Instale modelos generativos de imágenes AI Stable Diffusion gratuitos en su PC

Programas gratuitos para descargar para generar imágenes mediante IA desde PC o nube mediante el modelo Stable Diffusion y sitios donde puede encontrar modelos e indicaciones

Todo el mundo habla de ellos, todo el mundo los prueba, pero ¿cómo funciona realmente la generación de imágenes mediante IA? Porque una cosa es ir a uno de los numerosos sitios que crean imágenes y pedir ver una puesta de sol o un paisaje o una persona al azar, pero otra completamente distinta es generar un conjunto de imágenes similares o consistentes, que tal vez representen lo mismo. sujeto.

Además, otra pregunta que surge espontáneamente y es aún más práctica: ¿podemos generar nuevas imágenes, imaginarias o realistas, sin utilizar servicios externos, sino sólo usando nuestra PC y quizás incluso gratis sin los créditos y las diversas limitaciones y censuras?

Si escribo este artículo queda claro que Podemos generar tantas imágenes como queramos.incluso sustancial, desde nuestra PC utilizando modelos de generación gratuitos y de código abierto.

Premisa

Sin embargo, antes de ver cómo hacerlo, es realmente necesario comprender dos o tres conceptos para saber lo que estamos haciendo; de lo contrario, utilizaremos una herramienta aleatoria que nunca dará los resultados esperados. Será un discurso súper conciso, imprescindible.

Entonces, volviendo a la discusión sobre guía para instalar una IA en tu PCsi solo necesita un modelo de lenguaje o LLM para chats de texto, para el GenAI o inteligencia artificial generativanecesitamos un modelo de aprendizaje profundo (aprendizaje profundo), imagen-texto.

Ejemplos de estas plantillas de texto de imagen son las famosas. DALL-E de Open AI, el primero en ser lanzado, luego A mitad del viajedel que hablé extensamente hace algún tiempo, grock de X, Imagen de Google y, sobre todo, el más importante para todos nosotros, Difusión estable.

Difusión establecuya historia y funcionamiento se puede leer en Wikipedia es el modelo gratuito de código abierto De difusión latente de texto-imagen de Estabilidad IA que todos puedan utilizar libremente. Stable Diffusiond es también un modelo más liviano que DALL-E y Midjourney, que puede instalarse en su PC y ser utilizado por la gran mayoría de sitios y aplicaciones web que ofrecen un servicio de generación de imágenes.

Requisitos de difusión estable en PC

Entonces, gracias a los creadores de Stable Diffusion, quedan dos problemas para aquellos que quieran jugar con IA generativa.

El primero es el costo en términos de memoria de vídeo: para crear imágenes vía IA necesitas una PC con al menos, para Difusión Estable, 12 GB de memoria VRAM, la de la tarjeta de video. Por tanto, si realmente quieres hacerlo todo en casa, tendrás que compre una tarjeta de video NVIDIA GeForce con mucha VRAMAl menos 12 GB, que como se ve cuesta un mínimo de 600 euros (y pese a este gasto, tendremos justo lo mínimo necesario). Para realizar pruebas pueden ser suficientes 6GB de VRAM, pero en cualquier caso este problema se puede solucionar fácilmente incluso sin comprar nada, utilizando la Nube, como veremos en breve.

El segundo problema está relacionado conaprendizaje de IA. En definitiva, si instalamos el software y luego le pedimos que cree una imagen de una niña, esta aparece con una apariencia determinada. La segunda vez aparecerá con una apariencia completamente diferente y de hecho, quizás aparecerá como un dibujo animado o como una figura digital en 3D. Básicamente, hay que darle el control a la IA para asegurarse de que las imágenes sean del mismo tipo. Para solucionar esto sólo hace falta un poco de paciencia para comprender y utilizar las herramientas.

Otros requisitos son puramente software. La PC debe tener instalado el intérprete. Pitón y luego el instrumento git

Descargue e instale Difusión estable en PC

Hay tres programas principales para instalar Stable Diffusion AI en tu PClos tres de código abierto y similares en funcionamiento, con diferentes métodos de instalación y configuración. Estos son:

AUTOMÁTICO1111 o A1111disponible para Mac y Windows, así como en la nube. La guía y las instrucciones de uso se encuentran en el sitio web StableDiffusion.art.
Fooocusprograma similar para Windows y Linux, que se puede descargar desde Github donde están presentes todas las instrucciones. Fooocus es bastante fácil de usar porque también admite la generación de imágenes, por lo que puedes cargar tu propia foto o intercambiar caras.
Cómoda interfaz de usuarioel cual no solo es el más potente de los programas sino también el más sencillo, además porque existe un paquete de este software para Windows que tiene todo incluido, por lo que no será necesario ningún comando de configuración y se podrá utilizar de inmediato. Si tienes un PC con tarjeta gráfica NVIDIA puedes descargar el programa CómodoUI_windows_portable_nvidia.7z desde la página de lanzamientos, que es solo para extraer y ejecutar.

Como podrás comprobar en las páginas web de estos programas, si no tienes un PC lo suficientemente potente o si no quieres perder demasiado tiempo realizando la instalación manual, puedes lanzarlos en la nube gracias a la plataforma colaboración de google. Colab es, esencialmente, un servicio de Google que le permite conectarse y tomar prestado un servidor de Google con 16 GB de VRAM para ejecutar comandos de Python. El acceso sólo requiere una cuenta de Google Drive y es gratuito durante un período de tiempo determinado. En Collab puedes iniciar los programas (presionando el botón Reproducir al lado de las líneas de comando):

ComfyUI también se puede ejecutar en la nube, completo con plantillas y puntos de control, desde el sitio RunComfy.comque te permite tomar prestada una máquina virtual con 16 GB de VRAM gratis o incluso alquilar, sin suscripciones, pagando solo por el tiempo que la usas o por más memoria.

Agregar plantillas o puntos de control

Sea cual sea el programa que utilicemos, recomiendo ComfyUI o Fooocus, para generar imágenes es necesario cargar los llamados puntos de control, es decir, los modelos de IA que no están incluidos. La difusión estable es uno de esos modelos de IA, pero existen varios otros. Estos modelos de IA o puntos de control son dioses archivo con formato .safetensors y debe descargarse y colocarse en la carpeta de modelos (abra la carpeta del programa y luego abra la ruta modelos/puntos de control y copie los archivos .safetensors allí).

Los modelos de tensores de seguridad se pueden descargar desde el sitio. AbrazosCara que los reúne a todos, o incluso en el sitio Civit.ai que es menos técnico y completo, pero también más fácil de navegar e investigar. Por ejemplo, puede descargar Stable Diffusion XL 1.0 (en la página vaya a Archivos y versiones para buscar descargas).

Como puedes ver, el mundo de la IA generativa de imágenes es un mundo terriblemente vasto, donde es fácil experimentar, pero requiere acumular mucha experiencia si quieres ir en serio. Para empezar, recomendaría, si Quieres hacer imágenes realistas como fotografías.para descargar el modelo Juggernaut XL en Civitai basado en SD XL. Si desea crear imágenes de anime o gráficos 3D o de cualquier otro tipo, puede descargar el punto de control deseado desde Civitai o Huggingface.

Sin embargo, la discusión sobre los modelos no termina aquí. Después de las primeras pruebas, sentirá como si el modelo estuviera yendo al azar y no respetando las indicaciones. Por esta razón existen los llamados lora (Adaptación de bajo rango), es decir, submodelos que limitan la variedad de creación de imágenes para que podamos definir mejor lo que queremos y necesitamos. crear imágenes consistentes. Para comprender mejor la historia, podemos pensar en los LORA como filtros fotográficos diferentes. Por ejemplo, si quisiéramos crear imágenes de una chica preciosa con la piel perfecta, podríamos descargar el LORA (Realismo) adecuado; Si quisiéramos obtener imágenes de algún personaje famoso, como Billie Eilish muy de moda, entonces tendremos que descargar LORA. Civitai tiene una gran colección de LORA que se pueden buscar y descargar de forma gratuita.

Nosotros también podemos crear un LORA a través de una formación (básicamente hay que subir 50 o 60 fotos del mismo tema o detalle) que también se puede hacer online en Civit.ai (aunque necesitarás comprar al menos 5 euros en créditos).

También preste atención al concepto de Flujo de trabajoque en ComfyUI se representan como diagramas de flujo. Los flujos de trabajo son los pasos que debe seguir el algoritmo (a través de puntos de control, LORA y muchos otros parámetros) para generar la imagen y pueden ser realmente complejos. En el sitio web Runcomfy.com puede descargar muchos flujos de trabajo ya preparados.

Difusión estable en línea

Quienes no tengan un PC con 12 GB de VRAM pueden probar estos programas, pero la generación de imágenes será realmente lenta. Por suerte existen servicios online. Ahora, hay muchísimos servicios en línea que integran Stable Diffusion. Éstos no hacen más que subir a sus servidores el programa de código abierto, por ejemplo ComfyUI, bien configurado con Checkpoint y LORA, solicitando suscripciones.

Hemos hecho una pequeña lista de Los mejores sitios para generar imágenes mediante IA de forma gratuita. en otro artículo.

De la investigación que hice, encontré que los sitios son absolutamente los mejores. Civit.ai Y Tensor.art son los mejores, porque son como versiones en línea de ComfyUI, completas con todos los puntos de control y LORA más utilizados y porque, en términos de consumo de crédito, se encuentran entre los más generosos y se pueden usar de forma gratuita para hacer muchas pruebas y no solo 5 o 10 imágenes.

Fluir

Dos palabras al respecto también. Flujo por el laboratorio de la Selva NegraOtro modelo de IA generativa de texto a imagen de código abierto, similar a Stable Diffusion, pero más nuevo y con mayor calidad. En los sitios mencionados anteriormente puedes intentar crear imágenes a través de Flux y comparar las generadas a través de SD XL o SD 1.5. Aunque es mejor, Flux es más «caro» tanto en términos de memoria de vídeo (necesitas al menos 16 GB de VRAM para Flux en tu PC) como en términos de precio de los servicios online.

La forma más sencilla de probar Flux gratis es desde el sitio. abrazando la cara. Al presionar Flujo.1 Desarrollador se abre la página donde puede escribir el mensaje o cargar una imagen para obtener una nueva.

Escribir texto o mensaje

Hay muchas cosas en este artículo y a quien le interese me imagino cuántas búsquedas más de guías hará, sin embargo, si hemos conseguido configurar el programa en el PC o si nos hemos registrado en algún servicio online para hacerlo primero. , ahora viene la parte más difícil: escribir el mensaje. Sí, porque para generar una imagen bien hecha, realista o de fantasía, es necesario describir todos los detalles en el mensaje, de lo contrario saldrá mal o será inexacto.

La IA normal, ChatGPT o, mejor aún, Google Gemini, que funciona bien para generar mensajes de texto, nos ayuda en esto. Puedes abrir Gemini Studio y luego preguntar algo como «generar un aviso para difusión estable para una imagen fotorrealista de una mujer…. «. El resultado se puede pegar luego en la herramienta de generación de imágenes. Solo recomiendo escribir indicaciones en inglesesto es realmente obligatorio.

Un gran sitio para encontrar mensajes listos para copiar y pegar para StableDiffusion y FLux es Prompthero.com.

También recuerdo que también es posible utilizar IA generativa para cambiar la cara de una foto con FaceSwapuna operación que ha evolucionado mucho en el último año.

Para cerrar, respondo una última pregunta: ¿Podemos también generar vídeos en PC mediante IA?

La respuesta, esta vez, es negativa, aún es pronto para hablar de ello. Para empezar, la plantilla gratuita. Difusión de vídeo estable Acaba de salir y todavía no funciona muy bien. Además, generar vídeo requiere aún más memoria de vídeo, por lo que puede resultar muy caro.

En generación de vídeo, los que llevan ventaja son los servicios Kling, Hailuo, Hedra, Pika y Runway, reportados en el listado de Sitios para generar videos usando IA..

Si tiene dificultades o preguntas, dado que el tema es complejo y en constante evolución, háganoslo saber.

Rate this post