Menu
in

InvokeAI: Excelente interfaz web para generar imágenes con inteligencia artificial

Un diseño mucho más limpio e intuitivo, que está ganando tracción

InvokeAI

Los desarrollos que rodean a la generación de imágenes con inteligencia artificial continúan avanzando. Tenemos aplicaciones móviles, efectos de profundidad, vídeo y animación, pero no debemos olvidar a las interfaces para la ejecución local de modelos. En el caso específico de Stable Diffusion, la solución de Automatic1111 es la más compatible y flexible, pero si prefieres un entorno intuitivo y fácil de usar, con excelentes funciones para expandir imágenes más allá de su tamaño original, necesitas ver de cerca a InvokeAI.


Existen por lo menos tres rutas para generar imágenes con inteligencia artificial. Por un lado tenemos a DALL-E, con Craiyon como una de sus mejores opciones gratuitas online. Después aparece Midjourney, extremadamente popular en redes sociales, pero requiere Discord y la compra de tokens. Finalmente, llegamos a Stable Diffusion, que además de ofrecer un modo online sin cargo, también habilita su ejecución offline, con una tarjeta gráfica.

En los primeros días, todo funcionaba en la consola de sistema, pero el proyecto de Automatic1111 dio lugar a una interfaz web para Stable Diffusion con un alto nivel de compatibilidad y flexibilidad. Sin embargo, también debemos reconocer que el estado de Auto1111 es un poco caótico, con más de 1.300 issues abiertos en GitHub, y una documentación no del todo óptima. Ahora, si tienes el poder de fuego suficiente para ejecutar Stable Diffusion offline y buscas una alternativa a la interfaz de Automatic1111, todas las flechas apuntan a InvokeAI.


InvokeAI: Una de las mejores interfaces web para Stable Diffusion


Uno de los aspectos más positivos de InvokeAI es su instalación. Los requerimientos principales son tres: La instalación de Python (3.10.6 es una buena opción ya que mantiene compatibilidad con Auto1111), la aplicación de un parche en el Registro que activa rutas de unidad más largas, y unos 25 GB de espacio en disco. Un doble clic en install.bat iniciará el proceso en sí, pero no es automático al 100 por ciento. InvokeAI preguntará por el destino de los archivos, y los modelos a instalar (la lista recomendada es un buen punto de partida). Obviamente, esto significa que InvokeAI descargará archivos muy grandes, por lo tanto, paciencia.


Necesitas una buena conexión para descargar todo lo que necesita InvokeAI
El modelo 1.5 de Stable Diffusion y su inpainting superan los 8 GB entre ambos

Por lejos, la función más potente de InvokeAI es el Unified Canvas, que combina funciones de inpainting, outpainting, texto a imagen, e imagen a imagen. Tanto el inpainting (modificar o regenerar partes específicas de una imagen), como el outpainting (expandir una imagen con detalles adicionales) dejan mucho que desear en la interfaz de Automatic1111, pero está claro que InvokeAI ha dado en el blanco con su última edición.


Llegué a la interfaz… pero no pude generar imágenes. Si tienes menos de 6 GB de VRAM, usa Auto1111.

A pesar de estas impresionantes funciones, InvokeAI posee limitaciones que debemos destacar. La primera de ellas es el número de tokens (en otras palabras, si nuestro prompt es demasiado largo, InvokeAI ignora el excedente), pero la más importante es su falta de eficiencia en el uso de VRAM, a un extremo tal que recomiendo ignorar a InvokeAI por completo si la tarjeta gráfica tiene 6 GB de VRAM o menos disponible. En ese caso, la mejor opción es regresar a Automatic1111 y activar los comandos –medvram o –lowvram, que funcionan muy bien (más allá de la merma de rendimiento).


Sitio oficial: Haz clic aquí


Escrito por Lisandro Pardo

Leave a Reply