La llamada ingeniería de prompts es fundamental para obtener buenos resultados en generadores como Stable Diffusion. Cuando hablamos de describir a una imagen, en realidad se trata de crear una estructura con características especiales y elementos que responden a detalles muy sutiles, incluyendo la posición. El nuevo «Libro de Prompts para Stable Diffusion» publicado por OpenArt es un excelente punto de partida que te ayudará a resolver dudas, y por qué no, pulir tus habilidades actuales a la hora de desarrollar prompts únicos.
La generación de imágenes con inteligencia artificial ha explotado a través de toda la Web. Las redes sociales se convirtieron en el hogar ideal para recibir a esta nueva ola de arte, con algunas tendencias muy marcadas (por ejemplo, Instagram adora a Midjourney). Las plataformas y aplicaciones móviles continúan multiplicándose, al igual que el número de usuarios interesados en la práctica. Y eso nos lleva inevitablemente al concepto de prompt: Antes de generar una imagen, los algoritmos necesitan una descripción… y hay mucho para aprender aquí.
Esto es especialmente cierto en el caso de Stable Diffusion. Su modelo open source lo vuelve más flexible, y eso significa que sus prompts tienen un rango de acción muy amplio. Al mismo tiempo, la curva de aprendizaje es un poco más exigente, y no es difícil caer en la frustración con los primeros sets de imágenes. Por suerte, la gente de OpenArt ha publicado el Stable Diffusion Prompt Book, un libro que te ayudará a asimilar los conceptos básicos de la ingeniería de prompts, y optimizar la calidad de tus resultados.
Diseña los mejores prompts con el «Stable Diffusion Prompt Book»
No te dejes llevar por el número de páginas. El libro nunca te bombardea con explicaciones técnicas, y está repleto de ejemplos e imágenes para comparar. La introducción a la ingeniería de prompts recomienda que te hagas varias preguntas antes de comenzar:
- ¿Quieres una foto o una pintura?
- ¿Cuál es el sujeto de la obra? ¿Una persona, un animal, un paisaje?
- ¿Qué clase de detalles deseas? ¿Qué tipo de luz imaginas para la escena? ¿Cuál es el entorno?
- ¿Buscas un estilo específico? ¿Gráficos en 3D? ¿Un póster? ¿Óleo sobre lienzo?
A eso le sigue el orden de las palabras, que es de gran importancia para cualquier prompt. A veces, el algoritmo ignora una parte de nuestra descripción porque no la considera tan importante como nosotros, pero si movemos esos elementos hacia adelante, el comportamiento de Stable Diffusion (y por extensión, el resultado) cambia por completo.
La tercera sección del libro se enfoca en modificadores, que nos permiten alterar el estilo, el formato o la perspectiva de las imágenes. A esto se suma una serie de «palabras mágicas» que los usuarios han descubierto en los últimos meses, y que tienen un impacto enorme.
La fotografía cuenta con su propia categoría, y presenta un cuadro de expresiones para lograr determinados efectos. También es muy útil ingresar la distancia focal y el modelo de cámara en el prompt: Por ejemplo, si agregas algo al estilo de «Nikon D850, 50mm», el algoritmo tratará de imitar esa combinación. Como alternativa, puedes usar referencias a dispositivos tipo GoPro, iPhone, drones, o incluso CCTV para ese toque particular de «circuito cerrado».
Otra sección que me gustaría mencionar es la de los medios. Su elección puede cambiar drásticamente la apariencia de una imagen, aún si repetimos la mayor parte del prompt o el seed. En algunos casos, lo mejor es seguir la ruta de pinturas al óleo o los grafitis, pero también es posible experimentar con elementos como madera o arcilla. Si tu plan es crear retratos, los dibujos en lápiz son excelentes.
Y para finalizar, los nombres de artistas. Si observas de cerca algunos prompts en Lexica y OpenArt, verás que los usuarios repiten ciertos nombres para alcanzar un estilo específico. Una de las combinaciones más comunes es la de Stanley Artgerm Lau, el artista polaco Greg Rutkowski, y Alphonse Mucha, pero sería un grave error no salir de esa selección. De hecho, el WebUI para la versión offline de Stable Diffusion cuenta con un botón que elige artistas de forma aleatoria, y definitivamente merece tu atención.
Stable Diffusion Prompt Book es una creación de Julián Herrera, Musical Sleep, Bob Chernow, Coco Mao, y Mohamad Diab, a quien conocemos mucho mejor por su fantástico proyecto Public Prompts. La última actualización es del 28 de octubre, y puedes descargar el PDF de forma completamente gratuita, sin restricciones ni credenciales. ¡No te lo pierdas!
Sitio oficial y descarga: Haz clic aquí