Los gatos monstruosos de Pix2pix respaldado por TensorFlow no tardaron mucho en recorrer la Web de punta a punta, y obviamente era cuestión de tiempo para que alguien tomara ese código y decidiera crear una solución diferente. Las inteligencias artificiales son muy buenas reconociendo objetos y rostros, pero a la hora de generar una imagen tomando como punto de partida un grupo simple de datos, todavía tienen bastante que aprender. ¿Qué sería un «grupo simple» de datos? Dibuja un rostro a mano alzada en la casilla, y deja que Pix2pix sude un poco…
No importa su nivel de complejidad, la clave para cualquier inteligencia artificial es el entrenamiento. Si esto suena un poco a fuerza bruta, es porque en cierto modo lo es: Si quieres una inteligencia artificial que sea formidable reconociendo naranjas y limones, el camino más efectivo es alimentarla con millones de imágenes, dejar que cometa todos los errores que necesite, y observar cómo mejora. Este proceso demanda un poder de procesamiento considerable, y los últimos desarrollos apuntan a reducir el tiempo de entrenamiento, pero al mismo tiempo existe la posibilidad de sacar a un algoritmo de su zona de confort y obligarlo a hacer extrañas interpretaciones.
Uno de los mejores ejemplos con acceso libre para el usuario es Pix2pix. La primera vez que lo vimos de cerca fue en febrero pasado, cuando el programador Christopher Hesse creó un port compatible con TensorFlow. Su objetivo era interpretar cualquier cosa dibujada como si fuera un gato, y cuando digo «cualquier cosa», digamos que hasta un Beholder podía ganar pelaje y ojos de gato. Esta nueva versión se enfoca en rostros humanos, y básicamente depende de qué tan compleja sea la fuente. Si observamos a la imagen de referencia su resultado es muy bueno, y aún cuando la alteramos un poco trata de aplicar lo aprendido, digamos, crear un cuello donde no lo hay.
De más está decirlo, la poca cordura de Pix2pix sale volando por el acantilado cuando lo obligamos a procesar simples garabatos. Si la prioridad es ver todo como un rostro humano, pueden salir cosas muy graciosas, o monstruosidades dignas del maestro H.R. Giger. Lamentablemente no tengo en mi poder ningún dato técnico avanzado sobre este generador más allá de su creador, NPO (la compañía de radiodifusión pública de los Países Bajos), y el dataset, basado en imágenes de la periodista Lara Rense. Trata de dibujar algo, y comparte los resultados.