El procesamiento de imágenes ya se ubica mucho más allá del reconocimiento de rostros y números. Hoy, los algoritmos disponibles pueden identificar parámetros muy específicos, evaluar contextos, e incluso analizar potenciales sentimientos de la gente que aparece en ellas. La demo de la API de Google Cloud Vision es contundente en esos aspectos, y sirve como recordatorio de la capacidad de recolección de datos que tiene Mountain View.
El mundo quedó de cabeza cuando Facebook demostró el poder del reconocimiento facial en su sistema de etiquetas. A pesar de las dudas y los reclamos, en ese momento supimos que el genio se había escapado de la lámpara, y que la única opción para los algoritmos era mejorar en sus tareas. Hoy pueden inventar rostros, crear paisajes enteros con indicaciones mínimas, y envejecer a la gente, ¿pero qué sucede con fotos ya existentes? ¿Qué tan buenos son interpretando «lo que ven»?
Para responder esas preguntas, nada mejor que la demo de la API de Google Cloud Vision. Se encuentra un poco escondida, pero no necesitas hacer nada raro para que funcione: Sólo arrastra una imagen al cuadro, o carga una desde tu disco duro manualmente. La fase de procesamiento dura unos pocos segundos, y una vez terminada, Cloud Vision divide la información extraída en varias categorías.
La primera de ellas es «Objetos», y como lo sugiere su nombre, asigna un porcentaje de certeza a cada objeto detectado. Después tenemos a «Etiquetas», con una serie de descripciones que podrían ser útiles (o no) a la hora de indexar y clasificar la imagen. «Entidades Web» crea una lista de entidades vinculadas al contenido, con valores de certeza que van de 0 a 1 (cuanto más cerca de 1, más «seguro» está el algoritmo), aunque la demo presenta un pequeño bug aquí (el número final nunca debería superar a 1).
La sección de «Propiedades» es aún más interesante. Por un lado, Cloud Vision reporta cuáles son los colores dominantes de una imagen, separados por porcentaje, y cada uno con su código hexadecimal y RGB. Por el otro, ofrece sugerencias de recorte, anticipando cómo se vería la imagen final dependiendo de la relación ancho-alto.
La última pestaña es «Safe Search», un aspecto no menor al momento de distribuir esa foto en la Web. ¿Su contenido es delicado de algún modo? ¿Es una imagen médica o representa una escena violenta? Cloud Vision tratará de determinar eso y más. En resumen, haz la prueba con algunas imágenes en la Web, o por qué no, carga tus propias fotografías. Probablemente te sorprenda.
Sitio oficial: Haz clic aquí