Menu
in

Google: Recognizing Text in Images

Una patente ingresada por Google pretende mejorar la forma en que se indexan las fotografías al buscador, a la vez que optimiza Adsense y Google Maps. Recognizing Text in Images, así se llama, “lee” el texto que puedan tener las imágenes, lo analiza y compara en relación a las keywords para así dar un mejor resultado en las búsquedas.

Google acaba de publicar una patente para lo que pretende ser una nueva forma de "reconocer" las imágenes colgadas en Internet. La patente, con el nombre Recognizing Text in Images (Reconociendo el Texto en Imágenes), hace exactamente lo que dice. Podrá leer todas las letras que estén presentes en una imagen, analizarlas y agregar la información en su metadata.

El texto de la patente dice: "Métodos, sistemas, y aparatos, incluyendo productos de software de ordenador, usados para extraer el texto de una imagen. (…) El método incluye recibir una entrada de datos de uno o más términos de búsqueda de imágenes y la identificación de keywords desde los términos de búsqueda de imagen recibidos. El método también incluye la búsqueda de una colección de keywords, incluyendo las keywords en el texto extraído de la imagen, trayendo una imagen asociada con el texto extraído de la imagen en uno o más términos de búsqueda y presentado la imagen." Pura palabrería legal, casi sin sentido.

En castellano, esto quiere decir que Google usaría variados métodos para lograr su cometido. El más interesante es la extracción de todo texto que haya en una imagen para incluirlo en la metadata, ampliando y refinando así el resultado de las búsquedas.

En la descripción de la patente, Google da pistas de un agregado que promete ser insuperable: "Adicionalmente, el texto extraído de la imagen puede ser combinado con la información del lugar (de donde pertenece la fotografía) e indexado para mejorar las búsquedas geográficas. El texto extraído puede proveer keywords para identificar lugares particulares y presentar imágenes que identifican ese lugar al usuario." ¿Qué quiere decir esto? Simple, si una imagen tiene un texto que el buscador puede identificar, de alguna manera, con un lugar geográfico, será presentado al usuario cuando ese lugar sea buscado en la base de datos de imágenes. Por ejemplo, si buscas una calle, y alguien por casualidad sacó una fotografía de esa calle (y si en algún lugar de la fotografía aparece un cartel con la dirección), Google te la mostraría aunque no haya keywords que la identifiquen de esa manera.

Este es un método harto difícil, como Google bien lo indica en la misma patente: "El texto en las imágenes puede ser difícil de identificar automáticamente debido a los problemas con la calidad de la imagen y a los factores ambientales asociados a la imagen. La baja calidad en las imágenes puede producirse, por ejemplo, por baja resolución, distorsiones de imagen y mala compresión. Los factores ambientales incluyen, por ejemplo, distancia del texto y el tamaño, sombras y otros efectos de contraste, obstrucciones y efectos causados por el inclemente clima."

Habrá que ver como resulta. El método en sí es una excelente idea y las complicaciones son muchas, pero de resultar como Google propone estaríamos frente a un verdadero avance en lo que búsqueda de imágenes se refiere. Además, y lo que no es poco, este método también optimizaría Adsense, ya que el sistema contextual de Google podría leer la nueva metadata para ofrecer publicidades más relevantes.

Leave a Reply