Con el objetivo de brindar a los usuarios direcciones exactas en sus mapas, Google desarrolló un algoritmo que puede reconocer con un alto nivel de precisión los números de las casas que aparecen en las imágenes de su servicio Street View. Sin embargo, el mismo algoritmo podría ser aplicado en la lectura de los CAPTCHAs más perversos, acertando en el 99 por ciento de los casos.
Para algunos es un mecanismo de seguridad necesario. Para otros, se trata de un enviado infernal que busca sembrar dolor en el corazón de la humanidad. A decir verdad, el CAPTCHA tiene un poco de ambas cosas. Aunque no podemos dejar que los bots maliciosos siembren el caos en la Web, el usuario promedio acumula varias derrotas frente a un sistema que parece escupir una mezcla entre chino y marciano. Se han desarrollado muchos métodos para evitar los desafíos CAPTCHA, con varios niveles de éxito, pero lo que tenemos aquí hoy ni siquiera tiene a los CAPTCHA como prioridad. La historia comienza con Google Street View. Si necesitas una dirección exacta, Google trata de hacer todo lo posible para entregarla con un máximo de precisión. Los equipos de Street View y reCAPTCHA desarrollaron un nuevo algoritmo que lee los números de las casas directamente de las imágenes, y a partir de esos datos, se calcula la dirección correcta.
Estamos ante un ejemplo extraordinario de reconocimiento visual, en el que interviene una avanzada red neural. Cuando trabaja con imágenes regulares de Street View, el algoritmo tiene una precisión del 90 por ciento. Cuando es aplicado sobre el “Street View House Numbers Dataset” de la Universidad de Stanford (usado en el entrenamiento de la red neural), el número asciende al 96 por ciento, y al reconocer dígitos individuales, es del 97.8 por ciento. Aún así, Google decidió en su estudio que el algoritmo se enfrente a algunos de los ejemplares más complejos generados por reCAPTCHA. El resultado fue un escalofriante 99.8 por ciento de precisión. No estoy seguro de que un humano pueda igualar semejante rendimiento: Google compartió en su blog a cuatro de los reCAPTCHA que el algoritmo reconoció, y siendo honesto, apenas logré leer a dos de ellos.
Gracias a este “efecto secundario”, Google y su equipo reCAPTCHA podrán reforzar al clásico sistema de verificación. Comprobaron que distorsionar texto ya no es suficiente, y si es posible alcanzar semejante nivel de precisión en forma automatizada, el gigante de Mountain View deberá incorporar parámetros adicionales de seguridad. Las probabilidades de que alguien vaya a desarrollar el equivalente a la red neural de Google para quebrar a toda la estructura CAPTCHA son muy bajas, pero no hay dudas de que una máquina puede ganarle.