El sistema Captcha nos ha acompañado durante años. Extraños jeroglíficos, comparaciones imposibles, imágenes rotas y frases de libros retorcidas y tachadas forman parte de su arsenal que separa a humanos de ordenadores. En el pasado hemos explorado desarrollos como algoritmos que lograron conquistarlo, y también estudiamos una buena parte de su historia, pero ahora nos cruzamos con una extensión para Chrome y Firefox llamada Buster, que promete resolver captchas automáticamente usando el método secundario de audio.
Un captcha puede ser irritante, pero saca lo peor de nosotros cuando se vuelve casi imposible de resolver. «¿Haga clic en los anuncios publicitarios? ¡Esa foto muestra un pedazo de cartel publicitario en la esquina, es válida!» Lamentablemente no tiene sentido discutir con un captcha, porque las cosas siempre salen como el sistema las quiere: O entregas el resultado exacto, o no pasas. Incluso he visto ejemplares que transforman al captcha en una mini publicidad (recuerdo que uno me obligó a escribir «Walmart»). Los desarrolladores están muy conscientes de la negatividad que arrastra el captcha, y en muchos casos han decidido activar la variante NoCaptcha, que reduce el proceso a un simple clic en una casilla. Ahora, ¿y si fuera posible evitar eso también?
Esa es la promesa que hace la extensión Buster, compatible con Chrome y Firefox. En vez de atacar a la estructura de imágenes presentada por reCAPTCHA en una sesión normal, lo que hace Buster es llamar al sistema alternativo basado en audio (diseñado para no videntes), y tratar de resolver su desafío usando reconocimiento de voz. Básicamente, Buster agrega un icono en la parte inferior del reCAPTCHA (el hombre con la tilde verde). Haz clic en ese icono, y la extensión tratará de superar la prueba.
Buster se encuentra en la versión 0.2.0 (al menos, ese es el build reportado en la tienda de Chrome), por lo tanto, nadie debería imaginar un rendimiento perfecto (no olvidemos que el reconocimiento de voz carga con sus propios límites). De hecho, la idea es esperar que Buster se equivoque las primeras veces, y reintentar haciendo clic hasta que acierte. Con un poco de suerte y esfuerzo, Buster se convertirá en una herramienta útil, salvo que los webmasters implementen a NoCaptcha de forma masiva.
Probablemente podrían utilizar machine learning para mejorar el reconocimiento, capaz que están armando la base de datos, para mejorar el algoritmo.
Leyendo el changelog de la extensión utilizan IBM Speech to Text y Microsoft Azure Speech to Text API. Ellos desarrollaron la parte de machine learning como tal.
Lo que he descubierto de esos captchas de imagenes es que minimo tienes que marcar 3 imagenes para que lo marque como válido.
No, yo en muchos casos tilde 2 solas