reCAPTCHA, aunque no lo creas soy una persona

José Miguel Moreno
4 min readSep 16, 2018

--

Quién diría que ya han pasado 11 años desde el lanzamiento inicial de reCAPTCHA y 9 desde su compra por parte de Google. En esta década de existencia de este peculiar test de Turing en el que una máquina cuestiona la identidad de la otra parte, su dificultad de resolución ha ido fluctuando entre un nivel aceptable para una persona y lo prácticamente imposible.

En sus inicios las pruebas a resolver consistían en escribir en un campo de texto dos palabras que se nos mostraban distorsionadas en una imagen.

Un ejemplo de reCAPTCHA del 2007 — BMaurer y Wikimedia Commons

Sin embargo, a medida que los programas de reconocimiento de texto mejoraban, Google empezó a subir la dificultad hasta el punto de que ni una persona era capaz de resolver estos retos.

A casa reCAPTCHA, que estás borracho — Elm House Creative

Dado que estas imágenes procedían de libros escaneados que, por si fuera poco, luego se distorsionaban, y que el proceso de selección de palabras estaba totalmente automatizado (no había intervención humana), reCAPTCHA estaba fuera de control.

Por suerte o por desgracia, en Google se acabaron percatando de ello (las malas lenguas dicen que se quedaron sin libros que escanear) y decidieron lanzar una nueva versión de reCAPTCHA en la que el usuario solo tendría que marcar una casilla para demostrar que no era una máquina.

El supuesto funcionamiento de NOCAPTCHA

Gracias a “inteligencia artificial” (cookies, historial de navegación y otras formas de invadir tu privacidad), reCAPCTHA sería capaz de distinguir automáticamente entre personas y bots y, para los casos dudosos, se mostraría un reto de catalogación de imágenes.

Un captcha para preescolares, claro y conciso — WIRED

Por supuesto, esta utopía duro apenas unos meses hasta que algún prometedor directivo se dio cuenta de que Google tenía un producto sin monetizar y decidió incorporar imágenes de Street View a los captchas, disparando la dificultad a niveles nunca antes vistos.

Y llegamos al presente, en el que el me veo incapaz de interactuar con múltiples sitios web y, en el mejor de los casos, dedico unos 50 segundos a resolver captchas injustos ya que Google asuma de antemano que soy una máquina.

Lo más curioso de esta — ya de por sí cómica — situación, es que no se trata de un caso aislado. Partiendo de una nueva dirección IP y en una ventana de incógnito, resolver estos retos es en muchos casos imposible, no por ser extremadamente difíciles, sino porque Google está equivocado.

Probablemente el señor de arriba la izquierda sea también una boca de incendios

Otro problema recurrente son las cada vez más ambiguas preguntas de reCAPTCHA. Mientras que antes se mostraba una imagen de ejemplo (como en el reto de buscar gatos), ahora se le da al usuario una palabra y nada más.

Y aunque buscar semáforos pueda parecer fácil, ¿qué es un semáforo? ¿Solo las luces? ¿El poste entero? Los píxeles que se quedan en el borde de otra casilla, ¿también hay que marcarlos?

reCAPTCHA, ¿qué quieres de mí?

Es injusto que una máquina incapaz de reconocer una boca de riego en una imagen penalice a personas por identificar correctamente ese objeto.

En conclusión, reCAPTCHA necesita ajustar la dificultad de sus retos urgentemente. Los sistemas de reconocimiento de entidades en imágenes son cada vez mejores, haciendo imposible cazar a todos las máquinas.
Por tanto, es absurdo asumir que todo el tráfico que circula por Internet son bots y penalizar a las personas incapaces de distinguir qué es para Google un semáforo y qué no.

Mientras tanto, parece que no me queda otra que seguir intentando convencer a una máquina de que soy una persona.

Los Simpsons, como siempre, tienen un gag para cualquier situación

--

--