Es posible que no sepas qué puñetas es eso de un Captcha, y es bastante importante, porque todo ‒todo de lo que hablaré hoy‒ empezó aquí, en el concepto de Captcha, un invento de Luis con Ahn, Manuel Blum y Nicholas J.Hopper. Bueno, no, lo cierto es que viene de antes, de mediados de siglo pasado, y de otro tipo, un tal Alan Turing.
Lo cierto es que Alan molaba, se sabe que realizó hazañas prodigiosas para la humanidad, como recorrer casi 100 km cuando tenía catorce años e intentar huir del internado en el que cayó. Y eso fue solo su primer día de clase. El tipo era un genio y, además, ateo. Pocas no-pruebas le hicieron falta para desconvertirse, y cuando su mejor amigo ‒y primer amor‒ estiró la pata por tuberculosis, Alan no pudo concebir que Dios estuviese mirando sin hacer nada. Su universo, como el de otros como yo, se volvió materialista ‒no, a mí no se me ha muerto nadie‒, y eso significó que todo podía ser explicado por la física y las matemáticas.
El tipo era un cerebrito, de esa clase de personas que, tras leer los trabajos de Einstein, va y los entiende. A mediados del siglo pasado, Alan dio un salto mental y creó la Máquina de Turing, o máquina universal de Turing, una máquina de la que era imposible distinguirla de las personas en cuanto a su lógica. Como consecuencia lógica de ese estudio, años más tarde Turing diseñó el Test de Turing ‒no es que fuese ególatra, el nombre se lo pusieron después‒, un test que pretendía determinar si un humano que pregunta es respondido por otro humano o por un robot.
Ejemplo: hay cuentas de Twitter que son programadas por entero, y los dueños no escriben en ellas. Imaginad que existen diez de esas cuentas, cinco controladas por humanos que las han preprogramado, y cinco controladas por una inteligencia artificial similar a la nuestra. El Test de Turing serviría para diferenciar las máquinas de las consciencias, añadiendo a los seres poseedores de una a las máquinas ‒los otros son los delfines, por cierto‒.
Todo esto venía a que Alan Turing diseñó un método para separar lo que son máquinas de humanos. El artículo bien podía haber empezado por aquí, pero Alan es un tipo que me cae muy bien, y creo que se merecía la presentación.
De modo que ahí estaban Luis con Ahn, Manuel Blum y Nicholas J.Hopper, cincuenta años después de aquello y con el spam creciendo por el mundo, metiéndose en los ordenadores y molestando. Y, encima, sin nada de jamón con especias dentro. Algo indignante, en especial esto último. ¿Qué podían hacer estos estudiantes sino inventar el Captcha?
He visto fotos de estos tipos y, como un servidor, no les veo interesados ‒o invitados‒ a dinámicas sociales como fiestas o eventos festivos. De modo que se pusieron a programar a lo forever alone, pero entre tres. Y crearon el «Completely Automated Public Turing test to tell Computers and Humans Apart», un invento que, de haber sido español, se habría llamado trilla. O trillatonic. O trillanator.
La trilla es un invento similar al tenedor pero que no te puedes meter en la boca ‒en serio, no lo intentes‒ y que sirve para separar el grano de la paja ‒el grano de trigo de la paja de trigo, los otros grano y paja aún no han sido relacionados a nivel científico‒. De un modo similar, el Captcha separa humanos de máquinas mediante el uso de una palabra difuminada, como esta:
Fue en ese mismo momento ‒un año después de 2000‒ cuando el trío se dio cuenta de la importancia del CAPTCHA en la vida de la humanidad. Por ese motivo le pusieron a partir de entonces en letras mayúsculas, para que se viese su importancia.
Estos tipos, perceptivos, se dieron cuenta de que la gente perdía tiempo insertando la palabra difuminada y siendo catalogado como no robot por el CAPTCHA. Y se preguntaron si no podrían aprovechar el hecho de tener a un humano al otro lado del cable en alguna tarea tediosa y exasperante. Ese tipo de tareas que le gustan a un robot, pero del tipo que un robot no podría realizar. Y, a ser posible, que valiese para algo.
Esta última condición hizo trizas toda esa línea de pensamiento hasta que apareció LA idea: usar el CAPTCHA para transcribir libros antiguos. ¿Cómo?
- Se toma una foto de una página ‒esto lo hace una máquina fotografiando cientos de miles de páginas diarias‒.
- Se trocea la página con un software que reconoce lo que es una palabra por los huecos ‒espacios‒ que tiene a los lados.
- Cada una de estas palabras es asignada a otra de la que ya se sabe la palabra transcrita.
Imaginad que tenemos un texto de dos palabras, como «Hola, caca». Cualquier humano podría leerlo ‒y reírse‒, pero una máquina no podría llegar a transcribirlo porque ‒por ejemplo‒ ha sido escrito a mano o está borroso. De modo que el programador usar el programa anterior, separando «Hola» de «caca», y le dice al ordenador que «Hola» ‒en imagen fotografiada‒ es «Hola» ‒en texto transcrito‒. Es decir, ha tenido que meter una entrada a una palabra escaneada. Pero ahora viene la magia:
- Cuando un usuario quiere escribir en un blog, aparece un CAPTCHA. A la derecha se ve, tomada desde una fotografía, «Hola». Es una palabra que el ordenador ya conoce. Pero a la derecha de esta se coloca la palabra que el ordenador no reconoce, «caca».
- El usuario, para escribir el comentario, debe, primero, salvar el obstáculo de escribir bien la primera palabra y, segundo, escribir lo que crea que pone en la segunda.
De modo que ahora el ordenador ya sabe dos palabras. Por supuesto el usuario ha podido meter mal la segunda, por eso se generan muchos CAPTCHAS hasta que un gran porcentaje se resuelve de manera similar, y es en ese momento en el que el ordenador dice: «¡Ey!¡Si pone caca!». Por desgracia para el ordenador, no tiene un sentido del humor desarrollado, y no entenderá la hilarante palabra.
Aquí es donde entra Google, en el momento en que CAPTCHA comienza a hacerse notar, y lo compra. Para entonces, el programa se llama reCAPTCHA, nombre que se le dio cuando los anteriores dueños comprendieron el poder de la transcripción de textos.
Y aquí nace la magia: Google usa a los usuarios para digitalizar libros que luego distribuye gratis. Eso entre otras cosas. ¿Cómo lo hace? Escaneando cientos de miles de libros, periódicos antiguos, revistas, e incluso manuscritos, y metiéndolos en la base de datos de reCAPTCHA. Luego, los usuarios van decodificando las palabras, y Google las pone cada una de vuelta en su lugar de origen, sustituyendo las imágenes de un libro escaneado por palabras en un Word.
Pero también se ha usado para, por ejemplo, que la gente lea placas de portales, nombres de calles, letreros de edificios, etc, y lo ha implementado a otra herramienta gratuita que todos conocemos: Google Maps. Reconozco que la idea, que leí por primera vez hará dos semanas, me chocó. Ni siquiera sabía que reCAPTCHA era de Google, y no podía imaginarme un uso tan justo para los usuarios: una simbiosis. reCAPTCHA protege sus lugares a cambio de aportar material útil para toda la humanidad.
Ya nadie podrá decir que no trabajaría para todo el planeta. Por mi parte no tengo ni idea de la de CAPTCHAS que habré resuelto en mi vida. ¿Miles, alguna decena de mil? A día del 11/04/12, se estimaba en unos 200 millones de reCAPTCHAS completados al día. Eso sumaban 150.000 horas de trabajo en un solo día transcribiendo libros. Una cifra que choca con nuestro día de 24 horas, y que ahora se habrá visto multiplicada por dos.
El futuro reCaptcha
¿Qué ocurrirá cuando ya no queden textos antiguos entendibles por los humanos? ¿Qué tipo de captcha será mostrado para su resolución? Es muy probable que dentro de 20 o 30 años, debido al crecimiento en el uso de los CAPTCHAS, ya no queden textos sin digitalizar. La pregunta que yo me hice es si se volvería al CAPTCHA de una palabra o no.
A mí me parecía un desperdicio, ya que el humano va a perder igualmente unos segundos de su tiempo en escribirlo. Quizá en treinta años, inventemos…
linguaCaptcha: el usuario deberá ingresar un sinónimo, antónimo o expresión parecida a la mostrada. De ese modo el ordenador aprenderá de manera relacional a combinar oraciones.
ImgCaptcha: se mostrará una imagen de la indización de Google, y habrá que ponerle nombre. El 90% de las imágenes de internet tienen nombres como IMG9087 o image.jpg, image (1).jpg,… Y existen usuarios que quieren acceder a ellas pero no las localizan. Si todas las imágenes tuviesen una metadescripción de 3-4 palabras en todos los idiomas, el problema de las imágenes en la búsqueda dejaría de existir.
No obstante, Google me ha sorprendido una vez más, esta vez a para mal, inventando su nuevo CAPTCHA, el «noCAPTCHA reCAPTCHA», un CAPTCHA… que no tiene CAPTCHA. Y lo hace con este vídeo. Eso sí, a intuitivo no gana nadie más, aunque a mí me hubiese parecido más interesante otro tipo de alternativas. Por ejemplo, las que he mencionado. Aunque, claro, si enseñamos mucho a un ordenador, en poco tiempo la idea de CAPTCHA resultaría obsoleta al ser la IA tan inteligente como nosotros. Quizá se pueda hablar entonces de programas suicidas. CAPTCHA, el asesino de CAPTCHA.
No he entendido muy bien la última parte, de lo que quiere hacer en un futuro Google con el reCaptcha. Pero sí sabía de dónde venían y me gusta los posibles usos futuros que has propuesto. Biquiños!
[…] Turing, CAPTCHAS y libros antiguos […]