Red neuronal

Red neuronal

   En La piedra de Sísifo lo hemos dicho más de una vez: aunque hay libros con cubiertas maravillosas y otros con cubiertas horribles, no se debería juzgar un libro por ello, porque si lo haces es muy posible que te equivoques ‒aunque alguna vez os hayamos invitado a que lo hagáis‒. Es más, ya existen libros que si te atreves a hacerlo, lo sabrán y no te dejarán que los leas. Ahora bien, las cubiertas están diseñadas para que los lectores tengan una mínima idea del contenido del libro, para saber si quieren intentar leerlo, ¿cómo no juzgarlas entonces? Y si la tecnología ya es capaz de desarrollar una forma de leer un libro sin tener que abrirlo, ¿por qué no arriesgarse a hacer lo mismo para las cubiertas y sistematizar un mecanismo para poder clasificar los libros a través de ellas?

   Eso es lo que han pretendido los expertos en datos Brian Kenji Iwana y Seiichi Uchida de la Universidad de Kyushu, en Japón: diseñar un algoritmo capaz de leer y reconocer la cubierta de un libro y determinar a qué género pertenece. Para los humanos es algo sencillo. Elegir un libro de cocina, de viajes o una biografía, solo mirando su cubierta. El reto era enseñarle ese proceso a una máquina. Para ello los investigadores descargaron 137.788 cubiertas de libros de Amazon junto con el género de cada uno. Existen veinte géneros posibles pero como cada libro puede estar en más de uno, solo se eligió el primero de ellos.

   A continuación formaron con los datos una red neuronal para aprender la correlación entre el diseño de la cubierta y el género y poder aplicar ese conocimiento a la categorización de cubiertas nunca vistas hasta ese momento. En estos casos el algoritmo conseguía acertar el género entre tres opciones en un 40% de las ocasiones y daba con exactitud con el género un 20% de las veces. Unos resultados que no pueden deberse a la casualidad.

   Algunos géneros eran más fáciles de reconocer que otros. Entre los más fáciles, por ejemplo, están los libros de viajes y los libros de informática y tecnología porque son los que tienen un diseño más homogéneo. Los libros de cocina eran fáciles de reconocer siempre y cuando usaran imágenes de comida, pero la cosa se complicaba si en la cubierta aparecía un cocinero. Las biografías y memorias también eran problemáticas, pero el algoritmo las solía catalogar dentro del género histórico, lo que parece que no está tan mal encaminado. Otras confusiones, debido a las similitudes en los diseños, se producen entre los libros infantiles, los de historietas y las novelas gráficas, o entre los libros de medicina y los de ciencia.

   Está claro que todavía queda mucho trabajo para mejorar el algoritmo. Un experimento interesante hubiera sido comparar los resultados de la red neuronal con los de un conjunto de seres humanos. Aunque de momento es poco probable que una máquina consiga superar a un hombre en este sentido, quizá es solo cuestión de tiempo que lo consiga.

   Lo que demuestra este trabajo es que, aunque es una tarea muy difícil, es posible clasificar los diseños de las cubiertas de libros. Una aplicación práctica del algoritmo sería la de ayudar a los diseñadores a facilitar o mejorar su trabajo. En un futuro mucho más lejano y oscuro, además, se podría entrenar a las máquinas para que diseñen ellas mismas las cubiertas sin necesidad de la intervención humana. Si la tecnología ya amenaza con dejar sin trabajo a escritores, editores y bibliotecarios, que tiemblen ahora los diseñadores.

Comentarios

comentarios