It made me want to cry./ No one had seen him since./ It made me feel uneasy./ No one had seen him./ The thought made me smile./The pain was unbearable./ The crowd was silent./The man called out./ The old man said./The man asked.

Parsey McParseface

Me dieron ganas de llorar. / Nadie lo había visto desde entonces./ Me hizo sentir incómoda./ Nadie lo había visto./ El pensamiento me hizo sonreír./ El dolor era insoportable./ La multitud se quedó en silencio./ El hombre llamó./ El anciano dijo./ El hombre le preguntó.

Parsey McParseface

Recitados con voz lenta y pastosa, estos versos bien podrían haber sido declamados en una velada surrealista, a la luz de las velas. Según el modelo de “unión libre” de André Bretón, el poema podría continuar sin fin, como un “murmullo constante” que diese forma a las imágenes proyectadas desde el subconsciente del autor, fluyendo en una escritura automática desconectada del pensamiento racional.

Sin embargo, Parsey McParseface no es un poeta decadente del siglo XIX ni vive en una sucia buhardilla de París. Parsey McParseface es el nuevo analizador sintáctico (parser) que Google acaba de liberar como Open Source, rebautizándolo a SyntaxNet.

Un parser es un motor de inteligencia artificial que analiza un texto para determinar su estructura sintáctica. En este caso, SyntaxNext se nutrió con datos de casi 3.000 novelas románticas y otros 1.5000 de ficción. Tras recopilar este ingente volumen de información, sus creadores le pidieron que creara un poema original dándole como inputs tan solo la frase inicial y final.

SyntaxNet es un analizador sintáctico, un componente clave en muchos sistemas NLU (Natural Language Understanding). Lo que hace este algoritmo es, como en el poema de unión libre de Bretón que comienza con “Mi mujer con la cabellera de fuego de los bosques”, tomar una frase dada como entrada y etiquetar cada palabra siguiente con una POS (Part-Of-Speech) específica, la cual describe la función sintáctica de la palabra y determina las relaciones sintácticas entre las palabras en la frase.

Las relaciones sintácticas están directamente relacionadas con el significado subyacente de la frase en cuestión. En la página oficial de Google esto se describe gráficamente a través del siguiente esquema:

asawb

El algoritmo entiende que Alice y Bob son sustantivos y “saw” (vio) es un verbo. Comprende también que el verbo es la parte principal de la frase, Alice es el sujeto y Bob es su objeto directo (dobj). Sin embargo, Parsey McParseface es capaz ir más allá y analizar y entender una estructura más compleja, como esta:

long

El equipo de investigadores de las Universidades de Stanford y Massachusetts partió el “Modelo de Lenguaje de Red Neuronal Recurrente” (RNNLM) que Google ya está utilizando hace tiempo para las traducciones automáticas y subtitulado de vídeo.

El siguiente paso será enriquecer su base de datos con más contenidos y con el feedback de inteligencias humanas. ¿Será Parsey McPaseface de superar el Test de Turing de las artes creativas y sorprendernos con poemas llenos de lirismo y belleza? Quién sabe si, en un futuro no muy lejano, Siri, Sherpa o Cortana nos despertarán cada mañana susurrándonos versos inspirados en nosotros…

Para saber más:

Announcing SyntaxNet: The World’s Most Accurate Parser Goes Open Source. http://googleresearch.blogspot.com.es/2016/05/announcing-syntaxnet-worlds-most.html

La inteligencia artificial de Google se atreve con la poesía.

http://computerhoy.com/noticias/software/inteligencia-artificial-google-atreve-poesia-45128

Google lanza SyntaxNet para potenciar la comprensión del lenguaje natural. http://www.xataka.com/robotica-e-ia/este-poema-no-lo-ha-escrito-un-hombre-sino-una-maquina