Fundado en 1910
La inteligencia artificial ha revolucionado las tecnologías de la comunicación

La inteligencia artificial ha revolucionado las tecnologías de la comunicaciónAFP

La Inteligencia Artificial consigue descifrar un idioma de más de 6.000 años de antigüedad

Un grupo de científicos logran crear una IA que ha sido capaz de traducir al inglés, con una precisión quirúrgica, los textos cuneiformes presentes en unas tablas

Investigadores de la Universidad de Tel Aviv han sido capaces de traducir al inglés, con la ayuda de la Inteligencia Artificial, una serie de textos escritos en acadio, una de las lenguas conocidas más antiguas y que empleaba el sistema cuneiforme para escribir. En un esutdio publicado recientemente, los científicos han dado a conocer el innovador método para descifrar antiguas lenguas.

Escrita por los antiguos babilonios y asirios en Mesopotamia, el acadio es una de las lenguas extintas más estudiadas y cuenta con más de 5.000 años de antigüedad. En esa región, que actualmente comprende Irak, es considerada uno de los lugares donde se desarrollaron varias de las primeras sociedades humanas. Ese lenguaje cuneiforme está formado por una serie de cuñas, símbolos y signos y de ellos nacen lenguas como el acadio, el sumerio o el asirio.

¿Cómo se llevó a cabo la investigación?

Hubert Mara, uno de los investigadores del estudio, y como recoge El Confidencial, indica que «En ellas se puede encontrar de todo: desde listas de la compra hasta sentencias judiciales». Además, añadió que «Las tablillas ofrecen una visión del pasado de la humanidad hace varios milenios. Sin embargo, están muy erosionadas y, por tanto, son difíciles de descifrar incluso para ojos entrenados»

Pese a esas dificultades, el trabajo en equipo dio sus frutos y la colaboración de los profesionales de la Universidad Martin Lutero de Halle-Wittenberg, la Universidad Johannes Gutenberg de Maguncia y la Universidad de Ciencias Aplicadas de Maguncia permitió descifrar los textos.

Hasta la fecha, la lectura de los mencionados textos era imposible. Sin embargo, esta investigación utilizaron programas de reconocimiento óptico de caracteres (OCR). Dichos programas, transforman imágenes escaneadas, o fotografías, en dos dimensiones de la escritura en un texto y así lo convierten en comprensible para la maquina.

Los pergaminos antiguos, o los textos reproducidos en un soporte plano, en pale son más sencillos de descifrar. Se trata de pasar de un medio 2D a un medio 2D. ¿Cuál era el problema aquí? La tridimensionalidad de las tablillas cuneiformes y sus caracteres, que tampoco son planos.

El OCR suele funcionar con fotografías o escaneos. […] En el caso de las tablillas cuneiformes, sin embargo, las cosas son más difíciles porque la luz y el ángulo de visión influyen mucho en la identificación de ciertos caracteresErnst StötznerCoautor del estudio

La solución: el entrenamiento de la IA

Entrenar la IA es posible y así lo hizo el equipo de investigadores. Ese entrenamiento se hizo a través de imágenes de escáneres tridimensionales y datos complementarios. Con la tecnología actual ya se puede usar el escaneo 3D en la tablillas y permite el análisis de multitud de aspectos, entre los que destacan la distancia entre los símbolos o las cuñas y la profundidad de la incisión realizada por el estilete en la arcilla.

«Traducir todas las tablillas que permanecen sin traducir podría exponernos a los primeros días de la historia, […], en qué creían, de qué hablaban, qué documentaban»Gai GutherzCientífico informático en la Universidad de Tel Aviv

¿Cómo se desarrolló la investigación?

Este desarrollo de la Inteligencia artificial fue posible gracias a la utilización de dos tecnologías existentes: un detector de signos y una red neuronal convolucional.

La primera de las tecnologías se basa en un modelo llamado RepPoints sobre la colección de imágenes ResNet18 para decodificar las tablillas. Este es un sistema que permite detectar objetos a través de una medición de la extensión espacial y la de sus áreas semánticamente significativas. Como indica El Confidencial, cuando se aplica sobre esa colección, previamente grabada, de imágenes de lenguas mesopotámicas incluidas en ResNet18, esta fue quien de realizar la combinación de patrones que permitían analizar el texto y localizar los distintos signos con precisión.

La segunda de las tecnologías permitió que un detector que utiliza Point R-CNN, que se trata de esa red neuronal convencional mencionada, pudiese clasificar y predecir las posiciones de las incisiones en forma de cuña típicas de la escritura cuneiforme. Así, la IA pudo «leer» aquello que contenían las tablas.

¿La revolución de la lectura?

Pocos son los textos de escritura cuneiforme que se conservan en la actualidad. Anteriormente, si los investigadores deseaban realizar esta traducción, era necesario realizar una doble traducción. Primero, una transliteración latina; y segundo, una al inglés. Sin embargo, ahora ni siquiera es necesario conocer el lenguaje cuneiforme ya que, y gracias a la Inteligencia Artificial, estos textos puede ser traducidos directamente al inglés.

Gai Gutherz, científico informático que comenzó el proyecto en la Universidad de Tel Aviv, dictaminó que «Lo asombroso es que no necesito entender nada de acadio para traducir [una tablilla] y entender lo que hay detrás del cuneiforme. Me basta con utilizar el algoritmo para entender y descubrir lo que el pasado tiene que decir»

comentarios
tracking