Fundado en 1910

08 de septiembre de 2024

Gran inscripción cuneiforme hallada en la cara sur de la colina del castillo de Van, a cuatro kilómetros al oeste de la actual Van, en el este de Turquía.

Gran inscripción cuneiforme hallada en la cara sur de la colina del castillo de Van, a cuatro kilómetros al oeste de la actual Van, en el este de Turquía.Wikimedia Commons

La inteligencia artificial ayuda a descifrar los secretos encerrados en tablas de más de 5.000 años

Gracias a esta IA se ha podido traducir con gran precisión al inglés más de medio millón de textos del acadio cuneiforme

Cada vez hay menos traductores expertos del acadio cuneiforme, una de las lenguas más antiguas que se conocen con más de 5.000 años de antigüedad y que servía para que personas de distintas regiones pudieran comunicarse entre sí. Para solucionar este problema, un grupo de investigadores de la Universidad de Tel Aviv ha creado una inteligencia artificial (IA) capaz de traducir al inglés textos en esta lengua con la esperanza de descifrar los secretos de los pueblos que lo hablaban.

Esta lengua, que se escribió y se utilizó en Mesopotamia y Oriente Próximo entre el 3.000 a.C. y el 100 d.C. aproximadamente, es sucesor del sumerio y ambas utilizaron la técnica cuneiforme para escribir sus textos en las tablillas de arcilla con la ayuda de una caña afilada para ir creando marcas en forma de cuña. Tanto el sumerio como el acadio cuneiforme son las primeras lenguas escritas que se han descubierto hasta el momento, teniendo más muestras de la segunda que de la primera.

Escritura de venta de un esclavo y una casa a Shuruppak, Dinastías Arcaicas III A, c. 2500 a. C. Museo del Louvre

Escritura de venta de un esclavo y una casa a Shuruppak, Dinastías Arcaicas III A, c. 2500 a. C. Museo del Louvre

En concreto se han recuperado más de medio millón de textos acadios escritos en tablillas repartidas por todo el mundo, decenas de miles de las cuales se han digitalizado ya. Sin embargo, la escasez de expertos traductores ha hecho que muchos de esos textos no se hayan traducido todavía.

«Traducir todas las tablillas que permanecen sin traducir podría exponernos a los primeros días de la historia, a la civilización de aquellas gentes, en qué creían, de qué hablaban, qué documentaban», afirma Gai Gutherz, científico informático que comenzó el proyecto en la Universidad de Tel Aviv, en declaraciones recogidas por The Times of Israel. Tanto él como sus colaboradores acaban de hacer públicos los resultados de sus investigaciones en la revista PNAS Nexus, de Oxford University Press.

Cómo funciona

La idea del traductor de acadio se empezó a gestar en 2020 cuando Gutherz, el arqueólogo Shai Gordin, de la Universidad Ariel y otros investigadores publicaron un artículo sobre una IA que traducía del cuneiforme acadio a la transliteración del latín (una técnica que reproduce la forma exacta en que una determinada palabra se representa en la lengua original). Los resultados que obtuvieron con este método fueron de un 97 % de precisión en las traducciones del acadio cuneiforme al alfabeto latino transliterado.

Antes de esta IA, los expertos pasaban primero los textos en cuneiforme a la transliteración latina y de ahí, en la mayoría de los casos, al inglés. Sin embargo, crear un ‘software’ capaz de traducir del acadio al inglés directamente es mucho más complicado que hacerlo al latín transliterado, ya que este permite traducir los símbolos cuneiformes a una sola palabra, manteniendo las palabras en el mismo orden en que fueron encontradas. En cambio, pasarlo al inglés requiere que la máquina encadene frases u oraciones completas que tengan sentido dentro del orden sintáctico en inglés. Otra de las dificultades fue no contar con suficientes textos e imágenes de tablas con la que entrenar a la IA. Por ello, el equipo consultó las muestras de la ORACC (Open Richly Annotated Cuneiform Corpus), una base de datos de la Universidad de Pensilvania.

El 90% del material (50.544 frases) lo usaron para el entrenamiento, mientras que del resto, el 5% (2.808 frases) se usó para la validación y el 5% restante (2.808 frases) para la fase de pruebas. Además, hay que añadir a estas dificultades que durante los 3.000 años en los que estuvo en uso esta lengua se produjeron enormes variaciones y surgieron dialectos que dieron lugar a símbolos cuneiformes completamente distintos. «La cantidad de datos con los que se entrena es correlativa a su rendimiento y cuantos más datos se tengan, mejores serán los modelos», afirma Gutherz.

Precisión asombrosa

Y apunta que «ChatGPT funciona tan bien porque han conseguido entrenarlo básicamente con todo Internet». El problema que se enfrentan ellos es la de «recopilar todas las traducciones posibles que pudiéramos conseguir, para generar tantos ejemplos como fuera posible». A pesar de esto, Gutherz asegura que aunque su tecnología está dando todavía sus primeros pasos, la nueva IA funciona mejor de lo esperado.

La inteligencia artificial, destaca, consigue más precisión en textos formulistas, como pueden ser los decretos reales; por otro lado, realiza adivinaciones que siguen un patrón determinado para textos más literarios y poéticos, como es el caso de las cartas de sacerdotes o tratados, donde se ha observado una mayor incidencia de fallos o «alucinaciones».

Para determinar la calidad de las traducciones, los investigadores utilizaron el Best Bilingual Evaluation Understudy 4 (BLEU4), una herramienta de evaluación que mide automáticamente la precisión de las traducciones creadas por máquinas. Según el estudio, obtuvieron una puntuación BLEU4 de 36,52 sobre 100 para el cuneiforme al inglés y una puntuación de 37,47 para el cuneiforme transliterado al inglés.

Estar cerca de 37 se considera bastante bueno para un modelo de traducción en una fase inicial como esta, explica Gutherz. El investigador asegura que Google Translate, uno de los traductores más usados y que lleva más de una década de evolución, obtendría una puntuación BLEU4 de alrededor de 60 traduciendo del español al inglés. «Lo asombroso es que no necesito entender nada de acadio para traducir [una tablilla] y entender lo que hay detrás del cuneiforme» ,asegura Gutherz. «Me basta con utilizar el algoritmo para entender y descubrir lo que el pasado tiene que decir».

Comentarios
tracking