Especialistas israelenses criam IA para traduzir texto cuneiforme antigo

Uma antiga tabuleta assíria com escrita em cuneiforme da Biblioteca de Ashurbanipal.

(crédito da foto: The Trustees of the British Museum)


#Cuneiforme #Assíria 

Especialistas em Assiriologia – que se especializam no estudo arqueológico, histórico, cultural e linguístico da Assíria e do restante da antiga Mesopotâmia (Iraque) – passam muitos anos tentando entender os textos acadianos escritos em cuneiforme, uma das formas mais antigas de escrita conhecidas.

Cuneiforme é traduzido como “em forma de cunha” porque, nos tempos antigos, as pessoas o escreviam usando um estilete de junco cortado para fazer uma marca em forma de cunha em uma placa de argila.

Mas agora, pesquisadores da Universidade de Tel Aviv (TAU) e da Universidade Ariel desenvolveram um modelo de inteligência artificial que economizará todo esse esforço. O modelo AI pode traduzir automaticamente o texto acadiano escrito em cuneiforme para o inglês.

Quem eram os antigos assírios?

Em 721 AEC, a Assíria varreu o Norte, capturou o Reino do Norte de Israel e levou as Dez Tribos ao cativeiro, após o que elas se perderam na história. A Assíria, batizada em homenagem ao deus Ashur (mais alto no panteão dos deuses assírios), estava localizada na planície da Mesopotâmia. Os historiadores observam que os judeus assírios apareceram pela primeira vez naquela região quando os israelenses foram exilados lá, e viveram continuamente ao lado do povo assírio nos territórios após o exílio assírio.

Centenas de milhares de tábuas de argila da antiga Mesopotâmia, escritas em cuneiforme e datadas de 3.400 aC, foram encontradas por arqueólogos – muito mais do que poderia ser facilmente traduzido pelo número limitado de especialistas que podem lê-los.

Cena de cerco com dois enormes escudos em forma de L protegendo soldados assírios, em relevo do palácio de Tiglate-Pileser III em Nimrud (crédito: Cortesia do Museu Britânico)

Dr. Shai Gordin da Ariel University e Dr. Gai Gutherz, Dr. Jonathan Berant e Dr. Omer Levy, da TAU, e seus colegas acabaram de publicar suas descobertas na revista PNAS Nexus sob o título “Traduzindo o acadiano para o inglês com a tradução automática neural”.

Quando desenvolveram o novo modelo de machine learning, eles treinaram duas versões – uma que traduz o acadiano a partir de representações dos sinais cuneiformes na escrita latina e outra que traduz a partir de representações unicode dos sinais cuneiformes. A primeira versão, utilizando a transliteração latina, apresentou resultados mais satisfatórios neste estudo, alcançando uma pontuação de 37,47 no Best Bilingual Evaluation Understudy 4 (BLEU4), que é um teste do nível de correspondência entre a tradução automática e a tradução humana de um mesmo texto .

O programa é mais eficaz ao traduzir frases de 118 caracteres ou menos. Em algumas das sentenças, o programa produziu “alucinações” – saída que estava sintaticamente correta em inglês, mas não exata.

Gordin observou que, na maioria dos casos, a tradução seria usada como uma primeira passagem no texto. Os autores propõem que a tradução automática possa ser usada como parte de uma “colaboração homem-máquina”, na qual estudiosos humanos corrigem e refinam a saída dos modelos.

Centenas de milhares de tabuletas de argila inscritas na escrita cuneiforme documentam a história política, social, econômica e científica da antiga Mesopotâmia, escreveram eles. “No entanto, a maioria desses documentos permanece sem tradução e inacessível devido ao seu grande número e à quantidade limitada de especialistas capazes de lê-los.”

Eles concluíram que a tradução é uma atividade humana fundamental, com uma longa história acadêmica desde o início da escrita. “Pode ser um processo complexo, pois geralmente requer não apenas conhecimento especializado de duas línguas diferentes, mas também de meios culturais diferentes. As ferramentas digitais que podem ajudar na tradução estão se tornando mais onipresentes a cada ano, ligadas a avanços em áreas como reconhecimento óptico de caracteres (OCR) e tradução automática. As línguas antigas, no entanto, ainda representam um problema enorme a esse respeito. Sua leitura e compreensão requerem o conhecimento de uma comunidade linguística morta há muito tempo e, além disso, os próprios textos também podem ser muito fragmentados”.


Publicado em 07/05/2023 21h16

Artigo original: