- Pesquisadores desenterraram centenas de milhares de tabuletas cuneiformes, mas muitas ainda não foram traduzidas.
- Traduzir uma língua antiga é um processo demorado e apenas algumas centenas de especialistas estão qualificados para realizá-lo.
- Um estudo recente descreve uma nova IA que produz traduções de alta qualidade de textos antigos.
🔵Para as últimas manchetes, siga nosso canal do Google Notícias on-line ou pelo aplicativo. 📰 aqui
A tradução não é simplesmente uma questão de trocar uma palavra por uma palavra correspondente em outro idioma. Uma tradução de alta qualidade exige que o tradutor entenda como os dois idiomas unem os pensamentos e, em seguida, use esse conhecimento para criar uma tradução que mantenha as nuances linguísticas do original, que os falantes nativos entendem sem esforço.
Por mais difícil que seja esse processo, não é nada comparado ao desafio de traduzir uma língua antiga para uma língua moderna. Esses tradutores devem não apenas ressuscitar idiomas extintos de fontes escritas, mas também ter conhecimento íntimo de como as culturas que produziram essas fontes evoluíram ao longo dos séculos. Como se isso não bastasse, suas fontes costumam ser fragmentadas, deixando um contexto crucial perdido no tempo.
Por causa disso, o número de pessoas capazes de traduzir idiomas da antiguidade é pequeno, e seus melhores esforços são frequentemente superados pelo volume de textos desenterrados por arqueólogos.
Pegue o antigo acadiano. Esta antiga língua semítica é uma das mais bem atestadas do mundo antigo. Centenas de milhares, segundo alguns relatos, mais de um milhão , textos acadianos foram descobertos e hoje estão em museus e universidades. Muitos foram até digitalizados online. Cada um tem o potencial de nos ensinar sobre a vida, a política e as crenças das primeiras civilizações, mas esse conhecimento permanece bloqueado no tempo e na mão de obra necessários para traduzi-los.
Para ajudar a mudar isso, uma equipe multidisciplinar de arqueólogos e cientistas da computação desenvolveu uma inteligência artificial que pode traduzir o acadiano quase instantaneamente e desbloquear o registro histórico preservado nessas tabuletas de 5.000 anos.
Continue a leitura após o anúncio:
🖥️ FONTES :
Acadiano perdido (e encontrado)
O acadiano era a língua materna do Império Acadiano, que surgiu por volta de 2300 aC por meio das conquistas de seu fundador, Sargão, o Grande. Como língua falada , o acadiano acabaria se dividindo em dialetos assírio e babilônico antes de ser completamente suplantado pelo aramaico no início do primeiro milênio aC. Hoje, é uma língua verdadeiramente extinta, sem sequer línguas filhas para continuar seu legado.
Como linguagem escrita, no entanto, o acadiano provou ser mais duradouro. O império emprestou a escrita cuneiforme de sua sucessora, a civilização suméria . Este sistema de escrita usava um estilete de junco para imprimir glifos em forma de cunha em tabletes de argila úmida antes de cozinhá-los (daí o nome cuneiforme , que literalmente significa “em forma de cunha” em latim). Mesmo depois que o aramaico suplantou o acadiano como a língua comum da região, os estudiosos continuaram a escrever em cuneiforme acadiano no primeiro século dC - mesmo na antiguidade, ao que parece, estudiosos e acadêmicos eram incrivelmente teimosos.
Essa mentalidade tradicional também teve um benefício não intencional para os arqueólogos modernos. Embora o cuneiforme pudesse ser escrito em papiro , era mais frequentemente escrito em argila ou pedra. Esses materiais resistem muito melhor aos incêndios e inundações que devastaram seus congêneres congêneres. E embora o tempo seja cruel com todas as coisas - os arqueólogos raramente descobrem tabuletas cuneiformes em perfeitas condições - esta é uma das razões pelas quais a escrita acadiana pode ser tão bem atestada no registro histórico.
“Ironicamente, conflagrações destrutivas preservaram algumas das maiores bibliotecas da antiga Mesopotâmia – porque eram feitas de barro. Em contraste, todas as bibliotecas de papiro do antigo Egito foram queimadas ou reduzidas a pó, embora muitos códices individuais tenham sobrevivido”, escreve o linguista Steven Roger Fischer em A History of Writing .
Mesmo com tais riquezas lingüísticas, traduzir adequadamente essas antigas bibliotecas não é pouca coisa. Além dos desafios já mencionados, a língua acadiana é polivalente. Ou seja, seus signos cuneiformes podem ter várias leituras diferentes dependendo de como cada um funciona em uma frase. Há muitas razões para esse desenvolvimento, mas, de acordo com Fischer, uma das razões pelas quais os acadianos nunca simplificaram foi que eles “pareciam estar presos à tradição e a uma eficiência auto-imposta”. Essa mentalidade tradicional os levou a continuar usando a escrita suméria para uma linguagem muito diferente da suméria. (Quando se trata de erudição histórica, alguns ganham, outros perdem.)
Como tal, traduzir acadiano é um processo de duas etapas. Primeiro, os estudiosos devem transliterar os sinais cuneiformes. Ou seja, eles pegam o cuneiforme e o reescrevem usando a fonética de som semelhante da língua-alvo. Um exemplo com o qual a maioria dos leitores estará familiarizado é a palavra árabe الله, que se traduz para o inglês como “Deus”, mas translitera como “Alá”. Essa transliteração é o mais próximo que o alfabeto latino pode chegar de produzir a palavra como ela soa em árabe. Os estudiosos então pegam sua transliteração do texto e a traduzem para uma linguagem moderna.
IA de ação rápida para resultados instantâneos
Como você pode imaginar, esse pode ser um processo longo e trabalhoso — que leva anos de treinamento e dedicação para aprender a se sair bem. Para ajudar a acelerar as coisas, a equipe de pesquisa desenvolveu um modelo de tradução automática neural para cuneiforme acadiano, a mesma tecnologia sob o capô do Google Tradutor .
A equipe treinou o modelo de IA em uma amostra de textos cuneiformes do Open Richly Annotated Cuneiform Corpus e o ensinou a traduzir de duas maneiras distintas. Primeiro, o modelo de IA aprendeu a traduzir o acadiano a partir de transliterações dos textos originais. Também aprendeu a traduzir símbolos cuneiformes diretamente. Mais especificamente, traduziu glifos Unicode de textos cuneiformes que foram gerados por outra ferramenta de economia de tempo que produz automaticamente Unicode a partir de uma imagem de um tablet original.
O modelo de IA então teve que descobrir como lidar com as nuances dos vários gêneros da amostra – por exemplo, a diferença entre obras literárias e cartas administrativas – bem como lidar com as mudanças encontradas na escrita cuneiforme ao longo dos milênios em que foi usada. O modelo AI foi então testado usando o subestudo de avaliação bilíngue 4 ( BLEU4 ), um algoritmo usado para avaliar texto traduzido por máquina.
Em seu teste de transliteração para inglês, o modelo de IA da equipe marcou 37,47. Em seu teste cuneiforme para inglês, obteve 36,52. Ambas as pontuações ficaram acima da linha de base alvo e na faixa de uma tradução de alta qualidade. E houve um resultado surpreendente: o modelo foi capaz de reproduzir as nuances do gênero de cada frase do teste. Embora esse não fosse um dos objetivos do pesquisador, eles observaram no estudo que isso pode abrir possibilidades para usos além da tradução.
Mais inteligente e mais rápido: o boletim Big Think
Inscreva-se para receber histórias contra-intuitivas, surpreendentes e impactantes entregues em sua caixa de entrada toda quinta-feira
Campos marcados com * são obrigatórios
E-mail
“Em quase todos os casos, seja a [tradução] adequada ou não, o gênero é reconhecível”, escreve a equipe. “Um cenário futuro promissor faria com que o [modelo] mostrasse ao usuário uma lista de fontes nas quais eles basearam suas traduções, o que também seria particularmente útil para fins acadêmicos.”
A equipe publicou seus resultados no PNAS Nexus, revisado por pares . Eles também lançaram sua pesquisa e código-fonte no GitHub em Akkademia .
O futuro do passado parece mais brilhante
Por mais promissores que sejam os resultados iniciais, ainda há trabalho a ser feito. Em ambos os casos, algumas das sentenças de teste foram mal traduzidas. E como outros modelos de IA, este é propenso a alucinações – momentos em que a resposta não tem conexão com a fonte. Em um exemplo, o tradutor humano produziu a frase “Por que deveríamos (também) conduzir o processo perante um homem de Libbi-Ali?” A tradução da IA: “Eles estão no centro da cidade no centro da cidade.” (Um pouco fora.)
Ao todo, o modelo de IA funciona melhor quando está traduzindo frases curtas a médias. Também se sai melhor com gêneros mais estereotipados, como decretos reais e registros administrativos, do que com gêneros literários como mitos, hinos e profecias. Com mais treinamento em um conjunto de dados maior, observam os pesquisadores no estudo, eles visam melhorar sua precisão. Com o tempo, eles esperam que seu modelo de IA possa atuar como um assistente virtual para estudiosos humanos. A IA pode fornecer a tradução bruta rapidamente, enquanto o estudioso pode refiná-la com seu conhecimento de línguas, culturas e pessoas históricas.
“Centenas de milhares de tabuletas de argila inscritas na escrita cuneiforme documentam a história política, social, econômica e científica da antiga Mesopotâmia. No entanto, a maioria desses documentos permanece sem tradução e inacessível devido ao seu grande número e quantidade limitada de especialistas capazes de lê-los”, escreve a equipe no estudo.
“Este é outro grande passo para a preservação e divulgação do patrimônio cultural da antiga Mesopotâmia.”
📙 GLOSSÁRIO:
Com Agências
PNAS Nexus, revisado por pares . Eles também lançaram sua pesquisa e código-fonte no GitHub em Akkademia .
O AR NEWS publica artigos de várias fontes externas que expressam uma ampla gama de pontos de vista. As posições tomadas nestes artigos não são necessariamente as do AR NEWS NOTÍCIAS.
Continue a leitura no site após o anúncio: