MADRID 5 mar. (EUROPA PRESS) -
A inteligência artificial (IA) foi aplicada para identificar e copiar caracteres cuneiformes a partir de fotografias de tabuletas, o que permitirá que especialistas em história antiga do Oriente Médio leiam escritas complicadas com facilidade.
Juntamente com os hieróglifos egípcios, a escrita cuneiforme é uma das mais antigas formas de escrita conhecidas e consiste em mais de 1.000 caracteres exclusivos. A aparência desses caracteres pode variar entre épocas, culturas, geografia e até mesmo entre escritores individuais, o que dificulta sua interpretação.
Pesquisadores da Cornell e da Universidade de Tel Aviv (TAU) desenvolveram um método chamado ProtoSnap que "encaixa" um protótipo de um caractere para corresponder às variações individuais impressas em um tablet. Com o novo método, eles podem fazer uma cópia precisa de qualquer caractere e reproduzir tabletes inteiros.
"Quando se volta ao mundo antigo, há uma enorme variabilidade nas formas dos caracteres", disse Hadar Averbuch-Elor, professor assistente de ciência da computação em Cornell, que liderou a pesquisa, em um comunicado. "Mesmo com o mesmo caractere, a aparência muda com o tempo, por isso é um problema muito difícil conseguir decifrar automaticamente o que o caractere realmente significa."
Rachel Mikulinsky, aluna de mestrado e coautora principal do TAU, apresentará "ProtoSnap: Prototype Alignment for Cuneiform Signs" em abril na Conferência Internacional sobre Representações de Aprendizagem (ICLR).
MEIO MILHÃO DE TABLETS
Estima-se que existam cerca de 500.000 tabuletas cuneiformes em museus, mas apenas uma fração foi traduzida e publicada. "Há um número infinito de digitalizações 2D desses cuneiformes, mas a quantidade de dados rotulados é muito escassa", disse Averbuch-Elor.
Para verificar se poderiam decifrar automaticamente essas digitalizações, a equipe aplicou um modelo de difusão (um tipo de modelo de IA generativo normalmente usado para tarefas de visão computacional, como geração de imagens) para calcular a semelhança entre cada pixel de uma imagem de personagem em um tablet e um protótipo geral do personagem. Em seguida, eles alinharam as duas versões e ajustaram o modelo para corresponder aos traços do personagem real.
Os caracteres ajustados também podem ser usados para treinar modelos de IA downstream que realizam o reconhecimento óptico de caracteres (basicamente, eles convertem imagens de tablet em texto legível por máquina). Os pesquisadores mostraram que, quando treinados com esses dados, os modelos posteriores têm um desempenho muito melhor no reconhecimento de caracteres cuneiformes (mesmo aqueles que são raros ou apresentam muita variação) em comparação com esforços anteriores usando IA.
Essa descoberta pode ajudar a automatizar o processo de cópia de tabletes, poupando inúmeras horas aos especialistas e permitindo comparações em grande escala de caracteres entre diferentes épocas, cidades e escritores.
"Nossa pesquisa baseia-se na meta de aumentar em dez vezes o número de fontes antigas disponíveis para nós", diz o coautor Yoram Cohen, professor de arqueologia da Universidade de Tel Aviv. "Isso nos permitirá, pela primeira vez, manipular grandes quantidades de dados, o que nos possibilitará obter novos conhecimentos mensuráveis sobre as sociedades antigas: sua religião, sua economia, sua vida social e jurídica.
Esta notícia foi traduzida por um tradutor automático