Martin Luther Üniversitesi Halle-Wittenberg, Johannes Gutenberg Üniversitesi Mainz ve Mainz Uygulamalı Bilimler Üniversitesi'nden bir ekip, antik çivi yazısı metinlerini deşifre edebilen bir yapay zeka sistemini tanıttı. 3D modellerden yararlanan bu yeni teknoloji, insanlığın en eski yazı biçimlerinden birinin anlaşılmasında önemli bir ilerlemeyi temsil ediyor.
Eurographics Association dergisinde yayınlanan araştırmacıların çalışması, Frau Professor Hilprecht Koleksiyonu'ndan bir dizi çivi yazılı tablete odaklandı. Bu tabletler öncelikle günümüz Irak'ında tarihi bir bölge olan antik Mezopotamya'dan gelmektedir. Genellikle medeniyetin beşiği olarak anılan bu bölge, en eski insan toplumlarından bazılarının geliştiği yerdir. Özellikle bu tabletler, Sümerce, Asurca ve Akadca gibi bölgenin dillerini oluşturan bir dizi sembol, işaret ve kama ile yazılmıştır.
Birçoğu 5.000 yıldan daha eskidir ve günlük yaşamdan hukuki konulara kadar geniş bir yelpazeyi kapsayan eski uygarlıklara bir bakış sunar.
Araştırmanın yazarlarından Hubert Mara, "Alışveriş listelerinden mahkeme kararlarına kadar her şey bu tabletlerde bulunabilir," demektedir. Tabletler insanlığın birkaç bin yıl önceki geçmişine bir bakış sağlıyor. Ancak çok yıpranmış olduklarından eğitimli gözler için bile deşifre edilmeleri zor.
Ekip Yardım İçin Yapay Zekaya Başvurdu
Antik çivi yazısı tabletlerin şifresini çözmek için yeni bir yapay zeka süreci kullanan ekip, nesne tanıma için tasarlanmış özel bir sistem olan Bölge Tabanlı Evrişimsel Sinir Ağı (R-CNN) mimarisine dayanan sofistike bir yapay zeka modelinden yararlandı. Çalışmada, 21.000 çivi yazısı işareti ve 4.700 kamanın ayrıntılı açıklamaları ile 1.977 çivi yazısı tabletinin 3B modellerinden oluşan benzersiz bir veri kümesi kullanıldı.
Yapay zekanın metodolojisi iki parçalı bir işlem hattı gerektiriyordu: ilk olarak, ResNet18 omurgasına sahip bir RepPoints modeli üzerine inşa edilen bir işaret dedektörü, tabletlerdeki çivi yazısı karakterlerini tanımladı. Basit bir ifadeyle, RepPoints modeli Mezopotamya dillerine bağlı ResNet18 görüntü koleksiyonunu tarar ve ardından metni 'görmek' için kalıpları birleştirir.
Bu adım, işaretleri doğru bir şekilde bulmak için çok önemliydi. Daha sonra, Özellik Piramit Ağı (FPN) ve RoI Hizalama gibi gelişmiş özelliklere sahip Nokta R-CNN kullanan kama dedektörü, çivi yazısının temel öğelerinin temelini oluşturan kamaların konumlarını sınıflandırdı ve tahmin etti, böylece yapay zekanın aslında 'okumasını' sağladı.
Bu araçlar tabletlerin 3D taramalarını alıyor ve kalemin kile yaptığı baskı derinliği veya semboller ile kamalar arasındaki mesafe gibi çok sayıda ölçümü elden geçiriyor. Bu incelikli yaklaşım, yapay zekanın geleneksel 2D fotoğrafların yarattığı tutarsız aydınlatma ve renk karmaşası gibi zorlukların üstesinden gelmesini ve böylece antik metinlerin daha doğru bir analizini yapmasını sağladı.
Antik metinler üzerine yapılan geleneksel araştırmalarda, yazının taranmış görüntülerini veya 2D fotoğraflarını makinede okunabilir metne dönüştüren optik karakter tanıma yazılımı (OCR) kullanılıyor.
OCR genellikle fotoğraflarla veya tarayıcılarla çalışır. Dolayısıyla kağıt ya da parşömen üzerindeki mürekkep için bu bir sorun teşkil etmez. Ancak çivi yazılı tabletler söz konusu olduğunda işler daha zordur çünkü ışık ve görüş açısı belirli karakterlerin ne kadar iyi tanımlanabileceğini büyük ölçüde etkiler.
Eski yazıtlar, parşömenler ve eski kitaplar, başka bir 2 boyutlu forma çevrilmiş 2 boyutlu ortamlardır. Ancak çivi yazılı tabletler 3 boyutludur ve tüm bu derinlik anlamlandırmayı etkiler.
Araştırma ekibi bunu ele almak için yapay zeka sistemlerini üç boyutlu taramalar ve ek veriler kullanarak kapsamlı bir eğitim rejiminden geçirdi. Bu verilerin önemli bir kısmı, şu anda bu antik kil tabletlerin 3D modellerini oluşturmaya odaklanan önemli bir projeye liderlik eden Mainz Uygulamalı Bilimler Üniversitesi tarafından sağlanmıştır. Bu sayede yapay zeka, tabletlerde yazılı sembollerin doğru bir şekilde tanımlanmasında kayda değer bir başarı elde etti.
Bu teknoloji sadece bu eski kayıtlara erişimi demokratikleştirmekle kalmıyor, aynı zamanda araştırma için yeni yollar açarak tarihi metinlerin daha geniş bir şekilde analiz edilmesine ve yorumlanmasına olanak sağlıyor. İleride yapılacak geliştirmelerle, mezarlıklarda bulunan yıpranmış yazıtlar gibi diğer üç boyutlu yazılara da uygulanabilir.