Birisi elindeki kaşığı düşürdüğünde, kaşığın havada durmadan yere düşeceğini bilirsiniz. Aynı şekilde, kaşık yere düşerken bir masaya çarptığında, masanın içinde geçemeyeceğini, kenarından kayıp düşmeye devam edeceğini de bilirsiniz. Etrafımızdaki fiziksel objelerin bu temel özellikleri hepimize sezgisel geliyor. Örneğin üç aylık bebekler, bir top ortadan kaybolduğu zaman, topun koltuğun atından buzdolabının üstüne ışınlanamayacağını anlayabilirler.
Yapay zeka sistemlerinin satranç ve poker gibi kolay olmayan oyunlarda uzmanlaştığını biliyoruz. Fakat henüz bir bebeğin doğduğu andan sonraki ilk birkaç ayı boyunca, görünürde hiç çaba göstermeden sahip olduğu "sağduyu" becerisini öğrenebilmiş değil.
Massachusetts Institute of Technology'de bilişsel bilimler profesörü olan ve bu alanda araştırmalar yapan Joshua Tenenbaum bu durumu şöyle açıklıyor: "Yapay zeka teknolojileri ne kadar ilerlemiş olsa da, henüz insan sağduyusuna sahip yapay zeka sistemlerine sahip değiliz: O noktaya geldiğimizde, bu sürecin nasıl o zaman nasıl geliştiğini, insanlarda nasıl ortaya çıktığını anlamak kolay olabilirdi."
Google'ın ana şirketi Alphabet'in bir kolu olan DeepMind'deki bir ekibin Nature Human Behavior dergisinde yayınladığı 11 Temmuz tarihli araştırma, bu tür sağduyu temelli bilgilerin makinelere nasıl eklenebileceğini ve insanlarda ise nasıl gelişmeye başladığını anlamaya yönelik bir fikir ortaya koyuyor. Bilim insanları bu noktada "sezgisel fizik" modelini ortaya koydular. Bu modele göre, çocuk gelişim psikologlarının elde ettiği, bir bebeğin doğduğunu an sahip olduğu içsel bilgiler kullanılarak bir yapay zeka sistemine entegre edilecekti. Ayrıca, bebeklerde biliş düzeyini değerlendirmek için kullanılan yöntemlere benzer bir modeli test etmek için de bir araç yarattılar.
Bilindiği gibi, yapay zeka araştırmalarında neredeyse her yerde bulunan derin öğrenme (deep learning) sistemleri, bir sahne ya da görüntüdeki piksel desenlerini öğrenmek için sürekli eğitime maruz bırakılır. Bu sayede, bir yüzü veya tenis topunu tanıyabilirler. Fakat tanımladıkları nesneler hareket edecekleri ve birbirlerine çarptıkları dinamik bir olay anına yerleştirildiğinde bu nesnelere ne olacağını asla bilemezler. Araştırmacılar sezgisel fiziğin sunduğu daha karmaşık olan zorluğun üstesinden gelmek için, ayrı ayrı pikselleri öğrenmek nesnenin bütününe odaklanabilen PLATO (Physics Learning through Auto-encoding and Tracking Objects) adlı bir model geliştirdiler. Ardından PLATO'yu bir nesnenin nasıl davrandığını öğrenebilmesi için neredeyse 300.000 video izleterek eğittiler: Bir topun düşmesi, başka bir nesneye çarpması veya bir engelin üstünden atlaması ve engelin diğer tarafında yeniden ortaya çıkması.
Burada en büyük hedef, PLATO sisteminin beş ana konsepte odaklanan sezgisel fizik yasalarına tam olarak nelerin karşı geldiğini anlamasını sağlamaktı: Nesne kalıcılığı (bir nesne orada görünmese olmasa bile hala vardır), katılık (nesneler fiziksel olarak katıdır), devamlılık (nesneler sürekli bir yörüngede hareket eder ve umulmadık bir şekilde kaybolup uzak bir yerde yeniden ortaya çıkamaz), değişmezlik (bir nesnenin özellikleri daima aynı kalır) ve yönsel eylemsizlik (bir nesne sadece eylemsizlik yasasına göre yön değiştirir).
Diyelim ki, PLATO adeta bir bebek gibi, karşılaştığı bir engel yüzünden geriye doğru sekmeden başka bir nesnenin içinden geçen bir nesneyi görüp "şaşkınlığa" uğradı. PLATO ile benzer videolar üzerinden eğitilmiş, fakat nesnelerin fiziksel doğasında bulunan bilgilere maruz bırakılmamış geleneksel bir yapay zeka sistemi burada afallayacaktı. Fakat PLATO sistemi, fiziksel olarak mümkün olanı bildiği için, beklenmedik anları ayırt etmede önemli oranda çok daha iyi performans gösterdi.
Bir basın toplantısında araştırmayı anlatan DeepMing çalışanı Luis Piloto şöyle bir açıklama yapıyor: "Psikologlar, insanların fiziksel dünyayı kavramak için nesnelerden yararlandıklarını düşünüyorlar, bu nedenle belki de böyle bir sistem inşa ederek, [bir yapay zeka modeli] fiziksel dünyayı gerçekten anlama olasılığımızı en üst noktaya çıkaracağız."
Sezgisel fiziği yapay zekaya öğretmeye yönelik, değişik derecelerde dahili veya sonradan edinilmiş fiziksel bilgiler sisteme dahil edildi. Bu çabalar araştırmacılara karma bir başarı sonucu sağladı. Bu yeni çalışmanın amacı, gelişim psikologlarının bir bebeğin ilk anda bir nesnenin ne olduğuna dair genlerinden gelen bir sağduyu eşliğinde yaptığını düşündüğü gibi sezgisel fizik anlayışı elde etmekti. Daha sonra çocuk bir nesnenin dünya etrafındaki hareketini izleyerek onun davranışını belirleyen fiziksel kurallarını öğrenir.
DeepMing araştırmacılarına göre, henüz bulundukları aşamada robotik, otonom arabalar veya popüler yapay zeka uygulamalarını geliştirmeye hazır olmadıkları vurgulanıyor. Bu aşamadaki yapay zeka modelinin gerçek dünyadaki nesnelerin büyük bölümüyle daha fazla miktarlarda eğitilmesi gerekiyor. Model ne kadar karmaşa işinde gelişirse, bebeklerin dünyayı nasıl kavrayıp çözümledikleri hakkında daha fazla bilgi edinebiliriz. Sağduyunun öğrenilen bir şey mi yoksa doğuştan mı geldiği, İsviçreli psikolog Jean Piaget'in bilişsel gelişim süreçleriyle ilgili yaptığı 100 yıl önceki araştırmalara kadar gidiyor.
DeepMind araştırmacıları, bu aşamada çalışmalarının robotik, kendi kendini süren arabalar veya diğer trend olmuş yapay zeka uygulamalarını geliştirmeye hazır olmadığını vurguluyor. Geliştirdikleri model, yapay zeka sistemlerine dahil edilmeden önce gerçek dünya senaryolarında yer alan nesneler üzerinde önemli ölçüde daha fazla eğitime ihtiyaç duyacaktır. Model, karmaşıklık içinde büyüdükçe, bebeklerin dünyayı anlamayı nasıl öğrendikleri hakkında gelişimsel psikoloji araştırmalarına da bilgi verebilir. Sağduyu veya farkındalık bilgisinin öğrenilmiş mi yoksa doğuştan mı olduğu, İsviçreli psikolog Jean Piaget'in 100 yıl önce ele aldığı bilişsel gelişimin aşamaları üzerine yaptığı çalışmalara kadar uzanıyor.