Bir Google DeepMind yapay zeka modeli, No Man's Sky gibi farklı açık dünya video oyunlarını, sadece bir ekrandan video izleyerek bir insan gibi oynayabilir, bu da genel olarak bedensel dünyada çalışan akıllı yapay zekalara doğru bir adım olabilir.
Video oyunları oynamak uzun zamandır Google DeepMind'ın sanal satranç ve Go oyunlarındaki yapay zeka ustalığı gibi yapay zeka sistemlerinin ilerlemesini test etmenin bir yolu olmuştur, ancak bu oyunlarda kazanmanın veya kaybetmenin bariz yolları vardır, bu da bir yapay zekayı bu oyunlarda başarılı olması için eğitmeyi nispeten kolaylaştırır.
Minecraft gibi daha soyut hedefleri ve göz ardı edilebilecek gereksiz bilgileri olan açık dünya oyunlarını yapay zeka sistemlerinin çözmesi daha zordur. Bu oyunlarda mevcut olan seçenekler dizisi, onları normal hayata biraz daha benzettiğinden, gerçek dünyada robotları kontrol etmek gibi işleri yapabilecek yapay zeka ajanlarını eğitmek ve yapay genel zeka için önemli bir adım olduğu düşünülmektedir.
Şimdi, Google DeepMind'daki araştırmacılar, sadece oyundan gelen video akışını kullanarak daha önce görmediği dokuz farklı video oyununu ve sanal ortamı oynayabilen Scalable Instructable Multiworld Agent veya SIMA adını verdikleri bir yapay zeka geliştirdiler. Bu oyunlar arasında uzay keşfi yapan No Man's Sky, problem çözen Teardown ve aksiyon dolu Goat Simulator 3 yer alıyor.
DeepMind'dan Frederic Besse, "Bu aslında insanların bir bilgisayarla etkileşim kurmak için kullandıkları arayüz, çok genel bir arayüz" diyor.
Doğal dilde sorulduğunda SIMA, hareket etmek, nesneleri kullanmak ve menülerde gezinmek gibi farklı oyunlarda ortak olan 10 saniye veya daha kısa süreli yaklaşık 600 görevi yerine getirebiliyor. Ayrıca uzay gemisi uçurmak ya da kaynak aramak gibi daha benzersiz görevleri de yerine getirebiliyor.
Besse ve meslektaşları, oyun video verilerini yorumlamak için önceden var olan video ve görüntü tanıma modellerini kullandılar, ardından SIMA'yı videoda olanları belirli görevlerle eşleştirmek için eğittiler. Araştırmacılar bu bilgiyi sağlamak için çiftlere birlikte video oyunları oynattı, bir kişi ekranı izledi ve diğerine hangi hareketleri yapması gerektiğini söyledi ve ayrıca kişilerin oyunlarını izlemelerini ve oyun eylemleri için gerçekleştirdikleri fare ve klavye hareketlerini tanımlamalarını sağladı. Bu, SIMA'nın insanların hareket tanımlarının görevlerin kendileriyle nasıl ilişkili olduğunu öğrenmesini sağladı.
SIMA sekiz oyun üzerinde eğitildiğinde, araştırmacılar daha önce görmediği dokuzuncu bir oyunu oynayabildiğini gördüler. Ancak, insan düzeyindeki performansın gerisinde kaldı. Araştırmacılar, yapay zekayı hangi sekiz oyun üzerinde eğittiklerini değiştirdikleri bir eğitim yöntemi kullandılar, böylece daha önce görmediği oyunlardan herhangi birini oynayabilmesini sağlamak için dokuzuncu oyunu kullanmak test oldu.
İngiltere'deki Aberdeen Üniversitesi'nden Felipe Meneguzzi, farklı oyunlar üzerinden çıkarım yapmanın genelci bir yapay zeka ajanı yolunda önemli bir adım olduğunu söylüyor, ancak SIMA şu anda yalnızca uzun vadeli planlama gerektirmeyen nispeten sınırlı bir dizi kısa görevi yerine getirebiliyor. Çok daha geniş bir yelpazedeki karmaşık görevleri yerine getirmenin daha zor olacağını söylüyor.
King's College London'dan Michael Cook, "DeepMind gibi şirketler için bu araştırmanın aslında oyunlarla ilgili olmadığını, robotikle ilgili olduğunu hatırlamakta fayda var" diyor. "3D ortamlarda gezinmek bir amaç için bir araç ve bu şirketler dünyayı algılayabilen ve hareket edebilen yapay zeka sistemleri yapmaya hevesliler. Dolayısıyla bunun video oyunları üzerinde büyük bir etkisi olduğunu düşünmüyorum, ancak gerçek dünyadaki yaşamımız üzerinde bilinmeyen birçok etkisi olabilir."