Yeni bir çalışma, ,çok karmaşık sistemlere gerek kalmadan ve direkt yapay zekayı kullanarak insan hafızasından geçenleri sözlere çeviriyor.

Sydney Teknoloji Üniversitesi’ndeki GrapheneX-UTS İnsan Odaklı Yapay Zeka Merkezi’ndeki araştırmacıların yeni buluşu, niyetlerin ekranda görülen sözlere dönüşmesini sağlarken “zihin okuma” artık bir gerçeklik haline gelmek üzere olabilir.
UTS Bilgisayar Bilimleri Okulu Seçkin Profesörü (Seçkin Profesör, Türkiye’de bir süre boyunca kullanılan Ordinaryüs Profesör unvanına benzer bir unvandır) ve GrapheneX-UTS HAI Merkezi Yöneticisi Ching-Ten Lin, “Bu araştırma, saf EEG dalgalarını direkt dile çevirme konusunda öncü bir çabayı temsil ediyor ve bu alanda çok önemli bir gelişmeyi gösteriyor” dedi ve ekledi: “Bu, beyinden metne çeviri sürecine başka kodlama tekniklerini dahil eden ve sinirsel kod çözmeye yenilikçi bir yaklaşım getiren ilk çalışmadır. Büyük lisan modelleriyle entegrasyon aynı vakitte hudut bilimi ve yapay zeka alanında da yeni ufuklar açıyor.”
Yapay zeka ve makine tahsili araştırmacılarının yıllık toplantısı olan NeurIPS konferansında öne çıkan bir makale olarak seçilen çalışmada, katılımcılar sessizce metin modüllerini okurken, DeWave ismi verilen bir yapay zeka modeli, girdi olarak sırf beyin dalgalarını kullanarak bu sözleri ekrana yansıttı.
Bu araştırma, beyin sinyallerini konuşma lisanına çevirebilen ilk teknoloji olmasa da, şu ana kadar geliştirilenler arasında beyin implantlarına ya da tam donanımlı bir MRI makinesine erişim gerektirmeyen tek teknoloji olarak dikkat çekiyor. Araştırmacılar, yeni teknolojinin, göz izleme yazılımı gibi ek girdi gerektiren evvelki modellere göre de bir avantajı olduğunu ve bunaekstra donanımlarla birlikte ya da bu bunlar olmadan kullanılabildiğini söylüyor.
Yeni teknolojide, kullanıcıların beyin aktivitelerini elektroensefalogram (EEG) aracılığıyla kaydeden bir başlık takmaları kâfi oluyor. Bu, bir göz takip aygıtından (ve doğal olarak bir MRI makinesinden) çok daha pratik ve kullanışlı bir sistem. Araştırmacılar, yalnızca bu başlığın kullanılmasının sinyalin implantlardan elde edilen bilgiye göre biraz daha fazla gürültüye sahip olduğu manasına geldiğini kabul ediyor olsalar da, bu gürültüye karşın denemelerde epey iyi performans gösterdi. Özgün bir metnin makine tarafından çevrilmiş bir çıktıya benzerliğini ona 0 ile 1 arasında bir puan vererek değerlendirmenin bir yolu olan BLEU algoritmasını kullanan doğruluk ölçümleri, yeni teknolojiyi yaklaşık 0,4 olarak belirledi.
Elbette bu oran, daha invaziv formüllere dayanan diğer seçeneklerden kimileri kadar iyi değil. Araştırmaya eşlik eden makalenin baş yazarı Yiqun Duan’ın belirttiğine göre model, fiilleri eşleştirme konusunda isimlerden daha maharetli gözüküyor. İsimler söylediği söz edilen olduğunda, kesin çeviriler yerine eşanlamlı çiftlere doğru bir eğilim görülüyor; örneğin ‘yazar’ yerine ‘adam’ benzeri…
Duan, “[Bu hataların] beyin bu sözleri işlediğinde anlamsal olarak benzeyenkelimelerin aynı beyin dalgası modelleri üretebilmesinden kaynaklandığını düşünüyoruz” diyor.
Duan, “zorluklara karşın modelimiz manalı sonuçlar veriyor” diyor ve “anahtar sözleri sıralayabiliyor ve cümle yapıları oluşturabiliyor” diye ekliyor.
Sonuçlar NeurIPS konferansında sunuldu ve şimdi hakem incelemesinden geçmemiş olan ön baskı sürümü ArXiV üzerinde yayınlandı.