Beyaz yakalara güzel haber! Yapay zeka henüz yerinizi almaya hazır değilmiş!

Yapay zekânın beyaz yaka işleri hemen devralacağı düşünülüyordu. Ancak gerçek ofis görevleriyle test edilen yeni bir araştırma, bu beklentinin şimdilik gerçeği yansıtmadığını ortaya koyuyor

Yapay Zeka

26.01.2026 12:00

A⁺

A^-

Satya Nadella yaklaşık iki yıl önce üretken yapay zekânın bilgi temelli işleri devralacağını söylemişti. Aradan geçen zamana bakıldığında ise bir hukuk bürosunda ya da yatırım bankasında hâlâ insan emeğinin açık ara önde olduğu görülüyor. Akıl yürütme ve planlama iddialarına rağmen, eğitim verileri üzerine çalışan Mercor tarafından yayımlanan yeni bir araştırma, bunun nedenini net şekilde ortaya koyuyor: Yapay zekâ, gerçek ofis işlerinin karmaşasıyla baş edemiyor.

“Yerine geçme” teorisine soğuk duş

Mercor’un yayımladığı APEX-Agents adlı yeni kıyaslama testi, şimdiye kadarki alışılmış yapay zekâ ölçümlerinden oldukça farklı. Şiir yazmak ya da matematik problemi çözmek yerine, avukatlar, danışmanlar ve bankacılardan alınmış gerçek iş taleplerini temel alıyor. Modellerden, birden fazla adım içeren ve farklı veri türleri arasında geçiş gerektiren görevleri baştan sona tamamlamaları isteniyor.

Ortaya çıkan sonuçlar ise oldukça çarpıcı. Piyasadaki en gelişmiş modeller arasında gösterilen Gemini 3 Flash ve GPT-5.2 bile yüzde 25 doğruluk oranını aşamadı. Gemini yüzde 24 ile listenin başında yer alırken, GPT-5.2 yüzde 23’te kaldı. Diğer modellerin büyük bölümü ise yüzde 15 civarında takılıp kaldı.

Yapay zekâ neden ofis testinde sınıfta kalıyor?

Mercor CEO’su Brendan Foody, sorunun ham zekâdan çok bağlamla ilgili olduğunu söylüyor. Gerçek hayatta cevaplar tek bir yerde durmuyor. Bir avukatın bir Slack yazışmasını kontrol etmesi, bir PDF politika belgesini okuması, bir elektronik tabloya bakması ve ardından tüm bu bilgileri birleştirerek GDPR uyumluluğu hakkında net bir yanıt vermesi gerekiyor.

İnsanlar bu geçişleri doğal biçimde yapabiliyor. Yapay zekâ ise dağınık kaynaklar arasında bilgi aramak zorunda kaldığında çoğu zaman kafası karışıyor, hatalı sonuçlar üretiyor ya da süreci tamamen yarıda bırakıyor.

Güven vermeyen stajyer benzetmesi

İşini kaybetmekten endişe edenler için araştırma bir nebze rahatlatıcı. Çalışmaya göre yapay zekâ, şu an için deneyimli bir uzmandan çok, işleri ancak dörtte bir oranında doğru yapan güvenilmez bir stajyer gibi davranıyor.

Yine de gelişim hızının ürkütücü olduğu vurgulanıyor. Foody’nin paylaştığı bilgilere göre bu modeller yalnızca bir yıl önce yüzde 5 ile 10 arasında skorlar alıyordu. Bugün yüzde 24 seviyesine ulaşmış durumdalar. Yani direksiyon başına geçmeleri henüz mümkün değil, ancak öğrenme hızları tahmin edilenden çok daha yüksek. Şimdilik bilgi işi devrimi, yapay zekâ çoklu görev yapmayı öğrenene kadar beklemede kalacak gibi görünüyor.

ETİKETLER: Bilgi, İş, Yapay Zeka

Yorumlar

[ Yoruma cevap yazmaktan vazgeç ]

Henüz yorum yapılmamış. İlk yorumu yukarıdaki form aracılığıyla siz yapabilirsiniz.