enflasyonemeklilikötvdövizakpchpmhp
DOLAR
44,8794
EURO
52,8599
ALTIN
6.914,86
BIST
14.493,27
Adana Adıyaman Afyon Ağrı Aksaray Amasya Ankara Antalya Ardahan Artvin Aydın Balıkesir Bartın Batman Bayburt Bilecik Bingöl Bitlis Bolu Burdur Bursa Çanakkale Çankırı Çorum Denizli Diyarbakır Düzce Edirne Elazığ Erzincan Erzurum Eskişehir Gaziantep Giresun Gümüşhane Hakkari Hatay Iğdır Isparta İstanbul İzmir K.Maraş Karabük Karaman Kars Kastamonu Kayseri Kırıkkale Kırklareli Kırşehir Kilis Kocaeli Konya Kütahya Malatya Manisa Mardin Mersin Muğla Muş Nevşehir Niğde Ordu Osmaniye Rize Sakarya Samsun Siirt Sinop Sivas Şanlıurfa Şırnak Tekirdağ Tokat Trabzon Tunceli Uşak Van Yalova Yozgat Zonguldak
İstanbul
Parçalı Bulutlu
17°C
İstanbul
17°C
Parçalı Bulutlu
Salı Çok Bulutlu
20°C
Çarşamba Yağmurlu
11°C
Perşembe Az Bulutlu
15°C
Cuma Parçalı Bulutlu
16°C

Beyaz yakalara güzel haber! Yapay zeka henüz yerinizi almaya hazır değilmiş!

Yapay zekânın beyaz yaka işleri hemen devralacağı düşünülüyordu. Ancak gerçek ofis görevleriyle test edilen yeni bir araştırma, bu beklentinin şimdilik gerçeği yansıtmadığını ortaya koyuyor

Beyaz yakalara güzel haber! Yapay zeka henüz yerinizi almaya hazır değilmiş!
26.01.2026 12:00
8
A+
A-

Satya Nadella yaklaşık iki yıl önce üretken yapay zekânın bilgi temelli işleri devralacağını söylemişti. Aradan geçen zamana bakıldığında ise bir hukuk bürosunda ya da yatırım bankasında hâlâ insan emeğinin açık ara önde olduğu görülüyor. Akıl yürütme ve planlama iddialarına rağmen, eğitim verileri üzerine çalışan Mercor tarafından yayımlanan yeni bir araştırma, bunun nedenini net şekilde ortaya koyuyor: Yapay zekâ, gerçek ofis işlerinin karmaşasıyla baş edemiyor.

“Yerine geçme” teorisine soğuk duş

Mercor’un yayımladığı APEX-Agents adlı yeni kıyaslama testi, şimdiye kadarki alışılmış yapay zekâ ölçümlerinden oldukça farklı. Şiir yazmak ya da matematik problemi çözmek yerine, avukatlar, danışmanlar ve bankacılardan alınmış gerçek iş taleplerini temel alıyor. Modellerden, birden fazla adım içeren ve farklı veri türleri arasında geçiş gerektiren görevleri baştan sona tamamlamaları isteniyor.

Ortaya çıkan sonuçlar ise oldukça çarpıcı. Piyasadaki en gelişmiş modeller arasında gösterilen Gemini 3 Flash ve GPT-5.2 bile yüzde 25 doğruluk oranını aşamadı. Gemini yüzde 24 ile listenin başında yer alırken, GPT-5.2 yüzde 23’te kaldı. Diğer modellerin büyük bölümü ise yüzde 15 civarında takılıp kaldı.

Yapay zekâ neden ofis testinde sınıfta kalıyor?

Mercor CEO’su Brendan Foody, sorunun ham zekâdan çok bağlamla ilgili olduğunu söylüyor. Gerçek hayatta cevaplar tek bir yerde durmuyor. Bir avukatın bir Slack yazışmasını kontrol etmesi, bir PDF politika belgesini okuması, bir elektronik tabloya bakması ve ardından tüm bu bilgileri birleştirerek GDPR uyumluluğu hakkında net bir yanıt vermesi gerekiyor.

İnsanlar bu geçişleri doğal biçimde yapabiliyor. Yapay zekâ ise dağınık kaynaklar arasında bilgi aramak zorunda kaldığında çoğu zaman kafası karışıyor, hatalı sonuçlar üretiyor ya da süreci tamamen yarıda bırakıyor.

Güven vermeyen stajyer benzetmesi

İşini kaybetmekten endişe edenler için araştırma bir nebze rahatlatıcı. Çalışmaya göre yapay zekâ, şu an için deneyimli bir uzmandan çok, işleri ancak dörtte bir oranında doğru yapan güvenilmez bir stajyer gibi davranıyor.

Yine de gelişim hızının ürkütücü olduğu vurgulanıyor. Foody’nin paylaştığı bilgilere göre bu modeller yalnızca bir yıl önce yüzde 5 ile 10 arasında skorlar alıyordu. Bugün yüzde 24 seviyesine ulaşmış durumdalar. Yani direksiyon başına geçmeleri henüz mümkün değil, ancak öğrenme hızları tahmin edilenden çok daha yüksek. Şimdilik bilgi işi devrimi, yapay zekâ çoklu görev yapmayı öğrenene kadar beklemede kalacak gibi görünüyor.

ETİKETLER: , ,
Yorumlar

Henüz yorum yapılmamış. İlk yorumu yukarıdaki form aracılığıyla siz yapabilirsiniz.