enflasyonemeklilikötvdövizakpchpmhp
DOLAR
45,1846
EURO
52,9954
ALTIN
6.703,28
BIST
14.442,56
Adana Adıyaman Afyon Ağrı Aksaray Amasya Ankara Antalya Ardahan Artvin Aydın Balıkesir Bartın Batman Bayburt Bilecik Bingöl Bitlis Bolu Burdur Bursa Çanakkale Çankırı Çorum Denizli Diyarbakır Düzce Edirne Elazığ Erzincan Erzurum Eskişehir Gaziantep Giresun Gümüşhane Hakkari Hatay Iğdır Isparta İstanbul İzmir K.Maraş Karabük Karaman Kars Kastamonu Kayseri Kırıkkale Kırklareli Kırşehir Kilis Kocaeli Konya Kütahya Malatya Manisa Mardin Mersin Muğla Muş Nevşehir Niğde Ordu Osmaniye Rize Sakarya Samsun Siirt Sinop Sivas Şanlıurfa Şırnak Tekirdağ Tokat Trabzon Tunceli Uşak Van Yalova Yozgat Zonguldak
İstanbul
Az Bulutlu
13°C
İstanbul
13°C
Az Bulutlu
Pazar Hafif Yağmurlu
12°C
Pazartesi Çok Bulutlu
15°C
Salı Hafif Yağmurlu
16°C
Çarşamba Açık
20°C

Yeni Araştırmaya Göre Yapay Zekâ Hâlâ Ofis İşleri İçin Yeterli Değil! Peki Neden?

Mercor isimli bir firma, yapay zekânın bilgi gerektiren ofis işlerinde insan yerine geçip geçemeyeceğini test etti. Sanılanın aksine yapay zekâ modellerinin hâlâ çok geride olduğu görüldü.

Yeni Araştırmaya Göre Yapay Zekâ Hâlâ Ofis İşleri İçin Yeterli Değil! Peki Neden?
27.01.2026 00:40
6
A+
A-

Her geçen gün daha da gelişmiş hâle gelen yapay zekâ teknolojilerinin ilerleyen dönemde birçok insanın işini elinden alacağı konuşuluyordu. Günümüzde özellikle bilgi gerektiren işlerde hâlâ insan gücünün öne çıktığını görüyoruz. Peki birkaç yıl içinde bu değişip ofislerde yapay zekâ mı kullanılacak?

Veri şirketi Mercor tarafından yayımlanan yeni bir araştırma, yapay zekâ için kullanılan tüm “mantık yürütme” veya “planlama” gibi özelliklere rağmen hâlâ bu teknolojinin insan yerine geçmesinin mümkün olmadığını gösterdi.

Yapay zekâ hâlâ gerçekten işlerin karmaşıklığıyla başa çıkacak seviyede değil

Mercor, APEX-Agenst isimli bir kıyaslama testi yayımladı. Yapay zekâdan şiir yazmasını veya matematik problemi çözmesini isteyen alışılagelmiş testlerin aksine bu testte avukatlar, danışmanlar ve bankacılardan gelen gerçek sorular kullanıldı. Modellerden, farklı bilgi türleri arasında geçiş yapmayı gerektiren, çok adımlı, eksiksiz görevler gerçekleştirmeleri istendi.

Sonuçlar ise şaşırtıcıydı. Gemini 3 Flash’ten GPT-5.2’ye kadar piyasadaki en iyi modeller bile testte** %25 doğruluk oranını aşamadı**. En öne çıkan model, %24 oran yakalayan Google modeli Gemini oldu. GPT-5.2, %23 ile onu takip etti. Diğer modellerde ise ortalama %10 civarı başarı oranı yakalandı.

Mercor yetkilileri, yaptıkları açıklamada gerçek dünyada cevapların altın tepside sunulmadığını, yapay zekânın bu tarz konularda hâlâ yeterli seviyede olmadığını söylüyor. Yani gerçek dünyadaki işlerin karmaşıklığıyla başa çıkacak seviyede değiller. Bir avukatın bir soruyu yanıtlamak için iş ortamındaki yazışmaları okuması, ilgili belgeleri incelemesi, tecrübelerini kullanması ve ardından tüm bu bilgileri sentezlemesi gerekiyor. Ancak yapay zekâ bunu yapamıyor.

İnsanlar bağlam değiştirme işini kolayca yapabiliyorlar ancak yapay zekâ bu konuda iyi değil. Modelleri dağınık kaynaklardan bilgi aramaya zorladığınızda ya kafaları karışıyor ya yanlış cevap veriyorlar ya da tamamen pes ediyorlar. Bu yüzden bazı işlerde insanların yerine geçmeleri için hâlâ erken olduğunu söyleyebiliriz.

ETİKETLER: , , , ,
Yorumlar

Henüz yorum yapılmamış. İlk yorumu yukarıdaki form aracılığıyla siz yapabilirsiniz.