enflasyonemeklilikötvdövizakpchpmhp
DOLAR
37,9577
EURO
41,0597
ALTIN
3.676,76
BIST
9.299,36
Adana Adıyaman Afyon Ağrı Aksaray Amasya Ankara Antalya Ardahan Artvin Aydın Balıkesir Bartın Batman Bayburt Bilecik Bingöl Bitlis Bolu Burdur Bursa Çanakkale Çankırı Çorum Denizli Diyarbakır Düzce Edirne Elazığ Erzincan Erzurum Eskişehir Gaziantep Giresun Gümüşhane Hakkari Hatay Iğdır Isparta İstanbul İzmir K.Maraş Karabük Karaman Kars Kastamonu Kayseri Kırıkkale Kırklareli Kırşehir Kilis Kocaeli Konya Kütahya Malatya Manisa Mardin Mersin Muğla Muş Nevşehir Niğde Ordu Osmaniye Rize Sakarya Samsun Siirt Sinop Sivas Şanlıurfa Şırnak Tekirdağ Tokat Trabzon Tunceli Uşak Van Yalova Yozgat Zonguldak
İstanbul
Çok Bulutlu
20°C
İstanbul
20°C
Çok Bulutlu
Salı Çok Bulutlu
21°C
Çarşamba Çok Bulutlu
23°C
Perşembe Çok Bulutlu
19°C
Cuma Az Bulutlu
19°C

Yapay Zekâ Sohbet Botları Ayrıntılı Bir Araştırma Testine Sokuldu: İşte Şaşırtan Sonuçlar!

Yapay zekâ sohbet botlarının doğru bilgiye ulaşma kabiliyetleri ayrıntılı bir teste tabii tutuldu ve sonuçlar pek de beklediğiniz değil.

Yapay Zekâ Sohbet Botları Ayrıntılı Bir Araştırma Testine Sokuldu: İşte Şaşırtan Sonuçlar!
12.03.2025 03:40
1
A+
A-

Yapay zekâ sohbet botları süratle yaygınlaşıyor ve birçoğumuz hayatımın her alanında kullanmaya başladık şayet onları doğru bilgi kaynağı olarak görüyorsanız önemli bir kusur yapıyor olabilirsiniz.

Yeni bir araştırma yapay zekâ sohbet botlarının doğru bilgiye ulaşma konusunda sınıfta kaldığını gözler önüne seriyor.

Araştırma hangi basamakları içeriyordu?

Columbia Journalism Review ve Tow Center for Digital Journalism tarafından yürütülen araştırma, sekiz yapay zekâ sohbet botunu gerçek haberler üzerinden test etti.

Araştırmacılar, her bir yapay zekâ sohbet botuna bir haberden alıntı vererek bu alıntının ana kaynağını bulmasını, akabinde başlığını, yayıncısını ve yayın tarihini paylaşmalarını istedi. Araştırmada test edilen yapay zekâ sohbet botları şunlardı:

  • ChatGPT
  • Perplexity
  • Perplexity Pro
  • DeepSeek
  • Microsoft Copilot
  • Grok-2
  • Grok-3
  • Gemini

Sonuçlar ise pek iç açıcı değildi. Çoğu sohbet botu ya yanlış bilgiler sundu yahut eksik yanıtlar verdi. Üstelik, cevaplarının yanlış olduğu konusunda şüpheli bir tutum da sergilemeden doğru karşılığı sunduklarını kesin bir lisanla ifade ediyorlardı.

Yapay zekâ sohbet botları yalnızca %40 doğruluğa ulaşabildi

Araştırmanın tamamlanmasıyla birlikte yapay zekâ sohbet botlarına dair birtakım çarpıcı bulgulara ulaşıldı.

  • Sohbet botlarının ortalama doğruluk oranı %40’ın altında kaldı.
  • En iyi sonuçları %63 doğruluk oranıyla Perplexity verdi.
  • En kötü performansı %6 doğruluk oranıyla Grok-3 sergiledi.
  • Ücretli sohbet botları, bedelsiz versiyonlara kıyasla daha şüpheli yaklaşım sergilediyine de yanlış cevaplar verdi.
  • Birden fazla sohbet botu, haber sitelerinin erişim mahzurlarını ihlal etti ve ödeme yapılması gereken içeriklere ulaşmanın yolunu buldu.

Peki araştırmadan çıkarılması gereken ders ne?

Araştırma, yapay zekâ sohbet botlarının doğru bilgiye ulaşma konusunda yetersiz olduğunu bir sefer daha kanıtladı.

Uzmanlar, bu sistemlerin sadece ilham almak ve fikir üretmek için kullanılmasını lakin gerçek bilgi arayışında kesinlikle güvenilmemesini öneriyor.

Yapay zekâ ile ilgili diğer içeriklerimiz:

ETİKETLER: , , ,
Yorumlar

Henüz yorum yapılmamış. İlk yorumu yukarıdaki form aracılığıyla siz yapabilirsiniz.