enflasyonemeklilikötvdövizakpchpmhp
DOLAR
46,1190
EURO
53,2864
ALTIN
6.312,01
BIST
13.741,89
Adana Adıyaman Afyon Ağrı Aksaray Amasya Ankara Antalya Ardahan Artvin Aydın Balıkesir Bartın Batman Bayburt Bilecik Bingöl Bitlis Bolu Burdur Bursa Çanakkale Çankırı Çorum Denizli Diyarbakır Düzce Edirne Elazığ Erzincan Erzurum Eskişehir Gaziantep Giresun Gümüşhane Hakkari Hatay Iğdır Isparta İstanbul İzmir K.Maraş Karabük Karaman Kars Kastamonu Kayseri Kırıkkale Kırklareli Kırşehir Kilis Kocaeli Konya Kütahya Malatya Manisa Mardin Mersin Muğla Muş Nevşehir Niğde Ordu Osmaniye Rize Sakarya Samsun Siirt Sinop Sivas Şanlıurfa Şırnak Tekirdağ Tokat Trabzon Tunceli Uşak Van Yalova Yozgat Zonguldak
İstanbul
Çok Bulutlu
25°C
İstanbul
25°C
Çok Bulutlu
Çarşamba Açık
26°C
Perşembe Parçalı Bulutlu
27°C
Cuma Az Bulutlu
27°C
Cumartesi Yağmurlu
21°C

En İyi Yapay Zekâ Modellerinin Bile Tam Not Alamadığı Yeni Bir Performans Testi Oluşturuldu

Yapay zekâ modellerinin performansını ölçmeye yarayan yeni bir test geliştirildi. “Humanity’s Last Exam” isimli test, en iyi yapay zekâ modellerini bile zorluyor.

En İyi Yapay Zekâ Modellerinin Bile Tam Not Alamadığı Yeni Bir Performans Testi Oluşturuldu
26.01.2025 06:40
7
A+
A-

Yapay zekâ modellerine yönelik yeni bir performans testi oluşturuldu. Yapay zekâ bölümünün kâr amaçladığı gütmeyen kuruluşlarından Center for AI Safety (CAIS) ile Scale AI isimli şirket tarafından geliştirilen bu performans testi, en iyi yapay zekâ modellerini bile zorlayan türden.

“Humanity’s Last Exam” olarak isimlendirilen yeni performans testi, pek çok kategoride zorlayıcı sorulara ev sahipliği yapıyor. Yapılan açıklamalara göre bu testte matematik, beşeri bilimler ve tabiat bilimleri gibi onlarca bahiste, 3.000 civarı soru bulunuyor. Geliştiriciler, testin sahiden belirleyici olması için grafikler, diyagramlar ve görseller kullanmayı da ihmal etmediler.

En iyi yapay zekâ modeli bile tüm soruları çözemiyor

Humanity’s Last Exam, sahiden zorlayıcı bir performans testi olacak gibi görünüyor. Çünkü yapılan çalışmalara göre piyasadaki amiral gemisi yapay zekâ modelleri, bu performans testinde yüzde 100 muvaffakiyete ulaşamadılar. Hatta 2021 yılında yayımlanan matematik odaklı testlerde erken etaptaki yapay zekâ modelleri, 100 üzerinden 10 puan bile alamamışlardı.

Humanity’s Last Exam’in ortaya çıkarılması için 50’den fazla ülkede 1.000 kadar kişiden destek alındı. Projeye destek olan isimler araştırmacılar ve profesörlerden oluşuyordu. Hâl bu türlü olunca bu performans testi, gelecekte kesim için çok önemli bir kıstas olabilir gibi görünüyor. Bu testte sorulan birtakım örnek soruları incelemek isterseniz buradaki ilişkiyi kullanabilirsiniz.

Yorumlar

Henüz yorum yapılmamış. İlk yorumu yukarıdaki form aracılığıyla siz yapabilirsiniz.