enflasyon emeklilik ötv döviz akp chp mhp

DOLAR

46,1190

EURO

53,2864

ALTIN

6.312,01

BIST

13.741,89

Adana Adıyaman Afyon Ağrı Aksaray Amasya Ankara Antalya Ardahan Artvin Aydın Balıkesir Bartın Batman Bayburt Bilecik Bingöl Bitlis Bolu Burdur Bursa Çanakkale Çankırı Çorum Denizli Diyarbakır Düzce Edirne Elazığ Erzincan Erzurum Eskişehir Gaziantep Giresun Gümüşhane Hakkari Hatay Iğdır Isparta İstanbul İzmir K.Maraş Karabük Karaman Kars Kastamonu Kayseri Kırıkkale Kırklareli Kırşehir Kilis Kocaeli Konya Kütahya Malatya Manisa Mardin Mersin Muğla Muş Nevşehir Niğde Ordu Osmaniye Rize Sakarya Samsun Siirt Sinop Sivas Şanlıurfa Şırnak Tekirdağ Tokat Trabzon Tunceli Uşak Van Yalova Yozgat Zonguldak

İstanbul

Çok Bulutlu

25°C

İstanbul

25°C

Çok Bulutlu

Çarşamba Açık

26°C

Perşembe Parçalı Bulutlu

27°C

Cuma Az Bulutlu

27°C

Cumartesi Yağmurlu

21°C

ÖNE ÇIKANLAR

WhatsApp Kullanıcılarına Casus Yazılım Tehlikesi

Türkiye Yunanistan askeri güç ve teknoloji karşılaştırması | 2T Savunma & Teknoloji #3

Katlanabilir iPhone iOS 27 ve macOS 27’de Görüldü

Apple, İPhone 17 Pro ile birlikte titanyumu neden terk etti?

Opera Android Tarayıcısı Dünya Kupası’na Hazır Hale Geldi

Yeni Audi Q7 ve SQ7 Tanıtıldı

Havacılık tarihinde eşi benzeri yok: Acil durumda uçağın altından atlayan pilotlar

Togg, Haziran Ayı Kampanyasını Açıkladı: 900 Bin TL %0 Faizli Kredi!

Xbox, Game Pass’e Yapılan Dev Zamdan Sonra Milyonlarca Oyuncu Kaybettiklerini İtiraf Etti

Steam Mermi Festivali İndirimleri Başladı (Büyük İndirimler Var)

TÜMÜNÜ GÖSTER →

Yine Microsoft Yine Sızıntı İddiası: Bu Seferki Hedef Yapay Zekâ Geliştiricileri Oldu!

09.06.2026 20:00

Tek Soruluk Dev Anket: Yazılımcılar Olarak En Çok Hangi Yapay Zekâyı Kullanıyorsunuz ve Neden?

09.06.2026 17:40

Dünyanın İlk Rüzgâr Enerjisiyle Çalışan Su Altı Veri Merkezi Açıldı

09.06.2026 17:20

Yapay zeka kendi hatasını kendi düzeltecek: JetBrains’ten yeni hamle

09.06.2026 16:40

En İyi Yapay Zekâ Modellerinin Bile Tam Not Alamadığı Yeni Bir Performans Testi Oluşturuldu

Yapay zekâ modellerinin performansını ölçmeye yarayan yeni bir test geliştirildi. “Humanity’s Last Exam” isimli test, en iyi yapay zekâ modellerini bile zorluyor.

Yapay Zeka

26.01.2025 06:40

A⁺

A^-

Yapay zekâ modellerine yönelik yeni bir performans testi oluşturuldu. Yapay zekâ bölümünün kâr amaçladığı gütmeyen kuruluşlarından Center for AI Safety (CAIS) ile Scale AI isimli şirket tarafından geliştirilen bu performans testi, en iyi yapay zekâ modellerini bile zorlayan türden.

“Humanity’s Last Exam” olarak isimlendirilen yeni performans testi, pek çok kategoride zorlayıcı sorulara ev sahipliği yapıyor. Yapılan açıklamalara göre bu testte matematik, beşeri bilimler ve tabiat bilimleri gibi onlarca bahiste, 3.000 civarı soru bulunuyor. Geliştiriciler, testin sahiden belirleyici olması için grafikler, diyagramlar ve görseller kullanmayı da ihmal etmediler.

En iyi yapay zekâ modeli bile tüm soruları çözemiyor

Humanity’s Last Exam, sahiden zorlayıcı bir performans testi olacak gibi görünüyor. Çünkü yapılan çalışmalara göre piyasadaki amiral gemisi yapay zekâ modelleri, bu performans testinde yüzde 100 muvaffakiyete ulaşamadılar. Hatta 2021 yılında yayımlanan matematik odaklı testlerde erken etaptaki yapay zekâ modelleri, 100 üzerinden 10 puan bile alamamışlardı.

Humanity’s Last Exam’in ortaya çıkarılması için 50’den fazla ülkede 1.000 kadar kişiden destek alındı. Projeye destek olan isimler araştırmacılar ve profesörlerden oluşuyordu. Hâl bu türlü olunca bu performans testi, gelecekte kesim için çok önemli bir kıstas olabilir gibi görünüyor. Bu testte sorulan birtakım örnek soruları incelemek isterseniz buradaki ilişkiyi kullanabilirsiniz.

ETİKETLER: Performans Testi, Soru, Yapay Zeka

Yorumlar

[ Yoruma cevap yazmaktan vazgeç ]

Henüz yorum yapılmamış. İlk yorumu yukarıdaki form aracılığıyla siz yapabilirsiniz.