enflasyonemeklilikötvdövizakpchpmhp
DOLAR
38,4262
EURO
43,7013
ALTIN
4.087,16
BIST
9.432,55
Adana Adıyaman Afyon Ağrı Aksaray Amasya Ankara Antalya Ardahan Artvin Aydın Balıkesir Bartın Batman Bayburt Bilecik Bingöl Bitlis Bolu Burdur Bursa Çanakkale Çankırı Çorum Denizli Diyarbakır Düzce Edirne Elazığ Erzincan Erzurum Eskişehir Gaziantep Giresun Gümüşhane Hakkari Hatay Iğdır Isparta İstanbul İzmir K.Maraş Karabük Karaman Kars Kastamonu Kayseri Kırıkkale Kırklareli Kırşehir Kilis Kocaeli Konya Kütahya Malatya Manisa Mardin Mersin Muğla Muş Nevşehir Niğde Ordu Osmaniye Rize Sakarya Samsun Siirt Sinop Sivas Şanlıurfa Şırnak Tekirdağ Tokat Trabzon Tunceli Uşak Van Yalova Yozgat Zonguldak
İstanbul
Parçalı Bulutlu
15°C
İstanbul
15°C
Parçalı Bulutlu
Pazartesi Az Bulutlu
14°C
Salı Az Bulutlu
15°C
Çarşamba Çok Bulutlu
16°C
Perşembe Çok Bulutlu
17°C

Microsoft’tan “Yapay Zekâ ile Uygulama Geliştirip Köşeyi Dönme” Hayali Kuranların Hevesini Kursağında Bırakacak Araştırma Geldi

Yeni bir araştırma, mevcut yapay zekâ araçlarının yazılım geliştirme ve yanılgı çözme bahislerinde gereğince iyi olmadığını ortaya çıkardı.

Microsoft’tan “Yapay Zekâ ile Uygulama Geliştirip Köşeyi Dönme” Hayali Kuranların Hevesini Kursağında Bırakacak Araştırma Geldi
12.04.2025 00:20
6
A+
A-

OpenAI, Anthropic vei yapay zekâ şirketlerinin geliştirdiği modeller artık yazılım geliştirme süreçlerinde kullanılmaya başlandı ama bu alanda hevesi olanlar için belirtmek gerek, görünüşe göre daha geliştirilmesi gereken çok şey var.

Google CEO’su Sundar Pichai, şirket içindeki yeni kodların %25’inin yapay zekâ tarafından üretildiğini belirtmişti. Meta CEO’su Mark Zuckerberg deplanlamaları olduğunu söylemişti.

Yapay zekâlar hâlâ yanlışları çözmekte başarısız

fakat Microsoft Research tarafından yapılan yeni bir araştırma, bu modellerin yazılım kusurlarını düzeltmede hâlâ yetersiz kaldığını ortaya koydu. SWE-bench Lite isimli testte, OpenAI’ın ve Anthropic’in ileri seviye modelleri, sunulan 300 yanılgı düzeltme görevinden birçoklarını çözemedi.

Claude 3.7 Sonnet en yüksek muvaffakiyet oranına sahip model olsa da başarı oranı sadece %48,4’te kaldı. OpenAI’ın o1 modeli %30,2; o3-mini ise %22,1 muvaffakiyet gösterdi.

Araştırmacılara göre bu düşük performansın temel sebepleri arasında modellerin yanılgı ayıklama araçlarını verimli kullanamaması ve eğitim datalarında gerçek insan kusur ayıklama süreçlerinden gereğince yararlanamamaları yatıyor.

Yapay zekâ ile ilgili diğer içeriklerimiz:

Peki siz yapay zekâyı kodlama işleriniz için kullandınız mı? Tecrübelerinizi aşağıdaki yorumlar kısmından bizimle paylaşabilirsiniz.

ETİKETLER: , ,
Yorumlar

Henüz yorum yapılmamış. İlk yorumu yukarıdaki form aracılığıyla siz yapabilirsiniz.