Elon Musk’a göre yapay zekâyı eğitecek gerçek dünya verisi çok az kaldı. Ünlü miyarder, artık geliştirilme süreçlerinin değişeceğini ve sentetik data kullanımının artacağını düşünüyor.
Hayal edebileceğiniz her şeyle eğitilen yapay zekâ modelleri, gün geçtikçe çok daha iyi hâle geliyordu. Fakat xAI ile bu alanda da öne çıkmaya başlayan Elon Musk tarafından yapılan yeni bir açıklama, yapay zekânın gelişiminde esaslı değişiklikler olabileceğini ortaya koydu.
X üzerinden bir canlı yayına katılan dünyanın en güçlü insanı, yapay zekâ modellerini eğitmede kullanılabilecek gerçek dünya bilgilerinin çok az kaldığını düşündüğünü söyledi ve çoğu yapay zekâ uzmanının son vakitlerde söyledikleriyle fikirde olduğunu gösterdi.
Yapay zekâ modellerinin kendi ürettiği “sentetik veriler” geliştirilmelerinde yeni dönem olacak
Musk tarafından yapılan açıklamada, “Artık temelde yapay zekâ eğitiminde insan bilgisinin kümülatif toplamını tükettik. Bu da geçen yıl oldu.” sözleri kullanıldı. Eski OpenAI yöneticisi Ilya Sutskever’in söylediklerini tekrarlayarak bölümün şimdi “zirve veri” denen şeye ulaştığını da ekledi.
Ünlü milyardere göre bu dataların azalması, modellerin nasıl geliştirildiğini değiştirecek. Musk, yapay zekâ modellerinin kendi ürettiği verilere denen “sentetik veriler” bu araçların geliştirilmesinde yeni dönem olacak. Bu şekilde yapay zekâ kendi kendine öğrenme sürecinden geçmeye başlayacak.
Hâlihazırda Microsoft’tan Meta’ya, OpenAI’dan Anthropic’e kadar birçok şirket modellerini eğitmek için sentetik bilgileri kullanıyor. Hatta iddialar, 2024’te eğitimde kullanılan bilgilerin %60’ının yapay olarak üretildiğini söylüyor. Örneğin Microsoft’un yeni tanıttığı Phi-4 modeli hem sentetik bilgiler hem de gerçek dünya bilgileri kullanılarak geliştirilmiş.
Sentetik dataların çok daha düşük masraflı olduğunu belirtelim. Örneğin bu prosedürü kullanan Writer isimli bir şirket, tamamen yapay kaynaklarla geliştirdiği Palmyra X 004 modeline yalnızca 700 bin dolar harcamış. Olağanda 4,5 milyon dolardan fazla masraf olduğunu düşündüğümüzde ortada önemli fark var.
Tabii sentetik datalar hakkında kimi dezavantajlar olduğunu da söylemek gerekiyor. Bu metodun, modellerin yaratıcılığını kaybetmesine ve daha fazla ön yargılı olabileceğini söyleyen birçok uzman var.