Meta’nın geçtiğimiz hafta özel kullanıma açtığı lisan modeli LLaMA, daha ilk günlerinde sızdırıldı. Lisan modeli, torrent üzerinden indirilebilir ve yüksek işlem gücüne sahip bilgisayarlarda kullanılabilir oldu.

ChatGPT, yapay zekâ takviyeli sohbet botlarının günümüzde ulaşabileceği en yüksek seviyeyi son kullanıcıya sunmuştu. ChatGPT’yi besleyen lisan modeline rakip olan lisan modelleri de diğer teknoloji şirketlerinin ağırlaştığı bir alan olmaya başlamıştı.
Bir yanda Google, kendi lisan modeli LaMDA’yı geliştirmeye devam ederken geçtiğimiz hafta Meta’dan da büyük haber gelmişti. Meta, bilim dünyasına katkı sağlamayı hedefleyen lisan modeli LLaMA’yı tanıtmıştı. Sadece bilimsel çalışmalara açık olan lisan modeli, ilk haftasında sızdırıldı.
LLaMA, şimdiden isteyen herkes tarafından kullanılabilir oldu:

‘llamanon’ isimli 4chan kullanıcısı, LLaMA’nın 7 milyar ve 65 milyar parametreye sahip versiyonlarını torrent yoluyla sızdırdı. Halkın kullanımına açık olmayan lisan modeli, GitHub’da yayımlanan bir kütüphane aracılığıyla erişilebilir oldu.
Kısa bir süre sonra ise GitHub’da ‘shawwn’ isimli bir kullanıcı tarafından, LLaMA’nın tüm sürümlerinin edinimi ve kullanımına dair bir kütüphane açıldı. LLaMA’nın tüm sürümleri, toplam 219 GB’lık boyuta sahip.
Tabii lisan modelini verimli bir şekilde çalıştırmak için fazlasıyla yüksek işlem gücüne, bundan ötürü ziyadesiyle tuzlu fiyat etiketine sahip ekran kartı donanımlarına sahip olmanız gerekiyor.
Meta, sızıntıyı internetten kaldırmak için şimdi bir aksiyon almadı.
LLaMA, OpenAI’ın lisan modellerine rakip olabilir mi?

LLaMA’nın sızdırılan sürümlerini indirerek testler gerçekleştiren kimi kullanıcılar, lisan modelinin en az ‘davinci’ modeli kadar gelişmiş olduğunu ifade etti. OpenAI’ın davinci modeli, geçtiğimiz haftaya kadar herkesin erişebildiği ve kendi sohbet botlarını oluşturabildiği bir lisan modeliydi.
Dil modelinin tam olarak ne kadar gelişmiş olduğunu şimdi bilemiyoruz. ama o denli görünüyor ki OpenAI, bugünün ChatGPT’sini oluşturan ‘gpt-3.5-turbo’ lisan modeli ise zirvede yer almaya devam ediyor.
Meta, bu lisan modelini neden herkese açmadı?
ChatGPT’nin verdiği cevaplar, lisan modelinin bir şekilde berbata kullanılabileceğinin (hatta kullanılmaya başladığının) da bir işaretiydi. Meta da devasa bir şirket olduğundan ve ismini karalamak istemediğinden aslında bu kötüye kullanımı dolaylı olarak desteklemek istemedi.
Şirket, bu nedenle lisan modelini sırf yapay zekâ alanında çalışan bilim insanlarının kullanımına açtı. Lisan modelinin maksadı, daha gelişmiş gelecekte daha gelişmiş lisan modellerinin geliştirilmesini sağlamak için bir temel olmak idi.