Elon Musk’ın OpenAI’ye rakip olarak kurduğu xAI, yapay zeka modeli Grok’un görsel bilgileri işleyebilen ilk sürümünü duyurdu.

Elon Musk tarafından kurulan OpenAI rakibi xAI, yapay zekası Grok’un görsel bilgileri işleyebilen ilk sürümünü tanıttı. Grok-1.5V, şirketin yalnızca metin değil,zamanda evraklar, diyagramlar, grafikler, ekran görüntüleri ve fotoğrafları da işleyebilen ilk kuşak multimodal yapay zeka modeli.
xAI yaptığı duyuruda, Grok’un yeteneklerinin gerçek dünyada nasıl kullanılabileceğine dair birtakım örneklere de yer verdi. Bu örneklere göre, Grok’a bir akış şemasının fotoğrafını gösterip bunu Python koduna çevirmesini, bir çizime dayanarak bir kıssa yazmasını ve hatta anlayamadığınız bir meme’i açıklamasını isteyebileceksiniz.
Yeni sürüm, şirketin Grok-1.5’i tanıtımından yalnızca birkaç hafta sonra geldi. Bu modelin, selefine göre kodlama ve matematikte daha iyi olmanın yanı sıra, belli sorguları daha iyi anlamak için daha fazla kaynaktan gelen dataları denetim edebildiği, daha uzun bağlamları işleyebilecek şekilde tasarlandığı belirtiliyor. xAI, ilk test kullanıcılarının ve mevcut kullanıcılarının yakında Grok-1.5V’nin yeteneklerinden yararlanabileceğini söylese de kullanıma sunulacağı zaman konusunda kesin bir tarih vermedi.
Şirket, Grok-1.5V’yi tanıtmanın yanı sıra RealWorldQA ismini verdiği bir kıyaslama bilgi seti de yayınladı. Şirketin açılamasına göre, kullanıcılar RealWorldQA’nın 700 görselinden herhangi birini yapay zeka modellerini kıymetlendirmek için kullanabilecek. Her öğe basitçe doğrulanabilecek ve Grok benzeri çok modlu modelleri zorlayabilecek sorular ve karşılıklar içerecek. xAI, ayrıyeten teknolojisinin RealWorldQA ile OpenAI’ın GPT-4V ve Google Gemini Pro 1.5 rakiplerine karşı test edildiğinde en yüksek puanı aldığını iddia etti.