Google, yeni yapay zekâ modeli PaliGemma 2’yi duyurdu. PaliGemma 2 ile görsel içerikleri daha ayrıntılı tahlil ederek duygusal tespit yapabilme yeteneğine sahip olacak.

Google, yeni yapay zekâ modeli PaliGemma 2’yi duyurdu. Modelin en dikkat alımlı özelliği, görsellerdeki bireylerin hislerini tanıyabilme yeteneği. Lakin bu özellik henüz fonksiyonel olarak kullanılabilir durumda değil.
PaliGemma 2, görüntüleri tahlil edebiliyor ve gördüğü bireylerle ilgili açıklamalar yapabiliyor. PaliGemma 2, evvelki sürümün geliştirilmiş hali olarak, manzaralardaki eylemleri, hisleri ve öyküyü daha ayrıntılı şekilde tanımlama yeteneğine sahip.
PaliGemma 2 özellikleri

Google, PaliGemma 2 modelinin görselleri ayrıntılı şekilde tahlil ederek, sahnelerdeki eylemleri, hisleri ve genel öyküyü ifade ettiğini açıkladı. Lakin modelin duygusal tespit özelliği şimdi başlangıç aşamasında ve tam manasıyla kullanılamıyor.
PaliGemma 2, görsel içeriklere daha kapsamlı başlıklar ekleyerek kolay obje tanımalarının ötesine geçebilmeyi hedefliyor. Artık sahnedeki eylemleri, hisleri ve genel kıssayı doğru bir şekilde tanımlayabilen model, 3B, 10B ve 28B parametre seçenekleriyle sunuluyor. Ayrıyeten, manzaraların çözünürlük seçenekleri 224px, 448px ve 896px olarak belirlenmiş durumda. PaliGemma 2’nin sağladığı diğer avantajlar arasında, optik karakter tanıma (OCR) ve evraklardaki tabloların yapısını manaya yer alıyor. PaliGemma 2 bilhassa kimyasal formül tanıma, müzik notası tanıma ve göğüs röntgeni raporu üretme alanlarda tahlil sunabiliyor olacak.
PaliGemma 2’nin his tanıma özelliği, şimdi tam olarak kullanıma sunulmadan önce çok önemli etik tartışmaları beraberinde getiriyor. Uzmanlar, bu teknolojinin yanlış kullanımı durumunda çeşitli toplumsal sıkıntılara yol açabileceği konusunda ihtarlarda bulunuyor. Buna aynı gelişmelerin ilerleyen periyotlarda daha geniş kapsamlı etik değerlendirmelere tabi tutulması bekleniyor.