Apple, kısa süre önce ortaya atılan Apple Intelligence’ın YouTube altyazıları bilgi setini müsaadesiz olarak kullandığı iddiası hakkında ilk defa konuştu.

Proof News tarafından kısa bir süre önce yapılan ve yayınlanan bir araştırma, aralarında Apple, Nvidia, Salesforce ve Anthropic birtakım büyük teknoloji şirketlerine ait olanların da bulunduğu kimi yapay zeka modellerinin müsaadesiz olarak YouTube altyazılarını içeren bir bilgi kümesi kullanılarak eğitildiğini iddia ederek tartışmalara yol açtı.
Kar amaçladığı gütmeyen EleutherAI tarafından hazırlanan “YouTube Altyazıları” isimli data seti, yüz milyonlarca abonesi olan Mr. Beasti tanınan içerik oluşturucular da dahil olmak üzere 170.000’den fazla kanaldan altyazı içeriyordu. Teknoloji şirketlerinin bu bilgilerden kar elde etmeye çalıştığı yönünde savlar vardı ve bu bilgi setini kullanan Apple’ın OpenELM modelleri de savlardan etkilendi.
Kısa bir sessizliğin akabinde 9to5Mac ile görüşen Apple, Apple Intelligence’da ya da diğer AI/makine tahsili özelliklerinde OpenELM modelinin kullanılmadığını söyledi. Öbür bir deyişle Apple’a göre, Apple Intelligence özelliklerinde bu YouTube Altyazı veritabanı yer almıyor.
OpenELM, bu yılın başlarında piyasaya sürülen bir açık kaynaklı model ailesi. Şirket, OpenELM’i “son teknoloji eseri bir açık lisan modeli” olarak tanımlıyor ve bunun “açık araştırma topluluğunu güçlendirmek ve desteklemek, gelecekteki açık araştırma eforlarının önünü açmak” için yayınlandığını söylüyor.
OpenELM’e, Apple’ın Makine Tahsili Araştırması web sitesi de dahil olmak üzere çeşitli kaynaklardan erişilebiliyor. Lakin Apple, 9to5Mac ile yaptığı görüşmede OpenELM modelinin gelecekteki sürümlerini oluşturma planlarının olmadığını belirtti.
Şirket daha önce Apple Intelligence modellerini eğitmek için “temel modellerimizi eğitirken kullanıcıların özel ferdî bilgilerini ya da kullanıcı etkileşimlerini” kullanmadığını açıklamıştı. Fakat, web siteleri şirkete bunu yapmamasını bilhassa söylemediği sürece lisanslı dataları ve tarayıcısı tarafından toplanan dataları kullanıyor: “Temel modellerimizi, muhakkak özellikleri geliştirmek için seçilen bilgilerin yanı sıra web tarayıcımız AppleBot tarafından toplanan halka açık datalar de dahil olmak üzere lisanslı datalar üzerinde eğitiyoruz. Web yayıncıları, data kullanım denetimiyle web içeriklerinin Apple Intelligence eğitimi için kullanılmasını devre dışı bırakma seçeneğine sahiptir.”