Apple dahil pek çok devin yapay zekasını eğitmek için kullandığı bilgi tabanının, YouTube’dan müsaadesiz data topladığı ortaya çıktı.

Proof News’in yeni bir incelemesinin keşfettiğine göre, dünyanın en büyük teknoloji şirketlerinden kimilerinin, AI modellerini 173.000’den fazla YouTube görüntüsünün altyazılarını içeren bir data seti üzerinde, müsaadesiz olarak eğittiği ortaya çıktı.
EluetherAI isimli kar amaçladığı gütmeyen kuruluş tarafından oluşturulan bilgi seti, 48.000’den fazla kanalın YouTube görüntülerinin altyazılarını içeriyordu ve diğer pek çok şirketin yanı sıra Apple, NVIDIA ve Anthropic de bu olaya dahil. Araştırmanın sonuçları, AI teknolojisinin çoğunlukla yaratıcılardan müsaadesiz ya da tazminatsız alınan bilgilerle kurulduğu gerçeğini bir sefer daha gösteriyor.
Veri seti YouTube’dan herhangi bir video ya da görsel içermiyor olsa da, aralarında Marques Brownlee ve MrBeast’in de bulunduğu platformun en büyük içerik oluşturucularından kimilerini ve New York Times, BBC ve ABC News benzeri büyük haber yayıncılarını içeriyor.
Daha önce Google, şirketlerin AI eğitimi için YouTube bilgilerini kullanmalarının platformun kullanım kurallarını ihlal edebileceğini belirtmişti ve Engadget ile konuşan bir Google sözcüsü bu durumun geçerliliğini hala koruduğunu bildirdi. Lakin şimdi Apple, NVIDIA, Anthropic ya da EleutherAI mevzu hakkında bir açıklama yapmış değil.
AI şirketleri ekseriyetle modellerini eğitmek için kullanılan bilgilerin kaynağı hakkında pek şeffaf davranmıyor. Pek çok sanatçı bu durumdan şikayetçi olurken, şirketler soruları cevaplamaktan kaçınmaya devam ediyor. Bilhassa dünyanın en büyük video deposu olan YouTube platformlar, yazıları, sesleri, görüntüleri ve fotoğrafları içeren çok cazip kaynaklar haline dönüşüyor. Lakin Alphabet CEO’su Sundar Pichai’nin de söylediği üzere, şirketlerin YouTube bilgilerini kendi AI modellerini eğitmek için kullanmaları çok önemli bir ihlal teşkil ediyor.