Yapay Zekâlar Eğitilirken Neden CPU Değil de GPU Tercih Ediliyor?

“Call of Duty oynarken kullandığım ekran kartı neden ChatGPT gibi bir araç yapmak için önemli?” sorusunu cevaplıyoruz.

31.10.2023 20:20

A⁺

A^-

Yapay zekâ konusuna dışarıdan bakıyorsanız; Stable Diffusion ve Midjourney benzeri görsel üretme maksatlı araçların, ekran kartı olarak bildiğimiz GPU ile çalıştığını, ChatGPT aynıi asistanların ise işlemci olarak bildiğimiz CPU’dan güç aldığını düşünüyor olabilirsiniz. Gündelik tariflerle yaygın olarak düşünülen bu olsa da durum fark etmeksizin iki tarafta da GPU daha öndedir.

İyi de bizim rahat şekilde görsel ve video düzenlememizi, sağlam grafiklerle oyun oynamamızı ve 3 boyutlu tasarım yapmamızı mümkün kılan GPU’lar, nasıl oluyor da husustan epeyce alakasız görünen sesli ve yazılı asistanlara hayat verebiliyor?

Öncelikle çözmemiz gereken bahis, CPU ve GPU ayrımı.

Genel olarak CPU dendiğinde i3, i7, Ryzen 5 gibi seriler kastedilir. GPU dendiğinde ise GTX, RTX, 6600, 7700 ekran kartı serileri söylediği söz edilen olur. bizim bu mevzuyu anlayabilmemiz için bir tık perde ardına geçmemiz gerek.

CPU ve GPU’nun ikisi de özünde işlem ünitesidir. CPU olarak bildiğimiz işlem ünitesi, sıralı süreçler yapar. Bunu hayli süratli bir şekilde gerçekleştiren CPU’lar, süratli olsalar da çok geniş çaplı data setleriyle ilgilenemezler. temel misyonları bilgisayarın işleyişini sağlamak ve karışık süreçleri gerçekleştirmek olan bu üniteler, az sayıda güçlü çekirdeklere sahip olurlar.

Öte yandan GPU birimleri, CPU’lara göre daha küçük ve daha çok sayıda çekirdeğe ev sahipliği yapar. Grafik süreçleri için üretilen bu üniteler, bunun yanında paralel hesaplamalar yaparlar. Tabii burada başınız karışmasın. Az önce CPU’ların süratli süreçleri sıra sıra yaptığını söylemiştik. GPU’lar, daha yüksek çekirdek sayısının da getirisiyle çok sayıda süreci aynı anda yapabilir. Buna hesaplamalar da dahil.

Ek olarak iki tarafın ortasında bulunan, içinde hem CPU hem de GPU bulunduran APU’lar da var.

Bu ayrımı yaptıktan sonra gelelim asıl sorumuza: Neden GPU’lar, yapay zekâ eğitiminde CPU’ların yerine tercih ediliyor?

Yapay zekâ araçlarının eğitilebilmesi, epeyce karışık süreçlerin ne kadar sürede işlenebildiğine bağlı. Bunun en kısa sürede yapılabilmesi için de birbirinden karışık çok sayıda sürecin aynı anda çözülebilmesi gerek. GPU’ların, CPU’lara göre daha çok çekirdeğe sahip olduğunu söylemiştik. Bu da bu ünitelerin benzer anda bir sürü süreci yapabilmesini sağlıyor.

Bant genişliği de GPU’ların avantajlı olduğu bir nokta. Yüksek bant genişliği sayesinde bu üniteler, hem aynı anda çok sayıda işlem yapıyor hem de tekrar yüksek süratte bu süreçlerin datalarını işliyor. Ortalama bir CPU 50 ila 100 GB/s bant genişliğine sahipken üst düzey bir GPU, 500 GB/s’nin üstüne çıkabiliyor.

Ayrıca yalnızca bu süreçlerin daha süratli yapılabilmesi için geliştirilen yapay zekâ odaklı GPU’lar da bulunuyor. Daha sağlam bant genişliğine ve saat suratına sahip olan bu modeller, alışık olduğumuz GTA 5 açan kartlara benzemeseler de yapay zekâ tahsilini daha verimli kılıyorlar. NVIDIA’nın H100 GPU’su bunlardan biri.

Buraya kadar ne olduğunu anlamayanlar için bu mevzuyu netleştirecek çok hoş bir örnek var.

Yapmamız gereken sürecin bu şahısları karşıdan karşıya geçirmek olduğunu düşünelim.

Bu bizim CPU’muz:

Bu da GPU’muz:

Her ne kadar CPU’muz hayli gelişmiş de olsa bu şahısların hepsini karşıya geçirmesi uzun zaman alacaktır. Bu elbette gereğince güçlü olmadığından değil, süreçleri yalnızca sıralı yapma seçeneği olduğundan kaynaklı.

Öte yandan GPU’muz, bu bireylerin (verilerin) hepsini aynı anda karşıya geçirebilecek kapasitede olduğundan bizim hem vakitten hem de masraftan tasarruf edebilmemizi sağlıyor.

Yapay zekâ modellerine data girileceği zaman hem GPU hem de CPU epey kritik roller oynuyor. Bu yüzden biri olmadan başkası olabilir kanılar başınızda canlanmasın. Çünkü CPU’nun öne geçtiği alanlarda da GPU kenarda kalabiliyor.

Kaynaklar: Pure Storage, Analytics Vidhya, By By