enflasyonemeklilikötvdövizakpchpmhp
DOLAR
45,3503
EURO
53,4728
ALTIN
6.889,72
BIST
15.062,65
Adana Adıyaman Afyon Ağrı Aksaray Amasya Ankara Antalya Ardahan Artvin Aydın Balıkesir Bartın Batman Bayburt Bilecik Bingöl Bitlis Bolu Burdur Bursa Çanakkale Çankırı Çorum Denizli Diyarbakır Düzce Edirne Elazığ Erzincan Erzurum Eskişehir Gaziantep Giresun Gümüşhane Hakkari Hatay Iğdır Isparta İstanbul İzmir K.Maraş Karabük Karaman Kars Kastamonu Kayseri Kırıkkale Kırklareli Kırşehir Kilis Kocaeli Konya Kütahya Malatya Manisa Mardin Mersin Muğla Muş Nevşehir Niğde Ordu Osmaniye Rize Sakarya Samsun Siirt Sinop Sivas Şanlıurfa Şırnak Tekirdağ Tokat Trabzon Tunceli Uşak Van Yalova Yozgat Zonguldak
İstanbul
Çok Bulutlu
24°C
İstanbul
24°C
Çok Bulutlu
Cumartesi Hafif Yağmurlu
23°C
Pazar Parçalı Bulutlu
23°C
Pazartesi Çok Bulutlu
26°C
Salı Az Bulutlu
25°C

OpenAI Çığır Açacak Yeni Modellerini Duyurdu: İşte GPT‑Realtime‑2, GPT‑Realtime‑Translate ve GPT‑Realtime‑Whisper!

OpenAI, özellikle yapay zekâ ile sesli konuşma konusunda devrim niteliğinde olacak yeni modellerini duyurdu.

OpenAI Çığır Açacak Yeni Modellerini Duyurdu: İşte GPT‑Realtime‑2, GPT‑Realtime‑Translate ve GPT‑Realtime‑Whisper!
08.05.2026 22:20
1
A+
A-

Yapay zekâ sektöründe uzun süredir metin odaklı yarış yaşanıyordu. Şimdi ise sahne tamamen sese geçiyor. OpenAI, geliştiriciler için duyurduğu üç yeni ses modeliyle birlikte “konuşan uygulamalar” dönemini bir adım ileri taşımaya başlamış durumda.

İçerikten Görseller

×
+ −

‹ ›

Şirketin yeni modelleri artık sadece konuşmuyor; düşünüyor, çeviri yapıyor, bağlamı takip ediyor ve gerçek zamanlı aksiyon alabiliyor. Yeni sistemler arasında en dikkat çekeni ise GPT-Realtime-2. OpenAI bunu “GPT-5 seviyesinde akıl yürütme yeteneğine sahip ilk ses modeli” olarak tanımlıyor.

İçerikten Görseller

×
+ −

‹ ›

Yapay zekâ artık sadece cevap vermeyecek

Bugüne kadar birçok sesli asistan hızlı cevap vermeye odaklanıyordu ancak gerçek hayatta işler biraz daha karmaşık. İnsanlar konuşurken fikir değiştiriyor, cümleyi yarıda kesiyor, farklı konulara atlıyor ya da aynı anda birkaç şey istiyor.

OpenAI’ın yeni modelleri tam da bu kaosa göre tasarlanmış durumda. Şirketin verdiği örneklerden biri oldukça dikkat çekici. Bir kullanıcı emlak uygulamasına “Bütçeme uygun evleri bul, yoğun trafikli sokaklardan uzak olsun ve cumartesi için tur ayarla” diyebiliyor. Sistem ise bunu anlayıp farklı araçları aynı anda kullanarak işlemleri gerçekleştirebiliyor. Yani olay artık “hava nasıl?” seviyesini ciddi biçimde aşmış durumda.

Gerçek zamanlı çeviri dönemi başlıyor

Duyurulan modellerden biri olan GPT-Realtime-Translate, canlı konuşmaları anlık olarak çevirebiliyor. Üstelik sistem 70’ten fazla dili anlayıp bunları 13 farklı dile çevirebiliyor.

Bu kulağa basit gelebilir ama önemli nokta şu ki çeviri, konuşmanın temposunu bozmadan yapılıyor. İnsan doğal şekilde konuşurken sistem yetişmeye çalışmıyor, gerçekten sohbetin içine dâhil oluyor.

Toplantı notlarını siz daha konuşurken yazacak

Üçüncü model olan GPT-Realtime-Whisper ise gerçek zamanlı konuşma metne dönüştürme teknolojisine odaklanıyor. Kısacası biri konuşurken sistem aynı anda yazıya döküyor. Bu özellik özellikle toplantılar, canlı yayınlar, dersler ve müşteri hizmetleri gibi alanlarda büyük fark yaratabilir.

En ilginç tarafı ise yalnızca altyazı üretmesi değil. Sistem aynı anda özet çıkarabiliyor, not tutabiliyor ve konuşmanın bağlamını takip edebiliyor. Yani gelecekte “toplantı notlarını kim alacak?” sorusunun cevabı büyük ihtimalle kimse olmayacak.

GPT-Realtime-2 neler yapabiliyor?

OpenAI’ın en iddialı modeli olan GPT-Realtime-2, klasik sesli asistanlardan daha farklı çalışıyor. Model:

  • Aynı anda birden fazla araç kullanabiliyor
  • Kullanıcı konuşurken işlemleri sürdürebiliyor
  • Hataları daha doğal şekilde yönetebiliyor
  • Uzun konuşmalarda bağlamı kaybetmiyor
  • Tonlamasını duruma göre değiştirebiliyor

Örneğin sistem bir problem çözerken “Bir saniye kontrol ediyorum” gibi doğal geçiş cümleleri kurabiliyor. Küçük gibi görünen bu detay, konuşmanın robotik hissettirmemesini sağlıyor. OpenAI ayrıca modelin bağlam kapasitesini 32K’dan 128K’ya çıkardığını açıkladı. Bu da daha uzun ve karmaşık konuşmaların takip edilebilmesi anlamına geliyor.

Kısacası yakın gelecekte uygulamalarla konuşmak, uygulamalara yazmaktan daha yaygın hâle gelebilir ve görünen o ki başta OpenAI olmak üzere şirketler bu geleceğe şimdiden hazırlanıyor.

Yorumlar

Henüz yorum yapılmamış. İlk yorumu yukarıdaki form aracılığıyla siz yapabilirsiniz.