enflasyonemeklilikötvdövizakpchpmhp
DOLAR
45,9277
EURO
53,4772
ALTIN
6.629,13
BIST
13.703,96
Adana Adıyaman Afyon Ağrı Aksaray Amasya Ankara Antalya Ardahan Artvin Aydın Balıkesir Bartın Batman Bayburt Bilecik Bingöl Bitlis Bolu Burdur Bursa Çanakkale Çankırı Çorum Denizli Diyarbakır Düzce Edirne Elazığ Erzincan Erzurum Eskişehir Gaziantep Giresun Gümüşhane Hakkari Hatay Iğdır Isparta İstanbul İzmir K.Maraş Karabük Karaman Kars Kastamonu Kayseri Kırıkkale Kırklareli Kırşehir Kilis Kocaeli Konya Kütahya Malatya Manisa Mardin Mersin Muğla Muş Nevşehir Niğde Ordu Osmaniye Rize Sakarya Samsun Siirt Sinop Sivas Şanlıurfa Şırnak Tekirdağ Tokat Trabzon Tunceli Uşak Van Yalova Yozgat Zonguldak
İstanbul
Parçalı Bulutlu
30°C
İstanbul
30°C
Parçalı Bulutlu
Çarşamba Parçalı Bulutlu
28°C
Perşembe Parçalı Bulutlu
30°C
Cuma Parçalı Bulutlu
27°C
Cumartesi Parçalı Bulutlu
27°C

OpenAI’den ileri seviye ses modeli: gpt-realtime özellikleri ve fiyatı

OpenAI, en gelişmiş konuşma modeli gpt-realtime’ı tanıttı. Daha doğal sesler, güçlü performans, yeni API özellikleri ve %20 daha uygun fiyatıyla geliştiricilere sunuldu.

OpenAI’den ileri seviye ses modeli: gpt-realtime özellikleri ve fiyatı
29.08.2025 11:00
9
A+
A-

OpenAI, Ekim 2024’te geliştiricilerin uygulamalarında düşük gecikmeli ve çok modlu deneyimler oluşturmasına imkan tanıyan Realtime API’yi duyurmuştu. O tarihten bu yana binlerce geliştirici, uygulamalarında doğal konuşma tabanlı etkileşimler sunmak için bu API’yi kullanmaya başladı.

gpt-realtime: En gelişmiş konuşma modeli

Bugün OpenAI, gpt-realtime adlı en gelişmiş speech-to-speech modelini tanıttı. Yeni model; karmaşık talimatları daha doğru şekilde yerine getirebiliyor, araçları daha düşük hata oranıyla çağırabiliyor ve çok daha doğal, anlamlı diyaloglar üretebiliyor. Ayrıca sistem mesajlarını ve geliştirici istemlerini yorumlama konusunda da önemli geliştirmeler içeriyor.

Yeni sesler: Marin ve Cedar

Realtime API ilk çıktığında 6 farklı ses seçeneği sunuyordu. Daha sonra iki ses eklenmişti. Şimdi ise OpenAI, Marin ve Cedar adlı iki yeni sesi duyurdu. Bunun yanı sıra mevcut 6 ses de daha doğal bir tonla güncellendi.

Kıyaslamalarda öne çıkan performans

Yeni gpt-realtime modeli, önceki sürümlere göre dikkat çekici bir performans artışı gösteriyor:

  • Big Bench Audio: %82,8 doğruluk (Aralık 2024 modelinde %65,6)

  • MultiChallenge: %30,5 puan (önceki model %20,6)

  • ComplexFuncBench: %66,5 puan (önceki model %49,7)

API’ye gelen yenilikler

Modelin yanı sıra API tarafında da önemli güncellemeler bulunuyor:

  • Uzak MCP sunucuları desteği

  • Görüntü girişleri işleme özelliği

  • SIP protokolü ile telefon görüşmesi entegrasyonu

  • İstemleri kaydetme ve yeniden kullanma imkanı

Daha güçlü, daha uygun fiyatlı

Tüm bu iyileştirmelere rağmen OpenAI, fiyatları düşürdü. Yeni gpt-realtime API, 1M ses giriş belirteci için 32$ (önbelleğe alınmış girişler için 0.40$) ve 1M ses çıkış belirteci için 64$ fiyatla sunuluyor. Bu rakamlar, gpt-4o-realtime-önizleme sürümüne göre %20 daha uygun.

Performans artışı, yeni özellikler ve fiyat avantajı ile OpenAI, gpt-realtime’ı ses öncelikli deneyimler geliştirmek isteyenler için güçlü bir seçenek haline getiriyor.

ETİKETLER: , , ,
Yorumlar

Henüz yorum yapılmamış. İlk yorumu yukarıdaki form aracılığıyla siz yapabilirsiniz.