Yeni ChatGPT Ses Modu Özellikleri Önümüzdeki Hafta Hizmete Giriyor

İlk olarak belirli bir grup ChatGPT Plus abonesine sunulacak ve sonbaharda daha geniş çaplı bir sürüm bekleniyor

Yazar Ali Artur
Yeni ChatGPT Ses Modu
Görsel: Lance Whitney/ZDNET

Özet

  • GPT-4o Ses Modu, ChatGPT ile konuşmanın doğal hissini geliştirecek.
  • Yeni özellikler arasında yanıt süresinin kısaltılması ve farklı ses tonları yer alıyor.

Beklenenden daha uzun bir bekleyişin ardından OpenAI'den Sam Altman X'e verdiği yanıtta GPT-4o'nun yeni ses özelliklerinin nihayet önümüzdeki hafta yayınlanmaya başlayacağını belirtti. Bununla birlikte, bu alfa sürümü başlangıçta küçük bir ChatGPT Plus abonesi grubuyla sınırlı olacak ve özelliklerin sonbaharda daha geniş bir sürüm görmesi muhtemel.

OpenAI, Mayıs ayında yeni modeli GPT-4o'yu sergilemişti. Tanıtım, gerçek zamanlı bir video akışından gelen bilgilere yanıt verme yeteneği ve GPT-4o ile konuşmayı bir insanla konuşmaya benzetecek yeni ses özellikleri gibi bazı etkileyici yeni yetenekleri içeriyordu. GPT-4o piyasaya sürüldüğünde, ses özellikleri eksikti ve uygulamada yeni Ses Modu özelliklerinin yakında kullanıma sunulacağını belirten mesajlar vardı. Görünüşe göre bu özelliklerin kullanıma sunulması nihayet başlayacak.

GPT-4o Ses Modu, ChatGPT ile Konuşmayı Çok Daha Doğal Hissettirecek

GPT-4o'nun piyasaya sürülmesinden önce bile GPT-4 ile Ses Modunda konuşabiliyordunuz, fakat en büyük dezavantajlarından biri, ortalama 5,4 saniyelik bir gecikmeyle normal bir konuşma hissi vermesinin zor oluşuydu. Yüksek sesle konuşuyorsunuz, ardından herhangi bir yanıt almadan önce birkaç saniye boyunca düşünce balonu animasyonunu izlemek zorunda kalıyorsunuz.

Yeni GPT-4o Ses Modu ortalama yanıt süresini sadece 320 milisaniyeye indirecek ve 232 milisaniyeye kadar düşürebilecek. Bu da GPT-4o ile anında ileri-geri konuşma yapabilmenizi sağlıyor. Duyuru sırasında yapılan gösterimlerde, yanıtlar etkileyici derecede hızlıydı. Ayrıca sadece tekrar konuşarak yanıtı kesmek de mümkündür; sesli yanıt duracak ve GPT-4o tekrar dinlemeye başlayacaktır.

Ancak tek değişiklik hız değil. GPT-4o'nun farklı ses tonlarında veya diğer farklı şekillerde konuşmasını sağlamak mümkündür. Tanıtım videolarında GPT-4o'nun alaycı bir ses tonuyla konuştuğu, bir spor spikeri gibi konuştuğu, farklı hızlarda ona kadar saydığı ve hatta Mutlu Yıllar şarkısını söylediği görülüyor. Eğer gerçek hayattaki yetenekleri de tanıtımlarda olduğu kadar etkileyiciyse, GPT-4o ile konuşmak gerçekten de başka bir insanla konuşmak gibi hissettirecek.

GPT-4o'daki Ses Modu aynı zamanda gerçek zamanlı çeviri yeteneğine de sahip. Örneğin, bir kişinin GPT-4o ile bir dilde konuşması ve ikinci bir kişinin GPT-4o ile farklı bir dilde konuşması mümkündür. GPT-4o daha sonra her bir ifadeyi karşı dilde tekrarlayarak aynı dili konuşmayan iki kişinin sohbet etmesine olanak tanır.

GPT-4o Ses Modu İçin Biraz Daha Beklemeniz Gerekecek

Yeni özelliklerin ilk sürümü uzun zamandır bekleniyordu. OpenAI Mayıs ayında "önümüzdeki haftalar içinde" kullanıma sunulacaklarını belirtmişti ancak duyurudan bu yana geçen hafta sayısı şimdiden çift haneli rakamlara ulaştı. Ancak, en azından küçük bir avuç insan için bekleyiş neredeyse sona erdi. X'te Sam Altman'ın verdiği bilginin yanı sıra, ChatGPT uygulamasındaki mesajda Open AI'nin "Temmuz ayı sonlarında küçük bir Plus kullanıcı grubuyla alfaya başlayacağı" da belirtiliyor.

Bu küçük ilk dağıtım, ChatGPT Plus kullanıcısı olsanız bile, önümüzdeki hafta yeni Ses Modu özelliklerine erişme olasılığınızın oldukça düşük olduğu anlamına geliyor. Bununla birlikte, mesajda ayrıca "planın tüm Plus kullanıcılarının sonbaharda erişime sahip olması" olduğu belirtiliyor, bu nedenle umarım geri kalanımızın çok fazla beklemesi gerekmeyecek. Kesin olan bir şey var; yeni Ses Modu çıktığında, Scarlett Johansson gibi bir ses duyulmayacak.