Spotify’da ses klonlama dönemi
Yukarıdaki senaryo için henüz gidilmesi gereken biraz daha yol var ancak adımlar atılmaya başlandı. OpenAI ile Spotify arasında yapılan ortaklık ile artık podcast yayıncıları kendi seslerini kullanarak diğer dillerdeki versiyonlarını yeniden üretmeye başlayacak.
Spotify, yeni aracıyla İngilizce bölümlerini İspanyolcaya çevirmek için bir avuç podcast yayıncısıyla ortaklık kurdu ve önümüzdeki haftalarda Fransızca ve Almanca çevirileri de kullanıma sunmayı planlıyor. Eğer ilgileniyorsanız, ilk bölümler Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons ve Steven Bartlett gibi büyük isimlerden gelecek.
Çeviri özelliğinin bel kemiği, hem İngilizce konuşmayı yazıya dökebilen hem de diğer dilleri İngilizceye çevirebilen OpenAI’ın ses dönüştürme aracı Whisper. Ancak Spotify’ın aracı, konuşmadan metne çevirinin ötesine geçerek bir podcast’i farklı bir dile çevirecek ve podcast yayıncısının kendi sesinin sentezlenmiş bir versiyonunda yeniden üretecek.
Spotify’ın kişiselleştirmeden sorumlu başkan yardımcısı Ziad Sultan yaptığı açıklamada, “Yaratıcının kendi sesiyle eşleşen Sesli Çeviri, dünyanın dört bir yanındaki dinleyicilere yeni podcast yayıncılarını daha önce hiç olmadığı kadar özgün bir şekilde keşfetme ve onlardan ilham alma gücü veriyor” dedi.
Bu yeni özelliğin ses kopyalama kısmının arkasında da muhtemelen OpenAI bulunuyor. Zira, detaylarına hemen üstteki bağlantıdan ulaşabileceğiniz bir duyuruda OpenAI, sadece metin ve birkaç saniyelik örnek konuşmadan insan benzeri ses oluşturabilen bir aracın lansmanı yaptı. Ancak OpenAI, bu ses klonlama modelini herkesin kullanımına açmayı en azından şimdilik -bariz sebeplerden dolayı- düşünmüyor.