OpenAI, Ses Klonlama Aracı Voice Engine’i Tanıttı!

Büşra Koça
A+A-
Reset

OpenAI, yeni bir ses üretme aracı olan Voice Engine’i duyurdu. Bu araç, insan seslerini son derece gerçekçi bir şekilde taklit edebilme yeteneğine sahip ve metinleri doğal bir sesle seslendirebiliyor. Voice Engine, kullanıcıların metin tabanlı içerikleri sesli hale getirmesine olanak tanıyarak iletişimi daha etkili hale getiriyor.

OpenAI, yapay zeka alanındaki öncü konumuyla tanınan bir teknoloji devi olduğunu rahatlıkla söyleyebiliriz. Şirket, sohbet botlarından görsel üretimine kadar geniş bir yelpazedeki modelleriyle dikkat çekiyor ve dijital çağın öncüsü konumunda. En son olarak, gerçekçiliğiyle dikkat çeken “Sora” modeliyle hayrete düşüren videolar oluşturma yeteneğini görmüştük.

Şimdi, OpenAI yepyeni bir model olan “Voice Engine”i duyurdu. Bu model, insan sesini son derece gerçekçi bir şekilde taklit edebiliyor ve ses teknolojilerinde yeni bir dönemi başlatıyor.

15 saniyelik örnekle gerçek insan sesini klonlayabiliyor

OpenAI, ses odaklı çalışmalara yabancı değil. Şirket, zaten yapay zeka destekli ses araçlarına sahipti. Örneğin, ChatGPT ile olan etkileşimimiz, bu alandaki çalışmaların başarılı bir örneğini oluşturuyor. Voice Engine ise şirketin metinden ses üretme çabalarının bir devamı niteliğinde. OpenAI’ın açıklamasına göre, bu araç aslında 2022’den beri küçük bir grup tarafından test ediliyordu.

Voice Engine, bir ses klonlama modeli olarak tanımlanabilir. Bu model, sadece 15 saniyelik bir ses örneğiyle gerçek bir insanın sesini kusursuz bir şekilde kopyalayabiliyor. Kullanıcılar, bu kopyalanan sesi istedikleri metni okutmak için kullanabiliyorlar. Ayrıca, klonlanan sesi farklı dillere çevirmek de mümkün hale geliyor.

OpenAI, yayınladığı blog gönderisinde Voice Engine’in çeşitli alanlarda nasıl kullanılabileceğine dair bilgiler de paylaştı. Bu alanlar arasında okuma desteği, içerik çevirisi ve konuşma bozukluklarına sahip bireylere yardımcı olma gibi hedefler bulunuyor.