Google, 31 Dili Destekleyen Yeni Ses Modeli Chirp 3’ü Tanıttı

Google, sesli yapay zekâ teknolojilerine yönelik çalışmalarını hızlandırarak Chirp 3 adlı yeni modelini duyurdu. Sesli komut sistemleri, müşteri destek çözümleri, sesli kitap üretimi ve video seslendirme gibi birçok alanda kullanılacak olan model, 31 dili destekleyerek 8 farklı ses seçeneği sunuyor.

Google, Chirp 3’ü Vertex AI platformuna eklemek için hazırlıklara başladı. Yapılan açıklamaya göre, güncelleme önümüzdeki hafta kullanıcılara sunulacak. Londra’daki DeepMind ofisinde düzenlenen bir etkinlikte tanıtılan yeni model, yapay zekâ destekli konuşma sentezini daha geniş bir kitleye ulaştırmayı hedefliyor.

Sesli Yapay Zekâ Yarışı Kızışıyor

Sesli yapay zekâ teknolojileri yalnızca Google’ın ilgi alanıyla sınırlı değil. Geçtiğimiz hafta Sesame, geliştiricilerin kendi ses modeli platformlarını oluşturmasına olanak tanıyan yeni bir sistem duyurdu. ElevenLabs gibi şirketler de ses teknolojilerine yönelik yatırımlarını artırarak, bu alandaki rekabeti kızıştırıyor.

Güvenlik Önlemleri ve Gelecek Planları

Google, Chirp 3’ün kötüye kullanımını önlemek amacıyla bazı güvenlik kısıtlamaları getireceğini açıkladı. Google Cloud CEO’su Thomas Kurian, şirketin güvenlik ekipleriyle yakından çalıştığını ve modelin etik kullanımı sağlamak için önlemler alındığını belirtti.

Vertex AI, Google’ın 2021 yılında makine öğrenimi modelleri geliştirmek isteyen yazılımcılar için oluşturduğu bir platformdu. Şirket, yapay zekâya olan ilginin artmasıyla birlikte Gemini dil modeli, Imagen görüntü üretim aracı ve Veo 2 video üretim sistemi gibi gelişmiş araçları da platforma entegre etti. Chirp 3, bu ekosistemin önemli bir parçası olacak.

DeepMind CEO’su Demis Hassabis, yapay zekâ alanındaki gelişmelerin hızla ilerlediğini ancak genel yapay zekâ seviyesine ulaşmanın hâlâ zaman alacağını vurguladı. Önümüzdeki yıllarda yapay zekâ tabanlı ses teknolojilerinin daha yaygın hale gelmesi bekleniyor.