NVIDIA’dan Yapay Zeka Destekli Konuşma Algoritması: RAD-TTS

1 Eylül 2021

241 1 dakika okuma süresi

Sentezlenmiş sesler yıllar içinde çok yol katetti. Alexa ve Siri üzere çağdaş yapay zeka asistanları ise çok gerçekçi insan sesleri çıkarabiliyor, birebir vakitte epey akıcı konuşuyorlar. NVIDIA ise RAD-TTS isimli bir yapay zeka modeli geliştirdi.

Böylece geliştiriciler, modeli kendi sesleriyle eğitebiliyor ve öğrenilen tonlamalar kullanılarak metinler doğal konuşmaya dönüştürülebiliyor. Ayrıyeten bir konuşmacının ve hatta müziklerin sesi, bir öteki insanın sesine dönüştürülebiliyor. NVIDIA yeni tahlilini şöyle tanımlıyor:

“Bir müzik enstrümanı olarak insan sesinden ilham alan RAD-TTS arayüzü, kullanıcılara sentezlenen sesin perdesi, müddeti ve gücü üzerinde ince denetimler sağlıyor.”

NVIDIA ayrıyeten “I AM AI” görüntü serisinde kullanılan teknolojinin örneklerini sergiliyor. Aşağıdaki görüntüde ise yapay zeka takviyeli modelin birtakım marifetlerinden bahsedilmiş.

Bu teknoloji, otomatik müşteri hizmetleri, lisan çevirisi, engelliler için dayanak ve hatta oyunlar dahil olmak üzere birçok alanda kullanılabilir. Özetleyecek olursak, doğal insan sesi gerektiren çabucak hemen her uygulamada RAD-TTS’den yararlanmak mümkün olabilir.

Blog yazısında yapay zeka takviyeli teknolojiyle ilgili ayrıyeten şu bilgiler veriliyor:

“Modellerin birçoğu NVIDIA DGX sistemlerinde on binlerce saatlik ses datalarıyla eğitiliyor. Geliştiriciler, kullanım durumuna nazaran rastgele bir modele ince ayar yapabilir ve NVIDIA Tensor Core GPU’larda karma hassas bilgi süreç kullanarak eğitimi hızlandırabilir.”

Araçlar NVIDIA ekran kartlarına sahip bilgisayarlarda kullanım için optimize edildi. Fakat çalışmalar açık kaynak kodlu ve ilgilenen tüm geliştiriciler için fiyatsız olarak sunuluyor.

Kaynak: Technopat

Etiketler

1 Eylül 2021

241 1 dakika okuma süresi

NVIDIA’dan Yapay Zeka Destekli Konuşma Algoritması: RAD-TTS

Instagram’dan En İyi İçerik Üreticilerine Altın Yüzük Ödülü

Instagram, Aylık 3 Milyar Kullanıcıyı Aştı

Instagram, Reels Videoları İçin PiP Özelliğini Test Ediyor

Spotify, 2025’in İkinci Çeyreğinde Gelirini ve Abone Sayısını Artırdı

Portuma Connect ile Alışverişlio Arasında Stratejik İş Birliği

Kedi Sahipliğine Eğlenceli Bir Başlangıç: WHISKAS®’tan Yeni Podcast “Miyavcast”

Portuma CEO’su Ozan Emrah Ünal DEİK – Foreign Economic Relations Board Dijital Teknolojiler İş Konseyi Oyun Komitesi Üyesi Oldu!

Algida, 35. Yılını İkonik Kırmızı-Beyaz Şemsiyeleriyle Kutluyor