Gündemdekiler

NVIDIA’dan Yapay Zeka Destekli Konuşma Algoritması: RAD-TTS

Sentezlenmiş sesler yıllar içinde çok yol katetti. Alexa ve Siri üzere çağdaş yapay zeka asistanları ise çok gerçekçi insan sesleri çıkarabiliyor, birebir vakitte epey akıcı konuşuyorlar. NVIDIA ise RAD-TTS isimli bir yapay zeka modeli geliştirdi.

Böylece geliştiriciler, modeli kendi sesleriyle eğitebiliyor ve öğrenilen tonlamalar kullanılarak metinler doğal konuşmaya dönüştürülebiliyor. Ayrıyeten bir konuşmacının ve hatta müziklerin sesi, bir öteki insanın sesine dönüştürülebiliyor. NVIDIA yeni tahlilini şöyle tanımlıyor:

Bir müzik enstrümanı olarak insan sesinden ilham alan RAD-TTS arayüzü, kullanıcılara sentezlenen sesin perdesi, müddeti ve gücü üzerinde ince denetimler sağlıyor.

NVIDIA ayrıyeten “I AM AI” görüntü serisinde kullanılan teknolojinin örneklerini sergiliyor. Aşağıdaki görüntüde ise yapay zeka takviyeli modelin birtakım marifetlerinden bahsedilmiş.

Bu teknoloji, otomatik müşteri hizmetleri, lisan çevirisi, engelliler için dayanak ve hatta oyunlar dahil olmak üzere birçok alanda kullanılabilir. Özetleyecek olursak, doğal insan sesi gerektiren çabucak hemen her uygulamada RAD-TTS’den yararlanmak mümkün olabilir.

Blog yazısında yapay zeka takviyeli teknolojiyle ilgili ayrıyeten şu bilgiler veriliyor:

Modellerin birçoğu NVIDIA DGX sistemlerinde on binlerce saatlik ses datalarıyla eğitiliyor. Geliştiriciler, kullanım durumuna nazaran rastgele bir modele ince ayar yapabilir ve NVIDIA Tensor Core GPU’larda karma hassas bilgi süreç kullanarak eğitimi hızlandırabilir.

Araçlar NVIDIA ekran kartlarına sahip bilgisayarlarda kullanım için optimize edildi. Fakat çalışmalar açık kaynak kodlu ve ilgilenen tüm geliştiriciler için fiyatsız olarak sunuluyor.

Kaynak: Technopat

Başa dön tuşu