Ajanslar, İş birlikleri ve Dijital HaberlerGündemdekiler

Alibaba Group, Fotoğrafları Videoya Dönüştüren ve Seslendiren Yapay Zeka Aracı EMO’yu Tanıttı

Yapay zeka teknolojisi gün geçtikçe yeni özelliklerle gelişmeye devam ediyor. En son gelişmelerden biri olan EMO, tek bir referans görselden video oluşturabilme yeteneği sunuyor.

Çin menşeli teknoloji devi Alibaba Group, görselleri video formatına çevirebilen ve seslendirebilen yapay zeka aracı olan EMO‘yu duyurdu. Yapay zeka teknolojisi gün geçtikçe yeni özelliklerle gelişmeye devam ediyor. En son gelişmelerden biri olan EMO, tek bir referans görselden video oluşturabilme yeteneği sunuyor.

Video oluşturma konusunda birçok yapay zeka modeli bulunmakla birlikte, EMO’nun dikkat çeken özelliklerinden biri, referans görseli temel alarak sesle bütünleştirilmiş videoları oluşturabilmesidir. EMO ile oluşturulan videolarda insan hareketleri ve mimiklerin gerçekçiliği öne çıkan özellikler arasında yer alıyor. Ayrıca, EMO tarafından oluşturulan videolardaki ağız hareketleri, eklenen ses dosyasına uygun olarak otomatik olarak ayarlanabiliyor.

EMO’nun önemli bir özelliği de ses kaynağındaki tempoyu algılayabilmesidir. Bu özellik sayesinde, yavaşça okunan bir metin ile hızla söylenen kelimeler arasındaki farkı profesyonelce değerlendirerek görüntüyü buna göre oluşturabilmektedir. Ayrıca, referans görselin gerçek bir kişi olmasına gerek olmaksızın, EMO kurgusal karakterleri de konuşturabilmektedir.

EMO’nun çalışma yöntemi iki kısımdan oluşmaktadır. İlk aşamada, referans görselden hareketli videolar oluşturulurken, ikinci aşamada ise ses dosyası incelenerek önemli kısımlar belirlenmektedir. Son olarak, belirlenen ses dosyası ile video birleştirilmektedir. Ayrıca, yapay zekanın iki kontrol merkezi bulunmaktadır; biri görseldeki resmin bütünlüğünü denetlerken, diğeri ise sesle ilgili kısımları kontrol etmektedir.

Başa dön tuşu