YouTube nasazuje AI synchronizaci rtů pro dabovaná videa: co zatím umí

YouTube pokračuje v nasazování nástrojů založených na umělé inteligenci, které mají zvýšit zapojení publika. Po zavedení automatického dabingu teď platforma zkouší další krok: synchronizovat pohyby rtů s přeloženou zvukovou stopou. Působí to jako přirozené pokračování – snaha, aby dabovaná videa nepůsobila jako přídavek, ale co nejvíc jako původní tvorba, a aby diváky nerušil pocit „přelepeného“ hlasu.

Podle vedoucího auto‑dubbingu Buddiky Kottahachchiho se technologie opírá o specializované algoritmy, které na úrovni pixelů upravují tvary rtů a mikropohyby v obličeji tak, aby výsledek působil co nejpřirozeněji. Systém bere v potaz trojrozměrnou geometrii rtů, zubů i mimiky a pohání jej vlastní model umělé inteligence vyvinutý Googlem.

Zatím funkce funguje pouze u videí do rozlišení 1080p a podporuje pět jazyků: angličtinu, francouzštinu, němčinu, portugalštinu a španělštinu. Google plánuje nabídku rozšířit na více než dvacet jazyků, včetně všech, které už YouTube zvládá v automatickém dabingu. Úzce vymezený start naznačuje opatrné nasazení, dokud technologie dozrává, což vzhledem k novosti přístupu dává smysl.