YouTube testaa tekoälyn huulisynkronointia käännettyihin ääniraitoihin

YouTube kiihdyttää tekoälyyn nojaavien työkalujen kehitystä kasvattaakseen katsojien sitoutumista. Automaattidubbausten jälkeen alustalla pilotoidaan seuraavaa askelta: huulten liikkeiden synkronointia käännettyyn ääniraitaan. Se on luonteva jatkumo, jonka tavoitteena on saada dubatut videot tuntumaan vähemmän irrallisilta ja enemmän alkuperäistuotannoilta.

Auto-dubbauksen kehitystä johtavan Buddika Kottahachchin mukaan taustalla ovat erikoisalgoritmit, jotka säätävät suun muotoja ja kasvojen mikrolikkeitä pikselitasolla, jotta lopputulos näyttäisi mahdollisimman luontevalta. Järjestelmä huomioi huulten, hampaiden ja ilmeiden kolmiulotteisen geometrian, ja sitä pyörittää Googlen kehittämä räätälöity tekoälymalli.

Toistaiseksi ominaisuus toimii vain enintään 1080p-tarkkuuden videoissa ja tukee viittä kieltä: englantia, ranskaa, saksaa, portugalia ja espanjaa. Google aikoo laajentaa valikoiman yli 20 kieleen, mukaan lukien kaikki kielet, joita YouTuben automaattidubbaus jo tukee. Suppea aloitus kertoo varovaisesta etenemisestä tekniikan kypsyessä — ratkaisu, joka tyypillisesti näkyy laadukkaampana lopputuloksena.