YouTube ने डब्ड वीडियो के लिए एआई लिप‑सिंकिंग का परीक्षण शुरू किया

YouTube दर्शकों की भागीदारी बढ़ाने के लिए एआई‑संचालित टूल्स को तेजी से आगे बढ़ा रहा है। ऑटो डबिंग लागू करने के बाद अब प्लेटफ़ॉर्म अगला कदम आज़मा रहा है: अनुवादित ऑडियो ट्रैक के साथ होंठों की हरकतों को सिंक करना। यह स्वाभाविक विकास डब किए गए वीडियो को ‘जुड़े हुए’ फीचर की तरह नहीं, बल्कि मूल प्रोडक्शन जैसा अहसास देने की कोशिश है.

Auto-dubbing lead Buddika Kottahachchi के अनुसार, यह तकनीक विशेष एल्गोरिद्म पर आधारित है जो पिक्सल स्तर पर होंठों के आकार और चेहरे की सूक्ष्म गतियों को समायोजित करते हैं, ताकि नतीजा जितना हो सके उतना नैसर्गिक लगे। सिस्टम होंठ, दांत और चेहरे के भाव की त्रि‑आयामी संरचना को ध्यान में रखता है, और इसे Google द्वारा विकसित एक कस्टम एआई मॉडल शक्ति देता है.

फिलहाल यह सुविधा 1080p तक के वीडियो के साथ काम करती है और पांच भाषाओं को सपोर्ट करती है: अंग्रेजी, फ्रेंच, जर्मन, पुर्तगाली और स्पैनिश। Google इस दायरे को 20 से अधिक भाषाओं तक बढ़ाने की योजना में है—और इसमें वे सभी भाषाएँ शामिल होंगी जो YouTube की ऑटो‑डबिंग में पहले से उपलब्ध हैं। सीमित शुरुआत संकेत देती है कि कंपनी तकनीक को परिपक्व होने का समय देते हुए सतर्कतापूर्वक आगे बढ़ना चाहती है.