Microsoft renforce son IA avec des modèles multimodaux
Microsoft lance trois nouveaux modèles d'IA pour traiter texte, voix et images, intégrés à ses plateformes pour des applications pratiques quotidiennes.
Microsoft lance trois nouveaux modèles d'IA pour traiter texte, voix et images, intégrés à ses plateformes pour des applications pratiques quotidiennes.
© RusPhotoBank
Microsoft renforce sa position dans le domaine de l'intelligence artificielle en lançant trois nouveaux modèles dédiés au traitement du texte, de la voix et des images. La société mise sur le développement de ses propres technologies pour consolider sa place face à une concurrence croissante entre les grands acteurs du marché.
Selon le Central News Service, ces solutions adoptent une approche multimodale : elles peuvent traiter différents types de données au sein d'un même écosystème. On y trouve notamment un modèle de reconnaissance vocale prenant en charge des dizaines de langues, un outil de génération audio capable de créer des voix sur mesure, ainsi qu'un système pour gérer du contenu visuel, incluant la génération d'images et de vidéos.
Tous ces développements sont déjà intégrés aux plateformes de Microsoft, dont Foundry et l'environnement de test Playground. L'entreprise souligne que l'accent est mis sur l'application pratique de l'IA dans les tâches quotidiennes des utilisateurs. À l'avenir, les progrès reposeront sur la combinaison de technologies propriétaires avec des solutions de partenaires.