Microsoft dévoile MAI-Voice-1 et MAI-1-preview, ses IA pour Copilot

Danny Weber

13:56 29-08-2025

© RusPhotoBank

Microsoft présente MAI-Voice-1 (audio d’1 min généré en <1 s) et MAI-1-preview, modèle texte IA entraîné sur 15 000 GPU H100, bientôt intégré à Copilot.

Microsoft franchit une nouvelle étape vers plus d’autonomie vis-à-vis d’OpenAI en dévoilant deux systèmes d’IA maison : MAI-Voice-1 et MAI-1-preview. C’est la première production d’ampleur de l’unité d’IA interne du groupe, et ce lancement paraît assumé.

Vedette de l’annonce, MAI-Voice-1 est un modèle vocal capable de générer un extrait audio d’une minute en moins d’une seconde, sur un seul GPU. La voix de synthèse est suffisamment réaliste pour qu’il soit difficile de la distinguer d’une voix humaine. Le modèle est déjà à l’œuvre dans Copilot Daily, où un présentateur lit l’actualité et propose des explications façon podcast sur des sujets complexes. Il est aussi accessible dans Copilot Labs, avec saisie de texte, changement de voix et réglage du style d’élocution. Le mélange de vitesse et de sobriété matérielle trahit une mise au point soignée.

Le second système, MAI-1-preview, est un modèle texte entraîné avec 15 000 GPU Nvidia H100. Conçu pour suivre des instructions, il génère des réponses dans l’esprit de ChatGPT. Microsoft prévoit de l’intégrer prochainement à Copilot pour réduire sa dépendance à OpenAI, et le modèle est déjà testé sur la plateforme ouverte LMArena. Ces essais publics laissent penser que l’équipe avance confiante et cherche des retours à grande échelle.