Microsoft představuje MAI-Voice-1 a MAI-1-preview: bleskový hlasový model a vlastní textový model AI pro Copilot

Danny Weber

14:04 29-08-2025

© RusPhotoBank

Microsoft uvádí MAI-Voice-1 a MAI-1-preview: hlasový model vytvoří minutový hlas během sekundy na jediném GPU, textový model pro Copilot trénován na 15k H100.

Microsoft vykročil k větší nezávislosti na OpenAI a představil dva vlastní AI systémy: MAI-Voice-1 a MAI-1-preview. Jde o první výrazný výstup interního týmu pro umělou inteligenci a premiéra působí sebejistě.

Hlavní pozornost si bere MAI-Voice-1, řečový model, který zvládne během méně než jedné sekundy vytvořit minutovou zvukovou ukázku a běží na jediném GPU. Syntetizovaný hlas je natolik přesvědčivý, že jej od skutečného člověka sotva odlišíte. Model už pracuje v Copilot Daily, kde moderátor předčítá zprávy a nabízí podcastově laděná vysvětlení složitějších témat. Zároveň je k vyzkoušení v Copilot Labs, kde mohou uživatelé zadat text, přepínat hlasy a doladit způsob podání. Kombinace rychlosti a střídmých nároků na hardware prozrazuje pečlivé inženýrství.

Druhý systém, MAI-1-preview, je textový model trénovaný s využitím 15 000 GPU Nvidia H100. Je koncipovaný tak, aby plnil instrukce a generoval odpovědi podobné ChatGPT. Microsoft jej plánuje brzy propojit s Copilotem, aby snížil závislost na OpenAI, a model se už testuje na otevřené platformě LMArena. Veřejné zkoušky naznačují sebevědomí týmu i snahu získat co nejširší odezvu.