Danny Weber
14:04 29-08-2025
© RusPhotoBank
Microsoft uvádí MAI-Voice-1 a MAI-1-preview: hlasový model vytvoří minutový hlas během sekundy na jediném GPU, textový model pro Copilot trénován na 15k H100.
Microsoft vykročil k větší nezávislosti na OpenAI a představil dva vlastní AI systémy: MAI-Voice-1 a MAI-1-preview. Jde o první výrazný výstup interního týmu pro umělou inteligenci a premiéra působí sebejistě.
Hlavní pozornost si bere MAI-Voice-1, řečový model, který zvládne během méně než jedné sekundy vytvořit minutovou zvukovou ukázku a běží na jediném GPU. Syntetizovaný hlas je natolik přesvědčivý, že jej od skutečného člověka sotva odlišíte. Model už pracuje v Copilot Daily, kde moderátor předčítá zprávy a nabízí podcastově laděná vysvětlení složitějších témat. Zároveň je k vyzkoušení v Copilot Labs, kde mohou uživatelé zadat text, přepínat hlasy a doladit způsob podání. Kombinace rychlosti a střídmých nároků na hardware prozrazuje pečlivé inženýrství.
Druhý systém, MAI-1-preview, je textový model trénovaný s využitím 15 000 GPU Nvidia H100. Je koncipovaný tak, aby plnil instrukce a generoval odpovědi podobné ChatGPT. Microsoft jej plánuje brzy propojit s Copilotem, aby snížil závislost na OpenAI, a model se už testuje na otevřené platformě LMArena. Veřejné zkoušky naznačují sebevědomí týmu i snahu získat co nejširší odezvu.