Danny Weber
14:03 29-08-2025
© RusPhotoBank
Microsoft irtautuu OpenAI-riippuvuudesta esittelemällä MAI-Voice-1-puhemallin ja MAI-1-preview-tekstimallin. Nopea synteettinen ääni ja Copilot-tuki mukana.
Microsoft ottaa taas askeleen irti OpenAI-riippuvuudesta ja esittelee kaksi omaa tekoälyjärjestelmää: MAI-Voice-1 ja MAI-1-preview. Kyse on yhtiön sisäisen AI-yksikön ensimmäisestä suuresta julkaisusta, ja avaus vaikuttaa varmaotteiselta.
Pääosassa on MAI-Voice-1, puhemalli, joka tuottaa minuutin mittaisen äänileikkeen alle sekunnissa ja toimii yhdellä GPU:lla. Synteettinen ääni on niin vakuuttava, että sen erottaminen aidosta puhujasta on erittäin vaikeaa. Malli on jo käytössä Copilot Dailyssa, jossa juontaja lukee uutisia ja tarjoaa podcast-tyylisiä selityksiä monimutkaisista aiheista. Se on myös kokeiltavissa Copilot Labsissa: käyttäjä voi syöttää tekstiä, vaihtaa ääniä ja säätää puhetyyliä. Nopeuden ja vaatimattomien laitevaatimusten yhdistelmä viittaa huolelliseen insinöörityöhön.
Toinen järjestelmä, MAI-1-preview, on tekstimalli, joka on koulutettu 15 000 Nvidia H100 -GPU:lla. Se on suunniteltu noudattamaan ohjeita ja tuottamaan ChatGPT:tä muistuttavia vastauksia. Microsoft aikoo tuoda sen pian osaksi Copilotia vähentääkseen riippuvuuttaan OpenAI:sta, ja mallia testataan jo avoimella LMArena-alustalla. Julkiset kokeilut kertovat siitä, että tiimi luottaa ratkaisuunsa ja hakee laajaa palautetta.