Microsoft bemutat három új mesterséges intelligencia modellt

Danny Weber

05:09 04-04-2026

© RusPhotoBank

Microsoft három új MI modellt mutat be szöveg, hang és képfeldolgozásra, erősítve pozícióját a versenyben. Multimodális megközelítés, integráció a platformokba.

A mesterséges intelligencia terén Microsoft erősíti a pozícióját három új modellel, amelyek szöveg, hang és képfeldolgozásra készültek. A vállalat saját technológiák fejlesztésére fogad, és célja, hogy megerősítse helyzetét a nagy piaci szereplők között fokozódó verseny közepette.

A Központi Hírügynökség szerint ezek az új megoldások multimodális megközelítést képviselnek: egyetlen ökoszisztémán belül képesek különböző típusú adatokat feldolgozni. Köztük van egy beszédfelismerő modell, amely több tucat nyelvet támogat, egy hanggeneráló eszköz, amely egyedi hangokat képes létrehozni, valamint egy vizuális tartalmak kezelésére szolgáló rendszer, beleértve a kép- és videógenerálást.

Mindezeket a fejlesztéseket már integrálják a Microsoft platformjaiba, mint a Foundry és a Playground tesztkörnyezet. A vállalat hangsúlyozza, hogy a fő fókusz az MI gyakorlati alkalmazása a felhasználók napi feladataiban, és a jövőbeli fejlődés a saját technológiák és partneri megoldások kombinálásán fog épülni.