Danny Weber
05:08 04-04-2026
© RusPhotoBank
Microsoft posiluje své postavení v oblasti umělé inteligence s multimodálními modely pro rozpoznávání řeči, generování audia a práci s vizuálním obsahem. Zjistěte více o integraci do platforem.
Microsoft posiluje své postavení v oblasti umělé inteligence tím, že představuje tři nové modely určené pro zpracování textu, hlasu a obrazu. Společnost sází na rozvoj vlastních technologií a snaží se upevnit svou pozici v situaci, kdy mezi hlavními hráči na trhu roste konkurence.
Podle informací Ústřední zpravodajské služby mají tyto nové řešení společný multimodální přístup: dokážou zpracovávat různé typy dat v rámci jednoho ekosystému. Jde o model pro rozpoznávání řeči podporující desítky jazyků, nástroj pro generování audia schopný vytvářet vlastní hlasy a systém pro práci s vizuálním obsahem včetně generování obrázků a videí.
Všechny tyto novinky se již integrují do platforem Microsoftu, mezi které patří Foundry a testovací prostředí Playground. Společnost zdůrazňuje, že hlavní důraz klade na praktické využití umělé inteligence v každodenních úkolech uživatelů. Budoucí vývoj bude podle ní vycházet z kombinace vlastních technologií s řešeními partnerů.