Microsoft усиливает своё присутствие в сфере искусственного интеллекта, представив сразу три новые модели, ориентированные на работу с текстом, голосом и изображениями. Компания делает ставку на развитие собственных технологий и стремится укрепить позиции на фоне усиливающейся конкуренции среди крупных игроков рынка.
Как пишет Центральная служба новостей, новые решения объединяет мультимодальный подход: они способны обрабатывать разные типы данных в рамках одной экосистемы. Среди них — модель для распознавания речи с поддержкой десятков языков, инструмент генерации аудио с возможностью создания пользовательских голосов и система для работы с визуальным контентом, включая генерацию изображений и видео.
Все разработки уже интегрируются в платформы Microsoft, включая Foundry и тестовую среду Playground. В компании подчёркивают, что основной акцент сделан на практическое применение ИИ в повседневных задачах пользователей, а дальнейшее развитие будет строиться на сочетании собственных технологий и партнёрских решений.