Nowe modele sztucznej inteligencji Microsoft do tekstu, głosu i obrazów

Microsoft wzmacnia swoją pozycję w obszarze sztucznej inteligencji, wprowadzając trzy nowe modele przeznaczone do przetwarzania tekstu, głosu i obrazów. Firma stawia na rozwój własnych technologii, dążąc do umocnienia swojej pozycji w obliczu rosnącej konkurencji między głównymi graczami rynkowymi.

Jak informuje Centralna Agencja Informacyjna, nowe rozwiązania łączy podejście multimodalne – mogą przetwarzać różne rodzaje danych w ramach jednego ekosystemu. Wśród nich znalazł się model rozpoznawania mowy obsługujący dziesiątki języków, narzędzie do generowania dźwięku zdolne do tworzenia spersonalizowanych głosów oraz system do obsługi treści wizualnych, w tym generowania obrazów i wideo.

Wszystkie te rozwiązania są już wdrażane na platformach Microsoft, w tym w środowisku Foundry i testowym Playground. Firma podkreśla, że główny nacisk kładzie na praktyczne zastosowanie AI w codziennych zadaniach użytkowników, a dalszy rozwój będzie oparty na łączeniu własnych technologii z rozwiązaniami partnerów.