Danny Weber
05:02 04-04-2026
© RusPhotoBank
Microsoft presenta tre nuovi modelli AI multimodali per elaborare testo, voce e immagini, integrati in piattaforme come Foundry e Playground per applicazioni pratiche.
Microsoft rafforza la sua posizione nel campo dell'intelligenza artificiale con tre nuovi modelli pensati per elaborare testo, voce e immagini. L'azienda punta a sviluppare tecnologie proprie, con l'obiettivo di consolidare la sua posizione in un mercato sempre più competitivo.
Secondo quanto riportato dal Central News Service, queste nuove soluzioni condividono un approccio multimodale: possono gestire diversi tipi di dati all'interno di un unico ecosistema. Tra i modelli presentati ci sono un sistema di riconoscimento vocale che supporta decine di lingue, uno strumento per la generazione audio in grado di creare voci personalizzate e un sistema per la gestione di contenuti visivi, inclusa la generazione di immagini e video.
Tutti questi sviluppi sono già in fase di integrazione nelle piattaforme Microsoft, tra cui Foundry e l'ambiente di test Playground. La società sottolinea che l'obiettivo principale è l'applicazione pratica dell'IA nelle attività quotidiane degli utenti, e che lo sviluppo futuro si baserà sulla combinazione di tecnologie proprietarie con soluzioni di partner.