Microsoft presenta MAI-Voice-1 e MAI-1-preview: voce ultra rapida e modello testuale per Copilot

Danny Weber

13:57 29-08-2025

© RusPhotoBank

Microsoft introduce MAI-Voice-1 e MAI-1-preview: voce sintetica credibile generata in meno di un secondo e modello testuale stile ChatGPT, integrati in Copilot.

Microsoft compie un altro passo verso l’autonomia da OpenAI, presentando due sistemi di intelligenza artificiale sviluppati in casa: MAI-Voice-1 e MAI-1-preview. È il primo risultato di peso dell’unità interna dedicata all’AI e l’esordio appare convincente, un segnale che l’azienda vuole camminare sempre più con le proprie gambe.

Protagonista è MAI-Voice-1, un modello vocale capace di generare un minuto di audio in meno di un secondo, funzionando su una singola GPU. La voce sintetizzata è così credibile che distinguerla da una reale è praticamente impossibile. Il modello è già all’opera in Copilot Daily, dove una voce narrante legge le notizie e propone spiegazioni in stile podcast su temi complessi. È disponibile anche per prove pratiche in Copilot Labs, permettendo di inserire testo, cambiare voce e persino regolare lo stile di parlato. L’equilibrio tra velocità e requisiti hardware contenuti lascia intuire un’ingegnerizzazione accurata.

Il secondo sistema, MAI-1-preview, è un modello testuale addestrato con 15.000 GPU Nvidia H100. È progettato per seguire istruzioni e generare risposte nello stile di ChatGPT. Microsoft intende integrarlo presto in Copilot per ridurre la dipendenza da OpenAI, e il modello è già in prova sulla piattaforma aperta LMArena. I test pubblici indicano la volontà di raccogliere un riscontro ampio e suggeriscono un team che procede con sicurezza.