Microsoft, MAI-Voice-1 ve MAI-1-preview ile OpenAI’ye bağımlılığını azaltıyor

Danny Weber

14:07 29-08-2025

© RusPhotoBank

Microsoft, MAI-Voice-1 ve MAI-1-preview ile Copilot’u güçlendiriyor: tek GPU’da hızlı konuşma sentezi ve H100’lerle eğitilmiş metin modeli. Detaylar ve testler.

Microsoft, OpenAI’dan bağımsızlık yönünde bir adım daha atarak, şirket içinde geliştirilen iki yapay zekâ sistemini tanıttı: MAI-Voice-1 ve MAI-1-preview. Bu, şirketin dahili yapay zekâ biriminden çıkan ilk büyük iş; ilk çıkış da hayli kendinden emin görünüyor.

Gösterinin yıldızı MAI-Voice-1; tek bir GPU üzerinde çalışan ve bir dakikalık bir ses kaydını bir saniyeden kısa sürede üretebilen bir konuşma modeli. Sentetik ses, gerçek bir konuşmacıdan ayırt etmeyi zorlaştıracak kadar ikna edici. Model, Copilot Daily’de şimdiden kullanılıyor; burada bir sunucu haberleri okuyor ve karmaşık konuları podcast tadında açıklıyor. Ayrıca Copilot Labs’te de denemeye açık: kullanıcılar metin girebiliyor, sesleri değiştirebiliyor ve konuşma tarzını ayarlayabiliyor. Hızla mütevazı donanım ihtiyacının birlikteliği, özenli bir mühendislik izlenimi bırakıyor.

İkinci sistem MAI-1-preview; 15.000 Nvidia H100 GPU kullanılarak eğitilmiş bir metin modeli. Talimatları takip etmek ve ChatGPT benzeri yanıtlar üretmek üzere tasarlandı. Microsoft, OpenAI’ye bağımlılığı azaltmak için yakında Copilot’a entegre etmeyi planlıyor; model şimdiden açık platform LMArena’da test ediliyor. Bu açık denemeler, ekibin özgüvenini ve geniş geri bildirim toplamaya istekliliğini gösteriyor.