Дарья Каширина
Microsoft начала внедрение собственного ИИ-ускорителя Maia 200.
Microsoft начала развёртывание первых партий собственного ускорителя искусственного интеллекта Maia 200 в дата-центрах Azure. При этом компания подчёркивает, что появление собственного чипа не означает отказа от решений Nvidia и AMD. В условиях глобального дефицита вычислительных ресурсов Microsoft делает ставку на гибридную стратегию, совмещая внутренние разработки и стороннее «железо».
Генеральный директор Microsoft Сатья Наделла отметил, что партнёрства с Nvidia и AMD остаются важными: обе компании продолжают активно развивать продукты, и Microsoft не собирается замыкаться только на вертикальной интеграции
Как пишет boda.su, Maia 200 ориентирован прежде всего на инференс — запуск и обслуживание уже обученных моделей. Чип создан с прицелом на снижение стоимости генерации токенов и оптимизацию работы ИИ-сервисов в реальных продуктах. Он производится по 3-нм техпроцессу TSMC, поддерживает вычисления FP8 и FP4 и оснащён 216 Гб памяти HBM3e с высокой пропускной способностью.
Microsoft утверждает, что по ряду показателей Maia 200 превосходит специализированные ускорители конкурентов. В частности, заявлено преимущество в FP4-вычислениях по сравнению с Amazon Trainium третьего поколения и более высокая FP8-производительность относительно TPU седьмого поколения от Google.
На первом этапе Maia 200 уже используется в регионе Azure US Central, а следующим станет кластер в западной части США. В дальнейшем география размещения будет расширяться. Ускоритель планируется задействовать для работы моделей OpenAI в Azure, а также в сервисах Microsoft 365 Copilot и платформе Microsoft Foundry.
Приоритетный доступ к новым чипам получит внутренняя команда Superintelligence, занимающаяся разработкой перспективных ИИ-моделей. Руководитель направления Мустафа Сулейман сообщил, что Maia 200 будет использоваться в том числе для генерации синтетических данных и задач reinforcement learning.
Несмотря на запуск собственного ускорителя, Microsoft продолжает активно закупать GPU у Nvidia и AMD. Причина — устойчивый дефицит передового ИИ-железа и стремительный рост спроса на вычисления. Это отражается и в капитальных расходах компании, значительная часть которых направлена на развитие ИИ-инфраструктуры.
Параллельно Microsoft запускает превью Maia SDK. В него входят поддержка PyTorch, компилятор Triton, оптимизированные библиотеки и инструменты низкоуровневого программирования. Компания делает ставку на то, что собственный чип будет востребован только при наличии полноценной и удобной экосистемы для разработчиков.