ADATA dévoile AI Scaler, une solution mémoire étendue pour l'IA sur site

ADATA TRUSTA AI Scaler : solution mémoire pour IA économique
© RusPhotoBank

ADATA, via sa division TRUSTA, dévoile une nouvelle solution d'infrastructure pour l'intelligence artificielle baptisée AI Scaler Extended Memory Solution. Cette technologie s'attaque à l'un des plus grands défis des systèmes d'IA modernes : la mémoire vidéo limitée des accélérateurs graphiques.

Exécuter de grands modèles de langage nécessite aujourd'hui des GPU coûteux avec une mémoire VRAM massive, ce qui rend le déploiement de l'IA en entreprise prohibitif. TRUSTA adopte une approche différente en exploitant non seulement la mémoire du GPU, mais aussi la RAM système et des SSD rapides pour stocker et traiter les données des modèles.

Au cœur de la plateforme se trouve l'AI Scaler Toolkit, un ensemble logiciel et matériel open source qui équilibre les charges de travail entre GPU, DRAM et SSD. Cela permet aux modèles d'IA de fonctionner de manière plus flexible et à moindre coût. Selon l'entreprise, dans certains scénarios, cela réduit les dépenses de déploiement de l'IA de plus de 50 %.

ADATA affirme que la technologie peut exécuter des tâches qui nécessitaient auparavant plusieurs processeurs graphiques sur un seul GPU, soutenu par une mémoire système étendue. C'est particulièrement important pour les entreprises qui souhaitent mettre en place des systèmes d'IA locaux sans construire de coûteux clusters de serveurs.

La plateforme prend en charge des modèles populaires tels que Llama, Qwen, Mixtral, Mistral, DeepSeek, Gemma et Phi, et est compatible avec les systèmes d'IA agentiques comme OpenClaw et Hermes Agentic. Les développeurs insistent sur le fait que la solution n'est liée à aucun matériel spécifique et peut s'adapter à diverses configurations de serveurs.

Parallèlement, TRUSTA a également présenté le SSD d'entreprise TD7P51 ECO PCIe Gen5, disponible en capacités allant jusqu'à 15,36 To. Ce disque prend en charge plusieurs facteurs de forme et utilise des technologies de placement intelligent des données pour améliorer la fiabilité sous les charges de travail liées à l'IA.

L'entreprise estime que de telles solutions contribueront à accélérer le passage des services d'IA basés sur le cloud aux systèmes sur site, où le contrôle des données, la sécurité et les économies de coûts sont des priorités clés.