NVIDIA lancia Vera e Vera Rubin per l'intelligenza artificiale

Durante la conferenza GTC 2026, NVIDIA ha presentato il processore Vera e la piattaforma Vera Rubin. Quest'ultima integra processori centrali e grafici, hardware di rete e sistemi di archiviazione in rack modulari, pensati per l'IA basata su agenti, il reinforcement learning e l'inferenza.

Il processore Vera include 88 core specializzati NVIDIA Olympus con tecnologia Spatial Multithreading, utilizza memoria LPDDR5X e offre una larghezza di banda fino a 1,2 Tb/s. Se abbinato ai processori grafici Rubin tramite l'interfaccia NVLink-C2C, raggiunge una coerenza di banda fino a 1,8 Tb/s, superando il PCIe Gen 6.

Un nuovo rack Vera può ospitare fino a 256 processori a raffreddamento liquido, supportando oltre 22.500 ambienti di calcolo simultanei. La piattaforma comprende adattatori di rete ConnectX SuperNIC e processori grafici BlueField-4. La versione ampliata di Vera Rubin integra rack NVL72 con 72 processori grafici Rubin e 36 processori Vera, rack di archiviazione BlueField-4 STX, rack Ethernet Spectrum-6 SPX e rack LPX per l'inferenza.

Questi sistemi garantiscono alta efficienza energetica e prestazioni: per l'addestramento di modelli mixture-of-experts servono quattro volte meno processori grafici rispetto a Blackwell, mentre l'inferenza per watt aumenta di dieci volte con costi per token più bassi. La piattaforma supporta i software DSX Max-Q e DSX Flex per ottimizzare la distribuzione dell'alimentazione e migliorare le capacità di deployment.

Vera e Vera Rubin sono già sostenuti da importanti provider cloud e laboratori di IA, tra cui Amazon Web Services, Google Cloud, Microsoft Azure, Oracle Cloud Infrastructure, Alibaba, ByteDance, CoreWeave, Lambda, Nebius, OpenAI e Anthropic. I fornitori di hardware server includono Dell, HPE, Lenovo, Supermicro, ASUS, Foxconn, GIGABYTE, QCT, Wistron e Wiwynn. La produzione di Vera è iniziata, con le consegne ai partner previste per la seconda metà del 2026.