NVIDIA Vera-processorn och Vera Rubin-plattformen för AI

På GTC 2026-konferensen presenterade NVIDIA Vera-processorn och Vera Rubin-plattformen. Denna plattform kombinerar centrala och grafiska processorer, nätverkshårdvara och datalagringssystem i modulära rack som är designade för agentbaserad AI, förstärkningsinlärning och inferens.

Vera-processorn har 88 specialiserade NVIDIA Olympus-kärnor med Spatial Multithreading-teknik, använder LPDDR5X-minne och levererar en bandbredd på upp till 1,2 Tb/s. När den kopplas samman med Rubin-grafikprocessorerna via NVLink-C2C-gränssnittet uppnår den en koherent bandbredd på upp till 1,8 Tb/s – vilket överträffar PCIe Gen 6.

Ett nytt Vera-rack kan rymma upp till 256 vätskekylda processorer och stöder över 22 500 samtidiga beräkningsmiljöer. Plattformen inkluderar ConnectX SuperNIC-nätverksadapter och BlueField-4-grafikprocessorer. Den utökade Vera Rubin integrerar NVL72-rack med 72 Rubin-grafikprocessorer och 36 Vera-processorer, BlueField-4 STX-lagringsrack, Ethernet Spectrum-6 SPX-rack och LPX-rack för inferens.

Dessa system erbjuder hög energieffektivitet och prestanda: träning av mixture-of-experts-modeller kräver fyra gånger färre grafikprocessorer än Blackwell, medan inferens per watt ökar tiofaldigt med lägre tokankostnader. Plattformen stöder DSX Max-Q och DSX Flex-programvara för att optimera strömfördelning och förbättra distributionsmöjligheter.

Vera och Vera Rubin har redan stöd från stora molnleverantörer och AI-labb, inklusive Amazon Web Services, Google Cloud, Microsoft Azure, Oracle Cloud Infrastructure, Alibaba, ByteDance, CoreWeave, Lambda, Nebius, OpenAI och Anthropic. Serverhårdvaruleverantörer inkluderar Dell, HPE, Lenovo, Supermicro, ASUS, Foxconn, GIGABYTE, QCT, Wistron och Wiwynn. Produktionen av Vera har påbörjats, och leveranser till partners är planerade för andra halvåret 2026.