NVIDIA Vera-prosessor og Vera Rubin-plattform for kunstig intelligens

På GTC 2026-konferansen presenterte NVIDIA Vera-prosessoren og Vera Rubin-plattformen. Plattformen kombinerer sentrale og grafikkprosessorer, nettverksmaskinvare og lagringssystemer i modulære rack som er designet for agentbasert kunstig intelligens, forsterkningslæring og inferens.

Vera-prosessoren har 88 spesialiserte NVIDIA Olympus-kjerner med Spatial Multithreading-teknologi, bruker LPDDR5X-minne og leverer en båndbredde på opptil 1,2 Tb/s. Når den kobles sammen med Rubin-grafikkprosessorer via NVLink-C2C-grensesnittet, oppnår den en koherent båndbredde på opptil 1,8 Tb/s, noe som overgår PCIe Gen 6.

Et nytt Vera-rack kan romme opptil 256 væskekjølte prosessorer og støtter over 22 500 samtidige beregningsmiljøer. Plattformen inkluderer ConnectX SuperNIC-nettverkskort og BlueField-4-grafikkprosessorer. Den utvidede Vera Rubin-integrerer NVL72-rack med 72 Rubin-grafikkprosessorer og 36 Vera-prosessorer, BlueField-4 STX-lagringsrack, Ethernet Spectrum-6 SPX-rack og LPX-rack for inferens.

Disse systemene tilbyr høy energieffektivitet og ytelse: trening av mixture-of-experts-modeller krever fire ganger færre grafikkprosessorer enn Blackwell, mens inferens per watt økes tifold med lavere token-kostnader. Plattformen støtter DSX Max-Q og DSX Flex-programvare for å optimalisere strømdistribusjon og forbedre utrullingsmuligheter.

Vera og Vera Rubin støttes allerede av store skyleverandører og AI-laboratorier, inkludert Amazon Web Services, Google Cloud, Microsoft Azure, Oracle Cloud Infrastructure, Alibaba, ByteDance, CoreWeave, Lambda, Nebius, OpenAI og Anthropic. Servermaskinvareleverandører inkluderer Dell, HPE, Lenovo, Supermicro, ASUS, Foxconn, GIGABYTE, QCT, Wistron og Wiwynn. Produksjonen av Vera har startet, og leveranser til partnere er planlagt til andre halvdel av 2026.