NVIDIA Vera processor en Vera Rubin platform voor AI

Op de GTC 2026-conferentie heeft NVIDIA de Vera-processor en het Vera Rubin-platform onthuld. Dit platform combineert centrale en grafische processoren, netwerkhardware en gegevensopslagsystemen in modulaire racks die zijn ontworpen voor agentgebaseerde AI, reinforcement learning en inferentie.

De Vera-processor beschikt over 88 gespecialiseerde NVIDIA Olympus-kernen met Spatial Multithreading-technologie, maakt gebruik van LPDDR5X-geheugen en levert een bandbreedte tot 1,2 Tb/s. In combinatie met Rubin-grafische processoren via de NVLink-C2C-interface bereikt het een coherente bandbreedte tot 1,8 Tb/s, wat PCIe Gen 6 overtreft.

Een nieuwe Vera-rack kan tot 256 vloeistofgekoelde processoren huisvesten en ondersteunt meer dan 22.500 gelijktijdige rekenomgevingen. Het platform omvat ConnectX SuperNIC-netwerkadapters en BlueField-4-grafische processoren. De uitgebreide Vera Rubin integreert NVL72-racks met 72 Rubin-grafische processoren en 36 Vera-processoren, BlueField-4 STX-opslagracks, Ethernet Spectrum-6 SPX-racks en LPX-racks voor inferentie.

Deze systemen bieden hoge energie-efficiëntie en prestaties: voor het trainen van mixture-of-experts-modellen zijn vier keer minder grafische processoren nodig dan bij Blackwell, terwijl de inferentie per watt tienvoudig wordt verhoogd met lagere tokenkosten. Het platform ondersteunt DSX Max-Q en DSX Flex-software voor het optimaliseren van stroomverdeling en het verbeteren van implementatiemogelijkheden.

Vera en Vera Rubin worden al ondersteund door grote cloudproviders en AI-labs, waaronder Amazon Web Services, Google Cloud, Microsoft Azure, Oracle Cloud Infrastructure, Alibaba, ByteDance, CoreWeave, Lambda, Nebius, OpenAI en Anthropic. Serverhardwareleveranciers zijn Dell, HPE, Lenovo, Supermicro, ASUS, Foxconn, GIGABYTE, QCT, Wistron en Wiwynn. De productie van Vera is begonnen, met leveringen aan partners gepland voor de tweede helft van 2026.