NVIDIA stellt Vera-Prozessor und Vera-Rubin-Plattform vor

Auf der GTC 2026 stellte NVIDIA den Vera-Prozessor und die Vera-Rubin-Plattform vor. Diese Plattform vereint zentrale und Grafikprozessoren, Netzwerkhardware sowie Datenspeichersysteme in modularen Racks, die für agentenbasierte KI, Reinforcement Learning und Inferenz konzipiert sind.

Der Vera-Prozessor verfügt über 88 spezialisierte NVIDIA-Olympus-Kerne mit Spatial-Multithreading-Technologie, nutzt LPDDR5X-Speicher und erreicht eine Bandbreite von bis zu 1,2 Tb/s. In Kombination mit Rubin-Grafikprozessoren über die NVLink-C2C-Schnittstelle erzielt er eine kohärente Bandbreite von bis zu 1,8 Tb/s – das übertrifft PCIe Gen 6.

Ein neuer Vera-Rack kann bis zu 256 flüssigkeitsgekühlte Prozessoren aufnehmen und unterstützt über 22.500 gleichzeitige Rechenumgebungen. Die Plattform umfasst ConnectX-SuperNIC-Netzwerkadapter und BlueField-4-Grafikprozessoren. Die erweiterte Vera-Rubin-Architektur integriert NVL72-Racks mit 72 Rubin-Grafikprozessoren und 36 Vera-Prozessoren, BlueField-4-STX-Speicherracks, Ethernet-Spectrum-6-SPX-Racks sowie LPX-Racks für Inferenz.

Diese Systeme bieten hohe Energieeffizienz und Leistung: Für das Training von Mixture-of-Experts-Modellen werden viermal weniger Grafikprozessoren benötigt als bei Blackwell, während die Inferenz pro Watt verzehnfacht wird – bei geringeren Token-Kosten. Die Plattform unterstützt DSX-Max-Q- und DSX-Flex-Software zur Optimierung der Stromverteilung und Verbesserung der Bereitstellungsfähigkeiten.

Vera und Vera Rubin werden bereits von großen Cloud-Anbietern und KI-Laboren unterstützt, darunter Amazon Web Services, Google Cloud, Microsoft Azure, Oracle Cloud Infrastructure, Alibaba, ByteDance, CoreWeave, Lambda, Nebius, OpenAI und Anthropic. Zu den Server-Hardware-Lieferanten zählen Dell, HPE, Lenovo, Supermicro, ASUS, Foxconn, GIGABYTE, QCT, Wistron und Wiwynn. Die Produktion von Vera hat begonnen, die Auslieferung an Partner ist für die zweite Hälfte des Jahres 2026 geplant.