Procesorul NVIDIA Vera și platforma Vera Rubin: inovații pentru inteligența artificială

La conferința GTC 2026, NVIDIA a prezentat procesorul Vera și platforma Vera Rubin. Această platformă integrează procesoare centrale și grafice, componente de rețea și sisteme de stocare în rack-uri modulare concepute pentru inteligența artificială bazată pe agenți, învățarea prin întărire și inferență.

Procesorul Vera dispune de 88 de nuclee specializate NVIDIA Olympus cu tehnologia Spatial Multithreading, folosește memorie LPDDR5X și oferă o lățime de bandă de până la 1,2 Tb/s. Când este asociat cu procesoarele grafice Rubin prin interfața NVLink-C2C, atinge o lățime de bandă coerentă de până la 1,8 Tb/s, depășind standardul PCIe Gen 6.

Un rack Vera nou poate găzdui până la 256 de procesoare răcite cu lichid, suportând peste 22.500 de medii de calcul simultane. Platforma include adaptoare de rețea ConnectX SuperNIC și procesoare grafice BlueField-4. Versiunea extinsă Vera Rubin integrează rack-uri NVL72 cu 72 de procesoare grafice Rubin și 36 de procesoare Vera, rack-uri de stocare BlueField-4 STX, rack-uri Ethernet Spectrum-6 SPX și rack-uri LPX pentru inferență.

Aceste sisteme oferă eficiență energetică și performanță ridicate: antrenarea modelelor mixture-of-experts necesită de patru ori mai puține procesoare grafice decât Blackwell, în timp ce inferența pe watt este crescută de zece ori, cu costuri mai mici pentru token. Platforma suportă software-ul DSX Max-Q și DSX Flex pentru optimizarea distribuției de energie și îmbunătățirea capabilităților de implementare.

Vera și Vera Rubin sunt deja susținute de principalii furnizori de cloud și laboratoare de AI, inclusiv Amazon Web Services, Google Cloud, Microsoft Azure, Oracle Cloud Infrastructure, Alibaba, ByteDance, CoreWeave, Lambda, Nebius, OpenAI și Anthropic. Furnizorii de hardware pentru servere includ Dell, HPE, Lenovo, Supermicro, ASUS, Foxconn, GIGABYTE, QCT, Wistron și Wiwynn. Producția procesorului Vera a început, iar livrările către parteneri sunt programate pentru a doua jumătate a anului 2026.