整台服务器一共72个节点,也就是144颗GPU、72颗CPU、20TB HBM3e、40TB DDR5内存,比上代增加50%,CX8互连带宽14.4TB/s,增加100%。
整机的Dense FP4推理性高达1.1EFlops(每秒110亿亿次),FP8训练性能高达0.36EFlps(36亿亿次),还有新的注意力指令。2026年下半年,我们将迎来全新的Rubin架构,首发服务器产品为“Vera Rubin NVL144”,每个节点两颗Rubin GPU搭配一颗全新的Vera CPU。
其中,Rubin GPU搭配288GB容量的下一代HBM4内存,FP4浮点性能跃升到50PFlops(每秒5亿亿次)。
Vera CPU则包含88个自研Arm架构核心,首次支持多线程而达到176线程,彼此之间通过1.8TB/s带宽的NVLink-C2C总线连接在一起。
整台服务器一共144个节点,也就是288颗GPU、144颗CPU、41.5TB HBM4内存(带宽13TB/s),还有75TB的系统内存,NVLink6带宽达260TB/s,CX9总线带宽达28.8TB/s。
FP4推理性能来到3.6EFlops(每秒360亿亿次),FP8训练性能则是1.2EFlops(每秒120亿亿次)。