当前位置:数智频道首页 > 酷玩配件 > 正文

英伟达 Rubin CPX GPU 包含 192 个重复单元,预计采用 512bit 显存位宽

9月10日,英伟达发布了面向大规模上下文推理处理和视频生成AI应用的Rubin CPX GPU。这款GPU基于"Rubin"架构构建,但与之前公布的Rubin Tensor Core GPU有所不同。

Rubin CPX GPU采用了经济高效的单片式设计,注重NVFP4数据格式计算资源,并搭载了NVENC/NVDNC视频编解码单元,配备128GB GDDR7显存。根据官方渲染图,该GPU包含192组重复单元,对应192组SM,数量与GB202相当。

在机架系统层面,从Vera Rubin NVL144到Vera Rubin NVL144 CPX,系统增加了144块Rubin CPX GPU,NVFP4算力提升了4.4 EFLOPS,显存带宽提升了0.3PB/s,快速存储增长了25TB。每颗Rubin CPX GPU大致对应约2083GB/s显存带宽。考虑到512-bit显存位宽的GeForce RTX 5090拥有1792GB/s的显存带宽以及Rubin CPX GPU的显存容量为128GB,可以估算出其显存等效速率约为32.55Gbps。

热点推送

本周关注

MORE