​Nvidia 发布全新 Rubin CPX GPU,助力「海量上下文」人工智能应用9 月 10 日

Nvidia 宣布全新 Vera Rubin 微架构处于研发阶段,计划 2026 年推出。其下的 Rubin CPX 变体专注处理海量上下文窗口的人工智能工作负载,适用于处理超百万个 token 的场景。Vera Rubin NDL144CPX 类 GPU 将于 2026 年底上市,具备强大 AI 性能、内存配置等。Nvidia 还计划推出千兆规模的数据中心参考设计,助力 AI 工厂建设。此前,Nvidia 公布的 MLPerf 推理测试中,黑威尔 GPU 创记录,「解耦服务」可提升硬件性能。

企业微信二维码