AI竞赛转向推理,英伟达宣布Rubin芯片平台全面投产
创始人
2026-01-06 14:10:31
0

来源:21世纪经济报道

英伟达2026年的首场重头戏比以往来得更早。

当地时间1月5日,在美国CES上,黄仁勋出乎意料地提前发布了下一代AI芯片平台“Rubin”,打破了英伟达通常在每年3月GTC大会上集中公布新一代架构的传统。

AI竞赛进入推理时代,英伟达决定加速出击。

Vera Rubin已投产

Rubin并非空降。

早在2025年3月的GTC大会上,黄仁勋就已预告了代号“Vera Rubin”的超级芯片,并明确其将于2026年量产。

此次在CES上,黄仁勋对Rubin平台进行了系统性发布,Rubin成为英伟达最新GPU的代号。

“Rubin的到来正逢其时。无论是训练还是推理,AI对计算的需求都在急剧攀升。”黄仁勋表示,“我们坚持每年推出新一代AI超级计算机,通过六颗全新芯片的极致协同设计,Rubin正在向AI的下一个前沿迈出巨大一步。”

Rubin平台采用极端协同设计理念,整合了6颗芯片,包括NVIDIA Vera CPU、Rubin GPU、NVLink 6交换芯片、ConnectX-9 SuperNIC、BlueField-4 DPU以及Spectrum-6以太网交换芯片,覆盖了从计算、网络到存储与安全的多个层级。

相比前代Blackwell架构,Rubin加速器在AI训练性能上提升3.5倍,运行性能提升5倍,并配备拥有88个核心的新款中央处理器(CPU)。

与英伟达Blackwell平台相比,Rubin平台可将推理token成本降低最高90%,并将训练混合专家(MoE)模型所需的GPU数量减少75%。

同时,Vera Rubin NVL72机柜级系统和平台同步发布,命名上非外界预计的NVL144。对此,英伟达高管在沟通会上向21世纪经济报道等记者指出,NVL72指的是72个GPU封装单元,每个封装内部包含2个Rubin Die,因此系统中实际包含144个Rubin Die,这并不意味着系统规模变化。

在生态层面,Rubin已获得头部云厂商和模型公司的集中响应。AWS、Microsoft、Google、OpenAI、Anthropic、Meta、xAI、CoreWeave等均被列入首批采用名单。

Rubin在CES的提前亮相,也引发了外界对英伟达产品发布节奏变化的关注。对此,英伟达高管回应称,目前构成Vera Rubin平台的六颗芯片已经全部到位,相关系统已在运行真实应用负载,并取得了积极结果。

此次在CES上提前披露Rubin,主要是为了尽早向生态伙伴提供工程样品,方便其为后续部署和规模化应用做准备。英伟达同时强调,Rubin仍将按照既定节奏推进,计划在今年下半年进入量产爬坡阶段,这一时间安排与此前披露的路线图保持一致。

全栈AI布局

随着AI进入推理阶段,黄仁勋展示的不只是Rubin平台。

在CES演讲中,英伟达还发布了一系列AI体系产品,包括开源模型、AI存储、物理AI等。这是英伟达的全栈AI布局,同时也是其在继续释放信号:AI重心继续从“训练规模”转向“推理系统”。

具体来看,英伟达发布了推理上下文存储平台(Inference Context Memory Storage Platform),这是一个专为推理场景设计的AI原生存储平台。该平台由BlueField-4 DPU与Spectrum-X以太网支撑,在GPU与传统存储之间引入新的存储层,用于高效管理和共享KV Cache,减少重复计算带来的算力浪费。

同时,黄仁勋特别强调了物理AI。在更长期的布局上,英伟达围绕物理AI推进,发布了一系列开源模型、开发框架和硬件平台,将AI能力从数据中心延伸至机器人、自动驾驶与工业边缘场景。

黄仁勋表示:“AI已经不再是一次性问答的聊天机器人,而是能够理解物理世界、进行长期推理、使用工具完成真实工作,并同时保有短期和长期记忆的智能协作者。”

面向机器人领域,英伟达发布了Cosmos与GR00T系列开源模型,用于机器人学习、推理与动作规划。

其中,Cosmos Reason 2是一款推理型视觉语言模型(VLM),使机器能够“看见、理解并在物理世界中行动”;GR00T N1.6 则是一款面向类人机器人的推理型视觉-语言-动作(VLA)模型,用于解锁全身控制能力。

“机器人领域的ChatGPT时刻已经到来,”黄仁勋表示,“能够理解现实世界、进行推理并规划行动的物理AI模型,正在解锁全新的应用场景。英伟达覆盖Jetson、CUDA、Omniverse 以及开源物理AI模型的完整技术栈,正在赋能全球合作伙伴,通过AI驱动的机器人重塑各个行业。”

在自动驾驶领域,英伟达发布了Alpamayo开源模型家族,定位为面向“长尾场景”的推理型自动驾驶基础模型。该体系配套发布了AlpaSim高保真仿真框架以及覆盖1700多小时驾驶数据的开源数据集,用于训练和验证基于推理的自动驾驶系统。黄仁勋表示,英伟达的首款AV车将于第一季度在美国推出,其他地区紧随其后。

从Rubin平台的提前亮相,到推理存储与物理AI的同步推进,英伟达正在将AI基础设施的竞争推向“系统工程能力”。

在这一阶段,真正拉开差距的,已不只是芯片算力本身,而是从架构、系统到生态的整体交付。

相关内容

热门资讯

长海电气取得轨道车辆用车载手动... 国家知识产权局信息显示,武汉长海电气科技开发有限公司取得一项名为“一种轨道车辆用车载手动转换开关箱”...
良信电器取得一种负荷开关及电表... 国家知识产权局信息显示,上海良信电器股份有限公司取得一项名为“一种负荷开关及电表”的专利,授权公告号...
示波器故障维修 故障 开机黑屏... 故障:开机黑屏,指示灯亮、风扇运转正常 故障现象:接通电源后按压开机键,机身电源指示灯常亮,散热风扇...
瑞昱半导体取得用于编码器中的环... 国家知识产权局信息显示,瑞昱半导体股份有限公司取得一项名为“用于编码器中的环路滤波器及相关的信号处理...
如何挑选一款合适的晶振频率测试... 在电子设备的 “心脏”—— 石英晶振的生产、研发与质量管控环节,石英晶振测试仪扮演着至关重要的角色。...
精华电子申请电位器噪音修正方法... 国家知识产权局信息显示,宁波精华电子科技股份有限公司申请一项名为“一种电位器噪音修正方法”的专利,公...
杭州行芯科技申请串扰延迟确定方... 国家知识产权局信息显示,杭州行芯科技有限公司申请一项名为“串扰延迟确定方法、装置及计算机设备”的专利...
鑫百智申请电路板穿孔装置专利,... 国家知识产权局信息显示,鑫百智(上海)新材料科技有限公司申请一项名为“一种电路板穿孔装置”的专利,公...
正浩创新取得降低逆变电路空载损... 国家知识产权局信息显示,深圳市正浩创新科技股份有限公司取得一项名为“逆变电路控制方法、逆变装置以及储...
微源半导体取得电压生成电路专利 国家知识产权局信息显示,深圳市微源半导体股份有限公司取得一项名为“电压生成电路、开关电源芯片、驱动电...