英伟达2026年的首场重头戏比以往来得更早。
当地时间1月5日,在美国ces上,黄仁勋出乎意料地提前发布了下一代ai芯片平台“rubin”,打破了英伟达通常在每年3月gtc大会上集中公布新一代架构的传统。
ai竞赛进入推理时代,英伟达决定加速出击。
rubin并非空降。
早在2025年3月的gtc大会上,黄仁勋就已预告了代号“vera rubin”的超级芯片,并明确其将于2026年量产。
此次在ces上,黄仁勋对rubin平台进行了系统性发布,rubin成为英伟达最新gpu的代号。
“rubin的到来正逢其时。无论是训练还是推理,ai对计算的需求都在急剧攀升。”黄仁勋表示,“我们坚持每年推出新一代ai超级计算机,通过六颗全新芯片的极致协同设计,rubin正在向ai的下一个前沿迈出巨大一步。”
rubin平台采用极端协同设计理念,整合了6颗芯片,包括nvidia vera cpu、rubin gpu、nvlink 6交换芯片、connectx-9 supernic、bluefield-4 dpu以及spectrum-6以太网交换芯片,覆盖了从计算、网络到存储与安全的多个层级。
相比前代blackwell架构,rubin加速器在ai训练性能上提升3.5倍,运行性能提升5倍,并配备拥有88个核心的新款中央处理器(cpu)。
相比英伟达blackwell平台,rubin平台实现推理token成本最高可降低10倍,训练moe(专家混合)模型所需gpu数量减少4倍。
同时,vera rubin nvl72机柜级系统和平台同步发布,命名上非外界预计的nvl144。对此,英伟达高管在沟通会上向21世纪经济报道等记者指出,nvl72指的是72个gpu封装单元,每个封装内部包含2个rubin die,因此系统中实际包含144个rubin die,这并不意味着系统规模变化。
在生态层面,rubin已获得头部云厂商和模型公司的集中响应。aws、microsoft、google、openai、anthropic、meta、xai、coreweave等均被列入首批采用名单。
rubin在ces的提前亮相,也引发了外界对英伟达产品发布节奏变化的关注。对此,英伟达高管回应称,目前构成vera rubin平台的六颗芯片已经全部到位,相关系统已在运行真实应用负载,并取得了积极结果。
此次在ces上提前披露rubin,主要是为了尽早向生态伙伴提供工程样品,方便其为后续部署和规模化应用做准备。英伟达同时强调,rubin仍将按照既定节奏推进,计划在今年下半年进入量产爬坡阶段,这一时间安排与此前披露的路线图保持一致。
随着ai进入推理阶段,黄仁勋展示的不只是rubin平台。