导语:英伟达打破惯例,提前发布了下一代AI服务器系统Vera Rubin。
当地时间2026年1月6日,在美国拉斯维加斯举办的国际消费电子展(CES)上,英伟达(Nvidia)首席执行官黄仁勋发布了两项重要信息:
一方面,英伟达打破惯例,提前发布了下一代AI服务器系统Vera Rubin,意在通过更强大的算力支持“物理AI”与模拟环境训练,应对日益加剧的全球算力竞赛。另一方面,黄仁勋在媒体沟通会上明确证实,针对中国市场的H200芯片已恢复量产,并在就出口许可细节与美国政府进行最后沟通,意图在国产芯片迅速崛起的背景下重返中国市场。
Rubin架构提前问世:算力竞赛加速与“物理AI”的崛起
按照过往惯例,英伟达通常会在春季举行的GTC开发者大会上披露最新芯片架构。然而,黄仁勋此次选择在年初的CES上直接发布Vera Rubin GPU及Vera CPU,这一反常的时间表调整直接反映了半导体行业发展节奏的骤然加快。
新发布的Vera Rubin服务器系统以美国天文学家维拉・鲁宾(Vera Rubin)命名,计划于2026年下半年正式上市。黄仁勋在发布会上强调,人工智能所需的计算复杂性以及模型训练对先进处理器的需求正在呈指数级增长。
根据现场披露的数据,Rubin GPU旨在处理高达10万亿个数据参数的模型训练任务。在性能对比上,Rubin展现了显著的代际优势:
训练效率方面、 开发者使用Rubin GPU训练庞大模型,仅需上一代Blackwell架构四分之一的芯片数量,即可在一个月内完成训练;推理成本上: 在推理环节,Rubin系统的成本降至Blackwell架构的十分之一。
此外,该系统集成了连接和内存存储产品,这种全栈式的硬件整合意在进一步提升计算吞吐能力。Futurum Group首席执行官丹尼尔・纽曼(Daniel Newman)将Vera Rubin评价为“一次不可思议的代际飞跃”,并认为此时发布信号表明英伟达的产能爬坡正在按计划推进。
H200重返中国:合规博弈与市场争夺
同时,英伟达在中国市场的布局经历了长达数月的动荡后迎来转机。黄仁勋在CES媒体沟通会上确认,英伟达已重启生产线,H200芯片正在量产,且中国客户需求“非常旺盛”。
此前,英伟达AI芯片在中国市场经历了超过8个月的“断供”期。基于上一代Hopper架构的特供版H20芯片曾是国内企业能获得的最先进产品。然而,自2025年4月起,特朗普政府收紧了出口管制,要求H20出口需获许可。
随后的中美经贸谈判为局势带来了变化。2025年8月,美国政府放宽态度,允许英伟达通过上交15%的对华销售收入来换取H20出口许可。目前,针对性能更强的H200芯片,黄仁勋表示仍在就出口许可的最后细节与美国政府沟通,之后将正式面向中国客户销售。他用“当订单发生了其他都不言自明”来暗示对恢复供应的信心。
值得注意的是,地缘政治风险依然存在。2025年7月,美国参众两院提出《芯片安全法案》,要求对先进AI芯片出口进行位置认证。同时,中国国家网信办也就H20芯片的安全风险约谈了英伟达。尽管英伟达方面反复强调其芯片不存在“后门”或监控软件,但包括运营商在内的中国主要需求方此前并未扩大采购。
此次计划进入中国的H200是基于H100升级而来,核心改进在于采用了新一代HBM3e(高带宽内存)。显存带宽和内存容量的提升对于AI大模型训练至关重要,这使得H200在绝对性能上不仅超越了H100,更大幅领先于此前的特供版H20。
对于中国互联网云厂商而言,H200具有极强的商业吸引力。国内云厂商人士透露,目前国产芯片在算力上仅能达到H20同级水平。由于现有的绝大多数大模型均基于英伟达GPU架构设计并利用其软件生态开发,使用英伟达芯片进行训练无需进行额外的模型适配,训练效果更佳。
竞争格局:国产芯片的崛起与云厂商的“双轨策略”
在英伟达缺位的8个月里,中国国产AI芯片获得了空前的市场空间和资本关注,市场格局已发生实质性变化。
国产芯片领军企业寒武纪交出了亮眼业绩。数据显示,其上半年营收增长超过43倍至28.81亿元,实现首次盈利,扣非净利润达9.13亿元。资本市场对此反应热烈,一年内其股价涨幅超过500%。
同期,多家国产AI芯片公司加速了上市进程。摩尔线程、沐曦股份已于2025年底登陆科创板,壁仞科技、天数智芯则在2026年初相继在港交所上市。燧原科技和昆仑芯也在积极推进上市计划。这一波上市潮为国产芯片厂商提供了充足的资金支持,以加速技术迭代。
另外,面对英伟达的回归与国产芯片的崛起,国内需求端呈现出明显的分层策略:一方面,政府主导市场(智算中心/信创): 已基本完成对英伟达芯片的取代,国产化率高;另一方面,商业化市场(互联网云厂商): 采取务实的“双轨策略”。
云厂商人士指出,国产AI芯片目前已可用于部分大模型推理任务,但在训练任务上,国内整体仍处于缺算力阶段。因此,企业的策略倾向于“边训练边追赶”――一方面争取购买性能最优的英伟达H200以保证模型竞争力,另一方面也采购国产芯片以构建供应链安全备份。