
皮夹克与一万亿
2026年3月16日,下午两点,加州圣何塞。
SAP Center——平时用来打冰球的体育馆——此刻涌入了超过两万名开发者、投资人、记者和各路科技信徒。空气中弥漫着一种混合了咖啡因与焦虑的味道:人们等待的不是冰球,而是一件黑色皮夹克。
黄仁勋踩着他标志性的步伐走上舞台。没有客套话,没有暖场视频。他开口的第一句话就像投下一颗炸弹:
“到2027年,Blackwell和Vera Rubin两代芯片的订单总额将达到一万亿美元。”
一万亿。Trillion。场内沉默了两秒——然后掌声爆发。
要知道,就在一年前的GTC 2025上,他给出的数字还是”五千亿”。短短十二个月,预期翻了一倍。整个英伟达的市值已经超过四万亿美元,坐稳全球最贵公司的宝座。而黄仁勋站在台上的样子,依然像一个在后院烧烤的邻居大叔——只不过这位大叔正在烧烤的,是整个计算世界的旧秩序。
推理拐点:AI的第二幕
如果说GTC 2025的主题是”AI训练的黄金时代”,那么GTC 2026的核心命题只有一个:推理时代来了。
黄仁勋用了一组惊人的数字来解释这个转折点:过去两年,大模型从”感知”和”生成”进化到了”推理”与”行动”。这一跃迁带来的计算需求增长不是两倍、十倍,而是一万倍。
为什么?因为训练一个模型,你只需要做一次——虽然这”一次”可能耗费数亿美元和数千张GPU。但推理不同。每一次用户查询、每一次智能体决策、每一次自动驾驶系统判断路况,都是一次推理计算。训练是一锤子买卖,推理是永动机。
“过去的数据中心是用来存储数据的,”黄仁勋说,声音平静得像在念一份菜单,”未来的数据中心是用来生产Token的。它们不是数据仓库,是Token工厂。”
这句话值得反复咀嚼。它意味着整个云计算产业的底层逻辑正在被改写:从”存储-检索”范式,切换到”生产-消费”范式。你不再是去数据库里查东西,而是让AI工厂为你现场”生产”答案、决策和行动方案。
黄仁勋甚至给出了一个新时代CEO的公式:
收入 = 每瓦Token吞吐量 × 可用千兆瓦数
翻译成人话就是:谁的AI工厂能用最少的电生产最多的Token,谁就赢了。在这个公式里,GPU不再是”高性能芯片”,而是Token印钞机。英伟达不再是”卖铲子的”,而是全世界最大的Token印钞机制造商。
七颗芯片与一个太空梦
如果说”Token工厂”是演讲的灵魂,那么硬件发布就是它的骨骼。黄仁勋在两个半小时里甩出了七颗芯片、五套机架级系统,信息密度之大,让台下的记者们手指在键盘上跑得像弹钢琴。
Vera Rubin:以天文学家之名
最重磅的当属Vera Rubin平台——以发现暗物质存在证据的美国天文学家Vera Rubin命名。这不是一颗芯片,而是一个全栈计算平台:新的GPU、新的CPU(名为Vera)、新的网络、新的软件栈,一整套从底层到顶层的重新设计。
数字说话:相比上一代Blackwell,Vera Rubin的推理算力提升了5倍,训练同等规模的MoE(混合专家)模型所需GPU数量减少四分之三,每Token推理成本降至十分之一。每瓦性能是Grace Blackwell的10倍。
这意味着什么?意味着同样一笔电费,Vera Rubin能生产10倍的Token。在黄仁勋的Token工厂经济学里,这就是核武器级别的效率优势。
Groq LPU:收购来的秘密武器
真正让行业震动的意外,是Groq的登场。
2025年12月,英伟达以200亿美元完成了对Groq核心IP的许可收购,将创始人Jonathan Ross和核心团队纳入麾下。GTC 2026上,黄仁勋首次展示了Groq 3 LPU——一种专为推理设计的语言处理单元。
LPU的设计哲学与GPU截然不同。GPU像一支庞大的军队,擅长并行处理海量数据;LPU更像一支精锐特种部队,用大量片上SRAM替代了外部存储访问,让每一步计算的延迟都可预测、可优化。黄仁勋将Groq LPU定位为”Token加速器”——GPU负责prefill(预填充)和注意力机制的重计算,LPU负责解码阶段的高速Token生成。两者组合的关键创新叫做AFD(注意力与前馈网络解耦)。
效果呢?在英伟达给出的基准测试中,Vera Rubin + Groq LPU组合拳将特定工作负载的吞吐量提升了35倍,解锁了每秒1000个Token以上的生成速度。
这就像让一台柴油发动机和一台涡轮增压器合体——单独用都很强,合在一起是另一个物种。
Feynman:来自未来的信号
黄仁勋还提前曝光了再下一代架构的名字:Feynman——以物理学传奇费曼命名。
Feynman将采用台积电1.6纳米制程,引入3D堆叠GPU die(英伟达首次)、定制HBM内存,以及全新的CPU架构Rosa(以DNA结构发现者Rosalind Franklin命名)。预计2028年推出。
最疯狂的一笔是太空。黄仁勋宣布英伟达将研发NVIDIA Space-1 Vera Rubin模块——将AI数据中心送入轨道。相比地面部署的H100 GPU,太空版Rubin模块的AI推理算力将提升25倍。
把Token工厂搬到太空。这句话如果出自任何其他人之口,大概会被当作科幻小说。但出自一个刚宣布”一万亿美元订单”的人——你至少得认真想想。
龙虾登上大雅之堂
如果说硬件是骨骼,软件就是灵魂。而GTC 2026上最有灵魂的软件,是一只龙虾。
OpenClaw——这个由奥地利退休程序员Peter Steinberger在失眠之夜写出的开源AI智能体框架——在短短几个月内成为GitHub历史上星标最高的开源项目,截至GTC前夕已突破28.5万颗星。黄仁勋在舞台上给出了一个惊人的评价:
“OpenClaw仅用几周时间就超越了Linux在过去30年取得的成就。它绝对是下一个ChatGPT。“
他将OpenClaw的重要性与开启了开源操作系统时代的Linux相提并论——称它为“AI智能体时代的操作系统”。用户只需编写一行代码就能创建专属智能体,让它替你操作电脑、浏览网页、管理文件、执行复杂任务。
但黄仁勋不只是在为别人的作品站台。他带来了英伟达的应对方案:NemoClaw——OpenClaw的企业级版本。NemoClaw在OpenClaw的基础上叠加了英伟达的软件栈:沙箱执行环境、最小权限访问控制、隐私路由器。简单说,OpenClaw是一只自由奔放的龙虾,NemoClaw是穿了防弹衣的龙虾。
合作伙伴名单读起来像一份科技业名人录:Adobe、Salesforce、SAP、ServiceNow、西门子、思科、Google……几乎所有你能想到的企业软件巨头,都在排队给龙虾穿衣服。
SaaS已死,AaaS万岁
这引出了黄仁勋在GTC 2026上最具哲学冲击力的论断:
“所有的SaaS公司都将变成AaaS公司——Agent as a Service。”
翻译一下:过去你买的是软件工具(我给你一把锤子,你自己钉钉子),未来你买的是结果(你告诉我要钉什么,我的智能体替你钉好)。传统SaaS卖的是”能力的访问权”,AaaS卖的是”任务的完成率”。
黄仁勋进一步预测:未来每个工程师的年度预算里,除了工资,还会有一笔”年度Token配额”。 Token将像水电煤一样,成为企业运营的基础消耗品。
这个判断如果成真,意味着什么?意味着今天的SaaS定价模型——按席位收费、按功能分级——将被彻底颠覆。未来的定价单位不是”人”,而是”Token”。
有媒体据此推算:如果80%的现有应用被智能体替代(黄仁勋原话),全球SaaS市场将经历一场比移动互联网更剧烈的洗牌。36氪的分析师直接将GTC 2026的主题总结为八个字:“告别卖卡,拥抱卖Token。”
雪宝来了
如果前面的内容让你觉得这场演讲过于硬核、过于数字、过于宏大叙事——别担心,黄仁勋早就准备好了他的”甜点时刻”。
演讲最后十五分钟,舞台灯光突然变暗。一个摇摇晃晃的白色身影从侧幕走了出来——没错,是雪宝。迪士尼《冰雪奇缘》里那个热爱温暖拥抱的雪人。
但这不是一个人穿着布偶服。这是一个真正的物理AI机器人。
雪宝的每一个动作——走路、转身、歪头、做出夸张的表情——都是在英伟达的Omniverse虚拟世界中学会的。迪士尼使用Newton物理引擎和GPU加速模拟器Kamino,在数字世界中训练雪宝的运动策略:如何保持平衡、如何管理自身”热量”(毕竟,雪人怕热)、如何在碰撞时降低噪音。
黄仁勋弯下腰,像跟一个孩子说话一样问它:”你是在Omniverse里学会走路的,对吧?”
雪宝歪着头,用那个标志性的傻乎乎的声音回答。全场笑了。
但笑声背后是一个严肃的信号:英伟达的物理AI栈——从Cosmos世界模型到Isaac GR00T机器人基础模型到Newton物理引擎——已经能让虚拟角色”跨越次元壁”走进现实世界。迪士尼宣布,雪宝将于3月29日在巴黎迪士尼乐园正式登场。
这不是一场tech demo。这是物理AI的商业化首秀。
黄仁勋顺势宣布了一系列物理AI合作伙伴:ABB、Universal Robots、KUKA等工业机器人巨头,以及自动驾驶领域的比亚迪、现代、日产、吉利和Uber。他用了一句话概括:”自动驾驶的ChatGPT时刻已经到来。“
华尔街的冷眼
然而,就在黄仁勋挥斥方遒的两个半小时里,英伟达的股票——跌了。
没错,跌了。演讲期间股价一度上涨4.8%,触及188.88美元,但最终收盘仅涨1.65%。第二天继续回落。TechCrunch用了一个意味深长的标题:《为什么华尔街不买英伟达大会的账?》
怀疑论者的逻辑并不复杂:
第一,估值太贵了。 英伟达的市盈率高达38倍,比行业中位数高出69%;市现金流倍数43倍,比行业中位数高出147%。不管黄仁勋画的饼有多大,这个估值已经price in了太多乐观预期。
第二,路线图太远了。 Vera Rubin在2026年下半年,Feynman在2028年,太空数据中心更是天知道什么时候。投资者们想看到的是现在的收入,不是三年后的承诺。
第三,泡沫的幽灵挥之不去。 一些分析师注意到,英伟达开始采用类似”供应商融资”的策略来推动客户采购——这让人想起了世纪之交Lucent的故事。那家公司当年也是靠给客户贷款来维持增长,最后的结局人人皆知。
第四,ROI的灵魂拷问。 建设AI基础设施的人依然看好,但掏钱买单的人开始犹豫了。”我花了几十亿买了这些GPU,回报在哪里?”——这个问题在越来越多的CEO会议上被问到。
华尔街的态度可以用一句话概括:我们相信你的技术,但我们不确定市场能消化你的野心。
“你们缺的不是AI,是想象力”
但黄仁勋显然不在乎股票一天的涨跌。
GTC结束后的第二天清晨,他走进圣何塞一间挤满媒体的新闻发布厅,花了将近两个小时回答各种问题——从芯片架构到中国市场,从AI末日论到公司本质。
最抓人的一刻出现在他与CNBC名嘴Jim Cramer的对话中。Cramer问了一个尖锐的问题:科技巨头们一边大量采购英伟达芯片,一边却在以AI为由裁员。这合理吗?
黄仁勋的回答被媒体广泛引用:
“因为他们缺乏想象力。 对于有想象力的公司,你会做得更多,雇更多的人。如果一个公司的领导层就是没有想法,他们除了削减就想不出别的招,当他们手里有了更强大的工具,他们反而不知道该怎么用——那不是AI的问题,那是管理者的问题。”
这番话的潜台词很辣:AI应该是一个扩张的杠杆,而不是一个收缩的借口。如果你拿到了人类历史上最强大的计算工具,你的第一反应却是裁人省钱——那你配不上这个时代。
Cramer——长期以来英伟达最高调的看多者——听完后更加看好。但黄仁勋的批评对象恰恰是他最大的客户们,这种”咬给你喂饭的手”的勇气(或者说任性),也引发了行业内的广泛讨论。
在与Stratechery的Ben Thompson的深度访谈中,黄仁勋进一步阐述了他的愿景:AI将使用所有人类已经创造出的工具——Excel、Photoshop、设计软件——只不过是以超加速的方式。目标是让全世界的软件都被加速,让AI智能体能够像人一样操作这些工具。他还对”AI末日论者”表达了不加掩饰的不满,认为他们在华盛顿的游说正在阻碍技术进步。
冷静的旁观者怎么说?
让我们暂停一下黄仁勋的叙事,听听那些没有穿皮夹克的人怎么看。
Bain & Company在GTC后发布的分析报告中指出:英伟达正在从一家芯片公司转型为”AI操作层的提供者”——这意味着它的增长逻辑已经从”卖硬件”变成了”卖平台”。好消息是平台的利润率更高、粘性更强;坏消息是平台的竞争对手也更多、反垄断风险也更大。
知乎上的技术分析者注意到了一个微妙的信号:黄仁勋在整场演讲中反复强调”美国再工业化”——英伟达在美国本土的投资、与美国企业的合作、在美国建设AI工厂。有人评论说,这场演讲同时是产品发布会和华盛顿政策简报。在AI芯片出口管制的大背景下,黄仁勋正在把英伟达打造成”美国AI战略的基础设施提供商”——这个定位,比任何芯片都值钱。
B站UP主们的解读更直接:有人将GTC 2026总结为”老黄甩出七颗芯片和一个太空梦”;也有人问了一个更尖锐的问题——”芯片不稀缺了,但为什么还是只能买英伟达?”答案指向了CUDA生态的深度锁定:不是硬件不可替代,是围绕硬件的软件生态不可替代。NemoClaw、Dynamo、Nemotron、Cosmos——每一层软件都是一道护城河。
Fortune杂志在一篇题为《从机器人到AI智能体,黄仁勋的GTC主题演讲充满了创业公司不能忽视的信号》的分析中指出:GTC 2026对创业者最大的启示不是具体的产品,而是一个范式转移——从”构建应用”到”编排智能体”。未来的创业者不需要从零开始写代码,而是需要学会如何让AI智能体协作完成任务。
Token之王的底层焦虑
把所有的产品发布、战略宣言和媒体评论放在一起,一个更深层的问题浮出水面:
黄仁勋真正在推销的是什么?
表面上,他在推销芯片、推销平台、推销AI工厂。但如果你仔细听,他真正在推销的是一个信念——AI的需求不会停。永远不会。Token的消费量将无限增长,就像人类对电力的消费从未停止增长一样。
这个信念是英伟达四万亿美元市值的地基。如果这个信念是对的,那么一万亿美元的订单只是起点;如果这个信念有误——哪怕只是增长速度慢于预期——地基上的一切都会晃动。
华尔街的分析师们已经在问那个关键问题:当基础设施建设的高潮过去,当所有该买芯片的公司都买了芯片,接下来呢?
黄仁勋的回答是:不会有”接下来”,因为推理需求是永续的。但这恰恰是一个信念,而非事实——至少目前还不是。
最后一幕
GTC 2026的尾声有一个值得记住的细节。
在长达两个半小时的马拉松演讲结束后,黄仁勋没有像惯例那样总结要点或喊口号。他最后停留的画面,是和雪宝并肩站在舞台上。一个穿皮夹克的62岁男人,和一个从虚拟世界走进现实的雪人。
一个制造芯片的公司,和一个学会了走路的卡通角色。
某种意义上,这就是GTC 2026想要传达的全部信息:AI不再只是屏幕上的文字和图片。它正在学会走路,学会触摸现实世界,学会用龙虾的钳子替你操作电脑。 从数字到物理,从推理到行动,从Token到现实——这条路径上的每一步,都需要更多的算力。
而黄仁勋站在那里,微笑着,像一个知道答案的人。
问题是:他真的知道答案,还是他只是比所有人都更擅长让你相信他知道?
也许两者皆是。也许这就是所谓的”想象力”。
参考资料与延伸阅读
- 钛媒体:《黄仁勋,不愧为”Token之王”!(附GTC 2026演讲全文)》
- 钛媒体:《一文看懂黄仁勋在GTC2026核心观点》
- CNBC:Nvidia GTC 2026: CEO Jensen Huang sees $1 trillion in orders
- TechCrunch:Why Wall Street wasn’t won over by Nvidia’s big conference
- Stratechery:An Interview with Nvidia CEO Jensen Huang About Accelerated Computing
- Fortune:From robotics to AI agents, Jensen Huang’s GTC keynote was full of signals
- 观察者网:《推理拐点已至,未来Token就是新的大宗商品》
- 36氪:《黄仁勋GTC 2026大会演讲解读:告别”卖卡”时代》
- 知乎:如何评价黄仁勋在英伟达 2026 GTC 大会的演讲?
- IT之家:英伟达黄仁勋谈龙虾:OpenClaw是人类历史上最成功开源项目
- Bain & Company:Nvidia GTC 2026: AI Becomes the Operating Layer
- B站:芯片不稀有了,但还是只能英伟达?拆解GTC2026黄仁勋甩出的终极底牌

留下评论