
CES(消费电子展)通常是英伟达发布新款 GeForce 游戏显卡的舞台。然而在 2026 年的 CES 上,黄仁勋打破了过去 5 年的惯例——现场没有发布任何一款消费级 GPU 硬件,而是将聚光灯完全打向了软件与开发者,一口气开源了13 款全新的 AI 模型。
这一反常举动意味深长,是否代表了某种趋势?至少释放了一个明确信号:英伟达正在从单纯的“卖铲人”(硬件供应商)向全栈 AI 平台进化—-开始向下游延伸了。
以下是此次发布的这13 款模型的详细阵容,可以看到大模型领域也开始摒弃通用模型、卷专业赛道了。
一、 13 款新模型全阵容解析
英伟达此次发布的模型覆盖了从自动驾驶到药物研发的多个垂直领域,具体可以分为四大类:
1. 自动驾驶领域:Alpamayo 系列
这是英伟达在自动驾驶软件上的重大突破,意在解决端到端自动驾驶中的“黑盒”问题。
- Alpamayo:这是一个 10B(100亿)参数的模型,也是首个开源的自动驾驶推理模型。它的核心能力是“思维链”(Chain of Thought)推理,能够处理罕见的驾驶场景。它不只是根据视觉输入做出反应,还能像人类一样进行逻辑推理。梅赛德斯-奔驰已确认将在今年推出的新车中使用该技术。
- Alpamayo Sim:这是一个模拟框架模型,用于根据视觉输入生成 API 调用,主要用于自动驾驶的训练和验证环境。
2. 物理 AI 与机器人:Cosmos 与 Isaac 系列
针对黄仁勋强调的“物理 AI”(Physical AI)概念,这组模型旨在帮助机器人理解现实世界。
- Cosmos Transfer & Cosmos Predict:这属于“世界模型”(World Models),用于生成合成训练视频。它们可以模拟现实世界的物理任务,为机器人提供海量的虚拟训练数据,解决现实数据采集难的问题。
- Isaac Group:这是一个专门针对人形机器人设计的模型,为机器人本体的运动和交互提供基础智能。
3. 医疗健康:Claraara 系列
- Claraara 模型群(共 4 款):这一系列包含 4 个专门用于健康医疗和药物发现(Drug Discovery)的模型。虽然对于普通开发者来说较为小众,但对于生物科技领域的 AI 应用至关重要。
4. 代理 AI 与多模态交互:Neotron 系列
这是对普通开发者最实用、也是最受关注的一组模型,专注于构建“智能代理”(Agentic AI)。
- Neotron RAG Embedding:一个多模态的 RAG(检索增强生成)嵌入模型。它的亮点在于不仅处理文本,还能处理视觉信息,让 AI 能“看懂”文档中的图表和图片。
- Neotron RAG Re-ranker:同样支持多模态的重排序模型,用于提升搜索结果的精准度。
- Neotron Speech ASR(语音识别):这是本次发布的“明星模型”。它基于英伟达之前的 Parakeet 模型构建,但专为低延迟、实时流媒体应用设计。
二、 为什么 Neotron Speech 被视为“最实用”的模型?
在所有发布中,Neotron Speech ASR 被认为是最能立即改变开发者生态的模型。
- 极致的速度与低延迟:传统的流式语音模型往往需要重复计算重叠的音频帧,而 Neotron 引入了缓存机制(Caching),它能记住已计算的内容,避免算力浪费。这使得它非常适合实时字幕、车内语音助手或会议转录等场景。
- 完全本地化运行:与不仅依赖云端的 Whisper 不同,Neotron 非常高效,支持 MLX 版本,可以在 Mac 电脑或手机上完全本地运行,且速度远超实时(Faster than realtime)。
- 替代 Whisper 的潜力:对于开发者而言,这提供了一个免费、高性能且无需依赖昂贵云服务(如 OpenAI API)的语音识别替代方案。
三、 这说明了什么?英伟达的战略转移
此次 CES 发布会不仅是产品的展示,更是英伟达战略风向标的转移:
- 重心从“玩家”转向“开发者与云厂商”:在 CES 这样一个消费电子展上,英伟达不仅没有发布游戏显卡,反而大谈特谈 Vera Rubin 超算平台和开源模型。这说明英伟达目前的战略核心已完全锁定在满足 OpenAI、微软、谷歌等超大规模厂商(Hyperscalers)的需求上。
- 死磕“推理成本”:Vera Rubin 平台和这些新模型的一个共同特点是降低推理成本。随着 AI 应用的普及,云厂商急需降低运行 AI 的成本以提高利润率。英伟达发布优化极佳的小模型(如 10B 的 Alpamayo 和高效的 Neotron),正是为了帮助客户在边缘设备和数据中心更便宜地运行 AI。
- 多模态与物理世界的融合:发布的模型中,无论是能看图的 RAG,还是能生成视频的 Cosmos,亦或是能推理的驾驶 AI,都表明未来的 AI 将不再局限于文本。英伟达正在为**多模态(视觉+听觉+文本)和具身智能(机器人)**的爆发提前铺设基础设施。
小结
CES 2026 上的英伟达,不再只是那个卖显卡给玩家打游戏的硬件商,而是一个正在通过开源高性能模型,试图定义 AI 工业革命底层标准的生态构建者。对于开发者来说,现在是时候去 Hugging Face 下载这些模型,尝试在本地构建下一代语音助手或智能代理了。
留下评论