一周AI速览（202511A）

本周AI领域再次展示了其指数级和不懈的发展势头，焦点集中在基础设施建设的激烈竞争和AGI（通用人工智能）安全与治理的讨论。在金融和硬件方面，两大巨头创下历史新高：Nvidia市值首次突破5万亿美元，成为史上第一家达到此成就的公司；同时，OpenAI的基础设施交易也超过了1.4万亿美元。硬件巨头高通和AMD相继与OpenAI达成数十亿美元的合作，旨在构建强大的AI基础设施并打破单一供应商依赖。模型方面，Sora 2和EMU 3.5等多模态视频生成工具取得重大突破，然而，全球850多名专家和公众人物则呼吁暂停超智能开发，直到其安全性得到科学验证。

一、市场、金融与基础设施 (Market, Finance, and Infrastructure)

万亿美元级里程碑：Nvidia市值突破5万亿美元，超越了Apple、Microsoft（约4万亿美元）以及Alphabet（约4.3万亿美元）。Nvidia预计今年及明年AI芯片订单将达到5000亿美元。
OpenAI的融资与转型：OpenAI已正式转为营利性公司，并计划在大约一年后进行首次公开募股（IPO），预计估值达1万亿美元目前估值约5000亿美元）。尽管如此，26%的OpenAI基金会（非营利部分）仍保留对公司的控制权。
基础设施军备竞赛：OpenAI已承诺约1.4万亿美元用于基础设施交易，合作方包括Nvidia、Oracle、AMD、Corewave等。OpenAI正推进Stargate数据中心项目，计划于2026年在德克萨斯州建成7GW的计算设施，并强调电力将成为“新石油”。
打破垄断的合作与自研：

AMD和高通与OpenAI签署了价值数百亿美元的协议，共同构建6GW的AI基础设施，以减少对单一供应商的依赖。NVIDIA则向韩国供应超过26万块BL芯片，并与现代汽车合作建设一座拥有5万块GPU的AI工厂。
OpenAI正计划设计自己的芯片，并将与Broadcom合作开发和部署使用这些芯片的数据中心，这被视为Nvidia垄断的终结。Amazon也已为Anthropic建成了一个大型AI数据中心，使用了50万片AWS Tranium 2芯片，未使用Nvidia。
计算金融化与国际投资：Oracle签署了价值320亿美元的债务融资协议，这是历史上最大的AI基础设施交易，用于资助Project Stargate数据中心，分析师称此举为“计算的金融化”。沙特阿拉伯计划投入400亿美元建设AI数据中心，目标将其在全球AI计算中的份额从不到1%提高到6%，设施由6.6吉瓦电力和六个核反应堆供电。

二、模型竞争、推理与效率 (Model Competition, Reasoning, and Efficiency)

金融交易测试：在加密货币市场交易测试（Alpha Arena）中，六个模型投入1万美元真金。结果显示，中国模型Quen是冠军，Deepseek紧随其后（均盈利），而美国和西方模型（Google Gemini, GPT, Anthropic, Grock）均亏损。
逻辑与推理能力：Claude和Quen 3 Max在关于左右脚鞋子的荒谬提问中表现出更强的逻辑判断能力。在处理倒置酒杯问题时，Perplexity是唯一一个给出“翻转即可使用”正确答案的模型。
模型学习与发现：DeepMind在《自然》杂志发表论文，展示AI可自主发现更优的强化学习（RL）算法。一个AI系统通过“源AI监督”自行发现了学习规则，在复杂任务中超越了人类算法。
小型化与效率：Meta的Llama更新版速度提升四倍，体积缩小56%，适用于边缘设备。Anthropic发布了最小型模型Cloud High Q 4.5，成本仅为S4的1/3，擅长数学推理和编码。
模型安全性研究：一篇论文指出，向大型语言模型（LLMs）提供某一领域（如金融）的“邪恶”或不当提示，会导致其在不相关领域（如医疗建议）中出现问题行为。

三、智能体、开发工具与平台 (Agents, Development Tools, and Platforms)

OpenAI智能体与浏览器：OpenAI发布了ATL AI浏览器，直接挑战Google Chrome，支持对话式AI搜索和任务自动化，此消息导致Alphabet市值蒸发1500亿美元。
Google智能体：Google推出了Gemini R5 Computer Use AI，能像人类一样与用户界面交互，实现自动化和移动工作流。Gemini 2.5实现了自主网页浏览与交互，支持跨页研究与推理。Project Astra多模态AI代理预计2025年正式推出。
智能体平台与规范：GitHub Agent HQ是一个统一仪表板，允许开发者同时分配、监控和监督多个AI智能体，适用于需要集中策略和审计跟踪的企业用途。它引入了Agents MD规范，用于版本控制智能体行为。
代码开发模型：Google CEO透露，AI已生成公司超过25%的新代码。Miniax M2是一个开源、2000亿参数的MoE中文模型，专门为智能体和编码工作流设计，质量与Claude Sonnet相当但价格仅为其8%。Cursor Composer是Cursor推出的云端模型，具有20万的上下文长度，速度比其他模型快四倍，并支持最多八个智能体协同工作。

四、多模态、机器人与计算创新 (Multimodal, Robotics, and Computing Innovation)

多模态生成突破：OpenAI Sora 2升级，支持生成60秒电影级视频，并首次集成了高保真上下文音頻同步以及CAMO功能（用户可输入自身形象和声音）。中国智源研究院发布了EMU 3.5多模态事件模型，推理速度提升20倍，能指导机器人执行任务，例如叠衣服。
计算效率创新：Extropic的热力学计算是一种新型计算方式，它跳过矩阵乘法，直接从概率分布中采样，有可能比传统CPU/GPU运行生成模型节能10000倍。Google芯片首次实现了低于阈值的量子纠错，计算速度比经典超级计算机快125倍。
机器人进展：Neor人形机器人已可预购（2万美元），具备安静运行、做家庭作业和远程人类操作的能力。Boommy是一款经济型（1400至4000美元）94厘米高人形机器人，能行走、平衡和跳舞。
行业应用：约旦王国推出Siraj AI，与Replit合作在公立学校部署为学习助手。Google Earth AI使用Gemini推理链进行灾害预测，在2025年加州山火期间向约1500万人推送了警报。

五、监管、伦理与社会影响 (Safety, Regulation, and Societal Impact)

超级智能安全呼吁：超过850名全球公众人物（包括诺贝尔奖得主、OpenAI高管）签署声明，呼吁在科学证明安全之前，禁止或暂停超级智能的开发。
治理与法规：联合国高级机构制定了国际AI治理框架，强调透明与问责。印度要求AI生成的媒体必须标注深度造假（Deepfake）标签。美国联邦储备副主席强调AI在经济中的双重作用，呼吁加强对生成式AI的管理。
就业与社会担忧：经济学家警告，AI已取代了部分编码和客服岗位，预计更多白领岗位将受冲击。斯坦福研究显示，年轻工作者受到的冲击最大。全球民调显示，大多数人对日常AI应用持担忧而非兴奋的态度。

总结

正如Perplexity CEO所言，AI的成功特质是“指数级”和“不懈的”。本周的动态显示，行业正在向更深层次的竞争迈进：核心是算力与电力基础设施的军备竞赛，大型企业正推动万亿美元级别的建设，并通过构建自研芯片生态来打破现有垄断。同时，从连续学习到智能体协作，研究人员正专注于提升AI模型的学习能力，这被认为是实现超级智能的关键突破。OpenAI预测，自动化AI研究员将在2028年3月完全实现。然而，伴随指数级增长的，是对超级智能失控的担忧，850多名专家的联合签名凸显了安全验证在AGI开发中的紧迫性。AI的未来不仅取决于计算能力，更取决于能否在安全和监管的框架内持续、负责任地进步。

Let's Make AGI Real