一周AI速览202602B

从“算力军备”到“代理自主”:工业化转型的阵痛与狂欢

前言:橡胶触地的时刻

2026年2月,人工智能的发展历程正迎来一个决定性的拐点:它正在进入“工业化阶段”。正如业内人士Matt Schumer所言,行业已来到“橡胶触地(rubber touches the road)”的时刻,即从单纯的研发投入转变为产生实际效用。

本周的信号充满了矛盾与张力:一方面,全球科技巨头抛出了高达6500亿美元的资本支出计划,试图用金钱堆砌出通往通用人工智能(AGI)的道路;另一方面,资本市场却因迟迟未见的回报率(ROI)而感到焦虑,导致巨头市值蒸发。埃隆·马斯克(Elon Musk)在本周的预言更是加剧了这种紧迫感——他断言AI最终将占据所有智能的99%。在这个情人节周,我们见证的不仅是技术的迭代,更是商业模式从“出售工时”向“出售结果”的残酷转型。

以下是本周(2026年2月16日当周)全球AI产业的深度复盘与分析。

一、 资本博弈与硬件范式的分裂:英伟达不再是唯一答案

本周最令人深思的数据来自华尔街。亚马逊、谷歌、Meta和微软四家公司在2026年的资本支出预算激增至6500亿美元,较去年增长约60%。然而,市场的反应却是残酷的——这四家公司的市值在第一周内蒸发了9500亿美元。这揭示了一个深刻的“投资悖论”:市场不再为单纯的算力堆砌买单,而是迫切要求看到盈利能力。

评论:这场豪赌的背后,硬件架构正在发生微妙的分裂。

  1. 英伟达的“Token经济学”防守战:英伟达试图通过Blackwell架构证明其统治力。通过引入NVFP4低精度格式和全栈优化,英伟达宣称将开源模型的推理成本降低了10倍。这不仅仅是性能提升,更是一场为了生存的“价格战”,试图通过降低边际成本来维持其生态壁垒,特别是在医疗(Sully.ai)和游戏领域。
  2. OpenAI的“叛逆”与Cerebras的突围:最值得关注的变数是OpenAI发布的GPT-5.3-Codex-Spark。这款模型并未运行在英伟达GPU上,而是采用了Cerebras的晶圆级引擎。结果是惊人的:代码生成速度超过了1000 tokens/秒,是传统速度的15倍以上。在实测中,该模型仅需50秒即可从零构建一个可玩的《吸血鬼幸存者》克隆版游戏。洞察:这预示着一种全新的编程范式——“极速推理”。当思考速度提升20倍,开发者不再是编写者,而是实时的系统编排者。OpenAI此举也暗示了其试图摆脱对英伟达硬件绝对依赖的战略意图。

二、 智能体革命:OpenClaw的崛起与编程之死

本周有一个堪称“GPT时刻”的进展并非来自巨头,而是来自奥地利的一个个人开源项目——OpenClaw(前身为Clawbot/Moltbot)。

  1. 从聊天到行动:OpenClaw并不是一个聊天机器人,它是一个真正的自主助手(Autonomous Assistant)。与基于浏览器的模型不同,OpenClaw安装在你完全自主可控的电脑上,配置要求极其灵活,能够直接访问本地文件、电子邮件、银行账户,并跨平台(Slack, Discord, WhatsApp)执行代码。其GitHub星标增长速度已打破历史记录。
  2. “中间件技能”成为新代码:OpenClaw的爆发引出了软件开发范式的根本转变:“技能(Skills)”取代了“硬编码”。现在的系统架构师变成了“技能架构师”,主要工作是编写Markdown格式的“技能文件”甚至定义智能体角色的“灵魂文件(soul.md)”。案例:开发者通过编写技能文件,让Claude Code在40秒内学会并执行了复杂的LinkedIn操作,而无需编写底层逻辑。
  3. 安全隐患与巨头觊觎:这种强大的权限带来了巨大的安全风险。直接从互联网下载技能文件被比喻为“不安全的性行为”,可能导致隐私泄露。因此,专家建议使用单独的硬件(如专用的MacBook Air)来运行此类代理。尽管如此,Meta和OpenAI已被传出有意斥资数十亿收购该项目,而百度甚至已将其集成到云服务中供7亿用户使用。

三、 模型战国时代:深度推理与价格屠夫

在模型性能的竞技场上,本周呈现出“两极分化”的趋势:一极追求极致的智力,另一极追求极致的廉价。

  1. 智力的天花板:Google Gemini 3 Deep Think谷歌的这款仅面向Ultra订阅用户的高级模型,在Arc AGI 2和Humanity's Last Exam等基准测试中全面碾压了Claude Opus 4.6和GPT 5.2。它不仅在奥林匹克物理竞赛中达到金牌水平,甚至被数学家用于发现学术论文中的逻辑漏洞。这标志着AI已从助手进化为“科研合伙人”。
  2. 价格的地下室:MiniMax与中国模型的“降维打击”在排行榜的另一端,以MiniMax M2.5为代表的中国模型发起了残酷的价格战。其成本仅为Claude Opus 4.6的二十五分之一,连续运行一小时仅需约1美元。排行榜动态:目前Claude位居榜首,但开源模型(尤其是中国模型如Kimi 2.5, GLM 5)表现强劲,紧随其后。GPT排名有所下滑,Deepseek虽跌至第29位,但预计将在春节期间发布版本4。
  3. 本周开源社区迎来了一款令人震惊的模型——由智谱发布的GLM 5.0。这款拥有7440亿参数的专家混合架构(MoE)模型,以MIT协议开源,其表现被认为已跻身世界顶尖行列。在Humanity's Last Exam和SWE-bench(软件工程)等硬核基准测试中,GLM 5.0的得分与Claude Opus 4.5及GPT 5.2等顶级闭源模型不相上下。业界对其评价的核心在于极强的“智能体(Agentic)”自主闭环能力:从设定目标、制定计划,到执行代码、自我测试、并在遇到错误时自动修复,全程无需人类干预。这标志着开源模型不仅在智力上追平了巨头,更在长程任务的执行力上实现了质的飞跃。

四、 视频生成与版权的“双城记”

本周视频生成领域发生了一场地震,震源来自字节跳动。

  1. SeeDance 2.0 的统治力:TikTok母公司发布的SeeDance 2.0被公认为目前最强的视频模型。它支持文本、图像、音频、视频四模态输入,生成的15秒视频在口型同步和物理真实感上无出其右。争议:该模型虽然尚未在美国正式开放,但其对版权内容的宽松处理令人咋舌。演示中出现了《指环王》、《海绵宝宝》、《海贼王》等角色的完美生成。这形成了一个鲜明的对比:美国公司(如Google, OpenAI)受制于版权合规,而中国公司似乎正在利用这一“灰色优势”抢占用户心智。
  2. 版权法律战的新边界:从输入到输出与此同时,美国本土的法律环境正在收紧。迪士尼和环球影业联合起诉Midjourney,标志着诉讼焦点从“训练数据”转向了“模型输出”——即生成的图像是否直接侵权。此外,美国提出的《CLEAR法案》要求AI公司公开训练数据,这将终结“黑箱训练”时代。评论:这种法律环境的差异,可能会在短期内导致美国模型在生成效果(尤其是流行文化相关内容)上落后于竞争对手,但在长期看,合规性是企业级应用的前提。

五、 物理渗透与地缘政治

AI的影响力不再局限于屏幕,正在加速渗透物理世界和地缘政治格局。

  1. 具身智能与可穿戴设备:波士顿动力宣布与Google DeepMind合作,将Gemini集成到Atlas机器人中。Meta则推出了基于肌电图(sEMG)技术的Neural Band,实现了“虚拟书写”。苹果也终于将在CarPlay中向ChatGPT和Gemini开放接口,但这更像是为了维持生态粘性而做出的妥协。
  2. 芯片封锁的精细化:在地缘政治层面,美国对华H200芯片的出口政策发生了微妙变化:从“完全禁止”转向“高额抽成”。新规允许向特定中国科技巨头出口H200,但需缴纳高额关税并限制数量。这实际上是将技术封锁转化为了一种经济收割手段,同时也迫使中国企业(如阿里、腾讯)加速寻找国产替代或通过黑市溢价获取算力。

未来:在泡沫与变革之间

2026年2月的一周,我们看到了AI行业继续以令人眩目的速度加速变化。

从宏观上看,工业化已经开始。医疗AI开始通过特定的支付代码实现盈利;软件开发正在被GitHub和Spotify等公司通过AI重构;OpenClaw展示了代理如何接管人类的繁琐工作。

但从微观上看,矛盾日益尖锐。巨额的资本支出与短期盈利压力之间的矛盾、开源模型的极速进步与闭源模型的护城河焦虑、以及最核心的——监管合规与技术野蛮生长之间的冲突。字节跳动的SeeDance 2.0与迪士尼的诉讼案就是这种冲突的缩影。

展望未来几个月,随着Claude 4.6的普及、GPT-5.3的迭代以及中国春节后DeepSeek V4的发布,模型能力的竞争将进入白热化。更值得关注的是,中国开源大模型在过去一年里出现了“轮番上新、屡触SOTA门槛”的集体式跃迁:以DeepSeek R1/V3引爆“DeepSeek时刻”,到智谱推出开源旗舰GLM-5、阿里持续推进Qwen体系迭代,再到字节、MiniMax、腾讯等密集发布与更新模型与多模态产品——一方面把开源权重模型的上限不断抬高,另一方面也把“闭源前沿模型 vs 开源可用模型”的分野重新洗牌。

由此,今年的竞争新格局很可能同时沿着两条轴线展开:其一是开闭源之争从“能力差距”转向“生态与落地速度”——开源阵营凭借更快的迭代、更广的社区与更灵活的部署,正在逼迫闭源阵营用更强的产品化、更可靠的安全与更确定的SLA来证明溢价;其二是中美模型之争从“单点性能对标”转向“工程体系与应用场景占领”——美国公司仍可能在前沿能力与平台化工具链上占优,而中国公司则可能在高频行业场景、成本效率与端侧/国产算力适配上形成更密集的“可交付优势”。对接下去的形势研判:如果中国开源模型继续保持“接近前沿—快速开源—生态扩散”的节奏,而头部闭源模型无法在安全、合规与可控接入上率先突破,那么2026年的胜负手将不再只是榜单上的几分,而是“谁能把最强能力用最低摩擦嵌入真实流程”。

但真正的战场,或许在于谁能最先解决“安全”与“实用”的平衡,将这些强大的“大脑”真正安全地接入我们的银行账户和物理世界。正如Jeff Dean所预测的,当吞吐量达到每秒10,000 tokens时,世界将完全不同。我们正站在这个新世界的门槛上,既兴奋,又战栗。



留下评论