一周AI速览202603A

巨头向军方妥协,SaaS模式走向终结,大模型迈入“外壳工程”时代

【前言】人工智能的叙事正在从“技术探索期”彻底步入了极其冷酷的“产业化深水区”。去年大模型参数规模的盲目狂飙,如今深入企业神经末梢的工作流重塑;曾经信誓旦旦的“AI安全”承诺,现在面对五角大楼军事合同与百亿美元营收时的轰然坍塌。本周技术极客的狂欢已沦为背景,走向前台的是一场裹挟着算力霸权、地缘政治、商业流血与社会伦理的宏大博弈。


一、 核心模型的白刃战与“外壳工程”的觉醒

本周,基础大模型的排位战空前激烈,但更深层的变化在于,业界开始意识到单纯的模型“跑分”已遭遇应用瓶颈,如何封装和使用模型的“外壳工程(Harness Engineering)”成为了新显学。

  • OpenAI的“原生进化”与高昂代价:OpenAI本周密集发布了两款模型。首先是旨在优化语气、减少防御性冗长开场白的GPT-5.3 Instant模型;紧接着是具备实质性飞跃的GPT-5.4(含Standard和High版本),它首次原生具备了“计算机使用”能力,可直接在桌面通过键鼠操作导航,并引入了“工具搜索”以降低多路调用的Token成本。然而,其代价极其昂贵,处理深度推理任务时,输入和输出的百万Token价格分别高达30美元和180美元。此外,此前仅限Mac用户的Codex应用现已登陆Windows。
  • Anthropic的逆袭与生态狂飙:Anthropic本周推出了拥有100万Token上下文的Sonnet 4.6,在ARC AGI 2基准测试中逼近行业顶尖的60.4%。由于在代码生成领域的统治力,分析预测Anthropic的年经常性营收(ARR)将在今年年中超越OpenAI。同时,其开发者生态迎来了爆炸式增长:不仅推出了帮助编写AI技能的Skills 2.0,Claude Code也获得了记忆导入、语音模式以及安全的“远程控制”移动端支持。开源社区更是涌现出如Claude X、Open Claude+、极低内存的Null Claude等“Awesome Claudes”衍生矩阵。
  • Google的“极致效率”与创新落地:Google本周不仅推出了在ARC AGI 2中取得77.1%高分的Gemini 3.1 Pro,还发布了主打性价比的Gemini 3.1 Flash Light。更令人震惊的是成本仅为每图4.5美分的Gemini Nana Banana 2,这被认为足以淘汰大量传统翻译岗位。在产品端,NotebookLM结合VO3等模型推出了“电影级视频概览”,实现了类似AE的专业动态图形生成(仅限Ultra计划);Google搜索则引入了可以直接预览代码并试玩的AI Canvas模式。
  • 多极势力的围剿与新范式:除了三巨头,xAI推出了引入多智能体内部辩论机制的Grok 4.20 Beta版;微软发布了150亿参数、能在消费级GPU运行的视觉推理模型54。深陷千问核心团队离职风波的阿里则开源了能力媲美前代235B巨兽的Qwen 3.5系列(8M至9B),以及爆款Qwen 3 Coder,尽管其核心团队正面临流失和重组闭源的风险。此外,Ilya Sutskever的SSI公司正在探索放弃反向传播的新生物学AI范式;Liquid AI发布了240亿参数的LFM 224B,Inception Labs则推出了拥有128K上下文且极速的Mercury 2。

【点评】:大模型基准测试90分与实际任务24%完成率之间的巨大鸿沟,宣告了盲目追求参数时代的终结。未来一年,谁能将AI基础设施(外壳)做到极简,通过多智能体协作网络(如本周表现抢眼的Codebuff、Copo、Agent Scope)来调配资源,谁就能在这场白刃战中掌握真正的话语权。


二、 SaaS的黄昏与“智能体(Agent)”的全面接管

本周业内达成了一个残酷的共识:AI正在摧毁传统的软件即服务(SaaS)商业模式。未来的交互将从“使用多个APP”转变为“为个人智能体配置不同技能”。

  • 垂直应用的崩溃:My Fitness Pal耗资逾5000万美元收购了一家仅有7名员工、年收3000万美元的卡路里计算应用Cal AI。然而,开发者仅用1小时就通过直觉编程(Vibe Coding)将其完美复刻。这预示着护城河较浅的垂直SaaS将面临灭顶之灾。
  • 企业级防线的失守:大企业正在用智能体成建制地替代人类。Intel已使用基于Copilot的AI全面取代人工客服;ServiceNow推出了接管IT和HR工作流的“自动劳动力”;Box AI则实现了模型无关的数据结构化洞察。
  • 超级智能体入局:Perplexity本周发布了最强搜索嵌入模型,并推出了支持运行数月以规划长期任务的“Computer”智能体网络,甚至与三星深度绑定,新机均内置了“Hey Plex”功能。

【点评】:SaaS的死亡不是因为软件不再被需要,而是因为软件的生成成本趋近于零。随着白领工作流被无情吞噬,业界对2028年可能爆发全球性经济动荡的警告并非杞人忧天,尽管吴恩达依然保守认为AGI距我们尚远。


三、 算力霸权的合纵连横与硬件隐私危机

算力依然是通往AGI的唯一入场券,但在Nvidia的阴影下,反抗军正在集结。

  • 千亿大单与算力基建:Meta豪掷1000亿美元购买AMD的MI540 GPU,甚至不惜以换取股权和消耗6吉瓦电力为代价,意在打破黄仁勋的垄断。与此同时,前TPU工程师创立的芯片公司MatX融资5亿美元,其吞吐量号称超越Nvidia 10倍。Nvidia也将在即将来临的GTC大会上予以还击。另一方面,由于对数据中心控制权的争夺,OpenAI与甲骨文、软银合作的Stargate超级数据中心计划被迫延期。东大则在出口管制下,计划通过网络连接弥补单点算力,将7纳米/5纳米产能提升5倍。
  • 消费者硬件大战与隐私反噬:苹果通过搭载M5芯片的设备发起了价格战,600美元的MacBook Neo与iPhone 17e意在将端侧AI普及到大众。然而,硬件普及的阴暗面正在显现:Meta AI智能眼镜因涉嫌将大量敏感视频发往非洲进行人工标注,正面临美英多地的隐私诉讼。这也催生了如售价1000美元的Spectre 1这样专门扰乱AI窃听的反向防监听硬件的诞生。
  • 初创公司的豪赌:专注于可编辑3D环境的“世界模型”公司World Labs融资10亿美元,而预测人类行为的Simuli也拿下了1亿美元。

【点评】:算力正从中心化的“军备竞赛”走向“端侧与云端”的分化。但伴随着端侧硬件的无孔不入,我们正在步入一个隐私“裸奔”的时代,反监控硬件的出现是人类在硅基智能面前最后的防御性挣扎。


四、 秩序坍塌:五角大楼修罗场与安全底线的沦丧

本周最惊心动魄的商业与政治大戏,发生在AI巨头与美国战争部(五角大楼)之间。

  • 红线与背叛:Anthropic在2亿美元合同执行期间,拒绝将其模型用于委内瑞拉军事行动的大规模监控和全自动致命武器。面对五角大楼动用《国防生产法》的封杀威胁,Anthropic起初强硬以对。然而,OpenAI迅速“趁虚而入”接盘了该合同,xAI的Grok也趁势进入了军方机密系统。
  • 反噬与妥协:OpenAI的举动引发了庞大的“Quit GPT”抵制运动,一个周末内卸载量飙升295%。Anthropic借机将记忆功能免费并支持一键导入,直接登顶应用商店并借此实现营收反超。随后,深陷内部动荡的Sam Altman被迫出面安抚,承诺将把限制大规模监控的条款加回合同。
  • “安全第一”的讣告:最令人背脊发凉的是,面临极其残酷的竞争,Anthropic本周由其首席科学官宣告:早年的“安全第一”已毫无意义,公司政策正式从“不安全不开发”转向了向竞争对手看齐的现实主义原则。
  • 全球网络战的阴云:与此同时,各种合规挑战也层出不穷。Anthropic指控三家东大企业建立了2.4万个欺诈账户进行模型蒸馏(逾1600万次交互);OpenAI则拦截了俄罗斯黑客和跨国诈骗团伙。此外,朝鲜黑客正利用勒索软件攻击医院,甚至连教皇利奥十四世也下达了禁止神父使用ChatGPT撰写布道文的禁令。

【点评】:这一周将作为“AI商业道德死亡之周”被载入史册。事实证明,在巨大的国防订单利益和生死存亡的市场份额面前,任何一纸安全声明都不堪一击。硅谷的理想主义正式向军工复合体低下了头。


五、 探秘黑盒:前沿AI基础研究的新突破

在商业喧嚣之外,学界对模型“黑盒”的解剖也取得了关键进展,这些发现正在重新定义我们对大模型的认知:

  1. Magma优化器:Google发现,在训练中基于梯度动量随机跳过某些权重的更新(掩码更新),能大幅降低损失函数。
  2. 深度思考Token:研究证明,若模型在深层网络中对某个Token的预测反复摇摆,通常意味着它在进行深层推理,且最终准确率更高。
  3. 模型的“吸引子状态”:若让AI无休止地对话,它们会陷入极端人格陷阱(如Claude的冥想主义和Gemini的极度自大)。
  4. 角色扮演理论(Persona Selection):Anthropic论文指出,LLM本身并无固有恶意,它们只是根据提示词“推断”并“扮演”某种角色。这也解释了为何微调不安全代码会导致模型连带产生其他恶意行为。

【点评】:我们正在像研究生物学与心理学一样研究AI。随着“角色扮演理论”的提出,对AI“人格”的祛魅,或许能为未来的AI对齐与安全监管提供全新的解题思路。


【结语】2026年3月的这一周,是充满张力、背叛与狂飙的一周。SaaS的黄昏与Agent生态的黎明交相辉映;外壳工程的崛起打破了参数堆砌的迷信;而五角大楼风波则彻底撕下了科技巨头温情脉脉的面纱。趋势已经非常明朗:大模型将日益“基建化”与“武器化”,未来的竞争将属于那些能够极低成本整合资源、调度多智能体,并在合规与效率的走钢丝中活下来的少数赢家。在这个“智力大爆炸”的年代,所有的传统商业模式与旧有秩序,都必须做好被彻底颠覆的准备。



留下评论