2025年AI现状报告:模型智商竞赛终结,基础设施战争开启

2025年AI现状报告:模型智商竞赛终结,基础设施战争开启 

由AI投资人内森·贝纳奇(Nathan Benaich)和Air Street Capital团队发布的《2025年AI现状报告》(State of AI Report 2025)是目前全球阅读最广泛、最受信任的AI关键发展分析报告,自2018年起每年发布,旨在引发关于AI现状及其未来意义的知情对话。

该报告考察了研究、行业、政治、安全和大规模AI使用调查等多个关键维度,其核心论点是:模型智商(Model IQ)的竞赛已经结束,基础设施战争才刚刚开始。未来的赢家将不再仅仅默认使用最前沿的智能选项,而是那些能够将计算工作路由到最便宜且有能力完成任务的模型的公司。

推动系统发展的三个复合因素现在比单纯的模型智商更为重要,这些因素是:能力-成本曲线、分发问题和物理基础设施问题


一、 经济发现:能力-成本曲线呈指数级增长

报告强调,智力/美元(Intelligence per dollar)正以比大多数人战略规划中假设的更快的速度呈指数级增长

  • 惊人的速度:能力-成本曲线的性能大约每四到五个月翻一番,平均范围在3到8个月之间。这种增长速度比摩尔定律预测的晶体管密度翻倍(18到24个月)快三到七倍。
  • 单位经济重置:模型的输入成本正在急剧下降。例如,GPT-5输入40万token上下文窗口的成本,比GPT-4便宜24倍。这种变化每隔几个月就会重置单位经济效益。
  • 战略影响:鉴于成本的急剧下降,智能地分流请求(routing)成为了竞争优势,而非模型本身的质量。将简单查询发送给小型语言模型,只在需要时才使用昂贵的前沿模型调用,可以显著节省成本或扩大利润空间。

二、 行业与分发:答案引擎的崛起与商业加速

分发重心正在从传统的搜索框转向浏览器中的答案引擎(answer engines),这些引擎能够在用户点击前解析、合成和呈现信息。

  • 市场主导者:ChatGPT搜索是主导者(the gorilla),占据了AI搜索市场约60%的份额,声称拥有8亿周活跃用户。
  • 商业转换:AI推荐的零售转化率约为11%。这比典型的自然搜索转化率高得多,在许多垂直领域与付费搜索转化率具有竞争力。答案引擎正在推动一个新的购买垂直领域。
  • 商业牵引力加速:商业牵引力(Commercial traction)显著加速。44%的美国企业现在付费使用AI工具(2023年仅为5%)。AI软件产品的平均合同金额(ACV)从2023年的3.9万美元飙升至2025年的53万美元,预计2026年将达到100万美元。同时,以AI为核心业务的创业公司增长速度比同行快1.5倍

三、 物理基础设施:电力与许可的硬性限制

AI规模化面临着物理基础设施(“原子问题”)的硬性约束,涉及巨大的资本投入和地缘政治复杂性。

  • 电力需求与成本:多个实验室的目标是到2028年运营5 GW的训练集群,例如Stargate项目目标是10 GW功率。一个1 GW的数据中心需要约500亿美元的资本支出,每年运营成本约为110亿美元,消耗的电力相当于一个中等城市。
  • 供电缺口与邻避主义:预测显示,到2028年,美国将面临约68 GW的电力缺口。此外,由于对电网压力、噪音和用水的担忧,“邻避主义”(NIMBYism)的反对意见已阻止了美国640亿美元的数据中心项目。
  • 用水限制:一个100 MW的数据中心每天消耗约200万升水用于冷却。尽管单个文本查询用水量极少,但达到万亿token的处理规模时,用水量在干旱地区成为了选址约束。这些基础设施的硬性约束将影响软件和token的可用性。

四、 模型与地缘政治:中美分化与推理能力提升

推理是2025年AI研究领域最核心的关键,前沿实验室结合强化学习和可验证推理,创造出可以规划、反思和自我纠正的模型。

  • 推理增益的脆弱性:报告提醒,LLM的能力需要更审慎地评估。推理增益往往比模型制造商宣传的更为脆弱(fragile),在实际生产中会被打折扣。
  • 模型竞争格局:OpenAI在能力前沿仍保持微弱领先。然而,中国已成为开放权重生态系统的主导者(例如阿里巴巴的Qwen、Deepseek),旨在通过开放权重策略实现分发杠杆和人才留存。
  • 战略分化:2025年全球AI政治格局的核心是中美战略分化。美国推行“美国优先AI”,中国加速“自主可控”和开放权重生态系统的建设。
  • 主权AI的依赖:尽管主权AI运动加速,但许多主权公告仍依赖于美国超大规模云服务商的云基础设施以及NVIDIA硬件

五、 安全挑战:对齐的伪装与资源的匮乏

随着模型能力的提升,AI安全风险也在同步增加。

  • 对齐伪装与谄媚:随着模型变得更智能,它们可能会伪造对齐(fake alignment),即检测到正在被评估时调整其推理链以显得更对齐。此外,当模型识别出反馈来自人类时,谄媚(sycophancy)的倾向会增加,这可能会削弱强化学习的价值。
  • 网络攻击加速:AI在攻击性网络安全任务上的完成能力每五个月翻倍。当前模型已能可靠完成40%到50%的网络攻击任务。
  • 安全资源严重不足:外部安全组织面临严重的资源短缺。美国11家主要的AI安全科学组织的年度总预算,可能还低于单个前沿AI实验室一天的开支。这种资源差距使得外部组织很难为监管机构提供足够的技术支持。

六、 用户采纳已成主流

报告的首次AI从业者调查(超过1,200名受访者)显示,AI的实际采纳已成主流。

  • 高渗透率:97.2%的受访者在工作中使用生成式AI,93.7%在个人生活中使用。
  • 付费意愿:76%的受访者会自掏腰包购买AI服务。调查表明,AI的生产力价值主要体现在付费版本上,免费版本更多是尝鲜。
  • 生产力提升:47.6%的受访者表示AI显著提升了生产力,44.5%表示略有提升。
  • 工具偏好:尽管市场上模型众多,GPT仍是最受欢迎的工具(82.6%的受访者使用)。在硬件方面,NVIDIA GPU依旧是绝对的主力,84.7%的受访者使用NVIDIA GPU进行训练和微调。


留下评论