AI已经拿到奥数金牌了！谷歌与OpenAI巅峰对决展示通用智能

国际数学奥林匹克竞赛（IMO）对国人并不陌生，多少年一直有中国孩子高挂金牌，很多获奖者如今都在硅谷AI大厂效力，不用创业就早早财富自由，成了此轮人才竞争的人生赢家。

IMO不仅是全球顶尖数学学子的竞技场，更成为了顶尖AI公司的战场。谷歌DeepMind和OpenAI这两大AI巨头，其最新研发的大型语言模型（LLMs）在刚结束的2025竞赛中双双取得金牌，与人类选手并驾齐驱，按照过去的说法，获得IMO金牌是通用人工智能的重要标志之一。

并驾齐驱的成就：共享荣耀与共同的挑战

在这场被视为通向通用人工智能（AGI）里程碑的竞赛中，谷歌DeepMind的Gemini with DeepThink模型与OpenAI的实验性通用推理大语言模型展现出令人难以置信的相似成就。它们都获得了35分（满分42分），并成功解决了IMO竞赛的六道问题中的五道，稳稳达到了金牌标准。

然而，一个共同的挑战横亘在两大AI巨头面前——它们都未能攻克IMO的第六道问题。视频中将这第六道题形容为“真正的通用人工智能（AGI）测试”或一个新的基准。与此同时，五位人类并列第一名选手——Ivan、Jiang、Deng、Warren和Satoshi——则完美地解决了这最后一道难题，取得了满分42分的辉煌成绩。这微妙的差距，既彰显了AI的巨大飞跃，也提醒着AGI之路上的最终考验。

通用模型革命：告别“翻译官”，直面自然语言

此次AI在IMO上的突破性进展，其核心意义在于使用了通用的大型语言模型。这意味着无论是谷歌还是OpenAI的模型，都能够像人类一样，直接阅读和理解IMO问题的自然语言描述，并撰写自然语言的证明。

这与以往AI处理数学问题的方式形成了鲜明对比，尤其与谷歌DeepMind在2024年IMO中获得银牌时所采用的方法不同。当时的谷歌AlphaGeometry 2和AlphaProofs是专门为数学设计的AI模型，它们需要将问题手动翻译成形式化的Lean语言才能被系统理解。OpenAI甚至透露，IMO组织者曾主动联系他们，提议在比赛后提供Lean版本的题目，因为这符合以往AI模型的处理习惯。而如今，“无需手动翻译”成为了通用型LLM的胜利宣言，标志着AI在理解人类语言和进行抽象推理方面迈出了革命性的一步。

深层探索：殊途同归的训练与技术演进

虽然都实现了金牌成绩，但谷歌和OpenAI在模型训练和技术探索上展现出各自的侧重：

谷歌Gemini DeepThink的策略：该模型通过新的强化学习（RL）技术进行了额外训练，这些技术专注于多步骤推理、问题解决和定理证明数据。它还吸收了高质量数学问题解决方案的精选语料库，并被注入了处理IMO问题的通用提示和技巧。值得注意的是，Gemini DeepThink模型还整合了“并行思考”技术，使其能够同时探索和结合多种可能的解决方案，最终得出答案。
OpenAI模型的创新：OpenAI研究人员开发了新的实验性通用技术，使得大语言模型在处理“难以验证的任务”时表现更佳。他们找到了绕过传统强化学习（RL）限制的方法，使得模型能够构建出与人类数学家水平相当的复杂且严谨的论证。OpenAI的模型也被形容为“思考很长时间”，并且拥有“多个并行运行的思维过程”，这与谷歌的“并行思考”异曲同工。

两家公司在核心技术上都押注了强化学习（RL）的重要性，并预示未来用于RL的计算量预计将大幅增长，甚至远超模型预训练的计算量，这凸显了RL在提升模型复杂推理能力上的关键作用。

发布争议与未来展望：谁“抢跑”了？

在IMO赛事闭幕后，谷歌DeepMind和OpenAI在结果公布时间上出现了一些争议。有传言称，IMO要求AI公司等到闭幕式一周后才公布结果，以避免抢去学生们的风头。

OpenAI的回应：OpenAI的Gnome Brown表示，他们是在闭幕式后才发布结果的，并可以直播确认。他还澄清，OpenAI并未正式通过IMO官方渠道接触，但他在发布前告知了一位组织者，并应其要求在闭幕式后才发布。
谷歌DeepMind的回应：谷歌DeepMind的CEO Demis Hassabis则强调，他们尊重了IMO董事会的原始要求：所有AI实验室只有在独立专家验证了官方结果，并且学生们获得了应有的认可后，才能分享成果。这暗示谷歌DeepMind是通过了IMO的官方渠道来处理发布事宜，而OpenAI则没有正式通过这些渠道。

尽管有这些小插曲，此次AI在IMO中达到金牌水平的成就，超越了大多数人的预期，甚至让预测者都感到惊讶。它标志着AI在创造性解决问题、抽象推理和长时间稳定思考方面的能力取得了巨大飞跃，被视为AI发展中“下一个巨大的浪潮”，因为它预示着AI开始“掌握AI开发的主导权”。

结论

此次事件揭示了一个关键的哲学思考：AI的表现略低于顶尖人类与高于顶尖人类之间存在着天壤之别。当AI达到和人类一样好的水平时，世界将发生根本性的改变。OpenAI和谷歌DeepMind在IMO上的金牌表现，无疑是这一改变的强有力预兆。

这次IMO竞赛中的AI表现，就像人工智能领域的一场“成人礼”。它不仅证明了AI在特定难题上的卓越能力，更预示着通用人工智能（AGI）的实现可能比我们想象的更快，如同黎明前的曙光，预示着一个由AI深度参与解决复杂世界难题的新时代的到来。

Let's Make AGI Real

留下评论取消回复