AI已经拿到奥数金牌了!谷歌与OpenAI巅峰对决展示通用智能

国际数学奥林匹克竞赛(IMO)对国人并不陌生,多少年一直有中国孩子高挂金牌,很多获奖者如今都在硅谷AI大厂效力,不用创业就早早财富自由,成了此轮人才竞争的人生赢家。

IMO不仅是全球顶尖数学学子的竞技场,更成为了顶尖AI公司的战场。谷歌DeepMind和OpenAI这两大AI巨头,其最新研发的大型语言模型(LLMs)在刚结束的2025竞赛中双双取得金牌,与人类选手并驾齐驱,按照过去的说法,获得IMO金牌是通用人工智能的重要标志之一。

并驾齐驱的成就:共享荣耀与共同的挑战

在这场被视为通向通用人工智能(AGI)里程碑的竞赛中,谷歌DeepMind的Gemini with DeepThink模型与OpenAI的实验性通用推理大语言模型展现出令人难以置信的相似成就。它们都获得了35分(满分42分),并成功解决了IMO竞赛的六道问题中的五道,稳稳达到了金牌标准。

然而,一个共同的挑战横亘在两大AI巨头面前——它们都未能攻克IMO的第六道问题。视频中将这第六道题形容为“真正的通用人工智能(AGI)测试”或一个新的基准。与此同时,五位人类并列第一名选手——Ivan、Jiang、Deng、Warren和Satoshi——则完美地解决了这最后一道难题,取得了满分42分的辉煌成绩。这微妙的差距,既彰显了AI的巨大飞跃,也提醒着AGI之路上的最终考验。

通用模型革命:告别“翻译官”,直面自然语言

此次AI在IMO上的突破性进展,其核心意义在于使用了通用的大型语言模型。这意味着无论是谷歌还是OpenAI的模型,都能够像人类一样,直接阅读和理解IMO问题的自然语言描述,并撰写自然语言的证明

这与以往AI处理数学问题的方式形成了鲜明对比,尤其与谷歌DeepMind在2024年IMO中获得银牌时所采用的方法不同。当时的谷歌AlphaGeometry 2和AlphaProofs是专门为数学设计的AI模型,它们需要将问题手动翻译成形式化的Lean语言才能被系统理解。OpenAI甚至透露,IMO组织者曾主动联系他们,提议在比赛后提供Lean版本的题目,因为这符合以往AI模型的处理习惯。而如今,“无需手动翻译”成为了通用型LLM的胜利宣言,标志着AI在理解人类语言和进行抽象推理方面迈出了革命性的一步。

深层探索:殊途同归的训练与技术演进

虽然都实现了金牌成绩,但谷歌和OpenAI在模型训练和技术探索上展现出各自的侧重:

  • 谷歌Gemini DeepThink的策略:该模型通过新的强化学习(RL)技术进行了额外训练,这些技术专注于多步骤推理、问题解决和定理证明数据。它还吸收了高质量数学问题解决方案的精选语料库,并被注入了处理IMO问题的通用提示和技巧。值得注意的是,Gemini DeepThink模型还整合了“并行思考”技术,使其能够同时探索和结合多种可能的解决方案,最终得出答案。
  • OpenAI模型的创新:OpenAI研究人员开发了新的实验性通用技术,使得大语言模型在处理“难以验证的任务”时表现更佳。他们找到了绕过传统强化学习(RL)限制的方法,使得模型能够构建出与人类数学家水平相当的复杂且严谨的论证。OpenAI的模型也被形容为“思考很长时间”,并且拥有“多个并行运行的思维过程”,这与谷歌的“并行思考”异曲同工。

两家公司在核心技术上都押注了强化学习(RL)的重要性,并预示未来用于RL的计算量预计将大幅增长,甚至远超模型预训练的计算量,这凸显了RL在提升模型复杂推理能力上的关键作用。

发布争议与未来展望:谁“抢跑”了?

在IMO赛事闭幕后,谷歌DeepMind和OpenAI在结果公布时间上出现了一些争议。有传言称,IMO要求AI公司等到闭幕式一周后才公布结果,以避免抢去学生们的风头。

  • OpenAI的回应:OpenAI的Gnome Brown表示,他们是在闭幕式后才发布结果的,并可以直播确认。他还澄清,OpenAI并未正式通过IMO官方渠道接触,但他在发布前告知了一位组织者,并应其要求在闭幕式后才发布。
  • 谷歌DeepMind的回应:谷歌DeepMind的CEO Demis Hassabis则强调,他们尊重了IMO董事会的原始要求:所有AI实验室只有在独立专家验证了官方结果,并且学生们获得了应有的认可后,才能分享成果。这暗示谷歌DeepMind是通过了IMO的官方渠道来处理发布事宜,而OpenAI则没有正式通过这些渠道

尽管有这些小插曲,此次AI在IMO中达到金牌水平的成就,超越了大多数人的预期,甚至让预测者都感到惊讶。它标志着AI在创造性解决问题、抽象推理和长时间稳定思考方面的能力取得了巨大飞跃,被视为AI发展中“下一个巨大的浪潮”,因为它预示着AI开始“掌握AI开发的主导权”。

结论

此次事件揭示了一个关键的哲学思考:AI的表现略低于顶尖人类与高于顶尖人类之间存在着天壤之别。当AI达到和人类一样好的水平时,世界将发生根本性的改变。OpenAI和谷歌DeepMind在IMO上的金牌表现,无疑是这一改变的强有力预兆。

这次IMO竞赛中的AI表现,就像人工智能领域的一场“成人礼”。它不仅证明了AI在特定难题上的卓越能力,更预示着通用人工智能(AGI)的实现可能比我们想象的更快,如同黎明前的曙光,预示着一个由AI深度参与解决复杂世界难题的新时代的到来。



留下评论