第四幕:数字与抽象宇宙——优化代码与发现数学
在征服了游戏世界和生物分子世界之后,Alpha血统向着人类智慧的另外两个巅峰发起了冲击:计算机代码和抽象数学。这标志着其通用学习框架的终极泛化,从模拟物理世界的规则,转向理解并优化由人类逻辑和理性构建的符号世界。
1.AlphaDev:教AI优化代码
计算机算法是现代数字社会的基石,从搜索引擎排名到手机上的数据处理,无处不在。即使是这些基础算法中最微小的效率提升,在每天数以万亿次的调用中,也能累积成巨大的性能和能耗节省。DeepMind将这一优化问题,巧妙地转化成了一场AI可以玩的游戏。
AlphaDev由此诞生。它玩的是一场名为“汇编游戏”(Assembly Game)的单人游戏。游戏的目标是,从最底层的计算机指令——汇编语言(Assembly)开始,构建出一个程序,这个程序不仅要能正确完成任务(如排序),而且要比人类专家编写的现有最优版本更快。
选择从汇编语言入手是一个极具战略眼光的决定。相比于Cpp等高级语言,汇编语言更接近计算机硬件的本质,提供了更大的优化空间,但也因此对人类程序员来说极其复杂和反直觉。这正是AI可以大展身手的领域。
AlphaDev的成就斐然,并已产生了切实的现实影响:
- 更快的排序算法:AlphaDev发现了针对短序列(3到5个元素)的全新排序算法,速度比之前Cpp标准库中的实现快了高达70%。由于这些短序列排序是大型排序算法(如快速排序、归并排序)中的核心组成部分,这一优化使得对超过25万个元素的大规模数据进行排序时,整体效率提升了约1.7%。
- 更快的哈希算法:它还发现了一种新的哈希算法,在特定场景下比原有算法快了30%。
最关键的是,这些由AI发现的、更优的算法并非停留在论文中。经过严格的审查和验证,它们已经被正式整合到全球广泛使用的开源Cpp基础库中,如LLVM的libc+和谷歌的Abseil库。这意味着,今天全球数十亿台设备和服务器上运行的软件,都可能在不知不觉中受益于AlphaDev的智慧,变得更快、更节能。这充分证明了Alpha的方法论不仅能用于科学发现,还能在工程实践中创造巨大的价值。
2.AlphaGeometry与AlphaProof:AI推理的新前沿
如果说代码优化是AI在应用逻辑上的突破,那么形式数学则是对AI纯粹抽象推理能力的终极考验。数学,特别是证明,被认为是人类最高形式的智力活动之一,它要求严密的逻辑、创造性的洞察和对抽象概念的深刻理解。
为了攻克这一难题,DeepMind开发了AlphaGeometry和AlphaProof,并引入了一种重要的架构演进——神经符号系统(neuro-symbolic system)。这种混合方法旨在结合两种AI范式的优点,以克服传统大型语言模型(LLM)在数学推理上的致命弱点——“幻觉”(hallucination)。
该系统的架构可以理解为模拟了人类的两种思维模式:
- 神经网络(基于Gemini):扮演着“快速、直觉的思考者”的角色。它负责从海量数据中学习模式,当面对一个复杂的数学问题时,能够快速地提出“直觉上”有用的解题思路或需要添加的辅助线等几何构造。
- 符号引擎(基于Lean等形式化语言):扮演着“缓慢、审慎的思考者”的角色。它是一个基于严格逻辑规则的推理系统。当神经网络提出一个想法后,符号引擎会用形式化的方法一步步进行推导和验证,确保每一步都符合逻辑公理,最终给出的证明是100%可验证和正确的,从而彻底杜绝了错误和幻觉。
为了训练这个系统,DeepMind再次展现了其强大的创造力。由于形式化数学的人类证明数据非常稀少,AlphaGeometry通过一个巧妙的程序,从零开始生成了1亿个独特的几何问题及其机器可验证的证明,构建了一个庞大的高质量合成数据集。
这一神经符号融合的方法取得了惊人的成果。在针对国际数学奥林匹克竞赛(IMO)级别难题的测试中:
- AlphaGeometry在30道IMO几何题的基准测试中,成功解决了25道,其表现已经达到了人类金牌选手的平均水平。
- AlphaProof则专注于代数和数论等其他领域。在2024年的IMO竞赛中,它与AlphaGeometry 2(AlphaGeometry的升级版)联手,成功解决了6道题中的4道,取得了相当于“银牌”的成绩。
AlphaGeometry和AlphaProof的成功,可能为未来高级AI的发展指明了一条重要道路。通过将神经网络的创造性直觉与符号系统的逻辑严谨性相结合,AI有望在需要绝对正确性和可解释性的关键领域(如科学、工程、法律)发挥更重要的作用,成为既强大又值得信赖的智能伙伴。

留下评论