Google DeepMind AlphaProof Nexus 以数百美元成本自动解决56年未解数学难题
Google DeepMind 的 AlphaProof Nexus 系统自主解决了9个开放 Erdős 问题,其中两个困扰数学家56年,每个问题推理成本仅数百美元。该系统使用 Lean 编译器自动验证证明步骤,成功率2.5%。了解其技术原理及对中文数学研究社区的影响。
一句话看懂
Google DeepMind 的 AlphaProof Nexus 以每个问题仅数百美元的推理成本,自主解决了9个开放 Erdős 问题,包括两个56年未解的数学难题。
详细发生了什么
Google DeepMind 发布了 AlphaProof Nexus,一个能自主解决数学难题的 AI 系统。它成功攻克了9个开放 Erdős 问题——这些是著名数学家 Paul Erdős 提出的悬赏问题,其中两个已经56年无人能解。每个问题的推理成本仅需几百美元,远低于传统人力或计算密集型方法。
与 OpenAI 使用自然语言推理的方式不同,AlphaProof Nexus 采用 Lean 编译器来验证每一个证明步骤,确保数学严谨性。Lean 是一种交互式定理证明器,能自动检查证明的正确性,避免了自然语言推理中常见的幻觉和逻辑错误。不过,系统整体成功率仅为2.5%,意味着大部分尝试仍以失败告终。
中文圈视角
对中文数学研究社区而言,AlphaProof Nexus 的意义在于它展示了 AI 在形式化数学证明上的突破。国内数学研究者长期依赖人工推理,而 Lean 等工具的使用门槛较高。AlphaProof Nexus 的成功可能推动更多中文数学团队采用形式化验证方法,尤其是在组合数学和数论领域。
然而,目前系统成功率仅2.5%,且成本虽低但需大量计算资源,国内研究者若想复现或改进,需关注 Google 是否开放模型权重或 API。相比之下,国内如华为的 MindSpore 和百度的 PaddlePaddle 在 AI for Science 方面也有布局,但尚未有类似级别的数学证明成果。此外,Lean 的中文文档和社区支持较弱,可能成为普及障碍。
几条值得记住的细节
- AlphaProof Nexus 解决了9个 Erdős 问题,其中两个悬而未决56年。
- 每个问题的推理成本仅数百美元,远低于传统超级计算机方法。
- 系统使用 Lean 编译器自动验证每一步证明,而非自然语言推理。
- 整体成功率仅为2.5%,表明 AI 数学证明仍有很大提升空间。
- 该成果由 Google DeepMind 团队完成,论文和部分代码可能后续公开。
一句话总结
AI 能以极低成本解决长期未解数学难题,但成功率低,距离替代人类数学家还很远。