Google DeepMind AlphaProof Nexus 以数百美元成本自动解决56年未解数学难题

一句话看懂

Google DeepMind 的 AlphaProof Nexus 以每个问题仅数百美元的推理成本，自主解决了9个开放 Erdős 问题，包括两个56年未解的数学难题。

详细发生了什么

Google DeepMind 发布了 AlphaProof Nexus，一个能自主解决数学难题的 AI 系统。它成功攻克了9个开放 Erdős 问题——这些是著名数学家 Paul Erdős 提出的悬赏问题，其中两个已经56年无人能解。每个问题的推理成本仅需几百美元，远低于传统人力或计算密集型方法。

与 OpenAI 使用自然语言推理的方式不同，AlphaProof Nexus 采用 Lean 编译器来验证每一个证明步骤，确保数学严谨性。Lean 是一种交互式定理证明器，能自动检查证明的正确性，避免了自然语言推理中常见的幻觉和逻辑错误。不过，系统整体成功率仅为2.5%，意味着大部分尝试仍以失败告终。

中文圈视角

对中文数学研究社区而言，AlphaProof Nexus 的意义在于它展示了 AI 在形式化数学证明上的突破。国内数学研究者长期依赖人工推理，而 Lean 等工具的使用门槛较高。AlphaProof Nexus 的成功可能推动更多中文数学团队采用形式化验证方法，尤其是在组合数学和数论领域。

然而，目前系统成功率仅2.5%，且成本虽低但需大量计算资源，国内研究者若想复现或改进，需关注 Google 是否开放模型权重或 API。相比之下，国内如华为的 MindSpore 和百度的 PaddlePaddle 在 AI for Science 方面也有布局，但尚未有类似级别的数学证明成果。此外，Lean 的中文文档和社区支持较弱，可能成为普及障碍。

几条值得记住的细节

AlphaProof Nexus 解决了9个 Erdős 问题，其中两个悬而未决56年。
每个问题的推理成本仅数百美元，远低于传统超级计算机方法。
系统使用 Lean 编译器自动验证每一步证明，而非自然语言推理。
整体成功率仅为2.5%，表明 AI 数学证明仍有很大提升空间。
该成果由 Google DeepMind 团队完成，论文和部分代码可能后续公开。

一句话总结

AI 能以极低成本解决长期未解数学难题，但成功率低，距离替代人类数学家还很远。