AI 自主推翻 Erdős 单位距离猜想:80 年未解难题的代数数论突破

论文链接:https://openai.com/index/model-disproves-discrete-geometry-conjecture/

深度分析:https://arstechnica.com/ai/2026/06/openais-math-breakthrough-played-to-ais-strengths/

原始发布日期:2026-05-20 | 深度分析:2026-06-01


📌 核心问题

1946 年,数学家 Paul Erdős 提出了一个看似简单的问题:在平面上放置 n 个点,最多能有多少对点之间的距离恰好为 1?这就是组合几何中最著名的「单位距离问题」。80 年来,数学家们普遍相信 Erdős 的猜想——答案的增长速率接近 n^(1+o(1)),即略快于线性增长。

2026 年 5 月 20 日,OpenAI 宣布其内部通用推理模型自主推翻了这一猜想。这不是一个专门针对数学的系统,不是经过证明搜索微调的工具,而是一个通用推理模型在评估 Erdős 问题集时,自主找到了反例。这是历史上第一次,一个重要的开放数学猜想被 AI 系统自主解决。

更令人震惊的是证明的方法:AI 将代数数论中无限类域塔和 Golod-Shafarevich 理论等深奥工具,创造性地应用于欧几里得平面的几何问题。这种跨领域的意外连接,连专业数学家都始料未及。


📊 关键数据

  • Erdős 猜想(1946):单位距离对数上界为 n^(1+o(1))
  • AI 构造:对无穷多个 n,单位距离对数 ≥ n^(1+δ),δ > 0(固定常数)
  • Will Sawin 后续精化:δ ≈ 0.014(即 n^1.014),彻底推翻 Erdős 猜想
  • 此前最佳下界:自 1946 年 Erdős 构造以来基本未变,来自缩放方格网格
  • 最佳上界:O(n^(4/3)),1984 年 Spencer-Szemerédi-Trotter,至今未改进
  • 证明验证:由一组外部数学家独立审阅确认,Tim Gowers(菲尔兹奖得主)称其为「AI 数学的里程碑」

🏗️ 技术架构与证明设计

  • 核心思路:将高斯整数(a+bi)替换为更复杂的代数数域推广,利用其更丰富的对称性创造更多单位距离差
  • 关键工具:无限类域塔(infinite class field towers)+ Golod-Shafarevich 理论,证明所需数域的存在性
  • 构造方法:在高维空间中构建网格,然后投影到二维平面,利用代数整数构建比整数格点更复杂的网格结构
  • 证明来源:通用推理模型(非数学专用系统),在 Erdős 问题集上自主产生完整证明
  • 人类补充:Princeton 教授 Will Sawin 给出显式 δ=0.014,Thomas Bloom 等撰写配套论文阐释证明意义

🔑 关键洞察

AI 的知识广度正在成为数学研究的新变量

证明的关键在于将代数数论的深奥工具应用于组合几何——这种跨领域连接是最令人惊讶的部分。人类数学家往往深耕某一领域,而 AI 系统天然具备跨领域的知识广度。正如 Thomas Bloom 所说:「代数数论对这类问题能说的远比我们猜想的多,而且所需的数论可以非常深刻。」这暗示 AI 可能正在开启一种新的数学发现范式:不是发明新工具,而是发现已有工具的意外用途。

从「辅助工具」到「自主研究者」的质变时刻

Daniel Litt(多伦多大学教授)评价:「这是第一个我作为结果本身感到兴奋的 AI 产出,而不仅仅是作为先兆指标。」此前 AI 在数学领域的贡献都需要大量人类诠释才能变成可发表的定理,而这次 AI 直接给出了完整的、经过专家验证的证明。这标志着 AI 在数学研究中角色的根本转变——从工具到合作者。

推理能力的指数级进步仍在加速

Ars Technica 的分析指出:三年前 LLM 还在为算术题挣扎,去年才开始在高中数学竞赛中崭露头角,今年已能自主解决重要开放问题。这种进步速度意味着,十年后人类数学家的角色可能需要根本性重新定义。当前人机协作的甜蜜期(AI 搜索广度 + 人类思考深度)可能只是过渡阶段。

超越数学:推理能力的通用价值

OpenAI 在公告中强调:能够维持复杂论证的连贯性、连接遥远知识领域、产生经得起专家审查的工作——这些能力同样适用于生物学、物理学、材料科学、工程和医学。数学之所以特殊,是因为它提供了最清晰的推理测试平台:问题精确、证明可验证、长链论证必须从头到尾一致。这次突破证明,当前的推理系统已经具备了支撑真正前沿研究的能力。


💡 引发思考

这次突破的意义远超数学本身。它提出了一个根本性问题:当 AI 系统的知识广度和推理深度同时超越人类时,「专家」的定义是什么?当前的协作模式——AI 负责搜索和验证,人类负责选择问题和诠释结果——可能只是过渡阶段。Tim Gowers 在配套论文中写道,AI 正在「帮助我们更充分地探索人类几个世纪以来建造的数学大教堂;还有多少未被发现的奇迹在等待?」

对工程领域的启示同样深刻:如果 AI 能在最纯粹的推理领域——数学——做出原创贡献,那么在软件工程、系统设计、架构决策等需要长链推理的领域,AI 的潜力可能远未被充分释放。这不是遥远的未来,而是正在发生的现实。


📎 相关阅读


逍遥云初 | 2026.06.24