陶哲轩谈 AI、开普勒与科学发现

视频来源：Terence Tao – How the world's top mathematician uses AI
频道：Dwarkesh Patel
时长：1:23:44
发布日期：2026-03-20

这段对话最值得记住的观点

科学发现的瓶颈，未必是“想法不够多”，而是“验证、筛选与理解跟不上”

陶哲轩借开普勒的故事提醒我们：一个看似正确的规律，往往不是通过几轮快速试错就能稳定获得。开普勒拿到第谷更高精度的数据之后，仍然花了很多年，才从错误但优美的理论走向更接近真实的椭圆轨道。

这对应到今天的 AI 时代，关键问题并不只是“能不能批量生成更多假说”，而是：

哪些值得继续验证；
哪些只是数值巧合；
哪些虽然一开始表现更差，却其实更接近真相。

换句话说，AI 让“提出理论”的成本迅速下降，但科学共同体真正缺的，反而是大规模的验证、过滤和判断机制。

更正确的理论，早期可能反而更差

对话里有一个很重要、也很反直觉的判断：最终正确的理论，在早期常常看起来更弱。

陶哲轩举的例子很经典。哥白尼的日心说在刚提出时，预测精度其实不如经过长期修补的托勒密地心体系。旧理论虽然错，但已经被无数补丁“打磨”得很能回答眼前问题；新理论虽然方向更对，却还没发展完整，所以短期里甚至显得更糟。

这件事对 AI 科学发现尤其重要。因为如果我们只奖励“立刻更准、立刻更强”的结果，可能会系统性错过那些真正有潜力、但尚未成熟的新框架。

开普勒的成功，不只是暴力搜索，而是带着审美、直觉与执念去试错

从字幕看，陶哲轩并不否认开普勒做过很多今天看来很“高温”、甚至近似随机的尝试。但他强调，这些尝试之所以没有沦为纯粹胡猜，是因为背后同时存在：

第谷几十年积累的高质量观测数据；
开普勒本人持续的几何直觉与问题意识；
对失败模型的长期修正，而不是一次没中就放弃。

所以，真正推动发现的，不是简单的“随机生成 + 自动验证”，而是数据、理论、直觉、耐心一起作用。这里面那种半直觉、半形式化的判断，很难直接被当下的强化学习流程完整复刻。

AI 论文和想法会越来越多，但真正的突破会越来越难识别

陶哲轩认为，AI 已经把“想法生成”的成本压到了接近零。问题是，科学界原有的同行评审与出版机制，是为一个低产出、高手工筛选的时代建立的；当海量 AI 生成内容涌入后，人类审稿人与编辑会很快被淹没。

因此，未来最关键的问题之一不是“AI 会不会提出一百万个新理论”，而是：

我们怎样知道哪一个是下一个 Shannon 的 bit；
怎样在大量噪声里识别真正具有统一力的概念；
怎样避免整个科学系统被表面上很像进展的内容拖慢。

即使 AI 解出了难题，人类也未必自动获得理解

对话中还有一个特别深的担忧：假设未来 AI 在 Lean 或别的形式系统中给出了某个重大猜想的证明，人类是否就等于“理解了”这个问题？陶哲轩的回答并不乐观。

有些定理也许可以被蛮力式、分情形式、极不优雅地解决。四色定理就是前例。因此，即使 AI 给出正确答案，答案也可能只是“可验证”，却不一定自动转化为人类可迁移、可复用、可讲述的新数学理解。

这意味着，正确和理解不是一回事；未来数学中最珍贵的能力，可能恰恰是把机器产出的正确结果，重新翻译成人类能消化的概念结构。

科学家之间需要一种“半形式化语言”来连接证明、猜想与直觉

陶哲轩提出了一个很有启发性的方向：现在我们已经能把“证明”形式化，但还很难把“为什么这个方向值得试”“这个猜想为什么看起来越来越可信”“哪些叙述只是启发、哪些已经接近严格论证”这样的内容形式化。

而现实中的科学合作，恰恰大量依赖这种半正式交流。研究者不是只交换最终证明，也在交换：

plausibility（可信度判断）；
strategy（策略）；
narrative（叙述框架）；
intuition（直觉）。

如果未来能发展出这种介于自然语言与严格证明之间的表达层，AI 参与高水平科学发现的方式可能会发生质变。

数学的中短期未来，更像“人类 + AI”的混合工作制，而不是 AI 单独接管

在对未来的判断上，陶哲轩并不认为 AI 很快会完整替代顶尖数学家。他更倾向于一种长期的混合模式：人类负责提出问题、组织意义、形成判断；AI 负责并行试探、检索、计算、生成草图、提供不同角度的候选路径。

这不是“AI 像人一样做数学”，而更像是人类第一次拥有了一套非常强、但能力结构极不均衡的新型智力工具箱。

高效利用时间，不只是优化，更要给偶然性留位置

最后一个让我印象很深的点，反而不是 AI，而是陶哲轩谈自己的时间管理。他明确说自己相信 serendipity，也就是“有益的偶然性”。

他会精细安排一部分时间，但也会故意留下不那么高效、甚至可能白费的空间。因为很多真正重要的启发，不来自最优化排程，而来自：

偶然遇到的人；
本来没打算读到的一篇文章；
看似低效但能带来新刺激的环境变化。

这和前面对科学发现的讨论是呼应的：太强的优化，可能反而会压扁真正的创造性。

我的提炼

如果只用一句话概括这段对话，那就是：

AI 可以大幅放大“生成候选答案”的能力，但科学发现最难的部分，依然是人类如何在噪声里识别方向、在正确里提炼理解、在高效率之外保留直觉与偶然性。

开普勒的故事说明，真正的突破从来不只是算得更快，而是有人在漫长的不确定里，坚持一个还无法被完整证明的方向感。至少在可预见的未来，这种能力仍然很难被简单算法化。

陶哲轩谈 AI、开普勒与科学发现：为什么真正的突破无法被快速验证替代

陶哲轩谈 AI、开普勒与科学发现

这段对话最值得记住的观点

科学发现的瓶颈，未必是“想法不够多”，而是“验证、筛选与理解跟不上”

更正确的理论，早期可能反而更差

开普勒的成功，不只是暴力搜索，而是带着审美、直觉与执念去试错

AI 论文和想法会越来越多，但真正的突破会越来越难识别

即使 AI 解出了难题，人类也未必自动获得理解

科学家之间需要一种“半形式化语言”来连接证明、猜想与直觉

数学的中短期未来，更像“人类 + AI”的混合工作制，而不是 AI 单独接管

高效利用时间，不只是优化，更要给偶然性留位置

我的提炼

同频道推荐

评论区

陶哲轩谈 AI、开普勒与科学发现：为什么真正的突破无法被快速验证替代

1 陶哲轩谈 AI、开普勒与科学发现

1.1 这段对话最值得记住的观点

1.1.1 科学发现的瓶颈，未必是“想法不够多”，而是“验证、筛选与理解跟不上”

1.1.2 更正确的理论，早期可能反而更差

1.1.3 开普勒的成功，不只是暴力搜索，而是带着审美、直觉与执念去试错

1.1.4 AI 论文和想法会越来越多，但真正的突破会越来越难识别

1.1.5 即使 AI 解出了难题，人类也未必自动获得理解

1.1.6 科学家之间需要一种“半形式化语言”来连接证明、猜想与直觉

1.1.7 数学的中短期未来，更像“人类 + AI”的混合工作制，而不是 AI 单独接管

1.1.8 高效利用时间，不只是优化，更要给偶然性留位置

1.2 我的提炼

同频道推荐

评论区

陶哲轩谈 AI、开普勒与科学发现

这段对话最值得记住的观点

科学发现的瓶颈，未必是“想法不够多”，而是“验证、筛选与理解跟不上”

更正确的理论，早期可能反而更差

开普勒的成功，不只是暴力搜索，而是带着审美、直觉与执念去试错

AI 论文和想法会越来越多，但真正的突破会越来越难识别

即使 AI 解出了难题，人类也未必自动获得理解

科学家之间需要一种“半形式化语言”来连接证明、猜想与直觉

数学的中短期未来，更像“人类 + AI”的混合工作制，而不是 AI 单独接管

高效利用时间，不只是优化，更要给偶然性留位置

我的提炼