陶哲轩谈 AI、开普勒与科学发现:为什么真正的突破无法被快速验证替代
基于陶哲轩与 Dwarkesh Patel 的一段长对话,提炼 AI 时代科学发现最关键的八个判断:验证比生成更稀缺,正确不等于理解,混合式研究长期仍将占主导。
BenszConan
管理员
文章目录 ⌄
陶哲轩谈 AI、开普勒与科学发现
视频来源:Terence Tao – How the world's top mathematician uses AI
频道:Dwarkesh Patel
时长:1:23:44
发布日期:2026-03-20
这段对话最值得记住的观点
科学发现的瓶颈,未必是“想法不够多”,而是“验证、筛选与理解跟不上”
陶哲轩借开普勒的故事提醒我们:一个看似正确的规律,往往不是通过几轮快速试错就能稳定获得。开普勒拿到第谷更高精度的数据之后,仍然花了很多年,才从错误但优美的理论走向更接近真实的椭圆轨道。
这对应到今天的 AI 时代,关键问题并不只是“能不能批量生成更多假说”,而是:
- 哪些值得继续验证;
- 哪些只是数值巧合;
- 哪些虽然一开始表现更差,却其实更接近真相。
换句话说,AI 让“提出理论”的成本迅速下降,但科学共同体真正缺的,反而是大规模的验证、过滤和判断机制。
更正确的理论,早期可能反而更差
对话里有一个很重要、也很反直觉的判断:最终正确的理论,在早期常常看起来更弱。
陶哲轩举的例子很经典。哥白尼的日心说在刚提出时,预测精度其实不如经过长期修补的托勒密地心体系。旧理论虽然错,但已经被无数补丁“打磨”得很能回答眼前问题;新理论虽然方向更对,却还没发展完整,所以短期里甚至显得更糟。
这件事对 AI 科学发现尤其重要。因为如果我们只奖励“立刻更准、立刻更强”的结果,可能会系统性错过那些真正有潜力、但尚未成熟的新框架。
开普勒的成功,不只是暴力搜索,而是带着审美、直觉与执念去试错
从字幕看,陶哲轩并不否认开普勒做过很多今天看来很“高温”、甚至近似随机的尝试。但他强调,这些尝试之所以没有沦为纯粹胡猜,是因为背后同时存在:
- 第谷几十年积累的高质量观测数据;
- 开普勒本人持续的几何直觉与问题意识;
- 对失败模型的长期修正,而不是一次没中就放弃。
所以,真正推动发现的,不是简单的“随机生成 + 自动验证”,而是数据、理论、直觉、耐心一起作用。这里面那种半直觉、半形式化的判断,很难直接被当下的强化学习流程完整复刻。
AI 论文和想法会越来越多,但真正的突破会越来越难识别
陶哲轩认为,AI 已经把“想法生成”的成本压到了接近零。问题是,科学界原有的同行评审与出版机制,是为一个低产出、高手工筛选的时代建立的;当海量 AI 生成内容涌入后,人类审稿人与编辑会很快被淹没。
因此,未来最关键的问题之一不是“AI 会不会提出一百万个新理论”,而是:
- 我们怎样知道哪一个是下一个 Shannon 的 bit;
- 怎样在大量噪声里识别真正具有统一力的概念;
- 怎样避免整个科学系统被表面上很像进展的内容拖慢。
即使 AI 解出了难题,人类也未必自动获得理解
对话中还有一个特别深的担忧:假设未来 AI 在 Lean 或别的形式系统中给出了某个重大猜想的证明,人类是否就等于“理解了”这个问题?陶哲轩的回答并不乐观。
有些定理也许可以被蛮力式、分情形式、极不优雅地解决。四色定理就是前例。因此,即使 AI 给出正确答案,答案也可能只是“可验证”,却不一定自动转化为人类可迁移、可复用、可讲述的新数学理解。
这意味着,正确 和 理解 不是一回事;未来数学中最珍贵的能力,可能恰恰是把机器产出的正确结果,重新翻译成人类能消化的概念结构。
科学家之间需要一种“半形式化语言”来连接证明、猜想与直觉
陶哲轩提出了一个很有启发性的方向:现在我们已经能把“证明”形式化,但还很难把“为什么这个方向值得试”“这个猜想为什么看起来越来越可信”“哪些叙述只是启发、哪些已经接近严格论证”这样的内容形式化。
而现实中的科学合作,恰恰大量依赖这种半正式交流。研究者不是只交换最终证明,也在交换:
- plausibility(可信度判断);
- strategy(策略);
- narrative(叙述框架);
- intuition(直觉)。
如果未来能发展出这种介于自然语言与严格证明之间的表达层,AI 参与高水平科学发现的方式可能会发生质变。
数学的中短期未来,更像“人类 + AI”的混合工作制,而不是 AI 单独接管
在对未来的判断上,陶哲轩并不认为 AI 很快会完整替代顶尖数学家。他更倾向于一种长期的混合模式:人类负责提出问题、组织意义、形成判断;AI 负责并行试探、检索、计算、生成草图、提供不同角度的候选路径。
这不是“AI 像人一样做数学”,而更像是人类第一次拥有了一套非常强、但能力结构极不均衡的新型智力工具箱。
高效利用时间,不只是优化,更要给偶然性留位置
最后一个让我印象很深的点,反而不是 AI,而是陶哲轩谈自己的时间管理。他明确说自己相信 serendipity,也就是“有益的偶然性”。
他会精细安排一部分时间,但也会故意留下不那么高效、甚至可能白费的空间。因为很多真正重要的启发,不来自最优化排程,而来自:
- 偶然遇到的人;
- 本来没打算读到的一篇文章;
- 看似低效但能带来新刺激的环境变化。
这和前面对科学发现的讨论是呼应的:太强的优化,可能反而会压扁真正的创造性。
我的提炼
如果只用一句话概括这段对话,那就是:
AI 可以大幅放大“生成候选答案”的能力,但科学发现最难的部分,依然是人类如何在噪声里识别方向、在正确里提炼理解、在高效率之外保留直觉与偶然性。
开普勒的故事说明,真正的突破从来不只是算得更快,而是有人在漫长的不确定里,坚持一个还无法被完整证明的方向感。至少在可预见的未来,这种能力仍然很难被简单算法化。

评论区
0 条评论