![]()
图源:Gemini
导读
有很多企业在做 AI for Science,但大多聚焦于医药、材料和大数据等实用方向,而在量子科学这种超硬核基础研究方向的探索非常难能可贵。
撰文 |袁岚峰
如果问近年来最热的科学领域是什么,那无疑是人工智能。不过,人工智能最大的用处是什么呢?
现在的最新趋势是,科学。
这话的意思是,大家逐渐认识到,最值得用AI去追求的东西就是科学成果,即AI for science,这比用AI聊天有价值得多。聊天聊得再好也不能产生新的知识,而科学是真能改变世界的。从科学到AI,又从AI到科学,闭环了。
有一点大多数人会感到吃惊的是,AI for science这个词是中国科学家提出来的!不久前,我在跟东方卫视合作的《锚点》节目中访问北京科学智能研究院理事长张林峰博士时谈到,2018年,中国科学院院士鄂维南和汤超等人在北京大学组织了一次会议,这个会议的名称就是AI for science。
鄂维南院士是著名的应用数学家、我的科大师兄,他在深度学习刚出来的时候就敏锐地意识到,许多领域的困难都可以归结为维数灾难,而深度神经网络正是提供了一个克服维数灾难的机会,因为它是一种逼近高维函数的方法。在他的指导下,张林峰等年轻科学家取得了很多突破,例如把高精度分子动力学模拟的原子数一下子提高了五个量级,获得2020年戈登·贝尔奖,这个奖被称为高性能计算应用最高奖。
这方面的研究对我来说其实非常熟悉,因为我的专业叫做理论与计算化学,分子动力学就是其中的一部分。理论与计算化学还有一部分叫做量子化学,即用量子力学原理直接计算原子分子体系的性质。今天,我们就来介绍一个量子化学的最新进展。
10月21日,来自字节跳动、伦敦国王学院和北京大学等单位的科学家在《Nature Communications》上发表了一篇文章,标题是《一种多分辨率、可系统改进的大规模表面化学计算量子嵌入方案》(A multi-resolution systematically improvable quantum embedding scheme for large-scale surface chemistry calculations)[1]
![]()
图片截取自Nature Communications
实际上,这里的关键是“可系统改进”。量子化学计算最大的好处是算得准,能够直接跟实验对照,而最大的困难是计算量随体系扩大增长得很快,所以对于比较大的体系就算不动了。
量子嵌入就是解决这个困难的一种思路,即把体系分成两部分,对最感兴趣的核心区域用高精度算法,对其他区域用低精度算法,然后想办法把两部分的结果缝合起来。比如说我们要研究一个分子吸附在一个表面上,那么这个分子以及它吸附的那一小块区域就是最值得关心的,用高精度算法,离得比较远的地方就不是那么重要,用低精度算法。
这样的量子嵌入方案以前就有,但它们不能“系统改进”。这是因为它们用的高精度算法其实并不是那么的高精度,例如最常用的密度泛函理论(DFT),其中仍然包括一些经验参数。它可以快速地得到一个还不错的结果,但如果真想把误差缩减到极小,就不知道该怎么办了。
这篇文章的突破,就是把量子嵌入中的高精度算法换成了真正意义的高精度,它的误差确实可以随着计算参数的提高而下降到极低,这就是“可系统改进”。具体而言,这种算法叫做CCSD(T),意思是包括单重激发(S)、双重激发(D)和部分三重激发(T)的耦合团簇法(coupled cluster,简称CC)。在我二十多年前读博士的时候,CCSD(T)就是最著名的精确量子化学方法,被广泛认为是“金标准”。但它实际用得并不多,为什么?因为计算量太大了,只能处理很小的体系。
那么,这篇文章的作者是如何迎难而上的?他们的方案叫做SIE,全称是systematically improvable quantum embedding,即“可系统改进的量子嵌入”。SIE用到很多理论方法,例如施密特分解、密度矩阵嵌入理论、浴自然轨道等等。限于篇幅,在这里不能详细介绍。但基本图景就是,通过这一系列理论创新,加上全面的GPU优化,他们成功地让很大的体系都能实现CCSD(T)的精度,让这个金标准适用到了以前不可思议的规模。
具体而言,他们用什么体系做了演示呢?是一个看起来很简单、但计算起来一点都不容易的体系:石墨烯上吸附一个水分子。请问,这个水分子最喜欢以什么样的构型待在石墨烯上?是两个氢原子朝下,氧原子朝上(称为两腿)?还是氧原子朝下,两个氢原子朝上(称为零腿)?还是两腿和零腿之间的某种状态?
实际上,这个问题以前是众说纷纭,不同的作者给出不同的结果。这是因为他们用的算法不同,模型大小也不同。请注意,我们其实没法模拟一个单个水分子加无穷多个碳原子的体系,我们能模拟的总是有限大小的体系。因此,这就存在一个体系规模收敛性的问题,只有当模型足够大,我们看到吸附能的计算值收敛了,才能相信结果的可靠性。但以前的计算要不就是模型不够大,要不就是算法不够精确,所以没有一个真正达到收敛的。
在这样的背景下,我们的SIE立功了。它把碳原子的数目扩展到了384,再加上一定的外推,求出了两腿和零腿以及其他若干种构型在体系无限大时的吸附能。在外推的过程中发现,水跟石墨烯的相互作用其实是相当长程的,作用距离超过1.8纳米,这意味着需要400多个碳原子。无怪乎以前的模拟都不准,因为它们离这个规模还远着呢!
SIE既然在高精度下算出了各种构型在体相极限时的吸附能,那就可以比较谁高谁低了。你猜结果是什么?是各种构型的吸附能都几乎相等!也就是说,水分子可以在石墨烯上自由翻滚,并不像以前想的那样倾向于某个构型。
从定性的角度看来,我觉得这个结果其实是相当符合直觉的。因为石墨烯没有极性,所以水分子在上面没有个偏好的角度,这很合理。而在一些极性表面,例如氮化硼或过渡金属二硫属化物,水分子就有倾向性了,这同样也很合理。
但这个计算绝不仅仅是得出了一个符合常理的结果,因为还有一些现象亟待SIE去解决。例如2022年发现了一种现象叫做量子摩擦,意思是碳纳米管内水分子流动受到的摩擦,随着碳纳米管直径的缩小是会降低,而不是升高。要理解这种现象,显然直觉就不够了,需要对很大的体系做十分精确的量子化学计算,这正是SIE有望大显身手的地方。
这项研究还有一个十分有趣的地方,就是第一单位是字节跳动这个企业。多年来,人们的印象是许多外国企业愿意投资做基础研究,例如贝尔实验室、IBM、谷歌,而中国企业大多只愿意做应用研究,能立刻赚钱的。但在AI for science的时代,像字节这样的中国企业在基础研究方面也大有进步。
实际上,字节跳动的AI for science研究从2021年就开始了。他们的代表性成果,除了这篇SIE,还有一大类是基于神经网络的量子蒙特卡洛方法(NNQMC)。前面我们说的CCSD(T)和DFT都是确定性算法,而量子蒙特卡洛是一种随机性算法,天然适合AI应用,所以近年来得到了巨大的关注。
NNQMC最大的好处,就是它算得特别准。有一个重要的指标叫做“化学精度”(chemical accuracy),一般取为1 kcal/mol,意思是对能量的计算精确到这个程度,就跟实验相当甚至比实验更高了。CCSD(T)之所以被称为金标准,就是因为它能系统地达到化学精度。但NNQMC更厉害,字节跳动的科学家发现,随着神经网络规模和计算资源的增加,它的精度能够持续提升,甚至比化学精度还高一个量级。[2][3]
![]()
图片截取自Nature Communications
由此可见,NNQMC有巨大的潜力,唯一的缺点就是算得慢。其实它大部分计算量,都消耗在计算二阶导数(即Laplacian)。字节跳动团队对此设计了一套前向传播计算框架,叫做Forward Laplacian,使NNQMC达到了十倍加速,从而能处理上百电子的体系[4]。这个框架已经广泛被业界采用,例如谷歌DeepMind 2024年在《Science》发表的NNQMC工作中,就用到了Forward Laplacian。
![]()
图片截取自Nature Machine Intelligence
还有一个有趣的发展是,NNQMC以前只能计算分子体系,字节跳动团队把它推广到了扩展体系。[5]例如大家可能都听说过魔角石墨烯体系,即两层转过特定角度的石墨烯摞在一起,听说过曹原等人在魔角石墨烯体系中发现了超导性。字节跳动团队把NNQMC用到了这个体系,从而能够研究其中的量子霍尔效应和拓扑绝缘体等神奇性质。[6][7][8]
![]()
图片截取自Nature Communications
作为量子化学专业的,我对这些进展十分感兴趣,因为愿意啃这种硬骨头的太少了。目前可以说有很多企业在做 AI for science,但大多聚焦于医药、材料和大数据等实用方向,而在量子科学这种超硬核基础研究方向的探索非常难能可贵。工欲善其事,必先利其器,在基础研究方面的突破,必将在将来带来更大的收获。
最后,我们来看一下大图景。AI for science是由中国科学家提出的,中国企业正在把它迅速推向前进。我们期待更多的人和组织对AI for science做出贡献,把人类文明推到新高度。
作者简介:
袁岚峰,中国科学技术大学合肥微尺度物质科学国家研究中心副研究员、科技传播系副主任、科学传播研究与发展中心副主任。
参考文献:
[1]https://www.nature.com/articles/s41467-025-64374-2[2]https://www.nature.com/articles/s41467-023-37609-3[3]https://arxiv.org/abs/2508.02570[4] https://www.nature.com/articles/s42256-024-00794-x[5] https://www.nature.com/articles/s41467-022-35627-1[6] https://www.nature.com/articles/s42005-025-02282-z[7]https://journals.aps.org/prl/abstract/10.1103/PhysRevLett.134.176503[8] https://arxiv.org/abs/2503.11756
相关文章
2025-11-217阅读
2025-11-217阅读
2025-11-217阅读
2025-11-217阅读
2025-11-217阅读
2025-11-217阅读
2025-11-217阅读
2025-11-217阅读
2025-11-217阅读
2025-11-217阅读