奥地利研究人员的一种新的深度学习算法对许多不同的分子产生了比以往更精确的Schrödinger方程的数值解,计算成本相对较低。令人惊讶的是,研究人员发现,尽管对算法进行一些“预训练”可以提高其预测能力,但更大量的训练是有害的。

随着Schrödinger方程可以解析求解只有氢原子,研究人员希望估计分子的能量被迫依赖于数值方法。更简单的近似方法,如密度泛函理论和哈特里-福克方法(几乎与Schrödinger方程本身一样古老),可以处理更大的系统,但往往给出不准确的结果。新的技术,如完全有源空间自洽场(CASSCF),使结果更接近实验,但需要更多的计算。

为了更快地找到分子波函数的更精确解,研究人员开发了深度学习算法,对多个点的能量进行采样,并自学搜索分子的基态。“通常情况下,人们一直在运行一个已建立的数值方案,然后使用机器学习算法来尝试了解缺失的细节,”解释道菲利普Grohs维也纳大学教授。

目前该领域的两个领先的机器学习算法是由谷歌开发的FermiNetDeepMind以及由柏林研究人员生产的PauliNet。FermiNet具有更简单、更高效的结构,并倾向于获得更准确的解决方案,而PauliNet则从已建立的方案中提供更多关于解决方案应该大致是什么样子的细节,因此往往工作得更快。

Grohs和维也纳大学的同事们利用Ferminet的简单结构开发了一种算法,但结合了PauliNet中最初用于计算分子中原子构型的SchNet元素。“我们试图通过使用SchNet的想法来更好地模拟粒子相互作用,”解释说利昂·杰拉德.与FermiNet或PauliNet相比,最终的算法获得了更高的精度,所需的计算资源更少,适用于从氮和水到苯和甘氨酸的各种分子。

研究人员测试了“预训练”步骤的效果,他们使用Hartree-Fock或CASSCF来教会算法在搜索基态时找到一个“合适的”起点。出乎意料的是,他们发现,尽管少量的预训练步骤可以提高性能,但过多的预训练会导致算法错过实际的基态。此外,当他们使用CASSCF训练算法时,这比使用Hartree-Fock训练算法时更明显。原因尚不清楚。作者解释说:“CASSCF在波函数上施加了更多的结构——所以可能有更多的节点和更复杂的形状,所以如果神经网络学习到一些复杂和错误的东西,它可能会学习到一些更难逃脱的东西——但我不认为我们在这一点上真的知道。迈克尔Scherbela

艾萨克Tamblyn加拿大渥太华大学能源与纳米科学计算实验室的研究员,他没有参与这项工作,他将其描述为“比目前的技术水平更好”,尽管他并不认为引入先验知识的反直觉效果特别令人惊讶。他说:“在优化文献中有很多例子,你可以尝试合并你认为有用的初始化,最终使情况变得更糟。”他将这项工作描述为“白金标准”,但他指出,虽然它可能比FermiNet等方法更有效,但在GPU上计算单个分子的性质仍然需要几天的时间。因此,他认为它的主要用途可能在于为近似方法(如监督机器学习)生成高度准确的训练数据。