使用机器学习的三组,包括IBM和DeepMind研究员,模拟原子和小分子比现有的量子化学方法更准确。在单独的文件arXiv预印本服务器团队每个使用神经网络来表示分子的原子周围的电子波函数。这个波函数的数学解薛定谔方程,它描述了在哪里可以找到电子的概率在分子。它提供了诱人的希望彻底解决化学的,完整准确地模拟反应。通常这一目标还需要大量的计算能力。现在新的研究提供了一个妥协的相对精度高在一个合理的处理能力。

每组只模拟简单的系统,与乙烯最复杂,他们都强调,方法是在非常早期阶段。“如果我们能够了解材料在最基本的工作,原子水平,我们可以更好的设计从光伏到药物分子,”说詹姆斯•斯宾塞从DeepMind在伦敦,英国。虽然这项工作没有实现,然而,我们认为这是在这个方向上迈出的一步。”

两种方法出现在arXiv几天在2019年9月,结合深机器学习和量子蒙特卡罗(QMC)方法。DeepMind研究员的一部分字母集团公司拥有谷歌,和伦敦帝国学院的电话他们的费米净。他们发布了一个更新的预印纸描述在2020年3月初1弗兰克•诺伊柏林自由大学的团队,德国,电话直接的方法,结合物理知识波函数,PauliNet2

同一个月晚些时候,一个团队包括每个来自IBM和熨斗研究所的一位研究人员都在纽约,我们,和苏黎世大学,瑞士,公布了机器学习的方法3它适应的方法模拟分子量子计算经典计算机,并使用QMC来优化搜索结果。

在化学、深度学习可以解决电子围绕原子的薛定谔方程,发现他们的波函数几乎完全,诺伊说。求解薛定谔方程本质上意味着找到一个函数指定位置的电子分子更可能不太可能,”他解释说。也很难计算准确除了氢原子波函数的解决方案,但量子化学算法可以近似。

等传统算法的耦合簇方法从评价一个波函数组件称为斯莱特行列式,诺解释道。如果我们想要真正准确、可靠解薛定谔方程,那么这样的组件的数量呈指数级增长的电子。五电子,所以它没有问题几乎不可行的10,可能20。许多算法面临的关键挑战是效率和准确性之间的权衡的波函数的近似,或“拟设”。

的神经网络显示令人印象深刻的能力一样精确函数近似者和承诺作为自旋系统,紧凑的波函数拟设“DeepMind团队写的arXiv纸。许多组织已经使用深层神经网络来解决问题在量子力学中,“DeepMind的补充道大卫Pfau。最近的活动是2017年由一个方法由朱塞佩Carleo和马提亚泰勒瑞士苏黎世联邦理工学院的,然后他说。4然而,化学系统更难处理由于泡利不相容原理,在两个电子不可能在同一地点同时,Pfau说。这介绍了复杂的约束,这意味着你不能用一个现成的神经网络。

量子蒙特卡罗的胜利

DeepMind因此建立了一个定制的深层神经网络来处理复杂的计算需要满足泡利不相容原理。他们用一个历史悠久的方法称为变分QMC。

“首先,你有一个初始猜测系统的状态,”斯宾塞解释道。估计包括化学系统的波函数和能量。“你随机样本可能配置的电子从这个概率分布,然后计算平均能量所有这些不同的系统配置。然后你从最初想迈出一小步,稍微低一些的能量,和一遍又一遍重复整个过程。你继续这样做,直到不能再低了。上面的变分方法永远是化学的能量系统的一部分,真正的解薛定谔方程,通常远远高于简单的版本,他补充道。但如果你让你的猜测变得太复杂,它可能是笨拙或棘手的找到最好的一个。”

Pfau补充说,费米净击中甜蜜点:足够复杂,它能非常精确的能量,但不是这么复杂,优化是不可能的。他和他的同事使用深层神经网络学习训练他们把电子的性质,如原子的原子核,距离波函数。你可以使变分QMC方法更准确如果使用深层神经网络作为一个近似系统的量子态,所以更准确,你可以匹配,甚至在某些情况下超过的准确性更复杂的方法,”他说。

DeepMind团队声称所有的三个团队的最大精度。所需的计算能力实现这一既不过度也无关紧要,与模拟的乙烯两天的神经网络训练和八个图形处理单元(GPU)。例如,费米净氮分子的离解曲线预测的准确性明显高于耦合簇方法,Pfau说。

一个图像显示费米净

来源:©DeepMind

费米净接近氮气分子使用变分波函数的量子蒙特卡罗抽样

挪亚的团队使用了一个类似的神经网络和变分QMC的组合。我们使用深层神经网络以一种非常灵活的方式来表示我们的波函数,”诺解释道。个人斯莱特行列式的价格是更昂贵的比标准的量子化学计算。但是收获是我们需要许多少等基本计算例如约5至20,而不是数千甚至数百万个分子实现精度所示预印本。

然而,PauliNet的设计编码更多关于波函数的物理知识,这使得它更快。挪亚的小组研究了氢分子,氢化锂、铍、硼原子和十氢链的线性链原子。对于这些系统,PauliNet可能达到99.9%正确的能源在数十分钟内一个GPU上几个小时。与其他同样数量的斯莱特行列式,QMC方法更准确,研究小组写道。密度泛函理论(DFT)是正常的规则的一个例外成倍增加的计算成本,诺伊说,因此到目前为止最受欢迎的量子化学方法。深深的QMC比DFT更贵,但可以多,更准确的成本比其他量子化学方法相似,”他评论。

一个图像显示深度学习结合量子蒙特卡罗技术

来源:©弗兰克•诺伊

像DFT,结合深度学习与量子蒙特卡罗技术提供了一个伟大的精确度的计算成本

柏林的团队正在致力于更大的系统非常有前景的结果,诺伊说。如果我们可以扩展quasi-accurate解决方案的电子薛定谔方程50 - 100电子我们可以涵盖各式各样的化学,“包括有机小分子,他补充道。傅DeepMind费米净和柏林PauliNet执行非常相似的如果你在相同的时间训练他们,诺伊说。PauliNet需要较少的参数和物理内存,因为它有很多内置的,他补充说。我们可以看到很多可能性相结合的方法来提高思想PauliNet和费米净”。

自旋在哪里来

同时,Carleo,有从苏黎世联邦理工学院计算中心的量子物理学熨斗研究所已经与安东尼奥Mezzacapo来自IBM和肯尼Choo来自苏黎世大学。Carleo和泰勒2017年的论文使用机器学习在lattice-based相互作用的量子系统解薛定谔方程,基于自旋属性,第一次。但由于泡利不相容原理的的问题产生的神经网络通常不能适用于电子轨道。但是Mezzacapo工作方法用于量子计算地图上系统,如电子轨道上spin-based框架。当Mezzacapo Carleo举行了一次会议,他们意识到他们可以结合这两个概念在神经网络模拟化学。

Carleo指出,不像PauliNet和费米净,他的团队的方法包括一个电子轨道的直接表示。4对他们来说电子只是在自由空间作为一个粒子,可以不断移动,”他说。否则方法同样使用神经网络作为他们应用变分QMC,拟设Choo解释道。

我们发现这种神经网络可以执行比一些更标准的化学技术耦合的集群,在一些分子二聚体,“Choo说。特别是在这种情况下,电子高度相关的属性,如氮分子的离解或一对碳原子成键,Mezzacapo补充道。Carleo认为,在选定的一组轨道方法甚至比PauliNet更准确和费米净。在未来,我们会理解这两个哲学中的一个更有效的研究这些分子系统,”他说。此刻,我想说没有一个强有力的理由。”

到目前为止的映射方法只涉及单个层模拟神经元,因此不算深度学习,它使用几层。使用一个更复杂的体系结构是对球队接下来的步骤之一,Choo说。诺伊说,补充PauliNet和FermiNet映射方法。是否将很好地扩展到大型分子的方法还不清楚,但这是一个非常优雅的方法,绝对值得跟进,”诺说

对于自旋系统,Carleo已经能够把他2017年初始结果几个粒子和规模模拟成千上万的今天。他警告说,计算电子行为的一个或两个数量级的困难,但仍对他们的前景表示乐观。“我认为同样的事情也会发生在这种情况下,我希望,我们将从这些第一次应用到更大的系统,”他说。

Pfau同意的方法蕴含着巨大的希望。很高兴看到这么多活动。希望这只是一个开始。”