一种算法已经被创造出来,可以快速扫描含有任何自然元素的假设晶体结构,并找到那些可能是稳定的。该程序通过机器学习对14万种材料的数据集进行训练,预测几乎与量子化学模拟一样准确,而且效率要高得多。研究人员搜索了3100万个潜在结构,发现了180万个稳定的结构。这样的搜索可能会为多种应用找到更好的材料。

Schrödinger方程对于比氢原子更复杂的化学系统是无法解的。因此,化学家经常依赖于从头算电子密度模拟,如DFT来计算多电子系统的性质。这些可以非常精确,但是,在大型多原子系统中,例如晶体,它们的计算成本非常高。“根据经验,DFT可以用于任何单位细胞中原子少于1000个的材料,”他说王淑萍“但它的可伸缩性很差,你不能轻易地对数百万种材料进行DFT,即使它们是简单的材料。”

原子间势通过简单地考虑原子在不同环境中的势能面形状来简化这一问题。为了了解这个势能曲面的形状,研究人员依靠机器学习算法。“说你对碳感兴趣,”Ong说。“所以,也许你可以对碳的不同结构进行DFT计算,以得到能量和力。然后你使用这些数据来训练机器学习潜力,但这种潜力不适用于硅或碳化硅。你必须重复整个化学训练过程。”

精神胜于物质

为了克服这一限制,Ong和他的项目科学家陈气使用图神经网络,这是一种机器学习方法,将图表示与松散地模仿大脑的算法相结合。他们从材料项目(2011年启动的开源数据库)中140,000个已知和假设无机结构的能量和原子间作用力的DFT计算开始。这些作为训练数据的图形神经网络算法称为M3GNet该系统自学了如何推断特定元素的给定原子可能以不同的构型表现。结果是M3GNet“通用原子间相互作用势”控制着89种不同元素之间的相互作用。

研究人员选取了5283个晶体的任意结构。他们首先使用M3GNet来找到近似的基态。M3GNet的“基态”随后被DFT再次放松,以找到更准确的基态。M3GNet对任意结构的弛豫使晶体的能量降低至少是随后DFT弛豫的10倍。这表明M3GNet几乎和DFT一样找到了系统的基态,但计算成本要低得多——K的结构57Se34岁,例如,最初在32核处理器上用DFT计算需要15小时,而在单核笔记本电脑上用M3GNet计算只需22秒。Ong说,现在,成千上万的原子是可行的。“我们正在对使用gpu的代码进行改进,这将使拥有超过10万个原子的系统变得更加可行。”

此外,陈驰,现在在微软量子他说,两阶段放松有优势。“对于许多结构,DFT计算会陷入局部极小值。与单独进行DFT松弛相比,M3GNet松弛之后再进行DFT松弛得到的能量更低。”

绘制材料空间

M3GNet搜索3100万个假设的晶体结构在单位细胞中有50个或更少的原子时,发现大约180万个原子可能是稳定的。研究人员使用DFT分析了其中的2000例,其中1578例的稳定性预测与DFT一致。研究人员还使用M3GNet来预测材料的弹性和声子色散曲线,这对于确定诸如动态稳定性和热导率等特性非常重要,在这两种情况下,他们发现与DFT有很好的一致性。

研究人员现在希望该算法可以找到有用的新材料。Ong说,这项工作没有综合。DFT是基准。但我希望其中一些预测最终能被实验证实。例如,我研究锂离子电池。你通常感兴趣的特性之一是锂离子的导电性。我们的万能电势可以与元素周期表中的任何元素组合一起工作,因此可以用来模拟任何潜在的锂离子电池材料。”

“这是非常令人印象深刻的工作,”他说巴勃罗Piaggi新泽西州普林斯顿大学教授。“分子模拟中的深度学习通常用于研究特定物质和极少数化学元素。在这篇论文中,他们走了完全相反的方向……总的来说,我的印象是,这项工作在预测新化合物方面具有巨大的潜力,在不同的应用中,它可能会超过已知的材料。”