计算机在模拟化学方面做得越来越好。但仍有许多挑战需要克服。

计算化学正在迅速发展,提高了我们理解世界的能力。然而,这一进展引发了争论,即我们应该如何利用它来回答不同的问题,特别是考虑到工作中的竞争力量。

例如,在准确性和速度之间存在权衡,这有时会导致有争议的妥协。这些争论大多围绕着对于给定类型的系统哪种近似最合适——一个糟糕的选择可能会导致错误或误导性的结果。另一个挑战是如何在深入理解特定系统的基本细节和更广泛的基于数据的方法之间取得平衡,这些方法可以推广到不同的应用程序。在某些情况下,这被认为是求知欲与工业的实际目标之间的较量。

然而,进步依赖于追求方法开发的社区和专注于应用的社区之间的对话。理想情况下,应用程序应该推动方法开发,鼓励开发人员将目标放在高度感兴趣的应用程序上,而应用程序社区应该充分了解这些前沿工具的局限性。

准确性与速度

尽管计算机能力不断增强,但计算化学仍然是得到准确答案和快速答案之间的妥协。找到平衡通常取决于系统的大小——随着系统变得越来越大,必须引入以速度换取精度的近似值。

小分子可以使用高水平的量子力学波函数方法进行严格处理,以获得定量精确的几何形状和相对能量。对于较大的分子来说,这很快就变得太麻烦了,所以必须使用密度泛函理论(DFT)等计算要求较低的方法。DFT基于严格的理论,在原理上是准确的,但它依赖于一个叫做电子交换相关泛函的量的近似值。通常,这种近似包括使用与能量相匹配的参数,有时是数据集中分子的几何形状。因此,每个函数往往都适用于与数据集中的系统相似的系统。发现一种适用于所有类型分子的功能将是重要的一步。另一种方法是开发基于波函数的方法,这种方法在计算上易于处理,适用于较大的系统。

我们永远不会完全满足——我们总是将目标扩展到计算能力的极限

在蛋白质、膜甚至整个细胞上,也必须做出类似的妥协。1这些分子有更大的构象空间,试图在一个大势能表面上找到最稳定的状态引入了表面精度和我们如何广泛探索构象空间之间的竞争。较小的生物分子可以用DFT等方法处理,但较大的生物系统通常用更近似的分子机械力场处理。对于更大的系统,需要粗粒度化,从原子级别的描述转移到考虑原子或分子组,在某些情况下,还需要对系统的某些部分进行连续处理。

在模拟复杂材料时也存在类似的层次结构。利用周期性的DFT方法可以处理固体和表面。模拟固液界面通常需要明确地处理溶剂分子和离子,以及对电化学过程的应用电位和相关电场的影响。在某些情况下,微动力学建模被用于包括与相关化学反应相结合的流动和扩散等效应。

深度与广度

还有关于我们努力获得的答案类型的争论。上述方法可用于阐明特定反应的详细机制,有助于解释实验数据和做出可测试的预测。例如,最近的一项研究预测了苯并咪唑-苯酚二元体中与质子耦合电子转移反应相关的氧化还原电位的~300 mV偏移2苯并咪唑被氨基取代。这些分子被合成,实验证实了这些预测。这些预测研究逐渐增加了化学学界对理论的信任。此外,这些计算产生了开发具有特定特性的分子、生物或材料系统的设计原则。3.

另一种方法是生成并分析大量数据。通常,这种方法不太关心理解基本的物理原理,而是侧重于产生实际结果。例如,虚拟筛选可以与指定的描述符一起使用,以设计具有所需属性的系统。机器学习是另一个强大的工具,可用于设计基于模式识别的系统。对于这两种方法,成功取决于描述符的选择,使用多个描述符的机械解释具有挑战性。在生物学领域,生物信息学被用于利用蛋白质数据库中包含的信息来设计蛋白质。

计算化学家必须平衡所有这些考虑因素:提出的问题、精度水平、系统的大小和可用的计算资源。

随着越来越多的计算机能力变得可用,我们可以以更高的精度瞄准更大的系统。这个移动的目标意味着我们永远不会完全满足——我们将不断扩大我们的目标,以推动现有计算机能力的极限。随着该领域的发展,雄心勃勃的应用程序将激发创新方法的进步,这反过来又将使应用程序推动前沿前进。

沙龙Hammes-Schiffer是美国伊利诺伊大学香槟分校的化学教授