通过调整他们的有机合成软件Chematica,该程序背后的团队首次展示了一台机器能够为复杂的自然产物规划多步合成。其中三种合成在实验室中得到了实验验证,化学的“图灵测试”表明,机器的路线与人类化学家设计的路线在很大程度上没有区别。

“这是我们第一次看到计算机能够实现自然产物的全合成。”

Timothy Cernak,密歇根大学

当仔细研究一种复杂天然产物的漫长的全合成过程时,很容易迷失方向。所涉及的许多反应步骤通常看起来并没有使起始物质更接近目标。但这是人类化学家的才能——能够提前制定许多步骤的策略并做出创造性的选择,执行一系列看似任意的步骤,直到事情突然结合在一起。说到全面综合,计算机程序可以比作国际象棋的初学者——到目前为止,他们被编程为一次只考虑一步棋。虽然这种策略允许机器设计出生产相对简单产品的路线,但它们很难设计出生产复杂产品的多步合成,因为它们缺乏像人类一样思考的能力。

一个图像显示自动合成计划的大网络可能的反应

来源:©Barbara Mikulak-Klucznik et al/施普林格Nature Limited 2020

Chematica的截图说明了机器在合成天然产品Aplykurodinone-1的过程中所考虑的合成可能性(如图左)

“有时,作为化学家,你会把一个结构复杂化,但计算机在这样做的过程中看不到任何好处,”他说Bartosz Grzybowski他是Chematica的开发商之一。但一旦你越过了复杂的障碍,你就可以得到非常简单的东西。“对计算机来说,另一个棘手的问题是,当生成一个复杂产品的路径时,化学空间会迅速变得天文数字般大。”每个反应步骤会产生100个分支,计算机可以遵循这些分支,这意味着对于由20个步骤组成的合成,空间将有100个分支20.选项。为了帮助程序在这个空间中找到有用的反应,该团队引入了一对新的算法。“一种算法是探索多种解决方案的空间,而另一种算法是尽可能快地完成综合。他们都在互相交谈,所以他们在更新自己。”其他变化包括新的反应规则、量子力学方法和分子力学方法。

虽然这些变化让Chematica找到了一些天然产物的途径,但它仍然无法找到其他的——即使它知道所有的单独反应来计划合成。更进一步,该团队引入了基于因果关系的规则——教会程序在综合中的一个点上的选择如何创造后续其他选择的可能性;例如,使结构复杂化,以便以后简化它。通过这一改进,Chematica能够为许多复杂分子创建原始路线,例如Lamellodysidine A,该团队与其他两种天然产物一起进行了实验验证。

显示反应方案的图像

来源:©Barbara Mikulak-Klucznik et al/施普林格Nature Limited 2020

Chematica计划的Lamellodysidine A的全对映选择性合成(上图)并在实验室进行(下图)

该团队继续进行了化学图灵测试,以确定Chematica设计的路线是否能被专家与人类设计的路线区分开来。结合该程序设计的20种途径和文献中提取的20种合成方法,18位顶级化学家被问及他们认为哪些是由人设计的,哪些是由机器设计的。“他们看不出来,”Grzybowski说。但Grzybowski强调,其目的并不是要消灭人类。Grzybowski说:“我们并不是想要取代化学家,我们只是想给化学家一个计算器,让他们更快地做事情。”“机器可以向你展示不同的选项,例如,你可以说‘我想做一些不同的事情,不要使用Diels-Alder反应’。”所以,它在时间尺度上给了你更多的选择,这是人类很难做到的。”

“我认为这是一个里程碑,这是我们第一次看到计算机能够实现自然产物的完全合成,”他说盖Cernak她是密歇根大学(University of Michigan)研究化学合成与计算机科学界面的助理教授。“真正的核心是这个图灵测试……计算机在相对复杂分子上的导航能力接近人类。”这里有一些生物碱,还有一些多环萜——这些都不是最容易制造的东西。”