自动合成仪

来源:©科学/美国科学促进会

由人工智能指导的自动合成机器人,以寻找最适合交叉偶联反应的条件

一个使用合成机器人进行实验的人工智能从数千种可能的组合中找出了交叉偶联反应的最普遍条件。与基准条件相比,人工智能创建的反应在20个棘手的交叉耦合中平均产量增加了一倍以上。

研究负责人说,适用于不同形状、大小和官能团的化合物的反应条件“对于小分子合成的自动化至关重要,而小分子合成反过来又对分子创新的民主化至关重要”马丁·伯克来自美国伊利诺伊大学香槟分校。2009年,伯克的团队创造了铃木-宫浦交叉耦合的一个版本氯芳烃和N-甲基氨基二乙酸(Mida)硼酸盐。

然后,该团队转向人工智能来调整反应,使其适用于尽可能广泛的底物范围。他们要求计算机搜索文献,从几乎无限多的催化剂、配体、温度和碱组合中找到最通用的反应条件。然而,该算法并没有发现新的、普遍的条件,而是“发现”了已经最受欢迎的条件。伯克解释说,其中一个原因是“文献中明显缺乏负面数据。没有人会发布不起作用的东西。但算法需要好的和坏的例子来学习。

反应计划

来源:©科学/美国科学促进会

初始训练集的反应方案和化学结构

现在,球队Bartosz Grzybowski在波兰科学院和艾伦Aspuru-Guzik加拿大多伦多大学的研究员,以及伯克和同事们结合了人工智能和机器人实验,在没有偏见的文献数据的情况下解决了一般性问题。首先,聚类分析选择了22个偶联伙伴,将代表5400个商用芳酰卤化物和54个米达硼酸盐的化学空间。然后,该团队让人工智能在数据上失败。伯克说:“一旦我们建立了它,我们就没有做任何决定。”

在几个月的时间里,人工智能经历了五轮设计实验,在合成机器人上运行并评估结果。伯克解释说:“这个算法的设定并不一定是为了找到最佳条件,而是为了尽量减少不确定性。”为此,人工智能进行了大量的低产量反应——大约100次。

该算法得出的条件似乎与伯克2009年的论文没有太大区别:100°C而不是60°C,钠而不是碳酸钾,钯催化剂的磷化氢配体略有不同。然而,在20个异质芳烃交叉偶联中,平均产量增加了一倍多——从21%增加到46%。伯克说,人工智能的速度和精度“让人感到谦卑和鼓舞,但同时也令人震惊和不安”。

“这对于平行药物化学来说非常棒,例如在高通量实验室中,他们使用自动化来生成化合物库,”他说阿尔巴萨拉特他在詹森制药公司(Janssen Pharmaceuticals)从事工艺开发工作。然而,她指出,该团队研究的化学空间缺乏具有药学相关取代基的分子,如卤素和脂肪族胺。

Zárate表示,如果类似的人工智能可以优化一种特定反应的条件,就可以极大地加速劳动密集型工艺的开发。毕竟,铃木-宫浦交叉耦合“可能是我们花费最多时间筛选的反应之一”。

伯克说,他现在希望他们的人工智能系统能够寻找具有特定功能的分子,比如太阳能电池材料。“在化学领域,我们倾向于关注结构。对我来说,这个闭环引擎最令人兴奋的地方在于,它为我们提供了一个转向功能优先的方法的机会。”