由人工智能驱动的逆合成规划器Chematica现在不仅可以分析数据,从现有的反应模式中学习,还可以识别新的合成路线,即使对专业化学家来说也是违反直觉的。一项新功能使人们有可能解锁大量以前未报道的战略反应序列——称为战术组合——这对合成复杂分子特别有用。通过制备一个小的天然产物来测试该软件。

当计划合成一个具有结构挑战性的分子时,选择一个反应组合实际上是一个好主意,首先产生一个更大的分子,然后修剪它以产生一个不那么复杂的结构。他说:“这一艰难且显然无益的步骤为随后极其优雅的简化奠定了基础。Bartosz Grzybowski波兰科学院和韩国蔚山国家科学技术研究所的研究员,Chematica的开发者之一。但这种两步战术组合并不那么容易找到。Grzybowski说:“发现这样的序列是非常困难的,因为我们化学家没有接受过设想将结构‘复杂化’的步骤的训练。”“在有机化学课程中,我们被教导要简化目标,再进一步简化,直到我们得到可以买到的东西。从结构复杂性的角度思考问题不是很直观。难怪迄今为止只有大约500个这样的序列被编目。“现在,这个团队发现了许多新的战术组合。

Grzybowski和他的团队花了15年的时间,将大约75000个反应规则编码到Chematica中,所以他们决定对程序进行调整,创建两步组合,并筛选出符合某些标准的组合,包括增加/减少复杂性,以及没有能够得到相同结果的一步绕过。同样重要的是,序列中的第一个反应为第二个反应提供了可能,从而创造了一个真正的合成策略。Grzybowski说:“设计正确的算法并调查近10亿个序列花了相当长的时间,但在许多方面它注定是可行的——而且它确实做到了。”“我们展示了大约46000个基于合适反应类别的前所未有的序列,以及近500万个基于特定反应变体的序列。”这可以说是机器识别新化学知识的第一个例子。”

战术规划

为了使新发现的战术组合可供其他科学家使用,该团队创建了战略家网页应用,用户可以在几秒钟内查询到合适的序列。“当然,所有这些知识也都在Chematica中,”Grzybowski说。“这个程序现在真的可以思考,并且可以针对非常困难的目标制定综合计划。他和他的同事们使用升级后的软件来计划血小板聚集抑制剂imperanene的合成,并通过选择包括加成反应和还原反应的战术组合,将合成路线从8步缩短为3步和2步。Grzybowski说:“通过烹饪,我们实际上展示了新发现的一个序列是如何将小天然产物的合成缩短一半的。”

chematica程序使用TC集合自主设计的药物相关分子和天然产物的合成方案

来源:©2019 Ewa P Gajewska等人/爱思唯尔公司出版。

根据Chematica推荐的战术组合路线,成功合成了一种血小板聚集抑制剂Imperanene。上面的部分是Chematica的药物成本计划路线,中间是相应的实验执行计划(反应箭头旁边给出了条件和产量)。底部是该药物最短的文献报道路径

里士满萨普昂没有参与这项研究的美国加州大学伯克利分校(University of California, Berkeley)教授认为,Chematica的升级将帮助科学家识别从逆合成角度来看不明显的途径。“这些战术组合应该可以帮助和激励人类设计师,通过考虑可能导致结构更复杂的化合物的断开来最好地构建化合物。”最终,这些非直观的脱节可能会提供一个更有效的综合。”“更容易识别更多战术组合的能力将对有机合成化学的实践起到重要作用。”这项工作是一个积极的开始,我们可以用电脑来做这件事。”

Grzybowski承认化学家也可以发现一些新的战略组合。“但他们没有,”他说。“此外,他们也不可能发现500万个。就发现的范围和速度而言,这台机器是无与伦比的。”