机器学习工具通过像对待语言一样对待化学来预测有机反应的产物

IBM研究人员已经开发出一个程序可以预测有机化学反应的产物。1模仿最新的语言翻译系统——比如谷歌的人工神经网络——人工智能在没有学习任何有机化学规则的情况下,80%的时间都能选择正确的产品。

“这个工具试图做的是在有机化学的整个领域模仿顶级专业化学家,”他说特奥多罗会他是瑞士苏黎世IBM公司参与这项研究的研究人员之一。自上世纪70年代有机化学家E J Corey通过创建化学知识数据库开启这一领域以来,其他化学家一直在尝试创建一个功能正常的人工智能化学家。

然而,基于化学知识制作工具可能很耗时;Bartosz Grzybowski的团队花了10年时间来编码他们的Chematica反合成程序,包含20,000个化学规则.此外,基于知识的AI很难处理超出其规则集的反应。莱诺解释了他的团队所采取的方法,他说:“有一种学习有机化学的方法,不是记住化学规则,而是试图找出反应的潜在模式,并试图使它们合理化。”

该团队没有教授程序规则,而是给了它5万多个专利反应来训练。“从反应物加上反应物,它试图猜测最有可能的产物,”解释说菲利普SchwallerIBM团队的成员。“通过一遍又一遍地向它展示相同的训练集,它慢慢学会了如何构建一个有效的产品。”

化学结构首先被转换成一串字母和数字(Smiles,简化的分子输入线输入系统)。然后,该程序使用最初为语言处理开发的鲁棒算法,将反应视为翻译问题。

在翻译中找到

来源:IBM

翻译中发现:该程序可以在五分之四的情况下正确预测反应的结果

经过24小时的学习,该程序获得了一组以前从未遇到过的新专利反应。它在80.3%的时间里提供了正确的产品。IBM团队表示,这意味着它的人工智能优于美国麻省理工学院(MIT)创建的一个类似的预测程序。2差额为6.3%。

“(IBM团队)在准确性上有了微小的提高,表明这个框架适用于这个问题,”评论道康纳绿青鳕他是麻省理工学院团队的一员。然而,“这些类型的模型[…]不能让你理解化学实际发生了什么,这可能会在说服化学学界接受这些“黑箱”类型模型方面面临挑战,”他补充道Klavs詹森他最近创建了一个人工智能化学家,将无规则学习与一些化学专业知识结合起来。3.

其他人也采用了这种组合方法,4但科利表示,重要的是要记住,任何人工智能都只能像它所输入的数据一样好。IBM的程序不包括任何反应参数,如温度或溶剂,因为这些更精细的细节通常无法以一种允许机器消化它们的格式提供。

到目前为止,还缺乏实验测试来验证预测程序在实践中的表现。但詹森说:“我认为在几年内,人们可以使用和测试的工具是现实的。”