机器学习工具预测产品对有机反应的化学语言

IBM的研究人员已经开发出一个程序可以预测有机化学反应的产品。1仿照最新的语言翻译系统——比如谷歌的人工神经网络——人工智能选择了正确的产品80%的时间尽管没有被教导任何有机化学的规则。

”这个工具试图做的是模仿一个顶级职业化学家在整个有机化学领域,或多或少的说特奥多罗会之一,参与研究的研究者们在IBM苏黎世瑞士。他的雄心勃勃的目标是共享其他化学家一直试图创建一个功能AI化学家自1970年代以来,当有机化学家E J科里开启领域通过创建一个化学知识数据库。

但是,使工具基于化学知识可以耗时;Bartosz Grzybowski的团队花了十年时间来编码与20000年化学规则Chematica retrosynthesis程序。此外,基于知识的人工智能有困难解决反应之外的规则集。“有有机化学学习方法不是记忆化学规则,只是试图找出潜在的反应模式,试图解释,“会说,解释他的团队的方法。

而不是教学计划规定,团队给了超过50000个专利反应训练。从反应物加上试剂,它试图猜测最可能的产品,”解释道菲利普SchwallerIBM团队。“通过展示相同的一次又一次的训练集,慢慢学会了如何构建一个有效的产品。

化学结构首先被转换成一串字母和数字(微笑,简化molecular-input line-entry系统)。程序然后将反应就像一个翻译问题,使用鲁棒算法最初开发语言处理。

发现在翻译

来源:IBM

翻译:程序可以正确预测的结果反应在四,五实例

经过24小时的学习,计划提出了一套新的专利反应之前没有见过。它设法给正确的产品80.3%的时间。IBM团队说,这意味着它的艾比类似的预测程序,创建在麻省理工学院(MIT),我们,2利润率为6.3%。

”(IBM团队)显示边际改善精度和显示,这个框架适用于这个问题,“评论康纳绿青鳕、研究生和麻省理工学院的团队的一部分。然而,这些类型的模型,[…]不给你实际的理解发生了化学可能有挑战的令人信服的化学界接受这些“黑盒”类型模型”,补充道Klavs詹森最近创造了一个人工智能相结合的化学家rule-free与一些化学专业知识学习。3

其他人也采取这种组合的方法,4但是Coley说重要的是要记住,任何人工智能只能是它被美联储的数据。IBM项目不包含任何反应参数,如温度或溶剂,这些细节往往不是可用的格式,使一台机器来消化它们。

到目前为止,一直缺乏实验测试,验证预测程序如何在实践中。但是詹森说:“我认为在几年的现实的期望会有工具,人们可以访问和测试。