一个新的人工智能(AI)的工具可以使用浓度化学反应机制进行分类数据进行预测,与实际数据99.6%准确。Igor Larrosa乔迪助教来自曼彻斯特大学的免费提供了模型帮助进步完全自动化的有机反应的发现和发展。

有更多的信息在动态数据比化学家能够提取传统上,“Larrosa评论。深度学习模型的不匹配但超过化学家动力学专家能够做什么与先前的工具”,他说。

交换

来源:©Springer自然

新人工智能模型可以解释动力学数据,以确定哪些20常见的反应机制确定衬底(S)之间的关系,催化剂(cat)和产品(P)

Larrosa补充说,化学是在一个独特的人工智能工具的转折点。因此,曼彻斯特化学家们试图设计一个分类模型与理想的功能反应。助教和Larrosa结合两种不同的神经网络。首先,长期短期记忆神经网络跟踪浓度会随着时间而改变。第二,一个完全连接的神经网络过程的第一个网络。

最终的模型包含576000可训练的参数。参数描述的数学运算,进行动态配置文件数据的,Larrosa解释道。这些操作然后产生机制的数据来自的概率。”相比之下,AlphaFold使用2100万参数和GPT3使用1750亿参数,”他补充道。

催化剂的见解

双人套房,Larrosa训练500万模拟动力学模型与样本,贴上标签,20个常见的一种示例与催化反应机制。一旦模型已经学会承认的特点与每个反应机理相关的动力学数据的这些规则适用于新的输入动态数据进行分类的,助教说。第一的20个是最简单的催化机理,Michaelis-Menten所描述的模型。助教和Larrosa集团其余机制涉及bicatalytic步骤,这些与催化剂失活催化剂活化步骤,这些步骤,后者是最大的群体。

模拟数据需要高的分类性能,助教补充道,因为实验数据不可避免地吵,很难解释。实验数据和相应的化学家的结论不应使用培训因为由此产生的模型,在最好的情况下,尽可能准确的平均化学家,并更有可能不准确,”他说。

测试训练模型,助教和Larrosa使用更多的模拟数据,只造成38 100000年样本分类错误。模拟真实实验更密切,化学家添加噪声的数据。与现实的水平精度下降到99.6%的噪音和83%与Larrosa称之为“荒谬的极端嘈杂的数据”。

化学家也应用模型之前发表的实验数据。虽然这些不能正确答案,化学模型提出机制的声音,“Larrosa说。研究结果也提供了新的深入了解包括ring-closing烯烃复分解反应和环加分解的催化剂。理解催化剂分解途径非常重要的是能够使可再生的过程,“Larrosa突显。

赛格勒来自微软研究Marwin AI4Science电话工作的一个奇妙的演示机器学习如何帮助创造性的科学家努力解开自然和解决化学问题”。这样我们需要更好的工具来发现小说反应作出新的药物和材料,使化学环保,”他说。这也突显出强大的模拟可以训练人工智能算法,我们可以期待看到更多的。