多达20%的化学结构可能被错配。一组研究人员已经使用计算核磁共振预测来更正一些,但其他修订仍然存在争议

使用机器学习增强计算核磁共振的结构和机械修订在研究人员之间引起了争议。一个研究小组分析并修正了化学文献中各种不同寻常的结构和机制,但此后他们的建议的准确性受到了质疑。这些争论表明,化学家需要在依靠计算、实验和直觉之间取得平衡。

核磁共振(NMR)是测定有机结构最具信息量的工具之一。然而,解释光谱是主观的,一些分子特征会使这进一步复杂化。澳门万博公司例如,第四纪碳就不能提供1H NMR信号,这意味着在某些情况下,分子的大部分基本上是看不见的。较重的原子如溴和碘也能以不寻常的方式影响化学变化。“因为它们有很多电子,它们会对化学位移产生所谓的相对论效应,”解释说克雷格的屁股他是英国布里斯托尔大学的结构和机械化学家。“这意味着,当涉及到大的卤素原子时,典型的有机化学家解释光谱的方法开始崩溃。”

计算核磁共振方法已经存在,但对有机化学家的实用性有限。化学软件包中提供的简单预测工具往往准确性较差。相反,量子水平的分析也是可能的,但技术的复杂性和较长的计算时间使其不适合常规使用。

安德烈Kutateladze他和他的团队开发了一种名为DU8ML的机器学习增强计算NMR方法。它结合了机器学习的速度和密度泛函理论计算的准确性。该系统目前拥有13,000个经过严格验证的结构的训练集,这使得机器学习组件能够识别广泛的功能组。

Kutateladze说:“我们的目标是找出最具挑战性的结构元素,这些元素通常会导致天然产物的错误配置。”“我们会标记任何可疑结构,并使用DU8ML方法再次检查它们。根据经验,我们估计12%到20%的已发表结构可能包括结构错位。“这些错误的配位通常可以归结为立体化学或区域化学,在含有许多四元碳或卤化碳的化合物中,这种配位尤其成问题。”

作为正在进行的DU8ML培训项目的一部分,Kutateladze小组报告了实验和计算之间的任何有趣差异,并提出了替代结构和机制来更好地拟合数据。然而,修正过程并不总是简单的,研究人员之间的对话往往是得出正确答案的必要条件。

2017年,Kutateladze使用了早期的DU8ML版本分析90多个倍半萜结构但在该团队修改了化合物的羟基构型一年后,全面综合揭示了原文和修订本实际上都是不正确的。额外的实验和计算数据帮助Kutateladze改进了DU8ML。库特拉泽说:“当有人纠正你时,这从来都不是一种愉快的经历,但这就是科学向前发展的方式。”“现在我们的方法表现得足够好,可以区分二氯头孢酮结构。”

库特拉泽强调,纠正错误并不是为了攻击任何人的工作或职业声誉,尽管这并不是每个人都同意的观点。

有争议的化学

2008年,有机化学家Metin Balci来自土耳其中东技术大学报道了一系列溴化反应在降冰片烯型结构上,提出了每种结构的形成机制。三溴化产物具有看似简单的核磁共振光谱,这使得确定它们的立体化学成为一个严峻的挑战。Balci和他的团队进行了各种二维核磁共振实验,最终使用长程耦合常数来分配溴基的相对取向。

然而,Kutateladze及其同事提出了Balci化合物的另一种结构和形成机制。“我们是受害者,”巴尔奇说。“他们正试图反驳一种已经被核磁共振理论证实的结构。DU8ML分析表明endo结构与核磁共振数据不匹配挂式溴基的取向更有可能。这两种结构在Balci所做的核磁共振实验中是无法区分的,他的任务依赖于长距离质子-质子耦合的缺失。

两组反应机制导致溴化结构

溴化的syn-7-溴单冰片烯产生三溴单冰片烯,但是哪一种呢?2008年进行该反应的研究小组提出endo结构(顶部),但计算核磁共振显示了更好的匹配挂式同分异构体(底部)

Balci被这种批评所激怒,重新合成了所讨论的化合物。进一步的核磁共振实验支持了他原来的结构,这被x射线晶体学证实。库特拉泽说:“我很想知道我们的修订到底出了什么问题。”“有可能我们没有考虑到近端溴原子之间的一些相互作用,这是‘机器’还没有看到的,因此没有被训练来纠正。另一种可能是,原始支持信息中有一个错别字,使我们的结论偏向于修订后的结构。我们已经向(巴尔奇)要了一份原版的副本13C核磁共振谱来解决这个问题。”

计算结果与实验结果不一致的确切原因还没有确定。但对巴茨来说,这正是科学的意义所在。他说:“这整个故事都是关于人们认识到他们所做的事情的局限性。”“巴尔奇当时并没有做一个完整的分析来无可争议地证明他的结构——这并不是不合理的,因为你不可能做世界上所有的实验。但后来库特拉泽找到了支持其他答案的证据,但没有测量实验数据。两位科学家只是用不同的方法解决了一个非常困难的问题,并得出了不同的结论。”

虽然这不是第一次结构修订引起争议,但库特拉泽的绝大多数建议都很容易被接受。2016年,他的团队revis含经络结构,是植物的天然产物孤立的通过巴勃罗Chacón莫拉莱斯来自委内瑞拉洛斯安第斯大学。这种化合物中大部分缺乏质子信号,这使得确定其结构特别具有挑战性。第二年,Chacón莫拉莱斯邀请库特拉泽一起工作相关天然产物项目

由于士的宁大小的分子的计算时间现在不到20分钟,DU8ML已经在与实验NMR相似的时间尺度上运行。通过继续在新的和更具挑战性的结构上训练系统,该团队希望进一步提高预测速度和准确性。库特拉泽说:“我们的最终目标是让社区广泛采用像我们这样的计算方法。”“现在是时候让每个人都用计算核磁共振来增强他们的结构阐明工具了。它不是万能的,而是结构化学中另一种强大的工具。”