1Manbetx

拥有数百万个条目的数据集，用于帮助人工智能发现新药

通过Serra Arslancan Sengelen2023 - 03 - 03 - t09:30:00 + 0

没有评论

俄罗斯的研究人员汇集了迄今为止世界上最大的数据集，用于训练深度神经网络模型。该数据集包含约100万个类药物分子的约600万个构象。

从计算的角度来看，人们必须知道诸如构象能和哈密顿矩阵参数等细节，才能在实验室合成一种潜在药物之前很久预测其生物活性。密度泛函理论(DFT)可以用来预测这些参数，但量子化学计算往往是耗时和计算昂贵的。然而，机器学习可以用来降低DFT的计算复杂度。

由于缺乏用于训练机器学习模型的数据集，该团队开始填补这一空白，并最终降低围绕药物化学的计算成本。他们从一个包含10万个分子的436,581种构象的训练集开始，并使用DFT计算它们的构象能量和哈密顿系数。这个训练集明显大于公开可用的深度神经网络模型中使用的数据集。然后，研究人员将原始基于dft的模型的性能与包含不同分子的测试集进行了比较。研究小组指出，在使用更大的数据集进行训练后，这些模型的表现要好得多。

该团队公开了这些代码，以鼓励其他研究人员使用和开发该数据集，他们希望这将有助于未来的量子化学研究。

参考文献

K Khrabrov等，理论物理。化学。化学。理论物理。, 2022,24， 25853 (doi:10.1039 / d2cp03966d）

额外的信息

完整数据集及其部分的代码和链接可以在https://github.com/AIRI-Institute/nablaDFT

主题

没有评论

研究
机器学习生态系统进化了MOF设计

2023 - 03 - 22 - t09:30:00z

Mofdscribe处理从收集数据到评估性能的所有阶段
研究
算法产生了分子Schrödinger方程的最佳解之一

2023 - 01 - 05 - t09:30:00z

但激进的“预训练”实际上损害了它的预测能力
研究
量子化学分析揭示了以前被忽视的碳正离子稳定性趋势的贡献者

2022 - 11 - 23 - t10:05:00z

引入取代基会破坏母体底物的稳定性

暂无评论

你还没有登录。要将您的评论链接到您的个人资料，现在就登录。

拥有数百万个条目的数据集，用于帮助人工智能发现新药

参考文献

额外的信息

主题

相关文章

机器学习生态系统进化了MOF设计

算法产生了分子Schrödinger方程的最佳解之一

量子化学分析揭示了以前被忽视的碳正离子稳定性趋势的贡献者

暂无评论

只有注册用户才能对本文发表评论。

更多新闻

疫苗佐剂皂苷的皂树生物合成途径

喷气枪在不需要冷藏的情况下，在MOFs中提供无针疫苗

氢冠军呼吁英国政府与工业界合作扩大投资