人工智能公司DeepMind与欧洲分子生物学实验室(EMBL)合作,发布了科学已知的几乎所有蛋白质的预测结构——总共超过2亿个结构。

这些结构是由DeepMind的AlphaFold系统生成的,该系统根据蛋白质的氨基酸序列预测蛋白质的3D结构。这些结构已经被添加到开源中AlphaFold蛋白质结构数据库,由EMBL维护。“这是我们给人类的礼物,也是人工智能给社会带来好处的一个展示,DeepMind联合创始人兼首席执行官德米斯·哈萨比斯宣布在Twitter上。

生命科学领域独特而重大的进步,展示了人工智能的力量

Eric Topol,美国斯克里普斯研究所

当AlphaFold去年推出,它只计算出35万个蛋白质结构。从那时起,来自近200个国家的50多万名研究人员访问了AlphaFold数据库,查看了200多万个结构。它的免费结构也被整合到其他公共数据集,如欧洲生物信息研究所的数据集运用基因组数据库和UniProt-蛋白质序列和功能信息资源。

Eric Topol美国斯克里普斯研究转化研究所(Scripps Research Translational Institute)的创始人兼所长霍金称AlphaFold是“生命科学领域独特而重大的进步,展示了人工智能的力量”。他补充说,确定蛋白质的3D结构过去需要几个月或几年的时间,但现在只需要几秒钟。托波尔指出,AlphaFold已经加速并实现了“大规模的发现”,包括核孔复合物的结构开裂-控制所有进出细胞核的物质的分子导管。

大卫·格兰杰他是一位生物技术企业家,也是英国Centessa制药公司的首席创新官。他说,AlphaFold团队所做的“在科学上给他留下了难以置信的深刻印象”。然而,他对其对药物发现的影响持谨慎态度,他指出,预测的蛋白质结构可能接近准确,但对于任何给定的目的都是无用的。

Grainger补充说,他已经检查了AlphaFold预测的几个他熟悉的蛋白质的结构,并发现在需要结合药理功效的区域中,不止一个AlphaFold预测是“无法识别的”。“不会每次都是这样,我毫不怀疑AlphaFold结构将为药物研发界带来巨大价值,”格兰杰总结道。“但它们只是预测模型……买者自负。”