十年任务搭建AI生物员刚启动美国非盈利月球球队未来院创建自主研究助手加速科学发现并帮助应对人类面临的关键挑战,包括抗生素抗药性、粮食安全和气候变化

生物今日基本瓶颈不单是数据或计算能力, 而且也是人的努力:没有个体科学家有时间设计数万个假设或阅读每日出版的千篇生物论文' 解释未来院项目首席执行官Sam Rodiques

未来院项目的最终目标是制作能自主完成复杂度不等的例行任务的AI科学家,从设计脱氧核糖核酸素材到故障解决实验问题不等系统必须能够从科学上讲解:预测、设计实验和分析结果,超出当前AI系统范畴跨专业团队,包括生物学家、生物化学家和AI研究人员,计划以AIs科学最新进展为基础,最显著的是化学大语言模型ChemCrow系统.4月发布,LLM已经展示未来AI科学家的许多特征,并可以作为未来院项目蓝图

ChemCrow将大语言模型提升到下一层次

LLM化学实战迄今一直臭名昭著地差LLM系统接受大量文本培训,允许系统预测下一个逻辑响应并随着培训集扩展提高精度缺少推理和批判思维能力 表示这些模型 通常提供无稽解答 即使是最简单化题

问题在于化学数据不足安德鲁怀特ChemCrow幕后开发者之一 现为未来院科学主管多数据编程生成(e化名), 免富, 多论文隐藏在付费墙后,多化学数据还锁在不易转换语言结构图片中

训练数据存取问题不容易解决,但怀特与开发者并发菲力浦史华绕过部分关键数据采集过程,直接将LLM和实用化学工具集合在一起,包括LiightSearch、Nation2SMILES和ReactionPlanner怀特表示:「我们不用LLM直接操作化工,LLM高一级并协同这些工具完成开放式复杂化学任务

用户可以自然语言输入问题或指令,系统将使用各种工具组合完成全任务的每一步处理问题举例说,ChemCrow团队在初步研究中请求系统制造昆虫阻抗AI能够执行网络搜索以确定昆虫驱散物,文献审查查找实例,复合名称转换SMILES结构,设计合成,并操作IBM机器人实验室系统生成已知昆虫驱散物物理样本

AI驱动自主实验室

源码:IBM

IBM机器人XN已经配对ChemCrow化学LLM自行设计已知杀虫剂合成并指令自动化实验室制作

最令人兴奋的部分之一是合成管道工具与IBM机器人XN并发,ChemCrow率先连接物理世界, 使我们能够从大语言模型中做实战合成

系统还能够响应机器人系统报告的反馈和错误,迭代修改并验证工作序列,允许AI自主解决问题而不输入人

助理非替换

怀特和施瓦勒热切强调ChemCrow是要增加化学家已经完成的工作,而不是取而代之White表示:「有些问题只需要放大实验并快速生成新复合物ChemCrow不会发明新反应或催化器,我希望它被视为增强能力

透过ChemCrow工具通常难以搭建,外加Schwaller

提高LLM能力已被社区充分接受ChemCrow是一个酷点子提高LLM化学性能和新能力,André Silva Pimentel化学AI研究者巴西里约热内卢天主教大学emCrow有效性还与其使用工具的质量和数量相关ChemCrow改进推理过程,但无法完全纠正错误推理

ChemCrow团队已经解决这些限制问题,方法包括增加可用工具数并检验系统对故障的反应和工作意外问题解决这些限制对未来AI作为科学家助手也有更广泛的影响

高语言模型并非最优结构识别方式,i工作与科学需求间有差距向前推进我们需要让这些模型能真正直视这些对象(化学结构、蛋白质和基因组),我们正在未来院努力消除漏洞。