智能机器很快就能超越最好的有机化学家

一段时间以来,我有一个原则,每个在职的科学家都应该准备好“电梯游说”来描述他们的工作。这是好莱坞的一句老话,指的是有人有机会在和某个大制片厂高管坐电梯的时候推销自己的电影创意。对于科学家来说,电梯游说是对他们正在做什么的压缩描述,或者他们一般是做什么的。这对于在工业界工作的人来说是一个特别相关的想法,他们会问“你在这里是做什么的?”在这种情况下,你不仅要准备好答案,而且要确保同样的答案无论如何都会出现在其他人身上,这对你是有好处的。理想情况下,它应该包括一些你所做的事情是你的能力所独有的,一些很难被取代的事情。

最近,当我阅读有关机器学习、人工智能和其他高级计算应用的论文时,这些想法浮现在脑海中。毫无疑问,人们已经意识到,这样的软件正越来越接近传统上认为的人类功能。这已经进行了很长一段时间,我们已经习惯看到曾经属于人类的问题被外包给机器——比如“我怎么从这里到这家餐厅?”或“我最后一次收到关于X话题或Y人的消息是什么时候?”我们对此都很满意,也没有太多人会为失去作为世界上最好的国际象棋选手的曾经的人类功能而烦恼。但当机器取代我们认为是我们自己工作的关键智力功能时,情况就有点不同了。

对于有机化学家来说,我认为第一个引起重大不安的软件将是逆向合成计划。我最近看到的一些论文让我相信,研究合成新化合物途径的程序正变得越来越有能力。化学家们50多年来一直在努力实现这个想法,但现在它可能要实现了,我们可能会怀疑自己是否真的考虑过它的后果。有些化学家的电梯游说至少在一定程度上包括能够提出这样的想法。现在怎么办呢?

即使目前的软件还不能完全取代人类的合成技术,我认为众所周知的笔迹就在众所周知的墙上。下一代将是,下一代即将到来。合成有机文献的规模大得难以理解,多年来没有人能够真正跟上它的步伐。只有机器才能处理今天存在的化学文献(它们确实如此)。逆合成程序知道所有的反应,不会忘记它们,也不会把它们放错地方。又一大堆文献落在了数字化的门阶上,程序没有诅咒、呻吟或出去喝酒:它把所有东西都添加到它的“所有有机化学”宏大计划中,并耐心地等待更多。

真正让人大开眼界的是最新版本的机器学习软件,它首次用于围棋等游戏。最近那些举世闻名的程序拥有一个包含所有已知人类策略的数据库(已经足以击败最好的人类冠军),与之相反,最新一代程序完全跳过了这一步。相反,程序通过无数的模拟和测试用例运行,在运行过程中学习自己的规则。就围棋而言,这类程序不仅远远超过了人类的表现,也远远超过了之前的模仿人类的程序,采用了前所未见的策略。这是一个更高层次的抽象:这些程序不是根据我们已经发现的规则被动地处理大量数据,而是将发现这些规则的过程也转移到它们的领域。

如果这真的适用于有机合成之类的东西,我们可以期待在某个时候,这样的程序提出的路线对我们来说可能没有多大意义。首先,这是因为它们会引发我们可能从未听说过的已知反应。但如果我们也开始教他们一般的化学原理——或者更有可能的是,把整个化学文献都扔给他们,让他们自己弄清楚这些原理——这些程序很可能会推断出还不存在但即将出现的反应。在这一点上,我们很多人都需要一个新的电梯游说!