将编码集成到化学中可以帮助科学更快地发展

像我和我的团队这样的高通量化学家通常最注意效率低下。如果一个实验室化学家平均每天平均抽取8个LC-MS样品,他们很快就会习惯20秒的工作流程缺陷,而且往往不会抱怨。但是,当一个高通量的化学家一次从一个井板中处理96个样品时,小的限制累积起来就会成为一个大麻烦,甚至是一个禁用的障碍。在我的职业生涯中,有一次我被要求使用特定的工作流来整理我的LC-MS数据。这个过程涉及到远程连接到多台计算机,并执行几个漫长的变通方法来合并我们的文件并批量导出高通量数据。由于我们只能缓慢地导出分析数据,如果我们随后注意到一个新的副产物,我们必须权衡识别整个盘子的副产物产量模式的好处与重新运行输出过程的时间的价值。由于这些好处往往不是立竿见影的,信息经常会丢失。我们都可以看到,如果你在设计软件,你不会这样做。但我们是化学家,不是软件设计师。

然而,在此之前一年,我曾尝试过一个免费的编程入门课程。它是由我大学时代的一个熟人经营的,作为第一份行业工作的化学家,我认为在我的工作之外做这件事似乎是个好主意。虽然我不认为我有太多的理由编写代码,但它看起来可能有一天会有用。

我是对的。当我看到错综复杂的LC-MS工作流程时,我所能回忆起的任何Python知识都是有限的。但这门课教给我的主要事情是,这是可能的。我知道Python可以修复我们的分析导出,所以我想出了我想做的事情,谷歌了几乎每一行,直到我建立了一个有效的过程。它写得很糟糕,没有利用很多我还不知道的有用的开源包,但它已经足够好了。新的脚本意味着我和我的团队可以自由地获取我们确定的所有信息。

化学家在两个阵营中都有一席之地

自从我涉足化学知识的广泛数据、编码和化学信息学领域以来,我发现这是一个很好的地方,尽管与合成化学完全不同。总体而言,数据化学家们坚持开放和推动进步的必要性,甚至比已经相当开放和进步的制药合成化学社区更加强烈。在化学以外的数据领域,人们正在广泛努力免费分发学习成果,因为领导免费的公共课程是一种荣誉。这让我有可能在我有全职化学工作的时候开始学习。然而,当我和一位有机化学家朋友参加我们的第一次化学数据会议时,我们发现了一个巨大的文化差异:每个人都在下午5点准时下班回家!我们抓住了一名组织者,那时候他绝对应该喝杯啤酒,我们三个人就自己去了酒吧。这和有机化学会议结束后在酒吧里熬夜的情况很不一样。

一位同事最近对我说,现在似乎每个人都在搞计算机。然而,实际上没有必要去任何地方。化学家在两个阵营中都有一席之地,就像我最初做的那样。我调查了一些同事,问他们是否有兴趣学习Python初学者课程,预计答案基本是否定的。相反,大约80%的人精明地说是的。我很高兴,因为这将使他们更容易使用编程专业人员编写的节省时间的脚本。我现在有很多关于如何进入编码的问题,所以我创建了一个资源网页而不是重复一百次。

但现在是我做出改变的时候了——全身心地投入到数据策略的工作中,同时保持对合成化学的深入研究。我对化学数据、代码和工作流程充满热情的原因是“因为”而不是“尽管”是一名合成有机化学家。化学知识也是这个角色的关键优势。我们中的许多人都见过数字实验室工具明显是在没有咨询实验室化学家的情况下制作的——通过一点合作,我们可以改变这种情况。我的目标是,优秀的合成化学可以更快、更高质量地完成,使化学家能够从他们的实验中得到更多,并将他们的时间从他们不想做的事情中释放出来。我们应该减少他们的工作量,而不是增加工作量!数据化学家在实现更快、更好的科学研究的目标上取得了巨大的进步,我迫不及待地想成为其中的一员。