有一些方法可以在不导致信息过载的情况下平衡整体数据的好处

现代化学越来越多地涉及到对大量结果的探索,这就带来了如何展示这些结果的问题。作为一名高通量实验化学家,我开始了解数据可视化,在那里我设计实验来评估参数空间(并且必须与显示大量变量的无数轴作斗争),通常是为了诱使顽固的反应正常工作。许多其他化学领域都大量使用可视化,包括由发现化学家和生物学家进行的复杂分析,配体或药物发现的化学空间描绘,或者可能是全国范围内的水污染物地图。对于较大的团队,显示实时指标的仪表板越来越受欢迎,用于自动化、一目了然的项目完成或仪器维护信息。

数据可视化

来源:©Getty Images

经过深思熟虑收集的数据值得仔细地可视化

我最初并没有意识到如何描述数据比报告的其他方面更重要。有一段时间,我最大的错误是在没有任何特别强调的情况下展示数据,目的是为了让读者形成自己的结论。这是一个错误,因为我已经仔细设计了参数,并在我的实验和数据集上花了几个小时,但我期望读者在几分钟内就能发现相同的结论。

视觉化是化学与心理学相结合的奇怪领域之一,要找到正确的平衡就像是一门艺术也是一门科学。读者理解图表的难易程度不仅与其中元素的数量有关,还与它们的显示方式有关:它们有多亮、多粗(或其他);颜色、形状和相对尺寸的影响;和更多。尽管所有的数据点可能都同样重要,但在报告中,有些值或趋势会比其他值或趋势更有趣,我们可以帮助读者快速看到这些值或趋势,而不会产生太多偏见,从而模糊任何结论。从数据中提取趋势,同时又不模糊其他可能性,或把读者引向错误的道路,比我想象的要容易。

同时看到太多东西会让人困惑

人类的大脑非常擅长发现模式,但当事情太多时,这种能力就会减弱。研究表明,一个典型的人通常能够在大多数时间里同时在脑海中记住大约七个概念性项目——这是认知负荷的心理概念。当然,实际的数字取决于各种各样的事情,可能在大多数会议中,至少有一个心理项目是用来注意其他人的话语和肢体语言的。对于数据可视化,我们只需要记住,一次看到太多东西会让人感到困惑。

尽管有认知负荷,但我总是发现展示整个数据集的好处。虽然一般来说,期刊似乎只想看到产量,但任何分支学科的实验室化学家在优化反应时都更喜欢更全面的数据。虽然实验化学家肯定会从了解可用的副产物概况中获得成功,但读者也可以从这些知识中受益。我记得我和一些化学家一起研究溴化反应——我们事先不知道,但他们非常感兴趣地看到一种替代溴化剂擅长产生的溴脱羧副产物。按照出版物风格的路线,在表格中只显示产量和可能的区域选择性,这意味着他们无法在他们的分析中测试这种材料。我认为,我们都可以更好地看到更多关于文学反应实际发生的数据,特别是对于那些试图为自己重复使用这些条件的读者。

幸运的是,有很多方法可以处理认知负荷和显示复杂信息的好处之间的二分法。与馆长不同,读者不能在数据集上花费数小时。但当馆长用可视化的方式讲述故事时,读者可以在不知不觉中理解。通过这种方式,数据点收集起来,逐渐形成概念,一旦读者对一个概念有了一个心理模型,它就变成了他们可以同时理解的七个项目之一。另一个减少认知负荷的技巧是给出能反映主要结论的图表标题。与其说“产率与碱和温度的关系”,更有用的标题可能是“富电子吡啶水解减少”。当许多不同的细节都很重要时,我喜欢为单个数据集显示多个图表。

当我认真思考数据可视化时,一开始我惊讶地发现我的报告更有洞察力。我的同事可以用这些结果做更多,更快,更有效地重用这些信息。它显示了实验报告中有时被遗忘的部分细节的重要性。即使是小的底物表或检测结果,我现在真的鼓励任何人思考他们的信息是如何显示的,以及是否有一种方法可以让读者更容易地辨别趋势。“我们一贯的做事方式”有时并不是最好的。