提供基础数据的研究比不提供的研究被引用的频率高25%

根据伦敦艾伦图灵研究所(Alan Turing Institute)的研究人员领导的一项分析,公开其基础数据的研究论文在未来的工作中被引用的可能性要大得多以预印本形式出版.这项研究目前正在同行评审中,研究了1997年至2018年期间由公共科学图书馆(PLoS)和生物医学中心(BMC)发表的350多种开放获取期刊上的近53.2万篇文章,发现那些直接链接到源数据集的期刊的平均引用量高出25%。

“我们发现,在研究期间,这些开放获取期刊发表了50万篇论文,其中三分之一包含数据可用性声明,然后对这些论文进行了检查,以确定是否有引文收益,”解释说伊恩•Hrynaszkiewicz他是施普林格Nature出版社的数据出版主管。结果清楚地指出,对于包含通过URL或其他永久标识符链接到存储库的文章,引用优势高达25.36%。这与之前专门关注基因表达微阵列或海洋数据的小型研究的结果一致。

Hrynaszkiewicz和他的同事们说,这一新证据可以更好地证明引入更强有力的研究数据政策所带来的成本增加是合理的。他们控制了几个已知影响引用的因素,比如作者和参考文献的数量,以及作者的声誉。

Hrynaszkiewicz说:“通过公开研究论文和基础数据,作者提高了他们的知名度,这导致了数据的重用和更多的引用。”他还指出,更成功的、可见的研究小组可能拥有更多的资源来共享底层数据和代码。

开放数据的新激励措施

彼得木栓他说,这些结论意义重大,因为它们可能促使期刊创造新的激励措施,鼓励作者开放他们的数据集,并在文章中链接到这些数据集。

苏伯说:“许多期刊都有开放数据政策,但有些期刊很难让作者遵守。”“诀窍是在发表之前先把数据打开一点,这样链接就可以包含在文章中了。”现在,期刊可能会有动力向作者施压,要求他们在特定的时间表上公开他们的数据。”

彼得Murray-Rust英国剑桥大学化学家、开放获取出版的倡导者,称这份预印本研究“做得好”、“一份好工作”。然而,他说,重要的是要确定研究人员识别的这些数据链接是否真的检索了有用的真实文件。“一个负责任的科学出版商会说你应该这么做InChIs和MOL文件,但我们通常有pdf或jpeg文件——这些文件很大程度上是被破坏信息的墓地,”默里-鲁斯特解释道。他目前正在编写软件,将pdf文件转换回光谱,以使它们更有用。

他还认为,在试图评估研究是否高质量或开创性时,引用的作用有限。他说:“我们应该衡量的不是引用次数,而是数据的重用。”Murray-Rust指出,只有当研究人员将他们的数据放在一个存储库中,从而创建一个公共记录,使引用信息以及查看和下载能够被测量和跟踪,这才有可能发生。