科技日报:在互联网上为科研数据办张“身份证”

作者: 2017-08-16 07:54 来源:
放大 缩小

   ■本报记者 王静婷

    现在我们大多数论文都只发表“结果”,不发表“数据”,而论文结果只是作者对“数据”的理解,正确与否无法判断。近日,阿里巴巴集团技术委员会主席王坚在全国科学数据大会上抛出的观点,得到众多专家的认同。

  不少科研人员、高校学生也都有类似的体验:一篇论文可能只有几十页,但背后的各种实验数据得有几百上千页,大量数据长期“沉睡”在“科研工作者个人电脑中”。

  数据分享的好处毋庸置疑,无论是从国家层面,还是社会角度,资源共享都会促进成本节约和效率的提高。但是,科研数据完全无条件的分享又存在诸多障碍。作为数据分享的一种有力尝试,数据出版刚刚起步。

  数据分享不是义务

  科研工作者为什么不愿意分享数据呢?8月9日,国家科技基础条件平台中心副主任王瑞丹展示的一项调研问卷或许能给出答案。在“没有将科学数据发布并共享的主要原因”问题中,选择最多的3项是:“数据的知识产权不清晰,不宜公开”“数据还有为自己的团队持续利用的价值,不发布有利于保持自己团队的科研优势”“科研项目资助机构、所在单位及发表研究成果的期刊并未要求将数据开放共享”。

  “数据公不公开,首先应该尊重科研工作者的意见,不能将数据分享单纯看作是科研工作者的一种‘义务’,毕竟数据隐含了科研工作者的大量心血,完全无条件的公开也是不现实的。”中国农业大学汪懋华院士表达了自己的观点。

  保护产权需贴标签

  8月11日,中国科学院计算机网络信息中心研究员黎建辉介绍,所谓数据出版,是指将科研过程中产生的数据,经过规范和质量控制,以互联网方式发布,供别人访问、引用、评价、再应用,给数据加以“标识”,相当于给数据办了一张“身份证”。

  “其实,原来论文和数据并不分离,发表论文的同时也会附带数据,只是随着数据容量越来越大,纸质媒介无法承载,才形成今天单独发表论文的形式。但是,随着互联网技术的发展,又为数据的发表提供了可能性。”黎建辉提到。

  中国科学院地理科学与资源研究所石瑞香指出,数据出版的优点显然不少,最重要的是保护作者知识产权,出版也就意味着数据被贴上“标签”;同时,确保数据准确规范,出版拥有一套对应的体系标准,将对数据的准确性和规范性进行审核;此外,永久保留数据,降低个人不慎丢失数据的风险;而且还能提高数据和作者的影响力,作者甚至在没有形成论文的情况下,单独发表数据。

  评价体系有待完善

  在世界范围内,数据出版都处在起步阶段,我国也是近两三年开始尝试的,基本上与世界同步。

  缺乏完善的评价体系,即发表的数据被引用情况还没有被相关科研领域认可,是目前数据出版面临的最大问题。对于论文的评价,现在有相对完善的体系,比如SCI引用等,通过这些影响因子可以对论文质量进行评价。但对于数据目前还没有评价指标,对于如何引用、引用次数等都没有明确规定,这也使得大多数科研工作者在出版数据方面缺乏积极性。

  要想解决这些问题,黎建辉认为,应该主要从三个方面考虑,一是项目承担单位,可以先从项目数据着手,对项目数据的评价、引用出台相关的规定,规范数据的引用;二是提高科学共同体也就是相关研究领域的认可,即大学、科研院所逐步转变观念,承认数据对科技的贡献,认可数据价值;三是从人才计划角度,可以将数据作为一种科研产品,纳入职称评审、人才计划申报等体系,提高科研人员内生动力。

  在加强科学数据管理的考虑中,王瑞丹提出要“发展科学数据出版,推动传统期刊论文支持数据的汇交与公开。”

  什么是数据分享的理想形式呢?王坚说,当大家可以通过互联网搜索到自己需要的“数据”时,数据分享也就实现了。

附件: