“用标识管理科学数据,让科学信息安全共享”--“数据标识和数据管理国际研讨会”成功在京召开

作者: 2018-04-20 18:54 来源:
放大 缩小

   418日,“数据标识和数据管理国际研讨会”成功在中科院计算机网络信息中心召开。国际RDA联盟、欧盟持久标识联合会、瑞士国家超级计算中心、国家科技基础条件平台中心、国家标准化管理委员会、中国科学院办公厅网络安全与信息化工作处、中国ISLI注册中心、中国科学院文献中心、中国科学院计算机网络信息中心(以下简称“计算机网络信息中心”)等单位领导和专家学者出席本次会议。  

   (与会单位领导及专家学者合影) 

“数据共享是实现科学数据管理的关键”,在本次国际研讨会上,这一观点屡被提及。  

“科学数据对于科学创新越来越重要。在实现数据管理的过程中,如何推进数据公开和共享,是我们必须攻克的难关”,计算机网络信息中心副主任迟学斌说,希望借由此次研讨会的碰撞,探讨出物联网标识技术在数据领域应用的更多可能性,为科学数据的标识化管理和应用发展提供借鉴。      

科学数据,要开放更要共享     

“我想和大家分享一个好消息”,计算机网络信息中心大数据部主任黎建辉介绍说,317日,中国出台了《科学数据管理办法》,将科学数据管理提到了国家的层面,这也意味着在科学数据方面将有更多的投入,包括资金和研究资源。   

在《科学数据管理办法》的鼓励下,许多科研机构积极响应,在自建平台公开了研究数据。但对于需要使用数据的广大用户而言,当需要查询某一个数据时,如果不知道这一个数据属于哪个机构?又应该从哪个科研机构的平台去获取?可见只有开放仍然是个问题。  

这些公开的科学数据并没有得到充分共享。散落在四面八方的科学数据,就像散落在各个学科分领域的拼图碎片,当你偶然间只看到一片的时候,很难知道这片拼图属于什么地方,有什么意义。但如果把这些散落在各处的拼图编号,并给你看到拼图的完整画面,就会激励更多人有动力、有指引地将这些散落的碎片聚拢起来,黏合成拼图。由计算机网络信息中心负责运营的国家物联网标识管理公共服务平台NIOT)(以下简称“国家平台”)通过标识建立数据之间的联系,为知识信息编号,并为用户提供一个统一的查询平台,让所有的科学信息在平台上实现共享。再举个例子,当你准备研究中国人的阅读习惯变迁时,想看看关于近十年我国国民借书、买书、下载电子书的数据,可能这些数据分别属于各级图书馆、各家出版社、各个电子书购买平台,但如果书籍都用了统一的标识,且销售渠道数据在标识中公开的话,只要打开国家平台网页,输入关键词搜索,就可以得到相关的数据集合和详细信息来源。    

 (来自国际RDA联盟的Peter Wittenburg教授(右)和来自欧盟持久标识联合会的Ulrich Schwardmann教授就“标识如何实现数据安全”与中国科学院计算机网络信息中心的专家进行交流)  

为科学数据建立一个“防火墙”     

“科学数据越用越有价值,但安全始终是前提”,计算机网络信息中心副研究员田野表示,在推动大数据的开放共享时,国家平台也始终把用户和行业数据信息的安全放在第一位。  

首先,基于标识的开放来分享数据,本身就意味着数据分享者可以自主决定哪些信息要通过标识公开,而不公开的数据都不会在公共领域里分享。这样既方便公众查询,又可以满足数据安全和自主开放的需求。  

同时,标识能够实现对数据信息的分层级公开。针对国内或者行业内保密数据的共享,可以通过为一个数据分配多类标识来保障信息的安全。例如,一条我国科学仪器采集的数据可能带有不适合分享到国际上的信息内容,那么用国际的通行标准handle码携带的信息,和用国内推行的CSTR编码的信息的分享程度的不同来实现。而国家标识管理公共服务平台基于异构解析技术,能够解析这两种编码,并对其信息进行解析分类,公开不同的信息。  

  本次国际研讨会上,国家平台(NIOT)首次宣布完成CSTR数据标识子平台与NIOT对接,并在现场演示了科学数据接入系统的操作流程,全面支持CSTR的注册、查询、解析和检索。(撰稿:蔡浩梅)  

附件: