科技日报:让科研数据不再“高冷范”
——中科院计算机网络信息中心探索科研信息开放共享
在科学数据以指数级速度增长的“数据洪流”时代,伴随数据资源不断丰富的,还有层出不穷的质疑与反思之声,比如数据库重复建设、科学数据浪费、数据只属于小群体专用且得不到有效管理,如果高冷姿态不俯下身子,科研信息化依旧不能被科研人员与民众认可等等。
“如果说以前科研信息化这五个字只是科学家在提,那么,现在对于科研数据的开放共享已成为政府、企业和社会的共识。”在中科院条件保障与财务局信息工作化处处长陈明奇看来,实用的科研信息化的影响力正在逐渐形成。特别是国务院副总理刘延东在去年的一份报告中批示:“推进科研信息化很有必要”。
示范激励:在科学界先打开围墙
上世纪70年代,中科院开始建设专业数据库,历经中科院“七五”和后十年的重大基本建设项目,到本世纪初基本形成了以研究所和课题组资助自洽为单位的科学数据资源建设和积累模式。
打开中国科技云服务门户的监控页面,四套监测系统揭开中国科技云服务的神秘面纱,15项平台服务中13项服务的年正常率达到90%以上;2016年6月超级计算机的使用率达到63%、最高的排队作业量达到2680人;团队文档库的月活跃用户有2万多、日访问量达15000次;中国虚拟天文台LAMOST望远镜的数据下载次数达到553万次,数据下载量达到7.58TB……
“让科研信息告别高冷、神秘,被科学家找得到、应用得了,需要通过一定的应用示范和激励机制来牵引。”陈明奇介绍,在中科院的领域云平台,科学家实名注册,信息互享。科研数据的发布与使用遵循可持续机制:在科研信息化平台上,注册者既具有获取科研数据的权利,也具有贡献数据的“义务”。用户贡献数据后即获得积分,相应的激励措施是下载数据的权限就会更多,这已经成为国际的通行惯例。
“中科院的基础科研数据开放共享已经持续了30年,始终坚持构建科学数据共享平台,始终坚持国家支持的科研项目产生的数据要作为公共资产开放共享。”陈明奇认为,让科研数据服务科技界是中科院中国科技云服务的首要任务。
截至目前,高能物理云的年均在线访问量接近150万、空间科学科技领域云的年均访问量近100万、最高的地学领域云的年均访问量近300万。中科院的实时监控平台显示,6个专业学科领域的年度服务正常率达94.8%。
领域拓展:让科研数据服务百姓
“科研信息不高端、不神秘,它无处不在,就像对青海湖的勘测。青海湖大而深,从前依靠人力勘测一圈需要半年多时间。现在,在青海湖候鸟密集的地方架设摄像头,在鸟的身上增加传感器、定位器,候鸟的迁徙路线和病毒的传播路径被及时记录。再将这些数据标准化打包,放到信息数据平台,实现共享服务。”指着身旁的一幅画,陈明奇打起了比方。
数据显示,“十二五”期间,中科院共有58家科研单位、1340个数据库,中国科学院数据云整合了从资源学科领域到植物学科领域等多领域数据库资源,提供共享的数据量从2.68GB增加到655TB。
在陈明奇看来,这些数据就像数据库这座富矿中的宝石,尽管现在还不能完全向公众开放,但通向矿山中的隧道早已打通,那就是科研数据试点开放已经开始,一旦时机成熟,更多便民的科研数据将会变成数据产品走入百姓的生活。
谈及未来的研究重点,陈明奇表示,科研发展最终要服务百姓生活,目前的中国科技云服务在整体上还缺乏联动,在范围上未达到民众的层面。我们要向云集成方面努力,是科技小云连成“中国科技云”这一大平台,并推动大数据的应用范式,让科学数据走入寻常百姓生活,服务于国家的经济社会发展。