中科院“数据应用环境建设与服务”项目通过验收
2011年5月24日,中国科学院“十一五”信息化建设专项“数据应用环境建设与服务”项目验收会在网络中心召开,中科院信息办主持会议,验收专家组由来自中科院资环局、高技术局、研究所和研究生院、中国地震局等单位的9名专家组成,陈润生院士为专家组组长,审议并一致通过了项目验收。中科院副秘书长兼信息办主任谭铁牛参加了会议。
数据应用环境是中科院“十一五”信息化专项建设的“三大环境”之一,于2008年9月启动实施,网络中心作为项目总承担单位,62家研究所共同参加了建设。项目按照“统筹规划、整合集成、公开共享、服务科研”的原则,重点组织数据资源中心建设、科学数据库建设和数据应用环境的运行与服务等任务。到2010年底,数据应用环境全面完成了23项建设指标,其中 3项超额完成,项目边建设、边服务,取得了显著的数据应用服务效果。
数据应用环境建成了数据资源中心存储总容量6.42PB,拥有300个专用数据处理节点,总带宽达到4Gb/s,与科研网络环境、超级计算环境实现优化联通,与院ARP中心开通千兆备份专线,向院属研究所提供基于IPv4和IPv6协议的数据传输存储服务。通过建立数据安全体系和部署分级存储、运行监控和存储服务等系统软件,实现海量数据存储设施的整体管理和运维服务。整合全院科学数据库,形成共享数据量达148TB,包括化学、材料、空间、天文、遥感、人地系统、动物、微生物等8个主题库,聚变、青海湖、冰雪冻土、生态功能区划等4个专题库,化合物和植物物种2个参考型库,以及土壤、海洋、地球化学、指纹、语料、光学、基因组、蛋白组等37个专业库。形成了由专业库、主题库、专题库和参考型库组成的资源整合框架,并在化学、生物学、空间科学、人地系统4个学科领域建成了科学数据网格应用示范。项目实施过程中,数据应用环境制定实施了科学数据库管理与集成的标准规范体系和27项相关标准规范,研发部署了科学数据库管理、运行和服务相关应用软件12项,建立了统一的数据应用环境门户系统,实现了科学数据库统一监控统计分析和海量数据存储与处理统一支撑。
数据应用环境实行项目“两总”管理制度和第三方监理制度,积极发挥院科学数据库专家委员会咨询评议作用,全面推进了数据在科研活动中的应用服务。网络中心牵头建立了数据运行服务体系,提供存储服务、处理服务、数据服务、应用服务以及咨询服务。目前,已存储数据容量超过700TB,存储环境利用率达到80%。在线数据访问量年均达707万人次、年均数据下载量达101.8TB,累计为210项科研项目提供了直接的数据服务。
科学数据的获取、存储和应用已是现代科研的重要组成部分。“十一五”期间,项目建设单位一方面结合科研需求在支持重大项目、支撑学科发展和服务经济社会发展等方面取得了良好的效果,另一方面在推进典型的数据应用服务过程中,共发表论文366篇,申请软件著作权23项、专利21项,并定期举办科学数据库技术培训,组织科学数据库与信息技术研讨会,目前已出版第十辑学术论文集,继续提升了数据应用水平。依托院科学数据工作,积极开展国内外数据合作交流,包括组织中美数据合作圆桌会议、参与国际科技数据委员会活动,在推动数据领域的国际交流方面发挥了主渠道作用。
与会专家一致认为数据应用环境全面完成了项目任务和考核指标,同意该项目通过验收,并认为数据应用环境取得了显著的服务效果,建成的海量数据存储、管理以支持数据共享与应用的基础设施环境,与超算环境、网络环境实现协同服务科研信息化,为创新工作奠定了重要数据支撑优势,必将产生深远影响。