中国科学报:科学研究迈进大数据驱动时代--国际数据委员会2019年学术大会在京召开
在联合国公布的17项可持续发展目标的169个具体指标中,39%的指标虽有方法论和路线图,但缺少数据依据帮助落实;16%的指标既缺少方法又缺少数据。中国科学院院士郭华东在国际数据委员会(CODATA)2019年学术大会上,分享了这样一组数据。
“大数据对实现可持续发展目标至关重要,而良好的数据共享机制可以把全世界的科研人员凝聚在一起。”郭华东说。
近日,国际数据委员会(CODATA)2019年学术大会在京召开。围绕“迈向下一代数据驱动的科学:政策、实践与平台”主题,学者针对数据基础设施能力建设、数据开放的政策和实践、数据驱动科学发现的案例等展开了研讨交流。
“随着科学研究进入大数据时代,世界各国对科学数据的重视达到了前所未有的高度。”CODATA中国委员会副主席、中国科学院计算机网络信息中心主任廖方宇说。
2018年3月,国务院办公厅印发《科学数据管理办法》。今年6月,科技部、财政部在前期科学数据工作的基础上,在高能物理、基因组、气象、地震海洋等领域组建了20个国家科学数据中心。其中11个国家科学数据中心是依托中科院高水平研究所建立的,中科院计算机网络信息中心承担了国家基础学科公共科学数据中心和中国科学院科学数据总中心的建设、运行和服务职责。
中国科学院副院长、中国科学院院士李树深指出,科学数据的丰富度、关联性与开放性将成为21世纪驱动科技创新的核心要素。继“观察实验”“理论分析”“计算模拟”之后,“大数据驱动科学发现”已成为科学研究的第四范式。
中科院作为国家自然科学最高学术机构,历来重视科学数据的管理与应用。上世纪80年代中科院启动了科学数据库建设项目,并从“十五”开始通过中科院信息化发展专项全面提升科学数据资源高效汇聚、集成管理和深度应用服务。发展至今,已形成了以国家重大科技基础设施、野外台站监测网络、大型观测实验平台等为代表的空天地海立体化科学数据生产网络。打造出的以“中国科技云”为代表的新一代科学数据基础设施平台,可为EB级科学数据提供传输、存储、分析、处理的一体化云服务,可开放共享的数据量已达到数十PB;部署的物质科学、天文学、空间科学、海洋科学、生态系统、地球环境等领域的学科数据应用平台,在重大科学发现及决策支持中发挥了重要的作用。
CODATA主席Barend Mons在讲话中提到,科学数据的发展机遇与挑战并存。随着海量且多样化的科学数据不断产生,机器智能化处理和使用数据的能力亟待提升,机器学习和人工智能等新技术将发挥越来越重要的作用。除了技术问题,人为因素也起关键作用。
科技部国家科技基础条件平台中心主任苏靖表示,期望通过中外科学家的不懈努力,进一步推动全球范围内更加广泛的科学数据开放与合作交流,助力更多具有世界领先水平的重大科学发现和原创性的技术突破,推动全世界科技创新能力和经济社会的发展。