科学数据中心在数据挖掘顶级国际会议KDD2012发表系列成果
近日,中国科学院计算网络信息中心科学数据中心大数据处理团队撰写的两篇论文均被数据挖掘领域顶级国际会议SIGKDD2012作为Workshop论文录用,而作为领导团队参加的KDD2012 CUP竞赛在170多支参加队伍中获得了第三名的好成绩。
薛正华、黎建辉、张洋、沈庚等的论文以并行Kmeans大数据聚类为例,提出基于压缩感知的性能优化模型,模型的使用可以极大的降低TB级数据挖掘任务中存在的IO瓶颈影响,有效的提升计算性能改善实时性。
邬亮、周园春等以移动数据为基础,提出了一个面向移动互联网的推荐算法。该算法通过挖掘移动物体的周期性及上下文信息,对用户的点击行为进行个性化预测。
硕士生谭飞领导的团队联合中国科学院其他兄弟院所参加了此届大会的KDD CUP竞赛:基于搜索引擎的广告点击率预测问题。在170多支参赛队伍中脱颖而出,取得了第三名的好成绩。按大会组委会的要求,该团队将被邀请到大会作学术报告,相关研究成果将以论文的形式收录到KDD2012会议论文集。
附:ACM SIGKDD(The ACM SIGKDD International Conference on Knowledge Discovery and Data Mining)(简称KDD)是由ACM数据挖掘及知识发现专委会主办的数据挖掘研究领域的顶级年会。它为来自学术界、企业界和政府部门的研究人员和相关从业者进行学术交流和展示研究成果提供了一个理想场所。由于KDD的学科交叉性和广泛应用性,吸引了来自统计、机器学习、数据库、万维网、生物信息学、多媒体、自然语言处理、人机交互、社会网络计算、高性能计算及大数据挖掘等众多领域的专家、学者,影响力越来越大。KDD 2012年会将于2012年8月12~16日在北京举办,这也是KDD首次在亚太地区举办。
KDD CUP 是ACM SIGKDD 组织的有关数据挖掘和知识发现领域的年度赛事。作为KDD会议的重要组成部分,自1997年以来已经连续举办了15届,目前是数据挖掘领域最有影响力的顶级赛事。