美国Etsy公司数据科学主管洪亮劼博士应邀访问计算机网络信息中心
6月23日,总部在纽约的美国上市公司Etsy数据科学主管洪亮劼博士应中国科学院计算机网络信息中心大数据部和战略中心联合邀请到中心进行学术交流,分享了题为“GB-CENT Gradient Boosted Categorical Embedding and Numerical Trees”的学术报告 。
洪亮劼在报告中介绍了数据挖掘领域的一项研究成果。 该成果主要用于海量类别和数值数据的分析与信息提取,通过将factorization machine和Gradient Boosting Decision Tree这两种最常用的工具相结合进行建模,并在真实数据集上进行了实现和验证。该模型不仅模型结果具有可解释性,还具有高预测性,能够很好的用于包括大量类别和数值类型的数据集。整场报告以数据挖掘领域的实际需求为切入,深入浅出,讲述了怎样将数据挖掘过程中遇到的一个问题与学术上的理论研究联系起来,通过很好的将两个常用的不同类型的强大工具相结合为该问题给出一个解答。报告之后,洪亮劼博士与中心师生就相关问题进行了积极互动与深入交流。(撰稿:赵江华)。
附洪亮劼博士简历:
洪博士目前担任总部位于纽约的手工艺品电子商务平台Etsy的数据科学主管(Head of Data Science),管理和领导一个数据科学家团队,当前主要职责是为Etsy提供全方位的数据科学支持,包括个性化与推荐、搜索、计算广告、图像处理及深度学习和文字信息挖掘等多方面的基于机器学习的产品优化方案。
在加入Etsy之前,于2013年到2016年在雅虎研究院(Yahoo Research)工作,历任科学家、资深科学家和高级研发经理职位。在雅虎研究院工作期间,亲自领导并参与了多项大数据大规模机器学习系统的研发工作,包括雅虎首页千万级用户个性化推荐系统、雅虎移动搜索千万级用户搜索优化系统以及大型个性化广告系统,对如何在产品中使用机器学习数据分析,以及如何在工程中实现高级机器学习模型有独到见解。
洪博士长期从事机器学习与人工智能的基础以及应用研究,对推荐系统、搜索引擎、计算广告学、社交网络以及自然语言处理等领域有深入理解,在国际顶级学术会议和期刊KDD、TKDE等中发表重要论文20余篇,文章引用量超过2000次(H-Index:18)。同时,长期担任多个国际著名会议及期刊的评审委员会成员和审稿人,并且组织过多个关于推荐、搜索、用户体验优化的国际研讨会。