KDD 2020捷报 | 第四范式斩获KDD Cup全球冠军 AutoML挑战赛圆满落幕
2020-08-27



近日,一年一度的国际数据挖掘顶级会议KDD正在如火如荼的进行。在此次会议中,第四范式捷报连连:首先,第四范式与北京航空航天大学童咏昕教授研究组组成的联合团队在千余支队伍中脱颖而出,获得KDD Cup 2020强化学习挑战赛(RL Track)世界冠军;其次,由第四范式主办,ChaLearn、斯坦福大学和谷歌(Google)协办的KDD Cup 2020自动机器学习挑战赛(AutoML Track)圆满落幕,中国团队不负众望,包揽前三名的同时,斩获了大部分奖项。第四范式创新的赛制、出色的组织也得到了KDD主席团的高度认可。此外,由第四范式参与组织的AutoML Workshop和Tutorial邀请了诸多学术大咖,分享AutoML的实战应用,得到了学术界的积极响应和广泛关注。


赛题聚焦共享出行优化难题 彰显技术价值


今年,KDD Cup 2020 强化学习挑战赛难度陡增,与去年KDD Cup强化学习赛题的分类任务以及过往多应用在体育竞技类比赛性质不同,此次挑战赛聚焦于更加真实且问题极为复杂的业务场景,以解决共享出行领域优化难题——智能化按需共享出行平台。主办方希望参赛团队尝试应用强化学习解决方案提出智能算法策略,在确保用户体验的基础上,进一步提高出行效率和司机收入,将强化学习的价值进一步放大。


该项赛事全球共有1007支团队参赛,其中不乏普渡大学、南京大学、中国科学技术大学、中山大学、东南大学等国际顶尖高等院校以及电商巨头京东、出行巨头Lyft、 日本通信巨头NTT DOCOMO的身影。最终,第四范式与北京航空航天大学童咏昕教授研究组组成的联合团队以绝对优势斩获KDD Cup 2020强化学习挑战赛冠军,这也是中国AI公司首次夺得该项赛事的冠军。


此次比赛主办方共设计了订单分配和车辆调度两个任务,参赛团队需设计开发算法来指定在派单窗口内的订单和司机进行匹配,并指引一批空闲司机开往指定目的地。最终结果排名以所有司机的平均日均收入为评判标准。


为了最大化平台上所有司机日均收入,在计算每个订单的收益时,联合团队采用强化学习的方法,不仅能考虑当前时刻的收入,还能兼顾未来可能的收益。同时,结合剪枝与C++实现的高效二分图匹配算法,能够在2秒的规定时限内,及时找到合适的订单分配方案,保证乘客的用户体验。


AutoML挑战赛圆满落幕 中国团队闪耀数据挖掘世界杯


此次KDD Cup另外一个重头戏,是由第四范式主办,ChaLearn、斯坦福大学和谷歌(Google)协办的KDD Cup 2020自动机器学习挑战赛,比赛经过四个月的激烈角逐最终落下帷幕,并公布了比赛成绩:美团点评、中国科学院大学、清华大学的联合团队获得冠军,南京大学团队斩获亚军,蚂蚁金服团队位列第三。


大赛吸引了全球上百支队伍参赛,囊括了加利福尼亚大学洛杉矶分校、南加利福尼亚大学、南洋理工大学、新加坡国立大学、中国科学院大学、清华大学、浙江大学、北京大学、北京邮电大学、南京大学、中国科学技术大学、香港大学等世界顶尖高校以及阿里巴巴、美团点评、蚂蚁金服、海康威视等科技巨头共同参赛。


与以往聚焦在表数据的AutoML竞赛不同,本次比赛首次设置为AutoGraph 挑战赛,聚焦在近年来非常热门的图表示学习技术。其核心任务是基于图的拓扑结构,学习节点或者全图的向量表达,从而更好地用于下游机器学习的任务,如商品推荐,知识图谱补全,交通流量预测等,希望通过自动实现图表示学习的方案,解决现有图表示学习算力投入大、技术实现难等棘手问题。


对此,该赛事负责人之一、第四范式副总裁、主任科学家涂威威认为:“图表示学习的应用领域十分广阔,因此能够自动实现图表示学习的方案极具应用价值,这也是学术界和工业界近年来共同关注的焦点之一。此次比赛验证了AutoML能够很好的应用于图领域,并且获得了出色的效果。参赛者们也对传统的方法进行了诸多改进,对业务效果提升明显。未来,第四范式还将在自动图表示学习方向上深耕,进一步推动其发展与应用落地。”


此外,作为第一家连续两年举办 KDD Cup 的中国科技公司,第四范式此次加大了赛事投入力度,奖金也为历年最高,达到了34000美金,排名前10的团队均可获得奖金,创新的赛制、出色的组织也得到了KDD主席团的高度认可。


组织多场学术活动引学界关注 持续推动AutoML发展


本次大会虽然采用虚拟方式召开,但仍然提供与往年相同的活动内容,吸引了众多世界数据挖掘领域的顶尖专家、学者参与。为了进一步推动AutoML发展,第四范式参与组织了AutoML Workshop,并与清华大学联合举办了名为“Automated Recommender System”的Tutorial活动,得到了学术界的积极响应和广泛关注。


近年来,机器学习技术的应用领域越来越广泛,为了进一步降低人工智能专家稀缺性和成长周期长造成的影响,AutoML已成为一个非常重要的研究课题。与此同时,如何在真实的业务场景中应用现有的AutoML算法也成为了工业界关注的焦点。在此次的AutoML Workshop中,第四范式联合创始人、AAAI院士、IJCAI理事会主席杨强、德国弗莱堡大学计算机科学系机器学习教授、博世人工智能中心首席AutoML专家Frank Hutter、杜克大学电子与计算机工程系教授Hai (Helen) Li (KDD 2020最佳学生论文的指导老师)、美国德州农工大学数据挖掘实验室主任、计算机学院终身教职系列助理教授胡侠等学术大咖现身说法,通过实际案例讲解了自动迁移学习、自动联邦学习、自动多方机器学习(AutoMPL)、自动推荐系统(AutoRec)、自动异常检测系统(AutoOD)、以及CTR预测任务自动设计架构等技术实践。


此外,在Tutorial活动中,第四范式也与清华大学学者重点围绕特征工程、超参数优化/神经网络结构搜索、算法选择等三个重要课题进行了详细阐述,并介绍了AutoML技术在推荐系统领域的应用。


未来,第四范式还将与更多AutoML技术的研究者和团队开展深入的合作与交流,为AutoML的应用普及提供新的思路和动力。