本篇文章2690字,读完约7分钟

根据雷锋的人工智能技术评论,kdd杯自1997年以来已经有20年的历史了。最近,第23届kdd大会在加拿大举行,23rd kdd杯的获奖者将在会上展示他们的成就。

2017年8月13-17日,第23届kdd大会在加拿大哈利法克斯召开,雷锋的《人工智能技术评论》也将第一手报道带到了第一线。从七月到八月,kdd周围有很多热点。起初,加拿大西蒙弗雷泽大学计算机科学学院的裴建博士被选为acm sigkdd的新主席。随后,正式宣布裴建博士获得2017年sigkdd创新奖,香港科技大学教授杨强博士获得2017年sigkdd杰出服务奖。会议开始前吸引了很多注意力。

KDD Cup 20年全回顾:从今年包揽前三甲说起,看中国力量逐年渗透的三大亮点

当然,除了裴建博士和杨强博士的出色表现之外,还有一个议程让本次大会的注意力加倍——加拿大时间8月17日,2017年kdd杯的获奖者将在大会上展示他们的成就。微软、美团和北航大学空航空航天大学的卷积团队在2017 KDD杯的两项任务中获得了第一名。此外,这两项任务的亚军和季军也是中国队。

KDD Cup 20年全回顾:从今年包揽前三甲说起,看中国力量逐年渗透的三大亮点

上图显示的是2017kdd杯冠军队

Kdd杯庆祝成立20周年

自1997年举办以来,这项比赛已经进入了第20个年头。作为数据挖掘领域最具影响力和最高水平的国际顶级赛事,kdd cup每年都会吸引来自世界数据挖掘领域的顶尖专家、学者、工程师和学生。它被称为大数据领域的“奥运会”。

KDD Cup 20年全回顾:从今年包揽前三甲说起,看中国力量逐年渗透的三大亮点

今年kdd cup 2017的任务是在交通领域竞争,要求参赛者根据历史数据预测高速收费站的交通流量和车辆从交叉口到收费站的平均时间。这场比赛有两轮。在第一轮中,玩家需要完成预测算法并在20天内提交测试结果,而在第二轮中,测试数据将会改变,玩家需要在一周内完成新一轮的结果提交。

KDD Cup 20年全回顾:从今年包揽前三甲说起,看中国力量逐年渗透的三大亮点

高速公路收费站是交通网络中众所周知的瓶颈。如果能够提前预测到下一个小时的交通拥堵,交通管理部门可以及时采取措施诱导和控制上游交叉口的交通。Kdd cup 2017希望参赛者能够设计出一套算法来预测交通流量和车辆到达时间,并利用这些算法和数据来增强交通领域的能力,减少拥堵的发生。

KDD Cup 20年全回顾:从今年包揽前三甲说起,看中国力量逐年渗透的三大亮点

2017年初,当kdd杯组委会宣布采纳阿里巴巴云在交通领域的竞赛时,有消息称,此次竞赛源于阿里巴巴云在交通领域实施人工智能et的案例之一。负责阿里巴巴云竞争的闵万里表示,技术垂直化一直是阿里巴巴云的一项重要战略。在交通领域,我们创造了一系列前沿项目,如路况预测和信号灯优化控制,为本次竞赛的技术可行性和商业实用性做出了贡献。

KDD Cup 20年全回顾:从今年包揽前三甲说起,看中国力量逐年渗透的三大亮点

亮点之一:强大的应用背景

纵观kdd杯的历史,不仅在2017年,而且在最近几年,许多试题都有很强的应用背景。

2011年的主题是理解节奏和预测乐谱。本次比赛的数据集是由雅虎音乐提供的超过100万匿名用户的3亿个分数,这些分数是针对歌曲、专辑、艺术家和音乐流派的。比赛有两个任务,一个是准确预测用户的得分,另一个是区分喜爱的歌曲和其他歌曲。

KDD Cup 20年全回顾:从今年包揽前三甲说起,看中国力量逐年渗透的三大亮点

2012年的首要任务是根据腾讯微博的用户属性、社交网络的社交关系和互动记录,预测下一步最有可能被用户接受的推荐项目列表。第二个任务是估计广告的点击率,并提供用户在腾讯搜索到的查询词、显示的广告信息、广告的相对位置和用户的点击量等。以便预测用户在随后时间内对广告的点击。

KDD Cup 20年全回顾:从今年包揽前三甲说起,看中国力量逐年渗透的三大亮点

连续两年,比赛的主题都是推荐系统。对于用户来说,每天面对海量的信息服务信息时,寻找他们感兴趣的内容是费时费力的。对于企业来说,拥有大量的资源,以及如何挖掘数据中的潜在价值以留住用户,也是一个巨大的挑战。个性化推荐系统是解决上述问题的有效工具。

KDD Cup 20年全回顾:从今年包揽前三甲说起,看中国力量逐年渗透的三大亮点

2015年,kdd杯的主题是预测中国最大的开放式在线课程平台唐雪在线的学生逃课率。mooc在线学习平台上的学生逃课率极高,因此预测他们下一步是否会选择逃课将非常有利于保持和激发学生的学习热情。参与者需要根据用户的个人行为预测他们未来10天的逃学率。

KDD Cup 20年全回顾:从今年包揽前三甲说起,看中国力量逐年渗透的三大亮点

智湖的很多网友认为2015年大赛的标题“相当有趣和实用”,也有网友认为这个标题的设置比推荐大画框的束缚更有创意。

此外,教育部在2015年4月发布《关于加强高校网上开放课程建设、应用和管理的意见》时,表示教育部正在密切关注世界范围内迅速兴起的大型网上开放课程(mooc)等新型网上开放课程的发展,并将积极推动大型网上开放课程与高等教育教学改革的讨论。

KDD Cup 20年全回顾:从今年包揽前三甲说起,看中国力量逐年渗透的三大亮点

亮点2:国内企业的参与越来越多

当然,除了试题的深入应用之外,从近年来的竞赛组织者来看,国内企业的频率也越来越高。

如上所述,阿里巴巴云将在2017年举办比赛。阿里巴巴云成立于2009年,隶属于阿里巴巴集团。阿里巴巴云自诞生以来,已经覆盖了欧洲、中东、日本和澳大利亚。本月4日,阿里巴巴云刚刚与澳门政府签署了合作城市人才计划。值得整合的是,阿里巴巴集团也是今年kdd大会的白金赞助商。

KDD Cup 20年全回顾:从今年包揽前三甲说起,看中国力量逐年渗透的三大亮点

2014年的比赛由雪糖主办。由清华大学计算机科学与技术系开发团队基于openedx平台开发的唐雪在线于2013年10月10日正式上线,可为全球用户提供mooc课程。2015年5月,清华大学宣布将启动中国第一个基于混合教学模式的学位项目,即数据科学与工程硕士。目前,唐雪在线已成为教育部在线教育研究中心的研究交流和成果应用平台。

KDD Cup 20年全回顾:从今年包揽前三甲说起,看中国力量逐年渗透的三大亮点

2012年,kdd杯由腾讯协办,试题也基于腾讯微博的海量数据集。目前,腾讯的两大垄断性社交工具——微信和qq,拥有庞大的用户群和海量数据,挖掘和利用缓慢。

KDD Cup 20年全回顾:从今年包揽前三甲说起,看中国力量逐年渗透的三大亮点

上图来自网络,从中可以看出,在2005年至2010年的组织者中,没有一家中国企业。

这一系列的创业团队也证实了国内企业的科研实力越来越强。据业内人士称,竞赛的组织者需要提供竞赛问题和大规模数据,这些数据作为挖掘样本具有很高的前沿应用价值。换句话说,没有深厚的学术积累和行业实践,举办“奥运会”是完全不可能的。

KDD Cup 20年全回顾:从今年包揽前三甲说起,看中国力量逐年渗透的三大亮点

亮点3:中国队越来越高

除了看到国内企业实力不断增强外,雷(公开号:雷)的《艾科技评论》也了解到,中国队取得了一个又一个的好成绩。

早在2004年和2005年,ieee研究员、HKUST大学教授杨强带领他的团队连续两年赢得kdd杯。

2011年,上海交通大学校内和平队获得第三名,2012年,上海交通大学acmclass@sjtu队获得冠军。

2015年,多国军团赢得了比赛冠军。在这个冠军团队中,有两位中国数据科学家分别来自清华大学和网易。

2017年,中国队几乎赢得了前20名。

图为2017年kdd杯比分列表

雷科技评论摘要:纵观杯20年的历史,2010年之前,国内企业和学术界鲜有出现,但2010年之后,腾讯、清华、阿里相继出现。此外,在获奖者中,中国队的影响力日益增加。

KDD Cup 20年全回顾:从今年包揽前三甲说起,看中国力量逐年渗透的三大亮点

雷锋原创文章。严禁擅自转载。详情请参考转载说明。

标题:KDD Cup 20年全回顾:从今年包揽前三甲说起,看中国力量逐年渗透的三大亮点

地址:http://www.hcsbodzyz.com/hcxw/5536.html