【新闻动态】南京大学PASA大数据实验室在NIPS 2019 AutoDL 自动化深度学习国际挑战赛中荣获第三名

2020-05-14

分享到

近日,由人工智能国际顶级会议NIPS 2019举办的全球首届AutoDL 2019-2020国际系列挑战赛正式落幕。


南京大学PASA大数据实验室代表队PASA-NJU, 经过3个多月、2个阶段的激烈角逐,最终在NIPS AutoDL最后收官之战的挑战赛中,荣获大赛国际第三名的佳绩!


参加本次NIPS AutoDL大赛的PASA大数据实验室团队成员包括:朱光辉博士(队长)以及程锋、许卓尔、邱孟川、汪文杰四位研一硕士生同学。


自2019年5月以来,NIPS 2019前后举办了一系列不同类型的AutoDL自动化深度学习大赛。作为NIPS AutoDL自动化深度学习国际系列挑战赛的收官之战,此次AutoDL Challenge 竞赛从2020年1月开始,历时3个多月,其技术性堪称史上最难,要求参赛队伍研究开发出针对多模态、多领域数据的高效、通用化自动化深度学习方法,能综合解决好包括图像、视频、语音、文本和结构化表格数据的自动化多标签学习和分类问题。


本次竞赛吸引了美国、德国、瑞士、日本、韩国等多个国家的参赛队伍,集结了国内外AutoML/AutoDL领域最具实力的研发团队,包括来自清华大学、北京大学、南京大学、卡内基梅隆大学、首尔大学、弗莱堡大学、汉诺威大学等国内外著名高校,以及 Google、微软、阿里、腾讯、浪潮等国内外IT企业巨头的参赛团队。


NIPS(或NeurIPS),全称“神经信息处理系统大会(Conference and Workshop on Neural Information Processing Systems),是机器学习和人工智能领域的顶级国际会议。此次NIPS会议举办的大赛为全球首届AutoDL挑战赛。对于首届AutoDL大赛的期望,大赛组委会负责人之一、第四范式资深算法科学家涂威威表示:过去AutoML比赛主要集中解决结构化数据的应用问题,本次AutoDL挑战赛参赛者将面临多种结构化和非结构化数据综合学习的新问题,挑战难度更大。比赛不只局限在单一数据类型和技术领域,而是希望构建一套通用化的技术方法和系统,适用于多种数据类型和领域,包括图像、视频、语音、文本和结构化表格数据,以推动AutoDL技术的落地应用及快速发展。


NIPS AutoDL挑战赛历经3个多月,分为两个阶段,包括 Feedback初赛阶段和Final 终赛阶段。


在Feedback初赛阶段,参赛选手基于 24 个训练数据集,离线开发自己的 AutoDL 算法和程序,实现训练数据处理、模型结构设计、参数调优等过程。然后将自己的 AutoDL 算法和程序代码上传到比赛平台上,通过另外 5 个线上私有数据集进行测试,得到程序性能的即时反馈。


在Final 终赛阶段,参赛选手的 AutoDL 程序在无任何人工干预的前提下,通过 10 个私有数据集进行测试评估(其中每个数据类型包含2个数据集)。最终阶段多轮评估的平均排名将决定获胜者。


人工智能已在国内外掀起了巨大的发展浪潮。著名计算机专家李开复预计,到2025年,AI将无处不在,“AI赋能行业”应用模式在未来将迎来高速成长。然而AI在行业应用时,存在着技术门槛高、专业人才短缺、依赖专家经验和手工作坊式生产、费时费力、建模周期长、效率低下的痛点,给行业AI应用落地带来诸多困难。


为此,近几年来,国内外出现了AutoML自动化机器学习技术,其目标是以机器替代人工建模,以AI设计AI。一方面,可以降低人工智能使用门槛,减少对AI专业人才的要求,让普通数据分析师和应用开发者都可以快速完成AI建模,实现AI技术的平民化。另一方面,可以大幅提高AI建模效率,将建模周期从数月时间短至数天,大幅降低AI应用开发周期和成本。由于行业应用对AutoML的巨大需求,Gartner2019 AI技术报告显示,AutoML已成为全球AI领域的技术热点。


近年来,深度学习技术飞速发展,并已在语音识别、图像识别、文本分类等领域取得了重要进展,这也促使了深度学习技术需求量的大幅增加。然而,该技术的实现仍然需要大量的专家经验和人工成本。因此,AutoDL自动化深度学习技术在全球备受关注。


目前,AutoML已经成为大型IT和互联网企业大数据和人工智能系统平台的必备技术,可大幅降低企业AI建模的周期和成本。拥有诸多高水平人工智能专家的大型IT和互联网企业都如此需要使用AutoML技术和工具,诸多缺少AI技术人才的行业/企业,对AutoML会有更大的应用需求。AutoML以自动化和高效易用的方式,将能大幅降低AI建模的技术门槛,提高行业大数据智能化建模效率,支持行业大数据与人工智能应用的快速落地,让人工智能为人人所用!


PASA大数据实验室Auto ML研究与成果

南京大学PASA大数据实验室自2017年初开始从事AutoML自动化机器学习技术研究,是国内最早进入AutoML领域的研究团队之一。在几年来的初步研究探索中,积累了一系列研究工作基础,取得了一系列研究成果。研发团队在AutoML领域研究水平居于国际先进行列,得到国内外AutoML领域专家的高度肯定。自2018年以来,研发团队已经连续8次在各类国际著名的AutoML大赛中参赛并以优异成绩获奖,体现了PASA大数据实验室在不同数据类型(表数据、时序数据、图像、视频、文本、语音)和不同学习方法和任务类型(机器学习、深度学习、弱监督学习以及终生学习)的自动化机器学习技术方面,均具有很强的技术实力。

2019 NIPS AutoDL(自动化深度学习) 国际建模大赛第3名
2019 NIPS AutoSpeech / AutoDL(自动化语音/自动化深度学习)国际建模大赛第1名
2019 KDD Cup AutoML(时序关系数据AutoML)国际大赛第8名(全球860支队伍)
2019 ACML AutoWSL(弱监督自动化机器学习建模)国际大赛第4名
2019 WAIC世界人工智能大会 AutoNLP(自动化自然语言处理建模)国际大赛第7名
2018 NIPS AutoML(终生学习AutoML)国际建模大赛第3名(全球360支队伍)
2018 PAKDD AutoML国际大赛第3名(全球250支队伍)


2019年10月,南京大学PASA大数据实验室联合江苏鸿程大数据研究院,以“PASA-AutoML:人工智能自动化建模工具平台”项目参加了由教育部主办的第五届中国“互联网+”大学生创新创业大赛,并荣获全国金奖。“互联网+”大学生创新创业大赛是中国创新创业类竞赛第一赛,是李克强总理亲自提议并批示举办的国家级大赛,受到习近平总书记和李克强总理的高度重视。


实验室与研究院的相关AutoML技术成果与软件已在华为、360等知名企业得到推广应用,在保持模型性能不低于专家人工设计模型的前提下,自动化建模效率可提升20-30倍。


PASA-AutoML自动化AI建模工具

自2017年初以来,南京大学PASA大数据实验室在AutoML技术领域开展了一系列系统深入的研究开发工作。实验室所积累的系列AutoML技术成果,已经形成完整的AutoML软件系统工具平台,并已由南京大学授权江苏鸿程大数据研究院进行成果转化。目前,研究院已成功研发出方便易用、功能丰富的AI自动化建模工具PASA-AutoML(【产品介绍】PASA-AutoML——人工智能自动化建模工具平台),以此助力行业/企业大数据与人工智能应用快速落地。



PASA-AutoML自动化AI建模工具具有以下功能特点:


自动化建模功能丰富:支持机器学习流水线的全过程自动化设计,支持分类、回归、聚类及深度学习等自动化算法模型选择和参数调优,支持深度神经网络结构自动化搜索、深度集成学习结构自动化搜索


技术原创,建模性能优异:性能优于已有的开源AutoML系统,并多次在国际AutoML大赛中获奖,核心技术原创且国际领先


落地化系统,扩展性强:所研制的AutoML技术方法,成为落地可用的系统产品,提供跨平台统一算法接入层,用户可以灵活地接入不同计算平台下的算法底层,可支持TensorFlow、Spark MLlib、scikit-learn、XGBoost等各种开源的人工智能算法平台


方便易用:可与可视化编程平台集成使用,可在拖拽式可视化编程环境中自动化选择算法模型和参数,也可提供简单易用的AutoML编程API,供代码编程时调用