2019-08-21
分享到江苏科技报记者:葛思佳
本文转载自江苏科技报
近几年来,人工智能技术在国内外掀起了巨大的发展浪潮。著名计算机专家李开复预计,到2025年,AI将无处不在,“AI赋能行业”应用模式在未来将迎来高速成长。然而AI在行业应用落地时,却存在着技术门槛高、专业人才短缺、依赖专家经验、费时费力等诸多困难,导致很多中小企业对人工智能望尘莫及。
李开复曾指出:“每个公司都要有AI,但首先要解决的一点是提供足够的专家人才。”日前,江苏鸿程大数据研究院开发的PASA-AutoML自动化AI建模工具平台,获得了省互联网+创新创业大赛一等奖。该平台可以让机器替代人工智能专业人才完成AI模型的设计,不仅降低了AI技术门槛,还大幅提升了AI生产效率,同时可以实现AI的平民化、普及化。
打造AI行业的“数控机床”
“我们的目的是改变依赖专家的人工低效生产方式,实现AI模型的自动化生产。”该项目负责人朱光辉告诉记者,开发机器学习和人工智能模型需要一个耗时、专家驱动的工作流程。设计AI模型包含多个阶段,每个阶段包含多种可选方法,每个方法包含多组可选参数,这其中组合爆炸,选择空间过大。在朱光辉看来,现在的人工智能建模就好比手工作坊式的生产模式,成本高、效率低。
如何让AI建模本身也变得自动化、智能化、高效化?“用AI技术实现自动化AI建模,可以达到甚至超越人工建模效果。”朱光辉告诉记者,自动化建模中特征、算法与参数的选择就类似于AlphaGo的落子选择和博弈策略选择,通过AI算法降低选择空间寻找最佳选择,达到可以战胜人类围棋冠军的效果。
“之前,构建一个互联网金融注册用户反欺诈的模型,需要两个AI工程师开发三个月,通过我们这个平台只需要一个AI工程师,5天就可以搞定。”朱光辉告诉记者,自动化建模的精度基本持平甚至超越人工设计,可以大幅度提升建模效率,降低人力研发成本,提高人工智能的生产效率。“门槛低了,效率高了,很多人都可以通过这个工具平台去让人工智能落地。”朱光辉表示,PASA-AutoML平台让人工智能变得触手可及,不再是一座高山,企业可以便捷、高效地去使用人工智能,满足行业的智能化分析需求。
核心技术原创且国际领先
目前,PASA-AutoML平台性能优于目前国际上最好的开源自动化机器学习系统Autosklearn,拥有基于强化学习的三阶段机器学习流水线自动化设计、基于自适应连续筛选的模型选择、基于多保真度和贝叶斯优化的超参优化、AutoML算法并行化等多项原创性的AutoML核心算法。与同类型的产品相比,功能丰富、支持各种AI建模应用场景,性能优异。
据了解,朱光辉的博士导师是南京大学PASA大数据技术实验室主任黄宜华教授,他带领的南京大学PASA实验室自2017年初开始从事AutoML自动化机器学习技术研究,是国内较早进入AutoML领域的研究团队。2018年,PASA团队连续两次荣获国际AutoML赛事第三名的优异战绩。日前,在素有“数据世界杯”之称的KDD Cup 2019数据挖掘国际大赛AutoML自动化机器学习竞赛中,该团队从全球860多支参赛队中突颖而出,荣获大赛TOP 10优胜奖,再次在国际AutoML大赛中创造优异成绩,总体处于国际先进水平。
加速AI在各个行业的落地
如今,PASA-AutoML平台可以广泛应用于互联网金融、政务民生、公安警务、医疗健康、智能制造等不同场景,目前已在华为和360等多家大型企业中落地应用验证。“目前就是要把自动化建模技术推广到更多的传统行业。”在朱光辉看来,传统行业或许更需要Au‐toML平台,因为传统行业的人工智能技术人员寥寥无几。AutoML工具平台可以帮助传统行业实现人工智能落地,也可以为大型互联网/ IT企业提供AutoML技术解决方案,大幅降低AI研究成本。
未来,该团队还将进一步开发完善AutoML平台,面向细分行业提供定制化分析的AutoML产品或服务,以自动化和高效易用的方式,支持行业大数据智能化分析建模与应用的快速开发。
“我们就是想让人工智能为人人所用。”朱光辉告诉记者,他们的目标就是打破人工智能高门槛的瓶颈,让AI惠及更多的行业和企业,以此让AI真正普及并赋能行业应用。