在原始森林内部,我们会发现正是由于树木的根系在地下交织在一起,才有了原始森林的整体生态。而以这种生态去考量美国ICT产业强大的原因,我们会发现:硅谷林立的IT豪强背后,是美国傲人的大学群;在此之外,还有无数看不见的社区将产、学、研等各方优势力量融汇于一体。在ICT产业发展的关键时刻,社区生态一次次显露出惊人的力量。
在人工智能的“江湖”里,可谓是“得框架者,得天下”。作为一种复杂的基础软件,深度学习框架的发展之路注定了极少数人“造”轮子,大部分人“用”轮子。这使得国内深度学习框架的发展同样急需一个繁荣的社区生态。于是,围绕着社区生态的打造,“昇腾众智计划”从一开始就注定要为突破而战。
破局人工智能生态
近日,由OpenI启智社区与MindSpore 社区共同举办的“OpenI启智&MindSpore集结号”落下帷幕,在短短的28天里,来自多所高校的29名开发者共完成28个模型交付。作为昇腾众智计划的一部分,“集结号”活动的成果又一次让昇腾众智计划成为了业界的焦点,这源于昇腾“集众人之智”的活动与国内人工智能生态的破局息息相关。
时至今日,人工智能已成为新一轮科技革命和产业变革的核心驱动力,其发展已经演化为一场国际间高科技实力的激烈竞争。围绕着这场竞争,2020年的“新基建”政策和2021年的“十四五”规划都进行了重要布局。
《2019年国家人工智能研发战略规划》报告显示,中国人工智能发展势头很猛,但也存在硬件、算法、人工智能框架、人才等薄弱环节。这表明在这场人工智能的较量中,国内人工智能产业的发展极不均衡。其中,对下完成底层硬件调度,对上支持模型搭建的深度学习框架,已成了国内人工智能产业必须攻下的难关。
作为“智能时代的操作系统”,深度学习框架研发门槛极高。企业将深度学习框架开源,可以帮助行业降低AI开发门槛,避免重复造轮子,极大节省成本和时间。开源深度学习框架的上下游生态非常复杂,需要对接不同的硬件平台,基于它做算法开发,并集合成完整的解决方案。只有形成了较深的产业链条和生态,开源深度学习框架才能真正形成竞争力。当中如果涉及到大量复杂的开发工作,单靠企业自身的力量难以快速推进,还需要借助开源社区集合广大开发者的力量。某种程度而言,开源深度学习框架的竞争,本质上是开源社区的竞争。
近年来,国内人工智能产业中的各路大军开始猛攻深度学习框架,2020年也成了国产深度学习框架的“元年”。其中,华为在2019年推出了全场景AI计算框架MindSpore,昇腾AI全栈就此囊括了系列硬件、AI算子开发的异构计算架构CANN、AI模型开发所需的计算框架MindSpore及AI应用开发的MindX四大关键层,被国内人工智能产业寄予厚望。
MindSpore为昇腾计算硬件平台量身打造,可以在昇腾硬件上实现性能最优,它也能适用于多家硬件平台。作为一个战略平台,MindSpore无疑拥有构建更大体量生态的巨大潜力。2020年3月华为将其开源,MindSpore社区发展迅速,也意味着国内人工智能生态破局已经紧锣密鼓地进行着。作为一个集大成者,昇腾计算产业的生态破局进程必然是“跑步前进+工业级实现”。
华为公司副总裁、计算产品线总裁邓泰华
华为公司副总裁、计算产品线总裁邓泰华在近期的中国软件产业峰会上总结说:“华为聚焦鲲鹏和昇腾基础软硬件创新,通过‘三个开源、三个开放、三个使能’,推进软件产业高质量发展。为此,华为发布了鲲鹏众智计划和昇腾众智计划,通过500多个任务包,1亿多激励资金,汇聚全产业链创新力量,共促多样性计算产业发展和生态繁荣。”
在这样的态势之下,围绕昇腾基础软件平台推出的生态合作计划——昇腾众智计划,其发展进程可谓是牵一发而动全身。一方面,它需要凝聚高校、科研机构的力量,提升昇腾基础软件能力,以便快速丰富算子、模型等,以支撑更丰富的人工智能应用;另一方面,要想实现人工智能与千行百业的实际业务1->N的复制,就要联合众多的行业应用企业,贡献丰富的行业经验积累。而这两方面成败的关键,在于能否通过开源和产业社区集结更多智慧和力量,共同完成这两项使命。
社区生态的成功路径
社区生态的成长有多种路径,如果我们把由极客引导,生存在GitHub上的开源项目视为“原始森林”式生长模式,那么华为围绕昇腾基础软件平台的社区生态合作,则是一种“速生林”式的发展路径。这突出体现在华为坚持的“三个开源”和“三个开放”。
先说“三个开源”,通过开源操作系统openEuler、企业级数据库openGauss、全场景AI计算框架MindSpore,华为积极推进社区开发者和相关企业共同参与到基础软件的研发中,已逐渐形成从底层到顶层的全产业链软件生态。
再说“三个开放”。工欲善其事必先利其器,对于软件产业而言,开发工具就是生产力工具。而华为通过开放通用计算鲲鹏应用使能套件BoostKit、人工智能昇腾应用使能套件MindX,以及面向开发者开放支持全研发作业流程的完整工具链(包括鲲鹏DevKit和昇腾MindStudio),为开发者赋能。
其中,昇腾应用使能套件 MindX 提供了大量人工智能场景所需的模型和行业SDK等,不仅自带质检、目标分类、目标检测等20多种行业场景,开发者还可以通过简单地调用SDK,实现更加丰富能力的调用。而全流程开发工具链MindStudio 则为开发者提供了一套简单易用的开发工具,可高效完成端到端开发,让开发者从算子开发、模型训练、模型推理、应用开发、应用部署的全流程 “拎包入住”,无需在不同工具上完成,显著降低开发门槛。
“三个开源”将华为技术研发的积累投入社区,“三个开放”让开发者获得了利器。在此基础之上,再提供良好的社区服务工作。截至目前,昇腾社区从学、练、用、考、赛等维度为开发者提供了完善的软件资源、专业培训、技术支持、生态政策和产品方案,上线了 50 多个开发者系列课程、1008 本学习资料、100多个 工具与样例及150 多个模 型 。由此带来的,就必然是“三个使能”式的成果。
“三个使能”到底使能了谁
“三个开源”与“三个开放”为昇腾众智计划打下了基础,MindSpore开源社区和昇腾计算产业社区生态由此实现了包括使能上游开源、使能伙伴发展、使能人才发展的“三个使能”。
昇腾众智计划通过公开征集异构计算架构CANN的算子、主流深度学习网络模型和行业参考设计等的创新,实现项目创新;再结合高校算子及模型开发课程和学科建设,提供开发人才培养和实践的支持,促进AI人才培养;也能够基于昇腾社区、MindSpore开源社区,与其他开源、开放社区建立紧密联系和合作,构建高校、科研机构、企业、产业和开源社区等组织技术专家的交流平台,从而促进开放平台、社区的建设和发展。
“三个使能”的直接表现,就是MindSpore及其社区生态正在实现跨越性成长。
一方面,MindSpore自身在社区力量的催化之下,持续高速迭代着。MindSpore自2020年3月正式开源之后,到了2020年9月,就推出了MindSpore 1.0版本;在即将举办的2021华为开发者大会(Cloud)上,MindSpore 1.2版本将提供超大模型的训练能力。按照社区计划,MindSpore1.5接下来还将提供弹性训练、科学计算等特性。
另一方面,MindSpore 社区生态也正在不断壮大中。除了产业合作伙伴之外,作为演绎“众智计划”内涵的最佳注脚,“OpenI启智&MindSpore集结号”活动通过召集广大高校开发者开展模型的众智,开发者共同学习、分享深度学习模型开发的前沿技术,弘扬开源开放文化,目前已经吸引了了大量高校研发资源的参与。
深度学习框架萌芽于高等学府,但由于深度学习框架复杂性高、工程量极大,这些工作并非高校研究所擅长,因此高校出生的深度学习框架,最终都并入了企业,或者被企业所超越。但在深度学习算法方面,高校学生中却蕴藏着极大的创新能力。昇腾众智计划在2020年启动之时,已有浙江大学、上海交通大学、西安交通大学、中国科学院等超过40所高校和科研机构参与;而作为众智计划的重要一环:“集结号”活动更深入了一步,吸引了来自西安电子科技大学、兰州大学、重庆大学、哈尔滨工业大学、东北大学等更多高校团队积极参与MindSpore的模型众智。
MindSpore社区生态的发展,因此正在走上一条“汇众智,集合力”式的发展之路。邓泰华介绍说:“全场景AI计算框架MindSpore自2020年3月正式开源之后,目前已有超过19万的开发者,下载量超过24万,日均下载量600+,超过100家高校选择MindSpore进行教学,超过40家科研团队选择MindSpore进行科学研究,MindSpore已经成为国内第一热度的AI开源社区。”
【结束语】
国内人工智能产业存在着近500万的人才缺口,而MindSpore开源社区内部,通过提供工程化AI训练,加速着国内人工智能人才的培养,进而缩小AI人才缺口。另一方面,华为坚持“硬件开放,软件开源,使能伙伴,发展人才”,让技术研发成果“从社区中来,到社区中去”,也将有助于提升社区技术积累,最终提升社区的创新能力。由此,也许一个AI领域的类似于Hadoop、kubernetes量级的产品,最终会诞生于这些社区,从而将国内人工智能技术水平提升至一个新高度。
—————————————————————————————————
微信关注公众号“懂懂笔记”每天第一时间为您奉上最新最热的科技圈资讯~多年财经媒体经历,业内资深分析人士,圈中好友众多,信息丰富,观点独到。发布各大自媒体平台,覆盖百万读者。《小米生态链战地笔记》、《微信思维》、《微信力量》三本畅销书的作者。
本文来自投稿,不代表消费最前线立场,如若转载,请注明出处:https://www.xiaofei001.com/22248.html