最近,“新基建”真是火出了(le)圈。尤其是3月4日,中央政治局常委会会议(yì)研究(jiū)当(dāng)前(qián)新(xīn)冠肺(fèi)炎疫情防控和(hé)稳定经济社会运行重点(diǎn)工作,其中提出(chū)“加快5G网络、数据(jù)中心等(děng)新型(xíng)基础(chǔ)设施建设进度(dù)”,为“新基建”摁下(xià)快进键。事实上(shàng),“新基建”不是一(yī)个(gè)新概念。2018年底召(zhào)开(kāi)的中央经济工作(zuò)会议就明确(què)了5G、人工智能(néng)、工业互联(lián)网、物联网等(děng)“新型基础设施建(jiàn)设”的定位,随后“加强(qiáng)新一代信息基(jī)础设施建设”被写入2019年(nián)政府工作报告。2020年(nián)开年的首次国务(wù)院常务会议也明确提(tí)及“新基建”。
在当前疫情(qíng)防控和经济恢复的大背(bèi)景下,由于在(zài)稳定投(tóu)资等方面的(de)巨大作用,“新基建”进入一个加速(sù)推进的快车道。
华(huá)为,清(qīng)华大学,旷世等人工智能企业开源,推动新基(jī)建发展3月20日,清华大(dà)学计算机系图(tú)形(xíng)实验室开源(yuán)AI框(kuàng)架计图(Jittor),这是由(yóu)中国(guó)科学(xué)界(jiè)开源(yuán)的首个AI框架。接着3月25日,旷视科技在线(xiàn)上发布旷视AI生(shēng)产(chǎn)力平(píng)台Brain++,同时,也宣布开源新(xīn)一代AI生产力平台(tái)Brain++的(de)核心深度(dù)学习框(kuàng)架(jià)旷视(shì)天元(MegEngine)。紧接着28日,华为在2020年开发者大会中(zhōng)宣布正式开(kāi)源一款支持端边(biān)云(yún)全场景的深度学习训(xùn)练(liàn)推理(lǐ)框架(jià)MindSpore。
其实,开(kāi)源(yuán)深度学习框架的重要性(xìng)不言(yán)而喻。在传(chuán)统深度学习研发中,产品从原型到(dào)生产(chǎn)部(bù)署(shǔ)往往(wǎng)需要分开设计并(bìng)调用训练框架和推理框架(jià)两种框(kuàng)架,这就导致模型在(zài)训练和推理的(de)转换(huàn)的过程中容(róng)易出(chū)现不明原(yuán)因的性能(néng)或精度损失,需要开发者手工进行优(yōu)化,而算法在计算平台部署的时(shí)候出(chū)现的各种问题也无法追(zhuī)溯。
针对以上问(wèn)题,开源框架在设计之(zhī)初就可以很好规避,它不仅可以降低(dī)AI开发门槛,还可以提升算法研发效率。
开源意义:技术(shù)开放与(yǔ)AI快速落地
那(nà)么,什么是开(kāi)源深度学(xué)习框架?
在讲述深度学习框架之前,首先先了解(jiě)深度学习。
大多数人(rén)对(duì)于深(shēn)度(dù)学习并(bìng)不(bú)陌生,深度学习即(jí)Deep Learning,源于人工(gōng)神经网络的研究,是机器(qì)学习的一个分支,它主(zhǔ)要依赖于深(shēn)度神经(jīng)元(yuán)网络,这种深度神经元网络就类似于人(rén)类的大脑(nǎo),其学习过程也与人类极其相(xiàng)似,并且还可以用海量的(de)数(shù)据和高级算法(fǎ)来提高(gāo)自主学习与分析事物(wù)特征的能(néng)力。
而开源(yuán)深度学习框架则是在深度学(xué)习(xí)初始阶(jiē)段基础之(zhī)上,由深度学习研(yán)究开发者(zhě)将大量重复代码写成一个框(kuàng)架,然后(hòu)放到网上(shàng)让所有其他(tā)研究(jiū)开发者(zhě)一起使用,主要是(shì)为了(le)提高研究开发者的(de)工作效率。
所以,“开源”就意(yì)味着开放自己的(de)源代码给别人查阅和使用,开发者可(kě)以将开(kāi)源(yuán)框架用(yòng)在任何平(píng)台,任何领域里。例如,如果有图像数据,就(jiù)可以(yǐ)将(jiāng)开源框架用在图像识别领(lǐng)域,如(rú)果有语(yǔ)音数据就(jiù)可以将开源(yuán)框架用在语音识别里等等。对(duì)于使用者而言,开(kāi)源框架即拿即用。
早前,百度高级副总裁(cái)、AI技术平台体(tǐ)系总负责人王海峰就表(biǎo)示:“开源、开放(fàng)对于(yú)人工智能时(shí)代至关重要。首先,人工智能技术(shù)的发展需(xū)要(yào)所有人的协同推(tuī)进(jìn),因(yīn)此(cǐ)开源、开放就显得特别重要;其次,人工(gōng)智(zhì)能技术会赋能各(gè)行各业,开源、开放可以让各行各业便捷地使用(yòng)人工智(zhì)能(néng),让社会(huì)各(gè)界都受益”。
旷视科技则把开源框(kuàng)架做了一个很好理解的比喻(yù),他们向笔者称,开源(yuán)框(kuàng)架的作用就是为(wéi)开发者提供一(yī)个良好的开发环境,如果(guǒ)把算法(fǎ)研发比做炒菜的过(guò)程,有无(wú)框架的区(qū)别就是,现在(zài)不需要厨(chú)师自(zì)己去造锅、生(shēng)火(huǒ)和洗菜,直接炒菜就可以了。

旷(kuàng)视科(kē)技天元开(kāi)源框架
“开源框架就是(shì)让研发人员获得(dé)从数据到算法(fǎ)产业化的一揽子技术能(néng)力,不用重复(fù)造(zào)轮子也可以推进AI快速落(luò)地。”旷(kuàng)视科技表示。
对(duì)于开(kāi)发者来说(shuō),“开(kāi)源”最大的意义就(jiù)在于其“技术共(gòng)享与共(gòng)建(jiàn)”。旷视科技介绍,“20世纪末(mò)期,Linux 系统为中国开(kāi)发(fā)者打开了通(tōng)往开源“集市”的大(dà)门,开源软件为国(guó)产操作系(xì)统和国产(chǎn)软件平台从0到1开辟了基础,同时中国的开发者(zhě)们(men)也为国际的开源社区做出了(le)大量的贡献”。
开源(yuán)社区的发(fā)展壮(zhuàng)大和成果共享,促使很多企(qǐ)业实现了快速的成长,同(tóng)时也触发了(le)技术(shù)的加速迭代(dài),和大批信(xìn)息技术人才的涌现。
开源(yuán):利于(yú)企业生态化(huà),加快新基建(jiàn)步伐
据笔者(zhě)了解,在旷视、华为等(děng)发布(bù)开源之前,早在2016年,百度就开放了自主研发的开源PaddlePaddle深(shēn)度学(xué)习平台。据(jù)了解,百度PaddlePaddle是国内最早的开源深度学习框架,并(bìng)且(qiě)打破了(le)国产AI框架(jià)的开源。
除百度开源PaddlePaddle外,还有脸书Torch、蒙(méng)特利尔理工学院Theano、谷歌Tensorflow、腾(téng)讯Angel、阿里X-DeepLearning等。据悉,目(mù)前,全球市(shì)场被脸书(shū)Torch、谷歌Tensorflow占据了90%以上的开发者(zhě)市场(chǎng)。
笔者查询资料获悉:此前,百度相关人士曾对媒体介绍道“深(shēn)度学习(xí)框架就(jiù)像智能(néng)时代(dài)的操作系统,它向下连接芯片、大型(xíng)计算(suàn)机(jī)系统,向上承接各种业务模型、行业应用,在生态(tài)中处于核心位置,如(rú)果一(yī)直基于海外谷歌和Facebook的框架(jià),等着别人开放(fàng)功能,会丧失(shī)率先打开未知领域的机会(huì)”。
同时,如果只偏重在上层应用、忽视了底层技术,国内(nèi)底层(céng)人才将空(kōng)心化。
亿欧(ōu)智库产业互联网研究副总监薄纯敏也向笔者表示:“目(mù)前,国内研发开源深度学习(xí)框架的企(qǐ)业比较少,而且也没有(yǒu)非常核心的开(kāi)源深度学(xué)习框架(jià),市场几乎被(bèi)谷歌与(yǔ)脸(liǎn)书占据”。
她分(fèn)析,国内企(qǐ)业开发开源框架主要有两个原因:第一、大公司想要通(tōng)过开源(yuán)框架建立(lì)企(qǐ)业生态化;第二、大公司建立完生态化后,希望(wàng)通过技术或产品(pǐn)的开(kāi)源,去获取想要的数据资(zī)源,然后对这些数据进行分析与(yǔ)整合,再利(lì)用。
开(kāi)源的(de)本(běn)质是开放,而目前开源是被大(dà)多数企业当作战略来(lái)发展的,因为所有行业最终的目标就是通(tōng)过开放实现生态化。就拿腾讯来说,第一(yī)步,它是通(tōng)过开放来进行企业生态化;第二步,则是通过生态来给(gěi)社会、企业等(děng)提供开源(yuán)框架的解(jiě)决方案。
除此(cǐ)之外,开(kāi)源框架对初进入AI行业的初创(chuàng)公司而(ér)言,可以很好降低最开始(shǐ)的研究(jiū)基础门槛;对于本(běn)身就对(duì)AI技术比(bǐ)较感兴趣的爱好者(zhě)而(ér)言(yán),他们不一定会商业化,他们可以会通过开源(yuán)框架做一些小的系统研发(fā)。不仅如此,开源(yuán)框架(jià)还(hái)可以(yǐ)构建全社(shè)会(huì)技术共(gòng)享的大生(shēng)态。
在笔者看来,AI作为新基建中的一部(bù)分,开源深度学习框(kuàng)架进(jìn)一步加速了AI技术落地,这对于最近(jìn)大家比较(jiào)关注(zhù)的新基(jī)建项目也有很大促进作(zuò)用,AI 加速落(luò)地在一定程度(dù)上,也(yě)可加快新型基础(chǔ)设(shè)施建设的步伐(fá)。旷视(shì)科技表示:“通过开源(yuán)、开放的方式,可以(yǐ)让每一个AI开发者(zhě)都有能力快速实现算法从0到1的创造,进而创造更(gèng)大(dà)的价值”。
不过,从目前的现实情况来看(kàn),开源(yuán)深(shēn)度(dù)学习框架确(què)实(shí)可以给AI行业技(jì)术落地(dì)带来促进作用,但是也会导致一些底层技(jì)术研(yán)发的滞后。薄纯敏称(chēng),“这就(jiù)好比现在大(dà)家用的手机一样,大部(bù)分都局限于androids与(yǔ)ioses系统,这些(xiē)系统本(běn)身(shēn)很好(hǎo),大家都可以用,但是却(què)不利于行业(yè)底层技术的多元化发展”。
开源框架的使用也一样,当开源框架(jià)开放(fàng)后,大家就会拿来即用,会(huì)停留在一些开(kāi)源(yuán)框架中(zhōng),而不去(qù)思考、不去进(jìn)行更深层次的多元化(huà)开源底层技术研发。