11月8日,猎豹移动董事(shì)长兼(jiān) CEO 傅盛(shèng)出席第(dì)五届世界互联网大会(huì)“物联网:连接无处(chù)不(bú)在”论坛,并(bìng)发(fā)表题(tí)为《真开(kāi)放·全(quán)链条AI技术赋(fù)能物联(lián)网》的主(zhǔ)题演讲。
猎(liè)豹移动董(dǒng)事长兼CEO傅盛
傅盛表示,即便是在今(jīn)天的生(shēng)产线上,也很难解决设备智能化的问题,而AI让机器第一次拥有了人类的感知能力,也(yě)让物联网终端更(gèng)聪明。这是一(yī)个巨大的分(fèn)水岭,使得(dé)AIoT的概念开始出现。在行业(yè)和自身(shēn)的变革背景下,猎豹移动携旗下人工智(zhì)能公司猎户星空(kōng),研发了包(bāo)括语音识别、视觉识别(bié)、室内导航平台等(děng)在内的(de)行业唯一全链(liàn)条AI技术。
他说到(dào),“我们(men)未(wèi)来不(bú)会单做一款硬件,我们致力于打造AI赋能的云端操作系(xì)统,跟(gēn)开发者一(yī)起做更多(duō)的物(wù)联网设备。”
以下是演讲全文:
首先,我花一点时间介绍一(yī)下(xià)猎豹(bào)移动。猎豹移(yí)动是一家经历过三次跨越的公司,2010年(nián)由我自己创办的可牛影像和金(jīn)山安全(quán)合并(bìng)而成。
当时我们经历的第一波是PC杀(shā)毒软件免费化,实现了第一次的增长。
第二波在移(yí)动互联网(wǎng)的时(shí)候(hòu),我们碰到了强大的(de)对(duì)手,决定(dìng)出海。我(wǒ)们是第(dì)一家大(dà)规模的把用户做到海外的中国公司。今天,猎豹移动大概有5亿多的月度活跃用户,其中(zhōng)80%来(lái)自于海外,完全走出了一条(tiáo)不一样的(de)曲线,我(wǒ)们内(nèi)部叫做(zuò)“天外飞仙”。所以(yǐ)我们(men)现在依然(rán)是Google工具排行榜的第一,我们(men)游(yóu)戏的下载次数在全球接近(jìn)20亿(yì)次。
第三波是在2014年上(shàng)市(shì)以后。我当时就意识到,整个移动互(hù)联网(wǎng)的风口(kǒu)将尽(jìn),我们需(xū)要寻找下一个机会。我们(men)在硅(guī)谷、以色列(liè)都投资了(le)基金,由此看到了人工智能的(de)机会。
AI让机(jī)器拥有感知能力 全力以赴打(dǎ)造全链条AI技术
我对人(rén)工智能有一些自己的理解和(hé)思(sī)考,我们讲了很久的物(wù)联网、智能硬件(jiàn),其(qí)实在AI或(huò)者(zhě)人工智能出现(xiàn)之前,所有(yǒu)的智能硬件都(dōu)是伪智能硬件(jiàn)。那个(gè)时候的智能硬件本(běn)质(zhì)上是(shì)联网硬件,你要掏出手机进行操作。大概在三五年前,各种智(zhì)能(néng)硬(yìng)件的行业(yè)都起(qǐ)来了(le),但是很快这个行(háng)业又衰落了。
我甚至想要把机器人行业划分(fèn)成两个分(fèn)水(shuǐ)岭。在AI出现之前的(de)机器(qì)人(rén)本(běn)质上(shàng)都是自动(dòng)化机(jī)器(qì),没有人的属性(xìng)。我们(men)看产线上那(nà)么多漂亮的机械手,其实(shí)都(dōu)是(shì)通过非常原始的编程(chéng)和(hé)自动化(huà)的设备进行(háng)生产的。即便今(jīn)天在生产线上,也很(hěn)难解(jiě)决智能化的问题。
但(dàn)AI出现(xiàn)以后,第(dì)一次让机器有了(le)人(rén)类的感知(zhī)能(néng)力,我们以前(qián)的摄(shè)像头看(kàn)到的(de)都是0101等一串数字,但今天摄像(xiàng)头看到的是人脸;以(yǐ)前看到的语音是波(bō)形,我们(men)现在看到的语音(yīn)是文字。
机器开(kāi)始有了人类(lèi)的(de)感(gǎn)知能力,使得(dé)AIoT的概念开始出现,看到这个机会以(yǐ)后,我们就去做了行业(yè)唯一的全链条AI技术。包括(kuò)语(yǔ)音识(shí)别、视觉识别、导航、机械臂、麦克(kè)风阵列等,为(wéi)什(shí)么要做呢?
这是从内外(wài)两(liǎng)个方面(miàn)思考(kǎo)的(de)。
第一个(gè),猎豹移(yí)动在以前做的太快了。我们就做一个小工具,居然就上市了。后来等到(dào)Google发政策不让我们做工具,手机厂商都开始自己做工具的时(shí)候,我(wǒ)们的日子就变得(dé)很(hěn)艰难(nán)。所以我(wǒ)当时就想,拥有自己的底(dǐ)层技术(shù)很(hěn)关键。
第二个,因(yīn)为AI行业还(hái)处于早(zǎo)期(qī)。很(hěn)多技术都不(bú)完善,或者没有形成产业分(fèn)工。但(dàn)很多(duō)开发者,拿一(yī)块板(bǎn)子,拿一(yī)个所谓(wèi)的开放平台,就(jiù)想实现(xiàn)很好(hǎo)的语音识别效果,其实是非常难的(de)。以智能音箱为(wéi)例,换一个外壳罩上去,算法就(jiù)得调整,因为混响不一样。就像,在(zài)你(nǐ)的(de)耳朵上加一个耳塞(sāi),听力就可能大幅度下降,和你的大脑聪(cōng)不聪明没关系(xì)。所以整个人工(gōng)智能产业(yè)的(de)链条都非常(cháng)新(xīn),又没有足够的分(fèn)工。
第三个(gè),我意识到(dào),AI其(qí)实并不算是一个不可逾越的黑科技。很多人都说,BAT才能做AI,或者人家的积累更好一点(diǎn)。但是今天看来,开源代(dài)码会(huì)远远丰富于任何一(yī)个时代(dài)。很(hěn)多大(dà)洋彼(bǐ)岸(àn)的论文出现之(zhī)后,中国的工程师就很快把它实现了(le)。所以,好处就在于(yú),AI大大(dà)降低了技术壁垒(lěi)。而且AI使得以前很多公司的积累变得无效,大家处在同一起跑线(xiàn)上。我们认为(wéi),这是一个弯道超车的好机会。
所以,我们当时就下(xià)定决心,把所以技(jì)术全都干了一遍,全力以赴(fù)打(dǎ)造全链条(tiáo) AI 技术。全干一遍(biàn)的好处就是,我们能够自主调整很多细节。
语音(yīn)交互实现了命令的自然化(huà) 可能颠覆手机的中(zhōng)心地位(wèi)
我(wǒ)认为真正有智能的第一个硬件品(pǐn)类,应该是智(zhì)能(néng)音(yīn)箱,我一直在想,语音识(shí)别是(shì)什么东西?今天有(yǒu)人谈“语义理解能力超过人”。只要看到这种标题,基本上都是骗子。
为(wéi)什么这么说(shuō)?在语义的理解(jiě)上,AI离人有(yǒu)巨(jù)大(dà)的差距。因为语言是人类超级牛的发明,你(nǐ)能够(gòu)把你对世(shì)界的理解,压缩成一串很短(duǎn)的文字输入给对方,对方(fāng)听(tīng)完以(yǐ)后,能把这(zhè)个图像、事件(jiàn)还原出来,这是个相当(dāng)牛的能力,人类之间的交流是(shì)带有巨大的信(xìn)息压缩和背景知识的。
所以,今天机器完(wán)全做不到(dào)。AI想在阅读理解(jiě)上(shàng)超过人类,那是在一个(gè)很(hěn)有限的短文章(zhāng)里,没有实际意义。
真(zhēn)正的(de)语音(yīn)操作是什么?我(wǒ)认(rèn)为(wéi)它的本质是实(shí)现了命令(lìng)的自然化(huà)。乔布斯有一句话说,每一次(cì)交(jiāo)互操作的演进都是一次革命。苹(píng)果有幸抓住了两次革命,第一个(gè)是抓(zhuā)住(zhù)了键盘和鼠标,第二(èr)个是抓住(zhù)了触摸(mō)屏。
今(jīn)天(tiān)的手机(jī)不是因为它(tā)有多么(me)智能,而是因为它有强大(dà)的处理(lǐ)能力,你可以(yǐ)非(fēi)常方便地touch。所以手机立刻(kè)取代了以前的(de)PC、电视,成为了你的(de)中心位置。
但语音使得(dé)手机(jī)的中心位置有可能被颠覆掉,你(nǐ)想(xiǎng)象一下(xià),语音是什(shí)么?比(bǐ)如,你(nǐ)想看《延禧攻略》,以往你需要从口袋里掏一个东西,解锁、搜索,未来可以(yǐ)用(yòng)语音就直接唤醒:我想(xiǎng)看《延禧攻略》。
我甚至认为,虽然手机(jī)还是个非常关键性的设备,但下一代设备都可(kě)以变得去(qù)手机化。
两年前,我们是业(yè)内第二款做(zuò)智(zhì)能音箱(xiāng)的厂(chǎng)商。我们(联合喜马拉雅)做(zuò)了一款小(xiǎo)雅音箱,当时很多人就问(wèn)我(wǒ),智能(néng)音箱有(yǒu)多智能呢(ne)?我回答:你不要考虑它有(yǒu)多智能,你只要考虑它是个摇控器,能够非常简单地(dì)点歌、了解天气,设(shè)置闹钟。我们(men)买(mǎi)来(lái)了对手的产品,我们发现点歌根本点不准,只(zhī)有50%的准(zhǔn)确率。为(wéi)什么?不是语音(yīn)识(shí)别的问(wèn)题,而(ér)是内(nèi)容上(shàng)的问题。比如说(shuō)今天抖音出了个神曲叫(jiào)《我们一起(qǐ)学猫叫》,你的曲库里(lǐ)得有这首歌。有的时候用户说(shuō)叫“学(xué)猫叫”,有的说喵喵喵(miāo),有(yǒu)多种的说法。这不是(shì)一个智能(néng)的活儿,这是(shì)个产品(pǐn)的活儿。
所以我们(men)就把音乐(lè)的点(diǎn)播率和内容(róng)的点播率(lǜ),这一件(jiàn)事儿做好了。当时,我觉得智能音箱的核心不(bú)是它有多智能,而(ér)是一种新的交互模式。这种新的交互(hù)模式本质上就是一个摇控器(qì),它把极其复杂难用的(de)摇(yáo)控器给改(gǎi)掉了,这个进步是(shì)非常巨大的。
iphoness刚出来的时候,大家(jiā)说这个没有全键盘、没有(yǒu)硬键盘怎(zěn)么用,输入内容太慢了(le)。但就是因为它方(fāng)便,你可以容(róng)忍它非常多不(bú)够快速的地方。
我们赋能了很多物联网的中枢,我坚定的(de)认(rèn)为,语音是下一代操(cāo)作系统的(de)界面,它一定可以使得物联(lián)网的(de)很多(duō)设备变得智能。可以跟你直接交互,不需(xū)要通过手(shǒu)机APP的方式,它自(zì)己就被赋能了。我们跟(gēn)很(hěn)多厂商合作了很(hěn)多款音箱(xiāng),因为我们觉得打音箱上的战役可能打(dǎ)不过,但是合作是有机会的。
人工智能不会颠覆人 只要(yào)一点(diǎn)突破就(jiù)会带(dài)来变革
我(wǒ)们(men)还做了一款能移动的售卖机——零售(shòu)机器人豹(bào)小贩,它会主动(dòng)问你是否需要(yào)商品,用户扫描二(èr)维码(mǎ)就可以购买(mǎi)。看到人多的(de)地(dì)方它就会过去,因为它有人脸识别技术(shù)。以前,售(shòu)卖机只能放在一(yī)个地方,如(rú)今,自动售卖机的售卖效率,大概(gài)是传统的三(sān)到五(wǔ)倍(bèi),用(yòng)互联网的定律看,当多一个链接,互联网就(jiù)损失了(le)50%以上的流量。而在线下(xià)零售端,当你从原有的位置走出来,让(ràng)用户看(kàn)到(dào)有一点点改进(jìn),效率的改变是巨大的。
在机械(xiè)臂方面,我专门去发那科看过他们的(de)生产线。我个人觉得,在精密(mì)制造上和日(rì)本、德(dé)国企业去比拼,是没有机会的。因为(wéi)他们是三十年的积累,可以用(yòng)机械(xiè)臂生产(chǎn)机(jī)械臂。但是他(tā)们面临一个问题:整个产线投产周期非常长,他(tā)要改变一个产(chǎn)品的时候,整条产(chǎn)线都要(yào)变,成本非常高。
我一直在想,AI 出现之后,可能不需要精密的机械臂,来做(zuò)生产。我想到我奶奶的(de)手(shǒu),哆哆嗦嗦(suō)的,但她仍然能(néng)够织毛衣,还(hái)可以穿针引线。核心(xīn)不是因为她的肌肉能够多么精确地控制,而是因为她能用(yòng)眼(yǎn)睛做最后一点点调整。
受此(cǐ)启发,我们在机械臂上加上了摄像头(tóu),使得它去抓(zhuā)杯子的时候,杯子怎么样放(fàng)都可以抓得到,这样可(kě)以降低对机械臂精度的要求。
做机械(xiè)臂(bì)的机床,如(rú)果从日本买,大(dà)概(gài)需要 2000 万的投资,六个月之(zhī)后拿货,我(wǒ)们现在(zài)正在(zài)尝试用韩(hán)国产的机床为我们做谐波减速(sù)器,未来可能用国(guó)产的机床。虽然精度降低了一点点(diǎn),由于由于有(yǒu)视觉技术,所以它最后肯定能完成动作。
因为机械臂最大的成本就来自于谐波减速器(qì),我们正在做的(de)机械臂,未来(lái)可以降到市场价格的三分之一。当机械臂(bì)的价格降低,可能(néng)会产生(shēng)新的、比工业市场大十(shí)倍的市场,市(shì)场增大十倍之(zhī)后,成本又会进一(yī)步降(jiàng)低。在(zài) AI 赋能之后,机械臂是有可能实现跨(kuà)越式(shì)增(zēng)长的。
在(zài)接待服务方(fāng)面,如果大家有兴趣的话,可以去猎豹(bào)移动参观一下。我们的(de)前台已经(jīng)是机(jī)器人接待了(le),我们是一(yī)家没有前台的公司,只有(yǒu)机器人。你来的时候,我在OA上提一个申请,然(rán)后你(nǐ)会收到一(yī)条数字码(mǎ),机器人就会过(guò)来。你(nǐ)跟它说“我来面试(shì)”或者开会,把数字码输上,它给你拍张照,在我们的闸(zhá)机上刷一下(xià)脸,你就可以(yǐ)进(jìn)入(rù)公司,它也会带你去会议室。
今天讲人工(gōng)智能,很多(duō)人太强调所谓颠(diān)覆人的(de)智能,这条(tiáo)路我还没有(yǒu)看到颠覆人(rén)的地(dì)方。但核心是有可(kě)能实现一点(diǎn)点突(tū)破,比如(rú)说它能够把(bǎ)原来的0101这种信号,对(duì)应成真正的人脸和语音的字节的时候,其实我觉得这个机会就已经非常(cháng)非常(cháng)巨大了。它会让(ràng)很多设备(bèi)具备(bèi)人(rén)的(de)感知能力,在一(yī)个非常垂直的领域,完成一点点(diǎn)工作。这一点(diǎn)点工作,可(kě)能会带来巨大的变(biàn)革(gé)。
我们最(zuì)近(jìn)刚跟一个酒店(diàn)签约(yuē),我们(men)的音箱进酒店了。以后你到(dào)房间以后,你就直接可以说(shuō),开灯。你可以(yǐ)跟音箱说:“给我来(lái)支牙刷”,酒店系统就会(huì)收到,服务(wù)员很快就会把牙刷送过来。这样的话,通过(guò)人工智(zhì)能技术可以(yǐ)让物联网的设备(bèi)变得更聪(cōng)明,而(ér)且真正可以使(shǐ)得照明、空(kōng)调等设备变得(dé)互联互(hù)通,非常好(hǎo)用。
我希望(wàng)机器人也好,音(yīn)箱也好,都能跟(gēn)各行各业合(hé)作,我们的(de)本质不是想做一个硬件,我(wǒ)们(men)的(de)本(běn)质还是想做一个(gè)AI赋能的云端操作系(xì)统,跟(gēn)开发者一起做更(gèng)多(duō)的物(wù)联网设备(bèi)。谢(xiè)谢大家(jiā)!