近日,一年一度的全球计算机视觉顶级(jí)会议CVPR落(luò)下帷幕。OPPO在本(běn)次会议(yì)上屡获佳绩,在六大赛道共十二项赛项中取得一项第一,七项第二(èr),四项(xiàng)第三,排名(míng)仅次于(yú)百度等国内第一梯队的参赛选手,再次展示(shì)了OPPO强劲的(de)AI创新实力。
本次参加(jiā)CVPR 2021竞赛的团队是来自(zì)OPPO研究院智能感知与交互研究部(bù)和OPPO美国(guó)研究所(suǒ),他们先后在(zài)多目标行为(wéi)分析(xī)、足球行为分(fèn)析、长视频理解、时空行为检测、跨(kuà)模态分析及人(rén)机交(jiāo)互识别六大赛道上取(qǔ)得(dé)优异的成绩。他们通过对算法的(de)优化、训练,不断强(qiáng)化OPPO的AI能力,让AI更好地为人类(lèi)服务(wù),让AI更(gèng)懂(dǒng)人。
而由OPPO智能(néng)感知(zhī)首(shǒu)席科学家郭彦东与清华(huá)学者(zhě)等共同发表的论文《View-Guided Point Cloud Completion》,也被(bèi)本次CVPR收录。该论文通过执行有效的跨模态(tài)和(hé)跨级别融合(hé)框(kuàng)架,为点云(yún)补全任务(wù)提出了一套(tào)视(shì)图引导的全新解决方(fāng)案。
其中,OPPO在多目标行为分析(xī)(Multi-Agent Behavior)赛道中收获(huò)颇丰,其(qí)所应用的AI算法能基于特征点信(xìn)息准确(què)判别、预测动物及人在复杂交互内容下的行为。OPPO凭借着领先(xiān)的AI算(suàn)法能力,从全球(qiú)240多个顶尖(jiān)参赛团队中脱颖而(ér)出(chū),获得子赛(sài)项少样(yàng)本(běn)行为分类任(rèn)务(Learning New Behavior)第一,及传统分类(lèi)(Classical Classification)与标注风格迁移任务(Annotation Style Transfer)赛项(xiàng)的第(dì)二与第(dì)三名。目前,这项技(jì)术正在OPPO智慧工(gōng)厂发挥作用,生产线上的(de)工人们在这套(tào)算(suàn)法(fǎ)的辅助下,可(kě)以避免关键生产环节的错漏错放,让(ràng)自身和产线更安(ān)全。
多目标行为分析(xī)赛道
从计算智能(néng)到人本智能(néng),OPPO让AI更“懂”人
在基于(yú)多(duō)张(zhāng)2D图片的3D人脸(liǎn)重建(3D Face Reconstruction From Multiple 2D Images)挑(tiāo)战赛中(zhōng),OPPO自研的AI算法(fǎ)所还原(yuán)的(de)三维人(rén)脸模型与(yǔ)真实人脸误差仅为1mm左右,在主(zhǔ)要指标成绩排名中取得第(dì)二名。该算法(fǎ)克(kè)服了在实际生活中,特别(bié)是动态视频(pín)拍摄时,因为动作导致的人脸五官(guān)点不明晰、表情(qíng)夸张、甚至图片数据失真等问(wèn)题。
事实(shí)上,OPPO自研的人脸(liǎn)检测算法已能够识别635个人脸特征关键点,并实现30次/秒的高速运行。在不久前发布(bù)的OPPO Reno6系列上,依托于该算法架构的AI焕(huàn)采美妆视频技术(shù)为用户轻松打造了(le)动态的自然美(měi)妆效果。这项(xiàng)技术将推动人像视频技术(shù)“升维”进化,以3D级的特征(zhēng)点识别、令(lìng)“上妆”效果更服帖;也将在社(shè)交平台上制作出更丰富更贴合的AR特效,实现“上镜自由(yóu)”让用户在日(rì)常(cháng)生活中享受(shòu)到技(jì)术(shù)带来(lái)的(de)美好瞬间。
基于(yú)多张2D图(tú)片的3D人脸重建赛项
让AI理解我(wǒ)们所处的时间(jiān)和空间
OPPO的AI能力(lì)目(mù)前(qián)已发展到可以识别人在时空环境中的行为状态了。在足(zú)球行为分析(SoccerNet)赛道(dào)中,OPPO取得动作(zuò)定位(wèi)(Action Spotting)和回放定(dìng)位(Replay Grounding)两个赛项第二(èr)名,仅次于百度(dù)。这项挑战需要(yào)在(zài)一段足球比赛视频中(zhōng)辨别出十几种关键动作,包括越位、红(hóng)牌等行为。这些动作基(jī)础规则(zé)复杂,动作(zuò)幅(fú)度(dù)小,连人类都很难(nán)识别出来。同(tóng)时AI算法还需要排除(chú)摄(shè)影机位等干(gàn)扰因素,准确定位回放片(piàn)段在原始(shǐ)比赛(sài)视频中发(fā)生的时间点。在不久(jiǔ)的(de)将来,这(zhè)项技术(shù)将为体育爱好者(zhě)们(men)带来福利,在比赛后AI可(kě)以实(shí)时整(zhěng)理精彩集锦。在(zài)该(gāi)技(jì)术的帮助下(xià),手机相册也可以(yǐ)自动(dòng)制作类(lèi)似“精彩一(yī)周(zhōu)”的(de)视频集锦,让用户可以随时回顾自己生活中的美好(hǎo)瞬间。
足球行为分析赛道
在跨模态(tài)行为分(fèn)析(MMact)赛道上,OPPO分别在行(háng)为识别(bié)(Cross-Modal Action Recognition)与行为定位(wèi)(Cross-Model Action Temporal Localization)两个(gè)子赛项中取得第(dì)二名(míng)的成绩(jì)。OPPO强大(dà)的AI算法仅通过视觉信息(xī)便可准确识别一(yī)段视(shì)频(pín)中(zhōng)人物在(zài)特定空间内发生的交(jiāo)谈、屈膝、走动(dòng)等十余种(zhǒng)动作。这种行为(wéi)识别(bié)和(hé)行为定位(wèi)在未来有望成为家中的贴心保镖。当父母不在身边时, AI可以在宝宝下意识做出危(wēi)险(xiǎn)性动作的时候,及时提醒父母,避免宝宝受到(dào)伤害。
此(cǐ)外,OPPO还在时空(kōng)行为定(dìng)位(AVA-Kinetics)赛道获(huò)得第三(sān)名。AVA数据集(jí)作为(wéi)行业内(nèi)第一个开辟时空(kōng)行(háng)为(wéi)检测的数(shù)据集(jí),使用该(gāi)数据(jù)集的定位赛项历来是人工智能的(de)热门赛道之一,每(měi)年不乏国际顶(dǐng)尖科技公司与院(yuàn)校的知名团队参与其中。时空行为定位算法不仅可以准确识别(bié)视频中人们的行(háng)为,还可以同步定位其所(suǒ)处的(de)时间(jiān)段和空间范围。这(zhè)也意味着,OPPO的(de)AI技术不仅能理解你在做什么(me),还可(kě)以在(zài)时空中“找到”你。
OPPO正(zhèng)在向更高维度的AI技术探索
本(běn)次CVPR上,OPPO在学术界前沿领域长视频理解(LOVEU, Long-form Video Understanding)挑战中,获(huò)得两大(dà)赛项第三名。这赛道对算法的泛化性提出了(le)极大挑战,它需(xū)要(yào)AI在预(yù)先没有特定(dìng)分类标准(zhǔn)的情况下,自行理解视频的意义并分割出其边界的时间(jiān)段落。AI需要像人一样思考,理解(jiě)视频中人类动作、颜色、物品、乃至光源(yuán)的变化,并对变化点(diǎn)进行判断(duàn)。未(wèi)来,这项技术可以广泛(fàn)应(yīng)用在视频领域(yù),作(zuò)为AI处理视频的基础(chǔ)工序,为后(hòu)续包(bāo)括人脸识别、行为(wéi)识别等AI任务的选择和(hé)执行(háng)奠定基础。
OPPO研(yán)究院美国研究所(suǒ)参与了稠密深度(dù)估计挑(tiāo)战赛道,展(zhǎn)示了能够基于(yú)2D图像输出稠(chóu)密3D深度信息的(de)技(jì)术(shù),获得自监督学(xué)习赛项第二(èr)名的成绩,并获得“最佳创(chuàng)意奖”。该技术通过利用(yòng)深度学习模(mó)型直接从普通图像输出深度信息,未来有(yǒu)可能替(tì)代ToF这样的深度传感器,带来体验更好的室内外(wài)导航。
OPPO始终秉持着“科技为人 以善天下”的企业使命,在构建(jiàn)自身(shēn)AI能力时也一直(zhí)围(wéi)绕着“以人为本”不断努力,向着更智能、更(gèng)前沿的(de)方(fāng)向努(nǔ)力,让AI能够真(zhēn)正地为人所(suǒ)用(yòng),为我(wǒ)们带来更智能更便捷的生(shēng)活。