leyu乐鱼

近日，一年一度的全球计算机视觉顶级（jí）会议CVPR落（luò）下帷幕。OPPO在本（běn）次会议（yì）上屡获佳绩，在六大赛道共十二项赛项中取得一项第一，七项第二（èr），四项（xiàng）第三，排名（míng）仅次于（yú）百度等国内第一梯队的参赛选手，再次展示（shì）了OPPO强劲的（de）AI创新实力。

本次参加（jiā）CVPR 2021竞赛的团队是来自（zì）OPPO研究院智能感知与交互研究部（bù）和OPPO美国（guó）研究所（suǒ），他们先后在（zài）多目标行为（wéi）分析（xī）、足球行为分（fèn）析、长视频理解、时空行为检测、跨（kuà）模态分析及人（rén）机交（jiāo）互识别六大赛道上取（qǔ）得（dé）优异的成绩。他们通过对算法的（de）优化、训练，不断强（qiáng）化OPPO的AI能力，让AI更好地为人类（lèi）服务（wù），让AI更（gèng）懂（dǒng）人。

而由OPPO智能（néng）感知（zhī）首（shǒu）席科学家郭彦东与清华（huá）学者（zhě）等共同发表的论文《View-Guided Point Cloud Completion》，也被（bèi）本次CVPR收录。该论文通过执行有效的跨模态（tài）和（hé）跨级别融合（hé）框（kuàng）架，为点云（yún）补全任务（wù）提出了一套（tào）视（shì）图引导的全新解决方（fāng）案。

其中，OPPO在多目标行为分析（xī）（Multi-Agent Behavior）赛道中收获（huò）颇丰，其（qí）所应用的AI算法能基于特征点信（xìn）息准确（què）判别、预测动物及人在复杂交互内容下的行为。OPPO凭借着领先（xiān）的AI算（suàn）法能力，从全球（qiú）240多个顶尖（jiān）参赛团队中脱颖而（ér）出（chū），获得子赛（sài）项少样（yàng）本（běn）行为分类任（rèn）务（Learning New Behavior）第一，及传统分类（lèi）（Classical Classification）与标注风格迁移任务（Annotation Style Transfer）赛项（xiàng）的第（dì）二与第（dì）三名。目前，这项技（jì）术正在OPPO智慧工（gōng）厂发挥作用，生产线上的（de）工人们在这套（tào）算（suàn）法（fǎ）的辅助下，可（kě）以避免关键生产环节的错漏错放，让（ràng）自身和产线更安（ān）全。

多目标行为分析（xī）赛道

从计算智能（néng）到人本智能（néng），OPPO让AI更“懂”人

在基于（yú）多（duō）张（zhāng）2D图片的3D人脸（liǎn）重建（3D Face Reconstruction From Multiple 2D Images）挑（tiāo）战赛中（zhōng），OPPO自研的AI算法（fǎ）所还原（yuán）的（de）三维人（rén）脸模型与（yǔ）真实人脸误差仅为1mm左右，在主（zhǔ）要指标成绩排名中取得第（dì）二名。该算法（fǎ）克（kè）服了在实际生活中，特别（bié）是动态视频（pín）拍摄时，因为动作导致的人脸五官（guān）点不明晰、表情（qíng）夸张、甚至图片数据失真等问（wèn）题。

事实（shí）上，OPPO自研的人脸（liǎn）检测算法已能够识别635个人脸特征关键点，并实现30次/秒的高速运行。在不久前发布（bù）的OPPO Reno6系列上，依托于该算法架构的AI焕（huàn）采美妆视频技术（shù）为用户轻松打造了（le）动态的自然美（měi）妆效果。这项（xiàng）技术将推动人像视频技术（shù）“升维”进化，以3D级的特征（zhēng）点识别、令（lìng）“上妆”效果更服帖；也将在社（shè）交平台上制作出更丰富更贴合的AR特效，实现“上镜自由（yóu）”让用户在日（rì）常（cháng）生活中享受（shòu）到技（jì）术（shù）带来（lái）的（de）美好瞬间。

基于（yú）多张2D图（tú）片的3D人脸重建赛项

让AI理解我（wǒ）们所处的时间（jiān）和空间

OPPO的AI能力（lì）目（mù）前（qián）已发展到可以识别人在时空环境中的行为状态了。在足（zú）球行为分析（SoccerNet）赛道（dào）中，OPPO取得动作（zuò）定位（wèi）（Action Spotting）和回放定（dìng）位（Replay Grounding）两个赛项第二（èr）名，仅次于百度（dù）。这项挑战需要（yào）在（zài）一段足球比赛视频中（zhōng）辨别出十几种关键动作，包括越位、红（hóng）牌等行为。这些动作基（jī）础规则（zé）复杂，动作（zuò）幅（fú）度（dù）小，连人类都很难（nán）识别出来。同（tóng）时AI算法还需要排除（chú）摄（shè）影机位等干（gàn）扰因素，准确定位回放片（piàn）段在原始（shǐ）比赛（sài）视频中发（fā）生的时间点。在不久（jiǔ）的（de）将来，这（zhè）项技术（shù）将为体育爱好者（zhě）们（men）带来福利，在比赛后AI可（kě）以实（shí）时整（zhěng）理精彩集锦。在（zài）该（gāi）技（jì）术的帮助下（xià），手机相册也可以（yǐ）自动（dòng）制作类（lèi）似“精彩一（yī）周（zhōu）”的（de）视频集锦，让用户可以随时回顾自己生活中的美好（hǎo）瞬间。

足球行为分析赛道

在跨模态（tài）行为分（fèn）析（MMact）赛道上，OPPO分别在行（háng）为识别（bié）（Cross-Modal Action Recognition）与行为定位（wèi）（Cross-Model Action Temporal Localization）两个（gè）子赛项中取得第（dì）二名（míng）的成绩（jì）。OPPO强大（dà）的AI算法仅通过视觉信息（xī）便可准确识别一（yī）段视（shì）频（pín）中（zhōng）人物在（zài）特定空间内发生的交（jiāo）谈、屈膝、走动（dòng）等十余种（zhǒng）动作。这种行为（wéi）识别（bié）和（hé）行为定位（wèi）在未来有望成为家中的贴心保镖。当父母不在身边时， AI可以在宝宝下意识做出危（wēi）险（xiǎn）性动作的时候，及时提醒父母，避免宝宝受到（dào）伤害。

此（cǐ）外，OPPO还在时空（kōng）行为定（dìng）位（AVA-Kinetics）赛道获（huò）得第三（sān）名。AVA数据集（jí）作为（wéi）行业内（nèi）第一个开辟时空（kōng）行（háng）为（wéi）检测的数（shù）据集（jí），使用该（gāi）数据（jù）集的定位赛项历来是人工智能的（de）热门赛道之一，每（měi）年不乏国际顶（dǐng）尖科技公司与院（yuàn）校的知名团队参与其中。时空行为定位算法不仅可以准确识别（bié）视频中人们的行（háng）为，还可以同步定位其所（suǒ）处的（de）时间（jiān）段和空间范围。这（zhè）也意味着，OPPO的（de）AI技术不仅能理解你在做什么（me），还可（kě）以在（zài）时空中“找到”你。

OPPO正（zhèng）在向更高维度的AI技术探索

本（běn）次CVPR上，OPPO在学术界前沿领域长视频理解（LOVEU, Long-form Video Understanding）挑战中，获（huò）得两大（dà）赛项第三名。这赛道对算法的泛化性提出了（le）极大挑战，它需（xū）要（yào）AI在预（yù）先没有特定（dìng）分类标准（zhǔn）的情况下，自行理解视频的意义并分割出其边界的时间（jiān）段落。AI需要像人一样思考，理解（jiě）视频中人类动作、颜色、物品、乃至光源（yuán）的变化，并对变化点（diǎn）进行判断（duàn）。未（wèi）来，这项技术可以广泛（fàn）应（yīng）用在视频领域（yù），作（zuò）为AI处理视频的基础（chǔ）工序，为后（hòu）续包（bāo）括人脸识别、行为（wéi）识别等AI任务的选择和（hé）执行（háng）奠定基础。

OPPO研（yán）究院美国研究所（suǒ）参与了稠密深度（dù）估计挑（tiāo）战赛道，展（zhǎn）示了能够基于（yú）2D图像输出稠（chóu）密3D深度信息的（de）技（jì）术（shù），获得自监督学（xué）习赛项第二（èr）名的成绩，并获得“最佳创（chuàng）意奖”。该技术通过利用（yòng）深度学习模（mó）型直接从普通图像输出深度信息，未来有（yǒu）可能替（tì）代ToF这样的深度传感器，带来体验更好的室内外（wài）导航。

OPPO始终秉持着“科技为人以善天下”的企业使命，在构建（jiàn）自身（shēn）AI能力时也一直（zhí）围（wéi）绕着“以人为本”不断努力，向着更智能、更（gèng）前沿的（de）方（fāng）向努（nǔ）力，让AI能够真（zhēn）正地为人所（suǒ）用（yòng），为我（wǒ）们带来更智能更便捷的生（shēng）活。