如何准确识别座舱内用户的年龄,并让算法适应不同的种族和环境差异?这一直是困扰智能座舱开发者的难题。如今这一问题有了新解决方案:长城汽车感知计算团队创造性地提出了一种描述年龄间特征差异的算法,有望让长城汽车的咖啡智能在工程上优雅解决这一问题,并且该技术目前已在测试中获得优异表现。
(资料图片)
论文入选计算机视觉顶会 技术获最高认可
近日,长城汽车感知计算团队与西南石油大学计算机科学学院合作的论文《DAA: A Delta Age AdaIN operation for age estimation via binary code transformer》被CVPR 收录。CVPR是由IEEE举办的计算机视觉和模式识别领域顶级会议。这某种程度上意味着长城汽车的创新方向,得到了业内最高级别的认可,标志着咖啡智能在座舱视觉研究领域已跻身行业研究前沿。
年龄识别新解法 助第三空间进化
智能座舱正在向「第三空间」进化,让座舱“识别”用户的年龄,是科技升维的关键一环。那怎么让计算机能够准确识别座舱乘员的年龄呢?论文里介绍了一种基于迁移学习的表观年龄估计新方法。凭借优异、健壮的测试表现,该方法获得了计算机视觉领域专家的认可,也已经上了实车,开始为用户提供实际服务。
注:DAA在多种族数据集Morph上的表现
注:DAA在MegaAge-Asian数据集上的表现
从实际测试中可以看到,在多种族数据集Morph上,不管是使用基础resnet网络,还是轻量级网络,DAA都有较好表现,体现了其有效性和即插即用的特点。而在复杂场景下的MegaAge-Asian数据集上它的表现则更为优异,DAA在CA(3)、CA(5)、CA(7)上正确率分别达到68.82%、84.89%和92.70%。之所以能有如此良好的数据表现,是因为该算法受风格迁移和face aging的启发。研究人员将不同年龄视为不同风格,而不同年龄之间的变换,本质上是对应年龄特征的均值和标准差的改变。团队在此基础上结合AdaIN,最终设计出能描述年龄间特征差异的操作Delta Age AdaIN(DAA)。
创造性突破两难题 算法已申请专利
正常人识别他人年龄的过程,通常是将其与已知年龄的人进行对比,识别的结果是一个大众经验值。而这种以肉眼去识别对比的逻辑,非常类似风格迁移。
但问题实际解决起来却没有这么简单。由于实际驾乘人员的年龄主要分布在10—50岁之间,要想针对0—100岁人群做表观年龄的典型对应,现有数据量很可能不够,或者要付出巨大的成本。另外,随着车企全球化战略的推进,开发的车型需要适应各个国家的环境和种族差异。
所以,要想完成上述的DAA操作,必须先解决两大难题:1、如何找到每一个具有代表性的年龄图像特征完成DAA操作?2、如何应对跨种族和不同生活环境给人带来的表观年龄的影响?
针对这些难题,团队首先想到,可以采用年龄特征的均值和标准差,来描述不同表观年龄,从而绕过对代表性年龄图像的依赖。接着,团队创新性地引入Binary code mapping模块,将年龄对应自然数的二进制编码作为风格迁移隐变量的输入,完成对应年龄特征的均值和标准差的映射。更重要的是,因为这个过程与图像特征是无关的,因此可以自适应跨种族和生活环境,从而完美解决问题。
“我们的研究成果不是闭门造车,而是产自座舱项目的实际研发。目前该算法已经申请了相关专利,并应用在智能座舱中。”嘉峪智能感知计算团队表示,希望能早日推动算法大规模应用,从而辅助咖啡智能建立起更加完善的车主画像,为他们提供更好的服务和体验。
关键词: