CN112800874A

CN112800874A - 一种人脸检测和识别方法及相关装置

Info

Publication number: CN112800874A
Application number: CN202110048466.9A
Authority: CN
Inventors: 李唐盛晟; 金忠孝
Original assignee: SAIC Motor Corp Ltd
Current assignee: SAIC Motor Corp Ltd
Priority date: 2021-01-14
Filing date: 2021-01-14
Publication date: 2021-05-14

Abstract

本申请公开了一种人脸检测和识别方法及相关装置，该方法提供的预设深度学习网络在人脸检测和识别过程中利用深度可分离式卷积对待测图像进行卷积操作，有利于大大降低卷积操作的运算量，降低人脸检测和识别方法对预设芯片的运算能力的要求；同时预设深度学习网络采用包含稀疏化正则项的损失函数，以实现提高预设深度学习网络的参数稀疏性，从而提高预设深度学习网络在预设芯片上的运行速度。

Description

一种人脸检测和识别方法及相关装置

技术领域

本申请涉及计算机应用技术领域，更具体地说，涉及一种人脸检测和识别方法及相关装置。

背景技术

随着深度学习技术的出现，视觉人脸识别技术的准确度已经大幅超越人类水准，视觉人脸识别技术目前在安全认证方面发挥了越来越重要的作用。在服务器端，使用GPU进行运算的人脸识别系统已经在各个方向上获得了广泛的应用。

由于车载芯片在功耗、安全性、工艺角和测试上相对普通民用芯片而言存在更为严格的要求，使得车载设备目前普遍使用的车规级芯片运算能力较低，生产工艺落后于消费级市场，这使得人脸识别技术在车载产品上的应用受到了很大限制。

发明内容

为解决上述技术问题，本申请提供了一种人脸检测和识别方法及相关装置，以实现降低人脸检测和识别方法对运算能力的要求的目的，从而使得人脸检测和识别方法在运算能力较差的车规级芯片上的应用成为可能。

为实现上述技术目的，本申请实施例提供了如下技术方案：

一种人脸检测和识别方法，包括：

提供预设深度学习网络，所述预设深度学习网络为经过训练集训练的人脸识别模型；

基于预设芯片，利用所述预设深度学习网络对待测图像进行人脸检测和识别，以判断所述待测图像是否与预设数据库中存储的任一人脸数据相匹配；所述预设深度学习网络在人脸检测和识别过程中利用深度可分离式卷积对所述待测图像进行卷积操作，且所述预设深度学习网络还包括经过稀疏化正则的深度学习损失函数；在人脸检测和识别过程中，利用所述预设芯片的加速操作单元执行所述预设深度学习网络，利用所述预设芯片的并行操作单元执行后处理中的并行操作部分；

当所述待测图像与所述预设数据库中存储的人脸数据匹配时，则执行与匹配的人脸数据对应的预设操作。

可选的，所述经过稀疏化正则的深度学习损失函数包括：

J＝J₀+α∑_ω|ω|；其中，J表示经过稀疏化正则的深度学习损失函数，J₀表示原深度学习损失函数，α表示预设参数，ω表示深度学习的输出网络向量。

可选的，所述加速操作单元包括DSP kernal；

所述并行操作单元包括DSP parallel。

可选的，所述当所述待测图像与所述预设数据库中存储的人脸数据匹配时，则执行与匹配的人脸数据对应的预设操作包括：

当所述待测图像与所述因素和数据库中存储的人脸数据匹配时，执行包括发动机启动、座位调整到与所述人脸数据匹配的位置、后视镜调整到与所述人脸数据匹配的位置和车机娱乐系统配置为与所述人脸数据相匹配的操作中的至少一项。

可选的，还包括：

当所述检测图像与所述预设数据库中存储的人脸数据不匹配时，判断人脸检测次数是否超过预设次数，若否，则获取新的待测图像，并返回基于预设芯片，利用所述预设深度学习网络对待测图像进行人脸检测和识别的步骤，若是，则提示匹配失败。

一种人脸检测和识别系统，包括：

网络提供模块，用于提供预设深度学习网络，所述预设深度学习网络为经过训练集训练的人脸识别模型；

网络执行模块，用于基于预设芯片，利用所述预设深度学习网络对待测图像进行人脸检测和识别，以判断所述待测图像是否与预设数据库中存储的任一人脸数据相匹配；所述预设深度学习网络在人脸检测和识别过程中利用深度可分离式卷积对所述待测图像进行卷积操作，且所述预设深度学习网络还包括经过稀疏化正则的深度学习损失函数；在人脸检测和识别过程中，利用所述预设芯片的加速操作单元执行所述预设深度学习网络，利用所述预设芯片的并行操作单元执行后处理中的并行操作部分；

操作执行模块，用于当所述待测图像与所述预设数据库中存储的人脸数据匹配时，则执行与匹配的人脸数据对应的预设操作。

可选的，所述经过稀疏化正则的深度学习损失函数包括：

J＝J₀+α∑_ω|ω|；其中，J表示经过稀疏化正则的深度学习损失函数，J₀表示原深度学习损失函数，α表示预设参数，ω表示深度学习网络的输出向量。

可选的，所述加速操作单元包括DSP kernal；

所述并行操作单元包括DSP parallel。

可选的，所述操作执行模块当所述待测图像与所述预设数据库中存储的人脸数据匹配时，则执行与匹配的人脸数据对应的预设操作的具体执行过程包括：

可选的，所述操作执行模块还用于，当所述检测图像与所述预设数据库中存储的人脸数据不匹配时，判断人脸检测次数是否超过预设次数，若否，则获取新的待测图像，并返回基于预设芯片，利用所述预设深度学习网络对待测图像进行人脸检测和识别的步骤，若是，则提示匹配失败。

一种人脸检测和识别系统，包括：存储器和处理器；

所述存储器用于存储程序代码，所述处理器用于调用所述程序代码，所述程序代码用于执行上述任一项所述的人脸检测和识别方法。

一种存储介质，所述存储介质上存储有程序代码，所述程序代码被执行时实现上述任一项所述的人脸检测和识别方法。

从上述技术方案可以看出，本申请实施例提供了一种人脸检测和识别方法及相关装置，其中，所述人脸检测和识别方法提供的预设深度学习网络在人脸检测过程中利用深度可分离式卷积对所述待测图像进行卷积操作，有利于大大降低卷积操作的运算量，降低人脸检测和识别方法对预设芯片的运算能力的要求；同时所述预设深度学习网络采用包含稀疏化正则项的损失函数，以实现提高预设深度学习网络的参数稀疏性，从而提高预设深度学习网络在所述预设芯片上的运行速度。另外，在人脸检测和识别过程中，利用所述预设芯片的加速操作单元执行所述预设深度学习网络，利用所述预设芯片的并行操作单元执行后处理中的并行操作部分，进一步提升所述预设芯片对所述预设深度学习网络的运行速度，使得所述人脸检测和识别方法在运算能力较差的芯片上的运行时间也可接受，从而使得所述人脸检测和识别方法在运算能力较差的车规级芯片上的应用成为可能。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请的一个实施例提供的一种人脸检测和识别方法的流程示意图；

图2为本申请的另一个实施例提供的一种人脸检测和识别方法的流程示意图；

图3为本申请的又一个实施例提供的一种人脸检测和识别方法的流程示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供了一种人脸检测和识别方法，如图1所示，包括：

S101：提供预设深度学习网络，所述预设深度学习网络为经过训练集训练的人脸识别模型；

S102：基于预设芯片，利用所述预设深度学习网络对待测图像进行人脸检测和识别，以判断所述待测图像是否与预设数据库中存储的任一人脸数据相匹配；所述预设深度学习网络在人脸检测和识别过程中利用深度可分离式卷积对所述待测图像进行卷积操作，且所述预设深度学习网络还包括经过稀疏化正则的深度学习损失函数；在人脸检测和识别过程中，利用所述预设芯片的加速操作单元执行所述预设深度学习网络，利用所述预设芯片的并行操作单元执行后处理中的并行操作部分；

S103：当所述待测图像与所述预设数据库中存储的人脸数据匹配时，则执行与匹配的人脸数据对应的预设操作。

通常情况下，传统的基于深度学习的人脸检测和识别技术，主要利用了深度学习网络进行人脸特征的提取。按照卷积神经网络感受野来将整个输入图片划分为H_i×W_i个不同的区域中心，每个区域中心对应k个不同长宽比的锚框(Anchor Box)，同时形成针对不同感受野尺寸的M个分支，即总共

个锚框。通过深度学习基网络(BackBone)提取出对应上述每个锚框的信息，最终使用NMS(非极大值抑制，Non-MaximumSuppression)算法筛选置信度高的锚框，再还原到原始图片的对应尺寸上将人脸图片进行提取，用于人脸识别网络的输入。人脸识别网络亦是通过深度学习网络直接对提取出来的人脸图像进行特征提取，通过神经网络将人脸图片投影到一个高维的特征空间，并通过聚类方法进行训练，使得同一个人对应的特征向量具有极高的相似度，即向量距离更近。因此最终将需要验证是否为同一人的两张图片进行神经网络特征提取并对输出的特征向量进行距离计算，如果两者特征向量的距离低于某一阈值即可视为同一个人。

常规情况下，针对形如K_H×K_W×C_in的输入单元(检测网络给定的锚框区域图片信息，会经过缩放到一特定尺寸再输入到人脸识别网络)，会由一个形如K_H×K_W×C_in×C_out的卷积核进行点乘操作，，这个点乘操作需要依靠具有较高运算能力的芯片实现，常规的车规级芯片难以实现或需要大量时间来实现该点乘运算。

而本申请实施例中，所述人脸检测和识别方法提供的预设深度学习网络在人脸检测和识别过程中利用深度可分离式卷积对所述待测图像进行卷积操作，有利于大大降低卷积操作的运算量，降低人脸检测和识别方法对预设芯片的运算能力的要求；同时所述预设深度学习网络采用包含稀疏化正则项的损失函数，以实现提高预设深度学习网络的参数稀疏性，从而提高预设深度学习网络在所述预设芯片上的运行速度。另外，在人脸检测和识别过程中，利用所述预设芯片的加速操作单元执行所述预设深度学习网络，利用所述预设芯片的并行操作单元执行后处理中的并行操作部分，进一步提升所述预设芯片对所述预设深度学习网络的运行速度，使得所述人脸检测和识别方法在运算能力较差的芯片上的运行时间也可接受，从而使得所述人脸检测和识别方法在运算能力较差的车规级芯片上的应用成为可能。

具体地，如前文所述，对于K_H×K_W×C_in规模的待处理输入单元，传统卷积运算会通过C_out个形如K_H×K_W×C_in的卷积核进行操作，这个运算量庞大的卷积操作在本实施例中被分为了两步，首先对输入块的每个通道分别做卷积，单个卷积核规模为K_H×K_W，共有C_in个卷积核，该操作后输出规模为1×1×C_in；然后对第一步输出结果通过C_out个规模为1×1×C_in的卷积核进行卷积操作。采用这样如此方式计算，一可以使得模型参数由原先的K_H×K_W×C_in×C_out规模变为K_H×K_W×C_in+C_in×C_out，模型复杂度下降；二则将大规模乘法用两个小规模乘法代替，大大减少了卷积操作的运算量。

而对于稀疏化正则，可选的，所述经过稀疏化正则的深度学习损失函数包括：

J＝J₀+α∑_ω|ω|；其中，J表示经过稀疏化正则的深度学习损失函数，J₀表示原深度学习损失函数，α表示预设参数，ω表示深度学习的输出向量。

在本实施例中，采用L1正则化的方式来修改原深度学习损失函数J，增加α∑_ω|ω|正则项达到模型训练时提高参数稀疏性的目的，稀疏的参数可加速在预设芯片上的计算过程。使用L1正则化可以使得参数各位稀疏和离散，为后续参数的量化提供精度更好的适配。同时相当于增加了参数中0的个数，使得预设芯片能够快速地在单位指令时间内完成计算。

可选的，所述加速操作单元包括DSP kernal；

所述并行操作单元包括DSP parallel。

以TI的车规级芯片为例，将芯片的DSP(数字信号处理模块，DigitalSignalProcessing)的执行程序按照TI的linkchain标准IO形成一个link_chain模式API提供给芯片的CPU(中央处理器，Central Processing Unit)进行调用。

在该车规级芯片中CPU调度每个不同的硬件均以link_chain模式调用，包括分配各个chain的内存。在使用DSP实现人脸检测与识别算法的过程中，采用两种方法来进行加速：包括使用DSPkernel(通过SoC厂商提供的DSP的SDK中已经实现部分加速的操作单元，即所述加速操作单元)和使用DSPParallel(通过DSP对并行操作的编译支持，即所述并行操作单元)。技术人员需要将算法进行重构，拆分成可使用DSPkernel与DSPParallel的部分，最大限度利用DSP的计算能力(例如DSPkernel可以基于TI官方给出的卷积加速工具包TIDL实现卷积神经网络计算加速，DSPParallel则基于DSP对代码的可并行操作部分的编译优化实现加速)。在充分利用DSP的计算能力之后，最大可以提供相对CPU8倍以上的运算速度。

在上述实施例的基础上，在本申请的一个实施例中，如图2所示，所述当所述待测图像与所述预设数据库中存储的人脸数据匹配时，则执行与匹配的人脸数据对应的预设操作包括：

S1031：当所述待测图像与所述因素和数据库中存储的人脸数据匹配时，执行包括发动机启动、座位调整到与所述人脸数据匹配的位置、后视镜调整到与所述人脸数据匹配的位置和车机娱乐系统配置为与所述人脸数据相匹配的操作中的至少一项。

本实施例的应用场景为车载环境，具体地，所述待测图像可以通过车载摄像头获取，获取所述待测图像后，可以对所述待测图像中包含的人脸信息进行检测，以实现对预设数据库中存储的人脸数据的匹配，从而实现发动机启动、座位调整到与所述人脸数据匹配的位置、后视镜调整到与所述人脸数据匹配的位置和车机娱乐系统配置为与所述人脸数据相匹配等操作。具体地，座位调整到与所述人脸数据匹配的位置可以是指当对所述待测图像的检测结果为与男车主的人脸数据匹配时，则将座位调整到记忆的与男车主对应的位置处，而当对所述待测图像的检测结果为与女车主的人脸数据匹配时，则将座位调整到记忆的与女车主对应的位置处。相似的，所述后视镜和车机娱乐系统配置的调整方式与座位的调整逻辑类似。另外，在本申请的一些实施例中，当车载设备还支持Carplay或Carlife等功能时，所述预设动作还可以包括FaceID的解锁等操作。

在上述实施例的基础上，在本申请的另一个实施例中，如图3所示，所述人脸检测和识别方法还包括：

S1032：当所述检测图像与所述预设数据库中存储的人脸数据不匹配时，判断人脸检测次数是否超过预设次数，若否，则获取新的待测图像，并返回基于预设芯片，利用所述预设深度学习网络对待测图像进行人脸检测和识别的步骤，若是，则提示匹配失败。

在本实施例中，当一次匹配失败后重新获取所述检测图像进行检测，以避免由于用户相对摄像头位置不佳而导致的检测失败，当超过预设次数的人脸检测均无法匹配成功时，才提示匹配失败，提示用户利用传统的操作方式进行车辆点火或座椅配置等。

下面对本申请实施例提供的人脸检测和识别系统进行描述，下文描述的人脸检测和识别系统可与上文描述的人脸检测和识别方法相互对应参照。

相应的，本申请实施例还提供了一种人脸检测和识别系统，包括：

可选的，所述预设深度学习网络利用深度可分离式卷积对所述待测图像进行卷积操作的过程具体包括：

将所述待测图像划分为H_i×W_i个不同的区域中心，每个所述区域中心包括k个不同长宽比的锚框；其中H_i和W_i均为大于1的正整数；

可选的，所述经过稀疏化正则的深度学习损失函数包括：

所述加速操作单元包括DSP kernal；

所述并行操作单元包括DSP parallel。

相应的，本申请实施例还提供了一种人脸检测和识别系统，包括：存储器和处理器；

所述存储器用于存储程序代码，所述处理器用于调用所述程序代码，所述程序代码用于：

相应的，本申请实施例还提供了一种存储介质，所述存储介质上存储有程序代码，所述程序代码被执行时实现上述任一实施例所述的人脸检测和识别方法。

综上所述，本申请实施例提供了一种人脸检测和识别方法及相关装置，其中，所述人脸检测和识别方法提供的预设深度学习网络在人脸检测过程中利用深度可分离式卷积对所述待测图像进行卷积操作，有利于大大降低卷积操作的运算量，降低人脸检测和识别方法对预设芯片的运算能力的要求；同时所述预设深度学习网络采用包含稀疏化正则项的损失函数，以实现提高预设深度学习网络的参数稀疏性，从而提高预设深度学习网络在所述预设芯片上的运行速度。另外，在人脸检测和识别过程中，利用所述预设芯片的加速操作单元执行所述预设深度学习网络，利用所述预设芯片的并行操作单元执行后处理中的并行操作部分，进一步提升所述预设芯片对所述预设深度学习网络的运行速度，使得所述人脸检测和识别方法在运算能力较差的芯片上的运行时间也可接受，从而使得所述人脸检测和识别方法在运算能力较差的车规级芯片上的应用成为可能。

本说明书中各实施例中记载的特征可以相互替换或者组合，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种人脸检测和识别方法，其特征在于，包括：

2.根据权利要求1所述的人脸检测和识别方法，其特征在于，所述经过稀疏化正则的深度学习损失函数包括：

3.根据权利要求1所述的人脸检测和识别方法，其特征在于，所述加速操作单元包括DSP kernal；

所述并行操作单元包括DSP parallel。

4.根据权利要求1所述的人脸检测和识别方法，其特征在于，所述当所述待测图像与所述预设数据库中存储的人脸数据匹配时，则执行与匹配的人脸数据对应的预设操作包括：

5.根据权利要求4所述的人脸检测和识别方法，其特征在于，还包括：

6.一种人脸检测和识别系统，其特征在于，包括：

7.根据权利要求6所述的人脸检测和识别系统，其特征在于，所述经过稀疏化正则的深度学习损失函数包括：

8.根据权利要求6所述的人脸检测和识别系统，其特征在于，所述加速操作单元包括DSP kernal；

所述并行操作单元包括DSP parallel。

9.根据权利要求6所述的人脸检测和识别系统，其特征在于，所述操作执行模块当所述待测图像与所述预设数据库中存储的人脸数据匹配时，则执行与匹配的人脸数据对应的预设操作的具体执行过程包括：

10.根据权利要求9所述的人脸检测和识别系统，其特征在于，所述操作执行模块还用于，当所述检测图像与所述预设数据库中存储的人脸数据不匹配时，判断人脸检测次数是否超过预设次数，若否，则获取新的待测图像，并返回基于预设芯片，利用所述预设深度学习网络对待测图像进行人脸检测和识别的步骤，若是，则提示匹配失败。

11.一种人脸检测和识别系统，其特征在于，包括：存储器和处理器；

所述存储器用于存储程序代码，所述处理器用于调用所述程序代码，所述程序代码用于执行权利要求1-5任一项所述的人脸检测和识别方法。

12.一种存储介质，其特征在于，所述存储介质上存储有程序代码，所述程序代码被执行时实现权利要求1-5任一项所述的人脸检测和识别方法。