CN112560828A

CN112560828A - 一种轻量级口罩人脸识别方法、系统、存储介质及设备

Info

Publication number: CN112560828A
Application number: CN202110209553.8A
Authority: CN
Inventors: 周燕; 吴浩海; 曾凡智
Original assignee: Foshan University
Current assignee: Foshan University
Priority date: 2021-02-25
Filing date: 2021-02-25
Publication date: 2021-03-26

Abstract

本发明提供了一种轻量级口罩人脸识别方法、系统、存储介质及设备，其中方法包括口罩人脸检测工序、口罩人脸对齐工序、人脸特征提取工序和人脸特征比对工序；人脸特征提取工序是指：将口罩人脸对齐工序的输出作为输入特征，输入到轻量级口罩人脸特征提取网络中；轻量级口罩人脸特征提取网络将所述输入特征卷积升维，之后经过激活函数激活，再进行深度可分离卷积；输入到通道注意力和区域注意力单元；进行合并操作，然后通道重组，输出人脸特征。该方法通过深度可分离卷积和注意力机制模块混用的方式，既减少了计算量又保证了特征提取不受口罩等大面积遮挡的影响；运行速度快，识别准确率高，具有良好鲁棒性。

Description

一种轻量级口罩人脸识别方法、系统、存储介质及设备

技术领域

本发明涉及人脸识别技术领域，更具体地说，涉及一种轻量级口罩人脸识别方法、系统、存储介质及设备。

背景技术

人脸识别已成为身份认证中最著名的生物识别技术，并已广泛用于许多领域。人脸佩戴口罩后，大量关键特征信息会被改变，导致不同对象的口罩人脸特征差异性减小，相同对象佩戴与非佩戴口罩的人脸特征差异性增大。如何依靠口罩人脸眉眼部分少量特征信息进行身份识别目前存在较大困难。

此外，现有人脸识别多采用深度特征提取网络实现。现有的深度特征提取网络主要分为两类：重量级和轻量级。重量级网络的优势是由于其深度排列的网络单元对人脸的特征有较好的提取，识别的准确率高，能够应对复杂的环境（如光照剧烈变化等），具有更强的鲁棒性，但是运用在一些实时场景中，易严重延时，并且大构架的人脸识别网络，在分布式训练的过程中，与服务器通信需求更大，占用资源更多，训练所产生的模型体积更大，不容易部署在一些移动设备或者是内存较小的设备中。轻量级网络占用服务器资源更少，实际运行时，速度更快，模型体积更小，但是轻量级网络特征抽取能力有限，导致鲁棒性更差，其识别率容易受表情变化和光照变化等影响。

发明内容

为克服现有技术中的缺点与不足，本发明的目的在于提供一种轻量级口罩人脸识别方法、系统、存储介质及设备；本发明通过深度可分离卷积和注意力机制模块混用的方式，既减少了计算量又保证了特征提取不受口罩等大面积遮挡的影响；运行速度快，识别准确率高，具有良好鲁棒性。

为了达到上述目的，本发明通过下述技术方案予以实现：一种轻量级口罩人脸识别方法，其特征在于：包括口罩人脸检测工序、口罩人脸对齐工序、人脸特征提取工序和人脸特征比对工序；

所述口罩人脸检测工序是指：对输入图像中疑似人脸的目标进行框选；

所述口罩人脸对齐工序是指：检测人脸关键点，之后通过图像相似变换算法进行人脸对齐；

所述人脸特征提取工序是指：将口罩人脸对齐工序的输出作为输入特征，输入到轻量级口罩人脸特征提取网络中得到人脸特征；所述轻量级口罩人脸特征提取网络将所述输入特征输入1×1卷积进行升维，之后经过激活函数激活，再进行深度可分离卷积；深度可分离卷积包括深度卷积和逐点卷积；深度卷积对输入特征的每个输入应用通道进行轻量级滤波；逐点卷积对轻量级滤波后的每个输入应用通道进行线性组合；深度可分离卷积后，输入到通道注意力和区域注意力单元以强化口罩人脸眉眼部分特征权重；将通道注意力和区域注意力单元的输出和人脸特征提取工序的输入特征进行合并操作，然后对合并后的特征进行通道重组，输出人脸特征；

所述人脸特征比对工序是指：将提取的人脸特征与人脸数据库特征进行比对，来判断输入图像的身份。

优选地，所述输入到通道注意力和区域注意力单元以加口罩以上部分权重，是指：首先将深度可分离卷积后的特征分别经过全局最大池化和全局平均池化层来聚合特征的空间信息，生成两个不同的空间上下文描述符，然后经过1×1卷积和激活函数激活后聚合一起来获取通道信息以针对眉毛眼睛部分提取特征，之后与深度可分离卷积后的特征进行第一次对位相乘；第一次对位相乘后的特征通过通道最大池化和通道平均池化来聚合通道信息，生成两个2维映射，将这两个2维映射通道拼接后通过卷积层连接和卷积混合，生成2维空间注意力特征，将2维空间注意力特征与第一次对位相乘后的特征进行第二次对位相乘，以获得侧重眉毛眼睛部分的人脸特征。

优选地，所述通道注意力和区域注意力单元包括通道注意力部分和区域注意力部分：

所述通道注意力部分为：

其中，M_c表示通道注意力，F表示输入特征，MLP表示多层感知器，AvgPool表示平均池化操作，MaxPool表示最大池化操作，F^c _avg和 F^c _max分别表示平均池化和最大池化，W₀和W₁是多层感知器的权重，σ为sigmoid激活函数；F^c _avg和 F^c _max是两个不同的空间上下文描述符；

所述区域注意力部分为：

其中，M_s表示区域注意力，F^s _avg和 F^s _max分别表示经过平均池化和最大池化的输入特征，f ^7×7表示7×7卷积。

优选地，所述深度卷积对输入特征的每个输入应用通道进行轻量级滤波，是指：将输入特征的每个输入应用通道分别对应一个滤波器进行卷积运算；

所述逐点卷积对轻量级滤波后的每个输入应用通道进行线性组合，是指：将轻量级滤波后的每个输入应用通道分别输入若干个滤波器，每个滤波器分别输出一个特征图。

优选地，所述口罩人脸检测工序中，以VGG16网络结合SENet网络作为轻量级口罩人脸检测网络；将输入图像输入到轻量级口罩人脸检测网络中，框选出疑似人脸目标；

所述SENet网络包括一个全局平均池化层和激活层；

所述全局平均池化层将输入特征H×W×C转换成1×1×C的输出以表明C个特征映射的数值分布情况，即全局信息：

其中，z_c表示全局信息，F_sq表示全局平均池化层，u_c表示输入特征，H、W、C分别表示输入特征的高、宽、通道数；

所述激活层先进行全连接操作：

其中，s表示输出特征；Fex表示激活操作；z表示全局信息z_c；g表示全局池化操作；σ为sigmoid激活函数；表示ReLU激活函数；W₁加了缩放参数以减少通道个数从而降低计算量；经过ReLU层，输出维度不变；W₂是全连接操作，在经过sigmoid函数，得到特征S（1×1×C）。

优选地，采用DIoU loss加速轻量级口罩人脸检测网络的收敛；

其中，IoU表示预测框和真实框的交并比，b、b^gt分别代表预测框和真实框的中心点，ρ代表计算两个中心点之间的欧式距离，c代表能够同时包含预测框和真实框的最小闭包距离的对角线距离。

优选地，在所述人脸特征比对工序中，采用欧几里得距离计算方法，来计算提取的人脸特征与人脸数据库特征之间的距离值，通过距离值来判断输入图像的身份。

一种轻量级口罩人脸识别系统，其特征在于：包括：

口罩人脸检测模块，用于对输入图像中疑似人脸的目标进行框选；

口罩人脸对齐模块，用于检测人脸关键点，之后通过图像相似变换算法进行人脸对齐；

人脸特征提取模块，用于将口罩人脸对齐模块的输出作为输入特征，输入到轻量级口罩人脸特征提取网络中得到人脸特征；所述轻量级口罩人脸特征提取网络将所述输入特征输入1×1卷积进行升维，之后经过激活函数激活，再进行深度可分离卷积；深度可分离卷积包括深度卷积和逐点卷积；深度卷积对输入特征的每个输入应用通道进行轻量级滤波；逐点卷积对轻量级滤波后的每个输入应用通道进行线性组合；深度可分离卷积后，输入到通道注意力和区域注意力单元以强化口罩人脸眉眼部分特征权重；将通道注意力和区域注意力单元的输出和人脸特征提取模块的输入特征进行合并操作，然后对合并后的特征进行通道重组，输出人脸特征；

人脸特征比对模块，用于将提取的人脸特征与人脸数据库特征进行比对，来判断输入图像的身份。

一种存储介质，其特征在于，其中所述存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行上述轻量级口罩人脸识别方法。

一种计算设备，包括处理器以及用于存储处理器可执行程序的存储器，其特征在于，所述处理器执行存储器存储的程序时，实现上述轻量级口罩人脸识别方法。

与现有技术相比，本发明具有如下优点与有益效果：

1、本发明具有计算量小、参数量少、运行速度快、准确率高等优势，在人脸特征提取中，通过深度可分离卷积和注意力机制模块混用的方式，既减少了计算量又保证了特征提取不受口罩等大面积遮挡的影响；使用倒残差结构保证其参数量的减少，增加网络的宽度，使得网络可以在更加广阔的空间进行特征提取；并且通过通道重组技术使得整个网络之间的信息流动更具有交互性，加强特征提取网络的鲁棒性；

2、本发明模型较小，计算量较少，可以很大程度上减少人脸识别算法运用在一些实时场景中造成严重延时问题的发生，有利于植入到移动设备或者内存较小设备上运行，具有广泛的实用价值；

3、本发明采用轻量级网络作为人脸检测模块的骨干网络，采用更为先进的DIoUloss加速模型的收敛，可以加快训练，减少训练成本，并在落地部署中达到更快的速度

4、本发明采用通道注意力和区域注意力结合的方式，对眉眼部分特征进行加权，并能将特征覆盖到待识别口罩人脸更多部位，降低最终人脸分类错误率。

附图说明

图1是本发明轻量级口罩人脸识别方法的流程示意图；

图2是本发明轻量级口罩人脸识别方法中SENet网络的示意图；

图3是本发明轻量级口罩人脸识别方法中人脸关键点预测的原理示意图；

图4是本发明轻量级口罩人脸识别方法中人脸特征提取工序的原理示意图；

图5 是本发明轻量级口罩人脸识别方法中倒残差结构的示意图；

图6是本发明轻量级口罩人脸识别方法中深度卷积的示意图；

图7是本发明轻量级口罩人脸识别方法中逐点卷积的示意图；

图8是本发明轻量级口罩人脸识别方法中注意力机制模块的原理示意图；

图9是本发明轻量级口罩人脸识别方法中通道注意力和区域注意力单元的原理示意图。

具体实施方式

下面结合附图与具体实施方式对本发明作进一步详细的描述。

实施例一

本实施例一种轻量级口罩人脸识别方法，其流程如图1所示，包括口罩人脸检测工序、口罩人脸对齐工序、人脸特征提取工序和人脸特征比对工序。

所述口罩人脸检测工序是指：对输入图像中疑似人脸的目标进行框选。

具体地说，以VGG16网络（Very Deep Convolutional Networks for Large-ScaleImage Recognition）结合SENet网络（Squeeze-and-Excitation Networks，如图2所示）作为轻量级口罩人脸检测网络；将输入图像输入到轻量级口罩人脸检测网络中，框选出疑似人脸目标；

所述SENet网络包括一个全局平均池化层（Squeeze）和激活层（Excitation）；

图2中Ftr表示转换操作，是一个标准的卷积操作，可将输入特征H'×W'×C'转换为H×W×C；

所述全局平均池化层将输入特征H×W×C转换成1×1×C的输出以表明C个特征映射的数值分布情况，即全局信息z_c：

其中，F_sq表示全局平均池化层，u_c表示输入特征，H、W、C分别表示输入特征的高、宽、通道数；

所述激活层先进行全连接操作：

由于采用VGG目标检测网络，需要同时回归预测框与真实框的距离以加快检测时间；本发明采用先进的DIoU（Distance-IoU) loss加速轻量级口罩人脸检测网络的收敛，更加符合目标框回归的机制，将目标与锚点之间的距离、重叠率和尺寸都考虑进去，使得目标框回归变得更加稳定，减少训练时间；

DIoU loss加速收敛的优点有：1.与目标框不重叠时，仍然可以为边界框提供移动方向；2.可以直接最小化两个目标框的距离，收敛更快；3.对于两个框在水平方向和垂直方向的情况，DIoU损失可以使回归非常快；4.可以替换普通的IoU评价策略，应用于NMS（非极大值抑制）中，使得NMS得到的结果更加合理和有效。

所述口罩人脸对齐工序是指：检测人脸关键点，之后通过图像相似变换算法进行人脸对齐。

本发明基于RetinaFace对口罩人脸进行关键点检测并对齐。该部分模块包括预测人脸框的偏移量和预测人脸关键点的偏移量，如图3所示。该网络采用多尺度特征图上的滑动锚点，对图像中疑似人脸的目标进行框选；使用LFPN层在网络上下层进行数据的传输共享，提高图像检测能力以捕获人脸关键点；使用轻量级网络作为网络骨干，提高速度和性能。得到人脸关键点后，通过图像相似变换算法进行人脸对齐。

所述人脸特征提取工序，如图4所示，是指：将口罩人脸对齐工序的输出作为输入特征，输入到轻量级口罩人脸特征提取网络中得到人脸特征；所述轻量级口罩人脸特征提取网络将所述输入特征输入1×1卷积进行升维，之后经过激活函数激活，再进行深度可分离卷积；深度可分离卷积包括深度卷积和逐点卷积；深度卷积对输入特征的每个输入应用通道进行轻量级滤波；逐点卷积对轻量级滤波后的每个输入应用通道进行线性组合；深度可分离卷积后，输入到通道注意力和区域注意力单元以强化口罩人脸眉眼部分特征权重；将通道注意力和区域注意力单元的输出和人脸特征提取工序的输入特征进行合并操作，然后对合并后的特征进行通道重组，输出人脸特征。

本发明使用低参数量、高性能的深度可分离卷积应用到特征提取中，同时为保证提取效率，本发明在人脸特征网络中减少了其分组卷积的组数。使用倒残差结构，如图5所示，保证其参数量的减少，增加网络的宽度，使得网络可以在更加广阔的空间进行特征提取。并且通过通道重组技术使得整个网络之间的信息流动更具有交互性，加强特征提取网络的鲁棒性。

所述深度卷积对输入特征的每个输入应用通道进行轻量级滤波，是指：将输入特征的每个输入应用通道分别对应一个滤波器进行卷积运算，如图6所示；

所述逐点卷积对轻量级滤波后的每个输入应用通道进行线性组合，是指：将轻量级滤波后的每个输入应用通道分别输入若干个滤波器，每个滤波器分别输出一个特征图，如图7所示。

本发明采用倒残差结构来对输入特征进行预处理：与传统残差结构不同，对输入特征采用先升维后降维的方式，可以有效提取高维空间特征，减少高维信号的丢失。

深度可分离卷积将标准卷积拆分成两个分卷积，第一层为深度卷积，对每个输入通道应用单通道的轻量级滤波器；第二层为逐点卷积，即1x1卷积，负责计算输入通道的线性组合，构建新的特征。

标准卷积的输入张量L_i为h_i×w_i×d_i，标准卷积核k∈R^k×k×di×dj产生输出张量L_j为h_i×w_i×d_j，其中，R表示实数，k×k×di×dj的值为实数范围，h，w，d_i ，d_j ，k分别为特征图的长、宽、输入通道数、输出通道数以及卷积核边长。

标准卷积的计算消耗为：h_i×w_i×d_i×d_j×k×k；

深度可分离卷积消耗为：h_i×w_i×d_i×（k²+ d_j）；

标准卷积的计算消耗/深度可分离卷积消耗=k²-[k⁴/ (d_j+ k²)]。

因此，本发明所使用的卷积核大小k=3，d_j最小取64，与标准卷积相比计算量减少了8-9倍。

通道注意力和区域注意力单元旨在利用通道注意力和区域注意力的融合来强化口罩人脸眉眼部分特征权重，并相对弱化口罩遮挡部分的特征权重。通过研究口罩人脸眉眼部分特征的差异性，来计算口罩人脸的相似度。通过自建口罩人脸数据集来进行注意力模块的参数训练，使得最终的权重分配到眉眼部分。注意力机制模块原理示意图如下图8所示。

所述输入到通道注意力和区域注意力单元以加口罩以上部分权重，如图9所示，是指：首先将深度可分离卷积后的特征分别经过全局最大池化和全局平均池化层来聚合特征的空间信息，生成两个不同的空间上下文描述符，然后经过1×1卷积和激活函数激活后聚合一起来获取通道信息以针对眉毛眼睛部分提取特征，之后与深度可分离卷积后的特征进行第一次对位相乘；第一次对位相乘后的特征通过通道最大池化和通道平均池化来聚合通道信息，生成两个2维映射，将这两个2维映射通道拼接后通过卷积层连接和卷积混合，生成2维空间注意力特征，将2维空间注意力特征与第一次对位相乘后的特征进行第二次对位相乘，以强化口罩人脸眉眼部分特征权重。通过通道注意力和区域注意力两个注意力对眉眼部分的加权，保证与眉眼部分特征有关的通道以及区域都能得到最大权重。

所述通道注意力和区域注意力单元包括通道注意力部分和区域注意力部分：

所述通道注意力部分为：

其中，M_c表示通道注意力，F表示输入特征，MLP表示多层感知器，AvgPool表示平均池化操作，MaxPool表示最大池化操作，F^c _avg和 F^c _max分别表示平均池化和最大池化，W₀和W₁是多层感知器的权重，σ为sigmoid激活函数；F^c _avg和 F^c _max是两个不同的空间上下文描述符；两个描述符送到一个共享网络（由MLP和一个隐藏层组成）以产生通道注意力图M_c∈R_c×1×1。该通道注意力集中针对提取眉毛眼睛部分的特征。

所述区域注意力部分为：

其中，M_s表示区域注意力，AvgPool表示平均池化操作，MaxPool表示最大池化操作，F^s _avg和 F^s _max分别表示经过平均池化和最大池化的输入特征，f ^7×7表示7×7卷积。即使用两个池化操作来聚合功能映射的通道信息，生成两个2维映射，然后通过标准的卷积层连接和卷积混合，产生2维空间注意力图。该空间注意力集中针对提取口罩以上眉毛眼睛部分的特征。

因此，通过串联通道注意力模块和空间注意力模块，可以让网络学习关注重要区域，将特征覆盖到待识别口罩人脸更多部位，降低最终人脸分类错误率。

具体地说，采用欧几里得距离计算方法，来计算提取的人脸特征与人脸数据库特征之间的距离值，通过距离值与阈值的大小比较来判断输入图像的身份。

欧几里得距离计算公式为：

上式中A、B分别为待识别人脸特征和数据库人脸特征，n为人脸特征向量数目，本发明中n=128。

为实现本实施例一种轻量级口罩人脸识别方法，本实施例还提供一种轻量级口罩人脸识别系统，包括：

本发明设计的人脸识别算法具有计算量小、参数量少、运行速度快、准确率高等优势，在人脸特征提取网络中，通过深度可分离卷积和注意力机制模块混用的方式，既减少了计算量又保证了特征提取不受口罩等大面积遮挡的影响。同时在人脸特征网络中减少了其分组卷积的组数，来保证网络的推理效率。使用倒残差结构保证其参数量的减少，增加网络的宽度，使得网络可以在更加广阔的空间进行特征提取。并且通过通道重组技术使得整个网络之间的信息流动更具有交互性，加强特征提取网络的鲁棒性。本发明模型较小，计算量较少，可以很大程度上减少人脸识别算法运用在一些实时场景中造成严重延时问题的发生,还可以植入到移动设备或者内存较小设备上运行，具有广泛的实用价值。

实施例二

本实施例一种存储介质，其中所述存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行实施例一所述的轻量级口罩人脸识别方法。

实施例三

本实施例一种计算设备，包括处理器以及用于存储处理器可执行程序的存储器，所述处理器执行存储器存储的程序时，实现实施例一所述的轻量级口罩人脸识别方法。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种轻量级口罩人脸识别方法，其特征在于：包括口罩人脸检测工序、口罩人脸对齐工序、人脸特征提取工序和人脸特征比对工序；

所述人脸特征提取工序是指：首先将口罩人脸对齐工序的输出作为输入特征，输入到轻量级口罩人脸特征提取网络中得到人脸特征；所述轻量级口罩人脸特征提取网络将所述输入特征输入1×1卷积进行升维，之后经过激活函数激活，再进行深度可分离卷积；深度可分离卷积包括深度卷积和逐点卷积；深度卷积对输入特征的每个输入应用通道进行轻量级滤波；逐点卷积对轻量级滤波后的每个输入应用通道进行线性组合；深度可分离卷积后，输入到通道注意力和区域注意力单元以强化口罩人脸眉眼部分特征权重；将通道注意力和区域注意力单元的输出和人脸特征提取工序的输入特征进行合并操作，然后对合并后的特征进行通道重组，输出人脸特征；

2.根据权利要求1所述的轻量级口罩人脸识别方法，其特征在于：所述输入到通道注意力和区域注意力单元以强化口罩人脸眉眼部分特征权重，是指：首先将深度可分离卷积后的特征分别经过全局最大池化和全局平均池化层来聚合特征的空间信息，生成两个不同的空间上下文描述符，然后经过1×1卷积和激活函数激活后聚合一起来获取通道信息以针对眉毛眼睛部分提取特征，之后与深度可分离卷积后的特征进行第一次对位相乘；第一次对位相乘后的特征通过通道最大池化和通道平均池化来聚合通道信息，生成两个2维映射，将这两个2维映射通道拼接后通过卷积层连接和卷积混合，生成2维空间注意力特征，将2维空间注意力特征与第一次对位相乘后的特征进行第二次对位相乘，以强化口罩人脸眉眼部分特征权重。

3.根据权利要求2所述的轻量级口罩人脸识别方法，其特征在于：所述通道注意力和区域注意力单元包括通道注意力部分和区域注意力部分：

所述通道注意力部分为：

所述区域注意力部分为：

4.根据权利要求1所述的轻量级口罩人脸识别方法，其特征在于：所述深度卷积对输入特征的每个输入应用通道进行轻量级滤波，是指：将输入特征的每个输入应用通道分别对应一个滤波器进行卷积运算；

5.根据权利要求1所述的轻量级口罩人脸识别方法，其特征在于：所述口罩人脸检测工序中，以VGG16网络结合SENet网络作为轻量级口罩人脸检测网络；将输入图像输入到轻量级口罩人脸检测网络中，框选出疑似人脸目标；

所述SENet网络包括一个全局平均池化层和激活层；

所述全局平均池化层将输入特征H×W×C转换成1×1×C的输出以表明C个特征映射的数值分布情况：

所述激活层先进行全连接操作：

其中，s表示输出特征；Fex表示激活操作；z表示全局信息z_c；g表示全局池化操作；σ为sigmoid激活函数；表示ReLU激活函数；W₁加了缩放参数以减少通道个数；经过ReLU层，输出维度不变；W₂是全连接操作，在经过sigmoid函数，得到特征S（1×1×C）。

6.根据权利要求5所述的轻量级口罩人脸识别方法，其特征在于：采用DIoU loss加速轻量级口罩人脸检测网络的收敛；

7.根据权利要求1所述的轻量级口罩人脸识别方法，其特征在于：在所述人脸特征比对工序中，采用欧几里得距离计算方法，来计算提取的人脸特征与人脸数据库特征之间的距离值，通过距离值来判断输入图像的身份。

8.一种轻量级口罩人脸识别系统，其特征在于：包括：

9.一种存储介质，其特征在于，其中所述存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行权利要求1-7中任一项所述的轻量级口罩人脸识别方法。

10.一种计算设备，包括处理器以及用于存储处理器可执行程序的存储器，其特征在于，所述处理器执行存储器存储的程序时，实现权利要求1-7中任一项所述的轻量级口罩人脸识别方法。