CN111860174A

CN111860174A - 融合RepGT-RepBox函数的遮挡人脸检测方法

Info

Publication number: CN111860174A
Application number: CN202010573445.4A
Authority: CN
Inventors: 陈宁; 李梦璐
Original assignee: Xian Polytechnic University
Current assignee: Xian Polytechnic University
Priority date: 2020-06-22
Filing date: 2020-06-22
Publication date: 2020-10-30

Abstract

本发明公开了融合RepGT‑RepBox函数的遮挡人脸检测方法，具体按照以下步骤实施：步骤1:步骤1、卷积层提取图像feature map；步骤2：RPN提取人脸候选区域，在提取人脸候选区时使用融合RepGT‑RepBox函数的损失函数L，更加精准地选取包括人脸的候选区域；步骤3：ROI池化层将人脸候选区域的特征转换成固定大小；步骤4：分类和回归层判断人脸具体位置。本发明遮挡人脸检测方法，可以有效遮挡对于人脸的干扰，加快训练速度，提高识别准确率。

Description

融合RepGT-RepBox函数的遮挡人脸检测方法

技术领域

本发明属于人脸检测技术领域，具体涉及一种融合RepGT-RepBox函数的遮挡人脸检测方法。

背景技术

人脸识别技术都是基于人脸关键特征提取对比完成识别的，其中，特征的完整性是算法成败的一个极为关键的因素，但是当受到外界干扰较多，外界的条件发生明显变化的时候，由于传统方法过于依赖明显的、完整的图像特征，一旦由于人脸发生遮挡，造成部分特征的消失，导致人脸图像特征不完整时，这种算法就会失效，导致无法和库中人脸信息进行对比。遮挡造成的人脸识别的困难主要体现在由遮挡所引发的特征损失、对准误差和局部混叠等方面。

Faster R-CNN框架由四个部分组成:1)卷积层(conv layers)，用于提取图片的特征，输入为整张图片，输出为提取出的特征称为feature map。2)RPN网络(Region ProposalNetwork)，用于推荐人脸候选区域，输出为多个候选区域。3)ROI pooling池化层，将不同大小的输入转换为固定长度的输出。4)分类和回归，这一层的输出是最终目的，输出候选区域所属的类，和候选区域在图像中的精确位置。

遮挡情形下周围其他目标的影响会干扰最终输出结果，检测的关键是使产生的proposals能够更加接近真实目标框。在RPN层融合RepGT-RepBox损失函数的遮挡人脸检测方法优点在于使得预测框和所负责的真实目标距离缩小，而使得其与周围非负责目标框距离增大，更加准确的判断行人位置。

综上所述，本文提出融合RepGT-RepBox损失函数的Faster-RCNN遮挡人脸检测方法，不仅训练速度快，并且提高遮挡情形下人脸识别率。

发明内容

本发明的目的是提供一种融合RepGT-RepBox函数的遮挡人脸检测方法，可以有效遮挡对于人脸的干扰，加快训练速度，提高识别准确率。

本发明所采用的技术方案如下：融合RepGT-RepBox函数的遮挡人脸检测方法，具体按照以下步骤实施：

步骤1:步骤1、卷积层提取图像feature map；

步骤2：RPN提取人脸候选区域，在提取人脸候选区时使用融合RepGT-RepBox函数的损失函数L，更加精准地选取包括人脸的候选区域；

步骤3：ROI池化层将人脸候选区域的特征转换成固定大小；

步骤4：分类和回归层判断人脸具体位置。

本发明的特征还在于，

步骤1的具体实施方式如下：

步骤1.1、首先要获取人脸图像，人脸图像来自WiderFace公开数据集，此数据集包含大量面部遮挡图片，将图像缩放至固定M×N大小；

步骤1.2、使用基于VGG16的Faster RCNN卷积层提取图像feature map。

步骤1.2中，所述Faster RCNN卷积层包括13个conv层，13个relu层，4个pooling层，依次通过这些层后可得到输入图像的feature map，conv、relu、pooling三种层的参数如下：

(1)13个conv层的参数均相同，具体为：kernel_size＝3,pad＝1，stride＝1；

(2)13个relu层均使用激活函数；

(3)4个pooling层的参数均相同，具体为：kernel_size＝2,stride＝2，经过此层后得出大小为(M/16)×(N/16)的feature map，kenel_size ⁴＝16。

步骤2的具体实施方式如下：

步骤2.1、先使用3*3的卷积核对feature map进行卷积运算，使feature map的特征更加集中；

步骤2.2、使用generate_anchors函数在feature map生成anchors，假设featuremap中每个点上有k个anchors，所以anchors数量是celi(M/16)×celi(N/16)×K,celi()表示向上取整运算；

步骤2.3、使用softmax判断得到的anchors属于positive anchors还是negativeanchors，提取出positive anchors为初步positive proposals候选区域；

步骤2.4、接着使用损失函数L计算positive anchors的bounding boxregression的偏移量，通过L的值，判断positive anchors是否范围超过人脸边界，剔除严重超出边界的anchors；以获得精确的positive proposals；

步骤2.5、排除掉超出人脸边界的positive anchors后，对剩下的positiveanchors进行Non-Maximum Suppression运算；

步骤2.6、对于进行了NMS后的positive anchors按分数从大到小排序，提取前Q个结果作为人脸候选区域positive proposals。

步骤2.4中，所述损失函数L的表达式具体如下：

L＝L_Attr+α*L_RepGT+β*L_RepBox (1)

式(1)中，L_Attr为预测框与真实目标框所产生的损失值；L_RepGT为预测框与相邻真实目标框所产生的损失值；L_RepBox为预测框与相邻真实目标的预测框所产生的损失值；α和β为两个相关系数。

L_Attr的定义为：

式(2)中，ρ+为所有positive proposals的集合，P∈ρ+，B^P是P的预测框，G为真实目标框，

为P匹配一个与之有最大IoU值的真实目标框G；

Smooth_L1用来度量两个框的逼近程度，

计算出B^P和

距离的最小损失值，即使目的预测框与真实目标框更加接近；

其中x为B^P和

之间的距离。

L_RepGT具体为：

式(3)中，ρ+为所有positive proposals的集合，P∈ρ_+，B^P为真实目标框预测框，

为相邻的真实目标框；

是真实目标框预测框B^P和相邻的真实目标框

之间的距离；用来计算预测框B^P与相邻的真实目标框

之间距离的损失值；

其中x为B^P和

之间的距离。

L_RepBox具体为：

式(4)，

表示子集P_i的预测框，

表示子集P_j的预测框，

表示

和

之间的距离，

用来计算

和

之间距离的损失值，1[]是恒等函数，恒等函数的输出等于其输入，ε为任一小数值常数以免分母为0。

步骤3的具体实施方式如下：

步骤3.1、输入是RPN层产生的前Q个positive proposals人脸候选区域和卷积层产生的原始的feature map，遍历每个Q个positive proposals将其映射到feature map上，从而将在feature map上确定一个区域(定义为RB*)；

步骤3.2、在feature map上确定的区域RB*，根据池化参数pooled_w,pooled_h,将这个RB*区域划分为w*h个相同大小的小区域，对于每个小区域进行max pooling(最大池化)形成了一个w*h的feature map；Q个positive proposals遍历完后，会产生Q*w*h大小的feature map，为输出的新的大小统一的特征数组，同时作为下一层的输入。

步骤4的具体实施方式如下：

步骤4.1、ROI pooling池化层之后，利用softmax对上一步得到的Q*w*h个featuremap进行全连接操作，利用Softmax进行具体类别的分类；

步骤4.2、对人脸positive proposals进行bounding box regression微调人脸框大小，进一步确定人脸区域，排除遮挡物的干扰。

发明的有益效果是：

(1)本发明方法可以有效提高候选可见人脸区域选择准确度，提升检测模型对于遮挡人脸图像的鲁棒性，抑制遮挡为特征区域带来的损失和干扰，对于图像中人脸进行更好地定位和提取。

(2)本发明方法针对遮挡对人脸图像检测造成的干扰问题，以Faster RCNN模型为基干，在RPN层融合RepGT-RepBox损失函数的遮挡人脸检测方法，使得人脸预测框和真实人脸目标距离缩小，有效减少了遮挡因素的干扰更加精准地选取人脸候选区域，对于遮挡人脸图像具有更高的检测准确率和召回率。

(3)本发明方法RPN提取层融合RepGT-RepBox损失函数的遮挡人脸检测方法，可以有效遮挡对于人脸的干扰，加快训练速度，提高识别准确率。

附图说明

图1是本发明融合RepGT-RepBox函数的遮挡人脸检测方法的流程图。

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

本发明一种融合RepGT-RepBox函数的遮挡人脸检测方法，如图1所示，包括以下步骤：

步骤1:步骤1、卷积层提取图像feature map；

步骤1的具体实施方式如下：

步骤1.2、使用基于VGG16的Faster RCNN卷积层提取图像feature map。

步骤1.2中，Faster RCNN卷积层包括13个conv层，13个relu层，4个pooling层，依次通过这些层后可得到输入图像的feature map，conv、relu、pooling三种层的参数如下：

(2)13个relu层均使用激活函数；

步骤2的具体实施方式如下：

步骤2.2、使用generate_anchors函数在feature map生成anchors，(anchors为不同长宽的矩形边框)假设feature map中每个点上有k个anchors，所以anchors数量是celi(M/16)×celi(N/16)×K,celi()表示向上取整运算；

步骤2.3、使用softmax判断得到的anchors属于positive(目标人脸)anchors还是negative(背景信息)anchors，提取出positive anchors为初步positive proposals候选区域；

步骤2.4、接着使用损失函数L计算positive anchors的bounding boxregression(边框回归)的偏移量，通过L的值，判断positive anchors是否范围超过人脸边界，剔除严重超出边界的anchors；以获得精确的positive proposals，L中融合了RepGT-RepBox函数，RepGT-RepBox损失函数进一步排除遮挡的干扰信息；

步骤2.4中，所述损失函数L的表达式具体如下：

L＝L_Attr+α*L_RepGT+β*L_RepBox (1)

式(1)中，L_Attr(Attraction term)为预测框与真实目标框所产生的损失值；L_RepGT(repulsion term)为预测框与相邻真实目标框所产生的损失值；L_RepBox(repulsion Box)为预测框与相邻真实目标的预测框所产生的损失值；α(alpha)和β(beta)为两个相关系数，通过两个相关系数α(alpha)和β(beta)来平衡两部分repulsion损失值。

在损失函数L中新融合了RepGT-RepBox函数，L_Attr采用Smooth_L1距离损失函数，L_Attr的定义为：

为P匹配一个与之有最大IoU值的真实目标框G；

Smooth_L1用来度量两个框的逼近程度，

计算出B^P和

其中x为B^P和

之间的距离。

L_RepGT目的是使预测框尽可能远离与之相邻的真实目标框，给定一个P∈ρ_+，其相邻的真实目标框为

为除真实目标框之外IoU值最大的框，真实目标框预测框B^P和相邻的真实目标框

之间的距离定义为:

Smooth_ln是在区间(0,1)连续可微分的平滑ln函数。

L_RepGT具体为：

为相邻的真实目标框；

是真实目标框预测框B^P和相邻的真实目标框

之间的距离；

用来计算预测框B^P与相邻的真实目标框

之间距离的损失值；

其中x为B^P和

之间的距离。

L_RepBox目的是使预测框尽量远离相邻真实目标的预测框。将ρ₊分为不同的子集P_i、P_j......P_n。

L_RepBox具体为：

式(4)中，

表示子集P_i的预测框，

表示子集P_j的预测框，

表示

和

之间的距离，

用来计算

和

步骤2.5、排除掉超出人脸边界的positive anchors后，对剩下的positiveanchors进行Non-Maximum Suppression(非极大值抑制NMS)运算；

步骤3：ROI池化层将人脸候选区域的特征转换成固定大小；

步骤3的具体实施方式如下：

步骤4：分类和回归层判断人脸具体位置。

步骤4的具体实施方式如下：

步骤4.1、ROI pooling池化层之后，利用softmax对上一步得到的Q*w*h个featuremap进行全连接操作，利用Softmax进行具体类别的分类。

步骤4.2、对人脸positive proposals进行bounding box regression(边框回归)微调人脸框大小，进一步确定人脸区域，排除遮挡物的干扰。

Claims

1.融合RepGT-RepBox函数的遮挡人脸检测方法，其特征在于，具体按照以下步骤实施：

步骤1:步骤1、卷积层提取图像feature map；

步骤3：ROI池化层将人脸候选区域的特征转换成固定大小；

步骤4：分类和回归层判断人脸具体位置。

2.根据权利要求1所述的融合RepGT-RepBox函数的遮挡人脸检测方法，其特征在于，步骤1的具体实施方式如下：

步骤1.2、使用基于VGG16的Faster RCNN卷积层提取图像feature map。

3.根据权利要求2所述的融合RepGT-RepBox函数的遮挡人脸检测方法，其特征在于，步骤1.2中，所述Faster RCNN卷积层包括13个conv层，13个relu层，4个pooling层，依次通过这些层后可得到输入图像的feature map，conv、relu、pooling三种层的参数如下：

(2)13个relu层均使用激活函数；

(3)4个pooling层的参数均相同，具体为：kernel_size＝2,stride＝2，经过此层后得出大小为(M/16)×(N/16)的feature map，kenel_size⁴＝16。

4.根据权利要求3所述的融合RepGT-RepBox函数的遮挡人脸检测方法，其特征在于，步骤2的具体实施方式如下：

步骤2.2、使用generate_anchors函数在feature map生成anchors，假设feature map中每个点上有k个anchors，所以anchors数量是celi(M/16)×celi(N/16)×K,celi()表示向上取整运算；

步骤2.3、使用softmax判断得到的anchors属于positiveanchors还是negativeanchors，提取出positive anchors为初步positive proposals候选区域；

步骤2.4、接着使用损失函数L计算positive anchors的bounding box regression的偏移量，通过L的值，判断positive anchors是否范围超过人脸边界，剔除严重超出边界的anchors；以获得精确的positive proposals；

步骤2.5、排除掉超出人脸边界的positive anchors后，对剩下的positive anchors进行Non-Maximum Suppression运算；

5.根据权利要求4所述的融合RepGT-RepBox函数的遮挡人脸检测方法，其特征在于，步骤2.4中，所述损失函数L的表达式具体如下：

L＝L_Attr+α*L_RepGT+β*L_RepBox (1)

6.根据权利要求5所述的融合RepGT-RepBox函数的遮挡人脸检测方法，其特征在于，所述L_Attr的定义为：

为P匹配一个与之有最大IoU值的真实目标框G；

Smooth_L1用来度量两个框的逼近程度，

计算出B^P和

其中x为B^P和

之间的距离。

7.根据权利要求5所述的融合RepGT-RepBox函数的遮挡人脸检测方法，其特征在于，所述L_RepGT具体为：

为相邻的真实目标框；

是真实目标框预测框B^P和相邻的真实目标框

之间的距离；

用来计算预测框B^P与相邻的真实目标框

之间距离的损失值；

其中x为B^P和

之间的距离。

8.根据权利要求5所述的融合RepGT-RepBox函数的遮挡人脸检测方法，其特征在于，所述L_RepBox具体为：

式(4)中，

表示子集P_i的预测框，

表示子集P_j的预测框，

表示

和

之间的距离，

用来计算

和

9.根据权利要求5所述的融合RepGT-RepBox函数的遮挡人脸检测方法，其特征在于，步骤3的具体实施方式如下：

步骤3.1、输入是RPN层产生的前Q个positive proposals人脸候选区域和卷积层产生的原始的feature map，遍历每个Q个positive proposals将其映射到feature map上，从而将在feature map上确定一个区域；

步骤3.2、在feature map上确定的区域RB*，根据池化参数pooled_w,pooled_h,将这个RB*区域划分为w*h个相同大小的小区域，对于每个小区域进行max pooling形成了一个w*h的feature map；Q个positive proposals遍历完后，会产生Q*w*h大小的feature map，为输出的新的大小统一的特征数组，同时作为下一层的输入。

10.根据权利要求5所述的融合RepGT-RepBox函数的遮挡人脸检测方法，其特征在于，步骤4的具体实施方式如下：

步骤4.1、ROI pooling池化层之后，利用softmax对上一步得到的Q*w*h个feature map进行全连接操作，利用Softmax进行具体类别的分类；