CN111126173A

CN111126173A - 一种高精度人脸检测方法

Info

Publication number: CN111126173A
Application number: CN201911224387.8A
Authority: CN
Inventors: 黄艳虎; 闭吕庆; 王强; 巫钊; 苏雪; 甘国妹; 莫燕斌; 陈超村
Original assignee: Yulin Normal University
Current assignee: Yulin Normal University
Priority date: 2019-12-04
Filing date: 2019-12-04
Publication date: 2020-05-08
Anticipated expiration: 2039-12-04
Also published as: CN111126173B

Abstract

本发明公开了一种高精度人脸检测方法，属于人脸检测技术领域，主要解决的是目前人脸检测存在准确率不高、效率慢的技术问题，所述方法包括步骤如下：S1.根据灰度转换对原始人脸图像预处理得到单通道灰度图；S2.依次经过通道压缩的多个卷积层和多个使网络加速收敛性的BN层对所述单通道灰度图进行特征提取得到人脸特征图；S3.根据卷积神经网络对所述人脸特征图进行学习得到描述特征后，结合回归网络和分类网络对人脸位置进行回归定位，并连接多个不同尺度的特征图融合，对所述人脸特征图进行检测得到人脸检测图；S4.使用人脸分类模型对所述人脸检测图进行确认。本发明准确率高、效率高。

Description

一种高精度人脸检测方法

技术领域

本发明涉及人脸检测技术领域，更具体地说，它涉及一种高精度人脸检测方法。

背景技术

目前人脸识别系统中对人脸检测的鲁棒性和可靠性以及高效性的要求越来越高。例如：公安安防人脸识别系统中识别犯罪逃犯，只有在高效率、高精度人脸检测的基础下才能更好更快的去进行人脸比对识别，保证公安第一时间对罪犯进行布控。而目前人脸检测存在准确率不高、效率慢的问题。

发明内容

本发明要解决的技术问题是针对现有技术的上述不足，本发明的目的是提供一种准确率高、效率高的高精度人脸检测方法。

本发明的技术方案是：一种高精度人脸检测方法，包括步骤如下：

S1.根据灰度转换对原始人脸图像预处理得到单通道灰度图；

S2.依次经过通道压缩的多个卷积层和多个使网络加速收敛性的BN层对所述单通道灰度图进行特征提取得到人脸特征图；

S3.根据卷积神经网络对所述人脸特征图进行学习得到描述特征后，结合回归网络和分类网络对人脸位置进行回归定位，并连接多个不同尺度的特征图融合，对所述人脸特征图进行检测得到人脸检测图；

S4.根据人脸分类模型对所述人脸检测图进行确认。

作为进一步地改进，在所述步骤S1中，根据公式：

f(i,j)＝0.2999R+0.587G+0.114B,

对原始人脸图像预处理得到单通道灰度图，其中，f(i,j)为灰度化后图像坐标(i,j)处的像素灰度值，R，G，B分别为彩色图像RGB三分量。

进一步地，在所述步骤S2中，所述卷积层为17个，17个所述卷积层特征图输出通道分别为8、16、16、64、64、64、64、64、64、64、64、64、64、64、64、64、64，且所述网络所有权重均随机初始化。

进一步地，在所述步骤S2中，所述BN层为卷积神经网络的Batch Normalization层。

进一步地，在所述步骤S3中，根据Smooth L1 Loss算法对人脸位置进行回归定位。

进一步地，在所述步骤S3中，各所述不同尺度的特征图根据所述原始人脸图像作为特征提取网络输入基础得到，所述不同尺度的特征图为5个，5个所述不同尺度的特征图的尺寸分别为24*24、12*12、6*6、3*3、1*1像素。

进一步地，在所述步骤S4中，所述人脸分类模型包括依次经过通道压缩的4个卷积层和两个全连接层连接，并使用softmax分类器进行分类。

进一步地，4个所述卷积层输出通道分别为4、4、8、16，两个所述全连接层输出通道分别为64、2，分类结果为人脸、非人脸两类。

有益效果

本发明与现有技术相比，具有的优点为：本发明通过一种卷积神经网络的特征提取方法，并在人脸检测算法之后加入一种人脸分类方法，使得原来很容易产生人脸误检的人脸检测算法变得非常准确，精度相比目前主流基于深度学习的人脸检测方法至少提高10％的精度，该方法在实际应用场景中得到验证。本发明的高精度人脸检测方法相比其他深度学习方法，具有图像特征提取速度快、特征提取网络简单、准确度高、人脸检测速度快、鲁棒性高等优点。

附图说明

图1为本发明的检测流程图；

图2为本发明中卷积神经网络原理图。

具体实施方式

下面结合附图中的具体实施例对本发明做进一步的说明。

参阅图1-2，一种高精度人脸检测方法，包括步骤如下：

S1.根据灰度转换对原始人脸图像预处理得到单通道灰度图，排除颜色的干扰；

S2.依次经过通道压缩的多个卷积层和多个使网络加速收敛性的BN层对单通道灰度图进行特征提取得到人脸特征图；

S3.根据卷积神经网络对人脸特征图进行学习得到描述特征后，结合回归网络和分类网络对人脸位置进行回归定位，并连接多个不同尺度的特征图融合，对人脸特征图进行检测得到人脸检测图；

S4.根据人脸分类模型对人脸检测图进行确认。

在步骤S1中，根据公式：

f(i,j)＝0.2999R+0.587G+0.114B,

对原始人脸图像预处理得到单通道灰度图，其中，f(i,j)为灰度化后图像坐标(i,j)处的像素灰度值，R，G，B分别为彩色图像RGB三分量。在转化成灰度图的基础上，将图片大小resize到384*384像素。

在步骤S2中，卷积层为17个，17个卷积层特征图输出通道分别为8、16、16、64、64、64、64、64、64、64、64、64、64、64、64、64、64，且网络所有权重均随机初始化。BN层为卷积神经网络的Batch Normalization层。

在步骤S3中，根据Smooth L1 Loss算法对人脸位置进行回归定位。Smooth L1Loss算法为：

其中N是先验框的正样本数量。这里

为一个指示参数，

时表示第i个先验框与第j个ground truth匹配，并且ground truth的类别为p，c为类别置信度预测值，l为先验框的所对应边界框的位置预测值，而g为ground truth的位置参数。

由于

的存在，所以位置误差仅针对正样本进行计算，值得注意的是，要先对ground truth的g进行编码得到

因为预测值l也是编码值,最后通过最小化L_loc(x,l,g)，实现一个可用的Smooth L1回归模型。

在步骤S3中，各不同尺度的特征图根据原始人脸图像作为特征提取网络输入基础得到，如在384*384像素大小的原始人脸图像作为特征提取网络输入基础上，不同尺度的特征图为5个，5个不同尺度的特征图的尺寸分别为24*24、12*12、6*6、3*3、1*1像素，连接5个不同尺度的特征图同时对原始人脸图像进行检测，大大提高了精度。

在步骤S4中，人脸分类模型包括依次经过通道压缩的4个卷积层和两个全连接层连接，并使用softmax分类器进行分类，使用人脸分类模型对人脸进行再次确认，从而大大提高了精度，避免误检。4个卷积层输出通道分别为4、4、8、16，两个全连接层输出通道分别为64、2，特征向量输出为2，即分类结果为人脸、非人脸两类。

softmax分类器算法为：

类标y可以取k个不同的值，对于训练集{(x⁽¹⁾,y⁽¹⁾),...,(x^(m),y^(m))}，得到有y⁽ⁱ⁾∈{1,2,...,k}，此处的类别下标从1开始，而不是0。

对于给定的测试输入x，使用假设函数针对每一个类别j估算出概率值p(y＝j|x)，即估计x的每一种分类结果出现的概率，因此，假设函数将要输出一个k维的向量来表示这k个估计的概率值，向量元素的和为1。假设函数h_θ(x)如下：

其中

是模型的参数，

这一项对概率分布进行归一化，使得所有概率之和为1。

为了方便起见，同样使用符号θ来表示全部的模型参数，在实现Softmax回归时，将θ用一个k×(n+1)的矩阵来表示会很方便，该矩阵是将θ₁,θ₂,…θ_k按行罗列起来得到的，如下所示：

下面公式为softmax的代价函数：

通过添加一个权重衰减项

来修改代价函数，这个衰减项会惩罚过大的参数值，现在的代价函数变为：

有了这个权重衰减项以后(λ>0)，代价函数就变成了严格的凸函数，可以保证得到唯一的解。此时的Hessian矩阵变为可逆矩阵，并且因为J(θ)是凸函数，梯度下降法和L-BFGS等算法可以保证收敛到全局最优解。

为了使用优化算法，需要求得这个新函数J(θ)的导数，如下：

通过最小化J(θ)就实现一个可用的softmax分类模型。

本发明通过一种卷积神经网络的特征提取方法，并在人脸检测算法之后加入一种人脸分类方法，使得原来很容易产生人脸误检的人脸检测算法变得非常准确，精度相比目前主流基于深度学习的人脸检测方法至少提高10％的精度，该方法在实际应用场景中得到验证。本发明的高精度人脸检测方法相比其他深度学习方法，具有图像特征提取速度快、特征提取网络简单、准确度高、人脸检测速度快、鲁棒性高等优点。

以上仅是本发明的优选实施方式，应当指出对于本领域的技术人员来说，在不脱离本发明结构的前提下，还可以作出若干变形和改进，这些都不会影响本发明实施的效果和专利的实用性。

Claims

1.一种高精度人脸检测方法，其特征在于，包括步骤如下：

S1.根据灰度转换对原始人脸图像预处理得到单通道灰度图；

S4.根据人脸分类模型对所述人脸检测图进行确认。

2.根据权利要求1所述的一种高精度人脸检测方法，其特征在于，在所述步骤S1中，根据公式：

f(i,j)＝0.2999R+0.587G+0.114B,

3.根据权利要求1所述的一种高精度人脸检测方法，其特征在于，在所述步骤S2中，所述卷积层为17个，17个所述卷积层特征图输出通道分别为8、16、16、64、64、64、64、64、64、64、64、64、64、64、64、64、64，且所述网络所有权重均随机初始化。

4.根据权利要求1所述的一种高精度人脸检测方法，其特征在于，在所述步骤S2中，所述BN层为卷积神经网络的Batch Normalization层。

5.根据权利要求1所述的一种高精度人脸检测方法，其特征在于，在所述步骤S3中，根据Smooth L1 Loss算法对人脸位置进行回归定位。

6.根据权利要求1所述的一种高精度人脸检测方法，其特征在于，在所述步骤S3中，各所述不同尺度的特征图根据所述原始人脸图像作为特征提取网络输入基础得到，所述不同尺度的特征图为5个，5个所述不同尺度的特征图的尺寸分别为24*24、12*12、6*6、3*3、1*1像素。

7.根据权利要求1所述的一种高精度人脸检测方法，其特征在于，在所述步骤S4中，所述人脸分类模型包括依次经过通道压缩的4个卷积层和两个全连接层连接，并使用softmax分类器进行分类。

8.根据权利要求7所述的一种高精度人脸检测方法，其特征在于，4个所述卷积层输出通道分别为4、4、8、16，两个所述全连接层输出通道分别为64、2，分类结果为人脸、非人脸两类。