CN112001302B

CN112001302B - 基于人脸感兴趣区域分割的人脸识别方法

Info

Publication number: CN112001302B
Application number: CN202010847672.1A
Authority: CN
Inventors: 杨赛; 顾全林
Original assignee: Wuxi Xishang Bank Co ltd
Current assignee: Wuxi Xishang Bank Co ltd
Priority date: 2020-08-21
Filing date: 2020-08-21
Publication date: 2022-06-14
Anticipated expiration: 2040-08-21
Also published as: CN112001302A

Abstract

本发明提供一种基于人脸感兴趣区域分割的人脸识别方法，包括以下步骤：步骤S1，通过人脸数据库训练基于Centernet算法的人脸检测器和人脸关键点检测器；步骤S2，利用训练好的人脸检测器和人脸关键点检测器获取待处理图像的人脸边界框和人脸关键点；步骤S3，根据人脸关键点的外部轮廓坐标利用B样条曲线拟合得到人脸的感兴趣区域；步骤S5，以标准平均正脸的人脸关键点为基点，将预测出的所有人脸关键点与基点做仿射变换，得到对齐后的人脸，然后将人脸感兴趣区域尺度归一化，并居中裁剪；步骤S6，对于训练集按照上述步骤S2～S5批处理人脸图像数据，得到人脸识别训练集；步骤S7，通过批处理后的人脸识别训练集，构建并训练人脸识别网络。

Description

基于人脸感兴趣区域分割的人脸识别方法

技术领域

本发明涉及一种人脸识别方法，尤其是一种基于人脸感兴趣区域分割的人脸识别方法。

背景技术

人脸作为一个人的外在属性，具有极强的个体差异。人脸识别技术是一种是基于人的脸部视觉特征信息进行身份识别的生物识别技术。目前市场上人脸识别技术已经十分成熟，已广泛应用于金融、司法、军队、公安、边检、政府、航天、电力、工厂、教育、医疗及众多企事业单位等领域。

在人脸识别的过程，主要包括人脸图像的匹配和识别过程，就是将提取到的待识别的人脸特征与已得到的存储在数据库中的人脸特征模板进行匹配，根据相似程度对人脸图像的身份信息进行判断。一方面，能够提取到准确而丰富的人脸特征对于人脸识别的结果具有重要影响。另一方面，消除在人脸识别过程中的噪声信息对于人脸识别的结果同样具有重要的意义。在目前的研究中，主要的方向基本围绕在训练数据的清洗或是减少噪声图像(如模糊、遮挡、大角度等)在训练过程中的权重占比来提高模型的鲁棒性。然而，在实际应用场景下，人脸识别任务需要判断不在训练数据集内的人脸数据，这也就要求人脸识别的训练数据集包含百万级甚至更多的人脸数据才能保证模型的稳定性，这无疑在清洗上造成巨大的工作量。另外，通过以往的研究证明减少噪声图像在训练过程中的权重占比来提高模型的鲁棒性显然是有效的，但是这些方法并没有考虑因背景噪声对于人脸识别的影响。在人脸识别任务中，对于模型有效的信息是人脸感兴趣区域的特征信息(如五官、肤色、脸颊等)，而背景信息对于识别任务是无效的，甚至因为部分噪声信息的引入会显著的影响到人脸识别的效果。

目前的研究中都是包含背景信息的对齐后的人脸作为输入来完成人脸识别的训练和预测，并没有有效的去除感兴趣区域以外的噪声信息的方法。

发明内容

本发明为了克服人脸识别任务中对人脸感兴趣区域以外的背景噪声信息考虑不足的问题，提供一种基于人脸感兴趣区域分割的人脸识别方法，实现对于人脸感兴趣区域以外背景噪声的过滤，能够有效的减少因背景原因对于人脸识别任务的影响，实现简单有效，并具有较高的鲁棒性等优点。

本发明实施例采用的技术方案是：

一种基于人脸感兴趣区域分割的人脸识别方法，包括以下步骤：

步骤S1，通过作为人脸检测和人脸关键点检测的人脸数据库训练基于Centernet算法的人脸检测器和人脸关键点检测器；

步骤S2，利用训练好的人脸检测器和人脸关键点检测器获取待处理图像的人脸边界框和人脸关键点；

步骤S3，根据人脸关键点的外部轮廓坐标利用B样条曲线拟合得到人脸的感兴趣区域；

步骤S5，以标准平均正脸的人脸关键点为基点，将预测出的所有人脸关键点与基点做做仿射变换，得到对齐后的人脸，然后将人脸感兴趣区域尺度归一化，并居中裁剪；

步骤S6，对于训练集按照上述步骤S2～S5批处理人脸图像数据，得到人脸识别训练集；

步骤S7，通过批处理后的人脸识别训练集，构建并训练人脸识别网络，训练得到人脸识别模型。

进一步地，在步骤S3与S5之间，还包括：

步骤S4，计算人脸感兴趣区域的平均像素值，对人脸感兴趣区域的周遭区域填充平均像素值；

步骤S5中，裁剪时包括人脸感兴趣区域的周遭区域。

进一步地，步骤S1具体包括：

人脸检测器和人脸关键点检测器采用同一个DLA全卷积编解码网络；

对于训练人脸检测器，以人脸数据库中人脸边界框坐标的中心点作为人脸检测器的输入，把图像I∈R^W×H×3传入DLA全卷积编解码网络，采用DLA全卷积编解码网络来预测人脸在图像I中的热力图

R为输出步长，C是目标检测中对应人脸检测点的类的数量，

表示当前类别c在热力图的(x,y)坐标中检测到了人脸；在下采样的图像中将真实的点坐标以

的形式通过高斯核分散到热力图上，并将热力图上所有响应点与其连接的8个临近点进行比较，如果该响应点响应值大于或等于其八个临近点值则保留，最后采用3x3的最大池化层保留所有满足之前要求的前num个峰值点，则人脸边界框的坐标为

其中，

是当前预测的点

对应原始图像的偏移量，

为当前预测的点对应的人脸边界框的长和宽，设定阈值对预测的人脸边界框的置信度进行筛选，得到预测的人脸边界框；

对于训练人脸关键点检测器，以人脸数据库中人脸关键点坐标作为人脸关键点检测器的输入，把图像I∈R^W×H×3传入DLA全卷积编解码网络，采用DLA全卷积编解码网络来预测人脸关键点在图像I中的热力图

R为输出步长，C是目标检测中对应人脸关键点的类的数量，在下采样的图像中将真实的点坐标以

的形式通过高斯核分散到热力图上，并将热力图上所有响应点与其连接的8个临近点进行比较，如果该响应点响应值大于或等于其八个临近点值则保留，最后采用3x3的最大池化层保留所有满足之前要求的对应每个类的最大峰值点。

更进一步地，num取50～200。

进一步地，步骤S7中，在人脸识别训练集上按照个体ID进行整理，即同一个人的多张人脸照片归属同一个类别ID；以mobilefacenet网络结构提取图片特征，使用arcfaceloss损失函数训练人脸识别模型。

进一步地，步骤S6中，还包括：

对于测试集按照上述步骤S2～S5批处理人脸图像数据，得到人脸识别测试集；

步骤S7之后，还包括：

步骤S8，将批处理后的人脸识别测试集数据进行同个体ID和不同个体ID之间的配对，将配对的图片载入人脸识别模型得到相似度，根据10折交叉验证得到平均后的识别精度。

相较于现有技术，本发明通过分割过滤关键区域以外的背景、提取人脸关键区域进行人脸识别，能够有效的减少因背景噪声对于人脸识别结果的影响，操作简单，快速有效，并具有较高鲁棒性等优点。

附图说明

图1为本发明实施例中人脸识别图像预处理示意图。

图2为本发明的方法流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

本发明实施例通过对人脸识别任务中人脸感兴趣区域的背景进行分割，实现对于人脸感兴趣区域以外背景的过滤，以此来减少因背景噪声对于人脸识别任务的影响，提升人脸识别任务的精度和鲁棒性。

在本实施例中，一种基于人脸感兴趣区域分割的人脸识别方法，包括以下步骤：

人脸检测器和人脸关键点检测器采用同一个DLA(deep layer aggregation)全卷积编解码网络；这里的人脸数据库采用300W-LP库；

R为输出步长，C是目标检测中对应人脸检测点的类的数量，此处C＝1，

的形式通过高斯核分散到热力图上，并将热力图上所有响应点与其连接的8个临近点进行比较，如果该响应点响应值大于或等于其八个临近点值则保留，最后采用3x3的最大池化层保留所有满足之前要求的前num个峰值点，num可以取50～200，则人脸边界框的坐标为

其中，

是当前预测的点

对应原始图像的偏移量，

R为输出步长，C是目标检测中对应人脸关键点的类的数量，此处C＝68，在下采样的图像中将真实的点坐标以

的形式通过高斯核分散到热力图上，并将热力图上所有响应点与其连接的8个临近点进行比较，如果该响应点响应值大于或等于其八个临近点值则保留，，最后采用3x3的最大池化层保留所有满足之前要求的对应每个类的最大峰值点；

步骤S3，根据人脸关键点的外部轮廓坐标利用B样条曲线(B-spline)拟合得到人脸的感兴趣区域；

此步骤中，先依据人脸关键点在空间中的坐标，求取最大的外部轮廓点集，利用B-spline来拟合最大的外部轮廓，继而得到人脸的感兴趣区域；

步骤S4，可选地，计算人脸感兴趣区域的平均像素值，对人脸感兴趣区域的周遭区域填充平均像素值；

此步骤中，计算人脸感兴趣区域内R、G、B三个通道的平均像素值，并将三组平均像素填充到1.25倍人脸边界框坐标的非感兴趣区域；其中，填充1.25倍的原因是为了提高处理的效率；

步骤S5，以标准平均正脸的68个人脸关键点为基点，将预测出的所有人脸关键点(本例中是68个)与基点做做仿射变换，得到对齐后的人脸，然后将人脸感兴趣区域尺度归一化到112x112，并居中裁剪；

若上一步步骤S4被配置，则裁剪时包括人脸感兴趣区域的周遭区域；裁剪后的效果如图1中第二行中间那副图样所示；

训练集本实施例中采用训练集MS-Celeb-1M；

可选地，对于测试集按照上述步骤S2～S5批处理人脸图像数据，得到人脸识别测试集；

测试集本实施例中采用测试集LFW；

步骤S7，通过批处理后的人脸识别训练集，构建并训练人脸识别网络，训练得到人脸识别模型，用于人脸识别；

此步骤中，在人脸识别训练集上按照个体ID进行整理，即同一个人的多张人脸照片归属同一个类别ID；以mobilefacenet网络结构提取图片特征，使用arcface loss损失函数训练人脸识别模型；训练过程中根据损失函数值的变化情况动态的调节超参数和学习率等，来使得人脸识别模型收敛，直到训练结束，得到最优的人脸识别模型。

若步骤S6中，得到了人脸识别测试集，则还进行，

最后所应说明的是，以上具体实施方式仅用以说明本发明的技术方案而非限制，尽管参照实例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的精神和范围，其均应涵盖在本发明的权利要求范围当中。