CN109871835B

CN109871835B - 一种基于互斥正则化技术的人脸识别方法

Info

Publication number: CN109871835B
Application number: CN201910235306.8A
Authority: CN
Inventors: 程明明; 赵凯
Original assignee: Nankai University
Current assignee: Nankai University
Priority date: 2019-03-27
Filing date: 2019-03-27
Publication date: 2021-10-01
Anticipated expiration: 2039-03-27
Also published as: CN109871835A

Abstract

一种基于互斥正则化技术的人脸识别方法，属于图像处理技术领域，该方法首先将进行筛选和校准后的人脸图像数据集导入模型；利用残差神经网络对输入的图像数据进行特征提取得到特征向量；利用特征向量和分类参数矩阵来计算分类概率得出识别向量；使用A‑Softmax损失函数计算识别向量与标注之间的损失差异并将其作为梯度进行反向传播来更新特征提取网络中的参数；计算互斥正则项关于分类参数矩阵的偏导数并利用该偏导数更新分类参数矩阵。本发明同时考虑了类內紧凑性和类间可分性，对开放环境下人脸识别模型的应用更具有实际意义，该方法能够同时实现人脸识别任务下类內数据的密集聚簇和类间数据的离散分布，比以往方法更具实用性和普适性。

Description

一种基于互斥正则化技术的人脸识别方法

技术领域

本发明属于图像处理技术领域，特别涉及到一种基于互斥正则化技术的人脸识别方法。

背景技术

人脸识别是计算机视觉中研究最广泛的主题之一，最近，卷积神经网络(CNN)成为人工智能研究领域的主力方法并且已经取得了显著的进步。通常，在人脸识别中存在两种用于人脸识别的测试环境：开放式和封闭式。在开放式测试环境中，训练集数据中可能不存在测试图片所属的身份类别。在封闭式测试环境中，训练数据集和测试数据集中均具有相对应的身份类别。因为收集所有可能的身份面庞进行训练是不可能的，所以开放式环境下的人脸识别更具挑战性，也更接近现实世界的应用，而特征的可辨性是训练更加精准的开放式人脸识别模型的关键，类内紧凑性和类间可分性是特征可辨性的两个重要因素，对提高人脸识别技术的准确率至关重要。

最近的许多工作都坚持设计新型的损失函数来改善深层特征的类内紧致性。Y.Wen等人提出的Center损失函数通过施加额外的损失项来改善类内紧凑性，该损失项旨在减少欧几里德空间下该样本特征与目标特征的距离。然后在Liu等人提出的SphereFace中利用A-Softmax损失函数施加了一个角度限制以将样本特征集中在一个球体空间中。和SphereFace相似，H.Wang等人提出的CosFace方法和J.Deng等人提出的ArgFace方法通过对原始Softmax损失函数的决策边界施加角度限制提高了识别准确率，以上方法主要着眼于通过在欧几里德空间或球体空间中限制并聚集那些属于同一身份类别的特征来加强该身份类别所代表的特征集合之间的紧凑性。虽然它们在类內紧凑性上取得了优秀成果，然而这些工作并没有关注类间可分性在人脸识别模型中的应用，继而使得上述方法无法充分利用人脸特征去提升人脸识别准确性，如果想要进一步推动该领域的发展，需要对类间可分性进行更深层次的发掘和利用。

发明内容

本发明目的是解决已有的人脸识别模型和方法仅考虑到人脸分类问题下同一类特征之间的紧凑性而没有考虑不同类特征之间的可分性的问题，提出一种能同时考虑到同一类特征之间的紧凑性和不同类特征之间的可分性的人脸识别方法。

本发明的技术方案

一种基于互斥正则化技术的人脸识别方法，本发明方法涉及的模型为RegularFace模型，该模型主要有两个基本模块：身份特征提取模块和分类参数映射模块。前者使用残差网络通过多层残差网络块对输入的图像数据进行特征提取，后者利用分类参数矩阵将身份特征提取模块输出的特征向量映射成识别向量，继而根据识别向量得到了输入人脸图像的分类结果。该识别方法包括如下步骤：

a.导入训练图像：将进行筛选和校准后的人脸图像数据集输入RegularFace模型中；

b.身份特征提取：利用残差神经网络组成的特征提取网络对输入的图像数据进行特征

提取得到特征向量；

c.身份识别：利用特征向量和分类参数矩阵来计算分类概率得出识别向量；

d.利用A-Softmax损失函数更新网络参数：使用A-Softmax损失函数计算识别向量与标注之间的损失差异并将该损失差异作为梯度进行反向传播来更新特征提取网络中的参数；

e.利用互斥正则项更新分类参数矩阵：计算互斥正则项关于分类参数矩阵的偏导数并利用该偏导数更新分类参数矩阵。

本发明使用A-Softmax损失函数计算识别向量与标注之间的损失差异并将其作为梯度进行反向传播来更新特征提取网络中的参数，从而加强了同一类别内图像特征的类內紧凑性，随后根据互斥正则项计算分类参数矩阵的梯度并对其进行更新，保证了不同类别间图像特征的类间可分性。互斥正则项可以嵌入各种现有的网络模型中，并且可以与各类损失函数组合起来对神经网络模型进行优化，进一步提升网络的识别准确率，具有较高的灵活性。

本发明的优点和有益效果：

本发明的人脸识别方法考虑到了分类问题中的类间可分性这一性质，相比于当前的其他识别方法只从类內紧凑性上着手改善识别率，本发明方法同时考虑了类內紧凑性和类间可分性，对于开放环境下人脸识别模型的应用更加具有实际意义，能得到更好的实际效果。

附图说明

图1为基于互斥正则化技术的人脸识别方法流程图。

图2为基于互斥正则化技术的RegularFace人脸识别模型示意图。

具体实施方式

下面结合附图和具体实施方式对本发明作进一步详细的说明:

参照图1，表示基于互斥正则化技术的人脸识别方法流程图，图中表示的方法的步骤为：

a.导入训练图像:对于现存的人脸识别数据集中的数据，进行人脸对齐这一预处理操作，首先检测人脸目标，根据目标区域对图像进行裁剪保证人脸图像在112×96的尺寸下，随后将处理好的人脸图像数据I导入进RegularFace网络模型中。

b.身份特征提取：将a步骤中导入的人脸图像I，通过由残差网络组成的身份特征提取模块对图像进行特征提取，得到了表示该图像的特征向量x：

x＝G_θ(I)

其中，G_θ(·)表示身份特征提取模块中卷积核参数为θ的特征提取网络。

c.身份识别：对步骤b中获得的特征向量和分类参数矩阵进行矩阵乘法运算，得到识别向量，同时该识别向量也表示网络模型对于输入图像属于何种类别的预测，具体表示如下：

y＝Wx

其中，y为识别向量，W为分类参数矩阵，x为特征向量。

d.利用A-Softmax损失函数更新网络参数：使用A-Softmax损失函数计算识别向量与标注之间的损失差异：

上式中N为单次导入RegularFace人脸识别模型中的图像的数量，

为序列号为i的图像的特征向量和y_i类别所代表的分类参数向量之间的角度，根据该公式计算出识别向量与标注之间的损失差异作为梯度并将其反向传播来更新身份特征提取网络中的参数，更新方式如下：

其中

为

关于θ^t的偏导数，θ为参数，α为学习率，W为分类参数矩阵，上角标t表示当前时间点，t+1表示更新参数后的时间点，θ^t为根据梯度更新参数之前的θ的取值情况，θ^t+1为根据梯度更新参数之后的θ的取值情况。

e.利用互斥正则项更新分类参数矩阵：计算互斥正则项关于分类参数矩阵的偏导数,计算方式如下：

其中

为互斥正则项，C为类别数，W为分类参数矩阵，W_j′为W_j的最近邻，

是最近邻为W_j的列向量的集合。计算出偏导数之后，将其用来更新分类参数矩阵，更新方式如下：

其中，Normalize(·)为L2正则化。

参照图2，表示基于互斥正则化技术的RegularFace人脸识别模型，图中表示的模型结构为：

第一部分由3个卷积层组成，每一层卷积层均有64个通道数为3尺寸为3×3的卷积核；

第二部分由5个卷积层组成，每一层卷积层均有128个通道数为64尺寸为3×3的卷积核；

第三部分由9个卷积层组成，每一层卷积层均有256个通道数为128尺寸为3×3的卷积核；

第四部分由3个卷积层组成，每一层卷积层均有512个通道数为256尺寸为3×3的卷积核；

前四部分各卷积层连接方式如图2，在每一个卷积层中，将输入数据X和卷积核C进行卷积运算，将得到的结果作为输出数据Y传入下一个卷积层，公式如下(*为卷积运算符号)：

Y＝X*C

前四部分中的逐元素相加符号表示将两个尺寸相同的矩阵中相对应位置各个单元的数值逐个相加后得到新的矩阵。

最后部分为分类参数矩阵。

举例，在100类人脸的识别任务中，将输入的一张长300宽300的人脸彩色图像转化为尺寸为300×300×3的矩阵，并将该矩阵数据作为输入数据导入RegularFace模型的第一层中与第一个卷积核进行卷积运算中，按照模型设计将输出数据导入下一层卷积层，直至最后经过分类参数矩阵输出100维的识别向量，该识别向量的每一个分量分别表示该图片属于100类人脸中某一类人脸的概率，同时也表示该模型完成了对人脸图像的识别。