CN116824659A

CN116824659A - 一种基于特征提取的智能机柜人脸识别方法

Info

Publication number: CN116824659A
Application number: CN202310508532.5A
Authority: CN
Inventors: 徐毓皓; 杨振国; 赵志刚; 丁超; 徐�明; 鞠首辉; 马中胜; 凤洋; 李佳哲; 梁超; 李星辉; 孙佳越
Original assignee: Jiamusi Power Supply Co Of State Grid Heilongjiang Electric Power Co ltd; State Grid Corp of China SGCC
Current assignee: Jiamusi Power Supply Co Of State Grid Heilongjiang Electric Power Co ltd; State Grid Corp of China SGCC
Priority date: 2023-05-08
Filing date: 2023-05-08
Publication date: 2023-09-29

Abstract

本发明涉及智能机柜领域，尤其涉及一种基于特征提取的人脸识别方法，包括步骤S1，对人脸图像进行预处理；步骤S2，提取LBP特征，采用主成分分析法进行降维；步骤S3，初始化NEW‑VGG网络参数模型，提取CNN特征；步骤S4，将CNN特征的卷积层特征和MB‑LBP特征在CNN特征的第一层进行合并和缩减；步骤S5，将处理后的特征导入Softmax层，得到最终的分类结果；步骤S6，调整特征向量参数，根据CNN网络调整权重参数。本发明通过加权方法融合LBP特征和神经网络两种特征，实现高精度、高效率的人脸识别。

Description

一种基于特征提取的智能机柜人脸识别方法

技术领域

本发明涉及智能机柜领域，尤其涉及一种基于特征提取的智能机柜人脸识别方法。

背景技术

随着电力系统信息化建设不断深化，传统的独立小型机房已难以适应和满足电力系统多元化业务发展需求，因此融合了调控、通信、量测等多种业务的集中式调控机房成为了电力系统数字化建设的新发展方向；目前，大部分电力公司都采用了集中式大型机房，这样的机房具有更好的实用性、先进性、可管理性、可扩展性和可维护性，同时在各系统间的组网与维护，以及系统的拓展上表现出了很好的兼容性；但日益扩大的机房容量也出现了在管理上的安全隐患，在目前管理模式中，集中式调控机房的管理技术人员授权管理机制不健全，大多数系统管理是建立在对管理人员及维护人员基本的信任基础上。

人脸识别又称人脸识别和人像识别，是一项受到社会各界广泛关注的生物特征识别技术，它以其非强制性、非接触性、并发性等特点成为一种炙手可热的生物特征识别技术；人脸识别技术主要是通过对图像采集设备采集的人脸图像进行特定的特征提取方法来提取人脸特征；一般来说，人脸描述特征可以分为全局特征和局部特征两大类全局特征描述了人脸的整体属性，如肤色、轮廓、面部器官分布等，即其特征向量的每个维度包含了人脸图像的所有部分(甚至所有像素)的信息，用于粗略匹配；局部特征不同于全局特征的是，每个维度只对应于人脸图像上的一个局部区域重点提取人脸的细节特征。特征提取是人脸识别中的一个难题。一方面，由于面部结构和器官外观的相似性，特征类之间的差异较小；有必要通过提取健壮的判别特征来放大这种变化和区分人类个体；另一方面，面部的外观相对不稳定；不同的面部表情，以及外部光线和年龄引起的面部结构变化，都导致人脸图像中同一个人的内部特征发生广泛的变化，有必要减少这种变化对识别的影响，因此，如何在复杂背景和光干涉条件下提取高特征成为一个亟待解决的问题。

发明内容

为此，本发明提供一种基于特征提取的智能机柜人脸识别方法，用以克服现有技术中复杂背景和光干涉条件下面部结构发生改变，导致智能机柜识别人脸错误率高的问题。

为实现上述目的，本发明提供一种基于特征提取的智能机柜人脸识别方法。

包括，步骤S1，对人脸图像进行预处理；

步骤S2，提取LBP特征，采用主成分分析法进行降维；

步骤S3，初始化NEW-VGG网络参数模型，提取CNN特征；

步骤S4，将所述CNN特征的卷积层特征和MB-LBP特征在所述CNN特征的第一层进行合并和缩减；

步骤S5，将处理后的特征导入Softmax层，得到最终的分类结果；

步骤S6，调整特征向量参数，根据CNN网络调整权重参数。

进一步地，所述步骤1中，对所述人脸图像进行预处理，包括使用相机捕捉所述人脸图像，对捕获的所述人脸图像进行缩放，以保持所采集所述人脸图像的一致性，并将所述人脸图像还转换成灰度格式。

进一步地，所述步骤2中，LBP算子为一种旋转不变性LBP算子，定义为:

其中R表示旋转不变LBP算子，其中/>表示旋转不变LBP算子，P表示邻域点的个数，R表示圆形邻域的半径，i表示顺时针选择的第i个邻域点，ROR(LBP_P,R,i)指沿顺时针方向旋转的第i次LBP算子，ri指第i个旋转不变性的LBP算子。

进一步地，包括图像像素，将初始正方形区域替换为圆形区域，沿时钟方向连续旋转半径为R的圆形邻域，取当前旋转的最小LBP，且使用等效模式LBP算子来降低旋转不变性LBP算子的二元模式类型的维数，得到二进制序列是端到端连接的LBP算子，用以将原始2^p二元模式类型降为P(P-1)+2，其公式为：

其中U(LBP_P,R)表示数字0到1或1到0的变化，式U(LBP_P,R)和/>中，P为邻域点个数，为矩形块中心像素的灰度值，g₀,...,g_P-1为中心像素域的P灰度值，R是圆形邻域的半径。

进一步地，将所述等效模式LBP算子和所述旋转不变LBP算子结合，且将新的LBP算子定义为用以将二进制模式从原来的2^P物种减少到P+1。

进一步地，选取面部的关键点作为采样区域，进行仿射变换，对面部进行校正，且将人脸区域的图片缩小到三个不同的尺度，包括75×75,120×120,224×224像素，固定采样窗口为P＝8且R＝1；采用无监督成分分析方法对LBP特征进行降维，包括，

第一步，构造M个个体人脸的训练样本，形成特征矩阵X，其中每个样本对应的特征向量为X_i，将X＝{X₁,X₂,...,X_M}转换为n×1个向量，且平均向量表示为:

第二步，根据式和式/>对特征矩阵均值，计算协方差矩阵P，只选取最大特征值对应的k个特征向量组合成一个矩阵U＝[μ₁,μ₂,...,μ_K],其中U是由向量μ_i平均后的特征向量矩阵，U矩阵中的每个特征向量称为一个特征面；将X投影到P坐标上，得到低维空间Y＝X×P的特征矩阵；

第三步，将LBP模态个数定为9个，选取5个关键点，采样区域大小为4×4，经过三种不同尺度的尺度变换，得到的LBP特征维数为2160(5×16×9×3)，即一个关键点区域包含432维的特征向量，采用主成分分析方法降维，得到每个关键点区域包含60维。

进一步地，所述步骤S3中，包括，

第一步，在初始层的特征映射上使用5×5个卷积核，在后两层特征映射上保持3×3个卷积核；

第二步，去掉全连通层的第一层，直接连通所述全连通层的第二层，然后将剩下的两个全连通层的节点数量分别减少到1024个和256个。

进一步地，所述步骤S4中，使用一个加权函数融合两个特征向量，包括，

第一步，结合LBP特征和CNN特征，n维LBP特征向量表示为V_Li，其中V_Li＝(V_L1,V_L2,...,V_Ln)；m维CNN特征向量表示为V_Ci，其中V_Ci＝(V_C1,V_C2,...,V_Cm)，第i个元素V_Ni的计算公式:

V_fc＝αV_Ci+(1-α)V_Li

式中，α为0～1之间的实数，对应两类特征组合的权重；有N个图像样本，每个样本的维数为D，则使用Softmax函数估计M个类中每个类标号的概率，其公式为:

f_yi＝W_i ^Tx+b_i

其中f_yi为得分函数，为第i类的线性预测结果，F_j为所有样本的得分函数值之和，每个样本x_i的大小为D×1,W_i ^T为第i个权重矩阵，大小为M×D，偏差为b，大小为D×1；对于给定的样本输入x_i,j＝1,...,M，某一类的概率值P＝(y_i|x_i)用矩阵形式表示为:

根据式f_yi＝W_i ^Tx+b_i和/>

计算损失函数，利用基于随机梯度后代优化方法的反向传播使式最小化；

第二步，融合特征降维，用于降低V_Ni的维数，消除冗余信息，生成新的有用信息。

进一步地，所述步骤S5中，将提取的图像特征进行组合并转发给全连接层，所述全连接层使用Softmax分类器对图像进行分类。

进一步地，所述步骤S6中，设置BP算法，所述BP算法包括激励传播环节和权重更新环节，所述激励传播环节和所述权重更新环节反复循环迭代；所述激励传播环节包括，

第一步，将训练输入送入网络以获得激励响应；

第二步，将激励响应同训练输入对应的目标输出求差，从而获得隐层和输出层的响应误差；

所述权重更新环节包括，

第一步，将输入激励和响应误差相乘，从而获得权重的梯度；

第二步，所述权重的梯度乘上一个比例并取反，并与权重相加。

与现有技术相比，本发明的有益效果在于，针对现有技术中复杂背景和光干涉条件下，现有的人脸识别技术不能准确识别人脸的问题；通过融合LBP特征和本发明改进后的VGG网络的卷积层，利用自适应加权函数，迫使网络学习更多的特征，从而有效地对结果进行分类，进而提高人脸识别精度。

附图说明

图1为本发明实施例中人脸识别技术的流程示意图；

图2为本发明实施例中人脸识别技术的程序运行示意图；

图3，其为不同尺度的LBP算子转换示意图；

图4为经过算法处理的提取图像特征对比图；

图5为训练损失和验证损失变化图。

具体实施方式

为了使本发明的目的和优点更加清楚明白，下面结合实施例对本发明作进一步描述；应当理解，此处所描述的具体实施例仅仅用于解释本发明，并不用于限定本发明。

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非在限制本发明的保护范围。

需要说明的是，在本发明的描述中，术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系，这仅仅是为了便于描述，而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

此外，还需要说明的是，在本发明的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域技术人员而言，可根据具体情况理解上述术语在本发明中的具体含义。

请参阅图1与图2所示，图1为本发明实施例中人脸识别技术的流程示意图；图2为本发明实施例中人脸识别技术的程序运行示意图。

本发明公开一种基于特征提取的智能机柜人脸识别方法，包括，

步骤S1，对人脸图像进行预处理；

步骤S2，提取LBP特征，采用主成分分析法进行降维；

步骤S3，初始化NEW-VGG网络参数模型，提取CNN特征；

步骤S6，调整特征向量参数，根据CNN网络调整权重参数，使得基于随机梯度后代优化方法的反向传播使误差最小。

具体而言，所述步骤1中，对所述人脸图像进行预处理，包括使用相机捕捉所述人脸图像，对捕获的所述人脸图像进行缩放，以保持所采集所述人脸图像的一致性，并将所述人脸图像还转换成灰度格式，以简化处理和减少其时间。

具体而言，所述步骤2中，LBP算子为一种旋转不变性LBP算子，定义为:

其中R表示旋转不变LBP算子。

本实施例中，局部二值模式(LBP)是计算机视觉领域里用于分类的视觉算子，PCA降维方法可以去除特征之间的冗余信息，使特征具有可分辨性；降维后得到的图像特征维数与深度卷积提取的特征接近，这有利于特征融合；

LBP是一种用来描述图像局部纹理特征的算子，它具有提取纹理细节特征的显著能力；LBP值是将图像的中心像素值与周围8个像素值进行比较得到的，该值描述了图像的局部纹理特征，传统的LBP算法如下:

其中(x,y)为中心像素，g_p为邻域像素，g_c为中心像素。S(x)根据与中心像素的差值转换为二进制数，定义如下:

从上面的方程中提取的二进制代码转换成十进制数，形成LBP图像；原始的LBP算子不能满足不同尺寸和频率纹理的要求，且不具有旋转不变性，因此提出一种具有旋转不变性的LBP算子。

请参阅图3，其为不同尺度的LBP算子转换示意图。

具体而言，包括图像像素，将初始正方形区域替换为圆形区域，沿时钟方向连续旋转半径为R的圆形邻域，取当前旋转的最小LBP，且使用等效模式LBP算子来降低旋转不变性LBP算子的二元模式类型的维数，得到二进制序列是端到端连接的LBP算子，用以将原始2^p二元模式类型降为P(P-1)+2，其公式为：

本实施例中，使用等效模式LBP算子来降低旋转不变LBP算子的二元模式类型的维数，LBP算子得到的二进制序列是端到端连接的；如果序列从1跳到0或从0跳到1不超过两次，则它是一个等效模型；该方法将原始2^p二元模式类型降为P(P-1)+2，在保证信息完整性的同时降低了特征向量维数，降低了高频噪声的影响。

具体而言，将所述等效模式LBP算子和所述旋转不变LBP算子结合，且将新的LBP算子定义为用以将二进制模式从原来的2^P物种减少到P+1，用以提取图像的整体纹理和轮廓特征。

具体而言，选取面部的关键点作为采样区域，进行仿射变换，对面部进行校正，且将人脸区域的图片缩小到三个不同的尺度，包括75×75,120×120,224×224像素，固定采样窗口为P＝8且R＝1；采用无监督成分分析方法对LBP特征进行降维，包括，

在进行人脸识别的主要过程之前，有必要对人脸区域进行识别；因此，有必要通过人脸检测过程来分离人脸和非人脸部分；通过使用MTCNN算法35来检测人脸并在数据集中定位特征点；选取面部的关键点，如左眼、右眼、鼻子、嘴角、右下角作为采样区域，进行仿射变换，对面部进行校正；通过在单个关键点附近的多尺度采样方法获得不同尺度的局部特征，从而增加LBP特征的维数；此外，不同的尺度使得提取的特征既包含细节信息，又包含相关的整体结构信息，增强了特征的表达能力；考虑到数据的主要信息集中在主成分上，采用无监督主成分分析方法36对高维LBP特征进行降维，在消除信息冗余和噪声的同时尽可能减少信息损失；

通过PCA降维方法可以去除特征之间的冗余信息，使特征具有可分辨性；经研究发现得到的图像特征维数与深度卷积提取的特征接近，这有利于特征融合。

具体而言，所述步骤S3中，包括，

该方法可以减少参数的数量，并提升卷积层的最后一层，以获得更多的可区分特征，这更适合于提高融合效果；步骤S3基于VGG-16CNN结构进行改进，改进后的网络命名为NEW-VGG，网络的输入图像大小为224×224×3，输出特征尺寸为12×12×256；发明人在网络中采用ReLU作为激活函数，并利用dropout来克服过拟合问题；一般来说，CNN需要在卷积层之后再连接一个低维的全连通层作为新的特征层来降低特征维数，卷积层获得的特征往往包含丰富的图像细节信息；因此，采用卷积层部分获得的特征作为要融合的特征。

深度学习方法的基础是神经网络模型，主要包括、循环神经网络和自编码器。CNN是一种特殊类型的人工神经网络，用于处理具有类似网格结构的数据，已成为图像分析领域的研究热点；网络的前端是多个卷积层和池化层的组合；后端连接到多个全连接CNN层，27和一个分类器作为输出；与传统的神经网络不同，它不需要将网络中的每个神经元与前一层的所有神经元连接起来；其优点是可以通过局部感知和权值共享来降低网络参数。

具体而言，所述步骤S4中，使用一个加权函数融合两个特征向量，包括，

V_fc＝αV_Ci+(1-α)V_Li

f_yi＝W_i ^Tx+b_i

根据式f_yi＝W_i ^Tx+b_i和/>

在图像特征中，每个神经元感知图像的局部部分，并利用每个神经元的局部信息结合图像的整体信息，减少网络需要学习的参数数量；权值共享使用不同的滤波器，也称为卷积核，提取图像在不同位置的不同特征的激活值，提取特征图像通过多个卷积核，采样层也称为池化层，它在减小维数的同时压缩了输入图像的局部区域，防止了过拟合，通用的抽样方法是最大(或平均)池，发明人使用Softmax分类器作为分类任务的最终输出，以估计M个类中每个类标签的概率。

具体而言，所述步骤S5中，将提取的图像特征进行组合并转发给全连接层，所述全连接层使用Softmax分类器对图像进行分类。

Softmax分类器使用给全连接层中的每个类的评分值，并根据每个类的概率值对图像进行分类，Softmax分类器的使用改善了所提模型的处理时间，因为它为查询的图像提供了一个概率分数来识别类，使用额外的模块来显示带有被识别个体身份的输出图像，通过式比较查询图像和画廊图像提取的特征，根据提取的图像特征与存储的图库图像特征的相似度对新图像进行分类。

具体而言，所述步骤S6中，设置BP算法，所述BP算法包括激励传播环节和权重更新环节，所述激励传播环节和所述权重更新环节反复循环迭代；所述激励传播环节包括，

第一步，将训练输入送入网络以获得激励响应；

所述权重更新环节包括，

本实施例中，梯度的方向指明了误差扩大的方向，因此在更新权重的时候需要对其取反，从而减小权重引起的误差；

误差反向传播算法(BP算法)适合于多层神经元网络的一种学习算法，它建立在梯度下降法的基础上，BP网络的输入输出关系实质上是一种映射关系：一个n输入m，输出的BP神经网络所完成的功能是从n维欧氏空间向m维欧氏空间中一有限域的连续映射，这一映射具有高度非线性，它的信息处理能力来源于简单非线性函数的多次复合，因此具有很强的函数复现能力；由于神经网络涉及到不同的层，每一层都是大量的神经元，而这些神经元又有大量的参数，对神经网络的这些组件进行微调，可以提高分类系统的性能，但是，由于网络中有这么多的参数，所以训练数据集过拟合的几率较高，数据的欠拟合和过拟合都会降低分类模型的性能，因此采用BP算法解决上述问题，提高分类模型的性能；

BP算法的学习过程由正向传播过程和反向传播过程组成，在正向传播过程中，输入信息通过输入层经隐含层，逐层处理并传向输出层，若在输出层得不到期望的输出值，则取输出与期望的误差的平方和作为目标函数，转入反向传播，逐层求出目标函数对各神经元权值的偏导数，构成目标函数对权值向量的梯量，作为修改权值的依据，网络的学习在权值修改过程中完成，误差达到所期望值时，网络学习结束；

融合后的特征更加可识别，进一步提高了特征对光照和人脸旋转的鲁棒性，带来更好的识别效果，最后将融合特征输入到网络模型的Softmax层，并利用BP算法调整参数，得到最终的分类识别结果。

请参阅图4与图5，图4为经过算法处理的提取图像特征对比图，图5为训练损失和验证损失变化图。利用上述方法，首先对一张图片进行预处理，然后提取LBP特征(LBP特征维数为2160)，并采用主成分分析方法降维，得到关键点区域包含的60维特征，从而得到图4。

将降维后的图像数据输入到改进的神经网络中，进行模型训练，随着训练周期的增加，训练损失和验证损失在不断减少，直到满足输出条件。将处理后的特征导入到Softmax层,即可得到最终图像识别结果。在上述训成果上，在大量图片集中进行验证，证实了本方案的可行性。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征做出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

以上所述仅为本发明的优选实施例，并不用于限制本发明；对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于特征提取的智能机柜人脸识别方法，其特征在于，包括，

步骤S1，对人脸图像进行预处理；

步骤S2，提取LBP特征，采用主成分分析法进行降维；

步骤S3，初始化NEW-VGG网络参数模型，提取CNN特征；

步骤S6，调整特征向量参数，根据CNN网络调整权重参数。

2.根据权利要求1所述的基于特征提取的智能机柜人脸识别方法，其特征在于，所述步骤1中，对所述人脸图像进行预处理，包括使用相机捕捉人脸图像，对捕获的人脸图像进行缩放，以保持所采集人脸图像的一致性，并将人脸图像还转换成灰度格式。

3.根据权利要求1所述的基于特征提取的智能机柜人脸识别方法，其特征在于，所述步骤2中，LBP算子为一种旋转不变性LBP算子，定义为:

其中表示旋转不变LBP算子，P表示邻域点的个数，R表示圆形邻域的半径，i表示顺时针选择的第i个邻域点，ROR(LBP_P,R,i)指沿顺时针方向旋转的第i次LBP算子，ri指第i个旋转不变性的LBP算子。

4.根据权利要求3所述的基于特征提取的智能机柜人脸识别方法，其特征在于，包括图像像素，将初始正方形区域替换为圆形区域，沿时钟方向连续旋转半径为R的圆形邻域，取当前旋转的最小LBP，且使用等效模式LBP算子来降低旋转不变性LBP算子的二元模式类型的维数，得到二进制序列是端到端连接的LBP算子，用以将原始2^p二元模式类型降为P(P-1)+2，其公式为：

其中U(LBP_P,R)表示数字0到1或1到0的变化，表示统一化的LBP算子，式/>U(LBP_P,R)和/>中，P为邻域点个数，为矩形块中心像素的灰度值，g₀,...,g_P-1为中心像素域的P灰度值，R是圆形邻域的半径。

5.根据权利要求4所述的基于特征提取的智能机柜人脸识别方法，其特征在于，将所述等效模式LBP算子和所述旋转不变LBP算子结合，且将新的LBP算子定义为用以将二进制模式从原来的2^P物种减少到P+1。

6.根据权利要求5所述的基于特征提取的智能机柜人脸识别方法，其特征在于，选取面部的关键点作为采样区域，进行仿射变换，对面部进行校正，且将人脸区域的图片缩小到三个不同的尺度，包括75×75,120×120,224×224像素，固定采样窗口为P＝8且R＝1；采用无监督成分分析方法对LBP特征进行降维，包括，

7.根据权利要求1所述的基于特征提取的智能机柜人脸识别方法，其特征在于，所述步骤S3中，包括，

8.根据权利要求1所述的基于特征提取的智能机柜人脸识别方法，其特征在于，所述步骤S4中，使用一个加权函数融合两个特征向量，包括，

V_fc＝αV_Ci+(1-α)V_Li

f_yi＝W_i ^Tx+b_i

其中f_yi为得分函数，为第i类的线性预测结果，F_j为所有样本的得分函数值之和，每个样本x_i的大小为D×1,W_i ^T为第i个权重矩阵，大小为M×D，偏差为b，大小为D×1；对于给定的样本输入x_i,j＝1,...,M，对于任一一类的概率值P＝(y_i|x_i)用矩阵形式表示为:

根据式f_yi＝W_i ^Tx+b_i和/>

9.根据权利要求1所述的基于特征提取的智能机柜人脸识别方法，其特征在于，所述步骤S5中，将提取的图像特征进行组合并转发给全连接层，所述全连接层使用Softmax分类器对图像进行分类。

10.根据权利要求1所述的基于特征提取的智能机柜人脸识别方法，其特征在于，所述步骤S6中，设置BP算法，所述BP算法包括激励传播环节和权重更新环节，所述激励传播环节和所述权重更新环节反复循环迭代；所述激励传播环节包括，

第一步，将训练输入送入网络以获得激励响应；

所述权重更新环节包括，