CN116824659A - 一种基于特征提取的智能机柜人脸识别方法 - Google Patents
一种基于特征提取的智能机柜人脸识别方法 Download PDFInfo
- Publication number
- CN116824659A CN116824659A CN202310508532.5A CN202310508532A CN116824659A CN 116824659 A CN116824659 A CN 116824659A CN 202310508532 A CN202310508532 A CN 202310508532A CN 116824659 A CN116824659 A CN 116824659A
- Authority
- CN
- China
- Prior art keywords
- lbp
- feature
- layer
- face recognition
- feature extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000000605 extraction Methods 0.000 title claims abstract description 19
- 239000013598 vector Substances 0.000 claims abstract description 31
- 238000012847 principal component analysis method Methods 0.000 claims abstract description 8
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 239000011159 matrix material Substances 0.000 claims description 26
- 230000006870 function Effects 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 16
- 230000005284 excitation Effects 0.000 claims description 15
- 238000005070 sampling Methods 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 12
- 238000004891 communication Methods 0.000 claims description 11
- 230000008859 change Effects 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 8
- 230000009467 reduction Effects 0.000 claims description 6
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 238000013527 convolutional neural network Methods 0.000 abstract description 19
- 238000013528 artificial neural network Methods 0.000 abstract description 9
- 238000005516 engineering process Methods 0.000 description 8
- 210000002569 neuron Anatomy 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000013507 mapping Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000001815 facial effect Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000013475 authorization Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本发明涉及智能机柜领域,尤其涉及一种基于特征提取的人脸识别方法,包括步骤S1,对人脸图像进行预处理;步骤S2,提取LBP特征,采用主成分分析法进行降维;步骤S3,初始化NEW‑VGG网络参数模型,提取CNN特征;步骤S4,将CNN特征的卷积层特征和MB‑LBP特征在CNN特征的第一层进行合并和缩减;步骤S5,将处理后的特征导入Softmax层,得到最终的分类结果;步骤S6,调整特征向量参数,根据CNN网络调整权重参数。本发明通过加权方法融合LBP特征和神经网络两种特征,实现高精度、高效率的人脸识别。
Description
技术领域
本发明涉及智能机柜领域,尤其涉及一种基于特征提取的智能机柜人脸识别方法。
背景技术
随着电力系统信息化建设不断深化,传统的独立小型机房已难以适应和满足电力系统多元化业务发展需求,因此融合了调控、通信、量测等多种业务的集中式调控机房成为了电力系统数字化建设的新发展方向;目前,大部分电力公司都采用了集中式大型机房,这样的机房具有更好的实用性、先进性、可管理性、可扩展性和可维护性,同时在各系统间的组网与维护,以及系统的拓展上表现出了很好的兼容性;但日益扩大的机房容量也出现了在管理上的安全隐患,在目前管理模式中,集中式调控机房的管理技术人员授权管理机制不健全,大多数系统管理是建立在对管理人员及维护人员基本的信任基础上。
人脸识别又称人脸识别和人像识别,是一项受到社会各界广泛关注的生物特征识别技术,它以其非强制性、非接触性、并发性等特点成为一种炙手可热的生物特征识别技术;人脸识别技术主要是通过对图像采集设备采集的人脸图像进行特定的特征提取方法来提取人脸特征;一般来说,人脸描述特征可以分为全局特征和局部特征两大类全局特征描述了人脸的整体属性,如肤色、轮廓、面部器官分布等,即其特征向量的每个维度包含了人脸图像的所有部分(甚至所有像素)的信息,用于粗略匹配;局部特征不同于全局特征的是,每个维度只对应于人脸图像上的一个局部区域重点提取人脸的细节特征。特征提取是人脸识别中的一个难题。一方面,由于面部结构和器官外观的相似性,特征类之间的差异较小;有必要通过提取健壮的判别特征来放大这种变化和区分人类个体;另一方面,面部的外观相对不稳定;不同的面部表情,以及外部光线和年龄引起的面部结构变化,都导致人脸图像中同一个人的内部特征发生广泛的变化,有必要减少这种变化对识别的影响,因此,如何在复杂背景和光干涉条件下提取高特征成为一个亟待解决的问题。
发明内容
为此,本发明提供一种基于特征提取的智能机柜人脸识别方法,用以克服现有技术中复杂背景和光干涉条件下面部结构发生改变,导致智能机柜识别人脸错误率高的问题。
为实现上述目的,本发明提供一种基于特征提取的智能机柜人脸识别方法。
包括,步骤S1,对人脸图像进行预处理;
步骤S2,提取LBP特征,采用主成分分析法进行降维;
步骤S3,初始化NEW-VGG网络参数模型,提取CNN特征;
步骤S4,将所述CNN特征的卷积层特征和MB-LBP特征在所述CNN特征的第一层进行合并和缩减;
步骤S5,将处理后的特征导入Softmax层,得到最终的分类结果;
步骤S6,调整特征向量参数,根据CNN网络调整权重参数。
进一步地,所述步骤1中,对所述人脸图像进行预处理,包括使用相机捕捉所述人脸图像,对捕获的所述人脸图像进行缩放,以保持所采集所述人脸图像的一致性,并将所述人脸图像还转换成灰度格式。
进一步地,所述步骤2中,LBP算子为一种旋转不变性LBP算子,定义为:
其中R表示旋转不变LBP算子,其中/>表示旋转不变LBP算子,P表示邻域点的个数,R表示圆形邻域的半径,i表示顺时针选择的第i个邻域点,ROR(LBPP,R,i)指沿顺时针方向旋转的第i次LBP算子,ri指第i个旋转不变性的LBP算子。
进一步地,包括图像像素,将初始正方形区域替换为圆形区域,沿时钟方向连续旋转半径为R的圆形邻域,取当前旋转的最小LBP,且使用等效模式LBP算子来降低旋转不变性LBP算子的二元模式类型的维数,得到二进制序列是端到端连接的LBP算子,用以将原始2p二元模式类型降为P(P-1)+2,其公式为:
其中U(LBPP,R)表示数字0到1或1到0的变化,式U(LBPP,R)和/>中,P为邻域点个数,为矩形块中心像素的灰度值,g0,...,gP-1为中心像素域的P灰度值,R是圆形邻域的半径。
进一步地,将所述等效模式LBP算子和所述旋转不变LBP算子结合,且将新的LBP算子定义为用以将二进制模式从原来的2P物种减少到P+1。
进一步地,选取面部的关键点作为采样区域,进行仿射变换,对面部进行校正,且将人脸区域的图片缩小到三个不同的尺度,包括75×75,120×120,224×224像素,固定采样窗口为P=8且R=1;采用无监督成分分析方法对LBP特征进行降维,包括,
第一步,构造M个个体人脸的训练样本,形成特征矩阵X,其中每个样本对应的特征向量为Xi,将X={X1,X2,...,XM}转换为n×1个向量,且平均向量表示为:
第二步,根据式和式/>对特征矩阵均值,计算协方差矩阵P,只选取最大特征值对应的k个特征向量组合成一个矩阵U=[μ1,μ2,...,μK],其中U是由向量μi平均后的特征向量矩阵,U矩阵中的每个特征向量称为一个特征面;将X投影到P坐标上,得到低维空间Y=X×P的特征矩阵;
第三步,将LBP模态个数定为9个,选取5个关键点,采样区域大小为4×4,经过三种不同尺度的尺度变换,得到的LBP特征维数为2160(5×16×9×3),即一个关键点区域包含432维的特征向量,采用主成分分析方法降维,得到每个关键点区域包含60维。
进一步地,所述步骤S3中,包括,
第一步,在初始层的特征映射上使用5×5个卷积核,在后两层特征映射上保持3×3个卷积核;
第二步,去掉全连通层的第一层,直接连通所述全连通层的第二层,然后将剩下的两个全连通层的节点数量分别减少到1024个和256个。
进一步地,所述步骤S4中,使用一个加权函数融合两个特征向量,包括,
第一步,结合LBP特征和CNN特征,n维LBP特征向量表示为VLi,其中VLi=(VL1,VL2,...,VLn);m维CNN特征向量表示为VCi,其中VCi=(VC1,VC2,...,VCm),第i个元素VNi的计算公式:
Vfc=αVCi+(1-α)VLi
式中,α为0~1之间的实数,对应两类特征组合的权重;有N个图像样本,每个样本的维数为D,则使用Softmax函数估计M个类中每个类标号的概率,其公式为:
fyi=Wi Tx+bi
其中fyi为得分函数,为第i类的线性预测结果,Fj为所有样本的得分函数值之和,每个样本xi的大小为D×1,Wi T为第i个权重矩阵,大小为M×D,偏差为b,大小为D×1;对于给定的样本输入xi,j=1,...,M,某一类的概率值P=(yi|xi)用矩阵形式表示为:
根据式fyi=Wi Tx+bi和/>
计算损失函数,利用基于随机梯度后代优化方法的反向传播使式最小化;
第二步,融合特征降维,用于降低VNi的维数,消除冗余信息,生成新的有用信息。
进一步地,所述步骤S5中,将提取的图像特征进行组合并转发给全连接层,所述全连接层使用Softmax分类器对图像进行分类。
进一步地,所述步骤S6中,设置BP算法,所述BP算法包括激励传播环节和权重更新环节,所述激励传播环节和所述权重更新环节反复循环迭代;所述激励传播环节包括,
第一步,将训练输入送入网络以获得激励响应;
第二步,将激励响应同训练输入对应的目标输出求差,从而获得隐层和输出层的响应误差;
所述权重更新环节包括,
第一步,将输入激励和响应误差相乘,从而获得权重的梯度;
第二步,所述权重的梯度乘上一个比例并取反,并与权重相加。
与现有技术相比,本发明的有益效果在于,针对现有技术中复杂背景和光干涉条件下,现有的人脸识别技术不能准确识别人脸的问题;通过融合LBP特征和本发明改进后的VGG网络的卷积层,利用自适应加权函数,迫使网络学习更多的特征,从而有效地对结果进行分类,进而提高人脸识别精度。
附图说明
图1为本发明实施例中人脸识别技术的流程示意图;
图2为本发明实施例中人脸识别技术的程序运行示意图;
图3,其为不同尺度的LBP算子转换示意图;
图4为经过算法处理的提取图像特征对比图;
图5为训练损失和验证损失变化图。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
请参阅图1与图2所示,图1为本发明实施例中人脸识别技术的流程示意图;图2为本发明实施例中人脸识别技术的程序运行示意图。
本发明公开一种基于特征提取的智能机柜人脸识别方法,包括,
步骤S1,对人脸图像进行预处理;
步骤S2,提取LBP特征,采用主成分分析法进行降维;
步骤S3,初始化NEW-VGG网络参数模型,提取CNN特征;
步骤S4,将所述CNN特征的卷积层特征和MB-LBP特征在所述CNN特征的第一层进行合并和缩减;
步骤S5,将处理后的特征导入Softmax层,得到最终的分类结果;
步骤S6,调整特征向量参数,根据CNN网络调整权重参数,使得基于随机梯度后代优化方法的反向传播使误差最小。
具体而言,所述步骤1中,对所述人脸图像进行预处理,包括使用相机捕捉所述人脸图像,对捕获的所述人脸图像进行缩放,以保持所采集所述人脸图像的一致性,并将所述人脸图像还转换成灰度格式,以简化处理和减少其时间。
具体而言,所述步骤2中,LBP算子为一种旋转不变性LBP算子,定义为:
其中R表示旋转不变LBP算子。
本实施例中,局部二值模式(LBP)是计算机视觉领域里用于分类的视觉算子,PCA降维方法可以去除特征之间的冗余信息,使特征具有可分辨性;降维后得到的图像特征维数与深度卷积提取的特征接近,这有利于特征融合;
LBP是一种用来描述图像局部纹理特征的算子,它具有提取纹理细节特征的显著能力;LBP值是将图像的中心像素值与周围8个像素值进行比较得到的,该值描述了图像的局部纹理特征,传统的LBP算法如下:
其中(x,y)为中心像素,gp为邻域像素,gc为中心像素。S(x)根据与中心像素的差值转换为二进制数,定义如下:
从上面的方程中提取的二进制代码转换成十进制数,形成LBP图像;原始的LBP算子不能满足不同尺寸和频率纹理的要求,且不具有旋转不变性,因此提出一种具有旋转不变性的LBP算子。
请参阅图3,其为不同尺度的LBP算子转换示意图。
具体而言,包括图像像素,将初始正方形区域替换为圆形区域,沿时钟方向连续旋转半径为R的圆形邻域,取当前旋转的最小LBP,且使用等效模式LBP算子来降低旋转不变性LBP算子的二元模式类型的维数,得到二进制序列是端到端连接的LBP算子,用以将原始2p二元模式类型降为P(P-1)+2,其公式为:
其中U(LBPP,R)表示数字0到1或1到0的变化,式U(LBPP,R)和/>中,P为邻域点个数,为矩形块中心像素的灰度值,g0,...,gP-1为中心像素域的P灰度值,R是圆形邻域的半径。
本实施例中,使用等效模式LBP算子来降低旋转不变LBP算子的二元模式类型的维数,LBP算子得到的二进制序列是端到端连接的;如果序列从1跳到0或从0跳到1不超过两次,则它是一个等效模型;该方法将原始2p二元模式类型降为P(P-1)+2,在保证信息完整性的同时降低了特征向量维数,降低了高频噪声的影响。
具体而言,将所述等效模式LBP算子和所述旋转不变LBP算子结合,且将新的LBP算子定义为用以将二进制模式从原来的2P物种减少到P+1,用以提取图像的整体纹理和轮廓特征。
具体而言,选取面部的关键点作为采样区域,进行仿射变换,对面部进行校正,且将人脸区域的图片缩小到三个不同的尺度,包括75×75,120×120,224×224像素,固定采样窗口为P=8且R=1;采用无监督成分分析方法对LBP特征进行降维,包括,
第一步,构造M个个体人脸的训练样本,形成特征矩阵X,其中每个样本对应的特征向量为Xi,将X={X1,X2,...,XM}转换为n×1个向量,且平均向量表示为:
第二步,根据式和式/>对特征矩阵均值,计算协方差矩阵P,只选取最大特征值对应的k个特征向量组合成一个矩阵U=[μ1,μ2,...,μK],其中U是由向量μi平均后的特征向量矩阵,U矩阵中的每个特征向量称为一个特征面;将X投影到P坐标上,得到低维空间Y=X×P的特征矩阵;
第三步,将LBP模态个数定为9个,选取5个关键点,采样区域大小为4×4,经过三种不同尺度的尺度变换,得到的LBP特征维数为2160(5×16×9×3),即一个关键点区域包含432维的特征向量,采用主成分分析方法降维,得到每个关键点区域包含60维。
在进行人脸识别的主要过程之前,有必要对人脸区域进行识别;因此,有必要通过人脸检测过程来分离人脸和非人脸部分;通过使用MTCNN算法35来检测人脸并在数据集中定位特征点;选取面部的关键点,如左眼、右眼、鼻子、嘴角、右下角作为采样区域,进行仿射变换,对面部进行校正;通过在单个关键点附近的多尺度采样方法获得不同尺度的局部特征,从而增加LBP特征的维数;此外,不同的尺度使得提取的特征既包含细节信息,又包含相关的整体结构信息,增强了特征的表达能力;考虑到数据的主要信息集中在主成分上,采用无监督主成分分析方法36对高维LBP特征进行降维,在消除信息冗余和噪声的同时尽可能减少信息损失;
通过PCA降维方法可以去除特征之间的冗余信息,使特征具有可分辨性;经研究发现得到的图像特征维数与深度卷积提取的特征接近,这有利于特征融合。
具体而言,所述步骤S3中,包括,
第一步,在初始层的特征映射上使用5×5个卷积核,在后两层特征映射上保持3×3个卷积核;
第二步,去掉全连通层的第一层,直接连通所述全连通层的第二层,然后将剩下的两个全连通层的节点数量分别减少到1024个和256个。
该方法可以减少参数的数量,并提升卷积层的最后一层,以获得更多的可区分特征,这更适合于提高融合效果;步骤S3基于VGG-16CNN结构进行改进,改进后的网络命名为NEW-VGG,网络的输入图像大小为224×224×3,输出特征尺寸为12×12×256;发明人在网络中采用ReLU作为激活函数,并利用dropout来克服过拟合问题;一般来说,CNN需要在卷积层之后再连接一个低维的全连通层作为新的特征层来降低特征维数,卷积层获得的特征往往包含丰富的图像细节信息;因此,采用卷积层部分获得的特征作为要融合的特征。
深度学习方法的基础是神经网络模型,主要包括、循环神经网络和自编码器。CNN是一种特殊类型的人工神经网络,用于处理具有类似网格结构的数据,已成为图像分析领域的研究热点;网络的前端是多个卷积层和池化层的组合;后端连接到多个全连接CNN层,27和一个分类器作为输出;与传统的神经网络不同,它不需要将网络中的每个神经元与前一层的所有神经元连接起来;其优点是可以通过局部感知和权值共享来降低网络参数。
具体而言,所述步骤S4中,使用一个加权函数融合两个特征向量,包括,
第一步,结合LBP特征和CNN特征,n维LBP特征向量表示为VLi,其中VLi=(VL1,VL2,...,VLn);m维CNN特征向量表示为VCi,其中VCi=(VC1,VC2,...,VCm),第i个元素VNi的计算公式:
Vfc=αVCi+(1-α)VLi
式中,α为0~1之间的实数,对应两类特征组合的权重;有N个图像样本,每个样本的维数为D,则使用Softmax函数估计M个类中每个类标号的概率,其公式为:
fyi=Wi Tx+bi
其中fyi为得分函数,为第i类的线性预测结果,Fj为所有样本的得分函数值之和,每个样本xi的大小为D×1,Wi T为第i个权重矩阵,大小为M×D,偏差为b,大小为D×1;对于给定的样本输入xi,j=1,...,M,某一类的概率值P=(yi|xi)用矩阵形式表示为:
根据式fyi=Wi Tx+bi和/>
计算损失函数,利用基于随机梯度后代优化方法的反向传播使式最小化;
第二步,融合特征降维,用于降低VNi的维数,消除冗余信息,生成新的有用信息。
在图像特征中,每个神经元感知图像的局部部分,并利用每个神经元的局部信息结合图像的整体信息,减少网络需要学习的参数数量;权值共享使用不同的滤波器,也称为卷积核,提取图像在不同位置的不同特征的激活值,提取特征图像通过多个卷积核,采样层也称为池化层,它在减小维数的同时压缩了输入图像的局部区域,防止了过拟合,通用的抽样方法是最大(或平均)池,发明人使用Softmax分类器作为分类任务的最终输出,以估计M个类中每个类标签的概率。
具体而言,所述步骤S5中,将提取的图像特征进行组合并转发给全连接层,所述全连接层使用Softmax分类器对图像进行分类。
Softmax分类器使用给全连接层中的每个类的评分值,并根据每个类的概率值对图像进行分类,Softmax分类器的使用改善了所提模型的处理时间,因为它为查询的图像提供了一个概率分数来识别类,使用额外的模块来显示带有被识别个体身份的输出图像,通过式比较查询图像和画廊图像提取的特征,根据提取的图像特征与存储的图库图像特征的相似度对新图像进行分类。
具体而言,所述步骤S6中,设置BP算法,所述BP算法包括激励传播环节和权重更新环节,所述激励传播环节和所述权重更新环节反复循环迭代;所述激励传播环节包括,
第一步,将训练输入送入网络以获得激励响应;
第二步,将激励响应同训练输入对应的目标输出求差,从而获得隐层和输出层的响应误差;
所述权重更新环节包括,
第一步,将输入激励和响应误差相乘,从而获得权重的梯度;
第二步,所述权重的梯度乘上一个比例并取反,并与权重相加。
本实施例中,梯度的方向指明了误差扩大的方向,因此在更新权重的时候需要对其取反,从而减小权重引起的误差;
误差反向传播算法(BP算法)适合于多层神经元网络的一种学习算法,它建立在梯度下降法的基础上,BP网络的输入输出关系实质上是一种映射关系:一个n输入m,输出的BP神经网络所完成的功能是从n维欧氏空间向m维欧氏空间中一有限域的连续映射,这一映射具有高度非线性,它的信息处理能力来源于简单非线性函数的多次复合,因此具有很强的函数复现能力;由于神经网络涉及到不同的层,每一层都是大量的神经元,而这些神经元又有大量的参数,对神经网络的这些组件进行微调,可以提高分类系统的性能,但是,由于网络中有这么多的参数,所以训练数据集过拟合的几率较高,数据的欠拟合和过拟合都会降低分类模型的性能,因此采用BP算法解决上述问题,提高分类模型的性能;
BP算法的学习过程由正向传播过程和反向传播过程组成,在正向传播过程中,输入信息通过输入层经隐含层,逐层处理并传向输出层,若在输出层得不到期望的输出值,则取输出与期望的误差的平方和作为目标函数,转入反向传播,逐层求出目标函数对各神经元权值的偏导数,构成目标函数对权值向量的梯量,作为修改权值的依据,网络的学习在权值修改过程中完成,误差达到所期望值时,网络学习结束;
融合后的特征更加可识别,进一步提高了特征对光照和人脸旋转的鲁棒性,带来更好的识别效果,最后将融合特征输入到网络模型的Softmax层,并利用BP算法调整参数,得到最终的分类识别结果。
请参阅图4与图5,图4为经过算法处理的提取图像特征对比图,图5为训练损失和验证损失变化图。利用上述方法,首先对一张图片进行预处理,然后提取LBP特征(LBP特征维数为2160),并采用主成分分析方法降维,得到关键点区域包含的60维特征,从而得到图4。
将降维后的图像数据输入到改进的神经网络中,进行模型训练,随着训练周期的增加,训练损失和验证损失在不断减少,直到满足输出条件。将处理后的特征导入到Softmax层,即可得到最终图像识别结果。在上述训成果上,在大量图片集中进行验证,证实了本方案的可行性。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于特征提取的智能机柜人脸识别方法,其特征在于,包括,
步骤S1,对人脸图像进行预处理;
步骤S2,提取LBP特征,采用主成分分析法进行降维;
步骤S3,初始化NEW-VGG网络参数模型,提取CNN特征;
步骤S4,将所述CNN特征的卷积层特征和MB-LBP特征在所述CNN特征的第一层进行合并和缩减;
步骤S5,将处理后的特征导入Softmax层,得到最终的分类结果;
步骤S6,调整特征向量参数,根据CNN网络调整权重参数。
2.根据权利要求1所述的基于特征提取的智能机柜人脸识别方法,其特征在于,所述步骤1中,对所述人脸图像进行预处理,包括使用相机捕捉人脸图像,对捕获的人脸图像进行缩放,以保持所采集人脸图像的一致性,并将人脸图像还转换成灰度格式。
3.根据权利要求1所述的基于特征提取的智能机柜人脸识别方法,其特征在于,所述步骤2中,LBP算子为一种旋转不变性LBP算子,定义为:
其中表示旋转不变LBP算子,P表示邻域点的个数,R表示圆形邻域的半径,i表示顺时针选择的第i个邻域点,ROR(LBPP,R,i)指沿顺时针方向旋转的第i次LBP算子,ri指第i个旋转不变性的LBP算子。
4.根据权利要求3所述的基于特征提取的智能机柜人脸识别方法,其特征在于,包括图像像素,将初始正方形区域替换为圆形区域,沿时钟方向连续旋转半径为R的圆形邻域,取当前旋转的最小LBP,且使用等效模式LBP算子来降低旋转不变性LBP算子的二元模式类型的维数,得到二进制序列是端到端连接的LBP算子,用以将原始2p二元模式类型降为P(P-1)+2,其公式为:
其中U(LBPP,R)表示数字0到1或1到0的变化,表示统一化的LBP算子,式/>U(LBPP,R)和/>中,P为邻域点个数,为矩形块中心像素的灰度值,g0,...,gP-1为中心像素域的P灰度值,R是圆形邻域的半径。
5.根据权利要求4所述的基于特征提取的智能机柜人脸识别方法,其特征在于,将所述等效模式LBP算子和所述旋转不变LBP算子结合,且将新的LBP算子定义为用以将二进制模式从原来的2P物种减少到P+1。
6.根据权利要求5所述的基于特征提取的智能机柜人脸识别方法,其特征在于,选取面部的关键点作为采样区域,进行仿射变换,对面部进行校正,且将人脸区域的图片缩小到三个不同的尺度,包括75×75,120×120,224×224像素,固定采样窗口为P=8且R=1;采用无监督成分分析方法对LBP特征进行降维,包括,
第一步,构造M个个体人脸的训练样本,形成特征矩阵X,其中每个样本对应的特征向量为Xi,将X={X1,X2,...,XM}转换为n×1个向量,且平均向量表示为:
第二步,根据式和式/>对特征矩阵均值,计算协方差矩阵P,只选取最大特征值对应的k个特征向量组合成一个矩阵U=[μ1,μ2,...,μK],其中U是由向量μi平均后的特征向量矩阵,U矩阵中的每个特征向量称为一个特征面;将X投影到P坐标上,得到低维空间Y=X×P的特征矩阵;
第三步,将LBP模态个数定为9个,选取5个关键点,采样区域大小为4×4,经过三种不同尺度的尺度变换,得到的LBP特征维数为2160(5×16×9×3),即一个关键点区域包含432维的特征向量,采用主成分分析方法降维,得到每个关键点区域包含60维。
7.根据权利要求1所述的基于特征提取的智能机柜人脸识别方法,其特征在于,所述步骤S3中,包括,
第一步,在初始层的特征映射上使用5×5个卷积核,在后两层特征映射上保持3×3个卷积核;
第二步,去掉全连通层的第一层,直接连通所述全连通层的第二层,然后将剩下的两个全连通层的节点数量分别减少到1024个和256个。
8.根据权利要求1所述的基于特征提取的智能机柜人脸识别方法,其特征在于,所述步骤S4中,使用一个加权函数融合两个特征向量,包括,
第一步,结合LBP特征和CNN特征,n维LBP特征向量表示为VLi,其中VLi=(VL1,VL2,...,VLn);m维CNN特征向量表示为VCi,其中VCi=(VC1,VC2,...,VCm),第i个元素VNi的计算公式:
Vfc=αVCi+(1-α)VLi
式中,α为0~1之间的实数,对应两类特征组合的权重;有N个图像样本,每个样本的维数为D,则使用Softmax函数估计M个类中每个类标号的概率,其公式为:
fyi=Wi Tx+bi
其中fyi为得分函数,为第i类的线性预测结果,Fj为所有样本的得分函数值之和,每个样本xi的大小为D×1,Wi T为第i个权重矩阵,大小为M×D,偏差为b,大小为D×1;对于给定的样本输入xi,j=1,...,M,对于任一一类的概率值P=(yi|xi)用矩阵形式表示为:
根据式fyi=Wi Tx+bi和/>
计算损失函数,利用基于随机梯度后代优化方法的反向传播使式最小化;
第二步,融合特征降维,用于降低VNi的维数,消除冗余信息,生成新的有用信息。
9.根据权利要求1所述的基于特征提取的智能机柜人脸识别方法,其特征在于,所述步骤S5中,将提取的图像特征进行组合并转发给全连接层,所述全连接层使用Softmax分类器对图像进行分类。
10.根据权利要求1所述的基于特征提取的智能机柜人脸识别方法,其特征在于,所述步骤S6中,设置BP算法,所述BP算法包括激励传播环节和权重更新环节,所述激励传播环节和所述权重更新环节反复循环迭代;所述激励传播环节包括,
第一步,将训练输入送入网络以获得激励响应;
第二步,将激励响应同训练输入对应的目标输出求差,从而获得隐层和输出层的响应误差;
所述权重更新环节包括,
第一步,将输入激励和响应误差相乘,从而获得权重的梯度;
第二步,所述权重的梯度乘上一个比例并取反,并与权重相加。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310508532.5A CN116824659A (zh) | 2023-05-08 | 2023-05-08 | 一种基于特征提取的智能机柜人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310508532.5A CN116824659A (zh) | 2023-05-08 | 2023-05-08 | 一种基于特征提取的智能机柜人脸识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116824659A true CN116824659A (zh) | 2023-09-29 |
Family
ID=88121170
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310508532.5A Pending CN116824659A (zh) | 2023-05-08 | 2023-05-08 | 一种基于特征提取的智能机柜人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116824659A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111177469A (zh) * | 2019-12-20 | 2020-05-19 | 国久大数据有限公司 | 人脸检索方法及人脸检索装置 |
WO2021155713A1 (zh) * | 2020-09-08 | 2021-08-12 | 平安科技(深圳)有限公司 | 基于权重嫁接的模型融合的人脸识别方法及相关设备 |
-
2023
- 2023-05-08 CN CN202310508532.5A patent/CN116824659A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111177469A (zh) * | 2019-12-20 | 2020-05-19 | 国久大数据有限公司 | 人脸检索方法及人脸检索装置 |
WO2021155713A1 (zh) * | 2020-09-08 | 2021-08-12 | 平安科技(深圳)有限公司 | 基于权重嫁接的模型融合的人脸识别方法及相关设备 |
Non-Patent Citations (1)
Title |
---|
徐镇: "基于LBP和CNN的人脸识别算法研究", 《中国优秀硕士 学位论文全文数据库信息科技辑》, pages 152 - 153 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108460356B (zh) | 一种基于监控系统的人脸图像自动处理系统 | |
CN111444881A (zh) | 伪造人脸视频检测方法和装置 | |
CN109389074B (zh) | 一种基于人脸特征点提取的表情识别方法 | |
CN109409297B (zh) | 一种基于双通道卷积神经网络的身份识别方法 | |
KR102138657B1 (ko) | 계층적 협업 표현 기반 분류를 통한 강인한 얼굴인식 장치 및 그 방법 | |
CN111639544A (zh) | 基于多分支跨连接卷积神经网络的表情识别方法 | |
CN112418041B (zh) | 一种基于人脸正面化的多姿态人脸识别方法 | |
CN112070058A (zh) | 人脸面部复合情感表情识别方法及系统 | |
CN112464730B (zh) | 一种基于域无关前景特征学习的行人再识别方法 | |
CN112232184B (zh) | 一种基于深度学习和空间转换网络的多角度人脸识别方法 | |
CN111339930A (zh) | 一种联合口罩属性损失函数的人脸识别方法 | |
CN111046732A (zh) | 一种基于多粒度语义解析的行人重识别方法及存储介质 | |
CN110163111A (zh) | 基于人脸识别的叫号方法、装置、电子设备及存储介质 | |
Yasir et al. | Two-handed hand gesture recognition for Bangla sign language using LDA and ANN | |
CN113205002B (zh) | 非受限视频监控的低清人脸识别方法、装置、设备及介质 | |
CN112016592B (zh) | 基于交叉领域类别感知的领域适应语义分割方法及装置 | |
CN110348395B (zh) | 一种基于时空关系的骨架行为识别方法 | |
CN109815887B (zh) | 一种基于多智能体协作的复杂光照下人脸图像的分类方法 | |
CN114187644A (zh) | 一种基于支持向量机的口罩人脸活体检测方法 | |
CN109886320A (zh) | 一种人体股骨x光片智能识读方法及系统 | |
CN117523626A (zh) | 伪rgb-d人脸识别法 | |
CN114998966A (zh) | 基于特征融合的人脸表情识别方法 | |
CN116824659A (zh) | 一种基于特征提取的智能机柜人脸识别方法 | |
CN111597896B (zh) | 异常人脸的识别方法、识别装置、识别设备和存储介质 | |
CN113688715A (zh) | 面部表情识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |