CN105913025A - 一种基于多特征融合的深度学习人脸识别方法 - Google Patents
一种基于多特征融合的深度学习人脸识别方法 Download PDFInfo
- Publication number
- CN105913025A CN105913025A CN201610225164.3A CN201610225164A CN105913025A CN 105913025 A CN105913025 A CN 105913025A CN 201610225164 A CN201610225164 A CN 201610225164A CN 105913025 A CN105913025 A CN 105913025A
- Authority
- CN
- China
- Prior art keywords
- theta
- sigma
- function
- gabor
- rsqb
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于多特征融合的深度学习人脸识别方法,首先对待测试的orl人脸库进行二维gabor变换(2D gabor),提取出具有gabor特征的人脸库;由于图片的尺寸为:92×112,此处尺寸比较大,采用双线性插值的方法,将图像降为32×32的;然后将原始的orl人脸库与gabor特征的人脸库进行融合;最后用深度学习里面的栈式自编码的方式进行编码,并用softmax回归的方式求出权重参数,预测出识别准确率。本发明融合了多特征后,前提是该特征单独用此算法测试准确率不得低于80%,准确率会提高,而且算法会更加稳定,即随机初始化后,识别准确率基本保持不变。
Description
技术领域
本发明属于图像识别和深度学习技术领域,涉及一种学习人脸识别方法,特别是涉及一种基于多特征融合的深度学习人脸识别方法。
背景技术
人脸识别是基于人的脸部特征信息进行身份认证的一种生物识别技术。通过摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行匹配与识别。
人脸识别的应用领域很广泛,尤其是在安防反恐、金融支付、门禁考勤、身份识别等众多领域起着非常重要的作用,它所涉及的领域知识有生物医学、模式识别、图像处理、机器学习等。
人脸识别算法主要有:
①模板匹配法:主要利用了人脸的纹理和灰度特征,采用最近邻分类器,将待识别的图像与数据集中的所有模板进行匹配,进而找出最相似的模板。该方法主要存在的问题是,如果数据集足够大,那么进行匹配的时候,时间消耗很大,而且准确率会有所降低。
②主成分分析法(PCA):简而言之,就是将原始图像库的图像用一个低维的特征表示出来,该特征一般要求能够代表整张图片的90%以上,可以很大程度上减少计算量。然而该算法对外界环境较敏感,而且在识别过程中,初始特征量个数难以事先确定。
③支持向量机(SVM):支持向量机是一种能力很强的分类器,一般情况下,采用此分类器的算法准确率较高。当人脸样本数量较大时,该算法的时间复杂度和空间复杂度都较高。
④线性判别式分析(LDA):其基本思想是将高维的模式样本投影到最佳判别矢量空间,以达到抽取分类信息和压缩特征空间维数的效果,投影后保证模式样本在新的子空间有最大的类间距离和最小的类内距离。过分强调类间距较大,忽视了类间距较小的特征,最终会造成类间距较小的类别大量的重叠,导致最终的识别准确率不高。
发明内容
为了解决上述技术问题,本发明公开了一种基于多特征融合的深度学习人脸识别方法。
本发明所采用的技术方案是:一种基于多特征融合的深度学习人脸识别方法,其特征在于,包括以下步骤:
步骤1:初始化权重衰减参数λ、权重稀疏惩罚参数β、权重参数θ、稀疏系数p、隐藏层L1、隐藏层L2和分类数k;
步骤2:原始图像特征提取;
步骤3:分别将图像像素矩阵进行双线性插值变成M×M大小,并利用高斯金字塔将图像像素降低N倍,变成大小;
步骤4:将每个对应的2张人脸串接在一起,组成一个大的人脸矩阵,并将该矩阵变成一个L*1的向量,其中
步骤5:训练第一个隐藏层的稀疏编码;
步骤6:训练第二个隐藏层的稀疏编码;
步骤7:训练softmax分类器;
步骤8:利用栈式自编码算法构建一个包含两个隐藏层和一个最终softmax分类器层的栈式自编码网络;
步骤9:微调;
步骤10:检验栈式自编码是否成功;
若是,则通过微调求出来的权重系统θ,对未知样本进行预测,并计算出准确率,流程结束;
若否,则直接结束流程。
作为优选,初始化参数λ=3e-3、β=3,随机初始化权重系统θ,初始化稀疏系数p=0.3、隐藏层L1=200、隐藏层L2=200和分类数k=40。
作为优选,步骤2中所述图像特征提取,包括对原始的ORL人脸库进行Gabor特征提取和对原始的ORL人脸库进行LBP特征提取;
所述对原始的ORL人脸库进行Gabor特征提取,是利用2D Gabor基本函数分别对原始的ORL人脸库进行特征提取,并组成一个Gabor的人脸库;
所述2D Gabor基本函数定义为:
h(x*,y*,σx,σy)=g(x',y')exp[j2π(u0x*+v0y*)]
其中:
其中:u0表示在x*方向的频率,v0表示在y*方向的频率,w为正弦函数的方向角,和分别为高斯包络在x*和y*方向上的标准差,即高斯分布,这两个参数决定了高斯包络的扩展空间,假设则把以上的2D Gabor基本函数写成如下的形式:
其中,为正弦函数的空间频率,σ为空间常数;
所述对原始的ORL人脸库进行LBP特征提取,是利用LBP基本函数分别对原始的ORL人脸库进行特征提取,并组成一个LBP的人脸库;
LBP基本函数定义为:
当某个局部二进制模式所对应的循环二进制从0到1或从1到0最多有两次跳变时这个二进制序列首尾相连,该局部二进制模式所对应的二进制就称为一个等价模式类;检验某种模式是否属于等价模式的方法是将其和其移动一位后的二进制模式按位相减的绝对值求和,定义如下:
其中:
gc:表示的是局部区域的中心点的灰度值;gp(p=0,1,....,P):表示对应于中心点周围等距分布的P个点;若某种模式计算得到的U(GP)小于或等于2,则将其归于等价模式。
作为优选,步骤3中M=128,N=32。
作为优选,步骤4中Z=200。
作为优选,步骤7中所述训练softmax分类器,其具体实现包括以下子步骤:
步骤7.1:初始化参数λ=1e-4、分类数k=40、随机初始化权重系统θ;
步骤7.2:判断梯度检验是否成功;
若是,则继续执行下述步骤7.3;
若否,则结束流程;
步骤7.3:加载人脸数据,并标签;
步骤7.4:计算损失函数;
将已经有m个标记了的训练样本作为训练集,特征向量x的维度为n+1,即x(i)∈Rn +1,标记y(i)∈{1,2,…k},此处x(i)特征向量即为步骤4中L*1的向量,y(i)表示的是x(i)所对应人脸的序号;最终训练集组成的集合为:{(x(1),y(1)),(x(2),y(2)),…,(x(m),y(m))};
对于logistic回归,假设函数(hypothesisfunction)如下:
其中,θ为权重参数;则最小化代价函数:
在softmax中的假设函数(hypothesisfunction)如下:
其中权重参数θ不再是列向量,而是一个矩阵,矩阵的每一行可以看做是一个类别所对应分类器的参数,总共有k行;
矩阵能写成下面的形式:
此时,系统损失函数的方程为:
其中,1{·}是一个指示性函数,即当大括号中的值为真时,该函数的结果就为1,否则其结果就为0;
Softmaxregression中损失函数的偏导函数如下所示:
其中公式中的是一个向量,表示的是针对第i个类别而求得的;表示的是损失函数对第j个类别的第L个参数的偏导;
加入规则项后的损失函数表达式如下:
则偏导函数表达式如下所示:
步骤7.5:利用L-BFGS算法求得的θ,该矩阵大小为k*(n+1),k为分类的类别数;
步骤7.6:采用softmax分类器预测结果并计算出分类的准确率。
作为优选,步骤8中所述栈式自编码神经网络是一个由多层稀疏自编码器组成的神经网络,其前一层自编码器的输出作为其后一层自编码器的输入;其中输入的就是前述步骤中提取的信息经过2次高斯金字塔缩小4倍后的图像,然后reshape成一维的向量;所述前述步骤中提取的信息包括原始图像、Gabor特征、LBP特征、原始图像&Gabor特征、原始图像&LBP特征、Gabor特征&LBP特征、原始图像&Gabor特征&LBP特征。
作为优选,步骤9中所述微调,是对反向传播算法进行微调,其具体实现包括以下子步骤:
步骤9.1:对L2,L3,…Lnl层使用前向传播中的公式计算各层的激活值;其中nl表示的是网络层数;
步骤9.2:对输出层nl,令:
其中:anl:表示的是第nl层的激活值,即输出值;z(nl):表示的是第nl层输入加权和,包括偏置单元;即选用的是sigmoid函数作为激活值;
当使用softmax分类器时,softmax满足:其中I为输入数据对应的标签,P为条件概率向量;
步骤9.3:对l=nl-x,nl-2,nl-3…,2,令δ(l)=((W(l))Tδ(l+1))·f'(z(l));
其中:f'(z):表示的是激活值函数的导数;
步骤9.4:计算所需要的偏导数;
损失函数J(W,b;x,y)对权重W(l)的偏导:
损失函数J(W,b;x,y)对偏置项b(l)的偏导:
步骤9.5:更新权重参数;
其中:α:学习因子。
本发明的优点:
(1)多特征融合技术能够比单一的准确率有所提高,最明显的就是原始orl库+Gabor特征后的库,融合在一起后,由单个准确率为91.5%和88%提高到了95%。提高了3.5%的准确率;
(2)融合了多特征的算法比单一的特征对复杂的场景更具有适应性;
(3)通过该发明算法,求出来的权重参数,只要有未知样本,只需要通过矩阵相乘的运算,然后求出每一列对应的最大值的序号,即为识别的人脸的序号,这很大程度上减少了算法的运算。当训练样本足够大时,可运用于实际的实时人脸识别中。
附图说明
图1:本发明实施例的流程图;
图2:本发明实施例的Softmax算法流程;
图3:本发明实施例的栈式自编码算法流程图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1,本发明提供的一种基于多特征融合的深度学习人脸识别方法,包括以下步骤:
步骤1:初始化权重衰减参数λ=3e-3、权重稀疏惩罚参数β=3,随机初始化权重参数θ,初始化稀疏系数p=0.3、隐藏层L1=200、隐藏层L2=200和分类数k=40。
步骤2:图像特征提取,包括对原始的ORL人脸库进行Gabor特征提取和对原始的ORL人脸库进行LBP特征提;
【第一个特征】原始的ORL人脸库,这个库当然是最全面的库,没有进行任何特征提取,从而保证了原始图像的完好特征。
【第二个特征】Gabor小波与人类的视觉刺激响应很相似。由于也对于图像的边缘敏感,提供了良好的方向特性和尺度特性,而且对于光照变化不敏感,又能提供对光照变化良好的适应性。所以对原始的ORL人脸库进行Gabor特征提取。
Gabor特征提取:
1946年,Dennis Gabor对傅立叶变换进行改进,提出了Gabor变换,该变换属于“窗口”傅立叶变换,Gabor函数可以在频域不同尺度、不同方向上提取相关的特征。而且经研究Gabor函数与人眼的生物作用相仿,是一种很好的特征提取算法,并取得了较好的效果。本发明主要采用Gabor变换来进行人脸识别。
2D Gabor基本函数定义为:
h(x,y,σx,σy)=g(x',y')exp[j2π(u0x+v0y)];
其中:u0表示在x*方向的频率,v0表示在y*方向的频率,w为正弦函数的方向角,和分别为高斯包络在x*和y*方向上的标准差,即高斯分布,这两个参数决定了高斯包络的扩展空间,假设则把以上的2D Gabor基本函数写成如下的形式:
其中,为正弦函数的空间频率,θ为正弦函数的方向角,σ为空间常数。
利用2D Gabor小波分别对原始的ORL人脸库进行特征提取,并组成一个Gabor的人脸库。
【第三个特征】由于LBP主要用于纹理特征提取,它具有旋转不变性和灰度不变性等显著的优点。所以对原始的ORL人脸库进行LBP特征提取。
LBP特征提取的简介:
Ojala等人通过研究发现,提出了采用一种等价模式对LBP算子进行降维。等价模式(uniformpattern)的LBP算子定义:当某个局部二进制模式所对应的循环二进制从0到1或从1到0最多有两次跳变时(这个二进制序列首尾相连),该局部二进制模式所对应的二进制就称为一个等价模式类。比如:10100000的变化次数为3次所以不是一个uniformpattern。为什么要提出这么个uniformLBP呢?因为研究者发现他们计算出来的大部分值都在这58种之中,可达到90%以上,这样直方图从原来的256维变成59维,起到了降维的作用。检验某种模式是否属于等价模式的简单方法是将其和其移动一位后的二进制模式按位相减的绝对值求和,定义如下:
其中:
若某种模式计算得到的U(GP)小于或等于2,则将其归于等价模式。
利用LBP分别对原始的ORL人脸库进行特征提取,并组成一个LBP的人脸库。
步骤3:分别将图像像素矩阵进行双线性插值变成128*128大小的矩阵,并利用高斯金字塔将图像像素降低4倍,变成大小32*32大小的像素矩阵;
步骤4:将每个对应的2张人脸串接在一起,组成一个大的人脸矩阵,并将该矩阵变成一个2048*1的向量,其中2048=32*32*2,乘以2是因为2张人脸;
步骤5:训练第一个隐藏层的稀疏编码;
步骤6:训练第二个隐藏层的稀疏编码;
步骤7:训练softmax分类器;
请见图2,本实施例的训练softmax分类器,其具体实现包括以下子步骤:
步骤7.1:初始化参数λ=1e-4、分类数k=40、随机初始化权重系统θ;
步骤7.2:判断梯度检验是否成功;
若是,则继续执行下述步骤7.3;
若否,则结束流程;
步骤7.3:加载人脸数据,并标签;
步骤7.4:计算损失函数;
将已经有m个标记了的训练样本作为训练集,特征向量x的维度为n+1,即x(i)∈Rn +1,标记y(i)∈{1,2,…k},此处x(i)特征向量即为步骤4中L*1的向量,y(i)表示的是x(i)所对应人脸的序号;最终训练集组成的集合为:{(x(1),y(1)),(x(2),y(2)),…,(x(m),y(m))};(本实施例对符号的约定如下:特征向量x的维度为n+1,其中x0=1对应截距项)
对于logistic回归,假设函数(hypothesisfunction)如下:
其中,θ为权重参数;
则最小化代价函数:
在softmax中的假设函数(hypothesisfunction)如下:
其中的参数θ不再是列向量,而是一个矩阵,矩阵的每一行可以看做是一个类别所对应分类器的参数,总共有k行;
矩阵能写成下面的形式:
此时,系统损失函数的方程为:
其中,1{·}是一个指示性函数,即当大括号中的值为真时,该函数的结果就为1,否则其结果就为0;
Softmaxregression中损失函数的偏导函数如下所示:
注意公式中的是一个向量,表示的是针对第i个类别而求得的。所以上面的公式还只是一个类别的偏导公式,我们需要求出所有类别的偏导公式。表示的是损失函数对第j个类别的第L个参数的偏导。
Softmax中对参数的最优化求解不只一个,每当求得一个优化参数时,如果将这个参数的每一项都减掉同一个数,其得到的损失函数值也是一样的。这说明这个参数不是唯一解。用数学公式证明过程如下所示:
hession矩阵如果没有加入规则项,就有可能不是可逆,因此加入规则项后的损失函数表达式如下:
则偏导函数表达式如下所示:
步骤7.5:利用L-BFGS算法求得的θ,该矩阵大小为k*(n+1),k为分类的类别数;
步骤7.6:采用softmax分类器预测结果并计算出分类的准确率。
步骤8:利用栈式自编码算法构建一个包含两个隐藏层和一个最终softmax分类器层的栈式自编码网络;
请见图3,利用栈式自编码算法中的栈式自编码神经网络是一个由多层稀疏自编码器组成的神经网络,其前一层自编码器的输出作为其后一层自编码器的输入。依照这种方法,最终构建一个包含两个隐藏层和一个最终softmax分类器层的栈式自编码网络;
其中输入的就是我们在前面提取的(原始图像,Gabor特征,LBP特征,原始图像+Gabor,原始图像+LBP,Gabor+LBP,原始图像+Gabor+LBP)经过2次高斯金字塔缩小4被后的图像,然后reshape成一维的向量。
步骤9:微调;
微调可以大幅提升一个栈式自编码神经网络的性能,本实施例的微调,是对反向传播算法进行微调,其具体实现包括以下子步骤:
步骤9.1:对L2,L3,…Lnl层使用前向传播中的公式计算各层的激活值;其中nl表示的是网络层数;
步骤9.2:对输出层nl,令:
其中:anl:表示的是第nl层的激活值,即输出值;z(nl):表示的是第nl层输入加权和,包括偏置单元;即选用的是sigmoid函数作为激活值;
当使用softmax分类器时,softmax满足:其中I为输入数据对应的标签,P为条件概率向量;
步骤9.3:对l=nl-1,nl-2,nl-3…,2,令δ(l)=((W(l))Tδ(l+1))·f'(z(l));
其中:f'(z):表示的是激活值函数的导数;
步骤9.4:计算所需要的偏导数;
损失函数J(W,b;x,y)对权重W(l)的偏导:
损失函数J(W,b;x,y)对偏置项b(l)的偏导:
步骤9.5:更新权重参数;
其中:α:学习因子。
步骤10:检验栈式自编码是否成功;
若是,则通过微调求出来的权重系统θ,对未知样本进行预测,并计算出准确率,流程结束;
若否,则直接结束流程。
本实施例通过实验结果分析来进一步阐述本发明的优点,
本实施例的实验平台:Windows7(64位),Matlab2014a;
本实施例的实验结果:
采用单一特征识别采用多特征融合的方法
由以上的实验结果可知道,如何进行特征选择是很重要的,由于LBP单独测试的准确率很低,即对该场景的适应不好,所以在此实验数据中不必融合LBP,只采用原始ORL特征+Gabor的特征进行融合。一般来说,只要融合的那个特征不很差(通过该算法独立测试的准确率不低于85%),那么对该算法均有贡献,即可以提高准确率。
本发明主要在两方面有较大的提高:
第一:计算时间上,虽然本发明在计算出权值时用的是栈式自编码网络求解的,计算量十分大,运行需要一段时间,但最终可以计算出每个输入特征的权重出来,但是这部分运行时间时可以不必计算到识别中去的,只需要计算一次即可。在识别的时候,只需要利用这些权重,然后乘以输入的特征向量,很容易就能识别出未知样本。时间上,显然,该方法只需要一个简单的矩阵相乘就能识别出来,时间上会快很多。
第二:准确率上,即便是用同样的数据库,通过PCA、SVM、Gabor、LBP、LDA等计算出来的识别率均达不到95%。该方法融合了原始人脸库和Gabor特征后,可以达到95%。如果样本足够大,那么计算出的权重将更具有代表性,准确率会更高。也就是说,在大数据时代,该算法更具有优势。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
Claims (8)
1.一种基于多特征融合的深度学习人脸识别方法,其特征在于,包括以下步骤:
步骤1:初始化权重衰减参数λ、权重稀疏惩罚参数β、权重参数θ、稀疏系数p、隐藏层L1、隐藏层L2和分类数k;
步骤2:原始图像特征提取;
步骤3:分别将图像像素矩阵进行双线性插值变成M×M大小,并利用高斯金字塔将图像像素降低N倍,变成大小;
步骤4:将每个对应的2张人脸串接在一起,组成一个大的人脸矩阵,并将该矩阵变成一个L*1的向量,其中
步骤5:训练第一个隐藏层的稀疏编码;
步骤6:训练第二个隐藏层的稀疏编码;
步骤7:训练softmax分类器;
步骤8:利用栈式自编码算法构建一个包含两个隐藏层和一个最终softmax分类器层的栈式自编码网络;
步骤9:微调;
步骤10:检验栈式自编码是否成功;
若是,则通过微调求出来的权重系统θ,对未知样本进行预测,并计算出准确率,流程结束;
若否,则直接结束流程。
2.根据权利要求1中所述的基于多特征融合的深度学习人脸识别方法,其特征在于:初始化参数λ=3e-3、β=3,随机初始化权重系统θ,初始化稀疏系数p=0.3、隐藏层L1=200、隐藏层L2=200和分类数k=40。
3.根据权利要求1中所述的基于多特征融合的深度学习人脸识别方法,其特征在于:步骤2中所述图像特征提取,包括对原始的ORL人脸库进行Gabor特征提取和对原始的ORL人脸库进行LBP特征提取;
所述对原始的ORL人脸库进行Gabor特征提取,是利用2D Gabor基本函数分别对原始的ORL人脸库进行特征提取,并组成一个Gabor的人脸库;
所述2D Gabor基本函数定义为:
h(x*,y*,σx,σy)=g(x',y')exp[j2π(u0x*+v0y*)]
其中:
其中:u0表示在x*方向的频率,v0表示在y*方向的频率,w为正弦函数的方向角,和分别为高斯包络在x*和y*方向上的标准差,即高斯分布,这两个参数决定了高斯包络的扩展空间,假设则把以上的2D Gabor基本函数写成如下的形式:
其中,为正弦函数的空间频率,σ为空间常数;
所述对原始的ORL人脸库进行LBP特征提取,是利用LBP基本函数分别对原始的ORL人脸库进行特征提取,并组成一个LBP的人脸库;
LBP基本函数定义为:
当某个局部二进制模式所对应的循环二进制从0到1或从1到0最多有两次跳变时这个二进制序列首尾相连,该局部二进制模式所对应的二进制就称为一个等价模式类;检验某种模式是否属于等价模式的方法是将其和其移动一位后的二进制模式按位相减的绝对值求和,定义如下:
其中:
gc:表示的是局部区域的中心点的灰度值;gp(p=0,1,....,P):表示对应于中心点周围等距分布的P个点;若某种模式计算得到的U(GP)小于或等于2,则将其归于等价模式。
4.根据权利要求1中所述的基于多特征融合的深度学习人脸识别方法,其特征在于:步骤3中M=128,N=32。
5.根据权利要求1中所述的基于多特征融合的深度学习人脸识别方法,其特征在于:步骤4中Z=200。
6.根据权利要求1中所述的基于多特征融合的深度学习人脸识别方法,其特征在于,步骤7中所述训练softmax分类器,其具体实现包括以下子步骤:
步骤7.1:初始化参数λ=1e-4、分类数k=40、随机初始化权重系统θ;
步骤7.2:判断梯度检验是否成功;
若是,则继续执行下述步骤7.3;
若否,则结束流程;
步骤7.3:加载人脸数据,并标签;
步骤7.4:计算损失函数;
将已经有m个标记了的训练样本作为训练集,特征向量x的维度为n+1,即x(i)∈Rn+1,标记y(i)∈{1,2,…k},此处x(i)特征向量即为步骤4中L*1的向量,y(i)表示的是x(i)所对应人脸的序号;最终训练集组成的集合为:{(x(1),y(1)),(x(2),y(2)),…,(x(m),y(m))};
对于logistic回归,假设函数(hypothesisfunction)如下:
其中,θ为权重参数;则最小化代价函数:
在softmax中的假设函数(hypothesisfunction)如下:
其中权重参数θ不再是列向量,而是一个矩阵,矩阵的每一行可以看做是一个类别所对应分类器的参数,总共有k行;
矩阵能写成下面的形式:
此时,系统损失函数的方程为:
其中,1{·}是一个指示性函数,即当大括号中的值为真时,该函数的结果就为1,否则其结果就为0;
Softmaxregression中损失函数的偏导函数如下所示:
其中公式中的是一个向量,表示的是针对第i个类别而求得的;
表示的是损失函数对第j个类别的第L个参数的偏导;
加入规则项后的损失函数表达式如下:
则偏导函数表达式如下所示:
步骤7.5:利用L-BFGS算法求得的θ,该矩阵大小为k*(n+1),k为分类的类别数;
步骤7.6:采用softmax分类器预测结果并计算出分类的准确率。
7.根据权利要求1中所述的基于多特征融合的深度学习人脸识别方法,其特征在于:步骤8中所述栈式自编码神经网络是一个由多层稀疏自编码器组成的神经网络,其前一层自编码器的输出作为其后一层自编码器的输入;其中输入的就是前述步骤中提取的信息经过2次高斯金字塔缩小4倍后的图像,然后reshape成一维的向量;所述前述步骤中提取的信息包括原始图像、Gabor特征、LBP特征、原始图像&Gabor特征、原始图像&LBP特征、Gabor特征&LBP特征、原始图像&Gabor特征&LBP特征。
8.根据权利要求1中所述的基于多特征融合的深度学习人脸识别方法,其特征在于:步骤9中所述微调,是对反向传播算法进行微调,其具体实现包括以下子步骤:
步骤9.1:对L2,L3,…Lnl层使用前向传播中的公式计算各层的激活值;其中nl表示的是网络层数;
步骤9.2:对输出层nl,令:
其中:anl:表示的是第nl层的激活值,即输出值;z(nl):表示的是第nl层输入加权和,包括偏置单元;即选用的是sigmoid函数作为激活值;
当使用softmax分类器时,softmax满足:其中I为输入数据对应的标签,P为条件概率向量;
步骤9.3:对l=nl-1,nl-2,nl-3…,2,令δ(l)=((W(l))Tδ(l+1))·f'(z(l));
其中:f'(z):表示的是激活值函数的导数;
步骤9.4:计算所需要的偏导数;
损失函数J(W,b;x,y)对权重W(l)的偏导:
损失函数J(W,b;x,y)对偏置项b(l)的偏导:
步骤9.5:更新权重参数;
其中:α为学习因子。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610225164.3A CN105913025B (zh) | 2016-04-12 | 2016-04-12 | 一种基于多特征融合的深度学习人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610225164.3A CN105913025B (zh) | 2016-04-12 | 2016-04-12 | 一种基于多特征融合的深度学习人脸识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105913025A true CN105913025A (zh) | 2016-08-31 |
CN105913025B CN105913025B (zh) | 2019-02-26 |
Family
ID=56746003
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610225164.3A Expired - Fee Related CN105913025B (zh) | 2016-04-12 | 2016-04-12 | 一种基于多特征融合的深度学习人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105913025B (zh) |
Cited By (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106372624A (zh) * | 2016-10-15 | 2017-02-01 | 杭州艾米机器人有限公司 | 人脸识别方法及系统 |
CN106503654A (zh) * | 2016-10-24 | 2017-03-15 | 中国地质大学(武汉) | 一种基于深度稀疏自编码网络的人脸情感识别方法 |
CN106503669A (zh) * | 2016-11-02 | 2017-03-15 | 重庆中科云丛科技有限公司 | 一种基于多任务深度学习网络的训练、识别方法及系统 |
CN106778687A (zh) * | 2017-01-16 | 2017-05-31 | 大连理工大学 | 基于局部评估和全局优化的注视点检测方法 |
CN106846301A (zh) * | 2016-12-29 | 2017-06-13 | 北京理工大学 | 视网膜图像分类方法及装置 |
CN106874952A (zh) * | 2017-02-16 | 2017-06-20 | 中国人民解放军国防科学技术大学 | 基于栈式自编码器的特征融合方法 |
CN106909905A (zh) * | 2017-03-02 | 2017-06-30 | 中科视拓(北京)科技有限公司 | 一种基于深度学习的多模态人脸识别方法 |
CN107103308A (zh) * | 2017-05-24 | 2017-08-29 | 武汉大学 | 一种基于由粗到细深度尺度学习的行人重识别方法 |
CN107194364A (zh) * | 2017-06-02 | 2017-09-22 | 重庆邮电大学 | 一种基于分治策略的Huffman‑LBP多姿态人脸识别方法 |
CN107392183A (zh) * | 2017-08-22 | 2017-11-24 | 深圳Tcl新技术有限公司 | 人脸分类识别方法、装置及可读存储介质 |
CN107578007A (zh) * | 2017-09-01 | 2018-01-12 | 杭州电子科技大学 | 一种基于多特征融合的深度学习人脸识别方法 |
CN107633255A (zh) * | 2017-08-11 | 2018-01-26 | 天津大学 | 一种深度学习模式下的岩石岩性自动识别分类方法 |
CN108154181A (zh) * | 2017-12-25 | 2018-06-12 | 深圳大学 | 温度系数的确定方法及装置 |
CN108171223A (zh) * | 2018-02-27 | 2018-06-15 | 北京中晟信达科技有限公司 | 一种基于多模型多通道的人脸识别方法及系统 |
CN108171176A (zh) * | 2017-12-29 | 2018-06-15 | 中车工业研究院有限公司 | 一种基于深度学习的地铁司机情绪辨识方法及装置 |
CN108229503A (zh) * | 2018-01-04 | 2018-06-29 | 浙江大学 | 一种针对服装照片的特征提取方法 |
CN108268854A (zh) * | 2018-02-02 | 2018-07-10 | 上海有我科技有限公司 | 一种基于特征识别的教学辅助大数据智能分析方法 |
CN108764072A (zh) * | 2018-05-14 | 2018-11-06 | 浙江工业大学 | 一种基于多尺度融合的血细胞亚型图像分类方法 |
CN108805889A (zh) * | 2018-05-07 | 2018-11-13 | 中国科学院自动化研究所 | 边缘引导的精细化显著性物体分割方法与系统、设备 |
CN108932950A (zh) * | 2018-05-18 | 2018-12-04 | 华南师范大学 | 一种基于标签扩增与多频谱图融合的声音场景识别方法 |
CN109325972A (zh) * | 2018-07-25 | 2019-02-12 | 深圳市商汤科技有限公司 | 激光雷达稀疏深度图的处理方法、装置、设备及介质 |
CN109635140A (zh) * | 2018-12-14 | 2019-04-16 | 常熟理工学院 | 一种基于深度学习和密度峰值聚类的图像检索方法 |
CN109740536A (zh) * | 2018-06-12 | 2019-05-10 | 北京理工大学 | 一种基于特征融合神经网络的亲属识别方法 |
CN109886160A (zh) * | 2019-01-30 | 2019-06-14 | 浙江工商大学 | 一种非限定条件下的人脸识别方法 |
CN109902736A (zh) * | 2019-02-25 | 2019-06-18 | 东北大学 | 一种基于自动编码器构建特征表示的肺结节图像分类方法 |
CN110399839A (zh) * | 2019-07-26 | 2019-11-01 | 北京达佳互联信息技术有限公司 | 人脸识别方法、装置、设备及存储介质 |
CN110956981A (zh) * | 2019-12-06 | 2020-04-03 | 湖北文理学院 | 语音情感识别方法、装置、设备及存储介质 |
CN111582223A (zh) * | 2020-05-19 | 2020-08-25 | 华普通用技术研究(广州)有限公司 | 一种三维人脸识别方法 |
CN112052681A (zh) * | 2020-08-20 | 2020-12-08 | 中国建设银行股份有限公司 | 信息抽取模型训练方法、信息抽取方法、装置及电子设备 |
CN112115443A (zh) * | 2020-11-19 | 2020-12-22 | 索信达(北京)数据技术有限公司 | 一种终端用户鉴权方法及系统 |
CN113872024A (zh) * | 2021-12-01 | 2021-12-31 | 中国工程物理研究院电子工程研究所 | 面向光纤激光系统多源物理监测量的智能故障诊断方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104008375A (zh) * | 2014-06-04 | 2014-08-27 | 北京工业大学 | 基于特征融合的集成人脸识别方法 |
CN105069400A (zh) * | 2015-07-16 | 2015-11-18 | 北京工业大学 | 基于栈式稀疏自编码的人脸图像性别识别系统 |
-
2016
- 2016-04-12 CN CN201610225164.3A patent/CN105913025B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104008375A (zh) * | 2014-06-04 | 2014-08-27 | 北京工业大学 | 基于特征融合的集成人脸识别方法 |
CN105069400A (zh) * | 2015-07-16 | 2015-11-18 | 北京工业大学 | 基于栈式稀疏自编码的人脸图像性别识别系统 |
Non-Patent Citations (1)
Title |
---|
张雯 等: "基于局部二值模式和深度学习的人脸识别", 《计算机应用》 * |
Cited By (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106372624A (zh) * | 2016-10-15 | 2017-02-01 | 杭州艾米机器人有限公司 | 人脸识别方法及系统 |
CN106503654A (zh) * | 2016-10-24 | 2017-03-15 | 中国地质大学(武汉) | 一种基于深度稀疏自编码网络的人脸情感识别方法 |
CN106503669A (zh) * | 2016-11-02 | 2017-03-15 | 重庆中科云丛科技有限公司 | 一种基于多任务深度学习网络的训练、识别方法及系统 |
CN106503669B (zh) * | 2016-11-02 | 2019-12-10 | 重庆中科云丛科技有限公司 | 一种基于多任务深度学习网络的训练、识别方法及系统 |
CN106846301A (zh) * | 2016-12-29 | 2017-06-13 | 北京理工大学 | 视网膜图像分类方法及装置 |
CN106778687A (zh) * | 2017-01-16 | 2017-05-31 | 大连理工大学 | 基于局部评估和全局优化的注视点检测方法 |
CN106778687B (zh) * | 2017-01-16 | 2019-12-17 | 大连理工大学 | 基于局部评估和全局优化的注视点检测方法 |
CN106874952A (zh) * | 2017-02-16 | 2017-06-20 | 中国人民解放军国防科学技术大学 | 基于栈式自编码器的特征融合方法 |
CN106874952B (zh) * | 2017-02-16 | 2019-09-13 | 中国人民解放军国防科学技术大学 | 基于栈式自编码器的特征融合方法 |
CN106909905A (zh) * | 2017-03-02 | 2017-06-30 | 中科视拓(北京)科技有限公司 | 一种基于深度学习的多模态人脸识别方法 |
CN106909905B (zh) * | 2017-03-02 | 2020-02-14 | 中科视拓(北京)科技有限公司 | 一种基于深度学习的多模态人脸识别方法 |
CN107103308A (zh) * | 2017-05-24 | 2017-08-29 | 武汉大学 | 一种基于由粗到细深度尺度学习的行人重识别方法 |
CN107194364B (zh) * | 2017-06-02 | 2020-08-04 | 重庆邮电大学 | 一种基于分治策略的Huffman-LBP多姿态人脸识别方法 |
CN107194364A (zh) * | 2017-06-02 | 2017-09-22 | 重庆邮电大学 | 一种基于分治策略的Huffman‑LBP多姿态人脸识别方法 |
CN107633255A (zh) * | 2017-08-11 | 2018-01-26 | 天津大学 | 一种深度学习模式下的岩石岩性自动识别分类方法 |
CN107633255B (zh) * | 2017-08-11 | 2021-05-25 | 天津大学 | 一种深度学习模式下的岩石岩性自动识别分类方法 |
CN107392183A (zh) * | 2017-08-22 | 2017-11-24 | 深圳Tcl新技术有限公司 | 人脸分类识别方法、装置及可读存储介质 |
CN107578007A (zh) * | 2017-09-01 | 2018-01-12 | 杭州电子科技大学 | 一种基于多特征融合的深度学习人脸识别方法 |
WO2019128056A1 (zh) * | 2017-12-25 | 2019-07-04 | 深圳大学 | 温度系数的确定方法及装置 |
CN108154181A (zh) * | 2017-12-25 | 2018-06-12 | 深圳大学 | 温度系数的确定方法及装置 |
CN108171176A (zh) * | 2017-12-29 | 2018-06-15 | 中车工业研究院有限公司 | 一种基于深度学习的地铁司机情绪辨识方法及装置 |
CN108171176B (zh) * | 2017-12-29 | 2020-04-24 | 中车工业研究院有限公司 | 一种基于深度学习的地铁司机情绪辨识方法及装置 |
CN108229503A (zh) * | 2018-01-04 | 2018-06-29 | 浙江大学 | 一种针对服装照片的特征提取方法 |
CN108268854B (zh) * | 2018-02-02 | 2022-06-10 | 上海有我科技有限公司 | 一种基于特征识别的教学辅助大数据智能分析方法 |
CN108268854A (zh) * | 2018-02-02 | 2018-07-10 | 上海有我科技有限公司 | 一种基于特征识别的教学辅助大数据智能分析方法 |
CN108171223A (zh) * | 2018-02-27 | 2018-06-15 | 北京中晟信达科技有限公司 | 一种基于多模型多通道的人脸识别方法及系统 |
CN108805889B (zh) * | 2018-05-07 | 2021-01-08 | 中国科学院自动化研究所 | 边缘引导的精细化显著性物体分割方法与系统、设备 |
CN108805889A (zh) * | 2018-05-07 | 2018-11-13 | 中国科学院自动化研究所 | 边缘引导的精细化显著性物体分割方法与系统、设备 |
CN108764072A (zh) * | 2018-05-14 | 2018-11-06 | 浙江工业大学 | 一种基于多尺度融合的血细胞亚型图像分类方法 |
CN108764072B (zh) * | 2018-05-14 | 2021-04-06 | 浙江工业大学 | 一种基于多尺度融合的血细胞亚型图像分类方法 |
CN108932950B (zh) * | 2018-05-18 | 2021-07-09 | 华南师范大学 | 一种基于标签扩增与多频谱图融合的声音场景识别方法 |
CN108932950A (zh) * | 2018-05-18 | 2018-12-04 | 华南师范大学 | 一种基于标签扩增与多频谱图融合的声音场景识别方法 |
CN109740536A (zh) * | 2018-06-12 | 2019-05-10 | 北京理工大学 | 一种基于特征融合神经网络的亲属识别方法 |
CN109325972B (zh) * | 2018-07-25 | 2020-10-27 | 深圳市商汤科技有限公司 | 激光雷达稀疏深度图的处理方法、装置、设备及介质 |
CN109325972A (zh) * | 2018-07-25 | 2019-02-12 | 深圳市商汤科技有限公司 | 激光雷达稀疏深度图的处理方法、装置、设备及介质 |
CN109635140A (zh) * | 2018-12-14 | 2019-04-16 | 常熟理工学院 | 一种基于深度学习和密度峰值聚类的图像检索方法 |
CN109886160A (zh) * | 2019-01-30 | 2019-06-14 | 浙江工商大学 | 一种非限定条件下的人脸识别方法 |
CN109886160B (zh) * | 2019-01-30 | 2021-03-09 | 浙江工商大学 | 一种非限定条件下的人脸识别方法 |
CN109902736A (zh) * | 2019-02-25 | 2019-06-18 | 东北大学 | 一种基于自动编码器构建特征表示的肺结节图像分类方法 |
CN110399839A (zh) * | 2019-07-26 | 2019-11-01 | 北京达佳互联信息技术有限公司 | 人脸识别方法、装置、设备及存储介质 |
CN110956981A (zh) * | 2019-12-06 | 2020-04-03 | 湖北文理学院 | 语音情感识别方法、装置、设备及存储介质 |
CN110956981B (zh) * | 2019-12-06 | 2022-04-26 | 湖北文理学院 | 语音情感识别方法、装置、设备及存储介质 |
CN111582223A (zh) * | 2020-05-19 | 2020-08-25 | 华普通用技术研究(广州)有限公司 | 一种三维人脸识别方法 |
CN112052681A (zh) * | 2020-08-20 | 2020-12-08 | 中国建设银行股份有限公司 | 信息抽取模型训练方法、信息抽取方法、装置及电子设备 |
CN112115443B (zh) * | 2020-11-19 | 2021-02-12 | 索信达(北京)数据技术有限公司 | 一种终端用户鉴权方法及系统 |
CN112115443A (zh) * | 2020-11-19 | 2020-12-22 | 索信达(北京)数据技术有限公司 | 一种终端用户鉴权方法及系统 |
CN113872024A (zh) * | 2021-12-01 | 2021-12-31 | 中国工程物理研究院电子工程研究所 | 面向光纤激光系统多源物理监测量的智能故障诊断方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105913025B (zh) | 2019-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105913025A (zh) | 一种基于多特征融合的深度学习人脸识别方法 | |
CN110348319B (zh) | 一种基于人脸深度信息和边缘图像融合的人脸防伪方法 | |
Garg et al. | Deep convolution neural network approach for defect inspection of textured surfaces | |
CN110717553A (zh) | 一种基于自衰减权重和多局部约束的交通违禁品识别方法 | |
CN107145836A (zh) | 基于栈式边界辨别自编码器的高光谱图像分类方法 | |
CN106529499A (zh) | 基于傅里叶描述子和步态能量图融合特征的步态识别方法 | |
CN105760900B (zh) | 基于近邻传播聚类和稀疏多核学习的高光谱图像分类方法 | |
CN107463920A (zh) | 一种消除局部遮挡物影响的人脸识别方法 | |
CN106023065A (zh) | 一种基于深度卷积神经网络的张量型高光谱图像光谱-空间降维方法 | |
Zhang et al. | A GANs-based deep learning framework for automatic subsurface object recognition from ground penetrating radar data | |
CN110826638A (zh) | 基于重复注意力网络的零样本图像分类模型及其方法 | |
CN105787510A (zh) | 基于深度学习实现地铁场景分类的系统及方法 | |
CN106096506A (zh) | 基于子类类间判别双字典的sar目标识别方法 | |
Aditya et al. | Batik classification using neural network with gray level co-occurence matrix and statistical color feature extraction | |
Nepovinnykh et al. | Identification of Saimaa ringed seal individuals using transfer learning | |
CN101609509B (zh) | 一种基于预分类器的图像物体检测方法及系统 | |
CN108154133A (zh) | 基于非对称联合学习的人脸画像-照片识别方法 | |
CN108492298A (zh) | 基于生成对抗网络的多光谱图像变化检测方法 | |
CN114511710A (zh) | 一种基于卷积神经网络的图像目标检测方法 | |
CN108985161B (zh) | 一种基于拉普拉斯正则化的低秩稀疏表征图像特征学习方法 | |
CN105809119A (zh) | 一种基于稀疏低秩结构多任务学习的行为识别方法 | |
CN109472733A (zh) | 基于卷积神经网络的图像隐写分析方法 | |
Tun et al. | Hyperspectral remote sensing images classification using fully convolutional neural network | |
CN109582960A (zh) | 基于结构化关联语义嵌入的零示例学习方法 | |
Haghighattalab et al. | Post-earthquake road damage assessment using region-based algorithms from high-resolution satellite images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190226 |
|
CF01 | Termination of patent right due to non-payment of annual fee |