CN106066992B - 基于自适应局部约束的判别字典学习的人脸识别方法及系统 - Google Patents
基于自适应局部约束的判别字典学习的人脸识别方法及系统 Download PDFInfo
- Publication number
- CN106066992B CN106066992B CN201610321262.7A CN201610321262A CN106066992B CN 106066992 B CN106066992 B CN 106066992B CN 201610321262 A CN201610321262 A CN 201610321262A CN 106066992 B CN106066992 B CN 106066992B
- Authority
- CN
- China
- Prior art keywords
- dictionary
- matrix
- code coefficient
- follows
- face
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明提出了一种基于自适应局部约束的判别字典学习算法以解决字典学习算法在人脸识别中存在的问题。本发明首先利用原子构造自适应的拉普拉斯图,使其能够保持字典的局部结构特征。然后,利用编码系数矩阵的行向量与字典的拉普拉斯图设计局部约束判别式项,使得字典具有更强的判别性能,进而设计基于自适应局部约束的判别字典学习的人脸识别系统模型,提高人脸识别的分类性能。本发明算法的顺利开展将丰富和发展基于约束的字典学习理论体系,为增强字典鉴别性能、提升人脸识别的能力起着重要的指导作用。
Description
技术领域
本发明涉及图像识别技术领域,尤其涉及一种判别字典学习算法及人脸识别系统。
背景技术
训练样本的局部特征对于提高基于字典学习的判别性能起到非常重要的作用。但人脸图像易受光照、姿态和遮挡等因素的影响,导致直接利用人脸图像计算的局部特征并不一定真实的反映人脸间的特征关系,降低基于字典学习的人脸识别系统的分类性能。
发明内容
本发明的目的在于提供一种基于自适应局部约束的判别字典学习算法来解决字典学习算法在人脸识别中存在的问题。
为达上述目的,本发明通过以下技术方案实现:
一种基于自适应局部约束的判别字典学习算法,包括以下步骤:
S1、利用原子构造字典的局部特征模型:利用字典中的原子构造图M:
其中,是第i个原子,K是原子个数,δ是参数,kNN(di)表示原子di的k近邻原子,M(i,j)是原子di和dj的权重,并反映它们间的相似性;
S2、利用拉普拉斯图来构造原子间的相似性特征,基于原子特征的拉普拉斯图L构造如下:
其中,M是字典D中原子的近邻图,T是利用近邻图M计算的对角矩阵,Mij是近邻图M中原子间的权重;
S3、利用编码系数矩阵的行向量和拉普拉斯图L保持字典的局部结构信息,则设计的自适应局部约束模型如下:
S4、为了学习一个判别性能强的字典,利用原子的局部特征约束项作为判别式约束项,构造目标函数如下:
s.t.||di||2=1,i=1,…,K
其中,Y是训练样本集合,D是学习得到的字典,X是编码系数,α和β是调整参数;
S5、目标函数求解:当编码系数矩阵X和拉普拉斯矩阵L固定,则基于局部约束的字典学习算法的目标函数可以转换为:
s.t.||di||2=1,i=1,…,K
最优的字典D为:D*=YXT(XXT+Λ)-1,其中λi是第i个等式约束||di||2=1的拉格朗日乘子;其对角元素Λii=λi;一旦获得最优的字典D*,根据步骤S1和S2更新拉普拉斯矩阵L;然后,计算编码系数矩阵:
其中,soft(.)为软阀值函数,▽X是关于变量X求导运算。
一种应用于人脸识别系统的基于自适应局部约束的判别字典学习方法,所述方法包括:
A.获得训练样本集合Y,设置参数α,β,γ,δ,k,及迭代次数φ;
B.针对训练样本中的第j类样本,利用K-SVD算法初始化特定类字典Dj和编码系数矩阵Xj;
C.获得初始化字典D0=[D1,…,DC]和初始化编码系数矩阵X0=[X1,…,XC],并利用D0计算初始化的拉普拉斯矩阵L0;
D.For i=1:φ
利用公式D*=YXT(XXT+δI)-1计算字典Di,其中,I是单位矩阵;
利用字典Di和公式L=T-M,T=diag(t1,…,tK),and计算拉普拉斯矩阵Li,其中,M是字典D中原子的近邻图,T是利用近邻图M计算的对角矩阵,Mij是近邻图M中原子间的权重;
利用公式计算编码系数矩阵Xi,其中,▽X是关于变量X的求导运算;
End
E.获得最优的编码系数X和字典D。
一种人脸识别方法,其特征在于,所述方法包括以下步骤:
步骤1,输入人脸训练样本集合Y,利用如权利要求3所述的基于自适应局部约束的判别字典学习方法,获得最优的编码系数X和字典D;
步骤2,利用编码系数矩阵X和训练样本的类标矩阵H计算分类参数W:
W=HXT(XXT+I)-1
其中,当hi中第j个元素为非零值时,表明训练样本yi来自于第j类;
步骤3,获取测试样本yt;
步骤4,对于测试样本yt,利用字典D对其稀疏表示如下:
s.t.||x||0≤T0
其中T0表示矢量x中的非零元素个数。利用OMP(Orthogonal Matching Pursuit)算法获得测试样本yt的最优表示系数x*;
步骤5,获得测试样本yt的类标j:
一种人脸识别系统,其特征在于,所述系统包括:
字典学习模块,用于根据输入人脸训练样本集合Y,利用如权利要求3所述的基于自适应局部约束的判别字典学习方法,获得最优的编码系数X和字典D;
分类参数计算模块,用于利用编码系数矩阵X和训练样本的类标矩阵H计算分类参数W:
W=HXT(XXT+I)-1
其中,当hi中第j个元素为非零值时,表明训练样本yi来自于第j类;
人脸图像获取模块,用于获取测试样本yt;
人脸分类识别模块,用于利用字典D对测试样本yt稀疏表示如下:
s.t.||x||0≤T0
其中T0表示矢量x中的非零元素个数。利用OMP(Orthogonal Matching Pursuit)算法获得测试样本yt的最优表示系数x*,然后获得测试样本yt的类标
本发明的有益效果是:本发明首先利用原子构造自适应的拉普拉斯图,使其能够保持字典的局部结构特征。然后,利用编码系数矩阵的行向量与字典的拉普拉斯图设计局部约束判别式项,使得字典具有更强的判别性能,进而设计基于自适应局部约束的判别字典学习的人脸识别系统模型,提高人脸识别的分类性能。本算法的顺利开展将丰富和发展基于约束的字典学习理论体系,为增强字典鉴别性能、提升人脸识别的能力起着重要的指导作用。
附图说明
图1是本发明的基于自适应局部约束的判别字典学习算法及人脸识别方法流程图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。
如果利用k均值算法学习字典,则字典可以继承训练样本中的结构特征。根据这一思想,考虑利用原子的局部特征继承训练样本的结构特征,并设计判别式约束项提高字典的判别性能。在此基础上设计基于自适应局部约束的判别字典学习算法提高人脸识别的分类性能。本发明提出的算法步骤如下:
第一步:利用原子构造字典的局部特征模型,由于图能够有效地表示数据间的关系,可以利用图来表示原子间的相似性特征。利用字典(是第i个原子,K是原子个数)中的原子构造图M如下:
其中,δ是参数,kNN(di)表示原子di的k近邻原子,M(i,j)是原子di和dj的权重,并反映它们间的相似性。
第二步:为了更好的反映原子间的局部特征,利用拉普拉斯图来构造原子间的相似性特征。基于原子特征的拉普拉斯图L构造如下:
第三步:由于字典D是从训练样本中学习得到的,拉普拉斯矩阵L比直接利用训练样本集合具有更强的鲁棒性。由于编码系数矩阵的行向量和原子是一一对于关系,可以利用编码系数矩阵的行向量和拉普拉斯图L保持字典的局部结构信息,则设计的自适应局部约束模型如下(Tr(.)是矩阵的迹运算):
第四步:为了学习一个判别性能强的字典,利用原子的局部特征约束项作为判别式约束项,设计基于自适应局部约束的字典学习算法(LCDL)如下:
s.t.||di||2=1,i=1,…,K
其中,Y是训练样本集合,D是学习得到的字典,X是编码系数,α和β是调整参数。是重构项,Tr(XTLX)是判别式约束项,||X||1是编码系数约束项,||·||1是l1范数,||·||2是l2范数。
与目前基于局部约束的判别字典学习算法相比,本发明提出的LCDL算法具有以下特点:(1)利用原子构造字典的拉普拉斯图,继承训练样本的结构特征;(2)判别式约束项具有一定的自适应性和鲁棒性,能减少人脸图像中的噪声对字典判别性能的影响。
当编码系数矩阵X和拉普拉斯矩阵L固定,则基于局部约束的字典学习算法的目标函数可以转换为:
s.t.||di||2=1,i=1,…,K
公式(5)是一个二次约束的最小平方优化问题,可利用拉格朗日对偶函数转换为:
其中λ=[λ1,…,λi,…,λK](i∈[1,…,K]),λi是第i个等式约束(||di||2=1)的拉格朗日乘子。于是可以定义对角矩阵其对角元素Λii=λi。因此,公式(6)可转换为:
为了获得最优的字典D,对公式(7)求一阶导数并令其等于零可得:
DXXT+DΛ-YXT=0 (8)
因此,最优的字典D为:
D*=YXT(XXT+Λ)-1 (9)
为了减少计算复杂度,利用δI(I是单位矩阵)代替Λ获得最优的字典D为:
D*=YXT(XXT+δI)-1 (10)
一旦获得最优的字典D*,可以利用公式(2)更新拉普拉斯矩阵L。
当字典D和拉普拉斯矩阵L固定,基于自适应局部约束的判别字典学习算法的目标函数转换为:
令:则公式(11)转换为:
公式(12)的求解等价于公式(13)的求解:
其中,▽f(X1)是对函数f(.)中的X求导运算。
且η应满足
公式(13)的求解可以转换为:
利用软阀值方法求解如下:
其中soft(.)为软阀值函数。
由于获得的编码系数矩阵不能直接用来分类,可以使用一种简单的线性分类器对测试样本进行分类。具体的分类步骤如下:
(1)利用编码系数矩阵X和训练样本的类标矩阵H计算分类参数W如下:
W=HXT(XXT+I)-1 (16)
其中,当hi中第j个元素为非零值时,表明训练样本yi来自于第j类。
(2)对于测试样本yt,利用学习得到的字典D对其稀疏表示如下:
s.t.||x||0≤T0 (17)
其中T0表示矢量x中的非零元素个数。利用OMP(Orthogonal Matching Pursuit)算法可以获得测试样本yt的最优表示系数x*
(3)测试样本yt的类标可以利用公式(18)获得
人脸测试图像yt可以基于摄像头拍摄的视频进行人脸检测算法得到。
表1 LCDL算法
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (4)
1.一种基于自适应局部约束的判别字典学习的人脸识别方法,其特征在于:基于自适应局部约束的判别字典学习方法包括步骤S1-S6:
S1、利用原子构造字典的局部特征模型:利用字典中的原子构造图M:
其中,是第i个原子,K是原子个数,δ是参数,kNN(di)表示原子di的k近邻原子,M(i,j)是原子di和dj的权重,并反映它们间的相似性;
S2、利用拉普拉斯图来构造原子间的相似性特征,基于原子特征的拉普拉斯图L构造如下:
其中,M是字典D中原子的近邻图,T是利用近邻图M计算的对角矩阵,Mij是近邻图M中原子间的权重;
S3、利用编码系数矩阵的行向量和拉普拉斯图L保持字典的局部结构信息,则设计的自适应局部约束模型如下:
其中,是编码系数矩阵X的第i行矢量,编码系数矩阵X的第j行矢量,Tr(.)是矩阵的迹运算;
S4、为了学习一个判别性能强的字典,利用原子的局部特征约束项作为判别式约束项,构造目标函数如下:
s.t.||di||2=1,i=1,…,K
其中,Y是训练样本集合,D是学习得到的字典,X是编码系数矩阵,α和β是调整参数;
S5、目标函数求解:当编码系数矩阵X和拉普拉斯矩阵L固定,则基于局部约束的字典学习算法的目标函数可以转换为:
s.t.||di||2=1,i=1,…,K
最优的字典D为:D*=YXT(XXT+Λ)-1,其对角元素Λii=λi;其中λi是第i个等式约束||di||2=1的拉格朗日乘子;一旦获得最优的字典D*,根据步骤S1和S2更新拉普拉斯矩阵L;
所述步骤S5中,为了减少计算复杂度,利用δI代替Λ获得最优的字典D为:D*=YXT(XXT+δI)-1,其中,I是单位矩阵;
S6、当字典D和拉普拉斯矩阵L固定,基于自适应局部约束的判别字典学习算法的目标函数转换为:
令:则公式(1)转换为:
公式(2)的求解等价于公式(3)的求解:
其中, 是对函数f(.)中的X求导运算;
且η应满足
公式(3)的求解可以转换为:
利用软阀值方法求解如下:
其中soft(.)为软阀值函数, 是关于变量X的求导运算;
迭代公式(5),计算得到编码系数矩阵;
当将步骤S1-S6的方法应用于人脸识别时,具体为:
步骤1,求解最优的编码系数X*和字典D*,具体包括:
A.获得训练样本集合Y,设置参数α,β,η,δ,n,及迭代次数φ;
B.针对训练样本中的第l类样本yl,利用K-SVD算法初始化特定类字典Dl和编码系数矩阵Xl,l=1,2…….,C,其中C是字典中原子的类数;
C.获得初始化字典D0=[D1,…,DC]和初始化编码系数矩阵X0=[X1,…,XC],并利用D0计算初始化的拉普拉斯矩阵L0;
D.For h=1:φ
利用公式Dh=Yh(Xh)T(Xh(Xh)T+δI)-1计算字典Dh,其中,I是单位矩阵;
利用字典Dh和公式Lh=Th-Mh,计算拉普拉斯矩阵Lh,其中,Mh是字典Dh中原子的近邻图,Th是利用近邻图Mh计算的对角矩阵,是近邻图Mh中原子间的权重;
利用步骤S6中的方法计算编码系数矩阵Xh;
End
E.获得最优的编码系数X*和字典D*;
步骤2,利用编码系数矩阵X*和训练样本的类标矩阵H计算分类参数W:
W=H(X*)T(X*(X*)T+I)-1
其中,s=[1,2,…,n],当hs中第l个元素为非零值时,表明训练样本yl来自于第l类;
步骤3,获取测试样本yt;
步骤4,对于测试样本yt,利用字典D*对其稀疏表示如下:
s.t.||x||0≤T0
其中T0表示矢量x中的非零元素个数;利用OMP算法获得测试样本yt的最优表示系数x*;
步骤5,获得测试样本yt的类标l:
2.根据权利要求1所述的人脸识别方法,其特征在于:人脸测试样本yt基于摄像头拍摄的视频进行人脸检测算法得到。
3.一种人脸识别系统,其特征在于,所述系统包括:
字典学习模块,用于根据输入人脸训练样本集合Y,利用如权利要求1所述的基于自适应局部约束的判别字典学习的人脸识别方法,获得最优的编码系数X*和字典D*;
分类参数计算模块,用于利用编码系数矩阵X*和训练样本的类标矩阵H计算分类参数W:
W=H(X*)T(X*(X*)T+I)-1
其中,s=1,……N,当hs中第l个元素为非零值时,表明训练样本yl来自于第l类;
人脸图像获取模块,用于获取测试样本yt;
人脸分类识别模块,用于利用字典D*对测试样本yt稀疏表示如下:
s.t.||x||0≤T0
其中T0表示矢量x中的非零元素个数;利用OMP算法获得测试样本yt的最优表示系数x*,然后获得测试样本yt的类标l:
4.根据权利要求3所述的人脸识别系统,其特征在于:人脸测试样本yt基于摄像头拍摄的视频进行人脸检测算法得到。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610321262.7A CN106066992B (zh) | 2016-05-13 | 2016-05-13 | 基于自适应局部约束的判别字典学习的人脸识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610321262.7A CN106066992B (zh) | 2016-05-13 | 2016-05-13 | 基于自适应局部约束的判别字典学习的人脸识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106066992A CN106066992A (zh) | 2016-11-02 |
CN106066992B true CN106066992B (zh) | 2019-10-18 |
Family
ID=57420035
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610321262.7A Active CN106066992B (zh) | 2016-05-13 | 2016-05-13 | 基于自适应局部约束的判别字典学习的人脸识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106066992B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106815599B (zh) * | 2016-12-16 | 2020-12-22 | 合肥工业大学 | 一种图像分类中通用的判别性稀疏编码字典学习方法 |
CN107832747B (zh) * | 2017-12-05 | 2022-06-07 | 广东技术师范大学 | 一种基于低秩字典学习算法的人脸识别方法 |
CN108734116B (zh) * | 2018-05-04 | 2021-12-03 | 江南大学 | 一种基于变速学习深度自编码网络的人脸识别方法 |
CN109543724B (zh) * | 2018-11-06 | 2021-09-03 | 南京晓庄学院 | 一种多层鉴别卷积稀疏编码学习方法 |
CN110046608B (zh) * | 2019-04-26 | 2020-01-07 | 广东石油化工学院 | 基于半耦合鉴别字典学习的叶遮挡行人重识别方法及系统 |
CN110648276B (zh) * | 2019-09-25 | 2023-03-31 | 重庆大学 | 基于流形映射与字典学习的高维图像数据降维方法 |
CN112241768B (zh) * | 2020-11-25 | 2024-04-26 | 广东技术师范大学 | 一种基于深度分解字典学习的精细图像分类方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102073880A (zh) * | 2011-01-13 | 2011-05-25 | 西安电子科技大学 | 利用稀疏表示进行人脸识别的集成方法 |
CN102129573A (zh) * | 2011-03-10 | 2011-07-20 | 西安电子科技大学 | 基于字典学习和稀疏表示的sar图像分割方法 |
US20130156300A1 (en) * | 2011-12-20 | 2013-06-20 | Fatih Porikli | Multi-Class Classification Method |
CN102609681B (zh) * | 2012-01-12 | 2014-04-30 | 北京大学 | 基于字典学习模型的人脸识别方法 |
US9380221B2 (en) * | 2013-02-27 | 2016-06-28 | Massachusetts Institute Of Technology | Methods and apparatus for light field photography |
CN105550634B (zh) * | 2015-11-18 | 2019-05-03 | 广东微模式软件股份有限公司 | 基于Gabor特征与字典学习的人脸姿态识别方法 |
-
2016
- 2016-05-13 CN CN201610321262.7A patent/CN106066992B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN106066992A (zh) | 2016-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106066992B (zh) | 基于自适应局部约束的判别字典学习的人脸识别方法及系统 | |
She et al. | Text classification based on hybrid CNN-LSTM hybrid model | |
Li et al. | Gesture recognition based on modified adaptive orthogonal matching pursuit algorithm | |
Li et al. | Maximum-margin structured learning with deep networks for 3d human pose estimation | |
CN103824054B (zh) | 一种基于级联深度神经网络的人脸属性识别方法 | |
CN104361328B (zh) | 一种基于自适应多列深度模型的人脸图像正规化方法 | |
Peng et al. | Active transfer learning | |
Cai et al. | Facial expression recognition method based on sparse batch normalization CNN | |
CN105678231A (zh) | 一种基于稀疏编码和神经网络的行人图片检测方法 | |
CN106845397A (zh) | 一种基于相似度度量的人脸确认方法 | |
CN104281845A (zh) | 基于旋转不变字典学习模型的人脸识别方法 | |
Gu et al. | Local robust sparse representation for face recognition with single sample per person | |
CN108830220A (zh) | 基于深度学习的视觉语义库构建及全局定位方法 | |
Sun et al. | Selective multiple kernel learning for classification with ensemble strategy | |
CN104392246A (zh) | 一种基于类间类内面部变化字典的单样本人脸识别方法 | |
CN110347857B (zh) | 基于强化学习的遥感影像的语义标注方法 | |
Xie et al. | Hierarchical coding of convolutional features for scene recognition | |
Liao et al. | Face recognition based on dictionary learning and subspace learning | |
WO2021003637A1 (zh) | 基于加性高斯核的核非负矩阵分解人脸识别方法、装置、系统及存储介质 | |
Zhang et al. | Joint distribution alignment via adversarial learning for domain adaptive object detection | |
Huang et al. | Design and Application of Face Recognition Algorithm Based on Improved Backpropagation Neural Network. | |
Du et al. | Research on small size object detection in complex background | |
CN108710836A (zh) | 一种基于级联特征提取的唇部检测及读取方法 | |
CN109446368B (zh) | 一种基于类别信息的鸟类检索方法及系统 | |
CN105069430B (zh) | 一种基于msnrd特征的多姿态人脸检测器的设计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |