CN104573726B - 基于四等分及各成分重构误差最优组合的人脸图像识别方法 - Google Patents

基于四等分及各成分重构误差最优组合的人脸图像识别方法 Download PDF

Info

Publication number
CN104573726B
CN104573726B CN201510014901.0A CN201510014901A CN104573726B CN 104573726 B CN104573726 B CN 104573726B CN 201510014901 A CN201510014901 A CN 201510014901A CN 104573726 B CN104573726 B CN 104573726B
Authority
CN
China
Prior art keywords
image
class
reconstructed error
optimum combination
jth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510014901.0A
Other languages
English (en)
Other versions
CN104573726A (zh
Inventor
张化祥
王永欣
李静
王强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Normal University
Original Assignee
Shandong Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Normal University filed Critical Shandong Normal University
Priority to CN201510014901.0A priority Critical patent/CN104573726B/zh
Publication of CN104573726A publication Critical patent/CN104573726A/zh
Application granted granted Critical
Publication of CN104573726B publication Critical patent/CN104573726B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种基于四等分及各成分重构误差最优组合的人脸图像识别方法。将所有图像划分成互不重叠和大小相等的四部分,通过SRC算法学习测试图像每一部分用训练图像相应部分表示的稀疏系数和重构误差,构建重构误差矩阵。通过图像每一部分的分类准确率计算图像各部分的最优权重,对重构误差采用最优权重线性聚合的方法,为测试图像分类。在基于稀疏编码的图像分类方法基础上,对图像不同成分进行加权线性组合,为判别力较强的部分分配较高的权值,为判别力较弱的部分分配较低的权值,从而使图像的整体判别力得到提升,提高了识别准确度。提出的各成分重构误差的最优组合方法对图像不同部分的稀疏重构误差进行最优组合,提高了人脸识别准确率。

Description

基于四等分及各成分重构误差最优组合的人脸图像识别方法
技术领域
本发明涉及一种人脸图像识别方法,尤其涉及一种基于四等分及各成分重构误差最优组合的人脸图像识别方法。
背景技术
图像识别是一项艰巨的任务。由于从互联网或以其他方法可以轻松地获得大量图像,所以图像识别具有巨大的应用前景,成为研究的热点之一。尽管目前已经有许多图像识别方法,但是识别的准确率和高效性仍然是研究的重点。基于稀疏表示的图像分类(SRC,Sparse Representation based Classification)方法成功地将稀疏编码技术用于图像分类,通过基于原子字典的稀疏线性组合来重构高维图像,并且基于测试图像与各个类别对应的重构误差对测试图像进行分类。SRC的成功归功于图像其类别的代表性样本在低维流形上的稀疏表示。许多SRC的扩展方法主要集中在解决稀疏表示中数据的标签信息和局部结构被忽视,以及每一类对应的子词典之间存在一定的关系等问题上。
目前的SRC及其扩展方法有一个共同的缺点,即在进行图像识别时,将图像作为整体考虑,也就是说,对图像的不同部分同等地考虑。实际上,一个图像不同部分所包含的判别信息是完全不同的。例如,在人脸识别中,如果我们把一个人脸图像划分成上下两个大小相同的部分,根据我们的经验,上半部分会比下半部分更具有判别力。因此,在分类中同等考虑不同的图像部分可能没有充分利用图像的判别信息。如何将图像各个部分按照判别能力的大小进行最优组合,实现更有效的分类,成为了一个值得研究的问题。
发明内容
本发明的目的就是为了解决上述问题,提供一种基于四等分及各成分重构误差最优组合的人脸图像识别方法,提高人脸识别的准确率。
本发明的基本思想是:将所有图像划分成互不重叠和大小相等的若干部分,通过SRC算法学习测试图像每一部分用训练图像相应部分表示的稀疏系数和重构误差,构建重构误差矩阵。通过图像每一部分的分类准确率计算图像各部分的最优权重,对重构误差采用最优权重线性聚合的方法,为测试图像分类。
本发明采用如下技术方案:
一种基于各成分重构误差最优组合的人脸图像识别方法,其特征在于包括如下步骤:
步骤一:将已知类别属性但属于L个不同类别的人脸图像训练样本集X和人脸图像测试样本Y以相同的方式,自上而下均匀划分为互不重叠且大小相等的m个部分,划分后,第l类中的每个人脸图像xli∈Xl(i∈{1,2,…,nl})分为m部分,每一部分记为xlij(j∈{1,2,…,m}),其中,Xl表示整个人脸图像训练样本集X中的第l类,nl表示第l类中的图像数,第l类中所有图像的第j部分组成的集合记为所有L类训练图像的第j部分组成的集合记为X(j)={X1j,…,Xlj,…,XLj},测试图像的每一部分记为yj(j∈{1,2,…,m});
步骤二:将所有训练图像的第j部分矢量化后构成字典矩阵,对测试图像的第j部分进行稀疏编码,得到第j部分的稀疏表示系数,记为wj=(w1j;…,wlj;…;wLj),对j的m个取值分别进行同样的操作,即对测试图像的每一部分,均得到用训练图像相应部分线性表示的稀疏表示系数,其中稀疏表示系数的求解根据如下公式得到:
min||yj-X(j)wj||2+λ||wj||1for j∈{1,2,…,m},其中λ是用于平衡重构误差与稀疏度的参数;
步骤三:计算测试图像y每个部分对应所有类相应部分的稀疏表示的重构误差,对第l类的第j部分的重构误差表示为dlj=||yj-Xljwlj||2,其中j∈{1,2,…,m}和l∈{1,2,…,L},并得到图像y的损失矩阵D(y),该损失矩阵中第l行第j列元素由dlj给出,即
步骤四:根据损失矩阵,计算测试图像各个部分重构误差的最优组合值;
步骤五:重构误差的最优组合值最小的类即判断为测试图像的类,即根据如下公式为测试图像y分配预测类标签:
cl(y)=argminfl(p)。
优选地,步骤四中测试图像各个部分重构误差的最优组合值的计算方法为:对验证图像采用如上相同的划分块和稀疏编码方式,计算验证图像对训练图像第l类的第j部分的重构误差,对每一部分选取重构误差最小的类作为该部分的分类标签,用每一部分的分类结果与真实的分类结果进行比较,得到用每一部分的分类结果作为图像整体分类结果的分类准确率pj,并按照如下公式计算测试图像各个部分重构误差的最优组合值:
其中,β是归一化参数,不影响分类结果。
优选地,取m的值为4,即将人脸图像自上而下划分为面积相等且不重叠的四块。
本发明的有益效果:在基于稀疏编码的图像分类方法基础上,对图像不同成分进行加权线性组合,为判别力较强的部分分配较高的权值,为判别力较弱的部分分配较低的权值,从而使图像的整体判别力得到提升,提高了识别准确度。本发明提出的各成分重构误差的最优组合方法对图像不同部分的稀疏重构误差进行最优组合,提高了人脸识别准确率。
附图说明
图1为本发明的人脸识别方法的流程图;
图2为本发明中实现图像分块和相应块的稀疏重构方法的示意图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
本发明以ORL、YaleB、AR、PIE多个人脸数据库为实施实例。其中,ORL数据库包含40个人的总计400幅人脸图像,每人10幅图像分别在不同光照条件及不同表情下获得。将人脸图像变换为32×32像素的图像,灰度级255。采用特征脸(Eigenface)方法进行降维。在数据库每人10幅图像中,分别随机选取3,5,6,8幅图像作为训练样例,剩下的作为测试样例。每幅图像是1024维行向量,总计400个向量。将所有的图像互不重叠的水平划分为4部分,将每幅图像变换为4个256维行向量并采用特征脸方法降到100维。
如图1所示为本发明人脸识别方法的流程图,本发明的方法总体包括五个步骤:首先是图像分块。由于人脸图像具有左右对称性,所以采用自上而下的方法分块。同时,根据人脸结构特点,采用四等分。分析和实验证明,这种分块方式对于人脸识别应用是合适的。当应用本方法对其它类型图像进行分类时,可以选择其它适合的分块方式。步骤一的具体实现方式为:将已知类别属性但属于L个不同类别的人脸图像训练样本集X和人脸图像测试样本Y以相同的方式,自上而下均匀划分为互不重叠且大小相等的m个部分,划分后,第l类中的每个人脸图像xli∈Xl(i∈{1,2,…,nl})分为m部分,每一部分记为xlij(j∈{1,2,…,m}),其中,Xl表示整个人脸图像训练样本集X中的第l类,nl表示第l类中的图像数,第l类中所有图像的第j部分组成的集合记为所有L类训练图像的第j部分组成的集合记为X(j)={X1j,…,Xlj,…,XLj},测试图像的每一部分记为yj(j∈{1,2,…,m})。
步骤二是对每一块,分别用SRC算法求稀疏表示系数。相应的图像分块的稀疏重构的对应方式如图2所示。将所有训练图像的第j部分矢量化后构成字典矩阵,对测试图像的第j部分进行稀疏编码,得到第j部分的稀疏表示系数,记为wj=(w1j;…,wlj;…;wLj),对j的m个取值分别进行同样的操作,即对测试图像的每一部分,均得到用训练图像相应部分线性表示的稀疏表示系数,其中稀疏表示系数的求解根据如下公式得到:
min||yj-X(j)wj||2+λ||wj||1for j∈{1,2,…,m},其中λ是用于平衡重构误差与稀疏度的参数。
步骤三是对每一块,分别求其用每一类相应的块进行稀疏表示的重构误差,即:计算测试图像y每个部分对应所有类相应部分的稀疏表示的重构误差,对第l类的第j部分的重构误差表示为dlj=||yj-Xljwlj||2,其中j∈{1,2,…,m}和l∈{1,2,…,L},并得到图像y的损失矩阵D(y),该损失矩阵中第l行第j列元素由dlj给出,即
由此可见,D(y)的每一列表示给定类别下图像不同部分所对应的重构误差,而其每一行表示给定部分下图像不同类别对应的重构误差。
步骤四是计算测试图像各个部分重构误差的最优权重,然后以最优权重加权,得到最优组合值。最优组合值可以由多种方法获得。本发明提出的计算最优权重的公式为:其中pj是用第j部分的分类结果作为图像整体分类结果的分类准确率。这里将每一类之外的其他类看作一类,把L类的分类问题转化为了二分类问题。步骤四的具体实现为:对验证图像采用如上相同的划分块和稀疏编码方式,计算验证图像对训练图像第l类的第j部分的重构误差dlj=||yj-Xljwlj||2,对每一部分选取重构误差最小的类作为该部分的分类标签,用每一部分的分类结果与真实的分类结果进行比较,得到用每一部分的分类结果作为图像整体分类结果的分类准确率pj,并按照如下公式计算测试图像各个部分重构误差的最优组合值:
步骤五是根据前面得到的重构误差的最优组合值,将重构误差的最优组合值最小的类判断为测试图像的类,即根据如下公式为测试图像y分配预测类标签:
cl(y)=argminfl(p)。
通过实验,得到本方法与SRC方法在多个人脸数据库上的分类准确率比较,如下表所示:
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (3)

1.一种基于各成分重构误差最优组合的人脸图像识别方法,其特征在于包括如下步骤:
步骤一:将已知类别属性但属于L个不同类别的人脸图像训练样本集X和人脸图像测试样本Y以相同的方式,自上而下均匀划分为互不重叠且大小相等的m个部分,划分后,第l类中的每个人脸图像xli∈Xl(i∈{1,2,…,nl})分为m部分,每一部分记为xlij(j∈{1,2,…,m}),其中,Xl表示整个人脸图像训练样本集X中的第l类,nl表示第l类中的图像数,第l类中所有图像的第j部分组成的集合记为Xlj={xl1j,…,xlij,…,xlnlj},所有L类训练图像的第j部分组成的集合记为X(j)={X1j,…,Xlj,…,XLj},测试图像记为y且其每一部分记为yj(j∈{1,2,…,m});
步骤二:将所有训练图像的第j部分矢量化后构成字典矩阵,对测试图像的第j部分进行稀疏编码,得到第j部分的稀疏表示系数,记为wj=(w1j;…,wlj;…;wLj),对j的m个取值分别进行同样的操作,即对测试图像的每一部分,均得到用训练图像相应部分线性表示的稀疏表示系数,其中稀疏表示系数的求解根据如下公式得到:
min||yj-X(j)wj||2+λ||wj||1for j∈{1,2,…,m},其中λ是用于平衡重构误差与稀疏度的参数;
步骤三:计算测试图像y每个部分对应所有类相应部分的稀疏表示的重构误差,对第l类的第j部分的重构误差表示为dlj=||yj-Xljwlj||2,其中j∈{1,2,…,m}和l∈{1,2,…,L},并得到图像y的损失矩阵D(y),该损失矩阵中第l行第j列元素由dlj给出,即
步骤四:根据损失矩阵,计算测试图像各个部分重构误差的最优组合值;
步骤五:重构误差的最优组合值最小的类即判断为测试图像的类,即根据如下公式为测试图像y分配预测类标签:
cl(y)=argminfl(p)。
2.如权利要求1所述的人脸图像识别方法,其特征在于:步骤四中测试图像各个部分重构误差的最优组合值的计算方法为:对验证图像采用如上相同的划分块和稀疏编码方式,计算验证图像对训练图像第l类的第j部分的重构误差,对每一部分选取重构误差最小的类作为该部分的分类标签,用每一部分的分类结果与真实的分类结果进行比较,得到用每一部分的分类结果作为图像整体分类结果的分类准确率pj,并按照如下公式计算测试图像各个部分重构误差的最优组合值:
其中,β是归一化参数,不影响分类结果。
3.如权利要求1或2所述的人脸图像识别方法,其特征在于:取m的值为4,即将人脸图像自上而下划分为面积相等且不重叠的四块。
CN201510014901.0A 2015-01-12 2015-01-12 基于四等分及各成分重构误差最优组合的人脸图像识别方法 Expired - Fee Related CN104573726B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510014901.0A CN104573726B (zh) 2015-01-12 2015-01-12 基于四等分及各成分重构误差最优组合的人脸图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510014901.0A CN104573726B (zh) 2015-01-12 2015-01-12 基于四等分及各成分重构误差最优组合的人脸图像识别方法

Publications (2)

Publication Number Publication Date
CN104573726A CN104573726A (zh) 2015-04-29
CN104573726B true CN104573726B (zh) 2019-02-19

Family

ID=53089746

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510014901.0A Expired - Fee Related CN104573726B (zh) 2015-01-12 2015-01-12 基于四等分及各成分重构误差最优组合的人脸图像识别方法

Country Status (1)

Country Link
CN (1) CN104573726B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105590088A (zh) * 2015-09-17 2016-05-18 重庆大学 一种基于稀疏自编码和稀疏表示进行交通标志识别的方法
CN106446806B (zh) * 2016-09-08 2018-10-12 山东师范大学 基于模糊隶属度稀疏重构的半监督人脸识别方法及系统
CN110070037B (zh) * 2019-04-22 2022-11-01 深圳力维智联技术有限公司 人脸识别模型的平滑升级方法、装置和可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102073880A (zh) * 2011-01-13 2011-05-25 西安电子科技大学 利用稀疏表示进行人脸识别的集成方法
CN102722699A (zh) * 2012-05-22 2012-10-10 湖南大学 基于多尺度韦伯局部特征和核组稀疏表示的人脸识别方法
CN104200194A (zh) * 2014-08-06 2014-12-10 北京工业大学 一种人脸识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8374442B2 (en) * 2008-11-19 2013-02-12 Nec Laboratories America, Inc. Linear spatial pyramid matching using sparse coding
US20130156300A1 (en) * 2011-12-20 2013-06-20 Fatih Porikli Multi-Class Classification Method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102073880A (zh) * 2011-01-13 2011-05-25 西安电子科技大学 利用稀疏表示进行人脸识别的集成方法
CN102722699A (zh) * 2012-05-22 2012-10-10 湖南大学 基于多尺度韦伯局部特征和核组稀疏表示的人脸识别方法
CN104200194A (zh) * 2014-08-06 2014-12-10 北京工业大学 一种人脸识别方法

Also Published As

Publication number Publication date
CN104573726A (zh) 2015-04-29

Similar Documents

Publication Publication Date Title
CN109344736B (zh) 一种基于联合学习的静态图像人群计数方法
CN105469096B (zh) 一种基于哈希二值编码的特征袋图像检索方法
Jia et al. Bagging-based spectral clustering ensemble selection
CN105184298B (zh) 一种快速局部约束低秩编码的图像分类方法
CN109615014A (zh) 一种基于kl散度优化的数据分类系统与方法
CN111950594A (zh) 基于子图采样的大规模属性图上的无监督图表示学习方法和装置
CN105354595A (zh) 一种鲁棒视觉图像分类方法及系统
CN104966105A (zh) 一种鲁棒机器错误检索方法与系统
CN107247753B (zh) 一种相似用户选取方法及装置
CN103177265B (zh) 基于核函数与稀疏编码的高清图像分类方法
CN110210027B (zh) 基于集成学习的细粒度情感分析方法、装置、设备及介质
CN103440471B (zh) 基于低秩表示的人体行为识别方法
CN106991355A (zh) 基于拓扑保持的解析型字典学习模型的人脸识别方法
CN107918761A (zh) 一种基于多流形核鉴别分析的单样本人脸识别方法
CN105956570B (zh) 基于唇部特征和深度学习的笑脸识别方法
Jia et al. Adaptive neighborhood propagation by joint L2, 1-norm regularized sparse coding for representation and classification
CN112256866A (zh) 一种基于深度学习的文本细粒度情感分析方法
CN113065974A (zh) 一种基于动态网络表示学习的链路预测方法
Sánchez et al. Efficient algorithms for a robust modularity-driven clustering of attributed graphs
CN108256630A (zh) 一种基于低维流形正则化神经网络的过拟合解决方法
CN109376763A (zh) 基于多样本推理神经网络的样本分类方法、系统及介质
CN110097096A (zh) 一种基于tf-idf矩阵和胶囊网络的文本分类方法
CN107301643A (zh) 基于鲁棒稀疏表示与拉普拉斯正则项的显著目标检测方法
CN104573726B (zh) 基于四等分及各成分重构误差最优组合的人脸图像识别方法
Zhang et al. Class relatedness oriented-discriminative dictionary learning for multiclass image classification

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190219

Termination date: 20210112