CN108647690A - 用于非约束人脸识别的判别稀疏保持投影方法 - Google Patents
用于非约束人脸识别的判别稀疏保持投影方法 Download PDFInfo
- Publication number
- CN108647690A CN108647690A CN201710969273.0A CN201710969273A CN108647690A CN 108647690 A CN108647690 A CN 108647690A CN 201710969273 A CN201710969273 A CN 201710969273A CN 108647690 A CN108647690 A CN 108647690A
- Authority
- CN
- China
- Prior art keywords
- sample
- class
- matrix
- sparse
- dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
- G06V10/507—Summing image-intensity values; Histogram projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/513—Sparse representations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种用于非约束人脸识别的判别稀疏保持投影方法,通过1),在计算样本重构关系矩阵W时,利用类别标签和类内紧凑度约束,增大同类非近邻样本权重系数;2)计算低维映射矩阵P时,增加全局约束因子,进一步降低异类伪近邻样本对投影矩阵的影响,能够更准确挖掘出隐藏在复杂冗余数据中的低维流形本质结构;3)实现高维样本数据的低维线性映射;对于真实环境中获取的非约束人脸图像,本发明DSPP可以更准确消除高维数据中的冗余信息,抽取本质特征,增强表征能力;同时,也减少了数据维度,节约存储空间,大大提高了人脸识别的可靠性和有效性。
Description
技术领域
本发明涉及一种用于非约束人脸识别的判别稀疏保持投影方法,是以非约束环境下人脸识别为应用背景,进行高维人脸数据的低维映射研究,主要包括样本稀疏表示的类内约束优化和低维投影目标函数的全局约束改进。
背景技术
随着互联网、传感技术的飞速发展,计算机处理的人脸图像数据越来越呈现海量、复杂的特点。因此,对海量复杂人脸数据进行有效降维,挖掘出掩藏在高维表象下有用的本质信息显得尤为重要。一方面可减少数据维度,节约存储空间,提高系统的运行效率;另一方面,又可获取数据本质特征,增强系统的表征能力。
鉴于非约束环境下获取的人脸图像受光照、姿态、表情、遮挡、年龄、分辨率等多种因素混合干扰,导致高维人脸数据结构复杂、冗余度高且呈现非线性分布。因此,传统的线性降维方法(如PCA、LDA等)不能有效处理这种在高维空间中扭曲的真实数据,有时甚至会削弱和破坏高维数据中隐含的局部几何结构。为了有效挖掘高维数据中隐含的低维本质结构,以核学习和流形学习为代表的非线性降维方法得到广泛应用。
核学习虽然在一定程度上起到了非线性降维的作用,但其本质仍是在高维的隐特征空间利用线性方法降维,并且核矩阵设计、以及通过核矩阵将数据映射到更高维的隐特征空间的内在机制和直观意义都尚不明确,这极大的限制了核学习的发展。而流形学习的本质是从局部可坐标化的拓扑空间中挖掘高维数据内在的流形结构,是对传统欧式空间研究的推广,符合人眼视觉感知机制,因此,流形学习能够更准确、更有效的从真实复杂数据中寻找事物的本质特征,是一种能够恢复数据内在扭曲结构的非线性降维方法。
目前,传统的流形学习算法(如LE、LLE、Isomap等)均采用隐式函数把数据从高维空间映射到低维空间,缺乏对新样本的归纳能力。而局部保留投影 (Locality preservingprojections,LPP)和近邻保持嵌入(Neighborhood preserving embedding,NPE)则分别是对传统的拉普拉斯特征映射(Laplacian Eigenmap,LE)和局部线性嵌入(Locally LinearEmbedding,LLE)的线性化改进,在不改变原有目标函数基础上增加线性约束,得到映射函数解析式,未知新样本的低维坐标可直接由显式函数计算得到,在模式识别领域得到广泛应用。
LPP和NPE的基本原理是以邻域样本之间的距离测度作为权值条件,约束达到在低维空间中仍保持该局部属性的降维方法。但在实际应用中,样本之间距离测度的可区分性会随着维数的增加而减弱,因此,利用距离测度描述样本局部属性并不能准确挖掘出高维数据中隐含的低维流形本质结构。为了解决这一问题,乔立山提出稀疏保持投影(SparsityPreserving Projections,SPP)算法,通过构造每一个训练样本在字典下的稀疏表示,得到稀疏重构权值矩阵,是一种以保持数据间稀疏关系为目的的降维方法。
虽然稀疏表示技术具有非常好的鲁棒性,这使得SPP在人脸识别中取得较好效果,但SPP是一种非监督的学习算法,没有引入标签信息,尽管乔立山指出稀疏重构系数中已隐含鉴别信息,但这个结论是基于训练样本充分多,且同类样本充分近似的假设条件下得到的。事实上,在真实环境下采集的人脸图像复杂多变,由于表情、遮挡、光照、年龄等因素影响,同类样本间会表现出很大差异,导致待测样本不能完全被同类样本近似稀疏表示,同时还会出现个别异类样本错误逼近的情况,使得投影矩阵不准确,识别性能下降。
总的来说,现有经典流形学习算法的不足之处在于:
1.LPP、NPE及其改进算法是传统流形学习算法的线性实现,有效保持了样本之间的局部近邻关系,但在高维空间中,样本之间的距离不具有可区分性,以距离测度表示近邻关系不能准确挖掘出掩藏在高维冗余数据中有用的低维本质信息。
2.SPP及其改进算法是通过保持样本稀疏重构关系实现高维数据的低维映射。相比LPP和NPE算法,SPP根据样本间的稀疏关系可以更准确描述高维数据内蕴的局部结构,并且稀疏表示系数的准确性直接决定了低维流形结构的准确性。但在处理非约束环境下获取的人脸数据时,样本复杂多变,传统SPP作为一种无监督降维方法,优化得到稀疏重构权值不准确,影响了非约束人脸识别的准确性。
发明内容
本发明的目的是提供一种用于非约束人脸识别的判别稀疏保持投影方法(Discriminative Sparsity Preserving Projections,DSPP),对于非约束环境中获取的真实人脸图像,可以更准确消除高维数据中的冗余信息,抽取本质特征,增强表征能力;同时,也减少了数据维度,节约存储空间,提高系统的运行效率。解决现有技术中存在的上述问题。
本发明的技术解决方案是:
一种用于非约束人脸识别的判别稀疏保持投影方法,包括以下步骤:
1)计算重构关系矩阵W,定义样本重构关系矩阵W=diag(S1,S2,...,Sc),得到任意样本xjq与样本xip的鉴别重构关系权值wpq:
这里,i和j表示类别,p和q表示对应类别中第p个样本和第q个样本,只用当样本xjq和xip同类别且不是同样本时,wpq才有值,表示为其含义是指第i类中第q样本用第p个样本表示的稀疏权值;
2)计算低维映射矩阵P,在最小化低维子空间重构误差时,由上述重构关系保留同类样本间局部稀疏关系,同时,增加样本全局类内、类间约束条件,使得低维流形结构更符合高维样本空间分布;定义目标函数如下:
这里为了描述方便,不考虑样本类别,定义xi为训练样本集X中的第i个样本,wi是重构关系矩阵W中的第i个列向量,表示了样本xi与其他样本的重构关系;约束PTXXTP=I可以低维数据为单位正交,I为单位矩阵,T表示矩阵转置;F为Frobenius范数,定义为
定义全局类内聚合矩阵其中, Xi是第i类样本子集,是第i类样本子集的均值矩阵,约束最小,使得低维子空间中各类样本子集类内紧凑;同理,定义全局类间离散矩阵这里是所有样本的均值矩阵,约束最大,进一步使得低维子空间中各类样本子集类间离散;由拉格朗日乘子法,上式转化为求解下式的广义特征值问题:
这里Xb为全局类间离散矩阵,定义为其中为所有样本的均值矩阵,是第i类样本子集的均值矩阵,λ为拉格朗日参数;
其中Wβ=W+WT-WTW,选取前d个最大特征值对应的特征向量,构成最佳低维映射矩阵Popt=[p1,p2…,pd];
3)实现高维样本数据的低维线性映射:
进一步地,计算重构关系矩阵W具体为:设训练样本集X由c类样本子集 X1,X2,...,Xc组成,
这里m,n表示图像的大小,N为图像个数,R表示实数集;
其中第k类有nk个样本,满足共N个训练样本;任意样本xij,描述为第i类的第j个样本,求解下式目标函数得到样本xij的稀疏表示系数sij:
这里定义e=[1,1,...,1T]∈RN×1为单位向量,eT表示单位向量转置,约束样本xi由字典Xi稀疏表示的权重和为1;F为Frobenius范数,定义为λ1和λ2为稀疏约束比例参数,调节λ1和λ2可以使目标函数达到最优;
其中,Xi定义为除xij外且同类别的训练样本组成的字典,即ni为第i类样本的个数,Γi是与xij同类别的所有样本的稀疏表示系数平均值,最小化使相同类别的样本的稀疏表示系数接近中心值,增强同类样本类内系数的紧凑度;
为了降低计算复杂度,首先初始化均值向量Γi为零向量,优化求解同类所有样本的sij,然后计算得到Γi值,最后带入式(4)中,根据最小二乘法分析得到解析式(5),由此计算得到最佳稀疏表示系数sij:
sij=((Xi)TXi+(λ1+λ2)I)-1((Xi)Txij+λ2Γi) (5)
可见,样本xij由同类样本稀疏表示的系数表示为则同类样本的稀疏表示系数矩阵为
定义样本重构关系矩阵W=diag(S1,S2,...,Sc),则任意样本xjq与样本xip的鉴别重构关系权值wpq为:
这里,i和j表示类别,p和q表示对应类别中第p个样本和第q个样本;只用当样本xjq和xip同类别且不是同样本时,wpq才有值。
本发明从两个方面进行改进:(1)在计算样本重构关系矩阵W时,利用类别标签和类内紧凑度约束,增大同类非近邻样本权重系数;(2)计算低维映射矩阵P时,增加全局约束因子,进一步降低异类伪近邻样本对投影矩阵的影响,能够更准确挖掘出隐藏在复杂冗余数据中的低维流形本质结构。
本发明的有益效果是:本发明非约束人脸识别的判别稀疏保持投影方法 DSPP通过引入类别标签,构建监督超完备字典,使得待测样本仅由同类样本稀疏表示,并且在稀疏表示基础上增加类内紧凑度约束,增强了同类非近邻样本的重构权值;然后,在最小化重构误差基础上,增加全局约束因子,使得数据低维投影时不仅考虑了样本的局部稀疏关系,也考虑了全局分布特性,进一步削弱异类伪近邻样本对待测样本的影响。对于真实环境中获取的非约束人脸图像,本发明DSPP可以更准确消除高维数据中的冗余信息,抽取本质特征,增强表征能力;同时,也减少了数据维度,节约存储空间,大大提高了人脸识别的可靠性和有效性。
附图说明
图1是本发明实施例非约束人脸识别的判别稀疏保持投影方法的流程示意图。
图2是AR、Extended Yale B、LFW和Pubfig四种数据库部分样本图像示意图。
图3是Extended Yale B库的二维可视化结果的示意图。
图4是LFW库的二维可视化结果的示意图。
图5是在不同维度下各种降维方法的识别率的示意图。
具体实施方式
下面结合附图详细说明本发明的优选实施例。
实施例
针对稀疏保持投影算法(Sparsity Preserving Projections,SPP)利用全部样本计算稀疏表示系数以及投影过程没有从全局角度分析不同类别样本的结构特征的问题,本发明提出一种有监督的判别稀疏保持投影方法(Discriminative Sparsity PreservingProjections,DSPP),旨在达到以下发明目的:
(1)通过构建监督超完备字典,使得待测样本仅由同类样本稀疏表示,并且在稀疏表示基础上增加类内紧凑度约束,增强了同类非近邻样本的重构权值;
(2)在最小化重构误差基础上,增加了训练样本的类内、类间全局约束,使得数据低维投影时不仅考虑了样本的局部稀疏关系,也考虑了全局分布特性,进一步削弱异类伪近邻样本对待测样本的影响,能够更准确挖掘出隐藏在复杂冗余数据中的低维流形本质结构;
(3)在计算样本重构关系矩阵W时,采用最小二乘法得到解析式,可以快速求解样本稀疏重构权值,大大降低了算法的时间复杂度;
(4)总之,对于真实环境中获取的非约束人脸图像,DSPP可以更准确消除高维数据中的冗余信息,抽取本质特征,增强表征能力;同时,也减少了数据维度,节约存储空间,大大提高了人脸识别的可靠性和有效性。
稀疏保持投影算法(Sparsity Preserving Projections,SPP)的实现原理如下:
稀疏保持投影算法基本思想是通过保持样本之间的稀疏重构关系不变来进行低维投影映射。基本实现步骤是:
1)计算样本之间的重构关系矩阵W。假设有N个训练样本,构建样本矩阵X=[x1,x2,...,xN]∈Rmn×N,其中xi是将大小为m×n的图像按行拉成的列向量。对任意训练样本xi,利用除样本xi的剩余所有样本构建字典 Xi=[x1,...,xi-1,0,xi+1,…,xN]∈Rmn×N,对xi进行稀疏表示,目标函数如下:
其中,si是xi在字典Xi下的稀疏表示向量,表现形式为
si=[αi1,...,αii-1,0,αii+1…,αiN]T∈RN×1。这里定义
e=[1,1,...,1]T∈RN×1为单位向量,eTsi=1可以约束样本xi由字典Xi稀疏表示的权重和为1。依次计算每个训练样本的稀疏表示向量,得到高维空间样本之间的重构关系矩阵W=[s1,...,si,…,sN]∈RN×N,W是对称矩阵,对角线上权值恒为零αii=0。
2)计算低维映射矩阵P。为保证原始高维空间中人脸数据集的稀疏重构关系映射到低维流形子空间后仍然保持,设计目标函数如下:
其中,P是将高维样本数据xi映射到低维空间的投影矩阵,其最优值可通过求解X(W+WT-WTW)XTP=λXXTP的广义特征值问题得到。选取前d个最大特征值对应的特征向量,构成最佳低维映射矩阵 Popt=[p1,p2...,pd]。
3)实现高维样本数据的低维线性映射。
实施例用于非约束人脸识别的判别稀疏保持投影方法(DiscriminativeSparsity Preserving Projections,DSPP)的实现原理如下:
本发明从两个方面对SPP进行改进:(1)在计算样本重构关系矩阵W时,通过引入类别标签,构建监督超完备字典,使得待测样本仅由同类样本稀疏表示,并且在稀疏表示基础上增加类内紧凑度约束,增强了同类非近邻样本的重构权值;(2)计算低维映射矩阵P时,在最小化重构误差基础上,增加全局类内、类间约束因子,使得数据低维投影时不仅考虑了样本的局部稀疏关系,也考虑了全局分布特性,进一步削弱异类伪近邻样本对待测样本的影响。
如图1,实施例用于非约束人脸识别的判别稀疏保持投影方法的具体实现如下:
1)计算重构关系矩阵W。设训练样本集X由c类样本子集X1,X2,...,Xc组成,
其中第k类有nk个样本,满足共N个训练样本。任意样本xij,描述为第i类的第j个样本,通过求解下式目标函数可以得到样本xij的稀疏表示系数sij:
其中,Xi定义为除xij外且同类别的训练样本组成的字典,即ni为第i类样本的个数。Γi是与xij同类的所有样本的稀疏表示系数平均值,最小化可以使相同类别的样本的稀疏表示系数接近中心值,增强同类样本类内系数的紧凑度。由于式(4)中Γi值与稀疏表示系数sij有关,传统方法采用交替阈值迭代算法分别优化求解sij和Γi。本发明为了降低计算复杂度,首先初始化均值向量Γi为零向量,优化求解同类所有样本的sij,然后计算得到Γi值,最后带入式(4),根据最小二乘法分析得到解析式(5),由此计算得到最佳稀疏表示系数sij:
sij=((Xi)TXi+(λ1+λ2)I)-1((Xi)Txij+λ2Γi) (5)
因此,样本xij由同类样本稀疏表示的系数可以表示为则同类所有样本的稀疏表示系数矩阵为定义所有样本X的重构关系矩阵W=diag(S1,S2,...,Sc),则任意样本xjq与样本xip的鉴别重构关系权值wpq为:
2)计算低维映射矩阵P。在最小化低维数据重构误差时,基于上述重构关系权值可以保留同类样本间的局部稀疏关系,同时,增加样本全局类内、类间约束条件,使得低维流形结构更符合高维样本空间分布。定义目标函数如下:
这里为了描述方便,不考虑样本类别,定义xi为训练样本集X中的第i个样本,wi是重构关系矩阵W中的第i个列向量,表示了样本xi与其他样本的重构关系。
定义其中,Xi是第i类样本子集,是第i类样本子集的均值矩阵,约束最小,可以使得低维子空间中各类样本子集类内紧凑。同理,定义这里是所有样本的均值矩阵,约束最大,可以进一步使得低维子空间各类样本子集类间离散。由拉格朗日乘子法,上式可以转化为求解下式的广义特征值问题:
其中Wβ=W+WT-WTW。选取前d个最大特征值对应的特征向量,构成最佳低维映射矩阵Popt=[p1,p2...,pd]。
3)实现高维样本数据的低维线性映射。
本发明DSPP分别在AR、Extended Yale B、LFW和Pubfig四个数据库上进行实验仿真,与传统经典降维方法(PCA、LDA、LPP、NPE、LSDA以及SPP) 进行结果比较和数据分析,得到以下结论:
(1)本发明在四个数据库上的识别率均高于传统经典降维方法,这说明了 DSPP可以有效提取高维、复杂、冗余数据蕴含的低维本质特征;
(2)本发明的稀疏重构时间远远小于SPP的稀疏重构时间,这说明本发明在稀疏重构阶段的改进以及快速求解稀疏重构权值的方法,可以大幅度降低算法的时间复杂度,为本发明实用化提供可能。
(3)将传统经典降维方法和本发明应用在支持向量机(SVM)、K近邻 (KNN)和稀疏表示分类(SRC)三种分类器上,发现DSPP的识别结果稳定,这说明了本发明具有很好的分类器普适性和稳定性;
(4)本发明与近期最新研究成果进行比较,非约束人脸识别率仍有一定提高,这也体现了本发明的先进性。
实验仿真:
由于AR、Extended Yale B、LFW和Pubfig数据库的人脸图像受姿态、光照、遮挡、表情等因素影响,尤其是LFW和Pubfig数据库,它们是在非约束环境下获取的,人脸图像复杂多变,因此分别在这四种数据库上进行实验仿真,能够充分验证算法的有效性和鲁棒性。人脸数据库的介绍如下:
AR数据库(Aleix Martinez and Robert Benavente database)是在严格控制外界环境条件下采集的具有不同的面部表情、照明条件和遮挡(包括太阳镜和围巾)的人脸正视图。有120类人(65男55女)同时参加了间隔14天的两次采集拍摄,共1680张人脸图像。在两阶段中,每类人每个阶段有13张图像,包括7张表情和光照有变化的无遮挡图像、6张有遮挡图像(3张太阳镜遮挡和3 张围巾遮挡)。本次实验中,选取100类人(50男50女),每类人两阶段中表情和光照有变化且无遮挡的共14张图像进行实验仿真,其中,每类人第一阶段的7张图像作为训练样本,第二阶段的7张图像作为测试样本。图像进行灰度化处理,并归一化为64*43像素大小。
Extended Yale B数据库,包含38类人的2414张脸部正视图像。在实验室控制的照明条件下,每类人大约拍摄64张照片。本次实验中,选取38类人的所有图像进行实验,随机选取每类人的20张图像作为训练样本,剩余图像作为测试样本。图像归一化为32*32像素大小。
LFW数据库(Labeled Faces in the Wild database),是从Internet上随机收集得到的,包含了在非约束环境下捕捉到的共有13233张的5749类人的人脸图像。其中,有1680类人的图像数目大于或等于两幅,图像绝大部分为彩色图像,灰度图像只占极少数。LFW中的人脸图像包含了光照、表情、姿态、遮挡、年龄、种族等多种干扰因素,几乎包括了非约束环境中所有干扰因素,对于人脸识别来说非常具有挑战性。本次实验中,我们选取有20张以上(包括20张)图像的人进行识别,得到62类人,供3023张图像进行实验仿真,其中每类人10张图像作为训练样本,剩余图像作为测试样本。对LFW数据库进行人脸检测预处理,去除背景干扰。图像归一化为128*128像素大小。
PubFig数据库(Public Figures Face Database)与LFW数据库类似,包括从互联网上采集到的200类知名人物的58797张图像。数据库中的人脸都是非约束环境下拍摄的,包含部分遮挡(眼镜、帽子等饰物)、极端光照、较大的姿势变换(>45°)、不同种族、年龄等干扰因素。本次实验中,从PubFig数据库中随机选取99类人,每类人选择20张图像进行实验仿真,其中每类人10张图像作为训练样本,剩余图像作为测试样本。同样也对PubFig数据库进行人脸检测预处理,去除背景干扰。图像归一化为128*128像素大小。四个数据库的部分样本图像如图2所示。
1.实施例DSPP与PCA、LDA、LPP、NPE、LSDA和SPP的二维可视化结果比较
考虑AR库和Extended Yale B库是实验人脸数据库(即数据库中图像是在实验环境下产生的,干扰因素单一),而LFW库和PubFig库是真实人脸数据库 (即数据库中图像是在真实环境下产生的,干扰因素复杂多变),这里以 Extended Yale B数据库和LFW数据库为例,采用PCA、LDA、LPP、NPE、 LSDA、SPP和本发明七种方法,对以上两个数据库进行降维,任选其中四类子集的二维可视化结果如图3~4所示。从图3~4中结果可以看出,无论是在实验数据库(Extended Yale B库),还是真实数据库(LFW库)上,相比其他算法,在实施例DSPP的二维可视化结果中,各类样本分布更集中,类间边界更明显,并且样本在低维投影子空间中具有明显的流形结构。
2.实施例DSPP与PCA、LDA、LPP、NPE、LSDA、SPP降维效果比较
为验证实施例DSPP相比PCA、LDA、LPP、NPE、LSDA和SPP,更能准确挖掘出隐藏在高维冗余数据中的本质特征,分别在AR、Extended Yale B、 LFW和PubFig四种数据库上进行投影降维,并使用SRC分类器进行人脸辨别。实验结果如表1~表4所示,表中罗列了七种方法在四个数据库上的最佳识别率及对应维度。为避免计算投影矩阵时的奇异性问题,首先采用PCA对原始数据进行预处理降维,要求降维后AR、Extended Yale B、LFW和PubFig数据库分别保持98%、99%、98%和95%的能量。
表1AR库中各种方法的最佳识别率(%)及其对应维度(d)
表2 Extended Yale B库中各种方法的最佳识别率(%)及其对应维度(d)
表3 LFW库中各种方法的最佳识别率(%)及其对应维度(d)
表4 PubFig库中各种方法的最佳识别率(%)及其对应维度(d)
从表1~表4中可以看出,实施例DSPP在AR、Extended Yale B、LFW和 PubFig四个数据库上的识别率分别为93.86%、95.04%、62.01%和36.16%,均高于其他算法的识别率,除了在Extended Yale B数据库上(见表2),本发明仅比NPE略低0.55%的识别率,但由图5可以看出,实施例DSPP的总体趋势仍优于NPE算法。可见,无论在实验数据库还是真实数据库上,均体现了本发明在人脸降维、识别上的优越性。尤其值得注意的是,在LFW和PubFig两个具有挑战的真实人脸数据库上,本发明具有更明显的优势,比具有第二高识别率的算法分别提升了5.71%和4.04%,比SPP算法,则提升更多。这说明,本发明可以有效克服SPP的局限性,低维映射矩阵不仅考虑了样本间的局部稀疏重构关系,而且考虑了全局分布特性,以样本稀疏关系代替欧式距离能够更准确挖掘出隐藏在复杂冗余数据中的低维流形本质结构,对准确区分受不同因素干扰的真实环境中的非约束人脸图像十分有效。
受篇幅限制,这里仅以AR库和Extended Yale B库为例,仍用SRC分类器识别不同算法的不同投影维度下的低维子空间样本,用以分析算法与投影维度的关系。不同子空间维度下算法识别率的变化趋势如图5所示。可以看出,当子空间维度较低时,随着投影维度的增加,PCA、LPP等六种经典降维算法与本发明DSPP的识别率在两个数据库上均呈明显上升趋势,并且DSPP的上升速度最快;但当子空间维度增大到一定程度时,所有算法的识别率均上升缓慢甚至保持不变,在AR库上,本发明DSPP的识别率仍高于其他六种算法,而在Extended Yale B库上,DSPP与NPE算法识别效果相当,但从曲线总体变化趋势上看,本发明仍稍胜一筹,这一结论也对表2中Extended Yale B库仿真结果做了进一步补充说明。可见,无论投影空间维度如何变化,本发明低维映射的优越性不受影响。
3.实施例DSPP与SPP的时间复杂度比较
考虑实施例DSPP和SSP算法都需要采用l1范数优化得到稀疏重构权值,时间复杂度远大于PCA、LDA、LPP、NPE等显式映射算法,因此本节主要讨论实施例DSPP和SSP的时间复杂度问题,包括稀疏重构时间tC和低维映射时间tP两部分。实验环境为2.50GHz Intel(R)Core(TM)i5-2450M CPU,4GB RAM,Win7 64位及Matlab R2013a,分别在AR库、ExtendedYale B库、LFW 库和PubFig库上进行实验仿真,结果如表5所示。
分析表中结果可知,首先,本发明DSPP和SPP算法在四个数据库上的低维映射时间tP均远远小于稀疏重构时间tC,并且它们的低维映射时间也相差不大,因此,认为本发明和SPP算法的时间复杂度主要集中在稀疏重构阶段,即式(4)~式(6)的计算时间,而数据低维投影阶段对系统运行时间影响可以忽略。其次,我们分析发现,随着数据库中训练样本个数、图像分辨率以及人的类别数增加,本发明DSPP和SPP算法的稀疏重构时间tC也随之增加,但SPP的计算复杂度是呈级数增加的,远大于DSPP的计算复杂度。例如,在LFW数据库中有62类人,每类人随机选择10个样本,则共有620个样本参与稀疏重构,图像分辨率为128*128,得到本发明DSPP的稀疏重构时间为44.23s,SPP的稀疏重构时间则为2810.23;而在PubFig数据库上,其图像分辨率以及样本选择方式与LFW数据库一样,区别仅是人的类别数增加到99种,即共有990个样本参与稀疏重构,相比LFW数据库多了370个样本,增加了59.68%,此时,本发明DSPP和SPP的稀疏重构时间分别增加到63.74s和10628.27s,即DSPP在PubFig数据库上的稀疏重构时间相比LFW数据库增加了44.11%,而SPP则增加了278.20%。可见,由于SPP算法需要对所有样本进行全局稀疏约束重构,而本发明DSPP只需在同类样本局部稀疏约束条件下,利用式(5)计算鉴别重构权值,因此,当样本数增加n倍时,本发明DSPP的稀疏重构时间近似于线性增加n倍,而SPP的稀疏重构时间则近似增加了6n倍。结合前面的结论,我们发现DSPP不仅准确描述了样本间稀疏重构关系,提高了人脸识别精度,而且相比SPP算法,大幅度降低了计算复杂度,是一种快速有效的人脸降维、识别算法,为后续算法的实用化提供研究思路。
表5在四个数据库中本发明和SPP的稀疏重构时间以及低维映射时间(s)
4.实施例DSPP与PCA、LDA、LPP、NPE、LSDA、SPP在不同分类器上识别结果比较
本节仍在AR、Extended Yale B、LFW和PubFig四个数据库上,分析不同算法采用不同分类器的识别效果,讨论算法对分类器的普适性和稳定性,进一步验证本发明提取复杂人脸数据的低维流形本质结构的准确性。
基于表1~表4得到的最佳投影维度,采用本发明和以上六种经典算法对四种数据库进行降维,然后分别在KNN、SVM和SRC三种分类器上进行人脸识别,仿真结果如表6~表9所示。对表中结果进行分析,我们发现,无论采用哪种分类器,本发明的识别效果均优于其余算法(除了在Extended Yale B库上,略低于NPE算法),并且在三个分类器上,本发明识别性能稳定,尤其体现在真实数据库上,不会因为数据复杂多变,而出现识别率大幅度上升或者下降的情况。例如,在LFW数据库上(见表8),本发明在KNN、SVM和SRC 三种分类器上的识别率分别为62.80%、62.01%和62.01%,其均值为62.27%,上下波动不超过0.46%;在PubFig数据库上(见表9),本发明的识别率也变化波动不大。而对于其他算法,它们的识别性能则受分类器影响严重,例如, NPE算法对LFW数据库进行降维,虽然在SVM分类器上取得了57.01%的识别率,仅次于本发明的识别率,但在KNN和SRC上识别率分别为32.67%和55.10%,分类效果不稳定,识别结果最大相差24.34%;并且,在PubFig数据库上,分类效果更不稳定,KNN分类器识别结果仅为6.06%,而SRC分类器识别结果则上升到25.05%。
可见,实施例DSPP相比其他经典算法具有更好的分类器普适性和稳定性,尤其是在复杂多变的真实数据库上,无论是采用基于欧式距离的传统分类器 KNN,还是采用近几年受到广泛关注的新兴分类器SRC,本发明均可以取得不错的、稳定的识别结果。这也进一步说明了,采用本发明投影真实环境中采集的非约束人脸数据,得到的低维子空间更接近真实的流形结构,揭示了数据的本质特征。
表6 AR库中不同分类方法下的识别率(%)
表7 Extended Yale B库中不同分类方法下的识别率(%)
表8 LFW库中不同分类方法下的识别率(%)
表9 PubFig库中不同分类方法下的识别率(%)
5.实施例DSPP和最新研究成果的比较
实施例DSPP与两个有代表性的最新研究成果进行比较。
2015年Gao等人在《IEEE Transactions on Image Processing》上提出一种结合稀疏表示和判别准则的降维算法(SRC-FDC),并成功应用在人脸识别问题上,在AR数据库和Extended Yale B数据库上都取得很好的识别效果。为了说明本发明的先进性,采用与文献相同的实验样本和计算方法,得到仿真结果如表10所示。其中,AR数据库有120类人,每类14张图片,随机选取每类人的 7张作为训练样本,其余剩下的样本作测试,重复10次实验,计算平均值和标准差;Extended Yale B数据库有31类人,每类人64张图片,随机选取每类人的32张作为训练样本,其余剩下的作测试,重复10次实验,计算平均值和标准差。
2016年Zhang等人在《IEEE Transactions on Image Processing》上又提出一种正交迹比优化投影算法(TR-SRC-DP),在迹比优化同时增加正交约束实现降维,同样也在AR库和Extended Yale B库上验证说明算法的有效性。AR数据库包含120类人,每类14张图片,随机选取每类人的7张作为训练样本,其余剩下的样本作测试;Extended Yale B数据库包含38类人,每类人大约64张图片,随机选取每类人的16张作为训练样本,其余剩下的样本作测试。采用与文献相同的实验样本和计算方法,得到仿真结果如表11所示。
表10本发明和SRC-FDC算法结果比较
表11本发明和TR-SRC-DP算法结果比较
从实验结果可知,相比SRC-FDC算法,实施例的DSPP在Extend Yale B 数据库上略有逊色,而相比TR-SRC-DP算法,DSPP在AR数据库和Extend Yale B数据库上均有明显提高,进一步说明了本发明的先进性。
Claims (2)
1.一种用于非约束人脸识别的判别稀疏保持投影方法,其特征在于:包括以下步骤:
1)计算重构关系矩阵W,定义样本重构关系矩阵W=diag(S1,S2,...,Sc),得到任意样本xjq与样本xip的鉴别重构关系权值wpq:
这里,i和j表示类别,p和q表示对应类别中第p个样本和第q个样本,只用当样本xjq和xip同类别且不是同样本时,wpq才有值,表示为其含义是指第i类中第q样本用第p个样本表示的稀疏权值;
2)计算低维映射矩阵P,在最小化低维子空间重构误差时,由上述重构关系保留同类样本间局部稀疏关系,同时,增加样本全局类内、类间约束条件,使得低维流形结构更符合高维样本空间分布;定义目标函数如下:
这里为了描述方便,不考虑样本类别,定义xi为训练样本集X中的第i个样本,wi是重构关系矩阵W中的第i个列向量,表示了样本xi与其他样本的重构关系;约束PTXXTP=I可以低维数据为单位正交,I为单位矩阵,T表示矩阵转置;F为Frobenius范数,定义为
定义全局类内聚合矩阵其中,Xi是第i类样本子集,是第i类样本子集的均值矩阵,约束最小,使得低维子空间中各类样本子集类内紧凑;同理,定义全局类间离散矩阵这里是所有样本的均值矩阵,约束最大,进一步使得低维子空间中各类样本子集类间离散;由拉格朗日乘子法,上式转化为求解下式的广义特征值问题:
这里Xb为全局类间离散矩阵,定义为其中为所有样本的均值矩阵,是第i类样本子集的均值矩阵,λ为拉格朗日参数;
其中Wβ=W+WT-WTW,选取前d个最大特征值对应的特征向量,构成最佳低维映射矩阵Popt=[p1,p2...,pd];
3)实现高维样本数据的低维线性映射:
。
2.如权利要求1所述的用于非约束人脸识别的判别稀疏保持投影方法,其特征在于:计算重构关系矩阵W具体为:设训练样本集X由c类样本子集X1,X2,...,Xc组成,这里m,n表示图像的大小,N为图像个数,R表示实数集;
其中第k类有nk个样本,满足共N个训练样本;任意样本xij,描述为第i类的第j个样本,求解下式目标函数得到样本xij的稀疏表示系数sij:
这里定义e=[1,1,...,1]T∈RN×1为单位向量,eT表示单位向量转置,eTsi=1约束样本xi由字典Xi稀疏表示的权重和为1;F为Frobenius范数,定义为λ1和λ2为稀疏约束比例参数,调节λ1和λ2可以使目标函数达到最优;
其中,Xi定义为除xij外且同类别的训练样本组成的字典,即ni为第i类样本的个数,Γi是与xij同类别的所有样本的稀疏表示系数平均值,最小化使相同类别的样本的稀疏表示系数接近中心值,增强同类样本类内系数的紧凑度;
为了降低计算复杂度,首先初始化均值向量Γi为零向量,优化求解同类所有样本的sij,然后计算得到Γi值,最后带入式(4)中,根据最小二乘法分析得到解析式(5),由此计算得到最佳稀疏表示系数sij:
sij=((Xi)TXi+(λ1+λ2)I)-1((Xi)Txij+λ2Γi) (5)
可见,样本xij由同类样本稀疏表示的系数表示为则同类样本的稀疏表示系数矩阵为
定义样本重构关系矩阵W=diag(S1,S2,...,Sc),则任意样本xjq与样本xip的鉴别重构关系权值wpq为:
这里,i和j表示类别,p和q表示对应类别中第p个样本和第q个样本;只用当样本xjq和xip同类别且不是同样本时,wpq才有值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710969273.0A CN108647690B (zh) | 2017-10-17 | 2017-10-17 | 基于判别稀疏保持投影的非约束人脸图像降维方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710969273.0A CN108647690B (zh) | 2017-10-17 | 2017-10-17 | 基于判别稀疏保持投影的非约束人脸图像降维方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108647690A true CN108647690A (zh) | 2018-10-12 |
CN108647690B CN108647690B (zh) | 2021-12-31 |
Family
ID=63744021
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710969273.0A Active CN108647690B (zh) | 2017-10-17 | 2017-10-17 | 基于判别稀疏保持投影的非约束人脸图像降维方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108647690B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109598218A (zh) * | 2018-11-23 | 2019-04-09 | 南通大学 | 一种车型的快速识别方法 |
CN109615026A (zh) * | 2018-12-28 | 2019-04-12 | 中国电子科技集团公司信息科学研究院 | 一种基于稀疏规则化的判别投影方法以及图像识别装置 |
CN110046669A (zh) * | 2019-04-22 | 2019-07-23 | 广东石油化工学院 | 基于素描图像的半耦合度量鉴别字典学习的行人检索方法 |
CN110210443A (zh) * | 2019-06-11 | 2019-09-06 | 西北工业大学 | 一种优化投影对称性近似稀疏分类的手势识别方法 |
CN110648276A (zh) * | 2019-09-25 | 2020-01-03 | 重庆大学 | 基于流形映射与字典学习的高维图像数据降维方法 |
CN110991566A (zh) * | 2019-12-26 | 2020-04-10 | 东北石油大学 | 通过信息融合方式进行风力发电机故障诊断的方法和装置 |
CN111611963A (zh) * | 2020-05-29 | 2020-09-01 | 扬州大学 | 一种基于近邻保持典型相关分析的人脸识别方法 |
CN111723759A (zh) * | 2020-06-28 | 2020-09-29 | 南京工程学院 | 基于加权张量稀疏图映射的非约束人脸识别方法 |
CN111783615A (zh) * | 2020-06-28 | 2020-10-16 | 南京工程学院 | 基于加权块张量稀疏图映射的非约束人脸识别方法 |
CN115019368A (zh) * | 2022-06-09 | 2022-09-06 | 南京审计大学 | 一种基于2desdlpp的审计调查中人脸识别特征提取方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102156878A (zh) * | 2011-04-08 | 2011-08-17 | 南京邮电大学 | 一种基于带有流形信息稀疏映射的人脸识别方法 |
US20120257798A1 (en) * | 2011-04-11 | 2012-10-11 | King Fahd University Of Petroleum And Minerals | Method of performing facial recognition using genetically modified fuzzy linear discriminant analysis |
CN107194329A (zh) * | 2017-05-05 | 2017-09-22 | 南京航空航天大学 | 一种基于自适应局部稀疏保持投影的一维距离像识别方法 |
-
2017
- 2017-10-17 CN CN201710969273.0A patent/CN108647690B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102156878A (zh) * | 2011-04-08 | 2011-08-17 | 南京邮电大学 | 一种基于带有流形信息稀疏映射的人脸识别方法 |
US20120257798A1 (en) * | 2011-04-11 | 2012-10-11 | King Fahd University Of Petroleum And Minerals | Method of performing facial recognition using genetically modified fuzzy linear discriminant analysis |
CN107194329A (zh) * | 2017-05-05 | 2017-09-22 | 南京航空航天大学 | 一种基于自适应局部稀疏保持投影的一维距离像识别方法 |
Non-Patent Citations (3)
Title |
---|
冯海亮 等: "基于稀疏相似保持算法的人脸识别", 《光电工程》 * |
杜春 等: "基于稀疏表示和非参数判别分析的降维算法", 《国防科技大学学报》 * |
杨艺芳 等: "一种鉴别稀疏局部保持投影的人脸识别算法", 《西安交通大学学报》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109598218A (zh) * | 2018-11-23 | 2019-04-09 | 南通大学 | 一种车型的快速识别方法 |
CN109598218B (zh) * | 2018-11-23 | 2023-04-18 | 南通大学 | 一种车型的快速识别方法 |
CN109615026A (zh) * | 2018-12-28 | 2019-04-12 | 中国电子科技集团公司信息科学研究院 | 一种基于稀疏规则化的判别投影方法以及图像识别装置 |
CN110046669A (zh) * | 2019-04-22 | 2019-07-23 | 广东石油化工学院 | 基于素描图像的半耦合度量鉴别字典学习的行人检索方法 |
CN110210443B (zh) * | 2019-06-11 | 2022-03-15 | 西北工业大学 | 一种优化投影对称性近似稀疏分类的手势识别方法 |
CN110210443A (zh) * | 2019-06-11 | 2019-09-06 | 西北工业大学 | 一种优化投影对称性近似稀疏分类的手势识别方法 |
CN110648276A (zh) * | 2019-09-25 | 2020-01-03 | 重庆大学 | 基于流形映射与字典学习的高维图像数据降维方法 |
CN110991566B (zh) * | 2019-12-26 | 2022-09-27 | 东北石油大学 | 通过信息融合方式进行风力发电机故障诊断的方法和装置 |
CN110991566A (zh) * | 2019-12-26 | 2020-04-10 | 东北石油大学 | 通过信息融合方式进行风力发电机故障诊断的方法和装置 |
CN111611963A (zh) * | 2020-05-29 | 2020-09-01 | 扬州大学 | 一种基于近邻保持典型相关分析的人脸识别方法 |
CN111611963B (zh) * | 2020-05-29 | 2023-12-26 | 扬州大学 | 一种基于近邻保持典型相关分析的人脸识别方法 |
CN111723759A (zh) * | 2020-06-28 | 2020-09-29 | 南京工程学院 | 基于加权张量稀疏图映射的非约束人脸识别方法 |
CN111783615A (zh) * | 2020-06-28 | 2020-10-16 | 南京工程学院 | 基于加权块张量稀疏图映射的非约束人脸识别方法 |
CN111723759B (zh) * | 2020-06-28 | 2023-05-02 | 南京工程学院 | 基于加权张量稀疏图映射的非约束人脸识别方法 |
CN111783615B (zh) * | 2020-06-28 | 2023-08-22 | 南京工程学院 | 基于加权块张量稀疏图映射的非约束人脸识别方法 |
CN115019368A (zh) * | 2022-06-09 | 2022-09-06 | 南京审计大学 | 一种基于2desdlpp的审计调查中人脸识别特征提取方法 |
CN115019368B (zh) * | 2022-06-09 | 2023-09-12 | 南京审计大学 | 一种审计调查中人脸识别特征提取方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108647690B (zh) | 2021-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108647690A (zh) | 用于非约束人脸识别的判别稀疏保持投影方法 | |
CN109670528B (zh) | 面向行人重识别任务的基于成对样本随机遮挡策略的数据扩充方法 | |
Kakadiaris et al. | 3D-2D face recognition with pose and illumination normalization | |
CN105205449B (zh) | 基于深度学习的手语识别方法 | |
CN109241813A (zh) | 用于非约束人脸识别的判别稀疏保持嵌入方法 | |
CN107862267A (zh) | 基于完全对称局部韦伯描述子的人脸识别特征提取算法 | |
CN111191737A (zh) | 基于多尺度反复注意力机制的细粒度图像分类方法 | |
CN108509925B (zh) | 一种基于视觉词袋模型的行人重识别方法 | |
CN107292299B (zh) | 基于内核规范相关分析的侧面人脸识别方法 | |
CN109948467A (zh) | 人脸识别的方法、装置、计算机设备和存储介质 | |
CN107341505B (zh) | 一种基于图像显著性与Object Bank的场景分类方法 | |
Clarke et al. | Perceptual similarity: A texture challenge. | |
CN111723759B (zh) | 基于加权张量稀疏图映射的非约束人脸识别方法 | |
CN106503633A (zh) | 一种视频图像中人脸特征库的建立方法 | |
CN107832786A (zh) | 一种基于字典学习的人脸识别分类方法 | |
CN108664941B (zh) | 基于测地映射分析的核稀疏描述人脸识别方法 | |
CN105608443B (zh) | 一种多特征描述及局部决策加权的人脸识别方法 | |
Xu et al. | Generalized morphological component analysis for hyperspectral unmixing | |
CN109766748A (zh) | 一种基于投影变换与字典学习的行人再识别的方法 | |
Liu et al. | TCvBsISM: Texture classification via B-splines-based image statistical modeling | |
CN109902692A (zh) | 一种基于局部区域深度特征编码的图像分类方法 | |
CN106022373B (zh) | 一种基于广义均值典型相关分析的图像识别方法 | |
Zhang et al. | Research On Face Image Clustering Based On Integrating Som And Spectral Clustering Algorithm | |
CN108510080A (zh) | 一种基于dwh模型对多关系型数据的多角度度量学习方法 | |
Li et al. | Multi-level Fisher vector aggregated completed local fractional order derivative feature vector for face recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |