CN108121964B - 基于矩阵的联合稀疏局部保持投影人脸识别方法 - Google Patents
基于矩阵的联合稀疏局部保持投影人脸识别方法 Download PDFInfo
- Publication number
- CN108121964B CN108121964B CN201711394265.4A CN201711394265A CN108121964B CN 108121964 B CN108121964 B CN 108121964B CN 201711394265 A CN201711394265 A CN 201711394265A CN 108121964 B CN108121964 B CN 108121964B
- Authority
- CN
- China
- Prior art keywords
- matrix
- feature extraction
- projection
- js2dlpp
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/513—Sparse representations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于矩阵的联合稀疏局部保持投影人脸识别方法,由于核范数度量的是矩阵奇异值之和,对数据的变化具有更强的鲁棒性,所以本发明利用核范数作为基本的度量来增强2D‑LPP的鲁棒性。传统的特征提取方法并没有考虑投影矩阵的稀疏性。虽然基于L1的方法能够学习到稀疏的投影,但其并不具有联合稀疏的特性。本方法利用具有联合稀疏特性的L2,1范数作为正则项,能有效地学习到联合稀疏鉴别投影,从而进行有效的特征提取与选择。实验证明本发明的方法能有效地改进2D‑LPP中存在的鲁棒性并实现联合稀疏特征提取与选择。
Description
技术领域
本发明涉及图像识别技术领域,尤其涉及一种基于矩阵的联合稀疏局部保持投影人脸识别方法。
背景技术
人脸识别的研究开始于20世纪60年代,在那个时候,由于计算机处理能力有限,算法不成熟,人脸识别系统的能力非常有限。80年代后,随着计算机和成像技术的发展,人脸识别技术得到不断的发展。在科技大爆发的背景之下,近十年来研究这门课题的人员也是愈来愈多,人脸识别在人机交互、公共场所安全监控方面表现得颇有前景。在自动化处理当中,数字图像处理是重要的组成部分,并且在人工智能方面,很多功能是是通过数字图像的处理来实现的。
特征提取是人脸识别中一个重要的组成部分。特征提取是通过一定的计算方式得到了对一张图片最有效果的描述抽象表示。到目前为止,已有许多有效的特征提取方法,最为常见的两种是主成分分析(PCA)和线性鉴别分析(Linear Discriminant Analysis,LDA)。PCA是至今为止使用最广泛的特征提取方法,它能找出最能够代表原始数据的投影方法,但是PCA 的缺陷是,它的图像矩阵必须线性地排列成一个高维的向量,然而这样容易使损坏人脸结构信息。LDA的核心思想是寻找最佳的投影方向,使得不同类型的样本尽可能分离,同类型样本尽可能靠近,即最大化类间距离,同时最小化类内距离。但是LDA算法在实践中往往会遇到小样本问题(样本的数量小于图片的维数)。另外,有学者提出了一种局部保持的投影方法 (LPP),并将其应用于人脸识别领域。LPP能在低维空间保持原始数据在高维空间的局部结构特性,从而进行更有效的特征提取以及识别。
为了解决小样本问题,基于图像矩阵的二维主成分分析 (Two-dimensionalPrincipal Component Analysis,2D-PCA)、二维线性鉴别分析(Two-dimensional LinearDiscriminant Analysis,2D-LDA)和二维局部保持投影方法(2D-LPP)这三个方法应运而生,从而衍生了一系列的基于二维图像的人脸识别方法。
以上介绍的传统的学习模型不太适合于部分特征提取问题,其中原因如下:①这三个算法没有考虑其他因素对人脸识别的影响,比如阴影、光照等,因此在这些因素下它的识别率将会下降,因此我们利用核范数来完成度量图像之间相似性的工作。②“维数灾难”在人脸识别中是很容易出现的,因此对该算法的要求的计算量很高,而且还会占据大量的存储空间,所以本发明将基于向量的特征提取方法改进成基于图像的方法。
本发明引入非专利文献1:Fornasier M,Rauhut H,Ward R.Low-rank matrixrecovery via iteratively reweighted least squares minimization[J].SIAMJournal on Optimization,2011,21(4):1614-1640.
非专利文献2:Zou H,Hastie T,Tibshirani R.Sparse principal componentanalysis[J].Journal of computational and graphical statistics,2006,15(2):265-286.
发明内容
为了解决现有技术中的问题,本发明提出了一种基于矩阵的联合稀疏局部保持投影人脸识别方,利用基于图像矩阵的核范数的局部保持投影方法并且加入L2,1正则范数进行联合稀疏学习,进一步提升人脸识别识别率。
本发明具体通过如下技术方案实现:
一种基于矩阵的联合稀疏局部保持投影人脸识别方法,所述方法基于图像矩阵的联合稀疏二维局部保持投影特征提取算法JS2DLPP实现,首先练样本序列通过本发明的JS2DLPP特征提取算法进行投影矩阵学习和特征提取。所提取的特征矩阵用于对分类器进行训练。然后,测试样本序列通过学习到的投影矩阵A进行提取特征后输入到分类器,最终得到识别结果;其中,所述JS2DLPP特征提取算法利用迭代来求解其最优投影,包括如下关键步骤:
Step1:输入s张图像,即样本X=[X1,X2,..Xi..,Xs],迭代次数为T,正则项参数α,降维数r;
Step2:初始化B,W,D,A为单位矩阵;X∈Rm×n×s,Gij∈Rm×m,D∈Rn×n,其中A,B∈Rn×r,m为图像矩阵的行,n为图像矩阵的列,Gij是求解范数时候的权值矩阵;
Step3:给定矩阵B,利用下式求解出A:
其中Wij为第i和j个图像矩阵Xi,Xj之间的权值,
Step4:给定矩阵A,利用下式求解出B:
B=UVT,
Step5:利用下式更新Gij:
Gij=[(WijXi-WijXjABT)(WijXi-WijXjABT)T]-1/4;
Step6:判断迭代循环次数是否为T,如果不是则返回到步骤Step3,如果是则到步骤Step7;
Step7:输出Yi=XiA。
本发明的有益效果是:本发明基于2DLPP提出了基于图像矩阵的联合稀疏局部保持投影方法,与2DLPP相比,本发明的方法能够提高算法的鲁棒性,从而更稳定地应用到多种实际情况;传统的特征提取方法并没有考虑投影矩阵的稀疏性。虽然基于L1的方法能够学习到稀疏的投影,但其并不具有联合稀疏的特性。本发明利用具有联合稀疏特性的L2,1范数作为正则项,能有效地学习到联合稀疏鉴别投影,从而进行有效的特征提取与选择。
附图说明
图1是本发明的算法流程图;
图2是实验中使用的FERET人脸数据库样本图像;
图3是实验中使用的ORL人脸数据库样本图像;
图4(a)是FERET数据库中平均识别率(%)相对于维数的变化;
图4(b)是添加15×15阴影块后的FERET数据库中平均识别率(%) 相对于维数的变化;
图5(a)是ORL数据库中平均识别率(%)相对于维数的变化;
图5(b)是添加15×15阴影块后的ORL数据库中平均识别率(%)相对于维数的变化。
具体实施方式
下面结合附图说明及具体实施方式对本发明进一步说明。
本发明的人脸识别方法基于图像矩阵的联合稀疏二维局部保持投影特征提取方法(Joint Sparse Two-dimensional Locality Preserving Projection,简称JS2DLPP)实现,如图1所示,首先练样本序列通过本发明的JS2DLPP 特征提取算法进行投影矩阵学习和特征提取。所提取的特征矩阵用于对分类器进行训练。然后,测试样本序列通过学习到的投影矩阵A进行提取特征后输入到分类器,最终得到识别结果。
矩阵的核范数是矩阵所有奇异值的总和。由于核范数相对于L 1和L 2范数而言更加适用于刻画由光照引起的结构化噪声。这便鼓励我们使用核范数来度量重构误差的矩阵。因此,本发明利用核范数作为2D-LPP的度量。于是N-2-DLPP的目标函数可以定义为:
其中A,B∈Rn×r,Xi,Xj∈Rm×n,m代表图像矩阵的行,n代表图像矩阵的列,Xi, Xj表示为第i和j个图像矩阵。Wij代表数据点之间的权值,与LPP的数量一样,||.||*代表核范数。受到非专利文献1的启发,我们可以把核范数最优化问题转化成为F范数(L2范数)最优化问题。首先给出如下引理:
引理1:对于矩阵Z∈Rp×q,有
由引理1,目标函数的模型(1)可以重新写为:
其中Gij是求解范数时候的权值矩阵,它的定义为
Gij=[(WijXi-WijXjABT)(WijXi-WijXjABT)T]-1/4 (4)
为了得到联合稀疏的解,我们对投影矩阵添加L2,1范数正则项,最后得到如下目标函数:
对于模型(5)经过计算我们得到
然后我们在对方程(6)进行处理,假设B不变,对A求导,并且令式子等于0有
于是解得
从而根据理论我们可以根据非专利文献2中的定理4,上述问题可以利用奇异值分解方法得到
则最优的B为
B=UVT (11)
其中的U为奇异值分解的左奇异向量,V为奇异值分解的右奇异向量。
下面给出利用迭代算法来求解JS2D-LPP的最优投影的关键步骤:
Step1:输入s张图像,即样本X=[X1,X2,..Xi..,Xs],迭代次数为T,正则项参数α,降维数r;
Step2:初始化B,W,D,A为单位矩阵。X∈Rm×n×s,Gij∈Rm×m,D∈Rn×n,其中A,B∈Rn×r,m为图像矩阵的行,n为图像矩阵的列,Gij是求解范数时候的权值矩阵;
Step3:给定矩阵B,利用下式求解出A:
其中Wij为第i和j个图像矩阵Xi,Xj之间的权值,
Step4:给定矩阵A,利用下式求解出B:
B=UVT,
Step5:利用下式更新Gij:
Gij=[(WijXi-WijXjABT)(WijXi-WijXjABT)T]-1/4;
Step6:判断迭代循环次数是否为T,如果不是则返回到步骤Step3,如果是则到步骤Step7;
Step7:输出Yi=XiA。
接下来,本发明将用四种不同的特征提取方法在FERET和ORL数据库(当然也可以选择PIE和Yale数据库)中进行实验,实验所选部分样本如图2和图3所示。四种不同的特征提取方法包括2DPCA(二维主成分分析)、2DLPP(二维局部保持投影)、LPP(局部保持投影)和本发明来的模型JS2DLPP(基于图像矩阵的联合稀疏局部保持投影)。在FERET和 ORL数据库中分别运行JS2DLPP、LPP、2DPCA、2DLPP算法,分别进行 10次实验,再求这10次实验的平均识别率作为该方法在这个数据集的图像识别结果。
表1各种特征提取方法在FERET和ORL数据库中的最高识别率
图4(a)展示的是在FERET数据库中各种特征提取方法识别率的比较情况。图4(b)展示的是在FERET数据库加入15×15阻挡块后,各种特征提取方法识别率的比较情况。从图4(a)看出,在FERET数据库中, JS2DLPP的识别率要比2DLPP高,而与2DPCA相当。从图4(b)看出,在FERET数据库中加入15×15随机遮挡块后,JS2DLPP的识别率最高。对比这些结果可以看出,JS2DLPP在有图像遮挡等干扰下具有好的鲁棒性,从而验证了基于核范数的JS2DLPP要比基于F范数的方法更具鲁棒性。
图5(a)展示的是在ORL数据库中各种特征提取方法识别率的比较情况。图5(b)展示的是在ORL数据库加入15×15随机遮挡块后,各种特征提取方法识别率的比较情况。图5(a)表明,在对ORL数据库中的原始图像进行识别时,JS2DLPP算法识别率是最高的方法。而图5(b)表明,在样本图片加入了15×15随机遮挡块以后,JS2DLPP明显要比其他算法要好,并且在低维度的时候,识别率就能达到最高,这再一次说明 JS2DLPP具有更强的特征提取能力与鲁棒性,并能在更低维的空间里获得更高的识别率。
在表1中,我们可以看到在FERET数据库中JS2DLPP的识别率是比普通的基于二维图像的局部保留投影(2DLPP)的算法要高,鲁棒性也比它好。在ORL数据库中,加入了15×15随机遮挡块后,其他方法识别率已经降得很低,然而JS2DLPP还可以维持在高水平的识别率,说明JS2DLPP 在抗干扰的情况下鲁棒性强。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (1)
1.一种基于矩阵的联合稀疏局部保持投影人脸识别方法,其特征在于:所述方法基于图像矩阵的联合稀疏二维局部保持投影特征提取算法JS2DLPP实现,首先训练样本序列通过采用所述JS2DLPP特征提取算法进行投影矩阵学习和特征提取,所提取的特征矩阵用于对分类器进行训练;然后,测试样本序列通过采用学习到的投影矩阵A进行提取特征后输入到分类器,最终得到识别结果;其中,所述JS2DLPP特征提取算法利用迭代来求解其最优投影,包括如下关键步骤:
Step1:输入s张图像,即样本X=[X1,X2,..Xi..,Xs],迭代次数为T,正则项参数α,降维数r;
Step2:初始化B、W、D、A,B、W、D、A为单位矩阵,X∈Rm×n×s,Gij∈Rm×m,D∈Rn×n,其中A,B∈Rn ×r,m为图像矩阵的行,n为图像矩阵的列,Gij是求解范数时候的权值矩阵,r为降维数;
Step3:给定矩阵B,利用下式求解出A:
其中Wij为第i和j个图像矩阵Xi,Xj之间的权值,
Step4:给定矩阵A,利用下式求解出B:
B=UVT,
Step5:利用下式更新Gij:
Gij=[(WijXi-WijXjABT)(WijXi-WijXjABT)T]-1/4;
Step6:判断迭代循环次数是否为T,如果不是则返回到步骤Step3,如果是则到步骤Step7;
Step7:输出Yi=XiA。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711394265.4A CN108121964B (zh) | 2017-12-21 | 2017-12-21 | 基于矩阵的联合稀疏局部保持投影人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711394265.4A CN108121964B (zh) | 2017-12-21 | 2017-12-21 | 基于矩阵的联合稀疏局部保持投影人脸识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108121964A CN108121964A (zh) | 2018-06-05 |
CN108121964B true CN108121964B (zh) | 2020-04-21 |
Family
ID=62230907
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711394265.4A Active CN108121964B (zh) | 2017-12-21 | 2017-12-21 | 基于矩阵的联合稀疏局部保持投影人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108121964B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110197204A (zh) * | 2019-05-09 | 2019-09-03 | 北京工业大学 | 一种局部保持投影的图像识别方法 |
CN110443255B (zh) * | 2019-06-14 | 2022-04-15 | 深圳大学 | 用于图像特征提取的图像识别方法 |
CN112115881B (zh) * | 2020-09-21 | 2023-09-26 | 国网重庆市电力公司长寿供电分公司 | 基于鲁棒鉴别特征学习的图像特征提取方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7376282B2 (en) * | 2003-11-20 | 2008-05-20 | Xerox Corporation | Method for designing nearly circularly symmetric descreening filters that can be efficiently implemented in VLIW (very long instruction word) media processors |
CN103390154A (zh) * | 2013-07-31 | 2013-11-13 | 中国人民解放军国防科学技术大学 | 基于进化多特征提取的人脸识别方法 |
US9239268B1 (en) * | 2014-07-14 | 2016-01-19 | Asml Netherlands B.V. | Calibration of photoelectromagnetic sensor in a laser source |
CN107145841B (zh) * | 2017-07-20 | 2021-08-10 | 深圳大学 | 一种基于矩阵的低秩稀疏人脸识别方法及其系统 |
-
2017
- 2017-12-21 CN CN201711394265.4A patent/CN108121964B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN108121964A (zh) | 2018-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107122809B (zh) | 基于图像自编码的神经网络特征学习方法 | |
Chen et al. | A cascaded convolutional neural network for age estimation of unconstrained faces | |
CN109522956B (zh) | 一种低秩判别特征子空间学习方法 | |
CN108256486B (zh) | 一种基于非负低秩和半监督学习的图像识别方法及装置 | |
Chen et al. | 3D object tracking via image sets and depth-based occlusion detection | |
CN107145841B (zh) | 一种基于矩阵的低秩稀疏人脸识别方法及其系统 | |
CN108121964B (zh) | 基于矩阵的联合稀疏局部保持投影人脸识别方法 | |
Hara et al. | Computationally efficient regression on a dependency graph for human pose estimation | |
Peng et al. | Correntropy based graph regularized concept factorization for clustering | |
CN109871880A (zh) | 基于低秩稀疏矩阵分解、局部几何结构保持和类别信息最大统计相关的特征提取方法 | |
Jin et al. | Multiple graph regularized sparse coding and multiple hypergraph regularized sparse coding for image representation | |
CN111695455B (zh) | 一种基于耦合判别流形对齐的低分辨人脸识别方法 | |
CN111325275A (zh) | 基于低秩二维局部鉴别图嵌入的鲁棒图像分类方法及装置 | |
Zhang et al. | Robust tensor decomposition for image representation based on generalized correntropy | |
CN108388918B (zh) | 具有结构保持特性的数据特征选择方法 | |
Zhu et al. | LIGAA: Generative adversarial attack method based on low-frequency information | |
You et al. | Robust structure low-rank representation in latent space | |
Kong et al. | Projection-preserving block-diagonal low-rank representation for subspace clustering | |
CN110443169B (zh) | 一种边缘保留判别分析的人脸识别方法 | |
Wei et al. | Spectral clustering steered low-rank representation for subspace segmentation | |
CN108121965B (zh) | 基于鲁棒联合稀疏特征提取的图像识别方法 | |
Chekir | A deep architecture for log-Euclidean Fisher vector end-to-end learning with application to 3D point cloud classification | |
Wang et al. | Partial sum minimization of singular values representation on grassmann manifolds | |
Ji et al. | A fast face detection method combining skin color feature and adaboost | |
Bi et al. | Generalized robust graph-Laplacian PCA and underwater image recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |