CN108664941B - 基于测地映射分析的核稀疏描述人脸识别方法 - Google Patents
基于测地映射分析的核稀疏描述人脸识别方法 Download PDFInfo
- Publication number
- CN108664941B CN108664941B CN201810469578.XA CN201810469578A CN108664941B CN 108664941 B CN108664941 B CN 108664941B CN 201810469578 A CN201810469578 A CN 201810469578A CN 108664941 B CN108664941 B CN 108664941B
- Authority
- CN
- China
- Prior art keywords
- geodesic
- space
- feature
- mapping
- gma
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000013507 mapping Methods 0.000 title claims abstract description 40
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000004458 analytical method Methods 0.000 title claims abstract description 24
- 239000013598 vector Substances 0.000 claims abstract description 34
- 238000005457 optimization Methods 0.000 claims abstract description 8
- 239000011159 matrix material Substances 0.000 claims description 29
- 238000012360 testing method Methods 0.000 claims description 22
- 238000012549 training Methods 0.000 claims description 18
- 230000009467 reduction Effects 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000005259 measurement Methods 0.000 claims description 5
- 238000000513 principal component analysis Methods 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 5
- 230000002349 favourable effect Effects 0.000 claims description 2
- 230000017105 transposition Effects 0.000 claims description 2
- 230000014509 gene expression Effects 0.000 abstract description 13
- 230000008859 change Effects 0.000 abstract description 9
- 230000036544 posture Effects 0.000 description 9
- 238000011160 research Methods 0.000 description 4
- 230000000903 blocking effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2136—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on sparsity criteria, e.g. with an overcomplete basis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于测地映射分析的核稀疏描述人脸识别方法,通过两个像素点得到其连通黎曼流形的唯一测地线,通过对数和指数映射将测地线投影到切向空间,从而获取更具辨别力的分类特征,能够较好地适应人脸的特殊曲面结构,可以准确地测量出人脸图像在表情、姿态和重度遮挡条件下两个像素点的真实距离,通过非线性映射将切向空间中的数据向量转换为较高维特征空间,引入核函数对稀疏特征空间进行建模,并在非线性稀疏空间中求解L1范数的优化问题实现人脸的准确分类,大大降低了复杂条件变化对识别性能的影响,使算法更具鲁棒性,解决了现有人脸识别系统在非控制环境下易受姿态、表情和遮挡变化影响的问题。
Description
技术领域:
本发明涉及一种面部识别领域,特别是涉及一种基于测地映射分析的核稀疏描述人脸识别方法。
背景技术:
人脸识别是当前机器视觉和人工智能领域的研究热点,也是信息安全和社会安全的重要认证手段。近年来,大量研究文献将高维测试人脸图像投影到低维特征空间,如特征脸(Eigenfaces),Fisher脸(Fisherfaces),拉普拉斯脸(Laplacianfaces)等,所有这些算法都要求测试样本必须裁剪适当、对齐、并与训练样本具有相同的规模大小。然而,人脸检测器的实际输出既不对准也不受限制,并且在规模上变化较大,对这些数据进行分类识别非常具有挑战性。
稀疏描述在目标跟踪及识别领域受到极大的关注,基于稀疏描述的人脸识别是一种根据人脸的全局信息进行分类识别的方法,虽然稀疏描述的模型简单,但对光照变化和有遮挡人脸的识别具有较强的鲁棒性;但是该类算法忽略了人脸局部特征对识别效果的影响,还需要测试样本与训练样本人脸要严格对齐,当存在表情和姿态变化时,其识别效果会明显下降。现有技术中也存在与人脸稀疏的研究,但是其均存在不足之处,有研究的是人类对视觉的感知是稀疏模型;有提出一种人脸稀疏描述建模方法;有的是没有将人脸表示为一个矢量,提出了区域协方差矩阵概念;有的是提出了针对主成分测地分析(PGA)的协方差描述符的降维方法,该描述符对于对齐和尺度变化是稳健的,而该描述符属于非向量对称空间,对其进行稀疏描述是不可行的;大量的研究表明,最稀疏的解对于人脸的分类是有效的,因为每个人脸都紧凑地表示为其训练集的线性组合,如果训练集很大,这样的紧凑表示是非常有用的。稀疏描述问题可以在压缩感知环境下引入L1最小化或基追踪来有效地解决。
此外,绝大多数文献采用欧氏距离作为人脸相似度量指标,但其在人脸姿态和表情变化时误差较大。
发明内容:
本发明所要解决的技术问题是:克服现有技术的不足,提供一种通过计算两个像素点间的测地距离来度量相似性,然后对提取的GMA特征进行核稀疏描述建模,并在非线性空间中实现特征的分类识别,对重度遮挡、姿态和表情变化的自由形式人脸图像具有更高识别率的基于测地映射分析的核稀疏描述人脸识别方法。
本发明的技术方案是:一种基于测地映射分析的核稀疏描述人脸识别方法,
1)、把人脸图像分成无数个像素点和无数条弧线,并在无数条弧线围成的区域内选择任意两个像素点,且其中一个作为参考点;
2)、连通黎曼流形的两点之间的距离是连接两点的曲线长度的最小值,实现最小值的曲线即为测地线;
3)、通过对数和指数映射将通过参考点的测地线变换成切向空间上的直线,保持与曲线相似的距离,通过主要测地分析,获得用于人脸识别的GMA分类特征;
4)、使用非线性模型进行稀疏描述,通过非线性映射将切向空间中的数据向量转换为较高维特征空间;
5)、使用内核技巧在GMA特征空间实现稀疏建模;
主要测地分析是欧几里德空间主成分分析的泛化和扩展;设φ是从输入空间TμM到特征空间F的任意非线性映射,即φ:TμM→F。
步骤3)中:根据微分方程理论,通过参考点x,x∈M,必然存在一条最短的测地弧,即是测地线,其切线向量为TXM为切向空间;将切线向量映射到测地线从x到流形上的点的函数称为指数映射,如下式所示:
Expx:TXM→M (1)
其中Υ(l)为测地线,将TXM的原点映射到x点,即Expx(0)=x;对于每个像素点x∈M,在TXM到邻域间存在指数映射的逆运算Logx=Expx -1,被称为对数映射。
步骤3)中:主要测地分析是欧几里德空间主成分分析的泛化和扩展,像素点集合的平均值为μ,由最小化平方距离函数之和给出:
其中,为均值向量,xi为集合M中的像素点,d(x,y)=||logx(y)||表示黎曼度量:
通过梯度下降算法来计算平均值:
步骤3)中:流形中的测地曲线是线性空间中直线的泛化,像素点x在测地子流形H上的投影是黎曼度量上最接近于x的点,由式(5)给出:
πH(x)=argminy∈Hd(x,y)2 (5)
给定一组像素点x1,x2,x3,…xn∈M,找到一个测地子流形,使得数据的投影方差最大化,其通过获取跨越切向空间TXM的切向量正交基ζ1,ζ2,...,ζd实现。
步骤3)中:训练集的协方差描述符表示为计算点的平均值μ,特征被映射到切向空间获得计算主要测地线分量以获得ζ1,ζ2,...,ζd,从而生成新的主投影特征:
其中,系数λi,k计算如下:
将样本i的GMA特征vi定义为:
将测试数据投影到测地子流形H上以获得用于人脸识别的GMA分类特征,其使用以下度量:
其中,为主投影特征,pt为协方差矩阵,令ki为和pt的广义特征值,得:
其中,d为广义特征值的ki数量。
步骤4)和步骤5)中:实现基于测地映射分析GMA有效特征提取,是以测地距离为度量依据,通过对数和指数映射将测试数据投影到切向空间,从而获取更具辨别力的分类特征;设φ是从输入空间TμM到特征空间F的任意非线性映射,即φ:TμM→F;c是类的数量,vj,k是第k个训练样本图像的第j个GMA特征,ni是样本i的图像数量,n=n1+n2+n3+…+nc是总的图像数量,l是测试图像的GMA特征,训练图像的GMA特征变换矩阵为ψ=[φ(v1,1),φ(v2,1),φ(vn1,1)…φ(vnc,c)],能够将变换后的测试向量φ(l)表示为:
φ(l)=ψα (16)
其中,ψ为GMA特征变换矩阵,α为样本的稀疏表示,由于式(16)是超定的,维数很高,能够利用核降维技术转化为欠定问题,有利于高效地执行高维度的计算:
RTφ(l)=RTψα (17)
其中R是切向空间TXM降维后的矩阵,T表示矩阵的转置,令Cφ为特征空间的协方差矩阵:
其中vi为GMA特征向量,前d个最大特征值表示为u1,u2,...,ud,将对应于非零特征值的所有特征向量转换训练样本的线性组合:
其中,列向量[βk,1…βk,n]T是第k个特征向量描述,可得:
对于式(20)两边都乘以φ(vr)T能够简化为以下矩阵形式:
其中,λ为正则化参数,K为核格拉姆矩阵Ki,j=φ(vi)T,则:
Kβ=nλβ (25)
则核降维投影矩阵为R=[u1u2…ud],其中第k个特征向量为因此式(17)能够转化为:
[u1u2...ud]Tφ(l)=[u1u2...ud]Tψα (26)
上式能够简化为:
Rβω=RβKα (29)
其中ω=[φ(v1)Tφ(l)......φ(vn)Tφ(l)]T,Rβ为核降维矩阵;
如果α的解足够稀疏,求解L0范数的最小化就等价于求解如下L1范数的优化问题:
满足RβKα=Rβω (30)
其中,根据噪声对稀疏模型的影响,进一步修改优化问题。
本发明的有益效果是:
1、本发明通过计算两个像素点间的测地距离来度量相似性,然后对提取的GMA特征进行核稀疏描述建模,并在非线性空间中实现特征的分类识别,对重度遮挡、姿态和表情变化的自由形式人脸图像具有更高的识别率,大大提高了人脸识别系统应对真实复杂环境的能力。
2、本发明提出了基于测地映射分析(Geodesic Mapping Analysis,GMA)的特征提取方法,由于人脸图像是由无数个像素点和无数条弧线构成,用测地映射分析模型适应人脸这一特殊曲面结构,可以准确地测量出人脸图像在表情、姿态和重度遮挡条件下两个像素点的真实距离,大大降低了复杂条件变化对识别性能的影响。
3、本发明通过非线性模型通过提供丰富的特征描述来捕获高于二阶的高阶统计量,并利用这一点实现有效分类,解决了当人脸样本发生严重的表情或姿态变化,使用线性模型造成的不准确。
4、本发明引入核函数对稀疏特征空间进行建模,并在非线性稀疏空间中求解L1范数的优化问题实现人脸的准确分类,克服线性模型的局限性。
附图说明:
图1为不同像素点间测地距离示意图。
图2为测地距离映射图。
图3为ORL数据库姿态与表情变化样本图像。
图4为ORL数据库平均识别率的对比表。
图5为Yale-B数据库50%遮挡样本图像。
图6为Yale-B数据库50%遮挡的识别率对比图。
具体实施方式:
实施例:参见图1、图2、图3、图4、图5和图6。
基于测地映射分析的核稀疏描述人脸识别方法,包括以下步骤:
步骤1、把人脸图像分成无数个像素点和无数条弧线,并在无数条弧线围成的区域内选择任意两个像素点,且其中一个作为参考点;
步骤2、连通黎曼流形的两点之间的距离是连接两点的曲线的最小长度,通过这个最小值的曲线得出测地线;
步骤3、通过对数和指数映射将通过参考点的测地线变换成切向空间上的直线,保持与曲线相似的距离,通过主要测地分析,获得用于人脸识别的GMA分类特征;
步骤4、使用非线性模型进行稀疏描述,通过非线性映射将切向空间中的数据向量转换为较高维特征空间;使用内核技巧在GMA特征空间实现稀疏建模,并通过建立的模型对人脸图像进行自动识别。
下面结合附图对本申请进行详细描述,并在ORL和Yale-B人脸数据库中对本申请提出的基于GMA的核稀疏描述人脸识别方法进行姿态、表情和遮挡变化实验。
本申请提出了基于测地映射分析(Geodesic Mapping Analysis,GMA)的特征提取方法,由于人脸图像是由无数个像素点和无数条弧线构成,连通黎曼流形的两点之间的距离是连接两点的曲线的最小长度,实现这个最小值的曲线被称为测地线;如图1所示,x、y为两个像素点,dxy为两点之间的直线距离,即欧氏距离。当x、y之间存在障碍物时(如表情变化较大),同类像素点边界出现一定的凹凸现象,欧式距离便不能准确地表示x、y的真实距离;此时,在绕过障碍的所有曲线中,必然存在一条最短的测地弧d1(测地线),d1的长度即为x、y像素间的测地距离。
根据微分方程理论,通过点x∈M,存在唯一的测地线,其切线向量为将通过参考点x的测地线变换成切向空间上的直线,保持与曲线相似的距离。将切线向量映射到测地线从x到流形上的点的函数称为指数映射,如下式所示:
Expx:TXM→M (1)
其中Υ(t)为测地线,将TXM的原点映射到x点,即Expx(0)=x;对于每个像素点x∈M,在TXM到邻域间存在指数映射的逆运算Logx=Expx -1,被称为对数映射。
点y=Υ(1)∈M到向量的映射如图2所示,其中,向量的长度即x和y之间的测地距离。
主要测地分析是欧几里德空间主成分分析的泛化和扩展。
集合的平均值为μ,由最小化平方距离函数之和给出:
其中d(x,y)=||logx(y)||表示黎曼度量。对于黎曼流形,均值的存在性和唯一性是有保证的。可通过梯度下降算法来计算平均值:
样本方差由式(4)给出:
流形中的测地曲线是线性空间中直线的泛化,点x在测地子流形H上的投影是黎曼度量上最接近于x的点,由式(5)给出:
πH(x)=argminy∈Hd(x,y)2 (5)
给定一组像素点x1,x2,x3,…xn∈M,目标是找到一个测地子流形,使得数据的投影方差最大化,可通过获取跨越切向空间TXM的切向量正交基ζ1,ζ2,...,ζd实现。为使投影方差最大化,选择指数映射下测地子流形第一个主成分由式(6)给出:
其中H=Expμ(span(ζ)),投影算子近似为:
其他测地子流形主成分定义为:
其中H=Expμ(span(ζ1,ζ2,...,ζk-1,ζ)),代入投影算子可得:
训练集的协方差描述符表示为计算点的平均值μ,特征被映射到切向空间获得计算主要测地线分量以获得ζ1,ζ2,...,ζd,从而生成新的主投影特征:
其中,系数λi,k计算如下:
将样本i的GMA特征νi定义为:
将测试数据投影到该子流形上以获得用于人脸识别的GMA分类特征,其使用以下度量:
上述测度可由协方差矩阵和pt的广义特征值ki给出,即:
通过式(15)即可实现基于测地映射分析(GMA)的有效特征提取,该特征以测地距离为度量依据,通过对数和指数映射将测试数据投影到切向空间,从而获取更具辨别力的分类特征。
设φ是从输入空间到特征空间的任意非线性映射,即φ:TμM→F。c是类的数量,vj,k是第k个训练样本图像的第j个GMA特征,ni是样本i的图像数量,n=n1+n2+n3+…+nc是总的图像数量,l是测试图像的GMA特征,训练图像的GMA特征变换矩阵为Ψ=[φ(v1,1),φ(v2,1),φ(vn1,1)…φ(vnc,c)],可以将变换后的测试向量φ(l)表示为:
φ(l)=Ψα (16)
由于式(16)是超定的,维数很高,可利用核降维技术转化为欠定问题,有利于高效地执行高维度的计算:
RTφ(l)=RTψα (17)
其中R是切向空间TμM中降维后的矩阵。令Cφ为特征空间的协方差矩阵:
其中vi为GMA特征,前d个最大特征值表示为u1,u2,...,ud,将对应于非零特征值的所有特征向量转换训练样本的线性组合:
其中,列向量[βk,1…βk,n]T是第k个特征向量描述,可得:
对于式(20)两边都乘以φ(vr)T得:
该组方程可以简化为以下矩阵形式:
上述问题可通过式(25)解决:
Kβ=nλβ (25)
则核降维投影矩阵为R=[u1u2…ud],其中第k个特征向量为因此式(17)可转化为:
[u1u2...ud]Tφ(l)=[u1u2...ud]TΨα (26)
此时:
其中r=1→d,c=1→n,式(27)可以进一步写成:
上式可简化为:
Rβω=RβKα (29)
其中ω=[φ(v1)Tφ(l)......φ(vn)Tφ(l)]T,K为核格拉姆矩阵Ki,j=φ(vi)T,Rβ为核降维矩阵。
如果α的解足够稀疏,求解L0范数的最小化就等价于求解如下L1范数的优化问题:
满足RβKα=Rβω (30)
因为有噪声的存在,噪声对稀疏模型具有影响,修改优化问题如下:
满足||y-Rψα||2≤∈ (31)
定义r(i)第i类测试样本l的重建误差,δi(α)是α中对应于类i的非零系数构成的向量,可得:
如果则基于GMA特征的核稀疏算法就把测试样本l分到第c类,从而实现自由形式人脸图像的分类识别。
姿态与表情变化实验采用ORL人脸数据库完成验证,该数据库包含40个人的400个灰度图像。每个样本的图像在变化的光照强度、面部表情(开/闭的眼睛、微笑/不笑)、面部细节(戴眼镜/无眼镜)和黑暗均匀的背景拍摄,姿态变化高达20o,尺寸变化高达10%。该数据库的样本图像如图3所示:
每一对象随机抽取5张图像作为训练样本(共200张),剩余的5张图像作为测试样本(共200张),对比本申请(GMA)与其他方法(KPCA、Gabor、GDA)面对不同姿态、不同表情测试样本的识别率如图4所示。
选取Yale-B人脸数据库的两个子集用于训练,另外一个子集用于测试。每个测试样本将插入一个不相关的图像作为遮挡块,遮挡率为50%,图5为不同遮挡位置的测试样本图像。
对比本申请(GMA)与KPCA、Gabor、GDA三种方法在50%遮挡条件下的识别率,如图6所示。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
Claims (6)
1.一种基于测地映射分析的核稀疏描述人脸识别方法,其步骤是:1)、把人脸图像分成无数个像素点和无数条弧线,并在无数条弧线围成的区域内选择任意两个像素点,且其中一个作为参考点;
2)、连通黎曼流形的两点之间的距离是连接两点的曲线长度的最小值,实现最小值的曲线即为测地线;
3)、通过对数和指数映射将通过参考点的测地线变换成切向空间上的直线,保持与曲线相似的距离,通过主要测地分析,获得用于人脸识别的GMA分类特征;
4)、使用非线性模型进行稀疏描述,通过非线性映射将切向空间中的数据向量转换为较高维特征空间;
5)、使用内核技巧在GMA特征空间实现稀疏建模;
主要测地分析是欧几里德空间主成分分析的泛化和扩展;设φ是从输入空间TμM到特征空间F的任意非线性映射,即φ:TμM→F。
2.根据权利要求1所述的基于测地映射分析的核稀疏描述人脸识别方法,其特征是:步骤3)中:根据微分方程理论,通过参考点x,x∈M,必然存在一条最短的测地弧,即是测地线,其切线向量为TXM为切向空间;将切线向量映射到测地线从x到流形上的点的函数称为指数映射,如下式所示:
Expx:TXM→M (1)
其中Υ(l)为测地线,将TXM的原点映射到x点,即Expx(0)=x;对于每个像素点x∈M,在TXM到邻域间存在指数映射的逆运算Logx=Expx -1,被称为对数映射。
3.根据权利要求1所述的基于测地映射分析的核稀疏描述人脸识别方法,其特征是:步骤3)中:主要测地分析是欧几里德空间主成分分析的泛化和扩展,像素点集合的平均值为μ,由最小化平方距离函数之和给出:
其中,为均值向量,xi为集合M中的像素点,d(x,y)=||logx(y)||表示黎曼度量:
通过梯度下降算法来计算平均值:
4.根据权利要求1所述的基于测地映射分析的核稀疏描述人脸识别方法,其特征是:步骤3)中:流形中的测地曲线是线性空间中直线的泛化,像素点x在测地子流形H上的投影是黎曼度量上最接近于x的点,由式(5)给出:
πH(x)=arg miny∈Hd(x,y)2 (5)
给定一组像素点x1,x2,x3,…xn∈M,找到一个测地子流形,使得数据的投影方差最大化,其通过获取跨越切向空间TXM的切向量正交基ζ1,ζ2,...,ζd实现。
5.根据权利要求4所述的基于测地映射分析的核稀疏描述人脸识别方法,其特征是:步骤3)中:训练集的协方差描述符表示为计算点的平均值μ,特征被映射到切向空间获得计算主要测地线分量以获得ζ1,ζ2,...,ζd,从而生成新的主投影特征:
其中,系数λi,k计算如下:
将样本i的GMA特征vi定义为:
将测试数据投影到测地子流形H上以获得用于人脸识别的GMA分类特征,其使用以下度量:
其中,为主投影特征,pt为协方差矩阵,令ki为和pt的广义特征值,得:
其中,d为广义特征值的ki数量。
6.根据权利要求1所述的基于测地映射分析的核稀疏描述人脸识别方法,其特征是:步骤4)和步骤5)中:实现基于测地映射分析GMA有效特征提取,是以测地距离为度量依据,通过对数和指数映射将测试数据投影到切向空间,从而获取更具辨别力的分类特征;设φ是从输入空间TμM到特征空间F的任意非线性映射,即φ:TμM→F;c是类的数量,vj,k是第k个训练样本图像的第j个GMA特征,ni是样本i的图像数量,n=n1+n2+n3+…+nc是总的图像数量,l是测试图像的GMA特征,训练图像的GMA特征变换矩阵为ψ=[φ(v1,1),φ(v2,1),φ(vn1,1)…φ(vnc,c)],能够将变换后的测试向量φ(l)表示为:
φ(l)=ψα (16)
其中,ψ为GMA特征变换矩阵,α为样本的稀疏表示,由于式(16)是超定的,维数很高,能够利用核降维技术转化为欠定问题,有利于高效地执行高维度的计算:
RTφ(l)=RTψα (17)
其中R是切向空间TXM降维后的矩阵,T表示矩阵的转置,令Cφ为特征空间的协方差矩阵:
其中vi为GMA特征向量,前d个最大特征值表示为u1,u2,...,ud,将对应于非零特征值的所有特征向量转换训练样本的线性组合:
其中,列向量[βk,1…βk,n]T是第k个特征向量描述,可得:
对于式(20)两边都乘以φ(vr)T能够简化为以下矩阵形式:
其中,λ为正则化参数,K为核格拉姆矩阵Ki,j=φ(vi)T,则:
Kβ=nλβ (25)
则核降维投影矩阵为R=[u1u2…ud],其中第k个特征向量为因此式(17)能够转化为:
[u1u2...ud]Tφ(l)=[u1u2...ud]Tψα (26)
上式能够简化为:
Rβω=RβKα (29)
其中ω=[φ(v1)Tφ(l)......φ(vn)Tφ(l)]T,Rβ为核降维矩阵;
如果α的解足够稀疏,求解L0范数的最小化就等价于求解如下L1范数的优化问题:
满足RβKα=Rβω (30)
其中,根据噪声对稀疏模型的影响,进一步修改优化问题。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810469578.XA CN108664941B (zh) | 2018-05-16 | 2018-05-16 | 基于测地映射分析的核稀疏描述人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810469578.XA CN108664941B (zh) | 2018-05-16 | 2018-05-16 | 基于测地映射分析的核稀疏描述人脸识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108664941A CN108664941A (zh) | 2018-10-16 |
CN108664941B true CN108664941B (zh) | 2019-12-27 |
Family
ID=63779982
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810469578.XA Expired - Fee Related CN108664941B (zh) | 2018-05-16 | 2018-05-16 | 基于测地映射分析的核稀疏描述人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108664941B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109753887B (zh) * | 2018-12-17 | 2022-09-23 | 南京师范大学 | 一种基于增强核稀疏表示的sar图像目标识别方法 |
CN112287745B (zh) * | 2020-07-23 | 2024-05-03 | 南京航空航天大学 | 一种基于测地距离与样本熵的认知情感识别方法 |
CN112733758B (zh) * | 2021-01-15 | 2023-09-01 | 哈尔滨工业大学(深圳) | 黎曼几何不变性下基于曲线的三维人脸识别方法及系统 |
CN117611827B (zh) * | 2024-01-19 | 2024-04-16 | 齐鲁工业大学(山东省科学院) | 基于感知分组策略的图像分割方法、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101350069A (zh) * | 2007-06-15 | 2009-01-21 | 三菱电机株式会社 | 从训练数据构建分类器并使用分类器检测在测试数据中的移动对象的计算机实现方法 |
CN104268593A (zh) * | 2014-09-22 | 2015-01-07 | 华东交通大学 | 一种小样本情况下多稀疏表示的人脸识别方法 |
CN104281835A (zh) * | 2014-09-04 | 2015-01-14 | 台州学院 | 基于局部敏感的核稀疏表示的人脸识别方法 |
CN107292299A (zh) * | 2017-08-14 | 2017-10-24 | 河南工程学院 | 基于内核规范相关分析的侧面人脸识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8498481B2 (en) * | 2010-05-07 | 2013-07-30 | Microsoft Corporation | Image segmentation using star-convexity constraints |
-
2018
- 2018-05-16 CN CN201810469578.XA patent/CN108664941B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101350069A (zh) * | 2007-06-15 | 2009-01-21 | 三菱电机株式会社 | 从训练数据构建分类器并使用分类器检测在测试数据中的移动对象的计算机实现方法 |
CN104281835A (zh) * | 2014-09-04 | 2015-01-14 | 台州学院 | 基于局部敏感的核稀疏表示的人脸识别方法 |
CN104268593A (zh) * | 2014-09-22 | 2015-01-07 | 华东交通大学 | 一种小样本情况下多稀疏表示的人脸识别方法 |
CN107292299A (zh) * | 2017-08-14 | 2017-10-24 | 河南工程学院 | 基于内核规范相关分析的侧面人脸识别方法 |
Non-Patent Citations (3)
Title |
---|
Face recognition based on geodesic distance approximations between multivariate normal distributions;John Soldera 等;《2017 IEEE International Conference on Imaging Systems and Techniques (IST)》;20171020;第1-6页 * |
Sparse Discriminative Multimanifold Grassmannian Analysis for Face Recognition With Image Sets;Haifeng Hu;《IEEE Transactions on Circuits and Systems for Video Technology》;20141105;第1599-1611页 * |
融合深度学习与最大间距准则的人脸识别方法;栗科峰 等;《Computer Engineering and Applications计算机工程与应用》;20180301;第206-201页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108664941A (zh) | 2018-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Luo et al. | Feature learning using spatial-spectral hypergraph discriminant analysis for hyperspectral image | |
CN108664941B (zh) | 基于测地映射分析的核稀疏描述人脸识别方法 | |
Zhang et al. | Learning structured low-rank representations for image classification | |
Li et al. | Overview of principal component analysis algorithm | |
AU2014368997B2 (en) | System and method for identifying faces in unconstrained media | |
CN107506700B (zh) | 基于广义相似性度量学习的行人再识别方法 | |
CN102938065B (zh) | 基于大规模图像数据的人脸特征提取方法及人脸识别方法 | |
Lee et al. | Collaborative expression representation using peak expression and intra class variation face images for practical subject-independent emotion recognition in videos | |
CN102609681A (zh) | 基于字典学习模型的人脸识别方法 | |
CN109376787B (zh) | 流形学习网络及基于其的计算机视觉图像集分类方法 | |
CN106980848A (zh) | 基于曲波变换和稀疏学习的人脸表情识别方法 | |
CN106096517A (zh) | 一种基于低秩矩阵与特征脸的人脸识别方法 | |
CN109241813B (zh) | 基于判别稀疏保持嵌入的非约束人脸图像降维方法 | |
Lee et al. | Face image retrieval using sparse representation classifier with gabor-lbp histogram | |
CN110874576B (zh) | 一种基于典型相关分析融合特征的行人再识别方法 | |
CN107918761A (zh) | 一种基于多流形核鉴别分析的单样本人脸识别方法 | |
CN111310813A (zh) | 一种潜在低秩表示的子空间聚类方法及装置 | |
Puthenputhussery et al. | A sparse representation model using the complete marginal fisher analysis framework and its applications to visual recognition | |
Bao et al. | Colour face recognition using fuzzy quaternion-based discriminant analysis | |
CN111723759B (zh) | 基于加权张量稀疏图映射的非约束人脸识别方法 | |
CN111325275A (zh) | 基于低秩二维局部鉴别图嵌入的鲁棒图像分类方法及装置 | |
CN113095305A (zh) | 一种医药异物高光谱分类检测方法 | |
CN111160405B (zh) | 一种基于深度学习的发动机滑油磨粒识别方法 | |
Wei et al. | Color image retrieval based on quaternion and deep features | |
CN112001231B (zh) | 加权多任务稀疏表示的三维人脸识别方法、系统及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20191227 |
|
CF01 | Termination of patent right due to non-payment of annual fee |