CN108520201B - 一种基于加权混合范数回归的鲁棒人脸识别方法 - Google Patents
一种基于加权混合范数回归的鲁棒人脸识别方法 Download PDFInfo
- Publication number
- CN108520201B CN108520201B CN201810203153.4A CN201810203153A CN108520201B CN 108520201 B CN108520201 B CN 108520201B CN 201810203153 A CN201810203153 A CN 201810203153A CN 108520201 B CN108520201 B CN 108520201B
- Authority
- CN
- China
- Prior art keywords
- model
- vector
- function
- face image
- weight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Abstract
一种基于加权混合范数回归的鲁棒人脸识别方法,其涉及模式识别领域,目的是提高人脸图像损失时的识别精度。包括以下步骤:a)为每个目标对象选取ni个样本作为训练集,确定字典矩阵X,输入测试人脸图像Y;b)建立WMNR模型,优化模型,获得相应的特征权值矩阵W,系数向量a和非负权值向量s;c)将步骤b学习得到的W,a和s代入分类重构误差最小化模型,最终实现人脸图像识别。本发明使用权值自适应机制和一种有效的重加权快速迭代算法对模型进行优化,具有运算效率高、准确性高等优点,非常适合图像受损情况下的人脸检测和人脸分类。
Description
技术领域
本发明涉及计算机视觉的鲁棒人脸识别方法,可用于人脸识别、图像识别、目标识别等。
背景技术
在互联网经济飞速发展的现在,身份确认具有十分重要的价值。近年来,人类的生物特征越来越广泛的应用于个人身份鉴认,相比于传统的方法安全、可靠、特征唯一、稳定性高,不易被盗窃和破解。人类固有的生物特征主要有:DNA、指纹、虹膜、语音、步态、掌纹、人脸等,基于人们对独立的个体特征的认知,结合先进的计算机技术和模式识别理论,诸如DNA识别技术、指纹识别技术、人脸识别技术等纷纷发展起来。就目前的研究水平而言,DNA鉴定和指纹识别具有较高的识别率,可靠性最强但其使用的强约束条件还是限制了这两种方法的使用。人脸识别相比于其他的生物特征识别方法具有如下的强大优势:(1)无需用户过多参与,非接触式采集,无侵犯性;(2)对用户没有任何明显刺激,便于隐藏;(3)设备成本低廉,主要是采用摄像头来搜集人脸。因而人脸识别作为一种特殊的生物特征识别技术,拥有许多独特的应用环境,如罪犯搜捕、自动门禁系统、海关过境检查、移动支付确认等。
人脸识别已然成为模式识别和图像处理领域的研究热点,涌现出多种研究理论和应用方法,目前主要存在卷积神经网络、度量学习和回归分析等方法。卷积神经网络虽然具有强大的非线性表示学习性能,但其对机器运算能力的要求和大量的训练数据和参数设置限制了其应用范围。度量学习通过获得衡量图像相似度的鉴别性信息进行分类,然而其容易遭受图像损坏的影响。近年来,基于回归分析的方法因其直观的解释性和对特殊噪声的鲁棒性,获得的广泛的关注。本发明提出的方法属于基于回归模型的人脸识别,寻求合适的样本表示,通过检验使重构误差最小的类别识别相应样本。
在实际人脸识别中饱受连续和非连续噪声的混合影响,因此,如何提供一种灵活适应各种噪声干扰的鲁棒人脸识别方法,是目前本领域技术研究人员函待解决的问题。
发明内容
本发明要解决现实人脸识别技术中图像存在的连续和非连续噪声干扰问题,提供一种基于加权混合范数回归的鲁棒人脸识别方法,可用于人脸检测和人脸分类。
本发明使用特征权值损失函数抑制来自非确定性分布的非连续噪声,并将连续性噪声进行非凸和有序秩权值约束,本发明提出的一种基于加权混合范数回归 (WeightedMixed-Norm Regression,WMNR)的鲁棒人脸识别方法,包括以下步骤:
a)为每个目标对象选取ni个样本作为训练集,确定字典矩阵X,输入测试人脸图像Y;
b)建立WMNR模型,优化模型,获得相应的特征权值矩阵W,系数向量 a和非负权值向量s;
c)将步骤b学习得到的W,a和s代入分类重构误差最小化模型,最终实现人脸图像识别。
本发明的优点是:能够很好地解决人脸图像损失问题,比如来自非确定分布的非连续噪声以及常见的连续性噪声。此外本发明使用权值自适应机制和一种有效的重加权快速迭代算法对模型进行优化,具有运算效率高、准确性高等优点。
附图说明
图1是添加0%-60%混合噪声的ExYaleB样本图像;
图2是添加40%混合噪声的不同姿势PIE样本图像;
图3a~图3d是各种方法对ExYaleB在不同遮挡和不同程度混合噪声下的识别率,其中图3a是在黑色块遮挡下的识别率,图3b是在狒狒图像遮挡下的识别率,图3c是在玫瑰图像遮挡下的识别率,图3d是在花瓶形状损失下的识别率;
图4是本发明的流程图。
具体实施方式
下面结合附图对本发明作进一步描述。一种基于加权混合范数回归的鲁棒人脸识别方法,包括以下步骤:
a)为每个目标对象选取ni个样本作为训练集,确定字典矩阵X,输入测试人脸图像Y;
b)建立WMNR模型,优化模型,获得相应的特征权值矩阵W,系数向量 a和非负权值向量s;
c)将步骤b学习得到的W,a和s代入分类重构误差最小化模型,最终实现人脸图像识别。
所述步骤a的过程,具体包括下述内容:
为每个目标对象选取ni个样本作为训练集,每个样本维数为m,其中i=1,…, c,c是目标类别数,总训练样本量为由此,确定字典矩阵 X=[X1,X2,…,Xc]∈Rm×n。余下的数据都作为测试集,将测试人脸图像表述为Y∈Ro×q, 即宽度为q,高度为o,将之按列连接为向量形式y=Vec(Y)∈Rm,m=o×q,使
y=Xa+e
其中a∈Rm表示系数向量,用于计算最小类残差以及实现最终识别,e表示残差图像,将之展开成列优先的矩阵形式E=Mat(e)∈Ro×q;
所述步骤b的过程,具体包括下述步骤:
b1建立WMNR模型
s.t.wT1=1,wi≥0,i=1~m.
g(σ)=μσp μ>0
作为代理函数,s=[s1,...,sv]T表示非负权值向量,并使用s=g’(σ)更新权值向量。θ(a)表示系数正则项,本发明使用θ(a)=||a||2,1作为系数正则项。γ、λ分别表示特征权值系数和正则项系数。
b2使用增广拉格朗日乘子法求解特征向量w,设X=[f1;f2;…;fm],fi∈Rn表示X的第i行特征向量,ei=yi-fia表示特征关于向量a的重构误差,则关于特征权值w的优化问题可写为
s.t.wT1=1,wi≥0,i=1~m,
其中拉格朗日算子α≥0且b≥0。根据KKT条件,优化解w可以表示为
(·)+表示保留正元素,其余元素均为0。假设稀疏解w具有k>0个非零权值,则 wk>0且wk+1=0,因此有
又由wT1=1可得
因此可得
由α和γ的表达式可得自适应特征权值向量
奇异值分解E=U∑VT,其中∑=diag{δi,i=1,2,…,v},奇异值分解G=UΔVT,Δ=diag{σi, i=1,2,…,v},可以将上述惩罚函数转换为
根据步骤b1所述,lp代理函数固定μ和p时,存在一个确定性阈值序列τ。当σi>τi时,fi(δ)最小值位于δi=0上;否则,fi(δ)最小时仍有确定性正解δi。本发明使用加权非凸范数最小化(Weighted Nonconvex Norm Minimization,WN2M)算法对低秩约束项进行优化
输入:G,s,迭代次数tm
输出:优化E
b31奇异值分解G=UΔVT,Δ=diag{σi,i=1,2,…,v};
b32利用公式
δi-σi+sig′(δi)=0
求取τ。
b33当|σi|<τi时,令σ=0;
b35 k=1,…,tm;
b37 k=k+1;
b39Σ=diag{δi,i=1,2,…,v};
b310返回E=UΣVT。
b4使用交替方向乘子法(Alternating Direction Method of Multipliers,ADMM) 对函数模型的a进行优化,令a=u,根据增广拉格朗日乘子法以及y=Xa+e可得
上述函数的优化过程如下
输入:y,a,u,λ,ρ和ε。
输出:优化a。
初始化t=0,at=1/n,;
迭代b41-b49,直至收敛,即max{||y-Xa-e||2,||a-u||2}<ε且||wt -wt-1||2/||wt-1||2<ε。
b41 t=t+1
b42通过步骤b2获得特征权值;
迭代b43-b48,直至收敛,即max{||y-Xa-e||2,||a-u||2}<ε且||wt
-wt-1||2/||wt-1||2<ε。
b43初始化l=0,al=at,z1,l=0,z2,l=0;
b44通过公式
b45通过步骤b3中WN2M算法计算非连续噪声el;
b46通过公式
ul+1=Vec(Di,λ/ρ(al+z2,l/ρ),i=1,...,c)
计算ul;
b47通过公式
al+1=C(XTga+gu)
ga=y-el+1+z1,l/ρ
gu=u-z2,l/ρ
C=(XTX+I)-1
计算al+1;
b48通过公式
z1,l+1=z1,l+ρ(y-Xal+1-el+1)
z2,l+1=z2,l+ρ(al+1-ul+1)
计算z1,l和z2,l。
b49 at=al;
所述步骤c的过程,具体包括如下步骤:
模型优化后,可获得测试人脸图像的重构向量y’=X1a1+X2a2+,…,+Xcac,Θi是一种映射函数,表示选择第i个人脸图像类别对应的系数,根据重构向量与目标类别对应字典向量的差值最小,可得分类重构误差模型
将步骤b学习得到的W,a和s加入上述模型,可得最终分类函数
所求i即为输入人脸图像所属的类别。
如上所述,根据本发明,可以提供一种基于加权混合范数回归的鲁棒人脸识别方法。
采用Extended Yale B(ExYaleB)和CMU PIE(PIE)两种经典的人脸数据库检验本发明在存在遮挡等情况下的识别率。实验中统一将上述人脸数据库调整至 32×32像素,每像素的灰度值在0-255范围之内。在ExYaleB人脸库包括38类对象,每类对象具有2414个人脸图像,随机选择每类30个构成字典参与训练,其余作为测试集。在PIE人脸库选择每个对象的5种(pose05,pose07,pose09, pose27,pose29)不同姿势,一共11554个人脸图像,并从pose27中选取3329个图像作为训练集,其余作为测试集。本文选用最近提出的基于回归的方法正则化鲁棒分类器(Regularized Robust Classifier,RRC)、迭代重约束组稀疏范分类器 (Iterative Re-constrained Group Sparse Classifier,IRGSC)、核范数矩阵表示(Nuclear-norm based Matrix Representation,NMR)模型、核范数约束回归 (Nuclear-norm Regularized Regression,NR)模型和鲁棒矩阵回归(Robust Matrix Regression,RMR)模型作为对比方法,此外本发明若只考虑连续噪声,可只保留 WMNR的后两项,则可得一种加权非凸范数回归(Weighted Nonconvex Norm Regression,WNNR)模型,本发明也将此模型作为对比方法。
对ExYaleB和PIE数据库图像添加不同程度的噪声处理,如图1所示, ExYaleB样本图像添加0%-60%的混合噪声。图2表示对PIE不同姿势图像添加40%的混合噪声。由图3a至图3d可见,本发明WMNR模型可以在各种遮挡和不同程度的噪声影响下获得优于其他对比方法的识别率。表1是所有方法在PIE人脸库添加40%噪声时在各种姿势上的识别率和相应平均运算时间,其中加粗部分是相同测试样本下的最高识别率。由此可见,WMNR模型不仅获得了较高的识别率,且在运算效率上具有优势。
表1 40%噪声下所有方法在PIE各种姿势的识别率和平均运算时间
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
Claims (1)
1.一种基于加权混合范数回归的鲁棒人脸识别方法,包括以下步骤:
步骤a.为每个目标对象选取ni个样本作为训练集,确定字典矩阵X,输入测试人脸图像Y;具体包括下述内容:
为每个目标对象选取ni个样本作为训练集,每个样本维数为m,其中i=1,...,c,c是目标类别数,总训练样本量为由此,确定字典矩阵X=[X1,X2,...,Xc]∈Rm×n;测试人脸图像Y作为测试集,将测试人脸图像表述为Y∈Ro×q,即宽度为q,高度为o,将之按列连接为向量形式y=Vec(Y)∈Rm,m=o×q,使
y=Xa+e
其中a∈Rm表示系数向量,用于计算最小类残差以及实现最终识别,e表示残差图像,将之展开成列优先的矩阵形式E=Mat(e)∈Ro×q;
步骤b.建立WMNR模型,优化模型,获得相应的特征权值矩阵W,系数向量a和非负权值向量s;具体包括下述步骤:
b1建立WMNR模型;
s.t.WT1=1,wi≥0,i=1~m,
g(σ)=μσp μ>0
作为代理函数;s=[s1,...,sv]T表示非负权值向量,并使用s=g(σ)更新权值向量;θ(a)表示系数正则项,使用θ(a)=||a||2,1作为系数正则项;γ、λ分别表示特征权值系数和正则项系数;
b2使用增广拉格朗日乘子法求解特征向量W,设X=[f1;f2;...;fm],fi∈Rn表示X的第i行特征向量,ei=yi-fia表示特征关于向量a的重构误差,则关于特征权值W的优化问题可写为
s.t.WT1=1,wi≥0,i=1~m,
其中拉格朗日算子α≥0且b≥0;根据KKT条件,优化解W可以表示为
(·)+表示保留正元素,其余元素均为0;假设稀疏解W具有k>0个非零权值,则wk>0且Wk+1=0,因此有
又由WT1=1可得
因此可得
由α和γ的表达式可得自适应特征权值向量
奇异值分解E=U∑VT,其中Σ=diag{δi,i=1,2,...,v},奇异值分解G=UΔVT,A=diag{σi,i=1,2,...,v},可以将上述惩罚函数转换为
根据步骤b1所述,lp代理函数固定μ和p时,存在一个确定性阈值序列τ;当σi>τi时,fi(δ)最小值位于δi=0上;否则,fi(δ)最小值仍有确定性正解δi;使用加权非凸范数最小化算法对低秩约束项进行优化
输入:G,s,迭代次数tm
输出:优化E
b31奇异值分解G=UΔVT,Δ=diag{σi,i=1,2,...,v};
b32利用公式
δi-σi+sig′(δi)=0
求取τ;
b33当|σi|<τi时,令σ=0;
b35 k=1,...,tm;
b37 k=k+1;
b39∑=diag{δi,i=1,2,...,v};
b310返回E=UΣVT;
b4使用交替方向乘子法对函数模型的a进行优化,令a=u,根据增广拉格朗日乘子法以及y=Xa+e可得
上述函数的优化过程如下
输入:y,a,u,λ,ρ和ε;
输出:优化a;
初始化t=0,at=1/n;
迭代b41-b49,直至收敛,即max{||y-Xa-e||2,||a-u||2}<ε且||wt-wt-1||2/||wt-1||2<ε;
b41 t=t+1
b42通过步骤b2获得特征权值;
迭代b43-b48,直至收敛,即max{||y-Xa-e||2,||a-u||2}<ε且||wt-Wt-1||2/||wt-1||2<ε;
b43初始化l=0,al=at,z1,l=0,z2,l=0;
b44通过公式
b45通过步骤b3中加权非凸范数最小化算法计算非连续噪声el;
b46通过公式
ul+1=Vec(Di,λ/ρ(al+z2,l/ρ),i=1,...,c)
计算ul;
b47通过公式
al+1=C(XTga+gu)
C=(XTX+I)-1
计算al+1;
b48通过公式
b49 at=al;
步骤c.将步骤b学习得到的W,a和s代入分类重构误差最小化模型,最终实现人脸图像识别;具体包括如下步骤:
模型优化后,可获得测试人脸图像的重构向量y’=X1a1+X2a2+,...,+Xcac,Θi是一种映射函数,表示选择第i个人脸图像类别对应的系数,根据重构向量与目标类别对应字典向量的差值最小,可得分类重构误差模型
将步骤b学习得到的W,a和s加入上述模型,可得最终分类函数
所求i即为输入人脸图像所属的类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810203153.4A CN108520201B (zh) | 2018-03-13 | 2018-03-13 | 一种基于加权混合范数回归的鲁棒人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810203153.4A CN108520201B (zh) | 2018-03-13 | 2018-03-13 | 一种基于加权混合范数回归的鲁棒人脸识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108520201A CN108520201A (zh) | 2018-09-11 |
CN108520201B true CN108520201B (zh) | 2021-12-07 |
Family
ID=63433042
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810203153.4A Active CN108520201B (zh) | 2018-03-13 | 2018-03-13 | 一种基于加权混合范数回归的鲁棒人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108520201B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020599A (zh) * | 2019-02-28 | 2019-07-16 | 浙江工业大学 | 一种稀疏强化型低秩约束的人脸图像聚类方法 |
CN111104868B (zh) * | 2019-11-25 | 2022-08-23 | 南京邮电大学 | 一种基于卷积神经网络特征的跨质量人脸识别方法 |
CN113331789A (zh) * | 2021-05-31 | 2021-09-03 | 浙江杜比医疗科技有限公司 | 肿瘤细胞生长检测系统的成像方法 |
CN113326791B (zh) * | 2021-06-10 | 2023-09-26 | 沈阳航空航天大学 | 基于鲁棒性自适应图结构学习算法的人脸识别方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8283623B2 (en) * | 2007-10-29 | 2012-10-09 | International Business Machines Corporation | Robust spectral analyzer for one-dimensional and multi-dimensional data analysis |
CN105069427A (zh) * | 2015-07-29 | 2015-11-18 | 天津市协力自动化工程有限公司 | 一种基于改进的稀疏编码的虹膜识别方法及装置 |
CN105118068A (zh) * | 2015-09-29 | 2015-12-02 | 常熟理工学院 | 一种小样本条件下医学图像自动标注方法 |
CN106295694A (zh) * | 2016-08-05 | 2017-01-04 | 浙江工业大学 | 一种迭代重约束组稀疏表示分类的人脸识别方法 |
CN107392128A (zh) * | 2017-07-13 | 2017-11-24 | 南京邮电大学 | 基于双低秩表示和局部约束矩阵回归的鲁棒图像识别方法 |
-
2018
- 2018-03-13 CN CN201810203153.4A patent/CN108520201B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8283623B2 (en) * | 2007-10-29 | 2012-10-09 | International Business Machines Corporation | Robust spectral analyzer for one-dimensional and multi-dimensional data analysis |
CN105069427A (zh) * | 2015-07-29 | 2015-11-18 | 天津市协力自动化工程有限公司 | 一种基于改进的稀疏编码的虹膜识别方法及装置 |
CN105118068A (zh) * | 2015-09-29 | 2015-12-02 | 常熟理工学院 | 一种小样本条件下医学图像自动标注方法 |
CN106295694A (zh) * | 2016-08-05 | 2017-01-04 | 浙江工业大学 | 一种迭代重约束组稀疏表示分类的人脸识别方法 |
CN107392128A (zh) * | 2017-07-13 | 2017-11-24 | 南京邮电大学 | 基于双低秩表示和局部约束矩阵回归的鲁棒图像识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108520201A (zh) | 2018-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jia et al. | Residual correlation in graph neural network regression | |
CN108520201B (zh) | 一种基于加权混合范数回归的鲁棒人脸识别方法 | |
Das et al. | Unsupervised domain adaptation using regularized hyper-graph matching | |
CN108960330B (zh) | 基于快速区域卷积神经网络的遥感图像语义生成方法 | |
CN107194378B (zh) | 一种基于混合字典学习的人脸识别方法及装置 | |
CN113610151B (zh) | 基于原型网络和自编码器的小样本图像分类系统 | |
Krak et al. | Multidimensional scaling by means of pseudoinverse operations | |
Park et al. | Fast and scalable approximate spectral matching for higher order graph matching | |
Pourzanjani et al. | Improving the identifiability of neural networks for Bayesian inference | |
Oune et al. | Latent map Gaussian processes for mixed variable metamodeling | |
Sanodiya et al. | A kernelized unified framework for domain adaptation | |
CN106250918B (zh) | 一种基于改进的推土距离的混合高斯模型匹配方法 | |
Wang et al. | Localized LRR on Grassmann manifold: An extrinsic view | |
WO2020171904A1 (en) | Human body part segmentation with real and synthetic images | |
Sharma et al. | Pose‐invariant face recognition using curvelet neural network | |
CN110689049A (zh) | 基于黎曼核字典学习算法的视觉分类方法 | |
Mehrkanoon et al. | Incremental multi-class semi-supervised clustering regularized by Kalman filtering | |
Zhao et al. | Discriminant and sparsity based least squares regression with l 1 regularization for feature representation | |
CN115496144A (zh) | 配电网运行场景确定方法、装置、计算机设备和存储介质 | |
Zhang et al. | l2, 1 norm regularized fisher criterion for optimal feature selection | |
dos Santos et al. | Grassmannian diffusion maps based surrogate modeling via geometric harmonics | |
Zhang et al. | Efficient history matching with dimensionality reduction methods for reservoir simulations | |
Tsai et al. | Improving measurement invariance assessments in survey research with missing data by novel artificial neural networks | |
Zhang et al. | Low‐rank constrained weighted discriminative regression for multi‐view feature learning | |
Lai et al. | Enhanced pooling method for convolutional neural networks based on optimal search theory |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |