CN105760821B - 基于核空间的分类聚集稀疏表示的人脸识别方法 - Google Patents

基于核空间的分类聚集稀疏表示的人脸识别方法 Download PDF

Info

Publication number
CN105760821B
CN105760821B CN201610065827.XA CN201610065827A CN105760821B CN 105760821 B CN105760821 B CN 105760821B CN 201610065827 A CN201610065827 A CN 201610065827A CN 105760821 B CN105760821 B CN 105760821B
Authority
CN
China
Prior art keywords
centerdot
matrix
formula
sample
rsqb
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610065827.XA
Other languages
English (en)
Other versions
CN105760821A (zh
Inventor
刘宝弟
王立
韩丽莎
王延江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN201610065827.XA priority Critical patent/CN105760821B/zh
Publication of CN105760821A publication Critical patent/CN105760821A/zh
Application granted granted Critical
Publication of CN105760821B publication Critical patent/CN105760821B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2136Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on sparsity criteria, e.g. with an overcomplete basis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Abstract

本发明涉及一种基于核空间的分类聚集稀疏表示的人脸识别方法,含有以下步骤:采用卷积神经网络对人脸图像提取人脸特征,训练分类聚集词典,对图像进行识别。本发明考虑了用训练样本对测试样本进行稀疏表达时,每个训练样本对子空间构造的权重的不同,以及离类中心近的训练样本对构造子空间应当具有更大的权重,采用φ(Xc)Wc矩阵构造新的稀疏表达词典,在稀疏表达约束中加入分类集中约束项。与现有技术相比,本发明提出的人脸识别方法能够有效的降低测试样本在相应子空间内的拟合误差,且使得相同类别的样本在稀疏空间内能够聚集在一起,从而提升了人脸识别性能;处理非线性结构和关系的能力增强,能够有效发掘复杂数据的隐藏特征,进一步提升人脸识别性能。

Description

基于核空间的分类聚集稀疏表示的人脸识别方法
技术领域
本发明模式识别技术领域,具体地说,涉及一种基于核空间的分类聚集稀疏表示的人脸识别方法。
背景技术
随着科技的发展,诸多领域均面临着日益膨胀的大量数据,例如地震数据、地球物理数据、音频数据、天文数据、工业控制数据、基因数据等等,如何对这些庞大的数据实现灵活、有效和自适应的表达逐渐成为人们关注的问题之一。图像处理、信息传输、计算机视觉等诸多领域一直在寻求信号与图像的稀疏而简洁地表示方式,这种稀疏表示的好处就在于,非零系数揭示了信号与图像的内在结构与本质属性,同时非零系数具有显式的物理意义。
人脸识别作为计算机视觉和模式分类领域的重要技术,越来越受到人们的关注与重视。人脸识别是利用计算机对人脸信息进行特征的提取并进行分类识别的过程,通常包含两个阶段:一是特征提取,二是构造分类器和标签预测。不同于指纹识别、步态识别、虹膜识别等一般的生物特征识别技术,人脸识别因其便捷性、友好性、高效性,已成为图像处理、模式识别、机器视觉和心理人脸识别具有广泛的应用意义和巨大的应用前景。目前,人脸识别技术主要应用于以下几个方面:刑侦破案、自动化智能管理、机器人学习、智能化相机、网络应用等。
近些年,最近邻子空间的方法受到了关注,通过比较一副测试图像在每一类中的重建误差,为其分配标签。在近邻子空间的方法体系下,Huang等人(参见K.Huang andS.Aviyente.Sparse representation for signal classification.In NIPS,2006.)在一个随机基上对一个信号进行稀疏编码,根据信号的编码向量对其分类。Zhang等人提出了基于协同表示的人脸识别方法,该方法首先对一幅测试图像在训练集上进行协同表示,然后计算该幅图像与每类训练集上协同表示的重构误差得到最终的判决结果,该方法实现起来比较简单,而且性能良好。Wright等人(参见J.Wright,A.Y.Yang,A.Ganesh,S.S.Sastry,and Y.Ma.Robust face recognition via sparse representation.IEEE PAMI,31(2):210–227,2009)将稀疏编码用于鲁棒人脸识别,首先将一副测试的人脸图像在模板图像上稀疏编码,然后根据产生最小编码误差的类别决定分类结果。这种基于稀疏表达的分类器方法,即SRC,在人脸识别领域取得了极大成功,同时也促进了基于模式分类的稀疏性研究。
不少研究学者探索了分类词典学习的方法,并取得了瞩目的成果。Yang等人(参见Yang,M.,Zhang,L.,Yang,J.,Zhang,D.,2010.Metaface learning for sparserepresentation based face recognition.In:Proceedings ofthe 17th ICIP.IEEE,pp.1601–1604.2)使用稀疏表示为每一类学习一个词典,并将其运用到人脸识别中。
此外,在核空间词典学习领域,Gemert等人(参见van Gemert J,Veenman C,SmeuldersA,Geusebroek J.Visual word ambiguity.IEEE Transactions on PatternAnalysis and Machine Intelligence,32(7):1271-1283,2010.)提出了一种高斯RBF核的词典,在词典学习的过程中,首先将特征映射到高斯RBF核空间,然后在新的空间使用K-means算法。高斯RBF核的引入提升了图像分类性能,这是因为高斯RBF核将距离近的点映射到新空间后距离变的更近,将距离远的点映射到新空间后距离变的更远,具有一定近邻约束的性质。Wu等人(参见Wu J,Rehg J M.Beyond the euclidean distance:Creatingeffective visual codebooks using the histogram intersection kernel[C]//Computer Vision,2009IEEE 12th International Conference on.IEEE,2009:630-637)提出了在直方图交叉核空间词典,由于图像分类的特征本身就是一种直方图,直方图交叉核函数更适合度量直方图间的距离,并且取得了不错的分类效果。这几种方法都是基于K-means算法的扩展,由于K-means算法自身的强约束性,分类性能受到一定的影响,很难有太大的进展。
Gao等人(参见Gao S,Tsang I,Chia L.Sparse representation withkernels.IEEE Transaction on Image Processing,22(2):423-434,2013.)直接将欧式空间中SR算法求取的过完备基映射到再生核希尔伯特空间,完成再生核希尔伯特空间的稀疏表达。Gao等人首次将核函数引入到了稀疏编码算法中,形成核空间的SR算法。该方法将图像特征和词典都映射到核空间,然后在核空间执行SR算法。该方法取得了不错的效果,但是存在着一定的不足,首先,图像特征空间与词典空间映射到同一个核空间未必合理,这是因为对于图像分类问题,图像特征一般说来每个bin都是正数,是位于欧式空间的某个特定区间,而词典的各个bin则有正有负,在欧式空间中,线性拟合的方式没有问题,然而映射到高维非线性核空间,这种线性拟合的假设并不准确;其次,该方法所有的推导都是基于高斯RBF核的,所以推广性不强。
综上所述,传统的人脸识别方法大多都是直接使用训练样本构造子空间,利用测试样本在构造子空间中拟合,这种方式导致测试样本在子空间中的拟合误差较大。而传统的词典学习方法将原始样本转换到稀疏子空间时,并不能保证稀疏子空间内每类样本的稀疏编码聚集在一起,不利于人脸的识别。此外,常用的词典学习方法都是在原始欧式空间进行的,是的隐藏在数据中的非线性结构无法被捕捉,会导致人脸的非线性结构信息丢失。
发明内容
本发明针对现有人脸识别方法存在拟合误差大、精确度不高等上述不足,提供一种基于核空间的分类聚集稀疏表示的人脸识别方法,该方法在稀疏表达约束中加热分类集中约束项,使同类样本在子空间中更加聚集,不同类样本在子空间中相对分散,有利于样本在高维子空间中的聚类,提高了识别效果。
本发明的技术方案是:一种基于核空间的分类聚集稀疏表示的人脸识别方法,含有以下步骤:
步骤一:采用卷积神经网络对人脸图像提取人脸特征。
步骤二:训练分类聚集词典,其训练步骤为:
(一)输入训练样本,采用包含C个种类的图片样本训练分类词典,训练样本空间用X表示,表示为X=[X1,X2,…,Xc,…,XC]∈RD×N,D表示训练样本的特征维度,N是训练样本总的个数,X1,X2,…,Xc,…,XC分别表示第1,2,…,c,…,C类样本,定义N1,N2,…,Nc,…,NC分别表示每类训练样本数目,则N=N1+N2+…Nc+…+NC
(二)对训练样本进行二范数归一化,得到归一化的训练样本集X;
(三)对每一类训练样本分别训练其聚集词典,训练词典的过程为:
1、取出第c类样本Xc,将Xc映射到核空间φ(Xc);
2、稀疏编码词典φ(Xc)Wc的训练需要满足约束条件,所述约束条件的目标函数为:
式中,α为稀疏编码算法中稀疏项约束的惩罚系数,η为稀疏编码词典Xc中分类聚集约束的惩罚系数,Sc为第c类核空间训练样本的稀疏表示矩阵,K为学习得到的词典的大小,是一个权重矩阵,其每一列表示核空间样本对构造词典中每个词条的贡献大小,词典Bc=φ(Xc)Wc,φ表示样本在核空间中的映射;
3、对步骤2中约束条件的目标函数进行求解,即对公式(1)求解,求解方法为:首先,对Wc和Sc进行初始化,随机生成两个矩阵,其中,Wc是Nc×K矩阵,Sc是K×Nc矩阵;然后,交替迭代更新Wc和Sc,求取最优的权重矩阵Wc和稀疏表示矩阵Sc,使得目标函数值最小,将每一类训练样本的权重矩阵Wc放置到一个大的矩阵当中,获得维数为N行C×K列的权重矩阵W,该权重矩阵W即为分类聚集词典;
步骤三:对图像进行识别,其步骤为:
(一)采用卷积神经网络提取待识别测试样本的图像特征,定义y∈RD×1表示一幅待识别的测试样本图像特征;并将测试样本图像特征y映射到核空间φ(y);
(二)使用步骤二中获得的权重矩阵W,对核空间φ(y)进行拟合,获取拟合函数;
(三)对步骤(二)中获取的拟合函数进行求解;
(四)核空间φ(y)在每类样本所构成子空间的拟合误差;
(五)比较核空间φ(y)和每类样本的拟合误差,待识别图像则属于拟合误差最小的那个类别。
作为优选,所述步骤二的步骤3中,对步骤2中约束条件的目标函数进行求解的具体过程为:
(1)固定Wc,更新Sc;将Wc带入约束条件的目标函数,这时该目标函数转化成为一个关于Sc的l1范数正则化最小二乘问题,即目标函数转化为:
忽略常数项,上述公式(2)可以简化为:
κ(Xc,Xc)=<φ(Xc),φ(Xc)>为核函数。去掉常数项,获得以下公式:
对Sc矩阵中的每一个元素进行更新,使公式(4)最优,对Sc矩阵中的每一个元素进行更新的方法步骤为:
定义Sc中的第k行第n列的元素为更新Sc矩阵,使Sc矩阵满足公式(3)的约束条件为:逐次更新Sc矩阵每一行每一列的元素;设第k行第n列的元素为未知,Sc矩阵其它元素为已知,则公式(3)可以变形为:
上述公式(5)为变量的一元二次方程,则的最优解为变量满足如下方程:
其中,E=WcTκ(Xc,Xc)Wc
依次遍历Sc矩阵每一个元素,即求取最优的稀疏表示矩阵Sc
(2)固定步骤(1)中求取的稀疏表示矩阵Sc,更新权重矩阵Wc,这时约束条件的目标函数转换为权重矩阵Wc的l2范数约束的最小二乘问题,即目标函数转化为:
采用拉格朗日乘子的方法计算l2范数约束的最小二乘问题,忽略公式(7)中的常数项约束,则公式(7)变化为:
式中,λk为拉格朗日乘子;
根据Karush-Kuhn-Tucker条件,上述公式(8)取得最优解需要满足如下条件:
对权重矩阵Wc的每一列逐次进行更新,更新某一列时,其余列则为固定值;
通过求解公式(9)获得Wc的每一列更新值为:
式中,表示在满足公式(7)的约束条件下的权重矩阵Wc的第k列的最优值;F=ScScT
遍历Wc的每一列来更新Wc的权值;
(3)交替更新上述步骤(1)和步骤(2)来更新稀疏表示矩阵Sc和权重矩阵Wc的权值,当上述公式(1)的目标函数值f(Wc,Sc)趋于稳定时,稀疏表示矩阵Sc和权重矩阵Wc更新完毕;
(4)依次训练每一类训练样本的稀疏表示矩阵Sc和权重矩阵Wc
(5)将每一类训练样本的权重矩阵Wc放置到一个大的矩阵当中,获得维数为N行C×K列的权重矩阵W,权重矩阵W表示为:
上述获得的权重矩阵W即为分类聚集词典。
进一步的,步骤三的步骤(二)中获取的拟合函数为:
式中,s表示测试样本φ(y)的稀疏编码,φ(X)表示训练样本X在核空间的映射。
进一步的,步骤三的步骤(三)中,对步骤(二)中公式(12)表示的拟合函数进行求解,其求解结果为:
式中,sk表示s中的第k个元素,
进一步的,步骤三的步骤(四)中,核空间φ(y)在每类样本所构成子空间的拟合误差用r(c)表示,其表达式为:
式中,φ(y)为测试样本图像特征y在核空间的映射。
本发明的有益效果是:本发明考虑了用训练样本对测试样本进行稀疏表达时,每个训练样本对子空间构造的权重的不同,以及离类中心近的训练样本对构造子空间应当具有更大的权重,采用φ(Xc)Wc矩阵构造新的稀疏表达词典,其中φ(Xc)是每类训练样本,Wc为本发明提出的词典权重矩阵;本发明在稀疏表达约束中加入分类集中约束项,使同类样本在子空间中更加聚集,不同类样本在子空间中相对分散,并推倒出该人脸识别方法的迭代优化方法。与现有技术相比,本发明提出的人脸识别方法能够有效的降低测试样本在相应子空间内的拟合误差,且使得相同类别的样本在稀疏空间内能够聚集在一起,从而提升了人脸识别性能;推广至核空间后,本发明人脸识别方法处理非线性结构和关系的能力增强,能够有效发掘复杂数据的隐藏特征,进一步提升人脸识别性能。
附图说明
图1为本发明具体实施例训练分类聚集词典的流程图。
图2为本发明具体实施例对样本进行图像识别的流程图。
具体实施方式
下面结合附图对本发明作出进一步说明。
一种基于核空间的分类聚集稀疏表示的人脸识别方法,含有以下步骤:
步骤一:采用卷积神经网络对人脸图像提取人脸特征。本实施例中,选用VGG模型(Deep face recognition,O.M.Parkhi and A.Vedaldi and A.Zisserman,Deep FaceRecognition,Proceedings oftheBritishMachineVision Conference(BMVC),2015)。首先,将人脸图像尺度大小变为224×224大小,然后调用VGG模型,得到人脸图像的特征。
步骤二:训练分类聚集词典,其训练步骤为:
(一)输入训练样本,采用包含C个种类的图片样本训练分类词典,训练样本空间用X表示,表示为X=[X1,X2,…,Xc,…,XC]∈RD×N,D表示训练样本的特征维度,N是训练样本总的个数,X1,X2,…,Xc,…,XC分别表示第1,2,…,c,…,C类样本,定义N1,N2,…,Nc,…,NC分别表示每类训练样本数目,则N=N1+N2+…Nc+…+NC
(二)对训练样本进行二范数归一化,得到归一化的训练样本集X;
(三)对每一类训练样本分别训练其聚集词典,训练词典的过程为:
1、取出第c类样本Xc,将Xc映射到核空间φ(Xc);
2、稀疏编码词典φ(Xc)Wc的训练需要满足约束条件,所述约束条件的目标函数为:
式中,α为稀疏编码算法中稀疏项约束的惩罚系数,η为稀疏编码词典Xc中分类聚集约束的惩罚系数,Sc为第c类核空间训练样本的稀疏表示矩阵,K为学习得到的词典的大小,是一个权重矩阵,其每一列表示核空间样本对构造词典中每个词条的贡献大小,词典Bc=φ(Xc)Wc,φ表示样本在核空间中的映射,φ是未知的,但可以通过核函数计算其内积,例如:κ(x,y)=<φ(x),φ(y)>。
3、对步骤2中约束条件的目标函数进行求解,即对公式(1)求解,求解方法为:首先,对Wc和Sc进行初始化,随机生成两个矩阵,其中,Wc是Nc×K矩阵,Sc是K×Nc矩阵;然后,交替迭代更新Wc和Sc,求取最优的权重矩阵Wc和稀疏表示矩阵Sc,使得目标函数值最小,将每一类训练样本的权重矩阵Wc放置到一个大的矩阵当中,获得权重矩阵W,该权重矩阵W即为分类聚集词典;其具体求解过程为:
(1)固定Wc,更新Sc;将Wc带入约束条件的目标函数,这时该目标函数转化成为一个关于Sc的l1范数正则化最小二乘问题,即目标函数转化为:
忽略常数项,上述公式(2)可以简化为:
κ(Xc,Xc)=<φ(Xc),φ(Xc)>为核函数。去掉常数项,获得以下公式:
对Sc矩阵中的每一个元素进行更新,使公式(4)最优,对Sc矩阵中的每一个元素进行更新的方法步骤为:
定义Sc中的第k行第n列的元素为更新Sc矩阵,使Sc矩阵满足公式(3)的约束条件为:逐次更新Sc矩阵每一行每一列的元素;设第k行第n列的元素为未知,Sc矩阵其它元素为已知,则公式(3)可以变形为:
上述公式(5)为变量的一元二次方程,则的最优解为变量满足如下方程:
其中,E=WcTκ(Xc,Xc)Wc
依次遍历Sc矩阵每一个元素,即求取最优的稀疏表示矩阵Sc
(2)固定步骤(1)中求取的稀疏表示矩阵Sc,更新权重矩阵Wc,这时约束条件的目标函数转换为权重矩阵Wc的l2范数约束的最小二乘问题,即目标函数转化为:
采用拉格朗日乘子的方法计算l2范数约束的最小二乘问题,忽略公式(7)中的常数项约束,则公式(7)变化为:
式中,λk为拉格朗日乘子;
根据Karush-Kuhn-Tucker条件,上述公式(8)取得最优解需要满足如下条件:
对权重矩阵Wc的每一列逐次进行更新,更新某一列时,其余列则为固定值;
通过求解公式(9)获得Wc的每一列更新值为:
式中,表示在满足公式(7)的约束条件下的权重矩阵Wc的第k列的最优值;F=ScScT
遍历Wc的每一列来更新Wc的权值;
(3)交替更新上述步骤(1)和步骤(2)来更新稀疏表示矩阵Sc和权重矩阵Wc的权值,当上述公式(1)的目标函数值f(Wc,Sc)趋于稳定时,稀疏表示矩阵Sc和权重矩阵Wc更新完毕;
(4)依次训练每一类训练样本的稀疏表示矩阵Sc和权重矩阵Wc
(5)将每一类训练样本的权重矩阵Wc放置到一个大的矩阵当中,获得维数为N行C×K列的权重矩阵W,权重矩阵W表示为:
上述获得的权重矩阵W即为分类聚集词典。
步骤三:对图像进行识别,其步骤为:
(一)采用卷积神经网络提取待识别测试样本的图像特征,具体如下:将测试样本图像尺度变为224×224mm大小,然后调用VGG模型,提取该测试样本图像的特征,定义y∈RD ×1表示一幅待识别的测试样本图像特征。
(二)使用步骤二中获得的权重矩阵W,对核空间φ(y)进行拟合,获取拟合函数,获取的拟合函数为:
式中,s表示测试样本φ(y)的稀疏编码,φ(X)表示训练样本X在核空间的映射。
(三)对步骤(二)中获取的拟合函数进行求解,其求解结果为:
式中,sk表示s中的第k个元素,
(四)求核空间φ(y)在每类样本所构成子空间的拟合误差,用r(c)表示,其表达式为:
式中,φ(y)为测试样本图像特征y在核空间的映射。
(五)比较核空间φ(y)和每类样本的拟合误差,待识别图像则属于拟合误差最小的那个类别。
通过本发明上述方法进行人脸识别,一方面能够有效地降低测试样本在相应子空间内的拟合误差,识别精确度高,另一方面,使得相同类别的测试样本在稀疏空间内能够聚集在一起,从而提升人脸识别的性能。由于本发明人脸识别方法处理非线性结构和关系的能力增强,能够有效发掘复杂数据的掩藏特征,进一步提升了人脸识别性能。
以上所举实施例仅用为方便举例说明本发明,并非对本发明保护范围的限制,在本发明所述技术方案范畴,所属技术领域的技术人员所作各种简单变形与修饰,均应包含在以上申请专利范围中。

Claims (5)

1.一种基于核空间的分类聚集稀疏表示的人脸识别方法,其特征在于:含有以下步骤:
步骤一:采用卷积神经网络对人脸图像提取人脸特征;
步骤二:训练分类聚集词典,其训练步骤为:
(一)输入训练样本,采用包含C个种类的图片样本训练分类词典,训练样本空间用X表示,表示为X=[X1,X2,…,Xc,…,XC]∈RD×N,D表示训练样本的特征维度,N是训练样本总的个数,X1,X2,…,Xc,…,XC分别表示第1,2,…,c,…,C类样本,定义N1,N2,…,Nc,…,NC分别表示每类训练样本数目,则N=N1+N2+…Nc+…+NC
(二)对训练样本进行二范数归一化,得到归一化的训练样本集X;
(三)对每一类训练样本分别训练其聚集词典,训练词典的过程为:
1、取出第c类样本Xc,将Xc映射到核空间φ(Xc);
2、稀疏编码词典φ(Xc)Wc的训练需要满足约束条件,所述约束条件的目标函数为:
f ( W c , S c ) = { | | &phi; ( X c ) - &phi; ( X c ) W c S c | | F 2 + 2 &alpha; | | S c | | 1 + &eta; &Sigma; n = 1 N c | | S &CenterDot; n c - 1 N c &Sigma; m = 1 N c S &CenterDot; m c | | 2 2 } s . t . | | &phi; ( X c ) W &CenterDot; k c | | F 2 &le; 1 , &ForAll; k = 1 , 2 , ... , K . - - - ( 1 )
式中,α为稀疏编码算法中稀疏项约束的惩罚系数,η为稀疏编码词典Xc中分类聚集约束的惩罚系数,Sc为第c类核空间训练样本的稀疏表示矩阵,K为学习得到的词典的大小,是一个权重矩阵,其每一列表示核空间样本对构造词典中每个词条的贡献大小,词典Bc=φ(Xc)Wc,φ表示样本在核空间中的映射;
3、对步骤2中约束条件的目标函数进行求解,即对公式(1)求解,求解方法为:首先,对Wc和Sc进行初始化,随机生成两个矩阵,其中,Wc是Nc×K矩阵,Sc是K×Nc矩阵;然后,交替迭代更新Wc和Sc,求取最优的权重矩阵Wc和稀疏表示矩阵Sc,使得目标函数值最小,将每一类训练样本的权重矩阵Wc放置到一个大的矩阵当中,获得权重矩阵W,该权重矩阵W即为分类聚集词典;
步骤三:对图像进行识别,其步骤为:
(一)采用卷积神经网络提取待识别测试样本的图像特征,定义y∈RD×1表示一幅待识别的测试样本图像特征,并将测试样本图像特征y映射到核空间φ(y);
(二)使用步骤二中获得的权重矩阵W,对核空间φ(y)进行拟合,获取拟合函数;
(三)对步骤(二)中获取的拟合函数进行求解;
(四)求核空间φ(y)在每类样本所构成子空间的拟合误差;
(五)比较核空间φ(y)和每类样本的拟合误差,待识别图像则属于拟合误差最小的那个类别。
2.如权利要求1所述的基于核空间的分类聚集稀疏表示的人脸识别方法,其特征在于:所述步骤二的步骤3中,对步骤2中约束条件的目标函数进行求解的具体过程为:
(1)固定Wc,更新Sc;将Wc带入约束条件的目标函数,这时该目标函数转化成为一个关于Sc的l1范数正则化最小二乘问题,即目标函数转化为:
f ( S c ) = { | | &phi; ( X c ) - &phi; ( X c ) W c S c | | F 2 + 2 &alpha; | | S c | | 1 + &eta; &Sigma; n = 1 N c | | S &CenterDot; n c - 1 N c &Sigma; m = 1 N c S &CenterDot; m c | | 2 2 } - - - ( 2 )
忽略常数项,上述公式(2)可以简化为:
f ( S c ) = t r a c e { &kappa; ( X c , X c ) - 2 &kappa; ( X c , X c ) W c S c } + t r a c e { S c T ( W c T &kappa; ( X c , X c ) W c ) S c } + 2 &alpha; | | S c | | 1 + &eta; &Sigma; n = 1 N c | | N c - 1 N c S &CenterDot; n c - 1 N c ( &Sigma; m = 1 , m &NotEqual; n N c S &CenterDot; m c ) | | 2 2 - - - ( 3 )
κ(Xc,Xc)=<φ(Xc),φ(Xc)>为核函数;去掉常数项,获得以下公式:
f ( S c ) = - 2 &Sigma; n = 1 N c &lsqb; &kappa; ( X c , X c ) W c &rsqb; &CenterDot; n S &CenterDot; n c + &Sigma; n = 1 N c S &CenterDot; n c T &lsqb; W c T &kappa; ( X c , X c ) W c &rsqb; S &CenterDot; n c + 2 &alpha; &Sigma; n = 1 N c | S &CenterDot; n c | + &eta; &Sigma; n = 1 N c ( N c - 1 N c ) 2 S &CenterDot; n c T S &CenterDot; n c - 2 &eta; N c - 1 N c 2 S &CenterDot; n c &Sigma; m = 1 , m &NotEqual; n N c S &CenterDot; m c - - - ( 4 )
对Sc矩阵中的每一个元素进行更新,使公式(4)最优,对Sc矩阵中的每一个元素进行更新的方法步骤为:
定义Sc中的第k行第n列的元素为更新Sc矩阵,使Sc矩阵满足公式(3)的约束条件为:逐次更新Sc矩阵每一行每一列的元素;设第k行第n列的元素为未知,Sc矩阵其它元素为已知,则公式(3)可以变形为:
f ( S k n c ) = S k n c 2 { &lsqb; W c T &kappa; ( X c , X c ) W c &rsqb; k k + ( N c - 1 N c ) 2 } + 2 S k n c { &Sigma; l = 1 , l &NotEqual; k K &lsqb; W c T &kappa; ( X c , X c ) W c &rsqb; k l S ln c } - 2 &eta;S k n c ( N c - 1 N c 2 &Sigma; m = 1 , m &NotEqual; n N S k m c ) - 2 S k n 2 { &lsqb; W c T &kappa; ( X c , X c ) &rsqb; k n } + 2 &alpha; | S k n c | - - - ( 5 )
上述公式(5)为变量的一元二次方程,则的最优解为变量满足如下方程:
S k n c = 1 1 + &eta; ( N c - 1 N c ) 2 min { A k n - &lsqb; E ( S ~ c ) k n &rsqb; k n , - &alpha; } + 1 1 + &eta; ( N c - 1 N c ) 2 max { A k n - &lsqb; E ( S ~ c ) k n &rsqb; k n , &alpha; } - - - ( 6 )
其中,E=WcTκ(Xc,Xc)Wc
依次遍历Sc矩阵每一个元素,即求取最优的稀疏表示矩阵Sc
(2)固定步骤(1)中求取的稀疏表示矩阵Sc,更新权重矩阵Wc,这时约束条件的目标函数转换为权重矩阵Wc的l2范数约束的最小二乘问题,即目标函数转化为:
f ( W c ) = | | &phi; ( X c ) - &phi; ( X c ) W c S c | | F 2 s . t . | | &phi; ( X c ) W &CenterDot; k c | | F 2 &le; 1 , &ForAll; k = 1 , 2 , ... , K . - - - ( 7 )
采用拉格朗日乘子的方法计算l2范数约束的最小二乘问题,忽略公式(7)中的常数项约束,则公式(7)变化为:
l ( W c , &lambda; k , &mu; k ) = - 2 &Sigma; k = 1 K &lsqb; S c &kappa; ( X c , X c ) &rsqb; k &CenterDot; W &CenterDot; k c + &Sigma; k = 1 K W &CenterDot; k c T &lsqb; &kappa; ( X c , X c ) W c S c S c T &rsqb; &CenterDot; k + &lambda; k ( 1 - &lsqb; W c T &kappa; ( X c , X c ) W c &rsqb; k k ) - - - ( 8 )
式中,λk为拉格朗日乘子;
根据Karush-Kuhn-Tucker条件,上述公式(8)取得最优解需要满足如下条件:
&part; l ( W c , &lambda; k , &mu; k ) &part; W &CenterDot; k c = 0 1 - &lsqb; W c T &kappa; ( X c , X c ) W c &rsqb; k k = 0 &lambda; k > 0 - - - ( 9 )
对权重矩阵Wc的每一列逐次进行更新,更新某一列时,其余列则为固定值;
通过求解公式(9)获得Wc的每一列更新值为:
W &CenterDot; k c = S k &CenterDot; c T - &lsqb; W c &OverBar; k F &rsqb; &CenterDot; k ( S k &CenterDot; c T - &lsqb; W c &OverBar; k F &rsqb; &CenterDot; k ) T &kappa; ( X c , X c ) ( S k &CenterDot; c T - &lsqb; W c &OverBar; k F &rsqb; &CenterDot; k ) - - - ( 10 )
式中,表示在满足公式(7)的约束条件下的权重矩阵Wc的第k列的最优值;F=ScScT
遍历Wc的每一列来更新Wc的权值;
(3)交替更新上述步骤(1)和步骤(2)来更新稀疏表示矩阵Sc和权重矩阵Wc的权值,当上述公式(1)的目标函数值f(Wc,Sc)趋于稳定时,稀疏表示矩阵Sc和权重矩阵Wc更新完毕;
(4)依次训练每一类训练样本的稀疏表示矩阵Sc和权重矩阵Wc
(5)将每一类训练样本的权重矩阵Wc放置到一个大的矩阵当中,获得维数为N行C×K列的权重矩阵W,权重矩阵W表示为:
W = W 1 0 0 ... 0 0 W 2 0 ... 0 0 0 W 3 ... 0 ... ... ... ... ... 0 0 0 ... W c - - - ( 11 )
上述获得的权重矩阵W即为分类聚集词典。
3.如权利要求1所述的基于核空间的分类聚集稀疏表示的人脸识别方法,其特征在于:步骤三的步骤(二)中获取的拟合函数为:
f ( s ) = | | &phi; ( y ) - &phi; ( X ) W s | | 2 2 + 2 &alpha; | | s | | 1 - - - ( 12 )
式中,s表示核空间φ(y)的稀疏编码,φ(X)表示训练样本X在核空间的映射。
4.如权利要求3所述的基于核空间的分类聚集稀疏表示的人脸识别方法,其特征在于:步骤三的步骤(三)中,对步骤(二)中公式(12)表示的拟合函数进行求解,其求解结果为:
s k = max ( &lsqb; W T &kappa; ( X c , y ) &rsqb; - &lsqb; W T &kappa; ( X , X ) W &rsqb; s ~ k , &alpha; ) + min ( &lsqb; W T &kappa; ( X c , y ) &rsqb; - &lsqb; W T &kappa; ( X , X ) W &rsqb; s ~ k , - &alpha; ) - - - ( 13 )
式中,sk表示s中的第k个元素,
5.如权利要求1所述的基于核空间的分类聚集稀疏表示的人脸识别方法,其特征在于:步骤三的步骤(四)中,核空间φ(y)在每类样本所构成子空间的拟合误差用r(c)表示,其表达式为:
r ( c ) = | | &phi; ( y ) - &phi; ( X c ) W c s c | | 2 2 - - - ( 14 )
式中,φ(y)为测试样本图像特征y在核空间的映射。
CN201610065827.XA 2016-01-31 2016-01-31 基于核空间的分类聚集稀疏表示的人脸识别方法 Active CN105760821B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610065827.XA CN105760821B (zh) 2016-01-31 2016-01-31 基于核空间的分类聚集稀疏表示的人脸识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610065827.XA CN105760821B (zh) 2016-01-31 2016-01-31 基于核空间的分类聚集稀疏表示的人脸识别方法

Publications (2)

Publication Number Publication Date
CN105760821A CN105760821A (zh) 2016-07-13
CN105760821B true CN105760821B (zh) 2017-06-06

Family

ID=56342820

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610065827.XA Active CN105760821B (zh) 2016-01-31 2016-01-31 基于核空间的分类聚集稀疏表示的人脸识别方法

Country Status (1)

Country Link
CN (1) CN105760821B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106250929A (zh) * 2016-07-29 2016-12-21 中国石油大学(华东) 弹性网络约束自解释稀疏表示分类器的设计方法
CN106326874A (zh) * 2016-08-30 2017-01-11 天津中科智能识别产业技术研究院有限公司 一种人眼图像中的虹膜识别方法及其装置
WO2018080702A1 (en) 2016-10-31 2018-05-03 Google Llc Face reconstruction from a learned embedding
CN106709494B (zh) * 2017-01-10 2019-12-24 天津师范大学 一种基于耦合空间学习的场景文字识别方法
CN107085700A (zh) * 2017-01-16 2017-08-22 安徽大学 一种基于稀疏表示与单隐层神经网络技术相结合的人脸识别方法
CN106897685A (zh) * 2017-02-17 2017-06-27 深圳大学 基于核非负矩阵分解的字典学习和稀疏特征表示的人脸识别方法及系统
CN107271965B (zh) * 2017-06-13 2020-02-04 电子科技大学 类聚集子空间的真假目标一维距离像特征提取方法
CN107392107B (zh) * 2017-06-24 2020-09-11 天津大学 一种基于异构张量分解的人脸特征提取方法
GB201710560D0 (en) * 2017-06-30 2017-08-16 Norwegian Univ Of Science And Tech (Ntnu) Detection of manipulated images
CN107391996B (zh) * 2017-08-02 2021-01-26 广东工业大学 一种基于l1范数神经网络的身份验证方法及装置
CN107729914B (zh) * 2017-09-06 2021-06-25 鲁小杰 一种病理数据的检测方法
CN107909019A (zh) * 2017-11-07 2018-04-13 重庆邮电大学 一种基于ti‑spca的人脸自动对齐及识别方法
CN109190753A (zh) * 2018-08-16 2019-01-11 新智数字科技有限公司 神经网络的处理方法及装置、存储介质、电子装置
CN109359694B (zh) * 2018-10-24 2021-07-02 中国石油大学(华东) 一种基于混合协同表示的分类器的图像分类方法和装置
CN109522844B (zh) * 2018-11-19 2020-07-24 燕山大学 一种社交亲密度确定方法及系统
CN110472514B (zh) * 2019-07-22 2022-05-31 电子科技大学 一种自适应车辆目标检测算法模型及其构建方法
WO2021042328A1 (zh) * 2019-09-05 2021-03-11 深圳大学 自构余弦核空间中人脸数据非负特征表示和识别方法、装置、系统及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930301A (zh) * 2012-10-16 2013-02-13 西安电子科技大学 基于特征权重学习与核稀疏表示的图像分类方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667246B (zh) * 2009-09-25 2011-07-20 西安电子科技大学 基于核稀疏表示的人脸识别方法
CN102609681B (zh) * 2012-01-12 2014-04-30 北京大学 基于字典学习模型的人脸识别方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930301A (zh) * 2012-10-16 2013-02-13 西安电子科技大学 基于特征权重学习与核稀疏表示的图像分类方法

Also Published As

Publication number Publication date
CN105760821A (zh) 2016-07-13

Similar Documents

Publication Publication Date Title
CN105760821B (zh) 基于核空间的分类聚集稀疏表示的人脸识别方法
WO2022160771A1 (zh) 基于自适应多尺度特征提取模型的高光谱图像分类方法
CN111126333B (zh) 一种基于轻量卷积神经网络的垃圾分类方法
Zhong et al. An adaptive artificial immune network for supervised classification of multi-/hyperspectral remote sensing imagery
CN110348399B (zh) 基于原型学习机制和多维残差网络的高光谱智能分类方法
CN103605972B (zh) 一种基于分块深度神经网络的非限制环境人脸验证方法
CN107122809A (zh) 基于图像自编码的神经网络特征学习方法
Wang et al. Remote sensing landslide recognition based on convolutional neural network
CN104732244B (zh) 基于小波变换、多策略pso和svm集成的遥感图像分类方法
CN105740912B (zh) 基于核范数正则化的低秩图像特征提取的识别方法及系统
CN102324038B (zh) 一种基于数字图像的植物种类识别方法
CN104392246B (zh) 一种基于类间类内面部变化字典的单样本人脸识别方法
CN109902590A (zh) 深度多视图特征距离学习的行人重识别方法
CN108171318A (zh) 一种基于模拟退火—高斯函数的卷积神经网络集成方法
CN108256486B (zh) 一种基于非负低秩和半监督学习的图像识别方法及装置
CN113344045B (zh) 一种结合hog特征提高sar船只分类精度的方法
Chen et al. Agricultural remote sensing image cultivated land extraction technology based on deep learning
CN116127298B (zh) 基于三元组损失的小样本射频指纹识别方法
CN105631478A (zh) 基于稀疏表示字典学习的植物分类方法
CN110135520A (zh) 基于图补全和自适应视角权重分配的不完备多视角聚类方法、装置、系统及存储介质
Huang et al. Design and Application of Face Recognition Algorithm Based on Improved Backpropagation Neural Network.
CN108520201A (zh) 一种基于加权混合范数回归的鲁棒人脸识别方法
CN103942545A (zh) 一种基于双向压缩数据空间维度缩减的人脸识别方法和装置
CN105930788A (zh) 非下采样轮廓波和主成分分析相结合的人脸识别方法
CN110210562A (zh) 基于深度网络和稀疏Fisher矢量的图像分类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant