CN105528620A - 一种联合鲁棒主成分特征学习与视觉分类方法及系统 - Google Patents

一种联合鲁棒主成分特征学习与视觉分类方法及系统 Download PDF

Info

Publication number
CN105528620A
CN105528620A CN201510918300.2A CN201510918300A CN105528620A CN 105528620 A CN105528620 A CN 105528620A CN 201510918300 A CN201510918300 A CN 201510918300A CN 105528620 A CN105528620 A CN 105528620A
Authority
CN
China
Prior art keywords
sample
classification
major component
sparse
component feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510918300.2A
Other languages
English (en)
Other versions
CN105528620B (zh
Inventor
张召
贾磊
李凡长
张莉
王邦军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Hengzhihui Intelligent Technology Co ltd
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201510918300.2A priority Critical patent/CN105528620B/zh
Publication of CN105528620A publication Critical patent/CN105528620A/zh
Application granted granted Critical
Publication of CN105528620B publication Critical patent/CN105528620B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种联合鲁棒主成分特征学习与视觉分类方法及系统,通过将鲁棒主成分特征学习、编码错误和基于主成分特征的分类错误集成到一个统一的最小化框架,可同时进行联合低秩与稀疏特征提取和数据纠错,且可确保得到的特征对于分类是最优的。为了得到描述性更强的鲁棒特征,同时考虑数据的低秩与稀疏特性,同时通过将一个投影嵌入的特征进行低秩和L1-范数最小化,确保提取的特征满足低秩与稀疏特性。最终得到一个线性投影矩阵P和一个线性分类器W。P可直接提取待测样本的联合特征,进而将特征向W进行映射,可得到其软类别标签,通过软类别标签中最大值对应的位置,得到最准确的视觉分类结果。此外,通过得到P和W,有效提升了测试过程的可拓展性。

Description

一种联合鲁棒主成分特征学习与视觉分类方法及系统
技术领域
本发明涉及计算机视觉和机器学习技术领域,更具体地说,涉及一种联合鲁棒主成分特征学习与视觉分类方法及系统。
背景技术
在众多的实际应用中,现实生活中的许多模式(例如图像、音频、视频等多媒体对象)均可用高维的属性或特征进行描述,然而高维的数据通常含有许多无用的干扰性特征、冗余特征、以及噪声数据等。随着计算机技术的不断发展,如何通过特征学习或低秩与稀疏编码技术来恢复原始数据或更准确地描述数据已经发展成为计算机视觉和图像处理中非常重要的一个研究课题。特征提取的目的在于找到一个潜在投影或映射,通过将高维的数据变换到一个描述性更强特征空间,同时有效保持数据中的重要几何特性。
最具代表性的数据特征提取方法是主成分分析(PrincipalComponentAnalysis,简称PCA)。PCA是基于变量协方差矩阵对信息进行处理、压缩和特征抽取的有效方法。PCA可有效揭示数据间的线性关系,但是基于L2范式的PCA被证明对噪声或异常非常敏感。近年来,为了克服PCA的这个缺点,一些更加鲁棒模型被提出,例如RPCA(RobustPrincipalComponentAnalysis),基于L1范式的PCA(PCA-L1)和基于核范数的IRPCA(InductiveRobustPrincipalComponentAnalysis)等。PCA-L1通过将PCA中的L2范数替换成L1范数来衡量散度矩阵,因此这种方法具有旋转不变性并对噪音和异常值健壮。IRPCA通过核范式最小化问题来恢复和表示原始数据,学习得到一个低秩的投影将给定数据映射到基础子空间中,进而除去或纠正样本数据中可能含有的错误。和PCA-L1和IRPCA相比,RPCA无法处理新来数据,即直推式模型。尽管上述PCA-L1和IRPCA均能够有效提升数据特征描述过程中鲁棒性,但是发明人发现,上述技术方案只考虑了特征提取问题,且在特征提取的过程中只考虑了数据的低秩或稀疏特性,但是却无法保证提取得到的鲁棒特征对于分类是最优的。
综上所述,如何提供一种能够在进行联合低秩与稀疏主成分特征提取的同时,确保得到的联合主成分特征对于分类是最优的的技术方案,是目前本领域技术人员亟待解决的问题。
发明内容
本发明的目的是提供一种联合鲁棒主成分特征学习与视觉分类方法及系统,为了确保得到的联合主成分特征对于分类是最优的,本发明将鲁棒主成分特征学习、编码错误和基于主成分特征的分类错误集成到一个统一的最小化框架,以克服现有技术中只是单纯关注于编码低秩或稀疏主成分特征,且没有同时考虑联合分类的问题,即本申请能够在进行联合低秩与稀疏主成分特征提取的同时,确保得到的联合主成分特征对于分类是最优的。
一种联合鲁棒主成分特征学习与视觉分类方法,包括:
基于训练样本集,通过将鲁棒主成分特征学习、编码错误和基于主成分特征的分类错误集成到一个统一的最小化框架,可同时进行联合低秩与稀疏主成分特征提取和数据纠错,且可确保得到的联合主成分特征对于分类是最优的;为了得到描述性更强的鲁棒特征,同时考虑了数据的鲁棒与稀疏特性,同时将经过一个投影嵌入的特征进行低秩和L1-范数最小化,确保提取的特征满足低秩与稀疏特性;最终得到一个线性投影矩阵和一个线性分类器;其中,所述训练样本集中包含的训练样本为已知其类别的样本;
利用所述线性投影矩阵通过嵌入方式提取待测样本的联合低秩与稀疏主成分特征;其中,所述待测样本为未知其类别的样本;
将提取到的所述待测样本对应的联合低秩与稀疏主成分特征向所述线性分类器进行映射,得到所述待测样本的软类别标签,其中包括测试样本归属各个类别的概率,根据所述概率中最大值对应的位置,确定为所述待测样本的类别,完成分类过程。
优选的,在基于所述待测样本集得到所述线性投影矩阵及所述线性分类器之前,还包括:
对所述训练样本集中的训练样本进行预处理。
优选的,基于所述待测样本集得到所述线性投影矩阵及所述线性分类器,包括:
按照下列公式将所述训练样本集分解为一个联合特征矩阵PX和一个稀疏错误矩阵E,并得到所述线性投影矩阵P及所述线性分类器W:
M i n P , E , W ( 1 - α ) | | P X | | * + α | | P X | | 1 + γ | | H T - X T P T W | | 2 , 1 + λ | | E | | l
s.t.X=PX+E
其中,X表示所述训练样本集,n表示每个所述训练样本的维度,N表示所述训练样本的数量,表示n×N的矩阵空间,||HT-XTPTW||2,1表示基于鲁棒l2,1范数度量的分类错误;α∈[0,1]表示用于权衡低秩主成分特征编码和稀疏主成分特征编码的最小化项;γ表示正的权衡参数,为了衡量分类错误项||HT-XTPTW||2,1的贡献程度;λ>0表示依赖于错误或噪音级别的权衡参数;表示与所述训练样本的类别对应的初始标签,c表示所述训练样本中包含的类别的个数,表示c×N的矩阵空间;||E||l表示稀疏错误项,||·||*表示核范数,||·||1表示l1范数,||·||2,1表示l2,1范数。
优选的,利用所述线性投影矩阵通过嵌入方式提取待测样本的联合低秩与稀疏主成分特征,包括:
将所述待测样本向所述线性投影矩阵进行嵌入,得到对应的嵌入结果即为所述待测样本的联合低秩与稀疏主成分特征。
一种联合鲁棒主成分特征学习与视觉分类系统,包括:
训练模块,用于:基于训练样本集,通过将鲁棒主成分特征学习、编码错误和基于主成分特征的分类错误集成到一个统一的最小化框架,可同时进行联合低秩与稀疏主成分特征提取和数据纠错,且可确保得到的联合主成分特征对于分类是最优的;为了得到描述性更强的鲁棒特征,同时考虑了数据的鲁棒与稀疏特性,同时将经过一个投影嵌入的特征进行低秩和L1-范数最小化,确保提取的特征满足低秩与稀疏特性;最终得到一个线性投影矩阵和一个线性分类器;其中,所述训练样本集中包含的训练样本为已知其类别的样本;
投影模块,用于利用所述线性投影矩阵通过嵌入方式提取待测样本的联合低秩与稀疏主成分特征;其中,所述待测样本为未知其类别的样本;
分类模块,用于将提取到的所述待测样本对应的联合低秩与稀疏主成分特征向所述线性分类器进行映射,得到所述待测样本的软类别标签,其中包括测试样本归属各个类别的概率,根据所述概率中最大值对应的位置,确定为所述待测样本的类别,完成分类过程。
优选的,还包括:
训练预处理模块,用于对所述训练样本集中的训练样本进行预处理。
优选的,训练模块包括:
训练单元,用于按照下列公式将所述训练样本集分解为一个联合特征矩阵PX和一个稀疏错误矩阵E:
M i n P , E , W ( 1 - α ) | | P X | | * + α | | P X | | 1 + γ | | H T - X T P T W | | 2 , 1 + λ | | E | | l
s.t.X=PX+E
其中,X表示所述训练样本集,n表示每个所述训练样本的维度,N表示所述训练样本的数量,表示n×N的矩阵空间,||HT-XTPTW||2,1表示基于鲁棒l2,1范数度量的分类错误;α∈[0,1]表示用于权衡低秩主成分特征编码和稀疏主成分特征编码的最小化项;γ表示正的权衡参数,为了衡量分类错误项||HT-XTPTW||2,1的贡献程度;λ>0表示依赖于错误或噪音级别的权衡参数;表示与所述训练样本的类别对应的初始标签,c表示所述训练样本中包含的类别的个数,表示c×N的矩阵空间;||E||l表示稀疏错误项,||·||*表示核范数,||·||1表示l1范数,||·||2,1表示l2,1范数。
优选的,投影模块包括:
投影单元,用于将所述待测样本向所述线性投影矩阵进行嵌入,得到对应的嵌入结果即为所述待测样本的联合低秩与稀疏主成分特征。
经由本发明公开的上述技术方案可知,与现有技术相比,本发明公开了一种联合鲁棒主成分特征学习与视觉分类的新方案,通过对训练样本运用该方案进行联合训练,生成一个用于特征提取的线性投影矩阵和线性分类器;进而利用得到的线性投影矩阵对待测样本进行嵌入处理与描述,完成联合低秩和稀疏主成分特征提取后,再将待测样本的联合低秩和稀疏主成分特征向线性分类器进行映射,可得到待测样本的软类别标签,通过软类别标签中的最大值对应的位置,确定为待测样本的类别,得到最准确的分类结果。本发明公开的上述技术方案可被直接的用于诱导式的表示和分类,此外,通过联合学习得到线性投影矩阵和线性分类器,可有效减少测试过程的时间复杂性,因此可有效提升算法的可拓展性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种联合鲁棒主成分特征学习与视觉分类方法的流程图;
图2为本发明实施例提供的一种联合鲁棒主成分特征学习与视觉分类系统的结构示意图;
图3为本发明实施例提供的一种视觉图像识别过程的预测示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本发明实施例提供的一种联合鲁棒主成分特征学习与视觉分类方法的流程图,该方法基于将鲁棒主成分特征学习、编码错误和基于主成分特征的分类错误集成到一个统一的最小化框架的思想,可以包括以下步骤:
S11:基于训练样本集,通过将鲁棒主成分特征学习、编码错误和基于主成分特征的分类错误集成到一个统一的最小化框架,可同时进行联合低秩与稀疏主成分特征提取和数据纠错,且可确保得到的联合主成分特征对于分类是最优的;为了得到描述性更强的鲁棒特征,同时考虑了数据的鲁棒与稀疏特性,同时将经过一个投影嵌入的特征进行低秩和L1-范数最小化,确保提取的特征满足低秩与稀疏特性;最终得到一个线性投影矩阵和一个线性分类器;其中,训练样本集中包含的训练样本为已知其类别的样本。
其中,线性投影矩阵为稀疏投影矩阵,线性分类器为线性多类别分类器。
S12:利用线性投影矩阵通过嵌入方式提取待测样本的联合低秩与稀疏主成分特征;其中,待测样本为未知其类别的样本。
S13:将提取到的待测样本对应的联合低秩与稀疏主成分特征向线性分类器进行映射,得到待测样本的软类别标签,其中包括测试样本归属各个类别的概率,根据概率中最大值对应的位置,确定为待测样本的类别,完成分类过程。
具体来说,待测样本可以表示为xnew,而其对应的待测样本的联合低秩与稀疏主成分特征可以表示为通过将向线性分类器投射,可以得到其软类别标签的向量,表达如下:以及相应的硬标签,表达如下:l(x)=argmini≤c(unew)i,即软标签向量μnew中的最大值对应的位置对应的类别,即为待测样本的类别。由此,利用得到的线性投影提取待测样本的联合低秩和稀疏主成分特征,将提取的上述特征向线性分类器进行映射得到其软类别标签向量(软类别标签向量中的值为待测样本归属各个类别的概率),根据软类别标签向量中的概率最大值对应的位置,得到最准确的视觉数据分类结果。本发明公开的上述一种联合鲁棒主成分特征学习与视觉分类的新方案,通过对训练样本运用该方案进行联合训练,生成一个用于特征提取的线性投影矩阵和线性分类器;进而利用得到的线性投影矩阵对待测样本进行嵌入处理与描述,完成联合低秩和稀疏主成分特征提取后,再将待测样本的联合低秩和稀疏主成分特征向线性分类器进行映射,可得到待测样本的软类别标签,通过软类别标签中的最大值对应的位置,确定为待测样本的类别,得到最准确的分类结果。本发明公开的上述技术方案可被直接的用于诱导式的表示和分类,此外,通过联合学习得到线性投影矩阵和线性分类器,可有效减少测试过程的时间复杂性,因此可有效提升算法的可拓展性。
本发明实施例提供的一种联合鲁棒主成分特征学习与视觉分类方法中,在基于待测样本集得到线性投影矩阵及线性分类器之前,还可以包括:
对训练样本集中的训练样本进行预处理。
需要说明的是,对训练样本集中的训练样本进行必要的预处理可以包括将训练样本图片的大小设置为预设的大小,等,并且,在对训练样本集中的训练样本进行预处理的同时,还可以对相关参数进行初始化设置,以保证本发明实施例提供的一种联合鲁棒主成分特征学习与视觉分类方法的顺利实现。
本发明实施例提供的一种联合鲁棒主成分特征学习与视觉分类方法中,基于待测样本集得到线性投影矩阵及线性分类器,可以包括:
按照下列公式将训练样本集分解为一个联合特征矩阵PX和一个稀疏错误矩阵E,并得到线性投影矩阵P及线性分类器W:
M i n P , E , W ( 1 - α ) | | P X | | * + α | | P X | | 1 + γ | | H T - X T P T W | | 2 , 1 + λ | | E | | l
s.t.X=PX+E
其中,X表示训练样本集,n表示每个训练样本的维度,N表示训练样本的数量,表示n×N的矩阵空间,||HT-XTPTW||2,1表示基于鲁棒l2,1范数度量的分类错误;α∈[0,1]表示用于权衡低秩主成分特征编码和稀疏主成分特征编码的最小化项;γ表示正的权衡参数,为了衡量分类错误项||HT-XTPTW||2,1的贡献程度;λ>0表示依赖于错误或噪音级别的权衡参数;表示与训练样本的类别对应的初始标签,c表示训练样本中包含的类别的个数,表示c×N的矩阵空间;||E||l表示稀疏错误项,||·||*表示核范数,||·||1表示l1范数,||·||2,1表示l2,1范数。
具体来说,对于给定的一个训练样本集根据训练样本集计算得到一个可用于联合低秩和稀疏主成分特征提取的线性投影矩阵P和线性分类器W,通过将X分解为一个联合特征矩阵PX和一个稀疏错误矩阵E,解决以下凸优化问题:
M i n P , E , W ( 1 - α ) | | P X | | * + α | | P X | | 1 + γ | | H T - X T P T W | | 2 , 1 + λ | | E | | l
s.t.X=PX+E
其中,X表示训练样本集,n表示每个训练样本的维度,N表示训练样本的数量,表示n×N的矩阵空间,||HT-XTPTW||2,1是回归分类误差,表示基于鲁棒l2,1范数度量的分类错误;γ表示正的权衡参数,为了衡量分类错误项||HT-XTPTW||2,1的贡献程度;α∈[0,1],表示用于权衡低秩主成分特征编码和稀疏主成分特征编码的最小化项;λ>0,表示依赖于错误或噪音级别的权衡参数;表示与训练样本的类别对应的初始标签,c表示训练样本中包含的类别的个数,表示c×N的矩阵空间,hj代表训练样本xj的初始标签,若xj的初始标签为i,1≤i≤c,则hi,j=1,hj中其他元素为0(即hj第i行的元素为1,其余为0);||E||l表示稀疏错误项,||·||*表示核范数,||·||1表示l1范数,||·||2,1表示l2,1范数。
而||·||*、||·||1及||·||2,1分别定义如下:
| | L | | * = Σ i σ i ( L )
| | S | | 1 = Σ i , j | S i , j |
Σ i , j | | E | | 2 , 1 = Σ j = 1 N Σ i = 1 N ( [ E ] i , j ) 2
其中,Σiσi(L)表示矩阵L的奇异值之和。
类似于其他核范式最小化问题一样,本算法最主要的计算任务就是计算奇异值分解(SingularValueDecomposition,简称SVD)的过程。为了提升计算的可拓展性,在计算线性投影矩阵P和线性分类器W的时候可转化为一个更简单的问题,可将优化结果P*分解为两个矩阵的乘积,即其中,Q*可以通过按列正交化训练样本集X计算得到,因此使用来代替P*,并令A=(Q*)TX,则问题就可描述为:
M i n J , F , E , P ^ , W , E W ( 1 - α ) | | J | | * + α | | F | | 1 + γ | | E W | | 2 , 1 + λ | | E | | l
s . t . X = P ^ A + E , P ^ A = J , P ^ A = F , H T = A T P T W + E W
本发明采用增广拉格朗日乘子法(InexactArgumentLagrangeMultiplier,简称InexactALM)对上述模型进行求解。如果对稀疏错误项E使用L2,1-norm正则化,则构造的增广拉格朗日函数如下公式所示:
其中,Y1,Y2,Y3,Y4为拉格朗日乘子,μ是正的权权衡参数。ALM方法通过解决增广拉格朗日函数来交替更新变量:
由于所要求解的变量在优化过程中存在一定的相对依赖,因此,本发明通过迭代求解如下子问题组合,通过固定其他变量来更新当前某个变量:
其中,每一步待优化的子问题都是一个凸子问题,因此可以得到有效解决。考虑到计算效率问题,本例中采用InexactALM方法,具体算法如下:输入:原始数据矩阵(训练样本集)控制参数α,γ,λ。输出:线性投影矩阵线性分类器(W*←Wk+1)。初始化:
k = 0 , J k = 0 , F k = 0 , E k = 0 , P k = 0 , W k = 0 , Y 1 k = 0 , Y 2 k = 0 , Y 3 k = 0 , Y 4 k = 0 , E k W = 0 , max μ = 10 10 , μ k = 10 - 6 , η , ϵ = 10 - 7 ;
while还未收敛时do
固定其他变量并更新低秩矩阵J:
J k + 1 = arg min J 1 - β μ k | | J | | * + 1 2 | | J - ( P ^ k A + Y 2 k / μ k ) | | k 2 = Ω ( 1 - α ) / μ k [ P ^ k A + Y 2 k / μ k ]
其中, Ω ( 1 - α ) / μ k [ P ^ k A + Y 2 k / μ k ] = U ~ S ( 1 - α ) / μ k [ Σ ] V , 的奇异值分解,Sε[x]=sgn(x)max(|x|-ε,0));
固定其他变量并更新稀疏矩阵F:
F k + 1 = arg m i n F α μ k | | F | | 1 + 1 2 | | F - ( F ^ A + Y 3 k / μ k ) | | F 2 = S α / μ k [ P k ^ A + Y 3 k / μ k ]
固定其他变量并更新稀疏误差E:
E k + 1 = arg m i n E λ μ k | | E | | 2 , 1 + 1 2 | | E - ( X - P ^ k + 1 A + Y 1 k / μ k ) | | F 2
固定其他变量并更新线性投影矩阵
固定其他变量并更新线性分类器W:
W k + 1 = ( P ^ k + 1 AA T P ^ k + 1 T ) - 1 ( P ^ k + 1 AY 4 k / μ k + P ^ k + 1 A ( H T - E k W ) )
固定其他变量并更新回归误差EW
E k + 1 W = arg m i n E W γ μ k | | E W | | 2 , 1 + 1 2 | | E W - ( H T - A T P k + 1 W k + 1 + Y 4 k / μ k ) | | F 2
固定其他变量,更新拉格朗日乘子Y1,Y2,Y3,Y4
Y 1 k + 1 = Y 1 k + μ k ( X - P ^ k + 1 A - E k + 1 )
Y 2 k + 1 = Y 2 k + μ k ( P ^ k + 1 A - J k + 1 )
Y 3 k + 1 = Y 3 k + μ k ( P ^ k + 1 A - F k + 1 )
Y 4 k + 1 = Y 4 k + μ k ( H T - A T P k + 1 T W k + 1 - E k + 1 W )
更新参数μ和μk+1=min(ημk+1,maxμ);
检查是否收敛:
( | | X - P ^ k + 1 A - E k + 1 | | &Proportional; , | | P ^ k + 1 A - J k + 1 | | &Proportional; , | | P ^ k + 1 A - F k + 1 | | &Proportional; , | | H T - A T P k + 1 T W k + 1 - E k + 1 W | | &Proportional; ) < &epsiv;
则算法迭代停止;否则k=k+1。
Endwhile
本发明实施例提供的一种联合鲁棒主成分特征学习与视觉分类方法中,利用线性投影矩阵通过嵌入方式提取待测样本的联合低秩与稀疏主成分特征,可以包括:
将待测样本向线性投影矩阵进行嵌入,得到对应的嵌入结果即为待测样本的联合低秩与稀疏主成分特征。
具体来说,得到的线性投影矩阵可表示为其中,表示n×n的矩阵空间,得到的待测样本的联合低秩与稀疏主成分特征可表示为:以利用待测样本的联合低秩与稀疏主成分特征顺利完成其分类过程。
上述本发明公开的实施例中详细描述了一种联合鲁棒主成分特征学习与视觉分类方法,对于本发明公开的上述方法可采用多种形式的系统实现,因此本发明还公开了一种联合鲁棒主成分特征学习与视觉分类系统,如图2所示,可以包括:
训练模块11,用于:基于训练样本集,通过将鲁棒主成分特征学习、编码错误和基于主成分特征的分类错误集成到一个统一的最小化框架,可同时进行联合低秩与稀疏主成分特征提取和数据纠错,且可确保得到的联合主成分特征对于分类是最优的;为了得到描述性更强的鲁棒特征,同时考虑了数据的鲁棒与稀疏特性,同时将经过一个投影嵌入的特征进行低秩和L1-范数最小化,确保提取的特征满足低秩与稀疏特性;最终得到一个线性投影矩阵和一个线性分类器;其中,训练样本集中包含的训练样本为已知其类别的样本;
投影模块12,用于利用线性投影矩阵通过嵌入方式提取待测样本的联合低秩与稀疏主成分特征;其中,待测样本为未知其类别的样本;
分类模块13,用于将提取到的待测样本对应的联合低秩与稀疏主成分特征向线性分类器进行映射,得到待测样本的软类别标签,其中包括测试样本归属各个类别的概率,根据概率中最大值对应的位置,确定为待测样本的类别,完成分类过程。
经由本发明公开的上述技术方案可知,与现有技术相比,本发明公开了一种联合鲁棒主成分特征学习与视觉分类的新方案,通过对训练样本运用该方案进行联合训练,生成一个用于特征提取的线性投影矩阵和线性分类器;进而利用得到的线性投影矩阵对待测样本进行嵌入处理与描述,完成联合低秩和稀疏主成分特征提取后,再将待测样本的联合低秩和稀疏主成分特征向线性分类器进行映射,可得到待测样本的软类别标签,通过软类别标签中的最大值对应的位置,确定为待测样本的类别,得到最准确的分类结果。本发明公开的上述技术方案可被直接的用于诱导式的表示和分类,此外,通过联合学习得到线性投影矩阵和线性分类器,可有效减少测试过程的时间复杂性,因此可有效提升算法的可拓展性。
本发明提供的上述联合鲁棒主成分特征学习与视觉分类系统,还可以包括:
训练预处理模块,用于对训练样本集中的训练样本进行预处理。
本发明提供的上述联合鲁棒主成分特征学习与视觉分类系统,训练模块可以包括:
训练单元,用于按照下列公式将训练样本集分解为一个联合特征矩阵PX和一个稀疏错误矩阵E:
M i n P , E , W ( 1 - &alpha; ) | | P X | | * + &alpha; | | P X | | 1 + &gamma; | | H T - X T P T W | | 2 , 1 + &lambda; | | E | | l
s.t.X=PX+E
其中,X表示训练样本集,n表示每个训练样本的维度,N表示训练样本的数量,表示n×N的矩阵空间,||HT-XTPTW||2,1表示基于鲁棒l2,1范数度量的分类错误;α∈[0,1]表示用于权衡低秩主成分特征编码和稀疏主成分特征编码的最小化项;γ表示正的权衡参数,为了衡量分类错误项||HT-XTPTW||2,1的贡献程度;λ>0表示依赖于错误或噪音级别的权衡参数;表示与训练样本的类别对应的初始标签,c表示训练样本中包含的类别的个数,表示c×N的矩阵空间;||E||l表示稀疏错误项,||·||*表示核范数,||·||1表示l1范数,||·||2,1表示l2,1范数。
本发明提供的上述联合鲁棒主成分特征学习与视觉分类系统,投影模块可以包括:
投影单元,用于将待测样本向线性投影矩阵进行嵌入,得到对应的嵌入结果即为待测样本的联合低秩与稀疏主成分特征。
对于本发明实施例公开的上述系统而言,由于其与本发明实施例公开的方法相对应,因此描述的比较简单,相关之处参见方法部分说明即可。
请参阅表1,以随机脸作为特征描述子来提取视觉人脸图像训练样本与测试样本的特征,用于对本发明提供的上述联合鲁棒主成分特征学习与视觉分类方法及系统进行验证,需要说明的是,测试样本与上述待测样本的实质相同,即为未知其类别的样本,由于此处用于测试验证,因此称之为测试样本。
本实验基于两个真实数据集CMUPIE和UMIST的基础上:CMUPIE脸数据库包含68个被测试者的41368幅图片,并且每张图片具有不同的姿势、光照强度和表情。UMIST脸数据库由20个个体(混合种族/性别/外貌)的575张图片构成。本发明通过合并CMUPIE和UMIST这两个数据库创造一个PIE-UMIST新的人脸数据集(总共88个个体的2003张图片),用于实验。由于新的人脸图像数据集将包含不同的姿势/表情和混血种族/性别/外貌的同时,因此对于人脸描述和识别将更具有挑战性。
在该实施例中,对40%的训练样本的数据值加入了均值为1和方差为100的高斯噪声,以此来评估各个算法在训练过程中对噪音的鲁棒性。仿真实验从每个人的图像中选取数值为l(l=2,3,4,5)组成训练样本集,并且采用L1范式来度量稀疏错误项E。表1为本发明方法和PCA、IRPCA、PCA-L1、LatLRR、rLRR方法识别结果对比表,给出了各方法实验的平均识别率和最高识别率。本实施例中,参与比较的IRPCA、LatLRR等方法(采用各文献中算法使用的默认参数)使用各自得到的投影矩阵用于测试样本的特征提取。
此处需说明一下,相对于本发明方法,PCA、IRPCA、PCA-L1、LatLRR和rLRR模型均没有同时考虑分类问题,因此当每个方法获得各自的线性投影矩阵或对应特征之后,再利用一个额外的多元岭回归模型来学习得到一个分类器W*,具体公式如下:
M i n W | | H - W T P X | | F 2 + | | W | | F 2 , W * = ( PXY T P T + I n ) - 1 PXH T
进而利用学习得到的分类器W*,完成测试样本类别的鉴定过程,实现分类。
通过实验结果可以看出本发明提供的本发明实施例提供的一种联合鲁棒主成分特征学习与视觉分类方法及系统的分类效果明显优于相关的PCA、IRPCA、PCA-L1、LatLRR以及rLRR方法,且表现出了较强的鲁棒性,具有一定的优势。
表1.在混合PIE-UMIST人脸库上的算法结果对比
另外,请参阅附图3,为本发明实施例在进行试验时得到的一种人脸识别预测示意图。
上述试验的具体过程为,用训练样本图像得到特征投影矩阵P与投影分类器W,然后将训练样本图像嵌入到线性投影矩阵中来获得其联合的低秩稀疏主成分特征,接着将上述得到的特征映射到线性分类器中得到测试样本图像的软类别标签,通过软类别标签中的最大值对应的位置,确定该测试样本图像的类别标签,得到最准确的分类结果。
综上:本发明公开了本发明实施例提供的一种联合鲁棒主成分特征学习与视觉分类方法及系统,通过引入低秩矩阵恢复和稀疏投影的思想,明确将样本分解为低秩主成分特征、稀疏错误(或噪音),通过凸优化技术,实现主成分特征编码。进而利用凸优化得到的稀疏投影矩阵将测试样本嵌入到稀疏编码空间,完成特征提取过程,生成包含联合低秩和稀疏主成分特征的测试集,再将得到的测试集向线性分类器进行映射,根据训练样本的类别标签,获得测试样本的类别信息,得到最准确的视觉分类结果。为了得到描述性更强的鲁棒特征,同时考虑了数据的低秩与稀疏特性,同时经过将一个投影嵌入的特征进行低秩和L1-范数最小化,确保提取的特征满足低秩与稀疏特性。本发明方案可被直接的用于诱导式的表示和分类,并且在测试阶段更加节省时间。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种联合鲁棒主成分特征学习与视觉分类方法,其特征在于,包括:
基于训练样本集,通过将鲁棒主成分特征学习、编码错误和基于主成分特征的分类错误集成到一个统一的最小化框架,可同时进行联合低秩与稀疏主成分特征提取和数据纠错,且可确保得到的联合主成分特征对于分类是最优的;为了得到描述性更强的鲁棒特征,同时考虑了数据的鲁棒与稀疏特性,同时将经过一个投影嵌入的特征进行低秩和L1-范数最小化,确保提取的特征满足低秩与稀疏特性;最终得到一个线性投影矩阵和一个线性分类器;其中,所述训练样本集中包含的训练样本为已知其类别的样本;
利用所述线性投影矩阵通过嵌入方式提取待测样本的联合低秩与稀疏主成分特征;其中,所述待测样本为未知其类别的样本;
将提取到的所述待测样本对应的联合低秩与稀疏主成分特征向所述线性分类器进行映射,得到所述待测样本的软类别标签,其中包括测试样本归属各个类别的概率,根据所述概率中最大值对应的位置,确定为所述待测样本的类别,完成分类过程。
2.根据权利要求1所述的方法,其特征在于,在基于所述待测样本集得到所述线性投影矩阵及所述线性分类器之前,还包括:
对所述训练样本集中的训练样本进行预处理。
3.根据权利要求1所述的方法,其特征在于,基于所述待测样本集得到所述线性投影矩阵及所述线性分类器,包括:
按照下列公式将所述训练样本集分解为一个联合特征矩阵PX和一个稀疏错误矩阵E,并得到所述线性投影矩阵P及所述线性分类器W:
M i n P , E , W ( 1 - &alpha; ) | | P X | | * + &alpha; | | P X | | 1 + &gamma; | | H T - X T P T W | | 2 , 1 + &lambda; | | E | | l
s.t.X=PX+E
其中,X表示所述训练样本集,n表示每个所述训练样本的维度,N表示所述训练样本的数量,表示n×N的矩阵空间,||HT-XTPTW||2,1表示基于鲁棒l2,1范数度量的分类错误;α∈[0,1]表示用于权衡低秩主成分特征编码和稀疏主成分特征编码的最小化项;γ表示正的权衡参数,为了衡量分类错误项||HT-XTPTW||2,1的贡献程度;λ>0表示依赖于错误或噪音级别的权衡参数;表示与所述训练样本的类别对应的初始标签,c表示所述训练样本中包含的类别的个数,表示c×N的矩阵空间;||E||l表示稀疏错误项,||·||*表示核范数,||·||1表示l1范数,||·||2,1表示l2,1范数。
4.根据权利要求1所述的方法,其特征在于,利用所述线性投影矩阵通过嵌入方式提取待测样本的联合低秩与稀疏主成分特征,包括:
将所述待测样本向所述线性投影矩阵进行嵌入,得到对应的嵌入结果即为所述待测样本的联合低秩与稀疏主成分特征。
5.一种联合鲁棒主成分特征学习与视觉分类系统,其特征在于,包括:
训练模块,用于:基于训练样本集,通过将鲁棒主成分特征学习、编码错误和基于主成分特征的分类错误集成到一个统一的最小化框架,可同时进行联合低秩与稀疏主成分特征提取和数据纠错,且可确保得到的联合主成分特征对于分类是最优的;为了得到描述性更强的鲁棒特征,同时考虑了数据的鲁棒与稀疏特性,同时将经过一个投影嵌入的特征进行低秩和L1-范数最小化,确保提取的特征满足低秩与稀疏特性;最终得到一个线性投影矩阵和一个线性分类器;其中,所述训练样本集中包含的训练样本为已知其类别的样本;
投影模块,用于利用所述线性投影矩阵通过嵌入方式提取待测样本的联合低秩与稀疏主成分特征;其中,所述待测样本为未知其类别的样本;
分类模块,用于将提取到的所述待测样本对应的联合低秩与稀疏主成分特征向所述线性分类器进行映射,得到所述待测样本的软类别标签,其中包括测试样本归属各个类别的概率,根据所述概率中最大值对应的位置,确定为所述待测样本的类别,完成分类过程。
6.根据权利要求5所述的系统,其特征在于,还包括:
训练预处理模块,用于对所述训练样本集中的训练样本进行预处理。
7.根据权利要求5所述的系统,其特征在于,训练模块包括:
训练单元,用于按照下列公式将所述训练样本集分解为一个联合特征矩阵PX和一个稀疏错误矩阵E:
M i n P , E , W ( 1 - &alpha; ) | | P X | | * + &alpha; | | P X | | 1 + &gamma; | | H T - X T P T W | | 2 , 1 + &lambda; | | E | | l
s.t.X=PX+E
其中,X表示所述训练样本集,n表示每个所述训练样本的维度,N表示所述训练样本的数量,表示n×N的矩阵空间,||HT-XTPTW||2,1表示基于鲁棒l2,1范数度量的分类错误;α∈[0,1]表示用于权衡低秩主成分特征编码和稀疏主成分特征编码的最小化项;γ表示正的权衡参数,为了衡量分类错误项||HT-XTPTW||2,1的贡献程度;λ>0表示依赖于错误或噪音级别的权衡参数;表示与所述训练样本的类别对应的初始标签,c表示所述训练样本中包含的类别的个数,表示c×N的矩阵空间;||E||l表示稀疏错误项,||·||*表示核范数,||·||1表示l1范数,||·||2,1表示l2,1范数。
8.根据权利要求5所述的系统,其特征在于,投影模块包括:
投影单元,用于将所述待测样本向所述线性投影矩阵进行嵌入,得到对应的嵌入结果即为所述待测样本的联合低秩与稀疏主成分特征。
CN201510918300.2A 2015-12-11 2015-12-11 一种联合鲁棒主成分特征学习与视觉分类方法及系统 Active CN105528620B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510918300.2A CN105528620B (zh) 2015-12-11 2015-12-11 一种联合鲁棒主成分特征学习与视觉分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510918300.2A CN105528620B (zh) 2015-12-11 2015-12-11 一种联合鲁棒主成分特征学习与视觉分类方法及系统

Publications (2)

Publication Number Publication Date
CN105528620A true CN105528620A (zh) 2016-04-27
CN105528620B CN105528620B (zh) 2019-12-06

Family

ID=55770834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510918300.2A Active CN105528620B (zh) 2015-12-11 2015-12-11 一种联合鲁棒主成分特征学习与视觉分类方法及系统

Country Status (1)

Country Link
CN (1) CN105528620B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106093074A (zh) * 2016-06-16 2016-11-09 广东工业大学 一种基于鲁棒主成分分析的ic元件焊点检测方法
CN107239448A (zh) * 2017-06-07 2017-10-10 长沙学院 一种解释性主成分分析方法
CN107436597A (zh) * 2017-07-17 2017-12-05 华南理工大学 一种基于稀疏过滤和逻辑回归的化工过程故障检测方法
CN107871160A (zh) * 2016-09-26 2018-04-03 谷歌公司 通信高效联合学习
CN109460788A (zh) * 2018-10-29 2019-03-12 西安电子科技大学 基于低秩-稀疏信息组合网络的高光谱图像分类方法
CN109558882A (zh) * 2018-11-30 2019-04-02 苏州大学 基于鲁棒局部低秩稀疏cnn特征的图像分类方法及装置
CN117456284A (zh) * 2023-12-21 2024-01-26 中电科新型智慧城市研究院有限公司 图像分类方法、装置、设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140029839A1 (en) * 2012-07-30 2014-01-30 Xerox Corporation Metric learning for nearest class mean classifiers
CN104504412A (zh) * 2014-11-28 2015-04-08 苏州大学 一种手写体笔划特征提取和识别方法及系统
CN104778479A (zh) * 2015-04-23 2015-07-15 苏州大学 一种基于稀疏编码提取子的图像分类方法及系统
CN104794489A (zh) * 2015-04-23 2015-07-22 苏州大学 一种基于深度标签预测的诱导式图像分类方法及系统
CN104915684A (zh) * 2015-06-30 2015-09-16 苏州大学 一种基于鲁棒多平面支持向量机的图像识别方法及装置
CN104933439A (zh) * 2015-06-02 2015-09-23 西安电子科技大学 基于稀疏低秩回归的高光谱图像分类方法
CN104992166A (zh) * 2015-07-28 2015-10-21 苏州大学 一种基于鲁棒度量的手写体识别方法与系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140029839A1 (en) * 2012-07-30 2014-01-30 Xerox Corporation Metric learning for nearest class mean classifiers
CN104504412A (zh) * 2014-11-28 2015-04-08 苏州大学 一种手写体笔划特征提取和识别方法及系统
CN104778479A (zh) * 2015-04-23 2015-07-15 苏州大学 一种基于稀疏编码提取子的图像分类方法及系统
CN104794489A (zh) * 2015-04-23 2015-07-22 苏州大学 一种基于深度标签预测的诱导式图像分类方法及系统
CN104933439A (zh) * 2015-06-02 2015-09-23 西安电子科技大学 基于稀疏低秩回归的高光谱图像分类方法
CN104915684A (zh) * 2015-06-30 2015-09-16 苏州大学 一种基于鲁棒多平面支持向量机的图像识别方法及装置
CN104992166A (zh) * 2015-07-28 2015-10-21 苏州大学 一种基于鲁棒度量的手写体识别方法与系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ZHAO ZHANG: "Joint Low-Rank and Sparse Principal Feature Coding for Enhanced Robust Representation and Visual Classification", 《IEEE TRANSACTIONS ON IMAGE PROCESSING》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106093074A (zh) * 2016-06-16 2016-11-09 广东工业大学 一种基于鲁棒主成分分析的ic元件焊点检测方法
CN106093074B (zh) * 2016-06-16 2020-01-07 广东工业大学 一种基于鲁棒主成分分析的ic元件焊点检测方法
CN107871160A (zh) * 2016-09-26 2018-04-03 谷歌公司 通信高效联合学习
US11763197B2 (en) 2016-09-26 2023-09-19 Google Llc Communication efficient federated learning
CN107871160B (zh) * 2016-09-26 2021-09-10 谷歌有限责任公司 通信高效联合学习
CN107239448A (zh) * 2017-06-07 2017-10-10 长沙学院 一种解释性主成分分析方法
CN107239448B (zh) * 2017-06-07 2019-03-22 长沙学院 一种解释性主成分分析方法
CN107436597A (zh) * 2017-07-17 2017-12-05 华南理工大学 一种基于稀疏过滤和逻辑回归的化工过程故障检测方法
CN107436597B (zh) * 2017-07-17 2019-10-18 华南理工大学 一种基于稀疏过滤和逻辑回归的化工过程故障检测方法
CN109460788B (zh) * 2018-10-29 2020-12-08 西安电子科技大学 基于低秩-稀疏信息组合网络的高光谱图像分类方法
CN109460788A (zh) * 2018-10-29 2019-03-12 西安电子科技大学 基于低秩-稀疏信息组合网络的高光谱图像分类方法
CN109558882A (zh) * 2018-11-30 2019-04-02 苏州大学 基于鲁棒局部低秩稀疏cnn特征的图像分类方法及装置
CN109558882B (zh) * 2018-11-30 2023-05-05 苏州大学 基于鲁棒局部低秩稀疏cnn特征的图像分类方法及装置
CN117456284A (zh) * 2023-12-21 2024-01-26 中电科新型智慧城市研究院有限公司 图像分类方法、装置、设备及存储介质
CN117456284B (zh) * 2023-12-21 2024-05-10 中电科新型智慧城市研究院有限公司 图像分类方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN105528620B (zh) 2019-12-06

Similar Documents

Publication Publication Date Title
CN105528620A (zh) 一种联合鲁棒主成分特征学习与视觉分类方法及系统
Guo et al. Supplier selection based on hierarchical potential support vector machine
CN105809123B (zh) 人脸检测方法及装置
Zhang et al. Leveraging implicit relative labeling-importance information for effective multi-label learning
CN110348579A (zh) 一种领域自适应迁移特征方法及系统
CN105469063A (zh) 鲁棒的人脸图像主成分特征提取方法及识别装置
CN102156885B (zh) 基于级联式码本生成的图像分类方法
CN106537379A (zh) 细粒度图像相似性
CN108509833B (zh) 一种基于结构化分析字典的人脸识别方法、装置及设备
CN105354595A (zh) 一种鲁棒视觉图像分类方法及系统
CN109376766B (zh) 一种画像预测分类方法、装置及设备
CN104504412A (zh) 一种手写体笔划特征提取和识别方法及系统
CN110210625A (zh) 基于迁移学习的建模方法、装置、计算机设备和存储介质
Ji et al. Pedestrian attribute recognition based on multiple time steps attention
CN109948735A (zh) 一种多标签分类方法、系统、装置及存储介质
Zhou et al. Semi-supervised extreme learning machine with manifold and pairwise constraints regularization
CN112085086A (zh) 一种基于图卷积神经网络的多源迁移学习方法
Zhang et al. Low-rank tensor regularized views recovery for incomplete multiview clustering
CN110781970A (zh) 分类器的生成方法、装置、设备及存储介质
CN108228684A (zh) 聚类模型的训练方法、装置、电子设备和计算机存储介质
CN106056074A (zh) 一种基于区域稀疏的单张训练样本人脸识别方法
Qin et al. Finger-vein quality assessment based on deep features from grayscale and binary images
Wang et al. Two-level label recovery-based label embedding for multi-label classification with missing labels
CN105868776A (zh) 一种基于图像处理技术的变压器设备识别方法及装置
Mo et al. Weighted pseudo labeled data and mutual learning for semi-supervised classification

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20201015

Address after: No.405, building 1, Tongji Science and Technology Plaza, No.2 Hushan Road, Changshu high tech Industrial Development Zone, Suzhou City, Jiangsu Province

Patentee after: Suzhou hengzhihui Intelligent Technology Co.,Ltd.

Address before: 215123 No. 199 benevolence Road, Suzhou Industrial Park, Jiangsu, China

Patentee before: Suzhou University