发明内容
有鉴于此,本申请提供一种图像的特征提取与分类方法及系统,基于核范数在度量重构错误时比Frobenius范数更有效的优点,本发明采用基于核范数度量的近邻重构错误最小化,以及L2,1-范数正则化的联合问题,提高了特征提取的有效性和分类的准确性。
为了实现上述目的,现提出的方案如下:
一种图像特征提取与分类联合方法,包括:
获取训练样本的近邻样本,构造近邻图,并计算所述训练样本的重构系数矩阵;
根据所述重构系数矩阵,基于核范数度量的近邻重构错误最小化的非线性流形学习,对训练样本进行低维流形特征学习,得到一个能提取低维流行特征的线性投影矩阵;
基于所述线性投影矩阵提取的低维流行特征对分类器进行更新,通过最小化L2,1-范数正则化的分类错误,完成分类器学习;
利用所述线性投影矩阵提取测试样本的低维流行特征,利用学习后的分类器对测试样本分类。
优选的,所述获取训练样本的近邻样本,包括:
采用K最近邻分类算法,得到训练样本的K个近邻样本。
优选的,所述计算重构系数矩阵,包括:
基于计算公式:
计算重构系数矩阵;
其中,其中,xi和xj分别为训练图像样本的第i,j个数据,NN(xi)为训练图像样本xi的近邻集合,xj∈NN(xi)表示xj为样本xi近邻,||||表示向量的L2范数。
优选的,所述根据所述重构系数矩阵,基于核范数度量的近邻重构错误最小化的非线性流形学习,对训练样本进行低维流形特征学习,得到一个能提取低维流行特征的线性投影矩阵,包括:
基于凸优化问题:
输出所述线性投影矩阵;
其中,α为权衡参数,S为得到的重构权重系数矩阵,||||*表示矩阵的核范数,||||F为矩阵Frobenius范数,YT-SYT为近邻重构错误,PX-Y为特征近似错误,P为线性投影矩阵,Y为低维流行特征。
优选的,所述基于所述线性投影矩阵提取的低维流行特征对分类器进行更新,通过最小化L2,1-范数正则化的分类错误,完成分类器学习,包括;
基于凸优化问题:
完成分类器的学习;
其中,W为分类器矩阵,β为权衡参数,H=[h1,h2,K,hN]∈c×N为训练样本的原始标签矩阵,其中hj为样本xj的原始标签,c为类别数,对于每个有标签的数据xj,如果xj属于类别i(1≤i≤c)则hi,j=1,否则hi,j=0,||||F表示Frobenius范数,||||2,1表示L2,1-范数。
一种图像特征提取与分类联合系统,包括:
训练预处理模块,用于获取训练样本的近邻样本,构造近邻图,并计算所述训练样本的重构系数矩阵;
特征学习模块,用于根据所述重构系数矩阵,基于核范数度量的近邻重构错误最小化的非线性流形学习,对训练样本进行低维流形特征学习,得到一个能提取低维流行特征的线性投影矩阵;
分类器学习模块,用于基于所述线性投影矩阵提取的低维流行特征对分类器进行更新,通过最小化L2,1-范数正则化的分类错误,完成分类器学习;
测试模块,用于利用所述线性投影矩阵提取测试样本的低维流行特征,利用学习后的分类器对测试样本分类。
优选的,所述训练预处理模块包括
数据采集单元,用于采用K最近邻分类算法,得到训练样本的K个近邻样本,构造近邻图;
计算单元,用于基于计算公式:
计算重构系数矩阵;
其中,其中,xi和xj分别为训练图像样本的第i,j个数据,NN(xi)为训练图像样本xi的近邻集合,xj∈NN(xi)表示xj为样本xi近邻,||||表示向量的L2范数。
经由上述技术方案可知,本发明公开了一种图像特征提取与分类联合方法及其系统,首先根据训练样本间的相似性,构造训练样本的近邻图,并计算重构系数矩阵。进而引入基于核范数度量的近邻重构错误最小化的非线性流形学习,对训练图像样本进行低维流形特征学习,得到一个可获取样本低维流形特征的线性投影矩阵;再利用所述训练样本低维特征,最小化L2,1-范数正则化的分类错误,完成鲁棒稀疏分类器学习,输出一个最优分类器,从而对测试样本进行特征提取和分类。与现有技术相比,本发明通过采用核范数度量和L2,1-范数正则化的联合问题,有效提高了提取特征的描述性与分类准确率。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1示出了本发明一个实施例公开的一种图像的特征提取与分类联合方法。
由图1可知,该方法包括:
S11:获取训练样本的近邻样本,构造近邻图,并计算所述训练样本的重构系数矩阵。
可选的,本发明方法采用K最近邻分类算法(k-NearestNeighbor,KNN)搜索方法,得到每个训练样本的K个近邻,构造近邻图,并计算重构系数矩阵。对于原始训练数据X=[x1,x2,...,xN]∈in×N(其中,n是图像样本的维度,N是样本的数量),用G表示一个有N个顶点的图,其中,每个顶点对应一个数据样本xi,用i:j表示顶点i指向顶点j的边。进而对每条边进行加权,并用S表示权重矩阵,其中Si,j代表边i:j上的权重,Si,j=0表示连接的两个顶点不是近邻关系。重构系数矩阵S可通过最小化如下优化问题求得:
其中,xi和xj分别为训练图像样本的第i,j个数据,NN(xi)为训练图像样本xi的近邻集合,xj∈NN(xi)表示xj为样本xi近邻。||||表示向量的L2范数。
S12:根据所述重构系数矩阵,基于核范数度量的近邻重构错误最小化的非线性流形学习,对训练样本进行低维流形特征学习,得到一个能提取低维流行特征的线性投影矩阵。
对于图像数据X=[x1,x2,...,xN]∈in×N(其中,n是样本的维度,N是样本的数量),划分为包含有类别标签(共c个类别,c>2)的训练样本集XL=[x1,x2,...,xl]∈in×l和包含无标签的测试样本集XU=[x1,x2,...,xu]∈in×u,且满足样本数量l+u=N。所述根据原始训练样本计算得到一个线性的投影矩阵P∈id×n,可将训练数据投影到低维空间id×l(其中,d=n),得到训练数据的低维非线性流形特征Y∈id×l。为了实现上述目标,本发明方法通过引入线性投影矩阵P建立流形特征与原始样本数据之间的关系,最小化特征近似错误项使得到的线性投影矩阵P具备直接从样本提取得到非线性流形特征的能力。所述解决以下凸优化问题:
其中,α为权衡参数,S为得到的重构权重系数矩阵,||||*表示矩阵的核范数,||||F为矩阵Frobenius范数。
对于任一给定的矩阵A=(a1,a2,K,an)∈ip×n,核范数和Frobenius范数可分别定义如下:
其中,∑iσi(A)表示矩阵A的所有奇异值之和。
计算时,本例运用引理:对任意矩阵X,有将核范数优化转化成如下F-范数优化问题:
其中
由此,可得到一个最优的能提取非线性流形特征的线性投影矩阵P*以及训练样本的低维嵌入Y*。
S13:基于所述线性投影矩阵提取的低维流行特征对分类器进行更新,通过最小化L2,1-范数正则化的分类错误,完成分类器学习。
利用所述线性投影矩阵得到训练样本的低维流形特征,完成分类器W的学习。通过引入一个分类错误最小化项并对分类器进行L2,1-范数正则化,确保得到的分类器W对于噪音具有很强的鲁棒性,且可确保分类器W能从低维流形特征获取每个样本xi的软类别标签,即WTPxi,根据软类别标签中最大值对应的位置,确定为样本类别。所述鲁棒分类器学习过程解决以下L2,1-范数正则化的凸优化问题:
其中,β为权衡参数,H=[h1,h2,K,hN]∈ic×N为训练样本的原始标签矩阵,其中hj为样本xj的原始标签,c为类别数,对于每个有标签的数据xj,如果xj属于类别i(1≤i≤c)则hi,j=1,否则hi,j=0。
||||F表示Frobenius范数,||||2,1表示L2,1-范数,分别定义如下:
需要说明的是,本发明通过迭代优化线性投影矩阵P与分类器W,即利用线性投影矩阵P提取的流形特征对分类器进行更新,进而利用L2,1-范数正则化的分类器学习过程确保得到的低维流形特征对于分类是最优的。即,所述过程交替优化问题如下两个问题:
具体地,由于变量Y,D,P,W,Q都是相互依赖的,上述问题无法直接进行求解。本例中,当计算某个变量时,固定其他变量,通过迭代地优化如下凸子问题,依次更新变量值完成求解:
Dk+1=((Yk+1 T-SYk+1 T)(Yk+1 T-SYk+1 T)T)-1/4
Pk+1=Yk+1XT(XXT)-1
该方法中每一步待优化的问题都是一个凸子问题,因此可以得到有效解。
S14:利用所述线性投影矩阵提取测试样本的低维流行特征,利用学习后的分类器对测试样本分类。
对测试样本xtest,可用线性投影矩阵P*将测试样本嵌入得到的线性投影空间,完成测试样本的特征提取。测试样本xtest的嵌入结果表达如下:其中为测试样本的显著特征。将其输入分类器进行分类测试即可得到分类结果。
由以上实施例可知,本发明公开了一种图像特征提取与分类联合方法,首先根据训练样本间的相似性,构造加权近邻图,并重构系数矩阵。进而引入基于核范数度量的近邻重构错误最小化的非线性流形学习,对训练图像样本进行低维流形特征学习,得到一个可获取样本低维流形特征的线性投影矩阵;再利用所述训练样本低维特征,最小化L2,1-范数正则化的分类错误,完成鲁棒稀疏分类器学习,输出一个最优分类器,从而对测试样本进行特征提取和分类。与现有技术相比,本发明通过采用核范数度量和L2,1-范数正则化的联合问题,有效提高了提取特征的描述性与分类准确率。
参见图2示出了本发明另一个实施例公开的一种图像特征提取和分类联合系统。
该系统包括:训练预处理模块1、特征学习模块2、分类器学习模块3以及测试模块4。
其中,训练预处理模块,用于获取训练样本的近邻样本,构造近邻图,并计算所述训练样本的重构系数矩阵。
特征学习模块2,用于根据所述重构系数矩阵,基于核范数度量的近邻重构错误最小化的非线性流形学习,对训练样本进行低维流形特征学习,得到一个能提取低维流行特征的线性投影矩阵;
分类器学习模块3,用于基于所述线性投影矩阵提取的低维流行特征对分类器进行更新,通过最小化L2,1-范数正则化的分类错误,完成分类器学习;
测试模块4,用于利用所述线性投影矩阵提取测试样本的低维流行特征,利用学习后的分类器对测试样本分类。
需要说明的是,在本发明公开的其他实施例中,所述训练预处理模块1具体包括:数据采集单元11以及计算单元12。
数据采集单元11,用于采用K最近邻分类算法,得到训练样本的K个近邻样本,构造近邻图。
计算单元12,用于基于计算公式:
计算重构系数矩阵;
其中,其中,xi和xj分别为训练图像样本的第i,j个数据,NN(xi)为训练图像样本xi的近邻集合,xj∈NN(xi)表示xj为样本xi近邻。||||表示向量的L2范数。
需要说明的是上述装置实施例与方法实施例相对应,其执行过程和执行原理相同,在此不作赘述。
参阅表1,为本发明方法和PCA(PrincipalComponentAnalysis)、LDA(LinearDiscriminantAnalysis)、有监督的NPE(NeighborhoodPreservingEmbedding)、有监督的LPP(LocalityPreservingProjections)方法分类结果对比表,给出了各方法10次实验的平均分类准确度。本例中,参与比较的PCA、LDA、NPE和LPP方法(采用各文献中算法使用的默认参数)使用各自得到的特征进行独立的分类器学习。
表1(a).本发明方法在HP0数据集和LDA、NPE、LPP、OLPP方法识别结果对比
表2(b).本发明方法在Indian_Face数据集和LDA、NPE、LPP、OLPP方法识别结果对比
表1(c).本发明方法在ORL、YALE混合数据集和LDA、NPE、LPP、OLPP方法识别结果对比
通过实验结果我们可以看出本发明的特征提取及分类效果明显优于相关的LDA、NPE、LPP和OLPP方法,且表现出了较强的稳定性,具有一定的优势。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。