CN108520281A - 一种基于全局与局部保持的高光谱图像半监督降维方法 - Google Patents
一种基于全局与局部保持的高光谱图像半监督降维方法 Download PDFInfo
- Publication number
- CN108520281A CN108520281A CN201810328999.0A CN201810328999A CN108520281A CN 108520281 A CN108520281 A CN 108520281A CN 201810328999 A CN201810328999 A CN 201810328999A CN 108520281 A CN108520281 A CN 108520281A
- Authority
- CN
- China
- Prior art keywords
- semi
- supervised
- sample
- data
- situation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于全局与局部保持的高光谱图像半监督降维方法,所述的方法包括以下步骤:步骤S1.设高维空间RD中存在数据集X={x1,x2,…,xl,xl+1,…,xl+u},其中前l个样本Xl为有类标样本,类别标签为c,各类样本数为Ni,i=(1,2,…,c),后u个样本Xu是无类标样本;步骤S2.通过半监督全局分布算法构造半监督全局目标函数;步骤S3.基于半监督局部保持投影算法,给出改进后的半监督局部目标函数;步骤S4.结合S2中的全局目标函数和S3中的局部目标函数,构造半监督IPCA‑IWSSFE整体目标函数及求解低维子空间Y=WTX。其优点表现在:通过对高光谱图像进行全局与局部保持的半监督降维,即考虑的数据的局部特性,又能保证数据的全局特性,从而提高了图像的分类精度。
Description
技术领域
本发明涉及高光谱图像的降维技术领域,具体地说,是一种基于全局与局部保持的高光谱图像半监督降维方法,适用于处理具有波段多且冗余、光谱分辨率高、波段宽度窄、数据量庞大、维数高的高光谱图像,大大降低了计算的复杂程度,减少了冗余信息所造成的判别误差,提高了分类精度,并且大大节省了这些图像的存储空间。
背景技术
高光谱遥感图像的空间分辨率高,地物光谱曲线连续,具有较强的地物分类和识别能力,在地质勘查、医疗检测、生命科学、司法鉴别、军事侦察、环境监测、精细农业等领域得到了广泛的应用。高光谱图像是由成像光谱仪获取的遥感图像,随着成像光谱仪空间和谱间分辨率指标的提高,同时具有二维空间和一维光谱信息的高光谱遥感图像数据量呈指数增加。数据量的急剧膨胀不但给数据存储与传输带来了巨大的困难,同时也加剧了数据处理过程的复杂性,降低了数据处理效率,甚至会出现维数灾难问题。降维可以为高维数据寻找一个包含样本重要信息的低维表示方法,是高光谱图像分类预处理的重要环节。降维不仅可以保存数据的有用信息,并且能够大大减少数据量,而且可以有效避免维数灾难,使数据表示更加简单清晰,有利于后续分类。
在过去的几十年里,有很多降维的方法已经被提出来。根据数据的结构,传统的降维方法分为全局性降维方法与局部性降维方法。全局性降维方法有主成分分析法(Principal component analysis,PCA)、线性判别分析(Linear discriminant analysis,LDA)等。此类方法从全局统计信息角度出发对数据进行挖掘,它能够在最大程度保持全局分布信息方差不变的情况下,获得对图像数据的最佳描述。局部性降维方法主要以局部流形学习算法为代表,如局部保持投影(locality preserving projection,LPP)、局部敏感判别分析(Locality Sensitive Discriminant Analysis,LSDA)等,其特点是从局部线性出发,通过邻域图揭示数据的局部近邻结构关系,在低维嵌入时保持数据的局部几何结构。局部流形学习以能够有效揭示出高维数据中的低维本质特征,对特征信息的局部保持性更强而著称,但又存在着获取全局分布特征信息的性能较差的缺陷。
根据样本数据是否考虑或使用类别标签,传统的降维方法可以分为三类:监督降维、无监督降维和半监督降维。根据降维方法不同,主要分为两类:特征提取和特征选择。无监督降维是指未给数据加类标进行降维,用于高光谱图像特征提取中无监督的传统降维算法包括主成分分析法(principle component analysis,PCA)和局部保留投影(localitypreserving projections,LPP),对高光谱图像进行无监督降维,不能保证从高维到低维投影之后样本数据间距离不变。有监督降维是指给所有的数据都加入类标进行降维,有监督降维的传统降维算法包括局部敏感判别分析(Locality Sensitive DiscriminantAnalysis,LSDA)和邻域保持嵌入(Neighborhood Preserving Embedding,NPE),对高光谱图像进行有监督降维,图像的类标需要大量的人力,物力,且有类标数据难以获取。半监督降维是指一部分数据加上类标,一部分数据未加类标,半监督降维的传统降维算法包括半监督局部保持投影(Semi-Supervised Locality Preserving Projection,SSLPP)和基于成对约束的半监督特征提取(Semi-Supervised Dimensionality Reduction based onpairwise constraint propagation,SSDR-PCP)。在高光谱图像领域,由于高光谱图像的波段信息多且冗余的特性,需要引入类标信息来提高分类精度,但是类标信息的成本大且不易获取,且目前传统的半监督降维算法SSLPP和SSDR-PCP虽然利用了半监督的思想,但是只考虑了数据的局部特性,未能保证数据的全局特性。因此,基于全局和局部保持的半监督特征提取方法值得研究。
中国专利文献:201210366079.0,申请日2012.09.27,专利名称为:基于局部一致性的遥感影像半监督投影降维方法。公开了一种基于局部一致性的遥感影像半监督投影降维方法。其步骤为:划分遥感影像数据集;生成语义相似矩阵、近邻矩阵和局部一致性矩阵;融合标签矩阵和近邻矩阵;生成近邻均值向量;生成相异散度矩阵、相似散度矩阵和局部一致性散度矩阵;求解最优投影矩阵;投影降维。本发明采用基于局部一致性约束的半监督学习方法,提高了小样本学习情况下的识别率。
中国专利文献:201410651950.0,申请日2014.11.17,专利名称为:基于局部流形学习构图的高光谱遥感图像半监督分类方法。公开了一种基于局部流形学习构图的高光谱遥感图像半监督分类方法,实现步骤为:(1)准备训练样本集,包括少量的带标记数据和大量的无标记数据;(2)基于光谱角制图这种距离度量方法,对训练样本集中的每个样本点选择k个最近邻点;利用局部流形学习算法,得到图结构中各连接点之间的权值,计算图邻接矩阵,得到对应的图结构;基于图邻接矩阵,基于GFHF算法对无标记数据进行分类;(3)利用GFHF的泛化算法对图像中其他数据点进行分类。本发明将局部流形学习降维算法和半监督分类算法这两种应用广泛的算法通过“图”联系起来,对多种高光谱遥感数据分类都表现出较好的适用性,能够明显提高高光谱遥感图像的分类精度。
综上所述,当高维中不同类的数据有部分重合或者靠的很近,虽然LPP有局部保留特性,但是LPP没有利用样本的类标信息,LPP会把不同的类投影到一起,会得到不理想的分类精度。半监督思想利用了类别标签信息,并没有考虑邻域信息,不能很好地反映数据集的局部结构。而研究表明,数据的全局与局部信息对于降维与分类都是有益的,传统的LPP降维算法只是单一的从图像数据的局部信息角度出发,并不能兼顾全局与局部信息的提取。需要一种既利用样本的类标信息,又同时考虑了样本数据间的全局与局部信息保持的降维方法,能够最小化同类样本间的距离,最大化不同类样本间的距离,而且能够同时保持数据的全局与局部信息的提取,从而提高了样本的分类精度的基于全局与局部保持的高光谱图像半监督降维方法,而关于这种基于全局与局部保持的高光谱图像半监督降维方法目前则没有相关的报道。
发明内容
本发明的目的是针对现有技术中的不足,提供一种既利用样本的类标信息,又同时考虑了样本数据间的全局与局部信息保持的降维方法,能够最小化同类样本间的距离,最大化不同类样本间的距离,而且能够同时保持数据的全局与局部信息的提取,从而提高样本分类精度的一种基于全局与局部保持的高光谱图像半监督降维方法。
本发明的再一目的是:提供一种基于全局与局部保持的高光谱图像半监督降维方法的技术路线。
为实现上述目的,本发明采取的技术方案是:
一种基于全局与局部保持的高光谱图像半监督降维方法,其特征在于,所述的方法包括以下步骤:
步骤S1.设高维空间RD中存在数据集X={x1,x2,…,xl,xl+1,…,xl+u},其中前l个样本Xl为有类标样本,类别标签为c,各类样本数为Ni,i=(1,2,…,c),后u个样本Xu是无类标样本。
步骤S2.通过半监督全局分布算法构造半监督全局目标函数;
步骤S3.基于半监督局部保持投影算法,给出改进后的半监督局部目标函数;
步骤S4.结合S2中的全局目标函数和S3中的局部目标函数,构造半监督IPCA-IWSSFE整体目标函数及求解得出低维子空间Y=WTX。
5.根据权利要求1所述的基于全局与局部保持的高光谱图像半监督降维方法,其特征在于,步骤S2中的半监督全局目标函数为:
其中, 和分别为有标签样本均值和无标签样本均值。
6.根据权利要求1所述的基于全局与局部保持的高光谱图像半监督降维方法,其特征在于,步骤S3中具体包括以下步骤:
步骤S31.提出改进的半监督相似权重矩阵:
其中,qij为改进的半监督相似权重矩阵Q的元素,aij=exp(-||xi-xj||2/σ),σ为所有样本对间欧式距离平均值的平方。J(xi)为xi的k近邻域,k为近邻参数。aij为局部权重值,令(1+aij)为类内判别权值,(1-aij)为类间判别权值;
步骤S31.基于半监督相似权重矩阵,给出改进后的半监督局部目标函数:
其中,矩阵D*为Q的对角矩阵,对角矩阵为Dii *=∑jqij,L*=D*-Q为拉普拉斯矩阵。引入约束条件YD*YT=WTXD*XTW=I,其中I为单位矩阵。
7.根据权利要求1所述的基于全局与局部保持的高光谱图像半监督降维方法,其特征在于,步骤S4具体包括以下步骤:
步骤S41.构造半监督IPCA-IWSSFE整体目标函数:
步骤S42.引入约束条件WTXD*XTW=I,其中I为单位矩阵;
步骤S43.引入拉格朗日乘子法将式:
整体目标函数转化为最大值问题,如下式:
F(W)=WT(Cu+Cl-XL*XT)W-λ(WTXD*XTW-I)
步骤S44.对式F(W)=WT(Cu+Cl-XL*XT)W-λ(WTXD*XTW-I)的W进行求导,如下式:
步骤S45.令式F(W)=WT(Cu+Cl-XL*XT)W-λ(WTXD*XTW-I)转化为式(Cu+Cl-XL*XT)W=λXD*XTW;
其中λ为广义特征值,通过求解前a个最大特征值对应的特征向量,组成投影矩阵W=[w1,w2,...,wa];
步骤S46.投影后低维空间的数据为:
Y=WTX
为实现上述第二个目的,本发明采取的技术方案是:
第一步,把已有的高光谱图像,根据专家已经标注的解译图,即参考图例,从这幅图像中提取出不同类别的样本数据{x1,x2,,…,xN},作为本发明高光谱图像降维的输入数据;
第二步,把第一步中获得的原始数据进行简单的数据预处理;
第三步,对处理过后的样本数据求解他们之间的欧式距离dist=||xi-xj||;
第四步,通过第三步求解的欧式距离,根据第二步中对样本添加类标信息的情况,分为5种情况求解,最终得到样本点之间的相似权重矩阵Q;
第五步,通过第四步求得的相似权重矩阵Q,根据相似权重矩阵Q求得对角矩阵D*和拉普拉斯矩阵L*;
第六步,通过有标签样本均值和无标签样本均值求出Cl和Cu;
第七步,由第五步和第六步求得的值带入以下公式:
第八步,设置将样本数据维度(Cu+Cl-XL*XT)W=λXD*XTW,求出转换矩阵W=(w1,w2,…,wd);
第九步,计算公式yi=WT×xi,求出低维空间中样本数据Y={y1,y2,…,yN};
第十步,对降维后的少部分样本加入类标信息作为训练样本数据,结合大部分未加类标的测试样本数据,利用最近邻分类器对降维后的样本进行分类,将分类结果与已知主成分分析法PCA、局部保留投影LPP的结果对比,计算出最终的样本识别率。
作为一种优选的技术方案,所述的选择标签数为10labels,d=15,k=16时,作为样本识别率。
作为一种优选的技术方案,所述的样本识别率的计算公式如下:nErr=sum(class~=classLabel);rate=1-nErr/length(class);class是通过最近邻算法求出来的测试样本的类标,classLabel是在降维之前已经知道的测试样本的类标,nErr是错误率,rate是识别率。
作为一种优选的技术方案,所述的预处理包括:样本数据加类标X={x1,x2,…,xl,xl+1,…,xl+u}、数据规范化处理。
本发明的优点在于:
1、本发明一旦投入应用,可以实现以下技术效果:本方案通过对高光谱图像进行全局和局部保持的半监督降维,既利用了数据的类标信息,也保持了数据的全局和局部特性,从而提高了图像的分类精度。
2、本发明提出的算法充分利用PCA算法的全局保持特性和LPP算法的局部保持特性,在LPP算法的相似权重矩阵中引入少量有类标样本数据和大量无类标样本数据,且在该算法中将样本数据间近邻信息及类标信息的不同结合情况分别考虑,包括1)同类标签近邻样本数据点之间的相似性;2)不同类标签近邻样本数据点之间的相似性;3)有类标和无类标近邻样本数据点之间的相似性;4)无类标和无类标近邻样本数据点之间的相似性。
3、本发明的一种基于全局与局部保持的高光谱图像半监督降维方法,适用于处理具有波段多且冗余、光谱分辨率高、波段宽度窄、数据量庞大、维数高的高光谱图像,大大降低了计算的复杂程度,减少了冗余信息所造成的判别误差,提高了分类精度,并且大大节省了这些图像的存储空间。
4、本发明提出了一种既利用样本的类标信息,又同时考虑了样本数据间的全局与局部信息保持的降维方法,能够最小化同类样本间的距离,最大化不同类样本间的距离,而且能够同时保持数据的全局与局部信息的提取,从而提高了样本的分类精度。
5、通过PCA无监督主成分分析算法,找到一个投影矩阵W,使投影后的数据能在低维空间中保持原有数据的大部分方差信息。
6、改进的半监督相似权重矩阵具有以下优点:(1)0≤aij≤1,1≤(1+aij)≤2,0≤(1-aij)≤1,类间判别权值和类内判别权值将噪声压缩在一定的范围之内;(2)由式(1)可知,随着欧氏距离的减小,局部权重值增大,类间判别权值减小,类内判别权值增大,使得同类标签样本的相似权值越大,而非同类标签样本的权值相应减少。
附图说明
附图1是本发明一种基于全局与局部保持的高光谱图像的半监督降维算法的技术路线。
附图2为标签数为10labels和PCA、LPP的结果进行对比示意图。
附图3为标签数为15labels和PCA、LPP的结果进行对比示意图。
附图4为标签数为20labels和PCA、LPP的结果进行对比示意图。
具体实施方式
下面结合附图对本发明提供的具体实施方式作详细说明。
实施例1
本发明提出了一个改进的算法:基于全局与局部保持的高光谱图像的半监督降维算法,该算法的关键在于兼顾了PCA的全局结构和LPP的局部结构保持以及引入类标信息,构建了一个新的投影目标函数,从而得到基于IPCA和IWSSFE的投影矩阵。该方法能够更全面地提取出全局与局部判别信息,使得高光谱图像分类精度得到明显提升。
设高维空间RD中存在数据集X={x1,x2,…,xl,xl+1,…,xl+u},其中前l个样本Xl为有类标样本,类别标签为c,各类样本数为Ni,i=(1,2,…,c),后u个样本Xu是无类标样本。
1、半监督全局分布算法(IPCA)
PCA是无监督主成分分析算法,该算法的主要目的是找到一个投影矩阵W,使投影后的数据能在低维空间中保持原有数据的大部分方差信息,PCA方法的全局分布目标函数如式(1)所示:
其中:
传统的降维算法不考虑数据的类标信息,在数据全局分布描述是最优的,但是不同类别样本间的分类能力较差。因此考虑数据的类标信息,在PCA目标函数的基础上构造半监督全局目标函数:
其中, 和分别为有标签样本均值和无标签样本均值。
2、半监督局部保持投影算法(IWSSFE)
LPP是无监督局部保持投影降维算法,在相似权重矩阵中未加入样本的类标信息,因此对噪声非常敏感。本发明利用样本的类标信息,提出了改进的半监督相似权重矩阵:
其中,qij为改进的半监督相似权重矩阵Q的元素,aij=exp(-||xi-xj||2/σ),σ为所有样本对间欧式距离平均值的平方。J(xi)为xi的k近邻域,k为近邻参数。aij为局部权重值,令(1+aij)为类内判别权值,(1-aij)为类间判别权值,改进的半监督相似权重值考虑了样本的类别标签信息,该相似权重矩阵反映了样本数据的局部邻域结构和类标信息。
改进的半监督相似权重矩阵的优点:(1)0≤aij≤1,1≤(1+aij)≤2,0≤(1-aij)≤1,类间判别权值和类内判别权值将噪声压缩在一定的范围之内;(2)由式(1)可知,随着欧氏距离的减小,局部权重值增大,类间判别权值减小,类内判别权值增大,使得同类标签样本的相似权值越大,而非同类标签样本的权值相应减少。
基于改进的半监督相似权重矩阵,给出改进后的半监督局部目标函数,使LPP的投影矩阵W在保证局部保留的情况下能够保持样本的类别信息:
其中,矩阵D*为Q的对角矩阵,对角矩阵为Dii *=∑jqij,L*=D*-Q为拉普拉斯矩阵。引入约束条件YD*YT=WTXD*XTW=I,其中I为单位矩阵。
3、半监督IPCA-IWSSFE整体目标函数及求解
结合全局目标函数与局部目标函数,构造半监督IPCA-IWSSFE整体目标函数,如式(5)所示,目标函数同时考虑全局特性和局部特性,使投影后低维空间的数据仍然保留更全面的数据信息:
引入约束条件WTXD*XTW=I,其中I为单位矩阵。
引入拉格朗日乘子法将式(5)整体目标函数转化为最大值问题,如下表示:
F(W)=WT(Cu+Cl-XL*XT)W-λ(WTXD*XTW-I) (6)
对式(6)的W进行求导,如下式:
令式(7)转化为式(8),如下所示:
(Cu+Cl-XL*XT)W=λXD*XTW (8)
投影矩阵W实际上就是求解广义特征值和特征向量问题,其中λ为广义特征值,通过求解前a个最大特征值对应的特征向量,组成投影矩阵W=[w1,w2,...,wa],投影后低维空间的数据为:
Y=WTX(9)
输入:样本数据集参数为k
输出:降维矩阵A=[a1,a2,…,ad]及低维子空间Y=ATX={y1,y2,…,yN}
算法的实现步骤如下:
(1)根据式(1)构造半监督全局目标函数式(2);
(2)根据aij=exp(-||xi-xj||2/σ)构造改进的半监督相似权重矩阵Q;
(3)由改进半监督相似权重矩阵,计算相似权重矩阵的对角矩阵D*以及拉普拉斯矩阵L*;
(4)根据式(3)半监督相似权重矩阵构造改进后的半监督局部目标函数式(4);(5)根据式(2)及式(4)构造半监督IPCA-IWSSFE整体目标函数式(5);
(6)根据式(8)求解广义特征方程,得到前a个最大特征值对应的特征向量,构成投影矩阵W;
(7)根据式(9)求低维子空间Y=WTX={y1,y2,…,yN}。
本发明提出了基于全局与局部保持的高光谱图像的半监督降维算法(IPCA-IWSSFE),对Pavia University高光谱图像进行处理,分别取标签数为10labels、15labels、20labels进行实验,并与PCA、LPP的结果进行对比,d为维数,k为近邻参数(k为16,d为5~50),结果参见附图2、附图3和附图4所示,从10labels、15labels、20labels的柱状图中可以发现,当标签数为10labels,d=15,k=16时,样本的识别率最高为94.44%。
图1大体展示了基于本发明技术的高光谱图像的降维的技术路线。
第一步,把已有的高光谱图像,根据专家已经标注的解译图,即参考图例,从这幅图像中提取出不同类别的样本数据{x1,x2,,…,xN},作为本发明高光谱图像降维的输入数据。
第二步,把第一步中获得的原始数据(103维*1800个样本)进行简单的数据预处理。预处理包括:样本数据加类标X={x1,x2,…,xl,xl+1,…,xl+u}、数据归一化处理。
第三步,对处理过后的样本数据求解他们之间的欧式距离(1800*1800)dist=||xi-xj||。
第四步,通过第三步求解的欧式距离,根据第二步中对样本添加类标信息的情况,分为5种情况求解,最终得到样本点之间的相似权重矩阵Q(1800*1800)如式(3)所示。
第五步,通过第四步求得的相似权重矩阵Q,根据相似权重矩阵Q求得对角矩阵D*和拉普拉斯矩阵L*。
第六步,通过有标签样本均值和无标签样本均值求出Cl和Cu。
第七步,由第五步和第六步求得的值带入根据公式(5)。
第八步,设置将样本数据维度d(取值范围为5~50),根据公式(8),求出转换矩阵W=(w1,w2,…,wd)(103*d维)。
第九步,计算公式yi=WT×xi,求出低维空间中样本数据Y={y1,y2,…,yN}(d维*1800)。
第十步,对降维后的少部分样本加入类标信息作为训练样本数据,结合大部分未加类标的测试样本数据,利用最近邻分类器对降维后的样本进行分类,将分类结果与已知(PCA、LPP)的结果对比,利用公式nErr=sum(class~=classLabel);rate=1-nErr/length(class)(class是通过最近邻算法求出来的测试样本的类标,classLabel是在降维之前已经知道的测试样本的类标,nErr是错误率,rate是识别率)计算出最终的样本识别率。
第十一步,从10labels、15labels、20labels的柱状图中可以发现,当标签数为10labels,d=15,k=16时,样本的识别率最高为94.44%。
本发明一旦投入应用,可以实现以下技术效果:本方案通过对高光谱图像进行全局和局部保持的半监督降维,既利用了数据的类标信息,也保持了数据的全局和局部特性,从而提高了图像的分类精度。本发明提出的算法充分利用PCA算法的全局保持特性和LPP算法的局部保持特性,在LPP算法的相似权重矩阵中引入少量有类标样本数据和大量无类标样本数据,且在该算法中将样本数据间近邻信息及类标信息的不同结合情况分别考虑,包括1)同类标签近邻样本数据点之间的相似性;2)不同类标签近邻样本数据点之间的相似性;3)有类标和无类标近邻样本数据点之间的相似性;4)无类标和无类标近邻样本数据点之间的相似性;本发明的一种基于全局与局部保持的高光谱图像半监督降维方法,适用于处理具有波段多且冗余、光谱分辨率高、波段宽度窄、数据量庞大、维数高的高光谱图像,大大降低了计算的复杂程度,减少了冗余信息所造成的判别误差,提高了分类精度,并且大大节省了这些图像的存储空间;本发明提出了一种既利用样本的类标信息,又同时考虑了样本数据间的全局与局部信息保持的降维方法,能够最小化同类样本间的距离,最大化不同类样本间的距离,而且能够同时保持数据的全局与局部信息的提取,从而提高了样本的分类精度;通过PCA无监督主成分分析算法,找到一个投影矩阵W,使投影后的数据能在低维空间中保持原有数据的大部分方差信息;改进的半监督相似权重矩阵具有以下优点:(1)0≤aij≤1,1≤(1+aij)≤2,0≤(1-aij)≤1,类间判别权值和类内判别权值将噪声压缩在一定的范围之内;(2)由式(1)可知,随着欧氏距离的减小,局部权重值增大,类间判别权值减小,类内判别权值增大,使得同类标签样本的相似权值越大,而非同类标签样本的权值相应减少。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明方法的前提下,还可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。
Claims (8)
1.一种基于全局与局部保持的高光谱图像半监督降维方法,其特征在于,所述的方法包括以下步骤:
步骤S1.设高维空间RD中存在数据集X={x1,x2,…,xl,xl+1,…,xl+u},其中前l个样本Xl为有类标样本,类别标签为c,各类样本数为Ni,i=(1,2,…,c),后u个样本Xu是无类标样本。
步骤S2.通过半监督全局分布算法构造半监督全局目标函数;
步骤S3.基于半监督局部保持投影算法,给出改进后的半监督局部目标函数;
步骤S4.结合S2中的全局目标函数和S3中的局部目标函数,构造半监督IPCA-IWSSFE整体目标函数及求解得出低维子空间Y=WTX。
2.根据权利要求1所述的基于全局与局部保持的高光谱图像半监督降维方法,其特征在于,步骤S2中的半监督全局目标函数为:
其中, 和分别为有标签样本均值和无标签样本均值。
3.根据权利要求1所述的基于全局与局部保持的高光谱图像半监督降维方法,其特征在于,步骤S3中具体包括以下步骤:
步骤S31.提出改进的半监督相似权重矩阵:
其中,qij为改进的半监督相似权重矩阵Q的元素,aij=exp(-||xi-xj||2/σ),σ为所有样本对间欧式距离平均值的平方。J(xi)为xi的k近邻域,k为近邻参数。aij为局部权重值,令(1+aij)为类内判别权值,(1-aij)为类间判别权值;
步骤S31.基于半监督相似权重矩阵,给出改进后的半监督局部目标函数:
其中,矩阵D*为Q的对角矩阵,对角矩阵为Dii *=∑jqij,L*=D*-Q为拉普拉斯矩阵。引入约束条件YD*YT=WTXD*XTW=I,其中I为单位矩阵。
4.根据权利要求1所述的基于全局与局部保持的高光谱图像半监督降维方法,其特征在于,步骤S4具体包括以下步骤:
步骤S41.构造半监督IPCA-IWSSFE整体目标函数:
步骤S42.引入约束条件WTXD*XTW=I,其中I为单位矩阵;
步骤S43.引入拉格朗日乘子法将式:
整体目标函数转化为最大值问题,如下式:
F(W)=WT(Cu+Cl-XL*XT)W-λ(WTXD*XTW-I)
步骤S44.对式F(W)=WT(Cu+Cl-XL*XT)W-λ(WTXD*XTW-I)的W进行求导,如下式:
步骤S45.令式F(W)=WT(Cu+Cl-XL*XT)W-λ(WTXD*XTW-I)转化为式(Cu+Cl-XL*XT)W=λXD*XTW;
其中λ为广义特征值,通过求解前a个最大特征值对应的特征向量,组成投影矩阵W=[w1,w2,…,wa];
步骤S46.投影后低维空间的数据为:
Y=WTX。
5.一种利用权利要求1-4任一所述的基于全局与局部保持的高光谱图像半监督降维方法的技术路线,具体如下:
第一步,把已有的高光谱图像,根据专家已经标注的解译图,即参考图例,从这幅图像中提取出不同类别的样本数据{x1,x2,,…,xN},作为本发明高光谱图像降维的输入数据;
第二步,把第一步中获得的原始数据进行简单的数据预处理;
第三步,对处理过后的样本数据求解他们之间的欧式距离dist=||xi-xj||;
第四步,通过第三步求解的欧式距离,根据第二步中对样本添加类标信息的情况,分为5种情况求解,最终得到样本点之间的相似权重矩阵Q;
第五步,通过第四步求得的相似权重矩阵Q,根据相似权重矩阵Q求得对角矩阵D*和拉普拉斯矩阵L*;
第六步,通过有标签样本均值和无标签样本均值求出Cl和Cu;
第七步,由第五步和第六步求得的值带入以下公式:
第八步,设置将样本数据维度(Cu+Cl-XL*XT)W=λXD*XTW,求出转换矩阵W=(w1,w2,…,wd);
第九步,计算公式yi=WT×xi,求出低维空间中样本数据Y={y1,y2,…,yN};
第十步,对降维后的少部分样本加入类标信息作为训练样本数据,结合大部分未加类标的测试样本数据,利用最近邻分类器对降维后的样本进行分类,将分类结果与已知主成分分析法PCA、局部保留投影LPP的结果对比,计算出最终的样本识别率。
6.根据权利要求5所述的一种基于全局与局部保持的高光谱图像半监督降维方法的技术路线,其特征在于,选择标签数为10labels,d=15,k=16时,作为样本识别率。
7.根据权利要求5所述的一种基于全局与局部保持的高光谱图像半监督降维方法的技术路线,其特征在于,样本识别率的计算公式如下:nErr=sum(class~=classLabel);rate=1-nErr/length(class);class是通过最近邻算法求出来的测试样本的类标,classLabel是在降维之前已经知道的测试样本的类标,nErr是错误率,rate是识别率。
8.根据权利要求5所述的一种基于全局与局部保持的高光谱图像半监督降维方法的技术路线,其特征在于,预处理包括:样本数据加类标X={x1,x2,…,xl,xl+1,…,xl+u}、数据规范化处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810328999.0A CN108520281A (zh) | 2018-04-13 | 2018-04-13 | 一种基于全局与局部保持的高光谱图像半监督降维方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810328999.0A CN108520281A (zh) | 2018-04-13 | 2018-04-13 | 一种基于全局与局部保持的高光谱图像半监督降维方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108520281A true CN108520281A (zh) | 2018-09-11 |
Family
ID=63432513
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810328999.0A Pending CN108520281A (zh) | 2018-04-13 | 2018-04-13 | 一种基于全局与局部保持的高光谱图像半监督降维方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108520281A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109754018A (zh) * | 2019-01-09 | 2019-05-14 | 北京工业大学 | 一种基于f范数的低秩局部保持投影的图像识别方法 |
CN110146652A (zh) * | 2019-05-17 | 2019-08-20 | 西南大学 | 基于全局和局部融合特征提取的电子鼻低浓度样本检测方法 |
CN110188821A (zh) * | 2019-05-30 | 2019-08-30 | 安徽机电职业技术学院 | 多参数边缘保持滤波和多特征学习的高光谱图像分类方法 |
CN110210500A (zh) * | 2019-06-06 | 2019-09-06 | 上海黑塞智能科技有限公司 | 一种基于多尺度局部特征嵌入的点云分类方法 |
CN110490231A (zh) * | 2019-07-17 | 2019-11-22 | 哈尔滨工程大学 | 一种有监督判别流形学习的Netflow数据降维方法 |
CN112163641A (zh) * | 2020-10-30 | 2021-01-01 | 浙江大学 | 一种基于概率多层次图结构的高维数据可视化方法 |
CN112257747A (zh) * | 2020-09-16 | 2021-01-22 | 北京工业大学 | 基于压缩数据和监督全局-局部/非局部分析的诊断方法 |
CN115861683A (zh) * | 2022-11-16 | 2023-03-28 | 西安科技大学 | 一种针对高光谱图像的快速降维方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102129571A (zh) * | 2011-01-31 | 2011-07-20 | 重庆大学 | 基于半监督流形学习的多光谱遥感数据土地利用分类方法 |
CN102982346A (zh) * | 2012-11-30 | 2013-03-20 | 湖州师范学院 | 一种最小最大局部结构信息的特征选择方法 |
CN106778885A (zh) * | 2016-12-26 | 2017-05-31 | 重庆大学 | 基于局部流形嵌入的高光谱图像分类方法 |
-
2018
- 2018-04-13 CN CN201810328999.0A patent/CN108520281A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102129571A (zh) * | 2011-01-31 | 2011-07-20 | 重庆大学 | 基于半监督流形学习的多光谱遥感数据土地利用分类方法 |
CN102982346A (zh) * | 2012-11-30 | 2013-03-20 | 湖州师范学院 | 一种最小最大局部结构信息的特征选择方法 |
CN106778885A (zh) * | 2016-12-26 | 2017-05-31 | 重庆大学 | 基于局部流形嵌入的高光谱图像分类方法 |
Non-Patent Citations (1)
Title |
---|
张晓涛 等: "基于半监督PCA-LPP 流形学习算法的故障降维辨识", 《中南大学学报》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109754018A (zh) * | 2019-01-09 | 2019-05-14 | 北京工业大学 | 一种基于f范数的低秩局部保持投影的图像识别方法 |
CN110146652A (zh) * | 2019-05-17 | 2019-08-20 | 西南大学 | 基于全局和局部融合特征提取的电子鼻低浓度样本检测方法 |
CN110188821A (zh) * | 2019-05-30 | 2019-08-30 | 安徽机电职业技术学院 | 多参数边缘保持滤波和多特征学习的高光谱图像分类方法 |
CN110210500A (zh) * | 2019-06-06 | 2019-09-06 | 上海黑塞智能科技有限公司 | 一种基于多尺度局部特征嵌入的点云分类方法 |
CN110490231A (zh) * | 2019-07-17 | 2019-11-22 | 哈尔滨工程大学 | 一种有监督判别流形学习的Netflow数据降维方法 |
CN112257747A (zh) * | 2020-09-16 | 2021-01-22 | 北京工业大学 | 基于压缩数据和监督全局-局部/非局部分析的诊断方法 |
CN112257747B (zh) * | 2020-09-16 | 2024-05-28 | 北京工业大学 | 基于压缩数据和监督全局-局部/非局部分析的诊断方法 |
CN112163641A (zh) * | 2020-10-30 | 2021-01-01 | 浙江大学 | 一种基于概率多层次图结构的高维数据可视化方法 |
CN112163641B (zh) * | 2020-10-30 | 2022-06-14 | 浙江大学 | 一种基于概率多层次图结构的高维数据可视化方法 |
CN115861683A (zh) * | 2022-11-16 | 2023-03-28 | 西安科技大学 | 一种针对高光谱图像的快速降维方法 |
CN115861683B (zh) * | 2022-11-16 | 2024-01-16 | 西安科技大学 | 一种针对高光谱图像的快速降维方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108520281A (zh) | 一种基于全局与局部保持的高光谱图像半监督降维方法 | |
Chen et al. | Remote sensing scene classification via multi-branch local attention network | |
Luo et al. | Semisupervised sparse manifold discriminative analysis for feature extraction of hyperspectral images | |
Qi et al. | Feature selection and multiple kernel boosting framework based on PSO with mutation mechanism for hyperspectral classification | |
Pang et al. | Robust heterogeneous discriminative analysis for face recognition with single sample per person | |
CN110084159A (zh) | 基于联合多级空谱信息cnn的高光谱图像分类方法 | |
CN109766858A (zh) | 结合双边滤波的三维卷积神经网络高光谱影像分类方法 | |
CN108520279A (zh) | 一种局部稀疏嵌入的高光谱图像半监督降维方法 | |
Zhou et al. | Robust visual tracking via efficient manifold ranking with low-dimensional compressive features | |
Huang et al. | Semi-supervised marginal fisher analysis for hyperspectral image classification | |
CN105678261B (zh) | 基于有监督图的直推式数据降维方法 | |
CN106096506A (zh) | 基于子类类间判别双字典的sar目标识别方法 | |
Liu et al. | Style transformation-based spatial–spectral feature learning for unsupervised change detection | |
Yang et al. | Semisupervised dual-geometric subspace projection for dimensionality reduction of hyperspectral image data | |
CN104778482A (zh) | 基于张量半监督标度切维数约减的高光谱图像分类方法 | |
Huang et al. | Hyperspectral image classification via discriminant Gabor ensemble filter | |
Han et al. | Spatial-spectral unsupervised convolutional sparse auto-encoder classifier for hyperspectral imagery | |
Salhi et al. | Fast and efficient face recognition system using random forest and histograms of oriented gradients | |
CN110363236A (zh) | 空谱联合超图嵌入的高光谱图像极限学习机聚类方法 | |
Dong et al. | Exploring locally adaptive dimensionality reduction for hyperspectral image classification: A maximum margin metric learning aspect | |
Xue et al. | Grafting transformer on automatically designed convolutional neural network for hyperspectral image classification | |
CN116503636A (zh) | 一种基于自监督预训练的多模态遥感影像分类方法 | |
CN105869161B (zh) | 基于图像质量评价的高光谱图像波段选择方法 | |
Kumari et al. | Deep learning techniques for remote sensing image scene classification: A comprehensive review, current challenges, and future directions | |
Wang et al. | Detect occluded items in X-ray baggage inspection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180911 |