CN104751191B - 一种稀疏自适应半监督多流形学习的高光谱影像分类方法 - Google Patents

一种稀疏自适应半监督多流形学习的高光谱影像分类方法 Download PDF

Info

Publication number
CN104751191B
CN104751191B CN201510197492.2A CN201510197492A CN104751191B CN 104751191 B CN104751191 B CN 104751191B CN 201510197492 A CN201510197492 A CN 201510197492A CN 104751191 B CN104751191 B CN 104751191B
Authority
CN
China
Prior art keywords
msub
mrow
manifold
sample
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510197492.2A
Other languages
English (en)
Other versions
CN104751191A (zh
Inventor
黄鸿
罗甫林
马泽忠
刘智华
杨娅琼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201510197492.2A priority Critical patent/CN104751191B/zh
Publication of CN104751191A publication Critical patent/CN104751191A/zh
Application granted granted Critical
Publication of CN104751191B publication Critical patent/CN104751191B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提供一种稀疏自适应半监督多流形学习的高光谱影像分类方法,其提出了半监督稀疏多流形学习维数约简算法和最近邻多流形分类算法,该方法仅通过对数据样本中的少量数据点进行标注,并结合部分未标注数据点来进行学习,能很好地揭示出蕴藏在高维数据的内在属性以及多流形结构,提取出具有更好鉴别性能的低维嵌入特征,从而改善分类效果,提高对高光谱遥感影像中地物类别的分类精度,因此能够有效的解决稀疏流形聚类与嵌入算法的“样本外学习”和遥感图像标记类别标签困难的问题;同时,在PaviaU数据集上的实验结果表明,与现有技术中所常用的识别方法相比,本发明方法具有更好的分类效果。

Description

一种稀疏自适应半监督多流形学习的高光谱影像分类方法
技术领域
本发明涉及高光谱数据处理方法与应用技术领域,具体涉及一种稀疏自适应半监督多流形学习的高光谱影像分类方法。
背景技术
高光谱遥感技术自20世纪80年代以来快速发展,其影像记录了地物目标的连续光谱,包含的信息更丰富,具备了识别更多种类的地物目标以及更高精度进行目标分类的能力。但由于高光谱数据由大量波段构成高维特征空间,大多数算法的复杂度随维数呈指数关系增长,对其处理需要更大的计算量,且其波段间具有高度相关性和冗余性,同时存在维数很高,分类时易因Hughes现象而无法获得理想结果等问题。科学家通过研究发现:高光谱数据可被描述为在低维嵌入空间上的流形(Manifold),即:高维空间的点是在少数独立变量的共同作用下在观测空间张成一个流形,如果能有效的发现其内在的主要变量,便能更好地了解高维数据的本质属性和特点。维数约减是解决以上问题的有效办法,能够降低数据的维数,得到高维数据有意义的低维表示,以便理解其内在的结构及后续处理。
迄今为止,在高维数据处理的研究领域中,国内外学者已经提出了一系列较为经典的降维算法,主要包括:主成分分析(Principal Component Analysis,PCA)、线性判别分析(Linear Discriminant Analysis,LDA)、独立成分分析(Independent ComponentAnalysis,ICA)、非负矩阵因子(Non-negative Matrix Factorization,NMF)等。这些方法的思想就是根据一定的性能目标来寻找一线性或非线性的空间变换,把原始信号数据压缩到一个低维子空间,使数据在子空间中的分布更加紧凑,为数据的更好描述提供了手段,另外计算的复杂度也得到了大大降低。由于这些维数约简方法具有描述性强、计算代价小、易实现及可分性好的特点,因而在高维数据特征提取的研究中占据了主导地位。但高光谱遥感数据具有十分复杂的非线性结构,并不全是线性分布的,子空间方法并不能揭示出高光谱数据中的非线性特性,无法反映出数据点的可分性和非线性,因而使用子空间方法对高光谱遥感数据进行维数约简并不能取得较好的效果。针对这些问题,He等提出了局部保持投影(Local Preserving Projrction,LPP)和邻域保持嵌入算法(NeighborhoodPreserving Embedding,NPE)等流形学习方法,其通过相似图保留样本的局部近邻结构,在一定程度上保持了原始数据的非线性流形,但是这两种算法依赖于人工预定义的相似图,要获得好的性能往往需要更多的训练样本,存在如近邻参数选择困难(如近邻数k、核宽σ)、噪声敏感等问题,分类效果受到限制。
稀疏保持投影(Sparsity Preserving Projections,SPP)是最近提出的一种基于稀疏表示理论的无监督降维算法。该算法不同于传统方法的图构建方式(如K-近邻),其利用样本间的稀疏重构关系建图,是全局性的稀疏构图算法,并归结为L1范数最小化问题。SPP算法不仅利用稀疏表示的自然判别能力,而且无需人为地选择近邻参数值,一定程度上缓解了近邻参数选择的困难。在高光谱图像分类中,常面对的是大量的未标记数据以及相对较少的有标记数据。虽然SPP算法无需对训练样本进行标记,但是没有有效利用标记样本中所提供的鉴别信息。
但是,上述方法都是假设数据中只存在一个单一流形,在实际应用中,数据中存在多个不同的流形结构。Xiao等提出了一种多流形的面部表情识别,能够有效地揭示出不同面部表情的内在多流形特性,采用了遗传算法寻求各流形的最优嵌入维度,再由最小化重构误差分类器进行分类,在面部表情识别中取得的较好的识别效果。Li和yang等人在人脸识别中分别提出了非参数鉴别多流形和多流形鉴别分析,揭示了人脸数据中的多流形结构,并取得了很好的识别效果。Tong等人提出一种多流形投影算法应用于工业过程监测和故障诊断中,揭示出局部和全局流形特性,在工业监测和故障诊断中取得了较好的效果。Valencia-Aguirre等人提出基于多流形的非线性维数约简方法,并用于COIL-100数据的可视化研究,取得了较好的多流形结构的可视效果。王立志等在“多线性局部与全局保持嵌入在高光谱遥感影像分类中的应用”一文中发现高光谱遥感数据中存在多个不同的低维流形结构,采用了局部全局保持嵌入提取出了各流形的鉴别特征,在高光谱地物分类中取得了较好的分类效果。
在稀疏多流形的研究中,Sun等提出了一种基于稀疏表示的多流形分析,揭示出了不同纹理图像的内在特性,并取得了较好的分类结果。Elhamifar等人提出了一种稀疏流形聚类与嵌入(Sparse Manifold Clustering and Embedding,SMCE)算法,该方法能够自适应的选取来自同一流形的数据,这些来自同一流形的数据点跨越了同一低维仿射子空间,在此基础上构建的相似图能更好地揭示出数据中不同流形的内在特性,在数据聚类中具有很好的效果,但该方法只在训练样本有定义,不能直接出来新样本,存在“样本外学习”问题,而且该方法没有充分利用训练样本的类别信息,限制了算法的鉴别能力。
因此,如何从标记数据以及未标记数据中提取出有用的知识来改善学习性能、提高分类精度,在高光谱图像分类领域中尤为重要。
发明内容
针对现有技术存在的上述不足,本发明的目的在于提供一种稀疏自适应半监督多流形学习的高光谱影像分类方法,其通过半监督稀疏鉴别嵌入算法对高光谱遥感影像进行维数简约,利用少量有标记训练样本以及部分无标记训练样本来发现蕴藏在高维数据的内在属性以及低维流形结构,以提高对高光谱遥感影像中地物类别的分类精度。
为了实现上述目的,本发明采用了如下的技术手段:
一种稀疏自适应半监督多流形学习的高光谱影像分类方法,包括如下步骤:
1)读入高光谱遥感影像数据;
2)将高光谱遥感影像中每一个数据点根据其光谱波段生成一个光谱数据向量,从而由各个数据点的光谱数据向量组成整幅高光谱遥感影像的光谱数据矩阵;
3)从高光谱遥感影像中选取部分数据点作为样本数据点,由各个样本数据点的光谱数据向量组成样本数据矩阵,并根据先验知识从样本数据矩阵中选取部分样本数据点的光谱数据向量进行已知地物类别的标注,生成相应的样本类别标签;
4)利用样本数据矩阵分别对其中每个样本数据点的光谱数据向量在仿射空间中构建稀疏优化模型,并优化求解得到每个样本数据点对应的仿射空间表示向量,从而得到样本数据矩阵对应的仿射空间表示矩阵;
5)根据样本数据矩阵中标注有样本类别标签的样本数据点进行半监督多流形划分,构建所有样本数据点的多流形稀疏相似图;
6)根据仿射空间表示矩阵和样本数据矩阵中标记的样本类别标签,利用半监督方法确定多流形稀疏相似图中各样本数据点之间的相似权重值,且根据多流形稀疏相似图中不同流形结构的划分关系,得到各个流形的半监督相似权重矩阵,进而由各个流形的半监督相似权重矩阵组成多流形稀疏相似图的半监督相似权重对角矩阵;
7)构建低维嵌入目标优化函数,利用多流形稀疏相似图的半监督相似权重对角矩阵通过稀疏多流形嵌入算法计算得到各流形的投影矩阵,进而得到每个流形中各个样本数据点相对于其投影矩阵所投影的低维嵌入特征;
8)对高光谱遥感影像中的测试数据点,分别利用各流形的投影矩阵对测试数据点的光谱数据向量进行投影,得到测试数据点的光谱数据向量分别在各流形的投影矩阵下的低维嵌入特征;
9)利用测试数据点在各流形的投影矩阵下的低维嵌入特征,分别计算测试数据点与每个流形中各样本数据点之间的低维嵌入特征最小距离,得到测试数据点相对于各流形的低维嵌入特征最小距离值;然后,以各个低维嵌入特征最小距离值中的最小值所对应的流形的地物类别作为测试数据点所属的地物类别;由此,分别确定高光谱遥感影像中各个测试数据点所属的类别,得到高光谱遥感影像中的地物类别的分类结果。
上述稀疏自适应半监督多流形学习的高光谱影像分类方法中,具体而言,所述步骤2)具体为:根据不同光谱波段对地物的光谱反射特性,将M行N列像素尺寸的高光谱遥感影像转换为Q行B列的光谱数据矩阵XQ
XQ={x1,x2,…,xq,…,xQ}T
其中,Q表示高光谱遥感影像的数据点空间尺寸,且Q=M×N,B表示高光谱遥感影像的光谱波段数;光谱数据矩阵XQ中的每一行表示高光谱遥感影像中的一个数据点在各个光谱波段上的光谱数据值,每一列表示高光谱遥感影像中各个数据点在一个光谱波段的光谱数据值;xq表示高光谱遥感影像中第q个数据点在各个光谱波段上的光谱数据值所构成的光谱数据向量,q∈{1,2,…,Q};T为矩阵转置符号。
上述稀疏自适应半监督多流形学习的高光谱影像分类方法中,具体而言,所述步骤3)得到的样本数据矩阵具体为:
X={(x1,l1),(x2,l2),…,(xi,li),…,(xu,lu),xu+1,xu+2,…,xn}T
其中,X表示样本数据矩阵,xi表示从高光谱遥感影像中选取的一个样本数据点的光谱数据向量,li表示对光谱数据向量xi标注的样本类别标签,i∈{1,2,…,n},n表示从高光谱遥感影像中选取作为样本数据点的数量,样本数据矩阵X中前u个样本数据点的光谱数据向量根据先验知识标注有样本类别标签,其余的n-u个样本数据点的光谱数据向量无样本类别标签。
上述稀疏自适应半监督多流形学习的高光谱影像分类方法中,具体而言,所述步骤4)具体为:
41)对样本数据矩阵X中任一个样本数据点的光谱数据向量xi,i∈{1,2,…,n},n表示从高光谱遥感影像中选取作为样本数据点的数量,利用样本数据矩阵X中的其它各个光谱数据向量建立xi的仿射空间表示方程:
其中,ε为松弛变量值,且0<ε<10;||·||为l2范数运算符,ci表示样本数据矩阵X中第i个样本数据点的光谱数据向量xi的仿射空间表示向量,即:
ci=[ci,1,ci,2,…,ci,j,…,ci,n]T
ci,j表示xi的仿射空间方程中对应于光谱数据向量xj的表示系数,j∈{1,2,…,n}且j≠i;
42)根据稀疏表示优化模型min||Qici||1和约束条件||Xici||≤ε,1Tci=1对xi的仿射空间表示方程进行求解,得到xi的同时满足稀疏优化模型和约束条件的仿射空间表示向量ci的最优解;其中,为xi对应的正则化向量;诱导矩阵表示了数据点间相距远近的权值;diag(·)表示对角矩阵;||·||1为l1范数运算符;||·||为l2范数运算符;
43)重复步骤41)~42),求得样本数据矩阵X中的每一个样本数据点的光谱数据向量xi的仿射空间表示向量ci,构成样本数据矩阵对应的仿射空间表示矩阵C:
C={c1,c2,…,ci,…,cn}。
上述稀疏自适应半监督多流形学习的高光谱影像分类方法中,具体而言,所述步骤5)具体为:
51)对于样本数据矩阵X中任一个标注有样本类别标签的样本数据点的光谱数据向量xi,考虑其k个近邻样本数据点之中的每一个近邻样本数据点的光谱数据向量xj∈X,j≠i;若光谱数据向量xj标注有样本类别标签且与光谱数据向量xi的样本类别标签相同,则用一条连线连接xi和xj所对应的两个样本数据点;若光谱数据向量xj无样本类别标签,但光谱数据向量xi的仿射空间表示向量ci中对应于光谱数据向量xj的表示系数ci,j≠0,则也用一条连线连接xi和xj所对应的两个样本数据点;否则,不连接xi和xj所对应的两个样本数据点;
52)按步骤51)所述方式遍历样本数据矩阵X中每一个标注有样本类别标签的样本数据点,由各个样本数据点之间的连线关系构成多流形稀疏相似图Gs;在多流形稀疏相似图Gs中,同一连线上的各个样本数据点属于同一流形,不同连线上的样本数据点分属于不同流形,从而在多流形稀疏相似图Gs中通过连线表示了不同流形结构的划分关系。
上述稀疏自适应半监督多流形学习的高光谱影像分类方法中,具体而言,所述步骤6)具体为:
61)针对于多流形稀疏相似图Gs中,任一个样本数据点的光谱数据向量xi与另一个样本数据点的光谱数据向量xj的相似权重值ws,ij按下式进行计算:
其中,i,j∈{1,2,…,n}且j≠i,n表示从高光谱遥感影像中选取作为样本数据点的数量;β为平衡参数,且β>1;ci,j表示仿射空间表示矩阵中光谱数据向量xi对应于光谱数据向量xi的表示系数,di,j表示光谱数据向量xi与xj之间的欧式距离;t[ci]和t[di]分别表示光谱数据向量xi对应的表示系数贡献值和欧氏距离贡献值,且有:
其中,表示仿射空间表示矩阵中光谱数据向量xi的仿射空间表示向量ci包含的非零表示系数的个数;表示取非零的表示系数ci,j所对应的光谱数据向量xi与xj之间的欧式距离di,j进行求和;
62)按上述方式分别计算得到光谱数据向量xi与其它各个光谱数据向量之间的相似权重值,得到光谱数据向量xi对应的相似权重向量Ws,i
Ws,i={ws,i1,ws,i2,…,ws,ij,…,ws,in},j≠i;
63)重复步骤61)~62),求得样本数据矩阵X中的每一个样本数据点的光谱数据向量对应的相似权重向量,由所有权重向量构成的多流形相似权重矩阵Ws
Ws={Ws,1,Ws,2,…,Ws,n}T
64)针对于多流形稀疏相似图Gs中的第l个流形Ml,由流形Ml中各样本数据点的光谱数据向量对应的相似权重向量排列构成流形Ml的半监督相似权重矩阵Ws[l]:
其中,Ws,a[l]表示流形Ml中第a个样本数据点对应的相似权重向量,Pl表示流形Ml中包含的样本数据点的个数,l∈{1,2,…,L},L表示稀疏相似图中包含的流形个数;
65)由各个流形的半监督相似权重矩阵构成多流形稀疏相似图的半监督相似权重对角矩阵WsD
上述稀疏自适应半监督多流形学习的高光谱影像分类方法中,具体而言,所述步骤7)具体为:
71)构造多流形稀疏相似图中的第l个流形Ml的目标函数J(Vl)为:
其中,Vl表示流形Ml上的投影矩阵;ws,ab[l]表示流形Ml中一个样本数据点的光谱数据向量xl,a与另一个样本数据点的光谱数据向量xl,b之间的相似权重值,xl,a,xl,b∈Ml,且b≠a;||·||为l2范数运算符;
72)在的约束条件下,根据目标函数J(Vl)得到流形Ml上的投影特征方程:
其中,Xl表示由流形Ml对应的样本数据矩阵,由流形Ml中各个样本数据点的光谱数据向量构成;I为单位矩阵;Ds[l]为Pl×Pl的对角矩阵,其对角元素Pl表示流形Ml中包含的样本数据点的个数;拉普拉斯矩阵Ls[l]=Ds[l]-Ws[l];λl为流形Ml的目标函数J(Vl)对应的拉格朗日常数;
73)对流形Ml上的投影特征方程进行广义特征值求解,得到其前d个最小特征值对应的d个特征向量vl,1,vl,2,…,vl,d,从而确定流形Ml上的投影矩阵Vl={vl,1,vl,2,…,vl,d};d<B,B表示高光谱遥感影像的光谱波段数;
74)对于流形Ml中任一个样本数据点的光谱数据向量xl,a,其通过投影矩阵Vl投影到低维嵌入空间的低维嵌入特征yl,a为:
yl,a=Vlxl,a
75)按照步骤71)~74)的流程,计算得到稀疏相似图中各流形的投影矩阵,进而得到每个流形中各个样本数据点相对于其投影矩阵所投影的低维嵌入特征。
上述稀疏自适应半监督多流形学习的高光谱影像分类方法中,具体而言,所述步骤8)中,测试数据点在任一流形Ml的投影矩阵下的低维嵌入特征yl,new为:
yl,new=Vlxnew
xnew表示测试数据点的光谱数据向量,Vl表示流形Ml上的投影矩阵,l∈{1,2,…,L},L表示稀疏相似图中包含的流形个数。
上述稀疏自适应半监督多流形学习的高光谱影像分类方法中,具体而言,所述步骤9)具体为:
91)利用测试数据点在各流形的投影矩阵下的低维嵌入特征,分别计算测试数据点相对于各流形的低维嵌入特征最小距离值;其中,测试数据点相对于稀疏相似图中流形Ml的的低维嵌入特征最小距离值dl,new为:
其中,yl,new表示测试数据点在流形Ml的投影矩阵下的低维嵌入特征;yl,a表示流形Ml中第a个样本数据点通过流形Ml的投影矩阵投影到低维嵌入空间的低维嵌入特征,a∈{1,2,…,Pl},Pl表示流形Ml中包含的样本数据点的个数;||·||为l2范数运算符;
92)比较测试数据点相对于各流形的低维嵌入特征最小距离值的大小,找到其中最小值所对应的流形,根据该流形中标注有样本类别标签的样本数据点确定该流形的地物类别,作为测试数据点所属的地物类别;
93)按照步骤91)~92)的流程,分别确定高光谱遥感影像中各个测试数据点所属的类别,得到高光谱遥感影像中的地物类别的分类结果。
与现有技术相比,本发明具有以下优点:
1、本发明稀疏自适应半监督多流形学习的高光谱影像分类方法,采用半监督稀疏多流形嵌入算法对高光谱遥感影像进行维数简约,先通过求解基于仿射空间中的稀疏优化模型的优化解,得到得到样本数据矩阵对应的仿射空间表示矩阵,再由仿射空间表示矩阵得到属于同一流形且跨越了同一低维仿射子空间的数据,构建多流形稀疏相似图及其半监督相似权重对角矩阵,增强少量的标记样本的权重,在低维嵌入空间中,对各流形分别保持各自流形上的相似性不变,使相邻点之间更加紧凑,能够提取出具有更好鉴别性能的低维嵌入特征,同时利用少量有标记训练样本以及部分无标记训练样本来发现蕴藏在高维数据的内在属性以及多流形结构,能够提高对高光谱遥感影像中地物类别的分类精度。
2、本发明稀疏自适应半监督多流形学习的高光谱影像分类方法中,利用了一种基于半监督的仿射空间模型,仅通过对数据样本中的少量数据点进行标注,并结合部分未标注数据点来进行学习,即可实现对整幅高光谱遥感影像的地物类别分类,能够消除监督学习方法中标记高光谱遥感数据全部类别信息困难的问题,同时改善了无监督学习鉴别能力受限制的现象,适宜于对数据量大、含混度高、地面已知样本数据少的高光谱遥感影像数据进行地物类别的分类。
3、本发明稀疏自适应半监督多流形学习的高光谱影像分类方法,能够有效的解决稀疏流形聚类与嵌入算法的“样本外学习”和遥感图像标记类别标签困难的问题,相比于现有技术而言具有更好的分类效果。
附图说明
图1为本发明稀疏自适应半监督多流形学习的高光谱影像分类方法的流程图。
图2为半监督多流形划分示例图。
图3为实施例中PaviaU高光谱遥感影像的真实地物图和地图分类效果图。
图4为实施例中本发明方法的S3MME算法在平衡参数β不同取值情况下的总体分类精度统计曲线图。
图5为实施例中本发明方法的S3MME算法在S3MME在不同无标记样本数情况下的总体分类精度统计直方图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细说明。
为了解决监督算法需要大量有标记数据以及无监督算法没有有效利用有标记数据提供的鉴别信息的不足,本发明提出了一种稀疏自适应半监督多流形学习的高光谱影像分类方法,该方法借助半监督稀疏多流形嵌入(Semi-supervised Sparse Multi-manifoldEmbedding,缩写为S3MME)算法,先通过求解基于仿射空间中的稀疏优化模型的优化解,得到得到样本数据矩阵对应的仿射空间表示矩阵,再由仿射空间表示矩阵得到属于同一流形且跨越了同一低维仿射子空间的数据,构建多流形稀疏相似图及其半监督相似权重对角矩阵,增强少量的标记样本的权重,在低维嵌入空间中,对各流形分别保持各自流形上的相似性不变,使相邻点之间更加紧凑,能够提取出具有更好鉴别性能的低维嵌入特征。同时,针对多流形分类问题,提出了一种最近邻多流形分类(Multi-manifold classificationbased Nearest Neighbor,缩写为NNMC)方法,改善分类效果。
下面对本发明稀疏自适应半监督多流形学习的高光谱影像分类方法所利用基本原理加以说明。
光谱数据矩阵:
高光谱遥感影像数据反映了地物对不同波段的光谱反射特性,根据高光谱遥感影像的数据点空间尺寸M×N(M行N列个数据点)以及光谱波段数B,若令Q=M×N,则可以将高光谱遥感影像中每一个数据点根据其光谱波段生成一个光谱数据向量,从而将高光谱遥感影像转换为Q行B列的光谱数据矩阵。
图嵌入框架:
图嵌入框架主要是嵌入主要思想是在低维嵌入空间中保持在高维空间中构建的图中各顶点间相似关系不变,得到最佳的低维嵌入特征,实现各数据的维数约简。由数据集X构建一个揭示数据间相似关系的无向权重图G={X,W},其中X为图的顶点,W为边权重矩阵。同时,在有些情况下还构建了一个惩罚图Gp={X,Wp},边权重矩阵Wp能抑制数据间的相似性。在低维嵌入空间中保留数据点间的相似性不变,其目标函数为:
其中,I为单位矩阵,wij为图G中数据点xi和xj间的边权重,B=Lp=Dp-Wp或B=I为约束矩阵,Lp和L=D-W为拉普拉斯矩阵,Dp和D为对角矩阵,且
连线边的权值设置主要采用简单方法和热核函数法,即为:
(1)简单方法:
(2)热核函数法(热核参数为t):
图嵌入方法在低维嵌入空间中能够很好地保持原始数据在高维空间的相似关系,具有较好的维数约简效果,但是近邻选取方式和权值设置方式对维数约简的结果有较大影响。
稀疏流形聚类与嵌入:
稀疏流形聚类与嵌入的主要思想是假设数据存在多个内在流形,每个数据点存在一个小的邻域数据点,只有这些来自同一流形的数据点在低维空间中才处于同一仿射子空间中。通过构建一个基于稀疏表示的优化问题来选取来自同一流形的数据点,在求解的稀疏系数中,非零值对应的数据点表示为属于同一流形,因此可以通过稀疏系数值得到不同流形的数据,可用于数据聚类,另外,由稀疏系数设置数据间的相似权重,可实现各流形数据的维数约简。
稀疏流形聚类与嵌入假设存在n个流形每个流形的内在维度为dl,对任意的点xi∈Ml,在最小球域范围内,包含了dl+1个来自流形Ml为xi的近邻点,邻域Ni中包含了Bl中除去xi的所有数据点。一般情况下,这个邻域内不仅包含了来自Ml流形的点,同时还包括了来自其它流形的数据点。假定对所有的数据点存在常数ε≥0,那么有:
其中,稀疏解中非零元素对应于来自流形Ml中xi的dl+1个近邻点,ci,j为xi与xj之间的稀疏系数,||·||为l2范数运算符。
上述假设可表示为:
其中稀疏系数ci=[ci,1,ci,2,…,ci,j,…,ci,n]。
当增大邻域尺寸时,在稀疏解ci具有最小数量的非零元素时,这个解将可能不是惟一的。为得到唯一解,首先将向量{xj-xi}j≠i正则化,令:
通过这种方法,对于一个很小的ε,||Xici||2≤ε的任何解ci的非零元素的位置都不因为选择的数据点是否接近或远离点xi而改变。在||Xici||2≤ε的所有满足条件1Tci=1解中,通常选择xi的最近邻点。另外,根据数据点与xi的接近程度设置了一个惩罚目标函数。其中,对接近xi的数据点比远离xi的数据点分配较小的惩罚值。因此,得到下列加权的l1优化目标:
其中,||·||1为l1范数运算符;||·||为l2范数运算符。l1范数提高了解的稀疏性,诱导矩阵Qi是一个正定对角矩阵,其主要作用是选择接近xi的数据点。
应该注意的是,在选择Qi中的元素时,接近xi的点权值较小,并且将非零系数分配给这些数据点;相反地,距离xi较远的点权值较大,并将为零的系数分配给它们。诱导矩阵Qi为对角矩阵,其对角线元素可设置为:
通过拉格朗日乘子法,上述l1优化目标可表示为:
其中:参数λ平衡了解的稀疏性和仿射重构误差。
根据稀疏系数,xi与xj间的相似权值设置为:
稀疏流形聚类与嵌入算法能够揭示出数据点间的流形结构,自适应地选取来自同一流形的近邻,可以较好地实现数据聚类。但是,该方法只在训练样本集上有定义,不能直接得到新样本的低维嵌入特征,而且该方法没有充分利用已知样本信息,限制了其鉴别力。
半监督稀疏多流形嵌入:
半监督稀疏多流形主要是运用SMCE自适应的选取来自同一流形的数据点,由标记点和无标记点来构建各流形的相似图,并通过稀疏系数计算各流形中数据点间的相似权重,同时增强标记数据点间的权重值,结合图嵌入框架,在各流形上分别构建相似图,并保留各流形中数据点间的相似性不变,得到各流形的低维嵌入。该方法不仅具有全局稀疏性的特点而且对各数据点具有较好的鉴别可分性。
首先,对数据进行半监督多流形划分,主要思想是把同类标记样本作为同一流形,对无标记样本通过SMCE算法由标记点选取同一流形的样本点,根据某类标记样本点选出的无标记样本点与该类标记样本一起归属为同一流形的样本。如图2为半监督多流形划分过程,图中三角形为无标记样本,圆形为标记样本,同一连线上的图形节点为同一流形样本。对于属于流形Ml的标记样本点x1,对其同类样本点都归于流形Ml;寻找属于Ml的无标记样本点,其中样本点x1与样本点x2、x3间的距离比样本点x4、x5、x6、x7距离更近,x1包含点x2、x3的近邻也包括点x4、x5、x6、x7。在这情况下,选取出仿射跨越的近邻,可得到点x1最近的切空间点x2、x3,进而得到同x1属于同一切空间流形Ml的无标记点。按这样的方式遍历样本数据矩阵X中每一个标注有样本类别标签的样本数据点,由各个样本数据点之间的连线关系构成多流形稀疏相似图Gs;在多流形稀疏相似图Gs中,同一连线上的各个样本数据点属于同一流形,不同连线上的样本数据点分属于不同流形,从而在多流形稀疏相似图Gs中通过连线表示了不同流形结构的划分关系。
对于数据点xi,可由SMCE中的稀疏优化方法,求解与xi同类标记样本和所有无标记样本间的稀疏系数,把同类标记样本点和非零稀疏系数对应的样本作为同一流形的数据点。其稀疏优化目标为:
其中:参数λ平衡了解的稀疏性和仿射重构误差;正则化矩阵Xi和诱导矩阵Qi分别为:
由稀疏系数中的非零元素可表示来自同一流形的数据,构建一个稀疏相似图Gs(V,E,Ws),其中V={x1,x2,…,xN}表示顶点集,E表示边集,Ws表示边的权重值。边E的设置方式是在同类数据点以及无标记稀疏系数不为零的数据点之间构建一条边,非同类数据点之间不连边,xi与xj间的权重为:
其中,i,j∈{1,2,…,n}且j≠i,n表示从高光谱遥感影像中选取作为样本数据点的数量;β为平衡参数,且β>1;ci,j表示仿射空间表示矩阵中光谱数据向量xi对应于光谱数据向量xi的表示系数,di,j表示光谱数据向量xi与xj之间的欧式距离;t[ci]和t[di]分别表示光谱数据向量xi对应的表示系数贡献值和欧氏距离贡献值,且有:
其中,表示仿射空间表示矩阵中光谱数据向量xi的仿射空间表示向量ci包含的非零表示系数的个数;表示取非零的表示系数ci,j所对应的光谱数据向量xi与xj之间的欧式距离di,j进行求和。按上述方式分别计算得到光谱数据向量xi与其它各个光谱数据向量之间的相似权重值,得到光谱数据向量xi对应的相似权重向量Ws,i
Ws,i={ws,i1,ws,i2,…,ws,ij,…,ws,in},j≠i;
如此求得样本数据矩阵X中的每一个样本数据点的光谱数据向量对应的相似权重向量,由所有权重向量构成的多流形相似权重矩阵Ws
Ws={Ws,1,Ws,2,…,Ws,n}T
由于在多流形稀疏相似图Gs中,同一连线上的各个样本数据点属于同一流形,不同连线上的样本数据点分属于不同流形,即多流形稀疏相似图Gs中包含了各流形的样本数据点,通过连线表示了不同流形结构的划分关系。因此,针对于多流形稀疏相似图Gs中的第l个流形Ml,由流形Ml中各样本数据点的光谱数据向量对应的相似权重向量排列构成流形Ml的半监督相似权重矩阵Ws[l]:
其中,Ws,a[l]表示流形Ml中第a个样本数据点对应的相似权重向量,Pl表示流形Ml中包含的样本数据点的个数,l∈{1,2,…,L},L表示稀疏相似图中包含的流形个数。由各个流形的半监督相似权重矩阵即构成多流形稀疏相似图的半监督相似权重对角矩阵WsD
在低维空间中,分别保持各流形数据点间的相似权重不变,使各流形上的数据点更加紧凑,构建目标函数为:
其中:Vl为流形Ml上的投影矩阵,xl,i和xl,j为流形Ml中的数据点,ws,ij[l]为流形Ml中xl,i和xl,j间的权重。
其中:Ds[l]为对角矩阵,且Ds,ii[l]=Σjws,ij[l];拉普拉斯矩阵Ls[l]=Ds[l]-Ws[l]。
在嵌入空间中,为消除尺度因子,增加一个约束条件为:
其中:I为单位矩阵。
在流形Ml上的目标函数可以转化为以下优化问题。
根据拉格朗日乘法,优化问题可转换为广义特征值求解问题,即:
其中:λi为拉格朗日常数。
根据广义特征值问题,可得到流形Ml上的最佳投影矩阵为Vl=[vl,1,…,vl,d],vl,i(i=1,2,…,d)为前d个最小的特征值对应的特征向量。
根据不同流形上的权重矩阵可得到各流形的投影矩阵进而得到Ml流形中数据点xl的低维嵌入
最近邻多流形分类:
由于各流形具有不同的内在嵌入维度,传统的最近邻分类器不能直接被利用,因此,本发明提出了一种最近邻多流形分类方法。该方法通过计算新样本在各流形中与各样本的最近距离,再比较所有流形中的最小距离,最后把新样本归属于距离最小的流形中。
对新样本xnew分别利用各流形的投影矩阵,得到各流形的低维嵌入计算各流形中的最小距离为:
其中:dl为在流形Ml与新样本的最小距离,Nl为Ml流形中样本数。
然后,根据各流形的最小距离,得到所有流形中的距离最小值,把新样本归为该最小值所属的流形,进而得到新样本所属的类别。
其中:L(xnew)为新样本xnew的类别。
基于上述理论思想,本发明稀疏自适应半监督多流形学习的高光谱影像分类方法的整体流程如图1所示,具体包括如下步骤:
1)读入高光谱遥感影像数据。
2)将将高光谱遥感影像中每一个数据点根据其光谱波段生成一个光谱数据向量,从而由各个数据点的光谱数据向量组成整幅高光谱遥感影像的光谱数据矩阵。
该步骤具体为:根根据不同光谱波段对地物的光谱反射特性,将M行N列像素尺寸的高光谱遥感影像转换为Q行B列的光谱数据矩阵XQ
XQ={x1,x2,…,xq,…,xQ}T
其中,Q表示高光谱遥感影像的数据点空间尺寸,且Q=M×N,B表示高光谱遥感影像的光谱波段数;光谱数据矩阵XQ中的每一行表示高光谱遥感影像中的一个数据点在各个光谱波段上的光谱数据值,每一列表示高光谱遥感影像中各个数据点在一个光谱波段的光谱数据值;xq表示高光谱遥感影像中第q个数据点在各个光谱波段上的光谱数据值所构成的光谱数据向量,q∈{1,2,…,Q};T为矩阵转置符号。
3)从高光谱遥感影像中选取部分数据点作为样本数据点,由各个样本数据点的光谱数据向量组成样本数据矩阵,并根据先验知识从样本数据矩阵中选取部分样本数据点的光谱数据向量进行已知地物类别的标注,生成相应的样本类别标签。该步骤得到的样本数据矩阵具体为:
X={(x1,l1),(x2,l2),…,(xi,li),…,(xu,lu),xu+1,xu+2,…,xn}T
其中,X表示样本数据矩阵,xi表示从高光谱遥感影像中选取的一个样本数据点的光谱数据向量,li表示对光谱数据向量xi标注的样本类别标签,i∈{1,2,…,n},n表示从高光谱遥感影像中选取作为样本数据点的数量,样本数据矩阵X中前u个样本数据点的光谱数据向量根据先验知识标注有样本类别标签,其余的n-u个样本数据点的光谱数据向量无样本类别标签。
4)利用样本数据矩阵分别对其中每个样本数据点的光谱数据向量在仿射空间中构建稀疏优化模型,并优化求解得到每个样本数据点对应的仿射空间表示向量,从而得到样本数据矩阵对应的仿射空间表示矩阵。
该步骤具体为:
41)对样本数据矩阵X中任一个样本数据点的光谱数据向量xi,i∈{1,2,…,n},n表示从高光谱遥感影像中选取作为样本数据点的数量,利用样本数据矩阵X中的其它各个光谱数据向量建立xi的仿射空间表示方程:
其中,ε为松弛变量值,且0<ε<10;||·||为l2范数运算符,ci表示样本数据矩阵X中第i个样本数据点的光谱数据向量xi的仿射空间表示向量,即:
ci=[ci,1,ci,2,…,ci,j,…,ci,n]T
ci,j表示xi的仿射空间方程中对应于光谱数据向量xj的表示系数,j∈{1,2,…,n}且j≠i;
42)根据稀疏表示优化模型min||Qici||1和约束条件||Xici||≤ε,1Tci=1对xi的仿射空间表示方程进行求解,得到xi的同时满足稀疏优化模型和约束条件的仿射空间表示向量ci的最优解;其中,为xi对应的正则化向量;诱导矩阵表示了数据点间相距远近的权值;diag(·)表示对角矩阵;||·||1为l1范数运算符;||·||为l2范数运算符;
43)重复步骤41)~42),求得样本数据矩阵X中的每一个样本数据点的光谱数据向量xi的仿射空间表示向量ci,构成样本数据矩阵对应的仿射空间表示矩阵C:
C={c1,c2,…,ci,…,cn}。
5)根据样本数据矩阵中标注有样本类别标签的样本数据点进行半监督多流形划分,构建所有样本数据点的多流形稀疏相似图。
该步骤具体为:
51)对于样本数据矩阵X中任一个标注有样本类别标签的样本数据点的光谱数据向量xi,考虑其k个近邻样本数据点之中的每一个近邻样本数据点的光谱数据向量xj∈X,j≠i;若光谱数据向量xj标注有样本类别标签且与光谱数据向量xi的样本类别标签相同,则用一条连线连接xi和xj所对应的两个样本数据点;若光谱数据向量xj无样本类别标签,但光谱数据向量xi的仿射空间表示向量ci中对应于光谱数据向量xj的表示系数ci,j≠0,则也用一条连线连接xi和xj所对应的两个样本数据点;否则,不连接xi和xj所对应的两个样本数据点;
52)按步骤51)所述方式遍历样本数据矩阵X中每一个标注有样本类别标签的样本数据点,由各个样本数据点之间的连线关系构成多流形稀疏相似图Gs;在多流形稀疏相似图Gs中,同一连线上的各个样本数据点属于同一流形,不同连线上的样本数据点分属于不同流形,从而在多流形稀疏相似图Gs中通过连线表示了不同流形结构的划分关系。
6)根据仿射空间表示矩阵和样本数据矩阵中标记的样本类别标签,利用半监督方法确定多流形稀疏相似图中各样本数据点之间的相似权重值,且根据多流形稀疏相似图中不同流形结构的划分关系,得到各个流形的半监督相似权重矩阵,进而由各个流形的半监督相似权重矩阵组成多流形稀疏相似图的半监督相似权重对角矩阵。
该步骤具体为:
61)针对于多流形稀疏相似图Gs中,任一个样本数据点的光谱数据向量xi与另一个样本数据点的光谱数据向量xj的相似权重值ws,ij按下式进行计算:
其中,i,j∈{1,2,…,n}且j≠i,n表示从高光谱遥感影像中选取作为样本数据点的数量;β为平衡参数,且β>1;ci,j表示仿射空间表示矩阵中光谱数据向量xi对应于光谱数据向量xi的表示系数,di,j表示光谱数据向量xi与xj之间的欧式距离;t[ci]和t[di]分别表示光谱数据向量xi对应的表示系数贡献值和欧氏距离贡献值,且有:
其中,表示仿射空间表示矩阵中光谱数据向量xi的仿射空间表示向量ci包含的非零表示系数的个数;表示取非零的表示系数ci,j所对应的光谱数据向量xi与xj之间的欧式距离di,j进行求和;
62)按上述方式分别计算得到光谱数据向量xi与其它各个光谱数据向量之间的相似权重值,得到光谱数据向量xi对应的相似权重向量Ws,i
Ws,i={ws,i1,ws,i2,…,ws,ij,…,ws,in},j≠i;
63)重复步骤61)~62),求得样本数据矩阵X中的每一个样本数据点的光谱数据向量对应的相似权重向量,由所有权重向量构成的多流形相似权重矩阵Ws
Ws={Ws,1,Ws,2,…,Ws,n}T
64)针对于多流形稀疏相似图Gs中的第l个流形Ml,由流形Ml中各样本数据点的光谱数据向量对应的相似权重向量排列构成流形Ml的半监督相似权重矩阵Ws[l]:
其中,Ws,a[l]表示流形Ml中第a个样本数据点对应的相似权重向量,Pl表示流形Ml中包含的样本数据点的个数,l∈{1,2,…,L},L表示稀疏相似图中包含的流形个数;
65)由各个流形的半监督相似权重矩阵构成多流形稀疏相似图的半监督相似权重对角矩阵WsD
7)构建低维嵌入目标优化函数,利用多流形稀疏相似图的半监督相似权重对角矩阵通过稀疏多流形嵌入算法计算得到各流形的投影矩阵,进而得到每个流形中各个样本数据点相对于其投影矩阵所投影的低维嵌入特征。
该步骤具体为:
71)构造多流形稀疏相似图中的第l个流形Ml的目标函数J(Vl)为:
其中,Vl表示流形Ml上的投影矩阵;ws,ab[l]表示流形Ml中一个样本数据点的光谱数据向量xl,a与另一个样本数据点的光谱数据向量xl,b之间的相似权重值,xl,a,xl,b∈Ml,且b≠a;||·||为l2范数运算符;
72)在的约束条件下,根据目标函数J(Vl)得到流形Ml上的投影特征方程:
其中,Xl表示由流形Ml对应的样本数据矩阵,由流形Ml中各个样本数据点的光谱数据向量构成;I为单位矩阵;Ds[l]为Pl×Pl的对角矩阵,其对角元素Pl表示流形Ml中包含的样本数据点的个数;拉普拉斯矩阵Ls[l]=Ds[l]-Ws[l];λl为流形Ml的目标函数J(Vl)对应的拉格朗日常数;
73)对流形Ml上的投影特征方程进行广义特征值求解,得到其前d个最小特征值对应的d个特征向量vl,1,vl,2,…,vl,d,从而确定流形Ml上的投影矩阵Vl={vl,1,vl,2,…,vl,d};d<B,B表示高光谱遥感影像的光谱波段数;
74)对于流形Ml中任一个样本数据点的光谱数据向量xl,a,其通过投影矩阵Vl投影到低维嵌入空间的低维嵌入特征yl,a为:
yl,a=Vlxl,a
75)按照步骤71)~74)的流程,计算得到稀疏相似图中各流形的投影矩阵,进而得到每个流形中各个样本数据点相对于其投影矩阵所投影的低维嵌入特征。
通过上述的步骤4~7的处理流程,可以看到,在本发明方法的降维处理过程中,先通过求解基于仿射空间中的稀疏优化模型的优化解,得到得到样本数据矩阵对应的仿射空间表示矩阵,再由仿射空间表示矩阵得到属于同一流形且跨越了同一低维仿射子空间的数据,构建多流形稀疏相似图及其半监督相似权重对角矩阵,增强少量的标记样本的权重,在低维嵌入空间中,对各流形分别保持各自流形上的相似性不变,使相邻点之间更加紧凑,能够提取出具有更好鉴别性能的低维嵌入特征。在本发明中,这里所采用的降维处理方法描述为半监督稀疏多流形嵌入(Semi-supervised Sparse Multi-manifold Embedding,缩写为S3MME)算法。
8)对高光谱遥感影像中的测试数据点,分别利用各流形的投影矩阵对测试数据点的光谱数据向量进行投影,得到测试数据点的光谱数据向量分别在各流形的投影矩阵下的低维嵌入特征。该步骤中,测试数据点在任一流形Ml的投影矩阵下的低维嵌入特征yl,new为:
yl,new=Vlxnew
xnew表示测试数据点的光谱数据向量,Vl表示流形Ml上的投影矩阵,l∈{1,2,…,L},L表示稀疏相似图中包含的流形个数。
9)利用测试数据点在各流形的投影矩阵下的低维嵌入特征,分别计算测试数据点与每个流形中各样本数据点之间的低维嵌入特征最小距离,得到测试数据点相对于各流形的低维嵌入特征最小距离值;然后,以各个低维嵌入特征最小距离值中的最小值所对应的流形的地物类别作为测试数据点所属的地物类别;由此,分别确定高光谱遥感影像中各个测试数据点所属的类别,得到高光谱遥感影像中的地物类别的分类结果。
该步骤具体为:
91)利用测试数据点在各流形的投影矩阵下的低维嵌入特征,分别计算测试数据点相对于各流形的低维嵌入特征最小距离值;其中,测试数据点相对于稀疏相似图中流形Ml的的低维嵌入特征最小距离值dl,new为:
其中,yl,new表示测试数据点在流形Ml的投影矩阵下的低维嵌入特征;yl,a表示流形Ml中第a个样本数据点通过流形Ml的投影矩阵投影到低维嵌入空间的低维嵌入特征,a∈{1,2,…,Pl},Pl表示流形Ml中包含的样本数据点的个数;||·||为l2范数运算符;
92)比较测试数据点相对于各流形的低维嵌入特征最小距离值的大小,找到其中最小值所对应的流形,根据该流形中标注有样本类别标签的样本数据点确定该流形的地物类别,作为测试数据点所属的地物类别;
93)按照步骤91)~92)的流程,分别确定高光谱遥感影像中各个测试数据点所属的类别,得到高光谱遥感影像中的地物类别的分类结果。
在本发明中,将步骤9所采用的针对于多流形分类问题的分类方法描述为最近邻多流形分类(Multi-manifold classification based Nearest Neighbor,缩写为NNMC)方法。
下面结合实施例和附图对本发明进行进一步的说明。
实施例:
为了验证本发明方法的有效性,下面通过实施例进行实验,并在相同的样本条件下,将本发明方法与现有技术中常用的其它维数约简方法进行了对比。在本实验中用以进行对比的维数约简方法有:主成分分析(Principal Component Analysis,PCA),线性鉴别分析(Linear Discriminant Analysis,LDA),邻域保持嵌入(Neighborhood PreservingEmbedding,NPE),监督NPE(Supervise NPE,SNPE),局部保持投影(Locality PreservingProjection,LPP),监督LPP(Supervise LPP,SLPP),边界Fisher分析(Marginal FisherAnalysis,MFA),局部Fisher鉴别分析(Locality Fisher Discriminant Analysis,LFDA),最大边界准则(Maximum Margin Criterion,MMC),稀疏保持投影(Sparsity PreservingProjections,SPP),鉴别学习基于稀疏表示(Discriminative Learning by SparseRepresentation,DLSP),半监督MMC(SSMMC),半监督MFA(Semi-supervised MFA,SSMFA),半监督子空间流形鉴别嵌入(Semi-supervised Sub-manifold Discriminant Analysis,S3MDE),稀疏鉴别分析(Sparse Discriminant Analysis,SDA)。同时,本实验中针对于采用现有技术维数约简方法的识别中,均采用了现有技术中最常用的最近邻(NN)分类方法进行分类。
本实验采用PaviaU数据作为实验数据。PaviaU数据集于2002年由ROSIS传感器获取的高光谱图像,该图像是位于意大利北部的帕维亚大学,其大小为610×340像素,空间分辨率为1.3m,波谱范围为430~860nm共包括了115个波段,去除受噪声影响的波段,余下的101个波段用于实验。PaviaU数据集的真实地物图像和地图分类效果图如图3所示,其中图(3a)为PaviaU数据集的真实地物图像,图(3b)为PaviaU数据集的地图分类效果图。
本实验中,分四次从PaviaU数据集中选取训练样本集和测试样本集,训练样本集包含3000个分别包括每类nl个标记样本和总共u个无标记样本,其中,四次取样的无标记样本个数u均为3000,而四次取样的标记样本个数nl分别为10、20、40、80,PaviaU数据集中剩余的样本作为测试样本。然后,采用本发明的S3MME算法结合NNMC分类方法,以及上述各种现有技术的维数约简方法结合最近邻(NN)分类方法,分别对上述四种取样情况中的测试样本进行分类,在每种取样情况下分别进行10次分类识别实验,最后通过平均总体分类精度(OA)评价分类结果。为使各算法都能有较好的效果,本实验中选取了NPE,SNPE,LPP,SLPP,MFA,LFDA,SSMFA的近邻数为7,对SPP,DLSP,SDA的稀疏重构误差选取为0.1,除本发明方法的S3MME算法以外其余各维数约简算法的低维嵌入维度设置为30,而本发明的S3MME算法中取平衡参数β的值为40。表1给出了在PaviaU数据集上不同算法不同标记样本和3000个无标记样本的分类结果。由表1可知,随着标记样本数的增加,各算法的总体分类精度都不断增大,这是由于标记样本越多可用的已知信息也越多,进而使算法的分类精度得到改善。在不同的标记样本下,本发明提出的S3MME算法的效果最好,表明本发明提出的算法能更有效地揭示出高光谱遥感数据的内在特性,多流形算法更能体现高光谱遥感数据的本征属性,进而改善分类效果。
表1不同算法在PaviaU数据集上的分类结果
此外,为了体现平衡参数β对S3MME实验结果的影响,随机选取每类80个标记样本和总共3000个无标记样本,分别设置平衡参数β的取值为1,10,20,…,200(即在取值为10之后,每次取值间隔值为10,一直取值到200),每个取值条件下分别进行10次重复实验,图4为统计得到的S3MME算法在平衡参数β不同取值情况下的总体分类精度统计曲线图。根据图4可知,β>1后总体分类精度也得到了改善,主要是因为β增大,增强了同类数据的权重,在嵌入空间中使同类数据更聚集。但当β过大时,使无标记样本的权重被削弱,使无标记样本的作用减弱,反而总体分类精度不能得到改善。为能达到较好的分类效果,针对于本发明的分类方法,平衡参数β的较优取值为20~40。
另外,为体现不同无标记样本数对S3MME算法的影响,还通过五种不同的取样情况进行实验,每种取样情况中随机选取10个标记样本,而五种不同取样情况的无标记样本个数分别为100个、500个、1000个、2000个、3000个,每中取样情况下采用本发明方法进行10次分类识别实验,图5给出了在不同无标记样本数下的分类精度。由图5可知,随着无标记样本数的增加,S3MME算法的分类精度也不断增加,在无标记样本数较小时,增幅比较明显,当无标记样本增加到一定数量后,增幅值较小。这是由于随着无标记样本数的增加,可用的信息增多,使分类效果得到较大的改善,当增加到一定程度后,能用的有用信息已达到饱和,分类效果增幅值就不太明显。
综上所述,可以看到,针对稀疏流形聚类与嵌入算法的“样本外学习”和遥感图像标记类别标签困难的问题,本发明主要提出了半监督稀疏多流形学习维数约简算法和最近邻多流形分类算法,该方法仅通过对数据样本中的少量数据点进行标注,并结合部分未标注数据点来进行学习,能很好地揭示出蕴藏在高维数据的内在属性以及多流形结构,提取出具有更好鉴别性能的低维嵌入特征,从而改善分类效果,提高对高光谱遥感影像中地物类别的分类精度。在PaviaU数据集上的实验结果表明,与现有技术中所常用的识别方法相比,本发明方法具有更好的分类效果。
需要说明的是,以上实施例仅以说明本发明技术方案而非限制本发明。尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围之中。

Claims (9)

1.一种稀疏自适应半监督多流形学习的高光谱影像分类方法,其特征在于,包括如下步骤:
1)读入高光谱遥感影像数据;
2)将高光谱遥感影像中每一个数据点根据其光谱波段生成一个光谱数据向量,从而由各个数据点的光谱数据向量组成整幅高光谱遥感影像的光谱数据矩阵;
3)从高光谱遥感影像中选取部分数据点作为样本数据点,由各个样本数据点的光谱数据向量组成样本数据矩阵,并根据先验知识从样本数据矩阵中选取部分样本数据点的光谱数据向量进行已知地物类别的标注,生成相应的样本类别标签;
4)利用样本数据矩阵分别对其中每个样本数据点的光谱数据向量在仿射空间中构建稀疏优化模型,并优化求解得到每个样本数据点对应的仿射空间表示向量,从而得到样本数据矩阵对应的仿射空间表示矩阵;
5)根据样本数据矩阵中标注有样本类别标签的样本数据点进行半监督多流形划分,构建所有样本数据点的多流形稀疏相似图;
6)根据仿射空间表示矩阵和样本数据矩阵中标记的样本类别标签,利用半监督方法确定多流形稀疏相似图中各样本数据点之间的相似权重值,且根据多流形稀疏相似图中不同流形结构的划分关系,得到各个流形的半监督相似权重矩阵,进而由各个流形的半监督相似权重矩阵组成多流形稀疏相似图的半监督相似权重对角矩阵;其中,多流形稀疏相似图Gs中任一个样本数据点的光谱数据向量xi与另一个样本数据点的光谱数据向量xj的相似权重值ws,ij按下式进行计算:
其中,i,j∈{1,2,…,n}且j≠i,n表示从高光谱遥感影像中选取作为样本数据点的数量;β为平衡参数,且β>1;ci,j表示仿射空间表示矩阵中光谱数据向量xi对应于光谱数据向量xi的表示系数,di,j表示光谱数据向量xi与xj之间的欧式距离;t[ci]和t[di]分别表示光谱数据向量xi对应的表示系数贡献值和欧氏距离贡献值,且有:
<mrow> <mi>t</mi> <mo>&amp;lsqb;</mo> <msub> <mi>c</mi> <mi>i</mi> </msub> <mo>&amp;rsqb;</mo> <mo>=</mo> <mfrac> <mn>1</mn> <msub> <mi>P</mi> <mrow> <mi>i</mi> <mo>,</mo> <msub> <mi>c</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>&amp;NotEqual;</mo> <mn>0</mn> </mrow> </msub> </mfrac> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>c</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mi>t</mi> <mo>&amp;lsqb;</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>&amp;rsqb;</mo> <mo>=</mo> <mfrac> <mn>1</mn> <msub> <mi>P</mi> <mrow> <mi>i</mi> <mo>,</mo> <msub> <mi>c</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>&amp;NotEqual;</mo> <mn>0</mn> </mrow> </msub> </mfrac> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>d</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <msub> <mo>|</mo> <mrow> <msub> <mi>c</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>&amp;NotEqual;</mo> <mn>0</mn> </mrow> </msub> <mo>;</mo> <mi>j</mi> <mo>&amp;NotEqual;</mo> <mi>i</mi> <mo>;</mo> </mrow>
其中,表示仿射空间表示矩阵中光谱数据向量xi的仿射空间表示向量ci包含的非零表示系数的个数;表示取非零的表示系数ci,j所对应的光谱数据向量xi与xj之间的欧式距离di,j进行求和;
7)构建低维嵌入目标优化函数,利用多流形稀疏相似图的半监督相似权重对角矩阵通过稀疏多流形嵌入算法计算得到各流形的投影矩阵,进而得到每个流形中各个样本数据点相对于其投影矩阵所投影的低维嵌入特征;
8)对高光谱遥感影像中的测试数据点,分别利用各流形的投影矩阵对测试数据点的光谱数据向量进行投影,得到测试数据点的光谱数据向量分别在各流形的投影矩阵下的低维嵌入特征;
9)利用测试数据点在各流形的投影矩阵下的低维嵌入特征,分别计算测试数据点与每个流形中各样本数据点之间的低维嵌入特征最小距离,得到测试数据点相对于各流形的低维嵌入特征最小距离值;然后,以各个低维嵌入特征最小距离值中的最小值所对应的流形的地物类别作为测试数据点所属的地物类别;由此,分别确定高光谱遥感影像中各个测试数据点所属的类别,得到高光谱遥感影像中的地物类别的分类结果。
2.根据权利要求1所述稀疏自适应半监督多流形学习的高光谱影像分类方法,其特征在于,所述步骤2)具体为:根据不同光谱波段对地物的光谱反射特性,将M行N列像素尺寸的高光谱遥感影像转换为Q行B列的光谱数据矩阵XQ
XQ={x1,x2,…,xq,…,xQ}T
其中,Q表示高光谱遥感影像的数据点空间尺寸,且Q=M×N,B表示高光谱遥感影像的光谱波段数;光谱数据矩阵XQ中的每一行表示高光谱遥感影像中的一个数据点在各个光谱波段上的光谱数据值,每一列表示高光谱遥感影像中各个数据点在一个光谱波段的光谱数据值;xq表示高光谱遥感影像中第q个数据点在各个光谱波段上的光谱数据值所构成的光谱数据向量,q∈{1,2,…,Q};T为矩阵转置符号。
3.根据权利要求1所述稀疏自适应半监督多流形学习的高光谱影像分类方法,其特征在于,所述步骤3)得到的样本数据矩阵具体为:
X={(x1,l1),(x2,l2),…,(xi,li),…,(xu,lu),xu+1,xu+2,…,xn}T
其中,X表示样本数据矩阵,xi表示从高光谱遥感影像中选取的一个样本数据点的光谱数据向量,li表示对光谱数据向量xi标注的样本类别标签,i∈{1,2,…,n},n表示从高光谱遥感影像中选取作为样本数据点的数量,样本数据矩阵X中前u个样本数据点的光谱数据向量根据先验知识标注有样本类别标签,其余的n-u个样本数据点的光谱数据向量无样本类别标签。
4.根据权利要求1所述稀疏自适应半监督多流形学习的高光谱影像分类方法,其特征在于,所述步骤4)具体为:
41)对样本数据矩阵X中任一个样本数据点的光谱数据向量xi,i∈{1,2,…,n},n表示从高光谱遥感影像中选取作为样本数据点的数量,利用样本数据矩阵X中的其它各个光谱数据向量建立xi的仿射空间表示方程:
<mrow> <mtable> <mtr> <mtd> <mrow> <mo>|</mo> <mo>|</mo> <mo>&amp;lsqb;</mo> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mn>1</mn> </msub> <mo>-</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>,</mo> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mn>2</mn> </msub> <mo>-</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>-</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>n</mi> </msub> <mo>-</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>&amp;rsqb;</mo> <msub> <mi>c</mi> <mi>i</mi> </msub> <mo>|</mo> <mo>|</mo> <mo>&amp;le;</mo> <mi>&amp;epsiv;</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mtable> <mtr> <mtd> <mrow> <mi>s</mi> <mo>.</mo> <mi>t</mi> <mo>.</mo> </mrow> </mtd> <mtd> <mrow> <msup> <mn>1</mn> <mi>T</mi> </msup> <msub> <mi>c</mi> <mi>i</mi> </msub> <mo>=</mo> <mn>1</mn> </mrow> </mtd> </mtr> </mtable> </mtd> </mtr> </mtable> <mo>;</mo> </mrow>
其中,ε为松弛变量值,且0<ε<10;||·||为l2范数运算符,ci表示样本数据矩阵X中第i个样本数据点的光谱数据向量xi的仿射空间表示向量,即:
ci=[ci,1,ci,2,…,ci,j,…,ci,n]T
ci,j表示xi的仿射空间方程中对应于光谱数据向量xj的表示系数,j∈{1,2,…,n}且j≠i;
42)根据稀疏表示优化模型min||Qici||1和约束条件||Xici||≤ε,1Tci=1对xi的仿射空间表示方程进行求解,得到xi的同时满足稀疏优化模型和约束条件的仿射空间表示向量ci的最优解;其中,为xi对应的正则化向量;诱导矩阵表示了数据点间相距远近的权值;diag(·)表示对角矩阵;||·||1为l1范数运算符;||·||为l2范数运算符;
43)重复步骤41)~42),求得样本数据矩阵X中的每一个样本数据点的光谱数据向量xi的仿射空间表示向量ci,构成样本数据矩阵对应的仿射空间表示矩阵C:
C={c1,c2,…,ci,…,cn}。
5.根据权利要求1所述稀疏自适应半监督多流形学习的高光谱影像分类方法,其特征在于,所述步骤5)具体为:
51)对于样本数据矩阵X中任一个标注有样本类别标签的样本数据点的光谱数据向量xi,考虑其k个近邻样本数据点之中的每一个近邻样本数据点的光谱数据向量xj∈X,j≠i;若光谱数据向量xj标注有样本类别标签且与光谱数据向量xi的样本类别标签相同,则用一条连线连接xi和xj所对应的两个样本数据点;若光谱数据向量xj无样本类别标签,但光谱数据向量xi的仿射空间表示向量ci中对应于光谱数据向量xj的表示系数ci,j≠0,则也用一条连线连接xi和xj所对应的两个样本数据点;否则,不连接xi和xj所对应的两个样本数据点;
52)按步骤51)所述方式遍历样本数据矩阵X中每一个标注有样本类别标签的样本数据点,由各个样本数据点之间的连线关系构成多流形稀疏相似图Gs;在多流形稀疏相似图Gs中,同一连线上的各个样本数据点属于同一流形,不同连线上的样本数据点分属于不同流形,从而在多流形稀疏相似图Gs中通过连线表示了不同流形结构的划分关系。
6.根据权利要求1所述稀疏自适应半监督多流形学习的高光谱影像分类方法,其特征在于,所述步骤6)具体为:
61)针对于多流形稀疏相似图Gs中,任一个样本数据点的光谱数据向量xi与另一个样本数据点的光谱数据向量xj的相似权重值ws,ij按下式进行计算:
其中,i,j∈{1,2,…,n}且j≠i,n表示从高光谱遥感影像中选取作为样本数据点的数量;β为平衡参数,且β>1;ci,j表示仿射空间表示矩阵中光谱数据向量xi对应于光谱数据向量xi的表示系数,di,j表示光谱数据向量xi与xj之间的欧式距离;t[ci]和t[di]分别表示光谱数据向量xi对应的表示系数贡献值和欧氏距离贡献值,且有:
<mrow> <mi>t</mi> <mo>&amp;lsqb;</mo> <msub> <mi>c</mi> <mi>i</mi> </msub> <mo>&amp;rsqb;</mo> <mo>=</mo> <mfrac> <mn>1</mn> <msub> <mi>P</mi> <mrow> <mi>i</mi> <mo>,</mo> <msub> <mi>c</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>&amp;NotEqual;</mo> <mn>0</mn> </mrow> </msub> </mfrac> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>c</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mi>t</mi> <mo>&amp;lsqb;</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>&amp;rsqb;</mo> <mo>=</mo> <mfrac> <mn>1</mn> <msub> <mi>P</mi> <mrow> <mi>i</mi> <mo>,</mo> <msub> <mi>c</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>&amp;NotEqual;</mo> <mn>0</mn> </mrow> </msub> </mfrac> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>d</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <msub> <mo>|</mo> <mrow> <msub> <mi>c</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>&amp;NotEqual;</mo> <mn>0</mn> </mrow> </msub> <mo>;</mo> <mi>j</mi> <mo>&amp;NotEqual;</mo> <mi>i</mi> <mo>;</mo> </mrow>
其中,表示仿射空间表示矩阵中光谱数据向量xi的仿射空间表示向量ci包含的非零表示系数的个数;表示取非零的表示系数ci,j所对应的光谱数据向量xi与xj之间的欧式距离di,j进行求和;
62)按上述方式分别计算得到光谱数据向量xi与其它各个光谱数据向量之间的相似权重值,得到光谱数据向量xi对应的相似权重向量Ws,i
Ws,i={ws,i1,ws,i2,…,ws,ij,…,ws,in},j≠i;
63)重复步骤61)~62),求得样本数据矩阵X中的每一个样本数据点的光谱数据向量对应的相似权重向量,由所有权重向量构成的多流形相似权重矩阵Ws
Ws={Ws,1,Ws,2,…,Ws,n}T
64)针对于多流形稀疏相似图Gs中的第l个流形Ml,由流形Ml中各样本数据点的光谱数据向量对应的相似权重向量排列构成流形Ml的半监督相似权重矩阵Ws[l]:
<mrow> <msub> <mi>W</mi> <mi>s</mi> </msub> <mo>&amp;lsqb;</mo> <mi>l</mi> <mo>&amp;rsqb;</mo> <mo>=</mo> <msup> <mrow> <mo>{</mo> <msub> <mi>W</mi> <mrow> <mi>s</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>&amp;lsqb;</mo> <mi>l</mi> <mo>&amp;rsqb;</mo> <mo>,</mo> <msub> <mi>W</mi> <mrow> <mi>s</mi> <mo>,</mo> <mn>2</mn> </mrow> </msub> <mo>&amp;lsqb;</mo> <mi>l</mi> <mo>&amp;rsqb;</mo> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>W</mi> <mrow> <mi>s</mi> <mo>,</mo> <mi>a</mi> </mrow> </msub> <mo>&amp;lsqb;</mo> <mi>l</mi> <mo>&amp;rsqb;</mo> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>W</mi> <mrow> <mi>s</mi> <mo>,</mo> <msub> <mi>P</mi> <mi>l</mi> </msub> </mrow> </msub> <mo>&amp;lsqb;</mo> <mi>l</mi> <mo>&amp;rsqb;</mo> <mo>}</mo> </mrow> <mi>T</mi> </msup> <mo>;</mo> </mrow>
其中,Ws,a[l]表示流形Ml中第a个样本数据点对应的相似权重向量,Pl表示流形Ml中包含的样本数据点的个数,l∈{1,2,…,L},L表示稀疏相似图中包含的流形个数;
65)由各个流形的半监督相似权重矩阵构成多流形稀疏相似图的半监督相似权重对角矩阵WsD
7.根据权利要求1所述稀疏自适应半监督多流形学习的高光谱影像分类方法,其特征在于,所述步骤7)具体为:
71)构造多流形稀疏相似图中的第l个流形Ml的目标函数J(Vl)为:
<mrow> <mi>J</mi> <mrow> <mo>(</mo> <msub> <mi>V</mi> <mi>l</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <msub> <mi>V</mi> <mi>l</mi> </msub> </munder> <munder> <mo>&amp;Sigma;</mo> <mrow> <mi>a</mi> <mo>,</mo> <mi>b</mi> </mrow> </munder> <mo>|</mo> <mo>|</mo> <msubsup> <mi>V</mi> <mi>l</mi> <mi>T</mi> </msubsup> <msub> <mi>x</mi> <mrow> <mi>l</mi> <mo>,</mo> <mi>a</mi> </mrow> </msub> <mo>-</mo> <msubsup> <mi>V</mi> <mi>l</mi> <mi>T</mi> </msubsup> <msub> <mi>x</mi> <mrow> <mi>l</mi> <mo>,</mo> <mi>b</mi> </mrow> </msub> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <msub> <mi>w</mi> <mrow> <mi>s</mi> <mo>,</mo> <mi>a</mi> <mi>b</mi> </mrow> </msub> <mo>&amp;lsqb;</mo> <mi>l</mi> <mo>&amp;rsqb;</mo> <mo>;</mo> </mrow>
其中,Vl表示流形Ml上的投影矩阵;ws,ab[l]表示流形Ml中一个样本数据点的光谱数据向量xl,a与另一个样本数据点的光谱数据向量xl,b之间的相似权重值,xl,a,xl,b∈Ml,且b≠a;||·||为l2范数运算符;
72)在的约束条件下,根据目标函数J(Vl)得到流形Ml上的投影特征方程:
<mrow> <msub> <mi>X</mi> <mi>l</mi> </msub> <msub> <mi>L</mi> <mi>s</mi> </msub> <mo>&amp;lsqb;</mo> <mi>l</mi> <mo>&amp;rsqb;</mo> <msubsup> <mi>X</mi> <mi>l</mi> <mi>T</mi> </msubsup> <msub> <mi>V</mi> <mi>l</mi> </msub> <mo>=</mo> <msub> <mi>&amp;lambda;</mi> <mi>l</mi> </msub> <msub> <mi>X</mi> <mi>l</mi> </msub> <msub> <mi>D</mi> <mi>s</mi> </msub> <mo>&amp;lsqb;</mo> <mi>l</mi> <mo>&amp;rsqb;</mo> <msubsup> <mi>X</mi> <mi>l</mi> <mi>T</mi> </msubsup> <msub> <mi>V</mi> <mi>l</mi> </msub> <mo>;</mo> </mrow>
其中,Xl表示由流形Ml对应的样本数据矩阵,由流形Ml中各个样本数据点的光谱数据向量构成;I为单位矩阵;Ds[l]为Pl×Pl的对角矩阵,其对角元素Pl表示流形Ml中包含的样本数据点的个数;拉普拉斯矩阵Ls[l]=Ds[l]-Ws[l];λl为流形Ml的目标函数J(Vl)对应的拉格朗日常数;
73)对流形Ml上的投影特征方程进行广义特征值求解,得到其前d个最小特征值对应的d个特征向量vl,1,vl,2,…,vl,d,从而确定流形Ml上的投影矩阵Vl={vl,1,vl,2,…,vl,d};d<B,B表示高光谱遥感影像的光谱波段数;
74)对于流形Ml中任一个样本数据点的光谱数据向量xl,a,其通过投影矩阵Vl投影到低维嵌入空间的低维嵌入特征yl,a为:
yl,a=Vlxl,a
75)按照步骤71)~74)的流程,计算得到稀疏相似图中各流形的投影矩阵,进而得到每个流形中各个样本数据点相对于其投影矩阵所投影的低维嵌入特征。
8.根据权利要求1所述稀疏自适应半监督多流形学习的高光谱影像分类方法,其特征在于,所述步骤8)中,测试数据点在任一流形Ml的投影矩阵下的低维嵌入特征yl,new为:
yl,new=Vlxnew
xnew表示测试数据点的光谱数据向量,Vl表示流形Ml上的投影矩阵,l∈{1,2,…,L},L表示稀疏相似图中包含的流形个数。
9.根据权利要求1所述稀疏自适应半监督多流形学习的高光谱影像分类方法,其特征在于,所述步骤9)具体为:
91)利用测试数据点在各流形的投影矩阵下的低维嵌入特征,分别计算测试数据点相对于各流形的低维嵌入特征最小距离值;其中,测试数据点相对于稀疏相似图中流形Ml的的低维嵌入特征最小距离值dl,new为:
<mrow> <msub> <mi>d</mi> <mrow> <mi>l</mi> <mo>,</mo> <mi>n</mi> <mi>e</mi> <mi>w</mi> </mrow> </msub> <mo>=</mo> <munderover> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <mrow> <mi>a</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>P</mi> <mi>l</mi> </msub> </munderover> <mo>|</mo> <mo>|</mo> <msub> <mi>y</mi> <mrow> <mi>l</mi> <mo>,</mo> <mi>n</mi> <mi>e</mi> <mi>w</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>y</mi> <mrow> <mi>l</mi> <mo>,</mo> <mi>a</mi> </mrow> </msub> <mo>|</mo> <mo>|</mo> <mo>;</mo> </mrow>
其中,yl,new表示测试数据点在流形Ml的投影矩阵下的低维嵌入特征;yl,a表示流形Ml中第a个样本数据点通过流形Ml的投影矩阵投影到低维嵌入空间的低维嵌入特征,a∈{1,2,…,Pl},Pl表示流形Ml中包含的样本数据点的个数;||·||为l2范数运算符;
92)比较测试数据点相对于各流形的低维嵌入特征最小距离值的大小,找到其中最小值所对应的流形,根据该流形中标注有样本类别标签的样本数据点确定该流形的地物类别,作为测试数据点所属的地物类别;
93)按照步骤91)~92)的流程,分别确定高光谱遥感影像中各个测试数据点所属的类别,得到高光谱遥感影像中的地物类别的分类结果。
CN201510197492.2A 2015-04-23 2015-04-23 一种稀疏自适应半监督多流形学习的高光谱影像分类方法 Expired - Fee Related CN104751191B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510197492.2A CN104751191B (zh) 2015-04-23 2015-04-23 一种稀疏自适应半监督多流形学习的高光谱影像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510197492.2A CN104751191B (zh) 2015-04-23 2015-04-23 一种稀疏自适应半监督多流形学习的高光谱影像分类方法

Publications (2)

Publication Number Publication Date
CN104751191A CN104751191A (zh) 2015-07-01
CN104751191B true CN104751191B (zh) 2017-11-03

Family

ID=53590844

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510197492.2A Expired - Fee Related CN104751191B (zh) 2015-04-23 2015-04-23 一种稀疏自适应半监督多流形学习的高光谱影像分类方法

Country Status (1)

Country Link
CN (1) CN104751191B (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104992166B (zh) * 2015-07-28 2018-09-11 苏州大学 一种基于鲁棒度量的手写体识别方法与系统
CN105069482B (zh) * 2015-08-21 2018-06-15 中国地质大学(武汉) 基于空间正则化流形学习算法的高光谱遥感图像分类方法
CN107067410B (zh) * 2016-05-27 2020-06-26 北京理工大学 一种基于增广样本的流形正则化相关滤波目标跟踪方法
CN106096663B (zh) * 2016-06-24 2019-03-26 长春工程学院 一种基于稀疏异构分组的高光谱遥感影像的分类器构建方法
CN106202916A (zh) * 2016-07-04 2016-12-07 扬州大学 建立一种阿尔茨海默病的分层多流形分析模型
CN106503754B (zh) * 2016-11-16 2019-06-11 哈尔滨工业大学 基于空谱特征保持全局几何结构的多时相高光谱图像分类方法
CN106650811B (zh) * 2016-12-26 2019-08-13 大连海事大学 一种基于近邻协同增强的高光谱混合像元分类方法
CN107527064A (zh) * 2017-07-24 2017-12-29 广东石油化工学院 一种流形学习在故障诊断数据提取中的应用
CN107563445A (zh) * 2017-09-06 2018-01-09 苏州大学 一种基于半监督学习的提取图像特征的方法与装置
CN107729926B (zh) * 2017-09-28 2021-07-13 西北大学 一种基于高维空间变换的数据扩增方法、机器识别系统
CN108229552B (zh) * 2017-12-29 2021-07-09 咪咕文化科技有限公司 一种模型处理方法、装置及存储介质
CN108460326B (zh) * 2018-01-10 2020-05-19 华中科技大学 一种基于稀疏表达图的高光谱图像半监督分类方法
CN109186973B (zh) * 2018-08-20 2020-03-31 东南大学 一种无监督深度学习网络的机械故障诊断方法
CN109800780B (zh) * 2018-12-05 2021-04-27 天津大学 基于非监督流形对齐的域自适应遥感图像分类算法
CN109934270B (zh) * 2019-02-25 2023-04-25 华东师范大学 一种基于局部流形判别分析投影网络的分类方法
CN110689064B (zh) * 2019-09-23 2023-06-09 云南电网有限责任公司电力科学研究院 一种图像半监督分类方法、装置及计算机可读存储介质
CN111079657B (zh) * 2019-12-18 2022-06-10 南京审计大学 一种基于半监督线性回归的人脸识别方法
CN112001222B (zh) * 2020-07-01 2023-11-24 安徽新知数字科技有限公司 一种基于半监督学习的学生表情预测方法
CN112257862B (zh) * 2020-09-30 2023-12-05 重庆大学 一种基于关系网络标记样本扩充的半监督辨识方法
CN112329654B (zh) * 2020-11-10 2021-05-28 中国地震局地震预测研究所 基于多流形学习算法的高光谱影像数据分类方法及系统
CN112926658B (zh) * 2021-02-26 2023-03-21 西安交通大学 基于二维数据嵌入与邻接拓扑图的图像聚类方法及设备
CN113920345B (zh) * 2021-09-09 2024-04-02 中国地质大学(武汉) 一种基于聚类多重流形测度学习的高光谱影像降维方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129571A (zh) * 2011-01-31 2011-07-20 重庆大学 基于半监督流形学习的多光谱遥感数据土地利用分类方法
CN103593676A (zh) * 2013-11-29 2014-02-19 重庆大学 基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7756342B2 (en) * 2004-09-20 2010-07-13 The United States Of America As Represented By The Secretary Of The Navy Method for image data processing

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129571A (zh) * 2011-01-31 2011-07-20 重庆大学 基于半监督流形学习的多光谱遥感数据土地利用分类方法
CN103593676A (zh) * 2013-11-29 2014-02-19 重庆大学 基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Sparse Manifold Clustering and Embedding;Ehsan Elhamifar等;《Advances in Neural Information Processing Systems 24(NIPS 2011)》;20111231;第1-9页 *

Also Published As

Publication number Publication date
CN104751191A (zh) 2015-07-01

Similar Documents

Publication Publication Date Title
CN104751191B (zh) 一种稀疏自适应半监督多流形学习的高光谱影像分类方法
CN110717354B (zh) 基于半监督k-svd与多尺度稀疏表示的超像元分类方法
CN106023065B (zh) 一种基于深度卷积神经网络的张量型高光谱图像光谱-空间降维方法
CN104408478B (zh) 一种基于分层稀疏判别特征学习的高光谱图像分类方法
CN103886342B (zh) 基于光谱和邻域信息字典学习的高光谱图像分类方法
CN105760900B (zh) 基于近邻传播聚类和稀疏多核学习的高光谱图像分类方法
CN104484681B (zh) 基于空间信息和集成学习的高光谱遥感影像分类方法
CN109766858A (zh) 结合双边滤波的三维卷积神经网络高光谱影像分类方法
CN110348399B (zh) 基于原型学习机制和多维残差网络的高光谱智能分类方法
CN109145992A (zh) 协作生成对抗网络和空谱联合的高光谱图像分类方法
CN107451545B (zh) 基于软标签下多通道判别非负矩阵分解的人脸识别方法
CN108460391B (zh) 基于生成对抗网络的高光谱图像无监督特征提取方法
CN111090764B (zh) 基于多任务学习和图卷积神经网络的影像分类方法及装置
CN106778885A (zh) 基于局部流形嵌入的高光谱图像分类方法
CN108256486B (zh) 一种基于非负低秩和半监督学习的图像识别方法及装置
CN104182767B (zh) 主动学习和邻域信息相结合的高光谱图像分类方法
CN104866871B (zh) 基于投影结构稀疏编码的高光谱图像分类方法
CN107844751A (zh) 引导滤波长短记忆神经网络高光谱遥感图像的分类方法
CN104820841B (zh) 基于低阶互信息和光谱上下文波段选择的高光谱分类方法
CN107145836A (zh) 基于栈式边界辨别自编码器的高光谱图像分类方法
CN106203483A (zh) 一种基于语义相关多模态映射方法的零样本图像分类方法
CN113344045B (zh) 一种结合hog特征提高sar船只分类精度的方法
CN105913092A (zh) 基于子空间学习的图正则高光谱图像波段选择方法
CN110147725A (zh) 一种基于正交指数局保投影的高光谱图像特征提取方法
CN111680579B (zh) 一种自适应权重多视角度量学习的遥感图像分类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171103

Termination date: 20190423

CF01 Termination of patent right due to non-payment of annual fee