CN104408466A - 基于局部流形学习构图的高光谱遥感图像半监督分类方法 - Google Patents

基于局部流形学习构图的高光谱遥感图像半监督分类方法 Download PDF

Info

Publication number
CN104408466A
CN104408466A CN201410651950.0A CN201410651950A CN104408466A CN 104408466 A CN104408466 A CN 104408466A CN 201410651950 A CN201410651950 A CN 201410651950A CN 104408466 A CN104408466 A CN 104408466A
Authority
CN
China
Prior art keywords
data
remote sensing
point
local
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410651950.0A
Other languages
English (en)
Other versions
CN104408466B (zh
Inventor
马丽
杨孝全
张晓锋
吴让仲
罗大鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences
Original Assignee
China University of Geosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences filed Critical China University of Geosciences
Priority to CN201410651950.0A priority Critical patent/CN104408466B/zh
Publication of CN104408466A publication Critical patent/CN104408466A/zh
Application granted granted Critical
Publication of CN104408466B publication Critical patent/CN104408466B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于局部流形学习构图的高光谱遥感图像半监督分类方法,实现步骤为:(1)准备训练样本集,包括少量的带标记数据和大量的无标记数据;(2)基于光谱角制图这种距离度量方法,对训练样本集中的每个样本点选择k个最近邻点;利用局部流形学习算法,得到图结构中各连接点之间的权值,计算图邻接矩阵,得到对应的图结构;基于图邻接矩阵,基于GFHF算法对无标记数据进行分类;(3)利用GFHF的泛化算法对图像中其他数据点进行分类。本发明将局部流形学习降维算法和半监督分类算法这两种应用广泛的算法通过“图”联系起来,对多种高光谱遥感数据分类都表现出较好的适用性,能够明显提高高光谱遥感图像的分类精度。

Description

基于局部流形学习构图的高光谱遥感图像半监督分类方法
技术领域
本发明属于遥感图像处理技术领域,具体涉及一种基于局部流形学习构图的半监督分类方法,用于高光谱遥感图像分类。
背景技术
利用遥感图像进行地物分类是根据获取的遥感信息对地物的物理属性进行识别,分类结果可以清晰反映地物的空间分布,以进行专题地图的制作,并便于人们从中认识和发现规律,辅助决策。地物分类在农业监测,土壤调查,矿物填图,以及城市环境监测等方面都有重要的应用。
高光谱遥感是具有高的光谱分辨率的遥感科学和技术,它具有“图谱合一”特性,将代表地物性质的光谱和确定地物空间的图像结合在一起,能够获取地球表面丰富的光谱和空间信息,使得在传统多光谱遥感中不可识别的地物,在高光谱遥感中能够被识别。因此,高光谱遥感可以获取地物丰富的细节信息,鉴别地物间微小的差别,凭借其对地物属性的准确描述成功应用于地物的精细分类。
利用高光谱遥感图像进行地物分类面临的一个主要问题是分类方法通常需要足够数量的标记数据,但是对高光谱图像获取类别标记数据,是一项耗时耗力,成本高昂的工作,所以研究标记样本数量少情况下的半监督分类算法具有重要意义。基于图的半监督分类算法综合利用少量带标记数据和大量无标记数据进行分类,能够明显提高标记数据少情况下的分类效果。该算法假设分类函数在数据流形上是平滑的,其中数据流形由图表示。图结构中数据点之间连接权值(简称“图权值”)的设置是算法的关键,具有高的连接权值的点更有可能属于同种地物类别。对于图权值设置这一关键问题,目前还没有被充分和深入研究。
在高光谱遥感图像分类中,目前主要使用热核函数(Heat Kernel,HK)计算图权值,但是这种权值只能反映两点之间的关系,没有充分利用数据点所在邻域的局部结构信息。在机器学习领域,2008年,有学者提出基于非负局部线性重构(Local LinerReconstruction,LLR)的图权值计算方法(F.Wang and C.Zhang,"Label propagationthrough linear neighborhoods,"IEEE Transactions on Knowledge and Data Engineering,vol.20,no.1,pp.55-67,Jan.2008.),考虑了数据局部结构信息,但是对权值进行非负约束,可能使得位于流形边界上的点的重构效果不好。2009年,Yan提出基于稀疏表达(SparseRepresentation,SR)的图权值计算方法,但是由于需要全局求解重构权值,所以计算量大(S.Yan and H.Wang,"Semi-supervised learning by sparse representation,"in Proceedingsof SIAM International Conference on Data Mining,Nevada,USA,Apr.2009,pp.792-801.)。
发明内容
为了解决现有技术的不足,本发明提供了一种基于局部流形学习构图的高光谱遥感图像半监督分类方法,能够表示数据之间的非线性关系,其对应的图结构能够很好地描述数据流形结构。同时,特别是在标记样本非常少的情况下,有效利用无标记数据来提高分类精度。
本发明为解决其技术问题所采用的技术方案是:提供了一种基于局部流形学习构图的高光谱遥感图像半监督分类方法,具体包括以下步骤:
(1)选取训练数据集X以及测试数据集Xt,所述训练数据集X包括标记数据集Xm和无标记数据集Xu
其中Xm是高光谱遥感图像中的m个标记数据点的集合,Xm的标记信息Ym用大小为C×m的矩阵表示,C为地物类型的类别数量,Ym中第i行第j列元素的值Yij用来指示第j个标记数据点,如果第j个标记数据点属于第i类,那么Yij=1,否则Yij=0;
Xu是高光谱遥感图像中随机选择的部分无标记数据点的集合,数量为u,u>>m;
所述测试数据集Xt为高光谱遥感图像中Xu以外的其它无标记数据点的集合;
(2)计算无标记数据集Xu的分类结果Fu
对于训练数据集X中每一个数据点xa,xa∈X,基于光谱角制图距离度量方法搜索xa的k个光谱特征最相似的近邻点;训练数据集X中有m+u个数据点,xa的邻域表示为N(xa),邻域中包含k个近邻点;
利用LLE或LTSA局部流形学习算法,分别计算xa与训练数据集X中的其他数据点xb的连接权值Wab,以得到图的邻接矩阵W;
采用GFHF算法,利用图的邻接矩阵W计算无标记数据集Xu的分类结果Fu
(3)计算测试数据集Xt的分类结果Ft
对于测试数据集Xt中的每一个数据点x0,x0∈Xt,基于光谱角制图距离度量方法在训练数据集X中选择其k个光谱特征最相似的近邻点,x0的邻域表示为N(x0),邻域中包含k个近邻点;
利用LLE或LTSA局部流形学习算法,分别计算x0与训练数据集X中的其他数据点xa的连接权值W0a
采用GFHF的泛化算法利用各连接权值计算测试数据集Xt的分类结果Ft
进一步的改进是,步骤(2)中,将局部流形学习算法图结构对应的图拉普拉斯矩阵L分成四部分 L mm L mu L um L uu , 其中L=I-W,I表示单位矩阵,则通过以下公式计算无标记数据集Xu的分类结果Fu
F u T = - L uu - 1 L um Y m T . . . ( 1 )
进一步的改进是,步骤(2)中,若xa和xb互为近邻点,或者xa和xb不互为近邻点,但xa或xb均是第三个数据点xr的近邻点,则xa和xb之间存在连接关系。若利用LLE局部流形学习算法,通过以下公式分别计算xa与xb的连接权值W(lle)ab
W ( lle ) ab = S ab + S ba - Σ r S ra S rb a ≠ b 0 a = 0 . . . ( 2 )
其中,xr的k个近邻点中包含xa和xb,Sab表示xa被其近邻点xb线性重构的系数,通过以下公式计算:
S ab = arg min | | x a - Σ x b ∈ N ( x a ) S ab x b | | 2 s . t . Σ x b ∈ N ( x a ) S ab = 1 . . . ( 3 )
其中N(xa)表示xa的邻域。
步骤(3)中,根据GFHF泛化算法,通过以下公式计算点x0的分类结果f0
f 0 = Σ x a ∈ X , x a ∈ N ( x 0 ) W ( lle ) oa f a . . . ( 4 )
其中fa表示x0的一个近邻点xa的GFHF分类结果,W(lle)0a表示xa和x0之间的权值,权值W(lle)0a利用LLE局部流形学习算法,通过以下公式计算:
W(lle)0a=S0a…(5)
其中S0a表示近邻点xa对测试点x0的线性重构系数,通过以下公式计算:
S 0 a = arg min | | x 0 - Σ x q ∈ N ( x 0 ) S 0 a x a | | 2 s . t . Σ x a ∈ N ( x 0 ) S 0 a = 1 . . . ( 6 )
其中N(x0)表示x0的邻域。
进一步的改进是,步骤(2)中,若xa和xb互为近邻点,或者xa和xb不互为近邻点,但xa或xb均是第三个数据点xr的近邻点,则xa和xb之间存在连接关系,利用LTSA局部流形学习算法,通过以下公式分别计算各个数据点xa的邻接矩阵W(ltsa)ab
W ( ltsa ) ab = Σ ( x a , x b ) ∈ N ( x r ) ( 1 k + 1 k - 1 θ ra T Λ r - 1 θ rb ) a ≠ b 0 a = b . . . ( 7 )
其中,N(xr)表示所有包含xa或xb的邻域,Λr是最大d个特征值所组成的对角矩阵,d表示特征值的数量,θra和θrb分别是xa和xb在N(xr)中的局部切空间坐标,通过以下方法求取:
首先统计N(xr)中k个数据点的协方差矩阵,然后对协方差矩阵进行特征分解,保留最大的d个特征值对应的特征向量,该特征向量即为k个数据点的局部切空间坐标。
步骤(3)中,根据GFHF泛化算法,通过以下公式计算点x0的分类结果f0
f 0 = Σ x a ∈ X , x a ∈ N ( x 0 ) W ( ltsa ) oa f a . . . ( 8 )
其中fa表示xa的GFHF分类结果,W(ltsa)0a表示xa和x0之间的权值,权值W(ltsa) 0a利用LTSA局部流形学习算法,通过以下公式计算:
W ( ltsa ) 0 a = 1 k + 1 k - 1 θ 0 T Λ 0 - 1 θ a . . . ( 9 )
其中,Λ0是N(x0)内k个数据点的协方差矩阵进行特征分解得到的最大d个特征值所组成的对角矩阵,θ0和θa分别表示在N(x0)中求取的x0和xa的局部切空间坐标,通过以下方法求取:
首先统计N(x0)中k个数据点的协方差矩阵,然后对协方差矩阵进行特征分解,保留最大的d个特征值对应的特征向量,该特征向量即为k个数据点的局部切空间坐标。
本发明基于其技术方案所具有的有益效果在于:
(1)本发明将局部流形学习降维算法和半监督分类算法这两种应用广泛的算法通过“图”联系起来,扩展了流形学习算法的应用,并进一步发展了基于图的半监督分类算法,为其引入了一类新的图构造方法;
(2)本方法使用了LLE或LTSA算法来计算图权值,两种算法对应的图拉普拉斯正则项使分类结果保持数据各邻域的局部几何结构,从而分类结果能够反应高维数据本质的非线性关系;
(3)本方法使用了LLE或LTSA算法来计算图权值,两种算法对应的图权值可能包含负值,负权值表达不相似性关系,如果具有不同标记的近邻具有负权值,那么可以降低这些错误近邻对分类的作用,有利于提高分类效果;
(4)本方法使用了LLE或LTSA算法来计算图权值,两种算法对应的图结构中,两点之间的边权,由包含这两个点的所有邻域决定,能够综合更多有用信息,得到更准确的数据相似性关系。
附图说明
图1是本发明基于局部流形学习构图的高光谱遥感图像半监督分类方法的流程图。
图2是Indian Pine高光谱遥感图像和其地面地物分布图,其中图2(1)是该场景第15个波段灰度图像,图2(2)是地面真实分布图,图2(3)类别图例。
图3是不同算法的分类精度比较,其中图3(1)是Indiana Pine数据第3和12类地物类型的分类精度,图3(2)是Indiana Pine数据第2、3、5、6、8、10、11、12和14类地物类型的分类精度。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
实施例1:
采用GFHF_LLE方法。
结合图1,本发明为解决其技术问题所采用的技术方案是:提供了一种基于局部流形学习构图的高光谱遥感图像半监督分类方法,具体包括以下步骤:
(1)选取训练数据集X以及测试数据集Xt,所述训练数据集X包括标记数据集Xm和无标记数据集Xu
其中Xm是高光谱遥感图像中的m个标记数据点的集合,Xm的标记信息Ym用大小为C×m的矩阵表示,C为地物类型的类别数量,Ym中第i行第j列元素的值Yij用来指示第j个标记数据点,如果第j个标记数据点属于第i类,那么Yij=1,否则Yij=0;
Xu是高光谱遥感图像中随机选择的部分无标记数据点的集合,数量为u,u>>m;
所述测试数据集Xt为高光谱遥感图像中Xu以外的其它无标记数据点的集合;
(2)计算无标记数据集Xu的分类结果Fu
对于训练数据集X中每一个数据点xa,xa∈X,基于光谱角制图距离度量方法搜索xa的k个光谱特征最相似的近邻点;训练数据集X中有m+u个数据点,xa的邻域表示为N(xa),邻域中包含k个近邻点;
利用LLE局部流形学习算法,分别计算xa与训练数据集X中的其他数据点xb的连接权值Wab,以得到图的邻接矩阵W,图邻接矩阵W即对应LLE构图的图结构;若xa和xb互为近邻点,或者xa和xb不互为近邻点,但xa或xb均是第三个数据点xr的近邻点,则xa和xb之间存在连接关系,利用LLE局部流形学习算法,通过以下公式分别计算xa与xb的连接权值W(lle)ab
W ( lle ) ab = S ab + S ba - Σ r S ra S rb a ≠ b 0 a = 0 . . . ( 2 )
其中,xr的k个近邻点中包含xa和xb,Sab表示xa被其近邻点xb线性重构的系数,通过以下公式计算:
S ab = arg min | | x a - Σ x b ∈ N ( x a ) S ab x b | | 2 s . t . Σ x b ∈ N ( x a ) S ab = 1 . . . ( 3 )
采用GFHF算法,利用图的邻接矩阵W计算无标记数据集Xu的分类结果Fu,将局部流形学习算法图结构对应的图拉普拉斯矩阵L分成四部分 L mm L mu L um L uu , 其中L=I-W,I表示单位矩阵,则通过以下公式计算无标记数据集Xu的分类结果Fu
F u T = - L uu - 1 L um Y m T . . . ( 1 )
Fu即为无标记数据集Xu的基于LLE构图的GFHF算法分类结果。
(3)计算测试数据集Xt的分类结果Ft
对于测试数据集Xt中的每一个数据点x0,x0∈Xt,基于光谱角制图距离度量方法在训练数据集X中选择其k个光谱特征最相似的近邻点,x0的邻域表示为N(x0),邻域中包含k个近邻点;
利用LLE局部流形学习算法,通过以下公式分别计算x0与训练数据集X中的其他数据点xa的连接权值W(lle)0a
W(lle)0a=S0a…(5)
其中S0a表示近邻点xa对测试点x0的线性重构系数,通过以下公式计算:
S 0 a = arg min | | x 0 - Σ x q ∈ N ( x 0 ) S 0 a x a | | 2 s . t . Σ x a ∈ N ( x 0 ) S 0 a = 1 . . . ( 6 )
采用GFHF的泛化算法利用各连接权值计算测试数据集Xt的分类结果Ft:测试数据集Xt中的数据点x0的分类结果f0通过以下公式计算:
f 0 = Σ x a ∈ X , x a ∈ N ( x 0 ) W ( lle ) oa f a . . . ( 4 )
其中fa表示x0的一个近邻点xa的基于LLE构图的GFHF分类结果。fa是矩阵Fu中的元素,由步骤(2)所得的矩阵Fu直接得出,W(lle)0a表示xa和x0之间的权值。
至此,对于高光谱遥感图像的每个像素点,都进行了分类。
实施例2:
采用GFHF_LTSA方法,具体包括以下步骤:
(1)选取训练数据集X以及测试数据集Xt,所述训练数据集X包括标记数据集Xm和无标记数据集Xu
其中Xm是高光谱遥感图像中的m个标记数据点的集合,Xm的标记信息Ym用大小为C×m的矩阵表示,C为地物类型的类别数量,Ym中第i行第j列元素的值Yij用来指示第j个标记数据点,如果第j个标记数据点属于第i类,那么Yij=1,否则Yij=0;
Xu是高光谱遥感图像中随机选择的部分无标记数据点的集合,数量为u,u>>m;
所述测试数据集Xt为高光谱遥感图像中Xu以外的其它无标记数据点的集合;
(2)计算无标记数据集Xu的分类结果Fu
对于训练数据集X中每一个数据点xa,xa∈X,基于光谱角制图距离度量方法搜索xa的k个光谱特征最相似的近邻点;训练数据集X中有m+u个数据点,xa的邻域表示为N(xa),邻域中包含k个近邻点;
利用LTSA局部流形学习算法,分别计算xa与训练数据集X中的其他数据点xb的连接权值Wab,以得到图的邻接矩阵W,图邻接矩阵W即对应LTSA构图的图结构;若xa和xb互为近邻点,或者xa和xb不互为近邻点,但xa或xb均是第三个数据点xr的近邻点,则xa和xb之间存在连接关系,利用LTSA局部流形学习算法,通过以下公式分别计算各个数据点xa的邻接矩阵W(ltsa)ab
W ( ltsa ) ab = Σ ( x a , x b ) ∈ N ( x r ) ( 1 k + 1 k - 1 θ ra T Λ r - 1 θ rb ) a ≠ b 0 a = b . . . ( 7 )
其中,N(xr)表示所有包含xa或xb的邻域,Λr是最大d个特征值所组成的对角矩阵,d表示特征值的数量,θra和θrb分别是xa和xb在N(xr)中的局部切空间坐标,通过以下方法求取:
首先统计N(xr)中k个数据点的协方差矩阵,然后对协方差矩阵进行特征分解,保留最大的d个特征值对应的特征向量,该特征向量即为k个数据点的局部切空间坐标。
采用GFHF算法,利用图的邻接矩阵W计算无标记数据集Xu的分类结果Fu,将局部流形学习算法图结构对应的图拉普拉斯矩阵L分成四部分 L mm L mu L um L uu , 其中L=I-W,I表示单位矩阵,则通过以下公式计算无标记数据集Xu的分类结果Fu
F u T = - L uu - 1 L um Y m T . . . ( 1 )
Fu即为对数据Xu的基于LTSA构图的GFHF算法分类结果。
(3)计算测试数据集Xt的分类结果Ft
对于测试数据集Xt中的每一个数据点x0,x0∈Xt,基于光谱角制图距离度量方法在训练数据集X中选择其k个光谱特征最相似的近邻点,x0的邻域表示为N(x0),邻域中包含k个近邻点;
利用LTSA局部流形学习算法,通过以下公式分别计算x0与训练数据集X中的其他数据点xa的连接权值W(ltsa)0a
W ( ltsa ) 0 a = 1 k + 1 k - 1 θ 0 T Λ 0 - 1 θ a . . . ( 9 )
其中,Λ0是N(x0)内k个数据点的协方差矩阵进行特征分解得到的最大d个特征值所组成的对角矩阵,θ0和θa分别表示在N(x0)中求取的x0和xa的局部切空间坐标,通过以下方法求取:
首先统计N(x0)中k个数据点的协方差矩阵,然后对协方差矩阵进行特征分解,保留最大的d个特征值对应的特征向量,该特征向量即为k个数据点的局部切空间坐标。
采用GFHF的泛化算法利用各连接权值计算测试数据集Xt的分类结果Ft:测试数据集Xt中的数据点x0的分类结果f0通过以下公式计算:
f 0 = Σ x a ∈ X , x a ∈ N ( x 0 ) W ( ltsa ) oa f a . . . ( 8 )
其中fa表示xa的基于LTSA构图的GFHF分类结果。fa是矩阵Fu中的元素,由步骤(2)所得的矩阵Fu直接得出,W(ltsa)0a表示xa和x0之间的权值。
至此,对于高光谱遥感图像的每个像素点,都进行了分类。
为证明以上方法的有效性,采用实际高光谱遥感数据为例进行说明。
Indiana Pine数据为1992年于美国印地安那州一个农场拍摄的高光谱遥感影像,其空间分辨率是20×20m2,波谱范围为400nm~2500nm,光谱分辨率为10nm,去除噪声波段和水汽吸收波段,剩余200波段。农田区域的作物类别主要包括玉米,大豆,小麦等,根据耕种情况和土壤湿度的不同,可以细分为多种类别。图2(1)给出该数据第15个波段的灰度图像,图像大小为145×145,该地区具有16种地物类型,我们选择其中具有较多标记数据的9类地物进行分类实验,分别为:
第2类:“2玉米-未收割”;
第3类:“3玉米-少量收割”;
第5类:“5-草/牧场”;
第6类:“6草/树”;
第8类:“8干草”;
第10类:“10大豆-未收割”;
第11类:“11大豆-少量收割”;
第12类:“12大豆-收割完毕”;
第14类:“14树林”。
图2(2)和图2(3)为这9种地物的地面分布和图例。根据该数据提供者Purdue大学Landgrebe教授的报告,我们还选择最难区分的两类——第3类和第12类进行单独实验。
实验比较五种分类方法,包括三种常用的分类方法——GFHF_HK、GFHF_LLR和及GFHF_SR,以及本发明提出的基于局部流形学习的构图方法,包括实施例1的GFHF_LLE方法和实施例2的GFHF_LTSA方法。另外给出两种有监督分类算法的分类结果——k近邻分类(k Nearest Neighbor,KNN)和支持向量机(Support Vector Machine,SVM)分类。
对于每种分类方法进行6次实验。每次实验时,在地面真实分布数据中,对各地物随机选择不同的标记数据点个数,6次实验分别选取5、10、20、30、40和50,随机选择剩余数据点的70%作为无标记数据点。各分类方法的算法中的参数采用Leave-One-Out方法进行优化选择,每次实验均进行20次计算,取平均值作为实验结果进行评价。
Indiana Pine图像的第3类和第12类地物类型的总体分类精度如图3(1)所示,第2、3、5、6、8、10、11、12和14类地物类型的总体分类精度如图3(2)所示。其中x轴表示每类地物类型的标记样本数量,y轴表示总体分类精度。从结果可以看出,GFHF_LLE和GFHF_LTSA构图方法得到的分类精度明显高于常用的三种构图方法,表明这两种流形学习算法能够更好的表示数据之间的非线性关系,其对应的图结构能够更好的描述数据流形结构。另外,大多数半监督分类算法的分类精度优于两种有监督分类算法,特别是在标记样本非常少的情况下,表明半监督分类算法有效利用了无标记数据来提高分类效果。
本发明给出基于局部流形学习构图的半监督分类方法,方法中具体采用了两种经典的局部流形学习算法(LLE,LTSA),用于一种半监督分类算法(GFHF)中。但是构图方法并不限于LLE和LTSA,任何能够在图嵌入框架下进行描述的流形学习算法,都对应图结构,可以用于基于图的半监督分类算法中;算法也不限于GFHF一种半监督分类算法,基于局部流形学习算法的图结构也适用于其他基于图的半监督分类算法中(例如局部与全局一致算法,拉普拉斯支持向量机算法等)。另外,实验只是给出了一种高光谱遥感数据,该算法同样可以适用于其他高光谱遥感图像,例如高空间分辨率遥感图像等。

Claims (6)

1.一种基于局部流形学习构图的高光谱遥感图像半监督分类方法,其特征在于具体包括以下步骤:
(1)选取训练数据集X以及测试数据集Xt,所述训练数据集X包括标记数据集Xm和无标记数据集Xu
其中Xm是高光谱遥感图像中的m个标记数据点的集合,Xm的标记信息Ym用大小为C×m的矩阵表示,C为地物类型的类别数量,Ym中第i行第j列元素的值Yij用来指示第j个标记数据点,如果第j个标记数据点属于第i类,那么Yij=1,否则Yij=0;
Xu是高光谱遥感图像中随机选择的部分无标记数据点的集合,数量为u,u>>m;
所述测试数据集Xt为高光谱遥感图像中Xu以外的其它无标记数据点的集合;
(2)计算无标记数据集Xu的分类结果Fu
对于训练数据集X中每一个数据点xa,xa∈X,基于光谱角制图距离度量方法搜索xa的k个光谱特征最相似的近邻点;训练数据集X中有m+u个数据点,xa的邻域表示为N(xa),邻域中包含k个近邻点;
利用LLE或LTSA局部流形学习算法,分别计算xa与训练数据集X中的其他数据点xb的连接权值Wab,以得到图的邻接矩阵W;
采用GFHF算法,利用图的邻接矩阵W计算无标记数据集Xu的分类结果Fu
(3)计算测试数据集Xt的分类结果Ft
对于测试数据集Xt中的每一个数据点x0,x0∈Xt,基于光谱角制图距离度量方法在训练数据集X中选择其k个光谱特征最相似的近邻点,x0的邻域表示为N(x0),邻域中包含k个近邻点;
利用LLE或LTSA局部流形学习算法,分别计算x0与训练数据集X中的其他数据点xa的连接权值W0a
采用GFHF的泛化算法利用各连接权值计算测试数据集Xt的分类结果Ft
2.根据权利要求1所述的基于局部流形学习构图的高光谱遥感图像半监督分类方法,其特征在于:步骤(2)中,得到图的邻接矩阵W,将局部流形学习算法图结构对应的图拉普拉斯矩阵L分成四部分 L mm L mu L um L uu , 其中L=I-W,I表示单位矩阵,则通过以下公式计算无标记数据集Xu的分类结果Fu
F u T = - L uu - 1 L um Y m T . . . ( 1 )
3.根据权利要求1或2所述的基于局部流形学习构图的高光谱遥感图像半监督分类方法,其特征在于:步骤(2)中,若xa和xb互为近邻点,或者xa和xb不互为近邻点,但xa或xb均是第三个数据点xr的近邻点,则xa和xb之间存在连接关系,利用LLE局部流形学习算法,通过以下公式分别计算xa与xb的连接权值W(lle)ab
W ( lle ) ab = S ab + S ba - Σ r S ra S rb a ≠ b 0 a = b . . . ( 2 )
其中,xr的k个近邻点中包含xa和xb,Sab表示xa被其近邻点xb线性重构的系数,通过以下公式计算:
S ab = arg min | | x a - Σ x b ∈ N ( x a ) S ab x b | | 2 . . . ( 3 )
s . t . Σ x b ∈ N ( x a ) S ab = 1
其中N(xa)表示xa的邻域。
4.根据权利要求3所述的基于局部流形学习构图的高光谱遥感图像半监督分类方法,其特征在于:步骤(3)中,根据GFHF泛化算法,通过以下公式计算点x0的分类结果f0
f 0 = Σ x a ∈ X , x a ∈ N ( x 0 ) W ( lle ) oa f a . . . ( 4 )
其中fa表示x0的一个近邻点xa的GFHF分类结果,W(lle)0a表示xa和x0之间的权值,权值W(lle)0a利用LLE局部流形学习算法,通过以下公式计算:
W(lle)0a=S0a…(5)
其中S0a表示近邻点xa对测试点x0的线性重构系数,通过以下公式计算:
S 0 a = arg min | | x 0 - Σ x a ∈ N ( x 0 ) S 0 a x a | | 2 . . . ( 6 )
s . t . Σ x a ∈ N ( x 0 ) S 0 a = 1
其中N(x0)表示x0的邻域。
5.根据权利要求1或2所述的基于局部流形学习构图的高光谱遥感图像半监督分类方法,其特征在于:步骤(2)中,若xa和xb互为近邻点,或者xa和xb不互为近邻点,但xa或xb均是第三个数据点xr的近邻点,则xa和xb之间存在连接关系,利用LTSA局部流形学习算法,通过以下公式分别计算各个数据点xa的连接权值W(ltsa)ab
W ( ltsa ) ab = Σ ( x a , x b ) ∈ N ( x r ) ( 1 k + 1 k - 1 θ ra T Λ r - 1 θ rb ) a ≠ b 0 a = b . . . ( 7 )
其中,N(xr)表示所有包含xa或xb的邻域,Λr是最大d个特征值所组成的对角矩阵,d表示特征值的数量,θra和θrb分别是xa和xb在N(xr)中的局部切空间坐标,通过以下方法求取:
首先统计N(xr)中k个数据点的协方差矩阵,然后对协方差矩阵进行特征分解,保留最大的d个特征值对应的特征向量,该特征向量即为k个数据点的局部切空间坐标。
6.根据权利要求5所述的基于局部流形学习构图的高光谱遥感图像半监督分类方法,其特征在于:步骤(3)中,根据GFHF泛化算法,通过以下公式计算点x0的分类结果f0
f 0 = Σ x a ∈ X , x a ∈ N ( x 0 ) W ( ltsa ) oa f a . . . ( 8 )
其中fa表示xa的GFHF分类结果,W(ltsa)0a表示xa和x0之间的权值,权值W(ltsa) 0a利用LTSA局部流形学习算法,通过以下公式计算:
W ( ltsa ) 0 a = 1 k + 1 k - 1 θ 0 T Λ 0 - 1 θ a . . . ( 9 )
其中,Λ0是N(x0)内k个数据点的协方差矩阵进行特征分解得到的最大d个特征值所组成的对角矩阵,θ0和θa分别表示在N(x0)中求取的x0和xa的局部切空间坐标,通过以下方法求取:
首先统计N(x0)中k个数据点的协方差矩阵,然后对协方差矩阵进行特征分解,保留最大的d个特征值对应的特征向量,该特征向量即为k个数据点的局部切空间坐标。
CN201410651950.0A 2014-11-17 2014-11-17 基于局部流形学习构图的高光谱遥感图像半监督分类方法 Expired - Fee Related CN104408466B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410651950.0A CN104408466B (zh) 2014-11-17 2014-11-17 基于局部流形学习构图的高光谱遥感图像半监督分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410651950.0A CN104408466B (zh) 2014-11-17 2014-11-17 基于局部流形学习构图的高光谱遥感图像半监督分类方法

Publications (2)

Publication Number Publication Date
CN104408466A true CN104408466A (zh) 2015-03-11
CN104408466B CN104408466B (zh) 2017-10-27

Family

ID=52646097

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410651950.0A Expired - Fee Related CN104408466B (zh) 2014-11-17 2014-11-17 基于局部流形学习构图的高光谱遥感图像半监督分类方法

Country Status (1)

Country Link
CN (1) CN104408466B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069482A (zh) * 2015-08-21 2015-11-18 中国地质大学(武汉) 基于空间正则化流形学习算法的高光谱遥感图像分类方法
CN106199544A (zh) * 2016-06-24 2016-12-07 电子科技大学 基于核鉴别局部切空间排列的雷达目标距离像识别方法
CN106778910A (zh) * 2017-01-12 2017-05-31 张亮 基于本地训练的深度学习系统和方法
CN106778885A (zh) * 2016-12-26 2017-05-31 重庆大学 基于局部流形嵌入的高光谱图像分类方法
CN107491734A (zh) * 2017-07-19 2017-12-19 苏州闻捷传感技术有限公司 基于多核融合与空间Wishart LapSVM的半监督极化SAR图像分类方法
CN107563442A (zh) * 2017-09-02 2018-01-09 西安电子科技大学 基于稀疏低秩正则图张量化嵌入的高光谱图像分类方法
CN107944479A (zh) * 2017-11-16 2018-04-20 哈尔滨工业大学 基于半监督学习的疾病预测模型建立方法及装置
CN107944474A (zh) * 2017-11-06 2018-04-20 中国地质大学(北京) 基于局部自适应字典的多尺度协作表达高光谱分类方法
CN108614926A (zh) * 2018-04-12 2018-10-02 西安交通大学 一种基于流形学习与希尔伯特-黄变换相结合的结构模态参数辨识方法
CN108875802A (zh) * 2018-05-30 2018-11-23 大连理工大学 基于多层近邻的图像相似性度量方法
CN109145950A (zh) * 2018-07-20 2019-01-04 华南理工大学 一种基于图信号采样的高光谱图像主动学习方法
WO2019090509A1 (zh) * 2017-11-08 2019-05-16 深圳大学 一种高光谱图像的分类方法及系统
CN109961088A (zh) * 2019-02-13 2019-07-02 苏州大学 无监督非线性自适应流形学习方法
CN111046951A (zh) * 2019-12-12 2020-04-21 安徽威奥曼机器人有限公司 一种医学影像分类方法
CN111738370A (zh) * 2020-08-25 2020-10-02 湖南大学 本质流形结构的图像特征融合与聚类协同表达方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129571A (zh) * 2011-01-31 2011-07-20 重庆大学 基于半监督流形学习的多光谱遥感数据土地利用分类方法
WO2013177586A1 (en) * 2012-05-25 2013-11-28 The Johns Hopkins University An integrated real-time tracking system for normal and anomaly tracking and the methods therefor

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129571A (zh) * 2011-01-31 2011-07-20 重庆大学 基于半监督流形学习的多光谱遥感数据土地利用分类方法
WO2013177586A1 (en) * 2012-05-25 2013-11-28 The Johns Hopkins University An integrated real-time tracking system for normal and anomaly tracking and the methods therefor

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王小攀等: "一种基于线性领域传播的加权K近邻算法", 《计算机工程》 *
马丽: "基于流形学习算法的高光谱图像分类和异常检测", 《中国博士学位论文全文数据库 信息科技辑》 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069482B (zh) * 2015-08-21 2018-06-15 中国地质大学(武汉) 基于空间正则化流形学习算法的高光谱遥感图像分类方法
CN105069482A (zh) * 2015-08-21 2015-11-18 中国地质大学(武汉) 基于空间正则化流形学习算法的高光谱遥感图像分类方法
CN106199544A (zh) * 2016-06-24 2016-12-07 电子科技大学 基于核鉴别局部切空间排列的雷达目标距离像识别方法
CN106778885A (zh) * 2016-12-26 2017-05-31 重庆大学 基于局部流形嵌入的高光谱图像分类方法
CN106778910A (zh) * 2017-01-12 2017-05-31 张亮 基于本地训练的深度学习系统和方法
CN106778910B (zh) * 2017-01-12 2020-06-16 张亮 基于本地训练的深度学习系统和方法
CN107491734A (zh) * 2017-07-19 2017-12-19 苏州闻捷传感技术有限公司 基于多核融合与空间Wishart LapSVM的半监督极化SAR图像分类方法
CN107491734B (zh) * 2017-07-19 2021-05-07 苏州闻捷传感技术有限公司 基于多核融合与空间Wishart LapSVM的半监督极化SAR图像分类方法
CN107563442A (zh) * 2017-09-02 2018-01-09 西安电子科技大学 基于稀疏低秩正则图张量化嵌入的高光谱图像分类方法
CN107563442B (zh) * 2017-09-02 2019-12-10 西安电子科技大学 基于稀疏低秩正则图张量化嵌入的高光谱图像分类方法
CN107944474A (zh) * 2017-11-06 2018-04-20 中国地质大学(北京) 基于局部自适应字典的多尺度协作表达高光谱分类方法
WO2019090509A1 (zh) * 2017-11-08 2019-05-16 深圳大学 一种高光谱图像的分类方法及系统
CN107944479A (zh) * 2017-11-16 2018-04-20 哈尔滨工业大学 基于半监督学习的疾病预测模型建立方法及装置
CN108614926A (zh) * 2018-04-12 2018-10-02 西安交通大学 一种基于流形学习与希尔伯特-黄变换相结合的结构模态参数辨识方法
CN108875802A (zh) * 2018-05-30 2018-11-23 大连理工大学 基于多层近邻的图像相似性度量方法
CN109145950A (zh) * 2018-07-20 2019-01-04 华南理工大学 一种基于图信号采样的高光谱图像主动学习方法
CN109145950B (zh) * 2018-07-20 2021-09-21 华南理工大学 一种基于图信号采样的高光谱图像主动学习方法
CN109961088A (zh) * 2019-02-13 2019-07-02 苏州大学 无监督非线性自适应流形学习方法
CN109961088B (zh) * 2019-02-13 2020-09-29 苏州大学 无监督非线性自适应流形学习方法
CN111046951A (zh) * 2019-12-12 2020-04-21 安徽威奥曼机器人有限公司 一种医学影像分类方法
CN111738370A (zh) * 2020-08-25 2020-10-02 湖南大学 本质流形结构的图像特征融合与聚类协同表达方法及系统
CN111738370B (zh) * 2020-08-25 2020-11-17 湖南大学 本质流形结构的图像特征融合与聚类协同表达方法及系统

Also Published As

Publication number Publication date
CN104408466B (zh) 2017-10-27

Similar Documents

Publication Publication Date Title
CN104408466A (zh) 基于局部流形学习构图的高光谱遥感图像半监督分类方法
Fei et al. UAV-based multi-sensor data fusion and machine learning algorithm for yield prediction in wheat
Meng et al. Monitoring desertification in Mongolia based on Landsat images and Google Earth Engine from 1990 to 2020
Liaqat et al. Evaluation of MODIS and Landsat multiband vegetation indices used for wheat yield estimation in irrigated Indus Basin
Ming et al. Land cover classification using random forest with genetic algorithm-based parameter optimization
Wang et al. Mapping Robinia pseudoacacia forest health conditions by using combined spectral, spatial, and textural information extracted from IKONOS imagery and random forest classifier
Jiang et al. Estimating the aboveground biomass of coniferous forest in Northeast China using spectral variables, land surface temperature and soil moisture
Hasituya et al. Mapping plastic-mulched farmland with multi-temporal Landsat-8 data
Ye et al. Identification of banana fusarium wilt using supervised classification algorithms with UAV-based multi-spectral imagery
CN102096825A (zh) 基于图的半监督高光谱遥感图像分类方法
Hao et al. Comparison of hybrid classifiers for crop classification using normalized difference vegetation index time series: A case study for major crops in North Xinjiang, China
Tariq et al. Impact of spatio-temporal land surface temperature on cropping pattern and land use and land cover changes using satellite imagery, Hafizabad District, Punjab, Province of Pakistan
CN111598045A (zh) 一种基于对象图谱和混合光谱的遥感耕地变化检测方法
Shu et al. Improving the estimation accuracy of SPAD values for maize leaves by removing UAV hyperspectral image backgrounds
CN106845428A (zh) 一种作物产量遥感估算方法及系统
Herbei et al. Processing and use of satellite images in order to extract useful information in precision agriculture.
Nidamanuri et al. Transferring spectral libraries of canopy reflectance for crop classification using hyperspectral remote sensing data
Liu et al. Estimating maize seedling number with UAV RGB images and advanced image processing methods
Cheng et al. Using multimodal remote sensing data to estimate regional-scale soil moisture content: A case study of Beijing, China
Yang et al. Effect of spring irrigation on soil salinity monitoring with UAV-borne multispectral sensor
Guermazi et al. Water irrigation management using remote sensing techniques: a case study in Central Tunisia
CN106096622A (zh) 半监督的高光谱遥感图像分类标注方法
Khan et al. County-level corn yield prediction using supervised machine learning
Zhu et al. UAV flight height impacts on wheat biomass estimation via machine and deep learning
Zhang et al. Crop type mapping with temporal sample migration

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171027

Termination date: 20201117