CN103745232A - 基于波段迁移的高光谱图像聚类方法 - Google Patents

基于波段迁移的高光谱图像聚类方法 Download PDF

Info

Publication number
CN103745232A
CN103745232A CN201410032062.0A CN201410032062A CN103745232A CN 103745232 A CN103745232 A CN 103745232A CN 201410032062 A CN201410032062 A CN 201410032062A CN 103745232 A CN103745232 A CN 103745232A
Authority
CN
China
Prior art keywords
sample
cluster
aiming field
label
hyperspectral image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410032062.0A
Other languages
English (en)
Other versions
CN103745232B (zh
Inventor
缑水平
刘芳
张观侣
马晶晶
马文萍
侯彪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201410032062.0A priority Critical patent/CN103745232B/zh
Publication of CN103745232A publication Critical patent/CN103745232A/zh
Application granted granted Critical
Publication of CN103745232B publication Critical patent/CN103745232B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于波段迁移的高光谱图像聚类方法。主要解决现有基于高斯混合模型的聚类方法对于高光谱图像聚类不准确,速度较慢,稳定性较差的问题。其实现步骤是:先从高光谱图像中随机选出一些波段分别作为目标域,根据聚类一致性值,从目标域选出一些聚类不稳定样本;再根据欧氏距离原则从高光谱图像剩余波段中选取一些波段作为源域,利用EM算法估计源域中高斯混合模型的参数;最后将源域中的参数迁移至目标域来改善目标域中不稳定样本的聚类结果。本发明与传统的聚类方法相比,具有速度快、效果好等优点,而且可使用较少的波段达到较高的分类精度,大大的节约了计算成本,可用于矿产探测、资源调查及环境监测。

Description

基于波段迁移的高光谱图像聚类方法
技术领域
本发明属于图像处理技术领域,涉及对高光谱遥感图像的处理,可用于矿产探测、资源调查及环境监测。
背景技术
伴随着遥感技术的发展和成像设备的进步,光学遥感技术进入了高光谱遥感时代,高光谱遥感技术的出现和发展将使得遥感成像设备以更快的速度、更高的分辨率、更大的信息量为人类提供海量的观测数据,将人们通过遥感技术观测和认识地物的能力带入了一个崭新的阶段。针对由成像光谱仪采集得到的高光谱遥感数据,如何对其中蕴含的海量信息进行充分而且有效的利用,给广大的科研工作者和技术人员提出的挑战并带来了机遇。通过对高光谱遥感数据进行有效的分类,能够更加深入的挖掘高光谱遥感图像在矿产探测、资源调查以及环境监测等方面的应用。由于实际应用中,有标签的数据难以获得并且代价巨大,于是无监督的分类在高光谱遥感图像中的应用显得尤为重要。
聚类,是将物理或抽象对象的集合组成为由类似的对象组成的多个类的过程。聚类是数据挖掘技术中的重要组成部分,根据样本间的相似度的度量标准将数据分成若干个簇,所组成的簇是一组数据对象的集合,且使同一簇中的样本相似度尽量高,不属于同一簇中的样本之间的相似度尽量低。在聚类的过程中,一些簇中的数据对象可以被看作为一个整体。一个聚类分析系统的输入是一组样本和一个度量样本间相似度或距离的标准,而输出则是簇集,即数据集的几个类,这些类构成一个分区或者分区结构。聚类是研究数据间逻辑上或物理上相互关系的技术,其分析结果不仅可以揭示数据间的内在联系与区别,还可以为进一步的数据分析与知识发现提供重要依据。作为统计学的重要研究内容之一,聚类分析具有坚实的理论基础,并形成了系统的方法学体系。
众所周知,高光谱图像数据波段服从高斯分布,用高斯混合模型对高光谱图像进行建模会得到良好的效果。高斯混合模型GMM是一个常用的描述混合密度分布的模型,即多个高斯分布的混合分布。高斯混合模型是一种半参数的密度估计方法,它融合了参数估计法和非参数估计法的优点,既不局限于特定的概率密度函数的形式,而且模型的复杂度仅与所求解的问题有关而与样本集合的大小无关。高斯混合模型的一个重要特性是,如果模型中的成员足够多,它能够以任意精度逼近任意的连续分布。所以高斯混合模型在许多领域得到了广泛的应用。高斯混合模型是一种统计模型,它能够很好地刻画参数空间中数据的空间分布及其特性。高斯混合模型中常用EM算法估计它的参数。然而,单纯的用基于高斯混合模型的EM算法对高光谱进行分类会有对初始值敏感,容易陷入局部最优的问题,并且由于高光谱中波段数目多,使得聚类速度缓慢。
发明内容
本发明的目的在于针对上述高光谱遥感图像中聚类的缺陷,提出一种基于高光谱图像波段迁移的聚类方法,以加快聚类速度,提高聚类精度。
为实现上述目的,本发明包括如下步骤:
(1)输入高光谱图像IR×N,R是不同谱对应的m×n大小的图像,N为高光谱图像的波段数目;
(2)随机选出高光谱的10个波段数据作为目标域样本DT,根据这10个波段数据,利用欧氏距离作为度量准则,从剩下的波段中再另选取出10个波段数据作为源域样本DS
(3)对目标域样本DT用EM、K-means和FCM聚类算法分别聚3次,得到的9个聚类标签,计算这9个聚类标签的聚类一致性值CI;
(4)设定一个阈值Q=0.6,将聚类一致性值CI与阈值Q进行比较,若CI大于等于Q,则将样本标记为确定性样本DA,否则标记为非确定性样本DB,同时记录确定性样本DA的聚类标签la
(5)对源域样本DS的高斯混合模型用EM算法进行参数估计,得到源域中混合高斯模型的类混合权值参数αj、均值μj、协方差σj,并将得到的这些参数迁移至目标域样本DT,得到目标域样本DT新的类混合权值参数αj′、均值μj′、协方差σj′;
(6)根据新的类混合权值参数αj′、均值μj′、协方差σj′,计算出非确定样本DB的聚类标签lb
(7)根据确定性样本DA的聚类标签la和非确定性样本DB的聚类标签lb,得到目标域样本DT的聚类标签l:l=la∪lb
本发明与现有的技术相比具有以下优点:
1、本发明通过引入迁移学习的方法,充分利用了高光谱图像波段间的信息,减少了需要使用的波段数目,使聚类速度加快;同时通过引入其它波段的分布信息,提高了聚类的准确性;
2、本发明针对EM算法中对于初始值敏感,容易陷入局部最优等问题,引入聚类一致性值和迁移学习的方法,对聚类一些不稳定的样本重新进行聚类,大大的提高了聚类的精度和稳定性。
附图说明
图1是本发明的总流程图;
图2是本发明所使用的高光谱遥感图像的灰度图;
图3是本发明中所使用高光谱图像的真实分布标签;
图4是本发明中对高光谱数据用GMM-EM聚类方法得到的聚类结果;
图5是本发明中对高光谱数据用基于MIFS算法聚类之后的结果;
图6是本发明中对高光谱数据用基于PCA算法聚类之后的结果;
图7是本发明中用基于波段迁移之后目标域的聚类结果。
具体实施方式
参照图1,本发明基于波段迁移的高光谱图像聚类方法,包括如下步骤:
步骤1:输入高光谱图像IR×N,R是不同谱对应的m×n大小的图像,N为高光谱图像的波段数目,这幅高光谱遥感图像是美国加利福尼亚萨利纳斯山谷的AVIRIS遥感图像,大小为86×83,灰度图像如图2所示,该图总共有6类地物,真实分布标签如图3所示。
步骤2:随机选出高光谱的10个波段数据作为目标域样本DT,根据这10个波段数据,利用欧氏距离作为度量准则,从剩下的波段中再另选取出10个波段数据作为源域样本DS
步骤3:对目标域样本DT用EM、K-means和FCM聚类算法分别聚3次,得到的9个聚类标签,计算这9个聚类标签的聚类一致性值CI。
3a)利用EM算法对于目标域样本DT进行3次聚类得到3个类别标签,再利用K-means算法对目标域样本DT进行3次聚类得到3个类别标签,最后再利用FCM算法对目标域样本DT进行3次聚类得到3个类别标签,总共得到9个类别标签;
3b)通过如下公式计算9个聚类标签的聚类一致性值CI:
CI={CI(x)},
其中, CI ( x ) = 1 9 max { Σ t = 1 9 δ ( π t ( x ) , L ) } L ∈ { 1,2 , . . . , k }
δ ( π t ( x ) , L ) = 1 π t ( x ) = L 0 π t ( x ) ≠ L ,
式中,CI(x)表示样本点x的聚类一致性值,πt(x)表示在第t次聚类时对样本点x的聚类标签,k为类别数,L为每一个类别标号。
步骤4:设定一个阈值Q=0.6,将聚类一致性值CI与阈值Q进行比较,若CI大于等于Q,则将样本标记为确定性样本DA,否则标记为非确定性样本DB,同时记录确定性样本DA的聚类标签la
步骤5:对源域样本DS的高斯混合模型用EM算法进行参数估计,并将得到的参数迁移至目标域样本DT,得到目标域样本DT新的类混合权值参数αj′、均值μj′、协方差σj′。
5a)用EM算法获得源域样本DS的高斯混合模型的类混合权值参数αj、均值μj、协方差σj:
EM算法是期望最大算法,它的主要目的是在不知道待估计参数先验信息和观测数据不完备的情况下提供一个简单的迭代算法来计算参数的最大似然估计。EM算法能保证迭代收敛并至少得到使待估计参数的似然函数达到局部极值的一个估计值。其主要分为两步:第一步称为E步骤,是根据参数初始值或上一次迭代值来计算期望;第二步称为M步骤,是将似然函数最大化得到新的参数。通过重复以上两步直到收敛为止,最后可得到源域样本DS的高斯混合模型的类混合权值参数αj、均值μj、协方差σj
5b)根据类混合权值参数αj、均值μj和协方差σj,计算源域中的隶属度Zi,j
Z i , j = α j G ( X i ; μ j , σ j ) / Σ j = 1 k α j G ( X i ; μ j , σ j )
G ( X i ; μ j , σ j ) = 1 ( 2 π ) M 2 | σ j | 1 2 exp { - 1 2 ( X i - μ j ) T σ j - 1 ( X i - μ j ) } ,
其中,Xi是源域样本DS中第i个样本的特征序列,M是特征序列的长度,j=1,2,...,k,k为类别数目;
5c)利用上述计算得到的隶属度Zi,j,计算样本在目标域样本DT中新的类混合权值参数αj′、均值μj′和协方差σj′:
α j ′ = 1 R Σ i = 1 R Z i , j
μ j ′ = Σ i = 1 R Z i , j X i Σ i = 1 R Z i , j
σ j ′ = Σ i = 1 R Z i , j ( X i - μ j ) ( X i - μ j ) T / Σ i = 1 R Z i , j ,
其中,R是样本的总个数。
步骤6:根据新的类混合权值参数αj′、均值μj′、协方差σj′,计算出非确定样本DB的聚类标签lb
6a)计算目标域样本的隶属度Zi,j′:
Z i , j ′ = α j ′ G ( X i ′ ; μ j ′ , σ j ′ ) / Σ j = 1 k α j ′ G ( X i ′ ; μ j ′ , σ j ′ )
G ( X i ′ ; μ j ′ , σ j ′ ) = 1 ( 2 π ) M 2 | σ j ′ | 1 2 exp { - 1 2 ( X i ′ - μ j ′ ) T σ j ′ - 1 ( X i ′ - μ j ′ ) }
其中,Xi′是目标域样本DT中的第i个样本的特征序列,M是目标域样本DT中特征序列的长度,j=1,2,...,k,k为类别数目;
6b)根据目标域样本的隶属度函数Zi,j′,得到目标域样本DT的标签li
li=max(max(Zi,j′)),
由于非确定性样本DB的标签lb是目标域样本DT的标签li的一部分,故得到目标域样本DT中非确定性样本DB的标签lb为:
Figure BDA0000460948390000061
其中,b是非确定性样本DB的位置标记。
步骤7:根据确定性样本DA的聚类标签la和非确定性样本DB的聚类标签lb,得到目标域样本DT的聚类标签l:l=la∪lb,将得到的标签l用图像的形式表示,如图5所示,即为最终的聚类结果。
本发明的效果可以通过如下仿真实验具体说明:
1、仿真条件
1)仿真实验所用编程平台为matlabR2010b;
2)仿真实验所用的高光谱图像是美国加利福尼亚萨利纳斯山谷的AVIRIS遥感图像,大小为86×83,灰度图像如图2所示;
3)仿真实验中采用聚类正确率来评价聚类性能,聚类正确率定义为:
rate = 1 N Σ i = 1 K Σ j = 1 , i ≠ j K Correct ( i , j ) ,
Correct(i,j)表示同时出现在真实标签和聚类结果标签中的数据样本点数目,N为数据样本点的数目,K为聚类类别数。
2、仿真内容
仿真1,采用GMM-EM算法对高光谱图像进行聚类,其聚类结果如图4所示;
仿真2,采用基于MIFS的高光谱图像聚类算法进行聚类,其聚类结果如图5所示;
仿真3,采用基于PCA的高光谱图像聚类算法进行聚类,其聚类结果如图6所示;
仿真4,采用本发明的方法对高光谱图像进行聚类,其聚类结果如图7所示;
从图4-图7所显示的聚类结果可以看出,本发明提出的基于波段迁移的高光谱图像聚类算法得到的结果错分点少,聚类结果更好。
统计GMM-EM算法、MIFS算法、PCA算法和本发明方法的聚类正确率,聚类正确率结果如表1所示。
表14种聚类方法的聚类正确率统计
从表1可以看出,本发明方法比GMM-EM算法要高5.23%,比MIFS算法高1.03%,比PCA算法高6.22%。

Claims (4)

1.一种基于波段迁移的高光谱图像聚类方法,包括如下步骤: 
(1)输入高光谱图像IR×N,R是不同谱对应的m×n大小的图像,N为高光谱图像的波段数目; 
(2)随机选出高光谱的10个波段数据作为目标域样本DT,根据这10个波段数据,利用欧氏距离作为度量准则,从剩下的波段中再另选取出10个波段数据作为源域样本DS; 
(3)对目标域样本DT用EM、K-means和FCM聚类算法分别聚3次,得到的9个聚类标签,计算这9个聚类标签的聚类一致性值CI; 
(4)设定一个阈值Q=0.6,将聚类一致性值CI与阈值Q进行比较,若CI大于等于Q,则将样本标记为确定性样本DA,否则标记为非确定性样本DB,同时记录确定性样本DA的聚类标签la; 
(5)对源域样本DS的高斯混合模型用EM算法进行参数估计,得到源域中混合高斯模型的类混合权值参数αj、均值μj、协方差σj,并将得到的这些参数迁移至目标域样本DT,得到目标域样本DT新的类混合权值参数αj′、均值μj′、协方差σj′; 
(6)根据新的类混合权值参数αj′、均值μj′、协方差σj′,计算出非确定样本DB的聚类标签lb; 
(7)根据确定性样本DA的聚类标签la和非确定性样本DB的聚类标签lb,得到目标域样本DT的聚类标签l:l=la∪lb。 
2.根据权利要求1所述的方法,其中所述步骤(3)中计算9个聚类标签的聚类一致性值CI,通过如下公式计算: 
CI={CI(x)} 
其中,
Figure FDA0000460948380000021
式中,CI(x)表示样本点x的聚类一致性值,πt(x)表示在第t次聚类时对样本点x的聚类标签,k为类别数,L为每一个类别标号。 
3.根据权利要求1所述的方法,其中步骤(5)所述的将得到的参数迁移至目标域样本DT,得到目标域样本DT新的类混合权值参数αj′、均值μj′、协方差σj′,按如下步骤进行: 
(5a)根据类混合权值参数αj、均值μj和协方差σj,计算源域中的隶属度Zi,j: 
Figure FDA0000460948380000023
Figure FDA0000460948380000024
其中,Xi是源域样本DS中第i个样本的特征序列,M是特征序列的长度,j=1,2,...,k,k为类别数目; 
(5b)利用上述计算得到的隶属度Zi,j,计算样本在目标域样本DT中新的类混合权值参数αj′、均值μj′和协方差σj′: 
Figure FDA0000460948380000025
Figure FDA0000460948380000026
Figure FDA0000460948380000027
其中,R是样本的总个数。 
4.根据权利要求1所述的方法,其中步骤(6)所述的根据新的类混合权值参数αj′、均值μj′、协方差σj′,计算出非确定样本DB的聚类标签lb,按如下步骤进行: 
(6a)计算目标域样本的隶属度Zi,j′: 
Figure FDA0000460948380000032
其中,Xi′是目标域样本DT中的第i个样本的特征序列,M是目标域样本DT中特征序列的长度,j=1,2,...,k,k为类别数目; 
(6b)根据目标域样本的隶属度函数Zi,j′,计算目标域样本DT的标签li: 
li=max(max(Zi,j′)), 
通过目标域样本DT的标签li,得到非确定性样本DB的标签lb: 
Figure FDA0000460948380000033
其中b是非确定性样本DB的位置。 
CN201410032062.0A 2014-01-23 2014-01-23 基于波段迁移的高光谱图像聚类方法 Active CN103745232B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410032062.0A CN103745232B (zh) 2014-01-23 2014-01-23 基于波段迁移的高光谱图像聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410032062.0A CN103745232B (zh) 2014-01-23 2014-01-23 基于波段迁移的高光谱图像聚类方法

Publications (2)

Publication Number Publication Date
CN103745232A true CN103745232A (zh) 2014-04-23
CN103745232B CN103745232B (zh) 2017-01-18

Family

ID=50502249

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410032062.0A Active CN103745232B (zh) 2014-01-23 2014-01-23 基于波段迁移的高光谱图像聚类方法

Country Status (1)

Country Link
CN (1) CN103745232B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107644212A (zh) * 2017-10-19 2018-01-30 中国地质大学(武汉) 一种高光谱遥感图像分类方法、设备及存储设备
CN109635702A (zh) * 2018-07-11 2019-04-16 国家林业局森林病虫害防治总站 基于卫星遥感图像的林业生物灾害监测方法和系统
CN113505852A (zh) * 2021-07-28 2021-10-15 云南电网有限责任公司电力科学研究院 一种基于主成分分析与em距离的低压用户相别识别方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102521605A (zh) * 2011-11-25 2012-06-27 河海大学 一种高光谱遥感图像波段选择方法
CN102819745B (zh) * 2012-07-04 2014-11-05 杭州电子科技大学 一种基于AdaBoost的高光谱遥感影像分类方法
CN103440505B (zh) * 2013-09-16 2016-11-02 重庆邮电大学 空间邻域信息加权的高光谱遥感图像分类方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107644212A (zh) * 2017-10-19 2018-01-30 中国地质大学(武汉) 一种高光谱遥感图像分类方法、设备及存储设备
CN107644212B (zh) * 2017-10-19 2019-12-17 中国地质大学(武汉) 一种高光谱遥感图像分类方法、设备及存储设备
CN109635702A (zh) * 2018-07-11 2019-04-16 国家林业局森林病虫害防治总站 基于卫星遥感图像的林业生物灾害监测方法和系统
CN113505852A (zh) * 2021-07-28 2021-10-15 云南电网有限责任公司电力科学研究院 一种基于主成分分析与em距离的低压用户相别识别方法

Also Published As

Publication number Publication date
CN103745232B (zh) 2017-01-18

Similar Documents

Publication Publication Date Title
Schneider Monitoring land cover change in urban and peri-urban areas using dense time stacks of Landsat satellite data and a data mining approach
Guillaumin et al. Large-scale knowledge transfer for object localization in imagenet
CN109871875B (zh) 一种基于深度学习的建筑物变化检测方法
Guo et al. Superpixel-based active learning and online feature importance learning for hyperspectral image analysis
CN111832615A (zh) 一种基于前景背景特征融合的样本扩充方法及系统
CN103440512A (zh) 一种基于张量局部保持投影的大脑认知状态的识别方法
CN104376335A (zh) 一种基于信息熵的半监督高光谱遥感影像分类方法
CN101710422B (zh) 基于全局流形原型聚类算法与分水岭算法的图像分割方法
CN108171119B (zh) 基于残差网络的sar图像变化检测方法
CN103268607A (zh) 一种弱监督条件下的共同对象检测方法
CN112990282B (zh) 一种细粒度小样本图像的分类方法及装置
CN103745233A (zh) 基于空间信息迁移的高光谱图像分类方法
Quan et al. Improved Deeplabv3 for better road segmentation in remote sensing images
Tirandaz et al. Unsupervised texture-based SAR image segmentation using spectral regression and Gabor filter bank
Deng et al. Citrus disease recognition based on weighted scalable vocabulary tree
CN112528058A (zh) 基于图像属性主动学习的细粒度图像分类方法
CN116740474A (zh) 一种基于锚定条纹注意力机制的遥感图像分类方法
CN115131580A (zh) 基于注意力机制的空间目标小样本识别方法
CN103745232A (zh) 基于波段迁移的高光谱图像聚类方法
Ataş Performance Evaluation of Jaccard-Dice Coefficient on Building Segmentation from High Resolution Satellite Images
Zeybek Inlier point preservation in outlier points removed from the ALS point cloud
CN104331711A (zh) 基于多尺度模糊测度与半监督学习的sar图像识别方法
Moghalles et al. Weakly supervised building semantic segmentation via superpixel‐CRF with initial deep seeds guiding
CN116342938A (zh) 基于多个潜在域混合的域泛化图像分类方法
Thirumaladevi et al. Improved transfer learning of CNN through fine-tuning and classifier ensemble for scene classification

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant