CN111783884B - 基于深度学习的无监督高光谱图像分类方法 - Google Patents
基于深度学习的无监督高光谱图像分类方法 Download PDFInfo
- Publication number
- CN111783884B CN111783884B CN202010622917.0A CN202010622917A CN111783884B CN 111783884 B CN111783884 B CN 111783884B CN 202010622917 A CN202010622917 A CN 202010622917A CN 111783884 B CN111783884 B CN 111783884B
- Authority
- CN
- China
- Prior art keywords
- data
- hyperspectral image
- predicted
- prediction
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000013135 deep learning Methods 0.000 title claims abstract description 11
- 238000012549 training Methods 0.000 claims abstract description 29
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 19
- 238000007906 compression Methods 0.000 claims abstract description 7
- 230000006835 compression Effects 0.000 claims abstract description 6
- 238000003064 k means clustering Methods 0.000 claims abstract description 5
- 238000000605 extraction Methods 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000002372 labelling Methods 0.000 abstract description 3
- 241001466077 Salina Species 0.000 description 13
- 238000010586 diagram Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 9
- 230000003595 spectral effect Effects 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 8
- 238000001514 detection method Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 238000007635 classification algorithm Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 1
- 235000011613 Pinus brutia Nutrition 0.000 description 1
- 241000018646 Pinus brutia Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开的一种基于深度学习的无监督高光谱图像分类方法,包括引入高光谱图像的负样本,结合原始高光谱图像构成高光谱图像样本,将高光谱图像样本划分为训练数据和待预测数据,并进行维度压缩,得到压缩后的训练数据和待预测数据;对压缩后的训练数据进行自回归,生成上下文信息;根据上下文信息和压缩后待预测数据之间的互信息进行高光谱图像样本的自身预测,得到对比预测编码器;将预测编码器应用在待分类高光谱图像上,得到特征数据,使用K‑Means聚类算法,对特征数据进行无监督分类。本发明避免了繁重的数据标注工作,提高了高光谱图像无监督分类的精确性。
Description
技术领域
本发明属于遥感通信技术领域,涉及一种基于深度学习的无监督高光谱图像分类方法。
背景技术
遥感技术是指利用航天设备携带的传感器采集地表信息的勘测技术。自兴起以来,遥感技术发展十分迅速,遥感传感器收集数据经历了由光学拍摄到计算机扫描的跨越,这使得遥感图像可以包含更多角度、更大范围内的地表信息。与传统航拍图像不同,遥感图像同时携带光谱信息和空间信息,能够实现图谱合一。按照光谱分辨率不同,通常将遥感图像划分为:多光谱图像、高光谱图像、超光谱图像三类。目前应用最广泛的是高光谱图像。
成像光谱仪的快速发展促进了多光谱遥感探测转向高光谱遥感探测的进程,遥感探测技术也由宽波探测拓展到窄波探测。高光谱图像比多光谱图像包含更为细致的地表信息,其覆盖从可见光至中红外波段的电磁波,拥有纳米级光谱分辨率。最重要的是高光谱图像提升了地表建筑的可分辨率,也就是说,在宽波中无法被探测识别的物体,在窄波中可以被探测识别。不仅如此,因为不同物体对成像传感器发出的电磁波产生的回应程度不同,所以地表各类建筑在高光谱图像中具有不同的光谱信息,借助这个特性,可以实现地表建筑有效分类。
高光谱图像在诸多行业之中被普遍运用。在军事方面,依靠高分辨率光谱信息,可以探测伪装的军事工程,掌握敌方军事部署。在民用方面,高光谱图像被应用在:污染检测、地质调查、资源勘探等领域。正确处理和识别高光谱图像中包含的信息是将其优势发挥的关键。需要知道,高光谱图像包含丰富信息的同时,也伴随着数据冗余性高、数据关联性强、“同物异谱”和“同谱异物”等缺陷,这无疑加重了识别分类的难度。从冗余数据中,提取数据特征是提高识别分类效率的重要方式。
目前高光谱图像分类问题,采用有监督分类算法已经取得了相当不错的成绩,采用有监督分类算法对高光谱图像进行分类的精度已经达到99%以上,这充分说明了有监督分类算法的有效性。但是有监督分类算法最大的特点也是其最大的短板,它要求输入的高光谱图像要事先标注好类别。我们知道高光谱图像本身结构复杂,一般采取人工标注的方式获取标签,数据预处理这部分工作耗时耗力,成本很大。标签的存在,使得高光谱图像本身携带的信息结构被忽视。
因此,提供一种避免了繁重的数据标注工作,提高高光谱图像分类精确性的基于深度学习的无监督高光谱图像分类方法是本领域技术人员亟待解决的技术问题。
发明内容
本发明针对上述研究现状和存在的问题,提供了一种基于深度学习的无监督高光谱图像分类方法,选择合适的无监督特征提取算法,分析将其应用于高光谱图像上的可行性。使用无监督特征提取算法得到的数据,采用K-Means算法对这部分数据进行无监督分类,根据高光谱图像的特点,优化算法结构,并评价特征提取算法的效率及分类结果的精确度。
为实现上述目的其具体方案如下:
一种基于深度学习的无监督高光谱图像分类方法,包括如下步骤:
S1、引入高光谱图像的负样本,结合原始高光谱图像构成高光谱图像样本,将高光谱图像样本划分为训练数据和待预测数据,并对分别对二者进行维度压缩,得到压缩后的训练数据和待预测数据;
S2、对压缩后的训练数据进行自回归,生成上下文信息;
S3、根据上下文信息和压缩后待预测数据之间的互信息进行高光谱图像样本的自身预测,得到用于特征提取的对比预测编码器;
S4、将预测编码器应用在待分类高光谱图像上,得到特征数据,使用K-Means聚类算法,对特征数据进行无监督分类。
优选的,所述S1还包括训练数据和待预测数据分别经过对比预测编码器压缩至低维空间,即进行特征提取。
优选的,所述S3还包括通过损失计算调整对比预测编码器权重的步骤:
压缩后的训练数据通过自回归模型得到上下文信息,经过对比预测编码器得到预测数据,预测数据与待预测数据点积计算损失,计算的损失反馈给对比预测编码,修改对比预测编码器各卷积层的权重。
优选的,所述S1中负样本获取的方法包括波动法、乱序法和错位法。
本发明相较现有技术具有以下有益效果:
本发明为了进一步挖掘高光谱图像的差异性特征,在训练过程中引入负样本,这样可以有效地提升特征提取效果,可以保证对比学习的有效性;本发明还充分利用了高光谱图像的互信息,提高了无监督高光谱图像分类精确度;同时对比预测编码器将高光谱图像样本映射到紧凑的潜在空间,进行特征提取,使得特征更加明显,便于算法后续处理。高光谱图像数据具有冗余性特点,必须进行特征提取才可以发挥高光谱图像丰富信息的优势,使得特征提取是必要的操作,适合运用对比预测编码进行无监督特征提取。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明基于深度学习的无监督高光谱图像分类方法的流程图;
图2是本发明正负样本光谱对比图;
图3是本发明实施例提供的Salinas数据集示意图;
图4是本发明实施例提供的Salinas数据集样本划分示意图;
图5是本发明实施例提供的Salinas数据集分类结果对比图;
图6是本发明实施例提供的IndianPines数据集示意图;
图7是本发明实施例提供的IndianPines数据集样本划分示意图;
图8是本发明实施例提供的IndianPines数据集分类结果对比图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见附图1,对比预测编码应用在高光谱图像分类的工作流程,首先将原始数据划分为两部分,如图1中所示的Date_x与Date_y,然后编码器将它们映射到更加紧凑的潜在空间得到表征数据Encoder_x与Encoder_y,接着把Encoder_x放入自回归模型得到上下文信息Context,进而得到预测值Date_pred,最后与Encoder_y一起计算预测损失值。显然只有编码器提取到有效地的特征,预测数据和待预测数据之间的误差才会减小。
具体执行过程如下:
S1、引入高光谱图像的负样本,结合原始高光谱图像构成高光谱图像样本,将高光谱图像样本划分为训练数据和待预测数据,其中训练数据和待预测数据内部进一步划分为若干小段,并对分别对二者进行维度压缩,得到压缩后的训练数据和待预测数据。
对比预测编码要求输入的数据同时包含正负样本,以便进行对比学习。因为这是无监督学习算法,所以这里的负样本不是指标签错乱的样本。算法关注的是数据本身丰富的信息,尤其是上下文联系,因此,负样本可以减弱或破坏这部分信息。如图2所示,采用波动法,使负样本后半部分波段进行随机震荡,使其与正样本波段产生明显差异。产生负样本的方法还有:错位法、乱序法等。
负样本生成策略如下:
(1)波动法
随机生成4个范围是[-1,1]的随机数,接着乘以被选中样本的待预测数据,从而实现负样本生成。
(2)错位法
随机选取两个样本,将它们的待预测数据部分交换,从而构成两个新的负样本数据。
(3)乱序法
乱序法与前两种方法不同,它并不改变选中数据的波段值,而是生成一个随机交换序列,按照生成的索引,改变待预测数据的顺序,达到生成负样本的目的。
这种通过改变正常光谱波段产生的负样本,与正常样本有明显差异,这就使得算法可以对比正负样本进行特征提取。仅仅输入正样本,算法很容易陷入过拟合的情形,而负样本的出现,可以修改某些泛特征的权重,使算法可以进一步挖掘样本之间的差异性特征,即光谱间可以相互区分的特征。负样本的训练数据生成的预测数据与其待预测部分是不同的,因此,迫使编码器去学习光谱更多的特征,以此提高编码器特征提取的效果。
编码器由一系列一维卷积层构成,他们之间权重会随着训练不断修正,直到输入的高纬数据可以被输出的低纬数据表示。
下面给出对比预测编码器进行数据维度压缩的一种示例:
编码器的输入数据维度示例:
输入(?,4,25,1)->输出(?,4,5)
其中,输入(?,4,25,1)中:
?:表示一批输入的数量;
4:训练数据或待预测数据内部再分成4个小段;
(25,1):表示25x1的数据向量(光谱的部分波段);
输出(?,4,5)中:
?:表示一批输出的数量;
4:与输入对于的再分小段;
5:被压缩后的数据维度。
数据维度的压缩过程不仅限于上述一种示例。
S2、对压缩后的训练数据进行自回归,生成上下文信息。
对比预测编码要求输入样本可以通过上下文信息进行自身其他信息的预测。换句话说,样本数据前后信息要有关联性,最理想的样本就是序列化数据。序列化数据的好处,在于可以通过上下文去推测其他部分数据。对比预测编码中,使用到的自回归模型可以得到上下文数据,并且可以进行其他部分数据的预测。实际上就是基于序列化数据的上下文数据与其他部分数据之间包含丰富的互信息。高光谱图像是天然的序列化数据,满足自我预测的要求。
S3、根据上下文信息和压缩后待预测数据之间的互信息进行高光谱图像样本的自身预测,得到用于特征提取的对比预测编码器。
上下文信息数据输入到一个含有若干个全连接层的网络中(这里的数目待预测数据内部再分小段的数据对应,如,待预测数据内部划分为6个小段,这里全连接层的数目也为6)。
上下文数据与待预测数据之间的互信息:
其中,I为互信息函数,c为上下文信息,x为压缩后待预测数据。
对比预测编码并没有直接使用生成模型计算预测概率,而是设计了一个密度比,维持上下文数据与待预测数据之间的互信息,来表示表征是真实数据与随机采样的可能性之比:
上下文预测模型:
fk为预测精确度,xt+k为被压缩后的待预测数据,ct为上下文信息。
这里采用简单的双线性模型:
下面给出利用互信息进行高光谱图像样本的自身预测的一种示例:
训练数据(?,4,3),待预测数据(?,3,3)
生成上下文信息输入输出维度示例:
输入(?,4,3)->输出(?,30)
预测数据输入输出维度示例:
输入(?,30)->输出(?,3,3)(预测数据)
需要说明的是,训练数据与待预测数据的划分可以平均划分,也可以采用其它比例进行划分。
使用噪声对比估计优化编码器和自回归模型,损失函数为:
损失函数LN用于修正整个神经网络的权重,包括特征提取步骤(数据压缩->降维)、生成上下文数据步骤(自回归模型)、以及数据预测步骤。
对比预测编码利用自身的互信息,提高自身预测能力的同时,强化了编码器的特征提取能力,尤其是对序列化数据,特征提取效果相当不错。
S3还包括通过损失计算调整对比预测编码器权重的步骤:
压缩后的训练数据通过自回归模型得到上下文信息,经过对比预测编码器得到预测数据,预测数据与待预测数据点积计算损失,反映的是正样本预测精度与负样本预测精度之比。计算的损失反馈给对比预测编码,修改对比预测编码器各卷积层的权重。点积计算损失是预测精度损失,聚焦的是每次预测的损失情况。
S4、将预测编码器应用在待分类高光谱图像上,得到特征数据,使用K-Means聚类算法,对特征数据进行无监督分类。
K-Means聚类是一个不断纠正的过程,聚类中心经过有限次移动,最终形成K种稳定的类别。
首先将输入的数据分为K类,接着随机选取K个初始基准点,并计算各个点与初始点的距离,接着在初始点一定范围内再次选取新的基准点,重复这个过程,直到新旧两个基准点的距离在可接受范围内,说明此时各类别已经稳定,聚类操作完成。
初始基准点一般采取随机选取的方式,也可以在随机选取第一个点后,选取一定条件下,距离最远的点作为其余初始基准点,这样做是依据经验,距离足够远的两点,分别属于不同类别。
上述一直提到的距离一般选取欧氏距离,也就是平时观念上两点间的距离,它的优点就是易于计算,简单明确。
K-Means分类的结果与输入数据本身有很大关系,如果数据本身的差异性强,那么K-Means可以很快完成分类操作,并且可以取得不错的效果,反之,输入的数据差异性小,K-Means将花费更多的时间,并且结果可能并不理想。这也说明在进行无监督分类之前,需要先进行数据特征提取。
L-分类结果的评价方法采用匈牙利算法,该算法将K-Means产生的类别与正确类别对应起来,进而计算分类的精确度。
实施例一
Salinas数据集的无监督分类实例:
实验中使用到的Salinas数据集是由美国航天局的成像光谱仪AVIRIS所拍摄,图中地区为加利福尼亚州南部的萨利纳斯山谷。去除部分干扰波段后,该数据集的空间尺寸为512×217个像素点,空间分辨率达到了3.7m。除去背景之后,Salinas数据集总共有54129个地物像素点,其中主要包含葡萄园、休耕地等16种不同类别的地表事物。表4-1展示了地表事物的所属类别、数量与对应的类别颜色。图3(a)为Salinas数据集的伪彩图;图3(b)为Salinas数据集的地物分布图;图3(c)为Salinas数据集的光谱曲线。
表1 Salinas数据集类别和抽样
将高光谱图像数据按照光谱维度分成8个小段,其中前4段作为训练数据,后4段作为目标数据,即待预测数据,如图4所示。
编码器输出维度设置为3,即每个25维的小段经过编码器之后,输出维度为3的数据,当使用完整数据输入时,编码之后的数据维度为24。
在实验过程中,分别采用波动法、错位法和乱序法三种方式生成负样本的比例,由随机数决定,这可以有效地避免算法使用单一的负样本特征。本次实验每批次选取16个样本,其中正负样本各一半。
预测数据与待预测数据进行点积运算,显然两部分数据越相似,结果越大,因而在这个基础上,用Sigmoid函数使其结果限定在[0,1]的范围内,作为模型的输出。
实验结果及分析如下:
分别对原数据、使用自编码特征提取的数据以及使用对比预测编码特征提取的数据进行无监督分类,实验结果对比图见图5,其中(a)为Salinas数据集真实标签图,(b)为原数据分类结果图,(c)为自编码特征提取数据分类结果图,(d)为对比预测编码特征提取数据分类结果图,分类结果数据详见表2。
表4-2 Salinas数据集的分类结果
使用对比预测编码的平均分类精确度为76.68%,使用自编码的平均分类精确度为70.87%,原数据的分类平均精确度为61.42%。对比预测编码的平均分类精度较自编码提升6%,较原数据提升15%,其Kappa系数为70.44%,可以认为该分类结果与真实标签高度一致。
实验结果表明,对比预测编码可以进行有效的无监督特征提取,并且无监督特征提取的效果要优于自编码,分类结果十分优秀。
实施例二
Indian Pines数据集无监督分类实例:
实验使用了最早用于高光谱图像分类检测的Indian Pines数据集。此数据集也由成像光谱仪AVIRIS拍摄,图中是美国印第安纳州的一片松树林。去除部分干扰波段后,该数据集的空间尺度为145×145个像素点,空间分辨率可达20米。该数据集的光谱分辨率是10nm,波长在0.4~2.5μm之间,共携带224个光谱通道。除去背景之后,Indian Pines数据集总共有10249个地物像素点,主要包括道路、树林等16个不同类别的地物。表3给出了各类地物的类别、样本数量以及对应的类别颜色,图6(a)、(b)、(c)显示了其伪彩色图、地物分布图、以及各类别的光谱曲线。
表3 Indian Pines数据集类别和抽样
本次实验中,将高光谱图像数据按照光谱维度分成8个小段,其中前4段作为训练数据,后4段作为目标数据,即待预测数据,如图7所示。
编码器输出维度设置为5,即每个25维的小段经过编码器之后,输出维度为5的数据,当使用完整数据输入时,编码之后的数据维度为40。
在本次实验中,同样采用波动法、错位法以及乱序法这三种方式生成负样本的方法,三种方法的选取比例由随机数决定。本次实验每批次选取16个样本,其中正负样本各一半。
实验结果及分析:
分别对原数据、使用自编码特征提取的数据以及使用对比预测编码特征提取的数据进行无监督分类,实验结果对比图如图8所示,其中(a)为Indian Pines数据集真实标签图,(b)为原数据分类结果图,(c)为使用自编码特征提取数据分类结果图,(d)为使用对比预测编码特征提取数据分类结果图,分类结果数据详见表4。
表4 Indian Pines数据集的分类结果
使用对比预测编码的平均分类精确度为41.56%,使用自编码的平均分类精确度为37.25%,原数据的分类平均精确度为36.55%。对比预测编码的平均分类精度较自编码提升4%,较原数据提升5%,其Kappa系数为34.74%,可以认为该分类结果与真实标签一般一致。
实验结果表明,对比预测编码可以进行有效的无监督特征提取,并且无监督特征提取的效果要优于自编码。需要注意的是IndianPines数据集样本量小,分类难度很大。对比预测编码作为无监督算法,与自编码、原数据的分类结果相比已经有了明显提升。这足以说明,该方法特征提取的能力潜力很大。
以上对本发明所提供的一种基于深度学习的无监督高光谱图像分类方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (2)
1.一种基于深度学习的无监督高光谱图像分类方法,其特征在于,包括如下步骤:
S1、引入高光谱图像的负样本,结合原始高光谱图像构成高光谱图像样本,将高光谱图像样本划分为训练数据和待预测数据,并对分别对二者进行维度压缩,得到压缩后的训练数据和待预测数据;训练数据和待预测数据分别经过对比预测编码器压缩至低维空间,即进行特征提取;
S2、对压缩后的训练数据进行自回归,生成上下文信息;
S3、根据上下文信息和压缩后待预测数据之间的互信息进行高光谱图像样本的自身预测,得到用于特征提取的对比预测编码器;通过损失计算调整对比预测编码器权重,包括:压缩后的训练数据通过自回归模型得到上下文信息,经过对比预测编码器得到预测数据,预测数据与待预测数据点积计算损失,计算的损失反馈给对比预测编码,修改对比预测编码器各卷积层的权重;
S4、将预测编码器应用在待分类高光谱图像上,得到特征数据,使用K-Means聚类算法,对特征数据进行无监督分类。
2.根据权利要求1所述的一种基于深度学习的无监督高光谱图像分类方法,其特征在于,所述S1中负样本获取的方法包括波动法、乱序法和错位法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010622917.0A CN111783884B (zh) | 2020-06-30 | 2020-06-30 | 基于深度学习的无监督高光谱图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010622917.0A CN111783884B (zh) | 2020-06-30 | 2020-06-30 | 基于深度学习的无监督高光谱图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111783884A CN111783884A (zh) | 2020-10-16 |
CN111783884B true CN111783884B (zh) | 2024-04-09 |
Family
ID=72760462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010622917.0A Active CN111783884B (zh) | 2020-06-30 | 2020-06-30 | 基于深度学习的无监督高光谱图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111783884B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112668627A (zh) * | 2020-12-24 | 2021-04-16 | 四川大学 | 一种基于对比学习的大规模图像在线聚类系统及方法 |
CN112905823B (zh) * | 2021-02-22 | 2023-10-31 | 深圳市国科光谱技术有限公司 | 一种基于大数据平台的高光谱物质检测识别系统及方法 |
CN113269282A (zh) * | 2021-07-21 | 2021-08-17 | 领伟创新智能系统(浙江)有限公司 | 一种基于自动编码器的无监督图像分类方法 |
CN113679393B (zh) * | 2021-08-25 | 2023-05-26 | 南京信息工程大学 | 基于对比预测编码的ecg数据特征生成模型 |
CN114638987A (zh) * | 2022-03-09 | 2022-06-17 | 浙江大学 | 一种基于对比学习光谱特征提取的金属材质识别方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102930533A (zh) * | 2012-10-09 | 2013-02-13 | 河海大学 | 一种基于改进k-均值聚类的半监督高光谱影像降维方法 |
CN104298999A (zh) * | 2014-09-30 | 2015-01-21 | 西安电子科技大学 | 基于递归自动编码的高光谱特征学习方法 |
WO2017161892A1 (zh) * | 2016-03-23 | 2017-09-28 | 深圳大学 | 一种高光谱遥感图像的分类方法及其系统 |
CN107832793A (zh) * | 2017-11-08 | 2018-03-23 | 深圳大学 | 一种高光谱图像的分类方法及系统 |
CN109583469A (zh) * | 2018-10-17 | 2019-04-05 | 浙江工业大学 | 基于互信息的k均值高光谱图像波段聚类方法 |
CN109753973A (zh) * | 2018-12-21 | 2019-05-14 | 西北工业大学 | 基于加权支持向量机的高光谱图像变化检测方法 |
CN110008948A (zh) * | 2019-04-15 | 2019-07-12 | 西安电子科技大学 | 基于变分自编码网络的高光谱图像目标检测方法 |
CN110782018A (zh) * | 2019-10-28 | 2020-02-11 | 北京环境特性研究所 | 基于自编码器的光谱降维方法和装置 |
CN111160526A (zh) * | 2019-12-18 | 2020-05-15 | 河海大学 | 基于mape-d环形结构的深度学习系统在线测试方法与装置 |
CN111242056A (zh) * | 2020-01-16 | 2020-06-05 | 陕西师范大学 | 一种最大-最小距离嵌入的无监督高光谱图像分类方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9946931B2 (en) * | 2015-04-20 | 2018-04-17 | Los Alamos National Security, Llc | Change detection and change monitoring of natural and man-made features in multispectral and hyperspectral satellite imagery |
-
2020
- 2020-06-30 CN CN202010622917.0A patent/CN111783884B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102930533A (zh) * | 2012-10-09 | 2013-02-13 | 河海大学 | 一种基于改进k-均值聚类的半监督高光谱影像降维方法 |
CN104298999A (zh) * | 2014-09-30 | 2015-01-21 | 西安电子科技大学 | 基于递归自动编码的高光谱特征学习方法 |
WO2017161892A1 (zh) * | 2016-03-23 | 2017-09-28 | 深圳大学 | 一种高光谱遥感图像的分类方法及其系统 |
CN107832793A (zh) * | 2017-11-08 | 2018-03-23 | 深圳大学 | 一种高光谱图像的分类方法及系统 |
CN109583469A (zh) * | 2018-10-17 | 2019-04-05 | 浙江工业大学 | 基于互信息的k均值高光谱图像波段聚类方法 |
CN109753973A (zh) * | 2018-12-21 | 2019-05-14 | 西北工业大学 | 基于加权支持向量机的高光谱图像变化检测方法 |
CN110008948A (zh) * | 2019-04-15 | 2019-07-12 | 西安电子科技大学 | 基于变分自编码网络的高光谱图像目标检测方法 |
CN110782018A (zh) * | 2019-10-28 | 2020-02-11 | 北京环境特性研究所 | 基于自编码器的光谱降维方法和装置 |
CN111160526A (zh) * | 2019-12-18 | 2020-05-15 | 河海大学 | 基于mape-d环形结构的深度学习系统在线测试方法与装置 |
CN111242056A (zh) * | 2020-01-16 | 2020-06-05 | 陕西师范大学 | 一种最大-最小距离嵌入的无监督高光谱图像分类方法 |
Non-Patent Citations (1)
Title |
---|
一种基于变分自编码器的高光谱图像分类方法;徐朋磊;薛朝辉;车子杰;;现代测绘(第01期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111783884A (zh) | 2020-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111783884B (zh) | 基于深度学习的无监督高光谱图像分类方法 | |
CN111368896B (zh) | 基于密集残差三维卷积神经网络的高光谱遥感图像分类方法 | |
Basu et al. | Deepsat: a learning framework for satellite imagery | |
Cheriyadat | Unsupervised feature learning for aerial scene classification | |
CN107145836B (zh) | 基于栈式边界辨别自编码器的高光谱图像分类方法 | |
CN107679250A (zh) | 一种基于深度自编码卷积神经网络的多任务分层图像检索方法 | |
CN111680176A (zh) | 基于注意力与双向特征融合的遥感图像检索方法及系统 | |
CN113723255B (zh) | 一种高光谱影像分类方法和存储介质 | |
CN107239759B (zh) | 一种基于深度特征的高空间分辨率遥感图像迁移学习方法 | |
Li et al. | Structure-aware collaborative representation for hyperspectral image classification | |
CN111626267B (zh) | 一种利用空洞卷积的高光谱遥感图像分类方法 | |
CN113988147B (zh) | 基于图网络的遥感图像场景多标签分类方法及装置、多标签检索方法及装置 | |
CN114937173A (zh) | 一种基于动态图卷积网络的高光谱图像快速分类方法 | |
CN112949416A (zh) | 一种监督的高光谱多尺度图卷积分类方法 | |
CN113378971A (zh) | 近红外光谱的分类模型训练方法、系统及分类方法、系统 | |
Uehara et al. | Object detection of satellite images using multi-channel higher-order local autocorrelation | |
Dong et al. | Joint contextual representation model-informed interpretable network with dictionary aligning for hyperspectral and LiDAR classification | |
CN116797787A (zh) | 基于跨模态融合与图神经网络的遥感影像语义分割方法 | |
Alshehri | A content-based image retrieval method using neural network-based prediction technique | |
CN107273919A (zh) | 一种基于置信度构造类属字典的高光谱无监督分类方法 | |
CN116977747B (zh) | 基于多路多尺度特征孪生网络的小样本高光谱分类方法 | |
CN103955711A (zh) | 一种成像光谱目标识别分析中的模式识别方法 | |
Dai et al. | Research on hyper-spectral remote sensing image classification by applying stacked de-noising auto-encoders neural network | |
CN107273793A (zh) | 一种用于人脸识别的特征提取方法 | |
Shi et al. | Intelligent classification of land cover types in open-pit mine area using object-oriented method and multitask learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |