CN111783884B

CN111783884B - 基于深度学习的无监督高光谱图像分类方法

Info

Publication number: CN111783884B
Application number: CN202010622917.0A
Authority: CN
Inventors: 郭延辉; 智绪威; 曲富丽; 于谦
Original assignee: Shandong Womens University
Current assignee: Shandong Womens University
Priority date: 2020-06-30
Filing date: 2020-06-30
Publication date: 2024-04-09
Anticipated expiration: 2040-06-30
Also published as: CN111783884A

Abstract

本发明公开的一种基于深度学习的无监督高光谱图像分类方法，包括引入高光谱图像的负样本，结合原始高光谱图像构成高光谱图像样本，将高光谱图像样本划分为训练数据和待预测数据，并进行维度压缩，得到压缩后的训练数据和待预测数据；对压缩后的训练数据进行自回归，生成上下文信息；根据上下文信息和压缩后待预测数据之间的互信息进行高光谱图像样本的自身预测，得到对比预测编码器；将预测编码器应用在待分类高光谱图像上，得到特征数据，使用K‑Means聚类算法，对特征数据进行无监督分类。本发明避免了繁重的数据标注工作，提高了高光谱图像无监督分类的精确性。

Description

基于深度学习的无监督高光谱图像分类方法

技术领域

本发明属于遥感通信技术领域，涉及一种基于深度学习的无监督高光谱图像分类方法。

背景技术

遥感技术是指利用航天设备携带的传感器采集地表信息的勘测技术。自兴起以来，遥感技术发展十分迅速，遥感传感器收集数据经历了由光学拍摄到计算机扫描的跨越，这使得遥感图像可以包含更多角度、更大范围内的地表信息。与传统航拍图像不同，遥感图像同时携带光谱信息和空间信息，能够实现图谱合一。按照光谱分辨率不同，通常将遥感图像划分为：多光谱图像、高光谱图像、超光谱图像三类。目前应用最广泛的是高光谱图像。

成像光谱仪的快速发展促进了多光谱遥感探测转向高光谱遥感探测的进程，遥感探测技术也由宽波探测拓展到窄波探测。高光谱图像比多光谱图像包含更为细致的地表信息，其覆盖从可见光至中红外波段的电磁波，拥有纳米级光谱分辨率。最重要的是高光谱图像提升了地表建筑的可分辨率，也就是说，在宽波中无法被探测识别的物体，在窄波中可以被探测识别。不仅如此，因为不同物体对成像传感器发出的电磁波产生的回应程度不同，所以地表各类建筑在高光谱图像中具有不同的光谱信息，借助这个特性，可以实现地表建筑有效分类。

高光谱图像在诸多行业之中被普遍运用。在军事方面，依靠高分辨率光谱信息，可以探测伪装的军事工程，掌握敌方军事部署。在民用方面，高光谱图像被应用在：污染检测、地质调查、资源勘探等领域。正确处理和识别高光谱图像中包含的信息是将其优势发挥的关键。需要知道，高光谱图像包含丰富信息的同时，也伴随着数据冗余性高、数据关联性强、“同物异谱”和“同谱异物”等缺陷，这无疑加重了识别分类的难度。从冗余数据中，提取数据特征是提高识别分类效率的重要方式。

目前高光谱图像分类问题，采用有监督分类算法已经取得了相当不错的成绩，采用有监督分类算法对高光谱图像进行分类的精度已经达到99％以上，这充分说明了有监督分类算法的有效性。但是有监督分类算法最大的特点也是其最大的短板，它要求输入的高光谱图像要事先标注好类别。我们知道高光谱图像本身结构复杂，一般采取人工标注的方式获取标签，数据预处理这部分工作耗时耗力，成本很大。标签的存在，使得高光谱图像本身携带的信息结构被忽视。

因此，提供一种避免了繁重的数据标注工作，提高高光谱图像分类精确性的基于深度学习的无监督高光谱图像分类方法是本领域技术人员亟待解决的技术问题。

发明内容

本发明针对上述研究现状和存在的问题，提供了一种基于深度学习的无监督高光谱图像分类方法，选择合适的无监督特征提取算法，分析将其应用于高光谱图像上的可行性。使用无监督特征提取算法得到的数据，采用K-Means算法对这部分数据进行无监督分类，根据高光谱图像的特点，优化算法结构，并评价特征提取算法的效率及分类结果的精确度。

为实现上述目的其具体方案如下：

一种基于深度学习的无监督高光谱图像分类方法，包括如下步骤：

S1、引入高光谱图像的负样本，结合原始高光谱图像构成高光谱图像样本，将高光谱图像样本划分为训练数据和待预测数据，并对分别对二者进行维度压缩，得到压缩后的训练数据和待预测数据；

S2、对压缩后的训练数据进行自回归，生成上下文信息；

S3、根据上下文信息和压缩后待预测数据之间的互信息进行高光谱图像样本的自身预测，得到用于特征提取的对比预测编码器；

S4、将预测编码器应用在待分类高光谱图像上，得到特征数据，使用K-Means聚类算法，对特征数据进行无监督分类。

优选的，所述S1还包括训练数据和待预测数据分别经过对比预测编码器压缩至低维空间，即进行特征提取。

优选的，所述S3还包括通过损失计算调整对比预测编码器权重的步骤：

压缩后的训练数据通过自回归模型得到上下文信息，经过对比预测编码器得到预测数据，预测数据与待预测数据点积计算损失，计算的损失反馈给对比预测编码，修改对比预测编码器各卷积层的权重。

优选的，所述S1中负样本获取的方法包括波动法、乱序法和错位法。

本发明相较现有技术具有以下有益效果：

本发明为了进一步挖掘高光谱图像的差异性特征，在训练过程中引入负样本，这样可以有效地提升特征提取效果，可以保证对比学习的有效性；本发明还充分利用了高光谱图像的互信息，提高了无监督高光谱图像分类精确度；同时对比预测编码器将高光谱图像样本映射到紧凑的潜在空间，进行特征提取，使得特征更加明显，便于算法后续处理。高光谱图像数据具有冗余性特点，必须进行特征提取才可以发挥高光谱图像丰富信息的优势，使得特征提取是必要的操作，适合运用对比预测编码进行无监督特征提取。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1是本发明基于深度学习的无监督高光谱图像分类方法的流程图；

图2是本发明正负样本光谱对比图；

图3是本发明实施例提供的Salinas数据集示意图；

图4是本发明实施例提供的Salinas数据集样本划分示意图；

图5是本发明实施例提供的Salinas数据集分类结果对比图；

图6是本发明实施例提供的IndianPines数据集示意图；

图7是本发明实施例提供的IndianPines数据集样本划分示意图；

图8是本发明实施例提供的IndianPines数据集分类结果对比图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参见附图1，对比预测编码应用在高光谱图像分类的工作流程，首先将原始数据划分为两部分，如图1中所示的Date_x与Date_y，然后编码器将它们映射到更加紧凑的潜在空间得到表征数据Encoder_x与Encoder_y，接着把Encoder_x放入自回归模型得到上下文信息Context，进而得到预测值Date_pred，最后与Encoder_y一起计算预测损失值。显然只有编码器提取到有效地的特征，预测数据和待预测数据之间的误差才会减小。

具体执行过程如下：

S1、引入高光谱图像的负样本，结合原始高光谱图像构成高光谱图像样本，将高光谱图像样本划分为训练数据和待预测数据，其中训练数据和待预测数据内部进一步划分为若干小段，并对分别对二者进行维度压缩，得到压缩后的训练数据和待预测数据。

对比预测编码要求输入的数据同时包含正负样本，以便进行对比学习。因为这是无监督学习算法，所以这里的负样本不是指标签错乱的样本。算法关注的是数据本身丰富的信息，尤其是上下文联系，因此，负样本可以减弱或破坏这部分信息。如图2所示，采用波动法，使负样本后半部分波段进行随机震荡，使其与正样本波段产生明显差异。产生负样本的方法还有：错位法、乱序法等。

负样本生成策略如下：

(1)波动法

随机生成4个范围是[-1,1]的随机数，接着乘以被选中样本的待预测数据，从而实现负样本生成。

(2)错位法

随机选取两个样本，将它们的待预测数据部分交换，从而构成两个新的负样本数据。

(3)乱序法

乱序法与前两种方法不同，它并不改变选中数据的波段值，而是生成一个随机交换序列，按照生成的索引，改变待预测数据的顺序，达到生成负样本的目的。

这种通过改变正常光谱波段产生的负样本，与正常样本有明显差异，这就使得算法可以对比正负样本进行特征提取。仅仅输入正样本，算法很容易陷入过拟合的情形，而负样本的出现，可以修改某些泛特征的权重，使算法可以进一步挖掘样本之间的差异性特征，即光谱间可以相互区分的特征。负样本的训练数据生成的预测数据与其待预测部分是不同的，因此，迫使编码器去学习光谱更多的特征，以此提高编码器特征提取的效果。

编码器由一系列一维卷积层构成，他们之间权重会随着训练不断修正，直到输入的高纬数据可以被输出的低纬数据表示。

下面给出对比预测编码器进行数据维度压缩的一种示例：

编码器的输入数据维度示例：

输入(？,4,25,1)->输出(？,4,5)

其中，输入(？,4,25,1)中：

？：表示一批输入的数量；

4：训练数据或待预测数据内部再分成4个小段；

(25,1)：表示25x1的数据向量(光谱的部分波段)；

输出(？,4,5)中：

？：表示一批输出的数量；

4：与输入对于的再分小段；

5：被压缩后的数据维度。

数据维度的压缩过程不仅限于上述一种示例。

S2、对压缩后的训练数据进行自回归，生成上下文信息。

对比预测编码要求输入样本可以通过上下文信息进行自身其他信息的预测。换句话说，样本数据前后信息要有关联性，最理想的样本就是序列化数据。序列化数据的好处，在于可以通过上下文去推测其他部分数据。对比预测编码中，使用到的自回归模型可以得到上下文数据，并且可以进行其他部分数据的预测。实际上就是基于序列化数据的上下文数据与其他部分数据之间包含丰富的互信息。高光谱图像是天然的序列化数据，满足自我预测的要求。

S3、根据上下文信息和压缩后待预测数据之间的互信息进行高光谱图像样本的自身预测，得到用于特征提取的对比预测编码器。

上下文信息数据输入到一个含有若干个全连接层的网络中(这里的数目待预测数据内部再分小段的数据对应，如，待预测数据内部划分为6个小段，这里全连接层的数目也为6)。

上下文数据与待预测数据之间的互信息：

其中，I为互信息函数，c为上下文信息，x为压缩后待预测数据。

对比预测编码并没有直接使用生成模型计算预测概率，而是设计了一个密度比，维持上下文数据与待预测数据之间的互信息，来表示表征是真实数据与随机采样的可能性之比：

上下文预测模型：

f_k为预测精确度，x_t+k为被压缩后的待预测数据，c_t为上下文信息。

这里采用简单的双线性模型：

下面给出利用互信息进行高光谱图像样本的自身预测的一种示例：

训练数据(？,4,3),待预测数据(？,3,3)

生成上下文信息输入输出维度示例：

输入(？,4,3)->输出(？,30)

预测数据输入输出维度示例：

输入(？,30)->输出(？,3,3)(预测数据)

需要说明的是，训练数据与待预测数据的划分可以平均划分，也可以采用其它比例进行划分。

使用噪声对比估计优化编码器和自回归模型，损失函数为：

损失函数L_N用于修正整个神经网络的权重，包括特征提取步骤(数据压缩->降维)、生成上下文数据步骤(自回归模型)、以及数据预测步骤。

对比预测编码利用自身的互信息，提高自身预测能力的同时，强化了编码器的特征提取能力，尤其是对序列化数据，特征提取效果相当不错。

S3还包括通过损失计算调整对比预测编码器权重的步骤：

压缩后的训练数据通过自回归模型得到上下文信息，经过对比预测编码器得到预测数据，预测数据与待预测数据点积计算损失，反映的是正样本预测精度与负样本预测精度之比。计算的损失反馈给对比预测编码，修改对比预测编码器各卷积层的权重。点积计算损失是预测精度损失，聚焦的是每次预测的损失情况。

K-Means聚类是一个不断纠正的过程，聚类中心经过有限次移动，最终形成K种稳定的类别。

首先将输入的数据分为K类，接着随机选取K个初始基准点，并计算各个点与初始点的距离，接着在初始点一定范围内再次选取新的基准点，重复这个过程，直到新旧两个基准点的距离在可接受范围内，说明此时各类别已经稳定，聚类操作完成。

初始基准点一般采取随机选取的方式，也可以在随机选取第一个点后，选取一定条件下，距离最远的点作为其余初始基准点，这样做是依据经验，距离足够远的两点，分别属于不同类别。

上述一直提到的距离一般选取欧氏距离，也就是平时观念上两点间的距离，它的优点就是易于计算，简单明确。

K-Means分类的结果与输入数据本身有很大关系，如果数据本身的差异性强，那么K-Means可以很快完成分类操作，并且可以取得不错的效果，反之，输入的数据差异性小，K-Means将花费更多的时间，并且结果可能并不理想。这也说明在进行无监督分类之前，需要先进行数据特征提取。

L-分类结果的评价方法采用匈牙利算法，该算法将K-Means产生的类别与正确类别对应起来，进而计算分类的精确度。

实施例一

Salinas数据集的无监督分类实例：

实验中使用到的Salinas数据集是由美国航天局的成像光谱仪AVIRIS所拍摄,图中地区为加利福尼亚州南部的萨利纳斯山谷。去除部分干扰波段后，该数据集的空间尺寸为512×217个像素点，空间分辨率达到了3.7m。除去背景之后，Salinas数据集总共有54129个地物像素点，其中主要包含葡萄园、休耕地等16种不同类别的地表事物。表4-1展示了地表事物的所属类别、数量与对应的类别颜色。图3(a)为Salinas数据集的伪彩图；图3(b)为Salinas数据集的地物分布图；图3(c)为Salinas数据集的光谱曲线。

表1 Salinas数据集类别和抽样

将高光谱图像数据按照光谱维度分成8个小段，其中前4段作为训练数据，后4段作为目标数据，即待预测数据，如图4所示。

编码器输出维度设置为3，即每个25维的小段经过编码器之后，输出维度为3的数据，当使用完整数据输入时，编码之后的数据维度为24。

在实验过程中，分别采用波动法、错位法和乱序法三种方式生成负样本的比例，由随机数决定，这可以有效地避免算法使用单一的负样本特征。本次实验每批次选取16个样本，其中正负样本各一半。

预测数据与待预测数据进行点积运算，显然两部分数据越相似，结果越大，因而在这个基础上，用Sigmoid函数使其结果限定在[0,1]的范围内，作为模型的输出。

实验结果及分析如下：

分别对原数据、使用自编码特征提取的数据以及使用对比预测编码特征提取的数据进行无监督分类，实验结果对比图见图5，其中(a)为Salinas数据集真实标签图，(b)为原数据分类结果图，(c)为自编码特征提取数据分类结果图，(d)为对比预测编码特征提取数据分类结果图，分类结果数据详见表2。

表4-2 Salinas数据集的分类结果

使用对比预测编码的平均分类精确度为76.68％，使用自编码的平均分类精确度为70.87％，原数据的分类平均精确度为61.42％。对比预测编码的平均分类精度较自编码提升6％，较原数据提升15％，其Kappa系数为70.44％，可以认为该分类结果与真实标签高度一致。

实验结果表明，对比预测编码可以进行有效的无监督特征提取，并且无监督特征提取的效果要优于自编码，分类结果十分优秀。

实施例二

Indian Pines数据集无监督分类实例：

实验使用了最早用于高光谱图像分类检测的Indian Pines数据集。此数据集也由成像光谱仪AVIRIS拍摄，图中是美国印第安纳州的一片松树林。去除部分干扰波段后，该数据集的空间尺度为145×145个像素点，空间分辨率可达20米。该数据集的光谱分辨率是10nm，波长在0.4～2.5μm之间，共携带224个光谱通道。除去背景之后，Indian Pines数据集总共有10249个地物像素点，主要包括道路、树林等16个不同类别的地物。表3给出了各类地物的类别、样本数量以及对应的类别颜色，图6(a)、(b)、(c)显示了其伪彩色图、地物分布图、以及各类别的光谱曲线。

表3 Indian Pines数据集类别和抽样

本次实验中，将高光谱图像数据按照光谱维度分成8个小段，其中前4段作为训练数据，后4段作为目标数据，即待预测数据，如图7所示。

编码器输出维度设置为5，即每个25维的小段经过编码器之后，输出维度为5的数据，当使用完整数据输入时，编码之后的数据维度为40。

在本次实验中，同样采用波动法、错位法以及乱序法这三种方式生成负样本的方法，三种方法的选取比例由随机数决定。本次实验每批次选取16个样本，其中正负样本各一半。

实验结果及分析：

分别对原数据、使用自编码特征提取的数据以及使用对比预测编码特征提取的数据进行无监督分类，实验结果对比图如图8所示，其中(a)为Indian Pines数据集真实标签图，(b)为原数据分类结果图，(c)为使用自编码特征提取数据分类结果图，(d)为使用对比预测编码特征提取数据分类结果图，分类结果数据详见表4。

表4 Indian Pines数据集的分类结果

使用对比预测编码的平均分类精确度为41.56％，使用自编码的平均分类精确度为37.25％，原数据的分类平均精确度为36.55％。对比预测编码的平均分类精度较自编码提升4％，较原数据提升5％，其Kappa系数为34.74％，可以认为该分类结果与真实标签一般一致。

实验结果表明，对比预测编码可以进行有效的无监督特征提取，并且无监督特征提取的效果要优于自编码。需要注意的是IndianPines数据集样本量小，分类难度很大。对比预测编码作为无监督算法，与自编码、原数据的分类结果相比已经有了明显提升。这足以说明，该方法特征提取的能力潜力很大。

以上对本发明所提供的一种基于深度学习的无监督高光谱图像分类方法进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上，本说明书内容不应理解为对本发明的限制。

在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims

1.一种基于深度学习的无监督高光谱图像分类方法，其特征在于，包括如下步骤：

S1、引入高光谱图像的负样本，结合原始高光谱图像构成高光谱图像样本，将高光谱图像样本划分为训练数据和待预测数据，并对分别对二者进行维度压缩，得到压缩后的训练数据和待预测数据；训练数据和待预测数据分别经过对比预测编码器压缩至低维空间，即进行特征提取；

S2、对压缩后的训练数据进行自回归，生成上下文信息；

S3、根据上下文信息和压缩后待预测数据之间的互信息进行高光谱图像样本的自身预测，得到用于特征提取的对比预测编码器；通过损失计算调整对比预测编码器权重，包括：压缩后的训练数据通过自回归模型得到上下文信息，经过对比预测编码器得到预测数据，预测数据与待预测数据点积计算损失，计算的损失反馈给对比预测编码，修改对比预测编码器各卷积层的权重；

2.根据权利要求1所述的一种基于深度学习的无监督高光谱图像分类方法，其特征在于，所述S1中负样本获取的方法包括波动法、乱序法和错位法。