CN110210412B

CN110210412B - 一种基于深度学习和多示例学习的高光谱影像分类方法

Info

Publication number: CN110210412B
Application number: CN201910482614.0A
Authority: CN
Inventors: 高红民; 姚丹; 杜星熠; 李臣明; 杨耀; 王明霞; 缪雅文
Original assignee: Hohai University HHU
Current assignee: Hohai University HHU
Priority date: 2019-06-04
Filing date: 2019-06-04
Publication date: 2022-08-26
Anticipated expiration: 2039-06-04
Also published as: CN110210412A

Abstract

本发明公开了一种基于深度学习和多示例学习的高光谱影像分类方法，包括以下步骤：S1：对高光谱影像进行预处理，删去部分冗余的波段；S2：对步骤S1得到的预处理后的高光谱影像进行特征提取，得到示例特征；S3：将步骤S2得到的示例特征映射为图像包的示例特征；S4：对步骤S3得到的图像包的示例特征进行分类。本发明能够提高特征提取效率和分类精度。

Description

一种基于深度学习和多示例学习的高光谱影像分类方法

技术领域

本发明涉及高光谱影像分类方法，特别是涉及一种基于深度学习和多示例学习的高光谱影像分类方法。

背景技术

一般来说，高光谱数据分类过程包括特征提取和分类两个过程。经特征提取后得到的特征对地物特性的描述更加精确，测度更加细致，对分类器性能的发挥起到至关重要的作用。

目前常用的监督分类方法有最小距离分类、支持向量机及神经网络等。在较长的一段时间内，SVM在处理高光谱图像分类任务中占主导地位。Joachims等人提出了基于转导推理的SVM方法，在训练过程中不断改变SVM的超平面和其两边某些样本的标签，使SVM在已知样本和未知样本在特征空间中的距离最大。在传统的分类方法中，如神经网络、支持向量机等，它们只考虑了高光谱遥感图像的光谱特征信息，忽视了光谱数据的复杂性与多样性，追求了分类的高效性却忽视了数据的复杂从而可能带来的拟合现象。

多示例学习(multiple nstance learning)是20世纪90年代(Dietterich)等人在研究药物活性预测(drug activity prediction)问题时提出来的。每个特征向量称为一个示例，由一组示例组成的具有标记信息的样本称为包。如果包中所有的示例都为负标记，则将此包记作负包；如果包中至少有一个示例为正标记，则将此包记作正包。多示例学习的目的在于通过对由正包反包的训练数据集进行学习来预测未知包是正包还是负包，即对未知的包进行正确的分类。对多示例学习的现有运用中，多为医学中的三通道算法，此算法通道数和数据运算量较少，所以转化效率尚可，运用SVM分类的效果也尚可，但对于高光谱影像高达几百通道的数据来说，简单的包转化函数并不能起到原有的效果，并且分类器的选择也有了新的要求。现有技术中的高光谱影像分类方法的特征提取效率和分类精度都不够。

发明内容

发明目的：本发明的目的是提供一种基于深度学习和多示例学习的高光谱影像分类方法，能够提高特征提取效率和分类精度。

技术方案：为达到此目的，本发明采用以下技术方案：

本发明所述的基于深度学习和多示例学习的高光谱影像分类方法，包括以下步骤：

S1：对高光谱影像进行预处理，删去部分冗余的波段；

S2：对步骤S1得到的预处理后的高光谱影像进行特征提取，得到示例特征；

S3：将步骤S2得到的示例特征映射为图像包的示例特征；

S4：对步骤S3得到的图像包的示例特征进行分类。

所述步骤S2具体包括以下步骤：

S21：将卷积神经网络从输入到输出的方向上设置第一卷积层、第一池化层、第二卷积层和第二池化层，第一卷积层与第一池化层之间设置第一BN层和第一激活函数层，第二卷积层和第二池化层之间设置第二BN层和第二激活函数层；

S22：第一卷积层和第二卷积层进行卷积操作之后不再进行卷积操作，判断第二激活函数层输出数据的维数是否为一：如果第二激活函数层输出数据的维数是一，则结束；如果第二激活函数层输出数据的维数不是一，则在第二激活函数层与第二池化层之间增加Flatten层，然后进行步骤S23；

S23：在Flatten层后增加第一全连接层、第二全连接层和第三全连接层，在第一全连接层与第二全连接层之间增加第三BN层，在第二全连接层与第三全连接层之间增加第四BN层，每个全连接层的标准差取2/w，第三全连接层的输出数据即为示例特征；其中，w为相应全连接层的前一层输出数据的维数。

所述步骤S3中，通过包转化函数将步骤S2得到的示例特征映射为图像包的示例特征，包转化函数如式(1)所示：

式(1)中，B_u为映射得到的第u个图像包的示例特征，h_uv为第u个图像包第v维的所有示例特征，x₁为第一BN层的输入数据的第一个示例特征，x_p为第一BN层的输入数据的第p个示例特征，n_u为第u个图像包的总维数。

进一步，所述步骤S21中，第一激活函数层和第二激活函数层中均设有激活函数，其中第一激活函数层的激活函数的表达式如式(2)所示：

f(x)＝max(0，x) (2)

式(2)中，f(x)为第一激活函数层的激活函数的表达式，也即为第一激活函数层的输出数据；x为第一BN层的输入数据。

进一步，所述第一卷积层的输出为第一特征图，第一特征图的第i行第j列元素通过式(3)得到：

式(3)中，a_i，j为第一特征图的第i行第j列元素，w_m，n为第一卷积核的第m行第n列权重，l_i+m，j+n为步骤S1中高光谱影像的第i+m行第j+n列元素，w_b为第一卷积核的偏置项。

进一步，所述步骤S4中，通过式(4)所示函数对图像包的示例特征进行分类：

式(4)中，B_v为映射得到的第v个图像包的示例特征，k为图像包的示例特征的维数。

有益效果：本发明公开了一种基于深度学习和多示例学习的高光谱影像分类方法，在使用同等数据量的情况下，能够一定程度的提高特征提取效率和分类精度，有一定的实际应用价值。

附图说明

图1为本发明具体实施方式中方法的流程图；

图2为本发明具体实施方式中四组实验的分类精度曲线图；

图2(a)为实验一的分类精度曲线图；

图2(b)为实验二的分类精度曲线图；

图2(c)为实验三的分类精度曲线图；

图2(d)为实验四的分类精度曲线图；

图3为本发明具体实施方式中Softmax分类器与SVM-BRF分类器的分类精度对比图。

具体实施方式

下面结合具体实施方式对本发明的技术方案作进一步的介绍。

本具体实施方式公开了一种基于深度学习和多示例学习的高光谱影像分类方法，如图1所示，包括以下步骤：

S1：对高光谱影像进行预处理，删去部分冗余的波段；本具体实施方式选择了Indian_pines影像，选择了删去水吸收波段以及严重破坏的波段103～～107、149～～162，共选择196个波段进行实验；

S3：将步骤S2得到的示例特征映射为图像包的示例特征；

S4：对步骤S3得到的图像包的示例特征进行分类。

步骤S2具体包括以下步骤：

步骤S3中，通过包转化函数将步骤S2得到的示例特征映射为图像包的示例特征，包转化函数如式(1)所示：

步骤S21中，第一激活函数层和第二激活函数层中均设有激活函数，其中第一激活函数层的激活函数的表达式如式(2)所示：

f(x)＝max(0，x) (2)

第一卷积层的输出为第一特征图，第一特征图的第i行第j列元素通过式(2)得到：

步骤S4中，通过式(4)所示函数对图像包的示例特征进行分类：

本具体实施方式通过对比四组不同的实验来说明本方法的有效性，第一组为无BN层、无激活函数；第二组为有BN层、无激活函数；第三组为无BN层、有激活函数；第四组为有BN层、有激活函数，为保证实验的客观性，分类器使用Softmax分类器；迭代次数为200，初始学习率为0.01，训练样本和测试样本为3∶1，四组实验的对比结果如表1所示：

表1结果对比

实验从四种不同的卷积部分进行实验，并充分考虑无关因素对实验造成的影像，保证了无关变量的统一性，通过多次实验求取的平均值可以看出实验四虽花费的时间最长但分类精度效果最好；实验三虽总时长较实验四有所优势但缺少激活函数提升非线性表达能力使得分类精度略有下降；实验二缺少了BN层的归一化对实验的约束，效果不太理想；实验一为单纯的卷积的特征提取，缺少相应函数对数据的改造，分类效果最差；可以看出具有归一化及激活函数的卷积方法效果较其他方法有了明显的提升。

四组实验的分类结果图如图2(a)-图2(d)所示，可以直观的看出，本实验采取的方法优于其他三种方法。

在前述实验的效果较好的卷积层的基础上，将转化过的包特征转化后的特征分别通过Sofimax分类器以及RBF-SVM分类器进行对比，实验采取Indian_pines遥感影像数据集作为输入，用于对比的SVM算法采取的是libsvm实现的，采用RBF作为核函数，具体对比结果如表2所示：

表2分类结果

实验从两种不同分类器的分类情况作了对比，为了保持实验的外部无关性，保持的无关变量的相同，有实验数据可以看出Softmax分类器与SVM-BRF分类器相比，时间的优势明显，并且如图3所示，精度也有所提升。故本方法可以较为明显的提高分类效率及其分类精度。

由上述实验结果可以看出，本方法较常规方法相比效率较高分类效果较好。

Claims

1.一种基于深度学习和多示例学习的高光谱影像分类方法，其特征在于：包括以下步骤：

S1：对高光谱影像进行预处理，删去部分冗余的波段；

S3：将步骤S2得到的示例特征映射为图像包的示例特征；

S4：对步骤S3得到的图像包的示例特征进行分类，

所述步骤S2具体包括以下步骤：

S23：在Flatten层后增加第一全连接层、第二全连接层和第三全连接层，在第一全连接层与第二全连接层之间增加第三BN层，在第二全连接层与第三全连接层之间增加第四BN层，每个全连接层的标准差取2/w，第三全连接层的输出数据即为示例特征；其中，w为相应全连接层的前一层输出数据的维数，

2.根据权利要求1所述的基于深度学习和多示例学习的高光谱影像分类方法，其特征在于：所述步骤S21中，第一激活函数层和第二激活函数层中均设有激活函数，其中第一激活函数层的激活函数的表达式如式(2)所示：

f(x)＝max(0，x) (2)

3.根据权利要求2所述的基于深度学习和多示例学习的高光谱影像分类方法，其特征在于：所述第一卷积层的输出为第一特征图，第一特征图的第i行第j列元素通过式(3)得到：

4.根据权利要求1所述的基于深度学习和多示例学习的高光谱影像分类方法，其特征在于：所述步骤S4中，通过式(4)所示函数对图像包的示例特征进行分类：