CN116977747A

CN116977747A - 基于多路多尺度特征孪生网络的小样本高光谱分类方法

Info

Publication number: CN116977747A
Application number: CN202311085390.2A
Authority: CN
Inventors: 杨京辉; 覃佳; 黎安奇
Original assignee: China University of Geosciences Beijing
Current assignee: China University of Geosciences Beijing
Priority date: 2023-08-28
Filing date: 2023-08-28
Publication date: 2023-10-31
Anticipated expiration: 2043-08-28
Also published as: CN116977747B

Abstract

本发明公开了一种基于多路多尺度特征孪生网络的小样本高光谱分类方法，包括以下步骤：读入高光谱图像数据；数据块划分；生成样本对训练集和测试集；生成样本对训练集的标签；通过孪生网络支路的膨胀‑余弦注意力模块获得带权重的特征,通过残差‑密集混合多路模块提取多路特征，通过多核深度特征提取模块提取细粒度特征；通过孪生网络支路获得样本特征；进行孪生网络对比学习训练；进行孪生网络分类学习训练；确定高光谱像元类别。本发明的优点是：所需带标签训练样本少，分类精度高。

Description

基于多路多尺度特征孪生网络的小样本高光谱分类方法

技术领域

本发明涉及遥感信息处理技术领域，特别涉及一种基于多路多尺度特征孪生网络的小样本高光谱分类方法。

背景技术

高光谱图像具有数百个连续波段，它不仅提供了空间信息，还提供了丰富的光谱信息，可用于区分土地覆盖类型。高光谱图像分类的目的是对高光谱图像逐像素分类到预定义的标签中。然而，在实际的应用中，获取具有类别标签的数据往往成本很高，导致带标签的数据短缺成为高光谱图像分类任务中的一项难题。实际遇到的高光谱分类通常为仅有少量带标签训练样本情况下的分类问题，也被称为小样本分类。随着技术的发展，基于3D卷积的孪生网络(3D convolutional siamese network，3DCSN)被成功的引入高光谱图像分类中，并具有一定的优势。

3DCSN的基本结构包含两个相同的卷积神经网络分支作为孪生网络支路，在训练阶段输入为一组样本对，每个分支处理样本对中的一个输入图像样本，这两个分支共享相同的权重和参数。在训练阶段，3DCSN会接收一组样本对作为输入，通过由三维卷积和二维卷积串联构成的孪生网络支路中进行训练，并利用损失函数来衡量样本对的相似性或距离，通过反向传播算法，网络的参数和权重会被调整以最小化损失函数。最后，通过全连接层输出每类的概率值，通过选出最大概率值来确定像元类别。

现有的高光谱图像分类方法中主要存在以下问题：1、小样本训练集情况下分类精度低。2、分类过程中，没有充分利用图像空-谱信息，不同尺度的邻域信息没有得到综合全面的考虑。3、没有有效提取并利用高光谱图像中的复杂完备特征。

上述问题导致高光谱图像的特征不能得到充分的提取及表达致使分类精度不高。

发明内容

本发明针对现有技术的缺陷，提供了一种基于多路多尺度特征孪生网络的小样本高光谱分类方法。利用膨胀-余弦注意力机制实现图像中的空间-光谱权重综合衡量，利用多路特征提取将组卷积局部残差特征、全局残差特征，全局密集特征融合，有效传播和利用不同层级的特征，增强了特征的表达能力，使用多尺度卷积核充分利用高光谱图像中的邻域信息提取特征，利用多尺度深度特征提取模块有效提取并利用高光谱图像中的复杂细粒度特征。

为了实现以上发明目的，本发明采取的技术方案如下：

一种基于多路多尺度特征孪生网络的小样本高光谱分类方法，包括以下步骤：

S1：读入高光谱图像数据；

读入三维的高光谱高维数据和每个像素的真实标签；

S2：数据块划分；

将读入的原始高光谱图像边缘填充0像素，填充的尺寸为在图像空间维度即宽高四周分别扩充并填充4像素；在填充操作后的高光谱图像中，以原始高光谱图像每个像素点为中心像，逐像素划分成数据块；去除标签值为0的数据块及其标签；

S3：生成样本对训练集和测试集；

从去除标签值为0后的数据块中每类随机选取三个样本，作为样本集，其余的样本作为测试集；再将样本集中的每个样本与其余样本配对得到样本对集，即训练集，和对应的标签对；

S4：生成样本对训练集的标签；

对训练集通过判断标签对的一致性给样本对赋予标签；若标签对的值是一致的，则这对样本的标签为1，若标签对的值不一致则这对样本的标签为0；

S5：通过孪生网络支路的膨胀-余弦注意力模块获得带权重的特征，通过残差-密集混合多路模块提取多路特征，通过多核深度特征提取模块提取细粒度特征；

在训练阶段，训练样本对输入孪生网络，孪生网络由两个完全相同的分支构成，并共享权重；在测试阶段，测试样本直接输入孪生网络中的一个支路；通过孪生网络支路获得样本特征；

S6：进行孪生网络对比学习训练；

将训练集中的训练样本对输入孪生网络，通过对比损失函数更新网络参数；

S7：进行孪生网络分类学习训练；

进入分类学习训练阶段，使用平均池化操作从特征中提取特征向量，然后使用全连接层来生成预测值，选出概率值最大的标签作为预测标签；

S8：确定高光谱像元类别；

训练好网络模型后，将测试集的测试样本输入到模型中进行像元分类；测试样本通过S5利用孪生网络中的一个支路获得分类特征，然后使用平均池化操作从分类特征中提取特征向量，然后使用全连接层来生成预测值，最终选出概率值最大的标签作为最终分类结果。

进一步地，S5包括以下步骤：

S51：通过膨胀-余弦注意力模块获得带权重的特征；

首先利用谱维度膨胀卷积将输入特征的谱维度减半，再利用余弦相似度计算相邻像素与中心像素的相关程度得到权重掩码，最后将得到的权重掩码与输入特征相乘得到带权重的特征图；

S52：通过残差-密集混合多路模块提取多路特征；

输入特征先在谱维度填充0，保证后续组卷积操作的分组数是整数，再依次经过两个串联的残差-密集混合多路模块来提取特征，利用组卷积操作提取局部残差特征、全局密集特征，利用普通卷积提取全局残差特征，然后利用元素级相加和谱维度拼接来融合三路特征；

S53：通过多核深度特征提取模块提取细粒度特征；

多路特征作为输入，通过多核深度特征提取模块提取细粒度特征，在单个残差块内构建分层的类残差连接来提取细粒度特征，使用多核多尺度卷积来增加每个网络层的接受域范围，通过在光谱维度分组，对光谱块进行多核多尺度卷积及层级跳跃连接，提取图像的语义信息；

S54：通过孪生网络支路获得样本特征；

孪生网络支路一与孪生网络支路二构成相同；如果在训练阶段，训练样本对通过两个孪生网络支路获得训练样本对特征；如果在测试阶段，测试样本通过孪生网络中的一个支路获得分类特征。

进一步地，S51通过膨胀-余弦注意力模块获得带权重的特征，包括以下步骤：

S511：膨胀卷积操作；

输入X_n经过核大小为3×1×1，膨胀率为2的膨胀卷积dilated_conv1，将谱带从B减少到B/2得到的通道减半的特征其具体过程如公式(1)和(2)所示；

K_equ＝K_real+(K_real-1)×(SDR-1) (1)

其中SDR表示膨胀率，K_equ表示光谱深度的等效卷积核大小，K_real表示在光谱深度上的实卷积核大小，*表示卷积操作；

S512：批归一化(BN)和sigmoid激活操作；

将步骤S511得到的通道减半的特征输入到由批归一化(BN)层和sigmoid激活层串联的操作中，得到输出特征其中sigmoid激活层将特征对应数值限制在(0，1)，输出由下式(3)得到；

S513：计算中心像素与邻域像素余弦相似度；

将S512输出的特征通过余弦相似度公式，即下式(4)来计算中心像素与其相邻像素的余弦相似度，得到空间权重掩码M；

其中m_i，j表示权重掩码M的第i行第j列的值，T表示转置操作，表示转置操作后的第i行第j列的值，表示的中心像素；||·||表示二范数运算，·表示乘运算；

S514：权重与输入相乘，获得注意力模块特征X′_n；

将步骤S513得到的空间权重掩码M与输入X_n相乘得到输出注意力模块特征X′_n。

进一步地，S52通过残差-密集混合多路模块提取多路特征，输入依次经过两个串联的残差-密集混合多路模块来提取特征，包括以下步骤：

S521：谱维度填充；

对步骤S514的得到的X′_n进行谱维度填充0，保证后续组卷积操作的分组数是整数，将谱维度B填充0到B′得到其中B′如公式(5)所示；

其中ceil(·)表示向上取整，groups表示分组的组数；

S522：多路特征提取预处理；

将步骤S521得到的结果依次经过：卷积核大小为1×1×1分组数为5输出为320个通道的组卷积层group_{preconditioning1}→批归一化层→relu激活层，得到输出X′_n1，如公式(6)所示；

其中group_{preconditioning1}(·)表示组卷积预处理操作，BN表示批归一化操作，relu表示relu激活函数；

S523：通过组卷积局部特征支路，提取组卷积局部特征；

将步骤S522得到结果X′_n1经过两个串联的GC操作GC1和GC2得到组卷积局部特征输出GC1表示第一个GC操作，GC2表示第二个GC操作；

S524：通过全局残差特征支路，提取全局残差特征；

与组卷积局部特征提取的同时，X′_n1通过两个串联的普通卷积和一个跳跃连接操作得到全局残差特征输出

S525：通过全局密集特征支路，提取全局密集特征；

与组卷积局部特征和全局残差特征提取的同时，X′_n1通过S523中GC1操作后直接通过跳跃连接作为全局密集特征参与后续操作；如下式(7)所示；

S526：三路特征进行聚合，包括以下步骤：

1)与相加得到输出

2)符号与进行谱维度的拼接得到聚合特征X″_n；

S527：残差-密集混合多路模块构成及操作封装；

步骤S521-S525构成了一个残差-密集混合多路模块，对应的模块组合操作能够封装为BX操作，如下式(8)所示；

S528：获取最终的多路特征X_nD，包括以下步骤：

1)第一个残差-密集混合多路模块的输出X″_n作为输入进入第二个残差-密集混合多路模块得到输出X′_nD，如公式(9)所示；

X′_nD＝BX(X″_n) (9)

2)X′_nD通过多路特征获取预处理操作，获得最终的多路特征X_nD；

X′_nD依次经过串联的：卷积核大小为1×1×1分组数为5输出为320个通道的组卷积层group_{preconditioning2}→批归一化层→relu激活层，得到最终的多路特征特征X_nD，由下式(10)所示：

X_nD＝relu(BN(group_{preconditioning2}(X′_nD))) (10)

其中group_{preconditioning2}表示组卷积预处理操作，BN表示批归一化操作，relu表示relu激活函数。

进一步地，S523具体包括如下步骤：

1)GC操作由卷积核大小为1×1×1分组数为5输出为320个通道的组卷积层group_GC→批归一化层→relu激活层构成，如下式(11)所示：

GC(ω)＝relu(BN(group_GC(ω))) (11)

其中group_GC(·)表示组卷积操作，BN表示批归一化操作，relu表示relu激活函数，ω表示待处理对象；

2)X′_n1经过两个串联的GC操作得到输出组卷积局部特征如下式(12)所示；

其中GC1表示第一个GC操作，GC2表示第二个GC操作。

进一步地，S524具体包括如下步骤：

1)输入X′_n1依次经过Conv1BnRelu操作即：卷积核大小为1×1×1输出为32个通道的普通卷积层1→批归一化层→relu激活层，和Conv2BnRelu操作即：卷积核大小为1×1×1输出为320个通道的普通卷积层2→批归一化层→relu激活层，得到输出

2)输入X′_n1与通过跳跃连接相加，得到全局残差特征

进一步地，S53通过多核深度特征提取模块提取细粒度特征，包括以下步骤：

S531：特征段划分；

将X_nD沿着谱维度平均划分成5个特征段，即{xs_1n，xs_2n，xs_3n，xs_4n，xs_5n}，每个子特征段通道数为64；

S532：提取五个特征段对应的细粒度特征，包括以下步骤：

1)第一特征段细粒度特征提取，输出结果ys_1n；

保留第一个特征段xs_1n作为第一个特征段细粒度输出特征ys_1n；

2)第二特征段细粒度特征提取，输出结果ys_2n；

将第一特征段xs_1n进行多核多尺度组卷积操作得到输出ys′_1n，再与第二特征段xs_2n相加得到第二特征段细粒度输出特征ys_2n；

3)第三特征段细粒度特征提取，输出结果ys_3n；

第二特征段细粒度输出特征ys_2n进行多核多尺度组卷积操作，与第三特征段xs_3n相加得到第三特征段细粒度输出特征ys_3n；

4)第四特征段细粒度特征提取，输出结果ys_4n；

第三特征段细粒度输出特征ys_3n进行多核多尺度组卷积操作操作，与第四特征段xs_4n相加得到第四特征段细粒度输出特征ys_4n；

5)第五特征段细粒度特征提取，输出结果ys_5n；

第四特征段细粒度输出特征ys_4n进行多核多尺度组卷积操作操作，与第五特征段xs₅相加得到第五特征段细粒度输出特征ys_5n；

S533：获取总的细粒度特征YS_nF，包括以下步骤：

1)特征维度拼接；

将五个特征段细粒度特征输出{ys_1n，ys_2n，ys_3n，ys_4n，ys_5n}沿着谱维度拼接得到YS′_nF，由下式(13)所示；

YS′_nF＝Concate(ys_1n，ys_2n，ys_3n，ys_4n，ys_5n) (13)

2)将YS′_nF与X_nD相加得到总的细粒度特征YS_nF。

进一步地，S532中的多核多尺度组卷积操作由和两个并行支路以及谱维度保持卷积组成；

①支路；

由卷积核大小为3×1×1分组数为2输入和输出通道为64的组卷积层group_conv3×1×1→批归一化层→relu激活层依次串联组成，将这一系列操作命名为操作，由下式(14)表示；

②支路；

由卷积核大小为5×1×1分组数为2输入和输出通道为64的组卷积层group_conv5×1×1→批归一化层→relu激活层依次串联组成，将这一系列操作命名为操作，由下式(15)表示；

③支路结果拼接；

将操作和操作分别取得的结果沿着谱维度拼接，命名为操作，如下式(16)所示：

④谱维度保持；

谱维度保持卷积依次使用卷积核大小为1×1×1分组数为2输入通道为128输出通道为64的组卷积层group_conv1×1×1→批归一化层→relu激活层；

⑤组合构成多核多尺度组卷积

将上述①-④组合操作记为操作，由下式(17)所示；

进一步地，S54通过孪生网络支路获得样本特征，具体包括：

孪生网络支路一与孪生网络支路二构成相同，将步骤S51至S53对应的孪生网络单个支路整体操作记为f(·)操作，并获得对应样本特征；如果在训练阶段，训练样本对(X_n，X_m)通过两个孪生网络支路获得训练样本对特征，f(X_n)表示孪生网络支路一特征提取操作，f(X_m)表示孪生网络支路二特征提取操作；如果在测试阶段，测试样本x_test通过孪生网络中的一个支路获得分类特征YS_test。

与现有技术相比，本发明的优点在于：

1.多路多尺度特征提取：通过多路特征提取模块，可以同时提取不同尺度和层次的特征，从而捕捉到图像中的更多细节和上下文信息。这有助于提高分类性能，尤其对于高光谱图像这种具有丰富信息的数据类型尤为重要。

2.孪生网络对比学习：通过对比损失函数进行网络训练，可以使得网络能够更好地学习到样本间的相似性和差异性。能够有效地克服小样本问题，提高分类精度。

3.膨胀-余弦注意力模块：通过膨胀-余弦注意力模块，可以为特征图中的每个位置赋予不同的权重，从而使得网络能够更加关注重要的特征区域。有助于提高分类性能和减少冗余特征的影响。

4.残差-密集混合多路模块：通过残差连接和密集混合的方式，可以提取更加鲁棒和丰富的特征表示。有助于增强网络的表达能力和分类性能。

5.多核深度特征提取模块：通过多核深度特征提取模块，可以提取细粒度特征，捕捉到更加细致的图像信息。有助于增强网络对于高光谱图像中复杂和细微特征的识别能力。

6.小样本需求：多路多尺度特征孪生网络在小样本场景下仍能表现出色。由于其能够利用数据增强技术和自适应权重分配，能够充分利用有限的带标签训练样本，减轻了对大量标注数据的需求，降低了数据收集和标注的成本。

7.高分类精度：多路多尺度特征孪生网络通过融合多个尺度的特征图，能够更全面地捕捉图像的特征信息。多尺度的特征融合可以提高分类模型的表达能力，从而达到更高的分类精度，提升了小样本场景下的分类性能。

8.鲁棒性强：多路多尺度特征孪生网络通过融合不同尺度的特征图，能够对图像中的不同尺度和角度的变化具有较好的适应性。这使得模型在面对视角变化、光照变化、噪声等干扰时具有更强的鲁棒性，提高了模型在实际应用中的稳定性和可靠性。

9.可扩展性好：多路多尺度特征孪生网络的结构可以根据需求进行调整和扩展。可以根据特定任务的要求，增加或减少特征提取模块的数量和尺度，灵活适应不同的数据和任务场景，具有较好的可扩展性和通用性。

10.高效性：多路多尺度特征孪生网络的结构简单且参数量较小，能够在计算资源有限的情况下高效地进行训练和推理。这使得模型能够适应边缘设备、移动设备等资源受限的场景，具有较高的实用性和应用价值。

附图说明

图1为本发明实施例基于多路多尺度特征孪生网络的小样本高光谱分类方法的流程图。

图2为本发明实施例膨胀-余弦注意力模块示意图。

图3为本发明实施例残差-密集混合多路模块示意图。

图4为本发明实施例多核深度特征提取模块示意图。

图5为本发明实施例多核多尺度组卷积模块示意图。

图6为实验中的Pavia University高光谱数据的单一波段显示图像。

图7为实验中在Pavia University高光谱数据中所选取的真实地物分布图。

图8为实验中采用的两种不同方法对数据集分类后与之对应的各类地物的分类分布图，其中a，b分别对应着数据集的3DCSN分类分布图和本发明方法分类分布图。

图9为3DCSN分类方法和本发明方法在总体分类精度，类别平均分类精度和Kappa系数评价指标上的结果。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚明白，以下根据附图并列举实施例，对本发明做进一步详细说明。

如图1所示，本发明提供一种基于多路多尺度特征孪生网络的小样本高光谱分类方法，包括以下步骤：

1、读入高光谱图像数据。

读入三维的高光谱高维数据S∈R^W×H×B。其中∈表示属于符号，R表示实数域符号，W表示高光谱图像的宽，H表示高光谱图像的高，B表示高光谱图像的高光波段数。并读入每个像素的真实标签Y∈(Y₁，Y₂，…，Y_i，…Y_E)，i∈(1，E)其中Y_i是对应每个像素的标签值，E表示一共E个像素点。

2.数据块划分。

2.1、将读入的原始高光谱图像边缘填充0像素，填充的尺寸为在图像空间维度即宽高四周分别扩充并填充4像素。

2.2、在填充操作后的高光谱图像中，以原始高光谱图像每个像素点为中心像，逐像素划分成9×9×B的E个数据块。

2.3、去除标签值为0的数据块及其标签，最终得到Q个数据块和对应中心像素标签的Q个标签值。

3、生成样本对训练集和测试集。

3.1、从Q个数据块中每类随机选取三个样本，共3×C个样本集，其余的样本作为测试集X_test，x_test是测试集中的测试样本。其中C表示读入的高光谱图像的总类别数。

3.2、将3×C个样本集中的每个样本与其余样本配对得到(3×C)(3×C-1)个样本对(X_n，X_m)，即训练集，和对应的标签对(Y_n，Y_m)。其中X_n和X_m分别表示组成样本对的两个样本，Y_n和Y_m分别表示X_n和X_m的标签，其中n，m∈(1，2，…，(3×C)(3×C-1))。

4、生成样本对训练集的标签。

对训练集通过判断标签对(Y_n，Y_m)的一致性给样本对赋予标签X_n，m。若标签对的值是一致的，则这对样本的标签X_n，m为1，若标签对的值不一致则这对样本的标签Y_n，m为0，如公式(1)所示。

5、通过孪生网络支路的膨胀-余弦注意力模块，残差-密集混合多路模块和多核深度特征提取模块提取样本特征。

在训练阶段，训练样本对(X_n，Y_m)输入孪生网络，孪生网络由两个完全相同的分支构成，并共享权重，X_n送入孪生网络支路一，将样本X_m送入孪生网络支路二，下边以孪生网络支路一的构成来进行展开介绍，孪生网络支路二为相同的模块构成。在测试阶段，测试样本x_test直接输入孪生网络中的一个支路。

5.1、通过膨胀-余弦注意力模块获得带权重的特征。

输入样本通过膨胀-余弦注意力模块获得带权重的特征，其具体处理可以参照图2。

5.1.1、膨胀卷积操作。

输入X_n经过核大小为3×1×1，膨胀率为2的膨胀卷积dilated_conv1，将谱带从B减少到B/2得到的通道减半的特征其具体过程如公式(2)和(3)所示。

K_equ＝K_real+(K_real-1)×(SDR-1) (2)

其中SDR表示膨胀率，K_equ表示光谱深度的等效卷积核大小，K_real表示在光谱深度上的实卷积核大小，*表示卷积操作。

5.1.2、批归一化(BN)和sigmoid激活操作。

将步骤5.1.1得到的通道减半的特征输入到由批归一化(BN)层和sigmoid激活层串联的操作中，得到输出特征其中sigmoid激活层将特征对应数值限制在(0，1)，输出由下式(4)得到。

5.1.3、计算中心像素与邻域像素余弦相似度。

将5.1.2输出的特征通过余弦相似度公式，即下式(5)来计算中心像素与其相邻像素的余弦相似度，得到空间权重掩码M。

其中m_i，j表示权重掩码M的第i行第j列的值，T表示转置操作，表示转置操作后的第i行第j列的值，表示的中心像素。||·||表示二范数运算，·表示乘运算。

5.1.4、权重与输入相乘，获得注意力模块特征X′_n

将步骤5.1.3得到的空间权重掩码M与输入X_n相乘得到输出注意力模块特征X′_n。由下式(6)表示。

X′_n＝M⊙X_n (6)

其中⊙表示逐像素相乘。

5.2、通过残差-密集混合多路模块提取多路特征。

通过残差-密集混合多路模块提取多路特征，输入依次经过两个串联的残差-密集混合多路模块来提取特征，其具体处理可以参照图3。

5.2.1、谱维度填充。

对步骤5.1.4的得到的X′_n进行谱维度填充0，保证后续组卷积操作的分组数是整数，将谱维度B填充0到B′得到其中B′如公式(7)所示。

其中ceil(·)表示向上取整，groups表示分组的组数。

5.2.2、多路特征提取预处理。

将步骤5.2.1得到的结果依次经过：卷积核大小为1×1×1分组数为5输出为320个通道的组卷积层group_{preconditioning1}→批归一化层→relu激活层，得到输出X′_n1，如公式(8)所示。

其中group_{preconditioning1}(·)表示组卷积预处理操作，BN表示批归一化操作，relu表示relu激活函数。

5.2.3通过组卷积局部特征支路，提取组卷积局部特征。

将步骤5.2.2得到结果X′_n1经过两个串联的GC操作得到组卷积局部特征输出

1)GC操作由卷积核大小为1×1×1分组数为5输出为320个通道的组卷积层group_GC→批归一化层→relu激活层构成，如下式(9)所示：

GC(ω)＝relu(BN(group_GC(ω))) (9)

其中group_GC(·)表示组卷积操作，BN表示批归一化操作，relu表示relu激活函数，ω表示待处理对象。

2)X′_n1经过两个串联的GC操作得到输出组卷积局部特征如下式(10)所示。

其中GC1表示第一个GC操作，GC2表示第二个GC操作。

5.2.4、通过全局残差特征支路，提取全局残差特征。

1)输入X′_n1依次经过Conv1BnRelu操作即：卷积核大小为1×1×1输出为32个通道的普通卷积层1→批归一化层→relu激活层，和Conv2BnRelu操作即：卷积核大小为1×1×1输出为320个通道的普通卷积层2→批归一化层→relu激活层，得到输出可由公式(11)表示。

2)输入X′_n1与通过跳跃连接相加，得到全局残差特征，如下式(12)所示。

5.2.5、通过全局密集特征支路，提取全局密集特征。

与组卷积局部特征和全局残差特征提取的同时，X′_n1通过5.2.3中GC1操作后直接通过跳跃连接作为全局密集特征参与后续操作。如下式(13)所示。

5.2.6、三路特征进行聚合。

1)与相加得到输出如下式(14)所示。

2)符号与进行谱维度的拼接得到聚合特征X″_n。即下式(15)所示。

其中Concate表示沿谱维度拼接操作。

5.2.7、残差-密集混合多路模块构成及操作封装。

步骤5.2.1-5.2.5构成了一个残差-密集混合多路模块，对应的模块组合操作可以封装为BX操作，如下式(16)所示。

5.2.8、获取最终的多路特征X_nD。

1)第一个残差-密集混合多路模块的输出X″_n作为输入进入第二个残差-密集混合多路模块得到输出X′_nD，如公式(17)所示。

X′_nD＝BX(X″_n) (17)

2)X′_nD通过多路特征获取预处理操作，获得最终的多路特征X_nD。

X′_nD依次经过串联的：卷积核大小为1×1×1分组数为5输出为320个通道的组卷积层group_{preconditioning2}→批归一化层→relu激活层，得到最终的多路特征特征X_nD，由下式(18)所示：

X_nD＝relu(BN(group_{preconditioning2}(X′_nD))) (18)

5.3、通过多核深度特征提取模块提取细粒度特征。

多路特征X_nD作为输入，通过多核深度特征提取模块提取细粒度特征，在单个残差块内构建了分层的类残差连接来提取细粒度特征，使用多核多尺度卷积来增加每个网络层的接受域范围，具体操作可以参照图4。

5.3.1、特征段划分。

将X_nD沿着谱维度平均划分成5个特征段，即{xs_1n，xs_2n，xs_3n，xs_4n，xs_5n}，每个子特征段通道数为64。

5.3.2、提取五个特征段对应的细粒度特征。

1)第一特征段细粒度特征提取，输出结果ys_1n。

保留第一个特征段xs_1n作为第一个特征段细粒度输出特征ys_1n。如下式(19)所示。

ys_1n＝xs_1n (19)

2)第二特征段细粒度特征提取，输出结果ys_2n。

将第一特征段xs_1n进行多核多尺度组卷积操作得到输出ys′_1n，再与第二特征段xs_2n相加得到第二特征段细粒度输出特征ys_2n，如下式(20)和(21)所示。

ys_2n＝xs_2n+ys′_1n (20)

其中的多核多尺度组卷积操作主要由和两个并行支路以及谱维度保持卷积组成。

①支路。

由卷积核大小为3×1×1分组数为2输入和输出通道为64的组卷积层group_conv3×1×1→批归一化层→relu激活层依次串联组成，将这一系列操作命名为操作，由下式(22)表示。

②支路。

由卷积核大小为5×1×1分组数为2输入和输出通道为64的组卷积层group_conu5×1×1→批归一化层→relu激活层依次串联组成，将这一系列操作命名为操作，由下式(23)表示。

③支路结果拼接。

将操作和操作分别取得的结果沿着谱维度拼接，命名为操作，如下式(24)所示：

④谱维度保持。

谱维度保持卷积依次使用卷积核大小为1×1×1分组数为2输入通道为128输出通道为64的组卷积层group_conv1×1×1→批归一化层→relu激活层。

⑤组合构成多核多尺度组卷积

将上述①-④组合操作记为操作如，由下式(25)所示。

3)第三特征段细粒度特征提取，输出结果ys_3n。

第二特征段细粒度输出特征ys_2n进行多核多尺度组卷积操作操作，与第三特征段xs_3n相加得到第三特征段细粒度输出特征ys_3n，如下式(26)所示。

4)第四特征段细粒度特征提取，输出结果ys_4n。

第三特征段细粒度输出特征ys3n进行多核多尺度组卷积操作操作，与第四特征段xs_4n相加得到第四特征段细粒度输出特征ys_4n，如下式(27)所示。

5)第五特征段细粒度特征提取，输出结果ys_5n。

第四特征段细粒度输出特征ys_4n进行多核多尺度组卷积操作操作，与第五特征段xs₅相加得到第五特征段细粒度输出特征ys_5n，如下式(28)所示。

5.3.3、获取总的细粒度特征YS_nF。

1)特征维度拼接。

将五个特征段细粒度特征输出{ys_1n，ys_2n，ys_3n，ys_4n，ys_5n}沿着谱维度拼接得到YS′_nF，由下式(29)所示。

YS′_nF＝Concate(ys_1n，ys_2n，ys_3n，ys_4n，ys_5n) (29)

2)将YS′_nF与X_nD相加得到总的细粒度特征YS_nF，如公式(30)表示。

YS_nF＝YS′_nF+X_nD (30)

5.4通过孪生网络支路获得样本特征。

孪生网络支路一与孪生网络支路二构成相同，将步骤5.1-5.3对应的孪生网络单个支路整体操作记为f(·)操作，并获得对应样本特征。如果在训练阶段，训练样本对(X_n，X_m)通过两个孪生网络支路获得训练样本对特征，f(X_n)表示孪生网络支路一特征提取操作，f(X_m)表示孪生网络支路二特征提取操作。如果在测试阶段，测试样本x_test通过孪生网络中的一个支路获得分类特征YS_test。

6、进行孪生网络对比学习训练。

将训练集中的训练样本对(X_n，X_m)输入孪生网络，X_n送入孪生网络支路一，将样本X_m送入孪生网络支路二。设θ为对比学习过程中的参数，通过下式(31)来更新θ：

θ＝argmin(L_contra{f(X_n)，f(X_m)，Y_n，m；θ}) (31)

其中L_contra表示的是对比损失函数，其中Y_n，m表示样本对标签。L_contra具体公式由下式(32)所示。

其中margin是边界间隔用于定义样本的分类边界，其典型值为1.25。d是两个特征向量之间的欧氏距离通过下式(33)得到。

d＝||f(X_n)-f(X_m)||₂ (33)

其中||·||₂表示欧式距离计算。

7、进行孪生网络分类学习训练。

步骤6之后进入分类学习训练阶段，使用平均池化操作从特征中提取1×1×128个特征向量，然后使用全连接层来生成大小为1×C个预测值，其中C表示数据集类别数，选出概率值最大的标签作为预测标签，即下式(34)所示。

是第i个训练样本的预测标签，Avgpool表示平均池化操作，Linear表示全连接层操作，max表示取最大值。

像元类别预测过程使用交叉熵损失函数来训练θ，通过反向传播算法来调整θ得到最小化损失函数，θ由下式(35)和(36)更新：

θ＝argmin{L_{cross-entropy}[f(X_i)]，Y_i；θ} (36)

其中L_{cross-entropy}交叉熵损失函数，Y_i是第i个训练样本的真实标签值。

8、确定高光谱像元类别。

训练好网络模型后，将测试集的测试样本输入到模型中进行像元分类。测试样本x_test通过步骤5利用孪生网络中的一个支路获得分类特征YS_test，然后使用平均池化操作从分类特征中提取1×1×128个特征向量，然后使用全连接层来生成大小为1×C个预测值，最终选出概率值最大的标签作为最终分类结果。即下式(37)所示。

YZ＝max(Linear(Avgpool(YS_test))) (37)

值得注意的是：步骤8针对高光谱图像中的每个测试样本都要运行一遍，最终输出本发明下的高光谱图像分类结果YZ。图1给出了本发明方法的流程图。

为了说明本发明的有效性，特进行如下实验论证。

其中采用Pavia University高光谱数据集来验证本发明方法的适用性，如图6和7所示。

帕维亚大学数据是由帕维亚大学使用反射光学系统成像光谱仪(ROSIS)传感器拍摄的。该传感器可捕获430～860nm范围内光谱波段。该数据集有103个光谱波段，610×340像素。数据场景中包含九个土地覆盖类别。从9种实际地物分布样本中每类随机抽取3个样本数据作为训练样本。

在对高光谱图像进行分类时，本发明方法与3DCSN方法进行对比。

运用三种方法分类后与之对应的各类地物的分类分布图如8所示，可以很直观的看到相对于3DCSN方法分类，本发明的方法分类效果图好。

三种分类方法的三个分类评价指标即总体分类精度，类别平均分类精度和Kappa系数如图9所示，其中总体分类精度、类别平均分类精度和Kappa系数越高图像的分类效果就越好。较之3DCSN，本发明方法从总体分类精度，类别平均分类精度和Kappa系数来看分别高出15.46％，15.92％，18.08％。通过实验的对比分析可以进一步看出本发明方法优势所在。

上述根据本发明的方法可在硬件、固件中实现，或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码，或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码，从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解，计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如，RAM、ROM、闪存等)，当所述软件或计算机代码被计算机、处理器或硬件访问且执行时，实现在此描述的基于多路多尺度特征孪生网络的小样本高光谱分类方法。此外，当通用计算机访问用于实现在此示出的处理的代码时，代码的执行将通用计算机转换为用于执行在此示出的处理的专用计算机。

本领域的普通技术人员将会意识到，这里所述的实施例是为了帮助读者理解本发明的实施方法，应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合，这些变形和组合仍然在本发明的保护范围内。

Claims

1.一种基于多路多尺度特征孪生网络的小样本高光谱分类方法，其特征在于，包括以下步骤：

S1：读入高光谱图像数据；

读入三维的高光谱高维数据和每个像素的真实标签；

S2：数据块划分；

S3：生成样本对训练集和测试集；

S4：生成样本对训练集的标签；

S5：通过孪生网络支路的膨胀-余弦注意力模块获得带权重的特征,通过残差-密集混合多路模块提取多路特征，通过多核深度特征提取模块提取细粒度特征；

S6：进行孪生网络对比学习训练；

S7：进行孪生网络分类学习训练；

S8：确定高光谱像元类别；

2.根据权利要求1所述的一种基于多路多尺度特征孪生网络的小样本高光谱分类方法，其特征在于，S5包括以下步骤：

S51：通过膨胀-余弦注意力模块获得带权重的特征；

S52：通过残差-密集混合多路模块提取多路特征；

S53：通过多核深度特征提取模块提取细粒度特征；

S54：通过孪生网络支路获得样本特征；

3.根据权利要求2所述的一种基于多路多尺度特征孪生网络的小样本高光谱分类方法，其特征在于：S51通过膨胀-余弦注意力模块获得带权重的特征，包括以下步骤：

S511：膨胀卷积操作；

K_equ＝K_real+(K_real-1)×(SDR-1) (1)

S512：批归一化(BN)和sigmoid激活操作；

将步骤S511得到的通道减半的特征输入到由批归一化(BN)层和sigmoid激活层串联的操作中，得到输出特征其中sigmoid激活层将特征对应数值限制在(0,1)，输出由下式(3)得到；

S513：计算中心像素与邻域像素余弦相似度；

其中m_,j表示权重掩码M的第i行第j列的值，T表示转置操作，表示转置操作后的第i行第j列的值，表示的中心像素；‖·‖表示二范数运算，·表示乘运算；

S514：权重与输入相乘，获得注意力模块特征X′_n；

4.根据权利要求3所述的一种基于多路多尺度特征孪生网络的小样本高光谱分类方法，其特征在于：S52通过残差-密集混合多路模块提取多路特征，输入依次经过两个串联的残差-密集混合多路模块来提取特征，包括以下步骤：

S521：谱维度填充；

其中ceil(·)表示向上取整，groups表示分组的组数；

S522：多路特征提取预处理；

S523：通过组卷积局部特征支路，提取组卷积局部特征；

S524：通过全局残差特征支路，提取全局残差特征；

S525：通过全局密集特征支路，提取全局密集特征；

S526：三路特征进行聚合，包括以下步骤：

1)与相加得到输出

2)符号与进行谱维度的拼接得到聚合特征X″_n；

S527：残差-密集混合多路模块构成及操作封装；

S528：获取最终的多路特征X_nD，包括以下步骤：

X′_nD＝BX(X″_n) (9)

X_nD＝relu(BN(group_{preconditioning2}(X′_nD))) (10)

5.根据权利要求4所述的一种基于多路多尺度特征孪生网络的小样本高光谱分类方法，其特征在于，S523具体包括如下步骤：

GC(ω)＝relu(BN(group_GC(ω))) (11)

其中GC1表示第一个GC操作，GC2表示第二个GC操作。

6.根据权利要求4所述的一种基于多路多尺度特征孪生网络的小样本高光谱分类方法，其特征在于，S524具体包括如下步骤：

2)输入X′_n1与通过跳跃连接相加，得到全局残差特征

7.根据权利要求6所述的一种基于多路多尺度特征孪生网络的小样本高光谱分类方法，其特征在于：S53通过多核深度特征提取模块提取细粒度特征，包括以下步骤：

S531：特征段划分；

S532：提取五个特征段对应的细粒度特征，包括以下步骤：

1)第一特征段细粒度特征提取，输出结果ys_1n；

2)第二特征段细粒度特征提取，输出结果ys_2n；

将第一特征段xs_1n进行多核多尺度组卷积噪作得到输出ys′_1n，再与第二特征段xs_2n相加得到第二特征段细粒度输出特征ys_2n；

3)第三特征段细粒度特征提取，输出结果ys_3n；

4)第四特征段细粒度特征提取，输出结果ys_4n；

第三特征段细粒度输出特征ys_3n进行多核多尺度组卷积噪作操作，与第四特征段xs_4n相加得到第四特征段细粒度输出特征ys_4n；

5)第五特征段细粒度特征提取，输出结果ys_5n；

第四特征段细粒度输出特征ys_4n进行多核多尺度组卷积噪作操作，与第五特征段xs₅相加得到第五特征段细粒度输出特征ys_5n；

S533：获取总的细粒度特征YS_nF，包括以下步骤：

1)特征维度拼接；

YS′_nF＝Concate(ys_1n，ys_2n，ys_3n，ys_4n，ys_5n) (13)

2)将YS′_nF与X_nD相加得到总的细粒度特征YS_nF。

8.根据权利要求7所述的一种基于多路多尺度特征孪生网络的小样本高光谱分类方法，其特征在于：S532中的多核多尺度组卷积操作由和两个并行支路以及谱维度保持卷积组成；

①支路；

②支路；

③支路结果拼接；

④谱维度保持；

⑤组合构成多核多尺度组卷积

将上述①-④组合操作记为操作，由下式(17)所示；

9.根据权利要求2所述的一种基于多路多尺度特征孪生网络的小样本高光谱分类方法，其特征在于：S54通过孪生网络支路获得样本特征，具体包括：