CN114821198A

CN114821198A - 基于自监督和小样本学习的跨域高光谱图像分类方法

Info

Publication number: CN114821198A
Application number: CN202210720249.4A
Authority: CN
Inventors: 吕国华; 池强; 王西艳; 高翔; 程嘉玟; 王美慧
Original assignee: Qilu University of Technology
Current assignee: Jinan Hongjie Electric Control Equipment Co ltd
Priority date: 2022-06-24
Filing date: 2022-06-24
Publication date: 2022-07-29
Anticipated expiration: 2042-06-24
Also published as: CN114821198B

Abstract

本发明公开了一种基于自监督和小样本学习的跨域高光谱图像分类方法，涉及高光谱遥感图像分类技术领域。本发明包括以下步骤：S1：获取数据集S_L、T_L、T_U、Te；S2：利用T_L为T_U自适应生成软标签，使用部分软标签对应的未标记样本来扩展目标域标记样本数量；S3：将S_L、T_L、T_U和Te映射为统一尺寸，并为S_L构建自监督学习任务；S4：在深度学习框架下构建深度神经网络，在深度神经网络中加入无监督域适应模块；S5：将S_L、T_L、T_U送入深度神经网络训练得到综合损失，并更新深度神经网络参数；S6：输出深度神经网络分类模型。本发明所述方法在少量样本的情况下具有较强的鲁棒性，取得了较高的分类精度。

Description

基于自监督和小样本学习的跨域高光谱图像分类方法

技术领域

本发明涉及高光谱遥感图像分类技术领域，具体涉及一种基于自监督和小样本学习的跨域高光谱图像分类方法。

背景技术

高光谱遥感图像是由成像光谱仪向地面发射的数百个连续波段反射得到的。由于地球表面各种材料对于波段的反射吸收存在差异，因此，由数百波段组成的高维图像包含着丰富的光谱空间信息。而这些光谱空间信息则又可以反应地面材料的属性，因此，高光谱遥感被广泛应用于土地覆盖制图、检测、农业等多个领域。

高光谱图像分类是遥感图像应用的关键步骤，高光谱图像分类的目的是为捕获的图像上每一个像素贴上一个类别的标签。最开始人们使用传统机器学习算法利用图像中的光谱信息进行分类，例如support vector machines (SVM)、k-nearest neighbor (KNN)、random forest (RF)等。但是，仅利用传统机器学习方法难以处理复杂高维数据，而且有限样本和高维向量之间矛盾还容易导致出现休斯现象。

近年来，深度学习依靠其比传统机器学习方法优异的表现在高光谱图像分类领域得到广泛应用。与传统机器学习方法相比，深度学习可以自动学习更深层次的特征，并且有更好的精度表现。虽然深度学习模型在高光谱图像分类领域取得了很好的效果，但是，深度学习训练往往需要大量的样本，如果样本数量过少会造成模型在测试集的泛化能力变差，影响最终的分类效果。然而，遥感图像标记样本获取又需要耗费巨大的人力物力，所以，在利用深度学习实现高光谱图像分类时一般仅有少量样本可用，这与深度学习需要大量样本之间产生矛盾。因此，如何在有限可用样本的情况下利用深度学习实现高光谱图像分类成为了研究热点。

发明内容

为了弥补现有技术的不足，本发明提供了一种基于自监督和小样本学习的跨域高光谱图像分类方法。

本发明的技术方案为：

一种基于自监督和小样本学习的跨域高光谱图像分类方法，包括以下步骤：

S1：选取两个高光谱数据集分别作为源域和目标域数据集，从源域数据集获取标记样本数据集S_L；从目标域数据集获取标记样本数据集T_L、软标签生成辅助数据集T_U、测试数据集Te；

S2：利用目标域数据集的标记样本数据集T_L为软标签生成辅助数据集T_U自适应生成软标签，使用部分软标签对应的未标记样本来扩展目标域标记样本数量；

S3：将源域数据集的标记样本数据集S_L以及目标域数据集中的标记样本数据集T_L、软标签生成辅助数据集T_U和测试数据集Te映射为统一尺寸，并为源域数据集的标记样本数据集S_L构建自监督学习任务；

S4：在深度学习框架下构建深度神经网络，在深度神经网络中加入无监督域适应，解决域偏移问题；

S5：将源域数据集中的标记样本数据集S_L，目标域数据集中的标记样本数据集T_L和软标签生成辅助数据集T_U送入深度神经网络训练得到综合损失L_total，根据综合损失更新深度神经网络参数，在整个训练过程采用元学习策略；

S6：预设一定数量的epoch作为一个训练段，在每次训练达到预设epoch数量后，将测试数据集Te送入特征提取器提取特征，将提取到的特征送入分类器得到预测的分类结果；通过将分类结果与测试数据集Te的标签比对，得测试精度；若测试精度大于上一个训练段结果，保存当前深度神经网络各层的参数，输出深度神经网络分类模型；若测试精度小于上一训练段结果，则不保存当前网络参数，继续进行下一个训练段，当达到所设训练迭代次数整个网络结束训练，输出深度神经网络分类模型。

优选地，步骤S1中，源域数据集和目标域数据集都包含标记样本和未标记样本，其中，标记样本数据集S_L是从源域数据集的标记样本中每个类别随机选取200个样本组成的，标记样本数据集T_L是从目标域数据集的标记样本中每个类别随机选取一个样本组成的，测试数据集Te是从目标域数据集的标记样本中除去标记样本数据集T_L中的样本后每个类别剩余样本组成的，而软标签生成辅助数据集T_U则是目标域数据集中除去标记样本数据集T_L的样本后剩余所有样本组成的，也就是说软标签生成辅助数据集T_U由测试数据集Te中的样本以及目标域数据集中的未标记样本共同组成的；源域以及目标域中的所有样本均取9×9的像素区域，作为样本的数据信息。

优选地，步骤S2中，利用目标域数据集中的标记样本数据集T_L为软标签生成辅助数据集T_U自适应生成软标签的步骤为：

S2-1：计算软标签生成辅助数据集T_U中所有未标记样本与标记样本数据集T_L中标记样本之间的光谱角度匹配度；通过SAM计算软标签生成辅助数据集T_U中所有未标记样本与标记样本数据集T_L中标记样本之间的光谱相似性，光谱向量

与

之间的SAM通过式（1）计算，结果用

表示：

（1）；

S2-2：计算软标签生成辅助数据集T_U中所有未标记样本与标记样本数据集T_L中标记样本之间的光谱空间距离；考虑到样本在物理位置的相关性，即相同类别的样本往往距离更近，不同类别的样本距离更远，本发明加入了标记样本和未标记样本之间的欧式距离，欧式距离通过式（2）计算，光谱向量

与

之间的光谱空间距离也就是欧式距离用D表示：

（2）

式（2）中，m表示标记样本的数量；

S2-3：计算软标签生成辅助数据集T_U中所有未标记样本到未标记样本的各个类别c之间的距离，其中，未标记样本

到各个类别c之间的距离用η表示，η的计算公式如式（3）所示：

（3）

S2-4：获取未标记样本的软标签：将

归一化为一个概率分布，从而得到未标记样本的软标签，用

表示，

的计算公式如式（4）所示：

（4）

式（4）中，

是归一化指数函数，使得每一个软标签数据的范围都在（0,1）之间，并且每个软标签中所有数据的和为1。

优选地，步骤S2中，使用部分软标签对应的未标记样本来扩展目标域标记样本数量的步骤为：首先，根据公式（2）计算所有未标记样本和标记样本之间的光谱空间距离D，然后，从软标签生成辅助数据集T_U中每个类别取与标记样本数据集T_L距离最近的前20个样本用于扩展目标域数据集中的标记样本数据集T_L，该20个样本即为部分软标签对应的未标记样本，而扩展之后的目标域标记样本数据集每类包括21个样本。

优选地，步骤S3中，将源域数据集中的标记样本数据集S_L以及目标域数据集中的标记样本数据集T_L、软标签生成辅助数据集T_U和测试数据集Te映射为统一尺寸步骤为：将源域数据集的标记样本数据集S_L以及目标域数据集的标记样本数据集T_L、软标签生成辅助数据集T_U和测试数据集Te中的所有数据送入映射层，得到尺寸为9×9×100的数据。

优选地，步骤S3中，映射层由二维卷积神经网络和BN层构成，将源域数据集的标记样本数据集S_L以及目标域数据集的标记样本数据集T_L、软标签生成辅助数据集T_U和测试数据集Te中的所有数据送入映射层的二维卷积神经网络，然后将结果送入BN层，得到的输出尺寸为9×9×100。

优选地，步骤S3中，为源域数据集中的标记样本数据集S_L构建自监督学习任务的步骤为：将为源域数据集构建的小样本学习中支持集S与查询集Q进行复制，然后将复制后的数据进行光谱翻转，并分别将翻转前后的样本赋予标签1和0；其中，支持集S的获取方式为：从标记样本数据集S_L中随机选取c个类，然后每个类别选出k个样本，组成支持集

，查询集Q的获取方式为：从选出的c个类的剩余样本中每类选择t个样本，组成查询集

。

优选地，步骤S4中，构建的深度神经网络由输入层、映射层、深度残差收缩网络、软标签学习网络、自监督学习网络、小样本分类网络、无监督域适应模块以及分类器组成；

其中，输入层用于对源域数据集和目标域数据集的高光谱图像数据进行采集，采集后的数据空间维度尺寸为9×9；

映射层用于对输入层输入的数据进行映射操作，经映射后的数据维度为9×9×100；

深度残差收缩网络用于提取输入的映射后的高光谱图像数据的光谱空间特征并完成分类预测，其中，深度残差收缩网络由特征提取器和分类层构成，该三维的残差收缩网络是在残差网络的基础上加入收缩模块，可以更好处理数据噪声和冗余；

软标签学习网络用于对目标域中生成的软标签的对应未标记样本数据经特征提取器提取到的特征进行接收，并结合软标签生成软标签损失

；

自监督学习网络用于对源域数据集中的标记样本数据集S_L经特征提取器提取到的特征进行接收，然后结合自监督学习得到源域自监督损失

；

小样本分类网络用于接收源域数据集中的标记样本数据集S_L和目标域数据集中的标记样本数据集T_L经特征提取器提取后的特征，然和结合小样本学习得到小样本分类损失，源域数据集的小样本分类损失和目标域数据集的小样本分类损失分别为

和

；

无监督域适应模块用于对经特征提取器提取后的源域数据集和目标域数据集的特征进行接收，然后计算源域数据集与目标域数据集两个域之间的分布损失

。

优选地，步骤S4中，在网络中加入的无监督域适应模块步骤为：将源域数据集、目标域集中的数据分别送入特征提取器中提取得到各自特征，计算源域数据集和目标域数据集两个域的特征之间的域损失并加入到网络总损失中，从而实现两个域之间的分布对齐。

优选地，步骤S5中，网络综合损失

的计算公式，如式（5）所示：

（5）

其中，

和

分别表示源域数据集和目标域数据集的损失；

而源域数据集损失，通过式（6）计算：

（6）

源域数据集的损失包括三个模块的损失，分别是：小样本学习损失

、自监督学习损失

以及域适应损失

；

而目标域数据集损失，通过式（7）计算：

（7）

目标域数据集的损失也包括三个部分，分别是：小样本学习损失

、软标签损失

以及域适应损失

。

优选地，步骤S5中，源域数据集的小样本分类损失

与目标域数据集的小样本分类损失

计算方法相同；源域数据集的小样本分类损失

的计算方法如下所示：从标记样本数据集S_L中随机选取c个类，然后每类选出k个样本，组成支持集

，而后从选出的c个类的剩余样本中每类选择t个样本，组成查询集

，而后将支持集S中的数据经过映射之后送入特征提取器提取特征，而后将每类样本的输出向量取平均值得出该类别的平均特征

，

的计算公式如式（8）所示：

（8）

式（8）中，

表示映射层，

和

分别表示映射层和特征提取器的参数；下一步将查询集Q中的数据经过映射之后送入特征提取器提取特征，然后通过计算与支持集得到的平均特征之间的距离

，可以得到查询集的类分布，

的计算公式如式（9）所示：

（9）

式（9）中，

表示负平方欧氏距离；

通过计算查询集Q样本的平均特征与支持集S样本的平均特征之间的距离，得到每个查询集Q中的样本与支持集S中各个类别的样本之间的相似性，最后可根据得到查询集Q中的样本的概率分布求出所有查询集Q样本的分类损失

，本申请中所有查询集Q样本的分类损失

即为源域数据集的小样本损失

，其中，

的计算公式如式（10）所示：

（10）

式（10）中，S和Q分别是支持集和查询集。

优选地，步骤S5中，自监督学习损失

的计算方法如下所示：复制一份支持集S与查询集Q，并将支持集S与查询集Q里面的光谱向量翻转，分别得到S’与Q’，而后给予原数据(S,Q)中所有样本标签为1，翻转后的数据(S’,Q’)中所有样本标签为0；而后，将所有数据送入特征提取器提取特征，然后将原数据和翻转后的数据特征结果送入分类器中预测是否翻转，本发明中自监督学习的损失被定义为

，

的计算公式如公式（11）所示：

（11）

式（11）中，

是对第n个样本预测为正例的概率，

表示第n个样本的标签，y的取值为0和1。

优选地，步骤S5中，域适应损失L_DA的获取方式为：利用特征提取器对标记样本数据集S_L和标记样本数据集T_L分别进行特征提取，得到源域特征F_S和目标域特征F_t，然后，通过式（12）计算得到域适应损失L_DA：

（12）

式（12）中，

表示Frobenius范数，d表示特征提取器输出的向量个数，

是一个所有元素为1的列向量，

和

分别为源域和目标域输入的样本的个数。

优选地，步骤S5中，软标签损失

的计算方法如下所示：将软标签对应的未标记样本数据送入深度残差收缩网络的特征提取器中提取特征，而后利用分类层完成分类预测，得预测结果，将预测结果与软标签做交叉熵作为软标签损失

，其中，软标签损失

的计算公式如公式（13）所示：

（13）

式（13）中，F_s是软标签对应的未标记样本数据得到的送入特征提取器得到的特征，labels表示对应的为未标记样本生成的软标签。

优选地，步骤S5中，根据网络综合损失

更新深度学习网络的参数，并采用元学习策略进行训练深度神经网络，具体步骤如下：在设置的小样本学习任务K-shot、C-way中，分别设置k=1，C设置为目标域类别个数，即每次训练选取C类，支持集每类样本数量设置为1个，查询集每类样本数量设置为19个。

优选地，步骤S6中，总迭代次数设置为10000，每1000个epoch作为一个训练段；在每个epoch中，源域数据集每类选取200个标记样本，目标域数据集每类选择1个标记样本。

与现有技术相比，本发明的有益效果如下：

小样本学习是元学习的一种，主要是解决在深度神经网络在样本数量极少情况下的分类问题，自监督学习主要通过利用预先定义任务从大规模的无监督数据中挖掘自身的监督信息；本发明提出了一种将自监督学习加入到小样本学习中的跨域高光谱图像分类方法，该高光谱分类方法在少量样本的情况下具有较强的鲁棒性，取得了较高的分类精度。本发明中不仅利用了源域中可转移知识，还充分利用了目标域的未标记样本，在样本数量极少情况下（甚至仅一个样本）也能实现较好的地物类别区分效果。具体来说，本发明提出的可用于少量样本的高光谱图像分类的深度学习框架，在跨域情况下，将小样本学习、自监督学习、软标签、域适应方法有机结合，提供了一个端到端的框架来解决小样本高光谱图像分类问题；本发明中将自监督学习作为辅助任务与小样本学习紧密结合，充分利用两者的优势，提出了一种新的基于SAM和欧式距离的自适应软标签生成方法，给未标记样本生成软标签用于模型训练，充分利用了未标记样本中包含的信息以及利用深度残差收缩网络模型作为特征提取器，此外，本发明中将一种简单高效的无监督域适应方法引入来缓解域偏移问题，充分利用了源域中可转移知识。

附图说明

图1为本发明的总体流程图；

图2为本发明的深度神经网络结构示意图；

图3为本发明测试阶段的流程图；

图4为本发明所述基于自监督和小样本学习的跨域高光谱图像分类方法得到的深度学习网络模型对实施例一中的目标域数据集进行测试的结果。

具体实施方式

为了使本技术领域的人员更好地理解本发明中的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

本发明中术语解释：

软标签：伪标签的一种，事实上，伪标签可以分为硬伪标签和软伪标签，这里简称为硬标签和软标签。软标签是通过算法或网络自动计算得到的，硬标签是指某个数据的类别，而软标签是指这个数据属于某个类别的概率。与硬标签相比，软标签有更高的熵，因此软标签中包含更多的信息。

SAM：Spectral Angle Mapper，光谱向量角或光谱角制图，把图像中的每个像元的光谱视为一个高维向量，通过计算两向量间的夹角来度量光谱间的相似性，夹角越小，两光谱越相似，属于同类地物的可能性越大，因而可根据光谱角的大小来辨别未知数据的类别。

2DCNN：2 dimension Convolutional Neural Networ，二维卷积神经网络，深度学习中的一种常用方法，利用二维卷积核学习提取图像特征信息。

KNN：K-NearestNeighbor，K最近邻，是一种简单高效地常用分类方法，主要依据最近邻地一个或者几个样本地类别来决定待分样本所属地类别。

本实施例提供的一种基于自监督和小样本学习的跨域高光谱图像分类方法，其总体流程图如图1所示，具体包括以下步骤：

S1：选取两个高光谱数据集分别作为源域数据集和目标域数据集，从源域数据集获取标记样本数据集S_L；从目标域数据集获取标记样本数据集T_L、软标签生成辅助数据集T_U、测试数据集Te；其中，本实施例中用到的源域数据集为Chikusei数据集，用到的目标域数据集为Indian Pines数据集，简称IP数据集；

本申请中源域数据集和目标域数据集都包含标记样本和未标记样本，其中，标记样本数据集S_L是从源域数据集的标记样本中每个类别随机选取200个样本组成的，标记样本数据集T_L是从目标域数据集的标记样本中每个类别随机选取一个样本组成的，测试数据集Te是从目标域数据集的标记样本中除去标记样本数据集T_L中的样本后每个类别剩余样本组成的，而软标签生成辅助数据集T_U则是目标域数据集中除去标记样本数据集T_L的样本后剩余所有样本组成的，也就是说软标签生成辅助数据集T_U由测试数据集Te中的样本以及目标域数据集中的未标记样本共同组成的；源域以及目标域中的所有样本均取9×9的像素区域，作为样本的数据信息；

S2：利用目标域数据集的标记样本数据集T_L为软标签生成辅助数据集T_U自适应生成软标签，使用部分软标签对应的未标记样本来扩展目标域标记样本数量，具体步骤为：

S2-1：计算软标签生成辅助数据集T_U中所有未标记样本与标记样本数据集T_L中的标记样本之间的SAM，得到的结果用来衡量未标记样本和标记样本之间的光谱相似性，光谱向量

与

之间的SAM通过式（1）计算，结果用

表示：

（1）

S2-2：考虑到样本在物理位置的相关性，即相同类别的样本往往距离更近，不同类别的样本距离更远。因此，本申请加入了目标域中未交标记样本与标记样本之间的欧式距离，本申请中欧式距离是指光谱向量

与

之间的光谱空间距离D，而光谱空间距离D是通过式（2）计算的：本发明对软标签生成辅助数据集T_U中所有未标记样本与标记样本数据集T_L中的标记样本之间的欧式距离进行了计算，其中，标记样本和未标记样本之间的欧式距离通过式（2）计算，光谱向量

与

之间的光谱空间距离也就是欧式距离用D表示：

（2）

式（2）中，m表示标记样本的数量；

（3）

S2-4：获取未标记样本的软标签：将η归一化为一个概率分布从而得到未标记样本的软标签用

表示，

的计算公式如式（4）所示：

（4）

式（4）中，

是归一化指数函数，使得每一个软标签数据的范围都在（0,1）之间，并且每个软标签中所有数据的和为1；

所述的使用软标签对应的未标记样本来扩展目标域标记样本数量的方法为：首先，根据公式（2）计算所有未标记样本和标记样本之间的光谱空间距离D，然后，从软标签生成辅助数据集T_U中每个类别取与标记样本数据集T_L距离最近的前20个样本用于扩展目标域数据集中的标记样本数据集T_L，该20个样本即为部分软标签对应的未标记样本，扩展之后的目标域标记样本数据集每类包括21个样本。

S3：源域数据集中的标记样本数据集S_L、目标域数据集中的标记样本数据集T_L、软标签生成辅助数据集T_U以及测试数据集Te利用映射层映射为统一尺寸，而后为源域数据集中的标记样本数据集S_L构建自监督学习任务，其中该步骤S3中用到的映射层是由二维卷积神经网络和BN层构成的，该步骤S3的具体步骤如下：

将源域数据集的标记样本数据集S_L以及目标域数据集的标记样本数据集T_L、软标签生成辅助数据集T_U和测试数据集Te中的所有数据送入映射层的二维卷积神经网络，其中，具体参数设置为：输入维度分别为源域和目标域各自的光谱维度，输出设置为100，步长和核尺寸都为1；然后将结果送入BN层，得到的输出尺寸为9×9×100；而后将为源域数据集构建的小样本学习中支持集S与查询集Q进行复制，然后将复制后的数据进行光谱翻转，并分别将翻转前后的样本赋予标签1和0；其中，支持集S的获取方式为：从标记样本数据集S_L中随机选取c个类，然后每个类别选出k个样本，组成支持集

。

S4：在深度学习框架Pytorch中构建深度神经网络，而深度神经网络的网络结构图如图2所示，本实施例中构建的深度神经网络由输入层、映射层、深度残差收缩网络、软标签学习网络、自监督学习网络、小样本分类网络、无监督域适应模块以及分类器组成；

输入层用于对源域数据集和目标域数据集的高光谱图像数据进行采集，采集后的数据空间维度尺寸为9×9，光谱维度为各自数据集原始光谱维度；

映射层用于对输入层输入的数据进行映射操作，经映射后的数据维度为9×9×100，数据空间维度尺寸为9×9，光谱维度为100；

；

；

和

；

。

S5：将源域数据集中的标记样本数据集S_L以及目标域数据集中的标记样本数据集T_L、软标签生成辅助数据集T_U送入深度网络训练得到综合损失

，根据综合损失更新深度神经网络参数，在整个训练过程采用元学习策略；其中，网络综合损失

的计算公式如公式（5）所示：

（5）

式（5）中，

和

分别表示源域数据集和目标域数据集的损失；

源域数据集包括三个模块的损失，分别是：小样本学习损失

、自监督学习损失

和域适应损失

，源域数据集损失可以通过式（6）计算：

（6）

本申请中目标域数据集小样本学习的小样本学习任务构建与源域数据集小样本学习的小样本学习任务构建相同，源域数据集的小样本学习损失

和目标域数据集的小样本学习损失

的计算方法相同；其中，源域数据集的小样本学习损失

的计算步骤为：首先从标记样本数据集S_L中随机选取c个类，然后每个类别选出k个样本，组成支持集

，

的计算公式如式（8）所示：

（8）

式（8）中，

表示映射层，

和

分别表示映射层和特征提取器的参数；下一步将查询集Q中的数据经过映射之后送入特征提取器提取特征，然后通过计算查询集Q与支持集S得到的平均特征之间的距离

，可以得到查询集的类分布，

的计算公式如式（9）所示：

（9）

式（9）中，

表示负平方欧氏距离；

而后，通过计算查询集Q样本的平均特征与支持集S样本的平均特征之间的距离，得到每个查询集Q中的样本与支持集S中各个类别的样本之间的相似性，最后根据得到的查询集Q中样本的概率分布求出所有查询集Q样本的分类损失

，本申请中所有查询集Q样本的分类损失

即为源域数据集的小样本损失

，其中，

的计算公式如式（10）所示：

（10）

式（10）中，S和Q分别是支持集和查询集。

遵循以上步骤，可以分别求出源域数据集和目标域数据集各自的小样本学习损失分别表示为

和

。

本发明中定义自监督的任务为判断输入光谱向量是否翻转，本申请中自监督学习损失

是通过如下方式得到的，具体来说，首先复制一份支持集S与查询集Q，并将支持集S与查询集Q里面的光谱向量翻转，分别得到S’与Q’，而后给予原数据(S,Q)中所有样本标签为1，翻转后的数据(S’,Q’)中所有样本标签为0；而后，将所有数据送入特征提取器提取特征，然后将原数据和翻转后的数据特征的结果送入分类器中预测是否翻转；本发明中自监督学习损失

的计算公式如公式（11）所示：

（11）

式（11）中，

是对第n个样本预测为正例的概率，

表示第n个样本的标签，y的取值为0和1。

而本发明中域适应损失

的获取方式为：利用特征提取器对标记样本数据集S_L和标记样本数据集T_L分别进行特征提取，得到源域特征F_S和目标域特征F_t，然后，通过式（12）计算得到域适应损失

：

（12）

式（12）中，

表示Frobenius范数，d表示特征提取器输出的向量个数，

是一个所有元素为1的列向量，

和

分别为源域和目标域输入的样本的个数。

本发明中在目标域上的损失也包括三个部分，分别是：小样本学习损失

、软标签损失

和域适应损失

，本发明中目标域数据集损失可以通过式（7）计算：

（7）

式（7）中，目标域上的小样本学习损失

计算方法与源域的小样本学习损失

计算方法相同；

目标域上的软标签损失

是通过如下方式得到的，具体来说：将软标签对应的未标记样本数据送入深度残差收缩网络的特征提取器中提取特征，而后利用分类层完成分类预测，得预测结果，将预测结果与软标签做交叉熵作为软标签损失

，软标签损失

的计算公式如公式（13）所示：

（13）

而后，根据计算得到的网络综合损失

S6：每次完成一个训练段后，使用特征提取器提取测试数据集Te特征，而后将特征送入sklearn包中实现的KNN分类器中实现分类，得到预测的分类结果；而后根据分类结果与测试数据集Te的标签比对，得出测试精度；本实施例中总迭代次数设置为10000，每个训练段为1000，如果测试精度大于上一个训练段结果则保存当前深度神经网络各层的参数，输出深度神经网络分类模型；若测试精度小于上一训练段结果，则不保存当前网络参数，继续进行下一个训练段，当达到所设训练迭代次数整个网络结束训练，保存最后在测试集上精度最高的网络模型参数作为最终训练结果，输出深度神经网络分类模型。

本发明中深度神经网络分类模型的测试过程如图3所示，主要包括步骤：

获取目标域中标记样本和未标记样本；

将标记样本和未标记样本送入映射层完成映射；

将映射后的数据送入特征提取器提取特征；

送入KNN分类器中输出分类结果。

为了对比利用本发明所述基于自监督和小样本学习的跨域高光谱图像分类方法获得的深度神经网络分类模型相较于现有技术中Support Vector Machine（简称SVM）、semi-supervised convolutional neural network（简称SS-CNN）、3 DimensionConvolutional Neural Network（简称3DCNN）、Similarity-Based Deep Metric Module（简称S-DMM）、spectral-spatial residual network（简称SSRN）、deep few-shotlearning（简称DFSL）、relation network few-shot classification（简称RN-FSC）、deepcross-domain few-shot learning（简称DCFSL）等光谱图像分类方法的分类效果优势，本申请分别利用上述八种光谱图像分类方法对本申请实施例中所述的目标域数据集进行分类获取分类精度，同时也用本申请所述基于自监督和小样本学习的跨域高光谱图像分类方法（简称SSFSL）获得的深度神经网络分类模型进一步对本实施例中所涉及的目标域数据集进行分类精度对比，为了公平对比，上述所有方法使用的目标域数据集每类仅选取一个标记样本用于训练，对于deep few-shot learning（简称DFSL）、relation network few-shotclassification（简称RN-FSC）、deep cross-domain few-shot learning（简称DCFSL）以及本申请所述基于自监督和小样本学习的跨域高光谱图像分类方法（简称SSFSL）这四种跨域方法，源域数据集统一使用Chikusei数据集且每类取200个标记样本用于训练，所有实验运行用到的环境如下：处理器为Intel(R) Xeon(R) Gold 5118，显卡为NVIDIA GeForce RTX2080 Ti，CUDA版本为10.0.130。其中，本申请的对比精度获取方式为：使用特征提取器提取测试数据集Te特征，而后将特征送入sklearn包中实现的KNN分类器中实现分类，得到预测的分类结果，而后根据分类结果与测试数据集Te的标签比对，得到分类对比精度，如图4所示。图4中使用总体精度OA、平均精度AA、卡帕系数KAPPA指标分析评价模型，OA、AA、KAPPA指标越高，模型的分类准确性越高。显然，从图4中可以看出，本申请所述基于自监督和小样本学习的跨域高光谱图像分类方法（简称SSFSL）获得的深度神经网络分类模型进一步对本实施例中所涉及的目标域数据集进行分类所获得的总体精度OA、平均精度AA、卡帕系数KAPPA都要明细优于上述八种光谱图像分类方法对本申请实施例中所述的目标域数据集进行分类获取的总体精度OA、平均精度AA、卡帕系数KAPPA。

由于Support Vector Machine（简称SVM）、semi-supervised convolutionalneural network（简称SS-CNN）、3 Dimension Convolutional Neural Network（简称3DCNN）、Similarity-Based Deep Metric Module（简称S-DMM）、spectral-spatialresidual network（简称SSRN）、deep few-shot learning（简称DFSL）、relation networkfew-shot classification（简称RN-FSC）、deep cross-domain few-shot learning（简称DCFSL）等光谱图像分类方法均为现有技术，利用该上述现有技术对本申请所述的目标域数据集进行分类也是现有技术，故利用该上述八种方法对本申请所述的目标域数据集进行分类的步骤在此不再赘述。

Claims

1.一种基于自监督和小样本学习的跨域高光谱图像分类方法，其特征在于：包括以下步骤：

S4：在深度学习框架下构建深度神经网络，在深度神经网络中加入无监督域适应模块；

2.根据权利要求1所述的基于自监督和小样本学习的跨域高光谱图像分类方法，其特征在于：步骤S2中，利用目标域数据集中的标记样本数据集T_L为软标签生成辅助数据集T_U自适应生成软标签的步骤为：

与

之间的SAM通过式（1）计算，结果用

表示：

（1）；

与

之间的光谱空间距离也就是欧式距离用D表示：

（2）

式（2）中，m表示标记样本的数量；

（3）

S2-4：获取未标记样本的软标签：将η归一化为一个概率分布，从而得到未标记样本的软标签，用

表示，

的计算公式如式（4）所示：

（4）

式（4）中，

3.根据权利要求1所述的基于自监督和小样本学习的跨域高光谱图像分类方法，其特征在于：步骤S2中，使用部分软标签对应的未标记样本来扩展目标域标记样本数量的步骤为：首先，根据公式（2）计算所有未标记样本和标记样本之间的光谱空间距离D，然后，从软标签生成辅助数据集T_U中每个类别取与标记样本数据集T_L距离最近的前20个样本用于扩展目标域数据集中的标记样本数据集T_L，该20个样本即为部分软标签对应的未标记样本，而扩展之后的目标域标记样本数据集每类包括21个样本。

4.根据权利要求1所述的基于自监督和小样本学习的跨域高光谱图像分类方法，其特征在于：步骤S3中，为源域数据集中的标记样本数据集S_L构建自监督学习任务的步骤为：将为源域数据集构建的小样本学习中支持集S与查询集Q进行复制，然后将复制后的数据进行光谱翻转，并分别将翻转前后的样本赋予标签1和0；其中，支持集S的获取方式为：从标记样本数据集S_L中随机选取c个类，然后每个类别选出k个样本，组成支持集

。

5.根据权利要求1所述的基于自监督和小样本学习的跨域高光谱图像分类方法，其特征在于：步骤S4中，构建的深度神经网络由输入层、映射层、深度残差收缩网络、软标签学习网络、自监督学习网络、小样本分类网络、无监督域适应模块以及分类器组成；

；

；

小样本分类网络用于接收源域数据集中的标记样本数据集S_L和目标域数据集中的标记样本数据集T_L经特征提取器提取后的特征，然后和结合小样本学习得到小样本分类损失，源域数据集的小样本分类损失和目标域数据集的小样本分类损失分别为

和

；

。

6.根据权利要求1所述的基于自监督和小样本学习的跨域高光谱图像分类方法，其特征在于：步骤S5中，网络综合损失

的计算公式，如式（5）所示：

（5）

其中，

和

分别表示源域数据集和目标域数据集的损失；

而源域数据集损失，通过式（6）计算：

（6）

、自监督学习损失

以及域适应损失

；

而目标域数据集损失，通过式（7）计算：

（7）

、软标签损失

以及域适应损失

。

7.根据权利要求1所述的基于自监督和小样本学习的跨域高光谱图像分类方法，其特征在于：步骤S5中，源域数据集的小样本分类损失

与目标域数据集的小样本分类损失

计算方法相同；源域数据集的小样本分类损失

，

的计算公式如式（8）所示：

（8）

式（8）中，

表示映射层，

和

，可以得到查询集的类分布，

的计算公式如式（9）所示：

（9）

式（9）中，

表示负平方欧氏距离；

，本申请中所有查询集Q样本的分类损失

即为源域数据集的小样本损失

，其中，

的计算公式如式（10）所示：

（10）

式（10）中，S和Q分别是支持集和查询集。

8.根据权利要求1所述的基于自监督和小样本学习的跨域高光谱图像分类方法，其特征在于：步骤S5中，自监督学习损失L_s的计算方法如下所示：复制一份支持集S与查询集Q，并将支持集S与查询集Q里面的光谱向量翻转，分别得到S’与Q’，而后给予原数据(S,Q)中所有样本标签为1，翻转后的数据(S^’,Q^’)中所有样本标签为0；而后，将所有数据送入特征提取器提取特征，然后将原数据和翻转后的数据特征结果送入分类器中预测是否翻转，本发明中自监督学习的损失被定义为