CN113221848A

CN113221848A - 基于多分类器域对抗网络的高光谱开放集领域自适应方法

Info

Publication number: CN113221848A
Application number: CN202110639872.2A
Authority: CN
Inventors: 彭元喜; 唐学斌; 杨文婧; 徐炜遐; 周侗; 李春潮; 涂文轩
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2021-06-09
Filing date: 2021-06-09
Publication date: 2021-08-06
Anticipated expiration: 2041-06-09
Also published as: CN113221848B

Abstract

一种基于多分类器域对抗网络的高光谱开放集领域自适应方法，基于多分类器结构的动态自适应阈值方案以评估目标域中各样本的域级可识别特征信息，从而增强对抗训练过程的鲁棒性，最终实现在准确分类目标域中与源域的共有类别的同时拒绝未知类别目标为“unknown”类。本发明结构清晰，易于实现，能够明显提升开放集场景下的高光谱图像分类效果，具有深厚的理论基础与实际意义。

Description

基于多分类器域对抗网络的高光谱开放集领域自适应方法

技术领域

本发明涉及高光谱图像开放集分类领域技术领域，尤其涉及一种基于多分类器域对抗网络的高光谱开放集领域自适应方法。

背景技术

高光谱图像以其丰富的空间和光谱信息而被广泛应用于解决遥感领域中的众多问题，如地物分类、地物分割等。其中，地物分类是将高光谱图像中的像元数据自动分配给正确地物类别标签的过程，早期的地物分类研究是基于手工标注特征实现的，即首先提取高光谱图像数据的有效特征，接着使用分类器将特征分类到正确标签。随着深度学习技术被证明在数据深层特征挖掘方面的强大优势，它已逐渐成为人工智能领域的研究热点和主流发展方向，特别是在计算机视觉这一重要分支中，卷积神经网络(convolutional neuralnetwork，CNN)的出现极大地提高了图像分类、检测与分割等任务的性能，因而将深度学习方法应用于高光谱遥感图像中的地物分类问题可以降低人工特征提取的成本，并提升算法性能。

然而，在许多实际研究中，总会面临可用于训练的标注样本有限或缺乏的情况，如在不同位置用不同传感器采集图像时，用于学习模型的训练数据可能与测试数据具有不同的分布，且测试样本规模大而无法进行大量标注。因此，缩小源领域与目标领域之间的分布差异，提高分类性能是很有必要的。迁移学习(transfer learning，TL)中的领域自适应(domain adaptation，DA)方法就是从有标注的源域数据中学习分类模型，并在无标注目标域数据上进行调整，使其最终适用于目标域上的分类任务。

在高光谱遥感地物分类中，目前绝大多数研究都是在封闭集的理想假设下进行的，即测试时样本的类别空间与训练时保持一致。事实上，开放环境下的高光谱遥感场景中，测试样本中往往包含一些训练过程中未出现的类别，如何在正确分类已知类的前提下实现未知类别目标的检测是一个挑战。

在封闭集领域自适应方法中，源领域高光谱数据与目标领域高光谱数据共有类别空间。而在开放环境下，领域自适应方法则需要考虑到迁移学习过程中目标领域包含一些源领域中未出现的样本类别，这些样本应被划分为未知类“unknown”，若将未知类样本错误地分类为共有类别之一，将会导致负迁移问题。这给高光谱开放集领域自适应方法提出了以下要求：(1)学习源域已标注样本的鲁棒性特征表示，(2)减少源分布与目标分布之间的数据偏移(Datashift)，保证从源域学习到的分类特征可用于目标域中已知类别目标的分类，(3)检测出目标领域中的未知类并克服负迁移。例如Nirmal等人引入开放集领域自适应方法解决高光谱图像的分类问题，该方法采用对抗学习的策略训练模型，并设定一个固定的经验阈值来减少域间分布差异，同时将未知类别样本与已知类别分离。然而固定的经验阈值并不能挖掘目标域样本潜在的标签和领域信息，易导致在经验阈值附近区间发生负迁移，从而降低分类精度。

发明内容

本发明所要解决的技术问题在于针对开放集场景下的高光谱图像分类任务中数据标注成本高昂、耗时长、分类精度不高等问题，提供一种基于多分类器域对抗网络的高光谱开放集领域自适应方法。

本发明提供一种基于多分类器域对抗网络的高光谱开放集领域自适应方法，包括：

S1：获取高光谱图像；

S2：从所述高光谱图像中提取立方体数据构建源域

与目标域

n_s表示源域中样本的个数，源域的样本标签集合l_s中包含N类标注标签，N类标注标签已知，x_i ^s为源域的样本，

为源域的样本

对应的标注标签；n_t表示目标域中样本的个数，目标域的样本标签集合l_t中包含M类标签，

为目标域的样本；源域与目标域的公共标签集合表示为l＝l_s∩l_t，目标域的私有标签集合表示为

且目标域的样本标签集合l_t中具有源域中的N类标注标签；

S3：构造域对抗神经网络模型，所述域对抗神经网络模型包括特征向量生成器、领域主分类器、源域辅助分类器和领域辅助分类器；所述特征向量生成器适于对输入至特征向量生成器的样本进行空间与光谱特征提取并输出特征向量至所述领域主分类器和所述源域辅助分类器；所述领域主分类器适于通过softmax分类器进行伪决策并输出伪决策信息q₁(x)至所述领域辅助分类器，所述伪决策信息q₁(x)为样本归属于N类标注标签的概率之和；所述源域辅助分类器适于通过LeakySoftmax分类层得到N维概率向量LeakySoftmax(z₂)，并输出q₂(x)至领域辅助分类器，q₂(x)为N维概率向量LeakySoftmax(z₂)中的第一维概率至第N维概率之和；所述领域辅助分类器适于基于q₁(x)与q₂(x)进行目标域中样本与源域中样本标签集合的相似性计算，逐个生成目标域中各样本的自适应阈值，自适应阈值为目标域中样本归属于公共标签集合的概率；

S4：从源域中取出m个样本

从目标域中取出m个样本

将m个样本

和m个样本

同时输入所述域对抗神经网络模型，对所述域对抗神经网络模型进行小批量训练。

可选的，获取所述高光谱图像的方法包括：提供原始高光谱图像；对所述原始高光谱图像进行双边滤波预处理以形成所述高光谱图像；所述高光谱图像中数据立方体的空间维尺寸与所述原始高光谱图像中数据立方体的空间维尺寸相同，所述高光谱图像中数据立方体的光谱通道数与所述原始高光谱图像中数据立方体的光谱通道数相同。

可选的，所述特征向量生成器包括第一3D卷积层、第二3D卷积层和第三3D卷积层、第一全连接层和第二全连接层；第二3D卷积层位于第一3D卷积层和第三3D卷积层之间，第一全连接层位于第三3D卷积层和第二全连接层之间。

可选的，第一3D卷积层具有4个卷积内核，第一3D卷积层中每个卷积内核的大小为3×3×3，第一3D卷积层适于进行卷积操作的步长为1×1×1；第二3D卷积层包括2个卷积内核，第二3D卷积层中每个卷积内核的大小为3×3×3，第二3D卷积层适于进行卷积操作的卷积步长为1×1×1；第三3D卷积层具有2个卷积内核，第三3D卷积层中每个卷积内核的大小为5×5×5，第三3D卷积层适于进行卷积操作的卷积步长为1×1×3。

可选的，所述第一3D卷积层、第二3D卷积层、第三3D卷积层、第一全连接层和第二全连接层的每层中均引入LeakyRelu函数作为第一激活函数；所述第一3D卷积层、第二3D卷积层、第三3D卷积层、第一全连接层和第二全连接层的每层之后均增加第一批标准化处理层。

可选的，所述领域主分类器的结构包括：第一全连接网络，第一全连接网络适于输出包含N+1个通道；与第一全连接网络中的末层连接的softmax分类器；所述softmax分类器适于输出N+1维概率向量softmax(z₁)；

其中，z₁为第一全连接网络中的末层输出的激活向量，z_1k表示z₁的第k个分量；N+1维概率向量softmax(z₁)包括第一维概率至第N+1维概率；N+1维概率向量softmax(z₁)的第一维概率至第N维概率中，第n维概率为样本属于源域中N类标注标签的概率，n为大于等于1且小于等于N的整数；N+1维概率向量softmax(z₁)的第N+1维概率为样本归属于未知标签的概率。

可选的，所述第一全连接网络包括：若干层第一子全连接层、位于相邻的第一子全连接层之间的第一Dropout处理层、以及位于相邻的第一子全连接层之间的第二批标准化处理层；第一全连接网络中的各层第一子全连接层中均引入LeakyRelu函数作为第二激活函数。

可选的，所述源域辅助分类器的结构包括：第二全连接网络，第二全连接网络适于输出包含N个通道；与所述第二全连接网络中的末层连接的LeakySoftmax分类层，LeakySoftmax分类层适于输出N维概率向量LeakySoftmax(z₂)，

其中，z₂为第二全连接网络中的末层输出的向量，z_2k表示z₂的第k个分量。

可选的，所述第二全连接网络包括若干层第二子全连接层、以及位于相邻的第二子全连接层之间的第二Dropout处理层；第二全连接网络中的各层第二子全连接层中均引入LeakyRelu函数作为第三激活函数。

可选的，q₁(x)＝1-P(y＝N+1|x)；

为源域辅助分类器输出的第k维概率；x表示样本；G(x)表示特征向量生成器输出的特征向量；

为所述领域辅助分类器的输出，j为大于等于1的整数；

为目标域中的样本；

的获取过程包括：

可选的，采用对抗学习的策略训练所述域对抗神经网络模型；对所述域对抗神经网络模型进行小批量训练的过程包括：在源域中的m个样本

上训练特征向量生成器与领域主分类器；在源域中的m个样本

上训练特征向量生成器与领域主分类器的过程中，采用损失函数

进行评估，损失函数

的表达式为：

其中，

为表示特征向量生成器当输入样本为x_i ^s时输出的特征向量，

表示标准交叉熵损失函数；标准交叉熵损失函数用以最小化领域主分类器在源域的m个样本上的分类误差。

可选的，在源域中的m个样本

上训练特征向量生成器与领域主分类器的过程中，采用二元交叉熵损失函数

来对抗性地最大化领域主分类器的分类误差，用以找到未知类别的样本的边界，将目标域中的未知类别样本与已知类别样本分离；二元交叉熵损失函数

的表达式为：

其中，

为领域辅助分类器的输出，1-P(y＝N+1|x)为领域主分类器输出的前N维概率之和，P(y＝N+1|x)为领域主分类器输出的第N+1维概率。

可选的，进行小批量训练的过程还包括：在源域中的m个样本

上训练特征向量生成器与领域主分类器之后，将源域中样本

的真实标签表示为one-hot向量形式

并使用基于N类分类的一对多二元损失函数

训练所述源域辅助分类器，

表示为当样本为

时源域辅助分类器输出的第k维概率；所述领域辅助分类器在训练过程中还遵循损失函数E_D，

其中，

可选的，还包括:采用反向传播算法和自适应矩估计优化器更新所述域对抗神经网络模型的参数，并在计算

的梯度时引入梯度反转层以实现有效的对抗训练；所述域对抗神经网络模型的总体优化目标表示为：

θ_G表示所述特征向量生成器的参数；

表示所述领域主分类器的参数，

表示所述源域辅助分类器的参数。

本发明技术方案具有以下有益效果：

本发明技术方案提供的基于多分类器域对抗网络的高光谱开放集领域自适应方法，利用开放集领域自适应方法解决高光谱图像开放集分类问题，提出了以3DCNN为主体的多分类器域对抗模型，降低了对标注样本量的要求，能够实现比结合深度学习与概率模型进行高光谱开放集识别更好的分类性能和实时性，且适用于大规模的高光谱图像。为了克服负迁移问题，引入动态自适应阈值方案来有效衡量目标域样本与源域的相似性，充分挖掘目标域样本潜在的标签和领域信息，从而优化分类性能。本发明所提出域对抗神经网络模型无需在源域数据上进行预训练，域对抗神经网络模型的所有参数更新遵循端到端的方式，复杂度低，实现简单。

附图说明

图1是本发明的高光谱图像开放集领域自适应场景设定示意图；

图2是本发明提出的域对抗神经网络模型的训练阶段流程示意图；

图3是本发明提出的域对抗神经网络模型的测试阶段流程示意图；

图4是本发明在具体应用实施例中采用的高光谱数据集示意图；

图5是本发明应用实施例中高光谱数据集进行双边滤波前(左)后(右)的单波段伪彩色图像；

图6是本发明的整体框架图。

具体实施方式

本发明一实施例提供一种基于多分类器域对抗网络的高光谱开放集领域自适应方法，包括：

S1：获取高光谱图像；

本实施例中，获取高光谱图像的方法包括：提供原始高光谱图像；对所述原始高光谱图像进行双边滤波预处理以形成高光谱图像。

原始高光谱图像表示为P∈H^A×B×C，A为原始高光谱图像中数据立方体的高度，B为原始高光谱图像中数据立方体的宽度，C为原始高光谱图像中数据立方体的光谱通道数。高光谱图像表示为

高光谱图像中数据立方体的空间维尺寸与原始高光谱图像中数据立方体的空间维尺寸相同，高光谱图像中数据立方体的光谱通道数与原始高光谱图像中数据立方体的光谱通道数相同。

双边滤波预处理在对原始高光谱图像去噪的同时保留原始高光谱图像的边缘信息。

S2：从所述高光谱图像中提取立方体数据构建源域

与目标域

源域表示为

n_s表示源域中像元的个数，也就是源域中样本的总数量；源域的样本标签集合表示为l_s，源域的样本标签集合l_s中包含N类标注标签，

为源域的样本，

为源域的样本

对应的标注标签；N类标注标签来自分布p_s，N类标注标签已知，N为大于等于2的整数；

目标域表示为

n_t表示目标域中像元的个数，也就是目标域中样本的总数量；目标域的样本标签集合表示为l_t，目标域的样本标签集合l_t中包含M类标签，M类标签来自分布p_t，M大于N，M为大于N的整数，

为目标域的样本。

源域与目标域的公共标签集合表示为l＝l_s∩l_t。

目标域的私有标签集合表示为

即目标域的样本标签集合中具有源域中的N类标注标签。

目标域的样本标签集合l_t中包含M类标签，M类标签的一部分为N类标注标签，M类标签的另一部分为私有标签。

n_s＜＜n_t，目标域中的样本的数量远多于源域中的样本的数量。

从所述高光谱图像中提取立方体数据构建源域与目标域，具体的，从高光谱图像中提取若干个以单个像元为中心的立方体数据

构建源域与目标域，V×V为从高光谱图像中提取的立方体数据的空间维尺寸。

参考图1，源域中包括5类样本标签，分别为“树木”、“沥青”、“瓷砖”、“裸土”、“草地”，样本标签为“树木”的样本数量为3个，样本标签为“沥青”的样本数量为3个，样本标签为“瓷砖”的样本数量为3个，样本标签为“裸土”的样本数量为3个，样本标签为“草地”的样本数量为3个。

参考图1，目标域中包括若干类标签，目标域中具有源域中所有的样本标签，

目标域的样本标签集合中包含源域中包括的5类样本标签，还具有私有标签，私有标签属于未知(unknown)类。

S3：构造域对抗神经网络模型，所述域对抗神经网络模型包括特征向量生成器G、领域主分类器C₁、源域辅助分类器C₂和领域辅助分类器D。

所述特征向量生成器G适于对输入至特征向量生成器G的样本进行空间与光谱特征提取并输出特征向量G(x)至所述领域主分类器和所述源域辅助分类器。所述特征向量生成器G适于将特征向量G(x)输出至领域主分类器C₁和源域辅助分类器C₂。所述特征向量生成器G适于同时将特征向量G(x)输出至领域主分类器C₁和源域辅助分类器C₂。其中，x为样本。

所述特征向量生成器G包括第一3D卷积层Conv1、第二3D卷积层Conv2和第三3D卷积层Conv3、第一全连接层FC1和第二全连接层FC2；第一3D卷积层Conv1具有4个卷积内核，第一3D卷积层Conv1中每个卷积内核的大小为3×3×3，第一3D卷积层Conv1适于进行卷积操作的步长为1×1×1；第二3D卷积层Conv2包括2个卷积内核，第二3D卷积层Conv2中每个卷积内核的大小为3×3×3，第二3D卷积层Conv2适于进行卷积操作的卷积步长为1×1×1；第三3D卷积层Conv3具有2个卷积内核，第三3D卷积层Conv3中每个卷积内核的大小为5×5×5，第三3D卷积层Conv3适于进行卷积操作的卷积步长为1×1×3。第三3D卷积层Conv3的输出包含256个通道，第二全连接层的输出包含100个通道。

3D卷积层指的是三维卷积层。

卷积内核的大小表示为aⅹbⅹc，a表示卷积内核的depth，b表示卷积内核的height，c表示表示卷积内核的width。

第二3D卷积层Conv2位于第一3D卷积层Conv1和第三3D卷积层Conv3之间，第一全连接层FC1位于第三3D卷积层Conv3和第二全连接层FC2之间。

所述第一3D卷积层Conv1、第二3D卷积层Conv2、第三3D卷积层Conv3、第一全连接层FC1和第二全连接层FC2的每层中均引入LeakyRelu函数作为第一激活函数；所述第一3D卷积层Conv1、第二3D卷积层Conv2、第三3D卷积层Conv3、第一全连接层FC1和第二全连接层FC2的每层之后均增加第一批标准化处理(Batch Normalization，BN)层。以使特征向量生成器提取的特征更加的精准。

所述领域主分类器C₁适于通过softmax分类器进行伪决策并输出伪决策信息q₁(x)至所述领域辅助分类器D，所述伪决策信息q₁(x)为样本归属于N类标注标签的概率之和。

所述领域主分类器C₁的结构包括：第一全连接网络，第一全连接网络适于输出包含N+1个通道；与第一全连接网络中的末层连接的softmax分类器。

第一全连接网络包括若干层第一子全连接层、位于相邻的第一子全连接层之间的第一Dropout处理层、以及位于相邻的第一子全连接层之间的第二批标准化处理(BatchNormalization，BN)层。第一全连接网络中的各层第一子全连接层中均引入LeakyRelu函数作为第二激活函数；第一全连接网络中的相邻的第一子全连接层之间均增加第二批标准化处理(Batch Normalization，BN)层。第一全连接网络中的相邻的第一子全连接层之间均增加第一Dropout处理层，能够防止模型在训练的过程中出现过拟合的现象，使模型在新的数据上表现更加稳定，增加模型的健壮性。本实施例中，第一全连接网络包括第一层第一子全连接层FC3和第二层第一子全连接层FC4作为示例。

所述softmax分类器适于输出N+1维概率向量

其中，z₁为第一全连接网络中的末层输出的激活向量，z_1k表示z₁的第k个分量；N+1维概率向量softmax(z₁)包括第一维概率至第N+1维概率；N+1维概率向量softmax(z₁)的第一维概率至第N维概率中，第n维概率为样本归属于源域中N类标注标签的概率，n为大于等于1且小于等于N的整数；N+1维概率向量softmax(z₁)的第N+1维概率为样本归属于未知标签的概率。伪决策信息q₁(x)为样本归属于N类标注标签的概率之和，也就是softmax(z₁)的第一维概率至第N维概率之和。

所述源域辅助分类器C₂适于通过LeakySoftmax分类层进行领域相似性计算以得到N维概率向量LeakySoftmax(z₂)，并输出N维概率向量LeakySoftmax(z₂)中的第一维概率至第N维概率之和为q₂(x)至领域辅助分类器D。q₂(x)为N维概率向量LeakySoftmax(z₂)中的第一维概率至第N维概率之和。

源域辅助分类器C₂的结构包括：第二全连接网络，第二全连接网络适于输出包含N个通道；与所述第二全连接网络中的末层连接的LeakySoftmax分类层，LeakySoftmax分类层适于输出N维概率向量LeakySoftmax(z₂)，

所述第二全连接网络包括若干层第二子全连接层、以及位于相邻的第二子全连接层之间的第二Dropout处理层。第二全连接网络中的各层第二子全连接层中均引入LeakyRelu函数作为第三激活函数。第二全连接网络中的相邻的第二子全连接层之间均增加第二Dropout处理层，能够防止模型在训练的过程中出现过拟合的现象，使模型在新的数据上表现更加稳定，增加模型的健壮性。

本实施例中，所述第二全连接网络包括第一层第二子全连接层FC5、第二层第二子全连接层FC6和第三层第二子全连接层FC7。

所述领域辅助分类器D适于基于伪决策信息q1(x)与N维概率向量LeakySoftmax(z₂)中的第一维概率至第N维概率之和q₂(x)进行目标域中样本与源域中样本标签集合的相似性计算，逐个生成目标域中各样本的自适应阈值，自适应阈值为目标域中样本归属于公共标签集合的概率。

所述领域辅助分类器为非对抗性的领域辅助分类器。

为领域辅助分类器D的输出。其中，j为大于等于1的整数。x_j ^t为目标域中的样本。

的获取过程包括：

其中，q₁(x)＝1-P(y＝N+1|x)，

为源域辅助分类器C₂输出的第k维概率，即样本归属于第k类标注标签的概率，即样本归属于公共标签集合l的概率。q₁(x)＝1-P(y＝N+1|x)，为领域主分类器C₁输出的前N维概率之和。x表示样本；G(x)表示特征向量生成器输出的特征向量。

S4：从源域中取出m个样本

从目标域中取出m个样本

将m个样本

和m个样本

采用对抗学习的策略训练所述域对抗神经网络模型，特征向量生成器G能够减少源域与目标域中的特征分布差异，领域主分类器C₁的训练目标为区分源域与目标域的特征，最终实现将目标域样本的特征空间与源域样本对齐，生成域不变特征，同时拒绝未知类别(“unknown”类)。

对所述域对抗神经网络模型进行小批量训练的过程包括：在源域中的m个样本

上训练特征向量生成器G与领域主分类器C₁以使得领域主分类器C₁能正确分类属于已知的标注标签的样本。

在源域中的m个样本

上训练特征向量生成器G与领域主分类器C₁的过程中，采用损失函数

进行评估，损失函数

的表达式为

其中，

为表示特征向量生成器当输入样本为

时输出的特征向量，

表示标准交叉熵损失函数，标准交叉熵损失函数用以最小化领域主分类器C₁在源域的m个样本上的分类误差。

在源域中的m个样本

上训练特征向量生成器G与领域主分类器C₁的过程中，采用二元交叉熵损失函数

来对抗性地最大化领域主分类器C₁的分类误差，用以找到未知类别的样本的边界，将目标域中的未知类别样本与已知类别样本分离。

二元交叉熵损失函数

的表达式为：

其中，

为领域辅助分类器D的输出，表示针对目标域各样本与源域的样本标签集合l_s的相似性而计算而得到的自适应阈值，即该目标样本归属于公共标签空间的概率。

的作用是增强训练过程中域对抗神经网络模型的伪决策鲁棒性，具体表现为:促成领域主分类器C₁增大或减小目标域中样本为未知类别的概率

使得特征向量生成器G将目标域中各样本的特征分布分别与源域上的标注标签或未知类别“unknown”对齐，同时缓解负迁移。

1-P(y＝N+1|x)为领域主分类器C₁输出的前N维概率之和，P(y＝N+1|x)领域主分类器输出的第N+1维概率。

进行小批量训练的过程还包括：在源域中的m个样本

上训练特征向量生成器G与领域主分类器C₁之后，将源域中样本

的真实标签表示为one-hot向量形式

并使用基于N类分类的一对多二元损失函数

训练所述源域辅助分类器C₂。

表示为当样本为

时源域辅助分类器输出的第k维概率。

所述领域辅助分类器D在训练过程中还遵循如下损失函数E_D，

其中，

所述基于多分类器域对抗网络的高光谱开放集领域自适应方法还包括:采用反向传播算法和自适应矩估计(Adam)优化器更新所述域对抗神经网络模型的参数，并在计算

的梯度时引入梯度反转层以实现有效的对抗训练。

所述域对抗神经网络模型的总体优化目标表示为：

θ_G表示所述特征向量生成器G的参数；

表示所述领域主分类器C₁的参数，

表示所述源域辅助分类器C₂的参数。

在本发明实施中，采用域对抗神经网络实现目标域与源域高光谱数据间共有类别的特征对齐并进行未知类别的拒绝，为了抑制负迁移现象，引入一种动态自适应阈值方案充分挖掘目标域样本潜在的标签和领域信息，从而有效地衡量目标域样本与源域的相似性，最终提升分类精度。

基于域对抗网络的开放集领域自适应方法的模型训练阶段流程示意图如图2所示，遵循上述步骤进行模型的训练后，特征向量生成器G和领域主分类器C₁已经能够适应目标域的高光谱样本数据。因而最后在测试阶段仅使用训练好的特征向量生成器G与领域主分类器C₁来正确分类目标域高光谱图像，测试阶段的流程示意图如图3所示。

如图4所示，为了更形象地说明本发明的技术方案，本实例采用在帕维亚大学(Pavia University)场景拍摄的高光谱图像公开数据集构造源域和目标域数据集，PaviaUniversity场景获取的数据集由ROSIS传感器采集，高光谱图像的像素尺寸大小为610×610，共42775个有效像元，每个像元包含103个光谱波段数，几何分辨率为1.3米，其中地面覆盖实物共9个类别。

S11:首先对Pavia University数据集的原始高光谱图像进行双边滤波预处理，其中设定滤波窗口直径大小为7，像素域核的控制参数σ_r和空间域核的控制参数σ_s皆为10，双边滤波前后的单波段伪彩色图像如图5所示。接着，从滤波后的高光谱图像中随机提取5类地物的光谱反射数据构造源域数据集，则以单个像元为中心的光谱立方体数据表示为P∈H^9×9×103，每种地物类别取800个像元，共4000个像元。将双边滤波后的整个PaviaUniversity数据集作为目标域数据集，则源域中未包含的4种地物类别在开放集识别任务中应被划分为“unknown”类，如图1所示。

S12:如图2所示，域对抗神经网络模型的特征向量生成器生成特征向量G(x)，在本实例中，每个特征向量数组的长度为512，分别将其输入至领域主分类器C₁与源域辅助分类器C₂。领域主分类器C₁通过softmax分类器对每个输入样本进行伪决策并输出样本归属于前5个已知类别的概率之和q₁(x)，q₂(x)为C₂的LeakySoftmax层输出的概率分布之和，领域辅助分类器D整合q₁(x)和q₂(x)进行目标域中样本与源域的样本标签集合的相似性计算，逐个生成对抗训练的自适应阈值。

S13：对域对抗神经网络模型的参数更新优化，在梯度的反向传播过程中引入梯度反转层实现对抗训练，使用步骤S12生成的动态自适应阈值方案，减少源域与目标域共有类别样本间的生成特征差异，并克服域间迁移学习过程中的负迁移，使得特征向量生成器G和领域主分类器C₁能够适应目标域高光谱数据的已知类分类和未知类拒绝。

S14：使用训练好的特征向量生成器G和领域主分类器C₁在目标域上进行分类性能测试，最终通过领域主分类器C₁的softmax层输出预测各像元高光谱数据的归属类别，如图6所示为整个方法的整体流程示意图。

随后，从源域与目标域中分别取出128个样本

和

作为模型的输入进行小批量训练。

本实施例中，首先对原始高光谱图像进行双边滤波预处理以实现保边去噪，接着设计基于3DCNN特征提取的域对抗网络模型，综合考虑高光谱图像的空间与光谱信息，并采用对抗学习的策略在有标签源域和无标签目标域数据上共同训练模型。为克服域间知识迁移过程中的负迁移问题，本发明引入一种基于多分类器结构的动态自适应阈值方案以评估目标域中各样本的域级可识别特征信息，从而增强对抗训练过程的鲁棒性，最终实现在准确分类目标域中与源域的共有类别的同时拒绝未知类别目标为“unknown”类。本发明结构清晰，易于实现，能够明显提升开放集场景下的高光谱图像分类效果，具有深厚的理论基础与实际意义。

上述只是本发明的较佳实施例，并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上，然而并非用以限定本发明。因此，凡是未脱离本发明技术方案的内容，依据本发明技术实质对以上实施例所做的任何简单修改、等同变化及修饰，均应落在本发明技术方案保护的范围内。

Claims

1.一种基于多分类器域对抗网络的高光谱开放集领域自适应方法，其特征在于，包括：

S1：获取高光谱图像；

S2：从所述高光谱图像中提取立方体数据构建源域

与目标域

n_s表示源域中样本的个数，源域的样本标签集合l_s中包含N类标注标签，N类标注标签已知，

为源域的样本，

为源域的样本

且目标域的样本标签集合l_t中具有源域中的N类标注标签；

S4：从源域中取出m个样本

从目标域中取出m个样本

将m个样本

和m个样本

2.根据权利要求1所述的基于多分类器域对抗网络的高光谱开放集领域自适应方法，其特征在于，获取所述高光谱图像的方法包括：提供原始高光谱图像；对所述原始高光谱图像进行双边滤波预处理以形成所述高光谱图像；所述高光谱图像中数据立方体的空间维尺寸与所述原始高光谱图像中数据立方体的空间维尺寸相同，所述高光谱图像中数据立方体的光谱通道数与所述原始高光谱图像中数据立方体的光谱通道数相同。

3.根据权利要求1所述的基于多分类器域对抗网络的高光谱开放集领域自适应方法，其特征在于，所述特征向量生成器包括第一3D卷积层、第二3D卷积层和第三3D卷积层、第一全连接层和第二全连接层；第二3D卷积层位于第一3D卷积层和第三3D卷积层之间，第一全连接层位于第三3D卷积层和第二全连接层之间。

4.根据权利要求3所述的基于多分类器域对抗网络的高光谱开放集领域自适应方法，其特征在于，第一3D卷积层具有4个卷积内核，第一3D卷积层中每个卷积内核的大小为3×3×3，第一3D卷积层适于进行卷积操作的步长为1×1×1；第二3D卷积层包括2个卷积内核，第二3D卷积层中每个卷积内核的大小为3×3×3，第二3D卷积层适于进行卷积操作的卷积步长为1×1×1；第三3D卷积层具有2个卷积内核，第三3D卷积层中每个卷积内核的大小为5×5×5，第三3D卷积层适于进行卷积操作的卷积步长为1×1×3。

5.根据权利要求3所述的基于多分类器域对抗网络的高光谱开放集领域自适应方法，其特征在于，所述第一3D卷积层、第二3D卷积层、第三3D卷积层、第一全连接层和第二全连接层的每层中均引入LeakyRelu函数作为第一激活函数；所述第一3D卷积层、第二3D卷积层、第三3D卷积层、第一全连接层和第二全连接层的每层之后均增加第一批标准化处理层。

6.根据权利要求1所述的基于多分类器域对抗网络的高光谱开放集领域自适应方法，其特征在于，所述领域主分类器的结构包括：第一全连接网络，第一全连接网络适于输出包含N+1个通道；与第一全连接网络中的末层连接的softmax分类器；

所述softmax分类器适于输出N+1维概率向量softmax(z₁)；

其中，z₁为第一全连接网络中的末层输出的激活向量；z_1k表示z₁的第k个分量，N+1维概率向量softmax(z₁)包括第一维概率至第N+1维概率；N+1维概率向量softmax(z₁)的第一维概率至第N维概率中，第n维概率为样本属于源域中N类标注标签的概率，n为大于等于1且小于等于N的整数；N+1维概率向量softmax(z₁)的第N+1维概率为样本归属于未知标签的概率。

7.根据权利要求6所述的基于多分类器域对抗网络的高光谱开放集领域自适应方法，其特征在于，所述第一全连接网络包括：若干层第一子全连接层、位于相邻的第一子全连接层之间的第一Dropout处理层、以及位于相邻的第一子全连接层之间的第二批标准化处理层；第一全连接网络中的各层第一子全连接层中均引入LeakyRelu函数作为第二激活函数。

8.根据权利要求1所述的基于多分类器域对抗网络的高光谱开放集领域自适应方法，其特征在于，

所述源域辅助分类器的结构包括：第二全连接网络，第二全连接网络适于输出包含N个通道；与所述第二全连接网络中的末层连接的LeakySoftmax分类层，LeakySoftmax分类层适于输出N维概率向量LeakySoftmax(z₂)，