CN113221848A - 基于多分类器域对抗网络的高光谱开放集领域自适应方法 - Google Patents
基于多分类器域对抗网络的高光谱开放集领域自适应方法 Download PDFInfo
- Publication number
- CN113221848A CN113221848A CN202110639872.2A CN202110639872A CN113221848A CN 113221848 A CN113221848 A CN 113221848A CN 202110639872 A CN202110639872 A CN 202110639872A CN 113221848 A CN113221848 A CN 113221848A
- Authority
- CN
- China
- Prior art keywords
- domain
- classifier
- layer
- samples
- hyperspectral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/194—Terrestrial scenes using hyperspectral data, i.e. more or other wavelengths than RGB
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Astronomy & Astrophysics (AREA)
- Remote Sensing (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
一种基于多分类器域对抗网络的高光谱开放集领域自适应方法,基于多分类器结构的动态自适应阈值方案以评估目标域中各样本的域级可识别特征信息,从而增强对抗训练过程的鲁棒性,最终实现在准确分类目标域中与源域的共有类别的同时拒绝未知类别目标为“unknown”类。本发明结构清晰,易于实现,能够明显提升开放集场景下的高光谱图像分类效果,具有深厚的理论基础与实际意义。
Description
技术领域
本发明涉及高光谱图像开放集分类领域技术领域,尤其涉及一种基于多分类器域对抗网络的高光谱开放集领域自适应方法。
背景技术
高光谱图像以其丰富的空间和光谱信息而被广泛应用于解决遥感领域中的众多问题,如地物分类、地物分割等。其中,地物分类是将高光谱图像中的像元数据自动分配给正确地物类别标签的过程,早期的地物分类研究是基于手工标注特征实现的,即首先提取高光谱图像数据的有效特征,接着使用分类器将特征分类到正确标签。随着深度学习技术被证明在数据深层特征挖掘方面的强大优势,它已逐渐成为人工智能领域的研究热点和主流发展方向,特别是在计算机视觉这一重要分支中,卷积神经网络(convolutional neuralnetwork,CNN)的出现极大地提高了图像分类、检测与分割等任务的性能,因而将深度学习方法应用于高光谱遥感图像中的地物分类问题可以降低人工特征提取的成本,并提升算法性能。
然而,在许多实际研究中,总会面临可用于训练的标注样本有限或缺乏的情况,如在不同位置用不同传感器采集图像时,用于学习模型的训练数据可能与测试数据具有不同的分布,且测试样本规模大而无法进行大量标注。因此,缩小源领域与目标领域之间的分布差异,提高分类性能是很有必要的。迁移学习(transfer learning,TL)中的领域自适应(domain adaptation,DA)方法就是从有标注的源域数据中学习分类模型,并在无标注目标域数据上进行调整,使其最终适用于目标域上的分类任务。
在高光谱遥感地物分类中,目前绝大多数研究都是在封闭集的理想假设下进行的,即测试时样本的类别空间与训练时保持一致。事实上,开放环境下的高光谱遥感场景中,测试样本中往往包含一些训练过程中未出现的类别,如何在正确分类已知类的前提下实现未知类别目标的检测是一个挑战。
在封闭集领域自适应方法中,源领域高光谱数据与目标领域高光谱数据共有类别空间。而在开放环境下,领域自适应方法则需要考虑到迁移学习过程中目标领域包含一些源领域中未出现的样本类别,这些样本应被划分为未知类“unknown”,若将未知类样本错误地分类为共有类别之一,将会导致负迁移问题。这给高光谱开放集领域自适应方法提出了以下要求:(1)学习源域已标注样本的鲁棒性特征表示,(2)减少源分布与目标分布之间的数据偏移(Datashift),保证从源域学习到的分类特征可用于目标域中已知类别目标的分类,(3)检测出目标领域中的未知类并克服负迁移。例如Nirmal等人引入开放集领域自适应方法解决高光谱图像的分类问题,该方法采用对抗学习的策略训练模型,并设定一个固定的经验阈值来减少域间分布差异,同时将未知类别样本与已知类别分离。然而固定的经验阈值并不能挖掘目标域样本潜在的标签和领域信息,易导致在经验阈值附近区间发生负迁移,从而降低分类精度。
发明内容
本发明所要解决的技术问题在于针对开放集场景下的高光谱图像分类任务中数据标注成本高昂、耗时长、分类精度不高等问题,提供一种基于多分类器域对抗网络的高光谱开放集领域自适应方法。
本发明提供一种基于多分类器域对抗网络的高光谱开放集领域自适应方法,包括:
S1:获取高光谱图像;
S2:从所述高光谱图像中提取立方体数据构建源域与目标域ns表示源域中样本的个数,源域的样本标签集合ls中包含N类标注标签,N类标注标签已知,xi s为源域的样本,为源域的样本对应的标注标签;nt表示目标域中样本的个数,目标域的样本标签集合lt中包含M类标签,为目标域的样本;源域与目标域的公共标签集合表示为l=ls∩lt,目标域的私有标签集合表示为且目标域的样本标签集合lt中具有源域中的N类标注标签;
S3:构造域对抗神经网络模型,所述域对抗神经网络模型包括特征向量生成器、领域主分类器、源域辅助分类器和领域辅助分类器;所述特征向量生成器适于对输入至特征向量生成器的样本进行空间与光谱特征提取并输出特征向量至所述领域主分类器和所述源域辅助分类器;所述领域主分类器适于通过softmax分类器进行伪决策并输出伪决策信息q1(x)至所述领域辅助分类器,所述伪决策信息q1(x)为样本归属于N类标注标签的概率之和;所述源域辅助分类器适于通过LeakySoftmax分类层得到N维概率向量LeakySoftmax(z2),并输出q2(x)至领域辅助分类器,q2(x)为N维概率向量LeakySoftmax(z2)中的第一维概率至第N维概率之和;所述领域辅助分类器适于基于q1(x)与q2(x)进行目标域中样本与源域中样本标签集合的相似性计算,逐个生成目标域中各样本的自适应阈值,自适应阈值为目标域中样本归属于公共标签集合的概率;
可选的,获取所述高光谱图像的方法包括:提供原始高光谱图像;对所述原始高光谱图像进行双边滤波预处理以形成所述高光谱图像;所述高光谱图像中数据立方体的空间维尺寸与所述原始高光谱图像中数据立方体的空间维尺寸相同,所述高光谱图像中数据立方体的光谱通道数与所述原始高光谱图像中数据立方体的光谱通道数相同。
可选的,所述特征向量生成器包括第一3D卷积层、第二3D卷积层和第三3D卷积层、第一全连接层和第二全连接层;第二3D卷积层位于第一3D卷积层和第三3D卷积层之间,第一全连接层位于第三3D卷积层和第二全连接层之间。
可选的,第一3D卷积层具有4个卷积内核,第一3D卷积层中每个卷积内核的大小为3×3×3,第一3D卷积层适于进行卷积操作的步长为1×1×1;第二3D卷积层包括2个卷积内核,第二3D卷积层中每个卷积内核的大小为3×3×3,第二3D卷积层适于进行卷积操作的卷积步长为1×1×1;第三3D卷积层具有2个卷积内核,第三3D卷积层中每个卷积内核的大小为5×5×5,第三3D卷积层适于进行卷积操作的卷积步长为1×1×3。
可选的,所述第一3D卷积层、第二3D卷积层、第三3D卷积层、第一全连接层和第二全连接层的每层中均引入LeakyRelu函数作为第一激活函数;所述第一3D卷积层、第二3D卷积层、第三3D卷积层、第一全连接层和第二全连接层的每层之后均增加第一批标准化处理层。
可选的,所述领域主分类器的结构包括:第一全连接网络,第一全连接网络适于输出包含N+1个通道;与第一全连接网络中的末层连接的softmax分类器;所述softmax分类器适于输出N+1维概率向量softmax(z1);其中,z1为第一全连接网络中的末层输出的激活向量,z1k表示z1的第k个分量;N+1维概率向量softmax(z1)包括第一维概率至第N+1维概率;N+1维概率向量softmax(z1)的第一维概率至第N维概率中,第n维概率为样本属于源域中N类标注标签的概率,n为大于等于1且小于等于N的整数;N+1维概率向量softmax(z1)的第N+1维概率为样本归属于未知标签的概率。
可选的,所述第一全连接网络包括:若干层第一子全连接层、位于相邻的第一子全连接层之间的第一Dropout处理层、以及位于相邻的第一子全连接层之间的第二批标准化处理层;第一全连接网络中的各层第一子全连接层中均引入LeakyRelu函数作为第二激活函数。
可选的,所述源域辅助分类器的结构包括:第二全连接网络,第二全连接网络适于输出包含N个通道;与所述第二全连接网络中的末层连接的LeakySoftmax分类层,LeakySoftmax分类层适于输出N维概率向量LeakySoftmax(z2),其中,z2为第二全连接网络中的末层输出的向量,z2k表示z2的第k个分量。
可选的,所述第二全连接网络包括若干层第二子全连接层、以及位于相邻的第二子全连接层之间的第二Dropout处理层;第二全连接网络中的各层第二子全连接层中均引入LeakyRelu函数作为第三激活函数。
可选的,q1(x)=1-P(y=N+1|x);为源域辅助分类器输出的第k维概率;x表示样本;G(x)表示特征向量生成器输出的特征向量;为所述领域辅助分类器的输出,j为大于等于1的整数;为目标域中的样本;的获取过程包括:
可选的,采用对抗学习的策略训练所述域对抗神经网络模型;对所述域对抗神经网络模型进行小批量训练的过程包括:在源域中的m个样本上训练特征向量生成器与领域主分类器;在源域中的m个样本上训练特征向量生成器与领域主分类器的过程中,采用损失函数进行评估,损失函数的表达式为:其中,为表示特征向量生成器当输入样本为xi s时输出的特征向量,表示标准交叉熵损失函数;标准交叉熵损失函数用以最小化领域主分类器在源域的m个样本上的分类误差。
可选的,在源域中的m个样本上训练特征向量生成器与领域主分类器的过程中,采用二元交叉熵损失函数来对抗性地最大化领域主分类器的分类误差,用以找到未知类别的样本的边界,将目标域中的未知类别样本与已知类别样本分离;二元交叉熵损失函数的表达式为:其中,为领域辅助分类器的输出,1-P(y=N+1|x)为领域主分类器输出的前N维概率之和,P(y=N+1|x)为领域主分类器输出的第N+1维概率。
可选的,进行小批量训练的过程还包括:在源域中的m个样本上训练特征向量生成器与领域主分类器之后,将源域中样本的真实标签表示为one-hot向量形式并使用基于N类分类的一对多二元损失函数训练所述源域辅助分类器,表示为当样本为时源域辅助分类器输出的第k维概率;所述领域辅助分类器在训练过程中还遵循损失函数ED,其中,
可选的,还包括:采用反向传播算法和自适应矩估计优化器更新所述域对抗神经网络模型的参数,并在计算的梯度时引入梯度反转层以实现有效的对抗训练;所述域对抗神经网络模型的总体优化目标表示为: θG表示所述特征向量生成器的参数;表示所述领域主分类器的参数,表示所述源域辅助分类器的参数。
本发明技术方案具有以下有益效果:
本发明技术方案提供的基于多分类器域对抗网络的高光谱开放集领域自适应方法,利用开放集领域自适应方法解决高光谱图像开放集分类问题,提出了以3DCNN为主体的多分类器域对抗模型,降低了对标注样本量的要求,能够实现比结合深度学习与概率模型进行高光谱开放集识别更好的分类性能和实时性,且适用于大规模的高光谱图像。为了克服负迁移问题,引入动态自适应阈值方案来有效衡量目标域样本与源域的相似性,充分挖掘目标域样本潜在的标签和领域信息,从而优化分类性能。本发明所提出域对抗神经网络模型无需在源域数据上进行预训练,域对抗神经网络模型的所有参数更新遵循端到端的方式,复杂度低,实现简单。
附图说明
图1是本发明的高光谱图像开放集领域自适应场景设定示意图;
图2是本发明提出的域对抗神经网络模型的训练阶段流程示意图;
图3是本发明提出的域对抗神经网络模型的测试阶段流程示意图;
图4是本发明在具体应用实施例中采用的高光谱数据集示意图;
图5是本发明应用实施例中高光谱数据集进行双边滤波前(左)后(右)的单波段伪彩色图像;
图6是本发明的整体框架图。
具体实施方式
本发明一实施例提供一种基于多分类器域对抗网络的高光谱开放集领域自适应方法,包括:
S1:获取高光谱图像;
本实施例中,获取高光谱图像的方法包括:提供原始高光谱图像;对所述原始高光谱图像进行双边滤波预处理以形成高光谱图像。
原始高光谱图像表示为P∈HA×B×C,A为原始高光谱图像中数据立方体的高度,B为原始高光谱图像中数据立方体的宽度,C为原始高光谱图像中数据立方体的光谱通道数。高光谱图像表示为高光谱图像中数据立方体的空间维尺寸与原始高光谱图像中数据立方体的空间维尺寸相同,高光谱图像中数据立方体的光谱通道数与原始高光谱图像中数据立方体的光谱通道数相同。
双边滤波预处理在对原始高光谱图像去噪的同时保留原始高光谱图像的边缘信息。
源域表示为ns表示源域中像元的个数,也就是源域中样本的总数量;源域的样本标签集合表示为ls,源域的样本标签集合ls中包含N类标注标签,为源域的样本,为源域的样本对应的标注标签;N类标注标签来自分布ps,N类标注标签已知,N为大于等于2的整数;
目标域表示为nt表示目标域中像元的个数,也就是目标域中样本的总数量;目标域的样本标签集合表示为lt,目标域的样本标签集合lt中包含M类标签,M类标签来自分布pt,M大于N,M为大于N的整数,为目标域的样本。
源域与目标域的公共标签集合表示为l=ls∩lt。
目标域的样本标签集合lt中包含M类标签,M类标签的一部分为N类标注标签,M类标签的另一部分为私有标签。
ns<<nt,目标域中的样本的数量远多于源域中的样本的数量。
参考图1,源域中包括5类样本标签,分别为“树木”、“沥青”、“瓷砖”、“裸土”、“草地”,样本标签为“树木”的样本数量为3个,样本标签为“沥青”的样本数量为3个,样本标签为“瓷砖”的样本数量为3个,样本标签为“裸土”的样本数量为3个,样本标签为“草地”的样本数量为3个。
参考图1,目标域中包括若干类标签,目标域中具有源域中所有的样本标签,
目标域的样本标签集合中包含源域中包括的5类样本标签,还具有私有标签,私有标签属于未知(unknown)类。
S3:构造域对抗神经网络模型,所述域对抗神经网络模型包括特征向量生成器G、领域主分类器C1、源域辅助分类器C2和领域辅助分类器D。
所述特征向量生成器G适于对输入至特征向量生成器G的样本进行空间与光谱特征提取并输出特征向量G(x)至所述领域主分类器和所述源域辅助分类器。所述特征向量生成器G适于将特征向量G(x)输出至领域主分类器C1和源域辅助分类器C2。所述特征向量生成器G适于同时将特征向量G(x)输出至领域主分类器C1和源域辅助分类器C2。其中,x为样本。
所述特征向量生成器G包括第一3D卷积层Conv1、第二3D卷积层Conv2和第三3D卷积层Conv3、第一全连接层FC1和第二全连接层FC2;第一3D卷积层Conv1具有4个卷积内核,第一3D卷积层Conv1中每个卷积内核的大小为3×3×3,第一3D卷积层Conv1适于进行卷积操作的步长为1×1×1;第二3D卷积层Conv2包括2个卷积内核,第二3D卷积层Conv2中每个卷积内核的大小为3×3×3,第二3D卷积层Conv2适于进行卷积操作的卷积步长为1×1×1;第三3D卷积层Conv3具有2个卷积内核,第三3D卷积层Conv3中每个卷积内核的大小为5×5×5,第三3D卷积层Conv3适于进行卷积操作的卷积步长为1×1×3。第三3D卷积层Conv3的输出包含256个通道,第二全连接层的输出包含100个通道。
3D卷积层指的是三维卷积层。
卷积内核的大小表示为aⅹbⅹc,a表示卷积内核的depth,b表示卷积内核的height,c表示表示卷积内核的width。
第二3D卷积层Conv2位于第一3D卷积层Conv1和第三3D卷积层Conv3之间,第一全连接层FC1位于第三3D卷积层Conv3和第二全连接层FC2之间。
所述第一3D卷积层Conv1、第二3D卷积层Conv2、第三3D卷积层Conv3、第一全连接层FC1和第二全连接层FC2的每层中均引入LeakyRelu函数作为第一激活函数;所述第一3D卷积层Conv1、第二3D卷积层Conv2、第三3D卷积层Conv3、第一全连接层FC1和第二全连接层FC2的每层之后均增加第一批标准化处理(Batch Normalization,BN)层。以使特征向量生成器提取的特征更加的精准。
所述领域主分类器C1适于通过softmax分类器进行伪决策并输出伪决策信息q1(x)至所述领域辅助分类器D,所述伪决策信息q1(x)为样本归属于N类标注标签的概率之和。
所述领域主分类器C1的结构包括:第一全连接网络,第一全连接网络适于输出包含N+1个通道;与第一全连接网络中的末层连接的softmax分类器。
第一全连接网络包括若干层第一子全连接层、位于相邻的第一子全连接层之间的第一Dropout处理层、以及位于相邻的第一子全连接层之间的第二批标准化处理(BatchNormalization,BN)层。第一全连接网络中的各层第一子全连接层中均引入LeakyRelu函数作为第二激活函数;第一全连接网络中的相邻的第一子全连接层之间均增加第二批标准化处理(Batch Normalization,BN)层。第一全连接网络中的相邻的第一子全连接层之间均增加第一Dropout处理层,能够防止模型在训练的过程中出现过拟合的现象,使模型在新的数据上表现更加稳定,增加模型的健壮性。本实施例中,第一全连接网络包括第一层第一子全连接层FC3和第二层第一子全连接层FC4作为示例。
所述softmax分类器适于输出N+1维概率向量其中,z1为第一全连接网络中的末层输出的激活向量,z1k表示z1的第k个分量;N+1维概率向量softmax(z1)包括第一维概率至第N+1维概率;N+1维概率向量softmax(z1)的第一维概率至第N维概率中,第n维概率为样本归属于源域中N类标注标签的概率,n为大于等于1且小于等于N的整数;N+1维概率向量softmax(z1)的第N+1维概率为样本归属于未知标签的概率。伪决策信息q1(x)为样本归属于N类标注标签的概率之和,也就是softmax(z1)的第一维概率至第N维概率之和。
所述源域辅助分类器C2适于通过LeakySoftmax分类层进行领域相似性计算以得到N维概率向量LeakySoftmax(z2),并输出N维概率向量LeakySoftmax(z2)中的第一维概率至第N维概率之和为q2(x)至领域辅助分类器D。q2(x)为N维概率向量LeakySoftmax(z2)中的第一维概率至第N维概率之和。
源域辅助分类器C2的结构包括:第二全连接网络,第二全连接网络适于输出包含N个通道;与所述第二全连接网络中的末层连接的LeakySoftmax分类层,LeakySoftmax分类层适于输出N维概率向量LeakySoftmax(z2),其中,z2为第二全连接网络中的末层输出的向量,z2k表示z2的第k个分量。
所述第二全连接网络包括若干层第二子全连接层、以及位于相邻的第二子全连接层之间的第二Dropout处理层。第二全连接网络中的各层第二子全连接层中均引入LeakyRelu函数作为第三激活函数。第二全连接网络中的相邻的第二子全连接层之间均增加第二Dropout处理层,能够防止模型在训练的过程中出现过拟合的现象,使模型在新的数据上表现更加稳定,增加模型的健壮性。
本实施例中,所述第二全连接网络包括第一层第二子全连接层FC5、第二层第二子全连接层FC6和第三层第二子全连接层FC7。
所述领域辅助分类器D适于基于伪决策信息q1(x)与N维概率向量LeakySoftmax(z2)中的第一维概率至第N维概率之和q2(x)进行目标域中样本与源域中样本标签集合的相似性计算,逐个生成目标域中各样本的自适应阈值,自适应阈值为目标域中样本归属于公共标签集合的概率。
所述领域辅助分类器为非对抗性的领域辅助分类器。
其中,q1(x)=1-P(y=N+1|x),为源域辅助分类器C2输出的第k维概率,即样本归属于第k类标注标签的概率,即样本归属于公共标签集合l的概率。q1(x)=1-P(y=N+1|x),为领域主分类器C1输出的前N维概率之和。x表示样本;G(x)表示特征向量生成器输出的特征向量。
采用对抗学习的策略训练所述域对抗神经网络模型,特征向量生成器G能够减少源域与目标域中的特征分布差异,领域主分类器C1的训练目标为区分源域与目标域的特征,最终实现将目标域样本的特征空间与源域样本对齐,生成域不变特征,同时拒绝未知类别(“unknown”类)。
在源域中的m个样本上训练特征向量生成器G与领域主分类器C1的过程中,采用损失函数进行评估,损失函数的表达式为其中,为表示特征向量生成器当输入样本为时输出的特征向量,表示标准交叉熵损失函数,标准交叉熵损失函数用以最小化领域主分类器C1在源域的m个样本上的分类误差。
在源域中的m个样本上训练特征向量生成器G与领域主分类器C1的过程中,采用二元交叉熵损失函数来对抗性地最大化领域主分类器C1的分类误差,用以找到未知类别的样本的边界,将目标域中的未知类别样本与已知类别样本分离。
其中,为领域辅助分类器D的输出,表示针对目标域各样本与源域的样本标签集合ls的相似性而计算而得到的自适应阈值,即该目标样本归属于公共标签空间的概率。的作用是增强训练过程中域对抗神经网络模型的伪决策鲁棒性,具体表现为:促成领域主分类器C1增大或减小目标域中样本为未知类别的概率使得特征向量生成器G将目标域中各样本的特征分布分别与源域上的标注标签或未知类别“unknown”对齐,同时缓解负迁移。
1-P(y=N+1|x)为领域主分类器C1输出的前N维概率之和,P(y=N+1|x)领域主分类器输出的第N+1维概率。
进行小批量训练的过程还包括:在源域中的m个样本上训练特征向量生成器G与领域主分类器C1之后,将源域中样本的真实标签表示为one-hot向量形式并使用基于N类分类的一对多二元损失函数训练所述源域辅助分类器C2。
所述领域辅助分类器D在训练过程中还遵循如下损失函数ED,
其中,所述基于多分类器域对抗网络的高光谱开放集领域自适应方法还包括:采用反向传播算法和自适应矩估计(Adam)优化器更新所述域对抗神经网络模型的参数,并在计算的梯度时引入梯度反转层以实现有效的对抗训练。
所述域对抗神经网络模型的总体优化目标表示为:
在本发明实施中,采用域对抗神经网络实现目标域与源域高光谱数据间共有类别的特征对齐并进行未知类别的拒绝,为了抑制负迁移现象,引入一种动态自适应阈值方案充分挖掘目标域样本潜在的标签和领域信息,从而有效地衡量目标域样本与源域的相似性,最终提升分类精度。
基于域对抗网络的开放集领域自适应方法的模型训练阶段流程示意图如图2所示,遵循上述步骤进行模型的训练后,特征向量生成器G和领域主分类器C1已经能够适应目标域的高光谱样本数据。因而最后在测试阶段仅使用训练好的特征向量生成器G与领域主分类器C1来正确分类目标域高光谱图像,测试阶段的流程示意图如图3所示。
如图4所示,为了更形象地说明本发明的技术方案,本实例采用在帕维亚大学(Pavia University)场景拍摄的高光谱图像公开数据集构造源域和目标域数据集,PaviaUniversity场景获取的数据集由ROSIS传感器采集,高光谱图像的像素尺寸大小为610×610,共42775个有效像元,每个像元包含103个光谱波段数,几何分辨率为1.3米,其中地面覆盖实物共9个类别。
S11:首先对Pavia University数据集的原始高光谱图像进行双边滤波预处理,其中设定滤波窗口直径大小为7,像素域核的控制参数σr和空间域核的控制参数σs皆为10,双边滤波前后的单波段伪彩色图像如图5所示。接着,从滤波后的高光谱图像中随机提取5类地物的光谱反射数据构造源域数据集,则以单个像元为中心的光谱立方体数据表示为P∈H9×9×103,每种地物类别取800个像元,共4000个像元。将双边滤波后的整个PaviaUniversity数据集作为目标域数据集,则源域中未包含的4种地物类别在开放集识别任务中应被划分为“unknown”类,如图1所示。
S12:如图2所示,域对抗神经网络模型的特征向量生成器生成特征向量G(x),在本实例中,每个特征向量数组的长度为512,分别将其输入至领域主分类器C1与源域辅助分类器C2。领域主分类器C1通过softmax分类器对每个输入样本进行伪决策并输出样本归属于前5个已知类别的概率之和q1(x),q2(x)为C2的LeakySoftmax层输出的概率分布之和,领域辅助分类器D整合q1(x)和q2(x)进行目标域中样本与源域的样本标签集合的相似性计算,逐个生成对抗训练的自适应阈值。
S13:对域对抗神经网络模型的参数更新优化,在梯度的反向传播过程中引入梯度反转层实现对抗训练,使用步骤S12生成的动态自适应阈值方案,减少源域与目标域共有类别样本间的生成特征差异,并克服域间迁移学习过程中的负迁移,使得特征向量生成器G和领域主分类器C1能够适应目标域高光谱数据的已知类分类和未知类拒绝。
S14:使用训练好的特征向量生成器G和领域主分类器C1在目标域上进行分类性能测试,最终通过领域主分类器C1的softmax层输出预测各像元高光谱数据的归属类别,如图6所示为整个方法的整体流程示意图。
本实施例中,首先对原始高光谱图像进行双边滤波预处理以实现保边去噪,接着设计基于3DCNN特征提取的域对抗网络模型,综合考虑高光谱图像的空间与光谱信息,并采用对抗学习的策略在有标签源域和无标签目标域数据上共同训练模型。为克服域间知识迁移过程中的负迁移问题,本发明引入一种基于多分类器结构的动态自适应阈值方案以评估目标域中各样本的域级可识别特征信息,从而增强对抗训练过程的鲁棒性,最终实现在准确分类目标域中与源域的共有类别的同时拒绝未知类别目标为“unknown”类。本发明结构清晰,易于实现,能够明显提升开放集场景下的高光谱图像分类效果,具有深厚的理论基础与实际意义。
上述只是本发明的较佳实施例,并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明。因此,凡是未脱离本发明技术方案的内容,依据本发明技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均应落在本发明技术方案保护的范围内。
Claims (14)
1.一种基于多分类器域对抗网络的高光谱开放集领域自适应方法,其特征在于,包括:
S1:获取高光谱图像;
S2:从所述高光谱图像中提取立方体数据构建源域与目标域ns表示源域中样本的个数,源域的样本标签集合ls中包含N类标注标签,N类标注标签已知,为源域的样本,为源域的样本对应的标注标签;nt表示目标域中样本的个数,目标域的样本标签集合lt中包含M类标签,为目标域的样本;源域与目标域的公共标签集合表示为l=ls∩lt,目标域的私有标签集合表示为且目标域的样本标签集合lt中具有源域中的N类标注标签;
S3:构造域对抗神经网络模型,所述域对抗神经网络模型包括特征向量生成器、领域主分类器、源域辅助分类器和领域辅助分类器;所述特征向量生成器适于对输入至特征向量生成器的样本进行空间与光谱特征提取并输出特征向量至所述领域主分类器和所述源域辅助分类器;所述领域主分类器适于通过softmax分类器进行伪决策并输出伪决策信息q1(x)至所述领域辅助分类器,所述伪决策信息q1(x)为样本归属于N类标注标签的概率之和;所述源域辅助分类器适于通过LeakySoftmax分类层得到N维概率向量LeakySoftmax(z2),并输出q2(x)至领域辅助分类器,q2(x)为N维概率向量LeakySoftmax(z2)中的第一维概率至第N维概率之和;所述领域辅助分类器适于基于q1(x)与q2(x)进行目标域中样本与源域中样本标签集合的相似性计算,逐个生成目标域中各样本的自适应阈值,自适应阈值为目标域中样本归属于公共标签集合的概率;
2.根据权利要求1所述的基于多分类器域对抗网络的高光谱开放集领域自适应方法,其特征在于,获取所述高光谱图像的方法包括:提供原始高光谱图像;对所述原始高光谱图像进行双边滤波预处理以形成所述高光谱图像;所述高光谱图像中数据立方体的空间维尺寸与所述原始高光谱图像中数据立方体的空间维尺寸相同,所述高光谱图像中数据立方体的光谱通道数与所述原始高光谱图像中数据立方体的光谱通道数相同。
3.根据权利要求1所述的基于多分类器域对抗网络的高光谱开放集领域自适应方法,其特征在于,所述特征向量生成器包括第一3D卷积层、第二3D卷积层和第三3D卷积层、第一全连接层和第二全连接层;第二3D卷积层位于第一3D卷积层和第三3D卷积层之间,第一全连接层位于第三3D卷积层和第二全连接层之间。
4.根据权利要求3所述的基于多分类器域对抗网络的高光谱开放集领域自适应方法,其特征在于,第一3D卷积层具有4个卷积内核,第一3D卷积层中每个卷积内核的大小为3×3×3,第一3D卷积层适于进行卷积操作的步长为1×1×1;第二3D卷积层包括2个卷积内核,第二3D卷积层中每个卷积内核的大小为3×3×3,第二3D卷积层适于进行卷积操作的卷积步长为1×1×1;第三3D卷积层具有2个卷积内核,第三3D卷积层中每个卷积内核的大小为5×5×5,第三3D卷积层适于进行卷积操作的卷积步长为1×1×3。
5.根据权利要求3所述的基于多分类器域对抗网络的高光谱开放集领域自适应方法,其特征在于,所述第一3D卷积层、第二3D卷积层、第三3D卷积层、第一全连接层和第二全连接层的每层中均引入LeakyRelu函数作为第一激活函数;所述第一3D卷积层、第二3D卷积层、第三3D卷积层、第一全连接层和第二全连接层的每层之后均增加第一批标准化处理层。
6.根据权利要求1所述的基于多分类器域对抗网络的高光谱开放集领域自适应方法,其特征在于,所述领域主分类器的结构包括:第一全连接网络,第一全连接网络适于输出包含N+1个通道;与第一全连接网络中的末层连接的softmax分类器;
所述softmax分类器适于输出N+1维概率向量softmax(z1);
7.根据权利要求6所述的基于多分类器域对抗网络的高光谱开放集领域自适应方法,其特征在于,所述第一全连接网络包括:若干层第一子全连接层、位于相邻的第一子全连接层之间的第一Dropout处理层、以及位于相邻的第一子全连接层之间的第二批标准化处理层;第一全连接网络中的各层第一子全连接层中均引入LeakyRelu函数作为第二激活函数。
9.根据权利要求8所述的基于多分类器域对抗网络的高光谱开放集领域自适应方法,其特征在于,所述第二全连接网络包括若干层第二子全连接层、以及位于相邻的第二子全连接层之间的第二Dropout处理层;第二全连接网络中的各层第二子全连接层中均引入LeakyRelu函数作为第三激活函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110639872.2A CN113221848B (zh) | 2021-06-09 | 2021-06-09 | 基于多分类器域对抗网络的高光谱开放集领域自适应方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110639872.2A CN113221848B (zh) | 2021-06-09 | 2021-06-09 | 基于多分类器域对抗网络的高光谱开放集领域自适应方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113221848A true CN113221848A (zh) | 2021-08-06 |
CN113221848B CN113221848B (zh) | 2022-07-19 |
Family
ID=77083322
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110639872.2A Active CN113221848B (zh) | 2021-06-09 | 2021-06-09 | 基于多分类器域对抗网络的高光谱开放集领域自适应方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113221848B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114241526A (zh) * | 2022-02-28 | 2022-03-25 | 南京甄视智能科技有限公司 | 分类模型、训练方法、分类方法、电子设备及存储介质 |
CN114511737A (zh) * | 2022-01-24 | 2022-05-17 | 北京建筑大学 | 图像识别域泛化模型的训练方法 |
CN114723994A (zh) * | 2022-04-18 | 2022-07-08 | 中国矿业大学 | 一种基于双分类器对抗增强网络的高光谱图像分类方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109871830A (zh) * | 2019-03-15 | 2019-06-11 | 中国人民解放军国防科技大学 | 基于三维深度残差网络的空谱融合高光谱图像分类方法 |
CN110750665A (zh) * | 2019-10-12 | 2020-02-04 | 南京邮电大学 | 基于熵最小化的开集域适应方法及系统 |
CN111368896A (zh) * | 2020-02-28 | 2020-07-03 | 南京信息工程大学 | 基于密集残差三维卷积神经网络的高光谱遥感图像分类方法 |
CN112131967A (zh) * | 2020-09-01 | 2020-12-25 | 河海大学 | 基于多分类器对抗迁移学习的遥感场景分类方法 |
CN112200121A (zh) * | 2020-10-24 | 2021-01-08 | 中国人民解放军国防科技大学 | 基于evm和深度学习的高光谱未知目标检测方法 |
CN112308158A (zh) * | 2020-11-05 | 2021-02-02 | 电子科技大学 | 一种基于部分特征对齐的多源领域自适应模型及方法 |
CN112904299A (zh) * | 2021-03-03 | 2021-06-04 | 西安电子科技大学 | 基于深层类内分裂的雷达高分辨距离像开集目标识别方法 |
-
2021
- 2021-06-09 CN CN202110639872.2A patent/CN113221848B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109871830A (zh) * | 2019-03-15 | 2019-06-11 | 中国人民解放军国防科技大学 | 基于三维深度残差网络的空谱融合高光谱图像分类方法 |
CN110750665A (zh) * | 2019-10-12 | 2020-02-04 | 南京邮电大学 | 基于熵最小化的开集域适应方法及系统 |
CN111368896A (zh) * | 2020-02-28 | 2020-07-03 | 南京信息工程大学 | 基于密集残差三维卷积神经网络的高光谱遥感图像分类方法 |
CN112131967A (zh) * | 2020-09-01 | 2020-12-25 | 河海大学 | 基于多分类器对抗迁移学习的遥感场景分类方法 |
CN112200121A (zh) * | 2020-10-24 | 2021-01-08 | 中国人民解放军国防科技大学 | 基于evm和深度学习的高光谱未知目标检测方法 |
CN112308158A (zh) * | 2020-11-05 | 2021-02-02 | 电子科技大学 | 一种基于部分特征对齐的多源领域自适应模型及方法 |
CN112904299A (zh) * | 2021-03-03 | 2021-06-04 | 西安电子科技大学 | 基于深层类内分裂的雷达高分辨距离像开集目标识别方法 |
Non-Patent Citations (3)
Title |
---|
TASFIA SHERMIN 等: "Adversarial Network With Multiple Classifiers for Open Set Domain Adaptation", 《IEEE TRANSACTIONS ON MULTIMEDIA》 * |
YING LI 等: "Spectral–Spatial Classification of Hyperspectral Imagery with 3D Convolutional Neural Network", 《REMOTE SENSING》 * |
ZILONG ZHONG 等: "Spectral–Spatial Residual Network for Hyperspectral Image Classification: A 3-D Deep Learning Framework", 《 IEEE TRANSACTIONS ON GEOSCIENCE AND REMOTE SENSING》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114511737A (zh) * | 2022-01-24 | 2022-05-17 | 北京建筑大学 | 图像识别域泛化模型的训练方法 |
CN114241526A (zh) * | 2022-02-28 | 2022-03-25 | 南京甄视智能科技有限公司 | 分类模型、训练方法、分类方法、电子设备及存储介质 |
CN114723994A (zh) * | 2022-04-18 | 2022-07-08 | 中国矿业大学 | 一种基于双分类器对抗增强网络的高光谱图像分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113221848B (zh) | 2022-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113221848B (zh) | 基于多分类器域对抗网络的高光谱开放集领域自适应方法 | |
Zheng et al. | Cross-regional oil palm tree counting and detection via a multi-level attention domain adaptation network | |
CN107133569B (zh) | 基于泛化多标记学习的监控视频多粒度标注方法 | |
Tuia et al. | Domain adaptation for the classification of remote sensing data: An overview of recent advances | |
CN113076994B (zh) | 一种开集域自适应图像分类方法及系统 | |
CN111860236B (zh) | 一种基于迁移学习的小样本遥感目标检测方法及系统 | |
Liu et al. | Remote sensing image change detection based on information transmission and attention mechanism | |
Sziranyi et al. | Segmentation of remote sensing images using similarity-measure-based fusion-MRF model | |
Qin et al. | Cross-domain collaborative learning via cluster canonical correlation analysis and random walker for hyperspectral image classification | |
CN108520215B (zh) | 基于多尺度联合特征编码器的单样本人脸识别方法 | |
Hagos et al. | ConCORDe-Net: cell count regularized convolutional neural network for cell detection in multiplex immunohistochemistry images | |
Wu et al. | Typical target detection in satellite images based on convolutional neural networks | |
CN109472733A (zh) | 基于卷积神经网络的图像隐写分析方法 | |
Sennan et al. | A Novel Convolutional Neural Networks Based Spinach Classification and Recognition System. | |
Pauzi et al. | A review on image processing for fish disease detection | |
CN108960005B (zh) | 一种智能视觉物联网中对象视觉标签的建立及显示方法、系统 | |
CN117333948A (zh) | 一种融合时空注意力机制的端到端多目标肉鸡行为识别方法 | |
CN112581502A (zh) | 一种基于孪生网络的目标跟踪方法 | |
CN113887652B (zh) | 基于形态和多示例学习的遥感图像弱小目标检测方法 | |
ALSAADI et al. | An automated classification of mammals and reptiles animal classes using deep learning | |
Yu et al. | Precise segmentation of remote sensing cage images based on SegNet and voting mechanism | |
Mirra et al. | Classification of Fruits using Deep Learning Algorithms | |
Tang et al. | Image Semantic Recognition and Segmentation Algorithm of Colorimetric Sensor Array Based on Deep Convolutional Neural Network | |
CN112052881A (zh) | 基于多尺度近端特征拼接的高光谱图像分类模型的装置 | |
Yang et al. | Optimization Algorithm of Moving Object Detection Using Multiscale Pyramid Convolutional Neural Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |