CN115292532B

CN115292532B - 基于伪标签一致性学习的遥感图像域适应检索方法

Info

Publication number: CN115292532B
Application number: CN202210729817.7A
Authority: CN
Inventors: 侯东阳; 王思远; 田雪晴
Original assignee: Central South University
Current assignee: Central South University
Priority date: 2022-06-24
Filing date: 2022-06-24
Publication date: 2024-03-15
Anticipated expiration: 2042-06-24
Also published as: CN115292532A

Abstract

本发明涉及基于伪标签一致性学习的遥感图像域适应检索方法，包括如下步骤：A)获取遥感图像；B)构建输入数据、三元组卷积神经网络和损失函数；C)利用输入数据并结合所述损失函数对三元组卷积神经网络进行优化训练，利用训练好的三元组卷积神经网络提取目标域内的遥感图像的遥感图像特征向量，形成特征库向量，提取用户查询的查询特征向量，并将查询特征向量与特征库向量中的遥感图像特征向量进行比较，得到设定的相似度排名内的所述遥感图像特征向量。本发明的基于伪标签一致性学习的遥感图像域适应检索方法受目标域与源域的分布差异的影响小，检索效果好。

Description

基于伪标签一致性学习的遥感图像域适应检索方法

技术领域

本发明涉及光学遥感图像检索技术领域，具体地，涉及一种基于伪标签一致性学习的遥感图像域适应检索方法。

背景技术

近年来，对地观测技术的发展使得遥感图像的获取变得越来越容易，海量的遥感图像数据为地表覆盖分类、灾害评估、环境监测和城市规划等领域的应用创造了有利的条件。

然而，在日益增长的遥感图像数据中，如何高效的找到感兴趣的目标或场景成为了一个难题。因此，遥感图像检索作为一种从大规模的遥感数据中挖掘有效信息的关键技术，受到了越来越多的关注。

目前，基于深度神经网络的检索模型在遥感图像检索中取得了最具竞争力的检索效果。由于深度学习是一种数据驱动的算法，这些模型为了得到较好的检索效果，使用大量的标注数据进行训练。然而，爆发式增长的遥感图像为数据标注工作带来了严峻的挑战，其不仅需要消耗大量的人力物力，而且为所有图像贴标签是不现实的。因此如何利用已有的有标注遥感图像，提高模型在无标注数据上的检索精度是需要解决的关键问题。然而，不同数据集之间由于传感器、拍摄角度、拍摄天气和季节等因素的差异，导致直接将训练好的检索模型迁移至无标注数据集的检索效果并不理想，现有技术中，一般是利用有标注的源域数据学习一个分类器，通过特征对齐将源域学习的分类器用于目标域。然而，受限于目标域与源域的分布差异，源域的先验类别信息对目标域决策边界的作用是有限的，这可能导致源域学习的决策边界不能区分目标域。

有鉴于此，需要设计一种基于伪标签一致性学习的遥感图像域适应检索方法。

发明内容

本发明所要解决的技术问题是提供一种基于伪标签一致性学习的遥感图像域适应检索方法，其受目标域与源域的分布差异的影响小，检索效果好。

为了解决上述技术问题，本发明提供一种基于伪标签一致性学习的遥感图像域适应检索方法，包括如下步骤：

A)获取遥感图像；

B)构建输入数据、三元组卷积神经网络和损失函数；

C)利用所述输入数据并结合所述损失函数对所述三元组卷积神经网络进行优化训练，利用训练好的所述三元组卷积神经网络提取所述目标域内的所述遥感图像的遥感图像特征向量，形成特征库向量，提取用户查询的查询特征向量，并将所述查询特征向量与所述特征库向量中的所述遥感图像特征向量进行比较，得到设定的相似度排名内的所述遥感图像特征向量。

进一步地，所述输入数据的构建步骤包括：

B11)构建包含n_s个样本的源域数据和包含n_t个样本的目标域数据/>其中，/>表示源域数据有标注样本，/>表示目标域数据无标注样本，/>表示与所述源域数据有标注样本/>相对应的标签，且/>C为图像类别数；

B12)对于所述目标域数据无标注样本利用翻转和移位数据增强变换得到目标域弱增强样本/>并对所述目标域数据无标注样本/>利用随机增强方法产生严重失真的目标域强增强样本/>

B13)对所述源域数据有标注样本使用所述翻转和移位数据增强变换得到源域弱增强样本。

进一步地，所述三元组卷积神经网络包括特征提取部分和分类部分，其中，所述特征提取部分包括多个特征提取网络，多个所述特征提取网络的结构和参数均相同，所述分类部分包括多个分类器，多个所述分类器的结构和参数均相同。

进一步地，所述特征提取网络由ImageNet(图像网络)数据集预训练的卷积神经网络构成。

进一步地，所述分类器为一层全连接网络，用于预测所述输入数据属于不同类别的可能性。

进一步地，所述分类器的输出维度与所述输入数据的类别数量一致。

进一步地，所述损失函数的构建步骤包括：

B31)构建分类损失，对所述源域数据进行有监督学习，并基于交叉熵损失构建所述源域数据的分类损失：

其中，L_CE为分类损失函数，p(x^s)表示所述源域数据有标注样本的真实概率分布，函数p(|)表示所述分类器预测的概率分布，x^s为所述源域数据有标注样本/>的合集，表示所述源域数据有标注样本/>的预测为不同类别的概率；

B32)构建迁移损失，基于最大均值差异度量不同特征分布的相似性构建迁移损失L_MMD：

其中，i表示第i个所述源域数据有标注样本n_s表示所述源域数据有标注样本的总数，f_i ^s表示第i个所述源域数据有标注样本/>的特征，n_t表示所述目标域数据的样本总数，j表示第j个所述目标域强增强样本，φ为映射函数，将所述源域数据的样本投影到高维的希尔伯特空间/>中，并在所述希尔伯特空间/>中计算所述源域数据的样本均值作以及所述目标域的样本均值以作为领域差异的度量；

B33)构建伪标签一致性损失，得到一致性正则增强的伪标签分类损失L_PCE：

其中，B表示一次训练所选取的样本数，μ为一次训练所选取的样本中满足设定阈值选取要求的样本比例，H函数表示两个概率分布的交叉熵损失，x^w表示所述目标域弱增强样本的合集，/>为伪标签筛选后x^w预测为不同类别的概率；

B34)构建最小类混淆损失，利用所述目标域数据的类别概率分布熵的值确定样本的权重，并依据加权后的所述目标域数据的样本，计算类混淆矩阵，并结合最小化类混淆损失以最大化所述目标域数据的类间差异；所述概率分布熵为：

其中，表示所述目标域数据中的第j个样本，/>表示所述目标域数据中第j个样本属于第c个类的概率，所述目标域数据的样本的权重定义为：

其中，W_j表示所述目标域数据中第j个样本的权重，用于对权重进行缩放，W_j对应的对角矩阵为W，基于所述对角矩阵W定义的所述类混淆矩阵M_cc′为：

其中，表示一次训练所选取的样本内所有样本属于第c个类别的概率，所述最小化类混淆损失L_MCC定义为：

B35)构建的所述损失函数为：

L＝L_CE+L_MMD+αL_PCE+βL_MCC

其中，α,β为权衡三元组卷积神经网络优化目标的参数。

进一步地，所述输入数据训练所述三元组卷积神经网络的步骤包括：

C11)将所述目标域弱增强样本所述目标域强增强样本/>和所述源域数据有标注样本/>分别输入至相对应的所述特征提取网络中，以得到目标域弱增强样本特征目标域强增强样本特征/>和源域数据有标注样本特征/>

C12)利用所述目标域强增强样本特征和源域数据有标注样本特征/>进行分布差异度量，计算所述迁移损失L_MMD；

C13)将所述目标域弱增强样本特征所述目标域强增强样本特征/>和所述源域有标注样本特征/>输入所述分类器，以对应转换为目标域弱增强样本条件概率分布/>目标域强增强样本条件概率分布/>和源域数据有标注样本条件概率分布/>

C14)对所述源域数据有标注样本条件概率分布基于所述分类损失函数L_CE，计算所述源域数据的分类损失；

C15)对所述目标域弱增强样本条件概率分布保留最大类别概率高于设定的概率分布阈值τ的类别标签作为伪标签：

其中，表示所述目标域强增强样本条件概率分布中满足设定的阈值筛选条件的最大概率所在的类别；

C16)利用所述目标域弱增强样本产生的伪标签作为对应目标域强增强样本的监督信息，采用所述伪标签分类损失L_PCE计算伪标签一致性损失；

C17)对于所述目标域弱增强样本条件概率分布，利用所述最小化类混淆损失L_MCC计算类混淆损失；

C18)计算训练总损失，使用梯度下降算法对所述特征提取网络的网络参数进行调整。

进一步地，所述遥感图像特征向量经由训练好的所述特征提取网络获取。

进一步地，获取所述目标域遥感图像的步骤为：

C21)基于训练好的所述特征提取网络提取所述查询特征向量图像；

C22)逐一计算所述查询特征向量图像与每幅所述遥感图像特征向量的欧式距离；

C23)依据所述欧式距离从小到大的顺序，将所述遥感图像特征向量进行排序，取排名处于设定次序内的所述遥感图像特征向量为高相似度图像。

通过上述技术方案，在本发明所提供的基于伪标签一致性学习的遥感图像域适应检索方法中，其先是要构建输入数据，包括源域数据和目标域数据，其中，源域数据是有标注的数据，目标域数据是无标注的，并对构建的输入数据进行相对应的增强，随后，将增强后的源域数据和目标域数据输入到相应的特征提取网络和分类器中，将输出的结果与输入的数据进行对比，并建立伪标签一致性损失，从而基于伪标签一致性损失得到损失函数，以能够基于损失函数，对特征提取网络的网络参数进行调整，从而能够减小特征提取网络受目标域与源域的分布差异的影响，以使得训练后的三元组卷积神经网络在对未标注的样本进行检索时具有更好的检索精度，检索效果更好。

有关本发明的其它优点以及优选实施方式的技术效果，将在下文的具体实施方式中进一步说明。

附图说明

图1是本发明基于伪标签一致性学习的遥感图像域适应检索方法的流程图；

图2是本发明基于伪标签一致性学习的遥感图像域适应检索方法的原理示意图；

图3是本发明基于伪标签一致性学习的遥感图像域适应检索方法中对三元组卷积神经网络的训练过程示意图；

图4是本发明基于伪标签一致性学习的遥感图像域适应检索方法中的检索过程示意图。

具体实施方式

以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本发明，并不用于限制本发明。

如图1和图2所示，作为本发明所提供的基于伪标签一致性学习的遥感图像域适应检索方法的一种实施例，该方法包括如下步骤：

A)获取遥感图像；

B)构建输入数据、三元组卷积神经网络和损失函数；

C)利用输入数据并结合损失函数对三元组卷积神经网络进行优化训练，利用训练好的三元组卷积神经网络提取目标域内的遥感图像的遥感图像特征向量，形成特征库向量，提取用户查询的查询特征向量，并将查询特征向量与特征库向量中的遥感图像特征向量进行比较，得到设定的相似度排名内的遥感图像特征向量。

具体地，在本发明所提供的基于伪标签一致性学习的遥感图像域适应检索方法的一种实施例中，输入数据的构建步骤包括：

B11)构建包含n_s个样本的源域数据和包含n_t个样本的目标域数据/>其中，/>表示源域数据有标注样本，/>表示目标域数据无标注样本，/>表示与源域数据有标注样本/>相对应的标签，且/>C为图像类别数；

B12)对于目标域数据无标注样本利用翻转和移位数据增强变换得到目标域弱增强样本/>并对目标域数据无标注样本/>利用随机增强方法产生严重失真的目标域强增强样本/>

B13)对源域数据有标注样本使用翻转和移位数据增强变换得到源域弱样本。

进一步地，在本发明所提供的基于伪标签一致性学习的遥感图像域适应检索方法的一种实施例中，如图3所示，三元组卷积神经网络包括特征提取部分和分类部分，其中，特征提取部分包括多个特征提取网络(例如根据需要进行提取的数据样本包括目标域弱增强样本目标域数据无标注样本/>和源域数据有标注样本/>三种，将特征提取网络设置为三个，以实现各特征提取网络对应不同的数据样本)，且各个特征提取网络的结构和参数均相同；分类部分包括多个分类器(例如根据需要进行分类的数据样本包括目标域弱增强样本/>目标域数据无标注样本/>和源域数据有标注样本/>三种，将分类器设置为三个，以实现各分类器对应不同的数据样本)，且各个分类器的结构和参数均相同，其中，特征提取网络包括由ImageNet(图像网络)数据集预训练的卷积神经网络({conv1,conv2_x,conv3_x,conv4_x,conv_5x})，以及瓶颈层，因此，特征提取网络的结构为：{conv1,conv2_x,conv3_x,conv4_x,conv_5x,bottleneck layer}，其输出的特征的尺寸为256维；分类器为一层全连接网络，用于预测输入数据属于不同类别的可能性，分类器的输出维度与输入数据的类别数量一致。

进一步地，在本发明所提供的基于伪标签一致性学习的遥感图像域适应检索方法的一种实施例中，损失函数的构建步骤包括：

B31)构建分类损失，对于源域数据，由于源域数据存在对应的标注信息，因此，可对其进行有监督学习，以保证源域数据有标注样本能够被准确识别，具体地，可基于交叉熵损失构建源域数据的分类损失：

其中，L_CE为分类损失函数，p(x^s)表示源域数据有标注样本的真实概率分布，x^s为源域数据有标注样本/>的合集，/>表示源域数据有标注样本/>的预测为不同类别的概率；

其中，i表示第i个源域数据有标注样本n_s表示源域数据有标注样本/>的总数，f_i ^s表示第i个源域数据有标注样本/>的特征，n_t表示目标域数据的样本总数，j表示第j个目标域强增强样本，φ为映射函数，将源域数据的样本投影到高维的希尔伯特空间/>中，并在希尔伯特空间/>中计算源域数据的样本均值作以及目标域的样本均值以作为领域差异的度量；

B33)构建伪标签一致性损失，以用于约束目标域样本的伪标签一致性学习，使用目标域弱增强样本产生的伪标签作为对应的目标域强增强样本/>的监督信息计算交叉熵损失，得到一致性正则增强的伪标签分类损失L_PCE：

其中，B表示一次训练所选取的样本数，μ为一次训练所选取的样本中满足设定阈值选取要求的样本比例，H函数表示两个概率分布的交叉熵损失，x^w表示目标域弱增强样本的合集，/>为伪标签筛选后x^w预测为不同类别的概率；

B34)构建最小类混淆损失，利用目标域数据的类别概率分布熵的值确定目标域数据的样本的权重，并依据加权后的目标域数据的样本，计算类混淆矩阵，并结合最小化类混淆损失以最大化目标域数据的类间差异；具体地，概率分布熵为：

其中，表示目标域数据中的第j个样本，/>表示目标域数据中第j个样本属于第c个类的概率，目标域数据的样本的权重定义为：

其中，W_j表示目标域数据中第j个样本的权重，用于对权重进行缩放，W_j对应的对角矩阵为W，基于对角矩阵W定义的类混淆矩阵M_cc′为：

其中，表示一次训练所选取的样本内所有样本属于第c个类别的概率，最小化类混淆损失L_MCC定义为：

B35)构建的损失函数为：

L＝L_CE+L_MMD+αL_PCE+βL_MCC

其中，α,β为权衡三元组卷积神经网络优化目标的参数。

进一步地，在本发明所提供的基于伪标签一致性学习的遥感图像域适应检索方法的一种实施例中，输入数据训练三元组卷积神经网络的步骤包括：

C11)将目标域弱增强样本目标域强增强样本/>和源域数据有标注样本/>分别输入至相对应的特征提取网络中，以得到目标域弱增强样本特征/>目标域强增强样本特征/>和源域数据有标注样本特征/>

C12)利用目标域强增强样本特征和源域数据有标注样本特征/>进行分布差异度量，计算迁移损失L_MMD；

C13)将目标域弱增强样本特征目标域强增强样本特征/>和源域数据有标注样本特征/>输入对应的分类器，以对应转换为目标域弱增强样本条件概率分布/>目标域强增强样本条件概率分布/>和源域数据有标注样本条件概率分布/>

C14)对源域数据有标注样本条件概率分布基于分类损失函数L_CE，计算源域数据的分类损失；

C15)对目标域弱增强样本条件概率分布保留最大类别概率高于设定的概率分布阈值τ的类别标签作为伪标签：

其中，表示目标域强增强样本条件概率分布中满足设定的阈值筛选条件的最大概率所在的类别；

C16)利用目标域弱增强样本产生的伪标签作为对应目标域强增强样本的监督信息，采用伪标签分类损失L_PCE计算伪标签一致性损失；

C17)对于目标域弱增强样本条件概率分布，利用最小化类混淆损失L_MCC计算类混淆损失；

C18)计算训练总损失，使用梯度下降算法对特征提取网络的网络参数进行调整。

已完成对于特征提取网络的训练，随后遥感图像特征向量则由经上述步骤训练好的特征提取网络提取获得。

进一步地，在本发明所提供的基于伪标签一致性学习的遥感图像域适应检索方法的一种实施例中，如图4所示，获取目标域遥感图像的步骤为：

C21)基于训练好的特征提取网络提取查询特征向量图像；

C22)逐一计算查询特征向量图像与每幅遥感图像特征向量的欧式距离；

C23)依据欧式距离从小到大的顺序，将遥感图像特征向量进行排序，取排名处于设定次序内(如前K名，K的具体取值可以进行人为规定，例如前4名)的遥感图像特征向量为高相似度图像。

进一步地，在本发明所提供的基于伪标签一致性学习的遥感图像域适应检索方法的一种实施例中，对于输入数据的构建以及三元组卷积神经网络的训练是基于Python语言的PyTorch库实现的，此外，还进行了ADDA(Adversarial Discriminative DomainAdaptation对抗鉴别域适应)、AFN(Adaptive Feature Norm自适应特征范数)、BSP(BatchSpectral Penalization批量奇异值约束)、CDAN(Conditional Adversarial DomainAdaptation条件对抗域适应)和DAN(Deep Adaptation Network深度域适应网络)等检索系统的仿真实验，以用于同本发明的基于伪标签一致性学习的遥感图像域适应检索方法进行对比；本发明采用平均归一化修正检索秩(ANMRR)、平均检索精度(mAP)和PK(K为前K张图像的检索精度)来评价结果，其中，平均检索精度(mAP)和前K张图像的检索精度PK值越高检索性能越好，而平均归一化修正检索秩ANMRR值越小越好，对比结果如表1所示：

表1

由表1的结果表明，本发明的基于伪标签一致性学习的遥感图像域适应检索方法取得了最高的检索精度，相较对比的方法，本发明方法的平均检索精度mAP提高了20.04％-28.96％，平均归一化修正检索秩ANMRR也取得了提高。并且本发明方法的P5-P100的检索精度均优于对比方法，综上所述，本发明所提出的基于伪标签一致性学习的遥感图像域适应检索方法在目标域无标注的情况下能够提高对目标域查询图像的检索能力。

以上结合附图详细描述了本发明的优选实施方式，但是，本发明并不限于此。在本发明的技术构思范围内，可以对本发明的技术方案进行多种简单变型，包括各个具体技术特征以任何合适的方式进行组合，为了避免不必要的重复，本发明对各种可能的组合方式不再另行说明。但这些简单变型和组合同样应当视为本发明所公开的内容，均属于本发明的保护范围。

Claims

1.基于伪标签一致性学习的遥感图像域适应检索方法，其特征在于，包括如下步骤：

A)获取遥感图像；

B)构建输入数据、三元组卷积神经网络和损失函数；

其中，所述输入数据的构建步骤包括：

B11)构建包含n_s个样本的源域数据和包含n_t个样本的目标域数据其中，/>表示源域数据有标注样本，/>表示目标域数据无标注样本，/>表示与所述源域数据有标注样本/>相对应的标签，且/>C为图像类别数；

B13)对所述源域数据有标注样本使用所述翻转和移位数据增强变换得到源域弱增强样本；

其中，所述三元组卷积神经网络包括特征提取部分和分类部分，所述特征提取部分包括多个特征提取网络，多个所述特征提取网络的结构和参数均相同，所述分类部分包括多个分类器，多个所述分类器的结构和参数均相同，所述分类器为一层全连接网络，以用于预测所述输入数据属于不同类别的可能性，所述分类器的输出维度与所述输入数据的类别数量一致，所述损失函数的构建步骤包括：

其中，L_CE为分类损失函数，p(x^s)表示所述源域数据有标注样本的真实概率分布，函数p(∣)表示所述分类器预测的概率分布，x^s为所述源域数据有标注样本/>的合集，/>表示所述源域数据有标注样本/>的预测为不同类别的概率；

其中，i表示第i个所述源域数据有标注样本n_s表示所述源域数据有标注样本/>的总数，f_i ^S表示第i个所述源域数据有标注样本/>的特征，n_t表示所述目标域数据的样本总数，j表示第j个所述目标域强增强样本，φ为映射函数，将所述源域数据的样本投影到高维的希尔伯特空间/>中，并在所述希尔伯特空间/>中计算所述源域数据的样本均值作以及所述目标域的样本均值以作为领域差异的度量；

B35)构建的所述损失函数为：

L＝L_CE+L_MMD+αL_PCE+βL_MCC

其中，α,β为权衡三元组卷积神经网络优化目标的参数；

2.根据权利要求1所述的基于伪标签一致性学习的遥感图像域适应检索方法，其特征在于，所述特征提取网络由ImageNet数据集预训练的卷积神经网络构成。

3.根据权利要求1所述的基于伪标签一致性学习的遥感图像域适应检索方法，其特征在于，所述输入数据训练所述三元组卷积神经网络的步骤包括：

C13)将所述目标域弱增强样本特征所述目标域强增强样本特征/>和所述源域数据有标注样本特征/>输入所述分类器，以对应转换为目标域弱增强样本条件概率分布/>目标域强增强样本条件概率分布/>和源域数据有标注样本条件概率分布/>

4.根据权利要求3所述的基于伪标签一致性学习的遥感图像域适应检索方法，其特征在于，所述遥感图像特征向量经由训练好的所述特征提取网络获取。

5.根据权利要求4所述的基于伪标签一致性学习的遥感图像域适应检索方法，其特征在于，获取所述目标域遥感图像的步骤为：