CN114972959B

CN114972959B - 深度学习中样本生成和类内排序损失的遥感图像检索方法

Info

Publication number: CN114972959B
Application number: CN202210894362.4A
Authority: CN
Inventors: 刘萍萍; 王一帆; 周求湛; 郎一君; 杨晓康; 刘泽同
Original assignee: Jilin University
Current assignee: Jilin University
Priority date: 2022-07-28
Filing date: 2022-07-28
Publication date: 2022-11-01
Anticipated expiration: 2042-07-28
Also published as: CN114972959A

Abstract

深度学习中样本生成和类内排序损失的遥感图像检索方法，属于遥感图像检索方法技术领域。搭建卷积神经网络模型，对原始的遥感图像数据集进行预处理和增强处理；将遥感图像数据集输入到数据加载器中，选取优化器；从数据加载器中读取遥感图像数据；对读取的遥感图像数据进行特征提取，将特征输入到损失函数中；对输入的特征进行样本生成和损失计算；对得到的损失计算梯度进行反向传播更新卷积神经网络的参数；判断训练的次数是否达到卷积神经网络参数设置的次数；将需要查询的遥感图像数据输入到训练好的卷积神经网络中得到向量，然后将向量与检索数据集中其他的向量进行比较，选出相似性高的遥感图像数据。

Description

深度学习中样本生成和类内排序损失的遥感图像检索方法

技术领域

本发明涉及遥感图像检索方法技术领域，具体为深度学习中样本生成和类内排序损失的遥感图像检索方法。

背景技术

随着遥感技术的发展，遥感图像的数量和种类显著增加。这方面促使许多研究人员专注于遥感图像的应用，如识别、分类、检索等。在这些应用中，遥感图像检索是最具挑战性的，同时在遥感大数据的高效管理和挖掘中发挥着重要作用。遥感图像检索的目的是在检索数据集中返回与给定查询图像在视觉上相似的所有图像，但庞大的遥感图像数据集使得精确的返回这些图像是很困难的。但随着深度卷积神经网络的出现，为遥感图像检索带来了解决的方案。深度卷积神经网络被认为是最成功和广泛使用的深度学习方法，它极大地改善了许多图像相关应用的最新技术。

在遥感图像检索中，为了提高检索效率，将通过深度卷积神经网络获得的更具代表性的高级特征进行度量学习，这些高级特征通过学习后能够很好的满足检索的需求。深度度量学习用于学习嵌入空间，其中来自同一类别的相似样本彼此靠近，同时，来自不同类别的不同样本保持分开。一般来说，深度度量学习的主要是通过设计有效的损失函数来达到学习的目的，损失函数大致可以分为两种，一种是基于样本对的损失函数，一种是基于代理的损失函数。

基于样本对的损失函数主要是通过利用样本间的关系信息，由于样本间的关系信息十分丰富，但是并不是所有的信息都是有用的，如果选择使用样本间全部的信息不仅会使训练复杂性增加，同时一些没有意义的信息可能会导致收敛速度的变慢，甚至会导致模型崩塌。所有我们需要在训练期间选择合适的样本对，这些样本在深度度量学习中被称为信息样本，信息样本往往对损失函数的计算有更高的贡献，也能使模型快速收敛。

基于代理的损失函数主要是通过利用代理和样本之间的关系信息，因为基于样本对的损失函数即使通过选择信息样本的训练复杂性也会很高，所有出现了基于代理的损失函数，通过为每个类分配一个代理，然后将样本与每个类的代理进行联系，能够显著的减少训练复杂性。

在深度度量学习中，现有技术仅仅关注于类间的差异，也即尝试将正样本和负样本尽可能区分开来，但是没有考虑到类内的差异，对于所有正样本都一样对待，导致生成的嵌入空间对同类样本的区分性不够。

发明内容

本发明解决了现有技术由于没有考虑到类内的差异，导致生成的嵌入空间对同类样本的区分性不够的问题。

本发明所述的深度学习中样本生成和类内排序损失的遥感图像检索方法，包括以下步骤：

步骤S1，搭建卷积神经网络模型，对原始的遥感图像数据集进行预处理和增强处理；

步骤S2，将遥感图像数据集输入到数据加载器中，选取优化器；

步骤S3，从数据加载器中读取遥感图像数据；

步骤S4，对步骤S3输出的遥感图像数据输入到卷积神经网络模型中进行特征提取，然后将特征输入到损失函数中；

步骤S5，对步骤S4输入的特征进行样本生成和损失计算；

步骤S6，对步骤S5得到的损失计算梯度进行反向传播更新卷积神经网络的参数；

步骤S7，判断训练的次数是否达到卷积神经网络参数设置的次数，若没有达到，则重复步骤S3～S6，若已达到，则结束训练，将训练好的卷积神经网络用于检索；

步骤S8，将需要查询的遥感图像数据输入到训练好的卷积神经网络中得到向量，然后将向量与检索数据集中向量进行比较，选出相似性高的遥感图像数据。

进一步地，在本发明的一个实施例中，所述的步骤S1中，所述的遥感图像数据集包括训练集和测试集。

进一步地，在本发明的一个实施例中，所述的步骤S1中，所述的原始的遥感图像数据的分辨率为224*224。

进一步地，在本发明的一个实施例中，所述的步骤S1中，所述的对遥感图像数据进行增强处理包括水平翻转、中心裁剪和正则化。

进一步地，在本发明的一个实施例中，所述的步骤S4中，所述的损失函数为：

，式中，

为总的损失函数，

为代理与正样本之间的损失，

为代理与负样本之间的损失，

为生成样本所产生的类内排序损失，λ为

的比例因子，取值为0-1。

进一步地，在本发明的一个实施例中，所述的步骤S5中，所述的对步骤S4输入的特征进行样本生成和损失计算，包括以下步骤：

步骤S501，对于每个样本，判断其与对应的代理之间是否满足样本生成的条件，若满足样本生成的条件，则生成N个样本，并输入到损失函数中计算N个样本之间是否满足类内排序关系来得到损失，若满足，则不会产生损失，若不满足，则会产生损失，同时还需要判断每个生成样本与对应的代理之间满足是否相似性关系，若满足，则不会产生损失，若不满足，则会产生损失，若不满足样本生成的条件，则跳过步骤S501直接执行步骤S502；

步骤S502，对于每个代理与所有同类的正样本进行联系，同时还需要将其输入到损失函数中计算每个代理与对应的正样本之间是否满足相似性关系来得到损失，若满足，则不会产生损失，若不满足，则会产生损失；

步骤S503，对于每个代理与所有不同类的负样本进行联系，同时还需要将其输入到损失函数中计算每个代理与对应的负样本之间是否满足相似性关系来得到损失，若满足，则不会产生损失，若不满足，则会产生损失，结束损失的计算。

进一步地，在本发明的一个实施例中，所述的步骤S501中，所述的样本生成的条件为：

将从卷积神经网络中得到样本嵌入特征与代理进行余弦相似性计算，若该余弦相似性样本大于δ，则对该样本进行样本生成；

δ是一个固定参数，将生成样本与代理之间满足一定的相似性。

进一步地，在本发明的一个实施例中，所述的步骤S501中，所述的损失函数为：

，式中，

表示正代理集合，则

为正代理集合的数目，

表示对于代理P而言，正样本中与P之间余弦相似性大于δ的样本集合，即能够进行样本生成的样本集合，N表示生成样本的数目，

表示生成样本i与原始样本x之间的余弦相似性，同理

就是生成样本j和原始样本x之间的余弦相似性，而

表示生成样本i与代理P之间的余弦相似性，α是一个固定参数，是为了将生成样本之间保持一定的类内排序，即如果i<j，则需要满足

，δ也是一个固定参数，将生成样本与代理之间满足一定的相似性，

为生成样本所产生的类内排序损失。

进一步地，在本发明的一个实施例中，所述的步骤S502中，所述的损失函数为：

，式中，

表示对于代理P而言，所有的正样本，

表示样本x与代理P之间的余弦相似性，δ是一个固定参数，将样本与代理之间满足一定的相似性，

为代理与正样本之间的损失，

表示正代理集合，则

为正代理集合的数目。

进一步地，在本发明的一个实施例中，所述的步骤S503中，所述的损失函数为：

，式中，

为代理与负样本之间的损失，P为所有代理组成的集合，|P|则为所有代理的数目，

表示对于代理P而言，所有的负样本，

表示样本x与代理P之间的余弦相似性，δ是一个固定参数，将样本与代理之间满足一定的相似性。

本发明解决了现有技术由于没有考虑到类内的差异，导致生成的嵌入空间对同类样本的区分性不够的问题。具体有益效果包括：

1、本发明所述的深度学习中样本生成和类内排序损失的遥感图像检索方法，利用自监督学习的方法做训练样本增广，基于代理的度量损失做约束条件使得样本与代理之间以及样本与生成样本之间满足指定的优化目标，以此实现生成的嵌入式空间描述性和区分性更为优异；

2、本发明所述的深度学习中样本生成和类内排序损失的遥感图像检索方法，该样品生成方法基于嵌入向量的，十分易于实现；

3、本发明所述的深度学习中样本生成和类内排序损失的遥感图像检索方法，通过样本生成和损失函数的设计，将生成的样本用到了训练中，增加了对样本信息的利用，解决了现有的方法由于基于代理的损失函数，对样本间丰富的信息利用不够的问题。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1是具体实施方式所述的深度学习中样本生成和类内排序损失的遥感图像检索方法流程图；

图2是具体实施方式所述的样本生成的示意图；

图3是具体实施方式所述的训练中样本梯度大小及样本变化的示意图。

具体实施方式

下面结合附图将对本发明的多种实施方式进行清楚、完整地描述。通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

本实施方式所述的深度学习中样本生成和类内排序损失的遥感图像检索方法，包括以下步骤：

步骤S3，从数据加载器中读取遥感图像数据；

步骤S5，对步骤S4输入的特征进行样本生成和损失计算；

本实施方式中，所述的步骤S1中，所述的遥感图像数据集包括训练集和测试集。

本实施方式中，所述的步骤S1中，所述的原始的遥感图像数据的分辨率为224*224。

本实施方式中，所述的步骤S1中，所述的对遥感图像数据进行增强处理包括水平翻转、中心裁剪和正则化。

本实施方式中，所述的步骤S4中，所述的损失函数为：

，式中，

为总的损失函数，

为代理与正样本之间的损失，

为代理与负样本之间的损失，

为生成样本所产生的类内排序损失，λ为

的比例因子，取值为0-1。

本实施方式中，所述的步骤S5中，所述的对步骤S4输入的特征进行样本生成和损失计算，包括以下步骤：

本实施方式中，所述的步骤S501中，所述的样本生成的条件为：

本实施方式中，所述的步骤S501中，所述的损失函数为：

，式中，一个训练中的所有样本对应类别的代理为正代理集合，

表示正代理集合，则

为正代理集合的数目，

表示生成样本i与原始样本x之间的余弦相似性，同理

是生成样本j和原始样本x之间的余弦相似性，而

，δ也是一个固定参数，是为了将生成样本与代理之间满足一定的相似性，

为生成样本所产生的类内排序损失。

本实施方式中，所述的步骤S502中，所述的损失函数为：

，式中，

表示对于代理P而言，所有的正样本；

表示样本x与代理P之间的余弦相似性；δ是一个固定参数，是为了将样本与代理之间满足一定的相似性，

为代理与正样本之间的损失，

表示正代理集合，则

为正代理集合的数目。

本实施方式中，所述的步骤S503中，所述的损失函数为：

，式中，

表示对于代理P而言，所有的负样本，

表示样本x与代理P之间的余弦相似性，δ是一个固定参数，是为了将样本与代理之间满足一定的相似性。

本实施方式基于本发明所述的深度学习中样本生成和类内排序损失的遥感图像检索方法，结合图1能更好的理解本实施方式，提供一种实际的实施方式：

深度学习中样本生成和类内排序损失的遥感图像检索方法，样本生成和损失函数的设计，经过训练得到的嵌入网络可以用于图像检索；由于使用的是基于代理的损失函数，所以对样本间丰富的信息利用不够，所以设计了一种样本生成的方法，同时将生成的样本用到了训练中。训练步骤如下：

1) 搭建网络模型，选取主干网络；

2) 对遥感图像数据集进行预处理和增强处理；预处理遥感图像数据为224*224大小，同时使用了水平翻转、中心裁剪、正则化等数据增强；

3) 将遥感图像数据集输入到数据加载器中，设置训练参数，选取优化器；

4) 从数据加载器中读取遥感图像数据；读取遥感图像前需要采样，如果选择随机采样，则需要设置随机种子；如果是平均采样则不需要；遥感图像数据集分为训练集和测试集，且在训练时只读取训练集中的图像，而检索的时候才读取测试集中的图像；

5) 提取遥感图像数据特征；对经步骤4)输出的数据进行特征提取，然后将特征输入到损失函数中；

6) 计算损失；对经步骤5)得到的特征进行损失的计算，这里损失的计算分成三个步骤：

a) 对于每个样本，判断它与对应的代理之间是否满足样本生成的条件即它们之间的余弦相似性是否大于δ，如果满足，则生成N个样本，并计算这N个样本之间是否满足层次关系来得到损失，同时还需要判断每个生成样本与对应的代理之间满足是否相似性关系生成损失；如果不满足，则直接跳过这一步；

b) 对于每个代理，将其输入到损失函数中计算每个代理与对应的正样本之间是否满足相似性关系来得到损失，即要满足＞δ，若满足，则不会产生损失，若不满足，则会产生损失，与代理离得越远的正样本被拉近的程度会越大，则产生的损失也会越大；相反，与代理离得越近的正样本则被拉近的程度会很小，则产生的损失很小；

c) 对于每个代理，将其输入到损失函数中计算每个代理与对应的负样本之间是否满足相似性关系来得到损失，即满足＜-δ，若满足，则不会产生损失，若不满足，则会产生损失，与代理离得越近的负样本被推远的程度会越大，则产生的损失也会越大；相反，与代理离得越远的负样本则被推远的程度会很小，则产生的损失很小；

7）更新网络；对经步骤6)得到的损失计算梯度，如图3所示，

表示神经网络的参数，

表示没有经过神经网络前的样本，

表示经过神经网络后的样本的嵌入向量，星状表示负样本，正方形表示正样本，样本与代理之间的连线表示梯度，连线越粗则梯度越大，反之同理。然后，反向传播更新网络参数；

8) 重复训练；当训练的次数没有达到指定的次数则会重复步骤4)-7)，当训练次数达到指定次数后则结束训练，将训练后得到的网络用于检索；

9) 检索；将查询图像输入到训练好的嵌入网络中得到嵌入向量，然后将这个向量与检索数据集中其他的嵌入向量进行比较，选出相似性高的图像；

如上所述的深度学习中样本生成和类内排序损失的遥感图像检索方法，在步骤6.a)中，如图2所示，首先，将从网络中得到样本嵌入特征与代理进行余弦相似性计算，如果该样本满足指定的相似性即大于δ，则对该样本进行样本生成；如果对一次训练中每个样本都生成额外的样本的话，会使得产生的样本过于冗余，而且携带的信息也不足，所以只对满足相似性要求的样本进行样本生成。在训练前随机生成N个单位向量

，这些单位向量满足正态分布，则对于某个正样本m，可以生成N个样本，

，当i越大则生成样本与正样本之间的相似性会越小,其中，r表示生成样本时的权重，r越大则生成样本与原始样本的差异就越大，反之就越小。

如上所述的深度学习中样本生成和类内排序损失的遥感图像检索方法，在步骤6.a)中，使用了如下的损失函数：

是对于每个正代理中满足要求的正样本x所产生的所有样本

进行度量，

表示生成样本

与

的相似性,

为原始样本的嵌入向量,

为生成样本的嵌入向量，

表示生成样本

与正样本x所对应代理P的相似性。按照前面的样本生成说明，生成样本应该满足序列相似性：即对于所有x的生成样本，当i越大，则

应该越小。具体的，我们给出这样的约束：对于生成样本i，则我们约定

，都有

，

表示相邻层次之间需要分开的程度，通过这种设置可以将生成样本i与所有的生成样本联系起来，并且使它们保持一定的层次关系，如当i > j时，此时

为正值，则

需要大于这个正值；当i < j时，此时

为负值，则

需要大于这个负值，也即则

需要小于

。同时我们约定所有生成样本需要满足代理P的约束即

。我们将这些约束在

中所体现，这样可以使得生成的样本保持一定的层次性。

如上所述的深度学习中样本生成和类内排序损失的遥感图像检索方法，在步骤6.b)中，使用了如下的损失函数：

；

与代理锚损失（Proxy-Anchor）中一致，对于每个正代理中的正样本与其对应的代理之间的相似性需要大于δ。这种设置最开始由Proxy-Anchor提出，因为之前基于代理的损失函数都是以样本为Anchor，然后与其他类的proxy进行相似性计算。但是这样没有利用到样本间丰富的信息，所以Proxy-Anchor使用了proxy作为anchor，这样每个anchor都与所有样本联系起来，并且同一类的样本之间的信息能够被利用，且不同类的所有负样本信息也可以被利用，这样最大化利用了样本带来的信息。

如上所述的深度学习中样本生成和类内排序损失的遥感图像检索方法，在步骤6.c)中，使用了如下的损失函数：

；

与Proxy-Anchor中一致，对于每个代理中的负样本与其对应的代理之间的相似性需要小于-δ；

如上所述的深度学习中样本生成和类内排序损失的遥感图像检索方法，其特征在于在步骤6)中，使用了如下的损失函数：

；

为总的损失函数，其中设计的

加了一个比例参数，用于控制生成样本产生损失占总损失的比例。

以上对本发明所提出的深度学习中样本生成和类内排序损失的遥感图像检索方法进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。