CN116188995B

CN116188995B - 一种遥感图像特征提取模型训练方法、检索方法及装置

Info

Publication number: CN116188995B
Application number: CN202310390641.1A
Authority: CN
Inventors: 武昊; 张俊; 侯东阳; 王思远
Original assignee: NATIONAL GEOMATICS CENTER OF CHINA
Current assignee: NATIONAL GEOMATICS CENTER OF CHINA
Priority date: 2023-04-13
Filing date: 2023-04-13
Publication date: 2023-08-15
Anticipated expiration: 2043-04-13
Also published as: CN116188995A

Abstract

本发明公开遥感图像特征提取模型训练方法、检索方法及装置，训练方法包括：构建遥感图像特征提取模型；获取样本集，样本集包括图像样本及标注类别的真实标签；从样本集采样支持集和查询集，分别输入模型，得到支持集和查询集中样本特征；根据支持集的各类样本特征，计算支持集中各类样本的代表特征；计算查询集中各样本特征与支持集中各代表特征的协方差距离；根据协方差距离，确定查询集样本与支持集样本的特征相似度，并将相似度最高的支持集样本的真实标签作为查询集样本的预测标签；根据查询集样本的真实标签和预测标签，计算损失，优化模型；重复上述步骤训练模型，直至训练完成。本发明模型特征感知能力强，解决遥感图像标签匮乏的问题。

Description

一种遥感图像特征提取模型训练方法、检索方法及装置

技术领域

本发明涉及遥感图像观测技术领域，尤其涉及一种遥感图像特征提取模型训练方法、检索方法及装置。

背景技术

随着对地观测技术的发展，遥感图像数量发生了爆炸式增长，遥感数据的分辨率也越来越高。如何快速地从海量遥感图像中检索到感兴趣的遥感影像变成了一个难题。基于内容的遥感图像检索技术能挖掘遥感图像的视觉特征并从海量图像中检索出所需图像，因而成为了研究热点。

近年来，基于卷积神经网络（Convolutional Neural Network，CNN）的方法因其高质量的特征提取能力而受到关注。与传统特征工程方法相比，CNN由大量神经元组成，可以从原始数据中提取抽象和高层的语义特征，以压倒性的性能优势迅速成为遥感图像检索领域的主流方法。然而，CNN是一种数据驱动模型，基于CNN的遥感图像检索方法使用优化算法（如 Adam、RMSProp或SGD）对网络参数更新，利用大量标记数据从新开始为每个新任务训练深度神经网络模型。然而，如果新的遥感场景任务只有很少的标记样本并且缺乏相似的数据集，那么具有大量参数的深度神经网络模型很容易过拟合。因此，当标记样本稀缺且不同数据集之间的差异很大时，快速适应一个新的任务数据集对深度检索模型是一个巨大的挑战。

为了解决标注数据有限和难以获取的问题，小样本学习（Few-shot Learning，FSL）方法被提出。通常情况下，小样本学习能够利用类别中的少量标注样本训练便可达到相应学习任务的要求。通过模型在基类上的训练，后续只需少量样本的学习就可以适应新类别的能力，是处理遥感标签匮乏问题的有效手段。当前，小样本学习算法大多遵循基于度量学习的元学习框架，通过元学习嵌入深度度量方法使得嵌入空间的图像距离维持了语义一致性。然而，现有的小样本学习算法中使用的欧式距离度量函数忽略了样本特征维度间的相关性，存在类内样本相对于数据分布不敏感的缺点。

此外，受成像环境与地物分布的影响，遥感图像存在大量的背景信息，反映图像语义信息的前景目标往往只占据图像的小部分区域，且形状较小很难被准确捕捉。因此，利用遥感图像的上下文信息挖掘小目标的语义信息成为了提升模型判别能力的关键。但是，由于CNN卷积池化交替工作的结构特点，卷积运算的感受野一般只与卷积核的尺寸相仿，不利于图像全局上下文信息的捕获。

发明内容

基于此，有必要针对上述问题，提出了一种遥感图像特征提取模型训练方法、检索方法及装置。

本发明公开了一种遥感图像特征提取模型训练方法，所述方法包括：

S110、基于自注意力机制的Transformer模型，构建遥感图像特征提取模型；

S120、获取遥感图像样本集，所述遥感图像样本集包括若干遥感图像样本，以及对所述遥感图像样本的类别进行标注的真实标签；

S130、随机从所述遥感图像样本集中采样支持集和查询集，并分别输入所述遥感图像特征提取模型，得到支持集和查询集中所有样本的特征；

S140、根据支持集的各类样本的所有特征，计算支持集中各类样本的代表特征；

S150、计算查询集中各样本的特征与支持集中各代表特征之间的协方差距离；

S160、根据所述协方差距离，确定查询集中各样本与支持集中各类样本的特征相似度，并将特征相似度最高的支持集中样本的真实标签作为对应的查询集中样本的预测标签；

S170、根据查询集中各样本的真实标签和预测标签，进行损失计算，并根据所述损失，对所述遥感图像特征提取模型进行参数优化；

S180、重复执行步骤S130至步骤S170，对所述遥感图像特征提取模型进行迭代训练，直至达到预设训练停止条件，得到训练完成的遥感图像特征提取模型。

进一步的，所述遥感图像特征提取模型，具体包括：

嵌入模块，用于将输入图像划分为图片块，并对每个图片块进行线性变换，映射到恒定的维度，实现特征变换；

融合模块，用于在嵌入模块的基础上，将可学习的位置嵌入信息分配给每个图片块，生成图片块编码，并将图片块编码与输入图像对应的类别编码和位置编码进行融合，得到融合向量；

编码模块，由若干编码器堆叠而成，每个编码器均由多头自注意力部分和残差连接部分组成，用于实现对融合向量进行自注意力运算。

进一步的，根据支持集的各类样本的所有特征，计算支持集中各类样本的代表特征，具体包括：

根据支持集的各类样本的所有特征，通过以下公式，计算支持集中各类样本的中心特征，并将中心特征作为支持集中各类样本的代表特征：

其中，表示支持集中第/>类样本中的样本数量，/>表示遥感图像特征提取模型，表示支持集中第/>类的第/>个样本，/>表示支持集中第/>类样本的中心特征。

进一步的，计算查询集中各样本的特征与支持集中各代表特征之间的协方差距离，具体包括：

通过以下公式，计算查询集中各样本的特征与支持集中各代表特征之间的协方差距离：

其中，表示支持集中第/>类样本，/>表示比例系数，/>表示支持集中第/>类样本的类内协方差矩阵，/>表示支持集中类间协方差矩阵，/>为单位矩阵，/>为矩阵缩放系数，表示查询集中样本/>与支持集中第n类样本的协方差矩阵，/>表示查询集中样本/>与支持集中第n类样本中心特征之间的协方差距离。

进一步的，根据所述协方差距离，确定查询集中各样本与支持集中各类样本的特征相似度，具体包括：

根据所述协方差距离，利用softmax函数，确定查询集中各样本与支持集中各类样本的特征相似度，softmax函数公式如下：

其中，和/>表示查询集中样本/>和支持集中第/>类及第j类样本的中心特征之间的协方差距离，/>表示查询集中样本/>属于类别/>的概率，即查询集中样本/>与支持集中第/>类样本的特征相似度，/>表示支持集中样本的类别数量。

进一步的，根据查询集中各样本的真实标签和预测标签，进行损失计算，具体包括：

根据查询集中各样本的真实标签和预测标签，进行Arcface损失计算。

另一方面，本发明还公开了一种遥感图像检索方法，所述方法包括：

获取待检索遥感图像，利用上述训练方法中所述的训练完成的遥感图像特征提取模型对所述待检索遥感图像进行特征提取，得到待检索特征；

获取若干遥感图像样本，利用上述训练方法中所述的训练完成的遥感图像特征提取模型对各遥感图像样本进行特征提取，得到若干样本特征；

计算所述待检索特征与各样本特征的欧氏距离；

根据所述欧氏距离，确定所述待检索遥感图像与各遥感图像样本的特征相似度；

根据所述特征相似度，从所述遥感图像样本中匹配所述待检索遥感图像的目标图像。

另一方面，本发明还公开了一种遥感图像特征提取模型训练装置，所述装置包括：

模型构建模块，用于基于自注意力机制的Transformer模型，构建遥感图像特征提取模型；

样本获取模块，用于获取遥感图像样本集，所述遥感图像样本集包括若干遥感图像样本，以及对所述遥感图像样本的类别进行标注的真实标签；

特征提取模块，用于随机从所述遥感图像样本集中采样支持集和查询集，并分别输入所述遥感图像特征提取模型，得到支持集和查询集中所有样本的特征；

支持集代表特征计算模块，用于根据支持集的各类样本的所有特征，计算支持集中各类样本的代表特征；

协方差距离计算模块，用于计算查询集中各样本的特征与支持集中各代表特征之间的协方差距离；

预测模块，用于根据所述协方差距离，确定查询集中各样本与支持集中各类样本的特征相似度，并将特征相似度最高的支持集中样本的真实标签作为对应的查询集中样本的预测标签；

模型优化模块，用于根据查询集中各样本的真实标签和预测标签，进行损失计算，并根据所述损失，对所述遥感图像特征提取模型进行参数优化；

模型训练模块，用于重复执行特征提取模块、支持集代表特征计算模块、协方差距离计算模块、预测模块、模型优化模块的功能，对所述遥感图像特征提取模型进行迭代训练，直至达到预设训练停止条件，得到训练完成的遥感图像特征提取模型。

另一方面，本发明还公开了一种遥感图像检索装置，所述装置包括：

待检索特征获取模块，用于获取待检索遥感图像，利用上述训练方法中所述的训练完成的遥感图像特征提取模型对所述待检索遥感图像进行特征提取，得到待检索特征；

样本特征获取模块，用于获取若干遥感图像样本，利用上述训练方法中所述的训练完成的遥感图像特征提取模型对各遥感图像样本进行特征提取，得到若干样本特征；

欧氏距离计算模块，用于计算所述待检索特征与各样本特征的欧氏距离；

相似度确定模块，用于根据所述欧氏距离，确定所述待检索遥感图像与各遥感图像样本的特征相似度；

目标图像匹配模块，用于根据所述特征相似度，从所述遥感图像样本中匹配所述待检索遥感图像的目标图像。

另一方面，本发明还公开了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行以下遥感图像特征提取模型训练方法的步骤：

S180、重复执行步骤S130至步骤S170，对所述遥感图像特征提取模型进行迭代训练，直至达到预设训练停止条件，得到训练完成的遥感图像特征提取模型；

和/或执行以下遥感图像检索方法的步骤：

计算所述待检索特征与各样本特征的欧氏距离；

采用本发明，具有如下有益效果：

1、本发明中，基于自注意力机制的Transformer模型，构建遥感图像特征提取模型，可以对遥感图像的上下文信息进行充分感知，提高模型的特征感知能力；

2、本发明中，基于小样本学习算法，使得模型具备仅通过少量的样本训练就能快速探测新样本的能力，有效解决遥感图像标签匮乏的问题；

3、本发明中，采用协方差距离度量方法支撑小样本学习算法，有效解决现有的小样本学习算法中使用欧式距离度量函数造成的忽略样本特征维度间的相关性，存在类内样本相对于数据分布不敏感的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

其中：

图1为一个实施例中遥感图像特征提取模型训练方法的流程图；

图2为一个实施例中遥感图像检索方法的流程图；

图3为一个实施例中遥感图像特征提取模型训练装置的结构框图；

图4为一个实施例中遥感图像检索装置的结构框图；

图5为一个实施例中计算机设备的结构框图。

附图标记说明：模型构建模块110，样本获取模块120，特征提取模块130，支持集代表特征计算模块140，协方差距离计算模块150，预测模块160，模型优化模块170，模型训练模块180，待检索特征获取模块210，样本特征获取模块220，欧氏距离计算模块230，相似度确定模块240，目标图像匹配模块250。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，在一个实施例中，提供了一种遥感图像特征提取模型训练方法，该方法具体包括如下步骤：

S120、获取遥感图像样本集，遥感图像样本集包括若干遥感图像样本，以及对遥感图像样本的类别进行标注的真实标签；

S130、随机从遥感图像样本集中采样支持集和查询集，并分别输入遥感图像特征提取模型，得到支持集和查询集中所有样本的特征；

S160、根据协方差距离，确定查询集中各样本与支持集中各类样本的特征相似度，并将特征相似度最高的支持集中样本的真实标签作为对应的查询集中样本的预测标签；

S170、根据查询集中各样本的真实标签和预测标签，进行损失计算，并根据损失，对遥感图像特征提取模型进行参数优化；

S180、重复执行步骤S130至步骤S170，对遥感图像特征提取模型进行迭代训练，直至达到预设训练停止条件，得到训练完成的遥感图像特征提取模型。

本实施例中，基于自注意力机制的Transformer模型构建遥感图像特征提取模型，利用自注意力的方式捕捉遥感图像的全局信息，建立特征之间的长距离依赖关系，对遥感图像的上下文信息进行充分感知，有效提高模型的特征感知能力，进而增强模型的判别能力。

同时，本实施例中，采用小样本学习方式解决遥感图像的标签稀缺问题。小样本学习是指在给定训练样本较少的前提下，模型仅通过少量的样本训练就能快速探测新样本。

具体而言，小样本学习过程分为了训练过程和测试过程，首先构建一个真实的测试任务，即需要实现在只有少量具有真实标签的样本的情况下，将所有测试样本正确归类，其中少量有真实标签的样本组成的集合称为支持集，大量无标签待归类样本组成查询集，一般称这样的一个小样本任务为N-way K-shot任务，即支持集中有N个类别，每个类别中只有K个样本，测试过程就是由大量这样的小样本学习任务组成。于此同时，为了有效训练模型，在训练过程中，同样模拟了大量和测试过程一样的N-way K-shot任务，在这些任务中，同样由支持集和查询集进行，但训练过程中的支持集和查询集中的样本都是有预先标注的真实标签的，以便模型进行能力训练。

为此，对小样本学习进行形式化表达。小样本学习的实现过程可分为元训练阶段和元测试阶段/>，其中/>目的是通过迁移学习来训练度量模块，/>主要是执行任务学习。元训练阶段/>需要训练数据/>，元测试阶段/>需要测试数据。在学习过程中，小样本学习以“任务”为单位，因此需要为每个任务都建立一个支持集/>和一个查询集/>。其中，支持集/>包含/>个类，每个类有/>个标注图像，查询集/>包括个未标记的图像。小样本学习的目的是在/>阶段中只通过/>的少量样本就能检测出/>中的样本。

以及，本实施例中，预设训练停止条件可以包括例如损失的值小于或等于预设的阈值，或者迭代训练次数达到预设的次数阈值等条件。训练过程中可以采用例如梯度下降法对遥感图像特征提取模型进行参数优化。

此外，本实施例中，小样本学习中涉及的度量方式，并非采用传统深度学习的全连接层，而是选择距离度量的方式，从而使得模型在运算过程中所涉及的参数量更小且不容易过拟合。具体而言，距离度量作为一种空间映射的方法，在数据转换为特征向量的基础上，衡量在嵌入空间中两个或者多个目标特征的相似度或者距离，如果同属相同的类特征则距离较近或相似度较高，反之属于不同的类特征则距离较远或相似度较低。

更具体的，本实施例中，小样本学习中采用的是协方差距离度量方法，而并非普通的欧氏距离度量方法，进而有效解决欧式距离度量带来的忽略样本特征维度间的相关性，存在类内样本相对于数据分布不敏感的问题。

进一步的，一实施例中，遥感图像特征提取模型，具体包括：

本实施例中，遥感图像特征提取模型包括：Token嵌入模块、 Token融合模块和编码模块，其中，Token 代表图像中的某一块，上述三个模块通过逐层堆叠的方式连接在一起。具体而言，上述三个模块的详细信息为：

（1）Token嵌入模块：假设定义输入的图像为，其中H表示图像高度，W表示图像宽度，C表示图像通道数。首先完整的图像划分为大小相同的扁平图片块（Patch），定义其形式化表达为/>，（P，P）表示每个图像块的分辨率，/>表示图像块的数量，由于Transformer模型在所有层中使用恒定的宽度，因此每个patch通过线性变换将其映射到恒定的维度，同时也起到特征变换功能，该过程称为块嵌入；

（2）Token融合模块：在块嵌入的基础上，将可学习的位置嵌入信息分配给每个patch作为编码器的输入，同时，考虑到后续任务，模型还引入一个可学习的类别编码（Class Token），最后，将Patch编码、类别编码与位置编码融合的向量输入Transformer编码模块中，进行自注意力运算；

（3）编码模块：编码模块主要是由L个相同的编码器块堆叠而成。编码器块主要由两部分组成，分别是多头自注意力和残差连接，公式如下：

其中，代表上一层编码器块的输出，同时也是本层编码器块的输入，/>代表本层编码器块的输出，LN代表层归一化，MLP代表多层感知机，MSA代表多头注意力。

此外，在融合向量输入编码模块进行自注意力运算结束后，编码模块输出的特征还可以通过一个线性映射转换为长度为256维的特征投影表示。

进一步的，一实施例中，步骤S140，具体包括：

支持集中各样本分别归属于不同的标签类别，而同属一个类别中的样本的特征相似度很高，故本实施例中，可以通过每一类样本中各样本的特征计算出每一类样本的中心特征，再将该中心特征作为代表特征，仅通过各个代表特征对支持集中的各类样本进行统一的特征表示，将后续步骤中查询集各样本特征与支持集各样本特征的协方差距离计算，转换为查询集各样本特征与支持集各代表特征的协方差距离计算，有效减少模型的运算量，提升模型训练速度。

进一步的，一实施例中，步骤S150，具体包括：

进一步的，一实施例中，步骤S160中，根据所述协方差距离，确定查询集中各样本与支持集中各类样本的特征相似度，具体包括：

本实施例中，协方差距离是有效计算两个样本特征相似度的方法，协方差距离解决了欧氏距离在小样本学习中对于类内样本相对于中心特征分布不敏感的缺点，通过协方差矩阵考虑到了特征维度间的关联性。

进一步的，一实施例中，步骤S170中，根据查询集中各样本的真实标签和预测标签，进行损失计算，具体包括：

本实施例中，为了提高遥感图像的类间可分性，使用Arcface损失函数优化模型训练。在实施方式上，通过协方差距离确定的预测标签与真实标签计算Arcface损失，Arcface损失利用特征向量的归一化和角裕度，显著扩大了类间距离，减小了类内距离。

另一方面，如图2所示，在一个实施例中，还提供了一种遥感图像检索方法，所述方法包括：

S210、获取待检索遥感图像，利用上述训练方法中的训练完成的遥感图像特征提取模型对待检索遥感图像进行特征提取，得到待检索特征；

S220、获取若干遥感图像样本，利用上述训练方法中的训练完成的遥感图像特征提取模型对各遥感图像样本进行特征提取，得到若干样本特征；

S230、计算待检索特征与各样本特征的欧氏距离；

S240、根据欧氏距离，确定待检索遥感图像与各遥感图像样本的特征相似度；

S250、根据特征相似度，从遥感图像样本中匹配待检索遥感图像的目标图像。

本实施例实际为训练完成的遥感图像特征提取模型的具体应用，由于待检索图像完全未知，而并非模型训练过程中的样本数据，无需考虑待检索图像与所获取的图像样本的特征相关性，故在遥感图像特征提取模型已经通过训练，具备完善的特征提取能力后，仅需计算待检索图像特征与样本特征的欧氏距离，即可确定待检索图像与样本图像的特征相似度，再根据特征相似度，按照检索需求从遥感图像样本中匹配待检索遥感图像的目标图像，进而实现从海量图像中检索挖掘所需图像的目的。

另一方面，如图3所示，在一个实施例中，还提供了一种遥感图像特征提取模型训练装置，所述装置包括：

模型构建模块110，用于基于自注意力机制的Transformer模型，构建遥感图像特征提取模型；

样本获取模块120，用于获取遥感图像样本集，遥感图像样本集包括若干遥感图像样本，以及对遥感图像样本的类别进行标注的真实标签；

特征提取模块130，用于随机从遥感图像样本集中采样支持集和查询集，并分别输入遥感图像特征提取模型，得到支持集和查询集中所有样本的特征；

支持集代表特征计算模块140，用于根据支持集的各类样本的所有特征，计算支持集中各类样本的代表特征；

协方差距离计算模块150，用于计算查询集中各样本的特征与支持集中各代表特征之间的协方差距离；

预测模块160，用于根据协方差距离，确定查询集中各样本与支持集中各类样本的特征相似度，并将特征相似度最高的支持集中样本的真实标签作为对应的查询集中样本的预测标签；

模型优化模块170，用于根据查询集中各样本的真实标签和预测标签，进行损失计算，并根据损失，对遥感图像特征提取模型进行参数优化；

模型训练模块180，用于重复执行特征提取模块、支持集代表特征计算模块、协方差距离计算模块、预测模块、模型优化模块的功能，对遥感图像特征提取模型进行迭代训练，直至达到预设训练停止条件，得到训练完成的遥感图像特征提取模型。

另一方面，如图4所示，在一个实施例中，还提供了一种遥感图像检索装置，所述装置包括：

待检索特征获取模块210，用于获取待检索遥感图像，利用上述训练方法中的训练完成的遥感图像特征提取模型对待检索遥感图像进行特征提取，得到待检索特征；

样本特征获取模块220，用于获取若干遥感图像样本，利用上述训练方法中的训练完成的遥感图像特征提取模型对各遥感图像样本进行特征提取，得到若干样本特征；

欧氏距离计算模块230，用于计算待检索特征与各样本特征的欧氏距离；

相似度确定模块240，用于根据欧氏距离，确定待检索遥感图像与各遥感图像样本的特征相似度；

目标图像匹配模块250，用于根据特征相似度，从遥感图像样本中匹配待检索遥感图像的目标图像。

图5示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端，也可以是服务器。如图5所示，该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统，还可存储有计算机程序，该计算机程序被处理器执行时，可使得处理器实现上述遥感图像特征提取模型训练方法，和/或上述遥感图像检索方法。该内存储器中也可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行上述遥感图像特征提取模型训练方法，和/或上述遥感图像检索方法。本领域技术人员可以理解，图5中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提出了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行以下遥感图像特征提取模型训练方法的步骤：

S180、重复执行步骤S130至步骤S170，对遥感图像特征提取模型进行迭代训练，直至达到预设训练停止条件，得到训练完成的遥感图像特征提取模型；

和/或执行以下遥感图像检索方法的步骤：

获取待检索遥感图像，利用上述训练方法中的训练完成的遥感图像特征提取模型对待检索遥感图像进行特征提取，得到待检索特征；

获取若干遥感图像样本，利用上述训练方法中的训练完成的遥感图像特征提取模型对各遥感图像样本进行特征提取，得到若干样本特征；

计算待检索特征与各样本特征的欧氏距离；

根据欧氏距离，确定待检索遥感图像与各遥感图像样本的特征相似度；

根据特征相似度，从遥感图像样本中匹配待检索遥感图像的目标图像。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种遥感图像特征提取模型训练方法，其特征在于，所述方法包括：

所述遥感图像特征提取模型包括：Token嵌入模块、Token融合模块和编码模块，其中，Token代表图像中的一个图像块，所述Token嵌入模块、Token融合模块和编码模块通过逐层堆叠的方式连接在一起；所述Token嵌入模块、Token融合模块和编码模块的信息为：

(1)Token嵌入模块：假设定义输入的图像为其中H表示图像高度，W表示图像宽度，C表示图像通道数，图像划分为大小相同的扁平图片块，定义其形式化表达为(P，P)表示每个图像块的分辨率，N＝HW/P²表示图像块的数量，每个图像块通过线性变换映射到恒定的维度，起到特征变换功能，该过程称为块嵌入；

(2)Token融合模块：在块嵌入的基础上，将可学习的位置嵌入信息分配给每个图像块作为编码器的输入，同时，还引入一个可学习的类别编码，将图像块编码、类别编码与位置编码融合的向量输入编码模块中，进行自注意力运算；

(3)编码模块：由L个相同的编码器块堆叠而成，编码器块由两部分组成，分别是多头自注意力和残差连接，公式如下：

f_l′＝MSA(LN(f_l-1))+f_l-1,∈[1,L]

f_l＝MLP(LN(f_l′))+_l′,∈[1,L]

其中，f_l-1代表上一层编码器块的输出，同时也是本层编码器块的输入，f_l代表本层编码器块的输出，LN代表层归一化，MLP代表多层感知机，MSA代表多头注意力。

2.根据权利要求1所述的一种遥感图像特征提取模型训练方法，其特征在于，根据支持集的各类样本的所有特征，计算支持集中各类样本的代表特征，具体包括：

其中，K表示支持集中第n类样本中的样本数量，F表示遥感图像特征提取模型，x_ni表示支持集中第n类的第i个样本，C_n表示支持集中第n类样本的中心特征。

3.根据权利要求2所述的一种遥感图像特征提取模型训练方法，其特征在于，计算查询集中各样本的特征与支持集中各代表特征之间的协方差距离，具体包括：

λ_n＝|S_n|/(∣S_n∣+1)

Q_n＝λ_nM_n+(1-λ_n)M+βI

其中，S_n表示支持集中第n类样本，λ_n表示比例系数，M_n表示支持集中第n类样本的类内协方差矩阵，M表示支持集中类间协方差矩阵，I为单位矩阵，β为矩阵缩放系数，Q_n表示查询集中样本m_i与支持集中第n类样本的协方差矩阵，d(m_i,C_n)表示查询集中样本m_i与支持集中第n类样本中心特征之间的协方差距离。

4.根据权利要求2所述的一种遥感图像特征提取模型训练方法，其特征在于，根据所述协方差距离，确定查询集中各样本与支持集中各类样本的特征相似度，具体包括：

其中，d(F(m_i),C_n)和d(F(m_i),C_j)表示查询集中样本m_i和支持集中第n类及第j类样本的中心特征之间的协方差距离，P_ni表示查询集中样本m_i属于类别n的概率，即查询集中样本m_i与支持集中第n类样本的特征相似度，C表示支持集中样本的类别数量。

5.根据权利要求1所述的一种遥感图像特征提取模型训练方法，其特征在于，根据查询集中各样本的真实标签和预测标签，进行损失计算，具体包括：

6.一种遥感图像检索方法，其特征在于，所述方法包括：

获取待检索遥感图像，利用权利要求1至5任一项所述的训练完成的遥感图像特征提取模型对所述待检索遥感图像进行特征提取，得到待检索特征；

获取若干遥感图像样本，利用权利要求1至5任一项所述的训练完成的遥感图像特征提取模型对各遥感图像样本进行特征提取，得到若干样本特征；

计算所述待检索特征与各样本特征的欧氏距离；

7.一种遥感图像特征提取模型训练装置，其特征在于，所述装置包括：

模型训练模块，用于重复执行特征提取模块、支持集代表特征计算模块、协方差距离计算模块、预测模块、模型优化模块的功能，对所述遥感图像特征提取模型进行迭代训练，直至达到预设训练停止条件，得到训练完成的遥感图像特征提取模型；

f_l′＝MSA(LN(f_l-1))+f_l-1,l∈[1,L]

f_l＝MLP(LN(f_l′))+f_l′,l∈[1,L]

8.一种遥感图像检索装置，其特征在于，所述装置包括：

待检索特征获取模块，用于获取待检索遥感图像，利用权利要求1至5任一项所述的训练完成的遥感图像特征提取模型对所述待检索遥感图像进行特征提取，得到待检索特征；

样本特征获取模块，用于获取若干遥感图像样本，利用权利要求1至5任一项所述的训练完成的遥感图像特征提取模型对各遥感图像样本进行特征提取，得到若干样本特征；

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如权利要求1至5中任一项所述的遥感图像特征提取模型训练方法，和/或权利要求6所述的遥感图像检索方法。