CN113190699A

CN113190699A - 一种基于类别级语义哈希的遥感图像检索方法及装置

Info

Publication number: CN113190699A
Application number: CN202110528115.8A
Authority: CN
Inventors: 程起敏; 邵丽媛; 许圆; 李丹; 周玉琢; 甘德樵; 黄海燕; 黄小松
Original assignee: Huazhong University of Science and Technology
Current assignee: Huazhong University of Science and Technology
Priority date: 2021-05-14
Filing date: 2021-05-14
Publication date: 2021-07-30
Anticipated expiration: 2041-05-14
Also published as: CN113190699B

Abstract

本发明提供了一种基于类别级语义哈希的遥感图像检索方法及装置，属于遥感图像检索领域，方法为：将查询图像输入至已训练完毕的基于深度度量的类别级语义哈希网络模型中，计算查询图像哈希码与哈希码库中各哈希码之间的汉明距离；按照汉明距离从小到大的顺序排序，输出前h个排名的检索结果；h为正整数；训练基于深度度量的类别级语义哈希网络模型的方法为：以基于三元组度量损失、类别级分类损失、哈希码二值化约束和位均衡约束构建的总体目标损失函数最小为目标对基于深度度量的类别级语义哈希网络模型进行训练。实现将遥感图像从高维特征空间映射到低维汉明空间过程中的语义相似性保持，在保证高检索效率低存储空间的同时提升检索准确率。

Description

一种基于类别级语义哈希的遥感图像检索方法及装置

技术领域

本发明属于遥感图像检索领域，更具体地，涉及一种基于类别级语义哈希的遥感图像检索方法及装置。

背景技术

随着遥感卫星技术的不断发展，社会进入了遥感大数据时代。高维数据的存储和检索成为利用海量遥感数据的瓶颈因素，如何实现对大规模遥感图像的准确快速检索，在灾害预警、农业检测和城市规划等遥感应用领域具有重要意义。哈希方法作为一种高效的索引方式，将原始图像从高维特征空间映射到低维的汉明空间，为每幅图像生成较短的二进制哈希码表示，大幅度地提高了检索效率，同时减少了内存消耗。然而哈希映射过程中不可避免地会有部分特征信息的丢失，如何生成语义相似性保持的哈希码，在提升检索效率的同时，保证检索精度，对遥感图像哈希检索的研究有着重要的意义。

现有的大规模遥感图像检索系统大多数是基于哈希的近似最近邻搜索技术实现的，哈希码的有效性取决于采用的图像特征描述符和哈希函数的设计。传统的哈希方法依赖人工设计的特征描述符作为哈希编码的输入，由于遥感图像数据的地物类别复杂多样，人工提取的低级特征不能准确地描述遥感图像更抽象的视觉信息，导致生成的哈希码性能不是最优的。随着深度学习的兴起，研究人员将深度学习技术和哈希技术相融合，提出了一种新的检索框架为深度哈希方法，该方法充分利用了深度学习强大的特征表达能力和哈希码简洁有效的优势，在检索任务中取得了良好的表现。然而现有的一些深度哈希方法虽然使用三元组标签信息来指导学习哈希码之间的相似性关系，但没有采用良好的策略选择有效的三元组，导致三元组的信息利用不充分，影响了图像检索的准确性；其次，一些深度哈希方法没有利用图像类别级语义信息，导致哈希码学习过程中语义空间分布不均匀；最后有些深度哈希方法没有考虑到哈希码的均衡性和独立性，影响最终生成的哈希码质量。

发明内容

针对现有技术的缺陷，本发明的目的在于提供一种基于类别级语义哈希的遥感图像检索方法及装置，旨在解决现有的大规模遥感图像检索系统采用的深度哈希方法仅利用三元组损失学习语义度量空间，没有利用图像类别级语义信息指导哈希码的学习过程，导致语义空间的分布不均匀，进而影响图像哈希检索性能的问题。

为实现上述目的，一方面，本发明提供了一种基于类别级语义哈希的遥感图像检索方法，包括以下步骤：

将查询图像输入至已训练完毕的基于深度度量的类别级语义哈希网络模型中，获取查询图像哈希码；

计算查询图像哈希码与哈希码库中各哈希码之间的汉明距离；

按照汉明距离从小到大的顺序进行排序，输出前h个排名的检索结果；其中，h为正整数；

其中，训练基于深度度量的类别级语义哈希网络模型的方法为：以基于三元组度量损失、类别级分类损失、哈希码二值化约束和位均衡约束构建的总体目标损失函数最小为目标对哈希码学习子网络进行训练；

哈希码库的获取方法为：将遥感图像数据库输入至已训练完毕的基于深度度量的类别级语义哈希网络模型中获取。

优选地，训练所述基于深度度量的类别级语义哈希网络模型的方法，具体包括以下步骤：

(1)提取带标签的训练样本集数据的深度特征；其中，训练样本集为遥感图像数据库；

(2)从深度特征集合中挑选出有效的三元组特征集合；

(3)在全连接层和输出层之间添加隐藏层，构建哈希学习子网络；且结合三元组度量损失、分类损失、哈希码二值化约束和位均衡约束构建总体目标损失函数；

(4)设置总体目标损失函数的权重系数组合，将有效的三元组特征集合输入至哈希学习子网络，通过交叉验证实验，以检索准确率最高为目标，确定总体目标损失函数的权重系数；

(5)以权重系数确定后的总体目标损失函数最小为目标进行迭代训练哈希学习子网络，当网络收敛或者达到最大迭代次数时，保留基于深度度量的类别级语义哈希网络模型的权重参数。

优选地，挑选有效的三元组特征集合的方法，包括以下步骤：

从训练样本集中随机挑选P个类，再从每个类中随机挑选K幅图像，组成一个批次的P×K幅图像；

从上述批次的图像中随机挑选一个锚点样本图像，从同类别图像中选取除锚点样本之外的图像作为正样本图像，再从不同类别的图像中随机挑选出负样本图像，构建(P×K)×(K-1)×(P×K-K)个三元组；

从上述三元组中挑选出三元组损失大于0的三元组作为有效的三元组特征集合。

优选地，总体目标损失函数为：L_Overall＝L_Metric+λL_Cat+γL_Push+αL_Bal；

三元组度量损失函数L_Metric为：

类别级分类损失函数L_Cat为：

哈希码二值化约束L_Push为：

位均衡约束L_Bal为：

其中，λ、γ、α分别表示L_Cat损失、L_Push损失、L_Bal损失的权重系数；M表示每个批次中参与训练的三元组的个数；||.||₂代表向量的L₂范数；f(·)代表哈希映射函数；

表示三元组特征集合

中的锚点样本，

和

表示属于同一类别的特征；

和

表示属于不同类别的特征；m表示最小边界阈值；φ(·)表示交叉熵损失函数；

分别代表锚点样本图像

正样本图像

和负样本图像

经网络分类层的softmax输出值，

分别为锚点样本图像、正样本图像、负样本图像的类别标签；K表示哈希码的长度；e表示长度为K的全1向量；mean(·)表示对特征向量求平均值；||·||代表向量间逐元素相减。

另一方面，本发明提供了基于深度度量的类别级语义哈希的遥感图像检索装置，包括：基于深度度量的类别级语义哈希网络模型和数据处理系统；

基于深度度量的类别级语义哈希网络模型用于以查询图像和遥感图像数据库为输入，分别输出查询图像哈希码和哈希码库；

数据处理系统用于以基于三元组度量损失、类别级分类损失、哈希码二值化约束和位均衡约束构建的总体目标损失函数最小为目标对哈希学习子网络的权重系数进行更新，完成哈希学习子网络的训练；并用于计算查询图像哈希码与哈希码库中各哈希码之间的汉明距离；按照汉明距离从小到大的顺序进行排序，输出前h个排名的检索结果；其中，h为正整数。

优选地，基于深度度量的类别级语义哈希网络模型包括深度特征提取子网络和哈希学习子网络；

深度特征提取子网络用于通过提取查询图像和遥感图像数据库的深度特征；

哈希学习子网络用于挑选有效的三元组特征集合作为输入，学习具有相应特性的紧凑哈希码。

优选地，哈希学习子网络包括顺次相连的两层全连接层、隐藏层和输出层；

全连接层用于将加权组合图像样本某一个或多个深度特征反映至哈希码；

隐藏层用于使用sigmoid激活函数将输出的实值哈希码限制在(0，1)范围之间，并用于对哈希码和图像分类标签之间的关系进行建模；

输出层用于得到每幅输入图像对应的网络softmax输出值，然后计算交叉熵分类损失。

优选地，深度特征提取子网络还包括三元组挑选模块，用于从深度特征中挑选出有效的三元组特征集合，输入至哈希学习子网络。

优选地，挑选有效的三元组特征集合的方法为：

三元组度量损失函数L_Metric为：

类别级分类损失函数L_Cat为：

哈希码二值化约束L_Push为：

位均衡约束L_Bal为：

表示三元组特征集合

中的锚点样本，

和

表示属于同一类别的特征；

和

分别代表锚点样本图像

正样本图像

和负样本图像

经网络分类层的softmax输出值，

总体而言，通过本发明所构思的以上技术方案与现有技术相比，具有以下有益效果：

本发明挑选有效的三元组特征集合作为哈希学习子网络的输入，并在哈希学习子网络中引入一个隐藏层来学习哈希函数；此外，本发明为了学习语义相似性保持的汉明度量空间，使用三元组度量损失函数确保同类图像学习到的哈希码比不同类图像的哈希码更相似；在此基础上，添加类别级分类损失以增强相似哈希码之间的潜在关联性，并使用哈希码二值化约束和位均衡约束学习更有效、判别性更强的二值哈希码，实现将遥感图像从高维特征空间映射到低维汉明空间过程中的语义相似性保持，在保证高检索效率、低存储空间的同时，有效提升检索准确率。

本发明采用小规模数据大批量在线训练的模式挑选有效的三元组集合(从训练样本集中随机挑选P个类，再从每个类中随机挑选K幅图像，组成一个批次的P×K幅图像；从上述批次的图像中随机挑选一个锚点样本图像，从同类别图像中选取除锚点样本之外的图像作为正样本图像，再从不同类别的图像中随机挑选出负样本图像，构建(P×K)×(K-1)×(P×K-K)个三元组；从上述三元组中挑选出三元组损失大于0的三元组作为有效的三元组特征集合)，从而将三元组信息利用得更充分，在加快网络模型收敛速度的同时使得网络学习的特征判别能力更强，提升网络模型的检索性能。

附图说明

图1是本发明实施例提供的基于类别级语义哈希的遥感图像检索方法流程示意图；

图2是本发明实施例提供的基于类别级语义哈希的遥感图像检索装置结构示意图；

图3(a)是本发明实施例提供的飞机场查询图像；

图3(b)是本发明实施例提供的针对图3(a)查询图像示例返回的前20幅检索图像。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

一方面，如图1所示，本发明提供了一种基于类别级语义哈希的遥感图像检索方法，包括以下步骤：

优选地，训练基于深度度量的类别级语义哈希网络模型的方法，具体包括以下步骤：

(2)从深度特征集合中挑选出有效的三元组特征集合；

三元组度量损失函数L_Metric为：

类别级分类损失函数L_Cat为：

哈希码二值化约束L_Push为：

位均衡约束L_Bal为：

表示三元组特征集合

中的锚点样本，

和

表示属于同一类别的特征；

和

分别代表锚点样本图像

正样本图像

和负样本图像

经网络分类层的softmax输出值，

另一方面，本发明提供了基于类别级语义哈希的遥感图像检索装置，包括：基于深度度量的类别级语义哈希网络模型和数据处理系统；

优选地，如图2所示，基于深度度量的类别级语义哈希网络模型包括深度特征提取子网络和哈希学习子网络；

优选地，挑选有效的三元组特征集合的方法为：

三元组度量损失函数L_Metric为：

类别级分类损失函数L_Cat为：

哈希码二值化约束L_Push为：

位均衡约束L_Bal为：

表示三元组特征集合

中的锚点样本，

和

表示属于同一类别的特征；

和

分别代表锚点样本图像

正样本图像

和负样本图像

经网络分类层的softmax输出值，

实施例

本发明提供了一种基于类别级语义哈希的遥感图像检索方法，如图1所示，包括以下步骤：

(1)将带标签的遥感图像数据集输入至深度特征提取子网络，提取遥感图像的深度特征作为图像的中间表示；

步骤(1)具体包括：利用深度卷积神经网络(Convolutional Neural Network，CNN)提取遥感图像更抽象的深度特征，其特征提取主干网络可以是LeNet网络、AlexNet网络、VGG网络、GoogLeNet网络、ResNet网络和DenseNet网络等其中的任意一种；

在本实施例中，选择在ImageNet数据集上预训练的深度卷积神经网络InceptionV3作为深度特征提取的骨干网络，首先将原始遥感图像的大小剪切为固定的256×256，然后提取网络分类输出层前一层的2048维特征向量作为遥感图像的中间表示；InceptionModule采用了模块化的网络结构，核心思想主要表现在将一个较大的二维卷积分解成几个较小的一维卷积，例如将一个5×5卷积分解成两个3×3卷积；另一种分解形式是将n×n的卷积分解成1×n和n×1卷积，例如将7×7卷积分解成两个一维的卷积1×7和7×1；将3×3分解成1×3和3×1，在保持感受野范围不变的前提下大大减少计算参数量，减轻网络过拟合，可以处理更丰富、更多样的空间特征，相比对称的卷积拆分而言，增加了特征的多样化，因此效果更好。假设

表示遥感图像训练样本集的n幅图像，每幅图像I_i对应的类别标签向量为y_i∈{0，1}^C，C代表数据集类别总数，对于训练样本集经Inception V3网络提取的特征集合可表示为G＝{G₁,G₂,...,G_n},G_i∈R²⁰⁴⁸；

(2)从图像提取的深度特征中挑选有效的三元组特征集合，作为哈希学习子网络的输入，用于学习从高维特征向量到低维哈希码序列的映射关系；

具体地，从第一阶段得到的特征集合G＝{G₁,G₂,...,G_n}中挑选有效的三元组集合

M表示每个批次中参与训练的三元组的个数；本实施例采用小规模数据大批量在线训练的模式，首先从训练样本集中随机挑选3个类；接着从每个类中随机挑选30幅图像，组成一个批次的90幅图像；然后从该批次的90幅图像集合中随机挑选一个锚点样本图像，从同类别图像中选取除锚点图像之外的样本图像作为正样本图像；再从不同类别的图像中挑选出负样本图像，共有90×29×60个三元组；最后从中挑选出对训练有意义(三元组损失大于0)的三元组集合，用于学习判别能力更强的哈希码，提升模型检索的准确率；

(3)构建哈希学习子网络，在全连接层和输出层之间增加一个隐藏层，用于对哈希码和图像分类标签之间的关系进行建模，增强相同类别图像哈希码之间的潜在关联性；

步骤(3)中哈希学习子网络的结构具体如下：深度语义哈希学习子网络包括两个全连接层f₁-f₂、一个隐藏层H和一个分类输出层output，分别有1024、512、K和C个神经元；K是哈希码的长度，C是数据集的类别数；全连接层f₁-f₂使用Leaky ReLU非线性激活函数加快网络收敛速度，用于加权组合图像样本某一个或多个特征，并将其反映在哈希码上；隐藏层H使用sigmoid激活函数将网络输出限制在(0，1)范围之间，用于对哈希码和图像分类标签之间的关系进行建模，增强相同类别图像哈希码之间的潜在关联性；分类输出层用于得到每幅输入图像对应的网络softmax输出值，然后计算交叉熵分类损失；

(4)组合使用三元组度量损失、分类损失、哈希码二值化约束和位均衡约束对哈希学习子网络进行训练，生成语义相似性保持的有效哈希码，并保留网络收敛时的模型参数；

步骤(4)具体说明如下：

学习一种非线性的哈希映射关系f：R²⁰⁴⁸→R^K，将描述图像的高维特征向量编码成较短的二进制哈希码序列，K表示哈希码的长度，映射函数f应保证生成的二值哈希码能保留原数据空间的语义相似性关系；对于构建的深度语义哈希网络和挑选的三元组特征输入集合

对哈希层的权重进行随机初始化并从零开始训练，学习相似性保持的有效哈希码；

构建的语义相似性保持的汉明度量空间使用的损失函数包括：

(41)使用三元组度量损失L_Metric保证经哈希学习后同类样本之间哈希码比不同类样本之间的哈希码更接近，即：

其中，M表示每个批次中参与训练的三元组的个数；||.||₂代表向量的L₂范数；f(·)代表哈希映射函数；

表示三元组特征集合

中的锚点样本，

和

表示属于同一类别的特征；

和

表示属于不同类别的特征；m表示最小边界阈值，用于控制正样本和负样本之间的相对距离；

(42)在目标损失函数中添加类别级分类损失L_Cat，保证语义相同的图像具有相近的哈希码，增强了同类别哈希码之间的潜在关联性；即：

(43)在目标损失函数中使用哈希码二值化约束L_Push和位均衡约束L_Bal，一方面使得隐藏层产生的实值哈希码更趋近于0或1，可以更容易地被二值化；另一方面使得生成的哈希码更加分离，离散分布的熵更大，哈希编码性能更好；具体形式为：

具体地，哈希学习子网络的总体目标损失函数为L_Overall＝L_Metric+λL_Cat+γL_Push+αL_Bal，其中，λ、γ、α分别表示L_Cat损失、L_Push损失、L_Bal损失的权重系数；并通过交叉验证实验将三元组损失中的阈值参数m的值设置为0.2，总体目标函数中权重系数的值设置为λ＝1，γ＝0.001，α＝1；W表示哈希学习子网络的权重参数，具体表示如下：

对应的实际操作过程为：对于遥感图像训练数据集，使用开源的深度学习框架Tensorflow来搭建基于深度度量的类别级语义哈希检索模型，首先对哈希层的权重进行随机初始化，并选择Adam优化器优化整体目标函数，为其设置一个较小的学习率η＝10^-4，另外两个Adam超参数β₁和β₁分别设置为0.5和0.9。当网络收敛或者达到最大迭代次数时，保留基于深度度量的类别级语义哈希网络模型最优的参数；

(5)将测试集图像输入到基于深度度量的类别级语义哈希网络模型中，保留测试集图像对象的哈希码；当输入查询图像时，获得模型输出的哈希码，并计算查询图像哈希码与测试集图像哈希码之间的汉明距离；

步骤(5)具体包括如下：

(51)从测试集中挑选查询图像I_q输入至基于深度度量的类别级语义哈希网络模型中，利用sign符号函数对隐藏层激活值进行阈值处理，将K位实值哈希码量化处理为K位二值哈希码；即：

b_q＝(sign(σ(f(G_q))-0.5)+1)/2，

其中I_q表示输入的查询图像，G_q对应输入图像的深度特征向量，f(.)表示哈希映射函数，σ(.)表示sigmoid激活函数，sign(.)符号函数表示将实值哈希码每一位量化为1或-1，得到输入图像最终的二值哈希码b_q。

(52)根据步骤(51)获取的图像哈希码，计算待检索图像哈希码与测试集图像哈希码之间的汉明距离，K代表哈希码的长度，即：

其中，h_q为待检索图像哈希码；h_t为测试集图像哈希码；D(h_q,h_t)为待检索图像哈希码与测试集图像哈希码之间的汉明距离；

(6)按照汉明距离从小到大的顺序进行排序，并输出排名位置靠前的检索结果。

综上所述，本发明首先利用深度卷积神经网络提取遥感图像的深度特征作为图像的中间表示；然后挑选有效的三元组集合作为哈希学习子网络的输入，并在哈希学习子网络中引入一个隐藏层以学习哈希函数；此外，为了学习语义相似性保持的汉明度量空间，本发明使用三元度量损失确保同类图像学习到的哈希码比不同类图像的哈希码更相似；在此基础上添加类别级分类损失以增强相似哈希码之间的潜在关联性，并使用哈希码二值化约束和位均衡约束学习更有效、判别性更强的二值哈希码。本发明通过构建基于深度度量的类别级语义哈希网络模型，实现将遥感图像从高维特征空间映射到低维汉明空间过程中的语义相似性保持，在保证高检索效率、低存储空间的同时，有效提升检索准确率。

以下通过实验以证明本发明的有效性：

本实验选取NWPU-RESISC45数据集进行性能测试。该数据集是目前公开的数据量较大、场景较为复杂的遥感图像分类数据集，共有45个不同的场景类别，每个场景类别包含700幅大小为256×256的图像，空间分辨率为30m-0.2m，共计31500幅遥感图像。与其他现有的遥感数据集相比，该数据集包含的数据量更大、场景类别更丰富，图像变化更多样，考虑到了光照、背景、空间分辨率和外观等因素对数据集每一类图像的影响，具有较高的类内多样性和类间相似性；此外，NWPU-RESISC45数据集还包含一些重叠的细粒度语义类别，如网球场和篮球场、圆形农田和矩形农田等，对分类和检索带来了更大的挑战。本实验的遥感图像检索数据集相关属性信息如表1所示。

表1

评价指标：平均准确率均值(mAP)；

具体地，在本实验中，mAP表示对所有查询样本的平均准确率取平均值，反映检索结果整体相关图像排名情况，网络模型检索出来的相关图像位置越靠前，mAP的值就越大，该方法的检索性能越好。

其中，q_i代表某一查询图像，Q代表查询图像总集合，q_i∈Q；|Q|代表查询图像的总个数；n_i表示第i次查询中图像集返回的与查询图像q_i相关的图像数量；precision(R_i ^j)代表检索返回的前j幅图像的准确率；

首先，在NWPU-RESISC45数据集上进行了消融实验以验证本发明提出的基于深度度量的类别级语义哈希网络模型(记为DMCH模型)中目标损失函数的各个约束项对检索性能的贡献，主要包括：一是没有使用三元组损失的DMCH模型，记为DMCH-nTri；二是挑选三元组时没有使用Batch All策略的DMCH模型，记为DMCH-nBatchAll-Tri；三是没有使用类别级语义信息指导哈希函数学习的DMCH模型，记为DMCH-nCat；四是没有考虑哈希码二值化约束的DMCH模型，记为DMCH-nPush；五是没有考虑哈希码位均衡约束的DMCH模型，记为DMCH-nBal；实验中哈希码的长度分别设置为32、64和96，其中最好的结果用粗体加以标注；实验结果如表2所示；

表2

模型	K＝32	K＝64	K＝96
				DMCH-nTri	0.7408	0.7691	0.7964
DMCH-nBatchAll-Tri	0.7939	0.8123	0.8310
				DMCH-nCat	0.7411	0.7914	0.8010
DMCH-nPush	0.7904	0.8216	0.8429
				DMCH-nBal	0.7468	0.7698	0.7917
DMCH	0.7974	0.8287	0.8437

如表2数据所示，通过分析本发明提出的DMCH模型与各种对比模型在不同长度哈希码时检索的mAP值，可以看出：(1)本发明提出的DMCH模型中目标损失函数的各个约束项对检索性能都有着明显的提升作用；(2)其中三元组度量损失函数L_Metric、类别级分类损失函数L_Cat和哈希码位均衡约束L_Bal对学习相似性保持的有效哈希码影响相对更大，这说明本发明提出的DMCH模型引入L_Metric、L_Cat和L_Bal学习哈希码的必要性，L_Metric较好地保证了哈希码类内相似性和类间差异性，L_Cat增强了相似哈希码之间的潜在关联性，L_Bal使得哈希码离散分布的熵最大，因此学习到的哈希码判别性更好；(3)对比DMCH-nTri模型和DMCH-nBatchAll-Tri模型，本发明提出的DMCH模型不仅学习到基于三元组的汉明度量空间，还使用BatchAll的方式挑选有效的三元组特征集合，为哈希函数的学习提供了更多有用的信息，因此本发明提出的DMCH模型检索准确率相比DMCH-nTri模型和DMCH-nBatchAll-Tri模型检索分别有了进一步的提高；

为了验证本发明提出的DMCH模型的检索性能将其与目前具有代表性的哈希检索模型进行对比，包括：(1)DHN模型，该模型分别使用成对交叉熵损失函数和量化误差损失来学习哈希码之间的相似性关系并保证生成哈希码的质量；(2)DPSH模型，该模型使用全连接层学习哈希函数并设计了一种新的基于成对损失的优化方法；(3)PRH模型，该模型主要思想是采用随机投影将遥感图像从原始空间映射到低维汉明空间，然后通过训练样本数据学习一个变换权重矩阵，以获得性能更优的二值码；(4)KSLSH模型，该模型提出使用人工设计的特征描述符在核空间学习哈希函数；(5)MiLaN模型，该模型在全连接层构建哈希函数，并使用三元组损失和哈希码约束来学习紧凑的哈希码；在NWPU-RESISC45数据集上的哈希检索对比结果如表3所示(表3中mAP@20表示对检索返回的前20幅图像计算平均准确率均值)；

表3

从表3中数据可以看出：由于深度卷积神经网络在图像特征表达方面的优势，使用深度特征的哈希方法的性能明显优于使用浅层特征的哈希方法；监督哈希方法由于利用了标签信息，性能也优于无监督哈希方法；且随着哈希码长度的增加，mAP值也有着一定程度的提高；更值得注意的是，本发明提出的DMCH模型在不同哈希码长度下均获得了最高的mAP值。由此可知，本发明提出的DMCH模型学习到的哈希码不仅考虑了基于三元组度量空间的语义相似性保持关系，在此基础上通过在哈希学习子网络中引入一个隐藏层对哈希码和图像类别标签之间的关系进行建模，增强了相似哈希码之间的潜在关联性，最后使用哈希码约束保证了哈希码的有效性和均衡性，有效地提高了生成哈希码的性能，从而在检索中获得较高的准确率。

此外，在测试阶段，本发明通过比较查询图像经DMCH模型输出的哈希码和测试数据集对应的哈希码集合之间的汉明距离大小，返回与查询图像视觉内容更相似的检索结果。假设图像集数目为N，则单次查询的时间复杂度为O(N)，表示检索时线性扫描图像集对应的哈希码集合所消耗的时间。与其他的基于汉明距离排序的哈希方法相比，本发明提出的DMCH模型在不增加额外的时间复杂度的前提下大幅度地提升了哈希检索的准确率，更适用于执行大规模遥感图像哈希检索任务。

对于如图3(a)所示的背景较复杂的遥感查询图像，本发明的方法检索返回的前20幅图像如图3(b)所示，可以直观看出，本发明提出的DMCH模型能够检索出与查询图像视觉或语义上相似的图像，具有良好的检索性能。

本领域的技术人员容易理解，以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于类别级语义哈希的遥感图像检索方法，其特征在于，包括以下步骤：

计算所述查询图像哈希码与哈希码库中各哈希码之间的汉明距离；

按照所述汉明距离从小到大的顺序进行排序，输出前h个排名的检索结果；其中，h为正整数；

其中，训练所述基于深度度量的类别级语义哈希网络模型的方法为：以基于三元组度量损失、类别级分类损失、哈希码二值化约束和位均衡约束构建的总体目标损失函数最小为目标对哈希码学习子网络进行训练；

所述哈希码库的获取方法为：将遥感图像数据库输入至已训练完毕的基于深度度量的类别级语义哈希网络模型中获取。

2.根据权利要求1所述的遥感图像检索方法，其特征在于，训练所述基于深度度量的类别级语义哈希网络模型的方法，具体包括以下步骤：

(2)从深度特征集合中挑选出有效的三元组特征集合；

3.根据权利要求2所述的遥感图像检索方法，其特征在于，挑选所述有效的三元组特征集合的方法，包括以下步骤：

(1)从训练样本集中随机挑选P个类，再从每个类中随机挑选K幅图像，组成一个批次的P×K幅图像；

(2)从步骤(1)获取的批次图像中随机挑选一个锚点样本图像，从同类别图像中选取除锚点样本之外的图像作为正样本图像，且从不同类别的图像中随机挑选出负样本图像，构建(P×K)×(K-1)×(P×K-K)个三元组；

(3)挑选出三元组损失大于0的三元组作为有效的三元组特征集合。

4.根据权利要求1至3任一所述的遥感图像检索方法，其特征在于，

所述总体目标损失函数为：L_Overall＝L_Metric+λL_Cat+γL_Push+αL_Bal；

所述三元组度量损失函数L_Metric为：

所述类别级分类损失函数L_Cat为：

所述哈希码二值化约束L_Push为：

所述位均衡约束L_Bal为：

表示三元组特征集合

中的锚点样本，

和

表示属于同一类别的特征；

和

分别代表锚点样本图像

正样本图像

和负样本图像

经网络分类层的softmax输出值，

5.一种基于类别级语义哈希的遥感图像检索装置，其特征在于，包括基于深度度量的类别级语义哈希网络模型和数据处理系统；

所述基于深度度量的类别级语义哈希网络模型用于以查询图像和遥感图像数据库为输入，分别获取查询图像哈希码和哈希码库；

所述数据处理系统用于以基于三元组度量损失、类别级分类损失、哈希码二值化约束和位均衡约束构建的总体目标损失函数最小为目标对哈希学习子网络的权重系数进行更新，完成哈希学习子网络的训练；并用于计算查询图像哈希码与哈希码库中各哈希码之间的汉明距离；按照汉明距离从小到大的顺序进行排序，输出前h个排名的检索结果；其中，h为正整数。

6.根据权利要求5所述的遥感图像检索装置，其特征在于，所述基于深度度量的类别级语义哈希网络模型包括深度特征提取子网络和哈希学习子网络；

哈希学习子网络用于挑选有效的三元组特征集合作为输入，学习具有相应特性的哈希码。

7.根据权利要求6所述的遥感图像检索装置，其特征在于，所述哈希学习子网络包括顺次相连的两层全连接层、隐藏层和输出层；

所述全连接层用于将加权组合图像样本某一个或多个深度特征反映至哈希码；

所述隐藏层用于使用sigmoid激活函数将输出的实值哈希码限制在(0，1)范围之间，并用于对哈希码和图像分类标签之间的关系进行建模；

所述输出层用于得到每幅输入图像对应的网络softmax输出值，然后计算交叉熵分类损失。

8.根据权利要求6或7所述的遥感图像检索装置，其特征在于，所述数据处理系统还包括三元组挑选模块，用于从深度特征中挑选出有效的三元组特征集合，输入至哈希学习子网络。

9.根据权利要求8所述的遥感图像检索装置，其特征在于，挑选所述有效的三元组特征集合的方法为：

10.根据权利要求5所述的遥感图像检索装置，其特征在于，所述总体目标损失函数为：L_Overall＝L_Metric+λL_Cat+γL_Push+αL_Bal；

所述三元组度量损失函数L_Metric为：