CN113988147A

CN113988147A - 基于图网络的遥感图像场景多标签分类方法及装置、多标签检索方法及装置

Info

Publication number: CN113988147A
Application number: CN202111487596.9A
Authority: CN
Inventors: 周维勋; 耿万轩
Original assignee: Nanjing University of Information Science and Technology
Current assignee: Nanjing University of Information Science and Technology
Priority date: 2021-12-08
Filing date: 2021-12-08
Publication date: 2022-01-28
Anticipated expiration: 2041-12-08
Also published as: CN113988147B

Abstract

本发明公开了基于图网络的遥感图像场景多标签分类方法及装置、多标签检索方法及装置，包括将查询图像以及图像库中的各图像转化为图结构；利用预先构建并训练的多尺度图卷积网络，基于图结构对图像场景中的地物进行多标签分类；基于查询图像转化的图结构和多标签分类结果对图像库进行第一次检索，得到与查询图像包含至少一种相同地物的图像集合；利用预先构建并训练的图相似网络对图像集合进行第二次检索，得到查询图像与图像库中其他图像的相似度；按照相似度大小返回图像，得到最终的多标签检索结果。本发明利于学习更好的图像特征，实现更精确的遥感图像解译。

Description

基于图网络的遥感图像场景多标签分类方法及装置、多标签检索方法及装置

技术领域

本发明属于图像处理技术领域，涉及一种基于图网络的遥感图像场景多标签分类方法技术领域、多标签分类装置技术领域、多标签检索方法技术领域及多标签检索装置技术领域。

背景技术

随着遥感对地观测技术的不断发展，遥感图像的空间分辨率呈现出从中低分辨率向高分辨率发展的趋势。不同于中低分辨率遥感图像，高分辨遥感图像由于空间分辨率较高可以提供地物更多的细节信息，为遥感图像理解提供了丰富的数据源。针对高分辨率遥感图像，传统的像素级和对象级解译方法适用范围和性能受限，因此，如何发展有效的场景级遥感图像分析方法是现阶段遥感图像处理领域亟待解决的难题。

遥感图像场景分类和检索是对遥感图像进行场景级分析的两个基本任务，前者是将遥感图像场景划分为一个主要的语义类别，如建筑物、道路等，例如文献“AID:Abenchmark data set for performance evaluation of aerial scene classification”对于场景分类的综述，而后者则是从众多遥感图像场景中搜索感兴趣的场景，例如文献“Exploiting Deep Features for Remote Sensing Image Retrieval:A SystematicInvestigation”对于场景检索的综述。遥感图像场景分类和检索方法主要依赖于图像特征，因而如何获取表征能力强的图像特征是场景分类和检索的关键。根据特征获取方式的不同，可将其分为传统的手工特征和当前主流的深度学习特征。手工特征主要包括颜色、纹理、形状、视觉词袋等中低层视觉特征，适用于图像场景简单且数据量小的场景分类与检索问题。相比手工特征，深度学习特征是通过构建深层网络从数据中自动学习图像的高层次特征，其中，以卷积神经网络为代表的深度学习方法广泛用于海量的、场景复杂的遥感图像场景。

现有的基于深度学习的遥感图像场景分类和检索方法具有以下两个特点（可参考上述两篇文献）：（1）一幅遥感图像场景只用其包含的主要语义类别（单标签）进行描述，例如，标注为居民区的场景通常包含建筑物、道路、树木等地物；（2）场景分类和检索本质上都属于识别范畴，但实际应用中通常将二者分开进行处理。然而，遥感图像场景通常包含多种地物，仅用主要的语义类别对场景进行描述是不准确的，基于单标签的场景分类和检索难以实现遥感图像的精确解译。在这一背景下，研究遥感图像场景的多标签分类和检索方法是必要的。

发明内容

本发明旨在针对现有的遥感图像场景单标签分类和检索方法忽略了图像包含的多类别地物信息，不能满足精细、准确的遥感图像解译需求，提供基于图网络的遥感图像场景多标签分类方法、多标签分类装置、多标签检索方法及多标签检索装置。

为实现上述技术目的，本发明采用以下技术方案。

第一方面，本发明提供了基于图网络的遥感图像场景多标签分类方法，包括：将图像转化为图结构；

利用预先构建并训练的多尺度图卷积网络，基于图结构对图像场景中的地物进行多标签分类，获得多标签分类结果；

构建并训练多尺度图卷积网络包括：对训练集的图像构建M层的图像金字塔，确定不同尺度相应的图结构；

通过对每个尺度的图结构分别建立N+1层的图卷积网络来构建多尺度图卷积网络，N+1层的图卷积网络包括N个卷积层和1个全连接层，所述卷积层用于通过卷积运算对不同尺度的图结构进行特征学习；所述全连接层的用于将卷积层学习的特征转化为一个特征向量；

利用训练集训练所述多尺度图卷积网络；利用测试集图像对所述多尺度图卷积网络的分类结果进行评价，根据评价结果对多尺度图卷积网络优化，最终获得多尺度图卷积网络。

进一步地，将图像转化为图结构，包括：

采用多尺度分割算法将遥感图像划分成一系列分割对象，采用颜色直方图和灰度共生矩阵组合得到的特征向量描述各分割对象；

将各分割对象的特征向量描述为图结构的节点，采用加权邻接矩阵描述图结构中节点之间的边。

图像

对应的图结构表示用下面的四元组表示：

其中，

表示图

的节点集合，n表示节点的数目，每个节点用p维特征向量描述，

表示各节点的标签集合，

是连接节点的边；如果两个节点s和t是彼此相邻的，则边是存在的，反之，边是不存在的；s和t表示任意两个节点，V _i的维度是n×p。

是加权邻接矩阵，由下式计算：

式中，

和

分别表示与节点

和

相对应的区域的中心，

和

分别表示与节点

和

相对应的区域的方向。

进一步地，利用二元交叉熵损失函数完成多尺度图卷积网络训练，所述二元交叉熵损失函数表示如下：

其中，

表示图像真实多标签向量中的第i个元素，

表示图像预测多标签向量中的第i个元素，

表示sigmoid函数，n为图像预测多标签向量中的元素总数。

第二方面，遥感图像场景分类与检索本质上都属于图像识别范畴，二者信息可以相互补充以改善分类和检索效果，但现有技术通常将二者分开单独进行处理。针对该技术问题，本发明提供了基于图网络的遥感图像场景多标签检索方法，采用以上技术方案任意一种可能的实施方式提供的基于图网络的遥感图像场景多标签分类方法分别对查询图像以及图像库中的各图像场景中的地物进行多标签分类，获得多标签分类结果；

基于查询图像转化的图结构和多标签分类结果对图像库进行第一次检索，得到与查询图像包含至少一种相同地物的图像集合；

利用预先构建并训练的图相似网络对图像集合进行第二次检索，得到查询图像与图像库中其他图像的相似度，所述图相似网络包括特征提取模块和相似性计算模块；

按照相似度大小返回图像，得到最终的多标签检索结果。

进一步地，所述基于查询图像转化的图结构和多标签分类结果对图像库进行第一次检索，得到与查询图像包含至少一种相同地物的图像集合，包括以下步骤：设

表示查询图像的多标签向量，

表示图像库中图像

的多标签向量，将二者进行向量点积运算，若

，则将图像

划分到图像集合

中；重复以上步骤，可得到最终的图像集合

。

进一步地，所述利用所述图相似网络对图像集合进行第二次检索，得到查询图像与图像库中其他图像的相似度，包括：

分别对查询图像和图像集合中的图像构建图像金字塔，确定各图像金字塔选定尺度对应的图结构；

将各图像金字塔选定尺度对应的图结构分别输入到特征提取模块中相应的分支网络得到查询图像

的节点特征矩阵

和图像集合中的图像

的节点特征矩阵

,并分别映射为特征向量

和特征向量

，其中所述分支网络包括预先构建并训练的多尺度图卷积网络中所述图卷积网络去除其中全连接层以后的结构；

将特征向量

和特征向量

合并为一个特征向量

输入到相似性计算模块中的第一网络分支并经过全连接层组合A，衡量图结构的全局相似性；

将查询图像

的节点特征矩阵

和

的节点特征矩阵

合并后输入到相似性计算模块中的第二网络分支，经过并基于节点的距离矩阵得到距离直方图

，衡量图结构的局部相似性。

特征向量

经过全连接层组合A，再和距离直方图

组合后输入到全连接层组合B，最终得到两幅图像对应图结构的相似性。

第三方面，本发明提供了基于图网络的遥感图像场景多标签分类装置，包括图结构表示模块和多尺度图卷积网络模块；

所述图结构表示模块，用于将图像转化为图结构；

所述多尺度图卷积网络模块，用于构建和训练多尺度图卷积网络模块；利用预先构建并训练的多尺度图卷积网络，基于图结构对图像场景中的地物进行多标签分类，获得多标签分类结果；

所述多尺度图卷积网络模块包括针对图像的不同尺度分别建立的N+1层的图卷积网络，N+1层的图卷积网络包括N个卷积层和1个全连接层，所述卷积层用于通过卷积运算对不同尺度的图结构进行特征学习；所述全连接层的用于将卷积层学习的特征转化为一个特征向量。

第四方面，本发明提供了基于图网络的遥感图像场景多标签检索装置，包括：多标签分类模块、第一次检索模块、图相似网络模块以及多标签检索结果确定模块；

所述多标签分类模块采用如以上技术方案的任意一种实施方式提供的基于图网络的遥感图像场景多标签分类装置，用于对查询图像以及图像库中的各图像场景中的地物进行多标签分类，获得多标签分类结果；

所述第一次检索模块，用于基于查询图像转化的图结构和多标签分类结果对图像库进行第一次检索，得到与查询图像包含至少一种相同地物的图像集合；

所述图相似网络模块，用于构建图相似网络，所述图相似网络模块包括特征提取模块和相似性计算模块；所述图相似网络用于对图像集合进行第二次检索，得到查询图像与图像库中其他图像的相似度；

所述多标签检索结果确定模块，用于按照相似度大小返回图像，得到最终的多标签检索结果。

进一步地，所述特征提取模块，用于在相应的分支网络分别输入查询图像和图像集合中图像的图像金字塔中确定选定尺度对应的图结构，得到查询图像

的节点特征矩阵

和图像集合中的图像

的节点特征矩阵

，并分别映射为特征向量

和特征向量

；所述分支网络包括所述多尺度图卷积网络模块预先构建并训练的多尺度图卷积网络中所述图卷积网络去除全连接层以后的结构。

进一步地，所述相似性计算模块中的第一网络分支用于输入特征向量

和特征向量

合并获得的一个特征向量

并经过全连接层A，衡量图结构的全局相似性；

所述相似性计算模块中的第二网络分支用于将查询图像

的节点特征矩阵

和图像集合中的图像

的节点特征矩阵

基合并后于节点的距离矩阵得到距离直方图

，衡量图结构的局部相似性。

特征向量

经过全连接层组合A，再和距离直方图

现有的遥感图像场景多标签分类和检索方法仅考虑图像包含的主要地物类别，对于复杂场景难以实现准确的解译。与现有技术相比，本发明具有如下特点和有益效果：

1、考虑遥感图像包含的所有地物类别实现场景的多标签分类和检索，相比现有的单标签场景分类与检索方法，能够实现更精确的遥感图像解译。

2、采用多尺度分割算法完成图像分割，并采用光谱和纹理的组合特征对图结构的节点进行描述，通过将规则的遥感图像转化图结构表示，利用图结构的节点来表征场景中不同地物的空间关系，有利于学习更好的图像特征。

3、顾及遥感图像包含地物的多尺度特点，构建多尺度的图卷积网络，实现场景的多标签分类。

4、利用训练的多尺度图卷积网络，构建图相似性网络，直接输出查询图像与图像库中图像的相似度。

5、采用两步式检索策略，第一步检索利用场景的多标签向量过滤不相似的图像，在此基础上，对查询图像与图像库中图像的相似度进行排序进行第二部检索，得到最终的多标签检索结果。

附图说明

图1为本发明实施例提供的多标签分类和检索的整体流程图；

图2为本发明实施例多尺度图卷积网络多标签分类的流程图；

图3为本发明实施例图相似性网络多标签检索的流程图。

具体实施方式

以下结合说明书附图和具体实施例对本发明做进一步详细说明。

实施例1：基于图网络的遥感图像场景多标签分类方法，包括：

将图像转化为图结构；

利用预先构建并训练的多尺度图卷积网络，基于图结构对图像场景中的地物进行多标签分类，获得多标签分类结果。

构建并训练多尺度图卷积网络包括：

步骤1，构造用于多标签分类与检索的场景图像库。具体实施时，可以预先构造场景图像库。实施例中，首先对大尺寸的遥感图像进行固定尺寸切分得到场景图像库，并划分为训练集

和测试集

两个子图像库，其中训练集

用于网络训练，测试集

用于多标签分类与检索结果评估。

步骤2，采用分割算法将训练集和测试集中的遥感图像场景分割成一系列均质对象，以各分割对象的质心为图结构的节点，将图像转化为图结构表示。

本步骤首先采用多尺度分割算法将训练集

和测试集

中的遥感图像划分成一系列均质对象，并采用颜色直方图和灰度共生矩阵组合得到的特征向量描述各分割对象。然后，分别对训练集和测试集中的图像场景的各分割区域进行标注，得到各图像的多标签标注结果。最后，将分割对象视为图结构中的节点，按照下面的实施方式定义图结构。

假设

表示训练集中的第

幅图像，经多尺度分割得到的分割对象数目为n，则

对应的图结构表示可用下面的四元组表示：

其中，

表示图

的节点集合，n表示节点的数目，p表示节点的特征维度。

表示各节点的标签集合，

是连接节点的边，如果两个节点是彼此相邻的，则边是存在的，反之，边是不存在的。

是加权邻接矩阵，由下式计算：

式中，

和

分别表示与节点

和

相对应的区域的中心，

和

分别表示与节点

和

相对应的区域的方向。边和邻接矩阵能够描述遥感图像中地物的空间关系。

定义了图结构的节点和边之后，为了得到最终的图结构表示，实施例采用步骤2中各分割对象的特征向量描述节点，采用加权邻接矩阵描述节点的边。由此，可将训练集

中规则的遥感图像转化为图结构表示，重复此过程，可将测试集

中的遥感图像也转化为图结构表示。

步骤3，利用步骤2得到的图结构表示，构建顾及不同地物的多尺度图卷积网络，并利用训练集

进行网络训练。

由于遥感图像包含的地物具有多尺度的特点，本步骤构建了多尺度的图卷积网络用于多标签分类，具体流程参见图2。对于一幅输入图像

，首先,构建M层的图像金字塔

，并得到不同尺度相应的图结构表示

。然后，对于每个尺度分别构建N+1层的图卷积网络，其中包括N个卷积层和1个全连接层，卷积层的作用是通过卷积运算对不同尺度的图结构进行特征学习，而全连接层的作用则是将卷积层学习的特征转化为一个特征向量。最后，不同尺度的图卷积网络学习的特征最终通过融合得到图像的多尺度特征。以第j层的图卷积网络为例，特征的学习过程可用下式表示：

其中，

表示网络第k层的输出，

表示k-1和k层之间的连接权重，

表示网络第k-1层的输出，

表示第k层的偏置项。

网络构建好后，可选地，本实施例中采用训练集

优化下面的二元交叉熵损失函数完成网络训练，

其中，

表示图像真实多标签向量中的第i个元素，

表示图像预测多标签向量中的第i个元素，

表示sigmoid函数，n为图像预测多标签向量中的元素总数。

在其它实施例中，还可以采用现有技术中的损失函数训练网络。关于网络的训练方法为现有技术，本发明不予赘述。

步骤4，利用步骤3训练得到的多尺度图卷积网络对测试集

中的各图像场景进行多标签分类，对分类结果进行评价，完成场景的多标签分类。利用训练的多尺度卷积网络进行多标签分类后，测试集

中的第i幅图像

可用一个标签向量

表示，其中

取值为0或1（0表示图像不包含当前类别，1与之相反），n表示测试集中图像的地物类别数目。

基于训练的网络进行多标签分类并进行结果评价为现有技术，本发明不予赘述。

实施例2：在实施例1的基础上，本实施提供了基于图网络的遥感图像场景多标签检索方法（如图1所示），还包括：

利用以上实施例提供的基于图网络的遥感图像场景多标签分类方法分别对查询图像以及图像库中的各图像场景中的地物进行多标签分类，获得多标签分类结果；

利用预先构建并训练的图相似网络对图像集合进行第二次检索，得到查询图像与图像库中其他图像的相似度，所述图相似网络模块包括特征提取模块和相似性计算模块；

按照相似度大小返回图像，得到最终的多标签检索结果。实施时，将查询图像

与图像库中的图像

对应的图结构输入图相似性网络，网络会输出二者的相似度

。依次重复该过程，得到查询图像与图像库中所有图像的相似度，然后按照从大到小的顺序排列，取前R ^,幅得到最终的对标签检索结果。

在以上实施例步骤4的基础上，本实施例中构建并训练图相似网络还包括以下步骤：

步骤5，基于步骤4得到的图像的多标签向量，对测试集进行第一次检索，具体的检索过程如下。

假设

表示测试集中查询图像

的多标签向量，

表示测试集中图像

的多标签向量，将二者进行向量点积运算如下：

如果

，则表明查询图像

和图像

至少包含一种相同的地物类别，二者必然是相似的。然后，将图像

划分到集合

中，并依次重复以上检索过程得到最终的图像集合

。

步骤6，基于步骤3训练的多尺度图卷积网络，构建并训练图相似性网络。

本步骤基于步骤3训练的多尺度图卷积网络（去掉全连接层）构建了图相似网络用于多标签检索，主要包括特征提取模块和相似性计算模块，具体流程参见图3。具体来说，首先，给定一幅查询图像

和一幅图像库中的图像

，并分别对查询图像和图像集合中的图像构建图像金字塔，确定各图像金字塔选定尺度对应的图结构；将各图像金字塔选定尺度转化为图结构表示

和

。然后，

和

分别输入到特征提取模块相应的分支网络得到

的节点特征矩阵

和

的节点特征矩阵

，并分别映射为特征向量

和

；最后，

和

合并为一个特征向量

输入到相似性计算模块中的一个网络分支并经过全连接层组合A，可衡量图结构的全局相似性；而另一个网络分支的输入为基于节点距离矩阵得到的距离直方图

，可衡量图结构的局部相似性。

特征向量

经过全连接层组合A，再和距离直方图

组合后输入到全连接层组合B，最终得到两幅图像对应图结构的相似。

图相似性网络构建好后，针对特征提取模块和相似性计算模块分别采用训练集

进行优化。对于特征提取模块，基于contrastive loss损失函数定义如下所示的损失函数：

其中，右边第一项表示对比损失项，第二项表示特征正则项，有利于网络训练收敛。m表示图像对的数量，

可根据多标签向量的内积确定，当

时，y=1表示输入的两幅图像是匹配的图像对，反之，y=0表示输入的两幅图像不匹配。

，m为设定的阈值。对于相似性计算模块，定义如下所示的损失函数：

其中，m表示图像对的数量，

为网络最后一层的输出，

表示两幅图像的真实距离。

发明提出的基于图网络的遥感图像场景多标签分类与检索技术方案，首先构造场景图像库，其次将规则的遥感图像场景转化为图结构表示并构建多尺度的图卷积网络实现场景多标签分类，然后利用多标签分类得到的多标签向量进行第一次检索得到初步的检索结果，最后基于训练的多尺度图卷积网络构建图相似性网络度量初始检索结果中查询图像与图像库中其他图像的相似度进行第二次检索得到最终的多标签检索结果。

实施3：与以上实施例提供的基于图网络的遥感图像场景多标签分类方法相对应地，本实施例提供了基于图网络的遥感图像场景多标签分类装置，包括图结构表示模块和多尺度图卷积网络模块；

所述图结构表示模块，用于将图像转化为图结构；

实施例4：与以上实施例提供的基于图网络的遥感图像场景多标签检索方法相对应地，本实施例提供了基于图网络的遥感图像场景多标签检索装置，包括：多标签分类模块、第一次检索模块、图相似网络模块以及多标签检索结果确定模块；

所述多标签分类模块采用如以上实施例提供的基于图网络的遥感图像场景多标签分类装置，用于对查询图像以及图像库中的各图像场景中的地物进行多标签分类，获得多标签分类结果；

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置、模块和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备（系统）、和计算机程序产品的流程图和／或方框图来描述的。应理解可由计算机程序指令实现流程图和／或方框图中的每一流程和／或方框、以及流程图和／或方框图中的流程和／或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的步骤。

以上结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，这些均属于本发明的保护之内。

Claims

1.基于图网络的遥感图像场景多标签分类方法，其特征在于，包括：

将图像转化为图结构；

构建并训练的多尺度图卷积网络包括：对训练集的图像构建M层的图像金字塔，确定不同尺度相应的图结构；

通过对每个尺度的图结构分别建立N+1层的图卷积网络来构建多尺度图卷积网络，N+1层的图卷积网络包括N个卷积层和1个全连接层，所述卷积层用于通过卷积运算对不同尺度的图结构进行特征学习；所述全连接层用于将卷积层学习的特征转化为一个特征向量；

利用训练集训练所述多尺度图卷积网络；利用测试集对所述多尺度图卷积网络的分类结果进行评价，最终获得多尺度图卷积网络。

2.根据权利要求1所述的基于图网络的遥感图像场景多标签分类方法，其特征在于，将图像转化为图结构，包括：

采用多尺度分割算法将遥感图像划分成一系列分割对象，并将获得的各分割对象视为图结构的节点，利用颜色直方图和灰度共生矩阵组合得到的特征向量对所述图结构的节点进行描述，采用加权邻接矩阵描述图结构中节点之间的边。

3.根据权利要求1所述的基于图网络的遥感图像场景多标签分类方法，其特征在于，利用二元交叉熵损失函数完成多尺度图卷积网络训练，所述二元交叉熵损失函数表示如下：

其中，

表示图像真实多标签向量中的第i个元素，

表示图像预测多标签向量中的第i个元素，

表示sigmoid函数，n为图像预测多标签向量中的元素总数。

4.基于图网络的遥感图像场景多标签检索方法，其特征在于，

采用权利要求1-3中任意一项权利要求所述的基于图网络的遥感图像场景多标签分类方法分别对查询图像以及图像库中的各图像场景中的地物进行多标签分类，获得多标签分类结果；

按照相似度大小返回图像，得到最终的多标签检索结果。

5.根据权利要求4所述的基于图网络的遥感图像场景多标签检索方法，其特征在于，基于查询图像转化的图结构和多标签分类结果对图像库进行第一次检索，得到与查询图像包含至少一种相同地物的图像集合，包括以下步骤：设

表示查询图像的多标签向量，

表示图像库中图像

的多标签向量，将二者进行向量点积运算，若

，则将图像

划分到图像集合

中；重复以上步骤，得到最终的图像集合

。

6.根据权利要求4所述的基于图网络的遥感图像场景多标签检索方法，其特征在于，利用预先构建并训练的图相似网络对图像集合进行第二次检索，得到查询图像与图像库中其他图像的相似度，包括：

的节点特征矩阵

和图像集合中的图像

的节点特征矩阵

，并分别映射为特征向量

和特征向量

，其中所述分支网络包括预先构建并训练的多尺度图卷积网络中所述图卷积网络去除全连接层以后的结构；

将特征向量

和特征向量

合并为一个特征向量

将查询图像

的节点特征矩阵

和

的节点特征矩阵

合并后输入到相似性计算模块中的第二网络分支经过基于节点的距离矩阵得到距离直方图

，衡量图结构的局部相似性；

特征向量

经过全连接层组合A，再和距离直方图

组合后输入到全连接层组合B，最终得到两幅图像对应图结构的相似度。

7.基于图网络的遥感图像场景多标签分类装置，其特征在于，包括图结构表示模块和多尺度图卷积网络模块；

所述图结构表示模块，用于将图像转化为图结构；

8.基于图网络的遥感图像场景多标签检索装置，其特征在于，包括：

多标签分类模块、第一次检索模块、图相似网络模块以及多标签检索结果确定模块；

所述多标签分类模块采用如权利要求7所述的基于图网络的遥感图像场景多标签分类装置，用于对查询图像以及图像库中的各图像场景中的地物进行多标签分类，获得多标签分类结果；

9.根据权利要求8所述的基于图网络的遥感图像场景多标签检索装置，其特征在于，所述特征提取模块，用于在相应的分支网络分别输入查询图像和图像集合中图像的图像金字塔中确定选定尺度对应的图结构，得到查询图像的节点特征矩阵

和图像集合中的图像

的节点特征矩阵

，并分别映射为特征向量

和特征向量

10.根据权利要求8所述的基于图网络的遥感图像场景多标签检索装置，其特征在于，所述相似性计算模块中的第一网络分支用于输入特征向量

和特征向量

合并获得的一个特征向量

并经过全连接层组合A，衡量图结构的全局相似性；

所述相似性计算模块中的第二网络分支用于将查询图像

的节点特征矩阵

和图像集合中的图像

的节点特征矩阵

合并后基于节点的距离矩阵得到距离直方图

，衡量图结构的局部相似性；

特征向量

经过全连接层组合A，再和距离直方图