CN110569761B

CN110569761B - 一种基于对抗学习的手绘草图检索遥感图像的方法

Info

Publication number: CN110569761B
Application number: CN201910796308.4A
Authority: CN
Inventors: 杨文�; 徐芳; 夏桂松; 张瑞祥
Original assignee: Wuhan University WHU
Current assignee: Wuhan University WHU
Priority date: 2019-08-27
Filing date: 2019-08-27
Publication date: 2021-04-02
Anticipated expiration: 2039-08-27
Also published as: CN110569761A

Abstract

本发明提供一种基于对抗学习的手绘草图检索遥感图像的方法，该方法利用了深度卷积神经网络提取手绘草图和遥感图像的高层语义特征，并利用对抗学习使深度卷积神经网络能够提取手绘草图域和遥感图像域之间不变的特征。网络的输入为手绘草图和遥感图像对，特征提取器分别提取手绘草图和遥感图像的特征；然后将提取到的特征分别作为域鉴别器和分类器的输入，根据提取到的特征判别输入的域及类别。本发明采用的基于对抗学习的手绘草图检索遥感图像方法，能够有效提取手绘草图和遥感图像的高层语义信息，弥合两个域之间的差距，得到更高的检索精度。

Description

一种基于对抗学习的手绘草图检索遥感图像的方法

技术领域

本发明属于图像处理技术领域，特别涉及基于草图的遥感图像检索方法。

背景技术

随着遥感图像数量的急剧增长，从大规模数据库中智能检索遥感图像成为大量研究工作的重点。传统的基于内容的图像检索技术是利用输入的查询图像在数据库中查找具有相似内容的遥感图像。然而感兴趣目标经常只存在于用户的脑海中，没有查询图像可用，例如感兴趣目标非常少见或者用户不认识感兴趣目标。与利用文字来描述感兴趣目标的方式相比，手绘草图是一种更直观、更简洁、更生动的描述方式，如图1所示。并且由于触屏设备的蓬勃发展，获取手绘草图十分便捷。目前基于草图的自然图像检索已经有了大量的工作，也取得了不错的成果。但基于草图的遥感图像检索还甚少有人研究。由于遥感图像几何结构和空间格局的高复杂性，在自然图像上发展起来的检索方法在遥感图像上不能取得满意的结果。总的来说，基于草图的遥感图像检索还尚未解决，存在以下两点挑战：(1)草图和遥感图像本质上属于两个完全不同的域，前者由稀疏的黑色线条和白色背景构成，后者由稠密的彩色像素点构成，遥感图像复杂的特性进一步扩大了两个域之间的差距；(2)现有的方法往往只将草图与训练样本中包含的类别相关联，对未知类别不具有泛化性。而现实场景中，草图往往是用来形容未知目标，模型只能利用从已知类别学习到的常识和度量准则来计算手绘草图和遥感图像之间的相似度。一种弥合草图和遥感图像之间的差距的泛化性模型，目前还未有人实现过。

发明内容

针对现有技术中的缺陷，本发明的目的是提供一种基于对抗学习的手绘草图检索遥感图像的方法，该方法能够更好地弥合草图和遥感图像之间的差距，对于未知目标具有更好的泛化性，以更高的精度实现基于草图的遥感图像检索。

本发明提供的基于对抗学习的手绘草图检索遥感图像方法，包括以下具体步骤：

步骤1，将手绘草图、遥感图像分别输入到两路完全相同、参数共享的特征提取器G(·)中，提取手绘草图和遥感图像的特征，即：将手绘草图s输入特征提取器得到手绘草图的特征

将遥感图像r输入特征提取器得到遥感图像的特征

其中θ_G为表示特征提取器的参数；

步骤2，将提取的手绘草图特征F_s和遥感图像特征F_r分别输入到鉴别器D(·)中，根据提取的特征判别网络的输入是手绘草图还是遥感图像，即：将手绘草图特征F_s输入鉴别器得到

将遥感图像特征F_r输入鉴别器得到

其中θ_D为表示鉴别器的参数；

步骤3，计算损失函数

使得鉴别器能够根据输入的特征正确地判别网络的输入是手绘草图还是遥感图像；

步骤4，产生多组手绘草图和遥感图像对(s,r)，通过反向传播算法来进行训练鉴别器，得到步骤2中的最优参数

步骤5，利用步骤4得到的最优参数

将手绘草图特征F_s输入鉴别器得到

将遥感图像特征F_r输入鉴别器得到

步骤6，将提取的手绘草图特征F_s和遥感图像特征F_r分别输入到分类器C(·)中，根据提取的特征判别网络的输入属于哪一类别，即：将手绘草图特征F_s输入分类器得到

将遥感图像特征F_r输入分类器得到

其中θ_C为表示分类器的参数；

步骤7，计算损失函数

N_c表示语义类别的总数目，该损失函数包含三项：第一项是对比损失函数，其中t表示手绘草图和遥感图像是否属于同一类别，若是，则t＝1，否则t＝0，m为设定的阈值；第二项为交叉熵损失函数，其中

若j＝{c_s,c_r}，则

否则

第三项表示更新参数后的鉴别器无法根据输入的特征正确地判别网络的输入是手绘草图还是遥感图像，即弥合了草图和遥感图像之间的差距；α，β，γ分别是三项损失函数的权重；

步骤8，由步骤4产生的多组手绘草图和遥感图像对(s,r)，通过反向传播算法来进行训练特征提取器和分类器，得到步骤1的最优参数

和步骤6中的最优参数

步骤9，通过步骤8训练得到的特征提取器，将手绘草图映射为特征G(s)，将遥感图像映射为特征G(r)，分别计算手绘草图s与数据库中每幅遥感图像

的欧式距离，即Dist(s,r_j)＝||G(s)-G(r_j)||₂，其中M表示数据库中遥感图像的总数目；

步骤10，对Dist(s,r_j)进行从小到大排序，值越小，表示相似度越高，其对应的遥感图像即为检索结果。

进一步的，步骤1中所述特征提取器G(·)选择的是ResNet-50，参数的初始值使用Pytorch官网里提供的ResNet-50预训练模型。

进一步的，步骤2中所述鉴别器包括两个全连接层及一个Sigmoid函数，相当于一个二分类器，根据所得特征判别网络输入为手绘草图还是遥感图像。

进一步的，步骤6中所述分类器包括一个全连接层及一个Softmaxloss层，根据所得特征判别网络输入属于哪一类别。

与现有技术相比，本发明具有如下优点和有益效果：

本发明利用深度卷积神经网络提取手绘草图和遥感图像的高层特征，利用孪生学习和分类器使特征提取器的泛化性更强，提取的特征区分性更强，利用对抗学习使特征提取器获得域不变的特征。通过对比实验表明：本发明采用的基于对抗学习的手绘草图检索遥感图像方法，能够有效提取手绘草图和遥感图像的高层语义信息，弥合两个域之间的差距，得到更高的检索精度。

附图说明

图1为本发明实施例遥感图像检索示意图。

图2为本发明所用的深度卷积神经网络模型图。

图3为本发明手绘草图和遥感图像对部分图例。

图4为本发明实施例中已知类别目标的检索结果。

图5为本发明实施例中未知类别目标的检索结果。

图6为本发明实施例在大尺度遥感图像中检索已知类别目标的实验结果。

图7为本发明实施例在大尺度遥感图像中检索未知类别目标的实验结果。

具体实施方式

为使本发明的目的、技术方案及效果更加清楚、明确，以下参照附图对本发明进一步详细说明。

本发明提供了一种基于对抗学习的手绘草图检索遥感图像的方法，如图1所示，具体包括如下步骤：

步骤1：如图2所示，将手绘草图s和遥感图像r分别缩放到224像素×224像素，再随机水平翻转，输入到两路结构完全相同、参数共享的特征提取器G(·)中，分别得到手绘草图的特征

和遥感图像的特征

其中特征提取器选择的是ResNet-50(ResidualNeural Network of50 layers)，参数的初始值使用Pytorch官网里提供的ResNet-50预训练模型。θ_G为特征提取器的参数。

步骤2：将手绘草图特征F_s和遥感图像特征F_r输入到鉴别器D(·)中，得到输出

和

鉴别器包括两个全连接层及一个Sigmoid函数，相当于一个二分类器，根据所得特征判别网络输入为手绘草图还是遥感图像。θ_D为鉴别器的参数。

步骤3：由步骤2得到的

和

计算损失函数

使得鉴别器能够正确地判断出网络的输入来自与哪一个域(手绘草图或者遥感图像)。

步骤4：产生手绘草图和遥感图像对(s,r)，通过反向传播方法来训练鉴别器，采用Adam优化器，学习率设置为0.0002，得到步骤2中的参数

本实施例中的手绘草图和遥感图像对(s,r)来自数据集Rsketch，该数据集由发明人自己收集，包含20类目标，每类目标包含200张遥感图像和45张手绘草图。其中遥感图像是从公开数据集PatternNet、WHU-RS19、AID和UCM中精心挑选的，其中感兴趣目标占整幅图像的大部分；手绘草图是志愿者画的。数据集的部分样本如图3所示，手绘草图和遥感图像对即一幅手绘草图和一幅遥感图像。

步骤5：将手绘草图特征F_s和遥感图像特征F_r输入到参数更新后的鉴别器D(·)中，得到输出

和

步骤6：将手绘草图特征F_s和遥感图像特征F_r输入到分类器C(·)中，得到

和

分类器包括一个全连接层及一个Softmaxloss层，根据所得特征判别网络输入属于哪一类别。θ_C为分类器的参数。

步骤7：由步骤1得到的F_s和F_r，步骤5得到的

和

步骤6得到的

和

计算损失函数

N_c表示语义类别的总数目，该损失函数包含三项：第一项是对比损失函数，其中t表示手绘草图和遥感图像是否属于同一类别，若是，则t＝1，否则t＝0，m为设定的阈值，该项表示属于同一类的手绘草图和遥感图像在特征空间的欧氏距离较小，属于不同类别的手绘草图和遥感图像在特征空间的欧式距离较大；第二项为交叉熵损失函数，其中

若j＝{c_s,c_r}，则

否则

步骤8：由步骤4产生的手绘草图和遥感图像对(s,r)，通过反向传播算法来训练特征提取器和分类器，采用SGD优化器，学习率设置为0.001，得到步骤1的参数

和步骤6中的参数

步骤9：通过步骤8训练得到的特征提取器，分别将手绘草图s与数据库中的每幅遥感图像

映射到特征空间中，其中M表示数据库中遥感图像的总数目，并计算手绘草图与数据库中的每幅遥感图像在特征空间中的欧式距离，即Dist(s,r_j)＝||G(s)-G(r_j)||₂。

步骤10：对Dist(s,r_j)进行从小到大排序，Dist(s,r_j)值越小，表示其对应的遥感图像与手绘草图相似度越高，在返回的检索结果中排在越前面。

在实验过程中，首先选用RSketch数据集进行精度测试。RSketch数据集是专为基于草图的遥感图像检索任务收集的数据集，包含20类目标，每类目标包含200张遥感图像和45张手绘草图。对于每一类目标，随机选取100张遥感图像和40张手绘草图训练模型，剩余的数据用于测试基于草图的遥感图像检索精度。实验结果如图4和图5所示，包括对已知类别目标的检索和未知类别的检索。对检索精度的测量，本方法采用的分析指标为：平均绝对误差(MAE)和返回的前K个检索结果的平均精度(topK，K＝10,50,100)。实验结果如表1所示。由检索精度的定量分析和定性分析可知，本方法对于已知类别的目标和未知类别的目标均有较好的检索精度。

表1基于草图的遥感图像检索精度分析

实验过程中，利用手绘草图检索大尺度遥感图像中的感兴趣目标，实验结果如图6和图7所示，包括对已知类别目标的检索和未知类别的检索。图6为在大尺度遥感图像中检索已知类别目标的实验结果，大尺度遥感图像中包含不止一个感兴趣目标。图7为在大尺度遥感图像中检索未知类别目标的实验结果，大尺度遥感图像中仅包含一个感兴趣目标。由检索精度分析可知，本方法能够有效地在大尺度遥感图像中检索已知类别目标和未知类别目标。

应当理解的是，上述针对较佳实施例的描述较为详细，并不能因此而认为是对本发明专利保护范围的限制，本领域的普通技术人员在本发明的启示下，在不脱离本发明权利要求所保护的范围情况下，还可以做出替换或变形，均落入本发明的保护范围之内，本发明的请求保护范围应以所附权利要求为准。