CN108446312B

CN108446312B - 基于深度卷积语义网的光学遥感图像检索方法

Info

Publication number: CN108446312B
Application number: CN201810116627.1A
Authority: CN
Inventors: 焦李成; 刘芳; 高蕾; 丁静怡; 张梦旋; 陈璞花; 古晶; 唐旭; 杨淑媛; 侯彪
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2018-02-06
Filing date: 2018-02-06
Publication date: 2020-04-21
Anticipated expiration: 2038-02-06
Also published as: CN108446312A

Abstract

本发明公开了一种基于深度卷积语义网的光学遥感图像检索方法，主要解决现有技术中光学遥感图像检索精度低的问题。本发明具体步骤如下：(1)构建深度卷积语义网络；(2)构建训练集；(3)调整网络参数；(4)构建光学遥感图像检索数据库；(5)提取遥感图像特征向量；(6)融合遥感图像特征向量；(7)建立特征库；(8)检索光学遥感图像检索数据库中的光学遥感图像。本发明构建深度卷积语义网络，提取图形的浅层特征、过渡特征以及深层特征，加权融合三个特征，实现不同层级特征优势互补，提高了图像特征的表达能力，进而提高了光学遥感图像的检索精度。

Description

基于深度卷积语义网的光学遥感图像检索方法

技术领域

本发明属于图像处理技术领域，更进一步涉及光学遥感图像检索排序技术领域中的一种基于深度卷积语义网的遥感图像检索方法。本发明可以实现从海量遥感影像数据库中快速、准确地查询到感兴趣的场景图像。

背景技术

随着卫星遥感技术的不断发展，遥感影像数据在城市规划、环境保护、地质勘探、灾害管理、军事侦查与打击等领域得到了日益广泛的应用。然而，随着获取数据的急速增长，如何从海量遥感影像数据库中快速、准确地检索查询出相关的场景图像已经成为目前迫切需要解决的问题之一。遥感图像特征提取方法是基于内容的遥感图像检索的关键环节，它的好坏直接影响到系统的运行效率和检索效果。

Fang Zhao在其发表的论文“Deep Semantic Ranking Based Hashing forMulti-Label Image Retrieval”(IEEE Transactions on Pattern Analysis andMachine Intelligence，2015)中提出了一种深度卷积网络Alexnet的图像检索方法。该方法可以实现从海量影像数据库中快速、准确地查询到感兴趣的图像。该方法首先利用卷积网络Alexnet获取第一图像特征，并引入哈希层构造哈希函数，将图像深度特征的学习和哈希函数的构造在同一过程中完成，挖掘图像特征与哈希函数内在关系，克服了现有技术中利用图像底层特征而导致特征表达能力不强、检索精度低的问题，大大提高图像检索准确率。但是，该方法仍然存在不足之处是：由于卷积网络采用卷积层和池化层级联的形式，造成了网络对于图像的语义信息提取功能较弱。

桂林明辉信息科技有限公司在其申请的专利文献“一种基于深度卷积神经网络的图像检索方法”(专利申请号：201710192895.7，公开号：107092661A)中公开了一种深度学习的图像检索方法。该方法首先构建深度卷积神经网络模型，用训练集图像数据对网络模型进行参数调整，在参数调整完成后的模型中输入测试集数据进行二进制哈希编码的学习，将测试集图像的特征用哈希编码的形式表现出来。最后，在测试集图像数据上进行图像检索，即从测试集图像数据所构成的海量影像数据库中快速、准确地查询到感兴趣的图像。通过本发明学习到了测试集图像数据所构成影像数据库中的图像的深层次的特征，提高图像检索的精确度，克服了传统方法难以学习到图像深层次的特征的缺点，以及解决了计算数据量存储空间过大的问题。但是，该方法仍然存在的不足之处是：仅仅提取深度卷积网络最后一层全连接层的单一特征，对于信息复杂度高的图像检索能力较弱，同时哈希层二值化的哈希编码造成的量化误差也没有得到合理的解决，因此造成了检索精度较低。

发明内容

本发明的目的是针对上述现有技术的不足，提出一种基于深度卷积语义网的光学遥感图像检索方法。本发明与现有其他光学遥感图像检索方法相比，首先在网络中使用了连接层，将第三个池化层与第十三个卷积层的信息进行融合，提高了网络对于图像语义信息的提取功能，通过用加权融合方法融合浅层特征、过渡特征以及深层特征，使得多级别特征能够实现优势互补，提高了模型对于信息复杂度高的图像的检索精度。

本发明实现上述目的的思路是：先构建一个共25层的深度卷积语义网络，构建训练集遥感图像并进行预处理，用预处理后的训练集遥感图像训练网络，再构建光学遥感图像检索数据库并对数据库中的图像进行预处理，然后将预处理后的检索数据库中的图像送入训练好的网络中，获取检索数据库中每一幅图像的浅层特征向量、过渡特征向量、深层特征向量，用加权融合方法融合提取的三个特征，建立特征库，最后通过计算待检索光学遥感图像的融合特征向量与特征库中每幅图像的融合特征向量两两之间的欧式距离，以及对应的图像之间的相似度，检索出相似度排序中的前30的图像。

本发明实现的具体步骤包括如下：

(1)构建深度卷积语义网络：

搭建一个25层的深度卷积语义网络，其结构依次为：输入层→第一个卷积层→第二个卷积层→第一个池化层→第三个卷积层→第四个卷积层→第二个池化层→第五个卷积层→第六个卷积层→第七个卷积层→第三个池化层→第四个池化层→第八个卷积层→第九个卷积层→第十个卷积层→第五个池化层→第十一个卷积层→第十二个卷积层→第十三个卷积层→第一个连接层→第六个池化层→第一个全连接层→第二个全连接层→第三个全连接层→分类层；

各层的参数设置如下：

将输入层特征映射图的总数设置为3个；

将第一至第二个共两个卷积层的特征映射图的总数设置为64个，卷积核的尺度设置为3×3个节点；

将第三至第四个共两个卷积层的特征映射图的总数设置为128个，卷积核的尺度设置为3×3个节点；

将第五至第七个共三个卷积层的特征映射图的总数设置为256个，卷积核的尺度设置为3×3个节点；

将第八至第十三个共六个卷积层的特征映射图的总数设置为512个，卷积核的尺度设置为3×3个节点；

将第一个连接层的特征映射图的总数设置为768个，卷积核的尺度设置为3×3个节点；

将第一至第二个共两个池化层的特征映射图的尺寸设置为2×2个节点；

将第三个池化层的特征映射图的尺寸设置为4×4个节点；

将第四至第六个共三个池化层的特征映射图的尺寸设置为2×2个节点；

将第一个全连接层的特征映射图的总数设置为4096；

将第二个全连接层的特征映射图的总数设置为1000；

将第三个全连接层的特征映射图的总数设置为128；

将分类层中的特征映射图的尺寸设置为20个；

(2)构建训练集：

(2a)从光学遥感影像数据库中选取1280幅图像组成训练集；

(2b)利用傅里叶变换，去除训练集中的每一幅光学遥感图像中的噪声；

(2c)在[0，255]区间，对去除噪音后的训练集中的每一幅遥感图像进行归一化处理；

(3)调整卷积语义网络参数：

将归一化后的训练集图像，输入到深度卷积语义网络模型中，对该模型进行迭代训练，直至深度卷积语义网络的损失值小于预先设定的极小值0.0001，得到训练好的深度卷积语义网络；

(4)构建光学遥感图像检索数据库：

(4a)从光学遥感影像数据库中除训练集以外的图像中，任意选取5120幅图像，组成光学遥感图像检索数据库；

(4b)利用傅里叶变换方法，去除光学遥感图像检索数据库中每一幅图像中的噪声；

(4c)在[0，255]区间，对去除噪音后的光学遥感图像检索数据库中的每一幅图像进行归一化处理；

(5)提取遥感图像特征向量：

将光学遥感图像检索数据库中归一化后的图像，批量输入到训练好的深度卷积语义网络中，分别提取第一个全连接层输出的浅层特征向量、第二个全连接层输出的过渡特征向量、第三个全连接层输出的深层特征向量；

(6)融合遥感图像特征向量：

(6a)利用加权融合公式，对浅层特征向量、过渡特征向量、深层特征向量进行融合，得到融合特征向量；

(7)建立特征库：

将光学遥感图像检索数据库中所有图像的融合特征向量，保存为pkl格式文件，将该文件作为特征库；

(8)检索光学遥感图像检索数据库中的光学遥感图像：

(8a)从光学遥感图像检索数据库中的图像中，任意选取1幅图像作为待检索图像，在

(8b)计算所选待检索图像与光学遥感图像检索数据库中的每一幅图像两两之间的相似度；

(8c)将检索图像库中所有的图像按照相似度的大小排序，选取排名前30的图像，作为检索的光学遥感图像结果。

本发明与现有的技术相比具有以下优点：

第一，本发明通过构建深度卷积语义网络，在网络中使用了连接层，将第三个池化层与第十三个卷积层的信息进行融合，提高了网络对于图像语义信息的提取功能，克服了现有技术中提取图像特征方面缺少语义信息的问题，使得本发明的图像特征表达能力有所增强，提高了光学遥感图像检索的精度。

第二，本发明通过将第一个全连接层输出的浅层特征向量、第二个全连接层输出的过渡特征向量、第三个全连接层输出的深层特征向量加权融合，得到图像的融合特征向量，根据融合特征向量之间的欧式距离计算两幅图像之间的相似度，克服了现有技术提取单一特征造成了对于信息复杂度高的图像检索能力较弱的问题，使得多级别特征能够实现优势互补，提高了模型对于信息复杂度高的图像的检索精度。

附图说明

图1是本发明的流程图；

图2是本发明构建的深度卷积语义网络的结构示意图。

具体实施方式

下面结合附图对本发明做进一步的详细描述。

参照附图1，对本发明的步骤做进一步的详细描述。

该方法利用训练好的深度卷积语义网络，分别提取光学遥感图像中的浅层特征向量、过渡特征向量、深层特征向量，加权融合所提取的三个特征向量，将其作为每幅图像的融合特征向量，并建立特征库；分别计算待检索光学遥感图像的融合特征向量与特征库中每一幅图像的融合特征向量两两之间的欧式距离，作为相似度。

步骤1，构建深度卷积语义网络。

搭建一个25层的深度卷积语义网络，其结构依次为：输入层→第一个卷积层→第二个卷积层→第一个池化层→第三个卷积层→第四个卷积层→第二个池化层→第五个卷积层→第六个卷积层→第七个卷积层→第三个池化层→第四个池化层→第八个卷积层→第九个卷积层→第十个卷积层→第五个池化层→第十一个卷积层→第十二个卷积层→第十三个卷积层→第一个连接层→第六个池化层→第一个全连接层→第二个全连接层→第三个全连接层→分类层。

附图2是本发明构建的深度卷积语义网络结构示意图，包括13层卷积层、6层池化层、1层连接层，3层全连接层。图2中的单向箭头表示特征在通道上的叠加，图2中的矩形块表示深度卷积语义网络提取的卷积特征图，矩形块上方的参数表示卷积特征图分辨率和卷积特征图的总数，例如，第一个卷积层矩形块上方的参数224×224×64中，224×224表示卷积特征图分辨率为224个像素，64表示卷积特征图的总数为64个。

各层的参数设置如下：

将输入层特征映射图的总数设置为3个。

将第一至第二个共两个卷积层的特征映射图的总数设置为64个，卷积核的尺度设置为3×3个节点。

将第三至第四个共两个卷积层的特征映射图的总数设置为128个，卷积核的尺度设置为3×3个节点。

将第五至第七个共三个卷积层的特征映射图的总数设置为256个，卷积核的尺度设置为3×3个节点。

将第八至第十三个共六个卷积层的特征映射图的总数设置为512个，卷积核的尺度设置为3×3个节点。

将第一个连接层的特征映射图的总数设置为768个，卷积核的尺度设置为3×3个节点。

将第一至第二个共两个池化层的特征映射图的尺寸设置为2×2个节点。

将第三个池化层的特征映射图的尺寸设置为4×4个节点。

将第四至第六个共三个池化层的特征映射图的尺寸设置为2×2个节点。

将第一个全连接层的特征映射图的总数设置为4096。

将第二个全连接层的特征映射图的总数设置为1000。

将第三个全连接层的特征映射图的总数设置为128。

将分类层中的特征映射图的尺寸设置为20个。

步骤2，构建训练集。

从光学遥感影像数据库中选取1280幅图像组成训练集。所选训练集中的每幅图像中1个场景，所有场景可分为20类，每类选取64幅图像。

利用傅里叶变换，去除训练集中的每一幅光学遥感图像中的噪声。

在[0，255]区间，对去除噪音后的训练集中的每一幅遥感图像进行归一化处理。

步骤3，调整卷积语义网络参数。

将归一化后的训练集图像，输入到深度卷积语义网络模型中，对该模型进行迭代训练，直至深度卷积语义网络的损失值小于预先设定的极小值0.0001，得到训练好的深度卷积语义网络。

步骤4，构建光学遥感图像检索数据库。

从光学遥感影像数据库中除训练集以外的图像中，任意选取5120幅图像，组成光学遥感图像检索数据库。光学遥感图像检索数据库中每一幅图像都可作为待检索图像，从光学遥感图像检索数据库中将所有与待检索图像相似的遥感图像查询出来。

利用傅里叶变换方法，去除光学遥感图像检索数据库中每一幅图像中的噪声。

在[0，255]区间，对去除噪音后的光学遥感图像检索数据库中的每一幅图像进行归一化处理。

步骤5，提取遥感图像特征向量。

将光学遥感图像检索数据库中归一化后的图像，批量输入到训练好的深度卷积语义网络中，分别提取第一个全连接层输出的浅层特征向量、第二个全连接层输出的过渡特征向量、第三个全连接层输出的深层特征向量。

步骤6，融合遥感图像特征向量。

利用加权融合公式，对浅层特征向量、过渡特征向量、深层特征向量进行融合，得到融合特征向量。

所述权融合公式如下：

其中，T表示加权融合后的融合特征向量，u表示设为0.5的浅层特征向量的权值系数，Q表示浅层特征向量，v表示设定为0.3过渡特征向量的权值系数，G表示过渡特征向量，w表示初始值设定为0.2的深层特征向量的权值系数，S表示深层特征向量。

步骤7，建立特征库。

将光学遥感图像检索数据库中所有图像的融合特征向量，保存为pkl格式文件，将该文件作为特征库。

步骤8，检索光学遥感图像检索数据库中的光学遥感图像。

从光学遥感图像检索数据库中的图像中，任意选取1幅图像作为待检索图像，从特征库中取出所选待检索图像的融合特征向量。

按以下步骤计算所选待检索图像与光学遥感图像检索数据库中的每一幅图像两两之间的相似度。

第一步，按照下式，计算所选待检索图像的融合特征向量和特征库中每一幅图像的融合特征向量两两之间的欧式距离：

其中d₁₂表示待检索图像的融合特征向量和特征库中的任意一幅图像的融合特征向量中的元素两两之间的欧式距离，x_1i表示待检索图像的融合特征向量中的第i个元素，x_2i表示特征库中的任意一幅图像的融合特征向量中的第i个元素。d₁₂的值越小表示两个向量的相似度越大。

第二步，按照下式，计算所选待检索图像与光学遥感图像检索数据库中的每一幅图像两两之间的相似度：

l₁₂＝1-d₁₂

其中，l₁₂表示待检索图像和其他图像两两之间的相似度。l₁₂的值越大表示两个向量的相似度越大。

将检索图像库中所有的图像按照相似度的大小排序，选取排名前30的图像，作为检索的光学遥感图像结果。

下面结合仿真实验对本发明的效果做进一步的说明。

1.仿真条件：

本发明的仿真实验是在主频2.40GHz*16的Intel(R)Xeon(R)E5-2630 CPU、内存64GB的硬件环境和caffe的软件环境下进行的。

2.仿真内容与结果分析：

使用本发明的方法和两个现有技术(二维卷积神经网络CNN(convolutionalnerual network)、深度卷积哈希网络SSDH(Supervised Learning of Semantics-Preserving Hash via Deep Convolutional Neural Networks))的方法，分别对从光学遥感影像数据库图像中选取的5120幅图像所组成的光学遥感检索数据库中的图像，进行图像检索。

下面采用精度P(Precision)和召回率R(Recall)两个指标，分别对本发明和两个现有技术，二维卷积神经网络CNN(convolutional nerual network)和深度卷积哈希网络SSDH(Supervised Learning of Semantics-Preserving Hash via Deep ConvolutionalNeural Networks)的方法的检索结果进行评价。对于所有待检索图像，获取检索数据库中每一幅图像与待检索图像两两之间的相似度排名前30的图像。在这些图像中，统计与待检索图像属于同一类的图像的个数，记为A、统计与待检索图像不属于同一类的图像的个数，记为B、统计与待检索图像属于同一类但相似度排名在30名以后的图像的个数，记为C。

利用下式，分别计算本发明和两个现有技术对光学遥感图像的检索精度P和召回率R：

精度P＝A/(A+B)

召回率R＝A/(A+C)

将本发明和两个现有技术对光学遥感图像的检索精度P和召回率R的计算结果记录在表1中。其中CNN表示二维卷积神经网络CNN的方法，SSDH表示深度卷积哈希网络SSDH的方法。

表1.三种检索方法效果一览表

	精度P	召回率R
			本发明	97.667％	11.445％
CNN	92.333％	10.820％
			SSDH	94.523％	11.093％

从表1可见，本发明的检索精度P(Precision)为97.667％，召回率R(Recall)为11.445％，这两个指标均高于两种现有技术方法，证明本发明可以得到更好的光学遥感图像检索效果。

接下来，我们采用单类精度AP(Average Precision)为指标，分别对本发明和两个现有技术(二维卷积神经网络CNN(convolutional nerual network)、深度卷积哈希网络SSDH(Supervised Learning of Semantics-Preserving Hash via Deep ConvolutionalNeural Networks))的方法，分别对光学遥感图像检索数据库中每一类待检索图像的检索结果进行评价。对于每一类待检索图像，获取检索数据库中每一幅图像与待检索图像两两之间的相似度排名前30的图像。在这些图像中，统计与待检索图像属于同一类的图像的个数，记为D、统计与待检索图像不属于同一类的图像的个数，记为E。

表2.三种检索方法的单类精度一览表

	CNN	SSDH	本发明
				庄稼(AP)	88.112％	90.022％	95.875％
飞机(AP)	93.333％	94.554％	96.667％
				人造草坪(AP)	98.556％	98.889％	99.678％
沙滩(AP)	97.999％	97.112％	99.876％
				建筑(AP)	88.223％	93.998％	96.339％
灌木丛(AP)	92.234％	94.333％	98.333％
				云(AP)	99.999％	100％	100％
容器(AP)	91.333％	93.998％	99.998％
				密集住宅区(AP)	86.772％	89.222％	95.667％
工厂(AP)	85.067％	90.888％	95.002％
				原始森林(AP)	85.778％	94.556％	97.009％
海港(AP)	97.887％	98.999％	100％
				中等密度住宅区(AP)	90.998％	94.227％	96.889％
海洋(AP)	100％	100％	100％
				停车场(AP)	91.998％	92.234％	97.334％
河流(AP)	100％	100％	100％
				街道(AP)	91.889％	95.223％	98.888％
铁路(AP)	92.786％	93.786％	99.112％
				稀疏住宅区(AP)	85.865％	88.201	92.335
储罐(AP)	87.845％	90.299	94.335

利用下式，分别计算本发明和两个现有技术对光学遥感图像检索的单类精度AP(Average Precision)：

单类精度AP＝D/(D+E)

将本发明和两个现有技术对光学遥感图像的单类精度AP的计算结果记录在表2中，其中表格左边第一列表示20类图像中每一类的精度AP，CNN表示二维卷积神经网络CNN的方法，SSDH表示深度卷积哈希网络SSDH的方法。

从表2可见，本发明对于信息含量较为丰富的图像如中等密度住宅区、停车场、工厂这些类别图像的检索精度AP，明显高于两种现有技术方法，证明本发明可以对于信息含量较为丰富的图像有较高的检索精度。

综上所述，本发明通过构建深度卷积语义网络，利用训练好的深度卷积语义网络，分别提取光学遥感图像中的浅层特征向量、过渡特征向量以及深层特征向量，加权融合所提取的三个特征向量，不仅实现多级别特征优势互补，而且网络中的连接层有效提高了网络对于图像语义信息的提取能力，从而提高了图像的检索精度。

Claims

1.一种基于深度卷积语义网的光学遥感图像检索方法，其特征在于，该方法构建深度卷积语义网络，利用训练好的深度卷积语义网络，分别提取光学遥感图像检索数据库中每幅图像的浅层特征向量、过渡特征向量、深层特征向量，将三个特征向量进行融合，作为每幅图像的融合特征向量，建立特征库，通过计算待检索光学遥感图像的融合特征向量与特征库中每幅图像的融合特征向量两两之间的欧式距离，以及对应的图像之间的相似度，检索出相似度排序中的前30的图像；该方法的具体步骤包括如下：

(1)构建深度卷积语义网络：

各层的参数设置如下：

将输入层特征映射图的总数设置为3个；

将第三个池化层的特征映射图的尺寸设置为4×4个节点；

将第一个全连接层的特征映射图的总数设置为4096；

将第二个全连接层的特征映射图的总数设置为1000；

将第三个全连接层的特征映射图的总数设置为128；

将分类层中的特征映射图的尺寸设置为20个；

(2)构建训练集：

(2a)从光学遥感影像数据库中选取1280幅图像组成训练集；

(3)调整卷积语义网络参数：

将归一化后的训练集图像，输入到深度卷积语义网络模型中，对该模型进行迭代训练，直至深度卷积语义网络的损失值小于预先设定的极小值0.0001，得到训练好的深度卷积语义网；

(4)构建光学遥感图像检索数据库：

(5)提取遥感图像特征向量：

(6)利用下述加权融合公式，对浅层特征向量、过渡特征向量、深层特征向量进行融合，得到融合特征向量：

其中，T表示加权融合后的融合特征向量，u表示设为0.5的浅层特征向量的权值系数，Q表示浅层特征向量，v表示设定为0.3过渡特征向量的权值系数，G表示过渡特征向量，w表示初始值设定为0.2的深层特征向量的权值系数，S表示深层特征向量；

(7)建立特征库：

(8)检索光学遥感图像检索数据库中的光学遥感图像：

(8a)从光学遥感图像检索数据库中的图像中，任意选取1幅图像作为待检索图像，从特征库中取出所选待检索图像的融合特征向量；

(8b)计算所选待检索图像与光学遥感图像检索数据库中的每一幅图像两两之间的相似度，其步骤如下：

其中d₁₂表示待检索图像的融合特征向量和特征库中的任意一幅图像的融合特征向量两两之间的欧式距离，x_1i表示待检索图像的融合特征向量中的第i个元素，x_2i表示特征库中的任意一幅图像的融合特征向量中的第i个元素；d₁₂的值越小表示两个向量的相似度越大；

l₁₂＝1-d₁₂

其中，l₁₂表示待检索图像和特征库中任意一幅图像两两之间的相似度，l₁₂的值越大表示两个向量的相似度越大；

2.根据权利要求1所述的基于深度卷积语义网的光学遥感图像检索方法，其特征在于，步骤(2a)中所述的训练集是指，所选训练集中的每幅图像中1个场景，所有场景可分为20类，每类选取64幅图像。

3.根据权利要求1所述的基于深度卷积语义网的光学遥感图像检索方法，其特征在于，步骤(4a)中所述的光学遥感图像检索数据库是指，光学遥感图像检索数据库中每一幅图像都可作为待检索图像，从光学遥感图像检索数据库中将所有与待检索图像相似的遥感图像查询出来。