CN115630236B

CN115630236B - 无源遥感影像的全球快速检索定位方法、存储介质及设备

Info

Publication number: CN115630236B
Application number: CN202211277845.6A
Authority: CN
Inventors: 李传广; 闫丽阳; 宋科; 张森; 芦秋迪; 宋瑞丽
Original assignee: Perception World Beijing Information Technology Co ltd
Current assignee: Perception World Beijing Information Technology Co ltd
Priority date: 2022-10-19
Filing date: 2022-10-19
Publication date: 2023-08-18
Anticipated expiration: 2042-10-19
Also published as: CN115630236A

Abstract

本发明提供了一种无源遥感影像的全球快速检索定位方法、设备及存储介质，其中定位方法包括：建立全球基准影像瓦片数据库，提取瓦片的局部特征点以及特征描述子，对局部特征点特征进行特征聚合，产生瓦片的全局特征向量，为第一全局特征向量，建立全球基准影像瓦片数据特征库，待匹配的无源遥感影像，采用相同的方法生成待匹配第二全局特征向量，将第二全局特征向量与第一全局特征向量进行特征对比以及相似性检查，计算出相似度最高的影像作为匹配影像，以该匹配影像的地理坐标即为待匹配的无源影像的地理坐标。该方法解决了无地理坐标或精确位置的遥感影像的大致定位问题。

Description

无源遥感影像的全球快速检索定位方法、存储介质及设备

技术领域

本发明涉及遥感影像应用领域，特别地，涉及遥感影像地理定位的技术领域。

背景技术

随着互联网技术的发展，图片分享网站以及社交媒体网站上存在大量的不同来源、不同分辨率以及不同尺寸的遥感影像照片，这些照片大部分都没有地理坐标或精确的位置信息，极大地限制了开源情报信息的获取及关联分析等。因此如何快速准确的确定这些无源遥感影像的地理位置信息等内容，对情报信息的抓取与筛选具有重要作用。同时除网络上可获取的无源遥感影像以外，对于通常我们获取的遥感影像产品，在进行使用前，为使其定位准确，通常需要进行几何精纠正，在地形起伏较大的地区，还需要进行正射纠正，特殊情况下还需要进行大气纠正，这一定位过程较为专业繁琐，限制了大部分非专业人士对遥感影像的使用。

发明内容

为解决以上两个问题，本申请设计发明了一种无源遥感影像的全球快速检索定位方法，通过建立全球基准影像特征库，基于基准影像特征库进行快速检索与定位来实现无源遥感影像的大致定位。

该方法包括：

S1，选择要建立的全球基准影像瓦片数据的数据源以及时间，建立全球基准影像瓦片数据库，

S2，采用卷积神经网络的方式提取瓦片的局部特征点以及特征描述子，采用特征聚合的方法对局部特征点特征进行特征聚合，产生瓦片的全局特征向量，为第一全局特征向量，建立全球基准影像瓦片数据特征库，

S3，待匹配的无源遥感影像，采用与全球基准影像瓦片数据特征库相同的方法生成待匹配第二全局特征向量，

S4，将第二全局特征向量与基于全球基准影像瓦片数据特征库的第一全局特征向量进行特征对比以及相似性检查，计算出相似度最高的影像作为匹配影像，以该匹配影像的地理坐标即为待匹配的无源影像的地理坐标。

在可选的实施例中，全局特征向量的生成方法包括：

基于FEAN特征提取以及聚合网络进行全球基准影像瓦片数据特征库的建立；

FEAN为自监督的网络框架，由卷积编码、特征点生成、描述子生成以及特征聚合四部分构成：

其中卷积编码部分由四个卷积块构成，前三个卷积块由卷积层、最大池化层组成，每经过一个池化层，图像尺寸变为原来的一半，第四个卷积块只包含一个卷积层，最终图像经卷积编码后，尺寸变为原来的八分之一，输入到特征点生成网络以及描述子生成网络中；

特征点生成网络中，先经过一层卷积层，改变通道大小后，经过Softmax交叉熵激活函数，得到每个像素是特征点的概率值后，经过Reshape图像回归操作，将图像映射回原尺寸，输出原尺寸上的特征点；

描述子生成网络中，同样先经过一层卷积层操作，改变通道大小，此通道数即为后续输出的描述子维度，选择128作为描述子的维度，卷积操作后，采用双线性插值将图像扩大为原尺寸，最后对每一个像素的描述子进行L2归一化操作，综合特征点生成网络阶段输出的特征点，输出特征点对应的归一化的描述子；

特征聚合即对特征点的描述子进行聚合，输出影像的全局特征向量；

FEAN输出的特征描述子为128维，经特征聚合后，生成8192维的全局特征向量，采用主成分分析方法对8192维的全局特征向量进行降维降为256维，由此建立256维的全球基准影像瓦片数据特征库。

在可选的实施例中，Softmax交叉熵激活函数公式如下：

S_i为第i个像素经过Softmax函数后输出的在该像素上是特征点的概率值，n为输入到特征点生成网络的图像，其图像像素个数；x_i为在第i个像素上各通道上像素值的和。

在可选的实施例中，所述方法还包括，基于全球基准影像瓦片数据特征库，建立高效的特征索引结构为后续大规模影像检索提供基础。

在可选的实施例中，所述对比以及相似性检查为：采用动态阈值哈希索引的方法进行检索，包括：

对全球基准影像瓦片数据特征库的第一全局特征向量进行二进制编码，得到全球基准影像瓦片全局特征的二进制哈希编码库，

对待匹配的无源遥感影像的第二全局特征向量进行二进制编码，得到二进制编码A，

基于二进制编码进行特征对比以及相似性检查。

在可选的实施例中，二进制编码方法包括：

(1)选择全球基准瓦片数据特征库中的任一全局特征向量进行二进制编码，假设其中任一瓦片全局特征向量为F，长度为D，计算该全局特征向量在各个维度上的中位数Tⁱ，其中Tⁱ为原始全局特征向量在第i维上的中位数；

以中位数Tⁱ为临界点，当原始全局特征向量在i维上的值Fⁱ大于等于Tⁱ，其二进制编码C中该i维度上的值Cⁱ为1，否则为0，具体公式如下；

(2)其中Fⁱ为原始全局特征向量在第i维上的值，Tⁱ为原始全局特征向量在第i维上的中位数，Cⁱ为原始全局特征向量经动态阈值哈希后得到的二进制编码在第i维上的值；

(3)重复上述第(1)和第(2)步骤，直至对所有的全球基准影像瓦片数据全局特征向量进行二进制编码，得到全球基准影像瓦片全局特征的二进制哈希编码库。

在可选的实施例中，基于二进制编码进行特征对比以及相似性检查为：将待匹配的无源遥感影像的二进制编码A与全球基准影像瓦片数据库中的二进制编码采用汉明距离进行距离计算，以计算各个特征向量之间的距离作为各个影像之间的相似性指标，选择计算距离最小的影像作为匹配影像，以该匹配影像的地理坐标即为待匹配的无源影像的地理坐标。

在可选的实施例中，汉明距离计算公式为：

其中d表示两个二进制编码A与C之间的距离，n表示二进制编码的长度，Cⁱ表示二进制编码C在i位上的值，Aⁱ表示二进制编码A在i位上的值。

本发明还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序代码，当所述计算机程序代码被计算机设备执行时，所述计算机设备执行上述任一项所述的无源遥感影像的全球快速检索定位方法。

本发明另一方面还提供了一种计算机设备，包括：存储器和处理器；

所述存储器用于存储计算机指令；

所述处理器执行所述存储器存储的计算机指令，以使所述计算机设备执行上述任一项所述的无源遥感影像的全球快速检索定位方法。

本发明的发明点和技术效果：

1、基于全球基准影像数据，通过采用特征提取的方式建立全球基准影像数据特征库，后利用图像检索技术对待匹配影像进行特征检索及定位，解决了无地理坐标或精确位置的遥感影像的大致定位问题。

2、本发明建立高效的特征索引结构为后续大规模影像检索提供基础。

3、本发明采用动态阈值哈希索引的方法进行检索，简单快速。

4、全球基准瓦片数据特征库全局特征向量进行二进制编码，二进制编码采用汉明距离进行距离计算，以计算各个特征向量之间的距离作为各个影像之间的相似性指标，方法简单，提高图像检索速度。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1是本发明实施例中的无源遥感影像全球快速检索定位流程图，

图2是本发明实施例中的FEAN网络结构图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

图2是本发明实施例中的FEAN网络结构图。

根据需要，选择要建立的全球基准影像瓦片数据的数据源以及时间，如以2020年谷歌地图的全球影像数据为主，建立全球基准影像瓦片数据库。基准影像数据为地面正射投影数据，每个像素都包含绝对平面坐标信息，辅助数字高程模型数据，可获得任意位置的三维地理坐标，因此可将基准影像数据作为先验参考去匹配定位无源遥感影像数据。

因此参考附图1，本发明提供了一种无源遥感影像的全球快速检索定位方法，包括，

基于全球基准影像瓦片数据库，建立全球基准影像瓦片数据特征库，全球基准影像瓦片数据特征库由每张瓦片的全局特征向量组成，在瓦片全局特征向量的构建过程中，主要有基于传统方式以及卷积神经网络的方式，传统的方式有SIFT或SURF提取瓦片的特征点以及描述子，后进行特征聚合构建瓦片的全局特征向量，基于卷积神经网络的方式可以提取瓦片的全局特征图，输出特定维度的全局特征向量。在本发明中，采用卷积神经网络的方式提取瓦片的局部特征点以及特征描述子，后采用特征聚合的方法对局部特征点特征进行特征聚合，产生瓦片的全局特征向量，其主要流程如下：

(1)基于FEAN(Feature Extraction and Aggregation Network)特征提取以及聚合网络进行全球基准影像瓦片数据特征库的建立。

FEAN是一种自监督的网络框架，主要由卷积编码、特征点生成、描述子生成以及特征聚合四部分构成，其主要的网络结构如图2所示，其中卷积编码部分由四个卷积块构成，前三个卷积块由卷积层、最大池化层组成，每经过一个池化层，图像尺寸变为原来的一半，第四个卷积块只包含一个卷积层，最终图像经卷积编码后，尺寸变为原来的八分之一，输入到特征点生成网络以及描述子生成网络中，特征点生成网络中，先经过一层卷积层，改变通道大小后，经过Softmax交叉熵激活函数，得到每个像素是特征点的概率值后，经过Reshape图像回归操作，将图像映射回原尺寸，输出原尺寸上的特征点；描述子生成网络中，同样先经过一层卷积层操作，改变通道大小，此通道数即为后续输出的描述子维度，本专利为了降低后续计算的复杂性，选择128作为描述子的维度，卷积操作后，采用双线性插值将图像扩大为原尺寸，最后对每一个像素的描述子进行L2归一化操作，综合特征点生成网络阶段输出的特征点，输出特征点对应的归一化的描述子；特征聚合即对特征点的描述子进行聚合，输出影像的全局特征向量。Softmax交叉熵激活函数公式如下：

(2)FEAN输出的特征描述子为128维，经特征聚合后，生成8192维的全局特征向量，为降低后续检索过程中的计算量，加快检索时间，采用主成分分析方法对8192维的全局特征向量进行降维降为256维，由此建立256维的全球基准影像瓦片数据特征库。

一般方法中，图像检索主要基于图像的纹理、内容语义等组合的图像全局特征，对其进行特征对比以及相似性检查等，从而确定两张图像的相似程度等，本发明中基于全球基准影像瓦片数据特征库，建立高效的特征索引结构为后续大规模影像检索提供基础，常用的相似性检索有暴力检索、哈希检索等，本专利中，采用动态阈值哈希索引的方法进行检索，其具体过程如下：

(2)以中位数Tⁱ为临界点，当原始全局特征向量在i维上的值Fⁱ大于等于Tⁱ，其二进制编码C中该i维度上的值Cⁱ为1，否则为0，具体公式如下所示；

其中Fⁱ为原始全局特征向量在第i维上的值，Tⁱ为原始全局特征向量在第i维上的中位数，Cⁱ为原始全局特征向量经动态阈值哈希后得到的二进制编码在第i维上的值。

(3)重复上述第一，第二步骤，直至对所有的全球基准影像瓦片数据全局特征向量进行二进制编码，得到全球基准影像瓦片全局特征的二进制哈希编码库。

通过以上二进制编码方法进行计算检索：

1、选择需要匹配的无源遥感影像，即待匹配影像，基于FEAN网络，输出该影像的全局特征向量W。

2、将全局特征向量W经过动态阈值哈希处理，得到该特征向量的二进制编码A。

3、将待匹配的无源遥感影像的二进制编码A与全球基准影像瓦片数据库中的二进制编码采用汉明距离进行距离计算，以计算各个特征向量之间的距离作为各个影像之间的相似性指标，选择计算距离最小的影像作为匹配影像，即该匹配影像的地理坐标即为待匹配的无源影像的地理坐标。其汉明距离计算公式如下：

最终，基于全球基准影像数据，通过采用特征提取的方式建立全球基准影像数据特征库，后利用图像检索技术对待匹配影像进行特征检索及定位，解决了无地理坐标或精确位置的遥感影像的大致定位问题，为遥感影像的后续利用提供了基础。

在另一方面，本申请实施例提供的无源遥感影像的全球快速检索定位方法可以部署于计算机设备。

计算机设备可以包括：输入单元、处理器单元、通信单元、存储单元、输出单元及电源等电子设备。

输入单元，用于输入或载入图像数据，

处理器单元，用于进行图像数据的处理和计算，

通信单元，用于实现数据的接收和发送，

存储单元，用于存储计算机指令，和数据库，

输出单元，用于输出处理结果。

本申请实施例提供的计算机设备可以用于执行前述实施例中的无源遥感影像的全球快速检索定位方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时，全部或部分地产生按照本申请的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk)等。

可以理解，除了上述内容，还包括一些常规结构和常规方法，由于这些内容都是公知的，不再赘述。但这并不意味着本发明不存在这些结构和方法。

本领域技术人员应认识到，虽然本文已详尽示出和描述了本发明的多个示例性实施例，但是，在不脱离本发明精神和范围的情况下，仍可根据本发明公开的内容直接确定或推导出符合本发明原理的许多其他变型或修改。因此，本发明的范围应被理解和认定为覆盖了所有这些其他变型或修改。

Claims

1.一种无源遥感影像的全球快速检索定位方法，其特征在于，包括：

S2，采用卷积神经网络的方式提取瓦片的局部特征点以及特征描述子，采用特征聚合的方法对局部特征点特征进行特征聚合，产生瓦片的全局特征向量，为第一全局特征向量，建立全球基准影像瓦片数据特征库，全局特征向量的生成方法包括：

FEAN输出的特征描述子为128维，经特征聚合后，生成8192维的全局特征向量，采用主成分分析方法对8192维的全局特征向量进行降维降为256维，由此建立256维的全球基准影像瓦片数据特征库，

2.如权利要求1所述的检索定位方法，其特征在于，Softmax交叉熵激活函数公式如下：

3.如权利要求1所述的检索定位方法，其特征在于，所述方法还包括，基于全球基准影像瓦片数据特征库，建立高效的特征索引结构为后续大规模影像检索提供基础。

4.如权利要求3所述的检索定位方法，其特征在于，所述高效的特征索引结构为：动态阈值哈希索引的方法进行检索，包括：

基于二进制编码进行特征对比以及相似性检查。

5.如权利要求4所述的检索定位方法，其特征在于，二进制编码方法包括：

以中位数Tⁱ为临界点，当原始全局特征向量在i维上的值Fⁱ大于等于Tⁱ，其二进制编码C中第i维度上的值Cⁱ为1，否则为0，具体公式如下；

6.如权利要求5所述的检索定位方法，其特征在于，

基于二进制编码进行特征对比以及相似性检查为：将待匹配的无源遥感影像的二进制编码A与全球基准影像瓦片数据库中的二进制编码采用汉明距离进行距离计算，以计算各个特征向量之间的距离作为各个影像之间的相似性指标，选择计算距离最小的影像作为匹配影像，以该匹配影像的地理坐标即为待匹配的无源影像的地理坐标。

7.如权利要求6所述的检索定位方法，其特征在于，汉明距离计算公式为：

8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序代码，当所述计算机程序代码被计算机设备执行时，所述计算机设备执行上述权利要求1-7中任一项所述的无源遥感影像的全球快速检索定位方法。

9.一种计算机设备，其特征在于，包括：存储器和处理器；

所述存储器用于存储计算机指令；

所述处理器执行所述存储器存储的计算机指令，以使所述计算机设备执行如权利要求1-7任一项所述的无源遥感影像的全球快速检索定位方法。