CN110458175B

CN110458175B - 一种基于词汇树检索的无人机影像匹配对选择方法及系统

Info

Publication number: CN110458175B
Application number: CN201910609524.3A
Authority: CN
Inventors: 姜三
Original assignee: China University of Geosciences
Current assignee: China University of Geosciences
Priority date: 2019-07-08
Filing date: 2019-07-08
Publication date: 2023-04-07
Anticipated expiration: 2039-07-08
Also published as: CN110458175A

Abstract

本发明公开了一种基于词汇树检索的无人机影像匹配对选择方法及系统，该方法及系统，首先，利用随机采样策略、SIFT算法，对采样得到的影像子集中每张影像进行SIFT特征点提取；其次，针对提取得到的SIFT特征点，构建初始特征集合，并在所述初始特征集合中，将所有SIFT特征点按尺度从大到小排序，在排序后的集合中，选择前h个特征点，构建一个关于h个特征点的特征子集；其次，对于得到的特征子集，采用分层K均值聚类算法，构建用于无人机影像检索的词汇树；其中，利用所述词汇树建立无人机影像索引；最后，利用建立的无人机影像索引，通过自适应相似影像数量选择算法进行无人机影像匹配对选择。

Description

一种基于词汇树检索的无人机影像匹配对选择方法及系统

技术领域

本发明涉及摄影测量与计算机视觉领域，提出一种基于自适应阈值词汇树检索的无人机影像匹配对选择方法及系统。

背景技术

影像匹配是摄影测量和计算机视觉领域的核心研究内容。对于无人机影像而言，由于无人机平台的飞行高度低、所使用的非量测相机像幅小，以及多角度相机的同时拍照，导致无人机影像具有数据量大、分辨率高等特点。穷举匹配模式将造成影像匹配的高昂计算代价。因此，在进行实际影像匹配前，选择重叠影像匹配对是实现影像匹配加速的关键技术。

目前，常用的影像匹配对选择方法可以分为两类。第一类，基于影像先验信息的匹配对选择。影像先验信息主要源于影像数据采集方式和影像粗略POS信。尽管影像先验信息可以为影像匹配对选择提供直接和可靠的线索，但是这类方案的应用范围局限于特殊的数据采集方式或者依赖其他辅助信息。第二类，基于影像视觉相似性的匹配对选择。影像视觉相似性用于定量描述影像的相似程度。基于词汇树的影像检索成为匹配对选择的标准算法，即利用词汇树对影像进行描述，将影像相似性计算问题转换为影像词汇向量的余弦角计算问题，使得特征匹配限定在具有最高相似性的若干张影像之间。虽然基于词汇树的影像检索不依赖其他辅助信息，但是相似影像数量难以确定。

对于大规模无人机影像匹配对选择，基于词汇树的影像检索能够提供稳健、可靠的匹配对，显著降低特征匹配的时间消耗。但是，基于词汇树的影像检索需要考虑精度和效率的平衡问题：如果使用预先建立的词汇树，不完备的词汇树将导致检索精度降低；如果为每个数据集建立对应词汇树，大数据量将会显著增加整体时间消耗。另外，现有词汇树检索方案一般选择固定数量或者固定比例的“相似”影像作为检索结果。这将会导致检索的“相似”影像过多或者数量不足够。因此，十分有必要设计自适应相似性阈值选择方法。

发明内容

本发明要解决的技术问题在于，针对现有技术的缺陷，提供一种无人机影像匹配对选择方法及系统。

本发明解决其技术问题所采用的技术方案是：构造一种基于词汇树检索的无人机影像匹配对选择方法，包括以下步骤：

S1、利用随机采样策略，从输入的无人机影像数据集中采样得到一个给定数量比例p的影像子集；其中，对于采样得到的影像子集，利用尺度不变特征变换SIFT算法提取所述影像子集中每张影像的SIFT特征点；

S2、将每张影像的SIFT特征点进行统计，构建一个关于提取得到的所有SIFT特征点的初始特征集合，在所述初始特征集合中，根据每个特征点的尺度大小，将所有SIFT特征点进行从大到小的排序；其中，在排序后的集合中，选择前h个特征点，构建一个关于所述前h个特征点的特征子集；

S3、基于步骤S2得到的特征子集，采用分层K均值聚类算法，构建用于无人机影像检索的词汇树；

S4、通过步骤S3构建的词汇树，对影像子集中每张影像进行索引，针对每张影像，计算其与数据集中其他影像之间的相似性值，基于索引结果以及影像相似性值的空间分布特性，通过自适应阈值算法进行无人机影像匹配对选择。

进一步的，步骤S3中，采用分层K均值聚类算法构建词汇树的具体操作为：首先利用K-means++算法确定K个初始聚类中心；其次，针对每个特征点，基于所述K个初始聚类中心，搜索与其空间距离最近的聚类中心，并将特征点与最近聚类中心之间的距离作为最近距离测度，这样，基于每个特征点的最近距离测度将步骤S2构建的特征子集划分为K个子集，其中，将所述K个子集作为词汇树的第一层；最后，基于所述K个初始聚类中心，对划分得到的每个子集进行迭代的聚类操作，直到词汇树的层数或者叶子节点达到给定的阈值。

进一步的，所述词汇树包含了V个词汇，步骤S4中利用所述词汇树对影像子集中每张影像进行索引的具体操作为：对于所有特征子集中的每个特征点，从词汇树中搜索与每个特征点距离最近的词汇，记录每个词汇在影像中出现的频数即词频，将所述无人机影像数据集中的每张影像表示为由词频所组成的V维特征向量。

进一步的，将每张影像表示为词汇向量v_d＝(t₁,...,t_i,...,t_V)，其中，所述词汇向量v_d中的每个组成元素t_i，按照词频-逆文档频率算法进行加权得到，具体的计算公式为：

其中，n_id表示词汇i在影像d中出现的频数；n_d表示影像d包含的总词汇数；N_i是包含词汇i的影像数；N表示影像的总数。

进一步的，步骤S4中，进行影像匹配对的子步骤包括：

S41、对于一张影像i，利用该影像的词汇向量v_d，计算影像i与数据集中其他影像之间的相似性值，根据得到的相似性值，对所述数据集中影像进行从大到小的排序；然后，将排序后的结果进行幂函数拟合，具体拟合公式如下：

y＝a*x^b；

其中，参数a和b是幂函数系数；x和y分别是影像编号和相似性值；

S42、针对影像i，对步骤S41中计算得到的影像i与数据集中其他影像之间的相似性值，进行相似性值的均值μ和标准差σ的统计；其中，将统计得到的均值μ和标准差σ带入到预定义的截断函数中：

y＝μ+k*σ；

其中，k为调节系数；

S43、联立所述拟合公式和截断函数，得到一个影像编号值x，将所述影像编号值x作为临界值x^*，将所述临界值x^*作为影像i需选择的影像匹配对数量，即在对所述数据集中影像按相似性值进行从大到小的排序集合中，保留所述排序集合中前x^*个相似影像作为当前查询影像的匹配对；

S44、返回到步骤S41-S43，完成对数据集中每张影像进行匹配对选择。

本发明公开的一种基于词汇树检索的无人机影像匹配对选择系统，包括以下模块：

特征提取模块，用于利用随机采样策略，从输入的无人机影像数据集中采样得到一个给定数量比例p的影像子集；其中，对于采样得到的影像子集，利用尺度不变特征变换SIFT算法提取所述影像子集中每张影像的SIFT特征点；

特征子集构建模块，用于针对所述影像子集中的每张影像，构建一个关于提取得到的所有SIFT特征点的初始特征集合，在所述初始特征集合中，根据每个特征点的尺度大小，将所有SIFT特征点进行从大到小的排序；其中，在排序后的集合中，选择前h个特征点，构建一个关于所述h个特征点的特征子集；

词汇树构建模块，用于对于特征子集构建模块得到的特征子集，采用分层K均值聚类算法，构建用于无人机影像检索的词汇树；

无人机影像匹配对选择模块，用于通过词汇树构建模块构建的词汇树，对影像子集中每张影像进行索引，针对每张影像，计算其与数据集中其他影像之间的相似性值；基于索引结果以及影像相似性值的空间分布特性，通过自适应阈值算法进行无人机影像匹配对选择。

进一步的，词汇树构建模块中还包括索引子模块，所述索引子模块用于对特征子集中的每个特征点，从词汇树中搜索与每个特征点距离最近的词汇，记录每个词汇在影像中出现的频数即词频，将所述无人机影像数据集中的每张影像表示为由词频所组成的V维特征向量。

进一步的，无人机影像匹配对选择模块中，还包括以下子模块：

幂函数拟合子模块，用于计算影像i与数据集中其他影像之间的相似性值，根据得到的相似性值，对所述数据集中影像进行从大到小的排序；然后，将排序后的结果进行幂函数拟合；

截断函数计算子模块，用于对幂函数拟合子模块中计算得到的影像i与数据集中其他影像之间的相似性值，进行相似性值的均值μ和标准差σ的统计；其中，将统计得到的均值μ和标准差σ带入到预定义的截断函数；

影像匹配对子模块，用于联立所述拟合公式和截断函数，得到一个影像编号值x，将所述影像编号值x作为临界值x^*，将所述临界值x^*作为影像i需选择的影像匹配对数量，即在对所述数据集中影像按相似性值进行从大到小的排序集合中，保留所述排序集合中前x^*个相似影像作为当前查询影像的匹配对。

在本发明所述的一种基于词汇树检索的无人机影像匹配对选择方法及系统中，随机采样策略和尺度约束策略进行影像选择和特征选择，实现高效率的词汇树构建和影像索引。

实施本发明的一种基于词汇树检索的无人机影像匹配对选择方法及系统，具有以下有益效果：

1、分析词汇树检索相似性值的分布特性，提出基于相似性值的均值和标准差统计，实现相似性阈值的自适应选择和稳健的影像匹配对选择；

2、本发明设计的高效影像匹配对选择方法能够解决词汇树检索中相似影像数量难以确定的难题，提高无人机影像特征匹配阶段的时间消耗。

附图说明

下面将结合附图及实施例对本发明作进一步说明，附图中：

图1是本发明提出的无人机影像匹配对选择方法流程图；

图2是本发明基于分层K均值聚类算法构建的词汇树效果图；

图3是本发明基于无人机倾斜影像检索的相似性值降序排列分布图；

图4是本发明提出的无人机影像匹配对选择系统结构图。

具体实施方式

为了对本发明的技术特征、目的和效果有更加清楚的理解，现对照附图详细说明本发明的具体实施方式。

请参考图1，其为本发明提出的无人机影像匹配对选择方法流程图，本发明的实施方案包括四个步骤，具体为：

步骤S1：考虑无人机影像高重叠度和高分辨率特征的训练特征选择，即利用随机采样策略构造影像子集，本实施例中，输入的数据为任意数量的无人机影像数据集，其中，无人机影像的高冗余性主要表现在两个方面，即影像数量的冗余性和特征数量的冗余性。对于影像数量的冗余性，本发明采用随机采样策略(random sampling strategy)，从原始输入的数据集中选择一个给定数量比例p的影像子集。经过试验分析，本实施例中，数量比例p的取值为20％，即基于输入影像数量的百分之二十来构造的影像子集。

在构建完成影像子集后，利用尺度不变特征变换算法，提取影像子集中每张影像的SIFT特征点，其中，SIFT特征点主要由四个部分的组成，包括特征点在影像平面上的位置(x,y)、特征点在尺度空间对应的尺度因子s、特征点局部区域的主方向o，以及特征点局部区域梯度组成的128维描述子d。由于，特征提取是数字摄影测量和计算机视觉领域的基本问题，本实施例不多赘述。

步骤S2：利用尺度约束策略选择特征子集：为了消除无人机影像高分辨率造成的特征冗余性，本实施例采用尺度约束策略(scale restriction strategy)，针对步骤S1提取的每张影像的SIFT特征点，选择一个给定数量h的特征子集。其中，特征子集的选择步骤具体为：

1)将SIFT特征点-初始特征点按照尺度因子s从大到小的顺序排列；

2)从排序后的特征点中选择前面h个的特征点。

经过试验分析，本实施例中特征数量h的取值为1500。如果所述特征子集包含的特征点数量小于1500，则保留子集中的所有特征点。经过上述处理，将所有保留的特征点组成词汇树的训练特征。

步骤S3：训练特征描述子空间量化构建用于影像检索的词汇树，基于分层K均值聚类算法构建的词汇树效果图，请参见图2，本实施例中，利用特征描述子空间量化来构建词汇树，对于步骤S1中选择的训练特征，采用分层K均值聚类算法进行特征描述子聚类，其中，K值表示词汇树的分支数；对于任意两个特征描述子向量x₁和x₂，K均值聚类的距离函数定义为特征描述子向量的平方欧式距离，如公式(1)所示：

d(x₁,x₂)＝x₁ ^T*x₂ (1)

构建词汇树具体操作为：将步骤S2选择特征子集作为训练特征集合，首先利用K-means++算法确定K个初始聚类中心；然后，针对每个特征点，基于所述K个初始聚类中心，搜索与其空间距离最近的聚类中心，并将特征点与最近聚类中心之间的距离作为最近距离测度，这样，基于每个特征点的最近距离测度将步骤S2构建的特征子集划分为K个子集，所述K个子集构成词汇树的第一层(根节点为第零层)；依据上述步骤，基于所述K个初始聚类中心，对每个子集进行迭代的聚类操作，直到词汇树的层数或者叶子节点数达到给定的阈值。

当中，利用构建的词汇树，对于待索引的无人机影像的每个特征描述，从步骤2建立的词汇树中搜索距离最近的词汇，本实施例中，将搜索到的结果保存在倒排文档系统中。在基于词汇树的影像检索方案中，倒排文件系统记录了词汇在影像中出现的频数。对于一个包含V个词汇的词汇树，经过上述索引操作，每张影像可以表示为词汇频率(词频)所组成的V维特征向量。与本实施例的检索方案类似，一般采用“词频-逆文档频率”(TF-IDF)进行加权。假设索引影像表示为词汇向量v_d＝(t₁,...,t_i,...,t_V)。那么，词汇向量v_d的组成元素t_i就按照下述公式(2)计算：

其中，n_id表示词汇i在索引影像d中的频数；n_d表示索引影像d包含的总词汇数；N_i是包含词汇i的影像数；N表示索引影像的总数。将数据库影像和查询影像按照上述操作建立索引，影相似性计算就可以表示为对应影像词汇向量的余弦角，即相似影像搜索问题转化为词汇向量的余弦角计算问题。

步骤S4：利用自适应阈值进行无人机影像匹配对选择，具体请参见图3，图3是本发明基于无人机倾斜影像检索的相似性值降序排列分布图：

本实施例中基于自适应阈值选择方案的核心思想是：对于空间邻近的重叠影像对，所述影像对的影像相似性值较大，且随着重叠区域减小而显著降低；相反，对于空间距离远的非重叠影像对，所述影像对的影像相似性值很小，且没有显著的变化。图3中横轴为影像编号；纵轴为相似性值。从图3中，可以明显地看出，“相似”影像的取值大且相似性值变化快(左侧分布图)；“非相似”影像的取值小且相似性值变化慢(右侧分布图)。

自适应阈值检索步骤：

1)根据相似性值分布图，拟采用公式所示的幂函数对数据点进行拟合，具体为对于一张影像i，利用该影像的词汇向量v_d，计算影像i与数据集中其他影像之间的相似性值，根据得到的相似性值，对所述数据集中影像进行从大到小的排序；然后，将排序后的结果进行幂函数拟合，具体拟合公式如下：

y＝a*x^b； (3)

其中，a和b是幂函数系数；x和y分别是影像编号和相似性值。从图3可以看出，幂函数能够很好的拟合数据点。

2)统计数据点相似性值的均值μ和标准差σ，即针对影像i，对步骤1)中计算得到的影像i与数据集中其他影像之间的相似性值，进行相似性值的均值μ和标准差σ的统计；拟定义公式所示的截断函数：

y＝μ+k*σ； (4)

其中，k为调节系数。

3)联立幂函数公式和截断函数公式，解算得到临界值x^*，所述临界值x^*即表示本实施例所选择的影像匹配对数量，即将所述临界值x^*作为影像i需选择的影像匹配对数量，即在对所述数据集中影像按相似性值进行从大到小的排序集合中，保留所述排序集合中前x^*个相似影像作为当前查询影像的匹配对。

最后根据上述自适应阈值检索步骤，完成对输入数据集中，所有影像的匹配对查询和选择。

请参考图4，其为本发明公开的一种基于词汇树检索的无人机影像匹配对选择系统结构图，该系统具体包括以下模块：

特征提取模块L1用于利用随机采样策略，从输入的无人机影像数据集中采样得到一个给定数量比例p的影像子集；其中，对于采样得到的影像子集，利用尺度不变特征变换SIFT算法提取所述影像子集中每张影像的SIFT特征点；

特征子集构建模块L2用于针对所述影像子集中的每张影像，构建一个关于提取得到的所有SIFT特征点的初始特征集合，在所述初始特征集合中，根据每个特征点的尺度大小，将所有SIFT特征点进行从大到小的排序；其中，在排序后的集合中，选择前h个特征点，构建一个关于所述h个特征点的特征子集；

词汇树构建模块L3用于对于特征子集构建模块L2得到的特征子集，采用分层K均值聚类算法，构建用于无人机影像检索的词汇树；

无人机影像匹配对选择模块L4用于通过词汇树构建模块L3构建的词汇树，对影像子集中每张影像进行索引，针对每张影像，计算其与数据集中其他影像之间的相似性值；基于索引结果以及影像相似性值的空间分布特性，通过自适应阈值算法进行无人机影像匹配对选择。

该系统中，所述词汇树构建模块中还包括索引子模块L31，所述索引子模块L31用于对特征子集中的每个特征点，从词汇树中搜索与每个特征点距离最近的词汇，记录每个词汇在影像中出现的频数即词频，将所述无人机影像数据集中的每张影像表示为由词频所组成的V维特征向量。

该系统中，所述无人机影像匹配对选择模块L4中，还包括幂函数拟合子模块L41、截断函数计算子模块L42和影像匹配对子模块L43，其中：

幂函数拟合子模块L41用于计算影像i与数据集中其他影像之间的相似性值，根据得到的相似性值，对所述数据集中影像进行从大到小的排序；然后，将排序后的结果进行幂函数拟合；

截断函数计算子模块L42用于对幂函数拟合子模块L41中计算得到的影像i与数据集中其他影像之间的相似性值，进行相似性值的均值μ和标准差σ的统计；其中，将统计得到的均值μ和标准差σ带入到预定义的截断函数；

影像匹配对子模块L43用于联立所述拟合公式和截断函数，得到一个影像编号值x，将所述影像编号值x作为临界值x^*，将所述临界值x^*作为影像i需选择的影像匹配对数量，即在对所述数据集中影像按相似性值进行从大到小的排序集合中，保留所述排序集合中前x^*个相似影像作为当前查询影像的匹配对。

综上所述，本发明的技术关键点在于：

1、对于词汇树检索效率和精度平衡的问题，本实施例中采用随机采样策略和尺度约束策略进行影像选择和特征选择，实现高效率的词汇树构建和影像索引；

2、分析词汇树检索相似性值的分布特性，提出基于相似性值的均值和标准差统计，实现相似性阈值的自适应选择和稳健的影像匹配对选择；

3、本实施例设计的高效影像匹配对选择方法能够解决词汇树检索中相似影像数量难以确定的难题，提高无人机影像特征匹配阶段的时间消耗。

上面结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，这些均属于本发明的保护之内。

Claims

1.一种基于词汇树检索的无人机影像匹配对选择方法，其特征在于，包括以下步骤：

S4、通过步骤S3构建的词汇树，对影像子集中每张影像进行索引，针对每张影像，计算其与数据集中其他影像之间的相似性值，基于索引结果以及影像相似性值的空间分布特性，通过自适应阈值算法进行无人机影像匹配对选择，具体步骤包括：

y＝a*x^b；

y＝μ+k*σ；

其中，k为调节系数；

2.根据权利要求1所述的无人机影像匹配对选择方法，其特征在于，步骤S3中，采用分层K均值聚类算法构建词汇树的具体操作为：首先利用K-means++算法确定K个初始聚类中心；其次，针对每个特征点，基于所述K个初始聚类中心，搜索与其空间距离最近的聚类中心，并将特征点与最近聚类中心之间的距离作为最近距离测度，这样，基于每个特征点的最近距离测度将步骤S2构建的特征子集划分为K个子集，其中，将所述K个子集作为词汇树的第一层；最后，基于所述K个初始聚类中心，对划分得到的每个子集进行迭代的聚类操作，直到词汇树的层数或者叶子节点达到给定的阈值。

3.根据权利要求2所述的无人机影像匹配对选择方法，其特征在于，所述词汇树包含了V个词汇，步骤S4中利用所述词汇树对影像子集中每张影像进行索引的具体操作为：对于所有特征子集中的每个特征点，从词汇树中搜索与每个特征点距离最近的词汇，记录每个词汇在影像中出现的频数即词频，将所述无人机影像数据集中的每张影像表示为由词频所组成的V维特征向量。

4.根据权利要求3所述的无人机影像匹配对选择方法，其特征在于，将每张影像表示为词汇向量v_d＝(t₁,...,t_i,...,t_V)，其中，所述词汇向量v_d中的每个组成元素t_i，按照词频-逆文档频率算法进行加权得到，具体的计算公式为：

5.一种基于词汇树检索的无人机影像匹配对选择系统，其特征在于，包括以下模块：

无人机影像匹配对选择模块，用于通过词汇树构建模块构建的词汇树，对影像子集中每张影像进行索引，针对每张影像，计算其与数据集中其他影像之间的相似性值；基于索引结果以及影像相似性值的空间分布特性，通过自适应阈值算法进行无人机影像匹配对选择；

无人机影像匹配对选择模块中，还包括以下子模块：

幂函数拟合子模块，用于计算影像i与数据集中其他影像之间的相似性值，根据得到的相似性值，对所述数据集中影像进行从大到小的排序；然后，将排序后的结果进行幂函数拟合，具体拟合公式如下：

y＝a*x^b；

截断函数计算子模块，用于对幂函数拟合子模块中计算得到的影像i与数据集中其他影像之间的相似性值，进行相似性值的均值μ和标准差σ的统计；其中，将统计得到的均值μ和标准差σ带入到预定义的截断函数：

y＝μ+k*σ；

其中，k为调节系数；

6.根据权利要求5所述的无人机影像匹配对选择系统，其特征在于，词汇树构建模块中还包括索引子模块，所述索引子模块用于对特征子集中的每个特征点，从词汇树中搜索与每个特征点距离最近的词汇，记录每个词汇在影像中出现的频数即词频，将所述无人机影像数据集中的每张影像表示为由词频所组成的V维特征向量。