CN112070831B

CN112070831B - 一种基于多平面联合位姿估计的主动相机重定位方法

Info

Publication number: CN112070831B
Application number: CN202010783333.1A
Authority: CN
Inventors: 万亮; 李楠; 冯伟; 张乾; 孟忱
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2020-08-06
Filing date: 2020-08-06
Publication date: 2022-09-06
Anticipated expiration: 2040-08-06
Also published as: WO2022028554A1; US20230300455A1; CN112070831A

Abstract

本发明涉及一种基于多平面联合位姿估计的主动相机重定位方法，包括下列步骤：提取当前观测图像T及参考观测图像R中场景的有效平面区域图像集合和；在有效平面区域图像集合

和

中建立匹配关系；获得每组匹配平面所指导的相机相对位姿P_i；通过融合所有的相机相对位姿P_i获得指导相机运动信息。

Description

一种基于多平面联合位姿估计的主动相机重定位方法

技术领域

本发明属于人工智能、计算机视觉领域，涉及主动视觉技术，具体为一种基于多平面联合位姿估计的主动相机重定位方法。

背景技术

主动式相机重定位，旨在物理真实地将相机六自由度位姿恢复到与拍摄参考图像时一致，在环境监测，历史文化遗产预防性保护，微小变化检测等领域发挥着重要作用，是主动视觉技术的一个重要应用[1]。主动式相机重定位过程包括相机的相对位姿估计和相机的动态调整，相机的调整由机器人平台完成。

目前最先进的主动式相机重定位算法在大量野生赋存环境下的文化遗产微小变化检测任务中取得了巨大成功[2]。但需要注意的是，这些监测任务是在稳定和可控的环境条件下进行的，在这种条件下，所采用图像的特征匹配结果能够支持准确的相机位姿估计。

然而，当历次观测的光照条件(方向和强度)不同时，监测结果差强人意。光照的显著差异会改变场景(尤其是普遍存在的三维结构场景)的表观，进而使涉及到姿态估计的图像中的特征点描述子会发生变化，导致相机位姿估计失败。此外，如果观测场景中的背景(非监测对象区域)变化较大，例如，被监测古建筑附近的植被在不同季节可能发生剧烈变化(甚至结构变化)，将显著增加图像中误匹配特征点的数量，严重影响重定位结果的准确性。实际任务中常见的上述两种情况，会严重损害主动相机重定位的精度，导致实际监测结果不可靠，从而无法支持户外不可控环境条件下的重定位作业。

参考文献：

[1]Feng W,Tian F P,Zhang Q,et al.Fine-Grained Change Detection ofMisaligned Scenes with Varied Illuminations[C]ICCV.IEEE,2015.

[2]Tian F P,Feng W,Zhang Q,et al.Active camera relocalization from asingle reference image without hand-eye calibration[J].IEEE transactions onpattern analysis and machine intelligence,2018,41(12):2791-2806.

[3]冯伟，孙济洲，张乾，田飞鹏，韩瑞泽,专利名称：一种无需手眼标定的相机六自由度位姿精确重定位方法，申请号：CN201611140264.2

发明内容

本发提供了一种基于多平面联合位姿估计的主动相机重定位方法，利用观测场景中的所有有效平面对相机的运动信息进行联合估计，有效减少了现有重定位方法对历次观测场景光照一致性和场景结构一致性的依赖，同时有效减少了重定位过程的时间花费，从而支持可靠高效的户外任务作业。技术方案如下：

一种基于多平面联合位姿估计的主动相机重定位方法，包括下列步骤：

步骤一：提取当前观测图像T及参考观测图像R中场景的有效平面区域图像集合

和

步骤二：在有效平面区域图像集合

和

中建立匹配关系，方法为：

(1)对于有效平面区域图像集合

计算其中每一个平面区域图像

的SIFT特征点的个数；计算其中每两个平面区域图像之间的最小欧氏距离；对有效平面区域图像集合

做同样操作；

(2)对于有效平面区域图像集合

以其中每一个平面区域图像

作节点建立无向全连通图

对有效平面区域图像集合

做同样操作得到无向全连通图

(3)以平面图像的SIFT特征点个数作为图的节点权重，以平面图像间的欧式距离作为图的边权重，求解

和

间的图匹配问题，建立有效平面区域图像集合

和

中匹配关系

步骤三：获得每组匹配平面所指导的相机相对位姿P_i；

步骤四：通过融合所有的相机相对位姿P_i获得指导相机运动信息。

优选地，步骤一具体包括:

(1)针对观测对象，选取原场景图像，分别检测当前观测图像T及参考观测图像R中场景的平面区域，得到平面区域图像集合

和

(2)在平面区域图像集合

和

中分别选取有效平面区域得到图像集合

和

方法如下：

第1步：确定面积比：分别计算所检测到的平面区域的图像面积与原场景图像面积的比例；

第2步：设定阈值，分别选取集合

及

中，平面区域图像面积占场景图像面积比大于阈值的区域组成有效平面区域图像集合

和

第3步：若集合

及

中所有的平面区域图像面积占比均小于阈值，则根据各自集合中各自集合中平面区域面积占比较大的图像区域确定有效平面区域图像集合

和

(3)对有效平面区域图像集合

和

中所有平面区域图像进行图像形态学腐蚀，获得所有有效平面区域图像集合

和

第2步所设定的阈值可以为10％。

步骤三具体为：

第1步：对于每一对匹配平面

计算

间的单应性矩阵H_i；

第2步：对于每一个单应性矩阵H_i，分别对其进行奇异值分解，求取所对应的旋转矩阵和平移向量，即为该组匹配平面所指导的相机相对位姿P_i。

步骤四具体为：

(1)确定参与每个P_i计算的SIFT特征点个数及特征点在平面上的分布；

(2)根据每个P_i所对应的SIFT特征点个数即数值权和SIFT特征点分布情况即分布权进行权重融合，按照各自对相机相对位姿的影响比重对所有的P_i做加权融合，获得最终用来指导相机运动的信息，其中，两个权重的确立方法如下：

第1步：数值权

用参与P_i计算的特征匹配点对的个数与参与匹配关系

中所有L个相机相对位姿计算的特征匹配点对的个数的比值来确定；

第2步：分布权η_i：将参与P_i计算的有效平面区域图像

按照平面区域形状的外接矩形裁剪生成

将

均匀分割成网格区域，统计每一个网格中参与P_i计算的特征匹配点个数，计算这些分布在每一个网格中的相关特征匹配点个数的方差，进而计算分布权，方差越小，权值越高。

数值权占比0.8，分布权占比0.2。

本发明提供的技术方案的有益效果是：

1、本发明在重定位过程中，由于对于相机运动信息(即相机相对位姿)的估计是基于平面的，可以有效减少由不同光照条件(方向、强度)导致观测的三维场景的表观不同对相机相对位姿估计的影响；同时，有效平面的选取和匹配可以有效减少观测的三维场景的结构性变化对相机相对位姿估计的影响。能使得现有的重定位设备可以在户外可靠地作业，基本屏蔽由场景光照差异和结构性变化所带来的主动相机重定位作业场景的限制。

2、本发明在重定位过程中，由于计算相机运动信息(即相机相对位姿)所使用的数学方法与现有重定位方法不同，有效减少了重定位过程的时间花费，能使得现有重定位设备更加高效地作业。

附图说明

图1为一种基于多平面联合位姿估计的主动相机重定位方法的流程图；

图2为本发明方法与现有最优重定位方法的时间和精度比较。

具体实施方式

下面结合附图对本发明中的技术方案进行清楚、完整地描述。基于本发明中的技术方案，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

(一)有效平面的确定

重定位过程开始前，提取当前观测图像T及参考观测图像R中场景的所有有效平面区域图像集合

和

具体步骤如下：

(1)分别检测当前观测图像T及参考观测图像R中场景的平面区域，得到平面区域图像集合

和

说明1：检测图像中的平面区域

使用传统的基于单应矩阵的平面检测方法或基于深度网络模型的机器学习的方法分别检测T及R中的平面区域，得到集合

及

(2)在

和

中分别选取有效平面区域得到图像集合

和

说明2：选取有效平面区域

第1步：确定面积比。分别计算所有检测到的平面区域的图像面积与原场景图像面积的比例。

第2步：分别选取集合

及

中，平面区域图像面积占场景图像面积比大于10％的区域组成有效平面区域图像集合

和

第3步：若集合

及

中所有的面积占比均小于10％，则分别选取各自集合中平面区域面积占比前5的图像区域组成有效平面区域图像集合

和

(不足5个以实际数目为准)。

(3)对

和

和

(二)平面匹配关系的建立

在有效平面区域图像集合

和

中建立匹配关系的具体方法为：

(1)对于有效平面区域图像集合

计算其中每一个平面区域图像

的SIFT特征点的个数；计算其中每两个平面区域图像之间的最小欧氏距离。对有效平面区域图像集合

做同样操作。

(2)对于有效平面区域图像集合

以其中每一个平面区域图像

作节点建立无向全连通图

对有效平面区域图像集合

做同样操作得到无向全连通图

和

间的图匹配问题，建立有效平面区域图像集合

和

中匹配关系

说明3：图匹配问题的建立与求解

第1步：建立图的节点相似性度量和图的边相似性度量标准。以节点权值矩阵来度量两个建立的图之间的节点相似性，度量依据来源于不同图之间两个节点所表示的平面图像上建立起匹配关系的SIFT特征点个数；以边权值矩阵来度量两个建立的图之间的边相似性，具体地，同一个图中的边代表它所连接的两个节点所表示的平面图像间的最小欧式距离，以分别来自两个建立的图之间的边所代表的最小欧氏距离之差的绝对值度量边相似性。

第2步：建立问题目标函数。用矩阵W整合第1步中的图的节点相似性权值矩阵和图的边相似性权值矩阵，其中W的对角元素两个图之间的节点相似性，W的所有非对角元素表示元素两个图之间的边相似性。建立目标函数，求解最优分配矩阵X^*:

求得的最优分配矩阵即包含

和

中节点的匹配情况，进而获得图像集合

和

中匹配关系

注：X∈{1,0}^m×n用来表示

和

间的节点匹配情况，X_ij＝1表示

中V_i节点和

中V_j节点匹配，X_ij＝O则表示不匹配。X_c是X的列展开形式。

(三)匹配平面组指导的相机相对位姿的估计

获得每组匹配平面所指导的相机相对位姿P_i的具体方法为：

(1)对于每一对匹配平面

计算

间的单应性矩阵H_iH_i。

说明4：匹配平面对间单应性矩阵的计算

第1步：特征匹配。使用确立匹配平面部分提取的SIFT特征点，对于

中的所有特征点，在

中寻找与其描述子最相近的特征点作为匹配特征点。获得的最终匹配点集为：

中的特征点集合X＝[x₁,x₂,...,x_N]_3×N依次对应

中的特征点集合Y＝[y₁,y₂,...,y_N]_3×N，其中x_i,y_i均为齐次坐标。

第2步：计算单应性矩阵。在X,Y中随机选出四对匹配点，对数据进行归一化，求解变换矩阵H，记为模型M；计算数据集中所有数据与模型M的投影误差，并记录内点个数。迭代完成后选取最优模型对应的变换矩阵为

间的单应性矩阵H_i。

(2)对于每一个单应性矩阵H_i，分别对其进行奇异值分解，求取所对应的旋转矩阵和平移向量，即为该组匹配平面所指导的相机相对位姿P_i。

说明5：匹配平面对所指导的相机相对位姿的估计

第1步：计算候选相机相对位姿。对于每一个单应性矩阵H与相机内参矩阵K，可以获得A＝K^-1HK。对A进行矩阵的奇异值分解A＝UΛV^T，Λ＝diag(λ₁,λ₂,λ₃)(λ₁≥λ₂≥λ₃)。根据单应性矩阵的物理含义，可以得到旋转矩阵r，平移向量t，平面法向量n，平面距相机的距离d有如下关系：

进而有Λ＝d′r′+t′n′^T，求解该等式可获得8组算数解

即为被分解的单应性矩阵H所对应的匹配平面对所指导的相机相对位姿的候选序列。

第2步：选取相机相对位姿。使用相机相对位姿的候选序列中的每一组算数解(r_i,t_i)对参与计算的匹配特征点三角化恢复图像上特征点所对应的三维空间点坐标。统计由每组算数解恢复的三维空间点满足空间点位于相机模型前方的个数，同时统计重投影误差。最终位于相机模型前方的空间点个数最多且重投影误差小的一组算数解即为一组匹配平面所指导的相机相对位姿P_i。

(四)获得指导相机运动的信息

通过融合所有的相机相对位姿P_i获得指导相机运动信息的具体方法为：

(1)确定参与每个P_i计算的SIFT特征点个数及特征点在平面上的分布。

(2)以每个P_i所对应的SIFT特征点个数和分布情况作为权重，对所有的P_i做加权融合，获得最终用来指导相机运动的

说明6：融合权重的确立

第1步：数值权

用参与P_i计算的特征匹配点对的个数与参与

中所有L个相机相对位姿计算的特征匹配点对的个数的比值来确定。

第2步：分布权η_i：将参与P_i计算的有效平面区域图像

按照平面区域形状的外接矩形裁剪生成

将

均匀分割成10×10大小的网格区域，统计每一个网格中参与P_i计算的特征匹配点个数，计算这些分布在每一个网格中的相关特征匹配点个数的方差，进而计算分布权，方差越小，权值越高。

说明7：指导相机运动信息的确定

第1步：将P_i中的旋转矩阵转换为欧拉角表示形式，即

其中r^X,r^Y,r^Z分别表示三维空间三个坐标方向的欧拉旋转角。

第2步：用计算的数值权

和分布权η_i融合所有的P_i：

其中σ₁，σ₂(σ₁+σ₂＝1)表示数值权和分布权对融合的影响比重，获得最终指导相机运动的信息

依据经验，数值权和分布权对相机相对位姿的影响比重是数值权占比0.8，分布权占比0.2。

(五)判断重定位是否完成

判断重定位过程是否完成的具体方法为：

由于计算的平移向量不可避免地缺失物理真实尺度，采用已有的重定位方法使用的“二分折半”策略来根据所得的平移向量提供的平移方向信息指导相机运动。当运动步长小于阈值ξ时，则判定重定位过程完成，终止重定位，否则重复步骤(一)至步骤(五)，且非首次迭代时，在步骤一中无需重复提取参考图像中场景的平面区域，利用首次信息。

下面结合具体实例对本发明方法进行可行性验证：

实验使用搭载佳能5DMarkⅢ相机的机械监测平台进行重定位实验，对于同一监测目标，设备分别使用本发明方法和现有最先进的重定位方法进行重定位作业。实验在室内和室外的三类监测场景进行，分为普通场景(无明显光照和场景结构变化)、光照变化场景(室外在不同天气和不同时刻进行重定位作业，室内在一组可控方向和强度的LED光下进行重定位作业)、结构变化场景(室外在不同季节有大量植物的场景下进行重定位作业，室内在可移动物体场景下进行重定位作业)。

结果分析选取重定位过程花费的时间和重定位后拍摄图像与参考图像之间的特征点平均距离(AFD)作为评估重定位方法的指标。其中AFD是指两幅图像所有匹配的特征点之间的欧式距离的平均值，这可以直观地评价重定位的精度。

根据图2所展示的本方法和已有最优的重定位方法[3]在不同场景下重定位作业的结果表明：对于无明显光照和场景结构变化的普通检测场景，两种重定位方法的重定位精度无显著优劣差异，但本方法的时间性能更加好；对于有光照强度和光照方向变化的场景，本方法除了在时间性能上有良好的优越性外，在重定位精度方面也有显著地优越性，尤其对于室外场景，在已有最优的重定位方法重定位作业失败时，相同情况下，本方法的重定位结果仍然支持相关需求；对于有明显场景结构变化的场景，本方法在时间性能和重定位精度方面均体现了显著的优越性。因此，可以表明发明方法的可行性和优越性。