WO2019205865A1

WO2019205865A1 - 相机姿态追踪过程的重定位方法、装置、设备及存储介质

Info

Publication number: WO2019205865A1
Application number: PCT/CN2019/079768
Authority: WO
Inventors: 林祥凯; 凌永根; 暴林超; 刘威
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2018-04-27
Filing date: 2019-03-26
Publication date: 2019-10-31
Also published as: US20200327695A1; CN108615248A; CN108615248B; EP3786892A1; EP3786892A4; US11481923B2; EP3786892B1

Abstract

本申请公开了一种相机姿态追踪过程的重定位方法、装置、设备及存储介质，属于AR领域。所述方法包括：获取所述多个标记图像中第i个标记图像后采集的当前图像；当所述当前图像符合重定位条件时，获取所述多个标记图像中的第一个标记图像的初始特征点和初始位姿参数；将所述当前图像相对于所述第一个标记图像进行特征点追踪，得到多组匹配特征点对；对所述多组匹配特征点对按照约束条件进行筛选，得到筛选后的匹配特征点对；根据所述筛选后的匹配特征点对，计算所述相机从所述初始位姿参数改变至目标位姿参数时的位姿变化量；根据所述初始位姿参数和所述位姿变化量，重定位得到所述相机的所述目标位姿参数。

Description

相机姿态追踪过程的重定位方法、装置、设备及存储介质

本申请要求于2018年04月27日提交的申请号为201810393563.X、发明名称为“相机姿态追踪过程的重定位方法、装置、设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及增强现实领域，特别涉及一种相机姿态追踪过程的重定位方法、装置、设备及存储介质。

背景技术

视觉SLAM(simultaneous Localization and mapping，同时定位与地图构建)是指搭载相机的主体，在没有环境先验信息的情况下，于运动过程中建立环境的模型，同时估计自己的运动的技术。SLAM可以应用在AR(Augmented Reality，增强现实)领域、机器人领域和无人驾驶领域中。

以单目视觉SLAM为例，通常将相机采集的第一帧图像作为标记图像(Anchor)。在相机后续采集到当前图像时，设备对当前图像与标记图像之间共同具有的特征点进行追踪，根据当前图像与标记图像之间的特征点位置变化计算得到相机在现实世界中的位姿变化。但某些场景下会发生当前图像中的特征点丢失(Lost)，无法继续追踪的情况。此时，需要使用SLAM重定位方法对当前图像进行重定位。

发明内容

本申请实施例提供了一种相机姿态追踪过程的重定位方法、装置、设备及存储介质。所述技术方案如下：

根据本申请的一个方面，提供了一种相机姿态追踪过程的重定位方法，应用于具有相机的设备中，所述设备用于按序执行多个标记图像的相机姿态追踪，所述方法包括：

获取所述多个标记图像中第i个标记图像后采集的当前图像，i＞1；

当所述当前图像符合重定位条件时，获取所述多个标记图像中的第一个标记图像的初始特征点和初始位姿参数；

将所述当前图像相对于所述第一个标记图像的所述初始特征点进行特征点追踪，得到多组匹配特征点对；对所述多组匹配特征点对按照约束条件进行筛选，得到筛选后的匹配特征点对；

根据所述筛选后的匹配特征点对，计算所述相机从所述初始位姿参数改变至目标位姿参数时的位姿变化量；

根据所述初始位姿参数和所述位姿变化量，重定位得到所述相机的所述目标位姿参数。

根据本申请的另一方面，提供了一种相机姿态追踪过程的重定位装置，应用于具有相机的设备中，所述设备用于按序执行多个标记图像的相机姿态追踪，所述应用于具有相机的设备中，所述设备用于按序执行多个标记图像的相机姿态追踪，所述装置包括：

图像获取模块，用于获取所述多个标记图像中第i个标记图像后采集的当前图像，i＞1；

信息获取模块，用于当所述当前图像符合重定位条件时，获取所述多个标记图像中的第一个标记图像的初始特征点和初始位姿参数；

特征点追踪模块，用于将所述当前图像相对于所述第一个标记图像的所述初始特征点进行特征点追踪，得到多组匹配特征点对；

特征点筛选模块，用于对所述多组匹配特征点对按照约束条件进行筛选，得到筛选后的匹配特征点对；

计算模块，用于根据所述筛选后的匹配特征点对，计算所述相机从所述初始位姿参数改变至目标位姿参数时的位姿变化量；

重定位模块，用于根据所述初始位姿参数和所述位姿变化量，重定位得到所述相机的所述目标位姿参数。

根据本申请的另一方面，提供了一种电子设备，所述电子设备包括存储器和处理器；

所述存储器中存储有至少一条指令，所述至少一条指令由所述处理器加载并执行以实现如上所述的相机姿态追踪过程中的重定位方法。

根据本申请的另一方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令，所述至少一条指令由处理器加载并执行以实现如上所述的相机姿态追踪过程中的重定位方法。

本申请实施例提供的技术方案带来的有益效果至少包括：

通过在当前图像符合重定位条件时，将当前图像与第一个标记图像进行重定位，能够在对连续多个标记图像进行追踪的Anchor-SLAM算法中实现重定位，从而减少了追踪过程中断的可能性，由于重定位过程是将当前图像相对于第一个标记图像进行重定位，所以还能消除多个标记图像的追踪过程所产生的累积误差，从而解决相关技术中的SLAM重定位方法并不适用于变种后的SLAM算法的问题。

同时，通过对多组特征点匹配按照约束条件进行筛选得到筛选后的匹配特征点对，利用筛选后的匹配特征点对计算位姿变化量。一方面，由于减少了匹配过程中需要计算的特征点对，所以提高了匹配速度；另一方面，由于筛选出的特征点对是匹配准确性更好的特征点对，因此能够提高匹配精度。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一个示例性实施例提供的AR应用场景的场景示意图；

图2是本申请一个示例性实施例提供的AR应用场景的场景示意图；

图3是本申请一个示例性实施例提供的Anchor-Switching AR System算法的原理示意图；

图4是本申请一个示例性实施例提供的电子设备的结构框图；

图5是本申请一个示例性实施例提供的相机姿态追踪过程的重定位方法的流程图；

图6和图7是本申请一个示例性实施例提供的AR应用场景中出现定位错误的图像示意图；

图8是本申请一个示例性实施例提供的相机姿态追踪过程的重定位方法的流程图；

图9是本申请一个示例性实施例提供的金字塔图像的示意图；

图10是本申请一个示例性实施例提供的相机姿态追踪过程的重定位方法的流程图；

图11是本申请一个示例性实施例提供的相机姿态追踪过程的重定位方法的流程图；

图12是本申请一个示例性实施例提供的相机姿态追踪过程的重定位方法的流程图；

图13是本申请一个示例性实施例提供的相机姿态追踪过程的重定位方法的流程图；

图14是本申请一个示例性实施例提供的极线约束条件的原理示意图；

图15是本申请一个示例性实施例提供的相机姿态追踪过程的重定位方法的流程图；

图16是本申请一个示例性实施例提供的特征点追踪过程的原理示意图；

图17是本申请一个示例性实施例提供的相机姿态追踪过程的重定位方法的流程图；

图18是本申请一个示例性实施例提供的栅格化筛选特征点过程的原理示意图；

图19是本申请一个示例性实施例提供的相机姿态追踪过程的重定位方法的流程图；

图20是本申请一个示例性实施例提供的相机姿态追踪过程的重定位装置的框图；

图21是本申请一个示例性实施例提供的电子设备的框图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

首先对本申请涉及的若干个名词进行简介:

AR(Augmented Reality，增强现实)：一种在相机采集图像的过程中，实时地计算相机在现实世界(或称三维世界、真实世界)中的相机姿态参数，根据该相机姿态参数在相机采集的图像上添加虚拟元素的技术。虚拟元素包括但不限于：图像、视频和三维模型。AR技术的目标是在屏幕上把虚拟世界套接在现实世界上进行互动。该相机姿态参数包括旋转矩阵和位移向量，旋转矩阵用于表征相机在现实世界中发生的旋转角度，位移向量用于表征相机在现实世界中发生的位移距离。

例如，参见图1和参见图2，设备在相机拍摄到的图像中添加了一个虚拟人物形象。随着相机在现实世界中的运动，相机拍摄到的图像会发生变化，虚拟人物的拍摄方位也发生变化，模拟出了虚拟人物在图像中静止不动，而相机随着位置和姿态的变化同时拍摄图像和虚拟人物的效果，为用户呈现了一幅真实立体的画面。

Anchor-Switching AR System：是基于连接多个标记图像(Anchor)的相机姿态追踪来确定在自然场景下的相机姿态参数，进而根据相机姿态参数在相机采集的图像上叠加虚拟世界的AR系统。

IMU(Inertial Measurement Unit，惯性测量单元)：是用于测量物体的三轴姿态角(或角速率)以及加速度的装置。一般的，一个IMU包含了三个单轴的加速度计和三个单轴的陀螺，加速度计用于检测物体在三维坐标系中每个坐标轴上的加速度信号，进而计算得到位移向量；而陀螺用于检测物体在三维坐标系中的旋转矩阵。可选地，IMU包括陀螺仪、加速度计和地磁传感器。

示意性的，三维坐标系的建立方式为：1、X轴使用向量积Y*Z来定义，在X轴在设备当前的位置上，沿与地面相切的方向指向东方；2、Y轴在设备当前的位置上，沿与地面相切的方向指向地磁场的北极；3、Z轴指向天空并垂直于地面。

在AR(Augmented Reality，增强现实)领域进行相机姿态追踪时，比如使用手机拍摄桌面进行AR游戏的场景，由于AR使用场景存在其场景特殊性，通常会对现实世界中的某个固定平面进行持续性拍摄(比如某个桌面或墙面)，直接使用相关技术中的SLAM重定位方法的效果较差，尚需提供一种适用于AR领域的重定位解决方案。

本申请提供了一种适用于Anchor-Switching AR System算法的重定位方法。Anchor-Switching AR System算法在确定相机姿态的过程中，将相机的运动过程划分为至少两段追踪过程进行追踪，每段追踪过程对应各自的标记图像。示意性的，当第i个标记图像对应的追踪过程中，当当前图像相对于第i个标记图像的追踪效果差于预设条件(比如能够匹配到的特征点少于预设阈值)时，将当前图像的上一个图像确定为第i+1个标记图像，开启第i+1段追踪过程。其中，i为正整数。示意性的参考图3，其示出了本申请一个示例性实施例提供的Anchor-Switching AR System算法的原理示意图。在现实世界中存在物体320，设置有相机的设备340被用户手持进行移动，在移动过程中拍摄得到包括物体320的多帧图像1-6。设备将图像1确定为第1个标记图像(born-anchor或born-image)并记录初始位姿参数，该初始位姿参数可以是IMU采集的，然后将图像2相对于图像1进行特征点追踪，根据初始位姿参数和特征点追踪结果计算出相机在拍摄图像2时的位姿参数；将图像3相对于图像1进行特征点追踪，根据初始位姿参数和特征点追踪结果计算出相机在拍摄图像3时的位姿参数；将图像4相对于图像1进行特征点追踪，根据初始位姿参数和特征点追踪结果计算出相机在拍摄图像4时的位姿参数。

然后，将图像5相对于图像1进行特征点追踪，如果特征点追踪效果差于预设条件(比如匹配的特征点数量较少)，则将图像4确定为第2个标记图像，将图像5相对于图像4进行特征点追踪，计算出相机在拍摄图像4至图像5之间的位移变化量，再结合相机在拍摄图像4至图像1之间的位移变化量以及初始位姿参数，计算出相机在拍摄图像5时的位姿参数。然后再将图像6相对于图像4进行特征点追踪，依次类推，若当前图像的特征点追踪效果变差时，即可将当前图像的上一帧图像确定为新的标记图像，切换新的标记图像后重新进行特征点追踪。

可选地，特征点追踪可以采用基于视觉里程计原理的算法，比如特征点法或直接法。但是若相机在追踪过程中处于发生较为剧烈的运动、朝向强光源、朝向白色墙壁等各种异常场景时，上述Anchor-Switching AR System追踪过程可能会发生丢失(Lost)现象。丢失现象是指在当前图像中无法匹配到足够多的特征点，导致追踪失败。

参考图4，其示出了本申请一个示例性实施例提供的设备的结构框图。该设备包括：处理器420、存储器440、相机460和IMU 480。

处理器420包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器420用于执行存储器440中存储的指令、代码、代码片段和程序中的至少一种。

处理器420与存储器440电性相连。可选地，处理器420通过总线与存储器440相连。存储器440存储有一个或多个指令、代码、代码片段和/或程序。该指令、代码、代码片段和/或程序在被处理器420执行时，用于实现如下实施例中提供的SLAM重定位方法。

处理器420还与相机460电性相连。可选地，处理器420通过总线与相机460相连。相机460是具有图像采集能力的传感器件。相机460还可称为摄像头、感光器件等其它名称。相机460具有连续采集图像或多次采集图像的能力。可选地，相机460设置在设备内部或设备外部。可选地，该相机460是单目相机。

处理器420还与IMU480电性相连。可选地，IMU480用于每隔预定时间间隔采集相机的位姿参数，并记录每组位姿参数在采集时的时间戳。相机的位姿参数包括：位移向量和旋转矩阵。其中，IMU480采集的旋转矩阵相对准确，采集的位移向量受实际环境可能会有较大的误差。

参考图5，其示出了本申请一个示例性实施例提供的相机姿态追踪过程的重定位方法的流程图。本实施例以该重定位方法应用于图4所示的设备中来举例说明，该设备用于按序执行多个标记图像的相机姿态追踪。该方法包括:

步骤502，获取多个标记图像中第i个标记图像之后采集的当前图像；

设备内的相机按照预设时间间隔采集一帧帧图像，形成图像序列。可选地，相机是在运动(平移和/或旋转)过程中，按照预设时间间隔采集一帧帧图像形成图像序列。

可选地，设备将图像序列中的第一帧图像(或前几帧图像中符合预定条件的一帧图像)确定为第一个标记图像，将后续采集的图像相对于第一个标记图像进行特征点追踪，并根据特征点追踪结果计算相机的相机姿态参数；若当前帧图像的特征点追踪效果差于预设条件时，将当前帧图像的上一帧图像确定为第二个标记图像，将后续采集的图像相对于第二个标记图像进行特征点追踪，并根据特征点追踪结果计算相机的相机姿态参数，依次类推。设备可以按序进行连续多个标记图像的相机姿态追踪。

当处于第i个标记图像对应的第i个追踪过程时，相机会采集到当前图像。当前图像是第i个标记图像之后采集的某一帧图像，其中，i为大于1的整数。

步骤504，当当前图像符合重定位条件时，获取多个标记图像中的第一个标记图像的初始特征点和初始位姿参数；

其中，初始位姿参数用于指示相机采集第一个标记图像时的相机姿态。

设备会确定当前图像是否符合重定位条件。重定位条件用于指示当前图像相对于第i个标记图像的追踪过程失败，或者，重定位条件用于指示历史追踪过程中的累积误差已经高于预设条件。

在一个可选的实施例中，设备对当前图像相对于第i个标记图像进行追踪，若当前图像中不存在与第i个标记图像匹配的特征点，或者，当前图像中与第i个标记图像匹配的特征点少于第一数量时，确定当前图像相对于第i个标记图像的追踪过程失败，符合重定位条件。

在另一个可选的实施例中，设备确定当前图像与上一次重定位的图像之间的帧数大于第二数量时，确定历史追踪过程中的累积误差已经高于预设条件，或者，设备确定第i个标记图像和第一个标记图像之间的标记图像数量大于第三数量时，确定历史追踪过程中的累计误差已经高于预设条件。

本实施例对重定位条件的具体条件内容不加以限定。

当当前图像符合重定位条件时，设备尝试将当前图像相对于第一个标记图像进行特征点追踪。此时，设备获取缓存的第一个标记图像中的初始特征点以及初始位姿参数。

初始特征点是从第一个标记图像上提取到的特征点，初始特征点可以是多个，比如10-500个。该初始位姿参数用于指示相机采集第一个标记图像时的相机姿态。可选地，初始位姿参数包括旋转矩阵R和位移向量T，初始位姿参数可以由IMU采集得到。

步骤506，将当前图像相对于第一个标记图像的初始特征点进行特征点追踪，得到多组匹配特征点对；

可选地，每组匹配特征点对中包括两个互相匹配的初始特征点和目标特征点。

特征点追踪可采用基于视觉里程计的追踪算法，本申请对此不加以限定。在一个实施例中，特征点追踪采用KLT(Kanade-Lucas)光流追踪算法；在另一个实施例中，特征点追踪采用基于ORB(Oriented FAST and Rotated BRIEF，快速特征点提取和描述)算法提取的ORB特征描述子进行特征点跟踪。本申请对特征点追踪的具体算法不加以限定，特征点追踪过程可以采用特征点法或直接法。

在一个实施例中，设备对第一个标记图像进行特征点提取，得到N个初始特征点；设备还对当前图像进行特征点提取，得到M个候选特征点；然后将M个候选特征点逐一与N个初始特征点进行匹配，确定出至少一组匹配特征点对。每组匹配特征点对包括：一个初始特征点和一个目标特征点。初始特征点是第1个标记图像上的特征点，目标特征点是当前图像上与该初始特征点匹配度最高的候选特征点。

可选地，初始特征点的数量大于或等于匹配特征点对的数量。比如，初始特征点的数量是450个，匹配特征点对为320组。

步骤508，对多组匹配特征点对按照约束条件进行筛选，得到筛选后的匹配特征点对；

由于在重定位计算过程中，只需要至少四组匹配特征点对就能完成计算，因此当存在多组匹配特征点对可以使用时，终端可以挑选出较为准确的至少四组匹配特征点对进行后续计算。

可选地，终端按照约束条件对多组匹配特征点对进行筛选，得到筛选后的匹配特征点对。约束条件用于对匹配特征点对的匹配准确性进行约束。约束条件包括如下三个条件中的至少一个：

1、匹配唯一性约束条件；

匹配唯一性是用于指示目标特征点是该初始特征点唯一匹配的特征点的条件。

2、极线约束检验条件；

由于不同角度拍摄的两张二维图像是对现实世界中同一个三维环境进行拍摄得到的，因此两张二维图像中的匹配点在不同视图上的对应点应当位于相应的极线上，也即不同的两张二维图像中的匹配特征点对应该满足极线约束检验条件。

极线约束检验条件用于检测目标特征与初始特征点之间是否满足极线约束。

3、区域代表性约束条件。

在特征点匹配过程中，可能会出现大量特征点处于一个密集区域内的现象。理想情况下，计算两个图像之间的单应性矩阵homography时的需要有足够的距离。区域代表性约束条件用于在当前图像的局部区域中挑选出具有代表性的目标特征点。

步骤510，根据筛选后的匹配特征点对，计算相机从初始位姿参数改变至目标位姿参数时的位姿变化量；

可选地，目标位姿参数用于指示在采集当前图像时的相机姿态。

可选地，设备根据筛选后的至少四组匹配特征点对(初始特征点和目标特征点)计算两帧图像之间的单应性矩阵homography；对单应性矩阵homography进行分解，得到相机从初始位姿参数改变至目标位姿参数时的位姿变化量R _relocalize和T _relocalize。

单应性矩阵描述了两个平面之间的映射关系，若自然场景(现实环境)中的特征点都落在同一物理平面上，则可以通过单应性矩阵进行运动估计。当存在至少四对相匹配的初始特征点和目标特征点时，设备通过ransac对该至少四对匹配特征点所计算得到的单应性矩阵进行分解，得到旋转矩阵R _relocalize和平移向量T _relocalize。

其中，R _relocalize是相机从初始位姿参数改变至目标位姿参数时的旋转矩阵，T _relocalize是相机从初始位姿参数改变至目标位姿参数时的位移向量。

步骤512，根据初始位姿参数和位姿变化量，重定位得到目标位姿参数。

设备将初始位姿参数利用位姿变化量进行变换后，重定位得到目标位姿参数，从而计算得到相机在采集当前图像时的相机姿态。

可选地，在对当前图像重定位成功时，终端将当前图像确定为第i+1个标记图像。

终端基于第i+1个标记图像继续进行特征点追踪。终端根据后续的特征点追踪情况，还可以继续生成第i+2个标记图像、第i+3个标记图像、第i+4个标记图像等等，以此类推不再赘述。相关过程可参考上述图3所示的追踪内容

综上所述，本实施例提供的重定位方法，通过在当前图像符合重定位条件时，将当前图像与第一个标记图像进行重定位，能够在连续多个标记图像进行追踪的Anchor-Switching AR system算法中实现重定位，从而减少了追踪过程中断的可能性，从而解决相关技术中的SLAM重定位方法并不适用于AR领域中重定位问题。

另外，由于重定位过程是将当前图像相对于第一个标记图像进行重定位，第一个标记图像可以认为是没有累积误差的，所以本实施例还能消除多个标记图像的追踪过程所产生的累积误差。

结合参考图6和图7，假设Anchor-Switching AR System算法应用于AR游戏领域，相机拍摄到的桌子上有一个物理键盘，由设备根据相机姿态参数在物理键盘的回车键上叠加一个虚拟小人。若未采用重定位技术，则在一段时间后会产生跟踪误差，设备根据存在误差的相机姿态参数计算虚拟小人的位置时产生了明显的漂移，虚拟小人漂移到了空格键的位置，如图6所示。若采用了重定位技术，则在重定位成功后消除了累计误差，根据较为准确的相机姿态参数计算虚拟小人的位置时，虚拟小人能够保持在回车键附近不变。

以下对上述重定位方法的若干个阶段进行介绍：

预处理阶段：

在基于图5所示的可选实施例中，由于第一个标记图像通常是相机拍摄的第一帧图像，也是重定位过程使用的当前图像，出于提高特征点匹配的成功率的目的，需要对第一个标记图像进行预处理。如图8所示，步骤502之前还包括如下步骤：

步骤501a，记录第一个标记图像对应的初始位姿参数；

设备中设置有IMU，通过IMU定时采集相机的位姿参数以及时间戳。位姿参数包括旋转矩阵和位移向量，时间戳用于表示位姿参数的采集时间。可选地，IMU采集的旋转矩阵是较为准确的。

设备中的相机采集每帧图像时，同时记录有每帧图像的拍摄时间。设备根据第一个标记图像的拍摄时间，查询并记录相机在拍摄第一个标记图像时的初始位姿参数。

步骤501b，获取第一个标记图像对应的n个尺度不同的金字塔图像，n为大于1的整数；

设备还提取第一个标记图像中的初始特征点。可选地，设备提取特征点时采用的特征提取算法可以为FAST(Features from Accelerated Segment Test，加速段测试特征点)检测算法、Shi-Tomasi(史托马西)角点检测算法、Harris Corner Detection(Harris角点检测)算法、SIFT (Scale-Invariant Feature Transform，尺度不变特征转换)算法、ORB(Oriented FAST and Rotated BRIEF，快速特征点提取和描述)算法等。

由于SIFT特征的实时计算难度较大，为了保证实时性，设备可以提取第一个标记图像中的ORB特征点。一个ORB特征点包括FAST角点(Key-point)和BRIER描述子(Binary Robust Independent Elementary Feature Descirptor)两部分。

FAST角点是指该ORB特征点在图像中所在的位置。FAST角点主要检测局部像素灰度变化明显的地方，以速度快著称。FAST角点的思想时：如果一个像素与邻域的像素差别较大(过亮或过暗)，则该像素可能是一个角点。

BRIEF描述子是一个二进制表示的向量，该向量按照某种人为设计的方式描述了该关键点周围像素的信息。BRIEF描述子的描述向量由多个0和1组成，这里的0和1编码了FAST角点附近的两个像素的大小关系。

由于ORB特征的计算速度较快，因此适用于移动设备上实施。但由于ORB特征描述子没有尺度不变性，用户手持相机采集图像时的尺度变化又很明显，用户很可能在很远或很近的尺度下观测到第一个标记图像对应的画面，在一个可选的实现中，设备为第一个标记图像生成n个尺度不同的金字塔图像。

金字塔图像是指对第一个标记图像按照预设比例进行缩放后的图像。以金字塔图像包括四层图像为例，按照缩放比例1.0、0.8、0.6、0.4将第一个标记图像进行缩放后，得到四张不同尺度的图像。

步骤501c，对每个金字塔图像提取初始特征点，并记录初始特征点在金字塔图像缩放至原始尺寸时的二维坐标。

设备对每一层金字塔图像都提取特征点并计算ORB特征描述子。对于不是原始尺度(1.0)的金字塔图像上提取的特征点，将该金字塔图像按照缩放比例放大到原始尺度后，记录每个特征点在原始尺度的金字塔图像上的二维坐标。这些金字塔图像上的特征点以及二维坐标，可称为layer-keypoint。在一个例子中，每层金字塔图像上的特征点最多有500个特征点。

对于第一个标记图像，将每个金字塔图像上的特征点确定为初始特征点。在后续特征点追踪过程中，若当前图像的尺度很大，当前图像上的高频细节都清晰可见，则当前图像与层数较低的金字塔图像(比如原始图像)会有更高的匹配分数；反之，若当前图像的尺度很小，当前图像上只能看到模糊的低频信息，则当前图像与层数较高的金字塔图像有更高的匹配分数。

在如图9所示出的例子中，第一个标记图像具有三个金字塔图像91、92和93，金字塔图像91位于金字塔的第一层，具有三个图像中的最小尺度；金字塔图像92位于金字塔的第二层，具有三个图像中的中间尺度；金字塔图像93位于金字塔的第三层，具有三个图像中的最大尺度，若当前图像94相对于第一个标记图像进行特征点追踪时，设备可以将当前图像94分别与三个金字塔图像中提取的特征点进行匹配，由于金字塔图像93和当前图像94的尺度更接近，则金字塔图像93中提取的特征点具有更高的匹配分数。

本实施例通过对第一个标记图像设置多个尺度的金字塔图像，并进而提取每层金字塔图像上的初始特征点用于后续的特征点追踪过程，通过多个尺度上的特征点共同匹配，自动调节了第一个标记图像的尺度，实现了尺度不变性。

特征点追踪阶段：

在基于图5所示的可选实施例中，对于步骤506所示出的特征点追踪过程。假设第一个标记图像中的初始特征点是N个，当前图像中的候选特征点是M个，则正常的特征点追踪过程的计算复杂度是N ^m次。为了减少特征点追踪过程的计算复杂度，终端基于词袋模型进行匹配加速。BoW(Bag of Words，词袋模型)是自然语言处理领域经常使用的一个概念。以文本为例，一篇文章可能有一万个词，其中可能只有500个不同的单词，每个词出现的次数各不相同。词袋就像一个个袋子，每个袋子里装着同样的词。这构成了一种文本的表示方式。这种表示方式不考虑文法以及词的顺序。在计算机视觉领域，图像通常以特征点以及该特征点的特征描述子来表达。如果把该特征点的特征描述子看做单词，那么能构建出相应的词袋模型。

此时，步骤506包括如下子步骤，如图10所示：

步骤506a，通过词袋模型将初始特征点聚类至第一节点树，第一节点树的每个父亲节点包括K个孩子节点，每个节点中包括被聚类至同一类的初始特征点；

可选地，初始特征点采用ORB特征点来表示。每个ORB特征点包括：FAST角点(Key-point)和BRIER描述子。BRIER描述子能够表征初始特征点的特征，该特征能够用于进行聚类。

本实施例中的BoW可使用DBoW2库，DBoW2库是University of Zara里的Lopez等人开发的开源软件库。设备通过词袋模型将多个初始特征点聚类至第一节点树。

可选地，如图11所示，设备先将多个初始特征点作为第一节点树的根节点，通过词袋模型将多个初始特征点聚类为K个分类构成第一层节点，每个节点中包括属于同一类的初始特征点；然后，第一层节点中的任意一个节点再聚类为K个分类，构成该节点的K个孩子节点，依此类推，设备将第L层节点中的任意一个节点再聚类为K个分类，构成该节点的K个孩子节点。可选地，聚类算法采用K-means聚类算法，该K-means聚类算法可以采用训练集中的图像提取到的特征进行训练。

步骤506b，提取当前图像中的候选特征点；

设备还提取第一个标记图像中的初始特征点。可选地，设备提取特征点时采用的特征提取算法可以为FAST(Features from Accelerated Segment Test，加速段测试特征点)检测算法、Shi-Tomasi(史托马西)角点检测算法、Harris Corner Detection(Harris角点检测)算法、SIFT(Scale-Invariant Feature Transform，尺度不变特征转换)算法、ORB(Oriented FAST and Rotated BRIEF，快速特征点提取和描述)算法等。

由于SIFT特征的实时计算难度较大，为了保证实时性，设备可以提取第一个标记图像中的ORB特征点。一个ORB特征点包括FAST角点(Key-point)和BRIER描述子(Binary Robust Independent Elementary Feature Descirptor)两部分。当然在设备计算能力足够时，也可以提取SIFT特征，本申请实施例对此不加以限定，只需要对第一个标记图像和当前图像提取相同类型的特征即可。

步骤506c，通过词袋模型将候选特征点聚类至第二节点树，第二节点树的每个父亲节点包括K个孩子节点，每个节点中包括被聚类至同一类的候选特征点；

可选地，候选特征点采用ORB特征点来表示。每个ORB特征点包括：FAST角点(Key-point)和BRIER描述子。BRIER描述子能够表征候选特征点的特征，该特征能够用于进行聚类。

本实施例中的BoW可使用DBoW2库，DBoW2库是University of Zara里的Lopez等人开发的开源软件库。设备通过词袋模型将多个候选特征点聚类至第二节点树。

可选地，设备先将多个候选特征点作为第二节点树的根节点，通过词袋模型将多个候选特征点聚类为K个分类构成第一层节点，每个节点中包括属于同一类的候选特征点；然后，第一层节点中的任意一个节点再聚类为K个分类，构成该节点的K个孩子节点，依此类推，设备将第L层节点中的任意一个节点再聚类为K个分类，构成该节点的K个孩子节点。可选地，聚类算法采用K-means聚类算法，该K-means聚类算法可以采用训练集中的图像提取到的特征进行训练。

步骤506d，将第一节点树中的正向索引中的第i个第一节点，与第二节点树中的正向索引中的第i个第二节点进行特征点追踪，得到多组匹配特征点对。

可选地，正向索引是指以深度优先遍历顺序或广度优先遍历顺序进行遍历时的顺序。第i个第一节点和第i个第二节点是两个节点树上位置相同的节点。比如，第i个第一节点是第一节点树上的第三层节点中第3个节点，则第i个第二节点是第二节点树上的第三层节点中第3个节点。

可选地，第i个第一节点是第一节点树中的中间节点，第i个第二节点是第二节点树中的中间节点，中间节点是位于根节点和叶子节点之间的节点。若第i个第一/第二节点是根节点，则计算复杂度与正常的特征点追踪过程相比没有得到简化；若第i个第一/第二节点是叶子节点，则有可能会错失正确匹配的特征点。设第i个第一节点和第i个第二节点是节点树上的第L层，第一个标记图像上有N个特征点，当前图像上有M个特征点，每个父亲节点有K个孩子节点，则本方法将搜索点的范围减少至(N)^(M/(K^L))，从而实现指数级的加速匹配。

在一个示意性的例子中，如图12所示，第一个标记图像上有N个初始特征点，将N个初始特征点聚类至第一节点树；当前图像上有M个目标特征点(与M个初始特征点匹配)，M≤N，将M个目标特征点聚类至第二节点树。将两个节点树中的第三层节点(从根节点往下数)作为索引层，对于索引层的每个节点，找出A的正向索引中第一节点对应的特征集合Sa，找出B的正向索引中第二节点对应的特征集合Sb，在Sa和Sb中计算特征匹配。由于第一节点和第二节点上属于同一类的初始特征点大约为几个至几十个，当前图像上的目标特征点的数量相同或更少，因此匹配次数缩减为两个集合(拥有几个至几十个特征点)的匹配。

综上所述，本实施例提供的重定位方法，通过基于词袋模型将两个图像上的特征点分别聚类至两个节点树，利用两个节点树上相同位置的节点来缩小特征点匹配时的匹配范围，从而实现对特征点追踪过程的加速，能够更加快速地实现当前图像相对于第一个标记图像的特征点追踪，从而实现更快地重定位效果。

特征点筛选阶段：

由于在对第一个标记图像进行特征点提取时，通过不同尺度的金字塔图像提取了大量的特征。因此无论是通过正常的特征点追踪过程，还是上述可选实施例中的基于词袋加速的特征点追踪过程，最终得到的多组匹配特征点对中都会存在大量的错误匹配。对于Anchor-SLAM系统来讲，由于是通过分解两个图像对应的单应性矩阵homography来计算相机的旋转矩阵和平移向量，因此最少只需要4组匹配特征点对即可，多余的点反而会在ransac时造成不必要的误差。因此，实际计算过程并不需要太多组匹配特征点对，而是需要特别准确的少量组匹配特征点对即可。在基于图5的可选实施例中，步骤508所示出的按照约束条件对多组匹配特征点对进行筛选的过程中。可选采用如下三个方向对多组匹配特征点对进行筛选。

1、匹配唯一性检验；

同一个初始特征点在目标图像中可能存在多个候选特征点，每个候选特征点与初始特征点之间存在匹配度，通常将排名第一的候选特征点确定与该初始特征点匹配的目标特征点。但在特征点匹配过程中，很容易出现两个匹配度非常接近的候选特征点，比如桌布上存在重复的花纹图案，这两个匹配度非常接近的候选特征点会有很大几率造成错误的匹配。也即这类型的匹配特征点对很可能出现意外而匹配失误，不具有唯一性，理应删除。

因此，匹配唯一性条件要求每个初始特征点的排名第一的候选特征点(目标特征点)与排名第二的候选特征点有一定的距离，也即目标特征点是与初始特征点唯一匹配的特征点，否则放弃该组匹配特征点对。

参考图13，此时步骤508可选包括如下步骤：

步骤5081，对于任一组匹配特征点对中的初始特征点，获取与初始特征点匹配的目标特征点和次一级特征点，目标特征点是与初始特征点匹配的多个候选特征点中匹配度排名第一的特征点，次一级特征点是与初始特征点匹配的多个候选特征点中匹配度排名第二的特征点；

步骤5082，检测排名第一的匹配度和排名第二的匹配度之间的差值是否大于预设阈值；

可选地，预设阈值是80％。设排名第一的匹配度(目标特征点与初始特征点之间的匹配度)为X，排名第二的匹配度(次一级特征点与初始特征点之间的匹配度)为Y，则检测X-Y是否大于80％X；若大于80％则进入步骤5083，若小于80％则进入步骤5084。

步骤5083，当排名第一的匹配度和排名第二的匹配度之间的差值大于预设阈值时，确定目标特征点是筛选后的目标特征点；

当排名第一的匹配度和排名第二的匹配度的差值大于预设阈值，则目标特征点是该初始特征点唯一匹配的特征点，符合筛选条件。将该组匹配特征点对确定为筛选后的匹配特征点对，或者，继续进行其它约束条件的筛选。

步骤5084，当排名第一的匹配度和排名第二的匹配度之间的差值小于预设阈值时，丢弃该组匹配特征点对。

当排名第一的匹配度和排名第二的匹配度的差值小于预设阈值，则该组匹配特征点对很有可能存在匹配失误，应当丢弃该组匹配特征点对。

综上所述，本实施例提供的重定位方法，通过按照匹配唯一性检验来筛选匹配特征点组，能够将存在较大匹配失误可能性的匹配特征点对滤除，从而保证筛选后的匹配特征点组符合匹配唯一特性，从而提高后续重定位过程中的计算准确性。

2、极线约束检验；

由于特征点的局部性，在多组匹配特征点对中可能会出现匹配度很高且满足匹配唯一性，但是几何位置上明显不满足要求的错误匹配。这种几何关系可以通过极线约束来约束。

极线约束(epipolar constraint)是指匹配点在其它视图上的对应点位于相应的极线上。对于Anchor-Switching AR System系统，由于每一帧图像都是同一个相机在不同相机姿态下拍摄，因此正确的匹配特征点对必然会满足极限约束。

图14是极限约束的原理示意图，在现实世界的平面上存在三维点x，则左成像平面上存在观测点x ₁，右成像平面上存在观测点x ₂，则必然满足如下关系：

X ₂＝R*X ₁+T；

其中，R为两个相机姿态之间的旋转矩阵，T为两个相机姿态之间的位移向量。

两边同时叉乘T可得

T×X ₂＝T×R*X ₁；

两边左乘X ₂，则等式为0，进而得到：

X ₂*T×X ₂＝0＝X ₂*T×R*X ₁；

令T*R为所求的基础矩阵F，则：

X ₂×R*X ₁＝0；

显然，对于任意的一组匹配点，必然有如上的基础矩阵的限制，需要最少8组匹配特征点对即可计算出基础矩阵F。因此，在筛选出至少8组匹配特征点对(比如符合匹配唯一性的8组匹配特征点对)后，通过ransac的方法拟合出一个基础矩阵F验证极线误差，从而排除掉那些匹配分数高但是几何坐标不正确的点，从而保证几何一致性。

参考图15，此时步骤508可选包括如下步骤：

步骤508A，通过至少8组匹配特征点对拟合出基础矩阵，该基础矩阵用于拟合第一个标记图像和当前图像之间的极线约束条件；

可选地，通过匹配唯一性检验条件筛选出的至少8组匹配特征点，用于作为拟合基础矩阵的特征点对。

可选地，通过至少8组匹配特征点进行ransac的计算，计算得到第一个标记图像和当前图像之间的单应性矩阵，对单应性矩阵进行分解后得到旋转矩阵和位移向量。将旋转矩阵和位移向量相乘后，拟合出基础矩阵F。

步骤508B，对于任一个匹配特征点对，计算初始特征点的二维坐标、基础矩阵以及目标特征点的二维坐标之间的乘积；

对于任一个候选的匹配特征点对，按照如下公式进行计算：

X ₂*F*X ₁

其中，X ₂是目标特征点在当前图像中的二维坐标，X ₁是初始特征点在第一个标记图像中的二维坐标，F是上一步骤中拟合出的基础矩阵。

步骤508C，检测乘积是否小于误差阈值；

理想情况下，该乘积应当为零。但由于误差的存在，该乘积不完全为零。因此可以预先设置一个误差阈值，当该乘积属于误差阈值之内时，认为初始特征点和目标特征点之间符合极线约束。

若乘积小于误差阈值，则进入步骤508D；若乘积大于或等于误差阈值，则进入步骤508E。

步骤508D，当乘积小于误差阈值时，确定匹配特征点对是筛选后的匹配特征点对。

当乘积小于误差阈值时认为符合筛选条件，将该组匹配特征点对确定为筛选后的匹配特征点对，或者，继续进行其它约束条件的筛选。

步骤508E，当乘积大于或等于误差阈值时，丢弃该组匹配特征点对。

综上所述，本实施例提供的重定位方法，通过按照极线约束检验来筛选匹配特征点组，能够将不符合几何位置的匹配特征点对进行滤除，从而保证筛选后的匹配特征点组符合极线约束特性，从而提高后续重定位过程中的计算准确性

3、区域代表性约束

在特征点匹配过程中，目标图像上可能存在同一个密集区域内出现大量目标特征点的情况。特别是因为不同尺度的金字塔图像上提取的所有初始特征点都会放缩到原始尺度上，因此有更大几率出现在一个小范围内有好几个不同尺度下的目标特征点与初始特征点相匹配的情况。如图16所示，设左侧图像是第一个标记图像(born anchor或born image)，右侧图像是当前图像。由于相机在采集当前图像时很靠近现实场景，因此只能与第一个标记图像上的局部区域匹配成功，此时所有匹配特征点对都集中出现在第一个标记图像上的一个局部区域内，再加上尺度金字塔，使得该局部区域内的匹配更加不具有代表性。

理想情况下，在重定位计算过程中用于计算单应性矩阵的特征点需要有足够的距离，最好是在标记图像上分布越远越好，这样的点更具有代表性。因此区域代表性约束是指在当前图像的各个局部区域中挑选出每个局部区域内具有代表性的目标特征点。

在基于图5的一个可选实施例中，提出了基于栅格的筛选方法。如图17所示，此时步骤508可选包括如下子步骤：

步骤508a，将当前图像进行栅格化处理，得到多个栅格区域；

设备按照预设的栅格大小，将当前图像进行栅格化处理。将当前图像划分为多个互不重叠的栅格区域。

步骤508b，对于多个栅格区域中存在目标特征点的任一栅格区域，筛选出该栅格区域中具有最高匹配度的目标特征点；

多个匹配特征点对中的目标特征点会分散在多个栅格区域中，每个栅格区域中的目标特征点可能为零到多个。对于存在目标特征点的任一栅格区域，会筛选出该栅格区域中具有最高匹配度的目标特征点。如图18所示，左图示出了预设栅格，通过该预设栅格对当前图像进行栅格化，得到多个栅格区域。对每个栅格区域中的目标特征点进行筛选，筛选出具有最高匹配度的目标特征点。

步骤508c，将具有最高匹配度的目标特征点对应的匹配特征点对，确定为筛选后的匹配特征点对。

当栅格区域中存在一个目标特征点时，将该目标特征点所在的匹配特征点对确定为筛选后的匹配特征点对。

当栅格区域中存在两个以上目标特征点时，获取每个目标特征点与对应初始特征点之间的匹配度，将具有最高匹配度的目标特征点确定为筛选后的匹配特征点对。

综上所述，本实施例提供的重定位方法，通过在每个栅格区域中筛选出具有最高匹配度的目标特征点，作为该栅格区域中具有代表性的目标特征点。该具有代表性的目标特征点能够唯一地代表当前的栅格区域，这样在重定位过程中计算出的单应性矩阵homography具有更好的鲁棒性，同时通过栅格区域的数量能够限制计算单应性矩阵homography时的最大数量，从而保证了计算homography时的计算速度。

重定位计算过程：

在基于图5所示的可选实施例中，对于步骤510所示出的相机姿态的位姿变化量计算过程。设备得到筛选后的多组匹配特征点对之后，将多组匹配特征点对(初始特征点和目标特征点)输入至ransac的算法中，计算得到当前图像相对于第一个标记图像的单应性矩阵homography，通过IMU中的分解算法对单应性矩阵homography可以分解得到旋转矩阵 R _relocalize和平移向量T _relocalize，也即相机在采集当前图像时的目标位姿参数。

如图19所示，步骤510可选包括如下子步骤：

步骤510a，根据筛选后的多组匹配特征点对，计算相机在相机姿态改变过程时的单应性矩阵；

设备将多组匹配特征点对(初始特征点和目标特征点)输入至ransac算法中，计算得到当前图像相对于第一个标记图像的单应性矩阵homography

步骤510b，通过单应性矩阵计算初始特征点在当前图像上的投影特征点；

设备从所有初始特征点中筛选出具有相匹配的目标特征点的初始特征点，计算每个初始特征点在当前图像上的投影特征点。可选地，将每个初始特征点与单应性矩阵homography相乘后，得到每个初始特征点在当前图像上的投影特征点。

步骤510c，计算投影特征点和目标特征点之间的投影误差；

对于每个初始特征点，计算与该初始特征点对应的投影特征点和目标特征点之间的投影误差。当投影特征点和目标特征点之间的距离小于距离误差时，认为该目标特征点为inlier(内点)；当投影特征点和目标特征点之间的距离大于距离误差时，认为该目标特征点为outlier(外点)。然后，设备统计外点数量占所有目标特征点的总数量的比例。

步骤510d，当投影误差小于预设阈值时，对单应性矩阵进行分解，得到相机从初始姿态参数改变至目标姿态参数时的位姿变化量R _relocalize和T _relocalize。

可选地，预设阈值为50％。

当处于outlier的点占目标特征点的总数量的点的比例小于50％时，认为本次计算得到单应性矩阵是可靠的，设备对单应性矩阵进行分解，得到相机从初始姿态参数改变至目标姿态参数时的位姿变化量R _relocalize和T _relocalize；当处于outlier的点占目标特征点的总数量的点的比例大于50％时，认为本次计算得到单应性矩阵是不可靠的，放弃本次结果。

需要说明的是，步骤510b和步骤510c所示出的统计过程是可选步骤，

综上所述，本实施例提供的重定位方法，能够通过统计outlier的个数来对单应性矩阵进行校验，当校验失败时放弃本次结果，从而保证单应性矩阵的计算准确性，进而保证重定位结果的计算准确性。

在一个示意性的例子中，上述相机姿态追踪过程的重定位方法可以用于AR程序中，通过该重定位方法能够实时根据现实世界的场景信息，对电子设备上的相机姿态进行追踪，并根据追踪结果调整和修改AR应用程序中的AR元素的显示位置。以图1或图2所示的运行在手机上的AR程序为例，当需要显示一个站立在书籍上的静止卡通人物时，不论用户如何移动该手机，只需要根据该手机上的相机姿态变化修改该卡通人物的显示位置，即可使该卡通人物在书籍上的站立位置保持不变。

以下为本申请的装置实施例，对于装置实施例中未详细描述的技术细节，请参考上述方法实施例中的描述，本文不再一一赘述。

请参考图20，其示出了本申请一个示例性实施例提供的相机姿态追踪过程的重定位装置的结构框图。该重定位装置可以通过软件、硬件或者两者的结合实现成为电子设备的全部或一部分。所述电子设备用于按序执行多个标记图像的相机姿态追踪，所述装置包括：

图像获取模块2010，用于获取所述多个标记图像中第i个标记图像后采集的当前图像，i＞1；

信息获取模块2020，用于当所述当前图像符合重定位条件时，获取所述多个标记图像中的第一个标记图像的初始特征点和初始位姿参数；

特征点追踪模块2030，用于将所述当前图像相对于所述第一个标记图像的所述初始特征点进行特征点追踪，得到多组匹配特征点对；

特征点筛选模块2040，用于对所述多组匹配特征点对按照约束条件进行筛选，得到筛选后的匹配特征点对；

计算模块2050，用于根据所述筛选后的匹配特征点对，计算所述相机从所述初始位姿参数改变至目标位姿参数时的位姿变化量；

重定位模块2060，用于根据所述初始位姿参数和所述位姿变化量，重定位得到所述相机的所述目标位姿参数。

在一个可选的实施例中，所述约束条件包括如下条件中的至少一个：

所述目标特征点是与所述初始特征点唯一匹配的特征点；

所述初始特征点和所述目标特征点满足极线约束；

所述目标特征点是所在栅格区域上匹配度最高的特征点，所述栅格区域是将所述当前图像进行栅格化后得到的区域。

在一个可选的实施例中，所述约束条件包括所述目标特征点是与所述初始特征点唯一匹配的特征点；

所述特征点筛选模块2040，用于对于任一组所述匹配特征点对中的所述初始特征点，获取与所述初始特征点匹配的所述目标特征点和次一级特征点，所述目标特征点是与所述初始特征点匹配的多个候选特征点中匹配度排名第一的特征点，所述次一级特征点是与所述初始特征点匹配的多个候选特征点中匹配度排名第二的特征点；当所述排名第一的匹配度和所述排名第二的匹配度之间的差值大于预设阈值时，确定所述目标特征点是所述筛选后的目标特征点。

在一个可选的实施例中，所述约束条件包括所述初始特征点和所述目标特征点满足极线约束；

所述特征点筛选模块2040，用于对于任一个所述匹配特征点对，计算所述初始特征点的二维坐标、基础矩阵以及所述目标特征点的二维坐标之间的乘积；所述基础矩阵用于拟合所述第一个标记图像和所述当前图像之间的极线约束条件；当所述乘积小于误差阈值时，确定所述匹配特征点对是所述筛选后的匹配特征点对。

在一个可选的实施例中，所述约束条件包括所述目标特征点是所在栅格区域上匹配度最高的特征点；

所述特征点筛选模块2040，用于将所述当前图像进行栅格化处理，得到多个栅格区域；对于所述多个栅格区域中存在目标特征点的任一栅格区域，筛选出所述栅格区域中具有最高匹配度的目标特征点；将所述具有最高匹配度的目标特征点对应的匹配特征点对，确定为所述筛选后的匹配特征点对。

在一个可选的实施例中，所述特征点追踪模块2030，用于通过词袋模型将所述初始特征点聚类至第一节点树，所述第一节点树的每个父亲节点包括K个孩子节点，每个节点中包括被聚类至同一类的初始特征点；提取所述当前图像中的候选特征点，通过所述词袋模型将所述候选特征点聚类至第二节点树，所述第二节点树的每个父亲节点包括K个孩子节点，每个节点中包括被聚类至同一类的候选特征点；将所述第一节点树中的正向索引中的第i个第一节点，与所述第二节点树中的正向索引中的第i个第二节点进行特征点追踪，得到多组匹配特征点对。

在一个可选的实施例中，所述第i个第一节点是所述第一节点树中的中间节点，所述第i个第二节点是所述第二节点树中的中间节点，所述中间节点是位于根节点和叶子节点之间的节点。

在一个可选的实施例中，所述计算模块2050，用于根据所述筛选后的多组匹配特征点对，计算所述相机在相机姿态改变过程时的单应性矩阵；对所述单应性矩阵进行分解，得到所述相机从所述初始姿态参数改变至目标姿态参数时的位姿变化量R _relocalize和T _{relocalize。}

在一个可选的实施例中，所述计算模块2050，用于通过所述单应性矩阵计算所述初始特征点在所述当前图像上的投影特征点；计算所述投影特征点和所述目标特征点之间的投影误差；当所述投影误差小于预设阈值时，执行所述对所述单应性矩阵进行分解，得到所述相机从所述初始姿态参数改变至目标姿态参数时的位姿变化量R _relocalize和T _relocalize的步骤。

图21示出了本申请一个示例性实施例提供的电子设备2100的结构框图。该电子设备2100可以是：智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。电子设备2100还可能被称为用户设备、便携式电子设备、膝上型电子设备、台式电子设备等其他名称。

通常，电子设备2100包括有：处理器2101和存储器2102。

处理器2101可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器2101可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器2101也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central Processing Unit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器2101可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器2101还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器2102可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器2102还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器2102中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器2101所执行以实现本申请中方法实施例提供的相机姿态追踪过程的重定位方法。

在一些实施例中，电子设备2100还可选包括有：外围设备接口2103和至少一个外围设备。处理器2101、存储器2102和外围设备接口2103之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口2103相连。示意性的，外围设备包括：射频电路2104、触摸显示屏2105、摄像头2106、音频电路2107、定位组件2108和电源2109中的至少一种。

外围设备接口2103可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器2101和存储器2102。在一些实施例中，处理器2101、存储器2102和外围设备接口2103被集成在同一芯片或电路板上；在一些其他实施例中，处理器2101、存储器2102和外围设备接口2103中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路2104用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路2104通过电磁信号与通信网络以及其他通信设备进行通信。射频电路2104将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路2104包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路2104可以通过至少一种无线通信协议来与其它电子设备进行通信。该无线通信协议包括但不限于：万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路2104还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏2105用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏2105是触摸显示屏时，显示屏2105还具有采集在显示屏2105的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器2101进行处理。此时，显示屏2105还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏2105可以为一个，设置电子设备2100的前面板；在另一些实施例中，显示屏2105可以为至少两个，分别设置在电子设备2100的不同表面或呈折叠设计；在再一些实施例中，显示屏2105可以是柔性显示屏，设置在电子设备2100的弯曲表面上或折叠面上。甚至，显示屏2105还可以设置成非矩形的不规则图形，也即异形屏。显示屏2105可以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。

摄像头组件2106用于采集图像或视频。可选地，摄像头组件2106包括前置摄像头和后置摄像头。通常，前置摄像头设置在电子设备的前面板，后置摄像头设置在电子设备的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件2106还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路2107可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器2101进行处理，或者输入至射频电路2104以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在电子设备2100的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器2101或射频电路2104的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路2107还可以包括耳机插孔。

定位组件2108用于定位电子设备2100的当前地理位置，以实现导航或LBS(Location Based Service，基于位置的服务)。定位组件2108可以是基于美国的GPS(Global Positioning System，全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。

电源2109用于为电子设备2100中的各个组件进行供电。电源2109可以是交流电、直流电、一次性电池或可充电电池。当电源2109包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

在一些实施例中，电子设备2100还包括有一个或多个传感器2110。该一个或多个传感器2110包括但不限于：加速度传感器2111、陀螺仪传感器2112、压力传感器2113、指纹传感器2114、光学传感器2115以及接近传感器2116。

加速度传感器2111可以检测以电子设备2100建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器2111可以用于检测重力加速度在三个坐标轴上的分量。处理器2101可以根据加速度传感器2111采集的重力加速度信号，控制触摸显示屏2105以横向视图或纵向视图进行用户界面的显示。加速度传感器2111还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器2112可以检测电子设备2100的机体方向及转动角度，陀螺仪传感器2112可以与加速度传感器2111协同采集用户对电子设备2100的3D动作。处理器2101根据陀螺仪传感器2112采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器2113可以设置在电子设备2100的侧边框和/或触摸显示屏2105的下层。当压力传感器2113设置在电子设备2100的侧边框时，可以检测用户对电子设备2100的握持信号，由处理器2101根据压力传感器2113采集的握持信号进行左右手识别或快捷操作。当压力传感器2113设置在触摸显示屏2105的下层时，由处理器2101根据用户对触摸显示屏2105的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器2114用于采集用户的指纹，由处理器2101根据指纹传感器2114采集到的指纹识别用户的身份，或者，由指纹传感器2114根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器2101授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器2114可以被设置电子设备2100的正面、背面或侧面。当电子设备2100上设置有物理按键或厂商Logo时，指纹传感器2114可以与物理按键或厂商Logo集成在一起。

光学传感器2115用于采集环境光强度。在一个实施例中，处理器2101可以根据光学传感器2115采集的环境光强度，控制触摸显示屏2105的显示亮度。示意性的，当环境光强度较高时，调高触摸显示屏2105的显示亮度；当环境光强度较低时，调低触摸显示屏2105的显示亮度。在另一个实施例中，处理器2101还可以根据光学传感器2115采集的环境光强度，动态调整摄像头组件2106的拍摄参数。

接近传感器2116，也称距离传感器，通常设置在电子设备2100的前面板。接近传感器2116用于采集用户与电子设备2100的正面之间的距离。在一个实施例中，当接近传感器2116检测到用户与电子设备2100的正面之间的距离逐渐变小时，由处理器2101控制触摸显示屏2105从亮屏状态切换为息屏状态；当接近传感器2116检测到用户与电子设备2100的正面之间的距离逐渐变大时，由处理器2101控制触摸显示屏2105从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图21中示出的结构并不构成对电子设备2100的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

本申请还提供一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述方法实施例提供的相机姿态追踪过程中的重定位方法。

本申请还提供了一种计算机程序产品，当其在电子设备上运行时，使得电子设备执行上述各个方法实施例所述的相机姿态追踪过程中的重定位方法。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的较佳实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种相机姿态追踪过程的重定位方法，其特征在于，应用于具有相机的设备中，所述设备用于按序执行多个标记图像的相机姿态追踪，所述方法包括：

获取所述多个标记图像中第i个标记图像后采集的当前图像，i＞1；

当所述当前图像符合重定位条件时，获取所述多个标记图像中的第一个标记图像的初始特征点和初始位姿参数；

将所述当前图像相对于所述第一个标记图像的所述初始特征点进行特征点追踪，得到多组匹配特征点对；对所述多组匹配特征点对按照约束条件进行筛选，得到筛选后的匹配特征点对；

根据所述筛选后的匹配特征点对，计算所述相机从所述初始位姿参数改变至目标位姿参数时的位姿变化量；

根据所述初始位姿参数和所述位姿变化量，重定位得到所述相机的所述目标位姿参数。
根据权利要求1所述的方法，其特征在于，所述约束条件包括如下条件中的至少一个：

所述目标特征点是与所述初始特征点唯一匹配的特征点；

所述初始特征点和所述目标特征点满足极线约束；

所述目标特征点是所在栅格区域上匹配度最高的特征点，所述栅格区域是将所述当前图像进行栅格化后得到的区域。
根据权利要求2所述的方法，其特征在于，所述约束条件包括所述目标特征点是与所述初始特征点唯一匹配的特征点；

所述对所述多组匹配特征点对按照约束条件进行筛选，得到筛选后的匹配特征点对，包括：

对于任一组所述匹配特征点对中的所述初始特征点，获取与所述初始特征点匹配的所述目标特征点和次一级特征点，所述目标特征点是与所述初始特征点匹配的多个候选特征点中匹配度排名第一的特征点，所述次一级特征点是与所述初始特征点匹配的多个候选特征点中匹配度排名第二的特征点；

当所述排名第一的匹配度和所述排名第二的匹配度之间的差值大于预设阈值时，确定所述目标特征点是所述筛选后的目标特征点。
根据权利要求2所述的方法，其特征在于，所述约束条件包括所述初始特征点和所述目标特征点满足极线约束；

所述对所述多组匹配特征点对按照约束条件进行筛选，得到筛选后的匹配特征点对，包括：

对于任一个所述匹配特征点对，计算所述初始特征点的二维坐标、基础矩阵以及所述目标特征点的二维坐标之间的乘积；所述基础矩阵用于拟合所述第一个标记图像和所述当前图像之间的极线约束条件；

当所述乘积小于误差阈值时，确定所述匹配特征点对是所述筛选后的匹配特征点对。
根据权利要求2所述的方法，其特征在于，所述约束条件包括所述目标特征点是所在栅格区域上匹配度最高的特征点；

所述对所述多组匹配特征点对按照约束条件进行筛选，得到筛选后的匹配特征点对，包括：

将所述当前图像进行栅格化处理，得到多个栅格区域；

对于所述多个栅格区域中存在目标特征点的任一栅格区域，筛选出所述栅格区域中具有最高匹配度的目标特征点；

将所述具有最高匹配度的目标特征点对应的匹配特征点对，确定为所述筛选后的匹配特征点对。
根据权利要求1至5任一所述的方法，其特征在于，所述将所述当前图像相对于所述第一个标记图像的所述初始特征点进行特征点追踪，得到多组匹配特征点对，包括：

通过词袋模型将所述初始特征点聚类至第一节点树，所述第一节点树的每个父亲节点包括K个孩子节点，每个节点中包括被聚类至同一类的初始特征点；

提取所述当前图像中的候选特征点，通过所述词袋模型将所述候选特征点聚类至第二节点树，所述第二节点树的每个父亲节点包括K个孩子节点，每个节点中包括被聚类至同一类的候选特征点；

将所述第一节点树中的正向索引中的第i个第一节点，与所述第二节点树中的正向索引中的第i个第二节点进行特征点追踪，得到多组匹配特征点对。
根据权利要求6所述的方法，其特征在于，所述第i个第一节点是所述第一节点树中的中间节点，所述第i个第二节点是所述第二节点树中的中间节点，所述中间节点是位于根节点和叶子节点之间的节点。
根据权利要求1至5任一所述的方法，其特征在于，所述根据所述初始位姿参数和所述位姿变化量，重定位得到所述相机的所述目标位姿参数，包括：

根据所述筛选后的多组匹配特征点对，计算所述相机在相机姿态改变过程时的单应性矩阵；

对所述单应性矩阵进行分解，得到所述相机从所述初始姿态参数改变至目标姿态参数时的位姿变化量R _relocalize和T _relocalize。
根据权利要求8所述的方法，其特征在于，所述根据所述筛选后的多组匹配特征点对，计算所述相机在相机姿态改变过程时的单应性矩阵之后，还包括：

通过所述单应性矩阵计算所述初始特征点在所述当前图像上的投影特征点；

计算所述投影特征点和所述目标特征点之间的投影误差；

当所述投影误差小于预设阈值时，执行所述对所述单应性矩阵进行分解，得到所述相机从所述初始姿态参数改变至目标姿态参数时的位姿变化量R _relocalize和T _relocalize的步骤。
一种相机姿态追踪过程的重定位装置，其特征在于，应用于具有相机的设备中，所述设备用于按序执行多个标记图像的相机姿态追踪，所述装置包括：

图像获取模块，用于获取所述多个标记图像中第i个标记图像后采集的当前图像，i＞1；

信息获取模块，用于当所述当前图像符合重定位条件时，获取所述多个标记图像中的第一个标记图像的初始特征点和初始位姿参数；

特征点追踪模块，用于将所述当前图像相对于所述第一个标记图像的所述初始特征点进行特征点追踪，得到多组匹配特征点对；

特征点筛选模块，用于对所述多组匹配特征点对按照约束条件进行筛选，得到筛选后的匹配特征点对；

计算模块，用于根据所述筛选后的匹配特征点对，计算所述相机从所述初始位姿参数改变至目标位姿参数时的位姿变化量；

重定位模块，用于根据所述初始位姿参数和所述位姿变化量，重定位得到所述相机的所述目标位姿参数。
根据权利要求10所述的装置，其特征在于，所述约束条件包括如下条件中的至少一个：

所述目标特征点是与所述初始特征点唯一匹配的特征点；

所述初始特征点和所述目标特征点满足极线约束；

所述目标特征点是所在栅格区域上匹配度最高的特征点，所述栅格区域是将所述当前图像进行栅格化后得到的区域。
根据权利要求11所述的装置，其特征在于，所述约束条件包括所述目标特征点是与所述初始特征点唯一匹配的特征点；

所述特征点筛选模块，用于对于任一组所述匹配特征点对中的所述初始特征点，获取与所述初始特征点匹配的所述目标特征点和次一级特征点，所述目标特征点是与所述初始特征点匹配的多个候选特征点中匹配度排名第一的特征点，所述次一级特征点是与所述初始特征点匹配的多个候选特征点中匹配度排名第二的特征点；当所述排名第一的匹配度和所述排名第二的匹配度之间的差值大于预设阈值时，确定所述目标特征点是所述筛选后的目标特征点。
根据权利要求11所述的装置，其特征在于，所述约束条件包括所述初始特征点和所述目标特征点满足极线约束；

所述特征点筛选模块，用于对于任一个所述匹配特征点对，计算所述初始特征点的二维坐标、基础矩阵以及所述目标特征点的二维坐标之间的乘积；所述基础矩阵用于拟合所述第一个标记图像和所述当前图像之间的极线约束条件；当所述乘积小于误差阈值时，确定所述匹配特征点对是所述筛选后的匹配特征点对。
根据权利要求11所述的装置，其特征在于，所述约束条件包括所述目标特征点是所在栅格区域上匹配度最高的特征点；

所述特征点筛选模块，用于将所述当前图像进行栅格化处理，得到多个栅格区域；对于所述多个栅格区域中存在目标特征点的任一栅格区域，筛选出所述栅格区域中具有最高匹配度的目标特征点；将所述具有最高匹配度的目标特征点对应的匹配特征点对，确定为所述筛选后的匹配特征点对。
根据权利要求10至14任一所述的装置，其特征在于，

所述特征点追踪模块，用于通过词袋模型将所述初始特征点聚类至第一节点树，所述第一节点树的每个父亲节点包括K个孩子节点，每个节点中包括被聚类至同一类的初始特征点；提取所述当前图像中的候选特征点，通过所述词袋模型将所述候选特征点聚类至第二节点树，所述第二节点树的每个父亲节点包括K个孩子节点，每个节点中包括被聚类至同一类的候选特征点；将所述第一节点树中的正向索引中的第i个第一节点，与所述第二节点树中的正向索引中的第i个第二节点进行特征点追踪，得到多组匹配特征点对。
根据权利要求15所述的装置，其特征在于，所述第i个第一节点是所述第一节点树中的中间节点，所述第i个第二节点是所述第二节点树中的中间节点，所述中间节点是位于根节点和叶子节点之间的节点。
根据权利要求10至14任一所述的装置，其特征在于，

所述计算模块2，用于根据所述筛选后的多组匹配特征点对，计算所述相机在相机姿态改变过程时的单应性矩阵；对所述单应性矩阵进行分解，得到所述相机从所述初始姿态参数改变至目标姿态参数时的位姿变化量R _relocalize和T _relocalize。
根据权利要求17所述的装置，其特征在于，

所述计算模块2050，用于通过所述单应性矩阵计算所述初始特征点在所述当前图像上的投影特征点；计算所述投影特征点和所述目标特征点之间的投影误差；当所述投影误差小于预设阈值时，执行所述对所述单应性矩阵进行分解，得到所述相机从所述初始姿态参数改变至目标姿态参数时的位姿变化量R _relocalize和T _relocalize的步骤。
一种电子设备，其特征在于，所述电子设备包括存储器和处理器；

所述存储器中存储有至少一条指令，所述至少一条指令由所述处理器加载并执行以实现如权利要求1至9任一所述的相机姿态追踪过程中的重定位方法。
一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令，所述至少一条指令由处理器加载并执行以实现如权利要求1至9任一所述的相机姿态追踪过程中的重定位方法。