CN113781563A

CN113781563A - 一种基于深度学习的移动机器人回环检测方法

Info

Publication number: CN113781563A
Application number: CN202111073896.2A
Authority: CN
Inventors: 陈维兴; 王琛; 陈斌; 李德吉
Original assignee: Civil Aviation University of China
Current assignee: Civil Aviation University of China
Priority date: 2021-09-14
Filing date: 2021-09-14
Publication date: 2021-12-10
Anticipated expiration: 2041-09-14
Also published as: CN113781563B

Abstract

一种基于深度学习的移动机器人回环检测方法。其包括构成航站楼实际场景数据集和航站楼实际场景增强数据集；获得区域生成模型、全局描述模型和回环检测模型；获得回环候选帧；进行回环验证，获得最终的回环帧等步骤。本发明具有如下有益效果：本发明引入深度学习技术学习图像帧局部区域的全局特征描述子，相比于人工设计的描述子，能学习到更深层次的语义信息，能更好地适应场景变化，并且结合了全局描述子和局部描述子的优点，在全局描述子本身具有的良好外观不变性的基础上，增强了描述子对于视点变化的鲁棒性。

Description

一种基于深度学习的移动机器人回环检测方法

技术领域

本发明属于视觉同步定位与建图(Simultaneous Localization and Mapping，SLAM)技术领域，特别是涉及一种基于深度学习的移动机器人回环检测方法。

背景技术

视觉SLAM是基于视觉传感器的同步定位与建图技术，在未知环境中，其通过跟踪提取的图像特征，求解相机帧之间的位姿及三维空间地图，目前已被广泛应用于机器人、无人机及自动驾驶汽车平台上。

作为视觉SLAM的重要组成部分，回环检测是通过图像数据识别出曾经到达过的地方，是视觉SLAM技术中的重要组成部分。在长期工作过程中，视觉SLAM系统会不可避免存在累计误差。正确识别回环后进行全局优化可消除累计误差。一个真阳性回环(被预测为回环的真回环)能够显著降低系统的累积误差，但一个假阳性回环(被预测为回环的假回环)可能会使整个优化算法收敛到完全错误的值。因此，正确识别回环对于整个视觉SLAM技术来说十分重要。

早期基于词袋的回环检测方法在稳定的环境下尚能正常运行，但在受诸如动态目标、光照变化、视角变化等因素影响的航站楼场景中，它的召回率和准确率都会产生下降，因此这就成为很多研究人员争相解决的重要问题。随着深度学习、图像分类、语义分割等领域的迅速发展，使得使用这些技术来进行回环检测成为可能。

发明内容

为了解决上述问题，本发明的目的在于提供了一种基于深度学习的移动机器人回环检测方法。

为了达到上述目的，本发明提供的基于深度学习的移动机器人回环检测方法包括按顺序进行的下列步骤：

1)利用采集设备获取航站楼场景中具有回环的序列原始图像帧而构成航站楼实际场景数据集D；

2)对上述航站楼实际场景数据集D中的所有图像帧进行包括旋转、翻转、缩放及光照强度改变在内的处理，以对图像帧进行增强，获得航站楼实际场景增强数据集D’；

3)将上述航站楼实际场景增强模数据集D’输入区域生成网络而对其进行训练，获得区域生成模型A；

4)将上述航站楼实际场景增强模数据集D’输入NetVLAD网络而对其进行训练，获得全局描述模型B；

5)将区域生成模型A和全局描述模型B连接而构成回环检测模型C；

6)将待检测原始图像帧输入上述回环检测模型C中，得到待检测原始图像的局部区域全局描述子，然后计算上述局部区域全局描述子与关键帧数据库中关键帧描述子的相似度，当相似度高于相似度阈值时，将关键帧作为回环候选帧Q，由所有的回环候选帧Q组成回环候选帧集Q_n；

7)对上述回环候选帧集Q_n进行回环验证，若回环验证成功，则判断出现回环，获得最终的回环帧。

在步骤1)中，所述利用采集设备获取航站楼场景中具有回环的序列原始图像帧而构成航站楼实际场景数据集D的方法是：

1.1)在航站楼室内区域选取包含回环的路线作为图像采集环境；

1.2)将RGB-D相机安装在移动平台上作为采集设备，RGB-D相机的安装方式为平视，安装方向与移动平台前进方向一致，RGB-D相机中轴线与移动平台中轴线重合，允许安装误差分别为5°以内和2mm以内；

1.3)使移动平台沿上述包含回环的路线行驶的同时，利用RGB-D相机采集航站楼场景中具有回环的序列原始彩色图像帧和深度图像帧，然后将上述图像帧以相应格式保存并将同一位置的彩色图像帧和深度图像帧一一对应而构成图像对，由所有图像帧对构成航站楼实际场景数据集D。

在步骤3)中，所述将上述航站楼实际场景增强模数据集D’输入区域生成网络而对其进行训练，获得区域生成模型A的方法是：

首先将航站楼实际场景增强数据集D’输入区域生成网络的输入层，在零值附近随机初始化权重；经过CNN层之后产生多尺度特征图，利用滑窗算法在特征图上生成初始框区域，对初始框区域计算分类损失函数及边界框回归损失函数找到候选框区域，执行反向传播算法并进行梯度检查，通过反向传播算法最小化损失函数，经过迭代直到损失函数误差满足阈值要求后，确定出权重参数，获得区域生成模型A。

在步骤4)中，所述将上述航站楼实际场景增强模数据集D’输入NetVLAD网络而对其进行训练，获得全局描述模型B的方法是：

所述NetVLAD网络由卷积层、池化层、全连接层和NetVLAD层构成；

首先将航站楼实际场景增强数据集D’输入NetVLAD网络的输入层，在零值附近随机初始化权重，通过前向传播算法计算输出，选取对应的损失函数，执行反向传播算法并进行梯度检查，通过反向传播算法最小化损失函数，经过迭代直到损失函数误差满足阈值要求后，确定出权重参数，获得全局描述模型B。

在步骤6)中，所述将待检测原始图像帧输入上述回环检测模型C中，得到待检测原始图像的局部区域全局描述子，然后计算上述局部区域全局描述子与关键帧数据库中关键帧描述子的相似度，当相似度高于相似度阈值时，将关键帧作为回环候选帧Q，由所有的回环候选帧Q组成回环候选帧集Q_n的方法是：

6.1)将待检测原始图像帧输入到回环检测模型C的区域生成模型A中，以待检测原始图像帧中物体在内的目标为先验信息进行局部区域划分并存储待检测原始图像帧的局部区域描述子，记为

其中n为局部区域数量；获得含有局部区域信息的图像帧；

6.2)将上述含有局部区域信息的图像帧输入回环检测模型C的全局描述模型B中，每个局部区域描述子会被聚类为k个全局描述子，获得含有局部区域全局描述子的图像帧，由所有含有局部区域全局描述子的图像帧组成待检测原始图帧像的描述子矩阵；

6.3)以邻近图和K-D树为基础建立关键帧数据库；

6.4)计算待检测图像帧的局部区域全局描述子与关键帧数据库中关键帧描述子的相似度，相似度使用待检测图像帧的局部区域全局描述子和关键帧描述子这两个矩阵A,B的余弦距离进行度量，计算公式如式(1)所示：

其中，矩阵A，B均为k×D矩阵，a_ij，b_ij分别为矩阵A，B的第i行第j列元素；

当相似度满足相似度阈值要求时，将此时的关键帧作为回环候选帧Q。

在步骤7)中，所述对上述回环候选帧集Q_n进行回环验证，若回环验证成功，则判断出现回环，获得最终的回环帧的方法是：

7.1)遍历回环候选帧集Q_n中的回环候选帧Q，对待检测图像帧与回环候选帧Q进行描述子匹配，确定匹配成功的匹配对数量；

7.2)将待检测图像帧中描述子的三维空间位置投影到回环候选帧Q的二维平面上的重投影误差满足阈值要求的描述子称为内点；采用RANSAC算法判断上述匹配对数量是否满足内点数要求，若满足，会返回待检测图像帧和回环候选帧Q的相对位姿，然后基于上述相对位姿进行内点重投影搜索以进行描述子匹配；

7.3)根据上述内点重投影搜索结果，进行双向优化，即将待检测图像帧中描述子的三维空间位置投影到回环候选帧Q的二维平面上并计算重投影误差e₁，再将回环候选帧Q中描述子的三维空间位置投影到待检测图像帧的二维平面上并计算重投影误差e₂，再将上述两个误差放在一起优化，即J＝∑(||e₁||²+||e₂||²))，得到新内点，之后判断新内点数量是否大于新内点数量阈值，如果判断结果为是，表明此回环候选帧Q是最终的回环帧。

本发明提供的基于深度学习的移动机器人回环检测方法具有如下有益效果：本发明引入深度学习技术学习图像帧局部区域的全局特征描述子，相比于人工设计的描述子，能学习到更深层次的语义信息，能更好地适应场景变化，并且结合了全局描述子和局部描述子的优点，在全局描述子本身具有的良好外观不变性的基础上，增强了描述子对于视点变化的鲁棒性。

附图说明

图1为本发明提供的基于深度学习的移动机器人回环检测方法流程图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。

在视觉SLAM系统中，位姿估计是一个递推的过程，即由上一帧位姿解算当前帧位姿，因此误差便会传递下去，即累积误差。消除累计误差有效的办法是进行回环检测。回环检测判断机器人是否回到了先前经过的位置，如果检测到回环，它会将信息传递给后端进行优化处理。回环是一个比后端更加紧凑、准确的约束，基于这一约束可以求解全局一致的位姿和地图。

如图1所示，本发明提供的基于深度学习的移动机器人回环检测方法包括按顺序进行的下列步骤：

1.2)将RGB-D相机安装在移动平台上作为采集设备，RGB-D相机的安装方式为平视，安装方向与移动平台前进方向一致，RGB-D相机中轴线与移动平台中轴线重合，允许安装误差分别为5°以内和2mm以内；因为单目相机无法获得深度信息，因此尺度不确定，但RGB-D相机能直接获取一定范围内的深度信息，从而可以克服尺度不确定性问题，因此选择RGB-D相机作为采集设备的感知部分；

1.3)使移动平台沿上述包含回环的路线行驶的同时，利用RGB-D相机采集航站楼场景中具有回环的序列原始彩色图像帧和深度图像帧，然后将上述图像帧以相应格式保存并将同一位置的彩色图像帧和深度图像帧一一对应而构成图像对，由所有图像帧对构成航站楼实际场景数据集D。若未一一对应或对应失败则会为深度特征匹配及位姿估计引入不必要的误差。

3)将上述航站楼实际场景增强模数据集D’输入区域生成网络(RPN)而对其进行训练，获得区域生成模型A；

区域生成网络是基于滑窗的无类别目标检测器。训练过程如下：首先将航站楼实际场景增强数据集D’输入区域生成网络的输入层，在零值附近随机初始化权重；经过CNN层之后产生多尺度特征图，利用滑窗算法在特征图上生成初始框区域，对初始框区域计算分类损失函数及边界框回归损失函数找到候选框区域，执行反向传播算法并进行梯度检查，通过反向传播算法最小化损失函数，经过迭代直到损失函数误差满足阈值要求后，确定出权重参数，获得区域生成模型A。

所述NetVLAD网络由卷积层、池化层、全连接层和NetVLAD层构成，其可将局部特征聚类为具有固定维数的全局表示。

训练过程如下：首先将航站楼实际场景增强数据集D’输入NetVLAD网络的输入层，在零值附近随机初始化权重，通过前向传播算法计算输出，选取对应的损失函数，执行反向传播算法并进行梯度检查，通过反向传播算法最小化损失函数，经过迭代直到损失函数误差满足阈值要求后，确定出权重参数，获得全局描述模型B。

其中n为局部区域数量；获得含有局部区域信息的图像帧；

6.2)将上述含有局部区域信息的图像帧输入回环检测模型C的全局描述模型B中，每个局部区域描述子会被聚类为k(固定不变)个全局描述子，获得含有局部区域全局描述子的图像帧，由所有含有局部区域全局描述子的图像帧组成待检测原始图帧像的描述子矩阵；

6.3)以邻近图和K-D树为基础建立关键帧数据库；

其中，矩阵A，B均为k×D矩阵，a_ij，b_ij分别为矩阵A，B的第i行第j列元素。

当相似度满足相似度阈值要求时，将此时的关键帧作为回环候选帧Q。相似度阈值作为一个可以调整的参数影响着最终回环检测的准确率和召回率，需要在实验过程中进行调整。本发明中相似度阈值设置为待检测图像帧与回环候选帧集Q_n中共视最多的描述子数量的80％。

7)对上述回环候选帧集Q_n进行回环验证，若回环验证成功，则判断出现回环，获得最终的回环帧；

7)对上述回环候选帧集Q_n进行回环验证，若回环验证成功，则判断出现回环；

7.2)将待检测图像帧中描述子的三维空间位置投影到回环候选帧Q的二维平面上的重投影误差满足阈值要求的描述子称为内点；采用RANSAC算法判断上述匹配对数量是否满足内点数要求，若满足要求，会返回待检测图像帧和回环候选帧Q的相对位姿，然后基于上述相对位姿进行内点重投影搜索以进行描述子匹配；

7.3)根据上述内点重投影搜索结果，进行双向优化，即将待检测图像帧中描述子的三维空间位置投影到回环候选帧Q的二维平面上并计算重投影误差e₁，再将回环候选帧Q中描述子的三维空间位置投影到待检测图像帧的二维平面上并计算重投影误差e₂，再将上述两个误差放在一起优化，即J＝∑(||e₁||²+||e₂||²))，得到新内点，之后判断新内点数量是否大于新内点数量阈值，如果判断结果为是，表明此回环候选帧Q是最终的回环帧。所述新内点数量阈值为绝对阈值，本发明中设置为30。

Claims

1.一种基于深度学习的移动机器人回环检测方法，其特征在于：所述基于深度学习的移动机器人回环检测方法包括按顺序进行的下列步骤：

2.根据权利要求1所述的基于深度学习的移动机器人回环检测方法，其特征在于：在步骤1)中，所述利用采集设备获取航站楼场景中具有回环的序列原始图像帧而构成航站楼实际场景数据集D的方法是：

3.根据权利要求1所述的基于深度学习的移动机器人回环检测方法，其特征在于：在步骤3)中，所述将上述航站楼实际场景增强模数据集D’输入区域生成网络而对其进行训练，获得区域生成模型A的方法是：

4.根据权利要求1所述的基于深度学习的移动机器人回环检测方法，其特征在于：在步骤4)中，所述将上述航站楼实际场景增强模数据集D’输入NetVLAD网络而对其进行训练，获得全局描述模型B的方法是：

5.根据权利要求1所述的基于深度学习的移动机器人回环检测方法，其特征在于：在步骤6)中，所述将待检测原始图像帧输入上述回环检测模型C中，得到待检测原始图像的局部区域全局描述子，然后计算上述局部区域全局描述子与关键帧数据库中关键帧描述子的相似度，当相似度高于相似度阈值时，将关键帧作为回环候选帧Q，由所有的回环候选帧Q组成回环候选帧集Q_n的方法是：

6.1)将待检测原始图像帧输入到回环检测模型C的区域生成模型A中，以待检测原始图像帧中物体在内的目标为先验信息进行局部区域划分并存储待检测原始图像帧的局部区域描述子，记为Lⁱ _A(i＝1,2,...,n)，其中n为局部区域数量；获得含有局部区域信息的图像帧；

6.3)以邻近图和K-D树为基础建立关键帧数据库；

6.根据权利要求1所述的基于深度学习的移动机器人回环检测方法，其特征在于：在步骤7)中，所述对上述回环候选帧集Q_n进行回环验证，若回环验证成功，则判断出现回环，获得最终的回环帧的方法是：