CN108108764B

CN108108764B - 一种基于随机森林的视觉slam回环检测方法

Info

Publication number: CN108108764B
Application number: CN201711433144.6A
Authority: CN
Inventors: 陈熙源; 方文辉; 柳笛
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2017-12-26
Filing date: 2017-12-26
Publication date: 2021-12-24
Anticipated expiration: 2037-12-26
Also published as: CN108108764A

Abstract

本发明公开一种基于随机森林的视觉SLAM回环检测方法，面向室内环境下移动机器人视觉SLAM定位，基于随机森林的视觉SLAM回环检测方法，主要特点是：(1)利用卷积神经网络的局部感知域，对输入视觉图像进行处理，得到多维的特征矩阵。(2)将特征矩阵转化为一个多维的特征列向量，输入随机森林进行训练，得到新的特征向量。(3)利用标准化欧式距离对当前帧的视觉图像训练得到的特征向量与关键帧的特征向量进行相似度测量，当距离小于设定的阈值则判定当前帧为回环。本发明克服了利用人工设定的特征进行回环检测准确率低、计算量大，实时性差等问题，提高了移动机器人视觉SLAM的定位精度。

Description

一种基于随机森林的视觉SLAM回环检测方法

技术领域

本发明属于在室内环境中的机器人定位领域，尤其涉及一种基于随机森林的视觉SLAM回环检测方法。

背景技术

移动机器人在室内环境下根据视觉传感器的数据进行同时定位与地图构建，即视觉SLAM技术，是实现移动机器人自主定位的关键。传统的视觉SLAM技术包括视觉里程计、后端优化、回环检测以及建图四个部分。视觉里程计主要负责估算相邻两帧视觉图像间的运动和局部地图，包括特征提取与图像配准等技术。回环检测主要负责判断机器人是否到达过先前的位置，并将检测到的回环信息提供给后端进行处理。回环检测的准确性直接影响地图构建的准确性，如果检测到错误的回环，将导致生成错误的地图，影响机器人的定位。

传统的视觉SLAM回环检测方法一般采用图像配准的方法，提取视觉图像的特征点，将当前帧的特征点与关键帧提取的特征点进行配准，如果特征点的匹配对数大于一定的数量，则认为出现了回环。传统的回环检测方法由于受环境因素以及人工特征点选取标准的影响，存在误匹配率高，计算量大，实时性差等缺陷，因此，提高回环检测的准确性和实时性具有重要的现实意义。

利用卷积神经网络的局部感知域提取视觉特征，卷积神经网络与普通神经网络的区别在于，卷积神经网络包含了一个由卷积层和子采样层构成的特征抽取器。在卷积神经网络的卷积层中，一个神经元只与部分邻层神经元连接。在CNN的一个卷积层中，通常包含若干个特征平面(featureMap)，每个特征平面由一些矩形排列的神经元组成，同一特征平面的神经元共享权值，这里共享的权值就是卷积核。卷积核一般以随机小数矩阵的形式初始化，在网络的训练过程中卷积核将学习得到合理的权值。共享权值(卷积核)带来的直接好处是减少网络各层之间的连接，同时又降低了过拟合的风险。子采样也叫做池化(pooling)，通常有均值子采样(mean pooling)和最大值子采样(max pooling)两种形式。子采样可以看作一种特殊的卷积过程。卷积和子采样大大简化了模型复杂度，减少了模型的参数。

发明内容

技术问题：本发明所要解决的技术问题是针对背景技术中所涉及到的传统的回环检测方法由于受环境因素以及人工特征点选取标准的影响，存在误匹配率高，计算量大，实时性差等缺陷，提供一种基于随机森林的视觉SLAM回环检测方法。

技术方案：本发明为解决上述技术问题采用以下技术方案：

一种基于随机森林的视觉SLAM回环检测方法，包括下列步骤：

步骤1)，利用卷积神经网络的局部感知域提取视觉特征，即将卷积神经网络的输入层当作多维矩阵排列的神经元，对输入视觉图像进行处理，将第一个隐藏层的输出作为视觉图像的特征矩阵。

步骤2)，将步骤1)得到的特征矩阵转化为一个多维的特征列向量，输入随机森林进行训练，得到新的特征向量。

步骤3)，利用标准化欧式距离对当前帧的视觉图像训练得到的特征向量与关键帧的特征向量进行相似度测量，当距离小于设定的阈值则判定当前帧为回环。

作为本发明一种基于随机森林的视觉SLAM回环检测方法的技术方案，所述步骤1)的详细步骤如下：

步骤1.1)，假设视觉图像的大小为M×N，卷积神经网络的局部感知域大小为m×m。

步骤1.2)，利用卷积神经网络的局部感知域提取视觉特征，即将卷积神经网络的输入层当作m×m维矩阵排列的神经元，对采集的视觉图像进行处理，得到第一个隐藏层的输出为：

F_I＝(M-m+1)×(N-m+1)

其中F_I表示第I帧视觉图像处理后得到的特征矩阵。

作为本发明一种基于随机森林的视觉SLAM回环检测方法的技术方案，所述步骤2)的详细步骤如下：

步骤2.1)，首先将第i帧视觉图像的特征矩阵按列进行转换，得到向量F_i：

F_i＝(N-m+1)(M-m+1)×1

步骤2.2)，然后利用Bagging策略对向量Fi进行有放回的采样，得到a个样本，然后对a个样本建立决策树，重复采样与建立决策树的过程，直到生成b颗决策树，组成一个随机森林模型，这里a和b均为大小合适的正整数。

步骤2.3)，将随机森林模型的结果进行拼接，得到新的特征向量NF_i。

作为本发明一种基于随机森林的视觉SLAM回环检测方法的技术方案，所述步骤3)的详细步骤如下：

步骤3.1)，关键帧的选取，设定每相隔k帧为一个关键帧。

步骤3.2)，设当前帧训练得到的特征向量为NFi，第n个关键帧训练得到的特征向量为：

步骤3.3)，设NF_i为NF_i＝(X_i1,X_i2,X_i3,…,X_ib)，NF_nk为NF_nk＝(X_n1,X_n2,X_n3,…,X_nb)，

其中X表示随机森林模型中每一颗决策树训练的结果，一共有b颗决策树，则利用标准化欧式距离进行相似性度量的公式如下：

其中，sx为第n个关键帧的标准差，设定距离阈值d，如果Din＜d，则当前帧判定为回环。

进一步地，k的取值应该视相机的帧率及移动机器人的速度而定，取值不能太大也不能太小。

有益效果：本发明采用以上技术方案与现有视觉SLAM回环检测技术相比，具有以下技术效果：

1.克服了传统视觉SLAM回环检测技术采用人工特征进行图像配准引起的误匹配率高，计算量大，实时性差等缺陷。

2.克服了传统视觉SLAM回环检测技术受环境因素影响的问题，提高了移动机器人视觉SLAM的定位精度。

附图说明

图1是本发明方法的流程示意图。

图2是本发明随机森林模型建立方法的流程示意图。

具体实施方式

下面结合附图对本发明的技术方案做进一步的详细说明：

实施方式的平台为：linux操作系统，ROS系统，流程如图1所示：

(1)利用卷积神经网络的局部感知域提取视觉特征，即将卷积神经网络的输入层当作多维矩阵排列的神经元，对输入视觉图像进行处理，将第一个隐藏层的输出作为视觉图像的特征矩阵。

假设视觉图像的大小为M×N，卷积神经网络的局部感知域大小为m×m。利用卷积神经网络的局部感知域对采集的视觉图像进行处理，得到的特征矩阵为：F_I＝(M-m+1)×(N-m+1)；

其中F_I表示第i帧视觉图像处理后得到的特征矩阵。

(2)将步骤1)得到的特征矩阵转化为一维的特征向量，输入随机森林进行训练，得到新的特征向量。

首先将第i帧视觉图像的特征矩阵按列进行转换，得到向量Fi：F_i＝(N-m+1)(M-m+1)×1，然后利用Bagging策略对向量Fi进行有放回的采样，得到a个样本，然后对a个样本建立决策树，重复采样与建立决策树的过程，直到生成b颗决策树，组成一个随机森林模型，这里a和b均为大小合适的正整数，最后将随机森林模型的结果进行拼接得到新的特征向量NF_i。

(3)利用标准化欧式距离对当前帧的视觉图像训练得到的特征向量与关键帧的特征向量进行相似度测量，当距离小于设定的阈值则判定当前帧为回环。

首先进行关键帧的选取，设定每相隔k帧为一个关键帧，其中k的取值应该视相机的帧率及移动机器人的速度而定，取值不能太大也不能太小。设当前帧训练得到的特征向量为NFi，第n个关键帧训练得到的特征向量为：

设NF_i为NF_i＝(X_i1,X_i2,X_i3,…,X_ib)，NF_nk为NF_nk＝(X_n1,X_n2,X_n3,…,X_nb)，其中X表示随机森林模型中每一颗决策树训练的结果，一共有b颗决策树，则利用标准化欧式距离进行相似性度量的公式为：

其中，s_x为第n个关键帧的标准差，设定距离阈值d，如果D_in＜d，则当前帧判定位回环。

本技术领域技术人员可以理解的是，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样定义，不会用理想化或过于正式的含义来解释。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于随机森林的视觉SLAM回环检测方法，其特征在于，包括下列步骤：

步骤1)，利用卷积神经网络的局部感知域提取视觉特征，即将卷积神经网络的输入层当作多维矩阵排列的神经元，对输入视觉图像进行处理，将第一个隐藏层的输出作为视觉图像的特征矩阵；

步骤2)，将步骤1)得到的特征矩阵转化为一个多维的特征列向量，输入随机森林进行训练，得到新的特征向量；

所述步骤2)的详细步骤如下：

F_i＝(N-m+1)(M-m+1)×1

其中,视觉图像的大小为M×N，卷积神经网络的局部感知域大小为m×m；

步骤2.2)，然后利用Bagging策略对向量F_i进行有放回的采样，得到a个样本，然后对a个样本建立决策树，重复采样与建立决策树的过程，直到生成b颗决策树，组成一个随机森林模型，这里a和b均为大小合适的正整数；

步骤2.3)，将随机森林模型的结果进行拼接，得到新的特征向量NF_i；

步骤3)，利用标准化欧式距离对当前帧的视觉图像训练得到的特征向量与关键帧的特征向量进行相似度测量，当距离小于设定的阈值则判定当前帧为回环；

所述步骤3)的详细步骤如下：

步骤3.1)，关键帧的选取，设定每相隔k帧为一个关键帧；

步骤3.2)，设当前帧训练得到的特征向量为NF_i，第n个关键帧训练得到的特征向量为：

步骤3.3)，设NF_i为NF_i＝(X_i1,X_i2,X_i3,…,X_ib)，NF_nk为NF_nk＝(X_n1,X_n2,X_n3,…,X_nb)，其中X表示随机森林模型中每一颗决策树训练的结果，一共有b颗决策树，则利用标准化欧式距离进行相似性度量的公式如下：

其中，s_x为第n个关键帧的标准差，设定距离阈值d，如果D_in＜d，则当前帧判定为回环。

2.根据权利要求1所述的基于随机森林的视觉SLAM回环检测方法，其特征在于，所述步骤1)的详细步骤如下：

步骤1.1)，假设视觉图像的大小为M×N，卷积神经网络的局部感知域大小为m×m；

F_I＝(M-m+1)×(N-m+1)

其中F_I表示第i帧视觉图像处理后得到的特征矩阵。

3.根据权利要求1所述的基于随机森林的视觉SLAM回环检测方法，其特征在于，所述步骤3.1)中，k的取值应该视相机的帧率及移动机器人的速度而定。