CN110516527B

CN110516527B - 一种基于实例分割的视觉slam回环检测改进方法

Info

Publication number: CN110516527B
Application number: CN201910609461.1A
Authority: CN
Inventors: 赖瑨; 刘治; 章云
Original assignee: Guangdong University of Technology
Current assignee: Guangdong University of Technology
Priority date: 2019-07-08
Filing date: 2019-07-08
Publication date: 2023-05-23
Anticipated expiration: 2039-07-08
Also published as: CN110516527A

Abstract

本发明公开了一种基于实例分割的视觉SLAM回环检测改进方法，提出通过Mask R‑CNN框架对图像进行实例分割，并提出三种结合实例分割的改进措施，以此来解决移动智能型机器人在视觉导航中遇到的回环检测问题，从而使得机器人在移动建图上更加准确；本发明与现有技术相比，使用Mask R‑CNN进行离线的训练，将图像中的实例进行精细分割。并将分割出的相关性较低的实例进行选择并去除，使得整个回环检测的稳定性以及准确率得到提高，以此来提高智能移动机器人导航的高效性和准确性；另外，在回环检测中通过三种结合实例分割框架的检测方法，用来对图像空间关系进行描述，从而进一步对回环检测进行检验。本发明中的这两大特征使得整个系统的准确性得到显著的提高。

Description

一种基于实例分割的视觉SLAM回环检测改进方法

技术领域

本发明涉及实例分割及视觉SLAM技术领域，具体涉及一种基于实例分割的视觉SLAM回环检测改进方法。

背景技术

目前，随着移动机器人系统的进一步发展，使得视觉同步定位与建图(视觉SLAM)受到了政府、社会、企业的高度重视，更是吸引了相关产业链与环节众多厂家的积极参与。视觉SLAM通过双目摄像头获取图像信息，以达到在没有环境先验信息的情况下，实现运动过程中建立环境并估计自身运动等功能。在复杂环境的干扰下，如何保证并提升移动机器人的建图准确性是视觉SLAM产业化过程的关键应用基础问题。

SLAM即Simultaneous Localization and mapping，中文译作“同时定位与地图构建”，它是指搭载特定传感器的主体，在没有环境先验信息的情况下，于运动过程中建立环境的模型，同时估计自身的运动。

在经典视觉SLAM框架中，主要由传感器数据、视觉里程计、后端优化、回环检测、最终建图这些方面组成；其中回环检测方面，传统回环检测方法采用的是视觉词袋模型(BoW)，词袋模型对图像中视觉特征描述子进行聚类，建立词典，然后对于给定的图像在词袋中找到对应的单词。常见的视觉特征SIFT、SURF、ORB等被广泛应用。但是其方法有着有很大的应用局限性，这些特征的提取耗费大量的时间，同时在光照变化明显的场景中，这些方法忽略了环境中有用的信息，造成闭环检测的准确度不高。BoW方法在实际应用中需要人为的设定一些字典，并且在准确性上相对于机器学习来说并不高；而且回环检测实际上就是聚类的问题，而此类问题在机器学习方面已经得到了很好的解决，所以机器学习代替BoW这类算法成为主流回环检测方法将是一大趋势，而MASK R-CNN则是当今机器学习中的热点之一，其能够在像素层面识别目标轮廓。

发明内容

本发明的目的在于克服现有技术的缺点与不足，提供一种基于实例分割的视觉SLAM回环检测改进方法，该方法将MASK R-CNN与SLAM回环检测问题相互结合，并提出实例SLAM回环检测中只适用于实例分割的改进方法，使得回环检测的准确性和稳定性得到提升。

本发明的目的通过下述技术方案实现：

一种基于实例分割的视觉SLAM回环检测改进方法，包括下述步骤：

(1)使用RGB-D摄像头获取RGB信息以及深度的信息，将采集到的数据集样本分成多个同等份的数据集；

(2)将数据集中的每一张图片分别送入CNN，进行特征提取；

(3)在最后一层卷积featuremap上，通过RPN生成ROI，每张图片固定n个建议窗口；

(4)通过RoIAlign层使得每个建议窗口生成固定大小的featuremap；

(5)得到三个输出向量，第一个是softmax分类，第二个是每一类的bounding box回归，第三个是每一个ROI的二进制掩码Mask；通过这三个输出向量，从而得到实例分割的结果；

(6)将实例分割的结果进行过滤，即将分割出的相关性较低的实例进行选择并去除，只留下能区分图像特征的实例；

(7)将第A帧图像与第B帧图像所得到的实例分割过滤后的结果进行对比，规定A、B在全部帧中随机取，且A+1<B，当最终聚类中心的对比在误差范围之内，并达到了一定的数量时，便看作是达到了回环的效果；

(8)得到MASK R-CNN的实例分割结果后，一方面可以直接通过最终的特征进行回环检测；另一方面，也可以使用结合实例分割与视觉SLAM的回环检测方法。

优选地，所述结合实例分割与视觉SLAM的回环检测方法具体为：

①将步骤(6)所得到的结果进行再次回环检测检验，由于移动机器人中回环检测问题主要研究图像间的相似性，而当背景实例相同但前后景不同时，应当判定为没有达到回环效果，为此可通过前后景对比的方式，而这一判定依据只能结合MASK R-CNN来进行判断；

②通过MASK R-CNN对实例进行前后景区分，随后对实例前后景进行统计，将前景的实例集合作为字典D1，后景的实例集合作为字典D2，其中前后景作为key，前后景的实例列表作为value；针对第A帧图像与第B帧图像得到的D1、D2进行前后景对比，从而对回环检测进行进一步的检测。

①将步骤(6)所得到的结果进行再次回环检测检验，由于当机器人在道路移动时，实际上图像中的事物都是由远到近的，所以实例和前后景经常都是相同的，为此可对每个实例进行图形面积计算，而这一判定依据只能结合MASK R-CNN来进行判断；

②通过对图像中每个实例进行像素点总和的计算，总和数记作n，将不同实例的面积进行区分和统计，可以得到每个实例的面积总和并进行图像之间的对比，从而对回环检测进行进一步的检测。

①将步骤(6)所得到的结果进行再次回环检测检验，由于机器人在运动过程中，有可能同一场景从不同角度拍摄，而此时实例面积很可能不起作用，为此可通过计算实例的中心位置，而这一判定依据只能结合MASK R-CNN来进行判断；

②在通过RGB-D相机得到数据的同时，对此时得到的像素平面进行位置处理，给定每个像素(x，y)位置信息，x轴为横向，y轴为纵向；

③对每个实例中的总和像素点n进行像素位置的x、y总和计算，x坐标总和记为X，y坐标总和记为Y，最后将总和X、Y分别除以总像素点n，得到每个实例的中心点位置，从而通过不同实例的中心点位置对回环检测进行进一步的检测。

本发明与现有技术相比具有以下的有益效果：

(1)本发明提出将MASK R-CNN与视觉SLAM回环检测相互结合，使得整个移动机器人在回环检测问题上能够以更加清晰的判别方式进行；

(2)本发明提出三种结合实例分割与视觉SLAM回环检测的改进方法，分别为：前后景对比方法、实例面积对比方法、实例位置对比方法；其方法只与MASK R-CNN相结合使用，能够有效的提高回环检测的稳定性与准确性，使得机器人在移动建图方面更加高效。

附图说明

图1为本发明的具体流程图；

图2为本发明的实例分割网络框架图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

如图1～2所示，一种基于实例分割的视觉SLAM回环检测改进方法，包括下述步骤：

(2)将数据集中的每一张图片分别送入CNN，进行特征提取；

(3)在最后一层卷积featuremap上，通过RPN生成ROI，每张图片固定n个建议窗口，这里设n为300；

(4)通过RoIAlign层使得每个建议窗口生成固定大小的featuremap；

(5)得到三个输出向量，第一个是softmax分类，第二个是每一类的bounding box回归，第三个是每一个ROI的二进制掩码Mask(FCN生成)；通过这三个输出向量，从而得到实例分割的结果；

本发明提出三种结合实例分割与视觉SLAM的回环检测方法，这三种方法是并行运行的，如图1所示，具体如下：

所述结合实例分割与视觉SLAM的回环检测方法之一：

所述结合实例分割与视觉SLAM的回环检测方法之二：

所述结合实例分割与视觉SLAM的回环检测方法之三：

本发明提出将MASK R-CNN与视觉SLAM回环检测相互结合，使得整个移动机器人在回环检测问题上能够以更加清晰的判别方式进行；提出三种结合实例分割与视觉SLAM回环检测的改进方法，分别为：前后景对比方法、实例面积对比方法、实例位置对比方法；其方法只与MASK R-CNN相结合使用，能够有效的提高回环检测的稳定性与准确性，使得机器人在移动建图方面更加高效。

上述为本发明较佳的实施方式，但本发明的实施方式并不受上述内容的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种基于实例分割的视觉SLAM回环检测改进方法，其特征在于，包括下述步骤：

(2)将数据集中的每一张图片分别送入CNN，进行特征提取；

(4)通过RoIAlign层使得每个建议窗口生成固定大小的feature map；

2.根据权利要求1所述的基于实例分割的视觉SLAM回环检测改进方法，其特征在于，所述结合实例分割与视觉SLAM的回环检测方法具体为：

3.根据权利要求1所述的基于实例分割的视觉SLAM回环检测改进方法，其特征在于，所述结合实例分割与视觉SLAM的回环检测方法具体为：

4.根据权利要求1所述的基于实例分割的视觉SLAM回环检测改进方法，其特征在于，所述结合实例分割与视觉SLAM的回环检测方法具体为：