CN108108764B - 一种基于随机森林的视觉slam回环检测方法 - Google Patents

一种基于随机森林的视觉slam回环检测方法 Download PDF

Info

Publication number
CN108108764B
CN108108764B CN201711433144.6A CN201711433144A CN108108764B CN 108108764 B CN108108764 B CN 108108764B CN 201711433144 A CN201711433144 A CN 201711433144A CN 108108764 B CN108108764 B CN 108108764B
Authority
CN
China
Prior art keywords
random forest
visual
visual image
training
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711433144.6A
Other languages
English (en)
Other versions
CN108108764A (zh
Inventor
陈熙源
方文辉
柳笛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201711433144.6A priority Critical patent/CN108108764B/zh
Publication of CN108108764A publication Critical patent/CN108108764A/zh
Application granted granted Critical
Publication of CN108108764B publication Critical patent/CN108108764B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种基于随机森林的视觉SLAM回环检测方法,面向室内环境下移动机器人视觉SLAM定位,基于随机森林的视觉SLAM回环检测方法,主要特点是:(1)利用卷积神经网络的局部感知域,对输入视觉图像进行处理,得到多维的特征矩阵。(2)将特征矩阵转化为一个多维的特征列向量,输入随机森林进行训练,得到新的特征向量。(3)利用标准化欧式距离对当前帧的视觉图像训练得到的特征向量与关键帧的特征向量进行相似度测量,当距离小于设定的阈值则判定当前帧为回环。本发明克服了利用人工设定的特征进行回环检测准确率低、计算量大,实时性差等问题,提高了移动机器人视觉SLAM的定位精度。

Description

一种基于随机森林的视觉SLAM回环检测方法
技术领域
本发明属于在室内环境中的机器人定位领域,尤其涉及一种基于随机森林的视觉SLAM回环检测方法。
背景技术
移动机器人在室内环境下根据视觉传感器的数据进行同时定位与地图构建,即视觉SLAM技术,是实现移动机器人自主定位的关键。传统的视觉SLAM技术包括视觉里程计、后端优化、回环检测以及建图四个部分。视觉里程计主要负责估算相邻两帧视觉图像间的运动和局部地图,包括特征提取与图像配准等技术。回环检测主要负责判断机器人是否到达过先前的位置,并将检测到的回环信息提供给后端进行处理。回环检测的准确性直接影响地图构建的准确性,如果检测到错误的回环,将导致生成错误的地图,影响机器人的定位。
传统的视觉SLAM回环检测方法一般采用图像配准的方法,提取视觉图像的特征点,将当前帧的特征点与关键帧提取的特征点进行配准,如果特征点的匹配对数大于一定的数量,则认为出现了回环。传统的回环检测方法由于受环境因素以及人工特征点选取标准的影响,存在误匹配率高,计算量大,实时性差等缺陷,因此,提高回环检测的准确性和实时性具有重要的现实意义。
利用卷积神经网络的局部感知域提取视觉特征,卷积神经网络与普通神经网络的区别在于,卷积神经网络包含了一个由卷积层和子采样层构成的特征抽取器。在卷积神经网络的卷积层中,一个神经元只与部分邻层神经元连接。在CNN的一个卷积层中,通常包含若干个特征平面(featureMap),每个特征平面由一些矩形排列的神经元组成,同一特征平面的神经元共享权值,这里共享的权值就是卷积核。卷积核一般以随机小数矩阵的形式初始化,在网络的训练过程中卷积核将学习得到合理的权值。共享权值(卷积核)带来的直接好处是减少网络各层之间的连接,同时又降低了过拟合的风险。子采样也叫做池化(pooling),通常有均值子采样(mean pooling)和最大值子采样(max pooling)两种形式。子采样可以看作一种特殊的卷积过程。卷积和子采样大大简化了模型复杂度,减少了模型的参数。
发明内容
技术问题:本发明所要解决的技术问题是针对背景技术中所涉及到的传统的回环检测方法由于受环境因素以及人工特征点选取标准的影响,存在误匹配率高,计算量大,实时性差等缺陷,提供一种基于随机森林的视觉SLAM回环检测方法。
技术方案:本发明为解决上述技术问题采用以下技术方案:
一种基于随机森林的视觉SLAM回环检测方法,包括下列步骤:
步骤1),利用卷积神经网络的局部感知域提取视觉特征,即将卷积神经网络的输入层当作多维矩阵排列的神经元,对输入视觉图像进行处理,将第一个隐藏层的输出作为视觉图像的特征矩阵。
步骤2),将步骤1)得到的特征矩阵转化为一个多维的特征列向量,输入随机森林进行训练,得到新的特征向量。
步骤3),利用标准化欧式距离对当前帧的视觉图像训练得到的特征向量与关键帧的特征向量进行相似度测量,当距离小于设定的阈值则判定当前帧为回环。
作为本发明一种基于随机森林的视觉SLAM回环检测方法的技术方案,所述步骤1)的详细步骤如下:
步骤1.1),假设视觉图像的大小为M×N,卷积神经网络的局部感知域大小为m×m。
步骤1.2),利用卷积神经网络的局部感知域提取视觉特征,即将卷积神经网络的输入层当作m×m维矩阵排列的神经元,对采集的视觉图像进行处理,得到第一个隐藏层的输出为:
FI=(M-m+1)×(N-m+1)
其中FI表示第I帧视觉图像处理后得到的特征矩阵。
作为本发明一种基于随机森林的视觉SLAM回环检测方法的技术方案,所述步骤2)的详细步骤如下:
步骤2.1),首先将第i帧视觉图像的特征矩阵按列进行转换,得到向量Fi
Fi=(N-m+1)(M-m+1)×1
步骤2.2),然后利用Bagging策略对向量Fi进行有放回的采样,得到a个样本,然后对a个样本建立决策树,重复采样与建立决策树的过程,直到生成b颗决策树,组成一个随机森林模型,这里a和b均为大小合适的正整数。
步骤2.3),将随机森林模型的结果进行拼接,得到新的特征向量NFi
作为本发明一种基于随机森林的视觉SLAM回环检测方法的技术方案,所述步骤3)的详细步骤如下:
步骤3.1),关键帧的选取,设定每相隔k帧为一个关键帧。
步骤3.2),设当前帧训练得到的特征向量为NFi,第n个关键帧训练得到的特征向量为:
Figure GDA0003311950450000041
步骤3.3),设NFi为NFi=(Xi1,Xi2,Xi3,…,Xib),NFnk为NFnk=(Xn1,Xn2,Xn3,…,Xnb),
其中X表示随机森林模型中每一颗决策树训练的结果,一共有b颗决策树,则利用标准化欧式距离进行相似性度量的公式如下:
Figure GDA0003311950450000042
其中,sx为第n个关键帧的标准差,设定距离阈值d,如果Din<d,则当前帧判定为回环。
进一步地,k的取值应该视相机的帧率及移动机器人的速度而定,取值不能太大也不能太小。
有益效果:本发明采用以上技术方案与现有视觉SLAM回环检测技术相比,具有以下技术效果:
1.克服了传统视觉SLAM回环检测技术采用人工特征进行图像配准引起的误匹配率高,计算量大,实时性差等缺陷。
2.克服了传统视觉SLAM回环检测技术受环境因素影响的问题,提高了移动机器人视觉SLAM的定位精度。
附图说明
图1是本发明方法的流程示意图。
图2是本发明随机森林模型建立方法的流程示意图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
实施方式的平台为:linux操作系统,ROS系统,流程如图1所示:
(1)利用卷积神经网络的局部感知域提取视觉特征,即将卷积神经网络的输入层当作多维矩阵排列的神经元,对输入视觉图像进行处理,将第一个隐藏层的输出作为视觉图像的特征矩阵。
假设视觉图像的大小为M×N,卷积神经网络的局部感知域大小为m×m。利用卷积神经网络的局部感知域对采集的视觉图像进行处理,得到的特征矩阵为:FI=(M-m+1)×(N-m+1);
其中FI表示第i帧视觉图像处理后得到的特征矩阵。
(2)将步骤1)得到的特征矩阵转化为一维的特征向量,输入随机森林进行训练,得到新的特征向量。
首先将第i帧视觉图像的特征矩阵按列进行转换,得到向量Fi:Fi=(N-m+1)(M-m+1)×1,然后利用Bagging策略对向量Fi进行有放回的采样,得到a个样本,然后对a个样本建立决策树,重复采样与建立决策树的过程,直到生成b颗决策树,组成一个随机森林模型,这里a和b均为大小合适的正整数,最后将随机森林模型的结果进行拼接得到新的特征向量NFi
(3)利用标准化欧式距离对当前帧的视觉图像训练得到的特征向量与关键帧的特征向量进行相似度测量,当距离小于设定的阈值则判定当前帧为回环。
首先进行关键帧的选取,设定每相隔k帧为一个关键帧,其中k的取值应该视相机的帧率及移动机器人的速度而定,取值不能太大也不能太小。设当前帧训练得到的特征向量为NFi,第n个关键帧训练得到的特征向量为:
Figure GDA0003311950450000061
设NFi为NFi=(Xi1,Xi2,Xi3,…,Xib),NFnk为NFnk=(Xn1,Xn2,Xn3,…,Xnb),其中X表示随机森林模型中每一颗决策树训练的结果,一共有b颗决策树,则利用标准化欧式距离进行相似性度量的公式为:
Figure GDA0003311950450000062
其中,sx为第n个关键帧的标准差,设定距离阈值d,如果Din<d,则当前帧判定位回环。
本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种基于随机森林的视觉SLAM回环检测方法,其特征在于,包括下列步骤:
步骤1),利用卷积神经网络的局部感知域提取视觉特征,即将卷积神经网络的输入层当作多维矩阵排列的神经元,对输入视觉图像进行处理,将第一个隐藏层的输出作为视觉图像的特征矩阵;
步骤2),将步骤1)得到的特征矩阵转化为一个多维的特征列向量,输入随机森林进行训练,得到新的特征向量;
所述步骤2)的详细步骤如下:
步骤2.1),首先将第i帧视觉图像的特征矩阵按列进行转换,得到向量Fi
Fi=(N-m+1)(M-m+1)×1
其中,视觉图像的大小为M×N,卷积神经网络的局部感知域大小为m×m;
步骤2.2),然后利用Bagging策略对向量Fi进行有放回的采样,得到a个样本,然后对a个样本建立决策树,重复采样与建立决策树的过程,直到生成b颗决策树,组成一个随机森林模型,这里a和b均为大小合适的正整数;
步骤2.3),将随机森林模型的结果进行拼接,得到新的特征向量NFi
步骤3),利用标准化欧式距离对当前帧的视觉图像训练得到的特征向量与关键帧的特征向量进行相似度测量,当距离小于设定的阈值则判定当前帧为回环;
所述步骤3)的详细步骤如下:
步骤3.1),关键帧的选取,设定每相隔k帧为一个关键帧;
步骤3.2),设当前帧训练得到的特征向量为NFi,第n个关键帧训练得到的特征向量为:
Figure FDA0003311950440000021
步骤3.3),设NFi为NFi=(Xi1,Xi2,Xi3,…,Xib),NFnk为NFnk=(Xn1,Xn2,Xn3,…,Xnb),其中X表示随机森林模型中每一颗决策树训练的结果,一共有b颗决策树,则利用标准化欧式距离进行相似性度量的公式如下:
Figure FDA0003311950440000022
其中,sx为第n个关键帧的标准差,设定距离阈值d,如果Din<d,则当前帧判定为回环。
2.根据权利要求1所述的基于随机森林的视觉SLAM回环检测方法,其特征在于,所述步骤1)的详细步骤如下:
步骤1.1),假设视觉图像的大小为M×N,卷积神经网络的局部感知域大小为m×m;
步骤1.2),利用卷积神经网络的局部感知域提取视觉特征,即将卷积神经网络的输入层当作m×m维矩阵排列的神经元,对采集的视觉图像进行处理,得到第一个隐藏层的输出为:
FI=(M-m+1)×(N-m+1)
其中FI表示第i帧视觉图像处理后得到的特征矩阵。
3.根据权利要求1所述的基于随机森林的视觉SLAM回环检测方法,其特征在于,所述步骤3.1)中,k的取值应该视相机的帧率及移动机器人的速度而定。
CN201711433144.6A 2017-12-26 2017-12-26 一种基于随机森林的视觉slam回环检测方法 Active CN108108764B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711433144.6A CN108108764B (zh) 2017-12-26 2017-12-26 一种基于随机森林的视觉slam回环检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711433144.6A CN108108764B (zh) 2017-12-26 2017-12-26 一种基于随机森林的视觉slam回环检测方法

Publications (2)

Publication Number Publication Date
CN108108764A CN108108764A (zh) 2018-06-01
CN108108764B true CN108108764B (zh) 2021-12-24

Family

ID=62213498

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711433144.6A Active CN108108764B (zh) 2017-12-26 2017-12-26 一种基于随机森林的视觉slam回环检测方法

Country Status (1)

Country Link
CN (1) CN108108764B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109325979B (zh) * 2018-07-20 2021-11-02 上海理工大学 基于深度学习的机器人回环检测方法
CN109272021B (zh) * 2018-08-22 2022-03-04 广东工业大学 一种基于宽度学习的智能移动机器人导航方法
CN109272577B (zh) * 2018-08-30 2023-02-03 北京计算机技术及应用研究所 一种基于Kinect的视觉SLAM方法
CN109376631B (zh) * 2018-10-12 2020-12-29 中国人民公安大学 一种基于神经网络的回环检测方法及装置
CN109556596A (zh) * 2018-10-19 2019-04-02 北京极智嘉科技有限公司 基于地面纹理图像的导航方法、装置、设备及存储介质
CN109443382B (zh) * 2018-10-22 2022-05-17 北京工业大学 基于特征提取与降维神经网络的视觉slam闭环检测方法
CN109544632B (zh) * 2018-11-05 2021-08-03 浙江工业大学 一种基于层次主题模型的语义slam对象关联方法
CN110070578B (zh) * 2019-03-15 2023-07-18 西安电子科技大学 一种回环检测方法
CN111754388A (zh) * 2019-03-28 2020-10-09 北京初速度科技有限公司 一种建图方法及车载终端
CN110146080B (zh) * 2019-04-24 2024-01-19 佛山科学技术学院 一种基于移动机器人的slam回环检测方法及装置
CN110097016A (zh) * 2019-05-08 2019-08-06 广东工业大学 一种应用于vslam回环验证的路标特征点匹配方法
CN110516527B (zh) * 2019-07-08 2023-05-23 广东工业大学 一种基于实例分割的视觉slam回环检测改进方法
CN111241944B (zh) * 2019-12-31 2023-05-26 浙江大学 基于背景目标与背景特征匹配的场景识别与回环检测方法
CN111325712B (zh) * 2020-01-20 2024-01-23 北京百度网讯科技有限公司 用于检测图像有效性的方法及装置
CN112950676A (zh) * 2021-03-25 2021-06-11 长春理工大学 一种智能机器人回环检测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102224410A (zh) * 2008-09-24 2011-10-19 施特劳斯控股公司 用于测试分析物的成像分析仪
US20160100790A1 (en) * 2014-10-08 2016-04-14 Revealix, Inc. Automated systems and methods for skin assessment and early detection of a latent pathogenic bio-signal anomaly
CN106662453A (zh) * 2014-08-27 2017-05-10 高通股份有限公司 用于根据传感器和射频测量进行基于移动的实时定位的方法和设备
CN106896807A (zh) * 2015-12-17 2017-06-27 卡西欧计算机株式会社 自主移动装置以及自主移动方法
CN106991374A (zh) * 2017-03-07 2017-07-28 中国矿业大学 基于卷积神经网络和随机森林的手写数字识别方法
CN107330357A (zh) * 2017-05-18 2017-11-07 东北大学 基于深度神经网络的视觉slam闭环检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102224410A (zh) * 2008-09-24 2011-10-19 施特劳斯控股公司 用于测试分析物的成像分析仪
CN106662453A (zh) * 2014-08-27 2017-05-10 高通股份有限公司 用于根据传感器和射频测量进行基于移动的实时定位的方法和设备
US20160100790A1 (en) * 2014-10-08 2016-04-14 Revealix, Inc. Automated systems and methods for skin assessment and early detection of a latent pathogenic bio-signal anomaly
CN106896807A (zh) * 2015-12-17 2017-06-27 卡西欧计算机株式会社 自主移动装置以及自主移动方法
CN106991374A (zh) * 2017-03-07 2017-07-28 中国矿业大学 基于卷积神经网络和随机森林的手写数字识别方法
CN107330357A (zh) * 2017-05-18 2017-11-07 东北大学 基于深度神经网络的视觉slam闭环检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Loop closure detection for visual SLAM systems using convolutional neural network;Xiwu Zhang 等;《2017 23rd International Conference on Automation and Computing (ICAC)》;20171026;第1页第2段-第5页倒数第2段 *
基于精简卷积神经网络的快速闭环检测方法;何元烈 等;《计算机工程》;20170807;全文 *

Also Published As

Publication number Publication date
CN108108764A (zh) 2018-06-01

Similar Documents

Publication Publication Date Title
CN108108764B (zh) 一种基于随机森林的视觉slam回环检测方法
CN109816725B (zh) 一种基于深度学习的单目相机物体位姿估计方法及装置
US11908244B2 (en) Human posture detection utilizing posture reference maps
CN110443143B (zh) 多分支卷积神经网络融合的遥感图像场景分类方法
US11551333B2 (en) Image reconstruction method and device
WO2020228446A1 (zh) 模型训练方法、装置、终端及存储介质
CN106599830B (zh) 人脸关键点定位方法及装置
CN111950453B (zh) 一种基于选择性注意力机制的任意形状文本识别方法
WO2020177432A1 (zh) 基于目标检测网络的多标签物体检测方法、系统、装置
CN108304820B (zh) 一种人脸检测方法、装置及终端设备
EP3968179A1 (en) Place recognition method and apparatus, model training method and apparatus for place recognition, and electronic device
CN107705322A (zh) 运动目标识别跟踪方法和系统
CN110766041B (zh) 一种基于深度学习的害虫检测方法
CN110222718B (zh) 图像处理的方法及装置
CN112581540B (zh) 一种大场景下基于人体姿态估计的相机标定方法
CN110675421B (zh) 基于少量标注框的深度图像协同分割方法
CN109753996B (zh) 基于三维轻量化深度网络的高光谱图像分类方法
CN113191489B (zh) 二值神经网络模型的训练方法、图像处理方法和装置
CN112950780B (zh) 一种基于遥感影像的网络地图智能生成方法及系统
CN110443279B (zh) 一种基于轻量级神经网络的无人机图像车辆检测方法
CN114332639B (zh) 一种非线性残差自注意力机制的卫星姿态视觉测量方法
CN113159300A (zh) 图像检测神经网络模型及其训练方法、图像检测方法
CN112669348A (zh) 一种鱼体姿势估计和鱼体表型数据测量方法及装置
CN112766305B (zh) 一种基于端到端度量网络的视觉slam闭环检测方法
CN112329662B (zh) 基于无监督学习的多视角显著性估计方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant