CN112766305A - 一种基于端到端度量网络的视觉slam闭环检测方法 - Google Patents

一种基于端到端度量网络的视觉slam闭环检测方法 Download PDF

Info

Publication number
CN112766305A
CN112766305A CN202011566515.XA CN202011566515A CN112766305A CN 112766305 A CN112766305 A CN 112766305A CN 202011566515 A CN202011566515 A CN 202011566515A CN 112766305 A CN112766305 A CN 112766305A
Authority
CN
China
Prior art keywords
convolution
convolution module
module
layer
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011566515.XA
Other languages
English (en)
Other versions
CN112766305B (zh
Inventor
肖卓凌
李莹
张钰涵
袁正希
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202011566515.XA priority Critical patent/CN112766305B/zh
Publication of CN112766305A publication Critical patent/CN112766305A/zh
Application granted granted Critical
Publication of CN112766305B publication Critical patent/CN112766305B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于端到端度量网络的视觉SLAM闭环检测方法,包括以下步骤:S1、对当前时刻的环境图像进行预处理,得到当前时刻的标准化图像;S2、采用特征提取模型对历史时刻和当前时刻的标准化图像分别进行图像特征提取;S3、采用两个图像的多层特征构建相似矩阵;S4、采用卷积神经网络对相似矩阵进行进一步地特征提取;S5、构建相似性度量模型,将相似矩阵的特征图输入相似性度量模型进行历史时刻与当前时刻的环境图像的相似度计算,确定当前时刻的环境是否产生闭环;本发明解决了现有的闭环检测方法大都将特征提取和相似性度量作为两个环节独立进行使得检测效果不能进一步优化的问题。

Description

一种基于端到端度量网络的视觉SLAM闭环检测方法
技术领域
本发明涉及同时定位与地图构建领域,具体涉及一种基于端到端度量网络的视觉SLAM闭环检测方法。
背景技术
近年来,计算机技术和人工智能的飞速发展,带动了许多新兴产业的发展,机器人产业是其中杰出的代表。机器人的出现,给人们的生产生活带来了极大的便利,极大的提高了人们的生活质量。机器人的良好运行得益于同时定位与地图构建技术的发展,该技术使得机器人能够在完全陌生的环境中,通过自身携带的传感器获取周边环境信息,实现自主定位,尤其是在全球定位系统(GPS)无法覆盖的地方,这种技术弥补了GPS信号穿透性差的缺陷。在机器人领域受到越来越多的关注。
闭环检测,是整个SLAM系统中至关重要的一个环节。它作用于整个SLAM系统的后端。SLAM系统的前端能够根据传感器数据恢复出机器人的行走轨迹,在恢复轨迹的过程中由于累计误差的存在会造成轨迹的漂移,影响定位的精度。而闭环检测能够通过传感器采集到的数据,判断当前位置是否是机器人曾经到达过的位置,来纠正大量时间尺度上的累积误差,修正轨迹漂移,这对于定位精度的提高以及全局一致性地图的构建起着至关重要的作用。
在视觉SLAM中,最简单也最流行的方法是将闭环检测看作图片匹配问题来解决。通过比较在当前位置获取的环境图像和之前到过位置的环境图像之间的相似度来确定此处是否发生了闭环。因此,视觉SLAM中的闭环检测本质上就是图像匹配问题,也被称为地点识别问题,主要可以分为两个关键步骤:特征提取和相似性度量。
在传统的闭环检测方法中,特征提取方法通常采用词袋模型(BoW)。基于BoW的方法主要利用的人们利用经验手工设计的特征,一方面特征的信息不够全面,无法应对复杂的视角变化和光照变化等场景,另一方面这部分特征多是一些统计特征,计算复杂度高,效率低下。随着深度学习技术的发展,深度学习技术在图像分类、识别、检索等领域取得了一系列优异的成果,而且相关的网络模型可以很方便的迁移到闭环检测问题中作为特征提取模型来使用,因此,越来越多的研究人员开始利用神经网络来提取特征。通过神经网络提取的特征能够更加有效的表征图片本身,而且能够很好的应对复杂场景下的感知混淆和感知偏差问题。但现有的基于深度学习的方法更多的是关注如何提取更加有效的特征,而忽略了相似性度量的重要性,并且这些方法往往将相似性度量和特征提取当作两个相互独立的环节,忽略了相似性度量的效果会受制于特征提取的有效性,同时相似性度量方法又最终决定了闭环检测的效果。因此,这种基于给定特征以及固定相似性度量的闭环检测方法很难突破检测精度和召回率的进一步提高。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于端到端度量网络的视觉SLAM闭环检测方法解决了现有的闭环检测方法大都将特征提取和相似性度量作为两个环节独立进行使得检测效果不能进一步优化的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种基于端到端度量网络的视觉SLAM闭环检测方法,包括以下步骤:
S1、对当前时刻的环境图像进行预处理,得到当前时刻的标准化图像;
S2、采用特征提取模型对历史时刻的标准化图像和当前时刻的标准化图像分别进行图像特征提取,得到两个图像的多层特征;
S3、采用两个图像的多层特征构建相似矩阵;
S4、采用卷积神经网络对相似矩阵进行进一步地特征提取,得到相似矩阵的特征图;
S5、构建相似性度量模型,将相似矩阵的特征图输入相似性度量模型进行历史时刻的环境图像与当前时刻的环境图像的相似度计算,并基于相似度,确定当前时刻的环境是否产生闭环。
进一步地:所述步骤S1包括以下分步骤:
S11、调整当前时刻的环境图像的尺寸,读取该图像并将其转换为张量格式图像;
S12、对张量格式图像进行标准化操作,得到当前时刻的标准化图像。
进一步地:步骤S12中标准化操作的具体公式为:
Figure BDA0002860824700000031
其中,imagestd为当前时刻的标准化图像,x为张量格式图像,μ为张量格式图像的均值,stddev为张量格式图像的标准方差。
进一步地:所述步骤S2中特征提取模型包括:第1卷积模块、第2卷积模块、第3卷积模块、第4卷积模块和第5卷积模块;
所述第1卷积模块、第2卷积模块、第3卷积模块、第4卷积模块和第5卷积模块依次连接;所述第1卷积模块的输入端作为特征提取模型的输入端;所述第5卷积模块的输出端作为特征提取模型的输出端;所述第1卷积模块、第2卷积模块和第5卷积模块均由卷积层和池化层构成;所述第3卷积模块和第4卷积模块由卷积层构成;所述第1卷积模块的卷积核大小为11×11;所述第2卷积模块、第3卷积模块和第4卷积模块的卷积核大小均为5×5;所述第5卷积模块的卷积核大小为3×3;所述第1卷积模块的卷积层的步长为4,所述第2卷积模块、第3卷积模块、第4卷积模块和第5卷积模块的卷积层的步长均为1;所述第1卷积模块的卷积层的卷积核个数为96,所述第2卷积模块的卷积层的卷积核个数为256,所述第3卷积模块的卷积层的卷积核个数为384,所述第4卷积模块的卷积层的卷积核个数为384,所述第5卷积模块的卷积层的卷积核个数为256;所述第1卷积模块、第2卷积模块和第5卷积模块的池化层均为最大池化层,其池化核的大小均为3×3,其步长均为2。
进一步地:所述第1卷积模块、第2卷积模块、第3卷积模块、第4卷积模块和第5卷积模块中的卷积层采用卷积核对输入数据进行特征提取的公式为:
Figure BDA0002860824700000041
其中,
Figure BDA0002860824700000042
为第l卷积模块的卷积层的第i个神经元上第j个特征图的输出特征,
Figure BDA0002860824700000043
为第l卷积模块的卷积层的卷积核,bj第j个特征图的偏置,Relu(·)为激活函数,a为第a个卷积核,m为卷积核的总数。
进一步地:所述第1卷积模块、第2卷积模块和第5卷积模块中的最大池化层进行特征压缩的公式为:
Figure BDA0002860824700000044
其中,
Figure BDA0002860824700000045
为最大池化层的输出,r为池化核的大小,yi,j为最大池化层的输入,
Figure BDA0002860824700000046
为第i个池化核内的最大值。
进一步地:所述步骤S3中构建相似矩阵的公式为:
Figure BDA0002860824700000047
其中,SMij为相似矩阵,F1,i为当前时刻的图像的多层特征,F2,j为历史时刻的图像的多层特征。
进一步地:所述步骤S4中卷积神经网络包括:第6卷积模块、第7卷积模块和第8卷积模块;
所述第6卷积模块和第7卷积模块均由卷积层和池化层构成;所述第8卷积模块由卷积层构成;所述第6卷积模块、第7卷积模块和第8卷积模块的卷积核尺寸为3×3;所述第6卷积模块的卷积核的数量为64;所述第7卷积模块的卷积核的数量为128;所述第8卷积模块的卷积核的数量为256;所述第6卷积模块和第7卷积模块的池化层均采用最大池化层,其池化核的大小均为3×3。
进一步地:所述步骤S5中相似性度量模型包括:第9卷积模块、第10卷积模块、第11卷积模块、拼接层、第一全连接层、第二全连接层和第三全连接层;
所述第9卷积模块、第10卷积模块、第11卷积模块、拼接层、第一全连接层、第二全连接层和第三全连接层依次连接;所述第9卷积模块的输入端作为相似性度量模型的输入端;所述第三全连接层的输出端作为相似性度量模型的输出端;所述第9卷积模块、第10卷积模块和第11卷积模块的卷积核尺寸均为3×3;所述第一全连接层和第二全连接层均包含1024个神经元。
进一步地:所述步骤S5包括以下分步骤:
S51、构建相似性度量模型,将相似矩阵的特征图输入相似性度量模型中;
S52、采用第9卷积模块、第10卷积模块和第11卷积模块分别对相似矩阵的特征图进行全局最大池化、全局平均池化和全局标准差池化操作,得到第一池化特征图、第二池化特征图和第三池化特征图;
S53、采用拼接层对第一池化特征图、第二池化特征图和第三池化特征图进行拼接组合,得到池化特征向量;
S54、采用第一全连接层、第二全连接层和第三全连接层进行拟合相似函数,对池化特征向量进行回归计算,得到历史时刻的环境图像与当前时刻的环境图像的相似度,基于相似度,确定当前时刻的环境是否产生闭环。
综上,本发明的有益效果为:
1、一种基于端到端度量网络的视觉SLAM闭环检测方法,与现有的基于深度学习的闭环检测方法相比,利用神经网络代替传统的相似性度量方法,使得特征提取和相似性度量能够以一种端到端的方式进行联合优化,一方面使得提取到的特征对于闭环对和非闭环对更易区分,另一方面使得拟合得到的相似性度量函数能够更加全面的度量两张图像之间的相似度,而不仅仅局限在特征向量的角度或者长度上的相似性,提高了相似性度量的准确性。
2、利用图片对的特征构建相似矩阵,对图像的空间信息加以利用,进一步提高了闭环检测的精度。整个度量网络全部采用卷积层和全连接层构成,可以加快计算速度,进一步减少检测时间,提高检测效率。
附图说明
图1为一种基于端到端度量网络的视觉SLAM闭环检测方法的流程图;
图2为特征提取模型的结构示意图;
图3为构建的相似矩阵的具体流程图;
图4为相似性度量模型的结构示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,一种基于端到端度量网络的视觉SLAM闭环检测方法,包括以下步骤:
S1、对当前时刻的环境图像进行预处理,得到当前时刻的标准化图像;
步骤S1包括以下分步骤:
S11、调整当前时刻的环境图像的尺寸,读取该图像并将其转换为张量格式图像;
S12、对张量格式图像进行标准化操作,得到当前时刻的标准化图像。
在本实施例中,预处理过程为:
为了满足卷积神经网络对输入数据的尺度要求,每张RGB环境图像的大小调整为240×320,读取图像并转为240×320×3的张量之后,对每张环境图像采取标准化操作,标准化操作的具体公式为:
Figure BDA0002860824700000071
其中,imagestd为当前时刻的标准化图像,x为张量格式图像,μ为张量格式图像的均值,取值为[0.485,0.456,0.406],stddev为张量格式图像的标准方差,取值为[0.229,0.224,0.225]。
S2、采用特征提取模型对历史时刻的标准化图像和当前时刻的标准化图像分别进行图像特征提取,得到两个图像的多层特征;
如图2所示,步骤S2中特征提取模型包括:第1卷积模块、第2卷积模块、第3卷积模块、第4卷积模块和第5卷积模块;
所述第1卷积模块、第2卷积模块、第3卷积模块、第4卷积模块和第5卷积模块依次连接;
所述第1卷积模块的输入端作为特征提取模型的输入端;
所述第5卷积模块的输出端作为特征提取模型的输出端;
所述第1卷积模块、第2卷积模块和第5卷积模块均由卷积层和池化层构成;
所述第3卷积模块和第4卷积模块由卷积层构成;
所述第1卷积模块的卷积核大小为11×11;
所述第2卷积模块、第3卷积模块和第4卷积模块的卷积核大小均为5×5;
所述第5卷积模块的卷积核大小为3×3;
所述第1卷积模块的卷积层的步长为4,所述第2卷积模块、第3卷积模块、第4卷积模块和第5卷积模块的卷积层的步长均为1;
所述第1卷积模块的卷积层的卷积核个数为96,所述第2卷积模块的卷积层的卷积核个数为256,所述第3卷积模块的卷积层的卷积核个数为384,所述第4卷积模块的卷积层的卷积核个数为384,所述第5卷积模块的卷积层的卷积核个数为256;
所述第1卷积模块、第2卷积模块和第5卷积模块的池化层均为最大池化层,其池化核的大小均为3×3,步长均为2。
第1卷积模块、第2卷积模块、第3卷积模块、第4卷积模块和第5卷积模块中的卷积层采用卷积核对输入数据进行特征提取的公式为:
Figure BDA0002860824700000081
其中,
Figure BDA0002860824700000082
为第l卷积模块的卷积层的第i个神经元上第j个特征图的输出特征,
Figure BDA0002860824700000083
为第l卷积模块的卷积层的卷积核,bj第j个特征图的偏置,Relu(·)为激活函数,a为第a个卷积核,m为卷积核的总数。
第1卷积模块、第2卷积模块和第5卷积模块中的最大池化层进行特征压缩的公式为:
Figure BDA0002860824700000084
其中,
Figure BDA0002860824700000085
为最大池化层的输出,r为池化核的大小,yi,j为最大池化层的输入,
Figure BDA0002860824700000086
为第i个池化核内的最大值。
最大池化层实现对特征的压缩,去除冗余信息,并增加了特征的平移不变性。
S3、采用两个图像的多层特征构建相似矩阵;
步骤S3中构建相似矩阵的公式为:
Figure BDA0002860824700000091
其中,SMij为相似矩阵,F1,i为当前时刻的图像的多层特征,F2,j为历史时刻的图像的多层特征。
在本实施例中,经过步骤S2后,得到多层特征的大小为256×14×19,为了对图像的空间信息加以利用,并构建区域到区域之间的相似矩阵,将历史时刻的多层特征和当前时刻的多层特征分别调整为256×266的大小,并分别记为F1,i和F2,j,然后由F1,i和F2,j计算得到相似矩阵SMij,大小为266×266,如图3所示,Xq、Xj这两个字符分别代表两张图片分别调整后的多层特征。
S4、采用卷积神经网络对相似矩阵进行进一步地特征提取,得到相似矩阵的特征图;
相似矩阵作为卷积神经网络的输入,大小调整为1×266×266。提取特征的网络由3个卷积阶段构成。经过卷积神经网络之后,得到相似矩阵的特征图大小为256×26×26。
步骤S4中卷积神经网络包括:第6卷积模块、第7卷积模块和第8卷积模块;
所述第6卷积模块和第7卷积模块均由卷积层和池化层构成;
所述第8卷积模块由卷积层构成;
所述第6卷积模块、第7卷积模块和第8卷积模块的卷积核尺寸为3×3;
所述第6卷积模块的卷积核的数量为64;
所述第7卷积模块的卷积核的数量为128;
所述第8卷积模块的卷积核的数量为256;
所述第6卷积模块和第7卷积模块的池化层均采用最大池化层,其池化核的大小均为3×3。
S5、构建相似性度量模型,将相似矩阵的特征图输入相似性度量模型进行历史时刻的环境图像与当前时刻的环境图像的相似度计算,并基于相似度,确定当前时刻的环境是否产生闭环。
如图4所示,步骤S5中相似性度量模型包括:第9卷积模块、第10卷积模块、第11卷积模块、拼接层、第一全连接层、第二全连接层和第三全连接层;
所述第9卷积模块、第10卷积模块、第11卷积模块、拼接层、第一全连接层、第二全连接层和第三全连接层依次连接;
所述第9卷积模块的输入端作为相似性度量模型的输入端;
所述第三全连接层的输出端作为相似性度量模型的输出端;
所述第9卷积模块、第10卷积模块和第11卷积模块的卷积核尺寸为3×3。
步骤S5包括以下分步骤:
S51、构建相似性度量模型,将相似矩阵的特征图输入相似性度量模型中;
S52、采用第9卷积模块、第10卷积模块和第11卷积模块分别对相似矩阵的特征图进行全局最大池化、全局平均池化和全局标准差池化操作,得到第一池化特征图、第二池化特征图和第三池化特征图,其中,三种池化方式的具体公式如下:
Figure BDA0002860824700000101
Figure BDA0002860824700000102
Figure BDA0002860824700000103
其中,xi,max为第一池化特征图,xi,avg为第二池化特征图,xi,var为第三池化特征图,
Figure BDA0002860824700000111
为第i个通道的特征图,max(·)为取最大值,i为第i个通道,j、k为相似矩阵的特征图的尺寸。
S53、采用拼接层对第一池化特征图、第二池化特征图和第三池化特征图进行拼接组合,得到池化特征向量;
在本实施例中,池化特征向量的大小为1×768。
S54、采用第一全连接层、第二全连接层和第三全连接层进行拟合相似函数,对池化特征向量进行回归计算,得到历史时刻的环境图像与当前时刻的环境图像的相似度,基于相似度,确定当前时刻的环境是否产生闭环。
利用三层全连接层来拟合相似函数。前两层全连接层包含1024个神经元,。采用Relu(·)作为激活函数,对卷积层的输出进行加权求和整合出更加抽象的数据特征。第三全连接层只包含一个神经元,采用Sigmoid(·)作为激活函数,输出为两张图片的相似性得分。通过设置合适的阈值,当相似性得分大于阈值时,则认为发生了闭环,小于阈值时,则认为不是闭环。在本实施例中,阈值设为0.5。

Claims (10)

1.一种基于端到端度量网络的视觉SLAM闭环检测方法,其特征在于,包括以下步骤:
S1、对当前时刻的环境图像进行预处理,得到当前时刻的标准化图像;
S2、采用特征提取模型对历史时刻的标准化图像和当前时刻的标准化图像分别进行图像特征提取,得到两个图像的多层特征;
S3、采用两个图像的多层特征构建相似矩阵;
S4、采用卷积神经网络对相似矩阵进行进一步地特征提取,得到相似矩阵的特征图;
S5、构建相似性度量模型,将相似矩阵的特征图输入相似性度量模型进行历史时刻的环境图像与当前时刻的环境图像的相似度计算,并基于相似度,确定当前时刻的环境是否产生闭环。
2.根据权利要求1所述的基于端到端度量网络的视觉SLAM闭环检测方法,其特征在于,所述步骤S1包括以下分步骤:
S11、调整当前时刻的环境图像的尺寸,读取该图像并将其转换为张量格式图像;
S12、对张量格式图像进行标准化操作,得到当前时刻的标准化图像。
3.根据权利要求2所述的基于端到端度量网络的视觉SLAM闭环检测方法,其特征在于,所述步骤S12中标准化操作的具体公式为:
Figure FDA0002860824690000011
其中,imagestd为当前时刻的标准化图像,x为张量格式图像,μ为张量格式图像的均值,stddev为张量格式图像的标准方差。
4.根据权利要求1所述的基于端到端度量网络的视觉SLAM闭环检测方法,其特征在于,所述步骤S2中特征提取模型包括:第1卷积模块、第2卷积模块、第3卷积模块、第4卷积模块和第5卷积模块;
所述第1卷积模块、第2卷积模块、第3卷积模块、第4卷积模块和第5卷积模块依次连接;所述第1卷积模块的输入端作为特征提取模型的输入端;所述第5卷积模块的输出端作为特征提取模型的输出端;所述第1卷积模块、第2卷积模块和第5卷积模块均由卷积层和池化层构成;所述第3卷积模块和第4卷积模块由卷积层构成;所述第1卷积模块的卷积核大小为11×11;所述第2卷积模块、第3卷积模块和第4卷积模块的卷积核大小均为5×5;所述第5卷积模块的卷积核大小为3×3;所述第1卷积模块的卷积层的步长为4,所述第2卷积模块、第3卷积模块、第4卷积模块和第5卷积模块的卷积层的步长均为1;所述第1卷积模块的卷积层的卷积核个数为96,所述第2卷积模块的卷积层的卷积核个数为256,所述第3卷积模块的卷积层的卷积核个数为384,所述第4卷积模块的卷积层的卷积核个数为384,所述第5卷积模块的卷积层的卷积核个数为256;所述第1卷积模块、第2卷积模块和第5卷积模块的池化层均为最大池化层,其池化核的大小均为3×3,其步长均为2。
5.根据权利要求4所述的基于端到端度量网络的视觉SLAM闭环检测方法,其特征在于,所述第1卷积模块、第2卷积模块、第3卷积模块、第4卷积模块和第5卷积模块中的卷积层采用卷积核对输入数据进行特征提取的公式为:
Figure FDA0002860824690000021
其中,
Figure FDA0002860824690000022
为第l卷积模块的卷积层的第i个神经元上第j个特征图的输出特征,
Figure FDA0002860824690000023
为第l卷积模块的卷积层的卷积核,bj第j个特征图的偏置,Relu(·)为激活函数,a为第a个卷积核,m为卷积核的总数。
6.根据权利要求4所述的基于端到端度量网络的视觉SLAM闭环检测方法,其特征在于,所述第1卷积模块、第2卷积模块和第5卷积模块中的最大池化层进行特征压缩的公式为:
Figure FDA0002860824690000031
其中,
Figure FDA0002860824690000032
为最大池化层的输出,r为池化核的大小,yi,j为最大池化层的输入,
Figure FDA0002860824690000033
为第i个池化核内的最大值。
7.根据权利要求1所述的基于端到端度量网络的视觉SLAM闭环检测方法,其特征在于,所述步骤S3中构建相似矩阵的公式为:
Figure FDA0002860824690000034
其中,SMij为相似矩阵,F1,i为当前时刻的图像的多层特征,F2,j为历史时刻的图像的多层特征。
8.根据权利要求1所述的基于端到端度量网络的视觉SLAM闭环检测方法,其特征在于,所述步骤S4中卷积神经网络包括:第6卷积模块、第7卷积模块和第8卷积模块;
所述第6卷积模块和第7卷积模块均由卷积层和池化层构成;所述第8卷积模块由卷积层构成;所述第6卷积模块、第7卷积模块和第8卷积模块的卷积核尺寸为3×3;所述第6卷积模块的卷积核的数量为64;所述第7卷积模块的卷积核的数量为128;所述第8卷积模块的卷积核的数量为256;所述第6卷积模块和第7卷积模块的池化层均采用最大池化层,其池化核的大小均为3×3。
9.根据权利要求1所述的基于端到端度量网络的视觉SLAM闭环检测方法,其特征在于,所述步骤S5中相似性度量模型包括:第9卷积模块、第10卷积模块、第11卷积模块、拼接层、第一全连接层、第二全连接层和第三全连接层;
所述第9卷积模块、第10卷积模块、第11卷积模块、拼接层、第一全连接层、第二全连接层和第三全连接层依次连接;所述第9卷积模块的输入端作为相似性度量模型的输入端;所述第三全连接层的输出端作为相似性度量模型的输出端;所述第9卷积模块、第10卷积模块和第11卷积模块的卷积核尺寸均为3×3;所述第一全连接层和第二全连接层均包含1024个神经元。
10.根据权利要求9所述的基于端到端度量网络的视觉SLAM闭环检测方法,其特征在于,所述步骤S5包括以下分步骤:
S51、构建相似性度量模型,将相似矩阵的特征图输入相似性度量模型中;
S52、采用第9卷积模块、第10卷积模块和第11卷积模块分别对相似矩阵的特征图进行全局最大池化、全局平均池化和全局标准差池化操作,得到第一池化特征图、第二池化特征图和第三池化特征图;
S53、采用拼接层对第一池化特征图、第二池化特征图和第三池化特征图进行拼接组合,得到池化特征向量;
S54、采用第一全连接层、第二全连接层和第三全连接层进行拟合相似函数,对池化特征向量进行回归计算,得到历史时刻的环境图像与当前时刻的环境图像的相似度,基于相似度,确定当前时刻的环境是否产生闭环。
CN202011566515.XA 2020-12-25 2020-12-25 一种基于端到端度量网络的视觉slam闭环检测方法 Active CN112766305B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011566515.XA CN112766305B (zh) 2020-12-25 2020-12-25 一种基于端到端度量网络的视觉slam闭环检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011566515.XA CN112766305B (zh) 2020-12-25 2020-12-25 一种基于端到端度量网络的视觉slam闭环检测方法

Publications (2)

Publication Number Publication Date
CN112766305A true CN112766305A (zh) 2021-05-07
CN112766305B CN112766305B (zh) 2022-04-22

Family

ID=75694678

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011566515.XA Active CN112766305B (zh) 2020-12-25 2020-12-25 一种基于端到端度量网络的视觉slam闭环检测方法

Country Status (1)

Country Link
CN (1) CN112766305B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113610099A (zh) * 2021-08-26 2021-11-05 吉林大学 一种环境感知方法及系统
CN115017021A (zh) * 2022-05-26 2022-09-06 杭州电子科技大学 一种视觉功能块执行时间预测方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109443382A (zh) * 2018-10-22 2019-03-08 北京工业大学 基于特征提取与降维神经网络的视觉slam闭环检测方法
CN109682385A (zh) * 2018-11-05 2019-04-26 天津大学 一种基于orb特征的即时定位与地图构建的方法
US20190219401A1 (en) * 2018-01-12 2019-07-18 The Trustees Of The University Of Pennsylvania Probabilistic data association for simultaneous localization and mapping
WO2019180414A1 (en) * 2018-03-20 2019-09-26 University Of Essex Enterprises Limited Localisation, mapping and network training
CN110555881A (zh) * 2019-08-29 2019-12-10 桂林电子科技大学 一种基于卷积神经网络的视觉slam测试方法
CN110781790A (zh) * 2019-10-19 2020-02-11 北京工业大学 基于卷积神经网络与vlad的视觉slam闭环检测方法
CN110880010A (zh) * 2019-07-05 2020-03-13 电子科技大学 基于卷积神经网络的视觉slam闭环检测算法
CN111241986A (zh) * 2020-01-08 2020-06-05 电子科技大学 一种基于端到端关系网络的视觉slam闭环检测方法
CN111553193A (zh) * 2020-04-01 2020-08-18 东南大学 一种基于轻量级深层神经网络的视觉slam闭环检测方法
CN111753752A (zh) * 2020-06-28 2020-10-09 重庆邮电大学 基于卷积神经网络多层特征融合的机器人闭环检测方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190219401A1 (en) * 2018-01-12 2019-07-18 The Trustees Of The University Of Pennsylvania Probabilistic data association for simultaneous localization and mapping
WO2019180414A1 (en) * 2018-03-20 2019-09-26 University Of Essex Enterprises Limited Localisation, mapping and network training
CN109443382A (zh) * 2018-10-22 2019-03-08 北京工业大学 基于特征提取与降维神经网络的视觉slam闭环检测方法
CN109682385A (zh) * 2018-11-05 2019-04-26 天津大学 一种基于orb特征的即时定位与地图构建的方法
CN110880010A (zh) * 2019-07-05 2020-03-13 电子科技大学 基于卷积神经网络的视觉slam闭环检测算法
CN110555881A (zh) * 2019-08-29 2019-12-10 桂林电子科技大学 一种基于卷积神经网络的视觉slam测试方法
CN110781790A (zh) * 2019-10-19 2020-02-11 北京工业大学 基于卷积神经网络与vlad的视觉slam闭环检测方法
CN111241986A (zh) * 2020-01-08 2020-06-05 电子科技大学 一种基于端到端关系网络的视觉slam闭环检测方法
CN111553193A (zh) * 2020-04-01 2020-08-18 东南大学 一种基于轻量级深层神经网络的视觉slam闭环检测方法
CN111753752A (zh) * 2020-06-28 2020-10-09 重庆邮电大学 基于卷积神经网络多层特征融合的机器人闭环检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHENYANG ZHAO等: "End-To-End Visual Place Recognition Based on Deep Metric Learning and Self-Adaptively Enhanced Similarity Metric", 《2019 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP)》 *
WEIQIZHANG等: "Learning second-order statistics for place recognition based on robust covariance estimation of CNN features", 《NEUROCOMPUTING》 *
吴奇: "室内复杂环境下基于闭环检测技术优化的SLAM算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113610099A (zh) * 2021-08-26 2021-11-05 吉林大学 一种环境感知方法及系统
CN113610099B (zh) * 2021-08-26 2024-02-02 吉林大学 一种环境感知方法及系统
CN115017021A (zh) * 2022-05-26 2022-09-06 杭州电子科技大学 一种视觉功能块执行时间预测方法及系统
CN115017021B (zh) * 2022-05-26 2024-05-14 杭州电子科技大学 一种视觉功能块执行时间预测方法及系统

Also Published As

Publication number Publication date
CN112766305B (zh) 2022-04-22

Similar Documents

Publication Publication Date Title
CN108108764B (zh) 一种基于随机森林的视觉slam回环检测方法
CN111814661B (zh) 基于残差-循环神经网络的人体行为识别方法
CN106599830B (zh) 人脸关键点定位方法及装置
WO2020228446A1 (zh) 模型训练方法、装置、终端及存储介质
CN110033002B (zh) 基于多任务级联卷积神经网络的车牌检测方法
CN111709311B (zh) 一种基于多尺度卷积特征融合的行人重识别方法
CN113065558A (zh) 一种结合注意力机制的轻量级小目标检测方法
CN107451565B (zh) 一种半监督小样本深度学习图像模式分类识别方法
Xia et al. Loop closure detection for visual SLAM using PCANet features
CN114187450A (zh) 一种基于深度学习的遥感图像语义分割方法
CN112766305B (zh) 一种基于端到端度量网络的视觉slam闭环检测方法
CN112200121B (zh) 基于evm和深度学习的高光谱未知目标检测方法
CN112766229B (zh) 基于注意力机制的人脸点云图像智能识别系统及方法
CN112364931A (zh) 基于元特征和权重调整的少样本目标检测方法及网络模型
CN110880010A (zh) 基于卷积神经网络的视觉slam闭环检测算法
CN108133235A (zh) 一种基于神经网络多尺度特征图的行人检测方法
CN110533661A (zh) 基于图像特征级联的自适应实时闭环检测方法
CN110895697A (zh) 变压器铭牌信息采集方法及智能采集系统
CN114398972A (zh) 一种基于联合表示注意力机制的深度学习图像匹配方法
CN116012653A (zh) 一种注意力残差单元神经网络高光谱图像分类方法及系统
CN114861761A (zh) 一种基于孪生网络特征与几何验证的回环检测方法
CN112418262A (zh) 车辆再识别的方法、客户端及系统
CN115049842B (zh) 一种飞机蒙皮图像损伤检测与2d-3d定位方法
CN116580279A (zh) 基于混合自注意力机制的番茄病害检测方法及系统
CN113128460B (zh) 基于知识蒸馏的多分辨率行人重识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant