CN109165680B - 基于视觉slam的室内场景下单一目标物体字典模型改进方法 - Google Patents

基于视觉slam的室内场景下单一目标物体字典模型改进方法 Download PDF

Info

Publication number
CN109165680B
CN109165680B CN201810860165.4A CN201810860165A CN109165680B CN 109165680 B CN109165680 B CN 109165680B CN 201810860165 A CN201810860165 A CN 201810860165A CN 109165680 B CN109165680 B CN 109165680B
Authority
CN
China
Prior art keywords
target object
camera
single target
dictionary
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810860165.4A
Other languages
English (en)
Other versions
CN109165680A (zh
Inventor
张小国
刘启汉
郑冰清
王慧青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201810860165.4A priority Critical patent/CN109165680B/zh
Publication of CN109165680A publication Critical patent/CN109165680A/zh
Application granted granted Critical
Publication of CN109165680B publication Critical patent/CN109165680B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/80Analysis of captured images to determine intrinsic or extrinsic camera parameters, i.e. camera calibration

Abstract

本发明公开了一种基于视觉SLAM的室内场景下单一目标物体字典模型改进方法:对于进行视觉SLAM的单目或双目相机进行基础标定,获得内参信息后对环境进行检测和前端同步定位与建图,得到点云地图;根据周边环境与单一目标物体相关特征制作图片数据集,利用DBoW2库k‑means++算法生成数据集对应的单词;进行TF‑IDF相似度计算划分单词权值,设定阈值,进行归零化处理,得到单一目标物体字典改进模型;将该改进模型结合到SLAM系统的后端优化中,通过对点云地图点在图像帧上的投影与实际像素坐标进行最小化投影误差。本发明优化了在室内场景下对于单一目标物体的回环检测的发现与点云地图的闭环融合,为一些类别环境下特定单一目标物体的同步定位与建图提供了较大的便利。

Description

基于视觉SLAM的室内场景下单一目标物体字典模型改进方法
技术领域
本发明涉及图像处理方法,尤其涉及一种基于视觉SLAM的室内场景下单一目标物体字典模型改进方法。
背景技术
随着我国经济的快速发展与工业水平的提升,对于进一步提升生产力水平的需求愈为迫切,因此一系列自动化程度较高的机器人在诸多行业的应用都取得了长足进步。由于视觉SLAM技术对于设备的要求不高、成本较低并且在室内定位与建图精度良好,能够帮助机器人快速识别周边环境与特定物体,因此例如在室内家务机器人、快递自动分拣机器人、工业装配机器人等等领域均有广泛的应用。
与此同时,当前的视觉SLAM技术受限于对室内家务、快递分拣等场景的细化研究不足,导致对物体的处理仍较多关注于点、边等局部特征,对于物体类别、结构等信息的关注不足。对于物体语义类别划分与相互联系的视觉SLAM系统的研究目前正处于初步阶段,由于各类工业应用场景的不同,导致指定类别划分的方法也不尽相同,还未能有可产业化的算法。因此研究在室内场景下结合目标物体信息的兼顾效率与准确度的视觉SLAM算法的需求日益凸显。
发明内容
发明目的:针对现有技术存在的问题,本发明的目的在于提供一种能够解决室内场景下现有开源视觉SLAM算法存在跟踪目标时易丢失、复杂场景下的实时性不足、工作效率不高并且易受环境因素影响而精度不高等问题的基于视觉SLAM的室内场景下单一目标物体字典模型改进方法,为一些类别环境下的特定单一目标物体的同步定位与建图提供了较大的便利。
技术方案:一种基于视觉SLAM的室内场景下单一目标物体字典模型改进方法,包括如下步骤:
(1)对于进行视觉SLAM的单目或双目相机进行基础标定,获得内参信息后利用该相机对环境进行检测并进行前端同步定位与建图,通过三维特征点得到未经过后端优化的点云地图;
(2)根据周边环境与单一目标物体相关特征制作图片数据集,并利用DBoW2库k-means++算法生成数据集对应的单词,为室内场景下视觉SLAM对单一目标物体建立的点云地图进行回环检测做准备;
(3)针对单一目标物体生成的单词进行TF-IDF相似度计算划分单词权值,根据对检测周边环境闭环贡献程度的高低设定阈值,对于与单一目标物体有关的部分单词进行归零化处理,得到单一目标物体字典改进模型;
(4)将改进后的字典模型结合到SLAM系统的后端优化中,通过对点云地图点在图像帧上的投影与实际像素坐标进行最小化投影误差,优化在室内场景下对于单一目标物体的回环检测的发现与点云地图的闭环融合,提高定位与建图精度。
所述步骤(1)中,对一台单目相机进行标定,获得内参信息,同时通过视觉SLAM前端进行同步定位与建图,具体步骤为:
(1.1)以环境内的一张黑白棋盘格作为标定物,通过调整标定物与各个相机的方向,为标定物拍摄一些不同方向的照片,并从照片中提取棋盘格角点;
(1.2)设周边环境中某空间点P的相机坐标为[X,Y,Z]T,其中,X,Y,Z分别为相机在三维空间立体坐标系中的坐标,则在相机模型中根据三角形相似关系得到成像平面内对应成像点P′坐标为
Figure BDA0001749444120000021
f为相机焦距;
将该点转换到像素坐标[U,V],有
Figure BDA0001749444120000022
K即为相机内参矩阵;
根据实际情况,合理选择校正参数k1、k2、p1、p2、p3,对相机基础标定的计算中的径向畸变与切向畸变进行纠正;
(1.3)获得标定相机的内参后,使用相机并利用视觉SLAM软件前端对周边环境进行同时定位与建图。首先由相机拍摄得到关键帧序列设为{Fkey},根据关键帧提取得到图像的特征点;其次通过前后两帧关键帧图像构建对极约束;最后根据相机位姿的变化,通过对极几何约束与特征点投影对周边环境进行定位与建图。
所述步骤(2)具体包括:
(2.1)使用相机拍摄包含单一目标物体的环境视频,并将视频转化为视频图像帧,构建初步的图片数据集;
(2.2)提取每幅图像帧的ORB特征点,筛选生成关键帧,通过筛选具有代表性的图像帧即关键帧,降低数据集的容量,提升后续步骤中生成单词与进行回环检测的效率。所述筛选生成关键帧需满足如下任一条件:
1)若继上一次筛选得到关键帧后,又过了N1帧;
2)当前无筛选得到的关键帧,或已有N2帧的图像帧被丢弃;
3)当前图像帧帧处理得到大于M个ORB特征点;
4)当前图像帧特征点与前一关键帧的相似度不超过S;
N1、N2、M、S为常数变量,可根据不同的单一目标物体场景提前设定成不同数值,其中S优选设置为0.85。
(2.3)通过图片数据集利用DBoW2库k-means++算法生成数据集对应的单词,具体为在每张关键帧图片中随机选取一个特征为初始聚类中心,通过计算图片中每一个特征点与当前已有聚类中心的最短距离D(x)来进一步得到每个特征点被选为下一个聚类中心的概率P(x);按照轮盘法则选择下一个聚类中心,若聚类中心数量达到设定的阈值k则完成字典词袋的生成,若未达到则继续聚类;每一个聚类中心即为字典中的一个单词。
所述步骤(3)具体包括:
(3.1)对于图片数据集中图片经过筛选得到的单词通过TF-IDF相似度计算划分权值:
Figure BDA0001749444120000031
其中,IDFi表示字典中某聚类中心叶子节点即单词ωi中特征数量ni相对于所有特征数量n的比值,表示某单词在字典中出现的频率;
Figure BDA0001749444120000032
TFi表示某特征在一张图片中出现的频率,n为该图片中出现单词的总个数,ni为单词ωi在该图片中呈现的次数;进而可得ωi在字典中的权重为:
ηi=TFi×IDFi
(3.2)在图片数据集中对任意一张图片I,通过对应的单词以及单词的权重构建向量
Figure BDA0001749444120000034
描述该图像I,表达式如下:
Figure BDA0001749444120000033
通过对比数据集中任两张图片的向量来比较两者的相似性:
Figure BDA0001749444120000041
若s(v1,v2)<ps,其中ps为相似度阈值,则在这两张图片中比较图片权重向量模值
Figure BDA0001749444120000042
将其中权重模值
Figure BDA0001749444120000043
较小的图片剔除;之后重新计算剔除相似图片后的图片数据集的单词以及单词权重;通过该步骤选取图片数据集中更具代表性的图片,可以进一步降低改进字典模型所选取字典的复杂度。
(3.3)生成的字典中,对于单一目标物体,考虑其在周边环境中出现频率较高,对于检测到周边环境闭环的贡献较低,进行如下运算:
若有:ηi=TFi×IDFi≤P
则:ηi=0
其中,P为可调整的单词权重阈值;通过对权值较低的单词进行归零化处理来提升字典对于闭环检测相似度计算的准确性。
所述步骤(4)具体包括:
(4.1)在应用改进字典模型的后端优化中,对于图像中的三维点P点,在单目的视觉SLAM系统中通过拥有7个自由度,即1个尺度因子、3个旋转角度和3个位移的三维点坐标以及位姿变化Sim3相似变换群,在检测到闭环条件进行优化时,对其相似变换群进行优化;在应用改进字典模型的后端优化中相机检测到闭环并进行尺度相似变换后,进行闭环融合,融合重复的点云,在CovisibilityGraph图优化中插入新的边以连接闭环;
(4.2)在应用改进字典模型的后端优化中发现闭环并进行后端优化后,对于相机的相对位姿与特征点空间位置进行基于局部集束调整(LocalBundleAdjustment)的最优调整;
设相机在运动中对于周边环境的观测方程为zk,j=h(yj,xk,vk,j),其中,zk,j表示传感器于xk位置观测到路标yj时产生的观测数据,vk,j为噪声;由于噪声的存在并不完全成立,将观测误差写成:
ekj=z-h(yj,xk,vk,j)
将其他时刻的误差一并考虑进来,考虑最小二乘模型,则整体误差即代价函数为:
Figure BDA0001749444120000044
求解上式,对相机姿态和特征点空间位置做出最优调整。
有益效果:本发明提供了一种基于视觉SLAM拓展的室内场景下单一目标物体字典模型改进方案,为一些类别环境下的特定单一目标物体的同步定位与建图提供了较大的便利。以单一目标物体为例,对特定目标物体的特征创建字典,结合目标物体信息改进DBoW2算法调整字典权重计算方式,将其应用到SLAM系统的回环检测中。首先对于相机进行基础标定,获得内参等信息后进行局部定位与建图工作,通过三维特征点得到未经过后端优化的点云地图;之后通过相机采集周边环境与单一目标物体相关的图片数据集,并利用DBoW2库k-means++算法生成数据集对应的单词;针对单一目标物体生成的单词进行TF-IDF相似度计算划分单词权值,根据对检测周边环境闭环贡献程度的高低设定阈值,对于与单一目标物体有关的部分单词进行归零化处理;最后将改进后的字典模型结合到SLAM系统的后端优化中,优化在室内场景下对于单一目标物体的回环检测的发现与点云地图的闭环融合,提高定位与建图精度。
附图说明
图1为本发明的方法流程示意图;
图2为相机相对位姿对极约束示意图;
图3为k-means++算法流程图:
图4为改进字典示意图。
具体实施方式
以下结合附图和具体实施例对本发明中的关键技术和具体实现方法进行详细说明。
如图所示为本发明的方法流程示意图。
步骤S1:对一台单目进行基础标定,获得内参等信息,同时通过视觉SLAM前端进行同步定位与建图。具体包括:
S1.1、以环境内的一张黑白棋盘格作为标定物,通过调整标定物与各个相机的方向,为标定物拍摄一些不同方向的照片,并从照片中提取棋盘格角点;
S1.2、设周边环境中某空间点P的相机坐标为[X,Y,Z]T,X,Y,Z分别为相机在三维空间立体坐标系中的坐标。那么在相机模型中根据三角形相似关系得到成像平面内对应成像点P′坐标为
Figure BDA0001749444120000051
f为相机焦距。之后将该点转换到像素坐标[U,V],有
Figure BDA0001749444120000061
K即为相机内参矩阵。根据实际情况,合理选择校正参数k1、k2、p1、p2、p3,对相机基础标定的计算中的径向畸变与切向畸变进行纠正;
S1.3、获得标定相机的内参后,使用相机并利用视觉SLAM软件前端对周边环境进行同时定位与建图。首先由相机拍摄得到关键帧序列设为{Fkey},根据关键帧提取得到图像的特征点;其次通过前后两帧关键帧图像构建对极约束,如图2所示;其中,O1,O2是相机的光心,I1,I2是相机前后两帧拍摄到的图片,P是周围环境中相机在前后两帧共同观测到的一个特征点,分别投影在I1的p1点上和I2的p2点上,根据对极几何约束可以求解相机的位姿,具体过程如下:
设空间点P在相机O1下的坐标:
P=[X,Y,Z]
根相机模型,可以获得p1,p2的像素坐标:
Figure BDA0001749444120000062
其中,Z1、Z2为特征点P与相机的深度距离;K为相机的内参矩阵;R为相机在两帧间相对运动的3x3旋转矩阵;t为两帧间相对运动的3x1平移矩阵。通过矩阵间运算的求解,可以得到:
Figure BDA0001749444120000063
最后根据相机位姿的变化,通过对极几何约束与特征点投影对周边环境进行定位与建图。
步骤S2:根据单一目标物体的相关特征制作图片数据集,之后通过图片数据集利用DBoW2库k-means++算法生成数据集对应的单词,为室内场景下视觉SLAM对单一目标物体建立的点云地图进行回环检测做准备。具体包括:
S2.1、使用相机拍摄包含单一目标物体的环境视频,并将视频转化为视频图像帧,构建初步的图片数据集。;
S2.2、在初步处理得到的图片数据集中,提取每幅图像帧的ORB特征点,通过筛选具有代表性的图像帧即关键帧,降低数据集的容量,提升后续步骤中生成单词与进行回环检测的效率。筛选生成关键帧所满足的具体条件如下:
(1)若继上一次帅选得到关键帧后,又过了N1帧;
(2)当前无筛选得到的关键帧,或已有N2帧的图像帧被丢弃;
(3)当前图像帧帧处理得到大于M个ORB特征点;
(4)当前图像帧特征点与前一关键帧的相似度不超过S;
S2.3、通过图片数据集利用DBoW2库k-means++算法生成数据集对应的单词。其方法为在每张关键帧图片中随机选取一个特征为初始聚类中心,通过计算图片中每一个特征点与当前已有聚类中心的最短距离D(x)来进一步得到每个特征点被选为下一个聚类中心的概率P(x)。之后按照轮盘法则选择下一个聚类中心,若聚类中心数量达到设定的阈值k则完成字典词袋的生成,若未达到则继续聚类。每一个聚类中心即为字典中的一个单词。
步骤S3:针对单一目标物体生成的单词进行TF-IDF相似度计算划分单词权值,根据对检测周边环境闭环贡献程度的高低设定阈值,对于与单一目标物体有关的部分单词进行归零化处理。具体包括:
S3.1、对于图片数据集中图片经过筛选得到的单词通过TF-IDF相似度计算划分权值。
Figure BDA0001749444120000071
其中,IDFi表示字典中某聚类中心叶子节点即单词ωi中特征数量ni相对于所有特征数量n的比值,简而言之即为某单词在字典中出现的频率;
Figure BDA0001749444120000072
TFi表示某特征在一张图片中出现的频率,n为该图片中出现单词的总个数,ni为单词ωi在该图片中呈现的次数。
进而可得ωi在字典中的权重为
ηi=TFi×IDFi
S3.2、在图片数据集中对任意一张图片I,通过对应的单词以及单词的权重构建向量
Figure BDA0001749444120000073
描述该图像I,表达式如下:
Figure BDA0001749444120000074
通过对比数据集中任两张图片的向量来比较两者的相似性:
Figure BDA0001749444120000075
若s(v1,v2)<ps,其中ps为相似度阈值,则在这两张图片中比较图片权重向量模值
Figure BDA0001749444120000081
将其中权重模值
Figure BDA0001749444120000082
较小的图片剔除。之后重新计算剔除相似图片后的图片数据集的单词以及单词权重。通过该步骤选取图片数据集中更具代表性的图片,可以进一步降低改进字典模型所选取字典的复杂度。
S3.3、生成的字典中,对于单一目标物体,考虑其在周边环境中出现频率较高,对于检测到周边环境闭环的贡献较低,故可以进行如下运算:
若有:ηi=TFi×IDFi≤P
则:ηi=0
其中P为可调整的单词权重阈值。通过对权值较低的单词进行归零化处理来提升字典对于闭环检测相似度计算的准确性。如图4所示为改进后生成的字典,
图中每一行起始数字为节点的编号;中间数字为ORB特征向量,TXT文件中为十进制显示,格式为CV_8U;每一行最后一个单精度浮点数即表示该节点单词的权重。
步骤S4:将改进后的字典模型结合到SLAM系统的后端优化中,通过对点云地图点在图像帧上的投影与实际像素坐标进行最小化投影误差,优化在室内场景下对于单一目标物体的回环检测的发现与点云地图的闭环融合,提高定位与建图精度。具体包括:
S4.1、在应用改进字典模型的后端优化中,对于图像中的三维点P点,在单目的视觉SLAM系统中通过拥有7个自由度,即1个尺度因子、3个旋转角度和3个位移的三维点坐标以及位姿变化Sim3相似变换群,在检测到闭环条件进行优化时,对其相似变换群进行优化。在应用改进字典模型的后端优化中相机检测到闭环并进行尺度相似变换后,进行闭环融合,融合重复的点云,在Covisibility Graph图优化中插入新的边以连接闭环。
S4.2、在应用改进字典模型的后端优化中发现闭环并进行后端优化后,对于相机的相对位姿与特征点空间位置进行基于局部集束调整(Local Bundle Adjustment)的最优调整。
设相机在运动中对于周边环境的观测方程为zk,j=h(yj,xk,vk,j),其中zk,j表示传感器于xk位置观测到路标yj时产生的观测数据,vk,j为噪声。由于噪声的存在并不完全成立,观测误差可写成:
ekj=z-h(yj,xk,vk,j)
将其他时刻的误差一并考虑进来,考虑最小二乘模型,则整体误差即代价函数为:
Figure BDA0001749444120000091
通过对该式的求解,即可对相机姿态和特征点空间位置做出最优调整。
如表1所示为改进字典模型的ORB-SLAM2算法与未改进字典模型ORB-SLAM2算法在针对单一目标物体电脑的自制数据集中各项数据的对比:
表1
Figure BDA0001749444120000092

Claims (5)

1.一种基于视觉SLAM的室内场景下单一目标物体字典模型改进方法,其特征在于,包括如下步骤:
(1)对于进行视觉SLAM的单目或双目相机进行基础标定,获得内参信息后利用该相机对环境进行检测并进行前端同步定位与建图,通过三维特征点得到未经过后端优化的点云地图;
(2)根据周边环境与单一目标物体相关特征制作图片数据集,并利用DBoW2库k-means++算法生成数据集对应的单词;
(3)针对单一目标物体生成的单词进行TF-IDF相似度计算划分单词权值,根据对检测周边环境闭环贡献程度的高低设定阈值,对于与单一目标物体有关的部分单词进行归零化处理,得到单一目标物体字典改进模型,具体包括:
(3.1)对于图片数据集中图片经过筛选得到的单词通过TF-IDF相似度计算划分权值:
Figure FDA0003683428300000011
其中,IDFi表示字典中某聚类中心叶子节点即单词ωi中特征数量ni相对于所有特征数量n的比值,表示某单词在字典中出现的频率;
Figure FDA0003683428300000012
TFi表示某特征在一张图片中出现的频率,n为该图片中出现单词的总个数,ni为单词ωi在该图片中呈现的次数;进而得到ωi在字典中的权重为:
ηi=TFi×IDFi
(3.2)在图片数据集中对任意一张图片I,通过对应的单词以及单词的权重构建向量
Figure FDA0003683428300000013
描述该图像I,表达式如下:
Figure FDA0003683428300000014
通过对比数据集中任两张图片的向量来比较两者的相似性:
Figure FDA0003683428300000015
若s(v1,v2)<ps,其中ps为相似度阈值,则在这两张图片中比较图片权重向量模值
Figure FDA0003683428300000016
将其中权重模值
Figure FDA0003683428300000017
较小的图片剔除;之后重新计算剔除相似图片后的图片数据集的单词以及单词权重;
(3.3)生成的字典中,对于单一目标物体,考虑其在周边环境中出现频率较高,对于检测到周边环境闭环的贡献较低,进行如下运算:
若有:ηi=TFi×IDFi≤P
则:ηi=0
其中,P为可调整的单词权重阈值;
(4)将改进后的字典模型结合到SLAM系统的后端优化中,通过对点云地图点在图像帧上的投影与实际像素坐标进行最小化投影误差。
2.根据权利要求1所述的基于视觉SLAM的室内场景下单一目标物体字典模型改进方法,其特征在于,所述步骤(1)中,对一台单目相机进行标定,获得内参信息,同时通过视觉SLAM前端进行同步定位与建图,具体步骤为:
(1.1)以环境内的一张黑白棋盘格作为标定物,通过调整标定物与各个相机的方向,为标定物拍摄一些不同方向的照片,并从照片中提取棋盘格角点;
(1.2)设周边环境中某空间点P的相机坐标为[X,Y,Z]T,其中,X,Y,Z分别为相机在三维空间立体坐标系中的坐标,则在相机模型中根据三角形相似关系得到成像平面内对应成像点P′坐标为
Figure FDA0003683428300000021
f为相机焦距;
将该点转换到像素坐标[U,V],有
Figure FDA0003683428300000022
K即为相机内参矩阵;
根据实际情况,合理选择校正参数k1、k2、p1、p2、p3,对相机基础标定的计算中的径向畸变与切向畸变进行纠正;
(1.3)由相机拍摄得到关键帧序列设为{Fkey},根据关键帧提取得到图像的特征点;其次通过前后两帧关键帧图像构建对极约束;最后根据相机位姿的变化,通过对极几何约束与特征点投影对周边环境进行定位与建图。
3.根据权利要求1所述的基于视觉SLAM的室内场景下单一目标物体字典模型改进方法,其特征在于,所述步骤(2)具体包括:
(2.1)使用相机拍摄包含单一目标物体的环境视频,并将视频转化为视频图像帧,构建初步的图片数据集;
(2.2)提取每幅图像帧的ORB特征点,筛选生成关键帧;所述筛选生成关键帧需满足如下任一条件:
1)若继上一次筛选得到关键帧后,又过了N1帧;
2)当前无筛选得到的关键帧,或已有N2帧的图像帧被丢弃;
3)当前图像帧帧处理得到大于M个ORB特征点;
4)当前图像帧特征点与前一关键帧的相似度不超过S;
N1、N2、M、S为常数变量,根据不同的单一目标物体场景提前设定;
(2.3)在每张关键帧图片中随机选取一个特征为初始聚类中心,通过计算图片中每一个特征点与当前已有聚类中心的最短距离D(x)来进一步得到每个特征点被选为下一个聚类中心的概率P(x);按照轮盘法则选择下一个聚类中心,若聚类中心数量达到设定的阈值k则完成字典词袋的生成,若未达到则继续聚类;每一个聚类中心即为字典中的一个单词。
4.根据权利要求3所述的基于视觉SLAM的室内场景下单一目标物体字典模型改进方法,其特征在于:所述步骤(2.2)中,S设置为0.85。
5.根据权利要求1所述的基于视觉SLAM的室内场景下单一目标物体字典模型改进方法,其特征在于,所述步骤(4)具体包括:
(4.1)在应用改进字典模型的后端优化中,对于图像中的三维点P点,在单目的视觉SLAM系统中通过拥有7个自由度,即1个尺度因子、3个旋转角度和3个位移的三维点坐标以及位姿变化Sim3相似变换群,在检测到闭环条件进行优化时,对其相似变换群进行优化;在应用改进字典模型的后端优化中相机检测到闭环并进行尺度相似变换后,进行闭环融合,融合重复的点云,在Covisibility Graph图优化中插入新的边以连接闭环;
(4.2)在应用改进字典模型的后端优化中发现闭环并进行后端优化后,对于相机的相对位姿与特征点空间位置进行基于局部集束调整的最优调整;
设相机在运动中对于周边环境的观测方程为zk,j=h(yj,xk,vk,j),其中,zk,j表示传感器于xk位置观测到路标yj时产生的观测数据,vk,j为噪声;由于噪声的存在并不完全成立,将观测误差写成:
ekj=z-h(yj,xk,vk,j)
将其他时刻的误差一并考虑进来,考虑最小二乘模型,则整体误差即代价函数为:
Figure FDA0003683428300000031
求解上式,对相机姿态和特征点空间位置做出最优调整。
CN201810860165.4A 2018-08-01 2018-08-01 基于视觉slam的室内场景下单一目标物体字典模型改进方法 Active CN109165680B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810860165.4A CN109165680B (zh) 2018-08-01 2018-08-01 基于视觉slam的室内场景下单一目标物体字典模型改进方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810860165.4A CN109165680B (zh) 2018-08-01 2018-08-01 基于视觉slam的室内场景下单一目标物体字典模型改进方法

Publications (2)

Publication Number Publication Date
CN109165680A CN109165680A (zh) 2019-01-08
CN109165680B true CN109165680B (zh) 2022-07-26

Family

ID=64898502

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810860165.4A Active CN109165680B (zh) 2018-08-01 2018-08-01 基于视觉slam的室内场景下单一目标物体字典模型改进方法

Country Status (1)

Country Link
CN (1) CN109165680B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111435086B (zh) * 2019-01-13 2022-03-25 北京魔门塔科技有限公司 基于拼接图的导航方法和装置
CN109855645A (zh) * 2019-03-27 2019-06-07 小驴机器人(武汉)有限公司 一种agv小车混合视觉导航方法
CN110068824B (zh) * 2019-04-17 2021-07-23 北京地平线机器人技术研发有限公司 一种传感器位姿确定方法和装置
CN112149471B (zh) * 2019-06-28 2024-04-16 北京初速度科技有限公司 一种基于语义点云的回环检测方法及装置
CN110514198B (zh) * 2019-08-28 2021-05-04 电子科技大学 一种基于计算机视觉技术的前后端架构地图定位方法
CN110853100B (zh) * 2019-10-24 2022-11-18 东南大学 一种基于改进点线特征的结构化场景视觉slam方法
CN111024078B (zh) * 2019-11-05 2021-03-16 广东工业大学 基于gpu加速的无人机视觉slam方法
CN111402331B (zh) * 2020-02-25 2023-03-28 华南理工大学 基于视觉词袋和激光匹配的机器人重定位方法
CN111368759B (zh) * 2020-03-09 2022-08-30 河海大学常州校区 基于单目视觉的移动机器人语义地图构建系统
CN112767546B (zh) * 2021-01-22 2022-08-02 湖南大学 移动机器人基于双目图像的视觉地图生成方法
CN113168717B (zh) * 2021-03-11 2023-03-03 华为技术有限公司 一种点云匹配方法及装置、导航方法及设备、定位方法、激光雷达

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105843925A (zh) * 2016-03-23 2016-08-10 中国科学技术大学 一种基于改进bow算法的相似图片搜索方法
CN106570884A (zh) * 2016-09-30 2017-04-19 天津大学 基于在线更新字典模型的目标跟踪方法
CN106909877A (zh) * 2016-12-13 2017-06-30 浙江大学 一种基于点线综合特征的视觉同时建图与定位方法
CN108230337A (zh) * 2017-12-31 2018-06-29 厦门大学 一种基于移动端的语义slam系统实现的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105843925A (zh) * 2016-03-23 2016-08-10 中国科学技术大学 一种基于改进bow算法的相似图片搜索方法
CN106570884A (zh) * 2016-09-30 2017-04-19 天津大学 基于在线更新字典模型的目标跟踪方法
CN106909877A (zh) * 2016-12-13 2017-06-30 浙江大学 一种基于点线综合特征的视觉同时建图与定位方法
CN108230337A (zh) * 2017-12-31 2018-06-29 厦门大学 一种基于移动端的语义slam系统实现的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于改进ORB的视觉SLAM闭环检测;王远配等;《中国科技论文》;20180715;第13卷(第14期);第1621-1653页 *

Also Published As

Publication number Publication date
CN109165680A (zh) 2019-01-08

Similar Documents

Publication Publication Date Title
CN109165680B (zh) 基于视觉slam的室内场景下单一目标物体字典模型改进方法
CN108648240B (zh) 基于点云特征地图配准的无重叠视场相机姿态标定方法
WO2020207512A1 (zh) 三维对象建模方法、图像处理方法、图像处理装置
CN108648215B (zh) 基于imu的slam运动模糊位姿跟踪算法
CN107833181B (zh) 一种基于变焦立体视觉的三维全景图像生成方法
CN110853100B (zh) 一种基于改进点线特征的结构化场景视觉slam方法
CN112598729B (zh) 融合激光与相机的目标物体识别与定位方法
CN107818598B (zh) 一种基于视觉矫正的三维点云地图融合方法
CN113298934B (zh) 一种基于双向匹配的单目视觉图像三维重建方法及系统
US11367195B2 (en) Image segmentation method, image segmentation apparatus, image segmentation device
WO2024045632A1 (zh) 基于双目视觉和imu的水下场景三维重建方法及设备
CN112767546B (zh) 移动机器人基于双目图像的视觉地图生成方法
CN107507232B (zh) 基于多尺度迭代的立体匹配方法
CN113361365B (zh) 定位方法和装置、设备及存储介质
CN112418288A (zh) 一种基于gms和运动检测的动态视觉slam方法
CN114022542A (zh) 一种基于三维重建的3d数据库制作方法
Byrne et al. Maximizing feature detection in aerial unmanned aerial vehicle datasets
CN116402978A (zh) 一种基于双目视觉结构特性的稠密三维重建方法
CN112150518A (zh) 一种基于注意力机制的图像立体匹配方法及双目设备
CN113506342B (zh) 一种基于多相机全景视觉的slam全向回环校正方法
CN113052880B (zh) 一种sfm稀疏重建方法、系统及应用
CN114140527A (zh) 一种基于语义分割的动态环境双目视觉slam方法
CN112634305B (zh) 一种基于边缘特征匹配的红外视觉里程计实现方法
CN113808269A (zh) 地图生成方法、定位方法、系统及计算机可读存储介质
Zhang et al. Improved feature point extraction method of ORB-SLAM2 dense map

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant