CN112560648A

CN112560648A - 一种基于rgb-d图像的slam方法

Info

Publication number: CN112560648A
Application number: CN202011448199.6A
Authority: CN
Inventors: 荆树旭; 卢鹏宇; 柳有权; 翟晓惠; 刘佳玲
Original assignee: Changan University
Current assignee: Changan University
Priority date: 2020-12-09
Filing date: 2020-12-09
Publication date: 2021-03-26
Anticipated expiration: 2040-12-09
Also published as: CN112560648B

Abstract

本发明公开了一种基于RGB‑D图像的SLAM方法，该方法包括以下步骤：一、RGB‑D图像的获取；二、RGB‑D图像的特征点提取与匹配；三、计算旋转矩阵和平移矩阵；四、RGB‑D图像中关键帧的获取；步骤五、关键帧的闭环判断；步骤六、RGB‑D图像的全局优化；步骤七、构建网格地图。本发明方法步骤简单、设计合理且实现方便，解决暴力匹配问题，且减少匹配点对质量差别造成深度相机位姿的误差，提高了SLAM的精度和实时性，从而能够满足机器人实时SLAM的要求，并且具有极高的精度。

Description

一种基于RGB-D图像的SLAM方法

技术领域

本发明属于网格地图构建技术领域，尤其是涉及一种基于RGB-D图像的SLAM方法。

背景技术

随着智能机器人技术的不断发展，研究者们希望有朝一日机器人可以像人类一样，通过眼睛去观察和理解周围的世界，完成自身的定位和对周围环境的建模。一般将这个问题称为即时定位与地图构建(Simultaneous Localization and Mapping,SLAM)。VSLAM是指通过视觉传感器的方式完成即时定位与地图构建。把视觉传感器和红外传感器集成到一起并实现两种传感器信息之间的良好同步，这样就构成了RGB-D传感器。基于RGB-D传感器的VSLAM则被称为RGB-D SLAM。目前的SLAM方法主要有RGB-D图像采用SIFT特征点提取，然后采用最近迭代点ICP算法求解两帧图像之间的最优变换，最后利用图优化工具TORO进行全局优化；还有利用三维重建的方案，可以在不需要RGB图只需要深度图的情况下就能实时地建立三维模型。还有基于单目、双目和RGB-D相机的完整的SLAM系统。但是上述方法还存一些问题：第一，采用暴力匹配对特征点进行匹配，需要每个特征与其他所有的特征进行匹配，匹配范围大，耗时严重；第二，精度和实时性不太理性。因此，需要一种基于RGB-D图像的SLAM方法，方法步骤简单、设计合理且实现方便，解决暴力匹配问题，且提高了SLAM的精度和实时性，从而进一步便于满足机器人实时SLAM的要求，并且具有极高的精度。

发明内容

本发明所要解决的技术问题在于针对上述现有技术中的不足，提供一种基于RGB-D图像的SLAM方法，其方法步骤简单、设计合理且实现方便，解决暴力匹配问题，且提高了SLAM的精度和实时性，从而进一步便于满足机器人实时SLAM的要求，并且具有极高的精度。

为解决上述技术问题，本发明采用的技术方案是：一种基于RGB-D图像的SLAM方法，其特征在于，该方法包括以下步骤：

步骤一、RGB-D图像的获取：

采用深度相机按照预设设定的采集时间对待拍摄空间进行实时采集，并将各个采样时刻采集到的RGB-D图像发送至计算机；其中，第i个采样时刻采集到的RGB-D图像包括第i帧彩色图像和第i帧彩色图像所对应的深度值，i为正整数，且1≤i≤M，M表示彩色图像的总帧数；

步骤二、RGB-D图像的特征点提取与匹配：

步骤201、计算机采用ORB算法对第i帧彩色图像进行特征点提取，得到第i帧彩色图像的特征点描述子集；其中，第i帧彩色图像中第a个特征点对应的特征点描述子记作第i帧彩色图像中第a个特征点描述子

a为正整数，且1≤a≤A，A表示特征点的总数；

同时，计算机采用ORB算法对第i+1帧彩色图像进行特征点提取，得到第i+1帧彩色图像的特征点描述子集；其中，第i+1帧彩色图像中第a′个特征点对应的特征点描述子记作第i+1帧彩色图像中第a′个特征点描述子

a′为正整数，1≤a′≤A；

步骤202、计算机采用K-means++算法对第i帧彩色图像的特征点描述子和第i+1帧彩色图像中的特征点描述子进行匹配，得到多组匹配点对；

步骤三、计算旋转矩阵和平移矩阵：

步骤301、计算机将每组匹配点对之间的汉明距离按照从小到大的顺序进行排序，并选取前N组匹配点对；

步骤302、计算机采用随机抽样一致RANSAC算法和PnP算法，对N组匹配点对进行姿态估计，得到第i+1帧彩色图像和第i帧彩色图像之间的姿态、特征匹配的内点数Inliers_i,i+1；其中，第i+1帧彩色图像和第i帧彩色图像之间的姿态包括第i+1帧彩色图像和第i帧彩色图像之间的旋转矩阵R_i+1,i和平移向量t_i+1,i；其中，旋转矩阵R_i+1,i为3×3矩阵，平移向量t_i+1,i为3×1向量；

步骤303、计算机对第i+1帧彩色图像和第i帧彩色图像之间的旋转矩阵R_i+1,i和平移向量t_i+1,i进行优化，得到第i+1帧彩色图像和第i帧彩色图像之间的优化后的旋转矩阵

和优化后的平移向量

步骤四、RGB-D图像中关键帧的获取：

步骤401、选取第1帧彩色图像作为关键帧；

步骤402、选取下一帧彩色图像即第2帧彩色图像作为当前帧彩色图像；

步骤403、按照步骤二和步骤三所述的方法，得到第2帧彩色图像和第1帧彩色图像即当前帧彩色图像和上一个关键帧之间的特征匹配的内点数Inliers_c,s，计算机将Inliers_c,s和设定的最小内点数In_min进行判断，如果Inliers_c,s>In_min,执行步骤404和步骤405；否则，舍弃该当前帧彩色图像；

步骤404、根据公式D_c,s＝||t_c,s ^*||+min(2π-||R_c,s ^*||,||R_c,s ^*||)，得到当前帧彩色图像和上一个关键帧之间的相对运动距离D_c,s；其中，R_c,s ^*表示第2帧彩色图像和第1帧彩色图像之间即当前帧彩色图像和上一个关键帧之间的优化后的旋转矩阵，t_c,s ^*表示第2帧彩色图像和第1帧彩色图像之间即当前帧彩色图像和上一个关键帧之间的优化后的平移向量，||·||表示向量的模；

步骤405、计算机将D_c,s与运动距离最小阈值D_min和运动距离最大阈值D_max进行判断，如果D_min<D_c,s<D_max成立，则第2帧彩色图像即当前帧彩色图像为关键帧；否则，舍弃该当前帧彩色图像；

步骤406、按照步骤401和步骤405所述的方法，对上一个关键帧和下一帧彩色图像之间进行判断，直至完成M-2帧彩色图像的判断，得到各个关键帧；

步骤五、关键帧的闭环判断：

步骤501、计算机将步骤406中得到的各个关键帧按照采样时间先后顺序存入数据库图像中；其中，关键帧的总数为B；

步骤502、计算机根据公式N_z＝B×A，得到数据库图像中特征点的总数N_z；

步骤503、计算机根据公式

得到第b个关键帧中第t个特征点的词频-逆文档频率

其中，N_z,t表示第b个关键帧中第t个特征点在数据库图像中出现的数量，N_b,t表示第b个关键帧中第t个特征点出现的数量，t为正整数，1≤t≤A，b为正整数，且1≤b≤B；

步骤504、计算机将剩余B-b个关键帧记作待判断关键帧，计算机根据公式

得到第b′个待判断关键帧中第t′个特征点的词频-逆文档频率

其中，N_z,t′表示第b′个待判断关键帧中第t′个特征点在数据库图像中出现的数量，N_b′,t′表示第b′个待判断关键帧中第t′个特征点出现的数量，b′和t′均为正整数，且b′的取值位于b+1～B，且b+1不大于B，1≤t′≤A；

步骤505、计算机根据

，得到第b个关键帧和第b′个待判断关键帧之间的相似度S(q^b,d^b′)；其中，q^b表示第b个关键帧中各个特征点的词频-逆文档频率向量，且

d^b′表示第b′个待判断关键帧中各个特征点的词频-逆文档频率向量，且

||·||表示向量的模；

步骤507、按照步骤506所述的方法，得到各个关键帧之间的相似度，获取相似度最大值并记作S_max，并设定相似度阈值系数为S_th；

步骤508、计算机将S(q^b,d^b′)和S_th×S_max进行判断，如果S(q^b,d^b′)大于S_th×S_max，则第b个关键帧和第b′个待判断关键帧作为候选闭环帧序列；

步骤509、按照步骤二和步骤三所述的方法，得到第b个关键帧和第b′个待判断关键帧之间优化后的旋转矩阵

和优化后的平移向量

以及第b个关键帧和第b′个待判断关键帧之间的特征匹配的内点数Inliers_b,b′(key)；

步骤5010、计算机将第b个关键帧和第b′个待判断关键帧之间的特征匹配的内点数Inliers_b,b′(key)和特征匹配的内点数阈值进行判断，如果Inliers_b,b′(key)大于内点数阈值，则第b个关键帧和第b′个待判断关键帧作为一组闭环帧，

步骤5011、按照步骤502至步骤5010所述的方法，对第b+1个关键帧和待判断关键帧进行判断，直至完成B-1个关键帧的判断，得到多组闭环帧；

步骤六、RGB-D图像的全局优化：

计算机对存在多组闭环帧的各个关键帧进行全局优化，得到优化后的位姿图；

步骤七、构建网格地图：

计算机根据优化后的位姿图和关键帧构建三角化网格地图。

上述的一种基于RGB-D图像的SLAM方法，其特征在于：步骤202中采用计算机对第i帧彩色图像和第i+1帧彩色图像中的特征点描述子进行匹配，得到多组匹配点对，具体过程如下：

步骤2021、计算机设定聚类种类k为5，设定聚类层数L为10，计算机采用K-means++算法对第i帧彩色图像的特征点描述子集进行聚类，得到第i帧彩色图像的特征点描述子词汇树，并记作第i个特征点描述子词汇树；

计算机采用K-means++算法对第i+1帧彩色图像的特征点描述子集进行聚类，得到第i+1帧彩色图像的特征点描述子词汇树，并记作第i+1个特征点描述子词汇树；

步骤2022、计算机获取第i个特征点描述子词汇树L层中各个叶子节点的聚类中心和第i+1个特征点描述子词汇树L层中各个叶子节点的聚类中心；

步骤2023、计算机将第i个特征点描述子词汇树第10层中各个叶子节点中的特征点描述子分别和第i+1个特征点描述子词汇树从第4层开始进行特征匹配判断的方法均相同，其中，计算机将第i个特征点描述子词汇树第10层中第m₁₀个叶子节点中的特征点描述子分别和第i+1个特征点描述子词汇树第4层进行特征匹配判断，具体过程如下：

步骤20231、计算机获取第i个特征点描述子词汇树第10层中第m₁₀个叶子节点中第m′₁₀个特征点描述子和第i+1个特征点描述子词汇树第4层中各个叶子节点的聚类中心之间的汉明距离，获取第i+1个特征点描述子词汇树第4层中与第i个特征点描述子词汇树第10层中第m₁₀个叶子节点中第m′₁₀个特征点描述子汉明距离最小的叶子节点记作

其中，m₁₀和m′₁₀均为正整数；

步骤20232、计算机获取第i个特征点描述子词汇树第10层中第m₁₀个叶子节点中第m′₁₀个特征点描述子和第i+1个特征点描述子词汇树第5层中与

叶子节点相连接的各个叶子节点的聚类中心之间的汉明距离，获取第i+1个特征点描述子词汇树第5层中与第i个特征点描述子词汇树的第10层中第m₁₀个叶子节点中第m′₁₀个特征点描述子汉明距离最小的叶子节点并记作

步骤20233、多次重复步骤20231和步骤20232，计算机获取第i个特征点描述子词汇树第10层中第m₁₀个叶子节点中第m′₁₀个特征点描述子和第i+1个特征点描述子词汇树第l′层中与

叶子节点相连接的各个叶子节点的聚类中心之间的汉明距离，并获取第i+1个特征点描述子词汇树第l′层中与第i个特征点描述子词汇树第10层中第m₁₀个叶子节点中第m′₁₀个特征点描述子汉明距离最小的叶子节点并记作

其中，l′为正整数，且4≤l′≤L；其中，

表示第i+1个特征点描述子词汇树第l′-1层中与第i个特征点描述子词汇树第10层中第m₁₀个叶子节点中第m′₁₀个特征点描述子汉明距离最小的叶子节点；

步骤20234、多次重复步骤20233，直至计算机获取第i个特征点描述子词汇树第10层中第m₁₀个叶子节点中第m′₁₀个特征点描述子和第i+1个特征点描述子词汇树第L层中与

叶子节点相连接的各个叶子节点的聚类中心之间的汉明距离，获取第i+1个特征点描述子词汇树第L层中与第i个特征点描述子词汇树第10层中第m₁₀个叶子节点中第m′₁₀个特征点描述子汉明距离最小的叶子节点并记作

其中，

表示第i+1个特征点描述子词汇树第L-1层中与第i个特征点描述子词汇树第10层中第m₁₀个叶子节点中第m′₁₀个特征点描述子汉明距离最小的叶子节点；

步骤20235、计算机获取第i个特征点描述子词汇树第10层中第m₁₀个叶子节点中第m′₁₀个特征点描述子和第i+1个特征点描述子词汇树第L层中

叶子节点中各个特征点描述子之间的汉明距离，并获取第i+1个特征点描述子词汇树第L层中

叶子节点中与第i个特征点描述子词汇树第10层中第m₁₀个叶子节点中第m′₁₀个特征点描述子汉明距离最小的特征点描述子，并将该特征点描述子记作第i个特征点描述子词汇树第10层中第m₁₀个叶子节点中第m′₁₀个特征点描述子的匹配特征点描述子；

步骤20236、按照步骤20231至步骤20235所述的方法，对第i个特征点描述子词汇树第10层中各个叶子节点中各个特征点描述子均进行特征匹配判断，得到第i个特征点描述子词汇树第10层中各个叶子节点中各个特征点描述子的匹配特征点描述子；

步骤20237、计算机获取第i个特征点描述子词汇树中各个特征点描述子的匹配特征点描述子，从而得到多组匹配点对；其中，一个特征点描述子和与其对应的匹配特征点描述子记作一组匹配点对。

上述的一种基于RGB-D图像的SLAM方法，其特征在于：步骤303中计算机对旋转矩阵R_i+1,i和平移向量t_i+1,i进行优化，得到第i+1帧彩色图像和第i帧彩色图像之间优化后的旋转矩阵

和优化后的平移向量

具体过程如下：

步骤3031、计算机将拍摄第i帧彩色图像时相机坐标系记作第i个相机坐标系，将拍摄第i+1帧彩色图像时相机坐标系记作第i+1个相机坐标系；设定第f组匹配点对应第f个空间点在第i个相机坐标系下的三维坐标记作

在第i+1个相机坐标系下的三维坐标记作

步骤3032、计算机根据公式

得到第f个空间点在第i+1帧彩色图像和第i帧彩色图像之间的姿态误差项

其中，||·||²表示向量的模的平方；R′_i+1,i表示第i+1帧彩色图像和第i帧彩色图像之间的设定旋转矩阵，t′_i+1,i第i+1帧彩色图像和第i帧彩色图像之间的设定平移向量；

步骤3033、计算机建立姿态误差函数

其中，1≤F≤N；

步骤3034、R′_i+1,i的初始值取R_i+1,i，t′_i+1,i的初始值取t_i+1,i，计算机采用最小二乘法对步骤3033中的姿态误差函数进行求解，得到姿态误差函数最小时的旋转矩阵R′_i,i+1和平移向量t′_i,i+1，并将姿态误差函数最小时的R′_i,i+1作为第i+1帧彩色图像和第i帧彩色图像之间优化后的旋转矩阵

姿态误差函数最小时的t′_i+1,i作为第i+1帧彩色图像和第i帧彩色图像之间优化后的平移向量

上述的一种基于RGB-D图像的SLAM方法，其特征在于：步骤六中计算机对存在多组闭环帧的各个关键帧进行全局优化，得到优化后的位姿图，具体过程如下：

步骤601、计算机根据各个关键帧建立位姿图，并设定第b个关键帧拍摄时相机位姿记作第b个相机位姿，设定第b+1个关键帧拍摄时相机位姿记作第b+1个相机位姿；且第b个相机位姿记作X_b，第b+1个相机位姿记作X_b+1；其中，第b个关键帧和第b+1个关键帧不是闭环帧；

步骤602、按照步骤二和步骤三所述的方法，得到第b+1个关键帧和第b个关键帧之间优化后的旋转矩阵

和优化后的平移向量

步骤603、计算机将步骤5011中多组关键帧中第r组闭环帧记作第r(1)个关键帧和第r(2)个关键帧，并设定位姿图中第r(1)个关键帧拍摄时相机位姿记作第r(1)个相机位姿X_r(1)，第r(2)个关键帧拍摄时相机位姿记作第r(2)个相机位姿X_r(2)；其中，r为正整数，且1≤r≤R，R表示闭环帧的总组数；

步骤604、按照步骤二和步骤三所述的方法，得到第r(1)个关键帧和第r(2)个关键帧之间优化后的旋转矩阵

和优化后的平移向量

步骤605、计算机根据公式

得到第b+1个相机位姿和第b个相机位姿之间的位姿差值矩阵e_b,b+1,并将第b+1个相机位姿和第b个相机位姿之间的位姿差值矩阵e_b,b+1经罗德里格斯公式转换，得到第b+1个相机位姿和第b个相机位姿之间的位姿差值向量e′_b,b+1；其中e′_b,b+1的大小为6×1；R″_b+1,b和t″_b+1,b分别表示第b+1个关键帧和第b个关键帧之间的设定的旋转矩阵和设定的平移向量；

步骤606、计算机根据公式

得到第b+1个相机位姿和第b个相机位姿之间的位姿差值C_b,b+1；其中，Ω表示信息矩阵，且

且Ω的大小为6×6；

步骤607、计算机根据公式

得到第r(2)个相机位姿和第r(1)个相机位姿之间的位姿差值矩阵e_r(1),r(2)；并将第r(2)个相机位姿和第r(1)个相机位姿之间的位姿差值矩阵e_r(1),r(2)经罗德里格斯公式转换，得到第r(2)个相机位姿和第r(1)个相机位姿之间的位姿差值向量e′_r(1),r(2)；其中e′_r(1),r(2)的大小为6×1；R″_r(1),r(2)和t″_r(1),r(2)分别表示第r(1)个关键帧和第r(2)个关键帧之间的设定的旋转矩阵和设定的平移向量；

步骤608、计算机根据公式

得到第r(2)个相机位姿和第r(1)个相机位姿之间的位姿差值C_r(1),r(2)；

步骤609、计算机根据公式

得到总误差函数C_z；

步骤6010、按照步骤二和步骤三所述的方法，得到第b+1个关键帧和第b个关键帧之间优化后的旋转矩阵

和优化后的平移向量

以及第r(1)个关键帧和第r(2)个关键帧之间优化后的旋转矩阵

和优化后的平移向量

步骤6011、设定第b个相机位姿X_b的初始值、第b+1个相机位姿X_b+1的的初始值、第r(1)个相机位姿X_r(1)的初始值和第r(2)个相机位姿X_r(2)的初始值均为4×4的单位矩阵；设定R″_b+1,b的初始值取

t″_b+1,b的初始值取

R″_r(1),r(2)的初始值取

t″_r(1),r(2)的初始值取

步骤6012、计算机利用g2o求解器选择高斯牛顿法对位姿图进行优化，得到总误差函数C_z最小的各个相机位姿、R″_b+1,b、t″_b+1,b、R″_r(1),r(2)和t″_r(1),r(2)解，形成优化后的位姿图。

上述的一种基于RGB-D图像的SLAM方法，其特征在于：步骤七中计算机根据优化后的位姿图和关键帧构建三角化网格地图，具体过程如下：

步骤701、计算机将B个关键帧转换分别转换为点云数据，并根据优化后的位姿图，将转换后的点云数据进行拼接，得到拼接后的点云数据；

步骤702、计算机采用三维体素栅格对拼接后的点云数据进行滤波，得到过滤后的点云数据；其中，三维体素栅格为立方体，且三维体素栅格的体积不大于27cm³；

步骤703、计算机采用移动最小二乘法对过滤后的点云数据进行重采样，得到重采样后的点云数据；

步骤704、计算机调取计算点云法线模块对重采样后的点云数据计算点云法线，构建有向点云；

步骤705、计算机采用贪心投影三角化算法对构建的有向点云进行三角化，构建三角化网格地图。

上述的一种基于RGB-D图像的SLAM方法，其特征在于：步骤405中运动距离最小阈值D_min的取值为0.07～0.15，运动距离最大阈值D_max的取值为0.3～0.5；

步骤5010中特征匹配的内点数阈值的取值范围为40～50；

步骤507中相似度阈值系数S_th的取值为0.7～0.85。

步骤403中设定的最小内点数In_min取值范围为25～40；

步骤301中N的取值为70～100。

本发明与现有技术相比具有以下优点：

1、本发明方法步骤简单、设计合理且实现方便，提高了即时定位与地图构建的精度。

2、本发明基于RGB-D图像的SLAM方法使用效果好，首先是RGB-D图像的获取，其次是RGB-D图像的特征点提取与匹配，接着根据匹配点计算旋转矩阵和平移矩阵，并从RGB-D图像中获取关键帧，然后经关键帧的闭环判断，接着是对存在多组闭环帧的各个关键帧进行全局优化，得到优化后的位姿图，最后根据优化后的位姿图和关键帧构建三角化网格地图，实现了与待拍摄空间真实逼近的地图模型，提高了精度。

3、本发明RGB-D图像的特征点提取中采用ORB算法进行特征点提取，与SIFT算法和SURF算法相比，ORB算法在速度上拥有绝对的优势，适合在嵌入式设备上使用。

4、本发明RGB-D图像的特征点匹配中采用K-means++算法得到多组匹配点对，通过K-means++算法进行聚类得到特征点描述子词汇树，通过特征点描述子词汇树的匹配，极大地缩小图像特征点的匹配范围，加快匹配速度。

5、本发明采用随机抽样一致RANSAC算法和PnP算法结合，计算旋转矩阵和平移矩阵，并对旋转矩阵和平移向量进行局部优化，减少匹配点对质量差别造成位姿的误差，提高SLAM方法的精度。

6、本发明从RGB-D图像中获取关键帧，是为了后续使用关键帧进行即时定位与地图构建，可以避免因逐帧插入导致系统实时性降低、计算代价增加、系统内存消耗过大的问题。

7、本发明关键帧的闭环判断中首先采用相似度和相似度最大值与相似度阈值系数的乘积进行判断，实现一次判断，然后经过RGB-D图像的特征点提取与匹配进行二次判断，得到多组闭环帧，这样通过一次判断可以大大节省闭环检测所需的时间，一次判断和二次判断结合从而可以极大的提高闭环检测的精度。

8、本发明计算机对存在多组闭环帧的各个关键帧进行全局优化时，位姿图节点为相机位姿，位姿节点之间的边为两个关键帧之间的运动估计即旋转矩阵和平移向量，可以在保证精度的同时，极大的减少全局优化所需要的时间，提高SLAM方法的实时性，另外便于根据优化后的位姿图和关键帧构建三角化网格地图，确保地图分辨率和精度。

综上所述，本发明方法步骤简单、设计合理且实现方便，解决暴力匹配问题，且提高了SLAM的精度和实时性，从而能够满足机器人实时SLAM的要求，并且具有极高的精度。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

图1为本发明的方法流程框图。

具体实施方式

如图1所示的一种基于RGB-D图像的SLAM方法，该方法包括以下步骤：

步骤一、RGB-D图像的获取：

步骤二、RGB-D图像的特征点提取与匹配：

a为正整数，且1≤a≤A，A表示特征点的总数；

a′为正整数，1≤a′≤A；

步骤三、计算旋转矩阵和平移矩阵：

和优化后的平移向量

步骤四、RGB-D图像中关键帧的获取：

步骤401、选取第1帧彩色图像作为关键帧；

步骤五、关键帧的闭环判断：

步骤503、计算机根据公式

得到第b个关键帧中第t个特征点的词频-逆文档频率

步骤505、计算机根据

||·||表示向量的模；

和优化后的平移向量

步骤六、RGB-D图像的全局优化：

步骤七、构建网格地图：

计算机根据优化后的位姿图和关键帧构建三角化网格地图。

本实施例中，步骤202中采用计算机对第i帧彩色图像和第i+1帧彩色图像中的特征点描述子进行匹配，得到多组匹配点对，具体过程如下：

其中，m₁₀和m′₁₀均为正整数；

其中，l′为正整数，且4≤l′≤L；其中，

其中，

本实施例中，步骤303中计算机对旋转矩阵R_i+1,i和平移向量t_i+1,i进行优化，得到第i+1帧彩色图像和第i帧彩色图像之间优化后的旋转矩阵

和优化后的平移向量

具体过程如下：

在第i+1个相机坐标系下的三维坐标记作

步骤3032、计算机根据公式

步骤3033、计算机建立姿态误差函数

其中，1≤F≤N；

本实施例中，步骤六中计算机对存在多组闭环帧的各个关键帧进行全局优化，得到优化后的位姿图，具体过程如下：

和优化后的平移向量

和优化后的平移向量

步骤605、计算机根据公式

步骤606、计算机根据公式

且Ω的大小为6×6；

步骤607、计算机根据公式

步骤608、计算机根据公式

步骤609、计算机根据公式

得到总误差函数C_z；

和优化后的平移向量

以及第r(1)个关键帧和第r(2)个关键帧之间优化后的旋转矩阵

和优化后的平移向量

t″_b+1,b的初始值取

R″_r(1),r(2)的初始值取

t″_r(1),r(2)的初始值取

本实施例中，步骤七中计算机根据优化后的位姿图和关键帧构建三角化网格地图，具体过程如下：

本实施例中，步骤405中运动距离最小阈值D_min的取值为0.07～0.15，运动距离最大阈值D_max的取值为0.3～0.5；

步骤5010中特征匹配的内点数阈值的取值范围为40～50；

步骤507中相似度阈值系数S_th的取值为0.7～0.85。

步骤403中设定的最小内点数In_min取值范围为25～40；

步骤301中N的取值为70～100。

本实施例中，

J表示特征点描述子元素的总数，j和J均为正整数，且J＝500，1≤j≤J，

表示第i帧彩色图像中第a个特征点描述子的第一个元素，

表示第i帧彩色图像中第a个特征点描述子的第j个元素，

表示第i帧彩色图像中第a个特征点描述子的第J个元素。

本实施例中，

表示第i+1帧彩色图像中第a′个特征描述子的第一个元素，

表示第i+1帧彩色图像中第a′个特征点描述子的第j个元素，

表示第i+1帧彩色图像中第a′个特征点描述子的第J个元素。

本实施例中，预设设定的采集时间的取值范围为0.01～0.1。

本实施例中，进一步地优选，预设设定的采集时间的取值范围为0.04。

本实施例中，RGB-D图像即为深度图像。

本实施例中，特征点的总数A＝500。

本实施例中，需要说明的是，SLAM为(Simultaneous Localization and Mapping)即时定位与地图构建。

本实施例中，进一步地优选，步骤507中相似度阈值系数S_th的取值为0.8。

本实施例中，需要说明的是，ORB算法即Oriented FAST and Rotated BRIEF算法，是一种快速特征点提取和描述的算法。

本实施例中，需要说明的是，实际使用时，N_b,t和N_b′,t的值均为1。

本实施例中，

表示第b个关键帧中第1个特征点的词频-逆文档频率，

表示第b个关键帧中第1个特征点的词频-逆文档频率，

表示第b个关键帧中第A个特征点的词频-逆文档频率；

表示第b′个待判断关键帧中第1个特征点的词频-逆文档频率，

表示第b′个待判断关键帧中第2个特征点的词频-逆文档频率，

表示第b′个待判断关键帧中第A个特征点的词频-逆文档频率。

本实施例中，需要说明的是，实际使用时，步骤302中还利用第i帧彩色图像所对应的深度值和第i+1帧彩色图像所对应的深度值。

本实施例中，需要说明的是，实际使用时，步骤701中计算机将B个关键帧转换分别转换为点云数据时，还需要利用B个关键帧所对应的深度值。

本实施例中，需要说明的是，实际使用时，当步骤202中多组匹配点对的组数小于N时，则步骤302中对步骤202中得到的多组匹配点对进行姿态估计。

综上所述，本发明方法步骤简单、设计合理且实现方便，解决暴力匹配问题，且减少匹配点对质量差别造成深度相机位姿的误差，提高了SLAM的精度和实时性，从而能够满足机器人实时SLAM的要求，并且具有极高的精度。

以上所述，仅是本发明的较佳实施例，并非对本发明作任何限制，凡是根据本发明技术实质对以上实施例所作的任何简单修改、变更以及等效结构变化，均仍属于本发明技术方案的保护范围内。

Claims

1.一种基于RGB-D图像的SLAM方法，其特征在于，该方法包括以下步骤：

步骤一、RGB-D图像的获取：

步骤二、RGB-D图像的特征点提取与匹配：

a为正整数，且1≤a≤A，A表示特征点的总数；

a′为正整数，1≤a′≤A；

步骤三、计算旋转矩阵和平移矩阵：

和优化后的平移向量

步骤四、RGB-D图像中关键帧的获取：

步骤401、选取第1帧彩色图像作为关键帧；

步骤五、关键帧的闭环判断：

步骤503、计算机根据公式

得到第b个关键帧中第t个特征点的词频-逆文档频率

步骤505、计算机根据

得到第b个关键帧和第b′个待判断关键帧之间的相似度S(q^b,d^b′)；其中，q^b表示第b个关键帧中各个特征点的词频-逆文档频率向量，且

||·||表示向量的模；

和优化后的平移向量

步骤六、RGB-D图像的全局优化：

步骤七、构建网格地图：

计算机根据优化后的位姿图和关键帧构建三角化网格地图。

2.按照权利要求1所述的一种基于RGB-D图像的SLAM方法，其特征在于：步骤202中采用计算机对第i帧彩色图像和第i+1帧彩色图像中的特征点描述子进行匹配，得到多组匹配点对，具体过程如下：

其中，m₁₀和m′₁₀均为正整数；

其中，l′为正整数，且4≤l′≤L；其中，

其中，

3.按照权利要求1所述的一种基于RGB-D图像的SLAM方法，其特征在于：步骤303中计算机对旋转矩阵R_i+1,i和平移向量t_i+1,i进行优化，得到第i+1帧彩色图像和第i帧彩色图像之间优化后的旋转矩阵

和优化后的平移向量

具体过程如下：

在第i+1个相机坐标系下的三维坐标记作

步骤3032、计算机根据公式

步骤3033、计算机建立姿态误差函数

其中，1≤F≤N；

4.按照权利要求1所述的一种基于RGB-D图像的SLAM方法，其特征在于：步骤六中计算机对存在多组闭环帧的各个关键帧进行全局优化，得到优化后的位姿图，具体过程如下：

和优化后的平移向量

和优化后的平移向量

步骤605、计算机根据公式

步骤606、计算机根据公式

且Ω的大小为6×6；

步骤607、计算机根据公式

步骤608、计算机根据公式

步骤609、计算机根据公式

得到总误差函数C_z；

和优化后的平移向量

以及第r(1)个关键帧和第r(2)个关键帧之间优化后的旋转矩阵

和优化后的平移向量

t″_b+1,b的初始值取

R″_r(1),r(2)的初始值取

t″_r(1),r(2)的初始值取

5.按照权利要求1所述的一种基于RGB-D图像的SLAM方法，其特征在于：步骤七中计算机根据优化后的位姿图和关键帧构建三角化网格地图，具体过程如下：

6.按照权利要求1所述的一种基于RGB-D图像的SLAM方法，其特征在于：步骤405中运动距离最小阈值D_min的取值为0.07～0.15，运动距离最大阈值D_max的取值为0.3～0.5；

步骤5010中特征匹配的内点数阈值的取值范围为40～50；

步骤507中相似度阈值系数S_th的取值为0.7～0.85。

步骤403中设定的最小内点数In_min取值范围为25～40；

步骤301中N的取值为70～100。