CN116630901B

CN116630901B - 一种基于潜在图预测无监督学习框架的视觉里程计方法

Info

Publication number: CN116630901B
Application number: CN202310905815.3A
Authority: CN
Inventors: 黄懿涵; 谢非; 柏思齐; 高知临; 周笑羽; 唐俊秋; 刘沁阳; 江如月; 陈莘艺
Original assignee: Nanjing Normal University
Current assignee: Nanjing Normal University
Priority date: 2023-07-24
Filing date: 2023-07-24
Publication date: 2023-09-22
Anticipated expiration: 2043-07-24
Also published as: CN116630901A

Abstract

本发明公开了一种基于潜在图预测无监督学习框架的视觉里程计方法，首先获取当前作业环境的RGB图像，并进行预处理，获得预处理后图像；然后进行改进的潜在图预测处理，通过潜在图预测模型处理后，进行潜在图预测损失优化，得到潜在图预测后图像；再进行图像分层，并逐层执行数据增强和伪标签算法处理，最后通过区域增长算法剔除动态目标的类点云信息，实现潜在图预测无监督学习框架下的视觉里程计。通过在潜在图预测时进行损失优化，对重合节点的嵌入进行了有效度量，通过对图像进行分层后再进行伪标签算法处理，采用了轻量化的分层聚类，使得该算法的抗环境干扰能力强得到了强化，鲁棒性得到了提升，可针对不用目标进行有效精准识别分割。

Description

一种基于潜在图预测无监督学习框架的视觉里程计方法

技术领域

本发明涉及即时定位与地图构建，具体是涉及一种基于潜在图预测无监督学习框架的视觉里程计方法。

背景技术

在即时定位与地图构建的过程中，动态障碍物（如：移动的车辆、行人等）会或多或少地劣化即时定位与地图构建中的两个方面：点云的配准和点云地图的构建。动态障碍物对点云地图的构建的影响在于其会在最终生成的地图中产生“鬼影”，而若简单使用在第一种情况中提到的特征点云构建地图的话，会错误地滤除掉很多实际需要的物体信息，而这些情况传统滤波方法是没有办法解决的。

当前视觉里程计动态点云滤除方法大多数针对单一的特定的动态目标识别分割及点云滤除，对于多元的通用的动态目标识别分割及点云滤除并未涉及。

发明内容

发明目的：针对以上缺点，本发明提供一种动态点云滤除精准的抗环境干扰能力强的基于潜在图预测无监督学习框架的视觉里程计方法。

技术方案：为解决上述问题，本发明采用一种基于潜在图预测无监督学习框架的视觉里程计方法，包括以下步骤：

（1）获取当前作业环境的RGB图像，并进行预处理，获得预处理后作业环境的RGB图像；

（2）对预处理后作业环境的RGB图像进行改进的潜在图预测处理，通过潜在图预测模型处理后，进行潜在图预测损失优化，得到潜在图预测后作业环境的RGB图像；

（3）对潜在图预测后作业环境的RGB图像进行图像分层，并逐层执行数据增强和伪标签算法处理，得到潜在图预测无监督学习框架下含作业环境的RGB图像；

（4）根据所述的潜在图预测无监督学习框架下含作业环境的RGB图像，通过区域增长算法剔除动态目标的类点云信息，实现潜在图预测无监督学习框架下的视觉里程计。

进一步的，所述步骤（1）中对当前作业环境的RGB图像进行预处理包括畸变矫正和畸变矫正后的高斯滤波；对当前作业环境的RGB图像进行畸变矫正具体为：根据畸变模型解二元高阶非线性方程组，通过牛顿叠代法得到畸变矫正后的当前作业环境的RGB图像；畸变模型的公式如下:

；

其中，为相机坐标系空间一点在当前作业环境的RGB图像投影中畸变系数迭算后的横坐标值；/>为相机坐标系空间一点在当前作业环境的RGB图像投影中畸变系数迭算后的纵坐标值；/>为当前作业环境的RGB图像的一阶径向和切向畸变系数；为当前作业环境的RGB图像的二阶径向和切向畸变系数；/>为相机坐标系空间一点在当前作业环境的RGB图像投影中的横坐标与纵坐标平方和的平方根；/>为相机坐标系空间一点在当前作业环境的RGB图像投影中的横坐标；/>为相机坐标系空间一点在当前作业环境的RGB图像投影中的纵坐标；/>为相机坐标系空间一点在当前作业环境的RGB图像投影中的横坐标的牛顿法函数；/>为相机坐标系空间一点在当前作业环境的RGB图像投影中的纵坐标的牛顿法函数；/>为畸变矫正后的当前作业环境的RGB图像投影中第/>个像素点的横坐标值；/>为畸变矫正后的当前作业环境的RGB图像投影中第/>个像素点的纵坐标值；/>为畸变矫正后的当前作业环境的RGB图像投影中第/>个像素点的横坐标值；/>为畸变矫正后的当前作业环境的RGB图像投影中第/>个像素点的纵坐标值；/>为雅可比式在点处的值。

进一步的，对畸变矫正后的当前作业环境的RGB图像进行高斯滤波具体为：通过预设大小的高斯卷积核扫描RGB图像中的每一个像素，将得到的每一个像素的高斯卷积核做归一化处理，计算高斯滤波后高斯卷积核内中心点的值，即获得预处理后作业环境的RGB图像；高斯卷积核公式为：

，

其中：为二维高斯函数；/>为畸变矫正后的当前作业环境的RGB图像的高斯卷积核内一点的横坐标；/>为畸变矫正后的当前作业环境的RGB图像的高斯卷积核内一点的纵坐标；/>为畸变矫正后的当前作业环境的RGB图像的像素标准差。

进一步的，所述步骤（2）中潜在图预测模型的公式如下：

，

其中：为预处理后作业环境的RGB图像的图矩阵数据；/>为预处理后作业环境的RGB图像的潜在图矩阵数据的邻接矩阵；/>为预处理后作业环境的RGB图像潜在图矩阵数据的特征矩阵；/>为预处理后作业环境的RGB图像的潜在图矩阵数据；/>为潜在图预测模型处理后作业环境的RGB图像的特征矩阵；/>为潜在图预测模型处理后作业环境的RGB图像的节点嵌入；/>为预处理后作业环境的RGB图像的潜在图矩阵数据的邻接矩阵与特征矩阵的联合节点集；/>为潜在图预测模型处理后作业环境的RGB图像的重合节点嵌入；为预处理后作业环境的RGB图像的潜在图矩阵数据的邻接矩阵与潜在图预测模型处理后作业环境的RGB图像的特征矩阵的联合节点集；/>为预处理后作业环境的RGB图像的图矩阵数据与特征矩阵编码结果最小值；/>为潜在图预测模型的解码器函数；/>为潜在图预测模型的编码器函数；/>为潜在图预测模型处理后作业环境的RGB图像的元素均方差；为潜在图预测模型处理后作业环境的RGB图像的归属节点；/>为潜在图预测模型处理后作业环境的RGB图像的元素集合。

进一步的，所述步骤（2）中潜在图预测损失优化的公式如下：

，

其中：为潜在图损失优化编码器系数；/>为潜在图损失优化解码器系数；为潜在图损失优化编码权重；/>为潜在图预测模型处理后作业环境的RGB图像的总节点数；/>为潜在图预测模型处理后作业环境的RGB图像的矩阵数量；/>为潜在图预测模型的编码器函数；/>为潜在图预测模型处理后作业环境的RGB图像的第/>个邻接矩阵；/>为潜在图预测模型处理后作业环境的RGB图像的第/>个特征矩阵；/>为潜在图预测模型处理后作业环境的RGB图像的第/>个归属节点；/>为潜在图损失优化解码权重；/>为潜在图预测模型的解码器函数；/>为潜在图预测模型处理后作业环境的RGB图像的元素集合；/>为潜在图损失优化。

进一步的，所述步骤（3）中数据增强的公式为：

，

其中，为数据增强函数，/>为潜在图预测后作业环境的RGB图像的图像块，/>为潜在图预测后作业环境的RGB图像的图像块的均值，/>为数据增强后作业环境的RGB图像的图像块，/>为数据增强后作业环境的RGB图像的图像块的均值，/>为数据增强后作业环境的RGB图像的图像块的均值权重参数，/>为潜在图预测后作业环境的RGB图像的图像块与数据增强后作业环境的RGB图像的图像块的协方差，/>为潜在图预测后作业环境的RGB图像的图像块的标准差，/>为数据增强后作业环境的RGB图像的图像块的标准差，/>为数据增强后作业环境的RGB图像的图像块的方差权重参数。

进一步的，所述伪标签算法处理针对潜在图预测输出的联合节点集合，进行联合特征集的提取，对联合特征集使用聚类算法生成伪标签；联合特征集及聚类算法公式如下：

，

其中，为潜在图预测输出的联合节点集合，/>为潜在图预测输出的联合节点数，为潜在图预测输出的第/>个联合节点，/>为潜在图预测无监督学习框架下含作业环境的RGB图像的伪标签集，/>为潜在图预测无监督学习框架下含作业环境的RGB图像的第/>个伪标签，/>为潜在图预测输出的第/>个联合节点与第/>个联合节点之间的距离，/>为潜在图预测输出的联合节点横向数量，/>为潜在图预测输出的联合节点纵向数量，/>为潜在图预测输出的第/>个联合节点中的联合特征集，/>为潜在图预测输出的第/>个联合节点中的联合特征集，/>为/>和/>的欧氏距离，/>为聚类算法函数，/>为潜在图预测输出的联合节点中的联合特征集，/>为聚类个数，/>为潜在图预测输出的联合特征集，/>为潜在图预测输出的联合特征集中第I/>个簇，/>为潜在图预测输出的联合特征集中簇的集合的元素。

进一步的，所述步骤（4）中通过潜在图预测无监督学习框架下含作业环境的RGB图像获得动态目标的点云，区域增长算法对获得的动态目标的点云进行扫描，得到作业环境中的动态点云以及与其相邻的非动态点云，并确定生长点，基于局部特征描述子的边缘特征提取确立生长边界，局部特征描述子采用点特征直方图，点特征直方图通过描述点云表面的特征信息从而进行特征点提取，对参与构网的种子点向外扩展延伸，确定原始点云的外边界，从边界各向外扩展一层新的虚拟网格，扩展的虚拟网格与边界内的网格具有相同的尺寸，在每个扩展的网格中心内插一个虚拟种子点，搜索虚拟种子点的邻近格网，确定种子点，根据种子点信息的边界阈值，对区域增长内的动态点云进行滤除，实现潜在图预测无监督学习框架下的视觉里程计。

有益效果：本发明相对于现有技术，其显著优点是通过在潜在图预测时进行损失优化，对重合节点的嵌入进行了有效度量，通过对图像进行分层后再进行伪标签算法处理，伪标签生成算法采用了轻量化的分层聚类，使得该算法的抗环境干扰能力强得到了强化，鲁棒性得到了提升，在动态目标的识别分割过程中，可针对不用目标进行有效精准识别分割。在图像的预处理过程中，所采用的预处理可有效解决图像因大光度变化、图像畸变不良因素的影响；在动态目标的识别分割过程中，所采用的潜在图预测的无监督学习模型可针对不用目标进行有效精准识别分割；在动态目标的点云滤除过程中所采用的区域增长算法可高效实现种子搜索及边界处理。本方法具有视觉里程计准确、动态点云滤除精准、抗环境干扰能力强的优点，对于无人驾驶、多源导航等领域的技术研究具有重要意义。

附图说明

图1是本发明视觉里程计方法的流程图。

图2是本发明中获取的强光线干扰下作业环境的RGB图像。

图3是本发明中预处理后作业环境的RGB图像。

图4是本发明中潜在图预测后的作业环境的RGB图像。

图5是本发明中潜在图预测无监督学习框架下含作业环境的RGB图像。

图6是采用现有技术进行即时定位与地图构建结果的示意图。

图7是采用本发明进行即时定位与地图构建结果的示意图。

图8是本发明中视觉里程计结果示意图。

图9是现有技术中的ORBSLAM2视觉里程计精度偏差曲线图。

图10是本发明中的视觉里程计精度偏差曲线图。

实施方式

如图1所示，本实施例中一种基于潜在图预测无监督学习框架的视觉里程计方法，其特征在于，包括以下步骤：

（1）通过摄像头采集并保存当前作业环境的RGB图像，对获取的当前作业环境的RGB图像采用畸变矫正模型及高斯滤波进行预处理，获得预处理后作业环境的RGB图像；获得如图2所示的强光线干扰下作业环境的RGB图像，进行畸变矫正模型及高斯滤波预处理后得到如图3所示的预处理后作业环境的RGB图像。可有效解决图像因大光度变化、图像畸变不良因素的影响。

（1.1）对获取的当前作业环境的RGB图像采用畸变矫正模型进行畸变矫正，根据畸变模型解二元高阶非线性方程组牛顿叠代法得到矫正畸变后的RGB图像，畸变模型的公式如下：

；

（1.2）采用高斯滤波方法处理畸变矫正后的当前作业环境的RGB图像，高斯滤波方法主要包括用3×3高斯卷积核扫描图像中的每一个像素，将邻域内各个像素值与对应位置的权值相称并求和。将得到的高斯卷积核做归一化处理，中心点以及周边8个点，每个点乘以预设的权重值并求和，即为高斯滤波后中心点的值，即获得预处理后作业环境的RGB图像。高斯卷积核公式为：

，

（2）对预处理后作业环境的RGB图像进行改进的潜在图预测处理，如图4所示，改进的潜在图预测的处理包括潜在图预测模型与潜在图损失优化两部分，可有效输出潜在图预测的联合节点集，通过潜在图预测模型处理后，进行潜在图预测损失优化，得到潜在图预测后作业环境的RGB图像。可针对不用目标进行有效精准识别分割。

潜在图预测模型的公式如下：

：

，

潜在图预测损失优化的公式如下：

，

（3）对潜在图预测后作业环境的RGB图像进行图像分层，并逐层执行数据增强和伪标签算法处理，伪标签生成算法针对潜在图预测输出的联合节点集合，进行联合特征集的提取，对联合特征集使用聚类算法生成伪标签，得到潜在图预测无监督学习框架下含作业环境的RGB图像，如图5所示。

数据增强的公式为：

，

伪标签算法处理针对潜在图预测输出的联合节点集合，进行联合特征集的提取，对联合特征集使用聚类算法生成伪标签；联合特征集及聚类算法公式如下：

，

（4）根据所述的潜在图预测无监督学习框架下含作业环境的RGB图像，考虑到动态点云的分布不具有普遍的规律性且易出现点云的堆叠重合的问题，即时定位与地图构建如图6所示，通过区域增长算法剔除动态目标的类点云信息，即时定位与地图构建如图7所示，实现潜在图预测无监督学习框架下的视觉里程计。可高效实现种子搜索及边界处理。

通过对潜在图预测无监督学习框架下含作业环境的RGB图像的无监督学习动态目标的点云，区域增长算法对获得的动态目标的点云进行扫描，区分作业环境中的动态点云以及与其相邻的非动态点云并确定生长点，使用基于局部特征描述子的边缘特征提取确立生长边界，其中局部特征描述子采用点特征直方图。点特征直方图通过描述点云表面的特征信息从而进行特征点提取，即采用高维直方图泛化查询点周围的平均曲率来编码查询点的最近邻点的几何特性，以此描述采样表面的变化和局部几何结构，实现点云边缘特征提取。点特征直方图具有一定的判别性和鲁棒性。进而，对参与构网的种子点向外扩展延伸，大矩形内侧的虚线为原始点云的外边界，从边界各向外扩展一层新网格，扩展的虚拟网格与边界内的网格具有相同的尺寸，在每个扩展的网格中心内插一个虚拟种子点，搜索虚拟种子点的邻近格网，确定种子点。

对区域生长算法处理后动态目标的种子信息，根据种子信息的边界阈值，对区域增长内的动态点云进行滤除，实现潜在图预测无监督学习框架下的视觉里程计。

Claims

1.一种基于潜在图预测无监督学习框架的视觉里程计方法，其特征在于，包括以下步骤：

（2）对预处理后作业环境的RGB图像进行改进的潜在图预测处理，通过潜在图预测模型处理后，进行潜在图预测损失优化，得到潜在图预测后作业环境的RGB图像；潜在图预测模型的公式如下：

，

其中：为预处理后作业环境的RGB图像的图矩阵数据；/>为预处理后作业环境的RGB图像的潜在图矩阵数据的邻接矩阵；/>为预处理后作业环境的RGB图像潜在图矩阵数据的特征矩阵；/>为预处理后作业环境的RGB图像的潜在图矩阵数据；/>为潜在图预测模型处理后作业环境的RGB图像的特征矩阵；/>为潜在图预测模型处理后作业环境的RGB图像的节点嵌入；/>为预处理后作业环境的RGB图像的潜在图矩阵数据的邻接矩阵与特征矩阵的联合节点集；/>为潜在图预测模型处理后作业环境的RGB图像的重合节点嵌入；/>为预处理后作业环境的RGB图像的潜在图矩阵数据的邻接矩阵与潜在图预测模型处理后作业环境的RGB图像的特征矩阵的联合节点集；/>为预处理后作业环境的RGB图像的图矩阵数据与特征矩阵编码结果最小值；/>为潜在图预测模型的解码器函数；/>为潜在图预测模型的编码器函数；/>为潜在图预测模型处理后作业环境的RGB图像的元素均方差；/>为潜在图预测模型处理后作业环境的RGB图像的归属节点；/>为潜在图预测模型处理后作业环境的RGB图像的元素集合；

（3）对潜在图预测后作业环境的RGB图像进行图像分层，并逐层执行数据增强和伪标签算法处理，得到潜在图预测无监督学习框架下含作业环境的RGB图像；数据增强的公式为：

，

其中，为数据增强函数，/>为潜在图预测后作业环境的RGB图像的图像块，/>为潜在图预测后作业环境的RGB图像的图像块的均值，/>为数据增强后作业环境的RGB图像的图像块，/>为数据增强后作业环境的RGB图像的图像块的均值，/>为数据增强后作业环境的RGB图像的图像块的均值权重参数，/>为潜在图预测后作业环境的RGB图像的图像块与数据增强后作业环境的RGB图像的图像块的协方差，/>为潜在图预测后作业环境的RGB图像的图像块的标准差，/>为数据增强后作业环境的RGB图像的图像块的标准差，/>为数据增强后作业环境的RGB图像的图像块的方差权重参数；

所述伪标签算法处理针对潜在图预测输出的联合节点集合，进行联合特征集的提取，对联合特征集使用聚类算法生成伪标签；联合特征集及聚类算法公式如下：

，

其中，为潜在图预测输出的联合节点集合，/>为潜在图预测输出的联合节点数，/>为潜在图预测输出的第/>个联合节点，/>为潜在图预测无监督学习框架下含作业环境的RGB图像的伪标签集，/>为潜在图预测无监督学习框架下含作业环境的RGB图像的第/>个伪标签，/>为潜在图预测输出的第/>个联合节点与第/>个联合节点之间的距离，/>为潜在图预测输出的联合节点横向数量，/>为潜在图预测输出的联合节点纵向数量，/>为潜在图预测输出的第/>个联合节点中的联合特征集，/>为潜在图预测输出的第/>个联合节点中的联合特征集，/>为/>和/>的欧氏距离，/>为聚类算法函数，/>为潜在图预测输出的联合节点中的联合特征集，/>为聚类个数，/>为潜在图预测输出的联合特征集，/>为潜在图预测输出的联合特征集中第I/>个簇，/>为潜在图预测输出的联合特征集中簇的集合的元素；

2.根据权利要求1所述的视觉里程计方法，其特征在于，所述步骤（1）中对当前作业环境的RGB图像进行预处理包括畸变矫正和畸变矫正后的高斯滤波；对当前作业环境的RGB图像进行畸变矫正具体为：根据畸变模型解二元高阶非线性方程组，通过牛顿叠代法得到畸变矫正后的当前作业环境的RGB图像；畸变模型的公式如下:

；

其中，为相机坐标系空间一点在当前作业环境的RGB图像投影中畸变系数迭算后的横坐标值；/>为相机坐标系空间一点在当前作业环境的RGB图像投影中畸变系数迭算后的纵坐标值；/>为当前作业环境的RGB图像的一阶径向和切向畸变系数；/>为当前作业环境的RGB图像的二阶径向和切向畸变系数；/>为相机坐标系空间一点在当前作业环境的RGB图像投影中的横坐标与纵坐标平方和的平方根；/>为相机坐标系空间一点在当前作业环境的RGB图像投影中的横坐标；/>为相机坐标系空间一点在当前作业环境的RGB图像投影中的纵坐标；/>为相机坐标系空间一点在当前作业环境的RGB图像投影中的横坐标的牛顿法函数；/>为相机坐标系空间一点在当前作业环境的RGB图像投影中的纵坐标的牛顿法函数；/>为畸变矫正后的当前作业环境的RGB图像投影中第/>个像素点的横坐标值；/>为畸变矫正后的当前作业环境的RGB图像投影中第/>个像素点的纵坐标值；/>为畸变矫正后的当前作业环境的RGB图像投影中第/>个像素点的横坐标值；/>为畸变矫正后的当前作业环境的RGB图像投影中第/>个像素点的纵坐标值；/>为雅可比式在点/>处的值。

3.根据权利要求2所述的视觉里程计方法，其特征在于，对畸变矫正后的当前作业环境的RGB图像进行高斯滤波具体为：通过预设大小的高斯卷积核扫描RGB图像中的每一个像素，将得到的每一个像素的高斯卷积核做归一化处理，计算高斯滤波后高斯卷积核内中心点的值，即获得预处理后作业环境的RGB图像；高斯卷积核公式为：

，

4.根据权利要求3所述的视觉里程计方法，其特征在于，所述步骤（2）中潜在图预测损失优化的公式如下：

，

其中：为潜在图损失优化编码器系数；/>为潜在图损失优化解码器系数；/>为潜在图损失优化编码权重；/>为潜在图预测模型处理后作业环境的RGB图像的总节点数；/>为潜在图预测模型处理后作业环境的RGB图像的矩阵数量；/>为潜在图预测模型的编码器函数；/>为潜在图预测模型处理后作业环境的RGB图像的第/>个邻接矩阵；/>为潜在图预测模型处理后作业环境的RGB图像的第/>个特征矩阵；/>为潜在图预测模型处理后作业环境的RGB图像的第/>个归属节点；/>为潜在图损失优化解码权重；/>为潜在图预测模型的解码器函数；/>为潜在图预测模型处理后作业环境的RGB图像的元素集合；/>为潜在图损失优化。

5.根据权利要求4所述的视觉里程计方法，其特征在于，所述步骤（4）中通过潜在图预测无监督学习框架下含作业环境的RGB图像获得动态目标的点云，区域增长算法对获得的动态目标的点云进行扫描，得到作业环境中的动态点云以及与其相邻的非动态点云，并确定生长点，基于局部特征描述子的边缘特征提取确立生长边界，局部特征描述子采用点特征直方图，点特征直方图通过描述点云表面的特征信息从而进行特征点提取，对参与构网的种子点向外扩展延伸，确定原始点云的外边界，从边界各向外扩展一层新的虚拟网格，扩展的虚拟网格与边界内的网格具有相同的尺寸，在每个扩展的网格中心内插一个虚拟种子点，搜索虚拟种子点的邻近格网，确定种子点，根据种子点信息的边界阈值，对区域增长内的动态点云进行滤除，实现潜在图预测无监督学习框架下的视觉里程计。

6.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。

7.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。