CN110889361A

CN110889361A - 基于图像序列的orb特征视觉里程计学习方法和装置

Info

Publication number: CN110889361A
Application number: CN201911144014.XA
Authority: CN
Inventors: 付莹
Original assignee: Beijing Yingpu Technology Co Ltd
Current assignee: Beijing Yingpu Technology Co Ltd
Priority date: 2019-11-20
Filing date: 2019-11-20
Publication date: 2020-03-17
Also published as: US20220398746A1; WO2021098766A1

Abstract

本申请公开了一种基于图像序列的ORB特征视觉里程计学习方法和装置，该方法摄录图像将所得到的若干图像构成原始数据集；对原始数据集中的图像进行ORB特征提取，实现对于第一关键特征的提取；通过卷积神经网络对原始数据集中的连续图像进行特征提取并进行匹配，从顺序图像中提取丰富的第二关键特征；将对原始数据集中所提取出的第一关键特征和第二关键特征输入至多层长短时记忆网络进行训练学习，最终生成输出对于视觉里程计的估计。该申请通过ORB的特征提取，是由FAST特征和Brief描述子组成，是初始预处理步骤，从图像序列中提取丰富的第一关键特征，然后使用跟踪算法来跟踪连续帧中的这些特征，以此产生来自图像序列的光流估计。

Description

基于图像序列的ORB特征视觉里程计学习方法和装置

技术领域

本申请涉及轨迹测距技术领域，特别是涉及一种基于图像序列的ORB特征视觉里程计学习方法和装置。

背景技术

视觉里程计(VO)是通过车载摄像头或移动机器人的运动所引起的图像的变化，以逐步估计车辆姿态的过程。视觉里程计是一个很重要的同步定位与建图(SLAM)特性，其依靠视觉传感器，从几个相邻图像中，希望测量一个运动物体的轨迹。但通常，视觉里程计只关心局部时间上的运动，多数时候是指两个时刻间的运动，在以某种间隔对时间进行采样时，就可以估计物体在各时间间隔之内的运动，但是这个估计受噪声的影响，一旦先前时刻的估计存在误差，那么就会在之后的运动上会累加，这个情况被称为漂移，是评价slam的一个重要指标。视觉里程计的主要方式分为特征点法和直接方法，其中特征点法比较主流，可以在噪声较大，相机运动较快时工作。

现有的与深度学习结合的视觉里程计方法，如基于非监督深度学习的单目视觉里程计(UnDeepVO)，该模型的提出主要有2个突出的特点：一是非监督的深度学习策略，二是可以计算绝对的尺度。UnDeepVO是一个单目的SLAM系统，用连续的单目影像测试，但是，在训练的时候输入是立体影像对获取的尺度来训练UnDeepVO，它的损失函数是基于时空的密集数据来定义的，模型由一个位姿估计器和一个深度估计器组成，它们的输入都是连续的单目影像，分别输出6-DoF的位姿值和深度值。位姿估计器是一个基于VGG的卷积神经网络，输入两张序列单目影像来预测它们之间6个自由度的转换。在最后一个卷积层后用两个有完全连接层的单独集来分开平移和旋转参数。引入权重归一化旋转和平移，从而得到更好的预测值。深度估计器主要是基于编码-解码来得到密集的深度图。关于利用影像视差(逆深度)的深度估计方法，他们采用直接预测深度图的方式来训练。

目前的这些方法无法以高效的方式回归测距，并且在解决视觉漂移方面，平均漂移结果不够优秀。

发明内容

本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。

根据本申请的一个方面，提供了一种基于图像序列的ORB特征视觉里程计学习方法，包括：

摄录图像并将所得到的若干图像构成原始数据集；

对所述原始数据集中的图像进行ORB特征提取，用于实现对于第一关键特征的提取；

通过卷积神经网络对原始数据集中的连续图像进行特征提取并进行匹配，从顺序图像中提取丰富的第二关键特征；

将对原始数据集中所提取出的第一关键特征和第二关键特征输入至堆叠的多层长短时记忆网络进行训练学习，最终生成输出对于视觉里程计的估计。

优选地，对所述原始数据集中的图像进行ORB特征提取，用于实现对于第一关键特征的提取，包括：

使用FAST检测输入图像中的关键点生成FAST特征点，然后根据Harris角点检测算子从图像中选取若干个点，再使用Brief描述子生成算法进行的抗噪性和旋转不变性的改进，最终根据时间戳排列所述原始数据集中的图像的序列，并通过ORB检测器从排序好的图像中的连续关键帧里提取所述第一关键特征。

优选地，在排列好的图像序列中提取出所述第一关键特征后，采用Lucas-Kanade光流观察所述ORB特征提取的过程，进一步筛选出符合图像关键点的第一关键特征。

优选地，摄录图像并将所得到的若干图像构成原始数据集，包括：

采用两组相机同时摄录待观测的图像，并按时刻将两组相机摄录的图像进行配对后进行有序排列，构成所述原始数据集。

优选地，通过卷积神经网络对原始数据集中的连续图像进行特征提取并进行匹配，从顺序图像中提取丰富的第二关键特征，包括：

所述卷积神经网络的体系结构采用类FlowNetCorr结构的向下卷积层，将所述原始数据集中的一对图片分开处理，分别进入卷积层提取各自的特征，然后再对这一对图片中的特征进行匹配，依序不断从连续图像中提取运动信息，提取出所述第二关键特征。

优选地，将对原始数据集中所提取出的第一关键特征和第二关键特征输入至堆叠的多层长短时记忆网络进行训练学习，最终生成输出对于视觉里程计的估计，包括：

所述多层长短时记忆网络中包括多个LSTM层，每一LSTM层中设置有遗忘门，遗忘门的偏置参数随机初始化，每一LSTM层中使用的激活函数采用的线性激活函数，每一LSTM层中还包括一个用于防止梯度消失的存储单元，综合第一关键特征和第二关键特征，使用来自先前状态的位姿信息预测在当前状态下的位姿信息，进而对于视觉里程计的估计。

根据本申请的另一个方面，还提供了一种基于图像序列的ORB特征视觉里程计学习装置，包括：

图像获取模块，其配置成通过相机摄录图像并将所得到的若干图像构成原始数据集；

ORB特征提取模块，其配置成对所述原始数据集中的图像进行ORB特征提取，用于实现对于第一关键特征的提取；

卷积神经网络训练模块，其配置成通过卷积神经网络对原始数据集中的连续图像进行特征提取并进行匹配，从顺序图像中提取丰富的第二关键特征；

长短时记忆网络训练模块，其配置成将对原始数据集中所提取出的第一关键特征和第二关键特征输入至堆叠的多层长短时记忆网络进行训练学习，最终生成输出对于视觉里程计的估计。

优选地，在ORB特征提取模块中，其配置成对所述原始数据集中的图像进行ORB特征提取，用于实现对于第一关键特征的提取，包括：

使用FAST检测输入图像中的关键点生成FAST特征点，然后根据Harris角点检测算子从图像中选取若干个点，再使用Brief描述子生成算法进行的抗噪性和旋转不变性的改进，最终根据时间戳排列所述原始数据集中的图像的序列，并通过ORB检测器从排序好的图像中的连续关键帧里提取所述第一关键特征；

在排列好的图像序列中提取出所述第一关键特征后，采用Lucas-Kanade光流观察所述ORB特征提取的过程，进一步筛选出符合图像关键点的第一关键特征。

优选地，图像获取模块中配置有两组相机，两组相机中设置的摄录机构对应相同，并按时刻将两组相机摄录的图像进行配对后进行有序排列，构成所述原始数据集，卷积神经网络训练模块配置成通过卷积神经网络对原始数据集中的连续图像进行特征提取并进行匹配，从顺序图像中提取丰富的第二关键特征，包括：

优选地，长短时记忆网络训练模块配置成将对原始数据集中所提取出的第一关键特征和第二关键特征输入至堆叠的多层长短时记忆网络进行训练学习，最终生成输出对于视觉里程计的估计，包括：

根据本申请的又一个方面，提供了一种计算设备，包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序，其中，所述处理器执行所述计算机程序时实现如上所述的方法。

根据本申请的又一个方面，提供了一种计算机可读存储介质，优选为非易失性可读存储介质，其内存储有计算机程序，所述计算机程序在由处理器执行时实现如上所述的方法。

根据本申请的又一个方面，提供了一种计算机程序产品，包括计算机可读代码，当所述计算机可读代码由计算机设备执行时，导致所述计算机设备执行如上所述的方法。

本申请所提供的技术方案，能够从连续的图像序列中提取丰富的特征，并随着关键帧队列的特征输入以跟踪这些特征，再通过选择合适的卷积神经网络架构，减小输入特征的维数，提取运动信息输出到多层的长短时记忆网络，通过训练实现对于视觉里程计的估计，输出运动物体的位姿估计。

根据下文结合附图对本申请的具体实施例的详细描述，本领域技术人员将会更加明了本申请的上述以及其他目的、优点和特征。

附图说明

后文将参照附图以示例性而非限制性的方式详细描述本申请的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解，这些附图未必是按比例绘制的。附图中：

图1是根据本申请一个实施例的基于图像序列的ORB特征视觉里程计学习方法流程图；

图2是根据本申请另一个实施例的基于图像序列的ORB特征视觉里程计学习装置结构图；

图3是根据本申请另一个实施例的计算设备结构图；

图4是根据本申请另一个实施例的计算机可读存储介质结构图。

具体实施方式

图1是根据本申请一个实施例的基于图像序列的ORB特征视觉里程计学习方法流程图。参见图1，该基于图像序列的ORB特征视觉里程计学习方法，包括：

101：摄录图像并将所得到的若干图像构成原始数据集；

102：对所述原始数据集中的图像进行ORB特征提取，用于实现对于第一关键特征的提取；

103：通过卷积神经网络对原始数据集中的连续图像进行特征提取并进行匹配，从顺序图像中提取丰富的第二关键特征；

104：将对原始数据集中所提取出的第一关键特征和第二关键特征输入至堆叠的多层长短时记忆网络进行训练学习，最终生成输出对于视觉里程计的估计。

ORB的特征提取，是由FAST特征和Brief描述子组成，是初始预处理步骤，从图像序列中提取丰富的第一关键特征，然后使用跟踪算法来跟踪连续帧中的这些特征，以此产生来自图像序列的光流估计。

具体说来，是使用FAST检测输入图像中的关键点生成FAST特征点，然后根据Harris角点检测算子从图像中选取若干个点，再使用Brief描述子生成算法进行的抗噪性和旋转不变性的改进，最终根据时间戳排列所述原始数据集中的图像的序列，并通过ORB检测器从排序好的图像中的连续关键帧里提取所述第一关键特征。在排列好的图像序列中提取出所述第一关键特征后，采用Lucas-Kanade光流观察所述ORB特征提取的过程，进一步筛选出符合图像关键点的第一关键特征。

优选地，摄录图像并将所得到的若干图像构成原始数据集，包括：采用两组相机同时摄录待观测的图像，并按时刻将两组相机摄录的图像进行配对后进行有序排列，构成所述原始数据集。

图2是根据本申请另一个实施例的基于图像序列的ORB特征视觉里程计学习装置结构图。参见图2，该基于图像序列的ORB特征视觉里程计装置，包括：

图像获取模块201，其配置成通过相机摄录图像并将所得到的若干图像构成原始数据集；

ORB特征提取模块202，其配置成对所述原始数据集中的图像进行ORB特征提取，用于实现对于第一关键特征的提取；

卷积神经网络训练模块203，其配置成通过卷积神经网络对原始数据集中的连续图像进行特征提取并进行匹配，从顺序图像中提取丰富的第二关键特征；

长短时记忆网络训练模块204，其配置成将对原始数据集中所提取出的第一关键特征和第二关键特征输入至堆叠的多层长短时记忆网络进行训练学习，最终生成输出对于视觉里程计的估计。

优选地，在ORB特征提取模块202中，其配置成对所述原始数据集中的图像进行ORB特征提取，用于实现对于第一关键特征的提取，包括：

优选地，图像获取模块201中配置有两组相机，两组相机中设置的摄录机构对应相同，并按时刻将两组相机摄录的图像进行配对后进行有序排列，构成所述原始数据集，卷积神经网络训练模块203配置成通过卷积神经网络对原始数据集中的连续图像进行特征提取并进行匹配，从顺序图像中提取丰富的第二关键特征，包括：

优选地，长短时记忆网络训练模块204配置成将对原始数据集中所提取出的第一关键特征和第二关键特征输入至堆叠的多层长短时记忆网络进行训练学习，最终生成输出对于视觉里程计的估计，包括：

本申请实施例还提供了一种计算设备，参照图3，该计算设备包括存储器1120、处理器1110和存储在所述存储器1120内并能由所述处理器1110运行的计算机程序，该计算机程序存储于存储器1120中的用于程序代码的空间1130，该计算机程序在由处理器1110执行时实现用于执行任一项根据本发明的方法步骤1131。

本申请实施例还提供了一种计算机可读存储介质。参照图4，该计算机可读存储介质包括用于程序代码的存储单元，该存储单元设置有用于执行根据本发明的方法步骤的程序1131′，该程序被处理器执行。

本申请实施例还提供了一种包含指令的计算机程序产品。当该计算机程序产品在计算机上运行时，使得计算机执行根据本发明的方法步骤。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、获取其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

专业人员应该还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令处理器完成，所述的程序可以存储于计算机可读存储介质中，所述存储介质是非短暂性(英文：non-transitory)介质，例如随机存取存储器，只读存储器，快闪存储器，硬盘，固态硬盘，磁带(英文：magnetic tape)，软盘(英文：floppy disk)，光盘(英文：optical disc)及其任意组合。

以上所述，仅为本申请较佳的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应该以权利要求的保护范围为准。

Claims

1.一种基于图像序列的ORB特征视觉里程计学习方法，包括：

摄录图像并将所得到的若干图像构成原始数据集；

2.根据权利要求1所述的基于图像序列的ORB特征视觉里程计学习方法，其特征在于，对所述原始数据集中的图像进行ORB特征提取，用于实现对于第一关键特征的提取，包括：

3.根据权利要求2所述的基于图像序列的ORB特征视觉里程计学习方法，其特征在于，在排列好的图像序列中提取出所述第一关键特征后，采用Lucas-Kanade光流观察所述ORB特征提取的过程，进一步筛选出符合图像关键点的第一关键特征。

4.根据权利要求1所述的基于图像序列的ORB特征视觉里程计学习方法，其特征在于，摄录图像并将所得到的若干图像构成原始数据集，包括：

5.根据权利要求4所述的基于图像序列的ORB特征视觉里程计学习方法，其特征在于，通过卷积神经网络对原始数据集中的连续图像进行特征提取并进行匹配，从顺序图像中提取丰富的第二关键特征，包括：

6.根据权利要求5所述的基于图像序列的ORB特征视觉里程计学习方法，其特征在于，将对原始数据集中所提取出的第一关键特征和第二关键特征输入至堆叠的多层长短时记忆网络进行训练学习，最终生成输出对于视觉里程计的估计，包括：

7.一种基于图像序列的ORB特征视觉里程计学习装置，包括：

8.根据权利要求7所述的基于图像序列的ORB特征视觉里程计学习装置，其特征在于，在ORB特征提取模块中，其配置成对所述原始数据集中的图像进行ORB特征提取，用于实现对于第一关键特征的提取，包括：

9.根据权利要求7所述的基于图像序列的ORB特征视觉里程计学习装置，其特征在于，图像获取模块中配置有两组相机，两组相机中设置的摄录机构对应相同，并按时刻将两组相机摄录的图像进行配对后进行有序排列，构成所述原始数据集，卷积神经网络训练模块配置成通过卷积神经网络对原始数据集中的连续图像进行特征提取并进行匹配，从顺序图像中提取丰富的第二关键特征，包括：

10.根据权利要求7所述的基于图像序列的ORB特征视觉里程计学习装置，其特征在于，长短时记忆网络训练模块配置成将对原始数据集中所提取出的第一关键特征和第二关键特征输入至堆叠的多层长短时记忆网络进行训练学习，最终生成输出对于视觉里程计的估计，包括：