CN112102388B

CN112102388B - 基于巡检机器人单目图像获取深度图像的方法及装置

Info

Publication number: CN112102388B
Application number: CN202010987267.XA
Authority: CN
Inventors: 程德强; 付新竹; 李纳森; 寇旗旗; 陈亮亮; 龚飞
Original assignee: China University of Mining and Technology CUMT
Current assignee: China University of Mining and Technology CUMT
Priority date: 2020-09-18
Filing date: 2020-09-18
Publication date: 2024-03-26
Anticipated expiration: 2040-09-18
Also published as: CN112102388A

Abstract

本发明涉及一种基于巡检机器人单目图像获取深度图像的方法及装置，属于图像处理技术领域，解决了现有现有的方法获得的深度图像精确度较低的问题。方法包括：构建多尺度卷积神经网络；所述多尺度卷积神经网络包括第一尺度卷积神经网络、第二尺度卷积神经网络和第三尺度卷积神经网络；基于变焦距数据集对所述多尺度卷积神经网络进行训练，得到多尺度卷积神经网络的最优网络结构并保存；将巡检机器人拍摄的单目图像输入所述多尺度卷积神经网络的最优网络结构，得到单目图像对应的深度图像，提高了深度图像的精确度。

Description

基于巡检机器人单目图像获取深度图像的方法及装置

技术领域

本发明涉及图像处理技术领域，尤其涉及一种基于巡检机器人单目图像获取深度图像的方法及装置。

背景技术

随着目前技术的不断发展与完善，中国已将机器人和智能制造纳入国家科技创新的优先重点领域。巡检机器人中对于三维场景的判断和感知成为主要难题，其根本在于二维图像的深度信息恢复。当今算法对于图形的表达不仅仅停留在二维阶段，对于有空间深度信息的三维图形的应用越来越广泛，并且根据二维图像转换成三维图像的工程项目也越来越普及，利于机械加工、建筑设计、动画制作等等。对于二维到三维图像的重建最主要的环节就是恢复其原本基于自然场景的深度信息，这个深度信息在三维降二维的过程中丢失，因此就意味着重建的过程是一个病态过程。

传统方法提出的通过双目视觉或者图像本身的纹理特征信息等获得深度图像都具有一定的局限性，获得的深度图像精确度较低，并且日常生活中标准的双目图像难以获得，具有突出特征纹理信息的照片需要一定的后期处理才能得到。

发明内容

鉴于上述的分析，本发明实施例旨在提供一种基于巡检机器人单目图像获取深度图像的方法及装置，用以解决现有的方法获得的深度图像精确度较低的问题。

一方面，本发明实施例提供了一种基于巡检机器人单目图像获取深度图像的方法，包括如下步骤：

构建多尺度卷积神经网络；所述多尺度卷积神经网络包括第一尺度卷积神经网络、第二尺度卷积神经网络和第三尺度卷积神经网络，其中，所述第一尺度卷积神经网络用于提取单目图像的全局特征，得到低分辨率图像；所述第二尺度卷积神经网络用于提取所述低分率图像的局部特征，得到高分辨率图像；所述第三尺度卷积神经网络用于对所述第二尺度输出的高分辨率图像进行卷积优化，得到单目图像对应的深度图像；

基于变焦距数据集对所述多尺度卷积神经网络进行训练，得到多尺度卷积神经网络的最优网络结构并保存；所述变焦距数据集基于固定焦距数据集转换得到，包括由单目图像及对应的深度图像所组成的训练数据对；

将巡检机器人拍摄的单目图像输入所述多尺度卷积神经网络的最优网络结构，得到单目图像对应的深度图像。

进一步，所述第一尺度卷积神经网络包括DenseNet单元和第一上采样单元，其中，所述DenseNet单元包括输入层、中间层和输出层；

所述输入层，用于对输入的单目图像进行归一化预处理；

所述中间层，用于对归一化预处理后的单目图像进行全局特征提取，得到全局子特征图像；

所述输出层，用于对所述中间层输出的全局子特征图像进行卷积，得到单目图像对应的全局特征图像；

所述第一上采样单元，用于对所述输出层输出的全局特征图像进行上采样，得到低分辨率图像。

进一步，所述第二尺度包括：

第一卷积层，用于对所述第一尺度模块输出的低分辨率图像进行局部特征提取，得到单目图像对应的局部特征图像；所述局部特征包括SIFT特征；

第二上采样单元，用于对所述第一卷积层输出的局部特征图像进行上采样，得到高分辨率图像。

进一步，所述第一上采样单元和第二上采样单元基于最近邻算法、双线性插值算法或转置卷积实现上采样。

进一步，基于变焦距数据集对所述多尺度卷积神经网络进行训练，得到多尺度卷积神经网络的最优网络结构，包括如下步骤：

获取用于训练多尺度卷积神经网络的变焦距数据集并输入至多尺度卷积神经网络；

计算所述多尺度卷积神经网络的损失函数，当所述多尺度卷积神经网络的损失函数小于阈值门槛时，得到多尺度卷积神经网络的最优网络结构。

另一方面，本发明实施例提供了一种基于巡检机器人单目图像获取深度图像的装置，包括：

网络构建模块，用于构建多尺度卷积神经网络；所述多尺度卷积神经网络包括第一尺度卷积神经网络、第二尺度卷积神经网络和第三尺度卷积神经网络，其中，所述第一尺度卷积神经网络用于提取单目图像的全局特征，得到低分辨率图像；所述第二尺度卷积神经网络用于提取所述低分率图像的局部特征，得到高分辨率图像；所述第三尺度卷积神经网络用于对所述第二尺度输出的高分辨率图像进行卷积优化，得到单目图像对应的深度图像；

网络训练模块，用于根据变焦距数据集对所述多尺度卷积神经网络进行训练，得到多尺度卷积神经网络的最优网络结构并保存；所述变焦距数据集基于固定焦距数据集转换得到，包括由单目图像及对应的深度图像所组成的训练数据对；

深度图像获取模块，用于将巡检机器人拍摄的单目图像输入所述多尺度卷积神经网络的最优网络结构，得到单目图像对应的深度图像。

所述输入层，用于对输入的单目图像进行归一化预处理；

进一步，所述第二尺度包括：

获取用于训练多尺度卷积神经网络的变焦距数据集；

将变焦距数据集中的训练数据对输入多尺度卷积神经网络；

基于所述训练数据计算多尺度卷积神经网络的损失函数，所述多尺度卷积神经网络的损失函数小于阈值门槛时，得到多尺度卷积神经网络的最优网络结构。

与现有技术相比，本发明至少可实现如下有益效果之一：

1、基于巡检机器人单目图像获取深度图像的方法，通过卷积神经网络提取了单目图像的全局特征和局部特征，得到了单目图像对应的深度图像，同时采用变焦距数据集对多尺度卷积神经网络进行训练，得到了多尺度卷积神经网络的最优网络结构，在提高单目图像深度信息恢复的准确性的同时，提高单目图像对应深度图像的精确度。

2、通过多尺度卷积神经网络分别提取了巡检机器人拍摄的单目图像的全局特征和局部特征，得到了高分辨率图像，最后使用第三尺度卷积神经网络对高分辨率图像进行卷积优化，得到了单目图像对应的深度图像，解决了现有的方法难以获得双目图像且提取的单目图像对应的深度图像精确度较低的问题，简单易行、易于实施，提高了深度图像的精确度。

3、基于第一尺度卷积神经网络对单目图像的全局特征进行提取，DenseNet单元与上采样相互配合，能够快速、高效的提取单目图像的全局特征，得到单目图像对应的低分辨率图像。

4、通过采用变焦距数据集对多尺度卷积神经网络进行训练，得到了多尺度卷积神经网络的最优网络结构，解决了现有的网络训练时基于固定焦距数据集造成的网络精确度较低的问题，在提高单目图像深度信息恢复的准确性的同时，提高了单目图像对应深度图像的精确度。

本发明中，上述各技术方案之间还可以相互组合，以实现更多的优选组合方案。本发明的其他特征和优点将在随后的说明书中阐述，并且，部分优点可从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过说明书以及附图中所特别指出的内容中来实现和获得。

附图说明

附图仅用于示出具体实施例的目的，而并不认为是对本发明的限制，在整个附图中，相同的参考符号表示相同的部件。

图1为一个实施例中基于巡检机器人单目图像获取深度图像的方法流程图；

图2为一个实施例中多尺度卷积神经网络结构图；

图3为另一个实施例中基于巡检机器人单目图像获取深度图像的装置结构图；

附图标记：

100-网络构建模块，200-网络训练模块，300-深度图像获取模块。

具体实施方式

下面结合附图来具体描述本发明的优选实施例，其中，附图构成本申请一部分，并与本发明的实施例一起用于阐释本发明的原理，并非用于限定本发明的范围。

传统方法提出的通过双目视觉或者图像本身的纹理特征信息等获得深度图像都具有一定的局限性，获得的深度图像精确度较低，并且日常生活中标准的双目图像难以获得，具有突出特征纹理信息的照片需要一定的后期处理才能得到。为此，本申请提出一种基于巡检机器人单目图像获取深度图像的方法及装置，通过构造的多尺度卷积神经网络提取巡检机器人拍摄的单目图像对应的深度图像，其中，多尺度卷积神经网络中的第一尺度卷积神经网络能够提取单目图像的全局特征，第二尺度卷积神经网络能够提取单目图像的局部特征，第三尺度卷积神经网络能够对第二尺度卷积神经网络获得的高分辨率图像进行卷积优化，得到单目图像对应的深度图像，解决了现有的深度图像提取方法获得的深度图像精确度较低的问题，提高了获得的单目图像对应的深度的精确度，具有较高的实用价值。

本发明的一个具体实施例，公开了一种基于巡检机器人单目图像获取深度图像的方法，如图1所示。包括如下步骤S1～S3。

步骤S1、构建多尺度卷积神经网络；多尺度卷积神经网络包括第一尺度卷积神经网络、第二尺度卷积神经网络和第三尺度卷积神经网络，其中，第一尺度卷积神经网络用于提取单目图像的全局特征，得到低分辨率图像；第二尺度卷积神经网络用于提取所述低分率图像的局部特征，得到高分辨率图像；第三尺度卷积神经网络用于对所述第二尺度输出的高分辨率图像进行卷积优化，得到单目图像对应的深度图像。

具体来说，如图2所示的多尺度卷积神经网络结构图所示，本申请中构建的多尺度卷积神经网络从三个尺度分别提取了单目图像的不同特征，第一尺度卷积神经网络主要是提取巡检机器人拍摄的单目图像的全局特征，本申请中单目图像的全局特征包括纹理、颜色、形状等，第二尺度卷积神经网络主要是根据第一尺度卷积神经网络得到的低分辨率图像提取局部特征，得到高分辨率图像，其中，局部特征包括SIFT特征，能够在有局部遮挡或者仿射变换的时候仍然能很好的还原单目图像原来的信息。第三尺度卷积神经网络主要作用是对第二尺度获得的高分辨率图像进行卷积优化，得到最终的深度图像。

通过多尺度卷积神经网络分别提取了巡检机器人拍摄的单目图像的全局特征、局部特征，得到了高分辨率图像，最后使用第三尺度卷积神经网络对高分辨率图像进行卷积优化，得到了单目图像对应的深度图像，解决了现有的方法难以获得双目图像且提取的单目图像对应的深度图像精确度较低的问题，简单易行、易于实施，提高了深度图像的精确度。

优选地，第一尺度卷积神经网络包括DenseNet单元和第一上采样单元，其中，DenseNet单元包括输入层、中间层和输出层；输入层，用于对输入的单目图像进行归一化预处理；中间层，用于对归一化预处理后的单目图像进行全局特征提取，得到全局子特征图像；输出层，用于对所述中间层输出的全局子特征图像进行卷积，得到单目图像对应的全局特征图像；第一上采样单元，用于对所述输出层输出的全局特征图像进行上采样，得到低分辨率图像。

具体来说，第一尺度卷积神经网络中的DenseNet单元主要是提取单目图像的全局特征，而第一上采样单元是实现对单目图像的尺寸变换，第一上采样单元可采用最近邻算法、双线性插值算法或转置卷积实现上采样。基于输入多尺度卷积神经网络的尺寸为320×240的单目图像，经过DenseNet单元后得到尺寸为15×20的全局特征图像，基于第一上采样单元得到尺寸为64×80的低分辨率图像。其中，DenseNet单元包括输入层、中间层和输出层，其中，输入层采用“Cov2d+BN+Relu”结构，“Cov2d”表示卷积层，能够对单目图像进行卷积处理，“BN”表示归一化层，用于对卷积处理后的单目图像进行归一化处理，以加快多尺度卷积神经网络后期的训练速度，“Relu”表示深度学习中的Relu激活函数。中间层包括DenseBlock_1、DenseBlock_2和连接层，其中，DenseBlock_1包含6个卷积层，DenseBlock_2中包含12个卷积层，连接层采用“Cov2d+BN+Relu”结构，以实现两个DenseBlock间的连接。输出层采用“Cov2d”结构，主要是对上一层输出的图像进行卷积。

基于第一尺度卷积神经网络对单目图像进行全局特征提取，DenseNet单元与上采样相互配合，能够快速、高效的提取单目图像的全局特征，得到单目图像对应的低分辨率图像。

优选地，第二尺度包括：第一卷积层，用于对第一尺度模块输出的低分辨率图像进行局部特征提取，得到单目图像对应的局部特征图像；所述局部特征包括SIFT特征；第二上采样单元，用于对第一卷积层输出的局部特征图像进行上采样，得到高分辨率图像。

具体的，第二尺度卷积神经网络包括一个卷积层和一个上采样单元，其中，卷积层中卷积核的大小为3×3，步长为2。第二上采样单元可采用最近邻算法、双线性插值算法、转置卷积中的任意一种实现上采样。第一卷积层输出的尺寸为64×80的局部特征图像经过第二上采样单元可得到尺寸为128×160的高分辨率图像。基于第二尺度卷积神经网络中的卷积层与上采样单元的相互配合，实现了单目图像对应的局部特征的提取。

步骤S2、基于变焦距数据集对多尺度卷积神经网络进行训练，得到多尺度卷积神经网络的最优网络结构并保存；变焦距数据集基于固定焦距数据集转换得到，包括由单目图像及对应的深度图像所组成的训练数据对。具体来说，变焦距数据集是基于固定焦距数据集变换得到，固定焦距数据集转换得到变焦距数据集的方法为常用的方法。本申请中，可直接采用标准公开的变焦距数据集对多尺度卷积神经网络进行训练。变焦距数据集中包括多组训练数据对，每一训练数据对均包含用于网络训练的单目图像及与之对应的深度图像。可经过多组训练数据对重复对多尺度卷积神经网络进行训练，以得到多尺度卷积神经网络的最优网络结构。同时，使用变焦距数据集对网络训练得到的网络结构，能够提高单目图像深度信息恢复的准确性，且提高了单目图像对应深度图像的精确度。

优选地，基于变焦距数据集对多尺度卷积神经网络进行训练，得到多尺度卷积神经网络的最优网络结构，包括如下步骤：

计算多尺度卷积神经网络的损失函数，当多尺度卷积神经网络的损失函数小于阈值门槛时，得到多尺度卷积神经网络的最优网络结构。

具体来说，变焦距数据集包括多组训练数据对，每一训练数据对均包含单目图像及与之对应的深度图像，构成(I_lr，I_hr)，其中，I_lr为用于训练的单目图像，I_hr为单目图像对应的深度图像。将训练数据对输入至多尺度卷积神经网络后，计算损失函数L₀＝Loss(I_hr,I_lr)＝(I_hr-I_lr)²，判断是否满足L0＜10^-5，若是，则结束网络训练，得到多尺度卷积神经网络的最优网络结构，若否，循环迭代训练数据对，直至得到多尺度卷积神经网络的最优网络结构。

通过采用变焦距数据集对多尺度卷积神经网络进行训练，得到了多尺度卷积神经网络的最优网络结构，解决了现有的网络训练时基于固定焦距数据集造成的网络精确度较低的问题，在提高单目图像深度信息恢复的准确性的同时，提高了单目图像对应深度图像的精确度。

步骤S3、将巡检机器人拍摄的单目图像输入多尺度卷积神经网络的最优网络结构，得到单目图像对应的深度图像。得到多尺度卷积神经网络的最优网络结构后，可将巡检机器人拍摄的单目图像输入至多尺度卷积神经网络的最优网络结构进行深度图像提取，得到高精度的深度图像。

与现有技术相比，本实施例提供的基于巡检机器人单目图像获取深度图像的方法，通过卷积神经网络提取了单目图像的全局特征和局部特征，最终得到了单目图像对应的深度图像，同时采用变焦距数据集对多尺度卷积神经网络进行训练，得到了多尺度卷积神经网络的最优网络结构，在提高单目图像深度信息恢复的准确性的同时，提高了单目图像对应深度图像的精确度。

本发明的另一个具体实施例，公开了一种基于巡检机器人单目图像获取深度图像的装置，如图3所示，包括网络构建模块100，用于构建多尺度卷积神经网络；多尺度卷积神经网络包括第一尺度卷积神经网络、第二尺度卷积神经网络和第三尺度卷积神经网络，其中，第一尺度卷积神经网络用于提取单目图像的全局特征，得到低分辨率图像；第二尺度卷积神经网络用于提取低分率图像的局部特征，得到高分辨率图像；第三尺度卷积神经网络用于对第二尺度输出的高分辨率图像进行卷积优化，得到单目图像对应的深度图像；网络训练模块200，用于根据变焦距数据集对多尺度卷积神经网络进行训练，得到多尺度卷积神经网络的最优网络结构并保存；变焦距数据集基于固定焦距数据集转换得到，包括由单目图像及对应的深度图像所组成的训练数据对；深度图像获取模块300，用于将巡检机器人拍摄的单目图像输入多尺度卷积神经网络的最优网络结构，得到单目图像对应的深度图像。

通过网络构建模块构建得到了卷积神经网络，以此提取得到单目图像的全局特征和局部特征，最终得到了深度图像，同时采用变焦距数据集对多尺度卷积神经网络进行训练，得到了多尺度卷积神经网络的最优网络结构，在提高单目图像深度信息恢复的准确性的同时，提高单目图像对应深度图像的精确度。

优选地，第一尺度卷积神经网络包括DenseNet单元和第一上采样单元，其中，DenseNet单元包括输入层、中间层和输出层；输入层，用于对输入的单目图像进行归一化预处理；中间层，用于对归一化预处理后的单目图像进行全局特征提取，得到全局子特征图像；输出层，用于对所述中间层输出的全局子特征图像进行卷积，得到单目图像对应的全局特征图像；第一上采样单元，用于对输出层输出的全局特征图像进行上采样，得到低分辨率图像。

通过基于第一尺度卷积神经网络对单目图像的全局特征进行提取，DenseNet单元与上采样相互配合，能够快速、高效的提取单目图像的全局特征，得到单目图像对应的低分辨率图像。

优选地，第一上采样单元和第二上采样单元基于最近邻算法、双线性插值算法或转置卷积实现上采样。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于巡检机器人单目图像获取深度图像的方法，其特征在于，包括如下步骤：

构建多尺度卷积神经网络；所述多尺度卷积神经网络包括第一尺度卷积神经网络、第二尺度卷积神经网络和第三尺度卷积神经网络，其中，所述第一尺度卷积神经网络包括DenseNet单元和第一上采样单元，用于提取单目图像的全局特征，得到低分辨率图像；所述第二尺度卷积神经网络包括第一卷积层和第二上采样单元，用于提取所述低分辨率图像的局部特征，得到高分辨率图像；所述第三尺度卷积神经网络用于对所述第二尺度输出的高分辨率图像进行卷积优化，得到单目图像对应的深度图像；其中，所述全局特征包括纹理、颜色和形状；所述局部特征包括SIFT特征；

2.根据权利要求1所述的基于巡检机器人单目图像获取深度图像的方法，其特征在于，所述DenseNet单元包括输入层、中间层和输出层；

所述输入层，用于对输入的单目图像进行归一化预处理；

3.根据权利要求2所述的基于巡检机器人单目图像获取深度图像的方法，其特征在于，所述第二尺度卷积神经网络包括：

第一卷积层，用于对所述第一尺度卷积神经网络输出的低分辨率图像进行局部特征提取，得到单目图像对应的局部特征图像；

4.根据权利要求3所述的基于巡检机器人单目图像获取深度图像的方法，其特征在于，所述第一上采样单元和第二上采样单元基于最近邻算法、双线性插值算法或转置卷积实现上采样。

5.根据权利要求1所述的基于巡检机器人单目图像获取深度图像的方法，其特征在于，基于变焦距数据集对所述多尺度卷积神经网络进行训练，得到多尺度卷积神经网络的最优网络结构，包括如下步骤：

计算所述多尺度卷积神经网络的损失函数，当所述损失函数小于阈值门槛时，得到多尺度卷积神经网络的最优网络结构。

6.一种基于巡检机器人单目图像获取深度图像的装置，其特征在于，包括：

网络构建模块，用于构建多尺度卷积神经网络；所述多尺度卷积神经网络包括第一尺度卷积神经网络、第二尺度卷积神经网络和第三尺度卷积神经网络，其中，所述第一尺度卷积神经网络包括DenseNet单元和第一上采样单元，用于提取单目图像的全局特征，得到低分辨率图像；所述第二尺度卷积神经网络包括第一卷积层和第二上采样单元，用于提取所述低分辨率图像的局部特征，得到高分辨率图像；所述第三尺度卷积神经网络用于对所述第二尺度输出的高分辨率图像进行卷积优化，得到单目图像对应的深度图像；其中，所述全局特征包括纹理、颜色和形状；所述局部特征包括SIFT特征；

7.根据权利要求6所述的基于巡检机器人单目图像获取深度图像的装置，其特征在于，所述DenseNet单元包括输入层、中间层和输出层；

所述输入层，用于对输入的单目图像进行归一化预处理；

8.根据权利要求6所述的基于巡检机器人单目图像获取深度图像的装置，其特征在于，所述第二尺度卷积神经网络包括：

9.根据权利要求8所述的基于巡检机器人单目图像获取深度图像的装置，其特征在于，所述第一上采样单元和第二上采样单元基于最近邻算法、双线性插值算法或转置卷积实现上采样。

10.根据权利要求6所述的基于巡检机器人单目图像获取深度图像的装置，其特征在于，基于变焦距数据集对所述多尺度卷积神经网络进行训练，得到多尺度卷积神经网络的最优网络结构，包括如下步骤：