CN110930306A

CN110930306A - 一种基于非局部感知的深度图超分辨率重建网络构建方法

Info

Publication number: CN110930306A
Application number: CN201911031488.3A
Authority: CN
Inventors: 杨宇翔; 曹旗; 何志伟; 高明煜; 黄继业
Original assignee: Hangzhou Electronic Science and Technology University
Current assignee: Hangzhou Electronic Science and Technology University
Priority date: 2019-10-28
Filing date: 2019-10-28
Publication date: 2020-03-27
Anticipated expiration: 2039-10-28
Also published as: CN110930306B

Abstract

本发明公开一种基于非局部感知的深度图超分辨率重建网络构建方法，目前越来越多的场景应用需要高质量高分辨率的深度图片，传统的深度图像超分辨方法在效果和速度都不如基于卷积神经网络的方法。但由于卷积的特性，大部分的超分辨卷积神经网络框架都只能利用深度图像的局部信息，然而图像的非局部信息对图像的重建十分重要。本发明充分发掘了深度图像的局部和非局部信息，帮助深度图像进行超分辨率重建。并且利用递归学习和残差学习的思想，减轻了卷积神经网络的负担，控制了网络的参数，提升了深度图像的重建效果。

Description

一种基于非局部感知的深度图超分辨率重建网络构建方法

技术领域

本发明属于计算机视觉领域，具体涉及一种基于非局部感知的深度图超分辨率重建网络构建方法。

背景技术

随着获取深度信息的技术的发展，如激光雷达，飞行时间(TOF)相机，三维结构光，深度图像已被广泛应用于移动机器人，人机交互，人体姿态估计和三维场景重建等。然而，从这些技术获得的深度图像仍然无法满足实际需求，尤其是获取的深度图像分辨率较低。因此，如何将低分辨率的深度图像重建成高质量高分辨率深度图像成为计算视觉领域的研究热点。

近年来，随着深度学习的发展，越来越多的基于卷积神经网络的超分辨方法被提出。经过在大量图片数据集上的训练，卷积神经网络能够充分学习目标物体的特征，并将这些特征进行组合得到最后的重建结果。相较传统的超分辨算法，基于卷积神经网络的超分辨算法需要依赖于非常大的数据集，所以通过卷积层提取出的特征更具有普适性，更能代表物体的通用特征。通常，基于CNN的深度超分辨率方法可以实现比传统方法更好的性能。

但目前大量的传统深度图像超分辨算法都是基于同场景的彩色图像引导的重建，需要额外的彩色相机，增加了额外的成本。虽然基于卷积神经网络的深度图像超分辨方法较传统方法提升效果明显，但是卷积神经网络仅利用了深度图像的局部信息，实际上非局部信息对图像超分辨重建任务很重要，获取非局部信息可以减弱对彩色图像引导的依赖。因此构建一个提升效果明显，可以提取深度图像的非局部信息的超分辨网络可以大大降低系统成本。

发明内容

本发明的目的就是克服现有技术的不足，提出了一种基于非局部感知的深度图超分辨率重建网络构建方法。本方法不仅很好的提取了图像的局部信息，而且可以感知深度图像的非局部信息。最终融合这些有利信息，重建出高分辨率高质量的深度图像。具体步骤如下：

一种基于非局部感知的深度图超分辨率重建网络构建方法，该方法的具体步骤是：

步骤(1)：利用深度相机获取深度图像

使用深度相机得到一张低分辨率深度图像I_depth其分辨率为M*N，其中M和N分别为图像的高和宽。对低分辨率的深度图像I_depth进行双三次上采样操作放大至rM*rN，其中r为倍率，获得了初始的低质量高分辨率深度图像

步骤(2)：基于卷积神经网络的深度图像特征提取结构构建，在图像特征提取阶段由两层卷积核大小为3*3的卷积层，六个权值共享的不同空洞比率的3*3的卷积层组成的多尺度残差块Multi-scale Residual Block，一个非局部感知残差块Residual Non-localBlock和一层卷积核大小为3*3的卷积层组成，这个阶段中的所有的卷积层之后都紧连着一个Rectified Linear Unit激活层，得到了设计网络的特提取部分；

(a)

首先通过两层卷积核大小为3*3卷积层得到初始的深度特征图

(b)多尺度残差结构构建，

经过六个多尺度残差块丰富特征，假设输入特征图为X_m-1，每个多尺度残差块的计算步骤解释为如下：

①

首先将特征图X_m-1经过并行结构的三个不同空洞比率的卷积层，空洞大小D分别为1、2和4，卷积核大小均为3*3，之后通过激活层得到的特征图R1、特征图P1和特征图Q1。其中σ(·)代表激活层，

和

为卷积层权值，其中，“1”代表卷积层结构位置，上标表示该卷积层的空洞大小，下标表示卷积核大小。

②

R2＝ω2_1x1*<R1,P1,Q1>+X_m-1 (3)

之后将特征图R1、特征图P1和特征图Q1拼接在一起，输入卷积核大小为1*1的卷积层ω2_1x1降低维度，并使用残差连接，将输入X_m-1与卷积层ω2_1x1的输出相加得到特征图R2。其中，<R1,P1,Q1>表示将R1、P1和Q1阶段的特征图拼接在一起。

③

最后特征图R2经过卷积核大小均为3*3的卷积层ω3和ω4之后，再次利用残差连接，得到多尺度残差块的最终输出X_m。并且利用递归学习的思想，将多尺度残差块递归六次。在递归中，不同的多尺度残差块之间相同结构位置、相同空洞大小的卷积层权值共享，例如递归的六个多尺度残差块之中，任意一个多尺度残差块的权值

与剩下五个多尺度残差块的

是共享的。

初始的特征图

经过六个权值共享的多尺度残差块结构之后，即得到深度图像的多尺度局部感知特征图

(c)残差非局部感知结构的构建，局部感知后的深度图像特征图

进入残差非局部感知模块，C代表

的通道数量，H和W代表

的高和宽。残差非局部感知计算过程表示如下：

经过三个并行的1*1卷积层降低通道数之后，进行向量化重组操作得到两个列向量α、β和一个行向量

α和β∈1*CHW，

其中，vector(·)表示向量化操作，ω_θ、ω_φ和ω_g代表三个并行的1*1卷积层的权值。

然后将其中的α与

进行矩阵相乘得到一个权重ω，对权重ω归一化之后再与列向量β进行矩阵相乘，再次重组之后得到与输入相同尺寸并包含了非局部信息的特征图

其中reshape(·)表示重组。

最后

经过一个1*1卷积ω_Z之后进行残差连接得到最后的残差非局部结构输出结果

(d)经过了非局部感知之后的特征图

经过一个连着激活层的卷积核大小为3*3的卷积层之后，得到了特征提取阶段的最终输出

步骤(3)：残差结构构建，重建高质量高分辨率深度图像

重建阶段的卷积神经网络由一个卷积核大小为3*3的卷积层和一次残差连接操作构成。

通过卷积核大小为3*3的卷积层得到重建深度图像的残差输出，记为

最后将

与

进行元素对应相加，得到最终放大r倍的高分辨率高质量深度图像

本发明的有益效果：本发明利用卷积神经网络学习可以很好的学习提取深度特征图像的局部和非局部信息，可以由此为单深度图像重建提供足够的信息，免去了同场景彩色图像引导的需求，能够重建出高质量高分辨率的深度图像。

附图说明

图1为本发明的流程图。

具体实施方式

以下结合附图1对本发明作进一步说明，本发明包括以下步骤：

一种基于非局部感知的深度图像超分辨率重建网络，该方法的具体步骤是：

步骤(1)：利用深度相机获取深度图像

(a)

首先通过两层卷积核大小为3*3卷积层得到初始的深度特征图

(b)多尺度残差结构构建，

①

和

②

R2＝ω2_1x1*<R1,P1,Q1>+X_m-1 (3)

③

与剩下五个多尺度残差块的

是共享的。

初始的特征图

进入残差非局部感知模块，C代表

的通道数量，H和W代表

的高和宽。残差非局部感知计算过程表示如下：

α和β∈1*CHW，

然后将其中的α与

其中reshape(·)表示重组。

最后

(d)经过了非局部感知之后的特征图

步骤(3)：残差结构构建，重建高质量高分辨率深度图像

最后将

与

Claims

1.一种基于非局部感知的深度图超分辨率重建网络构建方法，其特征在于该方法的具体步骤是：

步骤(1)：利用深度相机获取深度图像

使用深度相机得到一张低分辨率深度图像I_depth其分辨率为M*N，其中M和N分别为图像的高和宽；对低分辨率的深度图像I_depth进行双三次上采样操作放大至rM*rN，其中r为倍率，获得了初始的低质量高分辨率深度图像

步骤(2)：基于卷积神经网络的深度图像特征提取结构构建，在图像特征提取阶段由两层卷积核大小为3*3的卷积层，六个权值共享的不同空洞比率的3*3的卷积层组成的多尺度残差块Multi-scale Residual Block，一个非局部感知残差块Residual Non-local Block和一层卷积核大小为3*3的卷积层组成，这个阶段中的所有的卷积层之后都紧连着一个Rectified Linear Unit激活层，得到了设计网络的特提取部分；

(a)