CN113269152B

CN113269152B - 一种非等间距离散深度补全的方法

Info

Publication number: CN113269152B
Application number: CN202110712259.9A
Authority: CN
Inventors: 张磊; 张�成; 戴维; 徐童; 王敬宇; 张龙; 戚琦; 张乐剑; 王晶
Original assignee: Beijing University of Posts and Telecommunications
Current assignee: Beijing University of Posts and Telecommunications
Priority date: 2021-06-25
Filing date: 2021-06-25
Publication date: 2022-07-01
Anticipated expiration: 2041-06-25
Also published as: CN113269152A

Abstract

一种非等间距离散深度补全的方法，包括下列操作步骤：(1)将深度区间按照非等间距的方式离散为k个分割区间；(2)将一幅单通道的雷达深度图离散为k个通道的深度概率图；(3)基于残差网络构建并训练第一深度补全网络，使用单通道雷达深度图和RGB格式可见光图像作为第一深度补全网络的输入；完成深度补全后的单通道的深度图作为输出；(4)基于残差网络构建并训练第二深度补全网络，使用k个通道的深度概率图和RGB格式可见光图像作为第二深度补全网络的输入；完成深度补全后的k个通道的深度图作为输出。

Description

一种非等间距离散深度补全的方法

技术领域

本发明涉及一种非等间距离散深度补全的方法，属于信息技术领域，特别是属于视觉和雷达技术的汽车无人驾驶技术领域。

背景技术

近年来深度学习得到了快速的发展，在相当多的应用领域得到了丰富的应用，并在许多任务中达到了传统算法无法达到的效果，这其中尤属视觉领域的应用最为瞩目。随着无人驾驶技术的发展，深度补全这一任务成为无法绕开的技术难题，因为只有当能够准确判断周围环境中物体距离车身的距离后，自动驾驶的算法才有应用的意义，否则建立在不可靠距离信息上的各种后续算法只能是空中楼阁。单纯利用RGB图像信息进行深度补全的方法产生的结果往往不够准确，而雷达获取的深度信息虽然准确，但是深度点云过于稀疏，所以单纯依靠激光雷达信息进行深度补全，在细窄物体和物体的边缘上表现不能令人满意。基于上述考虑，近年来利用多模态信息进行视觉深度补全的方法受到越来越大的关注，产生了许多补全深度精度更高，计算更快的技术方案。

但是，这些技术方案鲜有关注深度补全中的边缘优化这一重要子问题的，这些方法补全的深度图中物体边缘部分往往与实际的边缘深度相比有一些模糊。由于物体边缘像素点占全图所有像素点的比例较小，所以对于深度补全任务的评价指标影响不大，但物体边缘的精确补全对于自动驾驶中后续的计算任务具有重要意义。

如何实现物体边缘深度的精确补全，成为目前汽车无人驾驶技术领域一个急需解决的技术难题。

发明内容

有鉴于此，本发明的目的是发明一种方法，基于RGB图像和雷达图像，实现物体边缘深度的精确补全。为了达到上述目的，本发明提出了一种非等间距离散深度补全的方法，所述方法包括下列操作步骤：

(1)将深度区间按照非等间距的方式离散为k个分割区间，按照下式计算各个分割区间的中心点的深度值：

上式中，D_i表示第i个分割区间的中心点的深度值，α表示所述深度区间的最近深度值，β表示所述深度区间的最远深度值；

(2)将一幅单通道的雷达深度图离散为k个通道的深度概率图，具体方法是：根据所述的单通道的雷达深度图里的每一个像素点的深度值，生成一个归一化的k维深度概率向量；所述的k维深度概率向量中的第i个分量，表示该像素点的深度值为D_i的概率；所述的单通道的雷达深度图里的所有像素点的k维深度概率向量汇合形成k个通道的深度概率图；

(3)基于残差网络构建并训练第一深度补全网络，所述的第一深度补全网络由输入层、中间层和输出层构成；使用所述的单通道雷达深度图和RGB格式可见光图像作为所述的第一深度补全网络的输入；完成深度补全后的单通道的深度图作为所述的第一深度补全网络的输出；使用均方根误差RMSE作为所述的第一深度补全网络的损失函数；把所述的第一深度补全网络训练至网络收敛；

(4)基于残差网络构建并训练第二深度补全网络，所述的第二深度补全网络由输入层、中间层和输出层构成；所述的第二深度补全网络的中间层与所述的第一深度补全网络的中间层完全一样；在训练开始前，所述的第二深度补全网络的中间层保留所述的第一深度补全网络的中间层训练收敛后的网络参数；使用所述的k个通道的深度概率图和RGB格式可见光图像作为所述的第二深度补全网络的输入；完成深度补全后的k个通道的深度图作为所述的第二深度补全网络的输出；使用交叉熵cross_entropy作为所述的第二深度补全网络的损失函数；把所述的第二深度补全网络训练至网络收敛。

步骤(2)中根据所述的单通道的雷达深度图里的每一个像素点的深度值，生成一个归一化的k维深度概率向量的具体内容是包括如下操作子步骤：

(21)根据该像素点的深度值确定所属的分割区间i；

(22)按照下式计算所述的归一化的k维深度概率向量的第j个分量的值：

上式中，D_i表示第i个分割区间的中心点的深度值；D_j表示第j个分割区间的中心点的深度值；当i取值在2到k-1时，

当i＝1时，σ_i＝3×D_i+1，当i＝k时，σ_i＝3×D_k-1；c_i表示归一化常数，按照下式进行计算：

本发明的有益效果在于不仅可以使边缘部分的深度补全结果更加准确，而且可以改善其他技术方案中出现的锯齿边缘问题；本发明采用第一深度补全网络和第二深度补全网络的方式完成网络的训练，显著提高了训练速度。

附图说明

图1是本发明提出的一种非等间距离散深度补全的方法的流程图。

图2是本发明的实施例中第一深度补全网络的结构示意图。

图3是本发明的实施例中第二深度补全网络的结构示意图。

图4是本发明的实施例中生成一个归一化的k维深度概率向量的计算示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面结合附图对本发明作进一步的详细描述。

参见图1，介绍本发明提出的一种非等间距离散深度补全的方法，所述方法包括下列操作步骤：

上式中，D_i表示第i个分割区间的中心点的深度值，α表示所述深度区间的最近深度值，β表示所述深度区间的最远深度值；在本实施例中根据数据集的深度分布统计结果，α(最近)取1m，β取(最远)80m，k＝80。

(2)将一幅单通道的雷达深度图离散为k(k＝80)个通道的深度概率图，具体方法是：根据所述的单通道的雷达深度图里的每一个像素点的深度值，生成一个归一化的k维深度概率向量；所述的k维深度概率向量中的第i个分量，表示该像素点的深度值为D_i的概率；所述的单通道的雷达深度图里的所有像素点的k(k＝80)维深度概率向量汇合形成k(k＝80)个通道的深度概率图；

(3)基于残差网络构建并训练第一深度补全网络，参见图2，所述的第一深度补全网络由输入层、中间层和输出层构成；图2中conv代表卷积，Res.Block代表残差网络，Upsamp代表上采样操作，DC代表离散化后的多通道深度图，圆圈代表concat操作，虚线代表复制，箭头代表数据流动的方向，SparseDepth代表雷达图像，RGB代表RGB图像，DenseDepth代表输出的完成深度补全后的图像。

使用所述的单通道雷达深度图和RGB格式可见光图像作为所述的第一深度补全网络的输入；完成深度补全后的单通道的深度图作为所述的第一深度补全网络的输出；使用均方根误差RMSE作为所述的第一深度补全网络的损失函数；把所述的第一深度补全网络训练至网络收敛；

(4)基于残差网络构建并训练第二深度补全网络，参见图3，所述的第二深度补全网络由输入层、中间层和输出层构成；所述的第二深度补全网络的中间层与所述的第一深度补全网络的中间层完全一样；在训练开始前，所述的第二深度补全网络的中间层保留所述的第一深度补全网络的中间层训练收敛后的网络参数；

图3中conv代表卷积，Res.Block代表残差网络，Upsamp代表上采样操作，DC代表k(k＝80)个通道的深度概率图，F代表该层输出的通道数，圆圈代表concat操作，虚线代表复制，箭头代表数据流动的方向，SparseDepth代表雷达图像，RGB代表RGB图像，DenseDepth代表输出的完成深度补全后的图像。

使用所述的k(k＝80)个通道的深度概率图和RGB格式可见光图像作为所述的第二深度补全网络的输入；完成深度补全后的k(k＝80)个通道的深度图作为所述的第二深度补全网络的输出；使用交叉熵cross_entropy作为所述的第二深度补全网络的损失函数；把所述的第二深度补全网络训练至网络收敛。

(23)根据该像素点的深度值确定所属的分割区间i；

(24)按照下式计算所述的归一化的k维深度概率向量的第j个分量的值：

举例如下：一个雷达深度图里的一个像素点的深度值为γ＝1.118m，落在了如图4所示的区间中，根据公式

得到该区间中心点的值为1.11656043m，以此作为均值；由公式

得到这个区间对应的标准差为0.18592755，高斯分布如图4所示。由公式

计算出80个区间的中心点为：

然后从每个区间的中心点处对该高斯分布取值，得到一个长度为k(取80)的向量

然后进行归一化处理，利用归一化常数

最终得到：

对一张单通道的雷达深度图上的所有像素点都做如上操作，之后就可以得到k个通道的离散化后的深度图。

发明人对本发明的方法进行了大量实验，获得了良好的实验结果，这表明本发明的方法是有效可行的。