CN105701787B

CN105701787B - 基于置信度的深度图融合方法

Info

Publication number: CN105701787B
Application number: CN201610026936.0A
Authority: CN
Inventors: 刘怡光; 董鹏飞; 曹丽萍
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2016-01-15
Filing date: 2016-01-15
Publication date: 2019-04-12
Anticipated expiration: 2036-01-15
Also published as: CN105701787A

Abstract

本发明提出了一种基于置信度的深度图融合方法。由于匹配信息弱或噪声影响，深度计算精度难以保证，从而导致深度图融合变得困难。为此，本发明提出了一种基于置信度的抗噪融合算法。该方法首先对每幅深度图进行修正，利用一致性检测剔除大多数错误点并填补某些空洞。其次，通过保留那些在自身邻域内具有最高置信度的三维点以删除冗余。最后，将深度图反投影到三维空间，采用迭代最小二乘法进一步优化三维点并剔除离群点。通过在标准测试数据集上与其他算法比较，验证了该方法的有效性。

Description

基于置信度的深度图融合方法

技术领域

本发明设计一种深度图融合方法，该方法是一种基于置信度的深度图融合方法。

背景技术

多目立体视觉(Multiple View Stereo,MVS)三维重建的目的是通过多幅图像恢复出场景的三维模型，它是计算机视觉领域中一个非常重要的研究课题，并已受到越来越多的关注。MVS算法可以分为基于体素的方法、基于特征点扩展的方法、基于表面演化的方法和基于深度图融合的方法四类。在这些算法中，基于深度图融合的方法具有更高的灵活性，更适用于大多数场景的三维重建。

基于深度图融合的三维重建算法一般包含两个步骤：深度图计算和深度图融合。目前，已有许多研究者，比如Goesele、Bradley等，在深度图计算方面做出了杰出的工作。但值得注意的是，三维模型重建精度直接依赖于深度图的计算精度，而由于受到摄像机噪声、图像畸变以及匹配误差等因素的影响，深度图的计算不可能达到很高的准确性，导致三维模型与实际情况有偏差。

发明内容

提出了一种基于置信度的深度图融合方法，可以比较准确地融合被噪声干扰的深度图。该方法充分考虑深度图之间的一致性，并以此为基础对原始深度图进行修正。同时，又依据影响深度计算的各种因素获得每个3D点的置信度，从而删除冗余信息。最后，从整体考虑对三维模型进行过滤，提高模型的重建精度。该方法将图像序列以及对应的深度图和摄像机参数作为输入，最终输出一个具有法向量的稠密三维点云。该方法包含三个步骤：

(1)深度图修正，由于深度的计算误差，原始深度图可能不会完全与其他深度图在共有区域相匹配，因此就需要对原始深度进行修正增强一致性。将待修正深度图所对应的图像作为参考图像，记为R。选出与之相关联的图像集，记为C_R。为描述方便，设P_I(p)为图像I中p像素点所对应的3D点，D_I(P_I(p))为P_I(p)相对于图像I的深度。对于参考图像R中的每个像素位置p_r，可以获得三个与之相关的3D点P_R(p_r)，P_I(p_i)，P_I(p_r→i)，其中I表示C_R中某一图像。为获得P_R(p_r)，将p_r处像素点根据深度值反投影到三维空间。为获得P_I(p_i)，将图像I中所有像素点反投影到三维空间，将能投影到p_r处并且距离图像R最近的3D点作为P_I(p_i)。为获取P_I(p_r→i)，将P_R(p_r)投影到图像I中得到投影点p_r→i，然后将此点反投影到三维空间获得P_I(p_r→i)。最后，便可获得与待修正图像R中p_r处像素点相关的待定深度D_R(P_R(p_r))，D_R(P_I(p_i))，D_R(P_I(p_r→i))。依据实际情况，如果图像R和I可以看到同一个3D点，换句话说，如果D_R(P_R(p_r))与D_R(P_I(p_i))之间的相对差足够小，且D_I(P_R(p_r))与D_I(P_I(p_r→i))之间的相对差也足够小，那么便可判定图像R在p_r处与图像I连续。否则，便可断定在此处是不连续的。定义图像R在p_r处的一致性比率R_R(p_r)如下述公式:

如果判定图像R在p_r处与图像I连续，则c_I,1(p_r)被设置为1。否则，便被设置为0，此时若D_R(P_R(p_r))>D_R(P_I(p_i))，c_I,2(p_r)被设为1，若D_I(P_I(p_r→i))>D_I(P_R(p_r))，c_I,3(p_r)便被设置为1。除此之外的其他情况，这三个标志全部设置为0。丢弃那些一致性比率小于特定的阈值t₁的深度信息，因为较低的一致性比率意味着深度估计有很大可能是错误的。然后，利用下述公式得到d^*，用来代替原始深度。

对于深度图像R中每个无深度信息的像素p'_r，收集所有能投影到p'_r处的3D点P组成集合P^*，I∈C_R。如果在P^*中存在足够多的点，那么便可以利用这些点按照下述公式来估计p'_r处的深度信息，否则，便不做任何处理。

上式中表示集合P^*中所有可得到的3D点P总和的平均值，t₂表示特定阈值。在估计出了p'_r处对应的3D点之后，又采用了主成分分析法(PCA来估计出场景表面在此点处的法向量。最后，为了确保准确性，在填补完空洞之后对所有深度图按照所述方法进行再次修正。

(2)删除冗余。深度图修正之后可能存在大量冗余信息，通过保留那些在自身邻域内具有最高置信度的3D点来达到删除冗余的目的。首先将所有深度图像反投影到三维空间中，并赋予每个3D点P’一个置信度。置信度是对深度计算准确性的衡量，置信度越高，那么计算的深度值就越可信。一般来说，置信度的计算主要由三个部分组成:1)判断一个3D点P'是否准确最直观的准则就是匹配误差，而匹配误差通过NCC(Normalized cross-correlation标准化互相关)计算出，匹配误差越小，那么得到的3D点就越精确。因此，可以将匹配权重作为衡量置信度的指标之一。2)场景离摄像机中心的距离也对3D点的重建产生一定影响。场景距离摄像机中心越近，场景的细节信息保留的越完整，重建的3D点也就越准确，因此，可以将距离权重作为衡量置信度的指标之二。3)另外，在深度估计中存在两个非常重要的夹角。其中一个是场景的视角方向与对应摄像机基轴的夹角，记为θ₁，另一个是场景视角与场景表面法向量之间的夹角，记为θ₂。当这两个夹角越接近于零，深度估计得也就越准确。因此，可以将角度权重作为衡量置信度的指标之三。考虑以上所有的因素，最终可以定义每个3D点的置信度计算公式

对于由图像R中处于p_r的像素点获得的3D点P'来说，首先利用下述公式找到与P'互为冗余的3D点集，记为根据上述公式计算中所有点的置信度，保留其中置信度最大的3D点，删除其余点。

但是，为防止误删正确的3D点，如果已经保留了某个点，那么在接下来的删除冗余过程中就要一直保留此点。

(3)深度图融合。在所有深度图修正之后，将它们反投影到三维空间中，获取三维模型，并通过迭代的方法进一步消除离群点获取精确的三维模型。在前面两步的过程中，每次只对一幅深度图单独进行过滤，这就导致无法完全剔除离群点和冗余点。那么接下来将从整体考虑对三维模型进行优化，提高重建的精确度。首先将所有深度图中具有深度信息的像素点反投影到三维空间中去，得到初始三维模型C。为了进一步删除冗余信息和提高算法效率，对初始点云进行一次降采样。首先，假设一个3D点P由图像I中某个像素点得到，定义P的影响半径。

其中，V_I表示以I所对应摄像机中心为起点，以P为终点的向量。PR_I表示I所对应摄像机的轴线，f_I表示I所对应摄像机的焦距。然后，循环初始点云中所有点，只保留那些置信度在其影响半径内所有点中最大的3D点。在降采样后，利用迭代最小二乘法来对点云进行整体优化，具体优化过程为，任取点云中一点P，令n_P为它的法向量，N_P为落入P两倍影响半径内的3D点组成的集合，初始值P₀＝P，对其进行迭代优化，优化过程如下述公式所示。在经过最大的迭代次数k之后，如果能收敛到N_P范围内，则用P_k代替原来的P，如此，直至所有3D点全部优化完毕。

Claims

1.一种基于置信度的深度图融合方法，该方法充分考虑深度图之间的一致性，并以此为基础对原始深度图进行修正，同时，又依据影响深度计算的各种因素获得每个三维点的置信度，从而删除冗余信息，最后，从整体考虑对三维模型进行过滤，提高模型的重建精度，具体步骤为：

(1)获取待定深度，通过一系列投影与反投影获得与每个像素相关的待定深度；

(2)一致性检测，通过下述公式①获得在待修正深度图的像素点处的一致性比率

(3)深度值更新，通过下述公式②利用上述步骤(1)(2)对一致性比率大于特定值的深度进行更新

(4)空洞填补，通过下述公式③对深度值更新后的深度图中无深度信息的像素点进行填补

(5)定义置信度，利用下述公式④通过匹配误差、场景离摄像机中心的距离以及场景视角等因素定义三维点的置信度

(6)删除冗余，通过那些由深度更新后的深度图像的像素点反投影到三维空间获得的3D点邻域内保留具有最高置信度的3D点，以删除冗余；

(7)深度图融合，将所有深度图中具有深度信息的像素点反投影到三维空间中去，得到初始三维模型，然后对得到的初始三维模型进行降采样，降低基于置信度的深度图融合算法复杂度，通过迭代最小二乘法从整体对降采样后的点云进行过滤；

通过步骤(1)(2)(3)(4)(5)(6)(7)对原始深度图进行融合。