CN111932601B

CN111932601B - 一种基于YCbCr颜色空间光场数据的稠密深度重建方法

Info

Publication number: CN111932601B
Application number: CN202010766902.1A
Authority: CN
Inventors: 邱钧; 刘畅; 陈平; 史立根
Original assignee: North University of China; Beijing Information Science and Technology University
Current assignee: North University of China; Beijing Information Science and Technology University
Priority date: 2019-09-27
Filing date: 2020-08-03
Publication date: 2023-06-06
Anticipated expiration: 2040-08-03
Also published as: CN111932601A

Abstract

本发明公开了一种基于YCbCr颜色空间光场数据的稠密深度重建方法，该方法包括以下步骤：步骤1，获取YCbCr颜色空间光场数据；步骤2，在Y通道标记平滑区域；步骤3，在CbCr通道进行语义分割；步骤4，在Y通道进行区域匹配；步骤5，优化匹配视差，并计算场景深度。通过采用本发明提供的方法，能够在四维光场理论下实现高精度的深度重建。

Description

一种基于YcbCr颜色空间光场数据的稠密深度重建方法

技术领域

本发明涉及计算机视觉与数字图像处理领域，尤其涉及一种基于YCbCr颜色空间光场数据的稠密深度重建方法。

背景技术

光场包含光线的空间和角度信息，是对场景中光线的辐照度刻画，广泛应用于场景渲染、深度信息获取、计算摄影与三维重构。七维全光函数

最早被提出用来形式化描述光场，描述了空间中任意时刻任意波长的光线辐照度信息。Levoy，Gortler等人提出了光场的双平面参数化表示，即四维光场L(x，y，u，v)。基于四维光场的理论，Ng和Levoy等人设计基于微透镜阵列采集系统的手持相机，实现了单次曝光下的四维光场数据采集和重聚焦成像。

由光场数据获取场景深度信息当前有三类方法。基于多视点像素匹配的深度获取方法，基于极线图的深度获取方法和基于聚焦堆栈深度获取方法。光场可以看作一组不同视点下的透视图，基于多视点像素匹配的深度获取方法通过像素匹配获取任意物点在所有视点下的视差信息。基于极线图的深度获取方法计算梯度方向或者尺度变换求极值得到极线图中直线的斜率。基于聚焦堆栈深度获取方法通过清晰度评价和聚焦堆栈的其它特性估计深度。

高精度的深度重建方法可用于光场相机的深度信息获取，以及为三维场景重构提供精确的深度信息。但是，现有技术中缺少高精度的深度重建方法。

发明内容

本发明的目的在于提供一种基于YCbCr颜色空间光场数据的稠密深度重建方法，为基于光场的数字重聚焦和三维场景重构提供高精度的深度信息。

为实现上述目的，本发明提供一种基于YCbCr颜色空间光场数据的稠密深度重建方法，该方法包括以下步骤：

步骤1，获取YCbCr颜色空间光场数据；

步骤2，在Y通道标记平滑区域；

步骤3，在CbCr通道进行语义分割；

步骤4，在Y通道进行区域匹配；

步骤5，优化匹配视差，并计算场景深度。

进一步地，步骤2包括：

步骤21，在Y通道上，计算以待匹配像素点为中心、预设面积的矩形窗口区域内各像素点的像素值的均方差值；

式中，f表示矩形窗口区域内像素点的像素值，

良示矩形窗口区域内像素点的像素值的平均值，N表示矩形窗口区域内像素点的个数；

步骤22，比较式(1)计算得到均方差值σ²与设定的平滑区域阈值ξ，σ²＜ξ时，则步骤21中的待匹配像素点被判定为平滑区域。

进一步地，步骤3具体包括：

步骤31，在YCbCr颜色空间光场数据的中心视图的CbCr通道通过区域生长二分法进行语义分割，此时场景被分成若干个色度块；

步骤32，遮挡发生在色度块的边缘，提取色度块的边缘，该边缘为边界遮挡区域。

进一步地，步骤31建立下式(2)提供的关于颜色距离和空间结构相关的区域生长能量函数E_k(x，y)：

当E_k(x，y)＜τ(x，y)，表示区域停止增长；

τ(x，y)＝(Cb(x，y)-Cb_n)²+(Cr(x，y)-Cr_n)² (4)

(Cb_n，Cr_n)＝argmin_x，y||(x-x_i)+(y-y_i)||_L2 (5)

式中，Cb(x，y)、Cr(x，y)分别表示像素点(x，y)的Cb值、Cr值，D_k表示第k个色度块，γ表示权重因子，

表示D_k中的Cb，Cr的均值，

表示中心视图的像素点(x，y)的梯度，Y(x+1，y)、Y(x-1，y)、Y(x，y+1)、Y(x，y-1)分别表示Y通道中坐标(x+1，y)、(x-1，y)、(x，y+1)、(x，y-1)的像素值，Cb_n、Cr_n分别表示距离像素点(x，y)最近的背景点(x_i，y_i)的Cb，Cr值，τ(x，y)表示分割的阈值函数，||(x-x_i)+(y-y_i)||_L2表示定义的像素点(x，y)与背景点(x_i，y_i)之间的距离。

进一步地，步骤4包括：

步骤41，定义基于区域匹配的距离测度函数；

步骤42，求解视差。

进一步地，步骤41中，使匹配窗口内只包含同一类型的色度块，设匹配点(x，y)的属于第k个色度块D_k，则匹配窗口描述为下式(8)：

基于区域匹配的距离测度函数

描述为式(9)：

其中，H与w_x，y都是大小为d的矩阵，

表示二维高斯函数，d为匹配窗口的大小，

表示中心视图中像素点(x，y)深度d(x+m，y+n)在视点(u₀，v₀)下的坐标，

P_u，v，Y(d(x+m+u_x·s，y+n+v_y·s))表示点(x，y)深度d(x+m+u_x·s，y+n+v_y·s)在视点(u，v)下的坐标，u_x，v_y分别为点(x，y)在视点(u，v)下在x方向和y方向的相邻视差s的倍数。

进一步地，步骤42采用线搜索求解初步视差图s^*(x，y)：

式中，E_(x，y)(s)表示为视差距离测度，Φ表示YCbCr颜色空间光场数据所有视点的集合，

表示最小化视差距离测度反求出对应的相邻视点的视差，

表示物点(x，y)在(u₀，v₀)和(u，v)两个视点下的视差。

进一步地，步骤5具体包括：

步骤51，对平滑区域处的初步视差图s^*(x，y)进行优化；

步骤52，根据步骤51优化得到的视差图，计算场景的深度。

进一步地，步骤51采用式(12)优化得到视差图μ(X)：

式中，

为视差图μ(X)的梯度，λ为设定的权重系数，Ω表示步骤2标记的平滑区域。

通过采用本发明提供的方法，能够在四维光场理论下实现高精度的深度重建。

附图说明

当结合附图考虑时，通过参照下面的详细描述，能够更完整更好地理解本发明以及容易得知其中许多伴随的优点，但此处所说明的附图用来提供对本发明的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定，其中：

图1是本发明实施例提供的基于YcbCr颜色空间光场数据的稠密深度重建方法的流程图。

图2是光场中视差与深度的关系示意图。

图3是场景平滑区域的提取示意图。

图4a是语义分割中的种子点选取示意图。

图4b是语义分割中的背景点选取示意图。

图4c是根据图4a和图4b中的语义分割后的结果示意图。

图5a是灯罩所在区域示意图。

图5b是被灯罩遮挡的不可见的圆点所在的区域示意图。

图6是场景匹配窗口的选取示意图。

图7是本发明提供的方法重建场景的视差图。

具体实施方式

在附图中，使用相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。为使上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

术语解释：YcbCr是色彩空间的一种，通常会用于影片中的影像连续处理，或是数字摄影系统中。Y是指亮度分量，亮度描述物体纹理信息；Cb指蓝色色度分量，Cr指红色色度分量，色度描述物体颜色信息。YCbCr颜色空间将亮度参量和色度参量分开表示，可以避免相互干扰。

本发明提供的方法欲利用纹理和颜色信息，将RGB转化为YCbCr 4：4：4的形式，而并不涉及YCbCr图像的压缩存储处理。

如图1所示，本发明实施例提供的基于YCbCr颜色空间光场数据的稠密深度重建方法包括以下步骤：

步骤1，读取RGB颜色空间下的光场数据，并转化为YCbCr颜色空间下的光场数据，该光场数据在文中简称为“YCbCr颜色空间光场数据”。

步骤2，在YCbCr颜色空间光场数据的中心视图的Y通道标记平滑区域。

步骤3，在YCbCr颜色空间光场数据的中心视图的CbCr进行语义分割。

步骤4，在YCbCr颜色空间光场数据的Y通道进行区域匹配，求解视差。

步骤5，优化匹配视差，并计算场景深度。

在一个实施例中，步骤2包括：

步骤21，在Y通道上，计算以待匹配像素点为中心、预设面积的矩形窗口区域内各像素点的像素值的均方差值，如式(1)中左侧等号提供的计算公式。其中，待匹配像素点指中心视图中的每一个像素点，也就是说，本实施例需要对中心视图中的每个像素点进行匹配。待匹配像素点的像素值为其在Y通道的像素值。预设面积可以是7*7，也可以是5*5，还可以根据实际需求进行选取。

式中，f表示矩形窗口区域内像素点的像素值，

表示矩形窗口区域内像素点的像素值的平均值，N表示矩形窗口区域内像素点的个数，ξ表示设定的判断平滑区域的阈值，该阈值可以通过实验得到，比如0.2或其它数值。

步骤22，比较式(1)计算得到均方差值与设定的判断平滑区域的阈值ξ，如式(1)中右侧小于号提供的部分，在计算得到均方差值小于ξ的情形下，则步骤21中的待匹配像素点被判定为平滑区域，获得的平滑区域记为Ω。

步骤22提供的平滑区域的判断方法也可以采用下面方法实现：

比如：统计预设面积的矩形窗口内相同的像素与该窗口内全部像素的比例，如果占比多的话，该点则可以标记为平滑区域。

在一个实施例中，场景中的物体所在区域通常具有色度一致性，也具有深度一致性。也就是说，物体所在区域内的物点通常具有空间连续性、深度信息变化平滑。而物体边界点通常是场景深度的跳跃点，而且，其遮挡存在于物体的边界轮廓处。

具体地，遮挡区域分为遮挡物体区域与被遮挡物体区域。结合图5a和图5b，说明遮挡物体区域与被遮挡物体区域的区分原则：由于视点的坐标不同，导致场景中的一些物体在一部分视点下可见，另一部分视点下不可见，这些不可见视点的所在区域称为被遮挡物体区域，如图5b中示出的被灯罩遮挡的不可见的圆点所在的区域。相应地，遮挡被遮挡物体区域的区域为遮挡物体区域。如图5a示出的灯罩所在区域。

鉴于此，步骤3欲通过在YCbCr颜色空间光场数据的中心视图的CbCr进行语义分割，将场景分成若干个色度块，并提取色度块的边缘即为边界遮挡区域。作为步骤3的一种优选实现方式，其可以包括：

步骤31，在YCbCr颜色空间光场数据的中心视图的CbCr通道通过区域生长二分法进行语义分割，此时场景被分成若干个色度块。其中，场景指的是YCbCr颜色空间光场数据的中心视图。

具体的，在区域生长的基础上采用二分类方法解决阈值难确定的问题。确定种子点，该种子点一般选取在单个物体的中心。比如：图4a示出了三个六边形的物体，也就是说，步骤3是将种子点选取在每一个物体的几何中心，如图4a中的“十”字型标记。在物体的边界外选取背景点，如图4b示出的三个六边形的物体之外的区域中的圆圈。建立如下式(2)提供的关于颜色距离和空间结构相关的区域生长能量函数E_k(x，y)：

式中，Cb(x，y)表示像素点(x，y)的Cb色度值，Cr(x，y)表示像素点(x，y)的Cr色度值，D_k表示第k个色度块，γ表示权重因子，其为具体实验，在Cb，Cr通道和梯度图进行归一化，其权重因子取值0.1；

表示第k个色度块D_k中的Cb，Cr的均值，该值根据色度块D_k的坐标，在Cb或Cr通道上提取灰度值，该灰度值是Cb，Cr的色度值，然后将该色度块D_k所有的色度值相加，再除以该色度块D_k的像素的个数，则为可以获得

的值；

表示中心视图的像素点(x，y)的梯度，用于防止区域生长超越边界，表示为式(3)：

式中，Y(x+1，y)表示Y通道中坐标(x+1，y)的像素值，Y(x-1，y)表示表示Y通道中坐标(x-1，y)的像素值，Y(x，y+1)表示表示Y通道中坐标(x，y+1)的像素值，Y(x，y-1)表示表示Y通道中坐标(x，y-1)的像素值。

分割的阈值函数表示为式(4)：

τ(x，y)＝(Cb(x，y)-Cb_n)²+(Cr(x，y)-Cr_n)² (4)

式中，Cb_n、Cr_n分别表示距离像素点(x，y)最近的背景点(x_i，y_i)的Cb，Cr值，其计算公式为式(5)。

(Cb_n，Cr_n)＝argmin_x，y||(x-x_i)+(y-y_i)||_L2 (5)

当E_k(x，y)＜τ(x，y)，表示区域停止增长。图4c示出的是分割的结果，k＝3。

步骤32，遮挡发生在色度块的边缘，因此，提取色度块的边缘即为边界遮挡区域。通过边缘检测方法可以提取边缘信息，边缘检测方法比如：Canny，Roberts，Prewitt，Sobel等。

上述实施例中，步骤3中的语义分割方法还可以采用基于区域的语义分割R-CNN、全卷积网络语义分割、以及弱监督语义分割等等。

在一个实施例中，步骤4具体包括：

步骤41，在光场重建场景深度问题中，可将求解场景深度问题转化为求解视差问题。因此对于场景中的物点p，对应中心视图中的像素点(x，y)，其深度记为d(x，y)，该物点在(u₀，v₀)和(u，v)两个视点下的视差表示为式(6)：

式中，在RGB颜色空间下color对应图像的R、G、B三个通道，P_{u，v，color}(d(x，y))为物点p在视点(u，v)下color通道亚光圈图像中的图像坐标，

为物点p在视点(u₀，v₀)下color通道亚光圈图像中的图像坐标，

表示物点p对应的中心视图的像素点(x，y)在视点(u，v)与视点(u₀，v₀)下的视差，|| ||表示2范数。

在自然场景，物体纹理信息主要由辐亮度描述，物体颜色信息主要由色度描述。在R、G、B三个通道做区域匹配近似于在纹理通道(Y通道)做区域匹配，消除匹配中的颜色计算冗余。于是，式(6)提供的视差可以定义为：

式中，

表示中心视图中像素点(x，y)深度d(x，y)在视点(u₀，v₀)下的坐标，P_u，v，Y(d(x，y))表示中心视图中像素点(x，y)深度d(x，y)在视点(u，v)下的坐标。

通过区域匹配代替单像素点匹配，来提高算法的鲁棒性。本实施例给出自适应匹配窗口，这样可以使匹配窗口内只包含同一类型的色度块，如图6所示，进而解决边界遮挡区域存在误匹配的问题。

设匹配点(x，y)的属于第k个色度块D_k，则匹配窗口可以描述如下：

式中，σ的取值通过实验获得，比如1.5。设d＝3，其坐标表示如下表所示：

(-1，-1)	(-1，0)	(-1，1)
			(0，-1)	(0，0)	(0，1)
(1，-1)	(1，0)	(1，1)

匹配窗口内的坐标与匹配点被相同的色度标记时，其值为高斯权重，非相同色度标记的为0。

根据式(8)，基于区域匹配的距离测度函数

描述为式(9)：

其中，H与w_x，y都是大小为d的矩阵，

表示二维高斯函数，d为匹配窗口的大小，

步骤42，求解视差方法包括：

在光场重建场景深度问题中，求解场景深度转化为极小化视差的问题。

式中，E_(x，y)(s)表示为视差距离测度，Φ表示YCbCr颜色空间光场数据所有视点的集合。

采用线搜索求解最优视差，即初步视差图s^*(x，y)：

在一个实施例中，步骤5具体包括：

步骤51，采用式(12)表示的全变分TV模型对平滑区域处的初步视差图s^*(x，y)进行优化，通过TV模型可以起到平滑滤波的作用，还能较好的保证边缘结构。

式中，(X)由(x，y)简化得到，μ(X)表示利用式(11)计算出的视差图s^*(X)优化后得到的估计结果，

为视差图μ(X)的梯度，λ为设定的权重系数，该取值判断依据在于初始视差图的稀疏性，即：如果初始视差图的平滑区域匹配的精度较高，则λ取值较大，接近1；如果初始视差图的平滑区域匹配的精度较低，则λ取值小于1，大于0.5。Ω表示标记的平滑区域。第一项为保真项，保证估计出的视差图与计算出的视差图之间的联系，第二项为平滑项，在视差图中起平滑作用。其最小化使得在对视差图进行平滑的同时，保证输入与输出结果之间差异性最小。

步骤51中，还可以采用曲率滤波或L0范数滤波等优化初步视差图。

步骤52，计算场景的深度。

如图2所示，在图2中，u₁，u₂为(u，v)平面上的视点，v为0，B为视点距离，A₁为物点A对应的像素点，s为物点A在视点u₁，u₂下在(x，y)成像平面上的视差。

利用式(13)，将步骤51优化后的视差图μ(X)转换为深度图z，也就是说，光场相机单次曝光时，微透镜阵列与主透镜之间的距离F、聚焦面的深度Z₀以及相邻视点之间的距离B皆为固定值，根据式(12)得到的视差μ(X)，其表示为式(13)中的μ，则可以计算得到深度Z：

式(13)中，z₀表示聚焦面的深度，F表示主透镜到成像面之间的距离，B表示相邻视点之间的距离，z表示空间场景的深度。

通过采用本发明提供的方法，能够在四维光场理论下实现高精度的深度重建。如图7的(a)、(b)、(c)、(d)这四项中，每一项的左侧是原场景示意图，右侧是利用本发明方法获得的相应视差图。

最后需要指出的是：以上实施例仅用以说明本发明的技术方案，而非对其限制。本领域的普通技术人员应当理解：可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。