CN102595166A

CN102595166A - 一种适用于深度图编码的拉格朗日因子计算方法

Info

Publication number: CN102595166A
Application number: CN2012100556808A
Authority: CN
Inventors: 元辉; 刘琚; 孙建德
Original assignee: Shandong University
Current assignee: Shandong University
Priority date: 2012-03-05
Filing date: 2012-03-05
Publication date: 2012-07-18
Anticipated expiration: 2032-03-05
Also published as: CN102595166B

Abstract

本发明公开了一种适用于深度图编码的拉格朗日因子计算方法，该方法首先是确定虚拟视图失真与深度图编码误差之间的关系，依据摄像机参数计算深度图的编码误差对虚拟视图失真的影响程度，进而采用深度图对应的纹理视频估算模型参数，最后计算拉格朗日因子。本发明依据深度图的压缩失真对合成虚拟视图质量的影响，更好的反映深度图的压缩失真对合成虚拟视图质量的影响，提高三维立体视频编码的效率，可应用于三位立体视频的编码标准中。

Description

一种适用于深度图编码的拉格朗日因子计算方法

技术领域

本发明涉及到三维视频编码标准中的深度图编码技术，具体是一种深度图编码器率失真优化过程中计算拉格朗日因子的方法，属于深度图编码技术领域。

背景技术

三维视频作为未来主要的视频应用技术，是指用户通过三维视频显示设备可以享受到真实的三维视频内容。三维视频的相关技术，比如，三维视频采集、三维视频编码、三维视频的显示等技术已经得到广泛的关注。为了推动三维视频技术的标准化，2002年，运动图像专家组(Motion Picture Experts Group，MPEG)提出任意视点电视(Free View Television，FTV)的概念。它能够提供生动真实的、交互式的三维视听系统。用户可以从不同的角度观看该角度的三维视频，使得用户有融入视频场景中的真实感受。FTV可广泛应用于广播通信、娱乐、教育、医疗和视频监控等领域。为了使用户可以观看到任意角度的三维视频，FTV系统服务端使用已标定好的摄像机阵列获得一定视点上的视频。并对不同视点上的视频校正，利用校正过的视频信息通过虚拟视图合成技术生成虚拟视点的虚拟视图。目前MPEG建议具体使用基于深度-图像(Depth-Image Based Rendering，DIBR)的虚拟视图合成技术。深度信息一般通过深度图表示。

虚拟视图合成的主要过程如下：

1).确定要虚拟视点在摄像机阵列中的相对位置。

2).确定用于合成虚拟视点的纹理视频

3).确定步骤2)的纹理视频对应的深度图

4).依据步骤2)与3)中的纹理视频和深度图，采用DIBR技术，合成虚拟视图。

FTV的标准化工作分为两个阶段进行。第一阶段是2006年至2008年由JVT(Joint VideoTeam)，联合视频编码组制定的H.264/AVC的扩展方案-MVC(Multi-View Video Coding)。MVC可以对多视点纹理视频进行编码。但是要最终实现FTV系统的功能，还必须要对深度信息进行编码。目前FTV的标准化制定工作已经进入第二阶段，即3DVC(Three Dimensional VideoCoding)。3DVC主要关注深度信息的表示与编码，以及纹理视频与深度信息的联合编码。3DVC中，深度信息通过深度图表示。

衡量3DVC性能的主要指标是合成虚拟视图的质量，以及纹理视频、深度图的编码码率。虚拟视图的质量：

通常采用峰值信噪比(Peak Signal-to-Noise Ratio，PSNR)来衡量视频的质量。PSNR的计算公式如下式所示，

PSNR = 10 \times \log (\frac{255^{2}}{MSE})

其中MSE表示原始视图与合成虚拟视图之间的均方误差，用来衡量虚拟视图的失真，以及纹理视频的编码失真、深度图的编码失真。

在实际应用中，虚拟视点的视图是不存在的，也即不存在原始视图。但是由于3DVC主要关注编码性能，因此为衡量3DVC的性能，首先采用未经编码的已有纹理视频及其对应的深度图合成虚拟视图V_orig，然后采用经过编码后的重建的纹理视频以及编码后重建的深度图合成虚拟视图V_rec，最后通过计算V_rec与V_orig之间的的MSE，进而得到PSNR，以衡量3DVC的性能。

在H.264/AVC视频编码标准中，首先对当前编码块进行预测，然后计算当前编码块与预测块之间的平均平方误差MSE作为失真D；然后将当前编码块的像素灰度值减去预测块的像素灰度值，得到预测差值，对预测差值进行离散余弦变换、量化和熵编码，继而得到当前编码块的编码码率R；最后采用下式计算当前编码块的率失真代价J，

J＝D+λ_mode·R，

其中λ_mode为拉格朗日因子。编码器在模式选择的过程中，λ_mode的计算方法如下，

λ_{mode} = - \frac{{&PartialD; D}_{d}}{&PartialD; R_{d}} = - \frac{&PartialD; D_{d}}{&PartialD; Q_{d}} g \frac{&PartialD; Q_{d}}{&PartialD; R_{d}} = 0.85 g 2^{(QP - 12) / 3},

其中，D_d为深度图的编码失真，Q_d为深度图的量化步长，R_d为深度图的编码码率，QP为深度图的量化参数。

在运动估计过程中，采用平均绝对差作为失真准则，因此运动估计过程中的拉格朗日因子λ_motion为：

λ_{motion} = \sqrt{λ_{mode}} .

H.264/AVC采用的拉格朗日因子计算方法没有考虑到深度图的压缩失真对合成虚拟视图的质量的影响，因此采用H.264/AVC的率失真判断准则对深度图进行编码的效率不高。在三维视频编码中，深度图的编码需要面向虚拟视图；因此深度图编码拉格朗日因子应综合考虑虚拟视图的失真，以及深度图的编码码率。

发明内容

针对H.264/AVC采用的拉格朗日因子计算方法没有考虑到深度图的压缩失真对合成虚拟视图质量影响的问题，本发明依据深度图的压缩失真对合成虚拟视图质量的影响，提出一种在相同深度图编码码率的条件下合成虚拟视图质量更高的适用于深度图编码的拉格朗日因子计算方法。

在虚拟视图合成过程中，深度图的编码误差|e_d|会改变像素的投射位置，使像素的投射位置平移i个像素，

i = \frac{fgL}{255} g (\frac{1}{Z_{near}} - \frac{1}{Z_{far}}) g | e_{d} | = αg | e_{d} |,

其中，f为摄像机焦距，L为当前视点与虚拟视点之间的距离，Z_near和Z_far分别表示场景的最近最远物体的深度值，参数α表示深度图的编码失真对像素投射位置的变化的影响程度。

像素的投射位置平移i个像素所引起虚拟视图的失真可表示为，

D_{v} = {SSD}_{i}

= Σ_{j = 0}^{M - 1} {[T (j) - T_{i} (j)]}^{2}

\approx A_{0} + A_{1} gi + A_{2} {gi}^{2},

= A_{0} + A_{1} gαg | e_{d} | + A_{2} g α^{2} g {| e_{d} |}^{2}

= A_{0} + A_{1} gαg | e_{d} | + A_{2} g α^{2} g D_{d}

其中，D_v表示虚拟视图的失真，T为深度图对应的纹理视频图像，T_i为将该纹理视频图像平移i个像素所得到的图像，SSD_i表示T与T_i之间的平方差和(Sum of Squared Difference，SSD)，j为纹理视频图像中的第j个像素，M为纹理视频图像中像素的数量，A₀，A₁，A₂表示像素投射位置的变化对虚拟视图失真的影响程度。

进一步，由理论分析知，深度图编码中拉格朗日因子λ_d的计算方法为，

λ_{d} = - \frac{{&PartialD; D}_{v}}{&PartialD; R_{d}} = - \frac{&PartialD; D_{v}}{&PartialD; Q_{d}} \cdot \frac{&PartialD; Q_{d}}{&PartialD; R_{d}},

因此，深度图编码中拉格朗日因子λ_d的计算方法应为，

λ_{d} = - \frac{&PartialD; D_{v}}{&PartialD; R_{d}}

= - \frac{&PartialD; (A_{0} + A_{1} gα \cdot | e_{d} | + A_{2} g α^{2} g {D_{d}}^{2})}{&PartialD; Q_{d}} g \frac{&PartialD; Q_{d}}{&PartialD; R_{d}} .

= - A_{1} gαg \frac{&PartialD; | e_{d} |}{&PartialD; Q_{d}} g \frac{{&PartialD; Q}_{d}}{&PartialD; R_{d}} - A_{2} g α^{2} g \frac{&PartialD; D_{d}}{&PartialD; Q_{d}} g \frac{&PartialD; Q_{d}}{&PartialD; R_{d}}

= - A_{1} gαg \sqrt{λ_{mode}} - A_{2} g α^{2} g λ_{mode}

根据以上论述，本发明的适用于深度图编码的拉格朗日因子计算方法，是依据摄像机焦距f、当前视点与虚拟视点之间的距离L以及场景的最近最远物体的深度值Z_near和Z_far计算参数α；确定深度图对应的纹理视频图像T，将该纹理视频图像依次平移1～N个像素，记为T_i，i∈[1，N]；计算T与T_i之间的平方差和(Sum of Squared Difference，SSD)，记为SSD_i；依据SSD_i与深度图编码误差|e_d|使像素的投射位置平移的像素个数i之间的关系，估计出参数A₁和A₂；进而计算深度图编码中拉格朗日因子λ_d；具体步骤如下：

(1)建立虚拟视图失真D_v与深度图编码误差之间的关系为，

D_{v} = {SSD}_{i}

= Σ_{j = 0}^{M - 1} {[T (j) - T_{i} (j)]}^{2}

\approx A_{0} + A_{1} gi + A_{2} {gi}^{2}

= A_{0} + A_{1} gαg | e_{d} | + A_{2} g α^{2} g {| e_{d} |}^{2}

= A_{0} + A_{1} gαg | e_{d} | + A_{2} g α^{2} g D_{d}

其中，D_v表示虚拟视图的失真，T为深度图对应的纹理视频图像，T_i为将该纹理视频图像平移i个像素所得到的图像，SSD_i表示T与T_i之间的平方差和，j为纹理视频图像中的第j个像素，M为纹理视频图像中像素的数量，|e_d|为深度图的编码误差，D_d为深度图的编码失真，A₀，A₁，A₂表示像素投射位置的变化对虚拟视图失真的影响程度，参数α表示深度图的编码失真对像素投射位置的变化的影响程度；

(2)依据摄像机焦距f、当前视点与虚拟视点之间的距离L、场景的最近物体的深度值Z_near以及最远物体的深度值Z_far计算参数α，

α = \frac{fgL}{255} g (\frac{1}{Z_{near}} - \frac{1}{Z_{far}}),

(3)确定深度图对应的纹理视频图像T，将该纹理视频图像依次平移i个像素，记为T_i，i的取值范围是[3，N]，其中，N须小于该纹理视频图像的宽度；

(4)计算T与T_i之间的平方差和，即SSD_i，

{SSD}_{i} = Σ_{j = 0}^{M - 1} {[T (j) - T_{i} (j)]}^{2},

其中，j为纹理视频图像中的第j个像素，M为纹理视频图像中像素的数量；

(5)依据SSD_i与i之间的关系，

\{\begin{matrix} {SSD}_{1} = Σ_{j = 0}^{M - 1} {[T (j) - T_{1} (j)]}^{2} \approx A_{0} + A_{1} g 1 + A_{2} g 1^{2} \\ M \\ {SSD}_{1} = Σ_{j = 0}^{M - 1} {[T (j) - T_{N} (j)]}^{2} \approx A_{0} + A_{1} gi + A_{2} {gi}^{2} \\ M \\ {SSD}_{N} = Σ_{j = 0}^{M - 1} {[T (j) - T_{N} (j)]}^{2} \approx A_{0} + A_{1} gN + A_{2} g N^{2} \end{matrix}

通过求解三元一次方程组：

\{\begin{matrix} A_{0} g Σ_{i = 1}^{N} i + A_{1} g Σ_{i = 1}^{N} i^{2} + A_{2} gN = Σ_{i = 1}^{N} {SSD}_{i} \\ A_{0} g Σ_{i = 1}^{N} i^{2} + A_{1} g Σ_{i = 1}^{N} i^{3} + A_{2} g Σ_{i = 1}^{N} i = Σ_{i = 1}^{N} ({SSD}_{i} gi) \\ A_{0} g Σ_{i = 1}^{N} i^{3} + A_{1} g Σ_{i = 1}^{N} i^{4} + A_{2} g Σ_{i = 1}^{N} i^{2} = Σ_{i = 1}^{N} ({SSD}_{i} {gi}^{2}) \end{matrix}

计算参数A₀、A₁和A₂；

(6)计算深度图编码中拉格朗日因子λ_d，

其中，λ_mode为H.264/AVC中模式判决过程中采用的拉格朗日因子，λ_mode的计算方法如下，

λ_{mode} = - \frac{{&PartialD; D}_{d}}{&PartialD; R_{d}} = - \frac{&PartialD; D_{d}}{&PartialD; Q_{d}} g \frac{&PartialD; Q_{d}}{&PartialD; R_{d}} = 0.85 g 2^{(QP - 12) / 3},

本发明与现有技术相比具有以下优点：

(1)本发明依据深度图的压缩失真对合成虚拟视图质量的影响，在率失真优化过程中，确定了适用于深度图的拉格朗日因子计算方法，该方法提高了三维立体视频深度图的编码效率，使得在相同深度图编码码率的条件下，合成虚拟视图质量更高；

(2)本发明依据深度图对应位置处的纹理视频图像计算拉格朗日因子，不需要进行预编码，可以实时的应用于3DV的编码器中。

附图说明

图1是本发明适用于深度图编码的拉格朗日因子计算流程图；

图2是分别采用本发明的方法与H.264/AVC的方法对三维视频序列Bookarrival的深度图进行编码后的率失真曲线比较图。

图3是分别采用本发明的方法与H.264/AVC的方法对三维视频序列Kendo的深度图进行编码后的率失真曲线比较图。

具体实施方式

如图1所示，本发明的适用于深度图编码的拉格朗日因子计算方法，具体包括以下步骤：

(1)建立虚拟视图失真D_v与深度图编码误差之间的数学模型关系，

D_{v} = {SSD}_{i}

= Σ_{j = 0}^{M - 1} {[T (j) - T_{i} (j)]}^{2}

\approx A_{0} + A_{1} gi + A_{2} {gi}^{2}

= A_{0} + A_{1} gαg | e_{d} | + A_{2} g α^{2} g {| e_{d} |}^{2}

= A_{0} + A_{1} gαg | e_{d} | + A_{2} g α^{2} g D_{d}

其中，D_v表示虚拟视图的失真，T为深度图对应的纹理视频图像，T_i为将该纹理视频图像平移i个像素所得到的图像，SSD_i表示T与T_i之间的平方差和(Sum of Squared Difference，SSD)，j为纹理视频图像中的第j个像素，M为纹理视频图像中像素的数量，|e_d|为深度图的编码误差，D_d为深度图的编码失真，A₀，A₁，A₂表示像素投射位置的变化对虚拟视图失真的影响程度，参数α表示深度图的编码失真对像素投射位置的变化的影响程度，

α = \frac{fgL}{255} g (\frac{1}{Z_{near}} - \frac{1}{Z_{far}}),

(4)计算T与T_i之间的平方差和，即SSD_i，

{SSD}_{i} = Σ_{j = 0}^{M - 1} {[T (j) - T_{i} (j)]}^{2},

(5)依据SSD_i与i之间的关系，

\{\begin{matrix} {SSD}_{1} = Σ_{j = 0}^{M - 1} {[T (j) - T_{1} (j)]}^{2} \approx A_{0} + A_{1} g 1 + A_{2} g 1^{2} \\ M \\ {SSD}_{1} = Σ_{j = 0}^{M - 1} {[T (j) - T_{N} (j)]}^{2} \approx A_{0} + A_{1} gi + A_{2} {gi}^{2} \\ M \\ {SSD}_{N} = Σ_{j = 0}^{M - 1} {[T (j) - T_{N} (j)]}^{2} \approx A_{0} + A_{1} gN + A_{2} g N^{2} \end{matrix}

通过求解三元一次方程组，

\{\begin{matrix} A_{0} g Σ_{i = 1}^{N} i + A_{1} g Σ_{i = 1}^{N} i^{2} + A_{2} gN = Σ_{i = 1}^{N} {SSD}_{i} \\ A_{0} g Σ_{i = 1}^{N} i^{2} + A_{1} g Σ_{i = 1}^{N} i^{3} + A_{2} g Σ_{i = 1}^{N} i = Σ_{i = 1}^{N} ({SSD}_{i} gi) \\ A_{0} g Σ_{i = 1}^{N} i^{3} + A_{1} g Σ_{i = 1}^{N} i^{4} + A_{2} g Σ_{i = 1}^{N} i^{2} = Σ_{i = 1}^{N} ({SSD}_{i} {gi}^{2}) \end{matrix}

计算参数A₀，A₁和A₂；

(6)计算深度图编码中拉格朗日因子λ_d，

其中，λ_mode为

H.264/AVC中模式判决过程中采用的拉格朗日因子，λ_mode的计算方法如下，

λ_{mode} = - \frac{{&PartialD; D}_{d}}{&PartialD; R_{d}} = - \frac{&PartialD; D_{d}}{&PartialD; Q_{d}} g \frac{&PartialD; Q_{d}}{&PartialD; R_{d}} = 0.85 g 2^{(QP - 12) / 3},

本发明的效果可以通过实验进一步说明。

实验测试了在不同的量化参数的条件下，采用本发明对深度图进行编码后的编码码率和合成虚拟视图的客观质量PSNR。图2和图3比较了采用本发明和H.264/AVC的方法对深度图编码后的率失真曲线，其中图2是对三维视频序列Bookarrival的深度图进行编码的实验结果，图3是对三维视频序列Kendo的深度图进行编码的实验结果。由图2和图3可见，与H.264/AVC相比，采用本发明进行编码后，在深度图的编码码率相同的条件下，合成的虚拟视图的客观质量更高，说明本发明提高了深度图的编码效率。

Claims

1.一种适用于深度图编码的拉格朗日因子计算方法，其特征是：依据摄像机焦距f、当前视点与虚拟视点之间的距离L以及场景的最近最远物体的深度值Z_near和Z_far计算参数α；确定深度图对应的纹理视频图像T，将该纹理视频图像依次平移1～N个像素，记为T_i，i∈[1，N]；计算T与T_i之间的平方差和，记为SSD_i；依据SSD_i与深度图编码误差|e_d|使像素的投射位置平移的像素个数i之间的关系，估计出参数A₁和A₂；进而计算深度图编码中拉格朗日因子λ_d；具体步骤如下：

(1)建立虚拟视图失真D_v与深度图编码误差之间的关系为，

D_{v} = {SSD}_{i}

= Σ_{j = 0}^{M - 1} {[T (j) - T_{i} (j)]}^{2}

\approx A_{0} + A_{1} gi + A_{2} {gi}^{2}

= A_{0} + A_{1} gαg | e_{d} | + A_{2} g α^{2} g {| e_{d} |}^{2}

= A_{0} + A_{1} gαg | e_{d} | + A_{2} g α^{2} g D_{d}

α = \frac{fgL}{255} g (\frac{1}{Z_{near}} - \frac{1}{Z_{far}}),

(4)计算T与T_i之间的平方差和，即SSD_i，

{SSD}_{i} = Σ_{j = 0}^{M - 1} {[T (j) - T_{i} (j)]}^{2},

(5)依据SSD_i与i之间的关系，

\{\begin{matrix} {SSD}_{1} = Σ_{j = 0}^{M - 1} {[T (j) - T_{1} (j)]}^{2} \approx A_{0} + A_{1} g 1 + A_{2} g 1^{2} \\ M \\ {SSD}_{1} = Σ_{j = 0}^{M - 1} {[T (j) - T_{N} (j)]}^{2} \approx A_{0} + A_{1} gi + A_{2} {gi}^{2} \\ M \\ {SSD}_{N} = Σ_{j = 0}^{M - 1} {[T (j) - T_{N} (j)]}^{2} \approx A_{0} + A_{1} gN + A_{2} g N^{2} \end{matrix}

通过求解三元一次方程组：

\{\begin{matrix} A_{0} g Σ_{i = 1}^{N} i + A_{1} g Σ_{i = 1}^{N} i^{2} + A_{2} gN = Σ_{i = 1}^{N} {SSD}_{i} \\ A_{0} g Σ_{i = 1}^{N} i^{2} + A_{1} g Σ_{i = 1}^{N} i^{3} + A_{2} g Σ_{i = 1}^{N} i = Σ_{i = 1}^{N} ({SSD}_{i} gi) \\ A_{0} g Σ_{i = 1}^{N} i^{3} + A_{1} g Σ_{i = 1}^{N} i^{4} + A_{2} g Σ_{i = 1}^{N} i^{2} = Σ_{i = 1}^{N} ({SSD}_{i} {gi}^{2}) \end{matrix}

计算参数A₀、A₁和A₂；

(6)计算深度图编码中拉格朗日因子λ_d，

λ_{mode} = - \frac{{&PartialD; D}_{d}}{&PartialD; R_{d}} = - \frac{&PartialD; D_{d}}{&PartialD; Q_{d}} g \frac{&PartialD; Q_{d}}{&PartialD; R_{d}} = 0.85 g 2^{(QP - 12) / 3},