CN104284196A

CN104284196A - 彩色与深度视频联合编码的比特分配及码率控制算法

Info

Publication number: CN104284196A
Application number: CN201410587503.3A
Authority: CN
Inventors: 雷建军; 李贞贞; 侯春萍; 胡春悦; 朱涛; 金鹏
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2014-10-28
Filing date: 2014-10-28
Publication date: 2015-01-14
Anticipated expiration: 2034-10-28
Also published as: CN104284196B

Abstract

本发明属于3D视频编码领域，为解决JVT-G012中码率控制与彩色深度视频之间比特分配不兼容的问题，同时更加准确的实现彩色/深度层及帧层的联合码率控制，为此，本发明采取的技术方案是，彩色与深度视频联合编码的比特分配及码率控制算法，包括如下步骤：1)建立虚拟视点失真模型：2)建立彩色及深度视频的失真模型D_t-R_t和D_d-R_d：3)建立D_v-R_t-R_t模型：4)计算当前编码视频的目标比特：5)基于计算的最优目标比特率进行编码。本发明主要应用于3D视频编码。

Description

彩色与深度视频联合编码的比特分配及码率控制算法

技术领域

本发明属于3D视频编码领域，涉及一种彩色加深度视频的联合比特分配及码率控制方法。

技术背景

三维(3D)视频是对立体视觉场景的一种再现，可以使观察者体验到自然逼真的3D场景。基于深度感知、交互性等的特点，3D视频在许多领域都有着广泛的应用，如3D电视(3DTV)、自由视点电视(FTV)、可视会议等。为了促进这些应用，研究者们正在研究包括3D视频的采集、表示、编码、传输、虚拟视点绘制和显示等与3D视频相关的关键技术。

实际应用中的3D视频通常需要包含不同角度的多个视点的信息，多视点增加了存储空间和传输带宽的需求。为了解决这个问题，许多场景表示和视点绘制技术被相继提出。基于深度图的虚拟视点绘制(Depth Image-Based Rendering，DIBR)是一种灵活的、低代价的虚拟视点绘制技术。在DIBR中，虚拟视点可以通过彩色视频及与其对应的深度视频来绘制，它利用3D变换技术，可以根据需要绘制不同位置上的虚拟视点。经虚拟视点绘制技术获得的虚拟视点的质量会受到多方面因素影响，包括彩色视频和深度视频的压缩效率及虚拟视点绘制算法。此外，当彩色视频和深度视频编码的总比特率受到限制时，彩色视频和深度视频之间的比特分配对绘制的虚拟视点的质量也具有重要的影响。

为了尽量减少绘制视点的失真，研究者们提出不同的彩色视频和深度视频之间比特分配方法。Liu等提出了一种联合码率控制算法，该算法分为三个层，即视点层，彩色/深度层和帧层。视点层通过预编码来统计各类视点之间的比特进而得到最佳视点间的比特分配比；在彩色/深度层，为确保3D视频的质量，比特被非均匀的分配在彩色与深度视频中；帧层采用分层码率控制算法为每帧分配目标比特。Shao等提出了一种虚拟视点失真模型。该模型将合成视点失真表示为彩色视频的失真和深度视频的失真两部分。然后，两个失真基于二次失真模型分别建模。最后，在总比特限制下最小化绘制视点的失真，计算得到彩色与深度视频的最优比特分配方案。Yuan等推导了一个通用的虚拟视点失真模型，该模型包含彩色视频的失真、深度视频的失真及常数部分。然后，两个失真部分由线性失真模型分别建模。最后，在总比特限制下通过最小化绘制视点的失真，计算得到彩色与深度视频的最优比特分配方法。

现有的比特分配能够得到较为准确的比特分配方案，然而这些方案需要考虑编码的同步性，且不能直接应用在H.264/AVC的码率控制中。

发明内容

为了克服现有技术的不足，解决JVT-G012中码率控制与彩色深度视频之间比特分配不兼容的问题，同时更加准确的实现彩色/深度层及帧层的联合码率控制，为此，本发明采取的技术方案是，彩色与深度视频联合编码的比特分配及码率控制算法，包括如下步骤：

1)建立虚拟视点失真模型：

在不同的给定目标比特R_T下预编码彩色视频及与之对应的深度视频，并采用虚拟视点绘制方法绘制虚拟视点；统计虚拟视点失真D_v，深度视频失真D_d与彩色视频失真D_t，建立模型，拟合模型参数，具体虚拟视点失真模型表示为：

D_v＝A·D_t+B·D_d+C₀

其中，A、B分别代表D_t和D_d对虚拟视点失真D_v的影响因子，C₀是一个常数；

2)建立彩色及深度视频的失真模型D_t-R_t和D_d-R_d：

统计彩色视频/深度视频编码失真，输出比特率及对应的目标比特率，建立模型。

3)建立D_v-R_t-R_t模型：

统计虚拟视点失真D_v，深度视频目标比特R_d与彩色视频目标比特R_t，并建立模型。由步骤1)和2)可以推导出D_v-R_t-R_t，具体表示为：

其中，μ，ν分别代表R_t和R_d在虚拟视点的失真D_v的影响因子，C是一个常数；

4)计算当前编码视频的目标比特：

比特分配方案为：在总比特率R_C的约束下，最小化的虚拟视点的失真，表示为

argminD_v

s.t.R_t+R_d≤R_C

st.表示使满足，基于D_v-R_t-R_d模型，最优比特分配问题可以改写为如下：

\underset{(R_{t}, R_{d}) &Element; Ω}{\arg \min} (μ \cdot \exp (- β_{t} \cdot R_{t}) + v \cdot \exp (- β_{d} \cdot R_{d}) + C)

s.t.R_t+R_d≤R_C

其中Ω表示所有(R_t,R_d)的集合。采用拉格朗日乘数法来解决在限制条件下求比特分配的最优解的问题。将限制条件下求极值的问题映射到等价的无约束条件的求极值问题，如下：

\min_{(R_{t}, R_{d})} J = {μ \cdot \exp (- β_{t} \cdot R_{t}) + v \cdot \exp (- β_{d} \cdot R_{d}) + C + λ (R_{d} + R_{t} - R_{C})}

其中，λ是拉格朗日乘子，最优的彩色及深度视频的目标比特率R_t和R_d可以通过求解以下解方程组得到

\{\begin{matrix} \frac{&PartialD; J}{&PartialD; R_{t}} = - μ \cdot β_{t} \cdot \exp (- β_{t} \cdot R_{t}) + λ = 0 \\ \frac{&PartialD; J}{&PartialD; R_{d}} = - v \cdot β_{d} \cdot \exp (- β_{d} \cdot R_{d}) + λ = 0 \\ \frac{&PartialD; J}{&PartialD; λ} = R_{d} + R_{t} - R_{C} = 0 \end{matrix}

从而，最优目标比特率R_t和R_d的计算如下：

\{\begin{matrix} R_{t} = \frac{β_{d} \cdot R_{C} + \ln (\frac{μ \cdot β_{t}}{v \cdot β_{d}})}{β_{t} + β_{d}} \\ R_{d} = \frac{β_{t} \cdot R_{C} - \ln (\frac{μ \cdot β_{t}}{v \cdot β_{d}})}{β_{t} + β_{d}} \end{matrix}

5)基于计算的最优目标比特率进行编码。

步骤2)进一步具体为：考虑较为理想的情况，输出比特率R_O和目标比特率R_T之间的关系表示为

R_o≌R_T

H.264/AVC的变换和量化采用整数DCT技术，基于DCT系数服从拉普拉斯分布的假设，香农率失真函数可以表示为

R_{O} = \ln (\frac{1}{γD}) (0 < D < \frac{1}{γ})

其中，γ是一个常数，D是输出失真。根据率失真函数及码率控制的准确性判定，输出失真D和目标比特率R_T之间的关系可以建立一个指数模型，模型可以如下表示：

D＝α·exp(-β·R_T)+c

其中，α、β和c是模型参数。相应的彩色/深度视频的失真模型D_t-R_t和D_d-R_d可以描述为

D_t＝α_t·exp(-β_t·R_t)+c_t

D_d＝α_d·exp(-β_d·R_d)+c_d

其中，α_t、β_t、c_t和α_d、β_d、c_d分别是对应于彩色视频与深度视频的模型参数，D_t、R_t和D_d、R_d对应为彩色及深度视频的失真及目标码率。

与已有技术相比，本发明的技术特点与效果：

本发明所提出的码率控制技术简化了彩色视频和深度视频的码率控制计算，并提高了比特分配的精度，满足3D视频系统的应用要求。

附图说明

图1采用本文方法及固定比特分配比方法的率失真性能对比图；

图2给出了技术方案的流程图。

具体实施方式

本发明提出了一种有效的联合比特分配和码率控制的方法，通过采用指数失真模型简化计算，并提升了比特分配的准确度。本发明解决了原有JVT-G012中码率控制与彩色深度视频之间比特分配不兼容的问题，同时更加准确的实现了彩色/深度层及帧层的联合码率控制。

为了克服现有技术的不足，本发明提出了一种比特分配与码率控制算法，实现了更准确的多层码率控制，具体的技术方案分为下列步骤：

1建立虚拟视点失真模型。

在不同的给定目标比特R_T下预编码彩色视频及与之对应的深度视频，并采用DIBR技术绘制虚拟视点。统计虚拟视点失真D_v，深度视频失真D_d与彩色视频失真D_t，建立模型，拟合模型参数，具体虚拟视点失真模型表示为：

D_v＝A·D_t+B·D_d+C₀

其中，A、B分别代表D_t和D_d对虚拟视点失真D_v的影响因子，C₀是一个常数。

2建立彩色及深度视频的失真模型D_t-R_t和D_d-R_d。

考虑较为理想的情况，输出比特率R_O和目标比特率R_T之间的关系可表示为

R_o≌R_T

R_{O} = \ln (\frac{1}{γD}) (0 < D < \frac{1}{γ})

D＝α·exp(-β·R_T)+c

D_t＝α_t·exp(-β_t·R_t)+c_t

D_d＝α_d·exp(-β_d·R_d)+c_d

3建立D_v-R_t-R_t模型。

统计虚拟视点失真D_v，深度视频目标比特R_d与彩色视频目标比特R_t，并建立模型。由步骤1和2可以推导出D_v-R_t-R_t，具体表示为：

其中，μ，ν分别代表R_t和R_d在虚拟视点的失真D_v的影响因子，C是一个常数。

4计算当前编码视频的目标比特

比特分配方案为：在总比特率R_C的约束下，最小化的虚拟视点的失真，可以表示为

argminD_v

s.t.R_t+R_d≤R_C

基于D_v-R_t-R_d模型，最优比特分配问题可以改写为如下：

\underset{(R_{t}, R_{d}) &Element; Ω}{\arg \min} (μ \cdot \exp (- β_{t} \cdot R_{t}) + v \cdot \exp (- β_{d} \cdot R_{d}) + C)

s.t.R_t+R_d≤R_C

\min_{(R_{t}, R_{d})} J = {μ \cdot \exp (- β_{t} \cdot R_{t}) + v \cdot \exp (- β_{d} \cdot R_{d}) + C + λ (R_{d} + R_{t} - R_{C})}

其中，λ是拉格朗日乘子。最优的彩色及深度视频的目标比特率R_t和R_d可以通过求解以下解方程组得到

\{\begin{matrix} \frac{&PartialD; J}{&PartialD; R_{t}} = - μ \cdot β_{t} \cdot \exp (- β_{t} \cdot R_{t}) + λ = 0 \\ \frac{&PartialD; J}{&PartialD; R_{d}} = - v \cdot β_{d} \cdot \exp (- β_{d} \cdot R_{d}) + λ = 0 \\ \frac{&PartialD; J}{&PartialD; λ} = R_{d} + R_{t} - R_{C} = 0 \end{matrix}

从而，最优目标比特率R_t和R_d的计算如下：

\{\begin{matrix} R_{t} = \frac{β_{d} \cdot R_{C} + \ln (\frac{μ \cdot β_{t}}{v \cdot β_{d}})}{β_{t} + β_{d}} \\ R_{d} = \frac{β_{t} \cdot R_{C} - \ln (\frac{μ \cdot β_{t}}{v \cdot β_{d}})}{β_{t} + β_{d}} \end{matrix}

5.基于计算的最优目标比特率进行编码。

依据以上步骤求得的最优的彩色及深度视频的目标比特率R_t和R_d，分别设置彩色及深度视频的目标比特，实现帧层的码率控制。

下面对本发明的具体实施方式进行描述。

1建立虚拟视点失真模型。

D_v＝A·D_t+B·D_d+C₀

2建立彩色及深度视频的失真模型D_t-R_t和D_d-R_d。

统计彩色视频/深度视频编码失真，输出比特率及对应的目标比特率，建立模型，拟合对应的模型参数。在理想情况下，码率控制算法可使输出的比特率R_O与设定的目标比特率R_T相同。考虑较为理想的情况，输出比特率R_O和目标比特率R_T之间的关系可表示为

R_o≌R_T

H.264/AVC的变换和量化采用整数DCT技术。基于DCT系数服从拉普拉斯分布的假设，香农率失真函数可以表示为

R_{O} = \ln (\frac{1}{γD}) (0 < D < \frac{1}{γ})

D＝α·exp(-β·R_T)+c

D_t＝α_t·exp(-β_t·R_t)+c_t

D_d＝α_d·exp(-β_d·R_d)+c_d

3建立D_v-R_t-R_t模型。

统计虚拟视点失真D_v，深度视频目标比特R_d与彩色视频目标比特R_t，建立模型，拟合相应的模型参数。由步骤1和2可以推导出D_v-R_t-R_t，具体表示为：

4计算当前编码视频的目标比特

比特分配解决方案：在总比特率R_C的约束下最小化的虚拟视点的失真，可以表示为

argminD_v

s.t.R_t+R_d≤R_C

基于D_v-R_t-R_d模型，最优比特分配问题可以改写为如下：

\underset{(R_{t}, R_{d}) &Element; Ω}{\arg \min} (μ \cdot \exp (- β_{t} \cdot R_{t}) + v \cdot \exp (- β_{d} \cdot R_{d}) + C)

s.t.R_t+R_d≤R_C

其中Ω表示所有(R_t,R_d)的集合。采用拉格朗日乘数法来解决在限制条件下求比特分配的最优解的问题。将限制条件下求极值的问题映射到等价的无约束条件的求极值问题如下：

\min_{(R_{t}, R_{d})} J = {μ \cdot \exp (- β_{t} \cdot R_{t}) + v \cdot \exp (- β_{d} \cdot R_{d}) + C + λ (R_{d} + R_{t} - R_{C})}

\{\begin{matrix} \frac{&PartialD; J}{&PartialD; R_{t}} = - μ \cdot β_{t} \cdot \exp (- β_{t} \cdot R_{t}) + λ = 0 \\ \frac{&PartialD; J}{&PartialD; R_{d}} = - v \cdot β_{d} \cdot \exp (- β_{d} \cdot R_{d}) + λ = 0 \\ \frac{&PartialD; J}{&PartialD; λ} = R_{d} + R_{t} - R_{C} = 0 \end{matrix}

从而，最优目标比特率R_t和R_d的计算如下：

\{\begin{matrix} R_{t} = \frac{β_{d} \cdot R_{C} + \ln (\frac{μ \cdot β_{t}}{v \cdot β_{d}})}{β_{t} + β_{d}} \\ R_{d} = \frac{β_{t} \cdot R_{C} - \ln (\frac{μ \cdot β_{t}}{v \cdot β_{d}})}{β_{t} + β_{d}} \end{matrix}

5.基于计算的最优目标比特率进行编码。

依据以上步骤求得的最优的彩色及深度视频的目标比特率R_t和R_d，分别设置彩色/深度视频的目标比特，实现帧层的码率控制。

下面结合附图说明实验效果：

为使本发明的效果具有可比性，我们采用ballet测试序列进行测试，其帧率为15fps，分辨率为1024×768。编码平台采用JM18.4，虚拟视点绘制采用DIBR技术。彩色及深度视频的目标比特设为500、750、1000、1500、2000、2500、3000、3500(Kbps),每个视点包含100帧，GOP长度设为8，搜索范围为32，熵编码方式采用CABAC。

图1为采用本文方法及固定比特分配比方法的率失真性能对比图。从图中可见，本方法优于固定比特分配比的方法。所提出的方法可以更精确地控制比特分配，提高虚拟视点的RD性能，满足3D视频系统的应用要求。

Claims

1.一种彩色与深度视频联合编码的比特分配及码率控制算法，其特征是，包括如下步骤：

1)建立虚拟视点失真模型：

D_v＝A·D_t+B·D_d+C₀

2)建立彩色及深度视频的失真模型D_t-R_t和D_d-R_d：

3)建立D_v-R_t-R_t模型：

4)计算当前编码视频的目标比特：

arg min D_v

s.t.R_t+R_d≤R_C

基于D_v-R_t-R_d模型，最优比特分配问题可以改写为如下：

\underset{(R_{t}, R_{d}) &Element; Ω}{\arg \min} (μ \cdot \exp (- β_{t} \cdot R_{t}) + v \cdot \exp (- β_{d} \cdot R_{d}) + C)

s.t.R_t+R_d≤R_C

st.表示使满足，采用拉格朗日乘数法来解决在限制条件下求比特分配的最优解的问题。将限制条件下求极值的问题映射到等价的无约束条件的求极值问题，如下：

\min_{(R_{t}, R_{d})} J = {μ \cdot \exp (- β_{t} \cdot R_{t}) + v \cdot \exp (- β_{d} \cdot R_{d}) + C + λ (R_{d} + R_{t} - R_{C})}

\{\begin{matrix} \frac{&PartialD; J}{{&PartialD; R}_{t}} = - μ \cdot β_{t} \cdot \exp (- β_{t} \cdot R_{t}) + λ = 0 \\ \frac{&PartialD; J}{{&PartialD; R}_{d}} = - v \cdot β_{d} \cdot \exp (- β_{d} \cdot R_{d}) + λ = 0 \\ \frac{&PartialD; J}{&PartialD; λ} = R_{d} + R_{t} - R_{C} = 0 \end{matrix}

从而，最优目标比特率R_t和R_d的计算如下：

\{\begin{matrix} R_{t} = \frac{β_{d} \cdot R_{C} + \ln (\frac{μ \cdot β_{t}}{v \cdot β_{d}})}{β_{t} + β_{d}} \\ R_{d} = \frac{β_{t} \cdot R_{C} - \ln (\frac{μ \cdot β_{t}}{v \cdot β_{d}})}{β_{t} + β_{d}} \end{matrix}

5)基于计算的最优目标比特率进行编码。

2.如权利要求1所述的彩色与深度视频联合编码的比特分配及码率控制算法，其特征是，步骤2)进一步具体为：考虑较为理想的情况，输出比特率R_O和目标比特率R_T之间的关系表示为

R_O≌R_T

R_{O} = \ln (\frac{1}{γD}) (0 < D < \frac{1}{γ})

其中，γ是一个常数，D是输出失真，根据率失真函数及码率控制的准确性判定，输出失真D和目标比特率R_T之间的关系可以建立一个指数模型，模型可以如下表示：

D＝α·exp(-β·R_T)+c

D_t＝α_t·exp(-β_t·R_t)+c_t

D_d＝α_d·exp(-β_d·R_d)+c_d