CN103281530A

CN103281530A - 基于率失真优化的hevc码率控制方法

Info

Publication number: CN103281530A
Application number: CN2013101652597A
Authority: CN
Inventors: 吴炜; 宋彬; 王杰; 姬瑞旭
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2013-05-07
Filing date: 2013-05-07
Publication date: 2013-09-04
Anticipated expiration: 2033-05-07
Also published as: CN103281530B

Abstract

本发明公开了一种基于率失真优化的HEVC码率控制方法，主要解决视频编码标准HEVC的现有码率控制方法得到的重建视频质量差的问题。其实现步骤是：（1）设置编码器参数；（2）依次读入每个图像组，并对每个图像组的每一帧进行码率控制；（3）对于每一帧，如果不需要编码树单元层码率控制则计算帧的量化参数并进行编码，如果需要则计算帧的目标比特并进行编码树单元层码率控制；（4）采用一种基于率失真优化的量化参数计算方法，依次计算每个编码树单元的量化参数并进行编码，实现对编码树单元层的码率控制。本发明提高了视频编码标准HEVC的重建视频的质量，可用于视频点播、远程教育、远程医疗、会议电视、可视电话和流媒体等。

Description

基于率失真优化的HEVC码率控制方法

技术领域

本发明属于视频通信技术领域，特别涉及针对HEVC视频编码标准的码率控制方法，可用于视频点播、远程教育、远程医疗、会议电视、可视电话和流媒体等。

背景技术

码率控制的目的是通过控制视频编码的参数来控制输出码流的大小，同时尽可能获得更好的视频重建质量。在实时的视频通信中，码率控制是视频编码器不可缺少的一部分。为了满足快速增长的视频内容的需要，由国际电信联盟远程通信标准化组织ITU-T的视频专家组和国际标准委员会ISO的运动图像专家组联合成立的视频编码联合组JCT-VC，制定了新的视频编码标准，即高效率视频编码HEVC。该HEVC标准的编码器配置有三种不同的时域结构：全帧内配置，随机接入配置，低时延配置。其中，全帧内配置对所有的视频帧采用帧内编码的方式进行编码；随机接入配置采用分层的B帧结构，分为四个时域层，I帧以一定的周期插入到GOP第一帧，其时域层的第一层为I帧和GPB帧，其它层为B帧，其中，第一层、第二层和第三层为参考帧，第四层为非参考帧；低时延配置又分为强制性低时延配置和非强制性低时延配置，强制性低时延配置的第一帧为I帧，其余帧为GPB帧，非强制性低时延配置的第一帧为I帧，其余帧为P帧。为了在带宽受限的信道上实时传输HEVC视频码流，需要采用HEVC码率控制技术。

视频编码联合组JCT-VC的会议提案JCTVC-H0213和JCTVC-J0057分别提出了一个码率控制方法，其中JCTVC-H0213在第8次JCT-VC会议上被采纳。JCTVC-H0213提出的编码树单元CTU层码率控制，首先分配CTU的目标比特，然后用基于像素的统一码率-量化参数R-Q模型来计算编码树单元CTU的量化参数QP。JCTVC-H0213码率控制方法的码率-量化参数R-Q模型没有考虑不同时域层对模型参数的影响，对CTU分配比特时没有考虑编码树单元CTU复杂度，所以可以通过对不同的时域层采用不同的码率-量化参数R-Q模型参数和根据编码树单元CTU的复杂度分配其目标比特来进一步提高视频编码质量。JCTVC-J0057中的方法是一个基于x264码率控制的帧层码率控制方法。为了获得更好的视频主观质量，不同编码复杂度的编码树单元CTU应该采用不同的量化参数QP，而JCTVC-J0057中的方法对一帧的所有编码树单元CTU采用相同的量化参数QP编码，导致重建图像的不同区域视觉差别比较大，视频主观质量比较差。

发明内容

本发明的于针对上述已有技术的不足，在提案JCTVC-H0213码率控制方法的基础上提出一种基于率失真优化的HEVC码率控制方法，以获得更好的码率控制性能。

实现本发明的基本思想是：对大多数的图像组GOP第一帧则采用编码树单元CTU层码率控制；对不同的时域层分别使用不同的码率-量化参数R-Q模型参数；根据随机接入配置和低时延配置的时域结构特性分别采用不同的帧层目标比特计算方法；对于编码树单元CTU层的码率控制，采用一种基于码率-量化参数R-Q模型和失真-量化参数D-Q模型的最优化方法计算量化参数QP，其技术方案包括如下步骤：

（1）读取编码器配置文件，设置编码参数：

（1a）根据配置文件，分别设置初始量化参数Q_in和所有图像组GOP的大小，并将编码的时域结构设置为随机接入或者低时延，根据配置文件中的原始视频文件路径打开原始视频文件；

（1b）设第i个图像组的初始值i=0，设图像组中第j帧的初始值j=0；

（2）判断原始视频文件中是否有未编码的图像组，如果原始视频文件中有未编码的图像组，则进入步骤（3）；否则，编码器编码结束；

（3）读入一个图像组GOP，令i=i+1，j=0；

（4）令j=j+1，计算编码器的输出缓冲区占用值V_i,j和图像组GOP的剩余比特B_i,j；

（5）根据时域结构配置，判断第i个GOP的第j帧是否需要编码树单元CTU层的码率控制：

5a）对于随机接入配置：

若i=1，j=1或者i=2，j=1或者i=2，j=2或者i=2，j=3，则不需要编码树单元CTU层码率控制，即把第i个图像组第j帧的所有编码树单元CTU的量化参数设为初始量化参数Q_in，对该帧的所有编码树单元CTU进行编码后，执行步骤（8）；

若第i个图像组的第j帧是帧内编码帧，则不需要编码树单元层码率控制，即把其所有编码树单元CTU的量化参数设为上一个图像组中参考帧量化参数的平均值，再对第i个图像组的第j帧所有编码树单元CTU进行编码后，执行步骤（8）；

若第i个GOP的第j帧是非参考帧，则不需要编码树单元层码率控制，即根据播放顺序的前一帧的所有编码树单元的量化参数和后一帧的所有编码树单元的量化参数来计算第i个图像组第j帧的所有编码树单元CTU的量化参数，再对第i个图像组第j帧的所有编码树单元CTU编码后，执行步骤（8）；

若第i个图像组GOP的剩余比特B_i,j小于0，则不需要编码树单元层码率控制，即把第i个图像组第j帧的所有编码树单元CTU的量化参数设为前一帧的所有编码树单元CTU的量化参数的平均值加2,再对第i个图像组第j帧的所有编码树单元CTU进行编码后，执行步骤（8）；

若第i个图像组第j帧为除上述情况外的其它情况，则需要编码树单元层码率控制，执行步骤（6）；

5b）对于低时延配置：

若i=1，j=1或者i=2，j=1，则不需要编码树单元CTU层码率控制，即把第i个图像组第j帧的所有编码树单元CTU的量化参数设为初始量化参数Q_in，再对第i个图像组第j帧的所有编码树单元CTU进行编码后，执行步骤（8）；

若第i个图像组GOP的剩余比特B_i,j小于0，则不需要编码树单元CTU层码率控制，即把第i个图像组第j帧的所有编码树单元CTU的量化参数设为第i个图像组GOP的第j-1帧的所有编码树单元CTU的量化参数的平均值加2,再对第i个图像组第j帧的所有编码树单元CTU进行编码后，执行步骤（8）；

若第i个图像组第j帧为上述情况外的其它情况，则需要编码树单元层CTU码率控制，执行步骤（6）；

（6）计算第i个图像组的第j帧的目标比特T_i,j；

（7）令第i个图像组第j帧的剩余编码树单元的目标比特T_r,i,j＝T_i,j，进行编码树单元层码率控制：

（7a）设第k个编码树单元k=1，将第i个图像组第j帧的第k个编码树单元的量化参数QP_i,j,k设为上一个参考帧的所有编码树单元的量化参数的平均值，并对其进行编码，得到第k个编码树单元的实际编码比特b_i,j,k；

（7b）令T_r,i,j＝T_r,i,j-b_i,j,k，k=k+1；如果T_r,i,j≤0，则令第i个图像组第j帧的第k个编码树单元的量化参数QP_i,j,k等于上一个参考帧的所有编码树单元的量化参数的平均值加2，执行步骤（7d）；否则，执行步骤（7c）；

（7c）根据平均绝对差值预测模型，用同一时域层的前一帧的相应位置的编码树单元的实际平均绝对差值预测第i个图像组第j帧每一个剩余的编码树单元的平均绝对差值，根据码率-量化参数模型和失真-量化参数模型，采用拉格朗日方法，通过使剩余编码树单元的失真的倒数和最大化，来计算第k个编码树单元的量化步长QS_i,j,k，根据量化步长与量化参数的对应关系得到第i个图像组第j帧的第k个编码树单元的量化参数QP_i,j,k；

（7d）用第i个图像组第j帧的第k个编码树单元的量化参数QP_i,j,k对第i个图像组第j帧的第k个编码树单元编码，得到第i个图像组第j帧的第k个编码树单元的实际编码比特b_i,j,k；

（7e）比较k与一帧所包含的编码树单元个数N_CTU的大小，如果k＜N_CTU,返回步骤（7b）；如果k≥N_CTU，则编码树单元层码率控制结束，执行步骤（8）；

（8）如果第i个图像组的第j帧是第i个图像组的最后一帧，则返回步骤（2）；否则返回步骤（4）。

本发明具有如下优点：

1.本发明与提案JCTVC-H0213中的码率控制方法相比，由于对大部分图像组GOP的第一帧采用编码树单元层码率控制，对不同的时域层分别使用不同的模型参数，并根据随机接入配置和低时延配置的时域结构特性分别采用不同的帧层目标比特计算方法；同时由于编码树单元层的码率控制，采用一种基于码率-量化参数模型和失真-量化参数模型的最优化方法计算量化参数，因而能获得更好的码率控制性能。

2.本发明与提案JCTVC-H0213中的码率控制方法相比，采用JCTVC会议提案JCTVC-I1100中规定的视频序列作为测试序列，在码率接近的情况下，提高了重建视频的平均峰值信噪比。

实验结果表明，本发明在随机接入配置下将重建视频的平均峰值信噪比提高了2.055dB，在强制性低时延配置下将重建视频的平均峰值信噪比提高了1.511dB，在非强制性低性时延配置下将重建视频的平均峰值信噪比提高了1.433dB，而且视频帧的峰值信噪比的波动更小。

附图说明

图1是本发明的码率控制流程图；

图2是分别采用本发明和JCTVC-H0213中的码率控制方法进行编码得到的率失真曲线对比图；

图3是分别采用本发明和JCTVC-H0213中的码率控制方法进行编码得到的PSNR曲线对比图。

具体实施方式

下面将结合附图对本发明的实施例进行详细描述。本实施例以本发明技术方法为前提进行实施，给出了详细的实施方式和具体操作，但本发明的保护范围不限于下述实施例。

参照图1，本发明的实现步骤如下：

步骤一：读取编码器配置文件，设置编码参数。

编码参数包括初始量化参数Q_in，图像组的大小，编码的时域结构，第i个图像组的初始值，图像组中第j帧的初始值；

初始量化参数Q_in有两种方法可以得到：根据编码器配置文件设置初始量化参数Q_in或者根据JCTVC会议提案JCTVC-J0262中的方法设置初始量化参数Q_in，设置编码的时域结构为随机接入或者低时延，设第i个图像组的初始值i=0，设图像组中第j帧的初始值j=0；

步骤二：根据编码器配置文件中的原始视频文件路径打开原始视频文件。

步骤三：判断原始视频文件中是否有未编码的图像组，如果原始视频文件中有未编码的图像组，则进入步骤四；否则，编码器编码结束。

步骤四：读入一个图像组，令i=i+1，j=0。

步骤五：计算编码器的输出缓冲区占用值V_i,j和图像组的剩余比特B_i,j。

令j=j+1，根据时域结构配置计算编码器的输出缓冲区占用值V_i,j和图像组的剩余比特B_i,j：

对于随机接入配置：

V_{i, j} = \{\begin{matrix} 0 & i = 1, j = 1 \\ V_{i - 1, N_{GOP}} + b_{i - 1, N_{GOP}} - \frac{R_{i - 1, N_{GOP}}}{f} & i &NotEqual; 1, j = 1 \\ V_{i, j - 1} + b_{i, j - 1} - \frac{R_{i, j - 1}}{f} & j = 2,3, . . ., N_{GOP} \end{matrix},

B_{i, j} = \{\begin{matrix} \frac{\frac{R_{i, j}}{f} \times N_{II} - V_{i, j}}{N_{II}} \times N_{GOP} & j = 1 \\ B_{i, j - 1} + \frac{R_{i, j} - R_{i, j - 1}}{f} \times (N_{GOP} - j + 1) - b_{i, j - 1} & j = 2,3, . . ., N_{GOP} \end{matrix},

其中f表示帧率，R_i,j表示对第i个图像组第j帧编码时的带宽，R_i,j-1表示对第i个图像组第j-1帧编码时的带宽，N_GOP表示图像组的帧数，

表示对第i个图像组第N_GOP帧编码时的缓冲区占用值，V_i,j-1表示对第i个图像组第j-1帧编码时的缓冲区占用值，b_i,j-1表示第i个图像组第j-1帧的实际编码比特，N_II表示两个相邻帧内编码帧之间的帧数；

对于低时延配置，

V_{i, j} = \{\begin{matrix} 0 & i = 2, j = 1 \\ V_{i - 1, N_{GOP}} + b_{i - 1, N_{GOP}} - \frac{R_{i - 1, N_{GOP}}}{f} - A_{i - 1, N_{GOP}} & i &NotEqual; 2, j = 1 \\ V_{i, j - 1} + b_{i, j - 1} - \frac{R_{i, j - 1}}{f} - A_{i, j - 1} & j = 2,3, . . ., N_{GOP} \end{matrix},

B_{i, j} = \{\begin{matrix} \frac{R_{i, j}}{f} \times N_{GOP} - V_{i, j} & j = 1 \\ B_{i, j - 1} + \frac{R_{i, j} - R_{i, j - 1}}{f} \times (N_{GOP} - j + 1) - b_{i, j - 1} & j = 2,3, . . ., N_{GOP} \end{matrix},

其中f表示帧率，

表示对第i个图像组第N_GOP帧编码时的带宽，R_i-1,j-1表示对第i个图像组第j-1帧编码时的带宽，R_i-1,j表示对第i个图像组第j帧编码时的带宽，b_i,j-1表示第i个图像组第j-1帧的实际编码比特，

表示对第i个图像组第N_GOP帧编码时的调整比特，A_i,j-1表示第i个图像组第j-1帧编码时的调整比特；

所述

和A_i,j-1，按下式计算：

式中，η是常数，取值为0.2，第i个图像组第j帧的占用比特

第i个图像第j帧的补偿比特

I_{i, j} = \{\begin{matrix} b_{i, j} - \frac{R_{i, j}}{f} & i = 1, j = 1 \\ I_{i - 1, N_{GOP}} + A_{i - 1, N_{GOP}} & i &NotEqual; 1, j = 1 \\ I_{i, j - 1} + A_{i, j - 1} & i &NotEqual; 1, j &NotEqual; 1 \end{matrix},

其中f表示帧率，R_i,j表示第i个图像组第j帧编码时的带宽，N_GOP表示图像组的帧数，表示第i-1个图像组第N_GOP帧编码时的调整比特

A_i,j-1表示第i个图像组第j-1帧编码时的调整比特。

步骤六：根据时域结构配置，判断第i个图像组的第j帧是否需要编码树单元层码率控制。

6a）对于随机接入配置：

若i=1，j=1或者i=2，j=1或者i=2，j=2或者i=2，j=3，则不需要编码树单元层码率控制，即把第i个图像组第j帧的所有编码树单元的量化参数设为初始量化参数Q_in，对该第i个图像组第j帧的所有编码树单元进行编码后，执行步骤九；

若第i个图像组的第j帧是帧内编码帧，则不需要编码树单元层码率控制，把其所有编码树单元的量化参数设为上一个图像组中参考帧量化参数的平均值，即令

{QP}_{i, j} = \max {{QP}_{i - 1,1} - 2, \min {{QP}_{i - 1,1} + 2, \frac{\underset{j = jref}{Σ} {QP}_{i - 1, j}}{N_{ref}}}},

然后对第i个图像组的第j帧所有编码树单元进行编码后，执行步骤九，其中，QP_i-1,1表示第i-1个图像组第1帧的量化参数，N_ref表示图像组中参考帧的个数，j_ref表示参考帧的索引；

若第i个图像组的第j帧是非参考帧，则不需要编码树单元层码率控制，令第i个图像组第j帧的量化参数

再对第i个图像组第j帧的所有编码树单元编码后，执行步骤九，其中QP_pre表示第i个图像组第j帧播放顺序上的前一帧的量化参数，QP_next表示第i个图像组第j帧播放顺序上的后一帧的量化参数；

若第i个图像组的剩余比特B_i,j小于0，则不需要编码树单元层码率控制，即把第i个图像组第j帧的所有编码树单元的量化参数设为前一帧的所有编码树单元的量化参数的平均值加2，再对第i个图像组第j帧的所有编码树单元进行编码后，执行步骤九；

若第i个图像组第j帧为除上述情况外的其它情况，则需要编码树单元层码率控制，执行步骤七；

6b）对于低时延配置：

若i=1，j=1或者i=2，j=1，则不需要编码树单元层码率控制，即把第i个图像组第j帧的所有编码树单元的量化参数设为初始量化参数Q_in，再对第i个图像组第j帧的所有编码树单元进行编码后，执行步骤九；

若第i个图像组的剩余比特B_i,j小于0，则不需要编码树单元层码率控制，即把第i个图像组第j帧的所有编码树单元的量化参数设为第i个图像组的第j-1帧的所有编码树单元的量化参数的平均值加2,再对第i个图像组第j帧的所有编码树单元进行编码后，执行步骤九；

若第i个图像组第j帧为上述情况外的其它情况，则需要编码树单元层码率控制，执行步骤七；

步骤七：计算第i个图像组的第j帧的目标比特T_i,j。

7a)根据时域配置计算基于图像组剩余比特的目标比特

7a1)对于随机接入配置，通过如下公式计算目标比特

{\hat{T}}_{i, j} = \frac{{\overset{&OverBar;}{W}}_{l_{cur}, i, j} \times B_{i, j}}{Σ_{l = 1}^{m} {\overset{&OverBar;}{W}}_{l, i, j} \times N_{l, r, i}},

其中，l_curr是第i个图像组中第j帧的时域层索引，B_i,j是第i个图像组的剩余比特，N_l,r,i表示第i个图像组中第l时域层的剩余的帧数，m表示总时域层数，取值为4，

表示对第i个图像组第j帧编码时第l时域层的权值，

表示对第i个图像组第j帧编码时第l_curr时域层的权值；

的值根据下式计算：

{\overset{&OverBar;}{W}}_{l, i, j} = \{\begin{matrix} 0 & i = 1, j = 1 \\ \frac{{QP}_{i - 1, N_{GOP}} \times b_{i - 1, N_{GOP}}}{8} + \frac{7 \times {\overset{&OverBar;}{W}}_{l, i - 1, N_{GOP}}}{8} & i &NotEqual; 1, j = 1, l = l_{i - 1, N_{GOP}} \\ {\overset{&OverBar;}{W}}_{l, i - 1, N_{GOP}} & i &NotEqual; 1, j = 1, l &NotEqual; l_{i - 1, N_{GOP}} \\ \frac{{QP}_{i, j - 1} \times b_{i, j - 1}}{8} + \frac{7 \times {\overset{&OverBar;}{W}}_{l, j, j - 1}}{8} & j &NotEqual; 1, l = l_{i, j - 1} \\ {\overset{&OverBar;}{W}}_{l, i, j - 1} & j &NotEqual; 1, l &NotEqual; i, j - 1 \end{matrix},

的值根据下式计算：

\begin{matrix} {\overset{&OverBar;}{W}}_{l_{cur}, i, j} = {\overset{&OverBar;}{W}}_{l, i, j} & l = l_{cur}, \end{matrix}

其中，l_i,j-1表示第i个图像组第j-1帧所在的时域层索引，N_GOP表示图像组包含的帧数，表示第i-1个图像组第N_GOP帧所在的时域层索引，l_i,j-1表示第i个图像组第j-1帧所在的时域层，QP_i,j-1表示第i个图像组第j-1帧的量化参数，b_i,j-1表示第i个图像组的第j-1帧的实际编码比特，表示对第i个图像组第N_GOP帧编码时第l时域层的权值，

表示对第i个图像组第j-1帧编码时第l时域层的权值；

7a2)对于低时延配置，通过如下公式计算目标比特

{\hat{T}}_{i, j} = \frac{B_{i, j}}{N_{r, i}},

其中，N_r,i表示第i个图像组中剩余的帧数，B_i,j表示第i个图像组的剩余比特；

（7b）计算基于缓冲区的目标比特：

其中f表示帧率，R_i,j表示对第i个图像组第j帧编码时的带宽，V_i,j表示对第i个图像组第j帧编码时的缓冲区占用值，γ是常数，取值为0.25，S_i,j表示目标缓冲区；

所述S_i,j根据时域结构配置计算：

对于随机接入配置：

S_{i, j} = \{\begin{matrix} V_{i, j} & j = q \\ S_{i, j - 1} - \frac{S_{i, q}}{N_{ref} - q} + (\frac{{\overset{&OverBar;}{W}}_{l_{cur}, i, j} \times N_{GOP}}{Σ_{l = 1}^{m} {\overset{&OverBar;}{W}}_{l, i, j} \times N_{l, i}} - 1) \times \frac{R_{i, j}}{f} & j = q + 1, . . ., N_{GOP} \end{matrix},

对于低时延配置：

S_{i, j} = \{\begin{matrix} V_{i, j} & j = p \\ S_{i, j - 1} - \frac{S_{i, p}}{N_{ref} - p} & j = p + 1, . . ., N_{GOP} \end{matrix},

其中，V_i,j表示缓冲区占用值，S_i,j-1表示第i个图像组第j帧的目标缓冲区，N_l,i表示第i个图像组第l层的帧数，R_i,j表示对第i个图像组第j帧编码时的带宽，f表示帧率，

表示对第i个图像组第j帧编码时第l_curr时域层的权值，l_curr表示第i个图像组第j帧的时域层，

表示对第i个图像组第j帧编码时第l时域层的权值，N_GOP表示图像组的帧数，N_ref表示第i个图像组中参考帧个数，m表示时域层数，取值为4，S_i,q表示第i个图像组第q帧的目标缓冲区，S_i,p表示第i个图像组第p帧的目标缓冲区，

p = \{\begin{matrix} 2 & i = 2 \\ 1 & i &NotEqual; 2 \end{matrix};

（7c）计算第i个图像组中第j帧的目标比特：

其中β是常数，取值为0.9，

表示基于图像组剩余比特的目标比特，

表示基于缓冲区的目标比特，U_i,j表示第i个图像组第j帧的目标比特的上界，

其中f表示帧率，R_i,j表示第i个图像组第j帧编码时的带宽，V_i,j表示对第i个图像组第j帧编码时缓冲区占用值，U_i,j-1表示第i个图像组第j-1帧的目标比特的上界；L_i,j表示目标比特的下界，根据时域结构配置分两种情况计算：

对于随机接入配置，

对于低时延配置，

其中f表示帧率，R_i,j表示第i个图像组第j帧编码时的带宽，V_i,j表示对第i个图像组第j帧编码时缓冲区占用值，N_GOP表示图像组的帧数，

表示第i-1帧第N_GOP帧的调整比特，L_i,j-1表示第i个图像组第j-1帧的目标比特的下界。

步骤八：令第i个图像组第j帧的剩余编码树单元的目标比特T_r,i,j＝T_i,j，进行编码树单元层码率控制。

（8a）设第k个编码树单元k=1，将第i个图像组第j帧的第k个编码树单元的量化参数QP_i,j,k设为上一个参考帧的所有编码树单元的量化参数的平均值，并对其进行编码，得到第k个编码树单元的实际编码比特b_i,j,k；

（8b）令T_r,i,j＝T_r,i,j-b_i,j,k，k=k+1；如果T_r,i,j≤0，则令第i个图像组第j帧的第k个编码树单元的量化参数QP_i,j,k等于上一个参考帧的所有编码树单元的量化参数的平均值加2，执行步骤（8d）；否则，执行步骤（8c）；

（8c）计算第i个图像组第j帧的第k个编码树单元的量化参数QP_i,j,k：

（8c1）用g表示未编码的编码树单元的索引，g的取值范围是k≤g≤N_CTU，对于此范围内的每一个g，根据平均绝对差值预测公式MAD_pred,g＝c_1,l×MAD_ac,g+c_2,l，得到第i个图像组第j帧第g个编码树单元的预测平均绝对差值MAD_pred,g；

其中c_1,l是第l时域层的平均绝对差值预测模型的一次系数，c_2,l是第l时域层的平均绝对差值预测模型的常系数，MAD_ac,g表示第l时域层上一帧的第i个图像组第j帧第g个编码树单元的实际平均绝对差值，N_CTU表示一帧中包含的编码树单元的总个数；

（8c2）根据失真-量化参数模型D_l＝ρ_l×QS和码率-量化参数模型

采用拉格朗日方法，通过使剩余编码树单元的失真的倒数和最大化，得到第k个编码树单元的量化步长QS_i,j,k的计算公式：

{QS}_{i, j, k} = - \frac{a_{1, l_{i, j}, k}}{{2 a}_{2, l_{i, j}, k}} + \frac{1}{{MAD}_{pred, k} \times W_{k} \times H_{k}} \times \sqrt{\frac{T_{r, i, j} + \frac{a_{1, l_{i, j}, k}^{2}}{{4 a}_{2, l_{i, j}, k}} (Σ_{g = k}^{N_{CTU}} {MAD}_{pred, g} W_{g} H_{g})}{a_{2, l_{i, j}, k} Σ_{g = k}^{N_{CTU}} {({MAD}_{pred, g} W_{g} H_{g})}^{- 1}}},

其中，l表示时域层，D_l表示处于第l时域层的编码树单元的失真，ρ_l是第l层的失真-量化参数模型的参数，QS表示量化步长，T_sum,l是第l层的编码树单元编码比特，包括纹理比特和非纹理比特，W和H分别表示编码树单元的宽度和高度，a_1,l是第l时域层的码率-量化参数模型的一次系数，a_2,l是第l时域层的码率-量化参数模型的二次系数，MAD_pred,l是第l层编码树单元的预测平均绝对差值，l_i，j表示第i个图像组第j帧所在的时域层，

表示对第k个编码树单元编码时第l_i，j时域层的码率-量化参数模型一次系数，

表示对第k个编码树单元编码时第l_i，j时域层的码率-量化参数模型的二次系数，W_k和H_k表示第k个编码树单元的实际宽度和高度，W_g和H_g第g个编码树单元的实际宽度和高度，T_r,i,j表示第i个图像组第j帧的剩余比特，N_CTU表示一帧中的编码树单元个数，MAD_pred,k表示第k个编码树单元的预测平均绝对差值，MAD_pred,g表示第g个编码树单元的预测平均绝对差值；

（8c3）根据量化步长QS_i,j,k与量化参数的对应关系，得到第i个图像组第j帧的第k个编码树单元的量化参数QP_i,j,k；

（8d）用第i个图像组第j帧的第k个编码树单元的量化参数QP_i,j,k对第i个图像组第j帧的第k个编码树单元进行编码，得到第i个图像组第j帧的第k个编码树单元的实际编码比特b_i,j,k；

（8e）比较k与一帧所包含的编码树单元个数N_CTU的大小，如果k＜N_CTU,则返回步骤（8b）；如果k≥N_CTU，则编码树单元层码率控制结束，执行步骤九。

步骤九：判断第i个图像组的第j帧是否是第i个图像组的最后一帧，如果是第i个图像组的第j帧是第i个图像组的最后一帧，则返回步骤三；否则返回步骤五。

上述步骤描述了本发明的优选实例，显然本领域的研究人员可参考本发明的优选实例和附图对本发明做出各种修改和替换，这些修改和替换都应落入本发明的保护范围之内。

本发明的效果可通过以下实验进一步说明：

1)实验条件

实验平台为HEVC参考软件HM-8.0rc2。

测试序列是JCTVC会议提案JCTVC-I1100中所规定的测试序列，根据视频分辨率，视频序列分别分为A类，B类，C类，D类和E类，其中B类根据帧率又分为B1和B2类。

目标码率为JCTVC会议提案JCTVC-A204所规定的目标码率，其中A类的目标码率是3500kbps,5000kbps,8000kbps,和14000kbps,；B1类的目标码率是1600kbps,2500kbps,4000kbps,和6000kbps；B2类的目标码率是3000kbps,4500kbps,7000kbps,和10000kbps；C类的目标码率是512kbps,768kbps,1200kbps和2000kbps；D类和E类的目标码率是384kbps,512kbps,850kbps和1500kbps。

初始量化参数根据JCTVC会议提案JCTVC-J0262中的方法得到，JCTVC-H0213和本发明使用相同的初始量化参数。

2)实验内容与结果

实验1，根据实验条件，对测试序列分别采用本发明和JCTVC-H0213中的码率控制方法进行编码，分别得到重建视频的峰值信噪比和码率。根据该峰值信噪比和码率得到率失真曲线对比图，如图2所示，其中图2(a)是视频序列“Traffic”在随机接入配置下的率失真曲线对比图，图2(b)是视频序列“BQMall”在随机接入配置下的率失真曲线对比图，图2(c)是视频序列“BQTerrace”在强制性低时延配置下的率失真曲线对比图，图2(d)是视频序列“Johnny”在强制性低时延配置下的率失真曲线对比图，图2(e)是视频序列“Cactus”在非强制性低时延配置下的率失真曲线对比图，2(f)是视频序列“KristenAndSara”在非强制性低时延配置下的率失真曲线对比图。

实验1得到的视频序列“PartyScene”的重建视频的峰值信噪比和视频序列“Kimono”的重建视频的峰值信噪比如图3所示，其中图3(a)是视频序列“PartyScene”在随机接入配置下，目标码率为768kbps得到的PSNR曲线对比图，图3(b)是视频序列“Kimono”在非强制性低时延配置下，目标码率为1600kbps得到的PSNR曲线对比图。

为了评估峰值信噪比PSNR和码率的性能，定义峰值信噪比的提高值ΔPSNR和码率变化的百分比ΔR为：

ΔPSNR＝PSNR_t-PSNR_b

ΔR = \frac{| R_{t} - R_{b} |}{R_{b}} \times 100 %

其中PSNR_t和R_t分别表示使用本发明的码率控制方法进行编码得到的峰值信噪比和码率，PSNR_b和R_b分别表示使用JCTVC-H0213中的码率控制方法进行编码得到的峰值信噪比和码率。

根据实验1得到重建视频的峰值信噪比和码率计算得到相应的ΔPSNR和ΔR，并进行统计，结果如表1所示，其中“—”表示JCTVC-I1100中规定不需要进行测试的情况。

表1 本发明与JCTVC-H0213的实验结果比较

从表1中的结果可以看出，与JCTVC-H0213相比，在码率接近的情况下，对于所有的序列，本发明都获得了更高的PSNR。其中随机接入配置的平均ΔPSNR比两种低时延配置的都要大，这是因为本发明考虑了随机接入配置的不同时域层的特性。在随机接入配置，强制性低时延配置和非强制低性时延配置下，本发明将重建视频的平均PSNR分别提高了2.055dB,1.511dB和1.433dB。

从图2中可以看出，本发明和JCTVC-H0213的码率都与目标码率接近，但是本发明在六个视频的各个目标码率上都可以获得更高的PSNR值。其中，序列“Traffic”在目标码率3500kbps时，本发明能够将重建视频的PSNR从34.57dB提高到37.12dB，提高了2.55dB。

从图3可以看出，本发明获得了更平滑的PSNR性能。

Claims

1.一种基于率失真优化的HEVC码率控制方法，包括如下步骤：

（1）读取编码器配置文件，设置编码参数：

（3）读入一个图像组GOP，令i=i+1，j=0；

5a）对于随机接入配置：

若i=1，j=1或者i=2，j=1或者i=2，j=2或者i=2，j=3，则不需要编码树单元CTU层码率控制，即把第i个图像组第j帧的所有编码树单元CTU的量化参数设为配置中的初始量化参数Q_in，对该j帧的所有编码树单元CTU进行编码后，执行步骤（8）；

5b）对于低时延配置：

（6）计算第i个图像组的第j帧的目标比特T_i,j；

（7c）根据平均绝对差值预测模型，用同一时域层的前一帧的相应位置的编码树单元的实际平均绝对差值预测第i个图像组第j帧每一个剩余的的编码树单元的平均绝对差值，根据码率-量化参数模型和失真-量化参数模型，采用拉格朗日方法，通过使剩余编码树单元的失真的倒数和最大化，来计算第k个编码树单元的量化步长QS_i,j,k，根据量化步长与量化参数的对应关系得到第i个图像组第j帧的第k个编码树单元的量化参数QP_i,j,k；

2.根据权利要求1所述的基于率失真优化的HEVC码率控制方法，其中步骤（4）所述的计算编码器的输出缓冲区占用值V_i,j和图像组剩余比特B_i,j，按以下不同配置计算：

对于随机接入配置：

V_{i, j} = \{\begin{matrix} 0 & i = 1, j = 1 \\ V_{i - 1, N_{GOP}} + b_{i - 1, N_{GOP}} - \frac{R_{i - 1, N_{GOP}}}{f} & i &NotEqual; 1, j = 1 \\ V_{i, j - 1} + b_{i, j - 1} - \frac{R_{i, j - 1}}{f} & j = 2,3, . . ., N_{GOP} \end{matrix},

B_{i, j} = \{\begin{matrix} \frac{\frac{R_{i, j}}{f} \times N_{II} - V_{i, j}}{N_{II}} \times N_{GOP} & j = 1 \\ B_{i, j - 1} + \frac{R_{i, j} - R_{i, j - 1}}{f} \times (N_{GOP} - j + 1) - b_{i, j - 1} & j = 2,3, . . ., N_{GOP} \end{matrix},

表示对第i个图像组第N_GOP帧编码时的缓冲区占用值，V_i,j-1表示对第i个图像组第j-1帧编码时的缓冲区占用值，b_i,j-1表示第i个图像组第j-1帧的实际编码比特，N_II表示两个帧内编码帧之间的帧数；

对于低时延配置，

V_{i, j} = \{\begin{matrix} 0 & i = 2, j = 1 \\ V_{i - 1, N_{GOP}} + b_{i - 1, N_{GOP}} - \frac{R_{i - 1, N_{GOP}}}{f} - A_{i - 1, N_{GOP}} & i &NotEqual; 2, j = 1 \\ V_{i, j - 1} + b_{i, j - 1} - \frac{R_{i, j - 1}}{f} - A_{i, j - 1} & j = 2,3, . . ., N_{GOP} \end{matrix},

B_{i, j} = \{\begin{matrix} \frac{R_{i, j}}{f} \times N_{GOP} - V_{i, j} & j = 1 \\ B_{i, j - 1} + \frac{R_{i, j} - R_{i, j - 1}}{f} \times (N_{GOP} - j + 1) - b_{i, j - 1} & j = 2,3, . . ., N_{GOP} \end{matrix},

其中f表示帧率，

表示对第i个图像组第N_GOP帧编码时的调整比特，A_i,j-1表示第i个图像组第j-1帧编码时的调整比特。

3.根据权利要求2所述的基于率失真优化的HEVC码率控制方法，其中所述的第i个图像组第N_GOP帧编码时的调整比特和第i个图像组第j-1帧编码时的调整比特A_i,j-1，按下式计算：

式中，η是常数，取值为0.2，第i个图像组第j帧的占用比特

第i个图像第j帧的补偿比特

I_{i, j} = \{\begin{matrix} b_{i, j} - \frac{R_{i, j}}{f} & i = 1, j = 1 \\ I_{i - 1, N_{GOP}} + A_{i - 1, N_{GOP}} & i &NotEqual; 1, j = 1 \\ I_{i, j - 1} + A_{i, j - 1} & i &NotEqual; 1, j &NotEqual; 1 \end{matrix},

其中f表示帧率，R_i,j表示第i个图像组第j帧编码时的带宽，N_GOP表示图像组的帧数，

表示第i-1个图像组第N_GOP帧编码时的调整比特

A_i,j-1表示第i个图像组第j-1帧编码时的调整比特。

4.根据权利要求1所述的基于率失真优化的HEVC码率控制方法，其中

步骤（6）所述的计算第i个图像组第j帧的目标比特T_i,j，按如下步骤进行：

（6a）根据时域配置计算基于图像组剩余比特的目标比特

（6a1）对于随机接入配置：

表示对第i个图像组第j帧编码时第l_curr时域层的权值，

表示对第i个图像组第j帧编码时第l时域层的权值，

的值根据下式计算：

{\overset{&OverBar;}{W}}_{l, i, j} = \{\begin{matrix} 0 & i = 1, j = 1 \\ \frac{{QP}_{i - 1, N_{GOP}} \times b_{i - 1, N_{GOP}}}{8} + \frac{7 \times {\overset{&OverBar;}{W}}_{l, i - 1, N_{GOP}}}{8} & i &NotEqual; 1, j = 1, l = l_{i - 1, N_{GOP}} \\ {\overset{&OverBar;}{W}}_{l, i - 1, N_{GOP}} & i &NotEqual; 1, j = 1, l &NotEqual; l_{i - 1, N_{GOP}} \\ \frac{{QP}_{i, j - 1} \times b_{i, j - 1}}{8} + \frac{7 \times {\overset{&OverBar;}{W}}_{l, j, j - 1}}{8} & j &NotEqual; 1, l = l_{i, j - 1} \\ {\overset{&OverBar;}{W}}_{l, i, j - 1} & j &NotEqual; 1, l &NotEqual; i, j - 1 \end{matrix},

的值根据下式计算：

\begin{matrix} {\overset{&OverBar;}{W}}_{l_{cur,} i, j} = {\overset{&OverBar;}{W}}_{l, i, j} & l = l_{cur}, \end{matrix}

其中，l_i,j-1表示第i个图像组第j-1帧所在的时域层，N_GOP表示图像组包含的帧数，

表示第i-1个图像组第N_GOP帧所在的时域层，l_i,j-1表示第i个图像组第j-1帧所在的时域层，QP_i,j-1表示第i个图像组第j-1帧的量化参数，b_i,j-1表示第i个图像组的第j帧的实际编码比特，

表示对第i个图像组第N_GOP帧编码时第l时域层的权值，

表示对第i个图像组第j-1帧编码时第l时域层的权值；

（6a2）对于低时延配置：

（6b）计算基于缓冲区的目标比特：

其中f表示帧率，R_i,j表示对第i个图像组第j帧编码时的带宽，V_i,j表示对第i个图像组第j帧编码时的缓冲区占用值，γ是常数，取值为0.25，S_i,j表示目标缓冲区，根据时域结构配置计算：

对于随机接入配置：

S_{i, j} = \{\begin{matrix} V_{i, j} & j = q \\ S_{i, j - 1} - \frac{S_{i, q}}{N_{ref} - q} + (\frac{{\overset{&OverBar;}{W}}_{l_{cur}, i, j} \times N_{GOP}}{Σ_{l = 1}^{m} {\overset{&OverBar;}{W}}_{l, i, j} \times N_{l, i}} - 1) \times \frac{R_{i, j}}{f} & j = q + 1, . . ., N_{GOP} \end{matrix},

对于低时延配置：

S_{i, j} = \{\begin{matrix} V_{i, j} & j = p \\ S_{i, j - 1} - \frac{S_{i, p}}{N_{ref} - p} & j = p + 1, . . ., N_{GOP} \end{matrix},

表示对第i个图像组第j帧编码时第l时域层的权值，N_GOP表示图像组的帧数，N_ref表示第i个图像组中参考帧个数，m表示时域层数，取值为4，S_i,q表示第i个图像组第q帧的目标缓冲区，

S_i,p表示第i个图像组第p帧的目标缓冲区，

p = \{\begin{matrix} 2 & i = 2 \\ 1 & i &NotEqual; 2 \end{matrix};

（6c）计算第i个图像组中第j帧的目标比特：

其中β是常数，取值为0.9，

表示基于图像组剩余比特的目标比特，

对于随机接入配置，

对于低时延配置，

5.根据权利要求1所述的基于率失真优化的HEVC码率控制方法，其中所述步骤（7c）的平均绝对差值预测模型，表示如下：

MAD_pred,l＝c_1,l×MAD_actu,l+c_2,l

其中c_1,l和c_2,l是第l时域层的平均绝对差值预测模型参数，MAD_actu,l表示第l时域层上一帧的编码树单元的实际平均绝对差值。

6.根据权利要求1所述的基于率失真优化的HEVC码率控制方法，其中所述步骤（7c）的码率-量化参数模型，表示如下：

\frac{T_{sum, l}}{W \times H \times {MAD}_{pred, l}} = \frac{a_{1, l}}{QS} + \frac{a_{2, l}}{{QS}^{2}}

其中l表示时域层，T_sum,l是第l层的编码树单元编码比特，包括纹理比特和非纹理比特，W和H分别表示编码树单元的宽度和高度，a_1,l是第l时域层模型的一次系数，a_2,l是第l时域层模型的二次系数，QS表示量化步长，MAD_pred,l是第l层编码树单元的平均绝对差值的预测值。

7.根据权利要求1所述的基于率失真优化的HEVC码率控制方法，其中所述步骤（7c）的失真-量化参数模型，表示如下：

D_l＝ρ_l×QS

其中l表示时域层，D_l表示处于第l时域层的编码树单元的失真，ρ_l是第l层的模型参数，QS表示量化步长。

8.根据权利要求1所述的基于率失真优化的HEVC码率控制方法，其中步骤（7c）所述的计算第k个编码树单元的量化步长QS_i,j,k，其计算公式如下：

{QS}_{i, j, k} = - \frac{a_{1, l_{i, j}, k}}{{2 a}_{2, l_{i, j}, k}} + \frac{1}{{MAD}_{pred, k} \times W_{k} \times H_{k}} \times \sqrt{\frac{T_{r, i, j} + \frac{a_{1, l_{i, j}, k}^{2}}{{4 a}_{2, l_{i, j}, k}} (Σ_{g = k}^{N_{CTU}} {MAD}_{pred, g} W_{g} H_{g})}{a_{2, l_{i, j}, k} Σ_{g = k}^{N_{CTU}} {({MAD}_{pred, g} W_{g} H_{g})}^{- 1}}}

其中l_i，j表示第i个图像组第j帧所在的时域层，

表示对第k个编码树单元编码时第l_i，j时域层的码率-量化参数模型的一次系数，

表示对第k个编码树单元编码时第l_i，j时域层的码率-量化参数模型的二次系数，W_k和H_k表示第k个编码树单元的实际宽度和高度，W_g和H_g表示第g个编码树单元的实际宽度和高度，T_r,i,j表示第i个图像组第j帧的剩余比特，N_CTU表示一帧中的编码树单元个数MAD_pred,k表示第k个编码树单元的预测平均绝对差值，MAD_pred,g表示第g个编码树单元的预测平均绝对差值。