CN101466040B

CN101466040B - 一种用于视频编码模式决策的码率估计方法

Info

Publication number: CN101466040B
Application number: CN 200910076304
Authority: CN
Inventors: 高文; 赵欣; 孙俊
Original assignee: Peking University
Current assignee: Peking University
Priority date: 2009-01-09
Filing date: 2009-01-09
Publication date: 2010-12-01
Anticipated expiration: 2029-01-09
Also published as: CN101466040A

Abstract

一种用于视频编码的码率估计方法，包括以下步骤：(1)首先根据当前帧的一般化高斯分布参数以及编码量化参数，对变换系数块的各个系数进行加权；(2)然后将加权后得到的数值进行求和，得到近似的变换系数块的信息比特数；(3)将近似的信息比特数与模型参数α相乘，然后再将相乘的结果与模型参数β相加，即得到估计的码率；(4)利用实际的熵编码结果，动态更新(3)中用到的两个模型参数。本发明可以直接应用于视频编码中模式决策过程的优化，实现低复杂度的模式决策，对整体的视频编码过程进行有效的加速。

Description

一种用于视频编码模式决策的码率估计方法

技术领域

本发明涉及一种视频编码方法，特别涉及一种用于视频编码模式决策的估计熵编码码率的方法。

背景技术

新一代的视频编码标准H.264/AVC在已有的视频编码标准的框架之下，实现了编码效率的大幅度提高，成为今后视频信息压缩格式的主流标准。然而由于增加了更多灵活有效的编码工具和编码模式，H.264/AVC视频编码标准的复杂度相比以往的视频编码标准，也有了显著的提高。因此，在很多对视频编码器速度和性能要求较高的场合，实际的应用对视频编码器的算法优化提出了更高的要求。

在视频编码器中，视频数据首先被划分为若干个16×16大小的块，其中每一个16×16大小的块被称为宏块(Macroblock)，视频编码的过程正是以宏块(Macroblock)为单位进行。在编码器编码一个宏块的过程当中，复杂度最高的两个模块为运动搜索(ME)模块和模式决策(MD)模块。其中模式决策模块的作用是，在很多视频编码器能够提供的待选编码模式当中，选择一种对于当前编码的视频宏块数据而言编码效率最高的模式。然而由于在新一代的国际视频编码标准中(例如H.264/AVC等)，编码器提供了丰富多样的编码模式，使得MD模块的复杂度也随之大幅度上升。因此，对于MD模块的优化成为编码器优化的一项关键技术。

视频编码器的模式决策流程如图1所示。在模式决策模块的处理过程中，编码器通过在每种待选模式下对当前视频宏块进行完整的一次编码，得到对应于该模式的宏块编码码率(R)和失真(D)大小，其中码率R的大小对应于熵编码后比特数的大小，R越小说明压缩率越高，而失真D的大小对应于编码后重建数据和原始数据的差别大小，失真越小说明编码后的视频质量越高。对于具有相同失真D的两种模式，编码器就会选择码率R更小的模式，这是因为在两种模式下失真相同、视频质量相同，而码率R较小则对应于较高的压缩率；而对于具有相同码率R的两种模式，编码器就会选择失真D更小的模式，这是因为在两种模式下码率相同、压缩效率相同，而失真D较小则对应于较好的视频质量。

然而在实际编码过程中，各个待选编码模式所得到的R和D一般情况都是各自不同的，编码器需要对每种模式的R和D进行最佳的权衡，从而得到最佳的编码模式。在H.264/AVC视频编码器中，模式决策模块采用现有的率失真优化技术(RD0)来比较各个待选模式的R和D的权重优劣。如图1所示，RD0技术首先计算每个模式的率失真代价(RD_cost)值，然后选取使RD_cost值最小的模式作为最佳编码模式。RD_cost是R和D的加权和，如下式描述：

RD_cost＝D+λ·R ， (1)

其中，λ是一个由视频编码量化参数所决定的参数。由(1)式可以看出，计算单个模式的RD_cost值的复杂度主要由计算D和R的复杂度所决定。

在H.264/AVC国际标准的参考软件(此参考软件里面给出了H.264/AVC国际标准的视频编码和视频解码的参考实现过程，已在网上已经公开，并且可以下载)中，D和R的值是通过对宏块在当前待选模式下进行一次完整的编码过程来得到。

为了便于说明编码的过程，首先标记宏块数据(16×16大小的像素区域，背景技术部分第二段已经给出了宏块的含义)为16×16大小的矩阵X，完整的编码过程包括：

(1)首先对输入的宏块数据进行预测，预测的过程就是利用其它位置的像素来预测当前的宏块，标记预测的宏块数据为16×16大小的X^*，那么预测的过程就是用X^*近似地表示X，之后再计算X和X^*的差值Y_M＝X-X^*，Y_M称为残差，也就是X经过X^*预测后残留的数据。

(2)对预测得到的Y_M进行变换。变换的过程如下：首先将16×16大小的残差数据Y_M划分为16个4×4的残差块，如图5所示，每个4×4的残差块标记为4×4大小的矩阵Y，然后对每个4×4的块Y计算D_f ^TYD_f，也就是计算三个4×4的矩阵D_f ^T，Y和D_f的乘积，其中

D_{f}^{T} = [\begin{matrix} 1 & 1 & 1 & 1 \\ 2 & 1 & - 1 & - 2 \\ 1 & - 1 & - 1 & 1 \\ 1 & - 2 & 2 & - 1 \end{matrix}],

D_{f} = [\begin{matrix} 1 & 2 & 1 & 1 \\ 1 & 1 & - 1 & - 2 \\ 1 & - 1 & - 1 & 2 \\ 1 & - 2 & 1 & - 1 \end{matrix}],

D_f称为变换核，由H.264/AVC标准规定。最终得到相乘的结果为4×4的矩阵F，即F＝D_f ^TYD_f，矩阵F中的16个元素称为变换系数，F称为变换系数块。

(3)然后对变换后得到的变换系数进行量化。量化的过程如下所述：对变换系数块F中的16个变换系数F_ij分别计算

其中Q是编码过程中指定的参数，

为向下取整操作，如

(4)然后再对量化后的数据进行熵编码，得到码率R。

(5)然后对量化后的数据进行反量化。反量化是量化的逆过程，也就是对量化后的变换系数计算

其中Q×IQ＝1，也就是说变换系数块中的每个系数F_ij经过量化和反量化，会近似变回F_ij，但是由于量化和反量化过程中有取整操作，所以反量化的结果和量化前的结果并不严格相等。

(6)接着对反量化后的数据进行反变换。反变换是变换的逆过程，其具体的操作过程如下所述：对每个经过前面的量化，反量化后得到的4×4的块F’计算D_i ^TF’D_i，也就是三个4×4的矩阵D_i ^T，F’和D_i的乘积，其中

D_{i}^{T} = [\begin{matrix} 1 & 1 & 1 & 1 / 2 \\ 1 & 1 / 2 & - 1 & - 1 \\ 1 & - 1 / 2 & - 1 & 1 \\ 1 & - 1 & 1 & - 1 / 2 \end{matrix}],

D_{i} = [\begin{matrix} 1 & 1 & 1 & 1 \\ 1 & 1 / 2 & - 1 / 2 & - 1 \\ 1 & - 1 & - 1 & 1 \\ 1 / 2 & - 1 & 1 & - 1 / 2 \end{matrix}],

D_i称为变换核，D_i ^T是D_i的转置。最终得到相乘的结果为4×4的矩阵Y’，即Y’＝D^TF’D。矩阵F’中的元素是经过量化，反量化后的变换系数，Y’是最终的反变换结果。

(7)最后对反变换后的数据进行像素重建。像素重建的过程如下所述，将Y’与当步骤(1)中的用于预测的参考数据X^*相加即得到重建后的4×4的像素数据。

对宏块内每个4×4的块进行(2)-(7)的操作之后便得到输出的宏块数据；最后将输入的宏块数据与输出的宏块数据进行比较，从而得到失真D。

由上述H.264/AVC标准所规定的过程可以看出，现有技术中计算R、D的计算复杂度很高。

模式决策的复杂度C_MD主要由待选模式的数量m和计算单个待选模式的RD_cost的复杂度C_MD ⁱ，i＝0，1，...，m-1所决定，并且近似地可以认为有如下的关系：

C_{MD} = Σ_{i = 1}^{m} C_{MD}^{i} . - - - (2)

也就是说，模式决策的复杂度是计算每个待选模式的RD_cost的复杂度之和。为了降低(2)式中的模式决策的复杂度C_MD，现有技术中针对MD模块的优化技术有两类，一类技术的目标是降低m的大小；一类是降低C_MD ⁱ的大小。从(2)式可以看出，这两类方法都可以实现模式决策复杂度C_MD的降低。第一类技术通过设计算法，判断RD_cost很可能为较高值的模式，并且在待选模式中提前排除该模式，从而省去了对该模式计算RD_cost的计算量。第二类技术通过降低计算每个RD_cost的复杂度C_MD ⁱ来降低整体的模式决策复杂度。更具体地来讲，第二类算法的实现是通过对R或D进行低复杂度的估计，从而避免进行图2所示高复杂度的计算过程。

以H.264/AVC标准为例，在实际的熵编码过程中，R和D的计算是以4×4的块为单位的，也就是说，每个16×16大小的宏块被划分为16个4×4的子块来进行熵编码，如图4所示。已有的码率估计技术通过统计一些经验得到的和熵编码码率相关的参量，比如4×4变换系数块中非零系数的个数，变换系数块的绝对值之和等等，并利用这些参量的线性组合对码率进行估计，其中线性组合的系数往往也是通过经验性的实验结果得到，或者通过自适应的进行线性拟合来得到。

如图3所示为实际视频编码过程中两个单独提取出来的4×4的变换系数表示，称为变换系数块，从图3可以看出这两个变换系数块的系数绝对值之和相同，均为20，但通过记录这两个块的实际熵编码结果可以得知，左块的实际熵码率为62比特(通过在视频编码的过程中记录实际熵编码结果得知)，而右块的熵编码码率仅为28比特(通过在视频编码的过程中记录实际熵编码结果得知)，相差有两倍之多。导致这样现象的原因是两个块的系数分布不同，右块的系数相比较左块系数而言，幅度更加集中于低频分量(块的左上角位置附近的分量)。如图4所示为另外一组由实际视频编码过程中两个单独提取出来的4×4的变换系数块，从图4可以看出这两个变换系数块的非零系数的个数相同，均为10，但通过记录这两个块的实际熵编码结果可以得知，左块的实际熵码率为85比特，而右块的熵编码码率仅为27比特，相差有三倍之多。导致这样现象的原因是两个块的系数幅度分布不同，右块的系数相比较左块系数而言，系数的幅度分布明显更高。

已有的码率估计方法通常采用变换系数块中的非零系数的个数，系数的绝对值之和等等参量来估计熵编码码率，但是从前面给出的两个例子可以看出，这些经验得到的参量并不能够可靠地衡量熵编码后的码率大小。这些方法的一个明显的缺陷是对4×4变换系数表示中的16个变换系数的重要性不加区别，认为每个系数对熵编码码率的影响大小都相同，然而事实上通过上面的例子可以看出，这16个系数对熵编码码率的影响往往是各自不同，甚至相差很大的。已有的方法一般基于经验性的实验结果，缺乏验证可靠的模型，并且往往是针对特定的熵编码方法(例如，上下文自适应的可变长编码(Context-based Adaptive Variable Length Coding，CAVLC))而设计，因此在普适性(对不同的熵编码方法都验证适用)和精确度上都不是非常有效。所以，为了更加准确地估计熵编码的码率大小，需要对变换系数块中的每个系数进行加权，以体现不同频率的变换系数对熵编码码率影响程度的不同。

发明内容

针对上述问题，本发明的目的在于提出一种加权形式的码率估计模型，使得码率估计的过程能够体现不同频率的变换系数对熵编码码率影响程度的不同，从而实现更为有效，更具普适性的码率估计。

为实现上述目的，首先对变换量化系数进行一般化高斯分布的概率建模，通过概率建模，推导得出了变换系数的幅度和其信息比特数之间的近似数学关系，根据这个数学关系，提出以下用于视频编码中码率估计的方法流程：

1、利用推导得到的数学关系来对变换量化后的各个系数分别进行加权；

2、对加权后的系数首先取绝对值，然后求和来估计变换系数块的信息比特数；

3、将2中计算得到的信息比特数与一个模型参数α相乘，然后再加上另一个模型参数β得到最终的估计码率；

4、在模式决策的过程中，根据最终得到的实际熵编码码率和对应估计得到的码率动态调整模型参数α和β。

根据本发明，提供一种用于视频编码模式决策的码率估计方法，该方法包括步骤：(1)将视频中的帧数据划分成多个宏块，再将各宏块划分为块；(2)对所述多个块分别进行帧间运动估计或帧内预测；(3)对所述的每个块分别根据步骤(2)中得到的所述帧间运动估计或帧内预测结果，计算所述估计或预测结果与所述块之间差值，得到残差数据块；(4)对所述残差数据块进行变换、量化，得到所述残差数据块的变换系数表示；(5)对所述变换系数表示中的每个分量进行加权计算，并通过计算结果估计熵编码码率大小；(6)记录所述的每个块的实际熵编码码率大小，并记录对应的估计熵编码码率大小。

根据本发明的一个方面，步骤(5)中加权计算的权重和形式由所述变换系数表示中的每个分量的概率分布参数所决定。

根据本发明的一个方面，步骤(5)中进行码率估计时，首先将所述变换系数表示中的每个分量加权后得到的数值进行求和，得到求和值r_B，然后通过精确码率估计模型R_B＝αgr_B+β计算得到估计的码率R_B。

根据本发明的一个方面，利用步骤(6)中记录的所述每个块的实际熵编码码率大小以及所述对应的估计熵编码码率大小，动态更新参数α如β。

根据本发明的一个方面，动态更新的过程是在实际熵编码块的数量积累到一个设定阈值T_threshold时开始，并且在数量积累到一个给定阈值T_update时结束，并重新动态更新参数α和β。

根据本发明的一个方面，所述变换系数表示中的每个分量的概率分布参数在开始编码当前视频帧时初始化，并在结束编码当前帧时重新统计。

根据本发明的一个方面，步骤(5)中还包括步骤：根据估计的熵编码码率大小计算当前待选模式的率失真代价，如果结果小于当前最佳编码模式的率失真代价，那么更新当前最佳编码模式为当前待选模式；如果当前待选模式为最后一个可选的编码模式，那么进行步骤(6)，否则继续步骤(2)。

本发明由于采取以上技术方案，与传统方法相比，可以建立更为准确合理的码率估计模型，该模型可有效地应用于视频编码的模式决策过程和码率控制过程。

附图说明

图1是H.264/AVC视频编码器中的模式决策流程示意图。

图2是计算单个模式的RD_cost流程示意图。

图3是实际编码过程中的两个经过变换和量化的变换系数块，并且系数的绝对值之和相等。

图4是实际编码过程中的两个经过变换和量化的变换系数块，并且非零系数的个数相等。

图5是将单个宏块划分为16个4×4的块的示意图。

图6是采用本发明方法进行视频编码模式决策的流程示意图。

具体实施方式

按照本发明的一个实施方式，根据信息论和熵编码器的设计原理，提出新的码率估计方法。

从熵编码的原理来看，由于低频分量和高频分量的概率分布不同，因此对码率的影响也不一样。而对自然图像而言，由于变换域的能量往往集中在低频，高频分量出现非零值的概率远小于低频分量，那么高频分量对码率的影响总是明显高于低频分量。如果记一个4×4的变换系数块为F，那么它的位于(0，0)位置(左上角位置)的低频分量和位于(3，3)位置的高频分量分别记为F(0，0)和F(3，3)，那么由于F(0，0)和F(3，3)的幅度大小的概率分布不同，F(0，0)＝20的概率往往大于F(3，3)＝20的概率。那么根据信息论的原理和熵编码器的设计原理，F(0，0)＝20所产生的码率将小于F(3，3)＝20所产生的码率。这说明了在4×4的变换系数块中，每个系数取相同值时对码率的贡献度是不同的，因而在利用这16个系数进行码率估计之前，应该首先对这些系数进行加权处理。根据熵编码器的设计原则，实际熵编码得到的码率大小应该和信息比特数的大小密切相关，因此本发明提出通过估计信息比特数的大小来估计实际熵编码得到的码率大小。

为了计算4×4的变换系数块的信息比特数的大小，需要首先对变换系数的分布建立有效的概率模型，在此模型基础之上推导单个变换系数和它的信息比特数之间的对应关系，并利用和码率直接密切相关的信息比特数来作为码率估计的估计量，从而体现不同频率的变换系数对熵编码码率影响程度的不同，实现更为合理有效的加权形式的码率估计。以往对变换系数的概率分布通常采用高斯分布和拉普拉斯分布来描述，然而这两种分布由于控制的参量少，所能够覆盖的分布类型非常有限，对于实际的随机性很强的视频数据而言，采用这两种分布进行描述都不够有效。为了能够更精确地描述变换系数的分布特征，采用更为灵活的一般化高斯分布(Generalized Gaussiandistribution，GGD)来对变换系数进行描述。零均值的一般化高斯分布的概率密度函数(Probability density function，PDF)可以表示为：

f (x) = \frac{ηα (η)}{2 σΓ (1 / η)} \exp {- [α (η) | \frac{x}{σ} |]^{η}}, - - - (3)

其中

Γ (x) = {&Integral;}_{0}^{\infty} t^{x - 1} e^{- t} dt

为伽玛函数，η＞0是形状参数，控制着概率密度函数的形状，σ为均方差，控制着概率密度函数的尺度。GGD是一个范围很广的概率分布，它的控制参数相比较高斯分布和拉普拉斯分布而言更加灵活。当形状参数η＝1时，GGD就是拉普拉斯分布，当形状参数η＝2时，GGD对应于高斯分布，当η＝∞时，GGD则退化为均匀分布。一般化高斯分布已经在很多研究中被有效地应用于对变换系数分布的分析。

对GGD的形状参数η和方差参数σ进行估计的方法有几种，这些方法基本都是建立在下面的数学关系基础之上：

R (η) = \frac{Γ^{2} (2 / η)}{Γ (1 / η) Γ (3 / η)} = \frac{E^{2} {| X |}}{E {X^{2}}} - - - (4 a)

σ²＝E{X²}， (4b)

从而得到η和σ的估计函数：

\hat{η} = R^{- 1} (\frac{{(\frac{1}{N} Σ_{i = 1}^{N} | x_{i} |)}^{2}}{\frac{1}{N} Σ_{i = 1}^{N} X_{i}^{2}}),

\hat{σ} = \sqrt{\frac{1}{N} Σ_{i = 1}^{N} X_{i}^{2}} - - - (5)

由于R^-1(g)没有闭合形式的表达式，几种参数估计的方法主要是采用不同的形式对R^-1(g)进行拟合。近年来，有研究者提出一种采用形式简单的双曲线函数对(5)中的R^-1(g)进行拟合的方法，这个拟合函数的形式如下：

H (x) = \frac{0.2718}{0.7697 - x} - 0.1247 . - - - (6)

在H.264/AVC中，变换系数的量化过程如下表示：

| {\hat{F}}_{uv} | = (| F_{uv} | gQ + fg 2^{qbits}) > > qbits, - - - (7)

其中，F_uv代表4×4的系数块中位于(u，v)的变换系数，|·|代表取绝对值操作，Q为量化器中的相乘因子，fg2^qbits控制着系数的截断，＞＞表示按比特右移操作，等式右边的

代表F_uv量化后的量化值。假设F_uv的概率密度函数为f_uv(x)，并且f_uv(x)的形状参数和均方差参数分别为η_uv和σ_uv，那么结合(7)式中的量化过程，可以计算F_uv被量化为

的概率为：

P {{\hat{F}}_{uv} = \hat{x}} = \{\begin{matrix} 2 {&Integral;}_{0}^{(1 - f) g Q_{step}} & f_{uv} (x) dx, & \hat{x} = 0 \\ {&Integral;}_{(| \hat{x} | - f) g Q_{step}}^{(| \hat{x} | + 1 - f) g Q_{step}} & f_{uv} (x) dx, & \hat{x} &NotEqual; 0 \end{matrix}, - - - (8)

其中

Q_{step} = \frac{2^{qbits}}{Q}

为量化步长。那么根据信息论中对信息量的定义，可以计算F_uv被量化为

的信息量为：

称r_uv为信息比特数。由于f_uv(x)在[0，+∞]的区间内是连续单调递减函数，因此存在x^*满足

{&Integral;}_{(| \hat{x} |) g Q_{step}}^{(| \hat{x} | + 1 - f) g Q_{step}} f_{uv} (x) dx = f_{uv} (x^{*}) g Q_{step}, - - - (10)

并且

事实上，对于形状参数η_uv＞1的f_uv(x)而言，概率密度函数在[0，+∞)的区间内是凸函数，可以进一步得到

也就是说，x^*落于量化区间的前半部分。结合H.264/AVC量化器(4)中f参数的设置原则：

可以得出，

也同样满足落于量化区间的前半部分，因此利用来近似x^*，也就是说：

f (x^{*}) \approx f (\hat{x} g Q_{step}) . - - - (12)

将(12)代入(10)可得：

{&Integral;}_{(| \hat{x} | - f) g Q_{step}}^{(| \hat{x} | + 1 - f) g Q_{step}} f_{uv} (x) dx \approx f_{uv} (\hat{x} g Q_{step}) g Q_{step} - - - (13)

再将(13)代入(8)可得：

结合(14)和(9)可得，当

时有：

其中

a_{uv} = \log_{2} (e) g [α_{uv} (η) \frac{Q_{step}}{σ_{uv}}]^{η},

b_{uv} = - \log_{2} [Q_{step} g \frac{η α_{uv} (η)}{2 σ_{uv} Γ (1 / η)}] .

在

时，r_uv和(15)式的形式类似，但是a_uv和b_uv不同。由此可以得到，对于服从一般化高斯分布的变换系数而言，单个变换系数所对应的信息比特数是和它的取值幅度成指数函数关系的。特别地，当变换系数服从拉普拉斯分布时，也就是η_uv＝1，那么式(15)则变为一个简单的线性函数。由(15)式得到了单个变换系数的幅度和信息比特数之间的数学关系，这个关系对于建立更为准确的码率估计模型是十分有意义的。

由此得到了单个变换系数的信息比特数和它的幅度之间的数学关系，由于变换系数之间可近似看作是独立的，根据信息论的结论，整个4×4的系数块的信息比特数可以近似为16个变换系数的信息比特数之和，也就是

r_{B} = Σ_{i = 0}^{3} Σ_{j = 0}^{3} r_{ij}, - - - (16)

其中r_B是整个4×4的系数块的信息比特数。在(15)和(16)的基础之上，利用信息比特数和熵编码码率的密切相关性提出一种新型的精确码率估计模型：

R_B＝αgr_B+β， (17)

其中α和β为模型的参数，r_B由(16)式计算得到。

参考图6，按照上述提出的码率估计方法，本发明提供一种用于视频编码的模式决策过程的方法如下：

(一)以宏块的形式提供视频数据，将视频中的一帧(称为本帧)划分为宏块，然后将宏块划分为多个块，(图5即为将单个宏块划分为块的示意图)并按照以下步骤循环地对当前帧的每个块进行模式决策；

(二)对当前块采用当前待选模式进行帧间运动估计或者帧内预测，并按照以下步骤循环地对当前块的每个待选模式计算率失真代价；

(三)在模式决策过程中，按照如下方法计算当前待选模式的率失真代价：

a)根据(二)中得到的预测数据，计算预测数据和块数据的差值，得到残差数据块；

b)对残差数据块依次进行视频编码标准中规定的变换、量化过程，得到该残差数据块的变换系数块表示；

c)根据b)中得到的变换系数块表示，按照(15)式对每个变换系数进行加权，然后根据(16)式和(17)式估计变换系数块的熵编码码率大小R_B；

d)根据(1)式和c)中得到的熵编码码率大小R_B计算当前待选模式的率失真代价，如果结果小于当前最佳编码模式的率失真代价，那么更新当前最佳的编码模式为当前待选模式；

e)如果当前待选模式为最后一个可选的编码模式，那么进行步骤(四)，否则继续步骤(二)，对下一个待选模式进行模式决策；

(四)采用选择的最佳编码模式对当前块进行熵编码，并利用实际熵编码得到的码率，动态更新(17)式中的模型参数α和β。更新的过程如下式描述：

α = \frac{n \underset{i}{Σ} R_{i} r_{i} - \underset{i}{Σ} R_{i} \underset{i}{Σ} r_{i}}{n {(\underset{i}{Σ} r_{i})}^{2} - \underset{i}{Σ} r_{i}^{2}}, β = \frac{n {(\underset{i}{Σ} r_{i})}^{2} \underset{i}{Σ} R_{i} - \underset{i}{Σ} R_{i} r_{i} \underset{i}{Σ} r_{i}}{n {(\underset{i}{Σ} r_{i})}^{2} - \underset{i}{Σ} r_{i}^{2}},

其中，n为已经编码的块的个数，R_i为第i个块的熵编码码率，r_i为第i个块的估计码率。更新的过程是在n积累到一个给定阈值T_threshold时开始，并且在n积累到一个给定阈值T_update时对n，R_i，r_i重新进行初始化。

(五)根据步骤(三)中记录得到的变换系数的数据，按照(5)式估计当前帧数据的一般化高斯分布参数，这些参数用在码率估计过程当中。

(六)重复上述步骤，继续下一帧的编码，直到视频最后一帧处理完毕。

按照本发明的一个具体实施方式，本发明所提出的方法可以直接应用在H.264/AVC视频编码的模式决策过程当中。

在H.264/AVC参考软件进行模式决策的过程当中，率失真代价中的码率部分的计算是通过复杂度较高的熵编码来得到，那么为了降低计算码率的复杂度，加快整体的编码速度，本发明方法将高复杂度的熵编码替换为低复杂度的码率估计过程(具体的步骤和上述步骤(一)-步骤(五)相同)，从而大大降低了率失真代价的计算复杂度，同时也降低了整体的编码复杂度。实验结果表明，在H.264/AVC标准参考软件版本JM86的基础之上，本发明方法可以节约整体编码时间的大约23％(对于采用上下文的自适应二进制算术编码，Context-bsaed Adaptive Binary Arithmetic Coding，CABAC)和40％(对于采用上下文自适应的可变长编码，Context-based Adaptive VariableLength Coding，CAVLC)，并且相比较原先的高复杂度的方法而言，编码效率的降低基本可以忽略(峰值信噪比的降低低于0.1dB)。

虽然以上描述了本发明的具体实施方式，但是本领域的技术人员应当理解，这些具体实施方式仅是举例说明，本领域的技术人员在不脱离本发明的原理和实质的情况下，可以对上述方法和系统的细节进行各种省略、替换和改变。例如，合并上述方法步骤，从而按照实质相同的方法执行实质相同的功能以实现实质相同的结果则属于本发明的范围。因此，本发明的范围仅由所附权利要求书限定。

Claims

1.一种用于视频编码模式决策的码率估计方法，其特征在于，该方法包括步骤：

(1)将视频中的帧数据划分成多个宏块，再将各宏块划分为块；

(2)对所述多个块分别进行帧间运动估计或帧内预测；

(3)针对所述多个块中的每个块，分别根据步骤(2)中得到的所述帧间运动估计或帧内预测结果，计算所述估计或预测结果与所述每个块之间差值，得到残差数据块；

(4)对所述残差数据块进行变换、量化，得到所述残差数据块的变换系数表示；

(5)对所述变换系数表示中的每个分量进行加权计算，并通过计算结果估计熵编码码率大小；

(6)记录所述的每个块的实际熵编码码率大小，并记录对应的估计熵编码码率大小。

2.根据权利要求1方法，其特征在于，步骤(5)中加权计算的权重和形式由所述变换系数表示中的每个分量的概率分布参数所决定。

3.根据权利要求2所述的方法，其特征在于，所述变换系数表示中的每个分量的概率分布参数在开始编码当前视频帧时初始化，并在结束编码当前帧时重新统计。

4.根据权利要求1所述的方法，其特征在于，步骤(5)中还包括步骤：

根据估计的熵编码码率大小计算当前待选模式的率失真代价，如果结果小于当前最佳编码模式的率失真代价，那么更新当前最佳编码模式为当前待选模式；

如果当前待选模式为最后一个可选的编码模式，那么进行步骤(6)，否则继续步骤(2)。