CN103200404A

CN103200404A - 基于宏块运动活跃度的编码模式快速预测方法

Info

Publication number: CN103200404A
Application number: CN2013101162210A
Authority: CN
Inventors: 沈燕
Original assignee: CHENGDU BOSHENG INFORMATION TECHNOLOGY Co Ltd
Current assignee: CHENGDU BOSHENG INFORMATION TECHNOLOGY Co Ltd
Priority date: 2013-04-07
Filing date: 2013-04-07
Publication date: 2013-07-10

Abstract

本发明涉及视频编码领域中的编码模式的选取，其公开了一种基于宏块运动活跃度的编码模式快速预测方法，解决传统技术中在选取最佳编码模式时会增加计算复杂度的问题，该预测方法，包括：对H.264标准定义下的各个可选用的编码模式按照宏块运动活跃度进行分类；首先，计算当前宏块在跳过模式下的RD代价，然后，将计算出的RD代价与预设的阈值进行比较，确定最佳编码模式所属类别，最后，在该类别中选取最佳编码模式。本发明根据宏块的运动活跃度对编码模式进行分类，对处理过程分级处理，避免了可能落选的编码模式的预测计算，同时加强了对跳过模式的预判断，优化了处理流程，显著降低了运算处理时间，有利于编码效果的提高，适用于视频图像快速编码。

Description

基于宏块运动活跃度的编码模式快速预测方法

技术领域

本发明涉及视频编码领域中的编码模式的选取，具体的说，是涉及一种基于宏块运动活跃度的编码模式快速预测方法。

背景技术

H.264/AVC作为ITU和MPEG联合开发的最新视频标准，比传统的视频标准在编码效率上获得了很大的提高。H.264压缩效率的提升很大程度上取决于拥有众多可以选用的编码模式。根据ITU-H.264标准的定义，可以选用的编码模式包括跳过(SKIP)模式，16x16模式，16x8模块，8x16模式，8x8模式，8x4模式，4x8模式，4x4模式，I4MB模式，I16MB模式；为了充分利用各种模式的优点，选出最佳编码模式，在传统技术中，H.264使用率失真优化技术RDO，通过计算所有上述模式下的率失真优化代价，比较后选取最佳编码模式。如此，选取的编码模式比较准确，能够实现编码的最优化处理，然而却极大的增加了计算复杂度。

发明内容

本发明所要解决的技术问题是：提出一种基于宏块运动活跃度的编码模式快速预测方法，解决传统技术中在选取最佳编码模式时会增加计算复杂度的问题。

本发明解决上述技术问题所采用的技术方案是：

基于宏块运动活跃度的编码模式快速预测方法，包括：对H.264标准定义下的各个可选用的编码模式按照宏块运动活跃度进行分类；首先，计算当前宏块在跳过模式下的RD代价，然后，将计算出的RD代价与预设的阈值进行比较，确定最佳编码模式所属类别，最后，在该类别中选取最佳编码模式。

进一步，所述在该类别中选取最佳编码模式的方法为：计算当前宏块在该类别中的各个编码模式下的RD代价，选择最小的RD代价对应的编码模式作为最佳编码模式。

进一步，将各个可选用的编码模式按照宏块运动活跃度分为5类，分别为：无运动类、低速运动类、中速运动类、高速运动类、包含密集的信息或场景切换类。

进一步，所述无运动类中的编码模式为跳过模式；所述低速运动类中的编码模式为跳过模式及16x16模式；所述中速运动类中的编码模式为16x8模块及8x16模式；所述高速运动类中的编码模式为8x8模式、8x4模式、4x8模式及4x4模式；所述包含密集的信息或场景切换类中的编码模式为I4MB模式及I16MB模式。

进一步，所述预设的阈值有两个，分别为最小阈值T_low及最大阈值T_high。

进一步，所述将计算出的RD代价与预设的阈值进行比较，确定最佳编码模式所属类别的方法是：

如果计算出的RD代价＜最小阈值T_low，则最佳编码模式属于无运动类；

如果计算出的RD代价＞最大阈值T_high，则最佳编码模式属于包含密集的信息或场景切换类；

如果T_iow≤计算出的RD代价≤T_high，则最佳编码模式属于低速运动类或中速运动类或高速运动类，此时确定最佳编码模式具体所属类别的方法如下：

若当前宏块为可在支持区域中确定运动矢量组的非特殊宏块，则通过计算运动矢量组中的每个运动矢量的区域块长度，找出最大区域块长度L并与预设的最小区域块长度门限值L1和最大区域块长度门限值L2比较；如果L≤L1,则最佳编码模式属于低速运动类；如果L1＜L≤L2，则最佳编码模式属于中速运动类；如果L2＜L,则最佳编码模式属于高速运动类；

若当前宏块为不可在支持区域中确定运动矢量组的特殊宏块，则进行如下处理：如果当前宏块为图像帧第一行且第一列的宏块A，则通过计算当前宏块在低速运动类、中速运动类、高速运动类中的各个编码模式下的RD代价，选取最小的RD代价对应的编码模式为最佳编码模式；如果当前宏块为位于第一行的除A外的其它宏块，则通过相邻左边宏块的运动矢量得到最大区域块长度L；如果当前宏块为位于第一列的除A外的其它宏块，则通过相邻上边宏块中的运动矢量得到最大区域块长度L；如果当前宏块为最后列中的宏块，则通过相邻左边宏块中的运动矢量得到最大区域块长度L；在找出最大区域块长度L后与预设的最小区域块长度门限值L1和最大区域块长度门限值L2比较；如果L≤L1,则最佳编码模式属于低速运动类；如果L1＜L≤L2，则最佳编码模式属于中速运动类；如果L2＜L,则最佳编码模式属于高速运动类。

进一步，所述最小阈值T_low=34e^0.1759×QP,最大阈值T_high=24215e^0.0675×QP,其中QP为在23至40区间的量化参数。

进一步，所述最小区域块长度门限值L1=1,最大区域块长度门限值L2=2。

本发明的有益效果是：根据宏块的运动活跃度对编码模式进行分类，对处理过程分级处理，避免了可能落选的编码模式的预测计算，同时加强了对跳过模式的预判断，优化了处理流程，显著降低了运算处理时间，有利于编码效果的提高。

附图说明

图1为本发明的基于宏块运动活跃度的编码模式快速预测方法的实施例流程图；

图2为当前宏块的支持区域ROS示意图。

具体实施方式

下面结合附图及实施例对本发明的技术方案作进一步的描述。

为解决传统技术中在选取最佳编码模式时会增加计算复杂度的问题，本发明提出一种基于宏块运动活跃度的编码模式快速预测方法，该方法根据宏块的运动活跃度对编码模式进行分类，对处理过程分级处理，避免了可能落选的编码模式的预测计算，同时加强了对跳过模式的预判断，优化了处理流程，显著降低了运算处理时间，有利于编码效果的提高。

对于本发明中涉及的术语解释如下：“支持区域”是本申请引入的一种大小可变的参考窗口技术，这个区域的大小根据当前宏块的运动种类和周围运动矢量的大小来判定大小。

实施例：

本例在具体实现上，首先需要按照宏块的运动活跃度的不同划分编码模式，这些编码模式均是来自于ITU-H.264标准，其划分方式如下表一所示：

表一：编码模式划分表

类别	运动活跃度	涉及到的模式
			1	无运动	跳过（SKIP）
2	低速运动（或单一性运动）	跳过（SKIP）、16x16
			3	中等速运动	16x8、8x16
4	高速运动	8x8、8x4、4x8、4x4
			5	包含密集的信息或者场景切换	I4MB、I16MB

上述划分方式的理论依据是：如果当前的宏块在SKIP模式下的RD代价足够小（小于T_low），那么当前的宏块很可能是没有发生运动的图像，而如果在SKIP模式下的RD代价非常大（大于T_high），这通常意味着该宏块中包含密集的信息、快速运动或场景切换；这里所说的T_low、T_high是我们分别为区分宏块运动活跃度而预设的最小阈值和最大阈值；而由于不同大小的量化参数将影响图像细节的展现程度，所以这两个阈值均和量化参数有关，在H.264中量化参数的范围是0-51的正整数，为保证图像的质量，本发明只针对23-40区间的量化参数；

我们采用的可信度为90%，即当选定T_low时，有90%的宏块满足无运动类下的SKIP模式为最佳编码模式，当选定T_high时，有90%的宏块满足第5类（包含密集的信息或场景切换类）中的I4MB或I16MB为最佳编码模式；

由上面的依据可以得出最小阈值T_low及最大阈值T_high的计算公式为：

T_low=34e^0.1759×QP (1)

T_high=24215e^0..0675×QP (2)

其中QP为在23至40区间的量化参数。

参见图1，本例中的预测方法采用以下手段实现：

1、判断当前宏块是否为帧内帧，如果是，则直接计算当前宏块在第5类（包含密集的信息或场景切换类）中的I4MB模式下的RD代价、在I16MB模式下的RD代价，然后选用RD代价最小的对应的模式作为最佳编码模式；如果当前宏块不是帧内帧，则进入步骤2；

2、计算当前宏块在跳过模式下的RD代价：RDcost(SKIP),并与最小阈值T_low及最大阈值T_high进行比较；

3、如果RDcost(SKIP)＜最小阈值T_low，则最佳编码模式属于1类（无运动类），由于1类中只有跳过模式，因此就选取跳过模式作为最佳编码模式；

如果RDcost(SKIP)＞最大阈值T_high，则最佳编码模式属于5类（包含密集的信息或场景切换类），由于5类中包含I4MB或I16MB两种模式，因此还需要分别计算当前宏块在这两种模式下的RD代价，然后选取RD代价最小的对应的编码模式为最佳编码模式；

如果T_low≤RDcost(SKIP)≤T_high，则最佳编码模式属于2类（低速运动类）或3类（中速运动类）或4类（高速运动类）；要具体区分最佳编码模式属于哪一类，还需要进行如下处理：

对于非特殊宏块（本发明中所述的特殊宏块为处于图像帧第一行、或第一列或最后列的宏块）的处理：首先在支持区域ROS内（该支持区域ROS的示意图参见图2）确定当前宏块MB0的运动矢量组{mv₁,mv₂,mv₃,mv₄}，其中mv_i=(x_i,y_i)，然后计算每个运动矢量的区域块长度，公式为：l(mv_i)=|x_i|+|y_i|,i=1，2，3，4；（3）

之后，从运动矢量组中找出最大区域块长度L,公式为：

L＝max{l(mv₁)，l(mv₂)，l(mm₃)，l(mv₄)} (4]

再将此最大区域块长度L与预设的最小区域块长度门限值L1和最大区域块长度门限值L2进行比较，从而确定最佳编码模式所属类别，公式为：

对于最小区域块长度门限值L1和最大区域块长度门限值L2的取值，L1可以取1，L2可以取2。

对于特殊宏块的处理：即处于图像帧第一行或第一列或最后列的宏块，这些宏块不能在支持区域中确定运动矢量组，因此我们采用以下处理方式：对于位于第一行且第一列的宏块需要全部计算其在2类、3类、4类中的各个模式下的RD代价，选用RD代价最小的对应的编码模式为最佳编码模式；而对于位于第一行的其它宏块（假设位于第一行且第一列的宏块为A,这里所说的其它宏块即为第一行中除A外的宏块）则通过相邻左边宏块中的那个运动矢量得到最大区域块长度L；对于位于第一列的其它宏块（这里所说的其它宏块即为第一列中除A外的宏块）则通过相邻上边宏块中的那个运动矢量得到最大区域快长度L；对于位于最后列的宏块，则通过相邻左边宏块中的那个运动矢量得到最大区域块长度L；

同样，在得到最大区域块长度L后，与预设的最小区域块长度门限值L1和最大区域块长度门限值L2进行比较，比较公式为上述式（5），从而确定最佳编码模式所属类别，在确定最佳编码类别后，分别计算在该类别下的各个编码模式下的RD代价，选用RD代价最小的对应的编码模式为最佳编码模式。

为体现本发明的预测算法的性能，可参见表二中的本发明的预测算法带来的性能效果与传统技术预测算法的性能效果对比，所使用的视频序列为：“Akiyo”、“Salesman”、“Foreman”、“Table Tennis”、“Bus”、“Stefan”。

表二：本发明的预测算法与传统技术相比性能效果对比表

从上述表二中可以看出，与传统技术相比，虽然本发明的预测算法带来了不明显的码率增加、图像质量下降的问题，但却带来运算时间的大幅度缩短的效果，非常有利于编码效率的提升。

本发明要求保护的技术方案包含但不仅限于上述实施例，本领域的技术人员根据上述对本发明的描述容易想到一些等同替换/修改，其皆在属于本发明精神实质下的保护范围之内。

Claims

1.基于宏块运动活跃度的编码模式快速预测方法，其特征在于，包括：对H.264标准定义下的各个可选用的编码模式按照宏块运动活跃度进行分类；首先，计算当前宏块在跳过模式下的RD代价，然后，将计算出的RD代价与预设的阈值进行比较，确定最佳编码模式所属类别，最后，在该类别中选取最佳编码模式。

2.如权利要求1所述的基于宏块运动活跃度的编码模式快速预测方法，其特征在于，所述在该类别中选取最佳编码模式的方法为：计算当前宏块在该类别中的各个编码模式下的RD代价，选择最小的RD代价对应的编码模式作为最佳编码模式。

3.如权利要求1所述的基于宏块运动活跃度的编码模式快速预测方法，其特征在于，将各个可选用的编码模式按照宏块运动活跃度分为5类，分别为：无运动类、低速运动类、中速运动类、高速运动类、包含密集的信息或场景切换类。

4.如权利要求3所述的基于宏块运动活跃度的编码模式快速预测方法，其特征在于，所述无运动类中的编码模式为跳过模式；所述低速运动类中的编码模式为跳过模式及16x16模式；所述中速运动类中的编码模式为16x8模块及8x16模式；所述高速运动类中的编码模式为8x8模式、8x4模式、4x8模式及4x4模式；所述包含密集的信息或场景切换类中的编码模式为I4MB模式及I16MB模式。

5.如权利要求4所述的基于宏块运动活跃度的编码模式快速预测方法，其特征在于，所述预设的阈值有两个，分别为最小阈值T_low及最大阈值T_high。

6.如权利要求5所述的基于宏块运动活跃度的编码模式快速预测方法，其特征在于，所述将计算出的RD代价与预设的阈值进行比较，确定最佳编码模式所属类别的方法是：

如果T_low≤计算出的RD代价≤T_high，则最佳编码模式属于低速运动类或中速运动类或高速运动类，此时确定最佳编码模式具体所属类别的方法如下：

7.如权利要求6所述的基于宏块运动活跃度的编码模式快速预测方法，其特征在于，所述最小阈值T_low34e^0.1759×Qp，最大阈值T_high=24215e^0.0675×QP其中QP为在23至40区间的量化参数。

8.如权利要求6所述的基于宏块运动活跃度的编码模式快速预测方法，其特征在于，所述最小区域块长度门限值L1=1,最大区域块长度门限值L2=2。