CN103200404A - 基于宏块运动活跃度的编码模式快速预测方法 - Google Patents
基于宏块运动活跃度的编码模式快速预测方法 Download PDFInfo
- Publication number
- CN103200404A CN103200404A CN2013101162210A CN201310116221A CN103200404A CN 103200404 A CN103200404 A CN 103200404A CN 2013101162210 A CN2013101162210 A CN 2013101162210A CN 201310116221 A CN201310116221 A CN 201310116221A CN 103200404 A CN103200404 A CN 103200404A
- Authority
- CN
- China
- Prior art keywords
- macro block
- pattern
- class
- liveness
- motion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明涉及视频编码领域中的编码模式的选取,其公开了一种基于宏块运动活跃度的编码模式快速预测方法,解决传统技术中在选取最佳编码模式时会增加计算复杂度的问题,该预测方法,包括:对H.264标准定义下的各个可选用的编码模式按照宏块运动活跃度进行分类;首先,计算当前宏块在跳过模式下的RD代价,然后,将计算出的RD代价与预设的阈值进行比较,确定最佳编码模式所属类别,最后,在该类别中选取最佳编码模式。本发明根据宏块的运动活跃度对编码模式进行分类,对处理过程分级处理,避免了可能落选的编码模式的预测计算,同时加强了对跳过模式的预判断,优化了处理流程,显著降低了运算处理时间,有利于编码效果的提高,适用于视频图像快速编码。
Description
技术领域
本发明涉及视频编码领域中的编码模式的选取,具体的说,是涉及一种基于宏块运动活跃度的编码模式快速预测方法。
背景技术
H.264/AVC作为ITU和MPEG联合开发的最新视频标准,比传统的视频标准在编码效率上获得了很大的提高。H.264压缩效率的提升很大程度上取决于拥有众多可以选用的编码模式。根据ITU-H.264标准的定义,可以选用的编码模式包括跳过(SKIP)模式,16x16模式,16x8模块,8x16模式,8x8模式,8x4模式,4x8模式,4x4模式,I4MB模式,I16MB模式;为了充分利用各种模式的优点,选出最佳编码模式,在传统技术中,H.264使用率失真优化技术RDO,通过计算所有上述模式下的率失真优化代价,比较后选取最佳编码模式。如此,选取的编码模式比较准确,能够实现编码的最优化处理,然而却极大的增加了计算复杂度。
发明内容
本发明所要解决的技术问题是:提出一种基于宏块运动活跃度的编码模式快速预测方法,解决传统技术中在选取最佳编码模式时会增加计算复杂度的问题。
本发明解决上述技术问题所采用的技术方案是:
基于宏块运动活跃度的编码模式快速预测方法,包括:对H.264标准定义下的各个可选用的编码模式按照宏块运动活跃度进行分类;首先,计算当前宏块在跳过模式下的RD代价,然后,将计算出的RD代价与预设的阈值进行比较,确定最佳编码模式所属类别,最后,在该类别中选取最佳编码模式。
进一步,所述在该类别中选取最佳编码模式的方法为:计算当前宏块在该类别中的各个编码模式下的RD代价,选择最小的RD代价对应的编码模式作为最佳编码模式。
进一步,将各个可选用的编码模式按照宏块运动活跃度分为5类,分别为:无运动类、低速运动类、中速运动类、高速运动类、包含密集的信息或场景切换类。
进一步,所述无运动类中的编码模式为跳过模式;所述低速运动类中的编码模式为跳过模式及16x16模式;所述中速运动类中的编码模式为16x8模块及8x16模式;所述高速运动类中的编码模式为8x8模式、8x4模式、4x8模式及4x4模式;所述包含密集的信息或场景切换类中的编码模式为I4MB模式及I16MB模式。
进一步,所述预设的阈值有两个,分别为最小阈值Tlow及最大阈值Thigh。
进一步,所述将计算出的RD代价与预设的阈值进行比较,确定最佳编码模式所属类别的方法是:
如果计算出的RD代价<最小阈值Tlow,则最佳编码模式属于无运动类;
如果计算出的RD代价>最大阈值Thigh,则最佳编码模式属于包含密集的信息或场景切换类;
如果Tiow≤计算出的RD代价≤Thigh,则最佳编码模式属于低速运动类或中速运动类或高速运动类,此时确定最佳编码模式具体所属类别的方法如下:
若当前宏块为可在支持区域中确定运动矢量组的非特殊宏块,则通过计算运动矢量组中的每个运动矢量的区域块长度,找出最大区域块长度L并与预设的最小区域块长度门限值L1和最大区域块长度门限值L2比较;如果L≤L1,则最佳编码模式属于低速运动类;如果L1<L≤L2,则最佳编码模式属于中速运动类;如果L2<L,则最佳编码模式属于高速运动类;
若当前宏块为不可在支持区域中确定运动矢量组的特殊宏块,则进行如下处理:如果当前宏块为图像帧第一行且第一列的宏块A,则通过计算当前宏块在低速运动类、中速运动类、高速运动类中的各个编码模式下的RD代价,选取最小的RD代价对应的编码模式为最佳编码模式;如果当前宏块为位于第一行的除A外的其它宏块,则通过相邻左边宏块的运动矢量得到最大区域块长度L;如果当前宏块为位于第一列的除A外的其它宏块,则通过相邻上边宏块中的运动矢量得到最大区域块长度L;如果当前宏块为最后列中的宏块,则通过相邻左边宏块中的运动矢量得到最大区域块长度L;在找出最大区域块长度L后与预设的最小区域块长度门限值L1和最大区域块长度门限值L2比较;如果L≤L1,则最佳编码模式属于低速运动类;如果L1<L≤L2,则最佳编码模式属于中速运动类;如果L2<L,则最佳编码模式属于高速运动类。
进一步,所述最小阈值Tlow=34e0.1759×QP,最大阈值Thigh=24215e0.0675×QP,其中QP为在23至40区间的量化参数。
进一步,所述最小区域块长度门限值L1=1,最大区域块长度门限值L2=2。
本发明的有益效果是:根据宏块的运动活跃度对编码模式进行分类,对处理过程分级处理,避免了可能落选的编码模式的预测计算,同时加强了对跳过模式的预判断,优化了处理流程,显著降低了运算处理时间,有利于编码效果的提高。
附图说明
图1为本发明的基于宏块运动活跃度的编码模式快速预测方法的实施例流程图;
图2为当前宏块的支持区域ROS示意图。
具体实施方式
下面结合附图及实施例对本发明的技术方案作进一步的描述。
为解决传统技术中在选取最佳编码模式时会增加计算复杂度的问题,本发明提出一种基于宏块运动活跃度的编码模式快速预测方法,该方法根据宏块的运动活跃度对编码模式进行分类,对处理过程分级处理,避免了可能落选的编码模式的预测计算,同时加强了对跳过模式的预判断,优化了处理流程,显著降低了运算处理时间,有利于编码效果的提高。
对于本发明中涉及的术语解释如下:“支持区域”是本申请引入的一种大小可变的参考窗口技术,这个区域的大小根据当前宏块的运动种类和周围运动矢量的大小来判定大小。
实施例:
本例在具体实现上,首先需要按照宏块的运动活跃度的不同划分编码模式,这些编码模式均是来自于ITU-H.264标准,其划分方式如下表一所示:
表一:编码模式划分表
类别 | 运动活跃度 | 涉及到的模式 |
1 | 无运动 | 跳过(SKIP) |
2 | 低速运动(或单一性运动) | 跳过(SKIP)、16x16 |
3 | 中等速运动 | 16x8、8x16 |
4 | 高速运动 | 8x8、8x4、4x8、4x4 |
5 | 包含密集的信息或者场景切换 | I4MB、I16MB |
上述划分方式的理论依据是:如果当前的宏块在SKIP模式下的RD代价足够小(小于Tlow),那么当前的宏块很可能是没有发生运动的图像,而如果在SKIP模式下的RD代价非常大(大于Thigh),这通常意味着该宏块中包含密集的信息、快速运动或场景切换;这里所说的Tlow、Thigh是我们分别为区分宏块运动活跃度而预设的最小阈值和最大阈值;而由于不同大小的量化参数将影响图像细节的展现程度,所以这两个阈值均和量化参数有关,在H.264中量化参数的范围是0-51的正整数,为保证图像的质量,本发明只针对23-40区间的量化参数;
我们采用的可信度为90%,即当选定Tlow时,有90%的宏块满足无运动类下的SKIP模式为最佳编码模式,当选定Thigh时,有90%的宏块满足第5类(包含密集的信息或场景切换类)中的I4MB或I16MB为最佳编码模式;
由上面的依据可以得出最小阈值Tlow及最大阈值Thigh的计算公式为:
Tlow=34e0.1759×QP (1)
Thigh=24215e0..0675×QP (2)
其中QP为在23至40区间的量化参数。
参见图1,本例中的预测方法采用以下手段实现:
1、判断当前宏块是否为帧内帧,如果是,则直接计算当前宏块在第5类(包含密集的信息或场景切换类)中的I4MB模式下的RD代价、在I16MB模式下的RD代价,然后选用RD代价最小的对应的模式作为最佳编码模式;如果当前宏块不是帧内帧,则进入步骤2;
2、计算当前宏块在跳过模式下的RD代价:RDcost(SKIP),并与最小阈值Tlow及最大阈值Thigh进行比较;
3、如果RDcost(SKIP)<最小阈值Tlow,则最佳编码模式属于1类(无运动类),由于1类中只有跳过模式,因此就选取跳过模式作为最佳编码模式;
如果RDcost(SKIP)>最大阈值Thigh,则最佳编码模式属于5类(包含密集的信息或场景切换类),由于5类中包含I4MB或I16MB两种模式,因此还需要分别计算当前宏块在这两种模式下的RD代价,然后选取RD代价最小的对应的编码模式为最佳编码模式;
如果Tlow≤RDcost(SKIP)≤Thigh,则最佳编码模式属于2类(低速运动类)或3类(中速运动类)或4类(高速运动类);要具体区分最佳编码模式属于哪一类,还需要进行如下处理:
对于非特殊宏块(本发明中所述的特殊宏块为处于图像帧第一行、或第一列或最后列的宏块)的处理:首先在支持区域ROS内(该支持区域ROS的示意图参见图2)确定当前宏块MB0的运动矢量组{mv1,mv2,mv3,mv4},其中mvi=(xi,yi),然后计算每个运动矢量的区域块长度,公式为:l(mvi)=|xi|+|yi|,i=1,2,3,4; (3)
之后,从运动矢量组中找出最大区域块长度L,公式为:
L=max{l(mv1),l(mv2),l(mm3),l(mv4)} (4]
再将此最大区域块长度L与预设的最小区域块长度门限值L1和最大区域块长度门限值L2进行比较,从而确定最佳编码模式所属类别,公式为:
对于最小区域块长度门限值L1和最大区域块长度门限值L2的取值,L1可以取1,L2可以取2。
对于特殊宏块的处理:即处于图像帧第一行或第一列或最后列的宏块,这些宏块不能在支持区域中确定运动矢量组,因此我们采用以下处理方式:对于位于第一行且第一列的宏块需要全部计算其在2类、3类、4类中的各个模式下的RD代价,选用RD代价最小的对应的编码模式为最佳编码模式;而对于位于第一行的其它宏块(假设位于第一行且第一列的宏块为A,这里所说的其它宏块即为第一行中除A外的宏块)则通过相邻左边宏块中的那个运动矢量得到最大区域块长度L;对于位于第一列的其它宏块(这里所说的其它宏块即为第一列中除A外的宏块)则通过相邻上边宏块中的那个运动矢量得到最大区域快长度L;对于位于最后列的宏块,则通过相邻左边宏块中的那个运动矢量得到最大区域块长度L;
同样,在得到最大区域块长度L后,与预设的最小区域块长度门限值L1和最大区域块长度门限值L2进行比较,比较公式为上述式(5),从而确定最佳编码模式所属类别,在确定最佳编码类别后,分别计算在该类别下的各个编码模式下的RD代价,选用RD代价最小的对应的编码模式为最佳编码模式。
为体现本发明的预测算法的性能,可参见表二中的本发明的预测算法带来的性能效果与传统技术预测算法的性能效果对比,所使用的视频序列为:“Akiyo”、“Salesman”、“Foreman”、“Table Tennis”、“Bus”、“Stefan”。
表二:本发明的预测算法与传统技术相比性能效果对比表
从上述表二中可以看出,与传统技术相比,虽然本发明的预测算法带来了不明显的码率增加、图像质量下降的问题,但却带来运算时间的大幅度缩短的效果,非常有利于编码效率的提升。
本发明要求保护的技术方案包含但不仅限于上述实施例,本领域的技术人员根据上述对本发明的描述容易想到一些等同替换/修改,其皆在属于本发明精神实质下的保护范围之内。
Claims (8)
1.基于宏块运动活跃度的编码模式快速预测方法,其特征在于,包括:对H.264标准定义下的各个可选用的编码模式按照宏块运动活跃度进行分类;首先,计算当前宏块在跳过模式下的RD代价,然后,将计算出的RD代价与预设的阈值进行比较,确定最佳编码模式所属类别,最后,在该类别中选取最佳编码模式。
2.如权利要求1所述的基于宏块运动活跃度的编码模式快速预测方法,其特征在于,所述在该类别中选取最佳编码模式的方法为:计算当前宏块在该类别中的各个编码模式下的RD代价,选择最小的RD代价对应的编码模式作为最佳编码模式。
3.如权利要求1所述的基于宏块运动活跃度的编码模式快速预测方法,其特征在于,将各个可选用的编码模式按照宏块运动活跃度分为5类,分别为:无运动类、低速运动类、中速运动类、高速运动类、包含密集的信息或场景切换类。
4.如权利要求3所述的基于宏块运动活跃度的编码模式快速预测方法,其特征在于,所述无运动类中的编码模式为跳过模式;所述低速运动类中的编码模式为跳过模式及16x16模式;所述中速运动类中的编码模式为16x8模块及8x16模式;所述高速运动类中的编码模式为8x8模式、8x4模式、4x8模式及4x4模式;所述包含密集的信息或场景切换类中的编码模式为I4MB模式及I16MB模式。
5.如权利要求4所述的基于宏块运动活跃度的编码模式快速预测方法,其特征在于,所述预设的阈值有两个,分别为最小阈值Tlow及最大阈值Thigh。
6.如权利要求5所述的基于宏块运动活跃度的编码模式快速预测方法,其特征在于,所述将计算出的RD代价与预设的阈值进行比较,确定最佳编码模式所属类别的方法是:
如果计算出的RD代价<最小阈值Tlow,则最佳编码模式属于无运动类;
如果计算出的RD代价>最大阈值Thigh,则最佳编码模式属于包含密集的信息或场景切换类;
如果Tlow≤计算出的RD代价≤Thigh,则最佳编码模式属于低速运动类或中速运动类或高速运动类,此时确定最佳编码模式具体所属类别的方法如下:
若当前宏块为可在支持区域中确定运动矢量组的非特殊宏块,则通过计算运动矢量组中的每个运动矢量的区域块长度,找出最大区域块长度L并与预设的最小区域块长度门限值L1和最大区域块长度门限值L2比较;如果L≤L1,则最佳编码模式属于低速运动类;如果L1<L≤L2,则最佳编码模式属于中速运动类;如果L2<L,则最佳编码模式属于高速运动类;
若当前宏块为不可在支持区域中确定运动矢量组的特殊宏块,则进行如下处理:如果当前宏块为图像帧第一行且第一列的宏块A,则通过计算当前宏块在低速运动类、中速运动类、高速运动类中的各个编码模式下的RD代价,选取最小的RD代价对应的编码模式为最佳编码模式;如果当前宏块为位于第一行的除A外的其它宏块,则通过相邻左边宏块的运动矢量得到最大区域块长度L;如果当前宏块为位于第一列的除A外的其它宏块,则通过相邻上边宏块中的运动矢量得到最大区域块长度L;如果当前宏块为最后列中的宏块,则通过相邻左边宏块中的运动矢量得到最大区域块长度L;在找出最大区域块长度L后与预设的最小区域块长度门限值L1和最大区域块长度门限值L2比较;如果L≤L1,则最佳编码模式属于低速运动类;如果L1<L≤L2,则最佳编码模式属于中速运动类;如果L2<L,则最佳编码模式属于高速运动类。
7.如权利要求6所述的基于宏块运动活跃度的编码模式快速预测方法,其特征在于,所述最小阈值Tlow34e0.1759×Qp,最大阈值Thigh=24215e0.0675×QP其中QP为在23至40区间的量化参数。
8.如权利要求6所述的基于宏块运动活跃度的编码模式快速预测方法,其特征在于,所述最小区域块长度门限值L1=1,最大区域块长度门限值L2=2。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013101162210A CN103200404A (zh) | 2013-04-07 | 2013-04-07 | 基于宏块运动活跃度的编码模式快速预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013101162210A CN103200404A (zh) | 2013-04-07 | 2013-04-07 | 基于宏块运动活跃度的编码模式快速预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103200404A true CN103200404A (zh) | 2013-07-10 |
Family
ID=48722745
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2013101162210A Pending CN103200404A (zh) | 2013-04-07 | 2013-04-07 | 基于宏块运动活跃度的编码模式快速预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103200404A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106170979A (zh) * | 2014-04-30 | 2016-11-30 | 英特尔公司 | 恒定质量视频编码 |
CN107087200A (zh) * | 2017-05-11 | 2017-08-22 | 郑州轻工业学院 | 针对高效率视频编码标准的跳过编码模式提前判决方法 |
CN107623858A (zh) * | 2017-10-19 | 2018-01-23 | 北京工业大学 | 一种基于自适应分段跳过规则的3d视频快速编码方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050135484A1 (en) * | 2003-12-18 | 2005-06-23 | Daeyang Foundation (Sejong University) | Method of encoding mode determination, method of motion estimation and encoding apparatus |
CN101170688A (zh) * | 2007-11-26 | 2008-04-30 | 电子科技大学 | 一种宏块模式的快速选择方法 |
CN101572817A (zh) * | 2009-05-26 | 2009-11-04 | 北京邮电大学 | 一种用于空间可分级视频编码的编码模式选择方法 |
US20090296812A1 (en) * | 2008-05-28 | 2009-12-03 | Korea Polytechnic University Industry Academic Cooperation Foundation | Fast encoding method and system using adaptive intra prediction |
CN102075751A (zh) * | 2011-01-12 | 2011-05-25 | 浙江大学 | 一种基于宏块运动状态的h264快速模式选择方法 |
-
2013
- 2013-04-07 CN CN2013101162210A patent/CN103200404A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050135484A1 (en) * | 2003-12-18 | 2005-06-23 | Daeyang Foundation (Sejong University) | Method of encoding mode determination, method of motion estimation and encoding apparatus |
CN101170688A (zh) * | 2007-11-26 | 2008-04-30 | 电子科技大学 | 一种宏块模式的快速选择方法 |
US20090296812A1 (en) * | 2008-05-28 | 2009-12-03 | Korea Polytechnic University Industry Academic Cooperation Foundation | Fast encoding method and system using adaptive intra prediction |
CN101572817A (zh) * | 2009-05-26 | 2009-11-04 | 北京邮电大学 | 一种用于空间可分级视频编码的编码模式选择方法 |
CN102075751A (zh) * | 2011-01-12 | 2011-05-25 | 浙江大学 | 一种基于宏块运动状态的h264快速模式选择方法 |
Non-Patent Citations (1)
Title |
---|
王琨: ""H.264/AVC快速模式选择算法研究"", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106170979A (zh) * | 2014-04-30 | 2016-11-30 | 英特尔公司 | 恒定质量视频编码 |
CN106170979B (zh) * | 2014-04-30 | 2019-06-04 | 英特尔公司 | 一种用于视频编码的计算机实现的方法、系统、机器可读介质及设备 |
CN107087200A (zh) * | 2017-05-11 | 2017-08-22 | 郑州轻工业学院 | 针对高效率视频编码标准的跳过编码模式提前判决方法 |
CN107623858A (zh) * | 2017-10-19 | 2018-01-23 | 北京工业大学 | 一种基于自适应分段跳过规则的3d视频快速编码方法 |
CN107623858B (zh) * | 2017-10-19 | 2020-08-28 | 北京工业大学 | 一种基于自适应分段跳过规则的3d视频快速编码方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103997645B (zh) | 一种快速的hevc帧内编码单元和模式决策方法 | |
CN106937116B (zh) | 基于随机训练集自适应学习的低复杂度视频编码方法 | |
CN103517069A (zh) | 一种基于纹理分析的hevc帧内预测快速模式选择方法 | |
CN106961606A (zh) | 基于纹理划分特征的hevc帧内编码模式选择方法 | |
CN105141954A (zh) | 一种hevc帧间编码快速模式选择方法 | |
CN105306947B (zh) | 基于机器学习的视频转码方法 | |
CN105959699B (zh) | 一种基于运动估计和时空域相关性的快速帧间预测方法 | |
WO2020207162A1 (zh) | 帧内预测编码方法、装置、电子设备及计算机存储介质 | |
CN104320658B (zh) | 一种hevc快速编码方法 | |
CN104333756B (zh) | 基于时域相关性的hevc预测模式快速选择方法 | |
CN104837019B (zh) | 基于支持向量机的avs到hevc优化视频转码方法 | |
CN101500161A (zh) | 基于自适应块变换的帧内预测方法及装置 | |
CN104702955A (zh) | 屏幕视频的预测编码的方法与系统 | |
CN108366256A (zh) | 一种hevc帧内预测模式快速选择系统及方法 | |
CN103888762A (zh) | 一种基于hevc标准的视频编码框架 | |
CN104601992B (zh) | 基于贝叶斯最小风险决策的skip模式快速选择方法 | |
CN104883566B (zh) | 一种适用于hevc标准的帧内预测块大小划分的快速算法 | |
CN110446052A (zh) | 一种3d-hevc帧内深度图快速cu深度选择方法 | |
CN105681808A (zh) | 一种scc帧间编码单元模式的快速决策方法 | |
CN104284186A (zh) | 一种适用于hevc标准帧内预测模式判决过程的快速算法 | |
CN101304529A (zh) | 宏块模式的选择方法和装置 | |
CN104702957A (zh) | 运动矢量压缩方法和装置 | |
CN101895761B (zh) | 一种快速帧内预测算法 | |
CN104581152A (zh) | 一种hevc帧内预测模式选择加速方法 | |
CN107690069B (zh) | 一种数据驱动的级联视频编码方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20130710 |