CN101527851A - H.264中p帧模式的快速选择方法 - Google Patents
H.264中p帧模式的快速选择方法 Download PDFInfo
- Publication number
- CN101527851A CN101527851A CN 200910106556 CN200910106556A CN101527851A CN 101527851 A CN101527851 A CN 101527851A CN 200910106556 CN200910106556 CN 200910106556 CN 200910106556 A CN200910106556 A CN 200910106556A CN 101527851 A CN101527851 A CN 101527851A
- Authority
- CN
- China
- Prior art keywords
- pattern
- mode
- current macro
- final
- rate distortion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一种H.264中P帧模式的快速选择方法,包括以下步骤:用邻块的最终模式通过贝叶斯分类器选出当前宏块的初始候选模式集合;若初始侯选模式集合是大尺寸模式集合,则根据邻块的最终率失真开销选出当前宏块的最佳帧间模式,若是小尺寸模式集合,则根据邻块的最终模式选出当前宏块的最佳帧间模式;利用贝叶斯学习中得到的后验概率判断帧内模式编码是否有必要进行,若没必要,则将所述最佳帧间模式作为当前宏块的最终模式,若有必要则从帧内模式和最佳帧间模式中选出最终模式。本发明方法可以很好地适应各种视频场景,同时能在获得较好编码质量的情况下大幅缩短编码所需时间。
Description
技术领域
本发明涉及H.264中P帧编码时的模式选择方法,特别是一种利用机器学习的方法实现快速的P帧模式选择的方法。
背景技术
随着与网络相关的多媒体应用技术的出现和快速发展,使得多媒体数据需要在多种多样的网络传输介质中进行传输,于是也就对视频压缩标准提出了更高的要求。以H.264为代表的新一代视频压缩标准通过采用大量的新技术实现了更高的数据压缩比和更好的网络传输特性,但是也带来了新的问题,如:视频压缩算法变得更为复杂、对计算资源的要求更高、算法运行时间也更长。这就对H.264算法的广泛运用(尤其是在嵌入式环境中的实时应用)带来了一定的局限性。
在H.264中,模式选择阶段所需的时间占到了整个编码过程的60%-80%。而P帧一般来说又是H.264中数量最多的帧,因此缩短P帧模式选择所需要的时间就能大大降低H.264整个编码过程所需要的时间。目前在国内外已经有一些该方面的研究,出现了一些改进的P帧编码快速算法。但这些算法大多缺少灵活性,只能按照人工设定的一些规则运行,且不能在编码时间和编码质量上都能取得好的效果。
发明内容
本发明的目的是提供一种H.264中P帧模式的快速选择方法,该方法能够使H.264算法在获得较好编码质量的情况下大幅缩短编码所需时间,能够降低H.264算法的复杂度,降低对计算资源的要求。
在H.264标准中,编码的最小单位是宏块。P帧中的每个宏块都有帧间和帧内两类大的模式可以选择,而每类大的模式中都有多种小的候选模式(帧间模式有SKIP、16×16、16×8、8×16和P8×8五种,帧内模式有16×16和4×4两种尺寸13种模式)。把每种模式依次编码一次,通过率失真优化公式来获得最佳模式是一种很耗费时间的方法。
宏块的编码模式和宏块本身所包含的内容有着很大的联系。处于画面背景或是较为平滑部分的宏块通常适合采用大尺寸的模式(如SKIP、16×16、16×8或8×16),而处于高速运动物体内部或是细节较多部分的宏块则适合采用小尺寸的模式(如P8×8、Inter4×4)。
相邻宏块的模式通常具有某些相似性,称为空间相关性。这是因为相邻的宏块往往包含相似的视频内容。比如它们可能同时处于画面的背景中或是同一个物体中。
为了更好地利用宏块间的空间相关性,本发明首先采用大量已经编码完毕的视频作为学习材料进行学习,通过邻近的已经编码完毕的宏块的模式来对当前宏块的模式进行预测。然后按照预测的模式对当前宏块进行编码,随即对编码效果进行评估。如果编码效果良好,则忽略其他候选模式。否则,再按照一定的顺序对其余候选模式进行检测,从中选取最好的模式作为当前宏块的最终模式。本发明的具体技术方案如下:
H.264中P帧模式的快速选择方法,包括以下步骤:
1)用邻块的最终模式通过贝叶斯分类器选出当前宏块的初始候选模式集合;
2)若初始侯选模式集合是大尺寸模式集合,则执行步骤3),若是小尺寸模式集合则转至步骤4);
3)根据邻块的最终率失真开销,选出当前宏块的最佳帧间模式;包括:
3.1根据邻块的最终率失真开销设置阈值T1,检测当前宏块在SKIP模式下的率失真开销并与阈值T1比较,若小于T1,则将SKIP作为最佳帧间模式并转至步骤5),否则执行步骤3.2;
3.2进一步检测当前宏块在16×16、16×8和8×16模式下的率失真开销,若率失真开销最小的模式是16×16或SKIP,则将率失真开销最小的模式作为最佳帧间模式并转至步骤5),否则执行步骤3.3;
3.3进一步检测当前宏块在P8×8模式下的率失真开销,将所有模式中率失真开销最小的模式作为最佳帧间模式,转至步骤5);
4)根据邻块的最终模式,选出当前宏块的最佳帧间模式;包括:
4.1根据邻块的最终模式设置阈值T2,检测当前宏块在P8×8模式下4个8×8子块的编码模式(宏块在进行8×8模式编码时会被分成4个8×8子块,每个8×8子块可以独立地选择自己的模式,每个子块的候选模式有8×8、8×4、4×8和4×4四种),若4个8×8子块中有大于或等于T2个子块的模式不为8×8,则将P8×8作为当前宏块的最佳帧间模式并转至步骤5),否则执行步骤4.2;
4.2进一步检测当前宏块在各个大尺寸模式下的率失真开销,将所有模式中率失真开销最小的模式作为最佳帧间模式;
5)比较帧间模式集在给定邻块模式下的后验概率和帧内模式集在给定邻块模式下的后验概率,若前者大于后者则将所述最佳帧间模式作为当前宏块的最终模式,否则执行步骤6);
6)判断最佳帧间模式是否是SKIP或者16×16,若是则从Intra16×16和所述最佳帧间模式间选出当前宏块的最终模式,若不是,则从Intra4×4和所述最佳帧间模式间选出当前宏块的最终模式。
本发明具有以下有益技术效果:本发明实现了一种基于机器学习的帧模式选择的快速算法,通过前期对大量视频进行学习,可以很好地适应各种视频场景,同时能在获得较好编码质量的情况下大幅缩短编码所需时间。通过实验证明,本发明方法比JM10.0中的原始算法可以缩短60%-80%的编码时间,同时带来的失真度很小,几乎可以忽略。
附图说明
图1为相邻宏块间的位置关系;
图2为一种理想状态下相邻宏块之间编码模式的关系;
图3为不同的邻块模式组合情况下,当前宏块模式的概率分布情况;
图4为本发明P帧模式快速选择方法的流程图。
具体实施方式
本发明首先利用贝叶斯学习的方法,将已经编码过的一些视频材料作为学习内容进行学习。学习的目的是为了获得宏块间的空间相关性信息,如图1所示。图中的A、B、C三个宏块为当前宏块的相邻宏块,由于宏块都已编码完毕,因此可以找到相邻宏块和当前宏块编码模式之间的对应关系。图2给出了一种最理想状况下的相关情况——当相邻3个宏块都为同一种模式时,当前的宏块也为相同模式。但在实际情况中,空间相关性远远复杂得多。图3给出了在不同的邻块模式组合情况下,当前宏块模式的概率分布情况。
用贝叶斯学习的方法可以在学习完毕之后获得当前宏块各候选模式在给定邻块模式下的后验概率。选取后验概率最高的模式作为首选进行检测并评估编码效果。参照图4,本实施例H.264中P帧模式的快速选择方法,包括以下步骤:
1)用邻块的最终模式通过贝叶斯分类器选出当前宏块的初始候选模式集合;
2)若初始侯选模式集合是大尺寸模式集合,则执行步骤3),若是小尺寸模式集合则转至步骤4);
3)根据邻块的最终率失真开销,选出当前宏块的最佳帧间模式;包括:
3.1根据3个邻块的最终率失真开销(RDcost值)设置阈值T1,检测当前宏块在SKIP模式下的率失真开销并与阈值T1比较,若小于T1,则将SKIP作为最佳帧间模式并转至步骤5),否则执行步骤3.2;
3.2进一步检测当前宏块在16×16、16×8和8×16模式下的率失真开销,若率失真开销最小的模式是16×16或SKIP,则将率失真开销最小的模式作为最佳帧间模式并转至步骤5),否则执行步骤3.3;
3.3进一步检测当前宏块在P8×8模式下的率失真开销,将所有模式中率失真开销最小的模式作为最佳帧间模式,转至步骤5);
4)根据邻块的最终模式,选出当前宏块的最佳帧间模式;包括:
4.1根据邻块的最终模式设置阈值T2,检测当前宏块在P8×8模式下4个8×8子块的编码模式(注:宏块在进行8×8模式编码时会被分成4个8×8子块,每个8×8子块可以独立地选择自己的模式,每个子块的候选模式有8×8、8×4、4×8和4×4四种),若4个8×8子块中有大于或等于T2个子块的模式不为8×8,则将P8×8作为当前宏块的最佳帧间模式并转至步骤5),否则执行步骤4.2;
4.2进一步检测当前宏块在各个大尺寸模式(即SKIP、16×16、16×8和8×16模式)下的率失真开销,将所有模式中率失真开销最小的模式作为最佳帧间模式;
5)利用贝叶斯学习中得到的后验概率判断帧内模式编码是否有必要进行。具体是:分别计算当前宏块的帧间模式集和帧内模式集在给定邻块模式下的后验概率,若前者大于后者,则认为没有必要进行帧内编码,直接将最佳帧间模式作为当前宏块的最终模式;否则认为有必要进行帧内编码,执行步骤6);
6)判断最佳帧间模式是否是SKIP或者16×16,若是则从Intra16×16和所述最佳帧间模式间选出当前宏块的最终模式,若不是,则从Intra4×4和所述最佳帧间模式间选出当前宏块的最终模式。
上述步骤3.1中,根据邻块的最终率失真开销设置阈值T1的方法为:若3个邻块均采用SKIP模式,则将T1设置为3个邻块最终率失真开销的最大值,否则,将T1设置为3个邻块最终率失真开销的最小值。
上述步骤4.1中,根据邻块的最终模式设置阈值T2的方法为:若3个邻块的最终模式均为P8×8模式,则将T2设置为1,否则将T2设置为3。
上述步骤1中,用邻块的最终模式通过贝叶斯分类器选出当前宏块的初始候选模式集合的方法如下:将帧间模式分为大尺寸模式集合(SKIP,16×16,16×8和8×16)和小尺寸模式集合(P8×8模式,包括4个8×8子块的各种组合),分别计算两种模式集合在给定邻块模式下的后验概率,选取后验概率大的一种模式集合作为初始候选模式集合。
上述大尺寸模式包括SKIP模式、16×16模式、16×8模式和8×16模式,小尺寸模式包括P8×8模式。
为了验证本发明的效果,将本发明与两个很有名的快速算法【1】I.Choi,J.Lee,and B.Jeon,“Efficient coding mode decision in MPEG-4part-10AVC/H.264main profile,”in Proc.Int.Conf.Image Process.(ICIP)2004,Oct.2004,vol.2,pp.1141-1145.【2】.Yang,M.,Wang,W.S,“Fast Macroblock Mode Selection BasedOn Motion Content Classification in H.264/AVC”,IEEE International Conferenceon Image Processing(ICIP),October 24-27,pp.741-744.进行了比较。实验采用了8个视频片段,在JM10.0上进行,实验重要的参数设定如表1,试验结果如表2所示。
表1
表2
由实验结果可以得出,本发明所提出的算法较之Choi和Yang的算法在编码时间缩减和编码质量上均有提高,比起JM10.0中的原始算法来可以缩短60%-80%的编码时间,同时带来的失真度很小,几乎可以忽略。
Claims (4)
1、H.264中P帧模式的快速选择方法,其特征在于包括以下步骤:
1)用邻块的最终模式通过贝叶斯分类器选出当前宏块的初始候选模式集合;
2)若初始候选模式集合是大尺寸模式集合,则执行步骤3),若是小尺寸模式集合则转至步骤4);
3)根据邻块的最终率失真开销,选出当前宏块的最佳帧间模式;包括:
3.1根据邻块的最终率失真开销设置阈值T1,检测当前宏块在SKIP模式下的率失真开销并与阈值T1比较,若小于T1,则将SKIP作为最佳帧间模式并转至步骤5),否则执行步骤3.2;
3.2进一步检测当前宏块在16×16、16×8和8×16模式下的率失真开销,若率失真开销最小的模式是16×16或SKIP,则将率失真开销最小的模式作为最佳帧间模式并转至步骤5),否则执行步骤3.3;
3.3进一步检测当前宏块在P8×8模式下的率失真开销,将所有模式中率失真开销最小的模式作为最佳帧间模式,转至步骤5);
4)根据邻块的最终模式,选出当前宏块的最佳帧间模式;包括:
4.1根据邻块的最终模式设置阈值T2,检测当前宏块在P8×8模式下4个8×8子块的编码模式,若4个8×8子块中有大于或等于T2个子块的模式不为8×8,则将P8×8作为当前宏块的最佳帧间模式并转至步骤5),否则执行步骤4.2;
4.2进一步检测当前宏块在各个大尺寸模式下的率失真开销,将所有模式中率失真开销最小的模式作为最佳帧间模式;
5)比较帧间模式集在给定邻块模式下的后验概率和帧内模式集在给定邻块模式下的后验概率,若前者大于后者则将所述最佳帧间模式作为当前宏块的最终模式,否则执行步骤6);
6)判断最佳帧间模式是否是SKIP或者16×16,若是则从Intra16×16和所述最佳帧间模式间选出当前宏块的最终模式,若不是,则从Intra4×4和所述最佳帧间模式间选出当前宏块的最终模式。
2、根据权利要求1所述的H.264中P帧模式的快速选择方法,其特征在于,根据邻块的最终率失真开销设置阈值T1的方法为:若3个邻块均采用SKIP模式,则将T1设置为3个邻块最终率失真开销的最大值,否则,将T1设置为3个邻块最终率失真开销的最小值;根据邻块的最终模式设置阈值T2的方法为:若3个邻块的最终模式均为P8×8模式,则将T2设置为1,否则将T2设置为3。
3、根据权利要求1所述的H.264中P帧模式的快速选择方法,其特征在于,用邻块的最终模式通过贝叶斯分类器选出当前宏块的初始候选模式集合的方法为:将帧间模式分为大尺寸模式集合和小尺寸模式集合,分别计算两种模式集合在给定邻块模式下的后验概率,选取后验概率大的一种模式集合作为初始候选模式集合。
4、根据权利要求1或2或3所述的H.264中P帧模式的快速选择方法,其特征在于:所述大尺寸模式集合包括SKIP模式、16×16模式、16×8模式和8×16模式,小尺寸模式集合包括P8×8模式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200910106556 CN101527851B (zh) | 2009-04-10 | 2009-04-10 | H.264中p帧模式的快速选择方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200910106556 CN101527851B (zh) | 2009-04-10 | 2009-04-10 | H.264中p帧模式的快速选择方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101527851A true CN101527851A (zh) | 2009-09-09 |
CN101527851B CN101527851B (zh) | 2010-08-11 |
Family
ID=41095511
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200910106556 Expired - Fee Related CN101527851B (zh) | 2009-04-10 | 2009-04-10 | H.264中p帧模式的快速选择方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101527851B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102025995A (zh) * | 2010-12-10 | 2011-04-20 | 浙江大学 | 一种可伸缩视频编码的空间增强层快速模式选择方法 |
CN102932642A (zh) * | 2012-11-13 | 2013-02-13 | 北京大学 | 一种帧间编码快速模式选择方法 |
CN103299639A (zh) * | 2010-12-28 | 2013-09-11 | Sk电信有限公司 | 利用周围块的特征向量对图像编码/解码的方法和装置 |
CN104601992A (zh) * | 2015-01-07 | 2015-05-06 | 上海交通大学 | 基于贝叶斯最小风险决策的skip模式快速选择方法 |
CN105141953A (zh) * | 2015-07-31 | 2015-12-09 | 华侨大学 | 一种适用于hevc的快速帧间模式选择方法 |
CN105812796A (zh) * | 2016-03-21 | 2016-07-27 | 同济大学 | 一种scc帧间编码单元备选预测模式缩减方法 |
CN106803962A (zh) * | 2017-02-16 | 2017-06-06 | 南京理工大学 | 基于贝叶斯准则的3d视频深度图帧内预测模式选择方法 |
CN110611819A (zh) * | 2019-08-01 | 2019-12-24 | 杭州当虹科技股份有限公司 | 一种提升h.264中b帧质量的编码方法 |
-
2009
- 2009-04-10 CN CN 200910106556 patent/CN101527851B/zh not_active Expired - Fee Related
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102025995B (zh) * | 2010-12-10 | 2012-10-31 | 浙江大学 | 一种可伸缩视频编码的空间增强层快速模式选择方法 |
CN102025995A (zh) * | 2010-12-10 | 2011-04-20 | 浙江大学 | 一种可伸缩视频编码的空间增强层快速模式选择方法 |
CN103299639A (zh) * | 2010-12-28 | 2013-09-11 | Sk电信有限公司 | 利用周围块的特征向量对图像编码/解码的方法和装置 |
CN102932642A (zh) * | 2012-11-13 | 2013-02-13 | 北京大学 | 一种帧间编码快速模式选择方法 |
CN102932642B (zh) * | 2012-11-13 | 2015-06-24 | 北京大学 | 一种帧间编码快速模式选择方法 |
CN104601992B (zh) * | 2015-01-07 | 2018-07-03 | 上海交通大学 | 基于贝叶斯最小风险决策的skip模式快速选择方法 |
CN104601992A (zh) * | 2015-01-07 | 2015-05-06 | 上海交通大学 | 基于贝叶斯最小风险决策的skip模式快速选择方法 |
CN105141953A (zh) * | 2015-07-31 | 2015-12-09 | 华侨大学 | 一种适用于hevc的快速帧间模式选择方法 |
CN105141953B (zh) * | 2015-07-31 | 2018-05-25 | 华侨大学 | 一种适用于hevc的快速帧间模式选择方法 |
CN105812796A (zh) * | 2016-03-21 | 2016-07-27 | 同济大学 | 一种scc帧间编码单元备选预测模式缩减方法 |
CN105812796B (zh) * | 2016-03-21 | 2018-10-26 | 同济大学 | 一种scc帧间编码单元备选预测模式缩减方法 |
CN106803962A (zh) * | 2017-02-16 | 2017-06-06 | 南京理工大学 | 基于贝叶斯准则的3d视频深度图帧内预测模式选择方法 |
CN106803962B (zh) * | 2017-02-16 | 2019-10-18 | 南京理工大学 | 基于贝叶斯准则的3d视频深度图帧内预测模式选择方法 |
CN110611819A (zh) * | 2019-08-01 | 2019-12-24 | 杭州当虹科技股份有限公司 | 一种提升h.264中b帧质量的编码方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101527851B (zh) | 2010-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101527851B (zh) | H.264中p帧模式的快速选择方法 | |
CN105306947B (zh) | 基于机器学习的视频转码方法 | |
CN110087087A (zh) | Vvc帧间编码单元预测模式提前决策及块划分提前终止方法 | |
CN100571390C (zh) | 一种h264视频编码快速模式选择方法和装置 | |
CN102025995B (zh) | 一种可伸缩视频编码的空间增强层快速模式选择方法 | |
CN101420617B (zh) | 一种十字六边形运动估计搜索方法 | |
CN101247525B (zh) | 一种提高图像帧内编码速率的方法 | |
CN101394566B (zh) | 一种十字菱形运动估计搜索方法 | |
CN101170688B (zh) | 一种宏块模式的快速选择方法 | |
CN105959699B (zh) | 一种基于运动估计和时空域相关性的快速帧间预测方法 | |
CN103384325A (zh) | 一种avs-m视频编码快速帧间预测模式选择方法 | |
CN104333756B (zh) | 基于时域相关性的hevc预测模式快速选择方法 | |
CN1757240A (zh) | 视频编码 | |
CN100444639C (zh) | 一种h.264/avc的帧间运动估计的模式选择方法 | |
CN101888546B (zh) | 一种运动估计的方法及装置 | |
CN105208387A (zh) | 一种hevc帧内预测模式快速选择方法 | |
Chen et al. | A novel fast intra mode decision for versatile video coding | |
CN104811729B (zh) | 一种视频多参考帧编码方法 | |
CN103888770B (zh) | 一种基于数据挖掘的高效自适应的视频转码系统 | |
CN101304529A (zh) | 宏块模式的选择方法和装置 | |
CN112188196A (zh) | 一种基于纹理的通用视频编码帧内快速预测的方法 | |
CN103384327A (zh) | 基于自适应阈值的avs快速模式选择算法 | |
CN104581152A (zh) | 一种hevc帧内预测模式选择加速方法 | |
CN101883275B (zh) | 视频编码方法 | |
CN101867818B (zh) | 宏块模式的选择方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20100811 Termination date: 20200410 |