CN103327325B - 基于hevc标准的帧内预测模式快速自适应选择方法 - Google Patents
基于hevc标准的帧内预测模式快速自适应选择方法 Download PDFInfo
- Publication number
- CN103327325B CN103327325B CN201310192185.6A CN201310192185A CN103327325B CN 103327325 B CN103327325 B CN 103327325B CN 201310192185 A CN201310192185 A CN 201310192185A CN 103327325 B CN103327325 B CN 103327325B
- Authority
- CN
- China
- Prior art keywords
- predicting unit
- predictive mode
- candidate
- mode
- predictive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开一种基于HEVC标准的帧内预测模式快速自适应选择方法,其实现包括:对当前预测单元进行SATD粗略选择;加入当前单元左侧和上方单元的预测模式;候选预测模式SATD代价值从小到大排序;比较相邻两个代价差值与代价值中值的比值与固定门限对比,自适应决定候选预测模式;选取最终候选预测模式的RDO代价值最小值对应的预测模式作为最佳预测模式。本发明主要解决现有HEVC标准的帧内模式选择计算复杂度高的问题。本发明提出的帧内预测模式选择方案简单,在保持图像压缩性能近似不变的同时,将图像压缩时间缩短了25%~31%,为HEVC标准的实时实现提供了技术基础,广泛应用于所有基于HEVC标准的视频压缩编码端中帧内最佳预测模式选择过程。
Description
技术领域
本发明属于数字信号处理技术领域,涉及图像视频压缩编码的实现方法,具体是一种基于HEVC标准的帧内预测模式快速自适应选择方法,用于HEVC标准中对图像的帧内最佳预测模式选择过程。
背景技术
计算机及网络技术对图像及视频的处理和传输依赖于视频压缩。视频信号数字化后带宽通常在20MB/秒以上,因此给计算机存储和处理以及网络传输带来极大挑战。近年来随着图像和视频获取终端的不断发展,图像和视频清晰度、分辨率也逐步上升。传统的H.264/AVC等视频压缩方案已经不能满足人们对高清晰度、高分辨率视频在网络以及移动终端方面应用的需求,下一代视频压缩编码标准应运而生。2010年4月在德国德雷斯顿召开了JCT-VC(JointCollaborativeTeamonVideoCoding)第一次会议,确定了新一代视频压缩编码标准的名称:HEVC(HighEfficiencyVideoCoding),并将于2013年6月发布HEVC标准终稿。HEVC旨在保证视频主观质量不变的情况下,压缩效率提高一倍,极大降低传输视频信号带宽。HEVC标准的制定,为高清视频解码终端标准化提供了技术依据,推动视频在包括多媒体信号存储与传输等方面的广泛应用,满足人们对高清视频的需求。
HEVC依然延续H.26x的预测(帧内和帧间),残差,变换和熵编码混合编码框架。与H.26x不同的是,为了提高压缩效率,HEVC采用了更灵活的编码单元;通过四叉树分解确定最佳块结构;帧内预测模式由H.264的9种增加为35种。灵活高效的编码框架使得编码和计算复杂度急剧上升,给HEVC实时实现带来极大困难。因此,需要在保证性能基本不变情况下,降低HEVC时间和计算复杂度。
帧内预测主要用于消除空间冗余。在HEVC中,需要遍历大小为64×64,32×32,16×16,8×8,4×4预测单元,在每种预测单元下遍历35种预测模式确定最佳预测模式。帧内预测首先对当前预测单元遍历35种预测模式,以基于SATD(HadamardtransformedSumofAbsoluteDifference)的代价函数为准则,将代价函数SATD计算结果简称SATD代价值,粗略选出3~10种预测模式作为精细预测的候选预测模式。精细预测过程中首先在当前预测模式根据参考元素估计当前预测单元像素值,进行残差计算,离散余弦或者正弦变换,量化,CABAC(Context-basedAdaptiveBinaryArithmeticCoding)熵编码,反量化,反余弦或者反正弦变换,重建当前编码单元。由重建单元计算失真及熵编码码流,根据RDO(RateDistortionOptions)率失真代价函数(简称RDO代价值)计算代价值,选择代价值最小的模式作为最优预测模式。
RDO代价值计算过程非常复杂,对数量高达35中的帧内预测模式均需进行RDO代价值计算,因而导致时间复杂度高,因此需要减少进行RDO代价值运算的预测模式数量。虽然SATD代价值粗略选取过程一定程度降低了HEVC编码和计算复杂度,但是预测模式选择的编码和计算过程仍然比较复杂,不能满足人们对视频信号的实时需求。HEVC即将作为下一代视频压缩编码标准,其复杂的帧内预测模式选择过程极大限制了在实际生产生活中的应用,因而需要进一步探索帧内预测模式选择过程。
目前为止,已提出的快速模式选择方法主要有以下几种:
清华大学提出的“基于纹理特性的HEVC帧内预测模式的快速选择方法及装置”,专利申请号为201210337831,公开一种基于纹理特性的HEVC帧内预测模式的快速选择方法及装置,通过确定待预测单元PU的纹理方向统计直方图,当所述PU具有强纹理方向且与任一相邻块的预测方向匹配时,则将所述强纹理方向作为最终预测模式方向。该发明在保证编码质量的同时,较为有效降低了模式选择计算时间,但是由于该发明使用了基于纹理的帧内预测模式选择,因此对于纹理方向复杂,纹理特征不够突出图像不能做出有效判断,反而会由于算法本身的复杂计算过程增加运算量,不能有效降低编码时间。
北方工业大学提出的“用于HEVC的自适应快速帧内预测模式决策”,专利申请号为201210138816.1,公开一种用于HEVC的自适应帧内预测模式决策方法,在实施RMD之后加入了基于纹理的附加模式选择过程,减少候选预测模式数量为2~5个。该发明减少了候选预测模式,一定程度上降低了复杂度,减少了编码时间,但是由于纹理方向计算过程需要计算每个元素的方向矢量及幅度,额外增加了预测模式选择计算时间,同时对于纹理方向不突出图像,会导致判断错误,降低了编码性能。
北方工业大学提出的“用于HEVC的基于方向矢量的帧内预测模式决策”,专利申请号为201210138806.8,公开一种用于HEVC的帧内预测模式决策过程,首先利用方向矢量幅度与角度对预测模式进行粗略选择,由方向矢量确定的2个预测方向与DC及planar模式,通过计算方向矢量得到最佳预测模式。该发明最终选出4个预测模式进行RDO代价值运算,较为有效降低了编码时间,但是时间降低不明显;由于当图像块没有明显方向特性,不能做出有效判断,反而会增加运算量;同时在方向矢量计算过程中利用了统计特性,当图像块比较小时方向矢量统计图特征不明显,从而导致方向判断错误,降低图像压缩性能。
综上所述,上述三种技术均利用图像块的纹理方向特征判断最佳预测模式,因此均存在当图像块纹理方向特征不明显时,导致方向判断错误,降低图像压缩性能;在生成直方图时利用了图像的统计特性,当图像块小时,统计特征不明显;纹理方向计算过程比较复杂,还增加了额外的计算量。
发明内容
本发明的目的在于针对上述已有技术中帧内预测模式选择过程依然复杂,帧内预测模式选择方案复杂及时间复杂度高的不足,提出一种帧内预测模式选择简单,在保持压缩过程中视频图像压缩性能基本不变同时,提高运算速度,处理时间大为缩短的基于HEVC标准的帧内预测模式快速自适应选择方法,以降低预测模式选择的计算复杂度,满足HEVC帧内编码的高性能快速要求。
实现本发明目的技术思路是:本发明针对HEVC编码方案帧内最佳预测模式选择部分,因此保持HEVC编码方案其他部分不变。在帧内预测最佳预测模式选择过程中,根据预测模式SATD代价值自适应决定需要计算RDO代价值的预测模式数量,以提高满足HEVC标准的编码方案的帧内编码的速度。
本发明是一种基于HEVC标准的帧内预测模式快速自适应选择方法,是针对视频图像压缩过程中,帧内最佳预测模式的选择过程,具体步骤包括如下:
步骤1)视频信号由多帧图像组成,一帧图像作为整体处理难度比较大,为了降低处理难度,将待处理视频信号中的一帧图像分块作为基本处理单元,基本处理单元进一步划分为64×64,32×32,16×16,8×8或者4×4大小的图像块,选取其中一个图像块作为预测单元。
步骤2)压缩编码在降低图像数据量同时会导致图像质量下降,如模糊等,而用于平衡图像质量损失和数据量的RDO代价计算过程非常复杂。为了降低计算复杂度,HEVC利用决定预测模式最终选择的RDO代价值与SATD代价值相关性,减少计算复杂度。通过基于SATD的代价函数,计算选定预测单元在HEVC标准中35种预测模式下的代价值SatdCost0~SatdCost34,将HEVC标准中的35种预测模式记为集合S0。
步骤3)选取35种预测模式的SATD代价值SatdCost0~SatdCost34中M个较小值所对应预测模式作为当前预测单元的候选预测模式,记为集合S1( 表示包含于)。
对64×64,32×32,16×16,8×8,4×4的不同大小的预测单元中35种预测模式SATD值SatdCost0~SatdCost34中分别选取最小3,3,3,8,8个值所对应预测模式。
步骤4)由于图像总是具有一定方向,当前预测单元预测模式与左侧和上方单元的预测模式有很大相关性,为了降低由SATD粗略选择带来的性能损失,候选模式中需要考虑左侧及上方单元的预测模式。若当前预测单元相邻左侧及上方单元(指原图像空间位置)的预测模式不包含在当前预测单元选定的M个候选预测模式之中,即左侧及上方单元选定的预测模式与当前预测单元选定的M个预测模式不同。则将其加入当前预测单元选定的M个候选预测模式中,候选模式个数变化为M+1或者M+2;否则,保持当前预测单元选定的M个候选预测模式不变;将当前预测单元此时选定的候选预测模式集合记为集合S2元素总数为n。
步骤5)为后续进一步利用SATD与RDO代价值之间相关性,对当前预测单元已选定候选预测模式集合S2中的所有n个预测模式的SATD代价值从小到大排序,记排序后的SATD代价值为所对应的预测模式依次记为m0~mn-1。
步骤6)虽然上述步骤4)粗略选择过程利用了SATD与RDO相关性,降低了计算复杂度,但是在所得候选预测模式的SATD与RDO仍然有很强的相关性。因此进一步探索SATD与RDO的相关性。
SATD最小代价值所对应的预测模式为最佳预测模式可能性最大,因此令所对应的预测模式m0作为最终候选预测模式(记为集合S3)初始值;当两个预测模式SATD代价值相差很大时,可推断较大SATD代价值所对应RDO代价值不会超过较大SATD代价值对应的RDO代价值,因此依次计算 序列中相邻两个元素 和的差与两者中值的比值,该比值可用于衡量此推断,其中k=m0,m1,…,mn-1。若所得比值小于设定固定门限,则将所对应的预测模式mk+1加入最终候选预测模式集合S3,最终候选预测模式个数增加1,遍历所有已选定候选预测模式继续进行比较,直至比较完毕,其中固定门限由经验选取;若所得比值大于固定门限,说明给定序列中及其以后的…等均与相差较远,因而mk+1,mk+2,…为最佳预测模式可能性很低,因此保持最终候选预测模式集合S3不变,直接执行步骤7),此时经过此步骤逐次选择,将可能最佳预测模式动态自适应加入最终候选预测模式。此步骤是实现本发明的关键的一步,通过相邻两个代价值的差与两者中值与固定门限的比较,将预测模式从3~10个缩减为1~3个,大大缩小了搜索范围,极大降低了计算量。
步骤7)经过步骤6)候选模式一般剩余1~3个,再经过RDO运算即可极大减少计算复杂度。通过率失真优化RDO代价函数,计算最终候选预测模式集合S3中所有元素的代价值,记为选择中最小值所对应预测模式作为该预测单元的最佳预测模式,为HEVC之后处理做准备。
步骤8)完成当前预测单元的后续处理,对该帧内所有基本处理单元的所有预测单元,均重复步骤1)~步骤8)过程,完成视频信号编码过程。
本发明在HEVC视频压缩标准编码方案基础上,针对帧内最佳预测模式选择部分,提出一种帧内预测模式快速自适应选择方法。本发明不仅仅采用HEVC标准中通过SATD粗略预测快速选择方法降低预测模式选择数量,还在粗略预测模式选择基础上,利用当两种预测模式SATD代价值的差值绝对值达到一定值时,SATD代价值较大的RDO代价值大于SATD代价值较小者的RDO代价值,满足此条件的预测模式才进行复杂的RDO代价值运算,从而实现预测模式自适应选择过程。
本发明的实现还在于:其中步骤6)中令中所对应的预测模式m0作为最终候选预测模式(记为集合S3)初始值;依次计算 序列中相邻两个元素 和的差与两者中值的比值,其中k=m0,m1,…,mn-1;若所得比值小于设定固定门限,则将所对应的预测模式mk+1加入最终候选预测模式集合S3,最终候选预测模式个数增加1,遍历所有已选定候选预测模式继续进行比较,直至比较完毕,其中固定门限由经验选取;若所得比值大于固定门限,则直接执行步骤7);其中( 表示包含于), 和 的比较由以下公式确定,即:
其中αN在当前预测单元大小为64×64,32×32,16×16,8×8或者4×4时,低复杂度情况下所对应的αN分别为:0.188,0.136,0.136,0.136,0.048;高效率情况下所对应的αN分别为:0.08,0.05,0.05,0.05,0.03;其中低复杂度和高效率分别为HEVC标准对视频编码标准的配置方式。
SATD代价值与RDO代价值的相关性,不仅仅体现在RDO代价值最小者对应的预测模式以非常大的可能包含在SATD代价值M个较小值所对应预测模式,还体现在当两种预测模式SATD代价值的差值绝对值达到一定值时,SATD值较大者的RDO代价值大于SATD代价值较小者的RDO代价值,通过固定门限αN自适应调整候选预测模式,达到保持图像压缩性能近似不变,而时间减少的目的。
本发明与现有技术相比具有以下优点:
第一,本发明在HEVC基础上进一步利用基于SATD与RDO代价值相关性,由当两种预测模式SATD代价值的差值绝对值达到一定值时,SATD代价值较大的RDO代价值大于SATD代价值较小者的RDO代价值,自适应将最终需要计算RDO代价值的预测模式由3~10个减少为1~3个,减少了用于计算RDO代价值的预测模式数量,运算时间降低了28%~31%,提高了运算速度;
第二,本发明由于在选择候选预测模式时,能够充分发掘基于SATD代价与RDO代价函数值之间的相关性,最佳预测模式以较大可能包含在自适应选择出的预测模式中,从而保持图像压缩性能基本不变;
第三,本发明实现方法简单,本方案仅需要通过简单排序和比较操作即可实现自适应选择过程,因而由方法改动所带来的运算量的增加相较于帧内预测模式选择运算量可忽略不计。
附图说明
图1为本发明实现视频信号帧内最佳预测模式选择过程的流程图;
图2为本发明图1中进行候选预测模式自适应选择过程的子流程图;
图3为HEVC标准帧内编码框图。
具体实施方式
下面结合附图和实施例对本发明进行详细说明。
实施例1
本发明是一种基于HEVC标准的帧内预测模式快速自适应选择方法,是对现有满足HEVC标准要求的编码方案中帧内预测模式选择技术的改进,能够在性能基本保持不变的情况下,减少28%~31%压缩时间。
参照图1,本发明实现了满足HEVC标准的编码方案的帧内预测模式快速自适应选择,实现方法包括如下步骤:
步骤1),将待处理视频信号中的一帧图像分块作为基本处理单元,基本处理单元进一步划分为64×64,32×32,16×16,8×8或者4×4大小的图像块,选取其中一个图像块作为预测单元。
步骤2),通过基于SATD的代价函数,计算选定预测单元在HEVC标准中35种预测模式下的代价值SatdCost0~SatdCost34。
(2a)用HEVC标准中的35种预测模式对当前预测单元进行预测,得到该预测单元的像素值Px(i,j)。其中,x为0~34;(i,j)表示预测单元像素的坐标其值为0~N-1;N为当前预测单元的大小,其值为64,32,16,8或者4;Px(i,j)为当前预测单元在x预测模式下位于(i,j)处的预测像素值;
(2b)使用HEVC标准中公式计算哈达玛变换绝对差和Satdx粗略估计当前预测单元失真值,计算公式如下:
其中,(i,j)表示预测单元像素的坐标,坐标原点位于左上方,其值为0~N-1;N为当前预测单元的大小,其值为64,32,16,8或者4;I(i,j)为当前预测单元位于i,j处的原始像素值;Px(i,j)为当前预测单元在x预测模式下位于i,j处的预测像素值;Hadamard(PN×N)表示对N×N大小的图像PN×N进行哈达玛变换;
(2c)按照HEVC标准中计算该预测单元在HEVC标准中35种预测模式下的代价值SatdCost0~SatdCost34,计算公式:
SatdCostx=Satdx+λpred×Bpred.
其中,x为HEVC标准中预测单元35种预测模式的序号,其值为0~34;λpred为拉格朗日常数因子,Bpred为HEVC标准中规定的当前预测模式的码流长度,Satdx为步骤(2b)中计算的哈达玛变换绝对差和。
步骤3),对64×64,32×32,16×16,8×8,4×4不同大小的预测单元分别选择SatdCost0~SatdCost34中最小的3,3,3,8,8个预测模式,作为该预测单元的候选预测模式,记为p0~pM-1。
(3a)将当前预测单元的35个哈达玛变换绝对差和SatdCost0~SatdCost34,按照从小到大进行排序,记为
(3b)将中的最小的M个值所对应的预测模式p0~pM-1,作为当前预测单元的候选预测模式,其中对64×64,32×32,16×16,8×8,4×4不同大小预测单元所对应的M依次分别为3,3,3,8,8,如64×64所对应的M为3。
步骤4),若步骤3得到的候选预测模式p0~pM-1不包含当前预测单元相邻的左侧及上方预测单元的预测模式,则将左侧和上方预测单元预测模式加入当前预测单元的候选预测模式;否则,保持p0~pM-1不变,不加入候选预测模式;记为当前预测单元所有候选预测模式为集合S2,S2中的元素候选预测模式为p0~pn-1,其中n为S2中预测模式总数,n=M,M+1或M+2;此时n的范围为3~10。
步骤5),对步骤4得到的候选预测模式p0~pn-1的哈达玛变换绝对差和 从小到大排序,记为 n表示步骤4得到的候选预测模式总数,m0~mn-1表示不同预测模式。
步骤6),以n个候选预测模式基础,从中自适应确定范围更小的候选预测模式作为最终候选预测模式。令中所对应的预测模式m0作为最终候选预测模式(记为集合S3)初始值;依次计算 序列中相邻两个元素和的差与两者中值的比值,其中k=m0,m1,…,mn-1;若所得比值小于设定固定门限,则将所对应的预测模式mk+1加入最终候选预测模式集合S3,最终候选预测模式个数增加1,遍历所有已选定候选预测模式继续进行比较,直至比较完毕,其中固定门限由经验选取;若所得比值大于固定门限,则保持最终候选预测模式集合S3不变,直接执行步骤7)。经过此步骤,预测模式数量可从S2中的3~10个减少为1~3个。
参照图2,本步骤的具体实现如下:
(6a)令中所对应的预测模式m0作为最终候选预测模式(记为集合S3)初始值,此时S3={m0},初始化候选模式索引标记k=0;
(6b)比较 序列中相邻和的差和中值的比值与固定门限αN的大小关系,若 则k增加一个计数值,执行(6b);否则结束,输出k。与门限的比较即为相邻两个代价差值与该相邻两个代价值中值的比值与固定门限的比较,用公式还可以表示为:自适应决定候选预测模式。
其中在低复杂度情况下,当前预测单元大小为64×64时固定门限αN为0.188,预测单元大小为32×32时固定门限αN为0.136,预测单元大小为16×16时固定门限αN为0.136,预测单元大小为8×8时固定门限αN为0.136,预测单元大小为4×4时固定门限αN为0.048;在高效率情况下:当前预测单元大小为64×64时固定门限αN为0.08,预测单元大小为32×32时固定门限αN为0.05,预测单元大小为16×16时固定门限αN为0.05,预测单元大小为8×8时固定门限αN为0.05,预测单元大小为4×4时固定门限αN为0.03。本发明不仅给出了图像压缩过程中帧内最佳预测模式自适应选择的技术方案,还进一步探索,通过实验和研究给出了自适应选择过程中固定门限αN的具体参数,为工程化实现视频压缩编码中帧内最佳预测模式选择提供了技术保证;
(6c)由k可得候选预测模式为m0~mk。
步骤7),对步骤6得到的最终候选预测模式m0~mk,通过率失真优化RDO代价函数,计算最终候选预测模式的代价值选择代价值最小的1个预测模式作为该预测单元的最佳预测模式。
(7a)用预测模式m0~mk对当前预测单元进行预测,得到该预测单元的像素值Px(i,j)。其中,(i,j)表示预测单元像素的坐标;Rx(i,j)为当前预测单元在x预测模式下位于(i,j)处的预测像素值;
(7b)使用HEVC标准中公式计算当前预测单元原始像素和重建像素之间的失真度计算公式如下:
其中,x为m0~mk,(i,j)表示预测单元像素的坐标,坐标原点位于左上方,其值为0~N-1;N为当前预测单元的大小,其值为64,32,16,8或者4;I(i,j)为当前预测单元位于(i,j)处的原始像素值;Rx(i,j)为当前预测单元在x预测模式下位于(i,j)处的重建像素值;
(7c)按照HEVC标准中通过率失真优化RDO代价函数,计算最终候选预测模式的代价值计算公式:
RdCostx=SSEx+λmode×Bmode.
其中,x为当前预测单元候选预测模式的序号,其值为m0~mk,λmode为拉格朗日常数因子;Bmode为当前预测单元预测实际码流量,实际码流是通过如图3的预测残差计算,离散余弦/正弦变换,量化,CABAC熵编码进行实际码流计算得到的;SSEx为(7b)得到的当前预测单元原始像素和重建像素之间的失真度,重建像素是通过如图3的预测残差计算,离散余弦/正弦变换,量化,反量化,反余弦/正弦变换,与预测像素叠加获得的;
(7d)对(7c)得到的最终候选预测模式的代价值从小到大排序,记为其所对应的预测模式为f0~fk;
(7e)f0即为最佳预测模式。
步骤8),进行当前预测单元后续处理过程包括最优变换单元选择。最优变换单元的选择是即将预测单元进一步划分,进行如图3所示的虚线框内所示的RDO运算。RDO计算包括预测,残差计算,离散余弦变换或正弦变换,量化,CABAC熵编码及反量化,反余弦或正弦变换,与预测像素叠加完成重建像素计算,由熵编码与重建像素结果得到RDO代价值,进而选择最优变换单元。之后对所有基本处理单元的所有预测单元,均重复执行步骤1)~步骤8)过程,完成视频所有帧内信号处理。
实施例2
基于HEVC标准的帧内预测模式快速自适应选择方法,同实施例1。
参照图1,本发明实现基于HEVC标准的帧内预测模式快速自适应选择,实现方法包括如下步骤:
步骤1),将待处理视频信号中的一帧图像分块作为基本处理单元,基本处理单元进一步划分为64×64,32×32,16×16,8×8或者4×4大小的图像块,选取其中一个图像块16×16作为预测单元,I(i,j)为当前预测单元位于(i,j)处的原始像素值,(i,j)表示预测单元像素的坐标,坐标原点位于左上方。
步骤2),通过基于SATD的代价函数,计算选定预测单元在HEVC标准中35种预测模式下的代价值SatdCost0~SatdCost34。
(2a)用HEVC标准中的35种预测模式对当前预测单元进行预测,得到该预测单元的像素值P0(i,j),P1(i,j),…,P34(i,j)。其中,(i,j)表示预测单元像素的坐标;Px(i,j)为当前预测单元在x预测模式下位于(i,j)处的预测像素值;
(2b)使用HEVC标准中公式计算哈达玛变换绝对差和Satdx粗略估计当前预测单元失真值,按照如下计算公式可求得Satd0,Satd1,…,Satd34分别为2252,2079,2171,2177,2175,2175,2174,2173,2187,2198,2238,2206,2394,2429,2619,2593,2679,2800,2853,2842,2854,2740,2566,2343,1938,1385,1530,2312,2493,3050,3429,4026,4059,4572,4900。
其中,(i,j)表示预测单元像素的坐标,坐标原点位于左上方,其值为0~N-1;N为当前预测单元的大小,其值为64,32,16,8或者4;I(i,j)为当前预测单元位于i,j处的原始像素值;Px(i,j)为当前预测单元在x预测模式下位于i,j处的预测像素值;Hadamard(PN×N)表示对N×N大小的图像PN×N进行哈达玛变换;
(2c)按照HEVC标准中计算该预测单元在HEVC标准中35种预测模式下的代价值SatdCost0~SatdCost34,由如下计算公式可得SatdCost0~SatdCost34依次分别为2267.22,2086.61,2224.27,2230.27,2228.27,2228.27,2227.27,2226.27,2240.27,2251.27,2291.27,2259.27,2447.27,2482.27,2672.27,2646.27,2732.27,2853.27,2906.27,2895.27,2907.27,2793.27,2619.27,2396.27,1991.27,1438.27,1545.22,2365.27,2546.27,3103.27,3482.27,4079.27,4112.27,4625.27,4953.27;
SatdCostx=Satdx+λpred×Bpred.
其中,x为HEVC标准中预测单元35种预测模式的序号,其值为0~34;λpred为拉格朗日常数因子,其值为7.609756;Bpred为HEVC标准中规定的当前预测模式的码流长度,对预测模式0~34的码流长度依次分别为2,1,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,2,7,7,7,7,7,7,7,7,Satdx为步骤(2b)中计算的哈达玛变换绝对差和。
步骤3),选择SatdCost0~SatdCost34中最小的3个预测模式,作为该预测单元的候选预测模式,记为p0~pM-1。
(3a)将当前预测单元的35个哈达玛变换绝对差和SatdCost0~SatdCost34,按照从小到大进行排序,记为 可知 依次分别为1438.27,1545.22,1991.27,2086.61,2224.27,2226.27,2227.27,2228.27,2228.27,2230.27,2240.27,2251.27,2259.27,2267.22,2291.27,2365.27,2396.27,2447.27,2482.27,2546.27,2619.27,2646.27,2672.27,2732.27,2793.27,2853.27,2895.27,2906.27,2907.27,3103.27,3482.27,4079.27,4625.27,4953.27;
(3b)将 中的最小的3个值 所对应的预测模式p0~p2作为当前预测单元的候选预测模式,记为集合S1,此时S1={25,26,24}。
步骤4),步骤3得到的候选预测模式p0~pM-1不包含当前预测单元相邻的左侧的预测模式1,因此将预测模式1加入候选预测模式S2,此时S2={25,26,24,1};候选预测模式S2不包含候选上方预测单元的预测模式0,因此将预测模式0加入候选预测模式S2,此时S2={25,26,24,1,0},记此时S2中候选预测模式为p0~p4,其值分别为25,26,24,1,0。
步骤5),对步骤4得到的候选预测模式p0~p4的哈达玛变换绝对差和 从小到大排序,记为 可知依次分别为1438.27,1545.22,1991.27,2086.61,2267.22,所对应的预测模式m0~mn-1分别为25,26,24,1,0。
步骤6),令中所对应的预测模式m0作为最终候选预测模式(记为集合S3)初始值;依次计算序列中相邻两个元素和的差与两者中值的比值,其中k=m0,m1,…,m4;若所得比值小于设定固定门限α16,则将所对应的预测模式mk+1加入最终候选预测模式集合S3,最终候选预测模式个数增加1,遍历所有已选定候选预测模式继续进行比较,直至比较完毕,其中固定门限α16由经验选取;若所得比值大于固定门限α16,则保持最终候选预测模式集合S3不变,直接执行步骤7)。可以看出,经过此步骤需要进行RDO代价值运算的预测模式数量由5个降低为了2个,此步骤极大降低了预测模式数量,从而降低压缩编码时间。
参照图2,本步骤的具体实现如下:
(6a)令中所对应的预测模式m0即预测模式25作为最终候选预测模式(记为集合S3)初始值,此时S3={25},初始化候选模式索引标记k=0;
(6b)依次计算 序列中相邻两个元素和的差与两者中值的比值,其中k=m0,m1,…,m4。k=0,时和的差与两者中值的比值为0.072;此时0.072<α16,将所对应的预测模式m1,即26加入S3,此时S3={25,26};k增加一个计数值,继续重复此步骤,k=1时和的差与两者中值的比值为0.252;此时0.252>α16,保持S3不变,直接进入步骤7)。
其中当前预测单元大小为16×16,HEVC配置文件为低复杂度情况下α16=0.136。(6c)由k可得候选预测模式为m0~m1,其值依次分别为25,26。
步骤7),对步骤6得到的最终候选预测模式m0~m1,通过率失真优化RDO代价函数,计算最终候选预测模式的代价值选择代价值最小的1个预测模式作为该预测单元的最佳预测模式。
(7a)用预测模式m0~m1对当前预测单元进行预测,求残差,DCT变换,量化,DCT反变换,与预测像素叠加得到该预测单元的重建像素Rx(i,j)。其中,(i,j)表示预测单元像素的坐标;
(7b)使用HEVC标准中公式计算当前预测单元在当前预测模式下原始像素和重建像素之间的失真度按照如下计算公式计算,可知依次分别为3143,2518,
其中,(i,j)表示预测单元像素的坐标,坐标原点位于左上方,其值为0~N-1;N为当前预测单元的大小,其值为64,32,16,8或者4;I(i,j)为当前预测单元位于(i,j)处的原始像素值;Rx(i,j)为当前预测单元在x预测模式下位于(i,j)处的预测像素值;
(7c)按照HEVC标准中通过率失真优化RDO代价函数,计算最终候选预测模式的代价值按照如下计算公式,可知依次分别为5633,4719,
RdCostx=SSEx+λmode×Bmode.
其中,x为当前预测单元候选预测模式的序号,其值为m0~m1,λmode为拉格朗日常数因子,其值为57.91;Bmode为当前预测单元预测码流量,由实际编码过程可求得当预测模式为m0~m1时,Bmode依次分别为43,38;SSEx为(7b)得到的当前预测单元原始像素和重建像素之间的失真度;
(7d)对(7c)得到的最终候选预测模式的代价值从小到大排序,记为可知依次分别为4719,5633;其所对应的预测模式为f0~f1,其值分别为26,25;
(7e)f0即26,为当前预测单元的最佳预测模式。
步骤8),同实施例1步骤8。
如下表格为采用本发明,在实际视频测试序列编码配置分别为低复杂度和高效率情况下,视频压缩性能变化(BDBR-Y)和时间减少量。
从表格中可以看出视频序列压缩的性能BDBR-Y的波动范围仅仅在0.9%~2.4%之间,由本方案带来的性能损失可忽略不计;还可以看出由本方案带来的时间减少量最低减少了26.4%,最高可达31.3%,因此本方案极大减少了压缩编码时间。
综上所述,本发明的基于HEVC标准的帧内预测模式快速自适应选择方法,其实现包括:对当前预测单元进行SATD粗略选择;加入当前单元左侧和上方单元的预测模式;候选预测模式SATD代价值从小到大排序;比较相邻两个代价差值与代价值中值的比值与固定门限对比,自适应决定候选预测模式;选取最终候选预测模式的RDO代价值最小值对应的预测模式作为最佳预测模式。本发明主要解决现有HEVC标准的帧内模式选择计算复杂度高的问题。本发明提出的帧内预测模式选择方案简单,在保持图像压缩性能近似不变的同时,将图像压缩时间缩短了25%~31%,为HEVC标准的实时实现提供了技术基础,广泛应用于所有基于HEVC标准的视频压缩编码端中帧内最佳预测模式选择过程。
Claims (1)
1.一种基于HEVC标准的帧内预测模式快速自适应选择方法,其特征在于:包括如下步骤:
步骤1)将待处理视频信号中的一帧图像分块作为基本处理单元,基本处理单元进一步划分为64×64,32×32,16×16,8×8或者4×4大小的图像块,选取其中一个图像块作为预测单元;
步骤2)通过基于SATD的代价函数,计算选定预测单元在HEVC标准中35种预测模式下的代价值SatdCost0~SatdCost34,将35种预测模式记为集合S0;
步骤3)选取35种预测模式的SATD代价值SatdCost0~SatdCost34中M个较小值所对应预测模式作为当前预测单元的候选预测模式,记为集合S1;
步骤4)将当前预测单元的候选模式集合S2初始化为S1,若当前预测单元相邻左侧及上方单元的预测模式不包含在当前预测单元选定的M个候选预测模式S2之中,则将其加入当前预测单元选定的M个候选预测模式S2中;否则,保持当前预测单元选定的M个候选预测模式S2不变;集合S2元素总数为n;
步骤5)对当前预测单元已选定候选预测模式集合S2中的所有n个预测模式的SATD代价值从小到大排序,记排序后的SATD代价值为所对应的预测模式编号依次为m0~mn-1;
步骤6)令中所对应的预测模式m0作为最终候选预测模式初始值,将最终候选预测模式集合记为S3;依次计算序列中相邻两个元素和的差与两者中值的比值,其中k=0,1,...,n-2,若所得比值小于设定固定门限αN,则将所对应的预测模式mk+1加入最终候选预测模式集合S3,最终候选预测模式个数增加1,遍历所有已选定候选预测模式继续进行比较,直至比较完毕,其中固定门限αN由经验选取,在低复杂度情况下,当前预测单元大小为64×64时固定门限αN为0.188,预测单元大小为32×32时固定门限αN为0.136,预测单元大小为16×16时固定门限αN为0.136,预测单元大小为8×8时固定门限αN为0.136,预测单元大小为4×4时固定门限αN为0.048;在高效率情况下:当前预测单元大小为64×64时固定门限αN为0.08,预测单元大小为32×32时固定门限αN为0.05,预测单元大小为16×16时固定门限αN为0.05,预测单元大小为8×8时固定门限αN为0.05,预测单元大小为4×4时固定门限αN为0.03;若所得比值大于固定门限αN,则保持最终候选预测模式集合S3不变,直接执行步骤7);
步骤7)通过率失真优化RDO代价函数,计算最终候选预测模式集合S3中所有元素的代价值,记为选择中最小值所对应预测模式作为该预测单元的最佳预测模式;
步骤8)完成当前预测单元的后续处理,对该帧内所有基本处理单元的所有预测单元,均重复执行步骤1)~步骤8)过程,完成视频所有帧内图像编码过程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310192185.6A CN103327325B (zh) | 2013-05-13 | 2013-05-13 | 基于hevc标准的帧内预测模式快速自适应选择方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310192185.6A CN103327325B (zh) | 2013-05-13 | 2013-05-13 | 基于hevc标准的帧内预测模式快速自适应选择方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103327325A CN103327325A (zh) | 2013-09-25 |
CN103327325B true CN103327325B (zh) | 2016-05-25 |
Family
ID=49195823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310192185.6A Expired - Fee Related CN103327325B (zh) | 2013-05-13 | 2013-05-13 | 基于hevc标准的帧内预测模式快速自适应选择方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103327325B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104581181B (zh) * | 2013-10-11 | 2017-12-05 | 中国科学院深圳先进技术研究院 | 一种基于备选模式列表优化的帧内编码方法 |
CN103702122B (zh) * | 2013-12-18 | 2017-07-21 | 华为技术有限公司 | 编码模式选择方法、装置及编码器 |
CN103763570B (zh) * | 2014-01-20 | 2017-02-01 | 华侨大学 | 一种基于satd的hevc快速帧内预测方法 |
CN104954788B (zh) * | 2014-03-27 | 2018-09-04 | 浙江大华技术股份有限公司 | Hevc帧内预测模式选择方法及装置 |
CN103997645B (zh) * | 2014-04-29 | 2017-02-15 | 长沙理工大学 | 一种快速的hevc帧内编码单元和模式决策方法 |
CN103929652B (zh) * | 2014-04-30 | 2017-04-19 | 西安电子科技大学 | 视频标准中基于自回归模型的帧内预测快速模式选择方法 |
CN104168480B (zh) * | 2014-09-09 | 2017-07-04 | 西安电子科技大学 | 基于hevc标准的帧内预测编码模式快速选择方法 |
CN104796701B (zh) * | 2015-03-27 | 2018-02-16 | 北京君正集成电路股份有限公司 | 基于hevc的预测模式确定方法及装置 |
CN106162176A (zh) * | 2016-10-09 | 2016-11-23 | 北京数码视讯科技股份有限公司 | 帧内预测模式选择方法和装置 |
CN108696749A (zh) * | 2017-04-11 | 2018-10-23 | 北京君正集成电路股份有限公司 | 一种提高图像编码质量的模式选择方法及装置 |
CN110049339B (zh) * | 2018-01-16 | 2023-02-17 | 腾讯科技(深圳)有限公司 | 图像编码中的预测方向选取方法、装置和存储介质 |
WO2020019316A1 (zh) * | 2018-07-27 | 2020-01-30 | 深圳市大疆创新科技有限公司 | 帧内预测模式搜索方法及装置、视频编码方法及装置以及记录介质 |
CN113347415A (zh) * | 2020-03-02 | 2021-09-03 | 阿里巴巴集团控股有限公司 | 编码模式确定方法和装置 |
CN112565752B (zh) * | 2020-11-13 | 2023-04-14 | 北京百度网讯科技有限公司 | 对视频数据进行编码的方法、装置、设备和介质 |
CN113038132B (zh) * | 2021-03-18 | 2023-01-20 | 北京奇艺世纪科技有限公司 | 一种编码单元cu的预测模式确定方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1753500A (zh) * | 2005-10-31 | 2006-03-29 | 连展科技(天津)有限公司 | 一种基于h.264/avc标准的帧图像的帧内预测模式选择方法 |
CN101247525A (zh) * | 2008-03-24 | 2008-08-20 | 北京邮电大学 | 一种提高图像帧内编码速率的方法 |
CN101977316A (zh) * | 2010-10-27 | 2011-02-16 | 无锡中星微电子有限公司 | 一种可伸缩编码方法 |
CN102740077A (zh) * | 2012-07-04 | 2012-10-17 | 西安电子科技大学 | 基于h.264/avc标准的帧内预测模式选择方法 |
CN102843559A (zh) * | 2012-09-12 | 2012-12-26 | 清华大学 | 基于纹理特性的hevc帧内预测模式的快速选择方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7961783B2 (en) * | 2005-07-07 | 2011-06-14 | Mediatek Incorporation | Methods and systems for rate control in video encoder |
KR100727969B1 (ko) * | 2005-08-27 | 2007-06-14 | 삼성전자주식회사 | 영상의 부호화 및 복호화 장치와, 그 방법, 및 이를수행하기 위한 프로그램이 기록된 기록 매체 |
KR20090095316A (ko) * | 2008-03-05 | 2009-09-09 | 삼성전자주식회사 | 영상 인트라 예측 방법 및 장치 |
-
2013
- 2013-05-13 CN CN201310192185.6A patent/CN103327325B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1753500A (zh) * | 2005-10-31 | 2006-03-29 | 连展科技(天津)有限公司 | 一种基于h.264/avc标准的帧图像的帧内预测模式选择方法 |
CN101247525A (zh) * | 2008-03-24 | 2008-08-20 | 北京邮电大学 | 一种提高图像帧内编码速率的方法 |
CN101977316A (zh) * | 2010-10-27 | 2011-02-16 | 无锡中星微电子有限公司 | 一种可伸缩编码方法 |
CN102740077A (zh) * | 2012-07-04 | 2012-10-17 | 西安电子科技大学 | 基于h.264/avc标准的帧内预测模式选择方法 |
CN102843559A (zh) * | 2012-09-12 | 2012-12-26 | 清华大学 | 基于纹理特性的hevc帧内预测模式的快速选择方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN103327325A (zh) | 2013-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103327325B (zh) | 基于hevc标准的帧内预测模式快速自适应选择方法 | |
CN103873861B (zh) | 一种用于hevc的编码模式选择方法 | |
CN105049850B (zh) | 基于感兴趣区域的hevc码率控制方法 | |
CN103248895B (zh) | 一种用于hevc帧内编码的快速模式估计方法 | |
CN102932642B (zh) | 一种帧间编码快速模式选择方法 | |
CN102740077B (zh) | 基于h.264/avc标准的帧内预测模式选择方法 | |
CN104320657B (zh) | Hevc无损视频编码的预测模式选择方法及相应的编码方法 | |
CN108989802B (zh) | 一种利用帧间关系的hevc视频流的质量估计方法及系统 | |
CN103517069A (zh) | 一种基于纹理分析的hevc帧内预测快速模式选择方法 | |
CN101860748A (zh) | 基于分布式视频编码的边信息生成系统及方法 | |
CN106303521B (zh) | 一种基于感知敏感度的hevc率失真优化方法 | |
CN103596004A (zh) | Hevc中基于数学统计和分类训练的帧内预测方法及装置 | |
CN102291582A (zh) | 一种基于运动补偿精化的分布式视频编码方法 | |
CN113301347A (zh) | 一种hevc高清视频编码的优化方法 | |
CN104702959B (zh) | 一种视频编码的帧内预测方法及系统 | |
CN107864380A (zh) | 基于dct的3d‑hevc快速帧内预测决策方法 | |
CN107318016A (zh) | 一种基于零块分布的hevc帧间预测模式快速判定方法 | |
CN104581152A (zh) | 一种hevc帧内预测模式选择加速方法 | |
CN102364950A (zh) | 基于h.264/avc标准的帧内预测模式快速选择方法及装置 | |
CN102595132A (zh) | 一种应用于无线传感器网络的分布式视频编解码方法 | |
CN102065293B (zh) | 一种基于空间域预测编码的图像压缩方法 | |
CN109688411B (zh) | 一种视频编码率失真代价估计方法和装置 | |
CN106060555A (zh) | 一种基于多核处理器的编码器 | |
CN102801982A (zh) | 一种应用于视频压缩且基于块积分的快速运动估计方法 | |
CN105100799A (zh) | 一种减少hevc编码器中帧内编码时延的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160525 Termination date: 20210513 |