CN103327325B

CN103327325B - 基于hevc标准的帧内预测模式快速自适应选择方法

Info

Publication number: CN103327325B
Application number: CN201310192185.6A
Authority: CN
Inventors: 李甫; 宋晓丹; 石光明; 张犁; 焦丹丹; 樊春晓
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2013-05-13
Filing date: 2013-05-13
Publication date: 2016-05-25
Anticipated expiration: 2033-05-13
Also published as: CN103327325A

Abstract

本发明公开一种基于HEVC标准的帧内预测模式快速自适应选择方法，其实现包括：对当前预测单元进行SATD粗略选择；加入当前单元左侧和上方单元的预测模式；候选预测模式SATD代价值从小到大排序；比较相邻两个代价差值与代价值中值的比值与固定门限对比，自适应决定候选预测模式；选取最终候选预测模式的RDO代价值最小值对应的预测模式作为最佳预测模式。本发明主要解决现有HEVC标准的帧内模式选择计算复杂度高的问题。本发明提出的帧内预测模式选择方案简单，在保持图像压缩性能近似不变的同时，将图像压缩时间缩短了25％～31％，为HEVC标准的实时实现提供了技术基础，广泛应用于所有基于HEVC标准的视频压缩编码端中帧内最佳预测模式选择过程。

Description

基于HEVC标准的帧内预测模式快速自适应选择方法

技术领域

本发明属于数字信号处理技术领域，涉及图像视频压缩编码的实现方法，具体是一种基于HEVC标准的帧内预测模式快速自适应选择方法，用于HEVC标准中对图像的帧内最佳预测模式选择过程。

背景技术

计算机及网络技术对图像及视频的处理和传输依赖于视频压缩。视频信号数字化后带宽通常在20MB/秒以上，因此给计算机存储和处理以及网络传输带来极大挑战。近年来随着图像和视频获取终端的不断发展，图像和视频清晰度、分辨率也逐步上升。传统的H.264/AVC等视频压缩方案已经不能满足人们对高清晰度、高分辨率视频在网络以及移动终端方面应用的需求，下一代视频压缩编码标准应运而生。2010年4月在德国德雷斯顿召开了JCT-VC(JointCollaborativeTeamonVideoCoding)第一次会议，确定了新一代视频压缩编码标准的名称：HEVC(HighEfficiencyVideoCoding)，并将于2013年6月发布HEVC标准终稿。HEVC旨在保证视频主观质量不变的情况下，压缩效率提高一倍，极大降低传输视频信号带宽。HEVC标准的制定，为高清视频解码终端标准化提供了技术依据，推动视频在包括多媒体信号存储与传输等方面的广泛应用，满足人们对高清视频的需求。

HEVC依然延续H.26x的预测(帧内和帧间)，残差，变换和熵编码混合编码框架。与H.26x不同的是，为了提高压缩效率，HEVC采用了更灵活的编码单元；通过四叉树分解确定最佳块结构；帧内预测模式由H.264的9种增加为35种。灵活高效的编码框架使得编码和计算复杂度急剧上升，给HEVC实时实现带来极大困难。因此，需要在保证性能基本不变情况下，降低HEVC时间和计算复杂度。

帧内预测主要用于消除空间冗余。在HEVC中，需要遍历大小为64×64，32×32，16×16，8×8，4×4预测单元，在每种预测单元下遍历35种预测模式确定最佳预测模式。帧内预测首先对当前预测单元遍历35种预测模式，以基于SATD(HadamardtransformedSumofAbsoluteDifference)的代价函数为准则，将代价函数SATD计算结果简称SATD代价值，粗略选出3～10种预测模式作为精细预测的候选预测模式。精细预测过程中首先在当前预测模式根据参考元素估计当前预测单元像素值，进行残差计算，离散余弦或者正弦变换，量化，CABAC(Context-basedAdaptiveBinaryArithmeticCoding)熵编码，反量化，反余弦或者反正弦变换，重建当前编码单元。由重建单元计算失真及熵编码码流，根据RDO(RateDistortionOptions)率失真代价函数(简称RDO代价值)计算代价值，选择代价值最小的模式作为最优预测模式。

RDO代价值计算过程非常复杂，对数量高达35中的帧内预测模式均需进行RDO代价值计算，因而导致时间复杂度高，因此需要减少进行RDO代价值运算的预测模式数量。虽然SATD代价值粗略选取过程一定程度降低了HEVC编码和计算复杂度，但是预测模式选择的编码和计算过程仍然比较复杂，不能满足人们对视频信号的实时需求。HEVC即将作为下一代视频压缩编码标准，其复杂的帧内预测模式选择过程极大限制了在实际生产生活中的应用，因而需要进一步探索帧内预测模式选择过程。

目前为止，已提出的快速模式选择方法主要有以下几种：

清华大学提出的“基于纹理特性的HEVC帧内预测模式的快速选择方法及装置”，专利申请号为201210337831，公开一种基于纹理特性的HEVC帧内预测模式的快速选择方法及装置，通过确定待预测单元PU的纹理方向统计直方图，当所述PU具有强纹理方向且与任一相邻块的预测方向匹配时，则将所述强纹理方向作为最终预测模式方向。该发明在保证编码质量的同时，较为有效降低了模式选择计算时间，但是由于该发明使用了基于纹理的帧内预测模式选择，因此对于纹理方向复杂，纹理特征不够突出图像不能做出有效判断，反而会由于算法本身的复杂计算过程增加运算量，不能有效降低编码时间。

北方工业大学提出的“用于HEVC的自适应快速帧内预测模式决策”，专利申请号为201210138816.1，公开一种用于HEVC的自适应帧内预测模式决策方法，在实施RMD之后加入了基于纹理的附加模式选择过程，减少候选预测模式数量为2～5个。该发明减少了候选预测模式，一定程度上降低了复杂度，减少了编码时间，但是由于纹理方向计算过程需要计算每个元素的方向矢量及幅度，额外增加了预测模式选择计算时间，同时对于纹理方向不突出图像，会导致判断错误，降低了编码性能。

北方工业大学提出的“用于HEVC的基于方向矢量的帧内预测模式决策”，专利申请号为201210138806.8，公开一种用于HEVC的帧内预测模式决策过程，首先利用方向矢量幅度与角度对预测模式进行粗略选择，由方向矢量确定的2个预测方向与DC及planar模式，通过计算方向矢量得到最佳预测模式。该发明最终选出4个预测模式进行RDO代价值运算，较为有效降低了编码时间，但是时间降低不明显；由于当图像块没有明显方向特性，不能做出有效判断，反而会增加运算量；同时在方向矢量计算过程中利用了统计特性，当图像块比较小时方向矢量统计图特征不明显，从而导致方向判断错误，降低图像压缩性能。

综上所述，上述三种技术均利用图像块的纹理方向特征判断最佳预测模式，因此均存在当图像块纹理方向特征不明显时，导致方向判断错误，降低图像压缩性能；在生成直方图时利用了图像的统计特性，当图像块小时，统计特征不明显；纹理方向计算过程比较复杂，还增加了额外的计算量。

发明内容

本发明的目的在于针对上述已有技术中帧内预测模式选择过程依然复杂，帧内预测模式选择方案复杂及时间复杂度高的不足，提出一种帧内预测模式选择简单，在保持压缩过程中视频图像压缩性能基本不变同时，提高运算速度，处理时间大为缩短的基于HEVC标准的帧内预测模式快速自适应选择方法，以降低预测模式选择的计算复杂度，满足HEVC帧内编码的高性能快速要求。

实现本发明目的技术思路是：本发明针对HEVC编码方案帧内最佳预测模式选择部分，因此保持HEVC编码方案其他部分不变。在帧内预测最佳预测模式选择过程中，根据预测模式SATD代价值自适应决定需要计算RDO代价值的预测模式数量，以提高满足HEVC标准的编码方案的帧内编码的速度。

本发明是一种基于HEVC标准的帧内预测模式快速自适应选择方法，是针对视频图像压缩过程中，帧内最佳预测模式的选择过程，具体步骤包括如下：

步骤1)视频信号由多帧图像组成，一帧图像作为整体处理难度比较大，为了降低处理难度，将待处理视频信号中的一帧图像分块作为基本处理单元，基本处理单元进一步划分为64×64，32×32，16×16，8×8或者4×4大小的图像块，选取其中一个图像块作为预测单元。

步骤2)压缩编码在降低图像数据量同时会导致图像质量下降，如模糊等，而用于平衡图像质量损失和数据量的RDO代价计算过程非常复杂。为了降低计算复杂度，HEVC利用决定预测模式最终选择的RDO代价值与SATD代价值相关性，减少计算复杂度。通过基于SATD的代价函数，计算选定预测单元在HEVC标准中35种预测模式下的代价值SatdCost₀～SatdCost₃₄，将HEVC标准中的35种预测模式记为集合S₀。

步骤3)选取35种预测模式的SATD代价值SatdCost₀～SatdCost₃₄中M个较小值所对应预测模式作为当前预测单元的候选预测模式，记为集合S₁( 表示包含于)。

对64×64，32×32，16×16，8×8，4×4的不同大小的预测单元中35种预测模式SATD值SatdCost₀～SatdCost₃₄中分别选取最小3，3，3，8，8个值所对应预测模式。

步骤4)由于图像总是具有一定方向，当前预测单元预测模式与左侧和上方单元的预测模式有很大相关性，为了降低由SATD粗略选择带来的性能损失，候选模式中需要考虑左侧及上方单元的预测模式。若当前预测单元相邻左侧及上方单元(指原图像空间位置)的预测模式不包含在当前预测单元选定的M个候选预测模式之中，即左侧及上方单元选定的预测模式与当前预测单元选定的M个预测模式不同。则将其加入当前预测单元选定的M个候选预测模式中，候选模式个数变化为M+1或者M+2；否则，保持当前预测单元选定的M个候选预测模式不变；将当前预测单元此时选定的候选预测模式集合记为集合S₂元素总数为n。

步骤5)为后续进一步利用SATD与RDO代价值之间相关性，对当前预测单元已选定候选预测模式集合S₂中的所有n个预测模式的SATD代价值从小到大排序，记排序后的SATD代价值为所对应的预测模式依次记为m₀～m_n-1。

步骤6)虽然上述步骤4)粗略选择过程利用了SATD与RDO相关性，降低了计算复杂度，但是在所得候选预测模式的SATD与RDO仍然有很强的相关性。因此进一步探索SATD与RDO的相关性。

SATD最小代价值所对应的预测模式为最佳预测模式可能性最大，因此令所对应的预测模式m₀作为最终候选预测模式(记为集合S₃)初始值；当两个预测模式SATD代价值相差很大时，可推断较大SATD代价值所对应RDO代价值不会超过较大SATD代价值对应的RDO代价值，因此依次计算

{SatdCost}_{m_{0}}, {SatdCost}_{m_{1}}, . . ., {SatdCost}_{m_{n - 1}}

序列中相邻两个元素

{SatdCost}_{m_{k + 1}}

和的差与两者中值的比值，该比值可用于衡量此推断，其中k＝m₀，m₁，…，m_n-1。若所得比值小于设定固定门限，则将所对应的预测模式m_k+1加入最终候选预测模式集合S₃，最终候选预测模式个数增加1，遍历所有已选定候选预测模式继续进行比较，直至比较完毕，其中固定门限由经验选取；若所得比值大于固定门限，说明给定序列中及其以后的…等均与相差较远，因而m_k+1，m_k+2，…为最佳预测模式可能性很低，因此保持最终候选预测模式集合S₃不变，直接执行步骤7)，此时经过此步骤逐次选择，将可能最佳预测模式动态自适应加入最终候选预测模式。此步骤是实现本发明的关键的一步，通过相邻两个代价值的差与两者中值与固定门限的比较，将预测模式从3～10个缩减为1～3个，大大缩小了搜索范围，极大降低了计算量。

步骤7)经过步骤6)候选模式一般剩余1～3个，再经过RDO运算即可极大减少计算复杂度。通过率失真优化RDO代价函数，计算最终候选预测模式集合S₃中所有元素的代价值，记为选择中最小值所对应预测模式作为该预测单元的最佳预测模式，为HEVC之后处理做准备。

步骤8)完成当前预测单元的后续处理，对该帧内所有基本处理单元的所有预测单元，均重复步骤1)～步骤8)过程，完成视频信号编码过程。

本发明在HEVC视频压缩标准编码方案基础上，针对帧内最佳预测模式选择部分，提出一种帧内预测模式快速自适应选择方法。本发明不仅仅采用HEVC标准中通过SATD粗略预测快速选择方法降低预测模式选择数量，还在粗略预测模式选择基础上，利用当两种预测模式SATD代价值的差值绝对值达到一定值时，SATD代价值较大的RDO代价值大于SATD代价值较小者的RDO代价值，满足此条件的预测模式才进行复杂的RDO代价值运算，从而实现预测模式自适应选择过程。

本发明的实现还在于：其中步骤6)中令中所对应的预测模式m₀作为最终候选预测模式(记为集合S₃)初始值；依次计算

{SatdCost}_{m_{0}}, {SatdCost}_{m_{1}}, . . ., {SatdCost}_{m_{n - 1}}

序列中相邻两个元素

{SatdCost}_{m_{k + 1}}

和的差与两者中值的比值，其中k＝m₀，m₁，…，m_n-1；若所得比值小于设定固定门限，则将所对应的预测模式m_k+1加入最终候选预测模式集合S₃，最终候选预测模式个数增加1，遍历所有已选定候选预测模式继续进行比较，直至比较完毕，其中固定门限由经验选取；若所得比值大于固定门限，则直接执行步骤7)；其中(

S_{3} &Subset; S_{2} &Subset; S_{0},

表示包含于)，

{SatdCost}_{m_{k + 1}}

和

{SatdCost}_{m_{k}}

的比较由以下公式确定，即：

{SatdCost}_{m_{k + 1}} - {SatdCost}_{m_{k}} \leq α_{N} ({SatdCost}_{m_{k + 1}} + {SatdCost}_{m_{k}}) / 2 .

其中α_N在当前预测单元大小为64×64，32×32，16×16，8×8或者4×4时，低复杂度情况下所对应的α_N分别为：0.188，0.136，0.136，0.136，0.048；高效率情况下所对应的α_N分别为：0.08，0.05，0.05，0.05，0.03；其中低复杂度和高效率分别为HEVC标准对视频编码标准的配置方式。

SATD代价值与RDO代价值的相关性，不仅仅体现在RDO代价值最小者对应的预测模式以非常大的可能包含在SATD代价值M个较小值所对应预测模式，还体现在当两种预测模式SATD代价值的差值绝对值达到一定值时，SATD值较大者的RDO代价值大于SATD代价值较小者的RDO代价值，通过固定门限α_N自适应调整候选预测模式，达到保持图像压缩性能近似不变，而时间减少的目的。

本发明与现有技术相比具有以下优点：

第一，本发明在HEVC基础上进一步利用基于SATD与RDO代价值相关性，由当两种预测模式SATD代价值的差值绝对值达到一定值时，SATD代价值较大的RDO代价值大于SATD代价值较小者的RDO代价值，自适应将最终需要计算RDO代价值的预测模式由3～10个减少为1～3个，减少了用于计算RDO代价值的预测模式数量，运算时间降低了28％～31％，提高了运算速度；

第二，本发明由于在选择候选预测模式时，能够充分发掘基于SATD代价与RDO代价函数值之间的相关性，最佳预测模式以较大可能包含在自适应选择出的预测模式中，从而保持图像压缩性能基本不变；

第三，本发明实现方法简单，本方案仅需要通过简单排序和比较操作即可实现自适应选择过程，因而由方法改动所带来的运算量的增加相较于帧内预测模式选择运算量可忽略不计。

附图说明

图1为本发明实现视频信号帧内最佳预测模式选择过程的流程图；

图2为本发明图1中进行候选预测模式自适应选择过程的子流程图；

图3为HEVC标准帧内编码框图。

具体实施方式

下面结合附图和实施例对本发明进行详细说明。

实施例1

本发明是一种基于HEVC标准的帧内预测模式快速自适应选择方法，是对现有满足HEVC标准要求的编码方案中帧内预测模式选择技术的改进，能够在性能基本保持不变的情况下，减少28％～31％压缩时间。

参照图1，本发明实现了满足HEVC标准的编码方案的帧内预测模式快速自适应选择，实现方法包括如下步骤：

步骤1)，将待处理视频信号中的一帧图像分块作为基本处理单元，基本处理单元进一步划分为64×64，32×32，16×16，8×8或者4×4大小的图像块，选取其中一个图像块作为预测单元。

步骤2)，通过基于SATD的代价函数，计算选定预测单元在HEVC标准中35种预测模式下的代价值SatdCost₀～SatdCost₃₄。

(2a)用HEVC标准中的35种预测模式对当前预测单元进行预测，得到该预测单元的像素值P_x(i，j)。其中，x为0～34；(i，j)表示预测单元像素的坐标其值为0～N-1；N为当前预测单元的大小，其值为64，32，16，8或者4；P_x(i，j)为当前预测单元在x预测模式下位于(i，j)处的预测像素值；

(2b)使用HEVC标准中公式计算哈达玛变换绝对差和Satd_x粗略估计当前预测单元失真值，计算公式如下：

{Satd}_{x} = Σ_{i, j = 0}^{N - 1} | Hadamard (I (i, j) - P_{x} (i, j)) | .

其中，(i，j)表示预测单元像素的坐标，坐标原点位于左上方，其值为0～N-1；N为当前预测单元的大小，其值为64，32，16，8或者4；I(i，j)为当前预测单元位于i，j处的原始像素值；P_x(i，j)为当前预测单元在x预测模式下位于i，j处的预测像素值；Hadamard(P_N×N)表示对N×N大小的图像P_N×N进行哈达玛变换；

(2c)按照HEVC标准中计算该预测单元在HEVC标准中35种预测模式下的代价值SatdCost₀～SatdCost₃₄，计算公式：

SatdCost_x＝Satd_x+λ_pred×B_pred.

其中，x为HEVC标准中预测单元35种预测模式的序号，其值为0～34；λ_pred为拉格朗日常数因子，B_pred为HEVC标准中规定的当前预测模式的码流长度，Satd_x为步骤(2b)中计算的哈达玛变换绝对差和。

步骤3)，对64×64，32×32，16×16，8×8，4×4不同大小的预测单元分别选择SatdCost₀～SatdCost₃₄中最小的3，3，3，8，8个预测模式，作为该预测单元的候选预测模式，记为p₀～p_M-1。

(3a)将当前预测单元的35个哈达玛变换绝对差和SatdCost₀～SatdCost₃₄，按照从小到大进行排序，记为

(3b)将中的最小的M个值所对应的预测模式p₀～p_M-1，作为当前预测单元的候选预测模式，其中对64×64，32×32，16×16，8×8，4×4不同大小预测单元所对应的M依次分别为3，3，3，8，8，如64×64所对应的M为3。

步骤4)，若步骤3得到的候选预测模式p₀～p_M-1不包含当前预测单元相邻的左侧及上方预测单元的预测模式，则将左侧和上方预测单元预测模式加入当前预测单元的候选预测模式；否则，保持p₀～p_M-1不变，不加入候选预测模式；记为当前预测单元所有候选预测模式为集合S₂，S₂中的元素候选预测模式为p₀～p_n-1，其中n为S₂中预测模式总数，n＝M，M+1或M+2；此时n的范围为3～10。

步骤5)，对步骤4得到的候选预测模式p₀～p_n-1的哈达玛变换绝对差和

{SatdCost}_{p_{0}} ~ {SatdCost}_{p_{n - 1}}

从小到大排序，记为

{SatdCost}_{m_{0}} ~ {SatdCost}_{m_{n - 1}},

n表示步骤4得到的候选预测模式总数，m₀～m_n-1表示不同预测模式。

步骤6)，以n个候选预测模式基础，从中自适应确定范围更小的候选预测模式作为最终候选预测模式。令中所对应的预测模式m₀作为最终候选预测模式(记为集合S₃)初始值；依次计算序列中相邻两个元素和的差与两者中值的比值，其中k＝m₀，m₁，…，m_n-1；若所得比值小于设定固定门限，则将所对应的预测模式m_k+1加入最终候选预测模式集合S₃，最终候选预测模式个数增加1，遍历所有已选定候选预测模式继续进行比较，直至比较完毕，其中固定门限由经验选取；若所得比值大于固定门限，则保持最终候选预测模式集合S₃不变，直接执行步骤7)。经过此步骤，预测模式数量可从S₂中的3～10个减少为1～3个。

参照图2，本步骤的具体实现如下：

(6a)令中所对应的预测模式m₀作为最终候选预测模式(记为集合S₃)初始值，此时S₃＝{m₀}，初始化候选模式索引标记k＝0；

(6b)比较

{SatdCost}_{m_{0}}, {SatdCost}_{m_{1}}, . . ., {SatdCost}_{m_{n - 1}}

序列中相邻和的差和中值的比值与固定门限α_N的大小关系，若

{SatdCost}_{m_{k + 1}} - {SatdCost}_{m_{k}} \leq α_{N} ({SatdCost}_{m_{k + 1}} + {SatdCost}_{m_{k}}) / 2,

则k增加一个计数值，执行(6b)；否则结束，输出k。与门限的比较即为相邻两个代价差值与该相邻两个代价值中值的比值与固定门限的比较，用公式还可以表示为：自适应决定候选预测模式。

其中在低复杂度情况下，当前预测单元大小为64×64时固定门限α_N为0.188，预测单元大小为32×32时固定门限α_N为0.136，预测单元大小为16×16时固定门限α_N为0.136，预测单元大小为8×8时固定门限α_N为0.136，预测单元大小为4×4时固定门限α_N为0.048；在高效率情况下：当前预测单元大小为64×64时固定门限α_N为0.08，预测单元大小为32×32时固定门限α_N为0.05，预测单元大小为16×16时固定门限α_N为0.05，预测单元大小为8×8时固定门限α_N为0.05，预测单元大小为4×4时固定门限α_N为0.03。本发明不仅给出了图像压缩过程中帧内最佳预测模式自适应选择的技术方案，还进一步探索，通过实验和研究给出了自适应选择过程中固定门限α_N的具体参数，为工程化实现视频压缩编码中帧内最佳预测模式选择提供了技术保证；

(6c)由k可得候选预测模式为m₀～m_k。

步骤7)，对步骤6得到的最终候选预测模式m₀～m_k，通过率失真优化RDO代价函数，计算最终候选预测模式的代价值选择代价值最小的1个预测模式作为该预测单元的最佳预测模式。

(7a)用预测模式m₀～m_k对当前预测单元进行预测，得到该预测单元的像素值P_x(i，j)。其中，(i，j)表示预测单元像素的坐标；R_x(i，j)为当前预测单元在x预测模式下位于(i，j)处的预测像素值；

(7b)使用HEVC标准中公式计算当前预测单元原始像素和重建像素之间的失真度计算公式如下：

{SSE}_{x} = Σ_{i, j}^{N - 1} {| I (i, j) - R_{x} (i, j) |}^{2} .

其中，x为m₀～m_k，(i，j)表示预测单元像素的坐标，坐标原点位于左上方，其值为0～N-1；N为当前预测单元的大小，其值为64，32，16，8或者4；I(i，j)为当前预测单元位于(i，j)处的原始像素值；R_x(i，j)为当前预测单元在x预测模式下位于(i，j)处的重建像素值；

(7c)按照HEVC标准中通过率失真优化RDO代价函数，计算最终候选预测模式的代价值计算公式：

RdCost_x＝SSE_x+λ_mode×B_mode.

其中，x为当前预测单元候选预测模式的序号，其值为m₀～m_k，λ_mode为拉格朗日常数因子；B_mode为当前预测单元预测实际码流量，实际码流是通过如图3的预测残差计算，离散余弦/正弦变换，量化，CABAC熵编码进行实际码流计算得到的；SSE_x为(7b)得到的当前预测单元原始像素和重建像素之间的失真度，重建像素是通过如图3的预测残差计算，离散余弦/正弦变换，量化，反量化，反余弦/正弦变换，与预测像素叠加获得的；

(7d)对(7c)得到的最终候选预测模式的代价值从小到大排序，记为其所对应的预测模式为f₀～f_k；

(7e)f₀即为最佳预测模式。

步骤8)，进行当前预测单元后续处理过程包括最优变换单元选择。最优变换单元的选择是即将预测单元进一步划分，进行如图3所示的虚线框内所示的RDO运算。RDO计算包括预测，残差计算，离散余弦变换或正弦变换，量化，CABAC熵编码及反量化，反余弦或正弦变换，与预测像素叠加完成重建像素计算，由熵编码与重建像素结果得到RDO代价值，进而选择最优变换单元。之后对所有基本处理单元的所有预测单元，均重复执行步骤1)～步骤8)过程，完成视频所有帧内信号处理。

实施例2

基于HEVC标准的帧内预测模式快速自适应选择方法，同实施例1。

参照图1，本发明实现基于HEVC标准的帧内预测模式快速自适应选择，实现方法包括如下步骤：

步骤1)，将待处理视频信号中的一帧图像分块作为基本处理单元，基本处理单元进一步划分为64×64，32×32，16×16，8×8或者4×4大小的图像块，选取其中一个图像块16×16作为预测单元，I(i，j)为当前预测单元位于(i，j)处的原始像素值，(i，j)表示预测单元像素的坐标，坐标原点位于左上方。

(2a)用HEVC标准中的35种预测模式对当前预测单元进行预测，得到该预测单元的像素值P₀(i，j)，P₁(i，j)，…，P₃₄(i，j)。其中，(i，j)表示预测单元像素的坐标；P_x(i，j)为当前预测单元在x预测模式下位于(i，j)处的预测像素值；

(2b)使用HEVC标准中公式计算哈达玛变换绝对差和Satd_x粗略估计当前预测单元失真值，按照如下计算公式可求得Satd₀，Satd₁，…，Satd₃₄分别为2252，2079，2171，2177，2175，2175，2174，2173，2187，2198，2238，2206，2394，2429，2619，2593，2679，2800，2853，2842，2854，2740，2566，2343，1938，1385，1530，2312，2493，3050，3429，4026，4059，4572，4900。

{Satd}_{x} = Σ_{i, j = 0}^{15} | Hadamard (I (i, j) - P_{x} (i, j)) |.

(2c)按照HEVC标准中计算该预测单元在HEVC标准中35种预测模式下的代价值SatdCost₀～SatdCost₃₄，由如下计算公式可得SatdCost₀～SatdCost₃₄依次分别为2267.22，2086.61，2224.27，2230.27，2228.27，2228.27，2227.27，2226.27，2240.27，2251.27，2291.27，2259.27，2447.27，2482.27，2672.27，2646.27，2732.27，2853.27，2906.27，2895.27，2907.27，2793.27，2619.27，2396.27，1991.27，1438.27，1545.22，2365.27，2546.27，3103.27，3482.27，4079.27，4112.27，4625.27，4953.27；

SatdCost_x＝Satd_x+λ_pred×B_pred.

其中，x为HEVC标准中预测单元35种预测模式的序号，其值为0～34；λ_pred为拉格朗日常数因子，其值为7.609756；B_pred为HEVC标准中规定的当前预测模式的码流长度，对预测模式0～34的码流长度依次分别为2，1，7，7，7，7，7，7，7，7，7，7，7，7，7，7，7，7，7，7，7，7，7，7，7，7，2，7，7，7，7，7，7，7，7，Satd_x为步骤(2b)中计算的哈达玛变换绝对差和。

步骤3)，选择SatdCost₀～SatdCost₃₄中最小的3个预测模式，作为该预测单元的候选预测模式，记为p₀～p_M-1。

{SatdCost}_{p_{0}} ~ {SatdCost}_{p_{34}},

可知

{SatdCost}_{p_{0}} ~ {SatdCost}_{p_{34}}

依次分别为1438.27，1545.22，1991.27，2086.61，2224.27，2226.27，2227.27，2228.27，2228.27，2230.27，2240.27，2251.27，2259.27，2267.22，2291.27，2365.27，2396.27，2447.27，2482.27，2546.27，2619.27，2646.27，2672.27，2732.27，2793.27，2853.27，2895.27，2906.27，2907.27，3103.27，3482.27，4079.27，4625.27，4953.27；

(3b)将

{SatdCost}_{p_{0}} ~ {SatdCost}_{p_{34}}

中的最小的3个值

{SatdCost}_{p_{0}} ~ {SatdCost}_{p_{2}}

所对应的预测模式p₀～p₂作为当前预测单元的候选预测模式，记为集合S₁，此时S₁＝{25，26，24}。

步骤4)，步骤3得到的候选预测模式p₀～p_M-1不包含当前预测单元相邻的左侧的预测模式1，因此将预测模式1加入候选预测模式S₂，此时S₂＝{25，26，24，1}；候选预测模式S₂不包含候选上方预测单元的预测模式0，因此将预测模式0加入候选预测模式S₂，此时S₂＝{25，26，24，1，0}，记此时S₂中候选预测模式为p₀～p₄，其值分别为25，26，24，1，0。

步骤5)，对步骤4得到的候选预测模式p₀～p₄的哈达玛变换绝对差和

{SatdCost}_{p_{0}} ~ {SatdCost}_{p_{4}}

从小到大排序，记为

{SatdCost}_{m_{0}} ~ {SatdCost}_{m_{4}},

可知依次分别为1438.27，1545.22，1991.27，2086.61，2267.22，所对应的预测模式m₀～m_n-1分别为25，26，24，1，0。

步骤6)，令中所对应的预测模式m₀作为最终候选预测模式(记为集合S₃)初始值；依次计算序列中相邻两个元素和的差与两者中值的比值，其中k＝m₀，m₁，…，m₄；若所得比值小于设定固定门限α₁₆，则将所对应的预测模式m_k+1加入最终候选预测模式集合S₃，最终候选预测模式个数增加1，遍历所有已选定候选预测模式继续进行比较，直至比较完毕，其中固定门限α₁₆由经验选取；若所得比值大于固定门限α₁₆，则保持最终候选预测模式集合S₃不变，直接执行步骤7)。可以看出，经过此步骤需要进行RDO代价值运算的预测模式数量由5个降低为了2个，此步骤极大降低了预测模式数量，从而降低压缩编码时间。

参照图2，本步骤的具体实现如下：

(6a)令中所对应的预测模式m₀即预测模式25作为最终候选预测模式(记为集合S₃)初始值，此时S₃＝{25}，初始化候选模式索引标记k＝0；

(6b)依次计算

{SatdCost}_{m_{0}}, {SatdCost}_{m_{1}}, . . ., {SatdCost}_{m_{4}}

序列中相邻两个元素和的差与两者中值的比值，其中k＝m₀，m₁，…，m₄。k＝0，时和的差与两者中值的比值为0.072；此时0.072＜α₁₆，将所对应的预测模式m₁，即26加入S₃，此时S₃＝{25，26}；k增加一个计数值，继续重复此步骤，k＝1时和的差与两者中值的比值为0.252；此时0.252＞α₁₆，保持S₃不变，直接进入步骤7)。

其中当前预测单元大小为16×16，HEVC配置文件为低复杂度情况下α₁₆＝0.136。(6c)由k可得候选预测模式为m₀～m₁，其值依次分别为25，26。

步骤7)，对步骤6得到的最终候选预测模式m₀～m₁，通过率失真优化RDO代价函数，计算最终候选预测模式的代价值选择代价值最小的1个预测模式作为该预测单元的最佳预测模式。

(7a)用预测模式m₀～m₁对当前预测单元进行预测，求残差，DCT变换，量化，DCT反变换，与预测像素叠加得到该预测单元的重建像素R_x(i，j)。其中，(i，j)表示预测单元像素的坐标；

(7b)使用HEVC标准中公式计算当前预测单元在当前预测模式下原始像素和重建像素之间的失真度按照如下计算公式计算，可知依次分别为3143，2518，

{SSE}_{x} = Σ_{i, j}^{N - 1} {| I (i, j) - R_{x} (i, j) |}^{2} .

其中，(i，j)表示预测单元像素的坐标，坐标原点位于左上方，其值为0～N-1；N为当前预测单元的大小，其值为64，32，16，8或者4；I(i，j)为当前预测单元位于(i，j)处的原始像素值；R_x(i，j)为当前预测单元在x预测模式下位于(i，j)处的预测像素值；

(7c)按照HEVC标准中通过率失真优化RDO代价函数，计算最终候选预测模式的代价值按照如下计算公式，可知依次分别为5633，4719，

RdCost_x＝SSE_x+λ_mode×B_mode.

其中，x为当前预测单元候选预测模式的序号，其值为m₀～m₁，λ_mode为拉格朗日常数因子，其值为57.91；B_mode为当前预测单元预测码流量，由实际编码过程可求得当预测模式为m₀～m₁时，B_mode依次分别为43，38；SSE_x为(7b)得到的当前预测单元原始像素和重建像素之间的失真度；

(7d)对(7c)得到的最终候选预测模式的代价值从小到大排序，记为可知依次分别为4719，5633；其所对应的预测模式为f₀～f₁，其值分别为26，25；

(7e)f₀即26，为当前预测单元的最佳预测模式。

步骤8)，同实施例1步骤8。

如下表格为采用本发明，在实际视频测试序列编码配置分别为低复杂度和高效率情况下，视频压缩性能变化(BDBR-Y)和时间减少量。

从表格中可以看出视频序列压缩的性能BDBR-Y的波动范围仅仅在0.9％～2.4％之间，由本方案带来的性能损失可忽略不计；还可以看出由本方案带来的时间减少量最低减少了26.4％，最高可达31.3％，因此本方案极大减少了压缩编码时间。

综上所述，本发明的基于HEVC标准的帧内预测模式快速自适应选择方法，其实现包括：对当前预测单元进行SATD粗略选择；加入当前单元左侧和上方单元的预测模式；候选预测模式SATD代价值从小到大排序；比较相邻两个代价差值与代价值中值的比值与固定门限对比，自适应决定候选预测模式；选取最终候选预测模式的RDO代价值最小值对应的预测模式作为最佳预测模式。本发明主要解决现有HEVC标准的帧内模式选择计算复杂度高的问题。本发明提出的帧内预测模式选择方案简单，在保持图像压缩性能近似不变的同时，将图像压缩时间缩短了25％～31％，为HEVC标准的实时实现提供了技术基础，广泛应用于所有基于HEVC标准的视频压缩编码端中帧内最佳预测模式选择过程。

Claims

1.一种基于HEVC标准的帧内预测模式快速自适应选择方法，其特征在于：包括如下步骤：

步骤1)将待处理视频信号中的一帧图像分块作为基本处理单元，基本处理单元进一步划分为64×64，32×32，16×16，8×8或者4×4大小的图像块，选取其中一个图像块作为预测单元；

步骤2)通过基于SATD的代价函数，计算选定预测单元在HEVC标准中35种预测模式下的代价值SatdCost₀～SatdCost₃₄，将35种预测模式记为集合S₀；

步骤3)选取35种预测模式的SATD代价值SatdCost₀～SatdCost₃₄中M个较小值所对应预测模式作为当前预测单元的候选预测模式，记为集合S₁；

步骤4)将当前预测单元的候选模式集合S₂初始化为S₁，若当前预测单元相邻左侧及上方单元的预测模式不包含在当前预测单元选定的M个候选预测模式S₂之中，则将其加入当前预测单元选定的M个候选预测模式S₂中；否则，保持当前预测单元选定的M个候选预测模式S₂不变；集合S₂元素总数为n；

步骤5)对当前预测单元已选定候选预测模式集合S₂中的所有n个预测模式的SATD代价值从小到大排序，记排序后的SATD代价值为所对应的预测模式编号依次为m₀～m_n-1；

步骤6)令中所对应的预测模式m₀作为最终候选预测模式初始值，将最终候选预测模式集合记为S₃；依次计算序列中相邻两个元素和的差与两者中值的比值，其中k＝0，1，...，n-2，若所得比值小于设定固定门限α_N，则将所对应的预测模式m_k+1加入最终候选预测模式集合S₃，最终候选预测模式个数增加1，遍历所有已选定候选预测模式继续进行比较，直至比较完毕，其中固定门限α_N由经验选取，在低复杂度情况下，当前预测单元大小为64×64时固定门限α_N为0.188，预测单元大小为32×32时固定门限α_N为0.136，预测单元大小为16×16时固定门限α_N为0.136，预测单元大小为8×8时固定门限α_N为0.136，预测单元大小为4×4时固定门限α_N为0.048；在高效率情况下：当前预测单元大小为64×64时固定门限α_N为0.08，预测单元大小为32×32时固定门限α_N为0.05，预测单元大小为16×16时固定门限α_N为0.05，预测单元大小为8×8时固定门限α_N为0.05，预测单元大小为4×4时固定门限α_N为0.03；若所得比值大于固定门限α_N，则保持最终候选预测模式集合S₃不变，直接执行步骤7)；

步骤7)通过率失真优化RDO代价函数，计算最终候选预测模式集合S₃中所有元素的代价值，记为选择中最小值所对应预测模式作为该预测单元的最佳预测模式；

步骤8)完成当前预测单元的后续处理，对该帧内所有基本处理单元的所有预测单元，均重复执行步骤1)～步骤8)过程，完成视频所有帧内图像编码过程。