CN100455021C - 帧内预测模式的选择方法 - Google Patents

帧内预测模式的选择方法 Download PDF

Info

Publication number
CN100455021C
CN100455021C CNB2004100793531A CN200410079353A CN100455021C CN 100455021 C CN100455021 C CN 100455021C CN B2004100793531 A CNB2004100793531 A CN B2004100793531A CN 200410079353 A CN200410079353 A CN 200410079353A CN 100455021 C CN100455021 C CN 100455021C
Authority
CN
China
Prior art keywords
image block
frame
prediction
infra
intra
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004100793531A
Other languages
English (en)
Other versions
CN1756364A (zh
Inventor
罗忠
宋彬
常义林
周宁兆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CNB2004100793531A priority Critical patent/CN100455021C/zh
Publication of CN1756364A publication Critical patent/CN1756364A/zh
Application granted granted Critical
Publication of CN100455021C publication Critical patent/CN100455021C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种帧内预测模式的选择方法,用于对视频图像编码过程中的帧内预测模式进行选择,包括步骤:为当前图像帧中要进行帧内预测的图像块选取参考图像块;控制该图像块在各个参考图像块的最优预测子模式所形成的预测子模式集合内选取相应的最优预测子模式进行帧内预测;为该要进行帧内预测的图像块选取最优预测子模式是根据要进行帧内预测的图像块在每种最优预测子模式下的Cost函数值来选取的。本发明可以提高H.264压缩编码过程中帧内预测模式的选择效率,使多媒体通信性能得到更好的改善。

Description

帧内预测模式的选择方法
技术领域
本发明涉及多媒体通信系统中的视频压缩编解码技术,尤其涉及一种帧内预测模式的选择方法。
背景技术
H.264压缩编码标准是目前最先进的视频压缩编码国际标准,其全称是国际电信联盟-电信标准化组织H.264建议(ITU-T H.264Recommendation,International Telecommunication Union-Telecommunication H.264Recommendation),以下将其简称为H.264标准。H.264标准由ITU-T和国际标准化组织(ISO,International Organization for Standardization)/国际电工委员会(IEC,International Electrotechnical Commission)的运动图像专家组(MPEG,Moving Picture Experts Group)共同合作开发制定。该标准从1999年开始研制,由众多国家的设备厂商,软件开发商,电信运营商,大学和科研机构参加,汇集了当前世界上最先进的视频压缩编码技术,最终于2003年正式成为ITU-T的国际标准。
H.264相对于在先的H.263+、H.263++以及MPEG-4Simple Profile等视频压缩编码标准技术,在性能和功能上都有了很大提高。其中在功能上增加了许多编码工具选项,使得可以适合更多的应用类型以及更加广阔的应用领域;在性能方面,在相同的编码码率(bit-rate)下,图像质量以峰值信号-噪声比值(PSNR,Peak Signal-to-Noise Ratio,简称峰值信噪比)作为参考,H.264标准比在先的H.263+/H.263++,MPEG-4Simple Profile标准提高了一倍,即PSNR增加了3dB;也就是说,在得到相同PSNR的情况下,H.642标准所需要的网络带宽相比H.263+/H.263++,MPEG-4 Simple Profile标准所需的网络带宽降低了50%。
但是,H.264标准相对于在先技术标准在功能和性能方面都得到显著提升的同时,其付出的代价也是高昂的,其中H.264标准对视频图像进行压缩编解码处理的运算复杂度要比H.263/H.263+等标准的运算复杂度增加几倍,因此,H.264标准大规模普及应用的前提必须是开发多种处理效率较高的运算处理方法,以降低H.264标准编解码运算处理过程中的多个计算强度非常高的计算环节的运算复杂度,这样才能降低产品所需多媒体处理器的处理能力,从而降低成本;或者是多媒体处理器在给定的处理能力上支持更高的编码及解码能力,从而提高产品性能。
其中在H.264标准的编解码处理过程中存在多处运算复杂度较高的计算环节,比如帧间预测编码(Inter-frame prediction,简称Inter)、帧内预测编码(Intra-frame prediction,简称Intra)、熵编码(CABAC,Context-Adaptive BinaryArithmetic Coding)、1/4像素精度的运动估计(ME,Motion Estimation)和运动补偿(MC,Motion Compensation)、多参考帧预测(Multi-hypothesisprediction)等等。
尤其是在帧内预测编码处理和帧间预测编码处理方面,H.264标准相对于在先的H.263/H.263+等标准有了很大的处理策略变化。其中H.264标准在对视频图像进行编解码处理的过程中,对于视频图像当前帧中的每个宏块(Macro block,以下简称MB),允许使用多种预测模式对其进行预测处理。一般预测处理首先是进行帧间预测,然后再进行帧内预测,继而比较帧内预测和帧间预测的结果,选取编码效率最高的预测模式,这样就把帧内预测和帧间预测这两种预测技术有机地结合起来了,可以达到更高的预测效率和压缩效率。
其中,帧内预测是H.264标准独有的处理属性,对于视频图像编码过程,帧内预测能够最大限度地利用图像数据在空间上的相关性,从而提高压缩编码效率。在一般的视频图像压缩编码处理方式中,较为普遍采用的是帧间预测,而帧间预测利用的是视频图像序列之间在时间上的相关性;然而很多类型的视频图像其内部是存在很强的空间相关性的,因此H.264标准设计了帧内预测方式以充分利用视频图像内部存在的空间相关性,以进而提高压缩编码效率。
H.264标准中的帧内预测是指在编码过程中,对于视频图像中当前要编码的某一个区域(一般都是矩形的块),在视频图像中搜索与其最相近似的、且已经编码的块,用这个搜索到的最相近似的块来预测当前要编码的块,预测结果即是预测的残差。其中不同块之间的相近似性是采用绝对误差和(SAD,Sum ofAbsolute Differences)来度量的,即与当前要编码的块计算得到的最小SAD所对应的块作为最相近似的块。上述图像块可以是宏块MB(即16×16象素大小的块),也可以是比宏块MB更小的块,也就是说H.264标准中的帧内预测是在MB或者比MB更小尺度的块上进行的。
对于彩色视频图像,每帧视频图像中分别有一个亮度分量帧(YUV)和两个色度分量帧(Ycb和Ycr)。其中亮度分量帧有两个大的帧内预测模式,如下:
(1)Intra 16×16帧内预测模式:即将MB作为一个整体来进行帧内预测。
(2)Intra 4×4帧内预测模式:即将每个MB分成16个4×4块来分别进行帧内预测,然后把每个块的预测结果拼起来组成一个16×16块作为该MB的最终预测结果。
而对于两个色度分量帧则只有一种大的帧内预测模式,即:
Intra 8×8帧内预测模式,即以色度分量帧中的每个8×8块作为基本预测单位进行帧内预测。
请参阅图1,该图是现有H.264压缩编码技术对每个宏块MB进行顺序压缩编码的示意图;因为H.264压缩编码是依照各个MB的排列顺序从上到下,从左到右依次进行的,因此对于当前要编码的MB,其上面和左面的MB已经完成编码处理,即为可以用来作为预测基础的MB。因此对于亮度分量帧的帧内预测就可以利用当前要编码的MB或者4×4块的上面一行和左面一列的像素作为参考像素来预测该要编码的MB或者4×4块中的各个像素的值。如图1所示,对要编码的MB中的象素f进行帧内预测时就可以参照上面一行象素a、b、c和d,以及左面一列象素e来进行。
因为视频图像在空间上的相关性存在多个方向,为简化处理过程,H.264标准规定了仅在有限个方向上进行帧内预测,请参阅图2,该图是现有H.264标准进行帧内预测所限定的预测方向示意图;由图2可见,在采用Intra 4×4帧内预测模式对亮度分量帧进行帧内预测时,允许使用的方向一共有9个(每个方向在图中用0~8数字符号来标识),其中方向2比较特殊,称为“直流”预测模式,这种预测模式是采用将所有参考像素进行算术平均处理来预测每个4×4块内各个像素值的,本质上是没有特殊方向的,即各个方向均等。
请参阅图3,该图是现有H.264标准分别在图2所示的各个预测方向上进行的预测过程示意图;其中图3中每条从参考像素出发的虚线所经过的像素都会利用该参考像素来进行帧内预测。请同时参阅图1,如方向1(水平)中,从参考像素I出发的虚线所经过的a、b、c和d像素都要利用象素I来进行帧内预测;而方向5(垂直偏右)中,从参考象素A出发的虚线所经过的a、e、j和n象素都要利用像素A来进行帧内预测。由此可见,在采用Intra 4×4帧内预测模式对亮度分量帧进行帧内预测时,其实存在9种预测子模式对应图2所示的9个允许的预测方向。
而在采用Intra 16×16帧内预测模式对亮度分量帧进行帧内预测时,允许使用的预测子模式包括4个:分别是Mode 0(垂直)预测、Mode 1(水平)预测、Mode 2(DC)预测和Mode 3(平面)预测;在采用Intra 8×8帧内预测模式对色度分量帧进行帧内预测时,也允许使用4种预测子模式,分别为:Mode 0(DC)预测、Mode 1(水平)预测、Mode 2(垂直)预测和Mode 3(平面)预测。
按照现有技术H.264参考软件实现(JM,Joint Model,JM已经推出了多个版本,目前最高版本是JM 8.5)中的技术方案,一个完整的帧内预测模式选择过程如下:
对于当前要编码的MB,首先将其分成16个4×4块;
对每个4×4块分别按照上述9种预测子模式进行帧内预测,以SAD代价函数为基础选择其中的最优预测子模式,并把最优预测子模式对应的预测结果作为本4×4块的预测结果;
将16个4×4块的预测结果拼成一个16×16块,作为本MB采用Intra 4×4帧内预测模式进行帧内预测的结果;并把各个4×4块在各自最优预测子模式下的代价函数值相加作为本MB在Intra 4×4帧内预测模式下的代价函数值;
然后,再采用Intra 16×16帧内预测模式对该MB进行帧内预测,分别按照上述4种允许的预测子模式进行帧内预测,其代价函数和Intra 4×4帧内预测模式的代价函数形式类似,个别系数不同而已;另外根据H.264规定还可以选用(作为一种选项的情况)基于哈达玛(Hadarmard)变换系数的代价函数为基础选择其中的最优预测子模式,并把最优预测子模式对应的预测结果作为本MB的预测结果,同时把最优预测子模式下的代价函数值作为本MB在Intra 16×16帧内预测模式下的代价函数值;
最后比较上述本MB在Intra 4×4帧内预测模式和Intra 16×16帧内预测模式下的代价函数值在一个不等式中的关系,根据不等式的比较结果来选择使用Intra 4×4帧内预测模式或者使用Intra 16×16帧内预测模式。
在以上帧内预测模式的选择过程中,如果MB或者4×4块采用两种预测子模式时得到了相同的代价函数值,则选取序号较小的预测子模式作为最优预测子模式(如MB采用Made 0和Made 1时得到了相同的代价函数值,则会选取Made 0作为最优预测子模式)。
由于亮度分量帧在Intra 16×16帧内预测模式下有4种预测子模式,在Intra 4×4帧内预测模式下有9种预测子模式,帧内模式选择就是希望选择出一种帧内预测模式使得编码出的码流量最小且信噪比最高。最好的方法就是使用Cost代价函数来表征预测子模式的处理结果,其中Cost代价函数是基于率失真优化(RDO=rate-distortion optimization)结合SAD而得到的函数,具体如下所示:
Cost=SAD+2Rλ(Qp)
上式中,SAD是绝对误差和,即是参考图像与所编图像对应位置的差值。为了更准确的比较每种预测子模式的好坏程度,取系数R=0或者R=1,对于所求得SAD最小对应的预测子模式,取R=0;对于其它预测子模式,取R=1。其中λ为Lagrangian因子,λ=0.85*2(Qp-12)/3,该式中Qp为量化参数,取值范围为[0,51]。
作为H.264标准的一个选项,还可以对帧内预测差值进行哈达玛Hadarmard变换,将差值变换到频域来求绝对误差和SAD(因为这些差值最后是要变换到频域来进行编码的),这里使用Hadarmard变换而不使用离散余弦变换(DCT变换)主要是考虑Hadarmard变换实现原理简单且比较接近DCT变换。
根据上述,对应亮度分量帧,分别对应Intra 4×4帧内预测模式和Intra16×16帧内预测模式,定义其对应的Cost代价函数为:
Cost4×4=SAD4×4+2Rλ(Qp)
Cost16×16=SAD16×16+2Rλ(Qp)
相应地,对色度分量帧,其对应Intra 8×8帧内预测模式定义的Cost代价函数为:
Cost8×8=SAD8×8+2Rλ(Qp)
对于亮度分量帧而言,通过判别下列不等式是否成立来决定选择何种帧内预测模式:
Cost16×16≥16Cost4×4
如果该不等式成立,则选择Intra 4×4帧内预测模式进行帧内预测,否则选择Intra 16×16帧内预测模式进行帧内预测。
综上可见,对于亮度分量帧的帧内预测模式选择是需要对图像中的每个MB比较Inter 4×4帧内预测模式和Intra 16×16帧内预测模式下的各种预测子模式预测结果来最终确定所选择的帧内预测模式,因此所需的计算量比较大,消耗处理器的资源也比较多。据数据统计,H.264压缩编码标准中,帧内预测模式的选择环节约占整个H.264编码过程所消耗计算时间的10%-12%,因此,对H.264标准中的帧内预测模式选择过程进行优化是十分必要的,以得到高效率的帧内预测模式选择方法。
发明内容
本发明要解决的技术问题在于提出一种帧内预测模式的选择方法,以提高H.264压缩编码过程中帧内预测模式的选择效率,使多媒体通信性能得到更好的改善。
为解决上述问题,本发明提出了一种帧内预测模式的选择方法,用于对视频图像编码过程中的帧内预测模式进行选择,包括步骤:
(1)为当前图像帧中要进行帧内预测的图像块选取参考图像块;
(2)控制该图像块在各个参考图像块的最优预测子模式所形成的预测子模式集合内选取相应的最优预测子模式进行帧内预测;所述步骤(2)中为该要进行帧内预测的图像块选取最优预测子模式是根据要进行帧内预测的图像块在每种最优预测子模式下的Cost函数值来选取的。
所述参考图像块包括:该要进行帧内预测的图像块的相邻已编码图像块;及在前一图像帧中与该要进行帧内预测的图像块在当前图像帧中的位置对应的对应位置图像块;及该对应位置图像块的相邻图像块。
其中所述相邻已编码图像块为相邻上方图像块,相邻左方图像块和相邻左上方图像块;所述前帧对应位置图像块的相邻图像块为相邻左上方图像块,相邻上方图像块,相邻右上方图像块,相邻左方图像块,相邻右方图像块,相邻左下方图像块,相邻下方图像块和相邻右下方图像块。
所述步骤(2)中为该要进行帧内预测的图像块选取最优预测子模式的过程包括步骤:
(21)使该要进行帧内预测的图像块分别在每个参考图像块的最优预测子模式下进行帧内预测,并分别计算在每种最优预测子模式下进行帧内预测的Cost函数值;
(22)选取最小函数值对应的预测子模式作为该要进行帧内预测的图像块的最优预测子模式。
所述步骤(1)之前还包括步骤:
(A1)判断当前图像帧是否是视频图像序列中的第一图像帧,如果是,转至步骤(A2);否则转至步骤(1);
(A2)控制该第一图像帧中的每个图像块,在Intra 4×4帧内预测模式下的9种预测子模式中,或在Intra 16×16和Intra 8×8帧内预测模式下的4种预测子模式中选取最优预测子模式进行帧内预测;对于后续图像帧的处理转至步骤(1)。
所述步骤(2)之后还包括步骤:控制视频图像序列的第nT个图像帧中的每个图像块,在Intra 4×4帧内预测模式下的9种预测子模式中,或在Intra16×16和Intra 8×8帧内预测模式下的4种预测子模式中选取最优预测子模式进行帧内预测;所述n为自然数,所述T由下列公式确定:
T=T0·λ(QP)
其中,λ(QP)=0.25×2-(QP-12)/6,QP为量化参数,T0=200。
相应地,本发明还提出了一种帧内预测模式的选择方法,用于对视频图像编码过程中的帧内预测模式进行选择,包括:
固定序列参考图像块的选取步骤:
(A)为帧内预测图像块选取参考图像块;
(B)分别计算帧内预测图像块与每个选取的参考图像块之间的相关性;
(C)根据帧内预测图像块的大小,相应在选取的所有参考图像块中选定N个相关性高的固定序列参考图像块,所述N为自然数;
图像块帧内预测步骤:
(D)后续进行帧内预测过程中,根据当前图像帧中的帧内预测图像块的大小,直接在相应选定的固定序列参考图像块的最优预测子模式所形成的预测子模式集合内选取相应的最优预测子模式进行帧内预测;所述步骤(D)中为帧内预测图像块选取最优预测子模式的过程包括步骤:(D1)使帧内预测图像块分别在相应选定的固定序列参考图像块的最优预测子模式下进行帧内预测,并分别计算在每种最优预测子模式下进行帧内预测的Cost函数值;(D2)选取最小函数值对应的预测子模式作为帧内预测图像块的最优预测子模式。。
所述步骤(A)和(B)之间还包括步骤:分别计算帧内预测图像块及每个参考图像块在Intra 16×16帧内预测模式下的9种预测子模式中,或在Intra8×8或Intra 4×4帧内预测模式下的4种预测子模式中的最优预测子模式;
所述步骤(B)的相关性根据如下公式进行计算:
Blkcorr ( f , p ) = 1 MRC Σ i = 0 M - 1 Σ j = 0 R - 1 Σ k = 0 C - 1 p ( i , j , k )
其中:
(f,p)为标识参考图像块的参数;
Blkcorr(f,p)为帧内预测图像块和用(f,p)标识的参考图像块之间的相关性值;所述f=n时表示当前图像帧,f=n-1时表示前一图像帧;所述p=0,1,2,3,4,5,6,7,8,表示参考图像块在图像帧中的位置;
M为一个视频图像序列中包含的图像帧数目,R为一个图像帧中垂直方向的图像块数目,C为一个图像帧中水平方向的图像块数目;
i为帧内预测图像块所在图像帧的帧号,0≤i≤M-1;j为帧内预测图像块在图像帧中的行号,0≤j≤R-1;k为帧内预测图像块在图像帧中的列号,0≤k≤C-1;
当帧内预测图像块和用(f,p)标识的参考图像块的最优预测子模式相同时,p(i,j,k)=1;
当帧内预测图像块和用(f,p)标识的参考图像块的最优预测子模式不同时,p(i,j,k)=0。
其中步骤(C)中当所述图像块为亮度分量帧中的4×4块时,所述N=5;所述5个相关性高的固定序列参考图像块分别为帧内预测图像块的相邻上方图像块和相邻左方图像块,及前一图像帧中的对应位置图像块,及该对应位置图像块的相邻右方图像块和相邻下方图像块;步骤(C)中当所述图像块为亮度分量帧中的16×16块或为色度分量帧中的8×8块时,所述N=3;所述3个相关性高的固定序列参考图像块分别为帧内预测图像块的相邻上方图像块和相邻左方图像块,及前一图像帧中的对应位置图像块。
其中所述步骤(D)中为帧内预测图像块选取最优预测子模式的过程包括步骤:
(D1)使帧内预测图像块分别在相应选定的固定序列参考图像块的最优预测子模式下进行帧内预测,并分别计算在每种最优预测子模式下进行帧内预测的Cost函数值;
(D2)选取最小函数值对应的预测子模式作为帧内预测图像块的最优预测子模式。
所述步骤(D)之前还包括步骤:
(P1)判断当前图像帧是否是视频图像序列中的第一图像帧,如果是,转至步骤(P2);否则转至步骤(D);
(P2)控制该第一图像帧中的每个图像块,在Intra 4×4帧内预测模式下的9种预测子模式中,或在Intra 16×16和Intra 8×8帧内预测模式下的4种预测子模式中选取最优预测子模式进行帧内预测;对于后续图像帧的处理转至步骤(D)。
所述步骤(D)之后还包括步骤:控制视频图像序列的第nT个图像帧中的每个图像块,在Intra 4×4帧内预测模式下的9种预测子模式中,或在Intra16×16和Intra 8×8帧内预测模式下的4种预测子模式中选取最优预测子模式进行帧内预测;所述n为自然数,所述T由下列公式确定:
T=T0·λ(QP)
其中,λ(QP)=0.25×2-(QP-12)/6,QP为量化参数,T0=200。
本发明帧内预测模式的选择方法通过为要进行帧内预测的图像块选取相应的参考图像块,使该要进行帧内预测的图像块在选取的参考图像块的最优预测子模式所组成的预测子模式集合中选取自身的最优预测子模式,从而可以减少该要进行帧内预测的图像块所选择的预测子模式数量,如对于Intra 4×4,每个4×4块可选择的预测子模式将小于9种,对于Intra 16×16或Intra8×8帧内预测模式,每个16×16块或8×8块可选择的预测子模式将小于4种;因此有效地提高了H.264压缩编码过程中的帧内预测模式的选择效率,使多媒体通信性能得到了更好的改善。
附图说明
图1是现有H.264压缩编码技术对每个宏块MB进行顺序压缩编码的示意图;
图2是现有H.264标准进行帧内预测所限定的预测方向示意图;
图3是现有H.264标准分别在图2所示的各个预测方向上进行的预测过程示意图;
图4是本发明帧内预测模式的选择方法的主要实现原理流程图;
图5是本发明帧内预测模式的选择方法中为当前图像块所选取的参考图像块的示意图;
图6是在本发明帧内预测模式的选择方法中通过增加相关性计算来确定相关性较强的固定序列参考图像块的处理流程图;;
图7是在本发明帧内预测模式的选择方法中,为进一步提高帧内预测准确度所提出的处理流程图。
具体实施方式
在进行帧内预测处理的过程中,对于亮度分量帧中的Intra 4×4帧内预测模式,每个4×4块要在9种预测子模式【分别为图3所示的Mode 0(垂直)预测、Mode 1(水平)预测、Mode 2(DC)预测、Mode 3(左斜下)预测、Mode 4(右斜下)预测、Mode 5(垂直偏右)预测、Mode 6(水平偏下)预测、Mode 7(垂直偏左)预测和Mode 8(水平偏上)预测】中进行选择自身的最优预测子模式,对于亮度分量帧中的Intra 16×16帧内预测模式和色度分量帧中的Intra 8×8帧内预测模式,每个16×16块或8×8块要在4种预测子模式【对于Intra 16×16帧内预测模式,4种预测子模式为Mode 0(垂直)预测、Mode 1(水平)预测、Mode 2(DC)预测和Mode 3(平面)预测;对于Intra 8×8帧内预测模式,4种预测子模式为Mode 0(DC)预测、Mode 1(水平)预测、Mode 2(垂直)预测和Mode 3(平面)预测】中进行选择自身的最优预测子模式,因此所需要比较的预测子模式数量较大,这样的预测子模式选择方式其计算量显然是相当大的。
本发明帧内预测模式的选择方法针对现有技术上述存在的缺陷,分析得出在进行帧内预测处理的过程中,每个图像块(包括亮度分量帧中的16×16块和4×4块,及色度分量帧中的8×8块)的最优预测子模式和自身所在的位置有关,也和自身周围的一些图像块,以及前帧对应位置上的图像块,以及对应位置上的图像块周围的一些图像块的最优预测子模式相关,即每个图像块的最优预测子模式可以由这些相关图像块的最优预测子模式来唯一决定。并根据上述这个分析结果,提出利用视频图像序列在时间和空间上的相关性,根据当前图像块的周围图像块,以及前帧对应位置的图像块及其周围块的属性来进行预测子模式的初步筛选,从而排除掉那些可能性很低的预测子模式,即不需要判别这些低可能性的预测子模式,而只需要判别高可能性的预测子模式;这样就可以减少每个图像块需要判别的预测子模式数目,排除掉一些明显可能性很低的预测子模式,然后仅仅对可能性比较高的预测子模式进行判别,以降低预测子模式选择的计算量,达到本发明的目的。
在H.264压缩编码标准中,编码帧内帧时要对每个宏块MB进行帧内预测,同时在预测帧中也要对每个宏块MB进行帧内预测和帧间预测,以完成预测模式选择。尤其对于亮度分量帧中的每个图像块既要做Intra4×4帧内预测,还要做Intra 16×16帧内预测,因此是本发明提高帧内预测模式选择效率的针对重点,以降低H.264编码器的运算复杂度,满足多媒体通信的实时性要求。
下面将结合各个附图对本发明帧内预测模式的选择方法的具体实施方式进行详细的阐述。请参阅图4,该图是本发明帧内预测模式的选择方法的主要实现原理流程图,其主要实现过程为:
步骤S10,为当前图像帧中要进行帧内预测的图像块选取参考图像块;其中选取的参考图像块可以包括:
该要进行帧内预测的图像块的相邻已编码图像块,根据视频图像块的编码规则,所述的相邻已编码图像块包括该要进行帧内预测的图像块的相邻上方图像块,相邻左方图像块和相邻左上方图像块;及
在前一图像帧中与该要进行帧内预测的图像块在当前图像帧中的位置对应的对应位置图像块;及
该对应位置图像块的相邻图像块,其中对应位置图像块的相邻图像块包括其相邻左上方图像块,相邻上方图像块,相邻右上方图像块,相邻左方图像块,相邻右方图像块,相邻左下方图像块,相邻下方图像块和相邻右下方图像块8个图像块。
步骤S20,控制该要进行帧内预测的图像块在选取的各个参考图像块的最优预测子模式所形成的预测子模式集合内选取相应的最优预测子模式进行帧内预测,该要进行帧内预测的图像块选取最优预测子模式的过程如下:
使该要进行帧内预测的图像块分别在每个参考图像块的最优预测子模式下进行帧内预测;并
分别基于Cost代价函数计算该要进行帧内预测的图像块在每个参考图像块的最优预测子模式下进行帧内预测的函数值;并
选取最小函数值对应的预测子模式作为该要进行帧内预测的图像块的最优预测子模式。
本发明帧内预测模式的选择方法实现技术的关键是在亮度分量帧的Intra16×16和Intra 4×4两种帧内预测模式及色度分量帧Intra 8×8帧内预测模式下,尽可能地减少每个图像块(可以是亮度分量帧中的宏块MB或者4×4块,及色度分量帧中的8×8块)需要计算判别的预测子模式的数量,但又不能显著降低帧内预测的准确度(一般情况下,高效处理方式相对于原始方法,其总体性能总会有一些降低,但应保证这个降低量应该尽可能小,或者说不显著)。本发明帧内预测模式的选择方法其主要思想是:利用前一图像帧和当前图像帧对应位置图像块及其周围图像块的帧内预测子模式来预测当前图像帧中要进行帧内预测的图像块的最优预测子模式,从而减少当前图像块需要计算判别的预测子模式数量。
请参阅图5,该图是本发明帧内预测模式的选择方法中为当前图像块所选取的参考图像块的示意图;假设在图5中,要对当前图像帧(第N帧)中的M0 n图像块(可以是亮度分量帧中的4×4块或16×16块,或是色度分量帧中的8×8块)进行帧内预测,则第N图像帧中的图像块M0 n的帧内预测模式的选择过程为:通过在第N-1图像帧中的图像块Mn -1、M1 n-1、……、M8 n-19个图像块和第N图像帧中的图像块M1 n、M2 n和M3 n图像块的最优预测子模式所形成的预测子模式集合内计算判别其最优预测子模式进行帧内预测。这样,对于M0 n图像块的预测子模式选择的初步筛选方式是认为当前图像块M0 n的12个参考图像块对应的最优预测子模式是可能性较高的候选预测子模式,是需要分别通过计算来比较判别的,而对于不在这些参考图像块范围内的预测子模式,就视为是可能性较低的预测子模式,可作直接舍弃不予计算的处理。同时因为在12个参考图像块中,可能有多个参考图像块的最优预测子模式是相同的,因此对应的最优预测子模式数目可能比现有技术中的9种(对于亮度分量帧中的Intra 4×4帧内预测模式而言)或4种(对于亮度分量帧中的Intra 16×16帧内预测模式或者色度分量帧中的Intra 8×8帧内预测模式而言)预测子模式数目少,这样就达到了降低判别计算量的目的,即使得第N图像帧中的要进行帧内预测的M0 n图像块需要计算判别的帧内预测子模式数目要远少于现有技术中的9种或4种,从而大大提高了帧内预测模式的选择效率。
其中,图5中第N-1帧中的M0 n-1、M1 n-1、M2 n-1、M3 n-1、M4 n-1、M5 n-1、M6 n-1、M7 n-1、M8 n-19个图像块和第N帧中的M1 n、M2 n、M3 n3个图像块即为该要进行帧内预测的图像块MO n的参考图像块;其中M1 n、M2 n和M3 n图像块为图像块M0 n的相邻已编码图像块,M0 n-1图像块为图像块M0 n的在前一图像帧中的对应位置图像块,M1 n-1、M2 n-1、M3 n-1、M4 n-1、M5 n-1、M6 n-1、M7 n-1、M8 n-1为对应位置图像块M0 n-1的相邻图像块。按照H.264压缩编码的编码规则,这些参考图像块都要先于当前图像块M0 n完成编码处理,因此都是可以参考的图像块。
为进一步减小帧内预测子模式的计算判别复杂度,本发明帧内预测模式的选择方法还提出根据当前图像块和其周围图像块,以及前帧对应位置图像块及其周围图像块的相关性强弱程度来排序确定相关性较强的一些参考图像块作为帧内预测图像块的固定序列参考图像块,然后直接根据这些相关性较强的固定序列参考图像块的属性来预测当前帧内预测图像块的最优预测子模式,以使可计算判别的预测子模式得到进一步筛选,并进一步降低预测子模式选择处理的计算量。
请参阅图6,该图是在本发明帧内预测模式的选择方法中通过增加相关性计算来确定相关性较强的固定序列参考图像块的处理流程图;其主要实现过程如下:
步骤S21,分别针对不同运动属性的图像序列,为帧内预测图像块选取参考图像块;其中为帧内预测图像块选取的参考图像块也可以为图5中所示的第N-1帧中的M0 n-1、M1 n-1、M2 n-1、M3 n-1、M4 n-1、M5 n-1、M6 n-1、M7 n-1、M8 n-19个图像块和第N帧(即当前帧)中的M1 n、M2 n、M3 n3个图像块。
步骤S22,分别计算帧内预测图像块,及选取的每个参考图像块在Intra 16×16帧内预测模式下的9种预测子模式中,或在Intra 8×8或Intra 4×4帧内预测模式下的4种预测子模式中的最优预测子模式;
步骤S23,分别计算帧内预测图像块与每个选取的参考图像块之间的相关性;其中所述相关性可以根据如下公式进行计算:
Blkcorr ( f , p ) = 1 MRC Σ i = 0 M - 1 Σ j = 0 R - 1 Σ k = 0 C - 1 p ( i , j , k )
上式中:(f,p)为标识参考图像块的参数;
Blkcorr(f,p)为该要进行帧内预测的图像块和用(f,p)标识的参考图像块之间的相关性值;其中f=n时表示当前图像帧,f=n-1时表示前一图像帧;所述p=0,1,2,3,4,5,6,7,8,表示参考图像块在图像帧中的位置;
M为一个视频图像序列中包含的图像帧的数目,R为一个图像帧中垂直方向的图像块数目,C为一个图像帧中水平方向的图像块数目;
i为该要进行帧内预测的图像块所在图像帧的帧号,0≤i≤M-1;j为该要进行帧内预测的图像块在图像帧中的行号,0≤j≤R-1;k为该要进行帧内预测的图像块在图像帧中的列号,0≤k≤C-1;
其中当该要进行帧内预测的图像块和用(f,p)标识的参考图像块的最优预测子模式相同时,则p(i,j,k)=1;当该要进行帧内预测的图像块和用(f,p)标识的参考图像块的最优预测子模式不同时,则p(i,j,k)=0。
步骤S24,根据帧内预测图像块的大小,相应在选取的所有参考图像块中选定N个(N为自然数)相关性高的固定序列参考图像块;
如,当帧内预测所选择的图像块为亮度分量帧中的4×4块时,可以选择5个(即N=5)相关性较高的图像块作为帧内预测图像块的固定序列参考图像块;其中选取的5个相关性较高的图像块可以分别为要进行帧内预测的图像块的相邻上方图像块和相邻左方图像块,以及前一图像帧中的对应位置图像块,及该对应位置图像块的相邻右方图像块和相邻下方图像块。
又如,当帧内预测所选择的图像块为亮度分量帧中的16×16块或为色度分量帧中的8×8块时,可以选择3个(即N=3)相关性较高的图像块作为帧内预测图像块的固定序列参考图像块;其中3个相关性较高的图像块可以分别为要进行帧内预测的图像块的相邻上方图像块和相邻左方图像块,以及前一图像帧中的对应位置图像块。
基于上述处理结果的基础,对于后续的帧内预测处理,可以依据帧内预测图像块的大小,并根据步骤S24所确定的固定序列参考图像块,直接选取相应的N个相关性较高的固定序列参考图像块(如对于亮度分量帧中的4×4块,可以直接选择要进行帧内预测的图像块的相邻上方图像块和相邻左方图像块,以及前一图像帧中的对应位置图像块,及该对应位置图像块的相邻右方图像块和相邻下方图像块等5个图像块作为该要进行帧内预测的图像块的参考图像块;而对于亮度分量帧中的16×16块或为色度分量帧中的8×8块,可以直接选取要进行帧内预测的图像块的相邻上方图像块和相邻左方图像块,以及前一图像帧中的对应位置图像块等3个图像块作为该要进行帧内预测的图像块的参考图像块,这样就可以在很大程度上减小相关性的计算量),然后在选取的N个相关性较高的固定序列参考图像块的最优预测子模式所形成的预测子模式集合内选取相应的最优预测子模式进行帧内预测。
因为从视频图像序列的相关性角度考虑,当前图像块M0 n和其12个参考图像块的相关性是不一样的,有些相关性是比较高的,比如参考图像块M0 n-1;另外一些相关性是比较低的,比如参考图像块M6 n-1,因此就可以通过对每个参考图像块和当前要进行帧内预测的图像块之间的相关性进行排序,以进一步筛选帧内预测子模式的数目。
基于上述原理,本发明提出对当前图像帧中的要进行帧内预测的4×4块M0 n的最优预测子模式与前一图像帧中对应位置的4×4块M0 n-1、及其块M0 n-1的相邻块M1 n-1、M2 n-1、M3 n-1、M4 n-1、M5 n-1、M6 n-1、M7 n-1和M8 n-1,以及当前图像帧中的相邻块M1 n、M2 n和M3 n共12个参考图像块的最优预测子模式进行统计比较,并给出各个参考图像块与当前图像块M0 n的相关性,这里的相关性是指“某个参考图像块的最优预测子模式与当前图像块M0 n的最优预测子模式相同”这一事件的概率。其中,相关性的具体计算方法如下:
Blkcorr ( f , p ) = 1 MRC Σ i = 0 M - 1 Σ j = 0 R - 1 Σ k = 0 C - 1 p ( i , j , k ) ,
Figure C20041007935300242
其中,Blkcorr(f,p)表征了当前图像块M0 n和参考图像块Mp f之间的相关性;f=n(表示当前图像帧)或者n-1(表示前一图像帧);p=0,1,2,3,4,5,6,7,8,表示图像块在图像帧中的位置标号;M为一个视频图像序列中的所有图像帧数目,R表示一个图像帧中垂直方向的图像块数目,C表示一个图像帧中水平方向的图像块数目。在上式求和过程中,对于求和指标(i,j,k),是标识当前图像块M0 n第i帧中的第j行,第k列的图像块。在上述计算某个视频图像序列的相关性之前,要分别对该视频图像序列中的每个图像块按照现有技术中的9种预测子模式或4种预测子模式进行最优预测子模式的选择处理。
为了使得上述这种相关性适用范围广泛的视频图像序列,本发明通过多次实验对各种典型类型的代表图像序列进行了计算,并给出了这三个典型图像序列的相关性数据,如下表所示:
表1.各参考图像块与M0 n相关性的比较
Figure C20041007935300243
由表1可以看出,当前图像块M0 n的最优预测子模式与参考图像块M0 n-1的相关性最高,其次是与参考图像块M1 n、M2 n的相关性较高,再次是与参考图像块M1 n-1、M2 n-1、M3 n-1、和M4 n-1的相关性次之,与其相关性较低的是参考图像块M5 n-1、M6 n-1、M7 n-1、M8 n-1和M3 n。因此,为了充分利用视频图像序列在空间和时间上的相关性,并尽量减少预测子模式的可选择数量,本发明这里选取使用下面5个相关性较高的固定序列参考图像块的最优预测子模式来预测当前图像块M0 n的最优预测子模式(请同时参阅图5中的阴影图像块):
1)前一图像帧(即第N-1帧)中对应位置的4×4图像块M0 n-1,以及该4×4图像块M0 n-1的相邻右方图像块M4 n-1和相邻下方图像块M2 n-1
2)当前图像帧(即第N帧)中的当前图像块M0 n的相邻上方图像块M1 n和相邻左方图像块M2 n
同时,这里所选取的5个相关性较高的参考图像块的最优预测子模式在很大程度上存在有相同的可能,因此当前图像块M0 n的可选择帧内预测子模式的数目将会小于5种。表2给出了使用本发明帧内预测模式的选择方法后,帧内预测的准确度参数及平均所需做的预测子模式选择个数,如下:
表2.预测准确度和平均预测模式个数的比较(QP=28)
Figure C20041007935300251
上述叙述了针对亮度分量帧中的Intra 4×4帧内预测模式采用本发明帧内预测模式的选择方法的处理过程及效果,与亮度分量帧中的Intra 4×4帧内预测模式相比,亮度分量帧中的Intra16×16帧内预测模式和色度分量帧中的Intra8×8帧内预测模式采用本发明帧内预测模式的选择方法后的可选择的预测子模式个数将比现有技术的4种减少一半,所以对于亮度分量帧Intra 16×16帧内预测模式和色度分量帧Intra8×8帧内预测模式,只需对当前图像块M0 n选取图像块M0 n-1、M1 n和M2 n作为其固定序列参考图像块,即以图像块M0 n-1、M1 n和M2 n的最优预测子模式作为候选预测子模式,在这个预测子模式范围内进行计算判别来选取当前图像块M0 n自身的最优预测子模式,其帧内预测的准确度及其平均可选择的预测子模式个数,请参阅表2记载。
然后利用上述计算得到的相应固定序列参考图像块的结果,在后续每次对图像块进行帧内预测时,就可以根据帧内预测图像块的大小,直接使用上述多次实验得到的相应固定序列参考图像块,并在确定的固定序列参考图像块的最优预测子模式所形成的预测子模式集合内选取相应的最优预测子模式进行帧内预测。
由上表2可以看出,本发明帧内预测模式的选择方法能够在保证帧内预测准确度达到相当高的基础上,使得每个图像块平均需要计算判别的预测子模式数目相对于现有技术而言减少了许多,特别是对于亮度分量帧中的Intra 4×4帧内预测模式,需要计算判别的预测子模式个数将由原来的9种减少至2.5种左右,其计算复杂度的降低非常明显。
虽然,实施本发明帧内预测模式的选择方法后,其帧内预测准确度相当高,但同现有技术相比,仍然存在一定的误差;而且这种误差会随着编码过程从前面的图像帧向后逐步扩散传播,因此就会造成这种误差的积累放大。所以为了消除这种误差的扩散和积累,本发明提出利用本发明方法进行帧内预测模式选择时,规定对一些特定图像帧不能使用本发明的帧内预测模式选择方法,而是依旧使用现有技术的帧内预测模式选择方式,以提高帧内预测的准确度,防止误差的扩散及传播,其中这些特殊图像帧及其处理方式如下:
首先,对视频图像序列的第一图像帧中的每个图像块不能使用本发明帧内预测模式的选择算法,必须在Intra4×4帧内预测模式下的9种预测子模式中,或在Intra 16×16和Intra 8×8帧内预测模式下的4种预测子模式中进行选择其最优预测子模式的处理,以便后续图像帧的帧内预测更加准确。
再次,在整个视频图像序列中,需要每隔一定的帧数T选择一个图像帧Fecc,对该选择的图像帧Fecc中的每个图像块,必须在Intra4×4帧内预测模式下的9种预测子模式中,或在Intra 16×16和Intra 8×8帧内预测模式下的4种预测子模式中进行选择其最优预测子模式的处理,以彻底消除前面图像帧采用本发明帧内预测模式的选择方法后的帧内预测误差。其中T值的选取可以按照下列公式进行确定:
T=T0·λ(QP)
上式中,λ(QP)=0.25×2-(QP-12)/6,其中QP为量化参数,T0为QP等于0时T的取值,其中T0=200。
请参阅图7,该图是在本发明帧内预测模式的选择方法中,为进一步提高帧内预测准确度所提出的处理流程图;其主要处理过程如下:
步骤S31,判断当前图像帧是否是视频图像序列中的第一图像帧,如果是,执行步骤S32;否则执行步骤S33;
步骤S32,控制该第一图像帧中的每个图像块,在Intra 4×4帧内预测模式下的9种预测子模式中,或在Intra 16×16和Intra 8×8帧内预测模式下的4种预测子模式中选取其最优预测子模式进行帧内预测;对于后续图像帧的处理则转至执行步骤S33;
步骤S33,为当前图像帧中帧内预测图像块选取参考图像块;
步骤S34,控制帧内预测图像块在选取的各个参考图像块的最优预测子模式所形成的预测子模式集合内选取相应的最优预测子模式进行帧内预测;
步骤S35,控制视频图像序列中第nT个图像帧中的每个图像块,在Intra4×4帧内预测模式下的9种预测子模式中,或在Intra 16×16和Intra 8×8帧内预测模式下的4种预测子模式中选取自身的最优预测子模式进行帧内预测。其中T的确定如上所述,这里不再赘述,n=1,2,3,4.......。
综上所述,采用本发明帧内预测模式的选择方法所制造的多媒体通信设备相对于采用H.264国际标准的各种多媒体通信产品而言,可以降低视频编码的计算量,从而可以实现在一定成本下,提高产品的处理性能,比如提高视频图像的帧率,或者把处理器的处理资源用于其它计算环节的处理,从而提高产品的市场竞争力;或者在保持处理性能和同类产品相当的条件下,显著降低投入成本,也同样可以提高产品的市场竞争力。
表3.本发明技术方案和现有技术方案在性能方面的对比
根据上表3所提供的本发明技术方案和现有技术方案在处理性能方面的对比参数,可以得出:对于不同的典型测试视频图像序列,比如Foreman(剧烈运动)图像序列,News(中等运动)图像序列和Claire(低运动)图像序列在不同量化参数QP下,其处理性能包括:
PSNR(其PSNR值越高,图像质量越好);
编码产生码流的比特率(其比特率越低,压缩效率越高);和
编码速度(编码速度越高,图像运动感越平滑流畅)。
由表3可见,在PSNR基本相同的情况下,本发明技术方案处理的结果相对于现有技术方案处理的结果,其比特率会略有增加,但是增加数值很小,基本低于2%(比特率增加的原因是采用本发明帧内预测模式的选择方法后,部分图像块选择的最优预测子模式偏离其真正的最优预测子模式,导致预测残差上升,引起压缩效率轻微下降);然而本发明技术方案处理的结果相对于现有技术方案处理的结果,编码速度会有明显地提高,编码速度相对于现有技术方案的处理结果提高了10%到20%,大大提高了H.264压缩编码过程中的帧内预测编码速度,所以说该性能的提升是相当显著的。如果采用本发明技术方案,保持其编码速率一定,比如保持在25fps,那么多媒体通信设备的数字信号处理器(DSP)的处理能力将可以节省15%左右,这部分节省出来的处理能力完全可以用来处理多媒体通信设备的主控或者音频编解码,从而便可节省出一个另外的芯片,以直接导致产品成本的降低。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (13)

1、一种帧内预测模式的选择方法,用于对视频图像编码过程中的帧内预测模式进行选择,其特征在于,包括步骤:
(1)为当前图像帧中要进行帧内预测的图像块选取参考图像块;
(2)控制该图像块在各个参考图像块的最优预测子模式所形成的预测子模式集合内选取相应的最优预测子模式进行帧内预测;
所述步骤(2)中为该要进行帧内预测的图像块选取最优预测子模式是根据要进行帧内预测的图像块在每种最优预测子模式下的Cost函数值来选取的。
2、根据权利要求1所述的帧内预测模式的选择方法,其特征在于,所述参考图像块包括:
该要进行帧内预测的图像块的相邻已编码图像块;及
在前一图像帧中与该要进行帧内预测的图像块在当前图像帧中的位置对应的对应位置图像块;及
该对应位置图像块的相邻图像块。
3、根据权利要求2所述的帧内预测模式的选择方法,其特征在于,
所述相邻已编码图像块为相邻上方图像块,相邻左方图像块和相邻左上方图像块;
所述前帧对应位置图像块的相邻图像块为相邻左上方图像块,相邻上方图像块,相邻右上方图像块,相邻左方图像块,相邻右方图像块,相邻左下方图像块,相邻下方图像块和相邻右下方图像块。
4、根据权利要求1所述的帧内预测模式的选择方法,其特征在于,所述选取的过程具体包括步骤:
(21)使该要进行帧内预测的图像块分别在每个参考图像块的最优预测子模式下进行帧内预测,并分别计算在每种最优预测子模式下进行帧内预测的Cost函数值;
(22)选取最小函数值对应的预测子模式作为该要进行帧内预测的图像块的最优预测子模式。
5、根据权利要求1、2或3所述的帧内预测模式的选择方法,其特征在于,所述步骤(1)之前还包括步骤:
(A1)判断当前图像帧是否是视频图像序列中的第一图像帧,如果是,转至步骤(A2);否则转至步骤(1);
(A2)控制该第一图像帧中的每个图像块,在Intra 4×4帧内预测模式下的9种预测子模式中,或在Intra 16×16和Intra 8×8帧内预测模式下的4种预测子模式中选取最优预测子模式进行帧内预测;对于后续图像帧的处理转至步骤(1)。
6、根据权利要求5所述的帧内预测模式的选择方法,其特征在于,所述步骤(2)之后还包括步骤:控制视频图像序列的第nT个图像帧中的每个图像块,在Intra 4×4帧内预测模式下的9种预测子模式中,或在Intra 16×16和Intra8×8帧内预测模式下的4种预测子模式中选取最优预测子模式进行帧内预测;所述n为自然数,所述T由下列公式确定:
T=T0·λ(QP)
其中,λ(QP)=0.25×2-(QP-12)/6,QP为量化参数,T0=200。
7、一种帧内预测模式的选择方法,用于对视频图像编码过程中的帧内预测模式进行选择,其特征在于,包括:
固定序列参考图像块的选取步骤:
(A)为帧内预测图像块选取参考图像块;
(B)分别计算帧内预测图像块与每个选取的参考图像块之间的相关性;
(C)根据帧内预测图像块的大小,相应在选取的所有参考图像块中选定N个相关性高的固定序列参考图像块,所述N为自然数;
图像块帧内预测步骤:
(D)后续进行帧内预测过程中,根据当前图像帧中的帧内预测图像块的大小,直接在相应选定的固定序列参考图像块的最优预测子模式所形成的预测子模式集合内选取相应的最优预测子模式进行帧内预测;
所述步骤(D)中为帧内预测图像块选取最优预测子模式的过程包括步骤:
(D1)使帧内预测图像块分别在相应选定的固定序列参考图像块的最优预测子模式下进行帧内预测,并分别计算在每种最优预测子模式下进行帧内预测的Cost函数值;
(D2)选取最小函数值对应的预测子模式作为帧内预测图像块的最优预测子模式。
8、根据权利要求7所述的帧内预测模式的选择方法,其特征在于,所述参考图像块包括:
帧内预测图像块的相邻已编码图像块;及
在前一图像帧中与帧内预测图像块在当前图像帧中的位置对应的对应位置图像块;及
该对应位置图像块的相邻图像块。
9、根据权利要求8所述的帧内预测模式的选择方法,其特征在于,
所述相邻已编码图像块为相邻上方图像块,相邻左方图像块和相邻左上方图像块;
所述前帧对应位置图像块的相邻图像块为相邻左上方图像块,相邻上方图像块,相邻右上方图像块,相邻左方图像块,相邻右方图像块,相邻左下方图像块,相邻下方图像块和相邻右下方图像块。
10、根据权利要求7、8、或9所述的帧内预测模式的选择方法,其特征在于,所述步骤(A)和(B)之间还包括步骤:
分别计算帧内预测图像块及每个参考图像块在Intra 16×16帧内预测模式下的9种预测子模式中,或在Intra 8×8或Intra 4×4帧内预测模式下的4种预测子模式中的最优预测子模式;
所述步骤(B)的相关性根据如下公式进行计算:
Blkcorr ( f , p ) = 1 MRC Σ i = 0 M - 1 Σ j = 0 R - 1 Σ k = 0 C - 1 p ( i , j , k )
其中:(f,p)为标识参考图像块的参数;
Blkcorr(f,p)为帧内预测图像块和用(f,p)标识的参考图像块之间的相关性值;所述f=n时表示当前图像帧,f=n-1时表示前一图像帧;所述p=0,1,2,3,4,5,6,7,8,表示参考图像块在图像帧中的位置;
M为一个视频图像序列中包含的图像帧数目,R为一个图像帧中垂直方向的图像块数目,C为一个图像帧中水平方向的图像块数目;
i为帧内预测图像块所在图像帧的帧号,0≤i≤M-1;j为帧内预测图像块在图像帧中的行号,0≤j≤R-1;k为帧内预测图像块在图像帧中的列号,0≤k≤C-1;
当帧内预测图像块和用(f,p)标识的参考图像块的最优预测子模式相同时,p(i,j,k)=1;
当帧内预测图像块和用(f,p)标识的参考图像块的最优预测子模式不同时,p(i,.j,k)=0。
11、根据权利要求10所述的帧内预测模式的选择方法,其特征在于,
步骤(C)中当所述图像块为亮度分量帧中的4×4块时,所述N=5;所述5个相关性高的固定序列参考图像块分别为帧内预测图像块的相邻上方图像块和相邻左方图像块,及前一图像帧中的对应位置图像块,及该对应位置图像块的相邻右方图像块和相邻下方图像块;
步骤(C)中当所述图像块为亮度分量帧中的16×16块或为色度分量帧中的8×8块时,所述N=3;所述3个相关性高的固定序列参考图像块分别为帧内预测图像块的相邻上方图像块和相邻左方图像块,及前一图像帧中的对应位置图像块。
12、根据权利要求7所述的帧内预测模式的选择方法,其特征在于,所述步骤(D)之前还包括步骤:
(P1)判断当前图像帧是否是视频图像序列中的第一图像帧,如果是,转至步骤(P2);否则转至步骤(D);
(P2)控制该第一图像帧中的每个图像块,在Intra 4×4帧内预测模式下的9种预测子模式中,或在Intra 16×16和Intra 8×8帧内预测模式下的4种预测子模式中选取最优预测子模式进行帧内预测;对于后续图像帧的处理转至步骤(D)。
13、根据权利要求12所述的帧内预测模式的选择方法,其特征在于,所述步骤(D)之后还包括步骤:控制视频图像序列的第nT个图像帧中的每个图像块,在Intra 4×4帧内预测模式下的9种预测子模式中,或在Intra 16×16和Intra 8×8帧内预测模式下的4种预测子模式中选取最优预测子模式进行帧内预测;所述n为自然数,所述T由下列公式确定:
T=T0·λ(QP)
其中,λ(QP)=0.25×2-(QP-12)/6,QP为量化参数,T0=200。
CNB2004100793531A 2004-09-30 2004-09-30 帧内预测模式的选择方法 Expired - Fee Related CN100455021C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2004100793531A CN100455021C (zh) 2004-09-30 2004-09-30 帧内预测模式的选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2004100793531A CN100455021C (zh) 2004-09-30 2004-09-30 帧内预测模式的选择方法

Publications (2)

Publication Number Publication Date
CN1756364A CN1756364A (zh) 2006-04-05
CN100455021C true CN100455021C (zh) 2009-01-21

Family

ID=36689238

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100793531A Expired - Fee Related CN100455021C (zh) 2004-09-30 2004-09-30 帧内预测模式的选择方法

Country Status (1)

Country Link
CN (1) CN100455021C (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101087427B (zh) * 2006-06-06 2011-04-06 北京大学深圳研究生院 一种h.264标准的帧内预测模式选择方法
CN101350927B (zh) * 2008-07-29 2011-07-13 北京中星微电子有限公司 帧内预测选择最优预测模式的方法及装置
CN101340581B (zh) * 2008-08-15 2010-06-02 上海富瀚微电子有限公司 一种基于m算法的帧内预测模式选择方法及其实现装置
CN101572818B (zh) * 2009-06-01 2010-12-01 北京邮电大学 一种帧内预测模式的预测方法
KR20110068792A (ko) * 2009-12-16 2011-06-22 한국전자통신연구원 적응적 영상 부호화 장치 및 방법
CN101877792B (zh) * 2010-06-17 2012-08-08 无锡中星微电子有限公司 帧内模式预测方法与装置、编码器
CN107071426B (zh) * 2010-08-17 2019-07-12 M&K控股株式会社 用于编码帧内预测模式的方法
CN102238391B (zh) * 2011-05-25 2016-12-07 深圳市云宙多媒体技术有限公司 一种预测编码方法、装置
KR101953522B1 (ko) * 2011-06-17 2019-02-28 가부시키가이샤 제이브이씨 켄우드 화상 부호화 장치, 화상 부호화 방법 및 화상 부호화 프로그램, 및 화상 복호 장치, 화상 복호 방법 및 화상 복호 프로그램
CN103096055B (zh) 2011-11-04 2016-03-30 华为技术有限公司 一种图像信号帧内预测及解码的方法和装置
CN102420989B (zh) * 2011-12-07 2014-03-19 中国航空无线电电子研究所 帧内预测方法和装置
CN102946538B (zh) * 2012-11-09 2015-03-25 中国矿业大学 一种适合井下分布式视频编码中的快速帧内模式选择方法
CN104125463A (zh) * 2013-04-26 2014-10-29 华为技术有限公司 一种图像预测编码方法及图像编码器
CN103841405B (zh) * 2014-03-21 2016-07-06 华为技术有限公司 深度图像的编解码方法和编解码装置
CN112118444B (zh) * 2019-06-20 2022-11-25 杭州海康威视数字技术股份有限公司 编码方法及装置
CN110958454B (zh) * 2019-12-17 2020-12-01 湖南长城银河科技有限公司 帧内预测方法、系统及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4816906A (en) * 1986-08-29 1989-03-28 Aeg Aktiengesellschaft Method for motion-compensated frame-to-frame prediction coding
US20030206594A1 (en) * 2002-05-01 2003-11-06 Minhua Zhou Complexity-scalable intra-frame prediction technique
CN1492688A (zh) * 2003-09-30 2004-04-28 清华大学 用于宏块组结构的两阶段预测编码的帧内编码帧编码方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4816906A (en) * 1986-08-29 1989-03-28 Aeg Aktiengesellschaft Method for motion-compensated frame-to-frame prediction coding
US20030206594A1 (en) * 2002-05-01 2003-11-06 Minhua Zhou Complexity-scalable intra-frame prediction technique
CN1492688A (zh) * 2003-09-30 2004-04-28 清华大学 用于宏块组结构的两阶段预测编码的帧内编码帧编码方法

Also Published As

Publication number Publication date
CN1756364A (zh) 2006-04-05

Similar Documents

Publication Publication Date Title
CN100455021C (zh) 帧内预测模式的选择方法
CN100551025C (zh) 宏块编码方法及编码器
CN100461867C (zh) 一种帧内图像预测编码方法
CN104539974B (zh) 用于高分辨率运动图像的编码设备
CN101305610B (zh) 对视频编码进行编码模式判定的系统和方法
KR100739714B1 (ko) 인트라 예측 모드 결정 방법 및 장치
CN101385347B (zh) 视频帧内预测编码/解码的装置与方法
KR100957316B1 (ko) 멀티미디어 코딩을 위한 모드 선택 기술
CN100586187C (zh) 用于图像内部预测编码/解码的方法和设备
CN105306939B (zh) 用于对视频进行解码的方法和装置
CN101345876B (zh) 视频编码中的帧内预测编码设备及编码方法
CN100401789C (zh) H.264/avc帧内预测模式的快速选择方法
Kim et al. Low-complexity macroblock mode selection for H. 264-AVC encoders
CN1925619B (zh) 视频编码和解码的装置和方法
CN105959691A (zh) 用于对分割块进行编码的视频编码方法、用于对分割块进行解码的视频解码方法以及用于实施上述方法的记录媒体
CN101640802A (zh) 基于宏块特征和统计特性的视频帧间压缩编码方法
CN101889405A (zh) 用于执行运动估计的方法和装置
KR20070007295A (ko) 비디오 인코딩 방법 및 장치
CN102077598A (zh) 用于视频编码器中的计算有效的帧内模式预测的设备和方法
CN101022555B (zh) 帧间预测编码的模式快速选择方法
CN101527848A (zh) 图像编码设备
CN100484249C (zh) 视频帧间编码基于边缘方向的帧内预测方法
CN101304529A (zh) 宏块模式的选择方法和装置
CN101621689A (zh) Mpeg到h.264/avc视频编码转换系统
CN101867818B (zh) 宏块模式的选择方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090121

Termination date: 20160930

CF01 Termination of patent right due to non-payment of annual fee