CN104883565A - 一种高效视频编码的帧内预测模式决策方法及装置 - Google Patents

一种高效视频编码的帧内预测模式决策方法及装置 Download PDF

Info

Publication number
CN104883565A
CN104883565A CN201410855847.8A CN201410855847A CN104883565A CN 104883565 A CN104883565 A CN 104883565A CN 201410855847 A CN201410855847 A CN 201410855847A CN 104883565 A CN104883565 A CN 104883565A
Authority
CN
China
Prior art keywords
hsad
mode
search
pattern
low
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410855847.8A
Other languages
English (en)
Inventor
蔡砚刚
魏伟
白茂生
刘阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LeTV Information Technology Beijing Co Ltd
Original Assignee
LeTV Information Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LeTV Information Technology Beijing Co Ltd filed Critical LeTV Information Technology Beijing Co Ltd
Priority to CN201410855847.8A priority Critical patent/CN104883565A/zh
Publication of CN104883565A publication Critical patent/CN104883565A/zh
Pending legal-status Critical Current

Links

Abstract

一种高效视频编码的帧内预测模式决策方法及装置,该方法包括:将当前PU块的方向性预测模式按照各模式所对应的序号依次分为M个方向模式组,并采用二分法分别查找出各方向模式组中基于哈达玛变换的率失真代价最小的一个最优帧内预测模式;对模式0、模式1、一个或多个最可能预测模式和上述各方向模式组中的最优帧内预测模式做基于哈达玛变换的粗选,选择出其中基于哈达玛变换的率失真代价最小的N个帧内预测模式加入到筛选列表中;对筛选列表中包含的帧内预测模式进行率失真优化运算,选取其中一个最优的帧内预测模式用于预测所述当前PU块。与现有技术相比,本发明可以在视频压缩质量不变的情况下,将帧内预测编码速度提高20%。

Description

一种高效视频编码的帧内预测模式决策方法及装置
技术领域
本申请涉及视频编码领域,尤其涉及一种高效视频编码(High EfficiencyVideo Coding,HEVC)的帧内预测模式决策方法及装置。
背景技术
近年来,随着互联网和硬件设备的发展,视频的制作成本愈来愈低,对视频的分享和访问需求日益增强。视频的分辨率愈来愈大,高清视频(分辨率为1920×1080,记作1080p)甚至超高清视频(分辨率为3840×2160,记作4K)被越来越多地制作、传播和播放。然而,无论是MPEG-2(MovingPicture Experts Group 2,运动图像专家组系列标准2)或是H.264/AVC(Advanced Video Coding,高级视频编码)都不是为这种高分辨率视频所设计的,这对视频压缩技术提出了新的要求及挑战。
2013年,由ITU-T(International Telecommunication UnionTelecommunication Standardization Sector,国际电信联合会电信标准化分会)VCEG(Video Coding Experts Group,视频编码专家组)和ISO(International Organization for Standardization,国际标准化组织)MPEG(Moving Picture Experts Group,运动图像专家组)联合成立的视频编码联合协作团队(Joint Collaborative Team on Video Coding,JCT-VC)研究制定了新一代视频编码标准,即高效视频编码(HEVC)标准。与H.264/AVC相比,在相同的画质下,采用HEVC标准可以节省一半上的码率。
图1是H.264/AVC和HEVC分别采用的帧内预测模式的示意图。如图1所示,与H.264/AVC所采用的帧内预测模式相比,HEVC采用了多方向帧内预测,方向数高达35个。包含Intra Planar模式(记作:模式0)、Intra DC模式(记作:模式1)以及33种方向性预测模式(记作:模式2~模式34):Intra_Angular[i],i=2,…,34,这使得HEVC的帧内预测更加精细,预测值更加准确。
如图1所示,HEVC的33种方向性预测模式中,模式10称为水平方向预测模式。模式2~9可称为向下偏移水平方向的方向性预测模式,模式11~34可称为向上偏移水平方向的方向性预测模式。
模式26称为垂直方向预测模式,模式27~34可称为向右偏移垂直方向的方向性预测模式,模式2~25可称为向左偏移垂直方向的方向性预测模式。
HEVC中的帧内预测模式有35种,如果对每一种帧内预测模式都做一次率失真优化(Rate Distortion Optimization,RDO)运算,即对每一种帧内预测模式都进行一次预测、变换、量化、熵编码、反量化、反变换和求失真处理,将使编码器的计算复杂度成几何倍数增长。因此,需要一个帧内预测模式的快速决策方法来选取最佳的预测模式以减小运算量。
发明内容
本申请所要解决的技术问题是,克服现有技术的不足,提供一种可减少进行帧内预测模式决策运算量的高效视频编码(HEVC)帧内预测模式决策方法及装置。
为了解决上述问题,本申请提供一种高效视频编码的帧内预测模式决策方法,其特征在于,该方法包括:
将当前PU块的方向性预测模式按照各模式所对应的序号依次分为M个方向模式组,并采用二分法分别查找出各方向模式组中基于哈达玛变换的率失真代价最小的一个最优帧内预测模式;
对Intra Planar模式、Intra DC模式、一个或多个最可能预测模式和上述各方向模式组中的最优帧内预测模式做基于哈达玛变换的粗选,选择出其中基于哈达玛变换的率失真代价最小的N个帧内预测模式加入到筛选列表中;
对所述筛选列表中包含的帧内预测模式进行率失真优化运算,选取其中一个最优的帧内预测模式用于预测所述当前PU块;
其中:M为大于等于2且小于9的整数;N为正整数且小于进行所述粗选的帧内预测模式的个数。
此外,将方向差小于或等于45度的相邻的方向性预测模式划分至一个方向模式组中;
其中,进行上述分组时,将向下偏移水平方向的方向性预测模式和向上偏移水平方向的方向性预测模式分入不同的方向模式组;将向左偏移垂直方向的方向性预测模式和向右偏移垂直方向的方向性预测模式分入不同的方向模式组。
此外,所述N等于3。
此外,采用如下步骤进行所述二分法查找:
A:对当前待查找的方向模式组中包含的各模式按照其序号排序,并将该方向模式组中的所有方向性预测模式确定为初始的搜索区间;
B:计算当前搜索区间的两个端点Low和High所对应的帧内预测模式的基于哈达玛变换的率失真代价值:HSADLow和HSADHigh
C:如果当前搜索区间中仅包含2个帧内预测模式,则根据HSADLow和HSADHigh的大小确定该方向模式组中的最优帧内预测模式;否则:
在两个端点Low和High之间确定一中间点Mid,并根据HSADLow和HSADHigh的大小确定新的搜索区间的两个端点,并跳转至步骤B:
如果HSADLow<HSADHigh,则将Low和Mid分别作为新的搜索区间的两个端点;
如果HSADLow>HSADHigh,则将Mid和High分别作为新的搜索区间的两个端点。
此外,在所述步骤C中,还包括:
如果HSADLow=HSADHigh,则在Low和Mid之间确定一中间点Mid1,在Mid与High之间确定一中间点Mid2;分别计算Mid1和Mid2所对应的帧内预测模式的基于哈达玛变换的率失真代价值:HSADMid1和HSADMid2;并根据HSADMid1和HSADMid2的值确定新的搜索区间:
如果HSADMid1≤HSADMid2,将Low和Mid分别作为新的搜索区间的两个端点;
如果HSADMid1>HSADMid2,将Mid和High分别作为新的搜索区间的两个端点。
本发明还提供一种高效视频编码的帧内预测模式决策装置,该装置包含:粗选模块,率失真优化筛选模块,二分法查找模块;其中:
所述二分法查找模块,用于将当前预测单元PU块的方向性预测模式按照各模式所对应的序号依次分为M个方向模式组,并采用二分法分别查找并输出各方向模式组中基于哈达玛变换的率失真代价最小的一个最优帧内预测模式;
所述粗选模块,用于对Intra Planar模式、Intra DC模式、一个或多个最可能预测模式和所述二分法查找模块输出的各方向模式组中的最优帧内预测模式做基于哈达玛变换的粗选,选择并输出其中基于哈达玛变换的率失真代价最小的N个帧内预测模式;
所述率失真优化筛选模块,用于对所述粗选模块输出的N个帧内预测模式进行率失真优化运算,选取并输出其中一个最优的帧内预测模式用于预测所述当前PU块;
其中:M为大于等于2且小于9的整数;N为正整数且小于进行所述粗选的帧内预测模式的个数。
此外,所述二分法查找模块将方向差小于或等于45度的相邻的方向性预测模式划分至一个方向模式组中;
其中,进行上述分组时,将向下偏移水平方向的方向性预测模式和向上偏移水平方向的方向性预测模式分入不同的方向模式组;将向左偏移垂直方向的方向性预测模式和向右偏移垂直方向的方向性预测模式分入不同的方向模式组。
此外,所述二分法查找模块采用如下方式进行所述二分法查找:
A:对当前待查找的方向模式组中包含的各模式按照其序号排序,并将该方向模式组中的所有方向性预测模式确定为初始的搜索区间;
B:计算当前搜索区间的两个端点Low和High所对应的帧内预测模式的基于哈达玛变换的率失真代价值:HSADLow和HSADHigh
C:如果当前搜索区间中仅包含2个帧内预测模式,则根据HSADLow和HSADHigh的大小确定该方向模式组中的最优帧内预测模式;否则:
在两个端点Low和High之间确定一中间点Mid,并根据HSADLow和HSADHigh的大小确定新的搜索区间的两个端点,并跳转至步骤B:
如果HSADLow<HSADHigh,则将Low和Mid分别作为新的搜索区间的两个端点;
如果HSADLow>HSADHigh,则将Mid和High分别作为新的搜索区间的两个端点。
此外,如果HSADLow=HSADHigh,所述二分法查找模块采用如下方式确定新的搜索区间:
在Low和Mid之间确定一中间点Mid1,在Mid与High之间确定一中间点Mid2;分别计算Mid1和Mid2所对应的帧内预测模式的基于哈达玛变换的率失真代价值:HSADMid1和HSADMid2;并根据HSADMid1和HSADMid2的值确定新的搜索区间:
如果HSADMid1≤HSADMid2,将Low和Mid分别作为新的搜索区间的两个端点;
如果HSADMid1>HSADMid2,将Mid和High分别作为新的搜索区间的两个端点。
此外,所述N等于3。
综上所述,本发明充分利用了35种帧内预测模式中的33种方向性预测模式在预测角度上的渐变特征所对应的率失真代价值的渐变特征,以二分法查找方式代替现有技术中对所有的35种帧内预测模式进行哈达玛粗选的方式,在不丢失每个分组中的最优解的前提下,过滤掉不太可能成为最优帧内预测模式的候选模式,减少了进行哈达玛粗选的帧内预测模式的个数,进而提高了帧内预测模式决策的运算效率。与现有技术相比,本发明可以在视频压缩质量不变的情况下,将帧内预测编码速度提高20%。
附图说明
图1是H.264/AVC和HEVC分别采用的帧内预测模式的示意图;
图2是现有的HM参考软件提出的一种帧内预测模式快速决策方法的流程图;
图3为本发明实施例HEVC帧内预测模式决策方法流程图;
图4是本发明另一具体实施例HEVC帧内预测模式决策方法流程图;
图4-1为本发明实施例采用二分法查找方向模式组中基于哈达玛变换的率失真代价最小的一个最优帧内预测模式的方法流程图;
图5是本发明实施例HEVC帧内预测模式决策装置结构示意图。
具体实施方式
本发明的核心是,将33种方向性预测模式按照方向/角度(或者帧内模式序号)的顺序分为M(M可以为4)个方向模式组,并在各方向模式组中采用二分法查找出各方向模式组中基于哈达玛变换的率失真代价最小的一个最优帧内预测模式;对模式0、模式1和各方向模式组中最优的一个帧内预测模式做基于哈达玛变换的粗选,选择出其中基于哈达玛变换的率失真代价最小的N(N可以为3)个帧内预测模式加入RDO筛选列表中,并将MPM加入RDO筛选列表中;最后对RDO筛选列表中的各帧内预测模式进行RDO运算,得到各帧内预测模式的率失真代价值Jmode,最终选取其中Jmode最小的一个最优的帧内预测模式用于预测当前PU块。
现有的HM(HEVC Test Model,HEVC测试模型)参考软件提出了一种如图2所示的帧内预测模式快速决策方法。如图2所示,该方法包括:
步骤201:对当前PU(Prediction Unit,预测单元)块对应的所有帧内预测模式做基于哈达玛变换的粗选(Rough Mode Decision,RMD),即计算各预测方向上基于哈达玛变换的率失真代价,并选取其中率失真代价最小的8个(对于大小为4×4和8×8的PU块)或3个(对于大小为16×16、32×32、64×64的PU块)帧内预测模式加入RDO筛选列表中;
由于哈达玛变换(Hadamard Transform,HT)可以近似地估计视频编码中的码率信息,因此可以用哈达玛变换所计算得到的率失真代价来代替以RDO运算计算得到的率失真代价,以便减少搜索最佳帧内预测模式的计算量。
上述基于哈达玛变换的率失真代价是对图像预测之后残差值的哈达玛变换代价值加上编码预测模式所估计的比特值,在本文中我们简称为哈达玛变换代价值,记作HSAD,如公式1所示。
HSAD=SATD+λ·B
SATD = ( &Sigma; i , j | DiffT ( i , j ) | ) / 2          公式1
公式1中,HSAD表示哈达玛变换代价值,SATD表示预测之后得到的残差经过哈达玛变换后的累加和,λ表示拉格朗日系数,B表示预测单元采用当前预测模式估计得到的比特位数。
本步骤中,对不同大小的PU块,加入上述RDO筛选列表中的帧内预测模式的个数不同:对于大小为4×4和8×8的PU块,选取HSAD最小的前8个最优预测模式加入上述RDO筛选列表中,以便进行后续的RDO运算及筛选;对于大小为16×16、32×32、64×64的PU块,选取HSAD最小的前3个最优预测模式加入上述RDO筛选列表中,以便进行后续的RDO运算及筛选。
步骤202:获得当前PU块的相邻块的最可能预测模式(Most ProbableMode,MPM),并将MPM也加入上述RDO筛选列表中;
MPM包含三个选项,前两个选项根据当前PU块的上邻PU块和左邻PU块设定。如果上邻PU块和左邻PU块与当前PU块属于同一个CTB(Coding Tree Block,树形编码块),且为帧内预测模式,则选定上邻PU块和左邻PU块的帧内预测模式作为当前PU块的MPM候选模式,否则判定相邻块不可用,选择Intra DC模式为MPM候选模式。
如果前两个MPM候选模式不相同,则按照Intra DC(模式1),IntraPlanar(模式0)和Intra垂直预测模式(即模式2~模式34中的垂直方向预测模式)的顺序选择一个与前两个MPM候选模式不重复的模式作为第三个MPM候选模式;
如果前两个MPM候选模式相同并且是Intra DC(模式1)或Intra Planar(模式0),则按照Intra DC,Intra Planar和Intra垂直预测模式的顺序选择两个不重复的模式作为MPM候选模式;
如果前两个MPM候选模式相同并且是方向性预测模式,则选择离对应方向最近的两个预测模式作为第二和第三个MPM候选模式。
如果当前PU块的预测模式和MPM候选模式之一相同,则只需编码该候选模式在MPM中的索引值即可;否则,使用5比特定长编码对当前PU块的帧内预测模式进行编码。
步骤203:对RDO筛选列表中包含的多个帧内预测模式进行RDO运算,得到各帧内预测模式所对应的基于RDO运算的率失真代价(记作Jmode),选取Jmode最小的一个最优的帧内预测模式用于预测当前PU块。
表1为现有的HM参考软件的帧内预测模式快速决策方法中针对不同的PU大小所需进行的基于哈达玛变换的粗选(记作HAD筛选)和RDO筛选的次数。
表1
虽然现有技术中的上述帧内预测模式快速决策方法可以降低帧内预测模式决策的运算量,但是在进行RDO筛选时,对于大小为4×4和8×8的PU块仍可能需要进行9次左右的RDO运算,进行帧内预测模式决策的运算量依然相对较大。
图3是本发明实施例HEVC帧内预测模式决策方法流程图;如图3所示,该方法包括:
步骤301:将当前PU块的方向性预测模式按照各模式所对应的序号依次分为M个方向模式组,并采用二分法分别查找出各方向模式组中基于哈达玛变换的率失真代价最小的一个最优帧内预测模式。
步骤302:对Intra Planar模式、Intra DC模式、一个或多个最可能预测模式和上述各方向模式组中的最优帧内预测模式做基于哈达玛变换的粗选,选择出其中基于哈达玛变换的率失真代价最小的N个帧内预测模式加入到筛选列表中。
步骤303:对所述筛选列表中包含的帧内预测模式进行率失真优化运算,选取其中一个最优的帧内预测模式用于预测所述当前PU块。
下面结合图4对是本发明一个实施例HEVC帧内预测模式决策方法流程进行说明。本实施例的帧内预测模式决策方法包括:
步骤401:将当前PU块的33种方向性预测模式(即模式2~模式34)按照方向/角度,或者说按照其帧内预测模式序号分为4个方向模式组;其中:将水平方向的方向性预测模式分为两组,分别记作方向模式组1和方向模式组2;将垂直方向的方向性预测模式分为两组,分别记作方向模式组3和方向模式组4;
方向模式组1中包含的各预测模式序号为:{2,3,4,5,6,7,8,9,10};
方向模式组2中包含的各预测模式序号为:{11,12,13,14,15,16,17,18};
方向模式组3中包含的各预测模式序号为:{19,20,21,22,23,24,25,26};
方向模式组4中包含的各预测模式序号为:{27,28,29,30,31,32,33,34}。
步骤402:采用二分法分别查找出4个方向模式组中基于哈达玛变换的率失真代价最小的一个最优帧内预测模式;
图4-1为本发明实施例采用二分法查找方向模式组中基于哈达玛变换的率失真代价最小的一个最优帧内预测模式的方法流程图;如图4-1所示,该方法包括:
步骤402a:将待搜索方向模式组中的各预测模式按照其预测模式序号排序;
本步骤中可以按照预测模式序号由小到大或者由大到小的顺序进行排序,优选为以由小到大的顺序对待搜索方向模式组中的各预测模式的序号排序,以减少内存的占用。
步骤402b:将整个待搜索方向模式组设定为初始的搜索区间;
将搜索区间记作I,搜索区间I的两个端点的预测模式序号分别记作Low和High;I可以表示为:I[Low,…,High];
例如,当前的待搜索方向模式组为方向模式组1,则初始搜索区间I={2,3,4,5,6,7,8,9,10};I的端点Low=2,High=10。
步骤402c:如果尚未计算,则计算当前搜索区间I的两个端点所对应帧内预测模式的基于哈达玛变换的率失真代价值,分别记作:HSADLow和HSADHigh
步骤402d:判断当前搜索区间中预测模式的个数k:如果k=2,则根据HSADLow和HSADHigh的值确定当前方向模式组中的最优帧内预测模式;在当前方向模式组的二分法查找结束。
步骤402e:确定在当前搜索区间中位于两个端点之间的一个点,将该点所对应的预测模式序号记作Mid;并根据HSADLow和HSADHigh的值确定下一级搜索区间;
本步骤中,可以令:
其中,表示向上取整,表示向下取整。
如果HSADLow<HSADHigh,则将搜索区间I中Low点至Mid点所包含的各预测模式作为新的搜索区间:I[Low,…,Mid];
如果HSADLow>HSADHigh,则将搜索区间I中Mid点至High点所包含的各预测模式作为新的搜索区间:I[Mid,…,High];
如果HSADLow=HSADHigh,则:
步骤402e1:在Low点与Mid点之间确定一个点,记作Mid1,并在Mid与High之间确定一个点,记作Mid2;
Mid1和Mid2的确定方法与上述Mid的确定方法类似;
步骤402e2:分别计算Mid1和Mid2所对应帧内预测模式的基于哈达玛变换的率失真代价值,分别记作:HSADMid1和HSADMid2;根据HSADMid1和HSADMid2的值确定下一级搜索区间:
如果HSADMid1≤HSADMid2,将搜索区间I中Low点至Mid点所包含的各预测模式作为新的搜索区间:I[Low,…,Mid];
如果HSADMid1>HSADMid2,将搜索区间I中Mid点至High点所包含的各预测模式作为新的搜索区间:I[Mid,…,High]。
在本发明的其它实施例中,如果HSADLow=HSADHigh,也可以在[Low,…,Mid]和[Mid,…,High]中随机选择一个作为新的搜索区间。
步骤402f:跳转至步骤402c。
步骤403:对模式0、模式1和各方向模式组中的最优帧内预测模式做基于哈达玛变换的粗选,选择出其中率失真代价最小的3个帧内预测模式加入RDO筛选列表中。
步骤404:获得当前PU块的相邻块的最可能预测模式(Most ProbableMode,MPM),并将MPM也加入上述RDO筛选列表中。
步骤405:对RDO筛选列表中包含的多个帧内预测模式进行RDO运算,得到各帧内预测模式所对应的基于RDO运算的率失真代价(记作Jmode),选取Jmode最小的一个最优的帧内预测模式用于预测当前PU块。
本实施例中,基于RDO运算的率失真代价计算方法流程图包含如下步骤:
步骤a:将当前的编码块记作Fec,根据当前的预测方向生成相应的预测块,记作Pre;
步骤b:根据Fec和Pre计算生成当前预测方向的残差块Res:Res=Fec–Pre;
步骤c:对残差块作变换,将残差块Res从时域信号变换成频域信号,记作TRes;
步骤d:对变换后的残差块TRes进行量化,得到量化后的残差块QTRes;
步骤e:对量化后的残差块QTRes进行熵编码,以获得该残差块所占用的比特数目R;
步骤f:对量化后的残差块QTRes进行反量化,得到反量化后的残差块TRes’;
步骤g:对反量化后的残差块TRes’做反变换,将残差块从频域信号变换为时域信号,记作Res’;
步骤h:根据残差块Res’和预测块Pre得到当前的重构解码块Rec:Rec=Res’+Pre;
步骤i:根据编码块Fec和重构解码块Rec计算得到当前编码块的失真D=Fec–Rec;
步骤j:根据失真D和比特数目R值计算当前预测方向的率失真代价J=D+λR,其中λ为Lagrange系数。
从上述流程可以看到,基于RDO运算的率失真代价计算过程复杂,需要很大的运算量。
由上可知,本发明的上述实施例根据33种方向性预测模式在预测角度上的渐变特征所对应的率失真代价值的渐变特征,将33种方向性预测模式按照不同的方向区间分为4个方向模式组后,在每一方向模式组中采用二分法查找出基于哈达玛变换的率失真代价最小的一个最优帧内预测模式,无需对各方向模式组中的每一方向性预测模式进行哈达玛变换,减少了进行哈达玛变换的次数,从而减少了帧内预测模式决策的整体运算量。
图5是本发明实施例HEVC帧内预测模式决策装置结构示意图;如图5所示,该装置包含:二分法查找模块,粗选模块,RDO筛选模块;其中:
二分法查找模块,用于将当前PU块的方向性预测模式按照各模式所对应的序号依次分为M个方向模式组,并采用二分法分别查找并输出各方向模式组中基于哈达玛变换的率失真代价最小的一个最优帧内预测模式;
粗选模块,用于对Intra Planar模式、Intra DC模式、一个或多个最可能预测模式和二分法查找模块输出的各方向模式组中的最优帧内预测模式做基于哈达玛变换的粗选,选择并输出其中基于哈达玛变换的率失真代价最小的N个帧内预测模式;
率失真优化筛选模块,用于对粗选模块输出的N个帧内预测模式进行率失真优化运算,选取并输出其中一个最优的帧内预测模式用于预测当前PU块;
其中:M为大于等于2且小于9的整数;N为正整数且小于进行粗选的帧内预测模式的个数。
此外,二分法查找模块将方向差小于或等于45度的相邻的方向性预测模式划分至一个方向模式组中;
其中,进行上述分组时,将向下偏移水平方向的方向性预测模式和向上偏移水平方向的方向性预测模式分入不同的方向模式组;将向左偏移垂直方向的方向性预测模式和向右偏移垂直方向的方向性预测模式分入不同的方向模式组。
此外,二分法查找模块采用如下方式进行二分法查找:
A:对当前待查找的方向模式组中包含的各模式按照其序号排序,并将该方向模式组中的所有方向性预测模式确定为初始的搜索区间;
B:计算当前搜索区间的两个端点Low和High所对应的帧内预测模式的基于哈达玛变换的率失真代价值:HSADLow和HSADHigh
C:如果当前搜索区间中仅包含2个帧内预测模式,则根据HSADLow和HSADHigh的大小确定该方向模式组中的最优帧内预测模式;否则:
在两个端点Low和High之间确定一中间点Mid,并根据HSADLow和HSADHigh的大小确定新的搜索区间的两个端点,并跳转至步骤B:
如果HSADLow<HSADHigh,则将Low和Mid分别作为新的搜索区间的两个端点;
如果HSADLow>HSADHigh,则将Mid和High分别作为新的搜索区间的两个端点。
此外,如果HSADLow=HSADHigh,二分法查找模块采用如下方式确定新的搜索区间:
在Low和Mid之间确定一中间点Mid1,在Mid与High之间确定一中间点Mid2;分别计算Mid1和Mid2所对应的帧内预测模式的基于哈达玛变换的率失真代价值:HSADMid1和HSADMid2;并根据HSADMid1和HSADMid2的值确定新的搜索区间:
如果HSADMid1≤HSADMid2,将Low和Mid分别作为新的搜索区间的两个端点;
如果HSADMid1>HSADMid2,将Mid和High分别作为新的搜索区间的两个端点。
上述N等于3。
根据本发明的基本原理,上述实施例还可以有其它变换方式,例如:
(一)本发明的上述实施例将33种方向性预测模式分为4个方向模式组,并确定了每个方向模式组中包含的方向性预测模式的序号;
在本发明的其它实施例中,可以对上述各方向模式组中的序号进行微调,例如,将模式10从方向模式组1调到方向模式组2;将模式18从方向模式组2调到方向模式组3;将模式26从方向模式组3调到方向模式组4;等等。
(二)本发明的上述实施例将33种方向性预测模式分为4个方向模式组,即M=4;
在本发明的其它实施例中,可以对M值进行如下设置:
M=2;例如,将水平方向的方向性预测模式分为1组,将垂直方向的方向性预测模式分为1组;或
M=3;例如,将水平方向的方向性预测模式分为1组,将垂直方向的方向性预测模式分为2组;或水平方向的方向性预测模式分为2组,将垂直方向的方向性预测模式分为1组;或
M=5;例如,将水平方向的方向性预测模式分为2组,将垂直方向的方向性预测模式分为3组;或将水平方向的方向性预测模式分为3组,将垂直方向的方向性预测模式分为2组;或
M=6;例如,将水平方向的方向性预测模式分为3组,将垂直方向的方向性预测模式分为3组。
需要注意的是,在上述分组方案中,仍然需要保证各方向模式组中的方向性预测模式序号的连续性。
综上所述,本发明充分利用了35种帧内预测模式中的33种方向性预测模式在预测角度上的渐变特征所对应的率失真代价值的渐变特征,以二分法查找方式代替现有技术中对所有的35种帧内预测模式进行哈达玛粗选的方式,在不丢失每个分组中的最优解的前提下,过滤掉不太可能成为最优帧内预测模式的候选模式,减少了进行哈达玛粗选的帧内预测模式的个数,进而提高了帧内预测模式决策的运算效率。与现有技术相比,本发明可以在视频压缩质量不变的情况下,将帧内预测编码速度提高20%。

Claims (10)

1.一种高效视频编码的帧内预测模式决策方法,其特征在于,该方法包括:
将当前PU块的方向性预测模式按照各模式所对应的序号依次分为M个方向模式组,并采用二分法分别查找出各方向模式组中基于哈达玛变换的率失真代价最小的一个最优帧内预测模式;
对Intra Planar模式、Intra DC模式、一个或多个最可能预测模式和上述各方向模式组中的最优帧内预测模式做基于哈达玛变换的粗选,选择出其中基于哈达玛变换的率失真代价最小的N个帧内预测模式加入到筛选列表中;
对所述筛选列表中包含的帧内预测模式进行率失真优化运算,选取其中一个最优的帧内预测模式用于预测所述当前PU块;
其中:M为大于等于2且小于9的整数;N为正整数且小于进行所述粗选的帧内预测模式的个数。
2.如权利要求1所述的方法,其特征在于,
将方向差小于或等于45度的相邻的方向性预测模式划分至一个方向模式组中;
其中,进行上述分组时,将向下偏移水平方向的方向性预测模式和向上偏移水平方向的方向性预测模式分入不同的方向模式组;将向左偏移垂直方向的方向性预测模式和向右偏移垂直方向的方向性预测模式分入不同的方向模式组。
3.如权利要求1或2所述的方法,其特征在于,
所述N等于3。
4.如权利要求1所述的方法,其特征在于,
采用如下步骤进行所述二分法查找:
A:对当前待查找的方向模式组中包含的各模式按照其序号排序,并将该方向模式组中的所有方向性预测模式确定为初始的搜索区间;
B:计算当前搜索区间的两个端点Low和High所对应的帧内预测模式的基于哈达玛变换的率失真代价值:HSADLow和HSADHigh
C:如果当前搜索区间中仅包含2个帧内预测模式,则根据HSADLow和HSADHigh的大小确定该方向模式组中的最优帧内预测模式;否则:
在两个端点Low和High之间确定一中间点Mid,并根据HSADLow和HSADHigh的大小确定新的搜索区间的两个端点,并跳转至步骤B:
如果HSADLow<HSADHigh,则将Low和Mid分别作为新的搜索区间的两个端点;
如果HSADLow>HSADHigh,则将Mid和High分别作为新的搜索区间的两个端点。
5.如权利要求4所述的方法,其特征在于,
在所述步骤C中,还包括:
如果HSADLow=HSADHigh,则在Low和Mid之间确定一中间点Mid1,在Mid与High之间确定一中间点Mid2;分别计算Mid1和Mid2所对应的帧内预测模式的基于哈达玛变换的率失真代价值:HSADMid1和HSADMid2;并根据HSADMid1和HSADMid2的值确定新的搜索区间:
如果HSADMid1≤HSADMid2,将Low和Mid分别作为新的搜索区间的两个端点;
如果HSADMid1>HSADMid2,将Mid和High分别作为新的搜索区间的两个端点。
6.一种高效视频编码的帧内预测模式决策装置,其特征在于,该装置包含:粗选模块,率失真优化筛选模块,二分法查找模块;其中:
所述二分法查找模块,用于将当前预测单元PU块的方向性预测模式按照各模式所对应的序号依次分为M个方向模式组,并采用二分法分别查找并输出各方向模式组中基于哈达玛变换的率失真代价最小的一个最优帧内预测模式;
所述粗选模块,用于对Intra Planar模式、Intra DC模式、一个或多个最可能预测模式和所述二分法查找模块输出的各方向模式组中的最优帧内预测模式做基于哈达玛变换的粗选,选择并输出其中基于哈达玛变换的率失真代价最小的N个帧内预测模式;
所述率失真优化筛选模块,用于对所述粗选模块输出的N个帧内预测模式进行率失真优化运算,选取并输出其中一个最优的帧内预测模式用于预测所述当前PU块;
其中:M为大于等于2且小于9的整数;N为正整数且小于进行所述粗选的帧内预测模式的个数。
7.根据权利要求6所述的装置,其特征在于,
所述二分法查找模块将方向差小于或等于45度的相邻的方向性预测模式划分至一个方向模式组中;
其中,进行上述分组时,将向下偏移水平方向的方向性预测模式和向上偏移水平方向的方向性预测模式分入不同的方向模式组;将向左偏移垂直方向的方向性预测模式和向右偏移垂直方向的方向性预测模式分入不同的方向模式组。
8.根据权利要求6所述的装置,其特征在于,
所述二分法查找模块采用如下方式进行所述二分法查找:
A:对当前待查找的方向模式组中包含的各模式按照其序号排序,并将该方向模式组中的所有方向性预测模式确定为初始的搜索区间;
B:计算当前搜索区间的两个端点Low和High所对应的帧内预测模式的基于哈达玛变换的率失真代价值:HSADLow和HSADHigh
C:如果当前搜索区间中仅包含2个帧内预测模式,则根据HSADLow和HSADHigh的大小确定该方向模式组中的最优帧内预测模式;否则:
在两个端点Low和High之间确定一中间点Mid,并根据HSADLow和HSADHigh的大小确定新的搜索区间的两个端点,并跳转至步骤B:
如果HSADLow<HSADHigh,则将Low和Mid分别作为新的搜索区间的两个端点;
如果HSADLow>HSADHigh,则将Mid和High分别作为新的搜索区间的两个端点。
9.根据权利要求8所述的装置,其特征在于,
如果HSADLow=HSADHigh,所述二分法查找模块采用如下方式确定新的搜索区间:
在Low和Mid之间确定一中间点Mid1,在Mid与High之间确定一中间点Mid2;分别计算Mid1和Mid2所对应的帧内预测模式的基于哈达玛变换的率失真代价值:HSADMid1和HSADMid2;并根据HSADMid1和HSADMid2的值确定新的搜索区间:
如果HSADMid1≤HSADMid2,将Low和Mid分别作为新的搜索区间的两个端点;
如果HSADMid1>HSADMid2,将Mid和High分别作为新的搜索区间的两个端点。
10.根据权利要求6所述的装置,其特征在于,
所述N等于3。
CN201410855847.8A 2014-12-31 2014-12-31 一种高效视频编码的帧内预测模式决策方法及装置 Pending CN104883565A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410855847.8A CN104883565A (zh) 2014-12-31 2014-12-31 一种高效视频编码的帧内预测模式决策方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410855847.8A CN104883565A (zh) 2014-12-31 2014-12-31 一种高效视频编码的帧内预测模式决策方法及装置

Publications (1)

Publication Number Publication Date
CN104883565A true CN104883565A (zh) 2015-09-02

Family

ID=53950883

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410855847.8A Pending CN104883565A (zh) 2014-12-31 2014-12-31 一种高效视频编码的帧内预测模式决策方法及装置

Country Status (1)

Country Link
CN (1) CN104883565A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105208391A (zh) * 2015-09-17 2015-12-30 广州市百果园网络科技有限公司 帧内预测方法及装置
CN105812825A (zh) * 2016-05-10 2016-07-27 中山大学 一种基于分组的图像编码方法
CN105847794A (zh) * 2015-11-18 2016-08-10 西安邮电大学 一种hevc帧内预测模式快速选择方法
CN106131547A (zh) * 2016-07-12 2016-11-16 北京大学深圳研究生院 视频编码中帧内预测模式的快速决策方法
CN107371023A (zh) * 2017-08-07 2017-11-21 福建星网智慧科技股份有限公司 一种帧内亮度预测模式的快速选择方法
WO2018233411A1 (zh) * 2017-06-23 2018-12-27 腾讯科技(深圳)有限公司 预测模式选择方法、视频编码设备及存储介质
CN109672895A (zh) * 2018-12-27 2019-04-23 北京佳讯飞鸿电气股份有限公司 一种hevc帧内预测方法及系统
CN110786015A (zh) * 2017-05-04 2020-02-11 交互数字Vc控股公司 用于帧内预测的最可能模式(mpm)重新排序的方法和装置
WO2020042916A1 (en) * 2018-08-27 2020-03-05 Huawei Technologies Co., Ltd. Method and Apparatus for Intra Prediction
WO2020062161A1 (zh) * 2018-09-29 2020-04-02 富士通株式会社 一种确定用于帧内预测的最可能模式的方法、装置和电子设备
WO2020135256A1 (zh) * 2018-12-29 2020-07-02 腾讯科技(深圳)有限公司 用于帧内编码的方法、装置、帧编码器、帧编码系统
CN112565752A (zh) * 2020-11-13 2021-03-26 北京百度网讯科技有限公司 对视频数据进行编码的方法、装置、设备和介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101247525A (zh) * 2008-03-24 2008-08-20 北京邮电大学 一种提高图像帧内编码速率的方法
WO2009004985A1 (ja) * 2007-06-29 2009-01-08 Sharp Kabushiki Kaisha 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法、プログラム、および記録媒体
EP2391130A2 (en) * 2010-05-30 2011-11-30 LG Electronics Inc. Enhanced intra mode signaling
CN102665078A (zh) * 2012-05-08 2012-09-12 北方工业大学 用于hevc的基于方向矢量的帧内预测模式决策
CN103297781A (zh) * 2013-06-07 2013-09-11 安科智慧城市技术(中国)有限公司 一种基于纹理方向的hevc帧内编码方法、装置和系统
CN103517069A (zh) * 2013-09-25 2014-01-15 北京航空航天大学 一种基于纹理分析的hevc帧内预测快速模式选择方法
CN104052994A (zh) * 2014-04-14 2014-09-17 嘉兴职业技术学院 分级自适应的hevc帧内预测模式快速决策方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009004985A1 (ja) * 2007-06-29 2009-01-08 Sharp Kabushiki Kaisha 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法、プログラム、および記録媒体
CN101247525A (zh) * 2008-03-24 2008-08-20 北京邮电大学 一种提高图像帧内编码速率的方法
EP2391130A2 (en) * 2010-05-30 2011-11-30 LG Electronics Inc. Enhanced intra mode signaling
CN102665078A (zh) * 2012-05-08 2012-09-12 北方工业大学 用于hevc的基于方向矢量的帧内预测模式决策
CN103297781A (zh) * 2013-06-07 2013-09-11 安科智慧城市技术(中国)有限公司 一种基于纹理方向的hevc帧内编码方法、装置和系统
CN103517069A (zh) * 2013-09-25 2014-01-15 北京航空航天大学 一种基于纹理分析的hevc帧内预测快速模式选择方法
CN104052994A (zh) * 2014-04-14 2014-09-17 嘉兴职业技术学院 分级自适应的hevc帧内预测模式快速决策方法

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105208391A (zh) * 2015-09-17 2015-12-30 广州市百果园网络科技有限公司 帧内预测方法及装置
CN105847794A (zh) * 2015-11-18 2016-08-10 西安邮电大学 一种hevc帧内预测模式快速选择方法
CN105812825B (zh) * 2016-05-10 2019-02-26 中山大学 一种基于分组的图像编码方法
CN105812825A (zh) * 2016-05-10 2016-07-27 中山大学 一种基于分组的图像编码方法
CN106131547A (zh) * 2016-07-12 2016-11-16 北京大学深圳研究生院 视频编码中帧内预测模式的快速决策方法
WO2018010492A1 (zh) * 2016-07-12 2018-01-18 北京大学深圳研究生院 视频编码中帧内预测模式的快速决策方法
CN106131547B (zh) * 2016-07-12 2018-07-03 北京大学深圳研究生院 视频编码中帧内预测模式的快速决策方法
CN110786015B (zh) * 2017-05-04 2023-09-12 交互数字Vc控股公司 用于帧内预测的最可能模式(mpm)重新排序的方法和装置
CN110786015A (zh) * 2017-05-04 2020-02-11 交互数字Vc控股公司 用于帧内预测的最可能模式(mpm)重新排序的方法和装置
CN109120926A (zh) * 2017-06-23 2019-01-01 腾讯科技(深圳)有限公司 预测模式选择方法、装置及视频编码设备
US10986332B2 (en) 2017-06-23 2021-04-20 Tencent Technology (Shenzhen) Company Limited Prediction mode selection method, video encoding device, and storage medium
CN109120926B (zh) * 2017-06-23 2019-08-13 腾讯科技(深圳)有限公司 预测模式选择方法、装置及介质
WO2018233411A1 (zh) * 2017-06-23 2018-12-27 腾讯科技(深圳)有限公司 预测模式选择方法、视频编码设备及存储介质
CN107371023A (zh) * 2017-08-07 2017-11-21 福建星网智慧科技股份有限公司 一种帧内亮度预测模式的快速选择方法
WO2020042916A1 (en) * 2018-08-27 2020-03-05 Huawei Technologies Co., Ltd. Method and Apparatus for Intra Prediction
CN112385227A (zh) * 2018-08-27 2021-02-19 华为技术有限公司 用于帧内预测的方法和装置
US11044469B2 (en) 2018-08-27 2021-06-22 Huawei Technologies Co., Ltd. Method and apparatus for intra prediction
WO2020062161A1 (zh) * 2018-09-29 2020-04-02 富士通株式会社 一种确定用于帧内预测的最可能模式的方法、装置和电子设备
CN109672895A (zh) * 2018-12-27 2019-04-23 北京佳讯飞鸿电气股份有限公司 一种hevc帧内预测方法及系统
US11582444B2 (en) 2018-12-29 2023-02-14 Tencent Technology (Shenzhen) Company Limited Intra-frame coding method and apparatus, frame coder, and frame coding system
WO2020135256A1 (zh) * 2018-12-29 2020-07-02 腾讯科技(深圳)有限公司 用于帧内编码的方法、装置、帧编码器、帧编码系统
CN112565752A (zh) * 2020-11-13 2021-03-26 北京百度网讯科技有限公司 对视频数据进行编码的方法、装置、设备和介质
CN112565752B (zh) * 2020-11-13 2023-04-14 北京百度网讯科技有限公司 对视频数据进行编码的方法、装置、设备和介质

Similar Documents

Publication Publication Date Title
CN104883565A (zh) 一种高效视频编码的帧内预测模式决策方法及装置
CN102474599B (zh) 用于对图像进行编码的方法和设备,用于对编码图像进行解码的方法和设备
CN103220528B (zh) 通过使用大型变换单元编码和解码图像的方法和设备
CN104602011B (zh) 图像解码装置
CN102301716B (zh) 解码代表画面序列的流的方法,编码画面序列的方法以及编码的数据结构
CN109845254A (zh) 影像编码/解码方法及装置
CN102474609B (zh) 对图像编码的方法和设备及对图像解码的方法和设备
CN102939753A (zh) 用于通过根据像素组补偿像素值来对视频进行编码的方法和设备以及用于通过根据像素组补偿像素值来对视频进行解码的方法和设备
CN103220522A (zh) 对视频编码的方法和设备及对视频解码的方法和设备
CN102740077B (zh) 基于h.264/avc标准的帧内预测模式选择方法
CN102932642B (zh) 一种帧间编码快速模式选择方法
CN104094600A (zh) 用于包括量化参数预测的基于分层数据单元的视频编码和解码的方法和设备
CN105141954A (zh) 一种hevc帧间编码快速模式选择方法
CN102640495A (zh) 运动向量编码/解码方法和装置及使用该方法和装置的图像编码/解码方法和装置
CN104994393A (zh) 根据像素分类使用偏移调整的视频解码方法及其设备
CN103797803A (zh) 用于熵编码/解码的方法和设备
CN102763411A (zh) 对视频编码的方法和设备以及对视频解码的方法和设备
CN104796711A (zh) 视频的编码方法和装置及视频的解码方法和装置
CN107105289A (zh) 基于帧间预测对视频信号进行解码的方法
CN101895751A (zh) 帧内预测的方法及装置、基于帧内预测的编/解码方法及系统
CN103327325A (zh) 基于hevc标准的帧内预测模式快速自适应选择方法
CN103596004A (zh) Hevc中基于数学统计和分类训练的帧内预测方法及装置
CN103929652A (zh) 视频标准中基于自回归模型的帧内预测快速模式选择方法
CN105306957A (zh) 自适应环路滤波方法和设备
CN107318016A (zh) 一种基于零块分布的hevc帧间预测模式快速判定方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20181116

AD01 Patent right deemed abandoned