CN105141954B - 一种hevc帧间编码快速模式选择方法 - Google Patents

一种hevc帧间编码快速模式选择方法 Download PDF

Info

Publication number
CN105141954B
CN105141954B CN201510509889.0A CN201510509889A CN105141954B CN 105141954 B CN105141954 B CN 105141954B CN 201510509889 A CN201510509889 A CN 201510509889A CN 105141954 B CN105141954 B CN 105141954B
Authority
CN
China
Prior art keywords
mrow
patterns
ctu
interframe
mtd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510509889.0A
Other languages
English (en)
Other versions
CN105141954A (zh
Inventor
朱威
张训华
王财盛
朱慧
陈朋
郑雅羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201510509889.0A priority Critical patent/CN105141954B/zh
Publication of CN105141954A publication Critical patent/CN105141954A/zh
Application granted granted Critical
Publication of CN105141954B publication Critical patent/CN105141954B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明涉及一种HEVC帧间编码快速模式选择方法,包括以下步骤:(1)输入一帧视频数据;(2)选取一个待估计CTU;(3)计算当前CTU的深度预测范围;(4)选取当前CTU中一个待估计CU;(5)大尺寸帧间PU模式的估计;(6)小尺寸帧间PU模式估计的选择;(7)对称帧间PU模式的估计;(8)非对称帧间PU模式估计的选择;(9)帧内PU模式的估计;(10)选取当前CU的最佳PU模式;(11)终止CU划分的判断;(12)重复步骤(4)~(11),完成所有CU的估计;(13)重复步骤(2)~(12),完成当前帧中所有CTU的估计。本发明能够有效减少HEVC的编码时间,同时保持良好的率失真性能。

Description

一种HEVC帧间编码快速模式选择方法
技术领域
本发明涉及数字视频编码领域,具体涉及一种HEVC帧间编码快速模式选择方法。
背景技术
随着视频会议、视频监控和数字电视等视频多媒体应用逐渐走进人们的生活,高清视频(720P和1080P)和超高清视频(4K和8K)相继出现,人们对更高分辨率和更高帧率的视频不断提出新的要求。目前广泛应用的视频编码标准H.264已很难满足高清和超高清视频存储及传输的发展需求。为进一步获得更高效的视频编码效率,国际组织ITU-T的视频编码专家组(Video Coding Experts Group,VCEG)和ISO/IEC的运动图像专家组(MovingPicture Experts Group,MPEG)成立视频编码联合专家组(Joint Collaborative Team onVideo Coding,JCT-VC),于2013年制定新一代高效率视频编码(High Efficiency VideoCoding,HEVC)标准。与H.264相比,HEVC在相同视频质量的条件下可以节约50%左右的视频码流(见G.J.Sullivan,J.R.Ohm,W.J.Han,and T.Wiegand,Overview of the highefficiency video coding(HEVC)standard,即“高效率视频编码(HEVC)标准概述”,IEEETransactions on Circuits and Systems for Video Technology,vol.22,no.12,pp.1649-1668,Dec.2012),但其编码计算复杂度也成倍增加,这严重阻碍了它在工业领域和民用领域的快速应用。HEVC采用许多编码技术,包括编码树单元(Coding Tree Unit,CTU)四叉树划分(见I.-K.Kim,J.Min,T.Lee,W.J.Han,and J.Park,Block partitionstructure in the HEVC standard,即“HEVC标准中的块划分结构”,IEEE Transactionson Circuits and Systems for Video Technology,vol.22,no.12,pp.1697-1706,Dec.2012)、非对称帧间预测单元(Prediction Unit,PU)模式和多方向帧内PU模式等。在HEVC编码过程中,一帧图像先被划分成多个CTU,每个CTU可采用四叉树划分技术再被逐层划分为一个或多个CU,其中每个CU可以被划分为4个子CU或者不进行划分,如果当前CU被划分为4个子CU,则当前CU是其子CU的父CU。与H.264中的尺寸固定为16×16的编码宏块相比,CTU的四叉树划分技术使CU的划分尺寸种类增加,这使得帧间和帧内编码更具适应性和多样性,显著地提升了视频压缩效率。HEVC参考模型HM中,CTU的默认尺寸为64×64,最大深度值默认为3,深度范围为[0,3],CU的尺寸可以为64×64、32×32、16×16和8×8,对应深度值分别为0、1、2和3。HEVC以PU为单位依次进行帧间和帧内PU模式估计,组成每个CU的PU个数可以是1、2或4个。CU的候选PU模式分两大类:帧间PU模式和帧内PU模式,其中帧间PU模式包括Skip、Merge、Inter 2N×2N、Inter N×N、Inter N×2N、Inter 2N×N、Inter 2N×nU、Inter 2N×nD、Inter nL×2N和Inter nR×2N,帧内PU模式包括Intra 2N×2N和Intra N×N。Skip模式是一种特殊的帧间PU模式,它采用HEVC标准默认的预测矢量进行帧间预测,其量化预测残差全为零,因此无需将预测矢量和量化预测残差编入码流;Merge模式是另一种特殊的帧间PU模式,它同样采用HEVC标准默认的预测矢量进行帧间预测,但存在非零量化预测残差,因此只需将量化预测残差编入码流;其它帧间PU模式则都需要将预测矢量和量化预测残差编入码流。为了提高编码压缩效率,每个CU需要先对各种模式进行估计,再从中选取率失真代价最小的模式作为最佳编码模式(见T.Wiegand,H.Schwarz,A.Joch,F.Kossentini,and G.J.Sullivan,Rate-constrained coder control and comparisonof video coding standards,即“视频编码标准的率失真编码器控制与比较”,IEEETransactions on Circuits and Systems for Video Technology,vol.13,no.7,pp.688-703,July 2003)。由于CTU采用四叉树划分技术,HM采用全搜索的模式选择方法,在每个CTU的编码过程中采用四叉树先序遍历的方式处理所有深度和CU,并且每次遍历都需计算出对应深度CU的各个候选PU模式的率失真代价,以获得最佳CTU划分和最佳PU模式。这种模式选择方法可以获得很好的编码率失真性能,但消耗了HEVC编码大部分的处理时间。
目前已经有一些研究人员对HEVC快速模式选择方法展开研究。申请号为201410041255.2的专利利用前一帧中两个相邻CU的深度关系,缩小当前CU的深度搜索范围。申请号为201310470508.3的专利不仅分析相邻CTU的深度特点来获取当前CTU深度遍历区间类型,而且采用贝叶斯决策原理对CU进行早期裁剪。除了以上方法通过预测当前CU深度来减少HEVC编码复杂度,还可以根据时域相邻CU的最佳PU模式来减少当前CU的模式估计,以降低编码计算复杂度。申请号为201410662687.5的专利首先将视频的运动强度分为三种状态,其次统计分析运动缓慢、运动适中状态的CU的最佳PU模式与其时域相邻CU的最佳PU模式的关系,然后构建候选PU模式列表,最后根据该模式列表,对当前CU模式估计,得到最佳PU模式。HEVC编码模式选择需要的处理时间与视频本身特征有关,纹理越简单且运动量越小,选择Skip模式为最佳PU模式的可能性就大,整体编码时间就可以降低。因此基于视频的纹理或运动信息,利用Skip模式特征能有效地降低编码计算复杂度(见S.Ahn,B.Lee,and M.Kim,A novel fast CU encoding scheme based on spatiotemporalencoding parameters for HEVC inter coding,即“一种新的基于时空编码参数HEVC的CU帧间编码快速方案”,IEEE Transactions on Circuits and Systems for VideoTechnology,vol.25,no.3,pp.422-435,Mar.2015;以及见L.Shen,Z.Liu,X.Zhang,W.Zhao,and Z.Zhang,An effective CU size decision method for HEVC encoders,即“一种高效的HEVC编码器CU尺寸决策方法”,IEEE Transactions on Multimedia,vol.15,no.2,pp.465-470,Feb.2013)。
以上这些方法中虽然已使用视频的时间和空间相关性来提高处理性能,但CTU编码信息的时空相关性还未充分挖掘。为了进一步降低HEVC的编码时间,我们可以利用相邻CTU的最小深度值和最大深度值,来预测当前CTU的深度范围,以减少CTU的整体划分次数;利用当前CU已估计PU模式的率失真代价和父CU的最佳PU模式,跳过当前CU的部分冗余帧间PU模式。
发明内容
为了在保持编码率失真性能的条件下显著地降低HEVC编码计算复杂度,本发明提供了一种HEVC帧间编码快速模式选择方法。
为了解决上述技术问题采用的技术方案为:
一种HEVC帧间编码快速模式选择方法,所述方法包括以下步骤:
(1)输入一帧视频数据;
(2)选取一个待估计CTU:
按从上到下、从左到右的顺序,从当前帧中选取一个待估计CTU。所述的CTU的尺寸为64×64或32×32;根据HEVC编码标准要求,一帧视频数据中所有CTU的尺寸都相同,其中CTU尺寸为64×64具有更好的压缩效率,CTU尺寸为32×32具有更少的计算复杂度。
(3)计算当前CTU的深度预测范围:
当前CTU与时空相邻CTU具有编码信息相关性,所述的时空相邻CTU包括当前CTU空间相邻的左方CTU(标记为L-CTU)、上方CTU(标记为U-CTU)和时间相邻的参考帧中相同位置CTU(标记为Col-CTU),在对当前CTU进行估计之前,这三个时空相邻的CTU都已经完成估计。当Col-CTU存在,且L-CTU和U-CTU中至少有1个存在的情况下,利用时空相邻CTU的深度信息来计算当前CTU的深度预测范围R,如式(I)所示:
式(I)中,DMIN和DMAX分别为所有存在的时空相邻CTU中的最小深度值和最大深度值;dMAX为当前帧CTU允许的最大深度值,如果当前帧CTU尺寸为64×64,则dMAX值为3,如果当前帧CTU尺寸为32×32,则dMAX值为2。当Col-CTU不存在、或L-CTU和U-CTU都不存在的情况下,当前CTU的深度预测范围R为[0,dMAX]。
(4)选择当前CTU中一个待估计CU:
按四叉树先序遍历的方式,为当前CTU选择一个深度值在R内的待估计CU。
(5)大尺寸帧间PU模式的估计:
对当前待估计CU进行Skip、Merge和Inter 2N×2N这三种大尺寸帧间PU模式的估计,分别计算它们的率失真代价RDSkip、RDMerge和RDInter2N×2N,并从中选取最小值作为大尺寸帧间PU模式的率失真代价RDSquare
(6)小尺寸帧间PU模式估计的选择:
所述的小尺寸帧间PU模式包括Inter N×N、Inter N×2N、Inter 2N×N、Inter 2N×nU、Inter 2N×nD、Inter nL×2N和Inter nR×2N这七种帧间PU模式。对当前待估计CU进行小尺寸帧间PU模式估计的选择按如下顺序执行:
首先利用步骤(5)得到的RDSkip、RDMerge和RDInter 2N×2N计算小尺寸帧间PU模式估计的选择标志Flag1和Flag2,如式(II)和式(III)所示:
式(II)和(III)中,参数α和β都是用来调整选择精度和计算复杂度,通常根据统计分析来选取,设为0.7~1.2;式(III)中,RDParent为父CU的率失真代价,所述的父CU为包含当前CU的上一层CU,系数四分之一代表当前CU与其父CU之间的像素点个数比值;式(III)中,如果当前CU的父CU不存在,则Flag2为0。
然后根据父CU的最佳PU模式、Flag1和Flag2来判断是否进行小尺寸帧间PU模式的估计:如果父CU的最佳PU模式为Skip模式,那么当前CU选取大尺寸帧间PU模式为最佳PU模式的可能性较大,则不进行小尺寸帧间PU模式的估计,跳到步骤(9);如果当前CU符合Skip模式条件且Flag1等于1,那么当前CU选取大尺寸帧间PU模式为最佳PU模式的可能性较大,则不进行小尺寸帧间PU模式的估计,跳到步骤(9);如果当前CU不符合Skip模式条件且Flag2等于1,那么当前CU所覆盖的区域大都运动量小且纹理简单,则不进行小尺寸帧间PU模式的估计,跳到步骤(9);其他情况则执行步骤(7)。
(7)对称帧间PU模式的估计:
所述的对称帧间PU模式包括Inter N×N、Inter N×2N和Inter 2N×N这三种帧间PU模式。本步骤对当前待估计CU进行对称帧间PU模式的估计,分别计算它们的率失真代价,并从中选取率失真代价最小值作为对称帧间PU模式的率失真代价RDSymmetry
(8)非对称帧间PU模式估计的选择:
所述的非对称帧间PU模式包括Inter 2N×nU、Inter 2N×nD、Inter nL×2N和Inter nR×2N这四种帧间PU模式。对当前待估计CU进行非对称帧间PU模式估计的选择按如下顺序执行:
首先利用由步骤(5)得到的RDSquare和步骤(7)得到的RDSymmetry来计算非对称帧间PU模式的选择标志Flag3,如式(IV)所示:
式(IV)中,参数γ是用于调整选择精度和计算复杂度,通常根据统计分析来选取,设为0.7~1.2。
然后根据父CU的最佳PU模式和Flag3来选择是否进行非对称帧间PU模式的估计:如果父CU的最佳PU模式为Merge或Inter 2N×2N模式,那么当前CU所覆盖的区域大都运动量规则且较小,纹理较简单,则不进行非对称帧间PU模式的估计;如果Flag3等于1,表明大尺寸帧间PU模式的估计效果已经较好,那么当前CU选择非对称帧间PU模式为最佳模式的可能性较小,则不进行非对称帧间PU模式的估计;其他情况,则进行非对称帧间PU模式的估计,并计算它们的率失真代价。
(9)帧内PU模式的估计:
对当前待估计CU进行Intra 2N×2N和Intra N×N这两种帧内PU模式的估计,并计算它们的率失真代价。
(10)选取当前CU的最佳PU模式:
从已估计的帧间PU模式和帧内PU模式中选取率失真代价最小的PU模式作为当前CU的最佳PU模式,并将最小的率失真代价作为当前CU的率失真代价。
(11)终止CU划分的判断:
首先根据当前CU空间相邻的左方CU和上方CU、时间相邻的参考帧中相同位置CU、以及父CU的率失真代价来计算终止CU划分的率失真代价阈值Th,其中,左方CU记为L-CU,上方CU记为U-CU,时间相邻的参考帧中相同位置CU记为Col-CU,如式(V)所示:
式(V)中,参数η是用来调整终止CU划分的率失真代价阈值,通常根据统计分析来选取,设为0.5~1.1;L-CU、U-CU和Col-CU都与当前CU具有相同的CU尺寸;当L-CU、U-CU和Col-CU都存在时,Th由L-CU、U-CU和Col-CU的平均率失真代价RDavg-LUC计算得到,RDavg-LUC等于L-CU、U-CU和Col-CU的率失真代价相加除以3;当只有L-CU和Col-CU存在时,Th由L-CU和Col-CU的平均率失真代价RDavg-LC计算得到,RDavg-LC等于L-CU和Col-CU的率失真代价相加除以2;当只有U-CU和Col-CU存在时,Th由U-CU和Col-CU的平均率失真代价RDavg-UC计算得到,RDavg-UC等于U-CU和Col-CU的率失真代价相加除以2。
然后根据Th判断是否终止当前CU划分:如果当前CU的率失真代价小于Th,则终止当前CU的四叉树划分,即在步骤(4)中将不再遍历当前CU的四个子CU。
(12)重复执行步骤(4)~(11),完成所有CU的估计:
完成所有待估计CU的最佳PU模式和率失真代价的选取;根据所有已估计CU的率失真代价,选择率失真代价总和最小的CU划分方式作为当前CTU的最佳四叉树划分。
(13)重复步骤(2)~(12),完成当前帧中所有CTU的估计。
本发明的技术构思为:首先根据已估计的时空相邻CTU的最大深度值和最小深度值计算当前CTU的深度预测范围,由该深度预测范围判断是否进行当前深度所有PU模式的估计;然后根据当前CU三种大尺寸帧间PU模式的率失真代价和父CU的最佳PU模式判断是否进行三种对称帧间PU模式的估计;接着根据当前CU三种大尺寸帧间PU模式和三种对称帧间PU模式的率失真代价以及父CU的最佳PU模式来判断是否进行四种非对称帧间PU模式的估计;最后根据已估计的时空相邻CU和父CU的率失真代价计算终止CU划分的阈值,由该阈值判断是否终止当前CU划分。
与现有技术相比,本发明具有以下有益效果:
本发明提供了一种HEVC帧间编码快速模式选择方法。该方法适用于HEVC帧间编码的模式选择,与现有技术相比,具有如下特点和优点:利用已估计的相邻CTU的深度统计信息计算深度预测范围;利用大尺寸帧间PU模式的率失真代价、对称帧间PU模式的率失真代价和父CU的最佳模式,减少候选帧间PU模式的估计;利用已估计时空相邻CU和父CU的率失真代价,判断是否终止当前CU划分。在保持良好的编码率失真性能的条件下,本发明能显著地降低HEVC帧间编码模式选择的计算复杂度,与HM中全搜索的模式选择方法相比,可以降低50%以上的编码时间。另外,本发明不仅对不同纹理复杂度和运动复杂度的视频编码效果都较好,而且对高清高分辨率视频的优化效果更加显著。
附图说明
图1为本发明方法的基本流程图。
具体实施方式
下面结合实施例和附图来详细描述本发明,但本发明并不仅限于此。
如图1所示,一种HEVC帧间编码快速模式选择方法,包括以下步骤:
(1)输入一帧视频数据;
(2)选取一个待估计CTU;
(3)计算当前CTU的深度预测范围;
(4)选择当前CTU中一个待估计CU;
(5)大尺寸帧间PU模式的估计;
(6)小尺寸帧间PU模式估计的选择:
(7)对称帧间PU模式的估计;
(8)非对称帧间PU模式估计的选择;
(9)帧内PU模式的估计;
(10)选取当前CU的最佳PU模式;
(11)终止CU划分的判断;
(12)完成所有CU的估计;
(13)完成当前帧中所有CTU的估计。
本实施例中,所述的大尺寸帧间PU模式包括Skip、Merge和Inter 2N×2N这三种帧间PU模式;所述的小尺寸帧间PU模式包括Inter N×N、Inter N×2N、Inter 2N×N、Inter2N×nU、Inter 2N×nD、Inter nL×2N和Inter nR×2N这七种帧间PU模式;所述的对称帧间PU模式包括Inter N×N、Inter N×2N和Inter 2N×N这三种帧间PU模式;所述的非对称帧间PU模式包括Inter 2N×nU、Inter 2N×nD、Inter nL×2N和Inter nR×2N这四种帧间PU模式;所述的父CU为包含当前CU的上一层CU。
步骤(2)具体包括:
按从上到下、从左到右的顺序,从当前帧中选取一个待估计CTU;本实施例为了保证压缩效率,将CTU尺寸设为64×64。
步骤(3)具体包括:
当前CTU与时空相邻CTU具有相关性,所述的时空相邻CTU包括当前CTU空间相邻的左方CTU(标记为L-CTU)和上方CTU(标记为U-CTU),时间相邻的参考帧中相同位置CTU(标记为Col-CTU)。当Col-CTU存在,且L-CTU和U-CTU中至少有1个存在的情况下,利用时空相邻CTU的深度信息来计算当前CTU的深度预测范围R,如式(I)所示:
式(I)中,DMIN和DMAX分别为所有存在的时空相邻CTU中的最小深度值和最大深度值;dMAX为当前帧CTU允许的最大深度值,本实施例中CTU尺寸为64×64,对应的dMAX值为3。当Col-CTU不存在、或L-CTU和U-CTU都不存在的情况下,当前CTU的深度预测范围R为[0,3]。
步骤(4)具体包括:
按四叉树先序遍历的方式,为当前CTU选择一个深度值在R内的待估计CU。
步骤(5)具体包括:
进行大尺寸帧间PU模式的估计,分别计算它们的率失真代价RDSkip、RDMerge和RDInter 2N×2N,并从中选取最小值作为大尺寸PU模式的率失真代价RDSquare
步骤(6)具体包括:
首先利用步骤(5)得到的RDSkip、RDMerge和RDInter 2N×2N计算小尺寸帧间PU模式估计的选择标志Flag1和Flag2,如式(II)和式(III)所示:
式(II)和(III)中,参数α和β都是用来调整选择精度和计算复杂度,设为0.7~1.2,此处α和β设为1.0;式(III)中,RDParent为父CU的率失真代价;系数四分之一代表当前CU与其父CU之间的像素点个数比值;式(III)中,如果当前CU的父CU不存在,则Flag2为0。
然后根据父CU的最佳PU模式、Flag1和Flag2来判断是否进行小尺寸帧间PU模式的估计:如果父CU的最佳PU模式为Skip模式,则不进行小尺寸帧间PU模式的估计,跳到步骤(9);如果当前CU符合Skip模式条件且Flag1等于1,则不进行小尺寸帧间PU模式的估计,跳到步骤(9);如果当前CU不符合Skip模式条件且Flag2等于1,则不进行小尺寸帧间PU模式的估计,跳到步骤(9);其他情况则执行步骤(7)。
步骤(7)具体包括:
进行对称帧间PU模式的估计,分别计算它们的率失真代价,并从中选取率失真代价最小值作为对称帧间PU模式的率失真代价RDSymmetry
步骤(8)具体包括:
首先利用由步骤(5)得到的RDSquare和步骤(7)得到的RDSymmetry来计算非对称帧间PU模式的选择标志Flag3,如式(IV)所示:
式(IV)中,参数γ是用于调整选择精度和计算复杂度,设为0.7~1.2,此处γ设为1.0。
然后根据父CU的最佳PU模式和Flag3来选择是否进行非对称帧间PU模式的估计:如果父CU的最佳PU模式为Merge或Inter 2N×2N模式,则不进行非对称帧间PU模式的估计;如果Flag3等于1,则不进行非对称帧间PU模式的估计;其他情况,则进行非对称帧间PU模式的估计,并计算它们的率失真代价。
步骤(9)具体包括:
进行Intra 2N×2N和Intra N×N这两种帧内PU模式的估计,并计算这两种模式的率失真代价。
步骤(10)具体包括:
从已估计的帧间PU模式和帧内PU模式中选取率失真代价最小的PU模式作为当前CU的最佳PU模式,并将最小的率失真代价作为当前CU的率失真代价。
步骤(11)具体包括:
首先根据当前CU空间相邻的左方CU和上方CU、时间相邻的参考帧中相同位置CU、以及父CU的率失真代价来计算终止CU划分的率失真代价阈值Th,其中,左方CU记为L-CU,上方CU记为U-CU,时间相邻的参考帧中相同位置CU记为Col-CU,如式(V)所示:
式(V)中,参数η是用来调整终止CU划分的率失真代价阈值,通常根据经验来选取,设为0.5~1.1,此处η设为0.7;L-CU、U-CU和Col-CU都与当前CU具有相同的CU尺寸。当L-CU、U-CU和Col-CU都存在时,Th由L-CU、U-CU和Col-CU的平均率失真代价RDavg-LUC计算得到,RDavg-LUC等于L-CU、U-CU和Col-CU的率失真代价相加除以3;当只有L-CU和Col-CU存在时,Th由L-CU和Col-CU的平均率失真代价RDavg-LC计算得到,RDavg-LC等于L-CU和Col-CU的率失真代价相加除以2;当只有U-CU和Col-CU存在时,Th由U-CU和Col-CU的平均率失真代价RDavg-UC计算得到,RDavg-UC等于U-CU和Col-CU的率失真代价相加除以2。
然后根据Th判断是否终止当前CU划分:如果当前CU的率失真代价小于Th,则终止当前CU的四叉树划分,即在步骤(4)不再遍历当前CU的四个子CU。
步骤(12)具体包括:
重复执行步骤(4)~(11),完成所有CU的估计。完成所有待估计CU的最佳PU模式和率失真代价的选取。根据所有已估计CU的率失真代价,选择率失真代价总和最小的CU划分方式作为当前CTU的最佳四叉树划分。
步骤(13)具体包括:
重复执行步骤(2)~(12),完成当前帧中所有CTU的估计。

Claims (4)

1.一种HEVC帧间编码快速模式选择方法,其特征在于,所述的选择方法包括以下步骤:
(1)输入一帧视频数据;
(2)选取一个待估计CTU:
按从上到下、从左到右的顺序,从当前帧中选取一个待估计CTU;所述的CTU的尺寸为64×64或32×32;
(3)计算当前CTU的深度预测范围;
(4)选择当前CTU中一个待估计CU:
按四叉树先序遍历的方式,为当前CTU选择一个深度值在深度预测范围内的待估计CU;
(5)大尺寸帧间PU模式的估计:
对当前待估计CU进行Skip、Merge和Inter 2N×2N这三种大尺寸帧间PU模式的估计,分别计算它们的率失真代价RDSkip、RDMerge和RDInter2N×2N,并从中选取最小值作为大尺寸帧间PU模式的率失真代价RDSquare
(6)小尺寸帧间PU模式估计的选择:
根据当前待估计CU的RDSkip、RDMerge、RDInter2N×2N、父CU的率失真代价RDParent和父CU的最佳PU模式判断当前待估计CU是否进行Inter N×N、Inter N×2N、Inter 2N×N、Inter 2N×nU、Inter 2N×nD、Inter nL×2N和Inter nR×2N这七种小尺寸帧间PU模式的估计;
首先利用步骤(5)得到的RDSkip、RDMerge和RDInter2N×2N计算小尺寸帧间PU模式估计的选择标志Flag1和Flag2,如式(II)和式(III)所示:
<mrow> <mi>F</mi> <mi>l</mi> <mi>a</mi> <mi>g</mi> <mn>1</mn> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>1</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <msub> <mi>RD</mi> <mrow> <mi>S</mi> <mi>k</mi> <mi>i</mi> <mi>p</mi> </mrow> </msub> <mo>&lt;</mo> <mi>&amp;alpha;</mi> <mo>&amp;times;</mo> <msub> <mi>RD</mi> <mrow> <mi>I</mi> <mi>n</mi> <mi>t</mi> <mi>e</mi> <mi>r</mi> <mn>2</mn> <mi>N</mi> <mo>&amp;times;</mo> <mn>2</mn> <mi>N</mi> </mrow> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>0</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>o</mi> <mi>t</mi> <mi>h</mi> <mi>e</mi> <mi>r</mi> <mi>s</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mi>I</mi> <mi>I</mi> <mo>)</mo> </mrow> </mrow>
式(II)和(III)中,参数α和β用于调整选择精度和计算复杂度,设为0.7~1.2;式(III)中,RDParent为父CU的率失真代价;式(III)中,如果当前CU的父CU不存在,则Flag2为0;
然后根据父CU的最佳PU模式、Flag1和Flag2来判断是否进行小尺寸帧间PU模式的估计:如果父CU的最佳PU模式为Skip模式,则不进行小尺寸帧间PU模式的估计;如果当前CU符合Skip模式条件且Flag1等于1,则不进行小尺寸帧间PU模式的估计;如果当前CU不符合Skip模式条件且Flag2等于1,则不进行小尺寸帧间PU模式的估计;
(7)对称帧间PU模式的估计:
对当前待估计CU进行Inter N×N、Inter N×2N和Inter 2N×N这三种对称帧间PU模式的估计,分别计算它们的率失真代价,并从中选取率失真代价最小值作为对称帧间PU模式的率失真代价RDSymmetry
(8)非对称帧间PU模式估计的选择:
根据当前待估计CU的RDSquare、RDSymmetry和父CU的最佳PU模式判断当前待估计CU是否进行Inter 2N×nU、Inter 2N×nD、Inter nL×2N和Inter nR×2N这四种非对称帧间PU模式的估计;
(9)帧内PU模式的估计:
对当前待估计CU进行Intra 2N×2N和Intra N×N这两种帧内PU模式的估计,并计算它们的率失真代价;
(10)选取当前CU的最佳PU模式:
从已估计的帧间PU模式和帧内PU模式中选取率失真代价最小的PU模式作为当前CU的最佳PU模式,并将最小的率失真代价作为当前CU的率失真代价;
(11)终止CU划分的判断;
(12)重复执行步骤(4)~(11),完成所有CU的估计:
完成所有待估计CU的最佳PU模式和率失真代价的选取;根据所有已估计CU的率失真代价,选择率失真代价总和最小的CU划分方式作为当前CTU的最佳四叉树划分;
(13)重复步骤(2)~(12),完成当前帧中所有CTU的估计。
2.如权利要求1所述的一种HEVC帧间编码快速模式选择方法,其特征在于,所述的步骤(3)采用当前CTU空间相邻的左方CTU、上方CTU和时间相邻的参考帧中相同位置CTU的深度统计信息来计算当前CTU的深度预测范围,其中,左方CTU记为L-CTU,上方CTU记为U-CTU,时间相邻的参考帧中相同位置CTU记为Col-CTU:当Col-CTU存在,且L-CTU和U-CTU中至少有1个存在的情况下,计算当前CTU的深度预测范围R,如式(I)所示:
式(I)中,DMIN和DMAX分别为所有存在的时空相邻CTU中的最小深度值和最大深度值;dMAX为当前帧CTU允许的最大深度值,如果当前帧CTU尺寸为64×64,则dMAX值为3,如果当前帧CTU尺寸为32×32,则dMAX值为2;
当Col-CTU不存在、或L-CTU和U-CTU都不存在的情况下,当前CTU的深度预测范围R为[0,dMAX]。
3.如权利要求1所述的一种HEVC帧间编码快速模式选择方法,其特征在于步骤(8)所述的非对称帧间PU模式估计的选择方法:
首先利用步骤(5)得到的RDSquare和步骤(7)得到的RDSymmetry计算非对称帧间PU模式的选择标志Flag3,如式(IV)所示:
<mrow> <mi>F</mi> <mi>l</mi> <mi>a</mi> <mi>g</mi> <mn>3</mn> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>1</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <msub> <mi>RD</mi> <mrow> <mi>S</mi> <mi>q</mi> <mi>u</mi> <mi>a</mi> <mi>r</mi> <mi>e</mi> </mrow> </msub> <mo>&lt;</mo> <mi>&amp;gamma;</mi> <mo>&amp;times;</mo> <msub> <mi>RD</mi> <mrow> <mi>S</mi> <mi>y</mi> <mi>m</mi> <mi>m</mi> <mi>e</mi> <mi>t</mi> <mi>r</mi> <mi>y</mi> </mrow> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>0</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>o</mi> <mi>t</mi> <mi>h</mi> <mi>e</mi> <mi>r</mi> <mi>s</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mi>I</mi> <mi>V</mi> <mo>)</mo> </mrow> </mrow>
式(IV)中,参数γ用于调整选择精度和计算复杂度,设为0.7~1.2;
然后根据父CU的最佳PU模式和Flag3来选择是否进行非对称帧间PU模式的估计:如果父CU的最佳PU模式为Merge或Inter2N×2N模式,则不进行非对称帧间PU模式的估计;如果Flag3等于1,则不进行非对称帧间PU模式的估计;其他情况,则进行非对称帧间PU模式的估计,并计算它们的率失真代价。
4.如权利要求1所述的一种HEVC帧间编码快速模式选择方法,其特征在于步骤(11)所述的终止CU划分的判断方法:
首先根据当前CU空间相邻的左方CU和上方CU、时间相邻的参考帧中相同位置CU、以及父CU的率失真代价来计算终止CU划分的率失真代价阈值Th,其中,左方CU记为L-CU,上方CU记为U-CU,时间相邻的参考帧中相同位置CU记为Col-CU,如式(V)所示:
<mrow> <mi>T</mi> <mi>h</mi> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mi>&amp;eta;</mi> <mo>&amp;times;</mo> <msub> <mi>RD</mi> <mrow> <mi>a</mi> <mi>v</mi> <mi>g</mi> <mo>-</mo> <mi>L</mi> <mi>U</mi> <mi>C</mi> </mrow> </msub> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <mi>L</mi> <mo>-</mo> <mi>C</mi> <mi>U</mi> <mo>,</mo> <mi>U</mi> <mo>-</mo> <mi>C</mi> <mi>U</mi> <mi> </mi> <mi>a</mi> <mi>n</mi> <mi>d</mi> <mi> </mi> <mi>C</mi> <mi>o</mi> <mi>l</mi> <mo>-</mo> <mi>C</mi> <mi>U</mi> <mi> </mi> <mi>e</mi> <mi>x</mi> <mi>i</mi> <mi>s</mi> <mi>t</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>&amp;eta;</mi> <mo>&amp;times;</mo> <msub> <mi>RD</mi> <mrow> <mi>a</mi> <mi>v</mi> <mi>g</mi> <mo>-</mo> <mi>L</mi> <mi>C</mi> </mrow> </msub> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <mi>o</mi> <mi>n</mi> <mi>l</mi> <mi>y</mi> <mi> </mi> <mi>L</mi> <mo>-</mo> <mi>C</mi> <mi>U</mi> <mi> </mi> <mi>a</mi> <mi>n</mi> <mi>d</mi> <mi> </mi> <mi>C</mi> <mi>o</mi> <mi>l</mi> <mo>-</mo> <mi>C</mi> <mi>U</mi> <mi> </mi> <mi>e</mi> <mi>x</mi> <mi>i</mi> <mi>s</mi> <mi>t</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>&amp;eta;</mi> <mo>&amp;times;</mo> <msub> <mi>RD</mi> <mrow> <mi>a</mi> <mi>v</mi> <mi>g</mi> <mo>-</mo> <mi>U</mi> <mi>C</mi> </mrow> </msub> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <mi>o</mi> <mi>n</mi> <mi>l</mi> <mi>y</mi> <mi> </mi> <mi>U</mi> <mo>-</mo> <mi>C</mi> <mi>U</mi> <mi> </mi> <mi>a</mi> <mi>n</mi> <mi>d</mi> <mi> </mi> <mi>C</mi> <mi>o</mi> <mi>l</mi> <mo>-</mo> <mi>C</mi> <mi>U</mi> <mi> </mi> <mi>e</mi> <mi>x</mi> <mi>i</mi> <mi>s</mi> <mi>t</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>&amp;eta;</mi> <mo>&amp;times;</mo> <msub> <mi>RD</mi> <mrow> <mi>P</mi> <mi>a</mi> <mi>r</mi> <mi>e</mi> <mi>n</mi> <mi>t</mi> </mrow> </msub> <mo>&amp;times;</mo> <mfrac> <mn>1</mn> <mn>4</mn> </mfrac> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>o</mi> <mi>t</mi> <mi>h</mi> <mi>e</mi> <mi>r</mi> <mi>s</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mi>V</mi> <mo>)</mo> </mrow> </mrow>
式(V)中,参数η是用来调整终止CU划分的率失真代价阈值,设为0.5~1.1;L-CU、U-CU和Col-CU都与当前CU具有相同的CU尺寸;当L-CU、U-CU和Col-CU都存在时,Th由L-CU、U-CU和Col-CU的平均率失真代价RDavg-LUC计算得到,RDavg-LUC等于L-CU、U-CU和Col-CU的率失真代价相加除以3;当只有L-CU和Col-CU存在时,Th由L-CU和Col-CU的平均率失真代价RDavg-LC计算得到,RDavg-LC等于L-CU和Col-CU的率失真代价相加除以2;当只有U-CU和Col-CU存在时,Th由U-CU和Col-CU的平均率失真代价RDavg-UC计算得到,RDavg-UC等于L-CU和Col-CU的率失真代价相加除以2;
然后根据Th判断是否终止当前CU划分:如果当前CU的率失真代价小于Th,则终止当前CU的四叉树划分,步骤(4)不再遍历当前CU的四个子CU。
CN201510509889.0A 2015-08-19 2015-08-19 一种hevc帧间编码快速模式选择方法 Active CN105141954B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510509889.0A CN105141954B (zh) 2015-08-19 2015-08-19 一种hevc帧间编码快速模式选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510509889.0A CN105141954B (zh) 2015-08-19 2015-08-19 一种hevc帧间编码快速模式选择方法

Publications (2)

Publication Number Publication Date
CN105141954A CN105141954A (zh) 2015-12-09
CN105141954B true CN105141954B (zh) 2018-03-13

Family

ID=54727144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510509889.0A Active CN105141954B (zh) 2015-08-19 2015-08-19 一种hevc帧间编码快速模式选择方法

Country Status (1)

Country Link
CN (1) CN105141954B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105721865A (zh) * 2016-02-01 2016-06-29 同济大学 一种hevc帧间编码单元划分的快速决策算法
CN106454342B (zh) * 2016-09-07 2019-06-25 中山大学 一种视频压缩编码的帧间模式快速选择方法及系统
CN106534849B (zh) * 2016-12-30 2019-07-16 杭州当虹科技股份有限公司 一种快速的hevc帧间编码方法
CN107343198A (zh) * 2017-05-08 2017-11-10 上海大学 一种avs2帧间预测模式快速判决方法
CN108012150B (zh) * 2017-12-14 2020-05-05 湖南兴天电子科技有限公司 视频帧间编码方法及装置
CN108124154B (zh) * 2017-12-28 2020-04-24 北京数码视讯科技股份有限公司 帧间预测模式的快速选择方法、装置及电子设备
CN108965873B (zh) * 2018-07-24 2020-02-14 北京大学 一种脉冲阵列编码的自适应划分方法
CN109302610B (zh) * 2018-10-26 2021-09-28 重庆邮电大学 一种基于率失真代价的屏幕内容编码帧间快速编码方法
CN109756719B (zh) * 2019-01-28 2020-06-26 华侨大学 基于cu划分贝叶斯决策的3d-hevc帧间快速方法
CN110022477B (zh) * 2019-03-29 2021-02-19 中南大学 一种基于CUTree的帧间预测模式快速选择方法
CN110139106B (zh) * 2019-04-04 2023-01-17 中南大学 一种视频编码单元分割方法及其系统、装置、存储介质
CN110446040A (zh) * 2019-07-30 2019-11-12 暨南大学 一种适用于hevc标准的帧间编码方法与系统
CN110430427B (zh) * 2019-08-07 2021-08-17 杭州微帧信息科技有限公司 一种基于skip模式编码结果的快速视频编码决策方法与系统
CN111031303B (zh) * 2019-11-21 2021-01-26 郑州轻工业大学 基于贝叶斯决策定理的3d-hevc快速深度编码方法
CN111277838B (zh) * 2020-02-17 2022-10-14 腾讯科技(深圳)有限公司 编码模式选择方法、装置、电子设备及计算机可读介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103533355B (zh) * 2013-10-10 2016-08-17 宁波大学 一种hevc快速编码方法
CN104702958B (zh) * 2013-12-05 2017-09-15 中国科学院深圳先进技术研究院 一种基于空间相关性的hevc帧内编码方法及系统
CN103813166B (zh) * 2014-01-28 2017-01-25 浙江大学 一种低复杂度的hevc编码多参考帧的选择方法

Also Published As

Publication number Publication date
CN105141954A (zh) 2015-12-09

Similar Documents

Publication Publication Date Title
CN105141954B (zh) 一种hevc帧间编码快速模式选择方法
CN106454342B (zh) 一种视频压缩编码的帧间模式快速选择方法及系统
CN101895751B (zh) 帧内预测的方法及装置、基于帧内预测的编/解码方法及系统
CN104811710B (zh) 对视频编码的方法和设备及对视频解码的方法和设备
CN102792695B (zh) 通过使用大变换单元对图像进行编码和解码的方法和设备
CN102984521B (zh) 基于时域相关性的高性能视频编码帧间模式判决方法
CN103873861B (zh) 一种用于hevc的编码模式选择方法
CN104980736B (zh) 对视频编码的方法和设备以及对视频解码的方法和设备
CN105959699B (zh) 一种基于运动估计和时空域相关性的快速帧间预测方法
CN102450017B (zh) 图像解码装置以及图像解码方法
CN107623850B (zh) 一种基于时空相关性的快速屏幕内容编码方法
CN106961606A (zh) 基于纹理划分特征的hevc帧内编码模式选择方法
CN110087087A (zh) Vvc帧间编码单元预测模式提前决策及块划分提前终止方法
CN104954788B (zh) Hevc帧内预测模式选择方法及装置
CN106937116B (zh) 基于随机训练集自适应学习的低复杂度视频编码方法
CN102932642B (zh) 一种帧间编码快速模式选择方法
CN104853191B (zh) 一种hevc的快速编码方法
CN103997645B (zh) 一种快速的hevc帧内编码单元和模式决策方法
CN103118262B (zh) 率失真优化方法及装置、视频编码方法及系统
CN104168480B (zh) 基于hevc标准的帧内预测编码模式快速选择方法
CN107318016A (zh) 一种基于零块分布的hevc帧间预测模式快速判定方法
CN103238334A (zh) 图像帧内预测方法和设备
CN103327327B (zh) 用于高性能视频编码hevc的帧间预测编码单元选择方法
CN105721866B (zh) 一种编码单元划分方法及装置
CN104811729B (zh) 一种视频多参考帧编码方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant