CN111212292B - 基于h.266的自适应cu分区和跳过模式方法 - Google Patents

基于h.266的自适应cu分区和跳过模式方法 Download PDF

Info

Publication number
CN111212292B
CN111212292B CN202010046795.5A CN202010046795A CN111212292B CN 111212292 B CN111212292 B CN 111212292B CN 202010046795 A CN202010046795 A CN 202010046795A CN 111212292 B CN111212292 B CN 111212292B
Authority
CN
China
Prior art keywords
block
blocks
cost
mode
partitioning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010046795.5A
Other languages
English (en)
Other versions
CN111212292A (zh
Inventor
张秋闻
赵进超
王艳军
王祎菡
赵永博
黄立勋
吴庆岗
常化文
蒋斌
王晓
张伟伟
崔腾耀
孙丽君
钱晓亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou University of Light Industry
Original Assignee
Zhengzhou University of Light Industry
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou University of Light Industry filed Critical Zhengzhou University of Light Industry
Priority to CN202010046795.5A priority Critical patent/CN111212292B/zh
Publication of CN111212292A publication Critical patent/CN111212292A/zh
Application granted granted Critical
Publication of CN111212292B publication Critical patent/CN111212292B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提出了一种基于H.266的自适应CU分区和跳过模式方法,其步骤为:首先,利用编码器将视频划分为编码树单元;其次,根据编码树单元的不同分别利用改进的贝叶斯决策或相邻块单元的RD成本信息对CU块进行分割;再根据分割后的子CU块的相邻块及分割前的CU块的相关性,计算子CU块的相邻块及分割前的CU块的RD成本的平均值,并作为帧间预测的阈值;最后,根据子CU块的RD成本与帧间预测的阈值的关系,判断子CU块是否帧间预测确定最佳编码模式。本发明利用时间和空间的相关性分析当前CU块的特征,进行自适应CU分区及早期跳过模式检测,有效降低了CU分区以及预测过程的复杂度,从而加速编码过程。

Description

基于H.266的自适应CU分区和跳过模式方法
技术领域
本发明涉及图像处理技术领域,特别是指一种基于H.266的自适应CU分区和跳过模式方法。
背景技术
联合视频探索小组(JVET)开发了下一代视频编码标准多功能视频编码(H.266/VVC),为了改善现有的HEVC并提供更高的压缩性能。高效视频编码(HEVC)在2013年被标准化,用于分辨率高达2K的视频。VVC测试模型(VTM)采用并实现了许多新颖的技术,这些技术大大提高了H.266/VVC的编码效率。目前,H.264/AVC和H.265/HEVC以及H.266/VVC都使用混合视频编码的框架,但是,很多用于HEVC的快速CU方法并不适用于H.266/VVC。因此,需要采用新的方法来加快H.266/VVC的CU决策。
在QTMT中,所有四叉树的叶子节点都可以拆分为二叉树或三叉树,但HEVC中的CU分区结构只能拆分为四叉树,但是HEVC和H.266/VVC中的编码树单元(CTU)的概念没有区别。根据所有可能的分割模式中的率失真(RD)成本的最小值,可以获得CU的最佳分割模式。在单棵树中,引入小块(即2×N)会导致硬件实现效率低下,因为这会导致流水线延迟,并且在硬件体系结构中需要2×N像素的处理。此外,对于2×N的块,每一个时钟处理需要额外的2×2个像素。在对偶树中,小块CU需要比8×8双向预测更高的存储带宽。因此,开发一种快速的帧内算法是非常有必要的,它可以降低编码器的复杂性,同时节省编码时间。
目前针对H.266/VVC的自适应CU分区和早期跳过模式检测的方法的研究,主要有:T.Fu等人通过贝叶斯决策规则提出了一种新颖的快速CU块划分算法。TL.Lin等人提出了一种基于空间特征的快速二叉树划分决策算法。Y.Huang等人提出了具有突破性的块结构设计的基于块的混合编码方法。H.Yang等人提出了一种由低复杂度编码树单元(CTU)结构决策和快速帧内模式决策组成的快速帧内编码算法。B.Min等人提出了一种用于帧内编码的CU大小决策的快速算法。M.Ramezanpou等人提出了一种用于帧内预测的提前终止算法。K.Lim等人提出了一种快速PU跳过和拆分的终止算法。
虽然上述算法可以有效地加速CU的决策,尤其是HEVC中有许多用于快速分区和早期跳过的算法,但是很少有适用于H.266/VVC的算法。这些方法并没有充分利用当前块与相邻块之前的相关性,因此,需要进一步降低对CU分区以及预测模式的计算复杂度和编码时间。
发明内容
针对上述背景技术中存在的不足,本发明提出了一种基于H.266的自适应CU分区和跳过模式方法,解决了现有技术没有充分利用当前块与相邻块之前的相关性,造成编码器的复杂度高的技术问题。
本发明的技术方案是这样实现的:
一种基于H.266的自适应CU分区和跳过模式方法,其步骤如下:
S1、利用编码器将视频划分为编码树单元,其中,编码树单元包括单树和对偶树;
S2、在单树中,利用改进的贝叶斯决策对CU块进行分割,进入步骤S4;
S3、在对偶树中,根据相邻块单元的RD成本信息对CU块进行分割,进入步骤S4;
S4、根据分割后的子CU块的相邻块及分割前的CU块的相关性,计算子CU块的相邻块及分割前的CU块的RD成本的平均值,并将平均值作为帧间预测的阈值;
S5、如果子CU块的RD成本小于帧间预测的阈值,对子CU块进行帧内预测,找出最佳编码模式,否则,对子CU块进行帧间预测和帧内预测,找出最佳编码模式。
所述在单树中,利用改进的贝叶斯决策对CU块进行分割的方法为:
S21、对CU块进行四叉树分割,得到中间CU块;
S22、比较中间CU块在给定特征向量的条件下选择垂直拆分类型的概率与中间CU块在给定特征向量的条件下未选择垂直拆分类型的概率:
P(V0|F)>P(V1|F) (1),
其中,V0表示中间CU块在对所有拆分类型进行递归RD检查后未选择垂直拆分类型,V1表示中间CU块在对所有拆分类型进行递归RD检查后选择垂直拆分类型,P(V0|F)表示给定特征向量F{fSTU,fSTL}的中间CU块属于类V0的概率,P(V1|F)表示给定特定向量F{fSTU,fSTL}的中间CU块属于类V1的概率,且P(V0|F)和P(V1|F)均为后验概率,fSTU和fSTL分别代表中间CU块的拆分类型;
S23、根据贝叶斯公式
Figure BDA0002369712390000021
将公式(1)转化为:
P(F|V0)P(V0)>P(F|V1)P(V1) (2),
其中,P(V0)表示在类V0时的先验概率,P(V1)表示在类V1时的先验概率;
S24、对公式(2)进行改进得到改进的贝叶斯决策方程:
P(F|V0)P(V0)>α·P(F|V1)P(V1) (3),
其中,α为平衡因子,P(F|V0)表示在类V0时的条件概率密度函数,P(F|V1)表示在类V1时的条件概率密度函数;
S25、如果中间CU块属于类V0的条件概率与先验概率的乘积大于中间CU块属于类V1的条件概率与先验概率的乘积,中间CU块跳过大小为8×N和16×N的垂直二进制分割和垂直三进制分割,N表示编码块的长度或宽度。
所述在对偶树中,根据相邻块单元的RD成本信息对CU块进行分割的方法为:
S31、对CU块进行四叉树分割,得到中间CU块;
S32、计算中间CU块的RD成本值RDM、中间CU块进行二进制分割后的RD成本值RDB、中间CU块进行三进制分割后的RD成本值RDT,并比较成本值RDM、成本值RDB、成本值RDT之间的大小;
S33、当中间CU块的RD成本值RDM满足RDM<RDB&RDM<RDT时,计算大小为4×N和8×N的中间CU块的RD成本值的平均值:
Figure BDA0002369712390000031
Figure BDA0002369712390000032
Figure BDA0002369712390000033
其中,0≤γ≤1,0≤β≤1,THM表示中间CU块是否跳过二进制分割和三进制分割的阈值,RDCosti为中间CU块的相邻块的RD成本,γ为准确率因子,βi为平衡因子,δi为参数,M表示当前CU块的长度或宽度;
S34、如果中间CU块的RD成本值小于阈值THM,则中间CU块跳过二进制分割和三进制分割,否则,中间CU块进行二进制分割或三进制分割。
所述帧间预测的阈值为:
Figure BDA0002369712390000034
其中,Rd costl为子CU块的左CU块的RD成本,Rd costu为子CU块的上CU块的RD成本,Rd costl-u为子CU块的左上CU块的RD成本,Rd costr-u为子CU块的右上CU块的RD成本,Rdcostp为分割前的CU块较高深度级别的RD成本。
所述对子CU块进行帧内预测,选择最佳编码模式的方法为:
S51、将帧内预测分为两步、分别为“粗搜索”和“细搜索”;
S52、在“粗搜索”中,通过绝对变换差总和SATD从H.265/HEVC中的35种帧内预测模式中选出N*个模式,再通过绝对变换差总和SATD计算N*个模式的相邻模式的粗略的RD成本,并更新N*个模式作为的最佳候选模式;
S53、在“细搜索”中,计算N*个最佳候选模式和最可能模式的完整的RD成本:
JMODE=DRECMODE×RREC (10),
其中,DREC表示原始块和重建块之间的平方差之和,RREC表示当前预测模式占用的位数,λMODE表示拉格朗日乘数,最可能模式包括邻近模式、派生模式和默认模式;
S54、比较N*个最佳候选模式和最可能模式的完整的RD成本值的大小,将最小的完整的RD成本值对应的编码模式作为最佳编码模式。
所述粗略的RD成本的计算方法为:
JRMS=DHadMODE×RMODE (9),
其中,DHad表示中间CU块与中间CU块进行帧内预测后的重构块之差的哈达玛变换,RMODE表示DCT变换产生的位数,λ表示拉格朗日乘数。
所述拆分类型包括四叉树分割、垂直二进制分割、垂直三进制分割、水平二进制分割和水平三进制分割;所述垂直拆分类型包括垂直二进制分割和垂直三进制分割。
利用检出率和命中率计算出自适应CU分区方法的效率:
Figure BDA0002369712390000041
其中,DR表示自适应CU分区的复杂度降低率,HR表示自适应CU分区的决策精度,A表示跳过垂直二进制分割和垂直三进制分割,B表示真正跳过垂直二进制和三进制分割的RD成本检查,Prob(A/B)和Prob(B/A)均表示条件概率,C(.)表示与A、B、A/B或B/A相关的CU分区的总数。
本技术方案能产生的有益效果:本发明利用时间和空间的相关性分析当前CU块的特征,再根据时间和空间的相关性得到相应的阈值,进行自适应CU分区以及早期跳过模式检测,有效降低了CU的分区以及预测过程的复杂度,从而加速编码过程。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的流程图;
图2为本发明的自适应CU分区方法的复杂度降低率和决策精度曲线图;
图3为本发明的当前CU块的相邻块分布图;
图4为本发明基于序列“Cactus”的RD性能曲线图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种基于H.266的自适应CU分区和跳过模式方法,首先以利用时间和空间的相关性分析当前CU块的特征,然后根据这些相关性得到相应的阈值,进行自适应CU分区以及早期跳过模式检测,以有效降低CU的分区以及预测过程的复杂度,从而加速编码过程,具体步骤如下:
S1、利用编码器将视频划分为编码树单元(CTU),开始进行CU的划分,其中,编码树单元包括单树和对偶树。
S2、在单树中,早期跳过8×N和16×N CU垂直二进制分割和垂直三进制分割的过程被视为二进制类别方法,利用改进的贝叶斯决策对CU块进行分割,进入步骤S4;具体实现方法为:
S21、对CU块进行四叉树分割,得到中间CU块;
S22、比较中间CU块在给定特征向量的条件下选择垂直拆分类型的概率与中间CU块在给定特征向量的条件下未选择垂直拆分类型的概率:
P(V0|F)>P(V1|F) (1),
其中,V0表示中间CU块在对所有拆分类型进行递归RD检查后未选择垂直拆分类型,V1表示中间CU块在对所有拆分类型进行递归RD检查后选择垂直拆分类型,P(V0|F)表示给定特征向量F{fSTU,fSTL}的中间CU块属于类V0的概率,P(V1|F)表示给定特定向量F{fSTU,fSTL}的中间CU块属于类V1的概率,且P(V0|F)和P(V1|F)均为后验概率,fSTU和fSTL分别代表中间CU块的拆分类型;其中,拆分类型包括四叉树分割、垂直二进制分割、垂直三进制分割、水平二进制分割和水平三进制分割;所述垂直拆分类型包括垂直二进制分割和垂直三进制分割。
S23、根据贝叶斯公式
Figure BDA0002369712390000061
将公式(1)转化为:
P(F|V0)P(V0)>P(F|V1)P(V1) (2),
其中,P(V0)表示在类V0时的先验概率,P(V1)表示在类V1时的先验概率;
S24、对公式(2)进行改进得到改进的贝叶斯决策方程:
P(F|V0)P(V0)>α·P(F|V1)P(V1) (3),
其中,α为平衡因子,P(F|V0)表示在类V0时的条件概率密度函数,P(F|V1)表示在类V1时的条件概率密度函数;
S25、如果中间CU块属于类V0的条件概率与先验概率的乘积大于中间CU块属于类V1的条件概率与先验概率的乘积,中间CU块跳过大小为8×N和16×N的垂直二进制分割和垂直三进制分割,N表示编码块的长度或宽度。
利用检出率和命中率计算出自适应CU分区方法的效率:
Figure BDA0002369712390000062
其中,DR表示自适应CU分区的复杂度降低率,HR表示自适应CU分区的决策精度,A表示跳过垂直二进制分割和垂直三进制分割,B表示真正跳过垂直二进制和三进制分割的RD成本检查,Prob(A/B)和Prob(B/A)均表示条件概率,C(.)表示与A、B、A/B或B/A相关的CU分区的总数。如果HR较大,则可以更精确地决定中间CU块是否提前跳过垂直二进制分割和垂直三进制分割。如图2所示,当DR为62%时,表明62%的中间CU块可以提前跳过垂直二进制分割和垂直三进制分割,HR为85%,表明85%的中间CU块真正跳过垂直二进制分割和垂直三进制分割。这些统计数据表明了所本发明中自适应CU分区方法的可行性。
S3、在对偶树中,相邻块单元的RD成本信息用于实现分区的早期终止二进制以及三进制分割,根据图像的局部相关性,相邻图像区域的相似度较高,但随着空间距离的增加,相似度变低,根据相邻块单元的RD成本信息对CU块进行分割,进入步骤S4;具体实现方法为:
S31、对CU块进行四叉树分割,得到中间CU块;
S32、计算中间CU块的RD成本值RDM、中间CU块进行二进制分割后的RD成本值RDB、中间CU块进行三进制分割后的RD成本值RDT,并比较成本值RDM、成本值RDB、成本值RDT之间的大小;
S33、当中间CU块的RD成本值RDM满足RDM<RDB&RDM<RDT时,计算大小为4×N和8×N的中间CU块的RD成本值的平均值:
Figure BDA0002369712390000071
Figure BDA0002369712390000072
Figure BDA0002369712390000073
其中,0≤γ≤1,0≤β≤1,THM表示中间CU块是否跳过二进制和三进制分割的阈值,RDCosti为中间CU块的相邻块的RD成本,M表示当前CU块的长度或宽度,γ为准确率因子,β为平衡因子,δ是根据相邻CU是否可用来取值,如果可用,则为1,如果不可用,则为0;
S34、如果中间CU块的RD成本值小于阈值THM,则中间CU块跳过二进制分割和三进制分割,否则,中间CU块进行二进制分割或三进制分割。
S4、根据分割后的子CU块的相邻块及分割前的CU块的相关性,计算子CU块的相邻块及分割前的CU块的RD成本的平均值,并将平均值作为帧间预测的阈值;
所述帧间预测的阈值为:
Figure BDA0002369712390000074
其中,Rd costl为子CU块的左CU块的RD成本,Rd costu为子CU块的上CU块的RD成本,Rd costl-u为子CU块的左上CU块的RD成本,Rd costr-u为子CU块的右上CU块的RD成本,Rdcostp为分割前的CU块较高深度级别的RD成本。图3为子CU块的相邻块分布,所述根据相邻CU以及分割前CU的相关性,计算他们的平均RD成本值作为跳过子CU块的帧间预测的阈值。
S5、如果子CU块的RD成本小于帧间预测的阈值,对子CU块进行帧内预测,找出最佳编码模式,否则,对子CU块进行帧间预测和帧内预测,找出最佳编码模式。
所述对子CU块进行帧内预测,选择最佳编码模式的方法为:
S51、帧内预测需要从67个帧内预测模式中选择最佳的预测模式,从而导致很高的计算复杂性。为了降低帧内编码预测模式选择的复杂性,帧内预测编码算法从67种预测模式中选择最佳预测模式,要经历两个步骤:第一步是“粗搜索”,第二步是“细搜索”;
S52、在“粗搜索”中,为了节省计算能力,通过绝对变换差总和SATD从H.265/HEVC中的35种帧内预测模式中选出N*个模式,再通过绝对变换差总和SATD计算N*个模式的相邻模式的粗略的RD成本,并更新N*个模式作为的最佳候选模式;
所述粗略的RD成本的计算方法为:
JRMS=DHadMODE×RMODE (9),
其中,DHad表示中间CU块与中间CU块进行帧内预测后的重构块之差的哈达玛变换,RMODE表示DCT变换产生的位数,λ表示拉格朗日乘数。与完整的RD成本过程相比,哈达玛变换简化了计算过程,因此编码器可以快速挑选出可能的预测方向。
“粗搜索”包括两个阶段。RD成本计算的候选模式从67种减少到2种或7种帧内预测模式,从而取代了整体帧内预测模式的决策。两阶段帧内模式预选过程如下:在第一步中,通过绝对变换差总和(SATD)从原始的35种帧内预测模式中选出N*(N*与帧内预测块大小有关)个模式。在第二步中,由SATD进一步选择所选择的N*个模式的左和右模式,然后更新所选择的N*个模式的候选列表。
S53、在“细搜索”中,计算N*个最佳候选模式和最可能模式的完整的RD成本:
JMODE=DRECMODE×RREC (10),
其中,DREC表示原始块和重建块之间的平方差之和,RREC表示当前预测模式占用的位数,λMODE表示拉格朗日乘数,最可能模式包括邻近模式、派生模式和默认模式;
S54、比较N*个最佳候选模式和6个最可能模式的完整的RD成本值的大小,将最小的完整的RD成本值对应的编码模式作为最佳编码模式。
为了获得DREC和RREC必须完全编码计算的RD成本,由于完整的编码需要变换量化和熵编码,因此这些过程很耗时,所以采用“粗搜索”和“细搜索”两个步骤,从而降低计算复杂度。
为了评估本发明的特性,在最新的H.266/VVC参考软件VTM-6.0上实现。编码树块的固定大小是64×64像素,最大深度级别是4,并且基于上下文的自适应二进制算术编码(CABAC)被用作熵编码器。表1显示了本发明的实验结果,本发明在AI-10编码条件下结合了自适应CU分区和早期跳过模式检测方法。从表1得出结论,Y,U和V的平均值分别为0.96%,0.92%和0.99%,ETs的平均值约为50%。因此,本发明在保持与VTM-6.0相同的RD属性的同时,可大大减少所有视频序列的编码时间。图4给出了视频序列“Cactus”在AI-10编码条件下的更多详细信息,其中“YPSNR(dB)”表示平均峰值信噪比(PSNR)。根据图可以得出结论,本发明与VTM-6.0相比执行的编码效率几乎相同,同时,RD性能下降几乎可以忽略不计,即本发明与VTM-6.0的实验结果曲线几乎完全重合。
表1显示了本发明的实验结果
Figure BDA0002369712390000091
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于H.266的自适应CU分区和跳过模式方法,其特征在于,其步骤如下:
S1、利用编码器将视频划分为编码树单元,其中,编码树单元包括单树和对偶树;
S2、在单树中,利用改进的贝叶斯决策对CU块进行分割,进入步骤S4;
在单树中,利用改进的贝叶斯决策对CU块进行分割的方法为:
S21、对CU块进行四叉树分割,得到中间CU块;
S22、比较中间CU块在给定特征向量的条件下选择垂直拆分类型的概率与中间CU块在给定特征向量的条件下未选择垂直拆分类型的概率:
P(V0|F)>P(V1|F)(1),
其中,V0表示中间CU块在对所有拆分类型进行递归RD检查后未选择垂直拆分类型,V1表示中间CU块在对所有拆分类型进行递归RD检查后选择垂直拆分类型,P(V0|F)表示给定特征向量F{fSTU,fSTL}的中间CU块属于类V0的概率,P(V1|F)表示给定特定向量F{fSTU,fSTL}的中间CU块属于类V1的概率,且P(V0|F)和P(V1|F)均为后验概率,fSTU和fSTL分别代表中间CU块的拆分类型;
S23、根据贝叶斯公式
Figure FDA0004059086280000011
将公式(1)转化为:
P(F|V0)P(V0)>P(F|V1)P(V1)(2),
其中,P(V0)表示在类V0时的先验概率,P(V1)表示在类V1时的先验概率;
S24、对公式(2)进行改进得到改进的贝叶斯决策方程:
P(F|V0)P(V0)>α·P(F|V1)P(V1)(3),
其中,α为平衡因子,P(F|V0)表示在类V0时的条件概率密度函数,P(F|V1)表示在类V1时的条件概率密度函数;
S25、如果中间CU块属于类V0的条件概率与先验概率的乘积大于中间CU块属于类V1的条件概率与先验概率的乘积,中间CU块跳过大小为8×N和16×N的垂直二进制分割和垂直三进制分割,N表示编码块的长度或宽度;
S3、在对偶树中,根据相邻块单元的RD成本信息对CU块进行分割,进入步骤S4;
在对偶树中,根据相邻块单元的RD成本信息对CU块进行分割的方法为:
S31、对CU块进行四叉树分割,得到中间CU块;
S32、计算中间CU块的RD成本值RDM、中间CU块进行二进制分割后的RD成本值RDB、中间CU块进行三进制分割后的RD成本值RDT,并比较成本值RDM、成本值RDB、成本值RDT之间的大小;
S33、当中间CU块的RD成本值RDM满足RDM<RDB&RDM<RDT时,计算大小为4×N和8×N的中间CU块的RD成本值的平均值:
Figure FDA0004059086280000021
Figure FDA0004059086280000022
Figure FDA0004059086280000023
其中,0≤γ≤1,0≤β≤1,THM表示中间CU块是否跳过二进制分割和三进制分割的阈值,RDCosti为中间CU块的相邻块的RD成本,γ为准确率因子,βi为平衡因子,δi为参数,M表示当前CU块的长度或宽度;
S34、如果中间CU块的RD成本值小于阈值THM,则中间CU块跳过二进制分割和三进制分割,否则,中间CU块进行二进制分割或三进制分割;
S4、根据分割后的子CU块的相邻块及分割前的CU块的相关性,计算子CU块的相邻块及分割前的CU块的RD成本的平均值,并将平均值作为帧间预测的阈值;
S5、如果子CU块的RD成本小于帧间预测的阈值,对子CU块进行帧内预测,找出最佳编码模式,否则,对子CU块进行帧间预测和帧内预测,找出最佳编码模式。
2.根据权利要求1所述的基于H.266的自适应CU分区和跳过模式方法,其特征在于,所述帧间预测的阈值为:
Figure FDA0004059086280000024
其中,Rdcostl为子CU块的左CU块的RD成本,Rdcostu为子CU块的上CU块的RD成本,Rdcostl-u为子CU块的左上CU块的RD成本,Rdcostr-u为子CU块的右上CU块的RD成本,Rdcostp为分割前的CU块较高深度级别的RD成本。
3.根据权利要求1或2所述的基于H.266的自适应CU分区和跳过模式方法,其特征在于,所述对子CU块进行帧内预测,选择最佳编码模式的方法为:
S51、将帧内预测分为两步、分别为“粗搜索”和“细搜索”;
S52、在“粗搜索”中,通过绝对变换差总和SATD从H.265/HEVC中的35种帧内预测模式中选出N*个模式,再通过绝对变换差总和SATD计算N*个模式的相邻模式的粗略的RD成本,并更新N*个模式作为的最佳候选模式;
S53、在“细搜索”中,计算N*个最佳候选模式和最可能模式的完整的RD成本:
JMODE=DRECMODE×RREC(10),
其中,DREC表示原始块和重建块之间的平方差之和,RREC表示当前预测模式占用的位数,λMODE表示拉格朗日乘数,最可能模式包括邻近模式、派生模式和默认模式;
S54、比较N*个最佳候选模式和最可能模式的完整的RD成本值的大小,将最小的完整的RD成本值对应的编码模式作为最佳编码模式。
4.根据权利要求3所述的基于H.266的自适应CU分区和跳过模式方法,其特征在于,所述粗略的RD成本的计算方法为:
JRMS=DHadMODE×RMODE(9),
其中,DHad表示中间CU块与中间CU块进行帧内预测后的重构块之差的哈达玛变换,RMODE表示DCT变换产生的位数,λMODE表示拉格朗日乘数。
5.根据权利要求1所述的基于H.266的自适应CU分区和跳过模式方法,其特征在于,所述拆分类型包括四叉树分割、垂直二进制分割、垂直三进制分割、水平二进制分割和水平三进制分割;所述垂直拆分类型包括垂直二进制分割和垂直三进制分割。
6.根据权利要求1所述的基于H.266的自适应CU分区和跳过模式方法,其特征在于,利用检出率和命中率计算出自适应CU分区方法的效率:
Figure FDA0004059086280000031
其中,DR表示自适应CU分区的复杂度降低率,HR表示自适应CU分区的决策精度,A表示跳过垂直二进制分割和垂直三进制分割,B表示真正跳过垂直二进制和三进制分割的RD成本检查,Prob(A/B)和Prob(B/A)均表示条件概率,C(.)表示与A、B、A/B或B/A相关的CU分区的总数。
CN202010046795.5A 2020-01-16 2020-01-16 基于h.266的自适应cu分区和跳过模式方法 Active CN111212292B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010046795.5A CN111212292B (zh) 2020-01-16 2020-01-16 基于h.266的自适应cu分区和跳过模式方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010046795.5A CN111212292B (zh) 2020-01-16 2020-01-16 基于h.266的自适应cu分区和跳过模式方法

Publications (2)

Publication Number Publication Date
CN111212292A CN111212292A (zh) 2020-05-29
CN111212292B true CN111212292B (zh) 2023-04-28

Family

ID=70789730

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010046795.5A Active CN111212292B (zh) 2020-01-16 2020-01-16 基于h.266的自适应cu分区和跳过模式方法

Country Status (1)

Country Link
CN (1) CN111212292B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112291562B (zh) * 2020-10-29 2022-06-14 郑州轻工业大学 针对h.266/vvc的快速cu分区和帧内模式决策方法
CN115379217A (zh) * 2022-07-14 2022-11-22 百果园技术(新加坡)有限公司 一种视频编码处理方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009052740A1 (en) * 2007-10-15 2009-04-30 Huawei Technologies Co., Ltd. An adaptive predicting device and method
CN104333755A (zh) * 2014-10-27 2015-02-04 上海交通大学 HEVC中B帧的基于SKIP/Merge RD Cost的CU提前终止方法
CN104394409A (zh) * 2014-11-21 2015-03-04 西安电子科技大学 基于空域相关性的hevc预测模式快速选择方法
CN107087200A (zh) * 2017-05-11 2017-08-22 郑州轻工业学院 针对高效率视频编码标准的跳过编码模式提前判决方法
WO2019174594A1 (en) * 2018-03-14 2019-09-19 Mediatek Inc. Method and apparatus of optimized splitting structure for video coding

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140072231A (ko) * 2012-11-26 2014-06-13 한국전자통신연구원 율-왜곡 비용의 확률분포를 이용한 비디오 부호화기의 고속 예측모드 결정 방법
US10085027B2 (en) * 2015-03-06 2018-09-25 Qualcomm Incorporated Adaptive mode checking order for video encoding

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009052740A1 (en) * 2007-10-15 2009-04-30 Huawei Technologies Co., Ltd. An adaptive predicting device and method
CN104333755A (zh) * 2014-10-27 2015-02-04 上海交通大学 HEVC中B帧的基于SKIP/Merge RD Cost的CU提前终止方法
CN104394409A (zh) * 2014-11-21 2015-03-04 西安电子科技大学 基于空域相关性的hevc预测模式快速选择方法
CN107087200A (zh) * 2017-05-11 2017-08-22 郑州轻工业学院 针对高效率视频编码标准的跳过编码模式提前判决方法
WO2019174594A1 (en) * 2018-03-14 2019-09-19 Mediatek Inc. Method and apparatus of optimized splitting structure for video coding

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Bochuan Du ; Wan-Chi Siu ; Xuefei Yang.Fast CU partition strategy for HEVC intra-frame coding using learning approach via random forests.《2015 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA)》.2016, *
基于图像空间相关性与纹理的HEVC块划分快速算法;姚英彪等;《电信科学》;20150120(第01期);全文 *

Also Published As

Publication number Publication date
CN111212292A (zh) 2020-05-29

Similar Documents

Publication Publication Date Title
CN103997646B (zh) 一种高清视频编码中快速帧内预测模式选择方法
Choi et al. Fast coding mode selection with rate-distortion optimization for MPEG-4 part-10 AVC/H. 264
KR101344200B1 (ko) 모션 추정 검색 범위 및 확장된 모션 벡터 범위의 동적 선택 방법, 및 인코더
US7706442B2 (en) Method for coding mode selection of intra prediction in video compression
CN110662078B (zh) 适用于avs2和hevc的4k/8k超高清编码帧间编码帧快速算法
JP2013138500A (ja) 画像符号化装置、画像復号装置、画像符号化方法、および画像復号方法
CN103533355B (zh) 一种hevc快速编码方法
CN111212292B (zh) 基于h.266的自适应cu分区和跳过模式方法
CN105681808B (zh) 一种scc帧间编码单元模式的快速决策方法
CN112637591B (zh) 一种视频预测编码的方法及装置
CN106534849A (zh) 一种快速的hevc帧间编码方法
KR100910209B1 (ko) 세분화된 탐색 영역을 기반으로 하는 고속 전영역 움직임예측 방법 및 그 장치
CN103702131A (zh) 一种基于模式预处理的帧内编码优化方法和系统
CN109151467A (zh) 基于图像块活动性的屏幕内容编码帧间模式快速选择方法
CN110139098B (zh) 基于决策树的高效率视频编码器帧内快速算法选择方法
CN109040756B (zh) 一种基于hevc图像内容复杂度的快速运动估计方法
Jillani et al. Multi-view clustering for fast intra mode decision in HEVC
KR100987581B1 (ko) 고속 움직임 추정을 위한 부분 블록정합 방법
Kim et al. A feature-based approach to fast H. 264 intra/inter mode decision
CN110446042B (zh) 一种提升h.264中p帧质量的编码方法
CN109168000B (zh) 一种基于rc预测的hevc帧内预测快速算法
CN110113601B (zh) 基于视频图片纹理特征的hevc帧内快速算法选择方法
Liu et al. Fast motion estimation algorithm for high efficient video coding
Li et al. Fast intra candidate selection and CU split in intra prediction for Future Video Coding
Wang et al. Probability-based decoder-side intra mode derivation for VVC

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant