CN111212292B

CN111212292B - 基于h.266的自适应cu分区和跳过模式方法

Info

Publication number: CN111212292B
Application number: CN202010046795.5A
Authority: CN
Inventors: 张秋闻; 赵进超; 王艳军; 王祎菡; 赵永博; 黄立勋; 吴庆岗; 常化文; 蒋斌; 王晓; 张伟伟; 崔腾耀; 孙丽君; 钱晓亮
Original assignee: Zhengzhou University of Light Industry
Current assignee: Zhengzhou University of Light Industry
Priority date: 2020-01-16
Filing date: 2020-01-16
Publication date: 2023-04-28
Anticipated expiration: 2040-01-16
Also published as: CN111212292A

Abstract

本发明提出了一种基于H.266的自适应CU分区和跳过模式方法，其步骤为：首先，利用编码器将视频划分为编码树单元；其次，根据编码树单元的不同分别利用改进的贝叶斯决策或相邻块单元的RD成本信息对CU块进行分割；再根据分割后的子CU块的相邻块及分割前的CU块的相关性，计算子CU块的相邻块及分割前的CU块的RD成本的平均值，并作为帧间预测的阈值；最后，根据子CU块的RD成本与帧间预测的阈值的关系，判断子CU块是否帧间预测确定最佳编码模式。本发明利用时间和空间的相关性分析当前CU块的特征，进行自适应CU分区及早期跳过模式检测，有效降低了CU分区以及预测过程的复杂度，从而加速编码过程。

Description

基于H.266的自适应CU分区和跳过模式方法

技术领域

本发明涉及图像处理技术领域，特别是指一种基于H.266的自适应CU分区和跳过模式方法。

背景技术

联合视频探索小组(JVET)开发了下一代视频编码标准多功能视频编码(H.266/VVC)，为了改善现有的HEVC并提供更高的压缩性能。高效视频编码(HEVC)在2013年被标准化，用于分辨率高达2K的视频。VVC测试模型(VTM)采用并实现了许多新颖的技术，这些技术大大提高了H.266/VVC的编码效率。目前，H.264/AVC和H.265/HEVC以及H.266/VVC都使用混合视频编码的框架，但是，很多用于HEVC的快速CU方法并不适用于H.266/VVC。因此，需要采用新的方法来加快H.266/VVC的CU决策。

在QTMT中，所有四叉树的叶子节点都可以拆分为二叉树或三叉树，但HEVC中的CU分区结构只能拆分为四叉树，但是HEVC和H.266/VVC中的编码树单元(CTU)的概念没有区别。根据所有可能的分割模式中的率失真(RD)成本的最小值，可以获得CU的最佳分割模式。在单棵树中，引入小块(即2×N)会导致硬件实现效率低下，因为这会导致流水线延迟，并且在硬件体系结构中需要2×N像素的处理。此外，对于2×N的块，每一个时钟处理需要额外的2×2个像素。在对偶树中，小块CU需要比8×8双向预测更高的存储带宽。因此，开发一种快速的帧内算法是非常有必要的，它可以降低编码器的复杂性，同时节省编码时间。

目前针对H.266/VVC的自适应CU分区和早期跳过模式检测的方法的研究，主要有：T.Fu等人通过贝叶斯决策规则提出了一种新颖的快速CU块划分算法。TL.Lin等人提出了一种基于空间特征的快速二叉树划分决策算法。Y.Huang等人提出了具有突破性的块结构设计的基于块的混合编码方法。H.Yang等人提出了一种由低复杂度编码树单元(CTU)结构决策和快速帧内模式决策组成的快速帧内编码算法。B.Min等人提出了一种用于帧内编码的CU大小决策的快速算法。M.Ramezanpou等人提出了一种用于帧内预测的提前终止算法。K.Lim等人提出了一种快速PU跳过和拆分的终止算法。

虽然上述算法可以有效地加速CU的决策，尤其是HEVC中有许多用于快速分区和早期跳过的算法，但是很少有适用于H.266/VVC的算法。这些方法并没有充分利用当前块与相邻块之前的相关性，因此，需要进一步降低对CU分区以及预测模式的计算复杂度和编码时间。

发明内容

针对上述背景技术中存在的不足，本发明提出了一种基于H.266的自适应CU分区和跳过模式方法，解决了现有技术没有充分利用当前块与相邻块之前的相关性，造成编码器的复杂度高的技术问题。

本发明的技术方案是这样实现的：

一种基于H.266的自适应CU分区和跳过模式方法，其步骤如下：

S1、利用编码器将视频划分为编码树单元，其中，编码树单元包括单树和对偶树；

S2、在单树中，利用改进的贝叶斯决策对CU块进行分割，进入步骤S4；

S3、在对偶树中，根据相邻块单元的RD成本信息对CU块进行分割，进入步骤S4；

S4、根据分割后的子CU块的相邻块及分割前的CU块的相关性，计算子CU块的相邻块及分割前的CU块的RD成本的平均值，并将平均值作为帧间预测的阈值；

S5、如果子CU块的RD成本小于帧间预测的阈值，对子CU块进行帧内预测，找出最佳编码模式，否则，对子CU块进行帧间预测和帧内预测，找出最佳编码模式。

所述在单树中，利用改进的贝叶斯决策对CU块进行分割的方法为：

S21、对CU块进行四叉树分割，得到中间CU块；

S22、比较中间CU块在给定特征向量的条件下选择垂直拆分类型的概率与中间CU块在给定特征向量的条件下未选择垂直拆分类型的概率：

P(V₀|F)>P(V₁|F) (1)，

其中，V₀表示中间CU块在对所有拆分类型进行递归RD检查后未选择垂直拆分类型，V₁表示中间CU块在对所有拆分类型进行递归RD检查后选择垂直拆分类型，P(V₀|F)表示给定特征向量F{f_STU,f_STL}的中间CU块属于类V₀的概率，P(V₁|F)表示给定特定向量F{f_STU,f_STL}的中间CU块属于类V₁的概率，且P(V₀|F)和P(V₁|F)均为后验概率，f_STU和f_STL分别代表中间CU块的拆分类型；

S23、根据贝叶斯公式

将公式(1)转化为：

P(F|V₀)P(V₀)>P(F|V₁)P(V₁) (2)，

其中，P(V₀)表示在类V₀时的先验概率，P(V₁)表示在类V₁时的先验概率；

S24、对公式(2)进行改进得到改进的贝叶斯决策方程：

P(F|V₀)P(V₀)>α·P(F|V₁)P(V₁) (3)，

其中，α为平衡因子，P(F|V₀)表示在类V₀时的条件概率密度函数，P(F|V₁)表示在类V₁时的条件概率密度函数；

S25、如果中间CU块属于类V₀的条件概率与先验概率的乘积大于中间CU块属于类V₁的条件概率与先验概率的乘积，中间CU块跳过大小为8×N和16×N的垂直二进制分割和垂直三进制分割，N表示编码块的长度或宽度。

所述在对偶树中，根据相邻块单元的RD成本信息对CU块进行分割的方法为：

S31、对CU块进行四叉树分割，得到中间CU块；

S32、计算中间CU块的RD成本值RD_M、中间CU块进行二进制分割后的RD成本值RD_B、中间CU块进行三进制分割后的RD成本值RD_T，并比较成本值RD_M、成本值RD_B、成本值RD_T之间的大小；

S33、当中间CU块的RD成本值RD_M满足RD_M＜RD_B&RD_M＜RD_T时，计算大小为4×N和8×N的中间CU块的RD成本值的平均值：

其中，0≤γ≤1，0≤β≤1，TH_M表示中间CU块是否跳过二进制分割和三进制分割的阈值，RDCost_i为中间CU块的相邻块的RD成本，γ为准确率因子，β_i为平衡因子，δ_i为参数，M表示当前CU块的长度或宽度；

S34、如果中间CU块的RD成本值小于阈值TH_M，则中间CU块跳过二进制分割和三进制分割，否则，中间CU块进行二进制分割或三进制分割。

所述帧间预测的阈值为：

其中，Rd cost_l为子CU块的左CU块的RD成本，Rd cost_u为子CU块的上CU块的RD成本，Rd cost_l-u为子CU块的左上CU块的RD成本，Rd cost_r-u为子CU块的右上CU块的RD成本，Rdcost_p为分割前的CU块较高深度级别的RD成本。

所述对子CU块进行帧内预测，选择最佳编码模式的方法为：

S51、将帧内预测分为两步、分别为“粗搜索”和“细搜索”；

S52、在“粗搜索”中，通过绝对变换差总和SATD从H.265/HEVC中的35种帧内预测模式中选出N*个模式，再通过绝对变换差总和SATD计算N*个模式的相邻模式的粗略的RD成本，并更新N*个模式作为的最佳候选模式；

S53、在“细搜索”中，计算N*个最佳候选模式和最可能模式的完整的RD成本：

J_MODE＝D_REC+λ_MODE×R_REC (10)，

其中，D_REC表示原始块和重建块之间的平方差之和，R_REC表示当前预测模式占用的位数，λ_MODE表示拉格朗日乘数，最可能模式包括邻近模式、派生模式和默认模式；

S54、比较N*个最佳候选模式和最可能模式的完整的RD成本值的大小，将最小的完整的RD成本值对应的编码模式作为最佳编码模式。

所述粗略的RD成本的计算方法为：

J_RMS＝D_Had+λ_MODE×R_MODE (9)，

其中，D_Had表示中间CU块与中间CU块进行帧内预测后的重构块之差的哈达玛变换，R_MODE表示DCT变换产生的位数，λ表示拉格朗日乘数。

所述拆分类型包括四叉树分割、垂直二进制分割、垂直三进制分割、水平二进制分割和水平三进制分割；所述垂直拆分类型包括垂直二进制分割和垂直三进制分割。

利用检出率和命中率计算出自适应CU分区方法的效率：

其中，DR表示自适应CU分区的复杂度降低率，HR表示自适应CU分区的决策精度，A表示跳过垂直二进制分割和垂直三进制分割，B表示真正跳过垂直二进制和三进制分割的RD成本检查，Prob(A/B)和Prob(B/A)均表示条件概率，C(.)表示与A、B、A/B或B/A相关的CU分区的总数。

本技术方案能产生的有益效果：本发明利用时间和空间的相关性分析当前CU块的特征，再根据时间和空间的相关性得到相应的阈值，进行自适应CU分区以及早期跳过模式检测，有效降低了CU的分区以及预测过程的复杂度，从而加速编码过程。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的流程图；

图2为本发明的自适应CU分区方法的复杂度降低率和决策精度曲线图；

图3为本发明的当前CU块的相邻块分布图；

图4为本发明基于序列“Cactus”的RD性能曲线图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，本发明实施例提供了一种基于H.266的自适应CU分区和跳过模式方法，首先以利用时间和空间的相关性分析当前CU块的特征，然后根据这些相关性得到相应的阈值，进行自适应CU分区以及早期跳过模式检测，以有效降低CU的分区以及预测过程的复杂度，从而加速编码过程，具体步骤如下：

S1、利用编码器将视频划分为编码树单元(CTU)，开始进行CU的划分，其中，编码树单元包括单树和对偶树。

S2、在单树中，早期跳过8×N和16×N CU垂直二进制分割和垂直三进制分割的过程被视为二进制类别方法，利用改进的贝叶斯决策对CU块进行分割，进入步骤S4；具体实现方法为：

S21、对CU块进行四叉树分割，得到中间CU块；

P(V₀|F)>P(V₁|F) (1)，

其中，V₀表示中间CU块在对所有拆分类型进行递归RD检查后未选择垂直拆分类型，V₁表示中间CU块在对所有拆分类型进行递归RD检查后选择垂直拆分类型，P(V₀|F)表示给定特征向量F{f_STU,f_STL}的中间CU块属于类V₀的概率，P(V₁|F)表示给定特定向量F{f_STU,f_STL}的中间CU块属于类V₁的概率，且P(V₀|F)和P(V₁|F)均为后验概率，f_STU和f_STL分别代表中间CU块的拆分类型；其中，拆分类型包括四叉树分割、垂直二进制分割、垂直三进制分割、水平二进制分割和水平三进制分割；所述垂直拆分类型包括垂直二进制分割和垂直三进制分割。

S23、根据贝叶斯公式

将公式(1)转化为：

P(F|V₀)P(V₀)>P(F|V₁)P(V₁) (2)，

S24、对公式(2)进行改进得到改进的贝叶斯决策方程：

P(F|V₀)P(V₀)>α·P(F|V₁)P(V₁) (3)，

利用检出率和命中率计算出自适应CU分区方法的效率：

其中，DR表示自适应CU分区的复杂度降低率，HR表示自适应CU分区的决策精度，A表示跳过垂直二进制分割和垂直三进制分割，B表示真正跳过垂直二进制和三进制分割的RD成本检查，Prob(A/B)和Prob(B/A)均表示条件概率，C(.)表示与A、B、A/B或B/A相关的CU分区的总数。如果HR较大，则可以更精确地决定中间CU块是否提前跳过垂直二进制分割和垂直三进制分割。如图2所示，当DR为62％时，表明62％的中间CU块可以提前跳过垂直二进制分割和垂直三进制分割，HR为85％，表明85％的中间CU块真正跳过垂直二进制分割和垂直三进制分割。这些统计数据表明了所本发明中自适应CU分区方法的可行性。

S3、在对偶树中，相邻块单元的RD成本信息用于实现分区的早期终止二进制以及三进制分割，根据图像的局部相关性，相邻图像区域的相似度较高，但随着空间距离的增加，相似度变低，根据相邻块单元的RD成本信息对CU块进行分割，进入步骤S4；具体实现方法为：

S31、对CU块进行四叉树分割，得到中间CU块；

其中，0≤γ≤1，0≤β≤1，TH_M表示中间CU块是否跳过二进制和三进制分割的阈值，RDCost_i为中间CU块的相邻块的RD成本，M表示当前CU块的长度或宽度，γ为准确率因子，β为平衡因子，δ是根据相邻CU是否可用来取值，如果可用，则为1，如果不可用，则为0；

所述帧间预测的阈值为：

其中，Rd cost_l为子CU块的左CU块的RD成本，Rd cost_u为子CU块的上CU块的RD成本，Rd cost_l-u为子CU块的左上CU块的RD成本，Rd cost_r-u为子CU块的右上CU块的RD成本，Rdcost_p为分割前的CU块较高深度级别的RD成本。图3为子CU块的相邻块分布，所述根据相邻CU以及分割前CU的相关性，计算他们的平均RD成本值作为跳过子CU块的帧间预测的阈值。

所述对子CU块进行帧内预测，选择最佳编码模式的方法为：

S51、帧内预测需要从67个帧内预测模式中选择最佳的预测模式，从而导致很高的计算复杂性。为了降低帧内编码预测模式选择的复杂性，帧内预测编码算法从67种预测模式中选择最佳预测模式，要经历两个步骤：第一步是“粗搜索”，第二步是“细搜索”；

S52、在“粗搜索”中，为了节省计算能力，通过绝对变换差总和SATD从H.265/HEVC中的35种帧内预测模式中选出N*个模式，再通过绝对变换差总和SATD计算N*个模式的相邻模式的粗略的RD成本，并更新N*个模式作为的最佳候选模式；

所述粗略的RD成本的计算方法为：

J_RMS＝D_Had+λ_MODE×R_MODE (9)，

其中，D_Had表示中间CU块与中间CU块进行帧内预测后的重构块之差的哈达玛变换，R_MODE表示DCT变换产生的位数，λ表示拉格朗日乘数。与完整的RD成本过程相比，哈达玛变换简化了计算过程，因此编码器可以快速挑选出可能的预测方向。

“粗搜索”包括两个阶段。RD成本计算的候选模式从67种减少到2种或7种帧内预测模式，从而取代了整体帧内预测模式的决策。两阶段帧内模式预选过程如下：在第一步中，通过绝对变换差总和(SATD)从原始的35种帧内预测模式中选出N*(N*与帧内预测块大小有关)个模式。在第二步中，由SATD进一步选择所选择的N*个模式的左和右模式，然后更新所选择的N*个模式的候选列表。

J_MODE＝D_REC+λ_MODE×R_REC (10)，

S54、比较N*个最佳候选模式和6个最可能模式的完整的RD成本值的大小，将最小的完整的RD成本值对应的编码模式作为最佳编码模式。

为了获得D_REC和R_REC必须完全编码计算的RD成本，由于完整的编码需要变换量化和熵编码，因此这些过程很耗时，所以采用“粗搜索”和“细搜索”两个步骤，从而降低计算复杂度。

为了评估本发明的特性，在最新的H.266/VVC参考软件VTM-6.0上实现。编码树块的固定大小是64×64像素，最大深度级别是4，并且基于上下文的自适应二进制算术编码(CABAC)被用作熵编码器。表1显示了本发明的实验结果，本发明在AI-10编码条件下结合了自适应CU分区和早期跳过模式检测方法。从表1得出结论，Y，U和V的平均值分别为0.96％，0.92％和0.99％，ETs的平均值约为50％。因此，本发明在保持与VTM-6.0相同的RD属性的同时，可大大减少所有视频序列的编码时间。图4给出了视频序列“Cactus”在AI-10编码条件下的更多详细信息，其中“YPSNR(dB)”表示平均峰值信噪比(PSNR)。根据图可以得出结论，本发明与VTM-6.0相比执行的编码效率几乎相同，同时，RD性能下降几乎可以忽略不计，即本发明与VTM-6.0的实验结果曲线几乎完全重合。

表1显示了本发明的实验结果

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。