CN114040211A

CN114040211A - 一种基于avs3的帧内预测快速决策方法

Info

Publication number: CN114040211A
Application number: CN202111256139.9A
Authority: CN
Inventors: 梁凡; 徐贵; 贾一凡
Original assignee: Sun Yat Sen University
Current assignee: Sun Yat Sen University
Priority date: 2021-10-27
Filing date: 2021-10-27
Publication date: 2022-02-11

Abstract

本发明公开了一种基于AVS3的帧内预测快速决策方法，方法包括：对预测块的帧内衍生模式进行划分，获取目标预测模式列表；采用帧内预测快速算法获取预测模式粗选列表；获取所述目标预测模式列表和所述预测模式粗选列表的并集，得到率失真代价列表；计算所述率失真代价列表的率失真代价；将率失真代价最小的模式确定为最优预测模式；其中，所述帧内预测快速算法包括基于纹理方向的帧内预测决策快速算法以及基于相邻预测块空间相关性的帧内预测决策快速算法。本发明的稳定性高且编码时间短，可广泛应用于音视频编码技术领域。

Description

一种基于AVS3的帧内预测快速决策方法

技术领域

本发明涉及音视频编码技术领域，尤其是一种基于AVS3的帧内预测快速决策方法。

背景技术

数字音视频编解码技术标准工作组(Audio Video coding Standard Workgroupof China，AVS)在2002年成立，主要负责制(修)订数字音视频的压缩、解压缩、处理和表示等共性技术标准，为数字音视频设备与系统提供高效经济的编解码技术，服务于高分辨率数字广播、高密度激光数字存储媒体、无线宽带多媒体通讯、互联网宽带流媒体等重大信息产业应用。AVS工作组制定的AVS系列标准，如AVS+，AVS2，已经广泛应用在国内视频应用中，国内视频编码标准发展也逐步跟上国际视频编码标准的步伐。2017年，国际标准组织开始制定下一代视频压缩标准VVC；AVS工作组发布第三代面向8K及5G产业应用的音视频编解码技术标准AVS3。

AVS3在保留了AVS2部分编码工具的同时，针对不同模块引入的新的编码工具，更加丰富的块划分方式、更精细的预测模式以及更灵活的变换核，提高了编码效率，同时也加大了编码的复杂度。总体性能对比结果来看，AVS3相比AVS2编码性能高出23.52％，时间复杂度增加了一倍，解码复杂度是AVS2参考软件的一半。相对HEVC平均编码性能提高了22.25％，时间复杂度大概是HEVC的7倍，解码时间略有上升。复杂度的增加不利于进行实时编码，也给硬件实现带来了困难，这大大限制了AVS3的应用和推广，因此降低AVS3的复杂度，提高编码速度的快速算法成为当下重点研究内容。

AVS2规定了33种帧内预测模式，编号0到32，如图1中黑色箭头所示。包括DC、Plane以及Bilinear3种非角度模式和30种角度模式，角度模式的预测方向之间夹角为7.5度，AVS3的EIPM对30种角度模式进行了拓展，在垂直方向(编号12)和水平方向(编号24)两侧各增加了两种角度，其他方向之间增加一种角度，即预测方向之间夹角减半为3.75度，新增的32种角度模式编号为34到65，在图1中用红色箭头表示。新增的预测模式细化了预测方向，提高了对视频方向性纹理特征的预测能力，有利于处理纹理更为复杂的高清视频，但也大大增加了编码复杂度，视频的实时性大打折扣，不利于推广。

发明内容

有鉴于此，本发明实施例提供一种稳定性高且编码时间短的，基于AVS3的帧内预测快速决策方法。

本发明的一方面提供了一种基于AVS3的帧内预测快速决策方法，包括：

对预测块的帧内衍生模式进行划分，获取目标预测模式列表；

采用帧内预测快速算法获取预测模式粗选列表；

获取所述目标预测模式列表和所述预测模式粗选列表的并集，得到率失真代价列表；

计算所述率失真代价列表的率失真代价；

将率失真代价最小的模式确定为最优预测模式；

其中，所述帧内预测快速算法包括基于纹理方向的帧内预测决策快速算法以及基于相邻预测块空间相关性的帧内预测决策快速算法。

可选地，采用帧内预测快速算法获取预测模式粗选列表，包括：

若当前预测块存在左方和上方相邻块，且所述相邻块的预测模式均为垂直方向，则计算所述预测块在水平方向和垂直方向的纹理值；

当垂直方向的纹理值大于水平方向的纹理值时，构建第一垂直粗选列表，并计算所述第一垂直粗选列表中预测模式的哈达玛代价，根据所述哈达玛代价更新所述第一垂直粗选列表；

根据所述第一垂直粗选列表，构建第二垂直粗选列表，并计算所述第二垂直粗选列表的哈达玛代价，根据所述哈达玛代价更新所述第二垂直粗选列表；

根据所述第二垂直粗选列表构建率失真优化列表。

可选地，采用帧内预测快速算法获取预测模式粗选列表，还包括：

若当前预测块存在左方和上方相邻块，且所述相邻块的预测模式均为水平方向，则计算所述预测块在水平方向和垂直方向的纹理值；

当水平方向的纹理值大于垂直方向的纹理值时，构建第一水平粗选列表，并计算所述第一水平粗选列表中预测模式的哈达玛代价，根据所述哈达玛代价更新所述第一水平粗选列表；

根据所述第一水平粗选列表，构建第二水平粗选列表，并计算所述第二水平粗选列表的哈达玛代价，根据所述哈达玛代价更新所述第二水平粗选列表；

根据所述第二水平粗选列表构建率失真优化列表。

若当前预测块存在左方和上方相邻块，所述相邻块的预测模式不是均为水平方向或不是均为垂直方向时，构建第一粗选列表，并且计算所述第一粗选列表中预测模式的哈达玛代价，根据所述哈达玛代价更新所述第一粗选列表；

当所述第一粗选列表中哈达玛代价最小的前两名预测模式均是DC模式或Plane模式，则根据所述哈达玛代价最小的前两名预测模式构建率失真代价列表。

可选地，所述采用帧内预测快速算法获取预测模式粗选列表，还包括：

当所述第一粗选列表中哈达玛代价最小的前两名预测模式不满足均是DC模式或Plane模式时；

若最可能模式为特殊模式，则将起始搜索模式确定为水平方向和垂直方向中哈达玛代价最小的目标模式；

根据所述目标模式，构建第二粗选列表，并计算所述第二粗选列表的哈达玛代价，根据所述哈达玛代价更新所述第二粗选列表；

根据所述第二粗选列表构建第三粗选列表，并计算所述第三粗选列表的哈达玛代价，根据所述哈达玛代价更新所述第三粗选列表；

从所述第三粗选列表中选取哈达玛代价最小的前两名预测模式构建率失真代价列表。

若最可能模式不是特殊模式，则将起始搜索模式确定为水平方向、垂直方向或最可能模式中哈达玛代价最小的目标模式。

本发明实施例的另一方面提供了一种基于AVS3的帧内预测快速决策装置，包括：

第一模块，用于对预测块的帧内衍生模式进行划分，获取目标预测模式列表；

第二模块，用于采用帧内预测快速算法获取预测模式粗选列表；

第三模块，用于获取所述目标预测模式列表和所述预测模式粗选列表的并集，得到率失真代价列表；

第四模块，用于计算所述率失真代价列表的率失真代价；

第五模块，用于将率失真代价最小的模式确定为最优预测模式；

本发明实施例的另一方面提供了一种电子设备，包括处理器以及存储器；

所述存储器用于存储程序；

所述处理器执行所述程序实现如前面所述的方法。

本发明实施例的另一方面提供了一种计算机可读存储介质，所述存储介质存储有程序，所述程序被处理器执行实现如前面所述的方法。

本发明实施例的另一方面提供了一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如前面所述的方法。

本发明的实施例对预测块的帧内衍生模式进行划分，获取目标预测模式列表；采用帧内预测快速算法获取预测模式粗选列表；获取所述目标预测模式列表和所述预测模式粗选列表的并集，得到率失真代价列表；计算所述率失真代价列表的率失真代价；将率失真代价最小的模式确定为最优预测模式；其中，所述帧内预测快速算法包括基于纹理方向的帧内预测决策快速算法以及基于相邻预测块空间相关性的帧内预测决策快速算法。本发明的稳定性高且编码时间短。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的帧内预测模式的示意图；

图2为本发明实施例提供的典型水平和垂直水平方向的预测模式的示意图；

图3为本发明实施例提供的预测块的垂直方向的预测模式示意图；

图4为本发明实施例提供的采用帧内预测快速算法获取预测模式粗选列表的步骤流程图；

图5为本发明实施例提供的整体步骤流程图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

针对现有技术存在的问题，本发明实施例提供了一种基于AVS3的帧内预测快速决策方法，包括：

采用帧内预测快速算法获取预测模式粗选列表；

计算所述率失真代价列表的率失真代价；

将率失真代价最小的模式确定为最优预测模式；

根据所述第二垂直粗选列表构建率失真优化列表。

根据所述第二水平粗选列表构建率失真优化列表。

第四模块，用于计算所述率失真代价列表的率失真代价；

所述存储器用于存储程序；

所述处理器执行所述程序实现如前面所述的方法。

下面结合说明书附图，本发明的基于AVS3的帧内预测快速决策方法的具体实现原理进行详细说明：

首先，本实施例对基于纹理方向的帧内预测决策快速算法进行详细说明：

以垂直方向为例进行说明：

1.若当前PU块存在左方和上方相邻块，且相邻块的预测模式均为典型的垂直方向，即MPM[0]∈Ver_List且MPM[1]∈Ver_List时(其中MPM列表为最可能的预测模式，MPM[0]与MPM[1]分别代表与当前PU左方和上方相邻已编码的PU块，Ver_List如图2中蓝色箭头所示模式号，绿色为典型的水平方向模式集合Hor_List)，计算CU大小为w*h水平和垂直方向的纹理值Dh和Dv值，其计算公式如式2-1和式2-2所示，其中I(i,j)表示坐标为(i,j)的像素值。最后进行阈值判决，满足判决条件时构建粗选列表Ver_RMD1＝{1,37,8,40,11,12,13,47,16,50,65}(水平方向的粗选列表构建为Hor_RMD1＝{1,34,5,18,52,21,55,57,25,61,28,64})，模式分布如图3中蓝色模式号所示。计算列表Ver_RMD1中预测模式的哈达玛代价，并更新列表。

哈达玛代价J_HAD计算如公式2-3所示。其中λ_mode和R_mode分别为当前帧内预测模式的拉格朗日系数和所需的编码比特数，SATD_res是指将残差信号进行哈达玛变换后元素的绝对值之和，即绝对变换误差和(Sum of Absolute Transformed Difference，SATD)，设D是大小为w*h的残差信号矩阵，H为哈达玛变换矩阵,其哈达玛变换后的表达式如2-4所示，则该残差信号的SATD值可以由式2-5求得。相比于率失真代价计算过程，哈达玛代价计算仅仅使用了加减法，且哈达玛矩阵可以递归生成，复杂度相对降低很多，性能也十分接近视频编码中实际使用的DCT。

J_HAD＝SATD_res+λ_mode·R_mode 2-3

T(D)＝HDH 2-4

SATD_res＝∑_w∑_h|T(D)| 2-5

2.在Ver_RMD1中，选出与哈达玛代价最小的前三名左右相邻的预测模式构建粗选列表Ver_RMD2，如图2中红色模式号所示为与Ver_RMD1左相邻的预测模式，绿色模式号为与Ver_RMD1右相邻的预测模式。计算列表Ver_RMD2中预测模式的哈达玛代价，并更新列表。

3.在Ver_RMD2中选出与哈达玛代价最小的前三名构建率失真优化列表List_RDO。

4.将MPM的预测模式并入List_RDO。

5.计算RDO代价更新列表,取代价最小的模式为最佳预测模式。RDO代价J_mode计算公式如式2-6所示，其中λ_mode和R_mode为当前模式下拉格朗日系数和编码所需的比特数，SSD表示原始像素和重建像素误差的平方和，计算公式为式2-7，其中I(x,y)，O(x,y)分别表示原始像素和重建像素。

J_mode＝SSD+λ_mode·R_mode 2-6

本发明实施例的基于纹理方向的帧内预测决策快速算法最多需要12+3*2+3＝21次哈达玛代价以及5次RDO计算，比HPM9.0最多节约33次哈达玛代价的计算，但是引入了Dh和Dv的计算量，为进一步降低计算复杂度，对于不具有明显方向特性，利用相邻PU块之间的相关性设计了基于相邻PU块空间相关性的帧内预测决策快速算法。

下面进一步介绍本发明实施例的基于相邻PU块空间相关性的帧内预测决策快速算法的实现原理：

具体步骤包括：

1.选择特殊模式、水平、垂直以及MPM这几种特殊角度的模式构建粗选列表List_RMD1，即List_RMD1＝{0,1,2,12,24}∪MPM，计算列表List_RMD1中预测模式的哈达玛代价，并更新列表。

2.若List_RMD1中哈达玛代价最小的前两名均是DC或Plane模式，则结束模式粗选，并入MPM后直接进入RDO过程；否则，继续模式粗选。

3.若MPM中的模式均为特殊模式，则设起始搜索模式为水平和垂直方向哈达玛代价中的较小者，即Search_Start＝min_cost(12,24)；否则，设起始搜索模式为水平、垂直方向以及MPM中哈达玛代价的最小者，即Search_Start＝min_cost(12,24,MPM)。

4.用与起始搜索模式间隔为4n，n＝1,2,3,...的预测模式构建粗选列表List_RMD2，计算列表List_RMD2预测模式的哈达玛代价，并更新列表。

5.在List_RMD2中，选出与哈达玛代价最小的模式左右相邻的4个预测模式构建粗选列表List_RMD3，计算列表List_RMD3预测模式的哈达玛代价，并更新列表。

6.取列表List_RMD3哈达玛代价最小的前两名构建率失真优化列表List_RDO。

7.将MPM的预测模式并入List_RDO。

8.计算RDO代价更新列表,取代价最小的模式为最佳预测模式。

本实施例的算法最多需要7+15+4＝26次哈达玛代价以及4次RDO计算，HPM9.0最多节约28次哈达玛代价的计算以及1次RDO计算。

最后，本发明将上述两种算法合并为帧内预测决策快速算法，根据以上描述，可以作出流程图如图4所示。其中401为基于纹理方向的帧内预测决策快速算法的步骤流程，402为基于相邻PU块空间相关性的帧内预测决策快速算法的步骤流程。帧内预测决策快速算法在整个帧内预测流程中位置如图5所示。

本实施例还针对本发明提出的技术方案与相关技术方案进行试验，比较不同方法之间的处理效果。

具体地，在AVS3标准制定过程中，为了探索有潜力的编码算法、并公平地评估新的编码技术，AVS3标准工作组使用High-Performance Model(HPM)作为参考软件平台，本实施例实验采用的是HPM9.0。通用测试序列根据分辨率不同分为通甲类、通乙类、通丙类，每类序列包含四种不同场景和内容的视频。视频编码的客观评价指标包括视频压缩率、编码重建后的视频质量以及编码速度，其中视频压缩率和编码重建后的视频质量相互制约，用BD-Rate来衡量，且人眼对亮度比对色度敏感，参考Y分量的BD-Rate值即可，编码速度用节约编码时间比TS衡量。

帧内预测决策快速算法实验结果如表1所示，表1展示了帧内预测决策快速算法实验结果，可以看出，本发明的方法对比原HPM9.0算法有显著效果。在仅带来0.40％BD-Rate上升的情况下，节约了25.4％的编码时间，归一化节约的编码时间为64％，即BD-Rate上升1％的情况下节约是编码时间为64％。不同序列之间节约的编码时间以及编码损失相对较为稳定，在平均值附近波动。

表1

序列类型	BD-Rate(Y)	TS	TS/BD-Rate
				通甲类(3840*2160)	0.42％	25.1％	60
通乙类1920*1080)	0.38％	27.2％	72
				通丙类(1280*720)	0.39％	24.0％	62
平均	0.40％	25.4％	64

在一些可选择的实施例中，在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如，取决于所涉及的功能/操作，连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外，在本发明的流程图中所呈现和描述的实施例以示例的方式被提供，目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的，其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。

此外，虽然在功能性模块的背景下描述了本发明，但应当理解的是，除非另有相反说明，所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中，或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是，有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说，考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下，在工程师的常规技术内将会了解该模块的实际实现。因此，本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是，所公开的特定概念仅仅是说明性的，并不意在限制本发明的范围，本发明的范围由所附权利要求书及其等同方案的全部范围来决定。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。

计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

以上是对本发明的较佳实施进行了具体说明，但本发明并不限于所述实施例，熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换，这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims

1.一种基于AVS3的帧内预测快速决策方法，其特征在于，包括：

采用帧内预测快速算法获取预测模式粗选列表；

计算所述率失真代价列表的率失真代价；

将率失真代价最小的模式确定为最优预测模式；

2.根据权利要求1所述的一种基于AVS3的帧内预测快速决策方法，其特征在于，采用帧内预测快速算法获取预测模式粗选列表，包括：

根据所述第二垂直粗选列表构建率失真优化列表。

3.根据权利要求2所述的一种基于AVS3的帧内预测快速决策方法，其特征在于，采用帧内预测快速算法获取预测模式粗选列表，还包括：

根据所述第二水平粗选列表构建率失真优化列表。

4.根据权利要求3所述的一种基于AVS3的帧内预测快速决策方法，其特征在于，采用帧内预测快速算法获取预测模式粗选列表，还包括：

5.根据权利要求4所述的一种基于AVS3的帧内预测快速决策方法，其特征在于，所述采用帧内预测快速算法获取预测模式粗选列表，还包括：

6.根据权利要求5所述的一种基于AVS3的帧内预测快速决策方法，其特征在于，所述采用帧内预测快速算法获取预测模式粗选列表，还包括：

7.一种基于AVS3的帧内预测快速决策装置，其特征在于，包括：

第四模块，用于计算所述率失真代价列表的率失真代价；

8.一种电子设备，其特征在于，包括处理器以及存储器；

所述存储器用于存储程序；

所述处理器执行所述程序实现如权利要求1至6中任一项所述的方法。

9.一种计算机可读存储介质，其特征在于，所述存储介质存储有程序，所述程序被处理器执行实现如权利要求1至6中任一项所述的方法。

10.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6任意一项所述的方法。