CN115361549B

CN115361549B - 一种使用基于历史的运动矢量预测的编码器、解码器及相应方法

Info

Publication number: CN115361549B
Application number: CN202210585841.8A
Authority: CN
Inventors: 阿南德·梅赫·科特拉; 陈建乐; 塞米赫·艾森力克; 王彪; 高晗; 赵志杰
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2018-12-21
Filing date: 2019-12-20
Publication date: 2024-04-09
Anticipated expiration: 2039-12-20
Also published as: EP3868102A4; CN112715031B; KR20210089742A; CN112715031A; US11558607B2; MX2021007197A; EP3868102A1; US20210360228A1; CN115426491A; US20230209043A1; CN115103184A; CN115361549A; WO2020125738A1

Abstract

本发明实施例提供了图像编码方法和设备(编码器和/或解码器)。对图像的分块中的当前译码树单元(Coding Tree Unit，CTU)行对应的基于历史的运动矢量预测(History‑based Motion Vector Prediction，HMVP)列表进行初始化，并且根据所述初始化的HMVP列表处理当前CTU行中的CTU。

Description

一种使用基于历史的运动矢量预测的编码器、解码器及相应方法

本申请是分案申请，原申请的申请号是201980061144.9，原申请日是2019年12月20日，原申请的全部内容通过引用结合在本申请中。

技术领域

本申请(发明)实施例大体上涉及图像处理领域，更具体地，涉及使用基于历史的运动矢量预测(History-based Motion Vector Prediction，HMVP)对图像进行处理。

背景技术

视频译码(视频编码和解码)广泛应用于数字视频应用，例如广播数字电视、基于互联网和移动网络的视频传输、视频聊天和视频会议等实时会话应用、DVD和蓝光光盘、视频内容采集和编辑系统以及安全应用的可携式摄像机。

即使在视频较短的情况下也需要对大量的视频数据进行描述，当数据要在带宽容量受限的通信网络中发送或以其它方式传输时，这样可能会造成困难。因此，视频数据通常要先压缩然后在现代电信网络中发送。由于内存资源可能有限，当在存储设备中存储视频时，视频的尺寸也可能成为问题。视频压缩设备通常在源侧使用软件和/或硬件，以在传输或存储之前对视频数据进行编码，从而减少用来表示数字视频图像所需的数据量。然后，压缩数据在目的地侧由用于对视频数据进行解码的视频解压缩设备接收。在有限的网络资源以及对更高视频质量的需求不断增长的情况下，需要改进压缩和解压缩技术，这些改进的技术能够在几乎不影响图像质量的情况下提高压缩比。

发明内容

鉴于上述问题，本发明提供了一种缓解甚至消除上述问题的解决方案。

本申请实施例提供了独立权利要求所描述的编码和解码方法及装置。

实施例有利于使用基于历史的运动矢量预测对图像进行高效处理，例如并行处理。保护范围由权利要求书界定。

本发明实施例由独立权利要求的特征定义，并且实施例的其它有利实现方式由从属权利要求、说明书以及附图的特征定义。

具体实施例在所附独立权利要求中概述，其它实施例在从属权利要求中概述。

在本发明中，术语“分块组(tile group)”也可以拼写为“分块组(tilegroup)”。在本发明中这两个术语的含义是相同的。

本发明提供一种由解码设备实现的图像译码方法。该方法包括：对图像的分块中的当前译码树单元(Coding Tree Unit，CTU)行对应的基于历史的运动矢量预测(History-based Motion Vector Prediction，HMVP)列表进行初始化；根据所述初始化的HMVP列表处理当前CTU行中的CTU。

此处，通过将列表尺寸的尺寸设置为0来初始化该HMVP列表。这可以通过NumHmvpCand＝0将变量NumHmvpCand设置为0来完成。基本上，使用变量NumHmvpCand跟踪HMVP列表(HMVP list)中有效候选的数量，并且只有以范围0……NumHmvpCand内的索引为起始的HMVP候选还用于构建融合列表。其中，初始化是根据预定义的条件进行的。一个分块组可以包括一个或多个分块，一个分块包括一个或多个CTU。从左到右以分块为单位逐行完成对CTU的处理。一般的层次结构是：图像包含分块组，然后分块组包含分块。分块包含CTU，且从分块的左列边界开始到该分块的右列边界的每组CTU构成该分块内部的一个CTU行。

换言之，可以通过检查给定CTU的地址与列表中的CTU的地址是否相同，来识别分块中的每个CTU行中的第一个CTU，其中，该列表存储以CTB为单位的左分块列边界的地址，该地址间接表示分块中的每个CTU行中的第一个CTU。

根据前述方面，在所述方法的一种可能的实现方式中，所述对当前CTU行对应的HMVP列表进行初始化可以包括以下步骤：

重置当前CTU行对应的所述HMVP列表；和/或

为当前CTU行对应的所述HMVP列表设置默认值；和/或

基于编码和/或扫描顺序上的前一个CTU行中的CTU的HMVP列表对当前CTU行对应的所述HMVP列表进行初始化。

这里，可以在满足以下条件时对所述HMVP列表进行初始化：

CtbAddrX＝＝CtbToTileColBd[CtbAddrX]。

列表CtbToTileColBd[ctbAddrX]包括从水平CTB地址到以CTB为单位的左分块列边界的地址的转换，“ctbAddrX”的范围为“0至PicWidthInCtbsY”(包括端值)。因此，在水平CTB地址CtbAddrX与左分块列边界的地址相同时，可以满足以下等式：

CtbAddrX＝＝CtbToTileColBd[CtbAddrX]。

其中，该左分块列边界的地址基本上是分块中的每个CTU行中的第一个CTU。当满足上述条件时，NumHmvpCand设置为0(NumHmvpCand＝0)。这相当于重置或清空HMVP列表。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，编码和/或扫描顺序上的前一个CTU行是在所述编码和/或扫描顺序上与当前CTU行紧邻的前一个CTU行。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，所述在编码和/或扫描顺序上与当前CTU行紧邻的前一个CTU行是与所述当前CTU行空间相邻或直接相邻的CTU行。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，所述对当前CTU行对应的HMVP列表进行初始化的操作在分块组(tile group，TG)的起始处执行，在所述分块的起始处执行，或者在所述分块中每个CTU行的起始处执行。

这里，三种情况可以是一致的。可以在满足以下条件时对所述HMVP列表进行初始化：

CtbAddrX＝＝CtbToTileColBd[CtbAddrX]。

列表CtbToTileColBd[ctbAddrX]包括从水平CTB地址到以CTB为单位的左分块列边界的地址的转换，“ctbAddrX”的范围为“0至PicWidthInCtbsY”(包括端值)。因此，在水平CTB地址CtbAddrX与左分块列边界的地址相同时，可以满足以下条件：

CtbAddrX＝＝CtbToTileColBd[CtbAddrX]。

其中，该左分块列边界的地址基本上是分块中的每个CTU行中的第一个CTU。因为该HMVP列表在每行的起始处被重置，该列表固然也在每个分块和每个分块组的起始处被初始化，参见以上关于分块组或者分块以及CTU的处理的描述。然后，当满足条件NumHmvpCand＝0时，可以重置或清空该HMVP列表。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，所述对当前CTU行对应的HMVP列表进行初始化的操作，是在处理所述当前CTU行中编码和/或扫描顺序上的第一个CTU之前执行的，其中，所述当前CTU行中的第一个CTU为或者包括：

分块组(tile group，TG)中编码和/或扫描顺序上的第一个CTU；和/或

分块中编码和/或扫描顺序上的第一个CTU；和/或

CTU行中编码和/或扫描顺序上的第一个CTU。

这里，可以在满足以下条件时对所述HMVP列表进行初始化：CtbAddrX＝＝CtbToTileColBd[CtbAddrX])。

对于分块组或分块的起始处或者分块内每个CTU行的起始处，上述条件被验证为真(true)。需要说明的是，在分块组或分块的起始处，对CtbAddrX＝＝CtbToTileColBd[CtbAddrX]的验证也为真(true)。然后，当满足条件NumHmvpCand＝0时，可以重置或清空该HMVP列表。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，所述对当前CTU行对应的HMVP列表进行初始化包括：重置当前CTU行对应的所述HMVP列表，其中，所述重置当前CTU行对应的所述HMVP列表包括：

将所述HMVP列表的长度置零，以处理所述当前CTU行中编码或扫描顺序上的第一个CTU。

对于分块组或分块的起始处或者分块内每个CTU行的起始处，上述条件被验证为真(true)。然后，当满足条件NumHmvpCand＝0时，可以重置或清空该HMVP列表。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，所述对当前CTU行对应的HMVP列表进行初始化包括：重置当前CTU行对应的所述HMVP列表，其中，重置分块中第一个CTU对应的HMVP列表允许并行处理或译码分块。

根据前述方面，在所述方法的一种可能的实现方式中，所述对当前CTU行对应的HMVP列表进行初始化包括：重置当前CTU行对应的所述HMVP列表，其中，重置每个分块中第一个CTU对应的HMVP列表允许并行处理或译码分块。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，所述对当前CTU行对应的HMVP列表进行初始化的操作，是在处理各个CTU行中的第一个CTU之前针对分块中的每个CTU行执行的。

根据前述方面，在所述方法的一种可能的实现方式中，所述重置当前CTU行对应的所述HMVP列表还包括：

当使用运动矢量对第一个CTU的块进行编码，即进行帧间编码时，将所述HMVP列表的长度加1，并将所述运动矢量添加到所述HMVP列表中。

根据前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，仅在所述HMVP列表中未包含运动信息的情况下才增加所述HMVP列表的长度以及添加所述运动矢量。

根据前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，所述运动信息包括运动矢量和参考图像索引中的至少一种。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，仅对所述HMVP列表的长度进行增加操作，直到达到所述HMVP列表的最大长度。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，所述方法还包括：

仅根据所述HMVP列表的当前长度考虑减少的HMVP列表候选的数量对所述当前CTU的当前块进行编码，其中，所述HMVP列表的当前长度小于所述HMVP列表的最大长度。

根据前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，所述减少的HMVP列表候选的数量对应于或等于所述HMVP列表的当前长度。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，无论分块的尺寸如何，都针对所述分块中的每个CTU行重置HMVP列表。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，当分块的尺寸大于或等于阈值尺寸时，针对所述分块中的每个CTU行重置HMVP列表，和/或当分块的尺寸小于所述阈值尺寸时，不针对所述分块中的每个CTU行重置HMVP列表。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，所述为当前CTU行对应的所述HMVP列表设置默认值包括：

将所述HMVP列表中的运动矢量(motion vector，MV)填充为单向预测方式中的MV；

其中，所述单向预测方式中的MV为零运动矢量或非零运动矢量；

参考图像包括列表0(list 0，L0)中的第一参考图像；和/或

将所述HMVP列表中的MV填充为双向预测方式中的MV，其中，所述双向预测方式中的MV为零运动矢量或非零运动矢量，参考图像包括列表L0中的第一参考图像以及列表1(list 1，L1)中的第一参考图像。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，每个并置图像存储对应每个CTU行或对应整个图像的时域HMVP列表，所述为当前CTU行对应的所述HMVP列表设置默认值包括：

根据所述时域HMVP列表对当前CTU行对应的所述HMVP列表进行初始化。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，所述前一个CTU行是与所述当前CTU行紧邻且位于所述当前CTU行上方的CTU行；

所述前一个CTU行中的所述CTU为所述前一个CTU行中的第二个CTU，或者所述前一个CTU行中的所述CTU为所述前一个CTU行中的第一个CTU。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，CTU行中的CTU具有对应的地址，通过以下表达式确定分块中的CTU行中的第一个CTB来识别所述CTU行中的第一个CTU的地址：

FirstCtbInCtuRowInTile＝((ctbAddrInTs-FirstCtbAddrTs[tileIdx]–NumCtusInTile[tileIdx])％ColWidth[tileIdx]＝＝0)？1:0,

If((tile_group_type！＝I)&&(FirstCtbInCtuRowInTile))

HMVPCandNum＝0

其中，FirstCtbInCtuRowInTile表示分块中的CTU行中的第一个CTU，ctbAddrInTx表示分块中的CTB的地址，FirstCtbAddrTs表示分块中的CTB的第一地址，tileIdx表示各个分块的索引，NumCtusInTile表示分块中的CTU的数量，ColWidth表示所述分块相对于CTU数量的宽度，“％”是模运算符，tile_group_type表示分块组的类型。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，CTU行中的CTU具有对应的地址，通过以下表达式判断地址j相对于当前分块的模运算是否产生0来识别CTU行中的第一个CTU的地址：

if(j％ColWidth[tileIdx]＝＝0),

其中，J为当前CTU的地址，ColWidth[tileIdx]表示所述分块相对于CTU数量的宽度，tileIdx表示各个分块的索引，“％”是模运算符。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，CTU行中的CTU具有对应的地址，通过判断所述当前CTU的地址与列表或数组中的CTU的地址是否相同，来识别分块中的每个CTU行中的第一个CTU的地址，从而推导出分块中的每个CTU行中的第一个CTU，其中，所述列表或数组存储以CTB为单位的左分块列边界的地址。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，通过以下表达式判断所述当前CTU的地址与所述列表中的CTU的地址是否相同，其中，所述列表存储以CTB为单位的所述左分块列边界的地址：

if(CtbAddrX＝＝CtbToTileColBd[CtbAddrX]),

其中，列表或数组CtbToTileColBd[ctbAddrX]包括从水平CTB地址到以CTB为单位的左分块列边界的地址的转换，“ctbAddrX”的范围为“0至PicWidthInCtbsY”(包括端值)，其中，ctbAddrX表示水平CTB的索引。

另一方面，提供一种由编码设备实现的图像编码方法，包括：

对图像的分块中的当前译码树单元(Coding Tree Unit，CTU)行对应的基于历史的运动矢量预测(History-based Motion Vector Prediction，HMVP)列表进行初始化；

根据所述初始化的HMVP列表处理当前CTU行中的CTU。

根据前述方面，在所述方法的一种可能的实现方式中，所述对当前CTU行对应的HMVP列表进行初始化包括以下步骤：

重置当前CTU行对应的所述HMVP列表；和/或

为当前CTU行对应的所述HMVP列表设置默认值；和/或

基于编码和/或扫描顺序上的前一个CTU行中的CTU的HMVP列表，对当前CTU行对应的所述HMVP列表进行初始化。

根据前述方面，在所述方法的一种可能的实现方式中，编码和/或扫描顺序上的前一个CTU行是在所述编码和/或扫描顺序上与当前CTU行紧邻的前一个CTU行。

根据前述方面，在所述方法的一种可能的实现方式中，所述在编码和/或扫描顺序上与当前CTU行紧邻的前一个CTU行是与所述当前CTU行空间相邻或直接相邻的CTU行。

分块中编码和/或扫描顺序上的第一个CTU；和/或

CTU行中编码和/或扫描顺序上的第一个CTU。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，所述对当前CTU行对应的HMVP列表进行初始化包括：重置当前CTU行对应的所述HMVP列表，其中，重置分块中第一个CTU对应的HMVP列表允许并行处理或编码分块。

根据前述方面，在所述方法的一种可能的实现方式中，所述对当前CTU行对应的HMVP列表进行初始化包括：重置当前CTU行对应的所述HMVP列表，其中，重置每个分块中第一个CTU对应的HMVP列表允许并行处理或编码分块。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，所述对当前CTU行对应的HMVP列表进行初始化的操作是在处理各个CTU行中的第一个CTU之前针对分块中的每个CTU行执行的。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，所述重置当前CTU行对应的所述HMVP列表还包括：

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，仅在所述HMVP列表中未包含运动信息的情况下，才增加所述HMVP列表的长度以及添加所述运动矢量。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，所述运动信息包括运动矢量和参考图像索引中的至少一种。

仅根据所述HMVP列表的当前长度考虑减少的HMVP列表候选的数量，对所述当前CTU的当前块进行编码，其中，所述HMVP列表的当前长度小于所述HMVP列表的最大长度。

根据前述方面或前述方面的任一前述实现方式，在所述方法的一种可能的实现方式中，所述减少的HMVP列表候选的数量对应于或等于所述HMVP列表的当前长度。

参考图像包括列表0(list 0，L0)中的第一参考图像；和/或

if(j％ColWidth[tileIdx]＝＝0),

if(CtbAddrX＝＝CtbToTileColBd[CtbAddrX]),

另一方面，提供一种解码器，所述解码器包括处理电路，用于执行根据前述方面或前述方面的任一前述实现方式的方法。

另一方面，提供一种编码器，所述编码器包括处理电路，用于执行根据前述方面或前述方面的任一前述实现方式的方法。

另一方面，提供一种计算机程序产品，所述计算机程序产品包括程序代码，用于执行根据前述方面或前述方面的任一前述实现方式的方法。

另一方面，提供一种计算机可读非瞬时性介质，所述计算机可读非瞬时性介质存储程序，所述程序包括指令。当所述指令在处理器上执行时，所述处理器执行根据前述方面或前述方面的任一前述实现方式的方法。

另一方面，提供一种解码器，包括：

一个或多个处理器；

非瞬时性计算机可读存储介质，耦合至所述处理器，并存储由所述处理器执行的程序，其中，当所述处理器执行所述程序时，所述程序配置所述解码器以执行根据前述方面或前述方面的任一前述实现方式的方法。

另一方面，提供一种编码器，包括：

一个或多个处理器；

非瞬时性计算机可读存储介质，耦合至所述处理器，并存储由所述处理器执行的程序，其中，当所述处理器执行所述程序时，所述程序配置所述编码器以执行根据前述方面或前述方面的任一前述实现方式的方法。

附图和以下描述对一个或多个实施例的细节进行了阐述。其它特征、目的和优点在说明书、附图以及权利要求中是显而易见的。

附图说明

下面结合本发明实施例中的附图对本发明实施例进行详细描述。在附图中：

图1A为用于实现本发明实施例的视频译码系统示例的框图；

图1B为用于实现本发明实施例的视频译码系统另一示例的框图；

图2为用于实现本发明实施例的视频编码器示例的框图；

图3为用于实现本发明实施例的视频解码器示例的框图；

图4为编码装置或解码装置示例的框图；

图5为编码装置或解码装置另一示例的框图；

图6示出了包括或被划分为12个分块的图像的示例，其中，所述12个分块划分为3个分块组；

图7示出了针对图6示例的分块组、分块以及分块内部的CTU行的重置；

图8示出了针对分块组、分块以及分块内部的CTU行的HMVP列表重置的示例语法说明；

图9示出了针对分块组、分块以及分块内部的CTU行的HMVP列表重置；

图10示出了用于融合候选列表构建和AMVP候选列表构建的空间相邻块的位置的示例；

图11为使用HMVP进行示例编码的流程图；

图12示出了更新HMVP表的示例；

图13示出了波前并行处理(Wavefront Parallel Processing，WPP)的示例；

图14示出了针对分块组、分块以及分块内部的CTU行的HMVP列表重置的另一种示例语法说明。

在下文中，除非另外明确说明，否则相同的附图标记是指相同或至少功能上等效的特征。

具体实施方式

以下描述中，参考组成本发明一部分并以说明的方式示出本发明实施例的具体方面或可使用本发明实施例的具体方面的附图。应理解，本发明实施例可在其它方面中使用，并可包括附图中未描述的结构变化或逻辑变化。因此，以下详细描述不应以限制性的意义来理解，本发明的范围由所附权利要求书界定。

例如，应理解，结合所描述方法的公开内容对用于执行所述方法的对应设备或系统也可以同样适用，反之亦然。例如，如果描述一个或多个具体方法步骤，则对应的设备可以包括一个或多个单元(例如，功能单元)来执行所描述的一个或多个方法步骤(例如，一个单元执行一个或多个步骤，或多个单元中的每个单元都执行多个步骤中的一个或多个)，即使附图中未明确描述或说明该一个或多个单元。另一方面，例如，如果基于一个或多个单元(例如，功能单元)描述具体装置，则对应的方法可以包括一个步骤来实现一个或多个单元的功能(例如，一个步骤实现一个或多个单元的功能，或多个步骤中的每个步骤实现多个单元中一个或多个单元的功能)，即使附图中未明确描述或说明该一个或多个步骤。此外，应理解，除非另有说明，否则本文描述的各种示例性实施例和/或方面的特征可彼此组合。

视频译码通常指对视频或视频序列的图像序列的处理。在视频译码领域中，术语“帧(frame)”或“图像(picture/image)”可以用作同义词。视频译码(或通常称为译码)包括视频编码和视频解码两部分。视频编码在源侧执行，通常包括处理(例如，压缩)原始视频图像以减少表示视频图像所需的数据量(从而更高效存储和/或发送)。视频解码在目的端执行，通常包括相对于编码器作逆处理，以重建视频图像。实施例涉及的视频图像(或通常称为图像)的“编码”应理解为视频图像或相应视频序列的“编码”或“解码”。编码部分和解码部分也合称为编解码(编码和解码，CODEC)。

在无损视频译码情况下，可以重建原始视频图像，即重建的视频图像与原始视频图像具有相同的质量(假设存储或传输期间没有传输损耗或其它数据丢失)。在有损视频译码情况下，通过量化等进行进一步压缩来减少表示视频图像所需的数据量，而解码器处无法完全重建视频图像，即重建的视频图像的质量比原始视频图像的质量更低或更差。

几个视频译码标准属于“有损混合视频编解码器”组(即，将像素点域中的空间预测和时域预测与变换域中用于应用量化的2D变换译码结合)。视频序列中的每个图像通常分割成非重叠的块集合，通常基于块级进行译码。换句话说，在编码器处，通常在块(视频块)级对视频进行处理(即编码)，例如，通过空间(图像内)预测和时域(图像间)预测来生成预测块；从当前块(当前处理/待处理的块)中减去预测块，获得残差块；在变换域中变换残差块并量化残差块，以减少待传输(压缩)的数据量，而在解码器处，将相对于编码器的逆处理应用于经编码或压缩的块，以重建当前块以进行表示。此外，编码器复制解码器的处理循环，使得两者生成相同的预测(例如，帧内预测和帧间预测)和/或重建，用于对后续块进行处理(即译码)。

在以下视频译码系统10的实施例中，视频编码器20和视频解码器30根据图1至图3进行描述。

图1A为示意性框图，示出了示例性译码系统10，例如可以利用本申请技术的视频译码系统10(或简称为译码系统10)。视频译码系统10的视频编码器20(或简称为编码器20)和视频解码器30(或简称为解码器30)代表可用于根据本申请中描述的各种示例执行各技术的设备示例。

如图1A所示，译码系统10包括源设备12，源设备12用于将编码图像数据13等编码图像数据21提供给用于对编码数据13进行解码的目的地设备14。

源设备12包括编码器20，另外即可选地，可包括图像源16、图像预处理器18等预处理器(或预处理单元)18、通信接口或通信单元22。

图像源16可以包括或可以是任何类型的图像采集设备，例如用于采集真实世界图像的摄像机，和/或任何类型的图像生成设备，例如用于生成计算机动画图像的计算机图形处理器，或用于获取和/或提供真实世界图像、计算机生成图像(例如，屏幕内容、虚拟现实(virtual reality，VR)图像)和/或其任何组合(例如，增强现实(augmented reality，AR)图像)的任何类型的其它设备。所述图像源可以为存储任一上述图像的任何类型的存储器(memory/storage)。

区别于预处理器18和预处理单元18执行的处理，图像或图像数据17也可以称为原始图像或原始图像数据17。

预处理器18用于接收(原始)图像数据17，对图像数据17进行预处理，以获得经预处理的图像19或经预处理的图像数据19。预处理器18执行的预处理可包括修剪、颜色格式转换(例如从RGB转换为YCbCr)、颜色校正或去噪等。可以理解的是，预处理单元18可以是可选组件。

视频编码器20用于接收预处理后的图像数据19并提供经编码的图像数据21(下面将根据图2等进一步描述)。源设备12中的通信接口22可用于：接收经编码的图像数据21并通过通信信道13向目的地设备14等另一设备或任何其它设备发送经编码的图像数据21(或其它任意处理后的版本)，以便存储或直接重建。

目的地设备14包括解码器30(例如视频解码器30)，另外即可选地，可包括通信接口或通信单元28、后处理器32(或后处理单元32)和显示设备34。

目的地设备14中的通信接口28用于直接从源设备12或从存储设备等任意其它源设备接收经编码的图像数据21(或其它任意处理后的版本)，例如，存储设备为编码图像数据存储设备，并将经编码的图像数据21提供给解码器30。

通信接口22和通信接口28可以用于经由源设备12与目的地设备14之间的直接通信链路(例如，直接有线或无线连接)，或经由任何类型的网络(例如，有线或无线网络或其任意组合，或任何类型的专用和公共网络)，或其任意组合发送或接收经编码的图像数据21或编码数据13。

例如，通信接口22可用于将经编码的图像数据21封装为报文等合适的格式，和/或使用任意类型的传输编码或处理来处理所述经编码的图像数据，以便在通信链路或通信网络上进行传输。

例如，与通信接口22对应的通信接口28可用于接收传输数据，并采用任何类型的对应传输解码或处理和/或解封装对传输数据进行处理，以获得经编码的图像数据21。

通信接口22和通信接口28均可配置为如图1A中从源设备12指向目的地设备14的对应通信信道13的箭头所指示的单向通信接口，或配置为双向通信接口，并且可用于发送和接收消息等，以建立连接，确认并交换与通信链路和/或例如经编码的图像数据传输等数据传输相关的任何其它信息，等等。

解码器30用于接收经编码的图像数据21并提供经解码的图像数据31或经解码的图像31(下面将根据图3或图5等进一步描述)。

目的地设备14的后处理器32用于对经解码的图像数据31(也称为经重建的图像数据)(例如，解码图像31)进行后处理，以获得经后处理的图像数据33(例如，后处理图像33)。后处理单元32执行的后处理可以包括例如颜色格式转换(例如从YCbCr转换为RGB)、调色、修剪或重采样，或者用于产生供显示设备34等显示的经解码的图像数据31等任何其它处理。

目的地设备14的显示设备34用于接收经后处理的图像数据33，以向用户或观看者等显示图像。显示设备34可以为或包括任意类型的用于表示重建后图像的显示器，例如，集成或外部显示屏或显示器。例如，显示器可以包括液晶显示器(liquid crystal display，LCD)、有机发光二极管(organic light emitting diode，OLED)显示器、等离子显示器、投影仪、微型LED显示器、硅基液晶显示器(liquid crystal on silicon，LCoS)、数字光处理器(digital light processor，DLP)或任何类型的其它显示器。

尽管图1A将源设备12和目的地设备14作为单独的设备进行描述，但是设备实施例还可以包括两种设备或两种功能，即源设备12或对应功能以及目的地设备14或对应功能。在这类实施例中，源设备12或对应功能以及目的地设备14或对应功能可以使用相同的硬件和/或软件或通过单独的硬件和/或软件或其任意组合来实现。

根据描述，图1A所示的源设备12和/或目的地设备14中的不同单元或功能的存在和(准确)划分可能根据实际设备和应用而有所不同，这对技术人员来说是显而易见的。

编码器20(例如视频编码器20)或解码器30(例如视频解码器30)，或编码器20和解码器30两者都可经由如图1B所示的处理电路实现，如一个或多个微处理器、数字信号处理器(digital signal processor，DSP)、专用集成电路(application-specific integratedcircuit，ASIC)、现场可编程门阵列(field-programmable gate array，FPGA)、离散逻辑、硬件、视频译码专用处理器或其任意组合。编码器20可以通过处理电路46实现，以包含参照图2编码器20论述的各种模块和/或本文描述的任何其它编码器系统或子系统。解码器30可以通过处理电路46实现，以包含参照图3解码器30论述的各种模块和/或本文描述的任何其它解码器系统或子系统。所述处理电路可用于执行下文描述的各种操作。如图5所示，如果部分技术在软件中实施，则设备可以将软件的指令存储在合适的非瞬时性计算机可读存储介质中，并且使用一个或多个处理器在硬件中执行指令，从而执行本发明技术。视频编码器20和视频解码器30中的任一个可作为组合编解码器(encoder/decoder，CODEC)的一部分集成在单个设备中，如图1B所示。

源设备12和目的地设备14可以包括多种设备中的任一种，包括任何类型的手持或固定设备，例如，笔记本电脑或膝上型电脑、手机、智能手机、平板电脑(tablet/tabletcomputer)、摄像机、台式计算机、机顶盒、电视机、显示设备、数字媒体播放器、视频游戏机、视频流设备(如内容服务服务器或内容分发服务器)、广播接收器设备、广播发射器设备等，并且可以不使用或使用任何类型的操作系统。在一些情况下，源设备12和目的地设备14可配备用于无线通信的组件。因此，源设备12和目的地设备14可以是无线通信设备。

在某些情况下，图1A所示的视频译码系统10仅仅是示例，本申请的技术可适用于在编码设备与解码设备之间不一定包括任何数据通信的视频译码设置(例如，视频编码或视频解码)。在其它示例中，数据从本地存储器中检索，通过网络发送，等等。视频编码设备可以对数据进行编码并将数据存储到存储器中，和/或视频解码设备可以从存储器中检索数据并对数据进行解码。在一些示例中，编码和解码由相互不通信而只是将数据编码到存储器和/或从存储器中检索数据并对数据进行解码的设备来执行。

为便于描述，参考通用视频编码(Versatile video coding，VVC)参考软件或由ITU-T视频编码专家组(Video Coding Experts Group，VCEG)和ISO/IEC运动图像专家组(Motion Picture Experts Group，MPEG)的视频编码联合工作组(Joint CollaborationTeam on Video Coding，JCT-VC)开发的高性能视频编码(High-Efficiency VideoCoding，HEVC)描述本发明实施例。本领域普通技术人员应理解本发明实施例不限于HEVC或VVC。

编码器和编码方法

图2为用于实现本申请技术的示例性视频编码器20的示意性框图。在图2的示例中，视频编码器20包括输入端201(或输入接口201)、残差计算单元204、变换处理单元206、量化单元208、反量化单元210、逆变换处理单元212、重建单元214、环路滤波单元220、解码图像缓冲器(decoded picture buffer，DPB)230、模式选择单元260、熵编码单元270和输出端272(或输出接口272)。模式选择单元260可以包括帧间预测单元244、帧内预测单元254和分割单元262。帧间预测单元244可以包括运动估计单元和运动补偿单元(未示出)。图2所示的视频编码器20也可以称为混合视频编码器或根据混合视频编解码器的视频编码器。

残差计算单元204、变换处理单元206、量化单元208、模式选择单元260可以称为组成编码器20的正向信号路径，而反量化单元210、逆变换处理单元212、重建单元214、缓冲器216、环路滤波器220、解码图像缓冲器(decoded picture buffer，DPB)230、帧间预测单元244和帧内预测单元254可以称为组成视频编码器20的反向信号路径。视频编码器20的反向信号路径与解码器(参见图3中的视频解码器30)的信号路径对应。反量化单元210、逆变换处理单元212、重建单元214、环路滤波器220、解码图像缓冲器(decoded picture buffer，DPB)230、帧间预测单元244和帧内预测单元254还组成视频编码器20的“内置解码器”。

图像和图像分割(图像和块)

编码器20可用于经由输入端201等接收图像17(或图像数据17)，例如，形成视频或视频序列的图像序列中的图像。接收的图像或图像数据也可以是经预处理的图像19(或经预处理的图像数据19)。为简单起见，以下描述使用图像17。图像17也可称为当前图像或待编码的图像(尤其是在视频译码中将当前图像与其它图像区分开时，其它图像例如同一视频序列，即也包括当前图像的视频序列，中的之前经编码图像和/或经解码图像)。

(数字)图像为或可以看作具有强度值的像素点的二维阵列或矩阵。阵列中的像素点也可以称为像素(pixel或pel)(图像元素的简称)。图像的尺寸和/或分辨率由阵列或图像在水平和垂直方向(或轴)上的像素点数量定义。为了表示颜色，通常使用三种颜色分量，即该图像可表示为三个像素点阵列或包括三个像素点阵列。在RGB格式或颜色空间中，图像包括对应的红色、绿色和蓝色像素点阵列。然而，在视频译码中，每个像素通常由亮度和色度格式或在颜色空间中表示，例如，YCbCr，包括Y表示的亮度分量(有时也用L指示)和Cb和Cr表示的两个色度分量。亮度(或简称luma)分量Y表示亮度或灰度级强度(例如，在灰度图像中)，而两个色度(或简称chroma)分量Cb和Cr表示色度或颜色信息分量。因此，YCbCr格式的图像包括亮度像素点值(Y)的亮度像素点阵列和色度值(Cb和Cr)的两个色度像素点阵列。RGB格式的图像可以转换或变换为YCbCr格式，反之亦然，该过程也称为颜色变换或转换。如果图像是单色的，则该图像可以仅包括亮度像素点阵列。相应地，例如，图像可以为单色格式的亮度像素点阵列或4:2:0、4:2:2和4:4:4彩色格式的亮度像素点阵列和两个对应的色度像素点阵列。

在一个实施例中，视频编码器20的实施例可包括图像分割单元(图2中未示出)，用于将图像17分割成多个(通常不重叠)图像块203。这些块也可以称为根块、宏块(H.264/AVC)或译码树块(coding tree block，CTB)，或译码树单元(coding tree unit，CTU)(H.265/HEVC和VVC)。分割单元可用于对视频序列中的所有图像使用相同的块尺寸和使用限定块尺寸的对应网格，或在图像或图像子集或图像组之间改变块尺寸，并将每个图像分割成对应块。

在其它实施例中，视频编码器可用于直接接收图像17的块203，例如，组成图像17的一个、几个或所有块。图像块203也可以称为当前图像块或待译码图像块。

与图像17一样，图像块203同样是或可认为是具有强度值(像素点值)的像素点组成的二维阵列或矩阵，但是图像块203的比图像17的小。换句话说，块203可包括一个像素点阵列(例如，单色图像17情况下的亮度阵列或彩色图像情况下的亮度阵列或色差阵列)或三个像素点阵列(例如，彩色图像17情况下的一个亮度阵列和两个色差阵列)或根据所采用的颜色格式的任何其它数量和/或类型的阵列。块203的水平方向和垂直方向(或轴线)上的像素点数量限定了块203的尺寸。因此，块可以为M×N(M列×N行)个像素点阵列，或M×N个变换系数阵列等。

图2所示的视频编码器20的实施例可以用于逐块对图像17进行编码，例如，按块203进行编码和预测。

残差计算

残差计算单元204可用于通过如下方式基于图像块203和预测块265(下文将详细描述预测块265)来计算残差块205(也称为残差205)：逐个像素点(逐个像素)从图像块203的像素点值中减去预测块265的像素点值，以获得像素点域中的残差块205。

变换

变换处理单元206可用于对残差块205的像素点值应用离散余弦变换(discretecosine transform，DCT)或离散正弦变换(discrete sine transform，DST)等变换，以获得变换域中的变换系数207。变换系数207也可以称为变换残差系数，表示变换域中的残差块205。

变换处理单元206可用于应用DCT/DST的整数化近似，例如为H.265/HEVC指定的变换。与正交DCT变换相比，该整数近似法通常通过某一因子按比例缩放。为了维持经过正变换和逆变换处理的残差块的范数，使用其它比例缩放因子作为变换过程的一部分。缩放因子通常是基于某些约束条件来选择的，例如缩放因子是用于移位运算的2的幂、变换系数的位深度、准确性与实施成本之间的权衡等。例如，通过逆变换处理单元212等为逆变换(以及在视频解码器30处通过逆变换处理单元312等为对应逆变换)指定具体的缩放因子，以及相应地，可以在编码器20处通过变换处理单元206等为正变换指定对应的缩放因子。

视频编码器20(具体是变换处理单元206)的实施例可以用于直接或通过熵编码单元270编码或压缩等输出变换参数(例如，一种或多种变换的类型)，使得例如视频解码器30可以接收并使用变换参数进行解码。

量化

量化单元208可以用于通过应用标量量化或矢量量化等对变换系数207进行量化，以获得量化系数209。量化系数209也可以称为经量化的变换系数209或经量化的残差系数209。

量化过程可以降低与一些或全部变换系数207相关联的位深度。例如，可以在量化期间将n位变换系数向下舍入到m位变换系数，其中n大于m。可以通过调整量化参数(quantization parameter，QP)修改量化程度。例如，对于标量量化，可以应用不同程度的缩放来实现较细或较粗的量化。较小量化步长对应较细量化，而较大量化步长对应较粗量化。可以通过量化参数(quantization parameter，QP)表示合适的量化步长。例如，量化参数可以为合适的量化步长的预定义集合的索引。例如，较小的量化参数可对应精细量化(较小量化步长)，较大的量化参数可对应粗糙量化(较大量化步长)，反之亦然。量化可以包括除以量化步长，而反量化单元210等执行的对应和/或反量化可包括乘以量化步长。根据HEVC等一些标准的实施例可用于使用量化参数来确定量化步长。一般而言，可以根据量化参数使用包含除法的等式的定点近似来计算量化步长。量化和解量化可以引入附加缩放因子以恢复残差块的范数，由于在量化步长和量化参数的方程的定点近似中使用了缩放，可能会修改残差块的范数。在一种示例性实现方式中，可以合并逆变换和解量化的比例。或者，可以使用自定义量化表并从编码器向解码器指示(signal)自定义量化表，例如在码流中指示。量化是有损操作，其中量化步长越大，损耗越大。

在一个实施例中，视频编码器20(对应地，量化单元208)可用于输出量化参数(quantization parameter，QP)，例如，直接输出或由熵编码单元270进行编码或压缩后输出，例如使得视频解码器30可接收并使用量化参数进行解码。

反量化

反量化单元210用于对量化系数执行量化单元208的反量化，得到解量化系数211，例如，根据或使用与量化单元208相同的量化步长执行与量化单元208所执行的量化方案的反量化方案。解量化系数211也可称为解量化残差系数211，对应于变换系数207，但是由于量化造成损耗，反量化系数211通常与变换系数不完全相同。

逆变换

逆变换处理单元212用于应用变换处理单元206应用的变换的逆变换，例如，逆离散余弦变换(discrete cosine transform，DCT)或逆离散正弦变换(discrete sinetransform，DST)，以获得像素点域中的重建残差块213(或对应的解量化系数213)。重建残差块213也可称为变换块213。

重建

重建单元214(例如，求和器214)用于将变换块213(即重建残差块213)添加到预测块265，以在像素点域中得到重建块215，例如，将重建残差块213的像素点值和预测块265的像素点值相加。

滤波

环路滤波单元220(或简称“环路滤波器”220)用于对重建块215进行滤波以获得滤波块221，或通常用于对重建像素点进行滤波以获得滤波像素点。例如，环路滤波单元用于平滑像素转变或提高视频质量。环路滤波单元220可以包括一个或多个环路滤波器，如去块效应滤波器、像素点自适应偏移(sample-adaptive offset，SAO)滤波器或一个或多个其它滤波器，例如双边滤波器、自适应环路滤波器(adaptive loop filter，ALF)、锐化、平滑滤波器或协作滤波器或其任意组合。尽管环路滤波器单元220在图2中示为环路滤波器，但在其它配置中，环路滤波器单元220可以实现为环后滤波器。滤波块221也可称为滤波重建块221。

视频编码器20(具体是环路滤波单元220)的实施例可用于直接或经由熵编码单元270编码等输出环路滤波器参数(如像素点自适应偏移信息)，使得例如解码器30可以接收和应用相同环路滤波器参数或相应的环路滤波器进行解码。

解码图像缓冲器

解码图像缓冲器(decoded picture buffer，DPB)230可以是存储参考图像数据以供视频编码器20在编码视频数据时使用的参考图像存储器。DPB 230可以由多种存储器设备中的任一种形成，例如动态随机存取存储器(dynamic random access memory，DRAM)，包括同步DRAM(synchronous DRAM，SDRAM)、磁阻RAM(magnetoresistive RAM，MRAM)、电阻RAM(resistive RAM，RRAM)或其它类型的存储设备。解码图像缓冲器(decoded picturebuffer，DPB)230可用于存储一个或多个滤波块221。解码图像缓冲器230还可用于存储同一当前图像或例如之前的重建图像等不同图像的其它之前的滤波块，例如之前重建和滤波的块221，并可提供完整的之前重建即解码图像(和对应参考块和像素点)和/或部分重建的当前图像(和对应参考块和像素点)，例如用于帧间预测。解码图像缓冲器230还可用于存储一个或多个未经滤波的重建块215，或一般存储未经滤波的重建像素点，例如，未被环路滤波单元220滤波的重建块215，或未进行任何其它处理的重建块或重建像素点。

模式选择(分割和预测)

模式选择单元260包括分割单元262、帧间预测单元244和帧内预测单元254，用于从解码图像缓冲器230或其它缓冲器(例如，列缓冲器，图中未显示)接收或获得原始块203(当前图像17的当前块203)和重建图像数据等原始图像数据，例如，同一(当前)图像和/或一个或多个之前解码图像的滤波和/或未经滤波的重建像素点或重建块。重建图像数据用作帧间预测或帧内预测等预测所需的参考图像数据，以得到预测块265或预测值265。

模式选择单元260可用于为当前块预测模式(包括不分割)和预测模式(例如帧内或帧间预测模式)确定或选择分割类型，并生成对应的预测块265，以对残差块205进行计算和对重建块215进行重建。

在一个实施例中，模式选择单元260可用于选择分割和预测模式(例如，从模式选择单元260支持的或可用的预测模式中)，所述预测模式提供最佳匹配或者说最小残差(最小残差是指传输或存储中更好的压缩)，或者提供最小信令开销(最小信令开销是指传输或存储中更好的压缩)，或者同时考虑或平衡以上两者。模式选择单元260可用于根据率失真优化(rate distortion optimization，RDO)确定分割和预测模式，即选择提供最小率失真的预测模式。本上下文中如“最佳”、“最小”、“最优”等术语不一定指总体上“最佳”、“最小”、“最优”等，也可以指满足终止或选择标准，例如，值超过或低于阈值或其它约束条件，可能会进行“次优选择”，但是降低了复杂度和处理时间。

换句话说，分割单元262可以用于将块203分割成更小的分割块或子块(再次形成块)，例如，使用四叉树(quad-tree，QT)分割、二叉树(binary-tree，BT)分割或三叉树(triple-tree，TT)分割或其任何组合迭代地进行，并例如，对每个分割块或子块进行预测，其中，所述模式选择包括选择分割块203的树形结构并将预测模式应用于每个分割块或子块。

下文将详细地描述由视频编码器20执行的分割(例如，由分割单元260执行)和预测处理(例如，由帧间预测单元244和帧内预测单元254执行)。

分割

分割单元262可以将当前块203分割(或划分)为较小的部分，例如正方形或矩形的小块。这些较小块(也可称为子块)可进一步分割为更小的部分。这也称为树分割或分层树分割，其中在根树级别0(层次级别0、深度0)等的根块可以递归地分割为两个或两个以上下一个较低树级别的块，例如树级别1(层次级别1、深度1)的节点。这些块可以又分割为两个或两个以上下一个较低级别的块，例如树级别2(层次级别2、深度2)等，直到分割结束(因为满足结束标准，例如达到最大树深度或最小块尺寸)。未进一步分割的块也称为树的叶块或叶节点。分割为两个部分的树称为二叉树(binary-tree，BT)，分割为三个部分的树称为三叉树(ternary-tree，TT)，分割为四个部分的树称为四叉树(quad-tree，QT)。

如前所述，如本文使用的术语“块”可以是图像的一部分，特别是正方形或矩形部分。例如，结合HEVC和VVC，块可以是或对应于译码树单元(coding tree unit，CTU)、编码单元(coding unit，CU)、预测单元(prediction unit，PU)和变换单元(transform unit，TU)，和/或对应于对应块，例如，译码树块(coding tree block，CTB)、译码块(coding block，CB)、变换块(transform block，TB)或预测块(prediction block，PB)。

例如，译码树单元(CTU)可以为或包括亮度像素点的CTB、具有三个像素点阵列的图像的色差像素点的两个对应CTB、或单色图像的像素点的CTB或使用三个独立颜色平面和语法结构(用于编码像素点)编码的图像的像素点的CTB。相应地，译码树块(CTB)可以为N×N个像素点块，其中N可以设为某个值使得分量划分为CTB，这就是分割。编码单元(codingunit，CU)可以为或包括亮度像素点的译码块、具有三个像素点阵列的图像的色差像素点的两个对应译码块、或单色图像的像素点的译码块或使用三个独立颜色平面和语法结构(用于编码像素点)编码的图像的像素点的译码块。相应地，译码块(CB)可以为M×N个像素点块，其中M和N可以设为某个值使得CTB划分为译码块，这就是分割。

在实施例中，例如根据HEVC，可以通过表示为译码树的四叉树结构将译码树单元(coding tree unit，CTU)划分为多个CU。在CU级决定是使用帧间(时域)预测还是帧内(空间)预测对图像区域进行译码。可以根据PU划分类型将每个CU进一步划分为一个、两个或四个PU。一个PU内使用相同的预测过程，并以PU为单位向解码器发送相关信息。在根据PU划分类型应用预测过程获得残差块之后，可以根据与用于CU的译码树类似的另一种四叉树结构将CU分割为变换单元(transform unit，TU)。

在实施例中，例如根据当前研发的称为通用视频译码(Versatile Video Coding，VVC)的最新视频译码标准，使用四叉树和二叉树(quad-tree and binary tree，QTBT)分割来分割译码块。在QTBT块结构中，CU可以为正方形或矩形。例如，首先通过四叉树结构分割译码树单元(coding tree unit，CTU)。通过二叉树或三叉树(或三叉树)结构进一步分割四叉树叶节点。分割树叶节点称为编码单元(coding unit，CU)，这样的分段用于预测和变换处理，无需其它任何分割。这意味着在QTBT译码块结构中，CU、PU和TU的块尺寸相同。同时，还提出将三叉树分割等多重分割与QTBT块结构结合使用。

在一个示例中，视频编码器20的模式选择单元260可以用于执行本文描述的分割技术的任意组合。

如上所述，视频编码器20用于从(预定的)预测模式集合中确定或选择最好或最优的预测模式。预测模式集合可以包括帧内预测模式和/或帧间预测模式等。

帧内预测

帧内预测模式集合可包括35种不同的帧内预测模式，例如，像DC(或均值)模式和平面模式的非方向性模式，或如HEVC定义的方向性模式，或者可包括67种不同的帧内预测模式，例如，像DC(或均值)模式和平面模式的非方向性模式，或如VVC中定义的方向性模式。

帧内预测单元254用于根据帧内预测模式集合中的帧内预测模式，使用同一当前图像的邻块的重建像素点来生成帧内预测块265。

帧内预测单元254(或通常为模式选择单元260)还用于将帧内预测参数(或通常为表示块的所选帧内预测模式的信息)以语法元素266的形式输出到熵编码单元270，以包括到经编码的图像数据21中，从而视频解码器30可执行操作，例如接收并使用用于解码的预测参数。

帧间预测

在可能的实现中，帧间预测模式集合取决于可用参考图像(即，例如前述存储在DBP230中的至少部分之前解码的图像)和其它帧间预测参数，例如取决于是否使用整个参考图像或只使用参考图像的一部分，例如当前块的区域附近的搜索窗口区域，来搜索最佳匹配参考块，和/或例如取决于是否执行像素内插，例如半像素和/或四分之一像素内插。

除上述预测模式外，还可以采用跳过模式和/或直接模式。

帧间预测单元244可包括运动估计(motion estimation，ME)单元和运动补偿(motion compensation，MC)单元(两者在图2中未示出)。运动估计单元可用于接收或获取图像块203(当前图像17的当前图像块203)和解码图像231，或至少一个或多个先前重建块，例如，一个或多个其他/不同先前解码图像231的重建块，以进行运动估计。例如，视频序列可包括当前图像和之前的解码图像231，或换句话说，当前图像和之前的解码图像231可以为形成视频序列的图像序列的一部分或形成该图像序列。

例如，编码器20可用于从多个其他图像中的相同或不同图像的多个参考块中选择参考块，并将参考图像(或参考图像索引)和/或参考块的位置(x坐标、y坐标)与当前块的位置之间的偏移(空间偏移)作为帧间预测参数提供给运动估计单元。该偏移也称为运动矢量(motion vector，MV)。

运动补偿单元用于获取，例如接收，帧间预测参数，并根据或使用该帧间预测参数执行帧间预测，得到帧间预测块265。由运动补偿单元执行的运动补偿可能包含根据通过运动估计确定的运动/块矢量来提取或生成预测块，还可能包括对子像素精度执行内插。内插滤波可从已知像素的像素点中产生其它像素的像素点，从而潜在地增加可用于对图像块进行编码的候选预测块的数量。一旦接收到当前图像块的PU对应的运动矢量时，运动补偿单元可在其中一个参考图像列表中定位运动矢量指向的预测块。

运动补偿单元还可以生成与块和视频条带相关的语法元素，以供视频解码器30在解码视频条带的图像块时使用。可以使用分块和分块组以及相应语法作为视频条带和相应语法元素的补充或替代。

熵译码

例如，熵编码单元270用于对量化系数209、帧间预测参数、帧内预测参数、环路滤波器参数和/或其它语法元素应用熵编码算法或方案(例如，可变长度译码(variablelength coding，VLC)方案、上下文自适应VLC(context adaptive VLC，CAVLC)方案、算术编码方案、二值化、上下文自适应二进制算术编码(context adaptive binary arithmeticcoding，CABAC)、基于语法的上下文自适应二进制算术编码(syntax-based context-adaptive binary arithmetic coding，SBAC)、概率区间分割熵(probability intervalpartitioning entropy，PIPE)译码或其它熵编码方法或技术)或旁路熵编码算法或方案(不压缩)，以获得可以经由输出端272以经编码码流21等形式输出的经编码的图像数据21，使得例如视频解码器30可以接收并使用参数进行解码。可以将经编码码流21传输到视频解码器30，或将其存储在存储器中以供稍后传输或由视频解码器30检索。

视频编码器20的其它结构变体可用于对视频流进行编码。例如，基于非变换的编码器20可以在没有变换处理单元206的情况下直接量化某些块或帧的残差信号。在另一种实现方式中，编码器20中，量化单元208和反量化单元210可以组合成一个单元。

解码器和解码方法

图3示出了用于实现本申请技术的示例性视频解码器30。视频解码器30用于接收例如由编码器20编码的编码图像数据21(例如编码比特流21)，得到解码图像331。编码图像数据或比特流包括用于解码所述编码图像数据的信息，例如表示编码视频条带(和/或分块或分块组)的图像块的数据和相关的语法元素。

在图3的示例中，解码器30包括熵解码单元304、反量化单元310、逆变换处理单元312、重建单元314(例如求和器314)、环路滤波器320、解码图像缓冲器(decoded picturebuffer，DPB)330、帧间预测单元344和帧内预测单元354。帧间预测单元344可以为或包括运动补偿单元。在一些示例中，视频解码器30可执行大体上与参照图2的视频编码器100描述的编码过程相反的解码过程。

如针对编码器20的描述，反量化单元210、逆变换处理单元212、重建单元214、环路滤波器220、解码图像缓冲器(decoded picture buffer，DPB)230、帧间预测单元344和帧内预测单元354还组成视频编码器20的“内置解码器”。相应地，反量化单元310的功能可以与反量化单元110相同；逆变换处理单元312的功能可以与逆变换处理单元212相同；重建单元314的功能可以与重建单元214相同；环路滤波器320的功能可以与环路滤波器220相同；解码图像缓冲器330的功能可以与解码图像缓冲器230相同。因此，针对视频编码器20的相应单元和功能进行的描述对应地适用于视频解码器30的相应单元和功能。

熵解码

熵解码单元304用于解析码流21(或通常为经编码的图像数据21)并例如对经编码的图像数据21执行熵解码，以获得量化系数309和/或经解码的编码参数(图3中未示出)等，例如帧间预测参数(例如参考图像索引和运动矢量)、帧内预测参数(例如帧内预测模式或索引)、变换参数、量化参数、环路滤波器参数和/或其它语法元素中的任一个或全部。熵解码单元304可用于应用与针对编码器20的熵编码单元270所描述的编码方案相对应的解码算法或方案。熵解码单元304还可以用于向模式选择单元360提供帧间预测参数、帧内预测参数和/或其它语法元素，并向解码器30的其它单元提供其它参数。视频解码器30可以接收视频条带级和/或视频块级的语法元素。可以使用分块和分块组以及相应语法作为视频条带和相应语法元素的补充或替代。

反量化

反量化单元310可用于从经编码的图像数据21(例如，通过熵解码单元304等解析和/或解码)接收量化参数(quantization parameter，QP)(或通常为与反量化相关的信息)和量化系数，并根据所述量化参数对经解码的量化系数309应用反量化以获得解量化系数311，所述解量化系数311也可以称为变换系数311。反量化过程可包括使用视频编码器20为视频条带中的每个视频块计算的量化参数来确定量化程度，同样也确定需要执行的反量化的程度。

逆变换

逆变换处理单元312可用于接收解量化系数311，也称为变换系数311，并对解量化系数311应用变换以获得像素点域中的重建残差块213。重建残差块213也可称为变换块313。变换可以为逆变换，例如逆DCT、逆DST、逆整数变换或概念上类似的逆变换过程。逆变换处理单元312还可以用于从编码图像数据21(例如通过熵解码单元304解析和/或解码)接收变换参数或相应信息，以确定应用于解量化系数311的变换。

重建

重建单元314(例如，加法器或求和器314)可用于通过例如将重建残差块313的像素点值和预测块365的像素点值相加，将重建残差块313添加到预测块365，以获得像素点域中的重建块315。

滤波

环路滤波单元320(在译码环路中或译码环路之后)用于对重建块315进行滤波，以获得滤波块321，以平滑像素转变或以其它方式提高视频质量等。环路滤波单元320可以包括一个或多个环路滤波器，如去块效应滤波器、像素点自适应偏移(sample-adaptiveoffset，SAO)滤波器或一个或多个其它滤波器，例如双边滤波器、自适应环路滤波器(adaptive loop filter，ALF)、锐化、平滑滤波器或协作滤波器或其任意组合。尽管环路滤波器单元320在图3中示为环路滤波器，但在其它配置中，环路滤波器单元320可以实现为环后滤波器。

解码图像缓冲器

随后将一个图像中的解码视频块321存储在解码图像缓冲器330中，解码图像缓冲器330存储作为参考图像的解码图像331，参考图像用于其它图像和/或分别输出显示的后续运动补偿。

解码器30用于经由输出312等输出解码图像311，向用户呈现或供用户观看。

预测

帧间预测单元344的功能可以与帧间预测单元244(特别是运动补偿单元)相同，帧内预测单元354的功能可以与帧间预测单元254相同，并基于从经编码的图像数据21接收的分割和/或预测参数或相应信息(例如，通过熵解码单元304等解析和/或解码)决定划分或分割并执行预测。模式选择单元360可用于基于重建图像、块或相应像素点(经滤波或未经滤波)执行每个块的预测(帧内或帧间预测)，以获得预测块365。

当将视频条带编码为帧内编码(I)条带时，模式选择单元360的帧内预测单元354用于根据指示的帧内预测模式和来自当前图像的先前解码块的数据生成当前视频条带的图像块的预测块365。当将视频图像编码为帧间编码(即，B或P)条带时，模式选择单元360的帧间预测单元344(例如，运动补偿单元)用于基于运动矢量和从熵解码单元304接收的其它语法元素产生当前视频条带的视频块的预测块365。对于帧间预测，可从其中一个参考图像列表中的其中一个参考图像产生这些预测块。视频解码器30可以根据存储在DPB 330中的参考图像，使用默认构建技术来构建参考帧列表：列表0和列表1。相同处或相似处可以应用于使用分块(视频分块)或分块组(视频分块组)作为条带(视频条带)的补充或替代的实施例。

模式选择单元360用于通过解析运动矢量和其它语法元素来确定当前视频条带的视频块的预测信息，并使用所述预测信息针对所解码的当前视频块生成预测块。例如，模式选择单元360使用接收到的一些语法元素确定用于对视频条带的视频块进行编码的预测模式(例如，帧内预测或帧间预测)、帧间预测条带类型(例如B条带、P条带或GPB条带)、条带的一个或多个参考图像列表的构建信息、条带的每个帧间编码视频块的运动矢量、条带的每个帧间编码视频块的帧间预测状态以及其它信息，以对当前视频条带的视频块进行解码。相同处或相似处可以应用于使用分块(视频分块)或分块组(视频分块组)作为条带(视频条带)的补充或替代的实施例。

可以使用视频解码器30的其它变体对经编码的图像数据21进行解码。例如，解码器30可以在没有环路滤波单元320的情况下产生输出视频流。例如，基于非变换的解码器30可以在没有逆变换处理单元312的情况下直接反量化某些块或帧的残差信号。在另一种实现方式中，视频解码器30中，反量化单元310和逆变换处理单元312可以组合成单个单元。

应理解，在编码器20和解码器30中，可以对当前步骤的处理结果进一步处理，然后输出到下一步骤。例如，在插值滤波、运动矢量推导或环路滤波之后，可以对插值滤波、运动矢量推导或环路滤波的处理结果进行进一步的运算，例如裁剪(clip)或移位(shift)运算。

应该注意的是，可以对当前块的推导运动矢量(包括但不限于仿射模式的控制点运动矢量、仿射、平面、ATMVP模式的子块运动矢量、时域运动矢量等)进行进一步运算。例如，根据运动矢量的表示位将运动矢量的值限制在预定义范围。如果运动矢量的表示位为bitDepth，则范围为-2^(bitDepth-1)至2^(bitDepth-1)-1，其中“^”表示幂次方。例如，如果bitDepth设置为16，则范围为-32768～32767；如果bitDepth设置为18，则范围为-131072～131071。例如，推导运动矢量的值(例如一个8×8块中的4个4×4子块的MV)被限制，使得所述4个4×4子块MV的整数部分之间的最大差值不超过N个像素，例如不超过1个像素。这里提供了两种根据bitDepth限制运动矢量的方法。

方法1：通过平滑操作来去除溢出的最高有效位(most significant bit，MSB)

ux＝(mvx+2^bitDepth)％2^bitDepth (1)

mvx＝(ux>＝2^bitDepth-1)？(ux-2^bitDepth):ux (2)

uy＝(mvy+2^bitDepth)％2^bitDepth (3)

mvy＝(uy>＝2^bitDepth-1)？(uy-2^bitDepth):uy (4)

其中，mvx为一个图像块或子块的运动矢量中的水平分量，mvy为一个图像块或子块的运动矢量中的垂直分量，ux和uy表示中间值。

例如，如果mvx的值为–32769，则使用公式(1)和(2)之后得到的值为32767。在计算机系统中，以二进制补码的形式存储十进数。-32769的二进制补码为1,0111,1111,1111,1111(17位)，这时丢弃MSB，那么得到的二进制补码为0111,1111,1111,1111(十进数为32767)，这与使用公式(1)和(2)之后得到的输出相同。

ux＝(mvpx+mvdx+2^bitDepth)％2^bitDepth (5)

mvx＝(ux>＝2^bitDepth-1)？(ux-2^bitDepth):ux (6)

uy＝(mvpy+mvdy+2^bitDepth)％2^bitDepth (7)

mvy＝(uy>＝2^bitDepth-1)？(uy-2^bitDepth):uy (8)

这些操作可以在对mvp和mvd求和的过程中执行，如公式(5)至(8)所示。

方法2：对值进行裁剪来去除溢出的MSB

vx＝Clip3(-2^bitDepth-1,2^bitDepth-1-1,vx)

vy＝Clip3(-2^bitDepth-1,2^bitDepth-1-1,vy)

其中，vx为一个图像块或子块的运动矢量中的水平分量，vy为一个图像块或子块的运动矢量中的垂直分量；x、y和z分别对应于MV裁剪过程的3个输入值，函数Clip3的定义如下：

图4为本发明实施例提供的视频译码设备400的示意图。视频译码设备400适用于实现本文描述的公开实施例。在一个实施例中，视频译码设备400可以是解码器，例如图1A中的视频解码器30，也可以是编码器，例如图1A中的视频编码器20。

视频译码设备400包括：入端口410(或输入端口410)和接收单元(Rx)420，用于接收数据；处理器、逻辑单元或中央处理单元(central processing unit，CPU)430，用于处理数据；发送单元(Tx)440和出端口450(或输出端口450)，用于发送数据；存储器460，用于存储数据。视频译码设备400还可以包括与入端口410、接收单元420、发送单元440和出端口450耦合的光电(optical-to-electrical，OE)组件和电光(electrical-to-optical，EO)组件，用作光信号或电信号的出口或入口。

处理器430通过硬件和软件实现。处理器430可实现为一个或多个CPU芯片、核(例如，多核处理器)、FPGA、ASIC和DSP。处理器430与入端口410、接收单元420、发送单元440、出端口450和存储器460通信。处理器430包括译码模块470。译码模块470实施上文所公开的实施例。例如，译码模块470执行、处理、准备或提供各种译码操作。因此，包括译码模块470使得视频译码设备400功能得到了显著改进，实现了视频译码设备400不同状态的转换。或者，以存储在存储器460中并由处理器430执行的指令来实现译码模块470。

存储器460包括一个或多个磁盘、磁带机和固态硬盘，可以用作溢出数据存储设备，用于在选择执行程序时存储此类程序，并且存储在程序执行过程中读取的指令和数据。例如，存储器460可以是易失性和/或非易失性的，并且可以是只读存储器(read-onlymemory，ROM)、随机存取存储器(random access memory，RAM)、三态内容寻址存储器(ternary content-addressable memory，TCAM)和/或静态随机存取存储器(staticrandom-access memory，SRAM)。

图5为示例性实施例提供的装置500的简化框图，其中，装置500可用作图1中的源设备12和目的地设备14中的任一个或两个。

装置500中的处理器502可以是中央处理单元。或者，处理器502可以是现有的或今后将开发出的能够操控或处理信息的任何其它类型的设备或多个设备。虽然可以使用如图所示的处理器502等单个处理器来实施所公开的实现方式，但使用多于一个处理器可以提高速度和效率。

在一种实现方式中，装置500中的存储器504可以是只读存储器(read onlymemory，ROM)设备或随机存取存储器(random access memory，RAM)设备。任何其它合适类型的存储设备都可以用作存储器504。存储器504可以包括处理器502通过总线512访问的代码和数据506。存储器504还可包括操作系统508和应用程序510，应用程序510包括允许处理器502执行本文所述方法的至少一个程序。例如，应用程序510可以包括应用1至N，还包括执行本文所述方法的视频译码应用。

装置500还可以包括一个或多个输出设备，例如显示器518。在一个示例中，显示器518可以是将显示器与可用于感测触摸输入的触敏元件组合的触敏显示器。显示器518可以经由总线512耦合到处理器502。

虽然装置500的总线512在本文中描述为单个总线，但是总线512可以包括多个总线。此外，辅助储存器514可以直接耦合到装置500的其它组件或通过网络访问，并且可以包括存储卡等单个集成单元或多个存储卡等多个单元。因此，装置500可以具有各种各样的配置。

数学运算符

本申请中使用的数学运算符与C编程语言中使用的数学运算符类似。然而，对整数除法和算术移位运算的结果进行了更准确的定义，并且定义了其它运算，如幂运算和实值除法。编号和计数规范通常从零开始，例如，“第一个”相当于第0个，“第二个”相当于第1个，等等。

算术运算符

算术运算符定义如下：

+ 加法

- 减法(作为双参数运算符)或者非运算(作为一元前缀运算符)

* 乘法，包括矩阵乘法

÷ 用来表示算术等式中的除法操作，但是这里没有截断或者四舍五入操作。

用来表示算术等式中的除法操作，但是这里没有截断或者四舍五入操作。

f(i)的求和，其中i取从x到y(包括y)的所有整数值。

x％y 取模运算，x除y的余数，这里x和y都必须是整数，并且x≥0和y>0。

逻辑运算符

逻辑运算符定义如下：

x&&y x和y的布尔逻辑“与”操作

x||y x和y的布尔逻辑“或”操作

！布尔逻辑“非”操作

x？y:z 如果x为真(TRUE)或者不等于0，那么返回y的值，否则，返回z的值。

关系运算符

关系运算符定义如下：

> 大于

>＝大于或者等于

< 小于

<＝小于或者等于

＝＝等于

！＝不等于

当一个关系运算符应用于一个已被赋值na(not applicable，不适用)的语法元素或变量时，na值被视为该语法元素或变量的不同值。na值被视为不等于任何其它值。

按位运算符

按位运算符定义如下：

& 按位与。当对整数变量运算时，运算的是整数值的二的补码表示。当对二进制参数运算时，如果它包含的位比另一个参数少，则通过添加更多等于0的有效位来扩展较短的参数。

| 按位或。当对整数变量运算时，运算的是整数值的二的补码表示。当对二进制参数运算时，如果它包含的位比另一个参数少，则通过添加更多等于0的有效位来扩展较短的参数。

^ 按位异或。当对整数变量运算时，运算的是整数值的二的补码表示。当对二进制参数运算时，如果它包含的位比另一个参数少，则通过添加更多等于0的有效位来扩展较短的参数。

x>>y x的二的补码整数表示向右算术移动y个二进制位。只有y为正数时才有这个函数定义。右移的结果是移进最高有效位(most significant bit，MSB)的比特位应该等于移位操作之前的x的MSB。

x<<y x的二的补码整数表示向左算术移动y个二进制位。只有y为正数时才有这个函数定义。左移的结果是移进最低有效位(least significant bit，LSB)的比特位应该等于0。

赋值运算符

算术运算符定义如下：

＝赋值运算符

++ 增，例如，x++等于x＝x+1；当使用在数组索引中时，应该等于增操作之前变量的值。

-- 减，例如，x––等于x＝x–1；当使用在数组索引中时，应该等于减操作之前变量的值。

+＝增加说明的量，例如：x+＝3等于x＝x+3，x+＝(-3)等于x＝x+(-3)。

-＝减少说明的量，例如：x–＝3等于x＝x–3，x–＝(-3)等于x＝x–(-3)。

范围表示法

下面的符号用来说明一个值的范围：

x＝y..z x取的整数值在y到z的范围内，包括y和z，这里x，y和z都是整数，且z大于y。

运算优先级顺序

当没有使用括号来显式的表示优先顺序，那么使用下面的规则：

–高优先级的运算在低优先级的运算之前计算。

–相同优先级的运算从左到右依次计算。

下表从最高到最低的顺序说明运算的优先级，表中位置越高优先级越高。

对于C编程语言中也使用的运算符，本规范中运算符优先级顺序与在C编程语言中优先级顺序相同。

表：运算优先级按照最高(表格顶部)到最低(表格底部)排序

逻辑运算的文字描述

在文中，逻辑运算语句用数学形式描述如下：

可用以下方式描述：

...as follows/...the following applies:

–If condition 0,statement 0

–Otherwise,if condition 1,statement 1

–...

–Otherwise(informative remark on remaining condition),statement n

“If...”后面紧跟着“...as follows”或“...the following applies”用来介绍文中的每个“If...Otherwise,if...Otherwise,...”语句。“If...Otherwise,if...Otherwise,...”的最后一个条件始终是“Otherwise,...”。间插的“If...Otherwise,if...Otherwise,...”语句可以通过将“...as follows”或“...the following applies”与结尾的“Otherwise,...”进行匹配来识别。

在文中，逻辑运算语句用数学形式描述如下：

可用以下方式描述：

...as follows/...the following applies:

–If all of the following conditions are true,statement 0:

–condition 0a

–condition 0b

–Otherwise,if one or more of the following conditions are true,statement 1:

–condition 1a

–condition 1b

–...

–Otherwise,statement n

在文中，逻辑运算语句用数学形式描述如下：

可用以下方式描述：

When condition 0,statement 0

When condition 1,statement 1

分块组和分块

本申请实施例可用于实现分块和分块组的概念，换句话说，用于使用分块和分块组处理或编码图像。下文提供更详细的描述。

分块：图像中特定分块列和特定分块行内的CTU所在的矩形区域。不同图像以及同一图像中的分块的尺寸可能不同。

分块列：CTU所在的矩形区域，具有与图像高度相等的高度以及指定的宽度。例如，该宽度通过图像参数集中的语法元素指定。

分块组：图像的分块光栅扫描中该图像的整数个分块。分块组中的分块可以仅包含在单个NAL单元中。

分块组头：经译码的分块组的一部分，包含与分块组中表示的第一个或所有分块相关的数据元素。

分块组数据：包含属于给定分块组的所有分块的实际译码数据。

分块行：CTU所在的矩形区域，具有指定的高度以及与图像宽度相等的宽度。例如，该高度通过图像参数集中的语法元素指定。

分块扫描：分割图像的CTU的一种特定顺序排列，其中，CTU在分块的CTU光栅扫描中连续排列，而图像中的分块在图像的分块光栅扫描中连续排列。

光栅扫描：矩形二维图案到一维图案的映射，以使一维图案中的第一条目来自从左到右扫描的二维图案的最上一行，随后是第二行，第三行等图案(向下)的从左向右扫描的行。

关于其它术语和定义，如果在此未详细说明，则参考2018年12月14日的JVET-L1001-v10以及2018年10月12日的JVET-L0686-V2，其全部内容以引用的方式并入本文中，尤其是本文中具体引用的JVET-L1001-v10的各个部分(也称为条款)。

图像到分块组和分块的分割：

示例性的，如图6所示，可以将图像分为分块组和分块。例如，在图像的分块光栅扫描中，分块组是一列分块。分块是一列CTU，这些CTU覆盖了图像中的矩形区域。在图6中，图像被分为12个分块(分块1至12)和3个分块组(分块组1至3)。在图6中，图像包括3个分块列和4个分块行，分块1和2属于分块组1，分块3至7属于分块组2，分块8至12属于分块组3。图6中描绘的每个分块包括18个CTU，分布在6个CTU列和3个CTU行中。跨分块(图像内的分块扫描顺序)光栅扫描可以是光栅扫描，例如，从位于左上角的分块1开始逐分块行地横向扫描图像，在位于右下角的分块12处结束扫描。这通过表示分块组扫描顺序(即跨分块光栅扫描)的虚线箭头来表示。在分块内，可以执行另一光栅扫描(分块内光栅扫描)(分块内的CTU扫描顺序)，例如，从位于左上角的CTU开始逐CTU行地横向扫描分块，在位于右下角的CTU处结束扫描。分块内光栅扫描由实线箭头指示，该实线箭头指示分块内的CTU扫描顺序。

因此，如图6所示，示出的分块组由分块组成，并且分块包括整数个CTU。对于图6，还需要说明的是，通用测试模型(Versatile Test Model，VTM)3.1版本也使用分块组。

图6和图7示出了涉及光栅扫描顺序的分块组(tile group，TG)。这可以与图9相比较，图9示出了矩形TG。分块组也可以认为是包括分块的条带。

CTB光栅和分块扫描流程

列表ColWidth[i]表示以CTB为单位的第i个分块列的宽度，其中，i的范围为0到num_tile_columns_minus1(包括端值)。该列表ColWidth[i]的推导过程如下：

列表RowHeight[j]表示以CTB为单位的第j个分块行的高度，其中，j的范围为0到num_tile_rows_minus1(包括端值)。该列表RowHeight[j]的推导过程如下：

列表ColBd[i]表示以CTB为单位的第i个分块列边界的位置，其中，i的范围为0到num_tile_columns_minus1+1(包括端值)。该列表ColBd[i]的推导过程如下：

for(ColBd[0]＝0,i＝0；i<＝num_tile_columns_minus1；i++)

ColBd[i+1]＝ColBd[i]+ColWidth[i] (3)

列表RowBd[j]表示以CTB为单位的第j个分块行边界的位置，其中，j的范围为0到num_tile_rows_minus1+1(包括端值)。该列表RowBd[j]的推导过程如下：

for(RowBd[0]＝0,j＝0；j<＝num_tile_rows_minus1；j++)

RowBd[j+1]＝RowBd[j]+RowHeight[j] (4)

列表CtbAddrRsToTs[ctbAddrRs]表示从图像的CTB光栅扫描中的CTB地址到分块扫描中的CTB地址的转换，其中，ctbAddrRs的范围为0到PicSizeInCtbsY-1(包括端值)。该列表CtbAddrRsToTs[ctbAddrRs]的推导过程如下：

列表CtbAddrTsToRs[ctbAddrTs]表示从分块扫描中的CTB地址到图像的CTB光栅扫描中的CTB地址的转换，其中，ctbAddrTs的范围为0到PicSizeInCtbsY-1(包括端值)。该列表CtbAddrTsToRs[ctbAddrTs]的推导过程如下：

for(ctbAddrRs＝0；ctbAddrRs<PicSizeInCtbsY；ctbAddrRs++) (6)

CtbAddrTsToRs[CtbAddrRsToTs[ctbAddrRs]]＝ctbAddrRs

列表TileId[ctbAddrTs]表示从分块扫描中的CTB地址到分块ID的转换，其中，ctbAddrTs的范围为0到PicSizeInCtbsY-1(包括端值)。该列表TileId[ctbAddrTs]的推导过程如下：

列表NumCtusInTile[tileIdx]表示从分块索引到分块中CTU的数量的转换，其中，tileIdx的范围为0到PicSizeInCtbsY-1(包括端值)。该列表NumCtusInTile[tileIdx]的推导过程如下：

for(j＝0,tileIdx＝0；j<＝num_tile_rows_minus1；j++)

for(i＝0；i<＝num_tile_columns_minus1；i++,tileIdx++) (8)

NumCtusInTile[tileIdx]＝ColWidth[i]*RowHeight[j]

列表FirstCtbAddrTs[tileIdx]表示从分块ID到分块中第一个CTB的分块扫描中的CTB地址的转换，其中，tileIdx的范围为0到NumTilesInPic-1(包括端值)。该列表FirstCtbAddrTs[tileIdx]的推导过程如下：

ColumnWidthInLumaSamples[i]的值表示以亮度像素点为单位的第i个分块列的宽度，并被设置为与ColWidth[i]<<CtbLog2SizeY相等，其中，i的范围为0到num_tile_columns_minus1(包括端值)。

RowHeightInLumaSamples[j]的值表示以亮度像素点为单位的第j个分块行的高度，并被设置为与RowHeight[j]<<CtbLog2SizeY相等，其中，j的范围为0到num_tile_rows_minus1(包括端值)。

图像参数集原始字节序列净荷(raw byte sequence payload，RBSP)语法

分块和分块组的图像参数集语法如下所示。

分块组头语法

分块组数据语法

图像参数集语义

single_tile_in_pic_flag等于1表示在每个参考PPS的图像中只有一个分块。single_tile_in_pic_flag等于0表示在每个参考PPS的图像中有不止一个分块。

码流一致性要求，对于CVS内激活的所有PPS，single_tile_in_pic_flag的值应相同。

num_tile_columns_minus1加1表示分割后的图像中分块列的数量。num_tile_columns_minus1应在范围0到PicWidthInCtbsY-1内(包括端值)。如果不存在，则推断num_tile_columns_minus1的值等于0。

num_tile_rows_minus1加1表示分割后的图像中分块行的数量。num_tile_rows_minus1应在范围0到PicHeightInCtbsY-1内(包括端值)。如果不存在，则推断num_tile_rows_minus1的值等于0。

将变量NumTilesInPic设置为等于(num_tile_columns_minus1+1)*(num_tile_rows_minus1+1)。

当single_tile_in_pic_flag等于0时，NumTilesInPic应大于1。

uniform_tile_spacing_flag等于1表示分块列边界以及分块行边界在整个图像中是一致分布的。uniform_tile_spacing_flag等于0表示分块列边界以及分块行边界在整个图像中并不是一致分布的，而是使用语法元素tile_column_width_minus1[i]和tile_row_height_minus1[i]显式地指示。如果不存在，则推断uniform_tile_spacing_flag的值等于1。

tile_column_width_minus1[i]加1表示以CTB为单位的第i个分块列的宽度。

tile_row_height_minus1[i]加1表示以CTB为单位的第i个分块行的高度。

如“CTB光栅和分块扫描过程”部分所述，通过调用CTB光栅和分块扫描转换过程，可以得出以下变量：

–表示以CTB为单位的第i个分块列的宽度的列表ColWidth[i]，其中，i的范围为0到num_tile_columns_minus1(包括端值)；

–表示以CTB为单位的第j个分块行的高度的列表RowHeight[j]，其中，j的范围为0到num_tile_rows_minus1(包括端值)；

–表示以CTB为单位的第i个分块列边界的位置的列表ColBd[i]，其中，i的范围为0到num_tile_columns_minus1+1(包括端值)；

–表示以CTB为单位的第j个分块行边界的位置的列表RowBd[j]，其中，j的范围为0到num_tile_rows_minus1+1(包括端值)；

–表示从图像的CTB光栅扫描中的CTB地址到分块扫描中的CTB地址的转换的列表CtbAddrRsToTs[ctbAddrRs]，其中，ctbAddrRs的范围为0到PicSizeInCtbsY-1(包括端值)；

–表示从分块扫描中的CTB地址到图像的CTB光栅扫描中的CTB地址的转换的列表CtbAddrTsToRs[ctbAddrTs]，其中，ctbAddrTs的范围为0到PicSizeInCtbsY-1(包括端值)；

–表示从分块扫描中的CTB地址到分块ID的转换的列表TileId[ctbAddrTs]，其中，ctbAddrTs的范围为0到PicSizeInCtbsY-1(包括端值)；

–表示从分块索引到分块中CTU的数量的转换的列表NumCtusInTile[tileIdx]，其中，tileIdx的范围为0到PicSizeInCtbsY-1(包括端值)；

–表示从分块ID到分块中第一个CTB的分块扫描中的CTB地址的转换的列表FirstCtbAddrTs[tileIdx]，其中，tileIdx的范围为0到NumTilesInPic-1(包括端值)；

–表示以亮度像素点为单位的第i个分块列的宽度的列表ColumnWidthInLumaSamples[i]，其中，i的范围为0到num_tile_columns_minus1(包括端值)；

–表示以亮度像素点为单位的第j个分块行的高度的列表RowHeightInLumaSamples[j]，其中，j的范围为0到num_tile_rows_minus1(包括端值)。

ColumnWidthInLumaSamples[i]的值和RowHeightInLumaSamples[j]的值均应大于0，其中，i的范围为0到num_tile_columns_minus1(包括端值)，j的范围为0到num_tile_rows_minus1(包括端值)。

loop_filter_across_tiles_enabled_flag等于1表示可以在参考PPS的图像中跨分块边界执行环内滤波操作。loop_filter_across_tiles_enabled_flag等于0表示在参考PPS的图像中不跨分块边界执行环内滤波操作。环内滤波操作包括去块滤波操作、像素点自适应偏移滤波操作以及自适应环路滤波操作。如果不存在，则推断loop_filter_across_tiles_enabled_flag的值等于1。

分块组头语义

tile_group_pic_parameter_set_id表示当前使用的PPS的pps_pic_parameter_set_id的值。tile_group_pic_parameter_set_id的值应在范围0至63内(包括0和63)。

tile_group_address表示分块组中第一个分块的分块地址。tile_group_address的长度为Ceil(Log2(NumTilesInPic))比特。tile_group_address的值应在范围0至NumTilesInPic-1内(包括端值)，并且tile_group_address的值应不等于同一编码图像中任意其它经编码的分块组NAL单元的tile_group_address的值。当tile_group_address不存在时，则推断它的值等于0。

num_tiles_in_tile_group_minus1加1表示分块组中的分块的数量。num_tiles_in_tile_group_minus1的值应在范围0至NumTilesInPic-1内(包括端值)。如果不存在，则推断num_tiles_in_tile_group_minus1的值等于0。

根据表1，tile_group_type表示分块组的编码类型。

表1：tile_group_type的名称关联关系

tile_group_type	tile_group_type的名称
		0	B(B分块组)
1	P(P分块组)
		2	I(I分块组)

offset_len_minus1加1表示entry_point_offset_minus1[i]语法元素的长度，该长度以比特为单位。offset_len_minus1的值应在范围0至31内(包括0和31)。

entry_point_offset_minus1[i]加1表示以字节为单位的第i个条目点偏移量，该第i个条目点偏移量通过offset_len_minus1加1个比特表示。分块组头之后的分块组数据由num_tiles_in_tile_group_minus1+1个子集组成，子集的索引值的范围为0到num_tiles_in_tile_group_minus1(包含0和num_tiles_in_tile_group_minus1)。分块组数据的第一个字节被认为是字节0。如果存在，出现在经编码的分块组NAL单元的分块组数据部分中的预防混淆字节会被计为分块组数据的一部分，已达到子集识别的目的。子集0由经编码的分块组数据的字节0到字节entry_point_offset_minus1[0]组成(包括端值)，子集k由经编码的分块组数据的字节firstByte[k]到字节lastByte[k]组成(包括端值)，其中，k的范围为1到num_tiles_in_tile_group_minus1-1(包括端值)。字节firstByte[k]和字节lastByte[k]定义如下：

lastByte[k]＝firstByte[k]+entry_point_offset_minus1[k] (11)

最后一个子集(其子集索引等于num_tiles_in_tile_group_minus1)由经编码的分块组数据的剩余字节组成。

每个子集应由分块组中同一个分块内的所有CTU的所有编码比特组成。

基于历史的运动矢量预测(history based motion vector predictor，HMVP)

本申请实施例可用于实现基于历史的运动矢量预测，或者换句话说，用于使用基于历史的运动矢量预测处理或译码图像。下文提供更详细的描述。

例如，在通用视频译码(Versatile Video Coding，VVC)中，可以通过两种方式指示帧间译码块的运动矢量：先进的运动矢量预测(Advanced motion vector prediction，AMVP)模式或融合模式。对于AMVP模式，指示实际运动矢量与运动矢量预测值(motionvectorprediction，MVP)之间的差值、参考索引以及参考AMVP候选列表的MVP索引。对于融合模式，指示参考融合候选列表的融合索引，并继承与融合候选相关联的所有运动信息。

对于AMVP候选列表和融合候选列表两者，运动候选都是从时域相邻译码块或空间相邻译码块推导出的。更具体地，可以通过按如下顺序检查以下四种类型的融合MVP候选来构建融合候选列表：

1.空间融合候选(来自五个空间相邻块，如图10所示)。

2.时域MVP(Temporal MVP，TMVP)融合候选。

3.合并的双向预测融合候选。

4.零运动矢量融合候选。

一旦可用融合候选的数量达到指示的最大容许融合候选的数量(例如，在常规测试条件下为5)，就终止融合候选列表构建过程。

类似地，对于AMVP候选列表，按如下顺序检查三种类型的MVP候选：

1.多达两个空间MVP候选(一个来自B₀、B₁和B₂，另一个来自A₀和A₁，如图10所示)。

2.时域MVP(Temporal MVP，TMVP)。

3.零MVP候选。

因此，图10示出了用于融合候选列表构建和AMVP候选列表构建的空间相邻块的位置。

在基于历史的MVP(history-based MVP，HMVP)方法中，HMVP候选定义为先前译码块的运动信息。在译码(即，编码和/或解码)过程中维护具有多个HMVP候选的表。每当存在帧间译码块时，就将相关的运动信息添加到表的最后一个条目中，作为新的HMVP候选。图11示出了整个译码流程。

将HMVP表的尺寸(也称为长度L)设置为给定值HMVPCand(HMVPCand可以是正整数，例如16)，这表示可以向表中添加多达16个HMVP候选。如果有超过16个HMVP候选来自先前译码块，则例如，使用先入先出(First in First out，FIFO)规则，使得该表中始终包含最近的先前编码的16个运动矢量候选。图12示出了HMVP方法中更新HMVP表的示例。图12(a)示出了一个示例，其中，使用FIFO规则移除HMVP候选并将新的候选添加到所提出的方法中所使用的表中。

为了进一步提高译码效率，引入了如图12(b)所示的约束FIFO规则，其中，在向表中插入HMVP候选时，首先进行冗余校验，以搜索表中是否存在相同的HMVP候选。如果存在，则从表中删除该相同的HMVP候选，并且之后的(按照FIFO的顺序)所有HMVP候选都会移动，即将它们的HMVP候选索引减1。

可以在融合候选列表的构建过程中使用HMVP候选。例如，在TMVP候选之后，插入表中从最后一个条目到第一个条目中的所有HMVP候选。对HMVP候选进行修剪(pruning)。一旦可用融合候选的总数量达到指示的最大容许融合候选的数量，就终止融合候选列表构建过程。

类似地，也可以在AMVP候选列表的构建过程中使用HMVP候选。例如，将表中最后K个HMVP候选的运动矢量插入到TMVP候选之后。仅使用参考图像与AMVP目标参考图像相同的HMVP候选来构建AMVP候选列表。对HMVP候选进行修剪。K可以设置为整数值，例如，K可以为4。

另外，当融合候选的总数大于或等于15时，可以采用截断一元加固定长度(3比特)二值化方法对融合索引进行编码。融合候选的总数表示为N_mrg，二值化方法见下表。

表：融合索引的二进制串(假设N_mrg为15)

包含“HMVP工具”的融合候选列表推导通过以下过程产生：

仅在merge_flag[xCb][yPb]等于1时调用此过程，其中，(xCb,yCb)表示相对于当前图像的左上亮度像素点的当前亮度译码块的左上像素点。

该过程的输入是：

–当前亮度译码块的左上像素点相对于当前图像的左上亮度像素点的亮度位置(xCb,yCb)；

–变量cbWidth，表示当前译码块以亮度像素点计算的宽度；

–变量cbHeight，表示当前译码块以亮度像素点计算的高度；

–双向预测权重索引gbiIdx。

该过程的输出是：

–1/16分数像素点精度的亮度运动矢量mvL0[0][0]和mvL1[0][0]；

–参考索引refIdxL0和refIdxL1；

–预测表利用率标志predFlagL0[0][0]和predFlagL1[0][0]。

双向预测权重索引gbiIdx设置为0。

所述运动矢量mvL0[0][0]和mvL1[0][0]、所述参考索引refIdxL0和refIdxL1以及所述预测表利用率标志predFlagL0[0][0]和predFlagL1[0][0]通过以下有序的步骤获得：

1.以亮度译码块位置(xCb,yCb)、亮度译码块宽度cbWidth以及亮度译码块高度cbHeight为输入调用条款8.3.2.3中所述的从相邻编码单元获得融合候选的过程。该过程的输出为可用性标志availableFlagA₀、availableFlagA₁、availableFlagB₀、availableFlagB₁和availableFlagB₂、参考索引refIdxLXA₀、refIdxLXA₁、refIdxLXB₀、refIdxLXB₁和refIdxLXB₂、预测表利用率标志predFlagLXA₀、predFlagLXA₁、predFlagLXB₀、predFlagLXB₁和predFlagLXB₂、运动矢量mvLXA₀、mvLXA₁、mvLXB₀、mvLXB₁和mvLXB₂以及双向预测权重索引gbiIdxA₀、gbiIdxA₁、gbiIdxB₀、gbiIdxB₁和gbiIdxB₂，其中，X为0或1。

2.时域融合候选Col的参考索引refIdxLXCol以及双向预测权重索引gbiIdxCol设置为0，其中，X为0或1。

3.以亮度位置(xCb,yCb)、亮度译码块宽度cbWidth、亮度译码块高度cbHeight以及变量refIdxL0Col为输入调用条款8.3.2.11中所述的时域亮度运动矢量预测值的推导过程。该过程的输出为可用性标志availableFlagL0Col和时域运动矢量mvL0Col。

变量availableFlagCol、predFlagL0Col和predFlagL1Col的推导过程如下：

availableFlagCol＝availableFlagL0Col (12)

predFlagL0Col＝availableFlagL0Col (13)

predFlagL1Col＝0 (14)

4.当tilegroup_type为B时，以亮度位置(xCb,yCb)、亮度译码块宽度cbWidth、亮度译码块高度cbHeight以及变量refIdxL1Col为输入调用条款8.3.2.11中所述的时域亮度运动矢量预测值的推导过程。该过程的输出为可用性标志availableFlagL1Col和时域运动矢量mvL1Col。变量availableFlagCol和predFlagL1Col的推导过程如下：

availableFlagCol＝availableFlagL0Col||availableFlagL1Col (15)

predFlagL1Col＝availableFlagL1Col (16)

5.融合候选列表mergeCandList的构建过程如下：

6.将变量numCurrMergeCand和numOrigMergeCand设置为mergeCandList中融合候选的数量。

7.当numCurrMergeCand小于(MaxNumMergeCand-1)，且NumHmvpCand大于0时，

执行以下操作：

–以mergeCandList和numCurrMergeCand为输入调用标题为(“基于历史的融合候选的推导过程”)的下一节中所述的基于历史的融合候选的推导过程。该过程的输出为修改后的mergeCandList和numCurrMergeCand。

–将numOrigMergeCand设置为等于numCurrMergeCand。

基于历史的融合候选的推导过程

该过程的输入是：

–融合候选列表mergeCandList；

–列表numCurrMergeCand中可用融合候选的数量。

该过程的输出是：

–修改后的融合候选列表mergeCandList；

–修改后的列表numCurrMergeCand中融合候选的数量。

将数组isPruned[i]中的每个元素设置为假(FALSE)，其中，i＝0……numCurrMergeCand-1。将变量numOrigMergeCand设置为等于numCurrMergeCand。

对于HmvpCandList[hMvpIdx]中的每个候选，重复执行以下有序的步骤，直到numCurrMergeCand等于(MaxNumMergeCand-1)，其中，索引hMvpIdx＝1..NumHmvpCand。

1.变量sameMotion的推导过程如下：

–对于i＝0……numOrigMergeCand-1中的任意值，如果以下条件均为真(true)，则将sameMotion和isPruned[i]均设置为真(TRUE)：

–候选HmvpCandList[NumHmvpCand-hMvpIdx]等于融合候选mergeCandList[i]；

–isPruned[i]等于假(FALSE)。

–否则，将sameMotion设置为假(FALSE)。

2.当sameMotion等于假(FALSE)时，将候选HmvpCandList[NumHmvpCand-hMvpIdx]添加到融合候选列表中，具体如下：

mergeCandList[numCurrMergeCand++]＝

HmvpCandList[NumHmvpCand-hMvpIdx] (18)

包含“HMVP工具”的运动矢量预测值候选列表推导通过以下过程产生：

该过程的输入是：

–变量cbWidth，表示当前译码块以亮度像素点计算的宽度；

–变量cbHeight，表示当前译码块以亮度像素点计算的高度；

–当前编码单元分区的参考索引refIdxLX，其中，X为0或1。

该过程的输出是1/16分数像素点精度的运动矢量预测值候选列表mvpListLX，其中，X为0或1。

通过以下有序的步骤推导出运动矢量预测值候选列表mvpListLX，其中，X为0或1：

1.以亮度译码块位置(xCb,yCb)、亮度译码块宽度cbWidth、亮度译码块高度cbHeight以及refIdxLX为输入调用条款8.3.2.10中所述的从相邻编码单元分区获得空间运动矢量预测值候选的过程，其中，X为0或1。该过程的输出为可用性标志availableFlagLXN和运动矢量mvLXN，其中，N可替换为A或B。

2.以设置为mvLXN的mvX、设置为MvShift+2的rightShift以及设置为MvShift+2的leftShift为输入调用条款8.3.2.14中所述的运动矢量的取整过程，其中，N可替换为A或B。该过程的输出为取整后的mvLXN，其中，N可替换为A或B。

3.如果availableFlagLXA和availableFlagLXB均等于1，且mvLXA不等于mvLXB，则将availableFlagLXCol设置为0。

4.否则，采用以下步骤：

–以亮度译码块位置(xCb,yCb)、亮度译码块宽度cbWidth、亮度译码块高度cbHeight以及refIdxLX为输入调用条款8.3.2.11中所述的时域亮度运动矢量预测值的推导过程，其中，X为0或1。该过程的输出为可用性标志availableFlagLXCol和时域运动矢量预测值mvLXCol。

–以设置为mvLXCol的mvX、设置为MvShift+2的rightShift以及设置为MvShift+2的leftShift为输入调用条款8.3.2.14中所述的运动矢量的取整过程。该过程的输出为取整后的mvLXCol。

5.运动矢量预测值候选列表mvpListLX的构建过程如下：

6.当numCurrMvpCand小于2且NumHmvpCand大于0时，对i＝1..Min(4,NumHmvpCand)执行以下操作，直到numCurrMvpCand等于2：

–对于每个参考图像列表LY(其中Y＝0……1)执行以下操作，直到numCurrMvpCand等于2：

–当以下条件均为真(true)时，将mvpListLX[numCurrMvpCand++]设置为等于候选HmvpCandList[NumHmvpCand-i]的LY运动矢量。

–基于历史的运动矢量预测值候选HmvpCandList[i]的LY参考索引等于refIdxLX。

–运动矢量预测值候选列表为空(numCurrMvpCand等于0)，或者候选HmvpCandList[NumHmvpCand-i]的LY运动矢量不等于mvpListLX[j]，其中，j＝0……numCurrMvpCand-1。

在标题为“基于历史的运动矢量预测值候选列表的更新”的部分中描述了基于历史的运动矢量预测值列表的更新，并且该过程在获得给定编码单元的运动信息后进行。

基于历史的运动矢量预测值候选列表的更新：

该过程的输入是：

–1/16分数像素点精度的亮度运动矢量mvL0和mvL1；

–参考索引refIdxL0和refIdxL1；

–预测表利用率标志predFlagL0和predFlagL1。

MVP候选hMvpCand包括亮度运动矢量mvL0和mvL1、参考索引refIdxL0和refIdxL1、预测表利用率标志predFlagL0和predFlagL1以及设置为0的双向预测权重索引gbiIdx。

按以下有序步骤使用候选hMvpCand对候选列表HmvpCandList进行修改：

1.将变量identicalCandExist设置为等于假(FALSE)，变量removeIdx设置为等于0。

2.当NumHmvpCand大于0时，对于hMvpIdx＝0……NumHmvpCand–1的每个索引hMvpIdx，执行以下步骤，直到identicalCandExist等于真(TRUE)为止：

–当hMvpCand等于HmvpCandList[hMvpIdx]时，将identicalCandExist设置为等于真(TRUE)，removeIdx设置为等于hMvpIdx。

3.候选列表HmvpCandList更新如下：

–如果identicalCandExist等于真(TRUE)或者NumHmvpCand等于6，则采用以下步骤：

–对于i＝(removeIdx+1)……(NumHmvpCand–1)的每个索引i，将HmvpCandList[i–1]设置为等于HmvpCandList[i]。

–将HmvpCandList[NumHmvpCand–1]设置为等于mvCand。

–如果(identicalCandExist等于假(FALSE)且NumHmvpCand小于6)，则采用以下步骤：

–将HmvpCandList[NumHmvpCand++]设置为等于mvCand。

下表示例性地示出了在新的分块组的起始处和每个CTU行的起始处重置HMVP列表的语法。

在新的分块组的起始处，使用以下语法重置HMVP列表，当CtbAddrInRs＝＝tilegroup_address，即新的分块组的起始处时，将NumHmvpCand设置为0。

在每个CTU行的起始处，即每个CTU行的第一个CTU,同样重置HMVP列表。语法CtbAddrInRs％PicWidthInCtbsY＝＝0指向每个CTU行的第一个CTU，通过将变量NumHmvpCand设置为0来重置HMVP列表。

波前并行处理(wavefront parallel processing，WPP)

为了提高处理效率，引入了称为波前并行处理(wavefront parallelprocessing，WPP)的处理方式，其中WPP模式允许并行处理各行的CTU。在WPP模式下，通过延迟例如两个(也可以是一个、三个或多个)连续CTU，来相对于前一个(紧邻的)CTU行对每个CTU行进行处理。图13示出了波前并行处理。例如，参见图13，将图像分为CTU，每个线程(行)包括11个CTU，即线程1包括CTU0至CTU10，线程2包括CTU11至CTU21，线程3包括CTU22至CTU32，线程4包括CTU33至CTU43，以此类推。因此，在WPP模式下，当线程1中CTU1的编解码过程完成时，可以开始线程2中CTU11的编解码过程。类似地，当线程2中CTU12的编解码过程完成时，可以开始线程3中CTU22的编解码过程，当线程3中CTU23的编解码过程完成时，可以开始线程4中CTU33的编解码过程，当线程4中CTU34的编解码过程完成时，可以开始线程5中CTU44的编解码过程。

例如，在采用基于历史的运动矢量预测(history-based motion vectorprediction，HMVP)时，本申请实施例中可以并行处理图像中的CTU。本申请实施例允许结合HMVP使用分块或分块组。

分块扫描定义为对分割图像的CTU的有序排列，其中CTU在分块中的CTU光栅扫描中连续排列，而图像中的分块在图像的分块光栅扫描中连续排列。分块组头定义为经编码的分块组的一部分，包含与分块组中表示的第一个或所有分块相关的数据元素。

因此，一个给定图像可以包含一个或多个分块组，且每个分块组可以包含一个或多个分块。允许对分块进行并行处理，例如，对不同分块组或分块进行并行处理。在更精细的粒度下，还可以在给定分块组中的每一个分块中采用波前并行处理(wavefrontparallel processing，WPP)或其它工具，以允许进一步的并行处理，其中，该其它工具例如采用基于CTU行的并行性。

本发明实施例用于，例如，在新分块组的起始处和/或新分块的起始处和/或给定分块内的每个CTU行的起始处重置HMVP列表。因此，有利于CTU的并行处理。

图6示出了被分为3个不同分块组和12个不同分块的图像。HMVP工具维护运动矢量候选列表，并在处理每个译码块后对其进行维护和更新。如此，维护并不断更新HMVP列表，直到CTU行的最后一个CTU。因此，波前并行处理工具不能在给定的图像、分块组或分块内执行。上文已经作了进一步解释。

图7和图8示出了针对分块组和分块，在每个CTU行的起始处重置HMVP列表的想法。

图7涉及为图6提供的解释。也就是说，分块的数量、三个分块组以及分块组扫描顺序(即跨分块光栅扫描)对应于已经为图6解释过的内容。图7还示出了分块内的光栅扫描，如表示分块内的CTU扫描顺序的实线箭头所指示。除了图6之外，图7指示通过图7中分块1、分块2以及分块3所对应的箭头进行HMVP列表重置。

在图7中，对以下所有组合执行HMVP列表重置：

·每个分块组的起始处(相当于条带的起始处)；

·分块组内每个分块的起始处；

·给定分块内每个CTU行的第一个CTU。

下表中提供了可能的语法说明的第一替代方案。程序tile_group_data由属于给定分块组的所有分块的编码数据组成。for循环“for(i＝0；i<＝num_tiles_in_tile_group_minus1；i++,tileIdx++)”迭代给定分块组中的所有分块，且for循环“for(j＝0；j<NumCtusInTile[tileIdx]；j++,ctbAddrInTs++)”迭代给定分块中的所有CTU。

此语法说明如图8所示。也就是说，图8示出了针对分块组、分块以及分块内CTU行的HMVP列表重置的可能语法说明。

下文提供重置HMVP列表(例如，在分块内每个CTU行的起始处)的语法的第二种替代方案：

此替代方案如图14所示。也就是说，图14示出了针对分块组、分块以及分块内CTU行的HMVP列表重置的另一可能语法说明。

图9给出了非一致间隔(例如，具有不同的尺寸)的三个不同分块的示例。图9可以与图5和图6进行比较。图5和图6示出了相对于光栅扫描顺序的分块组(tile group，TG)，图9示出了矩形TG并示出了由虚线表示的分块边界。图9还示出了译码树块(Coding TreeBlock，CTB)。

图9示出了针对分块组、分块以及分块内CTU行起始处的HMVP列表重置。

例如，基于前面的语法表中指定的公式重置HMVP列表。该公式如下：

只有在给定CTU的ctbAddrInTs等于分块组或分块的起始处，或者给定CTU的地址与分块内给定CTU行的第一个CTU相同时，才将变量FirstCtbInCtuRowInTile设置为真(true)。表达式HMVPCandNum＝0用于初始化或重置HMVP列表。当变量FirstCtbInCtuRowInTile设置为真(true)时，将HMVPCandNum设置为0。

对图9中的分块1使用该公式将得出以下结果。图9中的分块1共包含12个CTU，编号为0至11。它的ColWidth为4个CTB，且FirstCtbAddrTs的值为0。

因此，对于CTB0、CTB4以及CTB8，FirstCtbInCtuRowInTile的值为1，所以对这些CTB的HMVP列表进行重置。

图9中的分块2包含21个CTB，ColWidth为7个CTB，且FirstCtbAddrTs的值为12。

因此，对于CTB12、CTB19以及CTB26，FirstCtbInCtuRowInTile的值为1，所以对这些CTB的HMVP列表进行重置。

类似地，图9中的分块3共包含12个CTU，它的ColWidth为4个CTB，且FirstCtbAddrTs的值为33。

因此，对于CTB33、CTB37以及CTB41，FirstCtbInCtuRowInTile的值为1，所以对这些CTB的HMVP列表进行重置。

因此，通过在分块内每个CTU行的起始处(第一个CTU)重置(即“初始化”)HMVP列表，可以实现波前并行处理或类似并行处理等工具的操作。

下文提供了用于在分块内每个CTU行的起始处重置HMVP列表的另一种语法。

下文提供了用于重置HMVP列表(例如，在分块内每个CTU行的起始处)的另一种语法。

通过以下公式初始化或重置HMVP列表：

FirstCtbInCtuRowInTile＝(j％ColWidth[tileIdx]＝＝0)？1:0

If((tile_group_type！＝I)&&(FirstCtbInCtuRowInTile))

HMVPCandNum＝0

只有在给定CTU(变量j)的ctbAddrInTs等于分块组或分块的起始处，或者给定CTU的地址与分块内给定CTU行的第一个CTU相同时，才将变量FirstCtbInCtuRowInTile设置为真(true)。表达式(j％ColWidth[tileIdx]＝＝0)用于检查CTU的地址是否与分块内给定CTU行的第一个CTU的地址相同。表达式HMVPCandNum＝0用于初始化或重置HMVP列表。当变量FirstCtbInCtuRowInTile设置为真(true)时，将HMVPCandNum设置为0。

编码器20和解码器30等的实施例，以及本文描述的与编码器20和解码器30等有关的功能可以通过硬件、软件、固件或其任意组合来实现。如果以软件来实现，则各种功能可作为一个或多个指令或代码存储在计算机可读介质中或通过通信介质传输，且由基于硬件的处理单元执行。计算机可读介质可以包括与有形介质(如数据存储介质)对应的计算机可读存储介质，或包括任何便于将计算机程序从一处传送到另一处的介质(例如根据通信协议)的通信介质。以此方式，计算机可读介质通常可以对应(1)非瞬时性的有形计算机可读存储介质，或(2)如信号或载波等通信介质。数据存储介质可为可由一或多个计算机或一或多个处理器存取以检索用于实现本申请中描述的技术的指令、代码和/或数据结构的任何可用介质。计算机程序产品可包括计算机可读介质。

作为示例而非限制，这类计算机可读存储介质可以包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储器、磁盘存储器或其它磁性存储设备、闪存或可用于存储指令或数据结构形式的所需程序代码并且可由计算机访问的任何其它介质。此外，任何连接都可以适当地称为计算机可读介质。例如，如果使用同轴缆线、光纤缆线、双绞线、数字订户线(digitalsubscriber line，DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输指令，那么同轴缆线、光纤缆线、双绞线、DSL或例如红外线、无线电和微波等无线技术包含在介质的定义中。然而，应理解，计算机可读存储介质和数据存储介质并不包括连接、载波、信号或其它瞬时性介质，而是针对非瞬时性有形存储介质。本文所使用的磁盘和光盘包括压缩光盘(compact disc，CD)、激光光盘、光学光盘、数字多功能光盘(digitalversatile disc，DVD)、软盘和蓝光光盘，其中磁盘通常以磁性方式再现数据，而光盘利用激光以光学方式再现数据。以上各项的组合也应包括在计算机可读介质的范围内。

可通过如一个或多个数字信号处理器(digital signal processor，DSP)、通用微处理器、专用集成电路(application specific integrated circuit，ASIC)、现场可编程逻辑阵列(field programmable logic array，FPGA)或其它等效集成或离散逻辑电路等一个或多个处理器来执行指令。因此，如本文中所使用的术语“处理器”可指前述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外，在一些方面中，本文描述的各种功能可以提供在用于编码和解码的专用硬件和/或软件模块内，或者并入到组合编解码器中。而且，所述技术可以完全在一个或多个电路或逻辑元件中实现。

本发明的技术可以在多种设备或装置中实现，这些设备或装置包括无线手机、集成电路(integrated circuit，IC)或一组IC(例如芯片组)。本申请中描述各种组件、模块或单元是为了强调用于执行所揭示的技术的装置的功能方面，但未必需要由不同硬件单元实现。实际上，如上所述，各种单元可以结合合适的软件和/或固件组合在编解码器硬件单元中，或者通过互操作硬件单元(包括如上所述的一个或多个处理器)的集合来提供。

本发明包括以下各个方面，其中编号不一定与本申请其他部分中使用的编号一致。

第一方面，一种由解码设备实现的图像译码方法包括：对图像的分块中的当前CTU行对应的基于历史的运动矢量预测(History-based Motion Vector Prediction，HMVP)列表进行初始化(或构建)；根据所述初始化的HMVP列表处理当前CTU行中的CTU。

根据第一方面所述的方法，在第二方面中，当前CTU行对应的所述HMVP列表通过如下方式初始化：重置(或清空)当前CTU行对应的所述HMVP列表；和/或为当前CTU行对应的所述HMVP列表设置默认值；和/或根据译码和/或扫描顺序上的前一个CTU行中的CTU的HMVP列表对当前CTU行对应的所述HMVP列表进行初始化(即，前一个是指译码和/或扫描顺序上的前一个，在一实施例中，所述前一个CTU行可以是在所述译码和/或扫描顺序上与当前CTU行紧邻的前一个CTU行，例如，与所述当前CTU行空间相邻或直接相邻的CTU行)。

根据第一方面或第二方面所述的方法，在第三方面中，所述对当前CTU行对应的HMVP列表进行初始化(例如重置)的操作在分块组(tile group，TG)的起始处执行，在分块的起始处执行，或者在分块中每个CTU行的起始处执行。

根据第一方面至第三方面中任一项所述的方法，在第四方面中，所述对当前CTU行对应的HMVP列表进行初始化(例如重置)的操作是在处理(例如译码)所述当前CTU行中译码和/或扫描顺序上的第一个CTU时(例如之前)执行的，其中，所述当前CTU行中的第一个CTU为或者包括：分块组(tile group，TG)中译码和/或扫描顺序上的第一个CTU；和/或分块中译码和/或扫描顺序上的第一个CTU；和/或CTU行中译码和/或扫描顺序上的第一个CTU。重置分块中第一个CTU(例如每个分块中的第一个CTU)对应的HMVP列表允许并行处理或译码分块。重置CTU行中第一个CTU(例如分块中每个CTU行的第一个CTU)对应的HMVP列表允许并行处理同一分块中独立的CTU行。已经发现，特别是对于较大的CTU，对应每个CTU行的重置对压缩性能的影响可以忽略不计，但是可以减少处理或译码时间。

根据第一方面至第四方面中任一项所述的方法，在第五方面中，所述对当前CTU行对应的HMVP列表进行初始化(例如重置)的操作是在处理(例如译码)各个CTU行中的第一个CTU时(例如之前)，例如，在对译码顺序上的第一个CTU的第一个CTB(例如亮度或色度CTB)的第一个块(例如CB，如第一个叶子节点CB)进行处理或译码之前，针对分块中的每个CTU行执行的。

根据第一方面至第五方面中任一项所述的方法，在第六方面中，所述对当前CTU行对应的HMVP列表进行初始化包括：重置当前CTU行对应的所述HMVP列表，其中，所述重置当前CTU行对应的所述HMVP列表包括：将所述HMVP列表的长度(也可以是长度指示符或长度参数，如HMVPCandNum)置零(例如HMVPCandNum＝0)，以处理(例如译码)所述当前CTU行中译码或扫描顺序上的第一个CTU。通过将所述HMVP列表的长度置零(并且仅逐步扩大所述HMVP列表)来重置所述HMVP列表，与具有全长(即最大长度)HMVP列表的情况相比，可以减少针对待译码块的预测而校验的候选的数量。

根据第六方面所述的方法，在第七方面中，所述重置当前CTU行对应的所述HMVP列表还包括：当使用运动矢量对第一个CTU的块(例如第一个块或连续的块，其中，块可以是CTB或CB，如叶子节点CB)进行译码(即进行帧间译码)时，将所述HMVP列表的长度加1，并将所述运动矢量添加到所述HMVP列表中。

根据第七方面所述的方法，在第八方面中，仅在所述HMVP列表中未包含运动信息(例如，运动信息包括运动矢量或参考图像索引)时才增加所述HMVP列表的长度以及添加所述运动矢量(修剪实施例)。

根据第六方面至第八方面中任一项所述的方法，在第九方面中，仅对所述HMVP列表的长度进行增加操作，直到达到所述HMVP列表的最大长度。

根据第六方面至第九方面中任一项所述的方法，在第十方面中，所述方法还包括：仅根据所述HMVP列表的当前长度考虑减少的HMVP列表候选的数量对所述当前CTU的当前块(例如CTB或CB)进行译码，其中，所述HMVP列表的当前长度小于所述HMVP列表的最大长度(例如，所述减少的HMVP列表候选的数量对应于或等于所述HMVP列表的当前长度)。

根据第二方面至第十方面中任一项所述的方法，在第十一方面中，无论分块的尺寸如何，都针对所述分块中的每个CTU行重置HMVP列表。

根据第二方面至第十方面中任一项所述的方法，在第十二方面中，当分块的尺寸大于(或者大于或等于)阈值尺寸时，针对所述分块中的每个CTU行重置HMVP列表，和/或当分块的尺寸小于(或者小于或等于)所述阈值尺寸时，不针对所述分块中的每个CTU行重置HMVP列表。

根据第二方面至第十二方面中任一项所述的方法，在第十三方面中，所述为当前CTU行对应的所述HMVP列表设置默认值包括：将所述HMVP列表中的MV填充为单向预测方式中的MV，其中，所述单向预测方式中的MV为零运动矢量或非零运动矢量，参考图像包括列表L0中的第一参考图像；和/或将所述HMVP列表中的MV填充为双向预测方式中的MV，其中，所述双向预测方式中的MV为零运动矢量或非零运动矢量，参考图像包括列表L0中的第一参考图像以及列表L1中的第一参考图像。

根据第二方面至第十二方面中任一项所述的方法，在第十四方面中，每个并置图像可存储对应每个CTU行或对应整个图像的时域HMVP列表，所述为当前CTU行对应的所述HMVP列表设置默认值包括：根据所述时域HMVP列表对当前CTU行对应的所述HMVP列表进行初始化。

根据第二方面至第十二方面中任一项所述的方法，在第十五方面中，所述前一个CTU行是与所述当前CTU行紧邻且位于所述当前CTU行上方的CTU行。

根据第十五方面所述的方法，在第十六方面中，所述前一个CTU行中的所述CTU为所述前一个CTU行中的第二个CTU。

根据第十五方面所述的方法，在第十七方面中，所述前一个CTU行中的所述CTU为所述前一个CTU行中的第一个CTU。

第十八方面，一种由编码设备实现的图像编码方法包括：对图像的分块中的当前CTU行对应的HMVP列表进行初始化(或构建)；根据所述构建/初始化的HMVP列表处理当前CTU行中的CTU。

根据第十八方面所述的方法，在第十九方面中，当前CTU行对应的所述HMVP列表通过如下方式初始化：重置(或清空)当前CTU行对应的所述HMVP列表；和/或为当前CTU行对应的所述HMVP列表设置默认值；和/或基于编码和/或扫描顺序上的前一个CTU行中的CTU的HMVP列表对当前CTU行对应的所述HMVP列表进行构建/初始化(即，前一个是指编码和/或扫描顺序上的前一个，在一实施例中，所述前一个CTU行可以是在所述编码和/或扫描顺序上与当前CTU行紧邻的前一个CTU行，例如，与所述当前CTU行空间相邻或直接相邻的CTU行)。

根据第十八方面或第十九方面所述的方法，在第二十方面中，所述对当前CTU行对应的HMVP列表进行初始化(例如重置)的操作在分块组(tile group，TG)的起始处执行，在分块的起始处执行，或者在分块中每个CTU行的起始处执行。

根据第十八方面至第二十方面中任一项所述的方法，在第二十一方面中，所述对当前CTU行对应的HMVP列表进行初始化(例如重置)的操作是在处理(例如编码)所述当前CTU行中编码和/或扫描顺序上的第一个CTU时(例如之前)执行的，其中，所述当前CTU行中的第一个CTU为或者包括：分块组(tile group，TG)中编码和/或扫描顺序上的第一个CTU；和/或分块中编码和/或扫描顺序上的第一个CTU；和/或CTU行中编码和/或扫描顺序上的第一个CTU。

根据第十八方面至第二十一方面中任一项所述的方法，在第二十二方面中，所述对当前CTU行对应的HMVP列表进行初始化(例如重置)的操作是在处理(例如编码)各个CTU行中的第一个CTU时(例如之前)，例如，在对编码顺序上的第一个CTU的第一个CTB(例如亮度或色度CTB)的第一个块(例如CB，如第一个叶子节点CB)进行处理或编码之前，针对分块中的每个CTU行执行的。

根据第十八方面至第二十二方面中任一项所述的方法，在第二十三方面中，所述对当前CTU行对应的HMVP列表进行初始化包括：重置当前CTU行对应的所述HMVP列表，其中，所述重置当前CTU行对应的所述HMVP列表包括：将所述HMVP列表的长度(也可以是长度指示符或长度参数，如HMVPCandNum)置零(例如HMVPCandNum＝0)，以处理(例如编码)所述当前CTU行中编码或扫描顺序上的第一个CTU。

根据第二十三方面所述的方法，在第二十四方面中，所述重置当前CTU行对应的所述HMVP列表还包括：当使用运动矢量对第一个CTU的块(例如第一个块或连续的块，其中，块可以是CTB或CB，如叶子节点CB)进行编码(即进行帧间编码)时，将所述HMVP列表的长度加1，并将所述运动矢量添加到所述HMVP列表中。

根据第二十四方面所述的方法，在第二十五方面中，仅在所述HMVP列表中未包含运动信息(例如，运动信息包括运动矢量或参考图像索引)时才增加所述HMVP列表的长度以及添加所述运动矢量(修剪实施例)。

根据第二十三方面至第二十五方面中任一项所述的方法，在第二十六方面中，仅对所述HMVP列表的长度进行增加操作，直到达到所述HMVP列表的最大长度。

根据第二十三方面至第二十六方面中任一项所述的方法，在第二十七方面中，所述方法还包括：仅根据所述HMVP列表的当前长度考虑减少的HMVP列表候选的数量对所述当前CTU的当前块(例如CTB或CB)进行编码，其中，所述HMVP列表的当前长度小于所述HMVP列表的最大长度(例如，所述减少的HMVP列表候选的数量对应于或等于所述HMVP列表的当前长度)。

根据第十九方面至第二十七方面中任一项所述的方法，在第二十八方面中，无论分块的尺寸如何，都针对所述分块中的每个CTU行重置HMVP列表。

根据第十九方面至第二十七方面中任一项所述的方法，在第二十九方面中，当分块的尺寸大于(或者大于或等于)阈值尺寸时，针对所述分块中的每个CTU行重置HMVP列表，和/或当分块的尺寸小于(或者小于或等于)所述阈值尺寸时，不针对所述分块中的每个CTU行重置HMVP列表。

根据第十九方面至第二十九方面中任一项所述的方法，在第三十方面中，所述为当前CTU行对应的所述HMVP列表设置默认值包括：将所述HMVP列表中的MV填充为单向预测方式中的MV，其中，所述单向预测方式中的MV为零运动矢量或非零运动矢量，参考图像包括列表L0中的第一参考图像；和/或将所述HMVP列表中的MV填充为双向预测方式中的MV，其中，所述双向预测方式中的MV为零运动矢量或非零运动矢量，参考图像包括列表L0中的第一参考图像以及列表L1中的第一参考图像。

根据第十九方面至第二十九方面中任一项所述的方法，在第三十一方面中，每个并置图像可存储对应每个CTU行或对应整个图像的时域HMVP列表，所述为当前CTU行对应的所述HMVP列表设置默认值包括：根据所述时域HMVP列表对当前CTU行对应的所述HMVP列表进行初始化/构建。

根据第十九方面至第二十九方面中任一项所述的方法，在第三十二方面中，所述前一个CTU行是与所述当前CTU行紧邻且位于所述当前CTU行上方的CTU行。

根据第三十二方面所述的方法，在第三十三方面中，所述前一个CTU行中的所述CTU为所述前一个CTU行中的第二个CTU。

根据第三十二方面所述的方法，在第三十四方面中，所述前一个CTU行中的所述CTU为所述前一个CTU行中的第一个CTU。

第三十五方面，一种编码器(20)包括处理电路，用于执行第十九方面至第三十四方面中任一项所述的方法。

第三十六方面，一种解码器(30)包括处理电路，用于执行第一方面至第十七方面中任一项所述的方法。

第三十七方面，一种计算机程序产品包括用于执行第一方面至第三十四方面中任一项所述的方法的程序代码。

第三十八方面，一种解码器包括：一个或多个处理器；非瞬时性计算机可读存储介质，耦合至所述处理器，并存储由所述处理器执行的程序，其中，当所述处理器执行所述程序时，使得所述解码器执行第一方面至第十七方面中任一项所述的方法。

第三十九方面，一种编码器包括：一个或多个处理器；非瞬时性计算机可读存储介质，耦合至所述处理器，并存储由所述处理器执行的程序，其中，当所述处理器执行所述程序时，使得所述编码器执行第十九方面至第三十四方面中任一项所述的方法。

Claims

1.一种由编码设备实现的图像编码方法，其特征在于，包括：

在满足CtbAddrX＝＝CtbToTileColBd[CtbAddrX]条件下，对图像的分块中的当前译码树单元(Coding Tree Unit，CTU)行对应的基于历史的运动矢量预测(History-basedMotion Vector Prediction，HMVP)列表进行初始化，所述初始化是通过将变量NumHmvpCand设置为0来完成；

其中，列表或数组CtbToTileColBd[ctbAddrX]包括从水平CTB地址到以CTB为单位的左分块列边界的地址的转换，ctbAddrX表示水平CTB的索引，NumHmvpCand为所述HMVP列表中有效候选的数量。

2.根据权利要求1所述的方法，其特征在于，所述对当前CTU行对应的HMVP列表进行初始化包括以下步骤：

重置当前CTU行对应的所述HMVP列表；和/或

为当前CTU行对应的所述HMVP列表设置默认值；和/或

基于编码和/或扫描顺序上的前一个CTU行中的CTU的HMVP列表,对当前CTU行对应的所述HMVP列表进行初始化。

3.根据权利要求2所述的方法，其特征在于，所述编码和/或扫描顺序上的前一个CTU行是在所述编码和/或扫描顺序上与当前CTU行紧邻的前一个CTU行。

4.根据权利要求3所述的方法，其特征在于，所述在编码和/或扫描顺序上与当前CTU行紧邻的前一个CTU行是与所述当前CTU行空间相邻或直接相邻的CTU行。

5.根据权利要求1至4中任一项所述的方法，其特征在于，所述对当前CTU行对应的HMVP列表进行初始化的操作在分块组(tile group，TG)的起始处执行，或者在所述分块的起始处执行，或者在所述分块中每个CTU行的起始处执行。

6.根据权利要求1至5中任一项所述的方法，其特征在于，所述对当前CTU行对应的HMVP列表进行初始化的操作，是在处理所述当前CTU行中编码和/或扫描顺序上的第一个CTU之前执行的，其中，所述当前CTU行中的第一个CTU是或者包括：

分块中编码和/或扫描顺序上的第一个CTU；和/或

CTU行中编码和/或扫描顺序上的第一个CTU。

7.根据权利要求1至6中任一项所述的方法，其特征在于，所述对当前CTU行对应的HMVP列表进行初始化包括：重置当前CTU行对应的所述HMVP列表，其中，所述重置当前CTU行对应的所述HMVP列表包括：

8.根据权利要求1至7中任一项所述的方法，其特征在于，所述对当前CTU行对应的HMVP列表进行初始化包括：重置当前CTU行对应的所述HMVP列表，其中，重置分块中第一个CTU对应的HMVP列表允许并行处理或编码分块。

9.根据权利要求8所述的方法，其特征在于，所述对当前CTU行对应的HMVP列表进行初始化包括：重置当前CTU行对应的所述HMVP列表，其中，重置每个分块中第一个CTU对应的HMVP列表允许并行处理或编码分块。

10.根据权利要求1至9中任一项所述的方法，其特征在于，所述对当前CTU行对应的HMVP列表进行初始化的操作，是在处理各个CTU行中的第一个CTU之前针对分块中的每个CTU行执行的。

11.根据权利要求2和权利要求7-9中任一项所述的方法，其特征在于，所述重置当前CTU行对应的所述HMVP列表还包括：

12.根据权利要求11所述的方法，其特征在于，仅在所述HMVP列表中未包含运动信息的情况下，才增加所述HMVP列表的长度以及添加所述运动矢量。

13.根据权利要求12所述的方法，其特征在于，所述运动信息包括运动矢量和参考图像索引中的至少一种。

14.根据权利要求6至13中任一项所述的方法，其特征在于，仅对所述HMVP列表的长度进行增加操作，直到达到所述HMVP列表的最大长度。

15.根据权利要求6至14中任一项所述的方法，其特征在于，所述方法还包括：

16.根据权利要求15所述的方法，其特征在于，所述减少的HMVP列表候选的数量对应于或等于所述HMVP列表的当前长度。

17.根据权利要求2至16中任一项所述的方法，其特征在于，无论分块的尺寸如何，都针对所述分块中的每个CTU行重置HMVP列表。

18.根据权利要求2至17中任一项所述的方法，其特征在于，当分块的尺寸大于或等于阈值尺寸时，针对所述分块中的每个CTU行重置HMVP列表，和/或当分块的尺寸小于所述阈值尺寸时，不针对所述分块中的每个CTU行重置HMVP列表。

19.根据权利要求2至4中任一项所述的方法，其特征在于，所述为当前CTU行对应的所述HMVP列表设置默认值包括：

参考图像包括列表0(list 0，L0)中的第一参考图像；和/或

将所述HMVP列表中的MV填充为双向预测方式中的MV，其中，所述双向预测方式中的MV为零运动矢量或非零运动矢量，参考图像包括列表L0中的第一参考图像以及列表1(list1，L1)中的第一参考图像。

20.根据权利要求2和权利要求19中任一项所述的方法，其特征在于，每个并置图像存储对应每个CTU行或对应整个图像的时域HMVP列表，所述为当前CTU行对应的所述HMVP列表设置默认值包括：

21.根据权利要求2至4中任一项所述的方法，其特征在于，所述前一个CTU行是与所述当前CTU行紧邻且位于所述当前CTU行上方的CTU行；

22.根据权利要求1至21中任一项所述的方法，其特征在于，CTU行中的CTU具有对应的地址，通过以下表达式判断地址j相对于当前分块的模运算是否产生0来识别CTU行中的第一个CTU的地址：

if(j％ColWidth[tileIdx]＝＝0),

23.根据权利要求1至21中任一项所述的方法，其特征在于，CTU行中的CTU具有对应的地址，通过判断所述当前CTU的地址与列表或数组中的CTU的地址是否相同来识别分块中的每个CTU行中的第一个CTU的地址，从而推导出分块中的每个CTU行中的第一个CTU，其中，所述列表或数组存储以CTB为单位的左分块列边界的地址。

24.根据权利要求23所述的方法，其特征在于，通过以下表达式判断所述当前CTU的地址与所述列表中的CTU的地址是否相同，其中，所述列表存储以CTB为单位的所述左分块列边界的地址：

if(CtbAddrX＝＝CtbToTileColBd[CtbAddrX]),

25.一种由解码设备实现的图像译码方法，其特征在于，包括：

在满足CtbAddrX＝＝CtbToTileColBd[CtbAddrX])条件下，对图像的分块中的当前译码树单元(Coding Tree Unit，CTU)行对应的基于历史的运动矢量预测(History-basedMotion Vector Prediction，HMVP)列表进行初始化，所述初始化是通过将变量NumHmvpCand设置为0来完成；

其中，列表或数组CtbToTileColBd[ctbAddrX]包括从水平CTB地址到以CTB为单位的左分块列边界的地址的转换，ctbAddrX表示水平CTB的索引，NumHmvpCand为所述HMVP列表中有效候选的数量；

根据所述初始化的HMVP列表处理当前CTU行中的CTU。

26.根据权利要求25所述的方法，其特征在于，所述对当前CTU行对应的HMVP列表进行初始化包括以下步骤：

重置当前CTU行对应的所述HMVP列表；和/或

为当前CTU行对应的所述HMVP列表设置默认值；和/或

根据译码和/或扫描顺序上的前一个CTU行中的CTU的HMVP列表,对当前CTU行对应的所述HMVP列表进行初始化。

27.根据权利要求26所述的方法，其特征在于，所述译码和/或扫描顺序上的前一个CTU行是在所述译码和/或扫描顺序上与当前CTU行紧邻的前一个CTU行。

28.根据权利要求27所述的方法，其特征在于，所述在译码和/或扫描顺序上与当前CTU行紧邻的前一个CTU行是与所述当前CTU行空间相邻或直接相邻的CTU行。

29.根据权利要求25至28中任一项所述的方法，其特征在于，所述对当前CTU行对应的HMVP列表进行初始化的操作在分块组(tile group，TG)的起始处执行，或在所述分块的起始处执行，或者在所述分块中每个CTU行的起始处执行。

30.根据权利要求25至29中任一项所述的方法，其特征在于，所述对当前CTU行对应的HMVP列表进行初始化的操作是在处理所述当前CTU行中译码和/或扫描顺序上的第一个CTU之前执行的，其中，所述当前CTU行中的第一个CTU是或者包括：

分块组(tile group，TG)中译码和/或扫描顺序上的第一个CTU；和/或

分块中译码和/或扫描顺序上的第一个CTU；和/或

CTU行中译码和/或扫描顺序上的第一个CTU。

31.根据上述权利要求中任一项所述的方法，其特征在于，所述对当前CTU行对应的HMVP列表进行初始化包括：重置当前CTU行对应的所述HMVP列表，其中，所述重置当前CTU行对应的所述HMVP列表包括：

将所述HMVP列表的长度置零，以处理所述当前CTU行中译码或扫描顺序上的第一个CTU。

32.根据上述权利要求中任一项所述的方法，其特征在于，所述对当前CTU行对应的HMVP列表进行初始化包括：重置当前CTU行对应的所述HMVP列表，其中，重置分块中第一个CTU对应的HMVP列表允许并行处理或译码分块。

33.根据权利要求32所述的方法，其特征在于，所述对当前CTU行对应的HMVP列表进行初始化包括：重置当前CTU行对应的所述HMVP列表，其中，重置每个分块中第一个CTU对应的HMVP列表允许并行处理或译码分块。

34.根据权利要求25至33中任一项所述的方法，其特征在于，所述对当前CTU行对应的HMVP列表进行初始化的操作是在处理各个CTU行中的第一个CTU之前，针对分块中的每个CTU行执行的。

35.根据权利要求26所述的方法，其特征在于，所述重置当前CTU行对应的所述HMVP列表还包括：

当使用运动矢量对第一个CTU的块进行译码，即进行帧间译码时，将所述HMVP列表的长度加1，并将所述运动矢量添加到所述HMVP列表中。

36.根据权利要求35所述的方法，其特征在于，仅在所述HMVP列表中未包含运动信息的情况下，才增加所述HMVP列表的长度以及添加所述运动矢量。

37.根据权利要求36所述的方法，其特征在于，所述运动信息包括运动矢量和参考图像索引中的至少一种。

38.根据权利要求31至37中任一项所述的方法，其特征在于，仅对所述HMVP列表的长度进行增加操作，直到达到所述HMVP列表的最大长度。

39.根据权利要求31至38中任一项所述的方法，其特征在于，所述方法还包括：

仅根据所述HMVP列表的当前长度考虑减少的HMVP列表候选的数量，对所述当前CTU的当前块进行译码，其中，所述HMVP列表的当前长度小于所述HMVP列表的最大长度。

40.根据权利要求39所述的方法，其特征在于，所述减少的HMVP列表候选的数量对应于或等于所述HMVP列表的当前长度。

41.根据权利要求26至40中任一项所述的方法，其特征在于，无论分块的尺寸如何，都针对所述分块中的每个CTU行重置HMVP列表。

42.根据权利要求26至41中任一项所述的方法，其特征在于，当分块的尺寸大于或等于阈值尺寸时，针对所述分块中的每个CTU行重置HMVP列表，和/或当分块的尺寸小于所述阈值尺寸时，不针对所述分块中的每个CTU行重置HMVP列表。

43.根据权利要求26所述的方法，其特征在于，所述为当前CTU行对应的所述HMVP列表设置默认值包括：

参考图像包括列表0(list 0，L0)中的第一参考图像；和/或

44.根据权利要求26和权利要求43中任一项所述的方法，其特征在于，每个并置图像存储对应每个CTU行或对应整个图像的时域HMVP列表，所述为当前CTU行对应的所述HMVP列表设置默认值包括：

45.根据权利要求26至28中任一项所述的方法，其特征在于，所述前一个CTU行是与所述当前CTU行紧邻，且位于所述当前CTU行上方的CTU行；

46.根据权利要求26至45中任一项所述的方法，其特征在于，CTU行中的CTU具有对应的地址，通过以下表达式确定分块中的CTU行中的第一个CTB，来识别所述CTU行中的第一个CTU的地址：

FirstCtbInCtuRowInTile＝((ctbAddrInTs-FirstCtbAddrTs[tileIdx]–

NumCtusInTile[tileIdx])％ColWidth[tileIdx]＝＝0)？1:0,

If((tile_group_type！＝I)&&(FirstCtbInCtuRowInTile))

HMVPCandNum＝0

其中，FirstCtbInCtuRowInTile表示分块中的CTU行中的第一个CTU，ctbAddrInTs表示分块中的CTB的地址，FirstCtbAddrTs表示分块中的CTB的第一地址，tileIdx表示各个分块的索引，NumCtusInTile表示分块中的CTU的数量，ColWidth表示所述分块相对于CTU数量的宽度，“％”是模运算符，tile_group_type表示分块组的类型，NumHmvpCand为所述HMVP列表中有效候选的数量。

47.根据权利要求26至46中任一项所述的方法，其特征在于，CTU行中的CTU具有对应的地址，通过以下表达式判断地址j相对于当前分块的模运算是否产生0,来识别CTU行中的第一个CTU的地址：

if(j％ColWidth[tileIdx]＝＝0),

48.根据权利要求26至45中任一项所述的方法，其特征在于，CTU行中的CTU具有对应的地址，通过判断所述当前CTU的地址与列表或数组中的CTU的地址是否相同,来识别分块中的每个CTU行中的第一个CTU的地址，从而推导出分块中的每个CTU行中的第一个CTU，其中，所述列表或数组存储以CTB为单位的左分块列边界的地址。

49.根据权利要求48所述的方法，其特征在于，通过以下表达式判断所述当前CTU的地址与所述列表中的CTU的地址是否相同，其中，所述列表存储以CTB为单位的所述左分块列边界的地址：

if(CtbAddrX＝＝CtbToTileColBd[CtbAddrX]),

50.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有由一个或多个处理器执行的如权利要求1至49中的任一项所述方法得到的视频码流。

51.一种编码器(20)，其特征在于，包括处理电路，用于执行根据权利要求1至24中任一项所述的方法。

52.一种解码器(30)，其特征在于，包括处理电路，用于执行根据权利要求25至49中任一项所述的方法。

53.一种存储程序的计算机可读非瞬时性介质，其特征在于，所述计算机可读非瞬时性介质包括指令；当所述指令在处理器上执行时，所述处理器执行根据权利要求1至49中任一项所述的方法。

54.一种编码器，其特征在于，包括：

一个或多个处理器；

非瞬时性计算机可读存储介质，耦合至所述处理器，并存储由所述处理器执行的程序，其中，当所述处理器执行所述程序时，使得所述编码器执行根据权利要求1至24中任一项所述的方法。

55.一种解码器，其特征在于，包括：

一个或多个处理器；

非瞬时性计算机可读存储介质，耦合至所述处理器，并存储由所述处理器执行的程序，其中，当所述处理器执行所述程序时，使得所述解码器执行根据权利要求25至49中任一项所述的方法。