CN115699736A

CN115699736A - 具有运动矢量细化的几何分区模式

Info

Publication number: CN115699736A
Application number: CN202180039047.7A
Authority: CN
Inventors: 修晓宇; 陈伟; 郭哲玮; 陈漪纹; 马宗全; 朱弘正; 王祥林; 于冰
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2020-06-03
Filing date: 2021-06-03
Publication date: 2023-02-03
Also published as: WO2021247906A1; EP4162682A1; US20230115074A1; EP4162682A4

Abstract

提供了用于以几何分区模式(GPM)解码视频块的方法、装置和非暂时性计算机可读存储介质。该方法可以包括将视频块分区为第一几何分区和第二几何分区。该方法可以包括针对第一几何分区获得第一运动矢量细化(MVR)。该方法可以包括针对第二几何分区获得第二MVR。该方法可以包括获得包括多个运动矢量(MV)的候选列表。该方法可以包括针对第一几何分区从候选列表中获得第一MV。该方法可以包括针对第二几何分区从候选列表中获得第二MV。该方法可以包括针对第一几何分区通过将第一MV与第一MVR相加来计算第三MV。该方法可以包括计算第四MV。该方法可以包括获得预测样本。

Description

具有运动矢量细化的几何分区模式

相关申请的交叉引用

本申请基于2020年6月3日提交的临时申请第63/034,365号并要求享有其优先权，该临时申请的公开内容以引用的方式整体并入本文以用于所有目的。

技术领域

本公开涉及视频编解码和压缩。更具体地，本公开涉及用于改进几何分区(GPM)模式(也称为角加权预测(AWP)模式)的编解码效率的方法和装置。

背景技术

可以使用各种视频编解码技术来压缩视频数据。根据一种或多种视频编解码标准执行视频编解码。例如，现在一些公知的视频编解码标准包括通用视频编解码(VVC)、高效视频编解码(HEVC，也称为H.265或MPEG-H Part2)以及高级视频编解码(AVC，也称为H.264或MPEG-4Part 10)，其由ISO/IEC MPEG和ITU-T VECG联合开发。AOMedia Video 1(AV1)由开放媒体联盟(AOM)开发，作为其先前标准VP9的后继。音视频编解码(AVS)(其指代数字音频和数字视频压缩标准)是由中国音视频编解码标准工作组开发的又一视频压缩标准系列。大多数现有的视频编解码标准都建立在著名的混合视频编解码框架之上，即，使用基于块的预测方法(例如，帧间预测、帧内预测)来减少视频图像或序列中存在的冗余，并且使用变换编解码来压缩预测误差的能量。视频编解码技术的重要目标是将视频数据压缩成使用较低比特率的形式，同时避免或最小化视频质量的下降。

发明内容

本公开的示例提供了用于视频编解码的方法和装置以及非暂时性计算机可读存储介质。

根据本公开的第一方面，提供了一种以几何分区模式(GPM)解码视频块的方法。该方法可以包括：将视频块分区为第一几何分区和第二几何分区。该方法可以包括针对第一几何分区获得第一运动矢量细化(MVR)。该方法可以包括针对第二几何分区获得第二MVR。该方法可以包括获得包括多个运动矢量(MV)的候选列表。该方法可以包括针对第一几何分区从候选列表中获得第一MV。该方法可以包括针对第二几何分区从候选列表中获得第二MV。该方法可以包括针对第一几何分区通过将第一MV与第一MVR相加来计算第三MV。该方法可以包括针对第二几何分区通过将第二MV与第二MVR相加来计算第四MV。该方法可以包括基于第三MV和第四MV来获得第一几何分区和第二几何分区的预测样本。

根据本公开的第二方面，提供了一种以GPM编码视频块的方法。该方法可以包括将视频块划分为第一几何分区和第二几何分区。该方法可以包括获得针对第一几何分区的第一MV和针对第二几何分区的第二MV。该方法可以包括获得包括用于视频块的多个MV的候选列表。该方法可以包括针对第一几何分区从候选列表中选择第三MV。该方法可以包括针对第二几何分区从候选列表中选择第四MV。该方法可以包括针对第一几何分区通过从第一MV减去第三MV来计算第一MVR。该方法可以包括针对第二几何分区通过从第二MV减去第四MV来计算第二MVR。该方法可以包括基于第一MV和第二MV来获得第一几何分区和第二几何分区的预测样本。

根据本公开的第三方面，提供了一种用于视频编解码的装置。该装置可以包括一个或多个处理器以及非暂时性计算机可读存储介质。该非暂时性计算机可读存储介质被配置为存储可由一个或多个处理器执行的指令。一个或多个处理器在执行指令时被配置为执行第一方面或第二方面的方法。

根据本公开的第四方面，提供了一种非暂时性计算机可读存储介质。该非暂时性计算机可读存储介质可以存储计算机可执行指令，该指令在由一个或多个计算机处理器执行时，使一个或多个计算机处理器执行第一方面或第二方面的方法。

附图说明

并入本说明书并构成其一部分的附图示出了与本公开一致的示例，并且与描述一起用于解释本公开的原理。

图1是根据本公开的示例的编码器的框图。

图2是根据本公开的示例的解码器的框图。

图3A是示出根据本公开的示例的多类型树结构中的块分区的图。

图3B是示出根据本公开的示例的多类型树结构中的块分区的图。

图3C是示出根据本公开的示例的多类型树结构中的块分区的图。

图3D是示出根据本公开的示例的多类型树结构中的块分区的图。

图3E是示出根据本公开的示例的多类型树结构中的块分区的图。

图4是根据本公开的示例的所允许的几何分区(GPM)分区的示图。

图5是示出根据本公开的示例的单向预测运动矢量选择的表。

图6A是根据本公开的示例的运动矢量差(MMVD)模式的示图。

图6B是根据本公开的示例的MMVD模式的示图。

图7是根据本公开的示例的以几何分区模式(GPM)解码视频块的方法。

图8是根据本公开的示例的以GPM编码视频块的方法。

图9是示出根据本公开的示例的与用户接口耦合的计算环境的图。

具体实施方式

现在将详细参考实施例，其示例在附图中示出。以下描述参考附图，其中除非另有说明，否则不同附图中相同的数字表示相同或相似的元件。以下实施例的描述中阐述的实现方式并不代表与本公开一致的所有实现方式。相反，它们仅仅是与如所附权利要求中叙述的本公开相关的方面一致的装置和方法的示例。

本公开中使用的术语仅用于描述特定实施例的目的，并不旨在限制本公开。如在本公开和所附权利要求中使用的，除非上下文另有明确指示，否则单数形式“一(a)”、“一个(an)”和“该(the)”旨在也包括复数形式。还应理解，本文使用的术语“和/或”旨在表示并包括关联列出项目中的一个或多个的任何或所有可能的组合。

应当理解，尽管在本文中可以使用术语“第一”、“第二”、“第三”等来描述各种信息，但是该信息不应受这些术语的限制。这些术语仅用于将一类信息与另一类信息区分开来。例如，在不脱离本公开的范围的情况下，第一信息可以称为第二信息；类似地，第二信息也可以称为第一信息。如本文所使用的，根据上下文，术语“如果”可以理解为表示“当……时(when)”、或“在……后(upon)”、或“响应于判断”。

第一代AVS标准包括中国国家标准《信息技术，高级音频视频编解码，第2部分：视频》(称为AVS1)和《信息技术，高级音频视频编解码，第16部分：无线电视视频》(称为AVS+)。与MPEG-2标准相比，它可以在相同的感知质量下节省大约50％的比特率。AVS1标准视频部分于2006年2月作为中国国家标准颁布。第二代AVS标准包括中国国家标准《信息技术，高效多媒体编解码》(称为AVS2)系列，其主要针对传输额外的HD TV节目。AVS2的编解码效率是AVS+的编解码效率的两倍。在2016年5月，AVS2作为中国国家标准发布。同时，AVS2标准视频部分由电气和电子工程师协会(IEEE)提交，作为一项国际应用标准。AVS3标准是针对UHD视频应用的新一代视频编解码标准，其旨在超越最新国际标准HEVC的编解码效率。在2019年3月，在第68次AVS会议上，完成了AVS3-P2基线，其与HEVC标准相比提供了大约30％的比特率节省。目前，存在一个称为高性能模型(HPM)的参考软件，其由AVS小组维护，用于演示AVS3标准的参考实现方式。

与HEVC一样，AVS3标准建立在基于块的混合视频编解码框架之上。

图1示出了用于VVC的基于块的视频编码器的总体图。具体地，图1示出了典型的编码器100。编码器100具有视频输入110、运动补偿112、运动估计114、帧内/帧间模式决策116、块预测值140、加法器128、变换130、量化132、预测相关信息142、帧内预测118、图片缓冲器120、逆量化134、逆变换136、加法器126、存储器124、环路滤波器122、熵编码138和比特流144。

在编码器100中，视频帧被分区成多个视频块以用于处理。对于每个给定视频块，基于帧间预测方法或帧内预测方法形成预测。

预测残差从加法器128发送到变换130，预测残差表示当前视频块(视频输入110的一部分)与其预测值(块预测值140的一部分)之间的差。然后变换系数从变换130发送到量化132以用于熵减少。然后将量化系数馈送到熵编码138以生成压缩的视频比特流。如图1所示，来自帧内/帧间模式决策116的预测相关信息142(例如，视频块分区信息、运动矢量(MV)、参考图片索引和帧内预测模式)也通过熵编码138被馈送并保存到已压缩比特流144中。已压缩比特流144包括视频比特流。

在编码器100中，还需要与解码器相关的电路以便重建像素以用于预测。首先，通过逆量化134和逆变换136重建预测残差。该重建的预测残差与块预测值140组合以生成当前视频块的未滤波的重建像素。

空间预测(或“帧内预测”)使用来自与当前视频块相同的视频帧中的已经编码的相邻块(称为参考样本)的样本的像素来预测当前视频块。

时间预测(也称为“帧间预测”)使用来自已编码的视频图片的重建像素来预测当前视频块。时间预测减少了视频信号中固有的时间冗余。给定编码单元(CU)或编码块的时间预测信号通常由一个或多个MV用信号通知，这些MV指示当前CU与其时间参考之间的运动的量和方向。此外，如果支持多个参考图片，则附加地发送一个参考图片索引，其用于标识时间预测信号来自参考图片存储库中的哪个参考图片。

运动估计114接收视频输入110和来自图片缓冲器120的信号，并且将运动估计信号输出到运动补偿112。运动补偿112接收视频输入110、来自图片缓冲器120的信号以及来自运动估计114的运动估计信号，并且将运动补偿信号输出到帧内/帧间模式决策116。

在执行空间和/或时间预测之后，编码器100中的帧内/帧间模式决策116例如基于率失真优化方法选择最佳预测模式。然后从当前视频块中减去块预测值140，并且使用变换130和量化132将得到的预测残差去相关。得到的量化残差系数由逆量化134进行逆量化并由逆变换136进行逆变换，以形成重建残差，然后将重建残差加回预测块以形成CU的重建信号。此外，在重建CU被放入图片缓冲器120的参考图片存储库并用于对未来的视频块进行编码之前，可以将环路滤波122(例如，去块滤波器、样本自适应偏移(SAO)和/或自适应环路滤波器(ALF))应用于重建CU。为了形成输出视频比特流144，编码模式(帧间或帧内)、预测模式信息、运动信息和量化残差系数都被发送到熵编码单元138以被进一步压缩和打包以形成比特流。

图1给出了通用的基于块的混合视频编码系统的框图。输入视频信号被逐块(称为编码单元(CU))处理。与仅基于四叉树对块进行分区的HEVC不同，在AVS3中，将一个编码树单元(CTU)分割为CU，以适应基于四叉树/二叉树/扩展四叉树的不同局部特性。此外，去除了HEVC中多分区单元类型的概念，即，AVS3中不存在CU、预测单元(PU)和变换单元(TU)的分离；相反，每个CU始终用作预测和变换的基本单元，而无需进一步分区。在AVS3的树分区结构中，首先基于四叉树结构对一个CTU进行分区。然后，可以基于二叉树和扩展四叉树结构进一步对每个四叉树叶节点进行分区。

如图3A、图3B、图3C、图3D和图3E中所示，存在五种分割类型，四元分区、水平二元分区、垂直二元分区、水平扩展四叉树分区和垂直扩展四叉树分区。

图3A示出了图示根据本公开的多类型树结构中的块四元分区的图。

图3B示出了图示根据本公开的多类型树结构中的块垂直二元分区的图。

图3C示出了图示根据本公开的多类型树结构中的块水平二元分区的图。

图3D示出了图示根据本公开的多类型树结构中的块垂直三元分区的图。

图3E示出了图示根据本公开的多类型树结构中的块水平三元分区的图。

在图1中，可以执行空间预测和/或时间预测。空间预测(或“帧内预测”)使用来自同一视频图片/条带中的已经编码的相邻块的样本(称为参考样本)的像素来预测当前视频块。空间预测减少了视频信号中固有的空间冗余。时间预测(也称为“帧间预测”或“运动补偿预测”)使用来自已经编码的视频图片的重建像素来预测当前视频块。时间预测减少了视频信号中固有的时间冗余。给定CU的时间预测信号通常由一个或多个运动矢量(MV)表示，MV指示当前CU与其时间参考之间的运动的量和方向。此外，如果支持多个参考图片，则附加地发送一个参考图片索引，其用于标识时间预测信号来自参考图片存储库中的哪个参考图片。在空间和/或时间预测之后，编码器中的模式决策块选择最佳预测模式，例如，基于率失真优化方法。然后从当前视频块中减去预测块；并且对预测残差使用变换进行去相关并且然后进行量化。对量化残差系数进行逆量化和逆变换，以形成重建残差，然后将重建残差加回预测块，以形成CU的重建信号。此外，在将重建CU放入参考图片存储库中并用作对未来的视频块进行编码的参考之前，可以将环路滤波(例如，去块滤波器、样本自适应偏移(SAO)和自适应环路滤波器(ALF))应用于重建CU。为了形成输出视频比特流，编码模式(帧间或帧内)、预测模式信息、运动信息和量化残差系数都被送到熵编码单元以被进一步压缩和打包。

图2示出了用于VVC的视频解码器的总体框图。具体地，图2示出了典型的解码器200框图。解码器200具有比特流210、熵解码212、逆量化214、逆变换216、加法器218、帧内/帧间模式选择220、帧内预测222、存储器230、环路滤波器228、运动补偿224、图片缓冲器226、预测相关信息234和视频输出232。

解码器200类似于位于图1的编码器100中的重建相关部分。在解码器200中，传入的视频比特流210首先通过熵解码212进行解码，以导出量化系数水平和预测相关信息。然后通过逆量化214和逆变换216处理量化系数水平以获得重建预测残差。在帧内/帧间模式选择器220中实现的块预测值机制被配置为基于已解码预测信息来执行帧内预测222或运动补偿224。通过使用求和器218将来自逆变换216的重建预测残差与块预测值机制生成的预测输出相加来获得一组未滤波的重建像素。

重建块在被存储在用作参考图片存储库的图片缓冲器226中之前可以进一步经过环路滤波器228。图片缓冲器226中的重建视频可以被发送以驱动显示设备，以及用于预测未来的视频块。在环路滤波器228开启的情况下，对这些重建像素执行滤波操作以导出最终的重建视频输出232。

图2给出了基于块的视频解码器的总体框图。视频比特流首先在熵解码单元处进行熵解码。编码模式和预测信息被发送到空间预测单元(如果是帧内编码)或时间预测单元(如果是帧间编码)以形成预测块。残差变换系数被发送到逆量化单元和逆变换单元以重建残差块。然后将预测块和残差块相加。重建块在被存储在参考图片存储库中之前可以进一步经过环路滤波。然后将参考图片存储库中的重建视频发送出去以用于显示，并且用于预测未来的视频块。

本公开的关注点是改进在VVC和AVS3标准中使用的几何分区模式(GPM)的编解码性能。在AVS3中，该工具也称为角加权预测(AWP)，其遵循GPM的相同设计思想，但在某些设计细节上存在一些细微差别。为了便于描述本公开，以下以VVC标准中的现有GPM设计为例，来解释GPM/AWP工具的主要方面。同时，还简要回顾了在VVC和AVS3标准中应用的另一种现有的帧间预测技术，称为具有运动矢量差的合并模式(MMVD)，因为它与本公开中提出的技术密切相关。之后，识别出当前GPM/AWP设计的一些缺点。最后，详细介绍了所提出的方法。请注意，虽然在整个公开中将VVC标准中现有的GPM设计用作示例，但是对于现代视频编解码技术领域的技术人员来说，所提出的技术也可以应用于其他GPM/AWP设计或具有相同或类似设计思想的其他编解码工具。

几何分区模式(GPM)

在VVC中，支持几何分区模式用于帧间预测。几何分区模式由一个CU级标志作为一种特殊的合并模式而用信号通知。在当前的GPM设计中，GPM模式对每个可能的CU大小总共支持64个分区，其中宽度和高度均不小于8且不大于64，不包括8x64和64x8。

当使用该模式时，CU被几何定位的直线分割成两部分，如图4所示(下面提供的描述)。分割线的位置在数学上是从特定分区的角度和偏移参数导出的。CU中几何分区的每个部分使用它自己的运动进行帧间预测；每个分区只允许单向预测，即，每个部分具有一个运动矢量和一个参考索引。应用单向预测运动约束以确保与传统的双向预测一样，每个CU只需要两次运动补偿预测。如果几何分区模式用于当前CU，则指示几何分区的分区模式(角度和偏移)的几何分区索引和两个合并索引(每个分区一个)被进一步用信号通知。最大GPM候选大小的数目在序列级别上显式地用信号通知。

图4示出了所允许的GPM分区，其中每个图片中的分割具有一个相同的分割方向。

单向预测候选列表构建

为了导出针对一个几何分区的单向预测运动矢量，首先直接从常规合并候选列表生成过程中导出一个单向预测候选列表。将n表示为几何单向预测候选列表中单向预测运动的索引。第n个合并候选的LX运动矢量(其中X等于n的奇偶性)用作几何分区模式的第n个单向预测运动矢量。

这些运动矢量在图5中用“x”标记(如下所述)。在不存在n-扩展合并候选的对应LX运动矢量的情况下，相同候选的L(1-X)运动矢量被替代地用作几何分区模式的单向预测运动矢量。

图5示出了从用于GPM的合并候选列表的运动矢量的单向预测运动矢量选择。

沿几何分区边缘混合

在使用其自己的运动获得每个几何分区之后，将混合应用于两个单向预测信号以导出几何分区边缘周围的样本。CU的每个位置的混合权重是基于从每个单独样本位置到对应分区边缘的距离导出的。

GPM信令设计

根据当前的GPM设计，GPM的使用通过在CU级别用信号通知一个标志来指示。该标志仅在当前CU是通过合并模式或跳过模式编码时才用信号通知。具体地，当标志等于1时，指示当前CU是通过GPM预测的。否则(标志等于0)，CU是通过另一种合并模式编码的，该另一种合并模式例如为常规合并模式、具有运动矢量差的合并模式、组合的帧间和帧内预测等。当针对当前CU启用GPM时，一个语法元素(即，merge_gpm_partition_idx)被进一步用信号通知以指示所应用的几何分区模式(它指定直线的方向和从CU中心的偏移，该直线将CU分割成两个分区，如图4所示)。之后，用信号通知两个语法元素merge_gpm_idx0和merge_gpm_idx1以指示用于第一GPM分区和第二GPM分区的单向预测合并候选的索引。更具体地，这两个语法元素用于从单向预测合并列表中确定两个GPM分区的单向MV，如“单向预测合并列表构建”部分所描述的。根据当前的GPM设计，为了让两个单向MV更加不同，两个索引不能相同。基于这样的先验知识，第一GPM分区的单向预测合并索引被首先用信号通知并用作预测值，以减少第二GPM分区的单向预测合并索引的信令开销。具体而言，如果第二单向预测合并索引小于第一单向预测合并索引，则直接用信号通知其原始值。否则(第二单向预测合并索引大于第一单向预测合并索引)，其值在被用信号通知给比特流之前减一。在解码器侧，第一单向预测合并索引首先是解码器。然后，对于第二单向预测合并索引的解码，如果解析值小于第一单向预测合并索引，则设置第二单向预测合并索引等于解析值；否则(解析值等于或大于第一单向预测合并索引)，设置第二单向预测合并索引等于解析值加一。表1说明了当前VVC规范中用于GPM模式的现有语法元素。

表1VVC规范的合并数据语法表中现有的GPM语法元素

另一方面，在当前的GPM设计中，截断的一元码用于两个单向预测合并索引(即，merge_gpm_idx0和merge_gpm_idx1)的二值化。此外，由于两个单向预测合并索引不能相同，因此使用不同的最大值来截断两个单向预测合并索引的码字，它们针对merge_gpm_idx0和merge_gpm_idx1分别被设置为等于MaxGPMMergeCand-1和MaxGPMMergeCand-2。MaxGPMMergeCand是单向预测合并列表中候选的数量。

当应用GPM/AWP模式时，应用两种不同的二值化方法来将语法merge_gpm_partition_idx转换成二进制比特串。具体地，语法元素分别通过VVC和AVS3标准中的固定长度码和截断二进制码进行二值化。同时，对于AVS3中的AWP模式，不同的最大值用于语法元素值的二值化。具体地，在AVS3中，所允许的GPM/AWP分区模式的数量为56(即，merge_gpm_partition_idx的最大值为55)，而在VVC中该数量增加到64(即，merge_gpm_partition_idx的最大值为63)。

具有运动矢量差的合并模式(MMVD)

除了从一个当前块的空间/时间邻居导出该当前块的运动信息的传统合并模式之外，MMVD/UMVE模式作为一种特殊的合并模式被引入VVC和AVS标准中。具体地，在VVC和AVS3两者中，模式通过一个MMVD标志在编码块级别用信号通知。在MMVD模式中，用于常规合并模式的合并列表中的前两个候选被选为用于MMVD的两个基本合并候选。在一个基本合并候选被选择并用信号通知之后，附加语法元素被用信号通知以指示被添加到所选合并候选的运动的运动矢量差(MVD)。MMVD语法元素包括用于选择基本合并候选的合并候选标志、用于指定MVD幅值的距离索引和用于指示MVD方向的方向索引。

在现有的MMVD设计中，距离索引指定MVD幅值，其基于一组预先定义的距起点的偏移来定义。如图6A和图6B所示，偏移被添加到起始MV(即，所选基本合并候选的MV)的水平或垂直分量。

图6A示出了用于L0参考的MMVD模式。图6B示出了用于L1参考的MMVD模式。

表2分别说明了在AVS3中应用的MVD偏移。

表2AVS3中使用的MVD偏移

距离IDX	0	1	2	3	4
						偏移(以亮度样本为单位)	1/4	1/2	1	2	4

如表3中所示，方向索引用于指定用信号通知的MVD的符号。注意，MVD符号的含义可能根据起始MV而有所不同。当起始MV是单向预测MV或如下的双向预测MV时：其中MV指向POC均大于当前图片的POC或均小于当前图片的POC的两个参考图片；用信号通知的符号是加到起始MV的MVD的符号。当起始MV是如下的双向预测MV时：指向其中一个图片的POC大于当前图片，而另一图片的POC小于当前图片的两个参考图片；用信号通知的符号被应用于L0MVD，并且用信号通知的符号的相反值被应用于L1 MVD。

表3方向索引指定的MVD符号

方向IDX	00	01	10	11
					x轴	+	–	N/A	N/A
y轴	N/A	N/A	+	–

对几何分区模式(GPM)的改进

如介绍中所提及的，用于生成两个GPM分区的预测样本的单向运动直接从常规合并候选中获得。在空间/时间相邻块的MV之间不存在强相关性的情况下，从合并候选导出的单向MV可能不够准确，无法捕获每个GPM分区的真实运动。运动估计能够提供更准确的运动，但是其以由于可以在现有单向MV之上应用任意运动细化而导致的不可忽略的信令开销为代价。另一方面，MVMD模式在VVC和AVS3标准中都被使用，这已被证明是一种高效的信令机制来减少MVD信令开销。因此，组合GPM与MMVD模式也可能是有益的。这种组合可以通过提供更准确的MV以捕获每个GPM分区的单独运动，来潜在地提高GPM工具的整体编解码效率。

提出的方法

在本公开中，提出了通过在应用于每个GPM分区的现有单向MV之上应用进一步运动细化来进一步提高GPM的编解码效率的方法。所提出的方法被命名为具有运动矢量细化的几何分区模式(GPM-MVR)。此外，在所提出的方案中，运动细化以一种与现有MMVD设计类似的方式用信号通知，即，基于运动细化的一组预先定义的MVD幅值和方向。

具有单独运动矢量细化的几何分区模式

为了提高GPM的编解码效率，在本部分中，提出了一种改进的具有单独运动矢量细化的几何分区模式。具体地，给定GPM分区，所提出的方法首先使用现有的语法merge_gpm_idx0和merge_gpm_idx1从现有的单向预测合并候选列表中识别两个GPM分区的单向MV，并将它们用作基本MV。在确定了两个基本MV之后，引入了两组新的语法元素来指定单独地应用于两个GPM分区的基本MV之上的运动细化的值。具体地，两个标志(即，gpm_mvr_partIdx0_enable_flag和gpm_mvr_partIdx1_enable_flag)被首先用信号通知以分别指示GPM-MVR是否应用于第一GPM分区和第二GPM分区。当一个GPM分区的标志等于1时，被应用于分区的基本MV的MVR的对应值以MMVD样式用信号通知，即，一个距离索引(如语法元素gpm_mvr_partIdx0_distance_idx和gpm_mvr_partIdx1_distance_idx所指示的)来指定MVR的幅值，以及一个方向索引(如语法元素gpm_mvr_partIdx0_direction_idx和gpm_mvr_partIdx1_distance_idx所指示的)来指定MVR的方向。表4说明了由提出的GPM-MVR方法引入的语法元素。

表4提出的GPM-MVR方法的语法元素，带有用于两个GPM分区的单独MVR(方法一)

基于如表4所示的提出的语法元素，在解码器处，用于生成每个GPM分区的单向预测样本的最终MV等于用信号通知的运动矢量细化和对应的基本MV之和。在实践中，可以预先定义不同组的MVR幅值和方向，并将其应用于所提出的GPM-MVR方案，这可以在运动矢量精度和信令开销之间提供各种折衷。在一个具体示例中，提出了将在VVC标准中使用的八个MVD偏移(即，1/4、1/2、1、2、4、8、16和32像素)和四个MVD方向(即，+/-x轴和y轴)重用于提出的GPM-MVR方案。在另一示例中，在AVS3标准中使用的现有五个MVD偏移{1/4、1/2、1、2和4像素}和四个MVD方向(即，+/-x和y轴)被应用于提出的GPM-MVR方案。

图7示出了根据本公开的以几何分区模式(GPM)解码视频块的方法。在步骤710中，该方法可以包括将视频块分区为第一几何分区和第二几何分区。在步骤712中，该方法可以包括针对第一几何分区获得第一运动矢量细化(MVR)。在步骤714，该方法可以包括针对第二几何分区获得第二MVR。在步骤716中，该方法可以包括获得包括多个运动矢量(MV)的候选列表。

在步骤718中，该方法可以包括针对第一几何分区从候选列表中获得第一MV。在步骤720中，该方法可以包括针对第二几何分区从候选列表中获得第二MV。在步骤722中，该方法可以包括针对第一几何分区通过将第一MV与第一MVR相加来计算第三MV。在步骤724中，该方法可以包括针对第二几何分区通过将第二MV与第二MVR相加来计算第四MV。在步骤726中，该方法可以包括基于第三MV和第四MV来获得第一几何分区和第二几何分区的预测样本。

图8示出了根据本公开的以GPM编码视频块的方法。在步骤810中，该方法可以包括将视频块分区为第一几何分区和第二几何分区。在步骤812中，该方法可以包括获得针对第一几何分区的第一MV和针对第二几何分区的第二MV。在步骤814中，该方法可以包括获得包括用于视频块的多个MV的候选列表。在步骤816中，该方法可以包括针对第一几何分区从候选列表中选择第三MV。

在步骤818中，该方法可以包括针对第二几何分区从候选列表中选择第四MV。在步骤820中，该方法可以包括针对第一几何分区通过从第一MV减去第三MV来计算第一MVR。在步骤822中，该方法可以包括针对第二几何分区通过从第二MV减去第四MV来计算第二MVR。在步骤824中，该方法可以包括基于第一MV和第二MV来获得第一几何分区和第二几何分区的预测样本。

如“GPM信令设计”部分中所讨论的，因为用于两个GPM分区的单向MV不能相同，所以在现有GPM设计中应用了一个约束，该约束强制两个单向预测合并索引不同。然而，在提出的GPM-MVR方案中，在现有的GPM单向MV之上应用了进一步的运动细化。因此，即使两个GPM分区的基本MV相同，只要两个运动矢量细化的值不相同，则用于预测两个分区的最终单向MV仍然可以不同。基于上述考虑，当应用所提出的GPM-MVR方案时，移除约束(限制两个单向预测合并索引不同)。此外，因为允许两个单向预测合并索引相同，所以相同的最大值MaxGPMMergeCand-1用于merg_gpm_idx0和merge_gpm_idx1的二值化，其中MaxGPMMergeCand是单向预测合并列表中候选的数量。

如上面分析的，当两个GPM分区的单向预测合并索引(即，merge_gpm_idx0和merge_gpm_idxl)相同时，两个运动矢量细化的值不能相同，以确保用于两个分区的最终MV不同。基于这种情况，在本公开的一个实施例中，提出了一种信令冗余去除方法，在两个GPM分区的单向预测合并索引相同(即，merge_gpm_idx0等于merge_gpm_idx1)时，使用第一GPM分区的MVR以减小第二GPM分区的MVR的信令开销。在一个示例中，应用了以下信令条件：

首先，当标志gpm_mvr_partIdx0_enable_flag等于0(即，GPM-MVR不应用于第一GPM分区)时，gpm_mvr_partIdx1_enable_flag的标志不被用信号通知而是被推断为1(即，GPM-MVR被应用于第二GPM分区)。

其次，当标志gpm_mvr_partIdx0_enable_flag和gpm_mvr_partIdx1_enable_flag都等于1(即，GPM-MVR被应用于两个GPM分区)并且gpm_mvr_partIdx0_direction_idx等于gpm_mvr_partIdx1_direction_idx(即，两个GPM分区的MVR具有相同的方向)时，第一GPM分区的MVR的幅值(即，gpm_mvr_partIdx0_distance_idx)用于预测第二GPM分区的MVR的幅值(即，gpm_mvr_partIdx1_distance_idx)。具体地，如果gpm_mvr_partIdx1_distance_idx小于gpm_mvr_partIdx0_distance_idx，则其原始值直接用信号通知。否则(gpm_mvr_partIdx1_distance_idx大于gpm_mvr_partIdx0_distance_idx)，其值在被用信号通知给比特流之前减一。在解码器侧，对于解码gpm_mvr_partIdx1_distance_idx的值，如果解析值小于gpm_mvr_partIdx0_distance_idx，则设置gpm_mvr_partIdx1_distance_idx等于解析值；否则(解析值等于或大于gpm_mvr_partIdx0_distance_idx)，设置gpm_mvr_partIdx1_distance_idx等于解析值加一。在这种情况下，为了进一步减少开销，不同的最大值MaxGPMMVRDistance-1和MaxGPMMVRDistance-2可以用于gpm_mvr_partIdx0_distance_idx和gpm_mvr_partIdx1_distance_idx的二值化，其中MaxGPMMVRDistance是运动矢量细化的允许幅值的数量。

在另一实施例中，提出了将信令次序切换到gpm_mvr_partIdx0_direction_idx/gpm_mvr_partIdx1_direction_idx和gpm_mvr_partIdx0_distance_idx/gpm_mvr_partIdx1_distance_idx，使得MVR幅值在MVR幅值之前被用信号通知。这样，按照与上面描述的相同的逻辑，编码器/解码器可以使用第一GPM分区的MVR方向来调节第二GPM分区的MVR方向的信令。在另一实施例中，提出了首先用信号通知第二GPM分区的MVR幅值和方向，并使用它们来调节第二GPM分区的MVR幅值和方向的信令。

在另一实施例中，提出了在用信号通知现有GPM语法元素之前用信号通知GPM-MVR相关语法元素。具体地，在这样的设计中，首先用信号通知两个标志gpm_mvr_partIdx0_enable_flag和gpm_mvr_partIdx1_enable_flag以分别指示GPM-MVR是否应用于第一GPM分区和第二GPM分区。当一个GPM分区的标志等于1时，距离索引(如语法元素gpm_mvr_partIdx0_distance_idx和gpm_mvr_partIdx1_distance_idx指示的)和方向索引(如语法元素gpm_mvr_partIdx0_direction_idx和gpm_mvr_partIdx1_distance_idx指示的)来指定MVR的方向。之后，用信号通知现有语法merge_gpm_idx0和merge_gpm_idx1以识别两个GPM分区的单向MV，即，基本MV。表5说明了提出的GPM-MVR信令方案。

表5提出的GPM-MVR方法的语法元素，带有用于两个GPM分区的单独MVR(方法二)

与表4中的信令方法类似，当应用表5中的GPM-MVR信令方法时可以应用某些条件以确保用于两个GPM分区的预测的所得到的MV不相同。具体地，取决于被应用于第一GPM分区和第二GPM分区的MVR的值，提出以下条件来约束单向预测合并索引merge_gpm_idx0和merge_gpm_idx1的信令：

首先，当gpm_mvr_partIdx0_enable_flag和gpm_mvr_partIdx1_enable_flag的值都等于0(即，针对两个GPM分区都禁用GPM-MVR)时，merge_gpm_idx0和merge_gpm_idx1的值不能相同；

其次，当gpm_mvr_partIdx0_enable_flag等于1(即，针对第一GPM分区启用GPM-MVR)并且gpm_mvr_partIdx1_enable_flag等于0(即，针对第二GPM分区禁用GPM-MVR)时，允许merge_gpm_idx0和merge_gpm_idx1的值相同。

第三，当gpm_mvr_partIdx0_enable_flag等于0(即，针对第一GPM分区禁用GPM-MVR)并且gpm_mvr_partIdx1_enable_flag等于1(即，针对第二GPM分区启用GPM-MVR)时，允许merge_gpm_idx0和merge_gpm_idx1的值相同。

第四，当gpm_mvr_partIdx0_enable_flag和gpm_mvr_partIdx1_enable_flag的值都等于1(即，针对两个GPM分区都启用GPM-MVR)时，有关merge_gpm_idx0和merge_gpm_idx1的值是否被允许相同的确定取决于被应用于两个GPM分区的MVR的值(如gpm_mvr_partIdx0_direction_idx和gpm_mvr_partIdx0_distance_idx以及gpm_mvr_partIdx1_direction_idx和gpm_mvr_partIdx1_distance_idx指示的)。如果两个MVR的值相等，则merge_gpm_idx0和merge_gpm_idx1不允许相同。否则(两个MVR的值不相等)，则merge_gpm_idx0和merge_gpm_idx1的值允许相同。

在上述四种情况下，当merge_gpm_idx0和merge_gpm_idx1的值不允许相同时，可以将一个分区的索引值用作另一分区的索引值的预测值。在一种方法中，提出首先用信号通知merge_gpm_idx0并使用其值来预测merge_gpm_idx1。具体地，在编码器处，当merge_gpm_idx1大于merge_gpm_idx0时，发送给解码器的merge_gpm_idx1的值减1。在解码器处，当merge_gpm_idx1的接收值等于或大于merge_gpm_idx0的接收值时，merge_gpm_idx1的值增加1。在另一种方法中，提出首先用信号通知merge_gpm_idx1并使用其值来预测merge_gpm_idx0。因此，在这种情况下，在编码器处，当merge_gpm_idx0大于merge_gpm_idx1时，发送到解码器的merge_gpm_idx0的值减1。在解码器处，当merge_gpm_idx0的接收值等于或大于merge_gpm_idx1的接收值时，merge_gpm_idx0的值增加1。另外，类似于现有的GPM信令设计，可以根据信令次序分别将不同的最大值MaxGPMMergeCand-1和MaxGPMMergeCand-2用于第一索引值和第二索引值的二值化。在另一方面，当由于两个索引值之间没有相关性而允许merge_gpm_idx0和merge_gpm_idx1的值相同时，可以将相同的最大值MaxGPMMergeCand-1用于两个索引值的二值化。

具有对称运动矢量细化的几何分区模式

对于上面讨论的GPM-MVR方法，用信号通知两个单独的MVR值，其中一个被应用以改进仅一个GPM分区的基本MV。通过允许针对每个GPM分区的独立的运动细化，这种方法在提高预测精度方面是高效的。然而，考虑到需要从编码器向解码器发送两组不同的GMP-MVR语法元素，这种灵活的运动细化是以增加信令开销为代价的。为了减少信令开销，在本部分中，提出了一种具有对称运动矢量细化的几何分区模式。具体地，在该方法中，根据当前图片与和两个GPM分区相关联的参考图片的图片次序计数(POC)值之间的对称关系，针对一个GPM CU用信号通知一个单一的MVR值并将该MVR值用于两个GPM分区。表6说明了应用所提出的方法时的语法元素。

表6提出的GPM-MVR方法的语法元素，带有用于两个GPM分区的对称MVR(方法一)

如表6所示，在选择了两个GPM分区的基本MV之后(基于merge_gpm_idx0和merge_gpm_idx1)，一个标志gpm_mvr_enable_flag被用信号通知以指示GPM-MVR模式是否应用于当前GPM CU。当标志等于1时，指示运动细化被应用以增强两个GPM分区的基本MV。否则(当标志等于0时)，指示运动细化不被应用于两个分区中的任何一个。如果启用GPM-MVR模式，则进一步用信号通知附加语法元素以通过方向索引gpm_mvr_direction_idx和幅值索引gpm_mvr_distance_idx指定所应用的MVR的值。另外，与MMVD模式类似，MVR符号的含义可以根据当前图片与GPM分区的两个参考图片的POC之间的关系而变化。具体地，当两个参考图片的POC都大于或小于当前图片的POC时，用信号通知的符号是加到两个基本MV的MVR的符号。否则(当一个参考图片的POC大于当前图片而另一个参考图片的POC小于当前图片时)，用信号通知的符号被应用于第一GPM分区的MVR，并且相反的符号被应用于第二GPM分区。在表6中，merge_gpm_idx0和merge_gpm_idx1的值允许相同。

在另一实施例中，提出用信号通知两个不同的标志以单独地分别控制两个GPM分区的GPM-MVR模式的启用/禁用。然而，当启用GPM-MVR模式时，基于语法元素gpm_mvr_direction_idx和gpm_mvr_distance_idx仅用信号通知一个MVR。这种信令方法的对应语法表如表7所示。

表7提出的GPM-MVR方法的语法元素，带有用于两个GPM分区的对称MVR(方法二)

当应用表7中的信令方法时，允许merge_gpm_idx0和merge_gpm_idx1的值相同。然而，为了确保应用于两个GPM分区的所得到的MV不是冗余的，当标志gpm_mvr_partIdx0_enable_flag等于0(即，GPM-MVR不应用于第一GPM分区)时，标志gpm_mvr_partIdx1_enable_flag不是用信号通知而是推断为1(即，GPM-MVR被应用于第二GPM分区)。

用于GPM-MVR的允许MVR的适配

在上面讨论的GPM-MVR方法中，固定一组MVR值在编码器和解码器处用于一个视频序列中的GPM CU。这样的设计对于具有高分辨率或具有剧烈运动的视频内容而言是次优的。在这些情况下，MV往往很大，使得固定的MVR值对于捕获这些块的实际运动可能不是最佳的。为了进一步提高GPM-MVR模式的编解码性能，本公开中提出了支持MVR值的适配，该MVR值被允许由GPM-MVR模式在各种编码级别进行选择，该编码级别例如为序列级别、图片/条带级别、编码块组级别等。例如，可以根据不同视频序列的特定运动特性离线导出多个MVR集合以及对应的码字。编码器可以选择最佳MVR集合并将所选集合的对应索引用信号通知给解码器。

用于GPM-MVR率失真优化的编码器加速逻辑

对于提出的GPM-MVR方案，为了确定每个GPM分区的最佳MVR，编码器可能需要多次测试每个GPM分区的率失真成本，每次都改变正在应用的MVR值。这会显著增加GPM模式的编码复杂度。为了解决编码复杂度问题，本部分提出以下快速编码逻辑：

首先，由于在VVC和AVS3中应用的四叉树/二叉树/三叉树块分区结构，在率失真优化(RDO)过程中可以检查一个相同的编码块，每个编码块通过一种不同的分区路径被划分。在当前的VTM/HPM编码器实现方式中，每当通过不同的块分区组合获得一个相同的CU时，总是会测试GPM和GPM-MVR模式以及其他帧间和帧内编码模式。一般而言，对于不同的分区路径，仅一个CU的相邻块可能不同，但这对一个CU将选择的最优编码模式的影响应该是相对较小的。基于这样的考虑，为了减少被应用的GPM RDO的总数，提出在第一次检查一个CU的RD成本时存储是否选择GPM模式的决策。之后，当RDO过程再次(通过另一分区路径)检查同一CU时，只有在第一次针对该CU选择GPM时，才会检查GPM(包括GPM-MVR)的RD成本。在针对一个CU的初始RD检查没有选择GPM的情况下，仅当通过另一分区路径实现相同的CU时，测试GPM(没有GPM-MVR)。在另一种方法中，当针对一个CU的初始RD检查没有选择GPM时，当通过另一分区路径实现相同的CU时，GPM和GPM-MVR均不被测试。

其次，为了减少GPM-MVR模式的GPM分区的数量，提出在第一次检查一个CU的RD成本时，保持前M个GPM分区模式没有最小的RD成本。之后，当RDO过程再次(通过另一分区路径)检查相同的CU时，针对GPM-MVR模式只测试那M个GPM分区模式。

再次，为了减少对于每个GPM分区针对初始RDO过程一测试的GPM分区的数量，提出在对于两个GPM分区使用不同的单向预测合并候选时首先计算总和绝对差(SAD)值。然后，对于一个特定分区模式下的每个GPM分区，选择SAD值最小的最佳单向预测合并候选，并计算该分区模式的对应的SAD值，该SAD值等于两个GPM分区的最佳单向预测合并候选的SAD值之和。然后，对于接下来的RD过程，仅针对GPM-MVR模式测试对于上一步具有最佳SAD值的前N个分区模式。

可以使用包括一个或多个电路的装置来实施上述方法，这些电路包括专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子组件。该装置可以与其他硬件或软件组件组合地使用电路来执行上述方法。上面公开的每个模块、子模块、单元或子单元可以至少部分地使用一个或多个电路来实现。

图9示出了与用户接口960耦合的计算环境(或计算设备)910。计算环境910可以是数据处理服务器的一部分。在一些实施例中，计算设备910可以根据本公开的各种示例执行如上文描述的各种方法或过程(例如，编码/解码方法或过程)中的任何一个。计算环境910可以包括处理器920、存储器940和I/O接口950。

处理器920典型地控制计算环境910的整体操作，例如，与显示、数据采集、数据通信和图像处理相关联的操作。处理器920可以包括一个或多个处理器以执行指令来执行上述方法中的步骤中的所有或一些步骤。此外，处理器920可以包括促进处理器920与其他组件之间的交互的一个或多个模块。处理器可以是中央处理单元(CPU)、微处理器、单片机、GPU等。

存储器940被配置为存储各种类型的数据以支持计算环境910的操作。存储器940可以包括预定软件942。这种数据的示例包括用于在计算环境910上操作的任何应用或方法的指令、视频数据集、图像数据等。存储器940可以通过使用任何类型的易失性或非易失性存储器设备或其组合来实现，例如，静态随机存取存储器(SRAM)、电可擦除可编程只读存储器(EEPROM)、可擦除可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)、磁存储器、闪速存储器、磁盘或光盘。

I/O接口950提供处理器920与外围接口模块(例如，键盘、点击轮、按钮等)之间的接口。按钮可以包括但不限于主页按钮、开始扫描按钮和停止扫描按钮。I/O接口950可以与编码器和解码器耦合。

在一些实施例中，还提供了一种非暂时性计算机可读存储介质，其包括多个程序，例如包括在存储器940中，可由处理器920在计算环境910中执行，以用于执行上述方法。例如，非暂时性计算机可读存储介质可以是ROM、RAM、CD-ROM、磁带、软盘、光数据存储设备等。

非暂时性计算机可读存储介质已经在其中存储了用于由具有一个或多个处理器的计算设备执行的多个程序，其中多个程序在由一个或多个处理器执行时使计算设备执行上述运动预测方法。

在一些实施例中，计算环境910可以用一个或多个专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、图形处理单元(GPU)、控制器、微控制器、微处理器或其他电子组件来实现，以用于执行上述方法。

通过考虑说明书和此处公开的本公开的实践，本公开的其他示例对于本领域技术人员将是显而易见的。本申请旨在涵盖公开内容的任何变化、使用或改编，遵循其一般原则，并且包括本领域已知或惯常实践中想到的与本公开的这种偏离。旨在将说明书和示例仅视为示例性的。

应当理解，本公开不限于上面描述和附图中所示的确切示例，并且可以在不背离其范围的情况下进行各种修改和改变。

根据本公开的各个方面，可以提供以下示例。

在一个或多个示例中，提供了一种以几何分区模式(GPM)解码视频块的方法。该方法可以包括：将视频块分区为第一几何分区和第二几何分区；针对第一几何分区获得第一运动矢量细化(MVR)；针对第二几何分区获得第二MVR；获得包括多个运动矢量(MV)的候选列表；针对第一几何分区从候选列表中获得第一MV；针对第二几何分区从候选列表中获得第二MV；针对第一几何分区通过将第一MV与第一MVR相加来计算第三MV；针对第二几何分区通过将第二MV与第二MVR相加来计算第四MV；以及基于第三MV和第四MV来获得第一几何分区和第二几何分区的预测样本。

在一个或多个示例中，针对第一几何分区获得第一MVR可以包括：接收指示MVR被应用于第一几何分区的语法元素gpm_mvr_partIdx0_enable_flag；响应于确定gpm_mvr_partIdx0_enable_flag等于1，接收指示第一MVR的方向和幅值的两个语法元素gpm_mvr_partIdx0_direction_idx和gpm_mvr_partIdx0_distance_idx。

在一个或多个示例中，针对第二几何分区获得第二MVR可以包括：接收指示MVR被应用于第二几何分区的语法元素gpm_mvr_partIdx1_enable_flag；响应于确定gpm_mvr_partIdx1_enable_flag等于1，接收指示第二MVR的方向和幅值的两个语法元素gpm_mvr_partIdx1_direction_idx和gpm_mvr_partIdx1_distance_idx。

在一个或多个示例中，针对第一几何分区和第二几何分区从候选列表中获得第一MV和从候选列表中获得第二MV可以包括：针对第一几何分区接收指示第一MV在候选列表中的索引的语法元素merge_gpm_idx0；针对第二几何分区接收指示第二MV在候选列表中的索引的语法元素merge_gpm_idx1；以及基于被应用于第一几何分区和第二几何分区的第一MVR和第二MVR的值来修改merge_gpm_idx0和merge_gpm_idx1的值。

在一个或多个示例中，基于被应用于第一几何分区和第二几何分区的第一MVR和第二MVR的值来修改merge_gpm_idx0和merge_gpm_idx1的值可以包括：响应于确定gpm_mvr_partIdx0_enable_flag和gpm_mvr_partIdx1_enable_flag都等于0并且merge_gpm_idx1等于或大于merge_gpm_idx0，将merge_gpm_idx1的值增加1。

在一个或多个示例中，基于被应用于第一几何分区和第二几何分区的第一MVR和第二MVR的值来修改merge_gpm_idx0和merge_gpm_idx1的值包括：响应于确定gpm_mvr_partIdx0_enable_flag和gpm_mvr_partIdx1_enable_flag都等于1并且第一MVR和第二MVR的值相等并且merge_gpm_idx1等于或大于merge_gpm_idx0，将merge_gpm_idx1的值增加1。

在一个或多个示例中，针对第一几何分区和第二几何分区获得第一MVR和第二MVR可以包括：获得包括以样本为单位的1/4、1/2、1、2和4的五个MVR幅值；以及获得包括水平正方向、水平负方向、垂直正方向和垂直负方向的四个MVR方向。

在一个或多个示例中，针对第一几何分区和第二几何分区获得第一MVR和第二MVR可以包括：获得包括以样本为单位的1/4、1/2、1、2、4、8、16和32的八个MVR幅值；以及获得包括水平正方向、水平负方向、垂直正方向和垂直负方向的四个MVR方向。

在一个或多个示例中，针对第一几何分区和第二几何分区获得第一MVR和第二MVR可以包括：在特定编码级别从比特流接收所允许的MVR，特定编码级别包括序列级别、图片/条带级别和块级别。

在一个或多个示例中，提供了一种以几何分区模式(GPM)编码视频块的方法。该方法可以包括：将视频块分区为第一几何分区和第二几何分区；获得针对第一几何分区的第一MV和针对第二几何分区的第二MV；获得包括用于视频块的多个MV的候选列表；针对第一几何分区从候选列表中选择第三MV；针对第二几何分区从候选列表中选择第四MV；针对第一几何分区通过从第一MV减去第三MV来计算第一MVR；针对第二几何分区通过从第二MV减去第四MV来计算第二MVR；以及基于第一MV和第二MV来获得第一几何分区和第二几何分区的预测样本。

在一个或多个示例中，针对第一几何分区计算第一MVR可以包括：响应于确定第一MVR不等于0，发送被设置为1的语法元素gpm_mvr_partIdx0_enable_flag和指示第一MVR的方向和幅值的两个其他语法元素gpm_mvr_partIdx0_direction_idx和gpm_mvr_partIdx0_distance_idx；响应于确定第一MVR等于0，发送被设置为0的语法元素gpm_mvr_partIdx0_enable_flag。

在一个或多个示例中，针对第二几何分区计算第二MVR可以包括：响应于确定第二MVR不等于0，发送被设置为1的语法元素gpm_mvr_partIdx1_enable_flag和指示第二MVR的方向和幅值的两个其他语法元素gpm_mvr_partIdx1_direction_idx和gpm_mvr_partIdx1_distance_idx；响应于确定第二MVR等于0，发送被设置为0的语法元素gpm_mvr_partIdx1_enable_flag。

在一个或多个示例中，获得第一MV和第二MV可以包括：针对第一几何分区获得指定第一MV在候选列表中的索引的merge_gpm_idx0的值；针对第二几何分区获得指定第二MV在候选列表中的索引的merge_gpm_idx1的值；基于被应用于第一几何分区和第二几何分区的第一MVR和第二MVR的值来修改merge_gpm_idx0和merge_gpm_idx1的值；以及在比特流中发送merge_gpm_idx0和merge_gpm_idx1。

在一个或多个示例中，基于被应用于第一几何分区和第二几何分区的第一MVR和第二MVR的值来修改merge_gpm_idx0和merge_gpm_idx1的值可以包括：响应于确定gpm_mvr_partIdx0_enable_flag和gpm_mvr_partIdx1_enable_flag都等于0，阻止merge_gpm_idx0和merge_gpm_idx1相同；以及当merge_gpm_idx1大于merge_gpm_idx0时，将merge_gpm_idx1的值减少1。

在一个或多个示例中，基于被应用于第一几何分区和第二几何分区的第一MVR和第二MVR的值来修改merge_gpm_idx0和merge_gpm_idx1的值可以包括：响应于确定gpm_mvr_partIdx0_enable_flag和gpm_mvr_partIdx1_enable_flag都等于1并且第一MVR和第二MVR的值相等，阻止merge_gpm_idx0和merge_gpm_idx1相同；以及当merge_gpm_idx1大于merge_gpm_idx0时，将merge_gpm_idx1的值减少1。

在一个或多个示例中，针对第一几何分区和第二几何分区获得第一MVR和第二MVR可以包括：获得MVR的不同集合；以及在特定编解码级别在比特流中发送MVR的不同集合，特定编码级别包括序列级别、图片/条带级别和块级别。

在一个或多个示例中，该方法还可以包括：响应于第一次检查了视频块的率失真(RD)成本并且选择GPM，第二次计算利用几何分区模式的视频块的RD成本；以及响应于第一次检查了视频块的RD成本并且未选择GPM，第二次不计算利用几何分区模式的视频块的RD成本。

在一个或多个示例中，该方法还可以包括：响应于第一次检查了视频块的率失真(RD)成本并且未选择GPM，第二次仅计算利用GPM而不应用MVR的视频块的RD成本。

在一个或多个示例中，该方法还可以包括：在第一次对利用GPM的视频块进行RD成本计算期间，维持具有最佳RD成本的M个几何分区模式；当第二次计算利用GPM的视频块的RD成本时，仅针对视频块检查M个几何模式。

在一个或多个示例中，该方法还可以包括：在给定的一个GPM使用来自候选列表的不同MV的情况下，计算每个几何分区的总和绝对差(SAD)值；针对每个GPM选择针对两个几何分区的具有最小SAD值的两个MV候选；将GPM的对应SAD值计算为针对两个几何分区的两个所选MV候选的SAD值之和；以及当计算应用MVR的视频块的RD成本时，仅检查具有最佳SAD值的GPM。

Claims

1.一种以几何分区模式(GPM)解码视频块的方法，包括：

将所述视频块分区为第一几何分区和第二几何分区；

针对所述第一几何分区获得第一运动矢量细化(MVR)；

针对所述第二几何分区获得第二MVR；

获得包括多个运动矢量(MV)的候选列表；

针对所述第一几何分区从所述候选列表中获得第一MV；

针对所述第二几何分区从所述候选列表中获得第二MV；

针对所述第一几何分区通过将所述第一MV与所述第一MVR相加来计算第三MV；

针对所述第二几何分区通过将所述第二MV与所述第二MVR相加来计算第四MV；以及

基于所述第三MV和所述第四MV来获得所述第一几何分区和所述第二几何分区的预测样本。

2.根据权利要求1所述的方法，其中，针对所述第一几何分区获得所述第一MVR包括：

接收指示MVR被应用于所述第一几何分区的语法元素gpm_mvr_partIdx0_enable_flag；

响应于确定gpm_mvr_partIdx0_enable_flag等于1，接收指示所述第一MVR的方向和幅值的两个语法元素gpm_mvr_partIdx0_direction_idx和gpm_mvr_partIdx0_distance_idx。

3.根据权利要求1所述的方法，其中，针对所述第二几何分区获得所述第二MVR包括：

接收指示MVR被应用于所述第二几何分区的语法元素gpm_mvr_partIdx1_enable_flag；

响应于确定gpm_mvr_partIdx1_enable_flag等于1，接收指示所述第二MVR的方向和幅值的两个语法元素gpm_mvr_partIdx1_direction_idx和gpm_mvr_partIdx1_distance_idx。

4.根据权利要求1所述的方法，其中，针对所述第一几何分区和所述第二几何分区从所述候选列表中获得所述第一MV和从所述候选列表中获得所述第二MV包括：

针对所述第一几何分区接收指示所述第一MV在所述候选列表中的索引的语法元素merge_gpm_idx0；

针对所述第二几何分区接收指示所述第二MV在所述候选列表中的索引的语法元素merge_gpm_idx1；以及

基于被应用于所述第一几何分区和所述第二几何分区的所述第一MVR和所述第二MVR的值来修改merge_gpm_idx0和merge_gpm_idx1的值。

5.根据权利要求4所述的方法，其中，基于被应用于所述第一几何分区和所述第二几何分区的所述第一MVR和所述第二MVR的值来修改merge_gpm_idx0和merge_gpm_idx1的值包括：

响应于确定gpm_mvr_partIdx0_enable_flag和gpm_mvr_partIdx1_enable_flag都等于0并且merge_gpm_idx1等于或大于merge_gpm_idx0，将merge_gpm_idx1的值增加1。

6.根据权利要求4所述的方法，其中，基于被应用于所述第一几何分区和所述第二几何分区的所述第一MVR和所述第二MVR的值来修改merge_gpm_idx0和merge_gpm_idx1的值包括：

响应于确定gpm_mvr_partIdx0_enable_flag和gpm_mvr_partIdx1_enable_flag都等于1并且所述第一MVR和所述第二MVR的值相等并且merge_gpm_idx1等于或大于merge_gpm_idx0，将merge_gpm_idx1的值增加1。

7.根据权利要求1所述的方法，其中，针对所述第一几何分区和所述第二几何分区获得所述第一MVR和所述第二MVR包括：

获得包括以样本为单位的1/4、1/2、1、2和4的五个MVR幅值；以及

获得包括水平正方向、水平负方向、垂直正方向和垂直负方向的四个MVR方向。

8.根据权利要求1所述的方法，其中，针对所述第一几何分区和所述第二几何分区获得所述第一MVR和所述第二MVR包括：

获得包括以样本为单位的1/4、1/2、1、2、4、8、16和32的八个MVR幅值；以及

9.根据权利要求1所述的方法，其中，针对所述第一几何分区和所述第二几何分区获得所述第一MVR和所述第二MVR包括：

在特定编码级别从比特流接收所允许的MVR，所述特定编码级别包括序列级别、图片/条带级别和块级别。

10.一种以几何分区模式(GPM)编码视频块的方法，包括：

将所述视频块分区为第一几何分区和第二几何分区；

获得针对所述第一几何分区的第一MV和针对所述第二几何分区的第二MV；

获得包括用于所述视频块的多个MV的候选列表；

针对所述第一几何分区从所述候选列表中选择第三MV；

针对所述第二几何分区从所述候选列表中选择第四MV；

针对所述第一几何分区通过从所述第一MV减去所述第三MV来计算第一MVR；

针对所述第二几何分区通过从所述第二MV减去所述第四MV来计算第二MVR；以及

基于所述第一MV和所述第二MV来获得所述第一几何分区和所述第二几何分区的预测样本。

11.根据权利要求10所述的方法，其中，针对所述第一几何分区计算所述第一MVR包括：

响应于确定所述第一MVR不等于0，发送被设置为1的语法元素gpm_mvr_partIdx0_enable_flag和指示所述第一MVR的方向和幅值的两个其他语法元素gpm_mvr_partIdx0_direction_idx和gpm_mvr_partIdx0_distance_idx；

响应于确定所述第一MVR等于0，发送被设置为0的所述语法元素gpm_mvr_partIdx0_enable_flag。

12.根据权利要求10所述的方法，其中，针对所述第二几何分区计算所述第二MVR包括：

响应于确定所述第二MVR不等于0，发送被设置为1的语法元素gpm_mvr_partIdx1_enable_flag和指示所述第二MVR的方向和幅值的两个其他语法元素gpm_mvr_partIdx1_direction_idx和gpm_mvr_partIdx1_distance_idx；

响应于确定第二MVR等于0，发送被设置为0的所述语法元素gpm_mvr_partIdx1_enable_flag。

13.根据权利要求10所述的方法，其中，获得所述第一MV和所述第二MV包括：

针对所述第一几何分区获得指定所述第一MV在所述候选列表中的索引的merge_gpm_idx0的值；

针对所述第二几何分区获得指定所述第二MV在所述候选列表中的索引的merge_gpm_idx1的值；

基于被应用于所述第一几何分区和所述第二几何分区的所述第一MVR和所述第二MVR的值来修改merge_gpm_idx0和merge_gpm_idx1的值；以及

在比特流中发送merge_gpm_idx0和merge_gpm_idx1。

14.根据权利要求13所述的方法，其中，基于被应用于所述第一几何分区和所述第二几何分区的所述第一MVR和所述第二MVR的值来修改merge_gpm_idx0和merge_gpm_idx1的值包括：

响应于确定gpm_mvr_partIdx0_enable_flag和gpm_mvr_partIdx1_enable_flag都等于0，阻止merge_gpm_idx0和merge_gpm_idx1相同；以及

当merge_gpm_idx1大于merge_gpm_idx0时，将merge_gpm_idx1的值减少1。

15.根据权利要求13所述的方法，其中，基于被应用于所述第一几何分区和所述第二几何分区的所述第一MVR和所述第二MVR的值来修改merge_gpm_idx0和merge_gpm_idx1的值包括：

响应于确定gpm_mvr_partIdx0_enable_flag和gpm_mvr_partIdx1_enable_flag都等于1并且所述第一MVR和所述第二MVR的值相等，阻止merge_gpm_idx0和merge_gpm_idx1相同；以及

当merge_gpm_idx1大于merge_gpm_idx0时，将merge_gpm_idx1的值减少1。

16.根据权利要求10所述的方法，其中，针对所述第一几何分区和所述第二几何分区获得所述第一MVR和所述第二MVR包括：

17.根据权利要求10所述的方法，其中，针对所述第一几何分区和所述第二几何分区获得所述第一MVR和所述第二MVR包括：

18.根据权利要求10所述的方法，其中，针对所述第一几何分区和所述第二几何分区获得所述第一MVR和所述第二MVR包括：

获得MVR的不同集合；以及

在特定编解码级别在比特流中发送所述MVR的不同集合，所述特定编码级别包括序列级别、图片/条带级别和块级别。

19.根据权利要求10所述的方法，还包括：

响应于第一次检查了所述视频块的率失真(RD)成本并且选择所述GPM，第二次计算利用几何分区模式的所述视频块的RD成本；以及

响应于第一次检查了所述视频块的RD成本并且未选择所述GPM，第二次不计算利用几何分区模式的所述视频块的RD成本。

20.根据权利要求10所述的方法，还包括：

响应于第一次检查了所述视频块的率失真(RD)成本并且未选择所述GPM，第二次仅计算利用GPM而不应用所述MVR的所述视频块的RD成本。

21.根据权利要求10所述的方法，还包括：

在第一次对利用GPM的所述视频块进行RD成本计算期间，维持具有最佳RD成本的M个几何分区模式；

当第二次计算利用GPM的所述视频块的RD成本时，仅针对所述视频块检查所述M个几何模式。

22.根据权利要求10所述的方法，还包括：

在给定的一个GPM使用来自所述候选列表的不同MV的情况下，计算每个几何分区的总和绝对差(SAD)值；

针对每个GPM选择针对两个几何分区的具有最小SAD值的两个MV候选；

将GPM的对应SAD值计算为针对两个几何分区的两个所选MV候选的SAD值之和；以及

当计算应用所述MVR的所述视频块的RD成本时，仅检查具有最佳SAD值的GPM。

23.一种用于视频编解码的装置，包括：

一个或多个处理器；以及

非暂时性计算机可读存储介质，其被配置为存储可由一个或多个处理器执行的指令；其中，所述一个或多个处理器在执行所述指令时被配置为执行权利要求1-22中任一项所述的方法。

24.一种存储计算机可执行指令的非暂时性计算机可读存储介质，所述指令在由一个或多个计算机处理器执行时，使所述一个或多个计算机处理器执行权利要求1-22中任一项所述的方法。