CN116418979A

CN116418979A - 视频编解码方法及相关装置

Info

Publication number: CN116418979A
Application number: CN202310013680.XA
Authority: CN
Inventors: 江嫚书; 陈俊嘉; 徐志玮; 向时达; 陈庆晔; 庄子德; 黄毓文
Original assignee: MediaTek Inc
Current assignee: MediaTek Inc
Priority date: 2022-01-07
Filing date: 2023-01-05
Publication date: 2023-07-11
Also published as: TW202329688A; US20230224455A1

Abstract

本发明提供一种视频编解码方法和相关装置。视频编解码方法包括接收与当前块相关联的输入数据；确定与编解码模式或模式参数相关的一组候选；确定与该组候选相关联的边界匹配成本，其中，藉由对该组候选中的每一个目标候选，通过使用根据该每一目标候选确定的该当前块的重建或预测的样本以及该当前块的一个或多个相邻块的相邻重建的或预测的样本，来确定每个边界匹配成本，并且其中每个边界匹配成本是使用从多个配置中选择的一个目标配置来计算的；基于边界匹配成本从组候选中确定最终候选；以及使用最终候选对当前块进行编码或解码。本发明的视频编解码方法及相应装置可以提高编解码性能。

Description

视频编解码方法及相关装置

【技术领域】

本发明涉及视频编解码系统。更具体地，本发明涉及一种用于视频编解码系统中基于边界匹配的模式选择的新视频编解码工具。

【背景技术】

通用视频编解码(VVC)是由ITU-T视频编解码专家组(VCEG)和ISO/IEC运动图像专家组的联合视频专家组(JVET)制定的最新国际视频编解码标准(MPEG)。该标准已作为ISO标准发布：ISO/IEC 23090-3:2021，Information technology-Coded representation ofimmersive media-Part 3:Versatile video coding，2021年2月发布。通过基于其前身HEVC(High Efficiency Video coding)，添加更多编解码工具来提高编解码效率，并处理各种类型的视频源，包括3维(3D)视频信号，发展处VVC。

图1A说明了包含循环处理的示例性适应性帧间/帧内(adaptive Inter/Intra)视频编解码系统。对于帧内预测，预测数据是根据当前图片(在后文中也称为画面)中先前编解码的视频数据导出的。对于帧间预测112，在编码器侧执行运动估计(MotionEstimation，简写为ME)并且基于ME的结果执行运动补偿(Motion Compensation，简写为MC)以提供从其他画面和运动数据导出的预测数据。开关114选择帧内预测110或帧间预测112并且所选择的预测数据被提供给加法器116以形成预测误差，也称为残差(residual)。预测误差然后由变换(T)118和随后的量化(Q)120处理。变换和量化的残差然后由熵编码器122编码以包括在对应于压缩视频数据的视频比特流中。然后，与变换系数相关联的比特流将与辅助信息(side information)(例如与帧内预测和帧间预测相关联的运动和解码模式)以及其他信息(例如与应用于底层图像区域(underlying image area)的环路滤波器相关联的参数)一起打包。与帧内预测110、帧间预测112和环路滤波器130相关联的辅助信息被提供给熵编码器122，如图1A所示。当使用帧间预测模式时，也必须在编码器端重建一个或多个参考图片。因此，经变换和量化的残差由逆量化(IQ)124和逆变换(IT)126处理以恢复残差。然后在重建(REC)128处将残差加回到预测数据136以重建视频数据。重建的视频数据可以存储在参考图片缓冲器134中并用于预测其他帧。

如图1A所示，输入的视频数据在编码系统中经过一系列处理。由于一系列处理，来自REC 128的重建的视频数据可能会受到各种损害。因此，环路滤波器130经常在重建的视频数据被存储在参考图片缓冲器134中之前应用于重建的视频数据以提高视频质量。例如，可以使用去块滤波器(deblocking filter，简写为DF)、样本适应性偏移(Sample AdaptiveOffset，简写为SAO)和适应性环路滤波器(Adaptive Loop Filter，简写为ALF)。可能需要将环路滤波器信息合并到比特流中，以便解码器可以正确地恢复所需的信息。因此，环路滤波器信息也被提供给熵编码器122以合并到比特流中。在图1A中，环路滤波器130在重建样本被存储在参考图片缓冲器134中之前被应用于重建的视频。图1A中的系统旨在说明典型视频编码器的示例性结构。它可能对应于高效视频编解码(HEVC)系统、VP8、VP9、H.264或VVC。

如图1B所示，除了变换118和量化120之外，解码器可以使用与编码器相似或相同的功能块，因为解码器只需要逆量化124和逆变换126。取代熵编码器122，解码器使用熵解码器140将视频比特流解码为量化的变换系数和需要的编解码信息(例如ILPF信息、帧内预测信息和帧间预测信息)。解码器侧的帧内预测150不需要执行模式搜索。相反，解码器仅需要根据从熵解码器140接收的帧内预测信息生成帧内预测。此外，对于帧间预测，解码器仅需要根据从熵解码器140接收的帧间预测信息执行运动补偿(MC 152)而无需运动估计。

根据VVC，与HEVC类似，输入图片被划分(partition)为称为CTU(编解码树单元)的非重叠方形块区域。每个CTU可以划分为一个或多个更小的编解码单元(CU)。生成的CU分区可以是正方形或矩形。此外，VVC将CTU划分为预测单元(PU)，作为应用预测处理的单元，例如帧间预测、帧内预测等。

VVC标准结合了各种新的编解码工具，以进一步在HEVC标准基础上提高编解码效率。在各种新的编解码工具中，与本发明相关的一些编解码工具综述如下。

使用树结构划分CTU

在HEVC中，CTU通过使用表示为编解码树的四叉树(quaternary-tree，简写为QT)结构被分成CU以适应各种局部特征。使用图片间(inter-picture)(时间)(temporal)还是图片内(intra-picture)(空间)(spatial)预测对图片区域进行编解码的决定是在叶CU级别做出的。每个叶CU可以根据PU分割类型(splitting type)进一步分割成一个、两个或四个PU。在一个PU内部，应用相同的预测过程，并将相关信息以PU为基础传输到解码器。在通过应用基于PU分割类型的预测过程获得残差块后，可以根据类似于CU的编解码树的另一种四叉树结构将叶CU划分为变换单元(TU)。HEVC结构的关键特征之一是它具有多个分区概念，包括CU、PU和TU。

在VVC中，使用二元和三元分割分段结构(binary and ternary splitssegmentation structure)的具有嵌套多类型树(nested multi-type tree)的四叉树取代了多划分单元类型的概念，即它去除了CU、PU和TU概念的分离(separation)(除了对于具有对于最大变换长度来说尺寸太大的CU)，并且支持更灵活(flexibility)的CU分区形状。在解码树结构中，CU可以是正方形或长方形。一个编解码树单元(CTU)首先被一个四叉树(又名四元树(quadtree))结构划分。然后四叉树叶节点可以进一步划分为多类型树结构。如图2所示，多类型树结构中有四种分割类型，垂直二元分割(SPLIT_BT_VER 210)、水平二元分割(SPLIT_BT_HOR 220)、垂直三元分割(SPLIT_TT_VER 230)、水平三元分割(SPLIT_TT_HOR240)。多类型树叶节点称为编解码单元(CU)，除非CU对于最大变换长度来说太大，否则此分段用于预测和变换处理，而无需进一步划分。这意味着，在大多数情况下，CU、PU和TU在具有嵌套多类型树块结构的四叉树中具有相同的块大小。当支持的最大变换长度小于CU颜色分量的宽度或高度时会发生例外(exception)。

图3说明了嵌套多类型树编解码树结构的四叉树中划分分割信息的发信(signaling)机制。编解码树单元(CTU)被视为四叉树的根，并首先由四叉树结构划分。每个四元树叶节点(当足够大以允许它时)然后由多类型树结构进一步划分。在多类型树结构中，发信第一标志(mtt_split_cu_flag)以指示节点是否被进一步划分；当一个节点被进一步划分时，发信第二标志(

mtt_split_cu_vertical_flag)以指示分割方向，然后发信第三标志(

mtt_split_cu_binary_flag)以指示分割是二元分割还是三元分割。根据mtt_split_cu_vertical_flag和mtt_split_cu_binary_flag的值，推导出CU的多类型树分割模式(MttSplitMode)，如表1所示。

表1–基于多类型树句法元素(syntax element)的MttSplitMode推导

图4显示了利用四叉树和嵌套的多类型树编解码块结构将一个CTU分成多个CU，其中粗体块边缘表示四叉树划分，其余边缘表示多类型树划分。具有嵌套多类型树划分的四叉树提供了由CU组成的内容适应性编解码树结构。CU的大小可以与CTU一样大，也可以以亮度(luma)样本为单位小至4×4。对于4:2:0色度(chroma)格式，最大色度CB大小为64×64，最小大小色度CB由16个色度样本组成。

在VVC中，支持的最大亮度变换大小为64×64，支持的最大色度变换大小为32×32。当CB的宽度或高度大于最大变换宽度或高度时，CB会自动在水平和/或垂直方向上拆分以满足该方向上的变换大小限制。

以下参数由用于具有嵌套多类型树编解码树方案的四叉树的SPS句法元素定义和指定。

–CTU大小(CTU size)：四叉树的根节点大小

–MinQTSize：允许的最小四叉树叶节点大小

–MaxBtSize：允许的最大二叉树根节点大小

–MaxTtSize：最大允许的三叉树根节点大小

–MaxMttDepth：从四叉树叶分割出的多类型树的最大允许层次深度(hierarchydepth)

–MinBtSize：允许的最小二叉树叶节点大小

–MinTtSize：允许的最小三叉树叶节点大小

在具有嵌套(nested)多类型树编解码树结构的四叉树的一个示例中，CTU大小设置为128×128亮度样本和4:2:0色度样本的两个对应的64×64块，MinQTSize设置为16×16，MaxBtSize设置为128×128，MaxTtSize设置为64×64，MinBtSize和MinTtSize(宽度和高度)设置为4×4，MaxMttDepth设置为4。四叉树划分首先应用于CTU以生成四叉树叶节点。四叉树叶节点的大小可以从16×16(即MinQTSize)到128×128(即CTU大小)。如果叶QT节点为128×128，由于大小超过了MaxBtSize和MaxTtSize(即64×64)，二叉树将不再进一步分割。否则，叶qdtree节点可能会被多类型树进一步划分。因此，四叉树叶节点也是多类型树的根节点，其多类型树深度(mttDepth)为0。当多类型树深度达到MaxMttDepth(即4)时，不再考虑进一步分割。当多类型树节点的宽度等于MinBtSize且小于或等于2*MinTtSize时，不再考虑进一步水平分割。类似地，当多类型树节点的高度等于MinBtSize且小于或等于2*MinTtSize时，不考虑进一步的垂直分割。

为了在VVC硬件解码器中允许64×64亮度块和32×32色度管线设计(pipeliningdesign)，当亮度编解码块的宽度或高度大于64时，禁止TT拆分，如图5所示。其中块500对应于128x128亮度CU。可以使用垂直二进制划分(510)或水平二进制划分(520)来拆分CU。将块拆分成4个CU，每个CU大小为64x64，CU可以进一步使用包括TT在内的分区进行拆分。例如，左上角的64x64 CU使用垂直三元拆分(vertical ternary splitting)(530)或水平三元拆分(horizontal ternary splitting)(540)进行划分。当色度编解码块的宽度或高度大于32时，也禁止TT拆分。

在VVC中，编解码树方案支持亮度和色度具有单独的块树结构(block treestructure)的能力。对于P和B切片，一个CTU中的亮度和色度CTB必须共享相同的编解码树结构。然而，对于I切片，亮度和色度可以具有单独的块树结构。当应用分离块树模式(separate block tree mode)时，亮度CTB被一个编解码树结构划分成CU，色度CTB被另一个编解码树结构划分成色度CU。这意味着I切片中的CU可能由亮度分量的编解码块或两个色度分量的编解码块组成，而P或B切片中的CU总是由所有三个颜色分量的编解码块组成，除非视频是单色(monochrome)的。

图片边界上的CU拆分

如在HEVC中所做的那样，当树节点块的一部分超出图片边界的底部或右侧时，树节点块被强制拆分，直到每个编解码的CU的所有样本都位于图片边界内。VVC中应用了以下拆分规则：

–如果树节点块的任何部分超出了底部或右侧图片边界(right pictureboundaries)，并且由于块大小限制不允许QT、BT和TT拆分，则该块被强制使用QT拆分方式拆分。

–否则，如果树节点块的一部分超过了底部以及右侧图片边界，

·如果块是一个QT节点，并且块的大小大于最小QT大小，则块被强制使用QT拆分模式进行拆分。

·否则，块被强制以SPLIT_BT_HOR模式拆分

–否则，如果树节点块的一部分超出了底部图片边界(bottom pictureboundaries)，

·如果块是QT节点，且块大小大于最小QT大小，且块大小大于最大BT大小，则强制使用QT拆分方式拆分块。

·否则，如果该块为QT节点，且块大小大于最小QT大小且块大小小于或等于最大BT大小，则该块被强制使用QT拆分模式或SPLIT_BT_HOR模式拆分。

·否则(该块为BTT节点或块大小小于或等于最小QT大小)，强制以SPLIT_BT_HOR模式拆分块。

–否则，如果树节点块的一部分超出了图片右侧边界，

·否则，如果该块为QT节点，且块大小大于最小QT大小且块大小小于或等于最大BT大小，则该块被强制使用QT拆分模式或SPLIT_BT_VER模式拆分。

·否则(该块为BTT节点或块大小小于或等于最小QT大小)，强制以SPLIT_BT_VER模式拆分块。

冗余CU(Redundant CU)拆分的限制

具有嵌套多类型树编解码块结构的四叉树提供了高度灵活的块划分结构。由于支持多类型树的拆分类型，不同的拆分模式(splitting pattern)可能会导致相同的编解码块结构。在VVC中，其中一些冗余拆分模式是不允许的。

图6说明了二叉树分割和三叉树分割的冗余分割模式。如图6所示，一个方向上的两层连续二叉树分割(垂直610和水平630)可能具有与三元树分割(垂直620和水平640)后利用中央划分的二叉树分割相同的块结构。在这种情况下，语法(syntax)阻止了三元树分割的中央分区的二叉树分割(在给定方向上)。此限制适用于所有图片中的CU。

当如上所述禁止分割时，相应语法元素的发信被修改以解决被禁止的情况。例如，当识别出图6中的任一情况(即，对于中央划分(central partition)的CU禁止二进制分割)，语法元素mtt_split_cu_binary_flag(指定分割是二进制分割还是三分分割)未被发信，而是被解码器推断为等于0。

虚拟管线数据单元(Virtual Pipeline Data Unit，简写为VPDU)

虚拟管线数据单元(VPDU)被定义为画面中的非重叠单元。在硬件解码器中，连续的VPDU由多个管线级同时处理。在大多数管线级，VPDU大小与缓冲区大小大致成正比，因此保持VPDU大小较小很重要。在大多数硬件解码器中，VPDU大小可以设置为最大变换块(transform block，简写为TB)大小。然而，在VVC中，三叉树(TT)和二叉树(BT)划分可能会导致VPDU大小增加。

为了将VPDU大小保持为64x64亮度样本，在VTM中应用以下规范划分限制(具有语法信令修改)，如图7所示：

–对于宽度或高度等于128或宽度和高度都等于128的CU，不允许进行TT拆分(如图7中的“X”所示)。

–对于N≤64(即宽度等于128且高度小于128)的128xN CU，不允许水平BT。

对于N≤64(即高度等于128且宽度小于128)的Nx128CU，不允许垂直BT。在图7中，亮度块大小为128x128。虚线表示块大小为64x64。根据上述限制，不允许分划分的例子用“X”表示，如图7中的各种例子(710-780)所示。

帧内色度(Intra Chroma)划分和预测限制(Prediction Restriction)

在典型的硬件视频编码器和解码器中，由于相邻帧内块(neighboring intrablock)之间的样本处理数据依赖性，当图片具有更多小帧内块(small intra block)时处理吞吐量下降。帧内块的预测子生成需要来自相邻块的顶部和左侧边界重建样本。因此，必须逐块顺序地处理帧内预测。

在HEVC中，最小的帧内CU是8x8亮度样本。最小帧内CU的亮度分量可以进一步分割为4个4x4亮度帧内预测单元(Pus)，但最小帧内CU的色度分量不能进一步分割。因此，当处理4x4色度帧内块或4x4亮度帧内块时，会出现最坏情况的硬件处理吞吐量。在VVC中，为了提高最坏情况下的吞吐量，通过限制色度帧内CB(chroma intra CB)的划分，不允许小于16个色度样本(大小2x2、4x2和2x4)的色度内CB和宽度小于4个色度样本(大小2xN)的色度内CB。

在单个编解码树中，最小色度帧内预测单元(smallest chroma intraprediction unit，简写为SCIPU)被定义为色度块大小大于或等于16个色度样本并且具有至少一个小于64亮度样本的子亮度块的编解码树节点，或者其色度块大小不是2xN，并且至少有一个子亮度块4xN亮度样本的编码树节点。要求在每个SCIPU中，所有CB都是帧间(inter)的，或者所有的CB都是非帧间(non-inter)的，即帧内(intra)或帧内块复制(intrablock copy，简写为IBC)。在非帧间SCIPU的情况下，还要求非帧间SCIPU的色度不应该被进一步分割并且SCIPU的亮度被允许进一步分割。这样，大小小于16个色度样本或大小为2xN的小色度帧内CB被移除。此外，在非帧间SCIPU的情况下不应用色度缩放。在这里，不发信额外的语法，并且SCIPU是否是非帧间的可以通过SCIPU中的第一个亮度CB的预测模式来导出。如果当前切片是I切片(I-slice)，或者当前SCIPU在进一步分割一次后有4x4亮度划分，则推断SCIPU的类型为非帧间(因为VVC不允许帧间4x4)；否则，在解析SCIPU中的CU之前，通过一个标志指示SCIPU的类型(帧间或非帧间)。

对于图片内(intra picture)中的双树(dual tree)，通过分别针对4xN和8xN色度划分禁用垂直二元和垂直三元分割来移除2xN帧内色度块。大小为2x2、4x2和2x4的小色度块也通过划分限制被删除。

另外，通过考虑图片宽度和高度是max(8，MinCbSizeY)的倍数，考虑对图片尺寸的限制以避免图片角处的2x2/2x4/4x2/2xN帧内色度块。

具有67种帧内预测模式的帧内模式编解码

为了捕获自然视频中呈现的任意边缘方向(arbitrary edge direction)，VVC中的定向帧内模式(directional intra mode)的数量从HEVC中使用的33个扩展到65个。HEVC中没有的新定向模式在图8中被描绘为红色虚线箭头，平面(planar)和DC模式保持不变。这些更密集的定向帧内预测模式适用于所有块大小以及亮度和色度帧内预测。

在VVC中，针对非方形块，几种传统的角度帧内预测模式被适应性地替换为广角帧内预测模式。

在HEVC中，每个帧内编解码块具有正方形形状并且其每条边的长度是2的幂。因此，不需要除法操作(division operation)来使用DC模式生成帧内预测子(intra-predictor)。在VVC中，块可以具有矩形形状，这在一般情况下需要对每个块使用除法运算。为了避免DC预测的除法操作，只有较长的边用于计算非方形块的平均值。

为了保持最可能模式(most probable mode，简写为MPM)列表生成的复杂性较低，通过考虑两个可用的相邻帧内模式，使用具有6个MPM的帧内模式编解码方法。构建MPM列表考虑以下三个方面：

–默认帧内模式

–相邻帧内模式

–导出的帧内模式。

统一的(unified)6-MPM列表用于帧内块，而不管是否应用MRL和ISP编解码工具。MPM列表是基于左侧和上方相邻块的帧内模式构建的。假设左侧的模式记为Left，上方块的模记为Above，则统一的MPM列表构造如下：

–当相邻块不可用时，其帧内模式默认设置为Planar。

–如果Left和Above两种模式都是非角度模式(non-angular mode)：

–MPM列表→{Planar,DC,V,H,V-4,V+4}

–如果Left和Above模式之一是角度模式(angular mode)，另一个是非角度模式：

–将模式Max设置为Left和Above中的较大模式

–MPM列表→{Planar,Max,DC,Max-1,Max+1,Max-2}

–如果Left和Above都是有角度的并且它们不同：

–将模式Max设置为Left和Above中的较大模式

–如果模式Left和Above的差异在2到62的范围内，包括2和62

·MPM列表→{Planar,Left,Above,DC,Max-1,Max+1}

–否则

·MPM列表→{Planar,Left,Above,DC,Max-2,Max+2}

–如果Left和Above都是有角度的并且它们是相同的：

–MPM列表→{Planar,Left,Left-1,Left+1,DC,Left-2}

此外，MPM索引码字的第一个位元子(bin)是CABAC上下文编解码的。总共使用了三个上下文，对应于当前帧内块是启用MRL、启用ISP还是正常帧内块。

在6MPM列表生成过程中，修剪(pruning)用于去除重复的模式，使得只有独特的模式可以被包括到MPM列表中。对于61种非MPM模式的熵编解码，使用截断的二进制编解码(Truncated Binary Code，简写为TBC)。

非正方形块的广角帧内预测

常规角度帧内预测方向被定义为顺时针方向从45度到-135度。在VVC中，几种传统的角度帧内预测模式被适应性地替换为非方形块的广角帧内预测模式。替换的模式使用原始模式索引发信，原始模式索引在解析后重新映射到广角模式的索引。帧内预测模式总数不变，即67，且帧内模式编解码方法不变。

为了支持这些预测方向，长度为2W+1的顶部参考和长度为2H+1的左侧参考分别如图9A和图9B被定义。

广角方向模式中替换模式的数量取决于块的纵横比。替换的帧内预测模式如表2所示。

表2–广角模式替换的帧内预测模式

纵横比	替换的帧内预测模式
		W/H＝＝16	模式12,13,14,15
W/H＝＝8	模式12,13
		W/H＝＝4	模式2,3,4,5,6,7,8,9,10,11
W/H＝＝2	模式2,3,4,5,6,7,
		W/H＝＝1	无
W/H＝＝1/2	模式61,62,63,64,65,66
		W/H＝＝1/4	模式57,58,59,60,61,62,63,64,65,66
W/H＝＝1/8	模式55,56
		W/H＝＝1/16	模式53,54,55,56

如图10所示，在广角帧内预测的情况下，两个垂直相邻的预测样本(样本1010和1012)可能使用两个不相邻的参考样本(样本1020和1022)。因此，将低通参考样本滤波器和边平滑(side smoothing)应用于广角预测，以减少增加的间隙Δp_α的负面影响。如果广角模式表示非分数偏移。广角模式中有8个模式满足这个条件，分别是[-14,-12,-10,-6,72,76,78,80]。当通过这些模式预测块时，直接复制参考缓冲区中的样本而不应用任何插值。通过此修改，需要平滑的样本数量减少了。此外，它对齐(align)了传统预测模式和广角模式中非分数模式的设计。

在VVC中，支持4:2:2和4:4:4以及4:2:0色度格式。4:2:2色度格式的色度导出模式(derived mode，简写为DM)导出表最初是从HEVC移植的，将条目数从35扩展到67，以与帧内预测模式的扩展保持一致。由于HEVC规范不支持-135°以下和45°以上的预测角度，从2到5的亮度帧内预测模式映射到2。因此，用于4:2:2色度格式的色度DM推导表透过替换映射表(mapping table)条目的一些值来更新，以更精确地转换色度块的预测角度。

模式相关帧内平滑(Mode Dependent Intra Smoothing，简写为MDIS)

四抽头(Four-tap)帧内插值滤波器被用来提高定向帧内预测精度(directionalintra prediction accuracy)。在HEVC中，双抽头线性插值滤波器已用于在定向预测模式(即不包括平面和DC预测子)中生成帧内预测块。在VVC中，简化的6位4抽头高斯插值滤波器仅用于定向帧内模式。非定向帧内预测过程未修改。4抽头滤波器的选择是根据提供非分数位移的定向帧内预测模式的MDIS条件执行的，即除以下模式外的所有定向模式：2、HOR_IDX、DIA_IDX、VER_IDX、66。

根据帧内预测模式，执行以下参考样本处理：

–定向帧内预测模式分为以下几组之一：

–垂直或水平模式(HOR_IDX、VER_IDX)，

–表示45°倍数的角度的对角线模式(2、DIA_IDX、VDIA_IDX)，

–剩余的定向模式；

–如果定向帧内预测模式属于A组，则不对参考样本应用滤波器来生成预测样本；

–否则，如果模式属于B组，则可以将[1,2,1]参考样本滤波器(取决于MDIS条件)应用于参考样本，以根据所选的方向进一步将这些滤波的值复制到帧内预测子中，但不应用插值滤波器；

–否则，如果模式被分类为属于C组，则仅将帧内参考样本插值滤波器应用于参考样本以生成预测样本，该预测样本根据所选方向落入参考样本之间的小数或整数位置(不执行参考样本滤波)。

交叉分量线性模型(Cross-Component Linear Model，简写为CCLM)预测

为了减少交叉分量冗余，在VVC中使用交叉分量线性模型(CCLM)预测模式，其中通过使用线性模型基于相同CU的重建的亮度样本来预测色度样本如下：

pred_C(i,j)＝α·rec_L′(i,j)+β (1)

其中pred_C(i,j)表示CU中预测的色度样本，rec_L(i,j)表示同一CU的下采样的重建的亮度样本(downsampled reconstructed luma sample)。

CCLM参数(α和β)由最多四个相邻色度样本及其相应的下采样的亮度样本导出。假设当前色度块维度为W×H，则W'和H'设置为

当应用LM模式时，W’＝W,H’＝H；

当应用LM-A模式时，W’＝W+H；

当应用LM-L模式时，H’＝H+W；

上述相邻位置记为S[0，-1]…S[W'-1，-1]，左相邻位置记为S[-1，0]…S[-1，H'-1]。然后选择四个样本作为

–当应用LM模式，且上方和左侧相邻样本可用时，S[W’/4,-1],S[3*W’/4,-1],S[-1,H’/4],S[-1,3*H’/4]；

–当应用LM-A模式，且仅上方相邻样本可用时，S[W’/8,-1],S[3*W’/8,-1],S[5*W’/8,-1],S[7*W’/8,-1]；

–当应用LM-L模式，且仅左侧相邻样本可用时，S[-1,H’/8],S[-1,3*H’/8],S[-1,5*H’/8],S[-1,7*H’/8]；

所选位置处的四个相邻亮度样本被下采样并比较四次以找到两个较小的值：x⁰ _A和x¹ _A，以及两个较大的值：x⁰ _B和x¹ _B。它们对应的色度样本值表示为y⁰ _A,y¹ _A,y⁰ _B和y¹ _B。x_A,x_B,y_A和y_B导出为：

Xa＝(x0A+x1A+1)>>1；

Xb＝(x0B+x1B+1)>>1；

Ya＝(y0A+y1A+1)>>1；

Yb＝(y0B+y1B+1)>>1 (2)

最后，根据以下等式获得线性模型参数α和β。

β＝Y_b-α·X_b (4)

图11显示了CCLM模式中涉及的当前块的样本以及左侧和上方样本的位置示例。图11显示了N×N色度块1110、相应的2N×2N亮度块1120及其相邻样本(显示为实心圆)的相对样本位置。

计算参数α的除法运算是通过查找表实现的。为了减少存储表所需的内存，diff值(最大值和最小值之间的差)和参数α用指数表示法表示。例如，diff由一个4位有效部分(significant part)和一个指数来近似。因此，对于16个有效数值(significand values)，1/diff的表被简化为16个元素(elements)，如下所示：

DivTable[]＝{0,7,6,5,5,4,4,3,3,2,2,1,1,1,1,0} (5)

这将具有降低计算复杂性以及存储所需表格所需的存储器大小的益处。

上方模板(above template)和左侧模板(left template)

可以一起用于计算线性模型系数外，它们还可以可选

地用于其他2种LM模式，称为LM_A和LM_L模式。

在LM_A模式下，仅使用上方模板计算线性模型系数。

为了获得更多样本，将上方模板扩展为(W+H)。在LM_L

模式下，只使用左侧模板计算线性模型系数。

为了获得更多样本，将左侧模板扩展为(H+W)。

对于非正方形块，将上方模板扩展为W+W，将左侧模板扩展为H+H。

为了匹配4:2:0视频序列的色度样本位置，将两种类型的下采样滤波器应用于亮度样本以在水平和垂直方向上实现2比1的下采样比率。

下采样滤波器的选择由SPS级别标志指定。

两个下采样滤波器如下，分别对应“type-0”和“type-2”内容。

Rec_L′(i,j)＝[rec_L(2i-1,2j-1)+2·rec_L(2i-1,2j-1)+rec_L(2i+1,2j-1)+rec_L(2i-1,2j)+2·rec_L(2i,2j)+rec_L(2i+1,2j)+4]＞＞3 (6)

Rec_L′(i,j)＝rec_L(2i,2j-1)+rec_L(2i-1,2j)+4·rec_L(2i,2j)+rec_L(2i+1,2j)+rec_L(2i,2j+1)+4]＞＞3 (7)

注意，当上方参考线(upper reference line)在CTU边界处时，仅使用一条亮度线(帧内预测中的通用线缓冲器)来制作下采样的亮度样本。

该参数计算作为解码过程的一部分执行，而不仅仅是作为编码器搜索操作。因此，没有语法用于将α和β值传送给解码器。

对于色度帧内模式编解码，色度帧内模式编解码总共允许8种帧内模式。这些模式包括五种传统帧内模式和三种跨分量线性模型模式(CCLM、LM_A和LM_L)。色度模式信令和推导过程如表3所示。色度模式编解码直接取决于相应亮度块的帧内预测模式。由于在I切片中启用了用于亮度和色度分量的单独块划分结构，所以一个色度块可以对应于多个亮度块。因此，对于色度DM模式，直接继承覆盖当前色度块中心位置的对应亮度块的帧内预测模式。

表-1–当启用cclm时从亮度模式导出色度预测模式

如表4所示，无论sps_cclm_enabled_flag的值如何，都使用单个二值化表。

表2–用于色度预测模式的统一二值化表

在表4中，第一个位元子表示它是常规(0)还是LM模式(1)。如果是LM模式，则下一个位元子表示是否为LM_CHROMA(0)。如果不是LM_CHROMA，则下一个位元子表示是LM_L(0)还是LM_A(1)。对于这种情况，当sps_cclm_enabled_flag为0时，对应intra_chroma_pred_mode的二值化表的第一个位元子可以在熵编解码之前被丢弃。或者，换句话说，第一个位元子被推断为0，因此未被编解码。此单个二值化表用于sps_cclm_enabled_flag等于0和1的情况。表4中的前两个位元子使用其自己的上下文模型进行上下文编进而码，其余位元子进行旁路编解码。

此外，为了减少双树中的亮度-色度延迟，当64x64亮度编解码树节点不分割(并且64x64 CU不使用ISP)或使用QT划分时，32x32/32x16色度编解码树节点中的色度CU允许通过以下方式使用CCLM：

–如果32x32色度节点不分割或使用QT分割划分，则32x32节点中的所有色度CU都可以使用CCLM

–如果32x32色度节点采用水平BT划分，32x16子节点不分割或使用垂直BT分割，则32x16色度节点中的所有色度CU都可以使用CCLM。

在所有其他亮度和色度编解码树分割条件下，CCLM不允许用于色度CU。

位置相关(Position Dependent)帧内预测组合

在VVC中，DC、平面和若干角度模式的帧内预测结果通过位置相关帧内预测组合(position dependent intra prediction combination，简写为PDPC)方法进一步修改。PDPC是一种帧内预测方法，它调用未滤波的边界参考样本和HEVC样式的帧内预测搭配滤波的边界参考样本的组合。PDPC应用于以下帧内模式而无需信令(without signaling)：平面、DC、水平、垂直、左下角模式及其八个相邻角度模式(angular mode)、右上角模式及其八个相邻角度模式。

使用帧内预测模式(DC、平面、角度)和参考样本的线性组合根据如下的等式(8)预测预测样本pred(x’,y’)：

pred(x’,y’)＝(wL×R_-1,y’+wT×R_x’,-1-wTL×R_-1,-1+(64-wL-wT+wTL)×pred(x’,y’)+32)>>6 (8)

其中R_x,-1,R_-1,y分别表示位于当前样本(x,y)上方和左侧边界的参考样本，R_-1,-1表示位于当前块左上角的参考样本。

如果PDPC应用于DC、平面、水平和垂直帧内模式，则不需要额外的边界滤波器，如在HEVC DC模式边界滤波器或水平/垂直模式边缘滤波器的情况下所需要的。DC和平面模式的PDPC过程是相同的，并且避免了削波操作。对于角度模式，调整PDPC比例因子，这样就不需要范围检查，并且删除启用PDPC的角度条件(使用>＝0的比例(scale>＝0))。此外，在所有角度模式情况下，PDPC权重均基于32。PDPC权重取决于预测模式，如表5所示。PDPC应用于宽度和高度均大于或等于4的块。

表3–依据预测模式的PDPC权重的示例

图12A-D说明了应用于各种预测模式的PDPC的参考样本(R_x,-1,R_-1,y和R_-1,-1)的定义，其中图12A对应于对角线右上角模式，图12B对应于对角线左下角模式，图12C对应于相邻对角线右上角模式，图12D对应于相邻对角线左下角模式。预测样本pred(x’,y’)位于预测块内的(x',y')处。例如，参考样本R_x,-1的坐标x由下式给出：x＝x'+y'+1，参考样本R_-1,y的坐标y类似地由下式给出：y＝x'+y'+1用于对角(diagonal)模式。对于其它角度模式，参考样本R_x,-1和R_-1,y可以位于分数样本位置。在这种情况下，使用最近的整数样本位置的样本值。

多参考线(Multiple Reference Line，简写为MRL)帧内预测

多参考线(MRL)帧内预测使用更多参考线用于帧内预测。图13描述了4条参考线的示例，其中片段(segment)A和F的样本不是从重建的相邻样本中提取的，而是分别用片段B和E中最接近的样本填充的。HEVC画面内预测使用最近的参考线(即参考线0)。在MRL中，使用了2条附加线(参考线1和参考线3)。

所选参考线的索引(mrl_idx)被发信并用于生成帧内预测子。对于大于0的参考线idx，仅在MPM列表中包括额外的参考线模式并且仅发信mpm索引而不发信剩余模式。参考线索引在帧内预测模式之前发信，并且在发信非零参考线索引的情况下，平面模式被排除在帧内预测模式之外。

MRL对于CTU内的块的第一行被禁用以防止使用当前CTU行之外的扩展参考样本。此外，当使用附加线时，PDPC(Position-Dependent Prediction Combinatio，位置相关预测组合)将被禁用。对于MRL模式，非零参考线索引的DC帧内预测模式中DC值的推导与参考线索引0的推导对齐。MRL需要存储CTU的3个相邻的亮度参考线以生成预测。交叉分量线性模型(CCLM)工具还需要3条相邻的亮度参考线用于其下采样滤波器。MRL的定义与CCLM一致去使用相同3行，以减少解码器的存储要求。

具有CU级别权重的双向预测(Bi-prediction with CU-level weight，简写为BCW)

在HEVC中，通过对从两个不同的参考图片获得的两个预测信号求平均和/或使用两个不同的运动矢量来生成双向预测信号。在VVC中，双向预测模式被扩展到简单的平均之外，以允许对两个预测信号进行加权平均。

P_bi-pred＝((8-w)*P₀+w*P₁+4)＞＞3 (9)

加权平均双向预测允许五个权重，w∈{-2,3,4,5,10}。对于每个双向预测的CU，权重w由以下两种方式之一确定：1)对于非合并CU，权重索引在运动向量差异之后发信；2)对于合并CU，权重索引是根据合并候选索引从相邻块中推断出来的。BCW仅适用于具有256个或更多亮度样本的CU(即，CU宽度乘以CU高度大于或等于256)。对于低延迟图片，使用所有5个权重。对于非低延迟图片，仅使用3个权重(w∈{3,4,5})。

在编码器处，应用快速搜索算法来查找权重索引，而不会显著增加编码器的复杂性。这些算法总结如下。有关更多详细信息，请参阅VTM软件和文件JVET-L0646(Yu-Chi Su等人，“CE4-related:Generalized bi-prediction improvements combined from JVET-L0197 and JVET-L0296”，ITU-T SG 16WP 3和ISO/IEC JTC 1/SC 29联合视频专家团队(JVET)，第12次会议：中国澳门，2018年10月3-12日，文件：JVET-L0646)。当与AMVR结合时，如果当前图片是低延迟图片，则仅针对1像素和4像素运动矢量精度有条件地检查不等权重。

当与仿射相结合时，当且仅当仿射模式被选为当前最佳模式时，才会对不等权重(unequal weight)执行仿射ME。

当双向预测中的两个参考图片相同时，仅有条件地检查不等权重。

当满足某些条件时不搜索不等权重，这取决于当前图片与其参考图片之间的POC距离、编解码QP和时间级别。

BCW权重指数使用一个上下文编解码的位元子和旁路编解码的位元子进行编解码。第一个上下文编码的位元子指示是否使用相等的权重；如果使用不等权重，则使用旁路编解码发信额外的位元子，以指示使用了哪个不等权重。

加权预测(weighted prediction，简写为WP)是H.264/AVC和HEVC标准支持的编解码工具，用于有效编解码具有衰落的视频内容。对WP的支持也被添加到VVC标准中。WP允许为每个参考图片列表L0和L1中的每个参考图片发送加权参数(权重和偏移)。然后，在运动补偿期间，应用相应参考图片的权重和偏移。WP和BCW不同类型的视频内容而设计。为了避免WP和BCW之间的相互作用(这会使VVC解码器设计复杂化)，如果CU使用WP，则BCW权重索引不被发信，并且w被推断为4(即应用相等的权重)。对于合并CU，权重索引是根据合并候选索引从相邻块中推断出来的。这可以应用于普通合并模式和继承的仿射合并模式。对于构造的仿射合并模式，仿射运动信息是基于最多3个块的运动信息构造的。使用构造的仿射合并模式的CU的BCW索引被简单地设置为等于第一个控制点MV的BCW索引。

在VVC中，CIIP和BCW不能一起应用于一CU。当CU采用CIIP模式编解码时，当前CU的BCW索引设置为2，例如，权重相等。

ITU-T SG16 WP3和ISO/IEC JTC1/SC29/WG11的联合视频专家组(JVET)目前正在探索下一代视频编解码标准。增强压缩模型2(Enhanced Compression Model 2，简写为ECM2)中采用了一些有前途的新编解码工具(M.Coban等人，“Algorithm description ofEnhanced Compression Model 2(ECM 2)”，ITU-TSG16 WP3和ISO/IEC JTC1/SC29/WG11的联合视频专家组(JVET)，第23次会议，通过电话会议，2021年7月7日至16日，文件JVET-W2025)以进一步改进VVC。采用的新工具已在参考软件ECM-2.0中实现(ECM参考软件ECM-2.0，可在https://vcgit.hhi.fraunhofer.de/ecm/ECM[Online]获得)。特别地，已经开发了一种用于联合预测残差变换块中变换系数级别的符号集合的新方法(JVET-D0031，FelixHenry等人，“Residual Coefficient Sign Prediction”，ITU-T SG16 WP3和ISO/IECJTC1/SC29/WG11的联合视频专家组(JVET)，第4次会议：中国成都，2016年10月15-21日，文件JVET-D0031)。在ECM2中，为了得出残差变换块的最佳符号预测假设，将成本函数定义为跨块边界的不连续性度量，如图14所示，其中块1410对应于变换块，圆圈1420和1422对应于相邻块样本和圆圈1430和1432对应于与块1410的符号(sign)候选相关联的重建样本。成本函数被定义为上方行和左侧列的残差域中的绝对二阶导数之和，如下所示：

上式中，R为重建相邻，P为当前块的预测，r为残差假设。变换块中每个符号预测假设(hypothesis)的允许的最大预测符号个数N_sp在序列参数集(SPS)中发信，并且在ECM-2.0中被限制为小于或等于8。为所有假设测量成本函数，并选择具有最小成本的假设作为系数符号的预测子(predictor)。仅允许将来自变换块中左上角4x4变换子块区域(具有最低频率系数)的系数符号包含在假设中。根据左上角4x4子块上的光栅扫描顺序收集和编解码前N_sp个(first N_sp)非零系数(如果可用)的符号。对于那些预测的系数，代替系数符号，指示预测的符号是否等于所选假设的符号预测位元子被发信。这个符号预测位元子是上下文编解码的，其中所选上下文是从系数是否为DC中导出的。上下文针对块内块(intra block)和块间块(inter block)以及亮度和色度分量是分开的。对于那些没有符号预测的其他系数，相应的符号在旁路模式下由CABAC编解码。

色度残差联合编码

VVC支持色度残差联合编解码(joint codingof chroma residual，简写为JCCR)工具，其中色度残差被联合编解码。JCCR模式的使用(激活)由TU级标志tu_joint_cbcr_residual_flag指示，所选模式由色度CBF隐式指示。如果TU的一个或两个色度CBF等于1，则存在标志tu_joint_cbcr_residual_flag。在PPS(图片参数集)和切片报头中，发信色度QP偏移值用于JCCR模式，以区别于为常规色度残差编解码模式发信的通常的色度QP偏移值。这些色度QP偏移值用于导出使用JCCR模式编解码的某些块的色度QP值。JCCR模式有3个子模式。当相应的JCCR子模式(表1中的子模式2)在TU中处于活动状态时，此色度QP偏移量会在该TU的量化和解码期间添加到应用的亮度导出的色度QP。对于其他JCCR子模式(表6中的子模式1和3)，色度QP的导出方式与传统Cb或Cr块相同。传输的变换块的色度残差(resCb和resCr)的重建过程展示在表1中。当JCCR模式被激活时，发信一个单一的联合色度残差块(表1中resJointC[x][y])，Cb的残差块(resCb)和Cr的残差块(resCr)是考虑诸如tu_cbf_cb、tu_cbf_cr和CSign之类的信息而导出的，CSign是切片报头中指定的符号值。

在编码器侧，联合色度分量的导出如下所述。根据模式(在上表中列出)，resJointC{1,2}由编码器生成，如下所示：

如果模式对于2(单个残差，重建Cb＝C,Cr＝CSign*C),联合残差的确定如下

resJointC[x][y]＝(resCb[x][y]+CSign*resCr[x][y])/2

否则，如果模式等于1(单个残差，重建Cb＝C,Cr＝(CSign*C)/2),联合残差的确定如下

resJointC[x][y]＝(4*resCb[x][y]+2*CSign*resCr[x][y])/5

否则(模式等于3，即,单个残差，重建Cr＝C,Cb＝(CSign*C)/2),联合残差的确定如下

resJointC[x][y]＝(4*resCr[x][y]+2*CSign*resCb[x][y])/5

表6.重建色度残差。值CSign是一个符号值(+1或-1)，在切片报头中指定，resJointC[][]是传输的残差。

上述三种联合色度编解码子模式仅在I切片中被支持。在P和B切片中，仅支持模式2。因此，在P和B切片中，语法元素tu_joint_cbcr_residual_flag仅在两个色度cbfs均为1时才存在。

JCCR模式可以与色度变换跳过(transform skip，简写为TS)模式组合(TS模式的更多细节可以在JVET-T2002的Section 3.9.3中找到)。为了加快编码器决策，JCCR变换选择取决于Cb和Cr分量的独立编解码是选择DCT-2还是TS作为最佳变换，以及独立色度编解码中是否存在非零系数。具体来说，如果一个色度分量选择DCT-2(或TS)而另一个分量全为零，或者两个色度分量都选择DCT-2(或TS)，那么在JCCR编码中只会考虑DCT-2(或TS)。否则，如果一个分量选择DCT-2而另一个分量选择TS，那么DCT-2和TS都将在JCCR编码中考虑。

【发明内容】

有鉴于此，本发明提供以下技术方案：

本发明提供一种视频编解码方法，包括接收与当前块相关联的输入数据，其中，输入数据包括编码器侧待编码的当前块的像素数据或解码器侧与当前块相关联的待解码的编码数据；确定与编解码模式或模式参数相关的一组候选；确定与该组候选相关联的边界匹配成本，其中，藉由对该组候选中的每一个目标候选，通过使用(1)根据该每一目标候选确定的该当前块的重建或预测的样本以及(2)该当前块的一个或多个相邻块的相邻重建的或预测的样本，来确定每个边界匹配成本，并且其中每个边界匹配成本是使用从多个配置中选择的一个目标配置来计算的；基于边界匹配成本从组候选中确定最终候选；以及使用最终候选对当前块进行编码或解码。

本发明提供一种用于视频编解码的装置，装置包括一个或多个电子设备或处理器，用于：接收与当前块相关联的输入数据，其中，输入数据包括编码器侧待编码的当前块的像素数据或解码器侧与当前块相关联的待解码的编码数据；确定与编解码模式或模式参数相关的一组候选；确定与该组候选相关联的边界匹配成本，其中，藉由对该组候选中的每一个目标候选，通过使用(1)根据该每一目标候选确定的该当前块的重建或预测的样本以及(2)该当前块的一个或多个相邻块的相邻重建的或预测的样本，来确定每个边界匹配成本，并且其中每个边界匹配成本是使用从多个配置中选择的一个目标配置来计算的；基于边界匹配成本从组候选中确定最终候选；以及使用最终候选对当前块进行编码或解码。

本发明的视频编解码方法及相应装置可以提高编解码性能。

【附图说明】

结合在本说明书中并构成本说明书一部分的附图示出了本发明的实施例，并且与说明书一起用于解释本发明的原理：

图1A说明了包含循环处理的示例性适应性帧间/帧内视频编解码系统。

图1B图示了图1A中的编码器的相应解码器。

图2示出了对应于垂直二元分割(SPLIT_BT_VER)、水平二元分割(SPLIT_BT_HOR)、垂直三元分割(SPLIT_TT_VER)和水平三元分割(SPLIT_TT_HOR)的多类型树结构的示例。

图3示出了具有嵌套多类型树编解码树结构的四叉树中的划分分割信息的信令机制的示例。

图4示出了CTU被划分为具有四叉树和嵌套多类型树编解码块结构的多个CU的示例，其中粗体块边缘表示四叉树划分而其余边缘表示多类型树划分。

图5显示了当亮度编解码块的宽度或高度大于64时禁止TT分割的示例。

图6示出了二叉树分割和三叉树分割的冗余分割模式的示例。

图7显示了当亮度编解码块的宽度或高度大于64时禁止TT分割的一些例子。

图8显示了VVC视频编解码标准采用的帧内预测模式。

图9A-B图示了宽度大于高度的块(图9A)和高度大于宽度的块(图9B)的广角帧内预测的示例。

图10图示了在广角帧内预测的情况下使用两个不相邻参考样本的两个垂直相邻预测样本的示例。

图11示出了CCLM模式中涉及的当前块的样本和左侧及上方样本位置示例。

图12A-D图示了应用于各种预测模式的PDPC的参考样本定义的示例，其中图12A对应于对角右上模式，图12B对应于对角左下模式，图12C对应于相邻对角线右上模式，图12D对应于相邻对角线左下模式。

图13示出了多参考线(MRL)帧内预测使用更多参考线进行帧内预测的示例。

图14示出了边界匹配成本计算中涉及的边界像素的示例。

图15示出了根据本发明的一个实施例的方向性边界匹配的例子，包括除了水平和垂直方向之外的角度方向。

图16示出了根据本发明的一个实施例的基于当前块与一个或多个相邻块之间的运动矢量的相似性/差异性来选择性地排除顶部或左侧区域以用于边界匹配计算的示例。

图17示出了根据本发明的一个实施例的通过对参考块及其L形相邻区域的上下文分析来选择性地排除顶部或左侧区域以用于边界匹配计算的另一示例。

图18示出了根据本发明的一个实施例的示例性视频编解码系统的流程图，该系统利用基于当前块及其相邻块的编码上下文的选择性边界匹配。

【具体实施方式】

容易理解的是，如本文附图中大体描述和图示的本发明的组件可以以多种不同的配置来布置和设计。因此，以下对如图所示的本发明的系统和方法的实施例的更详细描述并不旨在限制所要求保护的本发明的范围，而仅代表本发明的选定实施例。贯穿本说明书对“一实施例”、“一个实施例”或类似语言的引用意味着结合该实施例描述的特定特征、结构或特性可以包括在本发明的至少一个实施例中。因此，贯穿本说明书各处出现的短语“在一实施例中”或“在一个实施例中”不一定都指代相同的实施例。

此外，所描述的特征、结构或特性可以以任何合适的方式组合在一个或多个实施例中。然而，相关领域的技术人员将认识到，本发明可以在没有一个或多个特定细节的情况下，或使用其他方法、组件等来实践。在其他情况下，未显示或未显示众所周知的结构或操作详细描述以避免模糊本发明的方面。参考附图将最好地理解本发明的所示实施例，其中相同的部分自始至终由相同的数字表示。下面的描述仅旨在作为示例，并且简单地说明与如本文要求保护的本发明一致的设备和方法的某些选定实施例。

在当前新兴的国际视频标准的发展过程中，提出了越来越多的编解码模式。通常，需要发信选定的编解码模式，以便解码可以使用相同的编码模式。随着编解码模式的增加，需要更多的数据来表示与编解码模式相关的语法元素。因此，需要开发技术来减少甚至消除发信相关语法元素所需的数据。用于ECM2.0中使用的变换系数的联合符号编解码的边界匹配(boundary matching)技术说明了一种技术，即编码器和解码器都可以根据相邻数据进行相同的成本评估，以选择最小成本函数(smallest cost function)的符号组合(signcombination)。在本发明中，使用块边界匹配(block boundary matching)方法来提高性能。

边界平滑度测量的附加角度

与仅包括垂直(用于顶部)或水平(用于左侧)方向匹配(direction matching)(例如ECM内的残差符号预测)的传统边界匹配算法相比，在所提出的方法中，边界匹配标准不仅包括垂直(对于顶部边缘)和/或水平(对于左边缘)，还有一些其他角度。如图15所示，传统的边界匹配是垂直比较像素1510；所提出的边界匹配方法可以在对角线方向(在右上方向1520或左上方向1530的角度)上比较像素。对于其他角度，可以使用滤波器(例如FIR滤波器)对像素的小数位置进行插值(例如，如果角度指向的对应位置不是像素的整数位置)

匹配过程的角度可以被明确地发信或隐式地导出(在解码过程中)。

在一个实施例中，平滑度匹配角度(smoothness matching angle)可以在CU/PU/CTU基础上明确地发信，它也可以由相邻CU预测(例如，发信左侧或顶部相邻CU的平滑度匹配角度和细节角度(detail angle)差异。)

在另一个实施例中，可以隐含地决定平滑度匹配角度。在一个实施例中，该角度由帧内(intra-mode)模式决定(例如，在VVC中，帧内编解码模式有各种角度，帧内模式指定的角度可以重新用作边界平滑度匹配角度)。在另一个实施例中，可以通过对当前L形(当前L形是当前CU周围的顶部、左侧和/或左上角像素区域)的上下文分析来决定角度，例如角度分析(使用角度滤波器)或一些角度滤波器的角度直方图。

在另一个实施例中，角度可以部分地发信，部分地隐含地决定。在一个示例中，编码器可以发送一个粗略角度(coarse angle)并且解码器导出一个精细角度(fine-angle)。粗略角度和导出的精细角度可以组合在一起形成最终角度。在另一示例中，编码器可以发送一个精细角度，而解码器导出一个粗略角度。

角度确定后，边界匹配可以根据角度进行平滑匹配(沿方向比较像素)或梯度值匹配(沿方向比较梯度值)。

计算差异期间的值削波

在一些情况下，(当前CU周围的相邻像素的)L形可以是另一个对象(与当前CU的对象不同)。在这种情况下，边界平滑度匹配可能会造成损失。为了解决这个风险，提出了一种新方法。该方法在计算边界平滑度匹配时，会对样本匹配差值(sample matchingdifference)进行裁剪。以下是截断差异的示例。首先，预定义最小阈值和/或预定义最大阈值。然后，应用裁剪过程来调整差值。进行裁剪时，如果差值大于最大阈值，则设置为等于最大阈值；如果差异小于最小阈值，则将其设置为等于最小阈值。

在一个实施例中，限幅阈值可以是固定的。在另一个实施例中，限幅阈值可以在CTU级或图片级或序列级中发信。在又一实施例中，限幅阈值可以通过当前L形和当前预测子的上下文分析或直方图分析来隐含地决定。在又一个实施例中，可以根据原始视频比特深度或编解码器中的内部比特深度来隐式地决定剪切阈值。

基于运动矢量相似性的边界选择

可以隐式地执行边界选择。以下是隐式边界选择的一些示例。

在一些情况下，相邻像素可能与当前CU具有不连续性(例如，相邻CU位于另一个对象中)。在这种情况下，边界匹配方法可能会造成损失。因此，需要一种方法来决定是否信任相邻像素。

在这个提出的方法中，在一个实施例中，编解码信息被用来决定所信任的相邻像素。以编解码信息为当前块的至少两个运动矢量和当前块的一个或多个相邻块为例。如果该边(顶部或左侧)的相邻MV的MV与当前CU MV差异较大，则该边将被排除在边界匹配之外。用于相似性(或差异性)比较的MV可以是像素级(假设相邻区域和当前CU区域具有像素级MV)、子块级(假设相邻区域和当前CU区域具有子块级MV)或CU(块)级。

根据该方法的一个示例在图16中示出，其中块1610对应于当前CU，块1620对应于左侧相邻子块并且块1630对应于顶部相邻子块。左侧相邻子块的运动矢量标记为1622和1624。顶部相邻子块的运动矢量标记为1632、1634、1636和1638。左侧当前块的运动矢量标记为1611和1612。当前块靠近顶部的运动矢量被标记为1612、1614、1616和1618。如图16所示，当前块的运动矢量类似于左侧相邻子块的运动矢量并且当前块的运动矢量与顶部相邻子块的运动矢量非常不同。因此，只有左边界像素被包括在边界匹配计算中。预先定义了一个阈值来衡量运动矢量的相似性。在一种方式中，阈值被预定义为标准中的一个或多个固定值。另一种方式是根据MV取值范围(标准中定义)、块宽、块高、块面积、当前块或相邻编解码块的编解码信息或上下文来选择阈值。

在另一个实施例中，解码器可以参考相应的参考像素(参考图片1720中由当前CU1710的当前MV 1712指向的像素1730)和参考图片中的相应的L形区域1740，如图17所示。以下是参考块及其对应的L形相邻区域的上下文分析示例。如果顶部或左侧的相应L形像素1740与参考块1730非常不同，则它可以隐含地放弃(即，不使用)当前CU的相应侧。例如，如果顶边对应的L形像素与参考块差异很大，则当前块将不会使用当前L形的顶部像素进行匹配。

当启用JCCR时，同时考虑Cb和Cr块边界

在ECM 2.0中，有一种符号预测方法(通过边界匹配)的编解码工具，在JCCR情况下，边界匹配只应用于一个固定的颜色分量(例如固定比较Cb的边界匹配))

在该方法中，当针对JCCR情况通过边界匹配对残差进行符号预测时，建议同时考虑Cb和Cr块边界。

在一个实施例中，Cb像素和Cr像素都是边界匹配的，并且总失真(totaldistortion)被用来决定残差符号位(residual sign bit)。

在另一个实施例中，对Cb边界匹配结果和Cr边界匹配结果进行加权以确定剩余符号位。

在另一个实施例中，编码器可以发送信号以通知解码器选择Cb边界匹配或Cr边界匹配。

在另一个实施例中，Cb边界匹配和Cr边界匹配的加权(匹配成本的加权和)取决于JCCR模式。例如，如果在某种JCCR模式下，Cb比Cr更重要，那么Cb边界匹配在加权求和中将更重要。

在另一个子实施例中，它取决于当前预测值和相邻重建像素之间的差异。例如，如果Cb的当前预测值与相邻重建像素之间的差异远大于Cr的当前预测值与相邻重建像素之间的差异，则它对Cb边界匹配具有更高的权重(或者，在另一个示例中，跳过Cr边界匹配)。

仅基于水平边界的检查或子采样

在该方法中，为了降低边界匹配的复杂度，边界匹配可以仅基于水平边界。在可以通过边界匹配隐式选择具有N个不同变换核的多变换核的情况下，解码器将生成N个不同版本的逆变换并加回到预测子以进行N个不同版本的重建。然后，解码器将使用内核来实现最小的边界匹配成本。因此，无需与多内核选择相关的额外信令即可实现编解码增益。在解码器处，通常首先执行垂直逆变换，然后进行水平逆变换。根据本发明，对于边界匹配仅执行水平边界检查。理论上，我们只需要生成最左边的一列样本进行水平逆变换。因此，边界匹配计算的复杂度大大降低。

另一种节省多核选择复杂度的方法是对匹配样本进行子采样。因此，根据本实施例不需要生成所有逆变换样本。

L型的增强

在该方法中，为了提高边界匹配方法的编解码增益，改进当前的L形像素，提出如下一些实施例。

根据一个实施例，建议对边界像素进行降噪以获得更好的边界匹配质量。边界匹配过程将在降噪处理之后应用。

在另一个实施例中，提出进行一些MH(multi-hypothesi，多假设)混合(例如使用两个其他MH块的L形来稍微调整当前的L形)，例如，它将使用一个或多个MV并从参考图片(MV指向)中取出相应的L形像素进行一些混合，得到的L形像素将更好地进行边界匹配。

用于匹配的选择性边界区域

该提议方法的主要目的是避免不正确的边界像素用于匹配，此外，该方法是基于区域的(不使用整个顶部边缘或左侧边缘，而是仅使用顶部或左侧相邻像素的部分区域)。

在一个实施例中，如果对于某些区域，相邻MV(例如，子块单元)与当前MV有很大不同，则将放弃该区域的边界像素用于匹配。

在另一个实施例中，可以使用基于分割的方法对L形区域进行分析。换句话说，本实施例将根据L形的对象(object)形状来分割和判断相邻的L形。然后，它可以通过排除边界匹配的相应区域来避免来自不同对象的边界匹配。

用于计算平滑度的适应性线数

在该提议的方法中，适应性地改变用于边界平滑度计算的线的数量。在一个示例中，它可以根据一些尺寸条件、内容条件等使用或多或少的相邻边界线来计算边界平滑度。边界平滑度计算可以对应于像素平滑度、梯度平滑度或角度平滑度。

在一个实施例中，对于更大的CU，它将使用更多的线来进行边界匹配。

在另一个实施例中，对于较小的CU，它将使用较少的线来进行边界匹配。

在又一个实施例中，对于窄CU，它将使用更多线用于更短的边缘以进行边界匹配。对于低纹理CU，它将使用更多线。

在又一个实施例中，对于其中顶部和/或左侧相邻像素具有高度纹理的像素周围的高纹理(high-texture)CU，它将使用较少的线用于边界匹配。

BCW加权选择与仅预测子隐式选择(Predictor-only Implicit Selection)或语法重新排序

边界匹配也可以应用于BCW加权选择以节省BCW加权语法比特率。例如，我们可以在解码器端生成具有不同BCW加权假设的预测子，将不同的加权假设结果添加到残差中，以制作不同假设版本的重建块。然后将边界匹配应用于那些不同版本的重建块，以便在解码器侧选择BCW加权决策最佳的一个。

除了上述方法之外，下面还公开了基于边界匹配的BCW加权语法保存的其他实施例。

在一个实施例中，BCW加权值根据不同版本的重建块的匹配成本来排序。然后使用编码器发送的重新排序的索引从排序的权重值列表中选择最终的BCW权重值。

在另一个实施例中，我们不向残差添加不同版本的预测子。相反，对应于不同权重值假设的不同版本的预测子直接与相邻L形状的重建相邻像素进行比较，以确定解码器导出的权重的最小值。

任何前述提出的方法都可以在编码器和/或解码器中实现。例如，所提出的任何方法都可以在解码器的帧内(例如图1B中的帧内150)/帧间编解码模块、运动补偿模块(例如图1B中的MC 152)、合并候选推导中实现。或者，所提出的任何方法都可以实现为耦合到编码器的帧内(例如图1A中的帧内110)/帧间编解码模块和/或编码器的运动补偿模块(例如图1B中的MC 112)、合并候选推导模块的电路。

图18示出了根据本发明实施例的基于当前块及其相邻块的编码上下文利用选择性边界匹配的示例性视频编解码系统的流程图。流程图中所示的步骤可以实现为可在编码器侧的一个或多个处理器(例如，一个或多个CPU)上执行的程序代码。流程图中所示的步骤也可以基于硬件来实现，诸如被布置为执行流程图中的步骤的一个或多个电子设备或处理器。根据该方法，在步骤1810中接收与当前块相关联的输入数据，其中输入数据包括在编码器侧待编码的当前块的像素数据或在解码器侧待解码的与当前块相关联的编码数据。在步骤1820中确定与编解码模式或模式参数相关联的一组候选。在步骤1830中确定与该组候选相关联的边界匹配成本，其中，藉由对该组候选中的每一个目标候选，通过使用(1)根据该每一目标候选确定的该当前块的重建或预测的样本以及(2)该当前块的一个或多个相邻块的相邻重建的或预测的样本，来确定每个边界匹配成本，并且其中每个边界匹配成本是使用从多个配置中选择的一个目标配置来计算的。在步骤1840中基于边界匹配成本从候选集合中选择最终候选。在步骤1850中使用最终候选对当前块进行编码或解码。

所示流程图旨在说明根据本发明的视频编解码的示例。在不脱离本发明的精神的情况下，本领域的技术人员可以修改每个步骤、重新安排步骤、拆分步骤或组合步骤来实施本发明。在本公开中，已经使用特定语法和语义来说明示例以实现本发明的实施例。在不脱离本发明的精神的情况下，技术人员可以通过用等同的句法和语义替换句法和语义来实施本发明。

提供以上描述是为了使本领域的普通技术人员能够实践在特定应用及其要求的上下文中提供的本发明。对所描述的实施例的各种修改对于本领域技术人员而言将是显而易见的，并且本文定义的一般原理可以应用于其他实施例。因此，本发明并不旨在限于所示出和描述的特定实施例，而是符合与本文公开的原理和新颖特征一致的最宽范围。在以上详细描述中，举例说明了各种具体细节以提供对本发明的透彻理解。然而，本领域的技术人员将理解可以实施本发明。

如上所述的本发明的实施例可以以各种硬件、软件代码或两者的组合来实现。例如，本发明的一个实施例可以是集成到视频压缩芯片中的一个或多个电路电路或者集成到视频压缩软件中的程序代码以执行这里描述的处理。本发明的实施例还可以是要在数字信号处理器(DSP)上执行以执行这里描述的处理的程序代码。本发明还可以涉及由计算机处理器、数字信号处理器、微处理器或现场可编程门阵列(FPGA)执行的许多功能。这些处理器可以被配置为通过执行定义由本发明体现的特定方法的机器可读软件代码或固件代码来执行根据本发明的特定任务。软件代码或固件代码可以以不同的编程语言和不同的格式或风格来开发。也可以为不同的目标平台编译软件代码。然而，软件代码的不同代码格式、风格和语言以及配置代码以执行根据本发明的任务的其他方式都不会脱离本发明的精神和范围。

在不脱离其精神或基本特征的情况下，本发明可以以其他特定形式体现。所描述的示例在所有方面都应被视为说明性而非限制性的。因此，本发明的范围由所附权利要求而不是由前述描述来指示。落入权利要求等同物的含义和范围内的所有变化都应包含在其范围内。

Claims

1.一种视频编解码方法，该方法包括：

接收与当前块相关联的输入数据，其中，该输入数据包括编码器侧待编码的该当前块的像素数据或解码器侧与该当前块相关联的待解码的编码数据；

确定与编解码模式或模式参数相关的一组候选；

确定与该组候选相关联的边界匹配成本，其中，藉由对该组候选中的每一个目标候选，通过使用(1)根据该每一目标候选确定的该当前块的重建或预测的样本以及(2)该当前块的一个或多个相邻块的相邻重建的或预测的样本，来确定每个边界匹配成本，并且其中每个边界匹配成本是使用从多个配置中选择的一个目标配置来计算的；

基于该边界匹配成本从该组候选中确定最终候选；以及

使用该最终候选对该当前块进行编码或解码。

2.如权利要求1所述的视频编解码方法，其中，为了确定边界匹配成本，该多个配置中的至少一个不包括该当前块的顶部像素或左侧像素以及该一个或多个相邻块的对应的顶部像素或对应的左侧像素。

3.如权利要求2所述的视频编解码方法，其特征在于，该多个配置中的至少一种取决于该当前块和该一个或多个相邻块的至少两个运动矢量。

4.如权利要求3所述的视频编解码方法，其中，如果该当前块与该一个或多个相邻块之间的一个或多个运动矢量差异超过相应顶侧或相应左侧的阈值，则排除该当前块的该顶侧像素或该左侧像素以及该一个或多个相邻块的该对应顶侧像素或该对应左侧像素。

5.如权利要求3所述的视频编解码方法，其特征在于，该当前块和该一个或多个相邻块的该至少两个运动矢量的相似性或差异是在逐像素、逐子块或逐块的基础上确定的。

6.如权利要求1所述的视频编解码方法，其中，为了确定边界匹配成本，该多个配置中的至少一个仅包括该当前块的顶侧像素或左侧像素以及该一个或多个相邻块的对应的顶侧像素或对应的左侧像素。

7.如权利要求1所述的视频编解码方法，其中，该多个配置中的至少一个在除水平方向和垂直方向之外的角度方向上计算边界匹配。

8.如权利要求7所述的视频编解码方法，其中与该角度方向相关联的一个或多个语法元素在该编码器侧在比特流中发信或在该解码器侧从该比特流解析。

9.如权利要求8所述的视频编解码方法，其特征在于，该一个或多个语法元素在该比特流中发信或在CU、PU或CTU级别从该比特流解析。

10.如权利要求7所述的视频编解码方法，其中，该当前块的该角度方向是基于一个相邻块的该角度方向来预测的。

11.如权利要求7所述的视频编解码方法，其中，通过分析该当前块的L形相邻像素的上下文信息来隐式地确定该当前块的该角度方向。

12.如权利要求1所述的视频编解码方法，其特征在于，该组候选对应于BCW的加权。

13.根据权利要求12所述的视频编解码方法，其中使用根据一个权重导出的该当前块的该重建样本针对该权重确定边界匹配成本，针对每个权重确定一个边界匹配成本，并且权重索引在该编码器侧发信或在该解码器侧解析，用于根据该边界匹配成本从重新排序的BCW权重中选择最终权重值。

14.根据权利要求12所述的视频编解码方法，其中，使用根据一个权重导出的该当前块的该预测样本针对该权重确定边界匹配成本，针对每个权重确定一个边界匹配成本，并且隐式地选择对应于最小边界匹配成本的权重为最终权重值。

15.根据权利要求1所述的视频编解码方法，其中每个边界匹配成本是使用根据该当前块的一个或多个编解码信息或上下文和/或该当前块的该一个或多个相邻块的一个或多个编解码信息或上下文从多个配置中选择的一个目标配置来计算的。

16.一种用于视频编解码的装置，该装置包括一个或多个电子设备或处理器，用于：

确定与编解码模式或模式参数相关的一组候选；

基于该边界匹配成本从该组候选中确定最终候选；以及

使用该最终候选对该当前块进行编码或解码。