CN113796069B

CN113796069B - 使用量化残差差分脉冲编解码调制编解码的帧内编解码视频

Info

Publication number: CN113796069B
Application number: CN202080032754.9A
Authority: CN
Inventors: 朱维佳; 张莉; 许继征; 庄孝强
Original assignee: ByteDance Inc
Current assignee: ByteDance Inc
Priority date: 2019-05-01
Filing date: 2020-04-30
Publication date: 2024-03-08
Anticipated expiration: 2040-04-30
Also published as: JP7311627B2; US20220038687A1; US20240121381A1; US20220377321A1; JP2023139037A; CN117857783A; CN113796069A; KR20220002292A; US11431966B2; JP2022529528A; WO2020223467A1; EP3942799A4; EP3942799A1

Abstract

描述了视频编解码和解码方法。在示例方法中，包括通过使用差分编解码模式确定要存储的与视频的当前视频块相关联的第一帧内编解码模式来执行当前视频块和当前视频块的比特流表示之间的转换，其中与当前视频块相关联的第一帧内编解码模式根据差分编解码模式所使用的第二预测模式来确定，并且其中在差分编解码模式下，当前视频块的帧内预测的量化残差和量化残差的预测之间的差使用差分脉冲编解码调制(DPCM)表示在当前视频块的比特流表示中表示。

Description

使用量化残差差分脉冲编解码调制编解码的帧内编解码视频

相关申请的交叉引用

根据适用的专利法和/或依据巴黎公约的规则，本申请旨在及时要求2019年5月1日提交的国际专利申请No.PCT/CN2019/085398的优先权和权益。出于根据法律的所有目的，前述申请的整个公开通过引用而并入作为本申请公开的一部分。

技术领域

本专利文档涉及视频编解码技术、设备和系统。

背景技术

尽管在视频压缩方面取得了进步，但数字视频仍然是互联网和其他数字通信网络上使用的最大带宽。随着能够接收和显示视频的连接用户设备数量的增加，预计数字视频使用的带宽需求将继续增长。

发明内容

本文档描述了在视频或图像的解码或编码期间使用二次变换的各种实施例和技术。

在一个示例方面，一种视频处理方法包括通过使用差分编解码模式确定要存储的与视频的当前视频块相关联的第一帧内编解码模式来执行当前视频块和当前视频块的比特流表示之间的转换，其中与当前视频块相关联的第一帧内编解码模式根据差分编解码模式所使用的第二预测模式来确定，并且其中在差分编解码模式下，当前视频块的帧内预测的量化残差和量化残差的预测之间的差使用差分脉冲编解码调制(DPCM)表示在当前视频块的比特流表示中表示。

在另一个示例方面，一种视频处理方法包括根据规则来确定差分编解码模式在视频的当前视频块和当前视频块的比特流表示之间的转换期间使用的帧内编解码模式；以及基于该确定，使用差分编解码模式来执行当前视频块和当前视频块的比特流表示之间的转换，其中在差分编解码模式下，当前视频块的帧内预测的量化残差和量化残差的预测之间的差使用差分脉冲编解码调制(DPCM)表示在当前视频块的比特流表示中表示，并且其中量化残差的预测根据帧内编解码模式来执行。

在另一个示例方面，公开了一种视频处理方法。该方法包括，使用差分编解码模式并选择性地使用基于共存规则的帧内预测模式来执行当前视频块和当前视频块的比特流表示之间的转换；其中，帧内预测模式用于生成当前视频块的样点的预测；并且其中，差分编解码模式用于使用差分脉冲编解码调制表示来表示来自像素的预测的量化残差块。

在另一个示例方面，公开了另一种视频处理的方法。该方法包括，使用差分编解码模式来执行当前视频块和当前视频块的比特流表示之间的转换，其中在该差分编解码模式下使用差分脉冲编解码调制表示来表示来自当前视频块的像素的预测的量化残差块；其中，预测的第一方向或差分编解码模式的第二方向可从比特流表示推断。

在又一个示例方面，公开了另一种视频处理的方法。该方法包括，基于应用性规则来确定差分编解码模式适用于当前视频块和当前视频块的比特流表示之间的转换；以及使用差分编解码模式来执行当前视频块和比特流表示之间的转换。这里，在差分编解码模式下，使用在不同于水平方向或垂直方向的残差预测方向上执行的差分脉冲编解码调制表示来表示来自当前视频块的像素的帧内预测的量化残差块。

在又一个示例方面，公开了另一种视频处理的方法。该方法包括，确定差分编解码模式适用于当前视频块和当前视频块的比特流表示之间的转换；以及使用差分编解码模式的实施规则来执行当前视频块和比特流表示之间的转换；其中，在差分编解码模式下，使用在不同于水平方向或垂直方向的残差预测方向上执行的差分脉冲编解码调制表示来表示来自当前视频块的像素的帧内预测的量化残差块。

在又一个示例方面，公开了另一种视频处理方法。该方法包括确定在当前视频块和当前视频块的比特流表示之间的转换期间使用的差分编解码模式和与当前视频块相关联的帧内编解码模式相同，并且使用差分编解码模式的实施规则来执行当前视频块和比特流表示之间的转换。

在又一个示例方面，公开了一种视频处理装置。该装置包括被配置为执行以上公开的方法的处理器。

在又一个示例方面，公开了一种计算机可读介质。该介质上存储有用于上述方法的处理器实施的代码。

本文档描述了这些和其他方面。

附图说明

图1是帧内块复制的图示。

图2示出了以调色板模式编解码的块的示例。

图3示出了示例使用调色板预测值来信令通知调色板条目。

图4示出了水平和垂直遍历扫描的示例。

图5示出了调色板索引的编解码的示例。

图6示出了仿射线性加权帧内预测(ALWIP)过程的示例过程。

图7示出了仿射线性加权帧内预测(ALWIP)过程的示例过程。

图8示出了仿射线性加权帧内预测(ALWIP)过程的示例过程。

图9示出了仿射线性加权帧内预测(ALWIP)过程的示例过程。

图10是用于实施本文档中描述的技术的示例硬件平台的框图。

图11是视频处理的示例方法的流程图。

图12示出了四个Merge候选的示例。

图13示出了在视频编解码中使用的示例Merge候选对。

图14示出了67种帧内预测模式的示例。

图15是示出可以利用本公开的技术的示例视频编解码系统的框图。

图16是示出视频编码器的示例的框图。

图17是示出视频解码器的示例的框图。

图18是示出可以在其中实施本文公开的各种技术的示例视频处理系统的框图。

图19和图20示出了视频处理的示例方法的流程图。

具体实施方式

本文档中使用章节标题是为了便于理解，而不是将章节中公开的实施例仅限于该章节。此外，虽然参考通用视频编解码或其他特定视频编解码器描述了特定实施例，但是所公开的技术也适用于其他视频编解码技术。此外，虽然一些实施例详细描述了视频编解码步骤，但是应当理解，撤销编解码的对应解码步骤将由解码器实施。此外，术语视频处理包括视频编解码或压缩、视频解码或解压缩以及视频转码，其中视频像素从一个压缩格式表示为另一个压缩格式或以不同的压缩比特率表示。

1.摘要

本专利文档涉及视频编解码技术。具体地，它涉及视频编解码中的DPCM编解码。它可以应用于现有的视频编解码标准，如HEVC，或即将要定案的标准(多功能视频编解码)。它也可以应用于未来的视频编解码标准或视频编解码器。

2.初步讨论

视频编解码标准主要是通过熟知的ITU-T和ISO/IEC标准的发展而演变的。ITU-T制定了H.261和H.263，ISO/IEC制定了MPEG-1和MPEG-4可视化，并且这两个组织联合制定了H.262/MPEG-2视频和H.264/MPEG-4高级视频编解码(Advanced Video Coding，AVC)和H.265/HEVC[1]标准。自H.262以来，视频编解码标准基于混合视频编解码结构，其中利用了时域预测加变换编解码。为了探索HEVC以外的未来视频编解码技术，VCEG和MPEG于2015年联合成立了联合视频探索组(Joint Video Exploration Team，JVET)。此后，JVET采用了许多新方法，并将其放入名为联合探索模型(Joint Exploration Model，JEM)[3,4]的参考软件中。2018年4月，VCEG(Q6/16)和ISO/IEC JTC1 SC29/WG11(MPEG)之间的联合视频专家组(JVET)成立，以致力于VVC(Versatile Video Coding，多功能视频编解码)标准，目标是与HEVC相比比特率降低50％。

VVC草案的最新版本，即通用视频编解码(草案4)可以在以下处找到：

phenix.it-sudparis.eu/jvet/doc_end_user/current_document.php？id＝5755

The latest reference software of VVC,named VTM,could be found at:

vcgit.hhi.fraunhofer.de/jvet/VVCSoftware_VTM/tags/VTM-4.0

2.1帧内块复制

HEVC屏幕内容编解码扩展(HEVC-SCC)[1]和当前VVC测试模型(VTM-4.0)采用了帧内块复制(IBC)，也称为当前图片参考。IBC将运动补偿的概念从帧间编解码扩展到帧内编解码。如图1所示范的，当应用IBC时，当前块由相同图片中的参考块预测。在当前块被编解码或解码之前，参考块中的样点必须已经被重构。尽管IBC对大多数相机捕捉的序列并不那么有效，但它示出对屏幕内容的显著编解码增益。原因是屏幕内容图片中有很多重复的图案，诸如图标和文本字符。IBC可以有效地移除这些重复图案之间的冗余。在HEVC-SCC中，如果帧间编解码单元(CU)选择当前图片作为其参考图片，则它可以应用IBC。在这种情况下，MV被重命名为块矢量(BV)，并且BV总是具有整数像素精度。为了与主简档HEVC兼容，当前图片在解码图片缓冲区(DPB)中被标记为“长期”参考图片。应当注意，类似地，在多视图/3D视频编解码标准中，帧间视图参考图片也被标记为“长期”参考图片。

在BV找到其参考块之后，可以通过复制参考块来生成预测。残差可以通过从原始信号中减去参考像素得到。然后，可以像在其他编解码模式下一样应用变换和量化。

图1是帧内块复制的图示。

然而，当参考块在图片之外，或与当前块重叠，或在重构区域之外，或在受一些约束限制的有效区域之外时，部分或全部像素值没有被定义。基本上，有两种解决方案来处理这样的问题。一种是不允许这样的情况，例如在比特流一致性中。另一种是对那些未定义的像素值应用填充。以下子章节详细描述了解决方案。

2.2HEVC屏幕内容编解码扩展中的IBC

在HEVC的屏幕内容编解码扩展中，当块使用当前图片作为参考时，它应该保证整个参考块在可用的重构区域内，如以下规范文本所指示的：

变量offsetX和offsetY被推导如下：

offsetX＝(ChromaArrayType＝＝0)？0:(mvCLX[0]&0x7？2:0) (0-106)

offsetY＝(ChromaArrayType＝＝0)？0:(mvCLX[1]&0x7？2:0) (0-107)

比特流一致性的要求是，当参考图片是当前图片时，亮度运动矢量mvLX应当遵守以下约束：

–当调用第6.4.1条中指定的z扫描顺序块可用性的推导过程时，其中以设置为等于(xCb,yCb)的(xCurr,yCurr)和设置为等于(xPb+(mvLX[0]>>2)-offsetX,yPb+(mvLX[1]>>2)-offsetY)的邻近亮度位置(xNbY,yNbY)作为输入，输出应当等于TRUE(真)。

–当调用第6.4.1条中指定的z扫描顺序块可用性的推导过程时，其中以设置为等于(xCb,yCb)的(xCurr,yCurr)和设置为等于(xPb+(mvLX[0]>>2)+nPbW-1+offsetX,yPb+(mvLX[1]>>2)+nPbH-1+offsetY)的邻近亮度位置(xNbY,yNbY)作为输入，输出应当等于TRUE。

–一个或两个以下条件应当为真：

–(mvLX[0]>>2)+nPbW+xB1+offsetX的值小于或等于0。

–(mvLX[1]>>2)+nPbH+yB1+offsetY的值小于或等于0。

–以下条件应当为真：

(xPb+(mvLX[0]>>2)+nPbSw-1+offsetX)/CtbSizeY-xCurr/CtbSizeY<＝yCurr/CtbSizeY-(yPb+(mvLX[1]>>2)+nPbSh-1+offsetY)/CtbSizeY (0-108)

因此，参考块与当前块重叠或者参考块在图片之外的情况将不会发生。不需要填充参考或预测块。

2.3VVC测试模型中的IBC

在当前VVC测试模型(即，VTM-4.0设计)中，整个参考块应该与当前编解码树单元(CTU)一起，并且不与当前块重叠。因此，不需要填充参考或预测块。IBC标志被编解码为当前CU的预测模式。因此，对于每个CU，总共有三种预测模式，MODE_INTRA、MODE_INTER和MODE_IBC。

2.3.1IBC Merge模式

在IBC Merge模式中，从比特流中解析指向IBC Merge候选列表中的条目的索引。IBC Merge列表的构建可以根据以下步骤顺序进行总结：

●步骤1：推导空域候选

●步骤2：插入HMVP候选

●步骤3：插入成对平均候选

在空域Merge候选的推导中，在位于图12中描绘的位置的候选当中最多选择四个Merge候选。推导的顺序为A₁、B₁、B₀、A₀和B₂。仅当位置A₁、B₁、B₀、A₀的任何PU不可用(例如，因为它属于另一个条带或片)或未以IBC模式编解码时，才考虑位置B₂。在位置A₁处的候选被添加之后，剩余候选的插入经受冗余检查，该冗余检查确保具有相同运动信息的候选从列表中排除，以便提高编解码效率。为了降低计算复杂度，在所提到的冗余检查中并没有考虑所有可能的候选对。相反，仅考虑图13中用箭头链接的对，并且如果用于冗余检查的对应候选不具有相同的运动信息，则候选仅被添加到列表。

在插入空域候选之后，如果IBC Merge列表尺寸仍然小于最大IBC Merge列表尺寸，则可以插入来自HMVP表的IBC候选。在插入HMVP候选时执行冗余检查。

最终，成对平均候选被插入到IBC Merge列表中。

当由Merge候选标识的参考块在图片之外，或者与当前块重叠，或者在重构区域之外，或者在受一些约束限制的有效区域之外时，该Merge候选被称为无效Merge候选。

注意，无效Merge候选可以被插入到IBC Merge列表中。

2.3.2IBC AMVP模式

在IBC AMVP模式下，从比特流中解析指向IBC AMVP列表中的条目的AMVP索引。IBCAMVP列表的构建可以根据以下步骤顺序进行总结：

●步骤1：推导空域候选

○检查A₀、A₁，直到找到可用候选。

○检查B₀、B₁、B₂，直到找到可用候选。

●步骤2：插入HMVP候选

●步骤3：插入零候选

在插入空域候选之后，如果IBC AMVP列表尺寸仍然小于最大IBC AMVP列表尺寸，则可以插入HMVP表中的IBC候选。

最后，零候选被插入到IBC AMVP列表中。

2.4调色板模式

调色板模式背后的基本思想是CU中的样点由代表性色彩值的小集合表示。该集合被称为调色板。也可以通过信令通知逸出符号(escape symbol)(其后是(可能是量化的)分量值)来指示调色板之外的样点。这在图2中示出。

2.5HEVC屏幕内容编解码扩展(HEVC-SCC)中的调色板模式

在HEVC-SCC中的调色板模式下，使用预测方式对调色板和索引图进行编解码。

2.5.1调色板条目的编解码

对于调色板条目的编解码，保持调色板预测值。调色板的最大尺寸以及调色板预测值在SPS中被信令通知。在HEVC-SCC中，在PPS中引入了palette_predictor_initializer_present_flag。当该标志为1时，用于初始化调色板预测值的条目在比特流中信令通知。调色板预测值在每个CTU行、每个条带和每个片的开头初始化。根据palette_predictor_initializer_present_flag的值，调色板预测值被重置为0或使用PPS中信令通知的调色板预测值初始化器条目进行初始化。在HEVC-SCC中，启用了尺寸为0的调色板预测值初始化器，以允许在PPS级别显式禁用调色板预测值初始化。

对于调色板预测值中的每个条目，信令通知重用标志，以指示它是否是当前调色板的一部分。这在图3中示出。使用零的游程长度编解码来传送重用标志。此后，新调色板条目的数量使用0阶的指数Golomb码来信令通知。最终，新调色板条目的分量值被信令通知。

2.5.2调色板索引的编解码

如图4所示，使用水平和垂直遍历扫描对调色板索引进行编解码。使用palette_transpose_flag在比特流中显式信令通知扫描顺序。对于该子章节的其余部分，假设扫描为水平。

调色板索引使用两种主要的调色板样点模式进行编解码：“INDEX”和“COPY_ABOVE”。如前所解释的，逸出符号也作为“INDEX”模式被信令通知，并被分配等于最大调色板尺寸的索引。除了顶行或先前模式为“COPY_ABOVE”时，该模式使用标志来信令通知。在“COPY_ABOVE”模式下，复制上面行中的样点的调色板索引。在“INDEX”模式下，调色板索引是显式信令通知的。对于“INDEX”和“COPY_ABOVE”模式两者，指定也使用相同模式进行编解码的后续样点的数量的游程值被信令通知。当逸出符号是“INDEX”或“COPY_ABOVE”模式下的游程的一部分时，针对每个逸出符号信令通知逸出分量值。调色板索引的编解码在图5中示出。

该语法顺序按如下方式完成。首先，信令通知CU的索引值的数量。随后是使用截断二进制编解码的整个CU的实际索引值的信令通知。索引数量以及索引值都在旁路模式下进行编解码。这将索引相关的旁路二进制位分组在一起。然后调色板样点模式(如有必要)和游程以交错方式信令通知。最终，对应于整个CU的逸出样点的分量逸出值被分组在一起，并在旁路模式下进行编解码。

附加语法元素，last_run_type_flag，在信令通知索引值之后被信令通知。该语法元素与索引的数量相结合，消除了信令通知与块中的最后游程相对应的游程值的需要。

在HEVC-SCC中，也针对4:2:2、4:2:0和单色色度格式启用调色板模式。对于所有色度格式，调色板条目和调色板索引的信令通知几乎是相同的。在非单色格式的情况下，每个调色板条目由3个分量组成。对于单色格式，每个调色板条目由单个分量组成。对于子采样色度方向，色度样点与可被2整除的亮度样点索引相关联。在为CU重构调色板索引后，如果样点只有与其相关联的单个分量，则只使用调色板条目的第一分量。信令通知的唯一差别是逸出分量值。对于每个逸出样点，根据与该样点相关联的分量的数量，信令通知的逸出分量值的数量可能不同。

2.6变换跳过模式下的系数编解码

在JVET-M0464和JVET-N0280中，为了使残差编解码适应变换跳过级别的统计和信号特征，对变换跳过(TS)模式下的系数编解码提出了几个修改。

提议的修改列出如下。

没有最后的显著扫描位置：由于残差信号反映了预测之后的空域残差，并且没有对TS执行通过变换的能量集中，所以不再给出在变换块的右下角的尾随零或不显著级别的更高概率。因此，在这种情况下，省略了最后显著扫描位置信令。相反，要处理的第一子块是变换块内的最右底部子块

子块CBF：最后显著扫描位置信令的缺失要求TS的具有coded_sub_block_flag的子块CBF信令被修改如下：

●由于量化，前述无意义序列可能仍然局部地出现在变换块内。因此，如上所述移除最后显著扫描位置，并为所有子块编解码coded_sub_block_flag。

●覆盖DC频率位置的子块(左顶部子块)的coded_sub_block_flag呈现了特殊情况。在VVC草案3中，该子块的coded_sub_block_flag从不被信令通知并且总是被推断为等于1。当最后显著扫描位置位于另一个子块中时，这意味着在DC子块之外有至少一个显著级别。因此，DC子块可以只包含零/非显著级别，尽管该子块的coded_sub_block_flag被推断为等于1。在TS中缺失最后扫描位置信息的情况下，每个子块的coded_sub_block_flag被信令通知。这还包括DC子块的coded_sub_block_flag，除了当所有其他coded_sub_block_flag语法元素已经等于0时。在这种情况下，DCcoded_sub_block_flag被推断为等于1(inferDcSbCbf＝1)。因为在该DC子块中必须有至少一个显著级别，所以如果该DC子块中的所有其他sig_coeff_flag语法元素都等于0，则反而(0,0)处的第一位置的sig_coeff_flag语法元素不被信令通知并被推导为等于1(injectsbdcsigcoefflag＝1)。

●coded_sub_block_flag的上下文建模被改变。上下文模型索引被计算为当前子块的左边的coded_sub_block_flag和上方的coded_sub_block_flag之和，而不是两者的逻辑析取(disjunction)。

sig_coeff_flag上下文建模：修改sig_coeff_flag上下文建模中的局部模板，以仅包括当前扫描位置左边的邻居(NB₀)和上方的邻居(NB₁)。上下文模型偏移只是重要邻近位置sig_coeff_flag[NB₀]+sig_coeff_flag[NB₁]的数量。因此，根据当前变换块内的对角线d的不同上下文集的选择被移除。这产生了三个上下文模型和用于编解码sig_coeff_flag标志的单个上下文模型集。

abs_level_gt1_flag和par_level_flag上下文建模：对abs_level_gt1_flag和par_level_flag采用单个上下文模型。

abs_remainder编解码：尽管变换跳过残差绝对级别的经验分布通常仍然符合拉普拉斯或几何分布，但是存在比变换系数绝对级别更大的不稳定性。具体地，对于残差绝对级别，连续实现窗口内的方差更高。这激发了对abs_remainder语法二值化和上下文建模的以下修改：

●在二值化中使用更高的截止值(即，从利用sig_coeff_flag、abs_level_gt1_flag、par_level_flag和abs_level_gt3_flag的编解码到abs_remainder的Rice码的转变点)、以及每个二进制位位置的专用上下文模型产生更高的压缩效率。增加截止值将导致更多的“大于X”标志，例如引入abs_level_gt5_flag、abs_level_gt7_flag等，直到达到截止值。截止值本身固定为5(numGtFlags＝5)。

●修改Rice参数推导的模板，即仅当前扫描位置的左边的邻居和上方的邻居被认为类似于sig_coeff_flag上下文建模的局部模板。

coeff_sign_flag上下文建模：由于记号序列内的不稳定性以及预测残差常常偏置的事实，即使当全局经验分布几乎均匀分布时，也可以使用上下文模型对记号进行编解码。单个专用上下文模型用于记号的编解码，并且符号在sig_coeff_flag之后被解析，以将所有上下文编解码二进制位保持在一起。

2.7量化残差块差分脉冲码调制(QR-BDPCM)

在JVET-M0413中，提出了量化残差块差分脉冲码调制(QR-BDPCM)来有效编解码屏幕内容。

QR-BDPCM中使用的预测方向可以是垂直和水平预测模式。通过在类似于帧内预测的预测方向(水平或垂直预测)上的样点复制，对整个块进行帧内预测。残差被量化，量化残差与其预测值(水平或垂直)量化值之间的增量(delta)被编解码。这可以通过以下进行描述：对于尺寸为M(行)×N(列)的块，假设r_i，j，0≤i≤M-1，0≤j≤N-1是在使用来自上方或左边块边界样点的未滤波样点水平地(跨预测块逐线复制左边邻近像素值)或垂直地(在预测块中将顶部邻近线复制到每条线)执行帧内预测之后的预测残差。假设Q(r_i，j)，0≤i≤M-1，0≤j≤N-1表示残差r_i，j的量化版本，其中残差是原始块和预测块值之间的差。然后将块DPCM应用于量化残差样点，得到具有元素的修改后的M×N阵列/>当信令通知垂直BDPCM时：

对于水平预测，应用类似的规则，通过以下获得残差量化样点

残差量化样点被传送到解码器。

在解码器侧，使上面计算相反，以产生Q(r_i，j)，0≤i≤M-1，0≤j≤N-1。对于垂直预测情况，

对于水平情况，

逆量化残差Q^-1(Q(r_i，j))被添加到帧内块预测值，以产生重构样点值。

该方案的主要好处是，在系数解析期间可以动态地执行逆DPCM，只要在解析系数时添加预测值，或者其可以在解析之后被执行。

QR-BDPCM的草案文本改变如下所示。

7.3.6.5编解码单元语法

等于1的bdpcm_flag[x0][y0]指定bdpcm_dir_flag存在于包括位置(x0,y0)处的亮度编解码块的编解码单元中

等于0的bdpcm_dir_flag[x0][y0]指定要在bdpcm块中使用的预测方向为水平，否则为垂直。

8.4.2亮度帧内预测模式的推导过程

该过程的输入为：

–亮度位置(xCb,yCb)，指定当前亮度编解码块相对于当前图片的左顶部亮度样点的左顶部样点，

–变量cbWidth，指定亮度样点中的当前编解码块的宽度，

–变量cbHeight，指定亮度样点中的当前编解码块的高度。

在该过程中，推导亮度帧内预测模式IntraPredModeY[xCb][yCb]。

表8-1指定了帧内预测模式IntraPredModeY[xCb][yCb]的值和相关联名称。

表8-1-帧内预测模式和相关联名称的规范

注–：帧内预测模式INTRA_LT_CCLM、INTRA_L_CCLM和INTRA_T_CCLM仅适用于色度分量。

IntraPredModeY[xCb][yCb]通过以下有序步骤推导：

–邻近位置(xNbA,yNbA)和(xNbB,yNbB)分别被设置为等于(xCb-1,yCb+cbHeight-1)和(xCb+cbWidth-1,yCb-1)。

–对于X被A或B代替，变量candIntraPredModeX被推导如下：

…

–变量ispDefaultMode1和ispDefaultMode2被定义如下：

…

–candModeList[x](其中x＝0..5)被推导如下：

…

–IntraPredModeY[xCb][yCb]通过应用以下过程来推导：

–如果bdpcm_flag[xCb][yCb]等于1，则IntraPredModeY[xCb][yCb]被设置为等于candModeList[0]。

–否则，如果intra_luma_mpm_flag[xCb][yCb]等于1，则IntraPredModeY[xCb][yCb]被设置为等于candModeList[intra_luma_mpm_idx[xCb][yCb]]。

–否则，IntraPredModeY[xCb][yCb]通过应用以下有序步骤来推导：

…

变量IntraPredModeY[x][y](其中x＝xCb..xCb+cbWidth-1，并且y＝yCb..yCb+cbHeight-1)被设置为等于IntraPredModeY[xCb][yCb]。

2.8基于矩阵的帧内预测(MIP)

基于矩阵的帧内预测也称为仿射线性加权帧内预测(ALWIP)，其使用加权矩阵来推导帧内预测信号。

2.8.1方法描述

为了预测具有宽度W和高度H的矩形块的样点，仿射线性加权帧内预测(ALWIP)将块左边的H个重构邻近边界样点的一条线和块上方的W个重构邻近边界样点的一条线作为输入。如果重构样点不可用，则像在传统帧内预测中那样生成它们。

预测信号的生成基于以下三个步骤：

1.在边界样点中，通过平均提取在W＝H＝4的情况下的四个样点和在所有其他情况下的八个样点。

2.使用平均样点作为输入，执行矩阵矢量乘法，随后添加偏移。结果是原始块中样点的子采样集上的简化预测信号。

3.剩余位置处的预测信号是通过线性插值从子采样集上的预测信号生成的，其中该线性插值是每个方向上的单步线性插值。

生成预测信号所需的矩阵和偏移矢量取自矩阵的三个集合S₀、S₁、S₂。集合S₀由18个矩阵i∈{0，...，17}和18个偏移矢量/>i∈{0，...，17}组成，每个矩阵具有16行和4列，并且每个偏移矢量的尺寸为16。该集合的矩阵和偏移矢量用于尺寸为4×4.的块。集合S₁由10个矩阵/>i∈{0，...，9}和10个偏移矢量/>i∈{0，...，9}组成，每个矩阵具有16行和8列，并且每个偏移矢量的尺寸为16。该集合的矩阵和偏移矢量用于尺寸为4×8、8×4和8×8的块。最终，集合S₂由6个矩阵/>i∈{0，...，5}和6个偏移矢量/>i∈{0，...，5}组成，每个矩阵具有64行和8列，并且每个偏移矢量的尺寸为64。该集合的矩阵和偏移矢量或者这些矩阵和偏移矢量的一部分用于所有其他块形状。/>

计算矩阵矢量乘积所需的乘法总数总是小于或等于4·W·H。换句话说，对于ALWIP模式，需要每个样点最多四次乘法。

2.8.2边界的平均

在第一步中，输入边界bdry^top和bdry^left被简化为更小的边界和这里，在4×4块的情况下，两者都由2个样点组成，并且在所有其他情况下，两者都由4个样点组成。

在4×4块的情况下，对于0≤i＜2，定义

并且近似地定义

否则，如果块宽度W给出为W＝4·2^k，对于0≤i＜4，则定义

并且近似地定义

这两个简化的边界和/>连结为简化的边界矢量bdry_red，因此，对于形状4×4的块，该矢量的尺寸为4，而对于所有其它形状的块，该矢量的尺寸为8。如果mode指的是ALWIP模式，该连结被定义如下：

最终，对于子采样预测信号的插值，在大块上，需要平均边界的第二版本。也就是说，如果min(W，H)＞8且W≥H，写为W＝8*2^l，并且对于0≤i＜8，定义

如果min(W，H)＞8且H＞W，则近似地定义

2.8.3通过矩阵矢量乘法生成简化的预测信号

在简化的输入矢量bdry_red中，生成简化的预测信号pred_red。后一个信号是在具有宽度W_red和高度H_red的下采样块上的信号。这里，W_red和H_red被定义为：

通过计算矩阵矢量乘积并添加偏移来计算简化的预测信号pred_red：

pred_red＝A·bdry_red+b。

这里，A是矩阵，如果W＝H＝4，则具有W_red·H_red行和4列，并且在所有其他情况下，具有8列。b是尺寸为W_red·H_red的矢量。

矩阵A和矢量b取自集合S₀、S₁、S₂中的一个，如下所示。定义索引idx＝idx(W，H)，如下：

此外，表达m如下：

然后，如果idx≤1或idx＝2并且min(W，H)＞4，表达和/> 在idx＝2并且min(W，H)＝4的情况下，假设A是通过省去/>的每行而出现的矩阵，在W＝4的情况下，其对应于下采样块中的奇数x坐标，或者在H＝4的情况下，其对应于下采样块中的奇数y坐标。

最终，在以下情况下，简化的预测信号被其转置所代替：

●W＝H＝4并且mode≥18

●max(W，H)＝8并且mode≥10

●max(W，H)＞8并且mode≥6

在W＝H＝4的情况下，计算pred_red所需的乘法次数为4，因为在这种情况下A具有4列和16行。在所有其他情况下，A具有8列和W_red·H_red行，并且立即验证在这些情况下需要8·W_red·H_red≤4·W·H次乘法，即，也在这些情况下，需要每个样点最多4次乘法来计算pred_red。

2.8.4整个ALWIP过程的图示

在图6、图7、图8和图9中针对不同形状示出了平均、矩阵矢量乘法和线性插值的整个过程。请注意，剩余形状被视为所描述的情况之一。

1.给出4×4块，ALWIP沿着边界的每个轴取两个平均值。得到的四个输入样点进入矩阵矢量乘法。矩阵取自集合S₀。在添加偏移之后，这产生16个最终预测样点。线性插值对于生成预测信号不是必需的。因此，执行每个样点总共(4·16)/(4·4)＝4次乘法。

图6是4×4块的ALWIP的图示。

2.给出8×8块，ALWIP沿着边界的每个轴取四个平均值。得到的八个输入样点进入矩阵矢量乘法。矩阵取自集合S₁。这在预测块的奇数位置产生16个样点。因此，执行每个样点总共8·16)/(8·8)＝2次乘法。在添加偏移之后，通过使用简化的顶部边界对这些样点进行垂直插值。使用原始的左边界进行水平插值。

图7是8×8块的ALWIP的图示。

3.给出8×4块，ALWIP沿着边界的水平轴取四个平均值，并且在左边界上取四个原始边界值。得到的八个输入样点进入矩阵矢量乘法。矩阵取自集合S₁。这在预测块的奇数水平和每个垂直位置上产生16个样点。因此，执行每个样点总共(8·16)/(8·4)＝4次乘法。在添加偏移之后，通过使用原始左边界对这些样点进行水平插值。

图8是8×4块的ALWIP的图示。

转置后的情况被相应地对待。

4.给出16×16块，ALWIP沿着边界的每个轴取四个平均值。得到的八个输入样点进入矩阵矢量乘法。矩阵取自集合S₂。这在预测块的奇数位置产生64个样点。因此，执行每个样点总共(8·64)/(16·16)＝2次乘法。在添加偏移之后，通过使用顶部边界的八个平均值对这些样点进行垂直插值。使用原始的左边界进行水平插值。

图9是16×16块的ALWIP的图示。

对于更大的形状，过程基本相同，容易检查每个样点的乘法次数少于四次。

对于W×8块，其中W＞8，仅需要水平插值，因为样点是在奇数水平和每个垂直位置给出的。在这种情况下，执行每个样点(8·64)/(W·8)＝64/W次乘法来计算简化预测。

最终，对于W×4块，其中W＞8，假设A_k是通过省去对应于沿着下采样块的水平轴的奇数条目的每行而出现的矩阵。因此，输出尺寸为32，并且再次，只剩下水平插值要执行。对于简化预测的计算，执行每个样点(8·32)/(W·4)＝64/W次乘法。对于W＝16，不需要附加的乘法，而对于W＞16，线性插值需要每个样点少于2次乘法。因此，乘法的总数小于或等于四。

转置后的情况被相应地对待。

2.8.5单步线性插值

对于W×H块，其中max(W，H)≥8，预测信号通过线性插值从简化的预测信号出现。根据块形状，线性插值在垂直、水平或两个方向上进行。如果要在两个方向上应用线性插值，则如果W＜H，首先在水平方向上应用，否则首先在垂直方向上应用。

不失一般性地考虑W×H块，其中max(W，H)≥8并且W≥H。然后，如下执行一维线性插值。不失一般性，它足以描述垂直方向上的线性插值。首先，简化的预测信号通过边界信号扩展到顶部。定义垂直上采样因子U_ver＝H/H_red，并且写为然后，通过以下定义扩展的简化预测信号/>

然后，从该扩展的简化预测信号，通过以下生成垂直线性插值预测信号

对于0≤x＜W_red，0≤y＜H_red并且0≤k＜U_ver。

仅比特移位线性插值算法不需要任何乘法。

2.8.6提出的帧内预测模式的信号化

对于帧内模式下的每个编解码单元(CU)，在比特流中传送指示ALWIP模式是否将被应用于对应的预测单元(PU)的标志。如果要应用ALWIP模式，则ALWIP模式的索引predmode使用具有3个MPM的MPM列表来信令通知。

这里，如下，使用上方和左边PU的帧内模式来执行MPM的推导。有将ALWIP模式分配给每个传统的帧内预测模式predmode_Anqular的三个固定的表map_angular_to_alwip_idx，idx∈{0，1，2}

predmode_ALwIP＝map_angular_to_alwip_idx[predmode_Angular].

对于具有宽度W和高度H的每个PU，定义索引

idx(PU)＝idx(W，H)∈{0，1，2}

这指示如在上面第1.3节中，从三个集合中的哪一个取得ALWIP参数。

如果上面的预测单元PU_above可用，与当前PU属于相同的CTU，并且处于帧内模式，则如果idx(PU)＝idx(PU_above)并且如果ALWIP以ALWIP模式应用于PU_above，则表达

如果上面的PU可用，则与当前PU属于相同的CTU，并且处于帧内模式，并且如果传统的帧内预测模式被应用于上面的PU，则表达

在所有其他情况下，表达

这意味着该模式不可用。以同样的方式，但没有左边PU需要与当前PU属于相同的CTU的限制，推导模式

最终，提供了三个固定的默认列表list_idx，idx∈{0，1，2}，每个列表包含三种不同的ALWIP模式。在默认列表list_idx(PU)以及模式和/>中，通过用默认值替换-1以及消除重复来构建三个不同的MPM。

2.8.7传统的亮度和色度帧内预测模式的自适应MPM列表推导

所提出的ALWIP模式与传统的帧内预测模式的基于MPM的编解码并置如下。传统的帧内预测模式的亮度和色度MPM列表推导过程使用固定的表map_alwip_to_angular_idx，idx∈{0，1，2}，将给出的PU上的ALWIP模式predmode_ALWIP映射到传统的帧内预测模式之一

predmode_Angular＝map_alwip_to_angular_idx(PU)[predmode_ALWIP]

对于亮度MPM列表推导，无论何时遇到使用ALWIP模式predmode_ALWIP的邻近亮度块，该块都被视为是否使用传统的帧内预测模式predmode_Angular。对于色度MPM列表推导，每当当前亮度块使用LWIP模式时，相同的映射用于将ALWIP模式转化为传统的帧内预测模式。

2.9具有67种帧内预测模式的帧内模式编解码

为了捕捉自然视频中呈现的任意边缘方向，VTM4中的方向帧内模式的数量从如HEVC所使用的33个扩展到65个。不在HEVC中的新方向模式在图14中被描绘为红点箭头，并且平面模式和DC模式保持不变。这些更密集的方向帧内预测模式适用于所有块尺寸以及亮度和色度帧内预测。

针对帧内块提出了统一的6-MPM列表，而不管是否应用了MRL和ISP编解码工具。如在VTM4.0中那样，基于左边邻近块和上方邻近块的帧内模式来构建MPM列表。假设左边的模式被表示为Left，并且上方块的模式被表示为Above，统一的MPM列表被构建如下：

●当邻近块不可用时，其帧内模式默认设置为Planar(平面)。

●如果模式Left和Above都是非角度模式：

○MPM列表→{Planar,DC,V,H,V-4,V+4}

●如果模式Left和Above之一是角度模式，并且另一个是非角度：

○将模式Max设置为Left和Above中的更大模式

○oMPM列表→{Planar,Max,DC,Max-1,Max+1,Max-2}

●如果Left和Above都是角度并且他们不同：

○将模式Max设置为Left和Above中的更大模式

○如果模式Left和Above的差异在2到62(含)的范围内

■MPM列表→{Planar,Left,Above,DC,Max-1,Max+1}

○否则

■MPM列表→{Planar,Left,Above,DC,Max-2,Max+2}

●如果Left和Above都是角度并且他们相同：

○MPM列表→{Planar,Left,Left-1,Left+1,DC,Left-2}

7.3.6.5编解码单元语法

/>

语法元素intra_luma_mpm_flag[x0][y0]、intra_luma_not_planar_flag[x0][y0]、intra_luma_mpm_idx[x0][y0]和intra_luma_mpm_remainder[x0][y0]指定亮度样点的帧内预测模式。阵列索引x0、y0指定所考虑的编解码块的左顶部亮度样点相对于图片的左顶部亮度样点的位置(x0,y0)。当intra_luma_mpm_flag[x0][y0]等于1时，根据条款8.4.2，从邻近的帧内预测编解码单元推断帧内预测模式。

当intra_luma_mpm_flag[x0][y0]不存在时，其被推断为等于1。

当intra_luma_not_planar_flag[x0][y0]不存在时，其被推断为等于1。

2.10色度帧内模式编解码

对于色度帧内模式编解码，允许总共8种帧内模式用于色度帧内模式编解码。这些模式包括五种传统帧内模式和三种跨分量线性模型模式。色度DM模式使用对应的亮度帧内预测模式。由于在I条带中启用亮度和色度分量的单独块分割结构，因此一个色度块可以对应于多个亮度块。因此，对于色度DM模式，直接继承覆盖当前色度块的中心位置的对应亮度块的帧内预测模式。

3.由所公开的实施例解决的技术问题的示例

尽管QR-BDPCM可以实现对屏幕内容编解码的编解码益处，但它可能仍有一些缺点。

1.QR-BDPCM模式下的预测仅限于水平帧内预测和垂直帧内预测，这可能限制QR-BDPCM模式下的预测效率。

2.为QR-BDPCM编解码块信令通知帧内预测模式，这可能增加QR-BDPCM模式的速率成本

3.当在QR-BDPCM模式下将信令通知的消息映射到预测模式时，没有考虑邻近信息

4.QR-BDPCM通过仅支持水平DPCM和垂直DPCM来表示残差，这可能包括对复杂残差块的编解码性能

5.QR-BDPCM中的残差范围可能超过其他非QR-BDPCM模式的最大范围

6.QR-BDPCM不考虑块形状

7.如何在用QR-BDPCM对亮度块进行编解码时处理色度是未知的。

8.QR-BDPCM仅使用第一MPM模式作为存储的帧内模式，这可能限制帧内模式的编解码效率。

4.示例实施例和技术

以下项列表应该被视为解释一般构思的示例。不应该狭隘地解释这些发明。此外，这些发明可以以任何方式组合。

1.QR-BDPCM编解码块中的样点预测可以通过基于矩阵的帧内预测(MIP)方法来生成。

a.在一个示例中，当对一个块启用QR-BDPCM和MIP两者时，限制仅支持MIP中的部分允许模式。

i.在一个示例中，部分允许模式可以包括可以被映射到水平和/或垂直正常帧内模式的、与基于矩阵的帧内预测方法相关联的那些模式。

ii.在一个示例中，部分允许模式可以仅包括可以被映射到水平和/或垂直正常帧内模式的、与基于矩阵的帧内预测方法相关联的那些模式。

b.在一个示例中，当对一个块启用QR-BDPCM和MIP两者时，支持MIP中的所有允许模式。

2.QR-BDPCM编解码块中的样点预测可以通过除了垂直/水平帧内预测之外的帧内预测模式来生成。

a.在一个示例中，QR-BDPCM编解码块中的样点可以通过帧内预测模式K来预测

i.在一个示例中，K可以是平面模式

ii.在一个示例中，K可以是DC模式

iii.在一个示例中，K可以是水平模式

iv.在一个示例中，K可以是垂直模式

v.在一个示例中，K可以是最可能模式列表中的一个候选。

vi.在一个示例中，K可以在比特流中被信令通知

b.QR-BDPCM的允许的帧内预测模式可以基于

i.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组中信令通知的消息

ii.当前块和/或其邻近块的块大小

iii.当前块和/或其邻近块的块形状

iv.当前块的邻近块的预测模式(帧内/帧间)

v.当前块的邻近块的帧内预测模式

vi.当前块的邻近块的QR-BDPCM模式的指示

vii.当前块和/或其邻近块的当前量化参数

viii.色彩格式(诸如4:2:0、4:4:4)的指示

ix.单独编解码树结构/双编解码树结构

x.条带/片组类型和/或图片类型

3.QR-BDPCM编解码块中的样点预测可以通过非相邻样点生成。

a.在一个示例中，对于IBC Merge模式，也可以启用QR-BDPCM。

b.在一个示例中，对于IBC AMVP模式，也可以启用QR-BDPCM。

c.在IBC和QR-BDPCM中使用的块矢量可以被信令通知或推导或预定义。

i.在一个示例中，IBC模式可以由运动矢量(块矢量)和/或Merge索引指示。

ii.在一个示例中，IBC模式可以由默认运动矢量指示。

1.在一个示例中，默认运动矢量可以为(-w,0)，其中w是正整数

2.在一个示例中，默认运动矢量可以为(0,-h)，其中h是正整数

3.在一个示例中，默认运动矢量可以为(-w,-h)，其中w和h是两个正整数

iii.在一个示例中，在IBC和QP-BPDCM编解码块中使用的运动矢量的指示可以基于：

1.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组中信令通知的消息

2.当前块和/或其邻近块的块大小

3.当前块和/或其邻近块的块形状

4.当前块的邻近块的预测模式(帧内/帧间)

5.当前块的邻近块的运动矢量

6.当前块的邻近块的QR-BDPCM模式的指示

7.当前块和/或其邻近块的当前量化参数

8.色彩格式(诸如4:2:0、4:4:4)的指示

9.单独编解码树结构/双编解码树结构

10.条带/片组类型和/或图片类型

d.在一个示例中，QR-BDPCM模式中的样点预测可以由帧间预测工具(例如，仿射模式、Merge模式和帧间模式)生成

4.QR-BDPCM中的量化残差预测方向的指示可以被动态地推导。

a.在一个示例中，QR-BDPCM中的量化残差预测方向的指示可以基于当前帧内预测模式的指示来推断

i.在一个示例中，当帧内预测模式是垂直时，QR-BDPCM中的量化残差预测的方向可以被推断为垂直

ii.在一个示例中，当帧内预测模式是水平时，QR-BDPCM中的量化残差预测的方向可以被推断为水平

iii.在一个示例中，当帧内预测模式是水平时，QR-BDPCM中的量化残差预测的方向可以被推断为垂直

iv.在一个示例中，当帧内预测模式是垂直时，QR-BDPCM中的量化残差预测的方向可以被推断为水平

b.在一个示例中，QR-BDPCM中的量化残差预测方向的指示可以基于

ii.当前块和/或其邻近块的块大小

iii.当前块和/或其邻近块的块形状

iv.当前块和/或其邻近块的最可能模式

v.当前块的邻近块的预测模式(帧内/帧间)

vi.当前块的邻近块的帧内预测模式

vii.当前块的邻近块的运动矢量

viii.当前块的邻近块的QR-BDPCM模式的指示

ix.当前块和/或其邻近块的当前量化参数

x.色彩格式(诸如4:2:0、4:4:4)的指示

xi.单独编解码树结构/双编解码树结构

xii.应用于当前块的变换类型

xiii.条带/片组类型和/或图片类型

5.要存储的QR-BDPCM编解码块的帧内模式可以与帧内预测过程中使用的帧内预测模式对齐。

a.在一个示例中，当QR-BDPCM采用垂直帧内预测(例如，当前块的bdpcm_dir_flag为1)时，要存储的QR-BDPCM编解码块的帧内模式可以被推断为垂直模式。

b.在一个示例中，当QR-BDPCM采用水平帧内预测(例如，当前块的bdpcm_dir_flag为0)时，要存储的QR-BDPCM编解码块的帧内模式可以被推断为水平模式。

c.在一个示例中，当QR-BDPCM采用左顶部帧内预测方向时，要存储的QR-BDPCM编解码块的帧内模式可以被推断为左顶部模式(例如，VVC中的模式34)。

d.在一个示例中，要存储的QR-BDPCM编解码块的帧内模式可以被推断为当在QR-BDPCM模式下的帧内预测过程中采用时的模式。

e.在一个示例中，要存储的QR-BDPCM编解码块的帧内模式可以被推断为当在QR-BDPCM模式下的残差预测过程中采用时的模式。

f.在一个示例中，在QR-BDPCM中编解码的块的帧内模式可以被推断为最可能模式(MPM)列表中的一种模式。

g.在一个示例中，在QR-BDPCM中编解码的块的帧内模式可以被推断为预定义模式。

i.在一个示例中，预定义模式可以是

1.平面模式

2.DC模式

3.垂直模式

4.水平模式

h.在一个示例中，在QR-BDPCM模式下编解码的块的帧内模式可以基于以下来确定

i.色彩分量

ii.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组中信令通知的消息

iii.bdpcm_dir_flag

iv.bdpcm_flag

ii.当前块和/或其邻近块的块大小

iii.当前块和/或其邻近块的块形状

iv.当前块和/或其邻近块的最可能模式

v.当前块的邻近块的预测模式(帧内/帧间)

vi.当前块的邻近块的帧内预测模式

vii.当前块的邻近块的运动矢量

viii.当前块的邻近块的QR-BDPCM模式的指示

ix.当前块和/或其邻近块的当前量化参数

x.色彩格式(诸如4∶2∶0、4∶4∶4)的指示

xi.编解码树结构

xii.应用于当前块的变换类型

xiii.条带/片组类型和/或图片类型

i.在一个示例中，存储的帧内预测模式可以用于对随后块进行编解码，诸如用于要编解码的随后块的MPM列表构建

6.从QR-BDPCM中的信令通知的索引到QR-BDPCM模式中的帧

内预测模式的映射可以基于

a.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组中信令通知的消息

b.当前块和/或其邻近块的块大小

c.当前块和/或其邻近块的块形状

d.当前块和/或其邻近块的最可能模式

e.当前块的邻近块的预测模式(帧内/帧间)

f.当前块的邻近块的帧内预测模式

g.当前块的邻近块的运动矢量

h.当前块的邻近块的QR-BDPCM模式的指示

i.当前块和/或其邻近块的当前量化参数

j.色彩格式(诸如4∶2∶0、4∶4∶4)的指示

k.单独编解码树结构/双编解码树结构

l.应用于当前块的变换类型

m.条带/片组类型和/或图片类型

7.在QR-BDPCM中，沿水平和垂直方向预测量化残差。提出沿着除了垂直和水平方向之外的方向预测量化残差。假设Q(r_i，j)表示量化残差，表示残差预测处理之后的量化残差。

a.在一个示例中，可以支持45度QR-BDPCM。

i.在一个示例中，DPCM可以沿着45度方向执行，其中如果Q(r_{(i-1)，(j-1)})可用，则可以通过Q(r_i，j)-Q(r_{(i-1)，(j-1)})推导。

b.在一个示例中，可以支持45度QR-BDPCM。

i.在一个示例中，DPCM可以沿着135度方向执行，其中如果Q(r_{(i-1)，(j+1)})可用，则可以通过Q(r_i，j)-Q(r_{(i-1)，(j+1)})推导。

c.在一个示例中，可以在QR-BDPCM中支持任何方向。

i.在一个示例中，如果Q(r_{(i-m)，(j-n)})可用，则可以通过Q(r_i，j)-Q(r_{(i-m)，(j-n)})推导。

1.在一个示例中，m和/或n可以在比特流中被信令通知

2.在一个示例中，m和/或n可以是整数，并且可以基于

3.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组中信令通知的消息

4.i和/或j

5.当前块和/或其邻近块的块大小

6.当前块和/或其邻近块的块形状

7.当前块和/或其邻近块的最可能模式

8.当前块的邻近块的预测模式(帧内/帧间)

9.当前块的邻近块的帧内预测模式

10.当前块的邻近块的运动矢量

11.当前块的邻近块的QR-BDPCM模式的指示

12.当前块和/或其邻近块的当前量化参数

13.色彩格式(诸如4∶2∶0、4∶4∶4)的指示

14.单独编解码树结构/双编解码树结构

15.条带/片组类型和/或图片类型

8.QR-BDPCM可以被应用于色度块(例如，Cb/Cr或B/R色彩分量)。

a.在一个示例中，亮度和色度QR-BDPCM编解码块的允许帧内预测方向可以相同，例如，仅水平和垂直。

b.在一个示例中，亮度和色度QR-BDPCM编解码块的允许预测方法可以相同，例如，IBC/帧间/水平和垂直帧内预测模式。

c.在一个示例中，亮度和色度QR-BDPCM编解码块的允许残差预测方向可以相同。

d.在一个示例中，色度QR-BDPCM的残差预测方向可以从对应亮度块的残差预测方向推导。

i.在一个示例中，对应亮度块可以是并置亮度块。

ii.在一个示例中，对应亮度块可以是包含色度块的左上角的并置样点的亮度块。

iii.在一个示例中，对应亮度块可以是包含色度块的中心样点的并置样点的亮度块。

e.在一个示例中，CCLM和QR-BDPCM不能被应用于相同色度块。

i.可替代地，CCLM也可以适用于QR-BDPCM编解码块。

f.在一个示例中，联合色度残差编解码(例如，联合cb和cr编解码)方法和QR-BDPCM不能被应用于相同色度块。

9.QR-BDPCM中的重构量化残差可以被限制在特定范围内。

a.在一个示例中，可以添加所有量化残差差(例如，等式2-7-1和2-7-2中的)可以在特定范围内的约束。

b.在一个示例中，可以添加所有重构量化残差(例如，等式2-7-3和2-7-4中的Q(r_i，j))可以在特定范围内的约束。

c.在一个示例中，裁剪操作可以被应用于量化残差差(例如，等式2-7-1和2-7-2中的)，使得重构量化残差可以在特定范围内。

d.在一个示例中，裁剪操作可以被应用于重构量化残差差(例如，等式2-7-3和2-7-4中的Q(r_i，j))，使得重构量化残差可以在特定范围内。

e.在一个示例中，裁剪操作可以被定义为(x＜min？min：(x＞max？max：x))

f.在一个示例中，裁剪操作可以被定义为(x＜＝min？min：(x＞＝max？max:x))

g.在一个示例中，裁剪操作可以被定义为(x<min？min:(x>＝max？max:x))

h.在一个示例中，裁剪操作可以被定义为(x<＝min？min:(x>max？max:x))

i.在一个示例中，min和/或max可以是负的或正的

j.在一个示例中，min被设置为-32768，并且max被设置为32767。

i.可替代地，min和/或max可以取决于没有用QR-BDPCM编解码的块的逆量化的范围。

ii.可替代地，min和/或max可以取决于输入样点/重构样点的比特深度。

iii.可替代地，min和/或max可以取决于是否使用无损编解码。

1.在一个示例中，min和/或max可以取决于transquant_bypass_enabled_flag。

2.在一个示例中，min和/或max可以取决于cu_transquant_bypass_flag。

k.在一个示例中，min和/或max可以基于

ii.当前块和/或其邻近块的块大小

iii.当前块和/或其邻近块的块形状

iv.当前块和/或其邻近块的最可能模式

v.当前块的邻近块的预测模式(帧内/帧间)

vi.当前块的邻近块的帧内预测模式

vii.当前块的邻近块的运动矢量

viii.当前块的邻近块的QR-BDPCM模式的指示

ix.当前块和/或其邻近块的当前量化参数

x.色彩格式(诸如4:2:0、4:4:4)的指示

xi.单独编解码树结构/双编解码树结构

xii.应用于当前块的变换类型

xiii.条带/片组类型和/或图片类型

10.可以从块的最后一行/列到第一行/列应用QR-DPCM。

a.在一个示例中，当残差预测方向为水平时，第(i+1)列的残差可以用于预测第i列的残差。

b.在一个示例中，当残差预测方向为垂直时，第(i+1)行的残差可以用于预测第i行的残差。

11.QR-DPCM可以被应用于块的子集。

a.在一个示例中，当残差预测方向为水平时，QR-DPCM不适用于残差的最左边k列。

b.在一个示例中，当残差预测方向为垂直时，QR-DPCM不适用于残差的最上方k行。

c.在一个示例中，当残差预测方向为水平时，QR-DPCM不适用于残差的最右边k列。

d.在一个示例中，当残差预测方向为垂直时，QR-DPCM不适用于残差的最底部k行。

e.上述k的值可以是预定义值，基于

ii.当前块和/或其邻近块的块大小

iii.当前块和/或其邻近块的块形状

iv.当前块和/或其邻近块的最可能模式

v.当前块的邻近块的预测模式(帧内/帧间)

vi.当前块的帧内预测模式

vii.当前块的邻近块的帧内预测模式

viii.当前块的邻近块的运动矢量

ix.当前块的邻近块的QR-BDPCM模式的指示

x.当前块和/或其邻近块的当前量化参数

xi.色彩格式(诸如4:2:0、4:4:4)的指示

xii.单独编解码树结构/双编解码树结构

xiii.应用于当前块的变换类型

xiv.条带/片组类型和/或图片类型

12.可以对块逐段应用QR-DPCM

a.在一个示例中，当残差预测方向为垂直并且N＝nK时，残差预测可以被执行为

b.在一个示例中，当残差预测方向为水平并且M＝mK时，残差预测可以被执行为

13.对一个色彩分量启用/禁用QR-DPCM可以从与另一个色彩分量相关联的推导。

a.在一个示例中，对于色度块，是否启用QR-DPCM可以取决于与并置亮度块内的一个或多个代表性块相关联的QR-DPCM的使用。

i.在一个示例中，可以以与用于DM推导相同的方式定义代表性块。

ii.在一个示例中，如果并置亮度块内的代表性块是QR-DPCM编解码的，并且当前色度块是以DM模式编解码的，则也可以对当前色度块启用QR-DPCM。

b.可替代地，可以针对色度分量信令通知QR-DPCM的使用的指示。

i.在一个示例中，可以信令通知一个标志以指示对两个色度分量的使用。

ii.可替代地，可以信令通知两个标志以分别指示对两个色度分量的使用。

iii.在一个示例中，当色度块以特定模式(诸如CCLM)编解码时，跳过信令通知QR-DPCM的使用的指示。

14.以上方法也可以适用于DPCM/QR-DPCM的其他变化。

5.实施例

在JVET-N0413提供的草稿之上的改变以粗体斜体突出显示。删除的文本标有

5.1实施例1

i.亮度帧内预测模式的推导过程

该过程的输入是：

–变量cbWidth，指定亮度样点中的当前编解码块的宽度，

–变量cbHeight，指定亮度样点中的当前编解码块的高度。

在该过程中，推导亮度帧内预测模式IntraPredModeY[xCb][yCb]。

表8-1-帧内预测模式和相关联名称的规范

帧内预测模式	相关联名称
		0	INTRA_PLANAR
1	INTRA_DC
		2..66	INTRA_ANGULAR2..INTRA_ANGULAR66
81..83	INTRA_LT_CCLM、INTRA_L_CCLM、INTRA_T_CCLM

IntraPredModeY[xCb][yCb]通过以下有序步骤推导：

–对于X被A或B代替，变量candIntraPredModeX被推导如下：

…

–变量ispDefaultMode1和ispDefaultMode2被定义如下：

…

–candModeList[x](其中x＝0..5)被推导如下：

…

–IntraPredModeY[xCb][yCb]通过应用以下过程来推导：

–如果bdpcm_flag[xCb][yCb]等于1，则IntraPredModeY[xCb][yCb]被设置为等于(bdpcm_dir_flag[xCb][yCb]＝＝0？INTRA_ANGULAR18:INTRA_ANGULAR50)。

–否则，IntraPredModeY[xCb][yCb]通过应用以下有序步骤来推导：

…

5.2实施例2

8.4.2亮度帧内预测模式的推导过程

该过程的输入是：

–变量cbWidth，指定亮度样点中的当前编解码块的宽度，

–变量cbHeight，指定亮度样点中的当前编解码块的高度。

推导亮度帧内预测模式IntraPredModeY[xCb][yCb]。

表8-1-帧内预测模式和相关联名称的规范

IntraPredModeY[xCb][yCb]通过以下有序步骤推导：

–否则，IntraPredModeY[xCb][yCb]通过应用以下有序步骤来推导：

–对于X被A或B代替，变量candIntraPredModeX被推导如下：

…

–变量ispDefaultMode1和ispDefaultMode2被定义如下：

…

–candModeList[x](其中x＝0..5)被推导如下：

…

–IntraPredModeY[xCb][yCb]通过应用以下过程来推导：

–如果intra_luma_mpm_flag[xCb][yCb]等于1，则IntraPredModeY[xCb][yCb]被设置为等于candModeList[intra_luma_mpm_idx[xCb][yCb]]。

–否则，IntraPredModeY[xCb][yCb]通过应用以下有序步骤来推导：

…

6.参考

[1]ITU-T and ISO/IEC,“High efficiency video coding”,Rec.ITU-T H.265|ISO/IEC 23008-2(02/2018).

[2]B.Bross,J.Chen,S.Liu,Versatile Video Coding(Draft 4),JVET-M1001,Jan.2019

图10是视频处理装置1000的框图。装置1000可以用于实施本文描述的一个或多个方法。装置1000可以体现在智能手机、平板电脑、计算机、物联网(IoT)接收器等中。装置1000可以包括一个或多个处理器1002、一个或多个存储器1004和视频处理硬件1006。(多个)处理器1002可以被配置为实施本文档中描述的一种或多种方法。存储器(多个存储器)1004可以用于存储用于实施本文描述的方法和技术的数据和代码。视频处理硬件1006可以用于在硬件电路系统中实施本文档中描述的一些技术。

图11是视频处理的示例方法1100的流程图。方法1100包括使用差分编解码模式并选择性地使用基于共存规则的帧内预测模式来执行当前视频块和当前视频块的比特流表示之间的转换(1102)。帧内预测模式用于生成当前视频块的样点的预测。差分编解码模式用于使用差分脉冲编解码调制表示来表示来自像素的预测的量化残差块。

图15是示出可以利用本公开的技术的示例视频编解码系统100的框图。如图15所示，视频编解码系统100可以包括源设备110和目标设备120。源设备110生成编码视频数据，其中该源设备110可以被称为视频编码设备。目标设备120可以解码由源设备110生成的编码视频数据，目标设备120可以被称为视频解码设备。源设备110可以包括视频源112、视频编码器114和输入/输出(I/O)接口116。

视频源112可以包括源，诸如视频捕捉设备、从视频内容提供器接收视频数据的接口、和/或用于生成视频数据的计算机图形系统、或这些源的组合。视频数据可以包括一个或多个图片。视频编码器114对来自视频源112的视频数据进行编码，以生成比特流。比特流可以包括形成视频数据的编解码表示的比特序列。比特流可以包括编解码图片和相关数据。编解码图片是图片的编解码表示。相关数据可以包括序列参数集、图片参数集和其他语法结构。I/O接口116可以包括调制器/解调器(调制解调器)和/或发射器。编码视频数据可以通过网络130a经由I/O接口116直接传输到目标设备120。编码视频数据也可以存储在存储介质/服务器130b上，以供目标设备120访问。

目标设备120可以包括I/O接口126、视频解码器124和显示设备122。

I/O接口126可以包括接收器和/或调制解调器。I/O接口126可以从源设备110或存储介质/服务器130b获取编码视频数据。视频解码器124可以对编码视频数据进行解码。显示设备122可以向用户显示解码视频数据。显示设备122可以与目标设备120集成，或者可以在被配置为与外部显示设备接口的目标设备120的外部。

视频编码器114和视频解码器124可以根据视频压缩标准进行操作，例如高效视频编解码(HEVC)标准、多功能视频编解码(VVC)标准和其他当前和/或另外的标准。

图16是示出视频编码器200的示例的框图，视频编码器200可以是图15所示的系统100中的视频编码器114。

视频编码器200可以被配置为执行本公开的任何或所有技术。在图16的示例中，视频编码器200包括多个功能组件。本公开中描述的技术可以在视频编码器200的各种组件之间共享。在一些示例中，处理器可以被配置为执行本公开中描述的任何或所有技术。

视频编码器200的功能组件可以包括分割单元201、预测单元202(其可以包括模式选择单元203、运动估计单元204、运动补偿单元205和帧内预测单元206)、残差生成单元207、变换单元208、量化单元209、逆量化单元210、逆变换单元211、重构单元212、缓冲区213和熵编码单元214。

在其他示例中，视频编码器200可以包括更多、更少或不同的功能组件。在示例中，预测单元202可以包括帧内块复制(IBC)单元。IBC单元可以执行IBC模式下的预测，其中至少一个参考图片是当前视频块所在的图片。

此外，诸如运动估计单元204和运动补偿单元205的一些组件可以高度集成，但是为了解释的目的，在图16的示例中分开表示。

分割单元201可以将图片分割为一个或多个视频块。视频编码器200和视频解码器300可以支持各种视频块尺寸。

模式选择单元203可以基于误差结果选择编解码模式(例如，帧内或帧间)之一，并且将作为结果的帧内编解码块或帧间编解码块提供给残差生成单元207以生成残差块数据，以及提供给重构单元212以重构编码块以用作参考图片。在一些示例中，模式选择单元203可以选择帧内和帧间预测模式的组合(CIIP)，其中预测基于帧间预测信号和帧内预测信号。在帧间预测的情况下，模式选择单元203还可以选择块的运动矢量的分辨率(例如，子像素或整数像素精度)。

为了对当前视频块执行帧间预测，运动估计单元204可以通过将来自缓冲区213的一个或多个参考帧与当前视频块进行比较，来生成当前视频块的运动信息。运动补偿单元205可以基于运动信息和来自缓冲区213的除了与当前视频块相关联的图片之外的图片的解码样点，来确定当前视频块的预测视频块。

运动估计单元204和运动补偿单元205可以对当前视频块执行不同的操作，例如，取决于当前视频块是在I条带、P条带还是B条带中。

在一些示例中，运动估计单元204可以对当前视频块执行单向预测，并且运动估计单元204可以为当前视频块的参考视频块搜索列表0或列表1的参考图片。运动估计单元204然后可以生成指示列表0或列表1中的参考图片的参考索引，该参考索引包含参考视频块和指示当前视频块和参考视频块之间的空域位移的运动矢量。运动估计单元204可以输出参考索引、预测方向指示符和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前块的预测视频块。

在其他示例中，运动估计单元204可以对当前视频块执行双向预测，运动估计单元204可以在列表0中的参考图片中搜索当前视频块的参考视频块，并且还可以在列表1中搜索当前视频块的另一个参考视频块。运动估计单元204然后可以生成参考索引，该参考索引指示包含参考视频块的列表0和列表1中的参考图片以及指示参考视频块和当前视频块之间的空域位移的运动矢量。运动估计单元204可以输出当前视频块的参考索引和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前视频块的预测视频块。

在一些示例中，运动估计单元204可以输出完整的运动信息集，以用于解码器的解码处理。

在一些示例中，运动估计单元204可以不输出当前视频的完整的运动信息集。而是运动估计单元204可以参考另一个视频块的运动信息信令通知当前视频块的运动信息。例如，运动估计单元204可以确定当前视频块的运动信息与邻近视频块的运动信息足够相似。

在一个示例中，运动估计单元204可以在与当前视频块相关联的语法结构中指示值，该值向视频解码器300指示当前视频块具有与另一个视频块相同的运动信息。

在另一示例中，运动估计单元204可以在与当前视频块相关联的语法结构中标识另一视频块和运动矢量差(MVD)。运动矢量差指示当前视频块的运动矢量和所指示的视频块的运动矢量之间的差。视频解码器300可以使用所指示的视频块的运动矢量和运动矢量差来确定当前视频块的运动矢量。

如上所讨论的，视频编码器200可以预测性地信令通知运动矢量。可以由视频编码器200实施的预测信令通知技术的两个示例包括高级运动矢量预测(AMVP)和Merge模式信令通知。

帧内预测单元206可以对当前视频块执行帧内预测。当帧内预测单元206对当前视频块执行帧内预测时，帧内预测单元206可以基于相同图片中的其他视频块的解码样点来生成当前视频块的预测数据。当前视频块的预测数据可以包括预测视频块和各种语法元素。

残差生成单元207可以通过从当前视频块中减去(例如，由减号指示)当前视频块的(多个)预测视频块来生成当前视频块的残差数据。当前视频块的残差数据可以包括与当前视频块中样点的不同样点分量相对应的残差视频块。

在其他示例中，例如在跳过模式中，对于当前视频块可能没有当前视频块的残差数据，并且残差生成单元207可能不执行减去操作。

变换处理单元208可以通过将一个或多个变换应用于与当前视频块相关联的残差视频块来为当前视频块生成一个或多个变换系数视频块。

在变换处理单元208生成与当前视频块相关联的变换系数视频块之后，量化单元209可以基于与当前视频块相关联的一个或多个量化参数(QP)值来量化与当前视频块相关联的变换系数视频块。

逆量化单元210和逆变换单元211可以分别对变换系数视频块应用逆量化和逆变换，以从变换系数视频块重构残差视频块。重构单元212可以将重构后的残差视频块添加到来自预测单元202生成的一个或多个预测视频块的对应样点，以产生与当前块相关联的重构视频块，用于存储在缓冲区213中。

在重构单元212重构视频块之后，可以执行环路滤波操作，以减少视频块中的视频块效应。

熵编码单元214可以从视频编码器200的其他功能组件接收数据。当熵编码单元214接收到数据时，熵编码单元214可以执行一个或多个熵编码操作，以生成熵编码数据，并输出包括该熵编码数据的比特流。

图17是示出视频解码器300的示例的框图，视频解码器300可以是图15所示的系统100中的视频解码器114。

视频解码器300可以被配置为执行本公开的任何或所有技术。在图17的示例中，视频解码器300包括多个功能组件。本公开中描述的技术可以在视频解码器300的各种组件之间共享。在一些示例中，处理器可以被配置为执行本公开中描述的任何或所有技术。

在图17的示例中，视频解码器300包括熵解码单元301、运动补偿单元302、帧内预测单元303、逆量化单元304、逆变换单元305以及重构单元306和缓冲区307。在一些示例中，视频解码器300可以执行通常与针对视频编码器200(图16)描述的编码过程相反的解码过程。

熵解码单元301可以检索编码比特流。编码比特流可以包括熵编解码的视频数据(例如，视频数据的编码块)。熵解码单元301可以解码熵编解码的视频数据，并且根据熵解码的视频数据，运动补偿单元302可以确定包括运动矢量、运动矢量精度、参考图片列表索引和其他运动信息的运动信息。运动补偿单元302可以例如通过执行AMVP和Merge模式来确定这样的信息。

运动补偿单元302可以产生运动补偿块，可以基于插值滤波器执行插值。要以子像素精度使用的插值滤波器的标识符可以包括在语法元素中。

运动补偿单元302可以使用如视频编码器20在视频块的编码期间使用的插值滤波器来计算参考块的子整数像素的插值。运动补偿单元302可以根据所接收的语法信息确定视频编码器200使用的插值滤波器，并使用该插值滤波器来产生预测块。

运动补偿单元302可以使用一些语法信息来确定用于对编码视频序列的(多个)帧和/或(多个)条带进行编码的块的尺寸、描述编码视频序列的图片的每个宏块如何被分割的分割信息、指示每个分割如何被编码的模式、每个帧间编码块的一个或多个参考帧(和参考帧列表)以及用于对编码视频序列进行解码的其他信息。

帧内预测单元303可以使用例如在比特流中接收的帧内预测模式来从空域上相邻的块形成预测块。逆量化单元303对在比特流中提供并由熵解码单元301解码的量化后的视频块系数进行逆量化，即，解量化。逆变换单元303应用逆变换。

重构单元306可以将残差块与由运动补偿单元202或帧内预测单元303生成的对应预测块相加，以形成解码块。如果需要，还可以应用去块滤波器来滤波解码块，以便移除块效应。解码的视频块然后被存储在缓冲区307中，为后续运动补偿/帧内预测提供参考块，并且还产生解码的视频以在显示设备上呈现。

在一些实施例中，在ALWIP模式或MIP模式下，当前视频块的预测块通过按行和列平均来确定，随后是矩阵乘法，随后是插值以确定预测块。

图18是示出可以在其中实施本文公开的各种技术的示例视频处理系统2100的框图。各种实施方式可以包括系统2100的一些或所有组件。系统2100可以包括用于接收视频内容的输入2102。视频内容可以以例如8或10比特多分量像素值的原始或未压缩格式而接收，或者可以是压缩或编码格式。输入2102可以表示网络接口、外围总线接口或存储接口。网络接口的示例包括诸如以太网、无源光网络(Passive Optical Network，PON)等的有线接口和诸如Wi-Fi或蜂窝接口的无线接口。

系统2100可以包括可以实施本文档中描述的各种编解码或编码方法的编解码组件2104。编解码组件2104可以将来自输入2102的视频的平均比特率减小到编解码组件2104的输出，以产生视频的编解码表示。编解码技术因此有时被称为视频压缩或视频转码技术。编解码组件2104的输出可以被存储，或者经由如由组件2106表示的通信连接而发送。在输入2102处接收的视频的存储或通信传送的比特流(或编解码)表示可以由组件2108用于生成像素值或传送到显示接口2110的可显示视频。从比特流表示生成用户可视视频的过程有时被称为视频解压缩。此外，虽然特定视频处理操作被称为“编解码”操作或工具，但是将理解，编解码工具或操作在编码器处被使用，并且反转编解码结果的对应的解码工具或操作将由解码器执行。

外围总线接口或显示接口的示例可以包括通用串行总线(USB)、或高清晰度多媒体接口(High Definition Multimedia Interface，HDMI)、或显示端口(Displayport)等。存储接口的示例包括SATA(Serial Advanced Technology Attachment，串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以体现在各种电子设备中，诸如移动电话、膝上型电脑、智能电话、或能够执行数字数据处理和/或视频显示的其他设备。

所公开技术的一些实施例包括做出启用视频处理工具或模式的决定或确定。在示例中，当视频处理工具或模式被启用时，编码器将在视频块的处理中使用或实施该工具或模式，但是不一定基于工具或模式的使用来修改产生的比特流。也就是说，当基于决定或确定启用视频处理工具或模式时，从视频的块到视频的比特流表示的转换将使用该视频处理工具或模式。在另一示例中，当视频处理工具或模式被启用时，解码器将在知道比特流已经基于视频处理工具或模式而修改的情况下处理比特流。也就是说，将使用基于该决定或该确定而启用的视频处理工具或模式来执行从视频的比特流表示到视频的块的转换。

所公开技术的一些实施例包括做出禁用视频处理工具或模式的决定或确定。在示例中，当视频处理工具或模式被禁用时，编码器将不在视频的块到视频的比特流表示的转换中使用该工具或模式。在另一示例中，当视频处理工具或模式被禁用时，解码器将在知道比特流还没有使用基于该决定或该确定而禁用的视频处理工具或模式而修改的情况下处理比特流。

图19示出了示例视频处理方法1900的流程图。方法1900包括通过使用差分编解码模式确定要存储的与视频的当前视频块相关联的第一帧内编解码模式来执行当前视频块和当前视频块的比特流表示之间的转换1902，其中与当前视频块相关联的第一帧内编解码模式根据差分编解码模式所使用的第二预测模式来确定，并且其中在差分编解码模式下，当前视频块的帧内预测的量化残差和量化残差的预测之间的差使用差分脉冲编解码调制(DPCM)表示在当前视频块的比特流表示中表示。

在方法1900的一些实施例中，响应于第二预测模式是垂直预测模式，第一帧内编解码模式被推断为垂直帧内预测模式。在方法1900的一些实施例中，响应于第二预测模式是水平预测模式，第一帧内编解码模式被推断为水平帧内预测模式。在方法1900的一些实施例中，响应于第二预测模式是左顶部对角线预测模式，第一帧内编解码模式被推断为左顶部对角线帧内预测模式。在方法1900的一些实施例中，第一帧内编解码模式被推断为与第二预测模式相同。

在方法1900的一些实施例中，第二预测模式被推断为与第一帧内编解码模式相同。在方法1900的一些实施例中，第一帧内编解码模式基于最可能模式(MPM)列表中的模式来推断。在方法1900的一些实施例中，第一帧内编解码模式是预定义的帧内预测模式。在方法1900的一些实施例中，预定义的帧内预测模式包括平面模式。在方法1900的一些实施例中，预定义的帧内预测模式包括DC模式。在方法1900的一些实施例中，预定义的帧内预测模式包括垂直模式。在方法1900的一些实施例中，预定义的帧内预测模式包括水平模式。在方法1900的一些实施例中，视频的附加视频块用第一帧内编解码模式进行编解码，并且其中当前视频块在时间上先于附加视频块。在方法1900的一些实施例中，使用第一帧内编解码模式为附加视频块构建最可能模式(MPM)列表。

图20示出了示例视频处理方法2000的流程图。方法2000包括根据规则来确定差分编解码模式在视频的当前视频块和当前视频块的比特流表示之间的转换期间使用的帧内编解码模式2002。操作2004包括基于该确定，使用差分编解码模式来执行当前视频块和当前视频块的比特流表示之间的转换，其中在差分编解码模式下，当前视频块的帧内预测的量化残差和量化残差的预测之间的差使用差分脉冲编解码调制(DPCM)表示在当前视频块的比特流表示中表示，并且其中量化残差的预测根据帧内编解码模式来执行。

在方法2000的一些实施例中，规则指定帧内编解码模式基于与当前视频块相关联的色彩分量来确定。在方法2000的一些实施例中，规则指定帧内编解码模式基于在以下中信令通知的消息来确定：序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)行或LCU组。在方法2000的一些实施例中，规则指定帧内编解码模式基于指示在差分编解码模式下执行帧内编解码模式的方向的标志来确定。在方法2000的一些实施例中，规则指定帧内编解码模式基于指示量化残差的预测的方向的标志来确定。在方法2000的一些实施例中，规则指定帧内编解码模式基于当前视频块或当前视频块的邻近视频块的块大小来确定。

在方法2000的一些实施例中，规则指定帧内编解码模式基于当前视频块或当前视频块的邻近视频块的形状来确定。在方法2000的一些实施例中，规则指定帧内编解码模式基于当前视频块或当前视频块的邻近视频块的最可能模式(MPM)来确定。在方法2000的一些实施例中，规则指定帧内编解码模式基于当前视频块的邻近视频块的帧间预测模式或帧内预测模式来确定。在方法2000的一些实施例中，规则指定帧内编解码模式基于当前视频块的邻近视频块的运动矢量来确定。在方法2000的一些实施例中，规则指定帧内编解码模式基于当前视频块的邻近视频块是否使用差分编解码模式进行编解码的指示来确定。

在方法2000的一些实施例中，规则指定帧内编解码模式基于当前视频块或当前视频块的邻近视频块的量化参数的值来确定。在方法2000的一些实施例中，规则指定帧内编解码模式基于用于对当前视频块进行编解码的色彩格式来确定。在方法2000的一些实施例中，规则指定帧内编解码模式基于单独编解码树结构还是双编解码树结构用于对当前视频块进行编解码来确定。在方法2000的一些实施例中，规则指定帧内编解码模式基于应用于当前视频块的变换类型来确定。在方法2000的一些实施例中，规则指定帧内编解码模式基于与当前视频块相关联的条带或片组类型或图片类型来确定。

以下列出的示例是对附加实施例的描述。

1.一种视频处理的方法，包括：使用差分编解码模式并选择性地使用基于共存规则的帧内预测模式来执行当前视频块和当前视频块的比特流表示之间的转换；其中，帧内预测模式用于生成当前视频块的样点的预测；并且其中，差分编解码模式用于使用差分脉冲编解码调制表示来表示来自像素的预测的量化残差块。

2.根据示例1所述的方法，其中，所述帧内预测模式是基于矩阵的帧内预测模式(MIP)，并且其中共存规则将MIP限制为MIP的部分允许模式。

3.根据示例2所述的方法，其中，部分允许模式包括水平正常帧内模式或垂直正常帧内模式。

示例1-3的进一步实施例在第4节的项1中描述。例如，差分编解码模式可以表示QR-BDPCM编解码模式的当前版本。

4.根据示例1所述的方法，其中，帧内预测模式包括沿着非水平或非垂直方向的预测。

5.根据示例1或4所述的方法，其中，帧内预测模式是平面或DC预测模式。

6.根据示例1或4所述的方法，其中，帧内预测模式是垂直预测模式或水平预测模式。

7.根据示例1或4所述的方法，其中，帧内预测模式由比特流表示中的字段标识。

8.根据示例1或4所述的方法，其中，帧内预测模式取决于当前视频块或邻近块的块大小。

9.根据示例1或4所述的方法，其中，帧内预测模式取决于当前块或邻近块的形状。

10.根据示例1或4所述的方法，其中，帧内预测模式取决于当前视频块或邻近视频块使用帧间预测还是帧内预测进行编解码。

11.根据示例1或4所述的方法，其中，帧内预测模式取决于邻近视频块是否使用差分编解码模式进行编解码。

12.根据示例1或4所述的方法，其中，帧内预测模式取决于用于当前视频块或邻近视频块的量化参数的值。

13.根据示例1或4所述的方法，其中，帧内预测模式取决于用于对当前视频块进行编解码的色彩格式。

14.根据示例1或4所述的方法，其中，帧内预测模式取决于单独编解码树结构还是双编解码树结构用于对当前视频块进行编解码。

示例4至14的进一步实施例在第4节的项2中提供。

15.根据示例1所述的方法，其中，当前视频块的样点的生成预测从邻近视频区域中的非相邻样点执行。

16.根据示例1所述的方法，其中，帧内预测模式包括帧内块复制Merge模式。

17.根据示例1所述的方法，其中，帧内预测模式包括帧内块复制高级运动矢量预测模式。

18.根据示例15至17中任一项所述的方法，其中，帧内预测模式由块矢量或Merge索引指示。

示例15至18的进一步实施例在第4节的项3中提供。

19.根据示例1所述的方法，其中，共存规则基于比特流表示中的字段来指定从差分编解码模式下的信令通知的索引到帧内预测模式的映射。

20.根据示例1所述的方法，其中，共存规则基于当前视频块或邻近块的大小来指定从差分编解码模式下的信令通知的索引到帧内预测模式的映射。

21.根据示例1所述的方法，其中，共存规则基于当前视频块或邻近块的形状来指定从差分编解码模式下的信令通知的索引到帧内预测模式的映射。

22.根据示例1所述的方法，其中，共存规则基于当前视频块或邻近块的预测模式来指定从差分编解码模式下的信令通知的索引到帧内预测模式的映射。

23.根据示例1所述的方法，其中，共存规则基于当前视频块或邻近块的最可能模式来指定从差分编解码模式下的信令通知的索引到帧内预测模式的映射。

24.根据示例1所述的方法，其中，共存规则基于当前视频块或邻近块的运动矢量来指定从差分编解码模式下的信令通知的索引到帧内预测模式的映射。

25.根据示例1所述的方法，其中，共存规则基于邻近块是否使用差分编解码模式进行编解码来指定从差分编解码模式下的信令通知的索引到帧内预测模式的映射。

26.根据示例1所述的方法，其中，共存规则基于由当前视频块或邻近块使用的量化参数来指定从差分编解码模式下的信令通知的索引到帧内预测模式的映射。

27.根据示例1所述的方法，其中，共存规则基于当前视频块的色彩格式来指定从差分编解码模式下的信令通知的索引到帧内预测模式的映射。

28.根据示例1所述的方法，其中，共存规则基于当前视频块使用单独编解码树还是双编解码树来指定从差分编解码模式下的信令通知的索引到帧内预测模式的映射。

29.根据示例1所述的方法，其中，共存规则基于应用于当前视频块的变换来指定从差分编解码模式下的信令通知的索引到帧内预测模式的映射。

30.根据示例1所述的方法，其中，共存规则基于当前视频块的条带类型或片组类型或图片类型来指定从差分编解码模式下的信令通知的索引到帧内预测模式的映射。

示例19至30的进一步实施例在第4节的项2中提供。

31.一种视频处理的方法，包括：使用差分编解码模式来执行当前视频块和当前视频块的比特流表示之间的转换，其中在该差分编解码模式下使用差分脉冲编解码调制表示来表示来自当前视频块的像素的预测的量化残差块；其中，预测的第一方向或差分编解码模式的第二方向可从比特流表示推断。

32.根据示例31所述的方法，其中，像素的预测的第一方向可从用于预测的帧内预测模式隐式推断。

33.根据示例32所述的方法，其中，差分编解码模式的第二方向可推断为与预测的第一方向相同的方向。

34.根据示例31所述的方法，其中，第二方向可从用于预测的帧内预测模式推断。

35.根据示例31所述的方法，其中，第二方向可从当前视频块或邻近块的大小或者当前视频块或邻近块的形状推断。

36.根据示例31所述的方法，其中，第二方向可从邻近块的运动矢量推断。

37.根据示例31所述的方法，其中，第二方向可从当前视频块或邻近块的最可能模式推断。

38.根据示例31所述的方法，其中，第二方向可从邻近块的预测模式推断。

39.根据示例31所述的方法，其中，第二方向可从邻近块的帧内预测模式推断。

40.根据示例31所述的方法，其中，第二方向可从邻近块是否使用差分编解码模式来推断。

示例31-40的进一步实施例在第4节的项4中提供。

41.一种视频处理的方法，包括：基于应用性规则来确定差分编解码模式适用于当前视频块和当前视频块的比特流表示之间的转换；以及使用差分编解码模式来执行当前视频块和比特流表示之间的转换；

其中，在差分编解码模式下，使用在不同于水平方向或垂直方向的残差预测方向上执行的差分脉冲编解码调制表示来表示来自当前视频块的像素的帧内预测的量化残差块。

42.根据示例41所述的方法，其中，残差预测方向是45度方向。

43.根据示例41所述的方法，其中，残差预测方向是135度方向。

44.根据示例41所述的方法，其中，残差预测方向与比特流表示中的字段或者当前视频块或邻近块的大小或者当前视频块或邻近块的形状相关。

示例41至44的进一步实施例在第4节的项7中提供。

45.根据示例41所述的方法，其中，应用性规则指定由于当前视频块是色度块而使用差分编解码模式。

46.根据示例45所述的方法，其中，应用性规则还指定当前视频块的残差预测方向是与对应于当前视频块的亮度块的方向相同的方向。

47.根据示例41所述的方法，其中，应用性规则指定由于当前视频块不使用跨分量线性模型(CCLM)编解码模式而使用差分编解码。

示例45至47的进一步实施例在第4节的项8中提供。

48.根据示例41所述的方法，其中，应用性规则指定从差分编解码模式对一个色彩分量的应用性推导差分编解码模式对另一个色彩分量的应用性。

示例48的进一步实施例在第4节的项12中提供。

49.一种视频处理的方法，包括：确定差分编解码模式适用于当前视频块和当前视频块的比特流表示之间的转换；以及使用差分编解码模式的实施规则来执行当前视频块和比特流表示之间的转换；其中，在差分编解码模式下，使用在不同于水平方向或垂直方向的残差预测方向上执行的差分脉冲编解码调制表示来表示来自当前视频块的像素的帧内预测的量化残差块。

50.根据示例49所述的方法，其中，实施规则指定将量化残差块的值限制在一范围内。

51.根据示例49所述的方法，其中，实施规则指定使用裁剪来获得量化残差块。

示例49-51的进一步实施例在第4节的项9中提供。

52.根据示例49所述的方法，其中，实施规则指定执行从当前视频块的最后一行到当前视频块的第一行的预测。

53.根据示例49所述的方法，其中，实施规则指定执行从当前视频块的最后一列到当前视频块的第一列的预测。

示例52至53的进一步实施例在第4节的项10中提供。

54.根据示例49所述的方法，其中，实施规则指定将差分编解码模式仅应用于当前视频块的子集。

55.根据示例54所述的方法，其中，子集排除残差的k个左列，其中k是小于块的像素宽度的整数。

56.根据示例54所述的方法，其中，子集排除残差的k个顶行，其中k是小于块的像素高度的整数。

示例54至56的进一步实施例在第4节的项10中提供。

57.根据示例49所述的方法，其中，实施规则指定将差分编解码模式逐段应用于转换。

示例57的进一步实施例在第4节的项12中提供。

58.一种视频处理的方法，包括：确定在当前视频块和当前视频块的比特流表示之间的转换期间使用的差分编解码模式和与当前视频块相关联的帧内编解码模式相同；以及使用差分编解码模式的实施规则来执行当前视频块和比特流表示之间的转换；其中，在差分编解码模式下，来自当前视频块的像素的帧内预测的量化残差块使用在不同于水平或垂直方向的残差预测方向上执行的差分脉冲编解码调制表示来表示。

59.根据示例58所述的方法，其中，差分编解码模式是垂直帧内预测模式。

60.根据示例58所述的方法，其中，差分编解码模式是水平帧内预测模式。

61.根据示例58所述的方法，其中，差分编解码模式是预定义的帧内预测模式。

示例58-61的进一步实施例在第4节的项5中描述。

62.一种视频处理装置，包括被配置为实施示例1至61中的一个或多个的处理器。

63.一种存储有代码的计算机可读介质，该代码在由处理器执行时使得处理器实施根据示例1至61中的任一项或多项所述的方法。

在本文档的列出的示例中，术语转换可以指为当前视频块生成比特流表示或者从比特流表示生成当前视频块。比特流表示不需要表示连续的比特组，并且可以被划分为头字段或表示编解码像素值信息的码字中包括的比特。

在上面的示例中，应用性规则可以是预定义的，并且对于编码器和解码器是已知的。

应当理解，所公开的技术可以体现在视频编码器或解码器中，以使用包括使用关于帧内编解码中使用差分编解码模式的考虑的各种实施规则的技术来提高压缩效率，如本文档中所述。

本文档中描述的所公开的以及其他解决方案、示例、实施例、模块和功能操作可以在数字电子电路中、或者在计算机软件、固件或硬件(包括本文档中公开的结构及其结构等同物)中、或者在它们中的一个或多个的组合中被实施。所公开的以及其他实施例可以被实施为一个或多个计算机程序产品，即在计算机可读介质上编码的计算机程序指令的一个或多个模块，该计算机程序指令用于由数据处理装置运行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读传播信号的物质的组合、或它们中的一个或多个的组合。术语“数据处理装置”包含用于处理数据的所有装置、设备和机器，包括例如可编程处理器、计算机、或多个处理器或计算机。除了硬件之外，装置还可以包括为所讨论的计算机程序创建运行环境的代码，例如，构成处理器固件、协议栈、数据库管理系统、操作系统、或它们中的一个或多个的组合的代码。传播信号是被生成以对信息进行编码以用于发送到合适的接收器装置的人工生成的信号，例如机器生成的电信号、光学信号或电磁信号。

计算机程序(也已知为程序、软件、软件应用、脚本或代码)可以以任何形式的编程语言(包括编译或解释语言)编写，并且其可以以任何形式部署，包括作为独立程序或作为适合在计算环境中使用的模块、组件、子例程或其他单元。计算机程序不一定对应于文件系统中的文件。程序可以存储在保存其他程序或数据(例如，存储在标记语言文档中的一个或多个脚本)的文件的一部分中，存储在专用于所讨论的程序的单个文件中，或存储在多个协调文件中(例如，存储一个或多个模块、子程序或代码部分的文件)。计算机程序可以被部署以在一个计算机上或在位于一个站点上或跨多个站点分布并通过通信网络互连的多个计算机上运行。

本文档书中描述的过程和逻辑流程可以由运行一个或多个计算机程序的一个或多个可编程处理器执行，以通过对输入数据进行操作并生成输出来执行功能。过程和逻辑流程也可以由专用逻辑电路执行，并且装置也可以被实施为专用逻辑电路，例如，FPGA(Field Programmable Gate Array，现场可编程门阵列)或ASIC(专用集成电路)。

适合于运行计算机程序的处理器包括例如通用和专用微处理器、以及任何类型的数字计算机的任何一个或多个处理器。通常，处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常，计算机还将包括用于存储数据的一个或多个大容量存储设备(例如，磁盘、磁光盘或光盘)，或可操作地耦合以从该一个或多个大容量存储设备接收数据或向该一个或多个大容量存储设备传递数据、或者从其接收数据并向其传递数据。然而，计算机不需要这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备，包括例如半导体存储器设备，例如EPROM、EEPROM和闪存设备；磁盘，例如内部硬盘或可换式磁盘；磁光盘；以及CD ROM和DVD-ROM磁盘。处理器和存储器可以由专用逻辑电路补充或并入专用逻辑电路中。

虽然本专利文档包含许多细节，但这些细节不应被解释为对任何主题或可能要求保护的范围的限制，而是作为指定于特定技术的特定实施例的特征的描述。在本专利文档中在单独的实施例的上下文中描述的特定特征也可以在单个实施例中组合实施。相反，在单个实施例的上下文中描述的各种特征也可以分别在多个实施例中或以任何合适的子组合实施。此外，尽管特征可以在上面描述为以特定组合起作用并且甚至最初如此要求保护，但是在一些情况下可以从组合排除来自所要求保护的组合的一个或多个特征，并且所要求保护的组合可以针对子组合或子组合的变化。

类似地，虽然在附图中以特定顺序描绘了操作，但是这不应该被理解为需要以所示的特定顺序或以先后顺序执行这样的操作或者执行所有示出的操作以实现期望的结果。此外，在本专利文档中描述的实施例中的各种系统组件的分离不应被理解为在所有实施例中都需要这样的分离。

仅描述了一些实施方式和示例，并且可以基于本专利文档中描述和示出的内容来进行其他实施方式、增强和变化。

Claims

1.一种处理视频数据的方法，包括：

确定差分编解码模式被应用于视频的第一视频块，并且在所述差分编解码模式下，利用所述第一视频块的第一帧内预测模式推导的量化残差和所述量化残差的预测之间的差被包括在所述视频的比特流中；

与在所述第一视频块的差分编解码模式下使用的预测方向对齐地，存储所述第一视频块的第一帧内预测模式；

基于所存储的所述第一视频块的第一帧内预测模式，为所述视频的第二视频块构建模式候选列表，其中所述第一视频块是所述第二视频块的空域邻近块，并且所述第二视频块是帧内块；

基于所述模式候选列表，确定所述第二视频块的第二帧内预测模式；以及

基于所述第二帧内预测模式，执行所述第二视频块和所述视频的比特流之间的转换，

其中，响应于所述差分编解码模式被应用于所述第一视频块，跨分量线性模型编解码模式不应用于所述第一视频块，并且

其中，所述第一视频块是亮度块，并且第三语法元素进一步用于指示所述差分编解码模式是否被应用于色度分量。

2.根据权利要求1所述的方法，其中，响应于在所述第一视频块的差分编解码模式下使用的所述预测方向是垂直方向，所述第一帧内预测模式被推断为垂直帧内预测模式。

3.根据权利要求1所述的方法，其中，响应于在所述第一视频块的差分编解码模式下使用的所述预测方向是水平方向，所述第一帧内预测模式被推断为水平帧内预测模式。

4.根据权利要求1所述的方法，其中，所述第一视频块的差分编解码模式的预测方向基于所述比特流中包括的、指示所述预测方向是水平方向还是垂直方向的第一语法元素来确定。

5.根据权利要求1所述的方法，其中，所述第一视频块是所述第二视频块的左边邻近块或上方邻近块。

6.根据权利要求1所述的方法，其中，当所述第一视频块不可用时，对应于所述第一视频块的模式候选列表中的候选被设置为平面帧内预测模式。

7.根据权利要求1所述的方法，其中，所述第二帧内预测模式基于所述比特流中的第二语法元素来确定，其中所述第二语法元素指示所述模式候选列表中用于所述第二视频块的帧内预测的候选的索引。

8.根据权利要求1所述的方法，其中，所述差使用差分脉冲编解码调制表示来表示。

9.根据权利要求1所述的方法，其中，所述转换包括将所述第二视频块编码为所述比特流。

10.根据权利要求1所述的方法，其中，所述转换包括从所述比特流解码所述第二视频块。

11.一种用于处理视频数据的装置，包括处理器和其上具有指令的非暂时性存储器，其中所述指令在由所述处理器执行时使得所述处理器：

12.根据权利要求11所述的装置，其中，响应于在所述第一视频块的差分编解码模式下使用的所述预测方向是垂直方向，所述第一帧内预测模式被推断为垂直帧内预测模式，或者响应于在所述第一视频块的差分编解码模式下使用的所述预测方向是水平方向，所述第一帧内预测模式被推断为水平帧内预测模式，并且

其中，所述第一视频块的差分编解码模式的预测方向基于所述比特流中包括的、指示所述预测方向是水平方向还是垂直方向的第一语法元素来确定。

13.根据权利要求11所述的装置，其中，所述第一视频块是所述第二视频块的左边邻近块或上方邻近块，并且当所述第一视频块不可用时，对应于所述第一视频块的模式候选列表中的候选被设置为平面帧内预测模式。

14.根据权利要求11所述的装置，其中，所述第二帧内预测模式基于所述比特流中的第二语法元素来确定，其中所述第二语法元素指示所述模式候选列表中用于所述第二视频块的帧内预测的候选的索引。

15.一种存储指令的非暂时性计算机可读存储介质，所述指令使得处理器：

16.根据权利要求15所述的非暂时性计算机可读存储介质，其中，响应于在所述第一视频块的差分编解码模式下使用的所述预测方向是垂直方向，所述第一帧内预测模式被推断为垂直帧内预测模式，或者响应于在所述第一视频块的差分编解码模式下使用的所述预测方向是水平方向，所述第一帧内预测模式被推断为水平帧内预测模式，并且

17.一种存储由视频处理装置执行的方法生成的视频的比特流的非暂时性计算机可读记录介质，其中所述方法包括：

基于所述第二帧内预测模式来生成所述比特流，

18.根据权利要求17所述的非暂时性计算机可读记录介质，其中，响应于在所述第一视频块的差分编解码模式下使用的所述预测方向是垂直方向，所述第一帧内预测模式被推断为垂直帧内预测模式，或者响应于在所述第一视频块的差分编解码模式下使用的所述预测方向是水平方向，所述第一帧内预测模式被推断为水平帧内预测模式，并且

19.一种用于存储视频的比特流的方法，包括：

基于所述模式候选列表，确定所述第二视频块的第二帧内预测模式；

基于所述第二帧内预测模式来生成所述比特流；以及

将所述比特流存储在非暂时性计算机可读记录介质中，

20.一种视频处理装置，包括被配置为实施权利要求2-10、19中的任一项的处理器。

21.一种存储有代码的非暂时性计算机可读介质，所述代码在由处理器执行时使得所述处理器实施根据权利要求2-10、19中任一项所述的方法。