CN117278750A

CN117278750A - 用于视频编解码中的语法元素的信令的方法和装置

Info

Publication number: CN117278750A
Application number: CN202310868493.XA
Authority: CN
Inventors: 修晓宇; 陈漪纹; 马宗全; 朱弘正; 陈伟; 王祥林; 于冰
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2020-05-20
Filing date: 2021-05-20
Publication date: 2023-12-22
Also published as: JP2024059937A; CN115516864A; EP4154541A4; MX2022014528A; WO2021236988A1; KR20230004941A; JP7422901B2; EP4154541A1; US20230110988A1; JP2023522482A; JP2024023200A; KR20240042167A

Abstract

提供了用于视频编解码的方法和装置。该方法包括解码器接收图像参数集(PPS)中的第一语法元素，该第一语法元素指定对应于PPS的图像是否包括一个或多个网络抽象层(NAL)单元以及该一个或多个NAL单元是否具有相同的NAL单元类型，接收图像头部(PH)中的第二语法元素，该第二语法元素指定对应于PH的图像是帧内随机访问点(IRAP)图像还是渐进式帧内刷新(GDR)图像，以及基于第二语法元素的值来确定第一语法元素的值或者基于第一语法元素的值来确定第二语法元素的值。

Description

用于视频编解码中的语法元素的信令的方法和装置

相关申请的交叉引用

本申请要求于2020年5月20日提交的标题为“Signaling of Syntax Elements inVideo Coding”的美国临时申请No.63/027,718的优先权，该美国临时申请的全部通过引用并入以用于所有目的。

技术领域

本公开涉及视频编解码(coding)和压缩，以及特别地但不限于用于视频编解码中的语法元素的信令的方法和装置。

背景技术

可以使用各种视频编解码技术来压缩视频数据。根据一种或多种视频编解码标准来执行视频编解码。例如，视频编解码标准包括通用视频编解码(VVC)、联合探索测试模型(JEM)、高效视频编解码(H.265/HEVC)、高级视频编解码(H.264/AVC)、运动图像专家组(MPEG)编解码等。视频编解码通常利用预测方法(例如，帧间预测、帧内预测等)，这些预测方法利用存在于视频图像或序列中的冗余。视频编解码技术的一个重要目标是为了将视频数据压缩成使用较低比特率的形式，同时避免或者最小化视频质量的下降。

发明内容

本公开提供了与用于视频编解码中的语法元素的信令相关的技术的示例。

根据本公开的第一方面，提供了一种用于视频编解码的方法。该方法包括解码器接收图像参数集(PPS)中的第一语法元素，该第一语法元素指定对应于PPS的图像是否包括一个或多个网络抽象层(NAL)单元以及该一个或多个NAL单元是否具有相同的NAL单元类型。附加地，解码器接收图像头部(PH)中的第二语法元素，该第二语法元素指定对应于PH的图像是帧内随机访问点(IRAP)图像还是渐进式帧内刷新(GDR)图像。进一步地，解码器基于第二语法元素的值来确定第一语法元素的值。

根据本公开的第二方面，提供了一种用于视频编解码的方法。该方法包括解码器接收PPS中的第一语法元素，该第一语法元素指定对应于PPS的图像是否包括一个或多个NAL单元以及该一个或多个NAL单元是否具有相同的NAL单元类型。附加地，该方法包括解码器接收PH中的第二语法元素，该第二语法元素指定对应于PH的图像是IRAP图像还是GDR图像。进一步地，该方法包括解码器基于第一语法元素的值来确定第二语法元素的值。

根据本公开的第三方面，提供了一种用于视频编解码的方法。该方法包括解码器接收第一语法元素，该第一语法元素指定图像是否包括一个或多个NAL单元以及该一个或多个NAL单元是否具有相同的NAL单元类型。进一步地，解码器基于第一语法元素来确定与图像相关联的PH中的第二语法元素。

根据本公开的第四方面，提供了一种用于视频编解码的方法。该方法包括解码器接收语法元素以及基于该语法元素的值来执行解码过程。进一步地，GDR图像的语法元素的值等于0，当针对图像的语法元素等于0并且该图像的任何条带具有等于GDR_NUT的nal_unit_type时，该图像的所有其他条带都具有相同的nal_unit_type值，并且在接收到该图像的第一条带之后该图像已知为GDR图像。

根据本公开的第五方面，提供了一种用于视频编解码的装置。该装置包括一个或多个处理器和存储器，该存储器被配置为存储由一个或多个处理器可执行的指令。该一个或多个处理器在执行指令时，被配置为执行根据本公开的第一方面的任何方法。

根据本公开的第六方面，提供了一种用于视频编解码的装置。该装置包括一个或多个处理器和存储器，该存储器被配置为存储由一个或多个处理器可执行的指令。该一个或多个处理器在执行指令时，被配置为执行根据本公开的第二方面的任何方法。

根据本公开的第七方面，提供了一种用于视频编解码的装置。该装置包括一个或多个处理器和存储器，该存储器被配置为存储由一个或多个处理器可执行的指令。该一个或多个处理器在执行指令时，被配置为执行根据本公开的第三方面的任何方法。

根据本公开的第八方面，提供了一种用于视频编解码的装置。该装置包括一个或多个处理器和存储器，该存储器被配置为存储由一个或多个处理器可执行的指令。该一个或多个处理器在执行指令时，被配置为执行根据本公开第四方面的任何方法。

根据本公开的第九方面，提供了一种用于视频编解码的非暂时性计算机可读存储介质，该非暂时性计算机可读存储介质存储计算机可执行指令，这些计算机可执行指令在由一个或多个计算机处理器执行时，使该一个或多个计算机处理器执行根据本公开的第一方面的任何方法。

根据本公开的第十方面，提供了一种用于视频编解码的非暂时性计算机可读存储介质，该非暂时性计算机可读存储介质存储计算机可执行指令，这些计算机可执行指令在由一个或多个计算机处理器执行时，使该一个或多个计算机处理器执行根据本公开的第二方面的任何方法。

根据本公开的第十一方面，提供了一种用于视频编解码的非暂时性计算机可读存储介质，该非暂时性计算机可读存储介质存储计算机可执行指令，这些计算机可执行指令在由一个或多个计算机处理器执行时，使该一个或多个计算机处理器执行根据本公开的第三方面的任何方法。

根据本公开的第十二方面，提供了一种用于视频编解码的非暂时性计算机可读存储介质，该非暂时性计算机可读存储介质存储计算机可执行指令，这些计算机可执行指令在由一个或多个计算机处理器执行时，使该一个或多个计算机处理器执行根据本公开的第四方面的任何方法。

附图说明

将通过参考附图中图示出的具体示例来呈现对本公开的示例的更特定的描述。考虑到这些附图描绘仅一些示例，因此未被认为在范围上是限制性的，将通过使用附图来用附加详情和细节描述并说明示例。

图1是图示出根据本公开一些实现方式的示例性视频编码器的框图。

图2是图示出根据本公开一些实现方式的示例性视频解码器的框图。

图3图示出根据本公开一些实现方式的划分成多个编码树单元(CTU)的图像的示例。

图4A-4D是图示出根据本公开一些实现方式的多类型树拆分模式的示意图。

图5图示出根据本公开一些实现方式的多个帧间图像中的帧内编解码区域。

图6是图示出根据本公开一些实现方式的用于视频编解码的示例性装置的框图。

图7是图示出根据本公开一些实现方式的视频编解码的示例性过程的流程图。

图8是图示出根据本公开一些实现方式的视频编解码的示例性过程的流程图。

图9是图示出根据本公开一些实现方式的视频编解码的示例性过程的流程图。

图10是图示出根据本公开一些实现方式的视频编解码的示例性过程的流程图。

具体实施方式

现在将详细地参考具体实现方式，其示例被图示出在附图中。在以下详细描述中，阐述了许多非限制性具体细节以便帮助理解本文呈现的主题。但是，对本领域普通技术人员而言将显而易见的是，可以使用各种替代方案。例如，对本领域普通技术人员而言将显而易见的是，能够在具有数字视频能力的许多类型的电子设备上实现本文呈现的主题。

贯穿本说明书对“一个实施例”、“实施例”、“示例”、“一些实施例”、“一些示例”或类似语言的引用意味着所描述的特定特征、结构或特性被包括在至少一个实施例或示例中。除非另外明确地指定，否则连同一个或一些实施例描述的特征、结构、元素或特性还适用于其他实施例。

贯穿本公开，除非另外明确地指定，否则术语“第一”、“第二”、“第三”等都被用作仅针对对相关元素(例如设备、组件、组合物、步骤等)的引用的命名法，而不暗示任何空间或时间顺序。例如，“第一设备”和“第二设备”可以指代两个分别形成的设备，或同一设备的两个部分、组件或操作状态，并且可以被任意地命名。

术语“模块”、“子模块”、“电路”、“子电路”、“电路系统”、“子电路系统”、“单元”或“子单元”可以包括存储器(共享的、专用的或组的)，该存储器存储能够由一个或多个处理器执行的代码或指令。模块可以包括具有或没有存储的代码或指令的一个或多个电路。模块或电路可以包括直接地或间接地连接的一个或多个组件。这些组件可以或者可以不物理上附接到彼此，或者彼此相邻地设置位置。

如本文所使用的，可以取决于上下文将术语“如果”或“当......时”理解为意指“一......就......”或“响应于”。这些术语在出现在权利要求中的情况下，可以不指示相关限制或特征是有条件的或可选的。例如，一种方法可以包括以下步骤：i)当存在条件X时或如果存在条件X，则执行功能或动作X’，以及ii)当存在条件Y时或如果存在条件Y，则执行功能或动作Y’。该方法可以用执行功能或动作X’的能力和执行功能或动作Y’的能力二者来实现。因此，功能X’和Y’二者可以在该方法的多次执行中、在不同时间执行。

单元或模块可以纯粹通过软件、纯粹通过硬件或者通过硬件和软件的组合来实现。例如，在纯软件实现方式中，单元或模块可以包括功能上相关的代码块或软件组件，这些代码块或软件组件被直接地或间接地链接在一起，以便执行特定功能。

图1示出了图示出示例性基于块的混合视频编码器100的框图，该混合视频编码器100可以与许多使用基于块处理的视频编解码标准相结合地使用。在编码器100中，视频帧被分割成多个视频块以用于处理。对于每个给定视频块，基于帧间预测方法或帧内预测方法来形成预测。在帧间预测中，一个或多个预测值是基于来自先前重建帧的像素通过运动估计和运动补偿而形成的。在帧内预测中，预测值是基于当前帧中的重建像素而形成的。通过模式判定，可以选取最佳预测值来预测当前块。

表示当前视频块及其预测值之间的差异的预测残差被发送至变换电路系统102。然后将变换系数从变换电路系统102发送至量化电路系统104以用于熵减少。然后将量化系数馈送至熵编码电路系统106以生成压缩视频比特流。如图1所示，来自帧间预测电路系统和/或帧内预测电路系统112的预测相关信息110，诸如视频块分割信息、运动矢量、参考图像索引和帧内预测模式，也通过熵编码电路系统106馈送并且保存到压缩视频比特流114中。

在编码器100中，还需要解码器相关电路系统以便为了预测而重建像素。首先，通过反量化电路系统116和逆变换电路系统118来重建预测残差。此重建的预测残差与块预测值120组合以生成当前视频块的未滤波重建像素。

帧内预测(还称为“空间预测”)使用来自相同视频图像和/或条带中的已编码的邻近块的样点(其被称作参考样点)的像素来预测当前视频块。空间预测减少了视频信号中固有的空间冗余。

帧间预测(还称为“时间预测”)使用来自已编码的视频图像的重建像素来预测当前视频块。时间预测减少了视频信号中固有的时间冗余。给定编码单元(CU)或码块的时间预测信号通常通过一个或多个运动矢量(MV)用信号传输，该一个或多个MV指示当前CU及其时间参考之间的运动量和方向。进一步地，如果支持多个参考图像，则附加地发送一个参考图像索引，该一个参考图像索引用于标识时间预测信号来自参考图像储存库中的哪个参考图像。

在执行空间预测和/或时间预测之后，编码器100中的帧内/帧间模式判定电路系统121例如基于率失真优化方法来选取最佳预测模式。然后从当前视频块减去块预测值120；以及使用变换电路系统102和量化电路系统104来使所得的预测残差去相关。所得的量化残差系数由反量化电路系统116反量化并且由逆变换电路系统118逆变换以形成重建残差，该重建残差然后添加回到预测块以形成CU的重建信号。进一步地，在将重建CU放置在图像缓存117的参考图像储存库中并且使用重建CU来对未来视频块进行编码之前，可以在重建CU上应用环内滤波器115，诸如去块滤波器、样点自适应偏移(SAO)和/或自适应环内滤波器(ALF)。为了形成输出视频比特流114，编码模式(帧间或帧内)、预测模式信息、运动信息和量化残差系数都被发送至熵编码单元106以被进一步压缩和包装以形成比特流。

例如，去块滤波器在AVC、HEVC以及VVC的当前版本中可用。在HEVC中，定义了称作SAO(样点自适应偏移)的附加环内滤波器以进一步改进编解码效率。在VVC标准的当前版本中，正在积极地调查研究称作ALF(自适应环路滤波器)的又一环内滤波器，并且它大概率将被包括在最终标准中。

这些环内滤波器操作是可选的。执行这些操作有助于改进编解码效率和视觉质量。它们还可以由编码器100提出的判定被关闭以节省计算复杂性。

应该注意，如果这些滤波器选项由编码器100打开，则帧内预测通常基于未滤波重建像素，而帧间预测基于经滤波重建像素。

图2是图示出可以与许多视频编解码标准相结合地使用的示例性基于块的视频解码器200的框图。此解码器200类似于存在在图1的编码器100中的重建相关部分。在解码器200中，传入视频比特流201首先通过熵解码202被解码以导出量化系数级别和预测相关信息。然后通过反量化204和逆变换206来处理量化系数级别以获得重建预测残差。在帧内/帧间模式选择器212中实施的块预测值机制被配置为基于解码预测信息来执行帧内预测208或运动补偿210。通过使用求和器214对来自逆变换206的重建预测残差和通过块预测值机制生成的预测输出进行求和来获得一组未滤波重建像素。

重建块可以在它被存储在充当参考图像储存库的图像缓存213中之前进一步经过环内滤波器209。图像缓存213中的重建视频可以被发送来驱动显示设备，以及用于预测未来视频块。在环内滤波器209被打开的情形下，对这些重建像素执行滤波操作以导出最终重建视频输出222。

通用视频编解码(VVC)

在2018年4月10日至20日在美国圣地亚哥举行的第10次JVET会议上，JVET将VVC和VVC测试模型1(VTM1)的第一草稿定义为其参考软件实现方式。决定了包括具有嵌套多类型树的四叉树作为VVC的初始新编解码特征。多类型树是包括二元拆分和三元拆分二者的码块分割结构。从那时起，已通过后续JVET会议开发并更新了参考软件VTM，其中实现了编码和解码过程。

在VVC中，输入视频的图像被分割成称作CTU的块。使用具有嵌套多类型树结构的四叉树来将CTU拆分成CU，其中CU定义共享相同预测模式(例如，帧内或帧间)的像素的区域。术语“单元”可以定义覆盖诸如亮度和色度之类的所有分量的图像的区域。术语“块”可以用于定义覆盖特定分量(例如，亮度)的区域，以及当考虑诸如4:2:0之类的色度采样格式时，不同分量(例如，亮度和色度)的块可能在空间位置上不同。

将图像分割成CTU

图3图示出根据本公开一些实现方式的划分成多个CTU 302的图像300的示例。

在VVC中，图像被划分成CTU的序列。CTU概念与HEVC的概念相同。对于具有三个样点阵列的图像，CTU由亮度样点的N×N块以及色度样点的两个对应块构成。

CTU中的亮度块的最大允许尺寸被指定为128×128(但是亮度变换块的最大尺寸是64×64)。

使用树结构分割CTU

在HEVC中，通过使用表示为编码树的四元树结构来将CTU拆分成CU以适应各种局部特性。在叶CU级别下做出是使用图像间(时间)预测还是图像内(空间)预测来对图像区域进行编解码的判定。能够根据PU拆分类型将每个叶CU进一步拆分成一个、两个或四个PU。在一个PU内部，应用相同预测过程并且在PU基础上将相关信息传送至解码器。在通过基于PU拆分类型应用预测过程来获得残差块之后，能够根据类似于用于CU的编码树的另一四元树结构来将叶CU分割成变换单元(TU)。HEVC结构的一个关键特征是它具有包括CU、PU和TU的多个分割概念。

在VVC中，具有使用二元和三元拆分分段结构的嵌套多类型树的四叉树替换多分割单元类型的概念，即，除了如对最大变换长度而言尺寸太大的CU所需的之外，它去除了CU、PU和TU概念的分离，并且对于CU分割形状支持更多灵活性。在编码树结构中，CU能够具有正方形或矩形形状。CTU首先通过四元树(又称四叉树)结构分割。然后能够通过多类型树结构进一步分割四元树叶节点。

图4A-4D是图示出根据本公开一些实现方式的多类型树拆分模式的示意图。如图4A-4D所示，在多类型树结构中存在四种拆分类型，即垂直二元拆分402(SPLIT_BT_VER)、水平二元拆分404(SPLIT_BT_HOR)、垂直三元拆分406(SPLIT_TT_VER)和水平三元拆分408(SPLIT_TT_HOR)。多类型树叶节点被称作CU，并且除非CU对最大变换长度而言太大，否则此分段被用于预测和变换处理而无需任何进一步分割。这意味着，在大多数情况下，CU、PU和TU在具有嵌套多类型树码块结构的四叉树中具有相同的块尺寸。当最大支持的变换长度小于CU的颜色分量的宽度或高度时发生例外。

VVC中的语法

在VVC中，语法信令的比特流的第一层是NAL，其中比特流被划分成一组NAL单元。一些NAL单元向解码器用信号传输公共控制参数，诸如SPS和PPS。其他NAL单元包含视频数据。视频编码层(VCL)NAL单元包含经编码的视频的条带。经编码的图像被称作访问单元并且能够被编码为一个或多个条带。

经编码的视频序列从瞬时解码器刷新(IDR)图像开始。所有后续视频图像都被编码为条带。新IDR图像用信号传输：前一个视频分段结束，以及新视频分段开始。每个NAL单元以跟随原始字节序列净荷(RBSP)的单字节报头开始。RBSP包含经编码的条带。条带被二元编码，所以可以用零比特填充它们以确保长度是整数个字节。条带由条带头部和条带数据构成。条带数据被指定为一系列CU。

在第16次JVET会议中采用了图像头部概念，以作为图像的第一VCL NAL单元，每个图像传送一次。还提出了将先前在条带头部中的一些语法元素分组至此图像头部。功能上仅需要每图像传送一次的语法元素可以被移动至图像头部，而不是针对给定图像在条带中传送多次。

在VVC规范中，语法表指定所有允许的比特流的语法的超集。可以在其他条款中直接地或间接地指定对语法的附加约束。下面的表1和表2是VVC中的条带头部和PH的语法表。在语法表之后还说明了一些语法的语义。

表1

表2

/>

所选语法元素的语义

ph_temporal_mvp_enabled_flag指定时间运动矢量预测值是否能够被用于与图像头部(PH)相关联的条带的帧间预测。如果ph_temporal_mvp_enabled_flag等于0，则与PH相关联的条带的语法元素应受到约束，使得在条带的解码中不使用时间运动矢量预测值。否则(ph_temporal_mvp_enabled_flag等于1)，可以在与PH相关联的条带的解码中使用时间运动矢量预测值。当不存在ph_temporal_mvp_enabled_flag时，ph_temporal_mvp_enabled_flag的值被推断为等于0。当解码图像缓冲区(DPB)中没有参考图像具有与当前图像相同的空间分辨率时，ph_tempora_mvp_enabled_flag的值应等于0。

基于子块的合并MVP候选的最大数量MaxNumSubblockMergeCand以如下方式导出：

MaxNumSubblockMergeCand的值应在0至5的范围内，包括0和5。

等于1的slice_collocated_from_10_flag指定用于时间运动矢量预测的同位图片是从参考图像列表0导出的。等于0的slice_collocated_from_10_flag指定用于时间运动矢量预测的同位图片是从参考图像列表1导出的。当slice_type等于B或P，ph_temporal_mvp_enabled_flag等于1，以及slice_collocated_from_10_flag不存在时，以下适用：

-如果rpl_info_in_ph_flag等于1，则推断slice_collocated_from_10_flag等于ph_collocated_from_10_flag。

-否则(rpl_info_in_ph_flag等于0并且slice_type等于P)，推断slice_collocated_from_10_flag的值等于1。

sice_collocated_ref_idx指定用于时间运动矢量预测的同位图片的参考索引。

当sice_type等于P时或者当slice_type等于B并且slice_collocated_from_l0_flag等于1时，slice_collocated_ref_idx引用参考图像列表0中的条目，并且slice_collocated_ref_idx的值应在0至NumRefIdxActive[0]-1的范围内，包括0和NumRefIdxActive[0]-1。

当slice_type等于B并且slice_collocated_from_10_flag等于0时，slice_collocated_ref_idx引用参考图像列表1中的条目，并且slice_collocated_ref_idx的值应在0至NumRefIdxActive[1]-1的范围内，包括0和NumRefIdxActive[1]-1。

当slice_collocated_ref_idx不存在时，以下适用：

-如果rpl_info_in_ph_flag等于1，则推断slice_collocated_ref_idx的值等于ph_collocated_ref_idx。

-否则(rpl_info_in_ph_flag等于0)，推断slice_collocated_ref_idx的值等于0。

由slice_collocated_ref_idx指代的图像对经编码的图像的所有条带而言应相同是比特流一致性的要求。

由slice_collocated_ref_idx指代的参考图像的pic_width_in_luma_samples和pic_height_in_luma_samples的值应分别等于当前图像的pic_width_in_luma_samples和pic_height_in_luma_samples的值，并且RprConstraintsActive[slice_collocated_from_l0_flag？0：1][slice_collocated_ref_idx]应等于0是比特流一致性的要求。

注意，RprConstraintsActive[i][j]的值在VVC规范的条款8.3.2中导出，概括如下。

用于参考图像列表构建的解码过程

此过程在针对非IDR图像的每个条带的解码过程开始时被调用。参考图像通过参考索引寻址。参考索引是对参考图像列表的索引。当对I条带进行解码时，在条带数据的解码中不使用参考图像列表。当对P条带进行解码时，在条带数据的解码中仅使用参考图像列表0(即，RefPicList[0])。当对B条带进行解码时，在条带数据的解码中使用参考图像列表0和参考图像列表1二者(即，RefPicList[1])。

在针对非IDR图像的每个条带的解码处理开始时，导出参考图像列表RefPicList[0]和RefPicList[1]。参考图像列表被用在如条款8.3.3中所指定的参考图像的标记中或在条带数据的解码中。

对于不是图像的第一条带的非IDR图像的I条带，可以出于比特流一致性检查目的而导出RefPicList[0]和RefPicList[1]，但是它们的导出对当前图像或在解码顺序上在当前图像之后的图像的解码而言不是必需的。对于不是图像的第一条带的P条带，可以出于比特流一致性检查目的而导出RefPicList[1]，但是其导出对当前图像或在解码顺序上在当前图像之后的图像的解码而言不是必需的。

参考图像列表RefPicList[0]和RefPicList[1]、参考图像缩放比率RefPicScale[i][j][0]和RefPicScale[i][j][1]、以及参考图像缩放标志RprConstraintsActive[0][j]和RprConstraintsActive[1][j]以如下方式导出：

/>

scaling_win_left_offset、scaling_win_right_offset、scaling_win_top_offset和scaling_win_bottom_offset指定应用于图像尺寸的用于缩放比率计算的偏移。当不存在scaling_win_left_offset、scaling_win_right_offset、scaling_win_top_offset和scaling_win_bottom_offset时，推断scaling_win_left_offset、scaling_win_right_offset、scaling_win_top_offset和scaling_win_bottom_offset的值分别等于pps_conf_win_left_offset、pps_conf_win_right_offset、pps_conf_win_top_offset和pps_conf_win_bottom_offset。

SubWidthC*(scaling_win_left_offset+scaling_win_right_offset)的值应小于pic_width_in_luma_samples，并且SubHeightC*(scaling_win_top_offset+scaling_win_bottom_offset)的值应小于pic_height_in_luma_samples。

变量PicOutputWidthL和PicOutputHeightL以如下方式导出：

PicOutputWidthL＝pic_width_in_luma_samples-SubWidthC*(scaling_win_right_offset+scaling_win_left_offset) (3)

PicOutputHeightL＝pic_height_in_luma_samples-SubWidthC*(scaling_win_bottom_offset+scaling_win_top_offsse) (4)

令refPicOutputWidthL和refPicOutputHeightL分别为引用此PPS的当前图像的参考图像的PicOutputWidthL和PicOutputHeightL。满足以下所有条件是比特流一致性的要求：

-PicOutputWidthL*2应大于或等于refPicWidthInLumaSamples。

-PicOutputHeightL*2应大于或等于refPicHeightInLumaSamples。

-PicOutputWidthL应小于或等于refPicWidthInLumaSamples*8。

-PicOutputHeightL应小于或等于refPicHeightInLumaSamples*8。

-PicOutputWidthL*pic_width_max_in_luma_samples应大于或等于refPicOutputWidthL*(pic_width_in_luma_samples-Max(8，MinCbSizeY))。

-PicOutputHeightL*pic_height_max_in_luma_samples应大于或等于refPicOutputHeightL*(pic_height_in_luma_samples-Max(8，MinCbSizeY))。

NAL单元语法

类似于HEVC，在VVC规范中，在每个NAL单元开始时，用信号传输总长度为两个字节的一个NAL单元标头表，以指定NAL单元的基本信息。表3图示出存在于当前NAL单元报头中的语法元素。

表3

在表3中，第一比特是用于指定是否在传输期间引发任何错误的forbidden_zero_bit。0意味着NAL单元正常，然而1意味着存在语法违规。因此，对于正常比特流，其对应值应等于0。下一个比特是留作将来使用并且应等于0的nuh_reserved_zero_bit。后面的6个比特用于指定语法nuh_layer_id的值，该语法nuh_layer_id标识NAL单元所属于的层。nuh_layer_id的值应在0至55的范围内，包括0和55。用于nuh_layer_id的其他值留作将来使用。然后，语法元素nal_unit_type用于指定NAL单元类型，即，如表4所指定的那样包含在NAL单元中的RBSP数据结构的类型。

表4

/>

渐进式帧内刷新

低延迟和错误恢复是针对实际视频传输系统应该考虑的两个重要因素。周期性地插入IRAP图像的帧内刷新通常用于限制时间图像中的错误传播并且增强比特流的错误恢复能力。然而，由于帧间编解码的编解码效率比帧内编解码好得多，所以，当以固定传输率通过网络发送时，相对大尺寸的帧内图像可能潜在地引起延迟问题。这会导致不希望的网络拥塞和分组丢失。为了解决此类问题，渐进式帧内刷新(GDR)被采用到VVC标准中，GDR将帧内编解码区域散布在多个帧间图像中，如图5所描绘的。如图5所示，定义了两个区域。部分2表示干净区域。干净区域对应于已在当前GDR时段期间刷新的像素，而脏区域对应于尚未被刷新的区域。部分1表示应用了帧内编解码的码块。GDR的原理是为了确保来自干净区域的像素仅使用来自相同GDR时段中的时间参考图像的刷新区域的像素来重建。在当前VVC中，在图像头部中用信号传输三个GDR相关语法元素ph_gdr_or_irap_pic_flag、ph_gdr_pic_flag和ph_recovery_poc_cnt。表5图示出图像头部中的对应GDR信令和关联语义。

表5

等于1的ph_gdr_or_irap_pic_flag指定当前图像是GDR或IRAP图像。等于0的ph_gdr_or_irap_pic_flag指定当前图像不是GDR图像并且可以或者可以不是IRAP图像。

等于1的ph_gdr_pic_flag指定与PH相关联的图像是GDR图像。等于0的ph_gdr_pic_flag指定与PH相关联的图像不是GDR图像。当不存在ph_gdr_pic_flag时，ph_gdr_pic_flag的值被推断为等于0。当sps_gdr_enabled_flag等于0时，ph_gdr_pic_flag的值应等于0。

当ph_gdr_or_irap_pic_flag等于1并且ph_gdr_pic_flag等于0时，与PH相关联的图像是IRAP图像。

ph_recovery_poc_cnt按输出顺序指定经解码的图像的恢复点。在当前图像是GDR图像时，变量recoveryPointPocVal以如下方式导出：

recoveryPointPocVal＝PicOrderCntVal+ph_recovery_poc_cnt (5)

如果当前图像是GDR图像，并且存在按解码顺序在具有等于recoveryPointPocVal的PicOrderCntVal的CLVS中跟随当前GDR图像的图像picA，则图像picA被称为恢复点图像。否则，按输出顺序在CLVS中具有大于recoveryPointPocVal的PicOrderCntVal的第一个图像被称为恢复点图像。恢复点图像按解码顺序不应在当前GDR图像之前。与当前GDR图像相关联并且具有小于recoveryPointPocVal的PicOrderCntVal的图像被称为GDR图像的恢复图像。ph_recovery_poc_cnt的值应在0至MaxPicOrderCntLsb-1的范围内，包括0和MaxPicOrderCntLsb-1。

当sps_gdr_enabled_flag等于1并且当前图像的PicOrderCntVal大于或等于关联的GDR图像的recoveryPointPocVal时，当前图像和按输出顺序中的后续解码图像与按解码顺序在关联的GDR图像之前的通过从先前的IRAP图像(当先前的IRAP图像存在时)开始解码过程所产生的对应图像完全匹配。

一个图像中的混合NAL类型

与一个图像内的条带的NAL类型必须相同的HEVC标准不同，如果在一个图像内有IRAP NAL单元类型和非IRAP NAL单元类型，则允许具有混合。此类功能性的动机是使用子图像的基于区域的随机访问。例如，对于360度视频流，一个360度视频的一些区域与其他区域相比，能够被用户观看得更多。为了更好地权衡编解码效率和平均视点切换延迟，与其他区域相比，能够使用更频繁的IRAP图像来对那些更经常观看的区域进行编解码。由于此类原因，在PPS中引入一个标志pps_mixed_nalu_types_in_pic_flag。当该标志等于1时，它指示引用PPS的每个图像具有不止一个NAL单元并且NAL单元不具有相同的nal_unit_type值。否则(当该标志等于0时)，引用PPS的每个图像具有一个或多个NAL单元并且引用PPS的每个图像的NAL单元具有相同的nal_unit_type值。附加地，标志pps_mixed_nalu_types_in_pic_flag等于1，进一步应用一个比特流一致性约束，即对于任何特定图像，一些NAL单元具有特定IRAP NAL单元类型，而其他NAL单元具有特定非IRAP NAL单元类型。换言之，任何特定图像的NAL单元不能具有不止一种IRAP NAL单元类型，并且不能具有不止一种非IRAPNAL单元类型，如在下面所指定的。

对于任何特定图像的VCL NAL单元，以下适用：

-如果pps_mixed_nalu_types_in_pic_flag等于0，则nal_unit_type的值对图像的所有VCL NAL单元而言应相同，并且图像或PU被称为具有与图像或PU的经编码的条带NAL单元相同的NAL单元类型。

-否则(pps_mixed_nalu_types_in_pic_flag等于1)，以下适用：

-图像应具有至少两个子图像。

-图像的VCL NAL单元应具有两个或更多个不同的nal_unit_type值。

-不应存在具有等于GDR_NUT的nal_unit_type的图像的VCL NAL单元。

-当图像的至少一个子图像的VCL NAL单元具有等于IDR_W_RADL、IDR_N_LP或CRA_NUT的nal_unit_type的特定值时，图像中的其他子图像的VCL NAL单元应都具有等于TRAIL_NUT的nal_unit_type。

在当前VVC中，在没有任何条件约束的图像头部(PH)中用信号传输mvd_l1_zero_flag。然而，通过标志mvd_l1_zero_flag控制的特征仅在条带为双向预测条带(B条带)时才适用。因此，当与图像头部相关联的条带不是B条带时，标志信令是冗余的。

类似地，在另一示例中，只有当在序列参数集(SPS)中用信号传输的对应启用标志(sps_bdof_pic_present_flag、sps_dmvr_pic_present_flag)分别为真时才在PH中用信号传输ph_disable_bdof_flag和ph_disable_dmvr_flag。然而，如表6所示，通过标志ph_disable_bdof_flag和ph_disable_dmvr_flag控制的特征仅在条带为双向预测条带(B条带)时才适用。因此，当与图像头部相关联的条带不是B条带时，这两个标志的信令是冗余的或无用的。

表6

再一个示例还可以存在于语法元素ph_collocated_from_l0_flag上，指示同位图片来自列表0或列表1，如表7所示。以及另一个示例可以存在于语法pred_weight_table()上，其是与针对双向预测的预测的加权表格相关的语法元素，如表8所示。

表7

if(phtemporal_mvp_enabled_flaa&&rpl_info_in_ph_fllag){
	ph_collocated_from_l0_flag

表8

一个问题与语法ph_temporal_mvp_enabled_flag相关联。在当前VVC中，因为被选择用于TMVP(Temporal motion Vector Prediction，时间运动向量预测)导出的同位图片的分辨率应与当前图像的分辨率相同，所以存在检查ph_temporal_mvp_enabled_flag的值的比特流一致性约束，如下所说明的：

当DPB中没有参考图像具有与当前图像相同的空间分辨率时，ph_temporal_mvp_enabled_flag的值应等于0。

然而，在当前VVC中，不仅同位图片的分辨率将影响TMVP的启用，而且应用于图像尺寸的用于缩放比率计算的偏移也影响TMVP的启用。然而，在当前VVC中，在ph_temporal_mvp_enabled_flag的比特流一致性中不考虑偏移。

此外，存在这样的比特流一致性的要求，即由slice_collocated_ref_idx指代的图像对经编码的图像的所有条带而言应相同。然而，当经编码的图像具有多个条带并且在所有这些条带间不存在公共参考图像时，没有机会满足此比特流一致性。而在此类情况下，应该将ph_temporal_mvp_enabled_flag约束为0。

根据当前VVC规范，IRAP图像是指其中所有相关NAL单元具有属于IRAP NAL类型的相同nal_unit_type的一个图像。具体地，下文中的描述用于定义VVC规范中的IRAP图像：

帧内随机访问点(IRAP)图像：所有VCL NAL单元具有相同的nal_unit_type值的经编码的图像，该nal_unit_type值在IDR_W_RADL至CRA_NUT的范围(包括端点)内。

IRAP图像在其解码过程中不使用帧间预测，并且可以是CRA图像或IDR图像。比特流中按解码顺序的第一图像必须是IRAP或GDR图像。如果必需的参数集在需要引用它们时可用，则IRAP图像和在CLVS中的按解码顺序所有后续非RASL图像都能够在不用按解码顺序执行在IRAP图像之前的任何图像的解码过程的情况下被正确地解码。

IRAP图像的pps_mixed_nalu_types_in_pic_flag的值等于0。当针对图像的pps_mixed_nalu_types_in_pic_flag等于0，并且该图像的任何条带具有IDR_W_RADL至CRA_NUT的范围(包括端点)内的nal_unit_type时，该图像的所有其他条带都具有相同的nal_unit_type值，并且该图像已知为IRAP图像。

如能够从上文看到的，对于每个IRAP图像，该图像引用的对应PPS应该具有等于0的pps_mixed_nalu_types_in_pic_flag。类似地，在当前VVC规范中，GDR图像是指其中与该图像相关联的所有NAL的nal_unit_type应等于GDR_NUT的一个图像，如被指定为：

渐进式解码刷新(GDR)图像：每个VCL NAL单元具有等于GDR_NUT的nal_unit_type的图像。

考虑到一个GDR图像的所有NAL单元必须具有相同的NAL类型，GDR图像引用的对应PPS中的标志pps_mixed_nalu_types_in_pic_flag不能等于一。

另一方面，在图像头部中用信号传输两个标志，即ph_gdr_or_irap_pic_flag和ph_gdr_pic_fiag，以指示一个图像是一个IRAP图像还是一个GDR图像。当标志ph_gdr_or_irap_pic_flag等于一并且标志ph_gdr_pic_flag等于零时，当前图像是一个IRAP图像。当标志ph_gdr_or_irap_pic_flag等于一并且标志ph_gdr_pic_flag等于一时，当前图像是一个GDR图像。根据当前VVC规范，这两个标志被允许作为一或零用信号传输，而不用考虑PPS中的标志pps_mixed_nalu_types_in_pic_flag的值。然而，如早前提及的，只有当图像中的NAL单元具有相同的nal_unit_type，即所对应的pps_mixed_nalu_types_in_pic_flag必须为零时，一个图像才可以是一个IRAP图像或一个GDR图像。因此，当ph_gdr_or_irap_pic_flag和ph_gdr_pic_flag中的任何一者或二者等于一(即，指示当前图像是IRAP图像或GDR图像)并且所对应的pps_mixed_naly_types_in_pic_flag等于一(即，指示在当前图像中存在多种NAL类型)时，图像头部中的现有IRAP/GDR信令是有问题的。

由于通过标志mvd_l1_zero_flag、ph_disable_bdof_flag和ph_disable_dmvr_flag控制的特征仅在条带是双向预测条带(B条带)时才适用，所以根据本公开的方法，提出了只有当关联条带是B条带时才用信号传输这些标志。注意，当在PH中用信号传输参考图像列表(例如，rpl_info_in_ph_flag＝1)时，这意味着经编码的图像的所有条带都使用在PH中用信号传输的相同参考图像。因此，当在PH中用信号传输参考图像列表并且用信号传输的参考图像列表指示当前图像不是双向预测的时，不需要用信号传输标志mvd_l1_zero_flag、ph_disable_bdof_flag和ph_disable_dmvr_flag。在第一实施例中，一些条件被添加到在图像头部(PH)中发送的那些语法以防止由于针对图像头部中的一些语法发送的不适当值而导致的冗余信令或未定义解码行为。在下面说明了基于该实施例的一些示例，其中变量num_ref_entries[i][RplsIdx[i]]表示列表i中的参考图像的数量。

If(！rpl_info_in_ph_flag ||(rpl_info_in_ph_flag&&num_ref_entries[0][RplsIdx[0]]＞0&&numref_entries[1][RplsIdx[1]]＞0))mvd_l1_zero_flag

作为一种选择，可以以给出相同结果的更紧凑形式来写条件。因为双向预测条带(B条带)或双向预测图像必须具有至少一个列表1参考图像，所以只能检查当前条带/图像是否具有列表1参考图像。在下面说明了替代的条件检查的示例：

If(！rpl_info_in_ph_flag||(rpl_info_in_ph_flag&&num_ref_entries[1][RplsIdx[1]]＞0))mvd_l1_zero_flag

mvd_l1_zero_flag的语义也被修改以处理当未用信号传输它时的情况。

等于1的mvd_l1_zero_flag指示mvd_coding(x0，y0，1)语法结构未被解析并且对于compIdx＝0..1和cpIdx＝0..2将MvdL1[x0][y0][compIdx]和MvdCpL1[x0][y0][cpIdx][compIdx]设置为等于0。等于0的mvd_l1_zero_flag指示mvd_coding(x0，y0，1)语法结构被解析。当不存在mvd_l1_zero_flag时，mvd_l1_zero_flag的值被推断为0。

在下面说明了有条件地用信号传输语法元素ph_disable_dmvr_flag的若干示例：

If(sps_dmvr_pic_present_flag&&(！rpl_info_in_ph_flag||(rpl_info_in_ph_flag&&num_ref_entries[0][RplsIdx[0]1＞0&&num_ref_entries[1][RplsIdx[1]]＞0)))ph_disable_dmvr_flag

类似地，在下面说明了替代的条件检查的示例：

If(sps_dmvr_pic_present_flag&&(lrpl_info_in_ph_flag||(rpl_info_in_ph_flag&&num_ref_entries[1][RplsIdx[1]]＞0)))ph_disable_dmvr_flag

ph_disable_dmvr_flag的语义也被修改以处理当未用信号传输它时的情况。

等于1的ph_disable_dmvr_flag指定在与PH相关联的条带中禁用基于解码器运动矢量细化的帧间双向预测。等于0的ph_disable_dmvr_flag指定在与PH相关联的条带中可以启用或者可以不启用基于解码器运动矢量细化的帧间双向预测。

当ph_disable_dmvr_flag不存在时，以下适用：

-如果sps_dmvr_enabled_flag等于1并且sps_dmvr_pic_present_flag等于0，则推断ph_disable_dmvr_flag的值等于0。

-否则如果sps_dmvr_enabled_flag等于1并且sps_dmvr_pic_present_flag等于1，则推断ph_disable_dmvr_flag的值等于1。

-否则(sps_dmvr_enabled_flag等于0)，推断ph_disable_dmvr_flag的值等于1。

在下面说明了当ph_disable_dmvr_flag的值未被呈现时导出它的替代方式：

-当显式地用信号传输或者隐式地导出ph_disable_dmvr_flag的值时，如果考虑所有条件以进行ph_disable_dmvr_flag的值的导出：如果sps_dmvr_enabled_flag等于1并且sps_dmvr_pic_present_flag等于0，则推断ph_disable_dmvr_flag的值等于0。

-否则如果sps_dmvr_enabled_flag等于0并且sps_dmvr_pic_present_flag等于0，则推断ph_disable_dmvr_flag的值等于1。

-否则如果sps_dmvr_enabled_flag等于1并且sps_dmvr_pic_present_flag等于1并且rpl_info_in_ph_flag等于0，则推断ph_disable_dmvr_flag的值等于X。(X被显式地用信号传输)

-否则如果sps_dmvr_enabled_flag等于1并且sps_dmvr_pic_present_flag等于1并且rpl_info_in_ph_flag等于1并且num_ref_entries[1][RplsIdx[1]]＞0，则推断ph_disable_dmvr_flag的值等于X。(X被显式地用信号传输)

-否则(sps_dmvr_enabled_flag等于1并且sps_dmvr_pic_present_flag等于1并且rpl_info_in_ph_flag等于1并且num_ref_entries[1][RplsIdx[1]]＝＝0)，推断ph_disable_dmvr_flag的值等于1。

由于在第三条件和第四条件下显式地用信号传输语法元素ph_disable_dmvr_flag，所以当ph_disable_dmvr_flag不存在时可以从ph_disable_dmvr_flag的导出中移除第三条件和第四条件：

当ph_disable_dmvr_flag不存在时，以下适用：

可以将条件在编辑上简化如下：

当ph_disable_dmvr_flag不存在时，以下适用：

-如果sps_dmvr_enabled_flag等于1并且sps_dmvr_pic_presenf_flag等于0，则推断ph_disable_dmvr_flag的值等于0。

-否则(sps_dmvr_enabled_flag等于0或sps_dmvr_pic_present_flag等于1)，推断ph_disable_dmvr_flag的值等于1。

在下面说明了当ph_disable_dmvr_flag的值未被呈现时导出它的另一替代方式：

当ph_disable_dmvr_flag不存在时，以下适用：

-如果sps_dmvr_pic_present_flag等于0，则推断ph_disable_dmvr_flag的值等于1-sps_dmvr_enabled_flag。

-否则如果sps_dmvr_pic_present_flag等于1并且rpl_info_in_ph_flag等于0，则推断ph_disable_dmvr_flag的值等于1-sps_dmvr_enabled_flag。

-否则如果sps_dmvr_pic_present_flag等于1并且rpl_info_in_ph_flag等于1并且num_ref_entries[1][RplsIdx[1]]＞0，则推断ph_disable_dmvr_flag的值等于1-sps_dmvr_enabled_flag。

-否则(sps_dmvr_pic_present_flag等于1并且rpl_info_in_ph_flag等于1并且num_ref_entries[1][RplsIdx[1]]＝＝0)，推断ph_disable_dmvr_flag的值等于1。

由于在第二条件和第三条件下显式地用信号传输语法元素ph_disable_dmvr_flag，所以当ph_disable_dmvr_flag不存在时，可以从ph_disable_dmvr_flag的导出中移除第二条件和第三条件：

当ph_disable_dmvr_flag不存在时，以下适用：

-否则，推断ph_disable_dmvr_flag的值等于1。

在下面说明了有条件地用信号传输语法元素ph_disable_bdof_flag的若干示例：

If(sps_bdof_pic_present_flag&&(！rpl_info_in_ph_flag||(rpi_info_in_ph_flag&&num_ref_entries[0][RplsIdx[0]]＞1&&num_ref_eniries[1][RplsIdx[l]]＞1)))ph_disable_bdof_flag

类似地，在下面说明了替代的条件检查的示例：

If(sps_bdof_pic_present_flag&&(！rpl_info_in_ph_flag||(rpl_info_in_ph_flag&&num_ref_entries[1][RplsIdx[1]]＞0)))ph_disable_bdof_flag

ph_disable_bdof_flag的语义也被修改以处理当未用信号传输它时的情况。

等于1的ph_disable_bdof_flag指定在与PH相关联的条带中禁用基于双向光流帧间预测的帧间双向预测。等于0的ph_disable_bdof_flag指定在与PH相关联的条带中可以启用或者可以不启用基于双向光流帧间预测的帧间双向预测。

当ph_disable_bdof_flag不存在时，以下适用：

-如果sps_bdof_enabled_flag等于1并且sps_bdof_pic_present_flag等于0，则推断ph_disable_bdof_flag的值等于0。

-否则如果sps_bdof_enabled_flag等于1并且sps_bdof_pic_present_flag等于1，则推断ph_disable_dmvr_flag的值等于1。

-否则(sps_bdof_enabled_flag等于0)，推断ph_disable_bdof_flag的值等于1。

在下面说明了当ph_disable_bdof_flag的值未被呈现时导出它的替代方式：

当显式地用信号传输或者隐式地导出ph_disable_bdof_flag的值时，如果考虑所有条件以进行ph_disable_bdof_flag的值的导出：

-否则如果sps_bdof_enabled_flag等于0并且sps_bdof_pic_present_flag等于0，则推断ph_disable_bdof_flag的值等于1。

-否则如果sps_bdof_enabled_flag等于1并且sps_bdof_pic_present_flag等于1并且rpl_info_in_ph_flag等于0，则推断ph_disable_bdof_flag的值等于X。(X被显式地用信号传输)

-否则如果sps_bdof_enabled_flag等于1并且sps_bdof_pic_present_flag等于1并且rpl_info_in_ph_flag等于1并且num_ref_entries[1][RplsIdx[1]]＞0，则推断ph_disable_bdof_flag的值等于X。(X被显式地用信号传输)

-否则(sps_bdof_enabled_flag等于1并且sps_bdof_pic_present_flag等于1并且rpl_info_in_ph_flag等于1并且num_ref_entries[1][RplsIdx[1]]＝＝0)，推断ph_disable_bdof_flag的值等于1。

由于在第三条件和第四条件下显式地用信号传输语法元素ph_disable_bdof_flag，所以当ph_disable_bdof_flag不存在时，可以从ph_disable_bdof_flag的导出中移除第三条件和第四条件：

当ph_disable_bdof_flag不存在时，以下适用：

可以将条件在编辑上简化如下：

当ph_disable_bdof_flag不存在时，以下适用：

-否则(sps_bdof_enabled_flag等于0或者sps_bdof_pic_present_flag等于1)，推断ph_disable_bdof_flag的值等于1。

在下面说明了当ph_disable_bdof_flag的值未被呈现时导出它的另一替代方式：

当ph_disable_bdof_flag不存在时，以下适用：

-如果sps_bdof_pic_present_flag等于0，则推断ph_disable_bdof_flag的值等于1-sps_bdof_enabled_flag。

-否则如果sps_bdof_pic_present_flag等于1并且rpl_info_in_ph_flag等于0，则推断ph_disable_bdof_flag的值等于1-sps_bdof_enabled_flag。

-否则如果sps_bdof_pic_present_flag等于1并且rpl_info_in_ph_flag等于1并且num_ref_entries[1][RplsIdx[1]]＞0，则推断ph_disable_bdof_flag的值等于1-sps_bdof_enabled_flag。

-否则(sps_bdof_pic_present_flag等于1并且rpl_info_in_ph_flag等于1并且num_ref_entries[1][RplsIdx[1]]＝＝0)，推断ph_disable_bdof_flag的值等于1。

由于在第二条件和第三条件下显式地用信号传输语法元素ph_disable_bdof_flag，所以当ph_disable_bdof_flag不存在时，可以从ph_disable_bdof_flag的导出中移除第二条件和第三条件：

当ph_disable_bdof_flag不存在时，以下适用：

-否则，推断ph_disable_bdof_flag的值等于1。

此外，针对语法元素ph_collocated_from_l0_flag和weight_table()的信令条件被修改，因为这两种类型的语法元素仅在相关条带是B条带时才适用。经修改的语法元素信令的示例在下表9-11中说明。

表9

ph_collocated_from_l0_flag的语义也被修改以处理当未用信号传输它时的情况。

等于1的ph_collocated_from_l0_flag指定用于时间运动矢量预测的同位图片是从参考图像列表0导出的。等于0的ph_collocated_from_l0_flag指定用于时间运动矢量预测的同位图片是从参考图像列表1导出的。

当ph_collocated_from_l0_flag不存在时，以下适用：

-如果num_ref_entries[0][RplsIdx[0]]大于1，则将ph_collocated_from_l0_flag的值推断为1。

-否则(num_ref_entries[1][RplsIdx[1]]大于1)，将ph_collocated_from_l0_flag的值推断为0。

表10

表11

类似地，在下面说明了替代的条件检查的示例：

if(pps_weighted_bipred_flag&&wp_info_in_ph_flag&&(！rpl_info_in_ph_flag||(rpl_info_in_ph_flag&&num_ref_entries[1][RplsIdx[1]]＞0)))num_l1_weighis

pred_weight_table()中的语法元素的语义也被修改以处理当未用信号传输它们时的情况。

num_l1_weights指定当pps_weighted_bipred_flag和wp_info_in_ph_flag都等于1时针对参考图像列表1中的条目用信号传输的权重的数量。num_l1_weights的值应在0至Min(15，num_ref_entries[1][RplsIdx[1]])的范围内，包括0和Min(15，num_ref_entries[1][RplsIdx[1]])。

变量NumWeightsL1以如下方式导出：

在pred_weight_tabe()中的语法元素的语义中，在下面说明了当num_l1_weights的值未被呈现时导出它的替代的方法：

num_l1_weights指定当pps_weighted_bipred_flag和wp_info_in_ph_flag都等于1时针对参考图像列表1中的条目用信号传输的权重的数量。num_l1weights的值应在0至Min(15，num_ref_entries[1][RplsIdx[1]])的范围内，包括0和Min(15，num_ref_entries[1][RplsIdx[1]])。当不存在num_l1_weights时，num_l1_weights的值被推断为0。

变量NumWeightsL1以如下方式导出：

在pred_weight_table()中的语法元素的语义中，在下面说明了当num_l1_weights的值未被呈现时导出它的另一替代的方式：

在概念上，提出了添加信令条件，以针对仅在B条带适用的任何语法元素，检查当前图像是否具有来自列表0参考图像列表和列表1参考图像列表的参考图像，以避免信令冗余比特。检查条件不限于以上提及的用于检查两个参考图像列表(例如，列表0参考图像列表/列表1参考图像列表)的尺寸的方法，并且检查条件可以是指示当前图像是否具有来自列表0参考图像列表和列表1参考图像列表二者的参考图像的任何其他方法。例如，可以用信号传输标志以指示当前图像是否具有列表0参考图像列表和列表1二者的参考图像。

当未用信号传输语法元素并且在PH中用信号传输参考图像列表信息时，使用以下信息来导出语法元素的值：当前图像是否具有列表0参考图像和列表1参考图像二者，或者当前图像是否仅具有列表0参考图像或列表1参考图像。在一个示例中，当未用信号传输ph_collocated_from_l0_flag时，其值被推断为当前图像具有的唯一参考图像。在另一示例中，当sps_bdof_enabled_flag等于1并且sps_bdof_pic_present_flag等于1但是未用信号传输ph_disable_bdof_flag时，这意味着根据关于ph_disable_bdof_flag提出的信令条件num_ref_entries[0][RplsIdx[0]]等于0或者num_ref_entries[1][RplsIdx[1]]等于0。因此，在此条件下，ph_disable_bdof_flag不用信号传输并且推断为1。在当前VVC中，不仅同位图片的分辨率可以影响TMVP的启用，而且应用于图像尺寸的用于缩放比率计算的偏移还可以影响TMVP的启用。然而，在当前VVC中，在ph_temporal_mvp_enabled_flag的比特流一致性中不考虑偏移。在第二实施例中，提出了向当前VVC添加这样的比特流一致性约束，即要求ph_temporal_mvp_enabled_flag的值应取决于应用于图像尺寸的用于缩放比率计算的偏移，如在下面所说明的。

当DPB中没有参考图像具有与当前图像相同的空间分辨率以及与当前图像相同的应用于图像尺寸的用于缩放比率计算的偏移时，ph_temporal_mvp_enabled_flag的值应等于0。

还可以以另一方式撰写以上句子如下：

当DPB中没有参考图像具有等于0的相关变量值RprConstraintsActive[i][j]时，ph_temporal_mvp_enabled_flag的值应等于0。

在当前VVC中，由slice_collocated_ref_idx指代的图像对经编码的图像的所有条带而言应相同是比特流一致性的要求。然而，当经编码的图像具有多个条带并且在所有这些条带间不存在公共参考图像时，没有机会满足此比特流一致性。在本公开的第三实施例中，对ph_temporal_mvp_enabled_flag的比特流一致性的要求被修改，以考虑在当前图像中的所有条带间是否存在公共参考图像。基于该实施例，在下面说明了对VVC规范的若干示例性修改。

ph_temporal_mvp_enabled_flag指定时间运动矢量预测值是否能够被用于与PH相关联的条带的帧间预测。如果ph_temporal_mvp_enabled_flag等于0，则与PH相关联的条带的语法元素应受到约束，使得在条带的解码中不使用时间运动矢量预测值。否则(ph_temporal_mvp_enabled_flag等于1)，可以在与PH相关联的条带的解码中使用时间运动矢量预测值。当不存在ph_temporal_mvp_enabled_flag时，ph_temporal_mvp_enabled_flag的值被推断为等于0。当DPB中没有参考图像具有与当前图像相同的空间分辨率时，ph_temporal_mvp_enabled_flag的值应等于0。当在与PH相关联的所有条带间不存在公共参考图像时，ph_temporal_mvp_enabled_flag的值应等于0。

ph_temporal_mvp_enabled_flag指定时间运动矢量预测值是否能够被用于与PH相关联的条带的帧间预测。如果ph_temporal_mvp_enabled_flag等于0，则与PH相关联的条带的语法元素应受到约束，使得在条带的解码中不使用时间运动矢量预测值。否则(ph_temporal_mvp_enabled_fiag等于1)，可以在与PH相关联的条带的解码中使用时间运动矢量预测值。当不存在ph_temporal_mvp_enabled_flag时，ph_temporal_mvp_enabled_flag的值被推断为等于0。当DPB中没有参考图像具有与当前图像相同的空间分辨率时，ph_temporal_mvp_enabled_flag的值应等于0。当在与PH相关联的所有帧间条带间不存在公共参考图像时，ph_temporal_mvp_enabled_flag的值应等于0。

ph_temporal_mvp_enabled_flag指定时间运动矢量预测值是否能够被用于与PH相关联的条带的帧间预测。如果ph_temporal_mvp_enabled_flag等于0，则与PH相关联的条带的语法元素应受到约束，使得在条带的解码中不使用时间运动矢量预测值。否则(ph_temporal_mvp_enabled_flag等于1)，可以在与PH相关联的条带的解码中使用时间运动矢量预测值。当不存在时，ph_temporal_mvp_enabled_flag的值被推断为等于0。当DPB中没有参考图像具有与当前图像相同的空间分辨率时，ph_temporal_mvp_enabled_flag的值应等于0。当在与PH相关联的所有非帧内条带间不存在公共参考图像时，ph_temporal_mvp_enabled_flag的值应等于0。

在一个示例中，关于slice_collocated_ref_idx的比特流一致性被简化如下：

由slice_collocated_ref_idx指代的参考图像的pic_width_in_luma_samples和pic_height_in_luma_samples的值应分别等于当前图像的pic_width_in_luma_samples和pic_height_in_luma_samples的值，并且RprConstraintsActive[slice_collocated_from_l0_flag？0：1][slice_collocated_ref_idx]应等于0，这是比特流一致性要求。

当pps_mixed_nalu_types_in_pic_flag的值等于一时，引用PPS的每个图像具有不止一个NAL单元并且那些NAL单元不具有相同的nal_unit_type。另一方面，在当前图像头部信令中，即使当关联PPS中的标志pps_mixed_nalu_types_in_pic_flag的值等于一时，也允许将ph_gdr_or_irap_pic_flag和ph_gdr_pic_flag的值作为一用信号传输。因为一个IRAP图像或一个GDR图像中的NAL单元必须具有相同的nal_unit_type，所以不应该允许此类信令场景。

在一个示例中，提出了在PPS中将pps_mixed_nalu_types_in_pic_flag的值作为标志ph_gdr_or_irap_pic_flag在图像头部中存在的条件。具体地，仅在pps_mixed_nalu_types_in_pic_flag的值等于零时才用信号传输ph_gdr_or_irap_pic_flag。否则，当标志pps_mixed_nalu_types_in_pic_flag等于一时，标志ph_gdr_or_irap_pic_flag不用信号传输并且推断为零。在应用所提出的修改之后描述了表12。

表12

在一个示例中，提出一个比特流一致性约束，以要求当标志pps_mixed_nalu_types_in_pic_flag等于一时用信号传输的标志ph_gdr_or_irap_pic_flag的对应值应等于一。具体地，所提出的比特流一致性约束可以指定如下。

等于1的ph_gdr_or_irap_pic_flag指定当前图像是GDR或IRAP图像。等于0的ph_gdr_or_irap_pic_flag指定当前图像不是GDR图像并且可以或可以不是IRAP图像。当pps_mixed_nalu_types_in_pic_flag的值等于一时，ph_gdr_or_irap_pic_flag的值应等于0。

在一个示例中，提出了将pps_mixed_nalu_types_in_pic_flag的信令从PPS级别移动至图像级别、条带级别或其他编解码级别。例如，假定标志被移动至图像头部，可以将标志重命名为ph_mixed_nalu_type_in_pic_flag。附加地，提出了使用该标志来作为ph_gdr_or_irap_pic_flag信令的条件。具体地，只有当标志ph_mixed_nalu_type_in_pic_flag等于零时才用信号传输ph_gdr_or_rap_pic_flag。否则，当标志ph_mixed_nalu_type_in_pic_flag是一时，标志ph_gdr_or_rap_pic_flags不用信号传输并且推断为0。在另一示例中，提出了添加比特流一致性约束，即当ph_mixed_nalu_type_in_pic_flag的值等于一时ph_gdr_or_irap_pic_flag的值应该等于零。在又一示例中，提出了使用ph_gdr_or_irap_pic_flag来作为ph_mixed_nalu_type_in_pic_flag存在的条件。具体地，只有当ph_gdr_or_rap_pic_flag的值等于零时才用信号传输标志ph_mixed_nalu_type_in_pic_flag。否则，当ph_gdr_or_rap_pic_flag的值等于一时，标志ph_mixed_nalu_type_in_pic_flag不用信号传输并且始终推断为零。

在一个示例中，提出了仅将pps_mixed_nalu_types_in_pic_flag的值应用于既不是IRAP图像也不是GDR图像的图像。具体地，通过此类方法，应该修改pps_mixed_nalu_types_in_pic_flag的语义如下：

等于1的pps_mixed_nalu_types_in_pic_flag指定引用PPS的既不是IRAP图像也不是GDR图像的每个图像具有不止一个VCL NAL单元，并且VCL NAL单元不具有相同的nal_unit_type值。等于0的pps_mixed_nalu_types_in_pic_flag指定引用PPS的既不是IRAP图像也不是GDR图像的每个图像具有一个或多个VCL NAL单元并且引用PPS的每个图像的VCLNAL单元具有相同的nal_unit_type值。

另一方面，在当前VVC规范中，要求一个GDR图像中的所有NAL单元都必须具有等于GDR_NUT的相同nal_unit_type。以下比特流一致性约束被应用于GDR图像的定义，使得pps_mixed_nal_types_in_pic_flag的对应值应该等于零。

渐进式解码刷新(GDR)图像：每个VCL NAL单元具有等于GDR_NUT的nal_unit_type的图像。GDR图像的pps_mixed_nalu_types_in_pic_flag的值等于0。当针对图像的pps_mixed_nalu_types_in_pic_flag等于0，并且该图像的任何条带具有为GDR_NUT的nal_unit_type时，该图像的所有其他条带具有相同的nal_unit_type值，并且在接收到该图像的第一条带之后该图像已知为GDR图像。

在另一实施例中，提出了从NAL单元报头中去除GDR NAL单元类型，同时仅使用语法元素ph_gdr_or_irap_pic_flag和ph_gdr_pic_flag来指示当前图像是否是GDR图像。

与将pps_mixed_nalu_types_in_pic_flag的约束应用于IRAP图像和GDR图像二者的以上方法不同，在下文中，提出了将约束应用于IRAP图像但不应用于GDR图像的三种方法。

在一个示例中，提出了在PPS中，将pps_mixed_nalu_types_in_pic_flag的值作为标志ph_gdr_pic_flag存在于图像头部中的条件。具体地，只有当pps_mixed_nalu_types_in_pic_flag的值等于零时才用信号传输标志ph_gdr_pic_flag。否则，当标志pps_mixed_nalu_types_in_pic_flag等于一时，标志ph_gdr_pic_flag不用信号传输并且推断为零，即，当前图像不能是一个GDR图像。在应用所提出的信令条件之后，所对应的图像头部表(表13)被修改如下。

表13

等于1的ph_gdr_pic_flag指定与PH相关联的图像是GDR图像。等于0的ph_gdr_pic_flag指定与PH相关联的图像不是GDR图像。当不存在ph_gdr_pic_flag时，ph_gdr_pic_flag的值在pps_mixed_nalu_types_in_pic_flag为0时被推断为等于0，而在pps_mixed_nalu_types_in_pic_flag为1时被推断为等于ph_gdr_or_irap_pic_flag的值。当sps_gdr_enabled_flag等于0时，ph_gdr_pic_flag的值应等于0。

在一个示例中，提出了引入一个比特流一致性约束，即当ph_gdr_or_irap_pic_flag是1并且pps_mixed_nalu_types_in_pic_flag是1时ph_gdr_pic_flag应该等于1，如指定为：

等于1的ph_gdr_pic_flag指定与PH相关联的图像是GDR图像。ph_gdr_pic_flag等于0表示与PH相关联的图像不是GDR图像。当不存在ph_gdr_pic_flag时，ph_gdr_pic_flag的值被推断为等于0。当sps_gdr_enabled_flag等于0时，ph_gdr_pic_flag的值应等于0。当ph_gdr_or_irap_pic_flag等于1并且pps_mixed_nalu_types_in_pic_flag等于1时，ph_gdr_pic_flag的值应该等于1。当ph_gdr_or_irap_pic_flag等于1并且ph_gdr_pic_flag等于0时，与PH相关联的图像是IRAP图像。

在一个示例中，提出了仅将标志pps_mixed_nalu_types_in_pic_flag应用于非IRAP图像。具体地，在此方法中，应该将pps_mixed_nalu_types_in_pic_flag的语义修改为：

等于1的pps_mixed_nalu_types_in_pic_flag指定引用PPS的每个非IRAP图像具有不止一个VCL NAL单元并且VCL NAL单元不具有相同的nal_unit_type值。等于0的pps_mixed_nalu_types_in_pic_flag指定引用PPS的每个非IRAP图像具有一个或多个VCL NAL单元并且引用PPS的每个图像的VCL NAL单元具有相同的nal_unit_type值。

以上方法可以使用包括一个或多个电路系统的装置来实现，该一个或多个电路系统包括专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理器件(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子组件。该装置可以将结合其他硬件或软件组件的电路系统用于执行上述方法。以上公开的每个模块、子模块、单元或子单元可以至少部分地使用一个或多个电路系统来实现。

图6是图示出根据本公开一些实现方式的用于视频编解码的示例性装置的框图。装置600可以是终端，诸如移动电话、平板计算机、数字广播终端、平板设备或个人数字助理。

如图6所示，装置600可以包括以下组件中的一个或多个：处理组件602、存储器604、电源组件606、多媒体组件608、音频组件610、输入/输出(I/O)接口612、传感器组件614和通信组件616。

处理组件602通常控制装置600的整体操作，诸如与显示、电话呼叫、数据通信、相机操作和录音操作相关的操作。处理组件602可以包括用于执行指令以完成以上方法的步骤的全部或部分的一个或多个处理器620。进一步地，处理组件602可以包括用于促进处理组件602与其他组件之间的交互的一个或多个模块。例如，处理组件602可以包括用于促进多媒体组件608与处理组件602之间的交互的多媒体模块。

存储器604被配置为存储不同类型的数据以支持装置600的操作。此类数据的示例包括用于在装置600上操作的任何应用或方法的指令、联系人数据、电话簿数据、消息、图像、视频等。存储器604可以由任何类型的易失性或非易失性存储设备或其组合实现，并且存储器604可以是静态随机存取存储器(SRAM)、电可擦除可编程只读存储器(EEPROM)、可擦除可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)、磁存储器、闪速存储器、磁盘或紧致盘。

电源组件606为装置600的不同组件供应电力。电源组件606可以包括电源管理系统、一个或多个电源、以及与为装置600生成、管理和分发电力相关联的其他组件。

多媒体组件608包括提供装置600与用户之间的输出接口的屏幕。在一些示例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，则可以将屏幕实现为从用户接收输入信号的触摸屏。触摸面板可以包括用于感测触摸面板上的触摸、滑动和手势的一个或多个触摸传感器。触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与触摸或滑动操作相关的持续时间和压力。在一些示例中，多媒体组件608可以包括前置相机和/或后置相机。当装置600处于诸如拍摄模式或视频模式之类的操作模式时，前置相机和/或后置相机可以接收外部多媒体数据。

音频组件610被配置为输出和/或输入音频信号。例如，音频组件610包括麦克风(MIC)。当装置600处于诸如呼叫模式、录音模式和语音识别模式之类的工作模式时，麦克风被配置为接收外部音频信号。所接收到的音频信号可以被进一步存储在存储器604中或者经由通信组件616发送。在一些示例中，音频组件610进一步包括用于输出音频信号的扬声器。

I/O接口612提供处理组件602与外围接口模块之间的接口。以上外围接口模块可以是键盘、点击轮、按钮等。这些按钮可以包括但不限于主页按钮、音量按钮、开始按钮和锁定按钮。

传感器组件614包括用于在不同方面为装置600提供状态评估的一个或多个传感器。例如，传感器组件614可以检测装置600的开/关状态和组件的相对位置。例如，组件是装置600的显示器和键区。传感器组件614还可以检测装置600或装置600的组件的位置变化、用户在装置600上的接触的存在或不存在、装置600的方向或加速/减速、以及装置600的温度变化。传感器组件614可以包括接近传感器，该接近传感器被配置为在没有任何物理接触的情况下检测附近物体的存在。传感器组件614可以进一步包括光学传感器，诸如在成像应用中使用的CMOS或CCD图像传感器。在一些示例中，传感器组件614可以进一步包括加速度传感器、陀螺仪传感器、磁传感器、压力传感器或温度传感器。

通信组件616被配置为促进装置600与其他设备之间的有线或无线通信。装置600可以接入基于诸如WiFi、4G或其组合之类的通信标准的无线网络。在示例中，通信组件616经由广播信道从外部广播管理系统接收广播信号或广播相关信息。在示例中，通信组件616可以进一步包括用于促进短距离通信的近场通信(NFC)模块。例如，可以基于射频标识(RFID)技术、红外数据协会(IrDA)技术、超宽带(UWB)技术、蓝牙(BT)技术和其他技术来实现NFC模块。

在示例中，装置600可以由专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理器件(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件中的一个或多个实现来执行以上方法。

非暂时性计算机可读存储介质可以是例如硬盘驱动器(HDD)、固态驱动器(SSD)、闪速存储器、混合驱动器或固态混合驱动器(SSHD)、只读存储器(ROM)、紧致盘只读存储器(CD-ROM)、磁带、软盘等。

在步骤702中，处理器620接收PPS中的第一语法元素，该第一语法元素指定引用PPS、对应于PPS或与PPS相关联的图像是否包括一个或多个NAL单元，以及该一个或多个NAL单元是否具有相同的NAL单位类型。

在步骤704中，处理器620接收PH中的第二语法元素，该第二语法元素指定指引用PH、对应于PH或与PH相关联的图像是IRAP图像还是GDR图像。

在步骤706中，处理器620基于第二语法元素的值来确定第一语法元素的值。

在一些示例中，处理器620被实现在解码器上。

在一些示例中，等于1的第一语法元素指定引用PPS、对应于PPS或与PPS相关联的每个图像包括不止一个VCL NAL单元，以及该不止一个VCL NAL单元不具有相同的NAL单元类型，而等于0的第一语法元素指定引用PPS、对应于PPS或与PPS相关联的每个图像包括一个或多个VCL NAL单元，以及该一个或多个VCL NAL单元具有相同的NAL单元类型。

在一些示例中，等于1的第二语法元素指定引用PH、对应于PH或与PH相关联的图像是IRAP图像或GDR图像，而等于0的第二语法元素指定引用PH、对应于PH或与PH相关联的图像既不是IRAP图像也不是GDR图像。

在一些示例中，处理器620基于第二语法元素的值约束第一语法元素的值，响应于确定图像是IRAP图像还是GDR图像对第一语法元素应用约束，以要求第一语法元素的值为零。

在步骤802中，处理器620接收第一语法元素，该第一语法元素指定图像是否包括一个或多个NAL单元，以及该一个或多个NAL单元是否具有相同的NAL单元类型。

在步骤804中，处理器620基于第一语法元素来确定与图像相关联的PH中的第二语法元素。

在一些示例中，处理器620被实现在解码器上。

在一些示例中，第二语法元素指定图像是GDR图像还是IRAP图像。

在一些示例中，在与图像相关联的PPS中用信号传输第一语法元素。

在一些示例中，第一语法元素可以是如以上所讨论的pps_mixed_nalu_types_in_pic_flag。

在一些示例中，处理器620通过以下各项基于第一语法元素来约束与图像相关联的PH中的第二语法元素：响应于确定第一语法元素等于0而确定第二语法元素在PH中用信号传输；响应于确定第一语法元素等于1而确定第二语法元素不在PH中用信号传输并且将第二语法元素推断为0，其中等于1的第一语法元素指定引用PPS、对应于PPS或与PPS相关联的每个图像包括不止一个NAL单元，以及该不止一个NAL单元不具有相同的NAL单元类型，并且其中等于0的第一语法元素指定引用PPS、对应于PPS或与PPS相关联的每个图像包括一个或多个NAL单元，以及该一个或多个NAL单元具有相同的NAL单元类型。进一步地，等于1的第二语法元素指定该图像是GDR图像或IRAP图像，而等于0的第二语法元素指定该图像既不是IRAP图像也不是GDR图像。

在一些示例中，处理器620基于第一语法元素约束与图像相关联的PH中的第二语法元素，该约束是通过接收第一语法元素和第二语法元素二者并且响应于确定第一语法元素等于1而应用一个约束以要求所接收到的第二语法元素为0。等于1的第一语法元素指定引用PPS、对应于PPS或与PPS相关联的每个图像包括不止一个NAL单元，以及该不止一个NAL单元不具有相同的NAL单元类型，而等于0的第二语法元素指定该图像既不是IRAP图像也不是GDR图像。第一语法元素可以是如以上所讨论的pps_mixed_nalu_types_in_pic_flag。

在一些示例中，在与图像相关联的PH中用信号传输第一语法元素。在一些示例中，第一语法元素可以是如以上所讨论的ph_mixed_nalu_types_in_pic_flag。

在一些示例中，处理器620通过以下各项来基于第一语法元素约束PH中的第二语法元素：响应于确定第一语法元素等于0而确定第二语法元素在PH中用信号传输；以及响应于确定第一语法元素等于1确定第二语法元素不在PH中用信号传输并且将第二语法元素推断为0。等于1的第一语法元素指定引用PH、对应于PH或与PH相关联的每个图像包括不止一个NAL单元，以及该不止一个NAL单元不具有相同的NAL单元类型，而等于0的第一语法元素指定引用PH、对应于PH或与PH相关联的每个图像包括一个或多个NAL单元，以及该一个或多个NAL单元具有相同的NAL单元类型。等于1的第二语法元素指定图像是GDR图像或IRAP图像，而等于0的第二语法元素指定图像既不是IRAP图像也不是GDR图像。在一些示例中，第二语法元素可以是如以上所讨论的ph_gdr_or_rap_pic_flag。

在一些示例中，处理器620基于第一语法元素约束PH中的第二语法元素，该约束是通过接收第一语法元素和第二语法元素二者并且响应于确定第一语法元素等于1而应用一个约束以要求所接收到的第二语法元素的值为0。等于1的第一语法元素指定引用PH、对应于PH或与PH相关联的每个图像包括不止一个NAL单元，以及该不止一个NAL单元不具有相同的NAL单元类型，而等于0的第二语法元素指定该图像既不是GDR图像也不是IRAP图像。

在一些示例中，第二语法元素指定图像是否是GDR图像，并且在与该图像相关联的PPS中用信号传输第一语法元素。进一步地，处理器620通过以下各项来基于第一语法元素约束在与图像相关联的PH中用信号传输的第二语法元素：响应于确定第一语法元素等于0而确定第二语法元素在PH中用信号传输；以及响应于确定第一语法元素等于1而确定第二语法元素不在PH中用信号传输并且将第二语法元素的值推断为0。等于1的第一语法元素指定引用PPS、对应于PPS或与PPS相关联的每个图像包括不止一个NAL单元，以及该不止一个NAL单元不具有相同的NAL单元类型，而等于0的第一语法元素指定引用PPS、对应于PPS或与PPS相关联的每个图像包括一个或多个NAL单元以及该一个或多个NAL单元具有相同的NAL单元类型。等于0的第二语法元素指定与PH相关联的图像既不是IRAP图像也不是GDR图像。

在一些示例中，处理器620响应于确定第二语法元素不在PH中用信号传输进一步确定第一语法元素的值，响应于确定第一语法元素的值是0而将第二语法元素的值推断为0，并且响应于确定第一语法元素的值是1而将第二语法元素的值推断为在PH中用信号传输的第三语法元素的值。第三语法元素指定图像是GDR图像还是IRAP图像。

在一些示例中，处理器620根据在PPS中用信号传输的启用标志的值而进一步确定PH中的第二语法元素的值。启用标志是为了指定图像是否被启用为GDR图像。此外，处理器620响应于确定启用标志的值等于0而将第二语法元素的值确定为0。在一些示例中，启用标志可以是如以上所讨论的sps_gdr_enabled_flag。

在一些示例中，第二语法元素指定图像是否是GDR图像，并且在与该图像相关联的PPS中用信号传输第一语法元素。进一步地，处理器620基于第一语法元素约束在与图像相关联的PH中用信号传输的第二语法元素，该约束是通过基于第一语法元素和在PH中用信号传输的第三语法元素来约束在与图像相关联的PH中用信号传输的第二语法元素。第三语法元素指定图像是GDR图像还是IRAP图像。在一些示例中，第三语法元素可以是如以上所讨论的ph_gdr_or_irap_pic_flag。

在一些示例中，处理器620响应于确定第三语法元素等于1并且第一语法元素等于0而进一步将第二语法元素确定为1。等于0的第一语法元素指定引用PPS、对应于PPS或与PPS相关联的每个图像包括一个或多个NAL单元，以及该一个或多个NAL单元具有相同的NAL单元类型。等于1的第二语法元素指定与PH相关联的图像是GDR图像，而等于1第三语法元素的指定图像是GDR图像或IRAP图像。

图9是图示出根据本公开一些实现方式的视频编解码的示例性过程的流程图。在步骤902中，处理器620接收语法元素。该语法元素可以是如以上所讨论的在与图像相关联的PPS中用信号传输的pps_mixed_nalu_types_in_pic_flag。在步骤904中，处理器620基于语法元素的值来执行解码过程。

在一些示例中，用于GDR图像的语法元素的值等于0，当针对图像的语法元素等于0并且该图像的任何条带具有等于GDR_NUT的nal_unit_type时，该图像的所有其他条带都具有相同的nal_unit_type值，并且在接收到该图像的第一条带之后该图像已知为GDR图像。

在一些示例中，处理器620可以在接收到图像中的第一条带之后，响应于确定语法元素的值等于0并且图像中的条带包括等于GDR_NUT的NAL单元类型，确定图像中的所有其他条带都包括相同的NAL单元类型并且该图像是GDR图像。

在一些示例中，处理器620被实现在解码器上。

图10是图示出根据本公开一些实现方式的视频编解码的示例性过程的流程图。在步骤1002中，处理器620接收PPS中的第一语法元素，该第一语法元素指定对应于PPS的图像是否包括一个或多个NAL单元以及该一个或多个NAL单元是否具有相同的NAL单元类型。

在步骤1004中，处理器620接收PH中的第二语法元素，该第二语法元素指定对应于PH的图像是IRAP图像还是GDR图像。

在步骤1006中，处理器620基于第一语法元素的值来确定第二语法元素的值。

在一些示例中，处理器620可以被实现在解码器上。

在一些示例中，等于1的第一语法元素指定对应于PPS的每个图像包括不止一个VCL NAL单元，以及该不止一个VCL NAL单元不具有相同的NAL单元类型，而等于0的第一语法元素指定对应于PPS的每个图像包括一个或多个VCL NAL单元以及该一个或多个VCL NAL单元具有相同的NAL单元类型。

在一些示例中，等于1的第二语法元素指定对应于PH的图像是IRAP图像或者GDR图像，而等于0的第二语法元素指定对应于PH的图像既不是IRAP图像也不是GDR图像。

在一些示例中，处理器620可以对图像中的其他条带的NAL类型应用第一约束以要求其他条带的NAL类型与所述条带的NAL类型相同，并且对图像中的其他条带的NAL类型应用第二约束以要求第二语法元素的值为一。

在一些示例中，提供了一种用于视频编解码的非暂时性计算机可读存储介质。该非暂时性计算机可读存储介质存储计算机可执行指令，这些计算机可执行指令在由一个或多个计算机处理器620执行时，使一个或多个计算机处理器620执行图7所图示出的方法。

在一些示例中，提供了一种用于视频编解码的非暂时性计算机可读存储介质。该非暂时性计算机可读存储介质存储计算机可执行指令，这些计算机可执行指令在由一个或多个计算机处理器620执行时，使一个或多个计算机处理器620执行图8所图示出的方法。

在一些示例中，提供了一种用于视频编解码的非暂时性计算机可读存储介质。该非暂时性计算机可读存储介质存储计算机可执行指令，这些计算机可执行指令在由一个或多个计算机处理器620执行时，使一个或多个计算机处理器620执行图9所图示出的方法。

在一些示例中，提供了一种用于视频编解码的非暂时性计算机可读存储介质。该非暂时性计算机可读存储介质存储计算机可执行指令，这些计算机可执行指令在由一个或多个计算机处理器620执行时，使一个或多个计算机处理器620执行图10所图示出的方法。

本公开的描述已出于说明的目的被呈现，而不旨在为穷尽的或者限于本公开。许多修改、变化和替代实现方式对受益于前述描述和关联附图中呈现的教导的本领域普通技术人员而言将是显而易见的。

示例被选取和描述以便说明本公开的原理，并且使得本领域其他技术人员能够针对各种实现方式理解本公开，并且用如适于设想的特定用途的各种修改，最佳地利用底层原理和各种实现方式。因此，应当理解，本公开的范围不限于所公开的实现方式的具体示例，并且修改和其他实现方式旨在被包括在本公开的范围内。

Claims

1.一种用于视频编解码的方法，包括：

生成图像参数集(PPS)中的第一语法元素，所述第一语法元素指定对应于所述PPS的图像是否包括不止一个网络抽象层(NAL)单元以及所述不止一个NAL单元是否具有相同的NAL单元类型；

生成图像头部(PH)中的第二语法元素，所述第二语法元素指定对应于所述PH的所述图像是帧内随机访问点(IRAP)图像还是渐进式解码刷新(GDR)图像，

其中，基于所述第二语法元素的值是1来设置所述第一语法元素的值；

将所述第一语法元素和所述第二语法元素通过视频比特流发送至解码侧。

2.根据权利要求1所述的方法，其中，等于1的所述第一语法元素的值指定对应于所述PPS的每个图像包括不止一个视频编解码层(VCL)NAL单元以及所述不止一个VCL NAL单元不具有相同的NAL单元类型，而等于0的所述第一语法元素的值指定对应于所述PPS的每个图像包括不止一个VCL NAL单元以及所述不止一个VCL NAL单元具有相同的NAL单元类型；以及

其中，等于1的所述第二语法元素的值指定对应于所述PH的所述图像是IRAP图像或GDR图像，而等于0的所述第二语法元素的值指定对应于所述PH的所述图像不是GDR图像。

3.根据权利要求1所述的方法，其中，生成所述第一语法元素的值包括：

响应于基于所述第二语法元素的值确定所述图像是IRAP图像或GDR图像，设置所述第一语法元素的值为零。

4.根据权利要求1所述的方法，进一步包括：

响应于确定所述图像既不是IRAP图像也不是GDR图像，设置所述第一语法元素的值为1。

5.一种用于视频编解码的方法，包括：

其中，基于所述第一语法元素的值来设置所述第二语法元素的值；

6.根据权利要求5所述的方法，其中，等于1的所述第一语法元素的值指定对应于所述PPS的每个图像包括不止一个视频编解码层(VCL)NAL单元以及所述不止一个VCL NAL单元不具有相同的NAL单元类型，而等于0的所述第一语法元素的值指定对应于所述PPS的每个图像包括不止一个VCL NAL单元以及所述不止一个VCL NAL单元具有相同的NAL单元类型；以及

7.根据权利要求5所述的方法，其中，基于所述第一语法元素来设置所述第二语法元素的值包括：

响应于基于所述PPS中的所述第一语法元素的值确定对应于所述PPS的每个图像包括不止一个VCL NAL单元并且所述不止一个VCL NAL单元具有相同的NAL单元类型，以及所述NAL单元类型是GDR NAL单元类型或特定的IRAP NAL单元类型，设置所述第二语法元素的值为1。

8.根据权利要求5所述的方法，其中，基于所述第一语法元素来设置所述第二语法元素的值包括：

响应于基于所述PPS中的所述第一语法元素的值确定对应于所述PPS的每个图像包括不止一个VCL NAL单元并且所述不止一个VCL NAL单元不具有相同的NAL单元类型，以及所述NAL单元类型既不是GDR NAL单元类型也不是IRAP NAL单元类型，设置所述第二语法元素的值为0。

9.根据权利要求7所述的方法，其中所述特定的IRAP NAL单元类型是IDR W RADL或CRANUT。

10.一种用于视频编解码的方法，包括：

生成所述视频的预测编码模式以及用于由解码侧进行解码的语法元素，

其中，所述语法元素指定图像的各网络抽象层(NAL)单元是否具有相同的NAL单元类型，并且当所述图像是渐进式解码刷新(GDR)图像或帧内随机接入点(IRAP)图像时设置所述语法元素的值为0；以及

将所述语法元素通过视频比特流发送至所述解码侧。

11.根据权利要求10所述的方法，其中，所述语法元素是在与所述图像相关联的图像参数集(PPS)中用信号传输的语法元素pps_mixed_nalu_types_in_pic_fiag。

12.根据权利要求10所述的方法，其中：

当图像的所述语法元素的值等于0，并且所述图像的任何条带具有等于GDR_NUT的nal_unit_type时，所述图像的所有其他条带具有相同的nal_unit_type值，并且在将所述图像的第一条带发送到所述解码侧之后，所述图像被称为GDR图像。

13.根据权利要求10所述的方法，其中：

当图像的所述语法元素的值等于0，并且所述图像的任何条带具有等于特定IRAP NAL单元类型的nal_unit_type时，所述图像的所有其他条带具有相同的nal_unit_type值，并且在将所述图像的第一条带发送到所述解码侧之后，所述图像被称为IRAP图像。

14.根据权利要求13所述的方法，其中所述特定的IRAP NAL单元类型是IDR_W_RADL或CRA_NUT。

15.一种用于视频编解码的装置，包括：

一个或多个处理器；以及

存储器，所述存储器被配置为存储由所述一个或多个处理器可执行的指令；其中，所述一个或多个处理器在执行所述指令时，被配置为执行根据权利要求1至14中的任一项所述的方法。

16.一种用于视频编解码的非暂时性计算机可读存储介质，所述非暂时性计算机可读存储介质存储计算机可执行指令，所述计算机可执行指令在由一个或多个计算机处理器执行时，使所述一个或多个计算机处理器执行根据权利要求1至14中的任一项所述的方法以生成视频比特流。

17.一种计算机程序产品，包括指令，所述指令当由处理器执行时，使得所述处理器执行权利要求1-14中任一项的方法。

18.一种非暂时性计算机可读存储介质，存储用于由具有一个或多个处理器的视频编码设备执行的多个程序，其中，当被所述一个或多个处理器执行时，所述多个程序使得所述视频编码设备执行根据权利要求1-14中任一项所述的方法，生成对应的视频比特流并将所述生成的视频比特流存储在所述非暂时性计算机可读存储介质中。