CN115668949A

CN115668949A - 编解码视频中的帧间层参考图片的标识

Info

Publication number: CN115668949A
Application number: CN202180038208.0A
Authority: CN
Inventors: 王业奎; 张莉
Original assignee: ByteDance Inc
Current assignee: ByteDance Inc
Priority date: 2020-05-26
Filing date: 2021-05-25
Publication date: 2023-01-31
Also published as: US20230111484A1; US20240080492A1; US12075096B2; WO2021242716A1

Abstract

描述了视频编码方法和装置以及视频解码方法和装置的示例。视频处理的一个示例方法包括根据规则来执行视频和视频的比特流之间的转换。比特流的一个或多个参数集中的至少一个包括包含定时和假想参考解码器HRD参数的通用语法结构。该规则指定，响应于(1)第二语法标志指定网络抽象层NAL HRD参数不存在于通用语法结构中并且(2)第三语法标志指定视频编解码层VCL HRD参数不存在于通用语法结构中，第一语法标志不包括在通用语法结构中，其中第一语法标志指定相同的图片级别定时信息适用于比特流中的所有输出层集。

Description

编解码视频中的帧间层参考图片的标识

相关申请的交叉引用

根据适用的专利法和/或依据巴黎公约的规则，本申请适时要求于2020年5月26日提交的美国临时专利申请No.63/030,106的优先权和权益。出于根据法律的所有目的，前述申请的全部公开通过引用而并入作为本申请的公开的一部分。

技术领域

本专利文档涉及图像和视频编解码与解码。

背景技术

在互联网和其他数字通信网络中，数字视频占用了最大的带宽。随着能够接收和显示视频的连接用户设备数量的增加，预计数字视频使用的带宽需求将继续增长。

发明内容

本文档公开了可以由视频编码器和解码器用于执行视频编码或解码的技术。

在一个示例方面，公开了一种处理视频数据的方法。该方法包括根据规则来执行视频和视频的比特流之间的转换。比特流包括参考一个或多个参数集的一个或多个视频图片。一个或多个参数集中的至少一个包括包含定时和假想参考解码器HRD参数的通用语法结构。该规则指定，响应于(1)第二语法标志指定网络抽象层NAL HRD参数不存在于通用语法结构中并且(2)第三语法标志指定视频编解码层VCL HRD参数不存在于通用语法结构中，第一语法标志不包括在通用语法结构中。第一语法标志指定相同的图片级别定时信息适用于比特流中的所有输出层集。

在另一个示例方面，公开了一种处理视频数据的方法。该方法包括根据规则来执行视频和视频的比特流之间的转换。该规则指定比特流中包含帧间层参考图片ILRP的层的索引基于直接参考层的列表的逆序来确定。

在另一个示例方面，公开了一种处理视频数据的方法。该方法包括根据规则来执行视频的当前图片和视频的比特流之间的转换。该规则指定，响应于帧间层参考图片的层索引在转换中可推导，指定关于帧间层参考图片的直接参考层的列表的索引的第一语法元素不存在于比特流中。

在另一个示例方面，公开了一种处理视频数据的方法。该方法包括根据规则来执行视频的当前图片和视频的比特流之间的转换。该规则指定，指定关于帧间层参考图片的直接参考层的列表的索引的第一语法元素的值范围独立于包含当前图片的层的直接参考层的数量。

在另一个示例方面，公开了一种处理视频数据的方法。该方法包括根据规则来执行视频的当前图片和视频的比特流之间的转换。该规则指定包含帧间层参考图片ILRP的层的索引基于当前图片的层索引和帧间层参考图片的层索引之间的差来确定。

在另一个示例方面，公开了一种视频处理方法。该方法包括执行包括包含一个或多个视频图片的一个或多个视频层的视频和视频的编解码表示之间的转换，其中编解码表示符合格式规则，格式规则指定指示帧间层参考图片是否用于转换的第一语法元素的第一值控制指示参考图片列表是否被包括在编解码表示中的第二语法元素的第二值或存在。

在另一个示例方面，公开了另一种视频处理方法。该方法包括执行包括包含一个或多个视频图片的一个或多个视频层的视频和视频的编解码表示之间的转换，其中编解码表示符合格式规则，格式规则指定，在第一语法元素指示参考图片列表的语法元素不包括在编解码表示中并且混合网络抽象层单元被允许在编解码表示中并且参考图片列表语法元素不包括在图片标头中的情况下，即时解码器参考图片类型网络抽象层单元的使用在编解码表示中被禁用。

在另一个示例方面，公开了另一种视频处理方法。该方法包括执行包括包含一个或多个视频图片的一个或多个视频层的视频和视频的编解码表示之间的转换，其中编解码表示符合格式规则，格式规则指定以下约束：(a)指示视频参数集中的给定层id的独立层激活标志的第一语法元素的值控制指示对帧间层参考图片的激活的第二语法元素的值，或者(b)指示序列参数集中的参考图片列表的数量的第一语法元素的值控制指示用于当前视频单元的转换的参考图片列表的第二语法元素的值。

在另一个示例方面，公开了另一种视频处理方法。该方法包括执行包括包含一个或多个视频图片的一个或多个视频层的视频和视频的编解码表示之间的转换，其中该转换根据规则，该规则指定在当前图片是编解码层视频序列的起始图片的情况下当前图片的参考列表中的帧间层图片被认为是长期参考图片。

在另一个示例方面，公开了另一种视频处理方法。该方法包括执行包括包含一个或多个视频图片的一个或多个视频层的视频和视频的编解码表示之间的转换，其中编解码表示符合格式规则，该格式规则指定在信令通知根据第一字段有条件地信令通知的帧间层图片的存在的第二字段之前信令通知指示参考图片列表信息的存在的第一字段。

在另一个示例方面，公开了另一种视频处理方法。该方法包括执行包括包含一个或多个视频图片的一个或多个视频层的视频和视频的编解码表示之间的转换，其中编解码表示符合格式规则，该格式规则指定，为了信令通知帧间层参考图片ILRP，ILRP图片所属的层的索引被信令通知给参考层列表的逆序列表。

在另一个示例方面，公开了另一种视频处理方法。该方法包括执行包括包含一个或多个视频图片的一个或多个视频层的视频和视频的编解码表示之间的转换，其中编解码表示符合指定使用参考层的逆序列表的索引来信令通知视频的编解码特性的格式规则。

在又一个示例方面，公开了一种视频编码器装置。视频编码器包括被配置为实施上述方法的处理器。

在又一个示例方面，公开了一种视频解码器装置。视频解码器包括被配置为实施上述方法的处理器。

在又一个示例方面，公开了一种存储有代码的计算机可读介质。该代码以处理器可执行代码的形式体现本文描述的方法之一。

这些以及其他特征将在本文档中描述。

附图说明

图1是示出根据本公开的一些实施例的视频编解码系统的框图；

图2是用于视频处理的一个示例硬件平台的框图；

图3是视频处理的一个示例方法的流程图；

图4是示出一个示例视频编解码系统的框图；

图5是示出根据本公开的一些实施例的一个编码器的框图；

图6是示出根据本公开的一些实施例的一个解码器的框图；

图7是根据本公开的一个或多个实施例的一种用于视频处理的方法的流程图表示；

图8是根据本公开的一个或多个实施例的另一种用于视频处理的方法的流程图表示；

图9是根据本公开的一个或多个实施例的另一种用于视频处理的方法的流程图表示；

图10是根据本公开的一个或多个实施例的另一种用于视频处理的方法的流程图表示；以及

图11是根据本公开的一个或多个实施例的又一种用于视频处理的方法的流程图表示。

具体实施方式

在本文档中使用章节标题以易于理解，并且不将每个章节中公开的技术和实施例的应用性仅限制于该章节。此外，在一些描述中使用H.266技术术语仅仅是为了易于理解，而不是为了限制所公开的技术的范围。因此，本文描述的技术也适用于其他视频编解码器协议和设计。

1.概述

本专利文档涉及视频编解码技术。具体地，它是关于参考图片列表的设计和定时信息的信令的一些改进。该思想可以单独或以各种组合应用于支持多层视频编解码的任何视频编解码标准或非标准视频编解码器，例如正在开发的多功能视频编解码(VVC)。

2.缩写

APS 自适应参数集

AU 接入单元

AUD 接入单元分隔符

AVC 高级视频编解码

CLVS 编解码层视频序列

CLVSS CLVS起始

CPB 编解码图片缓冲区

CRA 完全随机接入

CTU 编解码树单元

CVS 编解码视频序列

DCI 解码能力信息

DPB 解码图片缓冲区

EOB 比特流结尾

EOS 序列结尾

GDR 逐步解码刷新

HEVC 高效视频编解码

HRD 假想参考解码器

IDR 即时解码刷新

ILP 帧间层预测

ILRP 帧间层参考图片

JEM 联合探索模型

LTRP 长期参考图片

MCTS 运动约束片集

NAL 网络抽象层

OLS 输出层集

PH 图片标头

PPS 图片参数集

PTL 档次、层和级别

PU 图片单元

RAP 随机接入点

RBSP 原始字节序列有效载荷

SH 条带标头

SEI 辅助增强信息

SPS 序列参数集

STRP 短期参考图片

SVC 可缩放视频编解码

VCL 视频编解码层

VPS 视频参数集

VTM VVC测试模型

VUI 视频可用性信息

VVC 多功能视频编解码

3.初步讨论

视频编解码标准主要是通过开发公知的ITU-T和ISO/IEC标准而演变的。ITU-T开发了H.261和H.263，ISO/IEC开发了MPEG-1和MPEG-4Visual，并且两个组织联合开发了H.262/MPEG-2视频、H.264/MPEG-4高级视频编解码(Advanced Video Coding，AVC)和H.265/HEVC标准。自H.262以来，视频编解码标准基于混合视频编解码结构，其中采用了时域预测加变换编解码。为探索HEVC之外的未来视频编解码技术，VCEG和MPEG于2015年联合成立了联合视频探索团队(Joint Video Exploration Team，JVET)。从那时起，JVET已经采用了许多新的方法，并将其放入了名为联合探索模型(Joint Exploration Model，JEM)的参考软件中。JVET会议每季度同时举行一次，新编解码标准的目标是与HEVC相比降低50％的比特率。新视频编解码标准在2018年4月的JVET会议上被正式命名为多功能视频编解码(VVC)，第一版VVC测试模型(VTM)也在当时发布。由于对VVC标准化的持续努力，新的编解码技术在每次JVET会议上都被采用到VVC标准中。VVC的工作草案和测试模型VTM在每次会议后都会更新。VVC项目现在的目标是在2020年7月的会议上技术上完成(FDIS)。

3.1.参考图片管理和参考图片列表(RPL)

参考图片管理是使用帧间预测的任何视频编解码方案所必需的核心功能。它管理参考图片在解码图片缓冲区(DPB)中的存储和从DPB的移除，并且将参考图片按照它们正确的顺序放在RPL中。

HEVC的参考图片管理，包括参考图片标记和从解码图片缓冲区(DPB)中的移除以及参考图片列表构建(RPLC)，与AVC的不同。代替AVC中的基于滑动窗口加自适应存储器管理控制操作(MMCO)的参考图片标记机制，HEVC指定了基于所谓的参考图片集(RPS)的参考图片管理和标记机制，RPLC因此基于RPS机制。RPS由与图片相关联的参考图片集合组成，该参考图片集合由按照解码顺序在相关联图片之前的所有参考图片组成，其可以用于相关联图片或按照解码顺序在相关联图片之后的任何图片的帧间预测。参考图片集由五个参考图片列表组成。前三个列表包含可以用于当前图片的帧间预测并且可以用于按照解码顺序在当前图片之后的一个或多个图片的帧间预测的所有参考图片。其他两个列表由不用于当前图片的帧间预测但是可以用于按照解码顺序在当前图片之后的一个或多个图片的帧间预测的所有参考图片组成。RPS提供了DPB状态的“帧内编解码”信令，而不是如AVC中的“帧间编解码”信令，主要是为了提高容错性。HEVC中的RPLC过程基于RPS，通过针对每个参考索引信令通知RPS子集的索引；这个过程比AVC中的RPLC过程简单。

VVC中的参考图片管理比AVC更类似于HEVC，但是稍微更简单并且更稳健。如在那些标准中，推导了两个RPL，列表0和列表1，但是它们不基于在HEVC中使用的参考图片集概念或者在AVC中使用的自动滑动窗口过程；相反，它们更直接地被信令通知。针对RPL列出参考图片作为活动和非活动条目，并且仅活动条目可以在当前图片的CTU的帧间预测中用作参考索引。非活动条目指示要被保存在DPB中以由比特流中稍后到达的其他图片参考的其他图片。

3.2.HEVC和VVC中的随机接入及其支持

随机接入是指从按照解码顺序不是比特流的第一个图片的图片开始接入和解码比特流。为了支持广播/多播和多方视频会议中的调谐和通道切换、本地回放和流媒体中的搜索、以及流媒体中的流自适应，比特流需要包括间隔近的随机接入点，其通常是帧内编解码图片，但也可以是帧间编解码图片(例如，在逐步解码刷新的情况下)。

HEVC通过NAL单元类型在NAL单元标头中包括帧内随机接入点(IRAP)图片的信令。支持三种类型的IRAP图片，即即时解码器刷新(IDR)、完全随机接入(CRA)和断开链接接入(BLA)图片。IDR图片将帧间图片预测结构约束为不参考当前图片组(GOP)之前的任何图片，该当前图片组(GOP)传统上被称为封闭GOP随机接入点。通过允许特定图片参考当前GOP之前的图片，CRA图片限制更少，其中在随机接入的情况下，所有图片都被丢弃。CRA图片传统上被称为开放GOP随机接入点。BLA图片通常源于CRA图片处两个比特流或其一部分的拼接，例如在流切换期间。为了更好地使得系统能够使用IRAP图片，总共定义了六个不同的NAL单元以信令通知IRAP图片的属性，这可以用于更好地匹配在ISO基本媒体文件格式(ISOBMFF)中定义的流接入点类型，该流接入点类型用于基于HTTP的动态自适应流(DASH)中的随机接入支持。

VVC支持三种类型的IRAP图片、两种类型的IDR图片(一种类型具有或者另一种类型不具有相关联的RADL图片)以及一种类型的CRA图片。这些与HEVC中基本相同。HEVC中的BLA图片类型不包括在VVC中，主要由于两个原因：i)BLA图片的基本功能可以通过CRA图片加上序列NAL单元结尾来实现，其存在指示后续图片在单层比特流中开始新的CVS。ii)在开发VVC期间，期望指定比HEVC更少的NAL单元类型，如通过针对NAL单元标头中的NAL单元类型字段使用5比特而不是6比特所指示的。

VVC和HEVC之间在随机接入支持中的另一个关键差异是VVC中以更规范的方式支持GDR。在GDR中，对比特流的解码可以从帧间编解码图片开始，尽管在开始时不是整个图片区域都可以被正确解码，但是在多个图片之后，整个图片区域将是正确的。使用恢复点SEI消息来信令通知GDR随机接入点和恢复点，AVC和HEVC也支持GDR。在VVC中，新的NAL单元类型被指定用于GDR图片的指示，并且恢复点在图片标头语法结构中被信令通知。允许CVS和比特流以GDR图片开始。这意味着允许整个比特流仅包含帧间编解码图片，而没有单个帧内编解码图片。以这种方式指定GDR支持的主要益处是提供GDR的一致性行为。GDR使得编码器能够通过在多个图片中分布帧内编解码的条带或块来平滑比特流的比特率，与对整个图片进行帧内编解码相反，从而允许显著的端到端延迟降低，随着如无线显示、在线游戏、基于无人机的应用的超低延迟应用变得更流行，这在当今被认为比以前更重要。

VVC中的另一个GDR相关特性是虚拟边界信令。GDR图片与其恢复点之间的图片处的刷新区域(即，正确解码的区域)和未刷新区域之间的边界可以被信令通知作为虚拟边界，并且当被信令通知时，将不会应用跨边界的环路滤波，因此将不会出现边界处或边界附近的一些样点的解码失配。当应用确定在GDR过程期间显示正确解码的区域时，这可以是有用的。

IRAP图片和GDR图片可以被统称为随机接入点(RAP)图片。

3.3.参数集

AVC、HEVC和VVC指定了参数集。参数集的类型包括SPS、PPS、APS和VPS。AVC、HEVC和VVC全部都支持SPS和PPS。VPS从HEVC开始引入，并且被包括在HEVC和VVC中。APS没有被包括在AVC或HEVC中，但是被包括在最新的VVC草案文本中。

SPS被设计为携带序列级别标头信息，并且PPS被设计为携带不频繁改变的图片级别标头信息。利用SPS和PPS，不频繁改变的信息不需要针对每个序列或图片重复，因此可以避免该信息的冗余信令。此外，SPS和PPS的使用实现了重要标头信息的带外传输，因此不仅避免了对冗余传输的需要，还提高了容错性。

引入VPS用于携带对多层比特流中的所有层共同的序列级别标头信息。

引入APS用于携带这样的图片级别或条带级别信息，该信息需要相当多的比特来编解码，可以由多个图片共享，并且在序列中可以有相当多的不同变化。

3.4.常规的以及VVC中的可缩放视频编解码(SVC)

可缩放视频编解码(SVC，有时也称为视频编解码中的可缩放性)是指使用基本层(BL)(有时被称为参考层(RL))和一个或多个可缩放增强层(EL)的视频编解码。在SVC中，基本层可以携带具有基本质量水平的视频数据。一个或多个增强层可以携带附加的视频数据，以支持例如更高的空域、时域和/或信噪比(SNR)水平。可以相对于先前编码的层来定义增强层。例如，底部层可以充当BL，而顶部层可以充当EL。中间层可以充当EL或RL，或者充当两者。例如，中间层(例如，既不是最低层也不是最高层的层)可以是中间层下方的层(诸如基本层或任何居间增强层)的EL，并且同时充当中间层上方的一个或多个增强层的RL。类似地，在HEVC标准的多视图或3D扩展中，可以有多个视图，并且一个视图的信息可以用于编解码(例如，编码或解码)另一个视图的信息(例如，运动估计、运动矢量预测和/或其他冗余)。

在SVC中，由编码器或解码器使用的参数基于可以利用它们的编解码级别(例如，视频级别、序列级别、图片级别、条带级别等)被分组为参数集。例如，比特流中不同层的一个或多个编解码视频序列可以利用的参数可以被包括在视频参数集(VPS)中，并且编解码视频序列中的一个或多个图片可以利用的参数可以被包括在序列参数集(SPS)中。类似地，图片中的一个或多个条带利用的参数可以被包括在图片参数集(PPS)中，并且特定于单个条带的其他参数可以被包括在条带标头中。类似地，可以在各种编解码级别提供特定层在给定时间使用哪个(哪些)参数集的指示。

由于VVC中对参考图片重采样(RPR)的支持，可以设计对包含多个层(例如，VVC中具有SD和HD分辨率的两个层)的比特流的支持，而不需要任何附加的信号处理级别编解码工具，因为空域可缩放性支持所需的上采样可以仅使用RPR上采样滤波器。然而，对于可缩放性支持，需要高级别语法改变(与不支持可缩放性相比)。在VVC版本1中指定了可缩放性支持。与任何更早的视频编解码标准(包括AVC和HEVC的扩展)中的可缩放性支持不同，VVC可缩放性的设计已经尽可能对单层解码器设计友好。多层比特流的解码能力以好像比特流中只有单个层的方式被指定。例如，诸如DPB尺寸的解码能力以独立于要被解码的比特流中的层的数量的方式被指定。基本上，为单层比特流设计的解码器不需要太多改变以能够解码多层比特流。与AVC和HEVC的多层扩展的设计相比，HLS方面在牺牲一些灵活性的情况下得到显著简化。例如，要求IRAP AU包含存在于CVS中的每个层的图片。

4.由所公开的技术解决方案解决的技术问题

最新的VVC文本中(JVET-R2001-vA/v10中)的参考图片列表的现有设计有以下问题：

1)标志sps_idr_rpl_present_flag是为单层比特流设计的，用于在不需要改变SH的情况下合并IDR和非IDR图片。在多层上下文中，当sps_inter_layer_ref_pics_present_flag等于1时，使sps_idr_rpl_present_flag等于0是没有意义的，因为这将禁用增强层(EL)图片中的IDR条带(即，nal_unit_type等于IDR_N_LP或IDR_W_RADL的条带)以包含RPL，并因此禁用要使用帧间层预测(ILP)编解码的EL图片中的IDR条带，而IRAP图片的ILP通常对可缩放性提供的编解码增益贡献最大。

2)对于pps_mixed_nalus_in_pic_flag等于1、pps_rpl_info_in_ph_flag等于0并且有nal_unit_type等于IDR_W_RADL或IDR_N_LP的至少一个VCL NAL单元的图片，sps_idr_rpl_present_flag的值必须等于1，使得图片中的IDR条带将具有在SH中信令通知的RPL，否则为图片中的IDR条带推导的RPL将为空，而为图片中的非IDR条带推导的RPL不为空。

3)当vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于0时，如果sps_inter_layer_ref_pics_present_flag等于0，则nuh_layer_id等于SPS的nuh_layer_id的非独立层将必须参考具有更低nuh_layer_id的SPS。尽管这是可能的，然而，在这种情况下，根本没有理由让这样的SPS具有nuh_layer_id的值。因此，当vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于0时，要求sps_inter_layer_ref_pics_present_flag等于1是有意义的。

4)当sps_num_ref_pic_lists[0]等于1并且rpl_sps_flag[0]等于1时的rpl_idx[0]的推断在需要时丢失。

5)最新的VVC文本的条款8.3.2(用于参考图片列表构建的解码过程)包括sps_idr_rpl_present_flag等于0并且nal_unit_type等于IDR_W_RADL或IDR_N_LP的条带的RplsIdx[i]、num_ref_entries[i][RplsIdx[i]]和NumRefIdxActive[i]的默认值的规范，因为当对于这样的条带，RPL为空时，将使用这些值。然而，当pps_rpl_info_in_ph_flag等于1时，PH包括RPL，因此当pps_rpl_info_in_ph_flag等于1时，不需要为以上变量和语法元素指定默认值。事实上，当pps_rpl_info_in_ph_flag等于1时，RPL可能不为空，因此默认值的这样的规范可能是不正确的。

6)最新的VVC文本的条款8.3.2(用于参考图片列表构建的解码过程)包括以下约束：

-由当前图片的条带的RefPicList[0]或RefPicList[1]中的每个ILRP条目参考的图片应当存在于DPB中，应当具有小于当前图片的nuh_layer_id的nuh_layer_idrefPicLayerId，并且应当是IRAP图片或者具有小于或等于Max(0,vps_max_tid_il_ref_pics_plus1[currLayerIdx][refLayerIdx]-1)的TemporalId，其中currLayerIdx和refLayerIdx分别等于GeneralLayerIdx[nuh_layer_id]和GeneralLayerIdx[refpicLayerId]。

然而，ph_recovery_poc_cnt等于0的GDR图片也应该在约束中被考虑，类似于IRAP图片。

7)在用于参考图片标记的解码过程中，如最新的VVC文本的条款8.3.3所指定的，由CLVSS图片参考的帧间层参考图片(如果有的话)不被标记为“用于长期参考”。这将导致解码过程中的问题，因为这将触发应用一些基于POC的缩放，这将导致调用除以零操作，因为IRLP和当前图片的POC值是相同的。

8)在一些情况下，信令通知图片速率信息(num_units_in_tick、time_scale等)在不需要信令通知完整的HRD模型(比特率、缓冲区尺寸、递送模型等)所必需的附加语法的情况下启用。然而，当general_nal_hrd_params_present_flag和general_vcl_hrd_params_present_flag都等于0时，仍然在不需要时信令通知标志general_same_pic_timing_in_all_ols_flag。

9)在最新的VVC文本中，ILRP通过语法元素ilrp_idx[listIdx][rplsIdx][i]信令通知，该语法元素指定ref_pic_list_struct(listIdx，rplsIdx)语法结构中的第i个条目的ILRP对于直接参考层的列表的索引。

ILRP表示为refPicLayerId的层ID然后被推导如下：

layerIdx＝DirectRefLayerIdx[GeneralLayerIdx[nuh_layer_id]][ilrp_idx[i][RplsIdx][j]]

refPicLayerId＝vps_layer_id[layerIdx]

然而，由于层的直接参考层以nuh_layer_id值的递增顺序来索引，虽然更有可能使用更高的直接参考层而不是更低的直接参考层用于ILP，但是信令通知直接参考层的保留顺序列表的索引会更有效。

10)在最新的VVC文本中，即使在当前层仅具有一个直接参考层时或者当仅最高直接参考层用于ILP时，语法元素ilrp_idx[listIdx][rplsIdx][i]也被信令通知，在这两种情况下都可以推导信息。

11)在最新的VVC文本中，指定ilrp_idx[listIdx][rplsIdx][i]的值应当在0到NumDirectRefLayers[GeneralLayerIdx[nuh_layer_id]]-1的范围(包括0和NumDirectRefLayers[GeneralLayerIdx[nuh_layer_id]]-1)内。当ref_pic_list_struct()在SPS中时，这里的nuh_layer_id是SPS的nuh_layer_id。然而，如果SPS由nuh_layer_id大于SPS的nuh_layer_id的层中的图片参考，并且直接参考层的数量对于两个层是不同的，该怎么办？基本上，为了图片能够灵活地参考任何直接依赖层中的ILRP，它可能必须选择不参考这个特定的SPS。换句话说，由于这个值范围规范，SPS共享的机会减少了。

5.技术解决方案和实施例的示例

为了解决以上问题和其他问题，公开了如下总结的方法。这些项应该被认为是解释一般概念的示例，而不应该以狭隘的方式进行解释。此外，这些项可以被单独应用或者以任何方式组合。

1)为了解决问题1，根据sps_inter_layer_ref_pics_present_flag来有条件地信令通知sps_idr_rpl_present_flag。

a.在一个示例中，指定当sps_inter_layer_ref_pics_present_flag等于1时，sps_idr_rpl_present_flag被跳过并被推断为等于1。

i.此外，可替代地，要求当vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于0时，sps_idr_rpl_present_flag的值等于1。

b.可替代地，不根据sps_inter_layer_ref_pics_present_flag有条件地信令通知sps_idr_rpl_present_flag，要求当sps_inter_layer_ref_pics_present_flag等于1时，sps_idr_rpl_present_flag的值等于1。

c.可替代地，不根据sps_inter_layer_ref_pics_present_flag有条件地信令通知sps_idr_rpl_present_flag，要求当vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于0时，sps_idr_rpl_present_flag的值等于1。

d.可替代地，不根据sps_inter_layer_ref_pics_present_flag有条件地信令通知sps_idr_rpl_present_flag，要求当sps_inter_layer_ref_pics_present_flag等于1或者vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于0时，sps_idr_rpl_present_flag的值等于1。

2)为了解决问题2，添加约束，使得当sps_idr_rpl_present_flag等于0，pps_mixed_nalus_in_pic_flag等于1，并且pps_rpl_info_in_ph_flag等于0，nal_unit_type的值不应当等于IDR_W_RADL或IDR_N_LP。

a.可替代地，添加约束，使得对于pps_mixed_nalus_in_pic_flag等于1、pps_rpl_info_in_ph_flag等于0并且有nal_unit_type等于IDR_W_RADL或IDR_N_LP的至少一个VCLNAL单元的图片，sps_idr_rpl_present_flag的值应当等于1。

3)为了解决问题3，添加约束，使得当vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于0时，sps_inter_layer_ref_pics_present_flag的值应当等于1。

a.可替代地，指定sps_inter_layer_ref_pics_present_flag的值应当等于！vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]。

4)为了解决问题4，添加当sps_num_ref_pic_lists[0]等于1并且rpl_sps_flag[0]等于1时的rpl_idx[0]的值的推断。

a.在一个示例中，当sps_num_ref_pic_lists[0]等于1并且rpl_sps_flag[0]等于1时，rpl_idx[0]的值被推断为等于0。

5)为了解决问题5，指定仅当pps_rpl_info_in_ph_flag等于0时，才设置或推断sps_idr_rpl_present_flag等于0并且nal_unit_type等于IDR_W_RADL或IDR_N_LP的条带的RplsIdx[i]、num_ref_entries[i][RplsIdx[i]]和NumRefIdxActive[i]的默认值。

6)为了解决问题6，关于对当前图片的条带的RefPicList[0]或RefPicList[1]中的ILRP条目的约束，以与IRAP图片相同的方式对待ph_recovery_poc_cnt等于0的GDR图片。

7)为了解决问题7，在用于参考图片标记的解码过程中，指定在当前图片是CLVSS图片时，将RefPicList[0]或RefPicList[1]中的每个ILRP条目(当存在时)标记为“用于长期参考”。

8)为了解决问题1，在SPS语法中，在sps_inter_layer_ref_pics_present_flag之前信令通知sps_idr_rpl_present_flag，并且根据sps_idr_rpl_present_flag来有条件地信令通知sps_inter_layer_ref_pics_present_flag。

a.在一个示例中，指定当sps_idr_rpl_present_flag等于0时，sps_inter_layer_ref_pics_present_flag被跳过并被推断为等于0。

i.此外，可替代地，要求当sps_idr_rpl_present_flag的值等于0时，vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于1。

b.可替代地，在SPS语法中，在sps_inter_layer_ref_pics_present_flag之前信令通知sps_idr_rpl_present_flag，不根据sps_idr_rpl_present_flag有条件地信令通知sps_inter_layer_ref_pics_present_flag，要求当sps_idr_rpl_present_flag的值等于0时，sps_inter_layer_ref_pics_present_flag等于0。

c.可替代地，在SPS语法中，在sps_inter_layer_ref_pics_present_flag之前信令通知sps_idr_rpl_present_flag，不根据sps_idr_rpl_present_flag有条件地信令通知sps_inter_layer_ref_pics_present_flag，要求当sps_idr_rpl_present_flag等于0时，sps_inter_layer_ref_pics_present_flag的值等于0或者vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于1。

d.可替代地，是否和/或如何信令通知sps_inter_layer_ref_pics_present_flag和/或sps_idr_rpl_present_flag可以依赖于存在于通用约束信息(GCI)语法中的通用约束标志，例如intra_only_constraint_flag。

9)为了解决问题8，当general_nal_hrd_params_present_flag和general_vcl_hrd_params_present_flag都等于0时，不信令通知标志general_same_pic_timing_in_all_ols_flag。

10)为了解决问题9，对于ILRP的信令，信令通知包含ILRP的层对于直接参考层的逆序列表的索引，而不信令通知包含ILRP的层对于直接参考层的列表的索引。

a.在一个示例中，ilrp_idx[listIdx][rplsIdx][i]语法元素的语义被改变如下：

[listIdx][rplsIdx][i]指定ref_pic_list_struct(listIdx,rplsIdx)语法结构中的第i个条目的ILRP对于直接参考层的

列表的索引。ilrp_idx[listIdx][rplsIdx][i]的值应当在0到NumDirectRefLayers[GeneralLayerIdx[nuh_layer_id]]-1的范围(包括0和NumDirectRefLayers[GeneralLayerIdx[nuh_layer_id]]-1)内。

i.此外，在一个示例中，ILRP表示为refPicLayerId的层ID被推导如下：

refPicLayerId＝vps_layer_id[layerIdx]

b.此外，可替代地，是信令通知逆序列表中的索引还是信令通知直接参考层的索引可以依赖于比特流中的不同层是由一个相机捕获的相同视频内容的不同可缩放表示还是在其他语法元素中(例如，在DCI、VPS或SPS的扩展中，在一个或多个新的独立NAL单元中，或者在一个或多个SEI消息中)信令通知的由不同内容捕获的不同视图等的信息。

11)为了解决问题10，当可以推导ILRP的层ID时，不为ILRP信令通知语法元素ilrp_idx[listIdx][rplsIdx][i]。

c.在一个示例中，可以添加一个或多个语法元素来指示视频单元(例如，层/图片/条带)的特定层索引。

i.在一个示例中，可以添加语法元素来指定仅允许一个特定层索引(如果有的话)。

a)在一个示例中，特定层索引可以被定义为最高参考层、或最低参考层、或具有给定索引的层。

a.此外，可替代地，特定层索引可以依赖于比特流中的不同层是由一个相机捕获的相同视频内容的不同可缩放表示还是在SEI消息或其他语法元素中(诸如在DCI、VPS或SPS的扩展中，或者在一个或多个新的独立NAL单元中)信令通知的由不同内容捕获的不同视图等的信息。

b)此外，可替代地，可以添加另一语法元素来指示哪个层要用于ILRP。

c)此外，可替代地，添加的语法元素存在于SPS/PPS/PH/SH中。

ii.此外，可替代地，是否信令通知或如何信令通知ilrp_idx可以依赖于添加的语法元素。

d.在一个示例中，例如命名为sps_ilp_uses_only_the_highest_ref_layer_flag的标志被添加到SPS语法。该标志等于1指定仅包含参考SPS的当前图片的层的直接参考层(如果有的话)中的最高层可以被包括在当前图片的条带的参考图片列表中。sps_ilp_uses_only_the_highest_ref_layer_flag等于0指定这样的约束可以或者可以适用。

i.此外，在一个示例中，当包含参考SPS的图片的所有层仅具有一个直接参考层时，sps_ilp_uses_only_the_highest_ref_layer_flag的值应当等于1。

a)可替代地，当nuh_layer_id等于SPS的nuh_layer_id的层仅具有一个直接参考层时，sps_ilp_uses_only_the_highest_ref_layer_flag的值应当等于1。

ii.此外，在一个示例中，当sps_ilp_uses_only_the_highest_ref_layer_flag等于1时，不信令通知语法元素

[listIdx][rplsIdx][i]。

a)此外，在一个示例中，当sps_ilp_uses_only_the_highest_ref_layer_flag等于1时，

[listIdx][rplsIdx][i]的值被推断为等于

NumDirectRefLayers[GeneralLayerIdx[nuh_layer_id]]-1。

e.在一个示例中，例如命名为sps_ilp_uses_only_the_lowest_ref_layer_flag的标志被添加到SPS语法。该标志等于1指定仅包含参考SPS的当前图片的层的直接参考层(如果有的话)中的最低层可以被包括在当前图片的条带的参考图片列表中。sps_ilp_uses_only_the_lowest_ref_layer_flag等于0指定这样的约束可以或者可以适用。

i.此外，在一个示例中，当包含参考SPS的图片的所有层仅具有一个直接参考层时，sps_ilp_uses_only_the_lowest_ref_layer_flag的值应当等于1。

a)可替代地，当nuh_layer_id等于SPS的nuh_layer_id的层仅具有一个直接参考层时，sps_ilp_uses_only_the_lowest_ref_layer_flag的值应当等于1。

ii.此外，在一个示例中，当sps_ilp_uses_only_the_lowest_ref_layer_flag等于1时，不信令通知语法元素

[listIdx][rplsIdx][i]。

a)此外，在一个示例中，当sps_ilp_uses_only_the_lowest_ref_layer_flag等于1时，

[listIdx][rplsIdx][i]的值被推断为等于0。

12)为了解决问题9和10，对于ILRP的信令，信令通知或推断包含ILRP的层对于直接参考层的逆序列表的索引，而不信令通知或推断包含ILRP的层对于直接参考层的列表的索引。当已知仅包含参考SPS的当前图片的层的直接参考层(如果有的话)中的特定(例如，最高层或最低层)层可以被包括在当前图片的条带的参考图片列表中时，不信令通知而推断索引。

f.在一个示例中，当已知仅包含参考SPS的当前图片的层的直接参考层(如果有的话)中的最高层可以被包括在当前图片的条带的参考图片列表中时，索引被推断为等于0(而不是等于NumDirectRefLayers[GeneralLayerIdx[nuh_layer_id]]-1)。

g.此外，可替代地，当不存在时，是否将索引解释为0或(NumDirectRefLayers[GeneralLayerIdx[nuh_layer_id]]–1)可以依赖于其他语法元素或SEI消息，其例如指示比特流中的不同层是由一个相机捕获的相同视频内容的不同可缩放表示还是由不同内容捕获的不同视图等的信息。

13)为了解决问题11，在一个示例中，指定ilrp_idx[listIdx][rplsIdx][i]的值范围独立于NumDirectRefLayers[GeneralLayerIdx[nuh_layer_id]]的值。

h.在一个示例中，指定ilrp_idx[listIdx][rplsIdx][i]的值应当在0到vps_max_layers_minus1-1的范围(包括0和vps_max_layers_minus1-1)内。

i.此外，在一个示例中，要求为当前条带推导的每个ILRP属于包含当前图片的当前层的直接参考层。

14)为了解决问题11，在另一个示例中，对于ILRP的信令，代替信令通知包含ILRP的层对于逆序列表或仅直接参考层的列表的索引，信令通知当前图片和ILRP的层索引值之间的增量减1。

i.在一个示例中，语法元素ilrp_idx[listIdx][rplsIdx][i]被替换为layer_idx_delta_minus1[listIdx][rplsIdx][i]，具有以下语义：

[listIdx][rplsIdx][i]加1指定当前图片的层索引和ref_pic_list_struct(listIdx,rplsIdx)语法结构中的第i个条目的ILRP的层索引之间的差。layer_idx_delta_minus1[listIdx][rplsIdx][i]的值应当在0到vps_max_layers_minus-1的范围(包括0和vps_max_layers_minus-1)内。

i.此外，在一个示例中，ILRP表示为refPicLayerId的层ID

被推导如下：

[[layerIdx＝DirectRefLayerIdx[GeneralLayerIdx[nuh_layer_id]][ilrp_idx[i][RplsIdx][j]]]]

refPicLayerId＝vps_layer_id[layerIdx]

ii.此外，在一个示例中，要求为当前条带推导的每个ILRP属于包含当前图片的当前层的直接参考层。

15)为了解决问题9-11，现有或新添加的语法元素的信令和/或现有或新添加的语法元素的语义/推导可以依赖于其他语法元素和/或SEI消息(例如，指定它是多视图编解码还是其他情况)。

6.实施例

以下是上面第4节中总结的本发明的一些方面的一些示例实施例，其可以被应用于VVC规范。已经被添加或修改的最相关部分以粗体斜体加下划线，并且删除的部分中的一些使用[[]]指示。

6.1.第一实施例

该实施例针对第1、1.a、2、2a、3、4、4.a、5、6和7项。

7.3.2.3序列参数集RBSP语法

7.4.2.2 NAL单元标头语义

...

nal_unit_type的值对于子图片的所有VCL NAL单元应当是相同的。子图片被称为具有与子图片的VCL NAL单元相同的NAL单元类型。

当图片中的任何两个子图片具有不同的NAL单元类型时，对于包含至少一个P条带或B条带的图片中的所有子图片，sps_subpic_treated_as_pic_flag[]的值应当等于1。

...

7.4.3.3序列参数集RBSP语义

...

等于0指定没有ILRP用于CLVS中的任何编解码图片的帧间预测。sps_inter_layer_ref_pics_present_flag等于1指定ILRP可以用于CLVS中的一个或多个编解码图片的帧间预测。当sps_video_parameter_set_id等于0时，sps_inter_layer_ref_pics_present_flag的值被推断为等于0。[[当vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于1时，sps_inter_layer_ref_pics_present_flag的值应当等于0。

等于1指定参考图片列表语法元素可以存在于IDR图片的条带标头中。sps_idr_rpl_present_flag等于0指定参考图片列表语法元素不存在于IDR图片的条带标头中。

...

7.4.9参考图片列表语义

...

[i]指定用于推导当前图片的参考图片列表i的listIdx等于i的ref_pic_list_struct(listIdx,rplsIdx)语法结构在SPS中包括的listIdx等于i的ref_pic_list_struct(listIdx,rplsIdx)语法结构的列表中的索引。语法元素rpl_idx[i]由Ceil(Log2(sps_num_ref_pic_lists[i]))比特表示。rpl_idx[i]的值应当在0到sps_num_ref_pic_lists[i]-1的范围(包括0和sps_num_ref_pic_lists[i]-1)内。

当

不存在时，

–[[如果rpl_sps_flag[i]等于1]]

并且pps_rpl1_idx_present_flag等于0，则rpl_idx[1]的值被推断为等于rpl_idx[0]。

–否则[[rpl_idx[1]]]

的值被推断为等于0。

变量RplsIdx[i]被推导如下：

RplsIdx[i]＝rpl_sps_flag[i]？rpl_idx[i]:sps_num_ref_pic_lists[i] (150)

...

8.3.2用于参考图片列表构建的解码过程

...

如果sps_idr_rpl_present_flag等于0，

并且nal_unit_type等于IDR_W_RADL或IDR_N_LP，则参考图片列表RefPicList[0]和RefPicList[1]都被推导为空，即包含0个条目，并且对于等于0或1的每个i，以下适用：

–RplsIdx[i]的值被设置为等于sps_num_ref_pic_lists[i]。

–num_ref_entries[i][RplsIdx[i]]的值被推断为等于0。

–NumRefIdxActive[i]的值被设置为等于0。

...

–[[由当前图片的条带的RefPicList[0]或RefPicList[1]中的每个ILRP条目参考的图片应当与当前图片在相同的AU中。]]

–所有以下约束适用于由当前图片的条带的RefPicList[0]或RefPicList[1]中的每个ILRP条目(当存在时)参考的图片：

ο

ο图片应当存在于DPB中。

ο图片应当具有小于当前图片的nuh_layer_id的nuh_layer_idrefPicLayerId。

ο以下约束中的任一个适用：

ο图片应当是

IRAP图片。

ο图片应当具有小于或等于Max(0，vps_max_tid_il_ref_pics_plus1[currLayerIdx][refLayerIdx]-1)的TemporalId，其中currLayerIdx和refLayerIdx分别等于GeneralLayerIdx[nuh_layer_id]和GeneralLayerIdx[refpicLayerId]。

–条带的RefPicList[0]或RefPicList[1]中的每个ILRP条目(当存在时)应当是活动条目。

...

8.3.3用于参考图片标记的解码过程

...

如果当前图片是CLVSS图片，则以下适用：

–当前在DPB中的具有与当前图片相同的nuh_layer_id的所有参考图片(如果有的话)被标记为“未用于参考”。

–

否则(当前图片不是CLVSS图片)，以下适用：

–对于RefPicList[0]或RefPicList[1]中的每个LTRP条目，当图片是具有与当前图片相同的nuh_layer_id的STRP时，图片被标记为“用于长期参考”。

–不由RefPicList[0]或RefPicList[1]中的任何条目参考的、DPB中具有与当前图片相同的nuh_layer_id的每个参考图片被标记为“未用于参考”。

–对于RefPicList[0]或RefPicList[1]中的每个ILRP条目，图片被标记为“用于长期参考”。

6.2.第二实施例

该实施例针对第11项。

语法和语义改变如下：

...

...

...

[listIdx][rplsIdx][i]指定ref_pic_list_struct(listIdx,rplsIdx)语法结构中的第i个条目的ILRP对于直接参考层的列表的索引。ilrp_idx[listIdx][rplsIdx][i]的值应当在0到NumDirectRefLayers[GeneralLayerIdx[nuh_layer_id]]-1的范围(包括0和NumDirectRefLayers[GeneralLayerIdx[nuh_layer_id]]-1)内。

...

6.3.第三实施例

该实施例针对第10、11和12项。

语法和语义改变如下：

...

...

...

...

将最新的VVC草案文本中的公式205改变如下：

...

layerIdx＝

DirectRefLayerIdx[GeneralLayerIdx[nuh_layer_id]][ilrp_idx[i][RplsIdx][j]]

refPicLayerId＝vps_layer_id[layerIdx]

...

6.4.第四实施例

该实施例针对第13项。

语法和语义改变如下：

...

[[

[listIdx][rplsIdx][i]指定ref_pic_list_struct(listIdx,rplsIdx)语法结构中的第i个条目的ILRP对于直接参考层的列表的索引。ilrp_idx[listIdx][rplsIdx][i]的值应当在0到NumDirectRefLayers[GeneralLayerIdx[nuh_layer_id]]-1的范围(包括0和NumDirectRefLayers[GeneralLayerIdx[nuh_layer_id]]-1)内。]]

...

将最新的VVC草案文本中的公式205改变如下：

...

refPicLayerId＝vps_layer_id[layerIdx]

图1是示出可以在其中实施本文公开的各种技术的示例视频处理系统1900的框图。各种实施方式可以包括系统1900的一些或所有组件。系统1900可以包括用于接收视频内容的输入1902。视频内容可以以例如8或10比特多分量像素值的原始或未压缩格式而接收，或者可以是压缩或编码格式。输入1902可以表示网络接口、外围总线接口或存储接口。网络接口的示例包括诸如以太网、无源光网络(PON)等的有线接口和诸如Wi-Fi或蜂窝接口的无线接口。

系统1900可以包括可以实施本文档中描述的各种编解码或编码方法的编解码组件1904。编解码组件1904可以将来自输入1902的视频的平均比特率减小到编解码组件1904的输出，以产生视频的编解码表示。编解码技术因此有时被称为视频压缩或视频转码技术。编解码组件1904的输出可以被存储，或者经由如组件1906所表示的通信连接来发送。在输入1902处接收的视频的存储或通信传送的比特流(或编解码)表示可以由组件1908用于生成像素值或传送到显示接口1910的可显示视频。从比特流表示生成用户可视视频的过程有时被称为视频解压缩。此外，虽然某些视频处理操作被称为“编解码”操作或工具，但是将理解，编解码工具或操作在编码器处被使用，并且反转编解码结果的对应的解码工具或操作将由解码器执行。

外围总线接口或显示接口的示例可以包括通用串行总线(USB)、或高清晰度多媒体接口(HDMI)、或显示端口(Displayport)等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以体现在各种电子设备中，诸如移动电话、膝上型电脑、智能电话、或能够执行数字数据处理和/或视频显示的其他设备。

图2是视频处理装置3600的框图。装置3600可以用于实施本文描述的一种或多种方法。装置3600可以体现在智能手机、平板电脑、计算机、物联网(IoT)接收器等中。装置3600可以包括一个或多个处理器3602、一个或多个存储器3604和视频处理硬件3606。(多个)处理器3602可以被配置为实施本文档中描述的一种或多种方法。存储器(多个存储器)3604可以用于存储用于实施本文描述的方法和技术的数据和代码。视频处理硬件3606可以用于在硬件电路系统中实施本文档中描述的一些技术。

图4是示出可以利用本公开的技术的示例视频编解码系统100的框图。

如图4所示，视频编解码系统100可以包括源设备110和目标设备120。源设备110生成编码视频数据，其中该源设备110可以被称为视频编码设备。目标设备120可以解码由源设备110生成的编码视频数据，其中该目标设备120可以被称为视频解码设备。

源设备110可以包括视频源112、视频编码器114和输入/输出(I/O)接口116。

视频源112可以包括源，诸如视频捕捉设备、从视频内容提供器接收视频数据的接口、和/或用于生成视频数据的计算机图形系统、或这些源的组合。视频数据可以包括一个或多个图片。视频编码器114对来自视频源112的视频数据进行编码，以生成比特流。比特流可以包括形成视频数据的编解码表示的比特序列。比特流可以包括编解码图片和相关数据。编解码图片是图片的编解码表示。相关数据可以包括序列参数集、图片参数集和其他语法结构。I/O接口116可以包括调制器/解调器(调制解调器)和/或发送器。编码视频数据可以通过网络130a经由I/O接口116直接发送到目标设备120。编码视频数据也可以存储在存储介质/服务器130b上，以供目标设备120访问。

目标设备120可以包括I/O接口126、视频解码器124和显示设备122。

I/O接口126可以包括接收器和/或调制解调器。I/O接口126可以从源设备110或存储介质/服务器130b获取编码视频数据。视频解码器124可以对编码视频数据进行解码。显示设备122可以向用户显示解码视频数据。显示设备122可以与目标设备120集成，或者可以在被配置为与外部显示设备接口的目标设备120的外部。

视频编码器114和视频解码器124可以根据视频压缩标准进行操作，例如高效视频编解码(HEVC)标准、多功能视频编解码(VVC)标准和其他当前和/或另外的标准。

图5是示出视频编码器200的示例的框图，该视频编码器200可以是图4所示的系统100中的视频编码器114。

视频编码器200可以被配置为执行本公开的任何或所有技术。在图5的示例中，视频编码器200包括多个功能组件。本公开中描述的技术可以在视频编码器200的各种组件之间共享。在一些示例中，处理器可以被配置为执行本公开中描述的任何或所有技术。

视频编码器200的功能组件可以包括分割单元201、预测单元202(其可以包括模式选择单元203、运动估计单元204、运动补偿单元205和帧内预测单元206)、残差生成单元207、变换单元208、量化单元209、逆量化单元210、逆变换单元211、重构单元212、缓冲器213和熵编码单元214。

在其他示例中，视频编码器200可以包括更多、更少或不同的功能组件。在示例中，预测单元202可以包括帧内块复制(IBC)单元。IBC单元可以执行IBC模式下的预测，其中至少一个参考图片是当前视频块所在的图片。

此外，诸如运动估计单元204和运动补偿单元205的一些组件可以高度集成，但是出于解释的目的，在图9的示例中被单独表示。

分割单元201可以将图片分割为一个或多个视频块。视频编码器200和视频解码器300可以支持各种视频块尺寸。

模式选择单元203可以基于误差结果选择编解码模式(例如，帧内或帧间)之一，并且将作为结果的帧内编解码块或帧间编解码块提供给残差生成单元207以生成残差块数据，以及提供给重构单元212以重构编码块以用作参考图片。在一些示例中，模式选择单元203可以选择帧内和帧间预测模式的组合(CIIP)，其中预测基于帧间预测信号和帧内预测信号。在帧间预测的情况下，模式选择单元203还可以选择块的运动矢量的分辨率(例如，子像素或整数像素精度)。

为了对当前视频块执行帧间预测，运动估计单元204可以通过将来自缓冲器213的一个或多个参考帧与当前视频块进行比较，来生成当前视频块的运动信息。运动补偿单元205可以基于运动信息和来自缓冲器213的除了与当前视频块相关联的图片之外的图片的解码样点，来确定当前视频块的预测视频块。

运动估计单元204和运动补偿单元205可以对当前视频块执行不同的操作，例如，依赖于当前视频块是在I条带、P条带还是B条带中。

在一些示例中，运动估计单元204可以对当前视频块执行单向预测，并且运动估计单元204可以为当前视频块的参考视频块搜索列表0或列表1的参考图片。运动估计单元204然后可以生成指示列表0或列表1中的参考图片的参考索引，该参考索引包含参考视频块和指示当前视频块和参考视频块之间的空域位移的运动矢量。运动估计单元204可以输出参考索引、预测方向指示符和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前块的预测视频块。

在其他示例中，运动估计单元204可以对当前视频块执行双向预测，运动估计单元204可以在列表0中的参考图片中搜索当前视频块的参考视频块，并且还可以在列表1中搜索当前视频块的另一个参考视频块。运动估计单元204然后可以生成参考索引，该参考索引指示包含参考视频块的列表0和列表1中的参考图片以及指示参考视频块和当前视频块之间的空域位移的运动矢量。运动估计单元204可以输出当前视频块的参考索引和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前视频块的预测视频块。

在一些示例中，运动估计单元204可以输出完整的运动信息集，以用于解码器的解码处理。

在一些示例中，运动估计单元204可以不输出当前视频的完整的运动信息集。而是运动估计单元204可以参考另一个视频块的运动信息信令通知当前视频块的运动信息。例如，运动估计单元204可以确定当前视频块的运动信息与邻近视频块的运动信息足够相似。

在一个示例中，运动估计单元204可以在与当前视频块相关联的语法结构中指示值，该值向视频解码器300指示当前视频块具有与另一个视频块相同的运动信息。

在另一个示例中，运动估计单元204可以在与当前视频块相关联的语法结构中标识另一视频块和运动矢量差(MVD)。运动矢量差指示当前视频块的运动矢量和所指示的视频块的运动矢量之间的差。视频解码器300可以使用所指示的视频块的运动矢量和运动矢量差来确定当前视频块的运动矢量。

如上所讨论的，视频编码器200可以预测性地信令通知运动矢量。可以由视频编码器200实施的预测信令通知技术的两个示例包括高级运动矢量预测(AMVP)和Merge模式信令通知。

帧内预测单元206可以对当前视频块执行帧内预测。当帧内预测单元206对当前视频块执行帧内预测时，帧内预测单元206可以基于相同图片中的其他视频块的解码样点来生成当前视频块的预测数据。当前视频块的预测数据可以包括预测视频块和各种语法元素。

残差生成单元207可以通过从当前视频块中减去(例如，由减号指示)当前视频块的(多个)预测视频块来生成当前视频块的残差数据。当前视频块的残差数据可以包括与当前视频块中样点的不同样点分量相对应的残差视频块。

在其他示例中，例如在跳过模式下，对于当前视频块可能没有残差数据，并且残差生成单元207可能不执行减去操作。

变换处理单元208可以通过将一个或多个变换应用于与当前视频块相关联的残差视频块来为当前视频块生成一个或多个变换系数视频块。

在变换处理单元208生成与当前视频块相关联的变换系数视频块之后，量化单元209可以基于与当前视频块相关联的一个或多个量化参数(QP)值来量化与当前视频块相关联的变换系数视频块。

逆量化单元210和逆变换单元211可以分别对变换系数视频块应用逆量化和逆变换，以从变换系数视频块重构残差视频块。重构单元212可以将重构后的残差视频块添加到来自预测单元202生成的一个或多个预测视频块的对应样点，以产生与当前块相关联的重构视频块，用于存储在缓冲器213中。

在重构单元212重构视频块之后，可以执行环路滤波操作，以减少视频块中的视频块效应。

熵编码单元214可以从视频编码器200的其他功能组件接收数据。当熵编码单元214接收到数据时，熵编码单元214可以执行一个或多个熵编码操作，以生成熵编码数据，并输出包括该熵编码数据的比特流。

图6是示出视频解码器300的示例的框图，该视频解码器300可以是图4所示的系统100中的视频解码器114。

视频解码器300可以被配置为执行本公开的任何或所有技术。在图6的示例中，视频解码器300包括多个功能组件。本公开中描述的技术可以在视频解码器300的各种组件之间共享。在一些示例中，处理器可以被配置为执行本公开中描述的任何或所有技术。

在图6的示例中，视频解码器300包括熵解码单元301、运动补偿单元302、帧内预测单元303、逆量化单元304、逆变换单元305、重构单元306和缓冲器307。在一些示例中，视频解码器300可以执行通常与针对视频编码器200(图5)描述的编码过程相反的解码过程。

熵解码单元301可以检索编码比特流。编码比特流可以包括熵编解码的视频数据(例如，视频数据的编码块)。熵解码单元301可以对熵编解码的视频数据进行解码，并且从熵解码的视频数据中，运动补偿单元302可以确定包括运动矢量、运动矢量精度、参考图片列表索引和其他运动信息的运动信息。运动补偿单元302可以例如通过执行AMVP和Merge模式来确定这样的信息。

运动补偿单元302可以产生运动补偿块，可以基于插值滤波器执行插值。要以子像素精度使用的插值滤波器的标识符可以包括在语法元素中。

运动补偿单元302可以使用如视频编码器200在视频块的编码期间所使用的插值滤波器来计算参考块的子整数像素的插值。运动补偿单元302可以根据所接收的语法信息确定视频编码器200使用的插值滤波器，并使用该插值滤波器来产生预测块。

运动补偿单元302可以使用一些语法信息来确定用于对编码视频序列的(多个)帧和/或(多个)条带进行编码的块的尺寸、描述编码视频序列的图片的每个宏块如何被分割的分割信息、指示每个分割如何被编码的模式、每个帧间编码块的一个或多个参考帧(和参考帧列表)、以及用于对编码视频序列进行解码的其他信息。

帧内预测单元303可以使用例如在比特流中接收的帧内预测模式来从空域上相邻的块形成预测块。逆量化单元303对在比特流中提供并由熵解码单元301解码的量化后的视频块系数进行逆量化，即，反量化。逆变换单元303应用逆变换。

重构单元306可以将残差块与由运动补偿单元202或帧内预测单元303生成的对应预测块相加，以形成解码块。如果需要，还可以应用去方块滤波器对解码块进行滤波，以便移除块效应。解码视频块然后被存储在缓冲器307中，为随后的运动补偿/帧内预测提供参考块，并且还产生解码视频以在显示设备上呈现。

接下来提供一些实施例优选的解决方案的列表。

以下解决方案示出了在前一节(例如，第1项)中讨论的技术的示例实施例。

1.一种视频处理的方法(例如，图3中的方法600)，包括执行包括包含一个或多个视频图片的一个或多个视频层的视频和视频的编解码表示之间的转换(602)，其中编解码表示符合格式规则，格式规则指定指示帧间层参考图片是否用于转换的第一语法元素的第一值控制指示参考图片列表是否被包括在编解码表示中的第二语法元素的第二值或存在。

2.根据解决方案1所述的方法，其中，在第一值为1的情况下，第二语法元素从编解码表示中省略并被推断为1。

以下解决方案示出了在前一节(例如，第2项)中讨论的技术的示例实施例。

3.一种视频处理方法，包括：执行包括包含一个或多个视频图片的一个或多个视频层的视频和视频的编解码表示之间的转换，其中编解码表示符合格式规则，格式规则指定，在第一语法元素指示参考图片列表的语法元素不包括在编解码表示中并且混合网络抽象层单元被允许在编解码表示中并且参考图片列表语法元素不包括在图片标头中的情况下，即时解码器参考图片类型网络抽象层单元的使用在编解码表示中被禁用。

以下解决方案示出了在前一节(例如，第3、4项)中讨论的技术的示例实施例。

4.一种视频处理方法，包括：执行包括包含一个或多个视频图片的一个或多个视频层的视频和视频的编解码表示之间的转换，其中编解码表示符合格式规则，格式规则指定以下约束：(a)指示视频参数集中的给定层id的独立层激活标志的第一语法元素的值控制指示对帧间层参考图片的激活的第二语法元素的值，或者(b)指示序列参数集中的参考图片列表的数量的第一语法元素的值控制指示用于当前视频单元的转换的参考图片列表的第二语法元素的值。

5.根据解决方案4所述的方法，其中，第一语法元素和第二语法元素具有相反的二进制值。

6.根据解决方案4所述的方法，其中，第一语法元素和第二语法元素具有相同的二进制值。

以下解决方案示出了在前一节(例如，第7项)中讨论的技术的示例实施例。

7.一种视频处理方法，包括：执行包括包含一个或多个视频图片的一个或多个视频层的视频和视频的编解码表示之间的转换，其中该转换根据规则，该规则指定在当前图片是编解码层视频序列的起始图片的情况下当前图片的参考列表中的帧间层图片被认为是长期参考图片。

以下解决方案示出了在前一节(例如，第8项)中讨论的技术的示例实施例。

9.一种视频处理方法，包括：执行包括包含一个或多个视频图片的一个或多个视频层的视频和视频的编解码表示之间的转换，其中编解码表示符合格式规则，该格式规则指定，为了信令通知帧间层参考图片ILRP，ILRP图片所属的层的索引被信令通知给参考层列表的逆序列表。

10.根据解决方案9所述的方法，其中，由于视频满足编解码条件，使用逆序列表。

11.根据解决方案11所述的方法，其中，编解码条件包括捕获的视图信息或语法元素的信令或编解码表示中辅助增强信息的存在。

12.一种视频处理方法，包括：执行包括包含一个或多个视频图片的一个或多个视频层的视频和视频的编解码表示之间的转换，其中编解码表示符合指定使用参考层的逆序列表的索引来信令通知视频的编解码特性的格式规则。

13.根据解决方案12所述的方法，其中，编解码特性包括帧间层参考图片的标识。

14.根据解决方案1-13中任一项所述的方法，其中，执行转换包括对视频进行编码以生成编解码表示。

15.根据解决方案1-13中任一项所述的方法，其中，执行转换包括对编解码表示进行解析和解码以生成视频。

16.一种视频解码装置，包括被配置为实施根据解决方案1至15中的一项或多项所述的方法的处理器。

17.一种视频编码装置，包括被配置为实施根据解决方案1至15中的一项或多项所述的方法的处理器。

18.一种存储有计算机代码的计算机程序产品，该代码在由处理器执行时使得处理器实施根据解决方案1至15中任一项所述的方法。

19.一种本文档中描述的方法、装置或系统。

图7是根据本公开的一个或多个实施例的用于视频处理的方法700的流程图表示。方法700包括，在操作710，根据规则来执行视频和视频的比特流之间的转换。比特流包括参考一个或多个参数集的一个或多个视频图片。一个或多个参数集中的至少一个包括包含定时和假想参考解码器HRD参数的通用语法结构。该规则指定，响应于(1)第二语法标志指定网络抽象层NAL HRD参数不存在于通用语法结构中并且(2)第三语法标志指定视频编解码层VCL HRD参数不存在于通用语法结构中，第一语法标志不包括在通用语法结构中。第一语法标志指定相同的图片级别定时信息适用于比特流中的所有输出层集。

在一些实施例中，第一语法标志被表示为general_same_pic_timing_in_all_ols_flag。在一些实施例中，一个或多个参数集包括视频参数集。在一些实施例中，一个或多个参数集包括序列参数集。

图8是根据本公开的一个或多个实施例的用于视频处理的方法800的流程图表示。方法800包括，在操作810，根据规则来执行视频和视频的比特流之间的转换。该规则指定比特流中包含帧间层参考图片ILRP的层的索引基于直接参考层的列表的逆序来确定。

在一些实施例中，直接参考层索引被表示为DirectRefLayerIdx。直接参考层的列表包括表示为NumDirectRefLayers的层的数量，并且层的索引被表示为layerIdx＝NumDirectRefLayers-1-DirectRefLayerIdx。在一些实施例中，索引不存在于比特流中，并且响应于仅包含参考序列参数集的当前图片的层的直接参考层中的特定层被包括在当前图片的条带的参考图片列表中而被推断。在一些实施例中，响应于特定层是直接参考层中的最高层，索引被推断为0。在一些实施例中，索引是否存在于比特流中和/或如何推断索引是基于关于视频的特性的信息。在一些实施例中，信息指示比特流中的不同层是相同内容的不同可缩放表示还是由不同内容捕获的不同视图。在一些实施例中，信息包括解码能力信息、视频参数集或序列参数集的扩展中或者一个或多个独立网络抽象层单元中的其他语法元素。

图9是根据本公开的一个或多个实施例的用于视频处理的方法900的流程图表示。方法900包括，在操作910，根据规则来执行视频的当前图片和视频的比特流之间的转换。该规则指定，响应于帧间层参考图片的层索引在转换中可推导，指定关于帧间层参考图片的直接参考层的列表的索引的第一语法元素不存在于比特流中。

在一些实施例中，比特流中的第二语法元素指定在比特流中允许至多一个层索引。在一些实施例中，至多一个层索引是最高参考层的索引、最低参考层的索引或者特定索引。在一些实施例中，特定索引基于关于视频的特性的信息。在一些实施例中，信息指示比特流中的不同层是相同内容的不同可缩放表示还是由不同内容捕获的不同视图。

在一些实施例中，信息包括解码能力信息、视频参数集或序列参数集的扩展中或者一个或多个独立网络抽象层单元中的其他语法元素。在一些实施例中，比特流中的第三语法元素指定哪个层用于帧间层参考图片。在一些实施例中，第二语法元素或第三语法元素在序列参数集、图片参数集、图片标头或条带标头中。在一些实施例中，是否以及如何在比特流中包括第一语法元素是基于第二语法元素和/或第三语法元素。

在一些实施例中，序列参数集中的第一语法标志等于1指定约束被实施。该约束指定仅包含参考序列参数集的当前图片的层的直接参考层中的最高层被包括在当前图片的条带的参考图片列表中。在一些实施例中，第一语法标志等于0指定约束不实施。在一些实施例中，响应于包含参考序列参数集的图片的所有层仅具有一个直接参考层，第一语法标志等于1。在一些实施例中，响应于具有与序列参数集相同的层标识符的层仅具有一个直接参考层，第一语法标志等于1。在一些实施例中，响应于第一语法标志等于1，第一语法元素不存在于比特流中。在一些实施例中，响应于第一语法标志等于1，语法元素被推断为直接参考层的数量减1。

在一些实施例中，序列参数集中的第二语法标志等于1指定约束被实施。该约束指定仅包含参考序列参数集的当前图片的层的直接参考层中的最低层被包括在当前图片的条带的参考图片列表中。在一些实施例中，第二语法标志等于0指定约束不实施。在一些实施例中，响应于包含参考序列参数集的图片的所有层仅具有一个直接参考层，第二语法标志等于1。在一些实施例中，响应于具有与序列参数集相同的层标识符的层仅具有一个直接参考层，第二语法标志等于1。在一些实施例中，响应于第一语法标志等于1，第一语法元素不存在于比特流中。在一些实施例中，响应于第一语法标志等于1，语法元素被推断为0。

图10是根据本公开的一个或多个实施例的用于视频处理的方法1000的流程图表示。方法1000包括，在操作1010，根据规则来执行视频的当前图片和视频的比特流之间的转换。该规则指定，指定关于帧间层参考图片的直接参考层的列表的索引的第一语法元素的值范围独立于包含当前图片的层的直接参考层的数量。

在一些实施例中，该规则指定第一语法元素的值范围为[0，视频参数集中的层的最大数量-1]。在一些实施例中，为属于包含当前图片的当前层的直接参考层的当前条带推导每个帧间层参考图片。

图11是根据本公开的一个或多个实施例的用于视频处理的方法1100的流程图表示。方法1100包括，在操作1110，根据规则来执行视频的当前图片和视频的比特流之间的转换。该规则指定包含帧间层参考图片ILRP的层的索引基于当前图片的层索引和帧间层参考图片的层索引之间的差来确定。

在一些实施例中，指定关于帧间层参考图片的直接参考层的列表的索引的第一语法元素被替换为第二语法元素。第二语法元素指定当前图片的层索引和帧间层参考图片的层索引之间的差。在一些实施例中，第二语法元素的值范围为[0，视频参数集中的层的最大数量-1]。在一些实施例中，为属于包含当前图片的当前层的直接参考层的当前条带推导每个帧间层参考图片。

在一些实施例中，语法元素或语法标志中的一个或多个是否和/或如何存在于比特流中是基于指定多视图编解码是否适用的其他语法元素或信息。

在一些实施例中，该转换包括将视频编码为比特流。在一些实施例中，该转换包括从比特流解码视频。

本文档中描述的所公开的以及其他解决方案、示例、实施例、模块和功能操作可以在数字电子电路中、或者在计算机软件、固件或硬件(包括本文档中公开的结构及其结构等同物)中、或者在它们中的一个或多个的组合中被实施。所公开的以及其他实施例可以被实施为一个或多个计算机程序产品，即在计算机可读介质上编码的计算机程序指令的一个或多个模块，该计算机程序指令用于由数据处理装置执行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读传播信号的物质的组合、或它们中的一个或多个的组合。术语“数据处理装置”包含用于处理数据的所有装置、设备和机器，包括例如可编程处理器、计算机、或多个处理器或计算机。除了硬件之外，装置还可以包括为所讨论的计算机程序创建执行环境的代码，例如，构成处理器固件、协议栈、数据库管理系统、操作系统、或它们中的一个或多个的组合的代码。传播信号是被生成以对信息进行编码以用于发送到合适的接收器装置的人工生成的信号，例如机器生成的电信号、光学信号或电磁信号。

计算机程序(也已知为程序、软件、软件应用、脚本或代码)可以以任何形式的编程语言(包括编译或解释语言)编写，并且其可以以任何形式部署，包括作为独立程序或作为适合在计算环境中使用的模块、组件、子例程或其他单元。计算机程序不一定对应于文件系统中的文件。程序可以存储在保存其他程序或数据(例如，存储在标记语言文档中的一个或多个脚本)的文件的一部分中，存储在专用于所讨论的程序的单个文件中，或存储在多个协调文件中(例如，存储一个或多个模块、子程序或代码部分的文件)。计算机程序可以被部署为在一个计算机上或在位于一个站点上或跨多个站点分布并通过通信网络互连的多个计算机上执行。

本文档书中描述的过程和逻辑流程可以由执行一个或多个计算机程序的一个或多个可编程处理器执行，以通过对输入数据进行操作并生成输出来执行功能。过程和逻辑流程也可以由专用逻辑电路执行，并且装置也可以被实施为专用逻辑电路，例如，FPGA(现场可编程门阵列)或ASIC(专用集成电路)。

适合于执行计算机程序的处理器包括例如通用和专用微处理器、以及任何类型的数字计算机的任何一个或多个处理器。通常，处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常，计算机还将包括用于存储数据的一个或多个大容量存储设备(例如，磁盘、磁光盘或光盘)，或可操作地耦合以从该一个或多个大容量存储设备接收数据或向该一个或多个大容量存储设备传递数据、或者从其接收数据并向其传递数据。然而，计算机不需要这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备，包括例如半导体存储器设备，例如EPROM、EEPROM和闪存设备；磁盘，例如内部硬盘或可换式盘；磁光盘；以及CD ROM和DVD-ROM盘。处理器和存储器可以由专用逻辑电路补充或并入专用逻辑电路中。

虽然本专利文档包含许多细节，但这些细节不应被解释为对任何主题或可能要求保护的范围的限制，而是作为指定于特定技术的特定实施例的特征的描述。在本专利文档中在单独的实施例的上下文中描述的某些特征也可以在单个实施例中组合实施。相反，在单个实施例的上下文中描述的各种特征也可以单独在多个实施例中或以任何合适的子组合实施。此外，尽管特征可以在上面描述为以某些组合起作用并且甚至最初如此要求保护，但是在一些情况下可以从组合排除来自所要求保护的组合的一个或多个特征，并且所要求保护的组合可以针对子组合或子组合的变化。

类似地，虽然在附图中以特定顺序描绘了操作，但是这不应该被理解为需要以所示的特定顺序或以先后顺序执行这样的操作或者执行所有示出的操作以实现期望的结果。此外，在本专利文档中描述的实施例中的各种系统组件的分离不应被理解为在所有实施例中都需要这样的分离。

仅描述了一些实施方式和示例，并且可以基于本专利文档中描述和示出的内容来进行其他实施方式、增强和变化。

Claims

1.一种处理视频数据的方法，包括：

根据规则来执行视频和所述视频的比特流之间的转换，

其中，所述比特流包括参考一个或多个参数集的一个或多个视频图片，

所述一个或多个参数集中的至少一个包括包含定时和假想参考解码器HRD参数的通用语法结构，

所述规则指定，响应于(1)第二语法标志指定网络抽象层NAL HRD参数不存在于所述通用语法结构中并且(2)第三语法标志指定视频编解码层VCL HRD参数不存在于所述通用语法结构中，第一语法标志不包括在所述通用语法结构中，其中所述第一语法标志指定相同的图片级别定时信息适用于所述比特流中的所有输出层集。

2.根据权利要求1所述的方法，其中，所述第一语法标志被表示为general_same_pic_timing_in_all_ols_flag。

3.根据权利要求1所述的方法，其中，所述一个或多个参数集包括视频参数集。

4.根据权利要求1所述的方法，其中，所述一个或多个参数集包括序列参数集。

5.一种处理视频数据的方法，包括：

根据规则来执行视频和所述视频的比特流之间的转换，

其中，所述规则指定所述比特流中包含帧间层参考图片ILRP的层的索引基于直接参考层的列表的逆序来确定。

6.根据权利要求5所述的方法，其中，直接参考层索引被表示为DirectRefLayerIdx，直接参考层的列表包括表示为NumDirectRefLayers的层的数量，并且所述层的索引被表示为layerIdx＝NumDirectRefLayers-1-DirectRefLayerIdx。

7.根据权利要求5或6所述的方法，其中，所述索引不存在于所述比特流中，并且响应于仅包含参考序列参数集的所述当前图片的层的直接参考层中的特定层被包括在所述当前图片的条带的参考图片列表中而被推断。

8.根据权利要求7所述的方法，其中，响应于所述特定层是所述直接参考层中的最高层，所述索引被推断为0。

9.根据权利要求5至8中任一项所述的方法，其中，所述索引是否存在于所述比特流中和/或如何推断所述索引是基于关于所述视频的特性的信息。

10.根据权利要求9所述的方法，其中，所述信息指示所述比特流中的不同层是相同内容的不同可缩放表示还是由不同内容捕获的不同视图。

11.根据权利要求9所述的方法，其中，所述信息包括解码能力信息、视频参数集或序列参数集的扩展中或者一个或多个独立网络抽象层单元中的其他语法元素。

12.一种处理视频数据的方法，包括：

根据规则来执行视频的当前图片和所述视频的比特流之间的转换，

其中，所述规则指定，响应于帧间层参考图片的层索引在所述转换中可推导，指定关于所述帧间层参考图片的直接参考层的列表的索引的第一语法元素不存在于所述比特流中。

13.根据权利要求12所述的方法，其中，所述比特流中的第二语法元素指定在所述比特流中允许至多一个层索引。

14.根据权利要求13所述的方法，其中，所述至多一个层索引是最高参考层的索引、最低参考层的索引或者特定索引。

15.根据权利要求14所述的方法，其中，所述特定索引基于关于所述视频的特性的信息。

16.根据权利要求15所述的方法，其中，所述信息指示所述比特流中的不同层是相同内容的不同可缩放表示还是由不同内容捕获的不同视图。

17.根据权利要求15所述的方法，其中，所述信息包括解码能力信息、视频参数集或序列参数集的扩展中或者一个或多个独立网络抽象层单元中的其他语法元素。

18.根据权利要求12所述的方法，其中，所述比特流中的第三语法元素指定哪个层用于所述帧间层参考图片。

19.根据权利要求12至18中任一项所述的方法，其中，所述第二语法元素或所述第三语法元素在序列参数集、图片参数集、图片标头或条带标头中。

20.根据权利要求12至19中任一项所述的方法，其中，是否以及如何在所述比特流中包括所述第一语法元素是基于所述第二语法元素和/或所述第三语法元素。

21.根据权利要求12至20中任一项所述的方法，其中，序列参数集中的第一语法标志等于1指定约束被实施，所述约束指定仅包含参考所述序列参数集的所述当前图片的层的直接参考层中的最高层被包括在所述当前图片的条带的参考图片列表中。

22.根据权利要求21所述的方法，其中，所述第一语法标志等于0指定所述约束不实施。

23.根据权利要求21或22所述的方法，其中，响应于包含参考所述序列参数集的图片的所有层仅具有一个直接参考层，所述第一语法标志等于1。

24.根据权利要求21或22所述的方法，其中，响应于具有与所述序列参数集相同的层标识符的层仅具有一个直接参考层，所述第一语法标志等于1。

25.根据权利要求21至24中任一项所述的方法，其中，响应于所述第一语法标志等于1，所述第一语法元素不存在于所述比特流中。

26.根据权利要求21所述的方法，其中，响应于所述第一语法标志等于1，所述语法元素被推断为直接参考层的数量减1。

27.根据权利要求12至20中任一项所述的方法，其中，序列参数集中的第二语法标志等于1指定约束被实施，所述约束指定仅包含参考所述序列参数集的所述当前图片的层的直接参考层中的最低层被包括在所述当前图片的条带的参考图片列表中。

28.根据权利要求27所述的方法，其中，所述第二语法标志等于0指定所述约束不实施。

29.根据权利要求27或28所述的方法，其中，响应于包含参考所述序列参数集的图片的所有层仅具有一个直接参考层，所述第二语法标志等于1。

30.根据权利要求27或28所述的方法，其中，响应于具有与所述序列参数集相同的层标识符的层仅具有一个直接参考层，所述第二语法标志等于1。

31.根据权利要求27至30中任一项所述的方法，其中，响应于所述第一语法标志等于1，所述第一语法元素不存在于所述比特流中。

32.根据权利要求31所述的方法，其中，响应于所述第一语法标志等于1，所述语法元素被推断为0。

33.一种处理视频数据的方法，包括：

其中，所述规则指定，指定关于帧间层参考图片的直接参考层的列表的索引的第一语法元素的值范围独立于包含所述当前图片的层的直接参考层的数量。

34.根据权利要求33所述的方法，其中，所述规则指定所述第一语法元素的值范围为[0，视频参数集中的层的最大数量-1]。

35.根据权利要求33或34所述的方法，其中，为属于包含所述当前图片的当前层的直接参考层的当前条带推导每个帧间层参考图片。

36.一种处理视频数据的方法，包括：

其中，所述规则指定包含帧间层参考图片ILRP的层的索引基于所述当前图片的层索引和所述帧间层参考图片的层索引之间的差来确定。

37.根据权利要求36所述的方法，其中，指定关于帧间层参考图片的直接参考层的列表的索引的第一语法元素被替换为第二语法元素，所述第二语法元素指定所述当前图片的层索引和所述帧间层参考图片的层索引之间的差。

38.根据权利要求37所述的方法，其中，所述第二语法元素的值范围为[0，视频参数集中的层的最大数量-1]。

39.根据权利要求36至38中任一项所述的方法，其中，为属于包含所述当前图片的当前层的直接参考层的当前条带推导每个帧间层参考图片。

40.根据权利要求1至39中任一项所述的方法，其中，所述语法元素或语法标志中的一个或多个是否和/或如何存在于所述比特流中是基于指定多视图编解码是否适用的其他语法元素或信息。

41.根据权利要求1至40中任一项所述的方法，其中，所述转换包括将所述视频编码为所述比特流。

42.根据权利要求1至40中任一项所述的方法，其中，所述转换包括从所述比特流解码所述视频。

43.一种用于存储视频的比特流的方法，包括：

根据规则从所述视频中的当前图片生成所述视频的比特流，以及

存储所生成的比特流，

44.一种用于存储视频的比特流的方法，包括：

根据规则来生成所述视频的比特流，以及

存储所生成的比特流，

其中，所述规则指定包含帧间层参考图片ILRP的层的索引基于直接参考层的列表的保留顺序来确定。

45.一种用于存储视频的比特流的方法，包括：

根据规则来生成所述视频的比特流，以及

存储所生成的比特流，

46.一种用于存储视频的比特流的方法，包括：

根据规则来生成所述视频的比特流，以及

存储所生成的比特流，

其中，所述规则指定，指定关于帧间层参考图片的直接参考层的列表的索引的第一语法元素的值范围独立于包含当前图片的层的直接参考层的数量。

47.一种用于存储视频的比特流的方法，包括：

根据规则来生成所述视频的比特流，以及

存储所生成的比特流，

其中，所述规则指定包含帧间层参考图片ILRP的层的索引基于当前图片的层索引和所述帧间层参考图片的层索引之间的差来确定。

48.一种视频解码装置，包括被配置为实施根据权利要求1至47中的一项或多项所述的方法的处理器。

49.一种视频编码装置，包括被配置为实施根据权利要求1至47中的一项或多项所述的方法的处理器。

50.一种存储有计算机代码的计算机程序产品，所述代码在由处理器执行时使得所述处理器实施根据权利要求1至47中任一项所述的方法。

51.一种存储通过由视频处理装置执行的方法生成的视频的比特流的非暂时性计算机可读记录介质，其中所述方法包括：

存储所生成的比特流，

52.一种存储通过由视频处理装置执行的方法生成的视频的比特流的非暂时性计算机可读记录介质，其中所述方法包括：

根据规则来生成所述视频的比特流，以及

存储所生成的比特流，

53.一种存储通过由视频处理装置执行的方法生成的视频的比特流的非暂时性计算机可读记录介质，其中所述方法包括：

根据规则来生成所述视频的比特流，以及

存储所生成的比特流，

54.一种存储通过由视频处理装置执行的方法生成的视频的比特流的非暂时性计算机可读记录介质，其中所述方法包括：

根据规则来生成所述视频的比特流，以及

存储所生成的比特流，

55.一种存储通过由视频处理装置执行的方法生成的视频的比特流的非暂时性计算机可读记录介质，其中所述方法包括：

根据规则来生成所述视频的比特流，以及

存储所生成的比特流，