CN105103562A

CN105103562A - 随机接入点画面

Info

Publication number: CN105103562A
Application number: CN201480020043.4A
Authority: CN
Inventors: 萨琴·G·德希潘德
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2013-04-05
Filing date: 2014-04-07
Publication date: 2015-11-25
Anticipated expiration: 2034-04-07
Also published as: HK1215834A1; CN105103562B; EP2982124A4; EP2982124A1; JP2016519855A; WO2014162750A1

Abstract

描述了一种用于对视频比特流进行解码的方法。接收到代表视频序列的基本层比特流。还接收代表视频序列的多个增强比特流，其中所述基本层比特流和/或增强比特流中的每一个包括直接依赖性数据。对所述基本层比特流和所述多个增强比特流中的每一个进行解码，其中编码为帧内编码的IDR或帧内编码的BLA的所述基本层比特流的画面应在所述基本层比特流的对应画面处，针对每一所述增强层具有对应帧内编码IDR或帧内编码BLA画面，除了以下情况：所述增强层之一并非独立比特流。

Description

随机接入点画面

技术领域

本发明涉及视频编码和解码。

背景技术

电子设备变得越来越小并且越来越强大，以便满足消费者需要并改善便携性和便利性。消费者已经变得依赖于电子设备，并期望增加的功能性。电子设备的一些示例包括台式计算机、膝上型计算机、蜂窝电话、智能电话、媒体播放器、集成电路等。

一些电子设备用于处理并显示数字媒体。例如，便携式电子设备现在允许在消费者可能处于的几乎任何位置处使用和/或产生数字媒体。此外，一些电子设备可以提供对数字媒体内容的下载或流传输，以便消费者使用和欣赏。

数字视频通常被表示为一系列图像或帧，每一图像或帧包含像素阵列。每一像素包括诸如强度和/或颜色信息的信息。在一些情况下，将每一像素表示为三种颜色的集合。一些视频编码技术以增加复杂性为代价提供较高编码效率。针对视频编码技术的增加图像质量的要求以及增加图像分辨率的要求还增加了编码的复杂度。

发明内容

技术问题

数字媒体的越来越流行呈现出若干问题。例如，高效地呈现高质量数字媒体以便进行存储、传送和重放存在若干挑战。更高效地表示数字媒体的技术是有利的。

问题的解决方案

根据本发明，提供了一种用于对视频比特流进行解码的方法，包括：

(a)接收代表视频序列的基本层比特流；

(b)接收代表视频序列的多个增强比特流，其中所述增强比特流中的每一个包括递增的层赋值，其中所述基本层比特流和/或增强比特流中的每一个包括直接依赖性数据，直接依赖性数据指示所述基本层比特流和/或增强比特流中的每一个是否依赖于具有较小层赋值的其它所述多个增强层和基本层；

(c)对所述基本层比特流和所述多个增强比特流中的每一个进行解码，其中编码为帧内编码的IDR或帧内编码的BLA的所述基本层比特流的画面应在所述基本层比特流的对应画面处，具有针对每一所述增强层的对应帧内编码IDR或帧内编码BLA画面，但排除以下情况：所述增强层之一不所述依赖于具有较小层赋值的其他所述多个增强层和所述基本层，所述增强层之一称作独立比特流，其中所述增强层的每一个的层赋值比所述独立比特流大，且并不依赖于层赋值比所述独立层小的所述多个其他增强层。

本发明的有利效果

根据以下结合附图对本发明的详细描述，将更容易理解本发明的上述和其他目标、特征和优点。

附图说明

图1A是示出了包括HEVC编码器的电子设备的一个配置的框图。

图1B是示出了包括具有增强层的HEVC编码器的电子设备的一个配置的框图。

图2A是示出了包括HEVC解码器的电子设备的一个配置的框图。

图2B是示出了包括具有增强层的HEVC解码器的电子设备的一个配置的框图。

图3A是示出了编码器和解码器的一个示例的框图。

图3B是示出了具有增强层的编码器和解码器的一个示例的框图。

图4示出了可以在电子设备中使用的多种组件。

图5示出了示例性的分片结构(slicestructure)。

图6示出了另一示例行的分片结构。

图7示出了具有1个分片和9瓦片(tiles)的帧。

图8示出了具有3个分片和3瓦片(tiles)的帧。

图9示出了POC、解码顺序和RPS。

图10示出了示例性的分片首部。

图11示出了示例性的分片首部。

图12示出了示例性的分片首部。

图13示出了示例性的分片首部。

图14示出了示例性的视频参数集合。

图15A示出了示例性的VPS扩展。

图15B示出了示例性的VPS扩展。

图15C是示出了当第二增强层(EL2)的画面速率比基本层(BL)和第一增强层(EL1)低时，针对多层的已编码画面的网络抽象层(NAL)单元和接入单元(AU)的结构和时序的框图。

图15D是示出了当基本层(BL)的画面速率比第一增强层(EL1)和第二增强层(EL2)低时，针对多层的已编码画面的网络抽象层(NAL)单元和接入单元(AU)的结构和时序的框图。

图16示出了IDR/BLA画面的限制。

图17示出了同时联播的(simulcast)IDR/BLA画面。

具体实施方式

国际电信联盟电信标准化部(ITU-T)第16研究组(SG16)第3工作组(WP3)和国际标准化组织/国际电工技术委员会(ISO/IEC)第一联合技术委员会/第29分会/第11工作组(JTC1/SC29/WG11)的视频编码联合协作组(JCT-VC)针对被称作高效视频编码标准(HEVC)的视频编码标准进行了标准化工作。HEVC使用基于块的编码。

在HEVC中，将上下文自适应二进制算术编码(CABAC)的熵编码技术用于无损地压缩经过变换和量化的系数(TQC)。根据变换尺寸，TQC可以具有来自不同块尺寸(例如，4x4、8x8、16x16、32x32)。

在进行熵编码之前，可以将二维(2D)TQC转换为一维的(1D)阵列。在一个实例中，4x4块中的2D排列的TQC可以布置为表(1)所示。

4	0	1	0
				3	2	-1	...
-3	0	...	...
				0	...	...	...

表(1)

当将2DTQC转换为1D阵列时，可以以对角z字形的方式扫描所述块。继续该示例，可以通过扫描第一行第一列、第一行第二列、第二行第一列、第三行第一列、第二行第二列、第一行第三列、第一行第四列、第二行第三列、第三行第二列、第四行第一列等，将表1所示的2D排列的TQC转换为1D排列的TQC[4，0，3，-3，2，1，0，-1，0，0，...]。

例如可以如下执行HEVC中的编码过程。可以根据扫描顺序对1D阵列中的TQC进行排序。可以确定末位有效系数(lastsignificantcoefficient)的扫描位置和末位系数级别(lastcoefficientlevel)。可以对末位有效系数进行编码。应注意，通常以逆扫描顺序对系数进行编码。可以执行运行级别(run-level)编码，其中在进行末位系数编码之后直接激活运行级别编码，在运行级别编码中，对关于对相同数字和/或比特的运行的信息进行编码，而不对数字本身进行编码。然后，可以执行级别编码。术语重要系数是指系数级别值大于零的系数。系数级别值表示经过变换和量化的系数(TQC)值的幅度(或绝对值)的唯一指示符。

可以在表(2)中示出该过程，作为上述示例(1D排列的TQC[4，0，3，-3，2，1，0，-1，0，...])的延续。

扫描位置	0	1	2	3	4	5	6	7	...
										系数级别	4	0	3	-3	2	1	0	-1	...
末位位置								7
										末位系数级别								-1
运行级别编码					2	1	0
										级别编码	4	0	3	-3

表(2)

在表(2)中，例如，扫描位置7处的系数级别-1可以是末位非零系数。因此，末位位置是扫描位置7，末位系数级别是-1。可以针对在扫描位置6、5和4处的系数0、1和2执行运行级别编码(其中以逆扫描顺序对系数进行编码)。然后，可以针对系数级别-3、3、0和4执行级别编码。

图1A是示出了可以对视频进行编码的电子设备102的一个配置的框图。应注意，所示在电子设备102中包括的一个或更多个组件可以实现为硬件、软件或其二者的组合。例如，电子设备102包括可以实现为硬件、软件或其二者组合的编码器108。例如，编码器108可以实现为电路、集成电路、专用集成电路(ASIC)、与具有可执行指令的存储器电子通信的处理器、固件、现场可编程门阵列(FPGA)等或其组合。在一些配置中，解码器604可以是高效视频编码(HEVC)编码器。

电子设备102可以包括供应器104。供应器104可以向编码器108提供画面或图像数据(例如视频)，作为源106。供应器104的示例可以包括图像传感器、存储器、通信接口、网络接口、无线接收机、端口等。

可以将源106提供给帧内预测模块和重构缓冲器110。还可以将源106提供给运动估计和运动补偿模块136以及减法模块116。

帧内预测模块和重构缓冲器110可以基于源106和重构数据150，产生帧内模式信息128和帧内信号112。运动估计和运动补偿模块136可以基于源106和参考画面缓冲器166信号168，产生帧间模式信息138和帧间信号114。参考画面缓冲器166信号168可以包括来自在参考画面缓冲器166中存储的一个或更多个参考画面的数据。

编码器108可以根据模式在帧内信号112和帧间信号114之间进行选择。在帧内编码模式下可以使用帧内信号112以便利用画面内的空间特性。在帧间编码模式下可以使用帧间信号114以便利用画面间的时间特性。当在帧内编码模式下时，可以将帧内信号112提供给减法模块128，并可以将帧内模式信息128提供给熵编码模块130。当在帧间编码模式下时，可以将帧间信号114提供给减法模块128，并且可以将帧间模式信息138提供给熵编码模块130。

在减法模块116处，从源106减去帧内信号112或帧间信号114(取决于模式)，以便产生预测残差118。将预测残差118提供给变换模块120。变换模块120可以压缩预测残差118以产生变换后的信号122，将所述信号122提供给量化模块124。量化模块124量化变换后的信号122，以产生经变换和量化的系数(TOC)126。

将TQC126提供给熵编码模块130以及逆量化模块140。逆量化模块140对TQC126执行逆量化以产生逆量化的信号142，将所述信号142提供给逆变换模块144。逆变换模块144对逆量化的信号142进行解压缩，以产生解压缩后的信号146，将所述信号146提供给重构模块148。

重构模块148可以基于解压缩后的信号146产生重构后的数据150。例如，重构模块148可以重构(修改)画面。可以将重构数据150提供给去块滤波器152以及帧内预测模块和重构缓冲器110。去块滤波器152可以基于重构后的数据150产生经滤波的信号154。

可以将经滤波的信号154提供给采样自适应偏移(SAO)模块156。SAO模块156可以产生提供给熵编码模块130的SAO信息158以及提供给自适应环路滤波器(ALF)162的SAO信号160。ALF162产生提供给参考画面缓冲器166的ALF信号164。ALF信号164可以包括来自可以用作参考画面的一个或更多个画面的数据。在一些情况下，可以省略ALF162。

熵编码模块130可以对TQC126进行编码，以产生比特流134。如上所述，在进行熵编码之前，可以将TQC126转换为1D阵列。此外，熵编码模块130可以使用CAVLC或CABAC来对TQC126进行编码。具体地，熵编码模块130可以基于帧内模式信息128、帧间模式信息138和SAO信息158中的一个或更多个，来对TQC126进行编码。比特流134可以包括已编码画面数据。

在视频压缩(例如，HEVC)中涉及的量化是通过将值的范围压缩为单个量化值实现的有损压缩技术。量化参数(QP)是用于基于重构视频的质量和压缩比二者来执行量化的预定义缩放参数。在HEVC中定义块类型以基于块尺寸及其颜色信息表示给定块的特性。可以在熵编码之前确定QP、分辨率信息和块类型。例如，电子设备102(例如，编码器108)可以确定QP、分辨率信息和块类型，所述QP、分辨率信息和块类型可以被提供给熵编码模块130。

熵编码模块130可以基于TQC126的块来确定块大小。例如，块大小可以是TQC126沿TQC块的一个维度的数目。换言之，TQC126在TQC块中的数目可以等于块大小的平方。此外，所述块可以是非平方的，其中TQC126的数目是块的高度乘以宽度。例如，可以将块大小确定为TQC126在TQC块中的数目的平方根。可以将分辨率定义为像素宽度乘以像素高度。分辨率信息可以包括画面宽度的像素数目、画面高度的像素数目或二者。可以将块大小定义为TQC沿2DTQC块的一个维度的数目。

在一些配置中，可以将比特流134发送到另一电子设备。例如，可以将比特流134提供给通信接口、网络接口、无线发射机、端口等。例如，比特流134可以经由局域网(LAN)、互联网、蜂窝电话基站等发送到另一电子设备。附加地或备选地，比特流134可以存储在电子设备102的存储器中。

图2B是示出了包括可以是高效视频编码(HEVC)解码器的解码器272的电子设备270的一个配置的框图。解码器712以及所示的包括在解码器272中的一个或更多个组件可以实现为硬件、软件或其二者的组合。解码器272可以接收比特流234(例如，包括在比特流234中的一个或更多个编码画面)，以便进行解码。在一些配置中，接收到的比特流234可以包括接收到的开销信息，例如，接收到的分片首部、接收到的画面参数集合(PPS)、接收到的缓冲器描述信息、分类指示符等。

可以通过熵解码模块274对从比特流134接收到的符号(例如，编码TQC)进行熵解码。这样可能产生运动信息信号298以及已解码、变换和量化的系数278。

在运动补偿模块294处，运动信息信号298可以与来自帧存储器290的已解码画面292的一部分组合，从而可以产生帧间预测信号296。可以通过逆变换模块280对已解码、变换和量化的系数(TQC)278进行逆量化和逆变换，从而产生已解码残差信号282。可以通过加法模块207将解码残差信号282与预测信号205相加以产生组合信号284。预测信号205可以是从由运动补偿模块294产生的帧间预测信号296或由帧内预测模块201产生的帧内预测信号203中选择的信号。在一些配置中，所述信号选择可以基于比特流134(例如，由比特流134控制)。

可以根据来自组合信号284(例如，在当前帧中)的先前解码信息来预测帧内预测信号203。还可以通过去块滤波器286来对组合信号284进行滤波。可以将得到的滤波信号288提供给采样自适应偏移(SAO)模块。基于经滤波的信号288以及来自熵解码模块274的信息239，SAO模块231可以产生提供给自适应环路滤波器(ALF)233的SAO信号235。ALF233产生提供给帧存储器290的ALF信号237。ALF信号237可以包括来自可以被用作参考画面的一个或更多个画面的数据。ALF信号237可以被写入帧存储器290。得到的ALF信号237可以包括解码画面。在一些情况下，可以省略ALF233。

帧存储器290可以包括经解码的画面缓冲器(DPB)。帧存储器290还可以包括与已解码画面相对应的开销信息。例如，帧存储器290可以包括分片首部、画面参数集(PPS)信息、循环参数、缓冲器描述信息等。可以从编码器(例如，编码器108)发信号通知这些信息中的一个或更多个。

帧存储器290可以向运动补偿模块294提供一个或更多个已解码画面292。此外，帧存储器290可以提供一个或更多个已解码画面292，所述已解码画面可以是从解码器272输出的。例如，可以将所述一个或更多个已解码画面292呈现在显示器上，存储在存储器中或发送给其他设备。

图1B是示出了电子设备702的视频编码器782的一个配置的框图。图1B的视频编码器782可以是图1A的视频编码器108的一个配置。视频编码器782可以包括增强层编码器706、基本层编码器709、分辨率上升(upscale)方框770和输出接口780。例如，图1B的视频编码器适用于可缩放的视频编码和多视图视频编码，如本文所述。

增强层编码器706可以包括接收输入画面704的视频输入781。可以将视频输入781的输出提供给接收预测选择750的输出的加法器/减法器783。可以将加法器/减法器783的输出提供给变换和量化方框752。可以将变换和量化组方框752的输出提供给熵编码方框748以及缩放和逆变换方框772。在执行熵编码748之后，熵编码方框748的输出可以提供给输出接口780。输出接口780可以输出已编码基本层视频比特流707和已编码增强层视频比特流710。

可以将缩放和逆变换方框772的输出提供给加法器779。加法器779还可以接收预测选择750的输出。可以将加法器779的输出提供给去块方框751。可以将去块方框751的输出提供给参考缓冲器794。可以将参考缓冲器794的输出提供给运动补偿方框754。可以将运动补偿方框754的输出提供给预测选择750。还可以将参考缓冲器794的输出提供给帧内预测器756。可以将帧内预测期756的输出提供给预测选择750。预测选择750还可以接收分辨率上升方框770的输出。

基本层编码器709可以包括视频输入762，视频输入762接收下采样输入画面、或适用于与另一图像组合的其他图像内容、或备选的视图输入画面或相同输入画面703(即，与由增强层编码器706接收的输入画面704相同)。可以将视频输入762的输出提供给编码预测回路764。可以对编码预测回路764的输出进行熵编码766。还可以将编码预测回路764的输出提供给参考缓冲器768。参考缓冲器768可以向编码预测回路764提供反馈。还可以将参考缓冲器768的输出提供给分辨率上升方框770。一旦执行熵编码766，可以将输出提供给输出接口780。

图2B是示出了电子设备802的视频解码器812的一个配置的框图。图2B的视频解码器812可以是图2A的视频解码器272的一个配置。视频解码器812可以包括增强层解码器815和基本层解码器813。视频解码器812还可以包括接口889和分辨率上升870。例如，图2B的视频解码器适用于可缩放的视频解码和多视图视频解码，如本文所述。

接口889可以接收已编码视频流885。经编码的视频流885可以包括基本层已编码视频流以及增强层已编码视频流。可以单独发送或一同发送这两个流。接口889可以向基本层解码器813中的熵解码方框886提供已编码视频流885中的一部分或其全部。可以将熵解码方框886的输出提供给解码预测回路887。可以将解码预测回路887的输出提供给参考缓冲器888。参考缓冲器可以向解码预测回路887提供反馈。参考缓冲器888还可以输出经解码的基本层视频流884。

接口889还可以向增强层解码器815中的熵解码方框890提供经编码的视频流885中的一部分或其全部。可以将熵解码方框890的输出提供给逆量化方框891。可以将逆量化方框891的输出提供给加法器892。加法器892可以将逆量化方框891的输出与预测选择方框895的输出相加。可以将加法器892的输出提供给去块方框893。可以将去块方框893的输出提供给参考缓冲器894。参考缓冲器894可以输出经解码的增强层视频流882。还可以将参考缓冲器894的输出提供给帧内预测器897。增强层解码器815可以包括运动补偿896。可以在分辨率上升870之后，执行运动补偿896。预测选择方框895可以接收帧内预测器897的输出和动作补偿896的输出。

图3A是示出了编码器308和解码器372的一个示例的框图。在该示例中，示出了电子设备A302和电子设备B370。然而，应注意，在一些配置中，可以将结合电子设备A302以及电子设备B370所述的特征和功能组合为一个电子设备。

电子设备A302包括编码器308。编码器308可以实现为硬件、软件或两者的组合。在一个配置中，编码器308可以是高效视频编码(HEVC)编码器。也可以使用其他编码器。电子设备A302可以获得源306。在一些配置中，可以使用图像传感器在电子设备A302上捕获、从存储器取得和/或从另一电子设备接收源306。

编码器308可以对源106进行编码以产生比特流334。例如，编码器308可以对源306中的一系列画面(例如，视频)进行编码。编码器308可以与结合图1A所述的编码器106相似。

比特流334可以包括基于源106的编码画面数据。在一些配置中，比特流334还可以包括开销数据，例如，分片首部信息、PPS信息等。当对源306中的附加画面编码时，比特流334可以包括一个或更多个已编码画面。

可以将比特流334提供给解码器372。在一个示例中，可以使用有线或无线链路将比特流334传输到电子设备B370。在一些情况下，这可以通过网络(例如，互联网或局域网(LAN))来完成。如图3A所示，可以将解码器372实现在电子设备B102上，与电子设备A302上的解码器308相分离。然而，应注意，在一些配置下，可以将编码器308和解码器372实现在相同电子设备上。在将编码器308和解码器372实现在相同电子设备上的实现方案中，例如，可以通过总线将比特流334提供给解码器372或将其存储在存储器中以便由解码器372取得。解码器372可以提供已解码画面392输出。

可以将解码器372实现为硬件、软件或二者的组合。在一个配置中，解码器372可以是高效视频编码(HEVC)解码器。可以使用其他解码器。解码器372可以与结合图2A所述的解码器272相似。

图3B是示出了编码器908和解码器972的另一示例的框图。在该示例中，示出了电子设备A902和电子设备B970。然而，应注意，在一些配置中，可以将结合电子设备A902以及电子设备B970所述的特征和功能合并为一个电子设备。

电子设备A902包括编码器908。编码器908可以包括基本层编码器910和增强层编码器920。编码器908适用于可缩放的视频编码和多视图视频编码。编码器908可以实现为硬件、软件或两者的组合。在一个配置中，编码器908可以是高效视频编码(HEVC)编码器，包括可缩放和/或多视图。也可以使用其他编码器。电子设备A902可以获得源906。在一些配置中，可以使用图像传感器在电子设备A902上捕获、从存储器取得和/或从另一电子设备接收源906。

编码器908可以对源906进行编码以产生基本层比特流934和增强层比特流936。例如，编码器908可以对源906中的一系列画面(例如，视频)进行编码。具体地，对于针对SNR可缩放性(也称作质量可缩放性)的可缩放视频编码，可以向基本层和增强层编码器提供相同源906。具体地，对于针对空间可缩放性的可缩放视频编码，可以将下采样源用于基本层编码器。具体地，对于多视图编码，可以将不同视图源用于基本层编码器和增强层编码器。编码器908可以与结合图1B所述的编码器782相似。

比特流934、936可以包括基于供源906的已编码画面数据。在一些配置中，比特流934、936还可以包括开销数据，例如，分片首部信息、PPS信息等。当对源906中的附加画面编码时，比特流934、936可以包括一个或更多个已编码画面。

可以将比特流934、936提供给解码器972。解码器972可以包括基本层解码器980和增强层解码器990。视频解码器972适用于可缩放视频解码和多视图视频解码。在一个示例中，可以使用有线或无线链路将比特流934、936传输到电子设备B970。在一些情况下，这可以通过网络(例如，互联网或局域网(LAN))来完成。如图3B所示，可以将解码器972实现在电子设备B970上，与电子设备A902上的解码器908相分离。然而，应注意，在一些配置下，可以将编码器908和解码器972实现在相同电子设备上。在将编码器908和解码器972实现在相同电子设备上的实现方案中，例如，可以通过总线将比特流934、936提供给解码器972或将其存储在存储器中以便由解码器972取得。解码器972可以提供已解码基本层画面992和已解码增强层画面994，作为输出。

可以将解码器972实现为硬件、软件或二者的组合。在一个配置中，解码器972可以是高效视频编码(HEVC)解码器，包括可缩放和/或多视图。可以使用其他解码器。解码器972可以与结合图2B所述的解码器812相似。

图4示出了可以在电子设备409中使用的多种组件。可以将电子设备109实现为一个或更多个电子设备。例如，可以将电子设备409实现为以上结合图1A和1B所述的电子设备102，实现为以上结合图2A和2B所述的电子设备270，或二者。

电子设备409包括控制电子设备409的操作的处理器417。处理器417还可以被称作CPU。存储器411向处理器417提供指令413a(例如，可执行指令)和数据415a，所述存储器411可以包括只读存储器(ROM)、随机存取存储器(RAM)或可以存储信息的任何类型的设备。存储器411的一部分还可以包括非易失性随机存取存储器(NVRAM)。存储器411可以与处理器417电子通信。

指令413b和数据415b还可以驻留在处理器417中。被加载到处理器417的指令413b和/或数据415b还可以包括来自存储器411的指令413a和/或数据415a，加载所述指令413a和/或数据415a以便通过处理器417来执行或处理。可以通过处理器417执行所述指令413b以实现本文所公开的一个或更多个技术。

电子设备409可以包括一个或更多个通信接口419，用于与其它电子设备进行通信。通信接口419可以基于有线通信技术、无线通信技术或二者。通信接口419的示例包括串行端口、并行端口、通用串行总线(USB)、以太网适配器、IEEE1394总线接口、小型计算机系统接口(SCSI)总线接口、红外(IR)通信端口、蓝牙无线通信适配器、符合第三代合作伙伴计划(3GPP)规范的无线收发机等。

电子设备409可以包括一个或更多个输出设备423以及一个或更多个输入设备421。输出设备423的示例包括扬声器、打印机等。可以包括在电子设备409中的一种类型的输出设备是显示设备425。使用本文所公开的配置的显示设备425可以使用任何适合的图像投影技术，例如，阴极射线管(CRT)、液晶显示器(LCD)、发光二极管(LED)、气体等离子体、电致发光等。可以提供显示控制器427用于将存储在存储器411中的数据转换为示出在显示器425上的文本、图形和/或运动图像(视情况而定)。输入设备421的示例包括键盘、鼠标、麦克风、遥控设备、按钮、操控杆、轨迹球、触摸板、触摸屏、激光笔等。

将电子设备409的多种组件通过总线系统429耦接在一起，其中除了数据总线之外，所述总线系统429还可以包括电力总线、控制信号总线和状态信号总线。然而，为了清楚，图4将多种总线示出为总线系统429。图4所示的电子设备409是功能框图，而不是特定组件的列表。

术语“计算机可读介质”指可以由计算机或处理器访问的任何可用介质。如本文所用，术语“计算机可读介质”可以表示非暂时性的且有形的计算机和/或处理器可读介质。例如而非限制性地，计算机可读或处理器可读介质可以包括：RAM、ROM、EEPROM、CD-COM或其它光学存储设备、磁盘存储设备或其它磁性存储器件、或可以用于携带或存储所需程序代码(以指令或数据结构形式)并可通过计算机或处理器访问的任何其它介质。如本文所用，磁盘和光盘包括：压缩盘(CD)、激光盘、光盘、数字多功能盘(DVD)、软盘和蓝光(注册商标)盘，其中磁盘通常磁性地再现数据，而光盘用激光光学地再现数据。解码器和/或编码器的代码可以存储在计算机可读介质上。

包括多个已编码树块(例如，通常称作块)的输入画面可以被分为一个或若干个分片。假定在编码器和解码器处使用的参考画面是相同的且去块滤波不使用分片边界两端的信息，则可以正确地对在分片所代表的画面区域中的采样值进行解码，而不是用来自其它分片的数据。因此，对分片进行的熵解码和块重构不依赖于其它分片。具体地，可以在每一分片的起始重置熵编码状态。当限定邻域可用于进行熵解码和重构时，可以将其它分片中的数据标记为是不可用的。可以并行地对分片进行熵解码和重构。优选地，不允许在分片的边界上进行帧内预测和运动矢量预测。相反，去块滤波可以使用在分片边界上的信息。

图5示出了在水平方向上包括11个块且在垂直方向上包括9个块的示例视频画面500(9个示例块被标记为501-509)。图5示出了三个示例分片：第一分片表示为“SLICE#0”520、第二分片表示为“SLICE#1”530且第三分片表示为“SLICE#2”540。解码器可以并行地对三个分片520、530、540进行解码和重构。可以按照扫描线顺序依次地传输每一分片。当开始针对每一分片的去块/重构处理时，初始化或重置上下文模型，并将其它分片中的块标记为不可用于熵解码和块重构。上下文模型通常代表熵编码器和/或解码器的状态。因此，对于在“SLICE#1”中的块，例如，标记为503的块，无法将“SLICE#0”中的块(例如，标记为501和502的块)用于上下文模型选择或重构。相反，对于在“SLICE#1”中的块，例如，标记为505的块，可以将“SLICE#1”中的其他块(例如，标记为503和504的块)用于上下文模型选择或重构。因此，在分片内连续地进行熵解码和块重构。除非使用灵活块排序(FMO)来限定多个分片，否则以栅格扫描的顺序处理分片内的多个块。

图6描述了分为三个分片组的示例块分配：第一分片组表示为“SLICEGROUP#0”550、第二分片组表示为“SLICEGROUP#1”560且第三片组表示为“SLICEGROUP#2”570。这些分片组550、560、570可以分别与画面580中的两个前景区域和一个背景区域相关。

可以将如图5所示的分片排列限制为以图像扫描顺序(也称作栅格扫描或栅格扫描顺序)在一对块之间定义每一分片。尽管这种扫描顺序的分片排列是计算高效的，但是不是为了用于高效地并行编码和解码。此外，这种扫描顺序定义的分片也不是用于将图像的较小的局部区域聚集在一起，其中这些区域可能具有非常适用于进行高效编码的通用特性。尽管如图6所示的分片排列在其排列上是非常灵活的，但是不是为了用于高效地进行并行编码或解码。此外，这种高灵活性定义的分片是计算上复杂的，以便实现在解码器中。

参考图7，瓦片技术将图像分为矩形(包括方形)区域集合。以栅格扫描顺序对每一瓦片内的块(备选地，在一些系统中称作最大编码单元或编码树块)进行编码和解码。类似地，以栅格扫描顺序对瓦片排列进行编码和解码。因此，可能存在任意适合数目的列边界(例如，0个或更多个)，可能存在任意适合数目的行边界(例如，0个或更多个)。因此，所述帧可以定义一个或更多个分片，诸如图7所示的一个分片。在一些实施例中，不能将位于不同瓦片内的块用于进行帧内预测、动作补偿、熵编码上下文选择或依赖于邻域块信息的其它处理。

参考图8，示出了将图像分为三个矩形列的集合的瓦片技术。以栅格扫描顺序对每一瓦片内的块(备选地，在一些系统中也被称作最大编码单元或编码树块)进行编码和解码。类似地，以栅格扫描顺序对瓦片进行编码和解码。可以以瓦片的扫描顺序来限定一个或更多个瓦片。可对每一分片进行独立解码。例如，分片1可以定义为包括块1-9，分片2可以定义为包括块10-28，片3可以定义为包括跨度了三个瓦片的块29-126。使用瓦片有助于通过处理在更局部区域帧中的数据，来提高编码效率。

应理解，在一些情况下，视频编码可以可选地不包括瓦片，并可以可选地包括针对视频的帧使用波前编码/解码模式。因此，可以以并行方式对一排或更多排的视频(诸如，多个一行或更多行的宏块(或备选地，编码树块)组)进行编码/解码，其中每一组代表波前子流。通常，可以以任何适合方式构造对视频的划分。

视频编码标准通常压缩视频数据，以便通过具有有限带宽和/或有线存储容量的信道进行传输。这些视频编码标准包括多个编码阶段，例如，帧内预测、从空间域到频域的变换、量化、熵编码、运动估计和运动补偿，以便更有效地对帧进行编码和解码。许多编码和解码阶段在计算上是过分复杂的。

视频比特流可以包括位于逻辑数据分组(通常被称作网络抽象层(NAL)单元)中的语法结构。每一NAL单元包括用于标识相关数据有效载荷的目的的NAL单元首部，例如，双字节NAL单元首部(例如，16比特)。例如，可以在一个或更多个分片(和/或画面)NAL单元中对每一已编码分片(和/或画面)进行编码。可以包括针对其它分类数据的其他NAL单元，诸如例如辅助增强信息，时域子层接入(TSA)画面的已编码分片，逐步时域子层接入(STSA)画面的已编码分片，非TSA、非STSA尾随画面(trailingpicture)的已编码分片，断点连接接入画面的已编码分片，即时解码的刷新画面的已编码分片，完全随机接入画面的已编码分片，随机接入可解码前导画面的已编码分片、随机接入跳转前导画面的已编码分片、视频参数集、序列参数集、画面参数集、接入单元分隔符、序列末尾、比特流末尾、填充数据和/或序列增强信息消息。下表1示出了NAL单元代码和NAL单元类型分类的一个示例。可以根据需要包括其他NAL单元类型。应注意，可以对表1所示的NAL单元的NAL单元类型进行重组和重新分配。此外，可以添加其他NAL单元类型。此外，可以去除一些NAL单元类型。

表1——NAL单元类型代码和NAL单元类型分类

NAL提供将代表画面内容的视频编码层(VCL)数据映射到多种传输层的能力。根据NAL单元是否包含编码画面或其他关联数据，NAL单元可以被分别分为VCL和非VCLNAL单元。B.Bros，W-J.Han、J-R.Ohm、G.J.Sullivan和T-.Wiegand的“Highefficiencyvideocoding(HEVC)textspecificationdraft8”，JCTVC-J10003，Stockholm，2012年7月(下文中称为“HEVCDraft8”)中通过全文引用合并于此。B.Bros、W-J.Han、J-R.Ohm、G.J.Sullivan、Wang和T-.Wiegand的“Highefficiencyvideocoding(HEVC)textspecificationdraft10(forDFIS&LastCall)”，JCTVC-J10003_v34，Geneva，2013年1月通过全文引用合并于此。B.Bros、W-J.Han、J-R.Ohm、G.J.Sullivan、Wang和T-.Wiegand的“Highefficiencyvideocoding(HEVC)textspecificationdraft10”JCTVC-L1003，Geneva，2013年1月通过全文引用合并于此。

为了实现随机接入和比特流接合，IDR接入单元包含帧内画面，即，可以在不对NAL单元流中的任何先前画面进行解码的前提下对其进行解码的已编码画面。此外，存在IDR接入单元表示比特流中的后续画面不需要参考在所包含的帧内画面之前的画面，以便进行解码。

IDR接入单元可以表示仅包含I分片的IDR画面，可以是在解码顺序下比特流中的第一画面，或可以随后出现在比特流中。每个IDR画面是在解码顺序下编码视频序列(CVS)的第一画面。当IDR画面的VCLNAL单元的nal_unit_type等于IDR_W_RADL时，它可以具有关联RADL画面。当针对IDR画面的每一VCLNAL单元的nal_unit_type等于IDR_N_LP时，它不具有任何关联前导画面。IDR画面不具有关联RASL画面。

BLA接入单元是指仅包括I分片的BLA画面，可以在解码顺序下比特流中的第一画面，或可以随后出现在比特流中。每个BLA画面开始新的CVS，与IDR画面在解码处理上具有相同效果。然而，BLA画面包含定义非空RPS的语法元素。当BLA画面的每一VCLNAL单元的nal_unit_type等于BLA_W_LP时，它可以具有相关RASL画面，该画面不是通过解码器输出可以是不可解码的，这是由于它们可能包含对在比特流中不存在的画面的参考。当针对BLA画面的每一VCLNAL单元的nal_unit_type等于BLA_W_LP时，它可能同样具有关联RADL画面，其中该画面用于进行解码。当针对BLA画面的每一VCLNAL单元的nal_unit_type等于BLA_W_RADL时，它不具有任何关联RASL画面，但是可能具有关联RADL画面。当针对BLA画面的每一VCLNAL单元的nal_unit_type等于BLA_N_LP时，它不具有任何关联前导画面。

清楚随机接入(clearrandomaccessCRA)画面语法规定在随机接入点(RAP)的位置处使用帧内画面，即，在比特流中的解码器可以开始对画面进行成功解码的位置，而无需对在比特流中之前呈现的任意画面进行解码。支持随机接入实现高效的信道切换，寻找操作和动态流传输服务。当开始对CRA画面进行解码时，在解码顺序中位于CRA画面之后并且在显示顺序(输出顺序)中位于CRA画面之前的一些画面可以包含对在解码器处不可用的画面的帧间画面预测参考。解码器丢弃这些不可解码的画面，其中解码器在CRA点处开始其解码处理。这种不可解码的画面被表示为随机接入跳过前导(RASL)画面。可以通过间断链接接入(BLA)画面来表示来自不同初始编码比特流的接合点的位置。可以通过将一个比特流中的CRA画面的NAL单元类型改变为指示BLA画面的值，并联系在另一比特流中的RAP画面的位置处的新比特流，来执行比特流拼接操作。RAP画面可以是IDR、CRA或BLA画面，在比特流中CRA和BLA画面二者都跟随RASL画面(取决于BLA画面使用的NAL单元类型的特定值)，联系在另一比特流中的RAP画面位置处的新比特流。解码器与BLA画面相关联的RASL画面，这是由于它们可能因为接合操作而参考在比特流中实际不存在的画面。在解码顺序中可以在RAP画面之后且输出顺序中在其之前的另一类型的画面是随机接入可解码前导画面(RADL)，其中不包含对在解码顺序中在RAP画面之前的任何画面的参考。将RASL和RADL画面统称作前导画面(LP)。在解码顺序和输出顺序二者中都在RAP画面之后的画面被称作尾随画面，不包含对LP的参考以便帧间画面预测。

为了进行多个参考画面管理，先前编码的画面的特定集合需要存在于解码画面缓冲器(DPB)中(参见，图lA的参考画面缓冲器166以及图2A的帧存储器290)，以便对比特流中的其他画面进行解码。为了标识这些画面，在每一分片首部中传送画面顺序计数(POC)指示符的列表。pic_order_cnt_lsb语法元素规定当前画面的画面顺序计数模数(modulo)MaxPicOrderCntLsb。pic_order_cnt_lsb语法元素的长度是log2_max_pic_order_cnt_lsb_minus4+4比特。pic_order_cnt_lsb的值的范围为0到MaxPicOrderCntLsb-1(包含0和MaxPicOrderCntLsb-1在内)。log2_max_pic_order_cnt_lsb_minus4规定了在对画面顺序计数的解码处理中使用的变量MaxPicOrderCntLsb的值，如下所示：

MaxPicOrderCntLsb＝2(log2_max_pic_order_cnt_lsb_minus4+4)(0-1)

log2_max_pic_order_cnt_lsb_minus4的值的范围是0到12(包含在内)。

参考画面集(RPS)是与画面相关的参考画面的集合，包括解码顺序中在相关画面之前的所有参考画面，可以用于对相关画面或解码顺序中在相关画面之后的任何画面进行帧内预测。图9示出了针对时域预测结构的示例POC值、解码顺序和RPS。在该示例中，所示的RPS值表示针对PRS的实际POC值。在其他情况下，代替POC值，画面POC值相对当前画面POC的差值，可以将发信号通知当前画面和参考是否使用所指画面的指示符存储在RPS中。

由于IDR画面不要求任何先前画面以便进行解码，pic_order_cnt_lsb语法元素的画面顺序可以被表示为0，因此，减小比特流的比特速率。通过被设置为1的first_slice_in_pic_flag来发信号通知画面在解码顺序中的第一分片。因此，值等于1的语法元素first_slice_in_pic_flag用作边界，以便在背对背地发送两个或更多个IDR画面的情况下识别IDR画面的起始。然而，在一些情况下，不可能区分在视频层属于背对背发送的IDR画面的片。第一个这种情况是数据分组顺序错乱地到达解码器。第二个这种情况是丢失含有IDR画面第一片的数据分组。此外，当通过帧内编码将编码视频序列的所有画面发信号通知为IDR画面时(例如，当使用所有帧内属性)，所有画面的pic_order_cnt_lsb值为0。因此，为了允许解码器区分特定IDR画面与另一IDR画面，该系统应发信号通知针对每个画面的不同pic_order_cnt_lsb值。此外，与IDR画面相似且仅具有I分片的BLA画面可以发信号通知pic_order_cnt_lsb元素的非零值。

参考图10，为了增加解码器在对比特流进行解码时的鲁棒性，应发信号通知针对IDR画面的pic_order_cnt_lsb语法元素。在图10所示的分片首部的实施例中，pic_order_cnt_lsb规定了针对当前画面的画面顺序计数模数MaxPicOrderCntLsb。pic_order_cnt_lsb语法元素的长度是log2_max_pic_order_cnt_lsb_minus4+4比特。pic_order_cnt_lsb的值的范围是0到MaxPicOrderCntLsb-1(包括0和MaxPicOrderCntLsb-1在内)。

备选技术方案应包括：不发信号通知针对BLA画面的pic_order_cnt_lsb语法元素，因此推断为0以便符合IDR信令。因此，优选地，将IdrPicFlag派生(derivation)改变为还包括BLA。此外，优选地将IdrPicFlag重新命名为IdrBlaPicFlag。附加地，优选地针对BLA画面修改PicOrderCntVal计算。备选地，可以在保持IdrPicFlag的同时，包括新标志IdrBlaPicFlag。

通常，如果画面是IDR画面，则IdrPicFlag为真或1。否则则为假或零。在一种情况下，将变量IdrPicFlag指定为：

IdrPicFlag＝(nal_unit_type＝＝IDR_W_RADL||nal_unit_type＝＝IDR_N_LP)，其中nal_unit_type表示NAL单元类型。

通常，如果画面是IDR画面或BLA画面，则IdrBlaPicFlag应为真或1。否则，则为假或零。在一种情况下，将变量IdrBlaPicFlag指定为IdrBlaPicFlag＝(nal_unit_type＝＝IDR_W_RADL||nal_unit_type＝＝IDR_N_LP||nal_unit_type＝＝BLA_W_LP||nal_unit_type＝＝BLA_W_LP||nal_unit_type＝＝BLA_N_LP)，其中nal_unit_type表示NAL单元类型。

由于BLA画面仅包含I分片并且可以是比特流在解码顺序中的第一画面，或BLA画面可以随后存在于比特流中，可以使用这种备选技术。每一BLA画面开始新编码视频序列，与IDR画面对编码处理具有相同作用，如上所述。因此，发信号通知针对BLA和IDR画面的pic_order_cnt_lsb值的方式相同将允许解码器对BLA和IDR画面进行相似地处理。

参考图11，为了增加解码器在对比特流解码和处理IDR与BLA画面时的一致性，可以在除了IDR画面或BLA画面的画面(例如，！IdrBLAPicFlag)的分片片首部中发信号通知pic_order_cnt_lsb语法元素。

参考图12，为了增加解码器在对比特流解码和处理IDR与BLA画面时的一致性，可以在除了IDR画面或BLA画面的画面(例如，！IdrBLAPicFlag)的分片首部中发信号通知pic_order_cnt_lsb语法元素。针对除了IDR画面之外的画面(！IdrPicFlag)，可以发信号通知分片首部的其他部分。因此，可以针对BLA画面发信号通知分片首部的其他部分。

参考图13，pic_order_cnt_lsb语法元素可以在分片首部的起始。在分片首部起始的pic_order_cnt_lsb字段更易于使得能够在片首部中首先检查到该字段，以便在对片内的其他语法元素进行语义分析之前，知道该分片属于哪个画面。这在画面可能顺序错乱地到达和/或丢失了画面的环境下是有用的。

可缩放视频编码是对视频比特流进行编码的技术，其中视频比特流还包含一个或更多个子集比特流。可以通过从较大视频提取分组数据，来得到子集视频比特流，从而减小自己比特流所需的带宽。子集比特流可以代表较低的空间分辨率(较小屏幕)、较低的时域分辨率(较低的帧速率)、或较低质量的视频信号。例如，视频比特流可以包括5个子集比特流，其中子集比特流中的每个将附加内容添加到基本比特流。Hannuksela等人的“TestModelforScalableExtensionsofHighEfficiencyVideoCoding(HEVC)”，JCTVC-L0453，Shanghai，2012年10月通过全文引用合并于此。Chen等人的“SHVCDraftText1”，JCTVC-L1008，Geneva，2013年3月通过全文引用合并于此。在以下文献中进行了附加描述：J.Chen、J.Boyce、Y.Ye、M.M.Hannuksela的“SHVCDraftText2”，JCTVC-M1008，Incheon，2013年5月；G.Tech、K.Wegner、Y.Chen、M.Hannuksela、J.Boyce的“MV-HEVCDraftText4(ISO/IEC23008-2：201x/PDAM2)”，JCTVC-D1004，Incheon，2013年5月；以及K.Suhring、R.Skupin、G.Tech、T.Schierl、K.Rapaka、W.Pu、X.Li、J.Chen、Y.-K.Wang、M.Karczewicz、K.Ugur、M.M.Hannuksela；其中这些文献中的每一个都通过全文引用合并于此。

多视图视频编码是对视频比特流进行编码的技术，其中该视频比特流还包含一个或更多个代表备选视图的其他比特流。例如，多视图可以使针对立体视频的一对视图。例如，多视图可以代表不同视角对同一场景的多个视图。多视图通常包含大量视图间统计依赖性，这是由于图像是不同视角下的同一场景。因此，合并后的时域和视图间预测可以实现高效的多视图编码。例如，可以不仅根据时域相关帧，而且根据相邻视角帧，来高效地预测帧。Hannuksela等人的“Commonspecificationtextforscalableandmulti-viewextensions”，JCTVC-L0452，Geneva，2013年1月通过全文引用合并于此。Tech等人的“MV-HEVCDraftText3(ISO/IEC23008-2：201x/PDAM2)”，JCT3V-C1004_d3，Geneva，2013年1月通过全文引用合并于此。

参考图14，视频参数集是描述与视频序列相关的内容的语法。通过许多语法元素来规定视频参数集语法，以下描述许多语法元素中的一部分。

vps_extension_offset规定了从NAL单元的起点开始到VPSNAL单元中的下一组固定长度编码信息的字节偏移。非基本层的VPS信息或视图可以从VPSNAL单元的字节对准位置开始，具有用于会话谈判和/或容量交换的固定长度编码信息。由vps_extension_offset规定的字节偏移应有助于布置和接入VPSNAL单元中的信息，而无需进行熵解码。

vps_extension_flag等于0表明在VPSRBSP语法结构中不存在vps_extension()语法结构。vps_extension_flag等于1表明在VPSRBSP语法结构中存在vps_extension()语法结构。当vps_max_layers_minusl大于0时，vps_extension_flag等于1。

vps_extension2_flag等于0表明在VPSRBSP语法结构中不存在vps_extension_data_flag语法元素。解码器应忽略VPSNAL单元中在值为1的vps_extension2_flag之后的数据。

因此，视频参数集语法可以使用vps_extension_flag标识出存在具有附加特性的扩展。参考图15A和15B，视频参数集扩展语法(例如，vps_extension())描述了与视频参数集序列相关的附加语法元素或元数据。由许多语法元素来规定视频参数集扩展语法，以下描述语法元素中的一部分。

vps_extension_byte_alignment_reserved_one_bit可以等于1。

avc_base_layer_flag等于1表明基本层符合ITU-TH.264|ISO/IEC14496-10，avc_base_layer_flag等于0表明符合另一规定，诸如这里所述的规定。

Splitting_flag等于1可以表示根据dimension_id_len_minus1[i]语法元素的值，将在NAL单元首部中的nuh_layer_id语法元素的比特拆分为具有一定比特长度的n个片段，且n个片段与在scalability_mask_flag[i]中指出的n个可缩放性维度相关联。当splitting_flag等于1时，第i层的nuh_layer_id的第j片段的值可以等于dimension_id[i][j]的值。splitting_flag等于0可以不表示上述限制。

当splitting_flag等于1时，即，可以服从以下所述的在dimension_id[i][j]语法元素的语义中报告的限制，可以通过比特掩码拷贝，从NAL单元首部中的nuh_layer_id语法元素得到可缩放指示符，备选地，在dimension_id[i][j]语法元素的语句中报告的派生。通过在dimension_id_len_minus1[j]的语句中规定的dimension_id_len_minus1[i]语法元素和dimBitOffset[i]的值，来定义第i个可缩放性维度的相应比特掩码。

scalability_mask_flag[i]等于1可以表示存在与表格F-1中的第i个可缩放维度相对应的dimension_id语法元素。scalability_mask_flag[i]等于0可以表示不存在与第i个可缩放性维度相对应的dimension_id语法元素。

在一个实施例中，scalability_maskindex0可以表示可缩放性维度“多视图”，并可以映射到“ViewId”的ScalabilityId。在一个实施例中，scalability_maskindex1可以表示可缩放维度“空间/SNR可缩放性”，并可以映射到“DependencyId”的ScalabilityId。在一个实施例中，范围在2到15(包括2和15在内)的scalability_mask索引可以表示在将来定义的保留的可缩放性。

dimension_id_len_minusl[j]plus1可以表示dimension_id[i][j]语法元素的比特长度。变量dimBitOffset[0]被设置为等于0，对于在1到(NumScalabilityTypes-splitting_flag)(包括1和(NumScalabilityTypes-splitting_flag在内)范围内的j，如下所示地得到dimBitOffset[j]：

\dim B i t O f f s e t [j] Σ_{\dim I d x = 0}^{j = 1} (\dim e n s i o n_i d_l e n_\min u s 1 [\dim I d x] + 1) - - - (F - 1)

当不存在dimension_id_len_minus1[NumScalabilityTypes-1]时，可以应用如下值：

-将dimension_id_len_minus1[NumScalabilityTypes-1]的值推断为等于5-dimBitOffset[NumScalabilityTypes-1]。

-将dimBitOffset[NumScalabilityTypes]设置为等于6。

vps_nuh_layer_id_present_flag可以表示是否存在layer_id_in_nuh[i]语法。

layer_id_in_nuh[i]可以表示在第i层的VCLNAL单元中的nuh_layer_id语法元素的值。对于范围在0到vps_max_layers_minus1(包括0和vps_max_layers_minus1在内)的i，当不存在layer_id_in_nuh[i]时，将layer_id_in_nuh[i]的值推断为等于1。

当i大于0时，layer_id_in_nuh[i]应大于layer_id_in_nuh[i-1]。

对于范围在0到vps_max_layers_minus1(包括0和vps_max_layers_minus1在内)的i，将变量LayerIdxInVps[layer_id_in_nuh[i]]设置为等于i。

dimension_id[i][j]可以表明第i层的第j个存在的可缩放性维度类型的指示符。用于表示dimension_id[i][j]的比特的数目是dimension_id_len_minus1[j]+1比特。当针对0到NumScalabilityTypes-1(包括0和NumScalabilityTypes-1在内)范围内的j不存在dimension_id[i][j]时，将dimension_id[i][j]推断为等于((ayer_id_in_nuh[i]&((1＜＜dimBitOffset[j+1])-1))＞＞dimBitOffset[j])。

如下所述地得到规定第i层的第smIdx个可缩放性维度类型的指示符的变量ScalabilityId[i][smIdx]、规定第i层的视图指示符的变量ViewId[layer_id_in_nuh[i]]、规定第i层是否是观看可缩放性扩展层的变量ViewScalExtLayerFlag以及规定第i层空间/SNR可缩放性指示符的DependencyId[layer_id_in_nuh[i]]：

vps_profile_present_flag[i]等于1表示在第i层profile_tier_level()语法结构中存在针对层组i的简档和层叠(tier)信息。vps_profile_present_flag[i]等于0表示在第i层profile_tier_level()语法结构中不存所述简档和层叠信息。

profile_ref_minus1[i]表明将针对第i个profile_tier_level()语法结构的简档和层叠信息推断为等于针对第(profile_ref_minusl[i]+1)层组的简档和层叠信息。profile_ref_minusl[i]+1的值应小于i。

more_output_layer_sets_than_default_flag等于1表示由VPS表示的输出层组的数目大于vps_number_layer_sets_minusl+1。more_output_layer_sets_than_default_flag等于0表示由VPS表示的输出层组的数目等于vps_number_layer_sets_minusl+1。

num_add_output_layer_sets_minuslplus1表示除了由VPS规定的默认输出层组之外的输出层组的数目。默认输出层组表示由VPS规定的第一vps_number_layer_sets_minusl+1输出层组。对于默认输出层组，只有最高层是目标输出层或所有层都是目标输出层。

default_one_target_output_layer_flag等于1表示在每一默认输出层组中仅最高层是目标输出层。default_one_target_output_layer_flag等于0表示在每一默认输出层组中所有层都是目标输出层。

output_layer_set_idx_minus1[i]plus1指示针对第i输出层组的层组的索引。output_layer_set_idx_minus1[i]的值的范围应在0到vps_num_layer_sets_minusl-1(包括0和vps_num_layer_sets_minus1-1在内)。output_layer_set_idx_minus1[i]语法元素的长度是Ceil(Log2(vps_num_layer_sets_minus1))比特。

将第i输出层组的层组推断为第i层组，其中i的范围是0到vps_num_layer_sets_minus1(包括0和vps_num_layer_sets_minus1在内)。

output_layer_flag[i][j]等于1表示在第i输出层组的第j层是目标输出层。output_layer_flag[i][j]等于0表示在第i输出层组的第j层不是目标输出层。

profile_level_tier_idx[i]表明了在VPS内的profile_tier_level()语法结构的列表中，向第i层输出层组应用的profile_tier_level()语法结构的索引。profile_level_tier_idx[i]语法元素的长度是Ceil(Log2(vps_num_profile_tier_level_minus1+1))比特。将profile_level_tier_idx[0]的值推断为等于0。profile_level_tier_idx[i]的值的范围应在0到vps_num_profile_tier_level_minus1(包括0和vps_num_profile_tier_level_minus1在内)。

max_one_active_ref_layer_flag等于1表示至多将一个画面用于对CVS中的每一画面进行层间预测。max_one_active_ref_layer_flag等于0表示至多将多于一个的画面用于对CVS中的每一画面进行层间预测。

direct_dep_type_len_minus2+2表示direct_dependency_type[i][j]语法要素的比特的数目。在符合本说明书版本的比特流中，direct_dep_type_len_minus2的值应等于0。尽管在本说明书的版本中direct_dep_type_len_minus2的值应等于0，然而解码器应允许范围在0到30(包括0和30在内)的direct_dep_type_len_minus2的其他值出现在语法中。

direct_dependency_type[i][j]直接用于得到变量NumSamplePredRefLayers[i]、NumMotionPredRefLayers[i]、SamplePredEnabledFlag[i][j]和MotionPredEnabledFlag[i][j]。在符合本说明书的版本的比特流中，direct_dependency_type[i][j]应在0到2的范围内(包括0和2在内)。尽管在本说明书的版本中direct_dependency_type[i][j]的值的范围应为0到2(包括0和2在内)，然而解码器应允许范围在3到232-2(包括3和232-2在内)的direct_dependency_type[i][j]的值出现在语法中。

如下所示，可以得到变量NumSamplePredRefLayers[i]、NumMotionPredRefLayers[i]、SamplePredEnabledFlag[i][j]、MotionPredEnabledFlag[i][j]、NumDirectRefLayers[i]、DirectRefLayerIdx[i][j]、RefLayerId[i][j]、MotionPredRefLayerId[i][j]和SamplePredRefLayerId[i][j]：

当avc_base_layer_flag等于1时，比特流一致性的要求是对于iNuhLId，MotionPredRefLayerId[iNuhLId][mIdx]应不等于0，其中iNuhLId等于在比特流中存在的nuh_layer_id的任意值与范围在0到NumMotionPredRefLayers[iNuhLId]-1(包括0和NumMotionPredRefLayers[iNuhLId]-1在内)的mIdx的任意值。

single_layer_for_non_irap_flag等于1表示接入单元的所有VCLNAL单元都具有相同的nuh_layer_id值，或通过接入单元的VCLNAL单元使用两个nuh_layer_id值且具有较大nuh_layer_id的画面是IRAP画面。single_layer_for_non_irap_flag等于0表示nuh_layer_id值可以或可以不受在这种推荐|国际标准的其他部分中规定的限制约束。

在JCTVC-M1008和JCT3VD-1004中，包括以下限制。当对于编码画面nal_unit_type值nalUnitTypeA等于IDR_W_DLP、IDR_N_LP、BLA_W_LP、BLA_W_DLP或BLA_N_LP时，对于同一接入单元的所有编码画面的所有VCLNAL单元，nal_unit_type值应等于nalUnitTypeA。

接入单元(AU)是指网络抽象层(NAL)单元组，其中所述网络抽象层(NAL)单元组根据指定分类规则彼此关联，在解码顺序上是连续的，并包括与同一输出时间相关联的所有编码画面的视频编码层(VCL)NAL单元和它们相关的非VCLNAL单元。基本层是所有VCLNAL单元的nuh_layer_id等于0的层。编码层是对包括nuh_layer_id为特定值的VCLNAL单元的画面的编码表示，并该画面的所有编码树单元。在一些情况下，编码画面可以被称作层分量。以下结合图9和10给出了关于步骤是基于画面的或基于接入单元(AU)的其他详情。

图15C是示出了当第二增强层(EL2)942b的画面速率比基本层(BL)944和第一增强层(EL1)942a低时，针对多层的编码画面的网络抽象层(NAL)单元和接入单元(AU)的结构和时序的框图。沿第一增强层(EL1)942a示出了EL1已编码画面953a的NAL单元。沿第二增强层(EL2)942b示出了EL2已编码画面953b的NAL单元。沿基本层(BL)944示出了基本层已编码画面953c的NAL单元。

在t1时，EL1已编码画面953a的NAL单元、EL2已编码画面953b的NAL单元以及基本层已编码画面953c的NAL单元是接入单元(AU)522a的一部分。在t2时，EL1已编码画面953a的NAL单元以及基本层已编码画面953c的NAL单元是接入单元(AU)955b的一部分。在t3时，EL1已编码画面953a的NAL单元、EL2已编码画面953b的NAL单元以及基本层已编码画面953c的NAL单元是接入单元(AU)955c的一部分。在t4时，EL1已编码画面953a的NAL单元以及基本层已编码画面953c的NAL单元是接入单元(AU)955d的一部分。

图15D是示出了当基本层(BL)1044的画面速率比第一增强层(EL1)1042a和第二增强层(EL2)1042b低时，针对多层的编码画面的网络抽象层(NAL)单元和接入单元(AU)的结构和时序的框图。沿第一增强层(EL1)1042a示出了EL1已编码画面1053a的NAL单元。沿第二增强层(EL2)1042b示出了EL2已编码画面1053b的NAL单元。沿基本层(BL)1044示出了基本层已编码画面1053c的NAL单元。

在t1时，EL1已编码画面1053a的NAL单元、EL2已编码画面1053b的NAL单元以及基本层已编码画面1053c的NAL单元是接入单元(AU)1055a的一部分。在t2时，EL1已编码画面1053a的NAL单元以及EL2已编码画面1053b的NAL单元是接入单元(AU)1055b的一部分。在t3时，EL1已编码画面1053a的NAL单元、EL2已编码画面1053b的NAL单元以及基本层已编码画面1053c的NAL单元是接入单元(AU)1055c的一部分。在t4时，EL1已编码画面1053a的NAL单元以及EL2已编码画面1053b的NAL单元是接入单元(AU)1055d的一部分。

参考图16，图形上示出了这种对NAL单元类型的限制。对于不同类型的IDR画面(例如，IDR_W_RADL、IDR_N_LP)和BLA画面(BLA_W_LP、BLA_W_RADL或BLA_N_LP)，对于相对基本层(例如，基本层0)的每一增强层(例如，增强层1、2、3、4)，实施该限制。因此，如果基本层的画面时IDR或BLA画面，则对于相同PicOrderCntVal的每一增强层也是对应的IDR或BLA画面。

确定的是可以将对基本层和增强层的使用用于同时联播同一视频流内的一对视频流(或更多)。因此，例如，基本层0和增强层1可以是第一视频流，增强层2、增强层3和增强层4可以是第二视频流。例如，两个视频流可以具有相同视频内容，但是可以针对不同的基本层和增强层使用不同比特速率。它们还可以针对不同的基本层使用不同的编码算法(例如，HEVC/AVC)。在这种方式下，增强层2不依赖于增强层1，也不依赖于基本层0。此外，增强层3和增强层4不依赖于增强层1，也不依赖于基本层0。增强层3可以依赖于增强层2，增强层4可以依赖于增强层3和增强层2。优选地，增强层可以仅依赖于具有较小编号的增强层，不依赖于具有较大编号的增强层。

使用直接依赖性标志来发信号通知这种特定的增强层依赖性，以便针对每层指示它可以直接依赖于哪些其它层。例如，direct_dependency_flag[1][j]＝{1}指示增强层1可以依赖于基本层0。例如，direct_dependency_flag[2][j]＝{0，0}指示增强层2不依赖于其它层。例如，direct_dependency_flag[3][j]＝{0，0，1}指示增强层3不依赖于基本层0，不依赖于增强层1，可以依赖于增强层2。例如，direct_dependency_flag[4][j]＝{0，0，1，1}指示增强层4不依赖于基本层0，不依赖于增强层1，可以依赖于增强层2，且可以依赖于增强层3。由于同时联播配置的可能性，可以重新限定对direct_dependency_flag[i][j]的限制以便允许当使用同时联播时，IDR和BLA频率是不同的。换言之，IDR和BLA限制可以是针对同时联播流中的每一个流限制的，但是针对同时联播流中的每一个流，是独立于另一个的。

参考图17，示出了同时联播两个视频流，第一视频流包括基本层0和增强层1；第二视频流包括增强层2、增强层3和增强层4。如图所示，第一视频流包括针对值为PicOrderCntValB的PicOrderCntVal的对应的一对IDR/BLA画面600、610，而第二视频流不包括针对相同值(PicOrderCntValB)的PicOrderCntVal的对应的一组IDR/BLA画面620、630、640。如图所示，第二视频流包括对应的一组IDR/BLA画面650、660、670，而第一视频流不包括对应的一对IDR/BLA画面680、690。

参考图17，具体地，例如，可以通过考虑针对VPS扩展中的层发信号通知的direct_dependency_flag[i][j]值，来实现这种灵活性。可以针对每一层确定变量IndepLayer[i]，即，该层是独立于(例如，0)还是依赖于(例如，1)另一层。如下所述，可以得到IndepLayer[i]：

因此，对于图17所示的示例，基本层0和增强层2二者是独立的层。备选地，可以根据NumDirectRefLayers[i]推断独立层，而无需使用附加语法IndepLayer[i]。例如，当NumDirectRefLayers[i]等于0时，IndepLayer[i]将等于1。此外，当NumDirectRefLayers[i]不等于0时，IndepLayer[i]将等于0。

在语法中，nuh_layer_id规定了应将层的指示符从“当对于具有特定PicOrderCntVal值且在特定CVS中的已编码画面，nal_unit_type的值nalUnitTypeA等于IDR_W_RADL、IDR_N_LP、BLA_W_LP、BLA_W_RADL或BLA_N_LP时，对于具有相同特定PicOrderCntVal值且在相同特定CVS中的所有已编码画面的所有VCLNAL单元，nal_unit_type值应等于nalUnitTypeA”修改为修改后的语义，以便使能上述同时联播的实施例。

一种针对nal_unit_type的修改语义可以如下所示：当对于具有特定PicOrderCntVal值且在特定CVS中nuh_layer_id值为nuhLayerIdA且IndepLayer[LayerIdInVps[nuhLayerIdA]]等于1的已编码画面，nal_unit_type的值nalUnitTypeA等于IDR_W_RADL、IDR_N_LP、BLA_W_LP、BLA_W_RADL或BLA_N_LP时，对于具有相同特定PicOrderCntVal值且在相同特定CVS中的所有已编码画面的所有VCLNAL单元，nal_unit_type值应等于nalUnitTypeA，此时这些所有VCLNAL单元的nuh_layer_id值为nuhLayerIdB(其中nuhLayerIdB＞nuhLayerIdA)，IndepLayer[LayerIdInVps[nuhLayerIdB]]等于0，并且范围在0到NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1(包括0和NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1在内)的至少一个j具有nuh_layer_id值RefLayerId[LayerIdInVps[nuhLayerIdB]][j]等于nuhLayerIdA的层。

另一种针对nal_unit_type的修改语义可以如下所示：当对于具有特定PicOrderCntVal值且在特定CVS中nuh_layer_id值为nuhLayerIdA且NumDirectRefLayers[LayerIdInVps[nuhLayerIdA]]等于0的已编码画面，nal_unit_type的值nalUnitTypeA等于IDR_W_RADL、IDR_N_LP、BLA_W_LP、BLA_W_RADL或BLA_N_LP时，对于具有相同特定PicOrderCntVal值且在相同特定CVS中的所有已编码画面的所有VCLNAL单元，nal_unit_type值应等于nalUnitTypeA，此时这些所有VCLNAL单元的nuh_layer_id值为nuhLayerIdB(其中nuhLayerIdB＞nuhLayerIdA)，NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]不等于0，范围在0到NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1(包括0和NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1在内)的至少一个j具有nuh_layer_id值RefLayerId[LayerIdInVps[nuhLayerIdB]][j]等于nuhLayerIdA的层。

另一种针对nal_unit_type的修改语义可以如下所示：当对于具有特定PicOrderCntVal值且在特定CVS中nuh_layer_id值为nuhLayerIdA且IndepLayer[LayerIdInVps[nuhLayerIdA]]等于1的已编码画面，nal_unit_type的值nalUnitTypeA等于IDR_W_RADL、IDR_N_LP、BLA_W_LP、BLA_W_RADL或BLA_N_LP时，对于具有相同特定PicOrderCntVal值且在相同特定CVS中的所有已编码画面的所有VCLNAL单元，nal_unit_type值应等于nalUnitTypeA，此时这些所有VCLNAL单元的nuh_layer_id值为nuhLayerIdB(其中nuhLayerIdB＞nuhLayerIdA)，IndepLayer[LayerIdInVps[nuhLayerIdB]]等于0，范围在0到NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1(包括0和NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1在内)的至少一个j具有nuh_layer_id值RefLayerId[LayerIdInVps[nuhLayerIdB]][j]的层(将nuhLayerIdA作为直接参考层)。

另一种针对nal_unit_type的修改语义可以如下所示：当对于具有特定PicOrderCntVal值且在特定CVS中nuh_layer_id值为nuhLayerIdA且NumDirectRefLayers[LayerIdInVps[nuhLayerIdA]]等于0的已编码画面，nal_unit_type的值nalUnitTypeA等于IDR_W_RADL、IDR_N_LP、BLA_W_LP、BLA_W_RADL或BLA_N_LP时，对于具有相同特定PicOrderCntVal值且在相同特定CVS中的所有已编码画面的所有VCLNAL单元，nal_unit_type值应等于nalUnitTypeA，此时这些所有VCLNAL单元的nuh_layer_id值为nuhLayerIdB(其中nuhLayerIdB＞nuhLayerIdA)，NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]不等于0，范围在0到NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1(包括0和NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1在内)的至少一个j具有nuh_layer_id值RefLayerId[LayerIdInVps[nuhLayerIdB]][j]的层时(将nuhLayerIdA作为直接参考层)。

另一种针对nal_unit_type的修改语义可以如下所示：当对于具有特定PicOrderCntVal值且在特定CVS中nuh_layer_id值为nuhLayerIdA且IndepLayer[LayerIdInVps[nuhLayerIdA]]等于1的已编码画面，nal_unit_type的值nalUnitTypeA等于IDR_W_RADL、IDR_N_LP、BLA_W_LP、BLA_W_RADL或BLA_N_LP时，对于具有相同特定PicOrderCntVal值且在相同特定CVS中的所有已编码画面的所有VCLNAL单元，nal_unit_type值应等于nalUnitTypeA，此时这些所有VCLNAL单元的nuh_layer_id值为nuhLayerIdB(其中nuhLayerIdB＞nuhLayerIdA)，IndepLayer[LayerIdInVps[nuhLayerIdB]]等于0，范围在0到NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1(包括0和NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1在内)的至少一个j具有nuh_layer_id值RefLayerId[LayerIdInVps[nuhLayerIdB]][j]的层(将nuhLayerIdA作为其本身的直接参考层或它的直接或间接参考层之一)。

另一种针对nal_unit_type的修改语义可以如下所示：当对于具有特定PicOrderCntVal值且在特定CVS中nuh_layer_id值为nuhLayerIdA且NumDirectRefLayers[LayerIdInVps[nuhLayerIdA]]等于0的已编码画面，nal_unit_type的值nalUnitTypeA等于IDR_W_RADL、IDR_N_LP、BLA_W_LP、BLA_W_RADL或BLA_N_LP时，对于具有相同特定PicOrderCntVal值且在相同特定CVS中的所有已编码画面的所有VCLNAL单元，nal_unit_type值应等于nalUnitTypeA，此时这些所有VCLNAL单元的nuh_layer_id值为nuhLayerIdB(其中nuhLayerIdB＞nuhLayerIdA)，NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]不等于0，范围在0到NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1(包括0和NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1在内)的至少一个j具有nuh_layer_id值RefLayerId[LayerIdInVps[nuhLayerIdB]][j]的层时(将nuhLayerIdA作为其本身的直接参考层或它的直接或间接参考层之一)。

另一种针对nal_unit_type的修改语义可以如下所示：当对于在特定CVS中具有特定PicOrderCntVal值且nuh_layer_id值为nuhLayerIdA且IndepLayer[LayerIdInVps[nuhLayerIdA]]等于1的编码画面，nal_unit_type的值nalUnitTypeA等于IDR_W_RADL、IDR_N_LP、BLA_W_LP、BLA_W_RADL或BLA_N_LP时，对于具有相同特定PicOrderCntVal值且在相同特定CVS中的所有已编码画面的所有VCLNAL单元，nal_unit_type值应等于nalUnitTypeA，此时这些所有VCLNAL单元的nuh_layer_id值为nuhLayerIdB(其中nuhLayerIdB＞nuhLayerIdA)，IndepLayer[LayerIdInVps[nuhLayerIdB]]等于0，范围在0到NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1(包括0和NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1在内)的至少一个j具有nuh_layer_id值RefLayerId[LayerIdInVps[nuhLayerIdB]][j]等于nuhLayerIdA的层或至少一个RefLayerId[LayerIdInVps[nuhLayerIdB]][j]将nuhLayerIdA作为其本身的直接参考层或它的直接参考层之一时。

另一种针对nal_unit_type的修改语义可以如下所示：当对于具有特定PicOrderCntVal值且在特定CVS中nuh_layer_id值为nuhLayerIdA且NumDirectRefLayers[LayerIdInVps[nuhLayerIdA]]等于0的已编码画面，nalunit_type的值nalUnitTypeA等于IDR_W_RADL、IDR_N_LP、BLA_W_LP、BLA_W_RADL或BLA_N_LP时，对于具有相同特定PicOrderCntVal值且在相同特定CVS中的所有已编码画面的所有VCLNAL单元，nal_unit_type值应等于nalUnitTypeA，此时这些所有VCLNAL单元的nuh_layer_id值为nuhLayerIdB(其中nuhLayerIdB＞nuhLayerIdA)，NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]不等于0，范围在0到NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1(包括0和NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1在内)的至少一个j具有nuh_layer_id值RefLayerId[LayerIdInVps[nuhLayerIdB]][j]等于nuhLayerIdA的层或至少一个RefLayerId[LayerIdInVps[nuhLayerIdB]][j]将nuhLayerIdA作为其本身的直接参考层或它的直接参考层之一。

另一种修改语义可以如下所示：当对于在特定接入单元中且在特定CVS中nuh_layer_id值nuhLayerIdA及IndepLayer[nuhLayerIdA]等于1的已编码画面，nal_unit_type的值nalUnitTypeA等于IDR_W_DLP、IDR_N_LP、BLA_W_LP、BLA_W_DLP或BLA_N_LP时，对于在相同接入单元中且在相同特定CVS中的所有已编码画面的所有VCLNAL单元，nal_unit_type值应等于nalUnitTypeA，此时这些所有VCLNAL单元的nuh_layer_id值为nuhLayerIdB(其中nuhLayerIdB＞nuhLayerIdA)，IndepLayer[nuhLayerIdB]等于0，范围在0到NumDirectRefLayers[nuhLayerIdB]-1(包括0和NumDirectRefLayers[nuhLayerIdB]-1在内)的至少一个j具有nuh_layer_id值RefLayerId[nuhLayerIdB][j]等于nuhLayerIdA的层。

另一种修改语义可以如下所示：当对于在特定接入单元中且在特定CVS中nuh_layer_id值nuhLayerIdA及NumDirectRefLayers[nuhLayerIdA]等于0的已编码画面，nal_unit_type的值nalUnitTypeA等于IDR_W_DLP、IDR_N_LP、BLA_W_LP、BLA_W_DLP或BLA_N_LP时，对于在相同接入单元中且在相同特定CVS中的所有已编码画面的所有VCLNAL单元，nal_unit_type值应等于nalUnitTypeA，此时这些所有VCLNAL单元的nuh_layer_id值为nuhLayerIdB(其中nuhLayerIdB＞nuhLayerIdA)，NumDirectRefLayers[nuhLayerIdB]不等于0，范围在0到NumDirectRefLayers[nuhLayerIdB]-1(包括0和NumDirectRefLayers[nuhLayerIdB]-1在内)的至少一个j具有nuh_layer_id值RefLayerId[nuhLayerIdB][j]等于nuhLayerIdA的层。

另一种修改语义可以如下所示：当对于在特定接入单元中且在特定CVS中nuh_layer_id值nuhLayerIdA及IndepLayer[nuhLayerIdA]等于1的已编码画面，nal_unit_type的值nalUnitTypeA等于IDR_W_DLP、IDR_N_LP、BLA_W_LP、BLA_W_DLP或BLA_N_LP时，对于在相同接入单元中且在相同特定CVS中的所有已编码画面的所有VCLNAL单元，nal_unit_type值应等于nalUnitTypeA，此时这些所有VCLNAL单元的nuh_layer_id值为nuhLayerIdB(其中nuhLayerIdB＞nuhLayerIdA)，IndepLayer[nuhLayerIdB]等于0，范围在0到NumDirectRefLayers[nuhLayerIdB]-1(包括0和NumDirectRefLayers[nuhLayerIdB]-1在内)的至少一个j具有nuh_layer_id值RefLayerId[nuhLayerIdB][j]的层(将nuhLayerIdA作为直接参考层)。

另一种修改语义可以如下所示：当对于在特定接入单元中且在特定CVS中nuh_layer_id值nuhLayerIdA及NumDirectRefLayers[nuhLayerIdA]等于0的已编码画面，nal_unit_type的值nalUnitTypeA等于IDR_W_DLP、IDR_N_LP、BLA_W_LP、BLA_W_DLP或BLA_N_LP时，对于在相同接入单元中且在相同特定CVS中的所有已编码画面的所有VCLNAL单元，nal_unit_type值应等于nalUnitTypeA，此时这些所有VCLNAL单元的nuh_layer_id值为nuhLayerIdB(其中nuhLayerIdB＞nuhLayerIdA)，NumDirectRefLayers[nuhLayerIdB]不等于0，范围在0到NumDirectRefLayers[nuhLayerIdB]-1(包括0和NumDirectRefLayers[nuhLayerIdB]-1在内)的至少一个j具有nuh_layer_id值RefLayerId[nuhLayerIdB][j]的层(将nuhLayerIdA作为直接参考层)。

另一种修改语义可以如下所示：当对于在特定接入单元中且在特定CVS中nuh_layer_id值nuhLayerIdA及IndepLayer[nuhLayerIdA]等于1的已编码画面，nal_unit_type的值nalUnitTypeA等于IDR_W_DLP、IDR_N_LP、BLA_W_LP、BLA_W_DLP或BLA_N_LP时，对于在相同接入单元中且在相同特定CVS中的所有已编码画面的所有VCLNAL单元，nal_unit_type值应等于nalUnitTypeA，此时这些所有VCLNAL单元的nuh_layer_id值为nuhLayerIdB(其中nuhLayerIdB＞nuhLayerIdA)，IndepLayer[nuhLayerIdB]等于0，范围在0到NumDirectRefLayers[nuhLayerIdB]-1(包括0和NumDirectRefLayers[nuhLayerIdB]-1在内)的至少一个j具有nuh_layer_id值RefLayerId[nuhLayerIdB][j]的层(将nuhLayerIdA作为直接参考层或它的直接或间接参考层之一)。

另一种修改语义可以如下所示：当对于在特定接入单元中且在特定CVS中nuh_layer_id值nuhLayerIdA及NumDirectRefLayers[nuhLayerIdA]等于0的已编码画面，nal_unit_type的值nalUnitTypeA等于IDR_W_DLP、IDR_N_LP、BLA_W_LP、BLA_W_DLP或BLA_N_LP时，对于在相同接入单元中且在相同特定CVS中的所有已编码画面的所有VCLNAL单元，nal_unit_type值应等于nalUnitTypeA，此时这些所有VCLNAL单元的nuh_layer_id值为nuhLayerIdB(其中nuhLayerIdB＞nuhLayerIdA)NumDirectRefLayers[nuhLayerIdB]不等于0，范围在0到NumDirectRefLayers[nuhLayerIdB]-1(包括0和NumDirectRefLayers[nuhLayerIdB]-1在内)的至少一个j具有nuh_layer_id值RefLayerId[nuhLayerIdB][j]的层(将nuhLayerIdA作为直接参考层或它的直接或间接参考层之一)。

另一种修改语义可以如下所示：当对于在特定接入单元中且在特定CVS中nuh_layer_id值nuhLayerIdA及IndepLayer[nuhLayerIdA]等于1的已编码画面，nal_unit_type的值nalUnitTypeA等于IDR_W_DLP、IDR_N_LP、BLA_W_LP、BLA_W_DLP或BLA_N_LP时，对于在相同接入单元中且在相同特定CVS中的所有已编码画面的所有VCLNAL单元，nal_unit_type值应等于nalUnitTypeA，此时这些所有VCLNAL单元A)，IndepLayer[nuhLayerIdB]等于0，范围在0到NumDirectRefLayers[nuhLayerIdB]-1(包括0和NumDirectRefLayers[nuhLayerIdB]-1在内)的至少一个j具有nuh_layer_id值RefLayerId[nuhLayerIdB][j]等于nuhLayerIdA的层或至少一个RefLayerId[nuhLayerIdB][j]将nuhLayerIdA作为其本身的直接参考层或它的直接参考层之一。

另一种修改语义可以如下所示：当对于在特定接入单元中且在特定CVS中nuh_layer_id值nuhLayerIdA及NumDirectRefLayers[nuhLayerIdA]等于0的已编码画面，nal_unit_type的值nalUnitTypeA等于IDR_W_DLP、IDR_N_LP、BLA_W_LP、BLA_W_DLP或BLA_N_LP时，对于在相同接入单元中且在相同特定CVS中的所有已编码画面的所有VCLNAL单元，nal_unit_type值应等于nalUnitTypeA，此时这些所有VCLNAL单元的nuh_layer_id值为nuhLayerIdB(其中nuhLayerIdB＞nuhLayerIdA)，NumDirectRefLayers[nuhLayerIdB]不等于0，范围在0到NumDirectRefLayers[nuhLayerIdB]-1(包括0和NumDirectRefLayers[nuhLayerIdB]-1在内)的至少一个j具有nuh_layer_id值RefLayerId[nuhLayerIdB][j]等于nuhLayerIdA的层或至少一个RefLayerId[nuhLayerIdB][j]将nuhLayerIdA作为其本身的直接参考层或它的直接参考层之一。

另一种修改语义可以如下所示：当对于在接入单元中且在特定CVS中nuh_layer_id值nuhLayerIdA等于0或NumDirectRefLayers[nuhLayerIdA]等于0的已编码画面，nal_unit_type值nalUnitTypeA等于IDR_W_DLP、IDR_N_LP、BLA_W_LP、BLA_W_DLP或BLA_N_LP时，相同接入单元内以及相同CVS内的所有其他已编码画面的nal_unit_type值应等于nalUnitTypeA。

另一种修改语义可以如下所示：当对于在接入单元中且在特定CVS中nuh_layer_id值nuhLayerIdA等于0或NumDirectRefLayers[nuhLayerIdA]等于0的已编码画面，nal_unit_type值nalUnitTypeA等于IDR_W_DLP、IDR_N_LP时，相同接入单元内以及相同CVS内的所有其他已编码画面的nal_unit_type值应等于nalUnitTypeA。

另一种修改语义可以如下所示：当接入单元中的已编码画面是IDR画面且在特定CVS中nuh_layer_id值为0或NumDirectRefLayers[nuh_layer_id]等于0时，相同接入单元内以及相同CVS内的所有其他已编码画面应是IDR画面。

另一种修改语义可以如下所示：当接入单元中的已编码画面是IDR画面且nuh_layer_id值为0或NumDirectRefLayers[nuh_layer_id]等于0时，相同接入单元内的所有其他已编码画面应是IDR画面。

另一种修改语义可以如下所示：当接入单元中的已编码画面是IDR画面且nuh_layer_id值为0或它所属的层的NumDirectRefLayers[nuh_layer_id]等于0时，相同接入单元内的所有其他已编码画面应是IDR画面。

另一种修改语义可以如下所示：当接入单元中的已编码画面是IDR画面且nuh_layer_id值为0或IDR画面的nuh_layer_id层的NumDirectRefLayers[nuh_layer_id]等于0时，相同接入单元内的所有其他已编码画面应是IDR画面。

另一种修改语义可以如下所示：当属于nuh_layer_id值等于nuhLayerIdA的层的接入单元中的已编码画面是IDR画面且NumDirectRefLayers[nuhLayerIdA]等于0时，相同接入单元内的所有其他已编码画面应是IDR画面，其中所述其他已编码画面的层将nuhLayerIdA作为自身的直接参考层或它的直接参考层之一。

另一种修改语义可以如下所示：当属于nuh_layer_id值等于nuhLayerIdA的层的接入单元中的编码画面是IDR画面且NumDirectRefLayers[nuhLayerIdA]等于0时，相同接入单元内的所有其他已编码画面应是IDR画面，其中所述所有其他已编码画面的层将nuhLayerIdA作为自身的直接参考层或间接参考层。

直接参考层的示例如下所示：

如果direct_dependency_flag[i][j]等于1，则将索引为j的层描述为是针对索引为i的另一层的直接参考层。

间接参考层的示例如下所示：索引为k的层是索引为j的层的直接参考层，即，direct_dependency_flag[j][k]等于1；且索引为j的层是索引为i的层的直接参考层，即，direct_dependency_flag[i][j]等于1，在这种情况下，索引为k的层是索引为i的层的间接参考层。

另一种修改语义可以如下所示：当对于在接入单元中且nuh_layer_id值等于0或NumDirectRefLayers[nuhLayerIdA]等于0的已编码画面，nal_unit_type值nalUnitTypeA等于IDR_W_DLP、IDR_N_LP、BLA_W_LP、BLA_W_DLP或BLA_N_LP时，相同接入单元内的所有其他已编码画面的nal_unit_type值应等于nalUnitTypeA。

在一些其他实施例中，可以实施以下限制。在接入单元中，至多一个编码画面的NumDirectRefLayers[nuh_layer_id]可以等于0。

在一些实施例中，可以通过用“当针对具有特定PicOrderCntVal值和nuh_layer_id值为layer_id_in_nuh[nuhLayerIdA]的已编码画面，nal_unit_type值nalUnitTypeA等于IDR_W_RADL、IDR_N_LP、BLA_W_LP、BLA_W_RADL或BLA_N_LP时”代替“当针对具有特定PicOrderCntVal值和nuh_layer_id值为nuhLayerIdA的已编码画面，nal_unit_type值nalUnitTypeA等于IDR_W_RADL、IDR_N_LP、BLA_W_LP、BLA_W_RADL或BLA_N_LP时”，来规定针对nal_unit_type的上述语义中的每一个。

可以向针对nal_unit_type的上述语义中的每一个添加除了NAL单元类型、IDR_W_RADL、IDR_N_LP、BLA_W_LP、BLA_W_RADL或BLA_N_LP以外的限制。例如，可以向属于CRA接入单元的每一CRANAL单元添加所述限制，其中CRA接入单元是在解码顺序上在比特流中的第一接入单元，是解码顺序上在后续NAL单元末端之后的第一接入单元，或其HandleCraAsBlaFlag等于1。因此，在一些情况下，例如在上述所有变型中，可以通过用“当对于具有特定PicOrderCntVal值且nuh_layer_id值为nuhLayerIdA的已编码画面，nal_unit_type值nalUnitTypeA等于IDR_W_RADL、IDR_N_LP、BLA_W_LP、BLA_W_RADL、或BLA_N_LP、或属于是解码顺序上在比特流中的第一接入单元的CRA接入单元的CRA_NUT、或属于是解码顺序上在后续NAL单元末端之后的第一接入单元的CRA接入单元的CRA_NUT、或HandleCraAsBlaFlag等于1的CRA_NUT时”代替“当对于具有特定PicOrderCntVal值且nuh_layer_id值为nuhLayerIdA的已编码画面，nal_unit_type值nalUnitTypeA等于IDR_W_RADL、IDR_N_LP、BLA_W_LP、BLA_W_RADL或BLA_N_LP时”，来在一些实施例中规定限制。

在其他实施例中

-可以用“NumDirectRefLayers[LayerIdxInVps[nuhLayerIdA]]”代替“NumDirectRefLayers[nuhLayerIdA]”；

-可以用“NumDirectRefLayers[LayerIdxInVps[nuhLayerIdB]]”代替“NumDirectRefLayers[nuhLayerIdB]”；

-可以用“RefLayerId[LayerIdxInVps[nuhLayerIdB]][j]”代替“RefLayerId[nuhLayerIdB][j]”。

可以将NAL单元以及与已编码画面、接入单元和已编码视频序列的关联的表现顺序从“nuh_layer_id等于nuhLayerIdA且PicOrderCntVal值等于picOrderCntValA的已编码画面在解码顺序上应在nuh_layer_id大于nuhLayerIdA的且PicOrderCntVal值等于picOrderCntValA的所有已编码画面(如果存在)之前”修改为修改后的表示：只有同步联播的视频流中的NAL单元的编码顺序需要遵守对NAL单元的顺序的上述限制。因此，在不需要正同步联播的独立视频流上遵守与NAL单元的顺序有关的限制。

可以将NAL单元以及与已编码画面、接入单元和已编码视频序列的关联的修改后解码顺序可以如下所示：nuh_layer_id等于nuhLayerIdA且PicOrderCntVal值等于picOrderCntValA且IndepLayer[LayerIdInVps[nuhLayerIdA]]等于1的已编码画面在解码顺序上应在如下所示的所有已编码画面(如果存在)之前：nuh_layer_id为nuhLayerIdB(nuhLayerIdB＞nuhLayerIdA)的且PicOrderCntVal值等于picOrderCntValA且IndepLayer[LayerIdInVps[nuhLayerIdB]]等于0，范围在0到NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1(包括0和NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1在内)的至少一个j具有nuh_layer_id值RefLayerId[LayerIdInVps[nuhLayerIdB]][j]等于nuhLayerIdA的层。

可以将NAL单元以及与已编码画面、接入单元和已编码视频序列的关联的修改后解码顺序可以如下所示：nuh_layer_id等于nuhLayerIdA且PicOrderCntVal值等于picOrderCntValA且IndepLayer[LayerIdInVps[nuhLayerIdA]]等于1的已编码画面在解码顺序上应在如下所示的所有已编码画面(如果存在)之前：nuh_layer_id为nuhLayerIdB(nuhLayerIdB＞nuhLayerIdA)的且PicOrderCntVal值等于picOrderCntValA且IndepLayer[LayerIdInVps[nuhLayerIdB]]等于0，范围在0到NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1(包括0和NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1在内)的至少一个j具有nuh_layer_id值RefLayerId[LayerIdInVps[nuhLayerIdB]][j]的层(将nuhLayerIdA作为直接参考层)。

可以将NAL单元以及与已编码画面、接入单元和已编码视频序列的关联的修改后解码顺序可以如下所示：nuh_layer_id等于nuhLayerIdA且PicOrderCntVal值等于picOrderCntValA且IndepLayer[LayerIdInVps[nuhLayerIdA]]等于1的编码画面在解码顺序上应在如下所示的所有编码画面(如果存在)之前：nuh_layer_id为nuhLayerIdB(nuhLayerIdB＞nuhLayerIdA)的且PicOrderCntVal值等于picOrderCntValA且IndepLayer[LayerIdInVps[nuhLayerIdB]]等于0，范围在0到NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1(包括0和NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1在内)的至少一个j具有nuh_layer_id值RefLayerId[LayerIdInVps[nuhLayerIdB]][j]的层(将nuhLayerIdA作为本身的直接参考层或它的直接或间接参考层之一)。

可以将NAL单元以及与已编码画面、接入单元和已编码视频序列的关联的修改后解码顺序可以如下所示：nuh_layer_id等于nuhLayerIdA且PicOrderCntVal值等于picOrderCntValA且IndepLayer[LayerIdInVps[nuhLayerIdA]]等于1的编码画面在解码顺序上应在如下所示的所有编码画面(如果存在)之前：nuh_layer_id为nuhLayerIdB(nuhLayerIdB＞nuhLayerIdA)的且PicOrderCntVal值等于picOrderCntValA且IndepLayer[LayerIdInVps[nuhLayerIdB]]等于0，范围在0到NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1(包括0和NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]-1在内)的至少一个j具有nun_layer_id值RefLayerId[LayerIdInVps[nuhLayerIdB]][j]等于nuhLayerIdA的层，或至少一个RefLayerId[LayerIdInVps[nuhLayerIdB]][j]将nuhLayerIdA作为本身的直接参考层或它的直接参考层之一。

在上述所有变型中，可以通过用“NumDirectRefLayers[LayerIdInVps[nuhLayerIdA]]等于0”代替“IndepLayer[LayerIdInVps[nuhLayerIdA]]等于1”并通过用“NumDirectRefLayers[LayerIdInVps[nuhLayerIdB]]不等于0”代替“IndepLayer[LayerIdInVps[nuhLayerIdB]]等于0”，来在一些实施例中规定顺序限制。

在备选实施例中，可以使用以下限制：对于nuh-layer_id＞0的每一层，比特流符合：

Σ_{j = 0}^{i - 1} d i r e c t_d e p e n d e n c y_f l a g [i] [j]! = 0

在另一备选实施例中，可以使用以下限制：对于nuh-layer_id＞0的每一层i，比特流符合：

Σ_{j = 0}^{i - 1} d i r e c t_d e p e n d e n c y_f l a g [i] [j] &GreaterEqual; 1

本文将在上述说明书中使用的术语和表述用作描述术语，而不是为了进行限制，使用这些术语和表述不是为了排除所述和所示特征的等同物或其部分，应认识到仅通过如下所示的权利要求来限定和限制本发明的范围。

Claims

1.一种用于对视频比特流进行解码的方法，包括：

(a)接收代表视频序列的基本层比特流；

(b)接收代表视频序列的多个增强比特流，其中所述增强比特流中的每一个包括递增的层赋值，其中所述基本层比特流和/或增强比特流中的每一个包括直接依赖性数据，所述直接依赖性数据指示所述基本层比特流和/或增强比特流中的每一个是否依赖于具有较小层赋值的其它所述多个增强层和基本层；

(c)对所述基本层比特流和所述多个增强比特流中的每一个进行解码，其中编码为帧内编码的IDR或帧内编码的BLA的所述基本层比特流的画面应在所述基本层比特流的对应画面处，具有针对每一所述增强层的对应帧内编码IDR或帧内编码BLA画面，但排除以下情况：所述增强层之一不依赖于具有较小层赋值的其他所述多个增强层和所述基本层，所述增强层之一称作独立比特流，其中所述增强层的每一个的层赋值比所述独立比特流大，且并不依赖于层赋值比所述独立层小的所述多个其他增强层。

2.根据权利要求1所述的方法，其中所述增强层形成可缩放比特流。

3.根据权利要求1所述的方法，其中所述增强层形成多视图比特流。

4.根据权利要求1所述的方法，其中所述直接依赖性数据由直接依赖性标志指示。

5.根据权利要求1所述的方法，其中通过VPS扩展语法来发信号通知所述直接依赖性标志。