CN103430542B

CN103430542B - 用于随机存取后译码依附图片的视频译码技术

Info

Publication number: CN103430542B
Application number: CN201280012586.2A
Authority: CN
Inventors: 陈盈; 穆罕默德·蔡德·科班; 陈培松; 马尔塔·卡切维奇
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2011-03-10
Filing date: 2012-03-09
Publication date: 2016-11-23
Anticipated expiration: 2032-03-09
Also published as: WO2012122480A1; IL228061B; AU2012225307A1; EP2684364A1; RU2013145305A; TWI544782B; US9706227B2; CA2828776C; BR112013023033A2; CN103430542A; JP2014513456A; IL228061A0; RU2566972C2; ZA201307540B; MY167061A; JP5876083B2; US20120230433A1; TW201244494A; AU2012225307B2; KR20130129468A

Abstract

一般来说，本发明描述用于针对随机存取来译码视频数据的技术。明确地说，本发明提议对语法元素译码，所述语法元素指示依附图片是否可在对清洁解码刷新CDR图片的随机存取请求的情况下成功地解码且是否可能需要用来对按显示次序在所述清洁解码刷新CDR图片之后的图片进行解码。

Description

用于随机存取后译码依附图片的视频译码技术

本申请案主张于2011年3月10日申请的第61／451,453号美国临时申请案和于2011年3月20日申请的第61／454,548号美国临时申请案的优先权，所述两件申请案的全文特此以引用的方式并入。

技术领域

本发明涉及视频译码，且更特定地说，涉及针对随机存取的视频译码技术。

背景技术

可将数字视频能力并入到广泛范围的装置中，所述装置包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型计算机或桌上计算机、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频电话会议装置和其类似者。数字视频装置实施视频压缩技术，例如，在由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264／MPEG-4第10部分(高级视频译码(AVC))、当前在开发过程中的高效率视频译码(HEVC)标准定义的标准以及此些标准的扩展中所描述的视频压缩技术，以更有效率地发射、接收和存储数字视频信息。

视频压缩技术可包含空间(帧内图片)预测和／或时间(帧间图片)预测以减少或移除视频序列中所固有的冗余。对于基于块的视频译码，可将一视频片段分割成多个视频块，视频块还可被称作树块、译码单元(CU)和／或译码节点。图片的经帧内译码(I)片段中的视频块是使用相对于同一图片中的相邻块中的参考样本的空间预测来编码。图片的经帧间译码(P或B)片段中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片可被称作帧，且参考图片可被称作参考帧。

空间或时间预测使用针对待译码的块的预测块。残余数据表示待译码的原始块与预测块之间的像素差。根据指向形成预测块的参考样本的块的运动向量和指示经译码块与预测块之间的差异的残余数据对经帧间译码块编码。根据帧内译码模式和残余数据对经帧内译码块编码。为了进一步压缩，可将残余数据从像素域变换到变换域，从而产生残余变换系数，所述残余变换系数接着可经量化。可按特定次序扫描最初排列成二维阵列的经量化的变换系数以产生变换系数的一维向量以用于熵译码。

发明内容

一般来说，本发明描述用于针对随机存取来译码视频数据的技术。明确地说，本发明提议对语法元素译码，所述语法元素指示潜在不必要图片是否为依附图片，所述依附图片可在对清洁解码刷新(CDR)图片的随机存取请求的情况下成功地解码。依附图片为用于对按显示次序在所述清洁解码刷新(CDR)图片之后的图片解码的图片。

在本发明的一个实例中，一种对视频数据编码的方法包括：对图片群组编码，所述图片群组包含清洁解码刷新(CDR)图片和一个或一个以上潜在不必要图片，所述一个或一个以上潜在不必要图片可为按显示次序在所述CDR图片之后的图片所需要的；确定所述一个或一个以上潜在不必要图片中的任一者是否为依附图片；确定所述依附图片是否可在所述CDP图片用于随机存取的状况下解码；以及用信号发出语法元素，所述语法元素指示确定所述依附图片可在所述CDR图片用于随机存取的状况下解码。

在本发明的另一实例中，一种对视频数据解码的方法包括：接收图片群组，所述图片群组包含清洁解码刷新(CDR)图片和一个或一个以上潜在不必要图片；以及接收语法元素，所述语法元素指示所述一个或一个以上潜在不必要图片中的任一者是否为依附图片，所述依附图片可在接收到对随机存取所述CDR图片的请求的状况下解码。所述解码方法可进一步包括：接收对随机存取所述CDR图片的请求；响应于对随机存取的所述请求而对所述CDR图片解码；对与所述所接收语法元素对应的所述依附图片解码；以及跳过针对所述一个或一个以上潜在不必要图片中未通过所述所接收语法元素指示为依附图片的任一者的解码。

上文所描述的编码和解码方法还可实施为设备(例如，通过视频编码器或视频解码器)或经由存储于计算机可读媒体上的指令。

一个或一个以上实例的细节陈述于下文的附图和实施方式中。其它特征、目标和优点将从实施方式和附图以及从权利要求书中显而易见。

附图说明

图1为说明图片群组的实例解码次序的概念图，所述图片群组具有清洁解码刷新(CDR)图片和经帧内预测依附图片。

图2为说明图片群组的实例解码次序的概念图，所述图片群组具有清洁解码刷新图片(CDR)和经帧间预测依附图片。

图3为说明可利用本发明中所描述的技术的实例视频编码和解码系统的框图。

图4为说明可实施本发明中所描述的技术的实例视频编码器的框图。

图5为说明可实施本发明中所描述的技术的实例视频解码器的框图。

图6为根据本发明的技术的视频编码方法的实例流程图。

图7为根据本发明的技术的视频解码方法的实例流程图。

图8为实例ISO基础媒体文件格式的概念图。

具体实施方式

视频译码中的随机存取允许视频解码器在极少参考或不参考先前视频帧的情况下解码特定时刻的视频。实际上，在经设计为随机存取点的图片处“重新开始”视频译码。清洁解码刷新(CDR)随机存取点图片的实例展示图1中。图1中的图片按显示次序展示。当前图片群组(GOP)1包含具有从141到156的图片次序计数(POC)的图片，所述图片包含随机存取点图片。在此实例中，随机存取点图片为清洁解码刷新(CDR)图片148。CDR图片为可在不参考其它图片的情况下被解码的图片。举例来说，CDR图片可为仅含有经帧内预测片段的图片。CDR图片不同于瞬时解码刷新(IDR)图片，IDR图片为另一类型的“清洁”随机存取图片。在IDR图片用于随机存取时，立刻重设经解码图片缓冲器(DPB)。在CDR图片用于随机存取时，并不立刻重设DPB。此情形相对于IDR图片随机存取提高了译码效率。

在图1中，用小写“b”标记的图片(即，图片139、141、143、145和147)为从两个其它图片双向地帧间预测的图片，如由箭头所展示。在帧间预测译码过程中，指向到的图片使用指向自的图片作为预测子。具有小写“b”的图片不用于预测其它图片。用大写“B”标记的图片(即，图片140、142、144和156)也为从两个其它图片双向地帧间预测的图片。与“b”图片相对比，使用用大写“B”标记的图片作为其它图片的预测子，如由箭头所展示。图片I₁₄₆为经帧内预测图片。即，未参考其它图片对图片I₁₄₆编码，而是使用内部空间预测来对所述图片译码。然而，图片I₁₄₆可用以预测其它图片(例如，如图1中所展示的图片b₁₄₇和b₁₄₅)。

如果在随机存取之后在CDR₁₄₈处开始解码，那么可能不会成功地解码当前GOP1中的一些图片(例如，具有POC141到147的图片)，这是因为来自前一GOP2的图片将不可用于帧间预测。即，如果从CDR₁₄₈开始解码，那么来自前一GOP的图片可能已解码或可能还没解码。因此，来自前一GOP的图片可能无法用于帧间预测。图片141到 147可能需要或可能不需要用于由按输出次序在CDR图片之后的图片(具有POC>148的图片)进行的帧间预测。按显示次序在CDR之前的图片常常被称作“潜在不必要图片”3(图1中的图片141到147)。

在图1的实例中，存在一个潜在不必要图片I₁₄₆，即使CDR₁₄₈用于随机存取，仍可成功地解码I₁₄₆。I₁₄₆仍可解码是因为其为不依赖于待解码的任何其它图片的经帧内预测图片。在一些环境下，图片(例如，按输出次序在CDR₁₄₈之后的B₁₅₆)可使用潜在不必要图片(在此状况下为I₁₄₆)进行帧间预测。用于按解码次序和显示次序在CDR之后的图片的帧间预测的潜在不必要图片被称为依附图片4。在图1的实例中，B₁₅₆为按解码次序和显示次序两者在CDR图片之后的第一个图片。如果保证I₁₄₆的解码，那么仍可使用CDR₁₄₈作为随机存取点，这是因为需要I₁₄₆用于解码按解码次序和输出次序两者在CDR₁₄₈之后的图片(例如，图片B₁₅₆)。如果依附图片4为经帧内预测图片，那么解码器可容易地确定此图片可解码。

图2为说明图片群组的实例解码次序的概念图，所述图片群组具有清洁解码刷新图片和经帧间预测依附图片。在图2的实例中，依附图片4为经帧间预测图片(P₂₄₆或B₂₄₆)。基于高效率视频译码(HEVC)标准中的CDR的当前定义，不允许此情形。这是因为不保证依附P或B图片的解码。如果在随机存取之后在CDR图片处开始视频解码，那么不确定包含任何依附图片的潜在不必要图片是否可解码，因为所述潜在不必要图片可从包含前一GOP中的图片的预测链或从当前GOP中的自身依赖于前一GOP中的图片的图片来被帧间预测。此外，在随机存取CDR图片之后，前一GOP中的图片可能是不可用的。

当前视频编解码器(编码器／解码器)设计不支持依附图片的解码。因此，当前视频编解码器设计也不支持依据依附图片进行的帧间预测，同时也不解码任何其它潜在不必要图片。不允许潜在不必要图片的解码是因为极难以确定在随机存取之后是否可成功地解码潜在不必要图片。如果潜在不必要图片为I图片，那么解码为可能的，因为可在不使用任何其它图片的情况下解码I图片。然而，如果潜在不必要图片为B或P图片(例如，图2中的P246或B246)，那么视频解码器必须首先确定复杂预测链以便识别潜在不必要图片是否可解码。举例来说，视频解码器必须首先确定图2中的图片239到248的预测链以便确定是否可成功地解码所述潜在不必要图片中的任一者。并且，当前视频编解码器设计并未提供任何机制来允许解码器确定潜在不必要图片是否将用于按解码次序在CDR之后的图片的帧间预测中(即，确定潜在不必要图片是否为依附图片)。

鉴于上文所描述的缺点，本发明提议使用待添加于图片级语法和／或片段标头语法中的语法元素(例如，旗标)作为潜在不必要图片可解码且可用于按解码次序在CDR之后的图片的帧间预测的指示(即，旗标指示潜在不必要图片为可解码依附图片)。可在经编码视频位流中通过编码器用信号发出旗标，因为编码器可确定用于潜在不必要图片的预测链是否允许在随机存取之后成功解码且潜在不必要图片是否可用于按解码次序在CDR之后的图片的帧间预测。

编码器可在对图片编码时追踪预测链且在图片处在与CDR相同的GOP中时将图片识别为潜在不必要图片。特定潜在不必要图片可接着被指派旗标(例如，依附图片旗标)以指示所述潜在不必要图片可在随机存取CDR之后解码且所述潜在不必要图片可用于按解码次序在CDR之后的图片的帧间预测(即，旗标指示潜在不必要图片为依附图片)。在一个实例中，可针对包含CDR图片的每一GOP用信号发出额外指示旗标(例如，依附指示旗标)。具有(例如)值1的依附指示旗标指示GOP中的潜在不必要图片中的至少一者为依附图片。如果是，那么针对每一潜在不必要图片用信号发出依附图片旗标。依附图片旗标指示特定潜在不必要图片是否为依附图片。如果依附指示旗标具有值0，那么此情形指示在GOP中没有潜在不必要图片为依附图片。因此，不需要针对所述GOP用信号发出依附图片旗标。在另一实例中，不使用依附指示旗标。而是，针对具有CDR图片的GOP中的所有潜在不必要图片用信号发出依附图片旗标。

作为实例，可在网络抽象层(NAL)单元标头、图片级补充增强信息(SEI)消息、片段标头或另一图片级语法元素或消息中用信号发出依附指示旗标和依附图片旗标以指示潜在不必要图片为依附图片(即，潜在不必要图片既可解码且还可在随机存取之后用于帧间预测)。NAL单元为含有用于片段的部分中所含的多个图片的视频数据的视频数据离散包。图片级SEI消息为可应用于图片的解码的补充信息。

在刚好选择当前GOP中的CDR以用于随机存取的状况下，解码器可使用此旗标来确定当前GOP中的任何潜在不必要图片是否可被成功地解码且是否可用于通过按解码次序和输出次序在CDR之后的图片进行的帧间预测(即，确定潜在不必要图片为依附图片)。

在本发明的另一实例中，可将依附指示旗标和／或依附图片旗标添加到文件格式(例如，ISO文件格式)中，使得并非依附图片的图片需要被解码和／或在应用情形(例如，基于HTTP的视频流式传输)中囊封文件以供传输的状况下不需要被传输。

ISO基础媒体文件格式经设计以含有用于以灵活、可扩展的格式呈现的定时媒体信息，所述灵活、可扩展的格式促进媒体的互换、管理、编辑和呈现。ISO基础媒体文件格式(ISO／IEC14496-12：2004)在MPEG-4第12部分中详细说明，MPEG-4第12部分定义基于时间的媒体文件的一般结构。ISO基础媒体文件格式用作家族中的例如以下其它文件格式的基础：经定义以支持H.264／MPEG-4AVC视频压缩的高级视频译码(AVC)文件格式(ISO／IEC14496-15)、3GPP文件格式以及SVC文件格式和MVC文件格式，SVC文件格式和MVC文件格式两者为AVC文件格式的扩展。ISO媒体文件格式还可通常扩展到其它视频译码标准，例如HEVC。

ISO基础媒体文件格式可含有用于媒体数据的定时序列(例如，音频视觉呈现)的时序、结构和媒体信息。所述文件结构为面向对象的。可极其简单地将文件分解成基本对象，且对象的结构由其类型隐含。

简报(动作序列)可含于若干文件中。时序和成帧(位置和大小)信息在ISO基础媒体文件中，且辅助文件可基本上使用任何格式。此简报可处在含有所述简报的系统‘本地’，或可经由网络或其它的流递送机构来传输。

遵照ISO基础媒体文件格式的文件形成为一系列对象，称作“盒(box)”。在一个实例中，所有数据含于盒中且在文件内不存在其它数据。此包含特定文件格式所需要的任何初始签名。“盒”为通过唯一类型识别符和长度定义的面向对象的建构块。

遵循ISO基础媒体文件格式的实例文件结构展示于图8中。通常，简报含于一个文件300中，其中媒体简报为自含式的。电影容器302(例如，电影盒)含有媒体的元数据，且视频和音频帧含于媒体数据容器350中和／或在其它文件中。

电影容器302可含有用于视频轨道304的元数据。电影容器302还可含有其它轨道，例如音频轨道(未图示)。视频轨道304中的元数据可存储于媒体信息容器308中。媒体信息可包含样本描述310。样本描述310可含有确切媒体类型(例如，对流进行解码所需要的解码器的类型)的‘名称’以及所述所需解码器的任何参数化。所述名称还可采取四字符码(例如，“moov”或“trak”)的形式。存在不仅用于MPEG-4媒体且还用于使用此文件格式家族的其它组织所使用的媒体类型的经定义的样本条目格式。

媒体数据容器350可包含交错式时间定序视频样本和音频帧。明确地说，媒体数据容器350可包含多个视频数据厚块(例如，视频数据厚块352和362)。每一视频数据厚块可包含多个视频样本(例如，视频样本353a-c和363a-c)。

文件具有逻辑结构、时间结构和物理结构。这些结构不需要耦合。文件的逻辑结构为电影，电影又含有一组时间并行的轨道。文件的时间结构为轨道含有在时间上的样本序列，且所述序列通过可选编辑列表而映射到整个电影的时间线中。

文件的物理结构将逻辑、时间和结构分解所需的数据与媒体数据样本自身分离。此结构信息集中于电影盒中，可能在时间上由电影片段盒扩展。所述电影盒记录样本的逻辑和时序关系，且还含有到其所处位置的指针。所述指针可指向由URL参考的同一文件或另一文件。

对元数据的支持采取两种形式。首先，可将定时元数据存储于适当轨道中，在需要时与其所描述的媒体数据(例如，媒体容器350中的视频数据厚块)同步。其次，存在对附加到电影或个别轨道的非定时元数据的一般支持。结构支持为一般性的，且如在媒体数据中，允许元数据资源存储于文件中的别处或存储于另一文件中。另外，这些资源可加以命名且可受保护。

在ISO基础媒体文件格式中，样本分组为将轨道中的样本中的每一者指派为一个样本群组中的成员。样本群组中的样本不需要为连续的。举例来说，在呈现呈AVC文件格式的H.264／AVC时，处于一个时间层级中的视频样本可被取样到一个样本群组中。通过两个数据结构来表示样本群组：SampleToGroup盒(sbdp)和SampleGroupDescription盒。SampleToGroup盒表示将样本指派给样本群组。对于每一样本群组条目而言，存在第二盒的一个实例以描述此群组的性质。

在ISO基础媒体文件格式中，定义被称作随机存取点(RAP)312样本分组的第二群组。将同步样本指定为随机存取点(例如，CDR图片)，可正确地解码按解码次序在所述随机存取点之后的所有样本。然而，可能会对“开放”随机存取点编码，可正确地解码按输出次序在所述“开放”随机存取点之后的所有样本，但不需要可正确地解码按解码次序在随机存取点之后和按输出次序在随机存取点之前的一些样本。举例来说，开始开放图片群组的帧内图片按解码次序可在经(双向)预测图片之前，经(双向)预测图片按输出次序在帧内图片之前。有可能在解码从帧内图片开始的状况下无法正确地解码这些经(双向)预测图片，且因此不需要所述经(双向)预测图片。

此些“开放”随机存取样本可通过成为此群组的成员而进行标记(由图8中的从RAP312到视频厚块352和362中的视频样本的箭头表示)。通过此群组标记的样本为随机存取点，且还可为同步点(即，不需要排除通过同步样本表标记的样本)。

下文中展示针对ISO基础文件格式的随机存取语法的实例。

语法元素num_leading_samples_known等于1指示：针对此群组中的每一样本，同步点(例如，CDR图片)之前的引导样本的数目为已知的，且由语法元素num_leading_samples指定所述数目。引导样本为与“开放”随机存取点(RAP)相关联的这样一类样本。引导样本按显示次序在RAP(例如，CDR图片)之前且按解码次序在RAP或另一引导样本之后。在解码从RAP开始时，无法正确地解码样本。语法元素num_leading_samples指定此群组中的每一样本的引导样本的数目。在num_leading_samples_known等于0时，应忽略此字段。

为了进一步实现用信号发出依附旗标(dependent_flag)，提议以下语法：

在上文实例中，按解码次序用信号发出针对引导图片的dependent_indication_flag314的值。dependent_indication_flag314指示引导样本(例如，潜在不必要图片)中的任一者是否为可在随机存取RAP(例如，CDR图片)之后正确地解码且用于解码按输出次序在RAP之后的图片的依附图片。如果dependent_indication_flag314为真(例如，具有值1)，那么针对潜在不必要图片中的每一者用信号发出dependent_flag316以指示特定图片是否为依附的。如果dependent_indication_flag314为假(例如，具有值0)，那么不需要用信号发出dependent_flag316。

在本发明的另一实例中，并不用信号发出dependent_indication_flag314，而是，针对具有RAP(例如，CDR图片)的群组中的所有潜在不必要图片用信号发出dependent_flag316。举例来说，可针对每一样本而关联不同的盒，且所述盒可含有此dependent_flag316。如果dependent_flag316为真，且因而当前图片为随机存取后的依附图片，那么旗标指示依附图片可成功地解码且可在最近CDR用于随机存取的状况下由按输出次序在CDR之后的图片用于帧间预测。如果dependent_flag316为假，那么图片不需要用于按输出次序在CDR之后的图片的帧间预测，且此外，在随机存取使用CDR发生时不需要图片。

如果相应地修改CDR定义，那么在CDR用于随机存取时不需要解码除依附图片(例如，图1和图2中的图片I146/P246/B246)以外的所有其它潜在不必要图片。在使用CDR图片进行随机存取时不需要解码用旗标标记为不可解码的依附图片的潜在不必要图片，这样可以简化解码。

图3为说明可利用本发明中所描述的随机存取译码技术的实例视频编码和解码系统10的框图。如图3中所展示，系统10包含源装置12，源装置12产生在稍后时间将通过目的地装置14解码的经编码视频数据。源装置12和目的地装置14可包括各种各样的装置中的任一者，包含桌上型计算机、笔记本型(即，膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能”电话等电话手持机、所谓的“智能”板、电视、相机、显示装置、数字媒体播放器、视频游戏控制台或其类似者。在一些状况下，源装置12和目的地装置14可经装备以用于无线通信。

目的地装置14可经由链路16接收待解码的经编码视频数据。链路16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一个实例中，链路16可包括使源装置12能够实时地将经编码视频数据直接发射到目的地装置14的通信媒体。经编码视频数据可根据通信标准(例如，无线通信协议)进行调制且被发射到目的地装置14。通信媒体可包括任何无线或有线通信媒体，例如射频(RF)频谱或一个或一个以上物理传输线。通信媒体可形成基于包的网络(例如，局域网、广域网或例如因特网等全球网络)的一部分。通信媒体可包含路由器、交换机、基站或可有用于促进从源装置12到目的地装置14的通信的任何其它设备。

在另一实例中，经编码视频还可存储于存储媒体34或文件服务器36上且可在需要时通过目的地装置14存取。存储媒体可包含多种本地存取的数据存储媒体中的任一者，例如蓝光光盘、DVD、CD-ROM、快闪存储器或用于存储经编码视频数据的任何其它合适数字存储媒体。存储媒体34或文件服务器36可为可保存由源装置12产生的经编码视频且目的地装置14可在需要时经由流式传输或下载而存取的任何其它中间存储装置。文件服务器可为能够存储经编码视频数据且将所述经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含web服务器(例如，用于网站)、FTP服务器、网络附加存储(NAS)装置或本地磁盘驱动器。目的地装置14可经由包含因特网连接在内的任何标准数据连接存取经编码视频数据。此情形可包含适合于存取存储于文件服务器上的经编码视频数据的无线信道(例如，Wi-Fi连接)、有线连接(例如，DSL、电缆调制解调器等)或两者的组合。经编码视频数据自文件服务器的传输可为流式传输、下载传输或两者的组合。

本发明的技术不一定限于无线应用或设置。技术可应用于视频译码，视频译码支持多种多媒体应用中的任一者，例如空中电视广播、有线电视传输、卫星电视传输、流式传输视频传输(例如，经由因特网)、编码数字视频以存储于数据存储媒体上、解码存储于数据存储媒体上的数字视频，或其它应用。在一些实例中，系统10可经配置以支持单向或双向视频传输以支持多种应用，例如视频流式传输、视频播放、视频广播和/或视频电话。

在图3的实例中，源装置12包含视频源18、视频编码器20和输出接口22。在一些状况下，输出接口22可包含调制器/解调器(调制解调器)和/或发射器。在源装置12中，视频源18可包含一源，例如，摄像机等视频捕获装置、含有先前捕获的视频的视频存档、从视频内容提供者接收视频的视频馈入接口，和/或用于产生计算机图形数据作为源视频的计算机图形系统，或此些源的组合。作为一个实例，如果视频源18为摄像机，那么源装置12和目的地装置14可形成所谓的相机电话或视频电话。然而，本发明中所描述的技术大体上可适用于视频译码，且可适用于无线和/或有线应用。

可通过视频编码器20来编码所捕获、预捕获或计算机产生的视频。经编码视频信息可根据通信标准(例如，无线通信协议)通过调制解调器22调制且经由发射器24发射到目的地装置14。调制解调器22可包含各种混频器、滤波器、放大器或经设计以用于信号调制的其它组件。发射器24可包含经设计以用于发射数据的电路，包含放大器、滤波器和一个或一个以上天线。

在图3的实例中，目的地装置14包含接收器26、调制解调器28、视频解码器30和显示装置32。目的地装置14的接收器26经由信道16接收信息，且调制解调器28对所述信息解调以产生用于视频解码器30的经解调位流。经由信道16传达的信息可包含由视频编码器20所产生的供视频解码器30在解码视频数据时使用的多种语法信息。此语法还可包含于存储于存储媒体34或文件服务器36上的经编码视频数据内。视频编码器20和视频解码器30中的每一者可形成能够对视频数据编码或解码的相应编码器-解码器(编解码器)的部分。

显示装置32可与目的地装置14集成或在目的地装置14的外部。在一些实例中，目的地装置14可包含集成显示装置且还经配置以与外部显示装置介接。在其它实例中，目的地装置14可为显示装置。一般来说，显示装置32向用户显示经解码视频数据，且可包括多种显示装置中的任一者，例如液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。

视频编码器20和视频解码器30可根据视频压缩标准(例如，当前在开发过程中的高效率视频译码(HEVC)标准)操作且可遵照HEVC测试模型(HM)。HEVC标准的当前草案版本呈现于由B.博罗斯(B.Bross)、W.-J.韩(W.-J.Han)、G.J.沙利文(G.J.Sullivan)、J.-R.欧姆(J.-R.Ohm)、T.维根(T.Wiegand)编辑的日期为2012年2月17日的JCTVC-H1003(“高效率视频译码(HEVC)文本规范草案6(High Efficiency Video Coding(HEVC)textspecification draft6)”，版本21)中。或者，视频编码器20和视频解码器30可根据其它专属或工业标准(例如，ITU-T H.264标准，或者被称作MPEG-4第10部分(高级视频译码(AVC)))或此些标准的扩展而操作。然而，本发明的技术不限于任何特定译码标准。视频压缩标准的其它实例包含MPEG-2和ITU-T H.263。

尽管未在图3中展示，但在一些方面中，视频编码器20和视频解码器30可各自与音频编码器和解码器集成，且可包含适当的多路复用-多路分用单元或其它硬件和软件以处置共同数据流或独立数据流中的音频和视频两者的编码。如果适用，那么在一些实例中，多路复用-多路分用单元可遵照ITU H.223多路复用器协议或例如用户数据报协议(UDP)等其它协议。

视频编码器20和视频解码器30各自可实施为包括多种合适编码器和/或解码器电路中的任一者的一个或一个以上处理器，例如，一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。在部分地以软件实施技术时，装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中且使用一个或一个以上处理器执行硬件中的指令以执行本发明的技术。视频编码器20和视频解码器30中的每一者可包含于一个或一个以上编码器或解码器中，其任一者可作为组合式编码器/解码器(CODEC)的部分集成在相应装置中。

视频编码器20可实施本发明的技术中的任一者或全部。同样地，视频解码器30可实施这些技术中的任一者或全部。作为一个实例，视频编码器20可经配置以对图片群组编码，所述图片群组包含清洁解码刷新(CDR)图片和一个或一个以上潜在不必要图片；确定所述一个或一个以上潜在不必要图片中的任一者是否为依附图片；确定所述依附图片是否可在所述CDP图片用于随机存取的状况下解码；以及用信号发出语法元素，所述语法元素指示确定所述依附图片可在所述CDR图片用于随机存取的状况下解码。

作为另一实例，视频解码器30可经配置以接收图片群组，所述图片群组包含清洁解码刷新(CDR)图片和一个或一个以上潜在不必要图片；以及接收语法元素，所述语法元素指示所述一个或一个以上潜在不必要图片中的任一者是否为依附图片，所述依附图片可在接收到对随机存取所述CDR图片的请求的状况下解码。视频解码器30可进一步经配置以接收对随机存取所述CDR图片的请求；响应于对随机存取的所述请求而对所述CDR图片解码；以及对与所述所接收语法元素对应的所述依附图片解码。

如本发明中所描述，视频译码器可指代视频编码器或视频解码器。类似地，视频编码器和视频解码器可分别被称为视频编码单元和视频解码单元。同样地，视频译码可指代视频编码或视频解码。

视频译码联合协作组(JCT-VC)当前正从事于HEVC标准的开发。HEVC标准化努力是基于被称作HEVC测试模型(HM)的视频译码装置的演进模型。当前HM根据(例如)ITU-TH.264/AVC推测相对于现有装置的视频译码装置的若干额外能力。举例来说，鉴于H.264提供9个帧内预测编码模式，HM可提供多达33个帧内预测编码模式。

一般来说，HM的工作模型描述可将视频帧或图片划分成包含明度和色度样本两者的树块或最大译码单元(LCU)的序列。树块具有与H.264标准的宏块类似的目的。片段包含数个按译码次序为连续的树块。可将视频帧或图片分割成一个或一个以上片段。可根据四叉树将每一树块拆分成译码单元(CU)。举例来说，可将作为四叉树的根节点的树块拆分成四个子节点，且每一子节点又可为父节点且被拆分成另外四个子节点。作为四叉树的叶节点的最终不可拆分的子节点包括译码节点，即经译码视频块。与经译码位流相关联的语法数据可定义一树块可被拆分的最大次数，且还可定义译码节点的最小大小。

CU包含译码节点和预测单元(PU)以及与译码节点相关联的变换单元(TU)。CU的大小对应于译码节点的大小且形状为正方形。CU的大小可在从8×8个像素直到最大64×64个像素或更大的树块的大小的范围内。每一CU可含有一个或一个以上PU和一个或一个以上TU。举例来说，与CU相关联的语法数据可描述将CU分割成一个或一个以上PU的情形。分割模式在CU是被跳过还是以直接模式编码、以帧内预测模式编码或以帧间预测模式编码之间可为不同的。PU可经分割以使形状为非正方形。举例来说，与CU相关联的语法数据还可描述根据四叉树将CU分割成一个或一个以上TU的情形。TU的形状可为正方形或非正方形。

一般来说，PU包含与预测过程有关的数据。举例来说，在PU以帧内模式编码时，PU可包含描述用于PU的帧内预测模式的数据。作为另一实例，在PU以帧间模式编码时，PU可包含界定PU的运动向量的数据。举例来说，界定PU的运动向量的数据可描述运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如，四分之一像素精度或八分之一像素精度)、运动向量所指向的参考图片，和/或运动向量的参考图片列表(例如，列表0、列表1或列表C)。

一般来说，TU供变换和量化过程使用。具有一个或一个以上PU的CU还可包含一个或一个以上变换单元(TU)。在预测之后，视频编码器20可计算对应于PU的残余值。残余值包括视频数据的当前块与视频数据的预测块之间的像素差值。残余值可变换成变换系数、经量化且使用TU扫描以产生串行化变换系数以用于熵译码。本发明通常使用术语“视频块”来指代CU的译码节点。在一些特定状况下，本发明还可使用术语“视频块”来指代包含译码节点以及PU和TU的树块，即LCU或CU。

视频序列通常包含一系列视频帧或图片。图片群组(GOP)通常包括一系列一个或一个以上视频图片。GOP可在GOP的标头中、图片中的一者或一者以上的标头中或别处包含语法数据，所述语法数据描述包含于GOP中的图片的数目。图片的每一片段可包含片段语法数据，其描述相应片段的编码模式。视频编码器20通常对个别视频片段内的视频块进行操作以便对视频数据编码。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小，且可根据所指定的译码标准而在大小上不同。

作为实例，HM支持各种PU大小的预测。假定特定CU的大小为2N×2N，则HM支持2N×2N或N×N的PU大小的帧内预测，以及2N×2N、2N×N、N×2N或N×N的对称PU大小的帧间预测。HM还支持针对2N×nU、2N×nD、nL×2N和nR×2N的PU大小的帧间预测的非对称分割。在非对称分割中，CU的一个方向未分割，而另一方向分割成25％和75％。对应于25％分割区的CU的部分由“n”后跟着“上”、“下”、“左”或“右”等指示来指示。因此，举例来说，“2N×nU”指代被水平地分割的2N×2N CU，其中2N×0.5N PU在上且2N×1.5N PU在下。

在本发明中，“N×N”与“N乘N”可互换使用以指代就垂直和水平维度来说视频块的像素尺寸，例如，16×16像素或16乘16像素。一般来说，16×16块将在垂直方向上具有16个像素(y=16)，且在水平方向上具有16个像素(x=16)。同样地，N×N块一般在垂直方向上具有N个像素，且在水平方向上具有N个像素，其中N表示非负整数值。可将块中的像素排列成行和列。此外，块未必需要在水平方向上与在垂直方向上具有相同数目的像素。举例来说，块可包括N×M个像素，其中M未必等于N。

在使用CU的PU进行帧内预测或帧间预测译码之后，视频编码器20可计算残余数据。PU可包括空间域(也被称作像素域)中的像素数据。TU可包括在应用变换(例如，离散余弦变换(DCT)、整数变换、小波变换或与残余视频数据概念上类似的变换)之后变换域中的系数。残余数据可对应于未经编码图片与预测视频块的像素之间的像素差。视频编码器20可形成包含CU的残余数据的TU，且接着变换TU以产生CU的变换系数。

在进行任何变换以产生变换系数之后，视频编码器20可执行变换系数的量化。量化通常指代一过程，在所述过程中对变换系数进行量化以可能减少用以表示系数的数据的量，从而提供进一步压缩。量化过程可减少与系数中的一些或全部相关联的位深度。举例来说，可在量化期间将n位值降值舍位到m位值，其中n大于m。

在一些实例中，视频编码器20可利用预定义扫描次序来扫描经量化变换系数以产生可被熵编码的串行化向量。在其它实例中，视频编码器20可执行自适应性扫描。在扫描经量化变换系数以形成一维向量之后，视频编码器20可(例如)根据上下文自适应性可变长度译码(CAVLC)、上下文自适应性二进制算术译码(CABAC)、基于语法的上下文自适应性二进制算术译码(SBAC)、概率间隔分割熵译码(PIPE)或另一熵编码方法来对一维向量进行熵编码。视频编码器20还可对与经编码视频数据相关联的语法元素进行熵编码以供视频解码器30在解码视频数据时使用。

为了执行CABAC，视频编码器20可将上下文模型内的上下文指派到待发射的符号。上下文可与(例如)符号的相邻值是否为非零有关。为了执行CAVLC，视频编码器20可选择待发射的符号的可变长度码。VLC中的码字可经建构以使得相对较短的码对应于较大可能的符号，而较长码对应于较小可能的符号。以此方式，VLC的使用可相对于(例如)针对待发射的每一符号使用等长码字实现了位节省。概率确定可基于指派到符号的上下文。

图4为说明可实施本发明中所描述的技术的实例视频编码器20的框图。视频编码器20可执行视频片段内的视频块的帧内译码和帧间译码。帧内译码依赖于空间预测以减少或移除给定视频帧或图片内的视频的空间冗余。帧间译码依赖于时间预测以减少或移除视频序列的邻近帧或图片内的视频的时间冗余。帧内模式(I模式)可指代若干基于空间的压缩模式中的任一者。例如单向预测(P模式)或双向预测(B模式)等帧间模式可指代若干基于时间的压缩模式中的任一者。

在图4的实例中，视频编码器20包含预测模块41、参考图片存储器64、求和器50、变换模块52、量化单元54和熵编码单元56。预测模块41包含模式选择单元40、运动估计单元42、运动补偿单元44和帧内预测模块46。预测模块41(包含含于其中的模式选择单元40、运动估计单元42、运动补偿单元44和帧内预测模块46)可被视为整个视频编码器电路的部分。针对视频编码器20所描述的任何模块或单元可被结构化为一个或一个以上可编程处理器、硬逻辑或其任何组合。为了视频块重建构，视频编码器20还包含反量化单元58、反变换模块60和求和器62。还可包含解块滤波器(图4中未展示) 以对块边界进行滤波以从经重建构视频移除方块效应假影。在需要时，解块滤波器将通常对求和器62的输出进行滤波。

如图4中所展示，视频编码器20接收待编码的视频片段内的当前视频块。片段可划分成多个视频块。模式选择单元40可基于误差结果针对当前视频块选择译码模式(帧内或帧间)中的一者，且预测模块41可将所得经帧内译码或经帧间译码块提供到求和器50以产生残余块数据且提供到求和器62以重建构经编码块以用作参考图片。

预测模块41(或视频编码器20的另一结构单元)还可经配置以确定当前GOP是否含有任何依附图片。如上文所描述，依附图片为按译码次序在CDR图片之后的图片，但还用作按译码次序和显示次序两者在CDR之后的另一图片的预测图片。预测模块41可针对含有CDR的GOP来追踪预测链。如果确定图片为依附图片，那么预测模块41可进一步确定依附图片是否可在随机存取CDR发生的状况下解码。如果依附图片的预测链不取决于来自前一GOP的任何图片(例如，在随机存取CDR的状况下从CDR或其它可解码图片帧间预测出的经帧间预测B或P图片)，或如果依附图片为经帧内预测图片(例如，图1的图片I₁₄₆)，那么确定依附图片可解码。

预测模块41可在经编码视频位流中用信号发出依附图片语法元素63(例如，依附旗标)以指示特定潜在不必要图片是否为可在随机存取CDR图片的状况下解码的依附图片。依附图片语法元素63可通过熵编码单元56进行熵译码以供包含于经编码视频位流中。如上文所论述，可在网络抽象层(NAL)单元标头、图片级补充增强信息(SEI)消息、片段标头或另一图片级语法元素或消息中用信号发出依附图片语法元素。如上文所描述，依附图片语法元素63还可存储于文件格式中。

应理解，预测模块41为可产生依附图片语法元素63的视频编码器20的结构组件的仅一实例。视频编码器20的其它结构或功能单元可单独或组合地经配置以使用上文所描述的技术产生依附图片语法元素。

预测模块41内的帧内预测模块46可执行相对于与待译码的当前块相同的帧或片段中的一个或一个以上相邻块的当前视频块的帧内预测译码以提供空间压缩。预测模块41内的运动估计单元42和运动补偿单元44执行相对于一个或一个以上参考图片中的一个或一个以上预测块的当前视频块的帧间预测译码以提供时间压缩。

运动估计单元42可经配置以根据视频序列的预定型样确定视频片段的帧间预测模式。预定型样可将序列中的视频片段指定为P片段、B片段或GPB片段。运动估计单元42和运动补偿单元44可高度集成，但为概念目的而分开说明。由运动估计单元42执行的运动估计为产生估计视频块的运动的运动向量的过程。举例来说，运动向量可指示当前视频帧或图片内的视频块的PU相对于参考图片内的预测块的位移。

预测块为被发现在像素差方面与待译码的视频块的PU密切匹配的块，像素差可通过绝对差和(SAD)、平方差和(SSD)或其它差度量确定。在一些实例中，视频编码器20可计算存储于参考图片存储器64中的参考图片的分段整数像素位置的值。举例来说，视频编码器20可计算参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此，运动估计单元42可执行关于全像素位置和分数像素位置的运动搜索且输出具有分数像素精度的运动向量。

运动估计单元42通过比较PU的位置与参考图片的预测块的位置而计算经帧间译码片段中的视频块的PU的运动向量。参考图片可从第一参考图片列表(列表0)或第二参考图片列表(列表1)中选择，所述列表中的每一者识别存储于参考图片存储器64中的一个或一个以上参考图片。运动估计单元42将计算出的运动向量发送到熵编码单元56和运动补偿单元44。

通过运动补偿单元44所执行的运动补偿可涉及基于由运动估计所确定的运动向量提取或产生预测块。在接收到当前视频块的PU的运动向量之后，运动补偿单元44即可在参考图片列表中的一者中定位运动向量所指向的预测块。视频编码器20通过从正被译码的当前视频块的像素值减去预测块的像素值来形成残余视频块，从而形成像素差值。像素差值形成块的残余数据，且可包含明度和色度差分量两者。求和器50表示执行此减法运算的一个或一个以上组件。运动补偿单元44还可产生与视频块和视频片段相关联的语法元素以供视频解码器30在解码视频片段的视频块时使用。

在运动补偿单元44针对当前视频块产生预测块之后，视频编码器20通过从当前视频块减去预测块而形成残余视频块。残余块中的残余视频数据可包含于一个或一个以上TU中且应用于变换模块52。变换模块52使用例如离散余弦变换(DCT)或概念上类似的变换等变换将残余视频数据变换成残余变换系数。变换模块52可将残余视频数据从像素域转换到变换域，例如频域。

变换模块52可将所得变换系数发送到量化单元54。量化单元54对变换系数进行量化以进一步减小位速率。量化过程可减少与系数中的一些或全部相关联的位深度。可通过调整量化参数来修改量化的程度。在一些实例中，量化单元54可接着执行包含经量化变换系数的矩阵的扫描。或者，熵编码单元56可执行所述扫描。

在量化之后，熵编码单元56对经量化变换系数进行熵编码。举例来说，熵编码单元56可执行上下文自适应性可变长度译码(CAVLC)、上下文自适应性二进制算术译码(CABAC)或另一熵编码技术。在通过熵编码单元56进行熵编码之后，可将经编码位流传输到视频解码器30或加以存档以供稍后传输或通过视频解码器30检索。熵编码单元56还可对正被译码的当前视频片段的运动向量和其它语法元素进行熵编码。

反量化单元58和反变换模块60分别应用反量化和反变换，以在像素域中重建构残余块以供稍后用作参考图片的参考块。运动补偿单元44可通过将残余块与参考图片列表中的一者内的参考图片中的一者的预测块相加来计算参考块。运动补偿单元44还可将一个或一个以上内插滤波器应用于经重建构残余块以计算分段整数像素值以供在运动估计中使用。求和器62将经重建构残余块与通过运动补偿单元44产生的经运动补偿预测块相加以产生参考块以供存储于参考图片存储器64中。参考块可由运动估计单元42和运动补偿单元44用作参考块以对后续视频帧或图片中的块进行帧间预测。

图5为说明可实施本发明中所描述的技术的实例视频解码器30的框图。在图5的实例中，视频解码器30包含熵解码单元80、预测模块81、反量化单元86、反变换单元88、求和器90和参考图片存储器92。预测模块81包含运动补偿单元82和帧内预测模块84。预测模块81可被视为整个视频解码器电路的部分。针对视频解码器30所描述的任何模块或单元可被结构化为一个或一个以上可编程处理器、硬逻辑或其任何组合。在一些实例中，视频解码器30可执行与关于来自图4的视频编码器20描述的编码过程大体上互反的解码过程。

在解码过程期间，视频解码器30接收由视频编码器(例如，视频编码器20)产生的经编码视频位流，所述经编码视频位流表示经编码视频片段的视频块和相关联的语法元素，相关联的语法元素包含依附图片语法元素63。视频解码器30的熵解码单元80对位流进行熵解码以产生经量化系数、运动向量和其它语法元素。熵解码单元80将运动向量和其它语法元素转发到预测模块81。视频解码器30可接收在视频图片级、视频片段级和/或视频块级处的语法元素。如上文所论述，可在网络抽象层(NAL)单元标头、图片级补充增强信息(SEI)消息、片段标头或另一图片级语法元素或消息中用信号发出依附图片语法元素。如上文所描述，依附图片语法元素63还可存储于文件格式中。

经编码视频位流中的由视频解码器30接收的一些图片群组可包含CDR图片。具有CDR图片的GOP中的图片还可包含依附图片语法元素63，依附图片语法元素63指示潜在不必要图片中的任一者是否为GOP中的依附图片且是否可在请求随机存取所述GOP中的CDR的状况下解码。在(例如)经由提供视频播放的计算装置的用户从用户接收随机存取请求83的状况下，视频解码器30可在与GOP相关联的CDR处开始解码且可根据所接收的依附图片语法元素63来解码任何依附图片。即，如果依附图片语法元素63指示相关联的潜在不必要图片为可在随机存取的状况下解码的依附图片，那么对所述依附图片进行解码。如果依附图片语法元素63指示相关联的潜在不必要图片不是可解码依附图片，那么可将所述潜在不必要图片舍弃且不进行解码。此外，潜在不必要图片可被解码器30识别为处在与CDR相同的GOP中但按显示次序在CDR之前的图片。

在视频片段被译码为经帧内译码(I)片段时，预测模块81的帧内预测模块84可基于用信号发出的帧内预测模式和来自当前帧或图片的先前解码块的数据而产生当前视频片段的视频块的预测数据。在视频帧被译码为经帧间译码(即，B、P或GPB)片段时，预测模块81的运动补偿单元82基于运动向量和从熵解码单元80所接收的其它语法元素而产生当前视频片段的视频块的预测块。预测块可从参考图片列表中的一者内的参考图片中的一者产生。视频解码器30可基于存储于参考图片存储器92中的参考图片使用默认建构技术来建构参考帧列表，列表0和列表1。

运动补偿单元82通过剖析运动向量和其它语法元素来确定当前视频片段的视频块的预测信息，且使用预测信息来产生正被解码的当前视频块的预测块。举例来说，运动补偿单元82使用所接收的语法元素中的一些来确定用以对视频片段的视频块进行译码的预测模式(例如，帧内预测或帧间预测)、帧间预测片段类型(例如，B片段、P片段或GPB片段)、片段的参考图片列表中的一者或一者以上的建构信息、片段的每一经帧间编码视频块的运动向量、片段的每一经帧间译码视频块的帧间预测状态和用以对当前视频片段中的视频块进行解码的其它信息。

运动补偿单元82还可基于内插滤波器执行内插。运动补偿单元82可使用如由视频编码器20在视频块的编码期间所使用的内插滤波器来计算参考块的分段整数像素的内插值。运动补偿单元82可从所接收的语法元素确定由视频编码器20使用的内插滤波器且使用所述内插滤波器来产生预测块。

反量化单元86对位流中所提供且通过熵解码单元80解码的经量化变换系数进行反量化，即进行解量化。反量化过程可包含使用通过视频编码器20针对视频片段中的每一视频块所计算的量化参数，以确定量化的程度，且同样确定应该应用的反量化的程度。反变换模块88将反变换(例如，反DCT、反整数变换或概念上类似的反变换过程)应用于变换系数以便在像素域中产生残余块。

在运动补偿单元82基于运动向量和其它语法元素产生当前视频块的预测块之后，视频解码器30通过将来自反变换模块88的残余块与由运动补偿单元82产生的对应预测块加总来形成经解码视频块。求和器90表示执行此加总运算的一个或多个组件。在需要时，还可应用解块滤波器来对经解码块滤波以便移除方块效应假影。接着将给定帧或图片中的经解码视频块存储于参考图片存储器92中，参考图片存储器92存储供后续运动补偿所使用的参考图片。参考图片存储器92还存储供稍后呈现于例如图3的显示装置32等显示装置上的经解码视频。

图6为根据上文所描述的本发明的技术的视频编码方法的实例流程图。图6的技术可通过例如图4的视频编码器20等视频编码器实施。视频编码器20可经配置以对包含清洁解码刷新(CDR)图片和一个或一个以上潜在不必要图片的图片群组(GOP)进行编码(110)。所述一个或一个以上潜在不必要图片按解码次序在CDR图片之后且按显示次序在CDR图片之前。视频编码器20还可确定所述一个或一个以上潜在不必要图片中的任一者是否为依附图片(112)。依附图片用于按解码次序和显示次序两者在CDR图片之后的图片的帧间预测。

如果潜在不必要图片中的任一者为依附图片，那么视频编码器20可进一步确定依附图片是否可在CDR图片用于随机存取的状况下解码(114)，如上文参看图4所描述。视频编码器20可进一步在经编码视频数据位流中用信号发出语法元素，所述语法元素指示潜在不必要图片为依附图片(116)，依附图片被确定为可在CDR图片用于随机存取的状况下解码。在一个实例中，可在网络抽象层单元标头和图片级补充增强信息(SEI)消息中的一者或一者以上中用信号发出语法元素。在另一实例中，如上文所描述，在文件格式中用信号发出语法元素。

图7为根据上文所描述的本发明的技术的视频解码方法的实例流程图。图7的技术可通过例如图5的视频解码器30等视频解码器实施。视频解码器30可经配置以接收包含清洁解码刷新(CDR)图片和一个或一个以上潜在不必要图片的图片群组(120)。视频解码器30可进一步经配置以接收语法元素，所述语法元素指示潜在不必要图片为依附图片且可在接收到对随机存取CDR图片的请求的状况下解码(122)。依附图片用于按解码次序和显示次序两者在CDR图片之后的图片的帧间预测。

视频解码器30可进一步经配置以接收对随机存取CDR图片的请求(124)。在接收到随机存取请求的状况下，视频解码器30可进一步经配置以响应于对随机存取的请求而对CDR图片解码(126)，以及对与所接收语法元素对应的依附图片解码(128)。另外，视频解码器30还可经配置以跳过针对所述一个或一个以上潜在不必要图片中通过语法元素指示为并非依附图片的任一者的解码(130)。在一个实例中，在网络抽象层单元标头和图片级补充增强信息(SEI)消息中的一者或一者以上中接收语法元素。在另一实例中，如上文所描述，在文件格式中存储语法元素。

在一个或一个以上实例中，所描述的功能可用硬件、软件、固件或其任何组合来实施。如果以软件来实施，那么功能可作为一个或一个以上指令或代码而存储于计算机可读媒体上或经由计算机可读媒体来传输，且通过基于硬件的处理单元来执行。计算机可读媒体可包含计算机可读存储媒体或通信媒体，计算机可读存储媒体对应于例如数据存储媒体等有形媒体，通信媒体包含促进计算机程序(例如)根据通信协议从一处传送到另一处的任何媒体。以此方式，计算机可读媒体大体上可对应于(1)非暂时性的有形计算机可读存储媒体或(2)例如信号或载波等通信媒体。数据存储媒体可为可由一个或一个以上计算机或一个或一个以上处理器存取以检索用于实施本发明中所描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。

作为实例而非限制，此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器，或可用于存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。并且，任何连接可适当地称作计算机可读媒体。举例来说，如果使用同轴电缆、光缆、双绞线、数字订户线(DSL)，或例如红外线、无线电和微波等无线技术而从网站、服务器或其它远程源传输指令，那么同轴电缆、光缆、双绞线、DSL，或例如红外线、无线电和微波等无线技术包含于媒体的定义中。然而，应理解，计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它暂时性媒体，而是针对非暂时性、有形的存储媒体。如本文中所使用，磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘和蓝光光盘，其中磁盘通常以磁性方式复制数据，而光盘通过激光以光学方式复制数据。以上各物的组合还应包含于计算机可读媒体的范围内。

可通过一个或一个以上处理器来执行指令，所述一个或一个以上处理器例如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成电路或离散逻辑电路。因此，如本文中所使用，术语“处理器”可指代前述结构或适于实施本文中所描述的技术的任何其它结构中的任一者。另外，在一些方面中，本文所描述的功能性可提供于经配置以用于编码和解码的专用硬件和/或软件模块内，或并入于组合式编解码器中。并且，所述技术可完全实施于一个或一个以上电路或逻辑元件中。

本发明的技术可实施于多种装置或设备中，包含无线手持机、集成电路(IC)或IC的集合(例如，芯片集)。本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面，但未必要求通过不同的硬件单元实现。而是，如上文所描述，各种单元可组合于编解码器硬件单元中或由互操作的硬件单元的集合(包含如上文所描述的一个或一个以上处理器)结合合适的软件和/或固件来提供。

已描述了各种实例。这些和其它实例属于所附权利要求书的范围内。

Claims

1.一种对视频数据编码的方法，其包括：

由视频编码器对图片群组编码，所述图片群组包含随机存取图片和按显示次序在所述随机存取图片之前的一个或多个潜在不必要图片；

由所述视频编码器确定所述一个或多个潜在不必要图片中的一者是否可在所述随机存取图片用于随机存取的状况下解码；以及

由所述视频编码器在网络抽象层(NAL)单元标头中用信号发出语法元素，所述语法元素指示所述潜在不必要图片中的一者是否被确定为可在所述随机存取图片用于随机存取的状况下解码。

2.根据权利要求1所述的方法，其进一步包含：

由所述视频编码器确定被确定为可以解码的一个或多个潜在不必要图片中的一者是否为依附图片，其中所述依附图片用于按解码次序和显示次序两者都在所述随机存取图片之后的至少一个图片的帧间预测。

3.根据权利要求1所述的方法，其进一步包括由所述视频编码器在所述一个或多个潜在不必要图片的文件格式容器中用信号发出所述语法元素。

4.一种对视频数据解码的方法，其包括：

由视频解码器接收图片群组，所述图片群组包含随机存取图片和按显示次序在所述随机存取图片之前的一个或多个潜在不必要图片；以及

由所述视频解码器在网络抽象层(NAL)单元标头中接收语法元素，所述语法元素指示所述潜在不必要图片中的一者是否可在接收到对所述随机存取图片进行随机存取的请求的状况下解码。

5.根据权利要求4所述的方法，其进一步包括：

由所述视频解码器接收随机存取所述随机存取图片的请求；

由所述视频解码器响应于随机存取的请求而对所述随机存取图片解码；以及

由所述视频解码器根据所接收的语法元素对所述潜在不必要图片解码。

6.根据权利要求5所述的方法，其进一步包括：

由所述视频解码器跳过对由所接收的语法元素未指示为可以解码的潜在不必要图片进行解码。

7.根据权利要求4所述的方法，其进一步包括由所述视频解码器确定被确定为可以解码的一个或多个潜在不必要图片中的一者是否为依附图片，以及将所述依附图片用于按解码次序和显示次序两者都在所述随机存取图片之后的至少一个图片的帧间预测。

8.根据权利要求4所述的方法，其中所述语法元素存储在用于所述一个或多个潜在不必要图片的文件格式容器中。

9.一种经配置以对视频数据编码的设备，其包括：

存储器，其经配置以存储视频数据；以及

视频编码器，其经配置以：

对图片群组编码，其中所述图片群组包含随机存取图片和按显示次序在所述随机存取图片之前的一个或多个潜在不必要图片；

确定所述一个或多个潜在不必要图片中的一者是否可在所述随机存取图片用于随机存取的状况下解码；以及

在网络抽象层(NAL)单元标头中用信号发出语法元素，所述语法元素指示所述潜在不必要图片中的一者是否被确定为可在所述随机存取图片用于随机存取的状况下解码。

10.根据权利要求9所述的设备，其中所述视频编码器进一步经配置以确定被确定为可以解码的一个或多个潜在不必要图片中的一者是否为依附图片，其中所述依附图片用于按解码次序和显示次序两者都在所述随机存取图片之后的至少一个图片的帧间预测。

11.根据权利要求9所述的设备，其中所述视频编码器进一步经配置以在用于所述一个或多个潜在不必要图片的文件格式容器中用信号发出所述语法元素。

12.一种经配置以对视频数据解码的设备，其包括：

存储器，其经配置以存储视频数据；以及

视频解码器，其经配置以：

接收图片群组，其中所述图片群组包含随机存取图片和按显示次序在所述随机存取图片之前的一个或多个潜在不必要图片；以及

在网络抽象层(NAL)单元标头中接收语法元素，所述语法元素指示所述潜在不必要图片中的一者是否可在接收到对所述随机存取图片进行随机存取的请求的状况下解码。

13.根据权利要求12所述的设备，其中所述视频解码器进一步经配置以：

接收随机存取所述随机存取图片的请求；

响应于随机存取的请求而对所述随机存取图片解码；以及

根据所接收的语法元素对所述潜在不必要图片解码。

14.根据权利要求13所述的设备，其中所述视频解码器进一步经配置以：

跳过对由所接收的语法元素未指示为可以解码的潜在不必要图片进行解码。

15.根据权利要求12所述的设备，其中所述视频解码器进一步经配置以确定被确定为可以解码的一个或多个潜在不必要图片中的一者是否为依附图片，以及将所述依附图片用于按解码次序和显示次序两者都在所述随机存取图片之后的至少一个图片的帧间预测。

16.根据权利要求12所述的设备，其中所述语法元素存储在用于所述一个或多个潜在不必要图片的文件格式容器中。

17.一种经配置以对视频数据编码的设备，其包括：

用于对图片群组编码的装置，所述图片群组包含随机存取图片和按显示次序在所述随机存取图片之前的一个或多个潜在不必要图片；

用于确定所述一个或多个潜在不必要图片中的一者是否可在所述随机存取图片用于随机存取的状况下解码的装置；以及

用于在网络抽象层(NAL)单元标头中用信号发出语法元素的装置，所述语法元素指示所述潜在不必要图片中的一者是否被确定为可在所述随机存取图片用于随机存取的状况下解码。

18.根据权利要求17所述的设备，其进一步包含：

用于确定被确定为可以解码的一个或多个潜在不必要图片中的一者是否为依附图片的装置，其中所述依附图片用于按解码次序和显示次序两者都在所述随机存取图片之后的至少一个图片的帧间预测。

19.根据权利要求17所述的设备，其进一步包括：

用于在用于所述一个或多个潜在不必要图片的文件格式容器中用信号发出所述语法元素的装置。

20.一种经配置以对视频数据解码的设备，其包括：

用于接收图片群组的装置，所述图片群组包含随机存取图片和按显示次序在所述随机存取图片之前的一个或多个潜在不必要图片；以及

用于在网络抽象层(NAL)单元标头中接收语法元素的装置，所述语法元素指示所述潜在不必要图片中的一者是否可在接收到对所述随机存取图片进行随机存取的请求的状况下解码。

21.根据权利要求20所述的设备，其进一步包括：

用于接收随机存取所述随机存取图片的请求的装置；

用于响应于随机存取的请求而对所述随机存取图片解码的装置；以及

用于根据所接收的语法元素对所述潜在不必要图片解码的装置。

22.根据权利要求21所述的设备，其进一步包括：

用于跳过对由所接收的语法元素未指示为可以解码的潜在不必要图片进行解码的装置。

23.根据权利要求20所述的设备，其进一步包括：

用于确定被确定为可以解码的一个或多个潜在不必要图片中的一者是否为依附图片的装置；以及

用于将所述依附图片用于按解码次序和显示次序两者都在所述随机存取图片之后的至少一个图片的帧间预测的装置。

24.根据权利要求20所述的设备，其中所述语法元素存储在用于所述一个或多个潜在不必要图片的文件格式容器中。