CN103416003A - 改进的nal单元头部 - Google Patents
改进的nal单元头部 Download PDFInfo
- Publication number
- CN103416003A CN103416003A CN2012800127035A CN201280012703A CN103416003A CN 103416003 A CN103416003 A CN 103416003A CN 2012800127035 A CN2012800127035 A CN 2012800127035A CN 201280012703 A CN201280012703 A CN 201280012703A CN 103416003 A CN103416003 A CN 103416003A
- Authority
- CN
- China
- Prior art keywords
- layer
- nal unit
- flag
- unit header
- nal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/65—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
所公开的是利用改进的网络自适应层(NAL)单元头部的可缩放、多视图和多个描述视频编码的技术。NAL单元头部可包括layer-id,该layer-id是对层描述的表的参考,该层描述规定层的性质。改进的NAL单元头部还可包括用于参考画面管理和标识时间层的字段。
Description
说明书
相关申请的交叉引用
本申请要求2011年1月14日提交的题为“Improved NAL Unit Header forSupporting Quality/Spatial Scalability(用于支持质量/空间可缩放性的改进的NAL单元头部)”的美国临时申请S/N61/432,836的优先权,其公开内容全篇地援引包含于此。
技术领域
本申请涉及视频压缩系统,且尤其涉及使用可缩放/同时联播/多视图视频编码技术的系统,其中将两个或更多层用于表示给定的视频信号。
背景技术
某些商业视频压缩技术可使用众多视频编码标准来实现跨销售者的互通性。本公开可与这种视频编码标准共同使用,具体地说是从瑞士CH-1211Geneva20联合国广场的国际电信联盟(ITU)或http://www.itu.int/recT-REC-H.264获得的ITU-T Rec.H.264“Advanced video coding for genericaudiovisual services(一般视听服务的先进视频编码)”2010年3月,并被全篇地援引包含于此。
H.264的最初版本在2003年批准,并且包括编码工具,例如灵活的参考画面选择模型,其允许时间可缩放性。在2007年批准的后续版本在附件G中增加了向可缩放视频编码(SVC)的扩展,包括用于空间可缩放性和质量可缩放性的技术,也称为信噪比(ANR)可缩放性。2009年批准的又一个版本在附件H中包括多视图编码(MVC)。
H.264的较早版本是在不特别关注后面版本的需求的情况下设计的。这已经导致若干确定的架构缺点,例如在网络自适应层(NAL)单元头部的设计中,其中的一些缺点通过所公开的主题解决。2012年1月4日提交的题为“HighLayer Syntax for Temporal Scalability(用于时间可缩放性的高层句法)”的共同待审的美国申请SN.13/343,266(其公开内容通过引用整体结合于此)至少在时间可缩放性的信令方面解决潜在的缺点,同时2012年3月10日提交的题为“Dependency Parameter Set for Scalable Video Coding(用于可缩放视频编码的依存性参数集)”的共同待审的美国临时专利申请SN61/451,454(其公开内容通过引用整体结合于此)解决至少与层依存性的信令有关的潜在缺点。
在H.264中,比特流在逻辑上细分为NAL单元。在一个或更多个切片NAL单元中编码每个经编码的画面。还针对不同类型的数据(诸如参数集、SEI消息等)定义很多其它NAL单元类别。在一些情况下,NAL单元能够“独立解析”,是因为NAL的损失不会防止其它NAL单元的有意义的解码和使用。因此,NAL单元可被置于遭受分组损失的分组网络的分组中。这种使用情况是在从诸如MAPEG-2(可从http://www.itu.int/rec/T-REC-H.262获得的ITU-T Rec.H.262"Information technology-Generic coding of moving pictures and associatedaudio information:Video(信息技术-移动画面和相关联的音频信息的一般编码:视频)",02/2000,也称为MPEG-2视频,通过引用结合于此)之类的较早的视频压缩标准已知的比特流概念上引入NAL单元概念的动机之一。
贯穿该公开,利用遵循H.264中规定的协定的句法表图。为了简要概况这些协定,使用C式符号。黑体字符串涉及从比特流(可由NAL单元组成,该NAL单元例如由开始代码或分组头部分离)获取的句法元素。句法图表的“描述符”列提供数据类型的信息。例如,u(2)指代2比特长的无符号整数,f(1)指代预定值的单个比特。
图1示出基线H.264和SVC和MVC扩展的NAL单元头部。基线NAL单元头部是NAL单元句法指定的一部分,在省略某些部分的情况下示出(101)以免混淆本公开。具体地,NAL单元头部包括forbidden_zero_bit(禁止_零_比特)(102)、指示解码过程中NAL单元的相对重要性的两个比特(nal_ref_idc,103)以及指示NAL单元类型的五个比特(104)。对于某些NAL单元类型,即类型14和20,它们被定义为用于可缩放和多视图编码的切片类型,如if()语句(105)所指示的,包括进一步的svc_extension_flag(svc_扩展_标记)比特(106)以及(107)nal_unit_header_svc_extension()(nal_单元_头部_svc_扩展())(108)或nal_unit_header_mvc_extension()(nal_单元_头部_mvc_扩展())(109),如由(107)svc_extension_flag所指示的。
nal_unit_header_svc_extension()和nal_unit_header_mvc_extension()的C函数式参考涉及分别示为SVC NAL单元头部扩展(110)和MVC NAL单元头部扩展(120)的句法表。
对于SVC NAL单元头部扩展(110),在本公开的上下文中的特定相关性是以下的字段:
priority_id字段(111)可用于线性地信令同一可缩放比特流的一层相对于其它层的相对重要性,如编码器所确定的,其中层可以是时间、空间或SNR可缩放层中的任一个。依存层具有比其依存的层更高的priority_id(优先级_id)。Priority_id不被H.264解码过程定义所使用,但可由例如解码器或媒体知晓网络要素(MANE)使用以标识某些层的解码不需要的NAL单元(其中该层在层等级中比具有高priority_id值的NAL单元所属的层低)。H.264基于dependency_id(依存_id)、quality_id(质量_id)和temporal_id(时间_id)的值规定对其值的某些限制。
no_inter_layer-Pred_flag(无_层_间-预测_标记)(112)指示NAL单元所属的层不涉及任何其它层来进行预测。如果针对给定层的所有NAL单元设置,则该标记可指示该层可被解码而不关注任何其它层,从而允许诸如同时多播之类的技术。
dependency_id字段(113)指示NAL单元所属的空间层或粗粒度SNR可缩放层——值越高,层越高。Quality_id和temporal_id指示SNR可缩放和时间可缩放层的类似性质。
MVC NAL单元扩展头部(120)包括以下的有关字段。
Priority_id(121)和temporal_id(123)具有与上述关于SVC头部priority_id(111)和temporal_id(115)字段相似的语义。View_id(视图_id)标识多视图系统的高达1024个“视图”中的一个输出,该视图可以是例如来自在不同地理位置处捕捉3D空间中的相同场景的不同相机的经编码的信号。基于在视图之间存在可通过预测消除的冗余的观察,MVC允许跨多个视图的预测。
在H.264的可缩放扩展的规定中的一个目标是允许由在可缩放扩展的批准之前设计的遗留解码器(例如,由遵守H.264的2003版本的任何简介的解码器)解码可缩放基层。出于这个和其它原因,还没有向后不兼容变化被引入基层句法。然而,可存在与在可缩放编码上下文(即,结合至少一个增强层)中的基层解码有关或甚至影响该基层解码的某些控制信息,在孤立地解码基层的上下文中不需要这种控制信息,因此未被包含在例如H.264的2003版本中。该信息的一些也可以是MVC相关的。该类别的信息的句法通过例如接下来描述的机制增加到H.264的可缩放扩展。
第一机制是将不同的NAL单元类型用于属于可缩放或多视图编码的切片数据,它可触发在NAL单元头部中附加字段的呈现,如已经描述的那样。
第二机制是引入前缀NAL单元。它使用先前保留的NAL单元类型之一,这表示不识别保留类型的遗留解码器将忽略其内容,而可缩放或多视图解码器能解释其内容。在图2中示出前缀NAL单元(201)的句法。NAL单元可包括store_ref_base_pic_flag(存储_参考_基_画面_标记)(202),指示除此之外且仅当满足附加条件时基础画面标记信息(203)的存在。虽然这种信息的精确性质对于本公开可能不是特别相关的,但在可缩放解码情况下解码过程需要其内容。
第三机制称为scalability_info(可缩放性_信息)SEI消息。在H.264中定义的补充增强信息(SEI)消息不应包括解码过程所需的信息,而是旨在用于对解码器、MANE或整个系统布局的其它部分(诸如呈现)有帮助的信息。
可缩放性信息SEI消息可被视为可缩放比特流的描述,包括诸如其层、层间依存性等的描述等方面。在H.264规定中的SEI消息的句法表大约2页长。其对于本公开有关的某些部分在图3中再现。可缩放性信息SEI消息(301)包括若干与可缩放比特流(即所有的层)有关的标记,之后跟随指示层(302)的数量的整数。对于这些层中的每一层,以下的字段是可用的。
layer_id(层_id)(303)字段提供层的标识。它可用于例如交叉参考位于未描述的SEI消息的部分中的层与其它层描述(诸如层间依存性描述)。例如,在SEI消息中依存层与他依存于的层之间的捆绑通过layer_id建立。
priority_id(304)、dependency_id(305)、quality_id(306)和temporal_id(307)字段的含义与在SVC NAL单元头部字段背景中已经描述的具有相同名称的那些相似。
所有的三种机制可被描述为“附加”到H.264的非可缩放版本(在2007年前批准的版本)。虽然保留向后兼容性,但该设计通常未被表征为精致,可导致对于可缩放扩展的NAL单元和画面不必要的高开销,并且可具有误差弹性问题。
作为不必要的高开销的示例,当使用H.264字节流句法时,在比特流中给定NAL单元的高开销是对于开始代码的至少四个八位位组。类似地,当使用IP网络并且将NAL单元置于其自身的分组中时,开销可以是40个八位位组或更多(12个八位位组用于IP头部、8个八位位组用于UDP头部以及20个八位位组用于RTP头部)。尽管聚集技术以及头部压缩技术能够将该开销减小到某一程度,但进一步减少开销和/或完全避免它将是优选的。
关于误差弹性,图4示出视频会议系统的简化框图。解码器(401)可产生包括属于一个以上的层的NAL单元的可缩放比特流(402)。比特流(402)图示为实线以指示它具有某一比特率。比特流(402)可在网络链路上被转发至媒体感知网络单元(MANE)403。MANE(403)的功能可以是将比特流向下“修剪”至由第二网络链路提供的某一比特率,例如通过选择性地去除属于最高层的那些NAL。这由从MANE(103)送至解码器(405)的比特流(404)的虚线表示。如果可缩放比特流(402)仅包含基层和一个增强层的NAL单元,则在修剪之后,比特流(404)仅包含基层的NAL单元。解码器(405)可从MANE(403)接收经修剪的比特流(404),并对其解码和呈现。
在这一应用中,连接中非常早的MAME处(理想地在任何层的任何经编码的切片NAL单元之前)的可缩放性信息SEI消息在比特流(402)中由MANE接收,对解码器性能可能有不利影响和/或在解码器实现中引起不必要的高成本。例如,在不知道可缩放性结构(例如:层数及其依存性)的情况下,MANE(403)可能需要转发,并且解码器(405)可能需要缓冲并且在可能的范围内解码其接收的所有NAL单元,即使是那些不用于呈现的单元(例如,因为它们属于比手持设备的显示器更高分辨率的空间层)。类似地,如果MANE(403)接收高复杂度的可缩放比特流(很多层)但知道接收解码器仅可处理非可缩放比特流或低复杂度的可缩放比特流(几个层),则MANE(403)很难决定哪些NAL单元转发到有限能力的解码器。包括可缩放性信息SEI消息的SEI消息可能是难以获得的,因为例如它在比特流(402)的传输器件丢失,或者因为编码器(401)决定不发送SEI消息,例如用于节省消息的比特(这是符合标准的,尽管从应用设备观点看并不明智)。
MANE也可能需要维持状态,尤其是对可缩放性信息SEI消息的内容,由此对修剪作出消息灵通的决策。这种状态仅可通过截取和解释所有的这些SEI消息来建立。尽管多数MANE需要拦截和翻译一些比特流信息,诸如参数集信息,以作出有意义的决策,但众多SEI消息中很少几个对MANE具有任何意义。只为了提取和解释那些对MANE具有意义的少数几个而拦截所有SEI消息是繁重的和计算昂贵的过程。
简言之,H.264的与NAL单元头部有关的可缩放和多视图句法由于可缩放和多视图扩展的“附加”设计而包含若干潜在的缺点。第一,扩展头部的NAL单元的NAL单元头部可能不必需要地大。与画面缓冲管理有关的信息在其自身的NAL单元(前缀NAL单元)中发送,这可引起不必要的高开销。此外,对于某些应用重要的信息(诸如在可缩放信息SEI消息中承载的信息)在SEI消息中承载,这(a)不反映它们的关键性质(SEI可被丢弃),以及(b)可能需要例如在NAL单元头部中对一些信息的不必要复制(诸如dependency_id、quality_id、view_id)。
最近,高效视频编码(HEVC)已经被视为标准。HEVC的工作草案可在(B.Bross等人的、可从http://wftp3.itu.int/av-arch/jctvc-site/2011_07_F_Torino/获得的“WD4:Working Draft4of High-Efficiency Video Coding(WD4:高效视频编码的工作草案4)”)中找到,此后将其称为“WD4”,其内容援引包含于此。HEVC继承了H.264的许多高级句法特征。如果在标准被批准前解决H.264的前述缺点,对HEVC的成功是有利的。
发明内容
所公开的主题提供NAL单元头部,该NAL单元头部比H.264或WD4中描述的效率高,且允许轻量级MANE和解码器实现。结合其它技术,诸如在共同待审S/N.61/451,454中描述的依存性参数集(DPS)并且嵌入在题为“Techniques for Layered Video Encoding and Decoding(分层视频编码和解码的技术)”的共同待审专利申请中描述的高级架构中,该专利申请与本申请同时提交并且被转让给同一受让人,其公开内容通过引用结合于此,所公开的主题可克服上述潜在的缺点。
在实施例中,NAL单元头部包括layer_id。layer_id可由例如六比特整数表示。layer_id可涉及位于层描述的表中的层的描述。
在同一实施例或另一个实施例中,层描述的表被包含在依存性参数集或高级句法结构中,用于与依存性参数集基本相似的目的。
在同一实施例或另一个实施例中,在NAL单元头部中称为layer_id的层描述包括用于dependency_id、quality_id、view_id、depth_map_flag(深度_图_标记)和dependent_flag(依存_标记)中的至少一个的字段。
在同一实施例或另一个实施例中,depth_map_flag可指示与其相关联的一个或多个层是深度图。与深度图的联合可利用view_id来建立,该深度图可按每个样本为基础指示样本的关于视图的第三维度(深度)。
在同一实施例或另一个实施例中,NAL单元头部包括temporal_id和layer_id。temporal_id可涉及由layer_id参考的描述定义的(空间/质量/视图/深度图)层的时间子层。概念上,这导致时间层在层具有分配的layer_id的意义上不被视为层,这映射到HEVC架构,在于当前开发的HEVC版本1被预期允许时间可缩放性而不是空间/质量可缩放性或多视图特征。
在同一实施例或另一个实施例中,预留一个预定的layer_id值用于扩展机制。
在同一实施例或另一个实施例中,layer_id可共同用作层在层等级中位置的指示,与H.264中的priority_id的通常使用(而不是表示、约束或推导机制)没什么不同。
在同一实施例或另一个实施例中,NAL单元头部包括store_ref_base_pic_flag和use_ref_base_pic_flag(使用_参考_基_画面_标记)中的至少一个。
在同一实施例或另一个实施例中,切片头部包括store_ref_base_pic_flag和use_ref_base_pic_flag中的至少一个。
在同一实施例或另一个实施例中,编码器可创建如上所述的至少一个NAL单元。
在同一实施例或另一个实施例中,考虑到layer_id可指示层在层等级中的位置,MANE或解码器可基于layer_id修剪可缩放比特流。
附图说明
图1示出根据H.264的NAL单元头部和扩展的句法图。
图2示出根据H.264的前缀NAL单元的句法图。
图3示出根据H.264的可缩放性信息SEI消息的句法图。
图4示出包括编码器、MANE和解码器的视频会议系统的示意图。
图5示出根据所公开的主题的实施例的改进的NAL单元头部的句法图。
图6示出由层等级的层使用并且参考层描述的表中的层描述的layer_id和temporal_id的示意图。
图7示出根据所公开的主题的实施例的改进的NAL单元头部的句法图。
图8示出由层等级的层使用并且参考层描述的表中的层描述的layer_id的示意图。
图9示出由两个层等级的同时多播层使用并且参考层描述的表中的层描述的layer_id的示意图。
图10示出利用NAL单元头部的解码器的流程图。
图11示出根据所公开的主题的实施例的用于视频编码的计算机系统。
这些附图被结合且组成本公开的一部分。除非另外指明,否则全部附图中的相同附图标记和字符用来表示所示实施例的相同特征、元素、组件、或部分。此外,当现在将参考附图详细地描述所公开的主题时,结合说明性实施例来完成该描述。
具体实施方式
图5示出根据所公开的主题的NAL单元头部(501)的句法图。NAL单元头部可包括以下的标记和字段:
可包括orbidden_zero_bit(502)(例如1位长,并且强制为0),以防止利用某些复用格式的开始代码仿真,诸如MPEG-2系统。
可包括nal_ref_flag(nal_参考_标记)(503)(例如1位长)。当设置成1时,该标记可指示解码过程需要NAL单元。该标记可允许MANE和/或解码器标识解码过程不需要的NAL单元,并且例如在没有充足的比特率和/或处理循环的情况下丢弃这种标识的NAL单元。
可包括例如nal_unit_type(nal_单元_类型)(504)(例如6位长)。nal_unit_type指示NAL单元的类型。H.264用尽几乎所有其分配的24个NAL单元类型,并且需要某些扩展机制将不同的NAL单元类型复用至nal_unit_type的相同值;六位字段允许高达64个NAL单元类型,并且因此应当有助于避免使用这种扩展机制。NAL单元类型例如可涉及不同类型的参数集NAL单元(诸如,依存性参数集、序列参数集、画面参数集)、不同类型的切片NAL单元(诸如,IDR切片、P切片、B切片)、SEI消息NAL单元等等。
对于涉及经编码的切片的这些NAL单元类型(由if()语句505表达),NAL单元头部可附加地包括temporal_id(3位)(506),用于标识NAL单元所属的时间子层。例如已经在S/N13/343,266中描述了时间层。用于经编码的切片的NAL单元头部中还包括layer_id(506)(5位)。
NAL单元头部的字段被示为固定长度的整数或标记。从实现和规范角度看,使用固定长度的整数或标记的优点在于NAL单元头部还可用作例如RTP有效载荷头部。尽管从该角度看NAL单元头部中数据的整数或布尔表示是优选的,但还存在支持NAL单元头部信息的其它熵编码机制的其它考虑因素。
图6示出使用改进的NAL单元头部(601)的示例。在该示例中,NAL单元类型是1,指示切片。Layer_id被设置为2,且temporal_id被设置为1,指示对定义时间增强子层的参考。
可将layer_id用于参考(602)层描述的表(604)中具有相同layer_id(603)的条目。在layer_id2(603)的条目中,dependency_id被设置为1且quality_id也被设置为1。未示出的是指示层之间的预测关系的信息;共同待审的美国专利申请S/N.61/451,454(DPS)包括该信息的详细描述。这种参考(602)以虚线示出,以便将NAL单元头部中的layer_id和层描述的表中的layer_id之间的逻辑参考与层间预测关系区分开,如稍后描述的。
还描述了层结构。具有为0的temporal_id的基层(605)(在图中以“T0”指示)用于空间增强层(606)(也具有为0的temporal_id)的预测。通过质量增强层(607)涉及空间增强层(606)。层间预测参考以黑体箭头(608)和(609)示出。如已经描述的,这些层间预测关系的表示也示出在层描述的表中。
与H.264中dependency_id和quality_id的NAL单元去参考(de-reference)被用于标识目标层相同的方式,由layer_id=2(603)参考的层描述的表中的条目通过dependency_id和quality_id涉及质量增强层(607)。
还示出的众多的时间增强子层,表示为T1或T2(分别用于第一和第二时间增强子层)。例如,质量增强层(607)具有两个时间增强子层,T1(610)和T2(611)。与用于示出基层和增强层与它们的层间预测关系的黑体线相反,时间增强子层与它们的层间预测关系用虚线描绘。temporal_id字段直接涉及temporal_enhancement(时间_增强)子层,该temporal_enhancement子层基于layer_id所涉及(间接)的基层或增强层。
layer_id还可共同用作给定层在层等级中的位置的指示。在示例中,层(605)具有layer_id0,层(606)具有layer_id1,而层(607)具有layer_id2。MANE或解码器在需要丢弃层或子层的NAL单元时可标识属于可被丢弃的层的NAL单元。例如,如果MANE或解码器发现自己需要丢弃属于层(606)(由layer_id1标识)的NAL单元,则显然层间预测关系(609)可能不会被保持,因此,MANE或解码器也可丢弃layer_id大于1(例如,layer_id=2)的NAL单元。对于去除属于时间子层的NAL单元,也是如此。
图7示出NAL单元头部(701)的不同设计的句法图。第一八位位组可类似于图5中示出和描述的NAL单元头部。然而,第二八位位组至少部分地由layer_id(702)填充,但省略temporal_id。可留下第二八位位组的零或更多位;示出的是一个这样的位(703)。在这一设计中,时间层不被视为子层,但有资格作为层,如图8所示。该层结构类似于图6的层结构。然而,层描述表(801)由所有的空间、质量和时间增强层填充。因此,现在表中有7个条目。NAL单元头部(802)包含layer_id(803),涉及(804)层描述表(801)中的一个条目(805)。该条目标识(有可能在其它字段中)dependency_id、quality_id和temporal_id,并且可用于标识(806)所有空间、质量和时间维度中的层。如已经描述的,层描述表还可包括用于其它维度的条目,诸如view_id和/或depth_map_flag。
上述技术还支持同时多播。在本文中同时多播涉及其中有多个基层的机制,如图9所示。
为了支持分层结构中的多个基层,可将no_inter_layer_prediction_flag(无_层_间_预测_标记)用于标识那些不需要任何其它层用于层间预测的层。标记可位于层描述标中的条目中。
图9示出两个层结构。基层(901)用于由质量增强层(902)进行的预测,质量增强层(902)进而由时间增强层(903)参考。第二基层(904)可通过时间增强层(905)增强。两个基层的不同之处在于例如其空间分辨率,这是同时多播的一种使用情况。在该示例中,假设基层(904)具有比基层(901)更高的空间分辨率。在该示例中,当仅时间和质量增强层在使用时,任何增强层的空间尺寸可与其相应的(参考的)基层相同。结果,在不同的时间和/或质量版本中,在缩放/同时多播比特流中可用两种分辨率。
层描述表(906)可用两个基层(902)(904)各自的条目(907)(909)以及空间增强层(903)的条目(908)填充。两个基层由设置为1的no_inter_layer_prediction_flag(910)标识,而在空间增强层(其可能需要另一个层用于预测)的层描述表中,no_inter_layer_prediction_flag被设置为0。
编码器可控制用于layer_id的值。在示例中,编码器通过划分(本示例中)5位二进制编码的layer_id字段所允许的数量范围使得一个基层使用layer_id0而另一个使用layer_id16来进行该控制。
还示出了NAL单元头部(911),包含涉及(914)表(909)中的相应条目的layer_id(912)以及涉及(915)所选的时间层(905)的temporal_id(913)。
关于前-SVC(2007前)NAL单元头部句法,H.264的一个可能的缺点是其缺少扩展机制。在实施例中,可通过预留预定layer_id,例如layer_id31(可利用5位二进制编码整数表示的最高layer_id),作为对至少再一个NAL单元头部信息的八位位组跟随的指示,来增加扩展机制。目前可能不一定需要定义该扩展八位位组的句法。在颁布扩展前不遵循标准版本的解码器例如可忽略该扩展八位位组。
H.264的高级句法的另一个潜在的缺点是前缀NAL单元的存在。如已经描述的,该NAL单元可包括两个标记:use_ref_base_pic_flag和store_ref_base_pic_flag。在H.264中,这些标记用于称为中等粒度可缩放性(MGS)的技术。为了支持HEVC中的MGS,这些标记可位于基层切片的切片头部中。
use_ref_base_pic_flag可指示增强质量层画面是利用来自基层画面的层间预测来编码的。标记可位于属于基层画面的切片的切片头部中。
store_ref_base_pic_flag可能需要解码器将当前的基层画面存储在参考画面缓冲器中用于可能的后续使用。store_ref_base_pic_flag可位于属于要存储在参考画面缓冲器中的基层画面的切片的切片头部中。
use_ref_base_pic_flag和/或store_ref_base_pic_flag也可位于NAL单元头部中的字段中,用于如上所述的类似目的。将标记置于切片头部或NAL单元头部中的开销可能大致是相同的。
上述句法可在例如解码器中使用如下。
参考图10,解码器可接收和解码层描述(1001)的经编码的表。共同待审US专利申请S/N.61/451,454(DPS)特别描述用于该步骤的机制。在例如画面序列(由所有层中的IDR画面标识)或画面组期间,可假设层描述的表是静态的。共同待审的S/N.61/451,454描述依存性参数集的激活机制,该依存性参数集可用于确保层描述的表中的变化仅可发生在可缩放比特流中良好定义的点处。
根据所公开的主题,任何解码器,包括不能解码可缩放比特流的解码器,能够接收和解码层描述的表。不能解码例如质量增强层的解码器能够通过解释层描述的表来标识质量增强层的layer_id值并且相应地例如通过丢弃其可能接收的所有这样的NAL单元来作出反应。甚至不能进行任何可缩放机制的解码器仍能够标识一个或多个(在同时多播的情况下)可独立解码的基层的layer_id。
利用接收和解码的层描述,可开始层描述的表中描述的层的NAL单元的解码。可接收NAL单元(1002)。可通过解释nal_unit_type字段标识(1003)并且处理(1004)非切片NAL单元,诸如参数集NAL单元、SEI消息及其它。
切片NAL单元可包括layer_id,可解释该layer_id(1005),并且该layer_id可触发例如对NAL单元的解码或丢弃。解释可涉及例如layer_id的去参考以寻址如上所述的层描述的表中的条目。基于该信息,解码器可确定NAL单元是否属于应被解码的层。该确定可涉及很多选项。例如,如果解码器因为不知道NAL单元的层的类型而不能解码NAL单元,因为它不具有足够的解码循环,因为它知道所接收的NAL单元所依存的层已经被损坏(即,由于分组丢失),该层没有给予用于足够的优点(即,屏幕分辨率太小而不能使层的高空间分辨率的呈现可行或有帮助)等等,则解码器可决定不解码NAL单元。在这些选项应用到经编码的比特流特性(即,不实现用于某些增强层类型的解码技术的解码器可丢弃该类型的NAL单元)的所有NAL单元意义上,该选项中的一些可以是静态的,而其它可以是动态的(即,依存增强层的NAL单元可被正常解码,但如果这些层被损坏则丢弃它们)。
具有层描述表中不存在的layer_id的任何NAL单元可以是不符合可缩放比特流的指示。解码器的很多反应对于不符合的比特流是可能的。在这种情况下,一种明智的解码器设计可丢弃所接收的NAL单元。
基于上述,解码器决定(1006)解码(1007)NAL单元或丢弃它。
操作继续(1008)可缩放比特流的下一NAL单元。
MANE可执行类似的步骤,例外是MANE通常不解码切片NAL单元,而是选择地将其转发到解码器。
上述用于视频编码的方法可被实现为使用计算机可读指令并且物理存储在计算机可读介质中的计算机软件。计算机软件可使用任何合适的计算机语言来编码。软件指令可在多种类型的计算机上执行。例如,图11示出了适合于实现本公开的实施例的计算机系统1100。
图11中所示的计算机系统1100的组件本质上是示例性的并且不旨在暗示关于实现本公开的实施例的计算机软件的使用范围或功能范围的任何限制。不应当将组件的配置解释为具有与在计算机系统的示例性实施例中示出的组件的任何一个或它们的组合有关的任何依赖或要求。计算机系统1100可具有包括集成电路、印刷电路板、小手持设备(例如,移动电话或PDA)、个人计算机或超级计算机的多种物理形式。
计算机系统1100包括显示器1132、一个或多个输入设备1133(例如,小键盘、键盘、鼠标、输入笔等等)、一个或多个输出设备1134(例如,扬声器)、一个或多个存储设备1135、多种类型的存储介质1136。
系统总线1140连接各种各样的子系统。如本领域技术人员所理解的,总线摂是指服务于共同功能的多个数字信号线。系统总线1140可以是包括存储器总线、外围总线和利用任何多种总线体系结构的本地总线的若干类型中任何一种的总线结构。作为示例而非限制,这种架构包括工业标准架构(ISA)总线、增强的ISA(EISA)总线、微通道架构(MCA)总线、视频电子标准协会本地(VLB)总线、外设组件互连(PCI)总线、PCI-Express总线(PCI-X)和加速图形端口(AGP)总线。
处理器1101(也称为中央处理单元或CPU)任选地包含用于临时本地存储指令、数据或计算机地址的高速缓存存储器单元1102。处理器1101耦合至包括存储器1103的存储设备。存储器1103包括随机存取存储器(RAM)1104和只读存储器(ROM)1105。如本领域已知,ROM1105用于单向地向处理器1101传输数据和指令,而RAM1104通常用于以双向方式传递数据和指令。这些类型存储器都可包括以下所述的任何合适的计算机可读媒体。
固定存储1108还任选地经由存储控制单元1101双向耦合至处理器1107。它提供附加的数据存储能力并且还可包括以下所述的任何计算机可读媒体。存储1108可被用于存储操作系统1109、EXEC1110、应用程序1112、数据1111等等,并且通常为比主存储更慢的辅助存储介质(例如,硬盘)。应当理解,在适当的情形下,保存在存储1108中的信息可按照标准方式被纳入作为存储器1103中的虚拟存储器。
处理器1101还耦合到诸如诸如图形控制1121、视频接口1122、输入接口1123、输出接口1124、存储接口1125之类的各种接口,并且这些接口进而耦合到适当的设备。一般而言,输入/输出设备可以是下面任何一种:视频显示器、跟踪球、鼠标、键盘、话筒、触敏显示器、换能器读卡器、磁或纸带读取器、便笺设备、输入笔、语音或手写识别器、生物识别读取器或其他计算机。处理器1101可使用网络接口1130耦合至另一计算机或电信网络1120。采用这种网络接口1120,预期CPU1101可从网络1130接收信息,或可在执行上述方法的过程中将信息输出至网络。此外,本公开的方法实施例可单独地在CPU1101上执行或可在诸如互联网之类的网络1130上协同远程CPU1101执行,该远程CPU1101共享处理的一部分。
根据各个实施例,当在网络环境中时,即当计算机系统1100连接至网络1130时,计算机系统1100可与同样连接至网络1130的其他设备通信。通信可经由网络接口1120向和从计算机系统1100发送。例如,传入的通信,例如,来自另一设备以一个或多个分组形式的请求或响应,可在网络接口1130处从网络1120接收并且存储在存储器1103选定的部分中以供处理。传出的通信,例如,对另一设备仍然以一个或多个分组形式的请求或响应,也可存储在存储器1103选定的部分中并在网络接口1120处送往网络1130。处理器1101可访问存储在存储器1103中的这些通信分组以供处理。
此外,本公开的实施例还涉及具有计算机可读介质的计算机存储产品,其上具有用于执行多种计算机实现的操作的计算机代码。介质和计算机代码可以是针对本发明的目的专门设计和构造的,或者它们可以是计算机软件领域的普通技术人员已知和可获得的类型。计算机可读介质的示例包括,但不限于:诸如硬盘、软盘和磁带之类的磁介质;诸如CD-ROM和全息设备之类的光学介质;诸如光盘之类的磁光介质;以及诸如专用集成电路(ASIC)、可编程逻辑器件(PLD)以及ROM和RAM设备之类专门配置成存储和执行程序代码的硬件设备。计算机代码的示例包括例如由编译器产生的机器代码,和包含由计算机利用解释器执行的更高级代码的文件。本领域普通技术人员也应当理解,与本公开的主题有关的术语计算机可读介质摂不包含传输介质、载波或其他瞬态信号。
作为示例而非限制,具有架构1100的计算机系统可提供作为处理器1101执行具体化为诸如存储器1103之类的一个或多个有形的计算机可读介质的结果的功能。实现本公开的各个实施例的软件可存储在存储器1103中并且可由处理器1101执行。计算机可读介质可根据特定需要包括一个或多个存储器设备。存储器1103可从诸如大容量存储器1135之类的一个或多个其他计算机可读介质或经由通信接口从一个或多个其他源读取软件。软件可使处理器1101执行本文所描述的特定进程或特定进程的特定部分,包括定义存储在存储器1103中的数据结构和根据软件定义的进程修改这类数据结构。作为附加或替代,计算机系统可提供作为硬连接的或以其他方式体现在电路中的逻辑的结果的功能,该逻辑可取代软件或与软件一起工作以执行本文所述的特定进程或特定进程的特定部分。在适当的情况下,对软件的引用可涵盖逻辑,反之亦然。在适当的情况下,对计算机可读介质的引用可涵盖存储用于执行的软件的电路(例如,集成电路(IC))、体现用于执行的逻辑的电路,或以上两种电路。本公开涵盖硬件和软件的任何适当组合。
尽管本公开内容描述了若干示例性实施例,但是存在落在所公开主题的范围内的变化、置换、和各种等价替换。由此,应当理解,本领域技术人员将能够设计多种系统和方法,虽然这些系统和方法在本文中未明确地示出或描述,但是体现本公开的原理并且由此在其精神和范围内。
Claims (26)
1.一种用于视频解码的方法,包括:
接收层描述的表,包括由第一layer_id标识的至少一个层描述;
接收NAL单元头部,包括第二layer_id;以及
通过使第二layer_id与第一layer_id匹配来确定NAL单元所属的层的至少一个属性。
2.如权利要求1所述的方法,其特征在于,至少一个属性包括以下各项中的至少一个:dependency_id、quality_id、temporal_id、view_id、depth_map_flag和dependent_flag。
3.如权利要求1所述的方法,其特征在于,NAL单元头部还包括temporal_id。
4.如权利要求3所述的方法,其特征在于,temporal_id标识由layer_id标识的层的时间子层。
5.如权利要求1所述的方法,其特征在于,层描述的表是依存性参数集的一部分。
6.如权利要求2所述的方法,其特征在于,depth_map_flag指示NAL单元所属的第一层是深度图,且与由具有与第一层相同的view_id标识的第二层相关联。
7.如权利要求1所述的方法,其特征在于,所述第二layer_id的预定值标识存在扩展数据。
8.如权利要求1所述的方法,其特征在于,所述第一layer_id是所述层在层等级中的位置的指示。
9.如权利要求1所述的方法,其特征在于,所述NAL单元头部还包括以下各项中的至少一个:store_ref_base_pic_flag和use_ref_base_pic_flag。
10.如权利要求1所述的方法,其特征在于,所述NAL单元头部是切片NAL单元头部,且在所述NAL单元中承载的切片的切片头部包括store_ref_base_pic_flag和use_ref_base_pic_flag中的至少一个。
11.一种用于视频编码的方法,包括:
确定层结构,所述层结构包括具有第一layer_id的至少一个层;
编码层表中的层结构的表示,所述层表包括层描述,所述层描述包括层的至少一个属性;以及
编码至少一个NAL单元,所述NAL单元包括第二layer_id;
其中所述第二layer_id与第一layer_id相同。
12.如权利要求11所述的方法,其特征在于,至少一个属性包括以下各项中的至少一个:dependency_id、quality_id、temporal_id、view_id、depth_map_flag和dependent_flag。
13.如权利要求11所述的方法,其特征在于,NAL单元头部还包括temporal_id。
14.如权利要求13所述的方法,其特征在于,temporal_id标识由layer_id标识的层的时间子层。
15.如权利要求11所述的方法,其特征在于,层描述的表是依存性参数集的一部分。
16.如权利要求12所述的方法,其特征在于,depth_map_flag指示NAL单元所属的第一层是深度图,且与由具有与第一层相同的view_id标识的第二层相关联。
17.如权利要求11所述的方法,其特征在于,所述第二layer_id的预定值标识存在扩展数据。
18.如权利要求11所述的方法,其特征在于,所述第一layer_id是所述层在层等级中的位置的指示。
19.如权利要求11所述的方法,其特征在于,所述NAL单元头部还包括以下各项中的至少一个:store_ref_base_pic_flag和use_ref_base_pic_flag。
20.如权利要求11所述的方法,其特征在于,所述NAL单元头部是切片NAL单元头部,且在所述NAL单元中承载的切片的切片头部包括store_ref_base_pic_flag和use_ref_base_pic_flag中的至少一个。
21.一种用于从可缩放比特流去除NAL单元的方法,包括:
接收和解码层描述的表,所述表包括至少一个层描述,所述层描述包括至少一个第一layer_id;
接收切片NAL单元,所述切片NAL单元包括NAL单元头部,所述NAL单元头部包括第二layer_id;
仅当所述第二layer_id将切片NAL单元标识为属于要去除的层时,去除所述切片NAL单元。
22.如权利要求21所述的方法,其特征在于,所述层描述的表包括多个层描述,每个层描述具有layer_id,其中由第一层描述所描述的第一层不依存于由第二层描述所描述的第二层,且其中第一层描述的layer_id在数字上小于第二层描述的layer_id。
23.如权利要求21所述的方法,其特征在于,所述层描述的表包括多个层描述,每个层描述具有layer_id,其中由第一层描述所描述的第一层不依存于由第二层描述所描述的第二层,且其中第一层描述的layer_id在数字上大于第二层描述的layer_id。
24.如权利要求22所述的方法,其特征在于,还包括:
在去除具有第一layer_id的至少一个NAL单元之后,去除具有第二layer_id的层的至少一个NAL单元;以及
其中所述第二layer_id在数字上小于第一layer_id。
25.如权利要求23所述的方法,其特征在于,还包括:
在去除具有第一layer_id的至少一个NAL单元之后,去除具有第二layer_id的层的至少一个NAL单元;以及
其中所述第二layer_id在数字上大于第一layer_id。
26.一种非瞬时计算机可读介质,包括用于执行权利要求1-25中任何一项方法的一组指令。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161432836P | 2011-01-14 | 2011-01-14 | |
US61/432,836 | 2011-01-14 | ||
PCT/US2012/020809 WO2012096981A1 (en) | 2011-01-14 | 2012-01-10 | Improved nal unit header |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103416003A true CN103416003A (zh) | 2013-11-27 |
CN103416003B CN103416003B (zh) | 2015-05-27 |
Family
ID=46490762
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280012703.5A Active CN103416003B (zh) | 2011-01-14 | 2012-01-10 | 改进的nal单元头部 |
Country Status (7)
Country | Link |
---|---|
US (2) | US20120183077A1 (zh) |
EP (1) | EP2664075A4 (zh) |
JP (1) | JP5738434B2 (zh) |
CN (1) | CN103416003B (zh) |
AU (1) | AU2012205650B2 (zh) |
CA (1) | CA2824741C (zh) |
WO (1) | WO2012096981A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105075251A (zh) * | 2014-01-02 | 2015-11-18 | 维迪奥股份有限公司 | 利用辅助图片的覆盖 |
CN107211140A (zh) * | 2015-01-07 | 2017-09-26 | 佳能株式会社 | 图像解码设备、图像解码方法和存储介质 |
Families Citing this family (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8289370B2 (en) | 2005-07-20 | 2012-10-16 | Vidyo, Inc. | System and method for scalable and low-delay videoconferencing using scalable video coding |
EP2664075A4 (en) | 2011-01-14 | 2015-08-19 | Vidyo Inc | ENHANCED NAL UNIT HEADER |
CA2829493A1 (en) | 2011-03-10 | 2012-09-13 | Vidyo, Inc. | Dependency parameter set for scalable video coding |
US10944994B2 (en) * | 2011-06-30 | 2021-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | Indicating bit stream subsets |
KR102047492B1 (ko) * | 2012-03-12 | 2019-11-22 | 삼성전자주식회사 | 스케일러블 비디오 부호화 방법 및 장치, 스케일러블 비디오 복호화 방법 및 장치 |
WO2013137697A1 (ko) * | 2012-03-16 | 2013-09-19 | 엘지전자 주식회사 | 영상 정보 저장 방법 및 영상 정보 파싱 방법 그리고 이를 이용하는 장치 |
CN104205813B (zh) * | 2012-04-06 | 2018-05-08 | 维德约股份有限公司 | 分层视频编码的等级信令 |
KR20130116782A (ko) | 2012-04-16 | 2013-10-24 | 한국전자통신연구원 | 계층적 비디오 부호화에서의 계층정보 표현방식 |
US20130272371A1 (en) * | 2012-04-16 | 2013-10-17 | Sony Corporation | Extension of hevc nal unit syntax structure |
WO2013162454A1 (en) * | 2012-04-24 | 2013-10-31 | Telefonaktiebolaget L M Ericsson (Publ) | Identifying a parameter set for decoding a multi-layer video representation |
KR101759855B1 (ko) * | 2012-06-12 | 2017-07-19 | 엘지전자 주식회사 | 영상 디코딩 방법 및 이를 이용하는 장치 |
US9313486B2 (en) | 2012-06-20 | 2016-04-12 | Vidyo, Inc. | Hybrid video coding techniques |
US10110890B2 (en) | 2012-07-02 | 2018-10-23 | Sony Corporation | Video coding system with low delay and method of operation thereof |
US9912941B2 (en) | 2012-07-02 | 2018-03-06 | Sony Corporation | Video coding system with temporal layers and method of operation thereof |
EP2871567A4 (en) * | 2012-07-06 | 2016-01-06 | Samsung Electronics Co Ltd | METHOD AND APPARATUS FOR ENCODING MULTILAYER VIDEO, AND METHOD AND APPARATUS FOR DECODING MULTILAYER VIDEO |
JP5885604B2 (ja) * | 2012-07-06 | 2016-03-15 | 株式会社Nttドコモ | 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム |
EP2876882A4 (en) * | 2012-09-09 | 2016-03-09 | Lg Electronics Inc | IMAGE DECODING METHOD AND APPARATUS USING THE SAME |
US10021394B2 (en) | 2012-09-24 | 2018-07-10 | Qualcomm Incorporated | Hypothetical reference decoder parameters in video coding |
EP2901688B1 (en) * | 2012-09-28 | 2019-10-23 | Nokia Technologies Oy | An apparatus and a method for video coding and decoding |
BR112015000422B1 (pt) * | 2012-09-28 | 2023-04-25 | Sony Corporation | Dispositivo e método de processamento de imagem |
US9781413B2 (en) * | 2012-10-02 | 2017-10-03 | Qualcomm Incorporated | Signaling of layer identifiers for operation points |
US9674519B2 (en) * | 2012-11-09 | 2017-06-06 | Qualcomm Incorporated | MPEG frame compatible video coding |
WO2014092445A2 (ko) * | 2012-12-11 | 2014-06-19 | 엘지전자 주식회사 | 영상 복호화 방법 및 이를 이용하는 장치 |
KR20140087971A (ko) | 2012-12-26 | 2014-07-09 | 한국전자통신연구원 | 계층적 비디오 부호화에서 다중참조계층을 적용한 화면간 부/복호화 방법 및 그 장치 |
CN105144720B (zh) | 2013-01-04 | 2018-12-28 | Ge视频压缩有限责任公司 | 高效可伸缩编码概念 |
US8798165B2 (en) * | 2013-01-04 | 2014-08-05 | Vidyo, Inc. | Techniques for prediction of unavailable samples in inter-layer predicted video coding |
US9723305B2 (en) * | 2013-03-29 | 2017-08-01 | Qualcomm Incorporated | RTP payload format designs |
US9992493B2 (en) * | 2013-04-01 | 2018-06-05 | Qualcomm Incorporated | Inter-layer reference picture restriction for high level syntax-only scalable video coding |
EP2983364A4 (en) * | 2013-04-05 | 2016-12-07 | Samsung Electronics Co Ltd | MULTILAYER VIDEO PROCESSING AND DEVICE AND MULTILAYER VIDEO DECODING PROCESS AND DEVICE |
KR102127281B1 (ko) | 2013-04-08 | 2020-06-26 | 지이 비디오 컴프레션, 엘엘씨 | 효율적인 다-시점/계층 코딩을 허용하는 코딩 개념 |
US9674522B2 (en) * | 2013-04-08 | 2017-06-06 | Qualcomm Incorporated | Device and method for scalable coding of video information |
JP6571314B2 (ja) | 2013-06-18 | 2019-09-04 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 送信方法 |
KR20150009424A (ko) | 2013-07-15 | 2015-01-26 | 한국전자통신연구원 | 시간적 서브 레이어 정보에 기반한 계층간 예측을 이용한 영상 부, 복호화 방법 및 그 장치 |
KR102435018B1 (ko) * | 2013-07-15 | 2022-08-22 | 지이 비디오 컴프레션, 엘엘씨 | 네트워크 장치 및 오류 처리 |
JP5789004B2 (ja) | 2013-08-09 | 2015-10-07 | ソニー株式会社 | 送信装置、送信方法、受信装置、受信方法、符号化装置および符号化方法 |
JP5774652B2 (ja) | 2013-08-27 | 2015-09-09 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
US20150103878A1 (en) * | 2013-10-14 | 2015-04-16 | Qualcomm Incorporated | Device and method for scalable coding of video information |
US10284858B2 (en) * | 2013-10-15 | 2019-05-07 | Qualcomm Incorporated | Support of multi-mode extraction for multi-layer video codecs |
US10063867B2 (en) * | 2014-06-18 | 2018-08-28 | Qualcomm Incorporated | Signaling HRD parameters for bitstream partitions |
JP2016015009A (ja) * | 2014-07-02 | 2016-01-28 | ソニー株式会社 | 情報処理システム、情報処理端末、および情報処理方法 |
US20160227229A1 (en) * | 2015-02-04 | 2016-08-04 | Harris Corporation | Mobile ad hoc network media aware networking element |
GB2538997A (en) * | 2015-06-03 | 2016-12-07 | Nokia Technologies Oy | A method, an apparatus, a computer program for video coding |
AU2020320295A1 (en) * | 2019-09-24 | 2022-04-21 | Huawei Technologies Co., Ltd. | Scalable nesting SEI messages for specified layers |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010014123A1 (en) * | 2008-07-26 | 2010-02-04 | Thomson Licensing | A real-time transport protocol (rtp) packetization method for fast channel change applications using scalable video coding (svc) |
US20100150232A1 (en) * | 2006-10-31 | 2010-06-17 | Gottfried Wilhelm Leibniz Universitat Hannover | Method for concealing a packet loss |
US20100189182A1 (en) * | 2009-01-28 | 2010-07-29 | Nokia Corporation | Method and apparatus for video coding and decoding |
WO2010126608A2 (en) * | 2009-05-01 | 2010-11-04 | Thomson Licensing | 3d video coding formats |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007515886A (ja) | 2003-12-09 | 2007-06-14 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 空間スケーラブルかつsnrスケーラブルなビデオ符号化 |
WO2006108917A1 (en) * | 2005-04-13 | 2006-10-19 | Nokia Corporation | Coding, storage and signalling of scalability information |
KR101125819B1 (ko) * | 2005-10-11 | 2012-03-27 | 노키아 코포레이션 | 효율적인 규모가변적 스트림 조정을 위한 시스템 및 방법 |
US8693549B2 (en) | 2006-01-16 | 2014-04-08 | Electronics And Telecommunications Research Institute | Method and apparatus for selective inter-layer prediction on macroblock basis |
CN101411080B (zh) * | 2006-03-27 | 2013-05-01 | 维德约股份有限公司 | 用于使用控制消息管理可缩放视频和音频编码系统中的可缩放性信息的系统和方法 |
US7535383B2 (en) * | 2006-07-10 | 2009-05-19 | Sharp Laboratories Of America Inc. | Methods and systems for signaling multi-layer bitstream data |
US8396134B2 (en) * | 2006-07-21 | 2013-03-12 | Vidyo, Inc. | System and method for scalable video coding using telescopic mode flags |
EP2060122A4 (en) * | 2006-09-07 | 2016-04-27 | Lg Electronics Inc | METHOD AND DEVICE FOR CODING AND DECODING A VIDEO SIGNAL |
US20080089411A1 (en) | 2006-10-16 | 2008-04-17 | Nokia Corporation | Multiple-hypothesis cross-layer prediction |
CN101573883B (zh) | 2006-10-16 | 2017-03-01 | 维德约股份有限公司 | 用于在可分级视频编码中信令并执行时间级切换的系统和方法 |
KR101349836B1 (ko) | 2006-11-17 | 2014-01-10 | 엘지전자 주식회사 | 비디오 신호의 디코딩/인코딩 방법 및 장치 |
US9445128B2 (en) | 2006-12-08 | 2016-09-13 | Freescale Semiconductor, Inc. | System and method of determining deblocking control flag of scalable video system for indicating presentation of deblocking parameters for multiple layers |
EP1994721A4 (en) * | 2007-01-12 | 2013-09-25 | Univ Kyung Hee Univ Ind Coop Group | PACKET FORMAT OF A NETWORK ABSTRACTION LAYER UNIT, ALGORITHM AND VIDEO ENCODING AND DECODING APPARATUS USING THE SAME, QOS CONTROL ALGORITHM AND IPV6 LABEL SWITCHING APPARATUS USING THE FORMAT |
WO2008117963A1 (en) * | 2007-03-23 | 2008-10-02 | Lg Electronics Inc. | A method and an apparatus for decoding/encoding a video signal |
PL2528341T3 (pl) * | 2007-04-18 | 2017-10-31 | Dolby Int Ab | System kodowania, stosujący uzupełniający zestaw parametrów sekwencyjnych do skalowalnego kodowania wideo lub kodowania wielowidokowego |
WO2009130561A1 (en) | 2008-04-21 | 2009-10-29 | Nokia Corporation | Method and device for video coding and decoding |
EP2319223A1 (en) * | 2008-04-24 | 2011-05-11 | SK Telecom Co., Ltd. | Scalable video providing and reproducing system and methods thereof |
EP2664075A4 (en) | 2011-01-14 | 2015-08-19 | Vidyo Inc | ENHANCED NAL UNIT HEADER |
CA2829493A1 (en) | 2011-03-10 | 2012-09-13 | Vidyo, Inc. | Dependency parameter set for scalable video coding |
-
2012
- 2012-01-10 EP EP12734429.9A patent/EP2664075A4/en not_active Withdrawn
- 2012-01-10 CN CN201280012703.5A patent/CN103416003B/zh active Active
- 2012-01-10 JP JP2013549495A patent/JP5738434B2/ja active Active
- 2012-01-10 AU AU2012205650A patent/AU2012205650B2/en not_active Ceased
- 2012-01-10 CA CA2824741A patent/CA2824741C/en active Active
- 2012-01-10 WO PCT/US2012/020809 patent/WO2012096981A1/en active Application Filing
- 2012-01-10 US US13/347,381 patent/US20120183077A1/en not_active Abandoned
- 2012-07-02 US US13/539,864 patent/US8649441B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100150232A1 (en) * | 2006-10-31 | 2010-06-17 | Gottfried Wilhelm Leibniz Universitat Hannover | Method for concealing a packet loss |
WO2010014123A1 (en) * | 2008-07-26 | 2010-02-04 | Thomson Licensing | A real-time transport protocol (rtp) packetization method for fast channel change applications using scalable video coding (svc) |
US20100189182A1 (en) * | 2009-01-28 | 2010-07-29 | Nokia Corporation | Method and apparatus for video coding and decoding |
WO2010126608A2 (en) * | 2009-05-01 | 2010-11-04 | Thomson Licensing | 3d video coding formats |
Non-Patent Citations (1)
Title |
---|
ITU-T: "《ITU-T Recommendation H.264》", 30 November 2007 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105075251A (zh) * | 2014-01-02 | 2015-11-18 | 维迪奥股份有限公司 | 利用辅助图片的覆盖 |
CN105075251B (zh) * | 2014-01-02 | 2016-11-23 | 维迪奥股份有限公司 | 利用辅助图片的覆盖的视频解码方法、装置和系统 |
CN107211140A (zh) * | 2015-01-07 | 2017-09-26 | 佳能株式会社 | 图像解码设备、图像解码方法和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP5738434B2 (ja) | 2015-06-24 |
US20120183077A1 (en) | 2012-07-19 |
JP2014504118A (ja) | 2014-02-13 |
US8649441B2 (en) | 2014-02-11 |
CA2824741C (en) | 2016-08-30 |
CN103416003B (zh) | 2015-05-27 |
AU2012205650A1 (en) | 2013-08-01 |
EP2664075A1 (en) | 2013-11-20 |
US20120269276A1 (en) | 2012-10-25 |
WO2012096981A1 (en) | 2012-07-19 |
CA2824741A1 (en) | 2012-07-19 |
AU2012205650B2 (en) | 2016-08-11 |
EP2664075A4 (en) | 2015-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103416003B (zh) | 改进的nal单元头部 | |
CN103430458B (zh) | 可伸缩视频编码的依存参数集 | |
CN103314591B (zh) | 时间可缩放性的高层句法 | |
US10542065B2 (en) | Method and apparatus for transmitting/receiving media contents in multimedia system | |
TWI775758B (zh) | 用於多畫面視訊編碼處理之裝置 | |
JP5614900B2 (ja) | 3d映像符号化フォーマット | |
CN101536527B (zh) | 可缩放视频编码和解码 | |
CN101444102B (zh) | 在可伸缩视频编码中的图像分隔符 | |
CN101036392B (zh) | 编码、解码视频的方法及编码器、解码器 | |
CN104205813B (zh) | 分层视频编码的等级信令 | |
CN100399824C (zh) | 用于jvt视频的通用适配层 | |
MX2008000569A (es) | Indicacion de dependencia de codificacion en codificacion de video escalable. | |
US20130195201A1 (en) | Techniques for layered video encoding and decoding | |
CN105049861B (zh) | 使用配置文件空间的信令符合性点 | |
CN104754358A (zh) | 码流的生成和处理方法、装置及系统 | |
CN102870416A (zh) | 运动图像编码装置以及运动图像解码装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |