CN104246773A - 识别视频文件中的参数集 - Google Patents

识别视频文件中的参数集 Download PDF

Info

Publication number
CN104246773A
CN104246773A CN201380021221.0A CN201380021221A CN104246773A CN 104246773 A CN104246773 A CN 104246773A CN 201380021221 A CN201380021221 A CN 201380021221A CN 104246773 A CN104246773 A CN 104246773A
Authority
CN
China
Prior art keywords
particular type
pattern representation
instruction
parameter sets
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380021221.0A
Other languages
English (en)
Other versions
CN104246773B (zh
Inventor
王益魁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN104246773A publication Critical patent/CN104246773A/zh
Application granted granted Critical
Publication of CN104246773B publication Critical patent/CN104246773B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/178Techniques for file synchronisation in file systems
    • G06F16/1794Details of file format conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/74Browsing; Visualisation therefor
    • G06F16/743Browsing; Visualisation therefor a collection of video files or sequences
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/74Browsing; Visualisation therefor
    • G06F16/745Browsing; Visualisation therefor the internal structure of a single video sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

一种设备经配置以将包含经译码视频图片的若干序列的经译码视频数据存储在电子文件中。所述设备包含至少一个处理器,其经配置以确定与至少一个样本相关联的样本描述是否包含与所述至少一个样本相关联的特定类型的所有参数集。所述至少一个样本包括所述多个序列的经译码视频图片的至少一部分。所述特定类型是参数集的多个不同特定类型中的一者。所述至少一个处理器还经配置以基于所述确定在所述电子文件中提供指示所述样本描述是否包含所述特定类型的所有参数集的指示。

Description

识别视频文件中的参数集
本申请案主张2012年4月25日申请的第61/638,393号美国临时申请案的权益,所述临时申请案的全部内容以引用的方式并入本文中。
技术领域
本发明涉及经编码视频数据的存储和运送。
背景技术
数字视频能力可并入到广范围的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电话、视频电话会议装置等。数字视频装置实施例如MPEG-2、MPEG-4、ITU-T H.263或ITU-TH.264/MPEG-4第10部分、先进视频译码(AVC)界定的标准及此类标准的扩展中描述的视频压缩技术,来更有效地发射和接收数字视频信息。
视频压缩技术执行空间预测和/或时间预测以减少或移除视频序列中固有的冗余。不论特定方法如何,在已编码视频数据之后,可将视频数据封包化以供发射或存储。视频数据可汇编为符合例如国际标准化组织(ISO)基础媒体文件格式(ISOBMFF)及其扩展(例如,AVC文件格式)等多种标准中的任一者的视频文件。
发明内容
一般来说,本发明描述用于视频数据的存储和运送的技术。本发明提供用于指定特定类型的所有参数集是否独立于其它类型的参数集存储在包含在视频文件中的所谓的“样本描述”中的技术。
一个实例包含一种将包括经译码视频图片的多个序列的经译码视频数据存储在电子文件中的方法。所述方法包含确定与至少一个样本相关联的样本描述是否包含与所述至少一个样本相关联的特定类型的所有参数集。所述至少一个样本包括经译码视频图片的所述多个序列的至少一部分。所述特定类型是参数集的多个不同特定类型的一者。所述方法还包含基于所述确定在电子文件中提供指示样本描述是否包含所述特定类型的所有参数集的指示。
在另一实例中,一种设备经配置以将包含经译码视频图片的若干序列的经译码视频数据存储在电子文件中。所述设备包含至少一个处理器,其经配置以确定与至少一个样本相关联的样本描述是否包含与所述至少一个样本相关联的特定类型的所有参数集。所述至少一个样本包括经译码视频图片的所述多个序列的至少一部分。所述特定类型是参数集的多个不同特定类型的一者。所述至少一个处理器还经配置以基于所述确定在电子文件中提供指示样本描述是否包含所述特定类型的所有参数集的指示。
另一实例包含一种上面存储有指令的计算机可读存储媒体,所述指令当执行时致使一或多个处理器执行包含确定与至少一个样本相关联的样本描述是否包含与所述至少一个样本相关联的特定类型的所有参数集的操作。所述至少一个样本包括经译码视频图片的所述多个序列的至少一部分。所述特定类型是参数集的多个不同特定类型的一者。所述指令当执行时还致使一或多个处理器执行包含基于所述确定在电子文件中提供指示样本描述是否包含所述特定类型的所有参数集的指示的操作。
另一实例包含一种用于将包括经译码视频图片的多个序列的经译码视频数据存储在电子文件中的设备。所述设备包含用于确定与至少一个样本相关联的样本描述是否包含与所述至少一个样本相关联的特定类型的所有参数集的装置。所述至少一个样本包括经译码视频图片的所述多个序列的至少一部分。所述特定类型是参数集的多个不同特定类型的一者。所述设备还包含用于基于所述确定在电子文件中提供指示样本描述是否包含所述特定类型的所有参数集的指示的装置。
另一实例包含一种处理存储在电子文件中的包括经译码视频图片的多个序列的经译码视频数据的方法。所述方法包含接收所述文件中指示与至少一个样本相关联的样本描述是否包含与所述至少一个样本相关联的特定类型的所有参数集的指示。所述至少一个样本包括经译码视频图片的所述多个序列的至少一部分。所述特定类型是参数集的多个不同特定类型的一者。所述方法还包含基于所述指示确定是否所述特定类型的所有参数集存储在样本描述中,以及基于是否所述特定类型的所有参数集存储在样本描述中的所述确定至少部分基于所述特定类型的参数集的一或多者处理所述经译码视频数据。
另一实例包含一种用于将包括经译码视频图片的多个序列的经译码视频数据存储在电子文件中的设备。所述设备包含至少一个处理器,其经配置以接收所述文件中指示与至少一个样本相关联的样本描述是否包含与所述至少一个样本相关联的特定类型的所有参数集的指示。所述至少一个样本包括经译码视频图片的所述多个序列的至少一部分。所述特定类型是参数集的多个不同特定类型的一者。所述至少一个处理器还经配置以基于所述指示确定是否所述特定类型的所有参数集存储在样本描述中,且基于是否所述特定类型的所有参数集存储在样本描述中的所述确定至少部分基于所述特定类型的参数集的一或多者处理所述经译码视频数据。
附图和以下描述中陈述一个或一个以上实例的细节。从描述内容和图式以及从权利要求书将显而易见其它特征、目标和优点。
附图说明
图1是说明其中音频/视频(A/V)源装置将音频和视频数据传送到A/V目的地装置的实例系统的框图。
图2是说明实例囊封单元的组件的框图。
图3是说明实例视频文件的元件的概念图。
图4是说明另一实例视频文件的元件的概念图。
图5是说明将经译码视频数据存储在电子文件中的实例方法的流程图。
图6是说明处理经译码视频数据的实例方法的流程图。
具体实施方式
一般来说,描述用于将视频内容存储在文件中的技术。特定来说,所述技术涉及基于国际标准化组织(ISO)基础媒体文件格式(ISOBMFF)将高效视频译码(HEVC)视频内容存储在文件中的各种方法。所述技术可使得能够指定特定类型的所有参数集是否独立于其它类型的参数集存储在包含在视频文件中的所谓的“样本描述”中。所述技术可扩展有时称为解码器配置记录的内容(其是包含在样本描述中的语法结构),以包含指示是否特定类型的所有参数集存储在样本描述中的一或多个旗标。所揭示的实例使得能够区分是否特定类型的所有参数集包含在样本描述中,这又可允许确定何时执行不同类型的参数集的频带外运送。以此方式,所揭示的实例可使得能够更有效存储、处理和发射经译码视频数据,这又可改进例如视频编码器和解码器等视频译码装置的性能。
数字视频能力可并入到广范围的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电话、视频电话会议装置等。数字视频装置实施例如MPEG-2、MPEG-4、ITU-T H.263或ITU-TH.264/MPEG-4第10部分、先进视频译码(AVC)界定的标准及此类标准的扩展中描述的视频压缩技术,来更有效地发射和接收数字视频信息。
视频压缩技术执行空间预测和/或时间预测以减少或移除视频序列中固有的冗余。对于基于块的视频译码,视频帧或切片可分割为块,例如宏块。每一宏块还可进一步分割。经帧内译码(I)帧或切片中的块相对于相邻块使用空间预测编码。经帧间译码(P或B)帧或切片中的块可相对于相同帧或切片中的相邻块使用空间预测,或相对于其它参考帧使用时间预测。
在已编码视频数据之后,视频数据可封包化以供发射或存储。视频数据可汇编为符合例如ISOBMFF等多种标准的任一者的视频文件。额外实例标准包含可缩放视频译码(SVC)文件格式、先进视频译码(AVC)文件格式、第三代合作伙伴计划(3GPP)文件格式,和/或多视图视频译码(MVC)文件格式,或其它类似的视频文件格式。
在一个实例中,文件囊封单元或其它装置接收包括来自视频编码器的视频数据的基本流和包括来自视频编码器的音频数据的基本流。AV数据连同与其相关的参数/属性(例如,位速率、帧速率、分辨率、编解码器类型(针对视频和/或音频数据)、语言等)可形成AV“表示”。
术语“表示”可用于指代经编码音频或视频数据的对应于多媒体内容的特定周期且以特定方式编码的区段。AV数据的每一个别流可称为基本流。基本流是表示的单一、经数字译码(可能经压缩)组件。举例来说,表示的经译码视频或音频部分可为基本流。另外,关于与包含在视频基本流中的视频数据有关的参数(例如,如上文描述的序列参数集)的信息可包含在参数集基本流中。
在一些实例中,视频和音频编码器可各自包含用于由经编码数据形成封包化基本流(PES)包的打包器。在其它实例中,视频和音频编码器可各自与用于由经编码数据形成PES包的相应打包器介接。在另外其它实例中,囊封单元可包含用于由经编码音频和视频数据形成PES包的打包器。
囊封单元可从音频和视频编码器接收表示的基本流的PES包,且由PES包形成对应的网络抽象层(NAL)单元。在H.264/AVC(先进视频译码)的实例中,经译码视频片段组织为NAL单元,其提供例如视频电话、存储、广播或串流等“网络友好”视频表示寻址应用。NAL单元可分类为视频译码层(VCL)NAL单元和非VCL NAL单元。VCL单元可含有核心压缩引擎且可包含块、宏块,和/或切片层级数据。非VCL NAL单元可包含(尤其)参数集NAL单元。
如果例如图片分割为多个片段(也称为切片)且那些片段在其自身运送单元(例如,RTP包)中运送,那么响应于序列标头和图片标头的损失的效应在H.264/AVC中引入参数集。不仅携载第一图片片段数据而且还携载图片标头的图片的第一包的损失可能导致完全不正确重建的图片(且有时还有随后图片),即使所有其它包未丢失也如此。如果具有图片标头的包丢失,那么一些解码器实施方案甚至将不会试图解码图片的所接收的包。
参数集可为视频位流的一部分,或可由解码器经由其它手段(包含使用可靠信道的频带外发射、编码器和解码器中的硬译码等)接收。参数集含有识别,其从例如对应于包含在经译码视频序列中的图片的切片的切片标头直接或间接参考。参考过程称为“激活”。依据参数集类型,激活可每图片发生一次或每序列发生一次。引入经由参考激活的概念(以及其它原因),因为借助位流中信息的定位的隐式激活(如对于视频编解码器的其它语法元素常见的)在频带外发射的情况下不可用。
HEVC包含适用于经译码视频序列的视频数据的不同粒度水平(例如,图片、序列、层)的若干不同类型的参数集。包含在HEVC中的参数集是图片参数集(PPS)、序列参数集(SPS)和视频参数集(VPS)。VPS传达适用于多个层以及子层的信息。多层视频序列的实例包含例如相同视频流的多个版本,其包含在分辨率、位速率、帧速率等方面不同的表示。给定视频序列的每一层(不论此些层具有相同还是不同SPS)可通常指代相同VPS。VPS可传达包含以下各项的信息:(1)由多个层或操作点共享以避免不必要复制的共同语法元素;(2)会话协商所需的操作点的信息,包含简档和水平;以及(3)不属于一个SPS的其它操作点特定信息。不属于一个SPS的其它操作点特定信息的实例可包含层或子层的假设参考解码器(HRD)参数。
SPS含有可应用于经译码视频序列的所有切片的信息。在HEVC中,经译码视频序列从瞬时解码刷新(IDR)图片、清洁随机存取(CRA)图片或作为位流中的第一图片的断开链接存取(BLA)开始,且包含并非IDR或BLA图片的所有后续图片。位流由一或多个经译码视频序列组成。SPS的内容可划分为若干类别的信息,包含例如:(1)自参考(其自身ID);(2)解码器操作点相关(简档、水平、图片大小、子层数目等);(3)实现针对简档内的特定工具的旗标,以及在工具启用的情况下相关联的译码工艺参数;(4)限制结构的灵活性和变换系数译码的信息;(5)时间可缩放性控制;以及(6)视觉可用性信息(VUI),其包含假设参考解码器(HRD)信息。
PPS含有可在经译码视频序列中在图片间改变的信息。PPS的内容可划分为若干类别的信息,包含例如:(1)自参考;(2)初始图片控制信息,例如初始量化参数(QP)、指示切片(序列)标头中的特定工具或控制信息的使用或存在的若干旗标;以及(3)贴瓦信息。
ISO基础媒体文件格式(ISOBMFF、ISO/IEC 14496-12)经设计以含有促进媒体的互换、管理、编辑和呈现的灵活可扩展格式的媒体呈现的经定时媒体信息。ISOBMFF在MPEG-4第12部分中指定,其界定基于时间的媒体文件的一般结构。ISOBMFF用作例如经界定支持H.264/MPEG-4AVC视频压缩的AVC文件格式(ISO/IEC 14496-15)、3GPP文件格式、SVC文件格式和MVC文件格式等系列中的其它文件格式的基础。3GPP文件格式和MVC文件格式是AVC文件格式的扩展。ISO基础媒体文件格式含有例如音频-视觉呈现等媒体数据的经定时序列的定时、结构和媒体信息。文件结构为对象定向的。文件可分解为基本对象,且对象的结构从其类型暗示。
在ISO基础媒体文件格式中,总体呈现称为电影,其逻辑上划分为轨道。一些轨道可表示媒体的经定时序列(例如,视频的帧)。另外,轨道可含有例如媒体属性/参数等其它数据,包含例如经译码视频数据可借以由接收囊封在文件中的数据的解码器装置解码的参数集。在每一轨道内,每一经定时单元称为样本,其可例如为视频或音频的帧。样本以序列隐式编号。每一轨道具有一或多个样本描述,且轨道中的每一样本通过参考与描述发生联系。描述界定样本可如何解码(例如,描述识别所使用的压缩算法)。
不同于一些其它多媒体文件格式,ISO基础媒体文件格式分离有时联系在一起的若干概念。文件的物理结构可不与媒体本身的物理结构发生联系。举例来说,文件的物理结构和媒体的布局不需要与媒体的时间排序发生联系。视频的帧不需要以时间次序布置在文件中(但其可以如此)。然而,文件结构可用于描述媒体的放置和定时。此文件结构可允许(但不要求)时间排序的文件。
文件内的数据可囊封在盒中。包含界定媒体的放置和定时的元数据的元数据可包含在结构化盒中,且媒体数据(例如,视频的帧)可由此元数据参考。媒体数据可在相同文件中(包含在一或多个盒中),或可在其它文件中。举例来说,元数据允许借助URL参考其它文件。媒体数据在这些次级文件内的放置完全由初级文件中的元数据描述。此类次级文件不需要格式化为此规格,但其可以如此;有可能例如在这些次级媒体文件中不存在盒。
轨道可具有各种种类。视频轨道含有视觉上的样本,且音频轨道含有音频媒体。文件还可包含索引轨道,其含有针对串流服务器的关于如何由文件中的媒体轨道形成串流协议的包的指令。当文件被读取以供本地重放时,索引轨道可被忽略。ISO基础媒体文件格式还允许其它轨道。
ISO基础媒体文件格式的扩展已针对若干不同经译码视频标准(包含HEVC)制定。根据ISO基础媒体文件格式的此类扩展,包含VPS、SPS和PPS的参数集可与视频基本流(其在视频的视频轨道中)相关联。另外,参数集还可存储在与样本相关联的样本描述中。还有可能具有另一轨道(称为参数集轨道)中的参数集,所述轨道包含含有由SPS、PPS和/或VPS非VCL参数集NAL单元的一或多者形成的样本的参数集基本流。
与视频的样本相关联的样本描述指示参数集的位置。样本描述提供借以可将样本属性信息传送到例如视频解码器等装置的语法结构。先前HEVC文件格式指定,所有类型的所有参数集包含在样本描述中,或所有类型的所有参数集可存储在样本描述和样本中。然而,在一些情况下,区分特定类型的参数集是否包含在样本描述中例如以确定何时执行VPS、SPS和PPS的一或多者的频带外运送可能是有用的。
为促进确定特定类型的所有参数集包含在样本描述或相关联样本中,或在某一其它位置(例如,参数集轨道)中,本发明的技术使得能够在经囊封文件中(例如,在样本描述中)指定指示,所述指示个别地指示每一类型的参数集包含在样本描述中、样本数据或两者中还是某一其它位置中。在一个实例中,针对每一类型的参数集的一个指示包含在解码器配置记录中,其是形成样本描述的一部分的语法结构。
图1是说明其中音频/视频(A/V)源装置20将音频和视频数据运送到A/V目的地装置40的实例系统10的框图。图1的系统10可对应于视频电话会议系统、服务器/客户端系统、广播器/接收器系统,或其中将视频数据从例如A/V源装置20等源装置发送到例如A/V目的地装置40等目的地装置的任何其它系统。在一些实例中,A/V源装置20和A/V目的地装置40可执行双向信息交换。即,A/V源装置20和A/V目的地装置40可能够编码和解码(以及发射和接收)音频和视频数据两者。在一些实例中,音频编码器26可包括语音编码器,也称为声码器。
在图1的实例中,A/V源装置20包含音频源22、视频源24、音频编码器26、视频编码器28、囊封单元30和输出接口32。音频源22可包含例如麦克风,其产生表示待由音频编码器26编码的所俘获音频数据的电信号。或者,音频源22可包括存储先前记录的音频数据的存储媒体、例如计算机化合成器等音频数据产生器,或音频数据的任何其它源。视频源24可包括产生待由视频编码器28编码的视频数据的视频相机、以先前记录的视频数据编码的存储媒体、视频数据产生单元,或视频数据的任何其它源。
原始音频和视频数据可包括模拟或数字数据。模拟数据可在由音频编码器26和/或视频编码器28编码之前数字化。音频源22可在发言参与者正发言的同时从发言参与者获得音频数据,且视频源24可同时获得发言参与者的视频数据。以此方式,本发明中描述的技术可应用于实况、串流、实时音频和视频数据,或应用于经存档、预先记录的音频和视频数据。
视频源24可提供场景的单一或多个同时视图。举例来说,视频源24可对应于一个相机或相机阵列,例如两个或两个以上相机各自分离开一定量的距离使得阵列中的相机的每一者指向近似共同焦点。在多相机布置中,相机的每一者可提供场景的稍许不同的视角。
视频源24还可使用其它技术提供多个同时视图。举例来说,视频源24可提供场景中的对象的一个视图和深度信息。深度信息可用于从第二虚拟相机视角产生第二视图。视频源24可包含处理器以产生第二视图,或用于视频编码器28的预处理单元可产生第二视图。在一些实例中,视频源24可包括使用两个或两个以上相机视角产生计算机图形的计算机。
对应于视频帧的音频帧通常为同时含有被音频源22俘获的音频数据以及被视频源24俘获的包含在视频帧内的视频数据的音频帧。因此,音频帧可时间上对应于一或多个特定视频帧。因此,对应于视频帧的音频帧通常对应于其中音频数据和视频数据被同时俘获且针对其音频帧和视频帧分别包括同时被俘获的音频数据和视频数据的情形。
在一些实例中,音频编码器26可编码每一经编码音频帧中的时间戳(其表示经编码音频帧的音频数据被记录的时间),且类似地,视频编码器28可编码每一经编码视频帧中的时间戳(其表示经编码视频帧的视频数据被记录的时间)。A/V源装置20可包含音频编码器26和/或视频编码器28可从中产生时间戳的内部时钟,或音频源22和视频源24可使用所述内部时钟使音频和视频数据分别与时间戳相关联。
在一些实例中,音频源22可将对应于音频数据被记录的时间的数据发送到音频编码器26,且视频源24可将对应于视频数据被记录的时间的数据发送到视频编码器28。在一些实例中,音频编码器26可编码经编码音频数据中的序列识别符以指示经编码音频数据的相对时间排序而不必指示音频数据被记录的绝对时间,且类似地,视频编码器28也可使用序列识别符来指示经编码视频数据的相对时间排序。类似地,在一些实例中,序列识别符可经映射或以其它方式与时间戳相关。
为编码从视频源24接收的视频数据,视频编码器28执行帧内和/或帧间预测以产生一或多个预测块。视频编码器28从待编码的原始视频块减去预测块以产生残余块。因此,残余块可表示正译码块与预测块之间的逐像素差。视频编码器28可对残余块执行变换以产生变换系数的块。在基于帧内和/或帧间的预测译码和变换技术之后,视频编码器28可量化变换系数。在量化之后,可由编码器28根据熵译码方法执行熵译码。
视频编码器28产生的经译码视频块可由可用于产生或识别预测块的预测信息以及可应用于预测块以重新产生原始块的数据的残余块表示。预测信息可包含用于识别数据的预测块的运动向量。使用运动向量,视频解码器48可能够重建由视频编码器28使用以对残余块进行译码的预测块。因此,给定一组残余块和一组运动向量(以及可能一些额外语法)的情况下,视频解码器28可重建原始经编码的视频帧或数据的其它块。基于运动估计和运动补偿的帧间译码可实现相对高的压缩量而无过多数据损失,因为连续视频帧或其它类型的经译码单元通常是类似的。经编码视频序列可包含残余数据的块、运动向量(当帧间预测编码时)、用于帧内预测的帧内预测模式的指示,和语法元素。
视频编码器28还可利用帧内预测技术来相对于共同帧或切片或帧的其它子部分的相邻视频块编码视频块。以此方式,视频编码器28空间上预测所述块。视频编码器28可配置有多种帧内预测模式,其通常对应于各种空间预测方向。
视频编码器28可应用变换、量化和熵译码过程来进一步减小与由于编码视频源24提供的源视频数据而产生的残余块的通信相关联的位速率。变换技术可包含例如离散余弦变换(DCT)或概念上类似的过程。或者,可使用小波变换、整数变换或其它类型的变换。视频编码器28还可量化变换系数,其通常涉及可能减小数据量(例如,用于呈现系数的位)的过程。熵译码可包含全体压缩数据以供输出到位流的过程。经压缩数据可包含例如译码模式的序列、运动信息、经译码块图案,和经量化变换系数。熵译码的实例包含上下文自适应可变长度译码(CAVLC)和上下文自适应二进制算术译码(CABAC)。
源装置20和目的地装置40进行的视频编码和解码可支持用于帧内预测的若干不同视频译码块大小,例如对于亮度分量16乘16、8乘8或4乘4,以及对于色度分量8x8。另外,源装置20和目的地装置40可支持用于帧间预测的若干不同视频译码块大小,例如对于亮度分量16x16、16x8、8x16、8x8、8x4、4x8和4x4,以及对于色度分量对应的按比例缩放大小。在本发明中,“NxN”和“N乘N”可互换使用以表示依据垂直和水平尺寸的块的像素尺寸(例如,16x16像素或16乘16像素)。一般来说,16x16块将具有垂直方向上16个像素(y=16)以及水平方向上16个像素(x=16)。同样,NxN块通常具有垂直方向上N个像素以及水平方向上N个像素,其中N表示非负整数值。一块中的像素可布置成行和列。块可具有水平和垂直维度上的不同数目的像素。即,块可包含NxM像素,其中N不一定等于M。
小于16乘16的块大小可称为16乘16宏块的分区。视频块可包括像素域中的像素数据的块,或变换域中的变换系数的块,例如随后应用例如离散余弦变换(DCT)、整数变换、小波变换或与表示经译码视频块与预测视频块之间的像素差的残余视频块数据概念上类似的变换等变换。在一些情况下,视频块可包括变换域中的经量化变换系数的块。
较小视频块可提供较好分辨率,且可用于视频帧的包含高细节水平的位置。一般来说,宏块和各种分区(有时称为子块)可视为视频块。另外,切片可视为多个视频块,例如宏块和/或子块。每一切片可为视频帧的可独立解码单元。或者,帧本身可为可解码单元,或帧的其它部分可界定为可解码单元。术语“经译码单元”或“译码单元”可指代例如整个帧、帧的切片、也称为序列的图片的群组(GOP),或根据适用的译码技术界定的另一可独立解码单元等视频帧的任何可独立解码单元。
再次参看图1,视频源24可将场景的一或多个视图提供到视频编码器28,或可将信息直接提供到囊封单元30。囊封单元30可从视频编码器28检索包含经编码视频数据的基本流以及从音频编码器26检索包含音频数据的基本流。在一些实例中,视频编码器28和音频编码器26可各自包含用于由经编码数据形成PES包的打包器。在其它实例中,视频编码器28和音频编码器26可各自与用于由经编码数据形成PES包的相应打包器介接。在另外其它实例中,囊封单元30可包含用于由经编码音频和视频数据形成PES包的打包器。
囊封单元30可从音频编码器26和视频编码器28接收表示的基本流的PES包,且由PES包形成对应的网络抽象层(NAL)单元。在相同表示内,流ID可用于区分属于一个基本流的PES包与属于另一基本流的PES包。基本流的数据的基本单元可为PES包。因此,MVC视频数据的每一视图可对应于相应基本流。类似地,音频数据对应于一或多个相应基本流。除了媒体基本流外,囊封单元30还可接收其它类型的基本流,包含对应于参数集的参数集流,视频解码器28编码的视频数据可借助所述参数集由比如A/V目的地装置40的视频解码器48等解码装置解码。
本发明的教示大体针对经编码多媒体(例如,音频和视频)数据的存储和运送,以及经运送多媒体数据的接收和后续解译及解码。举例来说,本发明的教示使得能够在经囊封视频文件中指定指示,所述指示个别地指示例如VPS、SPS和PPS等每一类型的参数集包含在与样本相关联的样本描述中、样本数据中、样本描述和样本两者中,还是某一其它位置中。
在一个实例中,囊封单元30分析从视频编码器28接收的基本流,且确定与样本相关联的特定类型的所有参数集是否存储在与样本相关联的样本描述中。囊封单元30可接着在从基本流产生的文件中提供指示,所述指示指示特定类型的所有参数集是否存储在样本描述中。根据本发明关于囊封单元30的此和其它功能的额外细节在下文参看图2-5提供。
在一个实例中,囊封单元30从音频编码器26和视频编码器28接收表示的基本流的PES包,且由PES包形成对应的NAL单元。将经译码视频片段组织为NAL单元可提供数据的“网络友好”视频表示以解决例如视频电话、存储、广播或串流等应用。NAL单元可分类为视频译码层(VCL)NAL单元和非VCL NAL单元。VCL单元可含有核心压缩引擎且可包含块、宏块,和/或切片层级数据。其它NAL单元可为非VCLNAL单元。
非VCL NAL单元可(尤其)包含参数集NAL单元和补充增强信息(SEI)NAL单元。参数集可含有视频数据的不同粒度水平(例如,序列和图片)的不同标头信息。囊封在参数NAL单元中的参数可包含VPS、SPS和PPS。利用参数集,不经常改变的信息不需要针对每一序列或图片重复,因此译码和发射效率可改进。举例来说,参数集的使用可实现重要标头信息的频带外发射,从而避免需要冗余信息用于错误复原。在频带外发射实例中,参数集NAL单元可在与其它NAL单元(例如,SEI NAL单元)不同的信道上发射。
SEI可含有对于解码来自VCL NAL单元的经译码图片样本并非必需但可辅助与解码、显示、错误复原和其它目的相关的过程的信息。SEI消息可包含在非VCL NAL单元中。SEI消息是一些标准规格的规范部分,且因此对于标准遵从解码器实施方案并非始终强制的。
SEI消息可为序列层级SEI消息或图片层级SEI消息。一些序列层级信息可包含在SEI消息中,例如SVC的实例中的可缩放性信息SEI消息和MVC中的视图可缩放性信息SEI消息。这些实例SEI消息可传达关于例如操作点的提取和操作点的特性的信息。在有效负载中包含视频数据的NAL单元可包含各种粒度水平的视频数据。举例来说,NAL单元可包含视频数据的块、一或多个宏块、视频数据的切片,或视频数据的整个帧。
在一个实例中,囊封单元30汇编来自若干NAL单元的存取单元。一般来说,存取单元可包含用于表示视频数据的帧的一或多个NAL单元,以及对应于帧的音频数据(当此类音频数据可用时)。存取单元通常包含针对一个输出时间例项的所有NAL单元,例如针对一个时间例项的所有音频和视频数据。举例来说,如果每一视图具有20帧/秒(fps)的帧速率,那么每一时间例项可对应于0.05秒的时间间隔。在此时间间隔期间,相同存取单元(相同时间例项)的所有视图的特定帧可同时再现。存取单元的解码次序不需要一定与输出或显示次序相同。
在囊封单元30已基于所接收数据将NAL单元和/或存取单元汇编为视频文件之后,囊封单元30将视频文件传递到输出接口32以供输出。在一些实例中,囊封单元30可将视频文件存储在本地或经由输出接口32将视频文件发送到远程服务器,而不将视频文件直接发送到目的地装置40。在一个实例中,视频数据可从A/V目的地装置40的输入接口36经由链路34传送。在一些实例中,源装置20包含调制解调器,其根据例如码分多址(CDMA)或另一通信标准等通信标准调制发射到目的地装置40的视频数据。调制解调器可包含各种混频器、滤波器、放大器或其它经设计用于信号调制的组件。输出接口32可包含经设计用于发射数据的电路,包含放大器、滤波器和一或多个天线。在一些实例中,代替于经由通信信道(例如,经由链路34)发射,源装置20可将经编码视频数据存储到例如数字影音光盘(DVD)、蓝光光盘、快闪驱动器等存储装置上。
在图1的实例中,A/V目的地装置40包含音频输出42、视频输出44、音频解码器46、视频解码器48、解封单元38和输入接口36。在目的地装置40中,视频解码器48最终接收并解码经编码视频数据。举例来说,目的地装置40的输入接口36经由链路34或从存储装置接收信息,所述信息接着由解封单元38解封。视频解码器48从解封单元38接收经解封视频数据。在一些实例中,目的地装置40包含解调制所述信息的调制解调器。类似于输出接口32,输入接口36可包含经设计用于接收数据的电路,包含放大器、滤波器和一或多个天线。在一些例子中,输出接口32和/或输入接口36可并入在包含接收和发射电路两者的单一收发器组件内。调制解调器可包含各种混频器、滤波器、放大器或其它经设计用于信号解调制的组件。在一些例子中,调制解调器可包含用于执行调制和解调制两者的组件。
解封单元38可将视频文件的元素解封为组成的PES流,将PES流拆包以检索经编码数据,且依据经编码数据为音频还是视频流的一部分(例如,如流的PES包标头所指示)将经编码数据发送到音频解码器46或视频解码器48。音频解码器46解码经编码音频数据且将经解码音频数据发送到音频输出42,而视频解码器48解码经编码视频数据且将经解码视频数据(其可包含流的多个视图)发送到视频输出44。
在一个实例中,视频解码器48根据熵译码方法(例如,CAVLC或CABAC)解码所接收的经编码视频数据8(例如,经译码块)以获得经量化系数。视频解码器48应用反向量化(解量化)和反向变换功能来重建像素域中的残余块。视频解码器48还基于包含在经编码视频数据中的控制信息或语法信息(例如,译码模式、运动向量、界定滤波器系数的语法等)产生预测块。视频解码器48计算预测块与经重建残余块的和以产生经重建的视频块以供显示。
在一个实例中,视频输出44包含一或多个显示装置,其经配置以向用户显示经解码视频数据,包含例如包括基于包含在参考视图中的深度信息合成的目的地视图的多视图视频。形成视频输出44的一部分或全部的显示装置可包含例如阴极射线管(CRT)、液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或另一类型的显示装置等多种一或多个显示装置的任一者。在一些实例中,视频输出44包含能够进行三维重放的显示装置。举例来说,视频输出44可包含立体显示,其结合检视者佩戴的眼镜使用。
视频编码器28、视频解码器48、音频编码器26、音频解码器46、囊封单元30和解封单元38各自可经实施为例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑电路、软件、硬件、固件或其任何组合等多种合适处理电路(适用的情况下)中的任一者。视频编码器28和视频解码器48的每一者可包含在一或多个编码器或解码器中,其任一者可作为组合式视频编码器/解码器(CODEC)的一部分集成。同样,音频编码器26和音频解码器46的每一者可包含在一或多个编码器或解码器中,其任一者可作为组合式CODEC的一部分集成。包含视频编码器28、视频解码器48、音频编码器26、音频解码器46、囊封单元30和/或解封单元38的设备可包括集成电路、微处理器,和/或无线通信装置(例如,蜂窝式电话)。
图2是说明实例囊封单元30的组件的框图。在图2的实例中,囊封单元30包含视频输入接口80、音频输入接口82、视频文件产生单元60和视频文件输出接口84。在此实例中,视频文件产生单元60包含网络抽象层(NAL)单元构造器62、参数集提取单元64,和样本描述产生单元66。
视频输入接口80和音频输入接口82分别接收经编码视频和音频数据。视频输入接口80和音频输入接口82可在数据经编码时接收经编码视频和音频数据,或可从计算机可读媒体接收经编码视频和音频数据。在接收经编码视频和音频数据后,视频输入接口80和音频输入接口82将经编码视频和音频数据传递到视频文件产生单元60以供汇编为视频文件。
视频文件产生单元60可对应于控制单元,包含经配置以执行归属于其的功能和程序的硬件、软件和/或固件。控制单元可进一步执行通常归属于囊封单元30的功能。对于视频文件产生单元60体现在软件和/或固件中的实例,囊封单元30可包含包括针对视频文件产生单元60的指令的计算机可读媒体,以及用以执行所述指令的处理单元。视频文件产生单元60的子单元的每一者(在此实例中,NAL单元构造器62、参数集提取单元64,和样本描述产生单元66)可实施为个别硬件单元和/或软件模块,且可功能上集成或进一步分离为额外子单元。视频文件产生单元60可对应于任何适宜的处理单元或处理电路,例如一或多个微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP),或其任何组合。视频文件产生单元60可进一步包含非暂时性计算机可读媒体,其存储针对NAL单元构造器62、参数集提取单元64和样本描述产生单元66的任一者或全部的指令,以及用于执行所述指令的处理器。
一般来说,视频文件产生单元60可产生包含所接收的音频和视频数据的视频文件。NAL单元构造器62可形成包含所接收的音频和视频样本的NAL单元。视频文件产生单元60可进一步经配置以针对特定时间例项汇编包含所有NAL单元的存取单元。此外,视频文件产生单元60可经配置以将序列层级SEI消息与序列层级SEI消息描述的经编码视频图片解耦,且将序列层级SEI消息与序列层级SEI消息描述的经编码视频图片分离而存储在视频文件中。
视频编码器28(图1)可包含除视频数据以及视频数据的样本以外的数据。囊封单元30的视频输入接口80从视频编码器28接收的经编码视频数据可包含例如表示例如VPS、SPS和PPS等参数集的数据,以及经编码视频的样本的SEI消息。在经囊封视频文件的上下文中,样本可指代经编码视频数据的样本以及其它数据的样本,包含包括形成参数集的部分的数据的样本,所述参数集可由视频解码器(例如,目的地装置40的视频解码器48)使用以解码也包含在囊封单元30产生的经囊封视频文件中的经编码视频数据。
在根据本发明的实例中,囊封单元30的视频文件产生单元60经配置以将作为经编码视频数据的一部分接收的参数集数据存储在特定位置中,且在经囊封文件中提供指示参数集位于何处的指示。举例来说,囊封单元30的视频文件产生单元60经配置以将参数集数据存储在与视频样本相关联的样本描述中、样本数据中、样本描述和样本两者中,或某一其它位置中。
如上所述,视频文件产生单元60包含参数集提取单元64和样本描述产生单元66。在一个实例中,参数集提取单元64经配置以从囊封单元30的视频输入接口80接收的经编码视频数据提取参数集数据。在一个实例中,参数集提取单元64可识别参数集数据且借此将此数据与经编码视频数据区分。另外,参数集提取单元64可将参数集数据与经编码视频数据区分。
视频文件产生单元60的参数集提取单元64还可经配置以将参数集数据存储在经囊封视频文件中的若干不同位置中。在一个实例中,参数集提取单元64经配置以将参数集数据的一部分或全部存储在与视频数据的样本相关联的一或多个样本描述中。在另一实例中,参数集提取单元64经配置以将参数集数据存储在除样本描述以外的位置中,包含与视频轨道中的视频样本一起,或在比如参数集轨道等经囊封视频文件的单独轨道中。在参数集数据与样本描述和视频样本分离而存储的情况下,在一些实例中,参数集提取单元64可产生与其中将存储且借以将发射参数集数据的一些或全部的经囊封视频文件分离的文件。
视频文件产生单元60的样本描述产生单元66经配置以产生与视频的样本相关联的样本描述。如上所述,在根据ISO基础媒体文件格式而格式化的文件中,总体媒体呈现称为电影。电影逻辑上划分为轨道。一些轨道可表示媒体的经定时序列(例如,视频的帧)。另外,轨道可含有例如媒体属性/参数等其它数据,包含例如接收囊封在文件中的数据的解码器装置可借以对经译码视频数据进行解码的参数集。在每一轨道内,每一经定时单元称为样本,其可例如为视频或音频的帧。每一轨道具有一或多个样本描述,且轨道中的每一样本通过参考与描述发生联系。样本描述提供可借以将样本属性信息传送到例如视频解码器等装置的语法结构。样本描述界定可如何对样本进行解码(例如,描述识别所使用的压缩算法)。样本描述产生单元66经配置以产生与包含在囊封单元30的视频输入接口80所接收的经编码视频数据中的视频的样本相关联的样本描述。
在一个实例中,样本描述产生单元66产生的样本描述指示参数集的位置以及其它信息。先前HEVC文件格式指定:所有类型的所有参数集包含在样本描述中,或所有类型的所有参数集可存储在样本描述和样本中。然而,在一些情况下,区分特定类型的参数集是否包含在样本描述中例如以确定何时执行VPS、SPS和PPS的一或多者的频带外运送可能是有用的。
为促进确定特定类型的所有参数集是包含在样本描述中还是某一其它位置(例如,参数集轨道)中,本发明的技术使得能够由样本描述产生单元66在样本描述中指定个别地指示每一类型的参数集存储在何处的指示。在一个实例中,样本描述产生单元66在解码器配置记录中针对每一类型的参数集提供一个指示,例如VPS、SPS和PPS的每一者。解码器配置记录是形成样本描述的一部分的语法结构。图3和4说明囊封单元30产生的文件的实例,其包含与存储在文件中的视频的样本相关联的参数集的位置的指示。
图3是说明由囊封单元30囊封的实例视频文件100的概念图。视频文件100包含网上音乐盒(moov box)102,其包含视频数据轨道104和参数集轨道106。根据本发明的视频文件100或其它经囊封视频文件可包含两个以上轨道,包含多个视频和音频数据轨道以及多个参数集轨道。在图3中,视频数据轨道104包含样本描述108以及包括视频样本110和11的视频样本的相关联序列。视频数据轨道104可包含更多视频样本和额外样本描述。
网上音乐盒102形成包含在ISO基础媒体文件格式视频文件100中的视频数据的基本存储容器。如上所述,在实践中,网上音乐盒102可包含若干不同轨道,包含视频数据、音频数据和(在一些情况下)参数集轨道。在图3的实例视频文件100中,网上音乐盒102包含视频数据轨道104和参数集轨道106。视频数据轨道104和参数集轨道106的每一者可表示媒体或其它信息(例如,视频的帧)的经定时序列。在每一轨道内,每一经定时单元称为样本,其可例如为视频或音频的帧,或表示借以解码视频的样本的参数集的数据的样本。
在一个实例中,样本描述108由样本描述产生单元66至少部分基于与视频样本110和111相关联的参数集存储在视频文件100中何处而产生。在图3的实例中,与视频样本110和111相关联的参数集包含若干不同类型的参数集,包含VPS 120、SPS122和PPS 124。VPS 120存储在参数集轨道106中,而SPS 122和PPS 124存储在样本描述108中或与视频样本110和111一起,或两者。
样本描述产生单元66可通过确定参数集存储在视频文件100中何处(例如,由参数集提取单元64)产生样本描述108。在一个实例中,样本描述产生单元66确定VPS 120存储在视频文件100的参数集轨道106中,而SPS 122和PPS 124存储在与视频样本110和111相关联的样本描述108中。在此情况下,样本描述产生单元66可在解码器配置记录126中提供视频文件100中的参数集位置的指示,所述解码器配置记录126是样本描述108中包含的语法结构。
下文提供实例实施方案。特定来说,与经囊封视频文件100中的视频样本110和11相关联的样本描述108中包含的解码器配置记录126的语法可在下文所展示的实例HEVC解码器配置记录中如下。
在以上实例中,allSpsIncluded指示等于1,其可指示配置记录126应用于的视频样本(例如,视频样本110和111)的所有SPS包含在解码器配置记录126中。allPpsIncluded指示等于1,其可指示配置记录126应用于的视频样本(例如,视频样本110和111)的所有PPS包含在解码器配置记录126中。然而,allVpsIncluded指示等于0,其可指示配置记录126应用于的视频样本(例如,视频样本110和111)的所有VPS不包含在解码器配置记录126中。在图3的实例中,VPS 120包含在参数集轨道106中。
待在经译码视频数据的图片或其它部分中使用的参数集可需要在含有所述图片的样本之前或在针对所述图片的样本中发送。然而,依据参数集中包含的信息的性质以及与参数集相关联的视频样本,有可能将一些参数集与视频数据分离发射,例如一些参数集可在频带外发射(如上文描述)。因此,可能有利的是个别地指示不同类型的参数集的位置,且如图3的实例中说明,指定在SPS 122和PPS 124包含在样本描述108的解码器配置记录126中时,VPS 120与同VPS 120相关联的例如视频样本110和111等视频数据分离而存储在参数集轨道106中。
图4是说明由囊封单元30囊封的另一实例视频文件140的概念图。视频文件140包含网上音乐盒142,其包含视频数据轨道144。在图4的实例中,囊封单元30产生单独参数文件146,其包含参数集轨道148。根据本发明的视频文件140或其它经囊封视频文件可包含两个以上轨道,包含多个视频和音频数据轨道以及多个参数集轨道。在图4中,视频数据轨道144包含样本描述150以及包括视频样本152和153的视频样本的相关联序列。视频数据轨道144可包含更多视频样本和额外样本描述。
在图4的实例中,样本描述产生单元66产生样本描述150,包含解码器配置记录152。另外,解码器配置记录152包含旗标allVpsIncluded、allSpsIncluded和allPpsIncluded,其个别地指示VPS 154、SPS 156和PPS 158是否存储在样本描述150中。在图4的实例中,VPS 154存储在参数文件146的参数集轨道148中,而SPS 156和PPS 158存储在视频文件140的视频数据轨道144的样本描述150中。因此,在此实例中,有可能与视频数据140分离发射VPS 154,例如在频带外发射VPS 154(如上文描述)。
与经囊封视频文件中的视频样本相关联的样本描述可包含名称,其可设定为若干不同值。在根据本发明的一些实例中,样本描述的名称可指示一或多个参数集的位置,例如可指示特定类型的一或多个参数集是否存储在样本描述中。在一个实例中,样本描述可包含若干“hvc1”或“hev1”。在一个实例中,对于特定样本描述适用于的视频样本的序列,VPS、SPS和PPS在样本描述名称为“hvc1”时仅存储在样本描述中,且在样本描述名称为“hev1”时存储在样本描述和样本两者中。以此方式,样本描述的名称(例如,“hvc1”或“hev1”)指示参数集存储在样本描述中或样本中何处。
将参数集存储在视频流的样本描述中提供一种供应参数集的简单且静态方式。另一方面,将参数存储在样本中虽然可能较为复杂但可允许例如在参数集更新的情况下或在添加额外参数集的情况下更大的灵活性。解码器以样本描述中的参数集初始化,且接着使用所述参数集(如其在流中出现)更新。此更新可用使用相同识别符的新定义代替参数集。每当样本描述改变时,解码器以包含在样本描述中的参数集重新初始化。
在以上实施实例中,allSpsIncluded旗标(或者位)当等于1时可指示此配置记录适用于的流的所有SPS包含在样本描述中。当样本描述名称为“hvc1”时,allSpsIncluded旗标通常设定为1。allPpsIncluded旗标当等于1时同样可指示此配置记录适用于的流的所有PPS包含在样本描述中。再次,当样本描述名称为“hvc1”时,allPpsIncluded旗标也通常设定为1。allVpsIncluded旗标当等于1时可指示此配置记录适用于的流的所有VPS包含在样本描述中。当样本描述名称为“hvc1”时,allVpsIncluded旗标通常设定为1。
作为具有两个样本描述名称“hvc1”和“hev1”的替代,两个样本描述名称“hvc1”和“hev1”的一者可被作为样本描述名称的概率移除使得剩余样本描述名称不指示参数集存储在何处。在此实例中,可通过三个旗标allSpsIncluded、allPpsIncluded和allVpsIncluded独立于样本描述名称指示参数的位置。因此,在此替代方案中,三个旗标的语义可如下:
·allSpsIncluded等于1指示此配置记录适用于的流的所有SPS独立于样本描述的名称包含在样本描述中。
·allPpsIncluded等于1指示此配置记录适用于的流的所有PPS独立于样本描述的名称包含在样本描述中。
·allVpsIncluded等于1可指示此配置记录适用于的流的所有VPS独立于样本描述的名称包含在样本描述中。
或者(作为以上所列举替代方案的任一者),所述技术的一些方面可实现,当allSpsIncluded旗标等于0时,此配置记录适用于的流的至少一个SPS不包含在样本描述中。同样,所述技术的一些方面可实现,当allPpsIncluded旗标等于0时,此配置记录适用于的流的至少一个PPS不包含在样本描述中。此外,所述技术的一些方面可实现,当allVpsIncluded旗标等于0时,此配置记录适用于的流的至少一个VPS不包含在样本描述中。
图5是说明将经译码视频数据存储在电子文件中的实例方法的流程图。图5的方法包含确定与至少一个样本相关联的样本描述是否包含与所述至少一个样本相关联的特定类型的所有参数集(200);以及基于所述确定在电子文件中提供指示样本描述是否包含特定类型的所有参数集的指示(202)。所述至少一个样本包含电子文件中的经译码视频图片的多个序列的至少一部分。所述特定类型是参数集的多个不同特定类型的一者。图5的实例方法的功能在下文参考图6的实例方法更详细描述,图6说明根据本发明处理经译码视频数据的实例方法。
图6是说明处理经译码视频数据的实例方法的流程图。尽管出于实例和阐释的目的相对于源装置20和目的地装置40(图1)的组件描述,但应理解,任何适宜的装置可实施图6的技术。
起初,囊封单元30可接收经编码视频图片的序列(210)。例如视频编码器28等编码器可已与经译码视频样本一起包含不同类型的参数集,包含VPS、SPS和PPS。另外或作为替代,囊封单元30可与视频编码器28分离产生参数集。在任何情况下,囊封单元30可将参数集数据与同参数集相关联的经译码视频图片分离(212)。举例来说,囊封单元30的视频文件产生单元60的参数集提取单元64可将参数集数据与同参数集相关联的经译码视频图片分离。
即,囊封单元30可产生包含参数集和与参数集相关联的经译码视频图片的视频文件(214)。然而,这样做,囊封单元30可与同参数集相关联的经译码视频图片分离而存储参数集的一或多者。以此方式,参数集可与经译码视频图片分离而发射和处理。举例来说,根据本发明的技术,囊封单元30可将一或多个参数集存储在所产生的视频文件或与视频文件分离的另一文件的参数集轨道中。在另一实例中,囊封单元30可将参数集的一或多者存储在与经译码视频图片相关联的一或多个样本描述中。
囊封单元30(例如,囊封单元30的样本描述产生单元66)可经配置以产生与包含在经囊封视频文件中的经译码视频图片相关联的一或多个样本描述(216)。作为此过程的一部分,样本描述产生单元66可经配置以确定不同类型的参数集的位置,且在样本描述中提供关于特定类型的所有参数集是否存储在样本描述中的指示(如上文分别参考图3和4的视频文件100和140的实例描述)。
囊封单元30可接着输出视频文件(218)。举例来说,囊封单元30可致使源装置20将视频文件写入到存储媒体,例如光盘、软盘、快闪驱动器、硬盘驱动器、固态驱动器或其它存储媒体。此存储媒体可实体上运送到目的地装置40。或者,源装置20可例如经由广播、网络发射或其它发射技术将视频文件发射到目的地装置40。在任何情况下,目的地装置40可最终接收视频文件(220)。
在一些实例中,源装置20可例如响应于目的地装置40向源装置20发布的一或多个HTTP-获得(HTTP-Get)或部分-获得(partial-Get)请求将视频文件的不同部分提供到目的地装置40。目的地装置40可向源装置20发布第一HTTP-获得或部分-获得请求以检索序列参数集(例如,包含序列层级SEI消息的参数集轨道的全部或一部分),且发布第二(或更多)HTTP-获得或部分-获得请求以检索序列参数集描述的经译码视频图片。
在接收视频文件之后,目的地装置40可基于参数集解码视频文件(222)。即,视频解码器48可使用参数集的数据,包含VPS、SPS和PPS的一或多者,来辅助解码过程。在一个实例中,视频解码器48分析与从源装置20接收的视频文件中包含的经译码视频图片的一或多个集合相关联的样本描述。举例来说,视频解码器48可接收包含旗标(例如,allSpsIncluded、allPpsIncluded和allVpsIncluded旗标)的样本描述,其个别地指示VPS、SPS和PPS是否包含在样本描述中。依据样本描述中提供的指示,视频解码器可检索或以其它方式参考参数集以解码从源装置20接收的视频文件中包含的视频。
在一个实例中,源装置20的囊封单元30将所有VPS存储在与视频文件分离的参数文件中,且在发射视频文件之前将参数文件发射到目的地装置40。视频解码器48可参考样本描述,包含参考相对于视频样本的不同集合的解码器配置记录,且基于解码器配置记录中提供的指示确定所有VPS不存储在样本描述中。在此实例中,视频解码器48可检索或以其它方式参考与视频文件分离的源装置20提供的参数文件中包含的VPS。
在一或多个实例中,本发明中描述的功能、方法和技术可实施在硬件、软件、固件或其任何组合中。如果实施在软件中,那么所述功能可作为一或多个指令或代码存储在计算机可读媒体上或经由计算机可读媒体发射,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,其对应于例如数据存储媒体或通信媒体等有形媒体,通信媒体包含促进例如根据通信协议将计算机程序从一处传送到另一处的任何媒体。以此方式,计算机可读媒体通常可对应于(1)非暂时性有形计算机可读存储媒体,或(2)例如信号或载波等通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索指令、代码和/或数据结构以供实施本发明中描述的技术的任何可用媒体。计算机程序产品可包含计算机可读媒体。
借助说明而非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置,或其它磁性存储装置、快闪存储器,或可用于存储指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。并且,任何连接适当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源发射软件,那么同轴电缆、光纤电缆、双绞线、DSL或例如红外线、无线电和微波等无线技术包含在媒体的定义中。然而,应理解,计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它瞬时媒体,而是针对非瞬时有形存储媒体。如本文中所使用,磁盘和光盘包含紧密光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软磁盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘使用激光以光学方式再现数据。上文的组合也应包含在计算机可读媒体的范围内。
可由例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一或多个处理器来执行所述指令。因此,如本文中所使用的术语处理器摂可指上述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文描述的功能性可提供在经配置用于编码和解码的专门硬件和/或软件模块内,或并入在组合式编解码器中。并且,所述技术可完全实施在一或多个电路或逻辑元件中。
本发明的技术可实施在广泛多种装置或设备中,包含无线手持机、集成电路(IC)或IC组(例如,芯片组)。本发明中描述各种组件、模块或单元以强调经配置以执行所揭示的技术的装置的功能方面,但所述各种组件、模块或单元不必要求由不同硬件单元实现。事实上,如上文描述,各种单元可组合在编解码器硬件单元中或由互操作硬件单元的集合(包含如上文描述的一或多个处理器)结合适宜的软件和/或固件提供。
已描述了各种实例。这些和其它实例在所附权利要求书的范围内。

Claims (28)

1.一种将包括多个序列的经译码视频图片的经译码视频数据存储在电子文件中的方法,所述方法包括:
确定与至少一个样本相关联的样本描述是否包含与所述至少一个样本相关联的特定类型的所有参数集,其中所述至少一个样本包括所述多个序列的经译码视频图片的至少一部分,且其中所述特定类型是参数集的多个不同特定类型中的一者;以及
基于所述确定在所述电子文件中提供指示所述样本描述是否包含所述特定类型的所有参数集的指示。
2.根据权利要求1所述的方法,其中所述多个不同特定类型的参数集包括序列参数集SPS、图片参数集PPS和视频参数集VPS中的一或多者。
3.根据权利要求1所述的方法,其中确定所述样本描述是否包含所述特定类型的所有参数集包括:
确定与所述样本描述相关联的名称;以及
基于与所述样本描述相关联的所述名称确定所述样本描述是否包含所述特定类型的所有参数集。
4.根据权利要求3所述的方法,
其中与所述样本描述相关联的所述所确定的名称是“hvc1”,且
其中确定所述样本描述是否包含所述特定类型的所有参数集包括当所述样本被命名为“hvc1”时确定所述样本描述包含所述特定类型的所有参数集。
5.根据权利要求3所述的方法,
其中与所述样本描述相关联的所述所确定的名称是“hev1”,且
其中确定所述样本描述是否包含所述特定类型的所有参数集包括当所述样本被命名为“hev1”时确定所述样本描述不包含所述特定类型的所有参数集。
6.根据权利要求1所述的方法,其进一步包括在所述电子文件中使名称与所述样本描述相关联,其中所述名称不指示所述样本描述是否包含所述特定类型的所有参数集。
7.根据权利要求1所述的方法,其中在所述电子文件中提供指示所述样本描述是否包含所述特定类型的所有参数集的指示包括基于所述确定在所述电子文件中提供指示所述样本描述不包含所述特定类型的所有参数集的指示。
8.根据权利要求1所述的方法,其中在所述电子文件中提供指示所述样本描述是否包含所述特定类型的所有参数集的指示包括基于所述确定在所述电子文件中提供指示所述样本描述确实包含所述特定类型的所有参数集的指示。
9.根据权利要求1所述的方法,其中在所述电子文件中提供指示所述样本描述是否包含所述特定类型的所有参数集的指示包括基于所述确定在所述电子文件中提供指示所述样本描述的解码器配置记录是否包含所述特定类型的所有参数集的指示。
10.根据权利要求1所述的方法,其中所述特定类型的所有参数集包括所述多个不同特定类型的参数集的第一类型的所有参数集,其中所述文件中的所述指示包括所述文件中的第一指示,且所述方法进一步包括:
确定所述样本描述是否包含与所述至少一个相关联的所述多个不同特定类型的参数集的第二类型的所有参数集;以及
基于所述确定在所述电子文件中提供指示所述样本描述是否包含所述第二类型的所有参数集的第二指示。
11.根据权利要求10所述的方法,
其中所述文件中的所述指示包括所述文件中的指示所述样本描述是否包含所述第一类型的所有参数集的第一指示,
其中在所述电子文件中提供指示所述样本描述是否包含所述第一类型的所有参数集的所述第一指示包括基于所述确定在所述电子文件中提供指示所述样本描述不包含所述第一类型的所有参数集的指示,且
其中在所述电子文件中提供指示所述样本描述是否包含所述第二特定类型的所有参数集的所述第二指示包括基于所述确定在所述电子文件中提供指示所述样本描述确实包含所述第二类型的所有参数集的指示。
12.一种用于将包括多个序列的经译码视频图片的经译码视频数据存储在电子文件中的设备,所述设备包括:
至少一个处理器,其经配置以:
确定与至少一个样本相关联的样本描述是否包含与所述至少一个样本相关联的特定类型的所有参数集,其中所述至少一个样本包括所述多个序列的经译码视频图片的至少一部分,且其中所述特定类型是参数集的多个不同特定类型中的一者;且
基于所述确定在所述电子文件中提供指示所述样本描述是否包含所述特定类型的所有参数集的指示。
13.根据权利要求12所述的设备,其中所述多个不同类型的参数集包括序列参数集SPS、图片参数集PPS和视频参数集VPS中的一或多者。
14.根据权利要求12所述的设备,其中所述至少一个处理器经配置以至少通过以下步骤确定所述样本描述是否包含所述特定类型的所有参数集:
确定与所述样本描述相关联的名称;以及
基于与所述样本描述相关联的所述名称确定所述样本描述是否包含所述特定类型的所有参数集。
15.根据权利要求14所述的设备,
其中与所述样本描述相关联的所述所确定的名称是“hvc1”,且
其中所述至少一个处理器经配置以当所述样本被命名为“hvc1”时确定所述样本描述包含所述特定类型的所有参数集。
16.根据权利要求14所述的设备,
其中与所述样本描述相关联的所述所确定的名称是“hev1”,且
其中所述至少一个处理器经配置以当所述样本被命名为“hev1”时确定所述样本描述不包含所述特定类型的所有参数集。
17.根据权利要求12所述的设备,其中所述至少一个处理器经配置以在所述电子文件中使名称与所述样本描述相关联,其中所述名称不指示所述样本描述是否包含所述特定类型的所有参数集。
18.根据权利要求12所述的设备,其中所述至少一个处理器经配置以基于所述确定在所述电子文件中提供指示所述样本描述不包含所述特定类型的所有参数集的指示。
19.根据权利要求12所述的设备,其中所述至少一个处理器经配置以基于所述确定在所述电子文件中提供指示所述样本描述确实包含所述特定类型的所有参数集的指示。
20.根据权利要求12所述的设备,其中所述至少一个处理器经配置以基于所述确定在所述电子文件中提供指示所述样本描述的解码器配置记录是否包含所述特定类型的所有参数集的指示。
21.根据权利要求12所述的设备,其中所述特定类型的所有参数集包括所述多个不同特定类型的参数集的第一类型的所有参数集,其中所述文件中的所述指示包括所述文件中的第一指示,且其中所述至少一个处理器经配置以:
确定所述样本描述是否包含与所述至少一个相关联的所述多个不同特定类型的参数集的第二类型的所有参数集;且
基于所述确定在所述电子文件中提供指示所述样本描述是否包含所述第二类型的所有参数集的第二指示。
22.一种用于将包括多个序列的经译码视频图片的经译码视频数据存储在电子文件中的设备,所述设备包括:
用于确定与至少一个样本相关联的样本描述是否包含与所述至少一个样本相关联的特定类型的所有参数集的装置,其中所述至少一个样本包括所述多个序列的经译码视频图片的至少一部分,且其中所述特定类型是参数集的多个不同特定类型的一者;以及
用于基于所述确定在所述电子文件中提供指示所述样本描述是否包含所述特定类型的所有参数集的指示的装置。
23.根据权利要求22所述的设备,其中所述多个不同类型的参数集包括序列参数集SPS、图片参数集PPS和视频参数集VPS中的一或多者。
24.根据权利要求22所述的设备,其进一步包括用于至少通过以下步骤确定所述样本描述是否包含所述特定类型的所有参数集的装置:
确定与所述样本描述相关联的名称;以及
基于与所述样本描述相关联的所述名称确定所述样本描述是否包含所述特定类型的所有参数集。
25.一种上面存储有指令的计算机可读存储媒体,所述指令当执行时致使一或多个处理器执行包括以下各项的操作:
确定与至少一个样本相关联的样本描述是否包含与所述至少一个样本相关联的特定类型的所有参数集,其中所述至少一个样本包括所述多个序列的经译码视频图片的至少一部分,且其中所述特定类型是参数集的多个不同特定类型中的一者;以及
基于所述确定在所述电子文件中提供指示所述样本描述是否包含所述特定类型的所有参数集的指示。
26.一种处理存储在电子文件中的包括多个序列的经译码视频图片的经译码视频数据的方法,所述方法包括:
接收所述文件中指示与至少一个样本相关联的样本描述是否包含与所述至少一个样本相关联的特定类型的所有参数集的指示,其中所述至少一个样本包括所述多个序列的经译码视频图片的至少一部分,且其中所述特定类型是参数集的多个不同特定类型中的一者;以及
基于所述指示确定所述特定类型的所有参数集是否存储在所述样本描述中;以及
基于所述特定类型的所有参数集是否存储在所述样本描述中的所述确定至少部分基于所述特定类型的所述参数集的一或多者处理所述经译码视频数据。
27.一种用于处理存储在电子文件中的包括多个序列的经译码视频图片的经译码视频数据的设备,所述设备包括:
至少一个处理器,其经配置以:
接收所述文件中指示与至少一个样本相关联的样本描述是否包含与所述至少一个样本相关联的特定类型的所有参数集的指示,其中所述至少一个样本包括所述多个序列的经译码视频图片的至少一部分,且其中所述特定类型是参数集的多个不同特定类型中的一者;且
基于所述指示确定所述特定类型的所有参数集是否存储在所述样本描述中;且
基于所述特定类型的所有参数集是否存储在所述样本描述中的所述确定至少部分基于所述特定类型的所述参数集的一或多者处理所述经译码视频数据。
28.根据权利要求27所述的设备,其进一步包括解码器装置,且其中所述解码器装置经配置以至少通过至少部分基于所述特定类型的所述参数集的一或多者解码所述经译码视频数据而至少部分基于所述特定类型的所述参数集的一或多者处理所述经译码视频数据。
CN201380021221.0A 2012-04-25 2013-03-26 识别视频文件中的参数集 Active CN104246773B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261638393P 2012-04-25 2012-04-25
US61/638,393 2012-04-25
US13/748,291 2013-01-23
US13/748,291 US9161004B2 (en) 2012-04-25 2013-01-23 Identifying parameter sets in video files
PCT/US2013/033826 WO2013162808A1 (en) 2012-04-25 2013-03-26 Identifying parameter sets in video files

Publications (2)

Publication Number Publication Date
CN104246773A true CN104246773A (zh) 2014-12-24
CN104246773B CN104246773B (zh) 2018-09-14

Family

ID=49477363

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380021221.0A Active CN104246773B (zh) 2012-04-25 2013-03-26 识别视频文件中的参数集

Country Status (9)

Country Link
US (1) US9161004B2 (zh)
EP (1) EP2842059B1 (zh)
JP (1) JP6042531B2 (zh)
KR (1) KR101676553B1 (zh)
CN (1) CN104246773B (zh)
BR (1) BR112014026747B1 (zh)
ES (1) ES2784613T3 (zh)
HU (1) HUE047509T2 (zh)
WO (1) WO2013162808A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107211168A (zh) * 2015-02-11 2017-09-26 高通股份有限公司 在分层视频文件格式中的样本条目及操作点发信设计
CN109155876A (zh) * 2016-05-24 2019-01-04 高通股份有限公司 样本条目和随机存取

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130279882A1 (en) 2012-04-23 2013-10-24 Apple Inc. Coding of Video and Audio with Initialization Fragments
US9819944B2 (en) * 2013-04-12 2017-11-14 Samsung Electronics Co., Ltd. Multi-layer video coding method for random access and device therefor, and multi-layer video decoding method for random access and device therefor
US11418812B2 (en) 2015-02-11 2022-08-16 Qualcomm Incorporated Placement of parameter sets and sync samples in video coding
GB2539462B (en) * 2015-06-16 2019-04-03 Canon Kk Obtaining media data and metadata from encapsulated bit-streams wherein operating point descriptors can be dynamically set
US9872062B1 (en) * 2017-02-22 2018-01-16 Wyse Technology L.L.C. Enforcing synchronization by embedding audio within video frame data
US11356698B2 (en) 2019-12-30 2022-06-07 Tencent America LLC Method for parameter set reference constraints in coded video stream
US11716474B2 (en) 2020-01-02 2023-08-01 Samsung Electronics Co., Ltd. Storage of EVC decoder configuration information
US11902552B2 (en) * 2020-09-17 2024-02-13 Lemon Inc. Decoder configuration record in coded video
EP4264948A2 (en) * 2020-12-21 2023-10-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. File parser, file generator, encoder, decoder, client, server, and methods using parameter sets for coded video sequences
WO2024072750A1 (en) * 2022-09-27 2024-04-04 Bytedance Inc. Enhanced signalling of lost or corrupted samples in a media file

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040218668A1 (en) * 2003-04-30 2004-11-04 Nokia Corporation Method for coding sequences of pictures
CN101036392A (zh) * 2004-09-03 2007-09-12 诺基亚公司 视频编码中的参数集和图片报头
CN100419748C (zh) * 2002-04-29 2008-09-17 索尼电子有限公司 一种计算方法和采用该方法的装置和系统
CN101518086A (zh) * 2006-07-20 2009-08-26 汤姆森特许公司 在多视图视频编码中用信号通知视图可分级性的方法和装置
CN101595475A (zh) * 2005-07-15 2009-12-02 索尼株式会社 可伸缩视频编码(svc)文件格式
US20120023249A1 (en) * 2010-07-20 2012-01-26 Qualcomm Incorporated Providing sequence data sets for streaming video data

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040006575A1 (en) * 2002-04-29 2004-01-08 Visharam Mohammed Zubair Method and apparatus for supporting advanced coding formats in media files
US8503541B2 (en) 2004-01-16 2013-08-06 Motorola Mobility Llc Method and apparatus for determining timing information from a bit stream
AU2005306697B2 (en) 2004-11-16 2010-12-16 Interdigital Vc Holdings, Inc. Bit-accurate seed initialization for pseudo-random number generators used in a video system
JP2006203662A (ja) 2005-01-21 2006-08-03 Toshiba Corp 動画像符号化装置・復号化装置及び符号化ストリーム生成方法
JP4903195B2 (ja) * 2005-04-13 2012-03-28 ノキア コーポレイション ビデオデータを効果的に符号化及び復号する方法,デバイス及びシステム
US20060277316A1 (en) 2005-05-12 2006-12-07 Yunchuan Wang Internet protocol television
CN102271249B (zh) 2005-09-26 2014-04-09 韩国电子通信研究院 用于可伸缩视频的感兴趣区域信息设置方法和解析方法
US8520733B2 (en) 2006-06-30 2013-08-27 Core Wireless Licensing S.A.R.L Video coding
RU2492585C2 (ru) 2008-07-16 2013-09-10 Нокиа Корпорейшн Способ и устройство для группирования треков и подмножеств треков
US8514931B2 (en) 2009-03-20 2013-08-20 Ecole Polytechnique Federale De Lausanne (Epfl) Method of providing scalable video coding (SVC) video content with added media content
US8677005B2 (en) 2009-11-04 2014-03-18 Futurewei Technologies, Inc. System and method for media content streaming
US8918533B2 (en) * 2010-07-13 2014-12-23 Qualcomm Incorporated Video switching for streaming video data
US9215473B2 (en) 2011-01-26 2015-12-15 Qualcomm Incorporated Sub-slices in video coding

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100419748C (zh) * 2002-04-29 2008-09-17 索尼电子有限公司 一种计算方法和采用该方法的装置和系统
US20040218668A1 (en) * 2003-04-30 2004-11-04 Nokia Corporation Method for coding sequences of pictures
CN1781315A (zh) * 2003-04-30 2006-05-31 诺基亚有限公司 用于编码图像序列的方法
CN101036392A (zh) * 2004-09-03 2007-09-12 诺基亚公司 视频编码中的参数集和图片报头
CN101595475A (zh) * 2005-07-15 2009-12-02 索尼株式会社 可伸缩视频编码(svc)文件格式
CN101518086A (zh) * 2006-07-20 2009-08-26 汤姆森特许公司 在多视图视频编码中用信号通知视图可分级性的方法和装置
US20120023249A1 (en) * 2010-07-20 2012-01-26 Qualcomm Incorporated Providing sequence data sets for streaming video data

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107211168A (zh) * 2015-02-11 2017-09-26 高通股份有限公司 在分层视频文件格式中的样本条目及操作点发信设计
CN109155876A (zh) * 2016-05-24 2019-01-04 高通股份有限公司 样本条目和随机存取
CN109155876B (zh) * 2016-05-24 2021-02-02 高通股份有限公司 一种检索视频数据的方法、装置、设备及可读存储媒体

Also Published As

Publication number Publication date
JP6042531B2 (ja) 2016-12-14
HUE047509T2 (hu) 2020-04-28
EP2842059B1 (en) 2020-01-15
JP2015519807A (ja) 2015-07-09
US20130287366A1 (en) 2013-10-31
CN104246773B (zh) 2018-09-14
BR112014026747A2 (pt) 2017-06-27
WO2013162808A1 (en) 2013-10-31
KR101676553B1 (ko) 2016-11-15
BR112014026747B1 (pt) 2021-10-13
ES2784613T3 (es) 2020-09-29
US9161004B2 (en) 2015-10-13
KR20150006449A (ko) 2015-01-16
EP2842059A1 (en) 2015-03-04

Similar Documents

Publication Publication Date Title
CN104246773A (zh) 识别视频文件中的参数集
CN102986218B (zh) 用于串流视频数据的视频切换
CN105744295B (zh) 提供用于串流传输视频数据的序列数据集
TWI489843B (zh) 配置用於串流傳輸視訊資料的次播放軌片段
CN105744382B (zh) 用于发射经编码视频数据的方法和装置
CN103609112B (zh) 视频译码中的内部位深度增加
TWI676387B (zh) 多層位元流之檔案中之參數集信令
CN103069769B (zh) 用于经译码视频数据的网络串流传输的特技模式
CN103069799B (zh) 发信号通知用于多路复用视频分量的数据
CN109155865A (zh) 在图像中的最感兴趣的区域的先进信号传送
CN110036641A (zh) 虚拟现实视频中的用信号表示的感兴趣区域或视点的优选呈现
CN108353191B (zh) 用于处理视频数据的方法、装置和计算机可读存储介质
CN109792567A (zh) 用于发送遗失或损坏视频数据信号的系统及方法
CN104221386A (zh) 译码视频及存储视频内容的方法
TWI699115B (zh) 用於視訊之改良式限制方案設計
CN102714715A (zh) 用于文件格式轨迹选择的媒体提取器轨迹
CN103081488A (zh) 发信号通知用于特技模式视频表示的视频样本
CN104303513B (zh) 三维视频中的位流提取
CN107251559B (zh) 一种处理视频数据的方法及装置
KR20230175242A (ko) Eos 샘플 그룹에 기반한 미디어 파일 생성/수신 방법,장치 및 미디어 파일 전송 방법
CN116584099A (zh) 媒体文件处理方法及媒体文件处理装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant