CN104813671A - 视频译码中的位流性质 - Google Patents
视频译码中的位流性质 Download PDFInfo
- Publication number
- CN104813671A CN104813671A CN201380049105.XA CN201380049105A CN104813671A CN 104813671 A CN104813671 A CN 104813671A CN 201380049105 A CN201380049105 A CN 201380049105A CN 104813671 A CN104813671 A CN 104813671A
- Authority
- CN
- China
- Prior art keywords
- bit stream
- syntactic element
- instruction
- decoding
- cvs
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/435—Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8451—Structuring of content, e.g. decomposing content into time segments using Advanced Video Coding [AVC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/85406—Content authoring involving a specific file format, e.g. MP4 format
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/238—Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
- H04N21/2381—Adapting the multiplex stream to a specific network, e.g. an Internet Protocol [IP] network
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
一种装置用信号表示位流的性质。所述位流包括多个经译码视频序列CVS。当所述性质具有特定值时,所述位流的所有所述CVS符合同一简档。视频处理装置能够基于所述性质确定是否处理所述位流。
Description
本申请案主张2012年9月24日申请的第61/705,047号美国临时专利申请案和2012年9月28日申请的第61/707,612号美国临时专利申请案的权益,所述申请案中的每一者的整个内容以引用的方式并入本文中。
技术领域
本发明涉及视频编码和解码。
背景技术
数字视频能力可并入到广泛范围的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子图书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的“智能电话”、视频电话会议装置、视频串流装置及其类似者。数字视频装置实施视频压缩技术,例如,由MPEG-2、MPEG-4、ITU-T H.263或ITU-TH.264/MPEG-4第10部分高级视频译码(AVC)所定义的标准、目前正在开发的高效率视频译码(HEVC)标准及这些标准的扩展中所描述的视频压缩技术。视频装置可通过实施此类视频压缩技术来更有效率地发射、接收、编码、解码及/或存储数字视频信息。
视频压缩技术执行空间(图片内)预测和/或时间(图片间)预测来减少或去除视频序列中固有的冗余。对于基于块的视频译码,可将视频切片(即,视频帧或视频帧的一部分)分割成视频块。使用相对于同一图片中的相邻块中的参考样本的空间预测对图片的经帧内译码(I)切片中的视频块进行编码。图片的经帧间编码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间或时间预测导致对块的预测性块进行译码。残余数据表示待译码的原始块与预测块之间的像素差。经帧间译码块是根据指向形成预测块的参考样本块的运动向量及指示经译码块与预测块之间的差的残余数据编码的。经帧内译码块是根据帧内译码模式和残余数据来编码的。为了实现进一步压缩,可以将残余数据从像素域变换到变换域,从而产生残余系数,接着可以对残余系数进行量化。可扫描最初布置为二维阵列的经量化的系数,以便产生系数的一维向量,且可应用熵译码以实现更多压缩。
可例如从多个视角编码视图来产生多视图译码位流。已经开发利用多视图译码方面的一些三维(3D)视频标准。举例来说,不同视图可传输左眼及右眼视图以支持3D视频。或者,一些3D视频译码过程可应用所谓的多视图加深度译码。在多视图加深度译码中,3D视频位流可不仅含有纹理视图分量而且含有深度视图分量。举例来说,每一视图可包括一个纹理视图分量及一个深度视图分量。
发明内容
一股来说,本发明描述用于在视频编码、解码、存储和应用系统中用信号表示位流性质和基本流性质的技术。在一些实例中,装置用信号表示位流的性质。所述位流包括多个经译码视频序列(CVS)。当所述性质具有特定值时,所述位流的所有所述CVS符合同一简档。视频处理装置可基于所述性质确定是否处理(例如,解码)所述位流。
在一个实例中,本发明描述处理视频数据的方法,所述方法包括:基于包括所述视频数据的经编码表示的位流的用信号表示的性质确定视频解码器是否能够解码所述位流,其中所述位流符合视频译码规范且包括多个CVS,且当所述用信号表示的性质具有特定值时,所述位流的所有所述CVS符合同一简档,所述简档是由所述视频译码规范指定的整个位流语法的子集;以及基于所述确定处理所述位流。
在另一实例中,本发明处理视频数据的方法,所述方法包括:用信号表示位流的性质,其中所述位流符合视频译码规范且包括多个CVS,其中当所述性质具有特定值时,所述位流的所有所述CVS符合同一简档,所述简档是由所述视频译码规范指定的整个位流语法的子集。
在另一实例中,本发明描述一种包括一或多个处理器的视频处理装置,所述一或多个处理器经配置以:基于包括视频数据的经编码表示的位流的用信号表示的性质确定视频解码器是否能够解码位流,其中所述位流符合视频译码规范且包括多个CVS,且当所述用信号表示的性质具有特定值时,所述位流的所有所述CVS符合同一简档,所述简档是由所述视频译码规范指定的整个位流语法的子集;以及基于所述确定处理所述位流。
在另一实例中,本发明描述一种包括一或多个处理器的视频处理装置,所述一或多个处理器经配置以:用信号表示位流的性质,其中所述位流符合视频译码规范且包括多个CVS,其中当所述性质具有特定值时,所述位流的所有所述CVS符合同一简档,所述简档是由所述视频译码规范指定的整个位流语法的子集。
在另一实例中,本发明描述一种视频解码装置,其包括:用于基于包括视频数据的经编码表示的位流的用信号表示的性质确定视频解码器是否能够解码所述位流的装置,其中所述位流符合视频译码规范且包括多个CVS,且当所述用信号表示的性质具有特定值时,所述位流的所有所述CVS符合同一简档,所述简档是由所述视频译码规范指定的整个位流语法的子集;以及用于基于所述确定处理所述位流的装置。
在另一实例中,本发明描述一种视频处理装置,其包括:用于用信号表示位流的性质的装置,其中所述位流符合视频译码规范且符合视频译码规范且包括多个CVS,其中当所述性质具有特定值时,所述位流的所有所述CVS符合同一简档,所述简档是由所述视频译码规范指定的整个位流语法的子集。
一种具有存储于其上的指令的非暂时性计算机可读数据存储媒体,所述指令当执行时配置视频解码器以:基于包括视频数据的经编码表示的位流的用信号表示的性质确定视频解码器是否能够解码所述位流,其中所述位流符合视频译码规范且包括多个CVS,且当所述用信号表示的性质具有特定值时,所述位流的所有所述CVS符合同一简档,所述简档是由所述视频译码规范指定的整个位流语法的子集;以及基于所述确定处理所述位流。
一种具有存储于其上的指令的非暂时性计算机可读数据存储媒体,所述指令当执行时配置视频处理装置以:用信号表示位流的性质,其中所述位流符合视频译码规范且包括多个CVS,其中当所述性质具有特定值时,所述位流的所有所述CVS符合同一简档,所述简档是由所述视频译码规范指定的整个位流语法的子集。
在附图和下文描述中阐述本发明的一或多个实例的细节。其它特征、目标和优点将从所述描述、图式以及权利要求书而显而易见。
附图说明
图1是说明可以利用本发明中描述的技术的实例视频编码系统的框图。
图2是图解说明可实施本发明中描述的技术的实例视频编码器的框图。
图3是图解说明可实施本发明中描述的技术的实例视频解码器的框图。
图4是说明经分割为多个瓦片的图片的实例译码树块译码次序的概念图。
图5是说明波前并行处理的实例的概念图。
图6是说明根据本发明的一或多个技术的视频解码器的实例操作的流程图。
图7是说明根据本发明的一或多种技术的视频处理装置的实例操作的流程图。
具体实施方式
位流可包括形成经译码图片的表示的位序列和形成一或多个经译码视频序列(CVS)的相关联数据。基本流可包括一或多个位流的序列。经译码图片可包括含有图片的所有译码树单元的图片的经译码表示。编码树单元(CTU)可包括亮度样本的译码树块(CTB)和色度样本的两个对应CTB以及用以对样本进行译码的语法结构。CVS可包括存取单元序列。存取单元中的每一者可包括与同一时间实例相关联的经译码图片的集合。
简档、层次和层级指定对位流的限制且因此指定对解码位流所需的能力的限制。简档、层次和层级也可以用以指示个别解码器实施方案之间的互操作性点。简档可为由视频译码规范(例如,HEVC)指定的整个位流语法的子集。举例来说,每一简档可指定由符合所述简档的所有解码器应支持的算法特征和限制的子集。不需要视频编码器利用简档中支持的所有特征。
层次的每一层级可指定对语法元素可采取的值的限制的集合。层次和层级定义的同一集合与所有简档一起使用,但个别实施方案可支持不同层次和在一层次内用于每一所支持简档的不同层级。对于任何给定简档,层次的层级可大体上对应于特定解码器处理负载和存储器能力。视频解码器的能力可在对符合简档、层次和层级的约束的视频流进行解码的能力方面指定。对于每一此类简档,也可表达针对所述简档支持的层次和层级。一些视频解码器可能不能够对特定简档、层次或层级进行解码。
位流可含有与不同简档相关联的多个CVS。因此,给定位流,简单地检查用于位流的第一CVS的作用中序列参数集(SPS)中包含的简档信息可能不足以知道符合特定简档的视频解码器是否能够解码整个位流。为了确保视频解码器可解码整个位流,所述视频解码器可需要检查位流中的所有CVS以确定所有CVS是否符合视频解码器能够解码的简档。此检查可能不是简单的,因为实际上可能必须检查在位流中的所有网络抽象层(NAL)单元以识别所有作用中SPS。
本发明的一些实例技术可通过在位流中用信号表示位流的性质而解决位流中的先前提到的问题。视频解码器可使用用信号表示的位流的性质来确定视频解码器是否能够解码所述位流。因此,视频解码器可不需要检查位流中的所有参数集(例如,视频参数集(VPS)、SPS、图片参数集(PPS)等)来确定在位流的解码期间哪些参数集在作用中。
在本发明的一些技术中,视频编码器(或其它视频处理装置)可用信号表示位流的性质。位流包括多个CVS。当此用信号表示的位流的性质具有特定值时,所述位流的所有CVS符合同一简档。视频处理装置可能够基于所述性质确定是否处理(例如,解码)所述位流。举例来说,视频编码器(或其它视频处理装置)可在位流性质补充增强信息(SEI)消息中用信号表示位流的位流性质。SEI消息可包含对于图片的样本值的正确解码不需要的元数据。位流性质SEI消息可提供含有所述SEI消息的整个位流的信息。举例来说,位流的每一SPS可包含简档指示符语法元素,其指示用于SPS的适用CVS符合的简档。在此实例中,在位流性质SEI消息中具有特定值(例如,1)的特定语法元素指示简档指示符语法元素的值对于当位流经解码时激活的所有SPS是相同的。
基本流可包括一或多个位流的序列。本发明的技术可解决关于基本流的相似问题。也就是说,视频解码器可能不能够确定视频解码器是否能够解码基本流而不剖析基本流的每一CVS来确定在基本流的解码期间哪些参数集在作用中。本发明的技术可通过在基本流中用信号表示基本流的性质而克服此问题。根据本发明的一些此类技术,视频编码器(或其它视频处理装置)可用信号表示基本流性质。基本流包括一或多个位流,其中的每一者包含一或多个CVS。当性质具有特定值时,基本流的所有CVS符合同一简档。视频处理装置可能够基于所述性质确定是否处理基本流。
举例来说,视频处理装置可产生基本流性质(ESP)SEI消息以用信号表示基本流层级性质。ESP SEI消息提供含有所述ESP SEI消息的整个基本流的信息。举例来说,基本流的每一SPS可包含简档指示符语法元素,其指示用于SPS的适用CVS符合的简档。在此实例中,ESP SEI消息中具有特定值(例如,1)的特定语法元素指示简档指示符语法元素的值对于当基本流经解码时激活的所有SPS是相同的。
图1是说明可以利用本发明的技术的实例视频译码系统10的框图。如本文所使用,术语“视频译码器”一股是指视频编码器及视频解码器两者。在本发明中,术语“视频译码”或“译码”一股可指视频编码或视频解码。
如图1中所示,视频编解码系统10包含源装置12和目的地装置14。源装置12产生经编码的视频数据。因此,源装置12可以被称为视频编码装置或视频编码设备。目的地装置14可以对由源装置12所产生的经编码的视频数据进行解码。因此,目的地装置14可以被称为视频解码装置或视频解码设备。源装置12以及目的地装置14可以是视频编解码装置或视频编解码设备的实例。
源装置12和目的地装置14可包括广泛范围的装置,包含桌上型计算机、移动计算装置、笔记型(例如,膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能”电话和电话手持机、电视、摄像机、显示装置、数字媒体播放器、视频游戏控制台、车载计算机或类似者。
目的地装置14可以经由信道16从源装置12接收经编码的视频数据。信道16可以包括能够将经编码的视频数据从源装置12移动到目的地装置14的一或多个媒体或装置。在一个实例中,信道16可以包括使得源装置12能够实时地将经编码的视频数据直接发射到目的地装置14的一或多个通信媒体。在此实例中,源装置12可以根据例如无线通信协议等通信标准调制经编码的视频数据,并且可以将经调制的视频数据发射到目的地装置14。一或多个通信媒体可以包含无线通信媒体和/或有线通信媒体,例如射频(RF)频谱或一或多个物理传输线。一或多个通信媒体可以形成基于包的网络的一部分,基于包的网络例如局域网、广域网或全球网络(例如,因特网)。所述一或多个通信媒体可包含路由器、交换器、基站或促进从源装置12到目的地装置14的通信的其它设备。
在另一实例中,信道16可以包含存储由源装置12产生的经编码的视频数据的存储媒体。在此实例中,目的地装置14可以例如经由磁盘存取或卡存取来存取存储媒体。存储媒体可以包含多种本地存取的数据存储媒体,例如蓝光光盘、DVD、CD-ROM、快闪存储器或用于存储经编码的视频数据的其它合适数字存储媒体。
在另一实例中,信道16可以包含存储由源装置12产生的经编码的视频数据的文件服务器或另一中间存储装置。在此实例中,目的地装置14可以经由流式传输或下载来存取存储于文件服务器或其它中间存储装置处的经编码的视频数据。文件服务器可以是能够存储经编码的视频数据并且将经编码的视频数据发射到目的地装置14的类型的服务器。实例文件服务器包含网络服务器(例如,用于网站)、文件传输协议(FTP)服务器、网络附接存储(NAS)装置及本地磁盘驱动器。
目的地装置14可以通过标准数据连接(例如因特网连接)来存取经编码的视频数据。数据连接的实例类型可包含无线信道(例如,Wi-Fi连接)、有线连接(例如,数字订户线(DSL)、电缆调制解调器等)或适合于存取存储在文件服务器上的经编码视频数据的两者的组合。经编码的视频数据从文件服务器的传输可为流式传输、下载传输或两者的组合。
本发明的技术不限于无线应用或设定。所述技术可以应用于视频编解码以支持多种多媒体应用,例如空中电视广播、有线电视发射、卫星电视发射、流式视频发射(例如,经由因特网)、编码视频数据以存储于数据存储媒体上、解码存储于数据存储媒体上的视频数据,或其它应用。在一些实例中,视频译码系统10可经配置以支持单向或双向视频传输以支持例如视频流式传输、视频回放、视频广播和/或视频电话等应用。
图1仅为实例,且本发明的技术可适用于未必包含编码装置与解码装置之间的任何数据通信的视频译码设定(例如,视频编码或视频解码)。在其它实例中,数据可从本地存储器检索、在网络上流式传输,等。视频编码装置可以对数据进行编码并且将数据存储到存储器,和/或视频解码装置可以从存储器检索数据并且对数据进行解码。在许多实例中,通过并不彼此通信而是简单地编码数据到存储器及/或从存储器检索数据且解码数据的装置执行编码及解码。
在图1的实例中,源装置12包含视频源18、视频编码器20以及输出接口22。在一些情况下,输出接口22可以包含调制器/解调器(调制解调器)和/或发射器。视频源18可以包含视频俘获装置(例如,摄像机)、含有先前俘获的视频数据的视频存档、用以从视频内容提供者接收视频数据的视频馈入接口、和/或用于产生视频数据的计算机图形系统,或视频数据的此些源的组合。
视频编码器20可以对来自视频源18的视频数据进行编码。在一些实例中,源装置12经由输出接口22将经编码的视频数据直接发射到目的地装置14。在其它实例中,经编码的视频数据还可以存储到存储媒体或文件服务器上以供稍后由目的地装置14存取以用于解码和/或回放。
在图1的实例中,目的地装置14包含输入接口28、视频解码器30以及显示装置32。在一些实例中,输入接口28包含接收器和/或调制解调器。输入接口28可经由信道16接收经编码视频数据。视频解码器30可对经编码视频数据进行解码。显示装置32可显示经解码视频数据。显示装置32可与目的地装置14集成或在目的地装置14外部。显示装置32可以包括多种显示装置,例如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20以及视频解码器30各自可以实施为例如以下各者的多种合适电路中的任一者:一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、硬件或其任何组合。如果部分地以软件实施技术,装置可将软件的指令存储于合适的非暂时性计算机可读存储媒体中且可使用一或多个处理器以硬件执行指令从而执行本发明的技术。可将前述内容中的任一者(包含硬件、软件、硬件与软件的组合等)视为一或多个处理器。视频编码器20和视频解码器30中的每一者可包含在一或多个编码器或解码器中,所述编码器或解码器中的任一者可集成为相应装置中的组合编码器/解码器(CODEC)的部分。
本发明可能总体上参考视频编码器20向另一装置(例如视频解码器30)“用信号表示”某些信息。术语“用信号表示”可以大体上是指对用以对经压缩的视频数据进行解码的语法元素和/或其它数据的通信。此通信可实时或接近实时地发生。替代性地,可历时时间跨度而发生此通信,例如当在编码时,以经编码位流将语法元素存储到计算机可读存储媒体时,可发生此通信,接着,在存储到此媒体之后可由解码装置在任何时间检索所述语法元素。
在一些实例中,视频编码器20和视频解码器30根据例如国际标准化组织(ISO)/IECMPEG-4视觉和ITU-T H.264(也被称作ISO/IEC MPEG-4 AVC)等视频压缩标准操作,包含其可缩放视频译码(SVC)扩展、多视图视频译码(MVC)扩展和基于MVC的三维视频(3DV)扩展。在一些情况下,符合H.264/AVC的基于MVC的3DV扩展的任何位流始终含有顺应H.264/AVC的MVC扩展的子位流。此外,视频编码器20和视频解码器30可根据当前在开发的对H.264/AVC的3DV译码扩展(即,基于AVC的3DV)操作。在其它实例中,视频编码器20和视频解码器30可根据国际电信联盟电信标准化部分(ITU-T)H.261、国际标准化组织(ISO)/国际电工委员会(IEC)移动图片专家组(MPEG)-1视觉、ITU-T H.262或ISO/IEC MPEG-2视觉和ITU-T H.264 ISO/IEC视觉操作。
在其它实例中,视频编码器20及视频解码器30可根据由ITU-T视频译码专家组(VCEG)及ISO/IEC动画专家组(MPEG)的视频译码联合合作小组(JCT-VC)开发的高效率视频译码(HEVC)操作。被称作“HEVC工作草案8”的HEVC标准的草案描述于布洛斯等人的“高效率视频译码(HEVC)文本规范草案8”中(ITU-T SG16 WP3及ISO/IECJTC1/SC29/WG11的视频译码联合合作小组(JCT-VC),瑞典斯德哥尔摩第10次会议,2012年7月),所述草案从2013年9月3日为止可从http://phenix.int-evry.fr/jct/doc_end_user/documents/10_Stockholm/wg11/JCTVC-J1003-v8.zip获得。此外,视频编码器20和视频解码器30可根据可缩放视频译码、多视图译码和当前在开发的用于HEVC的3DV扩展而操作。HEVC的可缩放视频译码扩展可被称为SHEVC。HEVC的3DV扩展可被称为基于HEVC的3DV或3D-HEVC。
在HEVC及其它视频译码规范中,视频序列通常包含一系列图片。图片也可被称作“帧”。图片可以包含三个样本阵列,表示为SL、SCb以及SCr。SL是亮度样本的二维阵列(即,块)。SCb是Cb色度样本的二维阵列。SCr是Cr色度样本的二维阵列。色度样本在本文中还可以被称为“色度”样本。在其它情况下,图片可为单色的且可仅包含亮度样本阵列。
为了产生图片的经编码的表示,视频编码器20可以产生译码树单元(CTU)的集合。CTU中的每一者可包括亮度样本的译码树块、色度样本的两个对应的译码树块,以及用以对译码树块的样本进行译码的语法结构。在单色图片或具有三个单独颜色平面的图片中,CTU可包括单个译码树块及用于对所述译码树块的样本进行译码的语法结构。译码树块可以是样本的NxN块。CTU也可以被称为树块或最大译码单元(LCU)。HEVC的CTU可以广泛地类似于例如H.264/AVC等其它标准的宏块。然而,CTU未必限于特定大小,并且可以包含一或多个译码单元(CU)。切片可包含按光栅扫描次序连续排序的整数数目的CTU。
为了产生经译码的CTU,视频编码器20可以对CTU的译码树块递归地执行四叉树分割,以将译码树块划分为译码块,因此命名为“译码树单元”。译码块是样本的NxN块。CU可包括具有亮度样本阵列、Cb样本阵列和Cr样本阵列的图片的亮度样本的译码块以及色度样本的两个对应的译码块,以及用以对译码块的样本进行译码的语法结构。在单色图片或具有三个单独颜色平面的图片中,CU可包括单个译码块和用以对译码块的样本进行译码的语法结构。
视频编码器20可以将CU的译码块分割成一或多个预测块。预测块是应用相同预测的样本的矩形(即,正方形或非正方形)块。CU的预测单元(PU)可包括亮度样本的预测块、色度样本的两个对应预测块和用以预测预测块的语法结构。在单色图片或具有三个单独颜色平面的图片中,PU可包括单个预测块和用以预测预测块的语法结构。视频编码器20可以产生用于CU的每个PU的亮度预测块、Cb预测块以及Cr预测块的预测性亮度块、Cb块以及Cr块。
视频编码器20可以使用帧内预测或帧间预测来产生用于PU的预测性块。如果视频编码器20使用帧内预测产生PU的预测性块,则视频编码器20可以基于与PU相关联的图片的经解码的样本来产生PU的预测性块。在本发明中,短语“基于”可指示“至少部分基于”。如果视频编码器20使用帧间预测产生PU的预测性块,则视频编码器20可以基于不同于与PU相关联的图片的一或多个图片的经解码的样本来产生PU的预测性块。
为支持帧间预测,视频编码器20可产生一或多个参考图片列表。这些参考图片列表可被称为RefPicList0和RefPicList1。在一些实例中,视频编码器20可产生用于不同图片或图片的不同切片的不同参考图片列表。因此,不同图片及/或切片的不同PU可与RefPicList0及RefPicList1的不同版本相关联。
此外,当视频编码器20使用帧间预测以产生PU的预测性块时,视频编码器可用信号表示PU的运动信息。运动信息可包含用于PU的参考索引和用于PU的运动向量。PU的参考索引可指示与PU相关联的参考图片列表中的一者内的参考图片的位置。PU的运动向量可指示PU的预测块与参考图片中的参考位置之间的空间移位。视频编码器20可使用与所述参考位置相关联的参考图片的样本来产生PU的预测性块。因为PU可与两个参考图片相关联,所以PU可具有两个参考索引及两个运动向量。因此PU可具有RefPicList0参考索引及RefPicList1参考索引。PU的RefPicList0参考索引指示PU的RefPicList0的版本中的参考图片。PU的RefPicList1参考索引指示PU的RefPicList1的版本中的参考图片。类似地,PU可具有RefPicList0运动向量及RefPicList1运动向量。PU的RefPicList0运动向量可指示PU的RefPicList0的版本中的参考图片中的参考位置。PU的RefPicList1运动向量可指示PU的RefPicList1的版本中的参考图片中的参考位置。
视频编码器20可在位流中用信号表示PU的参考索引及运动向量。换句话说,视频编码器20可在位流中包含指示PU的参考索引和运动向量的数据。视频解码器30可重构PU的RefPicList0及/或RefPicList1的版本,且可使用PU的参考索引及运动向量以确定PU的一或多个预测性块。视频解码器30可使用PU的预测性块连同残余数据一起来解码样本。
在视频编码器20为CU的一或多个PU产生预测性亮度块之后,视频编码器20可以为CU产生亮度残余块。CU的亮度残余块中的每个样本指示CU的预测性亮度块中的一者中的亮度样本与CU的原始亮度译码块中对应的样本之间的差异。另外,视频编码器20可以为CU产生Cb残余块。CU的Cb残余块中的每一样本可以指示CU的预测性Cb块中的一者中的Cb样本与CU的原始Cb译码块中的对应样本之间的差异。视频编码器20还可以为CU产Cr残余块。CU的Cr残余块中的每一样本可以指示CU的预测性Cr块中的一者中的Cr样本与CU的原始Cr译码块中的对应样本之间的差异。
此外,视频编码器20可使用四叉树分割将CU的亮度、Cb及Cr残余块分解成一或多个亮度、Cb及Cr变换块。变换块可为应用同一变换的样本的矩形(例如,正方形或非正方形)块。CU的变换单元(TU)可包括亮度样本的变换块、色度样本的两个对应变换块及用以对变换块样本进行变换的语法结构。因此,CU的每个TU可以与亮度变换块、Cb变换块以及Cr变换块相关联。与TU相关联的亮度变换块可以是CU的亮度残余块的子块。Cb变换块可以是CU的Cb残余块的子块。Cr变换块可以是CU的Cr残余块的子块。在单色图片或具有三个单独颜色平面的图片中,TU可包括单个变换块和用以对变换块的样本进行变换的语法结构。
视频编码器20可将一或多个变换应用到TU的亮度变换块以产生TU的亮度系数块。系数块可以是变换系数的二维阵列。变换系数可以是标量。视频编码器20可以将一或多个变换应用到TU的Cb变换块从而为TU产生Cb系数块。视频编码器20可以将一或多个变换应用到TU的Cr变换块从而为TU产生Cr系数块。
在产生系数块(例如,亮度系数块、Cb系数块或Cr系数块)之后,视频编码器20可以量化系数块。量化大体上指代对变换系数进行量化以可能减少用以表示变换系数的数据的量从而提供进一步压缩的过程。在视频编码器20量化系数块之后,视频编码器20可以对指示经量化变换系数的语法元素进行熵编码。例如,视频编码器20可以对指示经量化变换系数的语法元素执行上下文自适应二进制算术译码(CABAC)。
视频编码器20可输出包含形成经译码图片及相关联数据的表示的位序列的位流。术语“位流”可为用以指网络抽象层(NAL)单元串流(例如,NAL单元序列)或字节串流(例如,含有开始码前缀的NAL单元串流及如由HEVC标准的附录B指定的NAL单元的囊封)的集合性术语。NAL单元为含有NAL单元中的数据类型类型的指示及含有所述数据的呈按需要穿插有模拟阻止位的原始字节序列有效负载(RBSP)的形式的字节的语法结构。NAL单元中的每一者可包含NAL单元标头且可囊封RBSP。NAL单元标头可包含指示NAL单元类型代码的语法元素。由NAL单元的NAL单元标头指定的所述NAL单元类型代码指示NAL单元的类型。RBSP可为含有封装在NAL单元内的整数数目个字节的语法结构。在一些情况下,RBSP包含零个位。
不同类型的NAL单元可囊封不同类型的RBSP。举例来说,第一类型的NAL单元可囊封用于图片参数集(PPS)的RBSP,第二类型的NAL单元可囊封用于经译码切片的RBSP,第三类型的NAL单元可囊封用于SEI的RBSP等等。囊封用于视频译码数据的RBSP(与用于参数集及SEI消息的RBSP相比)的NAL单元可被称为视频译码层(VCL)NAL单元。含有参数集(例如,VPS、SPS、PPS等)的NAL单元可被称为参数集NAL单元。
视频解码器30可以接收由视频编码器20产生的位流。另外,视频解码器30可以剖析位流以获得来自位流的语法元素。视频解码器30可至少部分基于从位流获得的语法元素重构视频数据的图片。用以重构视频数据的过程大体上可以与由视频编码器20执行的过程互逆。举例来说,视频解码器30可使用PU的运动向量,以确定当前CU的PU的预测性块。另外,视频解码器30可以逆量化与当前CU的TU相关联的系数块。视频解码器30可以对系数块执行逆变换以重构与当前CU的TU相关联的变换块。通过将用于当前CU的PU的预测性块的样本增加到当前CU的TU的变换块的对应的样本上,视频解码器30可以重构当前CU的译码块。通过重构用于图片的每个CU的译码块,视频解码器30可以重构图片。
在多视图译码中,可存在来自不同视角的同一场景的多个视图。在多视图译码的情况下,术语“存取单元”可用以指代对应于同一时间实例的图片的集合。因此,视频数据可概念化为随时间过去而出现的一系列存取单元。“视图分量”可为单个存取单元中的视图的经译码表示。在本发明中,“视图”可指与相同视图识别符相关联的视图分量序列。在一些实例中,视图分量可为纹理视图分量(即,纹理图片)或深度视图分量(即,深度图片)。
多视图译码支持视图间预测。视图间预测类似于用于HEVC中的帧间预测且可使用相同的语法元素。然而,当视频译码器对当前视频单元(例如PU)执行视图间预测时,视频编码器20可使用与当前视频单元在同一存取单元中但在不同视图中的图片作为参考图片。相对比地,常规的帧间预测仅使用不同存取单元中的图片作为参考图片。
在多视图译码中,如果视频解码器(例如,视频解码器30)可对视图中的图片进行解码而无需参考任何其它视图中的图片,那么所述视图可被称为“基础视图”。当对非基础视图中的一者中的图片进行译码时,视频译码器(例如视频编码器20或视频解码器30)可在图片与视频译码器当前正译码的图片处于不同视图中但在同一时间实例(即,存取单元)内的情况下将所述图片添加到参考图片列表中。类似于其它帧间预测参考图片,视频译码器可在参考图片列表的任何定位处插入视图间预测参考图片。
举例来说,NAL单元可包含标头(即,NAL单元标头)和有效负载(例如,RBSP)。NAL单元标头可包含nuh_reserved_zero_6bits语法元素。具有指定不同值的nuh_reserved_zero_6bit语法元素的NAL单元属于位流的不同“层”。因此,在多视图译码、3DV或SVC中,NAL单元的nuh_reserved_zero_6bits语法元素指定NAL单元的层识别符(即,层ID)。如果NAL单元涉及多视图译码、3DV译码或SVC中的基础层,那么所述NAL单元的nuh_reserved_zero_6bits语法元素等于0。可在不参考位流的任何其它层中的数据的情况下解码位流的基础层中的数据。如果NAL单元并不涉及多视图译码、3DV或SVC中的基础层,那么nuh_reserved_zero_6bits语法元素可具有非零值。在多视图译码和3DV译码中,位流的不同层可对应于不同视图。在SVC中,除基础层外的层可被称为“增强层”且可提供增强从位流解码的视频数据的视觉质量的信息。
此外,可在不参考相同层内的其它图片的情况下解码层内的一些图片。因此,可从位流移除囊封一层的某些图片的数据的NAL单元而不影响所述层中的其它图片的可解码性。移除囊封此些图片的数据的NAL单元可能会降低位流的帧速率。可在无需参考层内的其它图片的情况下解码的层内的图片的子集可在本文中被称作“子层”或“时间子层”。
NAL单元可包含temporal_id语法元素。NAL单元的temporal_id语法元素指定NAL单元的时间识别符。NAL单元的时间识别符识别NAL单元相关联的子层。因此,位流的每一子层可与不同时间识别符相关联。如果第一NAL单元的时间识别符小于第二NAL单元的时间识别符,那么可在不参考由第二NAL单元囊封的数据的情况下解码由第一NAL单元囊封的数据。
位流可与多个操作点相关联。位流的每一操作点与层识别符的集合(即,nuh_reserved_zero_6bits值的集合)及时间识别符相关联。所述层识别符集合可表示为OpLayerIdSet且所述时间识别符可表示为TemporalID。如果NAL单元的层识别符在操作点的层识别符集合中,且NAL单元的时间识别符小于或等于所述操作点的时间识别符,那么所述NAL单元与所述操作点相关联。操作点表示是与操作点相关联的位流子集。操作点表示可包含与操作点相关联的每一NAL单元。在一些实例中,操作点表示并不包含不与操作点相关联的VCL NAL单元。
媒体感知网络元件(MANE)可对以多个子层编码的HEVC位流应用位流薄化。在位流中的任何点MANE可基于较低子层(即,与较低时间识别符相关联的子层)中的图片由于用于较低子层中的图片的解码过程并不取决于较高子层的NAL单元而仍可解码的事实而开始移除较高子层(即,与较高时间识别符相关联的子层)的NAL单元。移除具有高于某一值的时间识别符的所有NAL单元的动作可被称作时间向下切换。时间向下切换可始终是可能的。
术语“时间向上切换”可指代开始向上转发在所述点之前尚未转发的某一子层的NAL单元的动作。仅在切换到的层中没有图片取决于同一子层中在位流中执行切换的点之前的任何图片的情况下,时间向上切换可为可能的。因此,术语“时间子层切换点”可指代对与图片在同一子层中且按解码次序先于所述图片的任何其它图片不具有相依性的图片。
在H.264/AVC视频译码标准的可缩放视频译码扩展(即,H.264/SVC)中,时间子层切换点可通过SPS中的temporal_id_nesting_flag语法元素而指示。举例来说,如果适用于特定CVS的SPS中的temporal_id_nesting_flag语法元素等于1,那么CVS中具有大于0的时间识别符的所有图片可为时间层切换点。此外,在H.264/SVC中,时间层级切换点SEI消息可指示时间子层切换点。在其中时间层级切换点SEI消息指示时间子层切换点的一些实例中,时间层级切换点SEI消息可含有关于在切换点之前应已经解码时间层M的时间长度的信息以便在所述切换点处向上切换到时间层M+1。
在HEVC中,如H.264/SVC中,SPS可包含sps_temporal_id_nesting_flag语法元素。当sps_temporal_id_nesting_flag语法元素具有等于1的值时,具有大于0的时间识别符的所有图片是子层切换点。在HEVC中,可存在与子层切换点相关联的两个图片类型,即时间子层存取(TSA)图片类型和逐步时间子层存取(STSA)图片类型。TSA和STSA图片类型可用以指示时间子层切换点。
TSA图片和按解码次序跟随TSA图片的图片并不使用具有等于或大于用于帧间预测参考的TSA图片的TemporalId的TemporalId的图片。TSA图片使得能够在TSA图片处从紧邻较低子层向上切换到含有所述TSA图片的子层或任何较高子层。在一些实例中,所有TSA图片具有大于0的时间识别符。
STSA图片并不使用具有与用于帧间预测参考的STSA图片相同的TemporalId的图片。与STSA图片具有相同时间识别符的按解码次序跟随STSA图片的图片并不使用具有与用于帧间预测参考的STSA图片具有相同时间识别符的按解码次序在STSA图片之前的图片。STSA图片使得能够在STSA图片处从紧邻较低子层向上切换到含有STSA图片的子层。在一些实例中,所有STSA图片具有大于0的时间识别符。因此,与TSA图片对比,STSA图片不一定实现到任何较高子层的向上切换。而是,STSA图片可仅实现到含有所述STSA图片的子层的向上切换。
HEVC从H.264/AVC继承参数集的概念。然而,HEVC提供对H.264/AVC的参数集的若干修改和添加。HEVC中提供的对H.264/AVC的参数集的修改和添加可分类为三个群组:(1)在与H.264/AVC相比时HEVC的不同译码工具所必要的添加和修改,(2)由关于H.264/AVC的操作体验产生的添加和修改,以及(3)HEVC中引入的视频参数集(VPS)。
如上文所指出,图片可分割为多个片段(例如,切片)。将图片分割为多个片段且在其自身输送单元中输送所述片段可对于最大传送单元(MTU)大小匹配为合意的。切片中的每一者可在输送单元(例如,包)中输送。在一些视频译码规范中,图片的第一输送单元可包含用于图片的第一片段的数据以及用于图片的图片标头。因为可需要图片标头来解码图片的所有片段,所以图片的第一输送单元的丢失可能阻止视频解码器正确地重构图片的任何片段,且有时随后图片的片段,即使含有图片的其它片段的输送单元不丢失也是如此。此外,含有图片的第一片段的输送单元可包含图片群组(GOP)标头和/或序列标头。因此,含有图片的第一片段的输送单元的丢失可能阻止视频解码器正确地解码整个GOP或整个序列。因此,如果图片分割为多个片段(例如,切片)且那些片段在其自身输送单元(例如,实时协议(RTP)包)中输送,那么序列标头或图片标头的丢失可对解码过程具有重要影响。因为此问题,一些解码器实施方案在含有图片的图片标头的输送单元丢失的情况下将不尝试对图片的所接收输送单元进行解码。
响应于序列标头和图片标头的丢失的影响而在H.264/AVC中引入参数集。为了对抗此脆弱性,引入基于输送层的机制。举例来说,请求注解(RFC)2429中指定的用于H.263的RTP有效负载格式允许在与编码器/打包器选择的包一样多的包中载运图片标头的冗余副本。在H.264/AVC的设计期间,认识到图片标头的脆弱性是视频编解码器自身的架构问题而不是输送问题,并且因此引入参数集概念作为所述问题的解决方案。参数集可为视频位流的部分或可通过其它方式(包含使用可靠的信道的带外发射、视频编码器和视频解码器中的硬译码等)由视频解码器接收。
参数集可含有直接或间接从切片的切片标头参考的识别。所述参考过程被称为“激活”。因此,当视频解码器30正解码一特定切片时,由所述特定切片的切片标头中的语法元素直接或间接参考的参数集被称为“经激活”。取决于参数集类型,激活可基于每图片或基于每序列发生。尤其引入通过参考的激活的概念,因为借助在位流中的信息的位置的隐式激活(对于视频编解码器的其它语法元素为共同的)在参数集的带外发射的情况下可能不可用。
此外,在HEVC中引入VPS以传达适用于多个层以及子层的信息。没有H.264/AVC的版本含有与VPS相当的参数集。因为H.264/AVC不含与VPS相当的参数集,因此可能需要用于例如能力交换和会话协商等目的的分层结构的复合建模。在H.264/AVC的SVC扩展中,可缩放性信息SEI消息可提供与VPS大致相同的内容,但由于其为SEI消息的本质,同一信息的大部分在序列参数集(SPS)中重复。在一些应用中,SPS也需要带外发射。因此,H.264/AVC中VPS的缺乏尤其当涉及重新发射时可造成增加的初始延迟,以保证带外发射中的可靠性。在具有参数集的带内发射的广播和多播的情况下,同一信息的重复可为大量开销,因为参数集可能需要在每一随机存取点重复以用于调入和信道切换。引入VPS以解决这些缺点以及实现多层编解码器的清洁且可扩展的高级设计。
位流的视频序列可具有多个层。所述层可与相同或不同SPS相关联。然而,视频序列的每一层可指代同一VPS,不管所述层是否与相同SPS或不同SPS相关联。VPS可传达包含以下各项的信息:
(1)由多个层或操作点共享的共同语法元素。在VPS中传达由多个层或操作点共享的共同语法元素可避免此类语法元素的不必要的复制;
(2)会话协商需要的操作点的信息,例如简档信息和层级信息;以及
(3)并不属于一个SPS的其它操作点特定的信息,例如用于层或子层的假设参考解码器(HRD)参数。
视频解码器30可剖析位流以从所述位流获得信息(例如,语法元素)。在一些实例中,每一操作点的信息的剖析并不需要视频解码器30执行熵译码(例如,CABAC、上下文自适应可变长度译码(CAVLC)、哥伦布译码等)。因此,每一操作点的信息的剖析可视为对于大多数网络元件为轻量的。
在HEVC中,每种类型的参数集可含有扩展机制。参数集的扩展机制可允许针对HEVC的将来版本和扩展而扩展所述参数集而不会破坏向后兼容性且不会产生对VPS和/或SPS中载运的简档/层级信息的剖析相依性。举例来说,HEVC提供用于允许HEVC的扩展(例如,SHEVC、MV-HEVC、3D-HEVC等)在VPS中包含额外语法元素的机制。换句话说,HEVC允许含有对HEVC的特定扩展为特定的额外语法元素的VPS扩展。换句话说,HEVC扩展中指定的VPS扩展可含有与针对基础HEVC规范指定的VPS中的语法元素相比更多的语法元素。VPS扩展中的语法元素可提供高效参数信令、灵活且轻量的会话协商、高级位流适配(例如,3D-HEVC中基于视图识别符的位流适配)等。
根据HEVC工作草案8,在属于层的VPS与SPS之间复制一些信息。此复制可允许符合HEVC规范的第一版本的视频解码器不考虑VPS NAL单元且仍具有解码位流所需的可用的所有信息。
在H.264/AVC和HEVC中,SPS可含有应用于CVS的所有切片的信息。在HEVC中,CVS可开始于瞬时解码刷新(IDR)图片,或断链存取(BLA)图片,或为位流中的第一图片的清洁随机存取(CRA)图片,包含并非IDR或BLA图片的所有后续图片。也就是说,在HEVC中,CVS可包括按解码次序由以下各项组成的存取单元序列:作为在位流中的第一存取单元的CRA存取单元,IDR存取单元或BLA存取单元,接着是零或多个非IDR和非BLA存取单元,包含直到但不包含任何后续IDR或BLA存取单元的所有后续存取单元。
位流包括一或多个CVS(且可由其组成)。SPS的内容可划分成六个类别:
(1)自参考(即,SPS的识别符);
(2)解码器操作点相关数据(例如,简档数据、层级数据、图片大小数据、编号子层数据等);
(3)用于实现在简档内可用的特定译码工具和与特定译码工具相关联的译码工具参数的旗标(或其它语法元素);
(4)限制结构的灵活性的信息和限制变换系数译码的灵活性的信息;
(5)时间可缩放性控制(类似于H.264/SVC);以及
(6)视觉可用性信息(VUI),其包含HRD信息。
HEVC PPS可含有可在图片之间改变的数据。HEVC PPS可包含与H.264/AVC PPS中包含的数据大致相当的数据。举例来说,HEVC PPS和H.264/AVC PPS两者可包含:
(1)自参考(例如,PPS的识别符);
(2)初始图片控制信息,例如初始量化参数(QP)、指示某些译码工具的使用或存在的许多旗标或参考PPS的切片的切片标头中的控制信息;以及
(3)平铺信息。
在HEVC中,切片标头可含有可在切片之间改变的数据。另外,切片标头可含有相对较小或仅针对特定切片类型或特定图片类型相关的图片相关数据。切片标头的大小可大于PPS的大小,尤其当切片标头包含瓦片进入点偏移或波前进入点偏移,明确地用信号表示参考图片集、预测权重或参考图片列表修改时。用于切片的切片标头的瓦片进入点偏移可指示所述切片的切片数据内与特定瓦片相关联的数据的开始位置。一股来说,瓦片是在所述瓦片的译码树块光栅扫描中连续排序的在一个列和一个行中共同发生的整数数目的译码树块。行可为整数数目的译码树块。列是由从图片的顶部边界延伸到底部边界的垂直边界彼此划定界限且在图片中从左到右连续排序。行是由从图片的左边边界延伸到右边边界的水平边界彼此划定界限且在图片中从上到下连续排序。列可为整数数目的译码树块。用于切片的切片标头的波前进入点偏移可指示所述切片的切片数据内与特定波前相关联的数据的开始位置。在本发明中其它地方分别关于图4和5描述瓦片和波前。
HEVC中的参数集的激活是H.264/AVC中的参数集的相似激活。在HEVC中,切片标头含有对PPS的参考。PPS又含有对SPS的参考。SPS含有对VPS的参考。用于参数集的一个共同实施方案策略是在其最大大小由参数集识别符的编号范围间接指定的表中保持给定类型(例如,PPS、SPS和VPS)的所有参数集。在此实施方案策略下,参数集激活可与以下操作一样简单:基于切片标头中的信息存取PPS表,将在PPS表中找到的信息复制到相关解码器数据结构中,以及跟随PPS中到相关SPS的参考,和跟随SPS中到相关VPS的参考。由于这些操作可能需要每图片仅执行一次(在最差情况情境中),因此所述操作可为轻量的。也可以通过在缓冲周期SEI消息中参考而激活SPS。
类似地,不管参数集NAL单元的类型如何,参数集NAL单元的处置也可以相对直接。在HEVC中,参数集NAL单元并不含有剖析相依性。换句话说,可在不参考任何其它NAL单元中的语法元素的情况下获得参数集NAL单元的语法元素。因为参数集NAL单元并不含有剖析相依性,所以参数集NAL单元是自包含的且并不需要从其它NAL单元导出的上下文用于剖析。虽然独立地维持剖析参数集NAL单元的能力可耗费再几个位,但独立地维持剖析参数集NAL单元的能力可实现相对直接的剖析和参数集在用于参数集的其相应表条目中的存储。
此外,HEVC工作草案8包含作用中参数集SEI消息的规范。作用中参数集SEI消息可包含指示作用中VPS和/或作用中SPS的语法元素。作用中参数集SEI消息可超驰基于切片标头、PPS、SPS和VPS中的参数集识别符的用于参数集的激活过程。
视频处理装置(例如,视频编码器20、MANE等)可拼接两个或两个以上位流。位流拼接可指代两个或两个以上位流或其部分的串联。举例来说,第一位流可由第二位流附加,可能对所述位流中的一者或两者具有一些修改以产生经拼接位流。在此实例中,第二位流中的第一经译码图片可被称为“拼接点”。因此,在拼接位流中的拼接点之后发生的图片来源于第二位流,而在拼接位流中的拼接点之前的图片来源于第一位流。
位流拼接器可执行位流拼接。在一些实例中,位流拼接器是轻量的且可能不如视频编码器复杂。举例来说,位流拼接器可能不配备有熵解码和熵编码能力。
在视频编辑和自适应流式传输环境中可使用位流切换。在切换到的位流中的特定图片处的位流切换操作可有效地为位流拼接操作,其中拼接点是位流切换点,即,来自切换到的位流的第一图片。
基本流可包括一或多个位流的序列。包括两个或两个以上位流的基本流可通过将所述两个或两个以上位流(或其部分)拼接在一起而形成。如果基本流含有多个位流,那么除了最后位流之外所述位流中的每一者以位流结束(EOS)NAL单元终止。
HEVC和其它视频译码标准提供用于实现对位流中的随机存取的机制。随机存取指代从不是位流中的第一经译码图片的经译码图片开始的位流的解码。在例如广播和流式传输等各种视频应用中可需要对位流的随机存取。对位流的随机存取可使得用户能够在任何时间调入到程序,在不同信道之间切换,跳转到视频的特定部分,或切换到不同位流用于串流适配(例如,位速率的调适、帧速率的适配、空间分辨率的适配等)。随机存取图片或随机存取点以规则的间隔插入到位流中可实现随机存取。随机存取图片的实例类型包含IDR图片、CRA图片和BLA图片。因此,IDR图片、CRA图片和BLA图片统称为随机存取点(RAP)图片。
IDR图片仅含有I切片(即,其中仅使用帧内预测的切片)。IDR图片可为按解码次序在位流中的第一图片,或可稍后出现在位流中。每一IDR图片为按解码次序的CVS的第一图片。如HEVC和H.264/AVC中指定的IDR图片可用于随机存取。然而,按解码次序在IDR图片之后的图片无法使用在IDR图片之前解码的图片作为参考。因此,依赖于IDR图片用于随机存取的位流可具有显著较低的译码效率以及使用额外类型的随机存取图片的位流。IDR存取单元是含有IDR图片的存取单元。
在HEVC中引入CRA图片的概念以允许在解码次序中在CRA图片后面但在输出次序中在CRA图片前面的图片使用在CRA图片之前解码的图片用于参考。按解码次序在CRA图片之后但按输出次序在CRA图片之前的图片被称作与CRA图片相关联的前导图片(或CRA图片的前导图片)。也就是说,为了改进译码效率,在HEVC中引入CRA图片的概念,以允许按解码次序在CRA图片之后但按输出次序在CRA图片之前的图片使用在CRA图片前解码的图片作为参考。CRA存取单元为其中经译码图片为CRA图片的存取单元。
CRA图片的前导图片在解码从按解码次序在CRA图片之前发生的IDR图片或CRA图片开始的情况下可正确地解码。然而,在发生从CRA图片的随机存取时,CRA图片的前导图片可能不可解码。因此,视频解码器在随机存取解码期间通常解码CRA图片的前导图片。为防止错误从取决于解码开始处而可能不可用的参考图片传播,在解码次序及输出次序两者中在CRA图片后面的所有图片都不可使用在解码次序或输出次序中在CRA图片前面的任何图片(其包含前导图片)作为参考。
断链存取(BLA)图片的概念在HEVC中是在CRA图片的引入之后引入且是基于CRA图片的概念。BLA图片通常源自在CRA图片的位置处拼接的位流,且在所述拼接的位流中,将拼接点CRA图片改变到BLA图片。含有RAP图片的存取单元可在本文中被称作RAP存取单元。BLA存取单元为含有BLA图片的存取单元。
BLA图片与CRA图片之间的一个差异如下。对于CRA图片,如果解码开始于按解码次序在CRA图片之前的RAP图片,那么相关联的前导图片可正确地解码。然而,当发生从CRA图片的随机存取时(即,当解码从CRA图片开始时,或换句话说,当CRA图片为位流中的第一图片时),与所述CRA图片相关联的前导图片不可正确地解码。相比之下,可能不存在与BLA图片相关联的前导图片可解码的情形,甚至当解码从按解码次序在BLA图片之前的RAP图片开始时。
与特定CRA图片或特定BLA图片相关联的前导图片中的一些可为可正确地解码的,甚至当所述特定CRA图片或特定BLA图片为位流中的第一图片时。这些前导图片可被称为可解码前导图片(DLP)。其它前导图片可被称为不可解码前导图片(NLP)。HEVC工作草案8还可将NLP称为标记为丢弃(TFD)图片。
一或多个HEVC位流可存储在符合特定文件格式的文件中。在一些实例中,视频数据位流(例如,HEVC位流)可存储在符合ISO基础媒体文件格式(ISOBMFF)的文件中。ISOBMFF也可被称作ISO/IEC 14496-12。用于视频数据位流的存储的其它实例文件格式包含从ISOBMFF导出的文件格式,包含MPEG-4文件格式(ISO/IEC 14496-14)、第三代合作伙伴计划(3GPP)文件格式(3GPP TS 26.244)和AVC文件格式(ISO/IEC 14496-15)。对用于HEVC视频内容的存储的AVC文件格式的修正正由MPEG开发。此AVC文件格式修正可被称为HEVC文件格式。
符合HEVC文件格式的文件可包含多个轨道。每一轨道可为相关样本的经定时序列。在HEVC文件格式的情况下,“样本”可包括与单个时戳相关联的数据。样本的实例包含:个别视频帧、按解码次序的一系列视频帧,或按解码次序的经压缩音频区段。在HEVC文件格式中,每一轨道可包括多个“盒”。“盒”是通过唯一类型识别符和长度定义的面向对象的构建块。
3GPP多媒体服务包含经由HTTP的3GPP动态自适应流式传输(3GP-DASH,3GPPTS 26.247)、包交换流式传输(PSS,3GPP TS 26.234)、多媒体广播及多播服务(MBMS,3GPP TS 26.346)及经由IMS的多媒体电话服务(MTSI,3GPP TS 26.114)。MPEG还已指定经由HTTP的动态自适应流式传输(DASH)标准(ISO/IEC IS 23009-1)。实时协议(RTP)有效负载格式包含RFC 6184中的H.264有效负载格式、RFC 6190中的SVC有效负载格式和许多其它格式。当前,HEVC RTP有效负载格式正由因特网工程任务小组(IETF)开发。
DASH是针对其中存在经编码媒体内容的多个表示但每一表示具有不同位速率(允许带宽适配)的网络流式传输。在带宽增加时,客户端可从较高带宽表示检索数据,且当带宽减小时,客户端可从较低带宽表示检索数据。DASH媒体呈现描述(MPD)是描述何种表示是可用的以及其位速率的文档(例如,XML格式化文档)。DASH MPD也可被称作“清单文件”。在给定特定时间的网络带宽的确定量的情况下,客户端可使用DASHMPD来选择表示。
在DASH中,媒体呈现可含有一或多个周期的序列。周期可以通过MPD中的周期元素来定义。每一周期可以含有相同媒体内容的一或多个表示。表示可以是音频或视频数据的多个替代的经编码版本中的一者。表示可按编码类型而不同,例如按用于视频数据的位速率、分辨率和/或编解码器和用于音频数据的位速率、语言和/或编解码器而不同。术语表示可用于指代经编码音频或视频数据的对应于多媒体内容的特定周期并且用特定方式编码的区段。
DASH的使用可允许客户端装置适应沿着源装置与客户端装置之间的网络路径可发生的可用带宽的变化。确切地说,内容产生者常常产生表示的集合,每一表示具有相同特性但在不同位速率下经译码。此表示的集合可被称为“适配集合”。例如MPD的清单文件描述适配集合的表示的特性,包含所述表示的位速率,并且还可提供用于检索表示的数据的信息,例如用于所述表示的片段(例如,个别文件)的统一资源定位符(URL)。
HEVC和其它视频译码标准指定简档、层次和层级。简档、层次和层级指定对位流的限制且因此指定对解码位流所需的能力的限制。简档、层次和层级也可以用以指示个别解码器实施方案之间的互操作性点。每一简档指定由符合简档简档的所有视频解码器支持的算法特征和限制的子集。不需要视频编码器利用简档中支持的所有特征。层次的每一层级可指定对语法元素可具有的值的限制的集合。层次和层级定义的同一集合可与所有简档一起使用,但个别实施方案可支持不同层次且支持层次内用于每一所支持简档的不同层级。对于任何给定简档,层次的层级可大体上对应于特定解码器处理负载和存储器能力。视频解码器的能力可在对符合特定简档、层次和层级的约束的视频串流进行解码的能力方面指定。对于每一此类简档,也可表达针对所述简档支持的层次和层级。一些视频解码器可能不能够对特定简档、层次或层级进行解码。
在HEVC中,简档、层次和层级可由语法结构profile_tier_level()语法结构用信号表示。profile_tier_level()语法结构可包含在VPS和/或SPS中。profile_tier_level()语法结构可包含general_profile_idc语法元素、general_tier_flag语法元素和general_level_idc语法元素。general_profile_idc语法元素可指示CVS符合的简档。general_tier_flag语法元素可指示用于general_level_idc语法元素的解译的层次上下文。general_level_idc语法元素可指示CVS符合的层级。用于这些语法元素的其它值可保留。
视频解码器的能力可在对符合简档、层次和层级的约束的视频串流进行解码的能力方面指定。对于每一此类简档,也可表达针对所述简档支持的层次和层级。在一些实例中,视频解码器并不推断HEVC中指定的值之间的general_profile_idc语法元素的保留值指示指定简档之间的中间能力。然而,视频解码器可推断与HEVC中指定的值之间的general_tier_flag语法元素的特定值相关联的general_level_idc语法元素的保留值指示层次的指定层级之间的中间能力。
位流可含有来自不同简档的多个CVS(可能具有额外限制,例如在针对0到31(包含性)的i范围内的general_profile_compatibility_flag[i]中用信号表示,和如HEVC中指定的general_reserved_zero_16bits)。因此,在给定位流的情况下,简单地检查用于第一CVS的作用中SPS中包含的简档信息不足以知道符合特定简档的视频解码器是否可解码整个位流。为了确保视频解码器可解码整个位流,视频解码器可检查位流中的所有CVS以找出所有CVS是否符合同一简档。此检查可不是简单的,因为视频解码器可需要检查位流中的实际上所有NAL单元以确定所有作用中SPS。确定所有作用中SPS可涉及确定SPS NAL单元、EOS NAL单元、RAP图片的NAL单元和SEI NAL单元,且剖析RAP图片的NAL单元的缓冲周期SEI消息和/或切片标头以确定哪一SPS对于CVS在作用中。
在不剖析和检查位流中实际上所有NAL单元的情况下不能够确定位流的性质的情形还可关于例如下文列出的那些其它类型的位流层级信息(即,位流性质)发生。然而应了解,关于确定以下位流性质中的一些所涉及的复杂性水平将不一定需要剖析和检查位流中的实际上所有NAL单元。
1)层次和层级是否对于位流中的所有CVS保持不变。
2)位流中的所有CVS是否具有相同空间分辨率。
3)位流中的所有CVS是否具有相同(最大)数目的时间子层。
4)位流中是否所有CVS具有相同(最大)数目的层(即,用于VCL NAL单元的nuh_reserved_zero_6bits的值的数目),且如果是,那么在位流中的所有CVS中是否所有层具有相同的层识别符集合(即,相同的nuh_reserved_zero_6bits值的集合)。
5)在位流中是否所有CVS支持同一操作点集合。
6)在位流中是否所有CVS具有相同(最大)图片速率。
7)在位流中是否所有CVS具有相同最大位速率。
8)在位流中是否所有CVS具有相同颜色格式。
9)在位流中是否所有CVS具有相同样本纵横比。
10)在位流中是否所有CVS具有用于亮度和色度的相同位深度集合。用于样本值(例如,亮度样本或色度样本)的位深度可指示多少位用以表示所述样本值。
11)在位流中是否至少一个参数集经更新。换句话说,VPS、SPS或PPS的内容是否改变但使用相同的VPS识别符、SPS识别符或PPS识别符。换句话说,在位流中是否至少一个VPS经更新,在位流中是否至少一个SPS经更新,以及在位流中是否至少一个PPS经更新。
12)是否所有参数集存在于位流的开始处(即在位流中的第一存取单元内)。如果所述条件是真,那么仍可存在在其它存取单元中重复的参数集,例如用于错误恢复目的。然而,可能不存在在重复参数集当中的任何参数集更新。换句话说,是否所有VPS存在于位流的开始处,是否所有SPS存在于位流的开始处,以及是否所有PPS存在于位流的开始处。
13)在位流中参数集的存在是否实现完整随机可存取性。也就是说,是否可能通过丢弃在RAP存取单元之前的所有存取单元而在每一RAP存取单元的位置处执行随机存取且按解码次序对RAP图片和所有后续非TFD图片进行正确地解码。这可需要当在任何RAP存取单元执行以上随机存取时,每一参数集当所述参数集需要激活时在位流中是可用的。
14)在位流中是否所有CVS仅含有在帧图片中译码的渐进帧,即扫描类型是渐进而不交错,且不存在字段图片。
15)在位流中是否任何CVS含有帧封装布置SEI消息。换句话说,在位流中由每一CVS表示的视频片段是否经帧封装。帧封装布置SEI消息指示与SEI消息相关联的图片是否是通过封装表示不同视图的两个图片而构成的帧,且如果是,则指示所述封装如何完成。
16)是否针对位流的所有CVS启用瓦片和/或位流的所有CVS中的所有图片是否具有相同瓦片配置。
17)在位流中是否所有CVS具有相同译码树块大小和相同最小译码块大小。
18)在位流中是否所有CVS具有相同的序列层级HRD参数(或其一部分)的集合(例如,如HEVC中指定的hrd_parameters()语法结构中用信号表示)和/或相同的经解码图片缓冲器大小的集合(例如,如HEVC中指定的vps_max_dec_pic_buffering[i]语法元素用信号表示)。
19)在位流中是否所有CVS利用特定译码工具。举例来说,是否位流的所有CVS利用相依切片(当dependent_slices_enabled_flag语法元素等于1时支持)、波前并行处理(当entropy_coding_sync_enabled_flag语法元素等于1时支持)、加权预测等。
20)在位流中是否所有CVS具有由SOP描述SEI消息描述的相同图片结构(SOP)。SOP描述SEI消息通过参考图片集(RPS)描述位流的结构。SOP描述SEI消息的设计可解决其中时间和帧间预测结构的了解是有帮助的若干使用情况。举例来说,网关可在位速率适配中使用SOP信息来确定可丢弃而不会影响转发位流的解码的互相关图片的集合。此位流修整可具有比基于TemporalId的子位流提取更精细的粒度且因此可更适合于细微的临时位速率适配。SOP描述SEI消息存在于SOP的第一存取单元中。SOP描述SEI消息提供用于SOP中的每一图片的以下信息:所述图片是否是参考或非参考图片的指示,所述图片的TemporalId值,所述图片使用的短期RPS索引,以及相对于SOP的第一图片的图片次序计数。这些条信息全面地表示SOP的时间结构和帧间预测阶层。
21)在位流中是否在所有CVS中的TFD图片可经解码且以可接受质量输出。
22)是否存在当位流经解码时激活的仅一个VPS;以及如果存在当位流经解码时激活的仅一个VPS,则所述VPS的VPS识别符。
23)是否存在当位流经解码时激活的仅一个SPS;以及如果存在当位流经解码时激活的仅一个SPS,则所述SPS的SPS识别符。
24)是否存在当位流经解码时激活的仅一个PPS;以及如果存在当位流经解码时激活的仅一个PPS,则所述PPS的PPS识别符。
25)以下各者中的一或多者及其组合:
a.在位流中是否所有RAP图片是IDR图片。
b.在位流中是否所有RAP不是IDR图片。
c.在位流中是否存在是IDR图片的RAP图片。
d.在位流中是否存在非IDR RAP图片。
e.在位流中是否所有RAP图片是CRA图片。
f.在位流中是否所有RAP图片不是CRA图片。
g.在位流中是否存在是CRA图片的RAP图片。
h.在位流中是否存在非CRARAP图片。
i.在位流中是否所有RAP图片是BLA图片。
i.在位流中是否所有RAP图片不是BLA图片。
k.在位流中是否存在是BLA图片的RAP图片。
l.在位流中是否存在非IDR BLA图片。
m.在位流中是否存在DLP图片。
n.在位流中是否存在TFD图片。
o.在位流中是否存在TSA图片。
p.在位流中是否存在STSA图片。
26)sps_temporal_id_nesting_flag语法元素的值是否针对当位流(或基本流)经解码时激活的所有SPS是相同的。
27)vps_temporal_id_nesting_flag语法元素的值是否针对当位流(或基本流)经解码时激活的所有VPS是相同的。
此外,剖析位流的实际上所有NAL单元以确定位流性质的情形可适用于一些较详细类型的位流层级信息,例如以下性质:
1)在位流中的简档集合(可能具有额外限制,例如针对0到31(包含性)的范围内的i的general_profile_compatibility_flag[i]中用信号表示,和如HEVC中指定的general_reserved_zero_16bits)。或者,在位流中的最大简档集合(即,在位流中没有CVS将符合所述集合中不包含的简档)。
2)在位流中的层次和层级的(最大)集合。这可有效地用信号表示为最高层次,且对于每一层次用信号表示最高层级。
3)在位流中的空间分辨率的(最大)集合。
4)在位流中的时间子层的(最大)数目的(最大)集合。
5)在位流中的层的(最大)数目(即用于VCL NAL单元的nuh_reserved_zero_6bits的值的数目)的(最大)集合和层ID(即nuh_reserved_zero_6bits值)的(最大)集合。
6)在位流中的操作点的(最大)集合。
7)在位流中的(最大)帧速率的(最大)集合。
8)在位流中的最大位速率的(最大)集合。
9)在位流中的颜色格式的(最大)集合。
10)在位流中的样本纵横比的(最大)集合。
11)在位流中的亮度位深度和色度位深度的(最大)集合。
12)在位流中的帧封装类型的(最大)集合。
13)在位流中的瓦片的(最大)数目。
14)在位流中的译码树块大小和最小译码块大小的(最大)集合。
在以上列表中,句子中的圆括号中的词语“最大”指示所述句子中可任选地包含词语“最大”。举例来说,句子句子“在位流中的瓦片的(最大)数目”可读作“在位流中的瓦片的数目”或“在位流中的瓦片的最大数目”。
基本流可含有多个位流且因此还可含有多个CVS。基本流中的CVS还可具有不同简档。因此,需要剖析和检查位流的实际上所有NAL单元以确定位流的性质的问题在基本流的情况下可产生。因此,可能必须剖析和检查基本流的实际上所有NAL单元以确定基本流的性质(即,基本流性质)。此类基本流性质可包含上文关于术语“位流”(被术语“基本流”置换)所列的位流性质中的一者或全部。
本发明的技术可解决上述问题中的一或多者。举例来说,视频编码器20可在位流中用信号表示位流的位流性质。位流的位流性质可总体上适用于位流。位流的位流性质可指定上文所列的位流性质中的一或多者。在一些技术中,位流性质SEI消息经界定以用信号表示位流层级性质。位流性质SEI消息提供含有所述SEI消息的整个位流的信息。换句话说,位流性质SEI消息可提供含有所述SEI消息的整个位流的信息。
举例来说,视频编码器20可用信号表示包括多个CVS的位流的性质。在此实例中,当所述性质具有特定值时,所述位流的所有CVS符合同一简档。举例来说,所述性质可为特定语法元素。在此实例中,视频编码器20可在位流中用信号表示含有所述特定语法元素的SEI消息。当特定语法元素具有特定值时,当位流经解码时激活的相应SPS中的一股简档指示符语法元素具有相同值。在此实例中,所述一股简档指示符语法元素中的每一者指示CVS符合的简档。
在相似实例中,视频解码器30(或另一视频处理装置)可基于包括视频数据的经编码表示的位流的用信号表示的性质而确定视频解码器30是否能够解码所述位流。在此实例中,所述位流包括多个CVS且当用信号表示的性质具有特定值时,所述位流的所有CVS符合同一简档。此外,在此实例中,视频解码器30(或另一视频处理装置)可基于所述确定而处理(例如,解码)所述位流。举例来说,视频解码器30(或另一视频处理装置)可基于包括视频数据的经编码表示的位流中的SEI消息中的特定语法元素而确定视频解码器30是否能够解码所述位流。当特定语法元素具有特定值时,当位流经解码时激活的相应SPS中的一股简档指示符语法元素具有相同值。所述一股简档指示符语法元素中的每一者指示CVS符合的简档。在此实例中,视频解码器30可基于所述确定而解码所述位流。
此外,视频编码器20可在基本流中用信号表示所述基本流的位流性质。基本流的位流性质可总体上适用于基本流。基本流的基本流性质可指定上文所列的基本流性质中的一或多者。在一些实例中,基本流性质(ESP)SEI消息经界定以用信号表示基本流层级性质。举例来说,视频编码器20可产生含有指定基本流性质的语法元素的ESP SEI消息。ESP SEI消息可提供含有所述SEI消息的整个基本流的信息。
举例来说,视频编码器20可在基本流中用信号表示含有特定语法元素的SEI消息。当特定语法元素具有特定值时,当基本流经解码时激活的相应SPS中的一股简档指示符语法元素具有相同值。在此实例中,所述一股简档指示符语法元素中的每一者指示CVS符合的简档。
在相似实例中,视频解码器30可基于包括视频数据的经编码表示的基本流中的SEI消息中的特定语法元素而确定视频解码器30是否能够解码所述基本流。当特定语法元素具有特定值时,当位流经解码时激活的相应SPS中的一股简档指示符语法元素具有相同值。所述一股简档指示符语法元素中的每一者可指示CVS符合的简档。在此实例中,视频解码器30可基于所述确定而解码所述基本流。
在一些实例中,位流的一或多个位流性质可以ISO基础媒体文件格式用信号表示。举例来说,一或多个位流性质可在ISO基础媒体文件格式的HEVC视频轨道中的样本条目中用信号表示。因此,位流的性质(例如,指示位流的所有CVS是否符合同一简档的性质)可在ISO基础媒体文件格式文件中(例如,在ISO媒体文件格式文件的HEVC视频轨道中)用信号表示。类似地,在一些实例中,一或多个基本流性质可在ISO基础媒体文件层级用信号表示。举例来说,一或多个基本流性质可在轨道标头盒、媒体信息盒、视频媒体标头盒或HEVC视频轨道的另一盒中包含的新盒(例如,基本流性质盒)中用信号表示。
在一些实例中,一或多个位流性质可在DASH MPD中的元素或属性中用信号表示。因此,位流的性质(例如,指示位流的所有CVS是否符合同一简档的性质)可在DASHMPD中用信号表示。在其中位流性质中的一或多者在DASH MPD中的元素或属性中用信号表示的一些实例中,所述一或多个位流性质可在周期层级、适配集合层级、表示层级或子表示层级中用信号表示。类似地,基本流性质中的一或多者可在DASH MPD中的元素或属性中用信号表示。在其中基本流性质中的一或多者在DASH MPD中的元素或属性中用信号表示的一些实例中,所述一或多个基本流性质可在周期层级、适配集合层级、表示层级或子表示层级中用信号表示。
根据本发明的一些实例技术,基本流性质中的一或多者可在会话描述协议(SDP)文件中用信号表示。因此,位流的性质(例如,指示位流的所有CVS是否符合同一简档的性质)可在SPD中用信号表示。SDP是用于描述流媒体初始化参数的格式。在一些实例中,基本流性质中的一或多者可在SDP文件中的各种媒体层级SDP属性中用信号表示。举例来说,多个简档和/或层次和层级可在一或多个媒体层级SDP属性中用信号表示以表示基本流中的简档、层次和层级的(最大)集合。在HEVC RTP有效负载格式中,可界定任选的有效负载类型参数,其可含有多个简档。在一些实例中,简档可以逗号分隔。参数可用以用信号表示基本流的性质或接收器实施方案的能力。此有效负载类型参数可包含在SDP文件中的SDP属性中。SDP供应可包含此SDP属性,其可含有多个简档。应答者可选择所供应简档中的一或多者。
此外,根据本发明的一或多个实例技术,位流性质或基本流性质可在如RFC 6381中界定的编解码器参数中用信号表示。举例来说,多个简档和/或层次和层级可在所述编解码器参数中用信号表示以表示位流或基本流的简档、层次和层级的(最大)集合。
图2是说明可以实施本发明的技术的实例视频编码器20的框图。图2是出于解释的目的而提供,且不应被视为将技术限制为本发明中所大致例示及描述者。出于解释的目的,本发明描述在HEVC译码的情况下的视频编码器20。然而,本发明的技术可以适用于其它译码标准或方法。
在图2的实例中,视频编码器20包含预测处理单元100、残余产生单元102、变换处理单元104、量化单元106、逆量化单元108、逆变换处理单元110、重构单元112、过滤器单元114、经解码的图片缓冲器116以及熵编码单元118。预测处理单元100包含帧间预测处理单元120以及帧内预测处理单元126。帧间预测处理单元120包含运动估计单元122以及运动补偿单元124。在其它实例中,视频编码器20可以包含更多、更少或不同的功能组件。
视频编码器20可以接收视频数据。视频编码器20可以对视频数据的图片的切片中的每个CTU进行编码。视频编码器20可对CTU的CU进行编码以产生CU的经编码表示(即,经译码CU)。作为对CU进行编码的一部分,预测处理单元100可以在CU的一或多个PU当中分割与CU相关联的译码块。因此,每个PU可以与亮度预测块以及对应的色度预测块相关联。视频编码器20以及视频解码器30可以支持具有各种大小的PU。CU的大小可指CU的亮度译码块的大小并且PU的大小可指PU的亮度预测块的大小。假定特定CU的大小是2Nx2N,则视频编码器20以及视频解码器30可以支持用于帧内预测的2Nx2N或NxN的PU大小,以及用于帧间预测的2Nx2N、2NxN、Nx2N、NxN或类似大小的对称PU大小。视频编码器20以及视频解码器30还可以支持用于帧间预测的2NxnU、2NxnD、nLx2N以及nRx2N的PU大小的非对称分割。
帧间预测处理单元120可以通过对CU的每个PU执行帧间预测产生用于PU的预测性数据。PU的预测性数据可以包含PU的预测性块以及PU的运动信息。取决于PU是在I切片中、P切片中或B切片中,帧间预测处理单元120可以对CU的PU执行不同操作。在I切片中,所有PU都是经帧内预测。因此,如果PU是在I切片中,则帧间预测处理单元120并不对PU执行帧间预测。
如果PU是在P切片中,则运动估计单元122可以对用于PU的参考区域搜索参考图片列表(例如,“RefPicList0”)中的参考图片。用于PU的参考区可为参考图片内含有最接近地对应于PU的预测块的样本的区。运动估计单元122可以产生指示含有用于PU的参考区域的参考图片的RefPicList0中的位置的参考索引。另外,运动估计单元122可产生指示PU的译码块与和参考区相关联的参考位置之间的空间位移的运动向量。举例来说,运动向量可以是提供从当前图片中的坐标到参考图片中的坐标的偏移的二维向量。运动估计单元122可将参考索引及运动向量输出为PU的运动信息。基于由PU的运动向量指示的参考位置处的实际样本或经内插样本,运动补偿单元124可以产生PU的预测性块。
如果PU是在B切片中,则运动估计单元122可以对PU执行单向预测或双向预测。为了对PU执行单向预测,运动估计单元122可以搜索RefPicList0的参考图片,或PU的参考区的第二参考图片列表(“RefPicList1”)。运动估计单元122可以将指示含有参考区的参考图片的RefPicList0或RefPicList1中的位置的参考索引、指示PU的预测块与相关联于参考区的参考位置之间的空间移位的运动向量以及指示参考图片是在RefPicList0中或在RefPicList1中的一或多个预测方向指示符输出为PU的运动信息。运动补偿单元124可以至少部分基于由PU的运动向量指示的参考位置处的实际样本或经内插样本来产生PU的预测性块。
为了对PU执行双向帧间预测,运动估计单元122可以在RefPicList0中的参考图片内搜索用于PU的参考区域,并且还可以在RefPicList1中的参考图片内搜索用于PU的另一参考区域。运动估计单元122可产生指示含有参考区的参考图片的RefPicList0及RefPicList1中的位置的参考索引。另外,运动估计单元122可产生指示与参考区相关联的参考位置与PU的预测块之间的空间移位的运动向量。PU的运动信息可包含PU的参考索引及运动向量。运动补偿单元124可至少部分基于在由PU的运动向量指示的参考位置处的实际或内插样本产生PU的预测性块。
帧内预测处理单元126可通过对PU执行帧内预测而产生PU的预测性数据。PU的预测性数据可以包含PU的预测性块以及各种语法元素。帧内预测处理单元126可以对I切片、P切片以及B切片中的PU执行帧内预测。
为了对PU执行帧内预测,帧内预测处理单元126可使用多个帧内预测模式产生PU的预测性块的多个集合。当使用特定帧内预测模式执行帧内预测时,帧内预测处理单元126可使用来自相邻块的样本的特定集合产生PU的预测性块。假定对于PU、CU及CTU采用从左到右、从上到下的编码次序,相邻块可在PU的预测块的上方、右上方、左上方或左方。帧内预测处理单元126可以使用各种数目的帧内预测模式,例如,33个定向帧内预测模式。在一些实例中,帧内预测模式的数目可以取决于PU的预测块的大小。
预测处理单元100可从PU的由帧间预测处理单元120产生的预测性数据或PU的由帧内预测处理单元126产生的预测性数据当中选择CU的PU的预测性数据。在一些实例中,预测处理单元100基于预测性数据的集合的速率/失真量度选择用于CU的PU的预测性数据。选定的预测性数据的预测性块在本文中可以被称为选定的预测性块。
残余产生单元102可基于CU的亮度、Cb及Cr译码块以及CU的PU的选定预测性亮度、Cb及Cr块产生CU的亮度、Cb及Cr残余块。举例来说,残余产生单元102可产生CU的残余块以使得残余块中的每一样本具有等于CU的译码块中的样本与CU的PU的对应选定的预测性块中的对应样本之间的差的值。
变换处理单元104可以执行四叉树分割以将CU的残余块分割成与CU的TU相关联的变换块。因此,TU可以与亮度变换块以及两个对应色度变换块相关联。CU的TU的亮度变换块以及色度变换块的大小和位置可以或可不基于CU的PU的预测块的大小和位置。
变换处理单元104可以通过将一个或一个以上变换应用到TU的变换块而产生用于CU的每一TU的变换系数块。变换处理单元104可以将各种变换应用到与TU相关联的变换块。例如,变换处理单元104可以将离散余弦变换(DCT)、定向变换或概念上类似的变换应用于变换块。在一些实例中,变换处理单元104并不将变换应用于变换块。在此类实例中,变换块可以处理为变换系数块。
量化单元106可以量化系数块中的变换系数。量化过程可以减小与变换系数中的一些或全部相关联的位深度。例如,可在量化期间将n位变换系数向下舍入到m位变换系数,其中n大于m。量化单元106可以基于与CU相关联的量化参数(QP)值而量化与CU的TU相关联的系数块。视频编码器20可以通过调整与CU相关联的QP值来调整应用于与CU相关联的系数块的量化的程度。量化可能使得信息丢失,因此经量化的变换系数可以具有比原始变换系数更低的精度。
逆量化单元108及逆变换处理单元110可分别将逆量化及逆变换应用于系数块,以从系数块重构残余块。重构单元112可以将经重构的残余块添加到来自由预测处理单元100产生的一或多个预测性块的对应样本,以产生与TU相关联的经重构变换块。通过以此方式重构用于CU的每一TU的变换块,视频编码器20可以重构CU的译码块。
滤波器单元114可以执行一或多个解块操作以减少与CU相关联的译码块中的成块假象。经解码图片缓冲器116可以在滤波器单元114对经重构的译码块执行一或多个解块操作之后存储经重构的译码块。帧间预测处理单元120可使用含有经重构译码块的参考图片来对其它图片的PU执行帧间预测。另外,帧内预测处理单元126可以使用经解码图片缓冲器116中的经重构的译码块以对处于与CU相同的图片中的其它PU执行帧内预测。
熵编码单元118可以从视频编码器20的其它功能组件接收数据。例如,熵编码单元118可以从量化单元106接收系数块,并且可以从预测处理单元100接收语法元素。熵编码单元118可以对数据执行一或多个熵编码操作以产生经熵编码的数据。举例来说,熵编码单元118可对数据执行CAVLC操作、CABAC操作、可变到可变(V2V)长度译码操作、基于语法的上下文自适应二进制算术译码(SBAC)操作、概率区间分割熵(PIPE)译码操作、指数哥伦布编码操作或另一种类型的熵编码操作。视频编码器20可输出包含由熵编码单元118产生的经熵编码数据的位流。
由视频编码器20产生的位流可包含提供总体上关于位流的信息的位流性质的集合。举例来说,视频编码器20可在位流中包含位流性质SEI消息。位流性质SEI消息可包含指定位流性质的语法元素。在另一实例中,视频编码器20可在位流中包含位流性质NAL单元。位流性质NAL单元可包含指定位流性质的语法元素。
在一些实例中,视频编码器20可产生包含位流的基本流。由视频编码器20产生的基本流可包含提供总体上关于所述基本流的信息的基本流性质的集合。举例来说,视频编码器20可在基本流中包含ESP SEI消息。ESP SEI消息可包含指定基本流性质的语法元素。在另一实例中,视频编码器20可在基本流中包含基本流性质NAL单元。基本流性质NAL单元可包含指定基本流性质的语法元素。
图3是说明经配置以实施本发明的技术的实例视频解码器30的框图。图3是出于解释的目的而提供,并且并不如本发明所广泛举例说明和描述来限制所述技术。出于解释的目的,本发明在HEVC译码的上下文中描述视频解码器30。然而,本发明的技术可以适用于其它译码标准或方法。
在图3的实例中,视频解码器30包含熵解码单元150、预测处理单元152、逆量化单元154、逆变换处理单元156、重构单元158、滤波器单元160以及经解码图片缓冲器162。预测处理单元152包含运动补偿单元164以及帧内预测处理单元166。在其它实例中,视频解码器30可以包含更多、更少或不同的功能组件。
经译码图片缓冲器(CPB)151可接收且存储位流的经编码视频数据(例如,NAL单元)。熵解码单元150可从CPB 151接收NAL单元,并剖析NAL单元以从位流获得语法元素。熵解码单元150可对NAL单元中的经熵编码语法元素进行熵解码。预测处理单元152、逆量化单元154、逆变换处理单元156、重构单元158及滤波器单元160可基于从位流获得的语法元素产生经解码的视频数据。
位流的NAL单元可以包含经译码切片NAL单元。作为解码位流的部分,熵解码单元150可对来自经译码切片NAL单元的语法元素进行剖析和熵解码。经译码的切片中的每一者可以包含切片标头以及切片数据。切片标头可含有关于切片的语法元素。
除对来自位流的语法元素进行解码之外,视频解码器30可对CU执行解码操作。通过对CU执行解码操作,视频解码器30可重构CU的译码块。
作为对CU执行解码操作的部分,逆量化单元154可逆量化(即,解量化)与CU的TU相关联的系数块。逆量化单元154可使用与TU的CU相关联的QP值来确定量化的程度,及同样逆量化单元154将应用的逆量化的程度。也就是说,可以通过调整当量化变换系数时所使用的QP的值来控制压缩比,即用以表示原始序列以及经压缩的序列的位的数目的比率。压缩比还可以取决于所采用的熵译码的方法。
在逆量化单元154逆量化系数块之后,逆变换处理单元156可以将一或多个逆变换应用于系数块以便产生与TU相关联的残余块。举例来说,逆变换处理单元156可以将逆DCT、逆整数变换、逆卡忽南-拉维(Karhunen-Loeve)变换(KLT)、逆旋转变换、逆定向变换或另一逆变换应用于系数块。
如果使用帧内预测对PU进行编码,则帧内预测处理单元166可以执行帧内预测以产生用于PU的预测性块。帧内预测处理单元166可以使用帧内预测模式,以基于空间上相邻的PU的预测块产生用于PU的预测性亮度块、Cb块以及Cr块。帧内预测处理单元166可以基于从位流解码的一或多个语法元素来确定用于PU的帧内预测模式。
预测处理单元152可以基于从位流提取的语法元素建构第一参考图片列表(RefPicList0)以及第二参考图片列表(RefPicList1)。此外,如果PU是使用帧间预测编码,那么熵解码单元150可获得PU的运动信息。运动补偿单元164可以基于PU的运动信息确定用于PU的一或多个参考区。运动补偿单元164可以基于在用于PU的一或多个参考块处的样本产生用于PU的预测性亮度块、Cb块以及Cr块。
重构单元158可使用来自与CU的TU相关联的亮度、Cb和Cr变换块以及所述CU的PU的预测性亮度、Cb和Cr块的残余值(即,在适用时的帧内预测数据或帧间预测数据)来重构所述CU的亮度、Cb和Cr译码块。例如,重构单元158可以将亮度变换块、Cb变换块以及Cr变换块的样本添加到预测性亮度块、Cb块以及Cr块的对应样本以重构CU的亮度译码块、Cb译码块以及Cr译码块。
滤波器单元160可执行解块操作以减少与CU的亮度、Cb及Cr译码块相关联的成块假象。视频解码器30可以在经解码图片缓冲器162中存储CU的亮度译码块、Cb译码块以及Cr译码块。经解码图片缓冲器162可提供参考图片以用于后续运动补偿、帧内预测及在显示装置(例如图1的显示装置32)上的呈现。举例来说,视频解码器30可基于经解码图片缓冲器162中的亮度、Cb及Cr块对其它CU的PU执行帧内预测或帧间预测操作。以此方式,视频解码器30可以从位流提取大量亮度系数块的变换系数层级,逆量化变换系数层级,对变换系数层级应用变换以产生变换块,至少部分基于变换块产生译码块并且输出译码块用于显示。
如本发明中在别处指示,视频编码器20可在ESP SEI消息中用信号表示基本流的ESP。ESP SEI消息提供适用于含有所述SEI消息的整个基本流的信息。在一些实例中,ESP SEI消息仅存在于基本流的第一存取单元中。此外,在一些实例中,ESP SEI消息不是嵌套式SEI消息。也就是说,在此些实例中,含有ESP SEI消息的SEI NAL单元不应含有其它SEI消息。
NAL单元的nuh_reserved_temporal_id_plus1语法元素可指示NAL单元的时间识别符加1。在一些实例中,含有基本流性质(ESP)SEI消息的SEI NAL单元的nuh_reserved_temporal_id_plus1语法元素可始终等于0。
ESP SEI消息可在基本流内的各种位置处用信号表示。举例来说,ESP SEI消息可存在于位流的第一存取单元中。换句话说,视频译码规范可需要ESP SEI消息存在于位流的第一存取单元中。在另一实例中,ESP SEI消息可存在于位流中的任何RAP存取单元中。换句话说,视频译码规范可允许ESP SEI消息存在于位流中的任何RAP存取单元中。
在另一实例中,ESP SEI消息可存在于位流中的任何存取单元中。换句话说,视频译码规范可允许ESP SEI消息存在于位流中的任何存取单元中。此外,在另一实例中,当ESP SEI消息存在于SEI NAL单元中时,视频译码规范要求ESP SEI消息为SEI NAL单元中的第一SEI消息。在另一实例中,视频译码规范可要求含有ESP SEI消息的SEINAL单元不应含有其它SEI消息。此外,在另一实例中,当SEI NAL单元含有ESP SEI消息时,视频译码规范要求所述SEI NAL单元为含有所述SEI NAL单元的存取单元中的第一SEI NAL单元。
在另一实例中,视频译码规范要求基本流的第一存取单元包含含有ESP SEI消息的SEI NAL单元。在另一实例中,视频译码规范要求基本流的第一存取单元包含仅含有ESP SEI消息的SEI NAL单元。
以下表1展示用于ESP SEI消息的实例语法。在以下表1的实例和本发明的其它语法表中,具有u(n)形式(其中n是非负整数)的描述符的语法元素是具有长度n的无符号值。在ESP SEI消息的语法元素的语义的以下论述中,术语“基本流”可指代“含有元素流性质SEI消息的基本流”。在其它实例中,ESP SEI消息可包含与表1的那些语法元素相比更多、更少或不同的语法元素。
表1
elementary_stream_properties(payloadSize){ | 描述符 |
es_profile_unchanging_flag | u(1) |
es_tier_level_unchanging_flag | u(1) |
es_spatial_resolution_unchanging_flag | u(1) |
es_num_sub_layers_unchanging_flag | u(1) |
es_max_bitrate_unchanging_flag | u(1) |
es_max_pic_rate_unchanging_flag | u(1) |
es_color_format_unchanging_flag | u(1) |
es_aspect_ratio_unchanging_flag | u(1) |
es_bit_depth_unchanging_flag | u(1) |
es_full_random_access_enabled_flag | u(1) |
es_all_vps_in_first_au_flag | u(1) |
if(es_all_vps_in_first_au_flag) | |
es_no_vps_set_update_flag | u(1) |
es_all_sps_in_first_au_flag | u(1) |
if(es_all_sps_in_first_au_flag) | |
es_no_sps_set_update_flag | u(1) |
es_all_pps_in_first_au_flag | u(1) |
if(es_all_pps_in_first_au_flag) | |
es_no_pps_set_update_flag | u(1) |
es_progressive_frames_only_flag | u(1) |
es_unpacked_frames_only_flag | u(1) |
es_tiles_unchanging_flag | u(1) |
es_wpp_unchanging_flag | u(1) |
es_dependent_slices_unchanging_flag | u(1) |
es_proterties_sei_extension_flag | u(1) |
} |
VPS可包含general_profile_space语法元素、general_profile_idc语法元素、general_profile_compatibility_flag[i]语法元素(即,多个一股简档兼容性旗标),和general_reserved_zero_16bits语法元素。general_profile_space语法元素指定用于general_profile_idc语法元素和针对0到31(包含性)范围内的i的所有值的general_profile_compatibility_flag[i]语法元素的解译的上下文。当general_profile_space语法元素等于0时,general_profile_idc语法元素指示CVS符合的简档。HEVC工作草案8的附录A描述简档的实例集合。当general_profile_space语法元素等于0且general_profile_compatibility_flag[i]语法元素等于1时,general_profile_compatibility_flag[i]语法元素指示CVS符合由等于i的general_profile_idc语法元素指示的简档。当general_profile_space语法元素等于0时,general_profile_idc[general_profile_idc]等于1。“general_profile_idc[general_profile_idc]”表示与由general_profile_idc语法元素指定的索引值相关联的general_profile_idc语法元素。在一些实例中,针对未作为general_profile_idc的容许值指定的i的任何值,general_profile_compatibility_flag[i]语法元素等于0。HEVC工作草案8的附录A指定general_profile_idc语法元素的允许值的实例集合。general_reserved_zero_16bits语法元素在位流中等于0。general_reserved_zero_16bits语法元素的某些值可用于HEVC的扩展。
在表1的实例中,等于1的es_profile_unchanging_flag语法元素指示general_profile_idc语法元素、针对0到31(包含性)的范围内的i的general_profile_compatibility_flag[i]语法元素和general_reserved_zero_16bits语法元素的值对于当基本流经解码时激活的所有SPS分别是相同的。等于0的es_profile_unchanging_flag语法元素指示general_profile_idc语法元素、针对0到31(包含性)的范围内的i的general_profile_compatibility_flag[i]语法元素和general_reserved_zero_16bits语法元素的值对于当基本流经解码时激活的所有SPS分别不是相同的。
VPS可包含profile_tier_level语法结构,其包含general_tier_flag语法元素和general_level_idc语法元素。general_tier_flag语法元素指定用于general_level_idc语法元素的解译的层次上下文。general_level_idc语法元素指示CVS符合的层级。HEVC工作草案8的附录A基于由general_tier_flag语法元素指定的层次上下文指定general_level_idc语法元素的实例解译。
在表1的实例中,等于1的es_tier_level_unchanging_flag语法元素指示general_tier_flag语法元素和general_level_idc语法元素的值针对当基本流经解码时激活的所有SPS分别是相同的。等于0的es_tier_level_unchanging_flag语法元素指示general_tier_flag语法元素和general_level_idc语法元素的值针对当基本流经解码时激活的所有SPS分别不是相同的。因此,es_tier_level_unchanging_flag语法元素可指示general_tier_flag语法元素和general_level_idc语法元素的值是否针对当基本流经解码时激活的所有SPS是相同的。
SPS可包含pic_width_in_luma_samples语法元素和pic_height_in_luma_samples语法元素。pic_width_in_luma_samples语法元素可指定亮度样本的单元中的每一解码图像的宽度。pic_height_in_luma_samples语法元素可指定亮度样本的单元中的每一解码图像的高度。在表1的实例中,等于1的es_spatial_resolution_unchanging_flag语法元素指示pic_width_in_luma_samples语法元素和pic_height_in_luma_samples语法元素的值针对当基本流经解码时激活的所有SPS分别是相同的。等于0的es_spatial_resolution_unchanging_flag语法元素指示pic_width_in_luma_samples语法元素和pic_height_in_luma_samples语法元素的值针对当基本流经解码时激活的所有SPS分别不是相同的。因此,es_spatial_resolution_unchanging_flag语法元素可指示基本流的所有CVS是否具有相同空间分辨率。
如本发明中指示,时间子层可指代在层内可无需参考所述层内的其它图片而经解码的图片的子集。在表1的实例中,等于1的es_num_sub_layers_unchanging_flag语法元素指示时间子层的数目针对基本流中的所有CVS是相同的。等于0的es_num_sub_layers_unchanging_flag语法元素指示时间子层的数目针对基本流中的所有CVS不是相同的。因此,es_num_sub_layers_unchanging_flag语法元素可指示基本流的时间子层的数目是否针对基本流中的所有CVS是相同的。
此外,在表1的实例中,等于1的es_max_bitrate_unchanging_flag语法元素指示最大位速率针对基本流中的所有CVS是相同的。等于0的es_max_bitrate_unchanging_flag语法元素指示最大位速率针对基本流中的所有CVS不是相同的。
最大图片速率可指示每秒的图片的最大数目。在表1的实例中,等于1的es_max_pic_rate_unchanging_flag语法元素指示最大图片速率针对基本流中的所有CVS是相同的。等于0的es_max_pic_rate_unchanging_flag语法元素指示最大图片速率针对基本流中的所有CVS不是相同的。因此,es_max_pic_rate_unchanging_flag语法元素可指示最大图片速率是否针对基本流中的所有CVS是相同的。
SPS可包含chroma_format_idc语法元素。SPS的chroma_format_idc语法元素可指定色度取样。在HEVC工作草案8中,chroma_format_idc语法元素指定相对于HEVC工作草案8的子条款6.2中指定的亮度取样的色度取样。如果针对当前图片激活的SPS的chroma_format_idc语法元素等于0,那么所述当前图片可由一个样本阵列(例如,SL)组成。否则,如果chroma_format_idc语法元素不等于0,那么当前图片可包括三个样本阵列(例如,SL,SCb和SCr)。在表1的实例中,等于1的es_color_format_unchanging_flag语法元素指示chroma_format_idc的值针对当基本流经解码时激活的所有SPS是相同的。等于0的es_color_format_unchanging_flag语法元素指示chroma_format_idc语法元素的值针对当基本流经解码时激活的所有SPS不是相同的。因此,es_color_format_unchanging_flag语法元素可指示基本流中的所有CVS是否具有相同颜色格式。
SPS可包含VUI参数语法结构,其包含aspect_ratio_idc语法元素。aspect_ratio_idc语法元素指定亮度样本的样本纵横比(例如,1∶1、12∶11、10∶11、16∶11、40∶33等)的值。HEVC工作草案8的表E-1指示aspect_ratio_idc语法元素的实例解译。此外,当aspect_ratio_idc语法元素指示Extended_SAR时(例如,当aspect_ratio_idc语法元素等于255时),VUI参数语法结构可包含sar_width语法元素和sar_height语法元素。sar_width语法元素指示样本纵横比的水平尺寸(以任意单位)。sar_height语法元素指示样本纵横比的垂直尺寸(以用于sar_width语法元素的同一任意单位)。
在表1的实例中,等于1的es_aspect_ratio_unchanging_flag语法元素指示aspect_ratio_idc语法元素的值针对当基本流经解码时激活的所有序列参数集是相同的,并且,当aspect_ratio_idc等于Extended_SAR时,sar_width语法元素和sar_height语法元素的值针对当基本流经解码时激活的所有序列参数集分别是相同的。等于0的es_aspect_ratio_unchanging_flag语法元素指示aspect_ratio_idc语法元素的值针对当基本流经解码时激活的所有序列参数集不是相同的,或者,sar_width语法元素和sar_height语法元素的值针对当基本流经解码时激活的所有序列参数集分别不是相同的。因此,es_aspect_ratio_unchanging_flag语法元素可指示基本流中的所有CVS是否具有相同样本纵横比。
SPS可包含bit_depth_minus8语法元素和bit_depth_chroma_minus8语法元素。bit_depth_minus8语法元素加8指定亮度阵列的样本的位深度和亮度量化参数范围偏移的值。bit_depth_chroma_minus8语法元素加8指定色度阵列的样本的位深度和色度量化参数范围偏移的值。在表1的实例中,等于1的es_bit_depth_unchanging_flag语法元素指示bit_depth_luma_minus8语法元素和bit_depth_chroma_minus8语法元素的值针对当基本流经解码时激活的所有SPS分别是相同的。等于0的es_bit_depth_unchanging_flag语法元素指示bit_depth_luma_minus8语法元素和bit_depth_chroma_minus8语法元素的值针对当基本流经解码时激活的所有序列参数集分别不是相同的。因此,es_bit_depth_unchanging_flag语法元素可指示基本流中的所有CVS是否具有用于亮度和色度的同一位深度集合。
此外,在表1的实例中,等于1的es_full_random_access_enabled_flag语法元素指示有可能通过丢弃在RAP存取单元之前的所有存取单元而在基本流中的每一RAP存取单元的位置处执行随机存取且按解码次序正确地解码RAP图片和所有后续非TFD图片,即,对于每一RAP存取单元,当在所述RAP存取单元之前的所有存取单元经丢弃且基本流的剩余部分经解码时,每一参数集当其需要激活时在基本流中仍是可用的。等于0的es_full_random_access_enabled_flag语法元素指示不可能通过丢弃在RAP存取单元之前的所有存取单元而在基本流中的每一RAP存取单元的位置处执行随机存取和/或不可能按解码次序正确地解码RAP图片和所有后续非TFD图片。因此,es_full_random_access_enabled_flag语法元素可指示基本流中的参数集的存在是否实现完整随机可存取性。这可要求当在任何RAP存取单元处执行以上随机存取时每一参数集当其需要激活时在位流中是可用的。
在表1的实例中,等于1的es_all_vps_in_first_au_flag语法元素指示当基本流经解码时激活的所有VPS存在于基本流中的第一存取单元中。等于0的es_all_vps_in_first_au_flag语法元素指示并非当基本流经解码时激活的所有VPS存在于基本流中的第一存取单元中。当es_all_vps_in_first_au_flag语法元素等于1时,仍可存在在基本流中的其它存取单元中重复的VPS(例如,用于错误恢复目的)。然而,可不存在在所述重复VPS当中的任何VPS更新。因此,es_all_vps_in_first_au_flag语法元素可指示当基本流经解码时激活的所有VPS是否存在于基本流中的第一存取单元中。
VPS可包含识别所述VPS的video_parameter_set_id语法元素。SPS可包含识别用于所述SPS的使用中的VPS的video_parameter_set_id语法元素。在表1的实例中,等于1的es_no_vps_update_flag语法元素指示基本流中的至少一个VPS的内容改变而无需改变VPS NAL单元中的video_parameter_set_id语法元素。等于0的es_no_vps_update_flag语法元素指示基本流中没有VPS的内容改变而无需改变VPSNAL单元中的video_parameter_set_id语法元素。因此,es_no_vps_update_flag可指示基本流中的至少一个VPS的内容是否改变而无需改变VPS NAL单元中的video_parameter_set_id语法元素。
此外,在表1的实例中,等于1的es_all_sps_in_first_au_flag语法元素指示当基本流经解码时激活的所有SPS存在于基本流的第一存取单元中。等于0的es_all_sps_in_first_au_flag语法元素指示并非当基本流经解码时激活的所有SPS存在于基本流的第一存取单元中。当es_all_sps_in_first_au_flag语法元素等于1时,仍可存在在基本流中的其它存取单元中重复的SPS(例如,用于错误恢复目的)。然而,不存在在重复SPS当中的任何SPS更新。因此,es_all_sps_in_first_au_flag语法元素可指示当基本流经解码时激活的所有SPS是否存在于位流中的第一存取单元中。
SPS可包含识别所述SPS的seq_parameter_set_id语法元素。PPS可包含识别用于所述PPS的在使用中的SPS的seq_parameter_set_id语法元素。在表1的实例中,等于1的es_no_sps_update_flag语法元素指示基本流中的至少一个SPS的内容改变而无需改变SPS NAL单元中的seq_parameter_set_id语法元素。等于0的es_no_sps_update_flag语法元素指示基本流中没有SPS的内容改变而无需改变SPS NAL单元中的seq_parameter_set_id。因此,es_no_sps_update_flag语法元素指示是否使用同一SPS识别符在基本流中更新至少一个SPS。
此外,在表1的实例中,等于1的es_all_pps_in_first_au_flag语法元素指示当基本流经解码时激活的所有PPS存在于基本流中的第一存取单元中。等于0的es_all_pps_in_first_au_flag语法元素指示并非当基本流经解码时激活的所有PPS存在于基本流中的第一存取单元中。当es_all_pps_in_first_au_flag语法元素等于1时,仍可存在在基本流中的其它存取单元中重复的PPS(例如,用于错误恢复目的)。然而,可不存在在重复PPS当中的任何PPS更新。因此,es_all_pps_in_first_au_flag语法元素可指示所有PPS是否存在于基本流的开始处。
PPS可包含识别所述PPS的pic_parameter_set_id语法元素。切片的切片标头可包含识别用于所述切片的在使用中的PPS的pic_parameter_set_id语法元素。在表1的实例中,等于1的es_no_pps_update_flag语法元素指示基本流中的至少一个PPS的内容改变而无需改变PPS NAL单元中的pic_parameter_set_id语法元素。等于0的es_no_pps_update_flag语法元素指示基本流中没有PPS的内容改变而无需改变PPS NAL单元中的pic_parameter_set_id。因此,es_no_pps_update_flag语法元素可指示在基本流中是否至少一个PPS改变但使用同一PPS识别符。
SPS可包含VUI参数语法结构,其包含field_seq_flag语法元素。field_seq_flag语法元素可指定CVS是否传达表示字段的图片,且指定字段指示SEI消息是否应存在于CVS的每个存取单元中。一股来说,字段(即,“视频字段”)可表示奇数或偶数编号的行。字段的使用可实现交错。HEVC工作草案8的子条款D.1.19提供用于字段指示SEI消息的实例语法。HEVC工作草案8的子条款D.2.19提供用于字段指示SEI消息的实例语义。在表1的实例中,等于1的es_progressive_frames_only_flag语法元素指示field_seq_flag语法元素的值针对当基本流经解码时激活的所有SPS等于0,且基本流中不存在字段指示SEI消息。等于0的es_progressive_frames_only_flag语法元素指示基本流中存在至少一个字段指示SEI消息。因此,es_progressive_frames_only_flag语法元素可指示基本流中的所有CVS是否仅含有在帧图片中译码的渐进帧。
帧封装布置SEI消息可提供关于将立体视频封装到HEVC位流中的信息。建议ITU-T H.264|ISO/IEC 14496-10的子条款D.1.25提供用于帧封装布置SEI消息的实例语法。在表1的实例中,等于1的es_unpacked_frames_only_flag语法元素指示基本流中不存在帧封装布置SEI消息。等于0的es_unpacked_frames_only_flag语法元素指示基本流中存在至少一个帧封装布置SEI消息。因此,es_unpacked_frames_only_flag语法元素可指示基本流中的所有CVS是否不含有帧封装布置SEI消息。
PPS可包含tiles_enabled_flag语法元素。PPS的tiles_enabled_flag语法元素可指定参考所述PPS的每一图片中是否可存在一个以上瓦片。图片的瓦片是由穿过所述图片的水平和/或垂直瓦片边界界定。图片的瓦片是根据光栅扫描次序经译码且每一瓦片内的CTB也是根据光栅扫描次序经译码。此外,SPS可包含VUI参数语法结构,其包含tiles_fixed_structure_flag语法元素。tiles_fixed_structure_flag语法元素指示CVS中在作用中的每一PPS是否具有界定图片的瓦片结构的语法元素(例如,num_tile_columns_minus1、num_tile_rows_minus1、uniform_spacing_flag、column_width_minus1[i]、row_height_minus1[i]和loop_filter_across_tiles_enabled_flag)的相同值。num_columns_minus1语法元素加1指定分割图片的瓦片列的数目。num_tile_rows_minus1语法元素加1指定分割图片的瓦片行的数目。uniform_spacing_flag语法元素指示列边界和同样行边界是否跨越图片均匀地分布。column_width_minus1[i]语法元素加1指定译码树块的单元中的第i瓦片列的宽度。row_height_minus1[i]语法元素加1指定译码树块的单元中的第i瓦片行的高度。loop_filter_across_tiles_enabled_flag指示是否跨越瓦片边界执行环内滤波操作。在本发明中别处描述的图4描述视频译码中瓦片的使用。
在表1的实例中,等于1的es_tiles_unchanging_flag语法元素指示tiles_enabled_flag语法元素的值针对当基本流经解码时激活的所有PPS是相同的,且当tiles_enabled_flag语法元素的值等于1时,tiles_fixed_structure_flag语法元素的值针对当基本流经解码时激活的所有SPS是相同的。等于0的es_tiles_unchanging_flag语法元素指示tiles_enabled_flag语法元素的值针对当基本流经解码时激活的所有PPS不是相同的,或tiles_fixed_structure_flag语法元素的值针对当基本流经解码时激活的所有SPS不是相同的。因此,es_tiles_unchanging_flag语法元素可指示基本流中的所有CVS是否具有相同瓦片配置。
此外,PPS可包含entropy_coding_sync_enabled_flag语法元素。PPS的entropy_coding_sync_enabled_flag语法元素可指示在对参考所述PPS的每一图片中的每一瓦片中的一行译码树块的第一译码树块进行解码之前是否调用用于上下文变量的特定同步过程以及在对参考所述PPS的每一图片中的每一瓦片中的一行译码树块的两个译码树块进行解码之后是否调用用于上下文变量的特定记忆过程。此特定同步过程和特定记忆过程可实现波前并行处理(WPP)。在WPP中,图片中的每一行CTB是“WPP波”。当视频译码器使用WPP对图片进行译码时,在视频译码器已对紧邻较高WPP波的两个或两个以上CTB进行译码之后,视频译码器可从左到右开始对WPP波的CTB进行译码。在本发明中别处描述的图5是图解说明图片的WPP译码的概念图。
在表1的实例中,等于1的es_wpp_unchanging_flag语法元素指示entropy_coding_sync_enabled_flag语法元素的值针对当基本流经解码时激活的所有PPS是相同的。等于0的es_wpp_unchanging_flag语法元素指示entropy_coding_sync_enabled_flag语法元素的值针对当基本流经解码时激活的所有PPS不是相同的。因此,es_wpp_unchanging_flag语法元素可指示基本流中的所有CVS是否利用波前并行处理。
dependent_slices_enabled_flag语法元素是PPS中指定dependent_slice_flag语法元素是否存在于用于参考所述PPS的经译码图片的切片标头中的语法元素。切片标头的dependent_slice_flag语法元素可指示切片标头中不存在的每一切片标头语法元素的值是否推断为等于先前切片中的对应切片标头语法元素的值。在表1的实例中,等于1的es_dependent_slices_unchanging_flag语法元素指示dependent_slices_enabled_flag语法元素的值针对当基本流经解码时激活的所有PPS是相同的。等于0的es_dependent_slices_unchanging_flag语法元素指示dependent_slices_enabled_flag语法元素的值针对当基本流经解码时激活的所有PPS不是相同的。因此,es_dependent_slices_unchanging_flag语法元素可指示基本流中的所有CVS是否利用相依性切片。
在表1的实例中,等于0的es_properties_sei_extension_flag语法元素指示无额外数据在ESP SEI消息内跟随。es_properties_sei_extension_flag语法元素的值应等于0可为位流符合性的要求。es_properties_sei_extension_flag语法元素的值1可保留用于ITU-T|ISO/IEC的未来使用。在一些实例中,视频解码器应忽略ESP SEI消息中的es_properties_sei_extension_flag语法元素的值且应忽略在es_properties_sei_extension_flag语法元素的值1之后在ESP SEI消息内跟随的所有数据。因此,es_properties_sei_extension_flag语法元素可指示是否任何额外数据在SEI消息中跟随。
在一些实例中,界定相异的NAL单元类型(例如,ESP NAL单元)以用信号表示基本流层级性质而不是ESP SEI消息。ESP NAL单元可指定为非VCL NAL单元。ESP NAL单元提供用于含有NAL单元的整个基本流的信息。ESP NAL单元可包含以上表1的一些或所有语法元素。此外,在一些实例中,ESP NAL单元可包含除表1中的那些语法元素之外的语法元素。
在一些实例中,ESP NAL单元可存在于基本流的第一存取单元中。在其它实例中,ESP NAL单元可存在于基本流中的任何RAP存取单元中。在又其它实例中,ESP NAL单元可存在于基本流中的任何存取单元中。此外,在一些实例中,要求ESP NAL单元必须为含有所述ESP NAL单元的存取单元中的第一NAL单元。在一些实例中,要求基本流的第一存取单元应包含ESP NAL单元。
如在本发明中别处指示,视频编码器20可在位流性质SEI消息中用信号表示位流的位流性质。位流性质SEI消息提供适用于含有所述SEI消息的整个位流的信息。在一些实例中,位流性质SEI消息可仅存在于位流的第一存取单元中。此外,在一些实例中,含有位流性质SEI消息的SEI NAL单元不应含有其它SEI消息。在一些实例中,视频译码规范可要求含有位流性质SEI消息的SEI NAL单元中的nuh_temporal_id_plus1语法元素的值等于0。
位流性质SEI消息可在位流内的各种位置处用信号表示。举例来说,视频译码规范可要求位流性质SEI消息可存在于位流的第一存取单元中。在另一实例中,视频译码规范可允许位流性质SEI消息存在于位流中的任何RAP存取单元中。在另一实例中,视频译码规范可允许位流性质SEI消息存在于位流中的任何存取单元中。在另一实例中,当位流性质SEI消息存在于SEI NAL单元中时,视频译码规范可要求位流性质SEI消息为SEI NAL单元中的第一SEI消息。在另一实例中,视频译码规范可要求含有位流性质SEI消息的SEI NAL单元不含有其它SEI消息。此外,在一些实例中,当SEI NAL单元含有位流性质SEI消息时,视频译码规范可要求所述SEI NAL单元为含有所述SEI NAL单元的存取单元中除基本流层级NAL单元外的第一SEI NAL单元。此外,视频译码规范可要求每一位流的第一存取单元包含含有位流性质SEI消息的SEI NAL单元。在替代实例中,视频译码规范可要求每一位流的第一存取单元包含仅含有位流性质SEI消息的SEI NAL单元。
在一个实例中,位流性质SEI消息可符合以下表2中所示的语法。在其它实例中,位流性质SEI消息可包含与表2的实例中所示的语法元素相比更多、更少或不同的语法元素。
表2
bitstream_properties(payloadSize){ | 描述符 |
bitstream_profile_unchanging_flag | u(1) |
bitstream_tier_level_unchanging_flag | u(1) |
bitstream_spatial_resolution_unchanging_flag | u(1) |
bitstream_num_sub_layers_unchanging_flag | u(1) |
bitstream_max_bitrate_unchanging_flag | u(1) |
bitstream_max_pic_rate_unchanging_flag | u(1) |
bitstream_color_format_unchanging_flag | u(1) |
bitstream_aspect_ratio_unchanging_flag | u(1) |
bitstream_bit_depth_unchanging_flag | u(1) |
bitstream_full_random_access_enabled_flag | u(1) |
bitstream_all_vps_in_first_au_flag | u(1) |
if(bitstream_all_vps_in_first_au_flag) | |
bitstream_no_vps_update_flag | u(1) |
bitstream_all_sps_in_first_au_flag | u(1) |
if(bitstream all_sps_in_first_au_flag) | |
bitstream_no_sps_set_update_flag | u(1) |
bitstream_all_pps_in_first_au_flag | u(1) |
if(bitstream_all_pps_in_first_au_flag) | |
bitstream_no_pps_set_update_flag | u(1) |
bitstream_progressive_frames_only_flag | u(1) |
bitstream_unpacked_frames_only_flag | u(1) |
bitstream_tiles_unchanging_flag | u(1) |
bitstream_wpp_unchanging_flag | u(1) |
bitstream_dependent_slices_unchanging_flag | u(1) |
bitstream_proterties_sei_extension_flag | u(1) |
} |
在位流性质SEI消息中的语法元素的以下描述中,“位流”可指代“含有位流性质SEI消息的位流”。
VPS可包含general_profile_space语法元素、general_profile_idc语法元素、general_profile_compatibility_flag[i]语法元素和general_reserved_zero_16bits语法元素。在表2的实例中,等于1的bitstream_profile_unchanging_flag语法元素指示general_profile_idc语法元素、针对0到31(包含性)的范围内的i的general_profile_compatibility_flag[i]语法元素和general_reserved_zero_16bits语法元素的值对于当位流经解码时激活的所有SPS分别是相同的。如果bitstream_profile_unchanging_flag语法元素等于0,那么general_profile_idc语法元素、针对0到31(包含性)的范围内的i的general_profile_compatibility_flag[i]语法元素和general_reserved_zero_16bits语法元素的值对于当位流经解码时激活的所有SPS分别不是相同的。
因此,当位流经解码时激活的SPS中的每一者可包含多个一股简档兼容性旗标语法元素。每一多个一股简档兼容性旗标语法元素中的每一相应一股简档兼容性旗标语法元素与索引(例如,i)相关联。此外,对应的一股简档兼容性旗标语法元素与同一索引相关联。因此,第一SPS中与索引i相关联的一股简档兼容性旗标语法元素可对应于第二SPS中具有索引i的一股简档兼容性旗标语法元素。当特定语法元素(例如,bitstream_profile_unchanging_flag)具有特定值(例如,1)时,SPS中的对应一股简档兼容性旗标语法元素中的每一者具有相同值。此外,SPS中的每一者可包含general_reserved_zero_16bits语法元素。当特定语法元素(例如bitstream_profile_unchanging_flag)具有特定值(例如,1)时,SPS中的每一者中的general_reserved_zero_16bits语法元素具有相同值。
VPS可包含profile_tier_level语法结构,其包含general_tier_flag语法元素和general_level_idc语法元素。在表2的实例中,如果bitstream_tier_level_unchanging_flag语法元素等于1,那么general_tier_flag语法元素和general_level_idc语法元素的值针对当位流经解码时激活的所有SPS分别是相同的。如果bitstream_tier_level_unchanging_flag语法元素等于0,那么general_tier_flag语法元素和general_level_idc语法元素的值针对当位流经解码时激活的所有SPS分别不是相同的。因此,bitstream_tier_level_unchanging_flag语法元素可指示general_tier_flag语法元素和general_level_idc语法元素的值是否针对当位流经解码时激活的所有SPS是相同的。
SPS可包含pic_width_in_luma_samples语法元素和pic_height_in_luma_samples语法元素。在表2的实例中,如果bitstream_spatial_resolution_unchanging_flag语法元素等于1,那么pic_width_in_luma_samples语法元素和pic_height_in_luma_samples语法元素的值针对当位流经解码时激活的所有SPS分别是相同的。如果bitstream_spatial_resolution_unchanging_flag语法元素等于0,那么pic_width_in_luma_samples语法元素和pic_height_in_luma_samples语法元素的值针对当位流经解码时激活的所有SPS分别不是相同的。因此,bitstream_spatial_resolution_unchanging_flag语法元素可指示位流的所有CVS是否具有相同空间分辨率。
此外,在表2的实例中,如果bitstream_num_sub_layers_unchanging_flag语法元素等于1,那么时间子层的数目针对位流中的所有CVS是相同的。如果bitstream_num_sub_layers_unchanging_flag语法元素等于0,那么时间子层的数目针对位流中的所有CVS不是相同的。因此,bitstream_num_sub_layers_unchanging_flag语法元素可指示位流的时间子层的数目是否针对位流中的所有CVS是相同的。
在表2的实例中,如果bitstream_max_bitrate_unchanging_flag等于l,那么最大位速率针对位流中的所有CVS是相同的。如果bitstream_max_bitrate_unchanging_flag语法元素等于0,那么最大位速率针对位流中的所有CVS不是相同的。因此,bitstream_max_bitrate_unchanging_flag语法元素可指示最大位速率是否针对位流中的所有CVS是相同的。
另外,在表2的实例中,如果bitstream_max_pic_rate_unchanging_flag语法元素等于1,那么最大图片速率针对位流中的所有CVS是相同的。如果bitstream_max_pic_rate_unchanging_flag语法元素等于0,那么最大图片速率针对位流中的所有CVS不是相同的。因此,bitstream_max_pic_rate_unchanging_flag语法元素可指示最大图片速率是否针对位流中的所有CVS是相同的。
此外,在表2的实例中,等于1的bitstream_color_format_unchanging_flag语法元素指示chroma_format_idc语法元素的值针对当位流经解码时激活的所有SPS是相同的。等于0的bitstream_color_format_unchanging_flag语法元素指示chroma_format_idc语法元素的值针对当位流经解码时激活的所有SPS不是相同的。因此,bitstream_color_format_unchanging_flag语法元素可指示位流中的所有CVS是否具有相同颜色格式。
SPS可包含VUI参数语法结构,其包含aspect_ratio_idc语法元素。在表2的实例中,等于1的bitstream_aspect_ratio_unchanging_flag语法元素指示aspect_ratio_idc语法元素的值针对当位流经解码时激活的所有SPS是相同的,并且,当aspect_ratio_idc语法元素等于Extended_SAR时,sar_width语法元素和sar_height语法元素的值针对当位流经解码时激活的所有SPS分别是相同的。等于0的bitstream_aspect_ratio_unchanging_flag语法元素指示aspect_ratio_idc语法元素的值针对当位流经解码时激活的所有SPS不是相同的,或者,sar_width语法元素和sar_height语法元素的值针对当位流经解码时激活的所有SPS分别不是相同的。因此,bitstream_aspect_ratio_unchanging_flag语法元素可指示位流中的所有CVS是否具有相同样本纵横比。
SPS可包含bit_depth_minus8语法元素和bit_depth_chroma_minus8语法元素。等于1的表2的bitstream_bit_depth_unchanging_flag语法元素指示bit_depth_luma_minus8语法元素和bit_depth_chroma_minus8语法元素的值针对当位流经解码时激活的所有SPS分别是相同的。等于0的bitstream_bit_depth_unchanging_flag语法元素指示bit_depth_luma_minus8语法元素和bit_depth_chroma_minus8语法元素的值针对当位流经解码时激活的所有SPS分别不是相同的。因此,bitstream_bit_depth_unchanging_flag语法元素可指示位流中的所有CVS是否具有用于亮度和色度的同一位深度集合。
此外,等于1的表2的bitstream_full_random_access_enabled_flag语法元素指示有可能通过丢弃在RAP存取单元之前的所有存取单元而在位流中的每一RAP存取单元的位置处执行随机存取且按解码次序正确地解码RAP图片和所有后续非TFD图片。也就是说,对于每一RAP存取单元,当丢弃RAP存取单元之前的所有存取单元且经解码位流的剩余部分时,每一参数集当所述参数集需要激活时在位流中仍是可用的。因此,bitstream_full_random_access_enabled_flag语法元素可指示位流中的参数集的存在是否实现完整随机可存取性。这可需要当在任何RAP存取单元执行以上随机存取时,每一参数集当所述参数集需要激活时在位流中是可用的。
在表2的实例中,等于1的bitstream_all_parameter_sets_in_first_au_flag语法元素指示当位流经解码时激活的所有参数集存在于位流中的第一存取单元中。等于0的bitstream_all_parameter_sets_in_first_au_flag语法元素指示并非当位流经解码时激活的所有参数集存在于位流中的第一存取单元中。当bitstream_all_parameter_sets_in_first_au_flag语法元素等于1时,仍可存在在位流中的其它存取单元中重复的参数集(例如,用于错误恢复目的)。然而,可存在在重复参数集当中的任何参数集更新。因此,bitstream_all_parameter_sets_in_first_au_flag语法元素可指示所有参数集是否存在于位流中的第一存取单元内。
另外,在表2的实例中,等于1的bitstream_no_parameter_set_update_flag语法元素指示在不改变参数集NAL单元中的video_parameter_set_id、seq_parameter_set_id或pic_parameter_set_id的情况下改变位流中的至少一个视频参数集、序列参数集或图片参数集的内容。等于0的bitstream_no_parameter_set_update_flag语法元素指示在不改变参数集NAL单元中的video_parameter_set_id、seq_parameter_set_id或pic_parameter_set_id的情况下不改变参数集的内容。因此,bitstream_no_parameter_set_update_flag语法元素指示在位流中是否至少一个VPS经更新,在位流中是否至少一个SPS经更新,或在位流中是否至少一个PPS经更新。
在表2的实例中,等于1的bitstream_all_sps_in_first_au_flag语法元素指示当位流经解码时激活的所有SPS存在于位流中的第一存取单元中。等于0的bitstream_all_sps_in_first_au_flag语法元素指示并非当位流经解码时激活的所有SPS存在于位流中的第一存取单元中。当bitstream_all_sps_in_first_au_flag等于1时,仍可存在在位流中的其它存取单元中重复的SPS,例如用于错误恢复目的。然而,可不存在在重复SPS之间的任何SPS更新。因此,bitstream_all_sps_in_first_au_flag语法元素可指示当位流经解码时激活的所有SPS是否存在于位流中的第一存取单元中。
此外,在表2的实例中,等于1的bitstream_no_sps_update_flag语法元素指示在不改变囊封SPS的SPS NAL单元中的seq_parameter_set_id的情况下改变位流中的至少一个SPS的内容。等于0的bitstream_no_sps_update_flag语法元素指示在不改变SPS NAL单元中的seq_parameter_set_id的情况下不改变位流中的SPS的内容。因此,bitstream_no_sps_update_flag语法元素可指示在使用同一SPS识别符的同时是否至少一个SPS经更新。
等于1的表2的bitstream_all_pps_in_first_au_flag语法元素指示当位流经解码时激活的所有PPS存在于位流中的第一存取单元中。等于0的bitstream_all_pps_in_first_au_flag语法元素指示并非当位流经解码时激活的所有PPS存在于位流中的第一存取单元中。当bitstream_all_pps_in_first_au_flag语法元素等于1时,仍可存在在位流中的其它存取单元中重复的PPS,例如用于错误恢复目的。然而,可不存在在重复PPS当中的任何PPS更新。因此,bitstream_all_pps_in_first_au_flag语法元素可指示所有PPS是否存在于位流的开始处。
另外,在表2的实例中,等于1的bitstream_no_pps_update_flag语法元素指示在不改变PPS NAL单元中的pic_parameter_set_id语法元素的情况下改变位流中的至少一个PPS的内容。等于0的bitstream_no_pps_update_flag语法元素指示在不改变PPS NAL单元中的pic_parameter_set_id语法元素的情况下不改变位流中的PPS的内容。因此,bitstream_no_pps_update_flag语法元素可指示在位流中是否至少一个PPS改变但使用同一PPS识别符。
SPS可包含VUI参数语法结构,其包含field_seq_flag语法元素。此外,在表2的实例中,等于1的bitstream_progressive_frames_only_flag语法元素指示SPS的field_seq_flag语法元素的值针对当位流经解码时激活的所有SPS等于0,且在位流中不存在字段指示SEI消息。等于0的bitstream_progressive_frames_only_flag语法元素指示在位流中存在至少一个字段指示SEI消息。因此,bitstream_progressive_frames_only_flag语法元素可指示在位流中的所有CVS是否仅含有在帧图片中译码的渐进帧。
在表2的实例中,等于1的bitstream_unpacked_frames_only_flag语法元素指示在位流中不存在帧封装布置SEI消息。等于0的bitstream_unpacked_frames_only_flag语法元素指示在位流中存在至少一个帧封装布置SEI消息。因此,bitstream_unpacked_frames_only_flag语法元素可指示在位流中的所有CVS是否不含有帧封装布置SEI消息。
PPS可包含tiles_enabled_flag语法元素。PPS的tiles_enabled_flag语法元素可指定参考所述PPS的每一图片中是否可存在一个以上瓦片。在表2的实例中,等于1的bitstream_tiles_unchanging_flag语法元素指示PPS的tiles_enabled_flag语法元素的值针对当位流经解码时激活的所有PPS是相同的,且当tiles_enabled_flag语法元素的值等于1时,tiles_fixed_structure_flag语法元素的值针对当位流经解码时激活的所有SPS是相同的。等于0的bitstream_tiles_unchanging_flag语法元素指示tiles_enabled_flag语法元素的值针对当位流经解码时激活的所有PPS不是相同的,或tiles_fixed_structure_flag语法元素的值针对当位流经解码时激活的所有SPS不是相同的。因此,bitstream_tiles_unchanging_flag语法元素可指示在位流中的所有CVS是否具有相同瓦片配置。
PPS可包含entropy_coding_sync_enabled_flag语法元素。在表2的实例中,等于1的bitstream_wpp_unchanging_flag语法元素指示PPS的entropy_coding_sync_enabled_flag语法元素的值针对当位流经解码时激活的所有PPS是相同的。等于0的bitstream_wpp_unchanging_flag语法元素指示entropy_coding_sync_enabled_flag语法元素的值针对当位流经解码时激活的所有PPS不是相同的。因此,bitstream_wpp_unchanging_flag语法元素可指示在位流中的所有CVS是否利用波前并行处理。
dependent_slices_enabled_flag语法元素是PPS中指定dependent_slice_flag语法元素是否存在于用于参考所述PPS的经译码图片的切片标头中的语法元素。另外,在表2的实例中,等于1的bitstream_dependent_slices_unchanging_flag语法元素指示PPS的dependent_slices_enabled_flag语法元素的值针对当位流经解码时激活的所有PPS是相同的。等于0的bitstream_dependent_slices_unchanging_flag语法元素指示dependent_slices_enabled_flag语法元素的值针对当位流经解码时激活的所有PPS不是相同的。因此,bitstream_dependent_slices_unchanging_flag语法元素可指示在位流中的所有CVS是否利用相依性切片。
此外,在表2的实例中,等于0的bitstream_properties_sei_extension_flag语法元素指示没有额外数据在位流性质SEI消息内跟随。bitstream_properties_sei_extension_flag语法元素的值应等于0可为位流符合性的要求。bitstream_properties_sei_extension_flag语法元素的值1可保留用于ITU-T|ISO/IEC的未来使用。在一些实例中,视频解码器将忽略位流性质SEI消息中的bitstream_properties_sei_extension_flag语法元素的值且将忽略在bitstream_properties_sei_extension_flag的值1之后在位流性质SEI消息内跟随的所有数据。因此,bitstream_properties_sei_extension_flag语法元素可指示是否任何额外数据在位流性质SEI消息中跟随。
在其它实例中,界定相异的NAL单元类型以用信号表示位流层级性质而不是位流性质SEI消息。属于此NAL单元类型的NAL单元可被称为位流性质NAL单元。位流性质NAL单元可指定为非VCL NAL单元。位流性质NAL单元可提供用于含有NAL单元的整个位流的信息。位流性质NAL单元可包含以上表2的一些或所有语法元素。
在一些实例中,位流性质NAL单元可存在于位流的第一存取单元中。或者,在其它实例中,位流性质NAL单元可存在于位流中的任何RAP存取单元中。此外,在一些实例中,位流性质NAL单元可存在于位流中的任何存取单元中。在一些实例中,要求位流性质NAL单元必须为含有所述位流性质NAL单元的存取单元中除基本流层级NAL单元外的第一NAL单元。或者,在其它实例中,要求每一位流的第一存取单元应包含位流性质NAL单元。
图4是说明经分割为多个瓦片202A、202B、202C、202D、202E和202F(共同地为“瓦片202”)的图片200的实例CTB译码次序的概念图。图片200中的每一正方形块表示与CTU相关联的译码树块(CTB)。粗虚线指示实例瓦片边界。不同类型交叉影线对应于不同切片。
像素块中的数字指示用于图片200的瓦片译码次序中的对应CTB的位置。如图4的实例中所示,瓦片202A中的CTB首先经译码,接着是瓦片202B中的CTB,接着是瓦片202C中的CTB,接着是瓦片202D中的CTB,接着是瓦片202E中的CTB,接着是瓦片202F中的CTB。在瓦片202中的每一者内,根据光栅扫描次序对CTB进行译码。
视频编码器可产生用于图片200的四个经译码切片NAL单元。第一经译码切片NAL单元可包含CTB 1-18的经编码表示。第一经译码切片NAL单元的切片数据可包含两个子流。第一子流可包含CTB 1-9的经编码表示。第二子流可包含CTB 10-18的经编码表示。因此,第一经译码切片NAL单元可包含含有多个瓦片的切片的经编码表示。
第二经译码切片NAL单元可包含CTB 19-22的经编码表示。第二经译码切片NAL单元的切片数据可包含单个子流。第三经译码切片NAL单元可包含CTB 23-27的经编码表示。第三经译码切片NAL单元的切片数据可包含仅单个子流。因此,瓦片202C可含有多个切片。
第四经译码切片NAL单元可包含CTB 28-45的经编码表示。第四经译码切片NAL单元的切片数据可包含三个子流,针对瓦片202D、202E和202F各一个。因此,第四经译码切片NAL单元可包含含有多个瓦片的切片的经编码表示。
图5是说明WPP的实例的概念图。如上文所描述,图片可分割为若干CTB,其中的每一者与CTU相关联。图5将CTB图解说明为白色正方形的栅格。所述图片包含CTB行250A-250E(共同地为“CTB行250”)。
第一并行处理线程(例如,由多个并行处理核心中的一者执行)可为对CTB行250A中的CTB进行译码。同时,其它线程(例如,由其它并行处理核心执行)可为对CTB行250B、250C和250D中的CTB进行译码。在图5的实例中,第一线程是当前对CTB 252A进行译码,第二线程是当前对CTB 252B进行译码,第三线程是当前对CTB 252C进行译码,且第四线程是当前对CTB 252D进行译码。本发明可将CTB 252A、252B、252C和252D共同地称为“当前CTB 252”。因为视频译码器可在紧邻较高行的两个以上CTB已经译码之后开始对CTB行进行译码,当前CTB 252以两个CTB的宽度从彼此水平地移位。
在图5的实例中,线程可使用来自由粗灰色箭头指示的CTB的数据执行用于当前CTB 252中的CU的帧内预测或帧间预测。(所述线程还可使用来自一或多个参考帧的数据执行用于CU的帧间预测。)为了对给定CTB进行译码,线程可基于与先前经译码CTB相关联的信息选择一或多个CABAC上下文。线程可使用一或多个CABAC上下文来对与给定CTB的第一CU相关联的语法元素执行CABAC译码。如果给定CTB不是行的最左边CTB,那么线程可基于与给定CTB的左边的CTB的最后CU相关联的信息选择所述一或多个CABAC上下文。如果给定CTB是行的最左边CTB,那么线程可基于与给定CTB的上方且向右两个CTB的CTB的最后CU相关联的信息选择所述一或多个CABAC上下文。线程可使用来自由细黑色箭头指示的CTB的最后CU的数据来选择用于当前CTB 252的第一CU的CABAC上下文。
图6是说明根据本发明的一或多个技术的视频解码器30的实例操作300的流程图。在图6的实例中,视频处理装置(例如,视频解码器30)可基于包括视频数据的经编码表示的位流中的补充增强信息(SEI)消息中的特定语法元素确定视频解码器30是否能够解码所述位流(302)。在一些实例中,当用信号表示的性质具有特定值时,所述位流的所有CVS符合同一简档。在另一实例中,用信号表示的性质可为特定语法元素(例如,bitstream_profile_unchanging_flag)且当所述特定语法元素具有特定值时,当位流经解码时激活的相应SPS中的一股简档指示符(例如,general_profile_idc)语法元素具有相同值。所述一股简档指示符语法元素中的每一者指示CVS符合的简档。
当视频解码器30能够解码所述位流(302的“是”)时,视频处理装置可处理所述位流(304)。举例来说,视频处理装置可解码所述位流。在另一实例中,视频处理装置可将位流转发到视频解码器30。否则,当视频解码器30不能够解码所述位流(302的“否”)时,视频处理装置并不处理所述位流(306)。举例来说,视频处理装置并不解码所述位流。在另一实例中,视频处理装置并不将位流转发到视频解码器30。以此方式,视频处理装置可基于所述确定处理所述位流。
图7是说明根据本发明的一或多种技术的视频处理装置的实例操作350的流程图。在图7的实例中,视频处理装置可为视频编码器(例如,视频编码器20)、MANE或另一种类型的装置。此外,在图7的实例中,视频处理装置可确定位流的所有CVS是否符合同一简档(352)。举例来说,视频处理装置可确定当位流经解码时激活的相应SPS中的一股简档语法元素是否具有相同值。
此外,视频处理装置可用信号表示位流的性质,其中当所述性质具有特定值时位流的所有CVS符合同一简档(354)。举例来说,视频处理装置可在位流或基本流中用信号表示含有特定语法元素的SEI消息。在此实例中,当所述特定语法元素具有特定值时,当位流经解码时激活的相应SPS中的一股简档指示符语法元素具有相同值,其中所述一股简档指示符语法元素中的每一者指示CVS符合的简档。
在一些实例中,本发明描述一种处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合或在基本流中用信号表示ESP的集合,其中用信号表示包括以下各项中的至少一者:在位流性质SEI消息中用信号表示位流性质的集合;在ESP SEI消息中用信号表示ESP的集合;在具有相异的NAL单元类型的NAL单元中用信号表示位流性质的集合,其中所述相异NAL单元类型界定NAL单元中的位流性质集合的存在;在具有相异ESP NAL单元类型的NAL单元中用信号表示ESP的集合,其中所述相异ESP NAL单元类型界定NAL单元中的ESP性质的集合的存在;在ISO基础媒体文件格式中用信号表示位流性质的集合;在ISO基础媒体文件格式中用信号表示ESP的集合;在DASH MPD中用信号表示位流性质的集合,其中DASH代表经由HTTP的动态自适应流式传输,HTTP代表超文本传送协议且MPD代表媒体呈现描述;在DASH MPD中用信号表示ESP的集合;用信号表示位流性质的集合作为根据RFC 6381的编解码器参数;用信号表示ESP的集合作为根据RFC 6381的编解码器参数;在会话描述协议(SDP)文件中用信号表示位流性质的集合;以及在SDP文件中用信号表示ESP的集合。在此实例中,处理可包括编码;且用信号表示可包含产生位流以便包含位流性质集合或产生基本流以便包含ESP。或者,在此实例中,处理包括解码;且用信号表示包含接收且解码包含位流性质集合的位流或接收且解码基本流以便包含ESP。在此实例中,处理可在MANE处发生;且用信号表示包含接收且解译位流性质集合而不完全解码所述位流或接收且解译ESP而不完全解码所述基本流。经配置以执行本实例的方法的装置。所述装置可包括以下各者中的一者:编码器,解码器,以及MANE。包括指令的计算机可读存储媒体,所述指令在被执行时致使一或多个处理器执行本实例的方法。处理视频数据的装置,所述装置包括用于执行本实例的方法的装置。
本发明的一或多种技术提供处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中用信号表示位流性质集合包括在位流性质SEI消息中用信号表示位流性质集合。在此实例中,位流性质SEI消息可存在于位流的第一存取单元中。或者,在此实例中,位流性质SEI消息存在于位流的RAP存取单元中。在此实例中,位流性质SEI消息当存在于SEI NAL单元中时可作为SEI NAL单元中的第一SEI消息定位。或者,在此实例中,位流性质SEI消息当存在时可位于不含任何其它SEI消息的SEI NAL单元中。或者,在此实例中,位流性质SEI消息当存在于SEI NAL单元中时作为存取单元中除含有所述SEI NAL单元的存取单元中的基本流层级NAL单元外的第一SEI消息而定位。在此实例中,可要求位流包含第一存取单元,所述第一存取单元包括包含所述位流性质SEI消息的SEI NAL单元。在一些实例中,第一存取单元中的SEI NAL单元并不包含任何其它SEI消息。在本实例的方法中,位流性质SEI消息可包括以下多个旗标中的一或多者:bitstream_profile_unchanging_flag、bitstream_tier_level_unchanging_flag、bitstream_spatial_resolution_unchanging_flag、bitstream_num_sub_layers_unchanging_flag、bitstream_max_bitrate_unchanging_flag、bitstream_max_pic_rate_unchanging_flag、bitstream_color_format_unchanging_flag、bitstream_aspect_ratio_unchanging_flag、bitstream_bit_depth_unchanging_flag、bitstream_full_random_access_enabled_flag、bitstream_all_parameter_sets_in_first_au_flag、bitstream_no_parameter_set_update_flag、es_all_sps_in_first_au_flag、es_no_sps_update_flag、es_all_pps_in_first_au_flag、es_no_pps_update_flag、bitstream_progressive_frames_only_flag、bitstream_unpacked_frames_only_flag、bitstream_tiles_unchanging_flag、bitstream_wpp_unchanging_flag、bitstream_dependent_slices_unchanging_flag,以及bitstream_proterties_sei_extension_flag。在此实例方法中,位流性质SEI消息可包含上文所列的所述多个旗标的子集,其中所述子集包含所述多个旗标中的至少两个或两个以上。在此实例方法中,位流性质SEI消息可包含上文所列的所述多个旗标的全部。在此实例方法中,位流性质SEI消息包含并非以上旗标的至少一个额外旗标。以上方法可进一步包括:处理包括编码;且在位流中用信号表示位流性质集合包含产生所述位流以便包含位流性质集合。在以上方法中处理可包括解码;且在位流中用信号表示位流性质集合可包含接收且解码包含位流性质集合的位流。此外,在此方法中处理可在MANE处发生;且在位流中用信号表示位流性质集合可包含接收且解译位流性质集合而不完全解码所述位流。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中用信号表示ESP集合包括在ESP SEI消息中用信号表示ESP集合。在此实例方法中,ESP SEI消息可包含用于含有ESP SEI消息的整个基本流的信息。此外,在此实例方法中,ESP SEI消息可包含在基本流的第一存取单元中。在此实例方法中,ESP SEI消息可包含在基本流的RAP存取单元中。在此实例方法中,ESP SEI消息可包含在基本流的任何存取单元内。此外,在此实例方法中,ESP SEI消息当存在于SEI NAL单元中时作为所述SEI NAL单元中的第一SEI消息而定位。在此实例方法中ESP SEI消息当存在时可位于不含任何其它SEI消息的SEI NAL单元中。在此实例方法中,ESP SEI消息当存在于SEI NAL单元中时可作为存取单元中的第一SEI消息而定位。此外,在此实例方法中,可要求基本流包含第一存取单元,所述第一存取单元包括包含所述ESP SEI消息的SEI NAL单元。在此实例方法中,ESP SEI消息可包括以下多个旗标中的一或多者:es_profile_unchanging_flag、es_tier_level_unchanging_flag、es_spatial_resolution_unchanging_flag、es_num_sub_layers_unchanging_flag、es_max_bitrate_unchanging_flag、es_max_pic_rate_unchanging_flag、es_color_format_unchanging_flag、es_aspect_ratio_unchanging_flag、es_bit_depth_unchanging_flag、es_full_random_access_enabled_flag、es_all_vps_in_first_au_flag、es_no_vps_update_flag、es_all_sps_in_first_au_flag、es_no_sps_update_flag、es_all_pps_in_first_au_flag、es_no_pps_update_flag、es_progressive_frames_only_flag、es_unpacked_frames_only_flag、es_tiles_unchanging_flag、es_wpp_unchanging_flag、es_dependent_slices_unchanging_flag,以及es_proterties_sei_extension_flag。在此实例方法中,ESP SEI消息可包含上文所列的所述多个旗标的子集,其中所述子集包含所述多个旗标中的至少两个或两个以上。在此实例方法中,ESP SEI消息可包含上文所列的所述多个旗标的全部。在此实例方法中,ESP SEI消息可包含上文未列的至少一个额外旗标。在此实例方法中,处理可包括编码;且用信号表示ESP集合可包含产生基本流以便包含所述ESP。在此实例方法中处理可包括解码;且在基本流中用信号表示ESP集合可包含接收且解码包含ESP集合的基本流。在此实例方法中,处理可在MANE处发生;且在基本流中用信号表示ESP集合可包含接收且解译基本流而不完全解码所述基本流。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中用信号表示位流性质集合包括在具有相异NAL单元类型的网络抽象层NAL单元中用信号表示位流性质集合,其中所述相异NAL单元类型界定NAL单元中的位流性质集合的存在。在此实例方法中,具有相异NAL单元类型的NAL单元可包括位流性质NAL单元。在一些情况下,具有相异NAL单元类型的NAL单元可不经可变长度经译码(VCL)。在此实例方法中,具有相异NAL单元类型的NAL单元可提供用于含有所述NAL单元的整个位流的信息。在此实例方法中,具有相异NAL单元类型的NAL单元可存在于位流的第一存取单元中。在此实例中,具有相异NAL单元类型的NAL单元可存在于位流中的RAP存取单元中。在此实例中,具有相异NAL单元类型的NAL单元可存在于位流中的任何存取单元中。在此实例中,具有相异NAL单元类型的NAL单元可包括除含有具有所述相异NAL单元类型的NAL单元的存取单元中的基本流层级NAL单元之外的第一NAL单元。在此实例中,具有相异NAL单元类型的NAL单元可包含在根据特定视频译码标准译码的每个位流的第一存取单元中。在此实例中,处理可包括编码;且在位流中用信号表示位流性质集合可包含产生所述位流以便包含位流性质集合。在此实例中,处理可包括解码;且在位流中用信号表示位流性质集合可包含接收且解码包含位流性质集合的位流。在此实例中,处理可在MANE处发生;且在位流中用信号表示位流性质集合可包含接收且解译位流性质集合而不完全解码所述位流。在此实例中,执行所述方法的装置可包括以下各者中的一者:编码器,解码器,以及MANE。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中用信号表示ESP集合包括在具有相异ESP NAL单元类型的NAL单元中用信号表示ESP集合,其中所述相异ESP NAL单元类型界定NAL单元中的ESP性质集合的存在。在一些实例中,在此实例中,具有相异ESP NAL单元类型的NAL单元未经可变长度经译码(VCL)。在此实例中,具有相异ESP NAL单元类型的NAL单元可提供用于含有所述NAL单元的整个位流的信息。在此实例中,具有相异ESP NAL单元类型的NAL单元可存在于位流的第一存取单元中。在此实例中,具有相异ESP NAL单元类型的NAL单元可存在于位流中的RAP存取单元中。在此实例中,具有相异ESPNAL单元类型的NAL单元可存在于位流中的任何存取单元中。在此实例中,具有相异ESP NAL单元类型的NAL单元可包括含有具有所述相异ESP NAL单元类型的NAL单元的存取单元中的第一NAL单元。在此实例中,具有相异ESP NAL单元类型的NAL单元可包含在根据特定视频译码标准译码的每个基本流的第一存取单元中。在此实例中,处理可包括编码;且用信号表示ESP集合可包含产生基本流以便包含所述ESP集合。在此实例中,处理可包括解码;且用信号表示ESP集合可包含接收且解码包含所述ESP集合的基本流。在此实例中,处理在MANE处发生;且用信号表示ESP集合可包含接收且解译ESP而不完全解码基本流。在此实例中,执行所述方法的装置可包括以下各者中的一者:编码器,解码器,以及MANE。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中用信号表示位流性质集合包括以ISO基础媒体文件格式用信号表示位流性质集合。在此实例中,ISO基础媒体文件格式可包括HEVC轨道中的样本条目。在此实例中,ISO基础媒体文件格式可包括以下各项中的一者或一者以上中包含的性质盒:轨道标头盒,媒体信息盒,以及HEVC视频轨道的视频媒体标头盒。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中用信号表示ESP集合包括以ISO基础媒体文件格式用信号表示ESP集合。在此实例中,ISO基础媒体文件格式可包括以下各项中的一者或一者以上中包含的基本流性质盒:轨道标头盒,媒体信息盒,以及HEVC视频轨道的视频媒体标头盒。在此实例中,处理可包括编码;且用信号表示位流性质或ESP的集合可包含产生位流以便包含位流性质集合或产生基本流以便包含ESP。在此实例中,处理可包括解码;且用信号表示位流性质或ESP的集合包含接收且解码包含位流性质集合的位流或包含ESP的基本流。在此实例中,处理可在MANE处发生;且用信号表示位流性质或ESP的集合可包含接收且解译位流性质或ESP的集合而不完全解码位流或基本流。在此实例中,执行所述方法的装置可包括以下各者中的一者:编码器,解码器,以及MANE。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中用信号表示位流性质集合包括在DASH MPD中用信号表示位流性质集合,其中DASH代表经由HTTP的动态自适应流式传输,HTTP代表超文本传送协议且MPD代表媒体呈现描述。在此实例中,在DASH MPD中用信号表示位流性质集合可包括在以下各者中的一者上用信号表示:周期层级,调适集合层级,表示层级,以及子表示层级。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在DASH MPD中用信号表示ESP的集合,其中DASH代表经由HTTP的动态自适应流式传输,HTTP代表超文本传送协议且MPD代表媒体呈现描述。在此实例中,在DASH MPD中用信号表示ESP集合可包括在以下各者中的一者上用信号表示:周期层级,调适集合层级,表示层级,以及子表示层级。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中用信号表示位流性质集合包括将位流性质集合用信号表示为根据RFC 6381的编解码器参数。在此实例中,将位流性质集合用信号表示为编解码器参数包括在所述编解码器参数中用信号表示多个简档和/或层次和层级以表示位流的简档、层次和层级的最大集合。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:将ESP的集合用信号表示为根据RFC 6381的编解码器参数。在此实例中,将ESP集合用信号表示为编解码器参数包括在所述编解码器参数中用信号表示多个简档和/或层次和层级以表示基本流的简档、层次和层级的最大集合。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中用信号表示位流性质集合包括在SDP文件中用信号表示位流性质集合。在此实例中,在SDP文件中用信号表示位流性质集合可包括在一或多个媒体层级SDP属性中用信号表示多个简档和/或层次和层级以表示位流中的简档、层次和层级的最大集合。在此实例中,在SDP文件中用信号表示位流性质集合可包括使用包含多个简档的任选的有效负载类型参数。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在SDP文件中用信号表示ESP的集合。在此实例中,在SDP文件中用信号表示ESP集合可包括在一或多个媒体层级SDP属性中用信号表示多个简档和/或层次和层级以表示位流中的简档、层次和层级的最大集合。在此实例中,在SDP文件中用信号表示位流性质集合可包括使用包含多个简档的任选的有效负载类型参数。在此实例中,处理可包括编码;且用信号表示位流性质或ESP的集合可包含产生位流或基本流以便包含位流性质或ESP的集合。在此实例中,处理可包括解码;且用信号表示位流性质或ESP的集合可包含接收且解码包含位流性质集合的位流或包含ESP的基本流。在此实例中,处理在MANE处发生;且用信号表示位流性质的集合可包括接收且解译位流性质或ESP的集合而不完全解码位流或基本流。在此实例中,执行所述方法的装置可包括以下各者中的一者:编码器,解码器,以及MANE。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中位流性质包含指示层次和层级是否针对在位流中的所有CVS保持不变的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有CVS是否具有相同空间分辨率的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有CVS是否具有相同最大数目的时间子层的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有CVS是否具有相同最大数目的层的信息。在此实例中,所述方法可进一步包括用信号表示在位流中的所有CVS中是否所有层具有层ID的相同集合。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有CVS是否支持操作点的相同集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有CVS是否具有相同最大图片速率的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有CVS是否具有相同最大位速率的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有CVS是否具有相同颜色格式的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有CVS是否具有相同样本纵横比的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有CVS是否具有用于亮度样本和色度样本的位深度的相同集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示是否至少一个参数集在位流中经更新的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示是否所有参数集存在于位流的开始处的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的参数集的存在是否实现完整随机可存取性的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有CVS是否仅含有在帧图片中译码的渐进帧的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有CVS是否不含有帧封装布置SEI消息的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有CVS是否含有对瓦片的支持的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有CVS是否具有相同瓦片配置的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有CVS是否具有相同译码树块大小的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有CVS是否具有相同最大译码树块大小的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有CVS是否具有相同最小译码树块大小的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有CVS是否具有相同序列层级参数集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有CVS是否具有序列层级参数的某个注释集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有CVS是否利用特定译码工具的信息。在此实例中,所述特定译码工具可为以下各者中的一者:相依性切片,波前并行处理,瓦片,以及加权预测。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有CVS是否具有由SOP描述SEI消息描述的相同SOP的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有CVS是否可经解码且以可接受质量输出的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示是否应存在当位流经解码时激活的仅一个VPS的信息。在此实例中,所述方法可进一步包括:用信号表示所述一个VPS的VPS识别(ID)。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示是否应存在当位流经解码时激活的仅一个SPS的信息。在此实例中,所述方法可进一步包括用信号表示所述一个SPS的SPS识别(ID)。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示是否应存在当位流经解码时激活的仅一个PPS的信息。在此实例中,所述方法可进一步包括用信号表示所述一个PPS的PPS识别(ID)。
在另一实例中,处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示是否所有RAP图片是位流中的IDR图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示是否所有RAP图片不是位流中的IDR图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示是否存在作为位流中的IDR图片的RAP图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示是否存在作为位流中的RAP图片的非IDR图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有RAP图片是否是CRA图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示是否在位流中的所有RAP图片不是CRA图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中是否存在作为CRA图片的RAP图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示是否存在作为位流中的RAP图片的非CRA图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中的所有RAP图片是否是BLA图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示是否在位流中的所有RAP图片不是BLA图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中是否存在作为BLA图片的RAP图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中是否存在作为BLA图片的非IDR图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中是否存在DLP的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中是否存在非NLP的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中是否存在时间TSA图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示在位流中是否存在STSA图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示sps_temporal_id_nesting_flag的值是否针对当基本流经解码时激活的所有序列参数集是相同的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中位流性质集合包含指示vps_temporal_id_nesting_flag的值是否针对当基本流经解码时激活的所有视频参数集是相同的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示位流中的简档集合的信息。
处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示位流中的最大简档集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示位流中的层次和层级的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示位流中的空间分辨率的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示位流中的最大数目的时间子层的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示位流中的最大数目的层和最大数目的层识别(ID)的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示位流中的操作点的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示位流中的最大帧速率的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示位流中的最大位速率的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示位流中的颜色格式的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示位流中的样本纵横比的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示位流中的亮度位深度和色度位深度的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示位流中的帧封装类型的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示位流中的瓦片的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质的集合,其中所述位流性质包含指示位流中的最大译码树块大小和最小译码块大小的最大集合的信息。
在另一实例中,本发明描述包括以上所描述的方法的任何组合的方法。在此实例和其它实例方法中,所述方法可包括用信号表示位流性质的集合。在此实例中,用信号表示位流性质的集合可包括以下各者中的至少一者:在位流性质SEI消息中用信号表示位流性质集合;在具有相异NAL单元类型的NAL单元中用信号表示位流性质集合,其中所述相异NAL单元类型界定所述NAL单元中的位流性质集合的存在;以ISO基础媒体文件格式用信号表示位流性质集合;在DASH MPD中用信号表示位流性质集合,其中DASH代表经由HTTP的动态自适应流式传输,HTTP代表超文本传送协议且MPD媒体呈现描述;将位流性质集合用信号表示为根据RFC 6381的编解码器参数;以及在SDP文件中用信号表示位流性质集合。在此方法中,处理可包括编码;且在位流中用信号表示位流性质集合可包含产生所述位流以便包含位流性质集合。或者,在此方法中,处理可包括解码;且在位流中用信号表示位流性质集合可包含接收且解码包含位流性质集合的位流。在此方法中,处理可在MANE处发生;且在位流中用信号表示位流性质集合可包含接收且解译位流性质集合而不完全解码所述位流。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示层次和层级是否针对基本流中的所有CVS保持不变的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的所有CVS是否具有相同空间分辨率的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的所有CVS是否具有相同最大数目的时间子层的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的所有CVS是否具有相同最大数目的层的信息。在此实例中,所述方法可进一步包括用信号表示在基本流中的所有CVS中是否所有层具有层ID的相同集合。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的所有CVS是否支持相同操作点集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的所有CVS是否具有相同最大图片速率的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的所有CVS是否具有相同最大位速率的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的所有CVS是否具有相同颜色格式的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的所有CVS是否具有相同样本纵横比的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的所有CVS是否具有用于亮度样本和色度样本的位深度的相同集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示是否至少一个参数集在所述基本流中经更新的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示是否所有参数集存在于基本流的开始处的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的参数集的存在是否实现完整随机可存取性的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的所有CVS是否仅含有在帧图片中译码的渐进帧的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的所有CVS是否不含有帧封装布置SEI消息的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的所有CVS是否含有对瓦片的支持的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的所有CVS是否具有相同瓦片配置的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的所有CVS是否具有相同译码树块大小的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的所有CVS是否具有相同最大译码树块大小的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的所有CVS是否具有相同最小译码树块大小的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的所有CVS是否具有相同序列层级参数集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的所有CVS是否具有序列层级参数的某个注释集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的所有CVS是否利用特定译码工具的信息。在此实例中,所述特定译码工具可为以下各者中的一者:相依性切片,波前并行处理,瓦片,以及加权预测。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的所有CVS是否具有由SOP描述SEI消息描述的相同SOP的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的所有CVS是否可经解码且以可接受质量输出的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示是否应存在当基本流经解码时激活的仅一个VPS的信息。在此实例中,所述方法可进一步包括:用信号表示所述一个VPS的VPS识别(ID)。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述基本流包含指示是否应存在当基本流经解码时激活的仅一个SPS的信息。在此实例中,所述方法可进一步包括用信号表示所述一个SPS的SPS识别(ID)。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示是否应存在当基本流经解码时激活的仅一个PPS的信息。在此实例中,所述方法可进一步包括用信号表示所述一个PPS的PPS识别(ID)。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示是否所有RAP图片是基本流中的IDR图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示是否所有RAP图片不是基本流中的IDR图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示是否存在作为基本流中的IDR图片的RAP图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示是否存在作为基本流中的RAP图片的非IDR图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示是否基本流中的所有RAP图片是CRA图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示是否基本流中的所有RAP图片不是CRA图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示是否存在作为CRA图片的基本流中的RAP图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示是否存在作为基本流中的RAP图片的非CRA图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示是否基本流中的所有RAP图片是BLA图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示是否基本流中的所有RAP图片不是BLA图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示是否存在作为BLA图片的基本流中的RAP图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示是否存在作为BLA图片的基本流中的非IDR图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中是否存在DLP的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中是否存在NLP的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中是否存在TSA图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中是否存在STSA图片的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示sps_temporal_id_nesting_flag的值是否针对当基本流经解码时激活的所有序列参数集是相同的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中ESP集合包含指示vps_temporal_id_nesting_flag的值是否针对当基本流经解码时激活的所有视频参数集是相同的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中位流性质包含指示位流中的简档的集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的最大简档集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的层次和层级的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的空间分辨率的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的最大数目的时间子层的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的最大数目的层和最大数目的层识别(ID)的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的操作点的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的最大帧速率的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的最大位速率的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的最大集合颜色格式的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的样本纵横比的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的亮度位深度和色度位深度的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的帧封装类型的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的瓦片的最大集合的信息。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示ESP的集合,其中所述ESP包含指示基本流中的最大译码树块大小和最小译码块大小的最大集合的信息。
在另一实例中,本发明描述包括在基本流中用信号表示ESP的集合的以上方法的任何组合的方法。在此实例中,用信号表示ESP集合可包括以下各者中的至少一者:在ESP SEI消息中用信号表示ESP集合;在具有相异ESP NAL单元类型的NAL单元中用信号表示ESP集合,其中所述相异ESP NAL单元类型界定NAL单元中的ESP性质集合的存在;以ISO基础媒体文件格式用信号表示ESP集合;在DASH MPD中用信号表示ESP集合;将ESP集合用信号表示为根据RFC 6381的编解码器参数;以及在SDP文件中用信号表示ESP集合。在此实例中,处理可包括编码;且用信号表示ESP集合可包含产生基本流以便包含所述ESP集合。在此实例中,处理可包括解码;且用信号表示ESP集合可包含接收且解码包含所述ESP集合的基本流。在此实例中,处理可在MANE处发生;且用信号表示ESP集合可包含接收且解译ESP集合而不完全解码基本流。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在位流中用信号表示位流性质,其中所述位流性质包含本发明中描述的位流性质中的一或多者。在此实例中,处理指代编码且用信号表示可包括产生位流或基本流。在此实例中,处理可指代解码且用信号表示可包括接收且解译位流或基本流。在此实例中,处理可指代处理而不解码,且用信号表示可包括接收且解译位流或基本流的部分。
在另一实例中,本发明描述处理视频数据的方法,所述方法包括:在基本流中用信号表示基本流性质,其中所述基本流性质包含本发明中描述的基本流性质中的一或多者。在此实例中,处理指代编码且用信号表示可包括产生位流或基本流。在此实例中,处理可指代解码且用信号表示可包括接收且解译位流或基本流。在此实例中,处理可指代处理而不解码,且用信号表示可包括接收且解译位流或基本流的部分。
在上述实例方法中的一或多者或其组合中,所述性质可包含指示以下各项中的至少一者的信息:
1)层次和层级是否针对位流或基本流中的所有CVS保持不变。
2)在位流或基本流中的所有CVS是否具有相同空间分辨率。
3)在位流或基本流中的所有CVS是否具有相同(最大)数目的时间子层。
4)在位流或基本流中的所有CVS是否具有相同(最大)数目的层(即用于VCL NAL单元的nuh_reserved_zero_6bits的值的数目),且如果是,那么在位流或基本流中的所有CVS中是否所有层具有层ID的相同集合(即nuh_reserved_zero_6bits值的相同集合)。
5)在位流或基本流中的所有CVS是否支持操作点的相同集合。操作点例如由nuh_reserved_zero_6bits值集合(表示为OpLayerldSet)及TemporalId值(表示为OpTid)识别,且经导出为如在HEVC中指定的将OpTid及OpLayerIdSet作为输入的子位流提取过程的输出的相关联位流子集可独立地解码。
6)在位流或基本流中的所有CVS是否具有相同(最大)图片速率。
7)在位流或基本流中的所有CVS是否具有相同最大位速率。
8)在位流或基本流中是否所有CVS具有相同颜色格式。
9)在位流或基本流中的所有CVS是否具有相同样本纵横比。
10)在位流或基本流中的所有CVS是否具有用于亮度和色度的位深度的相同集合。
11)在位流或基本流中是否至少一个参数集经更新,即VPS、SPS或PPS改变但使用相同的VPS、SPS或PPS ID。或在位流或基本流中是否至少一个VPS经更新,在位流或基本流中是否至少一个SPS经更新,且在位流或基本流中是否至少一个PPS经更新。
12)是否所有参数集存在于位流或基本流的开始处(即在位流或基本流中的第一存取单元内)-应注意如果所述条件是真,那么仍可存在其它存取单元中重复的参数集,例如用于错误恢复目的,但将不存在任何参数集更新。或是否所有VPS存在于位流或基本流的开始处,是否所有SPS存在于位流或基本流的开始处,且天气所有PPS存在于位流或基本流的开始处。
13)在位流或基本流中的参数集的存在是否实现完整随机可存取性,即有可能通过丢弃在RAP存取单元之前的所有存取单元而在每一RAP存取单元的位置处执行随机存取(且按解码次序正确地解码RAP图片和所有后续非TFD图片)。这要求当在任何RAP存取单元处执行以上随机存取时,每一参数集当其需要激活时在位流中是可用的。
14)在位流或基本流中的所有CVS是否仅含有在帧图片中译码的渐进帧,即扫描类型是渐进不交错的,且不存在字段图片。
15)在位流或基本流中的所有CVS是否不含有帧封装布置SEI消息,即由位流或基本流中的每一CVS表示的视频片段未经帧封装。
16)在位流或基本流中的所有CVS是否具有对瓦片的支持和/或相同瓦片配置。
17)在位流或基本流中的所有CVS是否具有相同译码树块大小和相同最小译码块大小。
18)在位流或基本流中的所有CVS是否具有序列层级HRD参数(或其一部分)的相同集合,例如如在HEVC中指定的hrd_parameters()语法结构中用信号表示,和/或经解码图片缓冲器大小的相同集合,例如如HEVC中指定的vps_max_dec_pic_buffering[i]语法元素用信号表示。
19)在位流或基本流中的所有CVS是否利用特定译码工具,例如相依性切片(当dependent_slices_enabled_flag等于1时支持)、波前并行处理(当entropy_coding_sync_enabled_flag等于1时支持)、加权预测等。
20)在位流或基本流中的所有CVS是否具有如由SOP描述SEI消息所描述的相同图片结构(SOP)。
21)在位流或基本流中的所有CVS中的TFD图片是否可经解码且以可接受质量输出。
22)是否存在当位流或基本流经解码时激活的仅一个VPS,且如果是,则所述VPS的VPS ID。
23)是否存在当位流或基本流经解码时激活的仅一个SPS,且如果是,则所述SPS的SPS ID。
24)是否存在当位流或基本流经解码时激活的仅一个PPS,且如果是,则所述PPS的PPS ID。
25)以下各者中的一或多者及其组合:
a.在位流或基本流中是否所有RAP图片是IDR图片。
b.在位流或基本流中是否所有RAP图片不是IDR图片。
c.在位流或基本流中是否存在作为IDR图片的RAP图片。
d.在位流或基本流中是否存在非IDR RAP图片。
e.在位流或基本流中是否所有RAP图片是CRA图片。
f.在位流或基本流中是否所有RAP图片不是CRA图片。
g.在位流或基本流中是否存在作为CRA图片的RAP图片。
h.在位流或基本流中是否存在非CRA RAP图片。
i.在位流或基本流中是否所有RAP图片是BLA图片。
i.在位流或基本流中是否所有RAP图片不是BLA图片。
k.在位流或基本流中是否存在作为BLA图片的RAP图片。
l.在位流或基本流中是否存在非IDR BLA图片。
m.在位流或基本流中是否存在DLP图片。
n.在位流或基本流中是否存在TFD图片。
o.在位流或基本流中是否存在TSA图片。
p.在位流或基本流中是否存在STSA图片。
26)sps_temporal_id_nesting_flag的值针对当基本流经解码时激活的所有序列参数集是否是相同的。
27)vps_temporal_id_nesting_flag的值针对当基本流经解码时激活的所有视频参数集是否是相同的。
在上述实例方法中的一或多者或其组合中,所述性质可包含指示以下各项中的至少一者的信息:
1)在位流中的简档集合(可能具有额外限制,例如针对0到31(包含性)的范围内的i的general_profile_compatibility_flag[i]中用信号表示,和如HEVC中指定的general_reserved_zero_16bits)。或者,在位流或基本流中的简档的最大集合(即在位流或基本流中没有CVS将符合所述集合中不包含的简档)。
2)在位流或基本流中的层次和层级的(最大)集合。这可有效地用信号表示为最高层次,且对于每一层次用信号表示最高层级。
3)在位流或基本流中的空间分辨率的(最大)集合。
4)在位流或基本流中的(最大)数目的时间子层的(最大)集合。
5)(最大)数目的层(即用于VCL NAL单元的nuh_reserved_zero_6bits的值的数目)的(最大)集合和在位流或基本流中的层ID(即nuh_reserved_zero_6bits值)的(最大)集合。
6)在位流或基本流中的操作点的(最大)集合。
7)在位流或基本流中的(最大)帧速率的(最大)集合。
8)在位流或基本流中的最大位速率的(最大)集合。
9)在位流或基本流中的颜色格式的(最大)集合。
10)在位流或基本流中的样本纵横比的(最大)集合。
11)在位流或基本流中的亮度位深度和色度位深度的(最大)集合。
12)在位流或基本流中的帧封装类型的(最大)集合。
13)在位流或基本流中的瓦片的(最大)数目。
14)在位流或基本流中的译码树块大小和最小译码块大小的(最大)集合。
在上述实例方法中的一或多者或其组合中,用信号表示可包括经由SEI消息用信号表示。在上述实例方法中的一或多者或其组合中,用信号表示可包括经由NAL单元用信号表示。
一或多个装置可经配置以执行以上所描述的方法。在一些实例中,所述一或多个装置可包含编码器、解码器或MANE。
在一或多个实例中,所描述的功能可以用硬件、软件、固件或其任何组合来实施。如果用软件实施,则所述功能可以作为一或多个指令或代码在计算机可读媒体上存储或传输,并且由基于硬件的处理单元来执行。计算机可读媒体可包含计算机可读存储媒体,其对应于有形媒体,例如数据存储媒体,或包括任何促进将计算机程序从一处传送到另一处的媒体(例如,根据通信协议)的通信媒体。以此方式,计算机可读媒体一股可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)通信媒体,例如,信号或载波。数据存储媒体可为可由一或多个计算机或一个或多个处理器存取以检索用于实施本发明中描述的技术的指令、代码及/或数据结构的任何可用媒体。计算机程序产品可以包含计算机可读媒体。
借助于实例而非限制,此类计算机可读存储媒体可包含RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或任何其它可用来存储指令或数据结构的形式的期望程序代码并且可由计算机存取的媒体。同样,任何连接可恰当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输指令,那么同轴电缆、光纤缆线、双绞线、DSL或例如红外线、无线电和微波等无线技术包含在媒体的定义中。然而,应理解,计算机可读存储媒体和数据存储媒体并不包含连接、载波、信号或其它暂时性媒体,而是实际上针对于非暂时性有形存储媒体。如本文所使用,磁盘及光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘及蓝光光盘,其中磁盘通常以磁性方式复制数据,而光盘使用激光以光学方式复制数据。以上的组合也应包含在计算机可读媒体的范围内。
指令可以由一或多个处理器执行,所述一或多个处理器例如是一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效的集成或离散逻辑电路。因此,如本文中所使用的术语“处理器”可指前述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可以在经配置用于编码和解码的专用硬件和/或软件模块内提供,或者并入在组合编解码器中。并且,可将所述技术完全实施于一或多个电路或逻辑元件中。
本发明的技术可在广泛多种装置或设备中实施,包含无线手持机、集成电路(IC)或IC的集合(即,芯片组)。本发明中描述各种组件、模块或单元是为了强调经配置以执行所揭示技术的装置的功能方面,但未必需要通过不同硬件单元实现。实际上,如上文所描述,各种单元可以结合合适的软件及/或固件组合在编码解码器硬件单元中,或者通过互操作硬件单元的集合来提供,所述硬件单元包含如上文所描述的一或多个处理器。
已描述各种实例。这些及其它实例在所附权利要求书的范围内。
Claims (51)
1.一种处理视频数据的方法,所述方法包括:
基于包括所述视频数据的经编码表示的位流的用信号表示的性质确定视频解码器是否能够解码所述位流,
其中所述位流符合视频译码规范且包括多个经译码视频序列CVS,且当所述用信号表示的性质具有特定值时,所述位流的所有所述CVS符合同一简档,所述简档是由所述视频译码规范指定的整个位流语法的子集;以及基于所述确定处理所述位流。
2.根据权利要求1所述的方法,其中所述用信号表示的性质在国际标准化组织ISO基础媒体文件格式文件中用信号表示。
3.根据权利要求2所述的方法,其中所述用信号表示的性质在所述ISO基础媒体文件格式文件的高效视频译码HEVC视频轨道中的样本条目中用信号表示。
4.根据权利要求1所述的方法,其中所述用信号表示的性质包括经由超文本传送协议的动态自适应流式传输DASH的媒体呈现描述MPD中的元素或属性中的参数。
5.根据权利要求1所述的方法,其中所述用信号表示的性质包括会话描述协议SDP的参数。
6.根据权利要求1所述的方法,其中处理所述位流包括解码所述位流。
7.根据权利要求1所述的方法,其中所述用信号表示的性质是特定语法元素且当所述特定语法元素具有所述特定值时,当所述位流经解码时激活的相应序列参数集SPS中的一股简档指示符语法元素具有相同值,其中所述一股简档指示符语法元素中的每一者指示所述位流的CVS符合的简档。
8.根据权利要求7所述的方法,其中:
所述SPS中的每一者包含多个一股简档兼容性旗标语法元素,
每一多个一股简档兼容性旗标语法元素中的每一相应一股简档兼容性旗标语法元素与索引相关联,
对应一股简档兼容性旗标语法元素与同一索引相关联,且
当所述特定语法元素具有所述特定值时,所述SPS中的所述对应一股简档兼容性旗标语法元素中的每一者具有相同值。
9.根据权利要求7所述的方法,其中:
所述SPS中的每一者包含general_reserved_zero_16bits语法元素,且
当所述特定语法元素具有所述特定值时,所述SPS中的每一者中的所述general_reserved_zero_16bits语法元素具有相同值。
10.根据权利要求1所述的方法,其中所述用信号表示的性质包括补充增强信息SEI消息中的特定语法元素。
11.根据权利要求10所述的方法,其中所述视频译码规范要求所述SEI消息在所述位流的第一存取单元中。
12.根据权利要求10所述的方法,其中所述视频译码规范允许所述SEI消息在所述位流的任何随机存取点RAP存取单元中用信号表示。
13.根据权利要求10所述的方法,其中:
网络抽象层NAL单元囊封所述SEI消息,且
所述视频译码规范要求所述SEI消息为所述NAL单元中的第一SEI消息。
14.根据权利要求10所述的方法,其中:
网络抽象层NAL单元囊封所述SEI消息,且
所述视频译码规范要求所述SEI消息为所述NAL单元中的仅有SEI消息。
15.根据权利要求10所述的方法,其中:
存取单元中的网络抽象层NAL单元囊封所述SEI消息,且
所述视频译码规范要求所述NAL单元为所述存取单元中除了基本流层级NAL单元之外的第一SEI NAL单元。
16.根据权利要求10所述的方法,其中所述SEI消息包括以下多个旗标中的一或多者:
bitstream_tier_level_unchanging_flag语法元素,其指示general_tier_flag语法元素和general_level_idc语法元素的值针对当所述位流经解码时激活的所有所述SPS是否是相同的,其中所述general_tier_flag语法元素指示用于所述一股level_idc语法元素的解译的层次上下文且所述general_level_idc语法元素指示所述CVS符合的层级;
bitstream_spatial_resolution_unchanging_flag语法元素,其指示所述位流的所有CVS是否具有相同空间分辨率;
指示所述位流的时间子层的数目针对所述位流中的所有CVS是否是相同的语法元素;
指示最大位速率针对所述位流中的所有所述CVS是否是相同的语法元素;
指示最大图片速率针对所述位流中的所有所述CVS是否是相同的语法元素;
指示在所述位流中的所有所述CVS是否具有相同颜色格式的语法元素;
指示在所述位流中的所有所述CVS是否具有相同样本纵横比的语法元素;
指示在所述位流中的所有所述CVS是否具有用于亮度和色度的位深度的相同集合的语法元素;
指示在所述位流中的参数集的存在是否实现完整随机可存取性的语法元素;
指示所有参数集是否存在于所述位流中的所述第一存取单元内的语法元素;
指示在所述位流中是否至少一个VPS经更新、在所述位流中是否至少一个SPS经更新或在所述位流中是否至少一个PPS经更新的语法元素;
指示当所述位流经解码时激活的所有SPS是否存在于所述位流中的所述第一存取单元中的语法元素;
指示是否至少一个SPS经更新但使用相同SPS识别符的语法元素;
指示是否所有PPS存在于所述位流的开始处的语法元素;
指示在所述位流中是否至少一个PPS改变但使用相同PPS识别符的语法元素;
指示在所述位流中的所有CVS是否仅含有在帧图片中译码的渐进帧的语法元素;
指示在所述位流中的所有CVS是否不含有帧封装布置SEI消息的语法元素;
指示在所述位流中的所有CVS是否具有相同瓦片配置的语法元素;
指示在所述位流中的所有CVS是否利用波前并行处理的语法元素;
指示在所述位流中的所有CVS是否利用相依性切片的语法元素;以及
指示是否任何额外数据在所述SEI消息中跟随的语法元素。
17.一种处理视频数据的方法,所述方法包括:
用信号表示位流的性质,其中所述位流符合视频译码规范且包括多个经译码视频序列CVS,其中当所述性质具有特定值时,所述位流的所有所述CVS符合同一简档,所述简档是由所述视频译码规范指定的整个位流语法的子集。
18.根据权利要求17所述的方法,其中所述性质是特定语法元素且当所述特定语法元素具有所述特定值时,当所述位流经解码时激活的相应序列参数集SPS中的一股简档指示符语法元素具有相同值,其中所述一股简档指示符语法元素中的每一者指示所述位流的CVS符合的简档。
19.根据权利要求18所述的方法,其中:
所述SPS中的每一者包含多个一股简档兼容性旗标语法元素,
每一多个一股简档兼容性旗标语法元素中的每一相应一股简档兼容性旗标语法元素与索引相关联,
对应一股简档兼容性旗标语法元素与同一索引相关联,且
当所述特定语法元素具有所述特定值时,所述SPS中的所述对应一股简档兼容性旗标语法元素中的每一者具有相同值。
20.根据权利要求18所述的方法,其中:
所述SPS中的每一者包含general_reserved_zero_16bits语法元素,且
当所述特定语法元素具有所述特定值时,所述SPS中的每一者中的所述general_reserved_zero_16bits语法元素具有相同值。
21.根据权利要求17所述的方法,其中用信号表示所述性质包括在补充增强信息SEI消息中用信号表示特定语法元素。
22.根据权利要求21所述的方法,其中所述视频译码规范要求所述SEI消息在所述位流的第一存取单元中。
23.根据权利要求21所述的方法,其中所述视频译码规范允许所述SEI消息在所述位流的任何随机存取点RAP存取单元中用信号表示。
24.根据权利要求21所述的方法,其中:
网络抽象层NAL单元囊封所述SEI消息,且
所述视频译码规范要求所述SEI消息为所述NAL单元中的第一SEI消息。
25.根据权利要求21所述的方法,其中:
网络抽象层NAL单元囊封所述SEI消息,且
所述视频译码规范要求所述SEI消息为所述NAL单元中的仅有SEI消息。
26.根据权利要求21所述的方法,其中:
存取单元中的网络抽象层NAL单元囊封所述SEI消息,且
所述视频译码规范要求所述NAL单元为所述存取单元中除了基本流层级NAL单元之外的第一SEI NAL单元。
27.根据权利要求21所述的方法,其中所述SEI消息包括以下多个旗标中的一或多者:
bitstream_tier_level_unchanging_flag语法元素,其指示general_tier_flag语法元素和general_level_idc语法元素的值针对当所述位流经解码时激活的所有所述SPS是否是相同的,其中所述general_tier_flag语法元素指示用于所述一股level_idc语法元素的解译的层次上下文且所述general_level_idc语法元素指示所述CVS符合的层级;
bitstream_spatial_resolution_unchanging_flag语法元素,其指示所述位流的所有CVS是否具有相同空间分辨率;
指示所述位流的时间子层的数目针对所述位流中的所有CVS是否是相同的语法元素;
指示最大位速率针对所述位流中的所有所述CVS是否是相同的语法元素;
指示最大图片速率针对所述位流中的所有所述CVS是否是相同的语法元素;
指示在所述位流中的所有所述CVS是否具有相同颜色格式的语法元素;
指示在所述位流中的所有所述CVS是否具有相同样本纵横比的语法元素;
指示在所述位流中的所有所述CVS是否具有用于亮度和色度的位深度的相同集合的语法元素;
指示在所述位流中的参数集的存在是否实现完整随机可存取性的语法元素;
指示所有参数集是否存在于所述位流中的所述第一存取单元内的语法元素;
指示在所述位流中是否至少一个VPS经更新、在所述位流中是否至少一个SPS经更新或在所述位流中是否至少一个PPS经更新的语法元素;
指示当所述位流经解码时激活的所有SPS是否存在于所述位流中的所述第一存取单元中的语法元素;
指示是否至少一个SPS经更新但使用相同SPS识别符的语法元素;
指示是否所有PPS存在于所述位流的开始处的语法元素;
指示在所述位流中是否至少一个PPS改变但使用相同PPS识别符的语法元素;
指示在所述位流中的所有CVS是否仅含有在帧图片中译码的渐进帧的语法元素;
指示在所述位流中的所有CVS是否不含有帧封装布置SEI消息的语法元素;
指示在所述位流中的所有CVS是否具有相同瓦片配置的语法元素;
指示在所述位流中的所有CVS是否利用波前并行处理的语法元素;
指示在所述位流中的所有CVS是否利用相依性切片的语法元素;以及
指示是否任何额外数据在所述SEI消息中跟随的语法元素。
28.一种包括一或多个处理器的视频处理装置,所述一或多个处理器经配置以:
基于包括视频数据的经编码表示的位流的用信号表示的性质确定视频解码器是否能够解码位流,
其中所述位流符合视频译码规范且包括多个经译码视频序列CVS,且当所述用信号表示的性质具有特定值时,所述位流的所有所述CVS符合同一简档,所述简档是由所述视频译码规范指定的整个位流语法的子集;以及基于所述确定处理所述位流。
29.根据权利要求28所述的视频处理装置,其中所述用信号表示的性质是特定语法元素且当所述特定语法元素具有所述特定值时,当所述位流经解码时激活的相应序列参数集SPS中的一股简档指示符语法元素具有相同值,其中所述一股简档指示符语法元素中的每一者指示所述位流的CVS符合的简档。
30.根据权利要求29所述的视频处理装置,其中:
所述SPS中的每一者包含多个一股简档兼容性旗标语法元素,
每一多个一股简档兼容性旗标语法元素中的每一相应一股简档兼容性旗标语法元素与索引相关联,
对应一股简档兼容性旗标语法元素与同一索引相关联,且
当所述特定语法元素具有所述特定值时,所述SPS中的所述对应一股简档兼容性旗标语法元素中的每一者具有相同值。
31.根据权利要求29所述的视频处理装置,其中:
所述SPS中的每一者包含general_reserved_zero_16bits语法元素,且
当所述特定语法元素具有所述特定值时,所述SPS中的每一者中的所述general_reserved_zero_16bits语法元素具有相同值。
32.根据权利要求28所述的视频处理装置,其中所述用信号表示的性质包括补充增强信息SEI消息中的特定语法元素。
33.根据权利要求32所述的视频处理装置,其中所述视频译码规范要求所述SEI消息在所述位流的第一存取单元中。
34.根据权利要求32所述的视频处理装置,其中所述视频译码规范允许所述SEI消息在所述位流的任何随机存取点RAP存取单元中用信号表示。
35.根据权利要求32所述的视频处理装置,其中:
网络抽象层NAL单元囊封所述SEI消息,且
所述视频译码规范要求所述SEI消息为所述NAL单元中的第一SEI消息。
36.根据权利要求32所述的视频处理装置,其中:
网络抽象层NAL单元囊封所述SEI消息,且
所述视频译码规范要求所述SEI消息为所述NAL单元中的仅有SEI消息。
37.根据权利要求32所述的视频处理装置,其中:
存取单元中的网络抽象层NAL单元囊封所述SEI消息,且
所述视频译码规范要求所述NAL单元为所述存取单元中除了基本流层级NAL单元之外的第一SEI NAL单元。
38.根据权利要求32所述的视频处理装置,其中所述SEI消息包括以下多个旗标中的一或多者:
bitstream_tier_level_unchanging_flag语法元素,其指示general_tier_flag语法元素和general_level_idc语法元素的值针对当所述位流经解码时激活的所有所述SPS是否是相同的,其中所述general_tier_flag语法元素指示用于所述一股level_idc语法元素的解译的层次上下文且所述general_level_idc语法元素指示所述CVS符合的层级;
bitstream_spatial_resolution_unchanging_flag语法元素,其指示所述位流的所有CVS是否具有相同空间分辨率;
指示所述位流的时间子层的数目针对所述位流中的所有CVS是否是相同的语法元素;
指示最大位速率针对所述位流中的所有所述CVS是否是相同的语法元素;
指示最大图片速率针对所述位流中的所有所述CVS是否是相同的语法元素;
指示在所述位流中的所有所述CVS是否具有相同颜色格式的语法元素;
指示在所述位流中的所有所述CVS是否具有相同样本纵横比的语法元素;
指示在所述位流中的所有所述CVS是否具有用于亮度和色度的位深度的相同集合的语法元素;
指示在所述位流中的参数集的存在是否实现完整随机可存取性的语法元素;
指示所有参数集是否存在于所述位流中的所述第一存取单元内的语法元素;
指示在所述位流中是否至少一个VPS经更新、在所述位流中是否至少一个SPS经更新或在所述位流中是否至少一个PPS经更新的语法元素;
指示当所述位流经解码时激活的所有SPS是否存在于所述位流中的所述第一存取单元中的语法元素;
指示是否至少一个SPS经更新但使用相同SPS识别符的语法元素;
指示是否所有PPS存在于所述位流的开始处的语法元素;
指示在所述位流中是否至少一个PPS改变但使用相同PPS识别符的语法元素;
指示在所述位流中的所有CVS是否仅含有在帧图片中译码的渐进帧的语法元素;
指示在所述位流中的所有CVS是否不含有帧封装布置SEI消息的语法元素;
指示在所述位流中的所有CVS是否具有相同瓦片配置的语法元素;
指示在所述位流中的所有CVS是否利用波前并行处理的语法元素;
指示在所述位流中的所有CVS是否利用相依性切片的语法元素;以及
指示是否任何额外数据在所述SEI消息中跟随的语法元素。
39.一种包括一或多个处理器的视频处理装置,所述一或多个处理器经配置以:
用信号表示位流的性质,其中所述位流符合视频译码规范且包括多个经译码视频序列CVS,其中当所述性质具有特定值时,所述位流的所有所述CVS符合同一简档,所述简档是由所述视频译码规范指定的整个位流语法的子集。
40.根据权利要求39所述的视频处理装置,其中所述性质是特定语法元素且当所述特定语法元素具有所述特定值时,当所述位流经解码时激活的相应序列参数集SPS中的一股简档指示符语法元素具有相同值,其中所述一股简档指示符语法元素中的每一者指示所述位流的CVS符合的简档。
41.根据权利要求40所述的视频处理装置,其中:
所述SPS中的每一者包含多个一股简档兼容性旗标语法元素,
每一多个一股简档兼容性旗标语法元素中的每一相应一股简档兼容性旗标语法元素与索引相关联,
对应一股简档兼容性旗标语法元素与同一索引相关联,且
当所述特定语法元素具有所述特定值时,所述SPS中的所述对应一股简档兼容性旗标语法元素中的每一者具有相同值。
42.根据权利要求40所述的视频处理装置,其中:
所述SPS中的每一者包含general_reserved_zero_16bits语法元素,且
当所述特定语法元素具有所述特定值时,所述SPS中的每一者中的所述general_reserved_zero_16bits语法元素具有相同值。
43.根据权利要求39所述的视频处理装置,其中用信号表示所述性质包括在补充增强信息SEI消息中用信号表示特定语法元素。
44.根据权利要求43所述的视频处理装置,其中所述视频译码规范要求所述SEI消息在所述位流的第一存取单元中。
45.根据权利要求43所述的视频处理装置,其中所述视频译码规范允许所述SEI消息在所述位流的任何随机存取点RAP存取单元中用信号表示。
46.根据权利要求43所述的视频处理装置,其中:
网络抽象层NAL单元囊封所述SEI消息,且
所述视频译码规范要求所述SEI消息为所述NAL单元中的第一SEI消息。
47.根据权利要求43所述的视频处理装置,其中:
网络抽象层NAL单元囊封所述SEI消息,且
所述视频译码规范要求所述SEI消息为所述NAL单元中的仅有SEI消息。
48.根据权利要求43所述的视频处理装置,其中:
存取单元中的网络抽象层NAL单元囊封所述SEI消息,且
所述视频译码规范要求所述NAL单元为所述存取单元中除了基本流层级NAL单元之外的第一SEI NAL单元。
49.根据权利要求43所述的视频处理装置,其中所述SEI消息包括以下多个旗标中的一或多者:
bitstream_tier_level_unchanging_flag语法元素,其指示general_tier_flag语法元素和general_level_idc语法元素的值针对当所述位流经解码时激活的所有所述SPS是否是相同的,其中所述general_tier_flag语法元素指示用于所述一股level_idc语法元素的解译的层次上下文且所述general_level_idc语法元素指示所述CVS符合的层级;
bitstream_spatial_resolution_unchanging_flag语法元素,其指示所述位流的所有CVS是否具有相同空间分辨率;
指示所述位流的时间子层的数目针对所述位流中的所有CVS是否是相同的语法元素;
指示最大位速率针对所述位流中的所有所述CVS是否是相同的语法元素;
指示最大图片速率针对所述位流中的所有所述CVS是否是相同的语法元素;
指示在所述位流中的所有所述CVS是否具有相同颜色格式的语法元素;
指示在所述位流中的所有所述CVS是否具有相同样本纵横比的语法元素;
指示在所述位流中的所有所述CVS是否具有用于亮度和色度的位深度的相同集合的语法元素;
指示在所述位流中的参数集的存在是否实现完整随机可存取性的语法元素;
指示所有参数集是否存在于所述位流中的所述第一存取单元内的语法元素;
指示在所述位流中是否至少一个VPS经更新、在所述位流中是否至少一个SPS经更新或在所述位流中是否至少一个PPS经更新的语法元素;
指示当所述位流经解码时激活的所有SPS是否存在于所述位流中的所述第一存取单元中的语法元素;
指示是否至少一个SPS经更新但使用相同SPS识别符的语法元素;
指示是否所有PPS存在于所述位流的开始处的语法元素;
指示在所述位流中是否至少一个PPS改变但使用相同PPS识别符的语法元素;
指示在所述位流中的所有CVS是否仅含有在帧图片中译码的渐进帧的语法元素;
指示在所述位流中的所有CVS是否不含有帧封装布置SEI消息的语法元素;
指示在所述位流中的所有CVS是否具有相同瓦片配置的语法元素;
指示在所述位流中的所有CVS是否利用波前并行处理的语法元素;
指示在所述位流中的所有CVS是否利用相依性切片的语法元素;以及
指示是否任何额外数据在所述SEI消息中跟随的语法元素。
50.一种视频解码装置,其包括:
用于基于包括视频数据的经编码表示的位流的用信号表示的性质确定视频解码器是否能够解码所述位流的装置,
其中所述位流符合视频译码规范且包括多个经译码视频序列CVS,且当所述用信号表示的性质具有特定值时,所述位流的所有所述CVS符合同一简档,所述简档是由所述视频译码规范指定的整个位流语法的子集;以及用于基于所述确定处理所述位流的装置。
51.一种具有存储于其上的指令的非暂时性计算机可读数据存储媒体,所述指令当执行时配置视频解码器以:
基于包括视频数据的经编码表示的位流的用信号表示的性质确定视频解码器是否能够解码所述位流,
其中所述位流符合视频译码规范且包括多个经译码视频序列CVS,且当所述用信号表示的性质具有特定值时,所述位流的所有所述CVS符合同一简档,所述简档是由所述视频译码规范指定的整个位流语法的子集;以及基于所述确定处理所述位流。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261705047P | 2012-09-24 | 2012-09-24 | |
US61/705,047 | 2012-09-24 | ||
US201261707612P | 2012-09-28 | 2012-09-28 | |
US61/707,612 | 2012-09-28 | ||
US14/034,172 US9161039B2 (en) | 2012-09-24 | 2013-09-23 | Bitstream properties in video coding |
US14/034,172 | 2013-09-23 | ||
PCT/US2013/061337 WO2014047613A1 (en) | 2012-09-24 | 2013-09-24 | Bitstream properties in video coding |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104813671A true CN104813671A (zh) | 2015-07-29 |
CN104813671B CN104813671B (zh) | 2016-12-07 |
Family
ID=50338853
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380049105.XA Active CN104813671B (zh) | 2012-09-24 | 2013-09-24 | 用于处理视频数据的方法和设备 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9161039B2 (zh) |
EP (1) | EP2898698B1 (zh) |
JP (1) | JP5973077B2 (zh) |
KR (1) | KR101652208B1 (zh) |
CN (1) | CN104813671B (zh) |
WO (1) | WO2014047613A1 (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108141613A (zh) * | 2015-10-20 | 2018-06-08 | 英特尔公司 | 利用后处理指示的视频译码的方法和系统 |
CN109155877A (zh) * | 2016-05-23 | 2019-01-04 | 高通股份有限公司 | 分开的文件轨中的序列结束及位流结束网络抽象层(nal)单元 |
CN109644282A (zh) * | 2016-08-24 | 2019-04-16 | 高通股份有限公司 | 用于媒体数据流式处理的补充增强信息轨迹的系统级发信 |
CN110178379A (zh) * | 2017-01-10 | 2019-08-27 | 高通股份有限公司 | 以文件格式用信号表示重要视频信息 |
CN110446047A (zh) * | 2019-08-16 | 2019-11-12 | 苏州浪潮智能科技有限公司 | 视频码流的解码方法及装置 |
CN111837396A (zh) * | 2018-04-03 | 2020-10-27 | 华为技术有限公司 | 基于子图像码流视角相关视频编码中的误差抑制 |
CN112771885A (zh) * | 2018-09-18 | 2021-05-07 | 诺基亚技术有限公司 | 用于针对视频编码的非二进制简档约束信令的方法和装置 |
CN114205626A (zh) * | 2020-09-17 | 2022-03-18 | 脸萌有限公司 | 视频操作点记录语法和语义 |
CN114556916A (zh) * | 2019-10-12 | 2022-05-27 | 北京字节跳动网络技术有限公司 | 视频编解码工具的高级语法 |
CN115104306A (zh) * | 2020-02-24 | 2022-09-23 | 高通股份有限公司 | 在视频译码中共享的信令约束和序列参数集 |
US12034964B2 (en) | 2019-02-14 | 2024-07-09 | Beijing Bytedance Network Technology Co., Ltd | Selective application of decoder side refining tools |
US12081767B2 (en) | 2019-02-03 | 2024-09-03 | Beijing Bytedance Network Technology Co., Ltd | Interaction between MV precisions and MV difference coding |
Families Citing this family (79)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9992490B2 (en) | 2012-09-26 | 2018-06-05 | Sony Corporation | Video parameter set (VPS) syntax re-ordering for easy access of extension parameters |
US20140092992A1 (en) * | 2012-09-30 | 2014-04-03 | Microsoft Corporation | Supplemental enhancement information including confidence level and mixed content information |
US10419778B2 (en) * | 2013-01-04 | 2019-09-17 | Sony Corporation | JCTVC-L0227: VPS_extension with updates of profile-tier-level syntax structure |
US10219006B2 (en) | 2013-01-04 | 2019-02-26 | Sony Corporation | JCTVC-L0226: VPS and VPS_extension updates |
RU2616185C2 (ru) * | 2013-01-18 | 2017-04-13 | Кэнон Кабусики Кайся | Способ, устройство и компьютерная программа для инкапсуляции сегментированных синхронизированных мультимедийных данных |
HUE043713T2 (hu) * | 2013-03-29 | 2019-09-30 | Intel Ip Corp | Minõségtudatos sebességillesztési technikák DASH streameléshez |
US20140372569A1 (en) * | 2013-06-14 | 2014-12-18 | Samsung Electronics Co., Ltd. | Controlling dash client rate adaptation |
CN106210746B (zh) * | 2013-07-12 | 2019-10-11 | 索尼公司 | 图像解码装置和方法 |
US10419801B2 (en) * | 2013-07-22 | 2019-09-17 | Sony Corporation | Information processing apparatus and method |
US20150049105A1 (en) * | 2013-08-13 | 2015-02-19 | Mediatek Inc. | Data processing apparatus for transmitting/receiving indication information of pixel data grouping setting via display interface and related data processing method |
GB2519745B (en) * | 2013-10-22 | 2018-04-18 | Canon Kk | Method of processing disordered frame portion data units |
US10321141B2 (en) * | 2013-12-18 | 2019-06-11 | Hfi Innovation Inc. | Method and apparatus for palette initialization and management |
CN110225345B (zh) | 2013-12-27 | 2022-07-19 | 寰发股份有限公司 | 用于主颜色索引图编码的方法及装置 |
US10182242B2 (en) | 2013-12-27 | 2019-01-15 | Mediatek Inc. | Method and apparatus for palette coding with cross block prediction |
CN105981388B (zh) | 2013-12-27 | 2019-05-10 | 寰发股份有限公司 | 调色板编码中句法冗余移除的方法和装置 |
US20150195554A1 (en) * | 2014-01-03 | 2015-07-09 | Sharp Laboratories Of America, Inc. | Constraints and enhancements for a scalable video coding system |
EP3061247A1 (en) | 2014-01-07 | 2016-08-31 | MediaTek Inc. | Method and apparatus for color index prediction |
JP2015136059A (ja) | 2014-01-17 | 2015-07-27 | ソニー株式会社 | 通信装置、通信データ生成方法、および通信データ処理方法 |
WO2015140401A1 (en) * | 2014-03-17 | 2015-09-24 | Nokia Technologies Oy | An apparatus, a method and a computer program for video coding and decoding |
US20150264404A1 (en) * | 2014-03-17 | 2015-09-17 | Nokia Technologies Oy | Method and apparatus for video coding and decoding |
US9402083B2 (en) * | 2014-04-24 | 2016-07-26 | Vidyo, Inc. | Signaling conformance points using profile space |
US9712871B2 (en) * | 2014-05-01 | 2017-07-18 | Qualcomm Incorporated | Determination bitstream decoding capability in video coding |
US9813719B2 (en) | 2014-06-18 | 2017-11-07 | Qualcomm Incorporated | Signaling HRD parameters for bitstream partitions |
CN104093028B (zh) * | 2014-06-25 | 2019-02-01 | 中兴通讯股份有限公司 | 一种设备能力协商的方法和装置 |
EP3163570A4 (en) * | 2014-06-30 | 2018-02-14 | Sony Corporation | Information processor and information-processing method |
US20170127073A1 (en) * | 2014-06-30 | 2017-05-04 | Sony Corporation | Information processing device and method |
CN106664445B (zh) * | 2014-08-07 | 2020-04-21 | 索尼公司 | 发送设备、发送方法和接收设备 |
US20160112724A1 (en) * | 2014-10-15 | 2016-04-21 | Qualcomm Incorporated | Hrd descriptor and buffer model of data streams for carriage of hevc extensions |
US9930378B2 (en) | 2015-02-11 | 2018-03-27 | Qualcomm Incorporated | Signaling of operation points for carriage of HEVC extensions |
US10129566B2 (en) | 2015-03-16 | 2018-11-13 | Microsoft Technology Licensing, Llc | Standard-guided video decoding performance enhancements |
US9979983B2 (en) | 2015-03-16 | 2018-05-22 | Microsoft Technology Licensing, Llc | Application- or context-guided video decoding performance enhancements |
US20170091896A1 (en) * | 2015-09-30 | 2017-03-30 | Samsung Display Co., Ltd. | Independent multi-source display device |
WO2017140685A1 (en) | 2016-02-16 | 2017-08-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient adaptive streaming |
CN107395950B (zh) * | 2016-05-16 | 2021-11-09 | 西安电子科技大学 | 媒体数据处理方法和装置及系统 |
US11166027B2 (en) | 2016-06-10 | 2021-11-02 | Apple Inc. | Content adaptation for streaming |
ES2963845T3 (es) | 2016-07-14 | 2024-04-02 | Koninklijke Kpn Nv | Codificación de vídeo |
CN115037917A (zh) | 2016-10-12 | 2022-09-09 | 弗劳恩霍夫应用研究促进协会 | 空间不均等流媒体化 |
US10805611B2 (en) * | 2016-10-18 | 2020-10-13 | Mediatek Inc. | Method and apparatus of constrained sequence header |
CN110115034B (zh) * | 2016-12-23 | 2023-01-13 | 华为技术有限公司 | 一种用于扩展预定定向帧内预测模式集合的帧内预测装置 |
GB2594615B (en) * | 2017-03-20 | 2022-11-30 | Canon Kk | Method and apparatus for encoding and transmitting at least a spatial part of a video sequence |
CN108965894B (zh) * | 2017-05-27 | 2021-12-21 | 华为技术有限公司 | 一种视频图像的编解码方法及装置 |
CN117336496A (zh) * | 2017-10-06 | 2024-01-02 | 松下电器(美国)知识产权公司 | 编码装置、解码装置以及非暂时性计算机可读介质 |
CN110035331B (zh) | 2018-01-12 | 2021-02-09 | 华为技术有限公司 | 一种媒体信息的处理方法及装置 |
JP7104485B2 (ja) * | 2018-02-20 | 2022-07-21 | フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. | 変動する解像度をサポートしかつ/または領域単位パッキングを効率的に処理するピクチャ/ビデオコーディング |
US11381621B2 (en) | 2018-04-11 | 2022-07-05 | Samsung Electronics Co., Ltd. | Device and method for processing data in multimedia system |
MX2020013864A (es) | 2018-06-21 | 2021-03-25 | Ericsson Telefon Ab L M | Particiones de mosaicos con sub-mosaicos en codificacion de video. |
CN112585970B (zh) | 2018-06-21 | 2024-07-09 | 瑞典爱立信有限公司 | 灵活图块分区 |
WO2019243534A1 (en) | 2018-06-21 | 2019-12-26 | Telefonaktiebolaget Lm Ericsson (Publ) | Tile shuffling for 360 degree video decoding |
US11196789B2 (en) * | 2018-09-20 | 2021-12-07 | Panasonic Intellectual Property Management Co., Ltd. | Recording device and recording method |
CN112823525A (zh) * | 2018-10-02 | 2021-05-18 | 瑞典爱立信有限公司 | 基于图块组id对图片进行编码和解码 |
US11310516B2 (en) * | 2018-12-21 | 2022-04-19 | Hulu, LLC | Adaptive bitrate algorithm with cross-user based viewport prediction for 360-degree video streaming |
MX2021007841A (es) | 2018-12-29 | 2021-10-26 | Huawei Tech Co Ltd | Metodo y aparato para intra-prediccion. |
US11032574B2 (en) * | 2018-12-31 | 2021-06-08 | Tencent America LLC | Method and apparatus for video coding |
AU2019419322B2 (en) * | 2018-12-31 | 2023-11-23 | Huawei Technologies Co., Ltd. | Method and apparatus of cross-component linear modeling for intra prediction |
US11570435B2 (en) * | 2019-01-16 | 2023-01-31 | Telefonaktiebolaget Lm Ericsson (Publ) | Video coding comprising uniform tile split with remainder |
KR20210122850A (ko) * | 2019-02-08 | 2021-10-12 | 샤프 가부시키가이샤 | 비디오 코딩 장치 및 비디오 디코딩 장치 |
US11272158B2 (en) * | 2019-03-01 | 2022-03-08 | Tencent America LLC | Method and apparatus for point cloud compression |
TWI826969B (zh) * | 2019-03-11 | 2023-12-21 | 弗勞恩霍夫爾協會 | 具輪廓與位階相依寫碼選項之編碼器與解碼器、編碼方法及解碼方法 |
CN113557744A (zh) * | 2019-03-11 | 2021-10-26 | 华为技术有限公司 | 视频译码中的分块级滤波 |
US12096032B2 (en) * | 2019-06-24 | 2024-09-17 | Interdigital Vc Holdings, Inc. | Method and apparatus for signaling decoding data using high level syntax elements |
WO2021055138A1 (en) * | 2019-09-20 | 2021-03-25 | Alibaba Group Holding Limited | Quantization parameter signaling in video processing |
CN115209153B (zh) | 2019-09-24 | 2023-06-06 | 华为技术有限公司 | 编码器、解码器及对应方法 |
KR20220063279A (ko) * | 2019-09-24 | 2022-05-17 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 인코더 및 디코더, 참조 픽처 리샘플링 확장을 위한 인코딩 방법 및 디코딩 방법 |
AU2020321174A1 (en) | 2019-10-07 | 2022-04-28 | Huawei Technologies Co., Ltd. | DPB size based reference picture entry constraints |
US11375182B2 (en) | 2019-12-17 | 2022-06-28 | Hfi Innovation Inc. | Method and apparatus of constrained layer-wise video coding |
MX2022007897A (es) * | 2019-12-23 | 2022-09-26 | Lg Electronics Inc | Codificacion de imagen o video basada en informacion asociada a la unidad nal. |
WO2021134015A1 (en) | 2019-12-26 | 2021-07-01 | Bytedance Inc. | Profile, tier and layer indication in video coding |
EP4062634A4 (en) | 2019-12-26 | 2022-12-28 | ByteDance Inc. | LIMITATIONS ON SIGNALING HYPOTHETICAL REFERENCE DECODER PARAMETERS IN VIDEO BITSTREAMS |
CN114902567A (zh) * | 2019-12-27 | 2022-08-12 | 字节跳动有限公司 | 视频编解码中的子图像信令 |
EP4074052A4 (en) | 2020-01-09 | 2023-05-31 | ByteDance Inc. | PROCESSING OF FILLER DATA UNITS IN VIDEO STREAMS |
WO2021145669A1 (ko) * | 2020-01-13 | 2021-07-22 | 엘지전자 주식회사 | 영상/비디오 코딩 시스템에서 인터 예측 방법 및 장치 |
US11516469B2 (en) | 2020-03-02 | 2022-11-29 | Tencent America LLC | Loop filter block flexible partitioning |
US11943429B2 (en) * | 2020-03-04 | 2024-03-26 | Qualcomm Incorporated | Subpicture signaling in video coding |
US11706428B2 (en) | 2020-04-06 | 2023-07-18 | Tencent America LLC | Method for signaling picture header in coded video stream |
CN114073098B (zh) * | 2020-04-28 | 2023-04-25 | Vidaa(荷兰)国际控股有限公司 | 流媒体同步方法及显示设备 |
US11523137B2 (en) * | 2020-06-09 | 2022-12-06 | FG Innovation Company Limited | Device and method for decoding video data using general constraints information |
US11503342B2 (en) * | 2020-06-10 | 2022-11-15 | Sharp Kabushiki Kaisha | Systems and methods for signaling sequence parameter information in video coding |
US11792433B2 (en) * | 2020-09-28 | 2023-10-17 | Sharp Kabushiki Kaisha | Systems and methods for signaling profile and level information in video coding |
US11575941B2 (en) * | 2021-03-23 | 2023-02-07 | Tencent America LLC | Parallel processing in video coding |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1666195A (zh) * | 2002-04-29 | 2005-09-07 | 索尼电子有限公司 | 支持媒体文件中的高级编码格式 |
US20070076799A1 (en) * | 2005-10-05 | 2007-04-05 | Broadcom Corporation | Determination of decoding information |
US20080310500A1 (en) * | 2003-12-09 | 2008-12-18 | Winger Lowell L | Method for activation and deactivation of infrequently changing sequence and picture parameter sets |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080253467A1 (en) | 2007-04-13 | 2008-10-16 | Nokia Corporation | System and method for using redundant pictures for inter-layer prediction in scalable video coding |
WO2010143853A2 (ko) * | 2009-06-07 | 2010-12-16 | 엘지전자 주식회사 | 비디오 신호의 디코딩 방법 및 장치 |
US8948241B2 (en) * | 2009-08-07 | 2015-02-03 | Qualcomm Incorporated | Signaling characteristics of an MVC operation point |
HUE037388T2 (hu) | 2009-10-20 | 2018-08-28 | Ericsson Telefon Ab L M | Kiegészítõ feldolgozási információ biztosítása |
US9131033B2 (en) * | 2010-07-20 | 2015-09-08 | Qualcomm Incoporated | Providing sequence data sets for streaming video data |
TWI587693B (zh) | 2011-06-30 | 2017-06-11 | 微軟技術授權有限責任公司 | 用於減少視訊編碼及解碼中之延遲的方法、系統及電腦可讀取媒體 |
KR101649207B1 (ko) | 2011-08-31 | 2016-08-19 | 노키아 테크놀로지스 오와이 | 멀티뷰 비디오 코딩 및 디코딩을 위한 방법, 장치 및 컴퓨터 프로그램 |
EP2834970B1 (en) * | 2012-04-06 | 2017-07-05 | Vidyo, Inc. | Level signaling for layered video coding |
-
2013
- 2013-09-23 US US14/034,172 patent/US9161039B2/en active Active
- 2013-09-24 CN CN201380049105.XA patent/CN104813671B/zh active Active
- 2013-09-24 JP JP2015533271A patent/JP5973077B2/ja not_active Expired - Fee Related
- 2013-09-24 KR KR1020157010473A patent/KR101652208B1/ko active IP Right Grant
- 2013-09-24 WO PCT/US2013/061337 patent/WO2014047613A1/en active Application Filing
- 2013-09-24 EP EP13771733.6A patent/EP2898698B1/en not_active Not-in-force
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1666195A (zh) * | 2002-04-29 | 2005-09-07 | 索尼电子有限公司 | 支持媒体文件中的高级编码格式 |
US20080310500A1 (en) * | 2003-12-09 | 2008-12-18 | Winger Lowell L | Method for activation and deactivation of infrequently changing sequence and picture parameter sets |
US20070076799A1 (en) * | 2005-10-05 | 2007-04-05 | Broadcom Corporation | Determination of decoding information |
Non-Patent Citations (1)
Title |
---|
ITU-T: "Advanced video coding for generic audiovisual services", 《TELECOMMUNICATION STANDARDIZATION SECTOR OF ITU H.264》 * |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108141613A (zh) * | 2015-10-20 | 2018-06-08 | 英特尔公司 | 利用后处理指示的视频译码的方法和系统 |
US10798422B2 (en) | 2015-10-20 | 2020-10-06 | Intel Corporation | Method and system of video coding with post-processing indication |
CN109155877A (zh) * | 2016-05-23 | 2019-01-04 | 高通股份有限公司 | 分开的文件轨中的序列结束及位流结束网络抽象层(nal)单元 |
CN109155877B (zh) * | 2016-05-23 | 2021-09-21 | 高通股份有限公司 | 产生、处理用于存储视频内容的文件的方法、装置及存储介质 |
CN109644282A (zh) * | 2016-08-24 | 2019-04-16 | 高通股份有限公司 | 用于媒体数据流式处理的补充增强信息轨迹的系统级发信 |
CN109644282B (zh) * | 2016-08-24 | 2021-10-15 | 高通股份有限公司 | 用于媒体数据流式处理的补充增强信息轨迹的系统级发信 |
CN110178379A (zh) * | 2017-01-10 | 2019-08-27 | 高通股份有限公司 | 以文件格式用信号表示重要视频信息 |
CN110178379B (zh) * | 2017-01-10 | 2022-01-11 | 高通股份有限公司 | 以文件格式用信号表示重要视频信息的方法和设备 |
CN111837396A (zh) * | 2018-04-03 | 2020-10-27 | 华为技术有限公司 | 基于子图像码流视角相关视频编码中的误差抑制 |
US12075029B2 (en) | 2018-04-03 | 2024-08-27 | Huawei Technologies Co., Ltd. | Bitstream signaling of error mitigation in sub-picture bitstream based viewport dependent video coding |
US11575886B2 (en) | 2018-04-03 | 2023-02-07 | Huawei Technologies Co., Ltd. | Bitstream signaling of error mitigation in sub-picture bitstream based viewport dependent video coding |
US12003701B2 (en) | 2018-04-03 | 2024-06-04 | Huawei Technologies Co., Ltd. | File format signaling of error mitigation in sub-picture bitstream based viewport dependent video coding |
US11917130B2 (en) | 2018-04-03 | 2024-02-27 | Huawei Technologies Co., Ltd. | Error mitigation in sub-picture bitstream based viewpoint dependent video coding |
CN111837396B (zh) * | 2018-04-03 | 2023-05-09 | 华为技术有限公司 | 基于子图像码流视角相关视频编码中的误差抑制 |
CN112771885A (zh) * | 2018-09-18 | 2021-05-07 | 诺基亚技术有限公司 | 用于针对视频编码的非二进制简档约束信令的方法和装置 |
CN112771885B (zh) * | 2018-09-18 | 2023-04-25 | 诺基亚技术有限公司 | 用于针对视频编码的非二进制简档约束信令的方法和装置 |
US12081767B2 (en) | 2019-02-03 | 2024-09-03 | Beijing Bytedance Network Technology Co., Ltd | Interaction between MV precisions and MV difference coding |
US12034964B2 (en) | 2019-02-14 | 2024-07-09 | Beijing Bytedance Network Technology Co., Ltd | Selective application of decoder side refining tools |
CN110446047A (zh) * | 2019-08-16 | 2019-11-12 | 苏州浪潮智能科技有限公司 | 视频码流的解码方法及装置 |
US11689747B2 (en) | 2019-10-12 | 2023-06-27 | Beijing Bytedance Network Technology Co., Ltd | High level syntax for video coding tools |
CN114556916B (zh) * | 2019-10-12 | 2023-11-17 | 北京字节跳动网络技术有限公司 | 视频编解码工具的高级语法 |
CN114556916A (zh) * | 2019-10-12 | 2022-05-27 | 北京字节跳动网络技术有限公司 | 视频编解码工具的高级语法 |
CN115104306A (zh) * | 2020-02-24 | 2022-09-23 | 高通股份有限公司 | 在视频译码中共享的信令约束和序列参数集 |
CN115104306B (zh) * | 2020-02-24 | 2023-05-30 | 高通股份有限公司 | 在视频译码中共享的信令约束和序列参数集 |
CN114205626B (zh) * | 2020-09-17 | 2023-12-01 | 脸萌有限公司 | 视频操作点记录语法和语义 |
CN114205626A (zh) * | 2020-09-17 | 2022-03-18 | 脸萌有限公司 | 视频操作点记录语法和语义 |
US11877011B2 (en) | 2020-09-17 | 2024-01-16 | Lemon Inc. | Picture dimension indication in decoder configuration record |
US11831921B2 (en) | 2020-09-17 | 2023-11-28 | Lemon Inc. | Video operating points record syntax and semantics |
Also Published As
Publication number | Publication date |
---|---|
EP2898698A1 (en) | 2015-07-29 |
JP5973077B2 (ja) | 2016-08-23 |
WO2014047613A1 (en) | 2014-03-27 |
KR20150063456A (ko) | 2015-06-09 |
US20140086333A1 (en) | 2014-03-27 |
EP2898698B1 (en) | 2016-07-20 |
KR101652208B1 (ko) | 2016-08-29 |
JP2015529439A (ja) | 2015-10-05 |
CN104813671B (zh) | 2016-12-07 |
US9161039B2 (en) | 2015-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104813671A (zh) | 视频译码中的位流性质 | |
KR101984368B1 (ko) | 하나 이상의 계층들을 포함하는 파티션과 연관된 프로파일, 티어 및 레벨에 기초하여 디코더의 능력을 결정하는 것에 의해 멀티-계층 비디오 데이터를 디코딩하기 위한 방법 및 디바이스 | |
RU2633100C2 (ru) | Применимость битового субпотока к вложенным sei-сообщениям при кодировании видео | |
CN105794212B (zh) | 一种处理多层视频数据的方法及装置 | |
JP6203852B2 (ja) | ビデオデータのためのファイルフォーマット | |
CN104509115A (zh) | 用于高效视频译码(hevc)和扩展的视频参数集 | |
KR20160070769A (ko) | 멀티-계층 비디오 코덱들에 대한 멀티-모드 추출의 지원 | |
CN104919802A (zh) | 在视频译码中的非嵌套式补充增强信息消息 | |
TW201515440A (zh) | 多層內容脈絡中之影像塊及波前處理 | |
CN105308971A (zh) | 假设的参考解码器模型和跨层随机存取跳过图片的一致性 | |
CN104054347A (zh) | 在视频译码中波前平行处理的使用的指示 | |
CN104471943A (zh) | 视频译码中的参数集 | |
KR101968425B1 (ko) | 비디오 코딩 확장본들의 캐리지를 위한 전송 스트림 | |
CN104798377A (zh) | 用于多视图、三维(3d)及可缩放视频位流的子位流提取 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |