CN104756500A - 向经编码视频的子层提供共同参数集 - Google Patents
向经编码视频的子层提供共同参数集 Download PDFInfo
- Publication number
- CN104756500A CN104756500A CN201380052642.XA CN201380052642A CN104756500A CN 104756500 A CN104756500 A CN 104756500A CN 201380052642 A CN201380052642 A CN 201380052642A CN 104756500 A CN104756500 A CN 104756500A
- Authority
- CN
- China
- Prior art keywords
- value
- mark
- cvs
- sub
- sps
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/31—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
这里所公开的系统和方法可描述用于生成、接收和/或处理包括至少第一经编码视频流(CVS)的位流的系统和方法,第一CVS包括第一标志,该第一标志指示是在经编码视频序列中的多个子层中的每一个具有各自相应的子层参数集还是共同的子层参数集与多个子层相对应,其中每个子层与各自的时间标识符值相对应。
Description
对相关申请的交叉引用
本申请要求于2012年10月9日提交的、题为“Remapping BannedPicture Type when Disallowing Sub-Layers(当不允许子层时重新绘制被禁止的图像类型)”的美国临时专利申请No.61/711,721的权益,并且还要求题为“Processing of Pictures in Coded Video Streams(处理经编码视频流中的图像)”的美国临时专利申请No.61/712,831的权益,二者的全部内容被通过引用结合于此。
技术领域
本公开一般地涉及用信号表示是经编码视频序列(CVS)中的多个子层中的每一个均具有各自相应的子层参数集还是共同的子层参数集可被应用于多个子层。
背景技术
在提供视频程序的系统(比如,用户电视网络、互联网或数字视频播放器)中,能够提供视频服务或视频回放的设备包括输入并处理数字视频信号以向最终用户提供具有各等级的可用性和/或功能性的数字视频回放所必需的硬件和软件。该设备包括以下能力:接收或输入压缩格式的数字视频信号,其中这样的压缩可根据视频编码规范;对接收或输入的数字视频信号进行解压缩;以及输出经解压缩的视频信号。压缩形式的数字视频信号在这里指的是包含连续的经编码视频序列的位流(bitstream)。
经数字经编码视频流可由诸如机顶盒和电视之类的设备通过某种类型的传输信道来接收。在输出经数字经编码视频流的过程中,可能需要判定是经编码视频序列(CVS)中的多个子层中的每一个均具有各自相应的子层参数集还是共同的子层参数集可被应用于多个子层。
附图说明
参考附图能够更好地理解本公开的很多方面。附图中的组件不必按比例绘制,而是重点在于清楚地示出本公开的原则。
图1是示出了本公开的实施例可在其中实现的示例性环境的高层次框图。
图2A-2B是图1所描述的接收器和相关设备的实施例的框图,本公开的实施例可在其中实现。
图3是示出了本公开的实施例的流程图。
图4是示出了本公开的实施例的流程图。
发明内容
本公开的实施例描述了用于生成、接收和/或处理包括至少第一经编码视频流(CVS)的位流的方法和系统,第一CVS包括第一标志,该第一标志指示是在经编码视频序列中的多个子层中的每一个具有各自相应的子层参数集还是共同的子层参数集与多个子层相对应,其中每个子层与各自的时间标识符值相对应。
具体实施方式
在提供视频程序的系统(例如,用户电视网络、互联网或数字视频播放器)中,能够提供视频服务或视频回放的设备包括输入并处理数字视频信号以向终端用户提供具有各等级的可用性和/或功能性的数字视频回放所必需的硬件和软件。该设备包括以下能力:接收或输入压缩格式的数字视频信号,其中该压缩可根据视频编码规范;对接收或输入的数字视频信号进行解压缩;以及输出经解压缩的视频信号。压缩形式的数字视频信号在这里指的是包含连贯的经编码视频序列的位流。
HEVC规范(也称为Rec.“ITU-T H.265”)(2013年4月发布),被通过引用结合于此。在本公开的一些实施例中,位流可在接收器(例如,下面将详细描述的接收器200)处被接收。位流可包括连续的CVS。位流中的每个CVS具有相应的序列参数集(SPS),其包括视频可用性信息(VUI)。其他网络设备(例如,拼接器或数字程序插入器)可用其他CVS替换位流的部分。
视频编码标准可从NAL单元头部中导出时间标识符,其指示分层时间预测结构中的等级。这被引入以在不需要解析除了NAL单元头部之外的位流的其他部分的情况下获得时间可扩展性。
在某些情况下,解码的时间子层的数量可在一个CVS的解码过程中进行调整。在位流中子层转换可开始解码一些更高时间层的点的位置可由某些类型的图像的存在来指示,作为非限制性示例,在HEVC中,这些图像能够对应于时间子层访问(TSA)图像和逐步TSA(STSA)图像。在这样的图像的位置处,可以从解码第一时间子层转换到解码第二时间子层。
对应于CVS的子层参数可由诸如对应于该CVS的序列参数集(SPS)之类的参数集来提供。该SPS可被提供在位流中相应的CVS的RAP图像之前。
在一些实施例中,SPS可包括提供整个CVS的一致点而不是每个连续子层各自的一致点的标志。
作为非限制性示例,该标志可被表示为“sps_sub_layer_ordering info_present_flag(SPS子层排序信息存在标志)”以促进对本方法的描述,但是应该理解的是在替代的实施例中,其命名可以不同。具体地,为了便于说明,sps_sub_layerordering info_present_flag这里用诸如“第一标志”之类的名称来表示以促进本方法的描述,但是应该理解的是在替换实施例中,该标志的命名可以不同。该第一标志可针对每个经编码视频序列来用信号表示。
第一标志可用信号表示是CVS中的多个子层中的每一个均具有各自相应的子层参数集还是共同的子层参数集可被应用到多个子层。例如,子层参数集可包括解码器图像缓冲器(DPB)中的最大帧缓冲器数、最大重新排序图像数和最大延迟增加量。每个子层可对应于各自的时间标识符值,该时间标识符值是从NAL单元头部中提供的数据字段的值中导出的。在本公开的描述中,时间id(temporal id)、时间_id(temporal_id)和时间标识应被解释为是相同的。
位流中的每个经编码图像对应于包括一个或多个NAL单元的访问单元。至少一个NAL单元可对应于经编码图像的分片(或经编码分片)。每个NAL单元包括包含NAL单元类型的头部。多个NAL单元类型可分别对应于不同的分片类型。一些NAL单元类型可对应于不同于编码分片的信息。经编码图像可包括一个或多个经编码分片。当经编码分片对应于完全图像分辨率时,对应于经编码图像的访问单元可只包含一个经编码分片。
RAP图像是内部经编码图像(即,只包括经编码的内部分片)。多个单元类型分别对应于多个类型的RAP图像。一些内部图像可能不是RAP图像。开始CVS的RAP图像的NAL单元类型标识对应于该RAP图像的RAP图像的类型。
NAL单元头部可包括对应于“nuh_temporal_id_plus 1(nuh时间id加1)”的数据字段。nuh_temporal_id_plus 1的值减1可指定对应于NAL单元的时间标识符。因此,变量“TemporalId”可被被指定为:TemporalId=nuh_temporal_id_plus 1-1。
位流包括一个或多个连续的CVS。CVS中的每个AU对应于相应的经编码图像。CVS中的每个AU具有一个或多个NAL单元。一些NAL单元对应于经编码分片数据,而其他NAL单元不对应于经编码分片数据,而是可对应于例如参数集。对应于经编码分片数据的NAL单元被称为视频编码层(VCL)NAL单元,而其他NAL单元被称为非VCL NAL单元。
NAL单元可相应地对应于其净负荷中的某种类型的信息,并且标识NAL单元的头部中的这样的信息,以使得该净负荷是可识别的。AU的时间id可被称为对应于该图像的时间id。图像可认为属于与从NAL单元头部中提供的数据字段值中导出的相应的时间id值相对应的子层,其中该数据字段对应于时间id信息。
在本公开的一些实施例中,携带第一标志的参数集是序列参数集(SPS)。通过提供在对应于每个CVS的SPS的相应数据字段中的第一标志的值来将第一标志提供给位流中的每个CVS。当第一标志等于SPS中的第一值时,使用(或参考)该SPS的CVS的所有子层具有共同的子层参数集。当第一标志等于SPS中的第二值(所述第二值与第一值不同)时,使用(或参考)该SPS的CVS的每个子层具有各自的子层参数集。
在替代实施例中,当SPS中提供的第一标志等于第一值时,只有一个子层参数集被提供于SPS中。此外,当SPS中提供的第一标志不等于第一值时,一个或多个子层参数集被提供于SPS中。在后者的情况下,SPS中提供的一个或多个子层参数集中的每一个对应于各自的子层,每个子层由各自相应的时间id来标识。
每个时间id对应于CVS中各自的子层。在一些实施例中,每个相应的时间id或时间层可对应于CVS中相应的子层或时间子层。每个连续的时间id值对应于具有相同时间id值的连续的时间子层。
对应于参考图像的时间id值可以从预定值(例如,零)开始。对应于非参考图像的一个或多个时间id值可大于对应于参考图像的最大时间id值。
在一些实施例中,第一标志的各个值可指示在CVS中特定类型的视频编码层(VCL)NAL单元(例如,如HEVC规范中所规定的对应于TSA和STSA单元的NAL单元类型)的缺失或存在。此外,第一标志的第一值可指定TSA和STSA单元类型不应存在于CVS中,并且temporal_id_nesting_flag(时间id嵌套标志)被推断为等于预定值(比如,0)。temporal_id_nesting_flag可以是被提供在SPS中的数据字段。在替代实施例中,第一标志的值可针对所有CVS被限制为第一值,并且对应于TSA和STSA的NAL单元类型是不被许可的。
在一些实施例中,第一标志在位流的所有CVS中可被限制为第一值以指示从一个子层转换到CVS中的不同子层是不允许的。在替换实施例中,第一标志可对应于“sps_temporal_id_nesting_flag(SPS时间id嵌套标志)”,如HEVC规范中所规定的那样。在替换实施例中,第一标志可指示在位流的解码过程中是否忽略特定参数集。例如,特定参数集可对应于视频参数集(VPS),如HEVC规范中所规定的那样。
在一些实施例中,当第一标志具有对应于CVS的SPS中的第二值时,第一标志用信号表示在SPS中存在CVS的每个子层各自的子层参数集。在这种情况下,对应于CVS中的每个连续子层的子层参数集被提供在SPS中。当第一标志具有对应于CVS的SPS中的不是第二值的值时,其可用信号表示在SPS中存在CVS的单一子层参数集。
SPS包括对应于“sps_max_sub_layers_minus 1(SPS最大子层数减1)”的数据字段。sps_max_sub_layers_minus 1的值加1指定关于该SPS中提供的信息的每个CVS中可存在的时间子层的最大数量。根据诸如HEVC规范之类的视频编码规范,sps_max_sub_layers_minus 1的值可在具体范围内。
可标识最高时间子层的值的变量“HighestTid”被指定为等于sps_max_sub_layers_minus 1,除非HighestTid的值通过外部方式提供。SPS中提供的“sps_max_sub_layers_minus_1”的值加1可指定关于序列参数集的每个经编码视频序列中可存在的时间子层的最大数量。
在一些实施例中,SPS中提供的子层参数集可对应于数据字段“sps_max_num_reorder_pics(SPS最大重新排序图像数)”、“sps_max_dec_pic_buffering(SPS最大解码器图像缓冲量)”和“sps_max_latency_increase(SPS最大延迟增加量)”。
sps_max_num_reorder_pics[i]可指示当HighestTid等于i时,在解码顺序中在任意图像之前并且在输出顺序中紧随该图像之后的的最大允许图像数。sps_max_num_reorder_pics[i]的值可包括在某值(例如,0)到sps_max_dec_pic_buffering[i]的范围中。当i的值大于该值(例如,0)时,sps_max_num_reorder_pics[i]可大于或等于sps_max_num_reorder_pics[i-1]。对于i的每个值,sps_max_num_reorder_pics[i]的值可小于或等于vps_max_num_reorder_pics[i]。在一些实施例中,当第一标志等于第一值时,sps_max_num_reorder_pics[i]的值具有默认含义或值。
当sps_max_latency_increase[i]不等于某值(例如,0)时,MaxLatencyPictures(最大延迟图像)[i]的值可通过设置MaxLatencyPictures[i]等于sps_max_num_reorder_pics[i]+sps_max_latency_increase[i]来计算。当sps_max_latency_increase[i]不等于某值(例如,0)时,MaxLatencyPictures[i]的值指定当HighestTid等于i时,可在以输出顺序的经编码视频序列中的任意图像之前并且在解码顺序中在该图像之后的最大图像数。
当sps_max_latency_increase[i]等于某值(例如,0)时,没有相应的限制可被表述。sps_max_latency_increase[i]的值应在根据诸如HEVC规范之类的视频编码规范的特定范围中。对于i的每个值,sps_max_latency_increase[i]的值应小于或等于vps_max_latency_increase[i]。在一些实施例中,当第一标志等于第一值时,sps_max_latency_increase[i]具有默认含义或值。
特定CVS内的分片头包含对应于no_output_of_prior_pics_flag(在图像之前无输出标志)的数据字段。no_output_of_prior_pics_flag指定在对诸如IDR或BLA图像之类的RAP图像进行解码之后,如何处理解码的图像中先前被解码的图像。当从活动序列参数集中导出的pic_width_in_luma_samples(亮度样本中的图像宽度)或pic_height_in_luma_samples(亮度样本中的图像高度)或对应于HighestTid的解码的图像缓冲器的最大大小与从针对先前图像活动的序列参数集中导出的pic_width_in_luma_samples或pic_height_in_luma_samples或对应于HighestTid的解码图像缓冲器的最大大小不同时,解码器可推断(但不应该推断)no_output_of_prior_pics_flag等于1,而不管no_output_of_prior_pics_flag的实际值。no_output_of_prior_pics_flag的值的确定在在审的美国专利申请_____中进行了更详细的描述,其全部内容被通过引用结合于此。
图1是示出了本公开的一个或多个实施例可在其中运作的示例性环境的高层次框图。具体地,图1是示出了示例视频传输系统100的框图。在该示例中,视频传输系统100可包括头端110和一个或多个接收器200。在本公开的一些实施例中,接收器200可容纳视频解码器。接收器200可被耦合到通信网络或存储设备,并且接收、获取或被提供有对应于视频信号的位流。接收器200还可包括耦合到显示设备的输出视频端口。接收器200在接收或获取到包含位流(即,视频流)的视频程序时,即可通过输出视频端口设置并提供视频信号。在一些实施例中,当接收器获取或接收位流时,耦合到显示设备的视频端口的相应的物理输出时钟即可被设置并保持不变。在这里,位流还可被称为视频流。在一些实施例中,视频流可由调谐到提供视频程序的电视频道的接收器获取。
接收器200和头端110通过网络130来耦合。头端110和接收器200合作以向用于提供数字电视服务、视频点播(VOD)和付费收看(pay-per-view)以及其他数字服务(例如,音乐、互联网访问、贸易(例如,家庭购物)、IP电话(VoIP)和/或其他电话或数据服务)。
接收器200可以是单独的单元或被集成到另一设备(例如,显示设备140、个人计算机、个人数字助理(PDA)、移动电话等设备)中。换句话说,接收器200(这里也被称为数字接收器或处理设备或数字家庭通信终端(DHCT))可包括很多设备中的一个或设备的组合,这些设备例如是:机顶盒、具有通信能力的电视、蜂窝电话、个人数字助理(PDA)或其他计算机或基于计算机的设备或系统(例如,膝上型计算机和个人计算机等)。如上所述,接收器200可被耦合到显示设备140(例如,计算机显示器、电视机等),或者在一些实施例中,接收器200可包括(具有或不具有集成音频组件的)集成显示器。
接收器200可通过网络130从头端110接收包括以数字化视频信号的压缩表示(例如,HEVC位流)的数字视频信号的信号(视频、音频和/或其他数据),并通过网络130向头端110提供逆向信息。如下面进一步解释的那样,除其他组件之外,接收器200还包括视频解码器和可重新配置的解码图像缓冲器(DPB)。
数字电视服务通过相应的显示设备140来呈现,每个显示设备通常包括根据其类型来用隔行扫描视频信号或逐行扫描视频信号驱动的电视机。但是,显示设备140还可以是能够显示视频图像的任意其他设备,例如包括,计算机监视器、移动电话、游戏设备等。在一个实施例中,显示设备140被配置有音频组件(例如,扬声器),而在一些实现中,音频功能可由分离但通信地耦合到显示设备140和/或接收器200的设备提供。虽然被示为与显示设备140通信,但是接收器200可与从接收器200接收、存储和/或处理视频流或向接收器200提供或发送视频流或非压缩视频信号的其他设备进行通信。
头端110可包括一个或多个服务器设备(未示出)以向客户端设备(例如,接收器200)提供数字视频、音频以及其他类型的媒体或数据。头端110可通过有线和/或无线连接(例如,卫星或地面网络)从头端110外部的源或视频传输系统100接收内容,例如,从内容提供商接收内容。
头端110还包括一个或多个编码器(编码设备或压缩引擎)111(示出了一个)及体现为耦合到编码器111的一个或多个拼接器112(示出一个)的一个或多个视频处理设备。在一些实施例中,编码器111和拼接器112可共同位于同一设备中和/或同一场所中(例如,二者均在头端110中或其他地方),而在一些实施例中,编码器111和拼接器112可分布在视频传输系统100的不同位置中。例如,虽然被示为位于头端110,但在一些实施例中,编码器111和/或拼接器112可位于其他位置(例如,集线器或节点)处。
编码器111可提供由接收器200接收的位流的一个或多个CVS。其他网络设备(例如,拼接器112或数字程序插入器)可用具有不同相应参数集的一个或多个替换CVS来替代位流的多个部分。
图2A是接收器200的选定组件的示例性实施例。本领域普通技术人员应该理解,图2A所示的接收器200只是示意性的,并且不应被解释为暗含对本公开的范围的任何限制。
接收器200包括耦合到复用/解调系统204(为了简便起见,在这里简称为解复用器204)的通信接口202。解复用器204可包括MPEG-2传输解复用功能。当接收到数字位流时,解复用器204使得对应于想要的视频流的数据分组能够分离以供进一步处理。
解复用器204被耦合到总线205和媒体引擎206。在一个实施例中,媒体引擎206包括解码逻辑,该解码逻辑包括一个或多个相应的音频解码器208和视频解码器210。媒体引擎206还被耦合到总线205和媒体存储器212,在一个实施例中,后者包括用于临时存储经压缩(压缩图像缓冲器或位缓冲器,未示出)和/或重建的图像(解码的图像缓冲器或DPB213)的一个或多个相应的缓冲器。DPB 213包括多个存储装置215,该存储装置215的数量在从位流接收图像之前针对当前观看的频道来配置并固定。在一些实施例中,媒体存储器212的一个或多个缓冲器可位于其他存储器(例如,下面解释的存储器222)或组件中。
接收器200还包括耦合到总线205(虽然被示为单一总线,但是一个或多个总线被预期在实施例的范围内)的附加组件。例如,接收器200还包括时钟电路218,时钟电路218包括相位和/或频率锁环电路以从在视频流中接收的程序时钟参考(或PCR)锁定到系统时钟(STC)来协助解码和输出操作。明确的PTS/DTS值和(针对PTS和DTS的)推测的值与(由时钟电路218生成的)重建的STC相比较以辅助确定何时将缓冲的压缩图像提供给视频解码器210以用于解码(DTS)以及何时由视频解码器210将缓冲的解码的图像输出给显示和输出逻辑230以用于处理和后续在显示设备140上的呈现(PTS)。在一些实施例中,时钟电路218可包括用于相应的视频和音频解码操作及输出处理操作的多个(例如,独立或从属)电路。虽然在硬件电路的情境中进行描述,但是时钟电路218的一些实施例可被配置为软件(例如,虚拟时钟)或硬件和软件的组合。此外,在一些实施例中,时钟电路218是可编程的。
接收器200还可包括存储设备220(和存储器222中的相关联的控制逻辑以及一个或多个驱动器)以临时存储缓冲的媒体内容和/或更永久地存储记录的媒体内容。存储设备220可通过适当的接口(未示出)耦合到总线205,正如本领域普通技术人员应理解的那样。接收器200中的存储器222包括易失和/或非易失存储器,并且被配置为存储与操作系统(O/S)224及其他应用相关联的可执行指令或代码。
接收器200还被配置有显示和输出逻辑230,如上所述,其包括缩放器232、行缓冲器231以及一个或多个输出系统(例如,被配置为HDMI、DENC或本领域普通技术人员熟知的其他输出系统)233以处理经解码的图像并提供以在显示设备140上呈现(例如,显示)。在一些实施例中,缩放器232可被配置为一个或多个采样率转换器。
图2B示出了显示和输出逻辑230的一个实施例的框图。本领域普通技术人员应该理解,图2B所示的显示和输出逻辑230只是示意性的,并且不应被解释为暗含对本公开的范围的任何限制。例如,在一些实施例中,显示和输出逻辑230可包括所示组件的不同布置和/或未示出的附加组件,除在本公开的情境中本领域普通技术人员应该认识到的其他组件之外,还包括附加存储器、处理器、交换机、时钟电路、滤波器和/或采样器、图形流水线。
此外,虽然在图2A中在概念上被示为与媒体引擎206分离的实体,但在一些实施例中,显示和输出逻辑230的一个或多个功能可被合并在媒体引擎206中(例如,在单一芯片上),或在一些实施例中在其他地方。如上所述,在一个实施例中,显示和输出逻辑230包括缩放器232以及耦合到缩放器232和显示设备140的一个或多个输出系统233。
缩放器232可包括显示流水线,包括被配置为执行水平缩放的水平图像缩放电路(HPSC)240和被配置为执行垂直缩放的垂直图像缩放电路(VPSC)242。在一个实施例中,VPSC 242的输入被耦合到对应于被连接到HPSC 240的输出的一个或多个行缓冲器23l的内部存储器。行缓冲器231作为临时储存库存储器来影响缩放操作。
在一个实施例中,根据(under)同步视频定时和内部FIFO(未示出),重建的图像可从DPB中读取,并按照光栅扫描的顺序提供,通过缩放器232馈送以实现水平和/或垂直缩放,并且经缩放的图像根据从输出系统233导出的物理时钟(例如,在时钟电路218中或其他地方)的定时被提供(例如,在一些实施例中,通过诸如位于媒体存储器212中的显示缓冲器之类的中间介质)给输出端口233。在一些实施例中,垂直缩小可通过用忽略读取并显示选定视频图像行代替由VPSC 242处理来实现。在一些实施例中,当图像格式的垂直分辨率发生改变时,垂直缩小可通过处理每个图像的多个行的相应集合并将其转换为输出图像的相应输出行来针对例如采用整数抽样因子(例如,2∶1)的所有情况被实现。
本领域普通技术人员应该理解,接收器200可包括未示出的其他组件,包括解密器、采样器、数字化器(例如,模数转换器)、复用器、条件访问处理器和/或应用软件、驱动器软件、互联网浏览器等。此外,虽然逻辑228被示为位于存储器222中,但是应该理解的是该逻辑228的全部或部分可被合并到媒体引擎206、显示和输出系统230或其他地方中或被分布在存储引擎206、显示和输出系统230或其他地方之间。类似地,在一些实施例中,结合图2A所示或所述的一个或多个组件的功能可与另一组件结合为单一集成组件或设备。
在一个实施例中,根据同步视频时序和内部FIFO(未示出),重建图像可从DPB中读取,通过缩放器232馈送以获得产生由CVS所暗示的相同的平面跨度所必须的水平和/或垂直缩放。
图3是示出了本公开的实施例的流程图。方法300是用于处理在位流内接收到的第一标志的方法。方法300可开始于步骤310,其中位流被接收。该位流可包括至少第一经编码视频流(CVS)。第一CVS可包含第一标志。在一些实施例中,第一标志可位于对应于第一CVS的序列参数集(SPS)的相应的数据字段中。在一些实施例中,第一标志可对应于sps_temporal_id_nesting_flag。在一些实施例中,具体参数可对应于视频参数集(VPS)。
方法300可进行到步骤320,其中第一标志的值可被确定。如果第一标志的值等于第一值,则方法300可进行到步骤330。如果第一标志的值等于不同于第一值的第二值,则方法300可进行到步骤340。
此外,在一些实施例中,第一标志可指示CVS中特定类型的VSLNAL单元的缺失或存在。这些具体类型可包括对应于TSA和STSA单元类型的NAL单元类型。因此,第一标志的第一值可指定TSA和STSA单元类型不存在于CVS中。在本公开的一些实施例中,当对于所有CVS,第一标志的值均被限制为第一值时,方法300可拒绝许可对应于TSA和STSA的NAL单元类型。
在步骤330,第一标志的第一值可指示第一CVS中的多个子层中的每一个具有各自相应的子层参数集。在一些实施例中,当第一标志等于第一值时,sps_max_num_reorder_pics[i]具有默认值。另外,第一标志可指示在位流的解码过程中是否忽略具体参数集。
或者,在步骤340,第一标志的第二值可指示共同的子层参数集对应于多个子层,其中每个子层对应于各自的时间标识符值。在一些实施例中,一个或多个子层参数集中的每一个可对应于各自的子层。类似地,每个子层可由各自相应的时间id来标识。相应的时间id可从NAL单元头部中提供的数据字段的值中导出。
图4是示出了本公开的实施例的流程图。方法400是用于处理在位流内接收到的第一标志的方法。方法400可开始于步骤410,其中位流可被接收器(例如,接收器200)接收。该位流可包含具有多个图像的至少第一CVS。例如,位流可响应于在接收器200处的用户请求数字程序而被提供。第一CVS可携带相应的第一标志,例如,HEVC中的sps_temporal_id_nesting_flag。
方法400可进行到步骤420,其中第一标志的值可被确定。在一些实施例中,第一标志可被设置为至少第一值和不同于第一值的第二值。如果在步骤420,第一标志具有第一值,则方法400可进行到步骤430。如果在步骤420,第一标志具有第二值,则方法400可进行到步骤440。
在步骤430,方法400可用信号表示在SPS中存在第一CVS的每个子层各自的子层参数集。或者,在步骤440,方法400可用信号表示在SPS中存在整个第一CVS的单个子层参数集。例如,子层参数集可包括解码器图像缓冲器(DPB)中的最大帧缓冲器数、最大重新排序图像数以及最大延迟增加量。每个子层可对应于从NAL单元头部中提供的数据字段的值中导出的各自的时间标识符值。
虽然说明书已经针对其具体实施例进行了描述,但是这些具体实施例只是示意性不是限制性的。例如,虽然描述了具体应用,但是可以使所公开的实施例的特征适应其他应用。任意适当的编程语言(包括C、C++、Java、汇编语言等)可被用于实现具体实施例的例程。不同的编程技术(例如,程序化或面向对象的)可被采用。这些例程可在单个处理设备或多个处理器上执行。虽然步骤、操作或计算可以特定顺序被呈现,但是该顺序在一些实施例中可被改变。在一些实施例中,在本说明书中被示为连续的多个步骤可同时被执行。这里所述的操作的序列可被另一过程(例如,操作系统、内核等)打断、暂停或以其他方式进行控制。该程序可在操作系统环境中操作,或操作为占用系统处理的所有或大部分的单独程序。功能可在硬件、软件、或二者的结合中被执行。
在这里的描述中,提供了很多具体细节(例如,组件和/或方法的示例)以提供对具体实施例的全面理解。但是,相关领域的技术人员将认识到具体实施例可在没有一个或多个具体细节的情况下或用其他装置、系统、配件、方法、组件、材料、部分等来实现。在其他实例中,熟知的结构、材料或操作没有具体示出或详细描述以避免模糊具体实施例的方面。
具体实施例可通过使用编程的通用数字计算机,通过使用专用集成电路、可编程逻辑设备、现场可编程门阵列来实现,光的、化学的、生物的、量子的或纳米工程的系统、组件和机制可被使用。一般地,具体实施例的功能可通过本领域知晓的任意方式获得。分布式网络化的系统、组件和/或电路可被使用。数据的通信或传输可以是有线的、无线的或通过任意其他方式。
所示具体实施例的以上描述(包括摘要中所描述的)不意图是详尽的或将本发明限制在这里所公开的明确形式。而是在该精神和范围内可以实现各种等同修改的特定的具体实施例,如相关领域的技术人员将认识到的那样。如所指示的,这些修改可根据所示具体实施例的以上描述对本系统和方法做出并且要被包括在该精神和范围内。
因此,虽然各种系统和方法在这里参考其具体实施例进行了描述,但是一定范围的修改、各种改变和置换预期在以上公开中,并且将认识到的是在一些实例中,在不脱离所给出的范围和精神的情况下,具体实施例的一些特征将在没有其他特征的相应使用的情况下被采用。因此,很多修改可被做出以使具体情况或材料适应基本范围和精神。预期各种实施例不被限制在用于所附权利要求的具体条目和/或被公开为预期执行该系统和方法的最佳模式的具体实施例,但是某些实施例将包括任意和全部具体实施例以及落入所附权利要求的范围内的等同物。
Claims (20)
1.一种方法,包括:
接收包括至少第一经编码视频流(CVS)的位流,所述第一CVS包括第一标志,所述第一标志指示是所述第一CVS中的多个子层中的每一个具有各自相应的子层参数集还是共同的子层参数集对应于所述多个子层,其中每个子层与各自的时间标识符值相对应。
2.如权利要求1所述的方法,其中,所述第一标志的值位于与所述第一CVS的相对应的序列参数集(SPS)的相应的数据字段中。
3.如权利要求2所述的方法,其中,当所述第一标志等于第一值时,引用所述SPS的所述第一CVS的多个子层中的每一个均具有共同的子层参数集。
4.如权利要求2所述的方法,其中,当所述第一标志等于第二值时,使用(或引用)所述SPS的CVS的所有子层具有各自的子层参数集,所述第二值与所述第一值不同。
5.如权利要求2所述的方法,其中,当所述第一标志等于第一值时,只有一个子层参数集被提供于所述SPS中。
6.如权利要求5所述的方法,其中,当所述SPS中提供的所述第一标志不等于所述第一值时,一个或多个子层参数集被提供于所述SPS中。
7.如权利要求6所述的方法,其中,所述一个或多个子层参数集中的每一个与各自的子层相对应,并且每个子层由各自相应的时间id来标识。
8.如权利要求1所述的方法,其中,所述第一标志指示在所述CVS中具体类型的VCL NAL单元的缺失或存在。
9.如权利要求8所述的方法,其中,所述NAL单元类型对应于TSA和STSA单元类型。
10.如权利要求9所述的方法,其中,所述第一标志的第一值指定所述TSA和STSA单元类型不存在于所述CVS中。
11.如权利要求9所述的方法,还包括:当所述第一标志的值对于所有CVS均被限制为第一值时,拒绝许可与TSA和STSA相对应的NAL单元类型。
12.如权利要求9所述的方法,还包括:在所述位流的所有CVS中将所述第一标志的值限制为第一值,其中所述第一值指示在所述CVS中从一个子层转换到不同子层是不被许可的。
13.如权利要求1所述的方法,其中,所述第一标志对应于sps_temporal_id_nesting_flag。
14.如权利要求1所述的方法,其中,所述第一标志指示在所述位流的解码过程中具体参数集是否被忽略。
15.如权利要求14所述的方法,其中,所述具体参数集对应于所述视频参数集(VPS)。
16.如权利要求1所述的方法,其中,当所述第一标志等于第一值时,sps_max_num_reorder_pics[i]具有默认值。
17.如权利要求1所述的方法,还包括从NAL单元头部中提供的数据字段的值中导出各自的时间标识符值。
18.一种方法,包括:
接收包括与CVS相对应的第一标志的位流;
如果所述第一标志具有第二值,则用信号表示在SPS中存在所述CVS的每个子层各自的子层参数集;以及
当所述第一标志具有与所述第二值不同的值时,用信号表示在所述SPS中存在所述CVS的单一子层参数集。
19.如权利要求18所述的方法,其中,子层参数集包括:解码器图像缓冲器(DPB)中的最大帧缓冲器数、最大重新排序图像数以及最大延迟增长量。
20.一种系统,包括:
存储器;
处理器,被配置为执行存储在所述存储器中的步骤,所述步骤包括:
提供包括至少第一经编码视频流(CVS)的位流,所述第一CVS包括第一标志,所述第一标志指示是在经编码视频流中的多个子层中的每一个具有各自相应的子层参数集还是共同的子层参数集与所述多个子层中的每个相对应,其中每个子层与各自的时间标识符值相对应。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261711721P | 2012-10-09 | 2012-10-09 | |
US61/711,721 | 2012-10-09 | ||
US201261712831P | 2012-10-12 | 2012-10-12 | |
US61/712,831 | 2012-10-12 | ||
PCT/US2013/064182 WO2014059051A1 (en) | 2012-10-09 | 2013-10-09 | Providing a common set of parameters for sub-layers of coded video |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104756500A true CN104756500A (zh) | 2015-07-01 |
CN104756500B CN104756500B (zh) | 2018-07-17 |
Family
ID=49447851
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380052642.XA Active CN104756500B (zh) | 2012-10-09 | 2013-10-09 | 向经编码视频的子层提供共同参数集 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9992492B2 (zh) |
EP (1) | EP2907308B1 (zh) |
CN (1) | CN104756500B (zh) |
WO (1) | WO2014059051A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109565612A (zh) * | 2016-08-22 | 2019-04-02 | 索尼公司 | 发送装置、发送方法、接收装置和接收方法 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014059049A1 (en) | 2012-10-09 | 2014-04-17 | Rodriguez Arturo A | Output management of prior decoded pictures at picture format transitions in bitstreams |
KR20140092198A (ko) * | 2013-01-07 | 2014-07-23 | 한국전자통신연구원 | 계층적 비디오 부호화에서의 스케일러빌리티 정보 표현방식 |
US9819941B2 (en) * | 2013-10-10 | 2017-11-14 | Qualcomm Incorporated | Signaling for sub-decoded picture buffer (sub-DPB) based DPB operations in video coding |
US10264272B2 (en) * | 2013-10-15 | 2019-04-16 | Qualcomm Incorporated | Device and method for scalable coding of video information |
CN106664445B (zh) * | 2014-08-07 | 2020-04-21 | 索尼公司 | 发送设备、发送方法和接收设备 |
WO2021134015A1 (en) | 2019-12-26 | 2021-07-01 | Bytedance Inc. | Profile, tier and layer indication in video coding |
EP4062634A4 (en) * | 2019-12-26 | 2022-12-28 | ByteDance Inc. | LIMITATIONS ON SIGNALING HYPOTHETICAL REFERENCE DECODER PARAMETERS IN VIDEO BITSTREAMS |
CN114902567A (zh) | 2019-12-27 | 2022-08-12 | 字节跳动有限公司 | 视频编解码中的子图像信令 |
EP4074052A4 (en) | 2020-01-09 | 2023-05-31 | ByteDance Inc. | PROCESSING OF FILLER DATA UNITS IN VIDEO STREAMS |
CN115606187A (zh) * | 2020-03-23 | 2023-01-13 | Lg电子株式会社(Kr) | 基于混合nal单元类型的图像编码/解码方法和设备及存储比特流的记录介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1969549A (zh) * | 2004-04-16 | 2007-05-23 | 松下电器产业株式会社 | 记录介质,再现设备,程序 |
CN101180883A (zh) * | 2005-04-13 | 2008-05-14 | 诺基亚公司 | 用于有效地编码和解码视频数据的方法、设备和系统 |
WO2008047257A3 (en) * | 2006-10-20 | 2008-06-12 | Nokia Corp | System and method for providing picture output indications in video coding |
US20080317124A1 (en) * | 2007-06-25 | 2008-12-25 | Sukhee Cho | Multi-view video coding system, decoding system, bitstream extraction system for decoding base view and supporting view random access |
US7983499B2 (en) * | 1998-05-06 | 2011-07-19 | At&T Intellectual Property Ii, L.P. | Method and apparatus to prioritize video information during coding and decoding |
CN102685493A (zh) * | 2011-03-10 | 2012-09-19 | 微软公司 | 用于视频编码速率控制的平均决定差预测 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013109178A1 (en) * | 2012-01-20 | 2013-07-25 | Telefonaktiebolaget L M Ericsson (Publ) | Sub-bitstream extraction |
US9319703B2 (en) * | 2012-10-08 | 2016-04-19 | Qualcomm Incorporated | Hypothetical reference decoder parameter syntax structure |
WO2014059049A1 (en) | 2012-10-09 | 2014-04-17 | Rodriguez Arturo A | Output management of prior decoded pictures at picture format transitions in bitstreams |
US20140301477A1 (en) * | 2013-04-07 | 2014-10-09 | Sharp Laboratories Of America, Inc. | Signaling dpb parameters in vps extension and dpb operation |
-
2013
- 2013-10-09 WO PCT/US2013/064182 patent/WO2014059051A1/en active Application Filing
- 2013-10-09 US US14/050,304 patent/US9992492B2/en active Active
- 2013-10-09 EP EP13779711.4A patent/EP2907308B1/en active Active
- 2013-10-09 CN CN201380052642.XA patent/CN104756500B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7983499B2 (en) * | 1998-05-06 | 2011-07-19 | At&T Intellectual Property Ii, L.P. | Method and apparatus to prioritize video information during coding and decoding |
CN1969549A (zh) * | 2004-04-16 | 2007-05-23 | 松下电器产业株式会社 | 记录介质,再现设备,程序 |
CN101180883A (zh) * | 2005-04-13 | 2008-05-14 | 诺基亚公司 | 用于有效地编码和解码视频数据的方法、设备和系统 |
WO2008047257A3 (en) * | 2006-10-20 | 2008-06-12 | Nokia Corp | System and method for providing picture output indications in video coding |
US20080317124A1 (en) * | 2007-06-25 | 2008-12-25 | Sukhee Cho | Multi-view video coding system, decoding system, bitstream extraction system for decoding base view and supporting view random access |
CN102685493A (zh) * | 2011-03-10 | 2012-09-19 | 微软公司 | 用于视频编码速率控制的平均决定差预测 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109565612A (zh) * | 2016-08-22 | 2019-04-02 | 索尼公司 | 发送装置、发送方法、接收装置和接收方法 |
Also Published As
Publication number | Publication date |
---|---|
EP2907308B1 (en) | 2019-08-14 |
US20140098897A1 (en) | 2014-04-10 |
CN104756500B (zh) | 2018-07-17 |
US9992492B2 (en) | 2018-06-05 |
EP2907308A1 (en) | 2015-08-19 |
WO2014059051A1 (en) | 2014-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104756500A (zh) | 向经编码视频的子层提供共同参数集 | |
US10051269B2 (en) | Output management of prior decoded pictures at picture format transitions in bitstreams | |
RU2741507C1 (ru) | Устройство и способ для кодирования и декодирования видео | |
US10313417B2 (en) | Methods and systems for auto-zoom based adaptive video streaming | |
JP6038380B1 (ja) | 送信装置、送信方法、受信装置および受信方法 | |
RU2746934C2 (ru) | Межуровневое предсказание для масштабируемого кодирования и декодирования видеоинформации | |
EP2735166B1 (en) | Transmission of reconstruction data in a tiered signal quality hierarchy | |
RU2497302C2 (ru) | Методики кодирования и декодирования цифрового видео с переменным разрешением | |
US8416859B2 (en) | Signalling and extraction in compressed video of pictures belonging to interdependency tiers | |
JP2022050373A (ja) | 映像符号化におけるサブピクチャエンティティ | |
EP2642764B1 (en) | Transcoding a video stream to facilitate accurate display | |
JP2022050375A (ja) | サブピクチャトラックの参照および処理 | |
US20140003539A1 (en) | Signalling Information for Consecutive Coded Video Sequences that Have the Same Aspect Ratio but Different Picture Resolutions | |
CA2843718C (en) | Methods and systems for processing content | |
EP2868111A1 (en) | Signalling information for consecutive coded video sequences that have the same aspect ratio but different picture resolutions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |