WO2015096540A1

WO2015096540A1 - 码流的生成和处理方法、装置及系统

Info

Publication number: WO2015096540A1
Application number: PCT/CN2014/088677
Authority: WO
Inventors: 李明; 吴平; 尚国强; 谢玉堂
Original assignee: 中兴通讯股份有限公司
Priority date: 2013-12-27
Filing date: 2014-10-15
Publication date: 2015-07-02
Also published as: JP2017507522A; KR20160102490A; JP6285034B2; EP3089454A1; KR101882596B1; BR112016015000A2; CN104754358A; US10638141B2; CN104754358B; EP3089454A4; EP3713242A1; US20160323590A1

Abstract

一种码流的生成和处理方法、装置及系统。其中，该码流的生成方法，包括：根据应用需求判断是否需要对码流的整体和／或部分执行视频图像序号POC对齐操作；根据判断结果，将标识及控制信息写入上述码流，其中，上述标识及控制信息包括：是否对上述码流进行整体和／或部分POC对齐操作的指示信息，能够提高码流控制的灵活性。

Description

码流的生成和处理方法、装置及系统

技术领域

本发明涉及图像传输技术领域，具体而言，涉及一种码流的生成和处理方法、装置及系统。

背景技术

目前正在制定的基于高性能视频编码(H.265/High Efficiency Video Coding，HEVC)标准兼容的三维视频(Three-Dimensional Video，3DV)编码标准MV-HEVC(HEVC Multi-view video coding extension framework)、3D-HEVC(3D High Efficiency Video Coding)和可伸缩视频编码(Scalable video coding)中，采用了统一的高层结构设计。这个统一的设计结构基于“多层视频编码”的概念，将MV-HEVC和3D-HEVC的纹理分量(Texture Component)和深度分量(Depth Component)、可伸缩编码的不同可伸缩层均抽象为“层(Layer)”，并使用层表示序号(Layer Id)来标识不同的视点和可伸缩层。目前已发布的H.265/HEVC标准称为“H.265/HEVC Version 1”标准。

在多层视频编码中，同时刻获得的视频图像及其对应的编码比特组成一个接入单元(Access Unit，AU)。在同一个AU中，各层图像可使用不同的编码方法。这样，在同一个AU中，某层的图像可以是能够作为随机点的帧内编码随机接入(Intra Random Access Point，IRAP)图像，而其他某一个或多个层是普通的帧间、层间预测编码图像。在实际应用中，不同层可以根据网络传输状况、视频内容变换情况等选择各自的IRAP图像插入策略。例如，对于兼容H.265/HEVC的基本层视频图像可采用较高频次的IRAP图像插入策略，对增强层视频图像可采用频次较低的IRAP图像插入策略。这样，使用这种逐层(layer-wise)接入的多层视频编码结构，可以在不出现大的码率激增的情况下，保证多层视频编码码流的随机接入性能。

对于多层视频编码码流，其基本层(Base Layer，BL)码流必须符合H.265/HEVC Version 1标准的规范。即，多层视频编码码流必须保证根据H.265/HEVC Version 1标准设计的解码器能够正确解码从多层视频编码码流中提取出的BL码流。特别地，对于MV-HEVC和3D-HEVC，BL对应于基本视点(Base View)或独立视点(Independent View)，EL对应于增强视点(Enhancement View)或非独立视点(Dependent View)。实际应用中，可通过提取多层视频编码码流的方法，获得仅用于传统二维电视播放的基本视点码流、支持三维立体显示的双视点码流以及支持更加丰富三维立体显示的多视点码流。

在H.265/HEVC Version 1标准中，IRAP图像的类型有三种，分别是IDR(Instantaneous Decoding Refresh)图像、BLA(Broken Link Access)图像和CRA(Clean Random Access)图像。这三种图像均使用帧内(Intra)编码方式进行编码，其解码不依赖于其他图像。这三种图像类型的不同之处在于对视频图像序号(Picture Order Count，POC)和解码图像缓冲区(Decoded Picture Buffer，DPB)的操作。

POC是H.265/HEVC Version 1中用于标识图像播放顺序的序号。根据H.265/HEVC Version 1标准，图像的POC值由两部分组成。使用PicOrderCntVal表示图像的POC值，则PicOrderCntVal＝PicOrderCntMsb+PicOrderCntLsb。其中，PicOrderCntMsb是图像POC值的MSB(Most Significant Bit)取值，PicOrderCntLsb是图像POC值的LSB(Least Significant Bit)。通常情况下，PicOrderCntMsb的取值等于按解码顺序当前图像的前一个TemporalId等于0的图像的PicOrderCntMsb的取值，PicOrderCntLsb的取值等于分片(slice)头信息中的slice_pic_order_cnt_lsb字段的取值。slice_pic_order_cnt_lsb字段的比特数由序列参数集(Sequance Parameter Set，SPS)中的log2_max_pic_order_cnt_lsb_minus4确定，所需比特数等于log2_max_pic_order_cnt_lsb_minus4+4。

在H.265/HEVC Version 1中，若当前图像是IDR图像，则PicOrderCntMsb的取值将被置为0，分片头信息中不包含slice_pic_order_cnt_lsb字段，PicOrderCntLsb的取值默认为0。若当前图像是BLA图像，则PicOrderCntMsb的取值将被置为0，分片头信息中包含slice_pic_order_cnt_lsb字段用于确定PicOrderCntLsb的取值。若当前图像是CRA图像且标志位HandleCraAsBlaFlag的取值等于0，则使用通常方法计算POC；若当前图像是CRA图像且标志位HandleCraAsBlaFlag的取值等于1，则使用BLA图像的方法计算该CRA图像的POC值。

需要说明的是，在多层视频编码标准中，不论图像类型，增强层(Enhancement Layer，EL)的分片头信息中始终包含slice_pic_order_cnt_lsb字段。

在此基础上，对于多层视频编码码流，为保证在DPB控制过程中检测同时刻的图像，同时为方便解码器使用POC值在码流中确定各AU的起止位置，要求AU中所有图像均具有相同的POC值。对于layer-wise的编码结构，AU中可能同时包含有IRAP图像和非IRAP图像。这样，如果IRAP图像是IDR图像和BLA图像，则该AU中包含图像的POC值将不同。因此，需要为多层视频编码标准设计POC对齐(POC Alignment)功能以满足在layer-wise结构时AU中各图像可以具有相同的POC。

为解决这个问题，JCT-VC标准会议提案JCTVC-N0244中提出了一种POC对齐方法。该方法是用分片头信息中的预留比特，增加长度为1比特的poc_reset_flag字段。当该字段的取值等于1时，首先按照通常方法解码图像POC值，然后将DPB中同层(包括BL)中图像的POC值减少之前计算得到的POC值(即POC平移操作)，最后将该分片所在图像的POC值设置为0。

该方法的最主要缺点是其BL码流无法兼容H.265/HEVC Version 1标准，即不能保证符合H.265/HEVC Version 1标准的解码器能够解码从多层视频编码码流中抽取得到的BL码流。

为解决该兼容性问题，JCT-VC会议提案JCTVC-O0140和JCTVC-O0213提出在JCTVC-N0244的基础上，在需要进行POC对齐时，仅将POC中的MSB置为0。进一步，JCTVC-O0213中增加了POC对齐的延迟操作选项，以应对携带有重置POC值的标志位的分片丢失和帧率不同的应用情况。JCTVC-O0176提出在IDR图像时直接进行POC对齐，而不是用显式的分片头标志位，并且在BL码流的IDR图像分片头中增加预留比特，用于计算若该图像是CRA图像而非IDR图像时的POC值，该计算得到的POC值用于EL层DPB中存储图像的POC平移操作。JCTVC-O0275提出了一种layer POC的概念，对于EL层图像，维护两套不同的POC。其中，Layer POC为不使用POC对齐条件下得到的POC值，该值用于参考图像集(Reference Picture Set，RPS)等解码算法的相关操作；另外一套是经过POC对齐处理的POC，该POC与同AU中BL图像的POC值一致，该POC值用于控制图像的输出、播放过程。JCTVC-O0275提出的方法在进行POC对齐过程中使用BL的信息，且POC对齐过程的触发使用编解码器内部维护的变量标志位，该标志位的取值与BL层图像类型相关。

对于多层视频，多数情况下需要进行POC对齐，使得同AU中包含的层的图像具有相同的POC值，以便利图像输出控制、AU边界检测等操作。尽管如此，对于某些应用，并不需要进行POC对齐。例如，非协调的联播(uncoordinated simulcast)中，由于某段时间内仅适用BL或单独某个EL层的视频码流，这种情况下，在这段码流中不需要使用POC对齐；如果对联播码流进行抽取、编辑和重组时，产生码流的过程中也不需要使用POC对齐。另外，对于混合可伸缩视频编码(hybrid scalable video coding)，其BL和EL使用不同的视频编码标准进行编码，由于不同编码标准使用不同的POC系统和基于POC的图像输出控制操作方式，因此，在混合可伸缩视频编码下，也可以不需要使用POC对齐操作。另外，对于多层视频编码码流，可以通过系统层或媒体文件打包时增加的时间标记信息来实现将同时刻采集得到的图像的在播放时间上进行对齐，此时，不需要对视频码流进行POC对齐。

由此可见，由于JCTVC-N0244以BL信息或预测结构信息隐含推导执行POC对齐操作的方法中不使用显式的POC对齐操作标志位。当预测结构满足一定条件时，即执行POC对齐操作。在不需要执行POC对齐操作时，无法对POC对齐操作进行局部和/或整体地关闭。

发明内容

针对相关技术中的上述问题，本发明提供了一种码流的生成和处理方法、装置及系统，以至少解决上述问题。

根据本发明的一个实施例提供了一种码流的生成方法，包括：根据应用需求判断是否需要对码流的整体和/或部分执行视频图像序号POC对齐操作；根据判断结果，将标识及控制信息写入所述码流，其中，所述标识及控制信息包括：是否对所述码流进行整体和/或部分POC对齐操作的指示信息。

优选地，所述标识及控制信息位于所述码流中的参数集所在的字段，用于指示所述码流中使用所述标识及控制信息所在的参数集的全部和/或部分图像是否执行POC对齐操作。

优选地，所述参数集包括以下至少之一：视频参数集VPS、序列参数集SPS、图像参数集PPS。

优选地，如果多个所述参数集中都包含有指示是否执行POC对齐操作的标识及控制信息，则根据参数集之间的引用关系，当前参数集中的指示是否执行POC对齐操作的标识及控制信息覆盖被其直接和/或间接引用的参数集中对应的指示是否执行POC对齐操作的标识及控制信息。

优选地，所述标识及控制信息位于所述码流中除参数集字段之外的其他至少作用于图像层的数据结构对应的字段，用于指示所述码流的所述数据结构有效作用范围内的全部和/或部分图像是否执行POC对齐操作。

优选地，所述标识及控制信息位于所述码流中补充增强辅助信息SEI所在字段，用于指示该SEI信息有效范围内的所述码流中的全部和/或部分图像是否执行POC对齐操作。

优选地，所述标识及控制信息位于所述码流的系统层用于描述视频媒体属性的字段，用于指示包含在系统码流中的所述码流的全部和/或部分图像是否执行POC对齐操作。

优选地，所述标识及控制信息位于所述码流的媒体文件中用于描述视频媒体属性的字段，用于指示包含在所述媒体文件中的所述码流的全部和/或部分图像是否执行POC对齐操作。

优选地，所述标识及控制信息还包括：开启或关闭POC对齐操作的起始图像位置信息和/或开启或关闭POC对齐操作的终止图像位置信息；在将所述标识及控制信息写入所述码流之前，所述方法还包括：根据预测结构和应用需求，确定开启和/或关闭POC对齐操作的一段按照图像播放顺序或图像解码顺序连续的图像的起始和/或终止位置。

根据本发明的另一个实施例，提供了一种码流的生成装置，包括：判断模块，设置为根据应用需求判断是否需要对码流的整体和/或部分执行视频图像序号POC对齐操作；写入模块，设置为根据判断结果，将标识及控制信息写入所述码流，其中，所述标识及控制信息包括：是否对所述码流的整体和/或部分执行POC对齐操作的指示信息。

优选地，所述标识及控制信息还包括：开启或关闭POC对齐操作的起始图像位置信息和/或开启或关闭POC对齐操作的终止图像位置信息；所述装置还包括：确定模块，设置为根据预测结构和应用需求，确定开启和/或关闭POC对齐操作的一段按照图像播放顺序或图像解码顺序连续的图像的起始和/或终端位置。

根据本发明的再一个实施例，提供了一种码流的处理方法，包括：从码流中获取标识及控制信息，其中，所述标识及控制信息包括：是否对所述码流的整体和/或部分执行视频图像序号POC对齐操作的指示信息；根据所述标识及控制信息的指示，对所述码流中需要执行POC对齐操作的全部和/或部分图像执行POC对齐操作。

优选地，所述标识及控制信息位于所述码流中的参数集所在的字段，用于指示所述码流中使用所述标识及信息所在的参数集的全部和/或部分图像是否执行POC对齐操作。

优选地，如果多个所述参数集中都包含有指示执行POC对齐操作的标识及控制信息，则根据参数集之间的引用关系，当前参数集中的指示是否执行POC对齐操作的标识及控制信息覆盖被其直接和/或间接引用的参数集中对应的指示执行是否POC对齐操作的标识及控制信息。

优选地，所述标识及控制信息位于所述码流中除参数集字段之外的其他至少作用于图像层的数据结构对应的字段，用于指示所述码流的所述数据结构有效作用范围内的全部和/或部分所述图像是否执行POC对齐操作。

优选地，所述标识及控制信息位于所述码流中增强辅助信息SEI所在字段，用于指示该SEI信息有效范围内的所述码流中的全部和/或部分图像是否执行POC对齐操作。

优选地，所述标识及控制信息位于所述多层视频码流的媒体文件中用于描述视频媒体属性的字段，用于指示包含在所述媒体文件中的所述码流的全部和/或部分图像是否执行POC对齐操作。

优选地，根据所述标识及控制信息的指示，对所述码流中需要执行POC对齐操作的图像执行POC对齐操作，包括：根据所述标识及控制信息所在字段的有效范围以及所述标识及控制信息的取值，确定所述码流中开启和/或关闭POC对齐操作的图像；对开启POC对齐操作的图像执行POC对齐操作。

根据本发明的又一个实施例，提供了一种码流的处理装置，包括：获取模块，设置为从码流中获取标识及控制信息，其中，所述标识及控制信息包括：是否对所述码流的整体和/或部分执行视频图像序号POC对齐操作的指示信息；执行模块，设置为根据所述标识及控制信息的指示，对所述码流中需要执行POC对齐操作的全部和/或部分图像执行POC对齐操作。

优选地，所述执行模块包括：确定模块，设置为根据所述标识及控制信息所在字段的有效范围以及所述标识及控制信息的取值，确定所述码流中开启和/或关闭POC对齐操作的图像；控制模块，设置为对开启POC对齐操作的图像执行POC对齐操作。

根据本发明的又一个实施例，提供了一种使用码流的通信系统，包括：源设备，包括上述的码流的生成装置；以及宿设备，包括上述的码流的处理装置。

通过本发明，在生成码流时，在码流中写入是否需要对码流的整体和/或部分执行POC对齐操作的指示及控制信息，从而可以对POC对齐操作进行局部和/或整体地关闭，提高了码流控制的灵活性。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的码流的生成方法100的流程图；

图2是根据本发明实施例的码流的生成装置200的结构示意图；

图3是根据本发明实施例的码流的处理方法300的流程图；

图4是根据本发明实施例的码流的处理装置400的结构示意图；以及

图5是根据本发明实施例的使用码流的通信系统500的结构示意图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

当需要使用POC对齐的情况下，编码器可使用现有POC对齐方法生成多层视频编码码流，解码器使用现有技术POC对齐方法对应的解码方法获得当前图像的POC值。对于某些应用，不需要使用POC对齐。例如，非协调的联播、混合可伸缩视频编码等应用。

因此，在本发明实施例中，为增加多层视频编解码器和码流的灵活性，适应多种应用需求，在多层视频编码的高层数据流程上，增加针对POC对齐操作的标识信息和对应操作。

需要说明的是，在本发明实施例中，源设备是指包含有编码器、可产生多层视频编码码流并进行必要的文件、系统层处理的设备；而宿设备指包含有解码器、进行必要的文件、系统层处理和可解码多层视频编码码流的设备。

实施例一

根据本发明实施例，提供了一种码流的生成方法。

图1为根据本发明实施例的码流的生成方法100的流程图。如图1所示，根据本发明实施例的码流的生成方法包括步骤S102和S104。在步骤S102中根据应用需求(例如，是否同时解码和输出全部层或多个层图像)判断是否需要对码流的整体和/或部分执行POC对齐操作。然后，在步骤S104中，根据判断结果，将标识及控制信息写入码流中，其中，该标识及控制信息中包括：对码流的整体和/或部分执行POC对齐操作的指示信息。

在具体实施过程中，源设备可以在需要传输码流时，执行上述步骤S102和步骤S104，在传输的码流中写入POC对齐操作标识及控制信息。

本发明实施例中所述的码流可以是多层视频码流，也可以是系统层上其他码流，具体本发明实施例不作限定。

通过上述步骤S102至S104，可以根据应用需求，在多层视频编码的高层数据流程上，增加针对POC对齐操作的标识及控制信息和对应操作，从而可以增加多层视频编解码器和码流的灵活性。

在本发明实施例中，可以通过将上述标识及控制信息写入码流的不同位置来表示该标识及控制信息的作用范围。在本发明实施例中，上述标识及控制信息可以位于码流的以下位置的至少之一：视频码流中的现有参数集字段，视频码流中除参数集外其他至少作用于图像层的数据结构对应的字段，视频码流中增强辅助信息(SEI)所在字段、系统层用于描述视频媒体属性的字段，媒体文件中用于描述视频媒体属性的字段。

可选地，在本发明实施例中，上述标识及控制信息包括但不限于以下方式来指示是否执行POC对齐操作的图像：

(1)上述标识及控制信息位于码流中的参数集所在的字段，用于指示码流中使用标识及控制信息所在的参数集的图像层是否执行POC对齐操作；其中，参数集包括以下至少之一：视频参数集、序列参数集及图像参数集。例如，当标识及控制信息位于视频参数集(Video Parameter Set，VPS)，则该标识及控制信息的控制范围是多层视频的全部图像层；而当标识及控制信息位于序列参数集(Sequence Parameter Set，SPS)，则该标识及控制信息的控制范围是使用该SPS的多层视频的图像层；当标识及控制信息位于图像参数集(Picture Parameter Set，PPS)，则该标识及控制信息的控制范围是使用该PPS的多层视频的图像层。

在这种情况下，如果多个所述参数集中都包含有指示是否执行POC对齐操作的标识及控制信息，则根据参数集之间的引用关系，当前参数集中的指示是否执行POC对齐操作的标识及控制信息覆盖被其直接和/或间接引用的参数集中对应的指示是否执行POC对齐操作的标识及控制信息。

(2)上述标识及控制信息位于所述码流中除参数集字段之外的其他至少作用于图像层的数据结构对应的字段，用于指示所述码流的所述数据结构所作用的图像层是否执行POC对齐操作。其中，该数据结构的作用范围至少包含1个图像(帧图像和/或场图像)。

(3)上述标识及控制信息位于码流中的补充增强信息(Supplemental Enhancement Information，SEI)，用于指示该SEI信息有效范围内的所述码流中的图像是否执行POC对齐操作；

(4)上述标识及控制信息位于所述码流的系统层用于描述视频媒体属性的字段，即系统层描述子(Descriptor)，用于指示包含在系统码流中的所述码流的整体和/或部分图像是否执行POC对齐操作。

(5)上述标识及控制信息位于所述多层视频码流的媒体文件中用于描述视频媒体属性的字段，文件描述子(Descriptor)，用于指示包含在所述媒体文件中的码流的整体和是否执行POC对齐操作。

上述标识及控制信息也可以同时位于上述多个位置中，同时指示多个范围内的图像是否执行POC对齐操作。

可选的，在本发明实施列中，上述标识及控制信息还包括：开启或关闭POC对齐操作的起始图像位置信息和/或开启或关闭POC对齐操作的终止图像位置信息。则如图1所示，在步骤S104之前，方法100还可以包括：步骤S103，根据预测结构和应用需求，确定开启和/或关闭POC对齐操作的一段按照图像播放顺序或图像解码顺序连续的图像的起始和/或终止位置。

可选的，在本发明实施例中，在将上述标识及控制信息写入码流之后，可以传输该码流，而接收侧(可以称为宿设备)接收该多层视频码流，从所述多层视频码流中获取所述标识及控制信息，并所述标识及控制信息的指示对多层视频码流执行解码操作和/或播放操作。例如，根据上述标识及控制信息，确定开启和/或关闭POC对齐操作的码流，在解码和/或播放对开启POC对齐操作的码流执行POC对齐.

实施例二

根据本发明实施例，提供了一种码流的生成装置，该装置用于实现实施例一所提供的方法。

图2为根据本发明实施例的码流的生成装置200的结构示意图，如图2所示，生成装置200可以包括：判断模块202和写入模块204。应当理解，图2中所表示的各个模块的连接关系仅为示例，本领域技术人员完全可以采用其它的连接关系，只要在这样的连接关系下各个模块也能够实现本发明的功能即可。

在本说明书中，各个模块的功能可以通过使用专用硬件、或者能够与适当的软件相结合来执行处理的硬件来实现。这样的硬件或专用硬件可以包括专用集成电路(ASIC)、各种其它电路、各种处理器等。当由处理器实现时，该功能可以由单个专用处理器、单个共享处理器、或者多个独立的处理器(其中某些可能被共享)来提供。另外，处理器不应该被理解为专指能够执行软件的硬件，而是可以隐含地包括、而不限于数字信号处理器(DSP)硬件、用来存储软件的只读存储器(ROM)、随机存取存储器(RAM)、以及非易失存储设备。

在本发明实施例中，判断模块202设置为根据应用需求判断是否需要对码流的整体和/或部分执行视频图像序号POC对齐操作；写入模块204设置为根据判断模块202的判断结果，将包括是否对所述多层视频码流的整体和/或部分执行POC对齐操作的指示信息的标识及控制信息写入码流。

与上述实施例一对应，写入模块204可以通过在多层视频码流的不同位置写入上述标识及控制信息，来指示多层视频码流的整体和/或部分是否开启或关闭POC对齐操作。具体不再赘述。

可选的，上述标识及控制信息还包括：开启或关闭POC对齐操作的起始图像位置信息和/或开启或关闭POC对齐操作的终止图像位置信息；则如图2所示，装置200还可以包括：确定模块206设置为根据预测结构和应用需求，确定开启和/或关闭POC对齐操作的一段按照图像播放顺序或图像解码顺序连续的图像的起始和/或终端位置。

可选的，该装置还可以包括一个输出模块，设置为输出写入所述标识及控制信息的所述码流。

本实施例的装置可以是视频通信应用中相关码流生成设备，例如，手机、计算机、服务器、机顶盒、便携式移动终端、数字摄像机，电视广播系统设备等。该装置可以位于源设备中，该输出装置可以处理以下至少一种多层视频信号：可伸缩视频，多视点视频，多视点深度，多视点视频+多视点深度。其中，立体视频是多视点视频的一种视点数等于2的特殊形式。

实施例三

与上述实施例一提供的方法对应，本发明实施例还提供了一种码流的处理方法，用于上述生成的码流进行处理。

图3为根据本发明实施例的码流的处理方法300的流程图，如图3所示，根据本发明实施例的多层视频码流的处理方法300主要包括步骤S302和步骤S304。在步骤S302中，从码流中获取包括是否对码流的整体和/或部分执行视频图像序号POC对齐操作的指示信息的标识及控制信息。然后，在步骤S304中，根据上述标识及控制信息的指示，对码流中需要执行POC对齐操作的部分执行POC操作。

在本实施例中，与上述实施例一对应，上述标识及控制信息可以位于码流的多个字段以指示标识及控制信息的有效范围，具体参见实施例一，在本实施例中不再赘述。

可选地，对应于上述实施例一中，通过将标识及控制信息写入到码流的不同位置以指示码流的不同部分是否执行POC对齐操作，步骤S304可以包括：根据所述标识及控制信息所在字段的有效范围以及所述标识及控制信息的取值，确定所述码流中开启和/或关闭POC对齐操作的图像；对开启POC对齐操作的图像进行POC对齐。

实施例四

根据本发明实施例，还提供了一种码流的处理装置，该装置用于实现实施例三所提供的方法。

图4是根据本发明实施例的码流的处理装置400的结构示意图，如图4所示，处理装置400主要包括：获取模块402和执行模块404。应当理解，图4中所表示的各个模块的连接关系仅为示例，本领域技术人员完全可以采用其它的连接关系，只要在这样的连接关系下各个模块也能够实现本发明的功能即可。

在本发明实施例中，获取模块402，设置为从码流中获取包括是否对多层视频码流的整体和/或部分执行视频图像序号POC对齐操作的指示信息的标识及控制信息。执行模块406，设置为根据所述标识及控制信息的指示，对所述码流中需要执行POC对齐操作的部分执行POC对齐。

可选的，执行模块404可以包括：确定模块，设置为根据所述标识及控制信息所在字段的有效范围以及所述标识及控制信息的取值，确定所述多层视频码流中开启和/或关闭POC对齐操作的图像；控制模块，设置为对开启POC对齐操作的图像执行POC对齐操作。

本实施例的装置可以是视频通信应用中相关码流接收播放设备，例如，手机、计算机、服务器、机顶盒、便携式移动终端、数字摄像机，电视广播系统设备等。该装置可以位于宿设备中，该处理装置可以处理以下至少一种多层视频信号：可伸缩视频，多视点视频，多视点深度，多视点视频+多视点深度。其中，立体视频是多视点视频的一种视点数等于2的特殊形式。

实施例五

根据本发明实施例，还提供了一种使用码流的通信系统。

图5为根据本发明实施例的使用码流的通信系统500的结构示意图，如图5所示，根据本发明实施例的多层视频码流的传输系统500包括源设备502和宿设备504。其中，源设备502包括上述实施例二中所述的码流的生成装置200，宿设备504包括上述实施例四中所述的码流的处理装置400。在本实施例中，源设备502可以按照实施例一中所述的方法生成码流并输出，宿设备504接收该码流，并按照实施例三中所述的方法对该码流进行处理，具体参见上述明实施例，本实施列中不再赘述。

为了进一步说明本发明实施例所提供的技术方案，下面通过具体实例对本发明实施例所提供的技术方案进行描述。

以下实例所使用的针对POC对齐操作的高层码流组织方法采用如表1和表2所示的结构。

如表1和表2所示码流中包含：标识整体和/或部分码流是否使用POC对齐操作的标识信息。在对应的码流中，携带有如下比特字段：标识整体和/或部分码流是否使用POC对齐操作的信息的一个或多个比特字段。

如表3所示码流中包含：启用或关闭POC对齐操作起始和/或结束位置信息。对应的码流中，携带有如下比特字段：启用或关闭POC对齐操作起始和/或结束位置信息的一个或多个比特字段。

表1.启用POC对齐的码流组织方法

表2.关闭POC对齐的码流组织方法

表3.POC对齐相关起止位置的码流组织方法

其中，表1中各字段的语义(对应的控制操作)如下：poc_alignment_enable_flag取值等于1时表示解码码流过程中需要使用POC对齐操作。poc_alignment_enable_flag取值等于0是表示解码码流过程中不使用POC对齐操作，当然，对于本领域技术人员来说poc_alignment_enable_flag取值及其所表示的含义也可以采用其它方式，具体本发明实施例中不作限定。poc_alignment_enable_flag使用u(1)对应的编解码方法。

可选地，如果码流中不存在poc_alignment_enable_flag对应的比特字段，则其对应变量poc_alignment_enable_flag的取值默认为1。

表2中各字段的语义(对应的控制操作)如下：poc_alignment_disable_flag取值等于1时表示解码码流过程中不使用POC对齐操作。poc_alignment_disable_flag取值等于0是表示解码码流过程中使用POC对齐操作。poc_alignment_disable_flag使用u(1)对应的编解码方法。可选地，如果码流中不存在poc_alignment_disable_flag对应的比特字段，则其对应变量poc_alignment_disable_flag的取值默认为0。当然，对于本领域技术人员来说poc_alignment_disable_flag取值及其所表示的含义也可以采用其它方式，具体本发明实施例中不作限定。

表3中各字段的语义(对应的控制操作)如下：start_info指示启用或关闭POC对齐操作的起始图像位置。start_info使用se(v)对应的编解码方法。end_info指示启用或关闭POC对齐操作的终止图像位置。end_info使用se(v)对应的编解码方法。

表3中字段可以与表1和表2中的字段组合使用。表3中字段与表1中字段组合使用时，指示的是开启POC对齐操作的起始图像位置和终止图像位置；表3中字段与表2中字段组合使用时，指示的是关闭POC对齐操作的起始图像位置和终止图像位置。

表3中，起始图像位置和终止图像位置可以使用以下所列信息中的一种或多种标识，包括：图像的POC值，POC的低比特位(LSB)的取值，POC的高比特位(MSB)信息，图像时间戳信息，图像解码顺序信息，图像播放顺序信息。

表1、表2和表3中的语法元素可以使用在以下一个或多个数据结构中，表1、表2和表3中的语法元素对应的比特字段使用在对应于该数据结构的码流中：

(1)视频参数集(Video Parameter Set，VPS)；

(2)序列参数集(Sequence Parameter Set，SPS)；

(3)图像参数集(Picture Parameter Set，PPS)；

(4)补充增强信息(Supplemental Enhancement Information，SEI)；

(5)除上述数据结构外其他作用范围至少包含1个图像(帧图像和/或场图像)的数据结构；

(6)系统层描述子(Descriptor)；

(7)文件描述子(Descriptor)；

(8)混合使用。

以下对上述各种方法的描述仅为各对应方法的具体实例。当同时使用多种方法时，可将下述各方法的实例进行简单组合和串联，即可得到对应的实例。

以下实施方法中，表1和表2的码流字段不位于同一个数据结构中。以下实施方法以表1的码流字段poc_alignment_enable_flag为例进行说明。表2的码流字段poc_alignment_disable_flag的对应的实施方法之相同，区别在于同一情况下poc_alignment_disable_flag的取值与poc_alignment_enable_flag的取值相反。

实例1

在本实例中，poc_alignment_enable_flag位于VPS，其控制范围是多层视频的全部层。其值等于1时，表示同一个AU中包含的图像具有相同的POC值。其值等于0时，表示同一个AU中包含的图像可能具有相同、也可能具有不相同的POC值。

在poc_alignment_enable_flag字段后，可进一步选择使用表3的比特字段，进一步标识poc_alignment_enable_flag对应操作的起始图像位置和终止图像位置。当表3的比特字段存在时，poc_alignment_enable_flag所限定的操作的有效范围为包含表3比特字段指示的起始图像和终止图像及其之间(按照图像播放顺序或图像解码顺序)的全部图像。

在本实例中，多层视频码流的传输主要包括以下步骤：

步骤1，源设备根据应用需求(如，是否同时解码和输出全部层或多个层图像)，判断是否需要对多层视频执行POC对齐操作。

若需要使用POC对齐操作，源设备将poc_alignment_enable_flag的取值设置为1，否则设置为0。

步骤2，源设备使用u(1)对应的编码方法将poc_alignment_enable_flag的取值写入VPS码流。

步骤3，源设备根据预测结构和应用需求，确定是否制定(按照图像播放顺序或图像解码顺序)连续的一段图像执行poc_alignment_enable_flag取值所指示的操作。若是，则源设备根据预测结构和应用需求，确定start_info和end_info的取值，并使用se(v)对应的编码方法将二者的取值写入码流。

步骤4，宿设备接收到码流后，使用u(1)对应的解码方法从VPS码流中获得poc_alignment_enable_flag的取值。

当码流中存在表3所示字段时，宿设备使用se(v)对应的解码方法从码流中获得start_info和end_info的取值。宿设备根据start_info和end_info的取值的取值确定poc_alignment_enable_flag取值对应操作的有效图像范围。若码流中不包含表3所示字段，宿设备设定poc_alignment_enable_flag取值对应操作的有效范围是整个视频编码序列(Coded Video Sequence，CVS)。

宿设备判断poc_alignment_enable_flag的取值为1时，宿设备可使用POC条件对视频码流进行AU边界划分。宿设备设置“同AU的输出图像的POC值相等”作为其码流检错和播放操作控制条件。若解码码流不符合该控制条件时，宿设备执行差错控制机制，进行误码掩盖和/或通过反馈信息向源设备报告错误。宿设备可直接根据POC值进行图像输出和播放控制。

宿设备判断poc_alignment_enable_flag的取值为0时，宿设备使用非POC条件对视频码流进行AU边界划分。对于同一个AU获得的图像，若其对应的系统层或文件中的时间标记信息相同，宿设备在该事件标记信息所指示的时刻对图像进行输出和播放控制。

实例2

本实例中，poc_alignment_enable_flag位于SPS，其控制范围是使用该SPS的多层视频的层。其值等于1时，表示AU中该层图像与BL层图像(在该AU中存在或假设存在)具有相同的POC值。其值等于0时，表示AU中该层图像与BL层图像(在该AU中存在或假设存在)可能具有相同、也可能具有不相同的POC值。

在本实例中，多层视频码流的传输主要包括以下步骤：

步骤1，源设备根据应用需求(如，是否同时解码和输出全部层或多个层图像)，判断是否需要将视频码流中该层图像与BL层图像执行POC对齐操作。

若需要使用POC对齐操作，源设备将该层所使用的SPS中poc_alignment_enable_flag的取值设置为1，否则设置为0。

步骤2，源设备使用u(1)对应的编码方法将poc_alignment_enable_flag的取值写入SPS码流。

步骤4，宿设备接收到码流后，使用u(1)对应的解码方法从SPS码流中获得poc_alignment_enable_flag的取值。

当码流中存在表3所示字段时，宿设备使用se(v)对应的解码方法从码流中获得start_info和end_info的取值。宿设备根据start_info和end_info的取值的取值确定poc_alignment_enable_flag取值对应操作的有效图像范围。若码流中不包含表3所示字段，宿设备设定poc_alignment_enable_flag取值对应操作的有效范围是整个CVS。

宿设备判断poc_alignment_enable_flag的取值为1时，宿设备可使用POC条件对视频码流进行AU边界划分。宿设备设置“AU中该层的输出图像的POC值与(假设存在)BL层图像相等”作为其码流检错和播放操作控制条件。若解码码流不符合该控制条件时，宿设备执行差错控制机制，进行误码掩盖和/或通过反馈信息向源设备报告错误。宿设备可直接根据POC值进行该层图像与BL图像间进行输出和播放控制。对其他位于同AU但POC值不相等的图像，宿设备在该事件标记信息所指示的时刻对图像进行输出和播放控制。

实例3

本实例中，poc_alignment_enable_flag位于PPS，其控制范围是使用该PPS的多层视频的层中的一个或多个图像。其值等于1时，表示AU中该层图像与BL层图像(在该AU中存在或假设存在)具有相同的POC值。其值等于0时，表示AU中该层图像与BL层图像(在该AU中存在或假设存在)可能具有相同、也可能具有不相同的POC值。

在本实例中，多层视频码流的传输主要包括以下步骤：

步骤1，源设备根据应用需求(如，是否同时解码和输出全部层或多个层图像)，判断是否需要将某一个或某一段该层图像与BL层图像执行POC对齐操作。

步骤2，源设备使用u(1)对应的编码方法将poc_alignment_enable_flag的取值写入PPS码流。

步骤4，宿设备接收到码流后，使用u(1)对应的解码方法从PPS码流中获得poc_alignment_enable_flag的取值。

实例4

本实例中，poc_alignment_enable_flag位于SEI，其指示范围是使用该SEI的多层视频的层中的一个或多个图像。其值等于1时，表示AU中的全部图像具有相同的POC值(与整个AU关联的SEI)，或指示某EL层图像具有与BL层图像(在该AU中存在或假设存在)相同的POC值(与某个EL层关联的SEI)。其值等于0时，表示AU中的全部图像可能具有、也可能不具有相同的POC值(与整个AU关联的SEI)，或指示某EL层图像具有与BL层图像(在该AU中存在或假设存在)可能具有、也可能不具有相同的POC值(与某个EL层关联的SEI)。

在本实例中，多层视频码流的传输主要包括以下步骤：

步骤1，源设备根据所产生的多层视频编码码流，判断是否需要将某一个或某一段图像所使用的POC对齐操作。

若使用POC对齐操作，源设备将对应的SEI中poc_alignment_enable_flag的取值设置为1，否则设置为0。所述对应的SEI指：与整个AU关联的SEI，或与某个EL层关联的SEI。

步骤2，源设备使用u(1)对应的编码方法将poc_alignment_enable_flag的取值写入SEI码流，并将SEI的字段插入到视频码流中关联位置。

步骤4，宿设备接收到码流后，使用u(1)对应的解码方法从SEI码流中获得poc_alignment_enable_flag的取值。

宿设备判断poc_alignment_enable_flag的取值为1时，若该SEI是与整个AU关联的SEI，宿设备可使用POC条件对视频码流进行AU边界划分。宿设备设置“同AU的输出图像的POC值相等”作为其码流检错和播放操作控制条件。若解码码流不符合该控制条件时，宿设备执行差错控制机制，进行误码掩盖和/或通过反馈信息向源设备报告错误。宿设备可直接根据POC值进行图像输出和播放控制。

宿设备判断poc_alignment_enable_flag的取值为1时，若该SEI是与某EL关联的SEI，宿设备可使用非POC条件对视频码流进行AU边界划分。宿设备设置“AU中该层的输出图像的POC值与(假设存在)BL层图像相等”作为其码流检错和播放操作控制条件。若解码码流不符合该控制条件时，宿设备执行差错控制机制，进行误码掩盖和/或通过反馈信息向源设备报告错误。宿设备可直接根据POC值进行该层图像与BL图像间进行输出和播放控制。对其他位于同AU但POC值不相等的图像，宿设备在该事件标记信息所指示的时刻对图像进行输出和播放控制。

实例5

本实例中，上述标识信息位于其他作用范围至少包含1个图像(帧图像和/或场图像)的数据结构，对于所述其他作用范围至少包含1个图像(帧图像和/或场图像)的数据结构，若该数据结构中包含有其他解码过程中必须使用的数据信息，则该数据结构是解码过程中所必需的数据结构。此时，如果该数据结构的作用范围是整个多层视频，则源设备和宿设备对poc_alignment_enable_flag的操作方法与实例1相似。如果该数据结构的作用范围是多层视频中的某EL视频，则源设备和宿设备对poc_alignment_enable_flag的操作方法与实例2相似。如果该数据结构的作用范围是整个多层视频中的某EL上的一个或多个图像，则源设备和宿设备对poc_alignment_enable_flag的操作方法与实例3相似。

对于所述其他作用范围至少包含1个图像(帧图像和/或场图像)的数据结构，若该数据结构中没有包含其他解码过程中必须使用的数据信息，则该数据结构不是解码过程中所必需的数据结构。此时，源设备和宿设备对poc_alignment_enable_flag的操作方法与实例4相似。

实例5与实例1至实例4的不同之处在于源设备使用u(1)对应的编码方法将poc_alignment_enable_flag的取值写入所述至少包含1个图像(帧图像和/或场图像)的数据结构的对应码流中，宿设备使用使用u(1)对应的解码方法从所述至少包含1个图像(帧图像和/或场图像)的数据结构的对应码流中解析poc_alignment_enable_flag对应的字段，获得poc_alignment_enable_flag的取值。

实例6

本实例中，上述标识信息位于系统描述子中，当包含有poc_alignment_enable_flag的描述子的作用范围是系统码流中的整个多层视频编码码流时，源设备和宿设备对poc_alignment_enable_flag的操作方法与实例4中“与整个AU关联的SEI”情况下的操作方法相似。

当包含有poc_alignment_enable_flag的描述子的作用范围是系统码流中的多层视频编码码流中某个EL码流时，源设备和宿设备对poc_alignment_enable_flag的操作方法与实例4中“与某个EL层关联的SEI”情况下的操作方法相似。

实例6与实例4的不同之处在于源设备使用u(1)对应的或与u(1)相同的编码方法将poc_alignment_enable_flag的取值写入所述描述子的对应系统码流中，如需要，源设备使用se(v)对应的或与se(v)相同的编码方法将start_info和end_info的取值写入所述描述子的对应系统码流中；宿设备使用使用u(1)对应的或与u(1)相同的解码方法从所述描述子数据结构的对应的系统码流中解析poc_alignment_enable_flag对应的字段，获得poc_alignment_enable_flag的取值，若表3字段在码流中存在，宿设备使用se(v)对应和或与se(v)相同的解码方法从码流中获取将start_info和end_info的取值。

实例7

本实例中，本实例中，上述标识信息位于文件描述子中，在实例中，当包含有poc_alignment_enable_flag的描述子的作用范围是媒体文件码流中的整个多层视频编码码流时，源设备和宿设备对poc_alignment_enable_flag的操作方法与实例4中“与整个AU关联的SEI”情况下的操作方法相似。

当包含有poc_alignment_enable_flag的描述子的作用范围是媒体文件码流中的多层视频编码码流中某个EL码流时，源设备和宿设备对poc_alignment_enable_flag的操作方法与实例4中“与某个EL层关联的SEI”情况下的操作方法相似。

实例7与实例4的的不同之处在于源设备使用u(1)对应的或与u(1)相同的编码方法将poc_alignment_enable_flag的取值写入所述描述子的对应系统码流中，如需要，源设备使用se(v)对应的或与se(v)相同的编码方法将start_info和end_info的取值写入所述描述子的对应系统码流中；宿设备使用使用u(1)对应的或与u(1)相同的解码方法从所述描述子数据结构的对应的系统码流中解析poc_alignment_enable_flag对应的字段，获得poc_alignment_enable_flag的取值，若表3字段在码流中存在，宿设备使用se(v)对应和或与se(v)相同的解码方法从码流中获取将start_info和end_info的取值。

实例8

本实例中，采用混和使用的方法携带上述标识信息。对于多层视频编码码流结构，在解码过程中，PPS引用SPS、SPS引用VPS。这里，将称为VPS是比SPS和PPS更高层的数据结构，SPS是比PPS更高的数据结构。

在实例中，poc_alignment_enable_flag可在不同层次的数据结构中进行编码。当高层数据结构与低层数据结构中的poc_alignment_enable_flag的取值不同时，低层数据结构中的poc_alignment_enable_flag覆盖高层数据结构中的poc_alignment_enable_flag。若表3中start_info和end_info的取值不同时，poc_alignment_enable_flag取值的作用范围为高层数据结构中start_info和end_info限定图像范围和低层数据结构中start_info和end_info限定图像范围的最小交集。

当高层数据结构与低层数据结构中的poc_alignment_enable_flag取值相同、但表3中start_info和end_info的取值不同时，poc_alignment_enable_flag取值的作用范围为高层数据结构中start_info和end_info限定图像范围和低层数据结构中start_info和end_info限定图像范围的最大并集。

在混合使用方法中，源设备首先根据输入视频、编码预测结构和应用需求，确定POC对齐的使用方式，包括：使用POC对齐的层、使用POC对齐的图像的起止位置。源设备根据以上所确定的信息，使用实例1、实例2、实例3的所述方法，设置VPS、SPS、PPS中的poc_alignment_enable_flag以及所需要的start_info和end_info的取值，并使用相应的编码方法将其写入码流。同时，源设备根据应用需求，使用实例4、实例6和实例7所述的方法，设置视频码流所需的辅助信息、以及系统层、媒体文件相关描述子中对应字段信息，并使用相应的编码方法将其写入码流。

宿设备对接收码流进行处理，使用实例1、实例2、实例3的所述方法，从VPS、SPS、PPS中获得poc_alignment_enable_flag以及所需要的start_info和end_info的取值，设置不同图像段和层的POC对齐使用控制，对并对接收码流进行解码。在解码过程中，当宿设备可以获得视频辅助信息、系统层信息、媒体文件信息中的POC对齐描述信息，宿设备使用上述各方法设置接收、解码过程中的差错控制、播放控制模块。

宿设备可使用非POC条件对视频码流进行AU边界划分。宿设备设置“AU中该层的输出图像的POC值与(假设存在)BL层图像相等”作为其码流检错和播放操作控制条件。若解码码流不符合该控制条件时，宿设备执行差错控制机制，进行误码掩盖和/或通过反馈信息向源设备报告错误。宿设备可直接根据POC值进行该层图像与BL图像间进行输出和播放控制。对其他位于同AU但POC值不相等的图像，宿设备在该事件标记信息所指示的时刻对图像进行输出和播放控制。

从以上的描述中，可以看出，通过上述实施例之一提供的技术方案，对于即时通讯等业务，用户能够在通信之前获取到对方的各个终端的信息(例如，终端的名称，也可以称为昵称)，因而可以主动的选择通信接收方的终端进行通信，在与对方通信之前获取通信接受方的多个终端的名称(昵称)，有针对性地选择一个发起通信(语音电话、可视电话或者消息)，提升了用户体验。

综上所述，通过本发明实施例提供的方法，可以在码流高层、辅助信息、系统层描述等增加对POC对齐的描述。同时，在码流高层结构上采用分层描述机制，有利于码流生成过程中的灵活控制。

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

工业实用性

基于本发明实施例提供的上述技术方案，采用在生成码流时，在码流中写入是否需要对码流的整体和/或部分执行POC对齐操作的指示及控制信息，从而可以对POC对齐操作进行局部和/或整体地关闭，提高了码流控制的灵活性。

Claims

一种码流的生成方法，包括：

根据应用需求判断是否需要对码流的整体和/或部分执行视频图像序号POC对齐操作；

根据判断结果，将标识及控制信息写入所述码流，其中，所述标识及控制信息包括：是否对所述码流进行整体和/或部分POC对齐操作的指示信息。
根据权利要求1所述的方法，其中，所述标识及控制信息位于所述码流中的参数集所在的字段，用于指示所述码流中使用所述标识及控制信息所在的参数集的全部和/或部分图像是否执行POC对齐操作。
根据权利要求2所述的方法，其中，所述参数集包括以下至少之一：视频参数集VPS、序列参数集SPS、图像参数集PPS。
根据权利要求2所述的方法，其中，如果多个所述参数集中都包含有指示是否执行POC对齐操作的标识及控制信息，则根据参数集之间的引用关系，当前参数集中的指示是否执行POC对齐操作的标识及控制信息覆盖被其直接和/或间接引用的参数集中对应的指示是否执行POC对齐操作的标识及控制信息。
根据权利要求1所述的方法，其中，所述标识及控制信息位于所述码流中除参数集字段之外的其他至少作用于图像层的数据结构对应的字段，用于指示所述码流的所述数据结构有效作用范围内的全部和/或部分图像是否执行POC对齐操作。
根据权利要求1所述的方法，其中，所述标识及控制信息位于所述码流中补充增强辅助信息SEI所在字段，用于指示该SEI信息有效范围内的所述码流中的全部和/或部分图像是否执行POC对齐操作。
根据权利要求1所述的方法，其中，所述标识及控制信息位于所述码流的系统层用于描述视频媒体属性的字段，用于指示包含在系统码流中的所述码流的全部和/或部分图像是否执行POC对齐操作。
根据权利要求1所述的方法，其中，所述标识及控制信息位于所述码流的媒体文件中用于描述视频媒体属性的字段，用于指示包含在所述媒体文件中的所述码流的全部和/或部分图像是否执行POC对齐操作。
根据权利要求1至8中任一项所述的方法，其中，

所述标识及控制信息还包括：开启或关闭POC对齐操作的起始图像位置信息和/或开启或关闭POC对齐操作的终止图像位置信息；

在将所述标识及控制信息写入所述码流之前，所述方法还包括：

根据预测结构和应用需求，确定开启和/或关闭POC对齐操作的一段按照图像播放顺序或图像解码顺序连续的图像的起始和/或终止位置。
一种码流的生成装置，包括：

判断模块，设置为根据应用需求判断是否需要对码流的整体和/或部分执行视频图像序号POC对齐操作；

写入模块，设置为根据判断结果，将标识及控制信息写入所述码流，其中，所述标识及控制信息包括：是否对所述码流的整体和/或部分执行POC对齐操作的指示信息。
根据权利要求10所述的装置，其中，

所述标识及控制信息还包括：开启或关闭POC对齐操作的起始图像位置信息和/或开启或关闭POC对齐操作的终止图像位置信息；

所述装置还包括：确定模块，设置为根据预测结构和应用需求，确定开启和/或关闭POC对齐操作的一段按照图像播放顺序或图像解码顺序连续的图像的起始和/或终端位置。
一种码流的处理方法，包括：

从码流中获取标识及控制信息，其中，所述标识及控制信息包括：是否对所述码流的整体和/或部分执行视频图像序号POC对齐操作的指示信息；

根据所述标识及控制信息的指示，对所述码流中需要执行POC对齐操作的全部和/或部分图像执行POC对齐操作。
根据权利要求12所述的方法，其中，所述标识及控制信息位于所述码流中的参数集所在的字段，用于指示所述码流中使用所述标识及信息所在的参数集的全部和/或部分图像是否执行POC对齐操作。
根据权利要求13所述的方法，其中，所述参数集包括以下至少之一：视频参数集VPS、序列参数集SPS、图像参数集PPS。
根据权利要求13所述的方法，其中，如果多个所述参数集中都包含有指示执行POC对齐操作的标识及控制信息，则根据参数集之间的引用关系，当前参数集中的指示是否执行POC对齐操作的标识及控制信息覆盖被其直接和/或间接引用的参数集中对应的指示执行是否POC对齐操作的标识及控制信息。
根据权利要求12所述的方法，其中，所述标识及控制信息位于所述码流中除参数集字段之外的其他至少作用于图像层的数据结构对应的字段，用于指示所述码流的所述数据结构有效作用范围内的全部和/或部分所述图像是否执行POC对齐操作。
根据权利要求12所述的方法，其中，所述标识及控制信息位于所述码流中增强辅助信息SEI所在字段，用于指示该SEI信息有效范围内的所述码流中的全部和/或部分图像是否执行POC对齐操作。
根据权利要求12所述的方法，其中，所述标识及控制信息位于所述码流的系统层用于描述视频媒体属性的字段，用于指示包含在系统码流中的所述码流的全部和/或部分图像是否执行POC对齐操作。
根据权利要求12所述的方法，其中，所述标识及控制信息位于所述多层视频码流的媒体文件中用于描述视频媒体属性的字段，用于指示包含在所述媒体文件中的所述码流的全部和/或部分图像是否执行POC对齐操作。
根据权利要求12所述的方法，其中，根据所述标识及控制信息的指示，对所述码流中需要执行POC对齐操作的图像执行POC对齐操作，包括：

根据所述标识及控制信息所在字段的有效范围以及所述标识及控制信息的取值，确定所述码流中开启和/或关闭POC对齐操作的图像；

对开启POC对齐操作的图像执行POC对齐操作。
一种码流的处理装置，包括：

获取模块，设置为从码流中获取标识及控制信息，其中，所述标识及控制信息包括：是否对所述码流的整体和/或部分执行视频图像序号POC对齐操作的指示信息；

执行模块，设置为根据所述标识及控制信息的指示，对所述码流中需要执行POC对齐操作的全部和/或部分图像执行POC对齐操作。
根据权利要求21所述的装置，其中，所述执行模块包括：

确定模块，设置为根据所述标识及控制信息所在字段的有效范围以及所述标识及控制信息的取值，确定所述码流中开启和/或关闭POC对齐操作的图像；

控制模块，设置为对开启POC对齐操作的图像执行POC对齐操作。
一种使用码流的通信系统，包括：

源设备，包括权利要求10或11所述的装置；以及

宿设备，包括权利要求21或22所述的装置。