CN104322071A - 参数集译码 - Google Patents
参数集译码 Download PDFInfo
- Publication number
- CN104322071A CN104322071A CN201380021749.8A CN201380021749A CN104322071A CN 104322071 A CN104322071 A CN 104322071A CN 201380021749 A CN201380021749 A CN 201380021749A CN 104322071 A CN104322071 A CN 104322071A
- Authority
- CN
- China
- Prior art keywords
- parameter set
- bit stream
- video
- decoding
- video data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明揭示用于处理视频数据的系统、方法和装置。一些实例涉及接收或形成具有经固定长度译码的识别符的参数集,其中所述参数集的参数集识别(ID)在所述参数集中经熵译码的任何语法元素之前;以及使用具有经固定长度译码的所述识别符的所述参数集来解码或编码视频数据。其它实例确定第一位流的第一参数集的第一参数集ID是否与第二位流的第二参数集的第二参数集ID相同。响应于确定所述第二参数集ID与所述第一参数集ID相同,将所述第二参数集ID改变为唯一参数集ID。可发射与所述唯一参数集ID相关联的参数集。
Description
本申请案主张以下临时申请案的权益:
2012年4月26日申请的第61/638,999号美国临时申请案,其全部内容以引用的方式并入本文中。
技术领域
本发明大体涉及处理视频数据,且更特定来说涉及用信号通知开销数据。
背景技术
数字视频能力可并入到广范围的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电话、所谓的“智能电话”、视频电话会议装置、视频串流装置等。数字视频装置实施视频压缩技术,例如MPEG-2、MPEG-4、ITU-T H.263、ITU-TH.264/MPEG-4第10部分、先进视频译码(AVC)、当前发展中的高效视频译码(HEVC)标准及此类标准的扩展所界定的标准中描述的视频压缩技术。视频装置可通过实施此类视频压缩技术更有效地发射、接收、编码、解码和/或存储数字视频信息。
视频压缩技术执行空间(图片内)预测和/或时间(图片间)预测以减少或移除视频序列中固有的冗余。对于基于块的视频译码,视频切片(即,视频帧或视频帧的一部分)可分割为视频块,其也可称为树块、译码单元(CU)和/或译码节点。图片的帧内译码(I)切片中的视频块相对于同一图片中的相邻块中的参考样本使用空间预测编码。图片的帧间译码(P或B)切片中的视频块可相对于同一图片中的相邻块中的参考样本使用空间预测,或相对于其它参考图片中的参考样本使用时间预测。图片可称为帧,且参考图片可称为参考帧。
空间或时间预测产生针对待译码的块的预测块。残余数据表示待译码的原始块与预测块之间的像素差。根据指向形成预测块的参考样本的块的运动向量和指示经译码块与预测块之间的差的残余数据编码经帧间译码块。根据帧内译码模式和残余数据编码经帧内译码块。为进一步压缩,残余数据可从像素域变换到变换域,从而产生残余变换系数,所述残余变换系数接着可量化。初始布置在二维阵列中的经量化的变换系数可经扫描以便产生变换系数的一维向量,且可应用熵译码实现更多压缩。
发明内容
本发明描述涉及拼接两个位流同时还确保解码器能够区分所拼接位流的参数集的技术。举例来说,本发明描述用于使用固定长度代码对一或多个参数集识别符(ID)进行译码的技术,以及用于至少一种类型的参数集可针对其在频带外运送的视频位流的低复杂性拼接的技术。在一些实例中,这可允许在两个位流拼接之后参数集的频带外运送,即使当在拼接之前两个位流包含具有相同参数集ID的参数集时也如此。如本发明中使用的“位流”指代可形成经译码图片和形成一或多个经译码视频序列的相关联数据的表示的位的序列。位流可为用于指代NAL单位流或字节流的集合术语。
在一个实例中,本发明描述一种用于解码视频数据的方法,其包含:接收具有经固定长度译码的参数集识别符(ID)的参数集,其中参数集的参数集ID在参数集中经熵译码的任何语法元素之前;以及使用具有经固定长度译码的识别符的参数集来解码视频数据。
在另一实例中,本发明描述一种用于编码视频数据的方法,其包含:形成具有经固定长度译码的参数集ID的参数集,其中参数集的参数集ID在参数集中经熵译码的任何语法元素之前;以及使用具有经固定长度译码的识别符的参数集来编码视频数据。
在另一实例中,本发明描述一种用于处理视频数据的设备,其包含一或多个处理器,所述处理器经配置以:处理具有经固定长度译码的参数集ID的参数集,其中参数集的参数集ID在参数集中经熵译码的任何语法元素之前;且使用具有经固定长度译码的识别符的参数集来对视频数据进行译码。
在另一实例中,本发明描述一种用于处理视频数据的设备,其包含:用于处理具有经固定长度译码的参数集ID的参数集的装置,其中参数集的参数集ID在参数集中经熵译码的任何语法元素之前;以及用于使用具有经固定长度译码的识别符的参数集来对视频数据进行译码的装置。
在另一实例中,本发明描述一种计算机可读存储媒体。所述计算机可读存储媒体上存储有指令,所述指令当执行时致使装置的一或多个处理器:处理具有经固定长度译码的参数集ID的参数集,其中参数集的参数集ID在参数集中经熵译码的任何语法元素之前;且使用具有经固定长度译码的识别符的参数集来对视频数据进行译码。
在另一实例中,本发明描述一种处理视频数据的方法,其包含:确定第一位流的第一参数集的第一参数集识别符(ID)是否与第二位流的第二参数集的第二参数集ID相同;响应于确定第二参数集ID与第一参数集ID相同,将第二参数集ID改变为唯一参数集ID;以及发射与唯一参数集ID相关联的参数集。
在另一实例中,本发明描述一种用于处理视频数据的设备,其包含一或多个处理器,所述处理器经配置以:确定第一位流的第一参数集的第一参数集ID是否与第二位流的第二参数集的第二参数集ID相同;响应于确定第二参数集ID与第一参数集ID相同,将第二参数集ID改变为唯一参数集ID;以及发射与唯一参数集ID相关联的参数集。
在另一实例中,本发明描述一种用于处理视频数据的设备,其包含:用于确定第一位流的第一参数集的第一参数集ID是否与第二位流的第二参数集的第二参数集ID相同的装置;用于响应于确定第二参数集ID与第一参数集ID相同将第二参数集ID改变为唯一参数集ID的装置;以及用于发射与唯一参数集ID相关联的参数集的装置。
在另一实例中,本发明描述一种计算机可读存储媒体。所述计算机可读存储媒体上存储有指令,所述指令当执行时致使装置的一或多个处理器:确定第一位流的第一参数集的第一参数集ID是否与第二位流的第二参数集的第二参数集ID相同;响应于确定第二参数集ID与第一参数集ID相同,将第二参数集ID改变为唯一参数集ID;且发射与唯一参数集ID相关联的参数集。
附图和以下描述中陈述一个或一个以上实例的细节。从描述内容和图式以及从权利要求书将显而易见其它特征、目标和优点。
附图说明
图1是说明拼接两个位流的实例的框图,其中一些参数集信息相对于位流的发射在频带外发射,且一些参数集信息作为位流的一部分发射。
图2是说明位流1与2拼接在一起成为单一位流从而形成图1中说明的拼接操作的结果的框图。
图3是说明可利用本发明中描述的技术的实例视频编码和解码系统的框图。
图4是说明可实施本发明中描述的技术的实例视频编码器的框图。
图5是说明可实施本发明中描述的技术的实例视频解码器的框图。
图6是说明形成网络的一部分的一组实例装置的框图。
图7是说明实施本发明的一或多个方面的实例方法的流程图。
图8是说明实施本发明的一或多个方面的另一实例方法的流程图。
图9是说明实施本发明的一或多个方面的另一实例方法的流程图。
图10是说明实施本发明的一或多个方面的实例方法的流程图。
具体实施方式
本发明描述涉及拼接两个位流同时还确保解码器能够区分所拼接位流的参数集的技术。举例来说,本发明描述用于使用固定长度代码对一或多个参数集识别符(ID)进行译码的技术,以及用于至少一种类型的参数集可针对其在频带外运送的视频位流的低复杂性拼接的技术。在一些实例中,这可允许在两个位流拼接之后参数集的频带外运送,即使当在拼接之前两个位流包含具有相同参数集ID的参数集时也如此。如本发明中使用的“位流”指代可形成经译码图片和形成一或多个经译码视频序列的相关联数据的表示的位的序列。位流可为用于指代NAL单位流或字节流的集合术语。
新兴的高效视频译码(HEVC)标准采用参数集概念。HEVC中的序列参数集(SPS)、图片参数集(PPS)和视频参数集(VPS)机构可将不经常改变的信息的发射与经译码视频块数据的发射解耦。序列、图片和视频参数集可在一些应用中“在频带外”递送,而非与含有经译码视频数据的单元一起运送。频带外发射通常是可靠的。
在HEVC中,SPS图片、PPS或VPS的识别符使用可变长度编码译码方法(称为“ue(v)”)译码。HEVC工作草案将经“ue(v)”译码语法元素界定为无符号整数Exp-Golomb译码语法元素,从左位开始。每一SPS包含SPS ID,每一PPS包含PPS ID和SPS ID,且每一切片标头包含PPS ID。每一缓冲周期补充增强信息(SEI)消息也包含SPS ID。一股来说,视频译码装置或视频处理装置可将位流的数据囊封在网络抽象层(NAL)单元内。NAL单元包含视频译码层(VCL)NAL单元和非VCL NAL单元。VCLNAL单元通常包含视频译码器使用的信息,例如经译码视频数据和参数集,比如SPS、PPS和VPS。非VCL NAL单元包含界定SEI消息的信息,其可含有对于解码来自VCL NAL单元的经译码图片样本并非必需但可辅助与解码、显示、错误复原和其它目的相关的过程的信息。
位流拼接通常指代两个或两个以上位流或其部分的组合。举例来说,视频译码装置或视频处理装置可将第一位流附加到第二位流,可能对位流的任一者或两者作出一些修改以产生经拼接位流。第二位流中的第一经译码图片也称为拼接点。因此,经拼接位流中的拼接点处的图片源自第二位流,而紧接在经拼接位流中的拼接点之前的图片源自第一位流。出于说明的目的,以下描述假定经拼接位流中仅存在一个拼接点。然而,本发明的技术也可应用于具有多个拼接点的经拼接位流,例如通过将所描述的技术个别地应用于两个或两个以上拼接点。
图1是说明拼接两个位流1与2的实例的概念图,其中一些参数集信息相对于位流的发射在频带外发射,且剩余参数集信息作为位流的一部分发射。在此实例中,PPS、SPS和VPS中的一些(如果提供的话)可相对于位流的发射在频带外发射。另外,PPS、SPS和VPS中的一些可包含在位流的开始,随后是一系列视频样本(例如,包含经编码视频数据的网络抽象层(NAL)单元)。在另一实例中,视频译码装置或视频处理装置可随位流发射所有PPS、SPS和VPS。在另一实例中,所有PPS、SPS和VPS可相对于位流的发射在频带外发射。视频样本可包含时间相关图片或其部分的序列中的图片(例如,切片或块)。
图2是说明图1中说明的拼接操作的结果的概念图。在图2中,位流1和2已拼接在一起成为单一位流。在一些实例中,这可由视频译码装置或视频处理装置进行。位流2的开始紧随在位流1的最后视频样本1-N之后。因此,位流2的第一视频样本2-1紧随在位流1的最后视频样本1-N之后。视频译码装置或视频处理装置可组合经拼接位流的频带外与频带内参数集信息。因此,如图2中说明,来自位流1和2的每一者的至少一些视频样本可参考相同频带外参数集ID,且来自位流1和2的每一者的一些视频样本参考经拼接位流的开始处的相同频带内参数集。
经译码视频数据的位流通常包含相对少的SPS和相对少的PPS,乃至仅一个SPS和一个PPS,且使用最小SPS ID值0和最小PPS ID值0。因此,如果两个位流或其部分经拼接,那么有可能乃至很可能拼接点参考的相同SPS或PPS ID将是与紧接在拼接点之前的图片所参考的相同的SPS或PPS ID,但拼接点和拼接点之前的图片实际上参考两个不同SPS或PPS。为简单起见,本发明的方面可仅相对于SPS描述,但所描述的技术通常也适用于PPS、APS或任何其它类型的参数集。
在拼接点图片和紧接在拼接点之前的图片尽管每一者正参考不同SPS却参考相同SPS ID的例子中,在经拼接位流中,具有紧接在拼接点之前的图片所参考的特定SPSID的SPS通过拼接点图片参考的SPS有效更新。在此情况下,经拼接位流的SPS不能放置在经拼接位流的开始,且SPS的频带外发射可能困难乃至不可能实现。然而,因为不论如何仅使用几个不同SPS,所以实现经拼接位流的SPS的频带外发射可能是有益的。
本发明描述包含修改经译码视频数据的位流以便实现经拼接位流的SPS(或其它类型的参数集,例如PPS和/或VPS)的频带外发射的技术,其可克服上文描述的一些不足。作为一个实例,如果包含在经拼接位流中的特定类型的不同参数集的数目小于或等于所述特定类型的所允许参数集的最大数目,那么可应用以下技术(否则,所述特定类型的参数集不能在频带外发射)。对于包含在拼接点的第二位流中的特定类型(例如,SPS、PPS或VPS)的每一参数集,如果第一位流的第一参数集的参数集ID与相同参数集类型的参数集ID的任一者相同,那么视频译码装置或视频处理装置将参数集ID的值改变为包含在经拼接位流中的相同类型的所有参数集中的唯一值。在以上步骤之后,视频译码装置或视频处理装置可在频带外发射所述类型的参数集。视频译码装置或视频处理装置可将参数集放置在位流的开始。
在参数集ID的值改变的过程中,当对ID进行熵译码(例如,使用“ue(v)”)时,视频译码装置或视频处理装置可移位数据单元中ID之后的所有位。这可能是麻烦的过程,因为视频译码装置或视频处理装置可能需要针对参考所述ID的所有经译码数据单元执行此操作。为简化用于改变参数集ID值的过程,本发明的技术包含使用固定长度代码对参数集ID进行译码,包含参数集本身中的ID和其被参考处(例如,囊封在NAL单元内的切片的切片标头内)两者的ID。长度(以位计)可等于Ceil(log2(N)),其中N是所述特定类型的所允许参数集的最大数目。举例来说,如果所允许SPS的最大数目为32,那么使用5个位对SPS ID进行译码。
本发明的技术可额外包含将数据集ID尽可能早地放置在经译码数据单元内,例如在任何经熵译码数据之前。在一些例子中,参数集值ID可以1开始,而非0,以避免开始代码模拟。开始代码模拟可例如在参数集ID具有值0时发生。当参数集的值为0时,所有位为0。这可增加开始代码模拟的概率,因为开始代码可为等于0x000001的3个字节的固定值序列,其含有若干0值位。
下表展示涉及SPS ID、PPS ID、APS ID和VPS ID的HEVC的实例语法。出于这些实例的目的,可假定每一类型的所允许参数集的最大数目等于32,但也可使用其它最大值。即,在以下实例中,使用u(5)描述符对各个ID值进行译码,从而指示五个位分配到ID值。然而,在其它实例中,可将其它数目的位分配到ID值。
表1展示根据本发明的技术的SPS原始字节序列有效负载(RBSP)语法的实例。
seq_parameter_set_rbsp(){ | 描述符 |
profile_idc | u(8) |
reserved_zero_8bits/*等于0*/ | u(8) |
level_idc | u(8) |
seq_parameter_set_id | u(5) |
chroma_format_idc | ue(v) |
... |
表1
如表1中说明,在一个实例中,seq_parameter_set_id可使用描述符u(5)而非ue(v)。描述符u(5)指示使用5个位来用信号通知语法元素。描述符ue(v)指示可使用可变数目的位。在参数集ID的值改变的过程中,当对ID进行熵译码(例如,使用“ue(v)”)时,将需要数据单元中ID之后的所有位的移位。这比较麻烦,因为可能需要针对参考所述ID的所有经译码数据单元进行此操作。为简化改变参数集ID值的过程,可使用利用固定长度代码对参数集ID进行译码。这可包含参数集本身中的ID以及其被参考之处的ID两者。长度(以位计)等于Ceil(log2(N)),其中N是所述特定类型的所允许参数集的最大数目。举例来说,如果所允许SPS的最大数目为32,那么使用5个位对SPS ID进行译码。因此,在表1的实例中,使用5个位来用信号通知语法元素seq_parameter_set_id。将位数目限于5(“u(5)”)而非使用可变数目的位(“ue(v)”)简化了用于改变参数集ID值的过程。将理解,可使用其它固定数目的位。
表2展示根据本发明的技术的SPS RBSP语法的另一实例。
seq_parameter_set_rbsp(){ | 描述符 |
seq_parameter_set_id | u(5) |
profile_idc | u(8) |
reserved_zero_8bits/*等于0*/ | u(8) |
level_idc | u(8) |
chroma_format_idc | ue(v) |
... |
表2
如表2中说明,在一个实例中,seq_parameter_set_id可使用描述符u(5)而非ue(v)。再次,将位数目限于5(“u(5)”)而非使用可变数目的位(“ue(v)”)简化了用于改变参数集ID值的过程。另外,如表2中说明,seq_parameter_set_id优选尽可能早地放置在经译码数据单元中以允许非熵编码。
表3展示根据本发明的技术的PSP RBSP语法的实例。
pic_parameter_set_rbsp(){ | 描述符 |
pic_parameter_set_id | u(5) |
seq_parameter_set_id | u(5) |
sign_data_hiding_flag | u(1) |
... |
表3
如表3中说明,在一个实例中,pic_parameter_set_id和seq_parameter_set_id可使用描述符u(5)而非ue(v)。再次,将位数目限于5(“u(5)”)而非使用可变数目的位(“ue(v)”)简化了用于改变参数集ID值的过程。另外,如表3中说明,seq_parameter_set_id优选尽可能早地放置在经译码数据单元中可允许非熵编码。
表4展示根据本发明的技术的APS RBSP语法的实例。
aps_rbsp(){ | 描述符 |
aps_id | u(5) |
aps_scaling_list_data_present_flag | u(1) |
... |
表4
再次,如表4中说明,aps_id可使用描述符u(5)而非ue(v)以简化用于改变参数集ID值的过程。将aps_id尽可能早地放置在经译码数据单元中可允许非熵编码。
表5展示根据本发明的技术的切片标头语法的实例。
表5
再次,如表5中说明,在一个实例中,pic_parameter_set_id和aps_id可使用描述符u(5)而非ue(v)以简化用于改变参数集ID值的过程。将其尽可能早地放置在经译码数据单元中可允许非熵编码。
表6展示根据本发明的技术的切片标头语法的另一实例。
slice_header(){ | 描述符 |
first_slice_in_pic_flag | u(1) |
aps_id | u(5) |
pic_parameter_set_id | u(5) |
if(first_slice_in_pic_flag==0) | |
slice_address | u(v) |
slice_type | ue(v) |
... |
表6
再次,如表6中说明,在一个实例中,pic_parameter_set_id和aps_id可使用描述符u(5)而非ue(v)以简化用于改变参数集ID值的过程。将其尽可能早地放置在经译码数据单元中可允许非熵编码。
在表6的实例中,需要每一APS具有大于0的APS ID,且切片标头中的aps_id等于0意味着没有APS被切片标头参考,且当以下条件不成立时切片标头中的aps_id将等于0,否则aps_id将不为零。
if(scaling_list_enable_flag||
deblocking_filter_in_aps_enabled_flag||
(sample_adaptive_offset_enabled_flag&&!slice_sao_interleaving_flag)||
adaptive_loop_filter_enabled_flag)
在此实例中,pic_parameter_set_id也需要大于0。这可通过要求每一PPS具有大于0的PPS ID来实现。
表7展示根据本发明的技术的切片标头语法的另一实例。
slice_header(){ | 描述符 |
aps_id | u(5) |
pic_parameter_set_id | u(5) |
first_slice_in_pic_flag | u(1) |
if(first_slice_in_pic_flag==0) | |
slice_address | u(v) |
slice_type | ue(v) |
... |
表7
再次,如表7中说明,在一个实例中,pic_parameter_set_id和aps_id可使用描述符u(5)而非ue(v)以简化用于改变参数集ID值的过程。将其尽可能早地放置在经译码数据单元中可允许非熵编码。
表8展示根据本发明的技术的缓冲周期SEI消息语法的实例。
表8
再次,如表8中说明,在一个实例中,seq_parameter_set_id_aps_id可使用描述符u(5)而非ue(v)以简化用于改变参数集ID值的过程。将其尽可能早地放置在经译码数据单元中以允许非熵编码。
表9展示根据本发明的技术的图片序列(SOP)描述SEI消息语法的实例。
sop_description(payloadSize){ | 描述符 |
sps_id | u(5) |
num_pics_in_sop_minusl | ue(v) |
其中(i=0;i<=num_pics_in_sop_minusl;i++){ | |
sop_desc_nal_ref_flag[i] | u(1) |
sop_desc_temporal_id[i] | u(3) |
st_rps_idx[i] | ue(v) |
if(i>0) | |
poc_delta[i] | se(v) |
} | |
} |
表9
再次,如表9中说明,在一个实例中,sps_id可使用描述符u(5)而非ue(v)以简化用于改变参数集ID值的过程。将其尽可能早地放置在经译码数据单元中以允许非熵编码。
表10展示根据本发明的技术的视频参数集RBSP语法的实例。
表10
再次,如表10中说明,在一个实例中,vps_video_parameter_set_id可使用描述符u(4)而非ue(v)以简化用于改变参数集ID值的过程。将其尽可能早地放置在经译码数据单元中以允许非熵编码。
根据本发明的技术,缓冲周期SEI消息和SOP描述SEI消息(当存在时)可尽可能早地放置在SEI网络抽象层(NAL单元)中,包含作为SEI NAL单元中的第一SEI消息。
除了参考参数集及其ID的以上语法结构外,缓冲周期SEI消息和SOP描述SEI消息的语法结构也可参考参数集和参数集ID。这些SEI消息因此也可针对上文描述的其它语法结构中使用的参数集ID采用固定长度译码技术。在一些实例中,缓冲周期和SOP描述SEI消息(当存在时)尽可能早地放置在SEI NAL单元中。在一个实例中,视频译码装置或视频处理装置将此类SEI消息作为第一SEI消息放置在SEI NAL单元中。
图3是说明可利用本发明中描述的技术的实例视频编码和解码系统10的框图。如图3所示,系统10包含源装置12,其产生待在稍后时间由目的地装置14解码的经编码视频数据。源装置12和目的地装置14可包括广范围装置的任一者,包含桌上型计算机、笔记本(即,膝上型)计算机、平板计算机、机顶盒、电话手持机(例如,所谓的“智能”电话)、所谓的“智能”板、电视机、相机、显示装置、数字媒体播放器、视频游戏控制台、视频串流装置等。在一些情况下,源装置12和目的地装置14可经装备用于无线通信。
目的地装置14可经由链路16接收待解码的经编码视频数据。链路16可包括任何类型的媒体或装置,其能够将经编码视频数据从源装置12移动到目的地装置14。在一个实例中,链路16可包括通信媒体以使源装置12能够实时将经编码视频数据直接发射到目的地装置14。源装置12可根据通信标准(例如,无线通信协议)调制经编码视频数据,并发射到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一或多个物理发射线。通信媒体可形成例如局域网、广域网或全局网络(例如,因特网)等基于包的网络的一部分。通信媒体可包含路由器、开关、基站,或可用于促进从源装置12到目的地装置14的通信的任何其它设备。
在一些实例中,链路16可包含中间装置(未图示),例如媒体感知网络元件(MANE),其从源装置12和另一源装置接收位流(或来自源装置12的两个位流)。MANE可将两个位流拼接在一起,接着将经拼接位流转发到目的地装置14。根据本发明的技术,MANE可确定第二位流的参数集是否具有与第一位流的参数集相同的ID,且如果是,那么将唯一参数集ID指派到第二位流的参数集,接着将参数集在频带外发送到目的地装置14。
或者,经编码数据可从输出接口22输出到存储装置34。类似地,经编码数据可通过输入接口从存储装置34存取。存储装置34可包含多种分布式或局部存取数据存储媒体的任一者,例如硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器,或用于存储经编码视频数据的任何其它适宜的数字存储媒体。在另一实例中,存储装置34可对应于文件服务器,或可固持源装置12产生的经编码视频的另一中间存储装置。目的地装置14可经由串流或下载从存储装置34存取所存储的视频数据。文件服务器可为能够存储经编码视频数据且将经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含网络服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置或本地磁盘驱动器。目的地装置14可经由任何标准数据连接(包含因特网连接)存取经编码视频数据。这可包含适于存取存储在文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线信道(例如,DSL、线缆调制解调器等),或两者的组合。经编码视频数据从存储装置34的发射可为串流发射,下载发射或两者的组合。
本发明的技术不需要限于无线应用或环境。所述技术可应用于视频译码以支持多种多媒体应用的任一者,例如空中电视广播、线缆电视发射、卫星电视发射、串流视频发射(例如,经由因特网)、编码数字视频以供存储在数据存储媒体上、解码存储在数据存储媒体上的数字视频,或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频发射以支持例如视频串流、视频重放、视频广播和/或视频电话等应用。
在图3的实例中,源装置12包含视频源18、视频编码器20和输出接口22。在一些情况下,输出接口22可包含调制器/解调器(调制解调器)和/或发射器。在源装置12中,视频源18可包含例如视频俘获装置等源,比如视频相机、含有先前所俘获视频的视频档案、用以从视频内容提供者接收视频的视频馈送接口,和/或用于产生计算机图形数据作为源视频的计算机图形系统,或此类源的组合。作为一个实例,如果视频源18是视频相机,那么源装置12和目的地装置14可形成所谓的相机电话或视频电话。然而,本发明中描述的技术可一股来说适用于视频译码,且可应用于无线和/或有线应用。
在根据本发明的技术的一些实例中,视频源18可产生一或多个位流。举例来说,如果视频源是视频俘获装置,那么视频俘获装置可产生两个或两个以上位流。在另一实例中,视频源18可能包含各自产生一个位流的两个或两个以上源装置。这些位流可拼接在一起。
因此,视频源18内的处理器可确定第一位流的第一参数集的参数集ID是否与第二位流的第一参数集的参数集ID相同。响应于第二位流的参数集ID与第一位流的参数集ID匹配,处理器可将第二位流的参数集ID改变为唯一参数集ID。视频源18可接着发射与唯一参数集ID相关联的新参数集。
视频编码器20可编码经俘获、预先俘获或计算机产生的视频。举例来说,视频编码器20可编码经拼接位流。另外,在一些实例中,视频解码器30可基于第一位流的参数集ID和唯一参数集ID而区分第一位流与第二位流。在其它实例中,源装置12的输出接口22可经由将经编码视频数据直接发射到目的地装置14。经编码视频数据还可(或替代地)存储到存储装置34上以供稍后由目的地装置14或其它装置存取,用于解码和/或重放。
在根据本发明的技术的一些实例中,例如媒体感知网络元件(MANE)等一些其它视频处理装置可将两个或两个以上位流拼接在一起。因此,MANE内的处理器或其它视频处理装置可确定第一位流的第一参数集的参数集ID是否与第二位流的第一参数集的参数集ID相同。响应于第二位流的参数集ID与第一位流的参数集ID匹配,处理器可将第二位流的参数集ID改变为唯一参数集ID。MANE或其它视频处理装置可接着发射与唯一参数集ID相关联的新参数集。
目的地装置14包含输入接口28、视频解码器30和显示装置32。在一些情况下,输入接口28可包含接收器和/或调制解调器。目的地装置14的输入接口28经由链路16接收经编码视频数据。经由链路16传送或在存储装置34上提供的经编码视频数据可包含视频编码器20产生以供视频解码器(例如,视频解码器30)解码视频数据的多种语法元素。此类语法元素可与在通信媒体上发射、存储在存储媒体上或存储在文件服务器上的经编码视频数据一起包含。在根据本发明的技术的一些实例中,视频解码器30可解码经拼接位流。视频处理装置可产生经拼接位流。因此,视频处理装置内的处理器可确定第一位流的第一参数集的参数集ID是否与第二位流的第一参数集的参数集ID相同。响应于第二位流的参数集ID与第一位流的参数集ID匹配,处理器可已将第二位流的参数集ID改变为唯一参数集ID。视频处理装置可接着发射与唯一参数集ID相关联的新参数集。经拼接位流可由视频编码器20编码、由输出接口22发射、由输入接口28接收且由解码器30解码。显示装置32可接着显示此经拼接位流。在一些实例中,视频解码器30可基于第一位流的参数集ID和唯一参数集ID区分第一位流与第二位流。
显示装置32可与目的地装置14集成或在目的地装置14外部。在一些实例中,目的地装置14可包含集成显示装置,且还可经配置以与外部显示装置介接。在其它实例中,目的地装置14可为显示装置。一股来说,显示装置32向用户显示经解码视频数据,且可包括例如液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或另一类型的显示装置等多种显示装置的任一者。
视频编码器20和视频解码器30可根据例如当前发展中的高效视频译码(HEVC)标准等视频压缩标准操作,且可符合HEVC测试模型(HM)。称为“HEVC工作草案9”或“WD9”的HEVC标准的最新草案在Bross等人的文献JCTVC-K1003v13“(高效视频译码(HEVC)文本规范草案9)”中描述,ITU-T SG16WP3和ISO/IECJTC1/SC29/WG11的视频译码联合协作团队(JCT-VC),第十一次会议:中国上海,2012年10月10-19日,其大约在2012年12月27日可从http://phenix.int- evrv.fr/jct/doc end user/documents/11Shanghai/wg11/JCTVC-K1003-v13.zip下载,其全部内容以引用的方式并入本文中。或者,视频编码器20和视频解码器30可根据例如ITU-T H.264标准(或者称为MPEG-4第10部分、先进视频译码(AVC))等其它专门或工业标准或此类标准的扩展操作。然而,本发明的技术不限于任何特定译码标准。视频压缩标准的其它实例包含MPEG-2和ITU-T H.263。
尽管图3中未展示,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器和解码器集成,且可包含适当的MUX-DEMUX单元或其它硬件和软件,以处理对共同数据流或单独数据流中的音频与视频两者的编码。在一些实例中,如果适用,那么MUX-DEMUX单元可符合ITU H.223多路复用器协议,或例如用户数据报协议(UDP)等其它协议。
视频编码器20和视频解码器30各自可经实施为例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合等多种合适编码器电路中的任一者。当所述技术部分实施在软件中时,装置可将针对所述软件的指令存储在适宜的非暂时性计算机可读媒体中且使用一或多个处理器执行硬件中的指令以执行本发明的技术。视频编码器20和视频解码器30的每一者可包含在一或多个编码器或解码器中,其任一者可作为组合式编码器/解码器(CODEC)的一部分集成在相应装置中。
JCT-VC正致力于HEVC标准的开发。HEVC标准化努力基于称为HEVC测试模型(HM)的视频译码装置的发展中的模型。HM假定视频译码装置相对于现有装置的额外能力(根据例如ITU-T H.264/AVC)。举例来说,虽然H.264提供九个帧内预测编码模式,HM可提供多达三十三个帧内预测编码模式。
一股来说,HM的工作模型描述视频帧或图片可划分为包含亮度和色度样本两者的树块或最大译码单元(LCU)的序列。树块具有与H.264标准的宏块类似的用途。切片包含呈译码次序的若干连续树块。视频帧或图片可分割为一或多个切片。每一树块可根据四叉树划分为译码单元(CU)。举例来说,作为四叉树的根节点的树块可划分为四个子节点,且每一子节点又可为母节点且划分为另外四个子节点。作为四叉树的叶节点的最后未划分子节点包括译码节点,即经译码视频块。与经译码位流相关联的语法数据可界定树块可被划分的最大次数,且还可界定译码节点的最小大小。
CU包含译码节点,以及与译码节点相关联的预测单元(PU)及和变换单元(TU)。CU的大小对应于译码节点的大小且必须为正方形形状。CU的大小在在8x8像素到树块的大小的范围内,具有64x64像素或更大的最大值。每一CU可含有一或多个PU以及一或多个TU。与CU相关联的语法元素可描述例如将CU分割为一或多个PU。分割模式可在CU经跳跃或直接模式编码、帧内预测模式编码还是帧间预测模式编码之间不同。PU可分割为非正方形形状。与CU相关联的语法元素还可描述例如根据四叉树将CU分割为一或多个TU。TU可为正方形或非正方形形状。
HEVC标准允许根据TU的变换,其可针对不同CU而不同。TU通常基于针对经分割LCU界定的给定CU内PU的大小而设定大小,但可能情况并非始终如此。TU通常与PU为相同大小或小于PU。在一些实例中,对应于CU的残余样本可使用称为“残余四叉树”(RQT)的四叉树结构再分为较小单元。RQT的叶节点可称为变换单元(TU)。与TU相关联的像素差值可经变换以产生变换系数,所述变换系数可经量化。
一股来说,PU包含与预测过程有关的数据。举例来说,当PU经帧内模式编码时,PU可包含描述PU的帧内预测模式的数据。作为另一实例,当PU经帧间模式编码时,PU可包含界定PU的运动向量的数据。界定PU的运动向量的数据可描述例如运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量指向的参考图片,和/或运动向量的参考图片列表(例如,列表0、列表1或列表C)。
一股来说,TU用于变换和量化过程。具有一或多个PU的给定CU还可包含一或多个变换单元(TU)。预测之后,视频编码器20可计算对应于PU的残余值。残余值包括可使用TU变换为变换系数、量化且扫描以产生用于熵译码的串行变换系数的像素差值。本发明通常使用术语“视频块”来表示CU的译码节点。在一些特定情况下,本发明还可使用术语“视频块”来表示树块(即,LCU)或CU(其包含译码节点以及PU和TU)。
视频序列通常包含一系列视频帧或图片。图片群组(GOP)通常包括视频图片的一系列一或多者。GOP可在GOP的标头中、图片的一或多者的标头中或其它地方包含语法数据,其描述GOP中包含的图片的数目。图片的每一切片可包含描述相应切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块操作以便编码视频数据。视频块可对应于CU内的译码节点。视频块可具有固定或可变大小,且可根据指定译码标准而大小不同。
作为一实例,HM支持各种PU大小的预测。假定特定CU的大小为2Nx2N,HM支持2Nx2N或NxN的PU大小的帧内预测,以及2Nx2N、2NxN、Nx2N或NxN的对称PU大小的帧间预测。HM还支持不对称分割以用于2NxnU、2NxnD、nLx2N和nRx2N的PU大小的帧间预测。在不对称分割中,CU的一个方向不分割,而另一方向分割为25%和75%。CU的对应于25%分割的部分由“n”指示,随后是“向上”、“向下”、“左”或“右”的指示。因此,举例来说,“2NxnU”指代水平分割的2Nx2N CU,其中2Nx0.5N PU在顶部且2Nx1.5N PU在底部。
在本发明中,“NxN”和“N乘N”可互换使用以表示依据垂直和水平尺寸的视频块的像素尺寸(例如,16x16像素或16乘16像素)。一股来说,16x16块将具有垂直方向上16个像素(y=16)以及水平方向上16个像素(x=16)。同样,NxN块通常具有垂直方向上N个像素以及水平方向上N个像素,其中N表示非负整数值。一块中的像素可布置成行和列。此外,块不需要在水平方向上与在垂直方向上具有相同像素数目。举例来说,块可包括NxM像素,其中M不需要等于N。
在使用CU的PU的帧内预测或帧间预测译码之后,视频编码器20可计算CU的TU的残余数据。PU可将像素数据包括在空间域(也称为像素域)中,且TU可将系数包括在变换域中随后应用变换(例如,离散余弦变换(DCT)、整数变换、小波变换或与残余视频数据概念上类似的变换)。残余数据可对应于未编码图片的像素域对应于PU的预测值之间的像素差。视频编码器20可形成包含CU的残余数据的TU,且接着变换TU以产生CU的变换系数。
在用以产生变换系数的任何变换之后,视频编码器20可执行变换系数的量化。量化通常指代变换系数经量化以可能减少用于表示系数的数据量从而提供进一步压缩的过程。量化过程可减少与系数中的一些或全部相关联的位深度。举例来说,n位值可在量化期间向下舍入为m位值,其中n大于m。
在一些实例中,视频编码器20可利用预先界定的扫描次序来扫描经量化变换系数以产生可经熵编码的串行向量。在其它实例中,视频编码器20可执行自适应扫描。在扫描经量化变换系数以形成一维向量之后,视频编码器20可例如根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法对一维向量进行熵编码。视频编码器20还可对与经编码视频数据相关联的语法元素进行熵编码以供由视频解码器30用于解码视频数据。
为执行CABAC,视频编码器20可将上下文模型内的上下文指派到待发射的符号。上下文可与例如符号的相邻值是否非零相关。为执行CAVLC,视频编码器20可选择待发射的符号的可变长度代码。VLC中的码字可经构造使得相对较短代码对应于较大概率符号,而较长代码对应于较小概率符号。以此方式,VLC的使用可与例如针对待发射的每一符号使用相等长度码字相比实现位节省。概率确定可基于指派到符号的上下文。
图4是说明可实施本发明中描述的技术的实例视频编码器20的框图。视频编码器20可执行视频切片内的视频块的帧内和帧间译码。帧内译码依赖于空间预测以减少或移除给定视频帧或图片内的视频中的空间冗余。帧间译码依赖于时间预测以减少或移除视频序列的邻近帧或图片内的视频中的时间冗余。帧内模式(I模式)可指代若干基于空间的压缩模式中的任一者。例如单向预测(P模式)或双向预测(B模式)等帧间模式可指代若干基于时间的压缩模式中的任一者。
在一些实例中,在位流的上下文内,参数集ID可唯一地指派,除非意图是重写先前发射的参数集。另外,视频编码器20可经配置以编码包含表示相同内容的数据但以不同方式格式化(例如,HEVC的基础简档和高简档、一个720p版本和一个1080p版本等)的两个位流。同样,当编码媒体内容的两个不同集合时,视频编码器20可再使用参数集ID,因为源自此媒体内容的两个不同媒体流并不冲突(换句话说,视频编码器20可在开始编码不同媒体内容集合时“复位”参数集ID)。在一些实例中,可能假设两个位流共享相同参数集ID值空间,即不再使用参数集ID。
在图4的实例中,视频编码器20包含分割模块35、预测模块41、滤波器模块63、参考图片存储器64、加法器50、变换模块52、量化模块54和熵编码模块56。预测模块41包含运动估计模块42、运动补偿模块44和帧内预测模块46。为视频块重建,视频编码器20还包含反向量化模块58、反向变换模块60和加法器62。滤波器模块63既定表示例如解块滤波器、自适应环形滤波器(ALF)和样本自适应偏移(SAO)滤波器等一或多个环形滤波器。尽管滤波器模块63在图4中被展示为在环形滤波器中,但在其它实施方案中,滤波器模块63可实施为后环形滤波器。
如图4所示,视频编码器20接收视频数据,且分割模块35将数据分割为视频块。此分割还可包含分割为切片、瓦片或其它较大单元,以及例如根据LCU和CU的四叉树结构的视频块分割。视频编码器20通常说明编码视频切片内待编码的视频块的组件。视频编码器20可将切片划分为多个视频块(且可能划分为称为瓦片的视频块的集合)。预测模块41可针对当前视频块基于错误结果(例如,译码速率和失真水平)选择多个可能译码模式中的一者,例如多个帧内译码模式中的一者或多个帧间译码模式中的一者。预测模块41可将所得帧内或帧间译码块提供到加法器50以产生残余块数据且提供到加法器62以重建经编码块以供用作参考图片。
预测模块41内的帧内预测模块46可执行当前视频块相对于与待译码的当前块相同的帧或切片中的一或多个相邻块的帧内预测性译码以提供空间压缩。预测模块41内的运动估计模块42和运动补偿模块44执行当前视频块相对于一或多个参考图片中的一或多个预测块的帧间预测性译码以提供时间压缩。
运动估计模块42可经配置以根据视频序列的预定图案确定视频切片的帧间预测模式。预定图案可指定序列中的视频切片作为P切片、B切片或GPB切片。运动估计模块42和运动补偿模块44可高度集成,但出于概念目的单独说明。由运动估计模块42执行的运动估计是产生估计视频块的运动的运动向量的过程。运动向量例如可指示当前视频帧或图片内的视频块的PU相对于参考图片内的预测块的移位。
预测块是被发现在像素差方面与待译码的视频块的PU紧密匹配的块,这可通过绝对差和(SAD)、平方差和(SSD)或其它差量度来确定。在一些实例中,视频编码器20可计算存储在参考图片存储器64中的参考图片的子整数像素位置的值。举例来说,视频编码器20可内插四分之一像素位置、八分之一像素位置或参考图片的其它分数像素位置的值。因此,运动估计模块42可执行相对于完全像素位置和分数像素位置的运动搜索且输出具有分数像素精度的运动向量。
运动估计模块42通过将PU的位置与参考图片的预测块的位置比较而计算经帧间译码切片中的视频块的PU的运动向量。参考图片可选自第一参考图片列表(列表0)或第二参考图片列表(列表1),其每一者识别存储在参考图片存储器64中的一或多个参考图片。运动估计模块42将所计算的运动向量发送到熵编码模块56和运动补偿模块44。
运动补偿模块44执行的运动补偿可涉及基于运动估计确定的运动向量取得或产生预测块,可能以子像素精度执行内插。在接收当前视频块的PU的运动向量后,运动补偿模块44可将运动向量指向的预测块定位在参考图片列表的一者中。视频编码器20通过从正译码的当前视频块的像素值减去预测块的像素值从而形成像素差值而形成残余视频块。像素差值形成块的残余数据,且可包含亮度和色度差分量两者。求和器50表示执行此减法运算的组件。运动补偿模块44还可产生与视频块和视频切片相关联的语法元素以供由视频解码器30用于解码视频切片的视频块。
帧内预测模块46可对当前块进行帧内预测,作为运动估计模块42和运动补偿模块44(如上所述)执行的帧间预测的替代。特定来说,帧内预测模块46可确定使用帧内预测模式来编码当前块。在一些实例中,帧内预测模块46可例如在单独编码遍次期间使用各种帧内预测模式编码当前块,且帧内预测模块46(或在一些实例中,模式选择模块40)可从经测试模式中选择适当帧内预测模式使用。举例来说,帧内预测模块46可使用对于各种经测试帧内预测模式的速率-失真分析计算速率-失真值,且在经测试模式中选择具有最佳速率-失真特性的帧内预测模式。速率-失真分析通常确定经编码块与原始未经编码块(其经经编码以产生经编码块)之间的失真(或错误)量,以及用于产生经编码块的位速率(即,位数目)。帧内预测模块46可从各种经编码块的失真和速率计算比率以确定哪一帧内预测模式展现所述块的最佳速率-失真值。
在任何情况下,在选择块的帧内预测模式之后,帧内预测模块46可将指示块的选定帧内预测模式的信息提供到熵译码模块56。熵译码模块56可根据本发明的技术编码指示选定帧内预测模式的信息。视频编码器20可将配置数据包含在所发射位流中,所述配置数据可包含多个帧内预测模式索引表和多个经修改帧内预测模式索引表(也称为码字映射表)、各个块的编码上下文的定义,以及用于上下文的每一者的最可能帧内预测模式、帧内预测模式索引表和经修改帧内预测模式索引表的指示。
在预测模块41经由帧间预测或帧内预测产生当前视频块的预测块之后,视频编码器20通过从当前视频块减去预测块而形成残余视频块。残余块中的残余视频数据可包含在一或多个TU中且施加到变换模块52。变换模块52使用例如离散余弦变换(DCT)或概念上类似的变换将残余视频数据变换为残余变换系数。变换模块52可将残余视频数据从像素域转换到变换域,例如频域。
变换模块52可将所得变换系数发送到量化模块54。量化模块54量化变换系数以进一步减小位速率。量化过程可减少与系数中的一些或全部相关联的位深度。量化的程度可通过调整量化参数来修改。在一些实例中,量化模块54可接着执行包含经量化变换系数的矩阵的扫描。或者,熵编码模块56可执行所述扫描。
量化之后,熵编码模块56对经量化变换系数进行熵编码。举例来说,熵编码模块56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法或技术。熵编码模块56进行熵编码之后,经编码位流可发射到视频解码器30,或存档以供稍后发射或由视频解码器30检索。熵编码模块56还可对运动向量和正译码的当前视频切片的其它语法元素进行熵编码。
反向量化模块58和反向变换模块60分别应用反向量化和反向变换来重建像素域中的残余块以供稍后用作参考图片的参考块。运动补偿模块44可通过将残余块与参考图片列表的一者内的参考图片的一者的预测块相加而计算参考块。运动补偿模块44还可将一或多个内插滤波器应用于经重建的残余块以计算子整数像素值以供在运动估计中使用。加法器62将经重建的残余块与由运动补偿模块44产生的经运动补偿的预测块相加以产生参考块以供存储在参考图片存储器64中。参考块可由运动估计模块42和运动补偿模块44用作参考块来对后续视频帧或图片中的块进行帧间预测。
以此方式,图4的视频编码器20表示经配置以编码根据本发明的技术译码的参数集ID的视频编码器的实例。
在编码视频数据的实例方法中,视频编码器20可接收与唯一参数集ID相关联的新参数集,其中发射与唯一参数集ID相关联的新参数集的装置已(1)确定第一位流的第一参数集的参数集ID是否与第二位流的第一参数集的参数集ID相同,(2)响应于第二位流的参数集ID与第一位流的参数集ID匹配,将第二位流的参数集ID改变为唯一参数集ID,且(3)发射与唯一参数集ID相关联的新参数集。视频编码器20还可基于第一位流的参数集ID与唯一参数集ID区分第一位流与第二位流。在一些实例中,所述接收在频带外发生。
图5是说明可实施经描述用于基于上文描述的CRA图片实现对流调适和拼接的增强的支持的技术的实例视频解码器30的框图。在一实例中,如果视频解码器30接收具有先前所接收参数集的相同参数集ID的参数集,那么视频解码器30可经配置以用新参数集重写先前参数集。因此,视频解码器30可使用具有在新参数集之前(在解码次序中)的参数集ID的先前参数集解码参考所述ID的视频数据,但使用新参数集解码参考新参数集之后(在解码次序中)的参数集ID的视频数据。根据本发明的技术,通过在频带外接收具有唯一ID的参数集,视频解码器30可能够区分对频带外接收的参数集与频带内接收的另一参数集的参考。在一些实例中,视频解码器30能够解码经拼接位流且在频带外接收SPS,作为上游装置对频带外SPS的SPS ID的修改的结果。
在图5的实例中,视频解码器30包含熵解码模块80、预测模块81、反向量化模块86、反向变换模块88、加法器90、滤波器模块91和参考图片存储器92。预测模块81包含运动补偿模块82和帧内预测模块84。视频解码器30可在一些实例中执行与相对于来自图4的视频编码器20描述的编码遍次大体互逆的解码遍次。
在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频切片的视频块和相关联语法元素的经编码视频位流。视频解码器30可从网络实体29接收经编码视频位流。网络实体29可例如为服务器、MANE、视频编辑器/拼接器,或经配置以实施上文描述的技术的一或多者的其它此类装置。如上所述,本发明中描述的技术中的一些可由网络实体29在网络实体29将经编码视频位流发射到视频解码器30之前实施。在一些视频解码系统中,网络实体29和视频解码器30可为单独装置的部分,而在其它实例中,相对于网络实体29描述的功能性可由包括视频解码器30的相同装置执行。
视频解码器30的熵解码模块80对位流进行熵解码以产生经量化系数、运动向量和其它语法元素。熵解码模块80将运动向量和其它语法元素转发到预测模块81。视频解码器30可在视频切片层级和/或视频块层级接收语法元素。
当视频切片作为经帧内译码(I)切片译码时,预测模块81的帧内预测模块84可基于用信号通知的帧内预测模式和来自当前帧或图片的先前经解码块的数据产生当前视频切片的视频块的预测数据。当视频帧作为经帧间译码(即,B、P或GPB)切片译码时,预测模块81的运动补偿模块82基于从熵解码模块80接收的运动向量和其它语法元素产生当前视频切片的视频块的预测块。可从参考图片列表的一者内的参考图片的一者产生预测块。视频解码器30可基于存储在参考图片存储器92中的参考图片使用默认构造技术构造参考帧列表,列表0和列表1。
运动补偿模块82可通过解析运动向量和其它语法元素而确定当前视频切片的视频块的预测信息,且使用预测信息来产生正解码的当前视频块的预测块。举例来说,运动补偿模块82使用所接收的语法元素的一些来确定用于对视频切片的视频块进行译码的预测模式(例如,帧内或帧间预测)、帧间预测切片类型(例如,B切片、P切片或GPB切片)、切片的参考图片列表的一或多者的构造信息、切片的每一经帧间编码视频块的运动向量、切片的每一经帧间译码视频块的帧间预测状态,以及用以解码当前视频切片中的视频块的其它信息。
运动补偿模块82还可基于内插滤波器执行内插。运动补偿模块82可使用如视频编码器20在编码视频块期间使用的内插滤波器来计算参考块的子整数像素的经内插值。在此情况下,运动补偿模块82可从所接收语法元素确定视频编码器20使用的内插滤波器,且使用所述内插滤波器来产生预测块。
反向量化模块86对位流中提供且由熵解码模块80解码的经量化变换系数进行反向量化,即解量化。反向量化过程可包含针对视频切片中的每一视频块使用视频编码器20计算的量化参数来确定量化的程度,以及同样应施加的反向量化的程度。反向变换模块88对变换系数应用例如反向DCT、反向整数变换或概念上类似的反向变换过程等反向变换以便产生像素域中的残余块。
在运动补偿模块82基于运动向量和其它语法元素产生当前视频块的预测块之后,视频解码器30通过将来自反向变换模块88的残余块与运动补偿模块82产生的对应预测块相加而形成经解码视频块。加法器90表示执行此加法操作的组件。视需要,环形滤波器(译码回路中或译码回路之后)还可用于使像素转变平滑,或以其它方式改进视频质量。滤波器模块91希望表示例如解块滤波器、自适应环形滤波器(ALF)和样本自适应偏移(SAO)滤波器等一或多个环形滤波器。尽管滤波器模块91在图5中展示为在环形滤波器中,但在其它实施方案中,滤波器模块91可实施为后环形滤波器。给定帧或图片中的经解码视频块接着存储在参考图片存储器92中,参考图片存储器92存储用于后续运动补偿的参考图片。参考图片存储器92还存储经解码视频以供在显示装置(例如,图3的显示装置32)上呈现。
以此方式,图5的视频解码器30表示经配置以解码根据本发明的技术译码的参数集ID的视频解码器的实例。
图6是说明形成网络100的一部分的一组实例装置的框图。在此实例中,网络100包含路由装置104A、104B(路由装置104)、拼接装置106和源装置110、112。路由装置104和拼接装置106希望表示可形成网络100的一部分的较小数目的装置。例如开关、集线器、网关、防火墙、桥接器和其它此类装置等其它网络装置也可包含在网络100内。此外,可沿着网络路径在服务器装置102与客户端装置108之间提供额外网络装置。在一些实例中,服务器装置102可对应于源装置12(图3),而客户端装置108可对应于目的地装置14(图3)。源装置110、112可提供例如视频数据等可拼接在一起的一或多个位流。举例来说,源装置110可提供第一位流,且源装置112可提供第二位流。在一些实例中,第一和第二位流可由拼接装置106拼接在一起。
一股来说,路由装置104实施一或多个路由协议以经由网络100交换网络数据。在一些实例中,路由装置104可经配置以执行代理或高速缓存操作。因此,在一些实例中,路由装置104也可称为代理装置。一股来说,路由装置104执行路由协议以经由网络100发现路线,通过执行此类路由协议,路由装置104B可发现经由路由装置104A从其自身到服务器装置102的网络路线。
本发明的技术可由例如路由装置104和拼接装置106等网络装置实施。在各个实例中,客户端装置108可经配置以接收和处理根据本发明的技术拼接的位流。以此方式,路由装置104、拼接装置106和客户端装置108表示装置的实例,所述装置经配置以确定第一位流的第一参数集的参数集ID是否与第二位流的第一参数集的参数集ID相同;响应于第二位流的参数集ID与第一位流的参数集ID匹配,将第二位流的参数集ID改变为唯一参数集ID;且发射与唯一参数集ID相关联的新参数集。所述发射可在频带外发生。第一位流的参数集ID、第二位流的参数集ID和唯一参数集ID中的一或多者可使用固定长度代码译码。第一位流的参数集ID可与特定参数类型相关联,例如序列参数集类型、图片参数集类型、调适参数集类型或其它类型的参数集中的一者,且第二位流的参数集ID可与同第一位流的参数集ID相同类型的参数集相关联。第一位流可包括针对拼接点之前的一或多个经译码图片的经译码视频数据,且第二位流可包括针对拼接点之后的一或多个经译码图片的经译码视频数据。
在根据本发明的技术的一些实例中,例如服务器装置102等视频源可产生一或多个位流。不同位流可针对客户端装置108的信道改变请求提供针对相同视频编程的视频质量的差异,例如可使用较多带宽的较高质量视频信号,或可使用较少带宽或更有效使用带宽的较低质量视频信号。不同位流可提供可能结合主视频信号使用的商业或其它临时发射。例如服务器装置102、路由装置104A/B或拼接装置106内的处理器可确定第一位流的第一参数集的参数集ID是否与第二位流的第一参数集的参数集ID相同。这可因为位流经常使用极少SPS乃至仅一个SPS。位流可使用最小SPS ID值0。在此情况下,如果两个位流或其部分经拼接,那么有可能相同SPS ID由拼接点且由紧接在拼接点图片之前的图片参考(当实际上可使用两个不同SPS时)。响应于第二位流的参数集ID与第一位流的参数集ID匹配,处理器可将第二位流的参数集ID改变为唯一参数集ID。服务器装置102、路由装置104A/B或拼接装置106的一者可接着发射与唯一参数集ID相关联的新参数集。
图7是说明实施本发明的一或多个方面的实例方法的流程图。在根据本发明的技术的一些实例中,例如MANE等一些其它视频处理装置可将两个或两个以上位流拼接在一起。因此,MANE内的处理器或其它视频处理装置可确定第一位流的第一参数集的第一参数集ID是否与第二位流的第一参数集的第二参数集ID相同(700)。响应于第二位流的参数集ID与第一位流的参数集ID匹配,处理器可将第二位流的参数集ID改变为唯一参数集ID(702)。MANE或其它视频处理装置可接着发射与唯一参数集ID相关联的新参数集(704)。这可允许拼接两个位流,同时还确保例如解码器能够区分所拼接位流的参数集。
图8是说明用以实施本发明的一或多个方面的另一实例方法的流程图。在一实例中,视频译码器视频处理装置可接收与唯一参数集ID相关联的新参数集(800)。
所接收的新参数集可已从例如MANE等装置发射。例如MANE等装置可发射与唯一参数集ID相关联的新参数集。这可例如在装置确定第一位流的第一参数集的参数集ID与第二位流的第二参数集的参数集ID相同时发生。与唯一参数集ID相关联的新参数集的发射可响应于第二位流的参数集ID与第一位流的参数集ID匹配。因此,此装置可将第二位流的参数集ID改变为唯一参数集ID,且发射与唯一参数集ID相关联的新参数集。
例如视频解码器30或视频处理装置等视频译码器可基于第一位流的参数集ID和唯一参数集ID区分第一位流与第二位流(802)。
图9是说明根据本发明的方面图7的方法与图8的方法之间的交互的实例的流程图。在根据本发明的技术的所说明的实例中,例如MANE等一些其它视频处理装置可将两个或两个以上位流拼接在一起。因此,MANE内的处理器或其它视频处理装置可确定第一位流的第一参数集的参数集ID是否与第二位流的第一参数集的参数集ID相同(700)。响应于第二位流的参数集ID与第一位流的参数集ID匹配,处理器可将第二位流的参数集ID改变为唯一参数集ID(702)。MANE或其它视频处理装置可接着发射与唯一参数集ID相关联的新参数集(704)。
MANE或其它视频处理装置发射的新参数集可由例如视频编码器20或视频解码器30等视频译码器接收(800)。视频译码器(例如,视频编码器20和/或视频解码器30)可基于第一位流的参数集ID和唯一参数集ID区分第一位流与第二位流(802)。
图10是说明从图6中说明的例如拼接装置106等拼接装置的视角来看实施本发明的一或多个方面的实例方法的流程图。拼接装置106从客户端装置108接收检视第一信道的请求(1000)。第一信道可例如为视频数据。
拼接装置106响应于此请求将第一位流的视频数据(对应于第一信道)转发到客户端装置108(1002)。随后,拼接装置106可从客户端装置108接收检视第二信道的信道改变请求(1004)。第二信道可为例如完全不同的程序或相同程序但不同视频质量。
拼接装置106确定第二位流内的切换点(例如,IDR)图片(对应于第二信道)以用作拼接点(1006)。切换点可对应于例如随机存取点(RAP),例如瞬时解码器刷新(IDR)图片、清洁随机存取(CRA)图片、断开链接存取(BLA)图片等。当切换点用于将两个单独视频位流拼接为一个单一位流时,切换点可视为拼接点。在此实例中,拼接装置106确定与拼接点相关联的SPS具有与第一位流的SPS相同的SPS ID(1008)。一股来说,拼接装置106确定与拼接点相关联的SPS是否具有与第一位流的SPS相同的SPS ID,且如果是,那么不需要相对于SPS采取任何动作。
另一方面,基于SPS ID与第一位流的SPS相同的确定,拼接装置106可(1)将新SPS ID重新指派到第二信道的SPS,(2)在频带外将具有新SPS ID的SPS转发到客户端装置,(3)更新对第二信道的视频数据中的SPS ID的参考以参考新SPS ID,且(4)将第二位流的视频数据转发到客户端装置,使得转发到客户端装置的位流形成包含来自切换点之前的第一位流的数据和来自切换点之后的第二位流的数据的经拼接位流(1010)。
在一或多个实例中,所描述的功能可实施在硬件、软件、固件或其任何组合中。如果实施在软件中,那么所述功能可作为一或多个指令或代码存储在计算机可读媒体上或经由计算机可读媒体发射,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,其对应于例如数据存储媒体或通信媒体等有形媒体,通信媒体包含促进例如根据通信协议将计算机程序从一处传送到另一处的任何媒体。以此方式,计算机可读媒体通常可对应于(1)非暂时性有形计算机可读存储媒体,或(2)例如信号或载波等通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索指令、代码和/或数据结构以供实施本发明中描述的技术的任何可用媒体。计算机程序产品可包含计算机可读媒体。
借助说明而非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置,或其它磁性存储装置、快闪存储器,或可用于存储指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。并且,任何连接适当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源发射软件,那么同轴电缆、光纤电缆、双绞线、DSL或例如红外线、无线电和微波等无线技术包含在媒体的定义中。然而,应理解,计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它瞬时媒体,而是针对非瞬时有形存储媒体。如本文中所使用,磁盘和光盘包含紧密光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软磁盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘使用激光以光学方式再现数据。上文的组合也应包含在计算机可读媒体的范围内。
可由例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一或多个处理器来执行所述指令。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文描述的功能性可提供在经配置用于编码和解码的专门硬件和/或软件模块内,或并入在组合式编解码器中。另外,所述技术可完全实施在一或多个电路或逻辑元件中。
本发明的技术可实施在广泛多种装置或设备中,包含无线手持机、集成电路(IC)或IC组(例如,芯片组)。本发明中描述各种组件、模块或单元以强调经配置以执行所揭示的技术的装置的功能方面,但所述各种组件、模块或单元不必要求由不同硬件单元实现。事实上,如上文描述,各种单元可组合在编解码器硬件单元中或由互操作硬件单元的集合(包含如上文描述的一或多个处理器)结合适宜的软件和/或固件提供。
已描述了各种实例。这些和其它实例在所附权利要求书的范围内。
Claims (51)
1.一种解码视频数据的方法,所述方法包括:
接收具有经固定长度译码的参数集识别符ID的参数集,其中所述参数集的所述参数集ID在所述参数集中的经熵译码的任何语法元素之前;以及
使用具有所述经固定长度译码的识别符的所述参数集来解码视频数据。
2.根据权利要求1所述的方法,其进一步包括基于所接收的信令确定用于所述固定长度译码的位的数目。
3.根据权利要求1所述的方法,其进一步包括接收包括拼接在一起的第一位流和第二位流的经拼接位流,其中所述参数集ID包括所述第一位流的第一参数集的参数集ID和第二位流的第二参数集的参数集ID,且其中所述第一参数集ID不同于所述第二参数集ID。
4.根据权利要求3所述的方法,其进一步包括解码所述第一位流的所述第一参数集的所述参数集ID和所述第二位流的所述第二参数集的所述参数集ID中的一或多者。
5.根据权利要求3所述的方法,其中所述经拼接位流包括在拼接点之前的所述第一位流的视频数据和在所述拼接点之后的所述第二位流的视频数据。
6.根据权利要求1所述的方法,其进一步包括对对于参数集ID的参考进行译码,其中所述参考经固定长度译码且在所述参数集中的经熵译码的任何语法元素之前。
7.一种编码视频数据的方法,所述方法包括:
形成具有经固定长度译码的参数集ID的参数集,其中所述参数集的所述参数集ID在所述参数集中的经熵译码的任何语法元素之前;以及
使用具有所述经固定长度译码的识别符的所述参数集来编码视频数据。
8.根据权利要求7所述的方法,其进一步包括用信号通知用于所述ID的所述固定长度译码的位的数目。
9.根据权利要求7所述的方法,其进一步包括发射包括拼接在一起的第一位流和第二位流的经拼接位流,其中所述参数集ID包括所述第一位流的第一参数集的参数集ID和第二位流的第二参数集的参数集ID,且其中所述第一参数集ID不同于所述第二参数集ID。
10.根据权利要求9所述的方法,其进一步包括编码所述第一位流的所述第一参数集的所述参数集ID和所述第二位流的所述第二参数集的所述参数集ID中的一或多者。
11.根据权利要求9所述的方法,其中所述经拼接位流包括在拼接点之前的所述第一位流的视频数据和在所述拼接点之后的所述第二位流的视频数据。
12.根据权利要求7所述的方法,其进一步包括对对于参数集ID的参考进行译码,其中所述参考经固定长度译码且在所述参数集中的经熵译码的任何语法元素之前。
13.一种用于处理视频数据的设备,所述设备包括:
一或多个处理器,其经配置以:
处理具有经固定长度译码的参数集ID的参数集,其中所述参数集的所述参数集ID在所述参数集中的经熵译码的任何语法元素之前;且
使用具有所述经固定长度译码的识别符的所述参数集来对视频数据进行译码。
14.根据权利要求13所述的设备,其中所述一或多个处理器进一步经配置以基于所接收的信令确定用于所述固定长度译码的位的数目。
15.根据权利要求13所述的设备,其中所述一或多个处理器进一步经配置以接收包括拼接在一起的第一位流和第二位流的经拼接位流,其中所述参数集ID包括所述第一位流的第一参数集的参数集ID和第二位流的第二参数集的参数集ID,且其中所述第一参数集ID不同于所述第二参数集ID。
16.根据权利要求15所述的设备,其中所述一或多个处理器进一步经配置以对所述第一位流的所述第一参数集的所述参数集ID和所述第二位流的所述第二参数集的所述参数集ID中的一或多者进行译码。
17.根据权利要求15所述的设备,其中所述经拼接位流包括在拼接点之前的所述第一位流的视频数据和在所述拼接点之后的所述第二位流的视频数据。
18.根据权利要求13所述的设备,其中所述一或多个处理器进一步经配置以对对于参数集ID的参考进行译码,其中所述参考经固定长度译码且在所述参数集中的经熵译码的任何语法元素之前。
19.一种用于处理视频数据的设备,所述设备包括:
用于处理具有经固定长度译码的参数集ID的参数集的装置,其中所述参数集的所述参数集ID在所述参数集中的经熵译码的任何语法元素之前;以及
用于使用具有所述经固定长度译码的识别符的所述参数集来对视频数据进行译码的装置。
20.一种上面存储有指令的计算机可读存储媒体,所述指令当执行时致使装置的一或多个处理器:
处理具有经固定长度译码的参数集ID的参数集,其中所述参数集的所述参数集ID在所述参数集中的经熵译码的任何语法元素之前;且
使用具有所述经固定长度译码的识别符的所述参数集来对视频数据进行译码。
21.一种处理视频数据的方法,所述方法包括:
确定第一位流的第一参数集的第一参数集识别符ID是否与第二位流的第二参数集的第二参数集ID相同;
响应于确定所述第二参数集ID与所述第一参数集ID相同,将所述第二参数集ID改变为唯一参数集ID;以及
发射与所述唯一参数集ID相关联的参数集。
22.根据权利要求21所述的方法,其中发射包括相对于从拼接所述第一位流与所述第二位流中产生的经拼接位流的发射在频带外发射与所述唯一参数集ID相关联的所述参数集。
23.根据权利要求21所述的方法,其进一步包括使用固定长度代码对所述第一位流的所述第一参数集的所述参数集ID、所述第二位流的所述第二参数集的所述参数集ID和所述唯一参数集ID的一或多者进行译码。
24.根据权利要求21所述的方法,其中所述第一位流的所述第一参数集的所述参数集ID与包括序列参数集类型、图片参数集类型和调适参数集类型的一者的参数集类型相关联,且其中所述第二位流的所述第二参数集的所述参数集ID与同所述第一位流的所述第一参数集的所述参数集ID相同类型的参数集相关联。
25.根据权利要求21所述的方法,其中经拼接位流包括在拼接点之前的所述第一位流的视频数据和在所述拼接点之后的所述第二位流的视频数据。
26.根据权利要求21所述的方法,其中所述方法由视频处理装置执行。
27.根据权利要求26所述的方法,其中所述视频处理装置包括包含视频解码器的客户端装置、多路复用单元、视频预处理装置、处理器、由处理器执行的网络浏览器、路由器,或内容递送网络的装置中的一者。
28.根据权利要求26所述的方法,其进一步包括将所述第一位流与所述第二位流拼接在一起。
29.根据权利要求21所述的方法,其进一步包括更新对所述第二位流的相关联经译码视频数据中的所述第二参数集ID的参考使得所述参考改为针对所述唯一参数集ID。
30.根据权利要求21所述的方法,其进一步包括对对于参数集ID的参考进行译码,其中所述参考经固定长度译码且在所述参数集中的经熵译码的任何语法元素之前。
31.一种用于处理视频数据的设备,所述设备包括:
一或多个处理器,其经配置以:
确定第一位流的第一参数集的第一参数集ID是否与第二位流的第二参数集的第二参数集ID相同;
响应于确定所述第二参数集ID与所述第一参数集ID相同,将所述第二参数集ID改变为唯一参数集ID;以及
发射与所述唯一参数集ID相关联的参数集。
32.根据权利要求31所述的设备,其中发射包括相对于从拼接所述第一位流与所述第二位流中产生的经拼接位流的发射在频带外发射与所述唯一参数集ID相关联的所述参数集。
33.根据权利要求31所述的设备,其中所述一或多个处理器进一步经配置以使用固定长度代码对所述第一位流的所述第一参数集的所述参数集ID、所述第二位流的所述第二参数集的所述参数集ID和所述唯一参数集ID中的一或多者进行译码。
34.根据权利要求31所述的设备,其中所述第一位流的所述第一参数集的所述参数集ID与包括序列参数集类型、图片参数集类型和调适参数集类型的一者的参数集类型相关联,且其中所述第二位流的所述第二参数集的所述参数集ID与同所述第一位流的所述参数集ID相同类型的参数集相关联。
35.根据权利要求31所述的设备,其中经拼接位流包括在拼接点之前的所述第一位流的视频数据和在所述拼接点之后的所述第二位流的视频数据。
36.根据权利要求31所述的设备,其中所述设备包括视频处理装置。
37.根据权利要求36所述的设备,其中所述视频处理装置包括包含视频解码器的客户端装置、多路复用单元、视频预处理装置、处理器、由处理器执行的网络浏览器、路由器,或内容递送网络的装置中的一者。
38.根据权利要求36所述的设备,其中所述一或多个处理器进一步经配置以更新对所述第二位流的相关联经译码视频数据中的所述第二参数集ID的参考使得所述参考改为针对所述唯一参数集ID。
39.根据权利要求36所述的设备,其中所述视频处理装置包括媒体感知网络元件MANE。
40.根据权利要求36所述的设备,其中所述一或多个处理器进一步经配置以将所述第一位流与所述第二位流拼接在一起。
41.根据权利要求36所述的设备,其中所述一或多个处理器进一步经配置以对对于参数集ID的参考进行译码,其中所述参考经固定长度译码且在所述参数集中的经熵译码的任何语法元素之前。
42.一种用于处理视频数据的设备,所述设备包括:
用于确定第一位流的第一参数集的第一参数集ID是否与第二位流的第二参数集的第二参数集ID相同的装置;
用于响应于确定所述第二参数集ID与所述第一参数集ID相同将所述第二参数集ID改变为唯一参数集ID的装置;以及
用于发射与所述唯一参数集ID相关联的参数集的装置。
43.根据权利要求42所述的设备,其中发射包括相对于从拼接所述第一位流与所述第二位流中产生的经拼接位流的发射在频带外发射与所述唯一参数集ID相关联的所述参数集。
44.根据权利要求42所述的设备,其进一步包括用于使用固定长度代码对所述第一位流的所述第一参数集的所述参数集ID、所述第二位流的所述第二参数集的所述参数集ID和所述唯一参数集ID的一或多者进行译码的装置。
45.根据权利要求42所述的设备,其中所述第一位流的所述第一参数集的所述参数集ID与包括序列参数集类型、图片参数集类型和调适参数集类型的一者的参数集类型相关联,且其中所述第二位流的所述第二参数集的所述参数集ID与同所述第一位流的所述第一参数集的所述参数集ID相同类型的参数集相关联。
46.根据权利要求42所述的设备,其中经拼接位流包括在拼接点之前的所述第一位流的视频数据和在所述拼接点之后的所述第二位流的视频数据。
47.一种上面存储有指令的计算机可读存储媒体,所述指令当执行时致使装置的一或多个处理器:
确定第一位流的第一参数集的第一参数集ID是否与第二位流的第二参数集的第二参数集ID相同;
响应于确定所述第二参数集ID与所述第一参数集ID相同,将所述第二参数集ID改变为唯一参数集ID;且
发射与所述唯一参数集ID相关联的参数集。
48.根据权利要求47所述的计算机可读存储媒体,其中发射包括相对于从拼接所述第一位流与所述第二位流中产生的经拼接位流的发射在频带外发射与所述唯一参数集ID相关联的所述参数集。
49.根据权利要求47所述的计算机可读存储媒体,其进一步包括致使所述一或多个处理器使用固定长度代码对所述第一位流的所述第一参数集的所述参数集ID、所述第二位流的所述第二参数集的所述参数集ID和所述唯一参数集ID中的一或多者进行译码的指令。
50.根据权利要求47所述的计算机可读存储媒体,其中所述第一位流的所述第一参数集的所述参数集ID与包括序列参数集类型、图片参数集类型和调适参数集类型的一者的参数集类型相关联,且其中所述第二位流的所述第二参数集的所述参数集ID与同所述第一位流的所述第一参数集的参数集ID相同类型的参数集相关联。
51.根据权利要求47所述的计算机可读存储媒体,其中经拼接位流包括在拼接点之前的所述第一位流的视频数据和在所述拼接点之后的所述第二位流的视频数据。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261638999P | 2012-04-26 | 2012-04-26 | |
US61/638,999 | 2012-04-26 | ||
US13/870,548 | 2013-04-25 | ||
US13/870,548 US9813705B2 (en) | 2012-04-26 | 2013-04-25 | Parameter set coding |
PCT/US2013/038382 WO2013163525A1 (en) | 2012-04-26 | 2013-04-26 | Parameter set coding |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104322071A true CN104322071A (zh) | 2015-01-28 |
CN104322071B CN104322071B (zh) | 2018-09-28 |
Family
ID=49477265
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380021749.8A Expired - Fee Related CN104322071B (zh) | 2012-04-26 | 2013-04-26 | 用于处理视频数据的方法及设备,以及计算机可读存储媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9813705B2 (zh) |
JP (2) | JP6177884B2 (zh) |
CN (1) | CN104322071B (zh) |
WO (1) | WO2013163525A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114189694A (zh) * | 2018-11-07 | 2022-03-15 | 华为技术有限公司 | 用于视频译码的参数集 |
CN115136605A (zh) * | 2019-12-20 | 2022-09-30 | 佳能株式会社 | 用于视频编码和解码的高级句法 |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9992490B2 (en) * | 2012-09-26 | 2018-06-05 | Sony Corporation | Video parameter set (VPS) syntax re-ordering for easy access of extension parameters |
US20140085415A1 (en) * | 2012-09-27 | 2014-03-27 | Nokia Corporation | Method and apparatus for video coding |
RU2651201C2 (ru) * | 2012-11-30 | 2018-04-18 | Сони Корпорейшн | Устройство обработки изображения и способ |
US10419778B2 (en) | 2013-01-04 | 2019-09-17 | Sony Corporation | JCTVC-L0227: VPS_extension with updates of profile-tier-level syntax structure |
US10219006B2 (en) | 2013-01-04 | 2019-02-26 | Sony Corporation | JCTVC-L0226: VPS and VPS_extension updates |
JP6652320B2 (ja) * | 2013-12-16 | 2020-02-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 送信方法、受信方法、送信装置及び受信装置 |
EP3703379B1 (en) | 2013-12-16 | 2022-06-22 | Panasonic Intellectual Property Corporation of America | Transmission method, reception method, transmitting device, and receiving device |
US9854270B2 (en) * | 2013-12-19 | 2017-12-26 | Qualcomm Incorporated | Device and method for scalable coding of video information |
CN106664424A (zh) * | 2014-01-03 | 2017-05-10 | 诺基亚技术有限公司 | 参数集编码 |
US10506244B2 (en) * | 2015-03-06 | 2019-12-10 | Qualcomm Incorporated | Method and apparatus for video coding using adaptive tile sizes |
US10595048B1 (en) * | 2018-09-13 | 2020-03-17 | Tencent America LLC | Method and device using high layer syntax architecture for coding and decoding |
GB2584295A (en) * | 2019-05-28 | 2020-12-02 | Canon Kk | Method and apparatus for encoding and decoding a video bitstream for merging regions of interest |
EP4026094A4 (en) * | 2019-10-07 | 2022-11-09 | Huawei Technologies Co., Ltd. | VIDEO-BASED POINT CLOUD COMPRESSION (V-PCC) TIME INFORMATION |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005123907A (ja) * | 2003-10-16 | 2005-05-12 | Matsushita Electric Ind Co Ltd | データ再構成装置 |
CN101461246A (zh) * | 2006-06-02 | 2009-06-17 | 松下电器产业株式会社 | 编码设备和编辑设备 |
CN101485208A (zh) * | 2006-07-05 | 2009-07-15 | 汤姆森许可贸易公司 | 多视图视频的编码和解码方法及装置 |
CN101569197A (zh) * | 2006-12-21 | 2009-10-28 | 汤姆森许可贸易公司 | 针对多视点视频编码和解码使用高级语法进行改进信号通知的方法和装置 |
WO2011015369A1 (en) * | 2009-08-07 | 2011-02-10 | Dolby International Ab | Authentication of data streams |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2005299534A1 (en) * | 2004-10-21 | 2006-05-04 | Sony Electonics, Inc. | Supporting fidelity range extensions in advanced video codec file format |
JP4757840B2 (ja) | 2006-06-02 | 2011-08-24 | パナソニック株式会社 | 符号化装置及び編集装置 |
US20120170648A1 (en) | 2011-01-05 | 2012-07-05 | Qualcomm Incorporated | Frame splitting in video coding |
EP4020989A1 (en) | 2011-11-08 | 2022-06-29 | Nokia Technologies Oy | Reference picture handling |
CN104160706B (zh) * | 2012-01-20 | 2018-12-28 | 诺基亚技术有限公司 | 对图像进行编码的方法和装置以及对图像比特流进行解码的方法和装置 |
EP2810443B1 (en) | 2012-02-01 | 2021-03-31 | Nokia Technologies Oy | Method and apparatus for video coding |
US9197888B2 (en) | 2012-03-13 | 2015-11-24 | Dolby Laboratories Licensing Corporation | Overlapped rate control for video splicing applications |
CA2870067C (en) * | 2012-04-16 | 2017-01-17 | Nokia Corporation | Video coding and decoding using multiple parameter sets which are identified in video unit headers |
-
2013
- 2013-04-25 US US13/870,548 patent/US9813705B2/en active Active
- 2013-04-26 JP JP2015509174A patent/JP6177884B2/ja active Active
- 2013-04-26 CN CN201380021749.8A patent/CN104322071B/zh not_active Expired - Fee Related
- 2013-04-26 WO PCT/US2013/038382 patent/WO2013163525A1/en active Application Filing
-
2017
- 2017-05-15 JP JP2017096654A patent/JP2017195607A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005123907A (ja) * | 2003-10-16 | 2005-05-12 | Matsushita Electric Ind Co Ltd | データ再構成装置 |
CN101461246A (zh) * | 2006-06-02 | 2009-06-17 | 松下电器产业株式会社 | 编码设备和编辑设备 |
CN101485208A (zh) * | 2006-07-05 | 2009-07-15 | 汤姆森许可贸易公司 | 多视图视频的编码和解码方法及装置 |
CN101569197A (zh) * | 2006-12-21 | 2009-10-28 | 汤姆森许可贸易公司 | 针对多视点视频编码和解码使用高级语法进行改进信号通知的方法和装置 |
WO2011015369A1 (en) * | 2009-08-07 | 2011-02-10 | Dolby International Ab | Authentication of data streams |
Non-Patent Citations (1)
Title |
---|
JILL BOYCE, DANNY HONG, STEPHAN WENGER: "Extensible High Layer Syntax for Scalability", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC)》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114189694A (zh) * | 2018-11-07 | 2022-03-15 | 华为技术有限公司 | 用于视频译码的参数集 |
CN115136605A (zh) * | 2019-12-20 | 2022-09-30 | 佳能株式会社 | 用于视频编码和解码的高级句法 |
Also Published As
Publication number | Publication date |
---|---|
US9813705B2 (en) | 2017-11-07 |
WO2013163525A1 (en) | 2013-10-31 |
JP2017195607A (ja) | 2017-10-26 |
JP2015518352A (ja) | 2015-06-25 |
CN104322071B (zh) | 2018-09-28 |
US20130287115A1 (en) | 2013-10-31 |
JP6177884B2 (ja) | 2017-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104322071A (zh) | 参数集译码 | |
KR101776448B1 (ko) | 비디오 코딩에 있어서의 비-네스팅된 sei 메시지들 | |
CN104272746B (zh) | 用于视频序列中的随机存取点图片的经解码图片缓冲器处理 | |
CN104429082B (zh) | 用于视频译码的长期参考图片的信令 | |
CN104429084B (zh) | 包含固定长度译码的视频参数集id(vps_id)的sei消息 | |
KR101770901B1 (ko) | 비디오 코딩에서의 롱텀 레퍼런스 픽쳐 시그널링 | |
KR101578314B1 (ko) | 비디오 코딩을 위한 단편화된 파라미터 세트 | |
CN104823449A (zh) | 在视频译码中用信号表示关注区和逐渐解码刷新 | |
CN104396253A (zh) | 用于高效视频译码(hevc)和扩展的视频参数集 | |
CN103430539A (zh) | 经解码图片缓冲器管理 | |
JP7018447B2 (ja) | 仮想現実アプリケーション用の、動き制約タイルセットのシグナリングのためのシステム及び方法 | |
CN104704843A (zh) | 视频性质的指示 | |
CN103828374A (zh) | 参考图片信令和经解码图片缓冲器管理 | |
CN105052156A (zh) | Irap存取单元与位流切换及拼接 | |
CN105122798B (zh) | 多层视频译码中的交叉层图片类型对准的指示 | |
CN105379271A (zh) | 帧内随机接入点图片的改进的跨层对齐 | |
CN105409219A (zh) | 高效率视频译码扩展中的目标输出层的选择 | |
CN103988437A (zh) | 用于上下文自适应二进制算术译码的上下文缩减 | |
CN105052149A (zh) | 改进的有效负载格式设计 | |
CN104488267A (zh) | 平铺块及波前并行处理 | |
CN104205829A (zh) | 合并信令及环路滤波器开/关信令 | |
CN104429081A (zh) | 基于干净随机存取(cra)图片的流式传输适应 | |
CN104272742A (zh) | 加权预测参数译码 | |
JP6199320B2 (ja) | 3次元ビデオコーディングのためのネットワーク抽象化レイヤ(nal)ユニットヘッダ設計 | |
CN105230016A (zh) | 用于视频译码的具有解码次序编号的单个网络抽象层单元包 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180928 Termination date: 20190426 |
|
CF01 | Termination of patent right due to non-payment of annual fee |