CN103190147B - 用于视频译码的语法元素的联合译码方法及设备 - Google Patents

用于视频译码的语法元素的联合译码方法及设备 Download PDF

Info

Publication number
CN103190147B
CN103190147B CN201180052536.2A CN201180052536A CN103190147B CN 103190147 B CN103190147 B CN 103190147B CN 201180052536 A CN201180052536 A CN 201180052536A CN 103190147 B CN103190147 B CN 103190147B
Authority
CN
China
Prior art keywords
converter unit
sub
cbf
chromatic component
code word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201180052536.2A
Other languages
English (en)
Other versions
CN103190147A (zh
Inventor
王翔林
马尔塔·卡切维奇
钱威俊
陈培松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN103190147A publication Critical patent/CN103190147A/zh
Application granted granted Critical
Publication of CN103190147B publication Critical patent/CN103190147B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

在一个实例中,一种视频解码器经配置以基于视频数据的译码单元的变换单元的码字确定所述变换单元的分量是否包括至少一个非零系数,基于所述码字确定所述变换单元是否分裂成子变换单元,和基于所述确定对所述变换单元进行解码。在另一实例中,一种视频编码器经配置以确定视频数据的译码单元的变换单元的分量是否包括至少一个非零系数,确定所述变换单元是否分裂成子变换单元,从可变长度码表中选择码字,其中所述可变长度码表提供关于所述码字对应于所述确定的指示,并且提供所述变换单元的所述码字。

Description

用于视频译码的语法元素的联合译码方法及设备
根据35U.S.C.§119主张优先权
本申请案主张以下申请案的权益:2010年11月1日申请的第61/409,052号美国临时申请案;2010年11月2日申请的第61/409,471号美国临时申请案;2011年1月13日申请的第61/432,548号美国临时申请案;2011年1月23日申请的第61/435,344号美国临时申请案;2011年3月4日申请的第61/449,556号美国临时申请案;2011年3月8日申请的第61/450,554号美国临时申请案;以及2011年3月10日申请的第61/451,448号美国临时申请案,以上申请案中的每一者的整个内容以引用的方式并入本文中。
技术领域
本发明涉及视频译码,且更明确地说涉及用于经译码视频数据的语法信息。
背景技术
数字视频能力可并入到广泛范围的装置中,包括数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频电话会议装置及类似装置。数字视频装置实施视频压缩技术,例如通过MPEG-2、MPEG-4、ITU-TH.263、ITU-TH.264/MPEG-4第10部分、高级视频译码(AVC)、即将来临的高效率视频译码(HEVC)标准和此类标准的扩展部分定义的标准中描述的技术,以便更有效地发射和接收数字视频信息。
视频压缩技术执行空间预测和/或时间预测,以减少或移除视频序列中所固有的冗余。对于基于块的视频译码,一视频帧或切片可以分割成视频块。每个视频块可被进一步分割。使用相对于相邻视频块的空间预测来对经帧内译码(I)帧或切片中的视频块进行编码。可以使用相对于同一帧或切片中的相邻视频块的空间预测或使用相对于其它参考帧的时间预测来对经帧间译码(P或B)帧或切片中的视频块进行编码。
发明内容
总的来说,本发明描述用于对视频数据的译码单元(CU)的变换单元(TU)的经译码块旗标(CBF)和变换分裂旗标(TSF)语法元素进行译码的技术。TU包括CU的一个或一个以上分量(例如,色度和亮度分量)的残余数据。TU的CBF指示CU的相应分量的TU的残余数据是否包括至少一个非零系数。TU的TSF指示所述TU是否分割或“分裂”成子TU。本发明的技术包括对TU的CBF和TSF进行联合译码,这可以改进压缩效率。
在一个实例中,一种对视频数据进行解码的方法包括:基于视频数据的译码单元的变换单元的码字确定所述变换单元的分量是否包括至少一个非零系数,基于所述码字确定所述变换单元是否分裂成子变换单元,和基于所述确定对所述变换单元进行解码。
在另一实例中,一种用于对视频数据进行解码的设备包括视频解码器,所述视频解码器经配置以基于视频数据的译码单元的变换单元的码字确定所述变换单元的分量是否包括至少一个非零系数,基于所述码字确定所述变换单元是否分裂成子变换单元,和基于所述确定对所述变换单元进行解码。
在另一实例中,一种用于对视频数据进行解码的设备包括:用于基于视频数据的译码单元的变换单元的码字确定所述变换单元的分量是否包括至少一个非零系数的装置,用于基于所述码字确定所述变换单元是否分裂成子变换单元的装置,和用于基于所述确定对所述变换单元进行解码的装置。
在另一实例中,一种计算机程序产品包括上面存储有指令的计算机可读媒体,所述指令在执行时致使可编程处理器进行以下操作:基于视频数据的译码单元的变换单元的码字确定所述变换单元的分量是否包括至少一个非零系数,基于所述码字确定所述变换单元是否分裂成子变换单元,和基于所述确定对所述变换单元进行解码。
在另一实例中,一种对视频数据进行编码的方法包括:确定视频数据的译码单元的变换单元的分量是否包括至少一个非零系数;确定所述变换单元是否分裂成子变换单元;从可变长度码表中选择码字,其中所述可变长度码表提供关于所述码字对应于所述确定的指示;以及提供所述变换单元的所述码字。在此实例中,所述方法可以进一步包括将所述码字发送到位流中。
在另一实例中,一种用于对视频数据进行编码的设备包括视频编码器,所述视频编码器经配置以确定视频数据的译码单元的变换单元的分量是否包括至少一个非零系数,确定所述变换单元是否分裂成子变换单元,从可变长度码表中选择码字,其中所述可变长度码表提供关于所述码字对应于所述确定的指示,并且提供所述变换单元的所述码字。在此实例中,视频编码器可以进一步经配置以将码字发送到位流中。
在另一实例中,一种用于对视频数据进行编码的设备包括:用于确定视频数据的译码单元的变换单元的分量是否包括至少一个非零系数的装置;用于确定所述变换单元是否分裂成子变换单元的装置;用于从可变长度码表中选择码字的装置,其中所述可变长度码表提供关于所述码字对应于所述确定的指示;以及用于提供所述变换单元的所述码字的装置。在此实例中,所述设备可以进一步包括用于将所述码字发送到位流中的装置。
在另一实例中,一种计算机程序产品包括上面存储有指令的计算机可读媒体,所述指令在执行时致使处理器进行以下操作:确定视频数据的译码单元的变换单元的分量是否包括至少一个非零系数,确定所述变换单元是否分裂成子变换单元,从可变长度码表中选择码字,其中所述可变长度码表提供关于所述码字对应于所述确定的指示,并且提供所述变换单元的所述码字。在此实例中,所述计算机程序产品可以进一步包含致使所述处理器将所述码字发送到位流中的指令。
在附图和以下描述中陈述本发明的一个或一个以上方面的细节。从描述和图式并从权利要求书将明白本发明中所描述的技术的其它特征、目的和优点。
附图说明
图1是说明视频编码和解码系统的实例的框图,所述视频编码和解码系统可以实施用于对视频数据的译码单元(CU)的变换单元(TU)的一个或一个以上经译码块旗标(CBF)和一变换分裂旗标(TSF)进行联合译码的技术。
图2是说明视频编码器的实例的框图,所述视频编码器可以实施用于对视频数据的CU的TU的一个或一个以上CBF和一TSF进行联合编码的技术。
图3是说明视频解码器的实例的框图,所述视频解码器可以实施用于对视频数据的CU的TU的经联合编码的一个或一个以上CBF和一TSF进行解码的技术。
图4是说明视频数据的CU的TU的实例的概念图。
图5A是说明视频数据的CU的TU的实例的概念图。
图5B是说明残余四叉树变换数据结构的实例的概念图,其表示图5A的TU的分区信息。
图5C是说明视频数据的CU的TU的均匀分区结构的实例的概念图。
图6是说明用于对视频数据的CU的TU的一个或一个以上CBF和一TSF进行联合编码的实例方法的流程图。
图7是说明用于对视频数据的CU的TU的经联合编码的一个或一个以上CBF和一TSF进行解码的实例方法的流程图。
图8是说明用于对视频数据的CU的TU的亮度CBF、色度CBF和TSF进行联合编码的实例方法的流程图。
图9是说明用于对视频数据的CU的TU的经联合编码的亮度CBF、色度CBF和TSF进行解码的实例方法的流程图。
具体实施方式
总的来说,本发明描述用于对视频数据的译码单元(CU)的变换单元(TU)的经译码块旗标(CBF)和变换分裂旗标(TSF)语法元素进行译码的技术。在本发明中,“译码”总体上既指代在编码器处对视频数据进行编码,又指代在解码器处对视频数据进行解码。CU总体上包括一个或一个以上预测单元(PU),其指示如何形成用于所述CU的预测数据。TU包括残余数据,也就是说,原始视频数据与预测数据之间的逐像素差,或包括残余数据的经变换版本,即变换系数。视频数据的帧可以划分成最大CU(LCU),其可以进一步分割成子CU。CU四叉树可以描述如何将LCU分割成子CU,和如何将每一子CU分割成另外的子CU。
未分割的CU对应于CU四叉树的一个叶节点。此CU可被称为一个叶节点CU。每一叶节点CU包括一个或一个以上PU和一个或一个以上TU。类似于CU,叶节点CU的TU可以根据TU四叉树分割成子TU。TU四叉树的每一节点可包括一个TSF语法元素,其中所述TSF指示对应于所述节点的TU是否“分裂”,也就是说,分割成子TU。
总的来说,视频数据是在YUV颜色空间而非RGB颜色空间中被译码。RGB颜色空间描述像素的红色、绿色和蓝色分量的值,而YUV颜色空间描述像素的亮度(Y)和色度(U和V)分量的值,其中U通常表示色度的蓝色调,而V表示色度的红色调。YUV颜色空间还被描述为YCbCr,其中Cb是指蓝色调,而Cr是指红色调。CU的TU通常包括一个或一个以上分量,其中所述分量中的每一者对应于CU的Y、U或V分量中的一者。举例来说,TU可包括用以表示亮度数据的Y分量,用以表示蓝色调数据的U分量,和用以表示红色调数据的V分量。
TU四叉树的每一节点还可包括一个或一个以上CBF语法元素,其中每一CBF指示对应于所述节点的TU的对应分量是否经译码。明确地说,当TU的分量包括至少一个非零系数时,所述分量被视为“经译码”。换句话说,当TU的分量包括具有大于零的绝对值的至少一个系数时,所述分量被视为经译码。TU的分量的CBF具有表示所述分量是否经译码的值,也就是说,所述分量是否包括至少一个非零系数,或换句话说,具有大于零的绝对值的至少一个系数。
在对用于对CU进行译码的视频数据的CU的TU的CBF和TSF语法元素进行译码时,本发明的技术可以改进压缩效率。应注意在此背景下,当视频数据的CU的TU的CBF或TSF被编码或解码时,也就是说,当编码器或解码器在经联合译码的CBF和TSF与VLC码字之间映射值时,所述CBF或所述TSF“经译码”。总的来说,这些技术的研发过程中执行的经验测试已经显示了视频数据的CU的TU的CBF与TSF之间的相关。举例来说,总的来说,当一个TU分裂成子TU时,可能所述TU的分量也经译码。作为另一实例,当TU的分量未经译码时,可能所述TU未分裂成子TU。同一TU的分量是否经译码之间也可能存在相关。举例来说,当TU的一个分量经译码时,可能TU的其它分量也经译码。
使用可变长度译码(VLC)技术对视频数据的CU的TU的相关语法元素(例如,一个或一个以上CBF和一TSF)进行联合译码可以改进压缩效率。举例来说,因为所述相关,语法元素的值的某些组合可能比其它组合有更大可能。因此,当使用VLC技术对相关语法元素进行联合译码时,可以给较大可能的组合指派比其它较小可能的组合短的VLC码字。以此方式,对应于较大可能的组合的码字可包含比对应于较小可能的组合的码字少的位。举例来说,对应于最可能组合的码字可包含仅单个位。因此,应用本发明的技术可以产生一个位流,其与例如对每一语法元素使用单个位旗标对TU单独地对语法元素进行译码相比在最可能情况下更有效地表示所述语法元素。
另外,再一次使用VLC技术基于子TU的另一相关语法元素(例如,CBF)的值对视频数据的CU的TU的子TU的相关语法元素(例如,TSF)中的一者进行联合译码也可改进压缩效率。举例来说,因为上文所描述的相关,对于给定子TU,取决于另一相关语法元素的值,相关语法元素中的一者的某些值可能比其它值有更大可能。作为一个实例,取决于子TU的给定CBF的一个值,子TU的TSF的某些值可能比其它值有更大可能。因此,当对子TU的TSF进行联合译码时,取决于子TU的CBF的值(例如,子TU的亮度(Y)分量的CBF),TSF的值的某些组合可能比其它组合有更大可能。其结果是,为了对TSF进行联合译码,可以基于CBF的值选择不同VLC表,从而使得可以向在给定CBF的值的情况下有较大可能的TSF的值的组合指派比其它较小可能的组合短的VLC码字。
类似地,取决于子TU的TSF的值,子TU的给定CBF的某些值可能比其它值有更大可能。因此,当对子TU的CBF(其对应于子TU中的每一者的一个特定分量(例如,亮度(Y)分量))进行联合译码时,取决于子TU的TSF的值,CBF的值的某些组合可能比其它组合有更大可能。其结果是,为了对CBF进行联合译码,可以基于TSF的值选择不同VLC表,从而使得可以向在给定TSF的值的情况下有较大可能的CBF的值的组合指派比其它较小可能的组合短的VLC码字。同样,应用本发明的技术可以产生一个位流,其与例如对每一语法元素使用单个位旗标对子TU单独地对语法元素进行译码相比在最可能情况下更有效地表示所述子TU的语法元素。
所以,本发明的技术包括对视频数据的CU的TU的一个或一个以上CBF和一TSF进行联合译码。在一些实例中,当可以推断出CBF中的一者或一者以上的值或TU的TSF的值时,不需要将所述CBF或TSF与TU的其余CBF和/或TSF联合译码。
作为一个实例,在TU的第一色度分量是否经译码与TU的第二色度分量是否经译码之间可以存在相关。举例来说,当TU的第一色度分量(例如,U)经译码时,可能TU的第二色度分量(例如,V)也经译码。所以,当对TU的一个或一个以上CBF和TSF进行联合译码时,本发明的技术可包括对表示TU的两个色度分量的CBF进行译码。也就是说,本发明的技术包括对TU的色度分量的CBF进行逐位“或”运算。以此方式,本发明的技术包括提供TU的色度CBF(例如,CBFC),其中CBFC表示CBFU|CBFV,其中U和V是指TU的色度分量,并且‘|'是指逐位“或”运算符。CBFC可以进一步与TU的TSF一起被联合译码。当TU的CBFC的值指示TU的色度分量中的至少一者经译码时,可以提供额外信息,其指示TU的每一个别色度分量是否经译码。在一些实例中,当可以推断出TU的色度分量的CBF中的一者的值时,不需要提供额外信息。
在其它实例中,如前所述,视频数据的CU的TU的每一子TU是否分裂成另外的子TU与每一子TU的一个或一个以上分量是否经译码之间也可以存在相关。作为一个实例,当每一子TU分裂成另外的子TU时,可能每一子TU的一个或一个以上分量(例如,Y分量)经译码。另外,当每一子TU的一个或一个以上分量未经译码时,可能每一子TU未分裂成另外的子TU。所以,本发明的技术包括对视频数据的CU的TU的子TU的TSF进行联合译码。举例来说,本发明的技术可包括在每一子TU的CBF都未经译码(即,推断出子TU的CBF的值)时对子TU的TSF进行联合译码。同样,当可以推断出子TU的TSF中的一者或一者以上的值时,TSF不需要与子TU的其余的TSF一起经联合译码。
另外,本发明的技术包括对子TU中的每一者的分量的CBF进行联合译码。举例来说,所述技术可包括在每一子TU的色度分量的CBF都未经译码(即,推断出子TU的色度分量的CBF的值)时和当子TU中的每一者的TSF也未经译码(即,也推断出子TU的TSF的值)时对子TU中的每一者的Y分量的CBF进行联合译码。同样,当可以推断出子TU中的每一者的分量的CBF中的一者或一者以上的值时,CBF不需要与子TU的其余的CBF一起经联合译码。
图1是说明视频编码和解码系统10的实例的框图,所述视频编码和解码系统可以实施用于对视频数据的CU的TU的一个或一个以上CBF和一TSF进行联合译码的技术。如图1中所示,系统10包括源装置12,其经由通信信道16将经编码视频发射到目的装置14。源装置12和目的装置14可包含各种各样的装置中的任一者。在一些情况下,源装置12和目的装置14可包含无线通信装置,例如无线手持机、所谓的蜂窝式或卫星无线电电话,或可在通信信道16上(在此情况下,通信信道16为无线的)传送视频信息的任何无线装置。
但是,本发明的技术(其涉及对视频数据的CU的TU的一个或一个以上CBF和一TSF进行联合译码)不必限于无线应用或设置。举例来说,这些技术可适用于空中电视广播、有线电视发射、卫星电视发射、因特网视频发射、经编码到存储媒体上的经编码数字视频,或其它情况。因此,通信信道16可包含适合于发射经编码视频数据的无线媒体或有线媒体的任何组合。
在图1的实例中,源装置12包括视频源18、视频编码器20、调制器/解调器(调制解调器)22和发射器24。目的装置14包括接收器26、调制解调器28、视频解码器30和显示装置32。根据本发明,源装置12的视频编码器20和/或目的装置14的视频解码器30可经配置以应用用于对视频数据的CU的TU的一个或一个以上CBF和一TSF进行联合译码的技术。在其它实例中,源装置和目的装置可包括其它组件或布置。举例来说,源装置12可以从外部视频源18(例如外部相机)接收视频数据。同样,目的装置14可以与外部显示装置介接,而非包括集成显示装置。
图1的所说明的系统10只是一个实例。可以通过任何数字视频编码和/或解码装置来执行用于对视频数据的CU的TU的一个或一个以上CBF和一TSF进行联合译码的技术。尽管本发明的技术总体上通过视频编码装置或视频解码装置来执行,但是所述技术还可通过视频编码器/解码器(通常被称作“编解码器”)执行。源装置12和目的装置14仅为这些译码装置的实例,其中源装置12产生用于发射到目的装置14的经译码视频数据。在一些实例中,装置12、14可以用大体上对称的方式操作以使得装置12、14中的每一者包括视频编码和解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频发射,例如用于视频流式传输、视频回放、视频广播或视频电话。
源装置12的视频源18可包括视频俘获装置,例如摄像机、含有先前所俘获视频的视频档案和/或来自视频内容提供者的视频馈送。作为另一替代方案,视频源18可产生基于计算机图形的数据作为源视频,或直播视频(livevideo)、存档视频与计算机产生的视频的组合。在一些情况下,如果视频源18为摄像机,那么源装置12和目的装置14可形成所谓的相机电话或视频电话。但是,如上文所提及,本发明中所描述的技术可总体上适用于视频译码,且可应用于无线和/或有线应用。在每一情况下,可通过视频编码器20来对经俘获的、经预先俘获的或计算机产生的视频进行编码。经编码视频信息可接着通过调制解调器22根据通信标准来调制,且经由发射器24而发射到目的装置14。调制解调器22可包括各种混频器、滤波器、放大器或经设计以用于信号调制的其它组件。发射器24可包括经设计以用于发射数据的电路,包括放大器、滤波器和一个或一个以上天线。
目的装置14的接收器26经由信道16接收信息,并且调制解调器28对所述信息进行解调。同样,上文所描述的视频编码过程可以实施本文所述的技术中的一者或一者以上以便对视频数据的CU的TU的一个或一个以上CBF和一TSF进行联合译码。经由信道16传送的信息可包括由视频编码器20定义的语法信息,此信息还可由视频解码器30使用,并且可包括例如描述视频数据的CU的TU的分量是否包括至少一个非零系数(也就是说,所述分量是否经译码)和所述TU是否分裂成子TU的语法元素。视频解码器30使用此语法信息以及位流中的其它数据来对经编码位流进行解码,并且将经解码信息传递到显示装置32。显示装置32又将经解码视频数据显示给用户,并且可包含多种显示装置中的任一者,例如阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
在图1的实例中,通信信道16可包含任一无线或有线通信媒体,例如,射频(RF)频谱或一个或一个以上物理传输线、或无线和有线媒体的任一组合。通信信道16可形成例如局域网、广域网或例如因特网的全球网络的基于包的网络的部分。通信信道16总体上表示用于将视频数据从源装置12发射到目的装置14的任何合适的通信媒体或不同通信媒体的集合,包括有线或无线媒体的任何合适组合。通信信道16可包括可用于促进从源装置12到目的装置14的通信的路由器、交换器、基站或任何其它设备。
视频编码器20和视频解码器30可以根据一种视频压缩标准(例如ITU-TH.264标准,替代地被称作MPEG-4,第10部分,高级视频译码(AVC))操作。但是,本发明的技术不限于任何特定译码标准。其它实例包括MPEG-2、ITU-TH.263和即将来临的高效率视频译码(HEVC)标准。总的来说,相对于HEVC描述本发明的技术,但应理解这些技术同样可以结合其它视频译码标准使用。尽管图1中未展示,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器和解码器集成,且可包括适当的MUX-DEMUX单元或其它硬件和软件,以处理对共同数据流或单独数据流中的音频与视频两者的编码。如果适用,MUX-DEMUX单元可符合ITUH.223多路复用器协议或例如用户数据报协议(UDP)等其它协议。
视频编码器20和视频解码器30各自可实施为多种合适的编码器和解码器电路中的任一者,例如一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。视频编码器20和视频解码器30中的每一者可包括于一个或一个以上编码器或解码器中,其中的任一者可作为组合式编码器/解码器(编解码器)的一部分而集成于相应相机、计算机、移动装置、订户装置、广播装置、机顶盒、服务器等装置中。
视频序列通常包括一系列视频帧。图片群组(GOP)总体上包括一系列一个或一个以上视频帧。GOP可包括GOP的标头、GOP的一个或一个以上帧的标头或其它地方中的语法数据,其描述GOP中包括的帧的数目。每一帧可包括描述相应帧的编码模式的帧语法数据。视频编码器20通常对个别视频帧内的视频块进行操作以便对视频数据进行编码。每一视频帧可包括多个切片,即视频帧的若干部分。每一切片可包括多个视频块(例如,LCU),其中的每一者可以分割成较小块,还称为子块(例如,子CU)。根据ITU-TH.264标准,一个视频块可以对应于一个宏块或宏块的一个分区。根据HEVC,一个视频块可以对应于一个CU或CU的一个分区。总的来说,LCU和其子CU(也就是说,CU四叉树的任何CU)可被称为“CU”。
取决于指定译码标准,视频块可以分割成各种“NxN”子块大小,例如16x16、8x8、4x4、2x2等等。视频编码器20可以递归地分割每一块,也就是说,将2Nx2N块分割成4个NxN块,和将任何或所有的NxN块分割成4个(N/2)×(N/2)块等等。在本发明中,“NxN”和“N乘N”可以互换使用来指代在垂直和水平尺寸方面的块的像素尺寸,例如,16x16像素或16乘16像素。总的来说,16x16块将在垂直方向上具有16个像素(y=16),并且在水平方向上具有16个像素(x=16)。同样,NxN块总体上在垂直方向上具有N个像素,并且在水平方向上具有N个像素,其中N表示非负整数值。一块中的像素可布置成若干行和若干列。此外,块未必需要在水平方向上具有与在垂直方向上相同数目的像素。举例来说,块可包含NxM个像素,其中M不必等于N。作为一个实例,在ITU-TH.264标准中,16乘16像素的大小的块可被称为宏块,而小于16乘16像素的块可被称为16乘16宏块的分区。在其它标准中,块可以相对于其大小更一般化地定义,举例来说,定义为CU和其分区,每一者具有变化的大小而非固定的大小。
视频块可包含像素域中的像素数据块或变换域中的变换系数块,例如,在向给定视频块的残余数据应用了变换之后,所述变换例如是离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换,其中所述残余数据表示所述块的视频数据与针对所述块产生的预测性数据之间的像素差。在一些情况下,视频块可包含变换域中的经量化变换系数的块,其中,在向给定视频块的残余数据应用了变换之后,所得变换系数还经量化。
总的来说,视频编码器20根据块分割过程将一个块分割成子块。举例来说,视频编码器20可经配置以在块包括高频变化或其它高量细节时将所述块分割成子块。在一些实例中,视频编码器20实施速率失真优化过程,所述过程确定是否将一个块分割成子块。使用较小块来对视频数据进行译码可以产生对包括高水平的细节的块的较好预测,并且可以因此减少所得误差(也就是说,预测数据与原始视频数据之间的逐像素差),其被表示为残余数据。视频数据的每一块包括提供所述块的译码信息的一组数据。此组数据被视为所述块的开销,还称为经译码视频数据的块的元数据。因而,尽管较小块可以产生块的较低残余值,但在一些情况下使用较小块的益处可能会被较小块的标头数据的开销抵消。所以,视频编码器20可经配置以执行速率失真优化过程,其中视频编码器20尝试确定最优(或可接受)的分割方案,所述方案平衡误差(残余数据或失真)的减少与同块中的每一者相关联的开销(位速率)。
总的来说,视频块是指母块和其分区(即,子块)两者。切片总体上包括多个视频块(例如,一组LCU),其中的任何或所有可以分割成子块(例如,子CU),所述子块可以用递归方式进一步分割。每一切片可以对应于视频数据的可独立解码的单元。替代地,帧本身可以对应于可解码单元,或帧的其它部分可以被定义为可解码单元。术语“经译码单元”可以是指视频数据的任何可独立解码的单元,例如整个帧、帧的一个切片、图片群组(GOP)(还称为序列),或根据适用译码技术定义的其它可独立解码的单元。
当前正在致力于研发一种新的视频译码标准,当前被称作高效率视频译码(HEVC)。所述新出现的HEVC标准还可被称作H.265。所述标准化努力是基于被称作HEVC测试模型(HM)的视频译码装置的模型。所述HM假设视频译码装置优于根据例如ITU-TH.264/AVC的装置的若干能力。举例来说,H.264提供9种帧内预测编码模式,而HM提供多达35种帧内预测编码模式,例如,基于经帧内预测译码的块的大小。
HM将视频数据的块称为CU。CU可以是指充当基本单元的2Nx2N像素图像区域,对所述区域应用各种译码工具以进行压缩。CU概念上类似于H.264/AVC的宏块。位流内的语法数据可以定义LCU,其为在特定单元(例如,切片、帧、GOP或包括LCU的视频数据的其它单元)的像素数目方面最大的CU。总的来说,CU具有类似于H.264的宏块的用途,但是CU并不具有大小区别。因而,总的来说,任何CU都可以分割或分裂成子CU。LCU被分割以产生特定CU的次数可被称为CU的分割等级、分解水平或“深度”。在一些情况下,语法数据定义用于LCU的最大分割等级,其又可以限制对于所述LCU可能出现的最小大小的CU(SCU)。
总的来说,本发明中所说的CU可以是指视频数据的LCU或LCU的子CU。LCU可以分裂成子CU,并且每一子CU可以进一步分裂成子CU等等。如上文所描述,位流的语法数据可以定义LCU可以分裂的最大次数,其可被称为最大分割等级。还如上文所描述,位流还可定义SCU。本发明还使用术语“块”来指代CU、CU的预测单元(PU)或CU的变换单元(TU)中的任一者。下文更详细地描述PU和TU。
LCU可以与指示如何分割LCU的四叉树数据结构相关联。与LCU相关联的四叉树数据结构可被称为CU四叉树。总的来说,CU四叉树包括LCU的每个CU的一个节点,其中根节点对应于LCU,并且其它节点对应于LCU的子CU。如果给定CU分裂成4个子CU,则四叉树中的对应于分裂CU的节点包括4个子节点,其中的每一者对应于子CU中的一者。四叉树数据结构的每一节点可以提供对应CU的语法信息。举例来说,四叉树中的节点可包括对应CU的分裂旗标,其指示CU是否分裂成4个子CU。可以递归地定义给定CU的语法信息,并且所述语法信息可以取决于所述CU是否分裂成子CU。
未分裂的CU(即,对应于相应CU四叉树中的一个端子或“叶”节点的CU)可包括一个或一个以上预测单元(PU)。总的来说,PU表示对应CU的全部或一部分,并且包括用于检索PU的参考样本以便执行对所述CU的预测的数据。举例来说,当CU经帧内模式编码时,PU可包括描述PU的帧内预测模式的数据。作为另一实例,当CU经帧间模式编码时,PU可包括定义PU的运动向量的数据。举例来说,定义运动向量的数据可以描述运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量指向的参考帧和/或运动向量的参考列表(例如,列表0或列表1)。举例来说,CU的定义CU的一个或一个以上PU的数据还可描述CU分割成一个或一个以上PU。分割模式可以在CU未经译码、经帧内预测模式编码或经帧间预测模式编码之间有区别。
叶节点CU还可包括一个或一个以上变换单元(TU)。在如上文所描述使用一个或一个以上PU对CU的预测之后,视频编码器20可以计算CU的对应于一个或一个以上PU的相应部分的一个或一个以上残余块。残余块可以表示CU的视频数据与所述一个或一个以上PU的预测数据之间的像素差。总的来说,TU表示CU的残余块的全部或一部分,并且包括用于对应残余块数据的变换和量化的数据,其中所述残余块是使用残余数据表示的。举例来说,视频编码器20可以将残余数据变换成变换系数,然后对TU的变换系数进行量化和扫描以形成一组经量化变换系数。TU不必限于PU的大小。因而,TU可以比同一CU的对应PU更大或更小。在一些实例中,TU的最大大小可以对应于对应CU的大小。
视频数据的CU可包括对应视频数据的亮度分量(Y)、第一色度分量(U)和第二色度分量(V)中的每一者。所以,可以针对视频数据的给定CU的Y、U和V分量中的每一者执行如上文参看PU和TU所描述的对CU的预测和变换。在一些实例中,可以相对于亮度(Y)分量确定预测信息(例如,预测模式(帧内或帧间预测)和其特性(例如,特定的帧内预测模式或运动向量)),并且可以针对色度(U和V)分量再使用所述信息和特性。因此,对于CU的给定TU,TU的残余数据的系数可被称为TU的Y、U和V分量的残余数据的系数。也就是说,可以向TU的分量中的每一者应用所确定的预测信息以形成分量中的每一者的残余数据的个别的块,其中残余数据的块包括表示逐像素差的系数。随后,可以对残余数据进行变换和量化,从而形成TU的Y、U和V分量中的每一者的经量化变换系数的块。
叶节点CU可以进一步包括变换四叉树数据结构,其定义对CU的一个或一个以上TU的分割。变换四叉树数据结构可以用实质性类似于上文参看LCU所描述的CU四叉树的方式指示CU的TU的分区信息。举例来说,所述变换四叉树数据结构可以定义如何将CU的最大TU分割成子CU。在一些实例中,所述变换四叉树数据结构可被称为“残余四叉树变换”(RQT)。RQT的每一节点可包括描述对应于所述节点的TU的分量(例如,Y、U或V)是否包括至少一个非零系数(即经译码)和TU是否分裂成子TU的语法信息。如上文所描述,此语法信息总体上对应于TU的CBF和TSF语法元素。总体上,根据RQT分裂成子TU的TU可被称为子TU的母代TU,并且所述子TU可被称为TU的子代TU。另外,所述子TU可以称为彼此的兄弟TU。未根据RQT分裂成子TU的TU可被称为RQT的叶节点TU。
在其它实例中,根据本发明的技术,CU的TU可以根据均匀分区结构分割,下文参看图5C更详细地描述所述结构。在这些实例中,TU可以是CU的最大TU,或CU的最大TU的子TU。CU的最大TU可以根据RQT和均匀分区结构两者分割成子TU。作为一个实例,最大TU可以根据RQT分割成子TU,并且子TU中的一者或一者以上可以根据均匀分区结构分割成另外的子TU。作为另一实例,最大TU可以完全根据均匀分区结构分割。同样,根据均匀分区结构分裂成子TU的TU可被称为子TU的母代TU,并且子TU可被称为TU的子代TU,并且彼此称为兄弟TU。此外,子TU可以不分裂成另外的子TU,并且因而可以表示CU的TU分区结构的叶节点TU,不论是使用RQT和均匀分区结构还是仅仅使用均匀分区结构定义,如先前描述。
以类似于如上文参看RQT所描述的方式,根据均匀分区结构分割的TU的每一子TU可包括描述所述子TU的一分量(例如,Y、U或V)是否包括至少一个非零系数的语法信息。如上文所描述,此语法信息总体上对应于可以简单地称为TU的子TU的CBF。另外,针对TU的子TU,可以存在共同地描述TU如何分裂成子TU的语法信息。换句话说,所述语法信息可以指示根据均匀分区结构分裂TU会产生多少个子TU和每一子TU的大小。举例来说,子TU的此语法信息可以包括在TU中。
在一些实例中,视频数据的CU的TU的CBF和TSF语法元素可以各自如先前描述使用单个位值(例如,单个位旗标)表示。参看上文所描述的RQT分割结构的实例,在一些情况下,对应于TU的Y、U和V分量的所有三个CBF可以包括在与TU相关联的RQT的对应节点中。在其它情况下,例如当可以推断出CBF中的一者或一者以上的值时,CBF的仅一个子集可以包括在节点中。
总的来说,根据本发明的技术,当TU的母代TU的同一分量的CBF的值指示母代TU的分量未经译码(也就是说,不包括任何非零系数)时,可以推断出TU的所述分量的CBF的值。在此情况下,可以推断出母代TU的每一子代TU的同一分量的CBF的值以指示相应分量未经译码。另外,当TU的母代TU的一分量的CBF的值指示母代TU的所述分量经译码(也就是说,包括至少一个非零系数)时,也可以推断出TU的同一分量的CBF的值,并且母代TU的每个其它子代TU的同一分量的CBF的值指示相应分量未经译码。在此情况下,可以推断TU的分量的CBF的值以指示分量经译码。
在另外其它情况中,例如,当可以推断出TU的TSF的值时,仅TU的CBF可以包括在RQT的对应节点中。总的来说,根据本发明的技术,当TU具有大于CU的最大准许大小(例如,CU的变换的最大准许大小)的大小时,可以推断TU的TSF的值。在此情况下,可以推断TU的TSF的值以指示TU分裂成子TU。类似地,当TU对应于CU的最小大小TU(例如,CU的变换的最小准许大小)时,也可以推断TU的TSF的值。在此情况下,可以推断TU的TSF的值以指示TU未分裂成子TU。应注意,在本发明各处,推断视频数据的CU的TU的CBF或TSF语法元素的值可被称为推断语法元素自身。
此外,在一些情况下,例如根据对应于每一分量的RQT和/或均匀分区结构,可以个别地分割CU的TU的Y、U和V分量。在这些情况下,可以在RQT的对应于TU的Y、U和V分量中的每一者的节点中提供TSF。此外,可以针对Y、U和V分量中的每一者为TU提供语法信息,其指示根据均匀分区结构分裂TU会产生多少个子TU。
在其它实例中,即根据共同RQT和/或均匀分区结构,可以一起分割CU的TU的Y、U和V分量。在这些实例中,可以在RQT的对应节点中包括CU的给定TU的单个TSF。类似地,可以针对全部Y、U和V分量为TU包括指示根据均匀分区结构分裂TU会产生多少个子TU的语法信息。
在进行帧内预测性或帧间预测性编码以产生预测性数据和残余数据之后,并且在进行任何变换(例如,4x4或8x8整数变换,类似于H.264/AVC中使用的变换,或离散余弦变换DCT)以产生变换系数之后,视频编码器20可以对变换系数进行量化。量化总体上是指其中变换系数经量化以可能减少表示系数所用的数据量的过程。量化过程可减少与系数中的一些或全部相关联的位深度。举例来说,在量化期间,可将n位值向下舍入到m位值,其中n大于m。
在量化之后,可以例如根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)或另一熵译码方法来执行对经量化数据的熵译码。经配置用于熵译码的处理单元或另一处理单元可以执行其它处理功能,例如经量化系数的零延伸长度译码和/或语法信息的产生,所述语法信息例如是经译码块样式(CBP)值、宏块类型、译码模式、经译码单元的最大宏块大小(例如,帧、切片、宏块或序列)或类似信息。根据一些译码标准,此类语法信息可包括视频数据的CU的TU的CBF和TSF语法元素,如先前描述,所述语法元素例如使用RQT来表示。
最近,在视频译码的焦点朝向高清视频和经改进压缩转移的情况下,已经引入更多且日益复杂的预测模式以达到更好的译码效率,从而产生了视频数据的经译码CU的更精细的PU和TU分割方案。本发明提供用于改进发信号通知TU分区信息(例如,如先前描述使用RQT指示)的效率的技术。
举例来说,在一些实例中,并非提供CU的每一TU的个别CBF和TSF,而是视频编码器20可以对CU的给定TU的一个或一个以上CBF和一TSF进行联合编码。同样,在其它实例中,视频解码器30可经配置以接收单个值,视频解码器30可以根据所述值确定TU的所述一个或一个以上CBF和所述TSF。举例来说,所述一个或一个以上CBF和所述TSF可以包括在RQT的对应于所述TU的节点中。
类似地,在一些实例中,视频编码器20可以对CU的给定TU的子TU的CBF或TSF进行联合编码。同样,在另外其它实例中,视频解码器30可经配置以接收单个值,视频解码器30可以根据所述值确定子TU的CBF或TSF。在一些情况下,CBF或TSF可以包括在RQT的对应于所述子TU的多个节点中。
在任何情况下,当可以推断出TU的CBF和TSF中的一者或一者以上的值时,不需要将CBF和TSF与TU的其余的CBF和/或TSF联合译码。类似地,当可以推断出子TU的CBF或TSF中的一者或一者以上的值时,不需要将CBF或TSF与子TU的其余的CBF或TSF联合译码。以此方式,仅将无法推断的CBF和TSF与其它CBF和/或TSF联合译码。
在一些实例中,视频编码器20可以使用单个VLC码字对TU的所述一个或一个以上CBF和所述TSF进行联合编码。在这些实例中,视频解码器30可经配置以接收的单个值可包含VLC码字,视频解码器30可以对所述VLC码字进行解码以确定TU的所述一个或一个以上CBF和所述TSF。类似地,在其它实例中,视频编码器20可以同样使用单个VLC码字对子TU的CBF或TSF进行联合编码。作为一个实例,视频编码器20可以在每一子TU的CBF都未经译码(即,推断出子TU的CBF的值)时使用单个VLC码字对子TU的TSF进行联合编码。作为另一实例,视频编码器20可以在每一子TU的色度分量的CBF都未经译码(即,推断出子TU的色度分量的CBF的值)时和当子TU中的每一者的TSF也未经译码(即,还推断出子TU的TSF的值)时使用单个VLC码字对子TU中的每一者的Y分量的CBF进行联合编码。同样,在这些实例中,视频解码器30可经配置以接收的单个值可包含VLC码字,视频解码器30可以对所述VLC码字进行解码以确定子TU的CBF或TSF。
如先前描述,根据本发明的技术,仅将无法推断的CBF和TSF与其它CBF和/或TSF联合译码。另外,当使用VLC码字对无法推断的CBF和TSF进行联合译码时,可以取决于可以推断出哪些CBF和TSF来使用不同VLC表。举例来说,根据本发明的技术,可以使用TU的“旗标模式”取决于是否可推断出TU的CBF和TSF中的一者或一者以上来选择不同VLC表对TU的一个或一个以上CBF和一TSF进行联合译码。此外,根据本发明的技术,可以使用TU的子TU中的每一者的旗标模式取决于是否可推断子TU的CBF或TSF中的一者或一者以上来选择不同VLC表对子TU的CBF或TSF进行联合译码。
举例来说,可以首先确定TU(包括TU的子TU)的旗标模式以包括TU的TSF可推断旗标和TU的母代TU的Y、U和V分量的CBF。举例来说,TU的TSF可推断旗标可以使用先前描述的技术指示是否可推断TU的TSF。因此,可以使用4个单个位值(例如,4个单个位旗标)来表示旗标模式。为了选择特定VLC表对TU的一个或一个以上CBF和所述TSF进行译码,如先前描述,可使用旗标模式来指示所述一个或一个以上CBF和所述TSF中的哪一些可以使用适用于推断TU的CBF和TSF的技术推断出来,并且因而不与TU的其余的CBF和/或TSF联合译码。类似地,为了选择特定VLC表对TU的子TU的CBF或TSF进行译码,如先前描述,可使用子TU中的每一者的旗标模式来指示子TU的所述CBF或所述TSF中的哪一些可以同样使用适用于推断TU的CBF和TSF的技术推断出来,并且因而不与子TU的其余的CBF或TSF联合译码。
举例来说,如果也如上文所描述的,可以基于TU的母代TU的对应CBF和在一些情况下TU的兄弟TU的对应CBF推断出TU的给定CBF,则可以设置旗标模式中的对应位值来指示所述推断(例如,“0”)。另一方面,如果无法推断CBF,则可以相应地设置对应位值(例如,“1”)。可以用类似方式设置对应于TU的旗标模式中的TSF可推断旗标的位值,例如,如果可以推断TU的TSF,则可以将TSF可推断旗标的对应位值设置成“0”,并且如果无法推断TSF,则可以将TSF可推断旗标的对应位值设置成“1”。因此,在对TU的所述一个或一个以上CBF和所述TSF进行联合译码的情况下,可以基于旗标模式选择VLC表,以反映TU的所述一个或一个以上CBF和所述TSF中的哪一些可以推断出来,并且对所述一个或一个以上CBF和所述TSF中的哪一些进行联合译码。类似地,在对TU的子TU的CBF或TSF进行联合译码的情况下,可以基于子TU中的每一者的旗标模式选择VLC表,以反映子TU的所述CBF或所述TSF中的哪一些可以推断出来,并且对所述CBF或所述TSF中的哪一些进行联合译码。
本发明的技术利用在经验测试期间发现的指示视频数据的CU的TU的分量是否包括至少一个非零系数(即,经译码)的信息与指示所述TU是否分裂成子TU的信息之间的相关。作为一个实例,此相关可以存在于指示视频数据的CU的TU的亮度分量是否经译码的信息与指示TU是否分裂成子TU的信息之间。举例来说,当TU分裂成子TU时,可能TU的亮度分量经译码。类似地,当TU的亮度分量未经译码时,可能TU未分裂成子TU。
作为另一实例,在TU的每一分量与其它分量独立分割(也就是说,每一分量包括独特的分区信息)的情况下并且当所述分量未经译码时,可能TU的分量未分裂成对应于所述分量的子TU。类似地,当TU的分量分裂成对应于所述分量的子TU时,可能TU的所述分量经译码。
更一般来说,在TU的所有分量以相同方式分割(也就是说,每一分量共用相同分区信息)的情况下,且当所述分量未经译码时,可能TU未分裂成子TU。类似地,当TU分裂成子TU时,可能TU的所述分量中的每一者经译码。
另外,如先前描述,在指示视频数据的CU的同一TU的分量是否经译码的信息之间也可存在相关。举例来说,当TU的一个分量经译码时,可能TU的其它分量也经译码。作为一个实例,此相关可以存在于指示视频数据的CU的TU的色度分量是否经译码的信息之间。举例来说,当TU的第一色度分量(例如,U)经译码时,可能TU的第二色度分量(例如,V)经译码,且反之亦然。
这些技术可以利用此发现的相关通过对语法元素表示的信息进行联合译码来相对于经译码CBF和TSF语法元素改进压缩效率。举例来说,归因于上述相关,CU的TU的CBF和TSF值的一些组合可能比其它组合有更大可能。当使用单个VLC码字对TU的一个或一个以上CBF和一TSF进行联合译码时,如果将包含比经个别译码的一个或一个以上CBF和TSF(例如,各自包含单个位码字)少的位的码字指派于较大可能的组合,则可以改进压缩效率。类似地,CU的TU的子TU的CBF或TSF值的一些组合可能比其它组合有更大可能。当使用单个VLC码字对子TU的CBF或TSF进行联合译码时,如果将包含比经个别译码的CBF或TSF(例如,同样,各自包含单个位码字)少的位的码字指派于较大可能的组合,则可以同样改进压缩效率。
根据本发明的技术,可以对视频数据的CU的一个或一个以上CBF和一TSF进行联合译码。作为一个实例,源装置12的视频编码器20可以对视频数据的块(例如,一个或一个以上CU)进行编码。视频编码器20可经配置以确定视频数据的CU的TU的分量是否包含至少一个非零系数,确定TU是否分裂成子TU,从VLC表选择码字,其中所述VLC表提供所述码字对应于所述确定的指示,且提供用于所述TU的码字。在此实例中,视频编码器20可以进一步经配置以将码字发送到位流中。
视频编码器20可以进一步经配置以确定用于选择特定VLC表的TU的编码上下文。所述上下文可包括TU的各种特性,例如,以下各项中的一者或一者以上:对应于TU的PU的预测模式,TU的分割等级,以及将由码字表示的TU的分量的数目。
视频编码器20可以使用所述编码上下文来选择VLC表。另外,当TU的色度分量的CBF中的一者是经译码的且另一者是推断的且因此未与其它CBF联合译码时,视频编码器20可选择同一VLC表,不管哪个CBF是经译码的且哪个CBF是推断的。在这些实例中,VLC表可包括码字到CBF和TSF值的映射。此外,当TU的TSF是推断的且因此未与TU的一个或一个以上CBF联合译码时,视频编码器20可选择与当TSF连同所述一个或一个以上CBF一起经译码时不同的VLC表。此外,视频编码器20可取决于推断的TSF的值而选择不同VLC表。在这些实例中,VLC表可包括码字到CBF值的映射。
视频编码器20可以进一步从VLC表中选择对应于TU的所述一个或一个以上CBF和所述TSF的码字。最后,视频编码器20可以提供TU的码字。同样,在此实例中,视频编码器20可以进一步经配置以将码字发送到位流中。
另外,对于所述VLC表,视频编码器20可以基于以上确定来更新码字到CBF和TSF值的映射,以反映哪些确定对于所述编码上下文有更多或更少可能出现。举例来说,视频编码器20可以跟踪对于所述编码上下文CBF和TSF值的每一组合的出现频率,并且设置与每一组合相关联的码字,从而使得所述码字具有与对应组合的可能性成反比的长度。
作为一个实例,视频编码器20可经配置以对TU的亮度分量的CBF(例如,CBFY)、TU的两个色度分量的CBF(例如,如先前描述的CBFC)和TU的TSF进行联合编码。举例来说,在其中所述分量包括TU的第一色度分量并且其中所述TU进一步包括第二不同色度分量的情况下,视频编码器20可以进一步经配置以确定第二色度分量是否包括至少一个非零系数。在此实例中,为了从所述VLC表中选择码字,视频编码器20可经配置以选择所述码字,使得VLC表提供对于所述码字表示第一色度分量和第二色度分量中的至少一者是否包括至少一个非零系数(即,表示TU的CBFC)的指示。
在TU的CBFC值指示所述色度分量中的至少一者包括至少一个非零系数的情况下,视频编码器20可进一步经配置以对指示每一个别色度分量是否包括至少一个非零系数的额外信息进行编码。但是,在一些实例中,当可以推断出色度分量的两个CBF中的一者的值时,视频编码器20可经配置以不对所述额外信息进行编码。
根据一些实例,为了对所述额外信息进行编码,视频编码器20可经配置以个别地对TU的色度分量的CBF进行编码。根据其它实例,视频编码器20可经配置以用与上文参看对视频数据的CU的TU的一个或一个以上CBF和一TSF进行联合编码所描述的类似方式对TU的色度分量的CBF进行联合编码。举例来说,在第一色度分量和第二色度分量中的至少一者包括至少一个非零系数的情况下,视频编码器20可以进一步经配置以从第二不同VLC表中选择第二不同码字,其中所述第二VLC表提供对第二码字表示第一色度分量是否包括至少一个非零系数和第二色度分量是否包括至少一个非零系数的指示。视频编码器20可以进一步经配置以提供TU的第二码字。在此实例中,视频编码器20可以进一步经配置以将第二码字发送到位流中。
在此实例中,同样,视频编码器20可经配置以确定用于选择第二VLC表的用于的TU的第二不同编码上下文。所述上下文可包括以下各项中的一者或一者以上:CU的分割等级,TU的分割等级,对应于TU的PU的预测模式,以及对应于TU的相邻TU的第一色度分量和第二色度分量的CBF值。举例来说,所述相邻TU可以是CU的其它TU,先前对所述其它TU用与本文所述的相同方式对CBF和TSF进行了联合编码。在一些实例中,视频编码器20可以使用同一编码上下文来选择第一VLC表和第二VLC表两者,在此情况下,上文所论述的第一和第二编码上下文可包含相同上下文。
同样,视频编码器20可以使用第二编码上下文来选择第二VLC表。举例来说,所述第二VLC表可包括码字到CBFU和CBFV值的映射。视频编码器20可以进一步从第二VLC表中选择对应于TU的色度CBF(即,CBFU和CBFV)的第二码字。最后,视频编码器20可以提供所述TU的第二码字。同样,在此实例中,视频编码器20可以进一步经配置以将第二码字发送到位流中。
另外,同样,对于第二VLC表,视频编码器20可以基于以上确定来更新码字到CBFU和CBFv值的映射,以反映对于所述第二编码上下文哪些确定有更多或更少可能出现。举例来说,视频编码器20可以跟踪对于所述第二编码上下文CBFU和CBFv值的每一组合的出现频率,并且设置与每一组合相关联的码字,从而使得所述码字具有与对应组合的可能性成反比的长度。
作为又一实例,TU的子TU的CBF或TSF可经联合译码。举例来说,在TU分裂成子TU的情况下,视频编码器20可以进一步经配置以选择表示子TU是否分裂成另外的子TU的第二不同码字,并且提供子TU的第二码字。类似地,视频编码器20可以选择第二码字,从而使得其表示对应于TU的分量的子TU的分量是否包括至少一个非零系数,并且提供子TU的第二码字。在这些实例中,视频编码器20可以进一步经配置以将第二码字发送到位流中。
在这些实例中,所述第二码字还可包含VLC码字。第二码字可以选自使用第二不同编码上下文的第二不同VLC表。举例来说,当对子TU的TSF进行联合编码时,第二编码上下文可包括子TU的CBF的值。类似地,当对子TU的CBF进行联合编码时,第二编码上下文可包括子TU的TSF的值。
在任何情况下,视频编码器20可以使用相应VLC码字对CU进行编码以包括TU的CBF和TSF和/或子TU的CBF或TSF。因为使用上文所描述的VLC技术可在平均情况中使得所述码字包含比由所述码字表示的经个别编码的CBF和TSF少的位,所以当使用本发明的技术时对于包括所述码字的经译码位流可存在相对位节省。
目的装置14的视频解码器30可以最终例如经由调制解调器28和接收器26从视频编码器20接收经编码视频数据(例如,一个或一个以上CU)。替代地,视频解码器30可从例如CD-ROM、蓝光光盘、快闪驱动器、硬盘驱动器或其它存储媒体等存储媒体接收经编码视频数据。同样,作为一个实例,视频数据的CU的TU的一个或一个以上CBF和一TSF可经联合译码。根据本发明的技术,视频解码器30可经配置以基于TU的码字而确定视频数据的CU的TU的分量是否包括至少一个非零系数,基于所述码字确定TU是否分裂成子TU,且基于所述确定对所述TU进行解码。
在一些实例中,视频解码器30可经配置以用实质性类似于如先前描述由视频编码器20使用的方式来确定TU的解码上下文,以选择包含所述码字的特定VLC表。举例来说,所述解码上下文可包括TU的各种特性,例如,以下各项中的一者或一者以上:对应于TU的PU的预测模式,TU的分割等级,以及由码字表示的TU的分量的数目。
视频解码器30可以使用所述解码上下文来选择VLC表。另外,当TU的色度分量的CBF中的一者是经译码的且另一者是推断的且因此未与其它CBF联合译码时,视频解码器30可选择同一VLC表,不管哪个CBF是经译码的且哪个CBF是推断的。在这些实例中,VLC表可包含码字到CBF和TSF值的映射。此外,当TU的TSF是推断的且因此未与TU的一个或一个以上CBF联合译码时,视频解码器30可选择与当TSF连同所述一个或一个以上CBF一起经译码时不同的VLC表。此外,视频解码器30可取决于推断的TSF的值而选择不同VLC表。在这些实例中,VLC表可包括码字到CBF值的映射。
使用VLC表,视频解码器30可基于所述码字而确定TU的一个或一个以上分量是否包括至少一个非零系数(即,经译码),且所述TU是否分裂成子TU。此外,视频解码器30可基于以上确定而更新码字与VLC表内的CBF和TSF值之间的映射以反映对于解码上下文来说哪些确定有更多或更少可能出现,例如以协调VLC表内的映射与由视频编码器20用来对TU的所述一个或一个以上CBF和所述TSF进行联合编码的对应VLC表中的映射。
作为一个实例,视频解码器30可经配置以对经联合编码的TU的亮度分量的CBF(例如CBFY)、TU的两个色度分量的CBF(例如,如先前描述的CBFC)以及TU的TSF进行解码。举例来说,在所述分量包含TU的第一色度分量并且其中所述TU进一步包含第二不同色度分量的情况下,视频解码器30可进一步经配置以基于所述码字而确定所述第一色度分量和第二色度分量中的至少一者是否包括至少一个非零系数,即,确定所述TU的CBFC。
在TU的CBFC值指示所述色度分量中的至少一者包括至少一个非零系数的情况下,视频解码器30可进一步经配置以对指示每一个别色度分量是否包括至少一个非零系数的额外信息进行解码。但是,在一些实例中,当可以推断出色度分量的两个CBF中的一者的值时,视频解码器30可经配置以不对所述额外信息进行解码。
根据一些实例,为了对所述额外信息进行解码,视频解码器30可经配置以对TU的色度分量的经个别编码的CBF进行解码。根据其它实例,视频解码器30可经配置以用如上文参看对视频数据的CU的TU的经联合编码的一个或一个以上CBF和一TSF进行解码所描述的类似的方式对TU的色度分量的经联合编码的CBF进行解码。
举例来说,在所述第一色度分量和第二色度分量中的至少一者包括至少一个非零系数的情况下,为了基于所述码字而确定第一色度分量是否包括至少一个非零系数,视频解码器30可进一步经配置以在基于所述码字确定第一色度分量和第二色度分量中的至少一者包括至少一个非零系数之后基于所述TU的第二不同码字而确定第一色度分量是否包括至少一个非零系数。视频解码器30可进一步经配置以基于所述第二码字而确定第二色度分量是否包括至少一个非零系数。
在此实例中,同样,视频解码器30可经配置以用与先前描述的由视频编码器20使用的方式大体上类似的方式来确定TU的第二解码上下文,以选择包含第二码字的第二VLC表。举例来说,所述第二解码上下文可包括以下各项中的一者或一者以上:CU的分割等级,TU的分割等级,对应于TU的PU的预测模式,以及对应于TU的相邻TU的第一色度分量和第二色度分量的CBF值。举例来说,所述相邻TU可为CU的其它TU,所述其它TU的经联合编码的CBF和TSF先前用与本文所述相同方式经解码。在一些实例中,视频解码器30可以使用同一解码上下文来选择第一VLC表和第二VLC表两者,在此情况下,上文所论述的第一和第二解码上下文可包含相同上下文。
视频解码器30可以使用第二解码上下文来选择第二VLC表。举例来说,第二VLC表可包括码字到CBFU和CBFV值的映射。使用第二VLC表,视频解码器30可基于所述第二码字而确定TU的色度分量中的每一者是否包括至少一个非零系数,即,是经译码的。此外,视频解码器30可基于以上确定而更新码字与第二VLC表内的CBFU和CBFV值之间的映射以反映对于第二解码上下文来说哪些确定有更多或更少可能出现,例如以协调第二VLC表内的映射与由视频编码器20用来对TU的CBFU和CBFV进行联合编码的对应VLC表中的映射。
作为又一实例,TU的子TU的CBF或TSF可经联合译码。举例来说,在TU分裂成子TU的情况下,视频解码器30可经配置以基于子TU的第二不同码字而确定所述子TU是否分裂为另外的子TU。类似地,视频解码器30可经配置以基于所述子TU的第二码字而确定对应于TU的分量的子TU的分量是否包括至少一个非零系数。
在这些实例中,所述第二码字也可包含VLC码字。所述第二码字可用于使用第二不同VLC表来确定子TU的CBF或TSF,所述第二不同VLC表是使用第二不同解码上下文选择的。举例来说,当对子TU的经联合编码的TSF进行解码时,所述第二解码上下文可包括所述子TU的CBF的值,例如对应于所述子TU的Y分量的CBF。类似地,当对所述子TU的经联合编码的CBF进行解码时,所述第二解码上下文可包括所述子TU的TSF的值。
在任何情况下,视频解码器30可使用利用所述一个或一个以上码字确定的TU的所述一个或一个以上CBF和TSF和/或子TU的CBF或TSF对CU进行解码。同样,因为使用上文所描述的VLC技术可在平均情况中使得所述一个或一个以上码字包含比由所述码字表示的个别地经译码CBF和TSF少的位,所以当使用本发明的技术时对于包含所述码字的经译码位流可存在相对位节省。
视频编码器20和视频解码器30各自可以经实施为可适用的多种合适的编码器或解码器电路中的任一者,例如一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑电路、软件、硬件、固件或其任何组合。大体上类似于视频编码器20和视频解码器30中的任一者或两者的组件可以包括在一个或一个以上编码器或解码器中,所述编码器或解码器中的任一者可以集成为组合视频编码器/解码器(编解码器)的一部分。包括大体上类似于视频编码器20和/或视频解码器30的组件的设备可包含集成电路、微处理器和/或无线通信装置,例如蜂窝式电话。
以此方式,源装置12表示用于对视频数据进行编码的设备的实例,其包括视频编码器,所述视频编码器经配置以确定视频数据的CU的TU的分量是否包括至少一个非零系数,确定TU是否分裂成子TU,从VLC表选择码字,其中所述VLC表提供所述码字对应于所述确定的指示,且提供所述TU的码字。
类似地,目的装置14表示用于对视频数据进行解码的设备的实例,其包括视频解码器,所述视频解码器经配置以基于TU的码字而确定视频数据的CU的TU的分量是否包括至少一个非零系数,基于所述码字确定TU是否分裂成子TU,且基于所述确定对所述TU进行解码。
图2是说明视频编码器20的实例的框图,所述视频编码器可以实施用于对视频数据的CU的TU的一个或一个以上CBF和一TSF进行联合编码的技术。视频编码器20可以执行视频帧内的块(例如宏块或CU和/或分区或其子分区)的帧内和帧间译码。帧内译码依赖于空间预测以减少或移除给定视频帧内的视频中的空间冗余。帧间译码依赖于时间预测以减少或移除视频序列的相邻帧内的视频中的时间冗余。帧内模式(I模式)可以指代若干基于空间的压缩模式中的任一者,并且帧间模式(例如单向预测(P模式)或双向预测(B模式))可以指代若干基于时间的压缩模式中的任一者。
如图2中所示,视频编码器20接收待编码视频帧内的视频数据的当前块。在图2的实例中,视频编码器20包括运动补偿单元44、运动估计单元42、帧内预测单元46、参考帧存储装置64、求和器50、变换单元52、量化单元54和熵编码单元56。为了进行视频块重构,视频编码器20还包括逆量化单元58、逆变换单元60和求和器62。还可包括解块滤波器(图2中未展示)以对块边界进行滤波,以从经重构视频移除成块假象。在需要时,解块滤波器通常将对求和器62的输出进行滤波。
在编码过程期间,视频编码器20接收待译码的视频帧或切片。所述帧或切片可以划分成视频块(例如,LCU)。运动估计单元42和运动补偿单元44可以相对于一个或一个以上参考帧中的一个或一个以上块执行给定接收到的视频块的帧间预测性译码以提供时间压缩。帧内预测单元46可以相对于与待译码块相同的帧或切片中的一个或一个以上相邻块执行给定接收到的视频块的帧内预测性译码,以提供基于空间的预测值来对所述块进行编码。
模式选择单元40可以例如基于误差结果和基于包括经译码的给定接收到的块的帧或切片的帧或切片类型来选择所述译码模式中的一者(帧内或帧间),并且向求和器50提供所得经帧内译码或经帧间译码块以产生残余块数据,且向求和器62提供所述所得经帧内译码或经帧间译码块以重构经编码块以用于在参考帧或参考切片中使用。总的来说,帧内预测包括相对于相邻经先前译码块预测当前块,而帧间预测包括进行运动估计和运动补偿以在时间上预测当前块。
运动估计单元42和运动补偿单元44表示视频编码器20的帧间预测元件。运动估计单元42与运动补偿单元44可高度集成,但出于概念上的目的而分开予以说明。运动估计是产生估计视频块的运动的运动向量的过程。运动向量(例如)可指示预测参考帧(或其它经译码单元)内的预测块相对于当前帧(或其它经译码单元)内正被译码的当前块的位移。预测块是经发现在像素差方面密切地匹配待译码的块的块,其可通过绝对差总和(SAD)、平方差总和(SSD)或其它差量度来确定。总的来说,运动向量可以描述CU的运动,但是在一些情况下(例如,当CU是使用合并模式经译码时),所述CU可以从另一CU继承运动信息。运动补偿可以包括基于通过运动估计确定的运动向量来取出或产生预测性块。同样,在一些实例中,运动估计单元42与运动补偿单元44可以在功能上集成。
运动估计单元42可以通过将视频块与参考帧存储装置64中的参考帧的视频块进行比较来计算经帧间译码帧的视频块的运动向量。运动补偿单元44还可出于此比较的目的内插参考帧(例如,I帧或P帧)的子整数像素。作为一实例,ITUH.264标准描述两个列举:列表0,其包括具有比正被编码的当前帧早的显示次序的参考帧,和列表1,其包括具有比正被编码的当前帧晚的显示次序的参考帧。因此,可以根据这些列表来组织存储在参考帧存储装置64中的数据。
运动估计单元42可以将来自参考帧存储装置64的一个或一个以上参考帧的块与当前帧(例如,P帧或B帧)的待编码块进行比较。当参考帧存储装置64中的参考帧包括用于子整数像素的值时,由运动估计单元42计算的运动向量可指代参考帧的子整数像素位置。如果子整数像素位置的值都未存储在参考帧存储装置64中,则运动估计单元42和/或运动补偿单元44还可经配置以计算存储在参考帧存储装置64中的参考帧的子整数像素位置的值。运动估计单元42可以将计算出来的运动向量发送到熵编码单元56和运动补偿单元44。通过运动向量识别的参考帧块可被称为帧间预测性块或更一般化地称为预测性块。运动补偿单元44可基于预测性块计算预测数据。
作为如上文所描述由运动估计单元42和运动补偿单元44执行的帧间预测的替代方案,帧内预测单元46可以对当前块进行帧内预测。明确地说,帧内预测单元46可以确定用来对当前块进行编码的帧内预测模式。在一些实例中,帧内预测单元46可以例如在分开的编码编次期间使用各种帧内预测模式对当前块进行编码,并且帧内预测单元46(或在一些实例中为模式选择单元40)可以从所述测试模式中选择适当帧内预测模式来使用。举例来说,帧内预测单元46可以使用速率失真分析计算各种经测试帧内预测模式的速率失真值,并且从所述经测试模式当中选择具有最佳速率失真特性的帧内预测模式。速率失真分析总体上确定经编码块与经编码以产生所述经编码块的原始未编码块之间的失真(或误差)的量,以及用于产生经编码块的位速率(也就是说,位数目)。帧内预测单元46可以根据各种经编码块的失真和速率计算比率,以确定哪个帧内预测模式对于当前块展现最佳速率失真值。
在一些实例中,模式选择单元40配合变换单元52和/或视频编码器20的其它单元或组件可以确定经帧间预测编码或经帧内预测编码CU的一个或一个以上TU的TSF。举例来说,表示如上文所描述的一个或一个以上TU的分区信息的TSF可以作为确定CU的一个或一个以上PU的分区信息的一部分加以确定。所以,CU的TU分区信息可以取决于CU的PU分区信息。举例来说,模式选择单元40配合变换单元52可以确定CU的一个或一个以上TU是否各自被分裂成子TU,作为产生CU的预测数据的一部分。另外,一个或一个以上TU是否各自分裂成子TU还可取决于变换单元52的性质,例如CU的最大和最小变换大小。此外,熵编码单元56可以确定一个或一个以上TU的CBF。举例来说,作为产生用于对CU进行编码的语法信息的一部分,熵编码单元56可以确定一个或一个以上TU中的每一者的分量是否包括至少一个非零系数(即,经译码)。在另外其它实例中,视频编码器20的其它单元或组件可以确定CU的一个或一个以上TU的CBF和TSF。
在任何情况下,视频编码器20可以执行速率失真优化过程来确定适当CU、PU和TU分割方案,并且使用确定的分割方案对CU进行编码。在一些实例中,视频编码器20还可确定CU的一个或一个以上TU的CBF和TSF的值。模式选择单元40配合变换单元52可以向熵编码单元56提供TSF,熵编码单元56也可产生所述CBF。
根据本发明的技术,如下文较详细描述,熵编码单元56可以对CU的TU的一个或一个以上CBF和一TSF进行联合编码。也根据本发明的技术,熵编码单元56可以对CU的TU的子TU的CBF或TSF进行联合编码。
在例如使用帧内预测或帧间预测来预测当前块之后,视频编码器20可以通过从正被译码的原始视频块减去由运动补偿单元44或帧内预测单元46计算的预测数据来形成残余视频块。求和器50表示可以执行此减法运算的组件。变换单元52可以将例如离散余弦变换(DCT)或概念上类似的变换等变换应用于残余块,从而产生包含残余变换系数值的视频块。变换单元52可以执行其它变换,例如通过H.264标准定义的或用于HEVC的变换,其概念上类似于DCT。也可使用小波变换、整数变换、子带变换、Karhunen-Loeve变换(KLT)、方向变换或其它类型的变换。在任何情况下,变换单元52可以向残余块应用所述变换,从而产生残余变换系数的块。所述变换可将残余信息从像素域转换到变换域,例如频域。量化单元54可以对残余变换系数进行量化以进一步降低位速率。量化过程可减少与系数中的一些或全部相关联的位深度。可通过调整量化参数来修改量化程度。
在量化之后,熵编码单元56可以对经量化变换系数进行熵译码。举例来说,熵编码单元56可以执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)或另一熵译码技术。在由熵编码单元56熵译码之后,可将经编码视频发射到另一装置或存档以供日后发射或检索。在CABAC的情况下,上下文可以基于相邻块和/或块大小。在CAVLC的情况下,上下文可以基于视频数据的经译码块和经先前译码相邻块的各种特性。
在一些情况下,熵编码单元56或视频编码器20的另一单元可经配置以执行如上文所描述的熵译码之外的其它译码功能。举例来说,熵编码单元56可经配置以确定视频数据的块和其分区的CBP值。此外,在一些情况下,熵编码单元56可以执行块中的系数的延伸长度译码。明确地说,熵编码单元56可以应用Z形扫描或其它扫描模式来扫描块中的变换系数并且对若干串的零进行编码以用于进一步压缩。熵编码单元56还可用适当语法元素构造标头信息以用于在经编码视频位流中发射。根据一些译码标准,例如HEVC,此类语法元素可包括例如如先前描述使用RQT表示的视频数据的CU的TU的一个或一个以上CBF和一TSF。
根据本发明的技术,可以对视频数据的CU的TU的一个或一个以上CBF和一TSF进行联合译码。作为一个实例,熵编码单元56可以对视频数据的块(例如,一个或一个以上CU)进行编码。熵编码单元56可经配置以确定视频数据的CU的TU的分量是否包括至少一个非零系数,确定TU是否分裂成子TU,从VLC表选择码字,其中所述VLC表提供所述码字对应于所述确定的指示,且提供所述TU的码字。在此实例中,熵编码单元56可以进一步经配置以将码字发送到位流中。
熵编码单元56可以进一步经配置以确定用于选择特定VLC表的TU的编码上下文。所述上下文可包括TU的各种特性,例如,以下各项中的一者或一者以上:对应于TU的PU的预测模式,TU的分割等级,以及将由码字表示的TU的分量的数目。
熵编码单元56可以使用所述编码上下文来选择VLC表。另外,当TU的色度分量的CBF中的一者是经译码的且另一者是推断的且因此未与另一CBF联合译码时,熵编码单元56可选择同一VLC表,不管哪个CBF是经译码的且哪个CBF是推断的。在这些实例中,VLC表可包括码字到CBF和TSF值的映射。此外,当TU的TSF是推断的且因此未与TU的一个或一个以上CBF联合译码时,熵编码单元56可选择与当TSF连同所述一个或一个以上CBF一起是经译码的时不同的VLC表。此外,熵编码单元56可取决于推断的TSF的值而选择不同VLC表。在这些实例中,VLC表可包括码字到CBF值的映射。
熵编码单元56可以进一步从VLC表中选择对应于TU的所述一个或一个以上CBF和所述TSF的码字。最后,熵编码单元56可以提供TU的码字。同样,在此实例中,熵编码单元56可以进一步经配置以将码字发送到位流中。
另外,对于所述VLC表,熵编码单元56可以基于以上确定来更新码字到CBF和TSF值的映射,以反映哪些确定对于所述编码上下文有更多或更少可能出现。举例来说,熵编码单元56可以跟踪对于所述编码上下文CBF和TSF值的每一组合的出现频率,并且设置与每一组合相关联的码字,从而使得所述码字具有与对应组合的可能性成反比的长度。
作为一个此实例,熵编码单元56可经配置以对TU的亮度分量的CBF、TU的两个色度分量的CBF(例如,如先前描述的CBFC)和TU的TSF进行联合编码。举例来说,在其中所述分量包含TU的第一色度分量并且其中所述TU进一步包含第二不同色度分量的情况下,熵编码单元56可以进一步经配置以确定第二色度分量是否包括至少一个非零系数。在此实例中,为了从所述VLC表中选择码字,熵编码单元56可经配置以选择所述码字,从而使得VLC表提供对于所述码字表示第一色度分量和第二色度分量中的至少一者是否包括至少一个非零系数(即,表示TU的CBFC)的指示。
在TU的CBFC值指示所述色度分量中的至少一者包括至少一个非零系数的情况下,熵编码单元56可进一步经配置以对指示每一个别色度分量是否包括至少一个非零系数的额外信息进行编码。但是,在一些实例中,当色度分量的两个CBF中的一者的值可推断时,熵编码单元56可经配置以不对所述额外信息进行编码。
根据一些实例,为了对所述额外信息进行编码,熵编码单元56可经配置以个别地对TU的色度分量的CBF进行编码。根据其它实例,熵编码单元56可经配置以用与上文参看对视频数据的CU的TU的一个或一个以上CBF和一TSF进行联合编码所描述的类似方式对TU的色度分量的CBF进行联合编码。举例来说,在第一色度分量和第二色度分量中的至少一者包括至少一个非零系数的情况下,熵编码单元56可以进一步经配置以从第二不同VLC表中选择第二不同码字,其中所述第二VLC表提供对第二码字表示第一色度分量是否包括至少一个非零系数和第二色度分量是否包括至少一个非零系数的指示。熵编码单元56可以进一步经配置以提供TU的第二码字。在此实例中,熵编码单元56可以进一步经配置以将第二码字发送到位流中。
在此实例中,同样,熵编码单元56可经配置以确定用于选择第二VLC表的用于的TU的第二不同编码上下文。所述上下文可包括以下各项中的一者或一者以上:CU的分割等级,TU的分割等级,对应于TU的PU的预测模式,以及对应于TU的相邻TU的第一色度分量和第二色度分量的CBF值。举例来说,所述相邻TU可以是CU的其它TU,先前对所述其它TU用与本文所述的相同方式对CBF和TSF进行了联合编码。在一些实例中,熵编码单元56可使用同一编码上下文来选择第一VLC表和第二VLC表两者,在此情况下上文所论述的第一和第二编码上下文可包含同一上下文。
同样,熵编码单元56可以使用第二编码上下文来选择第二VLC表。举例来说,第二VLC表可包括码字到CBFU和CBFV值的映射。熵编码单元56可以进一步从第二VLC表中选择对应于TU的色度CBF(即,CBFU和CBFV)的第二码字。最后,熵编码单元56可以提供TU的第二码字。同样,在此实例中,熵编码单元56可以进一步经配置以将第二码字发送到位流中。
另外,同样,对于第二VLC表,熵编码单元56可以基于以上确定来更新码字到CBFU和CBFV值的映射,以反映对于所述第二编码上下文哪些确定有更多或更少可能出现。举例来说,熵编码单元56可以跟踪对于所述第二编码上下文CBFU和CBFV值的每一组合的出现频率,并且设置与每一组合相关联的码字,从而使得所述码字具有与对应组合的可能性成反比的长度。
作为又一实例,TU的子TU的CBF或TSF可经联合译码。举例来说,在TU分裂成子TU的情况下,熵编码单元56可以进一步经配置以选择表示子TU是否分裂成另外的子TU的第二不同码字,并且提供子TU的第二码字。类似地,熵编码单元56可以选择第二码字,从而使得其表示对应于TU的分量的子TU的分量是否包括至少一个非零系数(即,经译码),并且提供子TU的第二码字。在这些实例中,熵编码单元56可以进一步经配置以将第二码字发送到位流中。
在这些实例中,所述第二码字还可包括VLC码字。第二码字可以选自使用第二不同编码上下文的第二不同VLC表。举例来说,当对子TU的TSF进行联合编码时,所述第二编码上下文可包括所述子TU的CBF的值,例如对应于所述子TU的Y分量的CBF。类似地,当对子TU的CBF进行联合编码时,第二编码上下文可包括子TU的TSF的值。
表1-5说明根据本发明的技术可以使用的VLC表的实例。表1的VLC表包括视频数据的CU的TU的CBF和TSF值(列“CU的TU的CBF和TSF”中所示的)到用于表示对应CBF和TSF值的VLC码字(列“码字”中所示的)的映射。表2的VLC表包括视频数据的CU的TU的CBFY、CBFC和TSF值(列“CU的TU的CBFY、CBFC和TSF”中所示的)到用于表示对应CBFY、CBFC和TSF值的VLC码字(列“码字”中所示的)的映射。表3的表VLC包括视频数据的CU的TU的CBFU和CBFV值(列“CU的TU的CBFU和CBFV”中所示的)到用于表示对应CBFU和CBFV值的VLC码字(列“码字”中所示的)的映射。最后,表4和表5的VLC表包括分别用于CU的TU的4个子TU的CBF和TSF值(列“CU的TU的子TU的CBF”和“CU的TU的子TU的TSF”中所示的)到也用于表示对应CBF或TSF值的VLC码字(相应列“码字”中所示的)的映射。
应注意,表1、表2、表4和表5中的每一者仅包括完整VLC表的摘录或子集。作为一个实例,表1和表5中的每一者的完整VLC表将一般包括CBF和/或TSF值组合的高达16个不同条目,所述组合被映射到对应数目的不同VLC码字,以表示所述TU或所述子TU的所有可能CBF和/或TSF值组合。作为另一实例,表2的完整VLC表将一般包括CBF和TSF值组合的高达8个不同条目,所述组合被映射到对应数目的不同VLC码字,以也表示所述TU的所有可能CBF和TSF值组合。作为又一实例,表4的完整VLC表将一般包括CBF值组合的多达15个不同条目,所述组合被映射到对应数目的不同VLC码字,以表示所述子TU的所有可能CBF值组合。在此实例中,从表4中排除对应于所有4个CBF(例如,针对4个子TU中的每一者的分量)为零的CBF值组合,因为此组合可通过子TU的母代TU的对应分量的CBF来指示。
在表1的实例中,假设每一码字表示视频数据的CU的TU的三个CBF和一个TSF。在其它实例中,如上所述,可表示较多或较少的CBF和TSF(例如,CU的TU的CBFY、CBFU和CBFV的子集,或一个以上TSF)。因此,表1中的码字的数目可基于经联合编码的CBF和TSF的数目而变化。以此方式,表1可具有比此实例中所示的条目多或少的条目。另外,在表1的实例中,参考列“CU的TU的CBF和TSF”,“1”的CBF值指示对应分量包括至少一个非零系数,即经译码,且为“0”的值指示分量不包含任何非零系数,即未经译码。此外,“1”的TSF值指示TU分裂成子TU,且为“0”的值指示TU未分裂。在其它实例中,表1中可使用不同的值来指示TU的分量是否经译码,以及TU是否分裂成子TU。
表1
参见表1的实例,假设对于视频数据的CU的TU,TU的所有分量(即,Y、U和V分量)包括至少一个非零系数,(且因此经译码),且TU分裂成子TU。在此实例中,假设CU的TU的分量(也就是说,TU的经译码分量)包括至少一个非零系数是以“1”的CBF值指示,且TU分裂成子TU以“1”的TSF值指示,如先前描述,模式选择单元40与变换单元52结合可将具有“1”的值的TU的TSF提供到熵编码单元56。另外,作为产生用以对CU进行编码的语法信息的一部分,熵编码单元56可确定TU的CBF,每一CBF也具有“1”的值。表1的实例是进一步以如下假设为前提:TU的所有分量经译码(也就是说,包括至少一个非零系数)且TU分裂成子TU的情况是给定编码上下文(即,用以选择表1中描绘的VLC表的上下文)时TU的最可能情况。因此,在此实例中,熵编码单元56将选择码字“1”来表示TU的所述一个或一个以上CBF和所述TSF。
在表2的实例中,假设每一码字表示视频数据的CU的TU的CBFY、CBFC和TSF。在其它实例中,可表示较多或较少的CBF和TSF(例如,CU的TU的仅CBFC和TSF)。因此,表2中的码字的数目可再次基于经联合编码的CBF和TSF的数目而变化,且表2可具有比此实例中所示的条目多或少的条目。再次,在表2的实例中,参见列“CU的TU的CBFY、CBFC和TSF”,“1”的CBF值指示对应分量是经译码的,且“0”的值指示所述分量是未经译码的。具体地说,“1”的CBFC值指示TU的色度分量中的至少一者是经译码的,且“0”的值指示色度分量是未经译码的。此外,“1”的TSF值指示TU分裂成子CU,且“0”的值指示TU是未分裂的。再次,在其它实例中,表2中可使用不同值来指示TU的分量是否是经译码的,以及TU是否分裂成子CU。
表2
参见表2的实例,假设对于视频数据的CU的TU,TU的亮度分量(即,Y分量)以及色度分量(即,U和V分量)中的至少一者包括至少一个非零系数,且TU分裂成子CU。在此实例中,假设CU的TU的亮度分量包括至少一个非零系数和TU的色度分量中的至少一者包括至少一个非零系数是各自以“1”的对应CBF值指示,且TU分裂成子TU是以“1”的TSF值指示,如先前描述,模式选择单元40与变换单元52结合可将具有“1”的值的TU的TSF提供到熵编码单元56。另外,作为产生用以对CU进行编码的语法信息的一部分,熵编码单元56可确定TU的CBFY和CBFC,每一CBF也具有“1”的值。表2的实例是进一步以如下假设为前提:TU的亮度分量和色度分量中的至少一者包括至少一个非零系数且TU分裂成子TU的情况是给定“第一”编码上下文(即,用以选择表2中描绘的VLC表的编码上下文)时TU的最可能情况。因此,在此实例中,熵编码单元56将选择码字“1”来表示TU的CBFY、CBFC和TSF,这在此实例中可被称为第一码字。
在表2的实例中,在TU的CBFC值指示色度分量中的至少一者包括至少一个非零系数的情况下(例如,CBFC=“l”),熵编码单元56可进一步经配置以对额外信息进行编码,所述信息指示是否每一个别色度分量包括至少一个非零系数,如下文更详细地描述的表3的实例中所说明。但是,在一些实例中,如先前描述,当色度分量的两个CBF中的一者的值可推断时,熵编码单元56可经配置以不对所述额外信息进行编码。
根据表3的实例,为了对所述额外信息进行编码,熵编码单元56可经配置以对TU的色度分量的CBF进行联合编码。在表3的实例中,假设每一码字表示视频数据的CU的TU的CBFU和CBFV。再次,在表3的实例中,参见列“CU的TU的CBFU和CBFV”,“1”的CBF值指示对应分量包括至少一个非零系数,且“0”的值指示所述分量并不包含任何非零系数。再次,在其它实例中,表3中可使用不同值来指示TU的色度分量是否包括至少一个非零系数。
表3
参见表3的实例,假设对于视频数据的CU的TU,TU的色度分量的两者(即,U和V分量)包括至少一个非零系数。在此实例中,假设CU的TU的色度分量包括至少一个非零系数是以“1”的对应CBF值指示,如先前描述,作为产生用以对CU进行编码的语法信息的一部分,熵编码单元56可确定TU的CBFu和CBFv,每一CBF具有“1”的值。表3的实例是进一步以如下假设为前提:TU的两个色度分量包括至少一个非零系数的情况是给定“第二”编码上下文(即,用以选择表3中描绘的VLC表的编码上下文)时TU的最可能情况。因此,在此实例中,熵编码单元56将选择码字“1”来表示TU的CBFU和CBFV,这在此实例中可被称为第二码字。
表4
表5
最后,参见表4和表5的实例,假设对于视频数据的CU的TU的4个子TU,所述子TU中的每一者的分量(例如,Y、U或V)包括至少一个非零系数,或所述子TU各自分裂为另外的子TU。在此实例中,再次假设CU的TU的分量包括至少一个非零系数是以“1”的CBF值指示,且TU分裂成子TU是以“1”的TSF值指示,如先前描述,模式选择单元40与变换单元52结合可将各自具有“1”的值的所述子TU的TSF提供到熵编码单元56。可替代地,作为产生用以对CU进行编码的语法信息的一部分,熵编码单元56可确定对应于所述分量的子TU的CBF,每一CBF也具有“1”的值。
在对子TU的CBF进行联合编码的情况下,再次假设所述子TU中的每一者的对应于CBF的特定分量包括至少一个非零系数的情况是给定编码上下文时所述子TU的最可能情况,熵编码单元56可从表4选择最短码字。在对子TU的TSF进行联合编码的情况下,再次假设子TU分裂为另外的子TU的情况是给定编码上下文时所述子TU的最可能情况,熵编码单元56还可从表5选择最短码字。在任何情况下,在此实例中,熵编码单元56将选择码字“1”来表示子TU的CBF或TSF。
简单参考下文更详细论述的图3的视频解码器30,视频解码器30可最终接收码字“1”,对应于在表1到5的实例中由视频编码器20所选择的码字中的任一者。因此,视频解码器30可使用大体上类似于表1或表2且在某些状况下表3中描绘的VLC表的VLC表来确定TU的所述一个或一个以上CBF和所述TSF,来对所述码字进行解码。类似地,视频解码器30可使用大体上类似于表4或表5中描绘的VLC表的VLC表来分别确定CU的TU的子TU的CBF或TSF,来对所述码字进行解码。
作为一个实例,使用表1,视频解码器30可基于所述码字确定TU的所有分量(即,Y、U和V分量)包括至少一个非零系数,且所述TU分裂成子TU。类似地,使用表2或表3,视频解码器30可基于所述码字而分别确定TU的亮度分量(即,Y分量)和色度分量(即,U和V分量)中的至少一者包括至少一个非零系数,且所述TU分裂成子TU,或所述色度分量两者均包括至少一个非零系数。作为另一实例,使用表4,视频解码器30可基于所述码字而确定子TU中的每一者的分量(例如,Y、U或V分量)包括至少一个非零系数。类似地,使用表5,视频解码器30可基于所述码字而确定所述子TU各自分裂为另外的子TU。在这些实例中,可实现位节省,原因是码字包含单个位而不是2个到4个位用以个别地指示TU的所述一个或一个以上CBF和/或所述TSF(例如,TU的CBFY、CBFU、CBFV和TSF,或CBFU和CBFV),以及子TU的CBF或TSF,如先前描述。
应理解,表1到5仅是用以对CU的TU的一个或一个以上CBF和一TSF以及CU的TU的子TU的CBF或TSF进行编码的VLC表的实例。提供表1到5中的VLC表的映射作为对于根据本发明的技术使用的VLC表可存在的许多可能映射中的某些映射的实例。
如表1的VLC表中所示,对应于CU的TU的所有分量包括至少一个非零系数以及TU分裂成子TU的CBF和TSF值映射到所述VLC表中的最短码字。类似地,如表2的VLC表中所示,对应于CU的TU的亮度分量和色度分量中的至少一者包括至少一个非零系数以及TU分裂成子TU的CBF和TSF值映射到VLC表中的最短码字。此外,如表3的VLC表中所示,对应于TU的两个色度分量包括至少一个非零系数的CBF值映射到VLC表中的最短码字。最后,如表4和表5的VLC表中所示,对应于CU的TU的所有子TU的分量包括至少一个非零系数的CBF值以及对应于CU的TU的子TU分裂为另外的子TU的TSF值映射到相应的VLC表中的最短码字。在以上实例中的每一者中,特定映射指示对应CBF和/或TSF值经确定为由用于编码上下文的VLC表界定的可能性当中的最可能值。在其它实例中,其它CBF和TSF值可经确定为最可能的。举例来说,指示CU的TU的所有分量并不包含任何非零系数的CBF值和指示所述TU未分裂为子TU的TSF值可经确定为最可能的。类似地,指示CU的TU的子TU中的每一者的分量并不包含任何非零系数的CBF值或指示CU的TU的子TU中的每一者未分裂为另外的子TU的TSF值也可以经确定为最可能的。
此外,基于用于TU和子TU的编码上下文,不同VLC表可提供不同映射。因此,对于所选择的不同VLC表,指示不同CBF和/或TSF值的相对可能性的对应映射可变化,且对于所选择的给定VLC表,所述映射可基于用于CU的其它TU和一个或一个以上先前编码的CU的TU的CBF和/或TSF值而持续经更新。
在一些实例中,如上文所描述对于TU或对于子TU确定的多个编码上下文可对应于共同VLC表,例如表1到5中的任一者。因此,不同编码上下文可仍然使得使用共同VLC表对于TU的一个或一个以上CBF和一TSF或TU的子TU的CBF或TSF进行译码,其可减少系统复杂性和译码资源。
出于实例的目的,以上表1到5利用一元码字来表示CU的TU的一个或一个以上CBF和一TSF以及TU的子TU的CBF或TSF。但是,在其它实例中可使用其它类型的可变长度码,例如指数-哥伦布,或其它霍夫曼码或算术码。在一些实例中,表1到5中的某些码字可具有类似位长度,例如,当CBF和/或TSF值对应于每一码字的概率大致相同时。此外,任何码字集合可用于表1到5,只要所述码字中的每一者是唯一可解码的(例如,所述码字中无任一者是同一表中的另一码字的前缀)。
视频编码器20可使用所述一个或一个以上码字对CU进行编码以包含TU的所述一个或一个以上CBF和所述TSF和/或子TU的CBF或TSF。举例来说,熵编码单元56可包含所述一个或一个以上码字作为CU的经编码语法信息的一部分,如上文所描述。因为使用上文所描述的VLC译码技术可在平均情况中使得所述一个或一个以上码字包含比由所述码字表示的经个别译码的CBF和TSF少的位,所以当使用本发明的技术时对于包含所述码字的经译码位流可存在相对位节省。
逆量化单元58和逆变换单元60分别应用逆量化和逆变换以在像素域中重构残余块,例如以供稍后用作参考块。运动补偿单元44可以通过将残余块添加到参考帧存储装置64的帧中的一者的预测性块中来计算参考块。运动补偿单元44还可将一个或一个以上内插滤波器应用于经重构残余块以计算子整数像素值用于运动估计。求和器62将经重构残余块添加到由运动补偿单元44产生的运动补偿预测块以产生经重构视频块用于存储在参考帧存储装置64中。经重构视频块可由运动估计单元42和运动补偿单元44使用作为参考块以对后续视频帧中的块进行帧间译码。
以此方式,图2的视频编码器20表示用于对视频数据进行编码的设备的实例,其包含视频编码器,所述视频编码器经配置以确定视频数据的CU的TU的分量是否包括至少一个非零系数,确定TU是否分裂成子TU,从VLC表中选择码字,其中所述VLC表提供对所述码字对应于所述确定的指示,且提供用于所述TU的码字。
图3是说明视频解码器30的实例的框图,所述视频解码器可以实施用于对视频数据的CU的TU的经联合编码的一个或一个以上CBF和一TSF进行解码的技术。在图3的实例中,视频解码器30包含熵解码单元70、运动补偿单元72、帧内预测单元74、逆量化单元76、逆变换单元78、参考帧存储装置82和求和器80。在一些实例中,视频解码器30可执行总体上与关于视频编码器20(图2)描述的编码遍次互逆的解码遍次。运动补偿单元72可基于从熵解码单元70接收的运动向量产生预测数据。帧内预测单元74可基于从熵解码单元70接收的用于对应CU的帧内预测模式而产生预测数据。
视频解码器30可接收由例如视频编码器20编码的经编码视频数据(例如,一个或一个以上CU)。可替代地,视频解码器30可从例如CD-ROM、蓝光光盘、快闪驱动器、硬盘驱动器或其它存储媒体等存储媒体接收经编码的视频数据。再次,作为一个实例,视频数据的CU的TU的一个或一个以上CBF和一TSF可经联合译码。根据本发明的技术,熵解码单元70可经配置以基于TU的码字而确定视频数据的CU的TU的分量是否包括至少一个非零系数,基于所述码字确定TU是否分裂成子TU,且基于所述确定对所述TU进行解码。
在一些实例中,熵解码单元70可经配置以用大体上类似于如先前参见图2描述的熵编码单元56使用的方式的方式确定用于TU的解码上下文,以选择包含所述码字的特定VLC表。举例来说,所述解码上下文可包含TU的各种特性,例如,以下各项中的一者或一者以上:对应于TU的PU的预测模式,TU的分割等级,以及由码字表示的TU的分量的数目。
熵解码单元70可使用所述解码上下文来选择VLC表。另外,当TU的色度分量的CBF中的一者是经译码的且另一者是推断的且因此未与另一CBF联合译码时,熵解码单元70可选择同一VLC表,不管哪个CBF是经译码的且哪个CBF是推断的。在这些实例中,VLC表可包含码字到CBF和TSF值的映射。此外,当TU的TSF是推断的且因此未与TU的一个或一个以上CBF联合译码时,熵解码单元70可选择与当TSF与所述一个或一个以上CBF一起经译码的时不同的VLC表。此外,熵解码单元70可取决于推断的TSF的值而选择不同VLC表。在这些实例中,VLC表可包含码字到CBF值的映射。
使用VLC表,熵解码单元70可基于所述码字而确定TU的一个或一个以上分量是否包括至少一个非零系数,即,是经译码的,且所述TU是否分裂成子TU。此外,熵解码单元70可基于以上确定而更新码字与VLC表内的CBF和TSF值之间的映射以反映对于解码上下文来说哪些确定有更多或更少可能出现,例如以协调VLC表内的映射与由视频编码器20用来对TU的所述一个或一个以上CBF和所述TSF进行联合编码的对应VLC表中的映射。
再次,作为一个实例,熵解码单元70可经配置以对TU的亮度分量的经联合编码的CBF(例如CBFY)、TU的两个色度分量的CBF(例如,如先前描述的CBFC)以及TU的TSF进行解码。举例来说,在所述分量包含TU的第一色度分量并且其中所述TU进一步包含第二不同色度分量的情况下,熵解码单元70可进一步经配置以基于所述码字而确定所述第一色度分量和第二色度分量中的至少一者是否包括至少一个非零系数,即,确定所述TU的CBFC
再次,在TU的CBFC值指示所述色度分量中的至少一者包括至少一个非零系数的情况下,熵解码单元70可进一步经配置以对指示每一个别色度分量是否包括至少一个非零系数的额外信息进行解码。但是,在一些实例中,当色度分量的所述两个CBF中的一者的值可推断时,熵解码单元70可经配置以不对所述额外信息进行解码。
根据一些实例,为了对所述额外信息进行解码,熵解码单元70可经配置以对TU的色度分量的经个别编码的CBF进行解码。根据其它实例,熵解码单元70可经配置以用与如上文参见对视频数据的CU的TU的经联合编码的一个或一个以上CBF和一TSF进行解码所描述的类似的方式对TU的色度分量的经联合编码的CBF进行解码。
举例来说,在所述第一色度分量和第二色度分量中的至少一者包括至少一个非零系数的情况下,为了基于所述码字而确定第一色度分量是否包括至少一个非零系数,熵解码单元70可进一步经配置以在基于所述码字确定第一色度分量和第二色度分量中的至少一者包括至少一个非零系数之后基于所述TU的第二不同码字而确定第一色度分量是否包括至少一个非零系数。熵解码单元70可进一步经配置以基于所述第二码字而确定第二色度分量是否包括至少一个非零系数。
在此实例中,再次,熵解码单元70可经配置以用大体上与如先前描述由熵编码单元56使用的方式类似的方式确定TU的第二解码上下文,以选择包含所述第二码字的第二VLC表。举例来说,所述第二解码上下文可包含以下各项中的一者或一者以上:CU的分割等级,TU的分割等级,对应于TU的PU的预测模式,以及对应于TU的相邻TU的第一色度分量和第二色度分量的CBF值。举例来说,所述相邻TU可为CU的其它TU,所述其它TU的经联合编码的CBF和TSF先前以与如本文所述的相同方式被解码。在一些实例中,熵解码单元70可使用同一解码上下文来选择第一VLC表和第二VLC表两者,在此情况下上文所论述的第一和第二编码上下文可包含同一上下文。
再次,熵解码单元70可使用第二解码上下文来选择第二VLC表。举例来说,第二VLC表可包括码字到CBFU和CBFV值的映射。使用第二VLC表,熵解码单元70可基于所述第二码字而确定TU的色度分量中的每一者是否包括至少一个非零系数,即,是经译码的。此外,熵解码单元70可基于以上确定而更新码字与第二VLC表内的CBFU和CBFV值之间的映射以反映对于所述第二解码上下文来说哪些确定有更多或更少可能出现,例如以协调所述第二VLC表内的映射与由熵编码单元56用来对TU的CBFU和CBFV进行联合编码的对应VLC表中的映射。
再次,作为又一实例,TU的子TU的CBF或TSF可经联合译码。举例来说,在TU分裂成子TU的情况下,熵解码单元70可进一步经配置以基于子TU的第二不同码字而确定所述子TU是否分裂为另外的子TU。类似地,熵解码单元70可经配置以基于所述子TU的第二码字而确定对应于TU的分量的子TU的分量是否包括至少一个非零系数。
再次,在这些实例中,所述第二码字还可包括VLC码字。所述第二码字可用于使用第二不同VLC表来确定子TU的CBF或TSF,所述第二不同VLC表是使用第二不同解码上下文选择的。举例来说,当对子TU的经联合编码的TSF进行解码时,所述第二解码上下文可包含所述子TU的CBF的值,例如对应于所述子TU的Y分量的CBF。类似地,当对所述子TU的经联合编码的CBF进行解码时,所述第二解码上下文可包括所述子TU的TSF的值。
作为一实例,再次参见图2的表1到5的VLC表,假设由熵解码单元70接收的用于视频数据的CU的TU的码字包含“1”。在此实例中,熵解码单元70可使用表1或表2且在某些情况下表3中描绘的码字和VLC表,以确定TU的一个或一个以上CBF和一TSF。明确地说,在此实例中,表1指示码字对应于TU的所有分量(即,Y、U和V分量)包括至少一个非零系数且所述TU分裂成子TU。因此,熵解码单元70可确定,对于具有对应于表1的解码上下文的CU的TU以及对于针对TU接收的具有值“1”的码字,所述TU的所有分量包括至少一个非零系数,且所述TU分裂成子TU。
类似地,假设由熵解码单元70接收的码字包含TU的第一码字。在此实例中,表2指示所述码字对应于TU的亮度分量(即,Y分量)和色度分量(即,U和V分量)中的至少一者包括至少一个非零系数,且所述TU分裂成子TU。因此,熵解码单元70可确定,对于具有对应于表2的解码上下文的CU的TU以及针对TU接收的具有值“1”的第一码字,所述TU的亮度分量和色度分量中的至少一者包括至少一个非零系数,且所述TU分裂成子TU。
此外,在此实例中,假设由熵解码单元70接收的TU的第二码字也包含“1”。表3指示所述第二码字对应于所述TU的两个色度分量(即,U和V分量)包括至少一个非零系数。因此,熵解码单元70可确定,对于具有对应于表3的解码上下文的CU的TU以及对于针对TU接收的具有值“1”的第二码字,所述TU的两个色度分量包括至少一个非零系数。
作为另一实例,假设由熵解码单元70接收的视频数据的CU的TU的子TU的码字包含“1”。在此实例中,表4指示所述码字对应于所述子TU中的每一者的分量(例如,Y、U或V分量)包括至少一个非零系数,且表5指示所述码字对应于所述子TU中的每一者分裂为另外的子TU。因此,在此情况下,熵解码单元70可确定,对于具有对应于表4或表5的解码上下文的CU的TU的子TU以及对于针对所述子TU接收的具有值“1”的码字,所述子TU中的每一者的分量包括至少一个非零系数,即,是经译码的(在表4的情况下),或所述子TU中的每一者分裂为另外的子TU(在表5的情况下)。
视频解码器30可使用使用所述一个或一个以上码字确定的TU的所述一个或一个以上CBF和TSF和/或子TU的CBF或TSF对CU进行解码。作为一实例,逆变换单元78和/或逆量化单元76可使用所述确定的CBF来确定CU的所述一个或一个以上TU中的哪些TU含有包括至少一个非零系数的分量,且使用所述确定的TSF来产生所述一个或一个以上TU的分区信息,以便执行逆变换和逆量化。再次,因为使用上文所描述的VLC译码技术可在平均情况中使得所述一个或一个以上码字包含比由所述码字表示的经个别译码的CBF和TSF少的位,所以当使用本发明的技术时对于包含所述码字的经译码位流可存在相对位节省。
运动补偿单元72可使用在位流中接收的运动向量来识别参考帧存储装置82中的参考帧中的预测块。帧内预测单元74可使用在位流中接收的帧内预测模式以从空间邻近的块形成预测块。
帧内预测单元74可使用经编码块的帧内预测模式的指示来对所述经编码块进行帧内预测,例如使用相邻的先前经解码块的像素。对于其中所述块经帧间预测模式编码的实例,运动补偿单元72可接收界定运动向量的信息,以便检索用于所述经编码块的运动补偿预测数据。在任何情况下,运动补偿单元72或帧内预测单元74可将界定预测块的信息提供到求和器80。
逆量化单元76对在位流中提供且由熵解码单元70解码的经量化块系数进行逆量化即解量化。所述逆量化过程可包括常规过程,例如由H.264解码标准界定或由HM执行。所述逆量化过程还可包括使用由编码器50为每一块所计算的量化参数QPY来确定量化的程度,且同样确定应应用的逆量化的程度。
逆变换单元58对变换系数应用逆变换,例如逆DCT、逆整数变换或概念上类似的逆变换过程,以便产生像素域中的残余块。如上文所描述,根据本发明的技术,描述CU的一个或一个以上TU的变换系数如何分割的语法信息可针对所述一个或一个以上TU经联合译码,在某些情况下与其它语法信息一起译码,且如本文所述由逆变换单元58使用。
运动补偿单元72产生经运动补偿块,有可能基于内插滤波器执行内插。用于将用于以子像素精度进行运动估计的内插滤波器的识别符可包括在语法元素中。运动补偿单元72可使用由视频编码器20在视频块的编码期间使用的内插滤波器来计算参考块的子整数像素的内插值。运动补偿单元72可根据接收到的语法信息而确定由视频编码器20使用的内插滤波器且使用所述内插滤波器来产生预测性块。
运动补偿单元72使用经编码块的某些语法信息来确定用以对经编码视频序列的帧进行编码的块的大小、描述经编码视频序列的帧或切片的每一块如何分割的分区信息、指示每一分区如何经编码的模式、每一经帧间编码块或分区的一个或一个以上参考帧(和参考帧列表),和用以对经编码视频序列进行解码的其它信息。
求和器80将残余块与由运动补偿单元72或帧内预测单元74产生的对应预测块求和以形成经解码块。如果需要的话,也可以应用去块滤波器以对经解码块进行滤波,以便移除成块假象。随后将经解码视频块存储在参考帧存储装置82中,参考帧存储装置82提供用于后续运动补偿的参考块且还产生经解码视频用于呈现于显示装置(例如图1的显示装置32)上。
以此方式,图3的视频解码器30表示用于对视频数据进行解码的设备的实例,其包括视频解码器,所述视频解码器经配置以基于视频数据的CU的TU的码字而确定所述TU的分量是否包括至少一个非零系数,基于所述码字确定TU是否分裂成子TU,且基于所述确定对所述TU进行解码。
图4是说明视频数据的CU的TU的实例的概念图。如图4中描绘,视频帧400的当前CU402可表示当前经译码CU。举例来说,当前CU402可表示视频帧400的LCU的子CU,其对应于与所述LCU相关联的CU四叉树中的叶节点,如先前描述。当前CU402可具有任何大小,例如,8x8、16x16、32x32或64x64像素。如图4中描绘,当前CU402可包括当前TU404,当前TU404又可包括Y分量410、U分量412和V分量414中的每一者。举例来说,Y分量410可对应于当前TU404的亮度分量,且U分量412和V分量414可分别对应于当前TU404的第一色度分量和第二色度分量。
在此实例中,如图4中所说明,当前TU404的大小可对应于当前CU402的大小。此外,Y分量410、U分量412和V分量414中的每一者的大小可对应于当前TU404的大小。换句话说,Y分量410、U分量412和V分量414中的每一者的大小可对应于当前CU402的大小。根据其它实例,当前TU404和相关联Y分量410、U分量412和V分量414可分割为子TU和相应的Y、U和V子分量。举例来说,当前TU404可分割为4个子TU,其中每一子TU可包括对应于当前TU404的Y分量410、U分量412和V分量414的子分量的相应的Y、U和V分量。
图4还说明视频帧400的当前CU402的相邻CU406。如图4中所示,相邻CU406定位于视频帧400中的当前CU402的左边。在其它实例中,相邻CU406或当前CU402的任何其它相邻CU可定位于视频帧400中的当前CU402上方。在另外其它实例中,当前CU402的相邻CU可定位于与当前CU402相邻的其它位置。还如图4中所示,相邻CU406可包括相邻TU408,其可包括Y分量416、U分量418和V分量420,其中相邻TU408和相关联Y分量416、U分量418和V分量420可以与与如上文参见当前TU404所描述大体上类似的方式分割为子TU和相应的Y、U和V子分量。
对于当前CU402的每一TU,包括当前TU404,且对于相邻CU406的每一TU,包括相邻TU408,可提供描述相应的TU的一个或一个以上分量(例如,Y、U或V分量中的一者或一者以上)是否包括至少一个非零系数(即,是经译码的)且TU是否分裂成子TU的语法信息。此语法信息可总体上对应于TU的一个或一个以上CBF和一TSF,如上文所描述。举例来说,TU的所述一个或一个以上CBF和所述TSF可各自使用单个位值来表示,例如,单个位旗标。在一些实例中,在CBF中的给定一者的情况下,视频编码器20可将对应的单个位旗标设置为“1”的值以指示所述TU的对应于所述CBF的分量包括至少一个非零系数,且将所述旗标设置为“0”的值以指示所述分量并不包括任何非零系数。类似地,在TSF的情况下,视频编码器20可将对应单个位旗标设置为“1”的值以指示所述TU分裂成子TU,且将所述旗标设置为“0”的值以指示所述TU不分裂。
根据本发明的技术,作为一个实例,视频编码器20可对视频数据的CU的TU的一个或一个以上CBF和一TSF进行联合编码,所述TU例如是当前TU404、相邻TU408或当前TU404或相邻TU408的任何子TU。举例来说,当对当前TU404的一个或一个以上CBF和一TSF进行联合编码时,视频编码器20可对对应于当前TU404的Y分量410、U分量412和V分量414中的一者或一者以上的一个或一个以上CBF连同TSF一起进行联合编码。如先前描述,视频编码器20可使用单个VLC码字对所述一个或一个以上CBF和所述TSF进行联合编码。因此,视频解码器30可接收所述单个VLC码字,且对所述码字进行解码以确定当前TU404的所述一个或一个以上CBF和所述TSF。
还如先前描述,视频编码器20可同样使用单个VLC码字(例如,第一码字)对对应于当前TU404的Y分量410的CBF(即,CBFY)和对应于U分量412和V分量414两者的CBF(即CBFC)连同当前TU404的TSF一起进行联合编码。另外,在某些情况下,视频编码器20可进一步使用另一单个VLC码字(例如,第二码字)对对应于U分量412和V分量414的CBF(即,CBFU和CBFV)进行联合编码。再次,视频解码器30可接收所述一个或一个以上单个VLC码字,且对所述码字进行解码以确定当前TU404的所述一个或一个以上CBF和所述TSF。
在这些实例中,为了使用所述一个或一个以上单个VLC码字对所述一个或一个以上CBF和所述TSF进行联合编码,视频编码器20可基于用于当前TU404的编码上下文而选择包括相应的码字的VLC表。举例来说,当对当前TU404的所述一个或一个以上CBF和所述TSF(包括CBFY、CBFC和TSF)进行联合编码时,编码上下文可包括以下各项中的一者或一者以上:对应于当前TU404的预测模式,当前TU404的分割等级,和当前TU404的将由所述单个VLC码字表示的分量的数目。另外,当对当前TU404的CBFU和CBFV进行联合编码时,编码上下文可包括以下各项中的一者或一者以上:当前CU402的分割等级,当前TU404的分割等级,和对应于当前TU404的相邻TU的第一色度分量和第二色度分量的CBF值。在此实例中,所述相邻TU可为当前CU402的其它TU,所述其它TU的亮度CBF、色度CBF和TSF是先前以与如本文所述的相同方式联合编码的。视频编码器20可随后从VLC表中选择相应的单个VLC码字,使得所述VLC表提供所述码字对应于当前TU404的所述一个或一个以上CBF和所述TSF或色度CBF的指示,且提供当前TU404的码字。
类似地,为了对所述一个或一个以上单个VLC码字进行解码以确定当前TU404的所述一个或一个以上CBF和所述TSF或色度CBF,视频解码器30还可基于当前TU404的解码上下文而选择包括相应的码字的VLC表,其中所述解码上下文可大体上与所述编码上下文相同。因此,由视频编码器20和视频解码器30所选择的VLC表可大体上相同。视频解码器30可随后基于所述一个或一个以上单个VLC码字而确定当前TU404的所述一个或一个以上CBF和所述TSF,且基于所述确定而对当前TU404进行解码。
作为另一实例,视频编码器20可对CU的TU的子TU的CBF或TSF进行联合编码,所述TU再次例如为当前TU404、相邻TU408或当前TU404或相邻TU408的任何子TU。举例来说,当对当前TU404的子TU的CBF进行联合编码时,视频编码器20可对对应于所述子TU的相应的Y分量的CBF进行联合编码,所述相应的Y分量又对应于当前TU404的Y分量410的子分量。举例来说,当所述子TU的仅Y分量的相应的CBF是经译码的(即,所述子TU的其它CBF和TSF是推断的)时,视频编码器20可对所述子TU的CBF进行联合编码。类似地,当对当前TU404的子TU的TSF进行联合编码时,当所述子TU的CBF全部未经译码(即,所述子TU的所有CBF是推断的)时,视频编码器20可对所述子TU的TSF进行联合编码。
同样如先前描述,视频编码器20可使用单个VLC码字对子TU的CBF或TSF进行联合编码。因此,视频解码器30可接收所述单个VLC码字,且对所述码字进行解码以确定所述子TU的CBF或TSF。
在此实例中,为了使用单个VLC码字对CBF或TSF进行联合编码,视频编码器20可再次基于所述子TU的编码上下文来选择包括所述码字的VLC表。举例来说,当对子TU的CBF进行联合编码时,编码上下文可包括子TU的TSF的值。类似地,当对子TU的TSF进行联合编码时,编码上下文可包括子TU的CBF的值,例如所述子TU的Y分量的CBF。视频编码器20可随后从VLC表选择单个VLC码字,使得所述VLC表提供所述码字对应于所述子TU的CBF或TSF的指示,且提供所述子TU的码字。
类似地,为了对所述单个VLC码字进行解码以确定子TU的CBF或TSF,视频解码器30还可基于所述子TU的解码上下文来选择VLC表,其中所述解码上下文可与编码上下文大体上相同。因此,由视频编码器20和视频解码器30所选择的VLC表可再次大体上相同。视频解码器30可随后基于所述单个VLC码字而确定子TU的CBF或TSF,且基于所述确定对所述子TU进行解码。
以此方式,根据本发明的技术,视频编码器20和/或视频解码器30可对视频数据的CU的TU的一个或一个以上CBF和一TSF进行联合译码。另外,视频编码器20和/或视频解码器30可对视频数据的CU的TU的子TU的CBF或TSF进行联合译码。如上文所描述,这些技术可使得能够比当对TU的语法元素进行个别译码时相对较有效地对视频数据的CU的TU的CBF和TSF语法元素进行译码。
图5A是说明视频数据的CU的TU的实例的概念图。如图5A中所示,可表示叶节点CU的最大TU的TU500可分裂成子TU502、504、506和508。假设对于此实例,所述TU500具有2Nx2N像素的大小。因此,子TU502、504、506和508中的每一者可具有NxN像素的大小。类似地,子TU504可分裂为子TU510、512、514和516,其中子TU510、512、514和516中的每一者可具有N/2xN/2像素的大小。子TU510、512、514和516同样被视为TU500的子TU。同样,子TU516可分裂为子TU518、520、522和524,其中子TU518、520、522和524中的每一者可具有N/4xN/4像素的大小,等等。因此,在此实例中,TU500可分裂成子TU,其中所述子TU中的某些可分裂为另外的子TU。换句话说,TU500可以递归方式分裂成子TU。
以与上文参见CU的分割等级所描述类似的方式,CU的每一TU,包括CU的最大TU和最大TU的子TU,可与以对应于CU的根节点TU的等级0起始的特定分割等级(或“深度”)相关联,所述根节点TU还称为CU的“最大”TU。在图5A的实例中,TU500可对应于CU的最大TU,且可与分割等级0相关联。类似地,TU500的子TU502、504、506和508可与分割等级1相关联,子TU504的子TU510、512、514和516可与分割等级2相关联,且子TU516的子TU518、520、522和524可与分割等级3相关联。因此,视频数据的CU的一个或一个以上TU可共享分割等级。此外,如下文较详细描述,指示CU的一个或一个以上TU的分割等级的信息以及其它语法信息可使用数据结构来表示,例如RQT或均匀分区结构。
图5B是说明表示图5A的TU500的分区信息的RQT的实例的概念图。如图5B中所示,RQT526包括根节点528,其对应于TU500,且与分割等级0相关联。同样如图5B中所示,RQT526包括不具有子代节点的端子或“叶”节点530、534、536、538、540、542、546、548、550和552,和各自具有4个子代节点的中间节点532和544。在此实例中,根节点528具有4个子代节点,包括三个叶节点530、534和536,和一个中间节点532。在此实例中,节点530、532、534和536分别对应于TU500的子TU502、504、506和508,且各自与分割等级1相关联。
因为节点532不是叶节点,所以节点532包括4个子代节点,包括三个叶节点538、540和542,和一个中间节点544。在此实例中,节点538、540、542和544分别对应于TU500的子TU510、512、514和516,且各自与分割等级2相关联。中间节点544包括4个叶节点546、548、550和552,其分别对应于TU500的子TU518、520、522和524,且各自与分割等级3相关联。一般来说,视频数据的CU的TU的RQT可包括比RQT526的实例多或少的节点和相关联分割等级。
图5C是说明视频数据的CU的TU的均匀分区结构的实例的概念图。举例来说,TU556可表示叶节点CU的最大TU。在其它实例中,TU556可表示CU的最大TU的子TU,其中所述最大TU是如先前描述根据RQT来分割。以此方式,根据本发明的技术,均匀分区结构554可用作CU的最大TU的唯一的分区结构,或如图5B中所示与RQT结合与所述最大TU相关联。作为一个实例,所述最大TU可基于均匀分区结构554分裂成子TU。作为另一实例,所述最大TU可基于RQT而分裂成子TU,且所述子TU中的一者或一者以上可基于均匀分区结构554而分裂为另外的子TU。在任何情况下,子TU558-588可对应于根据均匀分区结构554分割的TU556的子TU。
根据本发明的技术,可使用语法信息在位流中发信号通知与TU(例如,CU的最大TU或最大TU的子TU)相关联的均匀分区结构,所述语法信息指示所述均匀分区结构用于所述TU,和所述TU根据所述均匀分区结构分裂为的子TU的数目(例如,4、16、64等等)。举例来说,所述TU根据所述均匀分区结构分裂为的子TU的数目可指示所述子TU中的每一者的大小。此外,在一些实例中,所述TU根据所述均匀分区结构分裂为的子TU的数目可以与上文参见RTQ所描述类似的方式对应于所述子TU的分割等级。一般来说,用于视频数据的CU的给定TU的均匀分区结构可包括比均匀分区结构554的实例多或少的分区。
再次参见图5A和5B,RQT526的每一节点可包括对应TU的一个或一个以上CBF和一TSF。举例来说,如先前描述,TU的所述一个或一个以上CBF和所述TSF可各自使用单个位值来表示,例如,单个位旗标。如上文所描述,在一些实例中,在所述CBF中的给定一者的情况下,视频编码器20可将所述对应单个位旗标设置为“1”的值以指示所述TU的对应于CBF的分量包括至少一个非零系数,即,是经译码的,且将所述旗标设置为“0”的值以指示所述分量并不包括任何非零系数,即是未经译码的。类似地,在TSF的情况下,视频编码器20可将对应单个位旗标设置为“1”的值以指示所述TU分裂成子TU,且将所述旗标设置为“0”的值以指示所述TU不分裂。
根据本发明的技术,作为一个实例,视频编码器20可对CU的TU的一个或一个以上CBF和一TSF进行联合编码,所述TU例如为TU500或TU500的子TU。如先前描述,视频编码器20可使用单个VLC码字对所述一个或一个以上CBF和所述TSF进行联合编码,且视频解码器30可接收所述单个VLC码字,且对所述码字进行解码以确定TU的所述一个或一个以上CBF和所述TSF。
作为另一实例,同样如先前描述,视频编码器20可同样使用单个VLC码字对对应于CU的TU(例如,TU500或TU500的子TU)的两个色度分量的CBF(即,CBFC)连同对应于所述TU的亮度分量的CBF和所述TU的TSF一起进行联合编码。另外,同样如先前描述,在某些情况下,视频编码器20可进一步使用另一单个VLC码字对对应于TU的色度分量的CBF进行联合编码。再次,视频解码器30可接收所述一个或一个以上单个VLC码字,且对所述码字进行解码以确定TU的所述一个或一个以上CBF和所述TSF。
作为又一实例,同样如先前描述,视频编码器20可对CU的TU的子TU的CBF或TSF进行联合编码,所述子TU例如为TU500的子TU510、512、514和516。同样如先前描述,视频编码器20可同样使用单个VLC码字对CBF或TSF进行联合编码,且视频解码器30可接收所述单个VLC码字且对所述码字进行解码以确定所述子TU的CBF或TSF。
在视频编码器20和/或视频解码器30对TU(例如,TU500或TU500的子TU)的一个或一个以上CBF和一TSF进行联合译码的情况下,对应于所述TU的RQT526的节点可包括一个或一个以上单个值(例如,一个或一个以上单个VLC码字),其表示所述TU的所述一个或一个以上CBF和所述TSF。换句话说,表示所述一个或一个以上CBF和所述TSF的所述一个或一个以上单个值可包括在与原始一个或一个以上CBF和TSF相同的节点或分区中。
在视频编码器20和/或视频解码器30对TU的子TU(例如,TU500或TU500的子TU)的CBF或TSF进行联合译码的情况下,对应于所述TU的RQT526的节点可包括单个值(例如,单个VLC码字),其表示所述子TU的CBF或TSF。以此方式,表示子TU的CBF或TSF的所述单个值可包括在对应于所述子TU的母代TU的节点中。举例来说,关于TU500,视频编码器20和/或视频解码器30可对TU500的分别对应于RQT526的节点530、532、534和536的子TU502、504、506和508的CBF或TSF进行联合译码。所产生的表示CBF或TSF的单个值可包括在RQT526的根节点528中,根节点528是节点530、532、534和536的母代节点。
以此方式,根据本发明的技术,视频编码器20和/或视频解码器30可对视频数据的CU的TU的一个或一个以上CBF和一TSF进行联合译码。另外,视频编码器20和/或视频解码器30可对视频数据的CU的TU的子TU的CBF或TSF进行联合译码。如上文所描述,这些技术可使得能够比当对TU的语法元素进行个别译码时相对较有效地对视频数据的CU的TU的CBF和TSF语法元素进行译码。
图6是说明用于对视频数据的CU的TU的一个或一个以上CBF和一TSF进行联合编码的实例方法的流程图。图6的技术可总体上由任何处理单元或处理器执行,无论是以硬件、软件、固件还是其组合实施,且当以软件或固件实施时,可提供对应硬件以执行所述软件或固件的指令。出于实例的目的,关于视频编码器20(图1和2)描述图6的技术,但应理解,其它装置可经配置以执行类似技术。此外,图6中说明的步骤可以不同次序或并行执行,且可添加额外步骤且省略某些步骤,而不脱离本发明的技术。
首先,视频编码器20可接收视频数据块(600)。所述块可对应于CU,例如LCU的子CU,其对应于与所述LCU相关联的CU四叉树中的叶节点,如上文所描述。所述CU可包括一个或一个以上TU,例如包括CU的最大TU,其可根据与所述最大TU相关联的RQT分裂成子TU,同样如上文所描述。以此方式,图6的方法可递归地应用到CU的任何TU,包括CU的最大TU和所述最大TU的子TU。
视频编码器20可进一步确定所述块的给定TU或CU的一个或一个以上分量是否是经译码的,即,包括至少一个非零系数(602)。举例来说,熵编码单元56可作为产生如上文所描述用以对CU进行编码的语法信息的一部分进行此确定,其中所述确定的结果可对应于所述TU的所述一个或一个以上分量的一个或一个以上CBF。视频编码器20可进一步确定所述TU是否分裂成子TU(604)。举例来说,同样如上文所描述,此确定可例如由模式选择单元40与变换单元52和/或视频编码器20的其它单元或组件结合在对CU进行编码的过程中较早进行,作为产生用于所述CU的预测数据的一部分。此确定的结果可对应于TU的TSF。
出于实例的目的,假设视频编码器20确定TU的所述一个或一个以上分量是否经译码的,且TU是否分裂成子TU,视频编码器20可进一步确定对应的一个或一个以上CBF和TSF的值。举例来说,“1”的CBF值可指示对应分量是经译码的,且“0”的CBF值可指示所述分量未经译码。类似地,“1”的TSF值可指示TU分裂成子TU,且“0”的TSF值可指示TU不分裂。
视频编码器20可以进一步对TU的所述一个或一个以上CBF和所述TSF进行编码。举例来说,模式选择单元40和/或变换单元52可将TSF的值提供到熵编码单元56。如上文所描述,熵编码单元56可作为产生用以对CU进行编码的语法信息的一部分而确定所述一个或一个以上CBF的值。
为了对TU的所述一个或一个以上CBF和所述TSF进行编码,熵编码单元56或视频编码器20的另一单元可确定TU的上下文(606)。TU的上下文可包括例如以下各项中的一者或一者以上:对应于TU的PU的预测模式,TU的分割等级,以及将由码字表示的TU的分量的数目。
作为一个实例,熵编码单元56可从模式选择单元40接收指示对应于TU的PU的预测模式的信息。所述信息可作为产生所述CU的预测数据的一部分而产生。作为另一实例,熵编码单元56可从CU的其它先前经编码TU(例如,对应RQT中的TU的母代TU)确定所述TU的分割等级。作为又一实例,熵编码单元56可通过确定所述TU的任何CBF的值是否可使用所述CU的其它先前经编码TU(例如,对应RQT中所述TU的母代和兄弟TU)来推断而确定将由所述码字表示的TU的分量的数目。
熵编码单元56可进一步基于所述上下文而选择VLC表(608)。举例来说,VLC表可包含码字到CBF和TSF值的映射。熵编码单元56可进一步从所述VLC表中选择表示以上确定的码字(610)。也就是说,熵编码单元56可选择表示所述块的TU的所述一个或一个以上分量是否经译码以及所述TU是否分裂成子TU的码字。举例来说,如上文所描述,熵编码单元56可在CBF和TSF值是针对所述上下文所述TU的最可能值时选择最短(例如,单个位)码字。另一方面,熵编码单元56可在CBF和TSF值不是最可能值时选择除最短码字外的码字。举例来说,所述码字可具有与针对所述上下文所述TU的CBF和TSF值的可能性(即所述TU的所述一个或一个以上分量是经译码的且所述TU分裂成子TU的可能性)成反比的长度,例如位长度。
在一些实例中,熵编码单元56可进一步基于以上确定而更新VLC表以反映哪些确定有更多或更少可能出现(612)。举例来说,熵编码单元56可基于所确定的CBF和TSF值而更新码字到VLC表内的CBF和TSF值的映射,使得针对所述上下文较频繁出现的值映射到比其它较不频繁出现的值短的VLC码字,如先前描述。
最后,熵编码单元56可将所述码字输出到位流(614)。举例来说,熵编码单元56可包括对应于TU的RQT的节点中的码字,使得所述码字包含表示所述TU的所述一个或一个以上CBF和所述TSF的单个值。
以此方式,图6的方法表示对视频数据进行编码的方法的实例,包括确定视频数据的CU的TU的分量是否包括至少一个非零系数,确定所述TU是否分裂成子TU,从VLC表中选择码字,其中所述VLC表提供所述码字对应于所述确定的指示,且提供用于所述TU的码字。
图7是说明用于对视频数据的CU的TU的经联合编码的一个或一个以上CBF和一TSF进行解码的实例方法的流程图。再次,图7的技术可总体上由任何处理单元或处理器执行,无论是以硬件、软件、固件还是其组合实施,且当以软件或固件实施时,可提供对应硬件以执行所述软件或固件的指令。出于实例的目的,关于视频解码器30(图1和3)描述图7的技术,但应理解,其它装置可经配置以执行类似技术。此外,图7中说明的步骤可以不同次序或并行执行,且可添加额外步骤且省略某些步骤,而不脱离本发明的技术。
首先,视频解码器30可接收用于视频数据的块的TU的码字(700)。视频解码器30还可接收所述块的视频数据,例如经量化变换系数和/或块标头数据,其指示用于所述块的预测模式和其它语法信息。如上文参见图6的实例方法所描述,所述块可对应于CU,例如LCU的子CU,其对应于与所述LCU相关联的CU四叉树中的叶节点。所述CU可包括一个或一个以上TU,例如包括CU的最大TU,其可根据与所述最大TU相关联的RQT分裂成子TU,同样如上文所描述。以此方式,图7的方法可递归地应用到CU的任何TU,包括CU的最大TU和所述最大TU的子TU。同样如上文所描述,所述码字可包含VLC码字。
视频解码器30可进一步确定TU的上下文(702)。举例来说,熵解码单元70可以与上文参见熵编码单元56所描述大体上类似的方式基于例如以下各项中的一者或一者以上确定TU的上下文:对应于TU的PU的预测模式,TU的分割等级,以及由码字表示的TU的分量的数目。
作为一个实例,熵解码单元70可从CU的标头数据内包含的接收到的语法信息确定对应于TU的PU的预测模式。作为另一实例,熵解码单元70可从CU的其它TU(例如,对应RQT中所述TU的母代TU)的先前接收到的码字确定所述TU的分割等级。作为又一实例,熵解码单元70可通过确定TU的任何CBF的值是否可使用所述CU的其它TU(例如,对应RQT中所述TU的母代和兄弟TU)的先前接收到的码字来推断而确定由所述码字表示的TU的分量的数目。
熵解码单元70可进一步基于所述上下文而选择VLC表(704)。举例来说,VLC表可包含码字到CBF和TSF值的映射。熵解码单元70可随后基于所述码字和所述VLC表而确定所述TU的一个或一个以上分量是否经译码,即,包括至少一个非零系数。此外,熵解码单元70可基于所述码字和所述VLC表而确定所述TU是否分裂成子TU。举例来说,熵解码单元70可检索映射到VLC表内的接收到的码字的对应于以上确定的CBF和TSF语法元素的值。以此方式,熵解码单元70可确定所述码字是否指示所述块的TU的所述一个或一个以上分量经译码(706),以及所述码字是否指示TU分裂成子TU(708)。
视频解码器30的VLC表可大体上类似于视频编码器20的VLC表。如先前描述,熵解码单元70可以与如上文参见熵编码单元56所描述大体上类似的方式确定TU的上下文。因此,视频解码器30使用所述上下文选择VLC表可使得所述VLC表包括与由视频编码器20使用以选择码字的VLC表的映射大体上类似的VLC码字到CBF和TSF值的映射。所述映射当中的此相似性可使视频解码器30能使用所述码字和VLC表进行以上确定。
如上文所描述,以上确定的结果可对应于TU的所述一个或一个以上CBF和所述TSF。举例来说,“1”的CBF值可指示TU的对应分量是经译码的,且“0”的CBF值可指示所述分量未经译码。类似地,“1”的TSF值可指示TU分裂成子TU,且“0”的TSF值可指示TU未分裂。同样如上文所描述,所述码字可具有与针对所述上下文所述TU的CBF和TSF值的可能性(即所述TU的所述一个或一个以上分量是经译码的且所述TU分裂成子TU的可能性)成反比的长度。
最后,熵解码单元70可基于以上确定而对所述块或CU进行解码(710)。另外,在一些实例中,熵解码单元70可基于以上确定而更新VLC表以反映哪些确定有更多或更少可能出现(712)。举例来说,熵解码单元70可基于所确定的CBF和TSF值而更新码字到VLC表内的CBF和TSF值的映射,使得针对所述上下文较频繁出现的值映射到比其它较不频繁出现的值短的VLC码字,如先前描述。以此方式,视频解码器30可协调所述VLC表内的映射与由视频编码器20使用以对TU的所述一个或一个以上CBF和TSF进行联合编码的VLC表内的映射。
以此方式,图7的方法表示对视频数据进行解码的方法的实例,包括基于TU的码字而确定视频数据的CU的TU的分量是否包括至少一个非零系数,基于所述码字确定TU是否分裂成子TU,且基于所述确定对所述TU进行解码。
图8是说明用于对视频数据的CU的TU的亮度CBF、色度CBF和TSF进行联合编码的实例方法的流程图。再次,图8的技术可总体上由任何处理单元或处理器执行,无论是以硬件、软件、固件还是其组合实施,且当以软件或固件实施时,可提供对应硬件以执行所述软件或固件的指令。出于实例的目的,关于视频编码器20(图1和2)描述图8的技术,但应理解,其它装置可经配置以执行类似技术。此外,图8中说明的步骤可以不同次序或并行执行,且可添加额外步骤且省略某些步骤,而不脱离本发明的技术。
首先,视频编码器20可接收视频数据块(800)。如上文所描述,所述块可对应于CU,例如LCU的子CU,其对应于与所述LCU相关联的CU四叉树中的叶节点。同样如上文所描述,所述CU可包括一个或一个以上TU,例如包括CU的最大TU,其可根据与所述最大TU相关联的RQT分裂成子TU。以此方式,图8的方法可递归地应用到CU的任何TU,包括CU的最大TU和所述最大TU的子TU。
视频编码器20可进一步确定所述块或CU的给定TU的第一色度分量或第二色度分量是否经译码,即包括至少一个非零系数(802)。举例来说,作为产生用以对CU进行编码的语法信息的一部分,熵编码单元56可确定所述TU的第一色度分量和第二色度分量中的至少一者是否经译码。
熵编码单元56可通过对所述TU的第一色度分量和第二色度分量的CBF的先前确定的值(例如,对应于CBFU和CBFV)进行逐位“或”运算来进行此确定,其中U和V分别指代所述第一色度分量和所述第二色度分量。在其它实例中,熵编码单元56可使用其它技术进行此确定,例如通过直接进行所述确定。在任何情况下,此确定的结果可对应于TU的色度CBF(例如,CBFC),其中CBFC可表示CBFU|CBFV,其中‘|’是指逐位“或”运算符。
在一些实例中,视频编码器20可进一步确定TU的亮度分量是否经译码(804)。以如上文参见TU的第一和第二色度分量所描述类似的方式,熵编码单元56可进行此确定,作为产生用以对CU进行编码的语法信息的一部分。举例来说,此确定的结果可对应于TU的亮度CBF(例如,CBFY),其中Y是指亮度分量。
视频编码器20可进一步确定TU是否分裂成子TU(806)。如上文所描述,作为产生用于CU的预测数据的一部分,此确定可例如由模式选择单元40与变换单元52结合在对CU进行编码的过程中较早进行,其中所述确定的结果可对应于所述TU的TSF。
再次,出于实例的目的而假设视频编码器20确定TU的亮度分量是否经译码,所述TU的第一色度分量和第二色度分量中的至少一者是否经译码,且所述TU是否分裂成子TU,视频编码器20可进一步确定对应CBFY、CBFC和TSF的值。举例来说,“1”的CBFY值可指示TU的亮度分量是经译码的,且“0”的CBFY值可指示所述亮度分量未经译码。类似地,“1”的CBFC值可指示TU的第一色度分量和第二色度分量中的至少一者是经译码的,且“0”的CBFC值可指示第一色度分量和第二色度分量未经译码。此外,“1”的TSF值可指示TU分裂成子TU,且“0”的TSF值可指示TU不分裂。
视频编码器20可进一步对TU的CBFY、CBFC和TSF进行联合编码。如上文所描述,举例来说,模式选择单元40和/或变换单元52可将TSF的值提供到熵编码单元56,且熵编码单元56可作为产生用以对CU进行编码的语法信息的一部分确定CBFY和CBFC的值。
为了对TU的CBFY和CBFC和TSF进行联合编码,熵编码单元56或视频编码器20的另一单元可确定TU的第一上下文(808)。以如上文参见图6-7所描述类似的方式,CU的第一上下文可包括例如以下各项中的一者或一者以上:对应于TU的PU的预测模式,TU的分割等级,以及将由码字表示的TU的分量的数目。
再次,作为一个实例,熵编码单元56可从模式选择单元40接收指示对应于TU的PU的预测模式的信息。所述信息可作为产生所述CU的预测数据的一部分而产生。作为另一实例,熵编码单元56可从CU的其它先前经编码TU(例如,对应RQT中的TU的母代TU)确定所述TU的分割等级。作为又一实例,熵编码单元56可通过确定所述TU的任何CBF的值是否可使用所述CU的其它先前经编码TU(例如,对应RQT中所述TU的母代和兄弟TU)来推断而确定将由所述码字表示的TU的分量的数目。
熵编码单元56可进一步基于第一上下文而选择第一VLC表(810)。举例来说,所述第一VLC表可包括码字到CBFY、CBFC和TSF值的映射。熵编码单元56可进一步从第一VLC表选择表示以上确定的第一码字(812)。举例来说,如上文所论述,熵编码单元56可在所述CBFY、CBFC和TSF值包含针对所述第一上下文所述TU的最可能值时选择最短(例如,单个位)码字。另一方面,熵编码单元56可在所述CBFY、CBFC和TSF值不是最可能值时选择除最短码字外的码字。举例来说,所述选定码字可具有与再次针对所述第一上下文所述TU的CBFY、CBFC和TSF值的可能性(即所述TU的亮度分量是经译码的且所述TU的第一色度分量和第二色度分量中的至少一者是经译码的且所述TU分裂成子TU的可能性)成反比的长度,例如位长度。
同样如上文所描述,在一些实例中,熵编码单元56可进一步基于以上确定而更新第一VLC表以反映哪些确定有更多或更少可能出现(814)。举例来说,熵编码单元56可基于所确定CBFY、CBFC和TSF值而更新码字到第一VLC表内的CBFY、CBFC和TSF值的映射,使得第一上下文内较频繁出现的值映射到比其它较不频繁出现的值短的码字,如先前描述。
最后,熵编码单元56可将第一码字输出到位流(816)。举例来说,熵编码单元56可包括用于CU的RQT中的第一码字,使得所述第一码字包括表示所述TU的CBFY、CBFC和TSF的单个值。
如上文所描述,视频编码器20可确定所述块的TU的第一色度分量或第二色度分量是否经译码(818)。以此方式,视频编码器20可确定所述块的TU的第一色度分量和第二色度分量中的至少一者是否经译码,如先前描述。在第一色度分量和第二色度分量两者未经译码的情况下,熵编码单元56可停止对TU的亮度CBF、色度CBF和TSF进行联合编码(820),且进行到其它译码任务,例如所述CU或后续CU的其它语法元素的编码。但是,在第一色度分量和第二色度分量中的至少一者经译码的情况下,视频编码器20可通过指示所述第一和第二色度分量中的哪一者经译码而继续所述编码过程。
举例来说,熵编码单元56可确定所述第一色度分量是否经译码(822)。熵编码单元56可进一步确定所述第二色度分量是否经译码(824)。如上文所描述,熵编码单元56可作为产生用以对CU进行编码的语法信息的一部分而进行这些确定,其中所述确定可分别对应于TU的CBFU和CBFV。同样如上文所描述,在一些实例中,这些确定可在编码过程中先前进行,以用于确定TU的CBFC。在其它实例中,这些确定可在编码过程中的不同点进行,例如仅当第一色度分量和第二色度分量中的至少一者经译码时。
以如上文所描述类似的方式,出于实例的目的而假设视频编码器20确定TU的第一色度分量和第二色度分量是否经译码,视频编码器20可进一步确定对应CBFU和CBFV的值。再次,举例来说,“1”的CBF值可指示TU的对应色度分量经译码,且“0”的CBF值可指示所述色度分量未经译码。
视频编码器20可进一步提供TU的第一色度分量和第二色度分量是否经译码的指示。在一些实例中,视频编码器20可通过在位流中明确地发信号通知所述TU的CBFY和CBFV而提供此指示,其中个别地发信号通知每一CBF。在其它实例中,视频编码器20可通过以如上文参见对TU的CBFY、CBFC和TSF进行联合编码所描述大体上类似的方式对TU的CBFU和CBFV进行联合编码而提供此指示。
为了对TU的CBFU和CBFV进行联合编码,熵编码单元56或视频编码器20的另一单元可确定所述TU的第二上下文(826)。举例来说,熵编码单元56可基于例如以下各项中的一者或一者以上而确定所述第二上下文:CU的分割等级,TU的分割等级,对应于TU的PU的预测模式,以及对应于TU的相邻TU的第一色度分量和第二色度分量的CBF值。举例来说,所述相邻TU可为CU的其它TU,所述其它TU的亮度CBF、色度CBF和TSF是以如本文所述的相同方式先前经联合编码的。作为一个实例,熵编码单元56可作为产生用以对CU进行编码的语法信息的一部分而确定CU的分割等级,其例如对应于与CU的LCU相关联的CU四叉树,如先前描述。
熵编码单元56可进一步基于所述第二上下文而选择第二VLC表(828)。举例来说,第二VLC表可包括码字到CBFU和CBFV值的映射。在一些实例中,熵译码单元56可使用同一上下文来选择第一VLC表和第二VLC表两者,在此情况下上文所论述的第一和第二上下文可包含相同上下文。
熵编码单元56可进一步从第二VLC表中选择表示以上针对第一色度分量和第二色度分量的确定的第二码字(830)。举例来说,如上文所论述,熵编码单元56可在CBFU和CBFV值包含针对第二上下文所述TU的最可能值时选择最短(例如,单个位)码字。另一方面,熵编码单元56可在CBFU和CBFV值不是最可能值时选择除最短码字外的码字。再次,举例来说,第二码字可具有与再次针对所述第二上下文所述TU的CBFU和CBFV值的可能性(即所述TU的第一色度分量和第二色度分量是经译码的可能性)成反比的长度,例如位长度。
如上文所描述,在一些实例中,熵编码单元56可进一步基于以上确定而更新第二VLC表以反映哪些确定有更多或更少可能出现(832)。举例来说,熵编码单元56可基于所确定的CBFU和CBFV值而更新码字到第二VLC表内的CBFU和CBFV值的映射,使得所述第二上下文内较频繁出现的值映射到比其它较不频繁出现的值短的码字,如先前描述。
最后,熵编码单元56可将所述第二码字输出到位流(834)。举例来说,熵编码单元56可在用于CU的RQT中包括所述第二码字连同所述第一码字,使得所述第二码字包含表示TU的CBFU和CBFV的单个值。熵编码单元56可随后停止对TU的亮度CBF、色度CBF和TSF进行联合编码(820),且进行到其它译码任务,例如CU或后续CU的其它语法元素的编码。
以此方式,图8的方法表示对视频数据进行编码的方法的实例,包括确定视频数据的CU的TU的分量是否包括至少一个非零系数,确定所述TU是否分裂成子TU,从VLC中表选择码字,其中所述VLC表提供所述码字对应于所述确定的指示,且提供用于所述TU的码字。
图9是说明用于对视频数据的CU的TU的经联合编码的亮度CBF、色度CBF和TSF进行解码的实例方法的流程图。再次,图9的技术可总体上由任何处理单元或处理器执行,无论是以硬件、软件、固件还是其组合实施,且当以软件或固件实施时,可提供对应硬件以执行所述软件或固件的指令。出于实例的目的,关于视频解码器30(图1和3)描述图9的技术,但应理解,其它装置可经配置以执行类似技术。此外,图9中说明的步骤可以不同次序或并行执行,且可添加额外步骤且省略某些步骤,而不脱离本发明的技术。
首先,视频解码器30可接收视频数据的块的TU的第一码字(900)。如上文所描述,视频解码器30还可接收所述块的视频数据,例如经量化变换系数和/或块标头数据,其指示用于所述块的预测模式和其它语法信息。同样如上文所描述,所述块可对应于CU,例如LCU的子CU,其对应于与所述LCU相关联的CU四叉树中的叶节点。所述CU可包括一个或一个以上TU,例如包括CU的最大TU,其可根据与所述最大TU相关联的RQT分裂成子TU,同样如上文所描述。以此方式,图9的方法可递归地应用到CU的任何TU,包括CU的最大TU和所述最大TU的子TU。同样如上文所描述,所述第一码字可包含VLC码字。
视频解码器30可进一步确定TU的第一上下文(902)。举例来说,熵解码单元70可以与上文参见图8的熵编码单元56所描述大体上类似的方式基于例如以下各项中的一者或一者以上确定TU的第一上下文:对应于TU的PU的预测模式,TU的分割等级,以及由码字表示的TU的分量的数目。
作为一个实例,熵解码单元70可从CU的标头数据内包含的所接收语法信息确定对应于TU的PU的预测模式。作为另一实例,熵解码单元70可从CU的其它TU(例如,对应RQT中所述TU的母代TU)的先前接收的码字确定所述TU的分割等级。作为又一实例,熵解码单元70可通过使用所述CU的其它TU(例如,对应RQT中所述TU的母代和兄弟TU)的先前接收码字做出推断而确定由所述码字表示的TU的分量的数目。
熵解码单元70可进一步基于所述第一上下文而选择第一VLC表(904)。举例来说,所述第一VLC表可包括码字到CBFY、CBFC和TSF值的映射。熵解码单元70可进一步基于所述第一码字和第一VLC表而确定TU的第一色度分量和第二色度分量中的至少一者是否经译码,即,包括至少一个非零系数。在一些实例中,熵解码单元70可进一步基于所述第一码字和第一VLC表而确定TU的亮度分量是否经译码。熵解码单元70可进一步基于所述第一码字和第一VLC表而确定TU是否分裂成子TU。举例来说,熵解码单元70可检索映射到第一VLC表内的所接收第一码字的对应于以上确定的CBFY、CBFC和TSF语法元素的值。以此方式,熵解码单元70可确定第一码字是否指示所述块的TU的第一色度分量或第二色度分量是经译码的(906),第一码字是否指示TU的亮度分量是经译码的(908),且第一码字是否指示TU分裂成子TU(910)。
再次,视频解码器30的VLC表可大体上类似于视频编码器20的VLC表。如先前描述,熵解码单元70可以与如上文参见图8的熵编码单元56所描述大体上类似的方式确定TU的第一上下文。因此,视频解码器30使用第一上下文选择第一VLC表可使得所述第一VLC表包括与由视频编码器20使用以选择第一码字的映射大体上类似的VLC码字到CBFY、CBFC和TSF值的映射。所述映射当中的此相似性可使视频解码器30能使用所述第一码字和第一VLC表做出以上确定。
如上文所描述,以上确定的结果可对应于TU的CBFY、CBFC和TSF。举例来说,“1”的CBFY值可指示TU的亮度分量是经译码的,且“0”的CBFY值可指示所述亮度分量未经译码。类似地,“1”的CBFC值可指示TU的第一色度分量和第二色度分量中的至少一者是经译码的,且“0”的CBFC值可指示第一色度分量和第二色度分量未经译码。类似地,“1”的TSF值可指示TU分裂成子TU,且“0”的TSF值可指示所述TU不分裂。同样如上文所描述,第一码字可具有针对所述第一上下文所述TU的CBFY、CBFC和TSF值的可能性(即TU的亮度分量是经译码的、TU的第一色度分量和第二色度分量中的至少一者是经译码的且TU分裂成子TU的可能性)成反比的长度。
同样如上文所描述,在一些实例中,熵解码单元70可基于以上确定而更新第一VLC表以反映哪些确定有更多或更少可能出现(912)。举例来说,熵解码单元70可基于所确定CBFY、CBFC和TSF值而更新码字到第一VLC表内的CBFY、CBFC和TSF值的映射,使得第一上下文内较频繁出现的值映射到比其它较不频繁出现的值短的码字,如先前描述。
如上文所描述,视频解码器30可确定所述块的TU的第一色度分量或第二色度分量是否经译码(914)。以此方式,视频解码器30可确定所述块的TU的第一色度分量和第二色度分量中的至少一者是否经译码,如先前描述。在第一色度分量和第二色度分量两者未经译码的情况下,熵解码单元70可停止对TU的经联合编码的亮度CBF、色度CBF和TSF进行解码(916),且进行到其它译码任务,例如CU或后续CU的其它语法元素的解码。但是,在第一色度分量和第二色度分量中的至少一者是经译码的情况下,视频解码器30可通过确定所述第一和第二色度分量中的哪一者是经译码的而继续所述解码过程。
举例来说,视频解码器30可接收TU的第一色度分量和第二色度分量是否经译码的指示。在一些实例中,视频解码器30可以在位流中明确地发信号通知的TU的CBFU和CBFV的形式接收此指示,其中每一CBF是个别地发信号通知的。在其它实例中,视频解码器30可以与如上文参见对TU的经联合编码的CBFY、CBFC和TSF进行解码所描述大体上类似的方式以TU的经联合编码的CBFU和CBFV的形式接收此指示。
举例来说,熵解码单元70可接收TU的第二码字(918)。所述第二码字还可包含VLC码字,且可对应于TU的经联合编码的CBFU和CBFV。为了对第二码字进行解码,熵解码单元70或视频解码器30的另一单元可确定TU的第二上下文(920)。再次,举例来说,熵解码单元70可基于例如以下各项中的一者或一者以上以与如上文参见图8的熵编码单元56所描述大体上类似的方式而确定所述TU的第二上下文:CU的分割等级,TU的分割等级,对应于TU的PU的预测模式,以及对应于TU的相邻TU的第一色度分量和第二色度分量的CBF值。举例来说,所述相邻TU可为CU的其它TU,所述其它TU的经联合编码的亮度CBF、色度CBF和TSF是以如本文所述的相同方式先前解码的。作为一个实例,熵解码单元70可从CU的标头数据内包含的所接收语法信息确定CU的分割等级,其例如对应于与CU的LCU相关联的CU四叉树,如先前描述。
熵解码单元70可进一步基于第二上下文而选择第二VLC表(922)。举例来说,第二VLC表可包括码字到CBFU和CBFV值的映射。在一些实例中,熵解码单元70可使用同一上下文来选择第一VLC表和第二VLC表两者,在此情况下上文所论述的第一和第二上下文可包含相同上下文。
熵解码单元70可随后基于所述第二码字和第二VLC表而确定TU的第一色度分量是否经译码。此外,熵解码单元70可基于所述第二码字和第二VLC表而确定TU的第二色度分量是否经译码。举例来说,熵解码单元70可检索映射到第二VLC表内的所接收第二码字的对应于以上确定的CBFU和CBFV语法元素的值。以此方式,熵解码单元70可确定所述第二码字是否指示TU的第一色度分量是经译码的(924),以及所述第二码字是否指示TU的第二色度分量是经译码的(926)。
再次,视频解码器30的VLC表可大体上类似于视频编码器20的VLC表。如先前描述,熵解码单元70可以与如上文参见图8的熵编码单元56所描述大体上类似的方式确定TU的第二上下文。因此,视频解码器30使用第二上下文选择第二VLC表可使得所述第二VLC表包括当由视频编码器20使用以选择第二码字的映射大体上类似的VLC码字到CBFU和CBFV值的映射。所述映射当中的此相似性可使视频解码器30能使用所述第二码字和第二VLC表做出以上确定。
如上文所描述,以上确定的结果可对应于TU的CBFU和CBFV。举例来说,“1”的CBF值可指示TU的对应色度分量是经译码的,且“0”的CBF值可指示色度分量未经译码。同样如上文所描述,第二码字可具有与再次针对所述第二上下文所述TU的CBFU和CBFV值的可能性(即所述TU的第一色度分量和第二色度分量是经译码的可能性)成反比的长度。
同样如上文所描述,在一些实例中,熵解码单元70可进一步基于以上确定而更新第二VLC表以反映哪些确定有更多或更少可能出现(928)。举例来说,熵解码单元70可基于所确定的CBFU和CBFV值而更新所述码字到第二VLC表内的CBFU和CBFV值的映射,使得第二上下文内较频繁出现的值映射到比其它较不频繁出现的值短的码字,如先前描述。
最后,视频解码器30可停止对TU的经联合编码的亮度CBF、色度CBF和TSF进行解码(916),且进行到其它译码任务,例如CU或后续CU的其它语法元素的解码。
以此方式,图9的方法表示对视频数据进行解码的方法的实例,包括基于TU的码字而确定视频数据的CU的TU的分量是否包括至少一个非零系数,基于所述码字确定TU是否分裂成子TU,且基于所述确定对所述TU进行解码。
在一个或一个以上实例中,所描述功能可以硬件、软件、固件或其任何组合来实施。如果以软件实施,则所述功能可以作为一个或一个以上指令或代码在计算机可读媒体上存储或传输,并且由基于硬件的处理单元执行。计算机可读媒体可包括计算机可读存储媒体,其对应于有形媒体,例如数据存储媒体,或包括任何促进将计算机程序从一处传送到另一处的媒体(例如,根据一种通信协议)的通信媒体。以此方式,计算机可读媒体总体上可以对应于(1)有形计算机可读存储媒体,其是非暂时性的,或(2)通信媒体,例如信号或载波。数据存储媒体可以是可由一个或一个以上计算机或一个或一个以上处理器存取以检索用于实施本发明中描述的技术的指令、代码和/或数据结构的任何可用的媒体。计算机程序产品可包括计算机可读媒体。
借助于实例而非限制,此类计算机可读存储媒体可包含RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或任何其它可用来存储指令或数据结构的形式的期望程序代码并且可由计算机存取的媒体。同样,任何连接被恰当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输指令,那么同轴电缆、光纤缆线、双绞线、DSL或例如红外线、无线电和微波等无线技术包括在媒体的定义中。但是,应理解,所述计算机可读存储媒体和数据存储媒体并不包括连接、载波、信号或其它暂时性媒体,而是实际上针对于非暂时性有形存储媒体。如本文所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘用激光以光学方式再现数据。以上各项的组合也应包含在计算机可读媒体的范围内。
指令可以由一个或一个以上处理器执行,所述一个或一个以上处理器例如是一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)、或其它等效的集成或离散逻辑电路。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外,在一些方面中,本文所述的功能性可以在经配置用于编码和解码的专用硬件和/或软件模块内提供,或者并入在组合编解码器中。并且,可将所述技术完全实施于一个或一个以上电路或逻辑元件中。
本发明的技术可以在广泛多种装置或设备中实施,包括无线手持机、集成电路(IC)或一组IC(例如,芯片组)。本发明中描述各种组件、模块或单元是为了强调经配置以执行所揭示的技术的装置的功能方面,但未必需要通过不同硬件单元实现。实际上,如上文所描述,各种单元可以配合合适的软件和/或固件组合在一个编解码器硬件单元中,或者通过互操作硬件单元的集合来提供,所述硬件单元包括如上文所描述的一个或一个以上处理器。
已描述各种实例。这些和其它实例在所附权利要求书的范围内。

Claims (26)

1.一种对视频数据进行解码的方法,所述方法包含:
解码视频数据的译码单元的变换单元的第一语法元素,其中所述第一语法元素联合地表示所述变换单元的第一色度分量或第二不同色度分量中的至少一者是否包括至少一个非零系数以及所述变换单元是否被分裂成子变换单元,其中所述第一语法元素与用于所述译码单元的其他语法元素分离,且其中所述其他语法元素包括第二语法元素,所述第二语法元素指示用于对应于所述第一色度分量和所述第二不同色度分量的所述译码单元的至少一部分的预测模式;
基于所述第一语法元素确定所述变换单元的所述第一色度分量或所述第二不同色度分量中的至少一者是否包括所述至少一个非零系数;
基于所述第一语法元素确定所述变换单元是否分裂成子变换单元;以及
基于所述确定对所述变换单元进行解码。
2.根据权利要求1所述的方法,其中基于所述第一语法元素确定所述第一色度分量是否包括至少一个非零系数包含:在基于所述第一语法元素确定所述第一色度分量或所述第二不同色度分量中的至少一者包括至少一个非零系数之后,基于所述变换单元的第三不同语法元素确定所述第一色度分量是否包括至少一个非零系数,所述方法进一步包含:
基于所述第三不同语法元素确定所述第二不同色度分量是否包括至少一个非零系数。
3.根据权利要求1所述的方法,其中所述第一语法元素包含码字,所述方法进一步包含:
基于所述变换单元的上下文选择可变长度码表,其中所述上下文包括以下各项中的至少一者:对应于所述变换单元的预测单元的预测模式,所述变换单元的分割等级,和由所述码字表示的所述变换单元的分量的数目,
其中基于所述码字确定所述第一色度分量或所述第二不同色度分量中的至少一者是否包括至少一个非零系数包含确定所述可变长度码表是否指示所述码字表示所述第一色度分量或所述第二不同色度分量中的至少一者包括至少一个非零系数,且
其中基于所述码字确定所述变换单元是否分裂成所述子变换单元包含确定所述可变长度码表是否指示所述码字表示所述变换单元分裂成所述子变换单元。
4.根据权利要求3所述的方法,其进一步包含基于所述确定更新所述可变长度码表。
5.根据权利要求1所述的方法,其中基于所述第一语法元素确定所述变换单元是否分裂成所述子变换单元包含确定所述第一语法元素表示所述变换单元分裂成所述子变换单元,并且其中所述子变换单元对应于所述译码单元的最小大小的变换单元,所述方法进一步包含不参考所述子变换单元的相应语法元素而基于对应于所述译码单元的所述最小大小的变换单元的所述子变换单元来确定所述子变换单元未分裂成另外的子变换单元。
6.根据权利要求1所述的方法,其中所述变换单元包含所述译码单元的母代变换单元的多个子变换单元中的一者,其中所述母代变换单元具有大于所述译码单元的最大准许大小的大小,所述方法进一步包含不参考所述母代变换单元的相应语法元素而基于所述母代变换单元具有大于所述译码单元的所述最大准许大小的大小来确定所述母代变换单元分裂成所述多个子变换单元。
7.根据权利要求1所述的方法,其中基于所述第一语法元素确定所述变换单元是否分裂成所述子变换单元包含确定所述第一语法元素表示所述变换单元分裂成所述子变换单元,所述方法进一步包含基于所述子变换单元的相应不同语法元素确定所述子变换单元是否分裂成另外的子变换单元。
8.一种用于对视频数据进行解码的设备,所述设备包含:
存储器,其经配置以存储视频数据;以及
视频解码器,所述视频解码器经配置以:
解码视频数据的译码单元的变换单元的第一语法元素,其中所述第一语法元素联合地表示所述变换单元的第一色度分量或第二不同色度分量中的至少一者是否包括至少一个非零系数以及所述变换单元是否被分裂成子变换单元,其中所述第一语法元素与用于所述译码单元的其他语法元素分离,且其中所述其他语法元素包括第二语法元素,所述第二语法元素指示用于对应于所述第一色度分量和所述第二不同色度分量的所述译码单元的至少一部分的预测模式;
基于所述第一语法元素确定所述变换单元的所述第一色度分量或所述第二不同色度分量中的至少一者是否包括所述至少一个非零系数,
基于所述第一语法元素确定所述变换单元是否分裂成子变换单元,和基于所述确定对所述变换单元进行解码。
9.根据权利要求8所述的设备,其中为了基于所述第一语法元素确定所述第一色度分量是否包括至少一个非零系数,所述视频解码器经配置以在基于所述第一语法元素确定所述第一色度分量或所述第二不同色度分量中的至少一者包括至少一个非零系数之后,基于所述变换单元的第三不同语法元素确定所述第一色度分量是否包括至少一个非零系数,其中所述视频解码器进一步经配置以:
基于所述第三不同语法元素确定所述第二不同色度分量是否包括至少一个非零系数。
10.根据权利要求8所述的设备,其中所述第一语法元素包含码字,
其中所述视频解码器进一步经配置以基于所述变换单元的上下文选择可变长度码表,其中所述上下文包括以下各项中的至少一者:对应于所述变换单元的预测单元的预测模式,所述变换单元的分割等级,和由所述码字表示的所述变换单元的分量的数目,
其中为了基于所述码字确定所述第一色度分量或所述第二不同色度分量中的至少一者是否包括至少一个非零系数,所述视频解码器经配置以确定所述可变长度码表是否指示所述码字表示所述第一色度分量或所述第二不同色度分量中的至少一者包括至少一个非零系数,并且
其中为了基于所述码字确定所述变换单元是否分裂成所述子变换单元,所述视频解码器经配置以确定所述可变长度码表是否指示所述码字表示所述变换单元分裂成所述子变换单元。
11.根据权利要求8所述的设备,其中所述设备包含以下各项中的至少一者:
集成电路;
微处理器;以及
无线通信装置,其包括所述视频解码器。
12.一种用于对视频数据进行解码的设备,所述设备包含:
用于解码视频数据的译码单元的变换单元的第一语法元素的装置,其中所述第一语法元素联合地表示所述变换单元的第一色度分量或第二不同色度分量中的至少一者是否包括至少一个非零系数以及所述变换单元是否被分裂成子变换单元,其中所述第一语法元素与用于所述译码单元的其他语法元素分离,且其中所述其他语法元素包括第二语法元素,所述第二语法元素指示用于对应于所述第一色度分量和所述第二不同色度分量的所述译码单元的至少一部分的预测模式;
用于基于所述第一语法元素确定所述变换单元的所述第一色度分量或所述第二不同色度分量中的至少一者是否包括所述至少一个非零系数的装置;
用于基于所述第一语法元素确定所述变换单元是否分裂成子变换单元的装置;以及
用于基于所述确定对所述变换单元进行解码的装置。
13.根据权利要求12所述的设备,其中所述用于基于所述第一语法元素确定所述第一色度分量是否包括至少一个非零系数的装置包含用于在基于所述第一语法元素确定所述第一色度分量或所述第二不同色度分量中的至少一者包括至少一个非零系数之后基于所述变换单元的第三不同语法元素确定所述第一色度分量是否包括至少一个非零系数的装置,所述设备进一步包含:
用于基于所述第三不同语法元素确定所述第二不同色度分量是否包括至少一个非零系数的装置。
14.根据权利要求12所述的设备,其中所述第一语法元素包含码字,所述设备进一步包含:
用于基于所述变换单元的上下文选择可变长度码表的装置,其中所述上下文包括以下各项中的至少一者:对应于所述变换单元的预测单元的预测模式,所述变换单元的分割等级,和由所述码字表示的所述变换单元的分量的数目,
其中用于基于所述码字确定所述第一色度分量或所述第二不同色度分量中的至少一者是否包括至少一个非零系数的装置包含用于确定所述可变长度码表是否指示所述码字表示所述第一色度分量或所述第二不同色度分量中的至少一者包括至少一个非零系数的装置,且
其中所述用于基于所述码字确定所述变换单元是否分裂成所述子变换单元的装置包含用于确定所述可变长度码表是否指示所述码字表示所述变换单元分裂成所述子变换单元的装置。
15.一种对视频数据进行编码的方法,所述方法包含:
确定视频数据的译码单元的变换单元的第一色度分量或第二不同色度分量中的至少一者是否包括至少一个非零系数;
确定所述变换单元是否分裂成子变换单元;以及
基于上述确定编码第一语法元素,使得所述第一语法元素联合地表示所述变换单元的所述第一色度分量或所述第二不同色度分量中的至少一者是否包括所述至少一个非零系数以及所述变换单元是否被分裂成所述子变换单元,从而所述第一语法元素与用于所述译码单元的其他语法元素分离,其中所述其他语法元素包括指示用于所述译码单元的至少一部分的预测模式的第二语法元素。
16.根据权利要求15所述的方法,所述方法进一步包含:当所述第一色度分量或所述第二不同色度分量中的至少一者包括至少一个非零系数时,
编码第三不同语法元素,使得所述第三不同语法元素表示所述第一色度分量是否包括至少一个非零系数和所述第二不同色度分量是否包括至少一个非零系数。
17.根据权利要求15所述的方法,其中所述变换单元分裂成所述子变换单元,并且其中所述子变换单元对应于所述译码单元的最小大小的变换单元,所述方法进一步包含编码表示所述子变换单元的一个或一个以上分量是否包括至少一个非零系数的一个或多个语法元素,使得所述语法元素并不指示相应子变换单元是否分裂成另外的子变换单元。
18.根据权利要求15所述的方法,其中所述变换单元包含所述译码单元的母代变换单元的多个子变换单元中的一者,其中所述母代变换单元具有大于所述译码单元的最大准许大小的大小,所述方法进一步包含编码表示所述母代变换单元的一个或一个以上分量是否包括至少一个非零系数的一个或多个语法元素,使得所述语法元素并不指示所述母代变换单元是否分裂成所述多个子变换单元。
19.根据权利要求15所述的方法,其中所述第一语法元素包含选自可变长度码表的码字,所述方法进一步包含基于所述变换单元的上下文选择所述可变长度码表,其中所述上下文包括以下各项中的至少一者:对应于所述变换单元的预测单元的预测模式,所述变换单元的分割等级,和由所述第一语法元素表示的所述变换单元的分量的数目。
20.根据权利要求15所述的方法,其中所述变换单元分裂成所述子变换单元,所述方法进一步包含:
编码表示所述子变换单元是否分裂成另外的子变换单元的第三不同语法元素。
21.根据权利要求15所述的方法,其中所述第一语法元素包含选自可变长度码表的码字,所述方法进一步包含基于所述确定更新所述可变长度码表。
22.一种用于对视频数据进行编码的设备,所述设备包含:
存储器,其经配置以存储视频数据;以及
视频编码器,其经配置以:
确定视频数据的译码单元的变换单元的第一色度分量或第二不同色度分量中的至少一者是否包括至少一个非零系数;
确定所述变换单元是否分裂成子变换单元;以及
基于上述确定编码第一语法元素,使得所述第一语法元素联合地表示所述变换单元的所述第一色度分量或所述第二不同色度分量中的至少一者是否包括所述至少一个非零系数以及所述变换单元是否被分裂成所述子变换单元,从而所述第一语法元素与用于所述译码单元的其他语法元素分离,其中所述其他语法元素包括指示用于所述译码单元的至少一部分的预测模式的第二语法元素。
23.根据权利要求22所述的设备,其中所述视频编码器进一步经配置以进行以下操作:当所述第一色度分量或所述第二不同色度分量中的至少一者包括至少一个非零系数时,编码第三不同语法元素,使得所述第三不同语法元素表示所述第一色度分量是否包括至少一个非零系数和所述第二不同色度分量是否包括至少一个非零系数。
24.根据权利要求22所述的设备,其中所述设备包含以下各项中的至少一者:
集成电路;
微处理器;以及
无线通信装置,其包括所述视频编码器。
25.一种用于对视频数据进行编码的设备,所述设备包含:
用于确定视频数据的译码单元的变换单元的第一色度分量或第二不同色度分量中的至少一者是否包括至少一个非零系数的装置;
用于确定所述变换单元是否分裂成子变换单元的装置;以及
用于基于上述确定编码第一语法元素,使得所述第一语法元素联合地表示所述变换单元的所述第一色度分量或所述第二不同色度分量中的至少一者是否包括所述至少一个非零系数以及所述变换单元是否被分裂成所述子变换单元,从而所述第一语法元素与用于所述译码单元的其他语法元素分离的装置,其中所述其他语法元素包括指示用于所述译码单元的至少一部分的预测模式的第二语法元素。
26.根据权利要求25所述的设备,进一步包含:
用于当所述第一色度分量或所述第二不同色度分量中的至少一者包括至少一个非零系数时编码第三不同码字,使得所述第三不同语法元素表示所述第一色度分量是否包括至少一个非零系数和所述第二不同色度分量是否包括至少一个非零系数的装置。
CN201180052536.2A 2010-11-01 2011-10-31 用于视频译码的语法元素的联合译码方法及设备 Active CN103190147B (zh)

Applications Claiming Priority (17)

Application Number Priority Date Filing Date Title
US40905210P 2010-11-01 2010-11-01
US61/409,052 2010-11-01
US40947110P 2010-11-02 2010-11-02
US61/409,471 2010-11-02
US201161432548P 2011-01-13 2011-01-13
US61/432,548 2011-01-13
US201161435344P 2011-01-23 2011-01-23
US61/435,344 2011-01-23
US201161449556P 2011-03-04 2011-03-04
US61/449,556 2011-03-04
US201161450554P 2011-03-08 2011-03-08
US61/450,554 2011-03-08
US201161451448P 2011-03-10 2011-03-10
US61/451,448 2011-03-10
US13/283,335 2011-10-27
US13/283,335 US9172963B2 (en) 2010-11-01 2011-10-27 Joint coding of syntax elements for video coding
PCT/US2011/058608 WO2012061298A1 (en) 2010-11-01 2011-10-31 Joint coding of syntax elements for video coding

Publications (2)

Publication Number Publication Date
CN103190147A CN103190147A (zh) 2013-07-03
CN103190147B true CN103190147B (zh) 2016-04-27

Family

ID=45996760

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180052536.2A Active CN103190147B (zh) 2010-11-01 2011-10-31 用于视频译码的语法元素的联合译码方法及设备

Country Status (5)

Country Link
US (1) US9172963B2 (zh)
JP (1) JP5788520B2 (zh)
KR (1) KR101632776B1 (zh)
CN (1) CN103190147B (zh)
WO (1) WO2012061298A1 (zh)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2950532B1 (en) 2010-08-17 2018-11-14 Samsung Electronics Co., Ltd Video decoding apparatus using using transformation unit of variable tree structure
MX2013003691A (es) * 2010-09-30 2013-04-24 Samsung Electronics Co Ltd Metodo de codficacion de video para codificar simbolos de estructura jerarquica y dispositivo para esto, y metodo de decodificacion de video para decodificar simbolos de estructura jerarquica y dispositivo para esto.
US9172963B2 (en) * 2010-11-01 2015-10-27 Qualcomm Incorporated Joint coding of syntax elements for video coding
CN104811706B (zh) * 2011-01-06 2017-10-27 三星电子株式会社 视频的编码方法和装置及视频的解码方法和装置
US8948271B2 (en) * 2011-01-13 2015-02-03 Texas Instruments Incorporated Method and apparatus for a low complexity transform unit partitioning structure for HEVC
CN103404147B (zh) * 2011-03-10 2016-08-31 联发科技(新加坡)私人有限公司 去区块滤波器方法及装置
US9247266B2 (en) * 2011-04-18 2016-01-26 Texas Instruments Incorporated Temporal motion data candidate derivation in video coding
KR101464978B1 (ko) * 2011-07-01 2014-11-26 삼성전자주식회사 계층적 구조의 데이터 단위를 이용한 엔트로피 부호화 방법 및 장치, 복호화 방법 및 장치
EP2740263B1 (en) * 2011-09-16 2019-02-27 HFI Innovation Inc. Method and apparatus for prediction mode and partition mode syntax coding for coding units in hevc
US9729890B2 (en) * 2012-01-12 2017-08-08 Hfi Innovation Inc. Method and apparatus for unification of significance map context selection
US9185405B2 (en) * 2012-03-23 2015-11-10 Qualcomm Incorporated Coded block flag inference in video coding
US9467701B2 (en) 2012-04-05 2016-10-11 Qualcomm Incorporated Coded block flag coding
US9749645B2 (en) * 2012-06-22 2017-08-29 Microsoft Technology Licensing, Llc Coded-block-flag coding and derivation
ES2764989T3 (es) * 2012-07-02 2020-06-05 Samsung Electronics Co Ltd Codificación por entropía de un vídeo y decodificación por entropía de un vídeo
AU2012232992A1 (en) * 2012-09-28 2014-04-17 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the transform units of a coding unit
CN103716607B (zh) * 2012-09-28 2017-02-08 中兴通讯股份有限公司 一种应用于HEVC‑based 3DVC的编码方法和装置
KR101516947B1 (ko) * 2013-10-31 2015-05-04 한밭대학교 산학협력단 Hevc를 위한 고속 변환 크기 결정 방법 및 장치
US9215469B2 (en) * 2014-01-10 2015-12-15 Sony Corporation Intra-plane and inter-plane predictive method for RGB image coding
US10250884B2 (en) 2014-06-20 2019-04-02 Qualcomm Incorporated Systems and methods for signaling information for layer sets in a parameter set
KR102416804B1 (ko) 2016-10-14 2022-07-05 세종대학교산학협력단 영상 부호화 방법/장치, 영상 복호화 방법/장치 및 비트스트림을 저장한 기록 매체
CN116886904A (zh) * 2016-10-14 2023-10-13 世宗大学校产学协力团 影像编码方法、影像解码方法以及传送比特流的方法
US10523966B2 (en) * 2017-03-31 2019-12-31 Mediatek Inc. Coding transform blocks
EP3657793A4 (en) * 2017-12-06 2021-03-17 Fujitsu Limited MODE INFORMATION ENCODING AND ENCODING PROCESS, CORRESPONDING DEVICE AND ELECTRONIC APPARATUS
CN110035287B (zh) * 2018-01-12 2023-05-09 富士通株式会社 对统一转换单元模式进行分组标识的方法、装置和电子设备
US10645396B2 (en) * 2018-06-04 2020-05-05 Tencent America LLC Method and apparatus for implicit transform splitting
RU183129U1 (ru) * 2018-06-18 2018-09-12 Российская Федерация, от имени которой выступает Государственная корпорация по атомной энергии "Росатом" Управляемый вакуумный разрядник
US11109041B2 (en) * 2019-05-16 2021-08-31 Tencent America LLC Method and apparatus for video coding
US11856232B2 (en) * 2019-05-28 2023-12-26 Dolby Laboratories Licensing Corporation Quantization parameter signaling
CN113966611B (zh) * 2019-06-09 2023-12-15 北京字节跳动网络技术有限公司 视频编解码中的重要系数信令
WO2020252270A1 (en) * 2019-06-13 2020-12-17 Beijing Dajia Internet Information Technology Co., Ltd. Methods and system of subblock transform for video coding
RU196890U1 (ru) * 2019-12-09 2020-03-19 Российская Федерация, от имени которой выступает Государственная корпорация по атомной энергии "Росатом" Управляемый разрядник
RU196889U1 (ru) * 2019-12-09 2020-03-19 Российская Федерация, от имени которой выступает Государственная корпорация по атомной энергии "Росатом" Управляемый разрядник
US20230140628A1 (en) * 2021-11-04 2023-05-04 Meta Platforms, Inc. Novel buffer format for a two-stage video encoding process

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080260028A1 (en) * 2004-12-22 2008-10-23 Thales Video H.264 Encryption Preserving Synchronization and Compatibility of Syntax
CN101822057A (zh) * 2007-10-12 2010-09-01 高通股份有限公司 视频块标头信息的自适应译码

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4816914A (en) 1987-01-07 1989-03-28 Pictel Corporation Method and apparatus for efficiently encoding and decoding image sequences
EP0729688A1 (en) 1993-11-15 1996-09-04 National Semiconductor Corporation Quadtree-structured walsh transform coding
TW376655B (en) 1997-07-23 1999-12-11 Matsushita Electric Ind Co Ltd Method for multi state variable length coding of multi zoned quantized DCT coefficients and apparatus therefor
US6563953B2 (en) 1998-11-30 2003-05-13 Microsoft Corporation Predictive image compression using a single variable length code for both the luminance and chrominance blocks for each macroblock
MXPA04008889A (es) * 2002-03-15 2004-11-26 Nokia Corp Metodo para la codificacion de movimiento en una secuencia de video.
US7099387B2 (en) * 2002-03-22 2006-08-29 Realnetorks, Inc. Context-adaptive VLC video transform coefficients encoding/decoding methods and apparatuses
JP3944225B2 (ja) 2002-04-26 2007-07-11 株式会社エヌ・ティ・ティ・ドコモ 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム及び画像復号プログラム
EP1387224A3 (en) 2002-08-02 2011-11-16 Eastman Kodak Company Fuser member, apparatus and method for electrostatographic reproduction
US6795584B2 (en) * 2002-10-03 2004-09-21 Nokia Corporation Context-based adaptive variable length coding for adaptive block transforms
US7379608B2 (en) 2003-12-04 2008-05-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Arithmetic coding for transforming video and picture data units
US7664176B2 (en) * 2004-07-09 2010-02-16 Nokia Corporation Method and system for entropy decoding for scalable video bit stream
US20060078049A1 (en) 2004-10-13 2006-04-13 Nokia Corporation Method and system for entropy coding/decoding of a video bit stream for fine granularity scalability
NO322043B1 (no) 2004-12-30 2006-08-07 Tandberg Telecom As Fremgangsmate for forenklet entropikoding
KR100746007B1 (ko) 2005-04-19 2007-08-06 삼성전자주식회사 엔트로피 코딩의 컨텍스트 모델을 적응적으로 선택하는방법 및 비디오 디코더
CN101283377B (zh) 2005-09-23 2013-05-29 喷流数据有限公司 向调色板图像提供熵约束颜色分裂的方法和系统
GB0600141D0 (en) * 2006-01-05 2006-02-15 British Broadcasting Corp Scalable coding of video signals
US7545293B2 (en) * 2006-11-14 2009-06-09 Qualcomm Incorporated Memory efficient coding of variable length codes
US7573407B2 (en) * 2006-11-14 2009-08-11 Qualcomm Incorporated Memory efficient adaptive block coding
US8102913B2 (en) * 2006-12-22 2012-01-24 Sony Corporation DCT/Q/IQ/IDCT bypass algorithm in MPEG to AVC/H.264 transcoding
US8041131B2 (en) * 2007-10-02 2011-10-18 Cisco Technology, Inc. Variable length coding of coefficient clusters for image and video compression
US8483282B2 (en) 2007-10-12 2013-07-09 Qualcomm, Incorporated Entropy coding of interleaved sub-blocks of a video block
US8107754B2 (en) * 2007-12-07 2012-01-31 Mediatek Inc. Systems and methods for randomly accessing compressed images
US8180166B2 (en) * 2008-09-23 2012-05-15 Mediatek Inc. Transcoding method
US8503527B2 (en) 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
US8634456B2 (en) 2008-10-03 2014-01-21 Qualcomm Incorporated Video coding with large macroblocks
US8619856B2 (en) * 2008-10-03 2013-12-31 Qualcomm Incorporated Video coding with large macroblocks
KR101647376B1 (ko) * 2009-03-30 2016-08-10 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
KR101624649B1 (ko) * 2009-08-14 2016-05-26 삼성전자주식회사 계층적인 부호화 블록 패턴 정보를 이용한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
US8340448B2 (en) * 2009-10-06 2012-12-25 Cisco Technology, Inc. Locally variable quantization and hybrid variable length coding for image and video compression
KR101791078B1 (ko) * 2010-04-16 2017-10-30 에스케이텔레콤 주식회사 영상 부호화/복호화 장치 및 방법
US8934540B2 (en) * 2010-07-20 2015-01-13 Cisco Technology, Inc. Video compression using multiple variable length coding methods for multiple types of transform coefficient blocks
US9172963B2 (en) * 2010-11-01 2015-10-27 Qualcomm Incorporated Joint coding of syntax elements for video coding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080260028A1 (en) * 2004-12-22 2008-10-23 Thales Video H.264 Encryption Preserving Synchronization and Compatibility of Syntax
CN101822057A (zh) * 2007-10-12 2010-09-01 高通股份有限公司 视频块标头信息的自适应译码

Also Published As

Publication number Publication date
US9172963B2 (en) 2015-10-27
KR20130084308A (ko) 2013-07-24
KR101632776B1 (ko) 2016-06-22
CN103190147A (zh) 2013-07-03
US20120106649A1 (en) 2012-05-03
JP2013546257A (ja) 2013-12-26
JP5788520B2 (ja) 2015-09-30
WO2012061298A1 (en) 2012-05-10

Similar Documents

Publication Publication Date Title
CN103190147B (zh) 用于视频译码的语法元素的联合译码方法及设备
RU2723568C2 (ru) Определение параметров предсказания для неквадратных блоков кодирования видео
RU2584498C2 (ru) Видеокодирование интра-режима
JP6162150B2 (ja) ビデオコーディング用の残差4分木(rqt)コーディング
CN103299620B (zh) 在视频译码中使用最可能扫描次序对用于视频块的扫描次序信息进行有效译码
RU2586003C2 (ru) Определение значений уровня границы фильтрования удаления блочности для кодирования видео
CN109716774A (zh) 用于视频译码的可变数目的帧内模式
CN104272742B (zh) 加权预测参数译码
CN104221374A (zh) 在视频译码中分群经旁路译码语法元素
CN103202016A (zh) 用于视频译码的自适应运动向量分辨率信令
CN104054344A (zh) 对色度数据进行解块以用于视频译码
CN103141100A (zh) 用于视频译码的帧内平滑滤波器
CN103238323A (zh) 在视频译码中基于视频块的扫描次序对块内的最后有效系数的位置进行译码
CN105379270A (zh) 颜色分量间残余预测
CN103597832A (zh) 用于使用相邻模式的视频译码的增强的帧内预测模式信令
CN104412591A (zh) 用于差域帧内预测的帧内模式扩展
CN103238322A (zh) 在视频译码中单独地译码视频块的最后有效系数的位置
CN105474641A (zh) 视频译码过程中用于系数层级译码的莱斯(rice)参数初始化
CN103140877A (zh) 使用帧内预测的视频译码
CN103947207A (zh) 用于图片分割方案的统一设计
CN104685875A (zh) 用于视频译码中的4:2:2样本格式的帧内译码
CN103959785A (zh) 在视频译码中用于色度分量的变换单位分割
CN103891279A (zh) 用于帧内预测译码的最大概率变换
CN104937936A (zh) 用于帧内预测的模式决策简化
CN103621082A (zh) 视频译码中的量化

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant