CN108307195B - 最后有效系数的位置的渐进式译码 - Google Patents

最后有效系数的位置的渐进式译码 Download PDF

Info

Publication number
CN108307195B
CN108307195B CN201810438564.1A CN201810438564A CN108307195B CN 108307195 B CN108307195 B CN 108307195B CN 201810438564 A CN201810438564 A CN 201810438564A CN 108307195 B CN108307195 B CN 108307195B
Authority
CN
China
Prior art keywords
binary string
binary
significant coefficient
last significant
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810438564.1A
Other languages
English (en)
Other versions
CN108307195A (zh
Inventor
钱威俊
霍埃尔·索赖·罗哈斯
马尔塔·卡切维奇
瑞珍·雷克斯曼·乔许
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Willow Media International Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Willow Media International Ltd filed Critical Willow Media International Ltd
Publication of CN108307195A publication Critical patent/CN108307195A/zh
Application granted granted Critical
Publication of CN108307195B publication Critical patent/CN108307195B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/88Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving rearrangement of data among different coding units, e.g. shuffling, interleaving, scrambling or permutation of pixel data or permutation of transform coefficient data among different blocks
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4006Conversion to or from arithmetic code
    • H03M7/4012Binary arithmetic codes
    • H03M7/4018Context adapative binary arithmetic codes [CABAC]
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4031Fixed length to variable length coding
    • H03M7/4037Prefix coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及最后有效系数的位置的渐进式译码。一种视频编码器经配置以确定值的第一二进制串和第二二进制串,所述值指示最后有效系数在大小为T的视频块内的位置。一种视频解码器经配置以基于第一二进制串和第二二进制串确定值,所述值指示最后有效系数在大小为T的视频块内的位置。在一个实例中,所述第一二进制串基于通过最大位长度定义的截断一元译码方案,所述最大位长度通过2log2(T)‑1定义,且所述第二二进制串基于通过最大位长度定义的固定长度译码方案,所述最大位长度通过log2(T)‑2定义。

Description

最后有效系数的位置的渐进式译码
分案申请的相关信息
本案是分案申请。该分案的母案是申请日为2012年11月6日、申请号为201280054978.5、发明名称为“最后有效系数的位置的渐进式译码”的发明专利申请案。
本申请案主张以下各者的权益:
2011年11月8日申请的第61/557,317号美国临时申请案;以及
2011年11月20日申请的第61/561,909号美国临时申请案,
所述申请案中的每一者特此以全文引用的方式并入。
技术领域
本发明是关于视频译码。
背景技术
数字视频能力可并入至广泛范围的装置中,所述装置包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、便携式或台式计算机、平板型计算机、电子书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏主机、蜂窝式或卫星无线电电话、所谓的“智能手机”、视频电话会议装置、视频流式传输装置,及其类似者。数字视频装置实施视频压缩技术,例如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分(高级视频译码(AVC))定义的标准、目前在开发中的高效视频译码(HEVC)标准,及此等标准的扩展等中描述的彼等技术。视频装置可通过实施此等视频压缩技术而更有效率地发射、接收、编码、解码和/或存储数字视频信息。
视频压缩技术执行空间(图片内)预测和/或时间(图片间)预测,以减少或移除视频序列中固有的冗余。对于基于块的视频译码,可将视频切片(即,视频帧或视频帧的一部分)分割成视频块,其还可被称作树型块、译码单元(CU)和/或译码节点。图片的帧内译码(I)切片中的视频块是使用相对于同一图片中的相邻块中的参考样本的空间预测来编码。图片的帧间译码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间预测或时间预测导致用于待译码块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。根据指向形成预测性块的参考样本的块的运动向量及指示经译码块与预测性块之间的差异的残余数据来编码帧间译码块。根据帧内译码模式及残余数据来编码帧内译码块。为了进一步压缩,可将残余数据从像素域变换至变换域,从而得到残余变换系数,可接着量化所述残余变换系数。可扫描最初布置成二维阵列的经量化的变换系数以便产生变换系数的一维向量,且可应用熵译码以实现甚至更多压缩。
发明内容
一般来说,本发明描述用于译码视频数据的技术。视频编码通常涉及使用特定预测模式来预测视频数据块,及基于所预测块与正进行译码的实际块之间的差来译码所述块的残余值。残余块包含此等逐像素差。可对残余块进行变换及量化。视频译码器可包含将变换系数映射成离散级别值的量化单元。本发明提供用于译码最后有效系数在视频块内的位置的技术。
在一个实例中,一种用于编码视频数据的方法包括:获得指示最后有效系数在大小为T的视频块内的位置的值;基于通过最大位长度定义的截断一元译码方案确定指示所述最后有效系数的所述位置的所述值的第一二进制串,所述最大位长度通过2log2(T)-1来定义;基于固定长度译码方案来确定指示所述最后有效系数的所述位置的所述值的第二二进制串;以及将所述第一二进制串及所述第二二进制串编码至位流。
在另一实例中,一种用于解码视频数据的方法包括:从经编码位流获得第一二进制串和第二二进制串;部分基于所述第一二进制串确定指示最后有效系数在大小为T的视频块内的位置的值,其中所述第一二进制串通过最大位长度由2log2(T)-1定义的截断一元译码方案来定义;以及部分基于所述第二二进制串确定指示所述最后有效系数的所述位置的所述值,其中所述第二二进制串通过固定长度译码方案来定义。
在另一实例中,一种用于编码视频数据的设备包括视频编码装置,所述视频编码装置经配置以:获得指示最后有效系数在大小为T的视频块内的位置的值;基于通过最大位长度定义的截断一元译码方案确定指示所述最后有效系数的所述位置的所述值的第一二进制串,所述最大位长度通过2log2(T)-1来定义;基于固定长度译码方案来确定指示所述最后有效系数的所述位置的所述值的第二二进制串;以及将所述第一二进制串及所述第二二进制串编码至位流。
在另一实例中,一种用于解码视频数据的设备包括视频解码装置,所述视频解码装置经配置以:从经编码位流获得第一二进制串和第二二进制串;部分基于所述第一二进制串确定指示最后有效系数在大小为T的视频块内的位置的值,其中所述第一二进制串通过最大位长度由2log2(T)-1定义的截断一元译码方案来定义;以及部分基于所述第二二进制串确定指示所述最后有效系数的所述位置的所述值,其中所述第二二进制串通过固定长度译码方案来定义。
在另一实例中,一种用于编码视频数据的装置包括:用于获得指示最后有效系数在大小为T的视频块内的位置的值的装置;用于基于通过最大位长度定义的截断一元译码方案确定指示所述最后有效系数的所述位置的所述值的第一二进制串的装置,所述最大位长度通过2log2(T)-1来定义;用于基于固定长度译码方案来确定指示所述最后有效系数的所述位置的所述值的第二二进制串的装置;以及用于将所述第一二进制串及所述第二二进制串编码至位流的装置。
在另一实例中,一种用于解码视频数据的装置包括:用于从经编码位流获得第一二进制串和第二二进制串的装置;用于部分基于所述第一二进制串确定指示最后有效系数在大小为T的视频块内的位置的值的装置,其中所述第一二进制串通过最大位长度由2log2(T)-1定义的截断一元译码方案来定义;以及用于部分基于所述第二二进制串确定指示所述最后有效系数的所述位置的所述值的装置,其中所述第二二进制串通过固定长度译码方案来定义。
在另一实例中,一种计算机可读存储媒体包括上面存储的指令,所述指令在执行时使得用于编码视频数据的装置的处理器使得一或多个处理器:获得指示最后有效系数在大小为T的视频块内的位置的值;基于通过最大位长度定义的截断一元译码方案确定指示所述最后有效系数的所述位置的所述值的第一二进制串,所述最大位长度通过2log2(T)-1来定义;基于固定长度译码方案来确定指示所述最后有效系数的所述位置的所述值的第二二进制串;以及将所述第一二进制串及所述第二二进制串编码至位流。
在另一实例中,一种计算机可读存储媒体包括上面存储的指令,所述指令在执行时使得用于解码视频数据的装置的处理器:从经编码位流获得第一二进制串和第二二进制串;部分基于所述第一二进制串确定指示最后有效系数在大小为T的视频块内的位置的值,其中所述第一二进制串通过最大位长度由2log2(T)-1定义的截断一元译码方案来定义;以及部分基于所述第二二进制串确定指示所述最后有效系数的所述位置的所述值,其中所述第二二进制串通过固定长度译码方案来定义。
在一个实例中,一种用于解码视频数据的方法包括:从经编码位流获得第一二进制串和第二二进制串;部分基于所述第一二进制串确定指示最后有效系数在大小为T的视频块内的位置的值,其中所述第一二进制串通过最大位长度由log2(T)+1定义的截断一元译码方案来定义;以及部分基于所述第二二进制串确定指示所述最后有效系数的所述位置的所述值,其中所述第二二进制串通过固定长度译码方案来定义。
在一个实例中,一种用于解码视频数据的方法包括:从经编码位流获得第一二进制串和第二二进制串;部分基于所述第一二进制串确定指示最后有效系数在大小为T的视频块内的位置的值,其中所述第一二进制串通过最大位长度由log2(T)定义的截断一元译码方案来定义;以及部分基于所述第二二进制串确定指示所述最后有效系数的所述位置的所述值,其中所述第二二进制串通过固定长度译码方案来定义。
一或多个实例的细节陈述于附图及以下描述中。其它特征、目标及优势将从描述及附图和从权利要求书中显而易见。
附图说明
图1为说明可利用本发明中所描述的技术的实例视频编码及解码系统的框图。
图2A至图2D说明例示性系数值扫描次序。
图3说明关于系数值块的有效性图的一个实例。
图4为说明可实施本发明中所描述的技术的实例视频编码器的框图。
图5为说明可实施本发明中所描述的技术的实例熵编码器的框图。
图6为说明根据本发明的技术的用于确定值的二进制串的实例方法的流程图,所述值指示最后有效系数的位置。
图7为说明可实施本发明中所描述的技术的实例视频解码器的框图。
图8为说明根据本发明的技术的用于从二进制串确定指示最后有效系数的位置的值的实例方法的流程图。
具体实施方式
本发明提供用于减少位串的长度的技术,所述位串用于指示最后有效系数位置在变换系数块内的位置。位串对于上下文自适应二进制算术译码(CABAC)可为特别有用的。在一个实例中,具有减少数目个二进制位及较短的截断一元代码的渐进式代码字结构可用以指示最后有效系数位置的位置。另外,在一个实例中,通过减少截断一元代码的最大长度,也可减少最后有效系数位置的CABAC上下文模型的数目。
视频编码器可经配置以确定值的第一二进制串及第二二进制串,所述值指示最后有效系数在大小为T的视频块内的位置。视频解码器可经配置以基于第一二进制串及第二二进制串确定值,所述值指示最后有效系数在大小为T的视频块内的位置。在一个实例中,第一二进制串可基于通过最大位长度定义的截断一元译码方案,所述最大位长度通过2log2(T)-1定义,且所述第二二进制串可基于通过最大位长度定义的固定长度译码方案,所述最大位长度通过log2(T)-2定义。在另一实例中,第一二进制串可基于通过最大位长度定义的截断一元译码方案,所述最大位长度通过log2(T)+1定义,且第二二进制串可基于通过最大位长度定义的固定长度译码方案,所述最大位长度通过log2(T)-1定义。在又一实例中,第一二进制串可基于通过最大位长度定义的截断一元译码方案,所述最大位长度通过log2(T)定义,且第二二进制串可基于通过最大位长度定义的固定长度译码方案,所述最大位长度通过log2(T)-1定义。
图1为说明可利用本发明中所描述的技术的实例视频编码及解码系统10的框图。如图1中所展示,系统10包含源装置12,所述源装置12产生将由目的装置14在稍后时间解码的经编码视频数据。源装置12及目的装置14可包括广泛范围的装置中的任一者,所述装置包含台式计算机、笔记本式(即,便携式)计算机、平板计算机、机顶盒、例如所谓的“智能”手机等的电话手机、所谓的“智能”板、电视、相机、显示装置、数字媒体播放器、视频游戏机、视频流式传输装置,或其类似者。在一些状况下,源装置12及目的装置14可被配备以进行无线通信。
目的装置14可经由链路16接收待解码的经编码视频数据。链路16可包括能够将经编码视频数据自源装置12移动至目的装置14的任何类型的媒体或装置。在一个实例中,链路16可包括通信媒体以使得源装置12能够将经编码视频数据实时地直接发射至目的装置14。可根据通信标准(例如无线通信协议等)调制经编码视频数据,且将经编码视频数据发射至目的装置14。通信媒体可包括任何无线或有线通信媒体,例如,射频(RF)频谱或者一或多个物理发射线。通信媒体可形成基于分组的网络(例如,局域网、广域网或例如因特网等的全球网络)的部分。通信媒体可包含路由器、交换机、基站,或可用以促进自源装置12至目的装置14的通信的任何其它设备。
替代地,可将经编码数据自输出接口22输出至存储装置32。类似地,可通过输入接口28自存储装置32存取经编码数据。存储装置32可包含多种分布式或本地存取式数据存储媒体中的任一者,例如,硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器,或用于存储经编码视频数据的任何其它合适的数字存储媒体。在其它实例中,存储装置32可对应于可保存由源装置12产生的经编码视频的文件服务器或另一中间存储装置。目的装置14可经由流式传输或下载自存储装置32存取所存储的视频数据。文件服务器可为能够存储经编码视频数据且将彼经编码视频数据发射至目的装置14的任何类型的服务器。实例文件服务器包含网页服务器(例如,用于网站)、FTP服务器、网络附接存储器(NAS)装置或本地磁盘驱动器。目的装置14可经由任何标准数据连接(包含因特网连接)而存取经编码视频数据。此数据连接可包含适合于存取存储于文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、缆线调制解调器,等等),或两者的组合。经编码视频数据自存储装置32的发射可为流式传输发射、下载发射,或两者的组合。
本发明的技术未必限于无线应用或设定。技术可应用至支持多种多媒体应用中的任一者的视频译码,例如空中电视广播、有线电视发射、卫星电视发射、流式传输视频发射(例如,经由因特网)、数字视频的编码以存储于数据存储媒体上、存储于数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频发射以支持例如视频流式传输、视频回放、视频广播和/或视频电话等的应用。
在图1的实例中,源装置12包含视频源18、视频编码器20及输出接口22。在一些状况下,输出接口22可包含调制器/解调器(调制解调器)和/或发射器。在源装置12中,视频源18可包含例如视频俘获装置(例如,摄像机)、含有先前俘获的视频的视频存档、自视频内容提供者接收视频的视频馈入接口,和/或用于产生计算机图形数据作为源视频的计算机图形系统等源,或此等源的组合。作为一个实例,如果视频源18为摄像机,那么源装置12及目的装置14可形成所谓的相机电话或视频电话。然而,本发明中所描述的技术可大体适用于视频译码,且可应用于无线和/或有线应用。
经俘获、预先俘获或计算机产生的视频可由视频编码器12进行编码。经编码视频数据可经由源装置20的输出接口22直接发射至目的装置14。经编码视频数据还可(或替代地)存储于存储装置32上,以供目的装置14或其它装置稍后存取以用于解码和/或回放。
目的装置14包含输入接口28、视频解码器30及显示装置32。在一些状况下,输入接口28可包含接收器和/或调制解调器。目的装置14的输入接口28经由链路16接收经编码视频数据。经由链路16传达或在存储装置32上提供的经编码视频数据可包含由视频编码器20产生的多种语法元素以供视频解码器(例如,视频解码器30)在解码视频数据中使用。此等语法元素可与在通信媒体上发射、存储于存储媒体上或存储于文件服务器上的经编码视频数据包含在一起。
显示装置32可与目的装置14集成,或在目的装置14外部。在一些实例中,目的装置14可包含集成显示装置,且还可经配置以与外部显示装置接口连接。在其它实例中,目的装置14可为显示装置。一般来说,显示装置32向用户显示经解码的视频数据,且可包括例如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置等多种显示装置中的任一者。
视频编码器20及视频解码器30可根据例如目前在开发中的高效视频译码(HEVC)标准的视频压缩标准而操作,且可符合HEVC测试模型(HM)。替代性地,视频编码器20及视频解码器30可根据例如替代地被称作MPEG-4第10部分高级视频译码(AVC)的ITU-T H.264标准等其它专属或行业标准或者此等标准的扩展而操作。然而,本发明的技术不限于任何特定译码标准。视频压缩标准的其它实例包含MPEG-2及ITU-T H.263。
尽管图1中未展示,但在一些方面中,视频编码器20及视频解码器30可各自与音频编码器及解码器集成,且可包含适当的多路复用器-多路分用器(MUX-DEMUX)单元或其它硬件及软件,以处理对共同数据流或单独数据流中的音频与视频两者的编码。如果适用,那么在一些实例中,MUX-DEMUX单元可符合ITU H.223多路复用器协议,或例如用户数据报协议(UDP)等其它协议。
视频编码器20和视频解码器30各自可经实施为例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合等多种合适编码器电路中的任一者。当所述技术部分地以软件实施时,装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中,且在硬件中使用一或多个处理器来执行所述指令以执行本发明的技术。视频编码器20及视频解码器30中的每一者可包含于一或多个编码器或解码器中,其中任一者可集成为个别装置中的组合式编码器/解码器(编解码器(CODEC))的部分。
JCT-VC正致力于HEVC标准的开发。HEVC标准化努力是基于视频译码装置的被称作HEVC测试模型(HM)的演进模型。HM假设视频译码装置相对于根据(例如)ITU-T H.264/AVC的现有装置的若干额外能力。举例来说,H.264提供九个帧内预测编码模式,而HM可提供多达三十三个帧内预测编码模式。
一般来说,HM的工作模型描述,视频帧或图片可划分成包含明度样本及色度样本两者的树型块或最大译码单元(LCU)的序列。树型块具有类似于H.264标准的宏块的用途。切片包含按译码次序的数个连续树型块。可将视频帧或图片分割成一或多个切片。每一树型块可根据四叉树而分裂成数个译码单元(CU)。举例来说,作为四叉树的根节点,树型块可分裂成四个子节点,且每一子节点又可为父节点并分裂成另外四个子节点。作为四叉树的叶节点,最终未经分裂子节点包括译码节点,即,经译码视频块。与经译码位流相关联的语法数据可定义树型块可经分裂的最大次数,且还可定义译码节点的最小大小。
CU包含译码节点,及与所述译码节点相关联的预测单元(PU)及变换单元(TU)。CU的大小对应于译码节点的大小,且形状必须为正方形。CU的大小的范围可自8×8个像素直至具有最大64×64像素或以上的树型块的大小。每一CU可含有一或多个PU及一或多个TU。与CU相关联的语法数据可描述(例如)CU至一或多个PU的分割。分割模式可视CU经跳过或直接模式编码、经帧内预测模式编码抑或经帧间预测模式编码而不同。PU可分割成非正方形。与CU相关联的语法数据还可描述(例如)CU根据四叉树至一或多个TU的分割。TU的形状可为正方形或非正方形。
HEVC标准允许根据TU的变换,所述变换对于不同CU可不同。通常基于针对经分割LCU所定义的给定CU内的PU的大小而设定TU的大小,尽管可能并非总是如此状况。TU大小通常与PU相同,或小于PU。在一些实例中,可使用称为为“残余四叉树”(RQT)的四叉树结构而将对应于CU的残余样本再分为更小的单元。RQT的叶节点可被称作变换单元(TU)。可变换与TU相关联的像素差值以产生可经量化的变换系数。
一般来说,PU包含与预测过程相关的数据。举例来说,当PU经帧间模式编码时,PU可包含描述所述PU的帧内预测模式的数据。作为另一实例,当PU经帧间模式编码时,PU可包含定义所述PU的运动向量的数据。定义PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量所指向的参考图片,和/或运动向量的参考图片列表(例如,列表0、列表1或列表C)。
一般来说,TU用于变换及量化过程。具有一或多个PU的给定CU还可包含一或多个TU。在预测之后,视频编码器20可计算对应于PU的残余值。残余值包括像素差值,像素差值可使用TU变换成变换系数,进行量化并扫描以产生串行化的变换系数以供熵译码。术语“视频块”在本发明中可指CU的译码节点,或变换系数的块。变换系数的一或多个块可定义TU。在一些特定状况下,本发明还可使用术语“视频块”来指树型块(即,LCU)或CU,CU包含译码节点以及PU及TU。
视频序列通常包含一系列视频帧或图片。图片群组(GOP)通常包括一系列的一或多个视频图片。GOP可在GOP的标头、图片中的一或多者的标头中或在别处包含语法数据,所述语法数据描述包含于GOP中的图片的数目。图片的每一切片可包含描述所述个别切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块进行操作,以便编码视频数据。视频块可包含对应于CU内的译码节点的一或多个TU或PU。视频块可具有固定或变化的大小,且可根据所指定的译码标准而在大小上不同。
作为一实例,HM支持以各种PU大小进行预测。假定特定CU的大小为2N×2N,那么HM支持以2N×2N或N×N的PU大小进行帧内预测,及以2N×2N、2N×N、N×2N或N×N的对称PU大小进行帧间预测。HM还支持以2N×nU、2N×nD、nL×2N及nR×2N的PU大小进行用于帧间预测的不对称分割。在不对称分割中,CU的一个方向未分割,而另一方向分割成25%与75%。CU的对应于25%分区的部分由“n”继之以“上”、“下”、“左”或“右”的指示来指示。因此,例如,“2N×nU”指水平分割成顶部2N×0.5N PU及底部2N×1.5N PU的2N×2N CU。
在本发明中,“N×N”与“N乘N”可互换地使用以指视频块在垂直尺寸与水平尺寸方面的像素尺寸,例如,16×16像素或16乘16像素。一般来说,16×16块在垂直方向上将具有16个像素(y=16)且在水平方向上将具有16个像素(x=16)。同样,N×N块通常在垂直方向上具有N个像素,且在水平方向上具有N个像素,其中N表示非负整数值。块中的像素可布置成若干行和若干列。此外,块未必需要在水平方向上与在垂直方向上具有相同的数目个像素。举例来说,块可包括N×M个像素,其中M未必等于N。
在使用CU的PU的帧内预测性或帧间预测性译码之后,视频编码器20可计算CU的TU的残余数据。PU可包括空间域(又被称作像素域)中的像素数据,且TU可包括在将例如离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换的变换应用至残余视频数据之后变换域中的系数。残余数据可对应于未经编码图片的像素与对应于PU的预测值之间的像素差。视频编码器20可自变换系数的一或多个块形成TU。TU可包含CU的残余数据。视频编码器20可接着变换TU以产生CU的变换系数。
在进行任何变换以产生变换系数之后,视频编码器20可执行变换系数的量化。量化大体指如下过程:将变换系数量化以可能地减少用以表示所述系数的数据的量,从而提供进一步压缩。量化过程可减少与系数中的一些或全部相关联的位深度。举例来说,可在量化期间将n位值降值舍位至m位值,其中n大于m。
在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化的变换系数,以产生可经熵编码的串行化向量。在其它实例中,视频编码器20可执行自适应扫描。图2A至2D说明一些不同例示性扫描次序。还可使用其它所定义扫描次序或自适应(变化的)扫描次序。图2A说明Z字形扫描次序,图2B说明水平扫描次序,图2C说明垂直扫描次序,且图2D说明对角线扫描次序。还可定义并使用这些扫描次序的组合。在一些实例中,本发明的技术在视频译码过程中的所谓有效性图的译码期间可为特别适用的。
一或多个语法元素可经定义以指示最后有效系数(即,非零系数)的位置,所述位置可取决于与系数块相关联的扫描次序。举例来说,一个语法元素可定义最后有效系数在系数值块内的列位置,且另一语法元素可定义最后有效系数在系数值块内的行位置。
图3说明关于系数值块的有效性图的一个实例。有效性图展示于右侧,其中1位旗标识别左侧视频块中有效(即,非零)的系数。在一个实例中,在给定有效系数的集合(例如,通过有效性图定义)及扫描次序的情况下,可定义出最后有效系数的位置。在新兴HEVC标准中,可将变换系数分组成信息块。信息块可包括整个TU,或在一些状况下,TU可被再分成较小信息块。针对信息块中的每一系数译码有效性图及级别信息(绝对值和正负号)。在一个实例中,对于4×4TU及8×8TU,信息块由呈逆扫描次序(例如,对角线、水平或垂直)的16个连续系数组成。对于16×16及32×32TU,4×4子块内的系数被当作信息块。语法元素经译码且用信号传送以表示信息块内的系数级别信息。在一个实例中,所有符号以逆扫描次序编码。本发明的技术可改善用以定义系数块的最后有效系数的此位置的语法元素的译码。
作为一个实例,本发明的技术可用以译码系数块(例如,TU或TU的信息块)的最后有效系数的位置。接着,在译码最后有效系数的位置之后,可译码级别及正负号信息。级别及正负号信息的译码可通过以逆扫描次序译码以下符号(例如,对于TU或TU的信息块)根据五遍次方法而进行处理:
significant_coeff_flag(缩写sigMapFlag):此旗标可指示信息块中每一系数的有效性。具有一或大于一的值的系数被认为是有效的。
coeff_abs_level_greater1_flag(缩写gr1Flag):此旗标可指示系数的绝对值对于非零系数(即,具有为1的sigMapFlag的系数)是否大于1。
coeff_abs_level_greater2_flag(缩写gr2Flag):此旗标可指示系数的绝对值对于具有大于1的绝对值的系数(即,具有为1的gr1Flag的系数)是否大于2。
coeff_sign_flag(缩写signFlag):此旗标可指示非零系数的正负号信息。举例来说,此旗标的零指示正号,而1指示负号。
coeff_abs_level_remain(缩写levelRem):为变换系数级别的剩余绝对值。对于此旗标,对于具有大于x的幅值的每一系数,译码系数的绝对值-x(abs(级别)-x),x的值取决于gr1Flag及gr2Flag的呈现。
以此方式,可译码TU或TU的信息块的变换系数。在任何状况下,关系到译码用以定义系数块的最后有效系数的位置的语法元素的译码的本发明的技术还可与用于最终译码变换系数的级别及正负号信息的其它类型的技术一起使用。如本发明中所陈述,用于译码有效性、级别及正负号信息的五遍次方法仅为在译码块的最后有效系数的位置之后可使用的一项实例技术。
在扫描经量化的变换系数以形成一维向量之后,视频编码器20可(例如)根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法而熵编码一维向量。视频编码器20还可熵编码与经编码视频数据相关联的语法元素以供视频解码器30用于解码视频数据。本发明的熵译码技术被具体描述为适用于CABAC,但所述技术还可适用于例如CAVLC、SBAC、PIPE或其它技术等其它熵译码技术。
为了执行CABAC,视频编码器20可将上下文模型内的上下文指派给待发射的符号。所述上下文可能是关于(例如)符号的相邻值是否为非零。为了执行CAVLC,视频编码器20可针对待发射的符号选择可变长度代码。可变长度译码(VLC)中的代码字可经构建,使得相对较短代码对应于更有可能的符号,而较长代码对应于较不可能的符号。以此方式,与(例如)针对待发射的每一符号使用等长度代码字相比较,使用VLC可实现位节省。概率确定可基于指派给符号的上下文。
一般来说,使用CABAC对数据符号译码可涉及以下步骤中的一或多者:
(1)二进制化:如果待译码符号具有非二进制值,那么其被映射至所谓“二进制位”的序列。每一二进制位可具有为“0”或“1”的值。
(2)上下文指派:将每一二进制位(呈规则模式)指派给上下文。上下文模型基于可用于二进制位的信息(例如,先前编码符号的值或二进制位号码)确定计算给定二进制位的上下文的方式。
(3)二进制位编码:用算术编码器来编码二进制位。为了编码二进制位,算术编码器需要二进制位的值的概率(即,二进制位的值等于“0”的概率,及二进制位的值等于“1”的概率)作为输入。每一上下文的(所估计)概率由称作“上下文状态”的整数值来表示。每一上下文具有一状态,且因此所述状态(即,所估计概率)对于指派给一个上下文的二进制位为相同的,且在上下文间不同。
(4)状态更新:基于二进制位的实际经译码值来更新所选择上下文的概率(状态)(例如,如果二进制位值为“1”,那么“1”的概率增加)。
请注意,概率区间分割熵译码(PIPE)使用类似于算术译码的彼等原理的原理,且可将类似技术用于本发明的主要关于CABAC描述的彼等原理。然而,本发明的技术可供CABAC、PIPE或使用二进制化技术的其它熵译码方法使用。
近来对HM4.0采用的一项技术描述于V.史乐金(Seregin),I.-K金“用于最后位置译码的二进制化修改”(JCTVC-F375,第6次会议,意大利都灵,2011年7月)(本文中“史乐金”)中。在HM4.0中采用的技术通过用绕过模式引入固定长度代码来减少用于CABAC的最后位置译码中的上下文。绕过模式意谓,不存在上下文建模程序,且每一符号是以相等概率状态译码。使以绕过模式译码的二进制位的数目增加同时减少以规则模式译码的二进制位可有助于编解码器的加速及并行化。
在HM4.0中采用的技术中,最后位置分量的最大可能量值max_length被相等地分成两半。前一半用截断一元代码译码,且第二半用固定长度代码译码(二进制位的数目等于log2(max_length/2))。在最差状况情境下,使用上下文建模的二进制位的数目等于max_length/2。表1展示HM4.0中TU 32×32的二进制化。
Figure BDA0001655305030000121
表1.HM4.0中TU 32×32的二进制化,其中X意谓1或0。
本发明提供最后有效系数位置的上下文自适应二进制算术译码(CABAC)的技术。在一个实例中,可使用具有减少数目个的二进制位及较短截断一元代码的渐进式代码字结构。另外,在一个实例中,通过减少截断一元代码的最大长度,可使最后有效系数位置的上下文模型的数目减少二。
图4为说明可实施本发明中所描述的技术的实例视频编码器20的框图。视频编码器20可执行视频切片内的视频块的帧内译码及帧间译码。帧内译码依赖于空间预测以减少或移除给定视频帧或图片内的视频的空间冗余。帧间译码依赖于时间预测以减少或移除视频序列的邻近帧或图片内的视频中的时间冗余。帧内模式(I模式)可指若干基于空间的压缩模式中的任一者。例如单向预测(P模式)或双向预测(B模式)等帧间模式可指若干基于时间的压缩模式中的任一者。
在图4的实例中,视频编码器20包含分割单元35、预测模块41、参考图片存储器64、求和器50、变换模块52、量化单元54及熵编码单元56。预测模块41包含运动估计单元42、运动补偿单元44及帧内预测模块46。对于视频块重建,视频编码器20还包含反量化单元58、反变换模块60及求和器62。还可包含去块滤波器(图2中未展示)以将块边界滤波,以从经重建的视频移除成块性伪影。如果需要的话,去块滤波器通常将对求和器62的输出进行滤波。除去块滤波器外,还可使用额外环路滤波器(环路内或环路后)。
如图4中所展示,视频编码器20接收视频数据,且分割单元35将数据分割成视频块。此分割还可包含分割成切片、图块或其它较大单元,以及(例如)根据LCU及CU的四叉树结构的视频块分割。视频编码器20通常说明编码待编码的视频切片内的视频块的组件。切片可经划分成多个视频块(且可能划分成被称作图块的视频块集合)。预测模块41可基于错误结果(例如,译码速率及失真级别)而选择多个可能译码模式中的一者(例如,多个帧内译码模式中的一者或多个帧间译码模式中的一者)用于当前视频块。预测模块41可将所得帧内或帧间译码块提供至求和器50以产生残余块数据,且至求和器62以重建经编码块以用作参考图片。
预测模块41内的帧内预测模块46可执行当前视频块相对于与待译码的当前块相同的帧或切片中的一或多个相邻块的帧内预测性译码以提供空间压缩。预测模块41内的运动估计单元42及运动补偿单元44执行当前视频块相对于一或多个参考图片中的一或多个预测性块的帧间预测性译码以提供时间压缩。
运动估计单元42可经配置以根据视频序列的预定模式来确定视频切片的帧间预测模式。预定模式可指定序列中的视频切片作为预测性切片(P切片)、双向预测性切片(B切片)或通用化P及B切片(GPB切片)。P切片可参考先前顺序图片。B切片可参考先前顺序图片或之后的顺序图片。GPB切片指参考图片的两个列表等同的状况。运动估计单元42与运动补偿单元44可高度集成,但出于概念上的目的而分开地予以说明。由运动估计单元42执行的运动估计为产生运动向量的过程,运动向量估计视频块的运动。运动向量(例如)可指示在当前视频帧或图片内的视频块的PU相对于参考图片内的预测性块的移位。
预测性块为被发现在像素差方面紧密地匹配于待译码视频块的PU的块,所述像素差可通过绝对差总和(SAD)、平方差总和(SSD)或其它差度量予以确定。在一些实例中,视频编码器20可计算存储于参考图片存储器64中的参考图片的子整数像素位置的值。举例来说,视频编码器20可内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可执行相对于全像素位置及分数像素位置的运动搜索,且以分数像素精度输出运动向量。
运动估计单元42通过比较帧间译码切片中的视频块的PU的位置与参考图片的预测性块的位置而计算所述PU的运动向量。参考图片可从第一参考图片列表(列表0)或第二参考图片列表(列表1)选择,所述列表中的每一者识别存储于参考图片存储器64中的一或多个参考图片。运动估计单元42将所计算运动向量发送至熵编码单元56及运动补偿单元44。
通过运动补偿单元44执行的运动补偿可涉及基于通过运动估计(可能执行到子像素精度的内插)确定的运动向量提取或产生预测性块。在接收到当前视频块的PU的运动向量时,运动补偿单元44可在参考图片列表中的一者中定位运动向量所指向的预测性块。视频编码器20通过从正被译码的当前视频块的像素值减去预测性块的像素值从而形成像素差值来形成残余视频块。像素差值形成块的残余数据,且可包含明度及色度差分量两者。求和器50表示执行此减法运算的组件。运动补偿单元44还可产生与视频块及视频切片相关联的语法元素以供视频解码器30用于解码视频切片的视频块。
作为通过运动估计单元42及运动补偿单元44执行的帧间预测的替代例,帧内预测模块46可帧内预测当前块,如上文所描述。具体来说,帧内预测模块46可确定用来编码当前块的帧内预测模式。在一些实例中,帧内预测模块46可(例如)在分离的编码遍次期间使用各种帧内预测模式来编码当前块,且帧内预测模块46(或在一些实例中,模式选择单元40)可从所测试的模式选择待使用的适当帧内预测模式。举例来说,帧内预测模块46可使用对各种经测试的帧内预测模式的速率-失真分析而计算速率-失真值,且在经测试的模式中选择具有最佳速率-失真特性的帧内预测模式。速率-失真分析通常确定经编码块与经编码以产生经编码块的原始未经编码块之间的失真(或误差)的量,以及用以产生经编码块的位速率(即,位数目)。帧内预测模块46可从各种经编码块的失真及速率计算比率以确定哪一帧内预测模式展现块的最佳速率-失真值。
在任何状况下,在选择块的帧内预测模式之后,帧内预测模块46可将指示块的所选择帧内预测模式的信息提供至熵译码单元56。熵译码单元56可根据本发明的技术编码指示所选择帧内预测模式的信息。视频编码器20可在经发射的位流中包含配置数据,所述配置数据可包含多个帧内预测模式索引表及多个经修改的帧内预测模式索引表(又被称作代码字映射表)、各种块的编码上下文的定义及将用于所述上下文中的每一者的最有可能的帧内预测模式、帧内预测模式索引表及经修改的帧内预测模式索引表的指示。
在预测模块41经由帧间预测或帧内预测产生当前视频块的预测性块之后,视频编码器20通过从当前视频块减去预测性块来形成残余视频块。残余块中的残余视频数据可包含于一或多个TU中,且应用至变换模块52。变换模块52使用例如离散余弦变换(DCT)或概念上类似的变换等变换将残余视频数据变换成残余变换系数。变换模块52可将残余视频数据从像素域转换至变换域(例如频域)。
变换模块52可将所得变换系数发送至量化单元54。量化单元54量化变换系数以进一步减少位速率。量化过程可减少与系数中的一些或全部相关联的位深度。可通过调整量化参数而修改量化程度。在一些实例中,量化单元54可接着执行对包含经量化变换系数的矩阵的扫描。替代性地,熵编码单元56可执行所述扫描。反量化单元58及反变换模块60分别应用反量化及反变换以在像素域中重建残余块,以供稍后用作参考图片的参考块。运动补偿单元44可通过将残余块添加至参考图片列表中的一者内的参考图片中的一者的预测性块来计算参考块。运动补偿单元44还可将一或多个内插滤波器应用至经重建残余块以计算子整数像素值以用于运动估计。求和器62将经重建的残余块加至由运动补偿单元44产生的运动补偿预测块,以产生参考块以供存储于参考图片存储器64中。参考块可由运动估计单元42及运动补偿单元44用作参考块以对后续视频帧或图片中的块进行帧间预测。
在量化之后,熵编码单元56熵编码经量化的变换系数。举例来说,熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法或技术。在通过熵编码单元56进行熵编码之后,经编码位流可被发射至视频解码器30,或经存档以供稍后发射或由视频解码器30检索。熵编码单元56还可熵编码运动向量,及正被译码的当前视频切块的其它语法元素。
在一个实例中,熵译码单元56可使用上文所描述的在HM4.0中所采用的技术来编码最后有效系数的位置。在其它实例中,熵译码单元56可使用可提供改善的译码的技术来编码最后有效系数的位置。具体来说,熵译码单元56可将渐进式最后位置译码方案用于若干可能的TU大小。
在一个实例中,最后有效系数的位置的代码字可包含截断一元代码前缀继之以固定长度代码后缀。在一个实例中,最后位置的每一量值可将相同二进制化用于所有可能的TU大小,不过最后位置等于TU大小减去1时除外。此例外是归因于截断一元译码的性质。在一个实例中,最后有效系数在矩形变换系数内的位置可通过指定x坐标值及y坐标值来指定。在另一实例中,变换系数块可呈1×N向量的形式,且最后有效系数在向量内的位置可通过单个位置值来指定。
在一个实例中,T可定义TU的大小。如上文详细地描述,TU形状可为正方形或非正方形。因此,T可指二维TU的行或列的数目,或向量的长度。在截断一元译码方案提供若干零位继之以一个1位的实例中,对最后有效系数的位置译码的截断一元代码前缀的零的数目可根据N={0,…,2log2(T)-1}来定义。请注意,在截断一元译码方案提供若干1位继之以一个零位的实例中,N={0,…,2log2(T)-1}还可定义一的数目。在此等截断一元译码替代例中的每一者中,2log2(T)-1可定义大小为T的TU的截断一元前缀的最大长度。举例来说,对于T等于32的TU,截断一元前缀的最大长度等于9,且对于T等于16的TU,截断一元前缀的最大长度等于7。
对于截断一元代码(值n),固定长度代码后缀可包含具有定义如下的值的固定长度二进制代码的随后b个位:f_value={0,...,2b-1},其中b=max(0,n/2-1)。因此,最后位置last_pos的量值可从n及f_value导出为:
Figure BDA0001655305030000161
其中mod(.)表示取模运算,且f_value表示固定长度代码的值。
表2展示针对32×32TU的根据根据等式1而提供的定义的最后有效系数的位置的实例二进制化。表2的第二列提供最后有效系数在大小为T的TU内的位置的可能值的对应截断一元前缀值,所述大小T通过为2log2(T)-1的最大截断一元前缀长度定义。表2的第三列提供每一截断一元前缀的对应固定长度后缀。为了简洁,表2包含指示一或零位值的X值。请注意,X值根据固定长度代码唯一地映射共享截断一元前缀的每一值。表2中最后位置分量的量值可对应于x坐标值和/或y坐标值。
Figure BDA0001655305030000162
表2.大小为32×32的TU的二进制化,其中X意谓1或0。
表3及4展示关于表1描述的实例二进制化方案与关于表2描述的实例二进制化方案的位串的最大长度的比较。如表3中所展示,一元代码前缀在关于表1所描述的实例中对于32×32TU可具有16个二进制位的最大长度。而一元代码前缀在关于表2所描述的实例中对于32×32TU可具有16个二进制位的最大长度。另外,如表4中所展示,基于截断一元前缀及固定长度后缀的总体长度(二进制位的最大数目)对于关于表2描述的实例在最差状况下(即,在最后位置位于32×32TU的末端处时)可为24,而对于关于表1描述的实例最差状况可为40。
表1 表2
TU 4×4 3 3
TU 8×8 4 5
TU 16×16 8 7
TU 32×32 16 9
总计(明度) 31 24
总计(色度) 15 15
表3.截断一元代码的最大长度。
表1 表2
TU 4×4 3 3
TU 8×8 6 6
TU 16×16 11 9
TU 32×32 20 12
表4.一个最后位置分量上的二进制位的最大长度。
在提供若干零位继之以一个1位或若干1位继之以一个1位的截断一元译码方案的另一实例中,译码最后有效系数的位置的截断一元代码前缀可根据N={0,…,log2(T)+1}来定义。在此等截断一元译码方案中的每一者中,log2(T)+1可定义大小为T的TU的截断一元前缀的最大长度。举例来说,对于T等于32的TU,截断一元前缀的最大长度等于6,且在T等于8之处,截断一元前缀的最大长度等于5。
对于截断一元代码(值n),固定长度代码后缀可包含具有定义如下的值的固定长度二进制代码的随后b个位:f_value={0,...,2b-1},其中b=n-2。因此,最后位置last_pos的量值可从n及f_value导出为:
Figure BDA0001655305030000171
其中f_value表示固定长度代码的值。
表5展示针对32×32TU的根据根据等式2而提供的定义的最后有效系数的位置的实例二进制化。表5的第二列提供最后有效系数在大小为T的TU内的位置的可能值的对应截断一元前缀值,所述大小T通过为log2(T)+1的最大截断一元前缀长度定义。表5的第三列提供每一截断一元前缀的对应固定长度后缀。为了简洁,表2包含指示一或零位值的X值。请注意,X值根据固定长度代码唯一地映射共享截断一元前缀的每一值。表5中最后位置分量的量值可对应于x坐标值和/或y坐标值。
Figure BDA0001655305030000181
表5.TU 32×32的实例二进制化,其中X意谓1或0。
在提供若干零位继之以一个1位或若干1位继之以一个1位的截断一元译码方案的另一实例中,译码最后有效系数的位置的截断一元代码前缀可根据N={0,…,log2(T)}来定义。在此等截断一元译码方案中的每一者中,log2(T)可定义大小为T的TU的截断一元前缀的最大长度。举例来说,对于T等于32的TU,截断一元前缀的最大长度等于5,且在T等于8之处,截断一元前缀的最大长度等于5。
对于截断一元代码(值n),固定长度代码后缀可包含具有定义如下的值的固定长度二进制代码的随后b个位:f_value={0,...,2b-1},其中b=n-1。因此,最后位置last_pos的量值可从n及f_value导出为:
Figure BDA0001655305030000182
其中f_value表示固定长度代码的值。
表6展示针对32×32TU的根据根据等式3而提供的定义的最后有效系数的位置的实例二进制化。表6的第二列提供最后有效系数在大小为T的TU内的位置的可能值的对应截断一元前缀值,所述大小T通过为log2(T)的最大截断一元前缀长度定义。表6的第三列提供每一截断一元前缀的对应固定长度后缀。为了简洁,表6包含指示一或零位值的X值。请注意,X值根据固定长度代码唯一地映射共享截断一元前缀的每一值。表6中最后位置分量的量值可对应于x坐标值和/或y坐标值。
Figure BDA0001655305030000183
Figure BDA0001655305030000191
表6.TU 32×32的实例二进制化,其中X意谓1或0。
表5及6展示使用截断一元前缀及固定长度后缀来译码最后有效系数的位置的一些替代性实例。展示于表5及6中的实例相较于关于表2提供的实例允许较短二进制位。请注意,在最后有效系数的位置是基于x坐标值及y坐标值确定的实例中,对于x坐标值及y坐标值可独立地选择展示于表1、2、5及6中的实例二进制化方案中的任一者。举例而言,x坐标值可基于关于表2描述的二进制化方案来编码,而y坐标值可基于关于表6描述的二进制化方案来编码。
如上文所描述,使用CABAC对数据符号译码可涉及随后步骤二进制化及上下文指派中的一或多者。在一个实例中,最后位置值上下文建模可用于截断一元串的算术编码,而上下文建模可不用于固定二进制串的算术编码(即,经绕过)。在使用上下文建模编码截断一元串的状况下,将上下文指派给二进制串的二进制位索引中的每一者。个别二进制位索引可共享上下文指派。上下文指派的数目等于二进制位索引的数目,或截断一元串的长度。因此,在说明于表1、2、5及6中的实例中的状况下,关联的上下文表可相应地指定至二进制化方案。表7说明关于以上表2在上文提供的实例二进制化的针对不同TU大小的每一二进制位的可能的上下文编索引。请注意,提供于表7中的实例上下文编索引所提供的上下文比史乐金中提供的上下文编索引所提供的上下文少两个。
Figure BDA0001655305030000192
表7
表8至11各自说明根据针对上下文建模创建的以下规则的上下文编索引的一些实例:
1.前K个二进制位并不共享上下文,其中K>1。K对于每一TU大小可不同。
2.一个上下文可仅被指派给连续二进制位。举例来说,二进制位3至二进制位5可使用上下文5。但二进制位3及二进制位5使用上下文5且二进制位4使用上下文6不被允许。
3.不同TU大小的最后N个二进制位(N>=0)可共享同一上下文。
4.共享同一上下文的二进制位的数目随着TU大小而增加。
以上规则1至4对于提供于表2中的二进制化可特别有用。然而,可基于经实施的二进制化方案相应地调整上下文建模。
Figure BDA0001655305030000201
表8
Figure BDA0001655305030000202
表9
Figure BDA0001655305030000203
表10
Figure BDA0001655305030000204
表11
图5为说明可实施本发明中所描述的技术的实例熵编码器56的框图。熵编码器56接收语法元素,例如表示最后有效变换系数在变换块系数内的位置的一或多个语法元素,且将所述语法元素编码到位流中。语法元素可包含指定最后有效系数在变换系数块内的位置的x坐标的语法元素,及指定最后有效系数在变换系数块内的位置的y坐标的语法元素。在一个实例中,说明于图5中的熵编码器56可为CABAC编码器。图5中的实例熵编码器56可包含二进制化单元502、算术编码单元504及上下文指派单元506。
二进制化单元502接收语法元素并产生二进制位串。在一个实例中,二进制化单元502接收表示有效系数在变换系数块内的最后位置的值,且根据上文所描述的实例产生位串或二进制位值。算术编码单元504从二进制化单元502接收位串,且对代码字执行算术编码。如图5中所展示,算术编码器504可从绕过路径或从上下文建模单元506接收二进制位值。在算术编码单元504从上下文建模单元506接收二进制位值的状况下,算术编码单元504可基于通过上下文指派单元506提供的上下文指派执行算术编码。在一个实例中,算术编码单元504可使用上下文指派来编码位串的前缀部分,且可在不使用上下文指派的情况下编码位串的后缀部分。
在一个实例中,上下文指派单元506可基于在以上表7至11中提供的实例上下文编索引来指派上下文。以此方式,视频编码器20表示经配置以进行以下操作的视频编码器:获得指示最后有效系数在大小为T的视频块内的位置的值;基于通过最大位长度定义的截断一元译码方案确定指示最后有效系数的位置的值的第一二进制串,所述最大位长度通过2log2(T)-1、log2(T)+1或log2(T)定义;基于固定长度译码方案确定指示最后有效系数的位置的值的第二二进制串;及将第一及第二二进制串编码至位流。
图6为说明根据本发明的技术的用于确定值的二进制串的实例方法的流程图,所述值指示最后有效系数的位置。描述于图6中的方法可通过本文中所描述的实例视频编码器或熵编码器中的任一者来执行。在步骤602处,获得指示最后有效变换系数在视频块内的位置的值。在步骤604处,确定指示最后有效系数的位置的值的前缀二进制串。前缀二进制串可使用本文中所描述的技术中的任一者来确定。在一个实例中,前缀二进制串可基于通过最大位长度定义的截断一元译码方案,最大位长度通过2log2(T)-1定义,其中T定义视频块的大小。在另一实例中,前缀二进制可基于通过最大位长度定义的截断一元译码方案,最大位长度通过log2(T)+1定义,其中T定义视频块的大小。在又一实例中,前缀二进制串可基于通过最大位长度定义的截断一元译码方案,最大位长度通过log2(T)定义,其中T定义视频块的大小。前缀二进制串可通过编码器执行一组计算、通过编码器使用查找表或前面两者的组合来确定。举例来说,编码器可使用表2、5及6中的任一者来确定前缀二进制串。
在步骤606处,确定指示最后有效系数的位置的值的后缀二进制串。后缀二进制串可使用本文中所描述的技术中的任一者来确定。在一个实例中,后缀二进制串可基于通过最大位长度定义的固定长度译码方案,最大位长度通过log2(T)-2定义,其中T定义视频块的大小。在另一实例中,后缀二进制串可基于通过最大位长度定义的固定长度译码方案,最大位长度通过log2(T)-1定义,其中T定义视频块的大小。后缀二进制串可通过编码器执行一组计算、通过编码器使用查找表或前面两者的组合来确定。举例来说,编码器可使用表2、5及6中的任一者来确定后缀二进制串。在步骤608处,将前缀及后缀二进制串编码到位流中。在一个实例中,前缀及后缀二进制串可使用算术编码来编码。请注意,可互换位流的前缀和后缀部分。算术编码可为CABAC编码过程的部分,或另一熵编码过程的部分。
表12至14提供关于表1描述的实例二进制化方案以及关于表2描述的实例二进制化方案的译码性能的模拟结果的概述。表12至14中的模拟结果是使用如由F.博森(Bossen)“常见测试条件及软件参考配置”(JCTVC-F900)定义的高效率普通测试条件而获得。表12至14中的负值指示关于表2描述的二进制化方案的相较于关于表1描述的二进制化方案的较低位速率。表12至14中的编码时间及解码时间描述与编码(或解码)使用关于表1描述的二进制化方案产生的位流所需要的时间量相比较的分别编码及解码使用关于表2描述的二进制化方案产生的位流所需要的时间量。如从展示于表12至14中的实验结果可看出,关于表2描述的二进制化方案在高效率仅帧内、随机存取及低延迟测试条件下分别提供-0.04%、-0.01%及-0.03%的BD速率性能增益。
以下表中的A至E类表示视频数据的各种序列。列Y、U及V分别对应于明度、U色度及V色度的数据。表12概述了所有数据以帧内模式译码的配置的此数据。表13概述了所有数据以帧内及帧间模式都可用的“随机存取”模式译码的配置的此数据。表14概述了图片以低延迟B模式译码的配置的此数据。
Figure BDA0001655305030000221
表12-全帧内HE
Figure BDA0001655305030000222
表13-随机存取HE
Figure BDA0001655305030000223
Figure BDA0001655305030000231
表14-低延迟B HE
图7为说明可实施本发明中所描述的技术的实例视频解码器30的框图。在图7的实例中,视频解码器30包含熵解码单元80、预测模块81、反量化单元86、反变换模块88、求和器90及参考图片存储器92。预测模块81包含运动补偿单元82及帧内预测模块84。在一些实例中,视频解码器30可执行与关于来自图4的视频编码器20描述的编码遍次大体上互逆的解码遍次。
在解码过程期间,视频解码器30从视频编码器20接收经编码的视频位流,所述视频位流表示经编码视频切片的视频块及相关联的语法元素。视频解码器30的熵解码单元80熵解码位流以产生经量化的系数、运动向量及其它语法元素。熵解码单元80可基于本文中所描述的技术确定值,所述值指示最后有效系数在变换系数内的位置。熵解码单元80将运动向量及其它语法元素转发至预测模块81。视频解码器30可接收视频切片级别和/或视频块级别的语法元素。
当视频切片被译码为帧内译码(I)切片时,预测模块81的帧内预测模块84可基于用信号传送的帧内预测模式及来自当前帧或图片的先前经解码块的数据而产生当前视频切片的视频块的预测数据。当视频帧被译码为帧间译码(即,B、P或GPB)切片时,预测模块81的运动补偿单元82基于自熵解码单元80接收的运动向量及其它语法元素而产生当前视频切片的视频块的预测性块。可从参考图片列表中的一者内的参考图片中的一者产生预测性块。视频解码器30可基于存储于参考图片存储器92中的参考图片而使用默认构建技术来构建参考帧列表(列表0及列表1)。
运动补偿单元82通过剖析运动向量及其它语法元素而确定当前视频切片的视频块的预测信息,且使用所述预测信息产生正被解码的当前视频块的预测性块。举例来说,运动补偿单元82使用一些所接收的语法元素以确定用以译码视频切片的视频块的预测模式(例如,帧内预测或帧间预测)、帧间预测切片类型(例如,B切片、P切片或GPB切片)、切片的参考图片列表中的一或多者的构建信息、切片的每一帧间编码视频块的运动向量、切片的每一帧间译码视频块的帧间预测状态,及用以解码当前视频切片中的视频块的其它信息。
运动补偿单元82还可基于内插滤波器执行内插。运动补偿单元82可使用如由视频编码器20在视频块的编码期间使用的内插滤波器,以计算参考块的子整数像素的内插值。在此状况下,运动补偿单元82可从所接收的语法元素确定由视频编码器20使用的内插滤波器,且使用所述内插滤波器来产生预测性块。
反量化单元86反量化(即,解量化)提供于位流中且由熵解码单元80解码的经量化变换系数。反量化过程可包含对于视频切片中的每一视频块使用由视频编码器20计算的量化参数来确定应应用的量化程度及同样确定反量化程度。反变换模块88将反变换(例如,反DCT、反整数变换或概念上类似的反变换过程)应用于变换系数,以便在像素域中产生残余块。
在预测模块81基于帧间预测或帧内预测产生当前视频块的预测性块之后,视频解码器30通过对来自反变换模块88的残余块与由预测模块81产生的对应预测性块求和而形成经解码视频块。求和器90表示执行此求和运算的(多个)组件。如果需要的话,还可应用去块滤波器以对经解码块进行滤波,以便移除成块性伪影。其它环路滤波器(译码环路内或译码环路后)也可用以使像素转变平滑,或以其它方式改善视频质量。接着将给定帧或图片中的经解码视频块存储于参考图片存储器92中,参考图片存储器92存储用于后续运动补偿的参考图片。参考图片存储器92也存储经解码的视频以用于稍后在显示装置(例如,图1的显示装置32)上呈现。以此方式,视频解码器30表示经配置以进行以下操作的视频解码器:从经编码位流获得第一二进制串及第二二进制串;部分基于第一二进制串确定值,所述值指示最后有效系数在大小为T的视频块内的位置,其中第一二进制串通过最大位长度由2log2(T)-1定义的截断一元译码方案来定义;及部分基于第二二进制串确定指示最后有效系数的位置的值,其中第二二进制串通过固定长度译码方案来定义。
图8为说明根据本发明的技术的用于从二进制串确定值的实例方法的流程图,所述值指示最后有效系数在变换系数内的位置。描述于图8中的方法可由本文中所描述的实例视频解码器或熵解码单元中的任一者执行。在步骤802处,获得经编码位流。可从存储器或经由发射检索经编码位流。经编码位流可根据CABAC编码过程或另一熵译码过程来编码。在步骤804处,获得前缀二进制串。在步骤806处,获得后缀二进制串。可通过解码经编码位流来获得前缀二进制串及后缀二进制串。解码可包含算术解码。算术解码可为CABAC解码处理器或另一熵解码过程的部分。在步骤808处,确定指示最后有效系数在大小为T的视频块内的位置的值。在一个实例中,部分基于前缀二进制串确定最后有效系数的位置,其中前缀二进制串通过最大位长度由2log2(T)-1定义的截断一元译码方案来定义,其中T定义视频块的大小。在一个实例中,部分基于前缀二进制串确定最后有效系数的位置,其中前缀二进制串通过最大位长度由log2(T)+1定义的截断一元译码方案来定义,其中T定义视频块的大小。在一个实例中,部分基于前缀二进制串确定最后有效系数的位置,其中前缀二进制串通过最大位长度由log2(T)定义的截断一元译码方案来定义,其中T定义视频块的大小。在一个实例中,最后有效系数的位置部分基于后缀二进制串,其中后缀二进制串通过最大位长度由log2(T)-2定义的固定长度译码方案来定义,其中T定义视频块的大小。在另一实例中,第二二进制串可基于通过最大位长度定义的固定长度译码方案,最大位长度通过log2(T)-1定义,其中T定义视频块的大小。请注意,可互换位流的前缀部分与后缀部分。
在一或多个实例中,可以硬件、软件、固件或其任何组合来实施所描述功能。如果以软件来实施,那么可将所述功能作为一或多个指令或代码存储在计算机可读媒体上或经由计算机可读媒体而发射,且由基于硬件的处理单元来执行。计算机可读媒体可包含计算机可读存储媒体(其对应于例如数据存储媒体等有形媒体)或通信媒体,通信媒体包含(例如)根据通信协议促进计算机程序从一处传送到另一处的任何媒体。以此方式,计算机可读媒体一般可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波等通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索指令、代码和/或数据结构以用于实施本发明中所描述的技术的任何可用媒体。计算机程序产品可包含计算机可读媒体。
在又其它实例中,本发明预期到包括存储于上面的数据结构的计算机可读媒体,其中数据结构包含与本发明一致的经编码位流。具体来说,经编码位流可包含经熵译码位流,所述位流包含第一二进制串及第二二进制串,其中第一二进制串指示值(所述值指示最后有效系数的位置)且基于通过最大位长度定义的截断一元译码方案,最大位长度通过2log2(T)-1定义,且第二二进制串指示值(所述值指示最后有效系数的位置),且基于固定长度译码方案。
以实例说明且非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器,或可用以存储呈指令或数据结构形式的所要程序代码且可由计算机存取的任何其它媒体。而且,可恰当地将任何连接称作计算机可读媒体。举例来说,如果使用同轴电缆、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电及微波等无线技术从网站、服务器或其它远程源发射软件,则同轴电缆、光纤缆线、双绞线、DSL或例如红外线、无线电及微波等无线技术包含于媒体的定义中。然而,应理解,计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它瞬时媒体,而是有关于非瞬时性有形存储媒体。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字影音光盘(DVD)、软磁盘及蓝光光盘,其中磁盘通常磁性地再生数据,而光盘使用激光光学地再生数据。上文各者的组合也应包含在计算机可读媒体的范围内。
可由例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一或多个处理器来执行指令。因此,如本文中所使用的术语“处理器”可指前述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面,可将本文中所描述的功能性提供于经配置以用于编码及解码的专用硬件和/或软件模块内,或并入于组合式编解码器中。并且,可将所述技术完全实施于一或多个电路或逻辑元件中。
本发明的技术可在广泛多种装置或设备中予以实施,所述装置或设备包含无线手机、集成电路(IC)或一组IC(例如,芯片组)。在本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但未必需要通过不同硬件单元来实现。更确切地说,如上文所描述,可将各种单元组合于编解码器硬件单元中,或通过结合合适软件和/或固件的互操作性硬件单元(包含如上文所描述的一或多个处理器)的集合来提供所述单元。
已描述了各种实例。这些及其它实例属于所附权利要求书的范围内。

Claims (56)

1.一种用于编码视频数据的方法,其包括:
获得指示最后有效系数在大小为T的视频块内的位置的值;
基于通过最大位长度定义的截断一元译码方案确定指示所述最后有效系数的所述位置的所述值的第一二进制串,所述最大位长度通过2log2(T)-1来定义;
基于固定长度译码方案来确定指示所述最后有效系数的所述位置的所述值的第二二进制串,所述固定长度译码方案包含基于经确定的所述第一二进制串的值来确定所述第二二进制串的最大长度;以及
将所述第一二进制串和所述第二二进制串编码至位流。
2.根据权利要求1所述的方法,其中所述固定长度译码方案由最大位长度来定义,所述最大位长度通过log2(T)-2来定义。
3.根据权利要求2所述的方法,其中T等于32,其中指示最后有效系数的所述位置的所述值等于8,且其中所述第一二进制串的位长度是7。
4.根据权利要求1所述的方法,其中编码所述第一二进制串和所述第二二进制串包括编码所述第一二进制串,随后编码所述第二二进制串。
5.根据权利要求1所述的方法,其中编码所述第一二进制串和所述第二二进制串包括使用上下文自适应二进制算术译码CABAC过程编码所述第一二进制串和所述第二二进制串,所述CABAC过程包括基于上下文模型编码所述第一二进制串且绕过编码所述第二二进制串。
6.根据权利要求5所述的方法,其中绕过编码所述第二二进制串包括使用相等概率状态编码所述第二二进制串的二进制。
7.根据权利要求1所述的方法,其中指示所述最后有效系数的所述位置的所述值包括指示所述最后有效系数的x位置的值或指示所述最后有效系数的y位置的值中的一个。
8.一种用于编码视频数据的装置,所述装置包括:
存储器,其经配置以存储最后有效系数;及
视频编码器,其经配置以:
获得指示所述最后有效系数在大小为T的视频块内的位置的值;
基于通过最大位长度定义的截断一元译码方案确定指示所述最后有效系数的所述位置的所述值的第一二进制串,所述最大位长度通过2log2(T)-1来定义;
基于固定长度译码方案来确定指示所述最后有效系数的所述位置的所述值的第二二进制串,所述固定长度译码方案包含基于经确定的所述第一二进制串的值来确定所述第二二进制串的最大长度;以及
将所述第一二进制串和所述第二二进制串编码至位流。
9.根据权利要求8所述的装置,其中所述固定长度译码方案通过最大位长度来定义,所述最大位长度通过log2(T)-2来定义。
10.根据权利要求9所述的装置,其中T等于32,其中指示最后有效系数的所述位置的所述值等于8,且其中所述第一二进制串的位长度是7。
11.根据权利要求8所述的装置,其中为编码所述第一二进制串和所述第二二进制串,所述视频编码器经配置以编码所述第一二进制串,随后编码所述第二二进制串。
12.根据权利要求8所述的装置,其中为编码所述第一二进制串和所述第二二进制串,所述视频编码器经配置以使用上下文自适应二进制算术译码CABAC过程编码所述第一二进制串和所述第二二进制串,所述CABAC过程包括基于上下文模型编码所述第一二进制串且绕过编码所述第二二进制串。
13.根据权利要求12所述的装置,其中为绕过编码所述第二二进制串,所述视频编码器经配置以使用相等概率状态编码所述第二二进制串的二进制。
14.根据权利要求8所述的装置,其中指示所述最后有效系数的所述位置的所述值包括指示所述最后有效系数的x位置的值或指示所述最后有效系数的y位置的值中的一个。
15.一种用于编码视频数据的装置,所述装置包括:
用于获得指示最后有效系数在大小为T的视频块内的位置的值的装置;
用于基于通过最大位长度定义的截断一元译码方案确定指示所述最后有效系数的所述位置的所述值的第一二进制串的装置,所述最大位长度通过2log2(T)-1来定义;
用于基于固定长度译码方案来确定指示所述最后有效系数的所述位置的所述值的第二二进制串的装置,所述固定长度译码方案包含用于基于经确定的所述第一二进制串的值来确定所述第二二进制串的最大长度的装置;以及
用于将所述第一二进制串和所述第二二进制串编码至位流的装置。
16.根据权利要求15所述的装置,其中所述固定长度译码方案通过最大位长度来定义,所述最大位长度通过log2(T)-2来定义。
17.根据权利要求16所述的装置,其中T等于32,其中指示最后有效系数的所述位置的所述值等于8,且其中所述第一二进制串的位长度是7。
18.根据权利要求15所述的装置,其中用于编码的所述装置包括用于编码所述第一二进制串,随后编码所述第二二进制串的装置。
19.根据权利要求15所述的装置,其中用于编码所述第一二进制串和所述第二二进制串的所述装置包括使用上下文自适应二进制算术译码CABAC过程编码所述第一二进制串和所述第二二进制串,所述CABAC过程包括基于上下文模型编码所述第一二进制串且绕过编码所述第二二进制串。
20.根据权利要求19所述的装置,其中用于编码的所述装置包括用于使用相等概率状态绕过编码所述第二二进制串的二进制的装置。
21.根据权利要求15所述的装置,其中指示所述最后有效系数的所述位置的所述值包括指示所述最后有效系数的x位置的值或指示所述最后有效系数的y位置的值中的一个。
22.一种包括存储于其上的指令的非暂时性计算机可读存储媒体,所述指令在执行时,使得一或多个处理器:
获得指示最后有效系数在大小为T的视频块内的位置的值;
基于通过最大位长度定义的截断一元译码方案确定指示所述最后有效系数的所述位置的所述值的第一二进制串,所述最大位长度通过2log2(T)-1来定义;
基于固定长度译码方案来确定指示所述最后有效系数的所述位置的所述值的第二二进制串,所述固定长度译码方案包含基于经确定的所述第一二进制串的值来确定所述第二二进制串的最大长度;以及
将所述第一二进制串和所述第二二进制串编码至位流。
23.根据权利要求22所述的非暂时性计算机可读存储媒体,其中所述固定长度译码方案通过最大位长度来定义,所述最大位长度通过log2(T)-2来定义。
24.根据权利要求23所述的非暂时性计算机可读存储媒体,其中T等于32,其中指示最后有效系数的所述位置的所述值等于8,且其中所述第一二进制串的位长度是7。
25.根据权利要求22所述的非暂时性计算机可读存储媒体,其中为编码所述第一二进制串和所述第二二进制串,所述指令使得所述一或多个处理器编码所述第一二进制串,随后编码所述第二二进制串。
26.根据权利要求22所述的非暂时性计算机可读存储媒体,其中为编码所述第一二进制串和所述第二二进制串,所述指令使得所述一或多个处理器使用上下文自适应二进制算术译码CABAC过程编码所述第一二进制串和所述第二二进制串,所述CABAC过程包括基于上下文模型编码所述第一二进制串且绕过编码所述第二二进制串。
27.根据权利要求26所述的非暂时性计算机可读存储媒体,其中为绕过编码所述第二二进制串,所述指令使得所述一或多个处理器使用相等概率状态编码所述第二二进制串的二进制。
28.根据权利要求22所述的非暂时性计算机可读存储媒体,其中指示所述最后有效系数的所述位置的所述值包括指示所述最后有效系数的x位置的值或指示所述最后有效系数的y位置的值中的一个。
29.一种用于解码视频数据的方法,其包括:
从已编码位流获得第一二进制串和第二二进制串;
部分基于所述第一二进制串确定指示最后有效系数在大小为T的视频块内的位置的值,其中所述第一二进制串通过最大位长度由2log2(T)-1定义的截断一元译码方案来定义;以及
部分基于所述第二二进制串确定指示所述最后有效系数的所述位置的所述值,其中所述第二二进制串通过固定长度译码方案来定义,所述固定长度译码方案包含基于经确定的所述第一二进制串的值来确定所述第二二进制串的最大长度。
30.根据权利要求29所述的方法,其中所述固定长度译码方案通过最大位长度来定义,所述最大位长度通过log2(T)-2来定义。
31.根据权利要求30所述的方法,其中T等于32,其中指示最后有效系数的所述位置的所述值等于8,且其中所述第一二进制串的位长度是7。
32.根据权利要求29所述的方法,其中获得所述第一二进制串和所述第二二进制串包括解码所述第一二进制串,随后解码所述第二二进制串。
33.根据权利要求29所述的方法,其中获得所述第一二进制串和所述第二二进制串包括使用上下文自适应二进制算术译码CABAC过程解码所述第一二进制串和所述第二二进制串,所述CABAC过程包括基于上下文模型解码所述第一二进制串且绕过解码所述第二二进制串。
34.根据权利要求33所述的方法,其中绕过解码所述第二二进制串包括使用相等概率状态解码所述第二二进制串的二进制。
35.根据权利要求29所述的方法,其中指示所述最后有效系数的所述位置的所述值包括指示所述最后有效系数的x位置的值或指示所述最后有效系数的y位置的值中的一个。
36.一种用于解码视频数据的装置,所述装置包括:
存储器,其经配置以存储已编码位流的第一二进制串和第二二进制串;以及
视频解码器,其经配置以:
从所述已编码位流获得所述第一二进制串和所述第二二进制串;
部分基于所述第一二进制串确定指示最后有效系数在大小为T的视频块内的位置的值,其中所述第一二进制串通过最大位长度由2log2(T)-1定义的截断一元译码方案来定义;以及
部分基于所述第二二进制串确定指示所述最后有效系数的所述位置的所述值,其中所述第二二进制串通过固定长度译码方案来定义,所述固定长度译码方案包含基于经确定的所述第一二进制串的值来确定所述第二二进制串的最大长度。
37.根据权利要求36所述的装置,其中所述固定长度译码方案通过最大位长度来定义,所述最大位长度通过log2(T)-2来定义。
38.根据权利要求37所述的装置,其中T等于32,其中指示最后有效系数的所述位置的所述值等于8,且其中所述第一二进制串的位长度是7。
39.根据权利要求36所述的装置,其中为获得所述第一二进制串和所述第二二进制串,所述视频解码器经配置以解码所述第一二进制串,随后解码所述第二二进制串。
40.根据权利要求36所述的装置,其中为获得所述第一二进制串和所述第二二进制串,所述视频解码器经配置以使用上下文自适应二进制算术译码CABAC过程解码所述第一二进制串和所述第二二进制串,所述CABAC过程包括基于上下文模型解码所述第一二进制串且绕过解码所述第二二进制串。
41.根据权利要求40所述的装置,其中为绕过解码所述第二二进制串,所述视频解码器经配置以使用相等概率状态解码所述第二二进制串的二进制。
42.根据权利要求36所述的装置,其中指示所述最后有效系数的所述位置的所述值包括指示所述最后有效系数的x位置的值或指示所述最后有效系数的y位置的值中的一个。
43.一种用于解码视频数据的装置,所述装置包括:
用于从已编码位流获得第一二进制串和第二二进制串的装置;
用于部分基于所述第一二进制串确定指示最后有效系数在大小为T的视频块内的位置的值的装置,其中所述第一二进制串通过最大位长度由2log2(T)-1定义的截断一元译码方案来定义;以及
用于部分基于所述第二二进制串确定指示所述最后有效系数的所述位置的所述值的装置,其中所述第二二进制串通过固定长度译码方案来定义,所述固定长度译码方案包含基于经确定的所述第一二进制串的值来确定所述第二二进制串的最大长度。
44.根据权利要求43所述的装置,其中所述固定长度译码方案通过最大位长度来定义,所述最大位长度通过log2(T)-2来定义。
45.根据权利要求44所述的装置,其中T等于32,其中指示最后有效系数的所述位置的所述值等于8,且其中所述第一二进制串的位长度是7。
46.根据权利要求43所述的装置,其中用于获得所述第一二进制串和所述第二二进制串的所述装置包括用于解码所述第一二进制串,随后解码所述第二二进制串的装置。
47.根据权利要求43所述的装置,其中用于获得所述第一二进制串和所述第二二进制串的所述装置包括使用上下文自适应二进制算术译码CABAC过程解码所述第一二进制串和所述第二二进制串,所述CABAC过程包括基于上下文模型解码所述第一二进制串且绕过解码所述第二二进制串。
48.根据权利要求47所述的装置,其中用于解码的所述装置包括绕过使用相等概率状态解码所述第二二进制串的二进制的装置。
49.根据权利要求43所述的装置,其中指示所述最后有效系数的所述位置的所述值包括指示所述最后有效系数的x位置的值或指示所述最后有效系数的y位置的值中的一个。
50.一种包括存储于其上的指令的非暂时性计算机可读存储媒体,所述指令在执行时,使得一或多个处理器:
从已编码位流获得第一二进制串和第二二进制串;
部分基于所述第一二进制串确定指示最后有效系数在大小为T的视频块内的位置的值,其中所述第一二进制串通过最大位长度由2log2(T)-1定义的截断一元译码方案来定义;以及
部分基于所述第二二进制串确定指示所述最后有效系数的所述位置的所述值,其中所述第二二进制串通过固定长度译码方案来定义,所述固定长度译码方案包含基于经确定的所述第一二进制串的值来确定所述第二二进制串的最大长度。
51.根据权利要求50所述的非暂时性计算机可读存储媒体,其中所述固定长度译码方案通过最大位长度来定义,所述最大位长度通过log2(T)-2来定义。
52.根据权利要求51所述的非暂时性计算机可读存储媒体,其中T等于32,其中指示最后有效系数的所述位置的所述值等于8,且其中所述第一二进制串的位长度是7。
53.根据权利要求50所述的非暂时性计算机可读存储媒体,其中为获得所述第一二进制串和所述第二二进制串,所述指令使得所述一或多个处理器解码所述第一二进制串,随后解码所述第二二进制串。
54.根据权利要求50所述的非暂时性计算机可读存储媒体,其中为获得所述第一二进制串和所述第二二进制串,所述指令使得所述一或多个处理器使用上下文自适应二进制算术译码CABAC过程解码所述第一二进制串和所述第二二进制串,所述CABAC过程包括基于上下文模型解码所述第一二进制串且绕过解码所述第二二进制串。
55.根据权利要求54所述的非暂时性计算机可读存储媒体,其中为绕过解码所述第二二进制串,所述指令使得所述一或多个处理器使用相等概率状态解码所述第二二进制串的二进制。
56.根据权利要求50所述的非暂时性计算机可读存储媒体,其中指示所述最后有效系数的所述位置的所述值包括指示所述最后有效系数的x位置的值或指示所述最后有效系数的y位置的值中的一个。
CN201810438564.1A 2011-11-08 2012-11-06 最后有效系数的位置的渐进式译码 Active CN108307195B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201161557317P 2011-11-08 2011-11-08
US61/557,317 2011-11-08
US201161561909P 2011-11-20 2011-11-20
US61/561,909 2011-11-20
US13/669,032 2012-11-05
US13/669,032 US9154792B2 (en) 2011-11-08 2012-11-05 Progressive coding of position of last significant coefficient
CN201280054978.5A CN104025603B (zh) 2011-11-08 2012-11-06 最后有效系数的位置的渐进式译码

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201280054978.5A Division CN104025603B (zh) 2011-11-08 2012-11-06 最后有效系数的位置的渐进式译码

Publications (2)

Publication Number Publication Date
CN108307195A CN108307195A (zh) 2018-07-20
CN108307195B true CN108307195B (zh) 2020-09-29

Family

ID=48223700

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201280054978.5A Active CN104025603B (zh) 2011-11-08 2012-11-06 最后有效系数的位置的渐进式译码
CN201810438564.1A Active CN108307195B (zh) 2011-11-08 2012-11-06 最后有效系数的位置的渐进式译码

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201280054978.5A Active CN104025603B (zh) 2011-11-08 2012-11-06 最后有效系数的位置的渐进式译码

Country Status (17)

Country Link
US (1) US9154792B2 (zh)
EP (2) EP3514970B1 (zh)
JP (1) JP5855759B2 (zh)
KR (1) KR101650640B1 (zh)
CN (2) CN104025603B (zh)
AU (1) AU2012336017B2 (zh)
BR (1) BR112014011058B1 (zh)
CA (1) CA2854509C (zh)
ES (1) ES2717679T3 (zh)
HK (1) HK1251107A1 (zh)
IL (1) IL232332A (zh)
IN (1) IN2014CN03426A (zh)
MY (1) MY176686A (zh)
PH (1) PH12014501036A1 (zh)
RU (1) RU2595892C2 (zh)
SG (1) SG11201401612XA (zh)
WO (1) WO2013070604A1 (zh)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3021591A1 (en) * 2011-06-28 2016-05-18 Samsung Electronics Co., Ltd. Apparatus for decoding video accompanied with context-based arithmetic decoding
EP2774360B1 (en) 2011-11-04 2017-08-02 Huawei Technologies Co., Ltd. Differential pulse code modulation intra prediction for high efficiency video coding
US9357185B2 (en) 2011-11-08 2016-05-31 Qualcomm Incorporated Context optimization for last significant coefficient position coding
TWI613907B (zh) * 2011-11-08 2018-02-01 三星電子股份有限公司 用於解碼視訊的方法
US10284851B2 (en) 2012-01-21 2019-05-07 Google Technology Holdings LLC Method of determining binary codewords for transform coefficients
US9565435B2 (en) * 2012-02-04 2017-02-07 Google Technology Holdings LLC Devices and methods for context reduction in last significant coefficient position coding
WO2013175736A1 (ja) * 2012-05-25 2013-11-28 パナソニック株式会社 動画像符号化方法、動画像符号化装置、動画像復号方法、動画像復号装置、および、動画像符号化復号装置
CN103650511B (zh) 2012-05-25 2017-12-15 太阳专利托管公司 运动图像解码方法及运动图像解码装置
CA3217710A1 (en) 2012-05-25 2013-11-28 Sun Patent Trust Image encoding and decoding using context adaptive binary arithmetic coding with a bypass mode
KR102060617B1 (ko) 2012-06-04 2019-12-30 선 페이턴트 트러스트 동화상 부호화 방법, 동화상 부호화 장치, 동화상 복호 방법, 및, 동화상 복호 장치
US20160050426A1 (en) * 2013-01-04 2016-02-18 Samsung Electronics Co., Ltd. Lossless-coding-mode video encoding method and device, and decoding method and device
GB2513111A (en) * 2013-04-08 2014-10-22 Sony Corp Data encoding and decoding
GB2521828A (en) * 2013-12-23 2015-07-08 Sony Corp Data encoding and decoding
US9716884B2 (en) * 2014-03-20 2017-07-25 Hfi Innovation Inc. Method of signaling for mode selection in 3D and multi-view video coding
US10469870B2 (en) 2014-09-26 2019-11-05 Kt Corporation Method and apparatus for predicting and restoring a video signal using palette entry
KR102470832B1 (ko) 2014-10-20 2022-11-28 주식회사 케이티 비디오 신호 처리 방법 및 장치
KR102332999B1 (ko) * 2015-01-15 2021-12-01 한국전자통신연구원 고속 율-왜곡 최적화 기반 양자화 방법 및 장치
CN107211143B (zh) 2015-01-15 2020-08-18 株式会社Kt 用于处理视频信号的方法和设备
US9781424B2 (en) 2015-01-19 2017-10-03 Google Inc. Efficient context handling in arithmetic coding
CN107211153B (zh) 2015-01-29 2020-10-02 株式会社Kt 用于处理视频信号的方法和设备
KR102422484B1 (ko) 2015-01-29 2022-07-20 주식회사 케이티 비디오 신호 처리 방법 및 장치
EP3282706A4 (en) 2015-04-02 2019-01-30 KT Corporation METHOD AND APPARATUS FOR PROCESSING VIDEO SIGNAL
US10110931B2 (en) * 2016-04-27 2018-10-23 Aspeed Technology Inc. Variable length coding and decoding methods and devices for grouped pixels
TWI610559B (zh) * 2016-10-27 2018-01-01 Chunghwa Telecom Co Ltd 最佳化視訊轉碼的方法與裝置
TW201824861A (zh) * 2016-12-23 2018-07-01 晨星半導體股份有限公司 二元編碼運算裝置以及方法
US10459843B2 (en) * 2016-12-30 2019-10-29 Texas Instruments Incorporated Streaming engine with separately selectable element and group duplication
KR101955096B1 (ko) 2017-06-26 2019-03-06 임광민 매우 간단하고 효율적인 리튬 비스(플루오로술포닐)이미드의 새로운 제조방법
US10523968B2 (en) 2017-09-18 2019-12-31 Google Llc Coding of last significant coefficient flags
CN108337514A (zh) * 2017-12-28 2018-07-27 宁波工程学院 一种加密域hevc视频数据隐藏方法
CN114374839B (zh) * 2018-11-12 2023-06-20 Lg电子株式会社 图像解码方法、图像编码方法和数据发送方法
US11218735B2 (en) * 2019-04-02 2022-01-04 Qualcomm Incorporated Context derivation for last position coding for video coding
US11336893B2 (en) * 2020-01-07 2022-05-17 Qualcomm Incorporated Context derivation and entropy coding initialization parameters for coordinates of last position coding in video coding

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1719903A (zh) * 2005-06-24 2006-01-11 清华大学 用于图象算术编码中的一种二值化和概率模型选择方法
CN101946515A (zh) * 2008-02-21 2011-01-12 高通股份有限公司 Cabac译码器的二回合量化
CN101951516A (zh) * 2010-09-25 2011-01-19 清华大学 基于h.264/avc中cabac的并行编码实现电路及编码方法
WO2011128303A2 (en) * 2010-04-13 2011-10-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coding of significance maps and transform coefficient blocks

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6757437B1 (en) * 1994-09-21 2004-06-29 Ricoh Co., Ltd. Compression/decompression using reversible embedded wavelets
EP1404133A4 (en) * 2001-06-29 2010-04-21 Ntt Docomo Inc IMAGE ENCODER, IMAGE DECODER, IMAGE ENCODING METHOD, AND IMAGE DECODING METHOD
PT1467491E (pt) 2002-05-02 2007-03-30 Fraunhofer Ges Forschung Codificação aritmética de coeficientes de transformação
US6900748B2 (en) * 2003-07-17 2005-05-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for binarization and arithmetic coding of a data value
KR100612015B1 (ko) 2004-07-22 2006-08-11 삼성전자주식회사 컨텍스트 적응형 이진 산술 부호화 방법 및 그 장치
DE102004049156B4 (de) 2004-10-08 2006-07-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codierschema für einen ein zeitlich veränderliches Graphikmodell darstellenden Datenstrom
US7245241B2 (en) * 2005-11-25 2007-07-17 Microsoft Corporation Image coding with scalable context quantization
EP2765780A1 (en) 2005-12-05 2014-08-13 Huawei Technologies Co., Ltd. Binarizing method and device thereof
US8275045B2 (en) * 2006-07-12 2012-09-25 Qualcomm Incorporated Video compression using adaptive variable length codes
US20100040136A1 (en) 2008-08-13 2010-02-18 Horizon Semiconductors Ltd. Method for performing binarization using a lookup table
WO2011128268A1 (en) 2010-04-13 2011-10-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Probability interval partioning encoder and decoder
WO2011142817A1 (en) 2010-05-12 2011-11-17 Thomson Licensing Methods and apparatus for unified significance map coding
KR101733794B1 (ko) * 2010-07-09 2017-05-10 삼성전자주식회사 변환 계수의 엔트로피 부호화/복호화 방법 및 장치
US9591320B2 (en) 2010-07-15 2017-03-07 Texas Instruments Incorporated Context and bypass encoding video
US9641846B2 (en) 2010-10-22 2017-05-02 Qualcomm Incorporated Adaptive scanning of transform coefficients for video coding
US8861599B2 (en) 2011-03-08 2014-10-14 Sony Corporation Context reduction for last transform position coding
US8446301B2 (en) 2011-04-15 2013-05-21 Research In Motion Limited Methods and devices for coding and decoding the position of the last significant coefficient
US20130003858A1 (en) 2011-06-30 2013-01-03 Vivienne Sze Simplified Context Selection For Entropy Coding of Transform Coefficient Syntax Elements
WO2013017092A1 (en) 2011-08-04 2013-02-07 Mediatek Inc. Method and apparatus for reordered binarization of syntax elements in cabac
US8964849B2 (en) 2011-11-01 2015-02-24 Blackberry Limited Multi-level significance maps for encoding and decoding
TWI613907B (zh) * 2011-11-08 2018-02-01 三星電子股份有限公司 用於解碼視訊的方法
US9357185B2 (en) 2011-11-08 2016-05-31 Qualcomm Incorporated Context optimization for last significant coefficient position coding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1719903A (zh) * 2005-06-24 2006-01-11 清华大学 用于图象算术编码中的一种二值化和概率模型选择方法
CN101946515A (zh) * 2008-02-21 2011-01-12 高通股份有限公司 Cabac译码器的二回合量化
WO2011128303A2 (en) * 2010-04-13 2011-10-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coding of significance maps and transform coefficient blocks
CN101951516A (zh) * 2010-09-25 2011-01-19 清华大学 基于h.264/avc中cabac的并行编码实现电路及编码方法

Also Published As

Publication number Publication date
MY176686A (en) 2020-08-19
CA2854509C (en) 2017-08-29
JP2015502079A (ja) 2015-01-19
JP5855759B2 (ja) 2016-02-09
CN104025603B (zh) 2018-06-01
CN104025603A (zh) 2014-09-03
BR112014011058A8 (pt) 2017-06-20
EP2777261A1 (en) 2014-09-17
IN2014CN03426A (zh) 2015-10-09
IL232332A (en) 2017-08-31
IL232332A0 (en) 2014-06-30
HK1251107A1 (zh) 2019-01-18
PH12014501036B1 (en) 2014-08-04
PH12014501036A1 (en) 2014-08-04
EP3514970B1 (en) 2020-09-09
EP3514970A1 (en) 2019-07-24
CA2854509A1 (en) 2013-05-16
RU2014123378A (ru) 2015-12-20
BR112014011058A2 (pt) 2017-06-13
KR101650640B1 (ko) 2016-08-23
CN108307195A (zh) 2018-07-20
US9154792B2 (en) 2015-10-06
AU2012336017A1 (en) 2014-05-22
ES2717679T3 (es) 2019-06-24
RU2595892C2 (ru) 2016-08-27
SG11201401612XA (en) 2014-06-27
AU2012336017B2 (en) 2016-05-12
WO2013070604A1 (en) 2013-05-16
BR112014011058B1 (pt) 2022-05-10
EP2777261B1 (en) 2019-01-09
KR20140098121A (ko) 2014-08-07
US20130114738A1 (en) 2013-05-09

Similar Documents

Publication Publication Date Title
CN108307195B (zh) 最后有效系数的位置的渐进式译码
US9357185B2 (en) Context optimization for last significant coefficient position coding
US9264706B2 (en) Bypass bins for reference index coding in video coding
US9538175B2 (en) Context derivation for context-adaptive, multi-level significance coding
US9621894B2 (en) Determining contexts for coding transform coefficient data in video coding
JP6527877B2 (ja) ビデオコーディングプロセスにおける係数レベルコーディング
US9338451B2 (en) Common spatial candidate blocks for parallel motion estimation
US9392301B2 (en) Context adaptive entropy coding for non-square blocks in video coding
US9826238B2 (en) Signaling syntax elements for transform coefficients for sub-sets of a leaf-level coding unit
US20130272423A1 (en) Transform coefficient coding
EP3745724A1 (en) Progressive coding of position of last significant coefficient
US20130114675A1 (en) Context state and probability initialization for context adaptive entropy coding
US20120014433A1 (en) Entropy coding of bins across bin groups using variable length codewords
US20130272390A1 (en) Uniform granularity for quantization matrix in video coding
US20130003859A1 (en) Transition between run and level coding modes
US20130114691A1 (en) Adaptive initialization for context adaptive entropy coding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1251107

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20211009

Address after: California, USA

Patentee after: QUALCOMM Inc.

Address before: Ai Erlandubailin

Patentee before: Willow Media International Ltd.