CN104205830B - 用于在视频译码中的参考索引译码的旁路二进制位的方法、设备及装置 - Google Patents
用于在视频译码中的参考索引译码的旁路二进制位的方法、设备及装置 Download PDFInfo
- Publication number
- CN104205830B CN104205830B CN201380019062.0A CN201380019062A CN104205830B CN 104205830 B CN104205830 B CN 104205830B CN 201380019062 A CN201380019062 A CN 201380019062A CN 104205830 B CN104205830 B CN 104205830B
- Authority
- CN
- China
- Prior art keywords
- decoding
- reference picture
- index value
- picture index
- binary digit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
在实例中,本发明的方面涉及一种用于在视频解码过程中解码参考索引语法元素的方法,其包含通过上下文自适应性二进制算术译码CABAC过程的上下文译码模式解码参考索引值的至少一个二进制位。所述方法也包含:当所述参考索引值包括多于通过所述上下文译码模式所译码的所述至少一个二进制位的二进制位时,通过所述CABAC过程的旁路译码模式解码所述参考索引值的至少另一二进制位;以及二进制化所述参考索引值。
Description
本发明主张以下临时申请案的权利:2012年4月11日申请的美国临时申请案第61/623,043号,2012年4月23日申请的美国临时申请案第61/637,218号、2012年4月30日申请的美国临时申请案第61/640,568号、2012年5月15日申请的美国临时申请案第61/647,422号和2012年6月27日申请的美国临时申请案第61/665,151号,所述临时申请案中的每一者的全部内容特此以引用的方式并入。
技术领域
本发明涉及视频译码,且更明确地说,涉及用于在视频译码过程中译码语法元素的技术。
背景技术
数字视频能力可并入到广泛范围的装置中,所述装置包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、数码相机、数码记录装置、数码媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频电话会议装置和类似者。数字视频装置实施视频压缩技术,例如在由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分(先进视频译码(AVC))、目前在开发过程中的高效率视频译码(HEVC)标准所定义的标准和这些标准的扩展中所述的视频压缩技术,以更有效地发射、接收和存储数字视频信息。
视频压缩技术包含空间预测和/或时间预测,以减少或去除视频序列中固有的冗余。针对基于块的视频译码,可将视频帧或切片分割为多个块。视频帧可替代地被称作图片。可进一步分割每一块。经帧内译码(I)图片或切片中的块涉及同一图片或切片中的相邻块中的参考样本使用空间预测来编码。经帧间译码(P或B)图片或切片中的块可关于同一图片或切片中的相邻块中的参考样本使用空间预测,或关于其它参考图片中的参考样本使用时间预测。空间或时间预测针对待译码的块产生预测性块。残余数据表示在待译码的原始块与预测性块之间的像素差。
经帧间译码块是根据指向形成预测性块的参考样本的块的运动向量和指示在经译 码块与预测性块之间的差的残余数据而编码。经帧内译码块是根据帧内译码模式和残余数据而编码。为进行进一步压缩,可将残余数据从像素域变换到变换域,从而产生接着可被量化的残余变换系数。可以特定次序扫描最初以二维阵列布置的经量化变换系数,以产生变换系数的一维向量以供熵译码。熵译码也可应用于在视频译码过程中所使用的多种其它语法元素。
发明内容
本发明的技术大体涉及熵译码视频数据。例如,当执行上下文自适应性译码时,视频译码器可使用概率估计译码数据的每一位或“二进制位(bin)”,所述概率估计可指示二进制位具有给定二进制值的可能性。概率估计可包含于概率模型内,所述概率模型也被称作“上下文模型”。视频译码器可通过确定所述二进制位的上下文而选择上下文模型。二进制位的上下文可包含先前译码的语法元素的相关二进制位的值。在译码二进制位之后,视频译码器可基于二进制位的值更新上下文模型,以反映最近的概率估计。与应用上下文译码模式相对比,视频译码器可应用旁路译码模式。例如,视频译码器可使用旁路模式,以绕过或省略常规算术译码过程。在这些例子中,视频译码器可使用固定概率模型(即,不在译码期间更新)来旁路译码所述二进制位。
本发明的技术涉及有效率地上下文译码与经帧间译码的视频数据相关联的语法元素。例如,本发明的方面涉及有效率地译码参考索引值、运动向量预测子、运动向量差值和类似者。在一些例子中,视频译码器可针对语法元素的一些二进制位执行上下文译码,且针对语法元素的其它二进制位执行旁路译码。例如,视频译码器可上下文译码参考索引值的一或多个二进制位,且旁路译码参考索引值的一或多个其它二进制位。
在实例中,本发明的方面涉及一种用于在视频编码过程中编码参考索引语法元素的方法,其包含:二进制化参考索引值;通过上下文自适应性二进制算术译码(CABAC)过程的上下文译码模式编码所述经二进制化的参考索引值的至少一个二进制位;以及当所述经二进制化的参考索引值包括多于通过所述上下文译码模式所译码的所述至少一个二进制位的二进制位时,通过所述CABAC过程的旁路译码模式编码所述经二进制化的参考索引值的至少另一二进制位。
在另一实例中,本发明的方面涉及一种用于在视频编码过程中编码参考索引语法元素的设备,其包含一或多个处理器以:二进制化参考索引值;通过上下文自适应性二进制算术译码(CABAC)过程的上下文译码模式编码所述经二进制化的参考索引值的至少一个二进制位;以及当所述经二进制化的参考索引值包括多于通过所述上下文译码模式 所译码的所述至少一个二进制位的二进制位时,通过所述CABAC过程的旁路译码模式编码所述经二进制化的参考索引值的至少另一二进制位。
在另一实例中,本发明的方面涉及一种用于在视频编码过程中编码参考索引语法元素的设备,其包含:用于二进制化参考索引值的装置;用于通过上下文自适应性二进制算术译码(CABAC)过程的上下文译码模式编码所述经二进制化的参考索引值的至少一个二进制位的装置;以及用于在所述经二进制化的参考索引值包括多于通过所述上下文译码模式所译码的所述至少一个二进制位的二进制位时通过所述CABAC过程的旁路译码模式编码所述经二进制化的参考索引值的至少另一二进制位的装置。
在另一实例中,本发明的方面涉及一种用于在视频解码过程中解码参考索引语法元素的方法,其包含:通过上下文自适应性二进制算术译码(CABAC)过程的上下文译码模式解码一参考索引值的至少一个二进制位;当所述参考索引值包括多于通过所述上下文译码模式所译码的所述至少一个二进制位的二进制位时,通过所述CABAC过程的旁路译码模式解码所述参考索引值的至少另一二进制位;以及二进制化所述参考索引值。
在另一实例中,本发明的方面涉及一种用于在视频解码过程中解码参考索引语法元素的设备,其包含经配置以进行以下操作的一或多个处理器:通过上下文自适应性二进制算术译码(CABAC)过程的上下文译码模式解码参考索引值的至少一个二进制位;当所述参考索引值包括多于通过所述上下文译码模式所译码的所述至少一个二进制位的二进制位时,通过所述CABAC过程的旁路译码模式解码所述参考索引值的至少另一二进制位;以及二进制化所述参考索引值。
在另一实例中,本发明的方面涉及一种非暂时性计算机可读媒体,其上存储有指令,所述指令在被执行时使一或多个处理器:通过上下文自适应性二进制算术译码(CABAC)过程的上下文译码模式解码参考索引值的至少一个二进制位;当所述参考索引值包括多于通过所述上下文译码模式所译码的所述至少一个二进制位的二进制位时,通过所述CABAC过程的旁路译码模式解码所述参考索引值的至少另一二进制位;以及二进制化所述参考索引值。
在随附图式和以下描述中阐述一或多个实例的细节。其它特征、目标和优点将从所述描述和所述图式以及从权利要求书显而易见。
附图说明
图1为说明实例视频编码和解码系统的框图。
图2为说明实例视频编码器的框图。
图3为说明实例视频解码器的框图。
图4为说明实例算术译码过程的框图。
图5A为说明预测数据的实例字串的框图。
图5B为说明预测数据的另一实例字串的框图。
图6为说明预测数据的另一实例字串的框图。
图7为说明预测数据的另一实例字串的框图。
图8A为说明上下文译码具有三个可能值的帧间预测方向语法元素的框图。
图8B为说明根据本发明的方面的旁路译码帧间预测方向语法元素的框图。
图9为说明根据本发明的方面的熵编码参考索引值的实例的流程图。
图10为说明根据本发明的方面的熵解码参考索引值的实例的流程图。
图11为说明根据本发明的方面的熵编码预测数据的实例的流程图。
图12为说明根据本发明的方面的熵解码预测数据的实例的流程图。
具体实施方式
视频译码装置可通过利用空间冗余和时间冗余来压缩视频数据。例如,视频编码器可通过相对于相邻的先前译码块来译码块而利用空间冗余。同样,视频编码器可通过相对于先前译码图片的数据来译码块而利用时间冗余。明确地说,视频编码器可从空间相邻者的数据(被称作帧内译码)或从一或多个其它图片的数据(被称作帧间译码)预测当前块。视频编码器可接着将块的残差计算为块的实际像素值与块的所预测像素值之间的差。因此,块的残差可包含像素(或空间)域中的逐像素差值。
视频译码器可在帧间预测视频数据的块时执行运动估计和运动补偿。例如,运动估计是在视频编码器处执行,且包含计算一或多个运动向量。运动向量可指示当前图片中的视频数据的块相对于参考图片的参考样本的位移。参考样本可为就像素差来说被发现紧密匹配待译码的块的块,所述像素差可通过绝对差总和(SAD)、平方差总和(SSD)或其它差度量来确定。参考样本可出现在参考图片或参考切片内的任何位置,且未必出现在参考图片或切片的块边界处。在一些实例中,参考样本可出现在分数像素位置处。
定义运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量所指向的参考图片和/或运动向量的参考图片列表(例如,列表0(L0)、列表1(L1)或组合式列表(LC)),例如,如通过预测方向所指示。参考索引(ref_idx)可识别运动向量所指向的在参考图片列表中的特定图片。以此方式,ref_idx语法元素用作到参考图片列表(例如,L0、L1或 LC)中的索引。
在识别出参考块后,原始视频数据块与参考块之间的差即得以确定。此差可被称作预测残余数据,且指示在待译码的块中的像素值与经选择以表示经译码块的参考块中的像素值之间的像素差。为了达成更好的压缩,预测残余数据可(例如)使用离散余弦变换(DCT)、整数变换、卡忽南-拉维(Karhunen-Loeve,K-L)变换或另一变换来变换。为进行进一步压缩,变换系数可经量化。
熵译码器接着熵编码与视频数据的块相关联的符号或语法元素和经量化变换系数。熵译码方案的实例包含上下文自适应性可变长度译码(CAVLC)、上下文自适应性二进制算术译码(CABAC)、概率区间分割熵译码(PIPE)或类似者。在上下文译码之前,视频编码器可将正译码的每一值的绝对值转换为二进制化形式。以此方式,正译码的每一非零值可(例如)使用将值转换为具有一或多个位的码字或“二进制位”的一元译码表或其它译码方案而“二进制化”。
关于CABAC,作为实例,视频译码器可选择概率模型(也被称作上下文模型)以译码与视频数据的块相关联的符号。例如,在编码器处,可通过使用概率模型而译码目标符号。在解码器处,可通过使用概率模型而剖析目标符号。在一些例子中,可使用上下文自适应性译码与非上下文自适应性译码的组合来译码二进制位。例如,视频译码器可针对一或多个二进制位使用旁路模式来绕过或省略规则算术译码过程,而针对其它二进制位使用上下文自适应性译码。在这些实例中,视频译码器可使用固定概率模型来旁路译码所述二进制位。即,经旁路译码二进制位不包含上下文或概率更新。一般来说,如关于下文的图4更详细地描述,上下文译码二进制位可被称作使用上下文译码模式译码所述二进制位。同样,旁路译码二进制位可被称作使用旁路译码模式译码所述二进制位。
用于译码语法元素的二进制位的上下文模型可基于先前译码的相邻语法元素的相关二进制位的值。作为一个实例,用于译码当前语法元素的二进制位的上下文模型可基于先前译码的相邻语法元素(例如,在当前语法元素的上部和左侧)的相关二进制位的值。导出上下文的位置可被称作上下文支持邻域(也被称作“上下文支持”,或简称为“支持”)。例如,关于译码有效性映射(例如,指示视频数据的块中的非零变换系数的位置)的二进制位,可使用五点支持来定义上下文模型。
在一些实例中,上下文模型(Ctx)可为经应用以选择多个不同上下文中的一者的索引或位移,所述多个上下文中的每一者可对应于特定概率模型。因此,在任何状况下,通常针对每一上下文定义不同概率模型。在译码二进制位之后,基于二进制位的值进一步更新概率模型,以反映针对二进制位的最近的概率估计。例如,概率模型可维持为有限 状态机中的状态。每一特定状态可对应于特定概率值。对应于概率模型的更新的下一状态可取决于当前二进制位(例如,当前正译码的二进制位)的值。因此,概率模型的选择可受先前译码的二进制位的值的影响,这是因为所述值至少部分地指示所述二进制位具有给定值的概率。上文所述的上下文译码过程可大体被称作上下文自适应性译码模式。
上文所述的概率更新过程可延迟到译码过程中。例如,假设为上下文自适应性译码的目的,两个二进制位使用同一上下文模型(例如,ctx(0))。在此实例中,第一二进制位可使用ctx(0)来确定用于译码的概率模型。第一二进制位的值影响与ctx(0)相关联的概率模型。因此,必须在通过ctx(0)译码第二二进制位之前执行概率更新。以此方式,概率更新可将延迟引入到译码循环中。
关于视频译码,作为另一实例,视频译码器可上下文自适应性译码参考索引(ref_idx)的一连串二进制位(例如,bin(0)、bin(1)、……bin(n))。如上文所指出,参考索引(ref_idx)可识别运动向量所指向的在参考图片列表中的特定图片。单一参考索引(ref_idx)可包含(例如)多达15个二进制位。假设为解释的目的,视频译码器导出用于译码所述二进制位的三个上下文,且基于正译码的二进制位数目应用所述上下文(例如,使用上下文索引ctx(0)、ctx(1)和ctx(2)来指示)。即,在此实例中,视频译码器可使用ctx(0)来译码bin(0),使用ctx(1)来译码bin(1),和使用ctx(2)来译码剩余二进制位(例如,bin(2)到bin(n))。
在上文所述的实例中,第三上下文(ctx(2))在数个二进制位(例如,多达13个二进制位)当中共享。以此方式使用相同概率模型来译码bin(2)到bin(n)可在接连的译码循环之间产生延迟。例如,如上文所指出,重复地调用同一上下文且在每一二进制位之后等待更新模型可呈现针对译码器的输送量的瓶颈。
此外,在bin(2)与bin(n)之间的相关性可能不足以保证与更新概率模型相关联的时间和计算资源。即,上下文自适应性译码的一个可能益处为基于先前译码的二进制位调适概率模型的能力(给定同一上下文)。然而,如果第一二进制位的值与后续二进制位的值具有极小相关性或与其毫无关系,那么可能存在与概率更新相关联的极少效率增益。因此,展现低相关性的二进制位受益于上下文自适应性译码的程度可能不及具有相对较高相关性的二进制位。
本发明的方面涉及有效率地上下文译码与帧间译码的视频数据相关联的语法元素。例如,本发明的方面涉及有效地译码参考索引值、运动向量预测子、运动向量差值和类似者。在一些实例中,视频译码器可针对语法元素的一些二进制位执行上下文译码,且针对语法元素的其它二进制位执行旁路译码。
特定地参考上文所述的参考索引译码实例,根据本发明的方面,视频译码器可将ctx(0)应用于bin(0),将ctx(1)应用于bin(1),将ctx(2)应用于bin(2),且可在不需要上下文的情况下旁路译码参考索引值的剩余二进制位。换句话说,视频译码器可将ctx(2)用作用于CABAC译码经二进制化的参考索引值的bin(2)的上下文,但可旁路译码在bin(2)之后的任何二进制位。
假定参考索引值在长度上可为15个二进制位或15个二进制位以上,那么以此方式限制经上下文译码二进制位的数目可能相对于上下文译码所有参考索引二进制位产生计算和/或时间节省。此外,如上文所指出,在参考索引值的位之间的相关性可能并不高(例如,参考索引值的bin(3)的值可能并不提供关于bin(4)具有值“1”或“0”的可能性的有用指示),此减少上下文译码的益处。因此,通过上下文译码参考索引值的较少二进制位所节省的时间和计算资源的量可能在价值上超过与上下文译码参考索引值的所有二进制位相关联的译码效率增益。
本发明的其它方面大体涉及在译码期间对经上下文译码二进制位与非上下文译码二进制位进行分群。例如,如上文所指出,可使用上下文译码与旁路译码的组合来译码一些语法元素。即,一些语法元素可具有经上下文译码的一或多个二进制位和经旁路译码的一或多个其它二进制位。
假设,为实例的目的,两个语法元素各自具有经上下文译码的部分(包含一或多个经上下文译码二进制位)和经旁路译码的部分(包含一或多个经旁路译码二进制位)。在此实例中,视频译码器可译码第一语法元素的经上下文译码的部分,随后译码第一语法元素的经旁路译码的部分,随后译码第二语法元素的经上下文译码的部分,随后译码第二语法元素的经旁路译码的部分。
在上文所述的实例中,视频译码器可在上下文译码模式与旁路译码模式之间切换三次,以译码两个语法元素。例如,在第一语法元素的经上下文译码二进制位之后,在第一语法元素的经旁路译码二进制位之后,和在第二语法元素的经上下文译码二进制位之后,视频译码器在上下文译码与旁路译码之间切换。以此方式在上下文译码与旁路译码之间切换在计算上可为低效的。例如,在上下文译码与旁路译码之间切换可能消耗一或多个时钟循环。因此,针对每一元素在上下文译码与旁路译码之间切换可能引入潜时,这是归因于在上下文译码与旁路译码之间的转变。
本发明的方面包含在译码期间对经上下文译码二进制位与非上下文译码二进制位(例如,旁路二进制位)进行分群。例如,关于上文所述的实例,根据本发明的方面,视频译码器可译码第一语法元素的经上下文译码二进制位,随后译码第二语法元素的经上下文译码二进制位,随后译码第一语法元素的经旁路译码二进制位,随后译码第二语法 元素的经旁路译码二进制位。因此,视频译码器仅在上下文译码模式与旁路译码模式之间(例如,在经上下文译码二进制位与非上下文译码二进制位)之间转变单一次。
以此方式将二进制位分群可降低视频译码器在上下文译码模式与旁路译码模式之间切换的频率。因此,当译码包含经上下文译码二进制位与经旁路译码二进制位的组合的语法元素时,本发明的方面可减少潜时。在一些实例中,如关于下文的图5到图8所述,可根据本发明的技术对与预测数据相关联的二进制位进行分群。例如,如本文所述,预测数据可大体包含与帧间预测相关联的数据。例如,预测数据可包含指示参考索引值、运动向量、运动向量预测子、运动向量差值和类似者的数据。
图1为说明根据本发明的实例的可经配置以译码预测数据的实例视频编码和解码系统10的框图。如图1中所示,系统10包含源装置12,源装置12经由通信信道16将经编码视频发射到目的地装置14。经编码视频数据也可存储于存储媒体34或文件服务器36上,且可通过目的地装置14按需要存取。当存储到存储媒体或文件服务器时,视频编码器20可将经译码视频数据提供到另一装置(例如,网络接口、紧密光盘(CD)、蓝光或数字视频光盘(DVD)烧录机或压印设施装置或其它装置),以用于将经译码视频数据存储到存储媒体。同样,与视频解码器30分离的装置(例如,网络接口、CD或DVD读取器,或类似者)可从存储媒体检索经译码视频数据,且将经检索数据提供到视频解码器30。
源装置12和目的地装置14可包括广泛多种装置中的任一者,包含桌上型计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、例如所谓的智能型手机的电话手机、电视、相机、显示装置、数字媒体播放器、视频游戏控制台或类似者。在许多状况下,这些装置可经配备以用于无线通信。因此,通信信道16可包括无线信道、有线信道或适用于传输经编码视频数据的无线和有线信道的组合。类似地,文件服务器36可通过目的地装置14通过任何标准数据连接(包含因特网连接)存取。此可包含适用于存取存储于文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、缆线调制解调器等)或两者的组合。
根据本发明的实例,用于译码预测数据的技术可应用于视频译码以支持多种多媒体应用中的任一者,例如,空中电视广播、有线电视传输、卫星电视传输、流式传输视频传输(例如,经由因特网)、用于存储于数据存储媒体上的数字视频的编码、存储于数据存储媒体上的数字视频的解码或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频传输,以支持例如视频流式传输、视频播放、视频广播和/或视频电话的应用。
在图1的实例中,源装置12包含视频源18、视频编码器20、调制器/解调制器22和发射器24。在源装置12中,视频源18可包含例如视频俘获装置的源,例如,视频摄影机、含有先前俘获的视频的视频封存档、从视频内容提供者接收视频的视频馈送接口和/或用于产生计算机图形数据作为源视频的计算机图形系统,或这些源的组合。作为一个实例,如果视频源18为视频摄影机,那么源装置12和目的地装置14可形成所谓的摄影机电话或视频电话。然而,本发明中所述的技术可大体适用于视频译码,且可应用于无线和/或有线应用,或经编码视频数据存储于本机磁盘上的应用。
可由视频编码器20编码所俘获、预先俘获或计算机产生的视频。经编码视频信息可由调制解调器22根据通信标准(例如,无线通信协议)加以调制,且经由发射器24传输到目的地装置14。调制解调器22可包含各种混频器、滤波器、放大器或经设计以用于信号调制的其它组件。发射器24可包含经设计以用于传输数据的电路,包含放大器、滤波器和一或多个天线。
由视频编码器20所编码的所俘获、预先俘获或计算机产生的视频也可存储到存储媒体34或文件服务器36上,以供稍后消耗。存储媒体34可包含蓝光光盘、DVD、CD-ROM、快闪存储器或用于存储经编码视频的任何其它合适的数字存储媒体。可接着由目的地装置14存取存储于存储媒体34上的经编码视频以用于解码和播放。
文件服务器36可为能够存储经编码视频且将彼经编码视频传输到目的地装置14的任何类型的服务器。实例文件服务器包含网络服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置、本端磁盘机或能够存储经编码视频数据且将其传输到目的地装置的任何其它类型的装置。经编码视频数据从文件服务器36的传输可为流式传输、下载传输或两者的组合。文件服务器36可由目的地装置14通过任何标准数据连接(包含因特网连接)存取。此可包含适合于存取存储于文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、缆线调制解调器、乙太网络、USB等)或两者的组合。
在图1的实例中,目的地装置14包含接收器26、调制解调器28、视频解码器30和显示装置32。目的地装置14的接收器26通过信道16接收信息,且调制解调器28解调制所述信息以产生用于视频解码器30的经解调制的位流。通过信道16所传达的信息可包含通过视频编码器20产生以供视频解码器30在解码视频数据时使用的多种语法信息。此语法也可与存储于存储媒体34或文件服务器36上的经编码视频数据一起包含在内。视频编码器20和视频解码器30中的每一者可形成能够编码或解码视频数据的相应编码器-解码器(CODEC)的部分。
显示装置32可与目的地装置14集成或在目的地装置14外部。在一些实例中,目的地装置14可包含集成式显示装置,且还经配置以与外部显示装置介接。在其它实例中,目的地装置14可为显示装置。一般来说,显示装置32向用户显示经解码视频数据,且可包括多种显示装置中的任一者,例如,液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
在图1的实例中,通信信道16可包括任何无线或有线通信媒体,例如,射频(RF)频谱或一或多个物理传输线,或无线媒体与有线媒体的任何组合。通信信道16可形成例如局域网、广域网或全球网络(例如,因特网)的基于封包的网络的部分。通信信道16大体表示用于将视频数据从源装置12发射到目的地装置14的任何合适的通信媒体或不同通信媒体的集合,包含有线或无线媒体的任何合适组合。通信信道16可包含路由器、交换器、基站或可用以促进从源装置12到目的地装置14的通信的任何其它装备。
视频编码器20和视频解码器30可根据例如目前在开发中的高效率视频译码(HEVC)标准的视频压缩标准而操作,且可符合HEVC测试模型(HM)。替代地,视频编码器20和视频解码器30可根据例如ITU-T H.264标准(替代地被称作MPEG-4第10部分,先进视频译码(AVC))的其它专有或工业标准或这些标准的扩展而操作。然而,本发明的技术不限于任何特定译码标准。其它实例包含MPEG-2和ITU-T H.263。
尽管未展示于图1中,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器和解码器集成,且可包含适当的MUX-DEMUX单元或其它硬件和软件,以处置共同数据串流或单独数据串流中的音频和视频两者的编码。如果适用,那么在一些实例中,MUX-DEMUX单元可符合ITU H.223多路复用器协议,或例如用户数据报协议(UDP)的其它协议。
视频编码器20和视频解码器30各自可实施为多种合适的编码器或解码器电路中的任一者(如果适用),包含处理器(例如,一或多个微处理器、数字信号处理器(DSP)、专用处理器或处理电路)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、固定逻辑电路、离散逻辑、软件、硬件、固件或其任何组合。因此,视频编码器20和视频解码器30内的各种单元同样可通过多种这些结构元件或其组合中的任一者来实施。当所述技术部分地以软件实施时,装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中,且使用一或多个处理器在硬件中执行所述指令以执行本发明的技术。视频编码器20和视频解码器30中的每一者可包含于一或多个编码器或解码器中,其中任一者可集成为相应装置中的组合式编码器/解码器(CODEC)的部分。
本发明可大体涉及视频编码器20将某些信息“用信号发送”到例如视频解码器30的另一装置。然而,应理解,视频编码器20可通过使某些语法元素与视频数据的各种经编码部分相关联来用信号发送信息。即,视频编码器20可通过将某些语法元素存储到视频数据的各种经编码部分的标头来“用信号发送”数据。在一些状况下,可在由视频解码器30接收和解码之前编码和存储这些语法元素(例如,存储到存储装置32)。因此,术语“用信号发送”可大体指用于解码经压缩视频数据的语法或其它数据的通信,而不管此通信是实时或接近实时或在一时间跨度内发生,例如,在于编码时将语法元素存储到媒体时可能发生,所述语法元素接着可在存储到此媒体之后的任何时间由解码装置检索。
如上文所指出,JCT-VC正致力于HEVC标准的开发。HEVC标准化努力是基于视频译码装置的演化模型,其被称作HEVC测试模型(HM)。HM假定视频译码装置相对于根据(例如)ITU-T H.264/AVC的现有装置的若干额外能力。本发明通常使用术语“视频块”来指CU的译码节点。在一些特定状况下,本发明也可使用术语“视频块”来指包含一译码节点和若干PU和TU的树块(即,LCU或CU)。
视频序列通常包含一系列视频帧或图片。图片群组(GOP)一般包括一系列一或多个视频图片。GOP可在GOP的标头、图片中的一或多者的标头中或在其它位置包含语法数据,所述语法数据描述包含于GOP中的图片的数目。图片的每一切片可包含描述所述相应切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块操作,以便编码视频数据。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小,且可根据所指定的译码标准而在大小上不同。
作为实例且如上文所指出,HM支持以各种PU大小(也被称作PU类型)进行预测。假设特定CU的大小为2N×2N,那么HM支持以2N×2N或N×N的PU大小进行的帧内预测,和以2N×2N、2N×N、N×2N或N×N的对称PU大小进行的帧间预测。HM也支持以2N×nU、2N×nD、nL×2N和nR×2N的PU大小进行的帧间预测的非对称分割。在非对称分割中,CU的一个方向未分割,而另一方向分割为25%和75%。CU的对应于25%分割的部分是通过“n”继之以“U(上)”、“D(下)”、“L(左)”或“R(右)”的指示来指示。因此,例如,“2N×nU”指以顶部2N×0.5N PU和底部2N×1.5N PU水平分割的2N×2N CU。其它分割类型也为可能的。
在本发明中,“N×N”和“N乘N”可互换地用以指依据垂直维度和水平维度视频的块的像素尺寸,例如,16×16个像素或16乘16个像素。一般来说,16×16块将在垂直方向上具有16个像素(y=16),且在水平方向上将具有16个像素(x=16)。同样,N×N块一般在垂直方向上具有N个像素,且在水平方向上具有N个像素,其中N表示非负 整数值。可以行和列来布置块中的像素。此外,块无需在水平方向上与在垂直方向上具有相同数目个像素。例如,块可包括N×M个像素,其中M未必等于N。
在使用CU的PU进行帧内预测性或帧间预测性译码之后,视频编码器20可计算用于CU的TU的残余数据。PU可包括在空间域(也被称作像素域)中的像素数据,且TU可包括在将变换应用于残余视频数据之后在变换域中的系数,所述变换例如离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换。残余数据可对应于未经编码原始图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形成包含用于CU的残余数据的TU,且接着变换所述TU以产生用于CU的变换系数。
在一些实例中,如上文所指出,可根据RQT来定义TU。例如,RQT可表示对与视频数据的块相关联的残余亮度样本和残余色度样本应用转换(例如,DCT、整数转换、小波转换或一或多个其它转换)的方式。即,如上文所指出,可使用RQT将对应于CU的残余样本再分为较小单元。一般来说,RQT为CU到TU的分割的递归表示。
在对残余数据应用任何变换以产生变换系数之后,视频编码器20可执行变换系数的量化。量化一般指将变换系数量化以可能地减少用以表示所述系数的数据量从而提供进一步压缩的过程。量化过程可减小与系数中的一些或全部相关联的位深度。例如,可在量化期间将n位值降值舍位到m位值,其中n大于m。
在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化变换系数,以产生可经熵编码的串列化向量。在其它实例中,视频编码器20可执行自适应性扫描。在扫描经量化变换系数以形成一维向量之后,视频编码器20可(例如)根据上下文自适应性可变长度译码(CAVLC)、上下文自适应性二进制算术译码(CABAC)、基于语法的上下文自适应性二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法而熵编码所述一维向量。视频编码器20也可熵编码与经编码视频数据相关联的语法元素,以供视频解码器30在解码视频数据时使用。HEVC的当前版本经设计以将CABAC用于熵译码。
在一些实例中,视频编码器20可使用上下文自适应性译码与非上下文自适应性译码的组合来译码语法元素。例如,视频编码器20可通过选择对上下文操作以译码二进制位的概率模型或“上下文模型”而上下文译码二进制位。相比之下,当译码二进制位时,视频编码器20可通过绕过或省略常规算术译码过程而旁路译码二进制位。在这些实例中,视频编码器20可使用固定概率模型来旁路译码所述二进制位。
如上文所指出,与上下文译码相关联的概率模型更新过程可将延迟引入到译码过程中。例如,视频编码器20可上下文译码参考索引(ref_idx)的二进制位序列(例如,bin(0)、 bin(1)、……bin(n))。单一参考索引(ref_idx)可包含(例如)多达15个二进制位。假设为解释的目的,视频编码器20导出用于译码所述二进制位的三个上下文,且基于正译码的二进制位数目应用所述上下文(例如,使用上下文索引ctx(0)、ctx(1)和ctx(2)来指示)。即,在此实例中,视频编码器20可使用ctx(0)来译码bin(0),使用ctx(1)来译码bin(1),且使用ctx(2)来译码剩余二进制位(例如,bin(2)到bin(n))。
在上文所述的实例中,第三上下文(ctx(2))在数个二进制位(例如,多达13个二进制位)当中共享。以此方式使用同一概率模型来译码bin(2)到bin(n)可在接连的译码循环之间产生延迟。例如,重复地调用同一上下文且在每一二进制位之后等待更新模型可呈现针对译码器的输送量的瓶颈。
此外,在bin(2)与bin(n)之间的相关性可能不足以保证与更新概率模型相关联的时间和计算资源。即,上下文自适应性译码的一个可能的益处为基于先前译码的二进制位调适概率模型的能力(给定同一上下文)。然而,如果第一二进制位的值与后续二进制位的值具有极小相关性或与其毫无关系,那么可能存在与概率更新相关联的极小效率增益。因此,展现低相关性的二进制位受益于上下文自适应性译码的程度可能不及具有相对较高的相关性的二进制位。
根据本发明的方面,视频编码器20可通过以下操作而编码参考索引语法元素:通过上下文自适应性二进制算术译码(CABAC)过程译码经二进制化的参考索引值的至少一个二进制位,且通过上下文自适应性二进制算术译码(CABAC)过程的旁路译码模式译码经二进制化的参考索引值的至少另一二进制位。
在实例中,为说明的目的,视频编码器20可将ctx(0)应用于bin(0),将ctx(1)应用于bin(1),将ctx(2)应用于bin(2),且可在不需要上下文的情况下旁路译码参考索引值的剩余二进制位。换句话说,视频译码器可将ctx(2)用作用于CABAC译码的上下文经二进制化的参考索引值的bin(2),但可旁路译码在bin(2)之后的任何二进制位。
假定参考索引值在长度上可为15个二进制位或以上,以此方式限制经上下文译码的二进制位的数目可相对于上下文译码所有参考索引二进制位产生计算和/或时间节省。此外,如上文所指出,在参考索引值的位之间的相关性可能并不高(例如,参考索引值的bin(3)的值可能并不提供关于bin(4)具有值“1”或“0”的可能性的有用指示),此减少上下文译码的益处。因此,通过上下文译码参考索引值的较少二进制位所节省的时间和计算资源的量可能在价值上超过与上下文译码参考索引值的所有二进制位相关联的译码效率增益。
根据本发明的其它方面,视频编码器20可在编码期间对经上下文译码二进制位和非上下文译码二进制位进行分群。例如,如上文所指出,一些语法元素可使用上下文译码与旁路译码的组合来译码。即,一些语法元素可具有经上下文译码的一或多个二进制位,和经旁路译码的一或多个其它二进制位。
在一些实例中,视频编码器20可在上下文译码与旁路译码之间切换,以译码一连串语法元素。然而,在上下文译码与旁路译码之间切换可能消耗一或多个时钟循环。因此,针对每一元素在上下文译码与旁路译码之间切换可引入潜时,这是归因于在上下文译码与旁路译码之间的转变。
根据本发明的方面,视频编码器20可在译码期间对经上下文译码二进制位和非上下文译码二进制位(例如,旁路二进制位)进行分群。例如,视频编码器20可上下文译码与一个以上语法元素相关联的二进制位。视频编码器20可接着旁路译码与一个以上语法元素相关联的二进制位。在其它实例中,视频编码器20可在上下文译码之前执行旁路译码。在任何情况下,所述技术允许视频编码器20最小化在上下文译码与旁路译码之间的转变。因此,当译码包含经上下文译码二进制位与经旁路译码二进制位的组合的语法元素时,本发明的方面可减少潜时。
在接收到经译码视频数据后,视频解码器30可随即执行与关于视频编码器20所述的编码遍次大体上互反的解码遍次。例如,视频解码器30可接收经编码位流且解码所述位流。根据本发明的方面,例如,视频解码器30可通过以下操作而解码参考索引语法元素:通过上下文自适应性二进制算术译码(CABAC)过程译码经二进制化的参考索引值的至少一个二进制位,且通过上下文自适应性二进制算术译码(CABAC)过程的旁路译码模式译码经二进制化的参考索引值的至少另一二进制位。
根据本发明的其它方面,视频解码器30可解码具有经分群的经上下文译码二进制位和非上下文译码二进制位(例如,旁路二进制位)的位流。例如,视频解码器30可解码与一个以上语法元素相关联的经上下文译码二进制位。视频解码器30可接着解码与一个以上语法元素相关联的经旁路译码二进制位。在其它实例中,视频解码器30可在上下文译码之前执行旁路译码(取决于正解码的位流中的二进制位的布置)。在任何情况下,所述技术允许视频解码器30最小化在上下文译码与旁路译码之间的转变。因此,当译码包含经上下文译码二进制位与经旁路译码二进制位的组合的语法元素时,本发明的方面可减少潜时。
图2为说明根据本发明的实例的可使用用于译码预测数据的技术的视频编码器20的实例的框图。尽管为说明的目的在HEVC译码的情况下描述视频编码器20的方面,但本发明的技术不限于可能需要预测数据的译码的任何特定译码标准或方法。
视频编码器20可执行视频图片内的CU的帧内译码和帧间译码。帧内译码依赖于空间预测以减少或去除给定图片内的视频数据的空间冗余。帧间译码依赖于时间预测以减少或去除在视频序列的当前图片与先前译码图片之间的时间冗余。帧内模式(I模式)可指若干基于空间的视频压缩模式中的任一者。帧间模式(例如,单向预测(P模式)或双向预测(B模式))可指若干基于时间的视频压缩模式中的任一者。
如图2中所示,视频编码器20接收待编码的图片内的当前视频块。在图2的实例中,视频编码器20包含运动补偿单元44、运动估计单元42、帧内预测单元46、参考图片存储器64、求和器50、变换处理单元52、量化单元54和熵编码单元56。图2中所说明的变换处理单元52为如下单元:将实际变换或变换的组合应用于残余数据的块,且不与变换系数的块混淆,其也可被称作CU的变换单元(TU)。针对视频块重构建,视频编码器20也包含反量化单元58、反变换处理单元60和求和器62。解块滤波器(未展示于图2中)也可被包含以滤波块边界,以从经重构建视频去除块效应伪影。如果需要,那么解块滤波器将通常滤波求和器62的输出。
在编码过程期间,视频编码器20接收待译码的图片或切片。图片或切片可划分为多个视频块,例如,最大译码单元(LCU)。运动估计单元42和运动补偿单元44相对于一或多个参考图片中的一或多个块执行所接收视频块的帧间预测性译码,以提供时间压缩。帧内预测单元46可相对于与待译码的所接收视频块相同的图片或切片中的一或多个相邻块而执行所述块的帧内预测性译码,以提供空间压缩。
模式选择单元40可(例如)基于针对每一模式的错误(即,失真)结果而选择译码模式(帧内或帧间)中的一者,且将所得的帧内或帧间预测块(例如,预测单元(PU))提供到求和器50以产生残余块数据且提供到求和器62以重构建经编码块以用于参考图片中。求和器62组合所预测块与针对所述块的来自反变换处理单元60的经反量化、反变换的数据,以重构建经编码块,如下文更详细地描述。一些图片可指明为I帧,其中I帧中的所有块是在帧内预测模式下编码。在一些状况下,(例如)当通过运动估计单元42所执行的运动搜索不产生块的足够预测时,帧内预测单元46可执行前向预测图片(P帧)或双向预测图片(B帧)中的块的帧内预测编码。
运动估计单元42与运动补偿单元44可为高度集成的,但针对概念性目的而单独说明。运动估计(或运动搜索)为产生运动向量的过程,其估计视频块的运动。运动向量(例如)可指示当前图片中的预测单元相对于参考图片的参考样本的位移。运动估计单元42通过比较预测单元与存储于参考图片存储器64中的参考图片的参考样本而计算用于帧间译码图片的预测单元的运动向量。
预测性块(也被称作参考样本)为就像素差来说被发现紧密匹配待译码的块的块,所述像素差可通过绝对差总和(SAD)、平方差总和(SSD)或其它差度量来确定。在一些实例中,视频编码器20可计算存储于参考图片存储器64中的参考图片的子整数像素位置的值,参考图片存储器64也可被称作参考图片缓冲器。例如,视频编码器20可内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可执行相对于全像素位置和分数像素位置的运动搜索,且以分数像素精度输出运动向量。
运动估计单元42通过比较经帧间译码切片中的视频块的PU的位置与参考图片的预测性块的位置而计算所述PU的运动向量。因此,一般来说,运动向量的数据可包含参考图片列表、到参考图片列表中的索引(ref_idx)、水平分量和垂直分量。可从第一参考图片列表(列表0)、第二参考图片列表(列表1)或组合式参考图片列表(列表c)选择参考图片,所述列表中的每一者识别存储于参考图片存储器64中的一或多个参考图片。
运动估计单元42可产生识别参考图片的预测性块的运动向量,且将所述运动向量发送到熵编码单元56和运动补偿单元44。即,运动估计单元42可产生和发送如下运动向量数据:识别含有预测性块的参考图片列表、到参考图片列表中的识别预测性块的图片的索引和在所识别图片内定位预测性块的水平分量和垂直分量。
在一些实例中,并非发送用于当前PU的实际运动向量,而是运动估计单元42可预测运动向量以进一步减少传达运动向量所需的数据的量。在此状况下,并非编码和传达运动向量自身,而是运动估计单元42可相对于已知的(或可知的)运动向量产生运动向量差(MVD)。MVD可包含对应于已知运动向量的水平分量和垂直分量的水平分量和垂直分量。可由所谓的运动向量预测子(MVP)来定义可供MVD使用以定义当前运动向量的已知运动向量。一般来说,作为有效的MVP,用于预测的运动向量必须指向与当前正译码的运动向量相同的参考图片。
当多个运动向量预测子候选者可用(来自多个候选块)时,运动估计单元42可根据预定选择准则确定用于当前块的运动向量预测子。例如,运动估计单元42可基于编码速率和失真的分析(例如,使用速率-失真成本分析或其它译码效率分析)从候选者集合选择最准确的预测子。在其它实例中,运动估计单元42可产生运动向量预测子候选者的平均值。选择运动向量预测子的其它方法也为可能的。
在选择运动向量预测子后,运动估计单元42可随即确定运动向量预测子索引(mvp_flag),所述运动向量预测子索引(mvp_flag)可用以向视频解码器(例如,视频解码器30)通知在含有MVP候选块的参考图片列表中的何处定位MVP。运动估计单元42也可 确定当前块与所选择MVP之间的MVD(水平分量和垂直分量)。MVP索引和MVD可用以重构建运动向量。
在一些实例中,运动估计单元42可替代地实施所谓的“合并模式”,其中运动估计单元42可“合并”预测性视频块与当前视频块的运动信息(例如,运动向量、参考图片索引、预测方向,或其它信息)。因此,关于合并模式,当前视频块从另一已知的(或可知的)视频块继承运动信息。运动估计单元42可建置包含在空间和/或时间方向上的若干相邻块的合并模式候选者列表作为用于合并模式的候选者。运动估计单元42可确定索引值(例如,merge_idx),所述索引值可用以向视频解码器(例如,视频解码器30)通知在含有合并候选块的参考图片列表中的何处定位合并视频块。
作为对通过运动估计单元42和运动补偿单元44所执行的帧间预测的替代,帧内预测单元46可帧内预测所接收块。帧内预测单元46可相对于相邻的先前译码块预测所接收块,所述先前译码块例如在当前块的上方、右上方、左上方或左方的块(假设针对块的从左到右、从上到下编码次序)。可通过多种不同的帧内预测模式来配置帧内预测单元46。例如,基于正编码的CU的大小,帧内预测单元46可配置有某一数目个方向性预测模式,例如,三十四个方向性预测模式。
帧内预测单元46可通过(例如)计算针对各种帧内预测模式的错误值和选择产生最低错误值的模式而选择帧内预测模式。方向性预测模式可包含用于组合空间相邻像素的值和将所述组合值应用于PU中的一或多个像素位置的功能。一旦已计算出PU中的所有像素位置的值,帧内预测单元46即可基于在PU与待编码的所接收块之间的像素差来计算针对所述预测模式的错误值。帧内预测单元46可继续测试帧内预测模式,直到发现得到可接受的错误值的帧内预测模式为止。帧内预测单元46可接着将PU发送到求和器50。
视频编码器20通过从正译码的原始视频块减去通过运动补偿单元44或帧内预测单元46所计算的预测数据来形成残余块。求和器50表示执行此减法运算的(多个)组件。残余块可对应于像素差值的二维矩阵,其中残余块中的值的数目与对应于残余块的PU中的像素的数目相同。残余块中的值可对应于PU中与待译码的原始块中的协同定位的像素的值之间的差(即,错误)。所述差可为色度差或亮度差,此取决于经译码的块的类型。
变换处理单元52可从残余块形成一或多个变换单元(TU)。变换处理单元52从多个变换当中选择变换。可基于一或多个译码特性(例如,块大小、译码模式或类似者)选择变换。变换处理单元52接着将所选择变换应用于TU,从而产生包括变换系数的二维阵 列的视频块。
变换处理单元52可将所得变换系数发送到量化单元54。量化单元54可接着量化变换系数。熵编码单元56可接着根据扫描模式执行矩阵中的经量化变换系数的扫描。本发明将熵编码单元56描述为执行扫描。然而,应理解,在其它实例中,例如量化单元54的其它处理单元可执行扫描。
一旦变换系数扫描到一维阵列中,熵编码单元56即可将熵译码应用于系数,所述熵译码例如CAVLC、CABAC、基于语法的上下文自适应性二进制算术译码(SBAC)、概率区间分割熵(PIPE),或另一熵译码方法。
为了执行CABAC,熵编码单元56可选择上下文模型来应用于某一上下文来编码待传输的符号。所述上下文可涉及(例如)相邻值是否为非零。熵编码单元56也可熵编码语法元素(例如,表示所选择变换的信号)。
熵编码单元56可熵编码预测数据。当视频数据系帧间预测时,例如,预测数据可包含指示参考索引值、运动向量、运动向量预测子、运动向量差值和类似者的数据。即,如上文所指出,运动估计(通过运动估计单元42)确定参考图片的一或多个索引(ref_idx),和预测方向(pred_dir:前向、后向或双向)。熵编码单元56可熵编码表示运动向量(例如,运动向量的水平分量和垂直分量)、参考图片索引和预测方向的语法元素。熵编码单元56可包含到经编码视频位流中的经编码语法元素,所述经编码语法元素可接着由视频解码器(例如,视频解码器30,下文所描述)解码以用于视频解码过程中。即,可针对经帧间译码PU提供这些语法元素,以准许视频解码器30解码和再现由PU定义的视频数据。
在一些实例中,如关于下文的图4更详细地描述,熵编码单元56(或视频编码器20的另一译码单元)可在熵编码语法元素之前二进制化所述语法元素。例如,熵编码单元56可将正译码的每一语法元素的绝对值转换为二进制位形式。熵编码单元56可使用一元、截断式一元或其它译码过程来二进制化语法元素。关于参考索引值,例如,如果参考图片列表中的参考图片的最大数目为四,即,参考索引(ref_idx)具有范围从0到3的值,那么可应用表1中的以下二进制化:
表1
参考索引 | 二进制化 |
0 | 0 |
1 | 10 |
2 | 110 |
3 | 111 |
如表1中所示,取决于参考索引的值,二进制化值在一个位到三个位的范围内。
在一些实例中,熵编码单元56可使用三个不同的上下文(例如,ctx0、ctx1和ctx2)熵编码参考索引值。例如,熵编码单元56可分别使用ctx0和ctx1熵编码第一二进制位(bin0)和第二二进制位(bin1),且第三二进制位(bin2)和其它二进制位是通过上下文ctx2来译码。在此实例中,ctx2系在从bin2开始且包含bin2的所有二进制位(即,bin2和bin2之后的二进制位,例如,bin3、bin4等等)当中共享。在一些实例中,(例如)如果参考图片的最大数目大于四,那么可提供超过bin2的额外二进制位。
如上文所指出,在二进制位当中共享上下文ctx2可为低效的,这是归因于与上下文译码相关联的概率更新。根据本发明的方面,熵编码单元56可通过将ctx2专用于译码bin2且使用旁路译码模式译码在bin2之后的所有二进制位来CABAC译码参考索引值。再次,旁路译码一般包含使用固定概率译码二进制位(不需要上下文)。例如,熵编码单元56可使用哥伦布译码(Golomb coding)、指数哥伦布译码、哥伦布-莱斯译码(Golomb-Ricecoding),或绕过CABAC译码引擎的其它译码过程来旁路译码参考索引值的在bin2之后的二进制位。
在另一实例中,熵编码单元56可通过去除ctx2而上下文译码参考索引值的较少二进制位。即,根据本发明的方面,熵编码单元56可使用CABAC旁路模式编码bin2和所有稍后二进制位。在此实例中,熵编码单元56可使用上下文ctx0CABAC译码bin0,且使用上下文ctx1CABAC译码bin1,且可使用CABAC旁路模式旁路译码bin2和在bin2之后的其它二进制位。以此方式去除上下文可降低与译码参考索引值相关联的总体复杂性。
在又一实例中,熵编码单元56可通过去除ctx1和ctx2两者而译码参考索引值的较少二进制位。即,根据本发明的方面,熵编码单元56可使用CABAC旁路模式编码bin1和所有稍后二进制位,藉此进一步降低与译码参考索引值相关联的复杂性。在此实例中,熵编码单元56可使用上下文ctx0CABAC译码bin0,且可使用CABAC旁路模式旁路译码bin1、bin2和在bin2之后的其它二进制位。
本发明的其它方面大体涉及熵编码单元56二进制化参考索引值的方式。例如,如上文所指出,熵编码单元56可使用一元、截断式一元或其它译码过程二进制化参考索引值。在另一实例中,熵编码单元56可使用指数-哥伦布译码过程来二进制化参考索引值。
在一些实例中,根据本发明的方面,熵编码单元56可实施二进制化过程的组合。例如,如关于下文的图4更详细地描述,熵编码单元56可组合一元(或截断式一元)译码 过程与指数-哥伦布译码过程以二进制化参考索引值。在实例中,为说明的目的,熵编码单元56可组合具有长度(4)的截断式一元码与指数-哥伦布码(例如,0阶的指数-哥伦布码)。在此实例中,熵编码单元56可使用一元码二进制化参考索引值的第一数目个二进制位(例如,两个、三个、四个,或类似者),且可使用指数-哥伦布码二进制化参考索引的剩余二进制位。
在任何状况下,熵编码单元56可实施用于通过任何二进制化方案上下文译码参考索引值的一或多个二进制位且旁路译码参考索引值的一或多个其它二进制位的技术。例如,如上文所指出,熵编码单元56可上下文译码(例如,CABAC译码)经二进制化的语法元素的第一数目个二进制位,且旁路译码剩余二进制位。在具有长度(4)的截断式一元码与0阶的指数哥伦布码组合的上文所述的实例中,熵编码单元56可上下文译码截断式一元码之前两个二进制位(或任何其它数目个二进制位),且接着旁路译码一元码的第二部分和整个指数哥伦布码。在其它实例中,熵编码单元56可使用其它二进制化方案。例如,熵编码单元56可使用固定长度二进制码,而非在以上实例中所述的指数哥伦布码。
在一些实例中,熵编码单元56可在译码经二进制化的参考索引值之前从所述值截断或去除二进制位。另外或替代地,熵编码单元56可对使用上下文所译码的二进制位与使用旁路模式所译码的二进制位进行分群。例如,熵编码单元56可通过以下操作译码B图片的参考索引:上下文译码第一参考索引值的一或多个二进制位,上下文译码第二索引值的一或多个二进制位,旁路译码第一参考索引值的一或多个其它二进制位,和旁路译码第二参考索引值的一或多个其它二进制位(以上文所呈现的次序)。因此,熵编码单元56仅在上下文译码模式与旁路译码模式之间(例如,在经上下文译码二进制位与非上下文译码二进制位之间)转变单一次。
在通过熵编码单元56熵译码之后,可将所得经编码视频传输到另一装置(例如,视频解码器30)或加以封存以供稍后传输或检索。反量化单元58和反变换处理单元60分别应用反量化和反变换,以在像素域中重构建残余块(例如)以供稍后用作参考块。
运动补偿单元44可通过将残余块加到参考图片存储器64的图片中的一者的预测性块而计算参考块。运动补偿单元44也可将一或多个内插滤波器应用于经重构建的残余块,以计算用于运动估计中的子整数像素值。
求和器62将经重构建的残余块加到由运动补偿单元44产生的经运动补偿的预测块以产生经重构建的视频块,以用于存储于参考图片存储器64中。经重构建的视频块可由运动估计单元42和运动补偿单元44用作参考块,以帧间译码后续图片中的块。
图3为说明解码经编码视频序列的视频解码器30的实例的框图。在图3的实例中,视频解码器30包含熵解码单元70、运动补偿单元72、帧内预测单元74、反量化单元76、反变换单元78、参考图片存储器82和求和器80。
作为背景,视频解码器30可接收经压缩视频数据,所述经压缩视频数据已经压缩以供通过网络传输到所谓的“网络抽象层单元”或NAL单元中。每一NAL单元可包含识别存储到所述NAL单元的数据的类型的标头。存在通常存储到NAL单元的两种类型的数据。存储到NAL单元的第一类型的数据为视频译码层(VCL)数据,其包含经压缩视频数据。存储到NAL单元的第二类型的数据被称作非VCL数据,其包含例如定义为大量NAL单元所共有的标头数据的参数集合和补充增强信息(SEI)的额外信息。
例如,参数集合可含有序列层级标头信息(例如,在序列参数集合(SPS)中)和不频繁改变的图片层级标头信息(例如,在图片参数集合(PPS)中)。不需要针对每一序列或图片重复含于参数集合中的不频繁改变的信息,藉此改进译码效率。另外,参数集合的使用实现标头信息的频带外传输,藉此避免为达成错误恢复而进行冗余传输的需要。
在解码过程期间,视频解码器30接收表示经编码视频切片的视频块和相关联的语法元素的经编码视频位流。一般来说,熵解码单元70熵解码位流以产生经量化系数、运动向量和其它语法元素。视频解码器30可在视频切片层级和/或视频块层级处接收语法元素。
例如,当视频切片译码为帧内译码(I)切片时,帧内预测单元74可基于经用信号发送的帧内预测模式和来自当前图片的先前解码块的数据而产生用于当前视频切片的视频块的预测数据。当图片译码为帧间译码(即,B、P或GPB)切片时,运动补偿单元72基于从熵解码单元70接收的运动向量和其它语法元素产生用于当前视频切片的视频块的预测性块(也被称作参考样本)。可从参考图片列表中的一者内的参考图片中的一者产生预测性块。视频解码器30可基于存储于参考图片存储器82中的参考图片使用默认构建技术来构建参考图片列表(列表0和列表1)。
熵解码单元70可使用在视频编码器20处所实施的相同过程(例如,CABAC、CAVLC等)来解码位流。由编码器使用的熵译码过程可在经编码位流中用信号发送或可为预定过程。例如,熵解码单元70可接收经编码的经二进制化语法元素。熵解码单元70可解码位流(例如,使用上下文自适应性模式或旁路模式)且二进制化经解码值,以产生经解码语法元素。
在一些例子中,熵解码单元70可熵解码预测数据。如上文关于视频编码器20所指出,预测数据可包含指示参考索引值、运动向量、运动向量预测子、运动向量差值和类 似者的数据。即,熵解码单元70可熵解码表示运动向量(例如,运动向量的水平分量和垂直分量)、参考图片索引和预测方向的语法元素。可针对经帧间译码PU提供这些语法元素,以准许视频解码器30解码和再现由PU所定义的视频数据。
在一些实例中,如上文所指出,熵解码单元70可使用三个不同的上下文(例如,ctx0、ctx1和ctx2)熵解码参考索引值。例如,熵解码单元56可分别使用ctx0和ctx1熵解码第一二进制位(bin0)和第二二进制位(bin1),且用上下文ctx2解码第三二进制位(bin2)和其它二进制位。在二进制位当中共享上下文ctx2可为低效的,这是归因于与上下文译码相关联的概率更新。
根据本发明的方面,熵解码单元70可通过将ctx2专用于译码bin2且使用旁路译码模式译码在bin2之后的所有二进制位来CABAC译码参考索引值。在另一实例中,熵解码单元70可通过去除ctx2而上下文译码参考索引值的较少二进制位。即,根据本发明的方面,熵解码单元70可使用CABAC旁路模式解码bin2和所有稍后二进制位。在又一实例中,熵解码单元70可通过去除ctx1和ctx2两者而译码参考索引值的较少二进制位。即,根据本发明的方面,熵解码单元70可使用CABAC旁路模式解码bin1和所有稍后二进制位,藉此进一步降低与译码参考索引值相关联的复杂性。
本发明的其它方面大体涉及熵解码单元70二进制化参考索引值的方式。在一些实例中,熵解码单元70可使用一元、截断式一元,或其它译码过程二进制化参考索引值。在另一实例中,熵编码单元56可使用指数-哥伦布译码过程来二进制化参考索引值。
在一些实例中,根据本发明的方面,熵解码单元70可实施二进制化过程的组合。例如,如关于下文的图4更详细地描述,熵解码单元70可组合一元(或截断式一元)译码过程与指数-哥伦布译码过程以二进制化参考索引值。在实例中,为说明的目的,熵解码单元70可组合具有长度(4)的截断式一元码与指数-哥伦布码(例如,0阶的指数-哥伦布码)。在此实例中,熵解码单元70可使用一元码二进制化参考索引值的第一数目个二进制位(例如,两个、三个、四个或类似者),且可使用指数-哥伦布码二进制化参考索引的剩余二进制位。
在任何状况下,熵解码单元70可实施用于通过任何二进制化方案上下文译码参考索引值的一或多个二进制位且旁路译码参考索引值的一或多个其它二进制位的技术。例如,如上文所指出,熵解码单元70可上下文译码(例如,CABAC译码)经二进制化的语法元素的第一数目个二进制位,且旁路译码剩余二进制位。在具有长度(4)的截断式一元码与0阶的指数哥伦布码组合的上文所述的实例中,熵解码单元70可上下文译码截断式一元码之前两个二进制位(或任何其它数目个二进制位),且接着旁路译码一元码的第 二部分和整个指数哥伦布码。在其它实例中,熵解码单元70可使用其它二进制化方案。例如,熵解码单元70可使用固定长度二进制码,而非在以上实例中所述的指数哥伦布码。
在一些实例中,熵解码单元70可在译码经二进制化的参考索引值之前从所述值截断或去除二进制位。另外或替代地,熵解码单元70可对使用上下文所译码的二进制位与使用旁路模式所译码的二进制位进行分群。例如,熵解码单元70可通过以下操作译码B图片的参考索引:上下文译码第一参考索引值的一或多个二进制位,上下文译码第二索引值的一或多个二进制位,旁路译码第一参考索引值的一或多个其它二进制位,和旁路译码第二参考索引值的一或多个其它二进制位(以上文所呈现的次序)。因此,熵解码单元70仅在上下文译码模式与旁路译码模式之间(例如,在经上下文译码二进制位与非上下文译码二进制位之间)转变单一次。
在熵解码语法元素和变换系数之后,在一些实例中,熵解码单元70(或反量化单元76)可使用扫描来扫描所接收变换系数值,所述扫描镜射由视频编码器20的熵编码单元56(或量化单元54)所使用的扫描模式。尽管为易于说明起见展示为单独的功能单元,但熵解码单元70、反量化单元76和视频解码器30的其它单元的结构和功能性可彼此高度集成。
反量化单元76反量化(即,解量化)在位流中所提供且由熵解码单元70解码的经量化变换系数。反量化过程可包含常规过程,例如,类似于针对HEVC所提出或由H.264解码标准所定义的过程。反量化过程可包含针对CU使用由视频编码器20计算出的量化参数QP,以确定量化程度和(同样地)应应用的反量化的程度。在系数从一维阵列转换为二维阵列之前或之后,反量化单元76可反量化变换系数。
帧内预测单元74可基于经用信号发送的帧内预测模式和来自当前图片的先前解码块的数据产生用于当前图片的当前块的预测数据。运动补偿单元72可从经编码位流检索运动向量、运动预测方向和参考索引。参考预测方向指示帧间预测模式为单向(例如,P帧)或双向(B帧)的。参考索引指示运动向量经指引到的参考图片。基于所检索的运动预测方向、参考图片索引和运动向量,运动补偿单元产生用于当前部分的经运动补偿的块。这些经运动补偿的块用以再产生用以产生残余数据的预测性块。
运动补偿单元72可产生经运动补偿的块,从而可能地基于内插滤波器来执行内插。待以子像素精度用于运动估计的内插滤波器的识别符可包含于语法元素中。运动补偿单元72可在视频块的编码期间使用如由视频编码器20使用的内插滤波器来计算参考块的子整数像素的内插值。运动补偿单元72可根据所接收语法信息确定由视频编码器20使 用的内插滤波器,且使用所述内插滤波器产生预测性块。
运动补偿单元72可接收预测数据,所述预测数据指示在何处检索用于当前块的运动信息。例如,运动补偿单元72可接收运动向量预测信息,例如,MVP索引(mvp_flag)、MVD、合并旗标(merge_flag)和/或合并索引(merge_idx),且使用此信息来识别用以预测当前块的运动信息。
例如,运动补偿单元72可产生MVP或合并候选者的列表。运动补偿单元72可接着使用MVP或合并索引来识别用以预测当前块的运动向量的运动信息。即,运动补偿单元72可使用MVP索引(mvp_flag)从参考图片的列表识别MVP。运动补偿单元72可组合所识别的MVP与所接收MVD,以确定用于当前块的运动向量。在其它实例中,运动补偿单元72可使用合并索引(merge_idx)从参考图片的列表识别合并候选者,以确定用于当前块的运动信息。在任何情况下,在确定用于当前块的运动信息之后,运动补偿单元72可产生用于当前块的预测性块。
另外,在HEVC实例中,运动补偿单元72和帧内预测单元74可使用语法信息(例如,通过四分树所提供)中的一些来确定用以编码经编码视频序列的(多个)图片的LCU的大小。运动补偿单元72和帧内预测单元74也可使用语法信息来确定描述经编码视频序列的图片的每一CU分裂的方式(和同样地,子CU分裂的方式)的分裂信息。语法信息也可包含指示每一分裂经编码的方式的模式(例如,帧内预测或帧间预测,和用于帧内预测和帧内预测编码模式)、用于每一经帧间编码PU的一或多个参考图片(和/或含有用于参考图片的识别符的参考列表)和解码经编码视频序列的其它信息。
求和器80组合残余块与由运动补偿单元72或帧内预测单元74产生的相应预测块,以形成经解码块。如果需要,那么也可应用解块滤波器来滤波经解码块,以便去除块效应伪影。经解码视频块接着存储于参考图片存储器82中,参考图片存储器82提供用于后续运动补偿的参考块,且也产生经解码视频以供在显示装置(例如,图1的显示装置32)上呈现。
图4为说明实例算术译码过程的框图。图4的实例算术译码过程大体描述为由视频编码器20执行。然而,应理解,关于图4所述的技术可由多种其它视频译码器(包含视频解码器30)执行。例如,如上文关于图3所指出,视频解码器30可执行与由视频编码器20所执行的过程互逆的解码过程。
图4的实例包含二进制化器100、上下文模型化器102、译码引擎104和旁路译码器106。二进制化器100负责二进制化所接收语法元素。例如,二进制化器100可将语法元素映射到数个所谓的二进制位,其中每一二进制位表示一个二进制值。在实例中, 为说明的目的,二进制化器100可使用截断式一元(TU)码将语法元素映射到二进制位。一般来说,一元译码可涉及产生具有长度N+1的二进制位字串,其中前N个二进制位为1且最后的二进制位为0。截断式一元译码可通过对语法元素的最大可能值设定最大值(cMax)而具有与一元译码相比少一个的二进制位。截断式一元译码的实例展示于表2中,其中cMax=10。
表2
值 | 二进制位字串 |
0 | 0 |
1 | 10 |
2 | 110 |
3 | 1110 |
4 | 11110 |
5 | 111110 |
6 | 1111110 |
7 | 11111110 |
8 | 111111110 |
9 | 1111111110 |
10 | 1111111111 |
当在视频解码器30处执行时,视频解码器30可搜索0,以确定当前正译码的语法元素何时完成。如下文更详细地描述,截断式一元译码仅为实例,且二进制化器100可执行多种其它二进制化过程(以及二进制化过程的组合)以二进制化语法元素。
上下文模型化器102可负责针对给定二进制位确定上下文模型(也被称作概率模型)。例如,上下文模型化器102可选择概率模型,所述概率模型对上下文操作以译码与视频数据的块相关联的符号。一般来说,概率模型存储每一二进制位为“1”或“0”的概率。
上下文模型化器102可从数个可用的概率模型选择概率模型。在一些实例中,如下文更详细地描述,可基于正译码的二进制位数目确定通过上下文模型化器102使用的上下文。即,上下文可取决于二进制位在由二进制化器100产生的二进制位字串中的位置。在任何情况下,在视频编码器20处,可通过使用所选择概率模型而译码目标符号。在视频解码器30处,可通过使用所选择概率模型而剖析目标符号。
译码引擎104使用所确定概率模型(来自上下文模型化器102)译码二进制位。在译码引擎104译码二进制位之后,译码引擎104可更新与用以译码二进制位的上下文相关联的概率模型。即,所选择概率模型是基于实际译码值而更新(例如,如果二进制值为“1”,那么“1”的频率计数增加)。使用上下文模型化器102和译码引擎104译码二进制位可 被称作使用上下文译码模式译码二进制位。
旁路译码器106使用固定概率译码二进制位。与上下文译码(通过上下文模型化器102和译码引擎104)对比,旁路译码器106不基于正译码的二进制位的实际值而更新旁路译码过程。因此,一般来说,旁路译码器106可比上下文译码快地旁路译码二进制位。使用旁路译码器106译码二进制位可被称作使用旁路译码模式译码二进制位。实例旁路译码模式包含哥伦布译码、指数哥伦布译码、哥伦布-莱斯译码或绕过上下文模型化器102和译码引擎104的任何其它合适的译码过程。
经译码二进制位(来自译码引擎104和旁路译码器106)经组合以形成经译码位流。为了解码经编码位流,视频解码器(例如,视频解码器30)可镜射图4中所示的过程。即,视频解码器30可对经编码位流执行上下文译码(使用上下文模型化器102和译码引擎104)或旁路译码(使用旁路译码器106),以产生经解码二进制位字串。视频解码器30可接着二进制化所述二进制位字串(使用二进制化器100),以产生语法值。
图3中所示的算术译码过程可用以译码视频数据。例如,图3中所示的译码过程可用以译码预测数据,包含参考索引值、运动向量、运动向量预测子、运动向量差值和类似者。
在实例中,为说明的目的,二进制化器100可二进制化参考索引(ref_idx)。在一些实例中,用于参考索引的所得二进制位字串在长度上可多达15个二进制位,此取决于可用于参考的参考图片的数目。如上文所指出,在一些实例中,可使用上下文模型化器102和译码引擎104上下文译码参考索引值的所有二进制位。此外,二进制位中的一或多者可共享上下文。然而,上下文译码所有二进制位和在一个以上二进制位当中共享上下文可为低效的,这是归因于与上下文译码相关联的潜时。
根据本发明的方面,如图4中所示,视频编码器20可基于正译码的二进制位的二进制位数目来编码用于参考索引的二进制位字串。例如,视频编码器20可根据参考索引二进制位字串中的特定二进制位的相对位置来译码二进制位字串中的特定二进制位。在实例中,视频编码器20可上下文译码参考索引的第一二进制位、第二二进制位和第三二进制位,且可旁路译码参考索引的剩余二进制位。即,视频编码器20可通过第一上下文ctx0使用上下文模型化器102和译码引擎104译码第一二进制位(bin0),通过第二上下文ctx1使用上下文模型化器102和译码引擎104译码第二二进制位(bin1),且通过第三上下文ctx2使用上下文模型化器102和译码引擎104译码第三二进制位(bin2)。然而,视频编码器20可使用旁路译码器106译码第四二进制位(bin3)和任何其它后面的二进制位。
在另一实例中,视频编码器20可减少经上下文译码的二进制位的数目。例如,视频编码器20可通过第一上下文ctx0使用上下文模型化器102和译码引擎104译码第一二进制位(bin0),且通过第二上下文ctx1使用上下文模型化器102和译码引擎104译码第二二进制位(bin1)。然而,在此实例中,视频编码器20可使用旁路译码器106旁路译码第三二进制位(bin2)和任何其它后面的二进制位。
在再一实例中,视频编码器20可进一步减少经上下文译码的二进制位的数目。例如,视频编码器20可通过第一上下文ctx0使用上下文模型化器102和译码引擎104译码第一二进制位(bin0)。然而,视频编码器20可使用旁路译码器106译码第二二进制位(bin1)和任何其它后面的二进制位。
本发明的方面也涉及二进制化器100针对视频数据执行二进制化的方式。例如,根据本发明的方面,二进制化器100可将语法元素划分为一个以上部分。即,二进制化器100可使用截断式一元译码来译码前缀(具有相对小的cMax,如上文所述),且可使用另一译码方法来译码后缀。在实例中,二进制化器100可使用k阶指数-哥伦布码来译码后缀。
在一些实例中,仅前缀的二进制位可经上下文译码,而后缀的二进制位可经旁路译码。表3展示具有指数-哥伦布码的截断式一元组合码的实例,其中cMax=4用于前缀且0阶指数-哥伦布用于后缀。这些技术也可应用于参考索引值以及其它语法元素,例如,经由先进运动向量预测(AMVP)在译码中所使用的运动向量差值或其它语法元素。
表3
在表3中所示的实例中,截断式一元二进制位可经上下文译码,而指数-哥伦布二进制位可经旁路译码。
本发明的技术可包含(例如)将上下文译码应用于在针对前缀部分中的指数-哥伦布二进制化的某一数目个二进制位之后的二进制位。本发明的技术也包含(例如)将基于上下文的译码应用于某一数目个二进制位(例如,预定数目个前缀二进制位),和将旁路译码应用于剩余二进制位。例如,替代使用上下文译码前缀部分中的所有二进制位,可通过旁路模式译码前缀部分中的bin2和稍后二进制位。在另一实例中,旁路模式可应用于在bin1之后和/或包含bin1的所有二进制位。在再一实例中,旁路模式可应用于前缀部分的所有二进制位。在某一数目个上下文译码二进制位之后使用旁路模式译码的类似方法可用于任何二进制化方法。即,尽管本发明描述使用指数-哥伦布和截断式一元译码方案,但可使用其它二进制化方法。
在又一实例中,可结合其它二进制化过程(包含二进制化过程的组合)来实施上文所述的本发明的技术。即,在一个实例中,一元译码过程可用以二进制化参考索引值。在另一实例中,截断式一元译码过程可用以二进制化参考索引值。在再一实例中,指数-哥伦布译码过程可用以二进制化参考索引值。其它二进制化过程和二进制化过程的组合也为可能的。即,例如,一元(或截断式一元)译码过程可与指数-哥伦布译码过程组合,以二进制化参考索引值。在实例中,为说明的目的,具有长度(4)的截断式一元码可与指数-哥伦布码(例如,0阶的指数-哥伦布码)组合。在此实例中,参考索引值的第一数目个二进制位(例如,两个、三个、四个,或类似者)可经一元译码,而参考索引的剩余二进制位可经指数-哥伦布译码。
在任何状况下,上文关于CABAC和旁路译码参考索引值所描述的技术可应用于任何经二进制化的参考索引值。即,根据本发明的方面,经二进制化的参考索引值的第一数目个二进制位可经上下文译码(例如,通过CABAC引擎来译码),而剩余二进制位可经旁路译码。在上文所述的实例中,其中具有长度(4)的截断式一元码与0阶的指数哥伦布码组合,截断式一元码之前两个二进制位(或任何其它数目个二进制位)可经上下文译码,且一元码的第二部分和整个指数哥伦布码可经旁路译码。
应理解,具有长度(4)的截断式一元码和0阶的指数哥伦布仅为实例的目的而提供,且相同或类似的技术可应用于其它截断式一元码长度以及用于指数哥伦布码的其它阶。此外,上文所述的二进制化过程仅为实例的目的而提供,且可使用其它经二进制化码。例如,可使用固定长度二进制码,而非在以上实例中所述的指数哥伦布码。另外,用于截断式一元二进制化部分的两个经上下文译码二进制位的实例为说明的目的而提供,且可使用其它数目个经上下文和旁路译码二进制位。
在任何状况下,本发明的方面也涉及截断经二进制化值的一部分。例如,因为参考索引的数目是预先已知的,所以根据本发明的方面,可截断指数哥伦布或固定长度码。即,可由二进制化器100使用具有阶k的指数哥伦布。作为实例,0阶的指数哥伦布可应用于视频压缩中。此二进制化由通过一元码所译码的指数前缀和具有长度(prefix-1)的固定长度后缀组成,其实例展示于下文的表4中:
表4
元素 | 指数哥伦布0阶 | 一元码 | 二进制位数 |
0 | 1 | 1 | 000 |
1 | 01 0 | 01 | 001 |
2 | 01 1 | 001 | 010 |
3 | 001 00 | 0001 | 011 |
4 | 001 01 | 00001 | 100 |
5 | 001 10 | 000001 | 101 |
6 | 001 11 | 0000001 | 110 |
7 | 0001 000 | 00000001 | 111 |
8 | 0001 001 | 000000001 | … |
9 | 0001 010 | … | |
10 | 0001 011 | ||
11 | 0001 100 | ||
12 | 0001 101 | ||
13 | 0001 110 | ||
14 | 0001 111 | ||
15 | 00001 0000 | ||
… | … |
例如,值10(例如,其对应于具有在表4的第一行中的值10的元素)是由经二进制化的码字0001011表示,其中0001为前缀且011为后缀。元素可为输入数据,其是使用表4的码字或使用下文展示和描述的表格来译码。例如,视频编码器20可接收元素,且根据下文展示和描述的表格将元素转换为码字。同样,视频解码器30可接收码字,且根据下文展示和描述的表格将码字转换为语法元素(例如,输入数据)。
可根据下文所示的方程序(1)来获得经重构建的值:
值=2^(前缀-1)+后缀-1 (1)
在此实例中,前缀是由0001对应于4的一元码表示,且后缀为由011对应于3的二进制位数字系统所表示的值,如上文的表4中所示。因此,在此实例中,应用方程序(1)得出以下值:2^(4-1)+3-1=10。
此码可表示大体无穷大数;然而,在一些情形中,元素的数目可为已知的。在此状况下,码字可缩短,从而考量最大数目个可能元素。
例如,如果元素的最大数目为2(例如,元素0和1),那么用于1的常规指数哥伦布码字为010。然而,不存在大于2的元素。因此,常规码010可缩短为1。此类型的二进制化可被称作截断式指数哥伦布,且可在例如H.264/AVC的视频译码标准中使用。然而,关于H.264标准,仅在元素的最大数目为1时才使用截断式指数哥伦布。针对其它状况,使用常规指数哥伦布二进制化。
根据本发明的方面,(例如)以类似于元素的最大数目为1的以上实例的方式,可进一步截断常规指数哥伦布译码。一般来说,当元素的最大数目预先已知时,可通过去除冗余二进制位而截断指数哥伦布二进制化码字的后缀。例如,如果元素的最大数目为9,那么可从码字去除在下文所示的表5中用粗体、斜体和底线标记的两个二进制位。
表5
元素 | 指数哥伦布0阶 | 阶0的截断式指数哥伦布 |
0 | 1 | 1 |
1 | 01 0 | 01 0 |
2 | 01 1 | 01 1 |
3 | 001 00 | 001 00 |
4 | 001 01 | 001 01 |
5 | 001 10 | 001 10 |
6 | 001 11 | 001 11 |
7 | 0001 000 | 0001 0 |
8 | 0001 001 | 01 |
即,对于表5中所示的元素7,可去除后缀之前两个00。另外,对于表5中所示的元素8,可去除后缀之前两个00。因此,阶0的截断式指数哥伦布指示针对元素7的00010和针对元素8的00001 1。
可(例如)通过比较用于最近前缀(以上实例中的0001)的固定长度后缀与常规指数哥伦布码来实施上文所述的技术。例如,如果最近群组中的元素的数目小于在常规指数哥伦布码中的数目,那么可去除冗余二进制位。换句话说,二进制化器100可通过比较用于最近前缀的固定长度后缀而产生具有阶0的所得截断式指数哥伦布码,且如果此最近群组中的元素的数目小于在常规指数哥伦布码中的数目,那么可去除冗余二进制位。
例如,在此实例中,二进制化器100可确定元素的数目,所述元素的前缀在存在预先已知的最大数目个元素用于译码时与最后元素的前缀相同。例如,在表5中,用于最后元素的前缀为0001,且存在两个元素(例如,元素7和元素8),其前缀在存在最大数目个元素(例如,在此实例中为9)时与最后元素的前缀相同。
二进制化器可接着比较前缀与最后元素的前缀相同的元素的数目与常规指数哥伦布码中具有相同前缀的元素的数目。例如,在上文的表4中,存在前缀为0001(即,与 先前元素的前缀相同)的八个元素(即,元素7到元素14)。在此实例中,二进制化器100可确定前缀与最后元素的前缀相同的元素的数目小于常规指数哥伦布码中具有相同前缀的元素的数目。
当此成立时,二进制化器100可从前缀与最后前缀相同的码字截断二进制位,以产生截断码字。在一些实例中,二进制位是从后缀截断;但本发明的方面不限于此。二进制化器100可基于前缀与最后前缀相同的元素的数目来确定待截断的二进制位的数目。
例如,在上文的表5中,存在具有与最后前缀相同的前缀的两个元素(例如,元素7和8)。二进制化器100可从元素7和8的码字截断二进制位以产生经截断码字,如在表5的最后行中所说明。在此实例中,因为存在具有与最后前缀相同的前缀的两个元素,所以二进制化器100可确定在后缀中仅需要一个二进制位来表示所述两个元素。例如,后缀中的0可表示一个元素(例如,元素7),且后缀中的1可表示另一元素(例如,元素8)。因此,针对上文的表5中的元素7,二进制化器100可截断后缀的前两个二进制位,从而仅留下0作为用于经截断码字的后缀。又,针对上文的表5中的元素8,二进制化器100可截断后缀的前两个二进制位,从而仅留下1作为用于经截断码字的后缀。
可针对译码媒体(例如,编码和/或解码视频数据)而实施上文所述的技术。例如,根据本发明的方面,视频解码器(例如,视频解码器30)可接收表示媒体数据的一或多个码字,且可存在可用于译码的最大数目个元素。视频解码器30可根据译码表将码字转换为元素。译码表可经构建,使得在相同前缀为译码表中的最后前缀时具有相同前缀的码字中的至少一些被截断,且具有相同前缀的码字的数目小于可具有相同前缀的独特码字的最大数目。例如,针对前缀0001,表4说明针对码字的独特概率,且表5和表6(下文所示)展示共享相同前缀且根据本发明的技术被截断的码字的实例。
也可由视频编码器20执行所述技术。例如,视频编码器20可接收表示媒体数据的一或多个元素。视频编码器20可根据译码表将元素转换为一或多个码字,且可存在可用于译码的最大数目个元素。译码表可经构建,使得在相同前缀为译码表中的最后前缀时具有相同前缀的码字中的至少一些被截断,且具有相同前缀的码字的数目小于可具有相同前缀的独特码字的最大数目。再次,例如,针对前缀0001,表4说明针对码字的独特概率,且表5和表6(下文所示)展示共享相同前缀且根据本发明的技术被截断的码字的实例。
以此方式,当已知正译码的元素的最大数目时,所述技术可减少译码视频数据所需的二进制位的数目。二进制位的减少导致较少位需要被用信号发送或接收,从而导致频宽效率。
在又一实例中,如果元素的最大数目为11,那么截断式指数哥伦布码字展示于下文的表6中。可自码字去除在表6中用粗体、斜体和底线标记的二进制位。
表6
元素 | 指数哥伦布0阶 | 阶0的截断式指数哥伦布 |
0 | 1 | 1 |
1 | 01 0 | 01 0 |
2 | 01 1 | 01 1 |
3 | 001 00 | 001 00 |
4 | 001 01 | 001 01 |
5 | 001 10 | 001 10 |
6 | 001 11 | 001 11 |
7 | 0001 000 | 0001 00 |
8 | 0001 001 | 0001 01 |
9 | 0001 010 | 0001 10 |
10 | 0001 011 | 0001 11 |
如表6中所示,可截断用于元素7、8、9和10的后缀中的第一二进制位(以粗体、斜体和底线展示)。在此实例中,来自后缀的仅一二进制位可被截断,这是因为四个元素是由码字表示。出于此原因,在经截断码字中,后缀自00开始且以11结束以涵盖各自具有相同前缀的四个元素。
上文的表5和表6中所示的实例仅作为实例而提供,且同一过程可应用于任何数目个最大元素。例如,在一些实例中,本发明的方面涉及接收经截断码字。可通过确定第一元素数目而产生经截断码字。第一元素数目可指示:在存在可用于译码的最大数目个元素时,在第一译码表中的具有与对应于第一译码表中的最后元素的码字的前缀相同的前缀的码字的数目。在此实例中,第一译码表可为表5或表6。诸方面涉及在操作期间接收在运行中预分类或计算的经截断码字。
本发明的方面也涉及确定第二元素数目,所述第二元素数目指示在第二译码表中的具有与对应于第一译码表中的最后元素的码字的前缀相同的前缀的码字的数目。在此实例中,第二译码表可为上文的表4。在一些实例中,第一译码表可为第二译码表的子集,这是基于可用于译码的元素的最大数目。
在一些实例中,当第一元素数目小于第二元素数目时,本发明的方面涉及从在第一译码表中的前缀与对应于第一译码表的最后元素的码字的前缀相同的码字截断二进制位以产生经截断码字,且使用经截断码字译码视频数据。在一些实例中,截断所述码字包含从码字的后缀或前缀或其组合截断二进制位。在一些实例中,截断二进制位是基于 第一元素数目,其中第一元素数目指示在第一译码表中的具有与对应于第一译码表中的最后元素的码字的前缀相同的前缀的码字的数目。在一些实例中,译码为哥伦布译码。
替代地或另外,也可使用截断式一元码而缩短前缀。例如,如果元素的最大数目为4,那么可如下文的表7中所示而截断前缀和后缀。
表7
元素 | 指数哥伦布0阶 | 阶0的截断式指数哥伦布 |
0 | 1 | 1 |
1 | 01 0 | 01 0 |
2 | 01 1 | 01 1 |
3 | 001 00 | 00 |
表7的经截断二进制位是以粗体、斜体和底线表示。在表7中所示的实例中,用于元素3的码字短于用于元素1或2的码字。(例如)通过将较短的码字00指派给更频繁出现的元素1且将010指派给元素3,可应用针对截断式指数哥伦布二进制化的额外重新排序或映射。可使用映射表来执行此重新排序或映射。
在一些实例中,重新排序也可基于特定元素的出现频率。例如,较短的码字可指派给最频繁出现的元素。此码字映射在元素按照出现频率排序时的状况下可为特别有效的。
尽管关于0阶指数哥伦布译码描述了上文的某些实例,但应理解,所述技术更一般来说适用于k阶指数哥伦布译码。此外,所述技术不限于HEVC视频标准,且可应用于任何视频压缩标准,或更广泛地,应用于执行二进制化的任何应用。
关于新兴的HEVC标准(以及HEVC标准的扩展,例如可调式视频译码(SVC)或多视角视频译码(MVC)),上文所述的截断式指数哥伦布二进制化技术可应用于二进制化多种语法元素。实例包含参考索引值、帧内模式(intra-mode mode)、合并索引、量化参数(或差量量化参数),或元素的数目预先已知的任何其它语法元素。
尽管以上实例描述指数哥伦布截断,但所述截断技术也可应用于固定长度码。即,在语法元素(例如,参考索引)是使用一个以上二进制化过程(例如,截断式一元和指数哥伦布)二进制化的实例中,预定数目个二进制位可经CABAC译码,而剩余二进制位可经截断和旁路译码。
在一些实例中,可应用算法来确定可截断的二进制位的数目(例如,从经二进制化的语法元素的指数哥伦布或固定长度二进制化部分截断)。在实例中,假设预定数目个二进制位保持被旁路译码。在此实例中,视频译码器(例如,视频编码器20或视频解码器30) 可通过计算剩余二进制位的舍进log2而确定可截断的剩余二进制位的数目。
图5A和图5B为说明与预测数据相关联的实例二进制位字串的框图。例如,图5A大体说明针对从单一参考图片所预测的图片的参考索引(ref_idx)、运动向量差(mvd)和运动向量预测子索引(mvp_idx)。
图5B大体说明针对从两个参考图片所预测的图片(B图片)的第一参考索引(ref_idx_L0)、第一运动向量差(mvd_L0)(表示水平分量和垂直分量)和第一运动向量预测子索引(mvp_idx_L0),以及第二参考索引(ref_idx_L1)、第二运动向量差(mvd_L1)(表示水平分量和垂直分量)和第二运动向量预测子索引(mvp_idx_L1)。即,针对双向预测PU,两个参考索引可经译码,其中针对列表L0和列表L1中的每一列表有一个参考索引。因此,每PU多达两个参考索引可经译码,且每CU多达八个索引可经译码。
二进制位字串120(图5A)和124(图5B)包含与先进运动向量预测(AMVP)技术相关联的预测数据。通过AMVP,用于当前正译码的块的运动向量可译码为相对于另一运动向量(例如,与空间或时间相邻块相关联的运动向量)的差值(即,差量)。例如,视频编码器20可建置运动向量预测子候选者列表,所述列表包含与在空间和时间方向上的一或多个相邻块相关联的运动向量。视频编码器20可基于(例如)速率-失真成本分析从候选者列表选择最准确的运动向量预测子(MVP)。
视频编码器20可使用参考索引(ref_idx)指示用于实际运动向量的参考图片。另外,视频编码器20可使用运动向量预测子索引(mvp_idx)指示所选择MVP,所述运动向量预测子索引(mvp_idx)在候选者列表中识别MVP。视频编码器20也可使用运动向量差(mvd)指示在当前块的运动向量(实际运动向量)与MVP之间的差。如上文所指出,mvd可包含对应于mvp的水平分量和垂直分量的水平分量和垂直分量。
视频解码器30可以相同方式建置MVP候选者列表。视频解码器30可接着使用所接收的运动向量预测子索引(mvp_idx)来确定在候选者列表中在何处定位MVP。视频解码器30可组合运动向量差(mvd)与运动向量预测子(使用运动向量预测子索引(mvp_idx)所确定),以便重构建运动向量。
以此方式预测运动向量(例如,通过差值)可能相对于译码(多个)实际运动向量要求将较少位包含于位流中。关于图5B,双向预测图片可包含与来自两个不同列表(例如,列表0和列表1)的图片相关联的预测数据。如图5B的实例中所示,与列表0相关联的预测数据可先于与列表1相关联的预测数据。即,二进制位字串124包含第一参考索引(ref_idx_L0)、第一运动向量差(mvd_L0)(例如,表示水平分量和垂直分量两者)和第一运动向量预测子索引(mvp_idx_L0),随后为第二参考索引(ref_idx_L1)、第二运动向量差 (mvd_L1)(例如,表示水平分量和垂直分量两者)和第二运动向量预测子索引(mvp_idx_L1)。
在一些实例中,可使用上下文译码与旁路译码的组合来译码与AMVP相关的语法。例如,如图5A和图5B的实例中所示,预测数据的二进制位中的一些经上下文译码,而其它二进制位经旁路译码。即,运动向量差值(以及其它值,例如,如关于下文的图7所述的参考索引值)的一或多个二进制位可经上下文译码,而运动向量差值的一或多个其它二进制位可经旁路译码。
关于图5A的实例,参考索引(ref_idx)和运动向量差(mvd)的第一部分可经上下文译码,如由经上下文译码二进制位128所指示。运动向量差(mvd)的第二部分可经旁路译码,如由经旁路译码二进制位130所指示。另外,运动向量预测子索引(mpv_idx)可经上下文译码,如由经上下文译码二进制位132所指示。
关于图5B的实例,第一参考索引(ref_idx_L0)和第一运动向量差(mvd_L0)(例如,表示水平分量和垂直分量两者)的第一部分可经上下文译码,如由经上下文译码二进制位136所指示。第一运动向量差(mvd_L0)(例如,表示水平分量和垂直分量两者)的第二部分可经旁路译码,如由经旁路译码二进制位138所指示。另外,第一运动向量预测子索引(mpv_idx_L0)、第二参考索引(ref_idx_L1)和第二运动向量差(mvd_L1)(例如,表示水平分量和垂直分量两者)的第一部分可经上下文译码,如由经上下文译码二进制位140所指示。第二运动向量差(mvd_L1)(例如,表示水平分量和垂直分量两者)的第二部分也可经旁路译码,如由经旁路译码二进制位142所指示。最后,第二运动向量预测子索引(mpv_idx_L1)可经上下文译码,如由经上下文译码二进制位144所指示。
因此,图5B的实例说明针对双向预测的基于PU的帧间模式语法,对于双向预测,视频译码器可能必须在上下文译码与旁路译码之间切换四次以处理二进制位。在上下文译码与旁路译码之间切换以译码二进制位字串120和124可为低效的。例如,在上下文译码与旁路译码之间切换可能消耗一或多个时钟循环。因此,针对每一元素在上下文译码与旁路译码之间切换可引入潜时,这是归因于在上下文译码与旁路译码之间的转变。
根据本发明的方面,如关于下文的图6和图7更详细地描述,上下文二进制位与旁路二进制位可经分群以减少在上下文译码与旁路译码之间的转变。例如,关于图5A,本发明的方面涉及将经上下文译码二进制位128和132分群在一起,使得所述二进制位不由经旁路译码二进制位130分离。以此方式,可在二进制位字串120的译码期间在上下文译码与旁路译码之间进行单一转变。
同样,关于图5B,本发明的方面涉及将经上下文译码二进制位136、140与144分群,使得所述二进制位不会通过经旁路译码二进制位138和142分离。又,以此方式将经上下文译码二进制位与经旁路译码二进制位分群可允许视频译码器(例如,视频编码器20或视频解码器30)在上下文译码与旁路译码之间进行单一转变。避免在上下文译码与旁路译码之间的多次转变可通过限制与转变相关联的潜时而增加效率。
图6为说明预测数据的另一实例二进制位字串140的框图。二进制位字串140包含第一参考索引(ref_idx_L0)、第一运动向量差(mvd_L0)(例如,表示水平分量和垂直分量两者)和第一运动向量预测子索引(mvp_idx_L0),随后为第二参考索引(ref_idx_L1)、第二运动向量差(mvd_L1)(例如,表示水平分量和垂直分量两者)和第二运动向量预测子索引(mvp_idx_L1)。二进制位字串140包含经上下文译码二进制位144和经旁路译码二进制位148。例如,经上下文译码二进制位144可使用上下文自适应性译码过程(例如,CABAC)的上下文译码模式来译码,而经旁路译码二进制位148可使用固定概率(例如,CABAC旁路译码模式)来译码。
根据本发明的方面,经上下文译码二进制位144经分群以用于在旁路二进制位148之前被译码。即,在图6中所示的实例中,经上下文译码二进制位144包含具有第一参考索引(ref_idx_L0)的经上下文译码二进制位、具有第二参考索引(ref_idx_L1)的经上下文译码二进制位、具有第一运动向量预测子索引(mvp_idx_L0)的经上下文译码二进制位、具有第二运动向量预测子索引(mvp_idx_L1)的经上下文译码二进制位、具有第一运动向量差(mvd_L0)的经上下文译码二进制位和具有第二运动向量差(mvd_L1)的经上下文译码二进制位。另外,经旁路译码二进制位148包含具有第一运动向量差(mvd_L0)的经旁路译码二进制位和具有第二运动向量差(mvd_L1)的经旁路译码二进制位。
在一些实例中,可基于正译码的语法元素的二进制位数目而对二进制位分群。在实例中,为说明的目的,视频译码器(例如,视频编码器20或视频解码器30)可使用上下文译码来译码运动向量差值之前两个二进制位,且使用旁路译码来译码剩余二进制位。因此,在此实例中,经上下文译码二进制位144可包含第一运动向量差(mvd_L0)和第二运动向量差值(mvd_L1)两者之前两个二进制位,而经旁路译码二进制位148可包含运动向量差值的剩余二进制位。
图6中所示的语法元素的排序仅为实例的目的而提供。在其它实例中,语法元素可以不同方式排序,例如,其中参考索引值、运动向量预测子和运动向量差值呈交替次序(或交错)。即,在另一实例中,视频译码器可如下译码PU:具有参考索引L0的经上下文译码二进制位、具有参考索引L1的经上下文译码二进制位、具有参考索引L0的经旁路模式译码二进制位、具有参考索引L1的经旁路模式译码二进制位。在再其它实例中, 旁路二进制位148可在经上下文译码二进制位144之前被译码。
在任何状况下,图6展示具有一或多个经上下文译码二进制位144的群组和一或多个经旁路译码二进制位148的群组的预测数据。如上文所指出,以此方式将经上下文译码二进制位与经旁路译码二进制位分群可减少与译码二进制位相关联的潜时。例如,视频译码器可译码所有经上下文译码二进制位144,进行从上下文译码到旁路译码的单一转变,且译码所有经旁路译码二进制位。避免在上下文译码与旁路译码之间的多次转变可通过限制与在上下文译码与旁路译码之间转变相关联的潜时而增加效率。
在一些实例中,如图6中所示,经上下文译码二进制位与经旁路译码二进制位可针对视频数据的块(例如,逐个PU地)而分群。在其它实例中,经上下文译码二进制位与经旁路译码二进制位可针对CU(例如,LCU的一或多个CU)、针对整个LCU,或针对视频数据的整个切片而分群。在这些实例中,经上下文译码二进制位可在CU/LCU/切片的经旁路译码二进制位之前针对CU/LCU/切片分群且译码,或经旁路译码二进制位可在CU/LCU/切片的经上下文译码二进制位之前针对CU/LCU/切片分群且译码。
图7为说明预测数据的另一实例二进制位字串160的框图。在图7的实例中,二进制位字串160包含第一参考索引(ref_idx_L0)、第一运动向量差(mvd_L0)(例如,表示水平分量和垂直分量两者)和第一运动向量预测子索引(mvp_idx_L0),随后为第二参考索引(ref_idx_L1)、第二运动向量差(mvd_L1)(例如,表示水平分量和垂直分量两者)和第二运动向量预测子索引(mvp_idx_L1)。二进制位字串160包含经上下文译码二进制位164和经旁路译码二进制位168。例如,经上下文译码二进制位164可使用上下文自适应性译码过程(例如,CABAC)的上下文译码模式来译码,而经旁路译码二进制位168可使用固定概率(例如,CABAC旁路译码模式)来译码。
根据本发明的方面,类似于图6中所示的实例,经上下文译码二进制位164在旁路二进制位168之前经分群以用于译码。然而,在图7中所示的实例中,参考索引(ref_idx_L0和ref_idx_L1)包含经上下文译码二进制位以及经旁路译码二进制位的组合。即,可根据关于上文的图4所述的实例来译码参考索引,其中一或多个二进制位是使用上下文自适应性模式译码,且一或多个其它二进制位是使用旁路模式译码。
因此,在图7的实例中,经上下文译码二进制位164包含具有第一参考索引(ref_idx_L0)的经上下文译码二进制位、具有第二参考索引(ref_idx_L1)的经上下文译码二进制位、具有第一运动向量预测子索引(mvp_idx_L0)的经上下文译码二进制位、具有第二运动向量预测子索引(mvp_idx_L1)的经上下文译码二进制位、具有第一运动向量差(mvd_L0)(例如,表示水平分量和垂直分量两者)的经上下文译码二进制位和具有第二运 动向量差(mvd_L1)(例如,表示水平分量和垂直分量两者)的经上下文译码二进制位。另外,经旁路译码二进制位168包含具有第一参考索引(ref_idx_L0)的经旁路译码二进制位、具有第二参考索引(ref_idx_L1)的经旁路译码二进制位、具有第一运动向量差(mvd_L0)的经旁路译码二进制位和具有第二运动向量差(mvd_L1)的经旁路译码二进制位。
如上文关于图6所述,可基于正译码的语法元素的二进制位数目而对二进制位进行分群。在实例中,为说明的目的,视频译码器(例如,视频编码器20或视频解码器30)可使用上下文译码来译码运动向量差值之前两个二进制位,且使用旁路译码来译码剩余二进制位。另外,视频译码器可使用上下文译码来译码参考索引之前两个二进制位,且使用旁路译码来译码剩余二进制位。因此,在此实例中,经上下文译码二进制位144可包含第一运动向量差(mvd_L0)和第二运动向量差值(mvd_L1)两者的前两个二进制位,和第一参考索引(ref_idx_L0)和第二参考索引(ref_idx_L1)两者的前两个二进制位。经旁路译码二进制位148可包含运动向量差值和参考索引的剩余二进制位。
将上下文译码二进制位与旁路译码二进制位分群可减少与译码二进制位相关联的潜时。例如,视频译码器可译码所有经上下文译码二进制位144,进行从上下文译码到旁路译码的单一转变,且译码所有经旁路译码二进制位。避免在上下文译码与旁路译码之间的多次转变可通过限制与在上下文译码与旁路译码之间转变相关联的潜时而增加效率。
应理解,可使用任何二进制化方案执行关于图6和图7所述的技术。此外,如上文所指出,语法元素的排序仅为实例的目的而提供。另外,可针对PU、针对一或多个CU、针对整个LCU或针对视频数据的整个切片而对经上下文译码二进制位和经旁路译码二进制位进行分群。在这些实例中,经上下文译码二进制位可在PU/CU/LCU/切片的旁路译码二进制位之前针对PU/CU/LCU/切片分群且译码,或旁路译码二进制位可在PU/CU/LCU/切片的上下文译码二进制位之前针对PU/CU/LCU/切片分群且译码。
图8A和图8B大体说明译码帧间预测方向语法元素。例如,如上文所指出,除计算运动向量之外,运动估计也确定参考帧的索引(ref_idx)和用于B切片的预测方向(inter_pred_idc:从L0向前、从L1向后,或双向,或inter_pred_flag:从LC的单向,或从L0和L1的双向)。运动向量(例如,运动向量的水平分量和垂直分量)、参考帧索引和预测方向通常由编码器熵编码为语法元素,且放置于经编码视频位流中以由视频解码器解码以用于视频解码过程中。这些语法元素可针对帧间译码PU而提供,以准许解码器解码和再现由PU所定义的视频数据。
在一些例子中,列表L0和列表L1参考索引可用以用信号发送用于双向预测模式(Pred_BI)的参考索引,且组合式列表(LC)参考索引用以用信号发送用于单向预测模式(Pred_LC)的参考索引。LC参考索引为组合式参考图片列表的参考索引,其包含来自列表L0和L1的参考图片与根据预定义规则(或显式用信号发送)所去除的重复参考图片的组合。因此,LC参考索引映射到用于列表L0或L1中的一者的参考索引。
在这些例子中,帧间预测方向语法元素(inter_pred_flag)仅具有两个可能值(来自LC的双向或单向)。当帧间预测方向语法元素经二进制化时,仅一二进制位可能需要被译码,以指示帧间预测方向为双向或单向。下文所示的表8说明帧间预测方向语法元素:
表8
在其它实例中,如在由T.Lee和J.Park的提案“关于参考列表组合(On ReferenceList Combination)”(JCTVC-10125,日内瓦,2012年4月)中所提出,组合式列表(LC)可被去除。在这些实例中,改为使用具有三个可能值(双向、来自L0的单向或来自L1的单向)的帧间预测方向语法元素(inter_pred_flag or inter_pred_idc)。当预测模式为单向预测模式时,可能需要译码指示Pred_L0或Pred_L1的额外二进制位。
表9说明在帧间预测方向语法元素译码中的改变(相对于上文的表8):
表9
图8A说明上文关于表9所述的译码结构。如图8A中所示,可通过使用两个二进制位的CABAC过程来译码帧间预测方向语法元素(inter_pred_flag)。第一二进制位(bin(0))指示帧间预测模式为单向(bin(0)=0)或双向(pred_BI)(bin(0)=1)。仅在第一二进制位指示单向预测模式时,才有条件地译码第二二进制位。第二二进制位(bin(1))指示单向预测模式是来自List0(pred_L0)(bin(1)=0)或来自List1(pred_L1)(bin(1)=1)。
可基于CU深度来确定针对仅具有两个可能值(来自LC的双向或单向)的帧间预测方向的上下文模型索引推导,所述CU深度可针对第一二进制位(bin0)具有在范围0到3中的值,如在下文的方程序中所示:
ctxIdx=cuDepth
在图8A的实例中,可用额外上下文来译码第二二进制位(bin(1)),或可通过再使用第一二进制位(bin(0))的一个上下文来译码第二二进制位(bin(1))。然而,引入额外上下文可增加与译码帧间预测方向语法元素相关联的复杂性。此外,再使用第一二进制位的上下文中的一者可减少用于译码bin0的上下文的数目,且视频译码器必须针对此条件执行附加检查。
图8B为说明根据本发明的方面的旁路译码帧间预测方向语法元素的框图。如图8B中所示,可通过CABAC过程上下文来译码帧间预测方向语法元素(inter_pred_flag)的第一二进制位(bin(0)),且可通过CABAC过程的旁路模式来译码第二二进制位(bin(1))。第一二进制位(bin(0))指示帧间预测模式为单向(bin(0)=0)或双向(pred_BI)(bin(0)=1)。在此实例中,可使用四个可能的上下文中的一者来译码bin(0),ctxIdx=0到3。仅在第一二进制位指示单向预测模式时,才可有条件地译码第二二进制位(bin(1))。第二二进制位(bin(1))指示单向预测模式是来自List0(pred_L0)(bin(1)=0)或来自List1(pred_L1)(bin(1)=1)。根据本发明的方面,bin(1)可不使用上下文来译码(例如,使用CABAC过程的旁路模式来译码)。
以此方式,根据本发明的方面,视频译码器(例如,视频编码器20或视频解码器30)可二进制化帧间预测方向值,且通过旁路模式译码经二进制化的帧间预测方向值的至少一个二进制位。更明确而言,视频译码器可选择上下文以通过CABAC过程上下文译码用于帧间预测方向值的第一二进制位(bin(0)),且通过CABAC过程的旁路模式译码第二二进制位(bin(1))。替代地,所述技术使得视频译码器能够通过旁路模式译码用于帧间预测方向值的第一二进制位(bin(0)),且也通过旁路模式译码第二二进制位(bin(1))。因此,可节省可用于译码bin(0)的四个上下文,ctxIdx=0到3。
在不需要任何附加上下文或再使用上下文(例如,bin0的上下文)的情况下,所述技术实现具有三个可能值(双向、来自L0的单向或来自L1的单向)的帧间预测方向语法元素的译码。此外,所述技术在不需要上下文的情况下使用旁路模式,此与上下文译码相比在计算上可为较不复杂的。
图9为说明根据本发明的方面的熵编码参考索引值的实例的流程图。尽管为解释的目的大体描述为由视频编码器20(图1和图2)的组件来执行,但应理解,其它视频译码 单元、处理器、处理单元、基于硬件的译码单元(例如,编码器/解码器(CODEC))和类似者也可经配置以执行图9的过程。
在图9的实例中,视频编码器20二进制化所接收语法元素(180)。视频编码器20可根据本发明中所述的二进制化过程中的任一者来二进制化语法元素。实例二进制化过程包含一元、截断式一元、指数-哥伦布或类似者。
视频编码器20确定经二进制化的语法元素是否为参考索引值(182)。再次,参考索引值为帧间预测的目的在参考图片列表中大体识别参考图片。如果经二进制化的语法元素为参考索引值(步骤182的“是”分支),那么视频编码器20可使用上下文自适应性译码(例如,CABAC)编码经二进制化的参考索引值的至少一个二进制位(184)。另外,视频编码器20可使用旁路译码编码经二进制化的参考索引值的至少另一二进制位(在存在待译码的额外二进制位的例子中),所述旁路译码绕过上下文自适应性译码引擎(186)。
如上文关于图4所述,在一些实例中,视频编码器20可使用上下文译码来译码一个、两个或三个二进制位。针对经上下文译码二进制位,视频编码器20可基于二进制位在二进制位字串中的相对位置而选择上下文。例如,视频编码器20可选择不同于针对第二二进制位的上下文的针对第一二进制位的上下文。
在任何状况下,视频编码器20可组合经上下文译码二进制位与经旁路译码二进制位以形成经编码位流188。在一些实例中,如果正译码的语法元素并非参考索引值(步骤182的“否”分支),那么视频编码器20可选择特定译码模式(例如,旁路或上下文自适应性)以译码语法元素(190)。视频编码器20可使用所选择模式编码语法元素(192),且形成经编码位流(188)。
也应理解,关于图9展示和描述的步骤系仅作为一个实例而提供。即,图9的方法的步骤未必以图9中所示的次序来执行,且可执行较少、额外或替代性步骤。例如,在一些例子中,视频编码器20可在二进制化语法元素(步骤180)之前确定语法元素是否为参考索引(步骤182)。
图10为说明根据本发明的方面的熵解码参考索引值的实例的流程图。尽管为解释的目的大体描述为由视频解码器30(图1和图3)的组件来执行,但应理解,其它视频译码单元、处理器、处理单元、基于硬件的译码单元(例如,编码器/解码器(CODEC))和类似者也可经配置以执行图10的过程。
视频解码器30可最初剖析来自经编码位流的经译码语法元素(200)。例如,视频解码器30可根据特定剖析过程(例如,波前剖析)从经编码位流读取和分段经译码语法元素。经译码语法元素可包含多个经译码二进制位,即,二进制值。
视频解码器30也可确定当前正解码的位流部分是否为参考索引值(202)。如果视频解码器30正解码参考索引值(步骤202的“是”分支),那么视频解码器30可使用上下文自适应性译码来解码至少一个二进制位(206)。另外,视频解码器30可使用旁路译码来解码至少另一二进制位(在存在待译码的额外二进制位的例子中)(208)。如上文关于图9所指出,在一些实例中,视频解码器30可使用上下文译码来译码一个、两个或三个二进制位。针对经上下文译码二进制位,视频解码器30可基于二进制位在二进制位字串中的相对位置而选择上下文。例如,视频解码器30可选择不同于针对第二二进制位的上下文的针对第一二进制位的上下文。
在解码二进制位以产生经解码二进制值之后,视频解码器30可二进制化经解码二进制位字串以产生经解码语法元素(208)。例如,视频解码器30可使用预定过程将经解码二进制位字串映射到语法元素。即,在一些例子中,视频解码器30可接收特定二进制位是针对语法元素的最后二进制位的指示。在完成语法元素后,接着,视频解码器30可随即使用二进制化表将二进制位字串映射到语法元素。
在一些实例中,如果正译码的语法元素并非参考索引值(步骤202的“否”分支),那么视频解码器30可选择特定译码模式(例如,旁路或上下文自适应性)以译码语法元素(210)。视频解码器30可使用所选择模式解码语法元素(212),且二进制化经解码二进制位字串(208)。
也应理解,关于图10展示和描述的步骤仅作为一个实例而提供。即,图10的方法的步骤未必以图10中所示的次序来执行,且可执行较少、额外或替代性步骤。
图11为说明根据本发明的方面的熵编码预测数据的实例的流程图。尽管为解释的目的大体描述为由视频编码器20(图1和图2)的组件来执行,但应理解,其它视频译码单元、处理器、处理单元、基于硬件的译码单元(例如,编码器/解码器(CODEC))和类似者也可经配置以执行图11的过程。
在图11的实例中,视频编码器20可二进制化当前正译码的一或多个语法元素(220)。例如,视频编码器20可二进制化包含一或多个参考索引、运动向量、运动向量预测子、运动向量预测子索引、运动向量差值和类似者的预测数据。
在任何状况下,视频编码器20可确定正译码的语法元素是否包含用于上下文译码的二进制位和用于旁路译码的二进制位(222)。即,视频编码器20可确定语法元素的二进制位是否是使用上下文自适应性译码与旁路译码的混合来译码。如果存在上下文译码与旁路译码的混合(步骤222的“是”分支),那么视频编码器20可将经上下文译码二进制位和经旁路译码二进制位分群(224)。例如,视频编码器20可分离经上下文译码二进 制位与经旁路译码二进制位。
视频编码器20可接着使用(例如)上下文自适应性译码过程(例如,CABAC)来编码经上下文译码二进制位(226)。另外,视频编码器20可使用旁路模式编码经旁路译码二进制位(226)。旁路模式可绕过上下文自适应性译码引擎,且使用固定概率来译码二进制位。
如果正译码的语法元素并不包含经上下文译码二进制位和经旁路译码二进制位两者(步骤222的“否”分支),那么视频编码器20可选择特定译码模式(例如,旁路或上下文自适应性)以译码语法元素(230)。视频编码器20可接着使用所选择模式来编码语法元素(234)。
在一些例子中,可针对两个以上语法元素来执行关于图11所述的二进制位分群。例如,如上文关于图7所述,与PU相关联的所有经上下文译码二进制位可经分群,使得PU的经上下文译码二进制位在一起译码,且PU的经旁路译码二进制位在一起译码。另外,可对CU、LCU或切片层级执行分群。即,在一些实例中,针对CU/LCU/切片的所有经上下文译码二进制位可经分群且在一起译码,藉此使得视频编码器20能够在上下文译码与旁路译码之间进行单一转变。
也应理解,关于图11展示和描述的步骤仅作为一个实例而提供。即,图11的方法的步骤未必以图11中所示的次序来执行,且可执行较少、额外或替代性步骤。例如,尽管图11展示视频编码器20在经旁路译码二进制位之前编码经上下文译码二进制位,但在其它实例中,视频编码器20可在经上下文译码二进制位之前译码经旁路译码二进制位。
图12为说明根据本发明的方面的熵解码预测数据的实例的流程图。尽管为解释的目的大体描述为由视频解码器30(图1和图3)的组件来执行,但应理解,其它视频译码单元、处理器、处理单元、基于硬件的译码单元(例如,编码器/解码器(CODEC))和类似者也可经配置以执行图12的过程。
在图12的实例中,视频解码器30可确定待解码的(一或多个)语法元素(240)。在实例中,视频解码器30可识别与预测数据相关联的语法元素以供解码。视频解码器30也可确定所述(等)语法元素的二进制位是否包含经上下文译码二进制位和经旁路译码二进制位(242)。如果存在上下文译码与旁路译码的混合(步骤242的“是”分支),那么视频解码器30可解码经上下文译码二进制位(244)。视频解码器30也可与经上下文译码二进制位分开地解码经旁路译码二进制位(246)。即,在经上下文译码二进制位在正解码的位流中与经旁路译码二进制位分开地分群的例子中,视频解码器30可与解码经旁路译码二进制位分开地解码所有经上下文译码二进制位。在解码所述二进制位之后,视频解码 器30可二进制化经解码二进制位以形成经解码语法元素(248)。例如,视频解码器30可使用二进制化表或其它二进制化过程将经解码二进制位字串映射到语法元素。
如果正译码的语法元素并不包含经上下文译码二进制位和经旁路译码二进制位两者(步骤242的“否”分支),那么视频解码器30可选择特定译码模式(例如,旁路或上下文自适应性)以译码语法元素(250)。视频解码器30可接着使用所选择模式解码经编码二进制位(252),且二进制化经解码二进制位字串以形成经解码语法元素(248)。
如上文关于图11所述,在一些例子中,可针对两个以上语法元素来执行二进制位分群。例如,可对PU、CU、LCU或切片层级执行分群。即,在一些实例中,针对PU/CU/LCU/切片的所有经上下文译码二进制位可经分群且在一起译码,藉此使得视频解码器30能够在上下文译码与旁路译码之间进行单一转变。
也应理解,关于图12展示和描述的步骤仅作为一个实例而提供。即,图12的方法的步骤未必以图12中所示的次序来执行,且可执行较少、额外或替代性步骤。例如,尽管图12展示视频解码器30在经旁路译码二进制位之前解码经上下文译码二进制位,但在其它实例中,视频解码器30可在经上下文译码二进制位之前解码经旁路译码二进制位。
也应理解,取决于实例,本文中所述的方法中的任一者的某些动作或事件可以不同序列执行、可添加、合并或完全省去(例如,针对实践所述方法来说,并非所有所描述动作或事件是必要的)。此外,在某些实例中,可(例如)通过多线程处理、中断处理或多个处理器同时而非顺序地执行动作或事件。另外,尽管本发明的某些方面为清楚的目的而描述为由单一模块或单元来执行,但应理解,本发明的技术可由与视频译码器相关联的单元或模块的组合来执行。
视频编码器20可实施本发明的技术中的任一者或全部,以用于在视频编码过程中译码参考索引和其它语法元素。同样,视频解码器30可实施这些技术中的任一者或全部,以用于在视频译码过程中译码参考索引和其它语法元素。如本发明中所述的视频译码器可指视频编码器或视频解码器。类似地,视频译码单元可指视频编码器或视频解码器。同样,视频译码可指视频编码或视频解码。
在一或多个实例中,可以硬件、软件、固件或其任何组合实施在本发明中所述且归于视频编码器20、视频解码器30或任何其它处理单元的功能。如果以软件实施,那么所述功能可作为一或多个指令或代码而存储于计算机可读媒体上或通过计算机可读媒体传输,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体(其对应于例如数据存储媒体的有形媒体)或通信媒体,通信媒体包含(例如)根据通信协议促 进计算机程序从一处传送到另一处的任何媒体。以此方式,计算机可读媒体一般可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索指令、代码和/或数据结构以用于实施本发明中所描述的技术的任何可用媒体。计算机程序产品可包含计算机可读媒体。
作为实例而非限制,这些计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可用以存储呈指令或数据结构的形式的所要的程序代码且可由计算机存取的任何其它媒体。又,可将任何连接恰当地称为计算机可读媒体。例如,如果使用同轴缆线、光缆、双绞线、数字用户线(DSL)或无线技术(例如,红外线、无线电和微波)从网站、服务器或其它远端源传输指令,那么同轴缆线、光缆、双绞线、DSL或无线技术(例如,红外线、无线电和微波)包含于媒体的定义中。然而,应理解,计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它暂时性媒体,而替代地针对非暂时性有形存储媒体。如本文所使用,磁盘和光盘包含紧密光盘(CD)、激光光盘、光盘、数字影音光盘(DVD)、软性磁盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘用激光以光学方式再现数据。以上各者的组合也应包含在计算机可读媒体的范围内。
可由例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、场可编程门逻辑阵列(FPGA)或其它等效集成或离散逻辑电路或其任何组合的一或多个处理器来执行指令。视频编码器20或视频解码器30可包含经配置以执行本发明中所述的功能的多种此一或多个处理器中的任一者。因此,如本文所使用的术语“处理器”可指前述结构或适合于实施本文所描述的技术的任何其它结构中的任一者。另外,在一些方面中,可将本文所描述的功能性提供于经配置以用于编码和解码的专用硬件和/或软件模块内,或并入于组合式编解码器中。又,可将所述技术完全实施于一或多个电路或逻辑元件中。
本发明的技术可以广泛多种装置或设备实施,所述装置或设备包含无线手机、集成电路(IC)或一组IC(例如,芯片组)。各种组件、模块或单元描述于本发明中以强调经配置以执行所揭示的技术的装置的功能方面,但未必需要由不同硬件单元来实现。更确切来说,如上文所描述,可将各种单元组合于编解码器硬件单元中,或由互操作性硬件单元(包含如上文所述的一或多个处理器)的集合结合合适的软件和/或固件来提供。
已描述各种实例。这些和其它实例在以下权利要求书的范围内。
Claims (92)
1.一种用于在视频编码过程中编码参考图片索引语法元素的方法,所述方法包括:
二进制化参考图片索引值;
通过上下文自适应性二进制算术译码CABAC过程的上下文译码模式编码经二进制化的参考图片索引值的至少一个二进制位;
确定所述经二进制化的参考图片索引值包括多于通过所述上下文译码模式所译码的所述至少一个二进制位的二进制位;以及
响应于确定所述经二进制化的参考图片索引值包括多于通过所述上下文译码模式所译码的所述至少一个二进制位的二进制位,通过所述CABAC过程的旁路译码模式编码所述经二进制化的参考图片索引值的至少另一二进制位。
2.根据权利要求1所述的方法,
其中通过所述上下文译码模式编码所述经二进制化的参考图片索引值的至少一个二进制位包括:
通过第一上下文编码所述经二进制化的参考图片索引值的第一二进制位,
通过第二上下文编码所述经二进制化的参考图片索引值的第二二进制位,且
其中通过所述旁路译码模式编码所述经二进制化的参考图片索引值的至少另一二进制位包括:
通过所述旁路译码模式编码第三二进制位和在所述第三二进制位之后的所有剩余二进制位。
3.根据权利要求2所述的方法,其中二进制化所述参考图片索引值包括使用组合的截断式一元和指数哥伦布码来二进制化所述参考图片索引值。
4.根据权利要求1所述的方法,其中通过所述旁路译码模式编码所述经二进制化的参考图片索引值的所述至少另一二进制位包括通过一元、截断式一元、哥伦布、指数哥伦布或哥伦布-莱斯译码过程中的至少一者编码所述至少另一二进制位。
5.根据权利要求1所述的方法,其进一步包括:
二进制化与第一参考图片索引相关联的第一运动向量差值的分量,和与第二参考图片索引相关联的第二运动向量差值的分量;
通过所述上下文译码模式编码第一运动向量差值的所述分量的第一部分和所述第二运动向量差值的所述分量的第一部分;以及
通过所述旁路译码模式编码所述第一运动向量差值的所述分量的第二部分和所述第二运动向量差值的所述分量的第二部分。
6.根据权利要求5所述的方法,其进一步包括:
将所述第一运动向量差值的所述分量的所述第一部分和所述第二运动向量差值的所述分量的所述第一部分分群为第一群组,以供通过所述上下文译码模式译码,以及
将第一运动向量差值的所述分量的所述第二部分和所述第二运动向量差值的分量的所述第二部分分群为第二群组,以供通过所述旁路译码模式译码。
7.根据权利要求1所述的方法,
其中通过所述上下文译码模式编码所述经二进制化的参考图片索引值的至少一个二进制位包括:
通过第一上下文编码所述经二进制化的参考图片索引值的第一二进制位,
通过第二上下文编码所述经二进制化的参考图片索引值的第二二进制位,
通过第三上下文编码所述经二进制化的参考图片索引值的第三二进制位,且其中通过所述旁路译码模式编码所述经二进制化的参考图片索引值的至少另一二进制位包括:
通过所述旁路译码模式编码在所述第三二进制位之后的所有剩余二进制位。
8.根据权利要求1所述的方法,
其中通过所述上下文译码模式编码所述经二进制化的参考图片索引值的至少一个二进制位包括:
通过第一上下文编码所述经二进制化的参考图片索引值的第一二进制位,且其中通过所述旁路译码模式编码所述经二进制化的参考图片索引值的至少另一二进制位包括:
通过所述旁路译码模式编码在所述第一二进制位之后的所有剩余二进制位。
9.根据权利要求1所述的方法,
其中二进制化所述参考图片索引值包括一元译码所述参考图片索引值;
其中通过所述上下文译码模式编码所述经二进制化的参考图片索引值的所述至少一个二进制位包括:
通过所述上下文译码模式编码所述经一元译码的参考图片索引值的至少一个二进制位;且
其中通过所述旁路译码模式编码所述经二进制化的参考图片索引值的所述至少另一二进制位包括:
通过所述旁路译码模式编码所述经一元译码的参考图片索引值的至少另一二进制位。
10.根据权利要求9所述的方法,其中一元译码所述参考图片索引值包括截断式一元译码所述参考图片索引值。
11.根据权利要求1所述的方法,其中
二进制化所述参考图片索引值包括一元译码和指数-哥伦布译码所述参考图片索引值;
其中通过所述上下文译码模式编码所述经二进制化的参考图片索引值的所述至少一个二进制位包括:
通过所述上下文译码模式编码所述参考图片索引值的经一元译码部分的至少一个二进制位;且
其中通过所述旁路译码模式编码所述经二进制化的参考图片索引值的所述至少另一二进制位包括:
通过所述旁路译码模式编码所述参考图片索引值的所述经一元译码部分的至少另一二进制位和所述参考图片索引值的经指数-哥伦布译码部分。
12.根据权利要求11所述的方法,其进一步包括在编码所述参考图片索引值的所述经指数-哥伦布译码部分之前,截断所述参考图片索引值的所述经指数-哥伦布译码部分。
13.根据权利要求1所述的方法,
其中二进制化所述参考图片索引值包括一元译码和固定长度译码所述参考图片索引值;
其中通过所述上下文译码模式编码所述经二进制化的参考图片索引值的所述至少一个二进制位包括通过所述上下文译码模式编码所述参考图片索引值的经一元译码部分的至少一个二进制位;且
其中通过所述旁路译码模式编码所述经二进制化的参考图片索引值的所述至少另一二进制位包括通过所述旁路译码模式编码所述经一元译码部分参考图片索引值的至少另一二进制位和所述参考图片索引值的经固定长度译码部分。
14.根据权利要求13所述的方法,其进一步包括在译码所述参考图片索引值的所述经固定长度译码部分之前,截断所述参考图片索引值的所述经固定长度译码部分。
15.根据权利要求1所述的方法,
其中通过所述上下文译码模式编码包括选择用于译码所述经二进制化的参考图片索引值的所述至少一个二进制位的一或多个概率模型,和使用所述所选择的一或多个概率模型编码所述经二进制化的参考图片索引值的所述至少一个二进制位;且
其中通过所述旁路译码模式编码包括:确定固定概率,和使用所述固定概率编码所述经二进制化的参考图片索引值的所述至少另一二进制位。
16.一种用于在视频编码过程中编码参考图片索引语法元素的设备,所述设备包括:
参考图片缓冲器,其经配置以存储一个或多个参考图片;以及
一或多个处理器以:
二进制化所述一个或多个参考图片中的参考图片的参考图片索引值;
通过上下文自适应性二进制算术译码CABAC过程的上下文译码模式编码经二进制化的参考图片索引值的至少一个二进制位;
确定所述经二进制化的参考图片索引值包括多于通过所述上下文译码模式所译码的所述至少一个二进制位的二进制位;以及
响应于确定所述经二进制化的参考图片索引值包括多于通过所述上下文译码模式所译码的所述至少一个二进制位的二进制位,通过所述CABAC过程的旁路译码模式编码所述经二进制化的参考图片索引值的至少另一二进制位。
17.根据权利要求16所述的设备,
其中为了通过所述上下文译码模式编码所述经二进制化的参考图片索引值的至少一个二进制位,所述一或多个处理器经配置以:
通过第一上下文编码所述经二进制化的参考图片索引值的第一二进制位,
通过第二上下文编码所述经二进制化的参考图片索引值的第二二进制位,且
其中为了通过所述旁路译码模式编码所述经二进制化的参考图片索引值的至少另一二进制位,所述一或多个处理器经配置以:
通过所述旁路译码模式编码第三二进制位和在所述第三二进制位之后的所有剩余二进制位。
18.根据权利要求17所述的设备,其中为了二进制化所述参考图片索引值,所述一或多个处理器经配置以使用组合的截断式一元和指数哥伦布码来二进制化所述参考图片索引值。
19.根据权利要求16所述的设备,其中为了通过所述旁路译码模式编码所述经二进制化的参考图片索引值的所述至少另一二进制位,所述一或多个处理器经配置以通过一元、截断式一元、哥伦布、指数哥伦布或哥伦布-莱斯译码过程中的至少一者编码所述至少另一二进制位。
20.根据权利要求16所述的设备,其中所述一或多个处理器经进一步配置以:
二进制化与第一参考图片索引相关联的第一运动向量差值的分量和与第二参考图片索引相关联的第二运动向量差值的分量;
通过所述上下文译码模式编码第一运动向量差值的所述分量的第一部分和所述第二运动向量差值的所述分量的第一部分;以及
通过所述旁路译码模式编码所述第一运动向量差值的所述分量的第二部分和所述第二运动向量差值的所述分量的第二部分。
21.根据权利要求20所述的设备,其中所述一或多个处理器经进一步配置以:
将所述第一运动向量差值的所述分量的所述第一部分和所述第二运动向量差值的所述分量的所述第一部分分群为第一群组,以供通过所述上下文译码模式译码,以及
将第一运动向量差值的所述分量的所述第二部分和所述第二运动向量差值的分量的所述第二部分分群为第二群组,以供通过所述旁路译码模式译码。
22.根据权利要求16所述的设备,
其中为了通过所述上下文译码模式编码所述经二进制化的参考图片索引值的至少一个二进制位,所述一或多个处理器经配置以:
通过第一上下文编码所述经二进制化的参考图片索引值的第一二进制位,
通过第二上下文编码所述经二进制化的参考图片索引值的第二二进制位,
通过第三上下文编码所述经二进制化的参考图片索引值的第三二进制位,且
其中为了通过所述旁路译码模式编码所述经二进制化的参考图片索引值的至少另一二进制位,所述一或多个处理器经配置以:
通过所述旁路译码模式编码在所述第三二进制位之后的所有剩余二进制位。
23.根据权利要求16所述的设备,
其中为了通过所述上下文译码模式编码所述经二进制化的参考图片索引值的至少一个二进制位,所述一或多个处理器经配置以:
通过第一上下文编码所述经二进制化的参考图片索引值的第一二进制位,且
其中为了通过所述旁路译码模式编码所述经二进制化的参考图片索引值的至少另一二进制位,所述一或多个处理器经配置以:
通过所述旁路译码模式编码在所述第一二进制位之后的所有剩余二进制位。
24.根据权利要求16所述的设备,
其中为了二进制化所述参考图片索引值,所述一或多个处理器经配置以一元译码所述参考图片索引值;
其中为了通过所述上下文译码模式编码所述经二进制化的参考图片索引值的所述至少一个二进制位,所述一或多个处理器经配置以:
通过所述上下文译码模式编码所述经一元译码的参考图片索引值的至少一个二进制位;且
其中为了通过所述旁路译码模式编码所述经二进制化的参考图片索引值的所述至少另一二进制位,所述一或多个处理器经配置以:
通过所述旁路译码模式编码所述经一元译码的参考图片索引值的至少另一二进制位。
25.根据权利要求24所述的设备,其中为了一元译码所述参考图片索引值,所述一或多个处理器经配置以截断式一元译码所述参考图片索引值。
26.根据权利要求16所述的设备,
其中为了二进制化所述参考图片索引值,所述一或多个处理器经配置以一元译码和指数-哥伦布译码所述参考图片索引值;
其中为了通过所述上下文译码模式编码所述经二进制化的参考图片索引值的所述至少一个二进制位,所述一或多个处理器经配置以:
通过所述上下文译码模式编码所述参考图片索引值的经一元译码部分的至少一个二进制位;且
其中为了通过所述旁路译码模式编码所述经二进制化的参考图片索引值的所述至少另一二进制位,所述一或多个处理器经配置以:
通过所述旁路译码模式编码所述参考图片索引值的所述经一元译码部分的至少另一二进制位和所述参考图片索引值的经指数-哥伦布译码部分。
27.根据权利要求26所述的设备,其中所述一或多个处理器经进一步配置以在编码所述参考图片索引值的所述经指数-哥伦布译码部分之前,截断所述参考图片索引值的所述经指数-哥伦布译码部分。
28.根据权利要求16所述的设备,
其中为了二进制化所述参考图片索引值,所述一或多个处理器经配置以一元译码和固定长度译码所述参考图片索引值;
其中为了通过所述上下文译码模式编码所述经二进制化的参考图片索引值的所述至少一个二进制位,所述一或多个处理器经配置以通过所述上下文译码模式编码所述参考图片索引值的经一元译码部分的至少一个二进制位;且
其中为了通过所述旁路译码模式编码所述经二进制化的参考图片索引值的所述至少另一二进制位,所述一或多个处理器经配置以通过所述旁路译码模式编码所述经一元译码部分参考图片索引值的至少另一二进制位和所述参考图片索引值的经固定长度译码部分。
29.根据权利要求28所述的设备,其中所述一或多个处理器经进一步配置以在译码所述参考图片索引值的所述经固定长度译码部分之前,截断所述参考图片索引值的所述经固定长度译码部分。
30.根据权利要求16所述的设备,
其中为了通过所述上下文译码模式编码,所述一或多个处理器经配置以选择用于译码所述经二进制化的参考图片索引值的所述至少一个二进制位的一或多个概率模型,和使用所述所选择的一或多个概率模型编码所述经二进制化的参考图片索引值的所述至少一个二进制位;且
其中为了通过所述旁路译码模式编码,所述一或多个处理器经配置以确定固定概率,和使用所述固定概率编码所述经二进制化的参考图片索引值的所述至少另一二进制位。
31.一种用于在视频编码过程中编码参考图片索引语法元素的设备,所述设备包括:
用于二进制化参考图片索引值的装置;
用于通过上下文自适应性二进制算术译码CABAC过程的上下文译码模式编码经二进制化的参考图片索引值的至少一个二进制位的装置;
用于确定所述经二进制化的参考图片索引值包括多于通过所述上下文译码模式所译码的所述至少一个二进制位的二进制位的装置;以及
用于响应于确定所述经二进制化的参考图片索引值包括多于通过所述上下文译码模式所译码的所述至少一个二进制位的二进制位而通过所述CABAC过程的旁路译码模式编码所述经二进制化的参考图片索引值的至少另一二进制位的装置。
32.根据权利要求31所述的设备,
其中用于通过所述上下文译码模式编码所述经二进制化的参考图片索引值的至少一个二进制位的所述装置包括:
用于通过第一上下文编码所述经二进制化的参考图片索引值的第一二进制位的装置,
用于通过第二上下文编码所述经二进制化的参考图片索引值的第二二进制位的装置,且
其中用于通过所述旁路译码模式编码所述经二进制化的参考图片索引值的至少另一二进制位的所述装置包括:
用于通过所述旁路译码模式编码第三二进制位和在所述第三二进制位之后的所有剩余二进制位的装置。
33.根据权利要求32所述的设备,其中用于二进制化所述参考图片索引值的所述装置包括用于使用组合的截断式一元和指数哥伦布码来二进制化所述参考图片索引值的装置。
34.根据权利要求31所述的设备,其中用于通过所述旁路译码模式编码所述经二进制化的参考图片索引值的所述至少另一二进制位的所述装置包括用于通过一元、截断式一元、哥伦布、指数哥伦布或哥伦布-莱斯译码过程中的至少一者编码所述至少另一二进制位的装置。
35.根据权利要求31所述的设备,其进一步包括:
用于二进制化与第一参考图片索引相关联的第一运动向量差值的分量和与第二参考图片索引相关联的第二运动向量差值的分量的装置;
用于通过所述上下文译码模式编码第一运动向量差值的所述分量的第一部分和所述第二运动向量差值的所述分量的第一部分的装置;以及
用于通过所述旁路译码模式编码所述第一运动向量差值的所述分量的第二部分和所述第二运动向量差值的所述分量的第二部分的装置。
36.根据权利要求35所述的设备,其进一步包括:
用于将所述第一运动向量差值的所述分量的所述第一部分和所述第二运动向量差值的所述分量的所述第一部分分群为第一群组以供通过所述上下文译码模式译码的装置,以及
用于将第一运动向量差值的所述分量的所述第二部分和所述第二运动向量差值的分量的所述第二部分分群为第二群组以供通过所述旁路译码模式译码的装置。
37.根据权利要求31所述的设备,
其中用于通过所述上下文译码模式编码所述经二进制化的参考图片索引值的至少一个二进制位的所述装置包括:
用于通过第一上下文编码所述经二进制化的参考图片索引值的第一二进制位的装置,
用于通过第二上下文编码所述经二进制化的参考图片索引值的第二二进制位的装置,
用于通过第三上下文编码所述经二进制化的参考图片索引值的第三二进制位的装置,且
其中用于通过所述旁路译码模式编码所述经二进制化的参考图片索引值的至少另一二进制位的所述装置包括:
用于通过所述旁路译码模式编码在所述第三二进制位之后的所有剩余二进制位的装置。
38.根据权利要求31所述的设备,
其中用于通过所述上下文译码模式编码所述经二进制化的参考图片索引值的至少一个二进制位的所述装置包括:
用于通过第一上下文编码所述经二进制化的参考图片索引值的第一二进制位的装置,且
其中用于通过所述旁路译码模式编码所述经二进制化的参考图片索引值的至少另一二进制位的所述装置包括:
用于通过所述旁路译码模式编码在所述第一二进制位之后的所有剩余二进制位的装置。
39.根据权利要求31所述的设备,
其中用于二进制化所述参考图片索引值的所述装置包括用于一元译码所述参考图片索引值的装置;
其中用于通过所述上下文译码模式编码所述经二进制化的参考图片索引值的所述至少一个二进制位的所述装置包括:
用于通过所述上下文译码模式编码所述经一元译码的参考图片索引值的至少一个二进制位的装置;且
其中用于通过所述旁路译码模式编码所述经二进制化的参考图片索引值的所述至少另一二进制位的所述装置包括:
用于通过所述旁路译码模式编码所述经一元译码的参考图片索引值的至少另一二进制位的装置。
40.根据权利要求39所述的设备,其中用于一元译码所述参考图片索引值的所述装置包括用于截断式一元译码所述参考图片索引值的装置。
41.根据权利要求31所述的设备,
其中用于二进制化所述参考图片索引值的所述装置包括用于一元译码和指数-哥伦布译码所述参考图片索引值的装置;
其中用于通过所述上下文译码模式编码所述经二进制化的参考图片索引值的所述至少一个二进制位的所述装置包括:
用于通过所述上下文译码模式编码所述参考图片索引值的经一元译码部分的至少一个二进制位的装置;且
其中用于通过所述旁路译码模式编码所述经二进制化的参考图片索引值的所述至少另一二进制位的所述装置包括:
用于通过所述旁路译码模式编码所述参考图片索引值的所述经一元译码部分的至少另一二进制位和所述参考图片索引值的经指数-哥伦布译码部分的装置。
42.根据权利要求41所述的设备,其进一步包括用于在编码所述参考图片索引值的所述经指数-哥伦布译码部分之前截断所述参考图片索引值的所述经指数-哥伦布译码部分的装置。
43.根据权利要求31所述的设备,
其中用于二进制化所述参考图片索引值的所述装置包括用于一元译码和固定长度译码所述参考图片索引值的装置;
其中用于通过所述上下文译码模式编码所述经二进制化的参考图片索引值的所述至少一个二进制位的所述装置包括用于通过所述上下文译码模式编码所述参考图片索引值的经一元译码部分的至少一个二进制位的装置;且
其中用于通过所述旁路译码模式编码所述经二进制化的参考图片索引值的所述至少另一二进制位的所述装置包括用于通过所述旁路译码模式编码所述经一元译码部分参考图片索引值的至少另一二进制位和所述参考图片索引值的经固定长度译码部分的装置。
44.根据权利要求43所述的设备,其进一步包括用于在译码所述参考图片索引值的所述经固定长度译码部分之前截断所述参考图片索引值的所述经固定长度译码部分的装置。
45.根据权利要求31所述的设备,
其中用于通过所述上下文译码模式编码的装置包括用于选择用于译码所述经二进制化的参考图片索引值的所述至少一个二进制位的一或多个概率模型的装置,和用于使用所述所选择的一或多个概率模型编码所述经二进制化的参考图片索引值的所述至少一个二进制位的装置;且
其中用于通过所述旁路译码模式编码的装置包括用于确定固定概率的装置,和用于使用所述固定概率编码所述经二进制化的参考图片索引值的所述至少另一二进制位的装置。
46.一种用于在视频解码过程中解码参考图片索引语法元素的方法,所述方法包括:
通过上下文自适应性二进制算术译码CABAC过程的上下文译码模式解码参考图片索引值的至少一个二进制位;
确定经二进制化的参考图片索引值包括多于通过所述上下文译码模式所译码的所述至少一个二进制位的二进制位;
响应于确定所述参考图片索引值包括多于通过所述上下文译码模式所译码的所述至少一个二进制位的二进制位,通过所述CABAC过程的旁路译码模式解码所述参考图片索引值的至少另一二进制位;以及
二进制化所述参考图片索引值。
47.根据权利要求46所述的方法,
其中通过所述上下文译码模式解码所述参考图片索引值的至少一个二进制位包括:
通过第一上下文解码所述参考图片索引值的第一二进制位,
通过第二上下文解码所述参考图片索引值的第二二进制位,且
其中通过所述旁路译码模式解码所述参考图片索引值的至少另一二进制位包括:
通过所述旁路译码模式解码第三二进制位和在所述第三二进制位之后的所有剩余二进制位。
48.根据权利要求47所述的方法,其中二进制化所述参考图片索引值包括使用组合的截断式一元和指数哥伦布码来二进制化所述参考图片索引值。
49.根据权利要求46所述的方法,其中通过所述旁路译码模式解码所述参考图片索引值的所述至少另一二进制位包括通过一元、截断式一元、哥伦布、指数哥伦布或哥伦布-莱斯译码过程中的至少一者解码所述至少另一二进制位。
50.根据权利要求46所述的方法,其进一步包括:
通过所述上下文译码模式解码第一运动向量差值的分量的第一部分和第二运动向量差值的分量的第一部分;
通过所述旁路译码模式解码所述第一运动向量差值的所述分量的第二部分和所述第二运动向量差值的所述分量的第二部分;以及
二进制化与第一参考图片索引相关联的所述第一运动向量差值的所述分量,和与第二参考图片索引相关联的所述第二运动向量差值的所述分量。
51.根据权利要求50所述的方法,其进一步包括:
将所述第一运动向量差值的所述分量的所述第一部分和所述第二运动向量差值的所述分量的所述第一部分分群为第一群组,以供通过所述上下文译码模式译码,以及
将第一运动向量差值的所述分量的所述第二部分和所述第二运动向量差值的分量的所述第二部分分群为第二群组,以供通过所述旁路译码模式译码。
52.根据权利要求46所述的方法,
其中通过所述上下文译码模式解码所述参考图片索引值的至少一个二进制位包括:
通过第一上下文解码所述参考图片索引值的第一二进制位,
通过第二上下文解码所述参考图片索引值的第二二进制位,
通过第三上下文解码所述参考图片索引值的第三二进制位,且
其中通过所述旁路译码模式解码所述参考图片索引值的至少另一二进制位包括:
通过所述旁路译码模式解码在所述第三二进制位之后的所有剩余二进制位。
53.根据权利要求46所述的方法,
其中通过所述上下文译码模式解码所述参考图片索引值的至少一个二进制位包括:
通过第一上下文解码所述参考图片索引值的第一二进制位,且
其中通过所述旁路译码模式解码所述参考图片索引值的至少另一二进制位包括:
通过所述旁路译码模式解码在所述第一二进制位之后的所有剩余二进制位。
54.根据权利要求46所述的方法,
其中通过所述上下文译码模式解码所述参考图片索引值的所述至少一个二进制位包括:
通过所述上下文译码模式解码所述经一元译码的参考图片索引值的至少一个二进制位;
其中通过所述旁路译码模式解码所述索引值的所述至少另一二进制位包括:
通过所述旁路译码模式解码所述经一元译码的参考图片索引值的至少另一二进制位;且
其中二进制化所述参考图片索引值包括一元译码所述参考图片索引值。
55.根据权利要求54所述的方法,其中一元译码所述参考图片索引值包括截断式一元译码所述参考图片索引值。
56.根据权利要求46所述的方法,
其中通过所述上下文译码模式解码所述参考图片索引值的所述至少一个二进制位包括:
通过所述上下文译码模式解码所述参考图片索引值的经一元译码部分的至少一个二进制位;
其中通过所述旁路译码模式解码所述参考图片索引值的所述至少另一二进制位包括:
通过所述旁路译码模式解码所述参考图片索引值的所述经一元译码部分的至少另一二进制位和所述参考图片索引值的经指数-哥伦布译码部分;且
其中二进制化所述参考图片索引值包括一元译码和指数-哥伦布译码所述参考图片索引值。
57.根据权利要求56所述的方法,其进一步包括在解码所述参考图片索引值的所述经指数-哥伦布译码部分之前,截断所述参考图片索引值的所述经指数-哥伦布译码部分。
58.根据权利要求46所述的方法,
其中通过所述上下文译码模式解码所述参考图片索引值的所述至少一个二进制位包括通过所述上下文译码模式解码所述参考图片索引值的经一元译码部分的至少一个二进制位;
其中通过所述旁路译码模式解码所述参考图片索引值的所述至少另一二进制位包括通过所述旁路译码模式解码所述经一元译码部分参考图片索引值的至少另一二进制位和所述参考图片索引值的经固定长度译码部分;且
其中二进制化所述参考图片索引值包括一元译码和固定长度译码所述参考图片索引值。
59.根据权利要求58所述的方法,其进一步包括在译码所述参考图片索引值的所述经固定长度译码部分之前,截断所述参考图片索引值的所述经固定长度译码部分。
60.根据权利要求46所述的方法,
其中通过所述上下文译码模式解码包括选择用于译码所述经二进制化的参考图片索引值的所述至少一个二进制位的一或多个概率模型,和使用所述所选择的一或多个概率模型解码所述经二进制化的参考图片索引值的所述至少一个二进制位;且
其中通过所述旁路译码模式解码包括确定固定概率,和使用所述固定概率解码所述经二进制化的参考图片索引值的所述至少另一二进制位。
61.根据权利要求46所述的方法,其进一步包括:
通过所述CABAC过程的上下文译码模式解码帧间预测方向语法元素的第一二进制位;以及
通过所述CABAC过程的旁路译码模式解码所述帧间预测方向语法元素的第二二进制位。
62.一种用于在视频解码过程中解码参考图片索引语法元素的设备,所述设备包括:
参考图片缓冲器,其经配置以存储一个或多个参考图片;以及
一或多个处理器,其经配置以:
通过上下文自适应性二进制算术译码CABAC过程的上下文译码模式解码参考图片索引值的至少一个二进制位,其中所述参考图片索引值与所述一个或多个参考图片中的参考图片相关联;
确定经二进制化的参考图片索引值包括多于通过所述上下文译码模式所译码的所述至少一个二进制位的二进制位;
响应于确定所述参考图片索引值包括多于通过所述上下文译码模式所译码的所述至少一个二进制位的二进制位,通过所述CABAC过程的旁路译码模式解码所述参考图片索引值的至少另一二进制位;以及
二进制化所述参考图片索引值。
63.根据权利要求62所述的设备,
其中为了通过所述上下文译码模式解码所述参考图片索引值的至少一个二进制位,所述一或多个处理器经配置以:
通过第一上下文解码所述参考图片索引值的第一二进制位,
通过第二上下文解码所述参考图片索引值的第二二进制位,且
其中为了通过所述旁路译码模式解码所述参考图片索引值的至少另一二进制位,所述一或多个处理器经配置以:
通过所述旁路译码模式解码第三二进制位和在所述第三二进制位之后的所有剩余二进制位。
64.根据权利要求63所述的设备,其中为了二进制化所述参考图片索引值,所述一或多个处理器经配置以使用组合的截断式一元和指数哥伦布码来二进制化所述参考图片索引值。
65.根据权利要求62所述的设备,其中为了通过所述旁路译码模式解码所述参考图片索引值的所述至少另一二进制位,所述一或多个处理器经配置以通过一元、截断式一元、哥伦布、指数哥伦布或哥伦布-莱斯译码过程中的至少一者解码所述至少另一二进制位。
66.根据权利要求62所述的设备,其中所述一或多个处理器经进一步配置以:
通过所述上下文译码模式解码第一运动向量差值的分量的第一部分和第二运动向量差值的分量的第一部分;
通过所述旁路译码模式解码所述第一运动向量差值的所述分量的第二部分和所述第二运动向量差值的所述分量的第二部分;以及
二进制化与第一参考图片索引相关联的所述第一运动向量差值的所述分量,和与第二参考图片索引相关联的所述第二运动向量差值的所述分量。
67.根据权利要求66所述的设备,其中所述一或多个处理器经进一步配置以:
将所述第一运动向量差值的所述分量的所述第一部分和所述第二运动向量差值的所述分量的所述第一部分分群为第一群组,以供通过所述上下文译码模式译码,以及
将第一运动向量差值的所述分量的所述第二部分和所述第二运动向量差值的分量的所述第二部分分群为第二群组,以供通过所述旁路译码模式译码。
68.根据权利要求62所述的设备,
其中为了通过所述上下文译码模式解码所述参考图片索引值的至少一个二进制位,所述一或多个处理器经配置以:
通过第一上下文解码所述参考图片索引值的第一二进制位,
通过第二上下文解码所述参考图片索引值的第二二进制位,
通过第三上下文解码所述参考图片索引值的第三二进制位,且
其中为了通过所述旁路译码模式解码所述参考图片索引值的至少另一二进制位,所述一或多个处理器经配置以:
通过所述旁路译码模式解码在所述第三二进制位之后的所有剩余二进制位。
69.根据权利要求62所述的设备,
其中为了通过所述上下文译码模式解码所述参考图片索引值的至少一个二进制位,所述一或多个处理器经配置以:
通过第一上下文解码所述参考图片索引值的第一二进制位,且
其中为了通过所述旁路译码模式解码所述参考图片索引值的至少另一二进制位,所述一或多个处理器经配置以:
通过所述旁路译码模式解码在所述第一二进制位之后的所有剩余二进制位。
70.根据权利要求62所述的设备,
其中为了通过所述上下文译码模式解码所述参考图片索引值的所述至少一个二进制位,所述一或多个处理器经配置以:
通过所述上下文译码模式解码所述经一元译码的参考图片索引值的至少一个二进制位;
其中为了通过所述旁路译码模式解码所述索引值的所述至少另一二进制位,所述一或多个处理器经配置以:
通过所述旁路译码模式解码所述经一元译码的参考图片索引值的至少另一二进制位;且
其中为了二进制化所述参考图片索引值,所述一或多个处理器经配置以一元译码所述参考图片索引值。
71.根据权利要求70所述的设备,其中为了一元译码所述参考图片索引值,所述一或多个处理器经配置以截断式一元译码所述参考图片索引值。
72.根据权利要求62所述的设备,
其中为了通过所述上下文译码模式解码所述参考图片索引值的所述至少一个二进制位,所述一或多个处理器经配置以:
通过所述上下文译码模式解码所述参考图片索引值的经一元译码部分的至少一个二进制位;
其中为了通过所述旁路译码模式解码所述参考图片索引值的所述至少另一二进制位,所述一或多个处理器经配置以:
通过所述旁路译码模式解码所述参考图片索引值的所述经一元译码部分的至少另一二进制位和所述参考图片索引值的一经指数-哥伦布译码部分;且
其中为了二进制化所述参考图片索引值,所述一或多个处理器经配置以一元译码和指数-哥伦布译码所述参考图片索引值。
73.根据权利要求72所述的设备,其中所述一或多个处理器经进一步配置以在解码所述参考图片索引值的所述经指数-哥伦布译码部分之前,截断所述参考图片索引值的所述经指数-哥伦布译码部分。
74.根据权利要求62所述的设备,
其中为了通过所述上下文译码模式解码所述参考图片索引值的所述至少一个二进制位,所述一或多个处理器经配置以通过所述上下文译码模式解码所述参考图片索引值的经一元译码部分的至少一个二进制位;
其中为了通过所述旁路译码模式解码所述参考图片索引值的所述至少另一二进制位,所述一或多个处理器经配置以通过所述旁路译码模式解码所述经一元译码部分参考图片索引值的至少另一二进制位和所述参考图片索引值的一经固定长度译码部分;且
其中为了二进制化所述参考图片索引值,所述一或多个处理器经配置以一元译码和固定长度译码所述参考图片索引值。
75.根据权利要求74所述的设备,其中所述一或多个处理器经进一步配置以在译码所述参考图片索引值的所述经固定长度译码部分之前,截断所述参考图片索引值的所述经固定长度译码部分。
76.根据权利要求62所述的设备,
其中为了通过所述上下文译码模式解码,所述一或多个处理器经配置以选择用于译码所述经二进制化的参考图片索引值的所述至少一个二进制位的一或多个概率模型,和使用所述所选择的一或多个概率模型解码所述经二进制化的参考图片索引值的所述至少一个二进制位;且
其中为了通过所述旁路译码模式解码,所述一或多个处理器经配置以确定固定概率,和使用所述固定概率解码所述经二进制化的参考图片索引值的所述至少另一二进制位。
77.一种用于在视频解码过程中解码参考图片索引语法元素的装置,所述装置包括:
用于通过上下文自适应性二进制算术译码CABAC过程的上下文译码模式解码参考图片索引值的至少一个二进制位的装置;
用于确定经二进制化的参考图片索引值包括多于通过所述上下文译码模式所译码的所述至少一个二进制位的二进制位的装置;
用于响应于确定所述参考图片索引值包括多于通过所述上下文译码模式所译码的所述至少一个二进制位的二进制位而通过所述CABAC过程的旁路译码模式解码所述参考图片索引值的至少另一二进制位的装置;以及
用于二进制化所述参考图片索引值的装置。
78.根据权利要求77所述的装置,
其中用于通过所述上下文译码模式解码所述参考图片索引值的至少一个二进制位的装置包括:
用于通过第一上下文解码所述参考图片索引值的第一二进制位的装置,
用于通过第二上下文解码所述参考图片索引值的第二二进制位的装置,且
其中用于通过所述旁路译码模式解码所述参考图片索引值的至少另一二进制位的装置包括:
用于通过所述旁路译码模式解码第三二进制位和在所述第三二进制位之后的所有剩余二进制位的装置。
79.根据权利要求78所述的装置,其中用于二进制化所述参考图片索引值的装置包括用于使用组合的截断式一元和指数哥伦布码来二进制化所述参考图片索引值的装置。
80.根据权利要求77所述的装置,其中用于通过所述旁路译码模式解码所述参考图片索引值的所述至少另一二进制位的装置包括用于通过一元、截断式一元、哥伦布、指数哥伦布或哥伦布-莱斯译码过程中的至少一者解码所述至少另一二进制位的装置。
81.根据权利要求77所述的装置,其进一步包括:
用于通过所述上下文译码模式解码第一运动向量差值的分量的第一部分和第二运动向量差值的分量的第一部分的装置;
用于通过所述旁路译码模式解码所述第一运动向量差值的所述分量的第二部分和所述第二运动向量差值的所述分量的第二部分的装置;以及
用于二进制化与第一参考图片索引相关联的所述第一运动向量差值的所述分量,和与第二参考图片索引相关联的所述第二运动向量差值的所述分量的装置。
82.根据权利要求81所述的装置,其进一步包括:
用于将所述第一运动向量差值的所述分量的所述第一部分和所述第二运动向量差值的所述分量的所述第一部分分群为第一群组,以供通过所述上下文译码模式译码的装置,以及
用于将第一运动向量差值的所述分量的所述第二部分和所述第二运动向量差值的分量的所述第二部分分群为第二群组,以供通过所述旁路译码模式译码的装置。
83.根据权利要求77所述的装置,
其中用于通过所述上下文译码模式解码所述参考图片索引值的至少一个二进制位的装置包括:
用于通过第一上下文解码所述参考图片索引值的第一二进制位的装置,
用于通过第二上下文解码所述参考图片索引值的第二二进制位的装置,
用于通过第三上下文解码所述参考图片索引值的第三二进制位的装置,且
其中用于通过所述旁路译码模式解码所述参考图片索引值的至少另一二进制位的装置包括:
用于通过所述旁路译码模式解码在所述第三二进制位之后的所有剩余二进制位的装置。
84.根据权利要求77所述的装置,
其中用于通过所述上下文译码模式解码所述参考图片索引值的至少一个二进制位的装置包括:
用于通过第一上下文解码所述参考图片索引值的第一二进制位的装置,且
其中用于通过所述旁路译码模式解码所述参考图片索引值的至少另一二进制位的装置包括:
用于通过所述旁路译码模式解码在所述第一二进制位之后的所有剩余二进制位的装置。
85.根据权利要求77所述的装置,
其中用于通过所述上下文译码模式解码所述参考图片索引值的所述至少一个二进制位的装置包括:
用于通过所述上下文译码模式解码所述经一元译码的参考图片索引值的至少一个二进制位的装置;
其中用于通过所述旁路译码模式解码所述索引值的所述至少另一二进制位的装置包括:
用于通过所述旁路译码模式解码所述经一元译码的参考图片索引值的至少另一二进制位的装置;且
其中用于二进制化所述参考图片索引值的装置包括用于一元译码所述参考图片索引值的装置。
86.根据权利要求85所述的装置,其中用于一元译码所述参考图片索引值的装置包括用于截断式一元译码所述参考图片索引值的装置。
87.根据权利要求77所述的装置,
其中用于通过所述上下文译码模式解码所述参考图片索引值的所述至少一个二进制位的装置包括:
用于通过所述上下文译码模式解码所述参考图片索引值的经一元译码部分的至少一个二进制位的装置;
其中用于通过所述旁路译码模式解码所述参考图片索引值的所述至少另一二进制位的装置包括:
用于通过所述旁路译码模式解码所述参考图片索引值的所述经一元译码部分的至少另一二进制位和所述参考图片索引值的经指数-哥伦布译码部分的装置;且
其中用于二进制化所述参考图片索引值的装置包括用于一元译码和指数-哥伦布译码所述参考图片索引值的装置。
88.根据权利要求87所述的装置,其进一步包括用于在解码所述参考图片索引值的所述经指数-哥伦布译码部分之前,截断所述参考图片索引值的所述经指数-哥伦布译码部分的装置。
89.根据权利要求77所述的装置,
其中用于通过所述上下文译码模式解码所述参考图片索引值的所述至少一个二进制位的装置包括用于通过所述上下文译码模式解码所述参考图片索引值的经一元译码部分的至少一个二进制位的装置;
其中用于通过所述旁路译码模式解码所述参考图片索引值的所述至少另一二进制位的装置包括用于通过所述旁路译码模式解码所述经一元译码部分参考图片索引值的至少另一二进制位和所述参考图片索引值的经固定长度译码部分的装置;且
其中用于二进制化所述参考图片索引值的装置包括用于一元译码和固定长度译码所述参考图片索引值的装置。
90.根据权利要求89所述的装置,其进一步包括用于在译码所述参考图片索引值的所述经固定长度译码部分之前,截断所述参考图片索引值的所述经固定长度译码部分的装置。
91.根据权利要求77所述的装置,
其中用于通过所述上下文译码模式解码的装置包括选择用于译码所述经二进制化的参考图片索引值的所述至少一个二进制位的一或多个概率模型的装置,和用于使用所述所选择的一或多个概率模型解码所述经二进制化的参考图片索引值的所述至少一个二进制位的装置;且
其中用于通过所述旁路译码模式解码的装置包括用于确定固定概率的装置,和用于使用所述固定概率解码所述经二进制化的参考图片索引值的所述至少另一二进制位的装置。
92.根据权利要求77所述的装置,其进一步包括:
用于通过所述CABAC过程的上下文译码模式解码帧间预测方向语法元素的第一二进制位的装置;以及
用于通过所述CABAC过程的旁路译码模式解码所述帧间预测方向语法元素的第二二进制位的装置。
Applications Claiming Priority (13)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261623043P | 2012-04-11 | 2012-04-11 | |
US61/623,043 | 2012-04-11 | ||
US201261637218P | 2012-04-23 | 2012-04-23 | |
US61/637,218 | 2012-04-23 | ||
US201261640568P | 2012-04-30 | 2012-04-30 | |
US61/640,568 | 2012-04-30 | ||
US201261647422P | 2012-05-15 | 2012-05-15 | |
US61/647,422 | 2012-05-15 | ||
US201261665151P | 2012-06-27 | 2012-06-27 | |
US61/665,151 | 2012-06-27 | ||
US13/828,173 | 2013-03-14 | ||
US13/828,173 US9264706B2 (en) | 2012-04-11 | 2013-03-14 | Bypass bins for reference index coding in video coding |
PCT/US2013/034968 WO2013154866A1 (en) | 2012-04-11 | 2013-04-02 | Bypass bins for reference index coding in video coding |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104205830A CN104205830A (zh) | 2014-12-10 |
CN104205830B true CN104205830B (zh) | 2018-01-12 |
Family
ID=49325049
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380019062.0A Active CN104205830B (zh) | 2012-04-11 | 2013-04-02 | 用于在视频译码中的参考索引译码的旁路二进制位的方法、设备及装置 |
Country Status (21)
Country | Link |
---|---|
US (1) | US9264706B2 (zh) |
EP (1) | EP2837178B1 (zh) |
JP (1) | JP6215304B2 (zh) |
KR (1) | KR101706838B1 (zh) |
CN (1) | CN104205830B (zh) |
AU (1) | AU2013246275B2 (zh) |
BR (1) | BR112014025419B1 (zh) |
CA (1) | CA2867756C (zh) |
DK (1) | DK2837178T3 (zh) |
ES (1) | ES2742027T3 (zh) |
HK (1) | HK1201111A1 (zh) |
HU (1) | HUE044738T2 (zh) |
IL (1) | IL234648A (zh) |
MY (1) | MY171168A (zh) |
PH (1) | PH12014502204A1 (zh) |
RU (1) | RU2643655C2 (zh) |
SG (1) | SG11201405754VA (zh) |
TW (1) | TWI520619B (zh) |
UA (1) | UA115142C2 (zh) |
WO (1) | WO2013154866A1 (zh) |
ZA (1) | ZA201407859B (zh) |
Families Citing this family (70)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012134246A2 (ko) | 2011-04-01 | 2012-10-04 | 엘지전자 주식회사 | 엔트로피 디코딩 방법 및 이를 이용하는 디코딩 장치 |
US9379736B2 (en) * | 2011-06-03 | 2016-06-28 | Qualcomm Incorporated | Context-adaptive coding video data |
JP5336004B2 (ja) * | 2011-06-17 | 2013-11-06 | パナソニック株式会社 | 動画像復号化装置 |
US9258565B1 (en) * | 2011-06-29 | 2016-02-09 | Freescale Semiconductor, Inc. | Context model cache-management in a dual-pipeline CABAC architecture |
WO2013067436A1 (en) | 2011-11-04 | 2013-05-10 | Huawei Technologies Co., Ltd. | Binarization of prediction residuals for lossless video coding |
US9584802B2 (en) * | 2012-04-13 | 2017-02-28 | Texas Instruments Incorporated | Reducing context coded and bypass coded bins to improve context adaptive binary arithmetic coding (CABAC) throughput |
RU2608354C2 (ru) * | 2012-07-02 | 2017-01-18 | Самсунг Электроникс Ко., Лтд. | Способ и устройство для кодирования видео и способ и устройство для декодирования видео, определяющие список опорных изображений внешнего прогнозирования в зависимости от размера блока |
KR102167095B1 (ko) * | 2012-07-02 | 2020-10-16 | 엘지전자 주식회사 | 영상 정보 코딩 방법 및 이를 이용하는 장치 |
CN111193929B (zh) * | 2013-12-16 | 2022-04-12 | 浙江大学 | 一种前向双假设编码图像块的编解码方法和装置 |
US9900625B2 (en) * | 2014-03-17 | 2018-02-20 | Mediatek Inc. | Method and apparatus for efficient information coding |
US9842115B2 (en) * | 2014-05-30 | 2017-12-12 | Apple Inc. | Media asset proxies |
US9854253B2 (en) * | 2014-06-30 | 2017-12-26 | Qualcomm Incorporated | Method for motion vector difference (MVD) and intra block copy vector difference (BVD) coding of screen content video data |
GB2530312B (en) * | 2014-09-19 | 2016-09-14 | Imagination Tech Ltd | Data compression |
EP3203743A4 (en) * | 2014-10-31 | 2018-01-10 | Samsung Electronics Co., Ltd. | Method and device for encoding/decoding motion vector |
US9942551B2 (en) * | 2015-01-30 | 2018-04-10 | Qualcomm Incorporated | Palette index grouping for video coding |
US10334248B2 (en) * | 2015-05-29 | 2019-06-25 | Qualcomm Incorporated | Coding data using an enhanced context-adaptive binary arithmetic coding (CABAC) design |
US10708164B2 (en) * | 2016-05-03 | 2020-07-07 | Qualcomm Incorporated | Binarizing secondary transform index |
EP3264763A1 (en) * | 2016-06-29 | 2018-01-03 | Thomson Licensing | Method and apparatus for improved significance flag coding using simple local predictor |
US10986358B2 (en) * | 2016-07-05 | 2021-04-20 | Kt Corporation | Method and apparatus for processing video signal |
US10412390B2 (en) | 2016-07-12 | 2019-09-10 | Mediatek Inc. | Video processing system using low-cost video encoding/decoding architecture |
US10827186B2 (en) * | 2016-08-25 | 2020-11-03 | Intel Corporation | Method and system of video coding with context decoding and reconstruction bypass |
KR20180031944A (ko) | 2016-09-21 | 2018-03-29 | 삼성전자주식회사 | 비디오 디코더 및 이를 포함하는 전자 시스템 |
US10264264B2 (en) * | 2016-09-24 | 2019-04-16 | Apple Inc. | Multi-bin decoding systems and methods |
EP3306924A1 (en) | 2016-10-05 | 2018-04-11 | Thomson Licensing | Method and device for context-adaptive binary arithmetic coding a sequence of binary symbols representing a syntax element related to picture data |
TWI604323B (zh) * | 2016-11-10 | 2017-11-01 | 財團法人工業技術研究院 | 視訊索引建立方法及應用其之裝置 |
KR102414164B1 (ko) | 2017-03-31 | 2022-06-29 | 한국전자통신연구원 | 향상된 산술부호화를 제공하는 영상 처리 방법, 그를 이용한 영상 복호화, 부호화 방법 및 그 장치 |
US10609414B2 (en) * | 2017-05-08 | 2020-03-31 | Qualcomm Incorporated | Context modeling for transform coefficient coding |
CN107300909A (zh) * | 2017-06-30 | 2017-10-27 | 电子科技大学 | 一种基于mvc框架的无人机地面维护系统及方法 |
US10506242B2 (en) * | 2018-01-30 | 2019-12-10 | Google Llc | Efficient context model computation design in transform coefficient coding |
US10869060B2 (en) * | 2018-01-30 | 2020-12-15 | Google Llc | Efficient context model computation design in transform coefficient coding |
CN112106355B (zh) * | 2018-04-13 | 2023-03-21 | 浙江大学 | 一种信息保持编解码方法与装置 |
EP3562162A1 (en) | 2018-04-27 | 2019-10-30 | InterDigital VC Holdings, Inc. | Method and apparatus for video encoding and decoding based on neural network implementation of cabac |
KR20210018254A (ko) * | 2018-06-06 | 2021-02-17 | 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 | 삼차원 데이터 부호화 방법, 삼차원 데이터 복호 방법, 삼차원 데이터 부호화 장치, 및 삼차원 데이터 복호 장치 |
CN110662053B (zh) | 2018-06-29 | 2022-03-25 | 北京字节跳动网络技术有限公司 | 使用查找表的视频处理方法、装置和存储介质 |
CN114466197A (zh) | 2018-06-29 | 2022-05-10 | 北京字节跳动网络技术有限公司 | 用于查找表更新的编码的运动信息的选择 |
WO2020003283A1 (en) | 2018-06-29 | 2020-01-02 | Beijing Bytedance Network Technology Co., Ltd. | Conditions for updating luts |
CA3105330C (en) | 2018-06-29 | 2023-12-05 | Beijing Bytedance Network Technology Co., Ltd. | Interaction between lut and amvp |
CN110662059B (zh) | 2018-06-29 | 2021-04-20 | 北京字节跳动网络技术有限公司 | 使用查找表存储先前编码的运动信息并用其编码后续块的方法和装置 |
CN110662064B (zh) | 2018-06-29 | 2022-06-14 | 北京字节跳动网络技术有限公司 | Lut中的运动候选的检查顺序 |
EP3794825A1 (en) | 2018-06-29 | 2021-03-24 | Beijing Bytedance Network Technology Co. Ltd. | Update of look up table: fifo, constrained fifo |
CN110662054B (zh) | 2018-06-29 | 2023-01-06 | 北京字节跳动网络技术有限公司 | 用于视频处理的方法、装置、计算机可读存储介质 |
KR102648120B1 (ko) | 2018-06-29 | 2024-03-18 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 슬라이스/타일/lcu 행마다의 룩업 테이블 리셋 |
TWI734133B (zh) * | 2018-07-02 | 2021-07-21 | 大陸商北京字節跳動網絡技術有限公司 | 更新查找表的規則 |
CN117676165A (zh) | 2018-09-10 | 2024-03-08 | 华为技术有限公司 | 视频解码方法及视频解码器 |
TW202025760A (zh) | 2018-09-12 | 2020-07-01 | 大陸商北京字節跳動網絡技術有限公司 | 要檢查多少個hmvp候選 |
US11006150B2 (en) | 2018-09-24 | 2021-05-11 | Tencent America LLC | Method and apparatus for video coding |
KR102661759B1 (ko) * | 2018-09-24 | 2024-04-30 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 종속 스칼라 양자화를 사용하거나 이와 조합하는 데에 적합한 변환 계수의 효율적인 코딩 |
US11197017B2 (en) * | 2018-12-06 | 2021-12-07 | Tencent America LLC | Methods and apparatuses for video coding |
US10798397B2 (en) * | 2019-01-02 | 2020-10-06 | Tencent America LLC | Method and apparatus for video coding |
JP7275286B2 (ja) | 2019-01-10 | 2023-05-17 | 北京字節跳動網絡技術有限公司 | Lut更新の起動 |
WO2020143774A1 (en) * | 2019-01-10 | 2020-07-16 | Beijing Bytedance Network Technology Co., Ltd. | Merge with mvd based on geometry partition |
CN113383554B (zh) | 2019-01-13 | 2022-12-16 | 北京字节跳动网络技术有限公司 | LUT和共享Merge列表之间的交互 |
WO2020147773A1 (en) | 2019-01-16 | 2020-07-23 | Beijing Bytedance Network Technology Co., Ltd. | Inserting order of motion candidates in lut |
CN113316934B (zh) * | 2019-01-25 | 2024-03-08 | 寰发股份有限公司 | 带有变换块级别约束的变换系数编码的方法和设备 |
KR20230003269A (ko) * | 2019-02-22 | 2023-01-05 | 엘지전자 주식회사 | 영상 코딩 시스템에서 cclm 예측에 기반한 영상 디코딩 방법 및 그 장치 |
CN111726632B (zh) * | 2019-03-18 | 2022-08-26 | 杭州海康威视数字技术股份有限公司 | 一种编解码方法、装置及其设备 |
WO2020192611A1 (en) | 2019-03-22 | 2020-10-01 | Beijing Bytedance Network Technology Co., Ltd. | Interaction between merge list construction and other tools |
US11604767B2 (en) * | 2019-04-05 | 2023-03-14 | Comcast Cable Communications, Llc | Systems and methods for data distillation |
KR20210142008A (ko) * | 2019-06-17 | 2021-11-23 | 엘지전자 주식회사 | 루마 맵핑 및 크로마 스케일링 기반 비디오 또는 영상 코딩 |
JP7439841B2 (ja) * | 2019-06-25 | 2024-02-28 | エスゼット ディージェイアイ テクノロジー カンパニー リミテッド | ループ内フィルタリングの方法及びループ内フィルタリングの装置 |
US11330298B2 (en) * | 2019-06-25 | 2022-05-10 | Qualcomm Incorporated | Simplified intra chroma mode coding in video coding |
WO2021054776A1 (ko) * | 2019-09-18 | 2021-03-25 | 삼성전자 주식회사 | 움직임 정보의 부호화 장치 및 방법, 및 복호화 장치 및 방법 |
US11973743B2 (en) | 2019-12-13 | 2024-04-30 | TripleBlind, Inc. | Systems and methods for providing a systemic error in artificial intelligence algorithms |
US11431688B2 (en) | 2019-12-13 | 2022-08-30 | TripleBlind, Inc. | Systems and methods for providing a modified loss function in federated-split learning |
US11599671B1 (en) * | 2019-12-13 | 2023-03-07 | TripleBlind, Inc. | Systems and methods for finding a value in a combined list of private values |
US10924460B2 (en) | 2019-12-13 | 2021-02-16 | TripleBlind, Inc. | Systems and methods for dividing filters in neural networks for private data computations |
JP7415030B2 (ja) * | 2020-03-05 | 2024-01-16 | エルジー エレクトロニクス インコーポレイティド | 混成nalユニットタイプに基づく画像符号化/復号化方法及び装置、並びにビットストリームを伝送する方法 |
WO2021179199A1 (en) * | 2020-03-11 | 2021-09-16 | Shenzhen Yunyinggu Technology Co., Ltd. | Methods and systems for compressing and decompressing display demura compensation data |
CN118160303A (zh) * | 2021-11-19 | 2024-06-07 | 北京达佳互联信息技术有限公司 | 用于解码器侧帧内模式推导的方法和设备 |
WO2023114155A1 (en) * | 2021-12-13 | 2023-06-22 | Beijing Dajia Internet Information Technology Co., Ltd. | Methods and devices for decoder-side intra mode derivation |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2301204A1 (en) * | 1996-08-09 | 1999-02-25 | Regents Of The University Of Minnesota | Sugarcane bacilliform virus promoter |
CN1471941A (zh) * | 2002-07-30 | 2004-02-04 | 孙新刚 | 中药痔疮药膏 |
KR20070034917A (ko) * | 2005-09-26 | 2007-03-29 | 삼성전자주식회사 | 엔트로피 코딩의 성능 향상 방법 및 장치, 상기 방법을이용한 비디오 코딩 방법 및 장치 |
WO2009087095A1 (en) * | 2008-01-08 | 2009-07-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Encoding filter coefficients |
CN101668202A (zh) * | 2008-09-01 | 2010-03-10 | 中兴通讯股份有限公司 | 帧内预测模式的选择方法和装置 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5473376A (en) * | 1994-12-01 | 1995-12-05 | Motorola, Inc. | Method and apparatus for adaptive entropy encoding/decoding of quantized transform coefficients in a video compression system |
EP0847650A4 (en) * | 1996-07-03 | 2000-01-05 | Motorola Inc | METHOD AND DEVICE FOR LIMIT-VALUE-BASED ADAPTIVE ENTROPY CODING AND DECODING |
DE69838639T2 (de) * | 1997-02-14 | 2008-08-28 | Nippon Telegraph And Telephone Corp. | Prädiktives kodierungs- und dekodierungsverfahren für dynamische bilder |
CN1160935C (zh) * | 1997-09-02 | 2004-08-04 | 皇家菲利浦电子有限公司 | 信息信号的水印处理 |
US5978494A (en) * | 1998-03-04 | 1999-11-02 | Sensar, Inc. | Method of selecting the best enroll image for personal identification |
US7020342B1 (en) * | 1999-08-27 | 2006-03-28 | Koninklijke Philips Electronics N.V. | Scalable coding |
US20020157116A1 (en) * | 2000-07-28 | 2002-10-24 | Koninklijke Philips Electronics N.V. | Context and content based information processing for multimedia segmentation and indexing |
FR2825538A1 (fr) * | 2001-05-31 | 2002-12-06 | Cit Alcatel | Procede de codage consistant a coder un mot binaire selon une pluralite de tables de codage |
US7142675B2 (en) * | 2002-02-12 | 2006-11-28 | City University Of Hong Kong | Sequence generator and method of generating a pseudo random sequence |
CN1525354A (zh) * | 2003-02-24 | 2004-09-01 | 王雅量 | 利用互联网资源进行语言词汇学习的方法和系统 |
US7630440B2 (en) | 2003-05-28 | 2009-12-08 | Broadcom Corporation | Context adaptive binary arithmetic code decoding engine |
US6900748B2 (en) * | 2003-07-17 | 2005-05-31 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for binarization and arithmetic coding of a data value |
US7599435B2 (en) * | 2004-01-30 | 2009-10-06 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Video frame encoding and decoding |
US7469070B2 (en) * | 2004-02-09 | 2008-12-23 | Lsi Corporation | Method for selection of contexts for arithmetic coding of reference picture and motion vector residual bitstream syntax elements |
US7804903B2 (en) * | 2005-06-27 | 2010-09-28 | Intel Corporation | Hardware-based CABAC decoder |
KR101158439B1 (ko) * | 2005-07-08 | 2012-07-13 | 엘지전자 주식회사 | 영상 신호의 코딩정보를 압축/해제하기 위해 모델링하는 방법 |
WO2007008018A1 (en) * | 2005-07-08 | 2007-01-18 | Lg Electronics Inc. | Method for modeling coding information of a video signal to compress/decompress the information |
KR100644713B1 (ko) | 2005-10-31 | 2006-11-10 | 삼성전자주식회사 | 컨텍스트 기반 적응적 이진 산술 코딩 복호기에서 원소구문을 복호화하는 방법 및 이를 위한 복호화 장치 |
US7983343B2 (en) * | 2006-01-12 | 2011-07-19 | Lsi Corporation | Context adaptive binary arithmetic decoding for high definition video |
RU2407218C2 (ru) * | 2006-07-13 | 2010-12-20 | Квэлкомм Инкорпорейтед | Видеокодирование с высокодетализированной масштабируемостью с использованием выровненных с циклом фрагментов |
TWI403170B (zh) * | 2010-05-21 | 2013-07-21 | Univ Nat Chiao Tung | 背景調適性二進制算術解碼裝置及其解碼方法 |
WO2012134246A2 (ko) * | 2011-04-01 | 2012-10-04 | 엘지전자 주식회사 | 엔트로피 디코딩 방법 및 이를 이용하는 디코딩 장치 |
US20130003829A1 (en) * | 2011-07-01 | 2013-01-03 | Kiran Misra | System for initializing an arithmetic coder |
US9538172B2 (en) | 2012-04-11 | 2017-01-03 | Qualcomm Incorporated | Grouping bypass coded syntax elements in video coding |
US9584802B2 (en) | 2012-04-13 | 2017-02-28 | Texas Instruments Incorporated | Reducing context coded and bypass coded bins to improve context adaptive binary arithmetic coding (CABAC) throughput |
-
2013
- 2013-03-14 US US13/828,173 patent/US9264706B2/en active Active
- 2013-04-02 JP JP2015505786A patent/JP6215304B2/ja active Active
- 2013-04-02 MY MYPI2014702628A patent/MY171168A/en unknown
- 2013-04-02 UA UAA201412158A patent/UA115142C2/uk unknown
- 2013-04-02 KR KR1020147031475A patent/KR101706838B1/ko active IP Right Grant
- 2013-04-02 EP EP13717116.1A patent/EP2837178B1/en active Active
- 2013-04-02 HU HUE13717116 patent/HUE044738T2/hu unknown
- 2013-04-02 RU RU2014145207A patent/RU2643655C2/ru active
- 2013-04-02 CA CA2867756A patent/CA2867756C/en active Active
- 2013-04-02 CN CN201380019062.0A patent/CN104205830B/zh active Active
- 2013-04-02 BR BR112014025419-2A patent/BR112014025419B1/pt active IP Right Grant
- 2013-04-02 AU AU2013246275A patent/AU2013246275B2/en active Active
- 2013-04-02 SG SG11201405754VA patent/SG11201405754VA/en unknown
- 2013-04-02 DK DK13717116.1T patent/DK2837178T3/da active
- 2013-04-02 ES ES13717116T patent/ES2742027T3/es active Active
- 2013-04-02 WO PCT/US2013/034968 patent/WO2013154866A1/en active Application Filing
- 2013-04-11 TW TW102112895A patent/TWI520619B/zh active
-
2014
- 2014-09-15 IL IL234648A patent/IL234648A/en active IP Right Grant
- 2014-09-30 PH PH12014502204A patent/PH12014502204A1/en unknown
- 2014-10-28 ZA ZA2014/07859A patent/ZA201407859B/en unknown
-
2015
- 2015-02-12 HK HK15101566.5A patent/HK1201111A1/zh unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2301204A1 (en) * | 1996-08-09 | 1999-02-25 | Regents Of The University Of Minnesota | Sugarcane bacilliform virus promoter |
CN1471941A (zh) * | 2002-07-30 | 2004-02-04 | 孙新刚 | 中药痔疮药膏 |
KR20070034917A (ko) * | 2005-09-26 | 2007-03-29 | 삼성전자주식회사 | 엔트로피 코딩의 성능 향상 방법 및 장치, 상기 방법을이용한 비디오 코딩 방법 및 장치 |
WO2009087095A1 (en) * | 2008-01-08 | 2009-07-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Encoding filter coefficients |
CN101668202A (zh) * | 2008-09-01 | 2010-03-10 | 中兴通讯股份有限公司 | 帧内预测模式的选择方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
AU2013246275A1 (en) | 2014-10-23 |
RU2643655C2 (ru) | 2018-02-02 |
CN104205830A (zh) | 2014-12-10 |
EP2837178A1 (en) | 2015-02-18 |
PH12014502204B1 (en) | 2014-12-10 |
CA2867756A1 (en) | 2013-10-17 |
US20130272377A1 (en) | 2013-10-17 |
HK1201111A1 (zh) | 2015-08-21 |
BR112014025419B1 (pt) | 2023-02-28 |
SG11201405754VA (en) | 2014-10-30 |
KR101706838B1 (ko) | 2017-02-14 |
BR112014025419A8 (pt) | 2021-06-22 |
IL234648A (en) | 2016-08-31 |
ES2742027T3 (es) | 2020-02-12 |
BR112014025419A2 (zh) | 2017-06-20 |
MY171168A (en) | 2019-09-30 |
RU2014145207A (ru) | 2016-05-27 |
HUE044738T2 (hu) | 2019-11-28 |
DK2837178T3 (da) | 2019-08-19 |
KR20150003299A (ko) | 2015-01-08 |
UA115142C2 (uk) | 2017-09-25 |
CA2867756C (en) | 2018-07-10 |
JP6215304B2 (ja) | 2017-10-18 |
PH12014502204A1 (en) | 2014-12-10 |
JP2015513290A (ja) | 2015-04-30 |
TW201408073A (zh) | 2014-02-16 |
ZA201407859B (en) | 2017-04-26 |
EP2837178B1 (en) | 2019-05-15 |
WO2013154866A1 (en) | 2013-10-17 |
TWI520619B (zh) | 2016-02-01 |
AU2013246275B2 (en) | 2016-09-15 |
US9264706B2 (en) | 2016-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104205830B (zh) | 用于在视频译码中的参考索引译码的旁路二进制位的方法、设备及装置 | |
CN103947120B (zh) | 使用二进制算术译码过程熵译码视频数据的方法及其设备 | |
CN104054341B (zh) | 用于上下文自适应性二进制算术译码系数层级译码的通过量改进 | |
CN103339936B (zh) | 用于视频译码的单一参考图片列表建构 | |
CN104040900B (zh) | 用于对视频数据进行编码和解码的方法和设备 | |
CN104025457B (zh) | 用于最后有效系数位置译码的上下文最优化 | |
CN103959775B (zh) | 一种视频数据编解码的方法及设备 | |
CN103828374B (zh) | 参考图片信令和经解码图片缓冲器管理 | |
CN103299621B (zh) | 用于视频译码中的一般化p/b帧的参考图片列表构造 | |
CN103329525B (zh) | 用于视频译码的组合参考图片列表建构 | |
CN105474641B (zh) | 视频译码过程中用于系数层级译码的莱斯(rice)参数初始化 | |
CN103190147B (zh) | 用于视频译码的语法元素的联合译码方法及设备 | |
CN103430539B (zh) | 经解码图片缓冲器管理 | |
CN104255035B (zh) | 视讯译码中的量化参数(qp)译码 | |
CN104272742B (zh) | 加权预测参数译码 | |
CN103636224B (zh) | 用于视频压缩中的系数等级译码的上下文 | |
CN107667531A (zh) | 使用增强型上下文自适应二进制算术译码设计来译码数据 | |
CN108353167A (zh) | 译码视频数据的正负号信息 | |
CN107925764A (zh) | 视频译码中的系数等级译码 | |
CN103202016A (zh) | 用于视频译码的自适应运动向量分辨率信令 | |
CN103891281A (zh) | 检测用于视频译码的相邻视频单元的可用性 | |
CN106664425A (zh) | 视频译码中的跨分量预测 | |
CN105723707A (zh) | 用于视频译码的色彩残差预测 | |
CN107211125A (zh) | 预测单元的灵活分割 | |
CN104221380A (zh) | 用于并行运动估计的共同空间候选块 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1201111 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1201111 Country of ref document: HK |