CN104509111A

CN104509111A - 样本自适应偏移(sao)译码

Info

Publication number: CN104509111A
Application number: CN201380031763.6A
Authority: CN
Inventors: 钟仁肃; 霍埃尔·索赖·罗哈斯; 马尔塔·卡切维奇
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2012-06-18
Filing date: 2013-06-18
Publication date: 2015-04-08
Also published as: IN2014MN02388A; US20130336386A1; WO2013192181A1; EP2862354A1

Abstract

根据本发明的技术的视频译码器可对前缀值进行译码且对后缀值进行译码，使得所述后缀值与所述前缀值的组合识别针对样本自适应偏移滤波SAO操作确定的偏移值。

Description

样本自适应偏移(SAO)译码

本申请案主张2012年6月18日申请的第61/661,240号美国临时专利申请案的权益，所述申请案的整个内容以引用方式并入本文。

技术领域

本发明涉及视频译码，且更特定来说涉及用于样本自适应偏移(SAO)偏移译码的技术。

背景技术

数字视频能力可并入到广泛范围的装置中，包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的“智能电话”、视频电话会议装置、视频流式传输装置，及其类似物。数字视频装置实施视频压缩技术，例如在由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分高级视频译码(AVC)、当前在开发的高效视频译码(HEVC)标准所定义的标准和这些标准的扩展中所描述的技术。视频装置可通过实施此类视频压缩技术来更有效地发射、接收、编码、解码和/或存储数字视频信息。

视频压缩技术执行空间(图片内)预测和/或时间(图片间)预测以减少或移除视频序列中固有的冗余。针对基于块的视频译码，视频切片(即，视频帧或视频帧的一部分)可分割为若干视频块，所述视频块也可被称为树块、译码单元(CU)和/或译码节点。图片的经帧内译码(I)切片中的视频块是相对于同一图片中的相邻块中的参考样本使用空间预测来编码。图片的经帧间译码(P或B)切片中的视频块可相对于同一图片中的相邻块中的参考样本使用空间预测，或相对于其它参考图片中的参考样本使用时间预测。图片可称为帧，且参考图片可称为参考帧。

空间或时间预测针对待译码的块产生预测性块。残余数据表示在待译码的原始块与预测性块之间的像素差。经帧间译码块是根据指向形成预测性块的参考样本的块的运动向量及指示在经译码块与预测性块之间的差的残余数据来编码。经帧内译码块是根据帧内译码模式及残余数据来编码。为进行进一步压缩，可将残余数据从像素域变换到变换域，从而产生接着可被量化的残余变换系数。最初以二维阵列布置的经量化变换系数可经扫描，以便产生变换系数的一维向量，且可应用熵译码以实现甚至更多的压缩。

发明内容

本发明描述涉及样本自适应偏移(SAO)滤波的技术，且更特定来说，本发明描述用于在视频数据的经编码位流中用信号发送可在SAO滤波操作中使用的偏移值的技术。根据本发明的技术，可使用前缀值和后缀值来用信号发送偏移值，其中后缀值与前缀值的组合识别偏移值。前缀值可例如为截断一元值，且后缀值可为固定长度码字。

在一个实例中，用于对视频数据进行解码的方法包含：接收经编码视频数据位流中的前缀值；接收所述经编码视频数据位流中的后缀值；且确定用于样本自适应偏移滤波(SAO)操作的偏移值，使得所述后缀值与所述前缀值的组合识别所述偏移值。

在另一实例中，用于对视频数据进行编码的方法包含：确定用于样本自适应偏移滤波(SAO)操作的偏移值；产生前缀值；且产生后缀值，其中所述后缀值与所述前缀值的组合识别所述偏移值。

在另一实例中，用于对视频数据进行解码的设备包含视频解码器，其经配置以接收经编码视频数据位流中的前缀值；接收所述经编码视频数据位流中的后缀值；且确定用于样本自适应偏移滤波(SAO)操作的偏移值；其中所述后缀值与所述前缀值的组合识别所述偏移值。

在另一实例中，用于对视频数据进行编码的设备包含视频编码器，其经配置以确定用于样本自适应偏移滤波(SAO)操作的偏移值；产生前缀值；且产生后缀值，使得所述后缀值与所述前缀值的组合识别所述偏移值。

在另一实例中，用于对视频数据进行译码的设备包含：用于确定用于样本自适应偏移滤波(SAO)操作的偏移值的装置；用于对前缀值进行译码的装置；以及用于对后缀值进行译码的装置，其中所述后缀值与所述前缀值的组合识别所述偏移值。

在另一实例中，一种存储指令的计算机可读存储媒体，所述指令在执行时致使一或多个处理器：确定用于样本自适应偏移滤波(SAO)操作的偏移值；对前缀值进行译码；且对后缀值进行译码，其中所述后缀值与所述前缀值的组合识别所述偏移值。

在附图和以下描述中陈述一或多个实例的细节。从描述和附图以及从权利要求书将明了其它特征、目标和优点。

附图说明

图1是说明可利用本发明中描述的技术的实例性视频编码和解码系统的框图。

图2A到2D是说明用于样本自适应偏移译码的实例性边缘偏移分类的概念图。

图3是说明用于样本自适应偏移译码的实例性带偏移分类的概念图。

图4是说明可实施本发明中描述的技术的实例性视频编码器的框图。

图5是说明可实施本发明中描述的技术的实例性视频解码器的框图。

图6A是说明可实施本发明中描述的技术的实例性熵编码器的框图。

图6B是说明可实施本发明中描述的技术的实例性熵解码器的框图。

图7是说明根据本发明的技术的用于对视频数据进行编码的方法的流程图。

图8是说明根据本发明的技术的用于对视频数据进行解码的方法的流程图。

具体实施方式

本发明描述涉及样本自适应偏移(SAO)滤波的技术，且更特定来说，本发明描述用于在视频数据的经编码位流中用信号发送可在SAO滤波操作中使用的偏移值的技术。SAO滤波是在视频译码中使用的一类环路滤波。大体上，将偏移值添加到视频帧(例如，经重构图像)中的像素在一些实例中可改善译码而不会大大增加存储或发射经编码视频数据所需的位开销。潜在地得自SAO滤波的译码改进可例如为较接近地类似于原始图像的经解码图像。SAO技术允许取决于像素(或块)分类量度将不同偏移值应用于不同像素(或像素块)，所述量度例如为边缘量度、带量度或其它类型的量度。

在一些配置中，SAO滤波器单元可经配置以执行两种类型的SAO滤波，本发明中大体上称为带偏移滤波和边缘偏移滤波。涉及偏移值的信令的本发明的技术一般适用于两种类型的SAO滤波。SAO滤波器单元还可有时不应用偏移，其如下文将更详细阐释可自身视为第三类SAO滤波。由SAO滤波器应用的偏移滤波的类型可显式地或隐式地用信号发送到视频解码器。当应用边缘偏移滤波时，可基于译码单元的边缘信息来分类像素，且可基于边缘分类针对像素确定偏移。如下文将更详细阐释，通常存在基于边缘的SAO的四种变化，其中将像素的值与其八个相邻像素中的两者进行比较。哪两个像素用于比较取决于使用基于边缘的偏移的哪种变化。基于量值差，将偏移应用于像素值。

当应用带偏移滤波时，可基于像素值(例如强度值)将像素分类到不同的带中，其中每一带具有相关联偏移。带包含某一范围的像素值。举例来说，范围从0到255的像素值可划分为32个相等的带(标记为0到31)，使得像素值0到7是第一带，像素值8到15是第二带，像素值16到23是第三带，且以此类推得到全部三十二个带。所述带可用于确定哪一特定偏移值将应用于像素或像素群组。举例来说，如果像素具有值10(在以上实例中在第二带内，即值8到15内)，那么可将与第二带相关联的偏移添加到像素值。

为了用信号发送和产生用于各种带的偏移的目的，可将带分组为两个或两个以上群组。对于带偏移滤波，可如上所述例如将像素分类为三十二个带(带0到31)，且可将带分组为两个群组(例如，十六个带的两个群组，四个带的一个群组和二十八个带的一个群组，八个带的一个群组和二十四个带的一个群组，或其它此类分组)。带的分组可用于确定在经编码视频位流中用信号发送带的偏移值的程序，和/或可用以确定特定带是否具有除了零之外的偏移值。可使用差分译码技术来用信号发送带的偏移，其中作为当前值与先前值之间的差来用信号发送当前值。

在为包含在高效视频译码(HEVC)标准中而建议的一些技术中，可在切片层级启用和停用SAO滤波，且此外，可针对亮度和色度样本单独地启用和停用SAO滤波。举例来说，对于特定视频数据切片，亮度和色度样本均可经SAO滤波，亮度或色度样本均不可经SAO滤波，或者亮度和色度样本中的一者可经SAO滤波而另一者不可经SAO滤波。当针对切片启用SAO滤波时，则在最大译码单元(LCU)层级用信号发送SAO类型和偏移值。如上文介绍，SAO类型可包含带偏移滤波、边缘偏移滤波或无SAO滤波。因此，即使针对特定切片启用SAO滤波，所述切片的一些LCU也可能未经SAO滤波(即，一些LCU将具有无SAO滤波的SAO类型)。在一些实例中，SAO类型和偏移值是用一系列合并旗标来用信号发送，其中第一合并旗标的真值指示LCU的偏移类型和偏移值是从左边相邻LCU继承的，且第二合并旗标的真值指示SAO类型和偏移值是从上方相邻LCU继承的。如果两个合并旗标为假，那么发送新的SAO类型和新的偏移值用于LCU。

本发明描述用于产生偏移值的二进制表示的技术。根据一些当前使用的技术，使用截断一元译码来二进制化偏移值。在截断一元译码中，一系列1和终止的0用以传达值。举例来说，110表示2，1110表示3，以此类推。最大值(如果已知)可在无终止的0的情况下表示。举例来说，如果值集合具有最大值4，那么3可表示为1110，而4表示为1111。由于4已知为最大值，因此视频译码器可将1111解译为4而无需接收终止的0。偏移值具有取决于内部位深度的最大可能值。举例来说，偏移对于8位位深度可具有值0到7，且对于10位位深度可具有最大值31。使用截断一元译码，当二进制化值时最差情况二进位数目较大(即，对于8位位深度为7，且对于10位位深度为31)。本发明建议用于通过使用SAO的偏移值的不同译码方法来减少最差情况二进位数目的技术。

根据本发明的技术，可使用前缀值和后缀值来传达偏移值，其中后缀值与前缀值的组合识别偏移值。前缀值可为截断一元值，且后缀值可为固定长度码字。以下表1和2提供可如何实施本发明的技术的实例。在表1和2的实例中，前缀值识别偏移值的范围，且后缀值识别所述偏移值范围内的特定偏移值。举例来说，在表2中，位流中的前缀1110识别从4到7的偏移值范围。在位流中可用信号发送固定长度2位后缀值以识别所述偏移值范围内的特定偏移值。举例来说，具有后缀00的前缀1110可用以用信号发送偏移值4，具有后缀01的前缀1110可用以用信号发送偏移值5，具有后缀10的前缀1110可用以用信号发送偏移值6，且具有后缀11的前缀1110可用以用信号发送偏移值7。

本发明的技术通过减少最差情况复杂性情形而潜在地改善译码效率。举例来说，仅使用如上所述的截断一元译码，偏移值31将需要用信号发送31个位。使用本发明的技术，偏移值31可使用仅9个位(即，前缀11111和后缀1111)来用信号发送。

表1-(8位内部位深度情况，最大偏移值＝7)

偏移值	前缀	后缀	后缀范围
					截断一元	固定长度
0	0	-	-
				1	10	-	-
2-3	110	X	0到1
				4-7	111	XX	0到3

表2-(10位内部位深度情况，最大偏移值＝31)

偏移值	前缀	后缀	后缀范围
					截断一元	固定长度
0	0	-	-
				1	10	-	-
2-3	110	X	0到1
				4-7	1110	XX	0到3
8-15	11110	XXX	0到7
				16-31	11111	XXXX	1到15

图1是说明可利用本发明中描述的SAO译码技术的实例性视频编码和解码系统10的框图。如图1中所示，系统10包含源装置12，其产生经编码视频数据以在稍后时间由目的地装置14解码，且如下文将更详细描述，此视频数据的编码和解码可包含对用于SAO滤波中的偏移值进行译码。源装置12和目的地装置14可包括广范围装置中的任一者，包含桌上型计算机、笔记本(即，膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能”电话的电话手持机、所谓的“智能”平板计算机、电视机、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置或类似物。在一些情况下，源装置12和目的地装置14可经配备以用于无线通信。

目的地装置14可经由链路16接收待解码的经编码视频数据。链路16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任一类型的媒体或装置。在一个实例中，链路16可包括用以使得源装置12能够实时地将经编码视频数据直接发射到目的地装置14的通信媒体。经编码视频数据可根据例如无线通信协议等通信标准来调制，且发射到目的地装置14。通信媒体可包括任何无线或有线通信媒体，例如射频(RF)频谱或一或多个物理传输线。通信媒体可形成例如局域网、广域网或全球网(例如，因特网)的基于包的网络的部分。通信媒体可包含路由器、交换器、基站，或可用以促进从源装置12到目的地装置14的通信的任何其它设备。

替代地，经编码数据可从输出接口22输出到存储装置19。类似地，经编码数据可由输入接口从存储装置19存取。存储装置19可包含多种分布式或局部存取的数据存储媒体中的任一者，例如硬驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器，或用于存储经编码视频数据的任何其它合适数据存储媒体。在又一实例中，存储装置19可对应于文件服务器或可保持由源装置12产生的经编码视频的另一中间存储装置。目的地装置14可经由流式传输或下载从存储装置19存取存储的视频数据。文件服务器可为能够存储经编码视频数据且将所述经编码视频数据发射到目的地装置14的任一类型的服务器。实例性文件服务器包含网络服务器(例如，用于网站)、FTP服务器、网络附接存储(NAS)装置或本地磁盘驱动器。目的地装置14可通过包含因特网连接的任一标准数据连接来存取经编码视频数据。这可包含无线信道(例如，Wi-Fi连接)、有线连接(例如，DSL、电缆调制解调器等等)，或适合于存取存储在文件服务器上的经编码视频数据的两者的组合。经编码视频数据从存储装置19的发射可为流式传输发射、下载发射或两者的组合。

本发明的技术不一定限于无线应用或设定。所述技术可应用于视频译码以支持多种多媒体应用中的任一者，例如空中电视广播、电缆电视发射、卫星电视发射、流式传输视频发射(例如，经由因特网)、用于存储在数据存储媒体上的数字视频的编码、存储在数据存储媒体上的数字视频的解码，或其它应用。在一些实例中，系统10可经配置以支持单向或双向视频发射以支持例如视频流式传输、视频重放、视频广播和/或视频电话等应用。

在图1的实例中，源装置12包含视频源18、视频编码器20和输出接口22。在一些情况下，输出接口22可包含调制器/解调器(调制解调器)和/或发射器。在源装置12中，视频源18可包含例如以下各项的源：视频俘获装置(例如摄像机)，含有先前俘获视频的视频存档，用以从视频内容提供者接收视频的视频馈送接口，和/或用于产生计算机图形数据作为源视频的计算机图形系统，或此类源的组合。作为一个实例，如果视频源18为摄像机，那么源装置12和目的地装置14可形成所谓的像机电话或视频电话。然而，本发明中所述的技术一般可适用于视频译码，且可应用于无线和/或有线应用。

可通过视频编码器20编码所俘获、预先俘获或计算机产生的视频。经编码视频数据可经由源装置12的输出接口22直接发射到目的地装置14。经编码视频数据还可(或替代地)存储到存储装置19上供目的地装置14或其它装置稍后存取以用于解码和/或重放。

目的地装置14包含输入接口28、视频解码器30和显示装置32。在一些情况下，输入接口28可包含接收器和/或调制解调器。目的地装置14的输入接口28经由链路16接收经编码视频数据。经由链路16传送或在存储装置19上提供的经编码视频数据可包含多个语法元素，其由视频编码器20产生供视频解码器(例如视频解码器30)用于对视频数据进行解码。此些语法元素可与在通信媒体上发射的经编码视频数据一起包含，存储在存储媒体上，或存储到文件服务器。

显示装置32可与目的地装置14集成或在所述目的地装置的外部。在一些实例中，目的地装置14可包含集成显示装置且还经配置以与外部显示装置介接。在其它实例中，目的地装置14可为显示装置。大体上，显示装置32向用户显示经解码视频数据，且可包括多种显示装置中的任一者，例如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器，或另一类型的显示装置。

视频编码器20和视频解码器30可根据视频压缩标准操作，例如当前在开发的高效视频译码(HEVC)标准，且可符合HEVC测试模型(HM)。布罗斯(Bross)等人的文献HCTVC-I1003“高效视频译码(HEVC)文字规范草案7(也称为“HEVC工作草案7”或“HEVC WD7”)”(ITU-T SG16WP3和ISO/IEC JTC1/SC29/WG11的视频译码联合合作组(JCT-VC)第9次会议，瑞士日内瓦，2012年4月27日到2012年5月7日)，其从2013年6月17日起可从http：//phenix.it-sudparis.eu/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC-I1003-v3.zip下载，且以全文引用方式并入本文。HEVC标准的开发正在进行，且称为“HEVC工作草案10”或“HEVC WD10”的即将到来的HEVC标准的更新草案在布罗斯等人的“对HEVC版本1的编者建议修正”(ITU-T SG16WP3和ISO/IECJTC1/SC29/WG11的视频译码联合合作组(JCT-VC)第13次会议，韩国仁川，2013年4月)中描述，其从2013年6月17日起可从http：//phenix.int-evry.fr/jct/doc_end_user/documents/13_Incheon/wg11/JCTVC-M0432-v3.zip下载，其整个内容以引用方式并入本文。

替代地，视频编码器20和视频解码器30可根据其它专门或行业标准来操作，例如ITU-T H.264标准，替代地称为MPEG4第10部分高级视频译码(AVC)，或此些标准的扩展。然而本发明的技术不限于任一特定译码标准。视频压缩标准的其它实例包含MPEG-2和ITU-T H.263。

虽然图1中未图示，但在一些方面中，视频编码器20和视频解码器30可各自与音频编码器和解码器集成，且可包含适当的MUX-DEMUX单元或其它硬件和软件，以处置共同数据流或单独数据流中的音频和视频两者的编码。如果适用，那么在一些实例中，MUX-DEMUX单元可符合ITU H.223多路复用器协议，或例如用户数据报协议(UDP)等其它协议。

可将视频编码器20和视频解码器30各自实施为多种合适的编码器电路中的任一者，例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件，或其任何组合。当所述技术部分地以软件实施时，装置可将用于所述软件的指令存储在合适的非暂时性计算机可读媒体中，且使用一或多个处理器以硬件执行所述指令以执行本发明的技术。可将视频编码器20和视频解码器30中的每一者包含于一或多个编码器或解码器中，其中任一者可集成为相应装置中的组合式编码器/解码器(CODEC)的部分。

如上文介绍，JCT-VC正在致力于HEVC标准的开发。HEVC标准化努力是基于称为HEVC测试模型(HM)的视频译码装置的演进模型。HM假设视频译码装置相对于根据例如ITU-T H.264/AVC的现有装置的若干额外能力。举例来说，H.264提供九个帧内预测编码模式，而HM可提供多达三十三个帧内预测编码模式。

大体上，HM的工作模型描述了可将视频帧或图片划分为包含亮度和色度样本两者的树块或最大译码单元(LCU)的序列。树块具有与H.264标准的宏块类似的目的。切片包含若干在译码次序上连续的树块。视频帧或图片可经分割为一或多个切片。每一树块可根据四叉树而分裂为若干译码单元(CU)。举例来说，作为四叉树的根节点的树块可经分裂为四个子代节点，且每一子代节点可又为父代节点且经分裂为另外四个子代节点。作为四叉树的叶节点的最终的未分裂子代节点包括译码节点，即经译码视频块。与经译码位流相关联的语法数据可界定可分裂树块的最大次数，且也可界定译码节点的最小大小。

CU包含译码节点以及与译码节点相关联的预测单元(PU)和变换单元(TU)。CU的大小对应于译码节点的大小，且形状必须为正方形。CU的大小的范围可从8x8像素直到具有最大64x64像素更大的树块的大小。每一CU可含有一或多个PU及一或多个TU。与CU相关联的语法数据可描述(例如)CU到一或多个PU的分割。分割模式可在CU是否经跳过或直接模式编码、经帧内预测模式编码或经帧间预测模式编码之间不同。PU的形状可分割为非正方形。与CU相关联的语法数据也可描述(例如)CU根据四叉树到一或多个TU的分割。TU的形状可为正方形或非正方形。

HEVC标准允许根据TU的变换，所述变换针对不同的CU可为不同的。通常基于针对经分割LCU所界定的给定CU内的PU的大小而对TU定大小，但可能并非始终如此。TU通常具有与PU相同的大小，或小于PU。在一些实例中，可使用被称为“残余四叉树”(RQT)的四叉树结构将对应于CU的残余样本再分为若干较小单元。RQT的叶节点可被称为变换单元(TU)。可变换与TU相关联的像素差值以产生可量化的变换系数。

大体上，PU包含与预测过程相关的数据。举例来说，当PU经帧内模式编码时，PU可包含描述用于PU的帧内预测模式的数据。作为另一实例，当PU经帧间模式编码时，PU可包含界定用于PU的运动向量的数据。界定用于PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如，四分之一像素精度或八分之一像素精度)、运动向量所指向的参考图片，和/或用于运动向量的参考图片列表(例如，列表0、列表1，或列表C)。

大体上，TU用于变换和量化过程。具有一或多个PU的给定CU也可包含一或多个变换单元(TU)。在预测之后，视频编码器20可计算对应于PU的残余值。残余值包括像素差值，所述像素差值可变换为变换系数、量化且使用TU扫描以产生用于熵译码的经串行化变换系数。本发明通常使用术语“视频块”来指代CU的译码节点。在一些特定情况下，本发明还可使用术语“视频块”来指代树块，即LCU或CU，其包含译码节点和PU和TU。

视频序列通常包含一系列视频帧或图片。图片群组(GOP)通常包括一系列一或多个视频图片。GOP可在GOP的标头、图片中的一或多者的标头或别处包含描述GOP中包含的图片的数目的语法数据。图片的每一切片可包含描述相应切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块操作以便对视频数据进行编码。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小，且可根据指定译码标准而大小不同。

作为实例，HM支持以各种PU大小进行预测。假设特定CU的大小为2Nx2N，则HM支持以2Nx2N或NxN的PU大小进行帧内预测，及以2Nx2N、2NxN、Nx2N或NxN的对称PU大小进行帧间预测。HM也支持以2NxnU、2NxnD、nLx2N和nRx2N的PU大小进行帧间预测的非对称分割。在非对称分割中，CU的一个方向未分割，而另一方向分割为25％及75％。CU的对应于25％分割的部分是通过“n”跟随有“上”、“下”、“左”或“右”的指示来指示。因此，举例来说，“2NxnU”指代以顶部2Nx0.5N PU及底部2Nx1.5N PU水平分割的2Nx2N CU。

在本发明中，“NxN”和“N乘N”可以可互换地使用以在垂直和水平尺寸方面指代视频块的像素尺寸，例如16x16像素或16乘16像素。大体上，16x16块将在垂直方向上具有16个像素(y＝16)且在水平方向上具有16个像素(x＝16)。同样，NxN块通常在垂直方向上具有N个像素且在水平方向上具有N个像素，其中N表示非负整数值。块中的像素可以布置成行和列。而且，块不需要一定在水平方向上与在垂直方向上具有相同数目的像素。举例来说，块可包括NxM像素，其中M不一定等于N。

在使用CU的PU进行帧内预测性或帧间预测性译码之后，视频编码器20可计算用于CU的TU的残余数据。PU可包括在空间域(也被称为像素域)中的像素数据，且TU可包括在对残余视频数据应用变换之后在变换域中的系数，所述变换例如离散余弦变换(DCT)、整数变换、小波变换，或概念上类似的变换。残余数据可对应于未经编码图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形成包含用于CU的残余数据的TU，且接着变换所述TU以产生用于CU的变换系数。

在应用任何变换以产生变换系数之后，视频编码器20可执行变换系数的量化。量化一般指代其中对变换系数进行量化以可能减少用以表示系数的数据量从而提供进一步压缩的过程。量化过程可减少与系数中的一些或全部相关联的位深度。举例来说，n位值可在量化期间舍入到m位值，其中n大于m。

在一些实例中，视频编码器20可利用预定义扫描次序来扫描经量化变换系数，以产生可经熵编码的串行化向量。在其它实例中，视频编码器20可执行自适应性扫描。在扫描经量化变换系数以形成一维向量之后，视频编码器20可(例如)根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法来对所述一维向量进行熵编码。视频编码器20也可对与经编码视频数据相关联的语法元素进行熵编码，以供视频解码器30用于对视频数据进行解码。

为了执行CABAC，视频编码器20可将上下文模型内的上下文指派给待发射的符号。所述上下文可与(例如)符号的相邻值是否为非零相关。为了执行CAVLC，视频编码器20可针对待发射的符号选择可变长度码。可将VLC中的码字建构成使得相对较短码对应于更有可能的符号，而较长码对应于较不可能的符号。以此方式，与(例如)针对待发射的每一符号使用相等长度码字相比较，使用VLC可实现位节省。概率确定可基于指派给符号的上下文。

当前考虑SAO译码用于采用到HEVC标准中。大体上，将偏移值添加到视频帧中的像素可改善经重构视频质量的质量而不会大大增加存储或发射经编码视频数据所需的位开销。SAO技术允许取决于像素(或块)分类量度将不同偏移值应用于不同像素(或像素块)。可能的分类量度包含带量度和例如边缘量度等活动量度。偏移分类的描述可参见C.-M.傅(C.-M.Fu)、C.-Y.陈(C.-Y.Chen)、C.-Y.蔡(C.-Y.Tsai)、Y.-W.黄(Y.-W.Huang)、S.雷(S.Lei)的“CE13：关于LCU独立解码的样本自适应偏移”(JCT-VC投稿，E049，日内瓦，2011年2月)，其以引用方式并入本文。

在HEVC标准中的当前SAO实施方案中，每一分区(由一组LCU组成)可具有三个偏移类型中的一者，所述偏移类型也称为像素分类。所述三个分类包含无偏移、基于带分类的偏移类型0/1，以及基于边缘分类的类型0/1/2/3。每一带分类偏移类型具有十六个可能的偏移值，而每一基于边缘分类的类型具有四个可能的偏移值。如果选择这些偏移类型中的一者用于分区，那么在经编码视频位流中用信号发送指示对应偏移类型和偏移值的信息。

图2A到2D是展示对于HEVC当前建议的四个可能的边缘偏移分类的概念图。边缘偏移类型基于边缘信息对每一像素进行分类。对于图2A到2D中所示的边缘分类中的每一者，通过将当前像素(C)的值与相邻像素(1和2)的值进行比较来计算当前像素的边缘类型。对于图2A中所示的分类零的SAO边缘偏移(SAO_EO_0)，将当前像素(像素C)与左边相邻像素(像素1)和右边相邻像素(像素1)进行比较。对于图2B中所示的分类一的SAO边缘偏移(SAO_EO_1)，将当前像素(像素C)与上方相邻像素(像素1)和下方相邻像素(像素2)进行比较。对于图2C中所示的分类二的SAO边缘偏移(SAO_EO_2)，将当前像素(像素C)与左上方相邻像素(像素1)和右下方相邻像素(像素2)进行比较。对于图2D中所示的分类三的SAO边缘偏移(SAO_EO_3)，将当前像素(像素C)与右上方相邻像素(像素1)和左下方相邻像素(像素2)进行比较。

四个边缘偏移分类可各自具有具有范围从-2到2的5个可能整数值的边缘类型。起初，当前像素的边缘类型假定为零。如果当前像素C的值等于左边相邻像素和右边相邻像素(1和2)两者的值，那么将边缘类型保持于零。如果当前像素C的值大于相邻像素1的值，那么将边缘类型增加一。如果当前像素C的值小于相邻像素1的值，那么将边缘类型减小一。同样，如果当前像素C的值小于相邻像素2的值，那么将边缘类型增加一，且如果当前像素C的值小于相邻像素2的值，那么将边缘类型减小1。

由此，当前像素C可具有-2、-1、0、1或2的边缘类型。如果当前像素C的值小于相邻像素1和2的值两者，那么边缘类型为-2。如果当前像素C的值小于一个相邻像素但等于另一相邻像素，那么边缘类型为-1。如果当前像素C的值与两个相邻像素相同，或如果当前像素C的值大于一个相邻像素但小于另一相邻像素，那么边缘类型为0。如果当前像素C的值大于一个相邻像素但等于另一相邻像素，那么边缘类型为1。如果当前像素C的值大于相邻像素1和2的值两者，那么边缘类型为2。对于每一非零边缘类型值，确定四个偏移值且在经编码视频位流中用信号发送以由解码器使用(即，eoffset_-2、eoffset_-1、eoffset₁、eoffset₂)。

鉴于以上描述，对于每一边缘偏移分类，可使用以下等式针对像素计算边缘类型值：

EdgeType＝0；

if(C＞Pixel 1)EdgeType＝EdgeType+1；

if(C＜Pixel 1)EdgeType＝EdgeType-1；

if(C＞Pixel 2)EdgeType＝EdgeType+1；

if(C＜Pixel 2)EdgeType＝EdgeType-1；

本发明描述用于在经编码视频位流中用信号发送偏移值的技术。因此，当视频编码器使用基于边缘的SAO对视频数据进行译码时，本发明的技术可用以在经编码视频位流中用信号发送eoffset_-2、eoffset_-1、eoffset₁、eoffset₂的值。

图3是展示可在基于带的SAO分类中使用的实例性带的概念图。图3中的每一矩形表示一个带。图3的实例展示32个带，即带0到31，且所述带中的一些已经标记，例如带0、带8、带24和带31。在一些实施方案中，可使用更多或更少的带。对于基于带的偏移，基于像素值(例如强度值)将像素分类到不同的带中。为了实例的目的，假定像素值范围从0到255(例如，8位位深度)，但也可使用其它范围，例如0到1023(例如，10位位深度)。在此实例中，图3中所示的最大值将等于255，且图3中所示的三十二个带中的每一者将具有8的范围。最左边的带(即，图3中的带0)将为像素值0到7，下一个带(即，图3中的带1)将用于像素值8到15，下一个带(即，带2)将用于像素值16到23，以此类推，直到最右边的带(即，图3中的带31)将用于像素值248到255。对于带偏移，基于像素值(例如强度值)将像素分类到不同的带中。基于像素值落在哪一带中，将偏移添加到像素。举例来说，如果像素具有值19，那么根据此当前实例，像素值落在范围从像素值16到23的带2内。因此，与带2相关联的偏移将添加到像素值19。

为了用信号发送与每一带相关联的偏移值的目的，可将带分组为两个或两个以上群组。在一些实施方案中，将中心的十六个带(带8到23)分类到一个群组中，且将其余的带(带0到7和24到31)分类到第二群组中。对于每一带群组，确定16个偏移值(即，boffset₀、...、boffset₁₅)且在经编码视频位流中用信号发送以由视频解码器使用。在一些实施方案中，用于群组(例如第二群组)的所有偏移值可假定为0，在此情况下在经编码视频位流中不需要包含用于所述群组的偏移值的信令。具有十六个带的两个群组仅是可如何对带进行分组的一个实例。在另一实例中，四个带的群组中的每一带可具有相关联非零偏移值，而其余28个带可全部推断为不具有偏移或具有偏移值0。在其它实例中，可将带分组为三个或三个以上群组，或可处理为一个单个群组。

在图3的实例中，中间十六个带(带8到23)构成第一带群组，而八个最左边的带(带0到7)构成第二带群组的第一部分，且八个最右边的带(带24到31)构成第二带群组的第二部分。对于每一带群组，视频编码器20可确定十六个偏移值(即，boffset₀、...、boffset₁₅)，且在经编码视频位流中用信号发送允许视频解码器30重构十六个偏移值的信息。如果一或多个群组全部假定为不具有非零偏移值，那么可不需要在编码视频位流中显式地用信号发送用于重构所述群组的偏移值的信息。本发明大体上描述用于在经编码视频位流中用信号发送偏移值的技术。因此，视频编码器20使用基于带的SAO对视频数据进行译码，本发明的技术可用以用信号发送boffset₀、...、boffset_N-1的值，其中N表示具有非零偏移值的带的数目。

一些HEVC建议实施偏移值的最大值。举例来说，在HEVC WD7中，对于8位位深度，偏移的最大值设定于7，且对于10位位深度，偏移的最大值设定于31。当前，以截断一元译码来二进制化这些偏移值，如以下表3中所示。

表3-8位内部位深度情况，最大偏移值＝7

偏移值	截断一元
		0	0
1	10
		2	110
3	1110
		4	11110
5	111110
		6	1111110
7	1111111

在表3的实例中，最差情况二进位数目相对大。举例来说，为了对偏移值7进行译码，需要要求7个二进位的7个位。对于10位位深度，最差情况情形甚至更差，可能为31个二进位。如上文介绍，本发明描述可通过使用用于SAO偏移值的不同译码方法来减少最差情况二进位数目的技术。

在以上表1和表2中描述的一个实例中，本发明的技术可将最大二进位数目分别针对8位内部位深度从7减少到5且针对10位内部位深度情况从31减少到9。返回参见表1，5个二进位的最差情况复杂性情形可针对偏移值4到7发生，其是使用3位前缀(在表1的实例中的111)和两位后缀值来用信号发送。返回参见表2，9个二进位的最差情况复杂性情形可针对16与31之间的偏移值发生，其是使用5位前缀(在表2的实例中的11111)和4位后缀来用信号发送。

如表1和2的实例中可见，替代于使用一元码字对偏移值进行译码(如表3中)，可将偏移值译码为前缀值与后缀值的组合，其中前缀值与后缀值的组合识别偏移值。前缀值可为截断一元码，而后缀值可为固定长度码。

作为实例，参见表1，可将偏移值6译码为前缀111与后缀值的组合。还可将偏移值7译码为具有前缀111但具有不同的后缀。用以对偏移值6和7进行译码的后缀值在表1的实例中各自为两个位。因此，用以对偏移值6和7进行译码的总的位是五个位(用于前缀的三个位和用于后缀的两个位)。相比之下，在表3的实例中，需要七个位来对偏移值6和7进行译码。因此，在表1的实例中，本发明的技术将用于对偏移值进行译码的最差情况情形从7个位减少到5个位。然而，表1的最佳情况情形与表2相比保持相同。通过将表3与表1进行比较可见，仍分别以一个和两个位对偏移值0和1进行译码。

以下伪码说明用于确定随着位深度而变(即，针对N位内部位深度情况)的截断点的一个实例性技术。

对于此伪码的技术，截断点取决于内部位深度(即，用于位深度8的bin3，用于位深度9的bin4，和用于位深度10的bin5)。

根据本发明的另一技术，用于对前缀值和后缀值进行译码的二进制化方法可与用于对其它值进行译码的方法相同，以便统一译码过程且减少译码器复杂性。举例来说，本发明的用于对前缀值和后缀值进行译码的二进制化方法可利用与最后位置译码(系数译码中)相同的二进制化方法来潜在地更统一译码过程。

根据本发明的技术，码的前缀部分可以基于上下文的熵译码(例如，上下文自适应二进制算术译码(CABAC))来译码。举例来说，前缀的bin0可以ctx0来译码，且前缀的其它二进位可以ctx1来译码。或bin0以ctx0，bin1以ctx1，且其它的以ctx2。或者前缀部分的仅子集可以上下文来译码(即，前缀部分的仅N个二进位以上下文来译码)。

根据本发明的技术，码的后缀部分可在绕过模式中(即，以固定概率模型)或以上下文(即，具有自适应概率模型)来译码。当使用上下文时，可使用用于所有后缀部分的一个ctx，其可与前缀的最后ctx共享或可具有单独的一或多个上下文。当其以绕过二进位译码时，其可以群组来译码(即，用于4个偏移值的所有绕过二进位是同时译码，而不与前缀交错)。

图4是说明可实施本发明中描述的技术的实例性视频编码器20的框图。视频编码器20可执行视频切片内的视频块的帧内和帧间译码。帧内译码依赖于空间预测来减少或移除给定视频帧或图片内的视频中的空间冗余。帧间译码依赖于时间预测来减少或移除视频序列的邻近帧或图片内的视频中的时间冗余。帧内模式(I模式)可涉及若干基于空间的压缩模式中的任一者。例如单向预测(P模式)或双向预测(B模式)等帧间模式可涉及若干基于时间的压缩模式中的任一者。

在图4的实例中，视频编码器20包含分割单元35、预测处理单元41、求和器50、变换处理单元52、量化单元54、熵编码单元56，和存储器64。预测处理单元41包含运动估计单元42、运动补偿单元44和帧内预测单元46。针对视频块重构，视频编码器20还包含逆量化单元58、逆变换处理单元60、求和器62、解块滤波器72、SAO单元74，和ALF 76。虽然解块滤波器72、SAO单元74和ALF 76在图4中展示为环路内滤波器，但在其它配置中，解块滤波器72、SAO单元74和ALF 76可实施为环路后滤波器。

如图4中所示，视频编码器20接收视频数据，且分割单元35将数据分割为视频块。此分割也可包含分割为切片、瓦片或其它较大单元，以及视频块分割，例如根据LCU和CU的四叉树结构。视频编码器20大体上说明对待编码的视频切片内的视频块进行编码的组件。切片可划分为多个视频块(且可能划分为称为瓦片的视频块集合)。预测处理单元41可基于错误结果(例如，译码速率和失真水平)选择多个可能译码模式中的一者，例如多个帧内译码模式中的一者或多个帧间译码模式中的一者，以用于当前视频块。预测处理单元41可将所得的经帧内或帧间译码的块提供到求和器50以产生残余块数据，且提供到求和器62以重构经编码块以用作参考图片。

预测处理单元41内的帧内预测单元46可相对于与待译码的当前块相同的帧或切片中的一或多个相邻块执行对当前视频块的帧内预测性译码，以提供空间压缩。预测处理单元41内的运动估计单元42及运动补偿单元44相对于一或多个参考图片中的一或多个预测性块执行对当前视频块的帧间预测性译码，以提供时间压缩。

运动估计单元42可经配置以根据视频序列的预定模式来确定用于视频切片的帧间预测模式。所述预定模式可指定序列中的视频切片作为P切片、B切片或GPB切片。运动估计单元42与运动补偿单元44可为高度集成的，但为了概念性目的而单独说明。由运动估计单元42执行的运动估计是产生运动向量的过程，所述向量估计视频块的运动。运动向量例如可指示当前视频帧或图片内的视频块的PU相对于参考图片内的预测性块的位移。

预测性块为就像素差来说被发现紧密匹配待译码的视频块的PU的块，所述像素差可通过绝对差和(SAD)、平方差和(SSD)或其它差量度来确定。在一些实例中，视频编码器20可计算存储在存储器64中的参考图片的子整数像素位置的值。举例来说，视频编码器20可内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此，运动估计单元42可执行相对于全像素位置和分数像素位置的运动搜索，且输出具有分数像素精度的运动向量。

运动估计单元42通过将经帧间译码切片中的视频块的PU的位置与参考图片的预测性块的位置进行比较来计算所述PU的运动向量。参考图片可选自第一参考图片列表(列表0)或第二参考图片列表(列表1)，其各自识别存储在64中的一或多个参考图片。运动估计单元42将所计算的运动向量发送到熵编码单元56和运动补偿单元44。

由运动补偿单元44执行的运动补偿可涉及基于通过运动估计、可能执行达子像素精度的内插而确定的运动向量而取得或产生预测性块。在接收到当前视频块的PU的运动向量后，运动补偿单元44可即刻在参考图片列表中的一者中定位运动向量指向的预测性块。视频编码器20通过从正经译码的当前视频块的像素值减去预测性块的像素值从而形成像素差值，来形成残余视频块。像素差值形成块的残余数据，且可包含亮度和色度差分量。求和器50表示执行此减法运算的一或多个组件。运动补偿单元44还可产生与视频块和视频切片相关联的语法元素以由视频解码器30用于对视频切片的视频块进行解码。

作为对上述由运动估计单元42和运动补偿单元44执行的帧间预测的替代，帧内预测单元46可帧内预测当前块。特定来说，帧内预测单元46可确定使用帧内预测模式来编码当前块。在一些实例中，帧内预测单元46可(例如)在单独的编码遍次期间使用各种帧内预测模式来编码当前块，且帧内预测单元46(或在一些实例中，模式选择单元40)可从所测试的模式选择待使用的适当的帧内预测模式。举例来说，帧内预测单元46可使用针对各种经测试的帧内预测模式的速率-失真分析计算速率-失真值，且在经测试模式当中选择具有最好的速率-失真特性的帧内预测模式。速率-失真分析一般确定经编码块与经编码以产生所述经编码块的原始未经编码块之间的失真(或错误)的量以及用以产生经编码块的位率(即，位的数目)。帧内预测单元46可从失真和速率计算各种经编码块的比率，以确定哪一帧内预测模式展现块的最好的速率-失真值。

在任一情况下，在为块选择帧内预测模式之后，帧内预测单元46可将指示块的所选择帧内预测模式的信息提供到熵编码单元56。熵编码单元56可根据本发明的技术对指示选定帧内预测模式的信息进行编码。视频编码器20可在所发射位流中包含配置数据，其可包含多个帧内预测模式索引表和多个经修改帧内预测模式索引表(也称为码字映射表)、各种块的编码上下文的定义，以及将用于所述上下文中的每一者的最可能帧内预测模式、帧内预测模式索引表和经修改帧内预测模式索引表的指示。

在预测处理单元41经由帧间预测或帧内预测产生当前视频块的预测性块之后，视频编码器20通过从当前视频块减去预测性块而形成残余视频块。残余块中的残余视频数据可包含在一或多个TU中且应用于变换处理单元52。变换处理单元52使用例如离散余弦变换(DCT)或概念上类似的变换等变换将残余视频数据变换为残余变换系数。变换处理单元52可将残余视频数据从像素域转换到变换域，例如频域。

变换处理单元52可将所得变换系数发送到量化单元54。量化单元54量化变换系数以进一步减小位率。量化过程可减少与系数中的一些或全部相关联的位深度。可通过调整量化参数来修改量化程度。在一些实例中，量化单元54可随后执行对包含经量化变换系数的矩阵的扫描。替代地，熵编码单元56可执行扫描。

在量化之后，熵编码单元56对经量化变换系数进行熵编码。举例来说，熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码，或另一熵编码方法或技术。在通过熵编码单元56熵编码之后，可将经编码位流发射到视频解码器30或加以存档以供视频解码器30稍后发射或检索。熵编码单元56还可对正译码的当前视频切片的运动向量和其它语法元素进行熵编码。

逆量化单元58和逆变换处理单元60分别应用逆量化和逆变换，以在像素域中重构残余块以供稍后用作参考图片的参考块。运动补偿单元44可通过将残余块加到参考图片列表中的一者内的参考图片中的一者的预测性块而计算参考块。运动补偿单元44也可将一或多个内插滤波器应用于经重构的残余块，以计算用于运动估计中的子整数像素值。求和器62将经重构的残余块加到由运动补偿单元44产生的经运动补偿预测块，以产生参考块以用于存储在存储器64中。参考块可由运动估计单元42和运动补偿单元44用作参考块，以对后续视频帧或图片中的块进行帧间预测。

在存储在存储器64中之前，经重构残余块可由一或多个滤波器进行滤波。如果需要，那么还可应用解块滤波器72以对经重构残余块进行滤波以便移除成块假象。也可使用例如ALF 76和SAO单元74等其它环路滤波器(译码环路中或在译码环路之后)来平滑像素转变或另外改善视频质量。参考块在由解块滤波器单元72、SAO单元74和ALF76中的一或多者滤波之后可由运动估计单元42和运动补偿单元44用作参考块，以对后续视频帧或图片中的块进行帧间预测。

SAO单元74可以改善视频译码指令的方式确定用于SAO滤波的偏移值。改善视频译码质量可例如涉及确定使经重构图像较接近地匹配于原始图像的偏移值。视频编码器20可例如使用具有不同SAO类型和不同偏移值的多个遍次对视频数据进行译码，且选择提供基于所要速率-失真折中确定的最佳译码质量的SAO类型和偏移值以用于包含在经编码位流中。

在一些配置中，SAO单元74可经配置以应用如上所述的两种类型的偏移(例如，带偏移和边缘偏移)。SAO单元74还可有时不应用偏移，其可自身视为第三类偏移。由SAO单元74应用的偏移的类型可显式地或隐式地用信号发送到视频解码器。当应用边缘偏移时，可根据图2A到2D基于边缘信息来分类像素，且可基于边缘分类确定偏移值。当应用基于带的偏移时，SAO单元74可基于像素值(例如强度值)将像素分类到不同的带中，其中每一带具有相关联偏移。

无论选定SAO类型是否为基于带的SAO或基于边缘的SAO，视频编码器20都可将偏移值译码为前缀值与后缀值的组合。前缀值可例如为截断一元值，其可由熵编码单元56进行CABAC译码。

以此方式，图4的视频编码器20表示视频编码器的实例，其经配置以确定用于SAO操作的偏移值且产生前缀值和后缀值以使得所述后缀值与前缀值的组合识别偏移值。

图5是说明可实施本发明中描述的技术的实例性视频解码器30的框图。在图5的实例中，视频解码器30包含熵解码单元80、预测处理单元81、逆量化单元86、逆变换处理单元88、求和器90、解块滤波器93、SAO单元94、ALF 95，和参考图片存储器92。预测处理单元81包含运动补偿单元82和帧内预测单元84。在一些实例中，视频解码器30可执行与相对于来自图4的视频编码器20所述的编码遍次大体上互逆的解码遍次。

在解码过程期间，视频解码器30从视频编码器20接收表示经编码视频切片的视频块和相关联语法元素的经编码视频位流。视频解码器30的熵解码单元80对位流进行熵解码以产生经量化系数、运动向量和其它语法元素。熵解码单元80将运动向量和其它语法元素转发到预测处理单元81。视频解码器30可在视频切片层级和/或视频块层级处接收语法元素。

当视频切片经译码为经帧内译码(I)切片时，预测处理单元81的帧内预测单元84可基于用信号发送的帧内预测模式和来自当前帧或图片的先前经解码块的数据而产生当前视频切片的视频块的预测数据。当视频帧经译码为经帧间译码(即，B、P或GPB)切片时，预测处理单元81的运动补偿单元82基于运动向量和从熵解码单元80接收的其它语法元素而产生当前视频切片的视频块的预测性块。预测性块可从参考图片列表中的一者内的参考图片中的一者产生。视频解码器30可基于存储在参考图片存储器92中的参考图片使用默认构造技术来构造参考帧列表，列表0和列表1。

运动补偿单元82通过剖析运动向量和其它语法元素来确定当前视频切片的视频块的预测信息，且使用所述预测信息产生正解码的当前视频块的预测性块。举例来说，运动补偿单元82使用所接收语法元素中的一些来确定用以对视频切片的视频块进行译码的预测模式(例如，帧内或帧间预测)、帧间预测切片类型(例如，B切片、P切片或GPB切片)、用于切片的参考图片列表中的一或多者的构造信息、切片的每一经帧间编码视频块的运动向量、切片的每一经帧间译码视频块的帧间预测状态，以及用以对当前视频切片中的视频块进行解码的其它信息。

运动补偿单元82也可执行基于内插滤波器的内插。运动补偿单元82可使用在视频块的编码期间由视频编码器20使用的内插滤波器来计算参考块的子整数像素的经内插值。在此情况下，运动补偿单元82可根据所接收语法元素确定由视频编码器20使用的内插滤波器且使用内插滤波器来产生预测性块。

逆量化单元86逆量化(即，解量化)在位流中提供且由熵解码单元80解码的经量化变换系数。逆量化过程可包含针对视频切片中的每一视频块使用由视频编码器20计算出的量化参数来确定量化程度和(同样)应应用的逆量化的程度。逆变换处理单元88将逆变换(例如，逆DCT、逆整数变换或概念上类似的逆变换过程)应用于变换系数，以便在像素域中产生残余块。

在运动补偿单元82基于运动向量和其它语法元素而产生当前视频块的预测性块之后，视频解码器30通过将来自逆变换处理单元88的残余块与由运动补偿单元82产生的对应预测性块进行求和而形成经解码视频块。求和器90表示执行此求和运算的一或多个组件。由求和器90形成的经解码视频块可随后由解块滤波器93、SAO单元94和ALF 95滤波。随后将给定帧或图片中的经解码视频块存储在参考图片存储器92中，所述参考图片存储器存储用于后续运动补偿的参考图片。参考图片存储器92还存储经解码视频以用于稍后呈现在显示装置(例如图1的显示装置32)上。SAO单元94可经配置以应用与上文论述的SAO单元74相同的滤波(例如，边缘偏移和带偏移)。

以此方式，图5的视频解码器30表示视频解码器的实例，其经配置以接收前缀值，接收后缀值，且基于后缀值与前缀值的组合而确定用于样本自适应偏移滤波操作的偏移值。前缀值可为截断一元值且可使用上下文来译码。在一些实例中，前缀值的子集可使用上下文来译码。后缀值可为固定长度码字且可使用绕过译码来译码。后缀值也可使用上下文来译码。

图6A是说明可根据本发明中描述的技术使用的实例性熵编码单元56的框图。图6A中说明的熵编码单元56可为CABAC编码器。实例性熵编码单元56可包含二进制化单元502、包含绕过编码引擎504和常规编码引擎508的算术编码单元510，以及上下文建模单元506。

熵编码单元56可接收一或多个语法元素，例如上述后缀值和前缀值中的任一者。二进制化单元502接收语法元素且产生二进位串(即，二进制串)。二进制化单元502可使用例如以下技术中的任一者或组合来产生二进位串：固定长度译码、一元译码、截断一元译码、截断莱斯(Rice)译码、哥伦布(Golomb)译码、指数哥伦布译码，和哥伦布-莱斯译码。此外，在一些情况下，二进制化单元502可接收语法元素作为二进制串，且简单地通过二进位值。在一个实例中，二进制化单元502接收上述后缀和前缀值且产生二进位串。

算术编码单元510经配置以从二进制化单元502接收二进位串，且对所述二进位串执行算术编码。如图6A中所示，算术编码单元510可从绕过路径或常规译码路径接收二进位值。遵循绕过路径的二进位值可为识别为经绕过译码的二进位值，且遵循常规编码路径的二进位值可识别为经CABAC译码。与上文描述的CABAC过程一致，在其中算术编码单元510从绕过路径接收二进位值的情况下，绕过编码引擎504可对二进位值执行算术编码而无需利用指派于二进位值的自适应上下文。在一个实例中，绕过编码引擎504可假定二进位的可能值的相等概率。

在其中算术编码单元510通过常规路径接收二进位值的情况下，上下文建模单元506可提供上下文变量(例如，上下文状态)，使得常规编码引擎508可基于由上下文建模单元506提供的上下文指派来执行算术编码。上下文指派可根据例如即将到来的HEVC标准等视频译码标准来界定。此外，在一个实例中，上下文建模单元506和/或熵编码单元56可经配置以将上下文指派于上述后缀或前缀值的二进位或指派于上述后缀或前缀值的部分。所述技术可并入到HEVC或另一视频译码标准中。上下文模型可存储在存储器中。上下文建模单元506可包含一系列经标引表和/或利用映射函数来确定用于特定二进位的上下文和上下文变量。在对二进位值进行编码之后，常规编码引擎508可基于实际二进位值更新上下文。

图6B是说明可实施本发明中描述的技术的实例性熵解码单元80的框图。熵解码单元80接收经熵编码位流且从位流解码语法元素。语法元素可包含上述后缀和前缀值。图6B中的实例性熵解码单元80包含算术解码单元802，其可包含绕过解码引擎804和常规解码引擎806。实例性熵解码单元80还包含上下文建模单元808和逆二进制化单元810。实例性熵解码单元80可执行相对于图6A描述的实例性熵编码单元56的互逆功能。以此方式，熵解码单元80可基于本文描述的技术执行熵解码。

算术解码单元802接收经编码位流。如图6B中所示，算术解码单元802可根据绕过路径或常规译码路径处理经编码二进位值。是否应根据绕过路径或常规通过来处理经编码二进位值的指示可在具有较高级语法的位流中用信号发送。与上文描述的CABAC过程一致，在其中算术解码单元802从绕过路径接收二进位值的情况下，绕过解码引擎804可对二进位值执行算术编码而无需利用指派于二进位值的上下文。在一个实例中，绕过解码引擎804可假定二进位的可能值的相等概率。

在其中算术解码单元802通过常规路径接收二进位值的情况下，上下文建模单元808可提供上下文变量，使得常规解码引擎806可基于由上下文建模单元808提供的上下文指派来执行算术编码。上下文指派可根据例如HEVC等视频译码标准来界定。上下文模型可存储在存储器中。上下文建模单元808可包含一系列经标引表和/或利用映射函数来确定经编码位流的上下文和上下文变量部分。此外，在一个实例中，上下文建模单元808和/或熵解码单元80可经配置以将上下文指派于后缀和前缀值的二进位。在对二进位值进行解码之后，常规解码引擎806可基于经解码二进位值更新上下文。此外，逆二进制化单元810可对二进位值执行逆二进制化，且使用二进位匹配功能来确定二进位值是否有效。逆二进制化单元810还可基于匹配确定来更新上下文建模单元。因此，逆二进制化单元810根据上下文自适应解码技术输出语法元素。

图7是说明根据本发明的技术的用于对视频数据进行编码的方法的流程图。图7的技术可例如由视频编码器20执行。作为视频编码过程的部分，视频编码器20确定用于SAO操作的偏移值(171)。为了用信号发送所确定偏移值，视频编码器20可产生前缀值以用于包含在经编码视频位流中(172)且还产生后缀值以用于包含在经编码视频位流中(173)，使得所述后缀值与前缀值的组合识别偏移值。前缀值可例如为截断一元值，且后缀值可为固定长度值，如上文在表1和表2的实例中说明。

图8是说明根据本发明的技术的用于对视频数据进行编码的方法的流程图。图8的技术可例如由视频解码器30执行。作为视频解码过程的部分，视频解码器30可接收经编码视频数据位流中的前缀值(181)。视频解码器30还可接收经编码视频数据位流中的后缀值(182)。后缀值与前缀值的组合可识别偏移值。因此，基于后缀值和前缀值，视频解码器30可确定用于样本自适应偏移滤波(SAO)操作的偏移值。

在一或多个实例中，所描述功能可以硬件、软件、固件或其任一组合实施。如果以软件来实施，那么所述功能可作为一或多个指令或代码存储于计算机可读媒体上或经由计算机可读媒体传输，且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体(其对应于例如数据存储媒体等有形媒体)或通信媒体，所述通信媒体包含(例如)根据通信协议促进计算机程序从一处传送到另一处的任何媒体。以此方式，计算机可读媒体一般可对应于(1)非暂时性的有形计算机可读存储媒体，或(2)例如信号或载波等通信媒体。数据存储媒体可为可由一或多个计算机或者一或多个处理器存取以检索指令、代码和/或数据结构以用于实施本发明中描述的技术的任何可用媒体。计算机程序产品可包含计算机可读媒体。

举例来说且并非限制，计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器，或可用以存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。而且，将任何连接恰当地称为计算机可读媒体。举例来说，如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源发射指令，那么同轴电缆、光纤电缆、双绞线、DSL或例如红外线、无线电和微波等无线技术包含于媒体的定义中。然而应了解，计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它瞬态媒体，而替代地针对非瞬态有形存储媒体。如本文所使用，磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软磁盘和蓝光光盘，其中磁盘通常以磁性方式再生数据，而光盘用激光以光学方式再生数据。以上各项的组合也应包含在计算机可读媒体的范围内。

可通过例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一或多个处理器来执行指令。因此，如本文使用的术语“处理器”可指代前述结构或适于实施本文所述的技术的任何其它结构中的任一者。另外，在一些方面中，可将本文描述的功能性提供于经配置以用于编码和解码的专用硬件和/或软件模块内，或并入于组合式编解码器中。而且，可将所述技术完全实施于一或多个电路或逻辑元件中。

本发明的技术可在广泛多种装置或设备中实施，包含无线手持机、集成电路(IC)或一组IC(例如，芯片组)。本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面，但未必需要通过不同硬件单元来实现。而是如上文所述，各种单元可组合于编解码器硬件单元中，或通过互操作性硬件单元(包含如上文所述的一或多个处理器)的集合结合合适的软件和/或固件来提供。

已描述各种实例。这些和其它实例在所附权利要求书的范围内。

Claims

1.一种用于对视频数据进行解码的方法，所述方法包括：

接收经编码视频数据位流中的前缀值；

接收所述经编码视频数据位流中的后缀值；

确定用于样本自适应偏移滤波SAO操作的偏移值；其中所述后缀值与所述前缀值的组合识别所述偏移值。

2.根据权利要求1所述的方法，其中所述前缀值识别所述偏移值的偏移值范围。

3.根据权利要求2所述的方法，其中所述后缀值识别所述偏移值的所述偏移值范围内的特定偏移值。

4.根据权利要求1所述的方法，其中所述前缀值是截断一元值。

5.根据权利要求1所述的方法，其中所述前缀值是使用上下文来译码的。

6.根据权利要求1所述的方法，其中所述前缀值的子集是使用上下文来译码的。

7.根据权利要求1所述的方法，其中所述后缀值是固定长度码字。

8.根据权利要求1所述的方法，其中所述后缀值是使用绕过译码来译码的。

9.根据权利要求1所述的方法，其中所述后缀值是使用上下文来译码的。

10.根据权利要求1所述的方法，其中所述SAO操作包括基于边缘的SAO操作。

11.根据权利要求1所述的方法，其中所述SAO操作包括基于带的SAO操作。

12.根据权利要求1所述的方法，其进一步包括：

将所述偏移值添加到像素值作为执行所述SAO操作的部分。

13.根据权利要求1所述的方法，其中所述方法由视频解码器执行。

14.一种用于对视频数据进行编码的方法，所述方法包括：

确定用于样本自适应偏移滤波SAO操作的偏移值；

产生前缀值；

产生后缀值，其中所述后缀值与所述前缀值的组合识别所述偏移值。

15.根据权利要求14所述的方法，其中所述前缀值识别所述偏移值的偏移值范围。

16.根据权利要求15所述的方法，其中所述后缀值识别所述偏移值的所述偏移值范围内的特定偏移值。

17.根据权利要求14所述的方法，其中所述前缀值是截断一元值。

18.根据权利要求14所述的方法，其中所述前缀值是使用上下文来译码的。

19.根据权利要求14所述的方法，其中所述前缀值的子集是使用上下文来译码的。

20.根据权利要求14所述的方法，其中所述后缀值是固定长度码字。

21.根据权利要求14所述的方法，其中所述后缀值是使用绕过译码来译码的。

22.根据权利要求14所述的方法，其中所述后缀值是使用上下文来译码的。

23.根据权利要求14所述的方法，其中所述方法由视频编码器执行。

24.根据权利要求14所述的方法，其中所述SAO操作包括基于边缘的SAO操作。

25.根据权利要求14所述的方法，其中所述SAO操作包括基于带的SAO操作。

26.一种用于对视频数据进行解码的设备，所述设备包括：

视频解码器，其经配置以接收经编码视频数据位流中的前缀值；接收所述经编码视频数据位流中的后缀值；且确定用于样本自适应偏移滤波SAO操作的偏移值；其中所述后缀值与所述前缀值的组合识别所述偏移值。

27.根据权利要求26所述的设备，其中所述前缀值识别所述偏移值的偏移值范围。

28.根据权利要求27所述的设备，其中所述后缀值识别所述偏移值的所述偏移值范围内的特定偏移值。

29.根据权利要求26所述的设备，其中所述前缀值是截断一元值。

30.根据权利要求26所述的设备，其中所述前缀值是使用上下文来译码的。

31.根据权利要求26所述的设备，其中所述前缀值的子集是使用上下文来译码的。

32.根据权利要求26所述的设备，其中所述后缀值是固定长度码字。

33.根据权利要求26所述的设备，其中所述后缀值是使用绕过译码来译码的。

34.根据权利要求26所述的设备，其中所述后缀值是使用上下文来译码的。

35.根据权利要求26所述的设备，其中所述SAO操作包括基于边缘的SAO操作。

36.根据权利要求26所述的设备，其中所述SAO操作包括基于带的SAO操作。

37.根据权利要求26所述的设备，其中所述视频解码器进一步经配置以将所述偏移值添加到像素值作为执行所述SAO操作的部分。

38.根据权利要求26所述的设备，其中所述设备包括以下各项中的至少一者：

集成电路；

微处理器；以及

无线通信装置，其包含所述视频解码器。

39.一种用于对视频数据进行编码的设备，所述设备包括：

视频编码器，其经配置以确定用于样本自适应偏移滤波SAO操作的偏移值；产生前缀值；且产生后缀值，其中所述后缀值与所述前缀值的组合识别所述偏移值。

40.根据权利要求39所述的设备，其中所述前缀值识别所述偏移值的偏移值范围。

41.根据权利要求40所述的设备，其中所述后缀值识别所述偏移值的所述偏移值范围内的特定偏移值。

42.根据权利要求39所述的设备，其中所述前缀值是截断一元值。

43.根据权利要求39所述的设备，其中所述前缀值是使用上下文来译码的。

44.根据权利要求39所述的设备，其中所述前缀值的子集是使用上下文来译码的。

45.根据权利要求39所述的设备，其中所述后缀值是固定长度码字。

46.根据权利要求39所述的设备，其中所述后缀值是使用绕过译码来译码的。

47.根据权利要求39所述的设备，其中所述后缀值是使用上下文来译码的。

48.根据权利要求39所述的设备，其中所述设备包括视频编码器。

49.根据权利要求39所述的设备，其中所述SAO操作包括基于边缘的SAO操作。

50.根据权利要求39所述的设备，其中所述SAO操作包括基于带的SAO操作。

51.根据权利要求39所述的设备，其中所述设备包括以下各项中的至少一者：

集成电路；

微处理器；以及

无线通信装置，其包含所述视频编码器。

52.一种用于对视频数据进行译码的设备，所述设备包括：

用于确定用于样本自适应偏移滤波SAO操作的偏移值的装置；

用于对前缀值进行译码的装置；

用于对后缀值进行译码的装置，其中所述后缀值与所述前缀值的组合识别所述偏移值。

53.根据权利要求52所述的设备，其中

所述用于对所述前缀值进行译码的装置包括用于对所述前缀值进行解码的装置；

所述用于对所述后缀值进行译码的装置包括用于对所述后缀值进行解码的装置。

54.根据权利要求52所述的设备，其中

所述用于对所述前缀值进行译码的装置包括用于产生所述前缀值以包含在经编码视频位流中的装置；

所述用于对所述后缀值进行译码的装置包括用于产生所述后缀值以包含在所述经编码视频位流中的装置。

55.一种存储指令的计算机可读存储媒体，所述指令在执行时致使一或多个处理器：

确定用于样本自适应偏移滤波SAO操作的偏移值；

对前缀值进行译码；

对后缀值进行译码，其中所述后缀值与所述前缀值的组合识别所述偏移值。

56.根据权利要求55所述的计算机可读存储媒体，其中

所述一或多个处理器通过对所述前缀值进行解码来对所述前缀值进行译码，且通过对所述后缀值进行解码来对所述后缀值进行译码。

57.根据权利要求55所述的计算机可读存储媒体，其中

所述一或多个处理器通过产生所述前缀值以包含在经编码视频位流中来对所述前缀值进行译码，且通过产生所述后缀值以包含在所述经编码视频位流中来对所述后缀值进行译码。