CN102577379A

CN102577379A - 用于视频编码和译码中的嵌入量化参数调节的方法和装置

Info

Publication number: CN102577379A
Application number: CN201080045061XA
Authority: CN
Inventors: 吕小安; 约珥·索; 尹鹏; 许茜; 郑云飞
Original assignee: Thomson Licensing SAS
Current assignee: Thomson Licensing SAS; International Digital Madison Patent Holding SAS
Priority date: 2009-10-05
Filing date: 2010-09-29
Publication date: 2012-07-11
Anticipated expiration: 2030-09-29
Also published as: US9819952B2; US10194154B2; WO2011043793A1; US20180091817A1; CN102577379B; US20180091822A1; EP2486730A1; JP2013507086A; JP5806219B2; US20120183053A1; KR20120083368A; KR101873356B1

Abstract

提供了用于视频编码和译码中的嵌入量化参数调节的方法和装置。一种装置，包括：用于对图片中的至少一个块的图片数据进行编码的编码器(300)。被应用到通过对所述块的原始版本和至少一个参考块之间的差值进行变换而获取的一个或者多个变换系数的量化参数是从至少对应于所述块的重建数据推导得出的。

Description

用于视频编码和译码中的嵌入量化参数调节的方法和装置

相关申请的交叉引用

本申请要求于2009年10月5日递交的美国临时申请序列号No.61/248,541(律师案件编号No.PU090143)的优先权，其全部内容通过引用被结合于此。

技术领域

本原理一般地涉及视频编码和译码，更具体地涉及用于视频编码和译码中的嵌入量化参数调节的方法和装置。

背景技术

大多数视频应用都寻求针对一组给定的比特率限制的最高可能的感知质量(perceptual quality)。例如，在诸如视频电话系统之类的低比特率应用中，视频编码器可以通过消除在视觉上更重要的感兴趣的区域上的强烈伪像来提供更高的质量。另一方面，在较高比特率的应用中，期望在图片中的任何地方都具有视觉无损的质量，并且视频编码器还需要实现透明的视觉质量。在高比特率的应用中获取透明视觉质量的一个挑战是保存细节，尤其是平滑区域的细节(其中，由于人类视觉系统的纹理遮蔽特征，平滑区域的细节损失比非平滑区域的细节损失更明显)。

增大比特率是用于提高质量的最直接的方法。当比特率给定时，编码器操纵它的比特分配模块，以将可用比特用在可以获得最大的视觉质量改善方面。在诸如DVD创作之类的非实时应用中，视频编码器可以利用可变比特率(VBR)设计，针对困难和容易的视频内容产生一贯的恒定质量。在这种应用中，可用比特被适当地分布到不同的视频段，以获取恒定的质量。相反，恒定比特率(CBR)系统向一个或者多个图片的间隔指派相同数目的比特而不管这些图片的编码难度如何，并且产生随视频内容变化的视觉质量。对于VBR和CBR编码系统，编码器可以根据图片内的感知模型来分配比特。人类感知的一个特性是纹理遮蔽(texture marking)，该特性解释了为什么人类的眼睛对平滑区域中的质量损失比纹理区域中的质量损失更敏感。为了获取较高的视觉质量，可以使用该特征来增大向平滑区域分配的比特数目。

视频编码器中的量化处理控制编码比特的数目和质量。通常通过调节量化参数(QP)来调节质量。量化参数可以包括量化步长、取整偏移(rounding offset)、以及比例变换矩阵。在当前的现有技术和现有标准中，量化参数值在比特流中被明确发送。编码器具有调谐量化参数并用信号向译码器发送量化参数的灵活性。然而，用信号发送量化参数会不利地导致开销成本。

提高感知质量的处理中的一个重要方面是保存精细的细节，诸如胶片颗粒和计算机生成的噪声等。这对于精细的细节损失很容易被注意到的平滑区域尤其重要。现有算法中的一种通用方法是以更精细的量化步长来编码这些平滑区域、或者包括平滑区域的视频片断。尽管对于横跨多个标准的本领域的当前状态是共同的，但是在以下的描述中我们将使用国际标准化组织/国际电工委员会(ISO/ICE)移动图片专家组-2(MPEG-2)标准参考软件测试模型版本5(以下称为“TM5”)来阐述怎样针对图片内的平滑区域获取更高的质量。

在TM5中，使用如下的原始像素值，从四个8×8的亮度帧组织的子块(n＝1，...，4)和四个亮度场组织的子块(n＝5，...，8)计算宏块(MB)j的空间活动性度量：

act_j＝1+min(vblk₁，vblk₂，...vblk₈) (1)

其中

{vblk}_{n} = \frac{1}{64} \times Σ_{k = 1}^{64} {(P_{n}^{k} - P_{{mean}_{n}})}^{2} - - - (2)

以及

P_{{mean}_{n}} = \frac{1}{64} \times Σ_{k = 1}^{64} P_{n}^{k} - - - (3)

其中

表示在第n个原始8×8块中的采样值。接着，如下对act_j进行归一化：

N_{act}_{j} = \frac{2 \times {act}_{j} + avg_act}{{act}_{j} + 2 \times avg_act} - - - (4)

其中avg_act是先前的经编码图片的act_j的平均值。在第一图片中，avg_act被设置为400。接着，TM5如下获取mquant_j：

mquant_j＝Q_j×N_act_j (5)

其中，Q_j是参考量化参数。mquant_j的最终值被裁剪到范围[1...31]中并且被用于指示在编码期间的量化步长。

因此，在TM5量化机制中，具有较小方差的平滑宏块具有较小值的空间活动性度量act_j和较小值的N_act_j、以及由mquant_j索引的更精细的量化步长。利用平滑宏块的更精细的量化，可以保存更精细的细节并且可以获取更高的感知质量。索引mquant_j在比特流中被发送到译码器。

国际标准化组织/国际电工委员会(ISO/ICE)移动图片专家组-4(MPEG-4)部分10高级视频编码(AVC)标准/国际电信联盟，电信部(ITU-T)H.264建议(以下为“MPEG-4AVC标准”)中的语法也允许针对每一图片和宏块的量化参数有所不同。量化参数的值为整数并且在0--51的范围内。可以从语法元素pic_init_qp_minus26推导得出每个切片(slice)的初始值。当对非零值的slice_qp_delta进行译码时在切片层对初始值进行修改，并且当对非零值的mb_qp_delta进行译码时在宏块层对初始值进行修改。

精确地，切片的初始量化参数被如下计算：

SliceQP_Y＝26+pic_init_qp_minus26+slice_qp_delta (6)

在宏块层上，量化参数的值被如下推导得出：

QP_Y＝QP_Y，PREV+mb_qp_delta (7)

其中，QP_Y，PREV是当前切片中按照译码顺序的前一宏块的量化参数。

参考图1，通过参考数字100一般地指示出了用于在视频编码器中改善感知质量的一般量化调节方法。方法100包括开始块105，该开始块105将控制传递到功能块110。功能块110分析输入视频内容，并且将控制传递到循环限制块115。循环限制块115使用具有从1到宏块(MB)的#的范围的变量i在图片中的每一宏块上开始循环，并将控制传递到功能块120。功能块120调节当前宏块i的量化参数，并且将控制传递到功能块125。功能块125对量化参数和宏块i进行编码，并且将控制传递到循环限制块130。循环限制块130结束每一宏块上的循环，并且将控制传递到结束块199。因此，在方法100中，量化参数调节被明确地用信号进行传送。至于功能块120，基于宏块i的内容和/或先前的编码结果对宏块i的量化参数进行调节。例如，平滑宏块将降低量化参数以提高感知质量。在另一示例中，如果先前的宏块使用比指派的比特更多的比特，则当前宏块将增大量化参数以消耗比原始指派的比特更少的比特。方法100在图片中的全部宏块被编码后结束。

参考图2，通过参考数字200一般地指示出了用于在视频译码器中对宏块和量化参数进行译码的一般方法。该方法200包括开始块205，该开始块205将控制传递到循环限制块210。循环限制块210使用具有从1到宏块(MB)的#的范围的变量i在图片中的每一宏块上开始循环，并将控制传递到功能块215。功能块215对量化参数和当前宏块i进行译码，并且将控制传递到循环限制块220。循环限制块220结束每一宏块上的循环，并且将控制传递到结束块299。

总之，如前所述，现有的标准支持在编码器中调节图片级和宏块级的量化参数，以实现高感知质量。量化参数值被绝对地或者是差分地编码从而在比特流中被明确发送。该编码器具有调谐量化参数并且用信号向译码器发送量化参数的灵活性。然而，明确地用信号发送量化参数会不利地导致开销成本。

发明内容

通过本原理解决了现有技术的这些以及其它缺点和劣势，该原理针对用于视频编码和译码中的嵌入量化参数调节的方法和装置。

依据本原理的一个方面，提供了一种装置。该装置包括用于对图片中的至少一个块的图片数据进行编码的编码器。被应用到通过对该块的原始版本和至少一个参考块之间的差值进行变换而获取的一个或者多个变换系数的量化参数是从至少对应于该块的重建数据推导得出的。

依据本原理的另一方面，提供了一种视频编码器中的方法。该方法包括对图片中的至少一个块的图片数据进行编码。被应用到通过对该块的原始版本和至少一个参考块之间的差值进行变换而获取的一个或者多个变换系数的量化参数是从至少对应于该块的重建数据推导得出的。

依据本原理的另一方面，提供了一种装置。该装置包括用于对图片中的至少一个块的图片数据进行译码的译码器。被应用到通过对该块的原始版本和至少一个参考块之间的差值进行变换而获取的一个或者多个变换系数的量化参数是从至少对应于该块的重建数据推导得出的。

依据本原理的另一方面，提供了一种视频译码器中的方法。该方法包括对图片中的至少一个块的图片数据进行译码。被应用到通过对该块的原始版本和至少一个参考块之间的差值进行变换而获取的一个或者多个变换系数的量化参数是从至少对应于该块的重建数据推导得出的。

结合附图，通过示例性实施例的以下详细描述，本原理的这些和其它方面、特征和优势将变得显而易见。

附图说明

依据以下的示例性示图，可以更好地理解本原理，其中：

图1是示出依据现有技术的用于在视频编码器中提高感知质量的一般量化调整方法的流程图；

图2是示出依据现有技术的用于在视频译码器中对量化参数和宏块进行译码的一般方法的流程图；

图3是示出依据本原理的实施例的应用本原理的示例性视频编码器的框图；

图4是示出依据本原理的实施例的应用本原理的示例性视频译码器的框图；

图5是示出依据本原理的实施例的用于在比特流中嵌入量化参数图的的示例性方法的流程图；

图6是示出依据本原理的实施例的用于对嵌入的量化参数图进行译码的示例性方法的流程图；

图7是示出依据本原理的实施例的用于利用嵌入的量化参数图对明确的量化参数调节进行编码的示例性方法的流程图；

图8是示出依据本原理的实施例的用于利用嵌入的量化参数图对明确的量化参数调节进行译码的示例性方法的流程图；

图9是示出依据本原理的实施例的用于在视频编码器中指派量化参数的示例性方法的流程图；

图10是示出依据本原理的实施例的用于在视频译码器中计算量化参数的示例性方法的流程图；

图11是示出依据本原理的实施例的用于在视频编码器中指派量化参数的示例性方法的流程图；以及

图12是示出依据本原理的实施例的用于在视频译码器中计算量化参数的示例性方法的流程图。

具体实施方式

本原理针对用于视频编码和译码中的嵌入量化参数调节的方法和装置。

本描述对本原理进行了举例说明。因而可以理解，本领域技术人员将可以设计虽然在这里没有被明确地描述或者示出、但是体现本原理并且被包括在本原理的精神和范围之内的各种配置。

这里陈述的全部示例和条件性语句出于教学目的，用于帮助读者理解本原理和一个或多个发明人为进一步推进现有技术所贡献的概念，并且本原理应被理解为不限于具体陈述的示例和条件。

此外，描述本原理的原理、方面、特征和实施例、以及它们的具体示例的全部陈述用于覆盖本原理的结构和功能等价物。另外，希望这些等价物包括当前已知的等价物以及将来开发的等价物(即，所开发的执行同样功能的任何元件，而不管其结构如何)。

因此，例如，本领域技术人员将明白，这里呈现的框图表示体现本原理的说明性电路的概念性视图。类似地，将明白任何流程表、流程图、状态转换图、伪代码等可以表示多种处理，该多种处理可以被大体上表示在计算机可读介质中并且由计算机或者处理器执行，无论该计算机或者处理器是否被精确地示出。

可以通过使用专用硬件以及能够执行与适当的软件相关联的软件的硬件，来提供图中示出的各种元件的功能。当由处理器提供时，这些功能可以由单个专用处理器、单个共享的处理器、或者其中的一些被共享的多个单独的处理器提供。此外，术语“处理器”或者“控制器”的明确使用不应当被理解为排他地指代能够执行软件的硬件，并且可以暗含而不限制地包括数字信号处理器(“DSP”)硬件、用于存储软件的只读存储器(“ROM”)、随机访问存储器(“RAM”)、以及非易失存储装置。

还可以包括传统的和/或定制的其它硬件。类似地，在图中示出的任何开关都仅仅是概念上的。可以通过程序逻辑的操作、通过专用逻辑、通过程序控制和专用逻辑的相互作用、或者甚至是手动地执行他们的功能。如通过上下文可以更具体地理解的，实施人可以选择特定技术。

在这里的权利要求中，被表示为用于执行指定功能的装置的任何元件包括执行该功能的任何方式，该元件例如包括：a)执行该功能的电路元件的组合、或者b)任何形式的包括固件、微代码等的与用于运行软件以执行该功能的适当的电子电路组合在一起的软件。如这些权利要求限定的本原理存在以下事实：由所陈述的各种装置提供的功能被以权利要求所要求的方式组合一起。因而可以认为，可以提供那些功能的任何装置都等同于在这里示出的那些装置。

本说明书中对于本原理的“一个实施例”或者“实施例”、以及它们的其他变形的引用，意味着结合该实施例描述的特定特征、结构、特性等被包括在本原理的至少一个实施例中。因而，出现在说明中的多种地方的短语“在一个实施例中”或“在实施例中”、以及任何其它的变形的出现不一定全部指同一实施例。

应明白，以下“/”、“和/或”、以及“其中的至少一个”(例如，在“A/B”、“A和/或B”、以及“A和B中的至少一个”的情况中)的使用意图包括仅第一个被列出的选项(A)的选择，或者仅第二个被列出的选项(B)的选择，或者两个选项(A和B)的选择。作为另一示例，在“A、B、和/或C”以及“A、B、和C中的至少一个”的情况中，这样的短语意图包括仅第一个被列出的选项(A)的选择，或者仅第二个被列出的选项(B)的选择，或者仅第三个被列出的选项(C)的选择，或者仅第一个和第二个被列出的选项(A和B)的选择，或者仅第一个和第三个被列出的选项(A和C)的选择，或者仅第二个和第三个被列出的选项(B和C)的选择，或者全部的三个选项(A和B和C)的选择。如本领域或者相关领域的普通技术人员容易明白地那样，对于所列出的许多项目，这可以被扩展。

同样，如在这里所使用的，单词“图片”和“图像”可以被相互交换地使用，并且被用来指代来自视频序列的静止图像或者图片。如已知的，图片可以为帧或者场。

另外，如在这里所使用的，单词“用信号发送”指代向相应的译码器指示某内容。例如，编码器为了使译码器知道哪一个或多个特定的量化参数被用在了编码器侧，可以用信号发送嵌入的量化参数图中的一个或者多个量化参数。这样，相同的量化参数可以被用在译码器侧和编码器侧上。因此，例如，编码器可以在发送给译码器的比特流中嵌入量化参数图，从而使得译码器可以使用与编码器同样的量化参数(图中指定的量化参数)。应明白，用信号发送可以以多种方法实现。例如，一个或者多个语法元素、标志等可以被用于用信号将信息发送到相应的译码器。

另外，应明白，出于说明的目的主要针对宏块描述了本文中描述的量化参数调节处理，本原理的量化参数调节处理可以被应用到子宏块、宏块、宏块的群组、或者任何的编码单元中的任意一种。因此，如在这里所使用的，单词“块”可以指代宏块或者子宏块。另外，应明白可以基于包括但不限于亮度和/或色度分量的各种准则来调节量化参数。

参考图3，通过参考数字300一般地指示出了可以应用本原理的示例性视频编码器。视频编码器300包括具有与组合器385的非反相输入信号通信的输出的帧排序缓冲器310。组合器385的输出以信号通信的方式与变换器和量化器325的第一输入连接。变换器和量化器325的输出以信号通信的方式与熵编码器345的第一输入和反变换器和反量化器350的第一输入连接。熵编码器345的输出以信号通信的方式与组合器390的第一非反相输入连接。组合器390的输出以信号通信的方式与输出缓冲器335的第一输入连接。

编码器控制器305的第一输出以信号通信的方式与帧排序缓冲器310的第二输入、反变换器和反量化器350的第二输入、图片类型判定模块315的输入、宏块类型(MB类型)判定模块320的第一输入、内部预测模块360的第二输入、去块滤波器365的第二输入、运动补偿器370的第一输入、运动估计器375的第一输入、以及参考图片缓冲器380的第二输入连接。

编码器控制器305的第二输出以信号通信的方式与辅助增强信息(SEI)插入器330的第一输入、变换器和量化器325的第二输入、熵编码器345的第二输入、输出缓冲器335的第二输入、以及序列参数集(SPS)和图片参数集(PPS)插入器340的输入连接。

SEI插入器330的输出以信号通信的方式与组合器390的第二非反相输入连接。

图片类型判定模块315的第一输出以信号通信的方式与帧排序缓冲器310的第三输入连接。图片类型判定模块315的第二输出以信号通信的方式与宏块类型判定模块320的第二输入连接。

序列参数集(SPS)和图片参数集(PPS)插入器340的输出以信号通信的方式与组合器390的第三非反相输入连接。

反变换器和反量化器350的输出以信号通信的方式与组合器319的第一非反相输入连接。组合器319的输出以信号通信的方式与内部预测模块360的第一输入和去块滤波器365的第一输入连接。去块滤波器365的输出以信号通信的方式与参考图片缓冲器380的第一输入连接。参考图片缓冲器380的输出以信号通信的方式与运动估计器375的第二输入和运动补偿器370的第三输入连接。运动估计器375的第一输出以信号通信的方式与运动补偿器370的第二输入连接。运动估计器375的第二输出以信号通信的方式与熵编码器345的第三输入连接。

运动补偿器370的输出以信号通信的方式与开关397的第一输入连接。内部预测模块360的输出以信号通信的方式与开关397的第二输入连接。宏块类型判定模块320的输出以信号通信的方式与开关397的第三输入连接。开关397的第三输入确定开关的“数据”输入(相对于控制输入(即，第三输入))是否将由运动补偿器370或者内部预测模块360提供。开关397的输出以信号通信的方式与组合器319的第二非反相输入和组合器385的反相输入连接。

帧排序缓冲器310的第一输入和编码器控制器305的输入可被用作编码器100的输入，用于接收输入图片。此外，辅助增强信息(SEI)插入器330的第二输入可被用作编码器300的输入，用于接收元数据。输出缓冲器335的输出可被用作编码器300的输出，用于输出比特流。

参考图4，通过参考数字400一般地指示出了可以应用本原理的示例性视频译码器。视频译码器400包括输入缓冲器410，输入缓冲器410具有以信号通信的方式与熵译码器445的第一输入连接的输出。熵译码器445的第一输出以信号通信的方式与反变换器和反量化器450的第一输入连接。反变换器和反量化器450的输出以信号通信的方式与组合器425的第二非反相输入连接。组合器425的输出以信号通信的方式与去块滤波器465的第二输入以及内部预测模块460的第一输入连接。去块滤波器465的第二输出以信号通信的方式与参考图片缓冲器480的第一输入连接。参考图片缓冲器480的输出以信号通信的方式与运动补偿器470的第二输入连接。

熵译码器445的第二输出以信号通信的方式与运动补偿器470的第三输入、去块滤波器465的第一输入、以及内部预测器460的第三输入连接。熵译码器445的第三输出以信号通信的方式与译码器控制器405的输入连接。译码器控制器405的第一输出以信号通信的方式与熵译码器445的第二输入连接。译码器控制器405的第二输出以信号通信的方式与反变换器和反量化器450的第二输入连接。译码器控制器405的第三输出以信号通信的方式与去块滤波器465的第三输入连接。译码器控制器405的第四输出以信号通信的方式与内部预测模块460的第二输入、运动补偿器470的第一输入、以及参考图片缓冲器480的第二输入连接。

运动补偿器470的输出以信号通信的方式与开关497的第一输入连接。内部预测模块460的输出以信号通信的方式与开关497的第二输入连接。开关497的输出以信号通信的方式与组合器425的第一非反相输入连接。

输入缓冲器410的输入可被用作译码器400的输入，用于接收输入比特流。去块滤波器465的第一输出可被用作译码器400的输出，用于输出输出图片。

如以上指出的，本原理针对用于视频编码和译码中的嵌入量化参数调节的方法和装置。例如，在一个或者多个实施例中，我们公开了用于在编码器处将量化参数嵌入在比特流中，并且在译码器处使用先前被译码的内容来重建量化参数的方法和装置。在不明确地发送量化参数信息的情况下，在编码器和译码器上使用相同的量化参数调节处理。这导致了重建视频中的感知质量的改善，并且几乎没有或者没有块级量化参数开销。同样，除了前述的现有技术使用的明确的块级量化参数之外，依据本原理的嵌入经调节的块级量化参数可以提供额外的量化参数调节灵活性。

嵌入量化参数调节

如先前陈述的，为了减少用信号发送量化参数信息的开销成本，依据本原理我们提出将量化参数嵌入在比特流中。因此，区分于其中量化参数被明确地输送到译码器的本技术的当前状态，依据本原理在编码器上和译码上使用同样的方法从重建数据暗含地推导得出量化参数。另外，在一个或者多个实施例中，可以结合现有技术的明确地用信号发送的量化参数，使用依据本原理的经调节和嵌入的量化参数来获取对于本领域或者相关领域的普通技术人员显而易见的其它优势中的进一步的灵活性。

实施例1

为了提高感知质量，需要基于图片的全局特征和单独块的局部特征来调节量化参数。如在这里使用的，短语“全局特征”指代从图片内的所有块推导得出的特征。例如，全局特征可以是但不限于图片的平均像素值或者平均方差。此外，如在这里使用的，短语“局部特征”指代宏块的特征。例如，局部特征可以是但不限于宏块的方差或者平均像素值。以下描述怎样计算图片的全局特征和单独块的局部特征的示例。另外，如以上指出的，虽然在这里出于说明的目的针对宏块描述了本原理的示例，但是依据本原理诸如子宏块、宏块组之类的其它编码单元也可以被使用，同时保持本原理的精神。有利地，本原理允许质量损耗更容易被注意到的区域的质量提高，并且可以可选地允许剩余区域(或它们的一部分)的质量降低以节省比特。

参考图5，通过参考数字500一般地指示出了用于将量化参数图嵌入在比特流中的示例性方法。方法500包括开始块505，该开始块505将控制传递到功能块510。功能块510分析输入视频内容，发送从在前的分析确定的全局特征信息，并且将控制传递到循环限制块515。循环限制块515使用具有从1到宏块(MB)的#的范围的变量i在图片中的每一宏块上开始循环，并将控制传递到功能块520。功能块520使用全局特征信息推导得出当前宏块i的量化参数，并将控制传递到功能块525。功能块525使用推导得出的量化参数对当前宏块i进行编码，并将控制传递到循环限制块530。循环限制块530结束在每一宏块上的循环，并且将控制传递到结束块599。

参考图6，通过参考数字600一般地指示出了用于对嵌入的量化参数图进行译码的示例性方法。方法600包括开始块605，开始块605将控制传递到功能块610。功能块610从所接收的比特流译码出全局特征信息，并且将控制传递到循环限制块615。循环限制块615使用具有从1到宏块(MB)的#的范围的变量i在图片中的每一宏块上开始循环，并将控制传递到功能块620。功能块620推导得出当前宏块i的量化参数，并将控制传递到功能块625。功能块625使用推导得出的量化参数对当前宏块进行译码，并将控制传递到循环限制块630。循环限制块630结束在每一宏块上的循环，并且将控制传递到结束块699。

实施例2

为了在量化参数调节中提供进一步的灵活性，描述了支持除了嵌入的QP以外的宏块级的明确的量化参数调节的实施例。

参考图7，通过参考数字700一般地指示出了用于利用嵌入的量化参数图对明确的量化参数调节进行编码的示例性方法。方法700包括开始块705，开始块705将控制传递到功能块710。功能块710分析输入视频内容，发送全局特征信息，并且将控制传递到循环限制块715。循环限制块715使用具有从1到宏块(MB)的#的范围的变量i在图片中的每一宏块上开始循环，并将控制传递到功能块720。功能块720推导得出当前宏块i的量化参数QP₀，并将控制传递到功能块725。功能块725调节当前宏块i的量化参数偏移QP_d，并将控制传递到功能块730。功能块730对量化参数偏移QP_d和宏块i进行编码，并将控制传递到循环限制块735。循环限制块735结束在每一宏块上的循环，并且将控制传递到结束块799。因此，依据方法700，在通过功能块720推导得出宏块的量化参数QP₀之后，功能块725可以进一步将宏块级量化参数调谐量化参数偏移QP_d。至于功能块730，在量化参数QP₀+QP_d上对宏块进行编码，并且对偏移QP_d进行编码。

参考图8，通过参考数字800一般地指示出了用于利用嵌入的量化参数图对明确的量化参数调节进行译码的示例性方法。方法800包括开始块805，开始块805将控制传递到功能块810。功能块810对全局特征信息进行译码，并将控制传递到循环限制块815。循环限制块815使用具有从1到宏块(MB)的#的范围的变量i在图片中的每一宏块上开始循环，并将控制传递到功能块820。功能块820对量化参数偏移QP_d进行译码，并且推导得出当前宏块i的量化参数QP₀，并将控制传递到功能块825。功能块825对宏块i进行译码，并将控制传递到循环限制块830。循环限制块835结束在每一宏块上的循环，并且将控制传递到结束块899。

QP推导

下面，我们描述推导量化参数的方法。对于具体的方法，为了同步在编码器和译码器上使用同一方法。

在感兴趣的区域上提供高感知质量对整个感知质量具有显著影响。所以，量化参数调节的一般准则是将较低的量化参数指派给感兴趣的区域以提高感知质量，并且将较高的量化参数指派给其它区域以减少比特数目。特别地，我们说明怎样使用以方差测量的图片的空间活动性来调节量化参数。对于每个块，可以使用该块中的全部像素或者它们的子集来计算方差。

首先，我们分析图片的全局特征。在一个实施例中，通过平均图片中的所有块上的方差来计算平均空间活动性(avg_var)。当avg_var大时，整个图片是有纹理的，否则是平滑的。信息avg_var需要被编码和并在比特流中被发送。为了节省开销，可以使用avg_var的降级版本(downscaledversion)。

对于每一宏块，我们基于avg_var和局部方差(var)来推导量化参数。因为在编码器和译码器上都使用局部方差，所以可以仅使用先前重建的信息。在一个实施例中，我们使用诸如左、上、和/或左上块之类的相邻块的平均方差。在另一实施例中，我们使用相邻块的最小方差。在另一实施例中，使用方差的中值。

在得到全局的和局部特征后，我们如下推导量化参数：

QP = {QP}_{pic} + \frac{α \times avg_var + var}{avg_var + α \times var} = {QP}_{pic} + \frac{α + \frac{var}{avg_var}}{1 + α \times \frac{var}{avg_var}} - - - (8)

其中，α是编译器和译码器都应知道的参数，QP_pic是图片的基础量化参数。α控制QP方差依赖在var和avg_var之间的比率var/avg_var的程度。在一个实施例中，为了控制量化参数方差的动态范围，我们将量化参数限制到[QP_pic-L，QP_pic+U]，其中L和U分别是下阈值和上阈值，编译器和译码器都应知道L和U，并且L和U应该相同。等式(8)中的公式将较小的量化参数指派给平滑的并且具有小方差的宏块。

为了简化等式(8)中的计算，可以使用查询表。例如，我们使用如下的伪代码如下推导量化参数：

其中，β_i和Δ_i是编译器和译码器都应知道的参数。在该示例中，我们使用三个不同的量化参数等级。然而，应明白本原理不限于此，并且在保持本原理的精神的条件下其他数目的等级可以被用于该方法。

参考图9，通过参考数字900一般地指示出了用于在视频编码器中指派量化参数的示例性方法。方法900包括开始块905，开始块905将控制传递到功能块910。功能块910分析图片的全局特征，并将控制传递到循环限制块915。循环限制块915使用具有从1到宏块的数目(#)的范围的变量i(例如，在当前图片中)开始循环，并将控制传递到功能块920。功能块920检测当前宏块的重要性，并将控制传递到功能块925。功能块925如下地指派量化参数，并将控制传递到循环限制块930：宏块越重要，指派给它的量化参数越低，其中量化参数可以是量化步长、取整偏移、和/或比例变换矩阵。循环限制块930结束循环，并且将控制传递到结束块999。

参考图10，通过参考数字1000一般地指示出了用于在视频译码器中计算量化参数的示例性方法。方法1000包括开始块1005，开始块1005将控制传递到功能块1010。功能块1010对图片的全局特征进行译码，并将控制传递到循环限制块1015。循环限制块1015使用具有从1到宏块的数目(#)的范围的变量i(例如，在当前图片中)开始循环，并将控制传递到功能块1020。功能块1020检测当前宏块的重要性，并将控制传递到功能块1025。功能块1025使用与编码器中同样的规则计算量化参数，并将控制传递到循环限制块1030。一般来说，宏块越重要，量化参数越低，其中量化参数可以是量化步长、取整偏移、和/或比例变换矩阵。循环限制块1030结束循环，并且将控制传递到结束块1099。

参考图11，通过参考数字1100一般地指示出了用于在视频编码器中指派量化参数的示例性方法。方法1100包括开始块1105，开始块1105将控制传递到功能块1110。功能块1110使用全部块计算平均方差(avg_var)，并将控制传递到循环限制块1115。循环限制块1115使用具有从1到宏块的数目(#)的范围的变量i(例如，在当前图片中)开始循环，并将控制传递到功能块1120。功能块1120从相邻块计算方差(其中，该方差可以为但不限于相邻块的方差的平均值、最小值或者中值)，并将控制传递到功能块1125。功能块1125基于等式(8)或者等式(9)计算量化参数，并将控制传递到循环限制块1130。循环限制块1130结束循环，并且将控制传递到结束块1199。

参考图12，通过参考数字1200一般地指示出了用于在视频译码器中计算量化参数的示例性方法。方法1200包括开始块1205，开始块1205将控制传递到功能块1210。功能块1210对平均方差(avg_var)进行译码，并将控制传递到循环限制块1215。循环限制块1215使用具有从1到宏块的数目(#)的范围的变量i(例如，在当前图片中)开始循环，并将控制传递到功能块1220。功能块1220从相邻块计算方差(其中，该方差可以为但不限于相邻块的方差的平均值、最小值或者中值)，并将控制传递到功能块1225。同样的方差计算方法被用在编码器中。功能块1225基于等式(8)或者等式(9)计算量化参数，并将控制传递到循环限制块1230。循环限制块1230结束循环，并且将控制传递到结束块1299。

语法

为了同步编码器和译码器，在译码器上应当已知全局特征、公式、查询表、和推导过程中它们的相关参数。

使用等式(9)中描述的方法作为示例，我们描述怎样设计语法以应用本原理。语法元素被用来指定嵌入的量化参数是否被使用。语法元素可以被指定在图片级或者序列级。应当在图片级语法中指定图片的全局特征avg_var。表1示出了依据本原理的实施例的图片参数集中的语法示例。

表1

pic_parameter_set_rbsp(){	C	描述符
			...
embedded_QPmap_flag	0	u(1)
			if(embedded_QPmap_flag){
avg_var		u(v)

for(i＝0；i＜N；i++)
			beta[i]	0	u(v)
delta[i]	0	u(v)
			}
}
			...
}

表1中的一些语法元素的语义如下：

Embedded_QPmap_flag等于1指示，在图片参数集中存在嵌入的量化参数。Embedded_QPmap_flag等于0指示，在图片参数集中不存在嵌入的量化参数。

Avg_var指示图片的平均方差的值。

Beta_i指示等式(9)中的参数。

Delta_i指示等式(9)中的QP偏移。

现在将给出本发明的许多伴随的优势/特征的描述，其中以上已经提及它们中的一些。例如，一个优势/特征是具有用于对图片中的至少一个块的图片数据进行编码的编码器的装置。被应用到通过对该块的原始版本和至少一个参考块之间的差值进行变换而获取的一个或者多个变换系数的量化参数是从至少对应于该块的重建数据推导得出的。

另一个优势/特征是具有上述编码器的装置，其中，响应于公式、查找表、图片的全局特征和该块的局部特征、方差，该块和图片中的至少一个的亮度特征、以及该块和图片中的至少一个的色度特征中的至少一个，从重建数据推导量化参数的处理被执行。

另一个优势/特征是具有上述编码器的装置，其中，响应于编码器和相应的译码器两者都使用的已知公式，从重建数据推导量化参数的处理被执行。

另一个优势/特征是具有上述编码器的装置，其中，响应于至少一个公式，从重建数据推导量化参数的处理被执行，其中至少一个公式、至少一个公式的索引、以及与索引和至少一个公式中的至少一个相关联的参数被明确地包括在比特流中。

另外，另一个优势/特征是具有上述编码器的装置，其中，响应于图片的全局特征和该块的局部特征，从重建数据推导量化参数的处理被执行，其中图片的全局特征是以方差为基础的。

另外，另一个优势/特征是具有上述编码器的装置，其中，除了默认的量化取整偏移外，另一量化偏移被支持用于包括至少一个块的图片中的每个块，从而使得默认的量化偏移被明确地用信号进行发送，并且其它量化偏移被暗含地用信号进行发送。

另外，另一个优势/特征是具有上述编码器的装置，其中，量化参数包括量化步长、量化取整偏移、以及量化比例变换矩阵中的至少一个。

基于本文中的教导，相关领域的普通技术人员可以容易地确定本原理的这些和其它特征和优势。应理解可以以硬件、软件、固件、专用处理器、或者它们的组合的多种形式来实现本原理的教导。

更优选地，本原理的教导可以被实现为硬件和软件的组合。此外，软件可以被实现为被有形地包括在程序存储单元上的应用程序。可以将该应用程序上载到包括任意合适的架构的机器上，或者可以通过包括任意合适的架构的机器执行该应用程序。优选地，在具有诸如一个或者多个中央处理器(“CPU”)、随机访问存储器(“RAM”)、以及输入/输出(“I/O”)接口之类的硬件的计算机平台上实现该机器。该计算机平台也可以包括操作系统和微指令代码。这里描述的各种处理和功能可以为微指令代码的一部分或者为应用程序的一部分，或者可以为它们的任何组合(其可以由CPU执行)。另外，可以将诸如附加的数据存储单元和打印单元之类的多种其它外围单元连接到计算机平台。

还应理解，因为可以优选地以软件来实现在附图中描绘的构成系统组件和方法中的一些，所以在系统组件或者处理功能块之间的实际连接可以依据对本原理进行编程的方式而不同。鉴于这里的教导，相关领域的普通技术人员将可以预见本原理的这些和类似的实施方式或者配置。

虽然在这里已经参考附图描述了说明性的实施例，但是应理解本原理不限制于那些精确的实施例，并且在不背离本原理的范围或者精神的情况下，相关领域的普通技术人员可以在这里实现多种变化和修改。全部这些变化和修改都被包括在如在所附权利要求中陈述的本原理的范围之内。

Claims

1.一种装置，包括：

用于对图片中的一个块的图片数据进行编码的编码器(300)，其中，被应用到通过对所述块的原始版本和至少一个参考块之间的差值进行变换而获取的一个或者多个变换系数的量化参数是从对应于所述块的重建数据推导得出的。

2.根据权利要求1所述的装置，其中，响应于从包括以下内容的群组中选择的至少一项内容，从所述重建数据推导所述量化参数的处理被执行：

公式，

查找表，

所述图片的全局特征和所述块的局部特征，

方差，

所述块的亮度特征，

所述图片的亮度特征，

所述块的色度特征，以及

所述图片的色度特征。

3.根据权利要求1所述的装置，其中，响应于所述编码器和相应的译码器两者所使用的已知公式，从所述重建数据推导所述量化参数的处理被执行。

4.根据权利要求1所述的装置，其中，响应于至少一个公式，从所述重建数据推导所述量化参数的处理被执行，其中，所述至少一个公式、所述至少一个公式的索引、以及与所述索引和所述至少一个公式中的至少一项相关联的参数被明确地包括在比特流中。

5.根据权利要求1所述的装置，其中，响应于所述图片的全局特征和所述块的局部特征，从所述重建数据推导所述量化参数的处理被执行，其中所述图片的全局特征是以方差为基础的。

6.根据权利要求1所述的装置，其中，除了默认的量化取整偏移以外，第二量化偏移被支持用于所述图片中的多个块，从而使得所述默认的量化偏移被明确地用信号进行发送，并且所述第二量化偏移被暗含地用信号进行发送。

7.根据权利要求1所述的装置，其中，所述量化参数包括量化步长、量化取整偏移、以及量化比例变换矩阵中的至少一个。

8.一种视频编码器中的方法，包括：

对图片中的一个块的图片数据进行编码，其中，被应用到通过对所述块的原始版本和至少一个参考块之间的差值进行变换而获取的一个或者多个变换系数的量化参数是从对应于所述块的重建数据推导得出的(520，525，720，730)。

9.根据权利要求8所述的方法，其中，响应于从包括以下内容的群组选择的至少一项内容，从所述重建数据推导所述量化参数的处理被执行(520，720，1125)：

公式，

查找表，

所述图片的全局特征和所述块的局部特征，

方差，

所述块的亮度特征，

所述图片的亮度特征，

所述块的色度特征，以及

所述图片的色度特征。

10.根据权利要求8所述的方法，其中，响应于所述编码器和相应的译码器两者所使用的已知公式，从所述重建数据推导所述量化参数的处理被执行(1125)。

11.根据权利要求8所述的方法，其中，响应于至少一个公式，从所述重建数据推导所述量化参数的处理被执行，其中，所述至少一个公式、所述至少一个公式的索引、以及与所述索引和所述至少一个公式中的至少一者相关联的参数被明确地包括在比特流中(1025)。

12.根据权利要求8所述的方法，其中，响应于所述图片的全局特征和所述块的局部特征，从所述重建数据推导所述量化参数的处理被执行，其中所述图片的全局特征是以方差为基础的(1120)。

13.根据权利要求8所述的方法，其中，除了默认的量化取整偏移以外，第二量化偏移被支持用于所述图片中的多个块，从而使得所述默认的量化偏移被明确地用信号进行发送，并且所述第二量化偏移被暗含地用信号进行发送(720，725)。

14.根据权利要求8所述的方法，其中，所述量化参数包括量化步长、量化取整偏移、以及量化比例变换矩阵中的至少一个(925)。

15.一种装置，包括：

用于对图片中的一个块的图片数据进行译码的译码器(400)，其中，被应用到通过对所述块的原始版本和至少一个参考块之间的差值进行变换而获取的一个或者多个变换系数的量化参数是从对应于所述块的重建数据推导得出的。

16.根据权利要求15所述的装置，其中，响应于从包括以下内容的群组选择的至少一项内容，从所述重建数据推导所述量化参数的处理被执行(525，720，1125)：

公式，

查找表，

所述图片的全局特征和所述块的局部特征，

方差，

所述块的亮度特征，

所述图片的亮度特征，

所述块的色度特征，以及

所述图片的色度特征。

17.根据权利要求15所述的装置，其中，响应于所述编码器和相应的译码器两者所使用的已知公式，从所述重建数据推导所述量化参数的处理被执行。

18.依据权利要求15所述的装置，其中，响应于至少一个公式，从所述重建数据推导所述量化参数的处理被执行，其中，所述至少一个公式、所述至少一个公式的索引、以及与所述索引和所述至少一个公式中的至少一者相关联的参数被明确地包括在比特流中。

19.根据权利要求15所述的装置，其中，响应于所述图片的全局特征和所述块的局部特征，从所述重建数据推导所述量化参数的处理被执行，其中所述图片的全局特征是以方差为基础的。

20.根据权利要求15所述的装置，其中，除了默认的量化取整偏移以外，第二量化偏移被支持用于所述图片中的多个块，从而使得所述默认的量化偏移被明确地用信号进行发送，并且所述第二量化偏移被暗含地用信号进行发送。

21.根据权利要求15所述的装置，其中，所述量化参数包括量化步长、量化取整偏移、以及量化比例变换矩阵中的至少一个。

22.一种视频译码器中的方法，包括：

对图片中的一个块的图片数据进行译码，其中，被应用到通过对所述块的原始版本和至少一个参考块之间的差值进行变换而获取的一个或者多个变换系数的量化参数是从对应于所述块的重建数据推导得出的(620，625，820，825)。

23.根据权利要求22所述的方法，其中，响应于从包括以下内容的群组选择的至少一项内容，从所述重建数据推导所述量化参数的处理被执行(620，820)：

公式，

查找表，

所述图片的全局特征和所述块的局部特征，

方差，

所述块的亮度特征，

所述图片的亮度特征，

所述块的色度特征，以及

所述图片的色度特征。

24.根据权利要求22所述的方法，其中，响应于所述编码器和相应的译码器两者所使用的已知公式，从所述重建数据推导所述量化参数的处理被执行(1225)。

25.根据权利要求22所述的方法，其中，响应于至少一个公式，从所述重建数据推导所述量化参数的处理被执行，其中，所述至少一个公式、所述至少一个公式的索引、以及与所述索引和所述至少一个公式中的至少一者相关联的参数被明确地包括在比特流中(1225)。

26.根据权利要求22所述的方法，其中，响应于所述图片的全局特征和所述块的局部特征，从所述重建数据推导所述量化参数的处理被执行，其中所述图片的全局特征是以方差为基础的(1220，1225)。

27.根据权利要求22所述的方法，其中，除了默认的量化取整偏移以外，第二量化偏移被支持用于所述图片中的多个块，从而使得所述默认的量化偏移被明确地用信号进行发送，并且所述第二量化偏移被暗含地用信号进行发送(820)。

28.根据权利要求22所述的方法，其中，所述量化参数包括量化步长、量化取整偏移、以及量化比例变换矩阵中的至少一个(1025)。

29.具有在其上被编码的视频信号数据的计算机可读存储介质，包括：

针对图片中的一个块被编码的图片数据，其中，被应用到通过对所述块的原始版本和至少一个参考块之间的差值进行变换而获取的一个或者多个变换系数的量化参数是从对应于所述块的重建数据推导得出的。