CN114466190B

CN114466190B - 一种图像集合级别的码率控制方法

Info

Publication number: CN114466190B
Application number: CN202210153276.8A
Authority: CN
Inventors: 范益波; 刘超
Original assignee: Fudan University
Current assignee: Fudan University
Priority date: 2022-02-18
Filing date: 2022-02-18
Publication date: 2023-01-06
Anticipated expiration: 2042-02-18
Also published as: CN114466190A

Abstract

本发明属于图像编码技术领域，具体为一种图像集合级别的码率控制算法。本发明通过使用拉格朗日函数，将有约束的码率控制问题变为无约束的问题，从而实现无极调节输出动态BPP(比特每像素)或PSNR（峰值信噪比）。相比于每张图片输出固定的BPP或PSNR值，本发明可以获得大约2%的BD‑Rate增益。

Description

一种图像集合级别的码率控制方法

技术领域

本发明属于图像编码技术领域，具体涉及一种适用于图像集合级别的码率控制方法。

背景技术

码率控制在编码器中占有了非常重要的地位。从主观质量的角度来看，使用码率控制策略可以给人眼更感兴趣的区域分配更多的码率。而从客观质量的角度来看，其也可以在相同的码率条件下，更合理地分配码率给整张图片或者是图片集合。本发明将介绍一种提升客观质量的图片集合域的码率控制方法。

参数定义

D，表示编码失真，为编/解码器重建结果和原始输入的视频/图像之间的差别衡量，常用PSNR(峰值信噪比)、SSIM(结构相似度)来进行衡量。

R，表示编码码率，为编码器输出的码流长度，其越大表示码流的文件大小越大，相应地传输成本和存储成本越高，反之亦然。一般认为更高的码率可以带来更小的失真。

J，表示率失真优化损失函数，使用拉格朗日数乘法对编码失真D和编码码率R进行权衡，通过计算不同编码方案的J，实现在他们之间的定量比较。

λ,表示率失真优化超参数，是率失真优化损失函数的超参数，其作用在R或者D上，当其变大时，选择更小的J意味着其对应作用的对象的重要程度就变大，反之亦然。

发明内容

本发明的目的是提出一种适用于图像集合级别的码率控制算法，以有效地提升编码器的分配码率的能力。

下面以输出目标PSNR(峰值信噪比)为例，介绍提升码率控制性能的原理。考察图1，考虑RDO(率失真优化)曲线C1和C2，正方形点表示目前的图片选择策略，菱形的点表示新的RDO策略。圆形点和菱形点的失真和码率是一样的，而圆形点在正方形点的点左下方。因此，圆形点具有比正方形点更低的RDO损失。换句话说，拥有更好的率失真优化表现。具体证明过程如下：

符号定义：d表示失真，R表示码率，d和R的下标，第一个下标表示曲线的序号，1表示C1曲线，2表示C2区线；第二个下标表示方法的序号，1表示原始方法，2表示新的方法，*表示新方法等价RDO损失的选择。

问题描述：对于一组待编码的图片，希望图片集合输出的平均PSNR为预先设定的目标PSNR。原始方法1表示，对每一张图片都选择输出预先设定的目标PSNR的QP作为编码QP进行编码。而原始方法2表示对每一张图片都选择在相同参数λ下的最小RDO损失的QP作为编码QP进行编码。可以假设方法1和方法2都可以输出预先设定的PSNR值，因此两者的失真之和相等，可以写作等式(1)：

d₁₁+d₂₁＝d₂₂+d₁₂， (1)

需要证明不等式(2)，即可说明新的RDO策略更好。

R₁₁+R₂₁>R₁₂+R₂₂， (2)

证明：考虑圆形点，因为d₁₁(d₂₁)到d₂₂和d₁₂的距离相同，所以：

R_1*+R_2*＝R₁₂+R₂₂， (3)

而：

R₁₁>R_1*

R₂₁>R_2*， (4)

所以：

r₁₁+r₂₁>r_1*+r_2*＝r₁₂+r₂₂， (5)

因此，式(2)得证，新的码率控制策略相比原始策略更好。

基于上述原理，本发明提供一种适用于图像集合级别的码率控制算法，对于待编码的图像集合，从整体的角度来考虑率失真优化，以实现比仅从图像的角度达到更高压缩率效果。这里以输出目标PSNR(峰值信噪比)为例，具体步骤如下：

(1)初始化编码量化参数QP为任意有效的值，这里的量化参数是指一般编码器中的量化参数,比如在HM(HEVC标准测试模型)中是0到51；

(2)将所有图片以选定的QP进行编码，每次编码计算平均的PSNR值，使用搜索算法(比如二分法)找到最接近目标PSNR的QP值；

(3)对每一张图片在步骤(2)中求得的QP附近的若干个QP都进行编码，得到重建图像；实际实验中若干个QP的数量选取越多，性能越好，这里我们推荐数量为4-6个。并统计每一张重建图像在每一个QP下编码消耗的BPP(比特每像素)以及PSNR(峰值信噪比)值；

(4)初始化率失真优化超参数λ为0.1，计算每一张图片在以λ为系数的拉格朗日公式下的率失真优化损失J，找到每一张图片中最小J对应的QP,进行保存；其中J定义为J等于失真加上BPP乘以λ；

(5)比较保存的结果的平均PSNR和目标PSNR的差别，以进行调整λ值；当保存的PSNR比目标PSNR大时，增大λ值，反之减小λ值；不断搜索直至达到目标的PSNR值；

(6)记录下最后一次满足要求的λ，对应选中每一张图片最小J的QP作为编码QP，从而实现码率控制。

本发明通过使用拉格朗日函数，将有约束的码率控制问题变为无约束的问题，从而可以实现无极调节输出动态BPP(比特每像素)或PSNR(峰值信噪比)。相比于每张图片输出固定的BPP或PSNR值，本方法可以获得大约2％的BD-Rate增益。

附图说明

图1本发明方法示意图。

具体实施方式

仍然以输出目标PSNR为例，介绍如何提升实施。在实际的过程中，如果输出目标为BPP，也是一样的，将提到的PSNR换成BPP即可。具体方法包含两个步骤，确定编码QP范围。搜索率失真优化参数λ。当率失真优化参数λ确定之后，每一张图片对应的编码QP值也就确定了。

(一)确定编码QP范围：

(1)初始化编码量化参数QP为任意有效的值，比如在HM中是0到51，可选择30作为起始值。在第一次编码过程中，初始化的QP用作每一张图片的编码参数，从而可以得到这个图片集合在QP＝30的情况下平均PSNR和BPP。

(2)将所有图片以选定的QP进行编码，从而得到每一张图片的编码结果，对编码的PSNR结果计算平均，即可得到数据集在当前选定QP下的平均PSNR值。当得到的PSNR值比目标的PSNR值要小的时候，增大QP值；反之当得到的PSNR值比目标的PSNR值要大的时候，减小QP值。不断重复进行此步骤，直到找到最接近目标PSNR的QP值，此时采用的是原始方法1的码率控制策略以输出目标的PSNR或者得到目标的BPP。

(3)以步骤(2)中求得的QP附近的若干个QP对每一张图片进行编码得到重建图像。对应N张图片，M个QP就一共是M×N次编码。比如假设步骤(2)中得到的QP为28，计算资源允许一定的搜索，我们可以搜索[26,27,28,29,30]五个QP作为候选QP，这里的M就是5。以此统计每一张重建图像在每一个QP下编码消耗的BPP以及PSNR值，记录为一张M×N的表格。

(二)搜索率失真优化参数λ

(4)在得到了M×N的编码结果表格后，需要对每一张图片挑选出最优的编码参数QP。其具体是通过计算率失真优化函数得到的。率失真优化函数定义为失真和码率的拉格朗日函数：

J＝D+λR， (6)

为了计算率失真优化函数，我们首先初始化λ为0.1，计算每一张图片在以λ为系数的拉格朗日公式下的RDO损失J，因此，每张图片就包含M个J，找到每一张图片中M个J中最小J对应的QP进行保存编码结果。

(5)对每一张图片都搜索完毕之后，统计保存的结果的平均PSNR和目标PSNR的差别，以进行调整λ值。当保存的PSNR比目标PSNR大时，增大λ值，反之减小λ值。更新λ这里的更新规则也可以采用二分法或者是其他常见的搜索算法。重复进行步骤(4)，直至统计保存的结果的平均PSNR达到目标的PSNR值。

(6)记录下最后一次保存的结果作为整个码率控制的编码结果。

Claims

1.一种图像集合级别的码率控制方法，其特征在于，对于输出目标PSNR，具体步骤如下：

（1）初始化编码量化参数QP为任意有效的值；

（2）将所有图片以选定的QP进行编码，每次编码计算平均的PSNR值，使用搜索算法找到最接近目标PSNR的QP值；

（3）对每一张图片在步骤（2）中求得的QP附近的若干个QP都进行编码；并统计每一张重建图像在每一个QP下编码消耗的BPP以及PSNR值；BPP表示比特每像素；

（4）初始化率失真优化超参数λ为0.1，计算每一张图片在以λ为系数的拉格朗日公式下的率失真优化损失J，找到每一张图片中最小J对应的QP,进行保存；其中J定义为J等于失真加上BPP乘以λ；

（5）比较保存的结果的平均PSNR和目标PSNR的差别，以进行调整λ值；当保存的PSNR比目标PSNR大时，增大λ值，反之减小λ值；不断搜索直至达到目标的PSNR值；

（6）记录下最后一次满足要求的λ，对应选中每一张图片最小J的QP作为编码QP，从而实现码率控制。