WO2021196682A1

WO2021196682A1 - 一种基于失真类型传播分析的时域率失真优化方法

Info

Publication number: WO2021196682A1
Application number: PCT/CN2020/132812
Authority: WO
Inventors: 朱策; 邓玲玲; 蒋妮; 王秋月; 丁可可
Original assignee: 电子科技大学
Priority date: 2020-03-31
Filing date: 2020-11-30
Publication date: 2021-10-07
Also published as: CN111314703A; CN111314703B; US11330270B2; US20220007031A1

Abstract

本发明属于视频编解码技术领域，具体涉及一种基于失真类型传播分析的时域率失真优化方法。本发明根据LD结构下的时域依赖关系以及skip模式和inter模式下失真传播分析，重新归纳了基于时域失真传播的依赖率失真优化问题，通过构造了时间传播链，估计当前编码单元及受影响的未来编码单元的聚合失真，计算时域失真传播模型中编码单元的传播因子，进而通过更加准确的传播因子调整拉格朗日乘子实现时域依赖率失真优化，同时对I帧使用二次编码技术实现I帧的时域依赖率失真优化。

Description

一种基于失真类型传播分析的时域率失真优化方法

技术领域

本发明属于视频编解码技术领域，具体涉及一种基于失真类型传播分析的时域率失真优化方法。

背景技术

率失真理论(Rate Distortion Theory)是有损编码的基础理论，基于该理论发展而来的率失真优化技术RDO(Rate Distortion Optimization)是提升编码效率的重要工具之一，已广泛应用于视频编码领域。

视频编码的性能需要编码比特和重建失真共同衡量，一方面，当我们想要更好的视频质量时，视频的编码比特会提高，另一方面在较低的编码比特水平下，视频的失真又会大大增加，故编码比特和重建失真存在相互矛盾、相互制约的关系。率失真优化技术就是让编码器选择一组最优的编码参数集使得在编码比特小于目标比特的前提下，编码失真最小，其数学表达如公式(1.1)所示：

其中D _i和R _i表示编码单元的失真和比特数，N为编码单元总数，R _c表示目标比特数。

为了解决上述约束性率失真优化问题，可以引入全局拉格朗日乘子λ _g，将约束性问题转换为公式(1.2)的无约束问题，其中J被称为率失真代价函数。

图1给出了经典R-D曲线，当使用一组编码参数对视频进行编码时，便可得到该编码参数条件下的失真和码率，我们以点的形式绘制不同编码参数下的(R,D)组合，这些点被称为实际率失真可操作点。我们可以观察到对于给定的速率R ^*，总能找到一个D最小的可操作点，这些点被称为实际可达到的最优可操作点，将这些最优可操作点连接起来，即可得到实际可操作R-D曲线。

在独立率失真优化的条件下，即不同编码单元之间的率失真性能相互独立，对公式(1.2)关于R _i求导可得

由此可见，λ _g是率失真曲线上某点的负斜率，较大的λ _g对应码率较小，失真较大的可操作点，而较小的λ _g对应着码率较大，失真较小的可操作点，是影响率失真性能最主要的决定因素，因此拉格朗日乘子λ _g的选取至关重要，目前VVC中λ _g的大小主要由预先设置好的量化参数QP决定，与输入视频序列无关。

然而由于帧内\帧间预测会在不同编码单元间引入依赖性，对每个编码单元采用独立率失真优化技术并不能使编码性能达到最优。因此需要一种复杂度可以接受的全局率失真优化方法，进一步提升编码效率。

文献Temporally dependent rate-distortion optimization for low-delay hierarchical video coding中就研究了一种LD编码结构下时域率失真优化算法。根据LD配置下的时域依赖关系，建立了多参考帧下的时域失真传播链，估计失真传播程度，计算传播因子，进而根据聚合传播因子调整全局拉格朗日乘子，实现时域率失真优化，解决全局率失真优化问题。

图2中给出了LD编码结构下时域失真传播链的构造方法，由于采用了多参考帧编码方式，关键帧中的一个编码块可能直接影响后续不同帧中的多个块，并继续间接地向前扩展。因此，需要利用大量的实验统出GOP中每个参考帧的利用率，对多个可能的影响块使用加权平均计算对后续编码块的期望失真。基于图3的LD编码结构下的时域依赖关系以及采用前向运动搜索可以确定后续帧中受影响的编码块。

在LD编码结构下在考虑关键帧f _i中的编码单元B _i的时域率失真优化时，编码帧f _i+1中受影响的编码单元B _i+1的期望失真为:

假设P _i,j是编码帧f _i被编码帧f _j参考的概率，o _i是B _i的编码参数。由于后三项与B _i的编码参数o _i无关，因此公式(1.3)可简化为

同理编码单元B _i+2的期望失真可写为：

其中

与B _i的编码参数o _i无关，使用类似的方法可以得到对后续有影响的编码单元的期望失真。

基于期望失真的概念下，公式(1.2)的率失真问题可重新表示为：

由于该算法对当前编码单元和后续编码单元估计的期望失真相对粗糙，使得传播因子难以准确衡量当前编码单元的失真对后续编码失真的影响，在新一代视频编码标准VVC中反而产生损失，同时该算法没有对I帧进行时域率失真优化，而I帧的编码性能在LD编码结构中非常重要。

发明内容

针对上述问题，为了进一步优化LD编码结构下的时域率失真优化方案，本发明根据LD编码结构下的时域依赖关系以及skip模式和inter模式下失真传播分析，重新归纳了基于时域失真传播的依赖率失真优化问题，通过构造时域失真传播链，估计当前编码单元及受影响的未来编码单元的聚合失真，计算时域失真传播模型中编码单元的传播因子，进而通过更加准确的传播因子调整拉格朗日乘子实现时域依赖率失真优化，同时对I帧使用二次编码技术实现I帧的时域依赖率失真优化。

本发明采用的技术方案是：

假设编码单元B _i重建失真为D _i。由于帧间预测存在skip模式，在该模式下不需传输残差，直接使用帧间预测值作为重建值，其余模式需要传输残差，称为inter模式，因此当前编码单元的失真可以由skip模式和inter模式带来的失真共同组成：

只有当前编码单元inter模式下的部分失真d ^inter会对后续编码单元的带来影响，因为在skip模式下使用已编码的参考单元作为预测块时不需要传输预测残差，当前编码单元的失真由前面已编码的参考单元失真决定，所以对后续编码单元的影响也是由前面已编码单元决定，所以在考虑当前编码单元的对后续编码单元的影响时应当将skip模式下的失真剔除。假设

和

分别是当前编码单元选择inter模式和skip模式的编码失真，p ^inter和p ^skip分别是当前编码单元选择inter模式和skip模式的概率，两者之和为1。如果当前编码单元与预测单元之间的误差越大，将会导致编码器选择inter模式的概率越大，同时较大的量化步长会导致编码器选择skip模式的概率增大。因此，将p ^inter定义为：

其中

为B _i在原始帧中通过运动搜索得到的原始运动补偿误差，F _i、F _i-1分别代表编码单元B _i和参考单元B _i-1的原始像素，Δ为量化步长。

在编码B _i时，对公式(1.6)关于R _i求偏导，可求得全局拉格朗日乘子λ _g：

在公式(1.9)两端同乘一个

同时假设

可以得到：

λ _i是在全局率失真性能下编码单元B _i的拉格朗日乘子。此外,κ _i代表编码单元B _i对后续视频序列编码失真的影响，称为该编码单元B _i的传播因子。

在高码率inter模式下的失真函数可以表示为

skip模式下的失真函数可以表示为

R _i+1为码率，b是与信源分布有关的常数，

为B _i+1的运动补偿预测误差。

F _i代表编码单元B _i的原始像素，

代表编码单元B _i的重建像素、F _i+1代表编码单元B _i+1的原始像素。

根据实验观察，α约等于一个常数，此时编码单元B _i+1的失真可表示为：

分别表示编码单元B _i+1参考编码单元B _i时使用inter模式和skip模式的概率，

表示编码单元B _i+1的原始运动补偿误差。

此时由公式(1.4)和(1.7)可得编码帧f _i+1中受编码单元B _i影响的编码单元B _i+1的期望失真为：

其中

仅与编码单元B _i+1的码率R _i+1有关，与编码单元B _i的编码参数o _i无关，

也与B _i的编码参数o _i无关，仅有编码帧f _i被编码帧f _i+1参考的概率P _i,i+1和编码单元B _i使用inter模式下的编码失真

以及参数γ _i,i+1与编码参数o _i有关。

同理可得，编码帧f _i+2中受B _i影响的编码单元B _i+2的期望失真为：

其中

分别表示编码单元B _i+2参考编码单元B _i+1时使用inter模式和skip模式的概率，

分别表示编码单元B _i+2参考编码单元B _i时使用inter模式和skip模式的概率，R _i+2表示编码单元B _i+2的码率，P _i+1,i+2和P _i,i+2分别表示编码帧f _i+1和f _i被编码帧f _i+2参考的概率。c _i+2为与编码单元B _i的编码参数o _i不相干的无关项。

同理，编码帧f _i+3中受B _i影响的编码单元B _i+3的期望失真为：

其中

分别表示编码单元B _i+3参考编码单元B _i+2时使用inter模式和skip模式的概率，

分别表示编码单元B _i+3参考编码单元B _i时使用inter模式和skip模式的概率，R _i+3表示编码单元B _i+3的码率，P _i+2,i+3和P _i,i+3分别表示编码帧f _i+2和f _i被编码帧f _i+3参考的概率。c _i+3为与编码单元B _i的编码参数o _i不相干的无关项。

因此，当前GOP中的四个编码帧中受编码单元B _i影响的所有编码单元的聚合失真为：

分别表示编码单元B _i+k+1-t参考编码单元B _i时使用inter模式和skip模式的概率，

分别表示编码单元B _j+1参考编码单元B _j时使用inter模式和skip模式的概率，P _i,i+k+1-t表示编码帧f _i被编码帧f _i+k+1-t参考的概率，P _j,j+1表示编码帧f _j被编码帧f _j+1参考的概率，其中

与编码单元B _i的编码参数o _i无关。

同理可得，第m个GOP中的四个编码帧中受编码单元B _i影响的所有编码单元的聚合失真为：

分别表示编码单元B _i+4m+k+1-t参考编码单元B _i+4m时使用inter模式和skip模式的概率，P _{i+4m,i+4m+k+1-t}表示编码帧f _i+4m被编码帧f _i+4m+k+1-t参考的概率，P _j,j+1表示编码帧f _j被编码帧f _j+1参考的概率，其中

与编码单元B _i的编码参数o _i无关。

从编码帧f _i+1到编码最后一帧f _N的所有后续编码帧中受B _i影响的编码单元的聚合失真为：

M为从编码帧f _i+1到编码最后一帧f _N的GOP总数，L表示与o _i无关的项。

由公式(1.8)可知当前编码单元B _i的使用inter模式的编码失真

与实际编码失真D _i关系如下：

令

是编码单元B _i选择inter模式的概率，公式(1.19)可表示为：

根据公式(1.10)，传播因子κ _i的计算公式为：

使用传播因子κ _i可对CTU级的全局拉格朗日乘子λ _g自适应调整，并进一步调整CTU级QP，同时使用帧级平均传播因子调整所有B帧的帧级QP。

由于I帧在LD编码结构下尤其重要，后续编码帧均需参考I帧。目前VTM中统一将I帧QP下调1，但在不同序列中I帧的重要性是不同的，所以可采用I帧2次编码的方式，用第一次编码得到的编码失真建立失真传播链计算I帧中每个16×16的块的传播因子，使用帧级平均传播因子对I帧的QP调整，使得I帧QP可以根据I帧对后续编码帧的影响进行调整，调整值不局限于-1。

本发明的有益效果为，本发明解决了传统方法没有对I帧进行时域率失真优化的问题，使得I帧的全局率失真性能达到最优，根据LD编码结构下的时域依赖关系以及skip模式和inter模式下失真传播分析，重新归纳了基于时域失真传播的依赖率失真优化问题，提高LD编码结构下的率失真优化性能。

附图说明

图1为可操作率失真曲线

图2为LD编码结构下时域失真传播链的构造示意图

图3为LD编码结构示意图

图4为Fourpeople序列的率失真曲线图。

具体实施方式

下面结合实施例对本发明进行详细的描述：

为了简化全局率失真算法的实现过程，可以通过传播因子κ _i直接在VTM中修改全局拉格朗日乘子λ _g。由于后续编码单元在推导传播因子κ _i时并没有真正被编码，因此需对后续编码单元的失真进行估计。

在高码率情况下，后续编码单元的编码失真大概率是inter失真，此时存在

由于B _i+1没有被编码，R _i+1无法获得，D _i+1无法使用(1.21)计算，但在量化步长为Q _step下B _i+1的编码失真可表示为

其中

基于大量不同量化步长和编码单元的实验可拟合出一条F(θ)曲线，根据曲线建立一个查询表计算θ查询得到F(θ)的值，进而估计编码块的inter失真，同时本发明中将α设置为0.94。

根据公式(1-9)，可得全局拉格朗日乘子：

同时VTM的拉格朗日乘子

因此λ _g和λ _VTM存在以下关系：

对于所有编码单元存在：

利用公式(1-24)可求得全局拉格朗日乘子λ _g，其中N是所有编码单元个数，所有编码单元的失真和编码过程中不能全部获得，此时失真和使用已编码帧的失真以及刚完成的编码帧的失真的加权和，对λ _g进行更新。由于

在集成了本节提出的率失真算法的编码器中是不可得的，因此使用D _i替代。

在建立失真传播链时，基于16×16大小的块做运动搜索，并计算每个块的传播因子，由于VTM中以大小为128×128的CTU进行独立划分编码，所以对CTU内所有16×16的块的传播因子取平均值，作为CTU的传播因子，调整CTU级的拉格朗日乘子和QP，同时使用一整幅图像的平均传播因子调整帧级QP。

I帧采用二次编码优化调整I帧QP，为了降低编码复杂度，对I帧第一次编码过程进行优化，跳过二叉树以及三叉树划分模式，仅使用四叉树划分模式对CTU进行划分，并且编码单元最小划分尺寸设置为16×16，不再进行更小尺寸的划分，基于I帧第一次编码得到的失真可以估计处于I帧的编码单元的失真对后续编码单元的影响，实现I帧QP自适应调整。

本发明采用VVC参考软件VTM5.0作为实验平台，实验环境根据JVET规定的通用测试条件CTC(Common Test Conditions)和参考软件配置，仅在LDB编码结构下进行实验，实验测试序列为CTC建议的Class B、C、D、E共16个视频序列，每个测试序列使用四个QP点(22，27，32，37)进行编码。

表1 本发明相比于VTM5.0的测试结果

编码实验结果如表1所示，表中显示了测试序列在LDB编码结构下Y分量取得了2.57％的编码性能。对于大部分测试序列，本发明性能提升明显，尤其是ClassE，性能提升显著，Y分量下取得了10.13％的码率节省。主要是因为Class E是场景较为固定的视频序列，各视频帧相似度较高，时域依赖性强，本发明对这种序列能取得较好的效果。接下来选取部分序列，基于率失真优化曲线对比图，观察它们的编码性能提升情况，如图4为Fourpeople序列的率失真曲线图，横坐标为编码码率Rate，纵坐标为重建视频峰值信噪比PSNR，其中圆形标记曲线是该全局率失真优化算法的率失真曲线，方形标记曲线是原始VTM5.0的率失真曲线，可以看出，对于时域依赖性较强的序列，该算法编码效率提升明显。

同样，在编码复杂度方面，该时域率失真优化算法在LDB编码结构下的编码复杂度平均增加15％，主要是由于算法中需要耗费一定的时间对每个16×16的块做运动搜索找到受影响的编码块从而建立失真传播链，同时对I帧使用了二次编码优化，尽管对I帧第一次编码过程进行了简化，但也增加了少量的编码复杂度。

表2 本发明相比于VTM5.0的编码时间百分比

Claims

一种基于失真类型传播分析的时域率失真优化方法，其特征在于，包括以下步骤：

S1、定义编码单元B _i的重建失真D _i为：

其中，
和
分别是当前编码单元选择inter模式和skip模式的编码失真，p ^inter和p ^skip分别是当前编码单元选择inter模式和skip模式的概率，d ^inter是inter模式下的部分失真，d ^skip是skip模式下的部分失真，p ^inter+p ^skip＝1；

p ^inter的定义为：

其中
为B _i在原始帧中通过运动搜索得到的原始运动补偿误差，F _i、F _i-1分别代表编码单元B _i和参考单元B _i-1的原始像素，Δ为量化步长；

S2、在编码B _i时，对B _i时域依赖率失真优化问题
关于R _i求偏导，得到全局拉格朗日乘子λ _g：

o _i为B _i的编码参数，R _i表示编码单元的比特数；

在公式两端同乘一个
同时令
得到：

λ _i是在全局率失真性能下编码单元B _i的拉格朗日乘子，κ _i代表编码单元B _i对后续视频序列编码失真的影响，定义为编码单元B _i的传播因子；

S3、建立当前GOP中的四个编码帧中受编码单元B _i影响的所有编码单元的聚合失真为：

其中，
α是一个常数，
分别表示编码单元B _i+k+1-t参考编码单元B _i时使用inter模式和skip模式的概率，
分别表示编码单元B _j+1参考编码单元B _j时使用inter模式和skip模式的概率，P _i,i+k+1-t表示编码帧f _i被编码帧f _i+k+1-t参考的概率，P _j,j+1表示编码帧f _j被编码帧f _j+1参考的概率，其中
与编码单元B _i的编码参数o _i无关，即c _i+k+1为与编码单元B _i的编码参数o _i不相干的无关项；

第m个GOP中的四个编码帧中受编码单元B _i影响的所有编码单元的聚合失真为：

分别表示编码单元B _i+4m+k+1-t参考编码单元B _i+4m时使用inter模式和skip模式的概率，P _{i+4m,i+4m+k+1-t}表示编码帧f _i+4m被编码帧f _i+4m+k+1-t参考的概率，P _j,j+1表示编码帧f _j被编码帧f _j+1参考的概率，其中
与编码单元B _i的编码参数o _i无关，即c _i+4m+k+1为与编码单元 B _i的编码参数o _i不相干的无关项；

得到编码帧f _i+1到编码最后一帧f _N的所有后续编码帧中受B _i影响的编码单元的聚合失真为：

M为从编码帧f _i+1到编码最后一帧f _N的GOP总数，L表示与o _i无关的项；

S4、根据步骤S1中p ^inter的定义，得到当前编码单元的inter失真
与实际失真D _i关系为：

b是与信源分布有关的常数，令
将上式简化表示为

根据步骤S2中λ _i的表达式，得到传播因子κ _i的计算公式为：

使用传播因子κ _i对CTU级的全局拉格朗日乘子λ _g自适应调整，根据上述步骤通过对CTU 分块求传播因子取平均值，获得CTU的传播因子，进一步调整CTU级QP，同时使用帧级平均传播因子调整所有B帧的帧级QP；对于I帧，采用2次编码的方式，用第一次编码得到的编码失真建立失真传播链并根据上述步骤计算I帧中每个16×16的块的传播因子，使用帧级平均传播因子对I帧的QP调整，使得I帧QP可以根据I帧对后续编码帧的影响进行调整。