CN107426570A

CN107426570A - 一种低延迟视频编码的自适应Qp级联方法

Info

Publication number: CN107426570A
Application number: CN201610959687.0A
Authority: CN
Inventors: 徐艺文; 李林贵; 李棋; 赵铁松; 范振嘉
Original assignee: Fuzhou University
Current assignee: Fuzhou University
Priority date: 2016-10-28
Filing date: 2016-10-28
Publication date: 2017-12-01
Anticipated expiration: 2036-10-28
Also published as: CN107426570B

Abstract

本发明涉及一种低延迟视频编码的自适应Qp级联方法，首先将视频序列分为多个图像组，构造图像组的分层结构，每个图像组由4帧构成，分别处于不同的层次；其次根据不同层间以及图像组间的依赖性，推导率失真优化模型；再次引入相关模型，将率失真优化模型转化为求解最佳的问题，同时通过更新模型参数来使模型适应不同的视频序列；最后引用拉格朗日乘子以及Newton‑Raphson方法求解模型每层最佳的，合理地分配每一帧的，实现率失真的最优化。本发明针对低延迟视频编码提出的一种自适应级联算法，主要解决低延迟视频编码的分配问题。

Description

一种低延迟视频编码的自适应Qp级联方法

技术领域

本发明涉及视频编码技术领域，特别是涉及一种低延迟视频编码的自适应 Qp级联方法。

背景技术

相比H.264，为了在相同编码质量的前提下进一步提高编码效率，HEVC(HighEfficiency Video Coding)标准提出了许多项新技术。其中包括新的预测结构、更大的编码树单元、更多帧内预测模式，以及采用分层编码结构，这使得不同层可以使用不同的Qp。然而，在HEVC标准的描述中，没有明确说明在保证(图像组平均量化参数)不变的情况下如何确定最佳的Qp。在现有的方案中，如静态的Qp级联方案，是由大量的实验数据启发得到的，保持固定不变的Qp设置，无法适应不同的视频序列，必然降低了编码性能；而多数的自适应Qp级联方案是针对H.264设计的，可能无法适用于HEVC编码结构。

发明内容

有鉴于此，本发明的目的是提供一种低延迟视频编码的自适应Qp级联方法，解决了视频编码中不同层的Qp分配问题，达到了率失真优化的目的。

本发明采用以下方案实现：一种低延迟视频编码的自适应Qp级联方法，包括以下步骤：

步骤S1：将视频序列分为多个图像组，构造图像组的分层结构，每个图像组由4帧构成，分别处于不同的层次；

步骤S2：根据不同层间以及图像组间的依赖性，推导率失真优化模型；

步骤S3：引入相关模型，将率失真优化模型转化为求解最佳Qp的问题，同时通过更新模型参数来使模型适应不同的视频序列；并引用拉格朗日乘子Λ以及 Newton-Raphson方法求解模型每层最佳的Qp，合理地分配每一帧的Qp，实现率失真的最优化。

进一步地，所述步骤S3具体包括以下步骤：

步骤S31：初始化静态Qp，得出图像组的确定图像组对Qp的影响，对第一个I帧编码；

步骤S32：对第一个图像组编码，初始化D-Q，R-Q模型的参数；

步骤S33：由模型解得最优的Q_l，根据映射关系并结合图像组的影响确定每个分层最优的Qp；

步骤S34：判断det(J)＝0，迭代次数超过100次，Qp_l+1<Qp_l是否同时成立，若是，则使用静态方案编码对图像组进行编码，若否，则采用最优的Qp对当前图像组编码，更新相关的模型参数；

步骤S35：判断当前图像是否为最后一个图像组，若是，则结束，若否，则返回步骤S33对下一个图像组进行处理。

进一步地，所述步骤S2中，根据不同层间的依赖性，推导率失真优化模型的具体方法如下：

当前帧的RD受低层参考帧的影响，其中存在大约为线性关系的帧间失真依赖性如下：

其中，R指比特率，D指失真，RD为率失真，ΔD_cur和ΔD_ref分别表示当前帧的失真增加及其参考帧的失真增加，δ表示误差传播强度，δ∈[0，1]；对于比特率，R_cur和R_ref没有帧间的依赖关系，假定帧间比特率依赖性为0；

在实际的低延迟视频编码中，一个帧有多个参考帧，不是一一对应的D_cur和 D_ref，简化层间的依赖关系，近似认为当前帧仅参考最相近的帧；

构造图像组帧的分层结构，编码顺序从低层到高层，第l层的平均失真的增加设为ΔD_l，对图像组总体失真ΔD_intra-gop,l的增加有影响，设ΔD_l与ΔD_intra-gop,l的关系为：

ΔD_intra-gop,l＝f_l(ΔD_l)，l＝0,...,L-1

其中，ΔD_l为第l层的平均失真的增加，ΔD_intra-gop,l为图像组总体失真的增加，f(·)为二者之间的函数关系，下标l为层的序列号，L为总层数，ΔD_l和ΔD_intra-gop,l的关系可表示为：

根据数学归纳法得到：

f_l(ΔD_l)＝(1+δ)^L-1-lΔD_l，l＝0,...,L-1

再得到：

ΔD_intra-gop,l＝α_lΔD_l，α_l＝(1+δ)^L-1-l，l＝0,...,L-1

由于帧间比特率依赖性为0，因此图像组总体比特率的增加为ΔR_intra-gop,l和第l层的比特率的增加ΔR_l的关系为：

ΔR_intra-gop,l＝β_lΔR_l，其中

进一步地，所述步骤S2中，根据不同图像组间的依赖性，推导率失真优化模型的具体方法如下：

在低延迟视频编码中，图像组之间存在失真依赖性，设视频序列中连续的虚拟图像组数量为N，根据图像组之间失真的依赖性，得到：

其中，ΔD_inter-gop,i为改变虚拟图像组的Qp时，视频序列失真的增加，ΔD_i为第i个虚拟图像组失真的增加，δ_gop表示图像组之间误差传播强度，δ_gop∈[0，1]，ΔR_inter-gop,i为视频序列比特率的增加，ΔR_i为第i个虚拟图像组比特率的增加，ΔR_inter-gop,i和ΔR_i的关系为：

ΔR_inter-gop,i＝ΔR_i。

进一步地，所述步骤S3中引入相关模型为D-Q模型为R-Q模型：引用线性D-Q模型与二次方程R-Q模型，分别表示为：

D＝γQ，

其中，γ、m、μ、ν为图像组各个层的参数。

进一步地，所述步骤S3中，将率失真优化模型转化为求解最佳Qp的问题，具体方法如下：

假设一个图像组分为L层，平均的量化步长Q设为自适应Qp级联的最优化问题即为找到最佳的Q_l，在不增加总比特率ΔR_intra-gop,l的条件下，使图像组的失真ΔD_intra-gop,l最小，自适应Qp级联的最优化问题表示为：

Q表示最佳的Q_l，l＝0,1,2,…,L-1，ΔR_intra-gop,l和ΔD_intra-gop,l受到Q_l， (D-Q)，(R-Q)模型等相关因素影响，从上述模型解出最优的Q，经过映射关系即可得到Qp。

进一步地，所述步骤S3中更新模型参数的具体方法为：引入的相关参数为 D-Q，R-Q模型为：

D＝γQ，

在编码过程逐渐更新每层的参数γ_l、m_l、μ_l、ν_l，以适应不同的视频序列，可得：

n为图像组的下标，l为层的下标，分别是预测参数的值，ω_γ、ω_m、ω_μ、ω_ν表示D-Q、R-Q、MAD模型更新系数，通过HEVC常用测试视频序列所得γ_l、m_l、μ_l、ν_l进行数据拟合而确定。

进一步地，所述步骤S3中，引用拉格朗日乘子Λ以及Newton-Raphson 方法求解模型每层最佳的Qp的具体方法为：

对图像组的所有分层应用D-Q、R-Q模型，得到：

ΔD_l＝γ_lΔQ_l，

将上述公式以及ΔD_intra-gop,l＝α_lΔD_l，ΔR_intra-gop,l＝β_lΔR_l代入以下公式：

得到：

将不同层Qp的分配问题采用上述公式表达，通过求解得到每层最优的Q，即可得到最佳的Qp：

设a_l＝-α_lγ_l，b_l＝2β_lμ_lm_l，c_l＝β_lν_lm_l，x_l＝ΔQ_l，可得：

引入拉格朗日乘子Λ，可得：

引用Newton-Raphson方法可求出x_l的值，即每层ΔQ_l的值，最终可以确定不同层Qp的分配；x通过迭代得到：x_t+1＝x_t-J^-1f(x_t)，t为迭代次数；限制条件使得det(J)≠0成立，则x_l+1有解；将解得的ΔQ_l结合图像组对Qp的影响，最终确定每层最佳的Qp。

与现有技术而言，本发明针对低延迟视频编码，提出了一种自适应Qp级联算法，解决在保证不变的情况下如何确定最佳Qp的问题。通过大量实验证明，本发明提出的自适应Qp级联方案比起静态自适应Qp级联方案，在实现较好的率失真优化的同时，还能够迅速适应不同的视频内容和编码配置。

附图说明

图1为本发明的LD-B/LD-P(Low-delay B、Low-delay P)层间结构示意图。

图2为本发明的LD-B/LD-P层间简化结构示意图。

图3为本发明的虚拟图像组结构示意图。

图4为本发明的步骤流程图。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

本实施例提供一种低延迟视频编码的自适应Qp级联方法，包括以下步骤：

在本实施例中，如图4所示，所述步骤S3具体包括以下步骤：

步骤S32：对第一个图像组编码，初始化D-Q，R-Q模型的参数；

在本实施例中，所述步骤S2中，根据不同层间的依赖性，推导率失真优化模型的具体方法如下：

LD-B/LD-P(Low-delay B、Low-delay P)层间结构如图1，箭头方向表明了图像组中不同层的预测关系，帧的率失真可能受低层参考帧的影响，存在大约为线性关系的帧间失真依赖性如下：

ΔD_cur和ΔD_ref分别表示当前帧的失真增加及其参考帧的失真增加，δ表示误差传播强度，δ∈[0，1]。δ＝0说明没有帧间误差传播，低层的失真不会影响到高层；δ＝1则说明帧间误差完全传播。在实验中，使用HEVC提供的常用测试视频序列，并设定δ＝0.5。帧的编码比特率一般由Qp、运动搜索、熵编码决定，几乎不受误差传播的影响，因此假定帧间比特率依赖性为0。

在实际的在低延迟视频编码中，一个帧有多个参考帧，不是一一对应的D_cur和D_ref。但是，经过实验统计，最相近的帧被作为参考帧的概率很大。在表1中，列举了LD-B/LD-P结构中最相近的帧被作为参考帧的百分比。其中涉及12个视频序列，每个视频序列包括4个Qp。从表中可以看出，最相近的帧被作为参考帧来预测当前帧的概率很大，尤其是Qp比较大的情况。因此，下面的推导过程只使用最相近的帧来预测当前帧是合理的，可以简化LD-B/LD-P层间依赖结构如图2。

(QP的第一列为最相近参考帧所占百分比，第二列为次相近参考帧所占百分比)

表1

根据层间依赖性，图像组中被作为参考帧频率越高的帧应该处于越低层，对应需要较好的编码质量，编码顺序应该从底层到高层。同时为了简化图像组之间的依赖关系，可以构造图3所示的虚拟图像组，从最低层到最高层的4帧作为一个图像组。以新的虚拟图像组的分层结构来代替原来编码顺序从第二层到最高层再到最低层的图像组结构。可以将图像组之间和图像组内部复杂的RD依赖性，简化为图像组内部的RD依赖性和图像组之间的RD依赖性线性叠加的关系。

设定一个虚拟图像组如图3，第l层的平均失真的增加为ΔD_l，对图像组总体失真ΔD_intra-gop,l的增加有影响。设ΔD_l与ΔD_intra-gop,l的关系为：

ΔD_intra-gop,l＝f_l(ΔD_l)，l＝0,...,L-1

其中，ΔD_l为第l层的平均失真的增加，ΔD_intra-gop,l为图像组总体失真的增加， f(·)为二者之间的函数关系，下标l为层的序列号，L为总层数。简化为一一对应的预测关系后，由图3的分层预测结构可知，ΔD_l和ΔD_intra-gop,l的关系可表示为：

根据数学归纳法可得：

f_l(ΔD_l)＝(1+δ)^L-1-lΔD_l，l＝0,...,L-1

可以得到ΔD_intra-gop,l＝α_lΔD_l，其中α_l＝(1+δ)^L-1-l，l＝0,...,L-1 帧间比特率依赖性为0，因此，图像组总体比特率的增加为ΔR_intra-gop,l和第l层的比特率的增加ΔR_l的关系为：

ΔR_intra-gop,l＝β_lΔR_l，其中

在本实施例中，所述步骤S2中，根据不同图像组间的依赖性，推导率失真优化模型的具体方法如下：

实验证明虚拟图像组之间也存在失真依赖性，一般没有比特率依赖性。针对低延迟视频编码，设定视频序列中连续的虚拟图像组数量为N，根据图像组之间失真的依赖性，可以得到：

ΔD_inter-gop,i为改变虚拟图像组的Qp时，视频序列失真的增加。ΔD_i为第i个虚拟图像组失真的增加。δ_gop表示图像组之间误差传播强度，δ_gop∈[0，1]。ΔR_inter-gop,i为总体比特率的增加，ΔR_i为第i个虚拟图像组比特率的增加，ΔR_inter-gop,i和ΔR_i的关系为：

ΔR_inter-gop,i＝ΔR_i

引用下述的拉格朗日乘子Λ以及Newton-Raphson方法可以解得图像组对 Qp的影响。需要注意的是，虚拟图像组对Qp的影响在编码之前就已经确定，实际上并非是自适应的。

在本实施例中，所述步骤S3中引入相关模型为D-Q模型为R-Q模型：引用线性D-Q模型与二次方程R-Q模型，分别表示为：

D＝γQ，

其中，γ、m、μ、ν为图像组各个层的参数。

在本实施例中，所述步骤S3中，将率失真优化模型转化为求解最佳Qp的问题，具体方法如下：

假设一个图像组分为L层，平均的量化步长Q设为为了给不同层分配不同的Q，最简单的办法就是把每层都设为另一种办法则是使用不同的Q_l，l＝0,1,2,...,L-1，对应不同层。然而，在l层中，以Q_l代替可能导致整个图像组的总比特率和总失真的改变，分别用ΔR_intra-gop,l和ΔD_intra-gop,l来表示。自适应 Qp级联的最优化问题就是找到最佳的Q_l，在不增加总比特率的条件下，使图像组的失真最小。更进一步，在不增加总比特率的条件下，当每个图像组的失真都是最小时，视频序列总体的失真也最小。因此，自适应Qp级联的最优化可表示为：

Q表示最佳的Ql，l＝0,1,2,...,L-1，ΔR_intra-gop,l和Δ_Dintra-gop,l受到Q_l， (D-Q)，(R-Q)模型等相关因素影响。从上述模型解出最优的Q，经过映射关系即可得到Qp，因此求解每层最佳的Qp等价于求解最优的Q。

在本实施例中，所述步骤S3中更新模型参数的具体方法为：引入的相关参数为D-Q，R-Q模型为：

引用线性D-Q模型、二次方程R-Q模型，表示为：

D＝γQ，

为了使Qp级联动态地适应具有不同纹理、运动模式、编码配置的视频序列，需要更精确的γ_l、m_l、μ_l、ν_l对应各个层。在编码过程中通过迭代逐渐更新每层的参数，可得：

n为图像组的下标，l为层的下标，分别是预测参数的值；ω_γ、ω_m、ω_μ、ω_ν表示D-Q、R-Q、MAD模型更新系数，是通过HEVC常用测试视频序列得到γ_l、m_l、μ_l、ν_l进行数据拟合而得到的。实验中，设定ω_γ＝0.98、ω_m＝0.95、ω_μ＝0.70、ω_ν＝0.82。

在本实施例中，所述步骤S3中，引用拉格朗日乘子Λ以及Newton-Raphson 方法求解模型每层最佳的Qp的具体方法为：

对图像组的所有分层应用D-Q、R-Q模型，得到：

ΔD_l＝γ_lΔQ_l，

将上述公式以及ΔD_intra-gop,l＝α_lΔD_l,ΔR_intra-gop,l＝β_lΔR_l代入以下公式：

可以得到：

将不同层Qp的分配问题用上述公式表达，通过求解这个问题可以得到每层最优的Q，再经过映射关系即可得到Qp。设a_l＝-α_lγ_l，b_l＝2β_lμ_lm_l，c_l＝β_lν_lm_l，x_l＝ΔQ_l，可得：

引入拉格朗日乘子，可得：

由于可得：

引用Newton-Raphson方法可得：

可得：

B_l＝4a_l(x_l+d)³-2Λ(b_l+c_lx_l)，

x可通过迭代得到：x_t+1＝x_t-J^-1f(x_t)，t为迭代次数。

在上式中，已知x_l+d＝Q_l＞0，只要使det(J)≠0，则x_l+1有解。可以推测以下

或是det(J)≠0的充分条件。将代入，可得：

4a_l(x_l+d)³-2Λ(b_l+c_lx_l)＝3b_l(x_l-d)+c_l(x_l-dx_l-2d²)

可化为或

当则

即可得det(J)≠0。

当则

即可得det(J)≠0。

因此，可得到限制条件

使得det(J)≠0，则x_l+1有解。由此，可以确定最优的Q_l，l＝0,...,L-1，得：

将解得的Q_l映射得到Qp_l，映射关系为其中C₁、C₂为常数。再结合图像组对Qp的影响，最终可以确定每层最佳的Qp。

为了保证以上算法在有限的计算量内有解，如果det(J)＝0或迭代次数超过 100次则采用静态Qp方案；为了保证视频编码的质量，根据低层与高层的预测关系，当高层的Qp小于最相近低层的Qp时，判定得到的Qp_l错误，也采用静态 Qp方案。

为了避免图像组间的质量波动，将所有层的Qp限制在内，是通过静态Qp方案计算出来的图像组所有层的Qp的平均值。上述的限制可能导致增加的比特率大于0，为了避免比特率突然增加，用近似的办法得到Qp_l，设定使图像组的保持不变。

在本实施例中，为了验证上述方案，与其他4组方案进行比较，包括SVC(可分层视频编码)默认的配置、X.Li在“Adaptive quantization parameter cascading forhierarchical video coding”提出的SVC自适应Qp级联方案、HEVC默认的F-RC (frame-level rate control)方案以及Tiesong Zhao在“Adaptive Quantization ParameterCascading in HEVC Hierarchical Coding”提出的静态图像组级联方案。其中，SVC是针对H.264设计的静态方案；Li’s的方案是针对H.264的自适应Qp级联方案；F-RC是针对HEVC提出的静态方案；Tiesong Zhao提出的方案虽然是针对HEVC 提出，但却也是静态的；而本发明的方案是针对低延迟视频编码的自适应Qp级联方案。通过对比在相同比特率时下不同的峰值信噪比、在相同的峰值信噪比下平均比特率增加量来描述不同方案的率失真优化效果。从表2中可以看出，LD-B 中本发明最大的BDPSNR和BDBR分别为0.310dB和-5.587％，平均情况下，此方案的BDPSNR和BDBR分别为0.077dB和-1.859％；在LD-P中最大的BDPSNR和BDBR分别为0.188dB和-5.792％，平均情况下，此方案的BDPSNR和BDBR分别为0.067dB 和-1.904％。本发明中图像组内部是自适应Qp级联，与Tiesong Zhao提出的静态图像组级联方案相比，在LD-B中，平均的BDPSNR和BDBR分别改善了0.012dB， -0.367％；在LD-P中，平均的BDPSNR和BDBR分别改善了0.012dB，-0.317％。

为了更进一步检测此方案的效率，把此方案和F-RC方案比较。一般而言，自适应Qp级联方案不能达到与F-RC相近的编码性能，因为自适应Qp级联方案是从图像组的层面上对不同层次分配Qp，而F-RC是从视频序列的层面对帧或者编码单元进行分配Qp。根据表2的结果来看，此方案达到了与F-RC相近的性能，

并且在编码CLASS B、CLASS E、CLASS F的视频序列时还具有更好的效果。

表2

以上所述仅为本发明的较佳实施例，凡依本发明申请专利范围所做的均等变化与修饰，皆应属本发明的涵盖范围。

Claims

1.一种低延迟视频编码的自适应Qp级联方法，其特征在于：包括以下步骤：

步骤S3：引入相关模型，将率失真优化模型转化为求解最佳Qp的问题，同时通过更新模型参数来使模型适应不同的视频序列；并引用拉格朗日乘子Λ以及Newton-Raphson方法求解模型每层最佳的Qp，合理地分配每一帧的Qp，实现率失真的最优化。

2.根据权利要求1所述的一种低延迟视频编码的自适应Qp级联方法，其特征在于：所述步骤S3具体包括以下步骤：

步骤S32：对第一个图像组编码，初始化D-Q，R-Q模型的参数；

3.根据权利要求1所述的一种低延迟视频编码的自适应Qp级联方法，其特征在于：所述步骤S2中，根据不同层间的依赖性，推导率失真优化模型的具体方法如下：

在实际的低延迟视频编码中，一个帧有多个参考帧，不是一一对应的D_cur和D_ref，简化层间的依赖关系，近似认为当前帧仅参考最相近的帧；

ΔD_intra-gop,l＝f_l(ΔD_l)，l＝0,...,L-1

根据数学归纳法得到：

f_l(ΔD_l)＝(1+δ)^L-1-lΔD_l，l＝0,...,L-1

再得到：

ΔD_intra-gop,l＝α_lΔD_l，α_l＝(1+δ)^L-1-l，l＝0,...,L-1

ΔR_intra-gop,l＝β_lΔR_l，其中

4.根据权利要求1所述的一种低延迟视频编码的自适应Qp级联方法，其特征在于：所述步骤S2中，根据不同图像组间的依赖性，推导率失真优化模型的具体方法如下：

ΔR_inter-gop,i＝ΔR_i。

5.根据权利要求1所述的一种低延迟视频编码的自适应Qp级联方法，其特征在于：所述步骤S3中引入相关模型为D-Q模型为R-Q模型：引用线性D-Q模型与二次方程R-Q模型，分别表示为：

D＝γQ，

其中，γ、m、μ、ν为图像组各个层的参数。

6.根据权利要求1所述的一种低延迟视频编码的自适应Qp级联方法，其特征在于：所述步骤S3中，将率失真优化模型转化为求解最佳Qp的问题，具体方法如下：

Q表示最佳的Q_l，l＝0,1,2,...,L-1，ΔR_intra-gop,l和ΔD_intra-gop,l受到Q_l，(D-Q)，(R-Q)模型等相关因素影响，从上述模型解出最优的Q，经过映射关系即可得到Qp。

7.根据权利要求1所述的一种低延迟视频编码的自适应Qp级联方法，其特征在于：所述步骤S3中更新模型参数的具体方法为：引入的相关参数为D-Q，R-Q模型为：

D＝γQ，

n为图像组的下标，l为层的下标，分别是预测参数的值；ω_γ、ω_m、ω_μ、ω_ν表示D-Q、R-Q、MAD模型更新系数，通过HEVC常用测试视频序列所得γ_l、m_l、μ_l、ν_l进行数据拟合而确定。

8.根据权利要求1所述的一种低延迟视频编码的自适应Qp级联方法，其特征在于：所述步骤S3中，引用拉格朗日乘子Λ以及Newton-Raphson方法求解模型每层最佳的Qp的具体方法为：

对图像组的所有分层应用D-Q、R-Q模型，得到：

ΔD_l＝γ_lΔQ_l，

得到：

引入拉格朗日乘子Λ，可得：