CN115134598A

CN115134598A - 一种基于qp估计的压缩视频质量盲增强方法

Info

Publication number: CN115134598A
Application number: CN202110319011.6A
Authority: CN
Inventors: 何小海; 帅鑫; 卿粼波; 孙伟恒; 熊淑华; 滕奇志; 王正勇
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2021-03-25
Filing date: 2021-03-25
Publication date: 2022-09-30

Abstract

本发明公布了一种基于QP估计的压缩视频质量盲增强方法，主要包括以下步骤：首先预测压缩视频的质量因子(QP)，根据预测结果选取对应训练好的模型增强压缩视频的质量。QP估计通过提取压缩视频具有代表性的样本块，再使用QP估计网络预测样本块的QP从而得到压缩视频的QP。压缩视频增强模型采用多帧网络结构，输入的相邻帧首先通过运动补偿增益有益信息。目标帧与补偿后的相邻帧经过多尺度卷积层来获得细节信息，再进一步通过质量增强子块来补偿与恢复信息，最后利用残差学习加速网络收敛，输出增强后的帧。实验结果表明，本发明方法能够有估计压缩视频的QP，提高压缩视频质量，获得更好的人眼视觉体验。

Description

一种基于QP估计的压缩视频质量盲增强方法

技术领域

本发明涉及QP估计和压缩视频质量增强技术，具体涉及一种基于QP估计的压缩视频质量盲增强方法，属于图像通信领域。

背景技术

视频编码标准HEVC已经越来越广泛地运用在互联网上来生成视频流。与以前的视频编码标准一样，HEVC压缩视频也会产生压缩效应，如块效应、振铃效应、模糊等，这些压缩效应的存在严重影响了用户的观影体验。为了削弱压缩效应，增强压缩视频的质量，HEVC中采用了环路滤波技术，包括去方块滤波DF和样点自适应补偿SAO两个环路后处理模块，可恢复受损视频的主客观质量，也有助于提高压缩效率。尽管HEVC自带着环路滤波技术，但压缩视频仍存在着压缩效应，所以关于去压缩效应的研究工作仍在进行中。

深度学习在计算机视觉和图像处理领域取得了令人瞩目的成就。当前，基于深度学习的方法也被应用于提高解码视频的质量。对于HEVC标准，大多数后处理方法均是在质量因子已知的情况下来进行的。然而，由于实际压缩视频的质量因子QP可能是未知的，在这种情况下，也需要实用的视频质量增强方法。而对于一些存在的盲方法，是训练全盲的模型，这种全盲的模型虽然能够应用于不知到质量因子的场合，但全盲模型的效果往往一般，因此，如果能将全盲模型转换为非盲模型，既能够用于盲场景，且能够提高效率。众所周知，不同质量因子的HEVC压缩视频，存在不同的压缩效应，可以依据这种不同来检测出压缩视频的质量因子，由此将盲场景转换为非盲场景，再训练非盲场景下训练的CNN网络，得到一个效果较好应用于压缩视频质量盲增强方法。

发明内容

本发明的目的是为了估计出HEVC标准压缩后的视频的质量因子，并根据此质量因子选择对应的质量增强模型来增强HEVC标准压缩后的视频质量。

本发明所提出的一种基于QP估计的压缩视频质量盲增强方法，主要包括以下操作步骤：

(1)提出一种压缩视频质量因子估计算法。

(2)训练不同QP的压缩视频质量增强模型。

(3)根据(1)中的QP估计算法，估计HEVC标准测试视频压缩后的质量因子，根据估计结果选取(2)中对应的训练好的质量增强模型，在输入端输入HEVC压缩后的测试视频序列，在输出端得到质量增强后的视频序列。

附图说明

图1是本发明基于QP估计的盲压缩视频质量增强方法的框图。

图2是本发明的QP估计算法。

图3是本发明的QP估计网络。

图4是本发明的压缩视频质量增强网络结构图。

图5是本发明的质量增强模块结构图。

图6是多尺度特征提取与融合子块结构图。

图7是本发明的质量增强子块结构图。

图8是从上到下分别是序列BasketballPass在QP＝37，序列FourPeople在QP＝37，序列Johnny在QP＝42，序列Akiyo在QP＝47时，HEVC标准和本发明方法以及原图的主观效果视觉质量对比图。

具体实施方式

下面结合附图对本发明作进一步说明。

图1中，具体涉及一种基于QP估计的压缩视频质量盲增强方法，具体可以分为以下几个步骤:

(1)提出一种压缩视频质量因子(QP)估计算法。

(2)提出一种压缩视频质量因子估计网络。

(3)提出一种压缩视频质量增强模型。

(4)根据(1)中的质量因子估计算法，检测HEVC标准压缩后的视频的质量因子，其中用到(2)中的网络，根据估计结果选取(3)中对应的训练好的质量增强模型，在输入端输入HEVC标准压缩后的视频，在输出端得到增强质量后的视频。

具体地，所示步骤(1)中，提出的QP估计算法的基础理论是，使用HEVC压缩视频时，设置不同的QP后，输出的不同QP压缩下的压缩视频存在不同的压缩效应，依据这种压缩效应来估计当前压缩视频的QP，通过提取压缩视频具有代表性的样本块，输入到本发明提出的QP估计网络来预测出当前压缩视频的QP，具体过程本如图2所示，对于压缩视频的若干帧，使用Kirsch提取当前帧的轮廓区域，具体过程是将当前帧分为若干个64×64的样本块，使用Kirsch算子将样本块转到像素域，计算当前帧的方差与样本块的方差，若样本块的方差大于当前帧的方法，则认为该样本块是当前帧的轮廓区域，并且将该样本块输入到(2)中的QP估计网络中预测QP。最后，在所有的QP预测结果中，被预测出次数最多的QP被认为是当前帧的QP，而在一个视频的被预测出QP的若干帧，预测次数最多的QP被认为是该压缩视频的QP。

所示步骤(2)中，设计了压缩视频质量因子估计网络，该网络将样本块输入到网络中来输出预测出的QP，该网络采用密集连接的思路来增强样本块的特征，通过连接层来控制数据量，最后用全局池化层与完全连接层来预测样本块的QP。

所示步骤(3)中，本发明设计了结合相邻帧的质量增强网络，该网络又提出了一种质量增强模块，该模块包含提出的多尺度特征提取与融合子块和一种质量增强子块，网络结构图如图4所示，质量增强模块如图5所示，多尺度特征提取与融合子块如图6所示，质量增强子块如图7所示。

如图4所示，该网络主要由一个运动补偿模块与质量增强模块组成。对于待增强的当前帧，其上下两帧首先通过运动补偿模块进行运动补偿。随后，补偿后的帧与当前帧输入到质量增强模块中得到增强后的帧。运动补偿模块采用的是STMC网络，质量增强模块结构如图5所示，输入的三帧通过多尺度特征提取与融合子块得到融合特征，如图6所示，该子块由3×3的卷积层，5×5的卷积层和7×7的卷积层，这些卷积层提取多尺度特征，随后用“Concat”操作进行特征融合，得到融合特征后，再经过三个质量增强块，最后在利用残差学习加速网络收敛，得到增强后的帧。其中，质量增强块的结构如图5所示，利用“Concat”操作增强特征，利用“split”操作控制特征数量，防止数量量过大。

在训练阶段，分为运动补偿模块与质量增强模块的训练，F_t是待增强的当前帧，F′_t-1和F′_t+1是运动补偿后的相邻上下帧，

是增强后的帧，θ_mc是运动补偿模块的参数，

是质量增强模块的参数，则运动补偿块的损失函数为：

质量增强模块的损失函数为：

整个质量增强网络采用联合训练的损失函数，为：

a和b是联合损失函数的权重。

所示步骤(4)中，由于不同质量因子的HEVC压缩视频存在不同的压缩效应，可以通过估计所提取的压缩视频具有代表性的样本块来得到当前压缩视频的质量因子，未知质量因子的压缩视频首先通过步骤(1)中提出的压缩视频质量因子估计算法，预测出对应的质量因子，根据质量因子选择步骤(3)中训练好的对应的质量增强模型，然后，这些压缩视频再输入到选择好的质量增强模型，得到质量增强后的视频。

为了更好地说明本发明的有效性，选择出四个测试序列“BasketballPass”,“FourPeople”，“Johnny”，“Akiyo”与压缩标准HEVC对比，主观视觉效果如图8所示。表二展示了本发明在压缩视频在QP＝37的QP估计结果与相较于HEVC压缩标准所提升的PSNR。表二展示了本发明方法与其他盲方法的PSNR对比，表三展示了本发明与其他非盲方法的PSNR对比，表明了本发明能有效提升压缩视频的质量，实验结果对于其他测试序列具有普适性。

对比的方法为:

方法1:Y.Kim,等人提出的方法，参考文献“A Pseudo-Blind ConvolutionalNeural Network for the Reduction of Compression Artifacts,"in IEEETransactions on Circuits and Systems for Video Technology,vol.30,no.4,pp.1121-1135,April2020,doi:10.1109/TCSVT.2019.2901919.

方法2:Z.Guan,Q.Xing,等人提出的方法，参考文献“MFQE 2.0:A New Approachfor Multi-Frame Quality Enhancement on Compressed Video”,in IEEE Transactionson Pattern Analysis and Machine Intelligence,vol.43,no.3,pp.949-963,1March2021,doi:10.1109/TPAMI.2019.2944806.

表一本发明在QP＝37的估计结果与相对于HEVC压缩标准所提升的PSNR

表二本发明方法与其他盲方法的PSNR对比

表三本发明与其他非盲方法的PSNR对比

Claims

1.一种基于QP估计的压缩视频质量盲增强方法，其特征在于包括以下步骤：

步骤一：提出一种基于QP估计的压缩视频质量盲增强方法，目前一般的HEVC压缩视频质量增强方法都是在已知质量因子(QP)下进行的，然而在实际应用中，真实场景下的压缩视频的QP往往是不知道，因此选择盲增强方法更加有效，但一般的盲方法是全盲方法，这种盲方法的提升效果往往一般，该基于QP估计的压缩视频质量盲增强方法通过步骤二中的压缩视频质量因子(QP)估计算法来估计HEVC压缩视频的QP，将盲场景转换为非盲场景，再通过步骤三中的非盲场景下训练的质量增强网络来提高HEVC压缩视频的质量，获得更好提升效果；

步骤二：提出一种压缩视频质量因子估计算法；

步骤三：提出一种压缩视频质量因子估计网络；

步骤四：提出一种压缩视频质量增强网络。

2.根据权利要求1所述的一种基于QP估计的压缩视频质量盲增强方法，其特征在于步骤一中所述的过程，该过程由于不同质量因子的HEVC压缩视频存在不同的压缩效应，可以通过估计所提取的压缩视频具有代表性的样本块来得到当前压缩视频的质量因子，再针对性选择对应的质量增强网络得到增强后的视频，具体过程是通过步骤二中提出的压缩视频质量因子估计算法，估计得到对应的质量因子，根据质量因子选择步骤四中训练好的对应的质量增强模型，然后，这些压缩视频再输入到选择好的质量增强模型，最后得到质量增强的视频。

3.根据权利要求1所述的一种基于QP估计的压缩视频质量盲增强方法，其特征在于步骤二中所述的压缩视频质量因子估计算法，该算法的基础理论是，使用HEVC压缩视频时，设置不同的QP后，输出的不同QP压缩下的压缩视频存在不同的压缩效应，依据这种压缩效应来估计当前压缩视频的QP，通过提取压缩视频具有代表性的样本块，输入到步骤三中提出的QP估计网络来预测出当前压缩视频的QP，对于压缩视频的若干帧，使用Kirsch提取当前帧的轮廓区域，具体过程是将当前帧分为若干个64×64的样本块，使用Kirsch算子将样本块转到像素域，计算当前帧的方差与样本块的方差，若样本块的方差大于当前帧的方法，则认为该样本块是当前帧的轮廓区域，并且将该样本块输入到QP估计网络中预测QP，最后，在所有的QP预测结果中，被预测出次数最多的QP被认为是当前帧的QP，而在一个视频的被预测出QP的若干帧，预测次数最多的QP被认为是该压缩视频的QP。

4.根据权利要求1所述的一种基于QP估计的压缩视频质量盲增强方法，其特征在于步骤三中所述的压缩视频质量因子估计网络，将样本块输入到网络中来输出预测出的QP，该网络采用密集连接的思路来增强样本块的特征，通过连接层来控制数据量，最后用全局池化层与完全连接层来预测样本块的QP。

5.根据权利要求1所述的一种基于QP估计的压缩视频质量盲增强方法，其特征在于步骤四中所述的压缩视频质量增强网络，该网络是一种多帧输入的质量增强网络，输入是连续的三帧，分别是目标帧与目标帧相邻的上一帧与下一帧，相邻的两帧首先输入到运动补偿模块进行运动补偿，随后，补偿后的相邻帧与目标帧一起输入到提出的质量增强模块中，经过特征提取，融合与增强等操作，再利用残差学习的思想来得到质量增强后的目标帧，质量增强模块中包含了所提出的融合子块，质量增强子块等网络结构，融合子块由3×3的卷积层，5×5的卷积层和7×7的卷积层组成，这些卷积层提取多尺度特征，随后用“Concat”操作进行特征融合，质量增强块运用残差学习的思路增强特征，其中，具体是利用“Concat”操作增强特征，利用“split”操作控制特征数量，防止数据量过大。