CN111726638A

CN111726638A - 一种结合去压缩效应与超分辨率的hevc编码优化方法

Info

Publication number: CN111726638A
Application number: CN201910202336.9A
Authority: CN
Inventors: 何小海; 周航; 王正勇; 熊淑华; 卿粼波; 滕奇志; 吴晓红
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2019-03-18
Filing date: 2019-03-18
Publication date: 2020-09-29

Abstract

本发明公布了一种结合去压缩效应与超分辨率的HEVC编码优化方法。主要包括以下步骤：在编码端，原始视频首先经过下采样，然后进行压缩，这样可以减少视频的数据量；在解码端，采用了双网络结构的方法，首先训练不同量化参数下的下采视频与压缩后的低分辨率视频的映射关系，这样可以减弱压缩伪影，然后建立了质量增强的压缩视频与原始视频的映射关系，最终在输出端可以得到质量提升的视频帧。实验结果表明，在低码率段，本发明所述的方法可以有效地提升编码视频的率失真性能，并能获得更好的视觉效果。

Description

一种结合去压缩效应与超分辨率的HEVC编码优化方法

技术领域

本发明涉及视频压缩和超分辨率重建技术，具体涉及一种结合去压缩效应与超分辨率的 HEVC编码优化方法，属于图像通信领域。

背景技术

在图像和视频传输中，为适应带宽的限制和方便人们的存储，通常对其进行下采样和压缩。图像和视频压缩标准普遍使用基于块的混合编码方式，这些压缩技术的主要目的是压缩大量的冗余信息，以适应通信信道的带宽限制。这些技术的思想是量化变换域系数以减少数据量，但是会造成块效应，从而降低图像和视频质量，而下采样和压缩技术相结合的方法在降低分辨率的同时，往往会使得压缩图像和视频产生一定的失真。因此，需要更简单和实用的视频质量提升方法。

图像和视频往往采用超分辨率重建的方法进行质量的提升，该方法大致可以分为基于插值，基于重建，基于学习这三种，传统的插值算法并不能取得令人满意的视觉效果，特别是对于经过压缩的低分辨率视频。基于重建的方法可以恢复边缘锐利的信息，但通常会忽略纹理区域的高频细节。随着卷积神经网络在计算机视觉领域的成功，基于深度学习的方法在图像和视频处理领域也很受欢迎。与此同时，深度学习的方法在图像和视频处理领域取得了显著的研究成果。深度学习与传统方法相比的优势在于，其得到的特征具有更强的表征能力。然而，现有的基于深度学习的方法，大多是针对下采样单个降质环节，而对于经过压缩的低分辨率视频，其质量还有一定提升的空间。

发明内容

本发明的目的是为了将视频的下采样和压缩两个降质环节分开处理，在提高视频分辨率的同时降低压缩噪声，从而有效提升压缩视频的率失真性能。

本发明所提出的一种结合去压缩效应与超分辨率的HEVC编码优化方法，主要包括以下操作步骤：

(1)采用去压缩卷积神经网络模型分别训练不同量化参数下的下采样视频与压缩后的低分辨率视频之间的映射关系；

(2)步骤一得到了质量增强的视频帧，训练其与原始视频帧的重建网络模型；

(3)将降质的低分辨率视频作为输入，根据步骤(1)，(2)训练出的卷积神经网络模型，在输出端得到质量提升的视频帧。

附图说明

图1是本发明结合去压缩效应与超分辨率的HEVC编码优化方法的框架图

图2是本发明的网络结构图

图3是Keiba序列在码率基本相同的情况下，HEVC标准和本发明方法主观效果对比图

图4是RaceHorses832x480序列在码率基本相同的情况下，HEVC标准和本发明方法主观效果对比图

图5是akiyo序列的不同方法及本发明方法重建后视频的率失真性能比较

图6是BasketballDrill序列的不同方法及本发明方法重建后视频的率失真性能比较

具体实施方式

下面结合附图对本发明作进一步说明：

图1中，具体涉及一种结合去压缩效应与超分辨率的HEVC编码优化方法，具体可以分为以下几个步骤:

具体地，所述步骤(1)中，首先训练下采样视频和经过压缩的低分辨率视频的映射关系，本发明网络结构如图2所示，包含4个密集残差模块。对于去压缩网络，首先利用第一层卷积对压缩后的低分辨率视频进行特征提取，相当于用一组滤波器对输入进行卷积。第一层的输出随后作为密集残差块的输入，将提取到的特征进行非线性映射得到更高维度的特征。为了更好地利用层次特征，提取了局部密集特征之后，采用了特征融合的策略。随后，利用最后一个卷积层将前面的高维特征进行组合，进而得到质量增强的视频帧。

在训练阶段，令

是训练的视频对，其中X_i表示原始的高分辨率视频，Y_i表示只经过下采样后的低分辨率视频，Z_i表示经过下采样，压缩两个降质过程的低分辨视频。

首先，视频对

用于去压缩网络的训练，本发明采用残差学习的策略，定义残差 r_e,i＝Y_i-Z_i，它的大部分值为0或者接近0，残差学习是使用映射f_e(Z_i,Ω)预测该残差，在网络中以均方误差为损失函数，测量预测值与原始值之间的差异，并通过最小化方式来更新网络参数，去压缩网络的损失函数为：

其中，Ω是网络的参数，f_e(Z_i,Ω)是残差的预测值。

所述步骤(2)中，提取步骤(1)中得到的增强的压缩视频，可以从压缩后的低分辨率视频Z_i中得到Y_i的高质量估计Y_i'。Y_i'便和X_i作为超分网络的训练对

同样采用残差学习的策略，使用映射f_s(Y_i',Ω)去预测残差r_s,i＝X_i-Y_i'，损失函数表示为：

所述步骤(3)中，将压缩后的低分辨率视频输入到步骤(1)和(2)的网络模型中，得到最终的重建视频帧。

为了更好地说明本发明的有效性，选择出两个测试序列”Keiba”，“RaceHorses832×480”，与压缩标准HEVC进行对比，主观视觉效果如图3及图4所示；并选出两个测试序列”akiyo”， “BasketballDrill”，与其他方法比较率失真性能，率失真曲线如图5及图6所示，其中横轴是码率，单位是Kpbs；纵轴是峰值信噪比(PSNR)，单位是dB。在相同的码率下，PSNR越高，率失真性能越好。表一展示了本发明方法及视频压缩标准HEVC的码率和PSNR对比，表明了本发明算法能有效提升压缩视频的率失真性能。表二展示了本发明与其他方法的PSNR对比，表明了本发明优于经典的卷积神经网络方法，实验结果对于其他测试序列具有普适性。

对比的方法为：

方法1：TAI Y等人提出的方法，参考文献“TAI Y,YANG J,and LIU X.Imagesuper-resolution via deep recursive residual network[C]//Proceedings of theIEEE Conference on Computer Vision and Pattern Recognition.Honolulu:IEEE,2017:3147-3155.”。

表一：

表二：

Claims

1.一种结合去压缩效应与超分辨率的HEVC编码优化方法，其特征在于包括以下步骤：

步骤一：采用去压缩卷积神经网络模型分别训练不同量化参数下的下采样视频与压缩后的低分辨率视频之间的映射关系；

步骤二：步骤一得到了质量增强的视频帧，训练其与原始视频帧的重建网络模型；

步骤三：将降质的低分辨率视频作为输入，根据步骤(1)，(2)训练出的卷积神经网络模型，在输出端得到质量提升的视频帧。

2.根据权利要求1所述的一种结合去压缩效应与超分辨率的HEVC编码优化方法，其特征在于步骤一中所述的去压缩卷积神经网络模型，该模型首先对压缩环节处理，训练下采样视频和压缩后的低分辨率视频之间的映射关系，从而可以得到质量增强后的视频帧。

3.根据权利要求1所述的一种结合去压缩效应与超分辨率的HEVC编码优化方法，其特征在于步骤二中所述的重建网络模型，该模型训练步骤一得到的增强视频与原始视频的映射关系；这样，可以将下采样和压缩两个降质环节分开处理，从而可以有效地减少压缩伪影。

4.根据权利要求1所述的一种结合去压缩效应与超分辨率的HEVC编码优化方法，其特征在于步骤二中所述的重建网络模型，该模型采用密集残差结构，该结构结合残差网络和密集连接网络的特性，充分利用原始低分辨率视频的分层特征，一个密集残差块的输出可以直接访问下一个密集残差块中的每一个卷积层，保持密集残差块之间的连续记忆，所以能重建出较高质量的视频；同时采用全局残差学习的策略，只需要学习高频部分的残差，这样可以降低训练深层网络的难度。