CN112019854B

CN112019854B - 基于深度学习神经网络的环路滤波方法

Info

Publication number: CN112019854B
Application number: CN201910450808.2A
Authority: CN
Inventors: 刘家瑛; 王德昭; 夏思烽; 杨文瀚; 胡越予; 郭宗明
Original assignee: Peking University
Current assignee: Peking University
Priority date: 2019-05-28
Filing date: 2019-05-28
Publication date: 2023-01-17
Anticipated expiration: 2039-05-28
Also published as: CN112019854A

Abstract

本发明为一种基于深度学习神经网络的环路滤波方法，利用了视频编码中块划分树的信息，进一步提升视频恢复质量。与传统的视频编码器内采用了手工设计的去块效应模块以及样点自适应补偿模块不同，本发明利用了深度卷积神经网络在大量训练数据集上进行学习，从而更准确地学习到从低质量视频到高质量视频的非线性映射。本发明为块与块间增加了连接，从而可以传递未被压缩的特征信息。此外，本发明还利用了视频编码器提供的块划分树中的多层块划分信息，生成多层编码单元均值图，进一步辅助神经网络更好地消除块效应。

Description

基于深度学习神经网络的环路滤波方法

技术领域

本发明涉及视频编码领域，尤其涉及一种基于深度学习神经网络的环路滤波方法。

背景技术

在数字视频的使用传播过程中，有损视频压缩是一项不可或缺的关键技术。有损视频压缩通过对视频进行编码端的编码压缩以及解码端的解码恢复，极大地降低了数字视频在存储和传输过程中的开销，使得数字视频在日常生活得以被普遍使用。但是有损视频压缩技术在编码段不可避免地要损失信息，这也造成了解码视频质量的下降。

造成视频质量下降的原因主要有两点：第一，最新的视频编码技术往往把每一帧划分为大小不同的块，基于块来压缩与编码。这样就会导致块与块的边界处像素值会有突变，也就是块效应。第二，在量化过程中，高频信息被消除，导致振铃效应。

为了恢复视频质量，视频编码器往往会在反变换后，进行环路滤波，以提高视频质量。其中，去块效应模块对块与块的边界的像素值进行调整，缓解块效应；样点自适应补偿模块为视频帧补充高频信息，缓解振铃效应。

受启发于深度神经网络技术在图像处理问题中的成功应用，一些方法在环路滤波中引入了深度神经网络，并获得了一定的性能提升。但是已有的方法往往通过简单地串联设计好的网络块来搭建网络(比如利用串联残差稠密块搭建残差稠密网络，请参见Y.L.Zhang,Y.P.Tian,Y.Kong,B.N.Zhong,and Y.Fu,“Residual dense network forimage super-resolution,”in Proc.IEEE Int’l Conf.Computer Vision and PatternRecognition,2018.)。本发明在残差稠密块的基础上额外引进了块与块间的跳接，将前一个网络块未经压缩的特征图进行卷积操作后直接接入后一块的输出部分。通过这样的连接，形成了长期记忆的传输。此外，视频编码器提供了许多辅助信息，例如块划分树，可以用来辅助视频恢复。

发明内容

本发明在上述技术背景下，提供了一种基于深度学习神经网络的环路滤波方法。为相邻的网络块间提供长期记忆的连接，并且利用了块划分树提供的多层划分信息，获得了更佳的编码性能。

本发明的基于深度学习神经网络的环路滤波方法，如附图1所示。所述深度学习神经网络包括基线网络和辅助信息抽取网络，所述基线网络和辅助信息抽取网络均由带有长期记忆的残差稠密块连接而成，其步骤包括：

1、将原始帧送入视频编码器进行编码，经过反变换得到待滤波的重建帧；

2、根据视频编码器的块划分树，递归地提取待滤波的重建帧中每一层编码单元像素的均值(请见Y.L.Zhang,Y.P.Tian,Y.Kong,B.N.Zhong,and Y.Fu,“Residual densenetwork for image)，组成多层编码单元均值图；

3、所述辅助信息抽取网络根据多层编码单元均值图进行特征抽取，得到多层编码单元均值图的特征图；

4、将所述待滤波的重建帧输入基线网络，并将所述多层编码单元均值图的特征图插入到基线网络的不同深度，进行前向传播，得到滤波后的重建帧。

本发明所述辅助信息抽取网络由两个带有长期记忆的残差稠密块连接而成。

本发明将所述待滤波的重建帧输入基线网络前进行去块效应。

本发明将前向传播输出的滤波后的帧进行样点自适应补偿。

本发明所述深度学习神经网络为一卷积神经网络模型，通过如下训练步骤得到：

1、收集N张图片，将各图片视为单帧视频，作为原始帧送入视频编码器中进行编码，经过反变换和去块效应模块后，得到待滤波的重建帧；

2、根据块划分树，递归地提取待滤波的重建帧中每一层编码单元像素的均值，组成多层编码单元均值图；

3、输入辅助信息特征抽取网络，进行特征抽取，得到多层编码单元均值图的特征图；

4、将所述待滤波的重建帧输入神经网络模型的基线网络，并将所述多层编码单元均值图的特征图插入到神经网络模型的基线网络的不同深度，进行前向计算，生成滤波后的重建帧；

5、将步骤4得到的计算结果，与原始帧进行均方差的计算；

6、把计算的均方差反向传播到基线网络各层，以更新各层权值，进行下次迭代，直到基线网络的均方差收敛，得到优化的卷积神经网络模型。

本发明的基于深度学习神经网络的环路滤波系统，包括视频编码器及其环路滤波模块，所述环路滤波模块包含基线网络以及辅助信息特征抽取网络，所述基线网络和辅助信息抽取网络均由带有长期记忆的残差稠密块连接而成，其特征在于：

所述视频编码器用于将原始帧进行编码，并进行反变换生成待滤波的重建帧；并根据块划分树，递归地提取待滤波的重建帧中每一层编码单元像素的均值，组成多层编码单元均值图；

所述辅助信息特征抽取网络用于对所述多层编码单元均值图进行特征抽取，得到多层编码单元均值图的特征图，并将所述多层编码单元均值图的特征图插入到所述基线网络的不同深度；

所述基线网络接收所述待滤波的重建帧和插入的特征图进行前向传播，输出滤波后的重建帧；

所述系统还包括一去块效应模块，用于将重建帧去块效应后再输入基线网络。

所述系统还包括一样点自适应补偿模块，以将前向传播输出的滤波后的重建帧进行样点自适应补偿。

所述辅助信息抽取网络的深度浅于所述基线网络。

本发明方法的滤波过程基于一个深度卷积神经网络实现。本发明的深度卷积神经网络可以分为两个部分：基线网络以及辅助信息特征抽取网络。基线网络由带有长期记忆的残差稠密块连接而成；辅助信息特征抽取网络由带有长期记忆的残差稠密块连接而成，其网络深度浅于基线网络。基线网络输入待滤波的重建帧；辅助信息特征抽取网络输入为多层编码单元均值图，输出为其特征图，并将特征图插入基线网络的不同深度网络。神经网络的输出是滤波后的重建帧。

本发明不仅仅是采用简单地串联网络块，而是额外增加了长期记忆连接，如附图2所示。其中，上一个网络块的长期信息(Md)直接传入当前块输出部分，弥补了在当前块运算过程中损失的信息。

本发明提取了编码器提供的块划分树的多层划分信息，通过计算每一层划分时编码单元的均值，形成了多层编码单元均值图，如附图3所示。其中，图片上半部分为块划分树，下半部分为其对应的编码单元均值图。

本发明为相邻的网络块间提供长期记忆的连接，并且利用了块划分树提供的多层划分信息，获得了更佳的编码性能。经过本发明的滤波，在JCT-VC的B-E类标准序列上(请参见K.Sharman and K.Suehring,“Common test conditions,”in document JCTVC-Z1100,Joint Collaborative Team on Video Coding,2017.)，全部帧内预测参数配置下，可达到了平均9.6％的BD-rate(请参见G.Bjontegaard,“Calculation of average PSNRdifferences between RD-curves,”in document VCEG-M33,ITU-T Video CodingExperts Group Meeting,2001)性能提升。

附图说明

图1是环路滤波方法流程图。

图2是带有长期记忆连接的稠密残差网络块示意图。

图3是提取多层编码均值图示意图。

具体实施方式

为了对本发明的技术方法进一步阐述，下面结合说明书附图和具体实例，对本发明的环路滤波方法进行进一步的详细说明。

假设目前已经构建了所需的卷积神经网络模型，并且有N张训练图像{I₁,I₂,…,I_N}作为训练数据，其训练步骤包括：

1、将{I₁,I₂,…,I_N}中的每一张图送入编码器中，将经过去块效应模块的帧保存下来，记为{I′₁,I′₂,...,I′_n}；

2、根据附图3所示，提取每一张图片的多层编码单元均值图，记为{{S₁₁,S₁₂,…,S_1m},{S₁₁,S₁₂,…,S_1m},…,{S₁₁,S₁₂,…,S_1m}}，其中m是块划分树的层数；

3、将每一张重建帧{I′₁,I′₂,...,I′_n}送入基线网络，并将他们对应的多层编码单元均值图{{S₁₁,S₁₂,…,S_1m},{S₂₁,S₂₂,…,S_2m},…,{S_N1,S_N2,…,S_Nm}}送入辅助信息特征抽取网络，生成编码单元均值图的特征图{{SF₁₁,SF₁₂,…,F_1m},{SF₂₁,SF₂₂,…,SF_2m},…,{SF_N1,SF_N2,…,SF_Nm}}；

4、将这些上述的特征图插入到基线网络的不同深度，从而得到输出

计算输出与{I₁,I₂,…,I_N}的均方差；

5、将计算的均方差反向传播到基线网络以及辅助信息特征提取网络各层，以训练网络更新模型权值；

6、重复步骤3-步骤5直到神经网络的均方差收敛，得到优化的卷积神经网络模型。

将优化的卷积神经网络模型运用到编码器的环路滤波模块中，介于去块效应模块与样点自适应补偿模块之间。

在编码器实际测试中，视频编码器将原始帧进行编码，并进行反变换和去块效应模块生成待滤波的重建帧；计算当前帧的多层编码单元均值图，将待滤波的重建帧和其多层编码单元均值图送入神经网络模型，得到滤波后的重建帧；将滤波后的重建帧送入样点自适应补偿模块中，得到最后的重建帧。

Claims

1.一种基于深度学习神经网络的环路滤波方法，所述深度学习神经网络包括基线网络和辅助信息抽取网络，所述基线网络和辅助信息抽取网络均由带有长期记忆的残差稠密块连接而成，所述带有长期记忆的残差稠密块是在残差稠密块的基础上引进块与块间的跳接，以将前一个网络块未经压缩的特征图进行卷积操作后直接接入后一网络块的输出部分，其特征在于，包括以下步骤：

1)将原始帧送入视频编码器进行编码，经过反变换得到待滤波的重建帧；

2)根据视频编码器的块划分树，递归地提取待滤波的重建帧中每一层编码单元像素的均值，组成多层编码单元均值图；

3)所述辅助信息抽取网络根据多层编码单元均值图进行特征抽取，得到多层编码单元均值图的特征图；

4)将所述待滤波的重建帧输入基线网络，并将所述多层编码单元均值图的特征图插入到基线网络的不同深度，进行前向传播，得到滤波后的重建帧。

2.如权利要求1所述的方法，其特征在于，所述辅助信息抽取网络的深度浅于所述基线网络。

3.如权利要求1所述的方法，其特征在于，所述待滤波的重建帧输入基线网络前进行去块效应。

4.如权利要求1所述的方法，其特征在于，将前向传播输出的所述滤波后的重建帧进行样点自适应补偿。

5.如权利要求1所述的方法，其特征在于，所述深度学习神经网络需先构建一个原始卷积神经网络模型，再通过如下训练步骤得到，包括：

1)收集N张图片，将各图片视为单帧视频，作为原始帧送入视频编码器中进行编码，经过反变换后，得到待滤波的重建帧；

2)根据块划分树，递归地提取待滤波的重建帧中每一层编码单元像素的均值，组成多层编码单元均值图；

3)输入辅助信息特征抽取网络，进行特征抽取，得到多层编码单元均值图的特征图；

4)将所述待滤波的重建帧输入神经网络模型的基线网络，并将所述多层编码单元均值图的特征图插入到神经网络模型的基线网络的不同深度，进行前向计算，生成滤波后的重建帧；

5)将步骤4)得到的计算结果，与原始帧进行均方差的计算；

6)把计算的均方差反向传播到基线网络各层，以更新各层权值，进行下次迭代，直到基线网络的均方差收敛，得到优化的卷积神经网络模型。

6.一种基于深度学习神经网络的环路滤波系统，包括视频编码器及其环路滤波模块，所述环路滤波模块包含基线网络以及辅助信息特征抽取网络，所述基线网络和辅助信息抽取网络均由带有长期记忆的残差稠密块连接而成，所述带有长期记忆的残差稠密块是在残差稠密块的基础上引进块与块间的跳接，以将前一个网络块未经压缩的特征图进行卷积操作后直接接入后一网络块的输出部分，其特征在于：

1)所述视频编码器用于将原始帧进行编码，并进行反变换生成待滤波的重建帧；并根据块划分树，递归地提取待滤波的重建帧中每一层编码单元像素的均值，组成多层编码单元均值图；

2)所述辅助信息特征抽取网络用于对所述多层编码单元均值图进行特征抽取，得到多层编码单元均值图的特征图，并将所述多层编码单元均值图的特征图插入到所述基线网络的不同深度；

3)所述基线网络接收所述待滤波的重建帧和插入的特征图进行前向传播，输出滤波后的重建帧。

7.如权利要求6所述的系统，其特征在于，所述系统还包括一去块效应模块，用于将重建帧去块效应后再输入基线网络。

8.如权利要求6所述的系统，其特征在于，所述系统还包括一样点自适应补偿模块，以将前向传播输出的滤波后的重建帧进行样点自适应补偿。

9.如权利要求6所述的系统，其特征在于，所述辅助信息抽取网络的深度浅于所述基线网络。