CN108134932A

CN108134932A - 基于卷积神经网络的视频编解码环路内滤波实现方法及系统

Info

Publication number: CN108134932A
Application number: CN201810025957.XA
Authority: CN
Inventors: 林巍峣; 何晓艺
Original assignee: Shanghai Jiaotong University
Current assignee: Shanghai Jiaotong University
Priority date: 2018-01-11
Filing date: 2018-01-11
Publication date: 2018-06-08
Anticipated expiration: 2038-01-11
Also published as: CN108134932B

Abstract

一种基于卷积神经网络的视频编解码环路内滤波器及其实现方法，以视频编解码算法编码并解码得到的视频作为训练数据，使用监督学习的方法训练一卷积神经网络并得到预训练模型，然后在视频编解码环路内对每一个重建帧划分为若干个子图，采用所述预训练模型以每一个子图作为输入，输出一张与输入图像大小相同的图像，并根据输出图像的质量提升与否，有选择地使用输出图像更新原图像。本发明能够提升编解码过程中的重建帧的图像质量，并对后续编码过程提供增益，最终提升编码算法的效率。

Description

基于卷积神经网络的视频编解码环路内滤波实现方法及系统

技术领域

本发明涉及的是一种数字图像处理领域的技术，具体是一种基于卷积神经网络的视频编解码环路内滤波实现方法及系统。

背景技术

现有的视频编解码算法有编码器和解码器两个主要组成部分：编码器负责把输入视频根据视频编码标准编码成比特流，而解码器负责对比特流进行解码得到最终的解码视频。在编解码过程中，编解码环路外滤波器和环路内滤波器被使用来提升重建视频帧的图像质量。

现有的环路内滤波器使用了Deblock Filter和Sample Adaptive offset Filter作为环路滤波器，即在编码的过程中，对重建图像进行滤波，改善图像质量。环路内滤波器的特点是在帧间参考模式下，当前重建帧会作为后续编码帧的参考帧，从而环路内滤波器会影响编码的后续过程。现有的环路外滤波器使用卷积神经网络作为环路外滤波器，对于帧内参考模式下的重建帧进行处理，一定程度上提升了编码效率。但是由于帧内参考模式的局限性，压缩比非常有限，并且环路外滤波器对于重建帧的质量提升对后续的编码过程不会产生增益，因此从这一角度来说，该算法对于编码效率的改进非常有限。

发明内容

本发明针对现有技术存在的上述不足，提出一种基于卷积神经网络的视频编解码环路内滤波实现方法及系统，采用卷积神经网络实现了视频编解码环路内滤波器，能够提升编解码过程中的重建帧的图像质量，并对后续编码过程提供增益，最终提升编码算法的效率。

本发明是通过以下技术方案实现的：

本发明涉及一种基于卷积神经网络的视频编解码环路内滤波实现方法，以视频编解码算法编码并解码得到的视频作为训练数据，使用监督学习的方法训练一卷积神经网络并得到预训练模型，然后在视频编解码环路内对每一个重建帧划分为若干个子图，采用所述预训练模型以每一个子图作为输入，输出一张与输入图像大小相同的图像，并根据输出图像的质量提升与否，有选择地使用输出图像更新原图像。

所述的训练数据是指：以视频编解码算法编码并解码得到的视频的视频帧所对应的原始视频帧的划分子图，即以64x64为大小划分得到的若干个不相交的子图。

所述的训练，即基于训练数据和预设的网络结构，对卷积神经网络的参数使用监督学习的方法进行优化的过程，该卷积神经网络以视频帧在编码过程中的划分和该视频帧的图像信息作为输入，其中视频帧的划分情况作为输入的可选模块，引导图像的质量恢复过程；该预设的网络结构的主体由一个主干和多个可选的分支组成，每一个分支由多个基本单位块(block)组成。额外的分支有助于捕捉图像不同层次的信息。最终输出一个与输入视频帧一样大小的图像。

所述的输出图像的质量提升是指：图像的通用客观质量的评价指标有提升，该质量评价采用但不限于峰值信噪比(PSNR)等。

优选地，在编码过程中使用一比特记录该图像是否更新，并写入编码最终产生的码流中；在解码过程中以所述比特位作为是否更新的依据。

本发明涉及一种实现上述方法的系统，包括：训练数据生成模块、卷积神经网络训练模块和滤波模块，其中：训练数据生成模块与卷积神经网络相连并传输训练数据供其训练，卷积神经网络训练模块与滤波模块相连并传输其产生的预训练模型，滤波模块可用于现有的视频编解码算法中，实现环路内滤波的作用。

技术效果

与现有技术相比，本发明利用卷积神经网络来实现滤波器，与传统的视频编解码算法中的滤波器相比，更具有鲁棒性。传统的滤波器算法主要由人的经验来设计，并必须经过大量的试验和优化，而基于卷积神经网络的滤波器针对视频编解码的特点，结合了重建帧的划分情况设计了一种新的网络结构，具有更广泛的适用性，能够有效地针对不同的图像质量下降情况，对图像质量进行恢复。

本发明与其他基于卷积神经网络的滤波器相比具有显著的优点。首先该滤波器是编解码环路内的滤波器，能够为后续编解码过程提供增益。其次该滤波器主要针对的是帧间参考模式下的视频编解码，并对应帧间参考模式，设计了可选的图像划分情况的输入以及额外的分支，有助于提取图像的多个层次的特征，更好地完成图像的质量恢复过程。该模式与帧内参考模式相比，更广泛地应用于实际的视频编解码过程，因为它具有更好的压缩比和编码效率。

附图说明

图1为本发明的流程图；

图2为实施例视频帧划分情况示意图；

图3为实施例卷积神经网络结构图。

具体实施方式

如图1所示，本实施例涉及一种基于卷积神经网络的视频编解码环路内滤波器在

h.265/HEVC视频编码标准的参考软件HM-16.0下的实现方法，其具体步骤如下：

步骤1)使用视频编解码软件HM对一系列视频进行编解码，最终得到解码后的重建视频。并经过预处理得到训练数据，对预设的卷积神经网络进行训练，优化它的模型参数。本实施例中采用只以图像作为输入且没有额外分支的基本网络。

所述的预处理是指将每一张解码得到的视频帧和原始视频帧以及该视频帧的划分图，只采用图像的Y通道，分别切分成64x64的不相交的子图，划分图如图2所示。

如图3所示，所述的卷积神经网络具体为：以图像为输入，经过主分支的多个卷积模块、batch normalization(BN)模块和激活函数(ReLu)等处理、计算，输出一张与输入图大小相同的图像。

所述的卷积神经网络的训练过程，采用监督学习的方式进行，优选使用tensorflow开源软件搭建该网络并使用训练数据对其进行有监督的训练，最终得到一个预训练模型。

步骤2)使用第一步中得到的与训练模型，对HM算法中的编解码得到的每一帧进行处理，输出图像。并有选择地使用输出图像对原图像进行更新。

所述的处理是指将该视频帧的Y通道图像以64x64为单位分成若干个不相交的子图，使用预训练的模型分别对每一子图结合它的划分图进行处理，得到输出图像。

所述的有选择地更新原图像是指针对每一个子图，若图像的视频质量与输入图像相比有提升，则使用该输出图像更新输入图像，否则不更新。

所述的更新是指使用输出图像替代输入图像，并记录该图像被更新过，该记录在编码过程将以比特的形式写入编码得到的码流中。而在解码过程中从码流中读入该记录并决定是否更新输入图像。

该实施例中使用编码软件HM-16.0，在LDB编码配置，对编码中常用的22个标准测试序列进行了实验。实验结果如表1，结果表明，该实施例对于所有测试序列，平均能够节省4.12％码率，超过了目前性能最好的基于卷积神经网络的环路外滤波器的性能，能够有效地提升编码效率。

表1实验结果

上述具体实施可由本领域技术人员在不背离本发明原理和宗旨的前提下以不同的方式对其进行局部调整，本发明的保护范围以权利要求书为准且不由上述具体实施所限，在其范围内的各个实现方案均受本发明之约束。

Claims

1.一种基于卷积神经网络的视频编解码环路内滤波器的实现方法，其特征在于，以视频编解码算法编码并解码得到的视频作为训练数据，使用监督学习的方法训练一卷积神经网络并得到预训练模型，然后在视频编解码环路内对每一个重建帧划分为若干个子图，采用所述预训练模型以每一个子图作为输入，输出一张与输入图像大小相同的图像，并根据输出图像的质量提升与否，有选择地使用输出图像更新原图像。

2.根据权利要求1所述的方法，其特征是，所述的训练，即基于训练数据和预设的网络结构，对卷积神经网络的参数使用监督学习的方法进行优化的过程。

3.根据权利要求2所述的方法，其特征是，所述的卷积神经网络以视频帧在编码过程中的划分和该视频帧的图像信息作为输入，其中视频帧的划分情况作为输入的可选模块，引导图像的质量恢复过程。

4.根据权利要求1所述的方法，其特征是，所述的预设的网络结构的主体由一个主干和多个可选的分支组成，每一个分支由多个基本单位块组成，最终输出一个与输入视频帧一样大小的图像。

5.根据权利要求1所述的方法，其特征是，所述的训练数据是指：以视频编解码算法编码并解码得到的视频的视频帧所对应的原始视频帧的划分子图，即以64x64为大小划分得到的若干个不相交的子图。

6.根据权利要求1所述的方法，其特征是，在编码过程中，使用一比特记录该图像是否更新，并写入编码最终产生的码流中；在解码过程中以所述比特位作为是否更新的依据。

7.一种实现上述任一权利要求所述方法的系统，其特征在于，包括：训练数据生成模块、卷积神经网络训练模块和滤波模块，其中：训练数据生成模块与卷积神经网络相连并传输训练数据供其训练，卷积神经网络训练模块与滤波模块相连并传输其产生的预训练模型，滤波模块可用于现有的视频编解码算法中，实现环路内滤波的作用。