CN109996084B

CN109996084B - 一种基于多分支卷积神经网络的hevc帧内预测方法

Info

Publication number: CN109996084B
Application number: CN201910361446.XA
Authority: CN
Inventors: 曾焕强; 陈婧; 粘春湄; 侯进辉; 朱建清; 马凯光
Original assignee: Huaqiao University
Current assignee: Huaqiao University
Priority date: 2019-04-30
Filing date: 2019-04-30
Publication date: 2022-11-01
Anticipated expiration: 2039-04-30
Also published as: CN109996084A

Abstract

本发明涉及一种基于多分支卷积神经网络的HEVC帧内预测方法，属于视频编码领域，本方法使用多分支卷积神经网络，对每个CTU进行预处理，并分别作为不同分支的卷积神经网络的输入，经过卷积计算之后，将得到的特征进行全连接，考虑不同QP值的影响，并最终输出三个分支的分类结果，三个分支分别对应每个CTU中深度等级0，1，2，判断三个深度等级的CU是否继续划分或者停止划分。本发明一种基于多分支卷积神经网络的HEVC帧内预测方法能够有效地减少编码器计算开销，在保持编码性能基本不变的情况下，减少编码时间。

Description

一种基于多分支卷积神经网络的HEVC帧内预测方法

技术领域

本发明涉及视频编解码领域，特别是指一种基于多分支卷积神经网络的HEVC帧内预测方法。

背景技术

随着视频逐渐地超高清化，且短视频、网络直播以及网络点播等新兴的视频应用方式的出现，对视频的存储与传输是一个巨大的挑战。因此，2013年，联合专家组发布了新一代高效视频编码标准(High Efficiency Video Coding,HEVC),旨在对庞大的视频数据进行有效地压缩使其能在有限的带宽内进行存储和传输，其压缩率比上一代视频编码标准H.264/AVC提高一倍。在提高编码效率的同时，HEVC采用四叉树划分方式等更复杂的编码结构，急剧增加了编码的复杂度，严重影响了HEVC的实用性。

因此，针对HEVC的编码复杂度高的问题，提出复杂度优化方法，在保持编码性能基本不变的情况下尽可能地降低编码复杂度，具有一定的研究意义和实用价值。

发明内容

本发明的主要目的在于克服现有HEVC编码复杂度高的不足，提出一种基于多分支卷积神经网络的HEVC帧内预测方法，在保持编码性能基本不变的情况下，降低编码时间开销。

本发明采用如下技术方案：

一种基于多分支卷积神经网络的HEVC帧内预测方法，其特征在于，包括：

收集数据时，选取多种不同纹理的视频，取前25帧在不同QP值下用原始HEVC编码器进行编码，将每个编码树单元CTU中三种不同深度等级的编码单元CU是继续划分或者终止划分的结果作为标签，所有标签记录在一个编码树单元CTU中，作为训练集；

训练数据时，对于训练集中的每一个编码树单元CTU，进行预处理，输出三个降采样程度不一的编码树单元CTU，并输入至多分支卷积神经网络进行训练，随后进行四层卷积层计算，每次卷积的卷积核不重叠，将输出的三个分支的卷积结果输入到一维的全连接层中，进行两次全连接，并加入对应QP值到全连接中进行计算；最后，再次分成三个分支，根据输出的标签确定分支的输出；得到训练好的多分支卷积神经网络；

测试数据时，选取20种不同分辨率不同视频内容的视频序列作为测试集，将每一帧图像的编码树单元CTU，输入到训练好的多分支卷积神经网络，输出每个编码树单元CTU中不同深度等级编码单元CU的最佳尺寸。

全连接层之后再次分成三个分支，根据输出的标签确定分支的输出，具体包括如下：

第一分支对应64×64的编码单元CU，第二分支对应32×32的编码单元CU，第三分支对应16×16的编码单元CU；第一分支先输出对应的标签，若标签显示不停止划分，则不进行另外两个分支的输出，若显示继续划分，则进行第二分支的输出；若第二分支输出标签显示停止划分，则停止第三分支的输出，否则，进行第三分支的输出。

测试数据时，所述每一帧图像的编码树单元CTU经过一些列预处理和卷积计算之后，首先处理第一分支的全连接计算，若输出的编码单元CU是停止划分，当前最佳编码单元CU尺寸为64×64；

若显示继续划分，则进行第二分支的全连接计算，输出有4个标签，对应不同位置的32×32的编码单元CU，若某32×32的编码单元CU显示停止划分，则该位置最佳编码单元CU尺寸是32×32；

若显示继续划分，则进行第三分支的全连接计算，输出有16个标签，对应不同位置16×16的编码单元CU，若某16×16的编码单元CU显示停止划分，则该位置最佳编码单元CU尺寸是16×16。

由上述对本发明的描述可知，与现有技术相比，本发明具有如下有益效果：

1、本发明采用多分支卷积神经网络结构，对应三种深度等级，可以有效区分不同深度等级CU的划分结果。

2、本发明可以直接测试每一帧所有CTU中不同深度等级的划分结果，而不需要对每个CU进行测试，可以有效地降低编码单元深度预测过程的计算时间。

附图说明

图1为本发明方法的流程示意图。

以下结合附图和具体实施例对本发明作进一步详述。

具体实施方式

以下通过具体实施方式对本发明作进一步的描述。

参见图1所示，本发明为了解决现有HEVC计算复杂度高的问题，提供一种基于多分支卷积神经网络的HEVC帧内预测方法，本方法使用多分支卷积神经网络，对每个CTU进行预处理，并分别作为不同分支的卷积神经网络的输入，经过卷积计算之后，将得到的特征进行全连接，考虑不同QP值的影响，并最终输出三个分支的分类结果，三个分支分别对应每个CTU中深度等级0，1，2，判断三个深度等级的CU是否继续划分或者停止划分。

本发明具体包括如下：

收集数据时，选取多种不同纹理的视频，取前25帧在不同QP值下用原始HEVC编码器进行编码，将每个编码树单元CTU中三种不同深度等级的编码单元CU是继续划分或者终止划分的结果作为标签，所有标签记录在一个编码树单元CTU中，作为训练集。

训练数据时，对于每一帧中的编码树单元CTU，进行去均值以及降采样的预处理，输出三个降采样程度不一的编码树单元CTU作为每个分支的卷积神经网络的输入，随后进行四层卷积层计算，每次卷积的卷积核不重叠，最后将三个分支的卷积结果输入到一维的全连接层中，并且进行两次全连接。最后分成三个分支输出，对第一个分支先输出对应的标签，若标签显示不继续划分，则不进行另外两个分支的输出，否则继续进行第二个分支的输出，同理判断，第二个以及第三个分支的输出。另外，在输出时加入对应QP值到全连接中进行计算。得到训练好的多分支卷积神经网络

其中，多分支卷积神经网络采用交叉熵损失函数形式：

L＝[ylogy'+(1-y)log(1-y')]

其中，y是CU划分的真实结果，y’是模型训练的预测结果。若L越小说明预测结果越接近真是结果，模型的性能越高。

而激活函数采用Sigmoid函数：

其中，z是模型上一层的输出。

测试数据时，选取20种不同分辨率不同视频内容的视频序列作为测试集，对每一帧图像的编码树单元CTU在编码之前，输入到训练后的多分支卷积神经网络中进行测试。

编码树单元CTU经过一系列预处理和卷积计算之后，首先处理第一分支的全连接计算，若输出的编码单元CU是停止划分，意味当前最佳编码单元CU尺寸64×64。若显示继续划分，则进行第二分支的全连接计算，输出有4个标签，对应不同位置的32×32的编码单元CU，若某32×32的编码单元CU显示停止划分，则该位置最佳编码单元CU尺寸是32×32，若显示继续划分，则进行第三分支的全连接计算，输出有16个标签，对应不同位置16×16的编码单元CU，判断方式一样。

最终，通过测试结果，在编码树单元CTU编码时，提前判断最佳编码单元CU尺寸，跳过其它尺寸的计算，降低编码复杂度。

上述仅为本发明的具体实施方式，但本发明的设计构思并不局限于此，凡利用此构思对本发明进行非实质性的改动，均应属于侵犯本发明保护范围的行为。

Claims

1.一种基于多分支卷积神经网络的HEVC帧内预测方法，其特征在于，包括：

2.如权利要求1所述的一种基于多分支卷积神经网络的HEVC帧内预测方法，其特征在于：全连接层之后再次分成三个分支，根据输出的标签确定分支的输出，具体包括如下：

3.如权利要求2所述的一种基于多分支卷积神经网络的HEVC帧内预测方法，其特征在于：测试数据时，所述每一帧图像的编码树单元CTU经过一系列预处理和卷积计算之后，首先处理第一分支的全连接计算，若输出的编码单元CU是停止划分，当前最佳编码单元CU尺寸为64×64；