CN109982092B

CN109982092B - 基于多分支循环卷积神经网络的hevc帧间快速方法

Info

Publication number: CN109982092B
Application number: CN201910349667.5A
Authority: CN
Inventors: 曾焕强; 陈婧; 左家宝; 粘春湄; 侯进辉; 朱建清; 马凯光
Original assignee: Huaqiao University
Current assignee: Huaqiao University
Priority date: 2019-04-28
Filing date: 2019-04-28
Publication date: 2022-11-01
Anticipated expiration: 2039-04-28
Also published as: CN109982092A

Abstract

本发明涉及一种基于多分支循环卷积神经网络的HEVC帧间快速方法，属于视频编码领域，方法包括：首先使用多分支卷积神经网络，对每个CTU进行预处理，并分别作为不同分支的卷积神经网络的输入，经过卷积计算之后，将得到的特征进行全连接，分为三个分支输出特征向量，再利用循环神经网络将特征向量和上一时刻的状态向量进行处理，并加入不同QP值的考量，最终输出三个分支的分类结果，三个分支分别对应每个CTU中深度等级0、1或2，判断三个深度等级的CU是否继续划分或者停止划分。本发明一种基于多分支循环卷积神经网络的HEVC帧间快速方法能够减少编码器计算开销，在保持编码性能基本不变的情况下，减少编码时间。

Description

基于多分支循环卷积神经网络的HEVC帧间快速方法

技术领域

本发明涉及视频编解码领域，尤其涉及一种基于多分支循环卷积神经网络的HEVC帧间快速方法。

背景技术

移动视频应用的流行，推动着现代视频编码技术向实时、高分辨率和高压缩率的方向发展。2013年，由动态图像专家组(Moving Picture Experts Group,MPEG)和隶属于国际电信联盟远程通信标准化组织(International Telecommunication Union-Telecommunication Standardization Sector,ITU-T)成立的联合专家组推出了新一代高效视频编码标准(High Efficiency Video Coding,HEVC)，在解决对庞大的视频数据进行有效地压缩使其能在有限的带宽内进行存储和传输，实现了编码质量相同的情况下，编码效率提升了50％。HEVC作为最新的视频编码标准，实现编码压缩率的提升，但同时也带来了极高的计算复杂度，严重影响了HEVC的实用性。

发明内容

本发明的目的在于克服现有HEVC编码复杂度和时间代价高的问题，提供一种基于多分支循环卷积神经网络的HEVC帧间快速方法，在保持编码性能基本不变的情况下，降低编码复杂度和时间开销。

为了实现上述目的，本发明的技术方案是：

一种基于多分支循环卷积神经网络的HEVC帧间快速方法，包括：

数据收集，选取多种纹理不同的视频，选取前25帧在不同QP下用原始HEVC编码器进行编码，将每个编码树单元CTU中三种不同深度等级的编码单元CU是继续划分或者终止划分的结果作为标签，所有标签记录在一个CTU中，作为训练集；

数据训练，对于训练集每一帧中的CTU，进行快速预编码获得残差CTU的亮度信息，将残差CTU进行去均值以及降采样的预处理，输出三个降采样程度不一的CTU作为每个分支的卷积神经网络的输入，随后进行四次卷积计算，每次卷积的卷积核不重叠；接下来将卷积结果输入到一维的全连接层中，再分为三个分支输出特征向量，随后把输出的特征向量输入到循环神经网络中，在循环神经网络中，除了接受当前时刻的输入向量还输入上一时刻卷积神经网络产生的状态向量，由此更新当前时刻卷积神经网络的状态向量和输出向量，然后将输出向量和对应QP值进行两次全连接，最后再次分成三个分支输出，经过数据训练后得到一个用于HEVC帧间编码的网络；

数据测试，选取20种不同分辨率不同视频内容的视频序列作为测试集，每一帧图像在编码之前，输入到训练好的用于HEVC帧间编码的网络中，判断每个CTU中不同深度等级CU的分类结果，并记录下来，随后在编码时，对记录的CU进行提前终止划分或者继续划分的判断。

优选的，所述再次分成三个分支输出，具体包括：

先输出第一分支对应的标签，若标签显示不继续划分，则不进行另外两个分支的输出，否则输出第二个分支对应的标签；

如果第二个分支有标签输出，判断标签是否显示不继续划分，如果是，不进行第三个分支的输出，否则输出第三个分支对应的标签。

本发明的有益效果如下：

1、本发明采用多分支卷积神经网络和循环神经网络结构，对应三种深度等级，可以有效区分不同深度等级CU的划分结果；

2、本发明可以直接测试每一帧所有CTU中不同深度等级的划分结果，而不需要对每个CU进行测试，这可以有效降低网络预测过程的计算时间。

以下结合附图及实施例对本发明作进一步详细说明，但本发明的一种基于多分支循环卷积神经网络的HEVC帧间快速方法不局限于实施例。

附图说明

图1是本发明基于多分支循环卷积神经网络的HEVC帧间快速方法的流程图。

具体实施方式

下面结合附图，对本发明的技术方案进行具体说明。

参见图1所示，本发明为了解决现有HEVC标准计算复杂度高、时间代价高的问题，提供一种基于多分支循环卷积神经网络的HEVC帧间快速方法，具体步骤如下：

步骤1，收集数据时，选取多种纹理不同的视频，选取前25帧在不同QP下用原始HEVC编码器进行编码，将每个编码树单元CTU中三种不同深度等级的编码单元CU是继续划分或者终止划分的结果作为标签，所有标签记录在一个CTU中，作为训练集；

步骤2，训练数据时，对于训练集每一帧中的CTU，进行快速预编码获得残差CTU的亮度信息，将残差CTU进行去均值以及降采样的预处理，输出三个降采样程度不一的CTU作为每个分支的卷积神经网络的输入，随后进行四次卷积计算，每次卷积的卷积核不重叠，接下来将卷积结果输入到一维的全连接层中，再分为三个分支输出特征向量，随后把输出的特征向量输入到循环神经网络中，在循环神经网络中，除了接受当前时刻的输入向量(即CNN处理后的特征向量)还输入上一时刻卷积神经网络产生的状态向量，由此更新当前时刻卷积神经网络的状态向量和输出向量，然后将输出向量和对应QP值进行两次全连接，最后再次分成三个分支输出，且先输出第一分支对应的标签，若标签显示不继续划分，则不进行另外两个分支的输出，否则继续进行第二个分支的输出，同理判断第二个分支和第三个分支的输出，经过数据训练后得到一个适用于HEVC帧间编码的网络；

步骤3，测试数据时，选取20种不同分辨率不同视频内容的视频序列作为测试集，对每一帧图像在编码之前，输入到训练好的用于HEVC帧间编码的网络中，判断每个CTU中不同深度等级CU的分类结果，并记录下来，随后在编码时，对记录的CU进行提前终止划分或者继续划分的判断。

以上仅为本发明实例中一个较佳的实施方案。但是，本发明并不限于上述实施方案，凡按本发明所做的任何均等变化和修饰，所产生的功能作用未超出本方案的范围时，均属于本发明的保护范围。

Claims

1.一种基于多分支循环卷积神经网络的HEVC帧间快速方法，其特征在于，包括：

2.根据权利要求1所述的基于多分支循环卷积神经网络的HEVC帧间快速方法，其特征在于，所述再次分成三个分支输出，具体包括：