CN108200442A

CN108200442A - 一种基于神经网络的hevc帧内编码单元划分方法

Info

Publication number: CN108200442A
Application number: CN201810063101.1A
Authority: CN
Inventors: 徐枫; 陈建武; 肖谋
Original assignee: Beijing Yi Intelligent Technology Co Ltd
Current assignee: Beijing Jingxin Technology Co ltd
Priority date: 2018-01-23
Filing date: 2018-01-23
Publication date: 2018-06-22
Anticipated expiration: 2038-01-23
Also published as: CN108200442B

Abstract

本发明公开了一种基于神经网络的HEVC帧内编码单元划分方法，其特征在于，包括以下步骤：将编码单元输入预处理模块进行去噪处理；将去噪处理后的编码单元进行下采样处理；将下采样处理后的编码单元输入神经网络模型进行结构划分；将结构划分处理后的编码单元进行编码处理。本方案通过采用神经网络模型对分类问题进行高效解决，减少传统四叉树划分编码的复杂性，同时确保编码的失真小，所述神经网络设计分别设计三个通道，并分别对不同大小的编码单元在不同通道中进行分割决策，提高了编码效率。

Description

一种基于神经网络的HEVC帧内编码单元划分方法

技术领域

本发明涉及视频编码领域，尤其涉及一种基于神经网络的HEVC帧内编码单元划分方法。

背景技术

视频编码也指视频压缩，通常采用预测、变换、量化和熵编码等方式，尽可能地减少视频数据中的冗余，尽可能使用最少的数据来表征视频，在现有网络的带宽限制下，尽可能地使视频的失真度最小，得到更好的视频观看效果。

视频编码中编码单元(Coding Unit，CU)的四叉树划分选择通常是由编码器计算每种分割方式的RD-costs，选取RD-costs最小的划分方式。这种方法确保了编码的失真最小，但其遍历每种决策的方式大大增加了编码的复杂性。

发明内容

本发明的目的在于：提供一种基于神经网络的HEVC帧内编码单元划分方法，引入神经网络进行分类，在确保编码性能的同时减少编码的复杂性。

本发明采用的技术方案如下：

一种基于神经网络的HEVC帧内编码单元划分方法，包括以下步骤：

S1：将64 x 64编码单元输入预处理模块进行预处理；

S2：将预处理后的编码单元输入到神经网络模型进行结构划分；

S3：将结构划分处理后的编码单元进行编码处理。

进一步的，所述S1具体步骤如下：

S101：将64 x 64编码单元通过四叉树划分方法依次划分为4个32 x 32和16个16x 16编码单元；

S102：将1个64 x 64编码单元通过去噪和下采样处理后得到1个16 x 16的编码单元，然后输入到神经网络结构；

S103：将4个32 x 32编码单元通过去噪和下采样处理后得到4个16 x 16的编码单元，然后输入到神经网络结构；

S104：将16个16 x 16编码单元通过去噪和下采样处理后得到16个16 x 16的编码单元，然后输入到神经网络结构。

进一步的，所述去噪处理采用非局部平均法对编码单元进行去噪处理。

进一步的，所述S2网络模型处理步骤如下：

S201：设计三个通道的神经网络输入层，分别用于接收预处理后的编码单元；

S202：每个通道分别设置卷积核对编码单元进行卷积得到相应特征图；

S203：将特征图经过全连接层处理后通过输出层输出划分预测结果。

进一步的，所述神经网络具有提前截止功能,依次对神经网络的通道进行预测结果判断，并控制下一个通道是否继续进行编码单元划分决策。

综上所述，由于采用了上述技术方案，本发明的有益效果是：

1、本发明中，通过采用神经网络模型对分类问题进行高效解决，减少传统四叉树划分编码的复杂性，同时确保编码的失真小。

2、本方案通过将神经网络设计三个通道，并分别对不同编码单元进行特征图的分割，提高了编码速度与效率。

3、通过对神经网络设置提前截止功能，在保证神经网络准确度的同时，防止空间资源的消耗和浪费，加快编码速度与效率。

附图说明

图1为本发明步骤流程图；

图2为本发明预处理步骤流程图；

图3为本发明神经网络结构图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

实施例1

如图1所示，一种基于神经网络的HEVC帧内编码单元划分方法，包括以下步骤：

S1：将64 x 64编码单元输入预处理模块进行预处理；

S3：将结构划分处理后的编码单元进行编码处理。

实施例2

如图2所示，在实施例1的基础上，所述S1具体步骤如下：

其中，1个16 x 16编码单元、4个16 x 16的编码单元、16个16 x 16的编码单元、分别输入神经网络的B1、B2、B3通道。

实施例3

在实施例1的基础上，所述去噪处理采用非局部平均法对编码单元进行去噪处理。

通过去噪处理使得其能更好地训练神经网络，所述去噪处理采用非局部平均法对树形编码单元进行去噪处理，它利用了整幅图像来进行去噪，以图像块为单位图像中寻找相似区域，再对这些区域求平均，能够较好地去掉图像中存在的高斯噪声。

NL-Means的去噪过程可以用下面公式来表示：

假设给定了一个带有噪声的图像v＝{v(i)|i∈I},对于像素点i，需要评估计算的值为

w(x,y)是一个权重，表示在原始图像中，像素x和y的相似度。Ω_x是像素x的领域，对于图像中的每一个像素x，去噪之后的结果等于它邻域中像素y的加权和，加权的权重等于x和y的相似度。

衡量像素相似度的方法采用根据两个像素的亮度值的差的平方来估计，但因为有噪声的存在，单独的一个像素并不可靠。对此解决方法是，考虑它们的邻域，只有邻域相似度高才能说这两个像素的相似度高。衡量两个图像块的相似度最常用的方法是计算他们之间的欧氏距离：

其中：n(x)是一个归一化的因子，是所有权重的和，对每个权重除以该因子后，使得权重满足和为1的条件。h>0,是滤波系数，控制指数函数的衰减从而改变欧氏距离的权重。V(x)和v(y)代表了像素x和y的领域，这个邻域常称为块(patch)邻域。是两个相邻域的高斯加权欧式距离。a>0,为高斯核的标准差。

所述下采样处理是对编码单元尺寸为MxN的图像进行S倍下采样，即得到(M/S)x(N/S)尺寸的图像，把原始图像SxS窗口内的像素求平均值，变成一个像素，其下采方式为：

实施例4

如图3所示，在实施例1的基础上，所述S2网络模型处理步骤如下：

设计一个三通道的神经网络，分别输入经过预处理后的64x64、32x32、16x16大小的编码单元的值。

第一通道B1输入64x64大小的编码预处理后的数据，经过卷积核大小为4x4，步长设为4的卷积层后得到16张4x4大小的特征图。然后依次经过卷积核大小为2x2，步长为2的卷积层，得到24张2x2大小的特征图和卷积核大小为1x1，步长为1的卷积层，得到32张1x1大小的特征图。最后经过两次全连接层后得到两个输出。

第二通道B2和第三通道B3输入分别输入32x32和16x16的编码单元经过预处理后的数据，所述通道B2、通道B3和通道B1的相同，但是第二通道B2要依次输入4个16x16的编码单元数据，第三通道B3要依次输入16个16x16的编码单元数据，然后经过与第一通道B1相同的处理。

特别的，所述神经网络具有提前截止功能,依次对神经网络的通道进行预测结果判断，并控制下一个通道是否继续进行编码单元划分决策。即当第一通道B1预测结果为0时，即当前深度为0的编码单元不再往下划分，则第二通道B2和第三通道B3提前停止处理。(其中当前划分的编码单元深度即为0，下一个四叉树划分单元深度为1,并依次类推)。

当第二个通道B2的某个预测结果为0，则第三通道B3对应的上个深度的4个编码单元将不进入通道进行处理。这样，当一个64x64的编码单元的数据经过此神经网络后将得到每个深度的编码单元是否往下划分的结果，即得到当前64x64的编码单元的划分结构，大大减小了传统RD-cost划分方式的计算难度和计算时间。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于神经网络的HEVC帧内编码单元划分方法，其特征在于，包括以下步骤：

S1：将64x64编码单元输入预处理模块进行预处理；

S3：将结构划分处理后的编码单元进行编码处理。

2.根据权利要求1所述一种基于神经网络的HEVC帧内编码单元划分方法，其特征在于：所述S1具体步骤如下：

S101：将64x64编码单元通过四叉树划分方法依次划分为4个32x32和16个16x16编码单元；

S102：将1个64x64编码单元通过去噪和下采样处理后得到1个16x16的编码单元，然后输入到神经网络结构；

S103：将4个32x32编码单元通过去噪和下采样处理后得到4个16x16的编码单元，然后输入到神经网络结构；

S104：将16个16x16编码单元通过去噪和下采样处理后得到16个16x16的编码单元，然后输入到神经网络结构。

3.根据权利要求2所述一种基于神经网络的HEVC帧内编码单元划分方法，其特征在于：所述去噪处理采用非局部平均法对编码单元进行去噪处理。

4.根据权利要求1所述一种基于神经网络的HEVC帧内编码单元划分方法，其特征在于：所述S2网络模型处理步骤如下：

5.根据权利要求1或4所述一种基于神经网络的HEVC帧内编码单元划分方法，其特征在于：所述神经网络具有提前截止功能,依次对神经网络的通道进行预测结果判断，并控制下一个通道是否继续进行编码单元划分决策。