CN104954806A

CN104954806A - 帧内视频优化编码方法

Info

Publication number: CN104954806A
Application number: CN201510353778.5A
Authority: CN
Inventors: 解蓉; 魏如君; 宋利; 张文军
Original assignee: Shanghai Jiaotong University
Current assignee: Shanghai Jiaotong University
Priority date: 2015-06-24
Filing date: 2015-06-24
Publication date: 2015-09-30

Abstract

一种视频编码技术领域的帧内视频优化编码方法，通过将编码单元CU的尺寸扩大两倍、将预测单元PU的尺寸扩大两倍、将变换单元TU的尺寸扩大两倍，并加入64×64整数变换矩阵，64×64蝶形正变换函数和64×64蝶形反变换函数；再进行帧内编码帧(I帧)编码，从而减少视频图像中编码的块单元个数和对应的视频编码时间，提高了编码速度，并且在一定程度上提升视频压缩效率，保证了优异的视频编码性能。

Description

帧内视频优化编码方法

技术领域

本发明涉及的是一种视频编码技术领域的技术，具体是一种HEVC上实现的帧内视频优化编码方法。

背景技术

视频编码技术，是将视频根据一定的视频编码标准压缩成视频码流。目前，针对不同的视频应用场景，存在多种视频编码标准，包括H.261、H.263和H.264等H.26X系列，主要用于电话和电视会议应用，以及MPEG‐1、MPEG‐2和MPEG‐4等MPEG‐X系列，主要针对多媒体广播电视领域。随着多媒体信息和网络技术的快速发展，人们对高清晰度、大容量的视频需求日益增加。为了使高清、超高清视频的编码效率更高，获得更好的视觉体验，新一代视频编码标准HEVC(high efficiency video coding)诞生了。HEVC作为新的视频编码标准，引入了很多新的编码技术，具有更优异的编码性能和更高的视频质量，相比H.264标准提升了大约50％的压缩效率，但编码计算复杂度大大增加。帧内视频编码模块是视频编码过程中的重要部分，对于视频编码性能的提升有着重要的作用，因此，实现帧内视频编码模块的优化，是近年来视频编码研究中的一个热点。

在帧内编码中，平滑区域内容变化缓慢，倾向于使用大尺寸的编码块单元；粗糙区域图像细节较多，会选择小尺寸的编码块单元。对于高清和超高清视频，一帧图像中常常有很多大面积的平滑区域，因此在高分辨率视频的编码中，采用更大尺寸的块单元，能够合理地减少一帧图像中编码的块单元个数，从而有效地减少编码计算复杂度，获得更好的压缩性能。然而，在帧内视频编码中，编码过程的简化不可避免会造成视频质量的下降，在一定程度上影响视觉效果，因此，在实现高效帧内视频编码，降低编码复杂度的同时，如何保证视频质量和编码性能是当前视频编码研究中的一个重要课题。

经过对现有技术的检索发现，中国专利文献号CN103957415A公开(公告)日2014.07.30，公开了一种在高效视频编码(HEVC)中进行编码单元(CU)快速分块的方法，包括：在编码树单元(CTU)中确定所有平滑分块；根据对所有平滑分块的所述确定的结果，跳过对一些CU的检查；以及确定最优CU分块方案；根据所述最优CU分块方案来对所述CTU进行编码。但该技术无法降低编码所用比特数，提高压缩效率。

发明内容

本发明针对现有技术存在的上述不足，提出一种帧内视频优化编码方法，采用更大尺寸的编码结构，能够减少编码过程中使用的比特数，获得更好的编码效率，特别对超高清视频的编码效率提升尤其明显。

本发明是通过以下技术方案实现的：

本发明涉及一种帧内视频优化编码方法，采用扩大后的编码树单元(Coding Tree Units，CTU)对编码过程进行优化，同时对应扩大CTU中的编码单元CU(Coding Unit)、CU中的预测单元PU(Prediction Unit)和CU中的变换单元TU(Transform Unit)的尺寸，再进行帧内编码帧(I帧)编码，从而减少视频图像中编码的块单元个数和对应的视频编码时间，提高了编码速度，并且在一定程度上提升视频压缩效率，保证了优异的视频编码性能。

所述的编码树单元CTU尺寸为128×128像素，对应的编码单元CU为128×128、64×64、32×32和16×16；在高清视频帧内编码中，采用更大的编码单元可以减少所用的比特数，提高编码效率，同时有效减少编码的计算复杂度。

所述的预测单元PU是进行帧内或帧间预测的基本单元，规定了编码单元的所有预测模式，其中包括：帧内预测的方向信息、帧间预测的分割方式信息以及运动矢量预测信息等等。

所述的预测单元PU的尺寸最大为128×128像素，在帧内编码中，预测单元尺寸与编码单元尺寸相同；对于最小尺寸的编码单元CU(16×16)，支持进一步划分得到四个8×8块的预测单元PU。

所述的编码单元CU采用四叉树的形式递归划分为变换单元TU，可划分的层级由CU的尺寸与规定的最大和最小TU尺寸决定。

对于帧内视频编码，在一个编码单元CU中，由于相邻预测单元有关联，一个预测单元PU可以包含多个变换单元TU，但一个变换单元TU只能对应一个预测单元PU。

所述的变换单元TU是变换、量化与熵编码的基本单元，其尺寸变为64×64、32×32、16×16和8×8，对于64×64的TU块，根据整数DCT运算公式加入64×64整数DCT变换矩阵，依照整数DCT蝶形算法加入64×64的DCT蝶形正变换和反变换函数。

对于高分辨视频，相同大小的区域包含更多像素，像素间相关性强，因此采用更大尺寸的变换单元能够将信号能量更好地集中，使得变换后的残差信号得到更多的压缩，提高视频压缩性能。

所述的帧内编码帧I帧的编码是指：将视频帧分割成若干个互不重叠的128×128的编码树单元CTU，表示相互独立的区域；然后在一个CTU中，根据四叉树的分割方式，从尺寸128×128到16×16递归遍历所有尺寸大小的编码单元；再对尺寸从128×128到8×8的所有预测单元分别寻找最优帧内预测模式并计算其残差值，并从尺寸64×64到8×8的变换单元，根据其可划分的深度对每个变换单元分别处理，将预测得到的残差数据进行变换编码后能量集中至低频区域，将变换系数进行量化可以减小编码的动态范围；最后可用率失真优化RDO准则确定得到编码结构的最优划分方式。

技术效果

与现有技术相比，本发明通过扩大块单元的尺寸，能够减少编码块的数目，极大地简化帧内编码过程，提升编码效率，实现高效帧内视频编码，特别对超高清视频的编码有更优异的编码性能。本发明进一步的技术效果包括：

1)采用128×128的编码树单元CTU，能够减少一帧图像中编码的块单元个数，大量减少视频编码时间；

2)扩大编码单元CU的尺寸，用更大的编码单元编码可以减少所用的比特数，提高编码效率；

3)扩大预测单元PU的尺寸，采用更大的预测单元能够简化帧内预测编码过程，加快视频编码速度；

4)扩大变换单元TU的尺寸，大块的变换单元能够将信号能量更好地集中，提升视频压缩性能。

附图说明

图1为本发明流程示意图。

具体实施方式

下面对本发明的实施例作详细说明，本实施例在以本发明技术方案为前提下进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。

实施例1

如图1所示，本实施例包括以下步骤：

步骤一，扩大编码单元的尺寸

高分辨率视频中常常有大面积的平滑区域，采用更大的块进行编码能够极大地提升压缩效率，减少编码计算复杂度。在大尺寸的编码结构中，扩大编码单元的尺寸具体方法如下：

1.1)将基于四叉树分割的编码树单元CTU尺寸扩大至128×128像素。

1.2)将编码单元CU的尺寸扩大两倍，新的编码单元CU尺寸为128×128、64×64、32×32和16×16。

步骤二，扩大预测单元的尺寸

预测单元是进行帧内或帧间预测的基本单元，规定了编码单元的所有预测模式，包括帧内预测的方向信息、帧间预测的分割方式信息以及运动矢量预测信息等等；对于帧内视频编码，预测单元PU的尺寸扩大两倍，最大为128×128像素。新的预测单元PU尺寸与新的编码单元CU尺寸相同，对于最小的编码单元CU(16×16)，支持进一步划分得到四个8×8块的预测单元PU。

步骤三，扩大变换单元的尺寸

变换单元是进行变换和量化的基本单元，扩大变换单元的尺寸，具体方法如下：

3.1)变换单元TU的尺寸扩大两倍，新的变换单元TU的尺寸变为64×64、32×32、16×16和8×8。

3.2)对于64×64的TU块，根据整数DCT运算公式加入64×64整数DCT变换矩阵，依照整数DCT蝶形算法加入64×64的DCT蝶形正变换和反变换函数。

步骤四，帧内编码帧(I帧)编码，具体方法如下：

4.1)视频帧首先被分割成若干个互不重叠的128×128的编码树单元CTU，用于表示相互独立的区域；

4.2)在一个CTU中，根据四叉树的分割方式，从尺寸128×128到16×16递归遍历所有尺寸大小的编码单元；

4.3)通过帧内预测编码模块，对尺寸从128×128到8×8的所有预测单元分别寻找最优帧内预测模式并计算其残差值；

4.4)通过变换量化模块，从尺寸64×64到8×8的变换单元，根据其可划分的深度对每个变换单元分别处理，将预测得到的残差数据进行变换编码后能量集中至低频区域，将变换系数进行量化可以减小编码的动态范围；

4.5)用率失真优化RDO准则确定得到编码结构的最优划分方式。

Claims

1.一种帧内视频优化编码方法，其特征在于，采用扩大后的编码树单元结构，对编码过程进行优化，即首先扩大三种块单元的尺寸，然后进行帧内编码帧编码，从而大量减少编码计算复杂度，提升编码效率；

所述的扩大三种块单元的尺寸，具体包括：

1)将编码单元CU的尺寸扩大两倍；

2)将预测单元PU的尺寸扩大两倍；

3)将变换单元的尺寸扩大两倍，并加入64×64整数变换矩阵，64×64蝶形正变换函数和64×64蝶形反变换函数。

2.根据权利要求1所述的帧内视频优化编码方法，其特征是，所述的扩大后的编码树单元的尺寸为128×128像素。

3.根据权利要求1所述的帧内视频优化编码方法，其特征是，所述的扩大三种块单元的尺寸，具体为：对编码单元、预测单元、变换单元的尺寸扩大。

4.根据权利要求3所述的帧内视频优化编码方法，其特征是，所述的编码单元尺寸为128×128、64×64、32×32和16×16。

5.根据权利要求3所述的帧内视频优化编码方法，其特征是，所述的预测单元的尺寸最大为128×128像素，且预测单元尺寸与编码单元尺寸相同。

6.根据权利要求5所述的帧内视频优化编码方法，其特征是，对于尺寸为16×16的编码单元，支持进一步划分得到四个8×8块的预测单元。

7.根据权利要求3所述的帧内视频优化编码方法，其特征是，所述的变换单元的尺寸为64×64、32×32、16×16和8×8。

8.根据权利要求7所述的帧内视频优化编码方法，其特征是，对于尺寸为64×64的变换单元，根据整数DCT运算公式加入64×64整数DCT变换矩阵，依照整数DCT蝶形算法加入64×64的DCT蝶形正变换和反变换函数。

9.根据权利要求1所述的帧内视频优化编码方法，其特征是，所述的帧内编码帧编码是指：将视频帧分割成若干个互不重叠的128×128的编码树单元CTU，表示相互独立的区域；然后在一个CTU中，根据四叉树的分割方式，从尺寸128×128到16×16递归遍历所有尺寸大小的编码单元；再对尺寸从128×128到8×8的所有预测单元分别寻找最优帧内预测模式并计算其残差值，并从尺寸64×64到8×8的变换单元，根据其可划分的深度对每个变换单元分别处理，将预测得到的残差数据进行变换编码后能量集中至低频区域，将变换系数进行量化可以减小编码的动态范围；最后可用率失真优化RDO准则确定得到编码结构的最优划分方式。