CN105430396B

CN105430396B - 采用分类的方式决策编码块大小的视频编码方法

Info

Publication number: CN105430396B
Application number: CN201510939504.4A
Authority: CN
Inventors: 虞露; 陈佳伟
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2015-12-15
Filing date: 2015-12-15
Publication date: 2019-04-19
Anticipated expiration: 2035-12-15
Also published as: CN105430396A

Abstract

本发明公开了一种采用分类的方式加速编码块大小决策的视频编码方法。该方法具有灵活性，能够满足不同的能量受限或者实时的应用；充分利用视频序列的特征，挖掘出编码块大小与特征之间的关系，并且采取级联的三分类器和二分类器，在保证编码性能的情况下，降低编码块大小决策的复杂度。

Description

采用分类的方式决策编码块大小的视频编码方法

技术领域

本发明涉及一种视频的编码方法，且更具体地，涉及一种采取分类的方式加速编码块大小决策的视频编码方法。

背景技术

在相同的视频质量下，HEVC比H.264/AVC的码率低一半以上。这种更高的编码性能得益于许多新的编码工具，其中一个重要的编码工具是编码块的划分灵活多变。编码块包括编码单元(CU)、预测单元(PU)和变换单元(TU)。同时，HEVC的编码复杂度也大幅度提升。

HEVC支持最大尺寸为64x64的编码单元，且一个编码单元根据四叉树结构可被划分成四个小尺寸的编码单元。在四叉树的结构下，64x64像素块中会有83522种编码单元的组合方式。预测单元和变换单元的划分都是以编码单元为基础。对于预测单元，HEVC最多能够支持24种不同的尺寸。在帧内预测模式下，HEVC支持对称的预测单元划分模式；在帧间预测模式下，HEVC支持对称和非对称的预测单元划分模式。变换单元的划分方式和编码单元相同，都是采取四叉树的结构。但是，变换单元的最大尺寸为32x32。在视频编码中，编码块的尺寸大小与编码深度有一一对应的关系。编码块的尺寸越小，编码深度越大。所以，当编码深度为0时，编码块的尺寸最大。

视频编码中的编码块大小的确定方式是比较每种编码块大小的组合方式下的率失真代价。其中，率失真代价最小的组合方式为最佳方式。率失真代价涉及到码率和失真的衡量。码率的衡量方式是统计熵编码后的比特数。失真有多种衡量方式，包括误差平方和(SSE)和误差绝对值之和(SAD)。通过率失真代价的比较来确定最佳的编码块大小，计算复杂度非常高。针对上述的现象，采用分类器的方法被提出来降低编码块大小决策的计算复杂度。该方法是：对单一尺寸的编码块进行决策时，首先提取编码块的特征，利用所提取的特征，将编码块归类到划分类、不确定类和不划分类。不确定类中的编码块的最佳尺寸大小通过率失真代价来进行决策。其中，编码块的归类可以通过单个三分类器或者两个二分类器来实现。

发明内容

视频编码性能的提升得益于更加灵活精细的编码模式。巨大的模式集合为编码器的参数选择带来了极大的挑战，如何在保证编码性能的同时，降低模式选择的复杂度，对于编码器的产业化具有重要意义。为了克服现有技术中存在的不足，本发明要解决的问题是提供一种采用分类的方式决策编码块大小的视频编码方法。

为解决上述技术问题，本发明提供一种视频编码块的编码方法，具体为：提取编码块的特征，利用所提取的特征，采用三分类器将所述编码块归类到划分类、不确定类或不划分类；如果所述编码块归类到划分类，所述编码块的模式确定为划分；如果所述编码块归类到不划分类，所述编码块的模式确定为不划分；如果所述编码块归类到不确定类，提取所述编码块的至少一种新特征，利用所提取的新特征和三分类器中已利用的至少一种特征，采用二分类器将所述编码块归类到划分类或不划分类。

为解决上述技术问题，本发明提供一种决策编码块大小的视频编码方法，包括以下步骤：

第一步：编码块从最大尺寸开始决策；

第二步：提取所述编码块的特征，利用所提取的特征，采用三分类器将所述编码块归类到划分类、不确定类或不划分类；如果所述编码块归类到划分类，所述编码块的模式确定为划分；如果所述编码块归类到不划分类，所述编码块的模式确定为不划分；如果所述编码块归类到不确定类，提取所述编码块的至少一种新特征，利用所提取的新特征和三分类器中已利用的至少一种特征，采用二分类器将所述编码块归类到划分类或不划分类；

第三步：如果所述编码块的模式是不划分或所述编码块的尺寸达到最小尺寸，停止决策所述编码块的尺寸大小；如果所述编码块的模式是划分，所述编码块被划分成若干个小尺寸的编码块，对每个小尺寸的编码块进行第二～三步的操作。

作为本发明所述的视频编码块的编码方法或决策编码块大小的视频编码方法的改进，三分类器和二分类器选自贝叶斯分类器和支持向量机。

作为本发明所述的视频编码块的编码方法或决策编码块大小的视频编码方法的另一种改进，不确定类的编码块的新特征包括该编码块按划分方式进行编码所对应的编码代价或该编码块按不划分方式进行编码所对应的编码代价。

本发明的有益效果是：本发明提供的一种采用分类的方式加速编码块大小决策的视频编码方法，该方法具有灵活性，能够满足不同的能量受限或者实时的应用；充分利用视频序列的特征，挖掘出编码块大小与特征之间的关系，并且采取级联的三分类器和二分类器，在保证编码性能的情况下，降低编码块大小决策的复杂度。

附图说明

图1图示最大尺寸编码块大小决策的流程图；

图2图示视频编码块大小决策的流程图；

图3示意地表示三分类器；

图4示意地表示二分类器；

图5示意地表示三分类器和二分类器所利用的特征之间的关系。

具体实施方式

以下参照附图，对本发明的实施方式进行详细说明。

图1示出最大尺寸编码块大小的决策过程。现结合图1所示流程图对决策编码块大小的视频编码方法的各步骤作具体的说明。

在步骤S100中，开始该处理流程。

在步骤S102中，编码允许最大尺寸的编码块。编码过程中采用的是视频编码块的编码方法。

图2示出视频编码块大小的决策过程。现结合图2所示流程图对视频编码块大小的编码方法的各步骤作具体的说明。

在步骤S200中，开始该处理流程，即编码深度为d(d＝0)的编码块。

在步骤S202中，提取出当前深度的编码块的特征作为三分类器的特征。

在步骤S204中，根据步骤S202中提取出的特征，采用三分类器将编码块归类到划分类、不确定类和不划分类。三分类器将特征位于不确定区域内的编码块视为“不确定”。如果是不划分，则判定为“不变”，并跳转到步骤S205进行处理；如果是不确定，则判定为“不确定”，并跳转到步骤S206进行处理；如果是不划分，则判定为“变小”，则跳转到步骤S212进行处理。其中，三分类器可以是贝叶斯分类器、支持向量机或者决策树。贝叶斯分类器是机器学习中常用的分类器，简单有效。支持向量机具有完备的数学理论基础，分类效果强，计算复杂度高。对于编码复杂度要求高的应用，三分类器可以采用贝叶斯分类器；对于编码性能要求高的应用，三分类器可以采用支持向量机。

图3是三分类器的示意图。曲线Q1为当前深度的编码块不划分的概率统计曲线；曲线Q2为当前深度的编码块划分的概率统计曲线。直线L1和L2是三分类器的两个门限值对应的直线。如果待编码块的特征位于直线L1的左边，则待编码块的大小是最佳编码块大小。如果待编码块的特征位于直线L1和L2之间，则待编码块的大小无法被判定是否最佳，即不确定。其中，斜线区域的面积表示编码块落入不确定区间的概率。如果待编码块的特征位于直线L2的右边，则该编码块的大小是非最佳编码块大小，需要进行划分。调整不确定区间的大小，可以同时改变编码性能和编码复杂度，满足不同的能量受限和实时的应用场景。

三分类器引入了一段不确定区间，通过对落在不确定区间内误判样本的修正，就可以在二分类器的基础上改进判决的正确率，从而提高编码性能。但是，对于不确定区间内的样本修正会增加计算复杂度。当不确定区域变大时，被修正的样本数增多，编码性能提高，编码复杂度增加。在确定三分类器的两个门限时，编码性能与编码复杂度要得到最好的平衡。数学上，可将确定三分类器门限时的优化问题表示如下：

即在保证率失真性能不小于特定阈值τ的条件下，选择最佳的不确定区间，使得复杂度最低。其中，η_RD表示率失真性能，τ为率失真性能的下限，它可以随着不同的应用需求设定不同的值，ΔC表示与基于二分类的编码框架相比，引入不确定区间后所导致的复杂度的增长量，Ω_φ表示特征空间中的不确定区间。计算率失真性能时，码率的衡量方式是统计熵编码后的比特数，失真的衡量方式是SAD或SSE。

在步骤S205和S206中，对当前大小的编码块进行编码。这里的编码指的是比提取三分类器特征时更近一步的编码，最后能够得到失真和码率等编码代价信息。该步骤的目的是为提取二分类器的特征做准备。

在步骤S208中，提取被归类到不确定的编码块的新特征，将新特征和三分类器所利用的特征作为二分类器的特征。

在步骤S210中，利用步骤S208中提取出的新特征和三分类器所利用的特征，采用二分类器将不确定的编码块归类到划分和不划分。如果是不划分，则判定为“不变”，并跳转到步骤S214进行处理；如果是划分，则判定为“变小”，并跳转到步骤S212进行处理。二分类器可以是贝叶斯分类器或支持向量机。贝叶斯分类器是机器学习中常用的分类器，简单有效。支持向量机具有完备的数学理论基础，分类效果强，计算复杂度高。对于编码复杂度要求高的应用，二分类器可以采用贝叶斯分类器；对于编码性能要求高的应用，二分类器可以采用支持向量机。

图4是二分类器的示意图。曲线Q3为当前深度的编码块不划分的概率统计曲线；曲线Q4为当前深度的编码块划分的概率统计曲线。直线L3是二分类器的门限值对应的直线。如果待编码块的特征位于直线L3的左边，则该编码块的大小是最佳编码块大小；如果待编码块的特征位于直线L3的右边，则该编码块的大小是非最佳编码块大小，需要进行划分。

二分类器的设计就是门限值的确定过程。在设计过程中，只需考虑编码性能最佳。数学上，可以将确定二分类器门限时的优化问题表示为minη_RD，其中η_RD表示率失真性能。计算率失真性能时，码率的衡量方式是统计熵编码后的比特数，失真的衡量方式是SAD或SSE。

特征选择对于分类器来说是至关重要的。一个好的特征必须是提取复杂度低，并且对于分类是有效的。三分类器和二分类器所采取的特征之间的关系如图5所示。其中，提取复杂度低的特征作为三分类器的特征，提取复杂度高的特征加上三分类器的全部或部分特征组成二分类器特征。三分类器和二分类器的特征选择具有灵活性，与编码块种类等因素有关。特征反应的信息可以是图像内容信息、预测残差信息、编码代价信息和时空域相关信息。

对于帧内编码单元(CU)的决策来说，三分类器的特征可以是近邻编码块的编码深度和量化系数。二分类器的特征可以是三分类器所采取的两个特征加上当前编码单元的预测残差的误差绝对值变换之和(SATD)和四个子编码单元的预测残差的SATD的方差这两个特征。也就是说，二分类器的特征是当前编码单元的预测残差的误差绝对值变换之和(SATD)、四个子编码单元的预测残差的SATD的方差、近邻编码块的编码深度和量化系数。当前编码单元的预测残差的SATD和四个子编码单元的预测残差的SATD的方差利用了编码块的纹理特性，反应了图像内容信息和预测残差信息。当前编码单元的近邻编码块的编码深度和量化系数利用了空域相关性。

对于帧内编码单元(CU)的决策来说，三分类器的特征可以是当前编码单元的预测残差的误差绝对值变换之和(SATD)、近邻编码块的编码深度和量化系数。二分类器的特征可以是三分类器的部分特征加上四个子编码单元的预测残差的SATD的方差。也就是说，二分类器的特征可以是当前编码单元的预测残差的误差绝对值变换之和(SATD)和四个子编码单元的预测残差的SATD的方差。当前编码单元的预测残差的SATD和四个子编码单元的预测残差的SATD的方差利用了编码块的纹理特性，反应了图像内容信息和预测残差信息。当前编码单元的近邻编码块的编码深度和量化系数利用了空域相关性。

在步骤S212中，当前编码块的大小会与允许的最小编码块尺寸进行比较。如果当前编码块大小大于最小尺寸，则判定为“否”，并跳转到步骤S216进行处理；如果当前编码块大小等于最小尺寸，则判定为“是”，并跳转到步骤S214进行处理。

在步骤S214中，将当前编码块大小设为最佳编码块尺寸。

在步骤S216中，将编码块的深度加1，即当前编码块被划分成若干个小尺寸的子编码块，并进入下一编码深度进行处理。

在步骤S218中，结束该处理流程，即结束编码深度为d(d＝0)的编码块。

最后的结果是将当前编码块归类到划分和不划分两类。如果当前编码块被判定为不划分，那么当前尺寸为最佳的编码块大小，并跳转到步骤S108中结束。如果当前编码块被判定为划分，那么当前尺寸为非最佳的编码块大小，并跳转到步骤S104中进行处理。对于帧内编码单元来说，非最佳的编码块大小的处理方式是，将当前编码块划分成4个尺寸是当前编码块1/4的子编码块。

在步骤S104中，该步骤的处理方式和步骤S102相同，但是编码块既不是最大尺寸也不是最小尺寸。编码过程中采用的是视频编码块的编码方法。

在步骤S200中，开始该处理流程，即编码深度为d(d>0)的编码块。

图3是三分类器的示意图。曲线Q1为当前深度的编码块不划分的概率统计曲线；曲线Q2为当前深度的编码块划分的概率统计曲线。直线L1和L2是三分类器的两个门限值对应的直线。如果待编码块的特征位于直线L1的左边，则待编码块的大小是最佳编码块大小。如果待编码块的特征位于直线L1和L2之间，则待编码块的大小无法被判定是否最佳，即不确定。其中，斜线区域的面积表示编码块落入不确定区间的概率。如果待编码块的特征位于直线L2的右边，则该编码块的大小是非最佳编码块大小，需要进行划分。通过调整不确定区间的大小，可以同时改变编码性能和编码复杂度，满足不同的能量受限和实时的应用场景。

三分类器引入了一段不确定区间，通过对落在不确定区间内误判样本的修正，就可以在二分类器的基础上改进判决的正确率，从而提高编码性能。但是，对于不确定区间内的样本修正会增加计算复杂度。当不确定区间变大时，被修正的样本数增多，编码性能提高，编码复杂度增加。在确定三分类器的两个门限时，编码性能与编码复杂度要得到最好的平衡。数学上，可将确定三分类器门限时的优化问题表示如下：

在步骤S205和S206中，对当前大小的编码块进行编码。这里的编码指的是比提取三分类器特征时更近一步的编码，最后能够得到失真和码率等信息。该步骤的目的是为提取二分类器的特征做准备。

在步骤S214中，将当前编码块大小设为最佳编码块尺寸。

在步骤S218中，结束该处理流程，即结束编码深度为的d(d>0)的编码块。

在步骤S106中，编码最小尺寸的编码块。编码过程中不采用单一尺寸编码块大小的视频编码方法。

在步骤S108中，结束该处理流程。

二分类器和三分类器采取的特征对于本发明来说至关重要。其中，二分类器的新特征包括该编码块按划分方式进行编码所对应的编码代价或该编码块按不划分方式进行编码所对应的编码代价。现结合图1所示流程图对最大尺寸编码块大小的视频编码方法的各步骤作具体的说明。

在步骤S100中，开始该处理流程。

对于帧内编码单元(CU)的决策来说，三分类器的特征可以是当前编码单元的预测残差的误差绝对值变换之和(SATD)、四个子编码单元的预测残差的SATD的方差、近邻编码块的编码深度和量化系数。二分类器的特征可以是三分类器的四个特征加上当前编码单元按划分方式进行编码所对应的率失真代价，即当前编码单元的预测残差的误差绝对值变换之和(SATD)、四个子编码单元的预测残差的SATD的方差、近邻编码块的编码深度、量化系数和当前编码单元按划分方式进行编码所对应的率失真代价。当前编码单元的预测残差的SATD和四个子编码单元的预测残差的SATD的方差利用了编码块的纹理特性，反应了图像内容信息和预测残差信息。当前编码单元的近邻编码块的编码深度和量化系数利用了空域相关性。当前编码单元的率失真代价利用了编码块的编码代价信息。

对于帧内编码单元(CU)的决策来说，三分类器的特征可以是当前编码单元的预测残差的误差绝对值变换之和(SATD)、四个子编码单元的预测残差的SATD的方差、近邻编码块的编码深度和量化系数。二分类器的特征可以是三分类器的四个特征加上当前编码单元按不划分方式进行编码所对应的率失真代价，即当前编码单元的预测残差的误差绝对值变换之和(SATD)、四个子编码单元的预测残差的SATD的方差、近邻编码块的编码深度、量化系数和当前编码单元按不划分方式进行编码所对应的率失真代价。当前编码单元的预测残差的SATD和四个子编码单元的预测残差的SATD的方差利用了编码块的纹理特性，反应了图像内容信息和预测残差信息。当前编码单元的近邻编码块的编码深度和量化系数利用了空域相关性。当前编码单元的率失真代价利用了编码块的编码代价信息。

对于帧内编码单元(CU)的决策来说，三分类器的特征可以是当前编码单元的预测残差的误差绝对值变换之和(SATD)，四个子编码单元的预测残差的SATD的方差，近邻编码块的编码深度和量化系数。二分类器的特征可以是三分类器的部分特征加上当前编码单元按划分方式进行编码所对应的率失真代价，即当前编码单元的预测残差的误差绝对值变换之和(SATD)、四个子编码单元的预测残差的SATD的方差和当前编码单元按划分方式进行编码所对应的率失真代价。当前编码单元的预测残差的SATD和四个子编码单元的预测残差的SATD的方差利用了编码块的纹理特性，反应了图像内容信息和预测残差信息。当前编码单元的率失真代价利用了编码块的编码代价信息。

对于帧内编码单元(CU)的决策来说，三分类器的特征可以是当前编码单元的预测残差的误差绝对值变换之和(SATD)，四个子编码单元的预测残差的SATD的方差，近邻编码块的编码深度和量化系数。二分类器的特征可以是三分类器的部分特征加上当前编码单元按不划分方式进行编码所对应的率失真代价，即当前编码单元的预测残差的误差绝对值变换之和(SATD)、四个子编码单元的预测残差的SATD的方差和当前编码单元按不划分方式进行编码所对应的率失真代价。当前编码单元的预测残差的SATD和四个子编码单元的预测残差的SATD的方差利用了编码块的纹理特性，反应了图像内容信息和预测残差信息。当前编码单元的率失真代价利用了编码块的编码代价信息。

在步骤S214中，将当前编码块大小设为最佳编码块尺寸。

在步骤S218中，结束该处理流程，即结束编码深度为0的编码块。

在步骤S214中，将当前编码块大小设为最佳编码块尺寸。

在步骤S108中，结束该处理流程。

在步骤S200中，开始该处理流程，即编码深度为d的编码块。

在步骤S214中，将当前编码块大小设为最佳编码块尺寸。

在步骤S218中，结束该处理流程，即结束编码深度为d的编码块。

二分类器和三分类器采取的特征对于本发明来说至关重要。其中，二分类器的新特征包括该编码块按划分方式进行编码所对应的编码代价或该编码块按不划分方式进行编码所对应的编码代价。现结合图2所示流程图对视频编码块大小的编码方法的各步骤作具体的说明。

在步骤S200中，开始该处理流程，即编码深度为d的编码块。

在步骤S214中，将当前编码块大小设为最佳编码块尺寸。

Claims

1.一种视频编码块的编码方法，其特征在于，包含：

提取编码块的特征，利用所提取的特征，采用三分类器将所述编码块归类到划分类、不确定类或不划分类；如果所述编码块归类到划分类，所述编码块的模式确定为划分；如果所述编码块归类到不划分类，所述编码块的模式确定为不划分；如果所述编码块归类到不确定类，提取所述编码块的至少一种新特征，利用所提取的新特征和三分类器中已利用的至少一种特征，采用二分类器将所述编码块归类到划分类或不划分类。

2.根据权利要求1所述的编码方法，其特征在于，所述三分类器和二分类器选自贝叶斯分类器和支持向量机。

3.根据权利要求1所述的编码方法，其特征在于，所述不确定类的编码块的新特征包括该编码块按划分方式进行编码所对应的编码代价或该编码块按不划分方式进行编码所对应的编码代价。

4.一种决策编码块大小的视频编码方法，其特征在于，包含以下步骤：

第一步：编码块从最大尺寸开始决策；

5.根据权利要求4所述的视频编码方法，其特征在于，所述三分类器和二分类器选自贝叶斯分类器和支持向量机。

6.根据权利要求4所述的视频编码方法，其特征在于，所述不确定类的编码块的新特征包括该编码块按划分方式进行编码所对应的编码代价或该编码块按不划分方式进行编码所对应的编码代价。