CN105122797A

CN105122797A - 在无损编码下对视频进行编码的方法和设备以及在无损编码下对视频进行解码的方法和设备

Info

Publication number: CN105122797A
Application number: CN201480012441.1A
Authority: CN
Inventors: 朴银姬; 闵正惠
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2013-01-04
Filing date: 2014-01-06
Publication date: 2015-12-02
Also published as: US20160050426A1; KR20140089485A; WO2014107072A1

Abstract

提供了一种根据示例性实施例的在无损编码中用于对有效变换系数的最后位置进行编码的编码方法，所述编码方法包括：按预定顺序执行从编码单元的第一点到第二点的扫描，以获得包括在编码单元中的变换系数；确定包括在编码单元中的变换系数之中的非0的有效变换系数的最后位置；确定与确定的最后位置相应的相对于第二点的位置信息；对确定的位置信息进行编码。

Description

在无损编码下对视频进行编码的方法和设备以及在无损编码下对视频进行解码的方法和设备

技术领域

本发明构思涉及在无损编码下对视频进行编码和解码，更具体地说，涉及一种用于在无损编码下对有效变换系数的最后位置进行编码和解码的方法和设备。

背景技术

根据诸如MPEG-1、MPEG-2或MPEG-4H.264/MPEG-4先进视频编码(AVC)的图像压缩方法，将图像划分为具有预定尺寸的块，然后，通过帧间预测或帧内预测来获得块的残差数据。通过变换、量化、扫描、游程编码和熵编码来对残差数据进行压缩。在熵编码中，诸如变换系数或预测模式的语法元素被熵编码以输出比特流。解码器从比特流解析语法元素，从而提取语法元素，并基于提取的语法元素来重建图像。

发明内容

技术问题

同时，在无损图像压缩方法中可绕过上述的对残差数据进行量化的处理。可选地，可绕过变换和量化两者。当变换和量化都被绕过时，可如变换系数一样，对残差数据本身进行熵编码。然而，根据现有技术的有效变换系数或有效残差数据的最后位置是基于低频区域(编码单元的左上角)而被熵编码的，因此，存在在无损图像压缩方法中最后位置的值总是很大的问题。也就是说，在无损图像压缩方法中，对最后位置进行编码所需的比特长度增加。

技术方案

本发明构思提供了一种用于在无损图像压缩方法中对有效变换系数或残差数据的最后位置进行有效编码和解码的方法和设备。

本发明构思的技术目标不限于上述的特征，本领域普通技术人员可从下面提取的描述中容易理解这里没有描述的其它技术目标。

有益效果

如上所述，根据基于示例性实施例的对有效变换系数的最后位置进行编码和解码的方法，与有效变换系数的最后位置相应的熵编码的编码大小可被减小，并且编码和解码的速度可被提高。

附图说明

通过参照附图详细描述本发明构思的示例性实施例，本发明构思的上述和其它特征和优点将变得更加明显，其中：

图1是根据示例性实施例的对视频进行编码的设备的框图。

图2是根据示例性实施例的对视频进行解码的设备的框图。

图3是用于描述根据示例性实施例的编码单元的概念的示图。

图4是根据示例性实施例的基于具有分层结构的编码单元的图像编码器的详细框图。

图5是根据示例性实施例的基于具有分层结构的编码单元的图像解码器的详细框图。

图6是示出根据本发明构思的示例性实施例的根据深度的较深层编码单元以及分区的示图。

图7是用于描述根据本发明构思的示例性实施例的编码单元和变换单元之间的关系的示图。

图8是用于描述根据本发明构思的示例性实施例的与编码深度相应的编码单元的编码信息的示图。

图9是根据示例性实施例的根据深度的较深层编码单元的示图。

图10至图12是用于描述根据本发明构思的示例性实施例的编码单元、预测单元和变换单元之间的关系的示图。

图13是用于描述根据表1的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图。

图14a是示出根据示例性实施例的用于在无损编码下对有效变换系数或有效残差数据的最后位置进行编码的设备的框图。

图14b是根据示例性实施例的在无损编码下对有效变换系数的最后位置进行编码的方法的流程图。

图14c是根据示例性实施例的在无损编码下对有效残差数据的最后位置进行编码的方法的流程图。

图15示出获得包括在变换单元中的变换系数的示例。

图16是用于描述根据示例性实施例的根据与有效变换系数的最后位置相应的语法元素的大小而需要的比特的示图。

图17示出根据示例性实施例的确定与有效变换系数的最后位置相应的语法元素的示例。

图18a是示出根据示例性实施例的用于在无损编码下对有效变换系数或有效残差数据的最后位置进行解码的设备的框图。

图18b是根据示例性实施例的在无损编码下对有效变换系数的最后位置进行解码的方法的流程图。

图18c是根据示例性实施例的在无损编码下对有效残差数据的最后位置进行解码的方法的流程图。

最佳实施方式

根据本发明构思的一方面，提供了一种在无损编码中用于对有效变换系数的最后位置进行编码的编码方法，所述编码方法包括：按预定顺序执行从编码单元的第一点到第二点的扫描，以获得包括在编码单元中的变换系数；确定包括在编码单元中的变换系数之中的非0的有效变换系数的最后位置；确定与确定的最后位置相应的相对于第二点的位置信息；对确定的位置信息进行编码。

根据示例性实施例的所述位置信息可以是与从第二点到确定的最后位置的距离相应的值。

根据示例性实施例的所述位置信息可以是与确定的最位置相应的相对于作为原点的第二点的坐标值。

根据示例性实施例，第一点可以是编码单元的左上角，第二点可以是编码单元的右下角。

根据示例性实施例，第一点可以是编码单元的低频位置，第二点可以是编码单元的高频位置或是与编码单元的高频位置相应的位置。

根据示例性实施例的用于对最后位置进行编码的编码方法还可包括从确定的最后位置开始，按照预定顺序的反向顺序，对包括在编码单元中的变换系数进行编码。

根据示例性实施例的变换系数可以是被执行了DCT(离散余弦变换)的残差数据。

根据本发明构思的另一方面，提供了一种在无损编码中用于对有效变换系数的最后位置进行解码的解码方法，所述解码方法包括：从比特流获得与包括在编码单元中的有效变换系数的最后位置相应的位置信息；基于获得的位置信息确定所述最后位置，其中，获得的位置信息是与从编码单元的高频区域到所述最后位置的距离相应的值。

根据示例性实施例的所述位置信息可指示有效变换系数相对于编码单元的右下角的最后位置。

根据示例性实施例的所述位置信息可以是与所述最后位置相应的以编码单元的右下角作为原点的坐标值。

根据示例性实施例的解码方法还可包括从确定的最后位置开始对包括在编码单元中的变换系数进行解码。

根据本发明构思的另一方面，提供了一种在无损编码中用于对有效变换系数的最后位置进行编码的编码设备，所述编码设备包括：扫描器，被配置为按预定顺序执行从编码单元的第一点到第二点的扫描，以获得包括在编码单元中的变换系数；最后位置确定器，被配置为确定包括在编码单元中的变换系数之中的非0的有效变换系数的最后位置；位置信息确定器，被配置为确定与确定的最后位置相应的相对于第二点的位置信息；编码器，被配置为对确定的位置信息进行编码。

根据示例性实施例的编码器可从确定的最后位置开始，按照预定顺序的反向顺序，对包括在编码单元中的变换系数进行编码。

根据本发明构思的另一方面，提供了一种在无损编码中用于对有效变换系数的最后位置进行解码的解码设备，所述解码设备包括：位置信息获得单元，被配置为从比特流获得与包括在编码单元中的有效变换系数的最后位置相应的位置信息；最后位置确定器，被配置为基于获得的位置信息确定有效变换系数的最后位置，其中，获得的位置信息是与从编码单元的高频区域到所述最后位置的距离相应的值。

根据示例性实施例的解码设备还可包括解码器，其中，解码器用于从确定的最后位置开始对包括在编码单元中的变换系数进行解码。

根据本发明构思的另一方面，提供了一种在无损编码中用于对有效变换系数的最后位置进行编码的编码方法，所述编码方法包括：按预定顺序执行从编码单元的第一点到第二点的扫描，以获得包括在编码单元中的残差数据；确定包括在编码单元中的残差数据之中的非0的有效残差数据的最后位置；确定与确定的最后位置相应的相对于第二点的位置信息；对确定的位置信息进行编码。

根据本发明构思的另一方面，提供了一种在无损编码中用于对有效残差数据的最后位置进行解码的解码方法，所述解码方法包括：从比特流获得与包括在编码单元中的有效残差数据的最后位置相应的位置信息；基于获得的位置信息确定所述最后位置，其中，获得的位置信息是与从编码单元的高频区域到所述最后位置的距离相应的值。

另外，还可提供用于实现本发明构思的其它方法或系统以及记录有用于执行上述方法的程序的计算机可读记录介质。

具体实施方式

现在将在下面参照附图更充分地描述本发明构思，其中，在附图中示出了本发明构思的示例性实施例。

首先，将参照图1至图13来描述根据本发明构思的示例性实施例的基于具有分层树的编码单元对视频进行编码和解码的方法和设备。另外，将参照图14a至图18b来详细描述参照图1至图13描述的对视频进行编码和解码的方法之中的对有效变换系数或有效残差数据的最后位置进行编码和解码的操作。

图1是根据示例性实施例的视频编码设备的框图。

根据示例性实施例的视频编码设备100包括分层编码器110和熵编码器120。

分层编码器110可按预定数据单元为单位对将被编码的当前画面进行划分以对每个数据单元执行编码。具体地说，分层编码器110可基于作为最大尺寸的编码单元的最大编码单元，来对当前画面进行划分。根据本发明构思的示例性实施例的最大编码单元可以是尺寸为32×32、64×64、128×128、256×256等的数据单元，其中，数据单元的形状是边长均为2的若干次方且大于8的正方形。

根据示例性实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元从最大编码单元空间被划分的次数，并且随着深度加深，根据深度的较深层编码单元可从最大编码单元被划分到最小编码单元。最大编码单元的深度为最高深度，最小编码单元的深度为最低深度。由于随着最大编码单元的深度加深，与每个深度相应的编码单元的尺寸减小，因此与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。

如上所述，当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单元，并且每个最大编码单元可包括根据深度被划分的较深层编码单元。由于根据深度对根据示例性实施例的最大编码单元进行划分，因此可根据深度对包括在最大编码单元中的空间域的图像数据进行分层地分类。

可预先确定编码单元的最大深度和最大尺寸，所述最大深度和最大尺寸限制对最大编码单元的高度和宽度进行分层划分的总次数。

分层编码器110对通过根据深度对最大编码单元的区域进行划分而获得的至少一个划分区域进行编码，并且根据所述至少一个划分区域来确定用于输出最终编码的图像数据的深度。换句话说，分层编码器110通过根据当前画面的最大编码单元以根据深度的较深层编码单元对图像数据进行编码，选择具有最小编码误差的深度，来确定编码深度。确定的编码深度和根据最大编码单元的被编码的图像数据被输出到熵编码器120。

基于与等于或小于最大深度的至少一个深度相应的较深层编码单元，对最大编码单元中的图像数据进行编码，并且基于每个较深层编码单元比较对图像数据进行编码的结果。在对与较深层编码单元的编码误差进行比较之后，可选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。

随着编码单元根据深度而被分层地划分并且编码单元的数量增加，最大编码单元的尺寸被划分。另外，即使在一个最大编码单元中编码单元与同一深度相应，也通过分别测量每个编码单元的图像数据的编码误差来确定是否将与同一深度相应的每个编码单元划分为更低深度。因此，即使图像数据被包括在一个最大编码单元中，在一个最大编码单元中图像数据被划分为根据深度的区域，并且编码误差根据区域而不同，因此在图像数据中编码深度可根据区域而不同。因此，可在一个最大编码单元中确定一个或更多个编码深度，并且可根据至少一个编码深度的编码单元来对最大编码单元的图像数据进行划分。

因此，根据示例性实施例的分层编码器110可确定包括在最大编码单元中的具有树结构的编码单元。根据示例性实施例的“具有树结构的编码单元”包括在最大编码单元中包括的所有较深层编码单元中的与确定为编码深度的深度相应的编码单元。可根据最大编码单元的相同区域中的深度来分层地确定编码深度的编码单元，并可在不同区域中独立地确定编码深度的编码单元。类似地，可从另一区域的编码深度独立地确定当前区域中的编码深度。

根据示例性实施例的最大深度是与从最大编码单元到最小编码单元执行划分的次数有关的索引。根据示例性实施例的第一最大深度可表示从最大编码单元到最小编码单元的总划分次数。根据示例性实施例的第二最大深度可表示从最大编码单元到最小编码单元的深度等级的总数量。例如，当最大编码单元的深度是0时，对最大编码单元划分一次的编码单元的深度可被设置为1，对最大编码单元划分两次的编码单元的深度可被设置为2。这里，如果最小编码单元是对最大编码单元划分四次的编码单元，则存在深度0、1、2、3和4的5个深度等级，并因此第一最大深度可被设置为4，第二最大深度可被设置为5。

可根据最大编码单元执行预测编码和变换。还根据最大编码单元，基于根据等于或小于最大深度的深度的较深层编码单元来执行预测编码和变换。

由于每当根据深度对最大编码单元进行划分时，较深层编码单元的数量增加，因此对随着深度加深而产生的所有较深层编码单元执行包括预测编码和变换的编码。为了便于描述，在最大编码单元中，现在将基于当前深度的编码单元来描述预测编码和变换。

根据示例性实施例的视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码，执行诸如预测编码、变换和熵编码的操作，此时，可针对所有操作使用相同的数据单元，或者可针对每个操作使用不同的数据单元。

例如，视频编码设备100不仅可选择用于对图像数据进行编码的编码单元，还可选择不同于编码单元的数据单元，以便对编码单元中的图像数据执行预测编码。

为了在最大编码单元中执行预测编码，可基于根据示例性实施例的与编码深度相应的编码单元(即，基于不再被划分成与更低深度相应的编码单元的编码单元)来执行预测编码。以下，不再被划分且成为用于预测编码的基本单元的编码单元现在将被称为“预测单元”。通过划分预测单元获得的分区可包括预测单元以及通过对预测单元的高度和宽度中的至少一个进行划分而获得的数据单元。

例如，当2N×2N(其中，N是正整数)的编码单元不再被划分，并且成为2N×2N的预测单元时，分区的尺寸可以是2N×2N、2N×N、N×2N或N×N。分区类型的示例包括通过对预测单元的高度或宽度进行对称地划分而获得的对称分区、通过对预测单元的高度或宽度进行非对称地划分(诸如，1：n或n:1)而获得的分区、通过对预测单元进行几何地划分而获得的分区、以及具有任意形状的分区。

预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个。例如，可对2N×2N、2N×N、N×2N或N×N的分区执行帧内模式或帧间模式。另外，可仅对2N×2N的分区执行跳过模式。可对编码单元中的一个预测单元独立地执行编码，从而选择具有最小编码误差的预测模式。

此外，根据示例性实施例的视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与编码单元不同的变换单元，来对编码单元中的图像数据执行变换。

为了对编码单元执行变换，可基于具有小于或等于编码单元的尺寸的数据单元，来执行变换。例如，用于变换的数据单元可包括帧内模式的数据单元和帧间模式的数据单元。

现在将作为变换的基础的数据单元称为“变换单元”。与编码单元类似，编码单元中的变换单元可被递归地划分为更小尺寸的区域，从而可以以区域为单元独立地确定变换单元。因此，可基于根据变换深度的具有树结构的变换，对编码单元中的残差数据进行划分。

还可在变换单元中设置指示通过对编码单元的高度和宽度进行划分来得到变换单元而执行的划分次数的变换深度。例如，在2N×2N的当前编码单元中，当变换单元的尺寸是2N×2N时变换深度可为0，当变换单元的尺寸是N×N时，变换深度可为1，当变换单元的尺寸是N/2×N/2时，变换深度可为2。也就是说，还可根据变换深度设置具有树结构的变换单元。

根据与编码深度相应的编码单元的编码信息不仅需要关于编码深度的信息，还需要关于与预测编码和变换相关的信息的信息。因此，分层编码器110不仅确定具有最小编码误差的编码深度，还确定预测单元中的分区类型、根据预测单元的预测模式和用于变换的变换单元的尺寸。

稍后将参照图3至图12详细描述根据示例性实施例的最大编码单元中的根据树结构的编码单元和确定分区的方法。

分层编码器110可通过使用基于拉格朗日乘数的率失真优化，来测量根据深度的较深层编码单元的编码误差。

熵编码器120在比特流中输出最大编码单元的图像数据和关于根据编码深度的编码模式的信息，其中，所述最大编码单元的图像数据基于由分层编码器110确定的至少一个编码深度被编码。编码的图像数据可以是图像的残差数据的编码结果，并包括关于变换系数的信息。关于根据编码深度的编码模式的信息可包括关于编码深度的信息、关于在预测单元中的分区类型的信息、预测模式信息和变换单元的尺寸信息。具体地，如将在稍后描述的，根据示例性实施例的熵编码器120可通过使用基于变换单元的变换深度确定的上下文模型，对变换单元有效系数标记(coded_block_flag；cbf)进行熵编码，其中，变换单元有效系数标记指示在变换单元中是否包括非0变换系数。将在稍后描述由熵编码器120执行的对与变换单元有关的语法元素进行熵编码的操作。

可通过使用根据深度的划分信息来定义关于编码深度的信息，其中，根据深度的划分信息指示是否对更低深度而不是当前深度的编码单元执行编码。如果当前编码单元的当前深度是编码深度，则对当前编码单元中的图像数据进行编码并输出，因此可定义划分信息以不将当前编码单元划分到更低深度。可选地，如果当前编码单元的当前深度不是编码深度，则对更低深度的编码单元执行编码，并因此可定义划分信息以对当前编码单元进行划分来获得更低深度的编码单元。

如果当前深度不是编码深度，则对被划分到更低深度的编码单元的编码单元执行编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中，因此对更低深度的每个编码单元重复执行编码，并因此可对具有相同深度的编码单元递归地执行编码。

由于针对一个最大编码单元确定具有树结构的编码单元，并且针对编码深度的编码单元确定关于至少一个编码模式的信息，所以可针对一个最大编码单元确定关于至少一个编码模式的信息。另外，由于根据深度对图像数据进行分层划分，因此最大编码单元的图像数据的编码深度可根据位置而不同，因此可针对图像数据设置关于编码深度和编码模式的信息。

因此，根据示例性实施例的熵编码器120可将关于相应的编码深度和编码模式的编码信息分配给包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。

根据示例性实施例的最小单元是通过将构成最低深度的最小编码单元划分为4份而获得的矩形数据单元。可选择地，最小单元可以是可包括在最大编码单元中所包括的所有编码单元、预测单元、分区单元和变换单元中的最大矩形数据单元。

例如，通过熵编码器120输出的编码信息可被分类为根据编码单元的编码信息和根据预测单元的编码信息。根据编码单元的编码信息可包括关于预测模式的信息和关于分区的尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息、以及关于帧内模式的插值方法的信息。此外，根据画面、条带或GOP定义的关于编码单元的最大尺寸的信息和关于最大深度的信息可被插入到比特流的头中。

在根据最简单的示例性实施例的视频编码设备100中，较深层编码单元可以是通过将更高深度的编码单元(更高一层)的高度或宽度划分成两份而获得的编码单元。换言之，当当前深度的编码单元的尺寸是2N×2N时，更低深度的编码单元的尺寸是N×N。另外，尺寸为2N×2N的当前深度的编码单元可包括更低深度的最多4个编码单元。

因此，视频编码设备100可基于考虑当前画面的特征而确定的最大编码单元的尺寸和最大深度，通过针对每个最大编码单元确定具有最优形状和最优尺寸的编码单元来形成具有树结构的编码单元。另外，由于可通过使用各种预测模式和变换中的任意一个对每个最大编码单元执行编码，因此可考虑各种图像尺寸的编码单元的特征来确定最优编码模式。

因此，如果以传统宏块对具有高分辨率或大数据量的图像进行编码，则每个画面的宏块的数量极度增加。因此，针对每个宏块产生的压缩信息的条数增加，因此难以发送压缩的信息，并且数据压缩效率降低。然而，通过使用根据示例性实施例的视频编码设备100，由于考虑图像的尺寸，同时在增加编码单元的最大尺寸的同时，基于图像的特征来调整编码单元，因此可增加图像压缩效率。

图2是根据示例性实施例的视频解码设备200的框图。

根据示例性实施例的视频解码设备200包括解析器210、熵解码器220和分层解码器230。用于根据示例性实施例的视频解码设备200的各种操作的各种术语(诸如编码单元、深度、预测单元、变换单元和关于各种编码模式的信息)的定义与参照图1和视频编码设备100描述的定义相同。

解析器210接收编码视频的比特流以解析语法元素。熵解码器220对解析的语法元素执行熵解码，以基于具有树结构的编码单元对指示编码的图像数据的语法元素进行算术解码，并将算术解码后的语法元素输出到分层解码器230。也就是说，熵解码器220对作为包括0和1的比特流接收的语法元素执行熵解码，以重建语法元素。

熵解码器220根据每个最大编码单元，针对具有树结构的编码单元，提取关于编码深度和编码模式的附加信息、彩色分量信息、预测模式信息等。提取的关于编码深度和编码模式的信息被输出到分层解码器230。比特流中的图像数据在被划分为最大编码单元之后被编码，因此分层解码器230可针对每个最大编码单元对图像数据进行解码。

可针对关于与编码深度相应的至少一个编码单元的信息设置关于根据最大编码单元的编码深度和编码模式的信息，关于编码模式的信息可包括关于与编码深度相应的相应编码单元的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。另外，根据深度的划分信息可被提取为关于编码深度的信息。

关于由熵解码器220提取的根据每个最大编码单元的编码深度和编码模式的信息是关于这样的编码深度和编码模式的信息：该编码深度和编码模式在编码器(诸如，根据示例性实施例的视频编码设备100)根据每个最大编码单元对根据深度的每个较深层编码单元重复地执行编码时被确定为产生最小编码误差。因此，视频解码设备200可通过根据产生最小编码误差的编码深度和编码模式对图像数据进行解码来重建图像。

由于根据示例性实施例的关于编码深度和编码模式的编码信息可被分配给相应的编码单元、预测单元和最小单元中的预定数据单元，因此熵解码器220可根据预定数据单元，提取关于编码深度和编码模式的信息。可将被分配了相同的关于编码深度和编码模式的信息的预定数据单元推断为是包括在同一最大编码单元中的数据单元。

分层解码器230基于关于根据最大编码单元的编码深度和编码模式的信息，通过对每个最大编码单元中的图像数据进行解码，来重建当前画面。换言之，分层解码器230可基于提取出的关于包括在每个最大编码单元中的具有树结构的编码单元之中的每个编码单元的分区类型、预测模式和变换单元的信息，对编码的图像数据进行解码。解码处理可包括预测(包含帧内预测和运动补偿)和逆变换。

分层解码器230可基于关于根据编码深度的编码单元的预测单元的分区类型和预测模式的信息，根据每个编码单元的分区和预测模式，执行帧内预测或运动补偿。

另外，分层解码器230可基于关于根据编码深度的编码单元的变换单元的尺寸的信息，根据编码单元中的每个变换单元执行逆变换，以根据最大编码单元执行逆变换。

分层解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的至少一个编码深度。如果划分信息指示图像数据在当前深度中不再被划分，则当前深度是编码深度。因此，分层解码器230可通过使用关于预测单元的分区类型、预测模式和变换单元的尺寸的信息，针对当前最大编码单元中的图像数据对当前深度的编码单元进行解码。

换言之，可通过观察分配给编码单元、预测单元和最小单元中的预定数据单元的编码信息集来收集包含包括相同划分信息的编码信息的数据单元，并且收集的数据单元可被认为是将由分层解码器230以相同编码模式进行解码的一个数据单元。

根据示例性实施例的视频解码设备200可获得关于当针对每个最大编码单元递归地执行编码时产生最小编码误差的至少一个编码单元的信息，并且可使用所述信息来对当前画面进行解码。换言之，被确定为每个最大编码单元中的最优编码单元的具有树结构的编码单元的编码的图像数据可被解码。

因此，即使图像数据具有高分辨率和极大的数据量，也可通过使用编码单元的尺寸和编码模式，对图像数据进行有效的解码和重建，其中，通过使用从编码器端接收到的关于最优编码模式的信息，根据图像数据的特征自适应地确定所述编码单元的尺寸和编码模式。

现在将参照图3至图13来描述根据示例性实施例的确定具有树结构的编码单元、预测单元和变换单元的方法。

图3是用于描述编码单元的概念的示图。

编码单元的尺寸可被表示为宽度×高度，并可以是64×64、32×32、16×16和8×8。64×64的编码单元可被划分为64×64、64×32、32×64或32×32的分区，32×32的编码单元可被划分为32×32、32×16、16×32或16×16的分区，16×16的编码单元可被划分为16×16、16×8、8×16或8×8的分区，8×8的编码单元可被划分为8×8、8×4、4×8或4×4的分区。

在视频数据310中，分辨率是1920×1080，编码单元的最大尺寸是64，最大深度是2。在视频数据320中，分辨率是1920×1080，编码单元的最大尺寸是64，最大深度是3。在视频数据330中，分辨率是352×288，编码单元的最大尺寸是16，最大深度是1。图3中示出的最大深度表示从最大编码单元到最小编码单元的划分总次数。

如果分辨率高或数据量大，则编码单元的最大尺寸可能较大，从而不仅提高编码效率，而且准确地反映图像的特征。因此，具有比视频数据330更高分辨率的视频数据310和320的编码单元的最大尺寸可以是64。

由于视频数据310的最大深度是2，因此由于通过对最大编码单元划分两次，深度加深至两层，因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元和长轴尺寸为32和16的编码单元。同时，由于视频数据330的最大深度是1，因此由于通过对最大编码单元划分一次，深度加深至一层，因此视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元和长轴尺寸为8的编码单元。

由于视频数据320的最大深度是3，因此由于通过对最大编码单元划分三次，深度加深至3层，因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元和长轴尺寸为32、16和8的编码单元。随着深度加深，详细信息可被精确地表示。

图4是根据示例性实施例的基于具有分层结构的编码单元的图像编码器400的详细框图。

帧内预测器410针对当前帧405，对帧内模式下的编码单元执行帧内预测，运动估计器420和运动补偿器425通过使用当前帧405和参考帧495，对帧间模式下的编码单元分别执行帧间估计和运动补偿。

从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430被输出为变换系数。典型的视频解码设备还经过对已通过变换器430的数据进行量化的处理，而在根据示例性实施例的视频编码设备400中，为了执行无损编码，绕过量化和反量化以避免由于量化而导致的数据损失。

变换系数通过逆变换器470被重建为空间域中的数据，重建的空间域中的数据在通过去块单元480和环路滤波单元490后处理之后被输出为比特流455。同时，作为另一示例，在根据示例性实施例的视频编码设备400中，为了无损编码，还可绕过变换器430、去块单元480和环路滤波单元490中的至少一个的操作。例如，如果变换和量化都被绕过(即，如果从图4的视频编码设备400还省略变换器430和逆变换器470)，残差数据本身而不是上述的变换系数可被熵编码和解码。这里，可将上述的对变换系数进行编码和解码的方法应用为对残差数据进行编码和解码的方法。也就是说，在下面的示例性实施例中，为了无损编码，变换和量化都被绕过，残差数据本身被熵编码和解码，熵编码器450可将残差数据视为变换数据并对其进行处理。此外，在示例性实施例中，为了无损编码而绕过变换，可将本说明书中描述的变换单元视为编码单元。也就是说，对于本领域普通技术人员来说，明显的是下面还可通过将残差数据视为变换系数来执行在本说明书中描述的对变换系数执行的操作。

根据示例性实施例的熵编码器450对与变换单元相关的语法元素(诸如，子块标记(coded_sub_block_flag)、有效图、第一临界值标记(coeff_abs_level_greater1_flag)、第二临界值标记(coeff_abs_level_greather2_flag)、变换系数的大小信息(coeff_abs_level_remaining)或位置信息(last_significant_coeff_x,last_significant_coeff_y))进行算术编码，并输出比特流，其中，子块标记(coded_sub_block_flag)指示子块的所有变换系数是否为0，有效图指示非0变换系数的位置，第一临界值标记(coeff_abs_level_greater1_flag)指示变换系数是否大于1，第二临界值标记(coeff_abs_level_greather2_flag)指示变换系数是否大于2，变换系数的大小信息(coeff_abs_level_remaining)与基于第一临界值标记和第二临界值标记确定的基本级别(baseLevel)与实际变换系数(abscoeff)之间的差相应，位置信息(last_significant_coeff_x,last_significant_coeff_y)指示非0变换系数在变换单元中的最后位置。

为了将视频编码器400应用到根据示例性实施例的视频编码设备100中，视频编码器400的所有元件(即，帧内预测器410、运动估计器420、运动补偿器425、变换器430、熵编码器450、逆变换器470、去块单元480和环路滤波单元490)在考虑每个最大编码单元的最大深度的同时，基于具有树结构的编码单元中的每个编码单元执行操作。

帧内预测器410、运动估计器420和运动补偿器425在考虑当前最大编码单元的最大尺寸和最大深度的同时，确定具有树结构的编码单元中的每个编码单元的分区和预测模式，变换器430确定具有树结构的编码单元中的每个编码单元中的变换单元的尺寸。

由于比特流505通过解析器510，因此作为将被解码的对象的编码图像数据以及作为解码所需的关于编码的信息的语法元素被解析。编码图像数据通过熵解码器520被输出为解码数据。典型的视频解码设备还经过对已通过熵解码器520的数据进行反量化的处理，而根据示例性实施例的视频解码设备500接收用于执行无损编码的非量化的数据，因此反量化被绕过。可选地，逆变换和反量化都可被绕过。根据示例性实施例的熵解码器520从比特流获得与变换单元相关的语法元素(诸如子块标记(coded_sub_block_flag)、有效图、第一临界值标记(coeff_abs_level_greater1_flag)、第二临界值标记(coeff_abs_level_greather2_flag)、变换系数的大小信息(coeff_abs_level_remaining)或位置信息(last_significant_coeff_x,last_significant_coeff_y))，并对获得的语法元素进行算术解码，从而重建语法元素，其中，子块标记(coded_sub_block_flag)指示子块的所有变换系数是否为0，有效图指示非0变换系数的位置，第一临界值标记(coeff_abs_level_greater1_flag)指示变换系数是否大于1，第二临界值标记(coeff_abs_level_greather2_flag)指示变换系数是否大于2，变换系数的大小信息(coeff_abs_level_remaining)与基于第一临界值标记和第二临界值标记确定的基本级别(baseLevel)与实际变换系数(abscoeff)之间的差相应，位置信息(last_significant_coeff_x,last_significant_coeff_y)指示非0变换系数在变换单元中的最后位置。

逆变换器540将解码的数据重建为空间域的图像数据。同时，如果为了无损编码而绕过变换，则在图5的视频解码设备500中可省略逆变换器540。此外，在这种情况下，上述的变换单元和变换系数或将稍后描述的变换单元和变换系数可分别被理解为编码单元和残差数据。帧内预测器550针对帧内模式的编码单元，对空间域的图像数据执行帧内预测，运动补偿器560也通过使用参考帧585对帧间模式的编码单元执行运动补偿。

已通过帧内预测器550和运动补偿器560的空间域中的图像数据可在通过去块单元570和环路滤波单元580后处理之后被输出为重建帧595。另外，通过去块单元570和环路滤波单元580后处理的数据可被输出为参考帧585。

为了将图像解码器500应用到根据示例性实施例的视频解码设备200中，图像解码器500的所有元件(即，解析器510、熵解码器520、逆变换器540、帧内预测器550、运动补偿器560、去块单元570和环路滤波单元580)针对每个最大编码单元，基于具有树结构的编码单元执行操作。

帧内预测器550和运动补偿器560确定具有树结构的每个编码单元的分区和预测模式，逆变换器540必须确定每个编码单元的变换单元的尺寸。

图6是示出根据示例性实施例的根据深度的较深层编码单元以及分区的示图。

根据示例性实施例的视频编码设备100和视频解码设备200使用分层编码单元以考虑图像的特征。可根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度，或可由用户不同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。

在根据示例性实施例的编码单元的分层结构600中，编码单元的最大高度和最大宽度均是64，最大深度是4。由于沿着根据示例性实施例的分层结构600的垂直轴深度加深，因此较深层编码单元的高度和宽度均被划分。另外，预测单元和分区沿着分层结构600的水平轴被示出，其中，所述预测单元和分区是对每个较深层编码单元进行预测编码的基础。

换言之，在分层结构600中，编码单元610是最大编码单元，其中，深度为0，尺寸(即，高度乘宽度)为64×64。深度沿着垂直轴加深，存在尺寸为32×32和深度为1的编码单元620、尺寸为16×16和深度为2的编码单元630、尺寸为8×8和深度为3的编码单元640以及尺寸为4×4和深度为4的编码单元650。尺寸为4×4和深度为4的编码单元650是最小编码单元。

编码单元的预测单元和分区根据每个深度沿着水平轴被排列。换言之，如果尺寸为64×64和深度为0的编码单元610是预测单元，则可将预测单元划分成包括在编码单元610中的分区，即，尺寸为64×64的分区610、尺寸为64×32的分区612、尺寸为32×64的分区614或尺寸为32×32的分区616。

类似地，可将尺寸为32×32和深度为1的编码单元620的预测单元划分成包括在编码单元620中的分区，即，尺寸为32×32的分区620、尺寸为32×16的分区622、尺寸为16×32的分区624和尺寸为16×16的分区626。

类似地，可将尺寸为16×16和深度为2的编码单元630的预测单元划分成包括在编码单元630中的分区，即，包括在编码度单元630中的尺寸为16×16的分区630、尺寸为16×8的分区632、尺寸为8×16的分区634和尺寸为8×8的分区636。

类似地，可将尺寸为8×8和深度为3的编码单元640的预测单元划分成包括在编码单元640中的分区，即，包括在编码单元640中的尺寸为8×8的分区、尺寸为8×4的分区642、尺寸为4×8的分区644和尺寸为4×4的分区646。

尺寸为4×4和深度为4的编码单元650是最小编码单元并且是最低深度的编码单元。编码单元650的预测单元仅被指定为尺寸为4×4的分区。

为了确定构成最大编码单元610的编码单元的至少一个编码深度，视频编码设备100的分层编码器110对包括在最大编码单元610中的与每个深度相应的编码单元执行编码。

随着深度加深，包括具有相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量增加。例如，需要四个与深度2相应的编码单元来覆盖包括在与深度1相应的一个编码单元中的数据。因此，为了根据深度比较对相同数据进行编码的结果，与深度1相应的编码单元和四个与深度2相应的编码单元均被编码。

为了针对深度之中的当前深度执行编码，可沿着分层结构600的水平轴，通过对与当前深度相应的编码单元中的每个预测单元执行编码，来针对当前深度选择最小编码误差。可选地，随着深度沿着分层结构600的垂直轴加深，可通过针对每个深度执行编码，比较根据深度的最小编码误差，来搜索最小编码误差。在编码单元610中的具有最小编码误差的深度和分区可被选为编码单元610的编码深度和分区类型。

图7是用于描述根据本发明构思的示例性实施例的在编码单元710和变换单元720之间的关系的示图。

根据示例性实施例的视频编码设备100或视频解码设备200针对每个最大编码单元，根据具有小于或等于最大编码单元的尺寸的编码单元，对图像进行编码或解码。可基于不大于相应的编码单元的数据单元，来选择用于在编码期间进行变换的变换单元的尺寸。

例如，在根据示例性实施例的视频编码设备100或视频解码设备200中，如果编码单元710的尺寸是64×64，则可通过使用尺寸为32×32的变换单元720来执行变换。

此外，可通过对小于64×64的尺寸为32×32、16×16、8×8和4×4的每个变换单元执行变换，来对尺寸为64×64的编码单元710的数据进行编码，然后可选择具有最小编码误差的变换单元。

根据示例性实施例的视频编码设备100的输出单元130可对与编码深度相应的每个编码单元的关于分区类型的信息800、关于预测模式的信息810以及关于变换单元尺寸的信息820进行编码，并将信息800、信息810和信息820作为关于编码模式的信息来发送。

信息800指示关于通过划分当前编码单元的预测单元而获得的分区的形状的信息，其中，所述分区是用于对当前编码单元进行预测编码的数据单元。例如，可将尺寸为2N×2N的当前编码单元CU_0划分成以下分区中的任意一个：尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808。这里，关于分区类型的信息800被设置来指示尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808中的一个。

信息810指示每个分区的预测模式。例如，信息810可指示对由信息800指示的分区执行的预测编码的模式，即，帧内模式812、帧间模式814或跳过模式816。

信息820指示当对当前编码单元执行变换时所基于的变换单元。例如，变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826和第二帧内变换单元828中的一个。

根据示例性实施例的视频解码设备200的图像数据和编码信息提取器210可根据每个较深层编码单元，提取并使用用于解码的信息800、810和820。

划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分成更低深度的编码单元。

用于对深度为0和尺寸为2N_0×2N_0的编码单元900进行预测编码的预测单元910可包括以下分区类型的分区：尺寸为2N_0×2N_0的分区类型912、尺寸为2N_0×N_0的分区类型914、尺寸为N_0×2N_0的分区类型916和尺寸为N_0×N_0的分区类型918。图9仅示出了通过对称地划分预测单元910而获得的分区类型912至918，但是分区类型不限于此，并且预测单元910的分区可包括非对称分区、具有预定形状的分区和具有几何形状的分区。

根据每种分区类型，对尺寸为2N_0×2N_0的一个分区、尺寸为2N_0×N_0的两个分区、尺寸为N_0×2N_0的两个分区和尺寸为N_0×N_0的四个分区重复地执行预测编码。可对尺寸为2N_0×2N_0、N_0×2N_0、2N_0×N_0和N_0×N_0的分区执行帧内模式和帧间模式下的预测编码。可仅对尺寸为2N_0×2N_0的分区执行跳过模式下的预测编码。

如果在尺寸为2N_0×2N_0、2N_0×N_0、N_0×2N_0的分区类型912至916中的一个分区类型中编码误差最小，则可不将预测单元910划分到更低深度。

如果在尺寸为N_0×N_0的分区类型918中编码误差最小，则深度从0改变到1以在操作920中划分分区类型918，并对深度为2和尺寸为N_0×N_0的分区类型编码单元930重复地执行编码来搜索最小编码误差。

用于对深度为1和尺寸为2N_1×2N_1(＝N_0×N_0)的(分区类型)编码单元930进行预测编码的预测单元940可包括以下分区类型的分区：尺寸为2N_1×2N_1的分区类型942、尺寸为2N_1×N_1的分区类型944、尺寸为N_1×2N_1的分区类型946以及尺寸为N_1×N_1的分区类型948。

如果在尺寸为N_1×N_1的分区类型948中编码误差最小，则深度从1改变到2以在操作950中划分分区类型948，并对深度为2和尺寸为N_2×N_2的编码单元960重复执行编码来搜索最小编码误差。

当最大深度是d时，根据每个深度的划分操作可被执行直到深度变成d-1，并且划分信息可被编码直到深度是0到d-2中的一个。换句话说，当编码被执行直到在与d-2的深度相应的编码单元在操作970中被划分之后深度是d-1时，用于对深度为d-1和尺寸为2N_(d-1)×2N_(d-1)的编码单元980进行预测编码的预测单元990可包括以下分区类型的分区：尺寸为2N_(d-1)×2N(d-1)的分区类型992、尺寸为2N_(d-1)×N(d-1)的分区类型994、尺寸为N_(d-1)×2N(d-1)的分区类型996和尺寸为N_(d-1)×N(d-1)的分区类型998。

可对分区类型992至998中的尺寸为2N_(d-1)×2N_(d-1)的一个分区、尺寸为2N_(d-1)×N_(d-1)的两个分区、尺寸为N_(d-1)×2N_(d-1)的两个分区、尺寸为N_(d-1)×N_(d-1)的四个分区重复地执行预测编码，以搜索具有最小编码误差的分区类型。

即使当尺寸为N_(d-1)×N_(d-1)的分区类型998具有最小编码误差时，由于最大深度是d，因此深度为d-1的编码单元CU_(d-1)也不再被划分到更低深度，构成当前最大编码单元900的编码单元的编码深度被确定为d-1，并且当前最大编码单元900的分区类型可被确定为N_(d-1)×N(d-1)。此外，由于最大深度是d，因此不设置最小编码单元980的划分信息。

数据单元999可以是用于当前最大编码单元的“最小单元”。根据示例性实施例的最小单元可以是通过将最小编码单元980划分成4份而获得的矩形数据单元。通过重复地执行编码，视频编码设备100可通过比较根据编码单元900的深度的编码误差来选择具有最小编码误差的深度以确定编码深度，并将相应分区类型和预测模式设置为编码深度的编码模式。

这样，在所有深度1至d中对根据深度的最小编码误差进行比较，并且具有最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型和预测模式可作为关于编码模式的信息被编码并发送。另外，由于编码单元从0的深度被划分到编码深度，因此仅编码深度的划分信息被设置为0，并且除了编码深度以外的深度的划分信息被设置为1。

根据示例性实施例的视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元900的编码深度和预测单元的信息，来对分区912进行解码。根据示例性实施例的视频解码设备200可通过使用根据深度的划分信息，将划分信息为0的深度确定为编码深度，并且使用关于相应深度的编码模式的信息来进行解码。

编码单元1010是最大编码单元中的与由视频编码设备100确定的编码深度相应的具有树结构的编码单元。预测单元1060是每个编码单元1010中的预测单元的分区，变换单元1070是每个编码单元1010的变换单元。

当在编码单元1010中最大编码单元的深度是0时，编码单元1012和编码单元1054的深度是1，编码单元1014、1016、1018、1028、1050和1052的深度是2，编码单元1020、1022、1024、1026、1030、1032和1048的深度是3，编码单元1040、1042、1044和1046的深度是4。

在预测单元1060中，通过划分编码单元来获得一些编码单元1014、1016、1022、1032、1048、1050、1052和1054。换句话说，编码单元1014、1022、1050和1054中的分区类型的尺寸是2N×N，编码单元1016、1048和1052中的分区类型的尺寸是N×2N，编码单元1032的分区类型的尺寸是N×N。编码单元1010的预测单元和分区小于或等于每个编码单元。

在小于编码单元1052的数据单元中的变换单元1070中，对编码单元1052的图像数据执行变换或逆变换。另外，在尺寸和形状方面，变换单元1070中的编码单元1014、1016、1022、1032、1048、1050、1052和1054不同于预测单元1060中的编码单元1014、1016、1022、1032、1048、1050、1052和1054。换句话说，视频编码设备100和视频解码设备200可对同一编码单元中的数据单元独立地执行帧内预测、运动估计、运动补偿、变换和逆变换。

因此，对最大编码单元的每个区域中的具有分层结构的每个编码单元递归地执行编码来确定最优编码单元，从而可获得具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。表1示出可由视频编码设备100和视频解码设备200设置的编码信息。

[表1]

根据示例性实施例的视频编码设备100的熵编码器120可输出关于具有树结构的编码单元的编码信息，根据示例性实施例的视频解码设备200的熵解码器220可从接收到的比特流提取关于具有树结构的编码单元的编码信息。

划分信息指示是否将当前编码单元划分成更低深度的编码单元。如果当前深度d的划分信息是0，则当前编码单元不再被划分成更低深度的深度是编码深度，从而可针对所述编码深度来定义关于分区类型、预测模式和变换单元的尺寸的信息。如果当前编码单元根据划分信息被进一步划分，则对更低深度的四个划分编码单元独立地执行编码。

预测模式可以是帧内模式、帧间模式和跳过模式中的一种。可针对所有分区类型定义帧内模式和帧间模式，仅针对尺寸为2N×2N的分区类型定义跳过模式。

关于分区类型的信息可指示通过对称地划分预测单元的高度或宽度而获得的尺寸为2N×2N、2N×N、N×2N和N×N的对称分区类型，以及通过非对称地划分预测单元的高度或宽度而获得的尺寸为2N×nU、2N×nD、nL×2N和nR×2N的非对称分区类型。可通过按1:n和n:1(其中，n是大于1的整数)来划分预测单元的高度来分别获得尺寸为2N×nU和2N×nD的非对称分区类型，可通过按1:n和n:1来划分预测单元的宽度来分别获得尺寸为nL×2N和nR×2N的非对称分区类型。

可将变换单元的尺寸设置成帧内模式下的两种类型和帧间模式下的两种类型。换句话说，如果变换单元的划分信息是0，则变换单元的尺寸可以是2N×2N，即当前编码单元的尺寸。如果变换单元的划分信息是1，则可通过对当前编码单元进行划分来获得变换单元。另外，如果尺寸为2N×2N的当前编码单元的分区类型是对称分区类型时，则变换单元的尺寸可以是N×N，如果当前编码单元的分区类型是非对称分区类型，则变换单元的尺寸可以是N/2×N/2。

根据示例性实施例的关于具有树结构的编码单元的编码信息可包括与编码深度相应的编码单元、预测单元和最小单元中的至少一个。与编码深度相应的编码单元可包括包含相同编码信息的预测单元和最小单元中的至少一个。

因此，通过比较邻近数据单元的编码信息来确定邻近数据单元是否被包括在与编码深度相应的同一编码单元中。另外，通过使用数据单元的编码信息来确定与编码深度相应的相应编码单元，并因此可确定最大编码单元中的编码深度的分布。

因此，如果基于邻近数据单元的编码信息来对当前编码单元进行预测，则可直接参考并使用与当前编码单元邻近的较深层编码单元中的数据单元的编码信息。

可选地，如果基于邻近数据单元的编码信息来对当前编码单元进行预测，则使用数据单元的编码信息来搜索与当前编码单元邻近的数据单元，并可参考搜索到的邻近编码单元以对当前编码单元进行预测。

最大编码单元1300包括编码深度的编码单元1302、1304、1306、1312、1314、1316和1318。这里，由于编码单元1318是编码深度的编码单元，因此划分信息可以被设置成0。可将关于尺寸为2N×2N的编码单元1318的分区类型的信息设置成以下分区类型中的一种：尺寸为2N×2N的分区类型1322、尺寸为2N×N的分区类型1324、尺寸为N×2N的分区类型1326、尺寸为N×N的分区类型1328、尺寸为2N×nU的分区类型1332、尺寸为2N×nD的分区类型1334、尺寸为nL×2N的分区类型1336以及尺寸为nR×2N的分区类型1338。

当分区类型被设置成对称(即，分区类型1322、1324、1326或1328)时，如果变换单元的划分信息(TU尺寸标记)是0，则设置尺寸为2N×2N的变换单元1342，如果TU尺寸标记是1，则设置尺寸为N×N的变换单元1344。

当分区类型被设置成非对称(例如，分区类型1332、1334、1336或1338)时，如果TU尺寸标记是0，则设置尺寸为2N×2N的变换单元1352，如果TU尺寸标记是1，则设置尺寸为N/2×N/2的变换单元1354。

TU尺寸标记是一类变换索引；与变换索引相应的变换单元的尺寸可根据编码单元的预测单元类型或分区类型而改变。

当分区类型被设置成对称(即，分区类型1322、1324、1326或1328)时，如果变换单元的TU尺寸标记是0，则设置尺寸为2N×2N的变换单元1342，如果TU尺寸标记是1，则设置尺寸为N×N的变换单元1344。

当分区类型被设置成非对称(例如，分区类型1332(2N×nU)、1334(2N×nD)、1336(nL×2N)或1338(nR×2N))时，如果TU尺寸标记是0，则设置尺寸为2N×2N的变换单元1352，如果TU尺寸标记是1，则设置尺寸为N/2×N/2的变换单元1354。

参照图9，上述的TU尺寸标记是具有值0或1的标记，但是TU尺寸标记不限于1比特，在TU尺寸标记从0增加的同时，变换单元可被分层划分。变换单元的划分信息(TU尺寸标记)可被用作变换索引的示例。

在这种情况下，当根据示例性实施例的TU尺寸标记与变换单元的最大尺寸和最小尺寸一起被使用时，实际上已使用的变换单元的尺寸可被表示。视频编码设备100可对最大变换单元尺寸信息、最小变换单元尺寸信息和最大变换单元划分信息进行编码。编码后的最大变换单元尺寸信息、最小变换单元尺寸信息和最大变换单元划分信息可被插入序列参数集(SPS)。根据示例性实施例的视频解码设备200可使用最大变换单元尺寸信息、最小变换单元尺寸信息和最大变换单元划分信息以进行视频解码。

例如，(a)如果当前编码单元的尺寸是64×64并且最大变换单元尺寸是32×32，则(a-1)如果TU尺寸标记为0，则变换单元的尺寸可以是32×32，(a-2)如果TU尺寸标记为1，则变换单元的尺寸可以是16×16，(a-3)如果TU尺寸标记为2，则变换单元的尺寸可以是8×8。

可选地，(b)如果当前编码单元的尺寸是32×32并且最小变换单元尺寸是32×32，则(b-1)如果TU尺寸标记为0，则变换单元的尺寸可以是32×32，由于变换单元的尺寸不能够小于32×32，因此不能够设置更多的TU尺寸标记。

可选地，(c)如果当前编码单元的尺寸是64×64并且最大TU尺寸标记为1，则TU尺寸标记可以是0或1，不能够设置更多的TU尺寸标记。

因此，当定义最大TU尺寸标记为“MaxTransformSizeIndex”，最小TU尺寸标记为“MinTransformSize”，并定义TU尺寸标记为0时的变换单元(即，基本变换单元RootTu)的尺寸为“RootTuSize”，则可通过下面的等式(1)来定义可在当前编码单元中可用的当前最小变换单元尺寸“CurrMinTuSize”：

CurrMinTuSize

…(1)

＝max(MinTransformSize,RootTuSize/(2^∧MaxTransformSizeIndex))

与在当前编码单元中可用的最小变换单元尺寸“CurrMinTuSize”相比，作为当TU尺寸标记为0时的变换单元的尺寸，基本变换单元尺寸“RootTuSize”可指示可在系统中选择的最大变换单元尺寸。也就是说，根据等式(1)，“RootTuSize/(2∧MaxTransformSizeIndex)”是通过将作为当TU尺寸标记为0时的变换单元的尺寸的“RootTuSize”划分了与最大变换单元划分信息相应的划分次数时的变换单元尺寸，“MinTransformSize”是最小变换尺寸，因此，“RootTuSize/(2^MaxTransformSizeIndex)”和“MinTransformSize”中较小的值可以是可在当前编码单元中可用的最小变换单元尺寸“CurrMinTuSize”。

根据示例性实施例的基本变换单元尺寸“RootTuSize”可根据预测模式而改变。

例如，如果当前预测模式是帧间模式，则可通过使用以下的等式(2)来确定“RootTuSize”。在等式(2)中，“MaxTransformSize”指示最大变换单元尺寸，“PUSize”指示当前预测单元尺寸：

RootTuSize＝min(MaxTransformSize,PUSize)……(2)

换句话说，如果当前预测模式是帧间模式，则在TU尺寸标记为0的情况下的变换单元的基本变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前预测单元尺寸中较小的值。

如果当前分区单元的预测模式是帧内模式，则可通过使用以下的等式(3)来确定“RootTuSize”。“PartitionSize”指示当前分区单元的尺寸：

RootTuSize＝min(MaxTransformSize,PartitionSize)……(3)

换句话说，如果当前预测模式是帧内模式，则基本变换单元尺寸“RootTuSize”可被设置为最大变换单元尺寸和当前分区单元的尺寸之中较小的值。

然而，应该注意，作为根据示例性实施例的当前最大变换单元尺寸并根据分区单元的预测模式而改变的基本变换单元尺寸“RootTuSize”是示例，用于确定当前最大变换单元尺寸的因素不限于此。

同时，根据示例性实施例的视频编码设备100和视频解码设备200可执行无损编码和解码，由于在无损编码和解码中绕过量化，因此设定量化的上下文级别的变换系数编码方法可能会引起低的效率。

例如，当对空间残差数据执行频率变换(例如，DCT(离散余弦变换))时，空间残差数据在高频区域具有非常小的值，因此大部分空间残差数据可被量化为0。因此，可通过仅对有效变换系数进行编码来提高压缩效率。然而，由于在无损编码和解码中不执行量化，在高频区域还可能存在更多的有效变换系数，尽管是很小的值。例如，如果量化被执行，则有效变换系数的最后位置可接近于变换单元的低频区域。然而在不执行量化的无损编码中，有效变换系数的最后位置可接近于高频区域。因此，当如在现有技术中将有效变换系数的最后位置确定为基于低频区域中的距离的语法元素时，有效变换系数的值是大的。因此，通过使用以下参照图14a至图18描述的方法来解决这样的问题。可选地，如果在不进行频率变换的情况下直接执行编码，则残差数据也可存在于与高频区域相应的位置，因此，最后位置信息接近于高频区域的概率甚至会更高。

另外，由于在无损编码中不执行量化，因此对与变换单元相关的预定语法元素(诸如子块标记(coded_sub_block_flag)、有效图、第一临界值标记(coeff_abs_level_greater1_flag)、第二临界值标记(coeff_abs_level_greather2_flag)或变换系数的大小信息(coeff_abs_level_remaining))进行编码和发送可能是低效的，其中，子块标记(coded_sub_block_flag)指示子块的所有变换系数是否为0，有效图指示非0变换系数的位置，第一临界值标记(coeff_abs_level_greater1_flag)指示变换系数是否大于1，第二临界值标记(coeff_abs_level_greather2_flag)指示变换系数是否大于2，变换系数的大小信息(coeff_abs_level_remaining)与基于第一临界值标记和第二临界值标记确定的基本级别(baseLevel)与实际变换系数(abscoeff)之间的差相应。因此，根据示例性实施例的视频编码设备100和视频解码设备200可省略关于获得、编码和发送上述与变换单元相关的语法元素的方法的操作。

以下，将详细描述由图1的视频编码设备100的熵编码器120执行的对有效变换系数的最后位置进行编码的处理和由图2的视频解码设备200的熵解码器220执行的对有效变换系数的最后位置进行解码的处理。

图14a是示出根据示例性实施例的用于在无损编码中对有效变换系数或有效残差数据的最后位置进行编码的设备的框图。

在图14a中示出的用于对有效变换系数或残差数据的最后位置进行编码的设备(以下，“最后位置编码设备1400”)中，仅示出与本示例性实施例相关的元件。因此，对于本领域的普通技术人员来说将明显的是除了在图14a中示出的元件之外还可包括其它通用元件。最后位置编码设备1400与图1的视频编码设备100的熵编码器120相应。

参照图14a，根据示例性实施例的最后位置编码设备1400可包括扫描器1410、最后位置确定器1420、位置信息确定器1430和编码器1440。

根据示例性实施例的扫描器1410可按照预定顺序从变换单元的第一点到第二点执行扫描，从而获得包括在变换单元中的变换系数。第一点可以是变换单元的低频位置，第二点可以是变换单元的高频位置。因此，第一点可以是变换单元的左上角，第二点可以是变换单元的右下角。另外，变换单元可以是被执行了DCT(离散余弦变换)的残差数据。

根据示例性实施例的最后位置确定器1420可确定包括在编码单元中的系数之中的非0有效变换系数的最后位置。

根据示例性实施例的位置信息确定器1430可与确定的最后位置相应的相对于第二点的位置信息。位置信息可以是与从第二点到确定的最后位置的距离相应的值。也就是说，位置信息可以是与确定的最后位置相应的相对于作为原点的第二点的坐标值。这里，位置信息可相应于上述的语法元素。

根据示例性实施例的编码器1440可对确定的位置信息进行编码。为了对位置信息进行编码，可使用上述的熵编码。

以下，将参照图14b详细描述图14a的最后位置编码设备1400的操作。

图14b是根据示例性实施例的在无损编码中对有效变换系数的最后位置进行编码的方法的流程图。

参照图14b，

在操作1415，根据示例性实施例的扫描器1410按照预定顺序执行从变换单元的第一点到第二点的扫描，从而获得包括在变换单元中的变换系数。这里，变换单元可具有与编码单元的尺寸相同的尺寸。

例如，图15示出获得包括在变换单元中的变换系数的示例。虽然图15示出了尺寸为16×16的变换单元1500，但是变换单元2000的尺寸不限于示出的16×16，而可以是各种尺寸，诸如4×4至32×32。

参照图15，为了对包括在变换单元1500中的变换系数进行熵编码和解码，变换单元1500可被划分为更小尺寸的变换单元。首先，根据示例性实施例的扫描器1410可按照示出的顺序(之字形扫描)执行从第一点1501至第二点1502的扫描，从而获得包括在变换单元1500中的变换系数。虽然图15示出对变换单元1501执行扫描的示例，但是还可按照图15中示出的顺序针对每个更小尺寸(例如，4×4)的变换单元执行变换系数的扫描。

再次参照图14b，在操作1425，根据示例性实施例的最后位置确定器1420可确定包括在变换单元中的系数之中的非0有效变换系数的最后位置。也就是说，在扫描顺序上在最后位置之后的所有变换系数都是0。例如，1510可以是获得的有效变换系数的最后位置。当最后位置被确定时，根据示例性实施例的编码设备100可按照与扫描顺序相反的顺序对包括在变换单元中的变换系数进行编码。因此，可绕过对从第二位置1502至最后位置1510的变换系数的编码。

同时，根据现有技术，最后位置相对于第一点1501的位置信息在不改变的情况下被熵编码。例如，如果最后有效变换系数的位置是(x,y)(其中，x和y是整数)，则可对作为表示(x,y)的坐标值的语法元素的last_significant_coeff_x1511和last_significant_coeff_y1512进行熵编码和解码。

另外，可将如图16的表1600中示出的比特分配给被熵编码的最后位置处的语法元素。

参照图16，与有效变换系数的最后位置相应的值越大，则根据上下文模型分配的比特数量就越大，导致了为熵编码而固定的二进制值的增大。

由于在无损编码和解码中不执行量化，因此在高频区域(图15的右下端)上可存在更多的有效变换系数，即使是很小的值。因此，有效变换系数的最后位置(图15的1510)接近于高频区域1502的概率很高。也就是说，当执行量化时，有效变换系数的最后位置可位于接近于变换单元的低频区域1501之处，而在不执行量化的无损编码中，有效变换系数的最后位置可接近于变换单元的高频区域1502。可选地，如果不执行频率变换，则存在非0的残差数据存在于与高频区域相应的位置处的概率，因此，最后位置可接近于高频区域。

然而，由于根据如上所述的现有技术，有效变换系数的最后位置的位置信息是基于低频区域1501被确定的，因此在无损编码中最后位置的值总是很大。也就是说，对最后位置进行编码所需的比特长度增加。

因此，在操作1435，根据示例性实施例的位置信息确定器1430可确定与确定的最后位置相应的相对于第二点1502的位置信息。在操作1445，根据示例性实施例的编码器1446可对确定的位置信息进行编码。

例如，图17示出根据示例性实施例的确定与有效变换系数的最后位置相应的语法元素的示例。

参照图17，相对于第二点1702的Last_x_rev、Last_x_rev可被确定为与有效变换系数的最后位置相应的语法元素。

也就是说，当相对于第一点1701确定的与最后位置1710相应的坐标(x,y)为

(x,y)＝(last_significant_coeff_x,last_significant_coeff_y_)，

可如下确定针对于第二点1702编码的与最后位置相应的坐标(Last_x_rev,Last_x_rev)。

(Last_x_rev,Last_x_rev)＝(tsize-1-last_significant_coeff_x,tsize-1-last_significant_coeff_y)

这里，tsize可表示编码单元的水平大小或垂直大小。

通过使用上述方法，在无损编码中，对最后位置进行编码而分配的比特数量可被减少。

同时，根据另一示例性实施例，在视频编码和解码中可不总是应用确定与上述的有效变换系数的最后位置相应的相对于第二点的位置信息的方法，而是可通过将从第一点到最后位置的距离与从第二点到最后位置的距离进行比较来选择性地应用上述方法。

图14c是根据示例性实施例的在无损编码中对有效残差数据的最后位置进行编码的方法的流程图。

图14c示出根据示例性实施例的在无损编码中绕过变换和量化两者从而对残差数据本身进行熵编码的示例性实施例。相比于图14b，由于差别仅在于输入的是绕过变换的编码单元的残差数据而不是变换单元的变换系数，因此将仅关注于对于差别的描述。

在操作1416，根据示例性实施例的扫描器1410可按照预定顺序执行从编码单元的第一点到第二点的扫描，从而获得包括在编码单元中的残差数据。

这里，第一点可以是编码单元的左上角，第二点可以是编码单元的右下角。同时，如果变换被绕过，则在编码单元中不存在高频区域；然而，根据本示例性实施例，残差数据可被视为图18b的变换系数，并被处理，因此，当假设执行变换时，第一点可相应于与编码单元的低频位置相应的位置，第二点可相应于与编码单元的高频位置相应的位置。

在操作1426，根据示例性实施例的最后位置确定器1420可确定包括在编码单元的系数之中的非0的残差数据的最后位置。

在操作1436，根据示例性实施例的位置信息确定器1430可确定与确定的最后位置相应的相对于第二点1502的位置信息。此外，在操作1446，根据示例性实施例的编码器1440可对确定的位置信息进行编码。

图18a是示出根据示例性实施例的用于在无损编码中对有效变换系数或有效残差数据的最后位置进行解码的设备的框图。图18b是根据示例性实施例的在无损编码中对有效变换系数的最后位置进行解码的方法的流程图。图18c是根据示例性实施例的在无损编码中对有效残差数据的最后位置进行解码的方法的流程图。

在图18a中示出的用于对有效变换系数或有效残差数据的最后位置进行解码的设备(以下，“最后位置解码设备1800”)中，仅示出与本示例性实施例相关的元件。因此，对于本领域的普通技术人员来说将明显的是除了图18a中示出的元件之外还可包括其它通用元件。最后位置解码设备1800与图2的视频解码设备200的熵解码器220相应。最后位置解码设备1800执行由上述最后位置编码设备1400执行的编码处理的反向处理。因此，对于本领域的普通技术人员来说将明显的是虽然在以下未描述，但是执行由最后位置编码设备1400执行的编码处理的反向处理所需的操作还可被执行。

参照图18a，可包括位置信息获得单元1810和最后位置确定器1820。

以下，将参照图18b详细描述最后位置解码设备1800的操作的示例。

在操作1815，根据示例性实施例的位置信息获得单元1810可从比特流获得与包括在变换单元中的有效变换系数的最后位置相应的位置信息。获得的位置信息可以是与编码单元的高频区域和最后位置之间的距离相应的值。也就是说，位置信息获得单元1810可获得相对于上述的第二点(图15的1520、图17的1720)而编码的语法元素。

在操作1825，根据示例性实施例的最后位置确定器1520可基于获得的位置信息来确定最后位置。例如，当图17中的位置信息获得单元1810获得了作为位置信息的(Last_x_rev,Last_y_rev)时，与最后位置1710相应的坐标(x,y)可相对于第一点1701被如下重建。

(x,y)＝(tsize-1-Last_x_rev,tsize-1-Last_y_rev)

随后，根据示例性实施例的视频解码设备200可从获得的最后位置开始对包括在变换单元中的变换系数进行解码。

以下，将参照图18c详细描述最后位置解码设备1800的操作的另一示例。

图18c示出在无损编码中通过绕过变换和量化两者来对残差数据本身进行熵解码的示例性实施例。相比于图18b，由于差别仅在于通过对比特流进行解码而将获得的数据是绕过了变换的残差数据，而不是有效变换系数，因此将仅关注于对差别的描述。

在操作1816，根据示例性实施例的位置信息获得单元1810可从比特流获得与包括在编码单元中的有效残差数据的最后位置相应的位置信息。获得的位置信息可以是与编码单元的高频区域所对应的位置和最后位置之间的距离相应的值。也就是说，如果绕过变换，则在编码单元中不存在高频区域；然而根据本示例性实施例的残差数据可被视为图18b的变换系数，并被处理，因此，与从高频区域所对应的位置到有效残差数据的最后位置的距离相应的值可被编码为位置信息。

在操作1826，根据示例性实施例的最后位置确定器1520可基于获得的位置信息来确定最后位置。

如上所述，根据基于示例性实施例的对有效变换系数的最后位置进行编码和解码的方法，在无损编码中与有效变换系数的最后位置相应的熵编码的编码大小可被减小，并且编码和解码的速度可被提高。

本发明构思还可被实现为计算机可读记录介质上的计算机可读代码。计算机可读记录介质是可存储可在其后由计算机系统读取的数据的任何数据存储装置。计算机可读记录介质的示例包括只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘、光学数据存储装置等。此外，计算机可读记录介质还可分布在联网的计算机系数上，从而计算机可读代码按分布式方式被存储和执行。

虽然已参照本发明构思的优选示例性实施例对本发明构思具体地示出和描述，但是本领域技术人员将理解，可在不脱离由权利要求限定的本发明构思的精神和范围的情况下，在其中进行形式和细节上的各种改变。优选的示例性实施例应该被视为仅是说明性意义，而不是为了限制的目的。因此，本发明构思的范围不是由本发明构思的详细描述所限定，而是由权利要求所限定，该范围内的所有差别将被解释为包括在本发明构思中。

Claims

1.一种在无损编码中用于对有效变换系数的最后位置进行编码的编码方法，所述编码方法包括：

按预定顺序执行从编码单元的第一点到第二点的扫描，以获得包括在编码单元中的变换系数；

确定包括在编码单元中的变换系数之中的非0的有效变换系数的最后位置；

确定与确定的最后位置相应的相对于第二点的位置信息；

对确定的位置信息进行编码。

2.如权利要求1所述的编码方法，其中，所述位置信息是与从第二点到确定的最后位置的距离相应的值。

3.如权利要求2所述的编码方法，其中，所述位置信息是与确定的最后位置相应的相对于作为原点的第二点的坐标值。

4.如权利要求1所述的编码方法，其中，第一点是编码单元的左上角，第二点是编码单元的右下角。

5.如权利要求1所述的编码方法，其中，第一点是编码单元的低频位置，第二点是编码单元的高频位置或是与编码单元的高频位置相应的位置。

6.一种在无损编码中用于对有效变换系数的最后位置进行解码的解码方法，所述解码方法包括：

从比特流获得与包括在编码单元中的有效变换系数的最后位置相应的位置信息；

基于获得的位置信息确定所述最后位置，

其中，获得的位置信息是与从编码单元的高频区域到所述最后位置的距离相应的值。

7.如权利要求6所述的解码方法，其中，所述位置信息是与所述最后位置相应的以编码单元的右下角作为原点的坐标值。

8.一种计算机可读记录介质，其中，在所述计算机可读记录介质上记录用于执行如权利要求1所述的编码方法的程序。

9.一种计算机可读记录介质，其中，在所述计算机可读记录介质上记录用于执行如权利要求6所述的解码方法的程序。

10.一种在无损编码中用于对有效变换系数的最后位置进行编码的编码设备，所述编码设备包括：

扫描器，被配置为按预定顺序执行从编码单元的第一点到第二点的扫描，以获得包括在编码单元中的变换系数；

最后位置确定器，被配置为确定包括在编码单元中的变换系数之中的非0的有效变换系数的最后位置；

位置信息确定器，被配置为确定与确定的最后位置相应的相对于第二点的位置信息；

编码器，被配置为对确定的位置信息进行编码。

11.如权利要求10所述的编码设备，其中，所述位置信息是与从第二点到确定的最后位置的距离相应的值。

12.一种在无损编码中用于对有效变换系数的最后位置进行解码的解码设备，所述解码设备包括：

位置信息获得单元，被配置为从比特流获得与包括在编码单元中的有效变换系数的最后位置相应的位置信息；

最后位置确定器，被配置为基于获得的位置信息确定有效变换系数的最后位置，

13.一种在无损编码中用于对有效变换系数的最后位置进行编码的编码方法，所述编码方法包括：

按预定顺序执行从编码单元的第一点到第二点的扫描，以获得包括在编码单元中的残差数据；

确定包括在编码单元中的残差数据之中的非0的有效残差数据的最后位置；

确定与确定的最后位置相应的相对于第二点的位置信息；

对确定的位置信息进行编码。

14.一种在无损编码中用于对有效残差数据的最后位置进行解码的解码方法，所述解码方法包括：

从比特流获得与包括在编码单元中的有效残差数据的最后位置相应的位置信息；

基于获得的位置信息确定所述最后位置，