CN104904202A

CN104904202A - 用于使用参考画面信息进行并行视频编码的方法和设备以及用于使用参考画面信息进行并行视频解码的方法和设备

Info

Publication number: CN104904202A
Application number: CN201380062307.8A
Authority: CN
Inventors: 朴永五; 崔光杓; 金赞烈; 崔秉斗; 鲁元宇; 金京儿; 金德镐; 金敃宇
Original assignee: Samsung Electronics Co Ltd; Industry Academic Cooperation Foundation of Yonsei University
Current assignee: Samsung Electronics Co Ltd; Industry Academic Cooperation Foundation of Yonsei University
Priority date: 2012-09-28
Filing date: 2013-09-30
Publication date: 2015-09-09
Also published as: WO2014051409A1; US20150288970A1; KR20140052831A

Abstract

提供一种用于并行处理的视频编码方法。所述视频编码方法包括：对画面组(GOP)中包括的画面执行帧间预测和帧内预测，并确定GOP中包括的画面之间的编码顺序和参考依赖关系；产生包括参考关系信息的预定数据单元，其中，参考关系信息是基于GOP中包括的画面之间的所述编码顺序和参考依赖关系而产生的。

Description

用于使用参考画面信息进行并行视频编码的方法和设备以及用于使用参考画面信息进行并行视频解码的方法和设备

技术领域

一个或更多个示例性实施例涉及视频的并行编码和并行解码方案。

背景技术

最近，随着数字显示技术的发展以及高质量数字TV的广泛使用，提出了用于处理大量视频数据的新编解码器。另外，最近，随着硬件性能的发展，用于执行视频图像处理的CPU或GPU被形成为多核，从而允许同时进行并行图像数据处理。

发明内容

一个或更多个示例性实施例包括将关于画面之间的参考关系的信息包括在预定数据传输单元中以被发送。

另外的方面将在随后的描述中部分地被阐述，并且部分将通过所述描述变得清楚，或者可通过所提出的示例性实施例的实践而被获知。

根据一个或更多个示例性实施例，一种用于并行处理的视频编码方法包括：对画面组(GOP)中包括的画面执行帧间预测和帧内预测，并确定GOP中包括的画面之间的编码顺序和参考依赖关系；产生包括参考关系信息的预定数据单元，其中，参考关系信息是基于GOP中包括的画面之间的编码顺序和参考依赖关系而产生的。

根据一个或更多个示例性实施例，一种用于并行处理的视频编码设备包括：图像编码器，对画面组(GOP)中包括的画面执行帧间预测和帧内预测，并确定GOP中包括的画面之间的编码顺序和参考依赖关系；输出单元，产生包括参考关系信息的预定数据单元，其中，参考关系信息是基于GOP中包括的画面之间的编码顺序和参考依赖关系而产生的。

根据一个或更多个示例性实施例，一种用于并行处理的视频解码方法包括：获得包括参考关系信息的预定数据单元，其中，参考关系信息是基于画面组(GOP)中包括的画面之间的解码顺序和参考依赖关系而产生的；基于所述数据单元中包括的参考关系信息，在GOP中包括的画面之中确定可被并行处理的画面；对确定的画面进行并行解码。

根据一个或更多个示例性实施例，一种用于并行处理的视频解码设备包括：接收器，获得包括参考关系信息的预定数据单元，其中，参考关系信息是基于画面组(GOP)中包括的画面之间的解码顺序和参考依赖关系而产生的；图像解码器，基于所述数据单元中包括的参考关系信息，在GOP中包括的画面之中确定可被并行处理的画面，并且对确定的画面进行并行解码。

附图说明

从以下结合附图对示例性实施例的描述，这些和/或其它方面将变得明显和更易于理解，其中：

图1是根据本发明的实施例的基于树结构的编码单元的视频编码设备的框图。

图2是根据本发明的实施例的基于树结构的编码单元的视频解码设备的框图。

图3示出根据本发明的实施例的编码单元的构思。

图4是根据本发明的实施例的基于编码单元的图像编码器的框图。

图5是根据本发明的实施例的基于编码单元的图像解码器的框图。

图6示出根据本发明的实施例的根据深度的编码单元以及分区。

图7示出根据本发明的实施例的编码单元和变换单元之间的关系。

图8示出根据本发明的实施例的根据深度的编码信息。

图9示出根据本发明的实施例的根据深度的编码单元。

图10、图11和图12示出根据本发明的实施例的编码单元、预测单元和变换单元之间的关系。

图13示出根据表1的编码模式信息的编码单元、预测单元和变换单元之间的关系。

图14是根据本发明的实施例的用于并行处理的视频编码设备的框图。

图15示出根据本发明的实施例的NAL单元的类型。

图16示出根据本发明的实施例的分层GOP结构。

图17示出用于图16的分层GOP结构中所包括的画面的参考依赖树(RDT)。

图18是示出根据本发明的实施例的用于并行处理的视频编码方法的流程图。

图19是根据本发明的实施例的用于并行处理的视频解码设备的框图。

图20是示出根据本发明的实施例的用于并行处理的视频解码方法的流程图。

图21示出根据本发明的实施例的用于并行处理的多线程程序。

图22示出多线程程序中的使用锁(lock)或信号量(semaphore)的线程执行处理。

图23是示出根据本发明的实施例的多线程程序的同步处理的流程图。

具体实施方式

现在将详细描述附图中示出的示例性实施例，其中，相同的参考标号始终指示相同元件。在这方面，本示例性实施例可具有不同形式，且不应被解释为受限于在此阐述的描述。因此，在下面仅通过参照附图描述示例性实施例来解释本描述的各个方面。当诸如“…中的至少一个”在一列元件之后时，修饰整列元件，而不修饰所述列中的单个元件。

在下文中，将参照图1至图13来描述根据本发明的实施例的基于树结构的编码单元的视频编码方案和视频解码方案。另外，将参照图14至图23来描述根据本发明的实施例的用于并行处理的对视频进行编码和解码的方案。

首先，将参照图1至图13来描述基于树结构的编码单元的视频编码方案和视频解码方案。

图1是根据本发明的实施例的基于树结构的编码单元的视频编码设备100的框图。

根据本发明的实施例的涉及基于根据树结构的编码单元的视频预测的视频编码设备100包括最大编码单元划分器110、编码单元确定器120和输出单元130。在下文中，为便于解释，根据本发明的实施例的涉及基于根据树结构的编码单元的视频预测的视频编码设备100将被称为视频编码设备100。

最大编码单元划分器110可基于图像的当前画面的最大编码单元来获得当前画面，其中，最大编码单元是最大尺寸的编码单元。如果当前画面大于最大编码单元，则可将当前画面的图像数据划分为至少一个最大编码单元。根据本发明的实施例的最大编码单元可以是诸如32×32、64×64、128×128或256×256的数据单元，并且可以是长度和宽度的尺寸为2的若干次方的正方形的数据单元。图像数据可通过至少一个最大编码单元被输出到编码单元确定器120。

根据本发明的实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元被空间划分的次数，并且随着深度加深，根据深度的编码单元可从最大编码单元被划分到最小编码单元。最大编码单元的深度为最高深度，最小编码单元可被定义为最低层的编码单元。针对最大编码单元，随着深度加深，根据深度的编码单元的尺寸减小，因此更高深度的编码单元可包括多个更低深度的编码单元。

如上所述，当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单元，并且每个最大编码单元可包括根据深度被划分的编码单元。根据深度对根据本发明的实施例的最大编码单元进行划分，因此可根据深度对包括在最大编码单元中的空间域的图像数据进行分层分类。

可预先设置编码单元的最大尺寸和最大深度，其中，所述最大深度限制对最大编码单元的高度和宽度进行分层划分的总次数。

编码单元确定器120对通过根据深度对最大编码单元的区域进行划分而获得的至少一个划分区域进行编码，以根据至少一个划分区域来确定输出最终编码结果的深度。也就是说，编码单元确定器120针对当前画面的每个最大编码单元以根据深度的编码单元对图像数据进行编码，并选择产生最小编码误差的深度，来确定编码深度。将根据最大编码单元的图像数据以及确定的编码深度输出到输出单元130。

根据小于最大深度的至少一个深度，基于根据深度的编码单元对最大编码单元中的图像数据进行编码，并且，对基于根据深度的编码单元的编码结果进行比较。作为根据深度的编码单元中的编码误差的结果，可选择具有最小编码误差的深度。可针对各个最大编码单元确定至少一个编码深度。

通过随着深度加深而对编码单元进行分层划分，最大编码单元的尺寸被划分，并且编码单元的数量增加。另外，即使对于包括在一个最大编码单元中的相同深度的编码单元，仍测量针对各个数据的编码误差，并确定是否将编码单元划分到更低深度。因此，即使包括在一个最大编码单元中的数据也会根据位置而具有不同的基于深度的编码误差，并因此编码深度可被不同地确定。因此，可针对一个最大编码单元设置一个或更多个深度，并且可根据一个或更多个编码深度的编码单元来对最大编码单元的数据进行划分。

因此，根据发明的实施例的编码单元确定器120可确定包括在当前最大编码单元中的根据树结构的编码单元。根据本发明的实施例的根据树结构的编码单元包括在当前最大编码单元中所包括的所有深度的编码单元之中的被确定为编码深度的深度的编码单元。可根据最大编码单元的相同区域中的深度分层地确定编码深度的编码单元，并可在最大编码单元中的其它区域中独立地确定编码深度的编码单元。类似地，当前区域的编码深度可独立于其它区域的编码深度被确定。

根据本发明的实施例的最大深度是与从最大编码单元到最小编码单元的划分次数相关的索引。根据本发明的实施例的第一最大深度可表示从最大编码单元到最小编码单元的划分总次数。根据本发明的实施例的第二最大深度可表示从最大编码单元到最小编码单元的深度等级的总数。例如，当最大编码单元的深度是0时，对最大编码单元划分一次的编码单元的深度可被确定为1，对最大编码单元划分两次的编码单元的深度可被确定为2。这里，如果从最大编码单元划分四次的编码单元是最小编码单元，则存在深度0、1、2、3和4的深度等级，并因此第一最大深度可被设置为4，第二最大深度可被设置为5。

可执行最大编码单元的预测编码和变换。还可针对每个最大编码单元，针对小于最大深度的每个深度的根据深度的编码单元来执行预测编码和变换。

每当根据深度对最大编码单元进行划分时，根据深度的编码单元的数量增加，并因此需要对随着深度加深而产生的所有深度的所有编码单元执行预测编码和变换。在下文中，为了便于解释，在一个或更多个最大编码单元中，将基于当前深度的编码单元来描述预测编码和变换。

根据本发明的实施例的视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码，执行诸如预测编码、变换和熵编码的操作，并且，可针对所有操作使用相同的数据单元，或者可针对不同操作使用不同的数据单元。

例如，视频编码设备100不仅可选择用于对图像数据进行编码的编码单元，还可选择不同于编码单元的数据单元，来对编码单元中的图像数据执行预测编码。

为了对最大编码单元执行预测编码，可基于编码深度的编码单元(即，基于根据本发明的实施例的不再被划分的编码单元)来执行预测编码。以下，不再被划分且成为预测编码的基础的编码单元被称为预测单元。通过划分预测单元得到的分区可包括预测单元以及通过对预测单元的高度和宽度中的至少一个进行划分而得到的数据单元。分区可以是处于对编码单元的预测单元进行划分的形式的数据单元，预测单元可以是尺寸与编码单元的尺寸相同的分区。

例如，当尺寸为2N×2N(其中，N是正整数)的编码单元不再被划分时，预测单元尺寸成为2N×2N，并且分区尺寸可以是2N×2N、2N×N、N×2N、N×N等。根据本发明的实施例的分区类型可选择性地包括通过按照预测单元的高度或宽度的对称比率被划分出的对称分区、通过按照诸如1：n或n:1的非对称比率被划分出的分区、以几何形状被划分出的分区、以及处于任意形状的分区。

预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个。例如，可对尺寸为2N×2N、2N×N、N×2N和N×N的分区执行帧内模式或帧间模式。另外，可仅对尺寸为2N×2N的分区执行跳过模式。可对编码单元中的每一个预测单元独立地执行编码，从而可选择具有最小编码误差的预测模式。

另外，根据本发明的实施例的视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与编码单元不同的数据单元，来对编码单元中的图像数据执行变换。为了对编码单元进行变换，可基于尺寸小于编码单元的尺寸的变换单元或者尺寸与编码单元的尺寸相同的变换单元来执行变换。例如，变换单元可包括用于帧内模式的数据单元和用于帧间模式的变换单元。

按照与根据本发明的实施例的根据树结构的编码单元中的方案类似的方案，编码单元中的变换单元可被递归地划分为更小尺寸的变换单元，并且，可基于根据变换深度的根据树结构的变换单元，对编码单元中的残差数据进行划分。

甚至可针对根据本发明的实施例的变换单元设置变换深度，其中，变换深度指示通过对编码单元的高度和宽度进行划分而达到变换单元的划分次数。例如，如果尺寸为2N×2N的当前编码单元的变换单元的尺寸为2N×2N，则变换深度可被设置为0，如果变换单元的尺寸为N×N，则变换深度可被设置为1，如果变换单元的尺寸为N/2×N/2，则变换深度可被设置为2。也就是说，针对变换单元，可根据变换深度设置根据树结构的变换单元。

针对用于各个编码深度的编码信息，除了需要编码深度之外，还需要与预测相关的信息和与变换相关的信息。因此，编码单元确定器120除了可确定产生最小编码误差的编码深度之外，还可确定预测单元被划分所根据的分区类型、用于各个预测单元的预测模式以及用于变换的变换单元的尺寸。

将参照图3至图12描述确定根据本发明的实施例的最大编码单元中的根据树结构的编码单元、预测单元/分区和变换单元的方案。

编码单元确定器120可通过使用基于拉格朗日乘数的率失真优化方案，来测量根据深度的编码单元的编码误差。

输出单元130以比特流的形式基于至少一个编码深度输出最大编码单元的编码的图像数据和关于用于各个深度的编码模式的信息，其中，所述至少一个编码深度在编码单元确定器120中被确定。

编码的图像数据可以是对图像的残差数据进行编码的结果。

关于根据深度的编码模式的信息可包括编码深度信息、预测单元的分区类型信息、预测模式信息和变换单元的尺寸信息。

可通过使用根据深度的划分信息来定义编码深度信息，其中，根据深度的划分信息指示是否在更低深度的编码单元中进行编码而不是根据当前深度进行编码。如果当前编码单元的当前深度是编码深度，则在当前深度的编码单元中对当前编码单元进行编码，因此可将当前深度的划分信息定义为不再将当前深度划分到更低深度。相反，如果当前编码单元的当前深度不是编码深度，则可能需要尝试通过使用更低深度的编码单元进行编码，并因此可将当前深度的划分信息定义为将当前编码单元划分为更低深度的编码单元。

如果当前深度不是编码深度，则对被划分为更低深度的编码单元的编码单元执行编码。在当前深度的编码单元中存在更低深度的一个或更多个编码单元，并因此对每个更低深度的每个编码单元重复地执行编码，并因此可对相同深度的每个编码单元执行递归编码。

确定一个最大编码单元中的树结构的编码单元，并且需要确定与用于编码深度的每个编码单元的至少一个编码模式有关的信息，并因此可针对一个最大编码度单元确定关于至少一个编码模式的信息。另外，可根据深度对最大编码单元的数据进行分层划分，并且编码深度可根据位置而不同，并因此可针对数据设置关于编码深度和编码模式的信息。

因此，在根据本发明的实施例的输出单元130中，可将关于编码深度和编码模式的编码信息分配给包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。

根据本发明的实施例的最小单元是通过将处于最低编码深度的最小编码单元的尺寸划分为4份而获得的矩形数据单元。根据本发明的实施例的最小单元可以是这样的最大尺寸的正方形数据单元：该最大尺寸的正方形数据单元可被包括在最大编码单元中所包括的所有编码单元、预测单元、分区单元和变换单元中。

例如，通过输出单元130输出的编码信息可被分类为用于根据深度的各个编码单元的编码信息和用于各个预测单元的编码信息。用于根据深度的各个编码单元的编码信息可包括预测模式信息和分区尺寸信息。通过预测单元传送的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息、以及关于帧内模式的插值方案的信息。

针对各个画面、条带或GOP定义的关于编码单元的最大尺寸的信息和关于最大深度的信息可被插入到比特流的头、序列参数集或画面参数集中。

另外，对于当前视频允许的关于变换单元的最大尺寸的信息和关于变换单元的最小尺寸的信息也可通过比特流的头、序列参数集或画面参数集被输出。输出单元130可对参照图1至图6描述的与预测相关的参考信息、预测信息、单方向预测信息以及条带类型信息(包括四个条带类型)等进行编码以便随后被输出。

根据视频编码设备100的最简化的形式的实施例，用于各个深度的编码单元是具有更高一层深度的编码单元的高度和宽度的一半尺寸的编码单元。也就是说，如果当前深度的编码单元的尺寸是2N×2N，则更低深度的编码单元的尺寸是N×N。另外，尺寸为2N×2N的当前编码单元可包括最多4个尺寸为N×N的更低深度的编码单元。

因此，视频编码设备100可基于考虑当前画面的特征而确定的最大编码单元尺寸和最大深度，针对各个最大编码单元确定具有最优形状和尺寸的编码单元，以形成根据树结构的编码单元。另外，可以以用于各个最大编码单元的各种预测模式和变换方案来执行编码，并因此可考虑各种图像尺寸的编码单元的图像特征来确定最优编码模式。

因此，如果以现有宏块单元对具有很高的分辨率或很大数据量的图像进行编码，则每个画面的宏块的数量变得过大。因此，针对每个宏块产生的压缩信息也会增加，因此压缩信息的传输负荷会增加，并且压缩效率会降低。因此，根据本发明的实施例的视频编码设备可考虑图像尺寸来增加编码单元的最大尺寸，并考虑图像特征来调整编码单元，并因此可提高图像压缩效率。

涉及基于根据树结构的编码单元的视频预测的视频解码设备200包括接收器210、图像数据和编码信息提取器220以及图像数据解码器230。为了便于解释，在下文中，涉及基于根据树结构的编码单元的视频预测的视频解码设备200将被称为视频解码设备200。

用于视频解码设备200的解码操作的诸如编码单元的各种术语(诸如深度、预测单元、变换单元和关于各种编码模式的信息)的定义已在上面参照图1和视频编码设备100被描述。

接收器210接收和解析关于编码视频的比特流。图像数据和编码信息提取器220从解析的比特流，基于针对各个最大编码单元的根据树结构的编码单元，针对各个最大编码单元提取编码图像数据，以将提取的图像数据输出到解码器230。图像数据和编码信息提取器220可从关于当前画面的头、序列参数集或画面参数集提取关于当前画面的编码单元的最大尺寸的信息。

另外，图像数据和编码信息提取器220从解析的比特流，针对各个最大编码单元，提取关于根据树结构的编码单元的编码深度和编码模式的信息。提取的关于编码深度和编码模式的信息被输出到解码器230。也就是说，比特流中的图像数据可被划分为最大编码单元，使得图像数据解码器230可针对各个最大编码单元对图像数据进行解码。

可针对一个或更多个编码深度信息集设置针对各个最大编码单元的关于编码深度和编码模式的信息，关于用于各个编码深度的编码模式的信息可包括编码单元的分区类型信息、预测模式信息和变换单元的尺寸信息。另外，根据深度的划分信息可被提取为编码深度信息。

由图像数据和编码信息提取器220提取的针对各个最大编码单元的关于编码深度和编码模式的信息是关于这样的编码深度和编码模式的信息：该编码深度和编码模式被确定为通过按照最大编码单元和深度针对各个编码单元重复地执行编码时产生最小编码误差。因此，视频解码设备200可根据产生最小编码误差的编码方案对数据进行解码来恢复图像。

根据本发明的实施例的关于编码深度和编码模式的编码信息可被分配给编码单元、预测单元和最小单元中的预定数据单元，并因此图像数据和编码信息提取器220可针对各个确定的数据单元，提取关于编码深度和编码模式的信息。如果关于最大编码单元的编码深度和编码模式的信息已针对各个数据单元被记录，则可将具有关于相同编码深度和编码模式的信息的预定数据单元推断为是包括在同一最大编码单元中的数据单元。

图像数据解码器230基于针对各个最大编码单元的关于编码深度和编码模式的信息，对各个最大编码单元的图像数据进行解码，来恢复当前画面。也就是说，图像数据解码器230可基于读取出的针对包括在最大编码单元中的根据树结构的编码单元之中的各个编码单元的分区类型、预测模式和变换单元，对已被编码的图像数据进行解码。解码处理可包括预测处理(包含帧内预测和运动补偿)和逆变换处理。

图像数据解码器230可基于针对各个编码深度的编码单元的预测单元的分区类型信息和预测模式信息，根据针对各个编码单元的各个分区和预测模式，执行帧内预测和运动补偿。

此外，针对各个最大编码单元，图像数据解码器230可针对各个编码单元读取根据树结构的变换单元信息，并基于用于逆变换的变换单元来执行逆变换。通过逆变换，可恢复编码单元的空间域的像素值。

图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的编码深度。如果划分信息指示在当前深度中未示出进一步的划分，则当前深度是编码深度。因此，图像数据解码器230可通过使用预测单元的分区类型、预测模式和变换单元尺寸信息，针对当前最大编码单元的图像数据，对当前深度的编码单元进行解码。

也就是说，观察针对编码单元、预测单元和预定数据单元设置的编码信息集，具有包括相同划分信息的编码信息的数据单元被收集，并且收集的数据单元可被认为是将由图像数据解码器230按相同编码模式解码的一个数据单元。以此方式，可通过获得关于针对各个确定的编码单元的编码模式的信息来对当前编码单元执行解码。

因此，视频解码设备200可获得关于在编码处理中通过对各个最大编码单元递归地执行编码而产生最小编码误差的编码单元的信息，以在对当前画面进行解码中使用。也就是说，对根据树结构的编码单元的编码图像数据的解码成为可能，其中，所述编码图像数据在针对各个最大编码单元的最佳编码单元中被确定。

因此，即使是高分辨率的图像和大数据量的图像，也可通过根据编码模式和编码单元尺寸有效地对图像数据进行恢复来被恢复，其中，所述编码模式和编码单元尺寸通过使用发送自编码终端的关于最优编码模式的信息被自适应地确定为图像的特性。

图3示出根据本发明的实施例的编码单元的构思。

编码单元的示例被表示为宽度×高度，并且32×32、16×16和8×8可被包括在尺寸为64×64的编码单元中。尺寸为64×64的编码单元可被划分为64×64、64×32、32×64和32×32的分区，尺寸为32×32的编码单元可被划分为32×32、32×16、16×32和16×16的分区，尺寸为16×16的编码单元可被划分为16×16、16×8、8×16和8×8的分区，尺寸为8×8的编码单元可被划分为8×8、8×4、4×8和4×4的分区。

对于视频数据310，分辨率被设置为1920×1080，编码单元的最大尺寸被设置为64，最大深度被设置为2。对于视频数据320，分辨率被设置为1920×1080，编码单元的最大尺寸被设置为64，最大深度被设置为3。对于视频数据330，分辨率被设置为352×288，编码单元的最大尺寸被设置为16，最大深度被设置为1。图9中示出的最大深度表示从最大编码单元到最小解码单元的划分总次数。

当分辨率高或数据量大时，优选的是，最大编码尺寸较大，以便除了提高编码效率之外，还准确地反映图像的特征。因此，具有比视频数据330的分辨率更高分辨率的视频数据310和320的最大编码尺寸可被设置为64。

视频数据310的最大深度是2，并因此当进行两次划分并且深度变高两层时，视频数据310的编码单元可包括从长轴尺寸为64的最大编码单元至长轴尺寸为32和16的编码单元。相比之下，视频数据330的最大深度是1，并因此当进行一次划分并且深度变高一层时，视频数据330的编码单元335可包括从长轴尺寸为16的编码单元到长轴尺寸为8的编码单元。

视频数据320的最大深度是3，并因此当进行三次划分并且深度变高三层时，视频数据320的编码单元325可包括从长轴尺寸为64的最大编码单元到长轴尺寸为32、16和8的编码单元。随着深度变高，表达详细信息的能力可被提高。

根据本发明的实施例的图像编码器400包括在视频编码设备100的编码单元确定器120中执行以对图像数据进行编码的操作。也就是说，帧内预测器410对当前帧405中的帧内模式的编码单元执行帧内预测，运动估计器420和运动补偿器425通过使用帧间模式的当前帧405和参考帧495，执行帧间估计和运动补偿。

从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430和量化器440被输出为变换系数。量化后的变换系数通过反量化器460和频率逆变换器470被恢复为空间域的数据，恢复的空间域的数据通过去块单元480和偏移调整单元490被后处理以便被输出为参考帧495。量化后的变换系数可通过熵编码器450被输出为比特流。

为了被应用于根据本发明的实施例的视频编码设备100，作为图像编码器400的元件的所有的帧内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器450、反量化器460、频率逆变换器470、去块单元480和偏移调整单元490需要在考虑用于各个最大编码单元的最大深度的情况下，基于根据树结构的编码单元中的各个编码单元执行操作。

具体地，帧内预测器410、运动估计器420和运动补偿器425在考虑当前最大编码单元的最大尺寸和最大深度的情况下确定根据树结构的编码单元中的各个编码单元的分区和预测模式，变换器430需要确定根据树结构的编码单元中的各个编码单元内的变换单元的尺寸。

解码所需的关于编码的信息以及作为解码的对象的编码图像数据在比特流505经过解析器510时被解析。编码图像数据通过解码器520和反量化器530被输出为反量化的数据，空间域的图像数据通过频率逆变换器540被恢复。

对于空间域的图像数据，帧内预测器550对帧内模式的编码单元执行帧内预测，运动补偿器560通过使用参考帧585对帧间模式的编码单元执行运动补偿。

经过帧内预测器550和运动补偿器560的空间域的数据可通过去块单元570和偏移调整单元580被后处理以被输出为恢复帧595。另外，通过去块单元570和偏移调整单元580后处理的数据可被输出为参考帧585。

为了在视频解码设备200的图像数据解码器230中对图像数据进行解码，可执行根据本发明的实施例的图像解码器500的解析器510之后的操作。

为了被应用于根据本发明的实施例的视频解码设备200，所有的解析器510、熵解码器520、反量化器530、频率逆变换器540、帧内预测器550、运动补偿器560、去块单元570和偏移调整单元580需要针对各个最大编码单元基于根据树结构的编码单元执行操作。

具体地，运动补偿器560针对根据树结构的各个编码单元确定分区和预测模式，频率逆变换器540需要针对各个编码单元确定变换单元的尺寸。

图6示出根据本发明的实施例的根据深度的编码单元和分区。

根据本发明的实施例的视频编码设备100和根据本发明的实施例的视频解码设备200使用分层编码单元以考虑图像特征。可根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度，并可根据用户的要求不同地设置编码单元的最大高度、最大宽度和最大深度。可根据预定编码单元的最大尺寸来确定根据深度的编码单元的尺寸。

根据本发明的实施例的编码单元的分层结构600示出了以下情况：编码单元的最大高度和最大宽度是64，并且最大深度是3。此时，最大深度是指从最大编码单元到最小编码单元的划分总次数。深度沿着根据本发明的实施例的编码单元的分层结构600的垂直轴变高，并因此每个深度的编码单元的高度和宽度被分别划分。另外，预测单元和分区沿着编码单元的分层结构600的水平轴被示出，其中，所述预测单元和分区成为对根据深度的编码单元进行预测编码的基础。

也就是说，在编码单元的分层结构600中，编码单元610是最大编码单元，深度为0，并且编码单元的尺寸(即，高度和宽度)为64×64。深度沿着垂直轴变得更高，存在尺寸为32×32且深度为1的编码单元620、尺寸为16×16且深度为2的编码单元630、尺寸为8×8且深度为3的编码单元640。尺寸为8×8且深度为3的编码单元640是最小编码单元。

编码单元的预测单元和分区针对各个深度沿着水平轴被排列。也就是说，如果尺寸为64×64且深度为0的编码单元610是预测单元，则可将预测单元划分成包括在尺寸为64×64的编码单元610中的尺寸为64×64的分区610、尺寸为64×32的分区612、尺寸为32×64的分区614和尺寸为32×32的分区616。

类似地，可将尺寸为32×32且深度为1的编码单元的预测单元划分成包括在尺寸为32×32的编码单元620中的尺寸为32×32的分区、尺寸为32×16的分区622、尺寸为16×32的分区624和尺寸为16×16的分区626。

可将尺寸为16×16且深度为2的编码单元630的预测单元划分成包括在尺寸为16×16的编码单元630中的尺寸为16×16的分区630、尺寸为16×8的分区632、尺寸为8×16的分区634和尺寸为8×8的分区636。

可将尺寸为8×8且深度为3的编码单元640的预测单元划分成包括在尺寸为8×8的编码单元640中的尺寸为8×8的分区、尺寸为8×4的分区642、尺寸为4×8的分区644和尺寸为4×4的分区。

最后，尺寸为8×8且深度为3的编码单元640是最小编码单元和最低深度的编码单元。

为了确定最大编码单元610的编码深度，根据本发明的实施例的视频编码设备100的编码单元确定器120需要对包括在最大编码单元610中的各个深度的各个编码单元执行编码。

随着深度增加，包括相同范围和相同尺寸的数据的根据深度的编码单元的数量增加。例如，对于包括在深度为1的一个编码单元中的数据，可需要深度为2的4个编码单元。因此，为了根据深度比较对相同数据进行编码的结果，需要分别使用深度为1的一个编码单元和深度为2的四个编码单元来执行编码。

为了针对各个深度进行编码，可沿着分层结构600的水平轴，针对各个深度的编码单元的各个预测单元执行编码，从而可选择具有最小编码误差的代表性的编码误差。另外，深度沿着编码单元的分层结构600的水平轴变高，可针对各个深度执行编码，并且可通过比较根据深度的代表性误差来搜索最小编码误差。在最大编码单元610中的具有最小编码误差的深度和分区可被选为最大编码单元610的编码深度和分区类型。

根据本发明的实施例的视频编码设备100或根据本发明的实施例的视频解码设备200针对各个最大编码单元，按照尺寸小于最大编码单元的尺寸或与最大编码单元的尺寸相同的编码单元，对图像进行编码或解码。可基于不大于各个编码单元的数据单元，来选择用于在编码处理期间进行变换的变换单元的尺寸。

例如，在根据本发明的实施例的视频编码设备100或根据本发明的实施例的视频解码设备200中，在当前编码单元710的尺寸为64×64时，可通过使用尺寸为32×32的变换单元720来执行变换。

此外，可将尺寸为64×64的编码单元710的数据分别转换为尺寸为32×32、16×16、8×8和4×4的变换单元，并然后可选择具有与原始数据单元相比最小的误差的变换单元。

图8示出根据本发明的实施例的根据深度的编码信息。

根据本发明的实施例的视频编码设备100的输出单元130可对各个编码深度的各个编码单元的关于分区类型的信息800、关于预测模式的信息810以及关于变换单元尺寸的信息820进行编码，并将信息800、信息810和信息820作为关于编码模式的信息来发送。

关于分区类型的信息800指示关于当前编码单元的预测单元被划分出的分区的形状的信息，其中，分区作为用于对当前编码单元进行预测编码的数据单元。例如，可将尺寸为2N×2N的当前编码单元CU_0划分成以下分区中的一个：尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806和尺寸为N×N的分区808。在此情况下，关于当前编码单元的分区类型的信息800可被设置为指示以下分区之一：尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806和尺寸为N×N的分区808。

关于预测模式的信息810指示针对各个分区的预测模式。例如，通过关于预测模式的信息810，可设置是否按照帧内模式812、帧间模式814和跳过模式816中的一种对由关于分区类型的信息800指示的分区执行预测编码。

另外，关于变换单元尺寸的信息820指示成为对当前编码单元进行变换的基础的变换单元。例如，变换单元可以是第一帧内变换单元尺寸822、第二帧内变换单元尺寸824、第一帧间变换单元尺寸826和第二帧间变换单元尺寸828之一。

视频解码设备200的图像数据和编码信息提取器210可针对各个深度的各个编码单元提取关于分区类型的信息800、关于预测模式的信息810和关于变换单元尺寸的信息820，以便在解码过程中被使用。

图9示出根据本发明的实施例的根据深度的编码单元。

划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分成更低深度的编码单元。

用于对深度为0且尺寸为2N_0×2N_0的编码单元900进行预测编码的预测单元910可包括尺寸为2N_0×2N_0的分区类型912、尺寸为2N_0×N_0的分区类型914、尺寸为N_0×2N_0的分区类型916和尺寸为N_0×N_0的分区类型918。仅示出了按照对称比率划分预测单元910而获得的分区类型912、914、916和918，但如上所述，分区类型不限于此，并可包括非对称分区、任意形状的分区和几何形状的分区。

对于每种分区类型，需要对尺寸为2N_0×2N_0的一个分区、尺寸为2N_0×N_0的两个分区、尺寸为N_0×2N_0的两个分区和尺寸为N_0×N_0的四个分区重复地执行预测编码。对于尺寸为2N_0×2N_0的分区、尺寸为N_0×2N_0的分区、尺寸为2N_0×N_0的分区和尺寸为N_0×N_0的分区，可按照帧内模式和帧间模式执行预测编码。可按照跳过模式仅对2N_0×2N_0的分区执行预测编码。

如果根据尺寸为2N_0×2N_0的分区类型912、尺寸为2N_0×N_0的分区类型914和尺寸为N_0×2N_0的分区类型916中的一个分区类型的编码误差最小，则不需要更低深度的分区。

如果根据尺寸为N_0×N_0的分区类型918的编码误差最小，则深度0改变为1，执行划分(920)，并对深度为2且尺寸为N_0×N_0的分区类型的编码单元930重复地执行编码以搜索最小编码误差。

用于对深度为1且尺寸为2N_1×2N_1(＝N_0×N_0)的编码单元930进行预测编码的预测单元944可包括尺寸为2N_1×2N_1的分区类型942、尺寸为2N_1×N_1的分区类型944、尺寸为N_1×2N_1的分区类型946以及尺寸为N_1×N_1的分区类型948。

另外，如果根据尺寸为N_1×N_1的分区类型948的编码误差最小，则深度1改变成2，执行划分(950)，并对深度为2且尺寸为N_2×N_2的编码单元960重复执行编码以搜索最小误差。

如果最大深度是d，则根据深度的编码单元被设置直到深度为d-1时为止，并且划分信息可被设置直到深度为d-2时为止。也就是说，如果划分970从深度d-2开始并且编码被执行甚至直到d-1，则用于对深度为d-1且尺寸为2N_(d-1)×2N_(d-1)的编码单元980进行预测编码的预测单元990可包括尺寸为2N_(d-1)×2N_(d-1)的分区类型992、尺寸为2N_(d-1)×N_(d-1)的分区类型994、尺寸为N_(d-1)×2N_(d-1)的分区类型996和尺寸为N_(d-1)×N_(d-1)的分区类型998。

可对分区类型中的尺寸为2N_(d-1)×2N_(d-1)的一个分区、尺寸为2N_(d-1)×N_(d-1)的两个分区、尺寸为N_(d-1)×2N_(d-1)的两个分区以及尺寸为N_(d-1)×N_(d-1)的四个分区执行通过预测编码的编码，使得可搜索具有最小编码误差的分区类型。

虽然根据尺寸为N_(d-1)×N_(d-1)的分区类型998的编码误差最小，但是最大深度是d，并因此深度为d-1的编码单元CU_(d-1)也不再经过更低深度的划分处理。另外，用于当前最大编码单元900的编码深度被确定为d-1，并且分区类型可被确定为N_(d-1)×N_(d-1)。此外，最大深度是d，并因此不设置用于深度为d-1的编码单元952的划分信息。

数据单元999可被称为用于当前最大编码单元的最小单元。根据本发明的实施例的最小单元可以是这样的正方形数据单元，该正方形数据单元的大小是作为最低编码深度的最小编码单元的1/4。通过这样的重复编码处理，根据本发明的实施例的视频编码设备100比较根据编码单元900的深度的编码误差来选择出现最小编码误差的深度以确定编码深度，并且，分区类型和预测模式可被确定为编码深度的编码模式。

根据深度0、1、…、d-1和d中的所有深度对最小编码误差进行比较，使得具有最小误差的深度可被选择并被确定为编码深度。编码深度、预测单元的分区类型和预测模式可作为关于编码模式的信息被编码以便随后被发送。另外，需要将编码单元从深度0划分到编码深度，并因此仅将编码深度的划分信息设置为0，并且需要将用于除了编码深度以外的各个深度的划分信息设置为1。

根据本发明的实施例的视频解码设备200的图像数据和编码信息提取器220可被用在提取关于编码深度和预测单元的信息的过程中以及对编码单元912进行解码的过程中。根据本发明的实施例的视频解码设备200可通过使用用于各个深度的划分信息来识别划分信息为0的深度，并且在解码过程中使用针对深度的关于解码模式的信息。

图10、图11和图12示出根据本发明的实施例的在编码单元、预测单元和变换单元之间的关系。

编码单元1010是针对各个编码深度的编码单元，其中，针对各个编码深度的编码单元由根据本发明的实施例的视频编码设备100确定。预测单元1060是编码单元1010中的针对各个编码深度的编码单元的预测单元的分区，变换单元1070是针对各个编码深度的编码单元的变换单元。

对于针对各个深度的编码单元1010，如果最大编码单元的深度为0，则编码单元1012和1054的深度为1，编码单元1014、1016、1018、1028、1050和1052的深度为2，编码单元1020、1022、1024、1026、1030、1032和1048的深度为3，编码单元1040、1042、1044和1046的深度为4。

在预测单元1060中，一些分区1014、1016、1022、1032、1048、1050、1052和1054处于对编码单元划分的形式。也就是说，分区1014、1022、1050和1054是2N×N的分区类型，分区1016、1048和1052是N×2N的分区类型，分区1032是N×N的分区类型。针对各个深度的编码单元1010的分区和预测单元与各个编码单元相同，或者小于各个编码单元。

对于变换单元1070中的一些变换单元1052的图像数据，可在尺寸小于编码单元的尺寸的数据单元中执行变换或逆变换。另外，如果与预测单元1060中的预测单元和分区比较，变换单元1014、1016、1022、1032、1048、1050、1052和1054是不同尺寸或形状的数据单元。也就是说，根据本发明的实施例的视频编码设备100和根据本发明的实施例的视频解码设备200可基于各个数据单元，对同一编码单元执行帧内预测/运动估计/运动补偿操作以及变换/逆变换操作。

因此，对各个编码单元的各个区域中的分层结构的各个编码单元递归地执行编码，从而确定最优编码单元。因此，可形成根据递归树结构的编码单元。编码信息可包括用于编码单元的划分信息、分区类型信息、预测模式信息和变换单元尺寸信息。表1在下面示出可在根据本发明的实施例的视频编码设备100和根据本发明的实施例的视频解码设备200中设置的示例。

[表1]

根据本发明的实施例的视频编码设备100的输出单元130可输出用于根据树结构的编码单元的编码信息，根据本发明的实施例的视频解码设备200的编码信息提取器220可从接收到的比特流提取用于根据树结构的编码单元的编码信息。

划分信息指示是否将当前编码单元划分成更低深度的编码单元。如果当前深度d的划分信息是0，则当前编码单元不再被划分成更低编码单元的深度是编码深度，并因此可针对所述编码深度来定义分区类型信息、预测模式信息和变换单元尺寸信息。当需要根据划分信息进行再一次划分时，需要对更低深度的4个划分编码单元独立地执行编码。

预测模式可被指示为帧内模式、帧间模式和跳过模式中的一种。可在所有分区类型中定义帧内模式和帧间模式，并且可仅在分区类型2N×2N中定义跳过模式。

分区类型信息可指示对称分区类型2N×2N、2N×N、N×2N和N×N以及非对称分区类型2N×nU、2N×nD、nL×2N和nR×2N，其中，在对称分区类型中按照对称比率划分预测单元的高度或宽度，在非对称分区类型中按照非对称比率划分预测单元的高度或宽度。非对称分区类型2N×nU和2N×nD指示这样的形状：在该形状中按1:3和3:1来划分各个类型的高度；非对称分区类型nL×2N和nR×2N指示这样的形状：在该形状中按1:3和3:1来划分各个类型的宽度。

可将变换单元尺寸设置成帧内模式下的两种类型的尺寸，并且可将变换单元尺寸设置成帧间模式下的两种类型的尺寸。也就是说，如果变换单元划分信息是0，则变换单元的尺寸被设置为2N×2N，即当前编码单元的尺寸。如果变换单元划分信息是1，则可设置对当前编码单元进行划分的尺寸的变换单元。另外，如果尺寸为2N×2N的当前编码单元的分区类型是对称分区类型，则变换单元的尺寸可被设置为N×N，如果分区类型是非对称分区类型，则尺寸可被设置为N/2×N/2。

根据本发明的实施例的根据树结构的编码单元的编码信息可被分配给编码深度的编码单元、预测单元和最小单元中的至少一个。编码深度的编码单元可包括含有相同编码信息的预测单元和最小单元中的一个或更多个。

因此，如果邻近数据单元含有的编码信息被检查，则可检查邻近数据单元是否被包括在相同编码深度的编码单元中。另外，如果由数据单元含有的编码信息被使用，则可检查相应编码深度的编码单元，并因此可推断在最大编码单元中编码深度的分区。

因此，在此情况下，如果参考周围数据单元无法对当前编码单元进行预测，则在与当前编码单元邻近的根据深度的编码单元内的数据单元中的编码信息可被直接参考以被使用。

可选地，如果参考周围编码单元对当前编码单元执行预测编码，则当通过使用根据深度的邻近编码单元的编码信息在根据深度的编码单元内搜索与当前数据单元邻近的数据时，可参考周围数据单元。

最大编码单元1300包括多个编码深度的编码单元1302、1304、1306、1312、1314、1316和1318。这里，一个编码单元1318是编码深度的编码单元，并因此划分信息可被设置成0。可将尺寸为2N×2N的编码单元1318的分区类型信息设置成以下分区类型中的一种：分区类型2N×2N 1322、分区类型2N×N 1324、分区类型N×2N 1326、分区类型N×N 1328、分区类型2N×nU1332、分区类型2N×nD 1334、分区类型nL×2N 1336以及分区类型nR×2N1338。

变换单元划分信息(TU尺寸标记)是一种类型的变换索引，并且与变换索引相应的变换单元的尺寸可根据编码单元的预测单元类型或分区类型而改变。

例如，当分区类型信息被设置为对称分区类型2N×2N 1322、2N×N 1324、N×2N 1326和N×N 1328中的一个时，如果变换单元划分信息是0，则设置尺寸为2N×2N的变换单元1342，如果变换单元划分信息是1，则可设置尺寸为N×N的变换单元1344。

当分区类型信息被设置为非对称分区类型2N×nU 1332、2N×nD 1334、nL×2N 1336或nR×2N 1338中的一个时，如果变换单元划分信息(TU尺寸标记)是0，则设置尺寸为2N×2N的变换单元1352，如果变换单元划分信息是1，则可设置尺寸为N/2×N/2的变换单元1354。

参照图13描述的变换单元划分信息(TU尺寸标记)是具有值0或1的标记，但是根据本发明的实施例的变换单元划分信息不限于1比特的标记，并且变换单元可在划分信息从0开始增加到1、2、3等时被分层划分。变换单元划分信息可被用作变换索引的实施例。

在这种情况下，如果根据本发明的实施例的变换单元的变换单元划分信息与变换单元的最大尺寸和变换单元的最小尺寸一起使用，则可表示实际上已使用的变换单元的尺寸。根据本发明的实施例的视频编码设备100可对最大变换单元尺寸信息、最小变换单元尺寸信息和最大变换单元划分信息进行编码。编码的最大变换单元尺寸信息、最小变换单元尺寸信息和最大变换单元划分信息可被插入SPS。根据本发明的实施例的视频解码设备200可在视频解码中使用最大变换单元尺寸信息、最小变换单元尺寸信息和最大变换单元划分信息。

例如，(a)如果当前编码单元的尺寸是64×64并且最大变换单元尺寸是32×32，则(a-1)当变换单元划分信息为0时，变换单元尺寸可被设置为32×32，(a-2)当变换单元划分信息为1时，变换单元尺寸可被设置为16×16，(a-3)当变换单元划分信息为2时，变换单元尺寸可被设置为8×8。

作为另一示例，(b)如果当前编码单元尺寸是32×32并且最小变换单元尺寸是32×32，则(b-1)当变换单元划分信息为0时，变换单元尺寸可被设置为32×32，并且，由于变换单元尺寸不能够小于32×32，因此不能设置进一步的变换单元划分信息。

作为另一示例，(c)如果当前编码单元尺寸是64×64并且最大变换单元划分信息为1，则变换单元划分信息可以是0或1，并且不能设置其它的变换单元划分信息。

因此，当最大变换单元划分信息被定义为“MaxTransformSizeIndex”，最小变换单元尺寸被定义为“MinTransformSize”，并且在变换单元划分信息为0情况下的变换单元尺寸被定义为“RootTuSize”时，在当前编码单元中可能的最小变换单元尺寸“CurrMinTuSize”可被定义为以下等式1中所示：

CurrMinTuSize＝max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex)) (1)

通过与在当前编码单元中可能的最小变换单元尺寸“CurrMinTuSize”相比，当变换单元划分信息为0时变换单元尺寸“RootTuSize”可指示可根据系统自适应的最大变换单元尺寸。也就是说，根据等式1，“RootTuSize/(2^MaxTransformSizeIndex)”是作为在变换单元尺寸“RootTuSize”被划分了与最大变换单元划分信息相应的次数之后的尺寸的变换单元尺寸，“MinTransformSize”是最小变换尺寸，并因此，“RootTuSize/(2^MaxTransformSizeIndex)”和“MinTransformSize”中较小的值可以是作为在当前编码单元中可能的最小变换单元尺寸的“CurrMinTuSize”。

根据本发明的实施例的最大变换单元尺寸RootTuSize可根据预测模式而改变。

例如，如果当前预测模式是帧间模式，则可根据以下的等式2来确定RootTuSize。在等式2中，“MaxTransformSize”指示最大变换单元尺寸，“PUSize”指示当前预测单元尺寸。

RootTuSize＝min(MaxTransformSize,PUSize)……(2)

也就是说，如果当前预测模式是帧间模式，则作为当变换单元划分信息为0时的变换单元尺寸的RootTuSize可被设置为最大变换单元尺寸和当前预测单元尺寸中较小的值。

如果当前分区单元的预测模式是帧内模式，则可根据以下的等式3来确定“RootTuSize”。“PartitionSize”指示当前分区单元的尺寸。

RootTuSize＝min(MaxTransformSize,PartitionSize)……(3)

也就是说，如果当前预测模式是帧内模式，则作为当变换单元划分信息为0时的变换单元尺寸的“RootTuSize”可被设置为最大变换单元尺寸和当前分区单元尺寸之中较小的值。

然而，根据分区单元的预测模式而改变且作为根据本发明的实施例的当前最大变换单元尺寸的“RootTuSize”仅是实施例，并且用于确定当前最大变换单元尺寸的因素不限于此实施例。

以上参照图1至图13描述的包括树结构的编码单元的最大编码单元也被称为编码块树、块树、根块树、编码树、编码根、树干等。

如上所述，根据本发明的实施例的视频编码设备100和视频解码设备200将最大编码单元划分为与最大编码单元相同或小于最大编码单元的编码单元，以执行编码和解码。为了提高图像的解码处理的处理速度，可并行执行图像解码处理。然而，当任意画面参考另一画面时，所述任意画面不能在被参考的画面的解码处理完成之前被解码。可被并行解码的画面必须是不被彼此参考的画面。另外，当参考其它参考画面对可被并行解码的画面进行预测时，在并行解码的时间点对参考画面的解码需要被完成。因此，为了确定能够并行解码的画面，需要确定对画面进行解码的顺序以及画面之间的参考关系。在根据本发明的实施例的用于并行处理的视频解码方案中，在画面组(GOP)中包括的参考关系信息是基于画面的编码顺序和参考依赖关系而产生的，并且参考关系信息被包括在预定数据单元中以被发送。在根据本发明的实施例的视频解码方案中，在GOP中包括的画面之间的解码顺序和参考依赖关系基于预定数据单元中包括的参考关系信息被确定，并且可被并行处理的画面基于解码顺序和参考依赖关系被确定。另外，在根据本发明的实施例的视频解码方案中，对可被并行处理的画面进行并行解码。

在下文中，将参照图14至图23描述用于并行处理的视频编码/解码方案。解码顺序和编码顺序分别是指在解码端和编码端的基础上处理画面的顺序，并且画面的编码顺序与解码顺序相同。因此，在下面描述本发明的实施例时，编码顺序可表示解码顺序，解码顺序也可表示编码顺序。

参照图14，视频编码设备1400包括图像编码器1410和输出单元1420。如图4的图像编码器400，图像编码器1410通过使用根据树结构的编码单元对形成视频序列的每个画面执行预测编码。图像编码器1410通过帧间预测和帧内预测对画面进行编码，以便输出关于残差数据、运动矢量和预测模式的信息。具体地，根据本发明的实施例的图像编码器1410对GOP中包括的画面执行帧间预测和帧内预测，并确定GOP中包括的画面之间的编码顺序和参考依赖关系。参考依赖关系指示GOP中包括的画面之间的参考关系，并可以是参考画面集(RPS)。RPS指示参考画面的画面顺序计数(POC)信息。例如，当任意B画面的RPS是[0，2]时，B画面将POC为0的画面和POC为2的画面用作参考画面。因此，B画面是依赖于POC为0的画面以及POC为2的画面的画面。B画面不能在POC为0的画面和POC为2的画面的解码处理完成之前被解码。

输出单元1420产生并输出包括编码的视频数据和附加信息的NAL单元。具体地，根据本发明的实施例的输出单元1420基于GOP中包括的画面之间的编码顺序和参考依赖关系来产生参考关系信息，并产生包括产生的参考关系信息的NAL单元。可通过使用诸如有限确定自动机(DFA)的数据结构来指示以分层画面结构解码的画面的顺序和参考依赖关系。例如，根据本发明的实施例的输出单元1620可将参考依赖树(RDT)用作参考关系信息，其中，参考依赖树指示GOP内的画面之间的编码顺序和参考依赖关系。

可通过基于编码顺序和参考依赖关系将由GOP内的画面参考的画面放置在父节点并将参考父节点的画面的画面放置在子节点来产生RDT。当能够对参考父节点的画面的多个画面进行并行处理时，通过允许多个画面包括在相同层的子节点中来形成RDT。假设由I条带组成的画面可形成将被放置在最上方根节点的RDT，其中，I条带不参考GOP中包括的画面中的其它画面。随后将参照图16和图17来描述具体的RDT产生方案。

输出单元1420将参考关系信息包括在NAL单元中以被输出。参考关系信息可被包括在NAL单元之中的包含附加信息的补充增强信息(SEI)消息中。

图15示出根据本发明的实施例的NAL单元的类型。

视频编码/解码处理可被分类为在处理视频编码处理本身的视频编码层(VCL)中的编码/解码处理以及在产生或接收附加信息(诸如图像数据和参数集)的网络抽象层中的编码/解码处理，其中，图像数据和参数集在VCL与发送并存储编码的图像数据的更下层系统之间根据预定格式被编码为比特流。关于VCL的编码图像的编码数据被映射在VCL NAL单元中，用于对编码数据进行解码的参数集的附加信息被映射在非VCL NAL单元中。

参照图15，非VCL NAL单元可包括视频参数集(VPS)、序列参数集(SPS)和画面参数集(PPS)以及SEI，其中，VPS、SPS和PPS包含视频编码设备1400中使用的参数信息，SEI包含图像解码处理中需要的附加信息。VCL NAL单元包括关于编码的图像数据的信息。

NAL单元头可具有总共2字节的长度。NAL单元头是用于识别NAL单元的比特，并包括值为0的forbidden_zero_bit、指示NAL单元的类型的标识符(nal unit type)、针对未来使用而保留的区域(reserved_zero_6bits)和时间标识符(temporal_id)。标识符(nal unit type)和针对未来使用而保留的区域(reserved_zero_6bits)分别由6比特形成，时间标识符(temporal_id)可由3比特组成。NAL单元中所包括的信息的类型根据nal_unit_type的值来区分。

例如，瞬时解码刷新(IDR)画面、纯净随机访问(CRA)画面、SPS、PPS、SEI、自适应参数集(APS)、被保留以用于未来扩展的NAL单元、未定义的NAL单元等可根据nal_unit_type被分类。表2是根据nal_unit_type的值指示NAL单元的类型的示例。然而，根据nal_unit_type的NAL单元的类型不限于表2的示例。

[表2]

图16示出根据本发明的实施例的分层GOP结构，图17示出用于在图16的分层GOP结构中包括的画面的参考依赖树(RDT)。图16的分层GOP结构也被称为分层B画面结构。

参照图16，假设在分层GOP结构中，较低时间层的画面被限制为不参考较高时间层的画面。此外，箭头方向指示参考方向。例如，在图16中，P8画面参考I0画面，B4画面通过参考I0画面和P8画面被预测。

如上所述，可通过基于编码顺序和参考依赖关系将由GOP内的画面参考的画面放置在父节点并将参考父节点的画面的画面放置在子节点来产生RDT。被放置在子节点的画面是通过参考父节点和被放置在父节点的上一层中的另一画面而被预测的画面。当能对参考父节点的画面的多个画面进行并行处理时，通过允许多个画面被包括在相同层的子节点中来形成RDT。

参照图16和图17，作为在GOP中被首先编码的IDR画面的I0被放置在最上方节点中。接下来，在I0之后参考I0而被编码的P8画面被编码，并被放置在I0的子节点中。参考I0和P8的B4被放置在P8的子节点中。在图16中，B2参考I0和B4，B6参考B4和P8，并且，B2和B6两者相应于可在B4被解码的情况下被并行解码的画面相应。因此，B2和B6两者被放置在B4的子节点中。类似地，B1参考I0和B2，B3参考B2和B4。另外，B5参考B4和B6，B7参考B6和P8。因此，B1和B3被放置在B2的子节点中，B5和B7被放置在B6的子节点中。可针对第一GOP之后的GOP类似地形成RDT。然而，第一GOP中的P8与第二GOP中的被首先编码(或解码)的参考画面P16相应，并因此，P16被放置在P8的子节点中。如果P16参考I0而不是参考P8，则P8和P16与I0的子节点具有相同的层。

在图17中，如果用于GOP的RDT被形成，则被放置在相同层的子节点不相互参考，并因此与允许并行处理的画面相应。例如，在图17中，B2和B61710是可在对B4的编码(或解码)完成之后被并行处理的画面。另外，B1、B3、B5和B71720是可在对B2和B6的处理完成之后被并行处理的画面。

参照图18，在操作1810，图像编码器1410对GOP中包括的画面执行帧间预测和帧内预测，并确定GOP中包括的画面之间的编码顺序和参考依赖关系。

在操作1820中，输出单元1420基于GOP中包括的画面之间的编码顺序和参考依赖关系来产生参考关系信息，并产生包括产生的参考关系信息的NAL单元。如上所述，RDT可被用作参考关系信息，其中，RDT指示GOP中的画面之间的编码顺序和参考依赖关系。

另外，输出单元1420可将参考关系信息包括在包含补充增强信息(SEI)消息的NAL单元中，以被发送到视频解码设备。

参照图19，视频解码设备1900包括接收器1910和图像解码器1920。接收器1910获得包括参考关系信息的NAL单元，其中，参考关系信息基于GOP中包括的画面之间的解码顺序和参考依赖关系。如上所述，RDT可被用作参考关系信息，并且RDT可通过包括SEI消息的NAL单元被获得。

图像解码器1920基于SEI消息中包括的RDT，在GOP中包括的画面之中确定可被并行处理的画面。如图17中所示，被放置在RDT中所布置的节点之中的相同层上的画面是允许不相互参考的并行处理的画面。图像解码器1920可对能够并行处理的画面进行并行解码。图像解码器1920可基于如图5的图像解码器400中的树结构的解码器来执行解码。

参照图20，在操作2010，接收器1910获得包括参考关系信息的NAL单元，其中，参考关系信息是基于GOP中包括的画面之间的解码顺序和参考依赖关系而产生的。如上所述，参考关系信息可以是诸如RDT的数据结构。

在操作2020，图像解码器2020基于SEI NAL单元中所包括的参考关系信息，在GOP中包括的画面之中确定允许并行处理的画面。如上所述，被放置在RDT中所布置的节点之中的相同层上的画面是不被相互参考的画面，并因此这些画面是能够并行处理的画面。

在操作2030，图像解码器1920通过对能够并行处理的画面进行并行解码来提高解码处理速度。可从VPS、SPS、PPS和VCL NAL单元中获得在并行处理中需要的图像数据和附加信息。

根据本发明的一些实施例，能够并行处理的画面可通过经由SEI消息发送GOP中包括的画面之间的参考关系信息而在解码端中被确定。因此，根据本发明的一些实施例，在视频解码处理中能够对没有相互依赖关系的画面进行并行解码。

另外，上述并行处理编码或解码操作可通过多核系统或多线程来实现。多线程用于允许程序内的并行处理，并且即使在单个进程中也可进行并行处理。

根据本发明的实施例的并行处理编码/解码操作可通过以下步骤来实现无需单独的同步处理的并行处理：分析各个画面之间的参考依赖关系，将各个画面的编码/解码处理划分成多个单独任务，并通过依赖自由执行模型来处理各个任务。

参照图21，在多线程程序中对每个画面的编码/解码处理可被划分成n个线程2110和线程2120。线程是指在进程中被执行的流的单位。多线程可共享在共享存储器中的共享变量2130。一般地，在多线程程序中，如果共享变量2130被使用，则线程之间的同步通过使用锁(lock)或信号量(semaphore)或者通过单独的模块(诸如调度器)而被实现。例如，当第一线程2110使用共享变量2130时，其它线程2120在第一线程2110对与共享变量2130相关的锁或信号量的使用结束之前处于等待状态，并且其它线程2120的执行被调度器停止。

图22示出使用锁或信号量的多线程程序中的线程执行处理。

参照图22，在程序开始2210之后，线程保持程序的连续执行2220，直到状态通过同步变为等待状态2230为止。如果状态通过同步变为等待状态，则调度器将线程改变为等待状态2230，并且线程在锁或信号量变为可用之前处于等待状态2230。如果锁或信号量变为可用并且调度器被执行，则调度器将线程重新改变为可操作状态，如果线程根据调度策略再次进入可执行状态，则处理器的所有权被交给线程，使得程序可被执行2220。类似地，在使用锁或信号量的多线程程序中，需要单独的调度器，并且等待时间被延长直到线程被调度器重新执行为止。

可通过自旋等待(spin-wait)方案来解决这种等待时间问题。自旋等待方案是这样的方案：在该方案中，持续检查共享变量的改变并且保持线程的执行状态直到共享变量被改变为止。这种自旋等待方案可提高同步反应性(即，速度)，但为了持续检查共享变量的改变，处理器需要保持活跃状态，而不是空闲状态。因此，由于用于对共享存储器的共享变量进行确认的指令被持续执行，因此自旋等待方案会增加处理器的功耗。

因此，根据本发明的实施例的多线程程序使共享变量的值在同步处理(使用共享存储器的共享变量)中通过共享存储器被传送到线程之前线程的等待时间最小化，并尝试将处理保持在空闲状态以减少处理器的功耗。

参照图23，在操作2310，开始同步语法。在操作2320，检查共享变量是否被改变，并且，当共享变量没有改变时，在操作2330，执行处理器停止命令。如果执行了处理器停止命令，则处理器被保持在空闲状态直到中断发生为止，并因此处理器的功耗减少。处理器停止命令可由中断停止，并且能够进行调度，使得可执行其它线程和处理。当处理器处于空闲状态时，可在通过在系统中被周期性执行的定时器中断而离开空闲状态之后，检查共享变量是否被改变。也就是说，通过允许在不需要单独的调度处理的情况下周期性地检查共享变量是否被改变，处理器可被保持在空闲状态。基于根据本发明的实施例的多线程程序的同步处理，通过在由于调度而使延迟未减少的情况下检查共享变量针对各个最小调度周期是否被改变，处理器的功耗可减少。另外，与使用信号量的同步方案相比，可通过用允许例如针对各个定时器中断周期进行调度的最小时间标准来检查共享变量是否被改变，以确保快速反应性。

如上所述，根据以上示例性实施例中的一个或更多个示例性实施例，通过识别在视频解码处理中可被并行处理的画面并且对这种画面进行并行解码，可提高视频解码处理的速度。

本发明可被实现为可由计算机读取的计算机记录介质中的代码。计算机可读记录介质包括存储可由计算机系统读取的数据的所有类型的记录装置。计算机可读记录介质的一些示例是ROM、RAM、CD-ROM、磁带、软盘和光数据存储装置。另外，计算机可读记录介质可分布在通过网络连接的计算机系统中，并且可作为由可被计算机读取的代码以分布式方式被存储和执行。

应理解，在此描述的示例性实施例应仅在描述性意义上被考虑，而非为了限制的目的。在每个示例性实施例中的特征或方面的描述通常应被理解为可用于其它示例性实施例中的其它类似特征或方面。虽然已参照附图描述了一个或更多个示例性实施例，但是本领域的普通技术人员将理解，可在不脱离由权利要求限定的精神和范围的情况下，对其做出形式上和细节上的各种改变。

Claims

1.一种用于并行处理的视频编码方法，所述视频编码方法包括：

对画面组(GOP)中包括的画面执行帧间预测和帧内预测，并确定GOP中包括的画面之间的编码顺序和参考依赖关系；

产生包括参考关系信息的预定数据单元，其中，参考关系信息是基于GOP中包括的画面之间的编码顺序和参考依赖关系而产生的。

2.如权利要求1所述的视频编码方法，其中，参考关系信息是参考依赖树，其中，参考依赖树是通过基于编码顺序和参考依赖关系将由GOP中的画面参考的画面放置在父节点并将参考父节点的画面的画面放置在子节点而产生的。

3.如权利要求2所述的视频编码方法，其中，当参考父节点的画面的多个画面能够被并行处理时，参考依赖树被形成为使得所述多个画面被包括在相同层的子节点中。

4.如权利要求1所述的视频编码方法，其中，所述预定数据单元是网络适应层(NAL)单元，参考关系信息被包括在NAL单元之中的包含附加信息的补充增强信息消息(SEI)中。

5.一种用于并行处理的视频编码设备，所述视频编码设备包括：

图像编码器，对画面组(GOP)中包括的画面执行帧间预测和帧内预测，并确定GOP中包括的画面之间的编码顺序和参考依赖关系；

输出单元，产生包括参考关系信息的预定数据单元，其中，参考关系信息是基于GOP中包括的画面之间的编码顺序和参考依赖关系而产生的。

6.如权利要求5所述的视频编码设备，其中，参考关系信息是参考依赖树，其中，参考依赖树是通过基于编码顺序和参考依赖关系将由GOP中的画面参考的画面放置在父节点并将参考父节点的画面的画面放置在子节点而产生的。

7.如权利要求5所述的视频编码设备，其中，所述预定数据单元是网络适应层(NAL)单元，参考关系信息被包括在NAL单元之中的包含附加信息的补充增强信息消息(SEI)中。

8.一种用于并行处理的视频解码方法，所述视频解码方法包括：

获取包括参考关系信息的预定数据单元，其中，参考关系信息是基于画面组(GOP)中包括的画面之间的解码顺序和参考依赖关系而产生的；

基于所述数据单元中包括的参考关系信息，在GOP中包括的画面之中确定能够被并行处理的画面；

对确定的画面进行并行解码。

9.如权利要求8所述的视频解码方法，其中，参考关系信息是参考依赖树，其中，参考依赖树是通过基于编码顺序和参考依赖关系将由GOP中的画面参考的画面放置在父节点并将参考父节点的画面的画面放置在子节点而产生的。

10.如权利要求8所述的视频解码方法，其中，确定能够被并行处理的画面的步骤包括：将被包括在父节点的下层中并被包括在相同层的子节点中的画面确定为能够被并行处理的画面。

11.如权利要求8所述的视频解码方法，其中，所述预定数据单元是网络适应层(NAL)单元，参考关系信息被包括在NAL单元之中的包含附加信息的补充增强信息消息(SEI)中。

12.一种用于并行处理的视频解码设备，所述视频解码设备包括：

接收器，获取包括参考关系信息的预定数据单元，其中，参考关系信息是基于画面组(GOP)中包括的画面之间的解码顺序和参考依赖关系而产生的；

图像解码器，基于所述数据单元中包括的参考关系信息，在GOP中包括的画面之中确定能够被并行处理的画面，并且对确定的画面进行并行解码。

13.如权利要求12所述的视频解码设备，其中，参考关系信息是参考依赖树，其中，参考依赖树是通过基于编码顺序和参考依赖关系将由GOP中的画面参考的画面放置在父节点并将参考父节点的画面的画面放置在子节点而产生的。

14.如权利要求12所述的视频解码设备，其中，确定能够被并行处理的画面的步骤包括：将被包括在父节点的下层中并被包括在相同层的子节点中的画面确定为能够被并行处理的画面。

15.如权利要求12所述的视频解码设备，其中，所述预定数据单元是网络适应层(NAL)单元，参考关系信息被包括在NAL单元之中的包含附加信息的补充增强信息消息(SEI)中。