CN106031175A

CN106031175A - 使用亮度补偿的层间视频编码方法及其装置、以及视频解码方法及其装置

Info

Publication number: CN106031175A
Application number: CN201480076092.XA
Authority: CN
Inventors: 朴慜祐; 李振荣
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2013-12-20
Filing date: 2014-12-22
Publication date: 2016-10-12
Anticipated expiration: 2034-12-22
Also published as: KR20150073132A; CN106031175B; US10063878B2; JP6742243B2; KR102312335B1; US20160295227A1; WO2015093920A1; JP2017504251A

Abstract

提供了一种层间视频解码方法。所述层间视频解码方法包括：获得指示第二层当前块是否执行亮度补偿的亮度补偿信息；基于亮度补偿信息是否指示亮度补偿被执行以及第二层当前块的候选是否执行时间方向帧间预测来确定第二层当前块的候选是否可用作合并候选；基于确定的结果来产生包括至少一个合并候选的合并候选列表；通过使用所述至少一个合并候选中的一个合并候选的运动信息来确定第二层当前块的运动信息。

Description

使用亮度补偿的层间视频编码方法及其装置、以及视频解码方法及其装置

技术领域

本发明涉及一种层间视频编码方法和解码方法，更具体地讲，涉及一种基于当前块是否执行亮度补偿来产生当前块的合并候选列表的方法。

背景技术

随着用于再现和存储高分辨率或高质量视频内容的硬件正被开发和提供，对于用于有效地对高分辨率或高质量视频内容进行编码或解码的视频编解码器的需求正在增加。根据传统的视频编解码器，基于具有预定尺寸的编码单元，根据受限的编码方法来对视频进行编码。

空间域的图像数据经由频率变换被变换为频域的系数。根据视频编解码器，将图像划分为具有预定尺寸的块，对每个块执行离散余弦变换(DCT)，并按照块单元对频率系数进行编码，以进行频率变换的快速计算。与空间域的图像数据相比，频域的系数容易被压缩。具体地，由于根据经由视频编解码器的帧间预测或帧内预测的预测误差来表示空间域的图像像素值，因此当对预测误差执行频率变换时，大量数据可能被变换为0。根据视频编解码器，可通过使用更少量的数据来代替连续并重复产生的数据，从而减少数据量。

在多层视频编解码器中，第一层视频和至少一个第二层视频被编码和解码。通过去除时间/空间冗余以及第一层视频和第二层视频的层冗余，可减少第一层视频和第二层视频的数据量。

发明内容

技术问题

本发明的一个或更多个实施例包括一种基于当前块是否执行亮度补偿来有效产生当前块的合并候选列表的方法。此外，本发明的一个或更多个实施例包括一种用于降低运算复杂度的层间视频编码方法和设备以及一种层间视频解码方法。

解决方案

根据本发明的一个或更多个实施例，一种层间视频解码方法包括：获得指示第二层当前块是否执行亮度补偿的亮度补偿信息；当亮度补偿信息指示亮度补偿未被执行时，基于与所述当前块相应的第一层候选块是否执行帧间预测来确定指示第一层候选块是否可用作合并候选的合并候选可能性信息；基于合并候选可能性信息来产生包括至少一个合并候选块的合并候选列表；通过使用所述至少一个合并候选块中的一个合并候选块的运动信息来确定所述当前块的运动信息。

有益效果

通过基于当前块是否执行亮度补偿有效地产生当前块的合并候选列表，在执行层间视频编码/解码的同时降低了运算的复杂度。

附图说明

图1a是根据各种实施例的层间视频编码设备10的框图。

图1b是根据各种实施例的层间视频编码方法的流程图。

图2a是根据各种实施例的层间视频解码设备的框图。

图2b是根据各种实施例的层间视频解码方法的流程图。

图3用于描述由根据各种实施例的层间视频解码设备20基于当前块是否执行亮度补偿来确定合并候选可能性信息的方法的流程图。

图4是用于描述根据各种实施例的与第二层当前块相应的第一层候选块的示例的示图。

图5示出根据各种实施例的当前块的空间候选块。

图6示出根据实施例的在帧间预测模式下使用的时间预测候选。

图7是用于描述根据各种实施例的基于当前块是否执行亮度补偿而不将视差矢量的垂直分量设置为0的方法的流程图。

图8是根据实施例的基于根据树结构的编码单元的视频编码设备的框图。

图9是根据实施例的基于根据树结构的编码单元的视频解码设备的框图。

图10是用于描述根据实施例的编码单元的概念的示图。

图11是根据实施例的基于编码单元的图像编码器的框图。

图12是根据实施例的基于编码单元的图像解码器的框图。

图13是示出根据实施例的编码单元以及分区的示图。

图14是用于描述根据实施例的编码单元与变换单元之间的关系的示图。

图15是用于描述根据实施例的编码信息的示图。

图16是根据实施例的编码单元的示图。

图17至图19是用于描述根据实施例的编码单元、预测单元和变换单元之间的关系的示图。

图20是用于描述根据表1的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图。

图21是根据实施例的存储程序的盘的物理结构的示图。

图22是通过使用盘来记录和读取程序的盘驱动器的示图。

图23是提供内容分发服务的内容供应系统的整体结构的示图。

图24和图25分别是根据实施例的应用了本发明的视频编码方法和视频解码方法的移动电话的外部结构和内部结构的示图。

图26是根据本发明的采用通信系统的数字广播系统的示图。

图27是示出根据实施例的使用视频编码设备和视频解码设备的云计算系统的网络结构的示图。

最佳模式

本发明的一个或更多个实施例包括一种基于当前块是否执行亮度补偿来有效地产生当前块的合并候选列表的方法。此外，本发明的一个或更多个实施例包括一种能够降低运算复杂度的层间视频编码方法和设备以及层间视频解码方法。

根据本发明的一个或更多个实施例，一种层间视频解码方法包括：获得指示第二层当前块是否执行亮度补偿的亮度补偿信息；基于亮度补偿信息是否指示亮度补偿被执行以及第二层当前块的候选是否执行时间方向帧间预测来确定第二层当前块的候选是否可用作合并候选；基于确定的结果来产生包括至少一个合并候选的合并候选列表；通过使用所述至少一个合并候选中的一个合并候选的运动信息来确定第二层当前块的运动信息。

当第二层当前块的亮度补偿信息指示亮度补偿被执行并且第二层当前块的候选执行时间方向帧间预测时，不包括第二层当前块的候选的合并候选列表可被产生。

第二层当前块的候选可基于由第二层当前块的从第二层当前块的位置开始的视差矢量所指示的相应块的运动信息。

第二层当前块的候选可基于由第二层当前块的从第二层当前块的位置开始的视差矢量所指示的相应块的右下块的运动信息。

当亮度补偿信息指示亮度补偿被执行时，具有与第二层当前块的候选的运动信息之中的运动矢量和参考索引相同的运动矢量和相同的参考索引的其他候选中的一些候选或全部候选可不被包括在合并候选列表中。

当亮度补偿信息指示亮度补偿被执行时，具有与第二层当前块的候选的运动信息之中的相同的参考索引的其他候选中的一些候选或全部候选可不被包括在合并候选列表中。

第二层当前块的候选可基于与第二层当前块的从第二层当前块的位置开始的视差矢量相应的块的运动信息，所述层间视频解码方法还可包括：当亮度补偿信息指示亮度补偿未被执行时，将所述视差矢量的垂直分量确定为0。

根据本发明的一个或更多个实施例，一种层间视频编码方法包括：确定第二层当前块是否执行亮度补偿；基于第二层当前块是否执行亮度补偿以及第二层当前块的候选是否执行时间方向帧间预测来确定第二层当前块的候选是否可用作合并候选；基于确定的结果来产生包括至少一个合并候选的合并候选列表；通过使用所述至少一个合并候选中的一个合并候选的运动信息来确定第二层当前块的运动信息。

当第二层当前块执行亮度补偿并且第二层当前块的候选执行时间方向帧间预测时，不包括第二层当前块的候选的合并候选列表可被产生。

当第二层当前块执行亮度补偿时，具有与第二层当前块的候选的运动信息之中的运动矢量和参考索引相同的运动矢量和相同的参考索引的其他候选中的一些候选或全部候选可不被包括在合并候选列表中。

根据本发明的一个或更多个实施例，一种记录有程序的非暂时性计算机可读记录介质，其中，当所述程序被计算机执行时，所述程序执行所述层间视频解码方法。

根据本发明的一个或更多个实施例，一种记录有程序的非暂时性计算机可读记录介质，其中，当所述程序被计算机执行时，所述程序执行所述层间视频编码方法。

具体实施方式

在下文中，参照图1a至图7建议根据各种实施例的基于亮度补偿是否被执行的层间视频编码技术和层间视频解码技术。此外，参照图8至图20建议适用于层间视频编码技术和解码技术的根据各种实施例的基于树结构的编码单元的视频编码技术和视频解码技术。此外，参照图21至图27建议视频编码方法和视频解码方法适用的各种实施例。

在下文中，“图像”可表示静止图像或视频的运动图像，或表示视频本身。

在下文中，“样本”表示被分配给图像的采样位置并且将被处理的数据。例如，空间域的图像中的像素可以是样本。

首先，将参照图1a至图7描述根据实施例的层间视频编码设备和层间视频编码方法以及层间视频编码设备和层间视频解码方法。

图1a是根据各种实施例的层间视频编码设备10的框图。图1b是根据各种实施例的层间视频编码方法的流程图。

根据各种实施例的层间视频编码设备10可包括亮度补偿确定器12、合并候选列表产生器14和运动信息确定器16。

根据各种实施例的层间视频编码设备10可根据层对多个图像序列进行分类，并根据可伸缩视频编码方法对图像序列中的每一个图像序列进行编码，并输出包括根据层编码的数据的单独的流。层间视频编码设备10可将第一层图像序列和第二层图像序列编码为不同的层。

例如，根据基于空间可伸缩性的可伸缩视频编码方法，低分辨率图像可被编码为第一层图像，并且高分辨率图像可被编码为第二层图像。第一层图像的编码结果被输出为第一层流，第二层图像的编码结果被输出为第二层流。

根据实施例的层间视频编码设备10可通过复用器将第一层流和第二层流表示并编码为一个流。

作为另一示例，可根据可伸缩视频编码方法对多视点视频进行编码。在这种情况下，左视点图像可被编码为第一层图像，右视点图像可被编码为第二层图像。可选择地，中心视点图像、左视点图像和右视点图像均可被编码，其中，中心视点图像被编码为第一层图像、左视点图像被编码为第二层图像并且右视点图像被编码为第三层图像。可选择地，中心视点彩色图像、中心视点深度图像、左视点彩色图像、左视点深度图像、右视点彩色图像和右视点深度图像可被分别编码为第一层图像、第二层图像、第三层图像、第四层图像、第五层图像和第六层图像。作为另一示例，中心视点彩色图像、中心视点深度图像、左视点深度图像、左视点彩色图像、右视点深度图像和右视点彩色图像可被分别编码为第一层图像、第二层图像、第三层图像、第四层图像、第五层图像和第六层图像。

作为另一示例，可根据基于时间可伸缩性的时间分层预测来执行可伸缩视频编码方法。包括通过对基本帧率的图像进行编码而产生的编码信息的第一层流可被输出。时间层级可根据帧率而被分类，并且每个时间层级可根据层而被编码。通过参照基本帧率的图像对更高帧率的图像进行进一步编码，包括高帧率的编码信息的第二层流可被输出。

此外，可对第一层和多个扩展层(第二层至第K层)执行可伸缩视频编码。当存在至少三个扩展层时，第一层图像和第K层图像可被编码。因此，第一层图像的编码结果可被输出为第一层流，并且第一层图像至第K层图像的编码结果可被分别输出为第一层流至第K层流。

根据各种实施例的层间视频编码设备10可执行参考单层图像的帧间预测以便预测当前图像。通过执行帧间预测，可从与第一层(基本层)相应的区域预测出指示当前图像和参考图像之间的运动信息的运动矢量以及当前图像和参考图像之间的残差。

此外，层间视频编码设备10可执行参考第一层图像的预测信息的层间预测以便预测第二层图像的预测信息。

此外，当根据实施例的层间视频编码设备10允许至少三层(即，第一层至第三层)时，第一层图像和第三层图像之间的层间预测以及第二层图像和第三层图像之间的层间预测可根据多层预测结构而被执行。

在层间预测中，当前图像和与当前图像的层不同的层的参考图像之间的视差矢量可被推导出，并且作为当前图像和通过使用不同层的参考图像而产生的预测图像之间的差分量的残差可被产生。

根据各种实施例的层间视频编码设备10可根据层，基于视频的每个图像块执行编码。块可具有正方形状、矩形形状或任意几何形状，并且不限于具有预定尺寸的数据单元。块可以是根据树结构的编码单元之中的最大编码单元、编码单元、预测单元或变换单元。包括树结构的编码单元的最大编码单元可被不同地命名，诸如编码树单元、编码块树、块树、根块树、编码树、编码根或树干。稍后将参照图8至图20描述基于根据树结构的编码单元的视频编码和解码方法。

可基于诸如编码单元、预测单元或变换单元的数据单元执行帧间预测和层间预测。

根据各种实施例的层间视频编码设备10可通过对第一层图像执行包括帧间预测或帧内预测的源编码操作以产生符号数据。符号数据表示每个编码参数值和残差的样值。

例如，层间视频编码设备10可通过对第一层图像的数据单元的样本上的样本执行帧间预测或帧内预测、变换和量化来产生符号数据，并可通过对符号数据执行熵编码来产生第一层流。

此外，层间视频编码设备10可基于树结构的编码单元对第二层图像进行编码。第二层编码器可通过对第二层图像的编码单元的样本执行帧间/帧内预测、变换和量化来产生符号数据，并通过对符号数据执行熵编码来产生第二层流。

根据各种实施例的第二层编码器可通过使用第一层图像的预测信息来执行对第二层图像进行预测的层间预测。为了通过层间预测结构对第二层图像序列之中的第二层原始图像进行编码，第二层编码器可通过使用第一层重建图像的预测信息来确定第二层当前图像的预测信息，并通过基于确定的预测信息产生第二层预测图像来对第二层原始图像和第二层预测图像之间的预测误差进行编码。

层间视频编码设备10可根据块(诸如编码单元或预测单元)对第二层图像执行帧间预测。换句话说，可确定第一层图像中的将由第二层图像的块参考的块。例如，可确定第一层图像中的位置与第二层图像中的当前块的位置相应的重建块。层间视频编码设备10可通过使用与第二层块相应的第一层重建块来确定第二层预测块。

为了执行帧间预测，层间视频编码设备10可首先执行运动估计以在从第一层和第二层重建的重建块中搜索与第二层原始块具有高相关性的预测块。然后，找出的预测块的运动信息可被发送到层间视频解码设备20。这里，运动信息可包括根据运动估计的结果对参考画面列表0和参考画面列表1进行分类的参考方向信息、对参考列表中的参考画面进行分类的索引、以及运动矢量。

同时，为了减少与根据预测单元发送的运动信息相关的数据量，层间视频编码设备10可使用用于基于空间/时间邻近块或沿层间方向的相应块的运动信息来设置当前块的运动信息的合并模式。

层间视频编码设备10可同样地形成用于在编码设备和解码设备中预测运动信息的合并候选列表，并将所述列表中的候选选择信息发送到解码设备以便有效减少运动相关数据的量。

合并候选列表可包括基于以下项而产生的候选：基于空间邻近块的运动信息的空间候选、基于时间邻近块的运动信息的时间候选、以及基于层间方向的相应块的运动信息的层间候选。层间视频编码设备10可确定空间候选、时间候选以及层间候选是否可用作合并候选。此外，层间视频编码设备10可根据预设顺序确定是否将空间候选、时间候选、层间候选以及基于上述候选而产生的候选添加到合并候选列表。

层间候选块表示包括在与当前块中所包括的图像的层不同的层的图像中的候选块。例如，层间候选块可包括第一层重建图像中的由从第二层当前块的位置开始的当前块的视差矢量所指示的第一层相应块、以及第一层相应块的右下块。

层间候选是在当前块的帧间预测期间可使用的合并候选，并且在当前块的相应块执行了帧内编码时，层间候选块可不被包括在合并候选列表中，所述相应块的运动信息不是当前块在同一时间可参考的参考画面。

根据实施例，层间候选可仅允许时间方向的运动信息，并且在这种情况下，层间视频编码设备10可确定当前块的帧间预测的方向是层方向，且不推导层间候选的合并候选可能性信息。合并候选可能性信息是指示候选是否可用作合并候选的信息。

例如，当对当前块执行了亮度补偿时，亮度补偿总是在层间方向的预测中被执行，因此层间视频编码设备10可不推导仅允许时间方向的运动信息的层间候选的合并候选可能性信息。

当对当前块执行了亮度补偿时，层间视频编码设备10不推导层间候选块的合并候选可能性信息，因此提高了视频编码效率。

层间视频编码设备10可通过使用第一层重建图像对第二层预测块的样值与第二层原始块的样值之间的误差(即，根据层间预测的残差)进行变换和量化来执行熵编码。

如上所述，层间视频编码设备10可通过层间预测结构，通过参考第一层重建图像来对当前层图像序列进行编码。然而，根据各种实施例的层间视频编码设备10可根据单层预测结构对第二层图像序列进行编码，而不必参考其它层样本。因此，理解不应限于层间视频编码设备10仅执行层间预测结构的帧间预测以便对第二层图像序列进行编码。

同时，当层间视频编码设备10对多视点视频进行编码时，已被编码的第一层图像可以是第一视点视频，并且第二层图像可以是第二视点视频。可通过使用不同的相机或不同的镜头来捕捉根据多个视点的多个视频。可选择地，在3D图形图像中，可通过捕捉不同的投影视图来获得根据多个视点的多个视频。

在下文中，将参照图1b描述层间视频编码设备10确定增强帧间预测候选列表的详细操作。

图1b是根据各种实施例的层间视频编码方法的流程图。

在操作11，亮度补偿确定器12可确定第二层当前块是否执行亮度补偿。

例如，亮度补偿确定器12可基于当前块的预测模式来确定当前块是否执行亮度补偿。

此外，亮度补偿确定器12可产生亮度补偿信息。亮度补偿信息表示指示当前块是否执行亮度补偿的信息。例如，亮度补偿信息可包括“ic_flag”。此外，亮度补偿确定器12可设置亮度补偿信息的值。

例如，亮度补偿确定器12可在当前块执行亮度补偿时将“ic_flag”的值设置为1。此外，亮度补偿确定器12可在当前块不执行亮度补偿时将“ic_flag”的值设置为0。

层间视频编码设备10可对亮度补偿信息进行编码。例如，层间视频编码设备10可对“ic_flag”进行编码并将“ic_flag”添加到比特流。

在操作13，合并候选列表产生器14可基于当前块是否执行亮度补偿以及当前块的候选是否执行时间方向帧间预测来确定当前块的候选是否可用作当前块的合并候选。

根据实施例，当前块的合并候选可包括时间候选、空间候选以及层间候选。

根据本发明的实施例，合并候选列表产生器14可确定当前块的候选。例如，合并候选列表产生器14可将与从第二层当前块的位置开始的视差矢量相应的第一层块确定为当前块的候选。

此外，合并候选列表产生器14可将由从第二层当前块的位置开始的视差矢量所指示的第一层块的右下块确定为当前块的候选。

合并候选列表产生器14可经由各种方法中的任意一种方法来确定用于确定当前块的层间候选的视差矢量。

例如，合并候选列表产生器14可从当前块的邻近块推导当前块的视差矢量。

作为另一示例，合并候选列表产生器14可通过使用从第二层当前块的邻近块推导出的视差矢量来检测与第一层当前块相应的深度块，选择所述深度块的多个值中的一个值，并通过使用相机参数将选择的值转换为视差矢量来推导视差矢量。

此外，当未对当前块执行亮度补偿时，合并候选列表产生器14可将具有当前块的视差矢量作为运动信息的合并候选的视差矢量的垂直分量设置为0。

此外，当对当前块执行了亮度补偿时，合并候选列表产生器14可不将具有当前块的视差矢量作为运动信息的合并候选的视差矢量的垂直分量设置为0，但可使用推导出的值。

根据本发明的各种实施例，在当前块的层间相应块执行了帧内编码时，层间候选块可不被包括在合并候选列表中。

此外，在当前块的层间相应块的运动信息不是时间与当前块可参考的时间相同的参考画面时，层间候选块可不被包括在合并候选列表中。

根据本发明的各种实施例，合并候选列表产生器14可基于当前块的特定候选是否执行帧间预测来确定当前块的所述特定候选的合并候选可能性信息。

例如，在当前块不执行亮度补偿，但当前块的候选执行时间方向帧间预测时，合并候选列表产生器14可将当前块的候选的合并候选可能性信息的值确定为1。

此外，在当前块不执行亮度补偿并且与当前块相应的第一层候选不执行时间方向帧间预测时，合并候选列表产生器14可将当前块的候选的合并候选可能性信息的值确定为0。

合并候选可能性信息是指示当前块的候选是否可用作合并候选的信息，并可包括“availableFlagIvMC(指示基于与当前块的视差矢量相应的块的右下块的运动信息的候选是否可用作合并候选的信息)”和/或“availableFlagIvMCShift(指示基于与当前块的视差矢量相应的块的右下块的运动信息的候选是否可用的信息)”。

根据本发明的各种实施例，当对当前块执行了亮度补偿时，合并候选列表产生器14可不将执行时间方向预测的候选用作合并候选。

例如，在当前块执行亮度补偿时，合并候选列表产生器14可确定当前块的候选之中的执行时间方向帧间预测的候选不可用作合并候选。

此外，在第二层当前块执行亮度补偿时，合并候选列表产生器14可不确定当前块的候选之中的执行时间方向帧间预测的候选的合并候选可能性信息。

例如，在第二层当前块执行亮度补偿时，合并候选列表产生器14可不确定当前块的候选之中的执行时间方向帧间预测的候选的合并候选可能性信息，并可将当前块的候选之中的执行时间方向帧间预测的候选的合并候选可能性信息保持为预设值。

候选的合并候选可能性信息的预设值可以是0。例如，“availableFlagIvMC”和“availableFlagIvMCShift”中的每一个的预设值可以是0。

合并候选列表产生器14不确定候选的合并候选可能性信息，因此提高了视频编码效率。

此外，当第二层当前块执行亮度补偿时，合并候选列表产生器14可不执行对当前块的候选之中的执行时间方向帧间预测的候选的合并候选的推导处理，并可不将所述执行时间方向帧间预测的候选添加到合并候选列表。

例如，在当前块执行亮度补偿时，合并候选列表产生器14可不执行通过使用当前块的候选之中的执行时间方向帧间预测的候选的运动矢量来推导执行时间方向帧间预测的候选的合并可能性信息的处理。

在操作15，合并候选列表产生器14可基于所述确定的结果来产生包括当前块的候选的合并候选列表。

合并候选列表产生器14可基于所述确定的结果来产生包括至少一个合并候选的合并候选列表。例如，合并候选列表产生器14可基于合并候选可能性信息的值来确定是否将当前块的候选添加到当前块的合并候选列表。

例如，当候选的合并候选可能性信息的值为1时，合并候选列表产生器14可将当前块的候选添加到第二层当前块的合并候选列表。

此外，当候选的合并候选可能性信息的值为0时，合并候选列表产生器14可不将当前块的候选添加到第二层当前块的合并候选列表。

此外，合并候选列表产生器14可通过进一步考虑当前候选的运动矢量是否与被添加到合并候选列表的另一候选的运动矢量相同来产生合并候选列表。

例如，即使在当前候选的合并候选可能性信息的值为1时，如果被添加到合并候选列表的所述另一候选的运动矢量与当前候选的时间方向运动矢量相同，则合并候选列表产生器14也可不将当前候选添加到合并候选列表。

在操作17，运动信息确定器16可通过使用包括在合并候选列表中的所述至少一个合并候选之一的运动信息来确定当前块的运动信息。

运动信息确定器16可选择包括在合并候选列表中的合并候选之一。此外，运动信息确定器16可将选择的合并候选的运动信息设置为当前块的运动信息。

例如，运动信息确定器16可通过使用包括在合并候选列表中的每个合并候选的运动信息对第二层当前块执行帧间预测来产生每个合并候选的第二层预测图像。此外，运动信息确定器16可获得第二层当前原始图像与第二层预测图像之间的误差，并选择误差最小的合并候选。运动信息确定器16可将选择的合并候选的运动信息设置为当前块的运动信息。

此外，层间视频编码设备10可通过基于对当前块设置的运动信息对第二层当前块执行帧间预测来产生第二层预测图像，并可对第二层当前原始图像与第二层预测图像之间的误差进行编码。此外，层间视频编码设备10可对指示选择的合并候选的合并索引进行编码。

根据各种实施例的层间视频编码设备10可包括总体控制亮度补偿确定器12、合并候选列表产生器14以及运动信息确定器16的中央处理器(未示出)。可选择地，亮度补偿确定器12、合并候选列表产生器14以及运动信息确定器16可由单独的处理器(未示出)操作，并且层间视频编码设备10可作为系统化操作的单独处理器而被操作。可选择地，亮度补偿确定器12、合并候选列表产生器14以及运动信息确定器16可根据层间视频编码设备10的外部处理器(未示出)的控制而被控制。

层间视频编码设备10可包括至少一个数据存储单元(未示出)，其中，亮度补偿确定器12、合并候选列表产生器14以及运动信息确定器16的输入和输出数据被存储在所述至少一个数据存储单元中。层间视频编码设备10可包括用于管理数据存储单元(未示出)的数据输入和输出的存储器控制器(未示出)。

为了输出视频编码结果，层间视频编码设备10可与安装在层间视频编码设备10中的内部视频编码处理器或外部视频编码处理器协作操作，以便执行包括变换的视频编码操作。层间视频编码设备10的内部视频编码处理器可作为单独的处理器执行视频编码操作。此外，基本视频编码操作可被实现为包括视频编码处理模块的层间视频编码设备10、中央处理设备或图形处理设备。

图2a是根据各种实施例的层间视频解码设备的框图。

根据各种实施例的层间视频解码设备20可包括亮度补偿信息获得器22、合并候选列表产生器24以及运动信息确定器26。

根据各种实施例的层间视频解码设备20可经由可伸缩编码方法根据层接收比特流。由层间视频解码设备20接收的比特流的层的数量不受限制。然而，为了便于解释，将描述层间视频解码设备20接收第一层流并对第一层流进行解码并且接收第二层流并对第二层流进行解码的实施例。

例如，基于空间可伸缩性的层间视频解码设备20可接收具有不同分辨率的图像序列按照不同层被编码的流。可对第一层流进行解码来重建具有低分辨率的图像序列，可对第二层流进行解码来重建具有高分辨率的图像序列。

作为另一示例，可根据可伸缩视频编码方法来对多视点视频进行解码。当以多个层接收到立体视频流时，第一层流可被解码以重建左视点图像。第二层流可被进一步解码以重建右视点图像。

可选择地，当以多个层接收到多视点视频流时，第一层流可被解码以重建中间视点图像。第二层流可被进一步解码以重建左视点图像。第三层流可被进一步解码以重建右视点图像。

作为另一示例，可执行基于时间可伸缩性的可伸缩视频编码方法。第一层流可被解码以重建基本帧率图像。第二层流可被进一步解码以重建高帧率图像。

此外，在存在至少三个第二层时，可从第一层流重建第一层图像，并且当通过参考第一层重建图像来进一步对第二层流进行解码时，第二层图像可被进一步重建。当通过参考第二层重建图像来进一步对第K层流进行解码时，第K层图像可被进一步重建。

层间视频解码设备20可从第一层流和第二层流获得第一层图像和第二层图像的编码数据，并且此外，可进一步获得通过帧间预测产生的运动矢量和通过层间预测产生的预测信息。

例如，层间视频解码设备20可按照每层对帧间预测的数据进行解码，并可对多个层之间的层间预测的数据进行解码。可基于编码单元或预测单元经由运动补偿和层间解码来执行重建。

针对每层流，通过参考经由相同层的帧间预测而预测出的重建图像来执行对当前图像的运动补偿，可重建图像。运动补偿是将通过使用当前图像的运动矢量确定的参考图像和当前图像的残差进行合成来重建当前图像的重建图像的操作。

此外，层间视频解码设备20可通过参照第一层图像的预测信息来执行层间解码以对经由层间预测而被预测出的第二层图像进行解码。层间解码包括通过使用不同层的参考块的预测信息来重建当前图像的预测信息以便确定当前图像的预测信息的操作。

根据实施例的层间视频解码设备20可执行用于重建通过参考第二层图像而预测出的第三层图像的层间解码。

然而，根据各种实施例的层间视频解码设备20可在不必参考第一层图像序列的情况下对第二层流进行解码。因此，解释不应限于层间视频解码设备20执行层间预测以对第二层图像序列进行解码。

层间视频解码设备20根据视频的每个图像的块执行解码。块可以是根据树结构的编码单元之中的最大编码单元、编码单元、预测单元或变换单元。

层间视频解码设备20可通过使用解析出的第一层图像的编码符号来对第一层图像进行解码。当层间视频解码设备20接收基于树结构的编码单元而被编码的流时，层间视频解码设备20可根据第一层流的最大编码单元，基于树结构的编码单元来执行解码。

层间视频解码设备20可通过根据每个最大编码单元执行熵解码来获得编码信息和编码的数据。层间视频解码设备20可通过对从流获得的编码的数据执行反量化和逆变换来重建残差。根据另一实施例的层间视频解码设备20可直接接收量化后的变换系数的比特流。可通过对量化后的变换系数执行反量化和逆变换来重建图像的残差。

层间视频解码设备20可经由相同层图像之间的运动补偿来确定预测图像，并可通过将预测图像和残差进行组合来重建第一层图像。

根据层间预测结构，层间视频解码设备20可通过使用第一层重建图像的样本来产生第二层预测图像。层间视频解码设备20可根据层间预测通过对第二层流进行解码来获得预测误差。层间视频解码设备20可通过将第二层预测图像和预测误差进行组合来产生第二层重建图像。

层间视频解码设备20可通过使用解码的第一层重建图像来确定第二层预测图像。根据层间预测结构，层间视频解码设备20可根据块(诸如第二层图像的编码单元或预测单元)执行帧间预测。换句话说，层间视频解码设备20确定将被第二层图像的块参考的第一层图像的块。例如，位置与第二层图像中的当前块的位置相应的第一层图像的重建块可被确定。层间视频解码设备20可通过使用与第二层块相应的第一层重建块来确定第二层预测块。

同时，为了减少与根据预测单元发送的运动信息相关的数据量，层间视频解码设备20可使用用于基于空间/时间邻近块或层间方向的相应块的运动信息来设置当前块的运动信息的合并模式。

层间视频解码设备20可同样地形成用于在编码设备和解码设备中预测运动信息的合并候选列表，并可将所述列表中的候选选择信息发送到解码设备以便有效减少运动相关数据的量。

合并候选列表可包括基于以下项而产生的候选：基于空间邻近块的运动信息的空间候选、基于时间邻近块的运动信息的时间候选、以及基于层间方向的相应块的运动信息的层间候选。层间视频解码设备20可确定空间候选、时间候选和层间候选是否可用作合并候选。此外，层间视频解码设备20可根据预设顺序来确定是否将空间候选、时间候选、层间候选以及基于上述候选而产生的候选添加到合并候选列表。

层间候选块表示包括在与当前块中所包括的图像的层不同的层的图像中的候选块。例如，层间候选块可包括第一层重建图像中的由当前块的从第二层当前块的位置开始的视差矢量所指示的第一层相应块、以及第一层相应块的右下块。

层间候选是在当前块的帧间预测期间可使用的合并候选，并且在当前块的相应块执行了帧内编码时，层间候选块可不包括在合并候选列表中，所述相应块的运动信息不是当前块在同一时间可参考的参考画面。

根据实施例，层间候选可仅允许时间方向的运动信息，在这种情况下，层间视频解码设备20可将当前块的帧间预测的方向确定为层方向，并且不推导层间候选的合并候选可能性信息。合并候选可能性信息是指示候选是否可用作合并候选的信息。

例如，当对当前块执行了亮度补偿时，亮度补偿总是在层间方向中的预测中被执行，因此，层间视频编码设备10可不推导仅允许时间方向的运动信息的层间候选的合并候选可能性信息。

层间视频解码设备20可将根据层间预测结构通过使用第一层重建块而确定的第二层预测块用作用于第二层原始块的层间预测的参考图像。层间视频解码设备20可通过将通过使用第一层重建图像而确定的第二层预测块的样值与根据层间预测的残差进行合成来重建第二层块。

根据空间可伸缩视频编码方法，当层间视频解码设备20重建了分辨率与第二层图像不同的第一层图像时，层间视频解码设备20可对第一层重建图像进行内插以便将第一层重建图像的尺寸调整为与第二层原始图像相同的分辨率。经过内插的第一层重建图像可被确定为用于层间预测的第二层预测图像。

因此，层间视频解码设备20可通过对第一层流进行解码来重建第一层图像序列，并通过对第二层流进行解码来重建第二层图像序列。

同时，当层间视频解码设备20对多视点视频进行解码时，已被解码的第一层图像可以是第一视点视频，并且第二层图像可以是第二视点视频。可通过使用不同的相机或不同的镜头来捕捉根据多个视点的多个视频。

图2b是根据各种实施例的层间视频解码方法的流程图。

在操作21，亮度补偿信息获得器22可获得指示第二层当前块是否执行亮度补偿的亮度补偿信息。

例如，亮度补偿信息获得器22可从比特流获得亮度补偿信息。例如，亮度补偿信息获得器22可从比特流获得“ic_flag”。

在操作23，合并候选列表产生器24可基于亮度补偿信息是否指示亮度补偿的执行以及当前块的候选是否执行时间方向帧间预测来确定当前块的候选是否可用作合并候选。

根据本发明的实施例，合并候选列表产生器24可确定当前块的候选。例如，合并候选列表产生器24可将与从第二层当前块的位置开始的视差矢量相应的第一层块确定为当前块的候选。

此外，合并候选列表产生器24可将由从第二层当前块的位置开始的视差矢量所指示的第一层块的右下块确定为当前块的候选。

合并候选列表产生器24可经由各种方法中的任意一种方法来确定用于确定当前块的层间候选的视差矢量。

例如，合并候选列表产生器24可从当前块的邻近块推导当前块的视差矢量。

作为另一示例，合并候选列表产生器24可通过使用从第二层当前块的邻近块推导出的视差矢量来检测与第一层当前块相应的深度块，选择所述深度块的多个值中的一个值，并通过使用相机参数将选择的值转换为视差矢量来推导视差矢量。

此外，当未对当前块执行亮度补偿时，合并候选列表产生器24可将具有当前块的视差矢量作为运动信息的合并候选的视差矢量的垂直分量设置为0。

此外，当对当前块执行了亮度补偿时，合并候选列表产生器24可不将具有当前块的视差矢量作为运动信息的合并候选的视差矢量的垂直分量设置为0，但可使用推导出的值。

根据本发明的各种实施例，合并候选列表产生器24可基于当前块的特定候选是否执行帧间预测来确定当前块的所述特定候选的合并候选可能性信息。

例如，在当前块不执行亮度补偿，但当前块的候选执行时间方向帧间预测时，合并候选列表产生器24可将当前块的候选的合并候选可能性信息的值确定为1。

此外，在当前块不执行亮度补偿并且与当前块相应的第一层候选不执行时间方向帧间预测时，合并候选列表产生器24可将当前块的候选的合并候选可能性信息的值确定为0。

根据本发明的各种实施例，当对当前块执行了亮度补偿时，合并候选列表产生器24可不将执行时间方向预测的候选用作合并候选。

例如，在当前块执行亮度补偿时，合并候选列表产生器24可确定当前块的候选之中的执行时间方向帧间预测的候选不可用作合并候选。

此外，在第二层当前块执行亮度补偿时，合并候选列表产生器24可不确定当前块的候选之中的执行时间方向帧间预测的候选的合并候选可能性信息。

例如，在第二层当前块执行亮度补偿时，合并候选列表产生器24可不确定当前块的候选之中的执行时间方向帧间预测的候选的合并候选可能性信息，并可将当前块的候选之中的执行时间方向帧间预测的候选的合并候选可能性信息保持为预设值。

合并候选列表产生器24不确定候选的合并候选可能性信息，因此提高了视频编码效率。

此外，当第二层当前块执行亮度补偿时，合并候选列表产生器24可不执行对当前块的候选之中的执行时间方向帧间预测的候选的合并候选的推导处理，并可不将所述执行时间方向帧间预测的候选添加到合并候选列表。

例如，在当前块执行亮度补偿时，合并候选列表产生器24可不执行通过使用当前块的候选之中的执行时间方向帧间预测的候选的运动矢量来推导执行时间方向帧间预测的候选的合并可能性信息的处理。

在操作25，合并候选列表产生器24可基于所述确定的结果来产生包括当前块的候选的合并候选列表。

合并候选列表产生器24可基于所述确定的结果来产生包括至少一个合并候选的合并候选列表。例如，合并候选列表产生器24可基于合并候选可能性信息的值来确定是否将当前块的候选添加到当前块的合并候选列表。

例如，当候选的合并候选可能性信息的值为1时，合并候选列表产生器24可将当前块的候选添加到第二层当前块的合并候选列表。

此外，当候选的合并候选可能性信息的值为0时，合并候选列表产生器24可不将当前块的候选添加到第二层当前块的合并候选列表。

此外，合并候选列表产生器24可通过进一步考虑当前候选的运动矢量是否与被添加到合并候选列表的另一候选的运动矢量相同来产生合并候选列表。

例如，即使在当前候选的合并候选可能性信息的值为1时，如果被添加到合并候选列表的所述另一候选的运动矢量与当前候选的时间方向运动矢量相同，则合并候选列表产生器24也可不将当前候选添加到合并候选列表。

在操作27，运动信息确定器26可通过使用包括在合并候选列表中的所述至少一个合并候选之一的运动信息来确定当前块的运动信息。

运动信息确定器26可选择包括在合并候选列表中的合并候选之一。此外，运动信息确定器26可将选择的合并候选的运动信息设置为当前块的运动信息。

例如，运动信息确定器26可通过使用包括在合并候选列表中的每个合并候选的运动信息对第二层当前块执行帧间预测来产生每个合并候选的第二层预测图像。此外，运动信息确定器26可获得第二层当前原始图像与第二层预测图像之间的误差，并选择误差最小的合并候选。运动信息确定器26可将选择的合并候选的运动信息设置为当前块的运动信息。

此外，层间视频解码设备20可通过基于对当前块设置的运动信息对第二层当前块执行帧间预测来产生第二层预测图像，并可通过将从比特流获得的残差数据与预测图像的样值进行合成来重建当前块。

根据各种实施例的层间视频解码设备20可包括至少一个数据存储单元(未示出)，其中，亮度补偿信息获得器22、合并候选列表产生器24以及运动信息确定器26的输入和输出数据被存储在所述至少一个数据存储单元中。层间视频解码设备20可包括用于管理数据存储单元(未示出)的数据输入和输出的存储器控制器(未示出)。

为了经由视频解码重建视频，根据各种实施例的层间视频解码设备20可与安装在层间视频解码设备20中的内部视频编码处理器或外部视频编码处理器协作操作，以便执行包括变换的视频解码操作。层间视频解码设备20的内部视频编码处理器可以是单独的处理器，或者可选择地，层间视频解码设备20、中央处理设备或图形处理设备可包括视频解码处理模块来执行基本视频解码操作。

图3是用于描述由根据各种实施例的层间视频解码设备20基于当前块是否执行亮度补偿来确定合并候选可能性信息的方法的流程图。

层间视频解码设备20可将当前块的层间候选的合并候选可能性信息设置为0。层间候选是包括在与包括当前块的图像的层不同的层的图像中的候选。例如，层间候选可包括第一层图像中的由当前块的从第二层当前块起的视差矢量所指示的第一层块、以及第一层块的右下块。

在操作31，层间视频解码设备20可将“availableFlaglvMC”的值设置为1。“availableFlaglvMC”指示由当前块的从第二层当前块的位置开始的视差矢量所指示的第一层候选的合并候选可能性信息。

在操作32，层间视频解码设备20可确定获得的亮度补偿信息的值是否为0。例如，层间视频解码设备20可确定获得的“ic_flag”的值是否为0。

在操作33，当获得的亮度补偿信息的值为0时，层间视频解码设备20可推导“availableFlaglvMC”的值。层间视频解码设备20可基于由当前块的从第二层当前块的位置开始的视差矢量所指示的第一层候选是否执行了时间方向预测来推导“availableFlaglvMC”的值。此外，推导出的值可被确定为“availableFlaglvMC”的值。

例如，当由当前块的从第二层当前块的位置开始的视差矢量所指示的第一层块执行时间方向预测时，层间视频解码设备20可将“availableFlaglvMC”的值推导为1。此外，推导出的值可被确定为“availableFlaglvMC”的值。

参考操作34，当获得的亮度补偿信息的值不为0时，层间视频解码设备20可不推导“availableFlaglvMC”的值。例如，当“ic_flag”的值为1时，层间视频解码设备20可不推导“availableFlaglvMC”的值，而是将“availableFlaglvMC”的值保持为预设的0。

此外，当获得的“ic_flag”的值为1时，层间视频解码设备20可通过考虑与当前块相应的第一层候选的时间方向的运动信息来确定是否将各种类型的候选添加到合并候选列表。

例如，当第二层当前块的空间候选的运动矢量和与第二层当前块相应的第一层候选的运动矢量相同时，合并候选列表产生器24可不将所述空间候选添加到合并候选列表。

此外，当第二层当前块的空间候选的参考索引和与第二层当前块相应的第一层候选的参考索引相同时，合并候选列表产生器24可不将所述空间候选添加到合并候选列表，而不管所述空间候选的运动矢量和第一层候选的时间方向的运动矢量是否相同。

从操作31到操作23的处理可被同样地应用于第一层图像中的由从第二层当前块的位置开始的视差矢量所指示的第一层候选的右下候选。在这种情况下，第一层候选的右下候选的合并候选可能性信息可由“availableFlagIvMCShift””指示。

层间视频编码设备10可使用利用邻近块和当前块之间的运动信息的相关性的合并模式。

当层间视频编码设备10使用合并模式时，层间视频编码设备10可同样地形成用于在编码设备和解码设备中推导运动信息的合并候选列表，并可将所述列表中的候选选择信息发送到解码设备，因此有效地减少了运动相关数据的量。

层间视频编码设备10可将层间候选块添加到用于帧间预测的合并候选列表。层间候选块是包括在与包括当前块的图像的层不同的层的图像中的候选块。

参照图4，层间候选块可包括由当前块的从包括在第二层画面41中的当前块42的位置开始的视差矢量43所指示的块45。

此外，层间候选块可包括由当前块的从包括在第二层画面41中的当前块42的位置开始的视差矢量43所指示的块45的右下块46。

以上描述的层间候选仅是本发明的实施例。除了上述块以外，层间候选块可还包括各种块，其中，所述各种块包括在与包括当前块的图像的层不同的层的图像中。

图5示出根据各种实施例的当前块的空间候选块。

参照图5，将被参照以从当前画面50预测当前块51的运动信息的候选块可以是与当前块51空间邻近的预测单元。

例如，位于当前块51的左侧底部样本的左侧底部之外的邻近块A0 52、位于当前块51的左侧底部样本的左侧之外的邻近块A1 53、位于当前块51的右侧顶部样本的右侧顶部之外的邻近块B0 54、邻近于当前块51的右侧顶部样本的顶部之外的邻近块B1 55、以及位于当前块51的左侧顶部样本的左侧顶部之外的邻近块B2 56可以是当前块51的空间候选块。

层间视频解码设备20可确定是否将空间候选块添加到合并候选列表。例如，层间视频解码设备20可考虑当前块51是否执行亮度补偿以及与当前块51相应的第一层候选块的时间方向的运动信息来确定是否将空间候选块添加到合并候选列表。

例如，当层间视频解码设备20确定对第二层当前块51执行了亮度补偿，并且作为第二层当前块51的空间候选块之一的A0 52的时间方向运动矢量和与第二层当前块51相应的第一层候选块的时间方向运动矢量相同时，合并候选列表产生器24可不将A0 52添加到合并候选列表。

此外，当层间视频解码设备20确定对第二层当前块51执行了亮度补偿并且作为第二层当前块51的空间候选块之一的A0 52的参考索引和与第二层当前块51相应的第一层候选块的参考索引相同时，层间视频解码设备20可不将A0 52添加到合并候选列表，而不管A052的运动矢量和第一层候选块的时间方向运动矢量是否相同。

图6示出根据实施例的在帧间预测模式中使用的时间预测候选。

参照图6，对于包括在当前画面50中的当前块51的帧间预测，当前块51的包括在参考画面57中的共同定位块59以及所述共同定位块59的邻近块中的至少一个邻近块可被包括在时间预测候选中。例如，共同定位块54的右下块59可包括在时间预测候选中。同时，用于确定时间预测候选的块可以是编码单元或预测单元。

层间视频解码设备20可确定是否将时间候选块添加到合并候选列表。例如，层间视频解码设备20可考虑当前块51是否执行亮度补偿以及与当前块51相应的第一层候选块的时间方向的运动信息来确定是否将时间候选块添加到合并候选列表。

例如，当层间视频解码设备20确定对第二层当前块51执行了亮度补偿，并且作为第二层当前块51的时间候选块之一的共同定位块的时间方向运动矢量以及与第二层当前块51相应的第一层候选块的时间方向运动矢量相同时，层间视频解码设备20可不将所述共同定位块添加到合并候选列表。

此外，当层间视频解码设备20确定对第二层当前块51执行了亮度补偿，并且作为第二层当前块51的时间候选块之一的共同定位块的参考索引以及与第二层当前块51相应的第一层候选块的参考索引相同时，层间视频解码设备20可不将所述共同定位块添加到合并候选列表，而不管所述共同定位块的运动矢量以及第一层候选块的时间方向运动矢量是否相同。

层间视频解码设备20可确定层间候选块。例如，合并候选列表产生器24可将由从第二层当前块的位置开始的视差矢量所指示的第一层块确定为与当前块相应的层间候选块。

层间视频解码设备20可基于当前块是否执行亮度补偿来确定用于确定层间候选块所需的视差矢量。

例如，参照图7的操作71，当获得的ic_flag为0时，层间视频解码设备20可将当前块的视差矢量的垂直分量设置为0。

此外，参照图7的操作72，当获得的ic_flag为0时，层间视频解码设备20可不将当前块的视差矢量的垂直分量设置为0。同时，以上参照图3至图7描述的操作由层间视频解码设备20执行，但对本领域普通技术人员而言将显而易见的是，所述操作还可由层间视频编码设备10执行。

如上所述，根据实施例的层间视频编码设备10和根据实施例的层间视频解码设备20可将视频数据的块划分为具有树结构的编码单元，并且编码单元、预测单元和变换单元可用于编码单元的层间预测或帧间预测。在下文中，将参照图8至图20描述根据实施例的基于具有树结构的编码单元和变换单元的视频编码方法、视频编码设备、视频解码方法和视频解码设备。

原则上，在用于多层视频的编码和解码处理期间，单独地执行对第一层图像的编码和解码处理以及对第二层图像的编码和解码处理。换句话说，当对多层视频执行了层间预测时，单层视频的编码和解码结果可被互相参考，但是根据单层视频执行单独的编码和解码处理。

因此，由于为了便于描述而在下面参照图8至图20描述的基于具有树结构的编码单元的视频编码处理和视频解码处理是对单层视频进行处理的视频编码处理和视频解码处理，因此仅执行帧间预测和运动补偿。然而，如参照图1a至图7所描述的，为了对视频流进行编码和解码，对基本层图像和第二层图像执行层间预测和补偿。

因此，为了根据实施例的层间视频编码设备10的编码器基于具有树结构的编码单元对多层视频进行编码，层间视频编码设备10可包括与多层视频的层数一样多的图8的视频编码设备100，以便根据每个单层视频执行视频编码，由此控制每个视频编码设备100对被分配的单层视频进行编码。此外，层间视频编码设备10可通过使用每个视频编码设备100的单独的单视点的编码结果来执行视点间预测。因此，层间视频编码设备10的编码器可产生包括根据层的编码结果的基本视点视频流和第二层视频流。

类似地，为了根据实施例的层间视频解码设备20的解码器基于具有树结构的编码单元对多层视频进行解码时，层间视频解码设备20可包括与多层视频的层数一样多的图9的视频解码设备200，以便针对接收到的第一层视频流和接收到的第二层视频流根据层执行视频解码，从而控制每个视频解码设备200对被分配的单层视频进行解码。此外，层间视频解码设备20可通过使用每个视频解码设备200的单独的单层的解码结果来执行层间补偿。因此，层间视频解码设备20的解码器可产生根据层而被重建的第一层图像和第二层图像。

图8是根据本发明的实施例的基于根据树结构的编码单元的视频编码设备100的框图。

涉及基于根据树结构的编码单元的视频预测的根据实施例的视频编码设备100包括编码单元确定器120和输出单元130。在下文中，为便于描述，涉及基于根据树结构的编码单元的视频预测的根据实施例的视频编码设备100将被简称为“视频编码设备100”。

编码单元确定器120可基于图像的当前画面的最大编码单元来划分当前画面，其中，最大编码单元是具有最大尺寸的编码单元。如果当前画面大于最大编码单元，则可将当前画面的图像数据划分为至少一个最大编码单元。根据实施例的最大编码单元可以是尺寸为32×32、64×64、128×128、256×256等的数据单元，其中，数据单元的形状是宽度和长度为2的若干次方的正方形。

根据实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元从最大编码单元被空间划分的次数，并且随着深度加深，根据深度的较深层编码单元可从最大编码单元被划分到最小编码单元。最大编码单元的深度为最高深度，最小编码单元的深度为最低深度。由于随着最大编码单元的深度加深，与每个深度相应的编码单元的尺寸减小，因此与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。

如上所述，当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单元，并且每个最大编码单元可包括根据深度被划分的较深层编码单元。由于根据深度对根据实施例的最大编码单元进行划分，因此可根据深度对包括在最大编码单元中的空间域的图像数据进行分层分类。

可预先确定编码单元的最大深度和最大尺寸，其中，所述最大深度和最大尺寸限制最大编码单元的高度和宽度被分层划分的总次数。

编码单元确定器120对通过根据深度对最大编码单元的区域进行划分而获得的至少一个划分区域进行编码，并且根据所述至少一个划分区域来确定用于输出最终编码的图像数据的深度。换句话说，编码单元确定器120通过根据当前画面的最大编码单元以根据深度的较深层编码单元对图像数据进行编码，并选择具有最小编码误差的深度，来确定最终深度。将确定的最终深度和根据确定的编码深度的编码的图像数据输出到输出单元130。

基于与等于或低于最大深度的至少一个深度相应的较深层编码单元，对最大编码单元中的图像数据进行编码，并且基于每个较深层编码单元比较对图像数据进行编码的结果。在对较深层编码单元的编码误差进行比较之后，可选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个最终深度。

随着编码单元根据深度而被分层地划分并且随着编码单元的数量增加，最大编码单元的尺寸被划分。此外，即使在一个最大编码单元中编码单元与同一深度相应，仍通过分别测量每个编码单元的图像数据的编码误差来确定是否将与同一深度相应的每个编码单元划分到更低深度。因此，即使当图像数据被包括在一个最大编码单元中时，编码误差仍可根据所述一个最大编码单元中的区域而不同，因此最终深度可根据图像数据中的区域而不同。因此，可在一个最大编码单元中确定一个或更多个最终深度，并且可根据至少一个最终深度的编码单元来对最大编码单元的图像数据进行划分。

因此，根据实施例的编码单元确定器120可确定包括在最大编码单元中的具有树结构的编码单元。根据实施例的“具有树结构的编码单元”包括最大编码单元中所包括的所有较深层编码单元之中的与确定为最终深度的深度相应的编码单元。可根据最大编码单元的同一区域中的深度来分层地确定最终深度的编码单元，并可在不同区域中独立地确定最终深度的编码单元。类似地，可与另一区域中的最终深度相独立地确定当前区域中的最终深度。

根据实施例的最大深度是与从最大编码单元到最小编码单元的划分次数相关的索引。根据实施例的第一最大深度可表示从最大编码单元到最小编码单元的总划分次数。根据实施例的第二最大深度可表示从最大编码单元到最小编码单元的深度等级的总数。例如，当最大编码单元的深度是0时，对最大编码单元划分一次的编码单元的深度可被设置为1，对最大编码单元划分两次的编码单元的深度可被设置为2。这里，如果最小编码单元是最大编码单元被划分四次的编码单元，则存在深度0、1、2、3和4的深度等级，并且因此第一最大深度可被设置为4，第二最大深度可被设置为5。

可根据最大编码单元执行预测编码和变换。根据最大编码单元，基于根据等于或小于最大深度的深度的较深层编码单元来执行预测编码和变换。

由于每当根据深度对最大编码单元进行划分时，较深层编码单元的数量增加，因此对随着深度加深而产生的所有较深层编码单元执行包括预测编码和变换的编码。为了便于描述，在最大编码单元中，现在将基于当前深度的编码单元来描述预测编码和变换。

根据实施例的视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码，执行诸如预测编码、变换和熵编码的操作，此时，可针对所有操作使用相同的数据单元，或者可针对每个操作使用不同的数据单元。

例如，视频编码设备100不仅可选择用于对图像数据进行编码的编码单元，还可选择不同于编码单元的数据单元，以便对编码单元中的图像数据执行预测编码。

为了在最大编码单元中执行预测编码，可基于根据实施例的与最终深度相应的编码单元(即，基于不再被划分为与更低深度相应的编码单元的编码单元)来执行预测编码。在下文中，不再被划分且成为用于预测编码的基本单元的编码单元现在将被称为“预测单元”。通过划分预测单元而获得的分区可包括预测单元或通过对预测单元的高度和宽度中的至少一个进行划分而获得的数据单元。分区是编码单元的预测单元被划分的数据单元，并且预测单元可以是与编码单元具有相同的尺寸的分区。

例如，当2N×2N(其中，N是正整数)的编码单元不再被划分并成为2N×2N的预测单元时，分区的尺寸可以是2N×2N、2N×N、N×2N或N×N。根据实施例的分区模式的示例包括通过对预测单元的高度或宽度进行对称地划分而获得的对称分区、通过对预测单元的高度或宽度进行非对称地划分(诸如，1：n或n:1)而获得的分区、通过对预测单元进行几何地划分而获得的分区、以及具有任意形状的分区。

预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个。例如，可对2N×2N、2N×N、N×2N或N×N的分区执行帧内模式或帧间模式。此外，可仅对2N×2N的分区执行跳过模式。可对编码单元中的一个预测单元独立地执行编码，从而选择具有最小编码误差的预测模式。

根据实施例的视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与编码单元不同的数据单元，来对编码单元中的图像数据执行变换。为了在编码单元中执行变换，可基于具有小于或等于编码单元的尺寸的变换单元来执行变换。例如，变换单元可包括帧内模式的数据单元和帧间模式的变换单元。

根据实施例，以与编码单元根据树结构被划分的方式类似的方式，编码单元中的变换单元可被递归地划分为更小尺寸的区域。因此，可基于根据变换深度的具有树结构的变换单元，对编码单元中的残差数据进行划分。

还可在根据实施例的变换单元中设置变换深度，其中，变换深度指示通过对编码单元的高度和宽度进行划分而达到变换单元的划分次数。例如，在2N×2N的当前编码单元中，当变换单元的尺寸是2N×2N时，变换深度可以是0，当变换单元的尺寸是N×N时，变换深度可以是1，当变换单元的尺寸是N/2×N/2时，变换深度可以是2。换句话说，还可根据变换深度设置具有树结构的变换单元。

根据深度的划分信息不仅需要关于深度的信息，还需要关于与预测编码和变换相关的信息。因此，编码单元确定器120不仅确定具有最小编码误差的深度，还确定用于将预测单元划分为分区的分区模式、根据预测单元的预测模式以及用于变换的变换单元的尺寸。

稍后将参照图9至图19详细描述根据实施例的最大编码单元中的根据树结构的编码单元以及确定预测单元/分区和变换单元的方法。

编码单元确定器120可通过使用基于拉格朗日乘数的率失真优化来测量根据深度的较深层编码单元的编码误差。

输出单元130在比特流中输出最大编码单元的图像数据和根据深度的划分信息，其中，所述最大编码单元的图像数据基于由编码单元确定器120确定的至少一个深度而被编码。

可通过对图像的残差数据进行编码来获得编码的图像数据。

根据深度的划分信息可包括关于深度的信息、关于预测单元中的分区模式的信息、关于预测模式的信息和关于变换单元的划分的信息。

可通过使用根据深度的划分信息来定义关于最终深度的信息，其中，根据深度的划分信息指示是否对更低深度而不是当前深度的编码单元执行编码。如果当前编码单元的当前深度是深度，则对当前编码单元进行编码，因此可将划分信息定义为不将当前编码单元划分到更低深度。可选择地，如果当前编码单元的当前深度不是深度，则对更低深度的编码单元执行编码，并因此可将划分信息定义为对当前编码单元进行划分以获得更低深度的编码单元。

如果当前深度不是深度，则对被划分到更低深度的编码单元的编码单元执行编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中，因此对更低深度的每个编码单元重复执行编码，并因此可对具有相同深度的编码单元递归地执行编码。

由于针对一个最大编码单元确定具有树结构的编码单元，并且针对具有深度的编码单元确定划分信息，因此可针对一个最大编码单元确定至少一条划分信息。此外，由于根据深度对最大编码单元的图像数据进行分层划分，因此最大编码单元的图像数据的深度可根据位置而不同，因此可针对图像数据设置深度和划分信息。

因此，根据实施例的输出单元130可将相应深度和关于编码模式的编码信息分配给包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。

根据实施例的最小单元是通过将构成最低深度的最小编码单元划分为4份而获取的正方形数据单元。可选择地，根据实施例的最小单元可以是可包括在最大编码单元中所包括的所有编码单元、预测单元、分区单元和变换单元中的最大正方形数据单元。

例如，通过输出单元130输出的编码信息可被分类为根据较深层编码单元的编码信息和根据预测单元的编码信息。根据较深层编码单元的编码信息可包括关于预测模式的信息和关于分区尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息、以及关于帧内模式的插值方法的信息。

根据画面、条带或GOP定义的关于编码单元的最大尺寸的信息和关于最大深度的信息可被插入到比特流的头、序列参数集或画面参数集中。

还可通过比特流的头、序列参数集或画面参数集来输出关于针对当前视频允许的变换单元的最大尺寸的信息、以及关于变换单元的最小尺寸的信息。输出单元130可对与预测相关的参考信息、预测信息和条带类型信息进行编码并输出。

在根据最简单的实施例的视频编码设备100中，较深层编码单元可以是通过将更高深度(更高一层)的编码单元的高度或宽度划分成两份而获取的编码单元。换句话说，在当前深度的编码单元的尺寸是2N×2N时，更低深度的编码单元的尺寸是N×N。此外，尺寸为2N×2N的具有当前深度的编码单元可包括最多4个具有更低深度的编码单元。

因此，视频编码设备100可基于考虑当前画面的特征而确定的最大编码单元的尺寸和最大深度，通过针对每个最大编码单元确定具有最优形状和最优尺寸的编码单元来形成具有树结构的编码单元。此外，由于可通过使用各种预测模式和变换中的任意一个对每个最大编码单元执行编码，因此可考虑各种图像尺寸的编码单元的特征来确定最优编码模式。

因此，如果以传统宏块对具有高分辨率或大数据量的图像进行编码，则每个画面的宏块的数量极度增加。因此，针对每个宏块产生的压缩信息的条数增加，因此难以发送压缩的信息，并且数据压缩效率降低。然而，通过使用根据实施例的视频编码设备100，由于在考虑图像的尺寸的同时增加编码单元的最大尺寸，并且在考虑图像的特征的同时调整编码单元，因此可提高图像压缩效率。

以上参照图1a描述的层间视频编码设备10可包括与层数一样多的视频编码设备100，以便根据多层视频中的层对单层图像进行编码。例如，第一层编码器可包括一个视频编码设备100，第二层编码器可包括与第二层的数量一样多的视频编码设备100。

当视频编码设备100对第一层图像进行编码时，编码单元确定器120可针对每个最大编码单元根据具有树结构的编码单元确定用于帧间预测的预测单元，并可根据预测单元执行帧间预测。

即使在视频编码设备100对第二层图像进行编码时，编码单元确定器120可针对每个最大编码单元确定具有树结构的编码单元和预测单元，并可根据预测单元执行帧间预测。

视频编码设备100可对第一层图像和第二层图像之间的亮度差进行编码，以便补偿亮度差。然而，可根据编码单元的编码模式确定是否执行亮度补偿。例如，可仅对尺寸为2Nx2N的预测单元执行亮度补偿。

图9是根据本发明的各种实施例的基于根据树结构的编码单元的视频解码设备200的框图。

涉及基于具有树结构的编码单元的视频预测的根据实施例的视频解码设备200包括接收器210、图像数据和编码信息提取器220以及图像数据解码器230。为了便于描述，涉及基于具有树结构的编码单元的视频预测的根据实施例的视频解码设备200将被简称为“视频解码设备200”。

用于根据实施例的视频解码设备200的解码操作的各种术语(诸如编码单元、深度、预测单元、变换单元和各种划分信息)的定义与参照图8和视频编码设备100描述的定义相同。

接收器210接收并解析编码的视频的比特流。图像数据和编码信息提取器220从解析的比特流针对每个编码单元提取编码的图像数据，并将提取的图像数据输出到图像数据解码器230，其中，编码单元具有根据每个最大编码单元的树结构。图像数据和编码信息提取器220可从关于当前画面的头、序列参数集或画面参数集提取关于当前画面的编码单元的最大尺寸的信息。

此外，图像数据和编码信息提取器220从解析的比特流根据每个最大编码单元提取具有树结构的编码单元的最终深度和划分信息。提取的最终深度和划分信息被输出到图像数据解码器230。换句话说，比特流中的图像数据被划分为最大编码单元，使得图像数据解码器230针对每个最大编码单元对图像数据进行解码。

可针对至少一条深度信息设置根据最大编码单元的深度和划分信息，所述划分信息可包括关于相应编码单元的分区模式的信息、关于预测模式的信息和关于变换单元的划分的信息。此外，根据深度的划分信息可被提取为关于深度的信息。

由图像数据和编码信息提取器220提取的根据每个最大编码单元的深度和划分信息是这样的深度和划分信息：所述深度和划分信息被确定为在编码器(诸如，根据实施例的视频编码设备100)根据每个最大编码单元对根据深度的每个较深层编码单元重复地执行编码时产生最小编码误差。因此，视频解码设备200可通过根据产生最小编码误差的编码深度和编码模式对图像数据进行解码来重建图像。

由于根据实施例的关于深度和编码模式的编码信息可被分配给相应的编码单元、预测单元和最小单元之中的预定数据单元，因此图像数据和编码信息提取器220可根据预定数据单元提取深度和划分信息。如果相应最大编码单元的深度和划分信息根据预定数据单元被记录，则可将被分配相同的深度和相同的划分信息的预定数据单元推断为是包括在同一最大编码单元中的数据单元。

图像数据解码器230可基于根据最大编码单元的深度和划分信息，通过对每个最大编码单元中的图像数据进行解码来重建当前画面。换句话说，图像数据解码器230可基于提取出的关于包括在每个最大编码单元中的具有树结构的编码单元之中的每个编码单元的分区模式、预测模式和变换单元的信息，对编码的图像数据进行解码。解码处理可包括预测(包含帧内预测和运动补偿)和逆变换。

图像数据解码器230可基于关于根据深度的编码单元的预测单元的分区模式和预测模式的信息，根据每个编码单元的分区和预测模式执行帧内预测或运动补偿。

此外，图像数据解码器230可针对每个编码单元读取关于根据树结构的变换单元的信息，以便基于每个编码单元的变换单元执行逆变换，以针对每个最大编码单元来进行逆变换。经过逆变换，可重建编码单元的空间域的像素值。

图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的深度。如果划分信息指示图像数据在当前深度中不再被划分，则当前深度是深度。因此，图像数据解码器230可通过使用关于预测单元的分区模式的信息、关于预测模式的信息和关于变换单元的尺寸的信息，对当前最大编码单元中的编码的数据进行解码。

换句话说，可通过观察被分配用于编码单元、预测单元和最小单元之中的预定数据单元的编码信息集来收集包含包括相同划分信息的编码信息的数据单元，并且收集的数据单元可被认为是将由图像数据解码器230以相同编码模式进行解码的一个数据单元。这样，可通过获得关于每个编码单元的编码模式的信息来对当前编码单元进行解码。

以上参照图2a描述的多层视频解码设备20可包括与视点数一样多的视频解码设备200，以便通过对接收的第一层图像流和接收的第二层图像流进行解码，从而重建第一层图像和第二层图像。

当第一层图像流被接收时，视频解码设备200的图像数据解码器230可将由图像数据和编码信息提取器220从第一层图像流提取的第一层图像的样本划分为具有树结构的编码单元。图像数据解码器230可通过对通过划分第一层图像的样本而获得的具有树结构的编码单元执行用于帧间预测的根据预测单元的运动补偿，重建第一层图像。

当第二层图像流被接收时，视频解码设备200的图像数据解码器230可将由图像数据和编码信息提取器220从第二层图像流提取的第二层图像的样本划分为具有据树结构的编码单元。图像数据解码器230可通过对通过划分第二层图像的样本而获得的编码单元执行用于帧间预测的根据预测单元的运动补偿，重建第二层图像。

提取器220可从比特流获得与亮度误差相关的信息，以便补偿第一层图像和第二层图像之间的亮度差。然而，可根据编码单元的编码模式确定是否执行亮度补偿。例如，可仅对尺寸为2Nx2N的预测单元执行亮度补偿。

因此，视频解码设备200可获得与在对每个最大编码单元递归地执行编码时产生最小编码误差的至少一个编码单元有关的信息，并可使用所述信息来对当前画面进行解码。换句话说，可对每个最大编码单元中的被确定为最优编码单元的具有树结构的编码单元进行解码。

因此，即使图像数据具有高分辨率和大数据量，也可通过使用通过使用编码单元的尺寸和编码模式来有效地对图像数据进行解码和重建，其中，所述编码单元的尺寸和编码模式是通过使用从编码器接收的最优划分信息，根据图像数据的特性而被自适应地确定的。

图10是用于描述根据各种实施例的编码单元的概念的示图。

编码单元的尺寸可被表示为宽度×高度，并且可以是64×64、32×32、16×16和8×8。64×64的编码单元可被划分为64×64、64×32、32×64或32×32的分区，32×32的编码单元可被划分为32×32、32×16、16×32或16×16的分区，16×16的编码单元可被划分为16×16、16×8、8×16或8×8的分区，8×8的编码单元可被划分为8×8、8×4、4×8或4×4的分区。

在视频数据310中，分辨率为1920×1080，编码单元的最大尺寸为64，最大深度为2。在视频数据320中，分辨率为1920×1080，编码单元的最大尺寸为64，最大深度为3。在视频数据330中，分辨率为352×288，编码单元的最大尺寸为16，最大深度为1。图10中示出的最大深度表示从最大编码单元到最小解码单元的划分总次数。

如果分辨率高或数据量大，则编码单元的最大尺寸可能较大，从而不仅提高编码效率，而且准确地反映图像的特征。因此，具有比视频数据330更高分辨率的视频数据310和320的编码单元的最大尺寸可以是64。

由于视频数据310的最大深度是2，因此由于通过对最大编码单元划分两次，深度加深至两层，因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元和长轴尺寸为32和16的编码单元。由于视频数据330的最大深度是1，因此由于通过对最大编码单元划分一次，深度加深至一层，因此视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元和长轴尺寸为8的编码单元。

由于视频数据320的最大深度是3，因此由于通过对最大编码单元划分三次，深度加深至3层，因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元和长轴尺寸为32、16和8的编码单元。随着深度加深，可准确地表达详细信息。

图11是根据各种实施例的基于编码单元的图像编码器400的框图。

根据实施例的图像编码器400执行视频编码设备100的编码单元确定器120对图像数据进行编码的操作。换句话说，帧内预测器420在当前帧405中根据每个预测单元对帧内模式下的编码单元执行帧内预测，帧间预测器415根据每个预测单元通过使用当前图像405和由恢复画面缓存器410获得的参考图像对帧间模式下的编码单元执行帧间预测。当前图像405可被划分为最大编码单元，然后最大编码单元可被顺序编码。这里，可对从最大编码单元按照树结构划分的编码单元执行编码。

通过从将被编码的当前图像405的数据减去从帧内预测器420或帧间预测器415输出的每个模式的编码单元的预测数据来产生残差数据，并且所述残差数据根据每个变换单元通过变换器425和量化器430被输出为量化后的变换系数。量化后的变换系数通过反量化器445和逆变换器450被恢复为空间域中的残差数据。空间域中的残差数据被添加到从帧内预测器420或帧间预测器输出的每个模式的编码单元的预测数据，从而被恢复为当前图像405的编码单元的空间域中的数据。空间域中的数据通过去块单元455和样本自适应偏移(SAO)执行器460，因此恢复的图像被产生。恢复的图像被存储在恢复画面缓存器410中。恢复画面缓存器410中存储的恢复的图像可被用作用于另一图像的帧间预测的参考图像。通过变换器425和量化器430获得的量化的变换系数可通过熵编码器435被输出为比特流440。

为了将根据实施例的图像编码器400应用于视频编码设备100，图像编码器400的组件(即，帧间预测器415、帧内预测器420、变换器425、量化器430、熵编码器435、反量化器445、逆变换器450、去块单元455和SAO执行器460)根据每个最大编码单元基于具有树结构的编码单元之中的每个编码单元执行操作。

具体地，帧内预测器420和帧间预测器415可在考虑当前最大编码单元的最大尺寸和最大深度的同时确定具有树结构的编码单元之中的每个编码单元的分区和预测模式，变换器425可确定是否在具有树结构的编码单元之中的每个编码单元中划分根据四叉树的变换单元。

图12是根据各种实施例的基于编码单元的图像解码器500的框图。

熵解码器515从比特流505解析将被解码的编码图像数据和解码所需的编码信息。编码图像数据是量化后的变换系数，并且反量化器520和逆变换器525从所述量化后的变换系数恢复残差数据。

帧内预测器540根据预测单元对帧内模式下的编码单元执行帧内预测。帧间预测器535通过使用由恢复画面缓存器530获得的参考图像，根据预测单元对来自当前图像的帧间模式下的编码单元执行帧间预测。

通过经由帧内预测器和帧间预测器535将残差数据和每个模式的编码单元的预测数据相加，当前图像的编码单元的空间域中的数据被恢复，并且空间域中的数据可通过去块单元545和SAO执行器550被输出为恢复的图像。另外，恢复画面缓存器530中存储的恢复的图像可被输出为参考图像。

为了在视频解码设备200的图像数据解码器230中对图像数据进行解码，可执行根据实施例的图像解码器500的熵解码器515之后的操作。

为了将图像解码器500应用于根据实施例的视频解码设备200，图像解码器500的组件(即，熵解码器515、反量化器520、逆变换器525、帧内预测器540、帧间预测器535、去块单元545和SAO执行器550)可针对每个最大编码单元基于具有树结构的编码单元执行操作。

具体地，帧内预测器540和帧间预测器535根据具有树结构的编码单元中的每个编码单元确定分区模式和预测模式，逆变换器525可针对每个编码单元确定是否划分根据四叉树结构的变换单元。

图10的编码操作和图11的解码操作分别是单层中的视频流编码操作和视频流解码操作。因此，当图1a的编码器16对至少两层的视频流进行编码时，图1a的视频编码设备100可包括与层数一样多的图像编码器400。类似地，当图2a的解码器22对至少两层的视频流进行解码时，图2a的视频解码设备200可包括与层数一样多的图像解码器500。

图13是示出根据本发明的各种实施例的编码单元以及分区的示图。

根据实施例的视频编码设备100和根据实施例的视频解码设备200使用分层编码单元以考虑图像的特征。可根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度，或可由用户不同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。

在根据实施例的编码单元的分层结构600中，编码单元的最大高度和最大宽度均是64，最大深度是3。在此情况下，最大深度是指编码单元从最大编码单元到最小编码单元被划分的总次数。由于深度沿着根据实施例的编码单元的分层结构600的垂直轴加深，因此较深层编码单元的高度和宽度均被划分。此外，预测单元和分区沿着分层结构600的水平轴被示出，其中，所述预测单元和分区是对每个较深层编码单元进行预测编码的基础。

换句话说，编码单元610是分层结构600中的最大编码单元，其中，深度为0，尺寸(即，高度乘宽度)为64×64。深度沿着垂直轴加深，存在尺寸为32×32且深度为1的编码单元620、尺寸为16×16且深度为2的编码单元630、尺寸为8×8且深度为3的编码单元640。尺寸为8×8和深度为3的编码单元640是最小编码单元。

编码单元的预测单元和分区根据每个深度沿着水平轴被排列。换句话说，如果尺寸为64×64且深度为0的编码单元610是预测单元，则可将预测单元划分成包括在编码单元610中的分区，即，尺寸为64×64的分区610、尺寸为64×32的分区612、尺寸为32×64的分区614或尺寸为32×32的分区616。

类似地，可将尺寸为32×32且深度为1的编码单元620的预测单元划分成包括在编码单元620中的分区，即，尺寸为32×32的分区620、尺寸为32×16的分区622、尺寸为16×32的分区624和尺寸为16×16的分区626。

类似地，可将尺寸为16×16且深度为2的编码单元630的预测单元划分成包括在编码单元630中的分区，即，包括在编码度单元630中的尺寸为16×16的分区、尺寸为16×8的分区632、尺寸为8×16的分区634和尺寸为8×8的分区636。

类似地，可将尺寸为8×8且深度为3的编码单元640的预测单元划分成包括在编码单元640中的分区，即，包括在编码单元640中的尺寸为8×8的分区、尺寸为8×4的分区642、尺寸为4×8的分区644和尺寸为4×4的分区646。

为了确定最大编码单元610的深度，根据实施例的视频编码设备100的编码单元确定器120对包括在最大编码单元610中的与每个深度相应的编码单元执行编码。

随着深度加深，包括具有相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量增加。例如，需要四个与深度2相应的编码单元来覆盖包括在与深度1相应的一个编码单元中的数据。因此，为了根据深度比较对相同数据进行编码的结果，与深度1相应的编码单元和四个与深度2相应的编码单元均被编码。

为了针对多个深度之中的当前深度执行编码，可沿着分层结构600的水平轴，通过对与当前深度相应的编码单元中的每个预测单元执行编码，来针对当前深度选择最小编码误差。可选择地，随着深度沿着分层结构600的垂直轴加深，可通过针对每个深度执行编码来比较根据深度的最小编码误差，以搜索最小编码误差。最大编码单元610中的具有最小编码误差的深度和分区可被选为最大编码单元610的深度和分区模式。

图14是用于描述根据各种实施例的编码单元和变换单元之间的关系的示图。

根据实施例的视频编码设备100或根据实施例的视频解码设备200针对每个最大编码单元，根据具有小于或等于最大编码单元的尺寸的编码单元对图像进行编码或解码。可基于不大于相应编码单元的数据单元来选择用于在编码期间进行变换的变换单元的尺寸。

例如，在根据实施例的视频编码设备100或根据实施例的视频解码设备200中，如果编码单元710的尺寸是64×64，则可通过使用尺寸为32×32的变换单元720来执行变换。

此外，可通过对小于64×64的尺寸为32×32、16×16、8×8和4×4的变换单元中的每一个执行变换，来对尺寸为64×64的编码单元710的数据进行编码，然后可选择具有最小编码误差的变换单元。

图15是用于描述根据各种实施例的编码信息的示图。

根据实施例的视频编码设备100的输出单元130可对与深度相应的每个编码单元的关于分区模式的信息800、关于预测模式的信息810以及关于变换单元的尺寸的信息820进行编码，并将信息800、信息810以及信息820作为划分信息来发送。

信息800指示关于通过划分当前编码单元的预测单元而获得的分区的形状的信息，其中，分区是用于对当前编码单元进行预测编码的数据单元。例如，可将尺寸为2N×2N的当前编码单元CU_0划分成以下分区中的任意一个：尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806和尺寸为N×N的分区808。这里，关于分区类型的信息800被设置为指示以下分区之一：尺寸为2N×N的分区804、尺寸为N×2N的分区806和尺寸为N×N的分区808。

信息810指示每个分区的预测模式。例如，信息810可指示对由信息800指示的分区执行的预测编码的模式，即，帧内模式812、帧间模式814或跳过模式816。

信息820指示当对当前编码单元执行变换时所基于的变换单元。例如，变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧间变换单元828。

根据实施例的视频解码设备200的图像数据和编码信息提取器220可根据每个较深层编码单元，提取并使用用于解码的信息800、信息810和信息820。

图16是根据各种实施例的根据深度的较深层编码单元的示图。

划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分成更低深度的编码单元。

用于对深度为0且尺寸为2N_0×2N_0的编码单元900进行预测编码的预测单元910可包括以下分区模式的分区：尺寸为2N_0×2N_0的分区模式912、尺寸为2N_0×N_0的分区模式914、尺寸为N_0×2N_0的分区模式916和尺寸为N_0×N_0的分区模式918。图9仅示出了通过对称地划分预测单元而获得的分区912至918，但是分区模式不限于此，并且预测单元的分区可包括非对称分区、具有预定形状的分区和具有几何形状的分区。

根据每种分区模式，对尺寸为2N_0×2N_0的一个分区、尺寸为2N_0×N_0的两个分区、尺寸为N_0×2N_0的两个分区和尺寸为N_0×N_0的四个分区重复地执行预测编码。可对尺寸为2N_0×2N_0、N_0×2N_0、2N_0×N_0和N_0×N_0的分区执行帧内模式和帧间模式下的预测编码。仅对尺寸为2N_0×2N_0的分区执行跳过模式下的预测编码。

如果在分区模式912至916中的一个分区模式中编码误差最小，则可不将预测单元910划分到更低深度。

如果在分区模式918中编码误差最小，则深度从0改变到1以在操作920中对分区模式918进行划分，并对深度为2且尺寸为N_0×N_0的编码单元930重复地执行编码来搜索最小编码误差。

用于对深度为1且尺寸为2N_1×2N_1(＝N_0×N_0)的编码单元930进行预测编码的预测单元940可包括以下分区模式的分区：尺寸为2N_1×2N_1的分区模式942、尺寸为2N_1×N_1的分区模式944、尺寸为N_1×2N_1的分区模式946以及尺寸为N_1×N_1的分区模式948。

如果在分区模式948中编码误差最小，则深度从1改变到2以在操作950中对分区模式948进行划分，并对深度为2且尺寸为N_2×N_2的编码单元960重复执行编码来搜索最小编码误差。

当最大深度是d时，根据每个深度的划分操作可被执行直到深度变成d-1时，并且划分信息可被编码直到深度是0到d-2之一时。换句话说，当编码被执行直到在与d-2的深度相应的编码单元在操作970中被划分之后深度是d-1时，用于对深度为d-1且尺寸为2N_(d-1)×2N_(d-1)的编码单元980进行预测编码的预测单元990可包括以下分区模式的分区：尺寸为2N_(d-1)×2N_(d-1)的分区模式992、尺寸为2N_(d-1)×N_(d-1)的分区模式994、尺寸为N_(d-1)×2N_(d-1)的分区模式996和尺寸为N_(d-1)×N_(d-1)的分区模式998。

可对分区模式之中的尺寸为2N_(d-1)×2N_(d-1)的一个分区、尺寸为2N_(d-1)×N_(d-1)的两个分区、尺寸为N_(d-1)×2N_(d-1)的两个分区、尺寸为N_(d-1)×N_(d-1)的四个分区重复地执行预测编码，以搜索具有最小编码误差的分区模式。

即使当分区模式998具有最小编码误差时，由于最大深度是d，因此深度为d-1的编码单元CU_(d-1)不再被划分到更低深度，用于构成当前最大编码单元900的编码单元的深度被确定为d-1，并且当前最大编码单元900的分区模式可被确定为N_(d-1)×N_(d-1)。此外，由于最大深度是d，因此不设置针对深度为d-1的编码单元952的划分信息。

数据单元999可以是用于当前最大编码单元的“最小单元”。根据实施例的最小单元可以是通过将具有最低深度的最小编码单元划分成4份而获得的正方形数据单元。通过重复地执行编码，根据实施例的视频编码设备100可通过比较根据编码单元900的深度的编码误差来选择具有最小编码误差的深度以确定深度，并将相应分区模式和预测模式设置为该深度的编码模式。

这样，在所有深度1至d中对根据深度的最小编码误差进行比较，并且具有最小编码误差的深度可被确定为d深度。该深度、预测单元的分区模式和预测模式可作为划分信息被编码并被发送。此外，由于编码单元从深度0被划分到深度，因此仅将该深度的划分信息设置为0，并且将除了该深度以外的深度的划分信息设置为1。

根据实施例的视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元900的深度和预测单元的信息，以对分区912进行解码。根据实施例的视频解码设备200可通过使用根据深度的划分信息，将划分信息为0的深度确定为深度，并且使用相应深度的划分信息来进行解码。

图17至图19是用于描述根据各种实施例的在编码单元、预测单元和变换单元之间的关系的示图。

编码单元1010是最大编码单元中的根据由根据实施例的视频编码设备100确定的深度的具有树结构的编码单元。预测单元1060是根据深度的每个编码单元的预测单元的分区，变换单元1070是根据深度的每个编码单元的变换单元。

当在编码单元1010中最大编码单元的深度是0时，编码单元1012和1054的深度是1，编码单元1014、1016、1018、1028、1050和1052的深度是2，编码单元1020、1022、1024、1026、1030、1032和1048的深度是3，编码单元1040、1042、1044和1046的深度是4。

在预测单元1060中，通过划分编码单元1010中的编码单元来获得一些编码单元1014、1016、1022、1032、1048、1050、1052和1054。换句话说，编码单元1014、1022、1050和1054中的分区模式的尺寸是2N×N，编码单元1016、1048和1052中的分区模式的尺寸是N×2N，编码单元1032的分区模式的尺寸为N×N。编码单元1010的预测单元和分区小于或等于每个编码单元。

在小于编码单元1052的数据单元中的变换单元1070中，对编码单元1052的图像数据执行变换或逆变换。此外，在尺寸和形状方面，变换单元1070中的编码单元1014、1016、1022、1032、1048、1050和1052不同于预测单元1060中的编码单元1014、1016、1022、1032、1048、1050和1052。换句话说，根据各种实施例的视频编码设备100和视频解码设备200可对同一编码单元中的数据单元独立地执行帧内预测、运动估计、运动补偿、变换和逆变换。

因此，对最大编码单元的每个区域中的具有分层结构的每个编码单元递归地执行编码来确定最优编码单元，从而可获得具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区模式的信息、关于预测模式的信息和关于变换单元的尺寸的信息。表1示出可由根据实施例的视频编码设备100和视频解码设备200设置的编码信息。

[表1]

根据实施例的视频编码设备100的输出单元130可输出关于具有树结构的编码单元的编码信息，根据实施例的视频解码设备200的图像数据和编码信息提取器220可从接收到的比特流提取关于具有树结构的编码单元的编码信息。

划分信息指示是否将当前编码单元划分成更低深度的编码单元。如果当前深度d的划分信息是0，则当前编码单元不再被划分成更低深度的深度是深度，从而可针对深度来定义关于分区模式、预测模式和变换单元的尺寸的信息。如果当前编码单元根据划分信息被进一步划分，则对更低深度的四个划分编码单元独立地执行编码。

预测模式可以是帧内模式、帧间模式和跳过模式中的一种。可在所有分区模式中定义帧内模式和帧间模式，可仅在尺寸为2N×2N的分区模式中定义跳过模式。

关于分区模式的信息可指示通过对称地划分预测单元的高度或宽度而获得的尺寸为2N×2N、2N×N、N×2N和N×N的对称分区模式，以及通过非对称地划分预测单元的高度或宽度而获得的尺寸为2N×nU、2N×nD、nL×2N和nR×2N的非对称分区模式。可通过按1:3和3:1来划分预测单元的高度来分别获得尺寸为2N×nU和2N×nD的非对称分区模式，可通过按1:3和3:1来划分预测单元的宽度来分别获得尺寸为nL×2N和nR×2N的非对称分区模式。

可将变换单元的尺寸设置成帧内模式下的两种类型和帧间模式下的两种类型。换句话说，如果变换单元的划分信息是0，则变换单元的尺寸可以是2N×2N，即当前编码单元的尺寸。如果变换单元的划分信息是1，则可通过对当前编码单元进行划分来获得变换单元。此外，如果尺寸为2N×2N的当前编码单元的分区模式是对称分区模式，则变换单元的尺寸可以是N×N，如果当前编码单元的分区模式是非对称分区模式，则变换单元的尺寸可以是N/2×N/2。

根据实施例，关于具有树结构的编码单元的编码信息可包括与深度相应的编码单元、预测单元和最小单元中的至少一个。与深度相应的编码单元可包括包含相同编码信息的预测单元和最小单元中的至少一个。

因此，通过比较邻近数据单元的编码信息来确定邻近数据单元是否被包括在与深度相应的同一编码单元中。此外，通过使用数据单元的编码信息来确定与深度相应的相应编码单元，并因此可确定最大编码单元中的深度的分布。

因此，如果基于邻近数据单元的编码信息来对当前编码单元进行预测，则可直接参考并使用与当前编码单元邻近的较深层编码单元中的数据单元的编码信息。

可选择地，如果基于邻近数据单元的编码信息来对当前编码单元进行预测，则使用数据单元的编码信息来搜索与当前编码单元邻近的数据单元，并可参考搜索到的邻近编码单元来对当前编码单元进行预测。

最大编码单元1300包括多个深度的编码单元1302、1304、1306、1312、1314、1316和1318。这里，由于编码单元1318是具有深度的编码单元，因此划分信息可被设置成0。可将关于尺寸为2N×2N的编码单元1318的分区模式的信息设置成以下分区模式中的一种：尺寸为2N×2N的分区模式1322、尺寸为2N×N的分区模式1324、尺寸为N×2N的分区模式1326、尺寸为N×N的分区模式1328、尺寸为2N×nU的分区模式1332、尺寸为2N×nD的分区模式1334、尺寸为nL×2N的分区模式1336和尺寸为nR×2N的分区模式1338。

变换单元的划分信息(TU尺寸标志)是一种类型的变换索引。与变换索引相应的变换单元的尺寸可根据编码单元的预测单元类型或分区模式而改变。

例如，当分区模式被设置为对称(即，分区模式1322、1324、1326或1328)时，如果变换单元的TU尺寸标志是0，则设置尺寸为2N×2N的变换单元1342，如果TU尺寸标志是1，则设置尺寸为N×N的变换单元1344。

当分区模式被设置成非对称(即，分区模式1332、1334、1336或1338)时，如果TU尺寸标志是0，则设置尺寸为2N×2N的变换单元1352，如果TU尺寸标志是1，则设置尺寸为N/2×N/2的变换单元1354。

参照图19，TU尺寸标志是具有值0或1的标志，但是根据实施例的TU尺寸标志不限于1比特，并且变换单元可在TU尺寸标志从0增加时被分层划分具有树结构。变换单元的划分信息(TU尺寸标志)可以是变换索引的示例。

在这种情况下，可通过使用根据实施例的变换单元的TU尺寸标志以及变换单元的最大尺寸和最小尺寸来表示实际上已使用的变换单元的尺寸。根据实施例的视频编码设备100能够对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标志进行编码。对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标志进行编码的结果可被插入SPS。根据实施例的视频解码设备200可通过使用最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标志来对视频进行解码。

例如，(a)如果当前编码单元的尺寸是64×64并且最大变换单元尺寸是32×32，则(a-1)当TU尺寸标志为0时，变换单元的尺寸可以是32×32，(a-2)当TU尺寸标志为1时，变换单元的尺寸可以是16×16，(a-3)当TU尺寸标志为2时，变换单元的尺寸可以是8×8。

作为另一示例，(b)如果当前编码单元的尺寸是32×32并且最小变换单元尺寸是32×32，则(b-1)当TU尺寸标志为0时，变换单元的尺寸可以是32×32。这里，由于变换单元的尺寸不能够小于32×32，因此TU尺寸标志不能够被设置为除了0以外的值。

作为另一示例，(c)如果当前编码单元的尺寸是64×64并且最大TU尺寸标志为1，则TU尺寸标志可以是0或1。这里，TU尺寸标志不能够被设置为除了0或1以外的值。

因此，如果定义最大TU尺寸标志为“MaxTransformSizeIndex”，最小变换单元尺寸为“MinTransformSize”，并且当TU尺寸标志为0时的变换单元尺寸为“RootTuSize”，则可通过等式(1)来定义可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”：

CurrMinTuSize＝max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex)) …(1)

与可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”相比，当TU尺寸标志为0时的变换单元尺寸“RootTuSize”可指示可在系统中选择的最大变换单元尺寸。在等式(1)中，“RootTuSize/(2^MaxTransformSizeIndex)”指示当TU尺寸标志为0时，变换单元尺寸“RootTuSize”被划分了与最大TU尺寸标志相应的次数时的变换单元尺寸，“MinTransformSize”指示最小变换尺寸。因此，“RootTuSize/(2^MaxTransformSizeIndex)”和“MinTransformSize”中较小的值可以是可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”。

根据实施例，最大变换单元尺寸RootTuSize可根据预测模式的类型而改变。

例如，如果当前预测模式是帧间模式，则可通过使用以下的等式(2)来确定“RootTuSize”。在等式(2)中，“MaxTransformSize”指示最大变换单元尺寸，“PUSize”指示当前预测单元尺寸。

RootTuSize＝min(MaxTransformSize,PUSize)……(2)

也就是说，如果当前预测模式是帧间模式，则当TU尺寸标志为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前预测单元尺寸中较小的值。

如果当前分区单元的预测模式是帧内模式，则可通过使用以下的等式(3)来确定“RootTuSize”。在等式(3)中，“PartitionSize”指示当前分区单元的尺寸：

RootTuSize＝min(MaxTransformSize,PartitionSize)……(3)

也就是说，如果当前预测模式是帧内模式，则当TU尺寸标志为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前分区单元的尺寸之中较小的值。

然而，根据分区单元中的预测模式的类型而改变的当前最大变换单元尺寸“RootTuSize”仅是示例，并且本发明不限于此。

根据以上参照图8至图20描述的基于具有树结构的编码单元的视频编码方法，可针对树结构的每个编码单元对空间域的图像数据进行编码。根据基于具有树结构的编码单元的视频解码方法，对每个最大编码单元执行解码来重建空间域的图像数据。因此，画面和作为画面序列的视频可被重建。重建的视频可由再现设备来再现，可存储在存储介质中，或可通过网络来发送。

根据本发明的实施例可被编写为计算机程序，并可实现在使用计算机可读记录介质执行程序的通用数字计算机中。计算机可读记录介质的示例包括磁存储介质(例如，ROM、软盘、硬盘等)和光学记录介质(例如，CD-ROM或DVD)等。

为便于描述，以上参照图1a至图20描述的层间视频编码方法和/或视频编码方法将被统称为“本发明的视频编码方法”。此外，以上参照图1a至图20描述的层间视频解码方法和/或视频解码方法将被称为“本发明的视频解码方法”。

此外，已参照图1a至图20描述的包括层间编码设备10、视频编码设备100或图像编码器400的视频编码设备将被称为“本发明的视频编码设备”。此外，已参照图1a至图20描述的包括层间视频解码设备20、视频解码设备200或图像解码器500的视频解码设备将被称为“本发明的视频解码设备”。

现在将详细描述根据实施例的存储程序的计算机可读记录介质(例如，盘26000)。

图21是根据各种实施例的存储程序的盘26000的物理结构的示图。作为存储介质的盘26000可以是硬盘驱动器、致密盘只读存储器(CD-ROM)盘、蓝光盘或数字多功能盘(DVD)。盘26000包括多个同心磁道Tr，每个同心磁道Tr沿盘26000的圆周方向被划分成特定数量的扇区Se。在根据实施例的盘26000的特定区域中，可分配并存储执行以上所描述的量化参数确定方法、视频编码方法和视频解码方法的程序。

现在将参照图22来描述使用存储用于执行如上所述的视频编码方法和视频解码方法的程序的存储介质来实现的计算机系统。

图22是通过使用盘26000来记录并读取程序的盘驱动器26800的示图。计算机系统27000可经由盘驱动器26800将执行本发明的视频编码方法和视频解码方法中的至少一个的程序存储在盘26000中。为了在计算机系统27000中运行存储在盘26000中的程序，可通过使用盘驱动器27000从盘26000读取程序并将程序发送到计算机系统26700。

执行本发明的视频编码方法和视频解码方法中的至少一个的程序不仅可被存储在图21或图22中示出的盘26000中，还可被存储在存储卡、ROM卡带或固态驱动器(SSD)中。

以下将描述应用以上所描述的视频编码方法和视频解码方法的系统。

图23是用于提供内容分发服务的内容供应系统11000的整体结构的示图。将通信系统的服务区域划分成预定尺寸的小区，并将无线基站11700、11800、11900和12000分别安装在这些小区中。

内容供应系统11000包括多个独立装置。例如，诸如计算机12100、个人数字助理(PDA)12200、视频相机12300和移动电话12500的多个独立装置经由互联网服务提供器11200、通信网络11400和无线基站11700、11800、11900和12000连接到互联网11100。

然而，内容供应系统11000不限于如图24中所示，并且装置可选择性地被连接到内容供应系统11000。多个独立装置可不经由无线基站11700、11800、11900和12000而直接连接到通信网络11400。

视频相机12300是能够捕捉视频图像的成像装置，例如，数字视频相机。移动电话12500可利用各种协议(例如，个人数字通信(PDC)、码分多址(CDMA)、宽带码分多址(W-CDMA)、全球移动通信系统(GSM)和个人手持电话系统(PHS))中的至少一种通信方法。

视频相机12300可经由无线基站11900和通信网络11400连接到流服务器11300。流服务器11300允许经由视频相机12300从用户接收到的内容经由实时广播被流传输。可使用视频相机12300或流服务器11300来对从视频相机12300接收到的内容进行编码。通过视频相机12300捕捉到的视频数据可经由计算机12100被发送到流服务器11300。

通过相机12600捕捉到的视频数据也可经由计算机12100被发送到流服务器11300。与数码相机类似，相机12600是能够捕捉静止图像和视频图像两者的成像装置。可使用相机12600或计算机12100对通过相机12600捕捉到的视频数据进行编码。可将对视频执行编码和解码的软件存储在可由计算机12100访问的计算机可读记录介质(例如，CD-ROM盘、软盘、硬盘驱动器、SSD或存储卡)中。

如果视频数据通过内置在移动电话12500中的相机被捕捉到，则可从移动电话12500接收视频数据。

还可通过安装在视频相机12300、移动电话12500或相机12600中的大规模集成电路(LSI)系统来对视频数据进行编码。

根据实施例的内容供应系统11000可对由用户使用视频相机12300、相机12600、移动电话12500或另一成像装置所记录的内容数据(例如，在音乐会期间记录的内容)进行编码，并将编码后的内容数据发送到流服务器11300。流服务器11300可将编码后的内容数据以流传输内容的类型发送到请求内容数据的其它客户端。

客户端是能够对编码后的内容数据进行解码的装置，例如，计算机12100、PDA12200、视频相机12300或移动电话12500。因此，内容供应系统11000允许客户端接收并再现编码后的内容数据。此外，内容供应系统11000允许客户端实时接收编码后的内容数据并对编码后的内容数据进行解码和再现，从而能够进行个人广播。

包括在内容供应系统11000中的多个独立装置的编码和解码操作可类似于本发明的视频编码设备和视频解码设备的编码和解码操作。

现在将参照图24和图25更加详细地描述包括在根据实施例的内容供应系统11000中的移动电话12500。

图24示出根据各种实施例的应用本发明的视频编码方法和视频解码方法的移动电话12500的外部结构。移动电话12500可以是智能电话，所述智能电话的功能不受限，并且所述智能电话的大多数功能可被改变或扩展。

移动电话12500包括可与图21的无线基站12000交换射频(RF)信号的内部天线12510，并包括用于显示由相机12530捕捉到的图像或经由天线12510接收到的并被解码的图像的显示屏12520(例如，液晶显示器(LCD)或有机发光二极管(OLED)屏幕)。移动电话12500包括包含有控制按钮和触摸面板的操作面板12540。如果显示屏12520是触摸屏，则操作面板12540还包括显示屏12520的触摸感测面板。移动电话12500包括用于输出语音和声音的扬声器12580或另一类型的声音输出单元、以及用于输入语音和声音的麦克风12550或另一类型的声音输入单元。移动电话12500还包括用于捕捉视频和静止图像的相机12530，诸如电荷耦合器件(CCD)相机。移动电话12500还可包括：存储介质12570，用于存储通过相机12530捕捉到的、经由电子邮件接收到的、或根据各种方式获得的编码/解码数据(例如，视频或静止图像)；插槽12560，存储介质12570经由插槽12560被装入移动电话12500中。存储介质12570可以是闪存，例如，包括在塑料壳中的安全数字(SD)卡或电可擦除可编程只读存储器(EEPROM)。

图25示出移动电话12500的内部结构。为了系统地控制包括显示屏12520和操作面板12540的移动电话12500的部件，供电电路12700、操作输入控制器12640、图像编码单元12720、相机接口12630、LCD控制器12620、图像解码单元12690、复用器/解复用器12680、记录/读取单元12670、调制/解调单元12660和声音处理器12650经由同步总线12730被连接到中央控制器12710。

如果用户操作电源按钮，并从“电源关闭”状态设置为“电源开启”状态，则供电电路12700从电池组向移动电话12500的所有部件供电，从而将移动电话12500设置为处于操作模式。

中央控制器12710包括中央处理单元(CPU)、ROM和RAM。

在移动电话12500将通信数据发送到外部的同时，在中央控制器12710的控制下，由移动电话12500产生数字信号。例如，声音处理器12650可产生数字声音信号，图像编码单元12720可产生数字图像信号，并且消息的文本数据可经由操作面板12540和操作输入控制器12640被产生。当数字信号在中央控制器12710的控制下被传送到调制/解调单元12660时，调制/解调单元12660对数字信号的频带进行调制，并且通信电路12610对频带调制后的数字声音信号执行数模转换(DAC)和频率转换。从通信电路12610输出的发送信号可经由天线12510被发送到语音通信基站或无线基站12000。

例如，当移动电话12500处于通话模式时，在中央控制器12710的控制下，经由麦克风12550获得的声音信号通过声音处理器12650被变换成数字声音信号。数字声音信号可经由调制/解调单元12660和通信电路12610被变换成发送信号，并可经由天线12510被发送。

当文本消息(例如，电子邮件)在数据通信模式下被发送时，文本消息的文本数据经由操作面板12540被输入，并经由操作输入控制器12640被发送到中央控制器12610。在中央控制器12610的控制下，文本数据经由调制/解调单元12660和通信电路12610被变换成发送信号，并经由天线12510被发送到无线基站12000。

为了在数据通信模式下发送图像数据，由相机12530捕捉到的图像数据经由相机接口12630被提供给图像编码单元12720。捕捉到的图像数据可经由相机接口12630和LCD控制器12620被直接显示在显示屏12520上。

图像编码单元12720的结构可与上述视频编码设备100的结构相应。图像编码单元12720可根据上述视频编码方法，将从相机12530接收到的图像数据变换为压缩和编码后的图像数据，并随后将编码后的图像数据输出到复用器/解复用器12680。在相机12530的记录操作期间，由移动电话12500的麦克风12550获得的声音信号可经由声音处理器12650被变换成数字声音数据，并且数字声音数据可被发送到复用器/解复用器12680。

复用器/解复用器12680对从图像编码单元12720接收到的编码后的图像数据与从声音处理器12650接收到的声音数据一起进行复用。对数据进行复用的结果可经由调制/解调单元12660和通信电路12610被变换成发送信号，然后可经由天线12510被发送。

当移动电话12500从外部接收到通信数据时，可对经由天线12510接收到的信号执行频率恢复和ADC以将信号变换成数字信号。调制/解调单元12660对数字信号的频带进行调制。根据频带调制后的数字信号的类型，将所述数字信号发送到视频解码单元12690、声音处理器12650或LCD控制器12620。

在通话模式下，移动电话12500对经由天线12510接收到的信号进行放大，并通过对放大后的信号执行频率转换和ADC来获得数字声音信号。在中央控制器12710的控制下，接收到的数字声音信号经由调制/解调单元12660和声音处理器12650被变换成模拟声音信号，并且模拟声音信号经由扬声器12580被输出。

当在数据通信模式下时，接收在互联网网站上访问的视频文件的数据，经由调制/解调单元12660将经由天线12510从无线基站12000接收到的信号输出为复用数据，并将复用数据发送到复用器/解复用器12680。

为了对经由天线12510接收到的复用数据进行解码，复用器/解复用器12680将复用数据解复用成编码后的视频数据流和编码后的音频数据流。经由同步总线12730，编码后的视频数据流和编码后的音频数据流分别被提供给视频解码单元12690和声音处理器12650。

图像解码单元12690的结构可与上述视频解码设备200的结构相应。图像解码单元12690可根据由上述视频解码设备200或图像解码器500采用的视频解码方法，对编码后的视频数据进行解码来获得重建的视频数据，并经由LCD控制器12620将重建的视频数据提供给显示屏12520。

因此，可将在互联网网站上访问的视频文件的数据显示在显示屏12520上。同时，声音处理器12650可将音频数据变换成模拟声音信号，并将模拟声音信号提供给扬声器12580。因此，也可经由扬声器12580再现在互联网网站上访问的视频文件中包含的音频数据。

移动电话12500或另一类型的通信终端可以是包括本发明的视频编码设备和视频解码设备两者的收发终端，可以是仅包括视频编码设备的收发终端，或者可以是仅包括视频解码设备的收发终端。

根据本发明的通信系统不限于以上参照图24描述的通信系统。例如，图26示出根据实施例的采用通信系统的数字广播系统。根据各种实施例的图26的数字广播系统可通过使用本发明的视频编码设备和视频解码设备来接收经由卫星或地面网络发送的数字广播。

具体地，广播站12890通过使用无线电波将视频数据流发送到通信卫星或广播卫星12900。广播卫星12900发送广播信号，广播信号经由家用天线12860被发送到卫星广播接收器。在每个房屋中，可通过TV接收器12810、机顶盒12870或其它装置对编码后的视频流进行解码和再现。

当本发明的视频解码设备被实现在再现设备12830中时，再现设备12830可对记录在存储介质12820(诸如盘或存储卡)上的编码后的视频流进行解析和解码，以重建数字信号。因此，可在例如监视器12840上再现重建的视频信号。

在被连接到用于卫星/地面广播的天线12860或用于接收有线电视(TV)广播的有线天线12850的机顶盒12870中，可安装本发明的视频解码设备。从机顶盒12870输出的数据也可被再现在TV监视器12880上。

作为另一示例，可将本发明的视频解码设备安装在TV接收器12810中，而不是机顶盒12870中。

具有合适的天线12910的汽车12920可接收从图23的卫星12900或无线基站11700发送的信号。可在安装在汽车12920中的汽车导航系统12930的显示屏上再现解码后的视频。

视频信号可由本发明的视频编码设备来编码，然后可被存储在存储介质中。具体地，可由DVD记录器将图像信号存储在DVD盘12960中，或可由硬盘记录器12950将图像信号存储在硬盘中。作为另一示例，可将视频信号存储在SD卡12970中。如果硬盘记录器12950包括根据实施例的本发明的视频解码设备，则记录在DVD盘12960、SD卡12970或另一存储介质上的视频信号可在TV监视器12880上被再现。

汽车导航系统12930可不包括图26的相机12530、相机接口12630和图像编码单元12720。例如，计算机12100和TV接收器12810可不包括在图26的相机12530、相机接口12630和图像编码单元12720中。

图27是示出根据各种实施例的使用视频编码设备和视频解码设备的云计算系统的网络结构的示图。

云计算系统可包括云计算服务器14000、用户数据库(DB)14100、多个计算资源14200和用户终端。

响应于来自用户终端的请求，云计算系统经由数据通信网络(例如，互联网)提供多个计算资源14200的点播外包服务。在云计算环境下，服务提供商通过使用虚拟化技术组合位于不同的物理位置的数据中心处的计算资源，为用户提供想要的服务。服务用户不必将计算资源(例如，应用、存储器、操作系统(OS)和安全软件)安装在他/她自己的终端中以使用它们，但可在想要的时间点在通过虚拟化技术产生的虚拟空间中从服务中选择和使用想要的服务。

指定的服务用户的用户终端经由包括互联网和移动电信网络的数据通信网络被连接到云计算服务器14000。可从云计算服务器14000向用户终端提供云计算服务，特别是视频再现服务。用户终端可以是能够被连接到互联网的各种类型的电子装置，例如，桌上型PC 14300、智能TV 14400、智能电话14500、笔记本计算机14600、便携式多媒体播放器(PMP)14700、平板PC14800等。

云计算服务器14000可组合分布在云网络中的多个计算资源14200，并向用户终端提供组合的结果。所述多个计算资源14200可包括各种数据服务，并可包括从用户终端上传的数据。如上所述，云计算服务器14000可通过根据虚拟化技术组合分布在不同区域中的视频数据库来向用户终端提供想要的服务。

将关于已经订购云计算服务的用户的用户信息存储在用户DB 14100中。用户信息可包括用户的登陆信息、地址、姓名和个人信用信息。用户信息还可包括视频的索引。这里，所述索引可包括已经被再现的视频的列表、正在被再现的视频的列表、之前正在被再现的视频的暂停点等。

可在用户装置之间共享存储在用户DB 14100中的关于视频的信息。例如，当响应于来自笔记本计算机14600的请求将视频服务提供给笔记本计算机14600时，视频服务的再现历史被存储在用户DB 14100中。当从智能电话14500接收到用于再现此视频服务的请求时，云计算服务器14000基于用户DB 14100搜索并再现此视频服务。当智能电话14500从云计算服务器14000接收到视频数据流时，通过对视频数据流进行解码来再现视频的处理与以上参照图24描述的移动电话12500的操作类似。

云计算服务器14000可参考存储在用户DB 14100中的想要的视频服务的再现历史。例如，云计算服务器14000从用户终端接收用于再现存储在用户DB 14100中的视频的请求。如果此视频被再现过，则由云计算服务器14000执行的对此视频进行流传输的方法可根据来自用户终端的请求(即，根据是将从视频的起点还是从视频的暂停点开始再现视频)而不同。例如，如果用户终端请求从视频的起点开始再现视频，则云计算服务器14000将从视频的第一帧开始的视频的流数据发送到用户终端。如果用户终端请求从视频的暂停点开始再现视频，则云计算服务器14000将从与暂停点相应的帧开始的视频的流数据发送到用户终端。

在此情况下，用户终端可包括以上参照图1a至图20描述的本发明的视频解码设备。作为另一示例，用户终端可包括以上参照图1a至图20描述的本发明的视频编码设备。可选择地，用户终端可包括以上参照图1a至图20描述的本发明的视频解码设备和视频编码设备两者。

以上参照图21至图27描述了以上参照图1a至图20描述的根据各种实施例的视频编码方法、视频解码方法、视频编码设备和视频解码设备的各种应用。然而，根据各种实施例的将视频编码方法和视频解码方法存储在存储介质中的方法或者将视频编码设备和视频解码设备实现在装置中的方法不限于以上参照图21至图27描述的实施例。

本领域的普通技术人员将理解，在不脱离由权利要求限定的本发明的精神和范围的情况下，可作出形式和细节上的各种改变。实施例应仅被看作描述性意义，而不是限制的目的。因此，本发明的范围不由本发明的详细描述来限定，而由权利要求来限定，在所述范围内的所有不同将被解释为包括在本发明中。

Claims

1.一种层间视频解码方法，包括：

获得指示第二层当前块是否执行亮度补偿的亮度补偿信息；

基于亮度补偿信息是否指示亮度补偿被执行以及第二层当前块的候选是否执行时间方向帧间预测来确定第二层当前块的候选是否可用作合并候选；

基于确定的结果来产生包括至少一个合并候选的合并候选列表；

通过使用所述至少一个合并候选中的一个合并候选的运动信息来确定第二层当前块的运动信息。

2.如权利要求1所述的层间视频解码方法，其中，当第二层当前块的亮度补偿信息指示亮度补偿被执行并且第二层当前块的候选执行时间方向帧间预测时，不包括第二层当前块的候选的合并候选列表被产生。

3.如权利要求1所述的层间视频解码方法，其中，第二层当前块的候选基于由第二层当前块的从第二层当前块的位置开始的视差矢量所指示的相应块的运动信息。

4.如权利要求1所述的层间视频解码方法，其中，第二层当前块的候选基于由第二层当前块的从第二层当前块的位置开始的视差矢量所指示的相应块的右下块的运动信息。

5.如权利要求1所述的层间视频解码方法，其中，当亮度补偿信息指示亮度补偿被执行时，具有与第二层当前块的候选的运动信息之中的运动矢量和参考索引相同的运动矢量和相同的参考索引的其他候选中的一些候选或全部候选不被包括在合并候选列表中。

6.如权利要求1所述的层间视频解码方法，其中，当亮度补偿信息指示亮度补偿被执行时，具有与第二层当前块的候选的运动信息之中的相同的参考索引的其他候选中的一些候选或全部候选不被包括在合并候选列表中。

7.如权利要求1所述的层间视频解码方法，其中，第二层当前块的候选基于与第二层当前块的从第二层当前块的位置开始的视差矢量相应的块的运动信息，

所述层间视频解码方法还包括：当亮度补偿信息指示亮度补偿不被执行时，将所述视差矢量的垂直分量确定为0。

8.一种层间视频编码方法，包括：

确定第二层当前块是否执行亮度补偿；

基于第二层当前块是否执行亮度补偿以及第二层当前块的候选是否执行时间方向帧间预测来确定第二层当前块的候选是否可用作合并候选；

9.如权利要求8所述的层间视频编码方法，其中，当第二层当前块执行亮度补偿并且第二层当前块的候选执行时间方向帧间预测时，不包括第二层当前块的候选的合并候选列表被产生。

10.如权利要求8所述的层间视频编码方法，其中，第二层当前块的候选基于由第二层当前块的从第二层当前块的位置开始的视差矢量所指示的相应块的运动信息。

11.如权利要求8所述的层间视频解码方法，其中，第二层当前块的候选基于由第二层当前块的从第二层当前块的位置开始的视差矢量所指示的相应块的右下块的运动信息。

12.如权利要求8所述的层间视频解码方法，其中，当第二层当前块执行亮度补偿时，具有与第二层当前块的候选的运动信息之中的运动矢量和参考索引相同的运动矢量和相同的参考索引的其他候选中的一些候选或全部候选不被包括在合并候选列表中。

13.一种层间视频解码设备，包括：

亮度补偿信息获得器，被配置为获得指示第二层当前块是否执行亮度补偿的亮度补偿信息；

合并候选列表产生器，被配置为基于亮度补偿信息是否指示亮度补偿被执行以及第二层当前块的候选是否执行时间方向帧间预测来确定第二层当前块的候选是否可用作合并候选，并基于确定的结果来产生包括至少一个合并候选的合并候选列表；

运动信息确定器，被配置为通过使用所述至少一个合并候选中的一个合并候选的运动信息来确定第二层当前块的运动信息。

14.一种层间视频编码设备，包括：

亮度补偿确定器，被配置为确定第二层当前块是否执行亮度补偿；

合并候选列表产生器，被配置为基于第二层当前块是否执行亮度补偿以及第二层当前块的候选是否执行时间方向帧间预测来确定第二层当前块的候选是否可用作合并候选，并基于确定的结果来产生包括至少一个合并候选的合并候选列表；

15.一种记录有程序的非暂时性计算机可读记录介质，其中，当所述程序被计算机执行时，所述程序执行权利要求1的层间视频解码方法。