CN104754356A

CN104754356A - 用于在视频编码或解码中的运动矢量确定的方法和设备

Info

Publication number: CN104754356A
Application number: CN201510161050.2A
Authority: CN
Inventors: 金壹求; 朴永五
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2011-11-08
Filing date: 2012-11-08
Publication date: 2015-07-01
Anticipated expiration: 2032-11-08
Also published as: JP2017143557A; JP2015159586A; TW201332371A; AU2012336572B2; RU2566955C9; EP2916552A3; US20140307783A1; KR101493698B1; CN103931192B; RU2566973C2; MY169355A; BR122015021736A2; EP2763416A4; PH12015500672A1; EP2916551A2; TW201536037A; MY174659A; TWI505696B; ZA201504684B; PH12015500669A1

Abstract

提供了一种用于在视频编码或解码中的运动矢量确定的方法和设备。所述运动矢量确定方法包括：确定候选运动矢量列表，其中，候选运动矢量列表包括为预测当前块的运动矢量而被参考的多个候选块的运动矢量；当所述多个候选块中的第一候选块的参考图像与当前块的参考图像不同时，基于当前块的参考图像和第一候选块的参考图像中的每一个是短期参考图像还是长期参考图像，来确定是否使用候选运动矢量列表中的第一候选块的运动矢量；通过使用从包括在候选运动矢量列表中的运动矢量之中选择的候选运动矢量，来确定当前块的运动矢量。

Description

用于在视频编码或解码中的运动矢量确定的方法和设备

本申请是向中国知识产权局提交的申请日为2012年11月8日、申请号为201280054956.9、发明名称为“用于在视频编码或解码中的运动矢量确定的方法和设备”的申请的分案申请。

技术领域

本发明涉及视频编码和解码，更具体地说，涉及执行帧间预测和/或运动补偿的视频编码和解码。

背景技术

随着用于再现和存储高分辨率或高质量视频内容的硬件的开发和提供，对于用于有效地对高分辨率或高质量视频内容进行编码或解码的视频编解码器的需求正在增加。根据传统的视频编解码器，基于具有预定尺寸的宏块，根据受限的编码方法来对视频进行编码。

空间域的图像数据经由频率变换被变换为频率域的系数。根据视频编解码器，将图像划分为具有预定尺寸的块，对每个各块执行离散余弦变换(DCT)，并在块单元中对频率系数进行编码，以进行频率变换的快速计算。与空间域的图像数据相比，频率域的系数容易被压缩。具体地，由于根据经由视频编解码器的帧间预测或帧内预测的预测误差来表示空间域的图像像素值，因此当对预测误差执行频率变换时，大量数据可被变换为0。根据视频编解码器，可通过使用小量数据来代替连续并重复产生的数据，来减少数据量。

根据多视点视频编码，基本视点视频和一个或更多个附加视点视频被编码和解码。通过去除基本视点视频与附加视点视频之间的时间/空间冗余以及视点之间的冗余，可减少基本视点视频和附加视点视频的数据量。

发明内容

技术问题

本发明提供了一种经由运动矢量预测执行的运动矢量确定方法和设备、通过经由运动矢量预测来执行帧间预测和运动补偿以对视频进行编码的方法和设备、以及通过经由运动矢量预测来执行运动补偿以对视频进行解码的方法和设备。

技术方案

根据本发明的一方面，提供了一种用于帧间预测的运动矢量确定方法，所述运动矢量确定方法包括以下操作：确定候选运动矢量列表，其中，候选运动矢量列表包括为预测当前块的运动矢量而被参考的多个候选块的运动矢量；当所述多个候选块中的第一候选块的参考图像与当前块的参考图像不同时，基于当前块的参考图像和第一候选块的参考图像中的每一个是短期参考图像还是长期参考图像，来确定是否使用候选运动矢量列表中的第一候选块的运动矢量；通过使用从包括在候选运动矢量列表中的运动矢量之中选择的候选运动矢量，来确定当前块的运动矢量。

有益效果

当根据本发明的一个或更多个实施例的确定运动矢量的方法被执行时，在由候选块的参考索引指示的参考图像与当前块的参考图像不同，并且当前块的参考图像和候选块的参考图像中的至少一个是长期参考图像时，可跳过对候选块的运动矢量的大小进行缩放的处理或参考候选块的运动矢量的处理，并且可控制当前块参考具有相对高预测精确度的另一候选块的运动矢量，从而提高运动矢量预测处理的效率。

附图说明

图1是根据本发明的实施例的运动矢量确定设备的框图。

图2是根据本发明的实施例的运动矢量确定方法的流程图。

图3示出根据本发明的实施例的候选块是另一图像的并置(collocated)块的示例。

图4示出根据本发明的实施例的候选块是同一图像的邻近块的示例。

图5是根据本发明的实施例的包括运动矢量确定方法的视频编码方法的流程图。

图6是根据本发明的实施例的包括运动矢量确定方法的视频解码方法的流程图。

图7是根据本发明的实施例的包括运动矢量确定设备的视频编码单元的框图。

图8是根据本发明的实施例的包括运动矢量确定设备的视频解码单元的框图。

图9是根据本发明的实施例的基于根据树结构的编码单元的视频编码设备的框图。

图10是根据本发明的实施例的基于根据树结构的编码单元的视频解码设备的框图。

图11是用于描述根据本发明的实施例的编码单元的概念的示图。

图12是根据本发明的实施例的基于编码单元的图像编码器的框图。

图13是根据本发明的实施例的基于编码单元的图像解码器的框图。

图14是示出根据本发明的实施例的根据深度的较深层编码单元以及分区的示图。

图15是用于描述根据本发明的实施例的编码单元与变换单元之间的关系的示图。

图16是用于描述根据本发明的实施例的与编码深度相应的编码单元的编码信息的示图。

图17是根据本发明的实施例的根据深度的较深层编码单元的示图。

图18至图20是用于描述根据本发明的实施例的编码单元、预测单元和变换单元之间的关系的示图。

图21是用于描述根据表1的编码模式信息的编码单元、预测单元或分区、和变换单元之间的关系的示图。

图22示出根据本发明的实施例的存储程序的盘的物理结构。

图23示出通过使用盘来记录和读取程序的盘驱动器。

图24示出提供内容分配服务的内容供应系统的整体结构。

图25和图26示出根据本发明的实施例的应用了视频编码方法和视频解码方法的移动电话的内部结构和外部结构。

图27示出根据本发明的实施例的采用通信系统的数字广播系统。

图28示出根据本发明的实施例的使用视频编码设备和视频解码设备的云计算系统的网络结构。

最佳实施方式

第一候选块可以是在当前块的当前图像中的当前块的邻近块，或者可以是在比当前图像更早恢复的图像中的位于与当前块相同的位置的并置块。

当当前块的参考图像和第一候选块的参考图像都是长期参考图像时，确定是否使用运动矢量的操作可包括：保持候选运动矢量列表中的第一候选块的运动矢量的操作。

当当前块的参考图像和第一候选块的参考图像中的一个是短期参考图像，当前块的参考图像和第一候选块的参考图像中的另一个是长期参考图像时，确定是否使用运动矢量的操作可包括：确定不使用候选运动矢量列表中的第一候选块的运动矢量的操作。

根据本发明的另一方面，提供了一种用于帧间预测的运动矢量确定设备，所述运动矢量确定设备包括：候选列表确定单元，确定包括为预测当前块的运动矢量而被参考的多个候选块的运动矢量的候选运动矢量列表，当所述多个候选块中的第一候选块的参考图像与当前块的参考图像不同时，基于当前块的参考图像和第一候选块的参考图像中的每一个是短期参考图像还是长期参考图像，来确定是否使用候选运动矢量列表中的第一候选块的运动矢量；运动矢量确定单元，通过使用从包括在候选运动矢量列表中的运动矢量之中选择的候选运动矢量，来确定当前块的运动矢量。

根据本发明的另一方面，提供了一种计算机可读记录介质，在所述计算机可读记录介质上记录用于执行所述运动矢量确定方法的计算机程序。

具体实施方式

以下，将参照图1至图4描述运动矢量确定设备10和运动矢量确定方法。此外，将参照图5至图8描述通过执行运动矢量确定方法来对视频进行编码和解码的方法和设备。此外，将参照图9至图21描述基于具有树结构的编码单元的包括运动矢量确定方法的视频编码和解码方案。以下，术语“图像”可以指静止图像或运动图像(即，视频本身)。

首先，将参照图1至图4描述运动矢量确定设备10和运动矢量确定方法。此外，将参照图5至图8描述通过执行运动矢量确定方法来对视频进行编码和解码的方法和设备。

图1是根据本发明的实施例的运动矢量确定设备10的框图。

运动矢量确定设备10包括候选列表确定单元12和运动矢量确定单元14。

通过使用当前图像和另一图像之间的相似性来执行帧间预测。在比当前图像更早恢复的参考图像中，检测与当前图像的当前区域相似的参考区域。当前区域和参考区域的坐标之间的距离被表示为运动矢量，当前区域和参考区域的像素值之间的差被表示为残差数据。因此，通过对当前区域执行帧间预测，可输出指示参考图像的索引、运动矢量和残差数据，而不是直接输出关于当前区域的图像信息。

运动矢量确定设备10可针对每个块对每个视频图像执行帧间预测。块可具有正方形形状、矩形形状或任何几何形状，不受限于具有预测尺寸的数据单元。根据本发明的实施例，块可以是根据树结构的编码单元之中的最大编码单元、编码单元、预测单元、变换单元等。以下将参照图9至图21来描述基于根据树结构的编码单元的视频编码和解码方法。

在当前图像的帧间预测中使用的参考图像必须是比当前图像更早解码的图像。在本实施例中，用于帧间预测的参考图像可被分类为短期(short-term)参考图像和长期(long-term)参考图像。解码画面缓冲器(DPB(未示出))存储经由对先前图像的运动补偿而产生的恢复图像。先前产生的恢复图像可被用作用于对其它图像进行帧间预测的参考图像。因此，为了执行当图像的帆间预测，可从解码画面缓冲器中存储的恢复图像中选择至少一个短期参考图像或至少一个长期参考图像。短期参考图像可以是以包括当前图像的解码顺序刚被解码或最近被解码的图像，而长期参考图像可以是解码比当前图像早得多，被选择用作对其它图像进行帧间预测的参考图像并因此被存储在解码画面缓冲器中的图像。

为了进行运动矢量预测、PU融合、或先进运动矢量预测(AMVP)，可通过参考另一块的运动矢量来确定当前块的运动矢量预测。

运动矢量确定设备10可通过参考与当前块在时间上或在空间上邻近的另一块的运动矢量来确定运动矢量。运动矢量确定设备10可确定候选运动矢量列表，其中，候选运动矢量列表包括可变成当前块的运动矢量的参考目标的多个候选块的运动矢量。运动矢量确定设备10可通过参考从候选运动矢量列表选择的运动矢量来确定当前块的运动矢量。

在本实施例中，候选块可指示当前图像中的当前块的邻近块，或可以是在比当前图像更早恢复的图像中位于与当前块相同位置的并置块。

候选列表确定单元12可对来自候选运动矢量列表的满足预定条件的候选运动矢量的大小进行缩放，或可排除候选运动矢量列表中的候选运动矢量，其中，候选运动矢量列表包括对当前块的运动矢量进行预测所参考的候选块的运动矢量。

当包括在候选运动矢量列表中的候选块之中的第一候选块的参考图像与当前块的参考图像不同时，候选列表确定单元12可确定当前块的参考图像和第一候选块的参考图像中的每个是短期参考图像还是长期参考图像。候选列表确定单元12可基于当前块的参考图像和第一候选块的参考图像中的每个是短期参考图像还是长期参考图像，来确定如何使用候选运动矢量列表中的第一候选块的运动矢量。

当当前块的参考图像和第一候选块的参考图像都是长期参考图像时，候选列表确定单元12可保持候选运动矢量列表中的第一候选块的运动矢量。也就是说，第一候选块可被包括在候选运动矢量列表中，而第一候选块的运动矢量的大小不被缩放。

当当前块的参考图像和第一候选块的参考图像中的一个是短期参考图像，当前块的参考图像和第一候选块的参考图像中的另一个是长期参考图像时，候选列表确定单元12可确定不使用候选运动矢量列表中的第一候选块的运动矢量。随后，第一候选块的运动矢量可被声明为不可用的运动矢量。

当当前块的参考图像和第一候选块的参考图像都是短期参考图像时，候选列表确定单元12可对第一候选块的运动矢量的大小进行缩放，并可将缩放后的第一候选块的运动矢量包括在候选运动矢量列表中。在这种情况下，候选列表确定单元12可基于当前图像和当前块的参考图像之间的距离与第一候选块的图像和第一候选块的参考图像之间的距离之比，对第一候选块的运动矢量的大小进行缩放，并可在候选运动矢量列表中将第一候选块的运动矢量的值更新为缩放后的值。

运动矢量确定单元14可从包括在候选运动矢量列表中的运动矢量之中选择候选运动矢量，并可通过使用选择的候选运动矢量来确定当前块的运动矢量。运动矢量确定单元14可通过不改变地复制候选运动矢量或通过修改候选运动矢量，来确定当前块的运动矢量。

图2是根据本发明的实施例的运动矢量确定方法的流程图。

运动矢量确定设备10可通过使用与当前块在时间上或空间上接近的块的运动矢量来预定当前块的运动矢量。此外，运动矢量确定设备10可确定具有可预测的运动矢量的多个候选块，可从候选块中选择候选块，可参考选择的候选块的运动矢量，从而可确定当前块的运动矢量。

然而，当由候选块中的候选块的参考索引指示的参考图像与当前块的参考图像不同时，如果运动矢量确定设备10通过参考候选块的运动矢量来预测当前块的运动矢量，则尽管对候选块的运动矢量的大小进行了缩放并随后参考了候选块的运动矢量，预测的运动矢量的精确度会下降。因此，当当前块的参考图像与候选块的参考图像不同时，运动矢量确定设备10可确定是否在对候选块的运动矢量的大小进行缩放之后参考候选块，或者可确定不参考候选块。

以下，参照操作21、23和25来详细描述当当前块的参考图像与候选块的参考图像不同时，由运动矢量确定设备10从候选块的运动矢量预测当前块的运动矢量的方法。

在操作21，运动矢量确定设备10确定候选运动矢量列表，其中，候选运动矢量列表包括当前块的多个候选块的运动矢量。

在操作23，当候选块中的第一候选块的参考图像与当前块的参考图像不同时，运动矢量确定设备10基于当前块的参考图像和第一候选块的参考图像中的每个是短期参考图像还是长期参考图像，来确定是否使用候选运动矢量列表中的第一候选块的运动矢量。

运动矢量确定设备10可通过使用指示当前块的参考图像是否是长期参考图像的长期参考索引，来确定当前块的参考图像是否是长期参考图像。类似地，运动矢量确定设备10可通过使用第一候选块的长期参考索引，来确定第一候选块的参考图像是否是长期参考图像。

在另一实施例中，当当前块的参考图像和第一候选块的参考图像的画面顺序计数(POC)之间的差值大于第一阈值时，运动矢量确定设备10可确定第一候选块的参考图像是长期参考图像。类似地，当当前块的参考图像和第一候选块的参考图像的POC之间的差值大于第二阈值时，运动矢量确定设备10可确定当前块的参考图像是长期参考图像。

在操作25，运动矢量确定设备10通过使用从包括在候选运动矢量列表中的运动矢量选择的候选运动矢量，来确定当前块的运动矢量。

在操作25，不管当前块的参考图像是短期参考图像还是长期参考图像，运动矢量确定设备10可确定由当前块的运动矢量指示的参考块，其中，在根据由当前块的参考索引指示的POC的当前块的参考图像中确定所述当前块的运动矢量。

在操作23，当当前块的参考图像和第一候选块的参考图像都是长期参考图像时，运动矢量确定设备10可保持候选运动矢量列表中的第一候选块的运动矢量，而不对第一候选块的运动矢量的大小进行缩放。当当前块的参考图像和第一候选块的参考图像中的一个是短期参考图像，当前块的参考图像和第一候选块的参考图像中的另一个是长期参考图像时，运动矢量确定设备10可确定不使用候选运动矢量列表中的第一候选块的运动矢量。当当前块的参考图像和第一候选块的参考图像都是短期参考图像时，运动矢量确定设备10可根据基于当前图像和当前块的参考图像之间的距离与第一候选块的图像和第一候选块的参考图像之间的距离之比进行大小缩放的第一候选块的运动矢量，来更新候选运动矢量列表中的第一候选块的运动矢量。

通过执行操作21、23和25，运动矢量确定设备10可重新确定候选运动矢量列表。当当前块的参考图像和第一候选块的参考图像中只有一个是长期参考图像时，运动矢量确定设备10可排除候选运动矢量列表中的第一候选块的运动矢量，并因此可不将第一候选块用作参考目标。因此，运动矢量确定设备10可通过参考包括在候选运动矢量列表中的另一运动矢量来确定候选块的运动矢量。

当当前块的参考图像和第一候选块的参考图像都是长期参考图像时，运动矢量确定设备10将第一候选块的运动矢量包括在候选运动矢量列表中，而不对第一候选块的运动矢量的大小进行缩放。因此，运动矢量确定设备10可从包括在候选运动矢量列表中的另一候选运动矢量和第一候选块的运动矢量中选择最佳参考运动矢量，并可通过使用选择的参考运动矢量来确定当前块的运动矢量。

当当前块的参考图像和第一候选块的参考图像都是短期参考图像时，运动矢量确定设备10可对第一候选块的运动矢量的大小进行缩放，并可将第一候选块的运动矢量包括在候选运动矢量列表中。因此，运动矢量确定设备10可从包括在候选运动矢量列表中的另一候选运动矢量和经大小缩放的第一候选块的运动矢量，选择最佳参考运动矢量，并可通过使用选择的参考运动矢量来确定当前块的运动矢量。

因此，根据以上参照图1和图2描述的运动矢量确定设备10和运动矢量确定方法，当由候选块的参考索引指示的参考图像与当前块的参考图像不同，并且当前块的参考图像和候选块的参考图像中的至少一个是长期参考图像时，可跳过对候选块的运动矢量的大小的缩放处理，或者可跳过参考候选块的运动矢量的处理。

也就是说，当当前块的参考图像与候选块的参考图像不同，并且当前块的参考图像和候选块的参考图像中的至少一个是长期参考图像时，如果通过参考候选块的运动矢量来预测当前块的运动矢量，则预测的运动矢量的精确度会下降，因此，可跳过参考缺乏预测精确度的候选块的运动矢量的处理，并可通过参考具有相对高精确度的另一候选块的运动参考来预测当前块。通过这样做，可提高运动矢量预测处理的效率。

以下，参照图3和图4，详细描述根据候选块的类型的运动矢量预测方法。

图3示出根据本发明的实施例的候选块是另一图像的并置块的示例。

并置图像35比当前图像30更早被恢复，可被参考以用于对当前图像30中的当前块31进行帧间预测。可根据当前块31的并置索引32确定并置图像35。

在并置图像35中，处于与当前图像30的当前块31相同位置的块可被确定为并置块36。运动矢量确定设备10可将并置块36用为候选块，即，用于预测当前块31的运动矢量34的参考目标。因此，可通过参考并置块36的运动矢量37来预测当前块31的运动矢量34。

可根据由并置块36的参考索引指示的POC来确定并置参考图像38。可根据由当前块31的参考索引指示的POC来确定当前参考图像33。

然而，当并置参考图像38与当前参考图像33不同时，运动矢量确定设备10可重新确定是否参考并置块36的运动矢量37，或如何参考并置块36的运动矢量37。

更具体地说，当并置块36的参考索引与当前块31的参考索引不同时，运动矢量确定设备10可通过使用并置块36的长期参考索引和当前块31的长期参考索引，来检查并置参考图像38和当前参考图像33是短期参考图像还是长期参考图像。

当并置参考图像38与当前参考图像33不同时，运动矢量确定设备10可重新确定是否参考并置块36的运动矢量37，或如何参考并置块36的运动矢量37。

根据检查的结果，当并置参考图像38与当前参考图像33不同，但是当前参考图像33和并置参考图像38都是短期参考图像时，可基于并置图像35和并置参考图像38之间的距离Td与当前图像30和当前参考图像33之间的距离Tb之比，对并置块36的运动矢量37的大小进行缩放。这里，可根据并置图像35和并置参考图像38的POC之间的差值，来确定并置图像35和并置参考图像38之间的距离Td。类似地，可根据当前图像30和当前参考图像33的POC之间的差值，来确定当前图像30和当前参考图像33之间的距离Tb。

也就是说，当当前参考图像33和并置参考图像38都是短期参考图像时，可用通过将并置块36的运动矢量37(MVcol)乘以并置图像35和并置参考图像38之间的距离Td与当前图像30和当前参考图像33之间的距离Tb之比而获得的值，来更新候选运动矢量MVcol’(MVcol’＝MVcol×Tb/Td)。

因此，根据检查的结果，当并置参考图像38与当前参考图像33不同，但是当前参考图像33和并置参考图像38都是短期参考图像时，运动矢量确定设备10可在候选运动矢量列表中将并置块36的运动矢量37改变为值MVcol’，其中，通过将并置块36的运动矢量37乘以并置图像35和并置参考图像38之间的距离Td与当前图像30和当前参考图像33之间的距离Tb之比(Tb/Td)，来获得值MVcol’。

当当前参考图像33和并置参考图像38中的一个是短期参考图像，当前参考图像33和并置参考图像38中的另一个是长期参考图像时，可将“NOT-AVAILABLE(不可用)”标记分配给并置块36的运动矢量37。在这种情况下，可排除候选运动矢量列表中的并置块36的运动矢量37。

当当前参考图像33和并置参考图像38都是长期参考图像时，可保持并置块36的运动矢量37。在这种情况下，可在候选运动矢量列表中保持并置块36的运动矢量37，而不对运动矢量37的大小进行缩放。

图4示出根据本发明的实施例的候选块是同一图像的邻近块46的示例。

运动矢量确定设备10可将邻近块46用作候选块，其中，候选块是在对当前块41的运动矢量44的预测中使用的参考目标，其中，邻近块46与当前块41邻近。因此，可通过参考邻近块46的运动矢量47来预测当前块41的运动矢量44。

可根据由邻近块46的参考索引指示的POC来确定邻近参考图像48。可根据由当前块41的参考索引指示的POC来确定当前参考图像43。

然而，当邻近参考图像48与当前参考图像43不同时，运动矢量确定设备10可重新确定是否参考邻近块46的运动矢量47，或者如何参考邻近块46的运动矢量47。

更具体地，当邻近块46的参考索引与当前块41的参考索引不同时，运动矢量确定设备10可通过使用邻近块46的长期参考索引和当前块41的长期参考索引，来检查邻近块46和当前参考图像43是短期参考图像还是长期参考图像。

当邻近参考图像48与当前参考图像43不同时，运动矢量确定设备10可重新确定是否参考邻近块46的运动矢量47，或者如何参考邻近块46的运动矢量47。

根据检查的结果，当当前参考图像43与邻近参考图像48不同，但是当前参考图像43和邻近参考图像48都是短期参考图像时，可基于当前图像40和邻近参考图像48之间的距离Td与当前图像40和当前参考图像43之间的距离Tb之比，对邻近块46的运动矢量47的大小进行缩放。可将当前图像40和邻近参考图像48之间的距离Td确定为当前图像30和邻近参考图像48的POC之间的差值。类似地，可将当前图像40和当前参考图像43之间的距离Tb确定为当前图像40和当前参考图像43的POC之间的差值。

也就是说，当当前参考图像43和邻近参考图像48都是短期参考图像时，可将候选运动矢量MVne’更新为通过将邻近块46的运动矢量47(MVne)乘以当前图像40和邻近参考图像48之间的距离Td与当前图像40和当前参考图像43之间的距离Tb之比(Tb/Td)而获得的值(MVne’＝MVne×Tb/Td)。

因此，根据检查的结果，当当前参考图像43和邻近参考图像48彼此不同，但是当前参考图像43和邻近参考图像48都是短期参考图像时，运动矢量确定设备10可在候选运动矢量列表中将邻近块36的运动矢量37改变为值MVne’，其中，通过将邻近块46的运动矢量47(MVne)乘以邻近参考图像48和当前图像40之间的距离Td与当前图像40和当前参考图像43之间的距离Tb之比(Tb/Td)，来获得值MVne’。

当当前参考图像43和邻近参考图像48中的一个是短期参考图像，当前参考图像43和邻近参考图像48中的另一个是长期参考图像时，可将“NON-USABLE(不可用)”标记分配给邻近块46的运动矢量47。在这种情况下，可排除当前图像40的候选运动矢量列表中的邻近块46的运动矢量47。

当当前参考图像43和邻近参考图像48都是长期参考图像时，可保持邻近块46的运动矢量47。在这种情况下，可在候选运动矢量列表中保持邻近块46的运动矢量47，而不对运动矢量47的大小进行缩放。

在图3和图4的实施例中，运动矢量确定设备10可通过使用当前块(即，当前块31和41)和候选块(即，并置块36和邻近块46)的长期参考索引，来确定当前参考图像(即，当前参考图像33和43)和候选块的参考图像(即，并置参考图像38和邻近参考图像48)中的每一个是短期参考图像还是长期参考图像，根据确定的结果，运动矢量确定设备10可确定是否参考候选块的运动矢量(即，运动矢量37和47)，或者是否在对运动矢量的大小进行缩放之后参考运动矢量。

在另一实施例中，运动矢量确定设备10可通过使用指示当前参考图像和候选块的参考图像的POC的参考索引，而不使用当前块的候选块的长期参考索引，来确定是否参考候选块的运动矢量，或者是否在对运动矢量的大小进行缩放之后参考运动矢量。

更具体地，根据参照图3的另一实施例的运动矢量确定设备10可将并置块36的参考索引和当前块31的参考索引之间的差Tr与第一阈值THpocdiff1进行比较，当参考索引之间的差Tr大于第一阈值THpocdiff1时，运动矢量确定设备10可确定并置块36的运动矢量37不是参考目标，或者可确定在不对运动矢量37的大小进行缩放的情况下参考运动矢量37。

类似地，根据参照图4的另一实施例的运动矢量确定设备10可将邻近块46的参考索引和当前块41的参考索引之间的差Tr与第一阈值THpocdiff1进行比较，当参考索引之间的差Tr大于第一阈值THpocdiff1时，运动矢量确定设备10可确定邻近块46的运动矢量47不是参考目标，或者可确定在不对运动矢量47的大小进行缩放的情况下参考运动矢量47。

在图3和图4的其它实施例中，当候选块(即，候选块36和46)的参考索引和当前块31的参考索引之间的差Tr大于第一阈值THpocdiff1时，运动矢量确定设备10可确定由候选块(36和46)的参考索引指示的候选参考图像(即，并置参考图像38和邻近参考图像48)和由当前块31的参考索引指示的当前参考图像(33和43)中的至少一个是长期参考图像。

因此，当当候选块(36和46)的参考索引和当前块31的参考索引之间的差Tr大于第一阈值THpocdiff1时，运动矢量确定设备10可不需要通过使用图像距离比(Tb/Td)对候选块(36和46)的运动矢量(37和47)的大小进行缩放，但是可确定候选块(36和46)不是参考目标，并因此可排除候选运动矢量列表中的候选块(36和46)的运动矢量(37和47)。可选地，运动矢量确定设备10可确定通过参考候选块(36和46)的运动矢量(37和47)(而不对候选块(36和46)的运动矢量(37和47)的大小进行缩放)来预测当前块(31和41)的运动矢量(34和44)。

在另一实施例中，运动矢量确定设备10可将当前图像(30和40)和当前参考图像(33和43)的POC之间的差值与第二阈值THpocdiff2进行比较，根据比较的结果，运动矢量确定设备10可确定是否参考候选块(36和46)的运动矢量(37和47)，或者是否在对运动矢量(37和47)的大小进行缩放之后参考缩放后的运动矢量。

因此，当由当前块(31和41)的参考索引指示的当前参考图像(33和43)和当前图像(30和40)的POC之间的差Tb大于第二阈值THpocdiff2时，运动矢量确定设备10可不需要通过使用图像距离比(Tb/Td)对候选块(36和46)的运动矢量(37和47)的大小进行缩放，但是可确定候选块(36和46)不是参考目标，并因此可排除候选运动矢量列表中的候选块(36和46)的运动矢量(37和47)。可选地，运动矢量确定设备10可确定通过参考候选块(36和46)的运动矢量(37和47)(而不对候选块(36和46)的运动矢量(37和47)的大小进行缩放)来预测当前块(31和41)的运动矢量(34和44)。

第一阈值THpocdiff1或第二阈值THpocdiff2可被设置为以下值之一：Ⅰ)参考图像的数量；Ⅱ)参考图像的数量的两倍；Ⅲ)画面组(GOP)的大小与参考图像的数量的两倍的总和；Ⅳ)解码顺序在当前图像之前并且输出顺序是连续的图像的最大允许量max_num_reorder_pics与参考图像的数量的两倍的总和；Ⅴ)存储在DPB中的恢复图像的输出被最大延迟的最大延迟时间max_output_delay与参考图像的数量的两倍的总和；Ⅵ)GOP的大小的两倍；Ⅶ)解码顺序在当前图像之前并且输出顺序是连续的图像的最大允许量max_num_reorder_pics的两倍；Ⅷ)存储在DPB中的恢复图像的输出被最大延迟的最大延迟时间max_output_delay的两倍。

当候选块是并置块36时，可根据当前图像30、当前参考图像33和并置参考图像38的相对位置来改变第一阈值THpocdiff1或第二阈值THpocdiff2。例如，可存在以下两种情况：Ⅰ)当并置块36的参考索引和当前块31的参考索引都大于或小于当前图像30的POC的时候(第一种情况)，Ⅱ)当当前图像30的POC在并置块36的参考索引与当前块31的参考索引之间的时候(第二种情况)。第一阈值THpocdiff1或第二阈值THpocdiff2可在第一种情况和第二种情况下不同。

此外，可基于根据当前图像30的时间预测的分层结构的时间深度来改变第一阈值THpocdiff1或第二阈值THpocdiff2。例如，当多个图像被分层参考以用于对当前图像30进行时间预测时，可根据在分层结构中参考了多少层来调整第一阈值THpocdiff1或第二阈值THpocdiff2。

可选地，可根据当前图像30在包括当前图像30的GOP结构中的位置来改变第一阈值THpocdiff1或第二阈值THpocdiff2。

可选地，可根据当前图像30在包括当前图像30的GOP结构中的POC来改变第一阈值THpocdiff1或第二阈值THpocdiff2。

在视频编码中使用的当前图像30的第一阈值THpocdiff1或第二阈值THpocdiff2可被编码，并被发送到视频解码器。例如，可针对每个序列、每个画面或每个条带确定第一阈值THpocdiff1或第二阈值THpocdiff2，或者可根据画面自适应地确定第一阈值THpocdiff1或第二阈值THpocdiff2。因此，序列参数集(SPS)、画面参数集(PPS)、条带头和自适应参数集(APS)可包含关于第一阈值THpocdiff1或第二阈值THpocdiff2的信息。

在另一实施例中，视频编码器和视频解码器可不发送和接收当前图像30的第一阈值THpocdiff1或第二阈值THpocdiff2，但是可预测第一阈值THpocdiff1或第二阈值THpocdiff2。例如，可基于作为当前图像30的时间预测的分层结构的随机访问或低延迟，来预测第一阈值THpocdiff1或第二阈值THpocdiff2。可选地，可基于当前图像30的POC来预测第一阈值THpocdiff1或第二阈值THpocdiff2。

以下，参照图5和图6，详细地描述包括运动矢量确定方法的视频编码和解码方法。

在操作51，根据运动矢量确定方法，可确定包括被参考以预测当前块的运动矢量的多个候选块的运动矢量的候选运动矢量列表。

当候选块中的第一候选块的参考图像与当前块的参考图像不同时，视频编码方法可基于当前块的参考图像和第一候选块的参考图像中的每一个是短期参考图像还是长期参考图像，来确定是否使用候选运动矢量列表中的第一候选块的运动矢量。

当当前块的参考图像和第一候选块的参考图像都是长期参考图像时，可将第一候选块的运动矢量包括在候选运动矢量列表中，而不对第一候选块的运动矢量的大小进行缩放。

当当前块的参考图像和第一候选块的参考图像中的一个是短期参考图像，当前块的参考图像和第一候选块的参考图像中的另一个是长期参考图像时，视频编码方法可确定不使用候选运动矢量列表中的第一候选块的运动矢量。

当当前块的参考图像和第一候选块的参考图像都是短期参考图像时，可在对第一候选块的运动矢量的大小进行缩放之后，将第一候选块的运动矢量包括在候选运动矢量列表中。

在操作53，可将包括在候选运动矢量列表中的运动矢量之中的在操作51确定的候选运动矢量选为参考运动矢量，并可通过参考选择的参考运动矢量来确定当前块的运动矢量。可通过无改变地复制参考运动矢量或者通过修改参考运动矢量，来确定当前块的运动矢量。例如，当存在关于运动矢量的差信息时，可合并参考运动矢量和差信息，来确定当前块的运动矢量。

当由在当前块的参考图像中确定的当前块的运动矢量指示的参考块被确定时，则可产生参考块和当前块之间的残差数据。

在操作55，可对在操作53产生的残差数据执行变换和量化，从而可产生量化后的变换系数。

可对当前图像的每个块执行操作51、52和53的帧间预测、变换以及量化，从而可在每个块中产生量化后的变换系数。此外，可对每个块的量化后的变换系数执行熵编码，从而可产生并输出比特流。

可由视频编码设备来实现根据图5的实施例的视频编码方法。用于实现根据图5的实施例的视频编码方法的视频编码处理器可被安装在视频编码设备中，或者可驱动与外部视频编码设备的连接，从而视频编码设备可执行包括帧间预测、变换、和量化的视频编码操作。根据本发明的实施例，可通过将视频编码处理模块添加到视频编码装置、中央操作装置或图形操作装置以及执行基本视频编码操作的单独的处理器，来实现视频编码设备的内部视频编码处理器。

在操作61，可接收当前块的参考索引和量化后的变换系数以及候选块的运动矢量。

在操作63，可对在操作61接收到的当前块的量化后的变换系数执行反量化和逆变换，从而可恢复当前块的残差数据。

在操作65，可确定当前块的候选运动矢量列表。当多个候选块中的第一候选块的参考图像与当前块的参考图像不同时，视频解码方法可基于当前块的参考图像和第一候选块的参考图像中的每一个是短期参考图像还是长期参考图像，来确定是否使用候选运动矢量列表中的第一候选块的运动矢量。

当当前块的参考图像和第一候选块的参考图像中的一个是短期参考图像，当前块的参考图像和第一候选块的参考图像中的另一个是长期参考图像时，视频解码方法可确定不使用候选运动矢量列表中的第一候选块的运动矢量。

在操作67，可将包括在候选运动矢量列表中的运动矢量之中的在操作65确定的候选运动矢量选为参考运动矢量，并可通过参考选择的参考运动矢量来确定当前块的运动矢量。例如，当接收到关于运动矢量的差信息时，可将参考运动矢量和差信息合并，从而可确定当前块的运动矢量。

可确定在由当前块的参考索引指示的当前块的参考图像之中的由当前块的参考矢量指示的参考块。通过将确定的参考块与当前块的残差数据合并，可恢复当前块。

可针对每个块执行操作61、63、65和67，从而可恢复包括恢复块的当前图像。随着图像被恢复，包括恢复的图像的序列的视频可被恢复。

当通过接收编码视频流并随后对视频流进行解码来恢复视频时，可执行包括操作61、63、65和67的视频解码过程。在这种情况下，在操作61，可对接收到的视频流进行解析，从而可从视频流提取当前块的参考索引的量化后的变换系数以及候选块的运动矢量。

在上述视频编码方法中，还可执行包括操作61、63、65和67的视频解码过程以产生将被参考以用于对另一图像进行帧间预测的恢复图像。在这种情况下，在操作61，可接收经由帧间预测、变换和量化而产生的当前块的参考索引和量化后的变换系数，以及候选块的运动矢量，随后逐步执行操作63、65和67，从而可将最终恢复的当前图像用作用于对另一图像进行帧间预测的参考图像。

可由视频解码设备来实现根据图6的实施例的视频解码方法。用于实现根据图6的实施例的视频解码方法的视频解码处理器可被安装在视频解码设备中，或者可驱动与外部视频解码设备的连接，从而视频解码设备可执行包括反量化、逆变换、帧内预测和运动补偿的视频解码操作。根据本发明的实施例，可通过将视频解码处理模块添加到视频解码装置、中央操作装置或图形操作装置以及执行基本视频解码操作的单独的处理器，来实现视频解码设备的内部视频解码处理器。

图7是根据本发明的实施例的包括运动矢量确定设备10的视频编码单元70的框图。

视频编码单元70包括帧间预测单元71以及变换和量化单元75。帧间预测单元71可包括运动矢量确定设备10和残差产生单元73。

运动矢量确定设备10确定每个块的运动矢量。此外，为了运动矢量预测、PU融合或AMVP，可通过参考另一块的运动矢量来预测当前块的运动矢量。运动矢量确定设备10可确定当前块的候选运动矢量列表以执行运动矢量预测。可从包括在候选运动矢量列表中的候选运动矢量中确定参考运动矢量。

运动矢量确定设备10可通过从包括在候选运动矢量列表中包括的运动矢量中选择最佳候选运动矢量来确定参考运动矢量，并可通过使用选择的参考运动矢量来确定当前块的运动矢量。

残差产生单元73可在当前块的参考图像中确定由当前块的运动矢量指示的参考块，并可产生参考块和当前块之间的残差数据。

因此，帧间预测单元71可对每个块执行帧间预测，随后可输出每个块的残差数据。

变换和量化单元75可对从帧间预测单元71输出的残差数据执行变换和量化，并因此可产生量化后的变换系数。变换和量化单元75可对从帧间预测单元71接收到的每个块的残差数据执行变换和量化，并因此可产生每个块的量化后的变换系数。

视频编码单元70可对由变换和量化单元75产生的量化后的变换系数执行熵编码，并因此可输出编码的比特流。此外，当从帧间预测单元71输出参考索引、运动矢量、长期参考索引等时，视频编码单元70不仅可对量化后的变换系数，还可对参考索引、运动矢量和长期参考索引执行熵编码，并因此可输出比特流。

图8是根据本发明的实施例的包括运动矢量确定设备10的视频解码单元80的框图。

视频解码单元80包括反量化和逆变换单元81以及运动补偿单元83。运动补偿单元83可包括运动矢量确定设备10和块恢复单元85。

视频解码单元80可接收当前块的参考索引和量化后的变换系数以及候选块的运动矢量。反量化和逆变换单元81可对当前块的量化后的变换系数执行反量化和逆变换，并因此可恢复当前块的残差数据。

运动补偿单元83可对经由帧间预测被编码的当前块执行运动补偿，并因此可恢复当前块。

运动矢量确定设备10确定每个块的运动矢量。运动矢量确定设备10可确定当前块的候选运动矢量列表以预测运动矢量。候选块可包括并置块或邻近块。运动矢量确定设备10可从包括在候选运动矢量列表中的候选运动矢量中确定参考运动矢量。

当包括在当前块的候选运动矢量列表中的候选块之中的第一候选块的参考图像与当前块的参考图像不同时，运动矢量确定设备10可基于当前块的参考图像和第一候选块的参考图像中的每一个是短期参考图像还是长期参考图像，确定是否使用候选运动矢量列表中的第一候选块的参考图像。

运动矢量确定设备10可通过从包括在候选运动矢量列表中的候选运动矢量中选择最佳候选运动矢量，来确定参考运动矢量，可通过使用参考运动矢量来预测当前块的运动矢量，并随后可确定当前块的运动矢量。

块恢复单元85可确定由通过视频解码单元80接收到的当前块的参考索引指示的当前块的参考图像。可在参考图像中确定在运动矢量确定设备10中确定的当前块的运动矢量所指示的参考块，可合并当前块的参考块和残差数据，并因此可恢复当前块。

运动补偿单元83可对每个块执行运动补偿，可恢复每个块，并因此可恢复包括恢复块的当前图像。以这样的方式，视频解码单元80可恢复图像，并因此可恢复包括图像序列的视频。

视频解码单元80还可包括环内(in-loop)滤波单元(未示出)，环路滤波单元对恢复图像执行去块滤波，其中，恢复图像包括当前块和随块被恢复而恢复的块。

视频解码单元80可接收编码的视频流，可对视频流进行解码，并因此可恢复视频。在这种情况下，视频解码单元80可对视频流进行解析，并因此可从视频流提取当前块的参考索引和量化后的变换系数以及候选块的运动矢量。此外，视频解码单元80还可包括接收单元(未示出)，接收单元接收比特流，对比特流执行熵解码，从比特流解析并提取当前块的的参考索引和量化后的变换系数以及候选块的运动矢量。

为了产生由以上参照图7描述的视频编码单元70对另一图像进行帧间预测而将要参考的恢复图像，视频解码单元80可与视频编码单元70合并。在这种情况下，视频解码单元80可接收经由帧间预测、变换和量化而产生的并随后从视频编码单元70输出的当前块的参考索引和量化后的变换系数，可接收候选块的运动矢量，并可输出由反量化和逆变换单元81和运动补偿单元83最终恢复的当前图像。从视频解码单元80输出的恢复图像可被用作由视频编码单元70对另一图像进行帧间预测的参考图像。

如上所述，在运动矢量确定设备10中，通过对视频数据进行划分而获得的块被划分为根据树结构的编码单元，预测编码单元被用于编码单元的帧间预测。以下，将参照图9至图22描述基于根据树结构的编码单元和变换单元的对视频进行编码的方法和设备以及对视频进行解码的方法和设备。

图9是根据本发明的实施例的基于根据树结构的编码单元的视频编码设备100的框图。

通过基于根据树结构的编码单元执行视频预测的视频编码设备100包括最大编码单元划分单元110、编码单元确定器120和输出单元130。在下文中，为了方便描述，将通过基于根据树结构的编码单元执行视频预测的视频编码设备100称为“视频编码设备100”。

最大编码单元划分单元110可基于图像的当前画面的最大编码单元，来对当前画面进行划分。如果当前画面大于最大编码单元，则可将当前画面的图像数据划分为至少一个最大编码单元。根据本发明的实施例的最大编码单元可以是尺寸为32×32、64×64、128×128、256×256等的数据单元，其中，数据单元的形状是宽度和长度为2的若干次方的正方形。图像数据可按照至少一个最大编码单元被输出到编码单元确定器120。

根据本发明的实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元从最大编码单元空间被划分的次数，并且随着深度加深，根据深度的较深层编码单元可从最大编码单元被划分到最小编码单元。最大编码单元的深度为最高深度，最小编码单元的深度为最低深度。由于随着最大编码单元的深度加深，与每个深度相应的编码单元的尺寸减小，因此与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。

如上所述，当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单元，并且每个最大编码单元可包括根据深度被划分的较深层编码单元。由于根据深度对根据本发明的实施例的最大编码单元进行划分，因此可根据深度对包括在最大编码单元中的空间域的图像数据进行分层地分类。

可预先确定编码单元的最大深度和最大尺寸，所述最大深度和最大尺寸限制对最大编码单元的高度和宽度进行分层划分的次数。

编码单元确定器120对通过根据深度对最大编码单元的区域进行划分而获得的至少一个划分区域进行编码，并且根据所述至少一个划分区域来确定用于输出最终编码的图像数据的深度。换句话说，编码单元确定器120通过根据当前画面的最大编码单元以根据深度的较深层编码单元对图像数据进行编码，选择具有最小编码误差的深度，来确定编码深度。因此，最终输出与确定的编码深度相应的编码单元的编码图像数据。此外，与编码深度相应的编码单元可被视为被编码的编码单元。确定的编码深度和根据确定的编码深度的被编码的图像数据被输出到输出单元130。

基于与等于或低于最大深度的至少一个深度相应的较深层编码单元，对最大编码单元中的图像数据进行编码，并且基于每个较深层编码单元比较对图像数据进行编码的结果。在对与较深层编码单元的编码误差进行比较之后，可选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。

随着编码单元根据深度而被分层地划分并且编码单元的数量增加，最大编码单元的尺寸被划分。另外，即使在一个最大编码单元中编码单元与同一深度相应，也通过分别测量每个编码单元的图像数据的编码误差来确定是否将与同一深度相应的每个编码单元划分为更低深度。因此，即使图像数据被包括在一个最大编码单元中，在一个最大编码单元中图像数据被划分为根据深度的区域，并且编码误差根据区域而不同，因此在图像数据中编码深度可根据区域而不同。因此，可在一个最大编码单元中确定一个或更多个编码深度，并且可根据至少一个编码深度的编码单元来对最大编码单元的图像数据进行划分。

因此，编码单元确定器120可确定包括在最大编码单元中的具有树结构的编码单元。根据本发明的实施例的“具有树结构的编码单元”包括在最大编码单元中包括的所有较深层编码单元中的与确定为编码深度的深度相应的编码单元。可根据最大编码单元的相同区域中的深度来分层地确定编码深度的编码单元，并可在不同区域中独立地确定编码深度的编码单元。类似地，可从另一区域的编码深度独立地确定当前区域中的编码深度。

根据本发明的实施例的最大深度是与从最大编码单元到最小编码单元执行划分的次数有关的索引。根据本发明的实施例的第一最大深度可表示从最大编码单元到最小编码单元的总划分次数。根据本发明实施例的第二最大深度可表示从最大编码单元到最小编码单元的深度等级的总数。例如，当最大编码单元的深度是0时，对最大编码单元划分一次的编码单元的深度可被设置为1，对最大编码单元划分两次的编码单元的深度可被设置为2。这里，如果最小编码单元是对最大编码单元划分四次的编码单元，则存在深度0、1、2、3和4的5个深度等级，并因此第一最大深度可被设置为4，第二最大深度可被设置为5。

可根据最大编码单元执行预测编码和变换。还根据最大编码单元，基于根据等于或小于最大深度的深度的较深层编码单元来执行预测编码和变换。可根据正交变换或整数变换的方法来执行变换。

由于每当根据深度对最大编码单元进行划分时，较深层编码单元的数量增加，因此对随着深度加深而产生的所有较深层编码单元执行包括预测编码和变换的编码。为了便于描述，在最大编码单元中，现在将基于当前深度的编码单元来描述预测编码和变换。

视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码，执行诸如预测编码、变换和熵编码的操作，此时，可针对所有操作使用相同的数据单元，或者可针对每个操作使用不同的数据单元。

例如，视频编码设备100不仅可选择用于对图像数据进行编码的编码单元，还可选择不同于编码单元的数据单元，以便对编码单元中的图像数据执行预测编码。

为了对最大编码单元执行预测编码，可基于与编码深度相应的编码单元(即，不再被划分成与更低深度相应的编码单元的编码单元)来执行预测编码。以下，不再被划分且成为用于预测编码的基本单元的编码单元现在将被称为“预测单元”。通过划分预测单元获得的分区可包括预测单元以及通过对预测单元的高度和宽度中的至少一个进行划分而获得的数据单元。分区是通过对编码单元的预测单元进行划分而获得的数据单元，预测单元可以是具有与编码单元相同的尺寸的分区。

例如，当2N×2N(其中，N是正整数)的编码单元不再被划分，并且成为2N×2N的预测单元时，分区的尺寸可以是2N×2N、2N×N、N×2N或N×N。分区类型的示例包括通过对预测单元的高度或宽度进行对称地划分而获得的对称分区、通过对预测单元的高度或宽度进行非对称地划分(诸如，1：n或n:1)而获得的分区、通过对预测单元进行几何地划分而获得的分区、以及具有任意形状的分区。

预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个。例如，可对2N×2N、2N×N、N×2N或N×N的分区执行帧内模式或帧间模式。另外，可仅对2N×2N的分区执行跳过模式。可对编码单元中的一个预测单元独立地执行编码，从而选择具有最小编码误差的预测模式。

视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与编码单元不同的变换单元，来对编码单元中的图像数据执行变换。为了对编码单元执行变换，可基于具有小于或等于编码单元的尺寸的数据单元，来执行变换。例如，用于变换的变换单元可包括帧内模式的数据单元和帧间模式的数据单元。

与根据本实施例的根据树结构的编码单元类似，编码单元中的变换单元可被递归地划分为更小尺寸的区域，可基于根据变换深度的具有树结构的变换，对编码单元中的残差数据进行划分。

根据本发明的实施例，还可在变换单元中设置变换深度，其中，变换深度表示对编码单元的高度和宽度进行划分以获得变换单元所执行的划分的次数。例如，当当前编码单元的变换单元的尺寸是2N×2N时，变换深度可被设置为0。当变换单元的尺寸是N×N时，变换深度可被设置为1。另外，当变换单元的尺寸是N/2×N/2时，变换深度可被设置为2。也就是说，还可根据变换深度设置根据树结构的变换单元。

根据与编码深度相应的编码单元的编码信息不仅需要关于编码深度的信息，还需要关于与预测编码和变换相关的信息的信息。因此，编码单元确定器120不仅确定具有最小编码误差的编码深度，还确定预测单元中的分区类型、根据预测单元的预测模式和用于变换的变换单元的尺寸。

稍后将参照图11至图22详细描述根据本发明的实施例的最大编码单元中的根据树结构的编码单元和预测单元/分区，以及确定变换单元的方法。

编码单元确定器120可通过使用基于拉格朗日乘数的率失真优化，来测量根据深度的较深层编码单元的编码误差。

输出单元130在比特流中输出最大编码单元的图像数据和关于根据编码深度的编码模式的信息，其中，所述最大编码单元的图像数据基于由编码单元确定器120确定的至少一个编码深度被编码。

可通过对图像的残差数据进行编码来获得编码图像数据。

关于根据编码深度的编码模式的信息可包括关于编码深度的信息、关于在预测单元中的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。

可通过使用根据深度的划分信息来定义关于编码深度的信息，其中，根据深度的划分信息指示是否对更低深度而不是当前深度的编码单元执行编码。如果当前编码单元的当前深度是编码深度，则对当前编码单元中的图像数据进行编码并输出，因此可定义划分信息以不将当前编码单元划分到更低深度。可选地，如果当前编码单元的当前深度不是编码深度，则对更低深度的编码单元执行编码，并因此可定义划分信息以对当前编码单元进行划分来获得更低深度的编码单元。

如果当前深度不是编码深度，则对被划分到更低深度的编码单元的编码单元执行编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中，因此对更低深度的每个编码单元重复执行编码，并因此可对具有相同深度的编码单元递归地执行编码。

由于针对一个最大编码单元确定具有树结构的编码单元，并且针对编码深度的编码单元确定关于至少一个编码模式的信息，所以可针对一个最大编码单元确定关于至少一个编码模式的信息。另外，由于根据深度对图像数据进行分层划分，因此最大编码单元的图像数据的编码深度可根据位置而不同，因此可针对图像数据设置关于编码深度和编码模式的信息。

因此，输出单元130可将关于相应的编码深度和编码模式的编码信息分配给包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。

根据本发明的实施例的最小单元是通过将构成最低深度的最小编码单元划分为4份而获得的矩形数据单元。可选择地，最小单元可以是包括在最大编码单元中所包括的所有编码单元、预测单元、分区单元和变换单元中的具有最大尺寸的最大矩形数据单元。

例如，通过输出单元130输出的编码信息可被分类为根据编码单元的编码信息和根据预测单元的编码信息。根据编码单元的编码信息可包括关于预测模式的信息和关于分区尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息、以及关于帧内模式的插值方法的信息。

此外，根据画面、条带或GOP定义的关于编码单元的最大尺寸的信息和关于最大深度的信息可被插入到比特流的头、SPS(序列参数集)或画面参数集(PPS)。

另外，还可经由比特流的头、SPS或PPS输出当前视频中可用的关于变换单元的最大尺寸的信息和关于变换的最小尺寸的信息。输出单元130可对与参照图1至图8描述的预测有关的参考信息、预测信息、单向预测信息和关于包括第四条带类型的条带类型的信息进行编码，并输出这些信息。

在视频编码设备100中，较深层编码单元可以是通过将更高深度的编码单元(更高一层)的高度或宽度划分成两份而获得的编码单元。换言之，当当前深度的编码单元的尺寸是2N×2N时，更低深度的编码单元的尺寸是N×N。另外，尺寸为2N×2N的当前深度的编码单元可包括最多4个更低深度的编码单元。

因此，视频编码设备100可基于考虑当前画面的特征而确定的最大编码单元的尺寸和最大深度，通过针对每个最大编码单元确定具有最优形状和最优尺寸的编码单元来形成具有树结构的编码单元。另外，由于可通过使用各种预测模式和变换中的任意一个对每个最大编码单元执行编码，因此可考虑各种图像尺寸的编码单元的特征来确定最优编码模式。

因此，如果以传统宏块对具有高分辨率或大数据量的图像进行编码，则每个画面的宏块的数量极度增加。因此，针对每个宏块产生的压缩信息的条数增加，因此难以发送压缩的信息，并且数据压缩效率降低。然而，通过使用视频编码设备100，由于考虑图像的尺寸，在增加编码单元的最大尺寸的同时，基于图像的特征来调整编码单元，因此可增加图像压缩效率。

图9的视频编码设备100可通过以上参照图1描述的运动矢量确定设备10和视频编码单元70执行操作。

编码单元确定器120可针对每个最大编码单元，确定包括用于对根据树结构的每个编码单元进行帧间预测的分区的预测单元，并可对每个预测单元执行帧间预测。

编码单元确定器120针对每个预测单元确定运动矢量。此外，为了运动矢量预测、PU融合或AMVP，可通过参考另一预测单元的运动矢量来预测当前预测单元(分区)的运动矢量。编码单元确定器120可确定当前预测单元的候选运动矢量列表，以执行运动矢量预测。可从包括在候选运动矢量列表中的候选运动矢量中确定参考运动矢量。第一候选预测单元可以是当前图像中的与当前预测单元邻近的邻近预测单元，或可以是并置图像中的并置预测单元。

当当前预测单元的候选运动矢量列表中的候选预测单元之中的第一候选预测单元的参考图像与当前预测单元的参考图像不同时，编码单元确定器120基于当前预测单元的参考图像和第一候选预测单元的参考图像中的每一个是短期参考图像还是长期参考图像，来确定是否使用候选运动矢量列表中的第一候选预测单元的运动矢量。

可选地，可基于当前预测单元和第一候选预测单元的长期参考索引，来确定当前预测单元的参考图像和第一候选预测单元的参考图像中的每一个是短期参考图像还是长期参考图像。

当当前预测单元的参考图像和第一候选预测单元的参考图像都是长期参考图像时，可保持候选运动矢量列表中的第一候选预测单元的运动矢量，而不对第一候选预测单元的运动矢量的大小进行缩放。

当当前预测单元的参考图像和第一候选块的参考图像中的一个是短期参考图像，当前预测单元的参考图像和第一候选块的参考图像中的另一个是长期参考图像时，可确定不使用候选运动矢量列表中的第一候选预测单元的运动矢量。

当当前预测单元的参考图像和第一候选预测单元的参考图像都是短期参考图像时，可对第一候选预测单元的运动矢量的大小进行缩放，并随后将第一候选预测单元的运动矢量包括在候选运动矢量列表中。

编码单元确定器120可通过从包括在候选运动矢量列表中的运动矢量中选择最佳参考运动矢量来确定参考运动矢量，并可通过使用选择的参考运动矢量预测并确定当前预测单元的运动矢量。

编码单元确定器120可根据由当前预测单元的参考索引指示的POC来确定当前预测单元的参考图像。不管当前预测单元的参考图像是短期参考图像还是长期参考图像，参考索引可指示POC，编码单元确定器120可将由POC指示的图像确定为参考图像。

编码单元确定器120可在当前预测单元的参考图像中确定由当前预测单元的运动矢量指示的参考块，并可产生参考预测单元和当前预测单元之间的残差数据。

因此，编码单元确定器120可针对每个预测单元执行帧间预测，并随后可输出每个预测单元的残差数据。

编码单元确定器120可对包括每个预测单元的残差数据的编码单元的变换单元执行变换和量化，并因此可产生量化后的变换系数。因此，编码单元确定器120可针对每个变换单元产生量化后的变换系数。

此外，编码单元确定器120可执行如上参照图8描述的视频解码单元80的操作，以产生在对预测单元进行帧间预测中使用的参考图像。

编码单元确定器120可对当前预测单元的量化后的变换系数执行反量化和逆变换，并因此可恢复当前块的残差数据。

编码单元确定器120可确定当前预测单元的候选运动矢量列表，当当前预测单元的候选运动矢量列表中的候选预测单元之中的第一候选预测单元的参考图像与当前预测单元的参考图像不同时，编码单元确定器120可基于当前预测单元的参考图像和第一候选预测单元的参考图像中的每一个是短期参考图像还是长期参考图像，来确定是否使用候选运动矢量列表中的第一候选预测单元的运动矢量。

编码单元确定器120可通过从包括在候选运动矢量列表中的运动矢量中选择最佳参考运动矢量来确定参考运动矢量，并可通过使用选择的参考运动矢量来预测并确定当前预测单元的运动矢量。

编码单元确定器120可确定由当前预测单元的参考索引指示的当前预测单元的参考图像。也就是说，可根据由当前预测单元的参考索引指示的POC来确定当前预测单元的参考图像。不管当前预测单元的参考图像是短期参考图像还是长期参考图像，参考索引可指示POC，并且由POC指示的图像可被确定为参考图像。

因此，编码单元确定器120可针对每个预测单元执行运动补偿，可恢复每个预测单元，并因此可恢复包括恢复后的预测单元的当前图像。恢复后的预测单元和图像可成为另一预测单元和另一图像的参考目标。

图10根据本发明的实施例的基于根据树结构的编码单元的视频解码设备200的框图。

基于根据树结构的编码单元的视频解码设备200包括接收器210、图像数据和编码信息提取器220和图像数据解码器230。在下文中，为了便于描述，使用基于根据树结构的编码单元执行视频预测的视频解码设备200将被称为“视频解码设备200”。

用于视频解码设备200的解码操作的各种术语(诸如编码单元、深度、预测单元、变换单元和关于各种编码模式的信息)的定义与参照图9和视频编码设备100描述的定义相同。

接收器210接收和解析编码视频的比特流。图像数据和编码信息提取器220从解析的比特流，针对每个编码单元提取编码图像数据，并随后将提取的图像数据输出到图像数据解码器230，其中，编码单元具有根据每个最大编码单元的树结构。图像数据和编码信息提取器220可从关于当前画面的头、SPS或PPS提取关于当前画面的编码单元的最大尺寸的信息。

另外，图像数据和编码信息提取器220从解析的比特流，根据最大编码单元，提取关于具有树结构的编码单元的编码深度和编码模式的信息。提取的关于编码深度和编码模式的信息被输出到图像数据解码器230。换言之，比特流中的图像数据被划分为最大编码单元，使得图像数据解码器230针对每个最大编码单元对图像数据进行解码。

可针对关于与编码深度相应的至少一个编码深度的信息设置关于根据最大编码单元的编码深度和编码模式的信息，关于编码模式的信息可包括关于与编码深度相应的相应编码单元的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。另外，根据深度的划分信息可被提取为关于编码深度的信息。

关于由图像数据和编码信息提取器220提取的根据每个最大编码单元的编码深度和编码模式的信息是关于在以下情况下被确定为产生最小编码误差的编码深度和编码模式的信息，即，在编码端(诸如，视频编码设备100)根据最大编码单元对根据深度的每个较深层编码单元重复地执行编码的时候。因此，视频解码设备200可通过根据产生最小编码误差的编码深度和编码模式对图像数据进行解码来恢复图像。

由于关于编码深度和编码模式的编码信息可被分配给相应的编码单元、预测单元和最小单元中的预定数据单元，因此图像数据和编码信息提取器220可根据预定数据单元，提取关于编码深度和编码模式的信息。可将被分配了相同的关于编码深度和编码模式的信息的预定数据单元推断为是包括在同一最大编码单元中的数据单元。

图像数据解码器230基于关于根据最大编码单元的编码深度和编码模式的信息，通过对每个最大编码单元中的图像数据进行解码，来恢复当前画面。换言之，图像数据解码器230可基于提取出的关于包括在每个最大编码单元中的具有树结构的编码单元之中的每个编码单元的分区类型、预测模式和变换单元的信息，对编码的图像数据进行解码。解码处理可包括预测(包含帧内预测和运动补偿)和逆变换。可根据逆正交变换或逆整数变换的方法来执行逆变换。

图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的分区类型和预测模式的信息，根据每个编码单元的分区和预测模式，执行帧内预测或运动补偿。

另外，为了对每个最大编码单元执行逆变换，图像数据解码器230可读取每个编码单元的根据树结构的变换单元信息，从而确定每个编码单元的变换单元，并基于每个编码单元的变换单元执行逆变换。通过逆变换，可恢复编码单元的空间域的像素值。

图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的至少一个编码深度。如果划分信息指示图像数据在当前深度中不再被划分，则当前深度是编码深度。因此，图像数据解码器230可通过使用关于与编码深度相应的每个编码单元的预测单元的分区类型、预测模式和变换单元的尺寸的信息，对当前最大编码单元中的与每个编码深度相应的至少一个编码单元的编码数据进行解码。

换言之，可通过观察分配给编码单元、预测单元和最小单元中的预定数据单元的编码信息集来收集包含包括相同划分信息的编码信息的数据单元，并且收集的数据单元可被认为是将由图像数据解码器230以相同编码模式进行解码的一个数据单元。针对如上所述确定的每个编码单元，可获得关于编码模式的信息以对当前编码单元进行解码。

此外，图10中示出的视频解码设备200的图像数据解码器230可执行以上参照图1描述的运动矢量确定设备10和视频解码单元80的操作。

图像数据解码器230针对每个最大编码单元中的根据树结构的每个编码单元，可确定用于运动补偿的预测单元，并可对各预测单元执行运动补偿。图像数据解码器230可对当前预测单元的量化后的变换系数执行反量化和逆变换，并因此可恢复当前块的残差数据。图像数据解码器230可对经由帧间预测而被编码的当前预测单元执行运动补偿，并因此可恢复当前预测单元。

图像数据解码器230可确定当前预测单元的候选运动矢量列表，当候选运动矢量列表中的候选预测单元之中的第一候选预测单元的参考图像与当前预测单元的参考图像不同时，图像数据解码器230可基于当前预测单元的参考图像和第一候选预测单元的参考图像中的每一个是短期参考图像还是长期参考图像，来确定是否使用候选运动矢量列表中的第一候选预测单元的运动矢量。第一候选预测单元可以是当前图像中的与当前预测单元邻近的邻近预测单元，或可以是并置图像中的并置预测单元。

可基于当前预测单元和第一候选预测单元的长期参考索引，来确定当前预测单元的参考图像和第一候选预测单元的参考图像中的每一个是短期参考图像还是长期参考图像。

图像数据解码器230可通过从包括在候选运动矢量列表中的运动矢量中选择最佳参考运动矢量来确定参考运动矢量，并可通过使用选择的参考运动矢量来预测并确定当前预测单元的运动矢量。

图像数据解码器230可根据由当前预测单元的参考索引指示的POC来确定当前预测单元的参考图像。不管当前预测单元的参考图像是短期参考图像还是长期参考图像，参考索引可指示POC，并且图像数据解码器230可将由POC指示的图像确定为参考图像。

可在当前预测单元的参考图像中确定由当前预测单元的运动矢量指示的参考预测单元，并可合并当前预测单元的参考预测单元和残差数据，从而可恢复当前预测单元。

因此，图像数据解码器230可针对每个预测单元执行运动补偿，可恢复每个预测单元，并因此可恢复包括恢复后的预测单元的当前图像。随着以以上述方式来恢复图像，可恢复包括恢复后的图像的序列的视频。此外，恢复后的预测单元和图像可成为另一预测单元和另一图像的参考目标。

视频解码设备200可获得关于当针对每个最大编码单元递归地执行编码时产生最小编码误差的至少一个编码单元的信息，并且可使用所述信息来对当前画面进行解码。换言之，被确定为最大编码单元中的最优编码单元的具有树结构的编码单元可被解码。此外，考虑图像数据的分辨率和图像数据量来确定编码单元的最大尺寸。

因此，即使图像数据具有高分辨率和大数据量，也可通过使用编码单元的尺寸和编码模式，对图像数据进行有效地解码和恢复，其中，通过使用从编码器接收到的关于最优编码模式的信息，根据图像数据的特征自适应地确定所述编码单元的尺寸和编码模式。

编码单元的尺寸可被表示为宽度×高度，并可以是64×64、32×32、16×16和8×8。64×64的编码单元可被划分为64×64、64×32、32×64或32×32的分区，32×32的编码单元可被划分为32×32、32×16、16×32或16×16的分区，16×16的编码单元可被划分为16×16、16×8、8×16或8×8的分区，8×8的编码单元可被划分为8×8、8×4、4×8或4×4的分区。

在视频数据310中，分辨率是1920×1080，编码单元的最大尺寸是64，最大深度是2。在视频数据320中，分辨率是1920×1080，编码单元的最大尺寸是64，最大深度是3。在视频数据330中，分辨率是352×288，编码单元的最大尺寸是16，最大深度是1。图11中示出的最大深度表示从最大编码单元到最小编码单元的划分总次数。

如果分辨率高或数据量大，则编码单元的最大尺寸可能较大，从而不仅提高编码效率，而且准确地反映图像的特征。因此，具有比视频数据330更高分辨率的视频数据310和320的编码单元的最大尺寸可以是64。

由于视频数据310的最大深度是2，因此由于通过对最大编码单元划分两次，深度加深至两层，因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元和长轴尺寸为32和16的编码单元。同时，由于视频数据330的最大深度是1，因此由于通过对最大编码单元划分一次，深度加深至一层，因此视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元和长轴尺寸为8的编码单元。

由于视频数据320的最大深度是3，因此由于通过对最大编码单元划分三次，深度加深至3层，因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元和长轴尺寸为32、16和8的编码单元。随着深度加深，详细信息可被精确地表示。

图12是根据本发明的实施例的基于编码单元的图像编码器400的框图。

图像编码器400执行视频编码设备100的编码单元确定器120的操作来对图像数据进行编码。换言之，帧内预测器410在帧内模式下对当前帧405中的编码单元执行帧内预测，运动估计器420和运动补偿器425通过使用当前帧405和参考帧495，在帧间模式下对当前帧405中的编码单元执行帧间预测和运动补偿。

从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430和量化器440被输出为量化后的变换系数。量化后的变换系数通过反量化器460和逆变换器470被恢复为空间域中的数据，恢复的空间域中的数据在通过去块单元480和环路滤波单元490后处理之后被输出为参考帧495。量化后的变换系数可通过熵编码器450被输出为比特流455。

为了将图像编码器400应用到视频编码设备100中，图像编码器400的所有元件(即，帧内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器450、反量化器460、逆变换器470、去块单元480和环路滤波单元490)在考虑每个最大编码单元的最大深度的同时，基于具有树结构的编码单元中的每个编码单元执行操作。

具体地，帧内预测器410、运动估计器420和运动补偿器425在考虑当前最大编码单元的最大尺寸和最大深度的同时，确定具有树结构的编码单元中的每个编码单元的分区和预测模式，变换器430确定具有树结构的编码单元中的每个编码单元中的变换单元的尺寸。

具体地，为了运动矢量预测、PU融合或AMVP，可通过参考另一预测单元的运动矢量来预测当前预测单元(分区)的运动矢量。

当当前预测单元的候选运动矢量列表中的候选预测单元之中的第一候选预测单元的参考图像与当前预测单元的参考图像495不同时，运动估计器420基于当前预测单元的参考图像495和第一候选预测单元的参考图像中的每一个是短期参考图像还是长期参考图像，来确定是否使用候选运动矢量列表中的第一候选预测单元的运动矢量。

当当前预测单元的参考图像和第一候选预测单元的参考图像中的至少一个是长期参考图像时，运动估计器420可将第一候选块的运动矢量包括在候选运动矢量列表中，而不对第一候选块的运动矢量的大小进行缩放，或者可确定不使用候选运动矢量列表中的第一候选块的运动矢量。

运动估计器420可通过从包括在候选运动矢量列表中的运动矢量中选择最佳参考运动矢量来确定参考运动矢量，并可通过使用选择的参考运动矢量来确定当前预测单元的运动矢量。运动估计器420可在当前预测单元的参考图像495中确定由当前块的运动矢量指示的参考块，并可产生参考预测单元和当前预测单元之间的残差数据。因此，运动估计器420可输出每个预测单元的残差数据。

此外，当当前预测单元的候选运动矢量列表中的候选预测单元之中的第一候选预测单元的参考图像与当前预测单元的参考帧495不同时，运动补偿器425还可基于当前预测单元的参考帧495和第一候选预测单元的参考图像中的至少一个是否是长期参考图像，来确定是否使用候选运动矢量列表中的第一候选预测单元的运动矢量或者是否排除候选运动矢量列表中的第一候选预测单元的运动矢量。

运动补偿器425可从包括在候选运动矢量列表中的运动矢量选择最佳参考运动矢量来确定参考运动矢量，并可通过使用选择的参考运动矢量预测并确定当前预测单元的运动矢量。

运动补偿器425可在参考帧495中确定由当前预测单元的运动矢量指示的参考预测单元，可合并当前预测单元的参考预测单元和残差数据，并因此可恢复当前预测单元。

因此，运动补偿器425可针对每个预测单元执行运动补偿，可恢复每个预测单元，并因此可恢复包括恢复后的预测单元的当前图像。恢复后的预测单元和图像可成为另一预测单元和另一图像的参考目标。

图13是根据本发明的实施例的基于编码单元的图像解码器500的框图。

解析器510从比特流505解析将被解码的编码图像数据和解码所需的编码信息。编码图像数据通过熵解码器520和反量化器530被输出为反量化的数据，反量化的数据通过逆变换器540被恢复为空间域中的图像数据。

针对空间域中的图像数据，帧内预测器550在帧内模式下对编码单元执行帧内预测，运动补偿器560通过使用参考帧585在帧间模式下编码单元执行运动补偿。

通过帧内预测器550和运动补偿器560的空间域中的图像数据可在通过去块单元570和环路滤波单元580后处理之后被输出为恢复帧595。另外，通过去块单元570和环路滤波单元580后处理的图像数据可被输出为参考帧585。

为了在视频解码设备200的图像数据解码器230中对图像数据进行解码，图像解码器500可执行在解析器510执行操作之后执行的操作。

为了将图像解码器500应用到视频解码设备200中，图像解码器500的所有元件(即，解析器510、熵解码器520、反量化器530、逆变换器540、帧内预测器550、运动补偿器560、去块单元570和环路滤波单元580)针对每个最大编码单元，基于具有树结构的编码单元执行操作。

具体地，帧内预测器550和运动补偿器560基于具有树结构的每个编码单元的分区和预测模式来执行操作，逆变换器540基于每个编码单元的变换单元的尺寸来执行操作。

具体地，当当前预测单元的候选运动矢量列表中的候选预测单元之中的第一候选预测单元的参考图像与当前预测单元的参考帧585不同时，运动补偿器560基于当前预测单元的参考帧585和第一候选预测单元的参考图像中的至少一个是否是长期参考图像，来确定是否使用候选运动矢量列表中的第一候选预测单元的运动矢量或者是否排除候选运动矢量列表中的第一候选预测单元的运动矢量。

运动补偿器560可通过从包括在候选运动矢量列表中的运动矢量选择最佳参考运动矢量来确定参考运动矢量，并可通过使用选择的参考运动矢量确定当前预测单元的运动矢量。

运动补偿器560可确定根据当前预测单元的参考索引的POC指示的参考帧585，可在参考帧585中确定由当前预测单元的运动矢量指示的参考预测单元，可合并当前预测单元的参考预测单元和残差数据，并因此可恢复当前预测单元。

因此，运动补偿器560可针对每个预测单元执行运动补偿，可恢复每个预测单元，并因此可恢复包括恢复后的预测单元的当前图像。恢复后的预测单元和图像可成为另一预测单元和另一图像的参考目标。

视频编码设备100和视频解码设备200使用分层编码单元以考虑图像的特征。可根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度，或可由用户不同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。

在根据本发明的实施例的编码单元的分层结构600中，编码单元的最大高度和最大宽度均是64，最大深度是4。在这种情况下，最大深度表示编码单元从最大编码单元被划分到最小编码单元的总次数。由于沿着分层结构600的垂直轴深度加深，因此较深层编码单元的高度和宽度均被划分。另外，预测单元和分区沿着分层结构600的水平轴被示出，其中，所述预测单元和分区是对每个较深层编码单元进行预测编码的基础。

换言之，在分层结构600中，编码单元610是最大编码单元，其中，深度为0，尺寸为64×64(即，高度乘宽度)。随着深度沿着垂直轴加深，存在尺寸为32×32和深度为1的编码单元620、尺寸为16×16和深度为2的编码单元630、尺寸为8×8和深度为3的编码单元640。尺寸为8×8和深度为3的编码单元640是具有最低深度的最小编码单元。

编码单元的预测单元和分区根据每个深度沿着水平轴被排列。换言之，如果尺寸为64×64和深度为0的编码单元610是预测单元，则可将预测单元划分成包括在编码单元610中的分区，即，尺寸为64×64的分区610、尺寸为64×32的分区612、尺寸为32×64的分区614或尺寸为32×32的分区616。

类似地，可将尺寸为32×32和深度为1的编码单元620的预测单元划分成包括在编码单元620中的分区，即，尺寸为32×32的分区620、尺寸为32×16的分区622、尺寸为16×32的分区624和尺寸为16×16的分区626。

类似地，可将尺寸为16×16和深度为2的编码单元630的预测单元划分成包括在编码单元630中的分区，即，包括在编码度单元630中的尺寸为16×16的分区630、尺寸为16×8的分区632、尺寸为8×16的分区634和尺寸为8×8的分区636。

类似地，可将尺寸为8×8和深度为3的编码单元640的预测单元划分成包括在编码单元640中的分区，即，包括在编码单元640中的尺寸为8×8的分区、尺寸为8×4的分区642、尺寸为4×8的分区644和尺寸为4×4的分区646。

为了确定构成最大编码单元610的编码单元的至少一个编码深度，视频编码设备100的编码单元确定器120对包括在最大编码单元610中的与每个深度相应的编码单元执行编码。

随着深度加深，包括具有相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量增加。例如，需要四个与深度2相应的编码单元来覆盖包括在与深度1相应的一个编码单元中的数据。因此，为了根据深度比较对相同数据进行编码的结果，与深度1相应的编码单元和四个与深度2相应的编码单元均被编码。

为了针对深度之中的当前深度执行编码，可沿着分层结构600的水平轴，通过对与当前深度相应的编码单元中的每个预测单元执行编码，来将针对当前深度选择最小编码误差。可选地，随着深度沿着分层结构600的垂直轴加深，可通过针对每个深度执行编码，比较根据深度的最小编码误差，来搜索最小编码误差。在编码单元610中的具有最小编码误差的深度和分区可被选为编码单元610的编码深度和分区类型。

图15是用于描述根据本发明的实施例的在编码单元710和变换单元720之间的关系的示图。

视频编码设备100或视频解码设备200针对每个最大编码单元，根据具有小于或等于最大编码单元的尺寸的编码单元，对图像进行编码或解码。可基于不大于相应的编码单元的数据单元，来选择用于在编码期间进行变换的变换单元的尺寸。

例如，在视频编码设备100或视频解码设备200中，如果编码单元710的尺寸是64×64，则可通过使用尺寸为32×32的变换单元720来执行变换。

此外，可通过对小于64×64的尺寸为32×32、16×16、8×8和4×4的每个变换单元执行变换，来对尺寸为64×64的编码单元710的数据进行编码，然后可选择具有最小编码误差的变换单元。

视频编码设备100的输出单元130可对与编码深度相应的每个编码单元的关于分区类型的信息800、关于预测模式的信息810以及关于变换单元尺寸的信息820进行编码，并将信息800、信息810和信息820作为关于编码模式的信息来发送。

信息800指示关于通过划分当前编码单元的预测单元而获得的分区的形状的信息，其中，所述分区是用于对当前编码单元进行预测编码的数据单元。例如，可将尺寸为2N×2N的当前编码单元CU_0划分成以下分区中的任意一个：尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808。这里，关于分区类型的信息800被设置来指示尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808中的一个。

信息810指示每个分区的预测模式。例如，信息810可指示对由信息800指示的分区执行的预测编码的模式，即，帧内模式812、帧间模式814或跳过模式816。

信息820指示当对当前编码单元执行变换时所基于的变换单元。例如，变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧内变换单元828。

视频解码设备200的图像数据和编码信息提取器220可根据每个较深层编码单元，提取并使用用于解码的信息800、810和820。

划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分成更低深度的编码单元。

用于对深度为0和尺寸为2N_0×2N_0的编码单元900进行预测编码的预测单元910可包括以下分区类型的分区：尺寸为2N_0×2N_0的分区类型912、尺寸为2N_0×N_0的分区类型914、尺寸为N_0×2N_0的分区类型916和尺寸为N_0×N_0的分区类型918。图17仅示出了通过对称地划分预测单元910而获得的分区类型912至918，但是分区类型不限于此，并且预测单元910的分区可包括非对称分区、具有预定形状的分区和具有几何形状的分区。

根据每种分区类型，对尺寸为2N_0×2N_0的一个分区、尺寸为2N_0×N_0的两个分区、尺寸为N_0×2N_0的两个分区和尺寸为N_0×N_0的四个分区重复地执行预测编码。可对尺寸为2N_0×2N_0、N_0×2N_0、2N_0×N_0和N_0×N_0的分区执行帧内模式和帧间模式下的预测编码。可仅对尺寸为2N_0×2N_0的分区执行跳过模式下的预测编码。

对在分区类型912至918中进行包括预测编码的编码的误差进行比较，并从分区类型中确定最小编码误差。如果在分区类型912至916中的一个分区类型中编码误差最小，则可不将预测单元910划分到更低深度。

如果在分区类型918中编码误差最小，则深度从0改变到1以在操作920中划分分区类型918，并对深度为2和尺寸为N_0×N_0的编码单元930重复地执行编码来搜索最小编码误差。

用于对深度为1和尺寸为2N_1×2N_1(＝N_0×N_0)的编码单元930进行预测编码的预测单元940可包括以下分区类型的分区：尺寸为2N_1×2N_1的分区类型942、尺寸为2N_1×N_1的分区类型944、尺寸为N_1×2N_1的分区类型946以及尺寸为N_1×N_1的分区类型948。

如果在分区类型948中编码误差最小，则深度从1改变到2以在操作950中划分分区类型948，并对深度为2和尺寸为N_2×N_2的编码单元960重复执行编码来搜索最小编码误差。

当最大深度是d时，根据每个深度的划分操作可被执行直到深度变成d-1，并且划分信息可被编码直到深度是0到d-2中的一个。换句话说，当编码被执行直到在与d-2的深度相应的编码单元在操作970中被划分之后深度是d-1时，用于对深度为d-1和尺寸为2N_(d-1)×2N_(d-1)的编码单元980进行预测编码的预测单元990可包括以下分区类型的分区：尺寸为2N_(d-1)×2N(d-1)的分区类型992、尺寸为2N_(d-1)×N(d-1)的分区类型994、尺寸为N_(d-1)×2N(d-1)的分区类型996和尺寸为N_(d-1)×N(d-1)的分区类型998。

可对分区类型992至998中的尺寸为2N_(d-1)×2N_(d-1)的一个分区、尺寸为2N_(d-1)×N_(d-1)的两个分区、尺寸为N_(d-1)×2N_(d-1)的两个分区、尺寸为N_(d-1)×N_(d-1)的四个分区重复地执行预测编码，以搜索具有最小编码误差的分区类型。

即使当分区类型998具有最小编码误差时，由于最大深度是d，因此深度为d-1的编码单元CU_(d-1)也不再被划分到更低深度，构成当前最大编码单元900的编码单元的编码深度被确定为d-1，并且当前最大编码单元900的分区类型可被确定为N_(d-1)×N(d-1)。此外，由于最大深度是d，并且具有最低深度d-1的最小编码单元980不再被划分到更低深度，因此不设置最小编码单元980的划分信息。

数据单元999可以是用于当前最大编码单元的“最小单元”。根据本发明的实施例的最小单元可以是通过将最小编码单元980划分成4份而获得的矩形数据单元。通过重复地执行编码，视频编码设备100可通过比较根据编码单元900的深度的编码误差来选择具有最小编码误差的深度以确定编码深度，并将相应分区类型和预测模式设置为编码深度的编码模式。

这样，在所有深度1至d中对根据深度的最小编码误差进行比较，并且具有最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型和预测模式可作为关于编码模式的信息被编码并发送。另外，由于编码单元从0的深度被划分到编码深度，因此仅编码深度的划分信息被设置为0，并且除了编码深度以外的深度的划分信息被设置为1。

视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元900的编码深度和预测单元的信息，来对分区912进行解码。视频解码设备200可通过使用根据深度的划分信息，将划分信息为0的深度确定为编码深度，并且使用关于相应深度的编码模式的信息来进行解码。

图18至图20是用于描述根据本发明的实施例的编码单元1010、预测单元1060和变换单元1070之间的关系的示图。

编码单元1010是最大编码单元中的与由视频编码设备100确定的编码深度相应的具有树结构的编码单元。预测单元1060是每个编码单元1010中的预测单元的分区，变换单元1070是每个编码单元1010的变换单元。

当在编码单元1010中最大编码单元的深度是0时，编码单元1012和编码单元1054的深度是1，编码单元1014、1016、1018、1028、1050和1052的深度是2，编码单元1020、1022、1024、1026、1030、1032和1048的深度是3，编码单元1040、1042、1044和1046的深度是4。

在预测单元1060中，通过划分编码单元1010中的编码单元来获得一些编码单元1014、1016、1022、1032、1048、1050、1052和1054。换句话说，编码单元1014、1022、1050和1054中的分区类型的尺寸是2N×N，编码单元1016、1048和1052中的分区类型的尺寸是N×2N，编码单元1032的分区类型的尺寸就N×N。编码单元1010的预测单元和分区小于或等于每个编码单元。

在小于编码单元1052的数据单元中的变换单元1070中，对编码单元1052的图像数据执行变换或逆变换。另外，在尺寸和形状方面，变换单元1070中的编码单元1014、1016、1022、1032、1048、1050和1052不同于预测单元1060中的编码单元1014、1016、1022、1032、1048、1050和1052。换句话说，视频编码设备100和视频解码设备200可对同一编码单元中的数据单元独立地执行帧内预测、运动估计、运动补偿、变换和逆变换。

因此，对最大编码单元的每个区域中的具有分层结构的每个编码单元递归地执行编码来确定最优编码单元，从而可获得具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。表1示出可由视频编码设备100和视频解码设备200设置的编码信息。

[表1]

视频编码设备100的输出单元130可输出关于具有树结构的编码单元的编码信息，视频解码设备200的图像数据和编码信息提取器220可从接收到的比特流提取关于具有树结构的编码单元的编码信息。

划分信息指示是否将当前编码单元划分成更低深度的编码单元。如果当前深度d的划分信息是0，则当前编码单元不再被划分成更低深度的的深度是编码深度，从而可针对所述编码深度来定义关于分区类型、预测模式和变换单元的尺寸的信息。如果当前编码单元根据划分信息被进一步划分，则对更低深度的四个划分编码单元独立地执行编码。

预测模式可以是帧内模式、帧间模式和跳过模式中的一种。可针对所有分区类型定义帧内模式和帧间模式，仅针对尺寸为2N×2N的分区类型定义跳过模式。

关于分区类型的信息可指示通过对称地划分预测单元的高度或宽度而获得的尺寸为2N×2N、2N×N、N×2N和N×N的对称分区类型，以及通过非对称地划分预测单元的高度或宽度而获得的尺寸为2N×nU、2N×nD、nL×2N和nR×2N的非对称分区类型。可通过按1:3和3:1来划分预测单元的高度来分别获得尺寸为2N×nU和2N×nD的非对称分区类型，可通过按1:3和3:1来划分预测单元的宽度来分别获得尺寸为nL×2N和nR×2N的非对称分区类型。

可将变换单元的尺寸设置成帧内模式下的两种类型和帧间模式下的两种类型。换句话说，如果变换单元的划分信息是0，则变换单元的尺寸可以是2N×2N，即当前编码单元的尺寸。如果变换单元的划分信息是1，则可通过对当前编码单元进行划分来获得变换单元。另外，如果尺寸为2N×2N的当前编码单元的分区类型是对称分区类型时，则变换单元的尺寸可以是N×N，如果当前编码单元的分区类型是非对称分区类型，则变换单元的尺寸可以是N/2×N/2。

关于具有树结构的编码单元的编码信息可包括与编码深度相应的编码单元、预测单元和最小单元中的至少一个。与编码深度相应的编码单元可包括包含相同编码信息的预测单元和最小单元中的至少一个。

因此，通过比较邻近数据单元的编码信息来确定邻近数据单元是否被包括在与编码深度相应的同一编码单元中。另外，通过使用数据单元的编码信息来确定与编码深度相应的相应编码单元，并因此可确定最大编码单元中的编码深度的分布。

因此，如果基于邻近数据单元的编码信息来对当前编码单元进行预测，则可直接参考并使用与当前编码单元邻近的较深层编码单元中的数据单元的编码信息。

可选地，如果基于邻近数据单元的编码信息来对当前编码单元进行预测，则使用数据单元的编码信息来搜索与当前编码单元邻近的数据单元，并可参考搜索到的邻近编码单元以对当前编码单元进行预测。

图21是用于描述根据表1的编码模式信息的编码单元、预测单元或分区和变换单元之间的关系的示图。

最大编码单元1300包括编码深度的编码单元1302、1304、1306、1312、1314、1316和1318。这里，由于编码单元1318是编码深度的编码单元，因此划分信息可以被设置成0。可将关于尺寸为2N×2N的编码单元1318的分区类型的信息设置成以下分区类型中的一种：尺寸为2N×2N的分区类型1322、尺寸为2N×N的分区类型1324、尺寸为N×2N的分区类型1326、尺寸为N×N的分区类型1328、尺寸为2N×nU的分区类型1332、尺寸为2N×nD的分区类型1334、尺寸为nL×2N的分区类型1336以及尺寸为nR×2N的分区类型1338。

变换单元的划分信息(TU(变换单元)尺寸标记)是一类变换索引。与变换索引相应的变换单元的尺寸可根据编码单元的预测单元类型或分区类型而改变。

例如，当分区类型被设置成对称(即，分区类型1322、1324、1326或1328)时，如果变换单元的划分信息(TU尺寸标记)是0，则设置尺寸为2N×2N的变换单元1342，如果TU尺寸标记是1，则设置尺寸为N×N的变换单元1344。

当分区类型被设置成非对称(例如，分区类型1332、1334、1336或1338)时，如果TU尺寸标记是0，则设置尺寸为2N×2N的变换单元1352，如果TU尺寸标记是1，则设置尺寸为N/2×N/2的变换单元1354。

参照图21，TU尺寸标记是具有值0或1的标记，但是TU尺寸标记不限于1比特，在TU尺寸标记从0增加的同时，变换单元可被分层划分以具有树结构。变换单元的划分信息(TU尺寸标记)可以是变换索引的示例。

在这种情况下，根据本发明的实施例，可通过使用变换单元的TU尺寸标记以及变换单元的最大尺寸和最小尺寸来表示实际上已使用的变换单元的尺寸。根据本发明的实施例，视频编码设备100能够对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记进行编码。对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记进行编码的结果可被插入SPS。根据本发明的实施例，视频解码设备200可通过使用最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记来对视频进行解码。

例如，(a)如果当前编码单元的尺寸是64×64并且最大变换单元尺寸是32×32，则(a-1)当TU尺寸标记为0时，变换单元的尺寸可以是32×32，(a-2)当TU尺寸标记为1时，变换单元的尺寸可以是16×16，(a-3)当TU尺寸标记为2时，变换单元的尺寸可以是8×8。

作为另一示例，(b)如果当前编码单元的尺寸是32×32并且最小变换单元尺寸是32×32，则(b-1)当TU尺寸标记为0时，变换单元的尺寸可以是32×32。这里，由于变换单元的尺寸不能够小于32×32，因此TU尺寸标记不能够被设置为除了0以外的值。

作为另一示例，(c)如果当前编码单元的尺寸是64×64并且最大TU尺寸标记为1，则TU尺寸标记可以是0或1。这里，TU尺寸标记不能够被设置为除了0或1以外的值。

因此，当TU尺寸标记为0时，如果定义最大TU尺寸标记为“MaxTransformSizeIndex”，最小变换单元尺寸为“MinTransformSize”，变换单元尺寸为“RootTuSize”，则可通过等式(1)来定义可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”：

CurrMinTuSize＝max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex))…(1)

与可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”相比，当TU尺寸标记为0时，变换单元尺寸“RootTuSize”可指示可在系统中选择的最大变换单元尺寸。在等式(1)中，“RootTuSize/(2∧MaxTransformSizeIndex)”指示当TU尺寸标记为0时，变换单元尺寸“RootTuSize”被划分了与最大TU尺寸标记相应的次数时的变换单元尺寸，“MinTransformSize”指示最小变换尺寸。因此，“RootTuSize/(2^MaxTransformSizeIndex)”和“MinTransformSize”中较小的值可以是可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”。

根据本发明的实施例，最大变换单元尺寸RootTuSize可根据预测模式的类型而改变。

例如，如果当前预测模式是帧间模式，则可通过使用以下的等式(2)来确定“RootTuSize”。在等式(2)中，“MaxTransformSize”指示最大变换单元尺寸，“PUSize”指示当前预测单元尺寸：

RootTuSize＝min(MaxTransformSize,PUSize)……(2)

也就是说，如果当前预测模式是帧间模式，则当TU尺寸标记为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前预测单元尺寸中较小的值。

如果当前分区单元的预测模式是帧内模式，则可通过使用以下的等式(3)来确定“RootTuSize”。在等式(3)中，“PartitionSize”指示当前分区单元的尺寸：

RootTuSize＝min(MaxTransformSize,PartitionSize)……(3)

也就是说，如果当前预测模式是帧内模式，则当TU尺寸标记为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前分区单元的尺寸之中较小的值。

然而，根据分区单元中的预测模式的类型而改变的当前最大变换单元尺寸“RootTuSize”仅是示例，本发明不限于此。

根据如上参照图9至图21描述的基于具有树结构的编码单元的视频编码方法，针对树结构的每个编码单元对空间域的图像数据进行编码。根据基于具有树结构的编码单元的视频解码方法，针对每个最大编码单元执行解码以恢复空间域的图像数据。因此，可恢复画面和视频(即，画面序列)。恢复后的视频可通过再现设备被再现，可被存储在存储介质中，或者可通过网络被发送。

根据本发明的实施例可被编写为计算机程序，并可在使用计算机可读记录介质执行程序的通用数字计算机中被实现。计算机可读记录介质的示例包括磁存储介质(例如，ROM、软盘、硬盘等)和光记录介质(例如，CD-ROM或DVD)。

为了便于解释，已参照图1至图21描述的根据运动矢量确定方法的视频编码方法将被统称为“根据本发明的视频编码方法”。另外，已参照图1至图21描述的根据运动矢量确定方法的视频解码方法将被称为“根据本发明的视频解码方法”。

已参照图1至图21描述的视频编码设备(包括运动矢量确定设备10、视频编码单元70、视频解码单元80和视频编码设备100或图像编码器400)将被称为“根据本发明的视频编码设备”。另外，已参照图1至图21描述的视频解码设备(包括运动矢量确定设备10、视频解码单元80、视频解码设备200或图像解码器500)将被称为“根据本发明的视频解码设备”。

现在将详细描述根据本发明的实施例的存储程序的计算机可读记录介质(例如，盘26000)。

图22示出根据本发明的实施例的存储程序的盘26000的物理结构。作为存储介质的盘26000可以是硬盘驱动器、致密盘只读存储器(CD-ROM)盘、蓝光盘或数字多功能盘(DVD)。盘26000包括多个同心磁道Tf，每个同心磁道Tf沿盘26000的圆周方向被划分成特定数量的扇区Se。在盘26000的特定区域中，可分配并存储执行如上所描述的运动矢量确定方法、视频编码方法和视频解码方法的程序。

现在将参照图23来描述使用存储以下程序的存储介质来实现的计算机系统，其中，所述程序用于执行如上所述的视频编码方法和视频解码方法。

图23示出通过使用盘26000来记录并读取程序的盘驱动器26800。计算机系统26700可经由盘驱动器26800将执行根据本发明的实施例的视频编码方法和视频解码方法中的至少一个的程序存储在盘26000中。为了在计算机系统26700中运行存储在盘26000中的程序，可通过使用盘驱动器26800从盘26000读取程序并将程序发送到计算机系统26700。

执行根据本发明的实施例的视频编码方法和视频解码方法中的至少一个的程序不仅可被存储在图22或图23中示出的盘26000中，还可被存储在存储卡、ROM卡带或固态驱动器(SSD)中。

以下将描述应用以上所描述的视频编码方法和视频解码方法的系统。

图24示出提供内容分布服务的内容供应系统11000的整体结构。将通信系统的服务区域划分成预定尺寸的小区，并将无线基站11700、11800、11900和12000分别安装在这些小区中。

内容供应系统11000包括多个独立装置。例如，诸如计算机12100、个人数字助理(PDA)12200、视频相机12300和移动电话12500的多个独立装置经由互联网服务提供商11200、通信网络11400和无线基站11700、11800、11900和12000连接到互联网11100。

然而，内容供应系统11000不限于如图24中所示，并且装置可选择性地被连接到内容供应系统11000。多个独立装置可不经由无线基站11700、11800、11900和12000而直接连接到通信网络11400。

视频相机12300是能够捕捉视频图像的成像装置，例如，数字视频相机。移动电话12500可利用各种协议(例如，个人数字通信(PDC)、码分多址(CDMA)、宽带码分多址(W-CDMA)、全球移动通信系统(GSM)和个人手持电话系统(PHS))中的至少一种通信方法。

视频相机12300可经由无线基站11900和通信网络11400连接到流服务器11300。流服务器11300允许经由视频相机12300从用户接收到的内容经由实时广播被流传输。可使用视频相机12300或流服务器11300来对从视频相机12300接收到的内容进行编码。通过视频相机12300捕捉到的视频数据可经由计算机12100被发送到流服务器11300。

通过相机12600捕捉到的视频数据也可经由计算机12100被发送到流服务器11300。与数码相机类似，相机12600是能够捕捉静止图像和视频图像两者的成像装置。可使用相机12600或计算机12100对通过相机12600捕捉到的视频数据进行编码。可将对视频执行编码和解码的软件存储在可由计算机12100访问的计算机可读记录介质(例如，CD-ROM盘、软盘、硬盘驱动器、SSD或存储卡)中。

如果视频数据通过内置在移动电话12500中的相机被捕捉到，则可从移动电话12500接收视频数据。

还可通过安装在视频相机12300、移动电话12500或相机12600中的大规模集成电路(LSI)系统来对视频数据进行编码。

根据本发明的实施例，内容供应系统1100可对由用户使用视频相机12300、相机12600、移动电话12500或另一成像装置所记录的内容数据(例如，在音乐会期间记录的内容)进行编码，并将编码后的内容数据发送到流服务器11300。流服务器11300可将编码后的内容数据以流内容的形式发送到请求内容数据的其它客户端。

客户端是能够对编码后的内容数据进行解码的装置，例如，计算机12100、PDA 12200、视频相机12300或移动电话12500。因此，内容供应系统11000允许客户端接收并再现编码后的内容数据。此外，内容供应系统11000允许客户端实时接收编码后的内容数据并对编码后的内容数据进行解码和再现，从而能够进行个人广播。

包括在内容供应系统11000中的多个独立装置的编码和解码操作可类似于根据本发明的实施例的视频编码设备和视频解码设备的编码和解码操作。

现在将参照图25和图26更加详细地描述包括在根据本发明的实施例的内容供应系统11000中的移动电话12500。

图25示出根据本发明的实施例的应用视频编码方法和视频解码方法的移动电话12500的外部结构。移动电话12500可以是智能电话，所述智能电话的功能不受限，并且所述智能电话的大部分功能可被改变或扩展。

移动电话12500包括可与图25的无线基站12000交换射频(RF)信号的内部天线12510，并包括用于显示由相机12530捕捉到的图像或经由天线12510接收到的和解码的图像的显示屏12520(例如，液晶显示器(LCD)或有机发光二极管(OLED)屏幕)。智能手机12500包括包含有控制按钮和触摸面板的操作面板12540。如果显示屏12520是触摸屏，则操作面板12540还包括显示屏12520的触摸感测面板。智能电话12500包括用于输出语音和声音的扬声器12580或另一类型声音输出单元、以及用于输入语音和声音的麦克风12550或另一类型声音输入单元。智能电话12500还包括用于捕捉视频和静止图像的相机12530，诸如电荷耦合器件(CCD)相机。智能电话12500还可包括：存储介质12570，用于存储通过相机12530捕捉到的、经由电子邮件接收到的、或根据各种方式获得的编码/解码数据(例如，视频或静止图像)；插槽12560，存储介质12570经由插槽12560被装入移动电话12500中。存储介质12570可以是闪存，例如，包括在塑料壳中的安全数字(SD)卡或电可擦和可编程只读存储器(EEPROM)。

图26示出根据本发明的实施例的移动电话12500的内部结构。为了系统地控制包括显示屏12520和操作面板12540的移动电话12500的部件，供电电路12700、操作输入控制器12640、图像编码单元12720、相机接口12630、LCD控制器12620、图像解码单元12690、复用器/解复用器12680、记录/读取单元12670、调制/解调单元12660以及声音处理器12650经由同步总线12730被连接到中央控制器12710。

如果用户操作电源按钮，并从“电源关闭”状态设置为“电源开启”状态，则供电电路12700从电池组向移动电话12500的所有部件供电，从而将移动电话12500设置为操作模式。

中央控制器12710包括中央处理单元(CPU)、ROM和随机存取存储器(RAM)。

在移动电话12500将通信数据发送到外部的同时，在中央控制器的控制下，在移动电话12500中产生数字信号。例如，声音处理器12650可产生数字声音信号，图像编码单元12720可产生数字图像信号，并且消息的文本数据可经由操作面板12540和操作输入控制器12640被产生。当在中央控制器12710的控制下数字信号被传送到调制/解调单元12660时，调制/解调单元12660对数字信号的频带进行调制，并且通信电路12610对频带调制数字声音信号执行数模转换(DAC)和频率转换。从通信电路12610输出的发送信号可经由天线12510被发送到语音通信基站或无线基站12000。

例如，当移动电话12500处于通话模式时，在中央控制器12710的控制下，经由麦克风12550获得的声音信号通过声音处理器12650被变换成数字声音信号。数字声音信号可经由调制/解调单元12660和通信电路12610被变换成发送信号，并可经由天线12510被发送。

当文本消息(例如，电子邮件)在数据通信模式下被发送时，文本消息的文本数据经由操作面板12540被输入，并经由操作输入控制器12640被发送到中央控制器12610。在中央控制器12610的控制下，文本数据经由调制/解调单元12660和通信电路12610被变换成发送信号，并经由天线12510被发送到无线基站12000。

为了在数据通信模式下发送图像数据，由相机12530捕捉到的图像数据经由相机接口12630被提供给图像编码单元12720。捕捉到的图像数据可经由相机接口12630和LCD控制器12620被直接显示在显示屏12520上。

图像编码单元12720的结构可与以上描述的视频编码设备100的结构相应。图像编码单元12720可根据由以上描述的视频编码设备100或图像编码器400所使用的视频编码方法，将从相机12530接收到的图像数据变换为压缩和编码后的图像数据，并然后将编码后的图像数据输出到复用器/解复用器12680。在相机12530的记录操作期间，由移动电话12500的麦克风12550获得的声音信号可经由声音处理器12650被变换成数字声音数据，并且数字声音数据可被传送到复用器/解复用器12680。

复用器/解复用器12680对从图像编码单元12720接收到的编码后的图像数据与从声音处理器12650接收到的声音数据一起进行复用。对数据进行复用的结果可经由调制/解调单元12660和通信电路12610被变换成发送信号，然后可经由天线12510被发送。

当移动电话12500从外部接收通信数据时，可对经由天线12510接收到的信号执行频率恢复和ADC以将信号变换成数字信号。调制/解调单元12660对数字信号的频带进行调制。根据频带调制后的数字信号的类型将所述数字信号发送到视频解码单元12690、声音处理器12650或LCD控制器12620。

在通话模式下，移动电话12500对经由天线12510接收到的信号进行放大，并通过对放大后的信号执行频率转换和ADC来获得数字声音信号。在中央控制器12710的控制下，接收到的数字声音信号经由调制/解调单元12660和声音处理器12650被变换成模拟声音信号，并且模拟声音信号经由扬声器12580被输出。

当在数据通信模式下时，接收在互联网网站上访问的视频文件的数据，经由调制/解调单元12660将经由天线12510从无线基站12000接收到的信号输出为复用数据，并将复用数据发送到复用器/解复用器12680。

为了对经由天线12510接收到的复用数据进行解码，复用器/解复用器12680将复用数据解复用成编码后的视频数据流和编码后的音频数据流。经由同步总线12730，编码后的视频数据流和编码后的音频数据流分别被提供给视频解码单元12690和声音处理器12650。

图像解码单元12690的结构可与以上描述的视频解码设备200的结构相应。图像解码单元12690可根据由以上描述的视频解码设备200或图像解码器500所使用的视频解码方法，对编码后的视频数据进行解码来获得恢复后的视频数据，并经由LCD控制器12620将恢复后的视频数据提供给显示屏12520。

因此，可将在互联网网站上访问的视频文件的数据显示在显示屏12520上。同时，声音处理器12650可将音频数据变换成模拟声音信号，并将模拟声音信号提供给扬声器12580。因此，也可经由扬声器12580再现在互联网网站上访问的视频文件中包含的音频数据。

移动电话12500或另一类型的通信终端可以是包括根据本发明的实施例的视频编码设备和视频解码设备两者的收发终端，可以是仅包括视频编码设备的收发终端，或者可以是仅包括视频解码设备的收发终端。

根据本发明的通信系统不限于以上参照图25描述的通信系统。例如，图27示出根据本发明的实施例的采用通信系统的数字广播系统。图27的数字广播系统可通过使用根据本发明的实施例的视频编码设备和视频解码设备来接收经由卫星或地面网络发送的数字广播。

具体地，广播站12890通过使用无线电波将视频数据流发送到通信卫星或广播卫星12900。广播卫星12900发送广播信号，广播信号经由家用天线12860被发送到卫星广播接收器。在每个房屋中，可通过TV接收器12810、机顶盒12870或另一装置对编码后的视频流进行解码并再现。

当根据本发明的实施例的视频解码设备被实现在再现设备12830中时，再现设备12830可对记录在存储介质12820(诸如用于恢复数字信号的盘或存储卡)上的编码后的视频流进行解析和解码。因此，可在例如监视器12840上再现恢复后的视频信号。

在被连接到用于卫星/地面广播的天线12860或用于接收有线电视(TV)广播的线缆天线12850的机顶盒12870中，可安装根据本发明的实施例的视频解码设备。从机顶盒12870输出的数据也可被再现在TV监视器12880上。

如另一示例，可将根据本发明的实施例的视频解码设备安装在TV接收器12810中，而不是机顶盒12870中。

包括适当天线12910的汽车12920可接收从卫星12900或无线基站11700发送的信号。可在内置在汽车12920中的汽车导航系统12930的显示屏上再现解码后的视频。

视频信号可由根据本发明的实施例的视频编码设备来编码，然后可被存储在存储介质中。具体地，可由DVD记录器将图像信号存储在DVD盘12960中，或可由硬盘记录器12950将图像信号存储在硬盘中。如另一示例，可将视频信号存储在SD卡12970中。如果硬盘记录器12950包括根据本发明的实施例的视频解码设备，则记录在DVD盘12960、SD卡12970或另一存储介质上的视频信号可被再现于TV监视器12880上。

汽车导航系统12930可不包括图27的相机12530、相机接口12630和图像编码单元12720。例如，计算机12100和TV接收器12810可不包括在图27的相机12530、相机接口12630和图像编码单元12720中。

云计算系统可包括云计算服务器14000、用户数据库(DB)14100、多个计算资源14200和用户终端。

响应于来自用户终端的请求，云计算系统经由数据通信网络(例如，互联网)提供多个计算资源14200的点播外包服务。在云计算环境下，服务提供商通过使用虚拟技术组合位于不同的物理位置的数据中心处的计算资源，来为用户提供想要的服务。服务用户不必将计算资源(例如，应用、存储器、操作系统(OS)和安全)安装在他/她拥有的终端中以使用它们，但可在想要的时间点在通过虚拟技术产生的虚拟空间中从服务中选择和使用想要的服务。

被指定的服务用户的用户终端经由包括互联网和移动通信网络的数据通信网络被连接到云计算服务器14100。可从云计算服务器14100向用户终端提供云计算服务，特别是视频再现服务。用户终端可以是能够被连接到互联网的各种类型的电子装置，例如，桌上型PC 14300、智能TV 14400、智能电话14500、笔记本计算机14600、便携式多媒体播放器(PMP)14700、平板PC 14800等。

云计算服务器14100可组合分布在云网络中的多个计算资源14200，并向用户终端提供组合的结果。所述多个计算资源14200可包括各种数据服务，并可包括从用户终端上载的数据。如上所描述的，云计算服务器14100可通过根据虚拟技术组合分布在不同区域中的视频数据库来向用户终端提供想要的服务。

将关于已经订购云计算服务的用户的用户信息存储在用户DB 14100中。用户信息可包括用户的注册信息、地址、姓名和个人信用信息。用户信息还可包括视频的索引。这里，所述索引可包括已经被再现的视频的列表、正在被再现的视频的列表，之前被再现的视频的暂停点等。

可在用户装置之间共享存储在用户DB 14100中的关于视频的信息。例如，当响应于来自笔记本计算机14600的请求将视频服务提供给笔记本计算机14600时，视频服务的再现历史被存储在用户DB 14100中。当从智能电话14500接收到用于再现此视频服务的请求时，云计算服务器14100基于用户DB 14100搜索并再现此视频服务。当智能电话14500从云计算服务器14100接收到视频数据流时，通过对视频数据流进行解码来再现视频的处理与以上参照图27描述的移动电话12500的操作类似。

云计算服务器14100可参考存储在用户DB 14100中的想要的视频服务的再现历史。例如，云计算服务器14100从用户终端接收用于再现存储在用户DB 14100中的视频的请求。如果此视频之前被再现过，则由云计算服务器14100执行的对此视频进行流传输的方法可根据来自用户终端的请求(即，根据是将从视频的起点还是视频的暂停点来再现视频)而不同。例如，如果用户终端请求从视频的起点开始再现视频，则云计算服务器14100将从视频的第一帧开始的视频的流数据发送到用户终端。如果用户终端请求从视频的暂停点开始再现视频，则云计算服务器14100将从与暂停点相应的帧开始的视频的流数据发送到用户终端。

在此情况下，用户终端可包括如以上参照图1至图23描述的视频解码设备。如另一示例，用户终端可包括如以上参照图1至图23描述的视频编码设备。可选地，用户终端可包括如以上参照图1至图23描述的视频解码设备和视频编码设备两者。

以上已经参照图22至图28描述了以上参照图1至图21描述的根据本发明的实施例的视频编码方法、视频解码方法、视频编码设备和视频解码设备的各种应用。然而，根据本发明的各种实施例的将视频编码方法和视频解码方法存储在存储介质中的方法，或者将视频编码设备和视频解码设备实现在装置中的方法不限于以上参照图22至图28描述的实施例。

虽然已参照本发明的示例性实施例具体示出并描述了本发明，但是本领域的普通技术人员将理解，在不脱离由权利要求书限定的本发明的精神和范围的情况下，可在其中进行形式和细节上的各种改变。

Claims

1.一种用于对图像进行解码的设备，所述设备包括：

参考画面比较单元，确定当前块的参考画面是否与邻近于当前块的多个候选块之中的候选块的参考画面相同，当候选块的参考画面与当前块的参考画面不同时，确定候选块的参考画面和当前块的参考画面是否都是长期参考画面；

运动矢量确定器，当候选块的参考画面和当前块的参考画面都是长期参考画面时，在不对候选块的运动矢量进行缩放的情况下获得空间运动矢量预测候选，从包括空间运动矢量预测候选的运动矢量预测候选之中确定当前块的运动矢量预测，通过使用该运动矢量预测来产生当前块的运动矢量。