CN105308961B

CN105308961B - 用于补偿亮度差的层间视频编码方法和设备以及层间视频解码方法和设备

Info

Publication number: CN105308961B
Application number: CN201480032644.7A
Authority: CN
Inventors: 朴慜祐; 尹载元; 李振荣; 崔秉斗; 魏浩千; 曺容振
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2013-04-05
Filing date: 2014-04-07
Publication date: 2019-07-09
Anticipated expiration: 2034-04-07
Also published as: EP2983362B1; KR20140123008A; EP2983362A4; US20160037177A1; EP2983362A1; CN105308961A; WO2014163454A1

Abstract

根据本发明的实施例的层间视频解码方法包括以下步骤：确定是否补偿使用第一层中的参考块被恢复的第二层中的当前块的亮度；基于是否补偿亮度，使用与相应于第二层中的当前块的参考像素位置的第一层的参考位置最接近的整像素来确定第一层中的参考像素；使用第一层中的确定的参考像素和第二层中的当前块的周围像素来确定第二层中的当前块的亮度补偿参数。

Description

用于补偿亮度差的层间视频编码方法和设备以及层间视频解码方法和设备

技术领域

本发明涉及层间视频编码方法和设备以及视频解码方法及其设备，更具体地，涉及一种推导出用于补偿层间图像之间的亮度差的亮度补偿参数的方法。

背景技术

随着用于再现和存储高分辨率或高质量视频内容的硬件的开发和提供，对于用于有效地对高分辨率或高质量视频内容进行编码或解码的视频编解码器的需求正在增加。根据传统的视频编解码器，基于根据树结构的编码单元，根据受限的编码方法来对视频进行编码。

空间域的图像数据经由频率变换被变换为频域的系数。根据视频编解码器，将图像划分为具有预定尺寸的块，对每个各块执行离散余弦变换(DCT)，并以块为单位对频率系数进行编码，以进行频率变换的快速计算。与空间域的图像数据相比，频域的系数容易被压缩。具体地，由于根据经由视频编解码器的帧间预测或帧内预测的预测误差来表示空间域的图像像素值，因此当对预测误差执行频率变换时，大量数据可被变换为0。根据视频编解码器，可通过使用小量数据来代替连续并重复产生的数据，来减少数据量。

具体地，在对视频进行编码和解码的操作期间可使用将重建像素的值调整SAO大小的方法，从而使原始图像与重建图像之间的误差最小化。

根据多层视频编解码器，可对第一层视频和一个或更多个第二层视频进行编码和解码。第一层视频和第二层视频的数据量可通过消除时间/空间冗余以及第一层视频与第二层视频的层间冗余而被减小。

发明内容

技术问题

为了推导出亮度补偿参数，需要获得与第二层当前块相应的第一层重建块周围的像素的值。在此，可使用视差矢量来找到与第二层当前块相应的第一层重建块。

然而，由于视差矢量可呈现出小数单位的精确度(诸如，四分之一像素或二分之一像素)，因此，在第二层当前块的位置由视差矢量所指示的位置可以是子像素的位置。然而，为了减小亮度补偿的复杂度，按照整像素对第二层当前块周围的像素与在第一层参考块周围的像素进行比较，因此，参考块的位置应被确定为整像素的位置。

技术方案

本发明提供了一种层间视频解码方法，其中，所述层间视频解码方法包括确定是否针对通过使用第一层参考块将被重建的第二层当前块执行亮度补偿；基于是否执行亮度补偿，通过使用与相应于第二层当前块的参考像素的位置的第一层的参考位置最接近的整像素来确定第一层参考像素；通过使用确定的第一层参考像素和在第二层当前块周围的像素来确定关于第二层当前块的亮度补偿参数。

有益效果

根据本发明的实施例，提供一种通过当用于推导出亮度补偿参数的参考位置在多层图像中的子像素位置时使用最接近的整像素来提高编码效率的层间视频编码方法和层间视频编码设备以及层间视频解码方法和层间视频解码设备。

附图说明

图1a是根据本发明的各种实施例的层间视频编码设备的框图。

图1b是根据本发明的各种实施例的层间视频编码方法的流程图。

图2a是根据本发明的各种实施例的层间视频解码设备的框图。

图2b是根据本发明的各种实施例的层间视频解码方法的流程图。

图3是示出根据实施例的层间预测结构的示图。

图4是示出根据实施例的确定亮度补偿参数的方法的示图。

图5a和图5b是示出根据本发明的实施例的确定由视差矢量指示的接近的整像素的示例的示图。

图6a是根据实施例的确定用于推导出亮度补偿参数的参考像素的方法的流程图。

图6b是根据另一实施例的确定用于推导出亮度补偿参数的参考像素的方法的流程图。

图7是根据另一实施例的确定用于推导出亮度补偿参数的参考像素的方法的流程图。

图8是根据一个或更多个实施例的基于根据树结构的编码单元的视频编码设备的框图。

图9是根据一个或更多个实施例的基于具有树结构的编码单元的视频解码设备的框图。

图10是用于描述根据一个或更多个实施例的编码单元的概念的示图。

图11是根据一个或更多个实施例的基于编码单元的图像编码器的框图。

图12是根据一个或更多个实施例的基于编码单元的图像解码器的框图。

图13是示出根据一个或更多个实施例的根据深度的较深层编码单元以及分区的示图。

图14是用于描述根据一个或更多个实施例的编码单元与变换单元之间的关系的示图。

图15是用于描述根据一个或更多个实施例的与深度相应的编码单元的编码信息的示图。

图16是根据一个或更多个实施例的根据深度的较深层编码单元的示图。

图17、图18和图19是用于描述根据一个或更多个实施例的编码单元、预测单元和变换单元之间的关系的示图。

图20是用于描述根据表1的编码模式信息的编码单元、预测单元、和变换单元之间的关系的示图。

图21是根据一个或更多个实施例的存储程序的盘的物理结构的示图。

图22是通过使用盘来记录和读取程序的盘驱动器的示图。

图23是提供内容分配服务的内容供应系统的整体结构的示图。

图24和图25分别是根据一个或更多个实施例的应用了视频编码方法和视频解码方法的移动电话的外部结构和内部结构的示图。

图26是根据一个或更多个实施例的采用通信系统的数字广播系统的示图。

图27是示出根据一个或更多个实施例的使用视频编码设备和视频解码设备的云计算系统的网络结构的示图。

最佳模式

根据本发明的实施例，一种层间视频解码方法包括：确定是否针对通过使用第一层参考块将被重建的第二层当前块执行亮度补偿；基于是否执行亮度补偿，通过使用与相应于针对第二层当前块的参考像素的位置的第一层的参考位置最接近的整像素来确定第一层参考像素；通过使用确定的第一层参考像素和在第二层当前块周围的像素来确定关于第二层当前块的亮度补偿参数。

确定参考像素的步骤包括：获得视差矢量，其中，所述视差矢量指示与将被亮度补偿的第二层当前块的参考像素的位置相应的第一层的参考位置；选择与由获得的视差矢量指示的第一层的参考位置最接近的整像素。

确定参考像素的步骤包括：将获得的视差矢量变换为整数视差矢量；将由整数视差矢量指示的位置确定为参考像素的位置。

将视差矢量变换为整数视差矢量的步骤包括：通过针对由获得的视差矢量指示的第一层的参考位置的坐标执行特定移位运算，将获得的视差矢量变换为指示整像素。

第二层当前块的参考像素是指示第二层当前块的位置的像素。

确定参考像素的步骤包括：将与相应于第二层当前块的左上角的像素的位置的第一层的参考位置最接近的整像素确定为在第一层参考块的左上角的像素的位置；将在确定的第一层参考块周围的像素确定为参考像素。

第二层当前块的参考像素是在第二层当前块周围的像素，在确定第一层参考像素的步骤中，将整像素的位置确定为参考像素的位置。

第二层当前块的参考像素是在第二层当前块周围的像素，确定第一层参考像素的步骤包括：获得与第一层的参考位置接近的至少一个整像素；通过使用获得的至少一个整像素，确定第一层的参考位置的参考像素值。

根据本发明的另一实施例，一种层间视频编码方法包括：确定是否针对通过使用第一层参考块将被重建的第二层当前块执行亮度补偿；如果确定执行亮度补偿，则通过使用与相应于第二层当前块的参考像素的位置的第一层的参考位置最接近的整像素来确定第一层参考像素；通过使用确定的第一层参考像素和在第二层当前块周围的像素来推导出关于第二层当前块的亮度补偿参数。

根据本发明的另一实施例，一种层间视频解码设备包括：亮度补偿确定器，确定是否针对通过使用第一层参考块将被重建的第二层当前块执行亮度补偿；参考像素确定器，基于是否执行亮度补偿，通过使用与相应于针对第二层当前块的参考像素的位置的第一层的参考位置最接近的整像素来确定第一层参考像素；亮度补偿参数确定单元，通过使用确定的第一层参考像素和在第二层当前块周围的像素来确定关于第二层当前块的亮度补偿参数。

根据本发明的另一实施例，一种层间视频编码设备包括：亮度补偿确定器，确定是否针对通过使用第一层参考块将被编码的第二层当前块执行亮度补偿；参考像素确定器，基于是否执行亮度补偿，通过使用与相应于第二层当前块的参考像素的位置的第一层的参考位置最接近的整像素来确定第一层参考像素；亮度补偿参数确定单元，通过使用确定的第一层参考像素和在第二层当前块周围的像素来确定关于第二层当前块的亮度补偿参数。

根据本发明的另一实施例，提供一种记录有用于实现根据实施例的方法的计算机程序的非暂时性计算机可读记录介质。

具体实施方式

以下，将参照图1a至图7，将提出根据各种实施例的确定是否基于块特性补偿亮度的层间视频编码方法和层间视频解码方法。此外，参照图8至图 20，公开了可应用到层间视频编码方法和层间视频解码方法的根据各种实施例的基于具有树结构的编码结构的视频编码方法和视频解码方法。此外，参照图21至图27，公开了可将视频编码方法和视频解码方法应用到的各种实施例。

以下，术语“图像”可以指视频的静止图像或运动图像(即，视频本身)。

以下，术语“样点”指示被分配到图像的采样位置的数据以及指示将被处理的数据。例如，空间域的图像中，像素可以是样点。

首先，参照图1a至图7，将公开层间视频编码设备和层间视频编码方法以及层间视频解码设备和层间视频解码方法。

图1a是根据本发明的各种实施例的层间视频编码设备10的框图。图1b 是根据本发明的各种实施例的层间视频编码方法的流程图。

根据本发明的各种实施例的层间视频编码设备10包括第一层编码器12 和第二层编码器14。第二层编码器14可包括亮度补偿确定器16、参考像素确定器17和亮度补偿模式确定器18。亮度补偿确定器16、参考像素确定器 17和亮度补偿模式确定器18可被布置在第二层编码器14的外面。

根据本发明的各种实施例的层间视频编码设备10可根据可伸缩视频编码方法，按层对多个图像序列进行分类，对分类的图像序列进行编码，并输出包括针对各个层的编码的数据的独立的流。层间视频编码设备10可将第一层图像序列和第二层图像序列编码为不同层。

第一层编码器12可对第一层图像进行编码，并输出包括第一层图像的编码数据的第一层流。

第二层编码器14可对第二层图像进行编码，并输出包括第二层图像的编码数据的第二层流。

例如，根据基于空间可伸缩性的可伸缩视频编码方法，低分辨率图像可被编码为第一层图像，而高分辨率图像可被编码为第二层图像。对第一层图像编码的结果可被输出为第一层流，而对第二层图像编码的结果可被输出为第二层流。

在另一示例中，可根据可伸缩视频编码方法对多视点视频进行编码。在这种情况下，中心视点图像可被编码为第一层图像，而左视点图像和右视点图像可被编码为参考第一层图像的第二层图像。可选地，如果层间视频编码设备10允许包括第一层、第二层和第三层的三层或更多层，则中心视点图像可被编码为第一层流，左视点图像可被编码为第二层图像。右视点图像可被编码为第三层图像。然而，本发明不受限于此，通过对中心视点图像、左视点图像和右视点图像进行编码而形成的层和将被参考的层可被改变。

在另一示例中，可根据基于时间可伸缩性的时间分层预测来执行可伸缩视频编码方法。可输出包括通过对基本帧率的图像进行编码而产生的编码的数据的第一层流。时间层可按照帧率被分类，并且各个时间层可被编码为各个层。可通过参照基本帧率的图像对高帧率的图像进行进一步编码，从而输出包括关于高速帧率的编码的数据的第二层流。

此外，可针对第一层和多个第二层执行可伸缩视频编码。如果存在三个或更多个第二层，则可对第一层图像、第一第二层图像、第二第二层图像、…、第K第二层图像进行编码。因此，对第一层图像编码的结果可被输出到第一层流，而对第一第二层图像、第二第二层图像、…、第K第二层图像编码的结果可分别输出到第一第二层流、第二第二层流、…、第K第二层流。

根据本发明的各种实施例的层间视频编码设备10可通过参考单个层的图像执行预测当前图像的帧间预测。经由帧间预测，可产生指示关于当前图像与参考图像之间的运动的信息的运动矢量以及当前图像和参考图像之间的残差。

此外，层间视频编码设备10可通过参考第一层图像来执行对第二层图像进行预测的层间预测。

此外，如果根据实施例的视频编码设备10允许三层或更多层(诸如第一层、第二层、第三层)，则层间视频编码设备10可根据多层预测结构执行一个第一层图像与第三层图像之间的层间预测以及第二层图像与第三层图像之间的层间预测。

经由层间预测，可产生当前图像和另一层的参考图像之间的位置差以及当前图像和其它层的参考图像之间的残差。

以下将参照图3详细描述层间预测结构。

根据本发明的各种实施例的层间视频编码设备10对视频的每个层的每个图像的块进行编码。块的形状可以是正方形形状、矩形形状或任意几何形状。块不限于具有特定尺寸的数据单元。根据树结构的编码单元之中，块可以是最大编码单元(LCU)、编码单元、预测单元、变换单元等。包括根据树结构的编码单元的LCU可被称为编码树单元、编码块树、块树、根块树、编码树、编码根、树干等。以下将参照图8至图20描述根据树结构的基于编码单元的视频编码和解码方法。

也可基于诸如编码单元、预测单元或变换单元的数据单元执行帧间预测和层间预测。

根据本发明的各种实施例的第一层编码器12可通过针对第一层图像执行包括帧间预测或帧内预测的源编码操作以产生符号数据。符号数据是指各个编码参数的样值和残差的样值。

例如，第一层编码器12可通过对第一层图像的数据单元的样点执行帧间预测或帧内预测、变换和量化来产生符号数据，并且通过针对符号数据执行熵编码来产生第一层流。

第二层编码器14可基于根据树结构的编码单元对第二层图像进行编码。第二层编码器14可通过对第二层图像的数据单元的样点执行帧间或帧内预测、变换和量化来产生符号数据，并且通过针对符号数据执行熵编码来产生第二层流。

根据本发明的各种实施例的第二层编码器14可通过使用第一层图像的重建样点执行对第二层流进行估计的层间预测。为了经由层间预测结构对来自第二层图像序列的第二层原始图像进行编码，第二层编码器14可通过使用第一层重建图像产生第二层预测图像，并且对第二层原始图像与第二层预测图像之间的预测误差进行编码。

第二层编码器14可按块(诸如编码单元或预测单元)针对第二层图像执行层间预测。第一层图像的将由第二层图像的块参考的块可被确定。例如，可确定第一层图像的与第二层图像中的当前块的位置相应地被定位的重建块。第二层编码器14可通过使用与第二层块相应的第一层重建块来确定第二层预测块。

第二层编码器14可将根据层间预测结构通过使用第一层重建块确定的第二层预测块用作对第二层原始块进行层间预测的参考图像。第二层编码器 14可对第二层预测块的样值与第二层原始块的样值之间的误差(即，根据层间预测的残差)进行转换和量化，从而对误差执行熵编码。

如上所述，第二层编码器14可通过经由层间预测结构参考第一层重建图像来对当前层图像序列进行编码。然而，根据本发明的各个实施例的第二层编码器14可在不参考其它层的样点的情况下，能够根据单层预测结构对第二层图像序列进行编码。因此，不应限制性地理解为：第二层编码器14仅执行对第二层图像序列进行编码的层间预测。

如果层间视频编码设备10如上所述对多视点视频进行编码，则第一层编码器12可对第一视点视频进行编码，而第二层编码器14可对第二视点视频进行编码。可经由不同相机捕捉或可经由不同镜头获得各个视点的视频。由于捕捉装置(相机、镜头)的捕捉角度、照度或特性会在视点之间彼此不同，因此，在不同视点的视频获得的亮度可能会彼此不匹配。这种照度不匹配可能与各个视点的视频的样值之间的差有关。

如果各个视点的视频的亮度彼此不一致，则层间预测误差变大，因此，编码效率会下降。因此，考虑到视点之间的亮度不一致，层间视频编码设备 10的第二层编码器14可对各个视点的视频之间的亮度差进行补偿和编码。例如，由第一层编码器12编码的第一视点图像与由第二层编码器14编码的第二视点图像之间的亮度差可被编码。由于第二视点图像相对于第一视点图像的亮度差被编码，所以当第二层编码器14对第二视点视频进行编码时可执行亮度补偿。

为了补偿第一层块与第二层块之间的亮度差，可使用亮度补偿参数。例如，如以下等式1所示，可获得通过使用比例系数a和偏移量b来针对与另一层相应的当前块的像素P执行亮度补偿的结果P'。

[等式1]

P^'＝a×P+b

用于补偿块之间的亮度差的包括比例系数a和偏移量的亮度补偿参数可被包括在比特流中并被发送，或者可通过使用在第二层当前块周围的像素值和在与第二层当前块相应的第一层重建块周围的像素值来推导出所述亮度补偿参数。

顺便提及，为了推导出根据实施例的亮度补偿参数，需要获得在与第二层当前块相应的第一层重建块周围的像素。在此，可使用视差矢量找到与第二层当前块相应的第一层重建块。在此，视差矢量可被包括在比特流中并被发送，或者可从其它编码信息推导出所述视差矢量。

然而，由于视差矢量可呈现出小数单位的精确度(诸如，四分之一像素或二分之一像素)，因此，在第二层当前块的位置由视差矢量指示的位置可以是子像素的位置。然而，为了减小亮度补偿的复杂度，按照整像素对第二层当前块周围的像素与第一层参考块周围的像素进行比较，因此，第一层参考块的位置应被确定为整像素的位置。

因此，根据实施例的层间视频编码设备10可通过使用与相应于针对第二层当前块的位置的参考像素的位置的第一层重建图像的参考位置最接近的整像素来确定第一层参考像素，其中，第一层参考像素用于推导出亮度补偿参数。

例如，层间视频编码设备10可将与相应于第二层当前块的位置的第一层重建图像的参考位置最接近的整像素的位置确定为参考块的位置，并可将参考块周围的块确定为用于推导出亮度补偿参数的第一层参考像素。

在另一示例中，层间视频编码设备10可将与相应于第二层当前块周围的像素的位置的第一层重建图像的参考位置最接近的整像素确定为用于推导出亮度补偿参数的第一层参考像素。

以下，将参照图1B来详细描述用于确定亮度补偿参数的层间视频编码设备10的操作。

在操作11，亮度补偿确定器16可确定是否针对通过使用第一层参考块将被重建的第二层当前块执行亮度补偿。

由于在层间预测结构中预测出层之间的残差，所以用于预测层之间的亮度差的操作会增加运算量。因此，根据实施例的亮度补偿确定器16可考虑到特定数据单元(诸如，当前图像的块或条带)的特性，确定是否执行亮度补偿。

在操作13，参考像素确定器17可通过使用与相应于针对第二层当前块的参考像素的位置的第一层的参考位置最接近的整像素的位置来确定第一层参考像素。在此，以下将参照图5a和图5b详细地描述使用与第一层的参考位置最接近的整像素的位置的应用。

根据实施例，参考像素确定器17可将与相应于第二层当前块的位置的第一层重建图像的参考位置最接近的整像素的位置确定为参考块的位置并且将参考块周围的块确定为用于推导出亮度补偿参数的第一层参考像素。

换句话说，第二层当前块的参考像素可以是指示第二层当前块的位置的像素。例如，指示第二层当前块的位置的像素可以是在第二层当前块的左上角的像素。因此，参考像素确定器17可将与在第二层当前块的左上角的像素的位置相应的第一层的参考位置最接近的整像素确定为在第一层参考块的左上角的像素的位置。然而，指示当前块的位置的像素不限于在左上角的像素，可以是当前块的中心像素或者是在当前块的其它角的像素。

根据另一实施例，参考像素确定器17可将与相应于第二层当前块周围的像素的位置的第一层重建图像的参考位置最接近的整像素确定为用于推导出亮度补偿参数的第一层参考像素。

换句话说，第二层当前块的参考像素可以是第二层当前块周围的像素。因此，参考像素确定器17可将与第一层的参考位置最接近的整像素确定为参考像素。

根据另一实施例，参考像素确定器17可获得与第一层的参考位置最接近的至少一个整像素并通过使用获得的至少一个整像素来确定第一层的参考位置的参考像素值。例如，如果第一层的参考位置是子像素位置，则可通过使用插值滤波器来推导出参考位置的像素值，并且推导出的值可用作第一层的参考位置的参考像素值。

在操作15，亮度补偿模式确定器18可通过使用确定的第一层参考像素和在第二层当前块周围的像素来确定亮度补偿参数。

因此，第二层编码器14可产生包括第二层块与第一层参考块之间的层间预测信息的第二层比特流，其中，第二层块具有基于关于是否执行亮度补偿的信息确定的亮度和确定的亮度补偿参数。

第二层编码器14可对亮度补偿确定器16确定的指示是否针对当前块执行亮度补偿的信息以及用于确定亮度补偿参数的视差矢量编码为比特流，并发送该比特流。此外，如果指示是否执行亮度补偿的信息和用于确定亮度补偿参数的视差矢量可基于现有的编码信息被确定，则第二层编码器14可以不发送指示是否执行亮度补偿的信息和用于确定亮度补偿参数的视差矢量。

当考虑第一层图像来调整第二层图像的亮度时，第二层图像与第一层图像之间的误差进一步减小，因此，层间预测的编码效率会提高。此外，根据对块进行编码的模式，在具体编码模式下可普遍进行亮度补偿。

根据本发明的各种实施例的层间视频编码设备10可包括中央处理器(未示出)，其中，该中央处理器控制第一层编码器12、第二层编码器14、亮度补偿确定器16、参考像素确定器17和亮度补偿模式确定器18。可选地，第一层编码器12、第二层编码器14、亮度补偿确定器16、参考像素确定器17 和亮度补偿模式确定器18可被它们各自的处理器(未示出)操作，其中，层间视频编码设备10可根据这些处理器(未示出)彼此结合进行操作而被操作。可选地，第一层编码器12、第二层编码器14、亮度补偿确定器16、参考像素确定器17和亮度补偿模式确定器18可被层间视频编码设备10外面的外部处理器(未示出)控制。

层间视频编码设备10可包括用于存储输入到第一层编码器12、第二层编码器14、亮度补偿确定器16、参考像素确定器17和亮度补偿模式确定器 18的数据以及从第一层编码器12、第二层编码器14、亮度补偿确定器16、参考像素确定器17和亮度补偿模式确定器18输出的数据的一个或更多个数据存储单元(未示出)。层间视频编码设备10可包括管理数据存储单元(未示出)的数据输入/数据输出的存储器控制器(未示出)。

为了输出对视频编码的结果，层间视频编码设备10可与嵌入的视频编码处理器或外部视频编码处理器结合地操作，从而执行包括变换的视频编码操作。层间视频编码设备10的内部视频编码处理器可以是用于实施视频编码操作的独立处理器。此外，层间视频编码设备10、中央处理器或图形处理器可包括用于实现基本视频编码操作的视频编码处理模块。

图2a是根据本发明的各种实施例的层间视频解码设备20的框图。

根据本发明的各种实施例的层间视频解码设备20可包括第一层解码器 22和第二层解码器24。第二层解码器24可包括亮度补偿确定器26、亮度补偿确定器26和亮度补偿模式确定器28。根据另一实施例，亮度补偿确定器 26、参考像素确定器27和亮度补偿模式确定器28可位于亮度补偿确定器26 的外面。

层间视频解码设备20可根据可伸缩视频编码方法，按层接收比特流。不限制由层间视频解码设备20接收的比特流的层数。然而，为了便于解释，以下将详细描述层间视频解码设备20的第一层解码器22接收第一层流并对第一层流进行解码以及第二层解码器24接收第二层流并对第二层流进行解码的实施例。

例如，基于空间可伸缩性的层间视频解码设备20可接收不同分辨率的图像序列被分别编码为不同层的流。低分辨率图像序列可通过对第一层流解码被重建，而高分辨率图像可通过对第二层流解码被重建。

在另一示例中，可根据可伸缩视频解码方法来对多视点视频进行解码。如果立体视频流作为多个层被接收，则可通过对第一层流解码来重建左视点图像。可通过对第一层流和第二层流进行解码来重建右视点图像。

可选地，如果多视频视频流作为多个层被接收，则可通过对第一层流进行解码来重建中心视点图像。通过对第一层流和第二层流进行解码来重建左视点图像。通过对第一层流和第三层流进行解码来重建右视点图像。

在另一示例中，可执行基于时间伸缩性的可伸缩视频编码方法。可通过对第一层流进行解码来重建基本帧率的图像。可通过对第一层流和第二层流进行解码来重建高帧率的图像。

此外，如果存在三个或更多个第二层，则可从第一层流重建第一层图像，并且可通过参考第一层重建图像对第二层流进行解码来进一步重建第二层图像。可通过参考第二层重建图像对第K层流进行解码来进一步重建第K层图像。

层间视频解码设备20可从第一层流和第二层流获得第一层图像和第二层图像的编码数据，并可进一步获得基于帧间预测产生的运动矢量和基于层间预测产生的预测信息。

例如，层间视频解码设备20可对针对各个层被帧间预测的数据进行解码，并可对在多个层之间被层间预测的数据进行解码。可基于编码单元或预测单元执行基于层间解码的运动补偿或重建。

通过参考通过同一层的帧间预测而预测的重建图像对当前图像执行运动补偿，可从每个层流重建图像。运动补偿是指通过将使用当前图像的运动矢量确定的参考图像与当前图像的残差进行合成来对当前图像的重建图像进行重建的操作。

另外，层间视频解码设备20可通过参考第一层图像来执行层间解码，以便对经由层间预测而被预测的第二层图像进行。层间解码是指通过将被确定用于预测当前图像的另一层的参考图像与当前图像的残差合成来对当前图像的重建图像进行重建的操作。

根据实施例的层间视频解码设备20也可执行用于对参考第二层图像而预测的第三层图像进行重建的层间解码。以下将参照图3给出层间预测结构的详细描述。

然而，根据本发明的各种实施例的第二层解码器24可在不参考第一层图像序列的情况下能够对第二层流进行解码。因此，不应限制性地理解为：第二层解码器24执行对第二层图像序列进行解码的层间预测。

层间视频解码设备20在每一层对视频的每个图像的块进行解码。块可以是根据树结构的编码单元之中的LCU、编码单元、预测单元、变换单元等。

层间视频解码设备20可通过使用解析出的第一层图像的编码符号来对第一层图像进行解码。如果层间视频解码设备20接收基于根据树结构的编码单元而编码的流，则第一层解码器22可针对第一层流的每个LCU，基于根据树结构的编码单元来执行解码。

第一层解码器22可针对每个LUC执行熵解码，并获得编码信息和编码的数据。第一层解码器22可通过针对从流获得的编码的数据执行反量化和逆变换以重建残差。根据另一实施例的第一层解码器22可直接接收量化后的变换系数的比特流。通过针对量化后的变换系数执行反量化和逆变换来重建图像的残差。

第一层解码器22可经由同一层图像之间的运动补偿来确定预测的图像，并将预测的图像与残差合成来重建第一层图像。

第二层解码器24可根据层间预测结构通过使用第一层重建图像的样点来产生第二层图像。第二层解码器24可基于层间预测通过对第二层流进行解码来获得预测误差。第二层解码器24可通过将第二层预测图像和预测误差合成来产生第二层重建图像。

第二层解码器24可通过使用由第一层解码器22解码的第一层重建图像来确定第二层预测图像。第二层解码器24可根据层间预测结构确定第一层图像之中的由第二层图像中的诸如编码单元或预测单元的块将参考的块。例如，可确定第一层图像之中的与第二层图像中的当前块的位置相应地被定位的重建块。第二层解码器24可通过使用与第二层块相应的第一层重建块来确定第二层预测块。

第二层解码器24可将根据层间预测结构将通过使用第一层重建块确定的第二层预测块用作用于第二层原始块的层间预测的参考图像。在这种情况下，第二层解码器24可通过将使用第一层重建图像确定的第二层预测块的样值与根据层间预测的残差合成来重建第二层块。

根据空间可伸缩视频编码，如果第一层解码器22对分辨率与第二层图像的分辨率不同的第一层图像进行重建，则第二层解码器24可对第一层重建图像进行插值以将第一层重建图像的尺寸调整为具有与第二层原始图像的分辨率相同的分辨率。插值后的第一层重建图像可被确定为用于层间预测的第二层预测图像。

因此，层间视频解码设备20的第一层解码器22可通过对第一层流进行解码来重建第一层图像序列，而第二层解码器24可通过对第二层流进行解码来重建第二层图像序列。

另外，考虑到视点之间的亮度不一致，层间视频解码设备20的第二层解码器24可对各个视点的视频之间的亮度差进行补偿并重建各个视点的视频。例如，可从比特流获得由第一层解码器22解码的第一视点图像与由第二层解码器24解码的第二视点图像之间的亮度差。由于第二视点图像相对于第一视点图像的亮度差被获得，所以当第二层解码器24对第二视点视频进行编码时可确定是否执行亮度补偿操作。

根据实施例的层间视频解码设备20可使用用于补偿第一层块与第二层块之间的亮度差的亮度补偿参数。因此，根据实施例的层间视频解码设备20 可通过使用与相应于第二层当前块的参考像素的位置的第一层重建图像的参考位置最接近的整像素，来确定用于推导出亮度补偿参数的第一层参考像素。

以下，将参照图2b给出考虑到亮度补偿的层间视频解码设备20的操作的详细描述。

在操作21，亮度补偿确定器26可确定是否针对通过使用第一层参考块将被重建的第二层当前块执行亮度补偿。

在此，可通过使用从接收的比特流或其它编码信息获得的语法来确定是否针对第二层当前块执行亮度补偿。

在操作23，参考像素确定器27可基于是否执行亮度补偿，通过使用与相应于第二层当前块的参考像素的位置的第一层的参考位置最接近的整像素的位置来确定第一层参考像素。在此，以下将参照图5a和图5b详细地描述使用与第一层的参考位置最接近的整像素的位置的应用。

此外，可使用视差矢量来找到与第二层当前块相应的第一层的参考位置。在此，可从接收的比特流获得的视差矢量或可从其它编码信息推导出视差矢量。

根据实施例，参考像素确定器27可将与相应于第二层当前块的位置的第一层重建图像的参考位置最接近的整像素的位置确定为参考块的位置并且将参考块周围的块确定为用于推导出亮度补偿参数的第一层参考像素。

换句话说，第二层当前块的参考像素可以是指示第二层当前块的位置的像素。例如，指示第二层当前块的位置的像素可以是在第二层当前块的左上角的像素。因此，参考像素确定器27可将相应于在第二层当前块的左上角的像素的位置相应的第一层的参考位置最接近的整像素确定为在第一层参考块的左上角的像素的位置。然而，指示当前块的位置的像素不限于在左上角的像素，可以是当前块的中心像素或者是在当前块的其它角的像素。

根据另一实施例，参考像素确定器27可将与相应于第二层当前块周围的像素的位置的第一层重建图像的参考位置最接近的整像素确定为用于推导出亮度补偿参数的第一层参考像素。

换句话说，第二层当前块的参考像素可以是第二层当前块周围的像素。因此，参考像素确定器27可将与第一层的参考位置最接近的整像素确定为参考像素。

根据另一实施例，参考像素确定器27可获得与第一层的参考位置接近的至少一个整像素并通过使用获得的至少一个整像素来确定第一层的参考位置的参考像素值。例如，如果第一层的参考位置是子像素位置，则可通过使用插值滤波器来推导出参考位置的像素值，并且推导出的值可用作第一层的参考位置的参考像素值。

在操作25，亮度补偿模式确定器28可通过使用确定的第一层参考像素和在第二层当前块周围的像素来确定亮度补偿参数。

如上所述，第二层解码器24可接收指示是否执行亮度补偿的信息并确定是否执行亮度补偿。当亮度补偿被执行时，第二层解码器24可确定亮度补偿参数。因此，第二层解码器24可使用基于指示是否执行亮度补偿的信息和确定的亮度补偿参数而补偿的亮度来重建第二层块。

根据本发明的各种实施例的层间视频解码设备20可包括中央处理器(未示出)，其中，该中央处理器控制第一层解码器22、第二层解码器24、亮度补偿确定器26、参考像素确定器27和亮度补偿模式确定器28。可选地，第一层解码器22、第二层解码器24、亮度补偿确定器26、参考像素确定器27 和亮度补偿模式确定器28可被它们各自的处理器(未示出)操作，其中，层间视频解码设备20可根据这些处理器(未示出)彼此结合进行操作而被操作。可选地，第一层解码器22、第二层解码器24、亮度补偿确定器26、参考像素确定器27和亮度补偿模式确定器28可被层间视频解码设备20外面的外部处理器(未示出)控制。

层间视频解码设备20可包括用于存储输入到第一层解码器22、第二层解码器24、亮度补偿确定器26、参考像素确定器27和亮度补偿模式确定器 28的数据以及从第一层解码器22、第二层解码器24、亮度补偿确定器26、参考像素确定器27和亮度补偿模式确定器28输出的数据的一个或更多个数据存储单元(未示出)。层间视频解码设备20可包括管理数据存储单元(未示出)的数据输入/数据输出的存储器控制器(未示出)。

为了对视频解码，层间视频解码设备20可与嵌入的视频解码处理器或外部视频解码处理器结合地操作，从而执行包括逆变换的视频解码操作。层间视频解码设备20的嵌入的视频解码处理器可以是用于实施视频解码操作的独立处理器。此外，层间视频解码设备20、中央处理器或图形处理器可包括用于实现基本视频编码操作的视频解码处理模块。

参照图2a和图2b，在层间视频解码设备20对第二层图像进行解码的同时层间视频解码设备20针对特定类型块或条带，对不同层的图像之间的亮度差或视点之间的亮度差进行补偿，第一层重建图像的亮度和第二层重建图像的亮度会变得一致。参照图1a和图1b，层间视频解码设备10针对特定类型块或条带，执行不同层的图像之间的亮度补偿，因此，在预测图像与原始图像之间的残差会减小。因此，会提高编码效率。

此外，当用于推导出亮度补偿参数的参考位置在子像素位置时，可选择与该子像素位置最接近的整像素，从而提高编码效率。

图3是根据实施例的层间预测结构的示图。

根据实施例的层间视频编码设备10可根据图3示出的多视点视频预测结构的再现顺序30来对基本视点图像、左视点图像和右视点图像进行预测编码。

根据现有技术的多视点视频预测结构的再现顺序30，相同视点的图像可被布置在水平方向上。因此，标记为“左”的左视点图像可沿水平方向被线性布置，标记为“右”的右视点图像可沿水平方向被线性布置。基本视点图像可以是相对于左视点图像/右视点图像的中心视点图像。

此外，具有相同POC顺序的图像可沿垂直方向被布置。图像的POC顺序指示再现构成视频的图像的顺序。在多视点视频预测结构30中标记的“POC X”是指关于位于相应列中的图像的相对再现顺序，其中，再现顺序的优先级随数字X的减小而提高，再现序列的优先级随数字X的增大而降低。

因此，根据现有技术的多视点视频预测结构的再现顺序30，标记为“左”的左视点图像可根据POC顺序(再现顺序)沿水平方向被布置，被标记为“中心”的基本视点图像可根据POC顺序(再现顺序)沿水平方向被布置，标记为“右”的右视点图像可根据POC顺序(再现顺序)沿水平方向被布置。此外，布置在与基本视点图像的列相同的列中的左视点图像和右视点图像是与不同视点相应的图像，但是相同的POC的图像。

四个连续图像在每个视点构成单个画面组(GOP)。每个GOP包括连续关键画面(keypicture)与单个关键画面之间的图像。

关键画面是随机访问点。在视频再现期间，当从根据再现顺序(即，根据POC熟悉怒)布置的图像中选择随机再现位置时，具有与再现位置最接近的POC顺序的关键画面被再现。基本视点图像包括基本视点关键画面31、32、 33、34和35，左视点图像包括左视点关键画面131、132、133、134和135，右视点图像包括右视点关键画面231、232、233、234和235。

可根据GOP顺序再现并预测(重建)多视点图像。首先，根据多视点视频预测结构的再现顺序30，针对每个视点，包括在GOP 0中的图像可先被再现，随后包括在GOP 1中的图像可被再现。换句话说，可按照GOP 0、GOP 1、 GOP 2和GOP 3的顺序来再现包括在各个GOP中的图像。此外，根据多视点视频预测结构的编码顺序，针对每个视点，包括在GOP 0中的图像先被预测 (重建)，并随后包括在GOP 1中的图像可被预测(重建)。换句话说，可按照GOP 0、GOP 1、GOP 2和GOP 3的顺序来预测(重建)包括在各个GOP 中的图像。

根据多视点视频预测结构的再现顺序30，可针对图像执行视点间预测 (层间预测)和帧内预测两者。在多视点视频预测结构中，箭头开始的图像是参考图像，而箭头结束的图像是通过使用参考图像而预测的图像。

预测基本视点图像的结果可被编码，并以基本视点图像流的形式被输出，而预测附加视点图像的结果可被编码，并以层比特流的形式被输出。另外，对左视点图像进行预测编码的结果可被输出为第一层比特流，而对右视点图像进行预测编码的结果可被输出为第二层比特流。

针对基本视点图像仅执行帧间预测。换句话说，I画面类型关键画面31、 32、33、34和35在不参考其它图像的情况下被预测，而作为B画面类型图像和b画面类型图像的其它图像通过参考其它基本视点图像被预测。B画面类型图像通过参考具有较高优先级的POC顺序的I画面类型关键画面和随后的I画面类型关键画面而被预测。b画面类型图像通过参考具有较高优先级的 POC顺序的I画面类型关键画面和随后的B画面类型图像或者通过参考具有较高优先级的POC顺序的B画面类型关键画面和随后的I画面类型图像而被预测。

针对左视点图像和右视点图像执行参考不同视点图像的视点间预测(层间预测)和参考相同视点图像的帧间预测。

可通过参考具有相同POC顺序的基本视点关键画面31、32、33、34和 35分别针对左视点关键画面131、132、133、134和135执行视点间预测(层间预测)。可通过参考具有相同POC顺序的基本视点关键画面31、32、33、 34和35或具有相同POC顺序的左视点关键画面131、132、133、134和135 分别针对右视点关键画面231、232、233、234和235执行视点间预测。此外，可针对对左视点图像和右视点图像之中的除了关键画面131、132、133、134、 135、231、232、233、234和235之外的图像执行参考具有相同POC顺序的其它视点图像的视点间预测(层间预测)。

左视点图像和右视点图像之中的除了关键画面131、132、133、134、135、 231、232、233、234和235之外的图像可通过参考相同视点图像被预测。

然而，左视点图像和右视点图像中的每一个可不参考相同视点的附加视点图像之中的在前再现顺序的关键画面而被预测。换句话说，为了对当前左视点图像进行帧间预测，可参考除了再现顺序在当前左视点图像的再现顺序之前的左视点关键画面之外的左视点图像。同样，为了对当前右视点图像进行帧间预测，可参考除了再现顺序在当前右视点图像的再现顺序之前的右视点关键画面之外的右视点图像。

此外，为了对当前左视点图像进行帧间预测，可不参考属于在包括当前左视点图像的当前GOP之前的GOP的左视点图像，并且可以通过参考属于当前GOP的左视点图像并将在当前左视点图像之前被重建的左视点图像，来执行预测。这同样应用在右视点图像。

根据实施例的层间视频解码设备20可根据图3中示出的多视点视频预测结构的再现顺序30来对基本视点图像、左视点图像和右视点图像进行重建。

经由参考基本视点图像的视点间视差补偿和参考左视点图像的视点间运动补偿来重建左视点图像。经由参考基本视点图像视点间视差补偿和参考右视点图像的图像间运动补偿来重建右视点图像。为了进行左视点图像和右视点图像的视差补偿和运动补偿，需要先重建参考图像。

为了对左视点图像进行运动补偿，可经由参考重建的左视点参考图像的图像间运动补偿来重建左视点图像。为了对右视点图像进行运动补偿，可经由参考重建的右视点参考图像的图像间运动补偿来重建右视点图像。

此外，为了对当前左视点图像进行运动补偿，可不参考属于在包括当前左视点图像的当前GOP之前的GOP的左视点图像，并且可参考属于当前GOP 并且将在当前左视点图像之前重建的左视点图像，来执行运动补偿。这同样应用在右视点图像。

如上所述，当用于推导出亮度补偿参数的参考位置在子像素位置时，层间视频编码设备10和层间视频解码设备20可选择与该子像素位置最接近的整像素，从而提高编码效率。

此外，如上所述，层间视频编码设备10和层间视频解码设备20可根据图像特性确定是否执行亮度补偿。例如，可确定是否针对根据关于块的经由率失真优化确定的编码模式、预测方向和编码类型的块执行亮度补偿。

以下，参照图4至图7，将提出根据本发明的各种实施例的确定亮度补偿参数的方法。

将参照图4来描述通过使用当前块周围的像素与参考块周围的像素推导出亮度补偿参数的实施例，将参照图5a至图6b来描述确定用于推导出亮度补偿参数的参考像素的实施例。

图4是示出根据实施例的确定亮度补偿参数的方法的示图。

根据实施例的层间视频解码设备20可获得针对每个编码单元的关于是否执行亮度补偿的标记信息，并确定关于各个色彩元素Y、U和V在针对每个编码单元的每个预测单元的每个预测方向上的亮度补偿参数。在此，亮度补偿参数可基于当前块周围的像素和在与当前块相应的另一层上的块周围的像素而被确定。换句话说，亮度补偿参数可通过将第一层的参考块周围的像素与第二层的当前块周围的像素进行比较而被确定。在此，当前块周围的像素是指在当前块的重建之前被重建并可使用的当前块周围的像素。因此，如果当前块的周围的像素不可以使用时，则不能推导出亮度补偿参数。

参照图4，可通过使用第二层当前块40周围的像素42和在与第二层当前块40相应的第一层参考块45周围的参考像素47来推导出亮度补偿参数。例如，在周围像素42与参考像素47之间的平均亮度差可被确定为偏移量，因此，可根据确定的偏移量对第二层当前块40执行亮度补偿。在另一示例中，可经由关于周围像素42与参考像素47的线性回归分析来推导出比例系数和偏移量，然后基于获得的值来执行亮度补偿。

顺便提及，为了确定亮度补偿参数，需要找到与第二层当前块40相应的另一层参考块45，这可利用视差矢量。在此，视差矢量是指指示第二层当前块与第一层参考块之间的位置差的矢量。

然而，由于视差矢量可呈现出小数单位的精确度(诸如，四分之一像素或二分之一像素)，因此，由视差矢量在第二层当前块40的参考像素41的位置所指示的位置可以是子像素的位置。然而，为了减小亮度补偿的复杂度，按照整像素对第二层当前块周围的像素与在第一层参考块周围的像素进行比较，因此，参考块45的位置应被确定为整像素的位置。

因此，根据实施例的层间视频编码设备10和层间视频解码设备20可将与由视差矢量在当前块40的参考像素41指示的另一层图像的参考位置最接近的整像素确定为第一层参考块45的参考像素46。

例如，图5a和图5b示出根据本发明的实施例的确定由视差矢量指示的接近的整像素的示例。

在图5a和图5b中，A、B、C和D表示整像素的位置，小写字母a至o 分别表示子像素位置。

参照图5a，根据实施例，如果视差矢量指示在左上区域50中的子像素位置a、d和e，则可确定子像素位置a、d和e与整像素位置A相应。同样地，在右上区域51中的子像素位置b、c、f和g可被确定为整像素位置B，在左下区域52中的子像素位置l、m和n可被确定为整像素位置C，在右下区域53中的子像素位置j、k、n和o可被确定为整像素位置D。当然，如果视差矢量指示整像素位置，则相应整像素位置可被确定为与该视差矢量相应的位置。

在另一示例中，参照图5b，如果视差矢量指示在左上区域54中的子像素位置a、b、d、e、f、h、i和j，则可确定子像素位置a、b、d、e、f、h、i 和j与整像素位置A相应。同样地，在右上区域55中的子像素位置c、g和k 可被确定为整像素位置B，在左下区域56中的子像素位置l、m和n可被确定为整像素位置C，在右下区域57中的子像素位置o可被确定为整像素位置D。换句话说，与视差矢量指示特定子像素时所匹配的整像素位置不限于图 5a和图5b中所示出的那些，可对其进行各种修改。

顺便提及，如以上参照图5a所示，可将由视差矢量在针对当前块的参考像素41的位置所指示的位置匹配到整像素位置的方法表示为以下示出的伪码。在以下示出的伪码中，mvLX[0]和mvLX[1]表示视差矢量的x分量和y 分量，xC和yC表示当前块的位置坐标，其中，cIdx可表示Y分量或深度图 (当cIdx的值为0时)，可表示U分量(当cIdx的值为1时)，或者可表示V 分量(当cIdx的值为2时)。此外，由于亮度块的尺寸与色度块的尺寸不同，所以在亮度块中的整像素之间的距离与在色度块中的整像素之间的距离不同。因此，通过使用条件语句“cIdx？4:2”，视差矢量指示子像素时将该子像素匹配到整像素的方法会基于块是亮度块还是色度块而不同。

xRLX＝xC+((mvLX[0]+(cIdx？4:2))>>(2+(cIdx？1:0)))

yRLX＝yC+((mvLX[1]+(cIdx？4:2))>>(2+(cIdx？1:0)))

因此，可经由在伪码中示出的具体移位运算来获得与当前块的位置(xC， yC)相应的参考块的位置(xRLX，yRLX)。在此，当前块的位置(xC，yC) 和参考块的位置(xRLX，yRLX)可以是在每个块的左上角的像素的坐标。然而，本发明不限于此，当前块的位置(xC，yC)和参考块的位置(xRLX， yRLX)可以是在每个块的中心的像素的坐标。

顺便提及，可按照以下所示对上面的伪码进行修改。

xRLX＝xC+((mvLX[0]+2+(cIdx？2:0))>>(2+(cIdx？1:0)))

yRLX＝yC+((mvLX[1]+2+(cIdx？2:0))>>(2+(cIdx？1:0)))

以下，将参照图6a和图6b来描述在根据以上陈述的方法确定与视差矢量相应的整像素的情况下的获得与当前块40周围的像素42相应的其它层当前块40的参考像素47的方法。此外，参照图7，以下将描述通过使用与由视差矢量指示的参考位置接近的整像素来获得与当前块40周围的像素42相应的其它层参考块45的参考像素47。

参照图6a，根据实施例的层间视频解码设备20可将与相应于第二层当前块的位置的第一层重建图像的参考位置最接近的整像素的位置确定为参考块的位置，并且将参考块周围的块确定为用于推导出亮度补偿参数的第一层参考像素。

在操作61，参考像素确定器27可获得视差矢量，其中，该视差矢量指示与将执行亮度补偿的第二层当前块的位置相应的第一层的参考位置。

在操作62，参考像素确定器27可确定与由获得的视差矢量指示的第一层的参考位置最接近的整像素的位置。

在操作63，参考像素确定器27可确定与确定的整像素的位置相应的第一层参考块。

在操作64，参考像素确定器27可将确定的第一层参考块周围的像素确定为第一层参考像素。

因此，在操作65，亮度补偿模式确定器28可通过使用确定的第一层参考像素和在第二层当前块周围的像素来确定亮度补偿参数。

参照图6b，根据另一实施例的层间视频解码设备20可将与相应于第二层当前块周围的像素的位置的第一层重建图像的参考位置最接近的整像素确定为参考块的位置确定为用于推导出亮度补偿参数的第一层参考像素的位置。

在操作66，参考像素确定器27可获得视差矢量，其中，该视差矢量指示与将执行亮度补偿的第二层当前块周围的像素的位置相应的第一层的参考位置。

在操作67，参考像素确定器27可确定与由获得的视差矢量指示的第一层的参考位置最接近的整像素的位置。

在操作68，参考像素确定器27可将确定的整像素的位置确定为参考像素的位置。

因此，在操作69，亮度补偿模式确定器28可通过使用确定的第一层参考像素和在第二层当前块周围的像素来推导出亮度补偿参数。

参照图7，根据另一实施例的层间视频解码设备20可获得与第一层的参考位置接近的至少一个整像素，并可通过使用获得的至少一个整像素来确定第一层的参考位置的参考像素值。例如，如果第一层的参考位置是子像素位置，则层间视频解码设备20可通过使用与子像素接近的整像素来对参考像素值进行插值。

在操作71，参考像素确定器27可获得视差矢量，其中，该视差矢量指示与将执行亮度补偿的第二层当前块周围的像素的位置相应的第一层的参考位置。

在操作72，参考像素确定器27可获得与由视差矢量指示的第一层的参考位置接近的整像素。

在操作73，参考像素确定器27可通过使用获得的至少一个整像素来确定与第一层的参考位置相应的参考像素值。例如，如果第一层的参考位置是子像素位置，则参考像素确定器27可通过使用插值滤波器来推导出参考位置的像素值，并将推导出的值用作第一层的参考位置的参考像素值。

因此，在操作74，亮度补偿模式确定器28可通过使用确定的第一层参考像素和在第二层当前块周围的像素来推导出亮度补偿参数。

顺便提及，虽然以上参照图6a至图7描述了在层间视频解码设备20执行的操作，但是本领域普通技术人员将理解，以上陈述的操作也可被应用到层间视频编码设备10。

如以上参照图1a至图7所示，已经提出了确定是否针对基于图像特性的块执行亮度补偿的层间视频编码设备10和层间视频解码设备20。如果针对所有块执行亮度补偿，则会增加计算负荷。因此，可仅针对满足特定条件的块确定是否执行亮度补偿。针对不满足特定条件的块，对于是否执行亮度补偿不进行确定，并且不对这些块进行亮度补偿。

因此，可确定是否针对在预设编码模式下进行编码的块执行亮度补偿。此外，指示是否针对在相应编码模式下进行编码的块执行亮度补偿的亮度补偿信息可被包括在发送的流中，或者可从接收的流获得该信息。

因此，根据本发明的各种实施例的层间视频编码设备10和层间视频解码设备20，由于仅针对需要亮度补偿的块而非其它块确定是否执行亮度补偿，并且不对其它块执行亮度补偿，所以会减小基于亮度补偿的计算负荷的增加，并且基于亮度补偿会提高编码效率。

此外，根据本发明的各种实施例的层间视频编码设备10和层间视频解码设备20，当用于推导出亮度补偿参数的另一层的参考位置在子像素位置时，可使用与其最接近的整像素，从而提高编码效率。

如上所述，在根据实施例的层间视频编码设备10和层间视频解码设备 20中，从视频数据划分的块可被划分为根据树结构的编码单元，编码单元、预测单元和变换单元可被用于关于编码单元的层间预测或帧间预测。以下，参照图8至图20，将公开基于根据树结构的编码单元的和变换单元的视频编码方法和视频编码设备以及视频解码方法和视频解码设备。

在技术上，在对多层视频进行编码/解码操作期间，彼此单独地执行对第一层图像的编码/解码操作和对第二层图像的编码/解码操作。换句话说，如果在多层视频期间发生层间预测，则对单层视频进行编码/解码的结果彼此参考，但是需要对每个单层视频进行单独的编码/解码操作。

因此，为了便于解释，由于以下参照图8至图20描述的基于根据树结构的编码单元的视频编码操作和视频解码操作是关于单层视频的视频编码操作和视频解码操作，因此以下将给出帧间预测和运动补偿的详细描述。然而，如以上参照图1a至图7b所述，在基本视点图像与第二层图像之间执行层间预测和补偿以对视频流进行编码/解码。

因此，对于使根据实施例的层间视频编码设备10的编码单元12基于根据树结构的编码单元对多层视频进行编码，为了针对每个单层视频执行视频编码，编码单元12可包括与多层视频的层数相同数量的图8的视频编码设备 100，并且控制视频编码设备100分别对分配的单层视频进行编码。另外，层间视频编码设备10可通过使用各个视频编码设备100对单独的视点进行编码的结果来执行视点间预测。因此，层间视频编码设备10的第一层编码器12 可产生包括对各个层进行编码的结果的基本视点视频流和第二层视频流。

类似地，为了使根据实施例的层间视频解码设备10的解码单元26基于根据树结构的编码单元对多层视频进行解码，为了按层对接收的第一层视频流和接收的第二层视频流进行解码，解码单元26可包括与多层视频的层数相同数量的图9的视频解码设备200，并且控制视频解码设备200分别对分配的单层视频进行解码。另外，层间视频解码设备20可通过使用视频解码设备 200的对单独的层的进行解码的结果来执行层间补偿。因此，层间视频解码设备20的解码单元26可产生按层重建的第一层图像和第二层图像。

图8是根据一个或更多个实施例的基于根据树结构的编码单元的视频编码设备100的框图。

涉及基于根据树结构的编码单元执行视频预测的视频编码设备100包括编码单元确定器120和输出器130。

编码单元确定器120可基于图像的当前画面的LCU，来对当前画面进行划分，其中，LCU是具有最大尺寸的编码单元。如果当前画面大于LCU，则可将当前画面的图像数据划分为至少一个LCU。根据一个或更多个实施例的 LCU可以是尺寸为32×32、64×64、128×128、256×256等的数据单元，其中，数据单元的形状是宽度和长度为2的若干次方的正方形。

根据一个或更多个实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元从LCU空间被划分的次数，并且随着深度加深，根据深度的较深层编码单元可从LCU被划分到最小编码单元(SCU)。LCU的深度为最高深度，SCU的深度为最低深度。由于随着LCU的深度加深，与每个深度相应的编码单元的尺寸减小，因此与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。

如上所述，当前画面的图像数据根据编码单元的最大尺寸被划分为 LCU，并且每个LCU可包括根据深度被划分的较深层编码单元。由于根据深度对根据一个或更多个实施例的LCU进行划分，因此可根据深度对包括在 LCU中的空间域的图像数据进行分层地分类。

可预先确定编码单元的最大深度和最大尺寸，所述最大深度和最大尺寸限制对LCU的高度和宽度进行分层划分的次数。

编码单元确定器120对通过根据深度对LCU的区域进行划分而获得的至少一个划分区域进行编码，并且根据所述至少一个划分区域来确定用于输出最终编码的图像数据的深度。换句话说，编码单元确定器120通过根据当前画面的LCU以根据深度的较深层编码单元对图像数据进行编码，选择具有最小编码误差的深度，来确定最终深度。确定的深度和根据确定的最终深度的被编码的图像数据被输出到输出器130。

基于与等于或低于最大深度的至少一个深度相应的较深层编码单元，对 LCU中的图像数据进行编码，并且基于每个较深层编码单元比较对图像数据进行编码的结果。在对与较深层编码单元的编码误差进行比较之后，可选择具有最小编码误差的深度。可针对每个LCU选择至少一个最终深度。

随着编码单元根据深度而被分层地划分并且编码单元的数量增加，LCU 的尺寸被划分。另外，即使在一个LCU中编码单元与同一深度相应，也通过分别测量每个编码单元的图像数据的编码误差来确定是否将与同一深度相应的每个编码单元划分为更低深度。因此，即使在图像数据被包括在一个LCU 中时，在一个LCU中编码误差根据区域而不同，因此在图像数据中最终深度可根据区域而不同。因此，可在一个LCU中确定一个或更多个最终深度，并且可根据至少一个最终深度的编码单元来对LCU的图像数据进行划分。

因此，编码单元确定器120可确定包括在LCU中的具有树结构的编码单元。根据一个或更多个的“具有树结构的编码单元”包括在LCU中包括的所有较深层编码单元中的与确定为最终深度的深度相应的编码单元。可根据 LCU的相同区域中的深度来分层地确定最终深度的编码单元，并可在不同区域中独立地确定最终深度的编码单元。类似地，可独立于另一区域的深度而确定当前区域中的最终深度。

根据一个或更多个的最大深度是与从LCU到SCU执行划分的次数有关的索引。根据一个或更多个的第一最大深度可表示从LCU到SCU的总划分次数。根据一个或更多个实施例的第二最大深度可表示从LCU到SCU的深度等级的总数。例如，当LCU的深度是0时，对LCU划分一次的编码单元的深度可被设置为1，对LCU划分两次的编码单元的深度可被设置为2。这里，如果SCU是对LCU划分四次的编码单元，则存在深度0、1、2、3和4 的5个深度等级，并因此第一最大深度可被设置为4，第二最大深度可被设置为5。

可根据LCU执行预测编码和变换。还根据LCU，基于根据等于或小于最大深度的深度的较深层编码单元来执行预测编码和变换。

由于每当根据深度对LCU进行划分时，较深层编码单元的数量增加，因此对随着深度加深而产生的所有较深层编码单元执行包括预测编码和变换的编码。为了便于描述，在LCU中，现在将基于当前深度的编码单元来描述预测编码和变换。

视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码，执行诸如预测编码、变换和熵编码的操作，此时，可针对所有操作使用相同的数据单元，或者可针对每个操作使用不同的数据单元。

例如，视频编码设备100不仅可选择用于对图像数据进行编码的编码单元，还可选择不同于编码单元的数据单元，以便对编码单元中的图像数据执行预测编码。

为了对LCU执行预测编码，可基于与深度相应的编码单元(即，基于不再被划分成与更低深度相应的编码单元的编码单元)来执行预测编码。以下，不再被划分且成为用于预测编码的基本单元的编码单元现在将被称为“预测单元”。通过划分预测单元获得的分区可包括预测单元以及通过对预测单元的高度和宽度中的至少一个进行划分而获得的数据单元。分区是通过对编码单元的预测单元进行划分而获得的数据单元，预测单元可以是具有与编码单元相同的尺寸的分区。

例如，当2N×2N(其中，N是正整数)的编码单元不再被划分，并且成为2N×2N的预测单元时，分区的尺寸可以是2N×2N、2N×N、N×2N 或N×N。分区类型的示例包括通过对预测单元的高度或宽度进行对称地划分而获得的对称分区、通过对预测单元的高度或宽度进行非对称地划分(诸如， 1：n或n:1)而获得的分区、通过对预测单元进行几何地划分而获得的分区、以及具有任意形状的分区。

预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个。例如，可对2N×2N、2N×N、N×2N或N×N的分区执行帧内模式或帧间模式。另外，可仅对2N×2N的分区执行跳过模式。可对编码单元中的一个预测单元独立地执行编码，从而选择具有最小编码误差的预测模式。

视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与编码单元不同的变换单元，来对编码单元中的图像数据执行变换。为了对编码单元执行变换，可基于具有小于或等于编码单元的尺寸的数据单元，来执行变换。例如，用于变换的数据单元可包括帧内模式的数据单元和帧间模式的数据单元。

按照与根据树结构的编码单元类似的方式，编码单元中的变换单元可被递归地划分为更小尺寸的区域。因此，可基于根据变换深度的具有树结构的变换单元，对编码单元中的残差进行划分。

还可在变换单元中设置变换深度，其中，变换深度指示对编码单元的高度和宽度进行划分以达到变换单元所执行的划分的次数。例如，在2N×2N 的当前编码单元中，当变换单元的尺寸是2N×2N时，变换深度可为0。当变换单元的尺寸是N×N时，变换深度可为1，当变换单元的尺寸是N/2×N/2 时，变换深度可为2。换句话说，可根据变换深度设置具有树结构的变换单元。

与深度相应的划分信息不仅需要关于深度的信息，还需要关于与预测编码和变换相关的信息的信息。因此，编码单元确定器120不仅确定具有最小编码误差的深度，还确定预测单元中的分区模式、根据预测单元的预测模式和用于变换的变换单元的尺寸。

稍后将参照图9至图19详细描述根据一个或更多个实施例的LCU中的根据树结构的编码单元以及确定预测单元/分区和变换单元的方法。

编码单元确定器120可通过使用基于拉格朗日乘数的率失真优化，来测量根据深度的较深层编码单元的编码误差。

输出器130在比特流中输出LCU的图像数据和关于根据深度的划分信息，其中，所述LCU的图像数据基于由编码单元确定器120确定的至少一个深度被编码。

可通过对图像的残差进行编码来获得编码的图像数据。

根据深度的划分信息可包括关于深度的信息、关于在预测单元中的分区模式的信息、关于预测模式的信息和关于变换单元的划分的信息。

可通过使用根据深度的划分信息来定义关于最终深度的信息，其中，根据深度的划分信息指示是否对更低深度而不是当前深度的编码单元执行编码。如果当前编码单元的当前深度是深度，则对当前编码单元中的图像数据进行编码并输出，因此可定义划分信息以不将当前编码单元划分到更低深度。可选地，如果当前编码单元的当前深度不是深度，则对更低深度的编码单元执行编码，并因此可定义划分信息以对当前编码单元进行划分来获得更低深度的编码单元。

如果当前深度不是深度，则对被划分到更低深度的编码单元的编码单元执行编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中，因此对更低深度的每个编码单元重复执行编码，并因此可对具有相同深度的编码单元递归地执行编码。

由于针对一个LCU确定具有树结构的编码单元，并且针对深度的编码单元确定至少一个划分信息，所以可针对一个LCU确定至少一个划分信息。另外，由于根据深度对图像数据进行分层划分，因此LCU的图像数据的深度可根据位置而不同，因此可针对图像数据设置划分信息。

因此，输出器130可将相应的划分信息分配给包括在LCU中的编码单元、预测单元和最小单元中的至少一个。

根据一个或更多个的最小单元是通过将构成最低深度的SCU划分为4份而获得的方形数据单元。可选择地，根据实施例的最小单元可以是包括在LCU 中所包括的所有编码单元、预测单元、分区单元和变换单元中的最大方形数据单元。

例如，通过输出器130输出的编码信息可被分类为根据较深层编码单元的编码信息和根据预测单元的编码信息。根据较深层编码单元的编码信息可包括关于预测模式的信息和关于分区尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息、以及关于帧内模式的插值方法的信息。

根据画面、条带或GOP定义的关于编码单元的最大尺寸的信息和关于最大深度的信息可被插入到比特流的头、序列参数集或画面参数集。

还可通过比特流的头、序列参数集或画面参数集输出关于针对当前视频允许的变换单元的最大尺寸的信息和关于变换单元的最小尺寸的信息。输出器130可对有关的参考信息、预测信息和条带类型信息进行编码，并输出这些信息。

在视频编码设备100中，较深层编码单元可以是通过将更高深度的编码单元(更高一层)的高度或宽度划分成两份而获得的编码单元。换句话说，当当前深度的编码单元的尺寸是2N×2N时，更低深度的编码单元的尺寸是 N×N。另外，尺寸为2N×2N的当前深度的编码单元可包括最多4个更低深度的编码单元。

因此，视频编码设备100可基于考虑当前画面的特征而确定的LCU的尺寸和最大深度，通过针对每个LCU确定具有最优形状和最优尺寸的编码单元来形成具有树结构的编码单元。另外，由于可通过使用各种预测模式和变换中的任意一个对每个LCU执行编码，因此可考虑各种图像尺寸的编码单元的特征来确定最优编码模式。

因此，如果以传统宏块对具有高分辨率或大数据量的图像进行编码，则每个画面的宏块的数量极度增加。因此，针对每个宏块产生的压缩信息的条数增加，因此难以发送压缩的信息，并且数据压缩效率降低。然而，通过使用视频编码设备100，由于考虑图像的尺寸，在增加编码单元的最大尺寸的同时，基于图像的特征来调整编码单元，因此可增加图像压缩效率。

为了对多层视频的每个层的单层图像进行编码，以上参照图1a描述的层间视频编码设备10可包括与层数具有相同数量的视频编码设备100。例如，第一层编码器12可包括单个视频编码设备100，而第二层编码器14可包括与第二层数具有相同数量的视频编码设备100。

在视频编码设备100对第一层图像进行编码的情况下，编码单元确定器 120可针对在每个LCU中的根据树结构的每个编码单元，确定用于图像间预测的预测单元，并针对每个预测单元执行图像间预测。

在视频编码设备100对第二层图像进行编码的情况下，编码单元确定器 120可针对每个LCU确定根据树结构的编码单元和预测单元，并可针对每个预测单元执行帧间预测。

为了对第一层图像和第二层图像之间的亮度差进行补偿，视频编码设备100可对亮度差进行编码。然而，可根据编码单元的编码模式来确定是否执行亮度补偿。例如，可仅针对2N×2N的预测单元执行亮度补偿。

图9根据一个或更多个实施例的基于具有树结构的编码单元的视频解码设备200的框图。

涉及基于具有树结构的编码单元的视频预测的视频解码设备200包括接收器210、图像数据和编码信息提取器220和图像数据解码器230。

用于视频解码设备200的解码操作的各种术语(诸如编码单元、深度、预测单元、变换单元和划分信息)的定义与参照图8和视频编码设备100描述的定义相同。

接收器210接收和解析编码视频的比特流。图像数据和编码信息提取器 220从解析的比特流，针对每个编码单元提取编码图像数据，并将提取的图像数据输出到图像数据解码器230，其中，编码单元具有根据每个LCU的树结构。图像数据和编码信息提取器220可从关于当前画面的头、序列参数集或画面参数集提取关于当前画面的编码单元的最大尺寸的信息。

另外，图像数据和编码信息提取器220从解析的比特流，根据每个LCU，提取具有树结构的编码单元的划分信息和编码信息。提取的划分信息和编码信息被输出到图像数据解码器230。换句话说，比特流中的图像数据被划分为LCU，使得图像数据解码器230针对每个LCU对图像数据进行解码。

可针对与深度相应的至少一条划分信息设置根据LCU的最终划分信息和编码信息，根据深度的编码信息可包括关于与深度相应的相应编码单元的分区模式的信息、关于预测模式的信息和关于变换单元的划分信息。另外，根据深度的划分信息可被提取作为关于最终深度的信息。

由图像数据和编码信息提取器220提取的根据每个LCU的划分信息和编码信息是这样的划分信息和编码信息：该划分信息和编码信息被确定为在编码器(诸如，视频编码设备100)根据每个LCU对根据深度的每个较深层编码单元重复地执行编码时产生最小编码误差。因此，视频解码设备200可通过根据产生最小编码误差的深度和编码模式对图像数据进行解码来重建图像。

由于划分信息和编码信息可被分配给相应的编码单元、预测单元和最小单元中的预定数据单元，因此图像数据和编码信息提取器220可根据预定数据单元，提取划分信息和编码信息。如果相应LCU的划分信息和编码信息根据预定数据单元被记录，则可将被分配了相同的划分信息和编码信息的预定数据单元推断为是包括在同一LCU中的数据单元。

图像数据解码器230基于根据LCU的划分信息和编码信息，通过对每个 LCU中的图像数据进行解码，来重建当前画面。换句话说，图像数据解码器 230可基于提取出的关于包括在每个LCU中的具有树结构的编码单元之中的每个编码单元的分区类型、预测模式和变换单元的信息，对编码的图像数据进行解码。解码处理可包括预测(包含帧内预测和运动补偿)和逆变换。

图像数据解码器230可基于关于根据深度的编码单元的预测单元的分区模式和预测模式的信息，根据每个编码单元的分区和预测模式，执行帧内预测或运动补偿。

另外，为了对每个LCU执行逆变换，图像数据解码器230可读取关于每个编码单元的根据树结构的变换单元的信息，从而基于每个编码单元的变换单元执行逆变换。通过逆变换，可重建编码单元的空间域的像素值。

图像数据解码器230可通过使用根据深度的划分信息来确定当前LCU的最终深度。如果划分信息指示图像数据在当前深度中不再被划分，则当前深度是最终深度。因此，图像数据解码器230可针对与深度相应的每个编码单元，通过使用关于预测单元的分区模式的信息、关于预测模式的信息和变换单元的划分信息，对当前LCU中的编码数据进行解码。

换句话说，可通过观察分配给编码单元、预测单元和最小单元中的预定数据单元的编码信息集来收集包含包括相同划分信息的编码信息的数据单元，并且收集的数据单元可被认为是将由图像数据解码器230以相同编码模式进行解码的一个数据单元。这样，针对每个编码单元，可通过获得关于编码模式的信息来对当前编码单元进行解码。为了通过对接收到的第一层图像流和第二层图像数据进行解码来恢复第一层图像和第二层图像，以上参照图 2a描述的层间视频解码设备20可包括与视点数量具有相同数量的视频解码设备200。

如果接收到第一层图像流，则视频解码设备200的视频数据解码器230 将由提取器220从第一层图像流提取的第一层图像的样点划分为LCU的根据树结构的编码单元。视频数据解码器230可在第一层图像的样点的根据树结构的每个编码单元中对用于图像间预测的每个预测单元执行运动补偿来恢复第一层图像。

如果接收到第二层图像流时，则视频解码设备200的视频数据解码器230 将由提取器220从第二层图像流提取的第二层图像的样点划分为LCU的根据树结构的编码单元。可在第二层图像的样点的根据树结构的每个编码单元中对用于图像间预测的每个预测单元执行运动补偿来恢复第二层图像。

视频数据和编码信息提取器220可从用于补偿在第一层图像与第二层图像之间的亮度差的比特流获得关于亮度补偿的信息。例如，可仅对2N×2N的预测单元执行亮度补偿。

换言之，视频解码设备200可在编码操作期间针对每个LCU递归地执行编码，获得关于具有最小编码误差的编码单元的信息，并且可使用用于对当前画面进行解码的信息。换句话说，被确定为每个LCU中最优编码单元的根据树结构的编码单元的编码图像数据可被解码。

因此，即使高分辨率图像或具有大数据量的图像，也可通过根据编码单元的尺寸和编码模式对图像数据进行有效地解码来恢复，其中，通过使用从编码端发送的最优划分信息，根据图像特征自适应地确定编码单元的尺寸和编码模式。

编码单元的尺寸可被表示为宽度×高度，并可以是64×64、32×32、16×16 和8×8。64×64的编码单元可被划分为64×64、64×32、32×64或32×32的分区，32×32的编码单元可被划分为32×32、32×16、16×32或16×16的分区， 16×16的编码单元可被划分为16×16、16×8、8×16或8×8的分区，8×8的编码单元可被划分为8×8、8×4、4×8或4×4的分区。

在视频数据310中，分辨率是1920×1080，编码单元的最大尺寸是64，最大深度是2。在视频数据320中，分辨率是1920×1080，编码单元的最大尺寸是64，最大深度是3。在视频数据330中，分辨率是352×288，编码单元的最大尺寸是16，最大深度是1。图17中示出的最大深度表示从LCU到最小编码单元的划分总次数。

如果分辨率高或数据量大，则编码单元的最大尺寸可能较大，从而不仅提高编码效率，而且准确地反映图像的特征。因此，具有比视频数据330更高分辨率的视频数据310和320的编码单元的最大尺寸可以是64。

由于视频数据310的最大深度是2，因此由于通过对LCU划分两次，深度加深至两层，因此视频数据310的编码单元315可包括长轴尺寸为64的 LCU和长轴尺寸为32和16的编码单元。同时，由于视频数据330的最大深度是1，因此由于通过对LCU划分一次，深度加深至一层，因此视频数据330 的编码单元335可包括长轴尺寸为16的LCU和长轴尺寸为8的编码单元。

由于视频数据320的最大深度是3，因此由于通过对LCU划分三次，深度加深至3层，因此视频数据320的编码单元325可包括长轴尺寸为64的 LCU和长轴尺寸为32、16和8的编码单元。随着深度加深，详细信息可被精确地表示。

图11是根据一个或更多个实施例的基于编码单元的图像编码器400的框图。

图像编码器400执行视频编码设备100的编码单元确定器120中对图像数据进行编码所需的操作。换句话说，帧内预测器420根据预测单元对当前帧405中的帧内模式下的编码单元执行帧内预测，帧间预测器通过使用当前图像405和从重建画面缓冲器410获得的参考图像，根据预测单元对帧间模式下的编码单元执行帧间预测。当前图像405可被划分为LCU，并随后LCU 可被顺序编码。在这点上，将被划分为具有树结构的编码单元的LCU可被编码。

通过从关于当前图像405的被编码的编码单元的数据去除从帧内预测器 420或帧间预测器415输出的每个模式的关于编码单元的预测数据来产生残差数据，并且残差数据通过变换器425和量化器430被输出为根据变换单元的量化后的变换系数。量化后的变换系数通过反量化器445和逆变换器450 被重建为空间域的残差数据。空间域的重建的残差数据与从帧内预测器420 或帧间预测器415输出的每个模式的关于编码单元的预测数据相加，并被重建为当前图像405的编码单元的空间域的数据。空间域的重建数据通过去块器455和SAO执行器460被产生为重建图像。重建图像被存储在重建画面缓冲器410中。存储在重建画面缓冲器410中的重建图像可被用作用于对另一图像进行帧间预测的参考图像。由变换器425和量化器430量化的变换系数可通过熵编码器435被输出为比特流440。

为了将图像编码器400应用到视频编码设备100中，图像编码器400的所有元件(即，帧间预测器415、帧内预测器420、变换器425、量化器430、熵编码器435、反量化器445、逆变换器450、去块器455和SAO执行器460) 基于根据每个LCU的具有树结构的编码单元中的每个编码单元执行操作。

具体地，帧内预测器410、运动估计器420和运动补偿器425在考虑当前LCU的最大尺寸和最大深度的同时，确定具有树结构的编码单元中的每个编码单元的分区和预测模式，变换器430确定具有树结构的编码单元中的每个编码单元中的变换单元的尺寸。

具体地，帧内预测器420和帧间预测器415可考虑当前LCU的最大尺寸和最大深度来确定具有树结构的编码单元之中的每个编码单元的分区模式和预测模式，变换器425可确定是否对具有树结构的编码单元中的每个编码单元中的具有四叉树结构的变换单元进行划分。

图12是根据一个或更多个实施例的基于编码单元的图像解码器500的框图。

熵解码器515从比特流505解析将被解码的编码图像数据和解码所需的关于编码的信息。编码图像数据是量化后的变换系数，其中，反量化器520 和逆变换器525从量化后的变换系数重建残差数据。

帧内预测器540根据每个预测单元对帧内模式下的编码单元执行帧内预测。帧间预测器535通过使用从重建画面缓冲器530获得的参考图像针对每个预测单元对当前图像405中的帧间模式下的编码单元执行帧间预测。

通过帧内预测器540和帧间预测器535的每个模式的关于编码单元的预测数据和残差数据相加，因此可重建关于当前图像405的编码单元的空间域的数据，并且空间域的重建数据可通过去块器545和SAO执行器550被输出为重建图像560。存储在重建画面缓冲器530中的重建图像可被输出为参考图像。

为了在视频解码设备200的图像数据解码器230中对图像数据进行解码，可执行在根据实施例的图像解码器500的熵解码器515之后的操作。

为了将图像解码器500应用到根据本发明的一个或更多个的视频解码设备200中，图像解码器500的所有元件(即，熵解码器515、反量化器520、逆变换器525、帧间预测器535、去块器545和SAO执行器550)可针对每个LCU基于具有树结构的编码单元执行操作。

具体地，帧内预测器540和帧间预测器535可确定每个具有树结构的编码单元的分区和预测模式，逆变换器525可针对每个编码单元确定是否对具有四叉树结构的变换单元进行划分。

图10的编码操作和图11的解码操作与单层的视频流编码操作和视频流解码操作相应。因此，如果图1a的编码单元12对包括两层或更多层的视频流进行编码，则编码单元12可包括针对每个层的图像编码器400。类似地，如果图2a的解码单元26对包括两层或更多层的视频流进行解码，则解码单元26可包括针对每个层的图像解码器500。

图13是示出根据一个或更多个的根据深度的较深层编码单元以及分区的示图。

视频编码设备100和视频解码设备200使用分层编码单元以考虑图像的特征。可根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度，或可由用户不同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。

在根据一个或更多个实施例的编码单元的分层结构600中，编码单元的最大高度和最大宽度均是64，最大深度是3。在这种情况下，最大深度表示编码单元从LCU被划分到SCU的总次数。由于沿着分层结构600的垂直轴深度加深，因此较深层编码单元的高度和宽度均被划分。另外，预测单元和分区沿着分层结构600的水平轴被示出，其中，所述预测单元和分区是对每个较深层编码单元进行预测编码的基础。

换句话说，在分层结构600中，编码单元610是LCU，其中，深度为0，尺寸为64×64(即，高度乘宽度)。随着深度沿着垂直轴加深，存在尺寸为32 ×32和深度为1的编码单元620、尺寸为16×16和深度为2的编码单元630、尺寸为8×8和深度为3的编码单元640。尺寸为8×8和深度为3的编码单元640是SCU。

编码单元的预测单元和分区根据每个深度沿着水平轴被排列。换句话说，如果尺寸为64×64和深度为0的编码单元610是预测单元，则可将预测单元划分成包括在编码单元610中的分区，即，尺寸为64×64的分区610、尺寸为64×32的分区612、尺寸为32×64的分区614或尺寸为32×32的分区616。

类似地，可将尺寸为32×32和深度为1的编码单元620的预测单元划分成包括在编码单元620中的分区，即，尺寸为32×32的分区620、尺寸为32 ×16的分区622、尺寸为16×32的分区624和尺寸为16×16的分区626。

类似地，可将尺寸为16×16和深度为2的编码单元630的预测单元划分成包括在编码单元630中的分区，即，包括在编码度单元630中的尺寸为16 ×16的分区630、尺寸为16×8的分区632、尺寸为8×16的分区634和尺寸为8×8的分区636。

类似地，可将尺寸为8×8和深度为3的编码单元640的预测单元划分成包括在编码单元640中的分区，即，包括在编码单元640中的尺寸为8×8的分区、尺寸为8×4的分区642、尺寸为4×8的分区644和尺寸为4×4的分区646。

为了确定构成LCU 610的编码单元的最终深度，视频编码设备100的编码单元确定器120对包括在LCU 610中的与每个深度相应的编码单元执行编码。

随着深度加深，包括具有相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量增加。例如，需要四个与深度2相应的编码单元来覆盖包括在与深度1相应的一个编码单元中的数据。因此，为了根据深度比较对相同数据进行编码的结果，与深度1相应的编码单元和四个与深度2相应的编码单元均被编码。

为了针对深度之中的当前深度执行编码，可沿着分层结构600的水平轴，通过对与当前深度相应的编码单元中的每个预测单元执行编码，来针对当前深度选择最小编码误差。可选地，随着深度沿着分层结构600的垂直轴加深，可通过针对每个深度执行编码，比较根据深度的最小编码误差，来搜索最小编码误差。在编码单元610中的具有最小编码误差的深度和分区可被选为编码单元610的最终深度和分区类型。

图14是用于描述根据一个或更多个实施例的在编码单元710和变换单元 720之间的关系的示图。

视频编码设备100或视频解码设备200针对每个LCU，根据具有小于或等于LCU的尺寸的编码单元，对图像进行编码或解码。可基于不大于相应的编码单元的数据单元，来选择用于在编码期间进行变换的变换单元的尺寸。

例如，在视频编码设备100或视频解码设备200中，如果编码单元710 的尺寸是64×64，则可通过使用尺寸为32×32的变换单元720来执行变换。

此外，可通过对小于64×64的尺寸为32×32、16×16、8×8和4×4 的每个变换单元执行变换，来对尺寸为64×64的编码单元710的数据进行编码，然后可选择具有最小编码误差的变换单元。

视频编码设备100的输出单元130可对与最终深度相应的每个编码单元的关于分区模式的信息800、关于预测模式的信息810以及关于变换单元尺寸的信息820进行编码，并将信息800、信息810和信息820作为关于编码模式的信息来发送。

信息800指示关于通过划分当前编码单元的预测单元而获得的分区的模式的信息，其中，所述分区是用于对当前编码单元进行预测编码的数据单元。例如，可将尺寸为2N×2N的当前编码单元CU_0划分成以下分区中的任意一个：尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N× 2N的分区806以及尺寸为N×N的分区808。这里，关于分区模式的信息800 被设置来指示尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808中的一个。

信息810指示每个分区的预测模式。例如，信息810可指示对由信息800 指示的分区执行的预测编码的模式，即，帧内模式812、帧间模式814或跳过模式816。

信息820指示当对当前编码单元执行变换时所基于的变换单元。例如，变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧内变换单元828。

视频解码设备200的图像数据和编码信息提取器220可根据每个较深层编码单元，提取并使用用于解码的信息800、810和820。

划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分成更低深度的编码单元。

用于对深度为0和尺寸为2N_0×2N_0的编码单元900进行预测编码的预测单元910可包括以下分区模式的分区：尺寸为2N_0×2N_0的分区模式 912、尺寸为2N_0×N_0的分区模式914、尺寸为N_0×2N_0的分区模式916 和尺寸为N_0×N_0的分区模式918。图23仅示出了通过对称地划分预测单元910而获得的分区模式912至918，但是分区模式不限于此，并且预测单元910的分区可包括非对称分区、具有预定形状的分区和具有几何形状的分区。

根据每种分区模式，对尺寸为2N_0×2N_0的一个分区、尺寸为2N_0 ×N_0的两个分区、尺寸为N_0×2N_0的两个分区和尺寸为N_0×N_0的四个分区重复地执行预测编码。可对尺寸为2N_0×2N_0、N_0×2N_0、2N_0 ×N_0和N_0×N_0的分区执行帧内模式和帧间模式下的预测编码。可仅对尺寸为2N_0×2N_0的分区执行跳过模式下的预测编码。

如果在分区模式912至916中的一个分区模式中编码误差最小，则可不将预测单元910划分到更低深度。

如果在分区模式918中编码误差最小，则深度从0改变到1以在操作920 中划分分区模式918，并对深度为2和尺寸为N_0×N_0的编码单元930重复地执行编码来搜索最小编码误差。

用于对深度为1和尺寸为2N_1×2N_1(＝N_0×N_0)的编码单元930 进行预测编码的预测单元940可包括以下分区类型的分区：尺寸为2N_1× 2N_1的分区类型942、尺寸为2N_1×N_1的分区类型944、尺寸为N_1×2N_1 的分区类型946以及尺寸为N_1×N_1的分区类型948。

如果在分区模式948中编码误差最小，则深度从1改变到2以在操作950 中划分分区模式948，并对深度为2和尺寸为N_2×N_2的编码单元960重复执行编码来搜索最小编码误差。

当最大深度是d时，根据每个深度的划分操作可被执行直到深度变成 d-1，并且划分信息可被编码直到深度是0到d-2中的一个。换句话说，当编码被执行直到在与d-2的深度相应的编码单元在操作970中被划分之后深度是d-1时，用于对深度为d-1和尺寸为2N_(d-1)×2N_(d-1)的编码单元980进行预测编码的预测单元990可包括以下分区模式的分区：尺寸为2N_(d-1)× 2N(d-1)的分区模式992、尺寸为2N_(d-1)×N(d-1)的分区模式994、尺寸为 N_(d-1)×2N(d-1)的分区模式996和尺寸为N_(d-1)×N(d-1)的分区模式998。

可对分区模式992至998中的尺寸为2N_(d-1)×2N_(d-1)的一个分区、尺寸为2N_(d-1)×N_(d-1)的两个分区、尺寸为N_(d-1)×2N_(d-1)的两个分区、尺寸为N_(d-1)×N_(d-1)的四个分区重复地执行预测编码，以搜索具有最小编码误差的分区模式。

即使当分区模式998具有最小编码误差时，由于最大深度是d，因此深度为d-1的编码单元CU_(d-1)也不再被划分到更低深度，构成当前LCU 900 的编码单元的深度被确定为d-1，并且当前LCU 900的分区模式可被确定为 N_(d-1)×N(d-1)。此外，由于最大深度是d，并且具有最低深度d-1的SCU 980 不再被划分到更低深度，因此不设置SCU 980的划分信息。

数据单元999可以是用于当前LCU的“最小单元”。根据一个或更多个的最小单元可以是通过将SCU 980划分成4份而获得的方形数据单元。通过重复地执行编码，视频编码设备100可通过比较根据编码单元900的深度的编码误差来选择具有最小编码误差的深度以确定深度，并将相应分区模式和预测模式设置为深度的编码模式。

这样，在所有深度1至d中对根据深度的最小编码误差进行比较，并且具有最小编码误差的深度可被确定为深度。深度、预测单元的分区模式和预测模式可作为关于编码模式的信息被编码并发送。另外，由于编码单元从0 的深度被划分到深度，因此仅深度的划分信息被设置为0，并且除了深度以外的深度的划分信息被设置为1。

视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元900的深度和预测单元的信息，来对分区912进行解码。视频解码设备200可通过使用根据深度的划分信息，将划分信息为0的深度确定为深度，并且使用关于相应深度的编码模式的信息来进行解码。

图17、图18和图19是用于描述根据一个或更多个实施例的编码单元1010、预测单元1060和变换单元1070之间的关系的示图。

编码单元1010是LCU中的与由视频编码设备100确定的深度相应的具有树结构的编码单元。预测单元1060是每个编码单元1010中的预测单元的分区，变换单元1070是每个编码单元1010的变换单元。

当在编码单元1010中LCU的深度是0时，编码单元1012和编码单元 1054的深度是1，编码单元1014、1016、1018、1028、1050和1052的深度是2，编码单元1020、1022、1024、1026、1030、1032和1048的深度是3，编码单元1040、1042、1044和1046的深度是4。

在预测单元1060中，通过划分编码单元1010中的编码单元来获得一些编码单元1014、1016、1022、1032、1048、1050、1052和1054。换句话说，编码单元1014、1022、1050和1054中的分区模式的尺寸是2N×N，编码单元1016、1048和1052中的分区模式的尺寸是N×2N，编码单元1032的分区模式的尺寸是N×N。编码单元1010的预测单元和分区小于或等于每个编码单元。

在小于编码单元1052的数据单元中的变换单元1070中，对编码单元 1052的图像数据执行变换或逆变换。另外，在尺寸和形状方面，变换单元1070 中的编码单元1014、1016、1022、1032、1048、1050和1052不同于预测单元1060中的编码单元1014、1016、1022、1032、1048、1050和1052。换句话说，视频编码设备100和视频解码设备200可对同一编码单元中的数据单元独立地执行帧内预测、运动估计、运动补偿、变换和逆变换。

因此，对LCU的每个区域中的具有分层结构的每个编码单元递归地执行编码来确定最优编码单元，从而可获得具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。表1示出可由视频编码设备100和视频解码设备200设置的编码信息。

[表1]

视频编码设备100的输出单元130可输出关于具有树结构的编码单元的编码信息，视频解码设备200的图像数据和编码信息提取器220可从接收到的比特流提取关于具有树结构的编码单元的编码信息。

划分信息指示是否将当前编码单元划分成更低深度的编码单元。如果当前深度d的划分信息是0，则当前编码单元不再被划分成更低深度的的深度是最终深度，从而可针对所述最终深度来定义关于分区模式、预测模式和变换单元的尺寸的信息。如果当前编码单元根据划分信息被进一步划分，则对更低深度的四个划分编码单元独立地执行编码。

预测模式可以是帧内模式、帧间模式和跳过模式中的一种。可针对所有分区模式定义帧内模式和帧间模式，仅针对尺寸为2N×2N的分区模式定义跳过模式。

关于分区模式的信息可指示通过对称地划分预测单元的高度或宽度而获得的尺寸为2N×2N、2N×N、N×2N和N×N的对称分区模式，以及通过非对称地划分预测单元的高度或宽度而获得的尺寸为2N×nU、2N×nD、nL ×2N和nR×2N的非对称分区模式。可通过按1:3和3:1来划分预测单元的高度来分别获得尺寸为2N×nU和2N×nD的非对称分区模式，可通过按1:3 和3:1来划分预测单元的宽度来分别获得尺寸为nL×2N和nR×2N的非对称分区模式。

可将变换单元的尺寸设置成帧内模式下的两种类型和帧间模式下的两种类型。换句话说，如果变换单元的划分信息是0，则变换单元的尺寸可以是 2N×2N，即当前编码单元的尺寸。如果变换单元的划分信息是1，则可通过对当前编码单元进行划分来获得变换单元。另外，如果尺寸为2N×2N的当前编码单元的分区类型是对称分区模式时，则变换单元的尺寸可以是N×N，如果当前编码单元的分区类型是非对称分区模式，则变换单元的尺寸可以是N/2×N/2。

关于具有树结构的编码单元的编码信息可包括与深度相应的编码单元、预测单元和最小单元中的至少一个。与深度相应的编码单元可包括包含相同编码信息的预测单元和最小单元中的至少一个。

因此，通过比较邻近数据单元的编码信息来确定邻近数据单元是否被包括在与深度相应的同一编码单元中。另外，通过使用数据单元的编码信息来确定与深度相应的相应编码单元，并因此可确定LCU中的深度的分布。

因此，如果基于邻近数据单元的编码信息来对当前编码单元进行预测，则可直接参考并使用与当前编码单元邻近的较深层编码单元中的数据单元的编码信息。

可选地，如果基于邻近数据单元的编码信息来对当前编码单元进行预测，则使用数据单元的编码信息来搜索与当前编码单元邻近的数据单元，并可参考搜索到的邻近编码单元以对当前编码单元进行预测。

图20是用于描述根据表1的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图。

LCU 1300包括多个深度的编码单元1302、1304、1306、1312、1314、 1316和1318。这里，由于编码单元1318是深度的编码单元，因此划分信息可以被设置成0。可将关于尺寸为2N×2N的编码单元1318的分区模式的信息设置成以下分区模式中的一种：尺寸为2N×2N的分区模式1322、尺寸为 2N×N的分区模式1324、尺寸为N×2N的分区模式1326、尺寸为N×N的分区模式1328、尺寸为2N×nU的分区模式1332、尺寸为2N×nD的分区模式1334、尺寸为nL×2N的分区模式1336以及尺寸为nR×2N的分区模式 1338。

变换单元的划分信息(TU尺寸标记)是一类变换索引。与变换索引相应的变换单元的尺寸可根据编码单元的预测单元类型或分区模式而改变。

例如，当分区模式被设置成对称(即，分区模式1322、1324、1326或 1328)时，如果变换单元的TU尺寸标记是0，则设置尺寸为2N×2N的变换单元1342，如果TU尺寸标记是1，则设置尺寸为N×N的变换单元1344。

当分区模式被设置成非对称(例如，分区模式1332、1334、1336或1338) 时，如果TU尺寸标记是0，则设置尺寸为2N×2N的变换单元1352，如果 TU尺寸标记是1，则设置尺寸为N/2×N/2的变换单元1354。

参照图27，TU尺寸标记是具有值0或1的标记，但是TU尺寸标记不限于1比特，在TU尺寸标记从0增加的同时，变换单元可被分层划分以具有树结构。变换单元的划分信息(TU尺寸标记)可以是变换索引的示例。

在这种情况下，根据一个或更多个实施例，可通过使用变换单元的TU 尺寸标记以及变换单元的最大尺寸和最小尺寸来表示实际上已使用的变换单元的尺寸。视频编码设备100能够对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记进行编码。对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记进行编码的结果可被插入SPS。视频解码设备200可通过使用最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记来对视频进行解码。

例如，(a)如果当前编码单元的尺寸是64×64并且最大变换单元尺寸是 32×32，则(a-1)当TU尺寸标记为0时，变换单元的尺寸可以是32×32， (a-2)当TU尺寸标记为1时，变换单元的尺寸可以是16×16，(a-3)当TU 尺寸标记为2时，变换单元的尺寸可以是8×8。

作为另一示例，(b)如果当前编码单元的尺寸是32×32并且最小变换单元尺寸是32×32，则(b-1)当TU尺寸标记为0时，变换单元的尺寸可以是 32×32。这里，由于变换单元的尺寸不能够小于32×32，因此TU尺寸标记不能够被设置为除了0以外的值。

作为另一示例，(c)如果当前编码单元的尺寸是64×64并且最大TU尺寸标记为1，则TU尺寸标记可以是0或1。这里，TU尺寸标记不能够被设置为除了0或1以外的值。

因此，如果定义最大TU尺寸标记为“MaxTransformSizeIndex”，最小变换单元尺寸为“MinTransformSize”，当TU尺寸标记为0时变换单元尺寸为“RootTuSize”，则可通过等式(1)来定义可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”：

CurrMinTuSize＝max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex)) …(1)

与可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”相比，当TU尺寸标记为0时的变换单元尺寸“RootTuSize”可指示可在系统中选择的最大变换单元尺寸。在等式(1)中，“RootTuSize/(2∧MaxTransformSizeIndex)”指示当TU尺寸标记为0时的变换单元尺寸“RootTuSize”被划分了与最大TU尺寸标记相应的次数时的变换单元尺寸，“MinTransformSize”指示最小变换尺寸。因此，“RootTuSize/(2^MaxTransformSizeIndex)”和“MinTransformSize”中较小的值可以是可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”。

根据一个或更多个实施例，最大变换单元尺寸RootTuSize可根据预测模式的类型而改变。

例如，如果当前预测模式是帧间模式，则可通过使用以下的等式(2)来确定“RootTuSize”。在等式(2)中，“MaxTransformSize”指示最大变换单元尺寸，“PUSize”指示当前预测单元尺寸：

RootTuSize＝min(MaxTransformSize,PUSize)……(2)

也就是说，如果当前预测模式是帧间模式，则当TU尺寸标记为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前预测单元尺寸中较小的值。

如果当前分区单元的预测模式是帧内模式，则可通过使用以下的等式(3) 来确定“RootTuSize”。在等式(3)中，“PartitionSize”指示当前分区单元的尺寸：

RootTuSize＝min(MaxTransformSize,PartitionSize)……(3)

也就是说，如果当前预测模式是帧内模式，则当TU尺寸标记为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前分区单元的尺寸之中较小的值。

然而，根据分区单元中的预测模式的类型而改变的当前最大变换单元尺寸“RootTuSize”仅是示例，实施例不限于此。

根据参照图15至图27描述的基于具有树结构的编码单元的视频编码方法，针对树结构的每个编码单元对空间域的图像数据进行编码。根据基于具有树结构的编码单元的视频解码方法，针对每个LCU执行解码以重建空间域的图像数据。因此，可重建画面和视频(即，画面序列)。重建后的视频可通过再现设备被再现，可被存储在存储介质中，或者可通过网络被发送。

实施例可被编写为计算机程序，并可在使用计算机可读记录介质执行程序的通用数字计算机中被实现。计算机可读记录介质的示例包括磁存储介质 (例如，ROM、软盘、硬盘等)和光记录介质(例如，CD-ROM或DVD)。

为了便于解释，以上参照图1a至图20描述的层间视频编码方法和/或视频编码方法将被称为“根据一个或更多个实施例的视频编码方法”。另外，以上参照图1a至图20描述的层间视频解码方法和/或视频解码方法将被称为“根据一个或更多个实施例的视频解码方法”。

此外，以上参照图1a至图20描述的包括层间视频编码设备10、层间视频编码设备100或图像编码器400的视频编码设备将被称为“根据一个或更多个实施例的视频编码设备”。另外，以上参照图1a至图20描述的包括层间视频解码设备20、视频解码设备200或图像解码器500的视频解码设备将被称为“根据一个或更多个实施例的视频解码设备”。

现在将详细描述根据一个或更多个实施例的存储程序的计算机可读记录介质(例如，盘26000)。

图21是根据一个或更多个实施例的存储程序的盘26000的物理结构的示图。作为存储介质的盘26000可以是硬盘驱动器、致密盘只读存储器 (CD-ROM)盘、蓝光盘或数字多功能盘(DVD)。盘26000包括多个同心磁道Tf，每个同心磁道Tf沿盘26000的圆周方向被划分成特定数量的扇区Se。在盘26000的特定区域中，可分配并存储执行如上所描述的量化参数确定方法、视频编码方法和视频解码方法的程序。

现在将参照图22来描述使用存储以下程序的存储介质来实现的计算机系统，其中，所述程序用于执行如上所述的视频编码方法和视频解码方法。

图22是通过使用盘26000来记录并读取程序的盘驱动器26800的示图。计算机系统26700可经由盘驱动器26800将执行根据一个或更多个实施例的视频编码方法和视频解码方法中的至少一个的程序存储在盘26000中。为了在计算机系统26700中运行存储在盘26000中的程序，可通过使用盘驱动器26700从盘26000读取程序并将程序发送到计算机系统26700。

执行根据一个或更多个实施例的视频编码方法和视频解码方法中的至少一个的程序不仅可被存储在图21或图22中示出的盘26000中，还可被存储在存储卡、ROM卡带或固态驱动器(SSD)中。

以下将描述应用以上所描述的视频编码方法和视频解码方法的系统。

图23是提供内容分布服务的内容供应系统11000的整体结构的示图。将通信系统的服务区域划分成预定尺寸的小区，并将无线基站11700、11800、 11900和12000分别安装在这些小区中。

内容供应系统11000包括多个独立装置。例如，诸如计算机12100、个人数字助理(PDA)12200、视频相机12300和移动电话12500的多个独立装置经由互联网服务提供商11200、通信网络11400和无线基站11700、11800、 11900和12000连接到互联网11100。

然而，内容供应系统11000不限于如图24中所示，并且装置可选择性地被连接到内容供应系统11000。多个独立装置可不经由无线基站11700、11800、 11900和12000而直接连接到通信网络11400。

视频相机12300是能够捕捉视频图像的成像装置，例如，数字视频相机。移动电话12500可利用各种协议(例如，个人数字通信(PDC)、码分多址 (CDMA)、宽带码分多址(W-CDMA)、全球移动通信系统(GSM)和个人手持电话系统(PHS))中的至少一种通信方法。

视频相机12300可经由无线基站11900和通信网络11400连接到流服务器11300。流服务器11300允许经由视频相机12300从用户接收到的内容经由实时广播被流传输。可使用视频相机12300或流服务器11300来对从视频相机12300接收到的内容进行编码。通过视频相机12300捕捉到的视频数据可经由计算机12100被发送到流服务器11300。

通过相机12600捕捉到的视频数据也可经由计算机12100被发送到流服务器11300。与数码相机类似，相机12600是能够捕捉静止图像和视频图像两者的成像装置，并与数码相机类似。可使用相机12600或计算机12100对通过相机12600捕捉到的视频数据进行编码。可将对视频执行编码和解码的软件存储在可由计算机12100访问的计算机可读记录介质(例如，CD-ROM 盘、软盘、硬盘驱动器、SSD或存储卡)中。

如果视频数据通过内置在移动电话12500中的相机被捕捉到，则可从移动电话12500接收视频数据。

还可通过安装在视频相机12300、移动电话12500或相机12600中的大规模集成电路(LSI)系统来对视频数据进行编码。

内容供应系统1100可对由用户使用视频相机12300、相机12600、移动电话12500或另一成像装置所记录的内容数据(例如，在音乐会期间记录的内容)进行编码，并将编码后的内容数据发送到流服务器11300。流服务器 11300可将流内容的类型的编码后的内容数据发送到请求内容数据的其它客户端。

客户端是能够对编码后的内容数据进行解码的装置，例如，计算机 12100、PDA12200、视频相机12300或移动电话12500。因此，内容供应系统11000允许客户端接收并再现编码后的内容数据。此外，内容供应系统 11000允许客户端实时接收编码后的内容数据并对编码后的内容数据进行解码和再现，从而能够进行个人广播。

包括在内容供应系统11000中的多个独立装置的编码和解码操作可类似于根据一个或更多个实施例的视频编码设备和视频解码设备的编码和解码操作。

现在将参照图24和图25更加详细地描述包括在根据一个或更多个实施例的内容供应系统11000中的移动电话12500。

图24示出根据一个或更多个实施例的应用视频编码方法和视频解码方法的移动电话12500的外部结构。移动电话12500可以是智能电话，所述智能电话的功能不受限，并且所述智能电话的大部分功能可被改变或扩展。

移动电话12500包括可与图21的无线基站12000交换射频(RF)信号的内部天线12510，并包括用于显示由相机12530捕捉到的图像或经由天线 12510接收到的和解码的图像的显示屏12520(例如，液晶显示器(LCD)或有机发光二极管(OLED)屏幕)。移动电话12500包括包含有控制按钮和触摸面板的操作面板12540。如果显示屏12520是触摸屏，则操作面板12540 还包括显示屏12520的触摸感测面板。移动电话12500包括用于输出语音和声音的扬声器12580或另一类型声音输出单元、以及用于输入语音和声音的麦克风12550或另一类型声音输入单元。移动电话12500还包括用于捕捉视频和静止图像的相机12530，诸如电荷耦合器件(CCD)相机。移动电话12500 还可包括：存储介质12570，用于存储通过相机12530捕捉到的、经由电子邮件接收到的、或根据各种方式获得的编码/解码数据(例如，视频或静止图像)；插槽12560，存储介质12570经由插槽12560被装入移动电话12500中。存储介质12570可以是闪存，例如，包括在塑料壳中的安全数字(SD)卡或电可擦和可编程只读存储器(EEPROM)。

图25示出根据一个或更多个实施例的移动电话12500的内部结构。为了系统地控制包括显示屏12520和操作面板12540的移动电话12500的部件，供电电路12700、操作输入控制器12640、图像编码单元12720、相机接口 12630、LCD控制器12620、图像解码器12690、复用器/解复用器12680、记录/读取器12670、调制器/解调器12660以及声音处理器12650经由同步总线 12730被连接到中央控制器12710。

如果用户操作电源按钮，并从“电源关闭”状态设置为“电源开启”状态，则供电电路12700从电池组向移动电话12500的所有部件供电，从而将移动电话12500设置为操作模式。

中央控制器12710包括中央处理器(CPU)、ROM和RAM。

在移动电话12500将通信数据发送到外部的同时，在中央控制器12710 的控制下，由移动电话12500产生数字信号。例如，声音处理器12650可产生数字声音信号，图像编码器12720可产生数字图像信号，并且消息的文本数据可经由操作面板12540和操作输入控制器12640被产生。当在中央控制器12710的控制下数字信号被传送到调制器/解调器12660时，调制器/解调器 12660对数字信号的频带进行调制，并且通信电路12610对频带调制数字声音信号执行数模转换(DAC)和频率转换。从通信电路12610输出的发送信号可经由天线12510被发送到语音通信基站或无线基站12000。

例如，当移动电话12500处于通话模式时，在中央控制器12710的控制下，经由麦克风12550获得的声音信号通过声音处理器12650被变换成数字声音信号。数字声音信号可经由调制器/解调器12660和通信电路12610被变换成变换信号，并可经由天线12510被发送。

当文本消息(例如，电子邮件)在数据通信模式下被发送时，文本消息的文本数据经由操作面板12540被输入，并经由操作输入控制器12640被发送到中央控制器12610。在中央控制器12610的控制下，文本数据经由调制器/解调器12660和通信电路12610被变换成发送信号，并经由天线12510被发送到无线基站12000。

为了在数据通信模式下发送图像数据，由相机12530捕捉到的图像数据经由相机接口12630被提供给图像编码单元12720。捕捉到的图像数据可经由相机接口12630和LCD控制器12620被直接显示在显示屏12520上。

根据一个或更多个实施例，图像编码单元12720的结构可与以上描述的视频编码设备100的结构相应。图像编码单元12720可基于上述根据一个或更多个实施例的视频编码方法，将从相机12530接收到的图像数据变换为压缩和编码后的图像数据，并然后将编码后的图像数据输出到复用器/解复用器 12680。在相机12530的记录操作期间，由移动电话12500的麦克风12550获得的声音信号可经由声音处理器12650被变换成数字声音数据，并且数字声音数据可被传送到复用器/解复用器12680。

复用器/解复用器12680对从图像编码单元12720接收到的编码后的图像数据与从声音处理器12650接收到的声音数据一起进行复用。对数据进行复用的结果可经由调制器/解调器12660和通信电路12610被变换成发送信号，然后可经由天线12510被发送。

当移动电话12500从外部接收通信数据时，可对经由天线12510接收到的信号执行频率恢复和ADC以将信号变换成数字信号。调制器/解调器12660 对数字信号的频带进行调制。根据频带调制后的数字信号的类型将所述数字信号发送到视频解码单元12690、声音处理器12650或LCD控制器12620。

在通话模式下，移动电话12500对经由天线12510接收到的信号进行放大，并通过对放大后的信号执行频率转换和ADC来获得数字声音信号。在中央控制器12710的控制下，接收到的数字声音信号经由调制器/解调器12660 和声音处理器12650被变换成模拟声音信号，并且模拟声音信号经由扬声器 12580被输出。

当在数据通信模式下时，接收在互联网网站上访问的视频文件的数据，经由调制器/解调器12660将经由天线12510从无线基站12000接收到的信号输出为复用数据，并将复用数据发送到复用器/解复用器12680。

为了对经由天线12510接收到的复用数据进行解码，复用器/解复用器 12680将复用数据解复用成编码后的视频数据流和编码后的音频数据流。经由同步总线12730，编码后的视频数据流和编码后的音频数据流分别被提供给视频解码单元12690和声音处理器12650。

图像解码单元12690的结构可与上述的根据一个或更多个的视频解码设备200的结构相应。图像解码单元12690可通过使用上述的根据一个或更多个实施例的视频解码方法，对编码后的视频数据进行解码来获得重建的视频数据，并经由LCD控制器12620将重建的视频数据提供给显示屏12520。

因此，可将在互联网网站上访问的视频文件的数据显示在显示屏12520 上。同时，声音处理器12650可将音频数据变换成模拟声音信号，并将模拟声音信号提供给扬声器12580。因此，也可经由扬声器12580再现在互联网网站上访问的视频文件中包含的音频数据。

移动电话12500或另一类型的通信终端可以是包括根据一个或更多个实施例的视频编码设备和视频解码设备两者的收发终端，可以是仅包括视频编码设备的收发终端，或者可以是仅包括视频解码设备的收发终端。

根据一个或更多个的通信系统不限于以上参照图24描述的通信系统。例如，图26示出根据一个或更多个实施例的采用通信系统的数字广播系统。图 26的数字广播系统可通过使用根据一个或更多个实施例的视频编码设备和视频解码设备来接收经由卫星或地面网络发送的数字广播。

具体地，广播站12890通过使用无线电波将视频数据流发送到通信卫星或广播卫星12900。广播卫星12900发送广播信号，广播信号经由家用天线 12860被发送到卫星广播接收器。在每个房屋中，可通过TV接收器12810、机顶盒12870或另一装置对编码后的视频流进行解码并再现。

当根据一个或更多个实施例的视频解码设备被实现在再现设备12830中时，再现设备12830可对记录在存储介质12820(诸如用于恢复数字信号的盘或存储卡)上的编码后的视频流进行解析和解码。因此，可在例如监视器 12840上再现重建的视频信号。

在被连接到用于卫星/地面广播的天线12860或用于接收有线电视(TV) 广播的线缆天线12850的机顶盒12870中，可安装根据一个或更多个实施例的视频解码设备。从机顶盒12870输出的数据也可被再现在TV监视器12880 上。

如另一示例，可将根据一个或更多个的视频解码设备安装在TV接收器 12810中，而不是机顶盒12870中。

具有适当天线12910的汽车12920可接收从卫星12900或图21的无线基站11700发送的信号。可在内置在汽车12920中的汽车导航系统12930的显示屏上再现解码后的视频。

视频信号可由根据一个或更多个实施例的视频编码设备来编码，然后可被存储在存储介质中。具体地，可由DVD记录器将图像信号存储在DVD盘 12960中，或可由硬盘记录器12950将图像信号存储在硬盘中。如另一示例，可将视频信号存储在SD卡12970中。如果硬盘记录器12950包括根据一个或更多个实施例的视频解码设备，则记录在DVD盘12960、SD卡12970或另一存储介质上的视频信号可被再现于TV监视器12880上。

汽车导航系统12930可不包括图25的相机12530、图25的相机接口12630 和图像编码单元12720。例如，计算机12100和TV接收器12810可不包括相机12530、相机接口12630和图像编码单元12720。

云计算系统可包括云计算服务器14000、用户数据库(DB)14100、多个计算资源14200和用户终端。

响应于来自用户终端的请求，云计算系统经由数据通信网络(例如，互联网)提供多个计算资源14200的点播外包服务。在云计算环境下，服务提供商通过使用虚拟技术组合位于不同的物理位置的数据中心处的计算资源，来为用户提供想要的服务。服务用户不必将计算资源(例如，应用、存储器、操作系统(OS)和安全)安装在他/她拥有的终端中以使用它们，但可在想要的时间点在通过虚拟技术产生的虚拟空间中从服务中选择和使用想要的服务。

被指定的服务用户的用户终端经由包括互联网和移动通信网络的数据通信网络被连接到云计算服务器14100。可从云计算服务器14100向用户终端提供云计算服务，特别是视频再现服务。用户终端可以是能够被连接到互联网的各种类型的电子装置，例如，桌上型PC 14300、智能TV 14400、智能电话14500、笔记本计算机14600、便携式多媒体播放器(PMP)14700、平板 PC 14800等。

云计算服务器14100可组合分布在云网络中的多个计算资源14200，并向用户终端提供组合的结果。所述多个计算资源14200可包括各种数据服务，并可包括从用户终端上载的数据。如上所描述的，云计算服务器14100可通过根据虚拟技术组合分布在不同区域中的视频数据库来向用户终端提供想要的服务。

将关于已经订购云计算服务的用户的用户信息存储在用户DB 14100中。用户信息可包括用户的注册信息、地址、姓名和个人信用信息。用户信息还可包括视频的索引。这里，所述索引可包括已经被再现的视频的列表、正在被再现的视频的列表，之前被再现的视频的暂停点等。

可在用户装置之间共享存储在用户DB 14100中的关于视频的信息。例如，当响应于来自笔记本计算机14600的请求将视频服务提供给笔记本计算机14600时，视频服务的再现历史被存储在用户DB 14100中。当从智能电话 14500接收到用于再现此视频服务的请求时，云计算服务器14000基于用户 DB 14100搜索并再现此视频服务。当智能电话14500从云计算服务器14000 接收到视频数据流时，通过对视频数据流进行解码来再现视频的处理与以上参照图24描述的移动电话12500的操作类似。

云计算服务器14000可参考存储在用户DB 14100中的想要的视频服务的再现历史。例如，云计算服务器14000从用户终端接收用于再现存储在用户DB 14100中的视频的请求。如果此视频之前被再现过，则由云计算服务器 14000执行的对此视频进行流传输的方法可根据来自用户终端的请求(即，根据是将从视频的起点还是视频的暂停点来再现视频)而不同。例如，如果用户终端请求从视频的起点开始再现视频，则云计算服务器14000将从视频的第一帧开始的视频的流数据发送到用户终端。如果用户终端请求从视频的暂停点开始再现视频，则云计算服务器14000将从与暂停点相应的帧开始的视频的流数据发送到用户终端。

在此情况下，用户终端可包括如以上参照图1a至图20描述的视频解码设备。如另一示例，用户终端可包括如以上参照图1a至图20描述的视频编码设备。可选地，用户终端可包括如以上参照图1a至图20描述的视频解码设备和视频编码设备两者。

以上已经参照图20至图27描述了以上参照图1a至图20描述的根据一个或更多个实施例的视频编码方法、视频解码方法、视频编码设备和视频解码设备的各种应用。然而，根据各种实施例的将视频编码方法和视频解码方法存储在存储介质中的方法，或者将视频编码设备和视频解码设备实现在装置中的方法不限于以上参照图21至图27描述的实施例。

应理解，这里描述的示例性实施例应该被解释为是说明性意义，而不是为了限制的目的。每个实施例内的特征和方面的描述应该通常被解释为可用于其它实施例中的其它类似的特征或方面。

虽然已参照附图描述了本发明的一个或更多个实施例，但是本领域的普通技术人员将理解，在不脱离由权利要求书限定的本发明的精神和范围的情况下，可在其中进行形式和细节上的各种改变。

Claims

1.一种层间视频解码方法，包括：

确定是否针对通过使用第一层的参考块将被重建的第二层的当前块执行亮度补偿；

基于位于第一层的子像素的左上侧、右上侧、左下侧和右下侧的整像素之中的与第一层的子像素最接近的整像素来确定第一层参考块的参考像素，其中，第一层的子像素由第二层的当前块的视差矢量所指示，并且所述与第一层的子像素最接近的整像素由第二层的当前块的经过调整和移位的视差矢量所指示；

将围绕第一层参考块的像素确定为第一层参考像素；

基于第一层参考像素和在第二层的当前块周围的像素来确定针对第二层的当前块的亮度补偿参数，

其中，基于与第一层的子像素最接近的整像素来确定第一层参考块的参考像素的步骤包括：

通过将基于指示当前块是亮度块还是色度块的颜色分量索引所确定的与整像素之间的距离有关的调整值添加到第二层的当前块的视差矢量的x分量和y分量来调整视差矢量；

基于当前块的颜色分量索引来将经过调整的视差矢量移位到预定方向以产生所述经过调整和移位的视差矢量。

2.如权利要求1所述的层间视频解码方法，其中，确定第一层的参考像素的步骤包括：

将所述视差矢量变换为整数视差矢量；

将由整数视差矢量指示的位置确定为第一层的参考像素的位置。

3.如权利要求1所述的层间视频解码方法，其中，确定第一层的参考像素的步骤包括：

将最接近于与第二层的当前块的左上角的像素的位置相应的第一层的参考像素的位置的整像素确定为在第一层的参考块的左上角的像素的位置；

将在第一层的参考块周围的像素确定为第一层的参考像素。

4.一种层间视频解码设备，包括：

亮度补偿确定器，确定是否针对通过使用第一层的参考块将被重建的第二层的当前块执行亮度补偿；

参考像素确定器，基于位于第一层的子像素的左上侧、右上侧、左下侧和右下侧的整像素之中的与第一层的子像素最接近的整像素来确定第一层参考块的参考像素，并将围绕第一层参考块的像素确定为第一层参考像素，其中，第一层的子像素由第二层的当前块的视差矢量所指示，并且所述与第一层的子像素最接近的整像素由第二层的当前块的经过调整和移位的视差矢量所指示；

亮度补偿参数确定单元，基于第一层参考像素和在第二层的当前块周围的像素来确定针对第二层的当前块的亮度补偿参数，

其中，参考像素确定器通过以下操作，基于与第一层的子像素最接近的由第二层的当前块的经过调整和移位的视差矢量所指示的整像素来确定第一层参考块的参考像素：

通过将基于指示当前块是亮度块还是色度块的颜色分量索引所确定的与整像素之间的距离有关的调整值添加到第二层的当前块的视差矢量的x分量和y分量来调整视差矢量，并且