CN107820098B

CN107820098B - 对视频编码的方法和设备以及对视频解码的方法和设备

Info

Publication number: CN107820098B
Application number: CN201711346630.4A
Authority: CN
Inventors: 范迪姆·谢廖金; 金壹求
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2011-06-28
Filing date: 2012-06-27
Publication date: 2021-01-08
Anticipated expiration: 2032-06-27
Also published as: JP2015149771A; JP5735710B2; US9565455B2; CA2840481A1; KR20150046773A; ES2797423T3; ES2655917T3; TWI615020B; CN105357541A; CN105516732A; EP3021591A1; JP5873200B2; KR101457399B1; AU2016206260A1; TWI562618B; CN107820098A; AU2012276453A1; PH12017501000A1; ZA201502761B; US20150181224A1

Abstract

提供一种对视频编码的方法和设备以及对视频解码的方法和设备。一种通过符号解码对视频进行解码的方法，所述方法包括：从接收的比特流解析图像块的符号；基于根据当前块的尺寸确定的阈值将当前符号分类为前缀比特串和后缀比特串；通过使用针对前缀比特串和后缀比特串中的每一个确定的算术解码方法来执行算术解码；以及，通过使用针对前缀比特串和后缀比特串中的每一个确定的二值化方法来执行逆二值化。

Description

对视频编码的方法和设备以及对视频解码的方法和设备

本申请是向中国知识产权局提交的申请日为2012年6月27日的标题为“伴随有算术编码的对视频编码的方法和设备以及对视频解码的方法和设备”的第201280042529.9号申请的分案申请。

技术领域

本发明涉及分别包括算术编码和算术解码的视频编码和视频解码。

背景技术

随着用于再现和存储高分辨率或高品质视频内容的硬件的开发和供应，对用于有效地对高分辨率或高质量视频内容进行编码或解码的视频编解码器的需要日益增加。在传统的视频编解码器中，基于具有预定尺寸的宏块，根据有限的编码方法对视频进行编码。

通过使用频率转换方法将空间域的图像数据转换为频域的系数。为了频率转换的快速操作，视频编解码器通过将图像划分为具有预定尺寸的多个块并执行离散余弦变换(DCT)转换，来以块为单位对频率系数进行编码。与空域的图像数据相比，频率区域的系数被容易地压缩。具体地讲，在空域中图像的像素值被表示为预测误差，因此，如果对预测误差执行频率转换，则大量的数据可被转换为0。视频编解码器将连续且重复地产生的数据转换为小数据，以减少数据量。

发明内容

技术问题

本发明提供一种用于通过将符号分类为前缀比特串和后缀比特串对视频执行算术编码和算术解码的方法和设备。

技术方案

根据本发明的一方面，提供一种通过符号解码对视频进行解码的方法，所述方法包括：从接收的比特流解析图像块的符号；基于根据当前块的尺寸确定的阈值将当前符号分类为前缀比特串和后缀比特串；通过使用针对前缀比特串和后缀比特串中的每一个确定的算术解码方法执行算术解码；通过使用针对前缀比特串和后缀比特串中的每一个确定的二值化方法执行逆二值化；通过使用经由算术解码和逆二值化恢复的当前符号对当前块执行逆变换和预测来恢复图像块。

有益效果

通过对后缀区域或后缀比特串执行具有相对小量操作负担的二值化方法或者通过在用于符号编码/解码的基于上下文的算术编码/解码期间省略上下文建模，来提高符号编码/解码处理的效率。

附图说明

图1是根据本发明的实施例的视频编码设备的框图；

图2是根据本发明的实施例的视频解码设备的框图；

图3和图4是用于描述根据本发明的实施例的通过根据预定阈值将符号分类为前缀比特串和后缀比特串来进行算术编码的示图；

图5是用于描述根据本发明的实施例的视频编码方法的流程图；

图6是用于描述根据本发明的实施例的视频解码方法的流程图；

图7是根据本发明的实施例的基于具有树结构的编码单元的视频编码设备的框图；

图8是根据本发明的实施例的基于具有树结构的编码单元的视频解码设备的框图；

图9是根据本发明的实施例的编码单元的概念图；

图10是根据本发明的实施例的基于编码单元的图像编码器的框图；

图11是根据本发明的实施例的基于编码单元的图像解码器的框图；

图12是示出根据本发明的实施例的根据深度的编码单元和分区的示图；

图13是用于描述根据本发明的实施例的编码单元和变换单元之间的关系的示图；

图14是用于描述根据本发明的实施例的根据深度的编码单元的编码信息的示图；

图15是示出根据本发明的实施例的根据深度的编码单元的示图；

图16至图18是用于描述根据本发明的实施例的编码单元、预测单元和变换单元之间的关系的示图；

图19是用于描述根据表1的编码模式信息的编码单元、预测单元和变换之间的关系的示图。

最佳实施方式

根据本发明的一方面，提供一种通过符号解码对视频进行解码的方法，所述方法包括：从接收的比特流解析图像块的符号；基于根据当前块的尺寸确定的阈值将当前符号分类为前缀比特串和后缀比特串；通过使用针对前缀比特串和后缀比特串中的每一个确定的算术解码方法来执行算术解码；通过使用针对前缀比特串和后缀比特串中的每一个确定的二值化方法来执行逆二值化；以及通过使用经由算术解码和逆二值化恢复的当前符号对当前块执行逆变换和预测来恢复图像块。

执行逆二值化的步骤可包括：通过根据针对前缀比特串和后缀比特串中的每一个确定的二值化方法执行逆二值化来恢复符号的前缀区域和后缀区域。

执行算术解码的步骤可包括：根据比特的位置对前缀比特串执行用于确定上下文建模的算术解码；以及在旁路模式下对后缀比特串执行省略上下文建模的算术解码。

执行算术解码的步骤可包括：当符号是变换系数的最终系数位置信息时，通过使用预先分配到前缀比特串的比特的位置的预定索引的上下文来执行算术解码。

当前符号可包括当前块的帧内预测模式和最终系数位置信息中的至少一个。

二值化方法还可包括：从包括一元二值化、截断一元二值化、指数哥伦布二值化和固定长度二值化构成的组中选择的至少一种。

根据本发明的另一方面，提供一种通过符号编码对视频进行编码的方法，所述方法包括：通过对图像块执行预测和变换来产生符号；基于根据当前块的尺寸确定的阈值将当前符号分类为前缀区域和后缀区域；通过使用针对前缀区域和后缀区域中的每一个确定的二值化方法来产生前缀比特串和后缀比特串；通过使用针对前缀比特串和后缀比特串中的每一个确定的算术编码方法来执行符号编码；以及以比特流的形式输出通过符号编码产生的比特串。

执行符号编码的操作可包括：通过使用用于根据比特的位置执行上下文建模的算术编码方法对前缀比特串执行符号编码；以及通过使用用于在旁路模式下省略上下文建模的算术编码方法对后缀比特串执行符号编码。

执行符号编码的操作可包括：当符号是变换系数的最终系数位置信息时，通过使用预先分配到前缀比特串的比特的位置的预定索引的上下文来执行算术编码。

根据本发明的另一方面，提供一种用于通过符号解码对视频进行解码的设备，所述设备包括：解析器，从接收的比特流解析图像块的符号；符号解码器，基于根据当前块的尺寸确定的阈值将当前符号分类为前缀比特串和后缀比特串，并且通过使用针对前缀比特串和后缀比特串中的每一个确定的算术解码方法来执行算术解码，然后通过使用针对前缀比特串和后缀比特串中的每一个确定的二值化方法来执行逆二值化；以及图像恢复单元，通过使用经由算术解码和逆二值化恢复的当前符号对当前块执行逆变换和预测来恢复图像块。

根据本发明的另一方面，提供一种用于通过符号编码对视频进行编码的设备，所述设备包括：图像编码器，通过对图像块执行预测和变换来产生符号；符号编码器，基于根据当前块的尺寸确定的阈值将当前符号分类为前缀区域和后缀区域，并且通过使用针对前缀区域和后缀区域中的每一个确定的二值化方法来产生前缀比特串和后缀比特串，然后通过使用针对前缀比特串和后缀比特串中的每一个确定的算术编码方法来执行符号编码；以及比特流输出单元，以比特流的形式输出通过符号编码产生的比特串。

根据本发明的另一方面，提供一种其上包含有用于执行通过符号解码对视频进行解码的方法的计算机程序的计算机可读记录介质。

根据本发明的另一方面，提供一种其上包含有用于执行通过符号编码对视频进行编码的方法的计算机程序的计算机可读记录介质。

具体实施方式

下文中，将参照附图更加全面地描述本发明，在附图中示出本发明的示例性实施例。诸如“…中的至少一个”的表达在位于一列元件之后时修饰整列元件，而非修饰列中的单个元件。

将参照图1至图6描述根据本发明的实施例的包括算术编码的视频编码方法和包括算术解码的视频解码方法。此外，将参照图7至图19描述根据本发明的实施例的基于具有树结构的编码单元的包括算术编码的视频编码方法和包括算术解码的视频解码方法。下文中，“图像”可表示视频的静止图像或运动图像(即，视频本身)。

下文中，将参照图1至图6描述基于帧内预测模式下的预测方法的根据本发明的实施例的视频编码方法和视频解码方法。

图1是根据本发明的实施例的视频编码设备10的框图。

视频编码设备10可通过帧内预测/帧间预测、变换、量化和符号编码对空域的视频数据进行编码。下文中，将详细地描述当视频编码设备10经由算术编码对通过帧内预测/帧间预测、变换和量化产生的符号进行编码时发生的操作。

视频编码设备10包括图像编码器12、符号编码器14和比特流输出单元16。

视频编码设备10可将视频的图像数据划分为多个数据单元，并根据数据单元对图像数据进行编码。数据单元可具有正方形形状或矩形形状，或者可以是任意几何形状，但是数据单元不限于具有预定尺寸的数据单元。根据基于具有树结构的编码单元的视频编码方法，数据单元可以是最大编码单元、编码单元、预测单元、变换单元等。将参照图7至图19描述在基于具有树结构的编码单元的视频编码/解码方法中使用根据本发明的实施例的算术编码/解码方法的示例。

为了便于描述，将详细地描述用于作为一种数据单元的“块”的视频编码方法。然而，根据本发明的各种实施例的视频编码方法不限于用于“块”的视频编码方法，并且可用于各种数据单元。

图像编码器12对图像块执行诸如帧内预测/帧间预测、变换或量化的操作，以产生符号。

符号编码器14基于根据当前块的尺寸确定的阈值将当前符号分类为前缀区域和后缀区域，以对根据块产生的符号中的当前符号进行编码。符号编码器14可基于当前块的宽度和高度中的至少一个来确定用于将当前符号分类为前缀区域和后缀区域的阈值。

符号编码器14可针对前缀区域和后缀区域中的每一个确定符号编码方法，并根据符号编码方法对前缀区域和后缀区域中的每一个进行编码。

符号编码可被划分为用于将符号变换为比特串的二值化处理和用于对比特串执行基于上下文的算术编码的算术编码处理。符号编码器14可针对符号的前缀区域和后缀区域中的每一个确定二值化方法，并根据二值化方法对前缀区域和后缀区域中的每一个执行二值化。可分别从前缀区域和后缀区域产生前缀比特串和后缀比特串。

可选地，符号编码器14可针对符号的前缀比特串和后缀比特串中的每一个确定算术编码方法，并根据算术编码方法对前缀比特串和后缀比特串中的每一个执行算术编码。

此外，符号编码器14可针对符号的前缀区域和后缀区域中的每一个确定二值化方法，并根据二值化方法对前缀区域和后缀区域中的每一个执行二值化，并且可针对符号的前缀比特串和后缀比特串中的每一个确定算术编码方法，并根据算术编码方法对前缀比特串和后缀比特串执行算术编码。

根据本发明的实施例的符号编码器14可针对前缀区域和后缀区域中的每一个确定二值化方法。针对前缀区域和后缀区域确定的二值化方法可以彼此不同。

符号编码器14可针对前缀比特串和后缀比特串中的每一个确定算术编码方法。针对前缀比特串和后缀比特串确定的算术编码方法可以彼此不同。

因此，符号编码器14可通过仅在符号解码处理的二值化处理中使用不同方法来对前缀区域和后缀区域进行二值化，或者可通过仅在算术编码处理中使用不同方法来对前缀比特串和后缀比特串进行编码。此外，符号编码器14可通过在二值化处理和算术编码处理中均使用不同方法来对前缀区域(前缀比特串)和后缀区域(后缀比特串)进行编码。

所选择的二值化方法可以是一般二值化方法、一元二值化方法、截断一元二值化方法、指数哥伦布(golomb)二值化方法和固定长度二值化方法中的至少一种。

符号编码器14可通过根据比特位置对前缀比特串执行用于执行上下文建模的算术编码并在旁路模式下对后缀比特串执行用于省略上下文建模的算术编码，来执行符号编码。

符号编码器14可对关于包括帧内预测模式和变换系数的最终系数位置信息中的至少一个的符号的前缀区域和后缀区域分别执行符号编码。

符号编码器14还可通过使用预先分配到前缀比特串的预定索引的上下文来执行算术编码。例如，当符号是变换系数的最终系数位置信息时，符号编码器14可通过使用预先分配到前缀比特串的比特的每个位置的预定索引的上下文，来执行算术编码。

比特流输出单元16以比特流的形式输出通过符号编码产生的比特串。

视频编码设备10可对视频的块的符号执行算术编码，并输出符号。

视频编码设备10可包括用于控制图像编码器12、符号编码器14和比特流输出单元16中的全部的中央处理器(未示出)。可选地，图像编码器12、符号编码器14和比特流输出单元16可由分别安装在它们中的处理器(未示出)操作，整个视频编码设备10可通过系统地操作这些处理器(未示出)来操作。可选地，图像编码器12、符号编码器14和比特流输出单元16可由视频编码设备10的外部处理器(未示出)来控制。

视频编码设备10可包括用于存储输入到图像编码器12、符号编码器14和比特流输出单元16的数据/从图像编码器12、符号编码器14和比特流输出单元16输出的数据的至少一个数据存储单元(未示出)。视频编码设备10可包括用于控制存储在数据存储单元(未示出)中的数据的输入/输出的存储器控制器(未示出)。

视频编码设备10通过与内部视频编码处理器或外部视频编码处理器链接来进行操作以执行包括预测和变换的视频编码，从而输出视频编码的结果。视频编码设备10的内部视频编码处理器可不仅通过使用单独的处理器，而且通过将视频编码处理模块包括在视频编码设备10、中央操作设备或图形操作设备中，来执行基本的视频编码操作。

图2是根据本发明的实施例的视频解码设备20的框图。

视频解码设备20可通过解析、符号解码、反量化、逆变换、帧内预测/运动补偿等对通过视频编码设备10编码的视频数据进行解码，并将视频数据恢复为接近于空域的原始视频数据。下文中，将描述视频解码设备20对从比特流解析的符号执行算术解码以恢复符号的处理。

视频解码设备20包括解析器22、符号解码器24和图像恢复单元26。

视频解码设备20可接收包括视频的编码数据的比特流。解析器22可从比特流解析图像块的符号。

解析器22可从比特流解析通过对视频的块进行算术编码而编码的符号。

解析器22可从接收的比特流解析包括视频的块的帧内预测模式、变换系数的最终系数位置信息等的符号。

符号解码器24确定用于将当前符号分类为前缀比特串和后缀比特串的阈值。符号解码器24可基于当前块的尺寸(即，当前块的宽度和高度中的至少一个)确定用于将当前符号分类为前缀比特串和后缀比特串的阈值。符号解码器24针对前缀比特串和后缀比特串中的每一个确定算术解码方法。符号解码器24通过使用针对前缀比特串和后缀比特串中的每一个确定的算术解码方法来执行符号解码。

针对前缀比特串和后缀比特串确定的算术解码方法可以彼此不同。

符号解码器24可针对符号的前缀比特串和后缀比特串中的每一个确定二值化方法。因此，符号解码器24可通过使用二值化方法对符号的前缀比特串执行逆二值化。针对前缀比特串和后缀比特串确定的二值化方法可以彼此不同。

此外，符号解码器24可通过使用针对符号的前缀比特串和后缀比特串中的每一个确定的算术解码方法来执行算术解码，并可通过使用针对经由算术解码产生的前缀比特串和后缀比特串中的每一个确定的二值化方法来执行逆二值化。

因此，符号解码器24可通过仅在符号解码处理的算术解码处理中使用不同方法来对前缀比特串和后缀比特串进行解码，或者可通过仅在逆二值化处理中使用不同方法来执行逆二值化。此外，符号解码器24可通过在算术解码处理和逆二值化处理中均使用不同方法来对前缀比特串和后缀比特串进行解码。

针对符号的前缀比特串和后缀比特串中的每一个确定的二值化方法不仅可以是一般二值化方法，而且可以是一元二值化方法、截断一元二值化方法、指数哥伦布二值化方法和固定长度二值化方法中的至少一种。

符号解码器24可根据比特的位置对前缀比特串执行用于执行上下文建模的算术解码。符号解码器24可在旁路模式下对后缀比特串使用用于省略上下文建模的算术解码方法。因此，符号解码器24可通过对符号的前缀比特串和后缀比特串中的每一个执行的算术解码来执行符号解码。

符号解码器24可对包括帧内预测模式和变换系数的最终系数位置信息中的至少一个的符号的前缀比特串和后缀比特串执行算术解码。

当符号是关于变换系数的最终系数位置的信息时，符号解码器24可通过使用根据前缀比特串的比特的位置预先分配的预定索引的上下文，来执行算术解码。

图像恢复单元26可通过对前缀比特串和后缀比特串中的每一个执行算术解码和逆二值化，来恢复符号的前缀区域和后缀区域。图像恢复单元26可通过将符号的前缀区域和后缀区域进行合成来恢复符号。

图像恢复单元26通过使用经由算术解码和逆二值化恢复的当前符号对当前块执行逆变换和预测。图像恢复单元26可通过使用用于每个图像块的相应符号执行诸如反量化、逆变换或帧内预测/运动补偿的操作来恢复图像块。

根据本发明的实施例的视频解码设备20可包括用于控制解析器22、符号解码器24和图像恢复单元26中的全部的中央处理器(未示出)。可选地，解析器22、符号解码器24和图像恢复单元26可由分别安装在它们中的处理器(未示出)操作，整个视频解码设备20可通过系统地操作这些处理器(未示出)来操作。可选地，解析器22、符号解码器24和图像恢复单元26可由视频解码设备20的外部处理器(未示出)来控制。

视频解码设备20可包括用于存储输入到解析器22、符号解码器24和图像恢复单元26的数据/从解析器22、符号解码器24和图像恢复单元26输出的数据的至少一个数据存储单元(未示出)。视频解码设备20可包括用于控制存储在数据存储单元(未示出)中的数据的输入/输出的存储器控制器(未示出)。

视频解码设备20通过与内部视频解码处理器或外部视频解码处理器链接来进行操作以执行包括逆变换的视频解码。视频解码设备20的内部视频解码处理器可不仅通过使用单独的处理器，而且通过将视频解码处理模块包括在视频解码设备20、中央操作设备或图形操作设备中，来执行基本的视频解码操作。

基于上下文的自适应二值化算术编码(CABAC)被广泛用作基于符号编码/解码的上下文的算术编码/解码方法。根据基于上下文的算术编码/解码，符号比特串的每个比特可以是上下文的bin，每个比特的位置可被映射到bin索引。比特串的长度(即，bin的长度)可根据符号值的大小而变化。需要用于确定符号的上下文的上下文建模以执行基于上下文的算术编码/解码。根据符号比特串的比特的位置(即，在每个bin索引中)更新上下文以执行上下文建模，因此，需要复杂的操作处理。

根据参照图1和图2描述的视频编码设备10和视频解码设备20，符号被分类为前缀区域和后缀区域，并且与前缀区域相比，可针对后缀区域使用相对简单的二值化方法。此外，对前缀比特串执行通过上下文建模的算术编码/解码，不对后缀比特串执行上下文建模，因此，可以减小基于上下文的算术编码/解码的操作量的负担。因此，视频编码设备10和视频解码设备20可在用于符号编码/解码的基于上下文的算术编码/解码期间通过对后缀区域或后缀比特串执行具有相对小量操作负担的二值化方法或者通过省略上下文建模，来提高符号编码/解码处理的效率。

下文中，将描述可由视频编码设备10和视频解码设备20执行的算术编码的各种实施例。

图3和图4是用于描述根据本发明的实施例的通过根据预定阈值将符号分类为前缀比特串和后缀比特串来进行算术编码的示图。

参照图3，将详细地描述对符号的最终系数位置信息执行根据本发明的实施例的符号编码的处理。最终系数位置信息是表示块的变换系数中的非0的最终系数的位置的符号。由于块的尺寸被定义为宽度和高度，因此最终系数位置信息可由二维坐标(即，宽度方向上的x坐标和高度方向上的y坐标)来表示。为了便于描述，图3示出了当块的宽度是w时对最终系数位置信息中的宽度方向上的x坐标执行符号编码的情况。

最终系数位置信息的x坐标的范围在块的宽度内，因此，最终系数位置信息的x坐标等于或大于0并且等于或小于w-1。对于符号的算术编码，符号可基于预定阈值th被分类为前缀区域和后缀区域。因此，可基于通过上下文建模确定的上下文对前缀区域被二值化的前缀比特串执行算术编码。此外，可在省略上下文建模的旁路模式下对后缀区域被二值化的后缀比特串执行算术编码。

这里，可基于块的宽度w确定用于将符号分类为前缀区域和后缀区域的阈值th。例如，阈值th可被确定为(w/2)-1以将比特串划分为两段(阈值确定公式1)。可选地，块的宽度w通常具有2的平方，因此，可基于宽度w的log值(阈值确定公式2)确定阈值th。

<阈值确定公式1>th＝(w/2)-1；

<阈值确定公式2>th＝(log2w<<1)-1

在图3中，根据阈值确定公式1，当块的宽度w是8时，公式给出阈值th＝(8/2)-1＝3。因此，在最终系数位置信息的x坐标中，3可被分类为前缀区域，除3之外的剩余值可被分类为后缀区域。可根据针对前缀区域和后缀区域中的每一个确定的二值化方法对前缀区域和后缀区域进行二值化。

当当前最终系数位置信息的x坐标N是5时，最终系数位置信息的x坐标可被分类为N＝th+2＝3+2。换言之，在最终系数位置信息的x坐标中，3可被分类为前缀区域，2可被分类为后缀区域。

根据本发明的实施例，可根据针对前缀区域和后缀区域确定的不同二值化方法分别对前缀区域和后缀区域进行二值化。例如，可根据一元二值化方法对前缀区域进行二值化，可根据一般二值化方法对后缀区域进行二值化。

因此，在根据一元二值化方法对3进行二值化之后，可从前缀区域产生前缀比特串32“0001”，并且在根据一般二值化方法对2进行二值化之后，可从后缀区域产生后缀比特串34“010”。

此外，可通过上下文建模对前缀比特串32“0001”执行基于上下文的算术编码。因此，可针对前缀比特串32“0001”的每个bin确定上下文索引。

可在不执行上下文建模的旁路模式下对后缀比特串34“010”执行算术编码。假设在旁路模式下每个bin具有相等概率状态的上下文(即，50％的上下文)，则可在不执行上下文建模的情况下执行算术编码。

因此，可对前缀比特串32“0001”和后缀比特串34“010”中的每一个执行基于上下文的算术编码，以完成关于当前最终系数位置信息的x坐标N的符号编码。

虽然已经描述了经由二值化和算术编码执行符号编码的实施例，但是可以以相同方式执行符号解码。换言之，可基于块的宽度w将解析的符号比特串分类为前缀比特串和后缀比特串，可通过上下文建模对前缀比特串32执行算术解码，并且可在不执行上下文建模的情况下对后缀比特串34执行算术解码。可通过使用一元二值化方法对算术解码之后的前缀比特串32执行逆二值化，可恢复前缀区域。此外，可在通过使用一般二值化方法对算术解码之后的后缀比特串34执行逆二值化，从而可恢复后缀区域。可通过将恢复的前缀区域和后缀区域进行合成来恢复符号。

虽然已经描述了一元二值化方法用于前缀区域(前缀比特串)并且一般二值化方法用于后缀区域(后缀比特串)的实施例，但是二值化方法不限于此。可选地，截断一元二值化方法可用于前缀区域(前缀比特串)，并且固定长度二值化方法可用于后缀区域(后缀比特串)。

虽然已经仅仅描述了关于块的宽度方向上的最终系数位置信息的实施例，但是还可使用关于块的高度方向上的最终系数位置信息的实施例。

此外，不需要对使用具有固定概率的上下文执行算术编码的后缀比特串执行上下文建模，但是需要对前缀比特串执行可变上下文建模。可根据块的尺寸确定将对前缀比特串执行的上下文建模。

<上下文映射表>

块尺寸	选择的上下文的Bin索引号
		4×4	0,1,2,2
8×8	3,4,5,5
		16×16	6,7,8,9,10,10,11,11
32×32	12,13,14,15,16,16,16,16,17,17,17,17,18,18,18,18

在上下文映射表中，每个数字的位置对应于前缀比特串的bin索引，数字表示将在相应比特的位置中使用的上下文索引。为了便于描述，例如，在4×4块中，前缀比特串包括总共4个比特，并且根据上下文映射表，当k是0、1、2和3时，针对第k bin索引确定上下文索引0、1、2和2，从而可执行基于上下文建模的算术编码。

图4示出帧内预测模式包括分别指示亮度块和色度块的帧内预测方向的亮度帧内模式和色度帧内模式的实施例。当帧内预测模式是6时，根据一元二值化方法产生符号比特串40“0000001”。在此情况下，可通过上下文建模对帧内预测模式的符号比特串40的第一比特41“0”执行算术编码，并且可在旁路模式下对符号比特串40的剩余比特45“000001”执行算术编码。换言之，符号比特串40的第一比特41对应于前缀比特串，符号比特串40的剩余比特45对应于后缀比特串。

可根据块的尺寸或一组块的尺寸确定符号比特串40的多少比特在算术编码中作为前缀比特串通过上下文建模被编码以及符号比特串40的多少比特在算术编码中作为后缀比特串在旁路模式下被编码。例如，关于64×64块，可仅对帧内预测模式的比特串中的第一比特执行算术编码，可在旁路模式下对剩余比特执行算术编码。关于具有其他尺寸的块，可在旁路模式下对帧内预测模式的比特串的所有比特执行算术编码。

通常，在符号比特串中，关于接近最低有效位(LSB)的比特的信息相对地没有关于接近最高有效位(MSB)的比特的信息重要。因此，视频编码设备10和视频解码设备20可针对接近MSB的前缀比特串即使存在操作量的负担也根据具有相对高精确性的二值化方法来选择算术编码方法，并可针对接近LSB的后缀比特串根据执行简单操作的二值化方法来选择算术编码方法。此外，视频编码设备10和视频解码设备20可针对前缀比特串选择基于上下文建模的算术编码方法，并可针对接近LSB的后缀比特串选择不执行上下文建模的算术编码方法。

在以上描述中，已经参照图3描述了通过使用不同方法对变换系数的最终系数位置信息的前缀比特串和后缀比特串执行二值化的实施例。此外，已经参照图4描述了通过使用不同方法对帧内预测模式的比特串中的前缀比特串和后缀比特串执行算术编码的实施例。

然而，根据本发明的各种实施例，使用针对前缀比特串和后缀比特串分别确定的二值化/算术编码方法或使用不同的二值化/算术编码方法的符号编码方法不限于参照图3和图4描述的实施例，并且可针对各种符号使用各种二值化/算术编码方法。

图5是用于描述根据本发明的实施例的视频编码方法的流程图。

在操作51，通过对图像块执行预测和变换来产生符号。

在操作53，基于根据当前块的尺寸确定的阈值将当前符号分类为前缀区域和后缀区域。

在操作55，通过使用针对符号的前缀区域和后缀区域分别确定的二值化方法来产生前缀比特串和后缀比特串。

在操作57，通过使用针对前缀比特串和后缀比特串分别确定的算术编码方法来执行符号编码。

在操作59，以比特流的形式输出通过符号编码产生的比特串。

在操作57，可通过根据比特的位置使用用于执行上下文建模的算术编码方法来对前缀比特串执行符号编码，并且还可通过在旁路模式下使用省略上下文建模的算术编码方法来对后缀比特串执行符号编码。

在操作57，当符号是变换系数的最终系数位置信息时，可通过使用预先分配到前缀比特串的比特的位置的预定索引的上下文来执行算术编码。

图6是用于描述根据本发明的实施例的视频解码方法的流程图。

在操作61，从接收的比特流解析图像块的符号。

在操作63，基于根据当前块的尺寸确定的阈值将当前符号分类为前缀比特串和后缀比特串。

在操作65，通过使用针对当前符号的前缀比特串和后缀比特串中的每一个确定的算术解码方法来执行算术解码。

在操作67，在算术解码之后，通过使用针对前缀比特串和后缀比特串中的每一个确定的二值化方法来执行逆二值化。

可通过使用针对前缀比特串和后缀比特串中的每一个确定的二值化方法执行逆二值化来恢复符号的前缀区域和后缀区域。

在操作69，可通过使用经由算术解码和逆二值化恢复的当前符号对当前块执行逆变换和预测，来恢复图像块。

在操作65，可对前缀比特串执行用于根据比特的位置确定上下文建模的算术解码，并可在旁路模式下对后缀比特串执行省略上下文建模的算术解码。

在操作65，当符号是变换系数的最终系数位置信息时，可通过使用预先分配到前缀比特串的比特的位置的预定索引的上下文来执行算术解码。

在根据本发明的实施例的视频编码设备10和根据本发明的另一实施例的视频解码设备20中，将视频数据被划分的块划分为具有树结构的编码单元，使用预测单元对编码单元执行帧内预测，并使用变换单元对编码单元进行变换。

下文中，将描述基于具有树结构的编码单元、预测单元和变换单元对视频进行编码的方法和设备以及对视频进行解码的方法和设备。

图7是根据本发明的实施例的基于具有树结构的编码单元的视频编码设备100的框图。

涉及基于具有树结构的编码单元的视频预测的视频编码设备100包括最大编码单元划分器110、编码单元确定器120和输出单元130。为了便于描述，涉及基于具有树结构的编码单元的视频预测的视频编码设备100将被称为视频编码设备100。

最大编码单元划分器110可基于用于图像的当前画面的最大编码单元来划分当前画面。如果当前画面大于最大编码单元，则当前画面的图像数据可被划分为至少一个最大编码单元。根据本发明的实施例的最大编码单元可以是具有32×32、64×64、128×128、256×256等尺寸的数据单元，其中，数据单元的形状是宽度和长度均为2的若干次方的正方形。图像数据可根据所述至少一个最大编码单元被输出到编码单元确定器120。

根据本发明的实施例的编码单元可以由最大尺寸和深度来表征。深度表示编码单元在空间上从最大编码单元被划分的次数，并且随着深度加深，根据深度的较深层编码单元可从最大编码单元被划分为最小编码单元。最大编码单元的深度是最高深度，最小编码单元的深度是最低深度。由于与每个深度相应的编码单元的尺寸随着最大编码单元的深度加深而减小，因此与更高深度相应的编码单元可包括与更低深度相应的多个编码单元。

如上所述，当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单元，并且每个最大编码单元可包括根据深度被划分的较深层编码单元。由于根据本发明的实施例的最大编码单元根据深度被划分，因此包括在最大编码单元中的空域的图像数据可根据深度被分层分类。

限制最大编码单元的高度和宽度被分层划分的总次数的编码单元的最大深度和最大尺寸可以被预先确定。

编码单元确定器120对通过根据深度划分最大编码单元的区域所获得的至少一个划分区域进行编码，并根据所述至少一个划分区域确定用于最终输出编码的图像数据的深度。换言之，编码单元确定器120通过根据当前画面的最大编码单元以根据深度的较深层编码单元对图像数据进行编码并选择具有最小编码误差的深度，来确定编码深度。将确定的编码深度和根据确定的编码深度的编码的图像数据输出到输出单元130。

基于与等于或低于最大深度的至少一个深度相应的较深层编码单元对最大编码单元中的图像数据进行编码，并且基于每个较深层编码单元比较对图像数据进行编码的结果。在比较较深层编码单元的编码误差之后，可选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。

随着编码单元根据深度被分层划分，并且随着编码单元的数量增加，最大编码单元的尺寸被划分。此外，即使编码单元在一个最大编码单元中对应于相同深度，也通过分别测量每个编码单元的图像数据的编码误差来确定是否将与该相同深度相应的编码单元中的每一个划分到更低的深度。因此，即使当图像数据被包括在一个最大编码单元中时，图像数据也被划分为根据深度的区域，并且编码误差可根据所述一个最大编码单元中的区域而不同，因此，编码深度可根据图像数据中的区域而不同。因此，可在一个最大编码单元中确定一个或更多个编码深度，并且可根据至少一个编码深度的编码单元划分最大编码单元的图像数据。

因此，编码单元确定器120可确定包括在最大编码单元中的具有树结构的编码单元。根据本发明的实施例的“具有树结构的编码单元”包括包含在最大编码单元中的所有较深层编码单元中的与被确定为编码深度的深度相应的编码单元。编码深度的编码单元可在最大编码单元的相同区域中根据深度被分层确定，并且可在不同区域中被独立地确定。类似地，当前区域中的编码深度可独立于另一区域中的编码深度而被确定。

根据本发明的实施例的最大深度是与从最大编码单元到最小编码单元执行划分的次数相关的索引。根据本发明的实施例的第一最大深度可表示从最大编码单元到最小编码单元执行划分的总次数。根据本发明的实施例的第二最大深度可表示从最大编码单元到最小编码单元的深度级的总数。例如，当最大编码单元的深度是0时，最大编码单元被划分一次的编码单元的深度可被设置为1，最大编码单元被划分两次的编码单元的深度可被设置为2。这里，如果最小编码单元是最大编码单元被划分四次的编码单元，则存在深度为0、1、2、3和4的5个深度级，因此，第一最大深度可被设置为4，第二最大深度可被设置为5。

可根据最大编码单元执行预测编码和变换。根据最大编码单元，还基于根据等于最大深度的深度或小于最大深度的深度的较深层编码单元执行预测编码和变换。

由于每当最大编码单元根据深度被划分时较深层编码单元的数量增加，因此对随着深度加深产生的所有较深层编码单元执行包括预测编码和变换的编码。为了便于描述，现在将基于最大编码单元中的当前深度的编码单元描述预测编码和变换。

视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码，执行诸如预测编码、变换和熵编码的操作，此时，可针对所有操作使用相同的数据单元，或者可针对每个操作使用不同的数据单元。

例如，视频编码设备100可不仅选择用于对图像数据进行编码的编码单元，而且选择与编码单元不同的数据单元，以对编码单元中的图像数据执行预测编码。

为了在最大编码单元中执行预测编码，可基于与编码深度相应的编码单元(即，基于不再被划分为与更低深度相应的编码单元的编码单元)执行预测编码。下文中，不再被划分并且变为用于预测编码的基本单元的编码单元现在将被称为“预测单元”。通过划分预测单元所获得的分区可包括通过划分预测单元的高度和宽度中的至少一个所获得的预测单元或数据单元。分区是具有编码单元的预测单元被划分的形状的数据单元，并且预测单元可以是与编码单元具有相同尺寸的分区。

例如，当2N×2N(其中，N是正整数)的编码单元不再被划分并且变为2N×2N的预测单元时，分区的尺寸可以是2N×2N、2N×N、N×2N或N×N。分区类型的示例包括通过对称地划分预测单元的高度或宽度所获得的对称分区、通过非对称地划分预测单元的高度或宽度(诸如1:n或n:1)所获得的分区、通过在几何上划分预测单元所获得的分区以及具有任意形状的分区。

预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一种。例如，可对2N×2N、2N×N、N×2N或N×N的分区执行帧内模式或帧间模式。此外，可仅对2N×2N的分区执行跳过模式。在编码单元中对一个预测单元独立地执行编码，从而选择具有最小编码误差的预测模式。

视频编码设备100还可不仅基于用于对图像数据进行编码的编码单元而且基于与编码单元不同的数据单元来对编码单元中的图像数据执行变换。为了在编码单元中执行变换，可基于具有小于或等于编码单元的尺寸的变换单元来执行变换。例如，变换单元可包括用于帧内模式的变换单元和用于帧间模式的变换单元。

与编码单元类似地，编码单元中的变换单元可递归地被划分为更小尺寸的区域。因此，可以按照根据变换深度的具有树结构的变换单元来划分编码单元中的残差数据。

还可在变换单元中设置指示通过划分编码单元的高度和宽度而执行划分以达到变换单元的次数的变换深度。例如，在2N×2N的当前编码单元中，当变换单元的尺寸也是2N×2N时，变换深度可以是0，当变换单元尺寸是N×N时，变换深度可以是1，当变换单元尺寸是N/2×N/2时，变换深度可以是2。换言之，可根据变换深度设置具有树结构的变换单元。

根据与编码深度相应的编码单元的编码信息不仅需要关于编码深度的信息，而且需要与预测编码和变换相关的信息。因此，编码单元确定器120不仅确定具有最小编码误差的编码深度，而且确定预测单元中的分区类型、根据预测单元的预测模式以及用于变换的变换单元的尺寸。

稍后将参照图7至图19详细地描述根据本发明的实施例的最大编码单元中的根据树结构的编码单元以及确定预测单元/分区和变换单元的方法。

编码单元确定器120可通过使用基于拉格朗日乘子的率失真优化，来测量根据深度的较深层编码单元的编码误差。

输出单元130以比特流形式输出基于由编码单元确定器120确定的至少一个编码深度被编码的最大编码单元的图像数据以及关于根据编码深度的编码模式的信息。

可通过对图像的残差数据进行编码来获得编码的图像数据。

关于根据编码深度的编码模式的信息可包括关于编码深度、预测单元中的分区类型、预测模式和变换单元的尺寸的信息。

关于编码深度的信息可通过使用根据深度的划分信息来定义，其表示是否对更低深度(而非当前深度)的编码单元执行编码。如果当前编码单元的当前深度是编码深度，则当前编码单元中的图像数据被编码和输出，因此，划分信息可被定义为不将当前编码单元划分到更低深度。可选地，如果当前编码单元的当前深度不是编码深度，则对更低深度的编码单元执行编码，因此，划分信息可被定义为划分当前编码单元以获得更低深度的编码单元。

如果当前深度不是编码深度，则对被划分为更低深度的编码单元的编码单元执行编码。由于在当前深度的一个编码单元中存在更低深度的至少一个编码单元，因此，对更低深度的每个编码单元重复地执行编码，从而可针对具有相同深度的编码单元递归地执行编码。

由于针对一个最大编码单元确定具有树结构的编码单元，并且针对编码深度的编码单元确定关于至少一个编码模式的信息，因此，可针对一个最大编码单元确定关于至少一个编码模式的信息。此外，最大编码单元的图像数据的编码深度可根据位置而不同，这是因为图像数据根据深度被分层划分，因此，可针对图像数据设置关于编码深度和编码模式的信息。

因此，输出单元130可将关于相应的编码深度和编码模式的编码信息分配到包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。

根据本发明的实施例的最小单元是通过将构成最低深度的最小编码单元划分为四个所获得的矩形数据单元。可选地，最小单元可以是可被包括在在最大编码单元中包括的所有的编码单元、预测单元、分区单元和变换单元中的最大矩形数据单元。

例如，通过输出单元130输出的编码信息可被分类为根据编码单元的编码信息和根据预测单元的编码信息。根据编码单元的编码信息可包括关于预测模式的信息和关于分区的尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息和关于帧内模式的插值方法的信息。此外，关于根据画面、条带或画面组(GOP)定义的编码单元的最大尺寸的信息以及关于最大深度的信息可被插入序列参数集(SPS)或画面参数集(PPS)中。

此外，关于对当前视频允许的变换单元的最大尺寸的信息以及关于变换单元的最小尺寸的信息可经由比特流的头、SPS或PPS输出。输出单元130可对与以上参照图1至图6描述的预测相关的参考信息、单方向预测信息、包括第四条带类型的条带类型信息等进行编码和输出。

在视频编码设备100中，较深层编码单元可以是通过将上述的作为一层的更高深度的编码单元的高度或宽度划分两次所获得的编码单元。换言之，当当前深度的编码单元的尺寸是2N×2N时，更低深度的编码单元的尺寸是N×N。此外，具有2N×2N尺寸的当前深度的编码单元可包括最多四个更低深度的编码单元。

因此，视频编码设备100可通过基于考虑当前画面的特性确定的最大深度和最大编码单元的尺寸针对每个最大编码单元确定具有最佳形状和最佳尺寸的编码单元，来形成具有树结构的编码单元。此外，由于可通过使用各种预测模式和变换中的任何一种对每个最大编码单元执行编码，因此可考虑各种图像尺寸的编码单元的特性来确定最佳编码模式。

因此，如果具有高分辨率或大数据量的图像以传统宏块被编码，则对于每个画面宏块的数量过度增加。因此，针对每个宏块产生的压缩信息的条数增加，从而难以发送压缩信息，并且数据压缩效率降低。然而，通过使用视频编码设备100，图像压缩效率可以提高，这是因为在考虑图像的特性时调整编码单元，同时在考虑图像的尺寸时增大编码单元的最大尺寸。

图7的视频编码设备100可执行参照图1描述的视频编码设备10的操作。

编码单元确定器120可执行视频编码设备10的图像编码器12的操作。编码单元确定器120可针对每个最大编码单元根据具有树结构的编码单元确定用于帧内预测的预测单元，在每个预测单元中执行帧内预测，确定用于变换的变换单元，并在每个变换单元中执行变换。

输出单元130可执行视频编码设备10的符号编码单元14和比特流输出单元16的操作。产生用于各种数据单元(诸如画面、条带、最大编码单元、编码单元、预测单元和变换单元)的符号，根据基于相应数据单元的尺寸确定的阈值将每个符号分类为前缀区域和后缀区域。输出单元130可通过使用针对符号的前缀区域和后缀区域中的每一个确定的二值化方法来产生前缀比特串和后缀比特串。选择一般二值化、一元二值化、截断一元二值化、指数哥伦布二值化和固定长度二值化中的任何一个来对前缀区域和后缀区域进行二值化，从而产生前缀比特串和后缀比特串。

输出单元130可通过执行针对前缀比特串和后缀比特串中的每一个确定的算术编码来执行符号编码。输出单元130可通过对前缀比特串执行用于根据比特的位置执行上下文建模的算术编码并通过在旁路模式下对后缀比特串执行省略上下文建模的算术编码，来执行符号编码。

例如，当变换单元的变换系数的最终系数位置信息被编码时，可根据变换单元的尺寸(宽度或高度)确定用于分类前缀比特串和后缀比特串的阈值。可选地，可根据包括当前变换单元、最大编码单元、编码单元、预测单元等的条带的尺寸来确定阈值。

可选地，可通过帧内预测模式的最大索引确定帧内预测模式下的符号比特串的多少比特在算术编码中作为前缀比特串通过上下文建模被编码以及符号比特串的多少比特在算术编码中作为后缀比特串在旁路模式下被编码。例如，可对于具有8×8、16×16和32×32尺寸的预测单元使用总共34个帧内预测模式，可对于具有4×4尺寸的预测单元使用总共17个帧内预测模式，可对于具有64×64尺寸的预测单元使用总共3个帧内预测模式。在此情况下，由于能够使用相同数量的帧内预测模式的预测单元被视为具有相似的统计特性，因此帧内预测模式下的比特串中的第一比特可通过上下文建模被编码以针对具有8×8、16×16和32×32尺寸的预测单元进行算术编码。此外，帧内预测模式下的比特串中的所有比特可在旁路模式下被编码以针对剩余的预测单元(即，具有4×4和64×64尺寸的预测单元)进行算术编码。

输出单元130可以以比特流的形式输出通过符号编码产生的比特串。

图8是根据本发明的实施例的基于具有树结构的编码单元的视频解码设备200的框图。

基于具有树结构的编码单元执行视频预测的视频解码设备200包括接收器210、图像数据和编码信息提取器220以及图像数据解码器230。

用于视频解码设备200的各种操作的诸如编码单元、深度、预测单元、变换单元和关于各种编码模式的信息的各种术语的定义与参照图7描述的术语和视频编码设备100的术语的定义相同。

接收器210接收并解析编码视频的比特流。图像数据和编码信息提取器220从解析的比特流提取用于每个编码单元的编码的图像数据，并将提取的图像数据输出到图像数据解码器230，其中，编码单元具有根据每个最大编码单元的树结构。图像数据和编码信息提取器220可从关于当前画面的头或SPS或PPS提取关于当前画面的编码单元的最大尺寸的信息。

此外，图像数据和编码信息提取器220从解析的比特流提取关于编码深度和编码模式的信息，其中，所述编码深度和编码模式用于具有根据每个最大编码单元的树结构的编码单元。提取的关于编码深度和编码模式的信息被输出到图像数据解码器230。换言之，比特串中的图像数据被划分为最大编码单元，从而图像数据解码器230针对每个最大编码单元对图像数据进行解码。

可针对关于与编码深度相应的至少一个编码单元的信息来设置关于根据最大编码单元的编码深度和编码模式的信息，并且关于编码模式的信息可包括关于与编码深度相应的相应编码单元的分区类型的信息、关于预测模式的信息以及关于变换单元的尺寸的信息。此外，可提取根据深度的划分信息，作为关于编码深度的信息。

由图像数据和编码信息提取器220提取的关于根据每个最大编码单元的编码深度和编码模式的信息是关于如下编码深度和编码模式的信息，所述编码深度和编码模式被确定为当编码器(诸如视频编码设备100)根据每个最大编码单元针对根据深度的每个较深层编码单元重复地执行编码时产生最小编码误差。因此，视频解码设备200可通过根据产生最小编码误差的编码深度和编码模式对图像数据进行解码来恢复图像。

由于关于编码深度和编码模式的编码信息可被分配到相应编码单元、预测单元和最小单元中的预定数据单元，因此图像数据和编码信息提取器220可根据预定数据单元提取关于编码深度和编码模式的信息。分配有关于编码深度和编码模式的相同信息的预定数据单元可被推断为包括在相同最大编码单元中的数据单元。

图像数据解码器230通过基于关于根据最大编码单元的编码深度和编码模式的信息对每个最大编码单元中的图像数据进行解码，来恢复当前画面。换言之，图像数据解码器230可基于提取的关于包括在每个最大编码单元中的具有树结构的编码单元中的每个编码单元的分区类型、预测模式和变换单元的信息，来对编码的图像数据进行解码。解码处理可包括包含帧内预测和运动补偿的预测以及逆变换。

图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的预测模式和分区类型的信息，根据每个编码单元的预测模式和分区来执行帧内预测或运动补偿。

此外，图像数据解码器230可基于关于根据具有树结构的编码单元的变换单元的信息，根据编码单元中的每个变换单元来执行逆变换，从而根据最大编码单元执行逆变换。可通过逆变换恢复编码单元中的空域的像素值。

图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的至少一个编码深度。如果划分信息指示图像数据在当前深度中不再被划分，则当前深度是编码深度。因此，图像数据解码器230可通过使用关于与编码深度相应的每个编码单元的预测单元的分区类型、预测模式和变换单元尺寸的信息，对当前最大编码单元中的与每个编码深度相应的至少一个编码单元的编码数据进行解码，并输出当前最大编码单元的图像数据。

换言之，可通过观察为编码单元、预测单元和最小单元中的预定数据单元分配的编码信息集来收集包含包括相同划分信息的编码信息的数据单元，并且收集的数据单元可被视为将在相同编码模式下被图像数据解码器230解码的一个数据单元。可通过获得关于以这种方式确定的每个编码单元的编码模式的信息，来执行当前编码单元的解码。

此外，图8的视频解码设备200可执行以上参照图2描述的视频解码设备20的操作。

接收器210以及图像数据和编码信息提取器220可执行视频解码设备20的解析器22和符号解码器24的操作。图像数据解码器230可执行视频解码设备20的符号解码器24的操作。

接收器210接收图像的比特流，图像数据和编码信息提取器220从接收的比特流解析图像块的符号。

图像数据和编码信息提取器220可基于根据当前块的尺寸确定的阈值将当前符号分类为前缀比特串和后缀比特串。例如，当变换单元的变换系数的最终系数位置信息被解码时，可根据变换单元的尺寸(宽度或高度)确定用于分类前缀比特串和后缀比特串的阈值。可选地，可根据包括当前变换单元、最大编码单元、编码单元、预测单元等的条带的尺寸确定阈值。可选地，可通过帧内预测模式的最大索引确定在帧内预测模式下的符号比特串的多少比特在算术编码中作为前缀比特串通过上下文建模被编码以及符号比特串的多少比特在算术编码中作为后缀比特串在旁路模式下被编码。

通过使用针对当前符号的前缀比特串和后缀比特串中的每一个确定的算术解码方法来执行算术解码。可对前缀比特串执行用于根据比特位置确定上下文建模的算术解码，并可通过使用旁路模式对后缀比特串执行省略上下文建模的算术解码。

在算术解码之后，根据针对前缀比特串和后缀比特串中的每一个确定的二值化方法来执行逆二值化。可通过根据针对前缀比特串和后缀比特串中的每一个确定的二值化方法执行逆二值化，来恢复符号的前缀区域和后缀区域。

图像数据解码器230可通过使用经由算术解码和逆二值化恢复的当前符号对当前块执行逆变换和预测，来恢复图像块。

因此，当针对每个最大编码单元递归地执行编码时，视频解码设备200可获得关于产生最小编码误差的至少一个编码单元的信息，并可使用该信息来对当前画面进行解码。换言之，在每个最大编码单元中被确定为最佳编码单元的具有树结构的编码单元可被解码。

因此，即使图像数据具有高分辨率和大量数据，也可通过使用关于从编码器接收的最佳编码模式的信息，通过使用根据图像数据的特性自适应地确定的编码单元的尺寸和编码模式来对图像数据有效地进行解码并恢复图像数据。

图9是根据本发明的实施例的编码单元的概念图。

编码单元的尺寸可被表示为宽度×高度，并且可以是64×64、32×32、16×16和8×8。64×64的编码单元可被划分为64×64、64×32、32×64或32×32的分区，32×32的编码单元可被划分为32×32、32×16、16×32或16×16的分区，16×16的编码单元可被划分为16×16、16×8、8×16或8×8的分区，8×8的编码单元可被划分为8×8、8×4、4×8或4×4的分区。

在视频数据310中，分辨率是1920×1080，编码单元的最大尺寸是64，最大深度是2。在视频数据320中，分辨率是1920×1080，编码单元的最大尺寸是64，最大深度是3。在视频数据330中，分辨率是352×288，编码单元的最大尺寸是16，最大深度是1。图9中示出的最大深度表示从最大编码单元到最小解码单元的划分总数。

如果分辨率高或数据量大，则编码单元的最大尺寸可以大，从而不但提高编码效率，而且精确地反映图像的特性。因此，具有比视频数据330更高分辨率的视频数据310和320的编码单元的最大尺寸可以是64。

由于视频数据310的最大深度是2，因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元以及因通过将最大编码单元划分两次而深度加深到两层的长轴尺寸为32和16的编码单元。同时，由于视频数据330的最大深度是1，因此视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元以及因通过将最大编码单元划分一次而深度加深到一层的长轴尺寸为8的编码单元。

由于视频数据320的最大深度是3，因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元以及因通过将最大编码单元划分三次而深度加深到3层的长轴尺寸为32、16和8的编码单元。随着深度加深，可精确表示详细信息。

图10是根据本发明的实施例的基于编码单元的图像编码器400的框图。

图像编码器400执行视频编码设备100的编码单元确定器120的操作以对图像数据进行编码。换言之，帧内预测器410对当前帧405中的处于帧内模式下的编码单元执行帧内预测，运动估计器420和运动补偿器425通过使用当前帧405和参考帧495对当前帧405中的处于帧间模式下的编码单元执行帧间估计和运动补偿。

从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430和量化器440被输出为量化的变换系数。量化的变换系数通过反量化器460和逆变换器470被恢复为空域中的数据，恢复的空域中的数据在通过去块单元480和环路滤波单元490进行后处理之后被输出为参考帧495。量化的变换系数可通过熵编码器450被输出为比特流455。

为了将图像编码器400应用在视频编码设备100中，图像编码器400的所有元件(即，帧内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器450、反量化器460、逆变换器470、去块单元480和环路滤波单元490)在考虑每个最大编码单元的最大深度时基于具有树结构的编码单元中的每个编码单元来执行操作。

具体地，帧内预测器410、运动估计器420和运动补偿器425在考虑当前最大编码单元的最大尺寸和最大深度时确定具有树结构的编码单元中的每个编码单元的分区和预测模式，并且变换器430确定具有树结构的编码单元中的每个编码单元中的变换单元尺寸。

具体地讲，熵编码器450可通过根据预定阈值将符号分类为前缀区域和后缀区域并针对前缀区域和后缀区域使用不同的二值化和算术编码方法，来对前缀区域和后缀区域执行符号编码。

可基于符号的数据单元(即，条带、最大编码单元、编码单元、预测单元、变换单元等)的尺寸来确定用于将符号分类为前缀区域和后缀区域的阈值。

图11是根据本发明的实施例的基于编码单元的图像解码器500的框图。

解析器510从比特流505解析将被解码的编码的图像数据和解码所需的关于编码的信息。编码的图像数据通过熵解码器520和反量化器530被输出为反量化的数据，反量化的数据通过逆变换器540被恢复为空域中的图像数据。

帧内预测器550针对空域中的图像数据对处于帧内模式下的编码单元执行帧内预测，运动补偿器560通过使用参考帧585对处于帧间模式下的编码单元执行运动补偿。

通过帧内预测器550和运动补偿器560的空域中的图像数据在通过去块单元570和环路滤波单元580进行后处理之后可被输出为恢复帧595。此外，通过去块单元570和环路滤波单元580进行后处理的图像数据可被输出为参考帧585。

为了在视频解码设备200的图像数据解码器230中对图像数据进行解码，图像解码器500可执行在解析器510之后执行的操作。

为了将图像解码器500应用在视频解码设备200中，图像解码器500的所有元件(即，解析器510、熵解码器520、反量化器530、逆变换器540、帧内预测器550、运动补偿器560、去块单元570和环路滤波单元580)基于针对每个最大编码单元的具有树结构的编码单元来执行操作。

具体地，帧内预测器550和运动补偿器560基于具有树结构的编码单元中的每个编码单元的分区和预测模式来执行操作，并且逆变换器540基于每个编码单元的变换单元的尺寸来执行操作。

具体地讲，熵解码器520可通过根据预定阈值将解析的符号比特串分类为前缀比特串和后缀比特串并针对前缀比特串和后缀比特串使用不同的二值化和算术解码方法，来对前缀比特串和后缀比特串中的每一个执行符号解码。

可基于符号的数据单元(即，条带、最大编码单元、编码单元、预测单元、变换单元等)的尺寸来确定用于将符号比特串分类为前缀比特串和后缀比特串的阈值。

图12是示出根据本发明的实施例的根据深度的较深层编码单元和分区的示图。

视频编码设备100和视频解码设备200使用分层编码单元，以便考虑图像的特性。编码单元的最大高度、最大宽度和最大深度可根据图像的特性适应性地确定，或者可由用户不同地设置。根据深度的较深层编码单元的尺寸可根据编码单元的预定最大尺寸来确定。

在根据本发明的实施例的编码单元的分层结构600中，编码单元的最大高度和最大宽度均为64，最大深度为4。这里，最大深度表示从最大编码单元到最小编码单元执行划分的总次数。由于深度沿分层结构600的纵轴加深，因此较深层编码单元的高度和宽度均被划分。此外，沿分层结构600的横轴示出作为用于每个较深层编码单元的预测编码的基础的预测单元或分区。

换言之，在分层结构600中，编码单元610是最大编码单元，其中，深度为0，尺寸(即，高度×宽度)为64×64。深度沿纵轴加深，存在尺寸为32×32且深度为1的编码单元620、尺寸为16×16且深度为2的编码单元630、尺寸为8×8且深度为3的编码单元640以及尺寸为4×4且深度为4的编码单元650。尺寸为4×4且深度为4的编码单元650是最小编码单元。

编码单元的预测单元和分区根据每个深度沿横轴排列。换言之，如果尺寸为64×64且深度为0的编码单元610是预测单元，则该预测单元可被划分为包括在编码单元610中的分区，即，尺寸为64×64的分区610、尺寸为64×32的分区612、尺寸为32×64的分区614或尺寸为32×32的分区616。

类似地，尺寸为32×32且深度为1的编码单元620的预测单元可被划分为包括在编码单元620中的分区，即，尺寸为32×32的分区620、尺寸为32×16的分区622、尺寸为16×32的分区624和尺寸为16×16的分区626。

类似地，尺寸为16×16且深度为2的编码单元630的预测单元可被划分为包括在编码单元630中的分区，即，包括在编码单元630中的尺寸为16×16的分区、尺寸为16×8的分区632、尺寸为8×16的分区634和尺寸为8×8的分区636。

类似地，尺寸为8×8且深度为3的编码单元640的预测单元可被划分为包括在编码单元640中的分区，即，包括在编码单元640中的尺寸为8×8的分区、尺寸为8×4的分区642、尺寸为4×8的分区644和尺寸为4×4的分区646。

尺寸为4×4且深度为4的编码单元650是最小编码单元和最低深度的编码单元。编码单元650的预测单元仅被分配到尺寸为4×4的分区。

为了确定构成最大编码单元610的编码单元的至少一个编码深度，视频编码设备100的编码单元确定器120针对包括在最大编码单元610中的与每个深度相应的编码单元执行编码。

包括相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量随着深度加深而增加。例如，需要与深度2相应的四个编码单元以涵盖在与深度1相应的一个编码单元中包括的数据。因此，为了比较根据深度的相同数据的编码结果，与深度1相应的编码单元和与深度2相应的四个编码单元均被编码。

为了针对深度中的当前深度执行编码，可通过针对沿分层结构600的横轴的与当前深度相应的编码单元中的每个预测单元执行编码来针对当前深度选择最小编码误差。可选地，可通过针对随深度沿分层结构600的纵轴加深的每个深度执行编码，通过将根据深度的最小编码误差进行比较来搜索最小编码误差。编码单元610中的具有最小编码误差的深度和分区可被选择为编码单元610的编码深度和分区类型。

图13是用于描述根据本发明的实施例的编码单元和变换单元之间的关系的示图。

视频编码设备100或视频解码设备200针对每个最大编码单元根据尺寸小于或等于最大编码单元的编码单元来对图像进行编码或解码。可基于不大于相应编码单元的数据单元来选择在编码期间用于变换的变换单元的尺寸。

例如，在视频编码设备100或视频解码设备200中，如果编码单元710的尺寸是64×64，则可通过使用尺寸为32×32的变换单元720来执行变换。

此外，可通过对小于64×64的尺寸为32×32、16×16、8×8和4×4的变换单元中的每一个执行变换来对尺寸为64×64的编码单元710的数据进行编码，并随后可选择具有最小编码误差的变换单元。

图14是用于描述根据本发明的实施例的根据深度的编码单元的编码信息的示图。

视频编码设备100的输出单元130可对针对与编码深度相应的每个编码单元的关于分区类型的信息800、关于预测模式的信息810和关于变换单元的尺寸的信息820进行编码，并发送信息800、信息810和信息820，作为关于编码模式的信息。

信息800指示关于通过将当前编码单元的预测单元进行划分所获得的分区的形状的信息，其中，分区是用于对当前编码单元进行预测编码的数据单元。例如，尺寸为2N×2N的当前编码单元CU_0可被划分为尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806和尺寸为N×N的分区808中的任何一个。这里，关于分区类型的信息800被设置为指示尺寸为2N×N的分区804、尺寸为N×2N的分区806和尺寸为N×N的分区808之一。

信息810指示每个分区的预测模式。例如，信息810可指示对由信息800指示的分区执行的预测编码的模式，即，帧内模式812、帧间模式814或跳过模式816。

信息820指示当对当前编码单元执行变换时所基于的变换单元。例如，变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧间变换单元828。

视频解码设备200的图像数据和编码信息提取器220可根据每个较深层编码单元提取信息800、810和820，并且使用信息800、810和820来进行解码。

图15是示出根据本发明的实施例的根据深度的较深层编码单元的示图。

划分信息可被用于指示深度的改变。划分信息指示当前深度的编码单元是否被划分为更低深度的编码单元。

用于对深度为0且尺寸为2N_0×2N_0的编码单元900进行预测编码的预测单元910可包括如下分区类型的分区：尺寸为2N_0×2N_0的分区类型912、尺寸为2N_0×N_0的分区类型914、尺寸为N_0×2N_0的分区类型916和尺寸为N_0×N_0的分区类型918。图15仅示出通过将预测单元910进行对称划分所获得的分区类型912至918，但是分区类型不限于此，预测单元910的分区可包括非对称分区、具有预定形状的分区和具有几何形状的分区。

根据每个分区类型，对尺寸为2N_0×2N_0的一个分区、尺寸为2N_0×N_0的两个分区、尺寸为N_0×2N_0的两个分区和尺寸为N_0×N_0的四个分区重复地执行预测编码。可对尺寸为2N_0×2N_0、N_0×2N_0、2N_0×N_0和N_0×N_0的分区执行帧内模式和帧间模式下的预测编码。仅对尺寸为2N_0×2N_0的分区执行跳过模式下的预测编码。

将在分区类型912至918中包括预测编码的编码的误差进行比较，并且在分区类型中确定最小编码误差。如果编码误差在分区类型912至916之一中最小，则预测单元910可不被划分到更低深度。

如果编码误差在分区类型918中最小，则深度从0改变到1以在操作920划分分区类型918，并对深度为2且尺寸为N_0×N_0的编码单元930重复地执行编码以搜索最小编码误差。

用于对深度为1且尺寸为2N_1×2N_1(＝N_0×N_0)的编码单元930进行预测编码的预测单元940可包括如下分区类型的分区：尺寸为2N_1×2N_1的分区类型942、尺寸为2N_1×N_1的分区类型944、尺寸为N_1×2N_1的分区类型946和尺寸为N_1×N_1的分区类型948。

如果编码误差在分区类型948中最小，则深度从1改变到2以在操作950划分分区类型948，并对深度为2且尺寸为N_2×N_2的编码单元960重复地执行编码以搜索最小编码误差。

当最大深度为d时，可执行根据每个深度的编码单元，直到深度变为d-1，并且可对划分信息进行编码，直到深度为0至d-2之一。换言之，当执行编码直到在与深度d-2相应的编码单元在操作970被划分之后深度为d-1时，用于对深度为d-1且尺寸为2N_(d-1)×2N_(d-1)的编码单元980进行预测编码的预测单元990可包括如下分区类型的分区：尺寸为2N_(d-1)×2N_(d-1)的分区类型992、尺寸为2N_(d-1)×N_(d-1)的分区类型994、尺寸为N_(d-1)×2N_(d-1)的分区类型996和尺寸为N_(d-1)×N_(d-1)的分区类型998。

可对分区类型992至998中的尺寸为2N_(d-1)×2N_(d-1)的一个分区、尺寸为2N_(d-1)×N_(d-1)的两个分区、尺寸为N_(d-1)×2N_(d-1)的两个分区、尺寸为N_(d-1)×N_(d-1)的四个分区重复地执行预测编码，以搜索具有最小编码误差的分区类型。

即使当分区类型998具有最小编码误差时，由于最大深度为d，因此深度为d-1的编码单元CU_(d-1)也不再被划分到更低深度，并且构成当前最大编码单元900的编码单元的编码深度被确定为d-1，且当前最大编码单元900的分区类型可被确定为N_(d-1)×N_(d-1)。此外，由于最大深度为d且具有最低深度d-1的最小编码单元980不再被划分到更低深度，因此不设置用于最小编码单元980的划分信息。

数据单元999可以是针对当前最大编码单元的“最小单元”。根据本发明的实施例的最小单元可以是通过将最小编码单元980划分为四个所获得的矩形数据单元。通过重复地执行编码，视频编码设备100可通过将根据编码单元900的深度的编码误差进行比较来选择具有最小编码误差的深度以确定编码深度，并将相应分区类型和预测模式设置为编码深度的编码模式。

如此，在所有深度1至d中比较根据深度的最小编码误差，并且具有最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型和预测模式可作为关于编码模式的信息被编码和发送。此外，由于编码单元从深度0被划分到编码深度，因此仅编码深度的划分信息被设置为0，除了编码深度之外的深度的划分信息被设置为1。

视频解码设备200的图像数据和编码信息提取器220可提取和使用关于编码深度的信息以及编码单元900的预测单元，以对分区912进行解码。视频解码设备200可通过使用根据深度的划分信息来将划分信息为0的深度确定为编码深度，并使用关于相应深度的编码模式的信息来进行解码。

图16至图18是用于描述根据本发明的实施例的编码单元、预测单元和变换单元之间的关系的示图。

编码单元1010是最大编码单元中的与由视频编码设备100确定的编码深度相应的具有树结构的编码单元。预测单元1060是编码单元1010中的每一个的预测单元的分区，变换单元1070是编码单元1010中的每一个的变换单元。

当在编码单元1010中最大编码单元的深度为0时，编码单元1012和1054的深度为1、编码单元1014、1016、1018、1028、1050和1052的深度为2、编码单元1020、1022、1024、1026、1030、1032和1048的深度为3，编码单元1040、1042、1044和1046的深度为4。

在预测单元1060中，通过对编码单元1010中的编码单元进行划分来获得一些编码单元1014、1016、1022、1032、1048、1050、1052和1054。换言之，编码单元1014、1022、1050和1054中的分区类型具有尺寸2N×N，编码单元1016、1048和1052中的分区类型具有尺寸N×2N，编码单元1032中的分区类型具有尺寸N×N。编码单元1010的预测单元和分区小于或等于每个编码单元。

在小于编码单元1052的数据单元中对变换单元1070中的编码单元1052的图像数据执行变换或逆变换。此外，变换单元1070中的编码单元1014、1016、1022、1032、1048、1050和1052在尺寸和形状方面不同于预测单元1060中的编码单元1014、1016、1022、1032、1048、1050和1052。换言之，视频编码设备100和视频解码设备200可对相同编码单元中的数据单元单独地执行帧内预测、运动估计、运动补偿、变换和逆变换。

因此，在最大编码单元的每个区域中对具有分层结构的编码单元中的每一个递归地执行编码，以确定最佳编码单元，从而可获得具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区类型的信息、关于预测模式的信息以及关于变换单元的尺寸的信息。表1示出了可由视频编码设备100和视频解码设备200设置的编码信息。

表1

视频编码设备100的输出单元130可输出关于具有树结构的编码单元的编码信息，视频解码设备200的图像数据和编码信息提取器220可从接收的比特流提取关于具有树结构的编码单元的编码信息。

划分信息指示当前编码单元是否被划分为更低深度的编码单元。如果当前深度d的划分信息是0，则当前编码单元不再被划分到更低深度的深度是编码深度，因此可针对编码深度定义关于分区类型、预测模式和变换单元的尺寸的信息。如果当前编码单元根据划分信息被进一步划分，则对更低深度的四个划分的编码单元独立地执行编码。

预测模式可以是帧内模式、帧间模式和跳过模式之一。可在所有分区类型中定义帧内模式和帧间模式，仅在尺寸为2N×2N的分区类型中定义跳过模式。

关于分区类型的信息可指示通过将预测单元的高度或宽度进行对称划分所获得的尺寸为2N×2N、2N×N、N×2N和N×N的对称分区类型以及通过将预测单元的高度或宽度进行非对称划分所获得的尺寸为2N×nU、2N×nD、nL×2N和nR×2N的非对称分区类型。可通过按照1:3和3:1将预测单元的高度进行划分而分别获得尺寸为2N×nU和2N×nD的非对称分区类型，可通过按照1:3和3:1将预测单元的宽度进行划分而分别获得尺寸为nL×2N和nR×2N的非对称分区类型。

变换单元尺寸可被设置为帧内模式下的两种类型和帧间模式下的两种类型。换言之，如果变换单元的划分信息是0，则变换单元尺寸可以是作为当前编码单元的尺寸的2N×2N。如果变换单元的划分信息是1，则可通过划分当前编码单元来获得变换单元。此外，如果尺寸为2N×2N的当前编码单元的分区类型是对称分区类型，则变换单元的尺寸可以是N×N，而如果当前编码单元的分区类型是非对称分区类型，则变换单元尺寸可以是N/2×N/2。

关于具有树结构的编码单元的编码信息可包括与编码深度相应的编码单元、预测单元和最小单元中的至少一个。与编码深度相应的编码单元可包括预测单元和最小单元中的至少一个，所述预测单元和最小单元包含相同的编码信息。

因此，通过比较邻近数据单元的编码信息来确定邻近数据单元是否包括在与编码深度相应的相同编码单元中。此外，通过使用数据单元的编码信息来确定与编码深度相应的相应编码单元，从而可确定最大编码单元中的编码深度的分布。

因此，如果当前编码单元基于邻近数据单元的编码信息被预测，则可直接参考和使用与当前编码单元邻近的较深层编码单元中的数据单元的编码信息。

可选地，如果当前编码单元基于邻近数据单元的编码信息被预测，则使用数据单元的编码信息来搜索与当前编码单元邻近的数据单元，并可参考搜索到的邻近编码单元来对当前编码单元进行预测。

图19是用于描述根据表1的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图。

最大编码单元1300包括编码深度的编码单元1302、1304、1306、1312、1314、1316和1318。这里，由于编码单元1318是编码深度的编码单元，因此划分信息可被设置为0。关于尺寸为2N×2N的编码单元1318的分区类型的信息可被设置为如下分区类型之一：尺寸为2N×2N的分区类型1322、尺寸为2N×N的分区类型1324、尺寸为N×2N的分区类型1326、尺寸为N×N的分区类型1328、尺寸为2N×nU的分区类型1332、尺寸为2N×nD的分区类型1334、尺寸为nL×2N的分区类型1336和尺寸为nR×2N的分区类型1338。

变换单元的划分信息(TU尺寸标记)是一种变换索引，并且与变换索引相应的变换单元尺寸可根据编码单元的预测单元或分区的类型而变化。

例如，当分区类型被设置为对称(即，分区类型1322、1324、1326或1328)时，如果变换单元的划分信息是0，则设置尺寸为2N×2N的变换单元1342，如果TU尺寸标记是1，则设置尺寸为N×N的变换单元1344。

当分区类型被设置为非对称(即，分区类型1332、1334、1336或1338)时，如果TU尺寸标记是0，则设置尺寸为2N×2N的变换单元1352，如果TU尺寸标记是1，则设置尺寸为N/2×N/2的变换单元1354。

参照图19，TU尺寸标记是具有值0或1的标记，但是TU尺寸标记不限于1比特，在TU尺寸标记从0增加时，变换单元可被分层划分为具有树结构。TU尺寸标记可被用作变换索引的实施例。

在此情况下，如果变换单元的划分信息与最大变换单元尺寸和最小变换单元尺寸一起使用，则可表示实际使用的变换单元尺寸。视频编码设备100可对最大变换单元尺寸信息、最小变换单元尺寸信息和最大变换单元划分信息进行编码。编码的最大变换单元尺寸信息、最小变换单元尺寸信息和最大变换单元划分信息可被插入SPS中。视频解码设备200可通过使用最大变换单元尺寸信息、最小变换单元尺寸信息和最大变换单元划分信息来执行视频解码。

例如，如果当前编码单元具有64×64的尺寸并且最大变换单元尺寸是32×32，则当变换单元划分信息是0时，变换单元尺寸可被设置为32×32，当变换单元划分信息是1时，变换单元尺寸可被设置为16×16，当变换单元划分信息是2时，变换单元尺寸可被设置为8×8。

可选地，如果当前编码单元具有32×32的尺寸并且最小变换单元尺寸是32×32，则当变换单元划分信息是1时，变换单元尺寸可被设置为32×32，并且由于变换单元尺寸等于或大于32×32，因此不可设置更多的变换单元划分信息。

可选地，如果当前编码单元具有64×64的尺寸并且最大变换单元划分信息是1，则变换单元划分信息可被设置为0或1，并且不可设置其他的变换单元划分信息。

因此，当变换单元划分信息是0时，如果最大变换单元划分信息被定义为“MaxTransformSizeIndex”，如果最小变换单元尺寸被定义为“MinTransformSize”，并且如果变换单元尺寸被定义为“RootTuSize”，则在当前编码单元中可用的最小变换单元尺寸“CurrMinTuSize”可通过下面的公式(1)来定义。

CurrMinTuSize

＝max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex))...(1)

与在当前编码单元中可用的最小变换单元尺寸“CurrMinTuSize”相比，当变换单元划分信息为0时的变换单元尺寸“RootTuSize”可表示可在系统中采用的最大变换单元尺寸。换言之，根据公式(1)，“RootTuSize/(2^MaxTransformSizeIndex)”是“RootTuSize”被划分与最大变换单元划分信息相应的次数的变换单元尺寸，“MinTransformSize”是最小变换单元尺寸，因此，“RootTuSize/(2^MaxTransformSizeIndex)”和“MinTransformSize”中的较小的值可以是在当前编码单元中可用的最小变换单元尺寸“CurrMinTuSize”。

最大变换单元尺寸“RootTuSize”可根据预测模式而变化。

例如，如果当前预测模式是帧间模式，则“RootTuSize”可通过下面的公式(2)来确定。在公式(2)中，“MaxTransformSize”表示最大变换单元尺寸，“PUSize”表示当前预测单元尺寸。

RootTuSize＝min(MaxTransformSize,PUSize).........(2)

换言之，如果当前预测模式是帧间模式，则当变换单元划分信息是0时的变换单元尺寸“RootTuSize”可被设置为最大变换单元尺寸和当前预测单元尺寸中的较小的值。

如果当前分区单元的预测模式是帧内模式，则“RootTuSize”可通过下面的公式(3)来确定。“PartitionSize”表示当前分区单元尺寸。

RootTuSize＝min(MaxTransformSize,PartitionSize)...........(3)

换言之，如果当前预测模式是帧内模式，则“RootTuSize”可被设置为最大变换单元尺寸和当前分区单元尺寸中的较小的值。

然而，根据分区单元的预测模式而变化的当前最大变换单元尺寸“RootTuSize”仅是示例，用于确定当前最大变换单元尺寸的因子不限于此。

通过使用基于以上参照图7至图19描述的具有树结构的编码单元的视频编码方法，针对具有树结构的每个编码单元对空域的图像数据进行编码，并且通过使用基于具有树结构的编码单元的视频解码方法，对每个最大编码单元执行解码，因此，空域的图像数据得到恢复，从而恢复作为画面和画面序列的视频。恢复的视频可通过再现设备再现，可存储在存储介质中，或者可经由网络传送。

本发明的实施例可被写为计算机程序，并且可被实现在使用计算机可读记录介质执行程序的通用数字计算机中。计算机可读记录介质的示例包括磁存储介质(例如，ROM、软盘、硬盘等)和光记录介质(例如，CD-ROM或DVD)。

尽管已经参照本发明的优选实施例具体示出和描述了本发明，但是本领域的普通技术人员将理解，在不脱离由权利要求限定的本发明的精神和范围的情况下，可对其进行形式和细节上的各种改变。优选实施例应仅被视为描述性意义，而非为了限制的目的。因此，本发明的范围不是由本发明的具体实施方式限定的，而是由权利要求限定的，并且在所述范围内的所有差异将被解释为包括在本发明中。

Claims

1.一种对视频进行解码的设备，所述设备包括：

接收器，被配置为接收包括关于变换块的最后一个有效系数位置的信息的比特流；

算术解码器，被配置为：对从关于最后一个有效系数位置的信息分类出的最后一个有效系数位置的前缀符号执行基于上下文的算术解码来获得前缀比特串，并且对从关于最后一个有效系数位置的信息分类出的最后一个有效系数位置的后缀符号执行旁路模式算术解码来获得后缀比特串，其中，所述前缀符号和所述后缀符号是基于预定阈值从关于最后一个有效系数位置的信息被分类出的；

逆二值化器，被配置为：根据截断二值化方案对所述前缀比特串执行逆二值化来获得逆二值化的前缀，并根据固定长度二值化方案对所述后缀比特串执行逆二值化来获得逆二值化的后缀；

符号重建器，被配置为：通过使用所述逆二值化的前缀和所述逆二值化的后缀来重建指示变换块的最后一个有效系数位置的符号，

其中：

基于从比特流解析出的最大编码块的尺寸信息，图像被划分为多个最大编码块；

通过使用从比特流解析出的编码块划分信息，最大编码块之一被分层划分为至少一个编码块，

包括所述变换块的至少一个变换块是通过使用从比特流解析出的变换块划分信息从当前编码块被分层划分出的，

对所述前缀符号进行的基于上下文的算术解码是通过使用基于变换块的尺寸和所述前缀比特串的比特位置而确定的上下文索引来执行的，

当前变换块的最后一个有效系数位置是通过将所述逆二值化的前缀和所述逆二值化的后缀进行组合来重建的，

关于最后一个有效系数位置的信息的范围在变换块的尺寸内，并且所述预定阈值是基于变换块的尺寸来确定的。

2.一种对视频进行编码的方法，所述方法包括：

将图像划分为多个最大编码块；

将最大编码块之一分层划分为至少一个编码块；

确定从所述至少一个编码块之中的当前编码块分层划分出的至少一个变换块；

产生指示所述至少一个变换块之中的变换块的最后一个有效系数位置的符号；

基于阈值将符号分类为符号的前缀和符号的后缀，其中，所述阈值是基于当前块的尺寸被确定的；

根据截断二值化方案对符号的前缀执行二值化来产生前缀比特串；

根据固定长度二值化方案对符号的后缀执行二值化来产生后缀比特串；

对所述前缀比特串执行基于上下文的算术编码来产生关于最后一个有效系数位置的前缀的信息；

对所述后缀比特串执行旁路模式算术编码来产生关于最后一个有效系数位置的后缀的信息，

其中，基于上下文的算术编码是通过使用基于变换块的尺寸和所述前缀比特串的比特位置而确定的上下文索引来执行的。

3.一种对视频进行编码的设备，所述设备包括：

编码器，被配置为：将图像划分为多个最大编码块，将最大编码块之一分层划分为至少一个编码块，确定从所述至少一个编码块之中的当前编码块分层划分出的至少一个变换块，产生指示所述至少一个变换块之中的变换块的最后一个有效系数位置的符号，并基于阈值将符号分类为符号的前缀和符号的后缀，其中，所述阈值是基于当前块的尺寸被确定的；

符号二值化器，被配置为：根据截断二值化方案对符号的前缀执行二值化来产生前缀比特串，并根据固定长度二值化方案对符号的后缀执行二值化来产生后缀比特串；

算术编码器，被配置为：对前缀比特串执行基于上下文的算术编码来产生关于最后一个有效系数位置的前缀的信息，并对后缀比特串执行旁路模式算术编码来产生关于最后一个有效系数位置的后缀的信息，

其中，图像被划分为多个最大编码块；

最大编码块之一被分层划分为至少一个编码块；

包括所述变换块的至少一个变换块是从所述至少一个编码块之中的当前编码块被分层划分出的；

基于上下文的算术编码是通过使用基于变换块的尺寸和前缀比特串的比特位置而确定的上下文索引来执行的。