CN112369022A - 图像编码/解码方法和装置以及存储比特流的记录介质 - Google Patents

图像编码/解码方法和装置以及存储比特流的记录介质 Download PDF

Info

Publication number
CN112369022A
CN112369022A CN201980043248.7A CN201980043248A CN112369022A CN 112369022 A CN112369022 A CN 112369022A CN 201980043248 A CN201980043248 A CN 201980043248A CN 112369022 A CN112369022 A CN 112369022A
Authority
CN
China
Prior art keywords
block
partition
current block
information
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980043248.7A
Other languages
English (en)
Inventor
林成昶
姜晶媛
李镇浩
李河贤
金晖容
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Publication of CN112369022A publication Critical patent/CN112369022A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Abstract

在本说明书中,公开了一种图像解码方法。本发明的图像解码方法包括:对包括在当前画面中的当前块的块分区信息进行解码;根据块分区信息确定当前块的分区方案;以及使用确定的分区方案对当前块进行分区,其中,根据当前块是否包括当前画面的边界来确定分区方案。

Description

图像编码/解码方法和装置以及存储比特流的记录介质
技术领域
本发明涉及一种图像编码/解码方法和设备以及存储比特流的记录介质。更具体地,本发明涉及一种基于块结构的图像编码/解码方法和设备以及存储比特流的记录介质。
背景技术
近来,在各种应用领域中,对高分辨率和高质量图像(诸如高清晰度(HD)图像和超高清晰度(UHD)图像)的需求已经增加。然而,与传统的图像数据相比,更高分辨率和更高质量的图像数据具有增加的数据量。因此,当通过使用诸如传统的有线和无线宽带网络的介质发送图像数据时,或者当通过使用传统的存储介质存储图像数据时,发送和存储的成本增加。为了解决随着图像数据的分辨率和质量的提高而出现的这些问题,对于更高分辨率和更高质量的图像,需要高效率的图像编码/解码技术。
图像压缩技术包括各种技术,包括:帧间预测技术,从当前画面的先前画面或后续画面来预测包括在当前画面中的像素值;帧内预测技术,通过使用当前画面中的像素信息来预测包括在当前画面中的像素值;变换和量化技术,用于压缩残差信号的能量;熵编码技术,将短码分配给具有高出现频率的值并且将长码分配给具有低出现频率的值,等等。图像数据可以通过使用这样的图像压缩技术被有效地压缩,并且可以被发送或存储。
在传统的视频编码/解码中,由于仅使用四叉树块结构,因此存在在提高编码效率方面存在限制的问题。
发明内容
技术问题
本发明的目的是提供一种能够提高压缩效率的图像编码/解码方法和设备,以及提供一种存储由所述方法或设备产生的比特流的记录介质。
本发明的另一目的是提供一种能够通过使用具有各种宽高比(即,水平与垂直的比率)的块形状来提高压缩效率的图像编码/解码方法和设备,以及提供一种存储由所述方法或设备产生的比特流的记录介质。
本发明的又一目的是提供一种能够通过依据当前块的编码参数和邻近块的编码参数确定是否使用邻近块作为当前块的参考块来提高压缩效率的图像编码/解码方法和设备,以及提供一种存储由所述方法或设备产生的比特流的记录介质。
技术方案
根据本发明,图像解码方法包括:对包括在当前画面中的当前块的块分区信息进行解码;根据块分区信息确定当前块的分区方案;以及使用确定的分区方案对当前块进行分区,其中,根据当前块是否包括当前画面的边界来确定分区方案。
在所述图像解码方法中,其中,分区方案是从四叉树分区、水平二叉树分区、垂直二叉树分区、水平三叉树分区和垂直三叉树分区中选择的任何一种方案。
在所述图像解码方法中,其中,在当前块包括当前画面的右侧边界时,分区方案被确定为垂直二叉树分区。
在所述图像解码方法中,其中,在当前块的高度超过当前块内的最大变换块的尺寸时,分区方案被确定为除垂直二叉树分区之外的任何一种分区方案。
在所述图像解码方法中,其中,最大变换块的尺寸是预定义值。
在所述图像解码方法中,其中,在当前块包括当前画面的下方边界时,分区方案被确定为水平二叉树分区。
在所述图像解码方法中,其中,在当前块的宽度超过当前画面内的最大变换块的尺寸时,分区方案被确定为除水平二叉树分区之外的任何一种分区方案。
在所述图像解码方法中,其中,最大变换块的尺寸是预设值。
在所述图像解码方法中,其中,在当前块至少包括当前画面的右侧边界或左侧边界时,块分区方案被确定为除三叉树分区之外的任何一种方案。
在所述图像解码方法中,其中,在当前块包括当前画面的右侧边界和左侧边界时,分区方案被确定为四叉树分区。
根据本发明,图像编码方法包括:确定包括在当前画面中的当前块的分区方案;使用确定的分区方案对当前块进行分区;以及对当前块的块分区信息进行编码,其中,根据当前块是否包括当前画面的边界来确定分区方案。
在所述图像编码方法中,其中,分区方案是从四叉树分区、水平二叉树分区、垂直二叉树分区、水平三叉树分区和垂直三叉树分区中选择的任何一种方案。
在所述图像编码方法中,其中,在当前块包括当前画面的右边界时,分区方案被确定为垂直二叉树分区。
在所述图像编码方法中,其中,在当前块的高度超过当前画面内的最大变换块的尺寸时,分区方案被确定为除垂直二叉树分区之外的任何一种方案。
在所述图像编码方法中,其中,最大变换块的尺寸是预定义值。
在所述视频编码方法中,其中,在当前块包括当前画面的下方边界时,分区方案被确定为水平二叉树分区。
在所述图像编码方法中,其中,在当前块的宽度超过当前画面内的最大变换块的尺寸时,分区方案被确定为除水平二叉树分区之外的任何一种方案。
在所述图像编码方法中,其中,最大变换块的尺寸是预设值。
在所述图像编码方法中,其中,在当前块至少包括当前画面的右侧边界或左侧边界时,分区方案被确定为除三叉树分区之外的任何一种方案。
在所述图像编码方法中,其中,在当前块包括当前画面的右侧边界和左侧边界时,分区方案被确定为四叉树分区。
根据本发明,提供了一种存储由图像解码设备接收以重建当前块的比特流的计算机可读记录介质,其中,比特流包含当前块的块分区信息,块分区信息用于确定当前块的分区方案,被确定为当前块的分区方案的分区方案被用于对当前块进行分区,并且分区方案是根据当前块是否包括当前画面的边界而确定的。
有益效果
根据本发明,可以提供一种能够提高压缩效率的图像编码/解码方法和设备,并且可以提供一种存储由所述方法或设备产生的比特流的记录介质。
另外,根据本发明,可以提供一种能够通过使用具有各种宽高比的块形状来提高压缩效率的图像编码/解码方法和设备,以及提供一种存储由所述方法或设备产生的比特流的记录介质。
另外,根据本发明,可以提供一种能够通过依据当前块的编码参数和邻近块的编码参数确定是否使用邻近块作为当前块的参考块来提高压缩效率的图像编码/解码方法和设备,并且可以提供一种存储由所述方法或设备产生的比特流的记录介质。
附图说明
图1是示出应用本发明的编码设备的配置的框图。
图2是示出应用本发明的解码设备的配置的框图。
图3是示意性地示出当对图像进行编码和解码时的分区结构的示图。
图4是示出帧内预测的示例的示图。
图5是示出帧间预测的示例的示图。
图6是示出变换和量化的示例的示图。
图7是示出可用于帧内预测的参考样点的示图。
图8a至图8c是示出根据本发明的一个实施例的图像编码/解码方法的流程图;
图9和图10是示出根据本发明的一个实施例的将与当前块相邻的邻近块插入候选列表的方法的示图;
图11和图12是示出根据本发明的一个实施例的依据当前块和邻近块之间的边界的长度将与当前块相邻的邻近块插入候选列表的方法的示图;
图13和图14是示出根据本发明一个实施例的依据邻近块的尺寸将与当前块相邻的邻近块插入候选列表的方法的示图;
图15和图16是示出根据本发明一个实施例的依据邻近块的深度将与当前块相邻的邻近块插入候选列表的方法的示图;
图17和图18是示出根据本发明实施例的依据邻近块的分区树类型将与当前块相邻的邻近块插入候选列表的方法的示图;
图19和图20是示出根据本发明一个实施例的依据邻近块的块形式将与当前块相邻的邻近块插入候选列表的方法的示图;
图21是示出根据本发明的一个实施例的按照对邻近块进行编码/解码的顺序将邻近块插入候选列表中的方法的示图;
图22是示出根据本发明的一个实施例的依据与当前块的位置间隔特定距离的邻近块的位置将邻近块插入候选列表的方法的示图;
图23是示出根据本发明的一个实施例的依据与从当前画面、子画面、条带、并行块和分块中选择的至少一个的位置间隔开特定距离的邻近块的位置将邻近块插入候选列表中的方法的示图;
图24是示出根据本发明的一个实施例的画面、子画面、条带、并行块和分块的边界的示图;
图25是示出根据本发明的一个实施例的块划分方案的示图。
具体实施方式
可以对本发明进行各种修改,并且存在本发明的各种实施例,其中,现在将参照附图来提供本发明的各种实施例的示例并对其进行详细描述。然而,本发明不限于此,尽管示例性实施例可被解释为包括本发明的技术构思和技术范围内的所有修改、等同或替代。在各个方面,相似的附图标号指代相同或相似的功能。在附图中,为了清楚,可夸大元件的形状和尺寸。在本发明的以下详细描述中,参照了附图,其中,附图以图示的方式示出了可实践本发明的特定实施例。足够详细地描述了这些实施例以使本领域技术人员能够实施本公开。应当理解的是,本公开的各种实施例尽管不同,但不一定是互斥的。例如,在不脱离本公开的精神和范围的情况下,结合一个实施例在此描述的特定特征、结构和特性可在其他实施例中被实现。另外,应当理解,在不脱离本公开的精神和范围的情况下,可修改每个公开的实施例内的各个元件的位置或布置。因此,以下详细描述不应被视为具有限制意义,并且本公开的范围仅由所附权利要求(在合适的解释的情况下,还连同权利要求所要求保护的等同物的全部范围)来限定。
说明书中使用的术语“第一”、“第二”等可用于描述各种组件,但是组件不应解释为限于这些术语。这些术语仅用于区分一个组件与其他组件。例如,在不脱离本发明的范围的情况下,“第一”组件可被命名为“第二”组件,并且“第二”组件也可被类似地命名为“第一”组件。术语“和/或”包括多个项的组合或多个项中的任意一项。
将理解的是,在本说明书中,当元件被简单称为“连接到”或“耦接到”另一元件而不是“直接连接到”或“直接耦接到”另一元件时,元件可“直接连接到”另一元件或“直接耦接到”另一元件,或者在元件与另一元件之间介入有其他元件的情况下连接到或耦接到另一元件。相反,应当理解,当元件被称为“直接耦接”或“直接连接”到另一元件时,不存在中间元件。
另外,本发明的实施例中所示的构成部分被独立地示出,以表示彼此不同的特征功能。因此,这并不表示每个构成部分都以单独的硬件或软件的构成单元构成。换言之,为了方便,每个构成部分包括列举的构成部分中的每个。因此,每个构成部分的至少两个构成部分可被组合以形成一个构成部分,或者一个构成部分可被划分为多个构成部分以执行每种功能。如果没有脱离本发明的实质,则将每个构成部分被组合的实施例和一个构成部分被划分的实施例也包括在本发明的范围内。
本说明书中使用的术语仅用于描述特定实施例,而不旨在限制本发明。除非在上下文中具有明显不同的含义,否则以单数形式使用的表述包括复数形式的表述。在本说明书中,将理解,诸如“包括”、“具有”等的术语旨在指示存在说明书中公开的特征、数字、步骤、动作、元件、部件或其组合,而并不旨在排除可存在或可添加一个或更多个其他特征、数字、步骤、动作、元件、部件或其组合的可能性。换言之,当特定元素被称为“被包括”时,并不排除除了相应元素之外的元素,而是可在本发明的实施例或本发明的范围中包括另外的元素。
另外,某些构成部分可能不是执行本发明的基本功能的必不可少的构成部分,而是仅提高其性能的选择性构成部分。可通过仅包括用于实现本发明的本质的必不可少的构成部分而不包括用于提高性能的构成部分来实现本发明。仅包括必不可少的构成部分而不包括仅用于提高性能的选择性构成部分的结构也包括在本发明的范围内。
在下文中,将参照附图详细描述本发明的实施例。在描述本发明的示例性实施例时,将不详细描述公知的功能或构造,因为它们可能不必要地模糊对本发明的理解。附图中相同的构成元件由相同的附图标号表示,并且对相同元件的重复描述将被省略。
在下文中,图像可指构成视频的画面,或者可指视频本身。例如,“对图像进行编码或解码或者进行编码和解码两者”可指“对运动画面进行编码或解码或者进行编码和解码两者”,并且可指“对运动画面的图像中的一个图像进行编码或解码或者进行编码和解码两者”。
在下文中,术语“运动画面”和“视频”可用作相同的含义并且可彼此替换。
在下文中,目标图像可以是作为编码目标的编码目标图像和/或作为解码目标的解码目标图像。另外,目标图像可以是输入到编码设备的输入图像、以及输入到解码设备的输入图像。这里,目标图像可与当前图像具有相同的含义。
在下文中,术语“图像”、“画面”、“帧”和“屏幕”可被用作相同的含义并且可彼此替换。
在下文中,目标块可以是作为编码目标的编码目标块和/或作为解码目标的解码目标块。另外,目标块可以是作为当前编码和/或解码的目标的当前块。例如,术语“目标块”和“当前块”可被用作相同的含义并且可彼此替换。
在下文中,术语“块”和“单元”可被用作相同的含义并且可彼此替换。或者“块”可表示特定单元。
在下文中,术语“区域”和“片段”可彼此替换。
在下文中,特定信号可以是表示特定块的信号。例如,原始信号可以是表示目标块的信号。预测信号可以是表示预测块的信号。残差信号可以是表示残差块的信号。
在实施例中,特定信息、数据、标志、索引、元素和属性等中的每个可具有值。信息、数据、标志、索引、元素和属性的值等于“0”可表示逻辑假或第一预定义值。换言之,值“0”、假、逻辑假和第一预定义值可彼此替换。信息、数据、标志、索引、元素和属性的值等于“1”可表示逻辑真或第二预定义值。换句话说,值“1”、真、逻辑真和第二预定义值可彼此替换。
当变量i或j用于表示列、行或索引时,i的值可以是等于或大于0的整数,或者是等于或大于1的整数。即,列、行、索引等可从0开始计数,或者可从1开始计数。
术语描述
编码器:表示执行编码的设备。即,表示编码设备。
解码器:表示执行解码的设备。即,表示解码设备。
块:是M×N的样点阵列。这里,M和N可表示正整数,并且块可表示二维形式的样点阵列。块可指单元。当前块可表示在编码时成为目标的编码目标块,或者在解码时成为目标的解码目标块。另外,当前块可以是编码块、预测块、残差块和变换块中的至少一个。
样点:是构成块的基本单元。根据比特深度(Bd),样点可被表示为从0到2Bd-1的值。在本发明中,样点可被用作像素的含义。即,样点、pel、像素可具有彼此相同的含义。
单元:可指编码和解码单元。当对图像进行编码和解码时,单元可以是通过对单个图像进行分区而产生的区域。另外,当在编码或解码期间将单个图像分区为子划分单元时,单元可表示子划分单元。即,图像可被分区为多个单元。当对图像进行编码和解码时,可以执行针对每个单元的预定处理。单个单元可被分区为尺寸小于该单元的尺寸的子单元。依据功能,单元可表示块、宏块、编码树单元、编码树块、编码单元、编码块、预测单元、预测块、残差单元、残差块、变换单元、变换块等。另外,为了将单元与块区分开,单元可包括亮度分量块、与亮度分量块相关联的色度分量块、以及每个颜色分量块的语法元素。单元可具有各种尺寸和形状,具体地,单元的形状可以是二维几何图形,诸如正方形、矩形、梯形、三角形、五边形等。另外,单元信息可包括指示编码单元、预测单元、变换单元等的单元类型以及单元尺寸、单元深度、单元的编码和解码的顺序等中的至少一个。
编码树单元:被配置有亮度分量Y的单个编码树块以及与色度分量Cb和Cr相关的两个编码树块。另外,编码树单元可表示包括块和每个块的语法元素。可通过使用四叉树分区方法、二叉树分区方法和三叉树分区方法中的至少一个对每个编码树单元进行分区,以配置诸如编码单元、预测单元、变换单元等的更低等级的单元。编码树单元可被用作用于指定在对作为输入图像的图像进行编码/解码时成为处理单元的样点块的术语。这里,四叉树可表示四元树。
当编码块的尺寸在预定范围内时,可以仅使用四叉树分区进行划分。这里,预定范围可被定义为能够仅使用四叉树分区进行划分的编码块的最大尺寸和最小尺寸中的至少一个。可通过比特流用信号发送指示允许四叉树分区的编码块的最大/最小尺寸的信息,并且可在序列、画面参数、并行块组或条带(片段)中的至少一个单元中用信号发送所述信息。可选地,编码块的最大/最小尺寸可以是编码器/解码器中预定的固定尺寸。例如,当编码块的尺寸与256×256至64×64相应时,仅使用四叉树分区来进行划分是可能的。可选地,当编码块的尺寸大于最大转换块的尺寸时,仅使用四叉树分区来进行划分是可能的。这里,将被划分的块可以是编码块和变换块中的至少一个。在这种情况下,指示编码块的划分的信息(例如,split_flag)可以是指示是否执行四叉树分区的标志。当编码块的尺寸落在预定范围内时,仅使用二叉树或三叉树分区来进行划分是可能的。在这种情况下,四叉树分区的以上描述可以以相同方式被应用于二叉树分区或三叉树分区。
编码树块:可用作用于指定Y编码树块、Cb编码树块和Cr编码树块中的任意一个的术语。
邻近块:可表示与当前块相邻的块。与当前块相邻的块可表示与当前块的边界接触的块、或者位于距当前块预定距离内的块。邻近块可表示与当前块的顶点相邻的块。这里,与当前块的顶点相邻的块可表示与水平相邻于当前块的邻近块垂直相邻的块、或者与垂直相邻于当前块的邻近块水平相邻的块。
重建邻近块:可表示与当前块相邻并且已经在空间/时间上被编码或解码的邻近块。这里,重建邻近块可表示重建邻近单元。重建空间邻近块可以是在当前画面内并且已经通过编码或解码或者编码和解码两者而被重建块。重建时间邻近块是在参考图像内的与当前画面的当前块相应的位置处的块或所述块的邻近块。
单元深度:可表示单元的分区程度。在树结构中,最高节点(根节点)可与未被分区的第一单元相应。另外,最高节点可具有最小深度值。在这种情况下,最高节点的深度可以为等级0。深度为等级1的节点可表示通过对第一单元进行一次分区而产生的单元。深度为等级2的节点可表示通过对第一单元进行两次分区而产生的单元。深度为等级n的节点可表示通过对第一单元进行n次分区而产生的单元。叶节点可以是最低节点并且是不能被进一步分区的节点。叶节点的深度可以是最大等级。例如,最大等级的预定义值可以是3。根节点的深度可以是最低的,并且叶节点的深度可以是最深的。另外,当单元被表示为树结构时,单元所存在于的等级可表示单元深度。
比特流:可表示包括编码图像信息的比特流。
参数集:与比特流内的配置之中的头信息相应。视频参数集、序列参数集、画面参数集和自适应参数集中的至少一个可被包括在参数集中。此外,参数集可包括条带(slice)头、并行块(tile)组头和并行块头信息。术语“并行块组”表示一组并行块并且具有与条带相同的含义。
自适应参数集是指可由不同画面、子画面、条带、并行块组、并行块或分块共享和参考的参数集。另外,画面中的子画面、条带、并行块组、并行块或分块可指不同自适应参数集以使用不同自适应参数集中的信息。
关于自适应参数集,画面中的子画面、条带、并行块组、并行块或分块可通过使用相应自适应参数集的标识符来指代不同的自适应参数集。
关于自适应参数集,子画面中的条带、并行块组、并行块或分块可通过使用相应自适应参数集的标识符来指代不同的自适应参数集。
关于自适应参数集,条带中的并行块或分块可以通过使用相应自适应参数集的标识符来指代不同的自适应参数集。
关于自适应参数集,并行块中的分块可以通过使用相应自适应参数集的标识符来指代不同的自适应参数集。
子画面的参数集或头可以包括关于自适应参数集标识符的信息。因此,可以在子画面中使用与自适应参数集标识符相应的自适应参数集。
并行块的参数集或头可以包括自适应参数集标识符,使得可以在并行块中使用与自适应参数集标识符相应的自适应参数集。
分块的头可以包括关于自适应参数集标识符的信息,使得可以在分块中使用与自适应参数集标识符相应的自适应参数集。
画面可被划分为一个或更多个并行块行以及一个或更多个并行块列。
画面中的子画面可被划分为一个或更多个并行块行以及一或更多个并行块列。子画面可以是画面中的矩形区域或正方形区域,并且可包括一个或更多个CTU。子画面可包括至少一个并行块、分块和/或条带。
并行块可以是画面中的矩形区域或正方形区域,并且可包括一个或更多个CTU。并行块可以被划分为一个或更多个分块。
分块可指并行块中的一或多个CTU行。并行块可以被划分为一个或更多个分块,并且每个分块可以具有至少一个CTU行。未被划分为两个或更多个块的并行块也可以表示分块。
条带可包括画面中的一个或更多个并行块,并且可包括并行块中的一个或更多个分块。
解析:可表示通过执行熵解码来确定语法元素的值,或者可表示熵解码本身。
符号:可表示编码/解码目标单元的语法元素、编码参数和变换系数值中的至少一个。此外,符号可表示熵编码目标或熵解码结果。
预测模式:可以是指示利用帧内预测而被编码/解码的模式或利用帧间预测而被编码/解码的模式的信息。
预测单元:可表示当执行预测(诸如帧间预测、帧内预测、帧间补偿、帧内补偿和运动补偿)时的基本单元。单个预测单元可被分区为具有更小尺寸的多个分区,或者可被分区为多个更低等级的预测单元。多个分区可以是在执行预测或补偿时的基本单元。通过划分预测单元而产生的分区也可以是预测单元。
预测单元分区:可表示通过对预测单元进行分区而获得的形状。
参考画面列表可指包括用于帧间预测或运动补偿的一个或更多个参考画面的列表。存在若干类型的可用的参考画面列表,包括LC(列表组合)、L0(列表0)、L1(列表1)、L2(列表2)、L3(列表3)。
帧间预测指示符可以指当前块的帧间预测的方向(单向预测、双向预测等)。可选地,帧间预测指示符可指用于产生当前块的预测块的参考画面的数量。可选地,帧间预测指示符可指在对当前块进行帧间预测或运动补偿时使用的预测块的数量。
预测列表利用标志指示是否使用特定参考画面列表中的至少一个参考画面来产生预测块。可使用预测列表利用标志来推导帧间预测指示符,并且相反地,可使用帧间预测指示符来推导预测列表利用标志。例如,当预测列表利用标志具有第一值零(0)时,它表示参考画面列表中的参考画面不被用于产生预测块。另一方面,当预测列表利用标志具有第二值一(1)时,它表示参考画面列表被用于产生预测块。
参考画面索引可指指示参考画面列表中的特定参考画面的索引。
参考画面可表示由特定块参考以用于特定块的帧间预测或运动补偿的目的的参考画面。可选地,参考画面可以是包括由当前块参考以用于帧间预测或运动补偿的参考块的画面。在下文中,术语“参考画面”和“参考图像”具有相同的含义并且可以互换。
运动矢量可以是用于帧间预测或运动补偿的二维矢量。运动矢量可表示编码/解码目标块与参考块之间的偏移。例如,(mvX,mvY)可表示运动矢量。这里,mvX可以表示水平分量,并且mvY可以表示垂直分量。
搜索范围可以是在帧间预测期间被搜索以检索运动矢量的二维区域。例如,搜索范围的尺寸可以是M×N。这里,M和N都是整数。
运动矢量候选可以指在对运动矢量进行预测时的预测候选块或预测候选块的运动矢量。另外,运动矢量候选可以被包括在运动矢量候选列表中。
运动矢量候选列表可表示由一个或更多个运动矢量候选组成的列表。
运动矢量候选索引可表示指示运动矢量候选列表中的运动矢量候选的指示符。可选地,它可以是运动矢量预测因子的索引。
运动信息可表示包括包括运动矢量、参考画面索引、帧间预测指示符、预测列表利用标志、参考画面列表信息、参考画面、运动矢量候选、运动矢量候选索引、合并候选和合并索引中的至少一项的信息。
合并候选列表可表示由一或更多个合并候选组成的列表。
合并候选可表示空间合并候选、时间合并候选、组合合并候选、组合双预测合并候选或零合并候选。合并候选可以包括诸如帧间预测指示符、每个列表的参考画面索引、运动矢量、预测列表利用标志和帧间预测指示符的运动信息。
合并索引可表示指示合并候选列表中的合并候选的指示符。可选地,合并索引可指示在空间上/时间上与当前块相邻的重建块中的块,其中,已从该块推导出合并候选。可选地,合并索引可指示合并候选的至少一条运动信息。
变换单元:可表示在对残差信号执行编码/解码(诸如变换、逆变换、量化、反量化、变换系数编码/解码)时的基本单元。单个变换单元可被分区为具有更小尺寸的多个更低等级的变换单元。这里,变换/逆变换可包括首次变换/首次逆变换和第二次变换/第二次逆变换中的至少一个。
缩放:可表示将量化的等级乘以因子的处理。可通过对量化的等级进行缩放来产生变换系数。缩放也可被称为反量化。
量化参数:可表示当在量化期间使用变换系数来产生量化的等级时使用的值。量化参数还可表示当在反量化期间通过对量化的等级进行缩放来产生变换系数时使用的值。量化参数可以是被映射在量化步长上的值。
增量量化参数:可表示预测的量化参数与编码/解码目标单元的量化参数之间的差值。
扫描:可表示对单元、块或矩阵内的系数进行排序的方法。例如,将系数的二维矩阵改成为一维矩阵可被称为扫描,将系数的一维矩阵改成为二维矩阵可被称为扫描或逆扫描。
变换系数:可表示在编码器中执行变换之后产生的系数值。变换系数可表示在解码器中执行熵解码和反量化中的至少一个之后产生的系数值。通过对变换系数或残差信号进行量化而获得的量化的等级或者量化的变换系数等级也可落入变换系数的含义内。
量化的等级:可表示在编码器中通过对变换系数或残差信号进行量化而产生的值。可选地,量化的等级可表示作为在解码器中经历反量化的反量化目标的值。类似地,作为变换和量化的结果的量化的变换系数等级也可落入量化的等级的含义内。
非零变换系数:可表示具有除零之外的值的变换系数、或者具有除零之外的值的变换系数等级或量化的等级。
量化矩阵:可表示在为了提高主观图像质量或客观图像质量而执行的量化处理或反量化处理中使用的矩阵。量化矩阵也可被称为缩放列表。
量化矩阵系数:可表示量化矩阵内的每个元素。量化矩阵系数也可被称为矩阵系数。
默认矩阵:可表示在编码器或解码器中预先定义的预定量化矩阵。
非默认矩阵:可表示在编码器或解码器中未被预先定义而是由用户用信号发送的量化矩阵。
统计值:针对具有可计算的特定值的变量、编码参数、常量值等之中的至少一个的统计值可以是相应特定值的平均值、求和值、加权平均值、加权和值、最小值、最大值、最频繁出现的值、中值、插值之中的一个或更多个。
图1是示出根据应用了本发明的实施例的编码设备的配置的框图。
编码设备100可以是编码器、视频编码设备或图像编码设备。视频可包括至少一个图像。编码设备100可顺序地对至少一个图像进行编码。
参照图1,编码设备100可包括运动预测单元111、运动补偿单元112、帧内预测单元120、切换器115、减法器125、变换单元130、量化单元140、熵编码单元150、反量化单元160、逆变换单元170、加法器175、滤波器单元180和参考画面缓冲器190。
编码设备100可通过使用帧内模式或帧间模式或者帧内模式和帧间模式两者来执行输入图像的编码。此外,编码设备100可通过对输入图像进行编码来产生包括编码信息的比特流,并输出产生的比特流。产生的比特流可被存储在计算机可读记录介质中,或者可通过有线/无线传输介质被流传输。当帧内模式被用作预测模式时,切换器115可切换到帧内。可选地,当帧间模式被用作预测模式时,切换器115可切换到帧间模式。这里,帧内模式可表示帧内预测模式,帧间模式可表示帧间预测模式。编码设备100可产生针对输入图像的输入块的预测块。此外,编码设备100可在产生预测块之后使用输入块和预测块的残差对残差块进行编码。输入图像可被称为作为当前编码目标的当前图像。输入块可被称为作为当前编码目标的当前块,或者被称为编码目标块。
当预测模式是帧内模式时,帧内预测单元120可使用已被编码/解码并与当前块相邻的块的样点作为参考样点。帧内预测单元120可通过使用参考样点来对当前块执行空间预测,或者通过执行空间预测来产生输入块的预测样点。这里,帧内预测可表示帧内部的预测。
当预测模式是帧间模式时,运动预测单元111可在执行运动预测时从参考图像检索与输入块最匹配的区域,并且通过使用检索到的区域来推导运动矢量。在这种情况下,搜索区域可被用作所述区域。参考图像可被存储在参考画面缓冲器190中。这里,当执行对参考图像的编码/解码时,参考图像可被存储在参考画面缓冲器190中。
运动补偿单元112可通过使用运动矢量对当前块执行运动补偿来产生预测块。这里,帧间预测可表示帧之间的预测或运动补偿。
当运动矢量的值不是整数时,运动预测单元111和运动补偿单元112可通过将插值滤波器应用于参考画面的部分区域来产生预测块。为了对编码单元执行画面间预测或运动补偿,可确定跳过模式、合并模式、高级运动矢量预测(AMVP)模式和当前画面参考模式之中的哪个模式被用于对包括在相应编码单元中的预测单元的运动预测和运动补偿。然后,依据所确定的模式,可不同地执行画面间预测或运动补偿。
减法器125可通过使用输入块和预测块的差来产生残差块。残差块可被称为残差信号。残差信号可表示原始信号和预测信号之间的差。此外,残差信号可以是通过对原始信号与预测信号之间的差进行变换或量化或者变换和量化而产生的信号。残差块可以是块单元的残差信号。
变换单元130可通过对残差块执行变换来产生变换系数,并输出产生的变换系数。这里,变换系数可以是通过对残差块执行变换而产生的系数值。当变换跳过模式被应用时,变换单元130可跳过对残差块的变换。
可通过将量化应用于变换系数或应用于残差信号来产生量化的等级。在下文中,量化的等级在实施例中也可被称为变换系数。
量化单元140可通过根据参数对变换系数或残差信号进行量化来产生量化的等级,并输出产生的量化的等级。这里,量化单元140可通过使用量化矩阵对变换系数进行量化。
熵编码单元150可通过根据概率分布对由量化单元140计算出的值或者对在执行编码时计算出的编码参数值执行熵编码来产生比特流,并输出产生的比特流。熵编码单元150可对图像的样点信息和用于对图像进行解码的信息执行熵编码。例如,用于对图像进行解码的信息可包括语法元素。
当熵编码被应用时,符号被表示使得较少数量的比特被分配给具有高产生可能性的符号,并且较多数量的比特被分配给具有低产生可能性的符号,因此,可减小用于将被编码的符号的比特流的大小。熵编码单元150可使用诸如指数哥伦布、上下文自适应可变长度编码(CAVLC)、上下文自适应二叉算术编码(CABAC)等的用于熵编码的编码方法。例如,熵编码单元150可通过使用变长编码/码(VLC)表来执行熵编码。此外,熵编码单元150可推导目标符号的二值化方法和目标符号/二叉位的概率模型,并且通过使用推导的二值化方法和上下文模型来执行算术编码。
为了对变换系数等级(量化的等级)进行编码,熵编码单元150可通过使用变换系数扫描方法将二维块形式的系数改成为一维矢量形式。
编码参数可包括在编码器中被编码并且被用信号发送到解码器的诸如语法元素的信息(标志、索引等)以及在执行编码或解码时推推导的信息。编码参数可表示在对图像进行编码或解码时所需要的信息。例如,以下项中的至少一个值或组合形式可被包括在编码参数中:单元/块尺寸、单元/块深度、单元/块分区信息、单元/块形状、单元/块分区结构、是否进行四叉树形式的分区、是否进行二叉树形式的分区、二叉树形式的分区方向(水平方向或垂直方向)、二叉树形式的分区形式(对称分区或非对称分区)、当前编码单元是否通过三叉树分区被分区、三叉树分区的方向(水平方向或垂直方向)、三叉树分区的类型(对称类型或非对称类型)、当前编码单元是否通过多类型树分区被分区、多类型树分区的方向(水平方向或垂直方向)、多类型树分区的类型(对称类型或非对称类型)、多类型树分区的树(二叉树或三叉树)结构、预测模式(帧内预测或帧间预测)、亮度帧内预测模式/方向、色度帧内预测模式/方向、帧内分区信息、帧间分区信息、编码块分区标志、预测块分区标志、变换块分区标志、参考样点滤波方法、参考样点滤波器抽头、参考样点滤波器系数、预测块滤波方法、预测块滤波器抽头、预测块滤波器系数、预测块边界滤波方法、预测块边界滤波器抽头、预测块边界滤波器系数、帧内预测模式、帧间预测模式、运动信息、运动矢量、运动矢量差、参考画面索引、帧间预测角度、帧间预测指示符、预测列表利用标志、参考画面列表、参考画面、运动矢量预测因子索引、运动矢量预测因子候选、运动矢量候选列表、是否使用合并模式、合并索引、合并候选、合并候选列表、是否使用跳过模式、插值滤波器类型、插值滤波器抽头、插值滤波器系数、运动矢量大小、运动矢量的表示精度、变换类型、变换尺寸、首次(第一次)变换是否被使用的信息、二次变换是否被使用的信息、首次变换索引、二次变换索引、残差信号是否存在的信息、编码块样式、编码块标志(CBF)、量化参数、量化参数残差、量化矩阵、是否应用帧内环路滤波器、帧内环路滤波器系数、帧内环路滤波器抽头、帧内环路滤波器形状/形式、是否应用去块滤波器、去块滤波器系数、去块滤波器抽头、去块滤波器强度、去块滤波器形状/形式、是否应用自适应样点偏移、自适应样点偏移值、自适应样点偏移类别、自适应样点偏移类型、是否应用自适应环路滤波器、自适应环路滤波器系数、自适应环路滤波器抽头、自适应环路滤波器形状/形式、二值化/逆二值化方法、上下文模型确定方法、上下文模型更新方法、是否执行常规模式、是否执行旁路模式、上下文二叉位、旁路二叉位、有效系数标志、最后有效系数标志、针对系数组的单元的编码标志、最后有效系数的位置、关于系数的值是否大于1的标志、关于系数的值是否大于2的标志、关于系数的值是否大于3的标志、关于其余系数值的信息、符号信息、重建亮度样点、重建色度样点、残差亮度样点、残差色度样点、亮度变换系数、色度变换系数、量化的亮度等级、量化的色度等级、变换系数等级扫描方法、在解码器侧的运动矢量搜索区域的尺寸、在解码器侧的运动矢量搜索区域的形状、在解码器侧的运动矢量搜索的次数、关于CTU尺寸的信息、关于最小块尺寸的信息、关于最大块尺寸的信息、关于最大块深度的信息、关于最小块深度的信息、图像显示/输出顺序、条带标识信息、条带类型、条带分区信息、并行块标识信息、并行块类型、并行块分区信息、并行块组标识信息、并行块组类型、并行块组分区信息、画面类型、输入样点的比特深度、重建样点的比特深度、残差样点的比特深度、变换系数的比特深度、量化的等级的比特深度、以及关于亮度信号的信息或关于色度信号的信息。
这里,用信号发送标志或索引可表示由编码器对相应标志或索引进行熵编码并将其包括在比特流中,并且可表示由解码器从比特流对相应标志或索引进行熵解码。
当编码设备100通过帧间预测执行编码时,编码的当前图像可被用作用于随后被处理的另一图像的参考图像。因此,编码设备100可对编码的当前图像进行重建或解码,或者将重建或解码的图像作为参考图像存储在参考画面缓冲器190中。
量化的等级可在反量化单元160中被反量化,或者可在逆变换单元170中被逆变换。可由加法器175将经过反量化或逆变换的系数或者经过反量化和逆变换两者的系数与预测块相加。通过将经过反量化或逆变换的系数或者经过反量化和逆变换两者的系数与预测块相加,可产生重建块。这里,经过反量化或逆变换的系数或经过反量化和逆变换两者的系数可表示执行了反量化和逆变换中的至少一个的系数,并且可表示重建残差块。
重建块可通过滤波器单元180。滤波器单元180可将去块滤波器、样点自适应偏移(SAO)和自适应环路滤波器(ALF)中的至少一个应用于重建样点、重建块或重建图像。滤波器单元180可被称为环内滤波器。
去块滤波器可去除在块之间的边界中产生的块失真。为了确定是否应用去块滤波器,可基于块中所包括的若干行或列中包括的样点来确定是否将去块滤波器应用于当前块。当将去块滤波器应用于块时,可根据所需的去块滤波强度来应用另一滤波器。
为了补偿编码误差,可通过使用样点自适应偏移将合适的偏移值与样点值相加。样点自适应偏移可以以样点为单位对经过去块的图像与原始图像的偏移进行校正。可使用考虑关于每个样点的边缘信息来应用偏移的方法,或者可使用以下方法:将图像的样点分区为预定数量的区域,确定偏移被应用的区域,并对确定的区域应用偏移。
自适应环路滤波器可基于经滤波的重建图像和原始图像的比较结果来执行滤波。可将包括在图像中的样点分区为预定组,可确定将被应用于每个组的滤波器,并且可对每个组执行差异化滤波。是否应用ALF的信息可通过编码单元(CU)被用信号发送,并且将被应用于每个块的ALF的形式和系数可变化。
已经通过滤波器单元180的重建块或重建图像可被存储在参考画面缓冲器190中。由滤波器单元180处理的重建块可以是参考图像的一部分。也就是说,参考图像是由滤波器单元180处理的重建块组成的重建图像。存储的参考图像可稍后在帧间预测或运动补偿中被使用。
图2是示出根据实施例并且应用了本发明的解码设备的配置的框图。
解码设备200可以是解码器、视频解码设备或图像解码设备。
参照图2,解码设备200可包括熵解码单元210、反量化单元220、逆变换单元230、帧内预测单元240、运动补偿单元250、加法器255、滤波器单元260和参考画面缓冲器270。
解码设备200可接收从编码设备100输出的比特流。解码设备200可接收存储在计算机可读记录介质中的比特流,或者可接收通过有线/无线传输介质被流传输的比特流。解码设备200可通过使用帧内模式或帧间模式对比特流进行解码。此外,解码设备200可产生通过解码而产生的重建图像或解码图像,并输出重建图像或解码图像。
当在解码时使用的预测模式是帧内模式时,切换器可被切换到帧内。可选地,当在解码时使用的预测模式是帧间模式时,切换器可被切换到帧间模式。
解码设备200可通过对输入比特流进行解码来获得重建残差块,并产生预测块。当重建残差块和预测块被获得时,解码设备200可通过将重建残差块与预测块相加来产生为解码目标的重建块。解码目标块可被称为当前块。
熵解码单元210可通过根据概率分布对比特流进行熵解码来产生符号。产生的符号可包括量化的等级形式的符号。这里,熵解码方法可以是上述熵编码方法的逆过程。
为了对变换系数等级(量化的等级)进行解码,熵解码单元210可通过使用变换系数扫描方法将单向矢量形式的系数改成为二维块形式。
可在反量化单元220中对量化的等级进行反量化,或者可在逆变换单元230中对量化的等级进行逆变换。量化的等级可以是进行反量化或逆变换或者进行反量化和逆变换两者的结果,并且可被产生为重建残差块。这里,反量化单元220可将量化矩阵应用于量化的等级。
当使用帧内模式时,帧内预测单元240可通过对当前块执行空间预测来产生预测块,其中,空间预测使用与解码目标块相邻并且已经被解码的块的样点值。
当使用帧间模式时,运动补偿单元250可通过对当前块执行运动补偿来产生预测块,其中,运动补偿使用运动矢量以及存储在参考画面缓冲器270中的参考图像。
加法器225可通过将重建残差块与预测块相加来产生重建块。滤波器单元260可将去块滤波器、样点自适应偏移和自适应环路滤波器中的至少一个应用于重建块或重建图像。滤波器单元260可输出重建图像。重建块或重建图像可被存储在参考画面缓冲器270中并且在执行帧间预测时被使用。由滤波器单元260处理的重建块可以是参考图像的一部分。也就是说,参考图像是由滤波器单元260处理的重建块组成的重建图像。存储的参考图像可稍后在帧间预测或运动补偿中被使用。
图3是示意性地示出当对图像进行编码和解码时图像的分区结构的示图。图3示意性地示出将单个单元分区为多个更低等级的单元的示例。
为了有效地对图像进行分区,当进行编码和解码时,可使用编码单元(CU)。编码单元可被用作当对图像进行编码/解码时的基本单元。此外,编码单元可被用作用于在对图像进行编码/解码时区分帧内预测模式与帧间预测模式的单元。编码单元可以是用于预测、变换、量化、逆变换、反量化、或对变换系数的编码/解码处理的基本单元。
参照图3,图像300按照最大编码单元(LCU)被顺序地分区,并且LCU单元被确定为分区结构。这里,LCU可以以与编码树单元(CTU)相同的含义被使用。单元分区可表示对与该单元相关联的块进行分区。在块分区信息中,可包括单元深度的信息。深度信息可表示单元被分区的次数或程度或者单元被分区的次数和程度两者。可基于树结构将单个单元分区为与深度信息分层地相关联的多个更低等级的单元。换言之,单元和通过对该单元进行分区而产生的更低等级的单元可分别与节点和该节点的子节点相应。分区出的更低等级的单元中的每个可具有深度信息。深度信息可以是表示CU的尺寸的信息,并且可被存储在每个CU中。单元深度表示与对单元进行分区相关的次数和/或程度。因此,更低等级的单元的分区信息可包括关于更低等级的单元的尺寸的信息。
分区结构可表示LCU 310内的编码单元(CU)的分布。可根据是否将单个CU分区为多个(包括1、2、3、4、5、6、7、8、12、16、20等的正整数)CU来确定这样的分布。通过分区产生的CU的水平尺寸和垂直尺寸可分别是分区之前的CU的水平尺寸和垂直尺寸的一半,或者可分别具有小于根据分区的次数而进行分区之前的水平尺寸和垂直尺寸的尺寸。CU可以被递归地分区为多个CU。通过递归分区,与分区之前的CU的高度和宽度之中的至少一个相比,分区之后的CU的高度和宽度之中的至少一个可减小。可递归地执行CU的分区,直到预定义的深度或预定义的尺寸为止。例如,LCU的深度可以是0,最小编码单元(SCU)的深度可以是预定义的最大深度。这里,如上所述,LCU可以是具有最大编码单元尺寸的编码单元,并且SCU可以是具有最小编码单元尺寸的编码单元。分区从LCU 310开始,当CU的水平尺寸或垂直尺寸或者水平尺寸和垂直尺寸两者通过分区而减小时,CU深度增加1。例如,对于每个深度,未被分区的CU的尺寸可以为2N×2N。此外,在被分区的CU的情况下,可将尺寸为2N×2N的CU分区为尺寸为N×N的四个CU。随着深度增加1,N的大小可减半。
另外,可通过使用CU的分区信息来表示CU是否被分区的信息。分区信息可以是1比特信息。除SCU之外的所有CU可包括分区信息。例如,当分区信息的值为第一值时,可不对CU进行分区,当分区信息的值为第二值时,可对CU进行分区。
例如,CTU可具有64×64、128×128、256×256、512×512等的尺寸,其中,垂直尺寸等于水平尺寸。在这种情况下,CTU的垂直尺寸或水平尺寸可以是正整数,其中,所述正整数为2、4和8的倍数或2的n次幂(=2n)中的一个。可选地,CTU可具有128×64、64×128、256×64、64×256、512×64、64×512、256×128、128×256等的尺寸,其中,垂直尺寸不同于水平尺寸。类似地,在这种情况下,CTU的垂直或水平尺寸可以是正整数,其中,所述正整数为2、4和8的倍数或2的n次幂(=2n)中的一个。
例如,CU可具有4×4、8×8、16×16、32×32、64×64、128×128、256×256、512×512等的尺寸,其中,垂直尺寸等于水平尺寸。在这种情况下,CU的垂直尺寸或水平尺寸可以是正整数,其中,所述正整数为2、4及8的倍数或2的n次幂(=2n)中的一个。可选地,例如,CU可具有4×8、8×4、4×16、16×4、4×32、32×4、4×64、64×4、8×16、16×8、8×32、32×8、8×64、64×8、16×32、32×16、16×64、64×16、16×128、128×16、32×64、64×32、32×128、128×32、128×64、64×128、256×64、64×256、512×64、64×512、256×128、128×256等的尺寸。类似地,在这种情况下,CU的垂直尺寸或水平尺寸可以是正整数,其中,所述正整数为2、4和8的倍数或2的n次幂(=2n)中的一个。
例如,SCU可以具有2×2、4×4、8×8、16×16、32×32、64×64、64×64、128×128、256×256、512×512等的尺寸,其中,垂直尺寸等于水平尺寸。在这种情况下,CTU的垂直或水平尺寸可以是正整数,其中,所述正整数为2、4和8的倍数或2的n次幂(=2n)中的一个。此外,例如,CTU可具有诸如2×4、4×2、2×8、8×2、2×16、16×2、2×32、32×2、4×8、8×4、4×16、16×4、4×32、32×4、4×64、64×4、8×16、16×8、8×32、32×8、8×64、64×8、16×32、32×16、16×64、64×16、16×128、128×16、32×64、64×32、32×128、128×32、128×64、64×128、256×64、64×256、512×64、64×512、256×128、128×256等的尺寸,其中,垂直尺寸不同于水平尺寸。类似地,在这种情况下,CTU的垂直尺寸或水平尺寸可以是正整数,其中,所述正整数为2、4和8的倍数或2的n次幂(=2n)中的一个。
CTU、CU、SCU和子CU中的至少一个可具有具有垂直与水平比率或水平与垂直比率的尺寸(诸如N:N、1.5×N:N、2×N:N、2.5×N:N、3×N:N、3.5×N:N、4×N:N、4.5×N:N、5×N:N、5.5×N:N、6×N:N、N:1.5×N、N:2×N、N:2.5×N、N:3×N、N:3.5×N、N:4×N、N:4.5×N、N:5×N、N:5.5×N、N:6×N等)。这里,N可以是2、4、6、8、16等中的正整数。子CU可指不是通过在块结构中分区而产生而是通过在对CU进行编码/解码的处理中对CU分区至少一次而产生的单元或子块。
参照图3,具有深度0的LCU可以是64×64的块。0可以是最小深度。具有深度3的SCU可以是8×8的块。3可以是最大深度。32×32的块和16×16的块的CU可分别被表示为深度1和深度2。
例如,当单个编码单元被分区为四个编码单元时,分区出的四个编码单元的水平尺寸和垂直尺寸可以是CU在被分区之前的水平尺寸和垂直尺寸的一半大小。在一个实施例中,当尺寸为32×32的编码单元被分区为四个编码单元时,分区出的四个编码单元中的每个可具有16×16的尺寸。当单个编码单元被分区为四个编码单元时,可称编码单元可被分区为四叉树形式。
例如,当一个编码单元被分区为两个子编码单元时,两个子编码单元中的每个子编码单元的水平尺寸或垂直尺寸(宽度或高度)可以是原始编码单元的水平尺寸或垂直尺寸的一半。例如,当具有32×32的尺寸的编码单元被垂直分区为两个子编码单元时,该两个子编码单元中的每个可具有16×32的尺寸。例如,当具有8×32的尺寸的编码单元被水平分区为两个子编码单元时,该两个子编码单元中的每个可具有8×16的尺寸。当一个编码单元被分区为两个子编码单元时,可称编码单元被二分区或者通过二叉树分区结构被分区。
例如,当一个父编码单元被划分为两个子编码单元时,两个子编码单元中的每个的水平尺寸或垂直尺寸相对于父编码单元的水平或垂直尺寸具有1/K:(K-1)/K或(K-1)/K:1/K的比率。这里,K可以是2、3、4、5、6、7、8、16、32等的正整数。
例如,当32×32父编码单元被垂直划分为1:3的比率时,所得到的两个子编码单元可以分别具有8×32和24×32的尺寸。
另一方面,当8×32父编码单元被水平划分为1:3的比率时,所得到的两个子编码单元可分别具有8×8和8×24的尺寸。
例如,当一个编码单元被分区为三个子编码单元时,可以以1:2:1的比例对编码单元的水平尺寸或垂直尺寸进行分区,从而产生水平尺寸或垂直尺寸的比例为1:2:1的三个子编码单元。例如,当尺寸为16×32的编码单元被水平分区为三个子编码单元时,该三个子编码单元以从最上方子编码单元到最下方子编码单元的顺序可分别具有16×8、16×16和16×8的尺寸。例如,当尺寸为32×32的编码单元被垂直划分为三个子编码单元时,该三个子编码单元以从左侧子编码单元到右侧子编码单元的顺序可分别具有8×32、16×32和8×32的尺寸。当一个编码单元被分区为三个子编码单元时,可称编码单元被三分区或者根据三叉树分区结构被分区。
例如,当一个父编码单元被划分为三个子编码单元时,父编码单元的水平尺寸或垂直尺寸可以被划分为K:L:M的比率(诸如1:2:1、2:1:1、1:1:2、1:4:1、4:1:1、1:1:4、1:3:2、2:3:1、1:6:1、6:1:1、1:1:6、1:5:2和2:5:1)。这里,K、L、M中的每个可以是正整数。
例如,当16×32父编码单元被水平划分为1:6:1的比率时,所得到的三个子编码单元可以从上侧依次分别具有16×4、16×24和16×4的尺寸。
可选地,例如,当32×32父编码单元被垂直划分为6:1:1的比率时,所得到的三个子编码单元可以从左侧依次分别具有24×32、4×32和4×32的尺寸。
进一步可选地,例如,当编码单元的尺寸不是K、L和M的总和(K+L+M)的倍数时,可根据预定规则划分编码单元。例如,当M具有K:L:M的比率的最大值时,将正整数n添加到M,使得编码单元的尺寸成为K、L和M+n的总和(K+L+M+n)的倍数。也就是说,编码单元可被划分为K:L:(M+n)的比率。
在图3中,编码树单元(CTU)320是四叉树分区结构、二叉树分区结构和三叉树分区结构全都被应用的CTU的示例。
如上所述,为了对CTU进行分区,可应用四叉树分区结构、二叉树分区结构和三叉树分区结构中的至少一个。可根据预定的优先级顺序将各种树分区结构顺序地应用于CTU。
例如,可将四叉树分区结构优先应用于CTU。不能再使用四叉树分区结构进行分区的编码单元可与四叉树的叶节点相应。与四叉树的叶节点相应的编码单元可用作二叉树和/或三叉树分区结构的根节点。也就是说,与四叉树的叶节点相应的编码单元可根据二叉树分区结构或三叉树分区结构被进一步分区,或者可不被进一步分区。因此,通过防止从与四叉树的叶节点相应的编码单元的二叉树分区或三叉树分区得到的编码块经历进一步的四叉树分区,块分区操作和/或用信号发送分区信息的操作可被有效执行。
例如,可将二叉树分区优先应用于CTU。不能再由二叉树分区划分的编码单元被称作二叉树的叶节点。与二叉树的叶节点相应的编码单元可成为四叉树或三叉树的根节点。也就是说,与二叉树的叶节点相应的编码单元可由四叉树分区或三叉树分区被划分,或者可不再被划分。当与二叉树的叶节点相应的编码单元由四叉树分区或三叉树分区被划分时,所得到的子编码单元不再由二叉树分区被划分。因此,可以有效地执行块分区和/或用信号发送分区信息。
例如,可将三叉树分区优先应用于CTU。不能再由三叉树分区划分的编码单元可被称作三叉树的叶节点。与三叉树的叶节点相应的编码单元可成为四叉树或二叉树的根节点。也就是说,与三叉树的叶节点相应的编码单元可由四叉树分区或二叉树分区进一步被划分,或者可不再被划分。当与三叉树的叶节点相应的编码单元由四叉树分区或二叉树分区被划分时,所得到的子编码单元可能不再由三叉树分区被划分。因此,可以有效地执行块分区和/或用信号发送分区信息。
例如,可以将四叉树分区、三叉树分区和二叉树分区顺序地应用于当前CTU。可选地,可以将三叉树分区、二叉树分区和四叉树分区顺序地应用于当前CTU。
例如,在将被应用于CTU的四叉树分区、二叉树分区和三叉树分区中,首先应用将垂直尺寸或水平尺寸划分为对称比率的分区,然后应用将垂直尺寸或水平尺寸划分为非对称比率的分区。
可选地,例如,当CTU由二叉树分区被划分时,分区方案的优先级可依据将水平尺寸或垂直尺寸划分为对称比率还是非对称比率而变化。
可选地,例如,当CTU由三叉树分区被划分时,分区方案的优先级可依据将水平尺寸或垂直尺寸划分为对称比率还是非对称比率或者依据水平尺寸或垂直尺寸的三个片段中的两个片段是否具有对称比率或非对称比率而变化。
可使用四叉树分区信息用信号发送与四叉树的节点相应的编码单元被分区的事实。具有第一值(例如,“1”)的四叉树分区信息可指示当前编码单元按照四叉树分区结构被分区。具有第二值(例如,“0”)的四叉树分区信息可指示当前编码单元未按照四叉树分区结构被分区。四叉树分区信息可以是具有预定长度(例如,一个比特)的标志。
在二叉树分区与三叉树分区之间可能没有优先级。即,与四叉树的叶节点相应的编码单元可进一步经历二叉树分区和三叉树分区中的任意分区。另外,通过二叉树分区或三叉树分区产生的编码单元可经历进一步的二叉树分区或进一步的三叉树分区,或者可不被进一步分区。
作为另一示例,四叉树分区与三叉树分区之间可不存在优先级。也就是说,可首先通过四叉树分区或三叉树分区来划分与二叉树的叶节点相应的编码单元。可选地,由四叉树分区或三叉树分区产生的编码单元可由四叉树分区或三叉树分区进一步被划分,或者可不再被划分。
作为又一实例,四叉树分区与二叉树分区之间可不存在优先级。也就是说,可通过四叉树分区或二叉树分区来进一步划分与三叉树的叶节点相应的编码单元。可选地,由四叉树分区或二叉树分区产生的编码单元可由四叉树分区或二叉树分区进一步被划分,或者可不再被划分。
例如,依据垂直尺寸或水平尺寸将被划分成对称比率还是非对称比率,二叉树分区与三叉树分区之间可不存在优先级。
在二叉树分区和三叉树分区之间不存在优先级的树结构被称为多类型树结构。与四叉树的叶节点相应的编码单元可用作多类型树的根节点。可使用多类型树分区指示信息、分区方向信息和分区树信息中的至少一个来用信号发送是否对与多类型树的节点相应的编码单元进行分区。为了对与多类型树的节点相应的编码单元进行分区,可顺序地用信号发送多类型树分区指示信息、分区方向信息和分区树信息。
在这种情况下,用信号发送的顺序可以由编码器/解码器中预设的值被确定,或者可以由从编码器向解码器用信号发送的值被确定。
例如,具有第一值(例如,“1”)的多类型树分区指示信息可指示当前编码单元将经历多类型树分区。具有第二值(例如,“0”)的多类型树分区指示信息可指示当前编码单元将不经历多类型树分区。
当与多类型树的节点相应的编码单元按照多类型树分区结构被进一步分区时,所述编码单元可包括分区方向信息。分区方向信息可指示当前编码单元将在哪个方向上针对多类型树分区被分区。具有第一值(例如,“1”)的分区方向信息可指示当前编码单元将被垂直分区。具有第二值(例如,“0”)的分区方向信息可指示当前编码单元将被水平分区。
当与多类型树的节点相应的编码单元按照多类型树分区结构被进一步分区时,当前编码单元可包括分区树信息。分区树信息可指示将被用于对多类型树的节点进行分区的树分区结构。具有第一值(例如,“1”)的分区树信息可指示当前编码单元将按照二叉树分区结构被分区。具有第二值(例如,“0”)的分区树信息可指示当前编码单元将按照三叉树分区结构被分区。
分区指示信息、分区树信息和分区方向信息均可以是具有预定长度(例如,一个比特)的标志。
为了确定是否划分与多类型树的每个节点相应的编码单元,可用信号发送从指示是否应用多类型树分区的信息、分区方向信息、分区比率信息和分区树信息中选择的至少一种类型的信息。为了划分与多类型树的每个节点相应的编码单元,可顺序地用信号发送指示是否应用多类型树分区的信息、分区方向信息、分区比率信息和分区树信息。
例如,为了划分与多类型树的每个节点相应的编码单元,可顺序地用信号发送指示是否应用多类型树分区的信息、分区方向信息、分区树信息和分区比率信息。
可选地,为了划分与多类型树的每个节点相应的编码单元,可顺序地用信号发送指示是否应用多类型树分区的信息、分区比率信息、分区方向信息和分区树信息。
当通过多类型树分区划分与多类型树的每个节点相应的编码单元时,编码单元还可包括分区比率信息。分区比率信息可指示用于多类型树分区的比率。
例如,在二叉树分区的情况下,下面将描述由分区比率信息指示的分区比率的示例。
当分区比率信息具有值1时,通过二叉树分区来划分编码单元,使得其水平尺寸或垂直尺寸被划分为1:1的比率。当分区比率信息具有值2时,通过二叉树分区来划分编码单元,使得其水平尺寸或垂直尺寸被划分为1:3的比率。当分区比率信息具有值3时,通过二叉树分区来划分编码单元,使得其水平尺寸或垂直尺寸被划分为1:7的比率。当分区比率信息具有值4时,通过二叉树分区来划分编码单元,使得其水平尺寸或垂直尺寸被划分为1:15的比率。
在二叉树分区的情况下,下面将描述由分区比率信息指示的分区比率的其他示例。
当分区比率信息具有值1时,通过二叉树分区来划分编码单元,使得其水平尺寸或垂直尺寸被划分为1:1的比率。当分区比率信息具有值2时,通过二叉树分区来划分编码单元,使得其水平尺寸或垂直尺寸被划分为3:1的比率。当分区比率信息具有值3时,通过二叉树分区来划分编码单元,使得其水平尺寸或垂直尺寸被划分为1:3的比率。
在三叉树分区的情况下,下面将描述由分区比率信息指示的分区比率的示例。
当分区比率信息具有值1时,通过三叉树分区来划分编码单元,使得其水平尺寸或垂直尺寸被划分为1:2:1的比率。当分区比率信息具有值2时,通过三叉树分区来划分编码单元,使得其水平尺寸或垂直尺寸被划分为1:4:1的比率。当分区比率信息具有值3时,通过三叉树分区来划分编码单元,使得其水平尺寸或垂直尺寸被划分为1:6:1的比率。当分区比率信息具有值4时,通过三叉树分区来划分编码单元,使得其水平尺寸或垂直尺寸被划分为1:8:1的比率。
在三叉树分区的情况下,下面将描述由分区比率信息指示的分区比率的其他示例。
当分区比率信息具有值1时,通过三叉树分区来划分编码单元,使得其水平尺寸或垂直尺寸被划分为1:2:1的比率。当分区比率信息具有值2时,通过三叉树分区来划分编码单元,使得其水平尺寸或垂直尺寸被划分为2:1:1的比率。当分区比率信息具有值3时,通过三叉树分区来划分编码单元,使得其水平尺寸或垂直尺寸被划分为1:1:2的比率。当分区比率信息具有值4时,通过二叉树分区来划分编码单元,使得其水平尺寸或垂直尺寸被划分为1:3的比率。也就是说,三叉树分区的分区比率信息可用于指示二叉树分区的分区比率信息。
分区比率信息可以是具有预定长度(例如,1比特)的标志或索引或者可以是具有可变长度的索引。
分区比率信息的值与分区比率之间的关系不限于上述示例。当分区比率信息具有特定值时,这表示编码单元被二叉树分区或三叉树分区划分为n:m的比率或n:m:r的比率。比率可以被不同地设置。
在四叉树分区与三叉树分区之间不存在优先级的情况下的分区也可被称作多树分区。也就是说,与二叉树的叶节点相应的编码单元可成为多类型树的根节点。为了划分与多类型树的每个节点相应的编码单元,可用信号发送从指示是否应用多类型树分区的信息、分区方向信息、分区比率信息和分区树信息中选择的至少一种类型的信息。
在四叉树分区与三叉树分区之间不存在优先级的情况下的分区也可被称作多树分区。也就是说,与二叉树的叶节点相应的编码单元可成为多类型树的根节点。为了划分与多类型树的每个节点相应的编码单元,可用信号发送从指示是否应用多类型树分区的信息、分区方向信息、分区比率信息和分区树信息中选择的至少一种类型的信息。
四叉树分区指示信息、多类型树分区指示信息、分区方向信息和分区树信息中的至少任意一个可被熵编码/熵解码。为了对那些类型的信息进行熵编码/熵解码,可使用关于与当前编码单元相邻的邻近编码单元的信息。例如,当前编码单元的左侧邻近编码单元和/或上方邻近编码单元的分区类型(被分区或不被分区、分区树和/或分区方向)与当前编码单元的分区类型相似的可能性很高。因此,可从关于邻近编码单元的信息推导用于对关于当前编码单元的信息进行熵编码/熵解码的上下文信息。关于邻近编码单元的信息可包括四叉树分区信息、多类型树分区指示信息、分区方向信息和分区树信息中的至少任意一个。
作为另一示例,在二叉树分区和三叉树分区中,可优先执行二叉树分区。即,当前编码单元可首先经历二叉树分区,并且随后可将与二叉树的叶节点相应的编码单元设置为用于三叉树分区的根节点。在这种情况下,对于与三叉树的节点相应的编码单元,可既不执行四叉树分区也不执行二叉树分区。
不能按照四叉树分区结构、二叉树分区结构和/或三叉树分区结构被分区的编码单元成为用于编码、预测和/或变换的基本单元。即,所述编码单元不能被进一步分区以用于预测和/或变换。因此,在比特流中可能不存在用于将编码单元分区为预测单元和/或变换单元的分区结构信息和分区信息。
通过四叉树分区、二叉树分区和/或三叉树分区被另外划分M次的编码单元可以成为用于编码、预测和变换的基本单元。也就是说,为了执行预测和/或变换,编码单元可被另外划分M次。在这种情况下,可以仅在编码/解码处理中使用被另外划分M次的编码单元,但是可以不在块结构中划分编码单元。因此,可以不将用于将编码单元进一步划分为预测单元和/或变换单元的分区结构、分区信息等插入比特流中。这里,M是正整数,并且例如是1。
例如,编码单元还可以被划分M次和N次,以便在预测处理和/或变换处理中使用。例如,M和N是相同的值或不同的值。
然而,当编码单元(即,用于分区的基本单元)的尺寸大于最大变换块的尺寸时,可递归地对编码单元进行分区,直到将编码单元的尺寸减小到等于或小于最大变换块的尺寸为止。
这里,编码单元的尺寸和最大变换块的尺寸中的至少一个可以表示水平尺寸、垂直尺寸或面积。这里,编码单元的尺寸和最大变换块的尺寸中的至少一个可以表示指定编码单元或块的尺寸的深度信息。可选地,它可以表示水平尺寸和垂直尺寸的比率。例如,当编码单元的尺寸为64×64时并且当最大变换块的尺寸为32×32时,可将编码单元分区为用于变换的四个32×32的块。例如,当编码单元的尺寸为32×64并且最大变换块的尺寸为32×32时,可将编码单元分区为用于变换的两个32×32的块。在这种情况下,不单独用信号发送编码单元的用于变换的分区,并且可通过编码单元的水平尺寸或垂直尺寸与最大变换块的水平尺寸或垂直尺寸之间的比较来确定编码单元的用于变换的分区。例如,当编码单元的水平尺寸(宽度)大于最大变换块的水平尺寸(宽度)时,可将编码单元垂直地二等分。例如,当编码单元的垂直尺寸(高度)大于最大变换块的垂直尺寸(高度)时,可将编码单元水平地二等分。
当编码单元的尺寸大于最大变换块的尺寸时,可根据条带类型和分区信息中的至少一个将编码单元的编码块标志(CBF)的值确定为第一值。这里,第一值可以是0,指示编码单元中不存在变换系数或量化的等级。
在这种情况下,条带类型可以是P条带或B条带。这里,分区信息可具有指示编码单元将不被划分的第一值0(或第二值1)。
例如,在当前条带是B条带、编码单元的尺寸是128×128、最大变换块的尺寸是64×64、并且分区信息是0时,编码单元的编码块标志(CBF)值可被确定为0。
例如,在当前条带是I条带、编码单元的尺寸是128×128、最大变换块的尺寸是64×64、并且分区信息是0时,编码单元的CBF值可以被确定为0。
例如,在当前条带是P条带、编码单元的尺寸是64×128、最大变换块的尺寸是64×64、并且分区信息是0时,编码单元的CBF值可被确定为0。
例如,在当前条带是P条带、编码单元的尺寸是64×32、最大变换块的尺寸是32×16、并且分区信息是0时,编码单元的CBF值可被确定为0。
例如,在当前条带是B条带、编码单元的尺寸是128×128、最大变换块的尺寸是32×32、并且分区信息是0时,编码单元的尺寸/分区信息可被另外熵编码/熵解码。
例如,当编码单元的尺寸/分区信息具有第一值0时,编码单元的尺寸可被确定为128×128,并且编码单元的CBF值可被确定为0。例如,当编码单元的尺寸/分区信息具有第二值1时,128×128父编码单元通过四叉树分区被划分为四个64×64子编码单元,并且编码单元的CBF值可被确定为0。也就是说,当编码单元的水平尺寸或垂直尺寸是最大变换块的水平尺寸或垂直尺寸的四倍时,可对编码单元的尺寸/分区信息进行进一步熵编码/熵解码,并且可确定CBF值为0的编码单元的尺寸。
例如,在当前条带是B条带、编码单元的尺寸是128×64、最大变换块的尺寸是32×16、并且分区信息是0时,编码单元的尺寸/分区信息可被进一步熵编码/熵解码。
例如,当编码单元的尺寸/分区信息具有第一值0时,编码单元的尺寸可被确定为128×64,并且编码单元的CBF值可被确定为0。例如,当编码单元的尺寸/分区信息具有第二值1时,128×64父编码单元通过四叉树分区被划分为四个64×32子编码单元,并且编码单元的CBF值可被确定为0。
当编码单元的尺寸大于最大变换块的尺寸时,可根据条带类型将编码单元的模式确定为跳过模式或AMVP模式,其中,编码块标志(CBF)具有第一值并且用信号发送运动矢量差值。在这种情况下,条带类型可以是P条带或B条带。
例如,在当前条带是B条带、编码单元的尺寸是128×128、最大变换块的尺寸是64×64、并且分区信息是0时,编码单元的模式可被确定为跳过模式。
例如,在当前条带是P条带、编码单元的尺寸是64×128、最大变换块的尺寸是64×64、并且分区信息是0时、编码单元的模式可以被确定为CBF值是0的AMVP模式。
例如,在当前条带是B条带、编码单元的尺寸是128×128、最大变换块的尺寸是32×32、并且分区信息是0时,编码单元的尺寸/分区信息可被另外熵编码/熵解码。
例如,当编码单元的尺寸/分区信息具有第一值0时,编码单元的尺寸可被确定为128×128,并且编码单元的模式可被确定为跳过模式。例如,当编码单元的尺寸/分区信息具有第二值1时,可通过四叉树分区将128×128编码单元划分为四个64×64编码单元,并且可将编码单元的模式确定为跳过模式。
例如,在当前条带是P条带、编码单元的尺寸是128×64、最大变换块的尺寸是32×16、并且分区信息是0时,编码单元的尺寸/分区信息可被另外熵编码/熵解码。
例如,当编码单元的尺寸/分区信息具有第一值0时,编码单元的尺寸可被确定为128×64,并且编码单元的模式可被确定为CBF值为0的AVMP模式。例如,当编码单元的尺寸/分区信息具有第二值1时,通过四叉树分区将128×64编码单元划分为四个64×32编码单元,并且可将编码单元的模式确定为CBF值为0的AVMP模式。
这里,编码单元的尺寸和最大变换块的尺寸中的至少一个可以是在编码器/解码器中预设的值,或者可以是从编码器向解码器用信号发送的值。
当编码单元的深度为0并且分区信息为0时,可将编码单元的CBF值确定为1。
当编码单元的深度为0并且分区信息为0时,可将编码单元的模式确定为跳过模式或AVMP模式,其中,编码块标志(CBF)具有第一值并且用信号发送运动矢量差值。
在以上描述中,编码块标志可包括亮度信号的编码块标志和色度信号的编码块标志中的至少一个。
编码单元的最大和/或最小尺寸的信息以及变换块的最大和/或最小尺寸的信息可以在编码单元的更高等级被用信号发送或确定。更高等级可以是例如序列级、画面级、条带级、并行块组级、并行块级等。例如,可将编码单元的最小尺寸确定为4×4。例如,变换块的最大尺寸可以被确定为64×64。例如,变换块的最小尺寸可以被确定为4×4。这里,编码单元的最大和/或最小尺寸信息以及变换块的最大和/或最小尺寸信息是针对帧内条带和帧间条带被用信号发送的值,或者是不管条带类型如何被用信号发送的值。
可与当前块的分区树类型相关联地用信号发送编码单元的最大和/或最小尺寸信息。例如,在当前编码单元的分区树类型是四叉树、二叉树和三叉树中的任何一个树时,可用信号发送每个树型编码单元的最大和/或最小尺寸信息。
这里,可与通用编码单元的最大和/或最小尺寸信息相关联地用信号发送特定树型编码单元的最大和/或最小尺寸信息。
这里,可与另一特定树型编码单元的最大和/或最小尺寸信息相关联地用信号发送特定树型编码单元的最大和/或最小尺寸信息。
这里,可以以对数值的形式用信号发送特定树型编码单元的最大和/或最小尺寸信息。例如,对数中的指数可以是2。
这里,可针对亮度分量和色度分量中的每个用信号发送每个特定树型编码单元的最大和/或最小尺寸信息。在下文中,由Y或亮度表示的值表示关于亮度单位的信息,并且由C或色度表示的信息表示关于色度单位的信息。
例如,可用信号发送四叉树编码单元的最小尺寸与通用编码单元的最小尺寸之间的差。例如,可以经由slice_log2_diff_min_qt_min_cb_luma或slice_log2_diff_min_qt_min_cb_chroma用信号发送四叉树编码单元的最小尺寸与通用编码单元的最小尺寸之间的差。例如,可从slice_log2_diff_min_qt_min_cb_luma或slice_log2_diff_min_qt_min_cb_chroma和通用编码单元的最小尺寸MinCbLog2SizeY推导四叉树编码单元的最小尺寸MinQtSizeY或MinQtSizeC。在下文中,四叉树编码单元具有最小尺寸的情况可以是四叉树编码单元与四叉树的叶节点相应的情况。
可选地,例如,可用信号发送二叉树编码单元的最大尺寸与四叉树编码单元的最小尺寸之间的差。例如,可以经由slice_log2_diff_max_bt_min_qt_luma或slice_log2_diff_max_bt_min_qt_chroma用信号发送二叉树编码单元的最大尺寸与四叉树编码单元的最小尺寸之间的差。可从slice_log2_diff_max_bt_min_qt_luma或slice_log2_diff_max_bt_min_qt_chroma以及四叉树编码单元的最小尺寸MinQtLog2SizeY或MinQtLog2SizeC推导二叉树编码单元的最大尺寸MaxBtSizeY或MaxBtSizeC。另一方面,解码器可从通用编码单元的最小尺寸MinCbLog2SizeY推导二叉树编码单元的最小尺寸MinBtSizeY或MinBtSizeC。
可选地,例如,可用信号发送三叉树编码单元的最大尺寸与四元树编码单元的最小尺寸之间的差。例如,可以经由slice_log2_diff_max_tt_min_qt_luma或slice_log2_diff_max_tt_min_qt_chroma用信号发送三叉树编码单元的最大尺寸与四叉树编码单元的最小尺寸之间的差。可从slice_log2_diff_max_tt_min_qt_luma或slice_log2_diff_max_tt_min_qt_chroma和四叉树编码单元的最小尺寸(MinQtLog2SizeY或MinQtLog2SizeC)推导三叉树编码单元的最大尺寸(MaxTtSizeY或MaxTtSizeC)。另一方面,解码器可从通用编码单元的最小尺寸(MinCbLog2SizeY)推导三叉树编码单元的最小尺寸(MinTtSizeY或MinTtSizeC)。
在编码单元的更高等级用信号发送或确定关于与四叉树的叶节点相应的编码单元的最小尺寸(四叉树最小尺寸)的信息和/或关于从根节点到叶节点的多类型树的最大深度(多类型树最大深度)的信息。更高等级可以是例如序列级、画面级、条带级、并行块组级、并行块级等。这里,关于四叉树最小尺寸的信息和/或关于多类型树最大深度的信息被确定为分别针对帧内条带和帧间条带被用信号发送的值,或被确定为不管条带类型如何被用信号发送的值。多类型树最大深度信息可被划分为二叉树最大深度信息和三叉树最大深度信息,并且可在编码单元的更高等级被用信号发送或确定。
这里,可与通用编码单元的最大尺寸信息和/或最小尺寸信息相关联地用信号发送多类型树最大深度信息。
这里,可以以对数值的形式用信号发送多类型树最大深度信息。例如,对数中的指数可以是2。
这里,可针对亮度分量和色度分量单独地用信号发送多型树最大深度信息。在下文中,由Y或亮度表示的值表示关于亮度单位的信息,并且由C或色度表示的信息表示关于色度单位的信息。
这里,可用信号发送多类型树最大深度信息。例如,可经由slice_max_mtt_hierarchy_depth_luma或slice_max_mtt_hierarchy_depth_luma_chroma用信号发送多类型树最大深度信息。slice_max_mtt_hierarchy_depth_luma或slice_max_mtt_hierarchy_depth_luma_chroma的值可以在0到Ctblog2Sizey-MinCblog2SizeY等式的结果值的范围内。解码器可以从slice_max_mtt_hierarchy_depth_luma或从slice_max_mtt_hierarchy_depth_luma_chroma推导最大深度(MaxMttDepthY或MaxMttDepthC)。
可在编码单元的更高等级用信号发送或确定CTU的尺寸与变换块的最大尺寸之间的差信息。例如,所述更高等级可以是序列级、画面级、条带级、并行块组级、并行块级等。可基于编码树单元的尺寸和所述差信息来确定与二叉树的各个节点相应的编码单元的最大尺寸(在下文中,称为二叉树的最大尺寸)的信息。与三叉树的各个节点相应的编码单元的最大尺寸(在下文中,称为三叉树的最大尺寸)可依据条带的类型而变化。例如,针对画面内条带,三叉树的最大尺寸可以是32×32。例如,针对画面间条带,三叉树的最大尺寸可以是128×128。与二叉树的每个节点相应的编码单元的最大尺寸(二叉树最大尺寸)的值依据条带类型而变化。例如,当条带类型是帧内条带时,二叉树的最大尺寸可以是32×32。例如,当条带类型是帧间条带时,二叉树的最大尺寸可以是128×128。可基于编码单元的尺寸和差信息来确定关于与三叉树的每个节点相应的编码单元的最大尺寸(三叉树最大尺寸)的信息。例如,与二叉树的各个节点相应的编码单元的最小尺寸(在下文中,称为二叉树的最小尺寸)和/或与三叉树的各个节点相应的编码单元的最小尺寸(在下文中,称为三叉树的最小尺寸)可被设置为编码块的最小尺寸。
作为另一示例,可在条带级用信号发送或确定二叉树的最大尺寸和/或三叉树的最大尺寸。可选地,可在条带级用信号发送或确定二叉树的最小尺寸和/或三叉树的最小尺寸。
例如,可以在序列级或画面级用信号发送或确定二叉树最大尺寸和/或三叉树最大尺寸。例如,可以在序列级或画面级用信号发送或确定二叉树最小尺寸和/或三叉树最小尺寸。
例如,可在序列级、画面级或条带级用信号发送或确定二叉树最大深度和/或三叉树最大深度。例如,可在序列级、画面级或条带级用信号发送或确定二叉树最小深度和/或三叉树最小深度。
依据上述各种块的尺寸和深度信息,四叉树分区信息、多类型树分区指示信息、分区树信息和/或分区方向信息可被包括或可不被包括在比特流中。
例如,当编码单元的尺寸不大于四叉树的最小尺寸时,编码单元不包括四叉树分区信息。因此,可从第二值推断四叉树分区信息。
例如,当与多类型树的节点相应的编码单元的尺寸(水平尺寸和垂直尺寸)大于二叉树的最大尺寸(水平尺寸和垂直尺寸)和/或三叉树的最大尺寸(水平尺寸和垂直尺寸)时,编码单元可不被二叉树分区或三叉树分区。因此,可不用信号发送多类型树分区指示信息,但可从第二值推断多类型树分区指示信息。
可选地,当与多类型树的节点相应的编码单元的尺寸(水平尺寸和垂直尺寸)与二叉树的最大尺寸(水平尺寸和垂直尺寸)相同和/或是三叉树的最大尺寸(水平尺寸和垂直尺寸)的两倍大时,编码单元可不被进一步二叉树分区或三叉树分区。因此,可不用信号发送多类型树分区指示信息,而是可从第二值推导多类型树分区指示信息。这是因为当通过二叉树分区结构和/或三叉树分区结构分区编码单元时,产生小于二叉树的最小尺寸和/或三叉树的最小尺寸的编码单元。
可选地,可以基于虚拟流水线数据单元的尺寸(在下文中,流水线缓冲器尺寸)来限制二叉树分区或三叉树分区。例如,当通过二叉树分区或三叉树分区将编码单元划分为不适合流水线缓冲器尺寸的子编码单元时,相应的二叉树分区或三叉树分区可能受到限制。流水线缓冲器尺寸可以是最大变换块的尺寸(例如,64×64)。例如,当流水线缓冲器尺寸是64×64时,可以限制下面的划分。
-用于编码单元的N×M(N和/或M是128)三叉树分区
-用于编码单元的水平方向的128×N(N<=64)二叉树分区
-用于编码单元的垂直方向的N×128(N<=64)二叉树分区
可选地,当与多类型树的节点相应的编码单元的深度等于多类型树的最大深度时,编码单元可不被进一步二叉树分区和/或三叉树分区。因此,可不用信号发送多类型树分区指示信息,但可从第二值推断多类型树分区指示信息。
可选地,仅当垂直方向二叉树分区、水平方向二叉树分区、垂直方向三叉树分区和水平方向三叉树分区中的至少一个对于与多类型树的节点相应的编码单元是可能的时,可用信号发送多类型树分区指示信息。否则,编码单元可以不被二叉树分区和/或三叉树分区。因此,可不用信号发送多类型树分区指示信息,但可从第二值推断多类型树分区指示信息。
可选地,仅当垂直方向二叉树分区和水平方向二叉树分区两者或垂直方向三叉树分区和水平方向三叉树分区两者对于与多类型树的节点相应的编码单元是可能的时,才可用信号发送分区方向信息。否则,可不用信号发送分区方向信息,但是可从指示可能的分区方向的值推导分区方向信息。
可选地,仅当垂直方向二叉树分区和垂直方向三叉树分区两者或水平方向二叉树分区和水平方向三叉树分区两者对于与多类型树的节点相应的编码树是可能的时,才可用信号发送分区树信息。否则,可以不用信号发送分区树信息,而是从指示可能的分区树结构的值推导分区树信息。
当单元或块的垂直尺寸和水平尺寸中的至少任一个不是2的n次幂(=2n)时,可以对单元或块进行编码/解码,使得不存在残差信号。
例如,单元或块的编码块标志(CBF)可不被熵编码/熵解码,但可被推断为零。
例如,单元或块的编码模式的跳过模式标志可不被熵编码/熵解码,并且单元或块的编码模式可被推断为跳过模式。
因此,可以不对垂直尺寸和水平尺寸中的至少任一个不是2的n次幂(=2n)的块执行变换/逆变换。也就是说,可以不需要2的n次幂形式的变换矩阵和逆变换矩阵中的至少任一个。
在当前块包括画面、子画面、条带、并行块或分块的边界时,可隐式地对当前块进行分区。在以下描述中,边界可表示画面、子画面、条带、并行块和分块的边界中的至少一个。在这种情况下,边界可以表示画面、子画面、条带、并行块和分块的右侧边界、下方边界、上方边界和左侧边界中的至少一个。这里,隐式分区可以表示通过特定分区方法对特定块进行分区而没有被用信号发送的编码参数的情况。
右侧边界或左侧边界可表示垂直边界。下方边界或上方边界可以表示水平边界。
当包括在当前块中的边界为垂直边界或水平边界时,可仅对当前块进行垂直分区或水平分区。可根据当前块的尺寸执行当前块的隐式分区。
当执行隐式分区时,可仅执行特定分区,并且可仅对特定分区信息进行熵编码/熵解码。根据当前块中包括的边界是垂直边界还是水平边界来确定特定分区。特定分区可以是选自四叉树分区、水平二叉树分区、垂直二叉树分区、水平三叉树分区和垂直三叉树分区中的任何一个分区类型。
例如,在当前块包括垂直边界时,可以执行四叉树分区、垂直二叉树分区和垂直三叉树分区中的至少一个,使得由当前块的分区产生的每个块不延伸跨越垂直边界。
例如,在当前块包括水平边界时,可以执行四叉树分区、水平二叉树分区和水平三叉树分区中的至少一个,使得由当前块的分区产生的每个块不延伸跨越水平边界。
例如,在当前块包括右侧边界时,可以限制当前块的分区,使得仅当前块的垂直二叉树分区是可能的。在这种情况下,可以对当前块隐式地执行垂直二叉树分区。在这种情况下,关于垂直二叉树分区的分区信息可被熵编码/熵解码。在这种情况下,关于除二叉树分区以外的其它类型的分区的信息可不被熵编码/熵解码。
具体地,在当前块包括右侧边界并且当前块的高度超过最大变换块尺寸时,可以限制当前块的分区,从而防止进行垂直二叉树分区。
例如,在当前块包括右侧边界并且当前块的高度超过64(其中,64是最大变换块尺寸)时,可限制当前块的分区,从而防止进行垂直二叉树分区。
例如,在当前块包括右侧边界但不包括下方边界时,可限制当前块的分区,从而防止进行水平二叉树分区。
例如,在当前块包括下方边界时,可限制当前块的分区,使得仅水平二叉树分区是可能的。在这种情况下,可对当前块隐式地执行水平二叉树分区。在这种情况下,关于当前块的水平二叉树分区信息可被熵编码/熵解码。在这种情况下,关于除水平二叉树分区以外的其它类型的分区的信息可不被熵编码/熵解码。
具体地,在当前块包括下方边界时,可以限制当前块的分区,从而防止进行垂直二叉树分区。
另外,在当前块包括下方边界并且当前块的宽度超过最大变换块尺寸时,可限制当前块的分区,从而防止进行水平二叉树分区。
例如,在当前块包括下方边界并且当前块的宽度超过64(其中,64是最大变换块尺寸)时,可限制当前块的分区,从而防止进行水平二叉树分区。
例如,在当前块包括右侧边界时,可以限制当前块的分区,从而仅允许对当前块进行垂直三叉树分区。在这种情况下,可以对当前块隐式地执行垂直三叉树分区。在这种情况下,关于当前块的垂直三叉树分区信息可被熵编码/熵解码。在这种情况下,关于除了垂直三叉树分区之外的其它类型的分区的信息可以不被熵编码/熵解码。
例如,在当前块包括下方边界时,可以限制当前块的分区,从而仅允许进行水平三叉树分区。在这种情况下,可以对当前块隐式地执行水平三叉树分区。在这种情况下,关于当前块的水平三叉树分区信息可被熵编码/熵解码。在这种情况下,关于除了水平三叉树分区之外的其它类型的分区的信息可以不被熵编码/熵解码。
例如,在当前块至少包括右侧边界或上方边界时,可以限制当前块的分区,从而防止进行三叉树分区。
例如,在当前块包括右侧边界和下方边界两者时,可限制当前块的分区,从而仅允许进行四叉树分区。在这种情况下,可以对当前块隐式地执行四叉树分区。在这种情况下,关于当前块的四叉树分区信息可被熵编码/熵解码。在这种情况下,关于除四叉树分区以外的其它类型的分区的信息可不被熵编码/熵解码。
当对当前块进行分区时,可以限制当前块的分区,使得每个得到的子块的宽高比(水平尺寸与垂直尺寸)不是特定比率。也就是说,可以限制当前块的分区,使得每个得到的子块的宽高比(水平尺寸与垂直尺寸)等于或小于特定比率。例如,水平尺寸和垂直尺寸的宽高比可以是1:N。也就是说,垂直尺寸和水平尺寸的比率可以是N:1。这里,N可以是4、5、6、7、8等正整数。这里,可以基于当前块的编码参数和候选块的编码参数中的至少一个来确定V。在这种情况下,N可以是在编码器/解码器中预设的值或从编码器向解码器用信号发送的值。
与特定比率相比,由当前块的分区得到的每个子块的比率增加,关于子块的分区信息可以不被熵编码/熵解码。
为了确定当前块的分区树结构,可以确定下面描述的语法。
例如,qtbtt_dual_tree_intra_flag可表示I条带中的每个CTU被划分成64×64编码单元,并且64×64编码单元中的每个充当亮度分量和色度分量的根节点。
例如,具有第一值(例如,0)的qtbtt_dual_tree_intra_flag可表示每个CTU被划分为64×64编码单元且每个64×64编码单元既不用作亮度分量的根节点也不用作色度分量的根节点,并且具有第二值(例如,1)的qtbtt_dual_tree_intra_flag可表示每个CTU被划分为64×64编码单元且每个64×64编码单元用作亮度分量的根节点和色度分量的根节点。
当qtbtt_dual_tree_intra_flag具有第一值(例如,0)时,亮度分量的块分区结构和色度分量的块分区结构可以相同。然而,依据色度分量的树类型,亮度分量的块尺寸可不同于色度分量的块尺寸。这种情况被称为使用单树结构的情况。从表达式“SINGLE_TREE”识别单树类型。
当条带类型为I条带且qtbtt_dual_tree_intra_flag具有第二值(例如,1)时,从64×64编码单元推导的亮度分量的块分区结构和色度分量的块分区结构可彼此不同。这种情况被称为使用双树结构的情况。在双树结构的情况下,可从表达式“DUAL_TREE_LUMA”识别亮度分量的树类型,并且可从表达式“DUAL_TREE_CHROMA”识别色度分量的树类型。
在单树结构的情况下,色度分量的最小块可被设置为2×2块。在这种情况下,对于色度分量,可不使用小于2×2块的块。也就是说,对于色度分量,不允许将大于2×2块的父块划分为小于2×2块的子块。
在单树结构的情况下,色度分量的最小块可被设置为4×4块。在这种情况下,对于色度分量,不可以使用2×2块、2×4块和4×2块。也就是说,可不允许将大于2×2块、2×4块和4×2块中的至少一个的块分区为2×2块、2×4块和4×2块中的至少一个。
在双树结构的情况下,色度分量的最小块可被设置为4×4块。在这种情况下,对于色度分量,不可以使用2×2块、2×4块和4×2块。也就是说,可不允许将大于2×2块、2×4块和4×2块中的至少一个的块分区为2×2块、2×4块和4×2块中的至少一个。
图4是示出帧内预测处理的示图。
图4中从中心到外部的箭头可表示帧内预测模式的预测方向。
可通过使用当前块的邻近块的参考样点来执行帧内编码和/或解码。邻近块可以是重建邻近块。例如,可通过使用包括在重建邻近块中的参考样点的编码参数或值来执行帧内编码和/或解码。
预测块可表示通过执行帧内预测而产生的块。预测块可与CU、PU和TU中的至少一个相应。预测块的单元可具有CU、PU和TU中的一个的尺寸。预测块可以是尺寸为2×2、4×4、16×16、32×32或64×64等的正方形块,或者可以是尺寸为2×8、4×8、2×16、4×16和8×16等的矩形块。
可根据针对当前块的帧内预测模式来执行帧内预测。当前块可具有的帧内预测模式的数量可以是固定值,并且可以是根据预测块的属性不同地确定的值。例如,预测块的属性可包括预测块的尺寸和预测块的形状等。
不管块尺寸为多少,可将帧内预测模式的数量固定为N。或者,帧内预测模式的数量可以是3、5、9、17、34、35、36、65或67等。可选地,帧内预测模式的数量可根据块尺寸或颜色分量类型或者块尺寸和颜色分量类型两者而变化。例如,帧内预测模式的数量可根据颜色分量是亮度信号还是色度信号而变化。例如,随着块尺寸变大,帧内预测模式的数量可增加。可选地,亮度分量块的帧内预测模式的数量可大于色度分量块的帧内预测模式的数量。
帧内预测模式可以是非角度模式或角度模式。非角度模式可以是DC模式或平面模式,并且角度模式可以是具有特定方向或角度的预测模式。帧内预测模式可由模式编号、模式值、模式数字、模式角度和模式方向中的至少一个来表示。帧内预测模式的数量可以是大于1的M,包括非角度模式和角度模式。为了对当前块进行帧内预测,可执行确定是否可将包括在重建邻近块中的样点用作当前块的参考样点的步骤。当存在不能用作当前块的参考样点的样点时,通过对包括在重建邻近块中的样点中的至少一个样点值进行复制或执行插值或者执行复制和插值两者而获得的值可被用于替换样点的不可用样点值,因此替换后的样点值被用作当前块的参考样点。
图7是示出能够用于帧内预测的参考样点的示图。
如图7所示,参考样点线0至参考样点线3中的至少一个可以用于当前块的帧内预测。在图7中,片段A和片段F的样点可以分别利用最接近片段B和片段E的样点被填充,而不是从重建邻近块进行检索。可以用信号发送指示将被用于当前块的帧内预测的参考样点线的索引信息。在当前块的上方边界是CTU的边界时,仅参考样点线0可以是可用的。因此,在这种情况下,可以不用信号发送索引信息。当使用除了参考样点线0之外的参考样点线时,可以不执行稍后将描述的针对预测块的滤波。
当进行帧内预测时,可基于帧内预测模式和当前块尺寸/形状将滤波器应用于参考样点和预测样点中的至少一个。
在平面模式的情况下,当产生当前块的预测块时,根据预测目标样点在预测块内的位置,可通过使用当前样点的上方参考样点与左侧参考样点以及当前块的右上方参考样点与左下方参考样点的加权和来产生预测目标样点的样点值。另外,在DC模式的情况下,当产生当前块的预测块时,可使用当前块的上方参考样点与左侧参考样点的平均值。另外,在角度模式的情况下,可通过使用当前块的上方参考样点、左侧参考样点、右上方参考样点和/或左下方参考样点来产生预测块。为了产生预测样点值,可执行实数单元的插值。
在颜色分量之间的帧内预测的情况下,可以基于第一颜色分量的相应重建块来产生第二颜色分量的当前块的预测块。例如,第一颜色分量可以是亮度分量,并且第二颜色分量可以是色度分量。对于颜色分量之间的帧内预测,可基于模板推导第一颜色分量与第二颜色分量之间的线性模型的参数。模板可包括当前块的上方和/或左侧邻近样点以及与其相应的第一颜色分量的重建块的上方和/或左侧邻近样点。例如,可使用模板中的样点中具有最大值的第一颜色分量的样点值及与其相应的第二颜色分量的样点值,以及模板中的样点中具有最小值的第一颜色分量的样点值及与其相应的第二颜色分量的样点值推导线性模型的参数。当推导线性模型的参数时,可将相应重建块应用于线性模型以产生当前块的预测块。根据视频格式,可对第一颜色分量的重建块和相应重建块的邻近样点执行二次采样。例如,当第二颜色分量的一个样点与第一颜色分量的四个样点相应时,可对第一颜色分量的四个样点进行二次采样以计算一个相应样点。在这种情况下,可基于相应二次采样的样点执行线性模型的参数推导和颜色分量之间的帧内预测。是否执行颜色分量之间的帧内预测和/或模板的范围可作为帧内预测模式被用信号发送。
当前块可在水平方向或垂直方向上被分区为两个子块或四个子块。可顺序地重建分区的子块。也就是说,可以对子块执行帧内预测以产生子预测块。另外,可以对子块执行反量化和/或逆变换以产生子残差块。可通过将子预测块添加到子残差块来产生重建子块。重建子块可以用作子块的帧内预测的参考样点。子块可以是包括预定数量(例如,16)或更多个样点的块。因此,例如,在当前块是8×4块或4×8块时,当前块可被分区为两个子块。此外,在当前块是4×4块时,当前块可不被分区为子块。在当前块具有其它尺寸时,当前块可被分区为四个子块。可以用信号发送关于是否基于子块和/或分区方向(水平或垂直)执行帧内预测的信息。可以限于仅在使用参考样点线0时执行基于子块的帧内预测。当执行基于子块的帧内预测时,可以不执行稍后将描述的针对预测块的滤波。
可以通过对被帧内预测的预测块执行滤波来产生最终预测块。可以通过将预定权重应用于滤波目标样点、左侧参考样点、上方参考样点和/或左上方参考样点来执行滤波。可以基于块尺寸、帧内预测模式和预测块中的滤波目标样点的位置中的至少一个来确定用于滤波的权重和/或参考样点(范围、位置等)。可以仅在预定帧内预测模式(例如,DC、平面、垂直、水平、对角线和/或相邻对角线模式)的情况下执行滤波。相邻对角线模式可以是给对角线模式加上k或从对角线模式减去k的模式。例如,k可以是8或更小的正整数。
可通过预测与当前块相邻存在的块的帧内预测模式来对当前块的帧内预测模式进行熵编码/熵解码。在当前块与邻近块的帧内预测模式相同时,可通过使用预定标志信息来用信号发送当前块与邻近块的帧内预测模式相同的信息。另外,可用信号发送多个邻近块的帧内预测模式之中的与当前块的帧内预测模式相同的帧内预测模式的指示符信息。在当前块与邻近块的帧内预测模式不同时,可通过基于邻近块的帧内预测模式执行熵编码/熵解码来对当前块的帧内预测模式信息进行熵编码/熵解码。
图5是示出画面间预测处理的实施例的示图。
在图5中,矩形可以表示画面。在图5中,箭头表示预测方向。根据画面的编码类型,可将画面分类为帧内画面(I画面)、预测画面(P画面)和双预测画面(B画面)。
可在不需要画面间预测的情况下通过帧内预测对I画面进行编码。可通过使用在相对于当前块的一个方向(即,前向或后向)上存在的参考画面,通过画面间预测来对P画面进行编码。可通过使用在相对于当前块的两个方向(即,前向和后向)上存在的参考画面,通过画面间预测来对B画面进行编码。当使用画面间预测时,编码器可执行画面间预测或运动补偿,并且解码器可执行对应运动补偿。
在下文中,将详细描述画面间预测的实施例。
可使用参考画面和运动信息来执行画面间预测或运动补偿。
可通过编码设备100和解码设备200中的每个在画面间预测期间推导当前块的运动信息。可通过使用重建的邻近块的运动信息、同位置块(也称为col块或同位块)的运动信息和/或与同位块相邻的块的运动信息来推导当前块的运动信息。同位块可表示先前重建的同位置画面(也称为col画面或同位画面)内的在空间上与当前块位于相同位置的块。同位画面可以是包括在参考画面列表中的一个或更多个参考画面中的一个画面。
运动信息的推导方法可依据当前块的预测模式而不同。例如,应用于帧间预测的预测模式包括AMVP模式、合并模式、跳过模式、具有运动矢量差的合并模式、子块合并模式、三角形分区模式、帧间-帧内组合预测模式、仿射模式等。这里,合并模式可以被称为运动合并模式。
例如,当AMVP被用作预测模式时,可将重建的邻近块的运动矢量、同位块的运动矢量、与同位块相邻的块的运动矢量和(0,0)运动矢量中的至少一个确定为针对当前块的运动矢量候选,并且通过使用运动矢量候选产生运动矢量候选列表。可通过使用产生的运动矢量候选列表来推导当前块的运动矢量候选。可基于推导的运动矢量候选来确定当前块的运动信息。同位块的运动矢量或与同位块相邻的块的运动矢量可被称为时间运动矢量候选,并且重建的邻近块的运动矢量可被称为空间运动矢量候选。
编码设备100可计算当前块的运动矢量与运动矢量候选之间的运动矢量差(MVD),并且可对运动矢量差(MVD)执行熵编码。另外,编码设备100可对运动矢量候选索引执行熵编码并产生比特流。运动矢量候选索引可指示包括在运动矢量候选列表中的运动矢量候选之中的最佳运动矢量候选。解码设备可对包括在比特流中的运动矢量候选索引执行熵解码,并且可通过使用经过熵解码的运动矢量候选索引从包括在运动矢量候选列表中的运动矢量候选中选择解码目标块的运动矢量候选。另外,解码设备200可将经过熵解码的MVD与通过熵解码而提取的运动矢量候选相加,从而推导解码目标块的运动矢量。
另外,编码设备100可对计算出的MVD的分辨率信息执行熵编码。解码设备200可使用MVD分辨率信息来调整被熵解码的MVD的分辨率。
另外,编码设备100基于仿射模型计算当前块中的运动矢量和运动矢量候选之间的运动矢量差(MVD),并对MVD执行熵编码。解码设备200通过根据被熵解码的MVD和仿射控制运动矢量候选的总和推导解码的目标块的仿射控制运动矢量来基于每个子块推导运动矢量。
比特流可包括指示参考画面的参考画面索引。参考画面索引可通过编码设备100被熵编码,并且随后作为比特流被用信号发送到解码设备200。解码设备200可基于推导的运动矢量和参考画面索引信息来产生解码目标块的预测块。
推导当前块的运动信息的方法的另一示例可以是合并模式。合并模式可表示合并多个块的运动的方法。合并模式可表示从邻近块的运动信息推导当前块的运动信息的模式。当应用合并模式时,可使用重建的邻近块的运动信息和/或同位块的运动信息来产生合并候选列表。运动信息可包括运动矢量、参考画面索引和画面间预测指示符中的至少一个。预测指示符可指示单向预测(L0预测或L1预测)或双向预测(L0预测和L1预测)。
合并候选列表可以是存储的运动信息的列表。包括在合并候选列表中的运动信息可以是以下至少一个:与当前块相邻的邻近块的运动信息(空间合并候选)、参考画面中的当前块的同位块的运动信息(时间合并候选)、通过合并候选列表中存在的运动信息的组合产生的新运动信息、在当前块之前被编码/解码的块的运动信息(基于历史的合并候选)和零合并候选。
编码设备100可通过对合并标志和合并索引中的至少一个执行熵编码来产生比特流,并且可将比特流用信号发送到解码设备200。合并标志可以是指示是否针对每个块执行合并模式的信息,并且合并索引可以是指示当前块的邻近块中的哪个邻近块是合并目标块的信息。例如,当前块的邻近块可包括位于当前块的左侧的左侧邻近块、被布置在当前块上方的上方邻近块和在时间上与当前块相邻的时间邻近块。
另外,编码设备100对合并候选的运动信息中的用于校正运动矢量的校正信息执行熵编码,并将其用信号发送到解码设备200。解码设备200可以基于校正信息校正由合并索引选择的合并候选的运动矢量。这里,校正信息可以包括关于是否执行校正的信息、校正方向信息和校正尺寸信息中的至少一个。如上所述,基于用信号发送的校正信息对合并候选的运动矢量进行校正的预测模式可以被称为具有运动矢量差的合并模式。
跳过模式可以是将邻近块的运动信息照原样应用于当前块的模式。当应用跳过模式时,编码设备100可对哪个块的运动信息将被用作当前块的运动信息的事实的信息执行熵编码,以产生比特流,并且可将比特流用信号发送到解码设备200。编码设备100可不将关于运动矢量差信息、编码块标志和变换系数等级中的至少任意一个的语法元素用信号发送到解码设备200。
子块合并模式可以表示以编码块(CU)的子块为单位推导运动信息的模式。当应用子块合并模式时,可使用与参考图像中的当前子块同位的子块的运动信息(基于子块的时间合并候选)和/或仿射控制点运动矢量合并候选来产生子块合并候选列表。
三角形分区模式可以表示通过将当前块分区为对角线方向来推导运动信息,使用推导的运动信息中的每个来推导每个预测样点,并且通过对推导的预测样点中的每个进行加权来推导当前块的预测样点的模式。
帧间-帧内组合预测模式可以表示通过对由帧间预测产生的预测样点和由帧内预测产生的预测样点进行加权来推导当前块的预测样点的模式。
解码设备200可自行校正推导的运动信息。解码设备200可基于由推导的运动信息指示的参考块搜索预定区域,并推导具有最小SAD的运动信息作为校正的运动信息。
解码设备200可使用光流对经由帧间预测推导的预测样点进行补偿。
图6是示出变换和量化处理的示图。
如图6中所示,对残差信号执行变换处理和/或量化处理,以产生量化的等级信号。残差信号是原始块与预测块(即,帧内预测块或帧间预测块)之间的差。预测块是通过帧内预测或帧间预测产生的块。所述变换可以是首次变换、二次变换或者首次变换和二次变换两者。对残差信号的首次变换产生变换系数,并且对变换系数的二次变换产生二次变换系数。
从预先定义的各种变换方案中选择的至少一种方案被用于执行首次变换。例如,所述预定义的变换方案的示例包括离散余弦变换(DCT)、离散正弦变换(DST)和Karhunen-Loève变换(KLT)。通过首次变换产生的变换系数可经历二次变换。可根据当前块和/或当前块的邻近块的编码参数来确定用于首次变换和/或二次变换的变换方案。可选地,可用信号发送指示变换方案的变换信息。基于DCT的变换可以包括例如DCT-2、DCT-8等。基于DST的变换可包括例如DST-7。
可以通过对残差信号或执行首次变换和/或二次变换的结果执行量化来产生量化的等级信号(量化系数)。依据块的帧内预测模式或块尺寸/形状,可以根据对角线右上扫描、垂直扫描和水平扫描中的至少一个来扫描量化的等级信号。例如,当在对角线右上扫描中扫描系数时,块形式的系数改变为一维矢量形式。除了对角线右上扫描之外,依据帧内预测模式和/或变换块的尺寸,可以使用水平地扫描二维块形式的系数的水平扫描或垂直地扫描二维块形式的系数的垂直扫描。扫描的量化的等级系数可以被熵编码以插入比特流中。
解码器对比特流进行熵解码以获得量化的等级系数。量化的等级系数可以通过反向扫描以二维块形式被布置。对于反向扫描,可以使用对角线右上扫描、垂直扫描和水平扫描中的至少一个。
然后可以对量化的等级系数进行反量化,然后根据需要进行二次逆变换,最后根据需要进行首次逆变换,以产生重建残差信号。
可在环内滤波之前针对通过帧内预测或帧间预测重建的亮度分量执行动态范围中的逆映射。动态范围可以被划分为16个相等的段,并且可以用信号发送每个段的映射函数。可在条带级或并行块组级用信号发送映射函数。可以基于映射函数推导用于执行逆映射的逆映射函数。在逆映射区域中执行环内滤波、参考画面存储和运动补偿,并且经由使用映射函数的映射将通过帧间预测产生的预测块被转换到映射区域,然后被用于产生重建块。然而,由于在映射区域中执行帧内预测,因此经由帧内预测产生的预测块可以被用于产生重建块而无需映射/逆映射。
在当前块是色度分量的残差块时,可以通过对映射区域的色度分量执行缩放来将残差块转换到逆映射区域。可在条带级或并行块组级用信号发送缩放的可用性。只有当亮度分量的映射可用并且亮度分量的划分和色度分量的划分遵循相同的树结构时,才可以应用缩放。可基于与色差块相应的亮度预测块的样点值的平均值来执行缩放。在这种情况下,在当前块使用帧间预测时,亮度预测块可表示映射的亮度预测块。可通过使用亮度预测块的样点值的平均值所属的片段的索引参考查找表来推导缩放所需的值。最后,通过使用推导的值对残差块进行缩放,可以将残差块转换到逆映射区域。然后,可以在逆映射区域中执行色度分量块恢复、帧内预测、帧间预测、环内滤波和参考画面存储。
可以通过序列参数集用信号发送指示亮度分量和色度分量的映射/逆映射是否可用的信息。
可以基于指示当前画面中的当前块与参考块之间的位移的块矢量来产生当前块的预测块。以这种方式,用于参考当前画面产生预测块的预测模式被称为帧内块复制(IBC)模式。IBC模式可被应用于M×N(M<=64,N<=64)编码单元。IBC模式可包括跳过模式、合并模式、AMVP模式等。在跳过模式或合并模式的情况下,构建合并候选列表,并且用信号发送合并索引,使得可以指定一个合并候选。指定的合并候选的块矢量可以用作当前块的块矢量。合并候选列表可包括空间候选、基于历史的候选、基于两个候选的平均值的候选和零合并候选中的至少一个。在AMVP模式的情况下,可用信号发送差块矢量。另外,可从当前块的左侧邻近块和上方邻近块推导预测块矢量。可以用信号发送将使用的邻近块的索引。IBC模式中的预测块被包括在当前CTU或左侧CTU中并且被限于已经重建的区域中的块。例如,可以限制块矢量的值,使得当前块的预测块按照编码/解码顺序位于当前块所属的64×64块之前的三个64×64块的区域中。通过以这种方式限制块矢量的值,可减少根据IBC模式实施方案的存储器消耗和装置复杂性。
在下文中,将基于上述内容描述根据本发明的图像编码/解码方法。
在下文中,将描述使用邻近块的编码参数对当前块进行编码/解码的实施例。
例如,在上述块分区结构中,邻近块的编码参数中的至少一个可被用作当前块的编码参数中的至少一个。
例如,从单元分区信息、是否执行四叉树分区、是否执行二叉树分区、二叉树分区的分区方向(垂直或水平)、二叉树分区的分区类型(对称或非对称)、二叉树分区的分区比率、是否执行三叉树分区、三叉树分区的分区方向(垂直或水平)、三叉树分区的分区类型(对称或非对称)、以及三叉树分区的分区比率中选择的邻近块的至少一种类型的信息可被用作从单元分区信息、是否执行四元树分区、是否执行二叉树分区、二叉树分区的分区方向(垂直或水平)、二叉树分区的分区类型(对称或非对称)、二叉树分区的分区比率、是否执行三叉树分区、三叉树分区的分区方向(垂直或水平)、三叉树分区的分区类型(对称或非对称)和三叉树分区的分区比率中选择的当前块的至少一种类型的信息。
例如,在上述块分区结构中,可使用邻近块的编码参数中的至少一个来推导当前块的编码参数中的至少一个。
例如,从单元分区信息、是否执行四叉树分区、是否执行二叉树分区、二叉树分区方向、二叉树分区类型、二叉树分区的分区比率、是否执行三叉树分区、三叉树分区方向、三叉树分区类型和三叉树分区的分区比率中选择的关于邻近块的至少一种类型的信息可被用于推导从单元分区信息、是否执行四叉树分区、是否执行二叉树分区、二叉树分区的分区方向(垂直或水平)、二叉树分区的分区类型(对称或非对称)、二叉树分区的分区比率、是否执行三叉树分区、三叉树分区的分区方向(垂直或水平)、三叉树分区的分区类型(对称或非对称)和三叉树分区的分区比率中选择的当前块的至少一种类型的信息。
这里,使用邻近块的编码参数中的至少一个来推导当前块的编码参数中的至少一个的情况可表示使用邻近块的编码参数中的至少一个来确定或推导当前块的编码参数中的至少一个。
例如,在上述块分区结构中,邻近块的编码参数中的至少一个可用于驱动另一邻近块的编码参数中的至少一个。
例如,从单元分区信息、是否执行四叉树分区、是否执行二叉树分区、二叉树分区方向、二叉树分区类型、二叉树分区的分区比率、是否执行三叉树分区、三叉树分区方向、三叉树分区类型和三叉树分区的分区比率中选择的关于邻近块的至少一种类型的信息可用于推导从单元分区信息、是否执行四叉树分区、是否执行二叉树分区、二叉树分区的分区方向(垂直或水平)、二叉树分区的分区类型(对称或非对称)、二叉树分区的分区比率、是否执行三叉树分区、三叉树分区的分区方向(垂直或水平)、三叉树分区的分区类型(对称或非对称)和三叉树分区的分区比率中选择的另一邻近块的至少一种类型的信息。
这里,使用邻近块的编码参数中的至少一个来推导另一邻近块的编码参数中的至少一个的情况可表示使用邻近块的编码参数中的至少一个来确定或推导另一邻近块的编码参数中的至少一个。
例如,在上述块分区结构中,可在对当前块执行帧内预测的处理中使用邻近块的编码参数中的至少一个。
例如,在对当前块执行帧内预测的处理中,可以使用从邻近块的帧内预测模式、帧内预测方向、参考样点滤波方法、预测块滤波方法、预测块滤波器抽头和预测块滤波器系数中选择的至少一种类型的信息。
例如,在上述块分区结构中,可在对当前块执行帧间预测或运动补偿的处理中使用邻近块的编码参数中的至少一个。
例如,帧间预测模式、运动信息、运动矢量、参考画面索引、帧间预测方向、帧间预测指示符、参考画面列表、运动矢量预测符、运动矢量候选列表、合并模式利用信息、合并候选、合并候选列表、跳过模式利用信息、插值滤波器类型、插值滤波器抽头、插值滤波器系数、运动矢量大小、邻近块的运动矢量表示准确度中的至少一个可被用于对当前块执行帧间预测或运动补偿的处理。
例如,在上述块分区结构中,可在对当前块执行变换、逆变换、量化或反量化的处理中使用邻近块的编码参数中的至少一个。这里,变换和逆变换可以包括首次变换、二次变换、首次逆变换和二次逆变换中的至少一个。
例如,从变换类型、变换尺寸、关于首次变换的利用的信息、关于二次变换的利用的信息、首次变换索引、二次变换索引、残差信号存在信息、编码块模式、编码块标志、量化参数和量化矩阵中选择的至少一种类型的信息可被用于当前块的变换、逆变换、量化或反量化。
例如,在上述块分区结构中,邻近块的编码参数中的至少一个可被用于当前块的熵编码/熵解码。
例如,从单元分区信息、是否执行四叉树分区、是否执行二叉树分区、二叉树分区方向、二叉树分区类型、二叉树分区的分区比率、是否执行三叉树分区、三叉树分区方向、三叉树分区类型和三叉树分区的分区比率中选择的关于邻近块的至少一种类型的信息可被用于对从单元分区信息、是否执行四叉树分区、是否执行二叉树分区、二叉树分区的分区方向(垂直或水平)、二叉树分区的分区类型(对称或非对称)、二叉树分区的分区比率、是否执行三叉树分区、三叉树分区的分区方向(垂直或水平)、三叉树分区的分区类型(对称或非对称)和三叉树分区的分区比率中选择的当前块的至少一种类型的信息进行熵编码/熵解码。这里,熵编码/熵解码可包括确定二值化/逆二值化方法、确定上下文模型、更新上下文模型、执行常规模式和执行旁路模式的处理。
作为另一示例,上述块分区结构中的邻近块的编码参数中的至少一个可以被用于使用环内滤波器、去块滤波器、自适应样点偏移、自适应环内滤波器等对当前块进行滤波。
例如,从包括是否应用环内滤波器、环内滤波器系数、环内滤波器抽头、环内滤波器形状、环内滤波器类型、是否应用去块滤波器、去块滤波器系数、去块滤波器抽头、去块滤波器强度、去块滤波器形状、去块滤波器类型、是否应用自适应样点偏移、自适应样点偏移值、自适应样点偏移类别、自适应样点偏移类型、是否应用自适应环内滤波器,自适应环内滤波器系数、自适应环内滤波器抽头、自适应环内滤波器形状和自适应环内滤波器类型中选择的关于邻近块的信息可被用于当前块的滤波(诸如去块滤波、自适应样点偏移滤波、自适应环内滤波等)。
作为另一示例,上述块分区结构中的邻近块的编码参数中的至少一个可被用于当前块的帧内预测、当前块的帧间预测或运动补偿、当前块的熵编码/熵解码、以及使用帧内环路滤波器、去块滤波器、自适应样点偏移、自适应环内滤波器等对当前块进行滤波中的至少一个。
例如,在上述块分区结构中,亮度信号块的编码参数中的至少一个可被用作色度信号块的编码参数中的至少一个。例如,在上述块分区结构中,亮度信号块的编码参数中的至少一个可被用于推导色度信号块的编码参数中的至少一个。作为另一示例,上述块分区结构中的亮度信号块的编码参数中的至少一个可被用于色度信号块的帧内预测、色度信号块的帧间预测或运动补偿、色度信号块的熵编码/熵解码、以及使用帧内环路滤波器、去块滤波器、自适应样点偏移、自适应环路滤波器等对色度信号块进行滤波中的至少一个。
例如,在上述块分区结构中,Cb/Cr信号块的至少一个编码参数可被用作Cr/Cb信号块的至少一个编码参数。例如,在上述块分区结构中,Cb/Cr信号块的至少一个编码参数可被用于推导Cr/Cb信号块的至少一个编码参数。作为另一示例,上述块分区结构中的Cb/Cr信号块的编码参数中的至少一个可被用于Cr/Cb信号块的帧内预测、Cr/Cb信号块的帧间预测或运动补偿、Cr/Cb信号块的熵编码/熵解码、以及使用环内滤波器、去块滤波器、自适应样点偏移、自适应环内滤波器等对Cr/Cb信号块进行滤波中的至少一个。
针对通过基于块分区结构的块分区产生的每个块,可以对下面描述的编码参数和信息中的至少一个进行熵编码/熵解码。另外,可根据被熵编码/熵解码的至少一条信息和/或块尺寸和块形状中的至少一个来执行由下面描述的信息指示的方法。
例如,运动信息可以包括从运动矢量、参考画面索引、帧间预测指示符、跳过模式利用信息(skip_flag)、合并模式利用信息(merge_flag)、合并索引信息(merge_index)和运动矢量分辨率信息、重叠块运动补偿信息、局部照度补偿信息、仿射运动补偿信息、解码器侧运动矢量推导信息和双向光流信息中选择的至少一条信息。
运动矢量分辨率信息可以是指示特定分辨率是否被用于运动矢量和运动矢量差值中的至少一个的信息。这里,分辨率可以表示精度。另外,特定分辨率可以被设置为从整数像素单位、1/2-pel单位、1/4-pel单位、1/8-pel单位、1/16-pel单位、1/32-pel单位和1/64-pel单位中选择的任何一个单位。
重叠块运动补偿信息可以是指示在执行当前块的运动补偿时是否通过另外使用与当前块在空间上相邻的邻近块的运动矢量来计算当前块的预测块的加权和的信息。
局部照度补偿信息可以是指示在产生当前块的预测块时是否应用权重值和偏移值中的至少一个的信息。这里,权重值和偏移值可以是使用关于参考块的信息计算的值。
仿射运动补偿信息可以是指示在对当前块执行运动补偿时是否使用仿射运动模型的信息。这里,仿射运动模型可以是使用多个参数将一个块划分为多个子块并且使用代表性运动矢量计算每个子块的运动矢量的模型。
解码器侧运动矢量推导信息可以是指示是否在解码器侧推导运动补偿所需的运动矢量的信息。依据解码器侧运动矢量推导信息,可以不对关于运动矢量的信息进行熵编码/熵解码。当解码器侧运动矢量推导信息指示解码器推导并使用运动矢量时,可对关于合并模式的信息进行熵编码/熵解码。也就是说,解码器侧运动矢量推导信息可指示解码器是否使用合并模式。
双向光流信息可以是指示是通过基于像素还是基于子块细化运动矢量来执行运动补偿的信息。依据双向光流信息,可以不对按照每个像素的运动矢量或按照每个子块的运动矢量进行熵编码/熵解码。这里,运动矢量细化可以指将运动矢量值从基于块的运动矢量改变为基于像素的运动矢量或基于子块的运动矢量的处理。
当图像被划分为预测单元(PUs)、变换单元(TUs)、预测块(PBs)、或变换块(TBs)时,可以根据与编码单元相关联的至少一个实施例来产生单元或块。
在下文中,将描述确定上述块结构中的当前块的参考块的方法。
可以根据下面描述的实施例中的至少一个或组合对图像进行编码/解码。通过使用下面描述的实施例在图像编码/解码处理中有效地确定当前块的参考块,可以提高图像编码器的编码效率和图像解码器的解码效率。
另外,稍后将描述的块可以表示单元,并且稍后将描述的候选列表可以表示包括至少一个候选的候选集。
这里,在包括帧间预测、帧内预测、变换、逆变换、量化、反量化、熵编码、熵解码和环内滤波的图像编码/解码处理步骤中的一个或更多个步骤中,可以确定当前块的参考块。
图8a至图8c是示出根据本发明的一个实施例的图像编码/解码方法的流程图。
参照图8a,根据本发明的图像编码/解码方法包括:步骤S810,将当前画面划分为多个块;步骤S820,将与当前块相邻的邻近块插入用于对当前块进行编码/解码的候选列表中;以及步骤S830,将候选列表中的邻近块确定为用于对当前块进行编码/解码的参考块。图8a中的当前块可以表示通过块分区产生的子块中的一个的解码目标子块。
为了将当前画面划分为多个子块,可以使用上面参照图3描述的关于块分区结构和分区方法的实施例中的至少一个或组合。
在图8b和图8c中,当前块可以表示包括在当前画面中并被划分为多个子块的当前解码的/解码的目标块。
参照图8b,将描述解码设备将当前画面划分为多个子块的方法。
根据本发明的块分区方法包括:对关于包括在当前画面中的当前块的块分区信息进行解码(S811a);使用块分区信息来确定当前块的分区方案(S812a),并且使用确定的分区方案来对当前块进行分区(S813a)。
根据当前块是否包括当前画面的边界来确定分区方案。
参照图8c,将描述编码设备将当前画面划分为多个子块的方法。
根据本发明的块分区方法包括:确定包括在当前画面中的当前块的分区方案的步骤(S811b);使用确定的分区方案对当前块进行分区的步骤(S812b);以及对关于当前块的块分区信息进行编码的步骤(S812c)。
例如,根据当前块是否包括当前画面的边界来确定分区方案。
当前块的参考块可选自包括邻近块或邻近块的块信息的候选列表。这里,在包括帧间预测、帧内预测、变换、逆变换、量化、反量化、熵编码、熵解码和环内滤波的图像编码/解码处理步骤中的一个或更多个步骤中,可以使用确定的参考块对当前块进行编码/解码。
参考块可以表示参考块的至少一条块信息。也就是说,可以使用确定的参考块的块信息对当前块执行图像编码/解码处理中的至少一个。这里,参考块的块信息可被确定为当前块的块信息。参考块可以表示参考块的至少一条块信息。
这里,当前块的邻近块表示包括与当前块的上方边界相邻的上方邻近块、与当前块的左上角相邻的左上方邻近块、与当前块的右上角相邻的右上方邻近块、与当前块的左侧边界相邻的左侧邻近块和与当前块的左下角相邻的左下方邻近块的空间邻近块中的一个。另外,邻近块可以是与当前块的边界邻近的空间邻近块中的至少一个。邻近块是指位于当前块所属的CTU的边界之外的块,并且具体地是指与当前块的边界相邻的空间邻近块中的一个。邻近块是指包括位于当前块外部并且与当前块内的特定样点位置相邻的一个或更多个样点的空间邻近块中的至少一个。邻近块是指位于当前块所属的CTU的边界外部的块,并且是指包括位于当前块外部且与当前块内的特定样点位置相邻的一个或更多个样点的空间邻近块中的一个。也就是说,邻近块可表示在空间/时间上与当前块相邻的邻近块,并且可表示重建邻近块。
邻近块可表示邻近块的至少一条块信息。也就是说,将邻近块包括在候选列表中可表示邻近块的块信息包括在候选列表中。因此,下面提及的邻近块可被用作指代邻近块的至少一条块信息的术语。
也就是说,块可以表示作为块本身的候选,或者可以表示作为关于块的一条信息的候选。在下面描述的实施例中,为方便起见,块信息和相应块被统称为块。
块信息可以表示关于邻近块的信息、关于参考块的信息和关于当前块的信息中的至少一个。
块信息可以包括块的编码参数中的至少一个。例如,块信息表示从帧间预测、帧内预测、变换、逆变换、量化、反量化、熵编码、熵解码和环内滤波中选择的至少一个处理中使用的信息。具体地,块信息是指以下参数中的任何一个或组合:块尺寸、块深度、块分区信息、块形式(正方形或非正方形)、是否执行四叉树分区、是否执行二叉树分区、二叉树分区方向(水平或垂直)、二叉树分区类型(对称或非对称)、预测模式(帧内或帧间)、亮度帧内预测模式/方向、色度帧内预测模式/方向、帧内预测分区信息、帧间预测分区信息、编码块分区标志、预测块分区标志、变换块分区标志、参考样点滤波器抽头。参考样点滤波器系数、预测块滤波器抽头、预测块滤波器系数、预测块边界滤波器抽头、预测块边界滤波器系数、运动矢量(L0、L1、L2、L3等中的至少一个的运动矢量)、运动矢量差(L0、L1、L2、L3等中的至少一个的运动矢量差)、帧间预测的方向(单向或双向)、参考画面索引(L0、L1、L2、L3等中的至少一个的参考画面索引)、帧间预测指示符、预测列表利用信息(是否使用)、参考画面列表、运动矢量预测索引、运动矢量预测候选、运动矢量候选列表、合并模式信息(是否使用)、合并索引、合并候选、合并候选列表、跳过模式信息(是否使用)、插值滤波器类型、插值滤波器抽头、插值滤波器系数、运动矢量大小、运动矢量精度(整数样点、1/2样点、1/4样点、1/8样点、1/16样点、1/32样点等)、变换类型、变换尺寸、首次变换利用信息(是否使用)、二次变换利用信息(是否使用)、首次变换索引、二次变换索引、残差信号存在信息(是否存在)、编码块模式、编码块标志、编码参数、残差量化参数、量化矩阵、画面内环路滤波器应用信息(是否应用)、画面内环路滤波器系数、画面内环路滤波器抽头、画面内环路滤波器形状/形式、去块滤波器应用信息(是否应用)、去块滤波器系数、去块滤波器抽头、去块滤波器强度、去块滤波器形状/形式、自适应样点偏移(SAO)应用信息(是否应用)、自适应样点偏移值、自适应样点偏移类别、自适应样点偏移类型,自适应环路滤波器(ALF)应用信息(是否应用)、自适应环路滤波器系数、自适应环路滤波器抽头、自适应环路滤波器形状/形式、二值化/逆二值化方法、上下文模型决策方法、上下文模型更新方法、常规模式利用信息(是否使用)、旁路模式利用标志、上下文二进制位、旁路二进制位、有效系数标志、最后有效系数标志、按照每个系数组的编码标志、最后有效标志的位置、指示系数值是否大于1的标志、指示系数值是否大于2的标志、指示系数值是否大于3的标志、剩余系数值信息、符号信息、重建亮度样点、重建色度样点、残差亮度样点、残差色度样点、亮度变换系数、色度变换系数、亮度量化等级、色度量化等级、变换系数等级扫描方法、解码器侧运动矢量搜索区域的尺寸、解码器侧运动矢量搜索区域的形状、解码器侧运动矢量搜索频率、CTU尺寸、最小块尺寸、最大块尺寸、最大块深度、最小块深度、条带标识信息、条带分区信息、并行块标识信息、并行块类型、并行块分区信息、输入样点的比特深度、重建样点的比特深度、残差样点的比特深度、变换系数的比特深度和量化等级的比特深度。
例如,当对四叉树分区信息进行熵编码/熵解码时,可通过比较当前块的深度值与邻近块的深度值来确定上下文模型。
作为另一示例,当对是否划分当前编码单元的信息进行熵编码/熵解码时,可通过将当前块的高度和/或宽度与每个邻近块的高度和/或宽度进行比较来确定上下文模型。
作为另一示例,当对是否跳过当前编码单元的解码的信息进行熵编码/熵解码时,可考虑是否跳过邻近块的解码的信息来确定上下文模型。
作为另一示例,当对当前编码单元的预测模式信息进行熵编码/熵解码时,可考虑邻近块的预测模式来确定上下文模型。
作为另一示例,当对是否对当前编码单元执行帧内块复制(IBC)的信息进行熵编码/熵解码时,可考虑是否对邻近块执行IBC的信息来确定上下文模型。
作为又一示例,当对是否将对当前编码单元执行基于子块的合并模式的信息进行熵编码/熵解码时,可考虑邻近块是否已经历基于子块的合并模式和仿射模式的信息来确定上下文模型。
作为又一实例,当对是否对当前编码单元执行仿射模式的信息进行熵编码/熵解码时,可考虑邻近块是否已经历基于子块的合并模式和仿射合并模式的信息来确定上下文模型。
首先,将详细描述将邻近块插入候选列表的步骤S820。
可以将与当前块在空间/时间上相邻的至少一个邻近块(多达V个邻近块)插入当前块的候选列表中。可以将与当前块在空间/时间上相邻的邻近块的至少一条(最多V条)块信息插入当前块的候选列表中。
这里,V可以是0或任何正整数。可以基于当前块的编码参数和候选块的编码参数中的至少一个来确定V。另外,V可以是在编码器/解码器中预设的值或从编码器向解码器用信号发送的值。
当邻近块包括在与当前块相同的图像(画面)、相同画面中的子画面、相同画面中的条带、相同画面中的并行块、相同画面中的分块或相同画面中的CTU中时,邻近块被称作在空间上与当前块相邻的空间邻近块。当邻近块包括在与当前块不同的图像、不同图像中的条带、不同图像中的并行块或不同图像中的CTU中时,邻近块被称作在时间上与当前块相邻的时间邻近块。
在下文中,将参照图9至图23详细描述将上述空间邻近块或时间邻近块插入候选列表中的实施例。编码器或解码器可通过使用下面描述的方法中的至少一个或至少一个组合将当前块的空间邻近块或时间邻近块添加到当前块的候选列表或将当前块的空间邻近块或时间邻近块插入当前块的候选列表中。
图9和图10是示出根据本发明的一个实施例的将与当前块相邻的邻近块插入候选列表的方法的示图。
可将与当前块相邻的至少一个邻近块(最多V个邻近块)插入当前块的候选列表中。这里,V可以是0或任何正整数。在这种情况下,邻近块与当前块相邻可表示当前块的边界和顶点中的至少一个与邻近块的边界和顶点中的至少一个接触。
这里,位于距当前块的上端位置与当前块的垂直尺寸相应的距离内的块可以被称为与当前块相邻的邻近块。这里,位于距当前块的左端位置与当前块的水平尺寸相应的距离内的块可以被称为与当前块相邻的邻近块。
可以优先将与当前块的边界相邻的邻近块插入候选列表中,然后可以将与当前块的顶点相邻的邻近块插入候选列表中。可以优先将与当前块的顶点相邻的邻近块插入候选列表中,然后可以将与当前块的边界相邻的邻近块插入候选列表中。
与当前块的左侧边界相邻的邻近块可优先被插入候选列表中,并且与当前块的上边界相邻的邻近块可接着被插入候选列表中。与当前块的上方边界相邻的邻近块可优先被插入候选列表中,并且与当前块的左侧边界相邻的邻近块可接着被插入候选列表中。
即使在当前块与邻近块之间存在至少一个块的情况下,也可以将邻近块表示为与当前块相邻。例如,参照图9,块E、F、H、I、K、L、N和R可以表示为与当前块相邻。
因为图9和图10中的灰色块与当前块X相邻,所以图9和图10中的灰色块表示可以插入候选列表中的邻近块。这里,块B、C和D可以是由父节点的三叉树分区产生的子块,块E、F和G可以是由父块的水平三叉树分区产生的子块,块P和Q可以是由父块的水平二叉树分区产生的子块,块R和S可以是由父块的垂直二叉树分区产生的子块,块H、I、J和K可以是由父块的四叉树分区产生的子块,并且块L、M、N和O可以是由父块的四叉树分区产生的子块。在随后的附图中通常使用该块分区示例。
在这个实例中,图9的实例中的候选列表可被配置为包括与当前块X相邻的块A、B、C、D和E中的至少一个块。在图10的示例中,候选列表被配置为包括与当前块X的相邻块A、B、C、D、G、J、M、O、P、Q和S中的至少一个块。
图11和图12是示出根据本发明的一个实施例的依据当前块和邻近块之间的边界的长度将与当前块相邻的邻近块插入候选列表中的方法的示图。
在与当前块接触的邻近块中,可将最多V个邻近块插入当前块的候选列表中。在通过等于或大于N或更大的水平边界或垂直边界长度与当前块接触的邻近块中,可将最多V个邻近块插入当前块的候选列表中。
当在当前块的邻近块中没有以等于或大于N的边界长度与当前块接触的邻近块时,用N-K替换N,并且满足改变的条件的邻近块可用于构建当前块的候选列表。这里,K可以表示大于零的正整数。也就是说,在以N-K或更大且小于N的边界长度与当前块接触的邻近块中,可将最多V个邻近块插入当前块的候选列表中。
例如,N可以表示为2的n次幂(=2n)的正整数(诸如2、4、8、16等)。可选地,可以根据当前块的编码参数和候选块的编码参数中的至少一个来确定N。另外,N可以是在编码器/解码器中预设的值或从编码器向解码器用信号发送的值。
例如,与当前块接触的邻近块可以按照边界长度减小的顺序优先插入候选列表中。例如,与当前块接触的邻近块可以按照边界长度增加的顺序优先插入候选列表中。
在以从N到M的范围的边界长度与当前块接触的邻近块中,可将最多V个邻近块插入当前块的候选列表中。这里,M和N中的每个可以表示为2的n次幂(=2n)的正整数(诸如2、4、8、16等)。
在图11中,因为灰色块中的每个与当前块X接触并且在当前块与相应邻近块之间具有N或更大的边界长度,所以灰色块表示可插入候选列表中的邻近块。例如,块X是32×32尺寸的块,块A表示16×16尺寸的块,块B和D是4×16尺寸的块,块C是8×16尺寸的块,块E和F是16×4尺寸的块,块F是16×8尺寸的块,块H、I、J、K、L、M、N和O是8×8尺寸的块,块P和Q是16×8尺寸的块,块R和S是8×16尺寸的块。通常在附图的后续图中使用这些块尺寸示例。
例如,在图11的示例中,与当前块接触的边界长度为8或更大的邻近块可包括在候选列表中。在这种情况下,当前块X的候选列表被配置为包括块C、G、M、O、P和Q中的至少一个。
在图12中,因为灰色块中的每个与当前块X接触并且在当前块与相应邻近块之间具有N或更大的边界长度,所以灰色块表示可插入候选列表中的邻近块。例如,与当前块接触的具有16或更大的边界长度的邻近块可包括在候选列表中。在这种情况下,候选列表被配置为包括块G。
图13和图14是示出根据本发明的一个实施例的依据邻近块的尺寸将与当前块相邻的邻近块插入候选列表中的方法的示图。
依据每个邻近块的尺寸,可将当前块的所有邻近块中的最多V个邻近块插入当前块的候选列表中。在下文中,块的尺寸可以表示水平尺寸、垂直尺寸和面积中的至少一个。
例如,可将尺寸为M×N或更大的邻近块中的最多V个邻近块插入当前块的候选列表中。作为另一实例,可将具有M×N或更小的尺寸的邻近块中的最多V个邻近块插入当前块的候选列表中。
作为又一实例,可将具有从M×N到P×Q的范围内的尺寸的邻近块中的最多V个邻近块插入当前块的候选列表中。这里,P可以表示块的水平尺寸,Q可以表示块的垂直尺寸,P和Q中的每个可以是正整数。
作为又一实例,当特定邻近块的水平尺寸和垂直尺寸中的至少一个大于M或N时,可将邻近块插入候选列表中。
作为又一实例,可将当前块的所有邻近块中的具有等于或大于M与N的乘积的面积的邻近块中的最多V个邻近块插入当前块的候选列表中。作为又一实例,可将当前块的所有邻近块中的具有等于或小于M与N的乘积的面积的邻近块中的最多V个邻近块插入当前块的候选列表中。作为又一实例,可将在当前块的所有邻近块中具有从M与N的乘积到P与Q的乘积的范围内的面积的邻近块中的最多V个邻近块插入当前块的候选列表中。
这里,M可以表示块的水平尺寸,N可以表示块的垂直尺寸,M和N中的每个可以是正整数。另外,M和N可以是相同的值或不同的值。可以根据当前块的编码参数和候选块的编码参数中的至少一个来确定M和N中的至少一个。另外,M和N中的至少一个可以是在编码器/解码器中预设的值或从编码器向解码器用信号发送的值。
例如,与当前块相邻的邻近块可以按块尺寸减小的顺序优先插入候选列表中。或者,与当前块相邻的邻近块可以按块尺寸增加的顺序优先插入候选列表中。
作为又一实例,当特定邻近块的尺寸等于或大于当前块时,可将邻近块插入候选列表中。可选地,当特定邻近块的尺寸等于或小于当前块时,可将邻近块插入候选列表中。
在图13中,因为其具有等于或大于M×N的尺寸的尺寸,所以灰色块表示可插入候选列表中的邻近块。例如,当特定邻近块具有16×8的尺寸或8×16的尺寸并且邻近块可插入候选列表中时,当前块X的候选列表被配置为包括块A、C、P、Q和S中的至少一个。
在图14中,因为其具有等于或大于M与N的乘积(M×N)的面积,所以灰色块表示可插入候选列表中的邻近块。例如,当特定邻近块具有128(=16×8)或(=8×16)的面积时,可将该邻近块插入候选列表中,并且当前块X的候选列表被配置为包括块A、C、F、P、Q、R和S中的至少一个。
图15和图16是示出根据本发明的一个实施例的依据邻近块的深度将与当前块相邻的邻近块插入候选列表中的方法的示图。
依据每个邻近块的深度,可将当前块的所有邻近块中的最多V个邻近块插入当前块的候选列表中。
例如,可将邻近块中具有等于或大于K的深度的最多V个邻近块插入当前块的候选列表中。可选地,可将邻近块中具有等于或小于K的深度的最多V个邻近块插入当前块的候选列表中。
另外可选地,可将当前块的所有邻近块中的深度在K到L的范围内的邻近块中的最多V个邻近块插入当前块的候选列表中。这里,L可以是0或任何正整数。
这里,K可以是0或任何正整数。可以基于当前块的编码参数和候选块的编码参数中的至少一个来确定K。另外,K可以是在编码器/解码器中预设的值或从编码器向解码器用信号发送的值。
例如,与当前块相邻的邻近块可以按照分区深度减小的顺序优先插入候选列表中。可选地,与当前块相邻的邻近块可以按照分区深度增大的顺序优先插入候选列表中。
作为又一实例,当特定邻近块具有等于或大于当前块的深度的深度时,可将邻近块插入候选列表中。作为又一实例,当特定邻近块具有等于或小于当前块的深度的深度时,可将邻近块插入候选列表中。
在图15中,因为其具有等于或大于K的深度,所以灰色块是可以插入候选列表中的邻近块。例如,当前块X具有深度1,块A具有深度2,并且块B、C、D、E、F、G、H、I、J、K、L、M、N、O、P、Q、R和S具有深度3。这些块深度示例可通用于附图的后续图中。例如,当特定邻近块具有等于或大于3的深度且邻近块可插入候选列表中时,当前块X的候选列表被配置为包括块B、C、D、E、F、G、J、K、M、O、P、Q和S中的至少一个。
在图16中,因为灰色块具有等于或小于K的深度,所以该灰色块是可以插入候选列表中的邻近块。例如,当特定邻近块具有等于或小于2的深度且邻近块可插入候选列表中时,当前块X的候选列表被配置为包括块A。
图17和图18是示出根据本发明的实施例的依据邻近块的分区类型将与当前块相邻的邻近块插入候选列表中的方法的示图。
依据每个邻近块的分区类型,可将当前块的所有邻近块中的最多V个邻近块插入当前块的候选列表中。
例如,可将由当前块的邻近块中的四叉树分区产生的四叉树块中的至少一个插入当前块的候选列表中。可选地,可将由当前块的邻近块中的二叉树分区产生的二叉树块中的至少一个插入当前块的候选列表中。可选地,可将由当前块的邻近块中的三叉树分区产生的三叉树块中的至少一个插入当前块的候选列表中。
这里,二叉树分区可指节点具有不同尺寸的非对称二叉树分区以及节点具有相同尺寸的对称二叉树分区。另外,三叉树分区可以指设置在中间块两侧的上方块和下方块具有不同的尺寸或者设置在中间块两侧的左侧块和右侧块具有不同的尺寸的非对称三叉树分区,以及上方块和下方块具有相同的尺寸或者左侧块和右侧块具有相同的尺寸的对称三叉树分区。
在与当前块相邻的邻近块中,四叉树分区的邻近块、二叉树分区的邻近块和三叉树分区的邻近块可以按照这个顺序被顺序地插入候选列表中。可选地,在当前块的邻近块中,由三叉树分区产生的邻近块、由二叉树分区产生的邻近块以及由四叉树分区产生的邻近块可以按照这个顺序被顺序地插入候选列表中。
另外可选地,当特定邻近块的分区类型与当前块的分区类型相同时,可将邻近块插入候选列表中。另外可选地,当特定邻近块的分区类型与当前块的分区类型不同时,可将邻近块插入候选列表中。
图17示出由于灰色块是具有二叉树分区类型的邻近块而可将灰色块插入候选列表中的状态。例如,块X、A、H、I、J、K、L、M、N和O是四叉树块,块B、C、D、E、F和G是三叉树块,而块P、Q、R和S是二叉树块。这些块分区类型示例通常用于附图的后续图中。例如,当特定邻近块是三叉树分区块时,可以将邻近块插入候选列表中。因此,当前块X的候选列表被配置为包括块B、C、D、E、F和G中的至少一个。
图18示出由于灰色块是具有与当前块相同的分区类型的邻近块,因此可将灰色块插入候选列表中的状态。例如,在当前块X是四叉树块时,可将四叉树邻近块插入候选列表中。因此,当前块X的候选列表被配置为包括块A、J、K、M和O中的至少一个。
图19和图20是示出根据本发明的一个实施例的依据邻近块的块形式将与当前块相邻的邻近块插入候选列表的方法的示图。
依据每个邻近块的块形式,可将当前块的所有邻近块中的最多V个邻近块插入当前块的候选列表中。
例如,可将当前块的邻近块中的具有正方形形式的至少一个邻近块插入当前块的候选列表中。可选地,可将当前块的邻近块中的具有非正方形形式(长方形形式)的至少一个邻近块插入当前块的候选列表中。
在当前块的邻近块中,将正方形邻近块优先插入候选列表中,并且接着将非正方形邻近块插入候选列表中。在当前块的邻近块中,将非正方形邻近块优先插入候选列表中,并且接着将正方形邻近块插入候选列表中。
另外可选地,当特定邻近块的块形式与当前块的块形式相同时,可将邻近块插入候选列表中。进一步可选地,当特定邻近块的块形式与当前块的块形式不同时,可将邻近块插入候选列表中。
图19示出由于灰色块是具有非正方形块形式的邻近块而可将灰色块插入候选列表中状态。例如,当特定邻近块具有非正方形块形式时,可将邻近块插入候选列表中。因此,当前块X的候选列表被配置为包括块B、C、D、G、Q和S中的至少一个。
图20示出由于灰色块是具有与当前块相同的块形式的邻近块,因此可将灰色块插入候选列表中的状态。例如,在当前块X是正方形块时,可将具有正方形块形式的邻近块插入候选列表中。因此,当前块X的候选列表被配置为包括块A、J、K、M和O中的至少一个。
当在一个或更多个边界或在一个或更多个顶点存在与当前块接触的邻近块时,可依据邻近块的相对边界长度、邻近块的相对块尺寸和邻近块的相对块深度中的至少一个将邻近块插入候选列表中。
例如,当存在边界长度为M的第一邻近块和边界长度为N的第二邻近块时,比较M和N,并且可以根据比较结果将特定邻近块插入候选列表中。
例如,当存在边界长度为4的第一邻近块和边界长度为8的第二邻近块时,可将具有相对长边界长度(即,8)的第二邻近块插入候选列表中。例如,当存在边界长度为16的第一邻近块和边界长度为4的第二邻近块时,可将具有相对短边界长度(即,4)的第二邻近块插入候选列表中。
可选地,当存在尺寸为N×M的第一邻近块和尺寸为P×Q的第二邻近块时,比较两个邻近块的尺寸,并且可根据比较结果仅将特定邻近块插入候选列表中。在这种情况下,N、M、P和Q可以各自是相同的正整数或不同的正整数。
可选地,当存在尺寸为8×8的第一邻近块和尺寸为16×16的第二邻近块时,可将具有相对大尺寸(即,16×16)的第二邻近块插入候选列表中。
进一步可选地,当存在具有块深度M的第一邻近块和具有块深度N的第二邻近块时,比较M和N,并且可以根据比较结果将其中的特定邻近块插入候选列表中。
例如,当存在块深度为0的第一邻近块和块深度为2的第二邻近块时,可将具有相对浅深度0的第一邻近块插入候选列表中。
图21是示出根据本发明的一个实施例的按照编码/解码的顺序将邻近块插入候选列表中的方法的示图。
可根据邻近块被编码/解码的顺序将当前块的所有邻近块中较早的最多V个邻近块插入当前块的候选列表中。这里,编码/解码顺序是水平优先级顺序、垂直优先级顺序、Z形顺序、Z字形顺序、右上对角线顺序、左下对角线顺序、光栅顺序、深度优先级顺序和尺寸优先级顺序中的至少一个。
在图21中,灰色块是可以按照编码/解码的顺序插入候选列表中的邻近块。例如,当按照A、B、C、D、E、F、G、H、I、J、K、L、M、N、O、P、Q、R和S的顺序对邻近块进行编码/解码时,可按照所述顺序将以块A开始的最多Z个邻近块插入候选列表中。图21示出Z为4的情况。在这种情况下,当前块X的候选列表被配置为包括块A、B、C和D。
图22是示出根据本发明的一个实施例的依据与当前块的位置间隔特定距离的邻近块的位置将邻近块插入候选列表的方法的示图。
在位于与当前块相距特定距离的邻近块中,可将最多V个邻近块插入当前块的候选列表中。也就是说,在当前块与特定邻近块之间存在多个块时,可将满足特定条件的最多V个邻近块插入当前块的候选列表中。
可将位于距当前块的特定位置的水平距离为-K×M、+K×M,垂直距离为-1×N和+1×N中的至少一个的一个或更多个块确定为邻近块,并且可将邻近块插入候选列表中。可以将位于与当前块的至少一个特定位置水平距离间隔-K×M或+K×M以及垂直距离间隔-1×N或+1×N的位置的块确定为邻近块,并且可以将邻近块插入候选列表中。
另外,在位于上述位置的邻近块中,可将包括在相对于当前块的特定区域中的块插入当前块的候选列表中。在这种情况下,特定区域可以是在编码器/解码器中预设的区域,或者可以是从编码器向解码器用信号发送的区域。
也就是说,M和N可以指针对当前块中的特定位置的相对距离。当前块中的特定位置可以是(0,0)位置、(宽度-1,0)位置、(宽度,0)位置、(0,高度-1)位置、(0,高度)位置、(-1,-1)位置、(-1,0)位置、(0,-1)位置、(宽度-1,-1)位置、(宽度,-1)位置、(-1,高度-1)位置、(-1,高度)位置、(宽度/2-1,0)位置、(宽度/2,0)位置、(宽度/2+1,0)位置、(0,高度/2-1)位置、(0,高度/2)位置、(0,高度/2+1)位置、(宽度/2-1,-1)位置、(宽度/2,-1)位置、(宽度/2+1,-1)位置、(-1,高度/2-1)位置、(-1,高度/2)位置、和(-1,高度/2+1)位置。
这里,M可以表示基于样点的水平距离,N可以表示基于样点的垂直距离,并且M和N中的每个可以是正整数。另外,M和N可以是相同的值或不同的值。可以根据当前块的编码参数和候选块的编码参数中的至少一个来确定M和N中的至少一个。另外,M和N中的至少一个可以是在编码器/解码器中预设的值或从编码器向解码器用信号发送的值。
这里,M的绝对值的最大值可以是MaxM,并且N的绝对值的最大值可以是MaxN。M的绝对值和N的绝对值可被确定为小于或等于CTU的尺寸的K或L倍。
这里,MaxM和MaxN中的至少一个可以是正整数。可以根据当前块的编码参数和候选块的编码参数中的至少一个来确定MaxM和MaxN中的至少一个。另外,MaxM和MaxN中的至少一个可以是在编码器/解码器中预设的值或从编码器向解码器用信号发送的值。
这里,K和L中的至少一个可以是0或任何正整数。可以根据当前块的编码参数和候选块的编码参数中的至少一个来确定K和L中的至少一个。另外,K和L中的至少一个可以是在编码器/解码器中预设的值或从编码器向解码器用信号发送的值。
当位于由水平距离为-K×M或+K×M以及垂直距离为-1×N或+1×N中的至少一个间隔开的位置的块存在于画面、子画面、条带、并行块、分块、CTU边界、CTU行和CTU列中的至少一个中,或者跨越画面、子画面、条带、并行块、分块、CTU、CTU行和CTU列中的至少一个的边界存在时,可不将相应位置的邻近块插入候选列表中。
当不存在与当前块直接接触的邻近块中的至少一个时,可将位于距当前块的位置特定距离的邻近块插入候选列表中。
当将位于距当前块的位置特定距离的邻近块插入候选列表中时,可根据特定扫描顺序将邻近块插入候选列表中。这里,特定扫描顺序是水平优先级顺序、垂直优先级顺序、Z形顺序、Z字形顺序、右上对角线顺序、左下对角线顺序、光栅顺序、深度优先级顺序和尺寸优先级顺序中的至少一个。另外,可照按距当前块的距离增加的顺序将邻近块插入候选列表中。
在图22中,因为灰色块位于距当前块的位置特定距离,所以该灰色块表示可以插入候选列表中的邻近块。例如,由图22中的对角线指示的部分可表示画面、子画面、条带、并行块、分块、CTU边界、CTU行和CTU列中的至少一个。
如图22的示例中所示,在当前块X为16×16块且M和N各自为16时,将每个不延伸超出画面、子画面、条带、并行块、分块、CTU、CTU行和CTU列的边界的邻近块插入候选列表中。也就是说,当前块X的候选列表被配置为包括块A0、A1、A3、A6、A7、A8、B0、B1、C0、C1、D0、D1、D2、D3、D4、D5、D6、E0、E1、E2、F0、F1、F2、G0、G1、G2、G3、G4和G5中的至少一个。因此,可将存在于针对当前块的位置的相对位置的邻近块插入当前块的候选列表中。
特定块存在于画面、子画面、条带、并行块、分块、CTU边界、CTU行和CTU列中的至少一个的边界的情况可表示特定块属于分别与当前块所属的画面、子画面、条带、并行块、分块、CTU边界、CTU行和CTU列不同的画面、子画面、条带、并行块、分块、CTU边界、CTU行和CTU列中的至少一个,并且可以具体地表示特定块存在于画面、子画面、条带、并行块、分块、CTU边界、CTU行和CTU列中的至少一个的边界。也就是说,这表示特定块存在于位于当前块上方或当前块左侧的画面、子画面、条带、并行块、分块、CTU边界、CTU行和CTU列中的至少一个中。
特定块延伸超出画面、子画面、条带、并行块、分块、CTU边界、CTU行和CTU列中的至少一个的边界的情况可表示特定块属于分别与当前块所属的画面、子画面、条带、并行块、分块、CTU边界、CTU行和CTU列不同的画面、子画面、条带、并行块、分块、CTU边界、CTU行和CTU列中的至少一个,并且可以具体地表示特定块存在于画面、子画面、条带、并行块、分块、CTU边界、CTU行和CTU列中的至少一个中。也就是说,这表示特定块存在于位于当前块上方或当前块左侧的画面、子画面、条带、并行块、分块、CTU边界、CTU行和CTU列中的至少一个中。
图23是示出根据本发明的一个实施例的依据位于与从当前画面、子画面、条带、并行块和分块中选择的至少一个的位置相距特定距离的邻近块的位置将邻近块插入候选列表中的方法的示图。
在位于与当前画面、子画面、条带、并行块、分块、CTU边界、CTU行和CTU列的位置相距特定距离的邻近块中,可将最多V个邻近块插入当前块的候选列表中。也就是说,在当前块与特定邻近块之间存在多个块时,可将邻近块中的最多V个邻近块插入当前块的候选列表中。
位于与当前画面、子画面、条带、并行块、分块、CTU边界、CTU行或CTU列的特定位置相距水平距离K×M和垂直距离1×N中的至少一个的位置的块被确定为当前块的邻近块,并且可将邻近块插入候选列表中。可以将位于与当前画面、子画面、条带、并行块、分块、CTU边界、CTU行和CTU列中的至少一个的特定位置间隔开水平距离K×M和垂直距离L×N中的至少一个的位置的块确定为邻近块,并且可以将邻近块插入候选列表中。
另外,在位于上述位置的邻近块中,可将包括在相对于当前块的特定区域中的块插入当前块的候选列表中。在这种情况下,特定区域可以是在编码器/解码器中预设的区域,或者可以是从编码器向解码器用信号发送的区域。
M和N可以是距当前画面、当前子画面、当前条带、当前并行块、当前分块、当前CTU边界、当前CTU行和当前CTU列中的至少一个的特定位置的绝对距离。当前画面、当前子画面、当前条带、当前并行块、当前分块、当前CTU边界、当前CTU行和当前CTU列中的至少一个的特定位置可以被定义为(0,0)位置。
这里,M可以表示基于样点的水平距离,N可以表示基于样点的垂直距离,并且M和N中的每个可以是2、4、8、16、32等的正整数(即,2的n次幂)。另外,M和N可以是相同的值或不同的值。可以根据当前块的编码参数和候选块的编码参数中的至少一个来确定M和N中的至少一个。另外,M和N中的至少一个可以是在编码器/解码器中预设的值或从编码器向解码器用信号发送的值。
这里,K和L中的至少一个可以是0或任何正整数。可以根据当前块的编码参数和候选块的编码参数中的至少一个来确定K和L中的至少一个。另外,K和L中的至少一个可以是在编码器/解码器中预设的值或从编码器向解码器用信号发送的值。
当不存在与当前块直接接触的邻近块中的至少一个时,可将位于距当前画面、子画面、条带、并行块、分块、CTU边界、CTU行和CTU列的位置特定距离的邻近块插入候选列表中。
当将位于与当前画面、子画面、条带、并行块、分块、CTU边界、CTU行或CTU列的位置相距特定距离的邻近块插入候选列表中时,按照特定扫描顺序插入邻近块。这里,特定扫描顺序可以是水平优先级顺序、垂直优先级顺序、Z形顺序、Z字形顺序、右上对角线顺序、左下对角线顺序、光栅顺序、深度优先级顺序和尺寸优先级顺序中的至少一个。另外,可按照从邻近块到当前块的距离增加的顺序将候选块插入候选列表中。
在图23中,因为灰色块位于距当前画面的位置特定距离,所以该灰色块表示可插入候选列表中的邻近块。
在图22的示例中,当前画面的特定位置是(0,0)位置,当前块X是16×16块,K和L是包括0的正整数,并且M和N各自是16。在这种情况下,可将相对于当前画面的位置(0,0)位于位置(K×M,L×N)的邻近块插入候选列表中。因此,当前块X的候选列表被配置为包括块0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22和23中的至少一个。在位置(K×M,L×N)中,x坐标的K和y坐标的L可以是相同的值或者可以是不同的值。因此,可将存在于基于当前画面、子画面、条带、并行块、分块、CTU边界、CTU行和CTU列中的至少一个的位置的绝对位置的邻近块插入当前块的候选列表中。
依据当前块的编码参数与邻近块的编码参数之间的关系,可以将当前块的所有邻近块中的最多V个邻近块插入当前块的候选列表中。
在当前块的编码参数中的至少一个和与当前块相邻的邻近块的编码参数中的至少一个相同时,可以将邻近块中的最多V个块插入当前块的候选列表中。
例如,在当前块和特定邻近块之间,当预测模式相同时、当帧内亮度预测模式/方向相同时、当帧内色度预测模式/方向相同时、当运动矢量相同时、当运动矢量差相同时、当参考画面列表相同时、当参考画面索引相同时、当参考画面相同时、当帧间预测方向(帧间预测指示符、预测列表利用标志)相同时、当合并模式利用信息相同时、当跳过模式利用信息相同时、当运动矢量预测索引相同时、当合并索引相同时、当运动矢量表示精度相同时、当变换尺寸相同时、当首次变换利用信息相同时、当二次变换利用信息相同时、当首次变换索引相同时、当二次变换索引相同时、当残差信号存在信息相同时、或当量化参数相同时,可将邻近块插入候选列表中。
在当前块的编码参数中的至少一个和与当前块相邻的邻近块的编码参数中的至少一个相似时,可以将邻近块中的最多V个块插入当前块的候选列表中。
例如,在当前块的帧内亮度预测模式/方向与邻近块的帧内亮度预测模式/方向之间的差等于或小于T时、在当前块的运动矢量与邻近块的运动矢量之间的差等于或小于T时、在当前块的运动矢量差与邻近块的运动矢量差之间的差等于或小于T时、或在当前块的参考画面索引与邻近块的参考画面索引之间的差等于或小于T时,可将邻近块插入候选列表中。这里,T可以是整数。
例如,在当前块与邻近块之间的参考画面列表不同但参考画面相同时,或者在当前块与邻近块之间的参考画面索引不同但参考画面相同时,可将邻近块插入候选列表中。
例如,对将被包括在候选列表中的邻近块的编码参数的标识符进行熵编码/熵解码,并且可以依据编码参数之间的相似性将邻近块插入候选列表中。
例如,对将被包括在候选列表中的邻近块的编码参数的标识符进行熵编码,并且可以将具有与编码参数相同的值的邻近块、具有大于编码参数的值的值的邻近块或具有小于编码参数的值的值的邻近块插入候选列表中。
例如,对将被包括在候选列表中的邻近块的编码参数的标识符进行熵解码,并且可以将具有与编码参数相同的值的邻近块、具有大于编码参数的值的值的邻近块或具有小于编码参数的值的值的邻近块插入候选列表中。
作为另一示例,作为存在于参考画面中且位于与当前块相同的空间位置的块的同位块可作为邻近块被插入候选列表中。
例如,可将属于并非当前块所属的画面的画面中的当前画面的参考画面的邻近块中的至少一个邻近块插入候选列表中。属于参考画面的邻近块中的至少一个邻近块被称为时间邻近块。
邻近块可以表示参考画面内的块中位于与当前块在空间上相同的位置的块,或者可以表示与参考画面内的块中位于与当前块在空间上相同的位置的块相邻的块。
在下文中,将详细描述从候选列表中包括的邻近块中选择并确定用于对当前块进行编码/解码的参考块的步骤S830。
在从候选列表中的邻近块中选择并确定将被使用以对当前块进行编码/解码的参考块之前,可使用下面描述的方法中的至少一个或组合来修改候选列表。当使用下面描述的方法的组合时,以特定顺序执行方法以修改候选列表。
包括在候选列表中的每个邻近块被称为候选,并且关于包括在候选列表中的每个邻近块的信息也被称为候选。包括在候选列表中的每个块被称为候选,并且关于包括在候选列表中的每个块的信息也被称为候选。
候选列表中的候选以特定顺序被排序。可以基于当前块的编码参数和候选的编码参数中的至少一个来执行排序。
可以执行排序使得当前块的编码参数的值和候选的编码参数的值以升序排列。可以执行排序使得当前块的编码参数的值和候选的编码参数的值以降序排列。
编码器以候选列表中的候选被确定为参考块的高概率的顺序对候选列表中的候选进行排序,并将短码字长度的候选索引分配给具有高概率的候选,从而提高编码效率。
在这种情况下,编码器或解码器可以将候选列表的尺寸限制为U的最大值。这里,U可以是0或任何正整数。可以基于当前块的编码参数和候选块的编码参数中的至少一个来确定U。另外,U可以是在编码器/解码器中预设的值或从编码器向解码器用信号发送的值。
例如,当候选列表中存在多于U个候选时,可从候选列表消除过多候选。可以根据候选列表中的候选的特定排序顺序来确定将被消除的候选。
编码器或解码器可以从候选列表中消除最多U个候选。这里,U可以是0或任何正整数。可以基于当前块的编码参数和候选块的编码参数中的至少一个来确定U。另外,U可以是在编码器/解码器中预设的值或从编码器向解码器用信号发送的值。
当至少两个候选在候选列表中是重复的时,可从候选列表去除重复候选中的至少一个。此时,重复候选中的候选列表中具有较高排序的候选可留在候选列表中,并且可从候选列表去除具有较低排序的其它候选。这里,当候选的编码参数中的至少一个重叠时,这些参数可以被称为重复候选。
编码器或解码器可将最多U个候选添加到候选列表。这里,U可以是0或任何正整数。可以基于当前块的编码参数和候选块的编码参数中的至少一个来确定U。另外,U可以是在编码器/解码器中预设的值或从编码器向解码器用信号发送的值。
将候选添加到候选列表,直到候选列表中的候选的数量达到最大数量为止。在这种情况下,可将重复候选添加到候选列表。
当编码器或解码器将候选添加到候选列表时,可以使用步骤S820的实施例中的至少一个或组合。
编码器或解码器可将包括在候选列表中的最大W个邻近块(候选)确定为当前块的参考块。编码器或解码器可确定包括在候选列表中的邻近块的最多W条块信息(候选)作为关于当前块的参考块的信息。
这里,W可以是0或任何正整数。可以基于当前块的编码参数和候选块的编码参数中的至少一个来确定W。另外,W可以是在编码器/解码器中预设的值或从编码器向解码器用信号发送的值。
例如,编码器或解码器可以将候选列表中的最多W个候选确定为当前块的参考块,以便在利用三角形分区模式预测当前块时对当前块进行编码/解码。例如,W可以是2。在当前块的尺寸为8×8或更大时,可以使用三角形分区模式对当前块进行编码/解码。三角形分区模式可以是合并模式的示例。用于对当前块进行编码/解码的候选列表可以指合并候选列表。可以在编码单元级用信号发送指示是否将利用三角形分区模式对当前块进行解码的信息。
在利用三角形分区模式对当前块进行编码/解码的情况下,将当前块划分为两个三角形区域。在这种情况下,可以对用于将当前块划分为两个三角形区域的分区方向信息进行编码/解码。为了对两个三角形区域中的每个进行解码,可以从候选列表中选择用于对相应三角形区域进行编码/解码的邻近块。
可以对相应三角形区域的索引进行编码/解码,以推导每个三角形区域的运动信息。例如,在当前块被划分为第一区域和第二区域时,可以对用于对第一区域进行编码/解码的第一索引和用于对第二区域进行编码/解码的第二索引进行编码/解码。当确定关于当前块的参考块的两条信息时,由第一索引指示的信息可以是关于当前块的第一参考块的信息,并且由第二索引指示的信息可以是关于当前块的第二参考块的信息。
编码器或解码器可以通过使用第一索引和第二索引从当前块的候选列表中选择第一邻近块和第二邻近块。在这种情况下,第一区域和第二区域可以共享基于尚未被划分的当前块而推导的一个候选列表。编码器或解码器可以使用选择的第一邻近块的信息来对第一区域进行编码/解码,并且可以使用选择的第二邻近块的信息来对第二区域进行编码/解码。
在上述三角形分区模式中,在对角线方向上划分当前块,并且对每个区域执行预测。然而,三角形分区模式也可以表示下面描述的操作。
当以三角形分区模式对当前块进行编码/解码时,可基于当前块的第一索引和第二索引从单个候选列表选择第一邻近块和第二邻近块。编码器或解码器可使用第一邻近块的信息推导当前块的第一预测块,并且使用第二邻近块的信息推导当前块的第二预测块。
编码器或解码器可以通过计算第一预测块和第二预测块的加权和来产生当前块的最终预测块。在这种情况下,可以通过对第一预测块的第一区域进行加权并对第二预测块的第二区域进行加权来执行预测块的加权和。
第一邻近块可表示当前块的第一参考块,并且第二邻近块可表示当前块的第二参考块。第一邻近块的信息可表示当前块的第一参考块的信息,并且第二邻近块的信息可表示当前块的第二参考块的信息。
编码器或解码器可以使用确定的参考块中的至少一个来对当前块进行编码/解码。编码器或解码器可以使用确定的参考块的至少一条块信息对当前块进行编码/解码。
确定的参考块的至少一条块信息可被确定为当前块的信息。确定的参考块中的至少一个参考块的至少一条块信息可被确定为当前块的块信息。
在下文中,将描述编码器或解码器将候选列表中的特定邻近块确定为参考块的方法。编码器或解码器可使用下面描述的方法中的至少一个或至少一个组合将候选列表中的候选确定为参考块。
例如,编码器或解码器可将候选列表中的第Y个候选确定为参考块。这里,Y可以是0或任何正整数。可以基于当前块的编码参数和候选块的编码参数中的至少一个来确定Y。另外,Y可以是在编码器/解码器中预设的值或从编码器向解码器用信号发送的值。
由于可以由编码器/解码器识别候选列表中的第Y个候选,因此可以不对指定参考块的候选索引进行熵编码/熵解码。可以根据关于将候选存储在候选列表中的方法的上述实施例来执行候选列表中的候选的排序以确定第Y个候选。
作为另一实例,编码器或解码器可减小或缩短候选列表,使得最大Y个候选保留在候选列表中且将Y个候选确定为参考块。这里,Y可以是0或任何正整数。可以基于当前块的编码参数和候选块的编码参数中的至少一个来确定Y。另外,Y可以是在编码器/解码器中预设的值或从编码器向解码器用信号发送的值。
例如,编码器或解码器可通过在候选列表中的候选中仅留下具有被选择为参考块的最高概率的Y个候选而将Y个候选确定为参考块。
在这种情况下,由于可以由编码器/解码器识别候选列表中的Y个候选,因此可以不对指定参考块的候选索引进行熵编码/熵解码。
可选地,编码器或编码器可以通过对指示候选列表中的特定候选的候选索引进行熵编码/熵解码来确定参考块。这里,候选索引可以是候选列表中的特定候选的位置、顺序等被映射到其上的值。编码器或解码器可以使用所确定的参考块(或所确定的参考块的至少一条块信息)对当前块进行编码/解码。
也就是说,编码器可使用从候选列表中的候选中选择的参考块(或参考块的至少一条块信息)对当前块进行编码,并对参考块的候选索引进行熵编码。另一方面,解码器可对参考块的候选索引进行熵解码,并使用候选列表中的候选中由候选索引指示的候选作为参考块(或参考块的至少一条块信息)来对当前块进行解码。
例如,当候选列表由{A,B,C,D,E,F}组成时,候选列表中的候选的索引可被分配{0,1,2,3,4,5}。当候选索引为2时,候选C被确定为参考块。另外,当候选索引为1时,候选B被确定为参考块的块信息。
编码器或解码器可对最多Y个候选索引进行熵编码/熵解码。当对多个候选索引进行熵编码/熵解码时,可以分别使用由多个候选索引指示的多个参考块对当前块进行编码/解码。
这里,Y可以是0或任何正整数。可以基于当前块的编码参数和候选块的编码参数中的至少一个来确定Y。另外,Y可以是在编码器/解码器中预设的值或从编码器向解码器用信号发送的值。
也就是说,编码器可以使用候选列表中的候选中的确定的Y个参考块来对当前块进行编码,并且可以对Y个参考块的Y个候选索引进行熵编码。另一方面,解码器可对Y个参考块的Y个候选索引进行熵解码,并且可使用分别由候选列表中的候选中的Y个候选索引指示的Y个参考块来对当前块进行解码。
图24是示出根据本发明的一个实施例的画面、子画面、条带、并行块和分块的边界的示图。
图24示出根据本发明的一个实施例的画面、子画面、条带、并行块和分块的边界。在图24中,(a)示出当前块中存在右侧边界和下方边界的情况,(b)示出当前块中存在下方边界的情况,(c)示出当前块中存在右侧边界的情况。
图25是示出根据本发明的一个实施例的块分区方案的示图。
图25示出根据本发明的一个实施例的块分区方案。在图25中,(a)示出垂直二叉树分区,(b)示出水平二叉树分区,(c)示出垂直三叉树分区,并且(d)示出水平三叉树分区。
可以在编码器和解码器中以相同的方法执行以上实施例。
以上实施例中的至少一个或组合可以用于对视频进行编码/解码。
应用于以上实施例的顺序在编码器和解码器之间可以是不同的,或者应用于以上实施例的顺序在编码器和解码器中可以是相同的。
可以对每个亮度信号和色度信号执行以上实施例,或者可以对亮度信号和色度信号相同地执行以上实施例。
应用本发明的以上实施例的块状形式可以具有正方形形式或非正方形形式。
可以依据编码块、预测块、变换块、块、当前块、编码单元、预测单元、变换单元、单元和当前单元中的至少一个的尺寸来应用本发明的以上实施例。这里,尺寸可以被定义为最小尺寸或最大尺寸或最小尺寸和最大尺寸两者,使得应用以上实施例,或者可以被定义为应用以上实施例的固定尺寸。另外,在以上实施例中,第一实施例可以应用于第一尺寸,并且第二实施例可以应用于第二尺寸。换句话说,可以依据尺寸组合应用以上实施例。另外,当尺寸等于或大于最小尺寸并且等于或小于最大尺寸时,可以应用以上实施例。换句话说,当块尺寸包括在特定范围内时,可以应用以上实施例。
例如,在当前块的尺寸为8×8或更大时,可以应用以上实施例。例如,在当前块的尺寸为4×4或更大时,可以应用以上实施例。例如,在当前块的尺寸为16×16或更大时,可以应用以上实施例。例如,在当前块的尺寸等于或大于16×16并且等于或小于64×64时,可以应用以上实施例。
可以依据时间层来应用本发明的以上实施例。为了识别可应用以上实施例的时间层,可用信号发送相应标识符,并且可将以上实施例应用于由相应标识符识别的指定时间层。这里,标识符可以被定义为可以应用以上实施例的最低层或最高层或最低层和最高层两者,或者可以被定义为指示应用实施例的特定层。另外,可以定义应用实施例的固定时间层。
例如,在当前图像的时间层是最低层时,可以应用以上实施例。例如,在当前图像的时间层标识符是1时,可以应用以上实施例。例如,在当前图像的时间层是最高层时,可以应用以上实施例。
在参考画面列表构建处理和参考画面列表修改处理中,使用参考画面集中的至少一个,并且参考画面集成为参考画面列表L0、L1、L2和L3中的一个或更多个参考画面列表。
当在去块滤波期间计算边界强度时,可使用当前块的一个或更多个运动矢量(最少一个运动矢量和最多N个运动矢量)。这里,N可以是等于或大于1的正整数。N可以是1、2、3、4等。
即使在运动矢量的精度是16-pel单位、8-pel单位、4-pel单位、整数-pel单位、1/2-pel单位、1/4-pel单位、1/8-pel单位、1/16-pel单位、1/32-pel单位或1/64-pel单位的情况下,也可以使用上述实施例。在当前块的编码/解码处理中,可以从上述像素单元中自适应地选择运动矢量的像素单元(精度)。
应用本发明的实施例的块的形状可以是正方形或非正方形。
由编码器熵编码并由解码器熵解码的用于自适应环内滤波的语法元素中的至少一个可经历从二值化、逆二值化和熵编码/熵解码中选择的至少一个处理。这里,对于二值化/逆二值化和熵编码/熵解码,可以使用以下技术中的至少一种,包括:带符号的0阶Exp_Golomb二值化/逆二值化方法(se(v))、带符号的k阶Exp_Golomb二值化/逆二值化方法(sek(v))、用于无符号正整数的0阶Exp_Golomb(ue(v))、用于无符号正整数的k阶Exp_Golomb二值化/逆二值化方法(uek(v))、固定长度二值化/逆二值化方法(f(n))、截断莱斯二值化/逆二值化方法或截断一元二值化/逆二值化方法(tu(v)),截断二元二值化/逆二值化方法(tb(v))、上下文自适应算术编码/解码方法(ae(v))、基于字节的位串(b(8))、用于有符号的整数(i(n))的二值化/逆二值化方法、用于无符号的正整数(u(n))的二值化/逆二值化方法以及一元二值化/逆二值化方法。
本发明不限于仅根据上述实施例中的一个特定实施例对当前块进行编码/解码的情况,而是涵盖使用上述实施例的任何组合对当前块进行编码/解码的情况。
可以定义应用本发明的以上实施例的条带类型或并行块组类型,并且可以依据相应的条带类型或并行块组类型来应用以上实施例。
在上述实施例中,基于具有一系列步骤或单元的流程图来对方法进行描述,但是本发明不限于步骤的顺序,而是某些步骤可以与其他步骤同时执行或以不同的顺序执行。另外,本领域普通技术人员应当理解,流程图中的步骤并不相互排斥,在不影响本发明的范围的情况下,可以向流程图中添加其他步骤,或者可以从流程图中删除某些步骤。
实施例包括示例的各个方面。可以不对用于各个方面的所有可能的组合进行描述,但是本领域技术人员将能够认识到不同的组合。因此,本发明可以包括在权利要求的范围内的所有替换、修改和改变。
可以以可由各种计算机组件执行的并且被记录在计算机可读记录介质中的程序指令的形式实现本发明的实施例。计算机可读记录介质可以包括独立的程序指令、数据文件、数据结构等或者程序指令、数据文件、数据结构等的组合。记录在计算机可读记录介质中的程序指令可以是为本发明特别设计和构造的,或者是计算机软件技术领域的普通技术人员公知的。计算机可读记录介质的示例包括:磁性记录介质(诸如硬盘、软盘和磁带);光学数据存储介质(诸如CD-ROM或DVD-ROM);磁优化介质(诸如光软盘);以及被特别地构造成存储和实现程序指令的硬件装置(诸如只读存储器(ROM)、随机存取存储器(RAM)、闪存等)。程序指令的示例不仅包括被编译器格式化的机械语言代码,而且包括可以由计算机使用解释器实现的高级语言代码。硬件装置可以被配置为由一个或更多个软件模块操作以执行根据本发明的处理,或者反之亦然。
尽管已经根据诸如详细元件的特定项目以及有限的实施例和附图描述了本发明,但是它们仅被提供以帮助更综合地理解本发明,并且本发明不限于上述实施例。本发明所属领域的技术人员应当理解,可以根据上面的描述进行各种修改和改变。
因此,本发明的精神不应被限于上述实施例,并且所附权利要求及其等同物的整个范围将落入本发明的范围和精神内。
工业适用性
本发明可用于对图像进行编码或解码。

Claims (20)

1.一种图像解码方法,包括:
对包括在当前画面中的当前块的块分区信息进行解码;
根据块分区信息确定当前块的分区方案;以及
使用确定的分区方案对当前块进行分区,
其中,根据当前块是否包括当前画面的边界来确定分区方案。
2.根据权利要求1所述的方法,其中,分区方案是从四叉树分区、水平二叉树分区、垂直二叉树分区、水平三叉树分区和垂直三叉树分区中选择的任何一种方案。
3.根据权利要求2所述的方法,其中,在当前块包括当前画面的右侧边界时,分区方案被确定为垂直二叉树分区。
4.根据权利要求3所述的方法,其中,在当前块的高度超过当前块内的最大变换块的尺寸时,分区方案被确定为除垂直二叉树分区之外的任何一种分区方案。
5.根据权利要求4所述的方法,其中,最大变换块的尺寸是预定义值。
6.根据权利要求2所述的方法,其中,在当前块包括当前画面的下方边界时,分区方案被确定为水平二叉树分区。
7.根据权利要求6所述的方法,其中,在当前块的宽度超过当前画面内的最大变换块的尺寸时,分区方案被确定为除水平二叉树分区之外的任何一种分区方案。
8.根据权利要求7所述的方法,其中,最大变换块的尺寸是预设值。
9.根据权利要求2所述的方法,其中,在当前块至少包括当前画面的右侧边界或左侧边界时,分区方案被确定为除三叉树分区之外的任何一种方案。
10.根据权利要求2所述的方法,其中,在当前块包括当前画面的右侧边界和左侧边界时,分区方案被确定为四叉树分区。
11.一种图像编码方法,包括:
确定包括在当前画面中的当前块的分区方案;
使用确定的分区方案对当前块进行分区;以及
对当前块的块分区信息进行编码,
其中,根据当前块是否包括当前画面的边界来确定分区方案。
12.根据权利要求11所述的方法,其中,分区方案是从四叉树分区、水平二叉树分区、垂直二叉树分区、水平三叉树分区和垂直三叉树分区中选择的任何一种方案。
13.根据权利要求12所述的方法,其中,在当前块包括当前画面的右侧边界时,分区方案被确定为垂直二叉树分区。
14.根据权利要求13所述的方法,其中,在当前块的高度超过当前画面内的最大变换块的尺寸时,分区方案被确定为除垂直二叉树分区之外的任何一种方案。
15.根据权利要求14所述的方法,其中,最大变换块的尺寸是预定义值。
16.根据权利要求12所述的方法,其中,在当前块包括当前画面的下方边界时,分区方案被确定为水平二叉树分区。
17.根据权利要求16所述的方法,其中,在当前块的宽度超过当前画面内的最大变换块的尺寸时,分区方案被确定为除水平二叉树分区之外的任何一种方案。
18.根据权利要求17所述的方法,其中,最大变换块的尺寸是预设值。
19.根据权利要求12所述的方法,其中,在当前块至少包括当前画面的右侧边界或左侧边界时,分区方案被确定为除三叉树分区之外的任何一种方案。
20.一种存储由图像解码设备接收以重建当前块的比特流的计算机可读记录介质,
其中,比特流包含当前块的块分区信息,
块分区信息用于确定当前块的分区方案;
被确定为当前块的分区方案的分区方案被用于对当前块进行分区,并且
分区方案是根据当前块是否包括当前画面的边界而确定的。
CN201980043248.7A 2018-06-27 2019-06-27 图像编码/解码方法和装置以及存储比特流的记录介质 Pending CN112369022A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2018-0074318 2018-06-27
KR20180074318 2018-06-27
PCT/KR2019/007832 WO2020004987A1 (ko) 2018-06-27 2019-06-27 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체

Publications (1)

Publication Number Publication Date
CN112369022A true CN112369022A (zh) 2021-02-12

Family

ID=68987474

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980043248.7A Pending CN112369022A (zh) 2018-06-27 2019-06-27 图像编码/解码方法和装置以及存储比特流的记录介质

Country Status (4)

Country Link
US (1) US11973944B2 (zh)
KR (1) KR20200001554A (zh)
CN (1) CN112369022A (zh)
WO (1) WO2020004987A1 (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012118359A2 (ko) 2011-03-03 2012-09-07 한국전자통신연구원 색차 성분 양자화 매개 변수 결정 방법 및 이러한 방법을 사용하는 장치
CN116208767B (zh) * 2018-09-03 2023-11-28 华为技术有限公司 一种对码流进行解码的方法、装置以及存储码流的设备
EP3850840A1 (en) * 2018-09-13 2021-07-21 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Affine linear weighted intra predictions
CN112840649A (zh) * 2018-09-21 2021-05-25 Lg电子株式会社 图像编码系统中通过使用块分割对图像解码的方法及其装置
WO2020072401A1 (en) * 2018-10-02 2020-04-09 Interdigital Vc Holdings, Inc. Method and apparatus for video encoding and decoding using list of predictor candidates
MY189399A (en) * 2019-03-21 2022-02-09 Samsung Electronics Co Ltd Method and device for encoding video having block size set for each block shape, and method and device for decoding video
JP7307191B2 (ja) 2019-04-01 2023-07-11 北京字節跳動網絡技術有限公司 履歴に基づく動きベクトル予測のための補間フィルタの使用
EP3942811A4 (en) 2019-04-24 2022-06-15 ByteDance Inc. CONSTRAINTS ON THE REPRESENTATION OF A DIFFERENTIAL MODULATION BY CODED PULSES OF QUANTIFIED RESIDUE FOR A CODED VIDEO
KR20220002292A (ko) 2019-05-01 2022-01-06 바이트댄스 아이엔씨 양자화된 잔차 차동 펄스 코드 변조 코딩을 사용하는 인트라 코딩된 비디오
WO2020223615A1 (en) * 2019-05-02 2020-11-05 Bytedance Inc. Coding mode based on a coding tree structure type
CN117221538A (zh) * 2019-07-08 2023-12-12 Lg电子株式会社 解码和编码设备、数据发送设备及计算机可读存储介质
US11553197B2 (en) * 2019-08-05 2023-01-10 Tencent America LLC Method and apparatus for intra picture block compensation
WO2021023262A1 (en) 2019-08-06 2021-02-11 Beijing Bytedance Network Technology Co., Ltd. Using screen content coding tool for video encoding and decoding
CN114270856A (zh) 2019-08-20 2022-04-01 北京字节跳动网络技术有限公司 视频处理中的备选插值滤波器的选择性使用
CN114342400A (zh) 2019-09-02 2022-04-12 北京字节跳动网络技术有限公司 基于色彩格式的编解码模式确定
KR102649584B1 (ko) 2019-09-21 2024-03-21 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 크로마 인트라 모드에 기초한 크기 제한

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180033030A (ko) * 2016-09-23 2018-04-02 세종대학교산학협력단 적응적 블록 분할에 기반한 비디오 신호 처리 방법 및 장치
KR20180041576A (ko) * 2016-10-14 2018-04-24 세종대학교산학협력단 영상 부호화 방법/장치, 영상 복호화 방법/장치 및 비트스트림을 저장한 기록 매체
CN108141604A (zh) * 2015-06-05 2018-06-08 英迪股份有限公司 图像编码和解码方法和图像解码设备

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6711211B1 (en) 2000-05-08 2004-03-23 Nokia Mobile Phones Ltd. Method for encoding and decoding video information, a motion compensated video encoder and a corresponding decoder
WO2016148438A2 (ko) 2015-03-13 2016-09-22 엘지전자 주식회사 비디오 신호의 처리 방법 및 이를 위한 장치
US10542294B2 (en) * 2016-03-16 2020-01-21 Mediatek Inc. Method and apparatus of video data processing with restricted block size in video coding
CN116866617A (zh) * 2016-09-20 2023-10-10 株式会社Kt 对视频进行解码和编码的方法和传输视频数据的方法
US10779004B2 (en) 2016-10-12 2020-09-15 Mediatek Inc. Methods and apparatuses of constrained multi-type-tree block partition for video coding
EP3383043A1 (en) * 2017-03-27 2018-10-03 Thomson Licensing Methods and apparatus for picture encoding and decoding
EP3682633A1 (en) * 2017-10-09 2020-07-22 Huawei Technologies Co., Ltd. Apparatus and method for image coding with boundary partition processing
CN112136327A (zh) * 2018-05-30 2020-12-25 华为技术有限公司 用于边界分割的方法和装置
US10887594B2 (en) * 2018-07-05 2021-01-05 Mediatek Inc. Entropy coding of coding units in image and video data
US11539982B2 (en) * 2019-11-01 2022-12-27 Qualcomm Incorporated Merge estimation region for multi-type-tree block structure

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108141604A (zh) * 2015-06-05 2018-06-08 英迪股份有限公司 图像编码和解码方法和图像解码设备
KR20180033030A (ko) * 2016-09-23 2018-04-02 세종대학교산학협력단 적응적 블록 분할에 기반한 비디오 신호 처리 방법 및 장치
KR20180041576A (ko) * 2016-10-14 2018-04-24 세종대학교산학협력단 영상 부호화 방법/장치, 영상 복호화 방법/장치 및 비트스트림을 저장한 기록 매체

Also Published As

Publication number Publication date
US11973944B2 (en) 2024-04-30
WO2020004987A1 (ko) 2020-01-02
US20210274175A1 (en) 2021-09-02
KR20200001554A (ko) 2020-01-06

Similar Documents

Publication Publication Date Title
CN111279695B (zh) 用于基于非对称子块的图像编码/解码的方法及装置
US11973944B2 (en) Image encoding/decoding method and device, and recording medium in which bitstream is stored for block division at picture boundary
CN117499683A (zh) 用于对图像进行编码/解码的方法和装置
CN116866563A (zh) 图像编码/解码方法、存储介质以及图像数据的传输方法
CN112369021A (zh) 用于吞吐量增强的图像编码/解码方法和设备以及存储比特流的记录介质
CN112740680A (zh) 图像编码/解码方法和设备以及存储比特流的记录介质
CN112771862A (zh) 通过使用边界处理对图像进行编码/解码的方法和设备以及用于存储比特流的记录介质
CN112335250A (zh) 用于对图像进行编码/解码的方法和设备以及用于存储比特流的记录介质
CN112740697A (zh) 图像编码/解码方法和装置及存储比特流的记录介质
US20220038682A1 (en) Image encoding/decoding method and device, and recording medium in which bitstream is stored
US20220182661A1 (en) Image encoding/decoding method and apparatus, and recording medium storing bitstream
CN112425167A (zh) 用于图像编码/解码的方法和装置以及其上存储有比特流的记录介质
CN112585976A (zh) 用于对图像进行编码/解码的方法和设备以及用于存储比特流的记录介质
CN114788286A (zh) 图像编码/解码方法和设备以及存储比特流的记录介质
CN112673629A (zh) 视频编码/解码方法和装置以及用于存储比特流的记录介质
CN112740694A (zh) 用于对图像进行编码/解码的方法和设备以及用于存储比特流的记录介质
CN113273188A (zh) 图像编码/解码方法和装置以及存储有比特流的记录介质
US20220070475A1 (en) Image encoding/decoding method and apparatus, and recording media storing bitstream
CN114342372A (zh) 帧内预测模式、以及熵编解码方法和装置
CN113261286A (zh) 用于推导帧内预测模式的方法和设备
CN113906740A (zh) 帧间预测信息编码/解码方法和装置
CN113940077A (zh) 用于视频编码/解码的虚拟边界信令方法和设备
CN113841398A (zh) 一种基于子块划分的图像编码/解码方法及装置
CN113228645A (zh) 图像编码/解码方法和装置以及存储有比特流的记录介质
CN113228643A (zh) 图像编码/解码方法和设备以及用于存储比特流的记录介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination