CN111164974A - 图像编码/解码方法和设备以及用于存储比特流的记录介质 - Google Patents

图像编码/解码方法和设备以及用于存储比特流的记录介质 Download PDF

Info

Publication number
CN111164974A
CN111164974A CN201880063815.0A CN201880063815A CN111164974A CN 111164974 A CN111164974 A CN 111164974A CN 201880063815 A CN201880063815 A CN 201880063815A CN 111164974 A CN111164974 A CN 111164974A
Authority
CN
China
Prior art keywords
block
merge candidate
current block
information
candidate list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880063815.0A
Other languages
English (en)
Other versions
CN111164974B (zh
Inventor
全东山
姜晶媛
高玄硕
林成昶
李镇浩
李河贤
金晖容
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LX Semicon Co Ltd
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Priority to CN202311040702.8A priority Critical patent/CN116866562A/zh
Priority to CN202311040525.3A priority patent/CN116866561A/zh
Priority to CN202310382489.2A priority patent/CN116489387A/zh
Publication of CN111164974A publication Critical patent/CN111164974A/zh
Application granted granted Critical
Publication of CN111164974B publication Critical patent/CN111164974B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements

Abstract

本发明涉及一种图像编码/解码方法和设备。根据本发明的图像解码方法可包括以下步骤:对针对当前块的与基于合并模式的运动补偿相关的信息进行熵解码;推导针对当前块的合并候选;通过使用推导的合并候选生成针对当前块的初始合并候选列表;并且通过使用所述初始合并候选列表生成重新构建的合并候选列表。

Description

图像编码/解码方法和设备以及用于存储比特流的记录介质
技术领域
本发明涉及一种图像编码/解码方法和设备。更具体地,本发明涉及一种在执行帧间预测时使用重新配置的合并候选列表的图像编码/解码方法和设备以及存储由本发明的图像编码方法和设备生成的比特流的记录介质。
背景技术
近来,在各种应用领域中,对诸如高清(HD)图像和超高清(UHD)图像的高分辨率和高质量图像的需求已经增加。然而,与传统的图像数据相比,更高分辨率和更高质量的图像数据具有增加的数据量。因此,当通过使用诸如传统的有线和无线宽带网络的介质来传输图像数据时,或者当通过使用传统的存储介质来存储图像数据时,传输和存储的成本增加。为了解决随着图像数据的分辨率和质量的提高而出现的这些问题,对于更高分辨率和更高质量的图像,需要高效的图像编码/解码技术。
图像压缩技术包括各种技术,包括:帧间预测技术,从当前画面的先前或后续画面预测当前画面中包括的像素值;帧内预测技术,通过使用当前画面中的像素信息预测当前画面中包括的像素值;变换和量化技术,用于压缩残差信号的能量;熵编码技术,将短码分配给具有高出现频率的值,并且将长码分配给具有低出现频率的值;等等。图像数据可通过使用这样的图像压缩技术被有效地压缩,并且可被传输或存储。
发明内容
技术问题
本发明的目的在于提供一种具有提高的压缩效率的图像编码/解码方法和设备以及存储由本发明的图像编码/解码方法和设备生成的比特流的记录介质。
此外,本发明的另一目的在于提供一种具有提高的压缩效率的使用帧间预测的图像编码/解码方法和设备以及存储由本发明的图像编码/解码方法和设备生成的比特流的记录介质。
此外,本发明的又一目的在于提供一种通过使用重新配置的合并候选列表有效地执行帧间预测的图像编码/解码方法和设备以及存储由本发明的图像编码/解码方法和设备生成的比特流的记录介质。
技术方案
一种本发明的对图像进行解码的方法可包括:推导当前块的至少一个合并候选;通过使用推导出的所述至少一个合并候选生成当前块的初始合并候选列表;并且通过使用所述初始合并候选列表生成重新配置的合并候选列表。
在本发明的对图像进行解码的方法中,生成重新配置的合并候选列表的步骤可包括:通过使用当前块的邻近块和所述至少一个合并候选计算所述至少一个合并候选的失真值;并且基于所述失真值重新配置所述初始合并候选列表。
在本发明的对图像进行解码的方法中,所述初始合并候选列表包括当前块的空间合并候选、时间合并候选、基于子块的时间合并候选、基于子块的时空组合合并候选、组合合并候选和零合并候选中的至少一个。
在本发明的对图像进行解码的方法中,所述失真值是通过使用当前块的邻近块与当前块的参考块的邻近块之间的绝对差之和SAD、绝对变换差之和SATD以及去除均值的绝对差之和MR-SAD中的至少一个被计算出的。
在本发明的对图像进行解码的方法中,所述失真值是基于由所述至少一个合并候选的L0方向运动信息指示的L0方向上的参考块的邻近块和由所述至少一个合并候选的L1方向运动信息指示的L1方向上的参考块的邻近块中的至少一个被计算出的。
在本发明的对图像进行解码的方法中,所述失真值是基于由通过将预设偏移应用于所述至少一个合并候选的运动矢量而获得的运动矢量指示的参考块的邻近块被计算出的。
在本发明的对图像进行解码的方法中,当所述至少一个合并候选包括L0方向运动信息和L1方向运动信息两者时,所述失真值是通过L0方向上的参考块的邻近块与L1方向上的参考块的邻近块之间的失真值被计算出的。
在本发明的对图像进行解码的方法中,当所述至少一个合并候选包括L0方向运动信息和L1方向运动信息中的任意一条运动信息时,所述失真值是由在由通过对所述任意一条运动信息应用镜像而推导出的运动信息所指示的参考块的邻近块与根据所述任意一条运动信息的参考块的邻近块之间的失真值计算出的。
在本发明的对图像进行解码的方法中,当所述至少一个合并候选包括L0方向运动信息和L1方向运动信息两者时,所述失真值是通过在由通过对L0方向运动信息应用镜像而推导出的运动信息所指示的参考块的邻近块与由通过对L1方向运动信息应用镜像而推导出的运动信息所指示的参考块的邻近块之间的失真值被计算出的。
在本发明的对图像进行解码的方法中,其中,所述重新配置的合并候选列表是通过对所述初始合并候选列表中包括的一个或更多个合并候选的失真值按照大小进行重新排列被生成的。
在本发明的对图像进行解码的方法中,成为将被重新排列的目标的合并候选是根据所述初始合并候选列表中包括的一个或更多个合并候选的顺序被确定的。
在本发明的对图像进行解码的方法中,其中,成为将被重新排列的目标的合并候选的数量是预先定义的值。
在本发明的对图像进行解码的方法中,还包括:对当前块的运动估计信息进行熵解码,其中,当前块的所述运动估计信息包括指示是否重新配置所述初始合并候选列表的信息。
在本发明的对图像进行解码的方法中,是否配置所述初始合并候选列表是基于当前块的尺寸和划分形状中的至少一个被确定的。
在本发明的对图像进行编码的方法中,所述方法可包括:推导当前块的至少一个合并候选;通过使用推导出的所述至少一个合并候选生成当前块的初始合并候选列表;并且通过使用所述初始合并候选列表生成重新配置的合并候选列表。
在本发明的非暂时性存储介质中,包括比特流,其中,所述比特流是通过图像编码方法生成的,所述图像编码方法可包括:推导当前块的至少一个合并候选;通过使用推导出的所述至少一个合并候选生成当前块的初始合并候选列表;并且通过使用所述初始合并候选列表生成重新配置的合并候选列表。
有益效果
根据本发明,提供了一种具有提高的压缩效率的图像编码/解码方法和设备以及存储由本发明的图像编码/解码方法和设备生成的比特流的记录介质。
此外,根据本发明,提供了一种具有提高的压缩效率的使用帧间预测的图像编码/解码方法和设备以及存储由本发明的图像编码/解码方法和设备生成的比特流的记录介质。
此外,根据本发明,提供了一种通过使用重新配置的合并候选列表有效地执行帧间预测的图像编码/解码方法和设备以及存储由本发明的图像编码/解码方法和设备生成的比特流的记录介质。
附图说明
图1是示出根据实施例的应用了本发明的编码设备的配置的框图。
图2是示出根据实施例的并且应用了本发明的解码设备的配置的框图。
图3是示意性地示出在对图像进行编码和解码时图像的分区结构的示图。
图4是示出画面间预测处理的实施例的示图。
图5是示出根据本发明的实施例的图像解码方法的流程图的示图。
图6是示出根据本发明的实施例的图像解码方法的流程图的示图。
图7是示出推导空间合并候选的方法的示图。
图8是示出推导时间合并候选的方法的示图。
图9是示出推导基于子块的时空组合合并候选的方法的示图。
图10是示出根据本发明的实施例的确定合并候选列表的方法的示图。
图11是示出根据本发明的实施例的确定代表性运动信息的方法的示图。
图12是示出根据本发明的实施例的计算失真值的方法的示图。
图13是示出根据本发明的另一实施例的计算失真值的方法的示图。
图14是示出根据本发明的另一实施例的计算失真值的方法的示图。
图15是示出根据本发明的实施例的图像编码方法的流程图的示图。
具体实施方式
可对本发明做出各种修改,并且存在本发明的各种实施例,其中,现在将参照附图提供并详细描述本发明的各种实施例的示例。然而,本发明不限于此,示例性实施例可被解释为包括本发明的技术构思和技术范围内的所有修改、等同形式或替换形式。相似的参考标号指在各方面相同或相似的功能。在附图中,为了清楚起见,元件的形状和尺寸可被夸大。在本发明的以下详细描述中,对通过图示的方式示出可实施本发明的具体实施例的附图进行参照。这些实施例被足够详细地描述以使本领域技术人员能够实施本公开。应该理解,本公开的各种实施例尽管不同,但不必是相互排他的。例如,在不脱离本公开的精神和范围的情况下,这里结合一个实施例描述的特定特征、结构和特性可在其它实施例中被实施。此外,应该理解,在不脱离本公开的精神和范围的情况下,每个公开的实施例内的各个元件的位置或布置可被修改。因此,以下详细描述不应以限制的含义来理解,并且本公开的范围仅由所附权利要求(在合适的解释的情况下,还连同权利要求所要求保护的等同物的全部范围)来限定。
在说明书中使用的术语“第一”、“第二”等可被用于描述各种组件,但这些组件并不被解释为受限于这些术语。这些术语仅被用于将一个组件与另一组件区分开。例如,在不脱离本发明的范围的情况下,“第一”组件可被称为“第二”组件,并且“第二”组件也可类似地被称为“第一”组件。术语“和/或”包括多个项的组合或者是多个项中的任意一项。
将理解的是,在本说明书中,当元件仅被称为“连接到”或“结合到”另一元件而不是“直接连接到”或“直接结合到”另一元件时,所述元件可“直接连接到”或“直接结合到”所述另一元件,或者在所述元件与所述另一元件之间具有其他元件的情况下连接到或结合到所述另一元件。相反,应该理解,当元件被称为“直接结合”或“直接连接”到另一元件时,不存在中间元件。
此外,在本发明的实施例中示出的组成部件被独立地示出,以便呈现彼此不同的特性功能。因此,这并不意味着每个组成部件以单独的硬件或软件的组成单元被组成。换句话说,为了方便,每个组成部件包括枚举的组成部件中的每一个。因此,每个组成部件中的至少两个组成部件可被组合形成一个组成部件,或者一个组成部件可被划分为用于执行每个功能的多个组成部件。在没有脱离本发明的本质的情况下,每个组成部件被组合的实施例以及一个组成部件被划分的实施例也被包括在本发明的范围中。
在本说明书中使用的术语仅用于描述具体实施例,而不旨在限制本发明。以单数使用的表达包括复数表达,除非它在上下文中具有明显不同的含义。在本说明书中,将理解,诸如“包括……的”、“具有……的”等的术语旨在指明存在说明书中所公开的特征、数量、步骤、动作、元件、部件、或其组合,而并不旨在排除可存在或者可添加一个或更多个其它特征、数量、步骤、动作、元件、部件、或其组合的可能性。换句话说,当特定元件被称为“被包括”时,除相应元件以外的元件并不被排除,而是,附加的元件可被包括在本发明的实施例中或者是本发明的范围中。
此外,一些组成元件可以不是执行本发明的必要功能的不可缺的组成元件,而是仅提升其性能的可选组成元件。可通过仅包括用于实施本发明的实质的不可缺的组成部件而排除在提升性能时使用的组成元件来实施本发明。仅包括所述不可缺的组成元件而排除仅在提升性能时使用的可选组成元件的结构也被包括在本发明的范围中。
在下文中,将参照附图详细描述本发明的实施例。在描述本发明的示例性实施例时,将不详细描述公知功能或结构,这是因为它们会不必要地模糊对本发明的理解。附图中的相同的组成元件由相同的参考标号来表示,并且对相同元件的重复描述将被省略。
在下文中,图像可指构成视频的画面,或者可指视频本身。例如,“对图像进行编码或解码或者进行编码和解码两者”可指“对运动画面进行编码或解码或者进行编码和解码两者”,并且可指“对运动画面的图像中的一个图像进行编码或解码或者进行编码和解码两者。”
在下文中,术语“运动画面”和“视频”可被用作相同的含义并且可彼此替换。
在下文中,目标图像可以是作为编码目标的编码目标图像和/或作为解码目标的解码目标图像。此外,目标图像可以是输入到编码设备的输入图像、以及输入到解码设备的输入图像。这里,目标图像可与当前图像具有相同的含义。
在下文中,术语“图像”、“画面”、“帧”和“屏幕”可被用作相同的含义并且彼此替换。
在下文中,目标块可以是作为编码目标的编码目标块和/或作为解码目标的解码目标块。此外,目标块可以是作为当前编码和/或解码的目标的当前块。例如,术语“目标块”和“当前块”可被用作相同的含义并且彼此替换。
在下文中,术语“块”和“单元”可被用作相同的含义并且彼此替换。或者“块”可表示特定单元。
在下文中,术语“区域”和“片段”可彼此替换。
在下文中,特定信号可以是表示特定块的信号。例如,原始信号可以是表示目标块的信号。预测信号可以是表示预测块的信号。残差信号可以是表示残差块的信号。
在实施例中,特定信息、数据、标志、索引、元素和属性等中的每一个可具有值。等于“0”的信息、数据、标志、索引、元素和属性的值可表示逻辑假或第一预定义值。换言之,值“0”、假、逻辑假和第一预定义值可彼此替换。等于“1”的信息、数据、标志、索引、元素和属性的值可表示逻辑真或第二预定义值。换句话说,值“1”、真、逻辑真和第二预定义值可彼此替换。
当变量i或j用于表示列、行或索引时,i的值可以是等于或大于0的整数、或者等于或大于1的整数。也就是说,列、行、索引等可从0开始计数,或者可从1开始计数。
术语描述
编码器:表示执行编码的设备。也就是说,表示编码设备。
解码器:表示执行解码的设备。也就是说,表示解码设备。
块:是M×N的样点阵列。这里,M和N可表示正整数,并且块可表示二维形式的样点阵列。块可指单元。当前块可表示在编码时成为目标的编码目标块,或者在解码时成为目标的解码目标块。此外,当前块可以是编码块、预测块、残差块和变换块中的至少一个。
样点:是构成块的基本单元。根据比特深度(Bd),样点可被表示为从0到2Bd-1的值。在本发明中,样点可被用作像素的含义。也就是说,样点、pel、像素可具有彼此相同的含义。
单元:可指编码和解码单元。当对图像进行编码和解码时,单元可以是通过对单个图像进行分区而生成的区域。此外,当在进行编码或解码期间将单个图像分区为子划分单元时,单元可表示子划分单元。也就是说,图像可被分区为多个单元。当对图像进行编码和解码时,可执行针对每个单元的预定处理。单个单元可被分区为尺寸小于该单元的尺寸的子单元。依据功能,单元可表示块、宏块、编码树单元、编码树块、编码单元、编码块、预测单元、预测块、残差单元、残差块、变换单元、变换块等。此外,为了将单元与块区分开,单元可包括亮度分量块、与亮度分量块相关联的色度分量块、以及每个颜色分量块的语法元素。单元可具有各种尺寸和形状,具体地,单元的形状可以是二维几何图形,诸如正方形、长方形、梯形、三角形、五边形等。此外,单元信息可包括指示编码单元、预测单元、变换单元等的单元类型以及单元尺寸、单元深度、单元的编码和解码的顺序等中的至少一个。
编码树单元:被配置有亮度分量Y的单个编码树块以及与色度分量Cb和Cr相关的两个编码树块。此外,编码树单元可表示包括块和每个块的语法元素。可通过使用四叉树分区方法、二叉树分区方法和三叉树分区方法中的至少一种方法对每个编码树单元进行分区,以配置诸如编码单元、预测单元、变换单元等的更低等级的单元。编码树单元可被用作用于指定在对作为输入图像的图像进行编码/解码时成为处理单元的样点块的术语。这里,四叉树可表示四元树。
编码树块:可用作用于指定Y编码树块、Cb编码树块和Cr编码树块中的任意一个的术语。
邻近块:可表示与当前块相邻的块。与当前块相邻的块可表示与当前块的边界接触的块、或者位于距当前块预定距离内的块。邻近块可表示与当前块的顶点相邻的块。这里,与当前块的顶点相邻的块可表示与水平相邻于当前块的邻近块垂直相邻的块、或者与垂直相邻于当前块的邻近块水平相邻的块。
重建的邻近块:可表示与当前块相邻并且已经在空间/时间上被编码或解码的邻近块。这里,重建的邻近块可表示重建的邻近单元。重建的空间邻近块可以是在当前画面内的并且已经通过编码或解码或者编码和解码两者而被重建的块。重建的时间邻近块是在参考图像内的与当前画面的当前块对应的位置处的块或所述块的邻近块。
单元深度:可表示单元的分区程度。在树结构中,最高节点(根节点)可与未被分区的第一单元对应。此外,最高节点可具有最小深度值。在这种情况下,最高节点的深度可以为等级0。深度为等级1的节点可表示通过对第一单元进行一次分区而生成的单元。深度为等级2的节点可表示通过对第一单元进行两次分区而生成的单元。深度为等级n的节点可表示通过对第一单元进行n次分区而生成的单元。叶节点可以是最低节点并且是不能被进一步分区的节点。叶节点的深度可以是最大等级。例如,最大等级的预定义值可以是3。根节点的深度可以是最低的,并且叶节点的深度可以是最深的。此外,当单元被表示为树结构时,单元存在于的等级可表示单元深度。
比特流:可表示包括编码图像信息的比特流。
参数集:与比特流内的配置之中的头信息对应。视频参数集、序列参数集、画面参数集和自适应参数集中的至少一个可被包括在参数集中。此外,参数集可包括条带(slice)头和并行块(tile)头信息。
解析:可表示通过执行熵解码来确定语法元素的值,或者可表示熵解码本身。
符号:可表示编码/解码目标单元的语法元素、编码参数和变换系数值中的至少一个。此外,符号可表示熵编码目标或熵解码结果。
预测模式:可以是指示利用帧内预测被编码/解码的模式或利用帧间预测被编码/解码的模式的信息。
预测单元:可表示当执行预测(诸如帧间预测、帧内预测、帧间补偿、帧内补偿和运动补偿)时的基本单元。单个预测单元可被分区为具有更小尺寸的多个分区,或者可被分区为多个更低等级的预测单元。多个分区可以是在执行预测或补偿时的基本单元。通过对预测单元进行划分而生成的分区也可以是预测单元。
预测单元分区:可表示通过对预测单元进行分区而获得的形状。
参考画面列表:可表示包括用于画面间预测或运动补偿的一个或更多个参考画面的列表。LC(列表组合)、L0(列表0)、L1(列表1)、L2(列表2)、L3(列表3)等是参考画面列表的类型。一个或更多个参考画面列表可被用于画面间预测。
画面间预测指示符:可表示当前块的画面间预测方向(单向预测、双向预测等)。可选地,画面间预测指示符可表示用于生成当前块的预测块的参考画面的数量。进一步可选地,画面间预测指示符可表示用于针对当前块执行画面间预测或运动补偿的预测块的数量。
预测列表利用标志:可表示是否使用包括在特定参考画面列表中的至少一个参考图像来生成预测块。可使用预测列表利用标志来推导帧间预测指示符,并且相反地,可使用帧间预测指示符来推导预测列表利用标志。例如,当预测列表利用标志指示第一值“0”时,它表示不使用包括在相应参考画面列表中的参考画面来生成预测块。当预测列表利用标志指示第二值“1”时,它表示使用包括在相应参考画面列表中的参考画面来生成预测块。
参考画面索引:可表示指示参考画面列表中的特定参考画面的索引。
参考画面:可表示特定块所参考的用于画面间预测或运动补偿的参考画面。可选地,参考画面可以是包括由当前块参考以进行帧间预测或运动补偿的参考块的画面。在下文中,术语“参考画面”和“参考图像”可被用作相同的含义并且被互换使用。
运动矢量:是用于画面间预测或运动补偿的二维矢量,并且可表示参考画面与编码/解码目标画面之间的偏移。例如,(mvX,mvY)可表示运动矢量,mvX可表示水平分量,并且mvY可表示垂直分量。
搜索范围:可以是在帧间预测期间执行对运动矢量的搜索的二维区域。例如,搜索范围的大小可以是M×N。M和N分别是整数。
运动矢量候选:可表示在对运动矢量进行预测时成为预测候选的块或所述块的运动矢量。可将运动矢量候选在运动矢量候选列表中列出。
运动矢量候选列表:可表示使用一个或更多个运动矢量候选配置的列表。
运动矢量候选索引:表示指示运动矢量候选列表中的运动矢量候选的指示符。运动矢量候选索引还被称为运动矢量预测因子的索引。
运动信息:可表示包括以下项的信息:运动矢量、参考画面索引、画面间预测指示符;以及参考画面列表信息、参考画面、运动矢量候选、运动矢量候选索引、合并候选和合并索引中的至少任意一个。
合并候选列表:可表示由合并候选组成的列表。
合并候选:可表示空间合并候选、时间合并候选、组合合并候选、组合双向预测合并候选、零合并候选等。合并候选可具有画面间预测指示符、针对每个列表的参考画面索引和诸如运动矢量的运动信息。
合并索引:可表示指示合并候选列表内的合并候选的指示符。合并索引可指示在空间上和/或时间上与当前块相邻的重建块中的用于推导合并候选的块。合并索引可指示合并候选所拥有的运动信息中的至少一项。
变换单元:可表示在对残差信号执行编码/解码(诸如变换、逆变换、量化、反量化、变换系数编码/解码)时的基本单元。单个变换单元可被分区为具有更小尺寸的多个更低等级的变换单元。这里,变换/逆变换可包括第一变换/第一逆变换和第二变换/第二逆变换中的至少一个。
缩放:可表示将量化的等级乘以因子的处理。可通过对量化的等级进行缩放来生成变换系数。缩放也可被称为反量化。
量化参数:可表示当在量化期间使用变换系数来生成量化的等级时使用的值。量化参数还可表示当在反量化期间通过对量化的等级进行缩放来生成变换系数时使用的值。量化参数可以是以量化步长被映射的值。
增量量化参数:可表示预测的量化参数与编码/解码目标单元的量化参数之间的差值。
扫描:可表示对单元、块或矩阵内的系数进行排序的方法。例如,将系数的二维矩阵改变为一维矩阵可被称为扫描,并且将系数的一维矩阵改变为二维矩阵可被称为扫描或逆扫描。
变换系数:可表示在编码器中执行变换之后生成的系数值。变换系数可表示在解码器中执行熵解码和反量化中的至少一个之后生成的系数值。通过对变换系数或残差信号进行量化而获得的量化的等级或者量化的变换系数等级也可落入变换系数的含义内。
量化的等级:可表示在编码器中通过对变换系数或残差信号进行量化而生成的值。可选地,量化的等级可表示作为在解码器中将被执行反量化的反量化目标的值。类似地,作为变换和量化的结果的量化的变换系数等级也可落入量化的等级的含义内。
非零变换系数:可表示具有除零之外的值的变换系数、或者具有除零之外的值的变换系数等级或量化的等级。
量化矩阵:可表示在被执行以提高主观图像质量或客观图像质量的量化处理或反量化处理中使用的矩阵。量化矩阵也可被称为缩放列表。
量化矩阵系数:可表示量化矩阵内的每个元素。量化矩阵系数也可被称为矩阵系数。
默认矩阵:可表示在编码器或解码器中预先定义的预定量化矩阵。
非默认矩阵:可表示在编码器或解码器中未被预先定义而是由用户用信号发送的量化矩阵。
统计值:针对具有可计算的特定值的变量、编码参数、常量值等之中的至少一个的统计值可以是相应特定值的平均值、加权平均值、加权和值、最小值、最大值、最频繁出现的值、中值、插值之中的一个或更多个。
图1是示出根据应用了本发明的实施例的编码设备的配置的框图。
编码设备100可以是编码器、视频编码设备或图像编码设备。视频可包括至少一个图像。编码设备100可顺序地对至少一个图像进行编码。
参照图1,编码设备100可包括运动预测单元111、运动补偿单元112、帧内预测单元120、切换器115、减法器125、变换单元130、量化单元140、熵编码单元150、反量化单元160、逆变换单元170、加法器175、滤波器单元180和参考画面缓冲器190。
编码设备100可通过使用帧内模式或帧间模式或者帧内模式和帧间模式两者来对输入图像执行编码。此外,编码设备100可通过对输入图像进行编码来生成包括编码信息的比特流,并输出生成的比特流。生成的比特流可被存储在计算机可读记录介质中,或者可通过有线/无线传输介质被流传输。当帧内模式被用作预测模式时,切换器115可被切换到帧内。可选地,当帧间模式被用作预测模式时,切换器115可被切换到帧间模式。这里,帧内模式可表示帧内预测模式,帧间模式可表示帧间预测模式。编码设备100可生成针对输入图像的输入块的预测块。此外,编码设备100可在生成预测块之后使用输入块和预测块的残差对残差块进行编码。输入图像可被称为作为当前编码目标的当前图像。输入块可被称为作为当前编码目标的当前块,或者被称为编码目标块。
当预测模式是帧内模式时,帧内预测单元120可使用已被编码/解码并与当前块相邻的块的样点作为参考样点。帧内预测单元120可通过使用参考样点来对当前块执行空间预测,或者通过执行空间预测来生成输入块的预测样点。这里,帧内预测可表示帧内部的预测。
当预测模式是帧间模式时,运动预测单元111可在执行运动预测时从参考图像检索与输入块最匹配的区域,并且通过使用检索到的区域来推导运动矢量。在这种情况下,搜索区域可被用作所述区域。参考图像可被存储在参考画面缓冲器190中。这里,当执行了对参考图像的编码/解码时,参考图像可被存储在参考画面缓冲器190中。
运动补偿单元112可通过使用运动矢量对当前块执行运动补偿来生成预测块。这里,帧间预测可表示帧之间的预测或运动补偿。
当运动矢量的值不是整数时,运动预测单元111和运动补偿单元112可通过将插值滤波器应用于参考画面的部分区域来生成预测块。为了对编码单元执行画面间预测或运动补偿,可确定将跳过模式、合并模式、高级运动矢量预测(AMVP)模式和当前画面参考模式之中的哪个模式用于对包括在相应编码单元中的预测单元的运动预测和运动补偿。然后,依据确定的模式,可不同地执行画面间预测或运动补偿。
减法器125可通过使用输入块和预测块的残差来生成残差块。残差块可被称为残差信号。残差信号可表示原始信号与预测信号之间的差。此外,残差信号可以是通过对原始信号与预测信号之间的差进行变换或量化或者进行变换和量化而生成的信号。残差块可以是块单元的残差信号。
变换单元130可通过对残差块执行变换来生成变换系数,并输出生成的变换系数。这里,变换系数可以是通过对残差块执行变换而生成的系数值。当变换跳过模式被应用时,变换单元130可跳过对残差块的变换。
可通过将量化应用于变换系数或应用于残差信号来生成量化的等级。在下文中,量化的等级在实施例中也可被称为变换系数。
量化单元140可通过根据参数对变换系数或残差信号进行量化来生成量化的等级,并输出生成的量化的等级。这里,量化单元140可通过使用量化矩阵对变换系数进行量化。
熵编码单元150可通过根据概率分布对由量化单元140计算出的值或者对在执行编码时计算出的编码参数值执行熵编码来生成比特流,并输出生成的比特流。熵编码单元150可对图像的样点信息和用于对图像进行解码的信息执行熵编码。例如,用于对图像进行解码的信息可包括语法元素。
当熵编码被应用时,符号被表示使得较少数量的比特被分配给具有高生成可能性的符号,并且较多数量的比特被分配给具有低生成可能性的符号,因此,可减小用于将被编码的符号的比特流的大小。熵编码单元150可使用诸如指数哥伦布、上下文自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等的用于熵编码的编码方法。例如,熵编码单元150可通过使用可变长度编码/码(VLC)表来执行熵编码。此外,熵编码单元150可推导目标符号的二值化方法和目标符号/二进制位的概率模型,并且通过使用推导的二值化方法和上下文模型来执行算术编码。
为了对变换系数等级(量化的等级)进行编码,熵编码单元150可通过使用变换系数扫描方法将二维块形式的系数改变为一维矢量形式。
编码参数可包括在编码器中被编码并且被用信号发送到解码器的诸如语法元素的信息(标志、索引等)以及在执行编码或解码时推导的信息。编码参数可表示在对图像进行编码或解码时所需要的信息。例如,以下项中的至少一个值或组合形式可被包括在编码参数中:单元/块尺寸、单元/块深度、单元/块分区信息、单元/块形状、单元/块分区结构、是否进行四叉树形式的分区、是否进行二叉树形式的分区、二叉树形式的分区方向(水平方向或垂直方向)、二叉树形式的分区形式(对称分区或非对称分区)、当前编码单元是否通过三叉树分区被分区、三叉树分区的方向(水平方向或垂直方向)、三叉树分区的类型(对称类型或非对称类型)、当前编码单元是否通过多类型树分区被分区、多类型树分区的方向(水平方向或垂直方向)、多类型树分区的类型(对称类型或非对称类型)和多类型树分区的树(二叉树或三叉树)结构、预测模式(帧内预测或帧间预测)、亮度帧内预测模式/方向、色度帧内预测模式/方向、帧内分区信息、帧间分区信息、编码块分区标志、预测块分区标志、变换块分区标志、参考样点滤波方法、参考样点滤波器抽头、参考样点滤波器系数、预测块滤波方法、预测块滤波器抽头、预测块滤波器系数、预测块边界滤波方法、预测块边界滤波器抽头、预测块边界滤波器系数、帧内预测模式、帧间预测模式、运动信息、运动矢量、运动矢量差、参考画面索引、帧间预测角度、帧间预测指示符、预测列表利用标志、参考画面列表、参考画面、运动矢量预测因子索引、运动矢量预测因子候选、运动矢量候选列表、是否使用合并模式、合并索引、合并候选、合并候选列表、是否使用跳过模式、插值滤波器类型、插值滤波器抽头、插值滤波器系数、运动矢量大小、运动矢量的表示精度、变换类型、变换尺寸、首次(第一次)变换是否被使用的信息、二次变换是否被使用的信息、首次变换索引、二次变换索引、残差信号是否存在的信息、编码块样式、编码块标志(CBF)、量化参数、量化参数残差、量化矩阵、是否应用帧内环路滤波器、帧内环路滤波器系数、帧内环路滤波器抽头、帧内环路滤波器形状/形式、是否应用去块滤波器、去块滤波器系数、去块滤波器抽头、去块滤波器强度、去块滤波器形状/形式、是否应用自适应样点偏移、自适应样点偏移值、自适应样点偏移类别、自适应样点偏移类型、是否应用自适应环路滤波器、自适应环路滤波器系数、自适应环路滤波器抽头、自适应环路滤波器形状/形式、二值化/反二值化方法、上下文模型确定方法、上下文模型更新方法、是否执行常规模式、是否执行旁路模式、上下文二进制位、旁路二进制位、有效系数标志、最后有效系数标志、针对系数组的单元的编码标志、最后有效系数的位置、关于系数的值是否大于1的标志、关于系数的值是否大于2的标志、关于系数的值是否大于3的标志、关于剩余系数值的信息、符号信息、重建的亮度样点、重建的色度样点、残差亮度样点、残差色度样点、亮度变换系数、色度变换系数、量化的亮度等级、量化的色度等级、变换系数等级扫描方法、在解码器侧的运动矢量搜索区域的尺寸、在解码器侧的运动矢量搜索区域的形状、在解码器侧的运动矢量搜索的次数、关于CTU尺寸的信息、关于最小块尺寸的信息、关于最大块尺寸的信息、关于最大块深度的信息、关于最小块深度的信息、图像显示/输出顺序、条带标识信息、条带类型、条带分区信息、并行块标识信息、并行块类型、并行块分区信息、画面类型、输入样点的比特深度、重建样点的比特深度、残差样点的比特深度、变换系数的比特深度、量化的等级的比特深度、以及关于亮度信号的信息或关于色度信号的信息。
这里,用信号发送标志或索引可表示由编码器对相应的标志或索引进行熵编码并将其包括在比特流中,并且可表示由解码器从比特流对相应的标志或索引进行熵解码。
当编码设备100通过帧间预测执行编码时,编码的当前图像可被用作用于随后被处理的另一图像的参考图像。因此,编码设备100可对编码的当前图像进行重建或解码,或者将重建或解码的图像作为参考图像存储在参考画面缓冲器190中。
量化的等级可在反量化单元160中被反量化,或者可在逆变换单元170中被逆变换。可由加法器175将经过反量化或逆变换的系数或者经过反量化和逆变换两者的系数与预测块相加。通过将经过反量化或逆变换的系数或者经过反量化和逆变换两者的系数与预测块相加,可生成重建块。这里,经过反量化或逆变换的系数或经过反量化和逆变换两者的系数可表示执行了反量化和逆变换中的至少一个的系数,并且可表示重建的残差块。
重建块可通过滤波器单元180。滤波器单元180可将去块滤波器、样点自适应偏移(SAO)和自适应环路滤波器(ALF)中的至少一个应用于重建样点、重建块或重建图像。滤波器单元180可被称为环内滤波器。
去块滤波器可去除在块之间的边界中生成的块失真。为了确定是否应用去块滤波器,可基于块中所包括的若干行或列中包括的样点来确定是否将去块滤波器应用于当前块。当将去块滤波器应用于块时,可根据所需的去块滤波强度来应用另一滤波器。
为了补偿编码误差,可通过使用样点自适应偏移将合适的偏移值与样点值相加。样点自适应偏移可以以样点为单位对经过去块的图像与原始图像的偏移进行校正。可使用考虑关于每个样点的边缘信息来应用偏移的方法,或者可使用以下方法:将图像的样点分区为预定数量的区域,确定偏移被应用到的区域,并对确定的区域应用偏移。
自适应环路滤波器可基于经过滤波的重建图像和原始图像的比较结果来执行滤波。可将包括在图像中的样点分区为预定组,可确定将被应用于每个组的滤波器,并且可对每个组执行差异化滤波。是否应用ALF的信息可通过编码单元(CU)被用信号发送,并且将被应用于每个块的ALF的形式和系数可变化。
已经通过滤波器单元180的重建块或重建图像可被存储在参考画面缓冲器190中。由滤波器单元180处理的重建块可以是参考图像的一部分。也就是说,参考图像是由滤波器单元180处理的重建块组成的重建图像。存储的参考图像可稍后在帧间预测或运动补偿时被使用。
图2是示出根据实施例的并且应用了本发明的解码设备的配置的框图。
解码设备200可以是解码器、视频解码设备或图像解码设备。
参照图2,解码设备200可包括熵解码单元210、反量化单元220、逆变换单元230、帧内预测单元240、运动补偿单元250、加法器225、滤波器单元260和参考画面缓冲器270。
解码设备200可接收从编码设备100输出的比特流。解码设备200可接收存储在计算机可读记录介质中的比特流,或者可接收通过有线/无线传输介质被流传输的比特流。解码设备200可通过使用帧内模式或帧间模式对比特流进行解码。此外,解码设备200可生成通过解码而生成的重建图像或解码图像,并输出重建图像或解码图像。
当在进行解码时使用的预测模式是帧内模式时,切换器可被切换到帧内。可选地,当在解码时使用的预测模式是帧间模式时,切换器可被切换到帧间模式。
解码设备200可通过对输入比特流进行解码来获得重建残差块,并生成预测块。当重建残差块和预测块被获得时,解码设备200可通过将重建残差块与预测块相加来生成成为解码目标的重建块。解码目标块可被称为当前块。
熵解码单元210可通过根据概率分布对比特流进行熵解码来生成符号。生成的符号可包括量化的等级形式的符号。这里,熵解码方法可以是上述熵编码方法的逆过程。
为了对变换系数等级(量化的等级)进行解码,熵解码单元210可通过使用变换系数扫描方法将单向矢量形式的系数改变为二维块形式。
可在反量化单元220中对量化的等级进行反量化,或者可在逆变换单元230中对量化的等级进行逆变换。量化的等级可以是进行反量化或逆变换或者进行反量化和逆变换两者的结果,并且可被生成为重建的残差块。这里,反量化单元220可将量化矩阵应用于量化的等级。
当使用帧内模式时,帧内预测单元240可通过对当前块执行空间预测来生成预测块,其中,空间预测使用与解码目标块相邻并且已被解码的块的样点值。
当使用帧间模式时,运动补偿单元250可通过对当前块执行运动补偿来生成预测块,其中,运动补偿使用运动矢量以及存储在参考画面缓冲器270中的参考图像。
加法器225可通过将重建的残差块与预测块相加来生成重建块。滤波器单元260可将去块滤波器、样点自适应偏移和自适应环路滤波器中的至少一个应用于重建块或重建图像。滤波器单元260可输出重建图像。重建块或重建图像可被存储在参考画面缓冲器270中并且在执行帧间预测时被使用。由滤波器单元260处理的重建块可以是参考图像的一部分。也就是说,参考图像是由滤波器单元260处理的重建块组成的重建图像。存储的参考图像可稍后在帧间预测或运动补偿时被使用。
图3是示意性地示出当对图像进行编码和解码时图像的分区结构的示图。图3示意性地示出将单个单元分区为多个更低等级的单元的示例。
为了有效地对图像进行分区,当进行编码和解码时,可使用编码单元(CU)。编码单元可被用作当对图像进行编码/解码时的基本单元。此外,编码单元可被用作用于在对图像进行编码/解码时区分帧内预测模式与帧间预测模式的单元。编码单元可以是用于预测、变换、量化、逆变换、反量化或对变换系数的编码/解码处理的基本单元。
参照图3,图像300按照最大编码单元(LCU)被顺序地分区,并且LCU单元被确定为分区结构。这里,LCU可以以与编码树单元(CTU)相同的含义被使用。单元分区可表示对与该单元相关联的块进行分区。在块分区信息中,可包括单元深度的信息。深度信息可表示单元被分区的次数或程度或者单元被分区的次数和程度两者。可基于树结构将单个单元分区为与深度信息分层地相关联的多个更低等级的单元。换言之,单元和通过对该单元进行分区而生成的更低等级的单元可分别与节点和该节点的子节点相应。分区出的更低等级的单元中的每一个可具有深度信息。深度信息可以是表示CU的尺寸的信息,并且可被存储在每个CU中。单元深度表示与对单元进行分区相关的次数和/或程度。因此,更低等级的单元的分区信息可包括关于更低等级的单元的尺寸的信息。
分区结构可表示LCU 310内的编码单元(CU)的分布。可根据是否将单个CU分区为多个(等于或大于2的正整数,包括2、4、8、16等)CU来确定这样的分布。通过分区生成的CU的水平尺寸和垂直尺寸可分别是分区之前的CU的水平尺寸和垂直尺寸的一半,或者可根据分区的次数而分别具有小于分区之前的水平尺寸和垂直尺寸的尺寸。CU可被递归地分区为多个CU。通过递归分区,与分区之前的CU的高度和宽度之中的至少一个相比,分区之后的CU的高度和宽度之中的至少一个可减小。可递归地执行CU的分区,直到达到预定义的深度或预定义的尺寸为止。例如,LCU的深度可以是0,最小编码单元(SCU)的深度可以是预定义的最大深度。这里,如上所述,LCU可以是具有最大编码单元尺寸的编码单元,并且SCU可以是具有最小编码单元尺寸的编码单元。分区从LCU 310开始,当CU的水平尺寸或垂直尺寸或者水平尺寸和垂直尺寸两者通过分区而减小时,CU深度增加1。例如,对于每个深度,未被分区的CU的尺寸可以为2N×2N。此外,在被分区的CU的情况下,可将尺寸为2N×2N的CU分区为尺寸为N×N的四个CU。当深度增加1时,N的大小可减半。
此外,可通过使用CU的分区信息来表示CU是否被分区的信息。分区信息可以是1比特信息。除SCU之外的所有CU可包括分区信息。例如,当分区信息的值为1时,可不对CU进行分区,当分区信息的值为2时,可对CU进行分区。
参照图3,具有深度0的LCU可以是64×64的块。0可以是最小深度。具有深度3的SCU可以是8×8的块。3可以是最大深度。32×32的块和16×16的块的CU可分别被表示为深度1和深度2。
例如,当单个编码单元被分区为四个编码单元时,分区出的四个编码单元的水平尺寸和垂直尺寸可以是CU在被分区之前的水平尺寸和垂直尺寸的一半大小。在一个实施例中,当尺寸为32×32的编码单元被分区为四个编码单元时,分区出的四个编码单元中的每一个的尺寸可以为16×16。当单个编码单元被分区为四个编码单元时,可称编码单元可被分区为四叉树形式。
例如,当一个编码单元被分区为两个子编码单元时,该两个子编码单元中的每一个的水平尺寸或垂直尺寸(宽度或高度)可以是原始编码单元的水平尺寸或垂直尺寸的一半。例如,当尺寸为32×32的编码单元被垂直分区为两个子编码单元时,该两个子编码单元中的每一个可具有16×32的尺寸。例如,当尺寸为8×32的编码单元被水平分区为两个子编码单元时,该两个子编码单元中的每一个可具有8×16的尺寸。当一个编码单元被分区为两个子编码单元时,可称编码单元被二分区,或者根据二叉树分区结构被分区。
例如,当一个编码单元被分区为三个子编码单元时,可以以1:2:1的比例对编码单元的水平尺寸或垂直尺寸进行分区,从而产生水平尺寸或垂直尺寸的比例为1:2:1的三个子编码单元。例如,当尺寸为16×32的编码单元被水平分区为三个子编码单元时,该三个子编码单元以从最上方子编码单元到最下方子编码单元的顺序可分别具有16×8、16×16和16×8的尺寸。例如,当尺寸为32×32的编码单元被垂直划分为三个子编码单元时,该三个子编码单元以从左侧子编码单元到右侧子编码单元的顺序可分别具有8×32、16×32和8×32的尺寸。当一个编码单元被分区为三个子编码单元时,可称编码单元被三分区或者根据三叉树分区结构被分区。
在图3中,编码树单元(CTU)320是四叉树分区结构、二叉树分区结构和三叉树分区结构全都被应用的CTU的示例。
如上所述,为了对CTU进行分区,可应用四叉树分区结构、二叉树分区结构和三叉树分区结构中的至少一种。可根据预定的优先级顺序将各种树分区结构顺序地应用于CTU。例如,可将四叉树分区结构优先应用于CTU。不能再使用四叉树分区结构进行分区的编码单元可与四叉树的叶节点对应。与四叉树的叶节点对应的编码单元可用作二叉树和/或三叉树分区结构的根节点。也就是说,与四叉树的叶节点对应的编码单元可按照二叉树分区结构或三叉树分区结构被进一步分区,或者可不被进一步分区。因此,通过防止对与四叉树的叶节点对应的编码单元进行二叉树分区或三叉树分区而产生的编码块被执行进一步的四叉树分区,可有效地执行块分区和/或用信号发送分区信息。
可使用四分区信息用信号发送与四叉树的节点对应的编码单元被分区的事实。具有第一值(例如,“1”)的四分区信息可指示当前编码单元按照四叉树分区结构被分区。具有第二值(例如,“0”)的四分区信息可指示当前编码单元不按照四叉树分区结构被分区。四分区信息可以是具有预定长度(例如,一个比特)的标志。
在二叉树分区与三叉树分区之间可没有优先级。也就是说,与四叉树的叶节点对应的编码单元可进一步被执行二叉树分区和三叉树分区中的任意分区。此外,通过二叉树分区或三叉树分区生成的编码单元可被执行进一步的二叉树分区或进一步的三叉树分区,或者可不被进一步分区。
在二叉树分区和三叉树分区中不存在优先级的树结构被称为多类型树结构。与四叉树的叶节点对应的编码单元可用作多类型树的根节点。可使用多类型树分区指示信息、分区方向信息和分区树信息中的至少一个来用信号发送是否对与多类型树的节点对应的编码单元进行分区。为了对与多类型树的节点对应的编码单元进行分区,可顺序地用信号发送多类型树分区指示信息、分区方向和分区树信息。
具有第一值(例如,“1”)的多类型树分区指示信息可指示当前编码单元将被执行多类型树分区。具有第二值(例如,“0”)的多类型树分区指示信息可指示当前编码单元将不被执行多类型树分区。
当与多类型树的节点对应的编码单元根据多类型树分区结构被进一步分区时,该编码单元可包括分区方向信息。分区方向信息可指示当前编码单元将在哪个方向上根据多类型树分区被分区。具有第一值(例如,“1”)的分区方向信息可指示当前编码单元将被垂直分区。具有第二值(例如,“0”)的分区方向信息可指示当前编码单元将被水平分区。
当与多类型树的节点对应的编码单元按照多类型树分区结构被进一步分区时,当前编码单元可包括分区树信息。分区树信息可指示将被用于对多类型树的节点进行分区的树分区结构。具有第一值(例如,“1”)的分区树信息可指示当前编码单元将按照二叉树分区结构被分区。具有第二值(例如,“0”)的分区树信息可指示当前编码单元将按照三叉树分区结构被分区。
分区指示信息、分区树信息和分区方向信息均可以是具有预定长度(例如,一个比特)的标志。
四叉树分区指示信息、多类型树分区指示信息、分区方向信息和分区树信息中的至少任意一个可被熵编码/熵解码。为了对那些类型的信息进行熵编码/熵解码,可使用关于与当前编码单元相邻的邻近编码单元的信息。例如,当前编码单元的左侧邻近编码单元和/或上方邻近编码单元的分区类型(被分区或未被分区、分区树和/或分区方向)与当前编码单元的分区类型相似的可能性很高。因此,可从关于邻近编码单元的信息推导用于对关于当前编码单元的信息进行熵编码/熵解码的上下文信息。关于邻近编码单元的信息可包括四分区信息、多类型树分区指示信息、分区方向信息和分区树信息中的至少任意一种。
作为另一示例,在二叉树分区和三叉树分区中,可优先执行二叉树分区。也就是说,当前编码单元可首先被执行二叉树分区,并且随后可将与二叉树的叶节点对应的编码单元设置为用于三叉树分区的根节点。在这种情况下,对于与三叉树的节点对应的编码单元,可既不执行四叉树分区也不执行二叉树分区。
不能按照四叉树分区结构、二叉树分区结构和/或三叉树分区结构被分区的编码单元成为用于编码、预测和/或变换的基本单元。也就是说,所述编码单元不能被进一步分区以用于预测和/或变换。因此,在比特流中可不存在用于将编码单元分区为预测单元和/或变换单元的分区结构信息和分区信息。
然而,当编码单元(即,用于分区的基本单元)的尺寸大于最大变换块的尺寸时,可递归地对编码单元进行分区,直到将编码单元的尺寸减小到等于或小于最大变换块的尺寸为止。例如,当编码单元的尺寸为64×64时并且当最大变换块的尺寸为32×32时,可将编码单元分区为用于变换的四个32×32的块。例如,当编码单元的尺寸为32×64并且最大变换块的尺寸为32×32时,可将编码单元分区为用于变换的两个32×32的块。在这种情况下,不单独用信号发送编码单元的用于变换的分区,并且可通过编码单元的水平尺寸或垂直尺寸与最大变换块的水平尺寸或垂直尺寸之间的比较来确定编码单元的用于变换的分区。例如,当编码单元的水平尺寸(宽度)大于最大变换块的水平尺寸(宽度)时,可将编码单元垂直地二等分。例如,当编码单元的垂直尺寸(长度)大于最大变换块的垂直尺寸(长度)时,可将编码单元水平地二等分。
可在编码单元的更高等级用信号发送或确定编码单元的最大尺寸和/或最小尺寸的信息以及变换块的最大尺寸和/或最小尺寸的信息。所述更高等级可以是例如序列等级、画面等级、条带等级等。例如,可将编码单元的最小尺寸确定为4×4。例如,可将变换块的最大尺寸确定为64×64。例如,可将变换块的最小尺寸确定为4×4。
可在编码单元的更高等级用信号发送或确定与四叉树的叶节点对应的编码单元的最小尺寸(四叉树最小尺寸)的信息和/或从多类型树的根节点到叶节点的最大深度(多类型树的最大树深度)的信息。例如,所述更高等级可以是序列等级、画面等级、条带等级等。可针对画面内条带和画面间条带中的每一个用信号发送或确定四叉树的最小尺寸的信息和/或多类型树的最大深度的信息。
可在编码单元的更高等级用信号发送或确定CTU的尺寸与变换块的最大尺寸之间的差信息。例如,所述更高等级可以是序列等级、画面等级、条带等级等。可基于编码树单元的尺寸和所述差信息来确定与二叉树的各个节点对应的编码单元的最大尺寸(在下文中,称为二叉树的最大尺寸)的信息。与三叉树的各个节点对应的编码单元的最大尺寸(在下文中,称为三叉树的最大尺寸)可依据条带的类型而变化。例如,针对画面内条带,三叉树的最大尺寸可以是32×32。例如,针对画面间条带,三叉树的最大尺寸可以是128×128。例如,可将与二叉树的各个节点对应的编码单元的最小尺寸(在下文中,称为二叉树的最小尺寸)和/或与三叉树的各个节点对应的编码单元的最小尺寸(在下文中,称为三叉树的最小尺寸)设置为编码块的最小尺寸。
作为另一示例,可在条带等级用信号发送或确定二叉树的最大尺寸和/或三叉树的最大尺寸。可选地,可在条带等级用信号发送或确定二叉树的最小尺寸和/或三叉树的最小尺寸。
依据上述各种块的尺寸信息和深度信息,四分区信息、多类型树分区指示信息、分区树信息和/或分区方向信息可被包括在比特流中或可不被包括在比特流中。
例如,当编码单元的尺寸不大于四叉树的最小尺寸时,编码单元不包含四分区信息。因此,可从第二值推导四分区信息。
例如,当与多类型树的节点对应的编码单元的尺寸(水平尺寸和垂直尺寸)大于二叉树的最大尺寸(水平尺寸和垂直尺寸)和/或三叉树的最大尺寸(水平尺寸和垂直尺寸)时,编码单元可不被二分区或三分区。因此,可不用信号发送多类型树分区指示信息,而是可从第二值推导多类型树分区指示信息。
可选地,当与多类型树的节点对应的编码单元的尺寸(水平尺寸和垂直尺寸)与二叉树的最大尺寸(水平尺寸和垂直尺寸)相同,和/或是三叉树的最大尺寸(水平尺寸和垂直尺寸)的两倍大时,编码单元可不被进一步二分区或三分区。因此,可不用信号发送多类型树分区指示信息,而是可从第二值推导多类型树分区指示信息。这是因为,当按照二叉树分区结构和/或三叉树分区结构对编码单元进行分区时,生成了小于二叉树的最小尺寸和/或三叉树的最小尺寸的编码单元。
可选地,当与多类型树的节点对应的编码单元的深度等于多类型树的最大深度时,编码单元可不进一步被二分区和/或三分区。因此,可不用信号发送多类型树分区指示信息,而是可从第二值推导多类型树分区指示信息。
可选地,只有当垂直方向二叉树分区、水平方向二叉树分区、垂直方向三叉树分区和水平方向三叉树分区中的至少一个对于与多类型树的节点对应的编码单元是可行的时,才可用信号发送多类型树分区指示信息。否则,可不对编码单元进行二分区和/或三分区。因此,可不用信号发送多类型树分区指示信息,而是可从第二值推导多类型树分区指示信息。
可选地,只有当垂直方向二叉树分区和水平方向二叉树分区两者或者垂直方向三叉树分区和水平方向三叉树分区两者对于与多类型树的节点对应的编码单元是可行的时,才可用信号发送分区方向信息。否则,可不用信号发送分区方向信息,而是可从指示可能的分区方向的值推导分区方向信息。
可选地,只有当垂直方向二叉树分区和垂直方向三叉树分区两者或者水平方向二叉树分区和水平方向三叉树分区两者对于与多类型树的节点对应的编码树是可行的时,才可用信号发送分区树信息。否则,可不用信号发送分区树信息,而是可从指示可能的分区树结构的值推导分区树信息。
图4是示出画面间预测处理的实施例的示图。
在图4中,矩形可表示画面。在图4中,箭头表示预测方向。可根据画面的编码类型将画面分类为帧内画面(I画面)、预测画面(P画面)和双向预测画面(B画面)。
可在无需画面间预测的情况下通过帧内预测对I画面进行编码。可通过使用针对当前块在一个方向(即,正向或反向)上存在的参考画面,通过画面间预测来对P画面进行编码。可通过使用针对当前块在两个方向(即,正向和反向)上存在的参考画面,通过画面间预测来对B画面进行编码。当画面间预测被使用时,编码器可执行画面间预测或运动补偿,并且解码器可执行相应的运动补偿。
在下文中,将详细描述画面间预测的实施例。
可使用参考画面和运动信息来执行画面间预测或运动补偿。
可通过编码设备100和解码设备200中的每一个在画面间预测期间推导当前块的运动信息。可通过使用重建的邻近块的运动信息、同位块(也称为col块或共同定位块)和/或与该同位块相邻的块的运动信息来推导当前块的运动信息。同位块可表示先前重建的同位画面(也称为col画面或共同定位画面)内的在空间上与当前块位于相同位置的块。同位画面可以是参考画面列表中包括的一个或更多个参考画面中的一个画面。
推导当前块的运动信息的方法可依据当前块的预测模式而变化。例如,作为用于画面间预测的预测模式,可存在AMVP模式、合并模式、跳过模式、当前画面参考模式等。合并模式可被称为运动合并模式。
例如,当AMVP被用作预测模式时,可将重建的邻近块的运动矢量、同位块的运动矢量、与同位块相邻的块的运动矢量和(0,0)运动矢量中的至少一个确定为针对当前块的运动矢量候选,并且通过使用运动矢量候选来生成运动矢量候选列表。可通过使用生成的运动矢量候选列表来推导当前块的运动矢量候选。可基于推导的运动矢量候选确定当前块的运动信息。同位块的运动矢量或与同位块相邻的块的运动矢量可被称为时间运动矢量候选,并且重建的邻近块的运动矢量可被称为空间运动矢量候选。
编码设备100可计算当前块的运动矢量与运动矢量候选之间的运动矢量差(MVD),并且可对运动矢量差(MVD)执行熵编码。此外,编码设备100可对运动矢量候选索引执行熵编码并生成比特流。运动矢量候选索引可指示运动矢量候选列表中包括的运动矢量候选中的最佳运动矢量候选。解码设备可对包括在比特流中的运动矢量候选索引执行熵解码,并且可通过使用经过熵解码的运动矢量候选索引,从包括在运动矢量候选列表中的运动矢量候选中选择解码目标块的运动矢量候选。此外,解码设备200可将经过熵解码的MVD与通过熵解码提取的运动矢量候选相加,从而推导解码目标块的运动矢量。
比特流可包括指示参考画面的参考画面索引。参考画面索引可通过编码设备100被熵编码,然后作为比特流被用信号发送到解码设备200。解码设备200可基于推导出的运动矢量和参考画面索引信息生成解码目标块的预测块。
推导当前块的运动信息的方法的另一示例可以是合并模式。合并模式可表示合并多个块的运动的方法。合并模式可表示从邻近块的运动信息推导当前块的运动信息的模式。当合并模式被应用时,可使用重建的邻近块的运动信息和/或同位块的运动信息来生成合并候选列表。运动信息可包括运动矢量、参考画面索引和画面间预测指示符中的至少一个。预测指示符可指示单向预测(L0预测或L1预测)或双向预测(L0预测和L1预测)。
合并候选列表可以是存储运动信息的列表。包括在合并候选列表中的运动信息可以是如下两者中的至少一个:零合并候选,以及作为与当前块相邻的一个邻近块的运动信息(空间合并候选)、当前块的包括在参考画面内的同位块的运动信息(时间合并候选)和在合并候选列表中存在的运动信息的组合的新的运动信息。
编码设备100可通过对合并标志和合并索引中的至少一个执行熵编码来生成比特流,并且可将比特流用信号发送到解码设备200。合并标志可以是指示是否针对每个块执行合并模式的信息,并且合并索引可以是指示当前块的邻近块中的哪个邻近块是合并目标块的信息。例如,当前块的邻近块可包括在当前块的左侧的左侧邻近块、布置在当前块的上方的上方邻近块和在时间上与当前块相邻的时间邻近块。
跳过模式可以是邻近块的运动信息按原样被应用于当前块的模式。当跳过模式被应用时,编码设备100可对如下事实的信息进行熵编码:哪个块的运动信息将被用作当前块的运动信息,从而生成比特流,并且可将该比特流用信号发送到解码设备200。编码设备100可不将关于运动矢量差信息、编码块标志和变换系数等级中的至少任意一个的语法元素用信号发送到解码设备200。
当前画面参考模式可表示将当前块所属的当前画面内的先前重建的区域用于预测的预测模式。这里,可将矢量用于指定先前重建的区域。可通过使用当前块的参考画面索引来对指示当前块是否将在当前画面参考模式下被编码的信息进行编码。可用信号发送指示当前块是否是在当前画面参考模式下被编码的标志或索引,并且可基于当前块的参考画面索引来推导该标志或索引。在当前块在当前画面参考模式下被编码的情况下,可将当前画面添加到针对当前块的参考画面列表,以使当前画面位于参考画面列表中的固定位置或随机位置。固定位置可以是例如由参考画面索引0指示的位置或列表中的最后一个位置。在当前画面被添加到参考画面列表以使其位于随机位置时,可用信号发送指示随机位置的参考画面索引。
在下文中,将参照上面描述来详细描述根据本发明的图像编码/解码方法。
图5是示出根据本发明的实施例的图像解码方法的流程图的示图。
参照图5,在S510,解码设备可基于合并模式对运动估计的信息进行熵解码,并且在S520,基于解码的信息来推导当前块的合并候选。随后,在S530,解码设备可通过使用先前推导的合并候选列表来生成合并候选的初始合并候选列表。随后,在S540,解码设备可生成通过使用初始合并候选列表重新配置的合并候选列表。
由解码设备推导的合并候选可包括空间合并候选、时间合并候选、基于子块的时间合并候选、基于子块的时空组合合并候选和附加合并候选中的至少一个。然而,可由解码设备合并的合并候选的类型不限于此,并且可由本领域普通技术人员实现的各种形式的合并候选可被应用于本发明。
图6是示出根据本发明的实施例的图像解码方法的流程图的示图。
参照图6,将详细描述由解码设备生成重建的合并候选列表的S540。在S610,解码设备可通过使用当前块的邻近块的运动信息来计算推导出的合并候选的失真值。随后,在S610,解码设备可通过基于计算的失真值重新配置初始合并候选列表来生成重新配置的合并候选列表。
图7是示出推导空间合并候选的方法的示图。
参照图7,将详细描述由解码设备推导将被解码的当前块的空间合并候选的方法。解码设备可从在空间上与当前块相邻的重建的邻近块来推导当前块的空间合并候选。
例如,运动信息可从与位于当前块X的左侧的块A1、位于当前块X的上方的块B1、位于当前块X的右上角的块B0、位于当前块X的左下角的块A0和位于当前块X的左上角的块B2对应的块被推导出,并且推导的信息可用作当前块的空间合并候选。
当从重建的邻近块推导当前块的空间合并候选时,当通过仿射变换模型模式(仿射模式)或当前画面参考(CPR)对邻近块的运动信息进行解码时,解码设备不使用相应的邻近块作为空间合并候选。这里,CPR模式可表示在执行帧内或帧间预测时可将当前图像用作参考图像的预测模式。
另外,邻近块可包括校正的运动信息而不是初始运动信息。这里,解码设备可使用邻近块的初始运动信息作为当前块的空间合并候选,而不是使用校正的运动信息作为当前块的空间合并候选。
空间合并候选可指示在空间上与当前块相邻的重建的邻近块的运动信息,并且可具有正方形形状或非正方形形状。另外,可将在空间上与当前块相邻的重建的邻近块划分为较低等级块(子块)单元。解码设备可针对每个较低等级块推导至少一个空间合并候选。
在另一示例中,空间合并候选可包括在空间上不与当前块相邻的重建的邻近块的运动信息。这里,在空间上不与当前块相邻的重建的邻近块可以是位于与当前块相同的CTU内的块。
同时,当在空间上不与当前块相邻的重建的邻近块位于与当前块不同的CTU中时,在空间上不相邻的重建的邻近块不用作当前块的空间合并候选块。但是,当在空间上不相邻的邻近块位于当前块所属的CTU的上边界或左边界或上边界和左边界两者上时,即使在空间上不相邻的邻近块位于不同的CTU内,相应的邻近块也可用作当前块的空间合并候选。
这里,推导空间合并候选可意为推导空间合并候选并将其添加到合并候选列表。这里,合并候选列表中包括的每个合并候选的运动信息可不同。
当由解码设备将空间合并候选添加到合并候选列表时,解码设备可确定存在于合并候选列表中的所有空间合并候选的运动信息是否与新添加的空间合并候选相同,而不是直接确定先前添加到合并候选列表中的候选的运动信息是否与新添加的空间合并候选相同。当解码设备确定在合并候选列表中不存在与新添加的空间合并候选相同的空间合并候选时,解码设备可将该空间合并候选添加到合并候选列表。
解码设备可推导多达maxNumSpatialMergeCand个空间合并候选。这里,maxNumSpatialMergeCand可以是包括0的正整数。
在示例中,maxNumSpatialMVPCand可以是5。MaxNumMergeCand可以是可包括在合并候选列表中的合并候选的最大数量,并且可以是包括0的正整数。此外,numMergeCand可表示预设MaxNumMergeCand内的包括在实际合并候选列表中的合并候选的数量。然而,numMergeCand和MaxNumMergeCand的使用不限制本发明的范围。解码设备可通过使用具有与numMergeCand和MaxNumMergeCand相同含义的参数值来使用上述信息。
图8是示出推导时间合并候选的方法的示图。
参照图8,将详细描述由解码设备推导将被解码的当前块的时间合并候选的方法。解码设备可从在时间上与当前块相邻的参考图像(参考画面)中的重建块来推导时间合并候选。在时间上与当前块相邻的参考图像可表示同位图像(同位画面)。另外,可以以序列、画面、条带、并行块、CTU和CTU内的编码块单元中的至少一个为单位将同位图像的信息从编码设备发送到解码设备。
可选地,可通过使用当前或在时间-空间上或当前和在时间-空间上两者与根据编码/解码顺序的层次结构相邻的已被编码/解码的块的至少一条运动信息,并且使用序列、画面、条带和并行块等级的同位图像的帧间预测指示符或参考图像索引信息来隐式地推导同位图像的信息。
同位图像的信息可包括帧间预测指示符、参考图像索引和指示当前块的同位块的运动矢量信息中的至少一个。
这里,当推导当前块的时间合并候选时,可通过使用在时间-空间上相邻的或不相邻的已被解码的块的至少一条运动信息,通过在同位图像内的基于当前块的位置的相同位置的块来确定同位图像和同位图像内的同位块的位置。
可选地,通过使用在时间-空间上与当前块相邻或不相邻的已被解码的块的至少一条运动矢量信息,可将从选择的同位图像内的在空间上与当前块相同的位置移动相应的运动矢量而定位的块定义为当前块的同位块。
这里,运动信息可包括运动矢量、参考图像索引、帧间预测指示符、画面顺序计数(POC)、当前编码画面(或条带)等级的同位图像的信息。
这里,推导时间合并候选可意为推导时间合并候选并将其添加到合并候选列表。另外,将时间合并候选添加到合并候选列表可意为当存在于现有的合并候选列表中的运动信息和新推导的时间合并候选的运动信息不同时,将相应的时间合并候选添加到合并候选列表。
当解码设备添加时间合并候选,并且在现有的合并候选列表中存在稍后将被描述的基于子块的时间合并候选时,解码设备可确定基于子块的时间合并候选的运动信息是否与新添加的时间合并候选的运动信息相同。当解码设备确定在合并候选列表中不存在与新添加的时间合并候选具有相同的运动信息的基于子块的时间合并候选时,解码设备可将相应的时间合并候选添加到合并候选列表中。
详细地,解码设备可将基于子块的时间合并候选的代表性运动信息与新添加的时间合并候选的运动信息进行比较。下面将参照图11描述获得代表性运动信息的详细实施例。
解码设备可确定代表性运动信息的帧间预测指示符是否与新添加的时间合并候选的帧间预测指示符的值相同。这里,当帧间预测指示符的值不相同时,解码设备可将时间合并候选添加到合并候选列表。同时,当帧间预测指示符的值相同时,解码设备可不将新添加的时间合并候选添加到合并候选列表。
在另一示例中,当帧间预测指示符的值相同时,解码设备可另外确定代表性运动信息的运动矢量或参考图像索引是否与新添加的时间合并候选的运动矢量或参考图像索引相同。当运动矢量和参考图像索引中的至少一个不相同时,解码设备可将时间合并候选添加到合并候选列表。
在另一示例中,即使帧间预测指示符的值相同,当L0方向和L1方向的至少一条运动信息不相同时,解码设备也可不将时间合并候选添加到合并候选列表。
另一方面,当在现有的合并候选列表中首先包括时间合并候选并且之后另外地添加基于子块的时间合并候选时,解码设备可通过使用上述任何一种方法来确定是否将新添加的基于子块的时间合并候选添加到合并候选列表。换言之,解码设备可将现有的合并候选列表中包括的时间合并候选的运动信息与新添加的基于子块的时间合并候选的运动信息进行比较,并确定是否将新添加的基于子块的时间合并候选添加到合并候选列表。
解码设备可推导多达maxNumTemporalMergeCand个时间合并候选。这里,maxNumTemporalMergeCand可以是包括0的正整数。
在示例中,maxNumTemporalMergeCand可以为1。然而,maxNumTemporalMergeCand的使用并不限制本发明的范围。解码设备可通过使用具有与maxNumTemporalMergeCand相同含义的参数值来使用上述信息。
在下文中,通过时间合并候选进行的预测在本说明书中被称为时间运动矢量预测(TMVP)。
图8是示出推导时间合并候选的方法的示图。解码设备可通过使用位置H处的块,或者通过使用位置C3处的块来推导时间合并候选,其中,位置H在在空间上与当前块X相同位置的同位块C的外部。
当解码设备从位置H处的块推导时间合并候选时,可通过位置H处的块推导时间合并候选,并且当解码设备不从位置H处的块推导时间合并候选时,可通过位置C3处的块推导时间合并候选。
这里,当通过使用帧内预测方法对位置H处的块或位置C3处的块进行编码时,解码设备不能推导时间合并候选。同位块可具有正方形形状或非正方形形状。
在另一示例中,当通过使用仿射变换模型模式(仿射模式)或当前图像参考模式(CPR模式)对与块(位于位置H或C3处的块)关联的块进行编码时,解码设备不能从相应的同位块推导当前块的时间合并候选。
当包括当前块的图像和当前块的参考图像之间的距离不同于包括同位块的图像和同位块的参考图像之间的距离时,解码设备可通过对同位块的运动矢量执行缩放来推导时间合并候选。可根据td与tb的比率(比率=(tb/td))执行运动矢量的缩放。
这里,td可表示同位图像的POC与同位块的参考图像的POC之间的差值,并且tb可表示将被解码的图像的POC与当前块的参考图像的POC之间的差值。
在下文中,将描述由解码设备推导基于子块的时间合并候选的方法。
解码设备可以以子块为单位从同位子块推导时间合并候选。子块是具有小于当前块的水平或垂直尺寸或者具有比当前块更深的深度或具有比当前块更小的形状的块,并且可以是当前块中包括的块。
将被解码的子块的同位子块可具有正方形形状或非正方形形状。解码设备可以以子块为单位对当前块的同位块进行划分,并且推导针对每个子块的至少一个时间合并候选。
当通过以子块为单位推导至少一个时间合并候选时,可根据如图8中所示的当前块的子块的形状或深度,从与H或C3对应的同位子块推导时间合并候选。可选地,可从与通过根据当前块的邻近块推导出的运动信息进行移动而得到的位置相关联的同位块的每个子块单元中存储的运动信息,来推导至少一个时间合并候选。
当推导当前块或当前块的子块的时间合并候选时,解码设备可对从同位块内的同位子块获得的每个参考图像列表的运动矢量执行缩放,作为与当前块的任意参考图像相关联的运动矢量。
解码设备可通过对来自同位子块的运动矢量执行缩放至为由当前块的子块可参考的所有参考图像中的至少一个参考图像相关联的运动矢量来获得多个运动矢量,使用经缩放的与每个参考图像相关联的运动矢量来获得至少一个预测块,并且通过对所述至少一个预测块的加权和来获得当前块或子块的预测块。
在下文中,通过基于子块的时间合并候选进行的预测在本说明书中被称为替代时间运动矢量预测(ATMVP)。
图9是示出推导基于子块的时空组合合并候选的方法的示图。
解码设备可通过将当前块划分为子块,以子块为单位通过使用邻近空间子块或同位图像内的同位子块或邻近空间子块和同位图像内的同位子块两者的至少一条运动信息来推导当前块的合并候选。
图9是示出由解码设备推导基于子块的时空组合合并候选的方法的示图。在图9中,灰色的尺寸为8×8的当前块被划分成四个4×4子块。
解码设备可通过使用每个子块的时空子块的运动矢量信息来推导基于子块的时空组合合并候选。
在图9中,当解码设备将当前块划分为子块并根据运动估计来推导残差信号时,解码设备可通过基于子块A上方的子块从左向右执行扫描来获得运动信息。例如,在图9中,当通过帧内预测方法对上方子块进行编码时,解码设备可顺序地对上方子块b进行扫描。
解码设备可对上方邻近块执行扫描,直到找到包括可用的运动矢量信息的上方子块为止。解码设备可获取可用的上方子块的运动信息,然后通过基于子块A左侧的子块c从顶部向底部执行扫描来获取运动信息。
解码设备可获得左侧子块和上方子块中的至少一个的空间邻近运动信息,并且为了推导时间运动信息,解码设备可获得同位子块和当前子块的同位块中的至少一个的运动信息。
这里,同位块或同位块的子块的位置可以是在图8中描述的位置C3或H处的块的运动信息,或者可指示在由与当前块相邻推导的运动矢量所校正的位置处的同位块的子块或者在校正的位置处的同位块。
通过使用以上方法,解码设备可获得当前块的L0空间邻近块和L1空间邻近块中的至少一个的运动信息以及时间邻近块的运动信息中的至少一条运动信息,并且基于所述至少一条运动信息推导当前被解码的子块的基于子块的时空组合合并候选。
在一个实施例中,解码设备可针对L0和L1中的至少一个对在描述当前块的子块的时空子块中推导的至少一个运动矢量执行缩放,以对应于当前块的第一参考图像。随后,解码设备可通过使用平均值、最大值、最小值、中值、权重值、多达三个缩放运动矢量的众数中的至少一个来推导当前子块A的运动矢量或子块A的时空组合合并候选。通过使用相同的方法,解码设备可推导子块B、C和D的时空组合合并候选。
解码设备可不将当前块划分为如图9所示的子块A、B、C和D,并且通过使用邻近空间子块和同位图像内的同位子块的至少一条运动信息来推导当前块的合并候选。例如,解码设备可通过使用上方子块b的运动信息、左侧子块d的运动信息和同位块的运动信息来推导当前块的时空组合合并候选。
在下文中,通过基于子块的时空组合合并候选进行的预测在本说明书中被称为时空运动矢量预测(STMVP)。
在下文中,除了上面描述的空间合并候选、时间合并候选、基于子块的时间合并候选和基于子块的时空组合合并候选之外,还将描述可被应用于本发明的附加合并候选。
作为可在本发明中使用的附加合并候选,解码设备可推导修改的空间合并候选、修改的时间合并候选、组合合并候选和具有预定运动信息值的合并候选中的至少一个。
这里,推导附加合并候选可意为当存在与现有的合并候选列表中存在的合并候选具有不同运动信息的合并候选时,将相应的合并候选添加到合并候选列表。
这里,修改的空间合并候选可表示通过修改通过使用上述方法推导的空间合并候选的至少一条运动信息而获得的合并候选。
修改的时间合并候选可表示通过修改通过使用上述方法推导的时间合并候选的至少一条运动信息而获得的合并候选。
这里,具有预定运动信息值的合并候选可表示运动矢量为(0,0)的零合并候选。在下文中,通过零合并候选进行的预测在本说明书中被称为零运动预测(ZMP)。
组合合并候选可表示使用存在于合并候选列表中的空间合并候选、时间合并候选、修改的空间合并候选、修改的时间合并候选、组合合并候选和具有预定运动信息值的合并候选的至少一条运动信息中的运动信息的合并候选,这里,组合合并候选可表示组合双向预测合并候选。
这里,可针对每个列表构建组合合并候选。例如,解码设备可通过使用存在于L0列表中的候选的平均值来生成新组合的L0列表合并候选。另外,解码设备可通过使用存在于L1列表中的候选的平均值来生成新组合的L1合并候选。
另外,解码设备可通过使用存在于L0或L1列表中的候选来生成L0或L1列表合并候选。
例如,解码设备可通过使用通过沿L0列表方向对L0合并候选和L1合并候选执行镜像或缩放而生成的候选的平均值来生成新组合的L0列表合并候选。
在另一示例中,解码设备可通过使用通过沿L1列表方向对L1合并候选和L0合并候选执行镜像或缩放而生成的候选的平均值来生成新组合的L1列表合并候选。
在下文中,通过组合合并候选进行的预测在本说明书中将被称为组合运动预测(CMP)。
解码设备可针对每个子块推导修改的空间合并候选、空间合并候选、修改的时间合并候选、时间合并候选、组合合并候选和具有预定运动信息值的合并候选中的至少一个,并将针对每个子块推导的合并候选添加到合并候选列表中。
图10是示出根据本发明的实施例的确定合并候选列表的方法的示图。
在下文中,将描述根据本发明的实施例的确定合并候选列表的方法。如在图5的S530中所描述的,解码设备可生成当前块的初始合并候选列表。随后,如在图6的S610中描述的,解码设备可通过使用初始合并候选列表中包括的每个合并候选的运动信息来计算当前块的合并候选的失真值。
运动信息可包括以下项中的至少一个:帧间预测指示符、L0参考或L1参考或L0参考和L1参考两者的图像索引、L0或L1或L0和L1两者的运动矢量、当前编码图像或参考图像或当前编码图像和参考图像两者的POC和LIC(局部照明补偿)标志、仿射标志、OBMC(重叠块运动补偿)标志、在空间上与当前块相邻的重建亮度样点或重建色度样点或重建亮度和色度样点两者、以及由合并候选的运动信息指示的参考图像的亮度样点或色度样点或亮度样点和色度样点两者。然而,本发明的运动信息不限于此。
初始合并候选列表可被配置有多达N个合并候选的运动信息,并且N可表示大于0的正整数。这里,时空合并候选可表示以上描述的空间合并候选、时间合并候选、基于子块的时间合并候选、基于子块的时空组合合并候选、组合合并候选和零合并候选中的至少一个。
为了在初始合并候选列表内配置多达N个合并候选,解码设备可根据针对当前块的预设顺序来填充初始合并候选列表。这里,解码设备可省略重新配置附加合并候选列表,并且将初始合并候选列表确定为当前块的最终合并候选列表。
当解码设备将新的合并候选添加到合并候选列表时,当新添加的合并候选的至少一条运动信息不同于现有的合并候选列表中包含的合并候选的运动信息时,解码设备可将新的合并候选添加到合并候选列表。
在示例中,假设允许多达七个时空合并候选添加到合并候选列表,可根据如下表1所示的任意预定顺序依次配置多达七个初始合并候选列表。这里,合并索引可具有从0到6的值。下面示出添加合并候选列表的顺序的示例是本发明的示例,并且本发明的范围不限于此。
[表1]
Figure BDA0002431895290000341
此处,A1、B1、A0、B0和B2可表示利用图7描述的空间合并候选。
例如,假设允许多达七个时空合并候选添加到合并候选列表,解码设备可利用与解码的合并索引对应的合并候选的数量来配置合并候选列表,以减小计算量或复杂度。因此,当从0到6发送合并索引,并且在解码设备中实际解码的合并索引是3时,解码设备可通过推导多达四个合并候选来配置初始合并候选列表。
在示例中,在配置合并候选列表的模块中,可仅在实际以子块为单位推导合并候选之前,执行以子块为单位存储合并候选的运动信息的存储器的初始化。这里,初始化可意为以子块为单位指定子块单元的运动矢量、帧间预测指示符以及L0或L1或L0和L1两者参考图像索引的初始值。
当解码设备配置初始合并候选列表,并且初始合并候选列表中包括的空间合并候选的数量小于预设值K时,解码设备可省略计算合并候选的失真值,并且将初始合并候选列表确定为当前块的最终合并候选列表。这里,K可表示大于0的任意正整数。
在下文中,将详细描述由解码设备计算失真值的方法。
解码设备可配置初始合并候选列表,然后可通过使用在空间上与当前块相邻的重建亮度样点或重建色度样点或重建亮度样点和重建色度样点两者(与当前块相邻的重建样点)、以及在空间上与由每个合并候选的运动信息指示的参考图像的参考块相邻的亮度样点或色度样点或亮度样点和色度样点两者(与参考块相邻的样点)来计算当前块与任意合并候选之间的失真值。
解码设备可通过使用与当前块相邻的重建样点和与参考块相邻的样点之间的SAD(绝对差之和)、SATD(绝对变换差之和)和MR-SAD(去除均值的绝对差之和)中的至少一个来计算失真值。
如图10所示,可将具有任意尺寸、形状和深度并且被配置有与当前块相邻的至少一个样点的至少一个块定义为模板1000和1005。
另外,通过使用与当前块的上方相邻的至少一条运动信息或与当前块的左侧相邻的至少一条运动信息或与当前块的上方相邻的至少一条运动信息和与当前块的左侧相邻的至少一条运动信息两者,解码设备可将具有任意尺寸、形状和深度并且被配置有从参考图像在时间上进行运动估计的样点的至少一个块定义为参考块的模板1010和模板1015。
解码设备可计算当前块的模板1000和1005与由合并候选指示的参考块的模板1010和1015之间的失真值。解码设备可将上方模板1000(上模板)或左侧模板1005定义为用于计算失真值的模板。
图10中描述的宽度和高度表示当前块的水平尺寸和垂直尺寸。这里,M和K可以是大于0的正整数。M和K可具有相同的值或彼此不同的值。另外,可将宽度或高度或宽度和高度两者设置为与当前块的宽度或高度或宽度和高度两者具有相同的值或具有不同的值。
图10是示出上方模板具有宽度×M的值并且左侧模板具有高度×K的值的实施例的示图。
在示例中,可通过使用当前块的模板1000(模板(当前))与参考块模板1010(模板L0)或参考块模板1015(模板L1)或参考块模板1010(模板L0)和参考块模板1015(模板L1)两者之间的SAD、SATD和MRSAD中的至少一个来计算当前块与由任意合并候选的运动信息指示的参考图像内的参考块之间的失真值。
解码设备可使用模板L0和模板L1之一作为用于计算失真值的模板,或者可使用模板L0和模板L1两者。当使用模板L0和模板L1两者时,解码设备可通过模板L0和模板L1的加权平均值来计算失真值。
当前块模板1000和1005与模板L0 1010之间的失真值可被定义为失真(L0),当前块模板与模板L1之间的失真值可被定义为失真(L1),并且当前块模板、模板L0和模板L1的加权平均值之间的失真值可被定义为失真(Bi)。这里,失真(L0)和失真(L1)可被定义为第一失真值和第二失真值。模板L0和模板L1可分别被定义为第一模板和第二模板。
当任意合并候选仅包括L0方向运动信息时,解码设备可计算失真(L0),或者可通过对L0方向运动信息执行镜像来推导L1方向运动信息以计算失真(L1)和失真(Bi)。这里,镜像可以是相对于原点对运动矢量的值执行对称操作。
例如,当L0方向运动矢量的X移动量和Y移动量为(3,5)时,通过对该运动矢量执行镜像而获得的L1矢量值可被推导为(-3,-5)。
在另一示例中,在计算所有失真(L0)、失真(L1)和失真(Bi)之后,解码设备可通过使用最小值、中值和平均值中的至少一个来计算当前块的最终失真值。
在另一个示例中,当解码设备将当前块和合并候选之间的失真值定义为失真(L0)、失真(L1)和失真(Bi)的最小值时,解码设备可通过更新合并候选列表的运动信息对当前块进行解码,其中,当在失真(L0)中的失真值具有最小值时,即使初始合并候选列表的合并候选包括双向运动信息,当前合并候选也仅包括L0运动信息。
当重新配置初始合并候选列表时,解码设备可基于从编码设备发送的信息来重新配置初始合并候选列表,而无需计算上述失真值。从编码设备发送的信息可以是指示在编码设备和解码设备中预设的列表重新配置方法的指示符信息,或者可以是指示预设列表的索引。
图11是示出根据本发明的实施例的确定代表性运动信息的方法的示图。
参照图11,将描述任意合并候选包括至少一条运动信息的情况。当构建初始合并候选列表的任意合并候选是包括至少一条运动信息的ATMVP或STMVP或ATMVP和STMVP两者时,解码设备可通过上述相同的方法使用代表性运动信息来计算当前块的失真值。
任意合并候选的代表性运动信息可由具有彼此不同的至少一条运动信息的子块的运动信息中的在预设位置处的运动信息被确定,或者可通过所有子块的运动信息之间的加权平均值被推导出。
在示例中,在当前块的尺寸是大于4×4的32×32块,并且合并候选是4×4子块单元的ATMVP或STMVP或ATMVP和STMVP两者时,为了推导针对当前块的参考块的模板,解码设备可将当前块的第一子块(如图12(a)所示的阴影区域)的运动信息推导为合并候选的代表性运动信息。
在另一示例中,在当前块的尺寸是大于4×4的32×32块并且合并候选是4×4子块单元的ATMVP或STMVP或ATMVP和STMVP两者时,为了推导针对当前块的参考块的模板,解码设备可将位于当前块的中心的子块(如图12(b)所示的阴影区域)的运动信息推导为合并候选的代表性运动信息。
在另一示例中,在当前块的尺寸是大于4×4的32×32块并且合并候选是4×4子块单元的ATMVP或STMVP或ATMVP和STMVP两者时,为了推导参考块的模板,解码设备可通过使用彼此不同的子块的众数、中值和平均值中的至少一个来推导代表性运动信息。
当解码设备计算失真值时,解码设备可通过校正(精细化)参考块的模板来精确地计算失真值。如图10所示,解码设备可通过使用L0方向参考块模板来计算失真(L0),但是可通过将任意偏移应用于合并候选中推导出的L0方向运动矢量来改变运动矢量,然后推导参考块的模板。
在一个示例中,当偏移为1并且由任意合并候选的L0运动矢量指示的X方向和Y方向的大小为(3,4)时,除了与(3,4)对应的参考块的模板之外,解码设备还可通过将+1和-1的偏移应用于X轴方向并且将+1和-1的偏移应用于Y轴方向来推导由每个运动矢量以交叉形式(诸如(2,4)、(4,4)、(3,3)和(3,5))指示的参考块的至少一个模板。这里,解码设备可将通过使用多个模板计算的失真值的值中的最小值定义为失真(L0)。这里,当在(3、5)处确定失真(L0)时,任意合并候选的L0方向运动矢量可从(3、4)被更新为(3、5),并被设置在合并候选列表中。
图12是示出根据本发明的实施例的计算失真值的方法的示图。
如图12所示,在当前块的任意合并候选包括双向运动信息时,解码设备可将L0参考块与L1参考块之间的失真值定义为当前块与任意合并候选之间的失真值。
图13是示出根据本发明的另一实施例的计算失真值的方法的示图。
如图13所示,当任意合并候选包括单向(L0或L1)运动信息时,解码设备可将通过对单向运动信息的运动矢量执行镜像而获得的L0参考块与L1参考块之间的失真值定义为当前块与任意合并候选之间的失真值。
图14是示出根据本发明的另一实施例的计算失真值的方法的示图。
如图14所示,当任意合并候选包括双向运动信息时,解码设备可在通过对L0的运动矢量执行镜像来计算L1方向上的参考块之后,计算L0参考块与L1参考块之间的失真(L0)。通过使用相同的方法,解码设备可在通过对L1的运动矢量执行镜像来计算L0方向上的参考块之后,计算L0参考块与L1参考块之间的失真(L1)。解码设备可通过使用失真(L0)和失真(L1)的平均值、最小值和最大值中的至少一个来计算当前块与任意合并候选之间的失真值。例如,当失真(L0)具有最小值时,解码设备可确定当前合并候选仅包括L0运动信息,并通过更新合并候选列表的运动信息来执行解码。
参照图13至图15,当计算参考块之间的失真值时,解码设备可照原样使用在合并候选中推导的运动矢量,或者可通过将任意偏移应用于初始推导的运动矢量来改变运动矢量。解码设备可将通过应用偏移而计算出的失真值中的最小值定义为当前块与任意合并候选之间的最终失真值。
在下文中,将详细描述由解码设备重新配置合并候选列表的方法。
如在图6的S620中所描述的,解码设备可通过使用通过使用邻近块的运动信息计算出的失真值来重新配置初始合并候选列表。
解码设备可计算初始合并候选列表的所有合并候选的失真值,然后从具有小的失真值的合并候选填充合并候选列表。
在示例中,解码设备可针对初始合并候选列表的L个任意合并候选计算失真值,然后从具有小的失真值的合并候选填充该合并候选列表。当合并候选列表中包括的合并候选的最大数量是P时,L可以小于P。
用于计算失真值的合并候选可在初始合并候选列表中具有从0到L-1的合并索引。例如,当L为2时,可通过针对填充在初始合并候选列表中的两个合并候选计算失真值来重新配置合并候选列表。
例如,当初始合并候选列表被确定为以(A1-B1-B0-A0-ATMVP-STMVP-B2)的顺序被配置,并且L为2且空间合并候选B1的失真值小于空间合并候选A1的失真值时,解码设备可按(B1-A1-B0-A0-ATMVP-STMVP-B2)的顺序重新配置初始合并候选列表。
在另一示例中,当重新配置合并候选列表时,解码设备可将具有计算出的最小失真值的合并候选重新配置为第一合并候选。当配置初始合并候选列表的顺序被确定为(A1-B1-B0-A0-ATMVP-STMVP-B2),并且在初始合并候选列表中,空间合并候选B0的失真值小于空间合并候选A1的失真值时,解码设备可将初始合并候选列表重新配置为(B0-A1-B1-A0-ATMVP-STMVP-B2)。
在另一实施例中,解码设备可使用在邻近块或当前块的更高等级中重新配置的合并候选列表的顺序来重新配置当前块的合并候选列表。可从编码设备向解码设备提供是否使用在邻近块中或在更高等级中重新配置的合并候选列表的顺序,或者解码设备可基于编码参数来确定是否使用在邻近块中或在更高等级中重新配置的合并候选列表的顺序。
编码设备可确定是否重新配置当前块的合并候选列表、以及指示是否执行重新配置的熵编码信息。编码设备可通过对在应用合并候选列表重新配置方法之前的RD代价与在执行合并候选列表重新配置方法之后的RD代价进行比较来确定是否执行合并候选列表的重新配置。
解码设备可从比特流对指示是否执行合并候选列表的重新配置的信息进行熵解码,并且根据接收到的信息来重新配置合并候选列表。
编码设备或解码设备可根据当前块的编码参数被设置为对指示是否执行合并候选列表的重新配置的相同信息执行熵编码/解码或者省略指示是否执行合并候选列表的重新配置的相同信息。
例如,在当前块的尺寸等于或小于预定义尺寸、形状和深度时,编码设备或解码设备可被设置为执行或不执行合并候选列表的重新配置。另一方面,在当前块的尺寸等于或大于预定义尺寸、形状和深度时,编码设备或解码设备可被设置为执行或不执行合并候选列表的重新配置。
在另一示例中,编码设备和解码设备可被设置为在当前块的尺寸等于或大于或者等于或小于预定义尺寸并且当前块按照二叉树或四叉树被划分时不执行合并候选列表的重新配置。
在另一示例中,编码设备或解码设备可被设置为在当前块的尺寸等于或大于或者小于或等于预定义尺寸并且当前块按照二叉树或四叉树被划分时不执行合并候选列表的重新配置。
解码设备可根据在画面/条带单元、CTU单元和CTU更低等级单元中的至少一个中被熵解码的标志信息来确定是否将合并候选列表重配置方法应用于当前目标块。这里,更低等级单元可包括CTU更低等级单元、四叉树单元和二叉树单元中的至少一个。在另一示例中,解码设备可根据当前块所属的当前画面或条带的时间层来确定是否执行合并候选列表重新配置方法。
图15是示出根据本发明的实施例的图像编码方法的流程图的示图。
参照图15,在S1500,编码设备可推导当前块的合并候选。随后,在S1510,编码设备可通过使用推导的合并候选列表来生成合并候选的初始合并候选列表。随后,在S1520,编码设备可通过使用初始合并候选列表来生成重新配置的合并候选列表。
由编码设备通过使用邻近块的运动信息来计算合并候选的失真值并基于失真值来重新配置合并候选列表对应于利用图6描述的解码设备的操作,因此,将省略其描述。
可在编码器和解码器中以相同的方法执行以上实施例。
应用于以上实施例的顺序在编码器与解码器之间可不同,或者应用于以上实施例的顺序在编码器和解码器中可相同。
可对每个亮度信号和色度信号执行以上实施例,或者可对亮度信号和色度信号相同地执行以上实施例。
应用本发明的以上实施例的块形状可具有正方形形状或非正方形形状。
可依据如下块/单元中的至少一个的尺寸来应用本发明的以上实施例:编码块、预测块、变换块、块、当前块、编码单元、预测单元、变换单元、单元和当前单元。这里,尺寸可被定义为最小尺寸或最大尺寸或者最小尺寸和最大尺寸两者,从而应用上述实施例,或者尺寸可被定义为应用了以上实施例的固定尺寸。此外,在以上实施例中,可将第一实施例应用于第一尺寸,并且可将第二实施例应用于第二尺寸。换句话说,可依据尺寸组合地应用以上实施例。此外,当尺寸等于或大于最小尺寸并且等于或小于最大尺寸时,可应用以上实施例。换句话说,当块尺寸被包括在特定范围内时,可应用以上实施例。
例如,在当前块的尺寸为8×8或更大时,可应用以上实施例。例如,在当前块的尺寸为4×4或更大时,可应用以上实施例。例如,在当前块的尺寸为16×16或更大时,可应用以上实施例。例如,在当前块的尺寸等于或大于16×16并且等于或小于64×64时,可应用以上实施例。
可依据时间层来应用本发明的以上实施例。为了标识可应用以上实施例的时间层,可用信号发送相应标识符,并且可将以上实施例应用于由相应标识符标识的指定时间层。这里,标识符可被定义为可应用以上实施例的最低层或最高层或者最低层和最高层两者,或者可被定义为指示应用实施例的特定层。此外,可定义应用实施例的固定时间层。
例如,在当前图像的时间层是最低层时,可应用以上实施例。例如,在当前图像的时间层标识符是1时,可应用以上实施例。例如,在当前图像的时间层是最高层时,可应用以上实施例。
可定义应用本发明的以上实施例的条带类型,并且可依据相应条带类型应用以上实施例。
当运动矢量具有16pel单位、8pel单位、4pel单位、整数pel单位、1/8pel单位、1/16pel单位、1/32pel单位和1/64pel单位中的至少一个时,也可应用本发明的以上实施例。可针对每个像素单位选择性地使用运动矢量。
在上述实施例中,基于具有一系列步骤或单元的流程图描述了所述方法,但是本发明不限于这些步骤的顺序,而是,一些步骤可与其他步骤同时执行或以不同的顺序执行。此外,本领域的普通技术人员应该理解,流程图中的步骤并不互相排斥,并且在不影响本发明的范围的情况下,可将其他步骤添加到流程图或者可将步骤中的一些步骤从流程图删除。
实施例包括示例的各个方面。可不描述各个方面的所有可能的组合,但是本领域技术人员将能够认识到不同的组合。因此,本发明可包括权利要求范围内的所有替换、修改和改变。
本发明的实施例可以以程序指令的形式实现,其中,该程序指令可由各种计算机组件执行并且被记录在计算机可读记录介质中。计算机可读记录介质可单独地包括程序指令、数据文件、数据结构等,或者可包括程序指令、数据文件、数据结构等的组合。记录在计算机可读记录介质中的程序指令可以是为本发明专门设计和构建的,或者对于计算机软件技术领域的普通技术人员是公知的。计算机可读记录介质的示例包括磁记录介质(诸如,硬盘、软盘和磁带)、光学数据存储介质(诸如,CD-ROM或DVD-ROM)、磁光介质(诸如软光盘)以及被专门构造为存储和实现程序指令的硬件装置(诸如,只读存储器(ROM)、随机存取存储器(RAM)、闪存等)。程序指令的示例不仅包括由编译器格式化的机械语言代码,而且包括可由计算机使用解释器来实现的高级语言代码。硬件装置可被配置为由一个或更多个软件模块操作或者反之亦可,以进行根据本发明的处理。
尽管已经在特定项目(诸如,详细元件)以及有限的实施例和附图方面描述了本发明,但是它们仅被提供以帮助更全面地理解本发明,并且本发明不限于以上实施例。本发明所属领域的技术人员将理解,可对以上描述进行各种修改和改变。
因此,本发明的精神将不应限于上述实施例,并且利要求及其等同物的整个范围将落入本发明的范围和精神内。
工业适用性
本发明可被用于对图像进行编码/解码。

Claims (16)

1.一种对图像进行解码的方法,所述方法包括:
推导当前块的至少一个合并候选;
通过使用推导出的所述至少一个合并候选生成当前块的初始合并候选列表;并且
通过使用所述初始合并候选列表生成重新配置的合并候选列表。
2.如权利要求1所述的方法,其中,生成重新配置的合并候选列表的步骤包括:
通过使用当前块的邻近块和所述至少一个合并候选计算所述至少一个合并候选的失真值;并且
基于所述失真值重新配置所述初始合并候选列表。
3.如权利要求1所述的方法,其中,所述初始合并候选列表包括当前块的空间合并候选、时间合并候选、基于子块的时间合并候选、基于子块的时空组合合并候选、组合合并候选和零合并候选中的至少一个。
4.如权利要求2所述的方法,其中,所述失真值是通过使用当前块的邻近块与当前块的参考块的邻近块之间的绝对差之和SAD、绝对变换差之和SATD以及去除均值的绝对差之和MR-SAD中的至少一个被计算出的。
5.如权利要求2所述的方法,其中,所述失真值是基于由所述至少一个合并候选的L0方向运动信息指示的L0方向上的参考块的邻近块和由所述至少一个合并候选的L1方向运动信息指示的L1方向上的参考块的邻近块中的至少一个被计算出的。
6.如权利要求2所述的方法,其中,所述失真值是基于由通过将预设偏移应用于所述至少一个合并候选的运动矢量而获得的运动矢量指示的参考块的邻近块被计算出的。
7.如权利要求5所述的方法,其中,当所述至少一个合并候选包括L0方向运动信息和L1方向运动信息两者时,所述失真值是通过L0方向上的参考块的邻近块与L1方向上的参考块的邻近块之间的失真值被计算出的。
8.如权利要求5所述的方法,其中,当所述至少一个合并候选包括L0方向运动信息和L1方向运动信息中的任意一条运动信息时,所述失真值是由在由通过对所述任意一条运动信息应用镜像而推导出的运动信息所指示的参考块的邻近块与根据所述任意一条运动信息的参考块的邻近块之间的失真值计算出的。
9.如权利要求5所述的方法,其中,当所述至少一个合并候选包括L0方向运动信息和L1方向运动信息两者时,所述失真值是通过在由通过对L0方向运动信息应用镜像而推导出的运动信息所指示的参考块的邻近块与由通过对L1方向运动信息应用镜像而推导出的运动信息所指示的参考块的邻近块之间的失真值被计算出的。
10.如权利要求2所述的方法,其中,所述重新配置的合并候选列表是通过对所述初始合并候选列表中包括的一个或更多个合并候选的失真值按照大小进行重新排列被生成的。
11.如权利要求10所述的方法,其中,成为将被重新排列的目标的合并候选是根据所述初始合并候选列表中包括的一个或更多个合并候选的顺序被确定的。
12.如权利要求10所述的方法,其中,成为将被重新排列的目标的合并候选的数量是预先定义的值。
13.如权利要求1所述的方法,还包括:对当前块的运动估计信息进行熵解码,其中,当前块的所述运动估计信息包括指示是否重新配置所述初始合并候选列表的信息。
14.如权利要求1所述的方法,其中,是否配置所述初始合并候选列表是基于当前块的尺寸和划分形状中的至少一个被确定的。
15.一种对图像进行编码的方法,所述方法包括:
推导当前块的至少一个合并候选;
通过使用推导出的所述至少一个合并候选生成当前块的初始合并候选列表;并且
通过使用所述初始合并候选列表生成重新配置的合并候选列表。
16.一种包括比特流的非暂时性存储介质,其中,所述比特流通过图像编码方法被生成,所述图像编码方法包括:
推导当前块的至少一个合并候选;
通过使用推导出的所述至少一个合并候选生成当前块的初始合并候选列表;并且
通过使用所述初始合并候选列表生成重新配置的合并候选列表。
CN201880063815.0A 2017-09-29 2018-09-28 图像编码/解码方法和设备以及非暂时性存储介质 Active CN111164974B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202311040702.8A CN116866562A (zh) 2017-09-29 2018-09-28 图像编码/解码方法、存储介质及图像数据的传输方法
CN202311040525.3A CN116866561A (zh) 2017-09-29 2018-09-28 图像编码/解码方法、存储介质及图像数据的传输方法
CN202310382489.2A CN116489387A (zh) 2017-09-29 2018-09-28 图像编码/解码方法和设备

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2017-0128130 2017-09-29
KR20170128130 2017-09-29
PCT/KR2018/011490 WO2019066524A1 (ko) 2017-09-29 2018-09-28 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체

Related Child Applications (15)

Application Number Title Priority Date Filing Date
CN202311040525.3A Division CN116866561A (zh) 2017-09-29 2018-09-28 图像编码/解码方法、存储介质及图像数据的传输方法
CN202410372029.6A Division CN118042122A (zh) 2017-09-29 2018-09-28 图像编码/解码设备以及传输图像数据的设备
CN202311040702.8A Division CN116866562A (zh) 2017-09-29 2018-09-28 图像编码/解码方法、存储介质及图像数据的传输方法
CN202310382489.2A Division CN116489387A (zh) 2017-09-29 2018-09-28 图像编码/解码方法和设备
CN202410372027.7A Division CN118042120A (zh) 2017-09-29 2018-09-28 图像编码/解码方法、存储介质以及图像数据的传输方法
CN202410372033.2A Division CN118042124A (zh) 2017-09-29 2018-09-28 图像编码/解码方法、存储介质以及图像数据的传输方法
CN202410372035.1A Division CN118042125A (zh) 2017-09-29 2018-09-28 图像编码/解码设备以及传输图像数据的设备
CN202410390849.8A Division CN118055230A (zh) 2017-09-29 2018-09-28 图像编码/解码设备及发送图像数据的设备
CN202410390840.7A Division CN118055228A (zh) 2017-09-29 2018-09-28 图像编码/解码设备及发送图像数据的设备
CN202410372026.2A Division CN118055225A (zh) 2017-09-29 2018-09-28 图像编码/解码方法、存储介质以及图像数据的传输方法
CN202410390839.4A Division CN118055227A (zh) 2017-09-29 2018-09-28 图像编码/解码方法、存储介质及图像数据的发送方法
CN202410390841.1A Division CN118055229A (zh) 2017-09-29 2018-09-28 图像编码/解码方法、存储介质及图像数据的发送方法
CN202410390837.5A Division CN118055226A (zh) 2017-09-29 2018-09-28 图像编码/解码设备及发送图像数据的设备
CN202410372028.1A Division CN118042121A (zh) 2017-09-29 2018-09-28 图像编码/解码设备以及传输图像数据的设备
CN202410372030.9A Division CN118042123A (zh) 2017-09-29 2018-09-28 图像编码/解码方法、存储介质以及图像数据的传输方法

Publications (2)

Publication Number Publication Date
CN111164974A true CN111164974A (zh) 2020-05-15
CN111164974B CN111164974B (zh) 2024-04-16

Family

ID=65903024

Family Applications (4)

Application Number Title Priority Date Filing Date
CN202311040525.3A Pending CN116866561A (zh) 2017-09-29 2018-09-28 图像编码/解码方法、存储介质及图像数据的传输方法
CN201880063815.0A Active CN111164974B (zh) 2017-09-29 2018-09-28 图像编码/解码方法和设备以及非暂时性存储介质
CN202310382489.2A Pending CN116489387A (zh) 2017-09-29 2018-09-28 图像编码/解码方法和设备
CN202311040702.8A Pending CN116866562A (zh) 2017-09-29 2018-09-28 图像编码/解码方法、存储介质及图像数据的传输方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202311040525.3A Pending CN116866561A (zh) 2017-09-29 2018-09-28 图像编码/解码方法、存储介质及图像数据的传输方法

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN202310382489.2A Pending CN116489387A (zh) 2017-09-29 2018-09-28 图像编码/解码方法和设备
CN202311040702.8A Pending CN116866562A (zh) 2017-09-29 2018-09-28 图像编码/解码方法、存储介质及图像数据的传输方法

Country Status (4)

Country Link
US (4) US11509907B2 (zh)
KR (5) KR20190038405A (zh)
CN (4) CN116866561A (zh)
WO (1) WO2019066524A1 (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11394992B2 (en) * 2018-03-14 2022-07-19 Hfi Innovation Inc. Methods and apparatuses of generating average candidates in video coding systems
US10893286B2 (en) * 2018-10-09 2021-01-12 Tencent America LLC Methods and apparatus for low-complexity MTS
RU2768377C1 (ru) * 2018-11-16 2022-03-24 МедиаТек Инк. Способ и устройство для видеокодирования c использованием улучшенного режима слияния с разностью векторов движения
JP7319365B2 (ja) 2018-11-22 2023-08-01 北京字節跳動網絡技術有限公司 サブブロックに基づくインター予測のための調整方法
CN111526362B (zh) * 2019-02-01 2023-12-29 华为技术有限公司 帧间预测方法和装置
WO2020182207A1 (en) * 2019-03-13 2020-09-17 Beijing Bytedance Network Technology Co., Ltd. Partitions on sub-block transform mode
CN117560489A (zh) * 2019-05-14 2024-02-13 北京字节跳动网络技术有限公司 用于残差编解码的上下文建模
US11109041B2 (en) * 2019-05-16 2021-08-31 Tencent America LLC Method and apparatus for video coding
CN114080812A (zh) 2019-06-13 2022-02-22 Lg 电子株式会社 使用sbtmvp的基于帧间预测的图像或视频编译
KR20240015171A (ko) 2019-06-13 2024-02-02 엘지전자 주식회사 Sbtmvp 기반 영상 또는 비디오 코딩
CN114041291B (zh) * 2019-06-21 2023-03-24 北京达佳互联信息技术有限公司 视频编解码中的运动矢量预测的方法、设备和存储介质
JP7481430B2 (ja) 2019-08-13 2024-05-10 北京字節跳動網絡技術有限公司 サブブロックに基づくインター予測における動き精度
CN114762330A (zh) 2019-09-22 2022-07-15 北京字节跳动网络技术有限公司 视频的子图片编码和解码
US11595689B2 (en) * 2020-03-20 2023-02-28 Tencent America LLC Local weighted prediction
WO2021200658A1 (ja) * 2020-04-02 2021-10-07 シャープ株式会社 動画像復号装置及び動画像復号方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140307789A1 (en) * 2011-12-23 2014-10-16 Electronics And Telecommunications Research Institute Method and apparatus for setting reference picture index of temporal merging candidate
US20150208086A1 (en) * 2012-10-03 2015-07-23 Mediatek Inc. Method and apparatus for inter-component motion prediction in three-dimensional video coding
US20150229947A1 (en) * 2011-01-07 2015-08-13 Lg Electronics Inc. Method for encoding and decoding image information and device using same
CN105247858A (zh) * 2013-07-12 2016-01-13 联发科技(新加坡)私人有限公司 三维视频编码中子预测单元的视图间运动预测的方法
CN105637870A (zh) * 2013-09-13 2016-06-01 高通股份有限公司 使用不对称运动分割的视频译码技术
US20160323573A1 (en) * 2013-12-19 2016-11-03 Sharp Kabushiki Kaisha Image decoding device, image coding device, and residual prediction device

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG194746A1 (en) * 2011-05-31 2013-12-30 Kaba Gmbh Image encoding method, image encoding device, image decoding method, image decoding device, and image encoding/decoding device
KR101197176B1 (ko) 2011-09-23 2012-11-05 주식회사 케이티 머지 후보 블록 유도 방법 및 이러한 방법을 사용하는 장치
CA2850595C (en) * 2011-10-19 2020-09-08 Panasonic Corporation Picture coding method, picture coding apparatus, picture decoding method, and picture decoding apparatus
KR101835625B1 (ko) * 2011-10-26 2018-04-19 인텔렉추얼디스커버리 주식회사 움직임 후보 리스트 생성 방법 및 그를 이용한 부호화 장치
RU2632154C1 (ru) 2011-11-08 2017-10-02 Электроникс Энд Телекоммьюникейшнз Рисерч Инститьют Способ и устройство для совместного использования списка кандидатов
KR20140005099A (ko) * 2012-07-02 2014-01-14 한국전자통신연구원 영상 부호화/복호화 방법 및 장치
WO2014073173A1 (ja) * 2012-11-06 2014-05-15 日本電気株式会社 映像符号化方法、映像符号化装置および映像符号化プログラム
KR102378459B1 (ko) 2014-06-30 2022-03-24 한국전자통신연구원 움직임 병합 모드에서 시점 합성 예측 후보의 중복성 제거 장치 및 방법
WO2017084512A1 (en) 2015-11-20 2017-05-26 Mediatek Inc. Method and apparatus of motion vector prediction or merge candidate derivation for video coding
US11082702B2 (en) * 2017-07-03 2021-08-03 Lg Electronics Inc. Inter prediction mode-based image processing method and device therefor
WO2019050115A1 (ko) * 2017-09-05 2019-03-14 엘지전자(주) 인터 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
JP2021005741A (ja) * 2017-09-14 2021-01-14 シャープ株式会社 画像符号化装置及び画像復号装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150229947A1 (en) * 2011-01-07 2015-08-13 Lg Electronics Inc. Method for encoding and decoding image information and device using same
US20140307789A1 (en) * 2011-12-23 2014-10-16 Electronics And Telecommunications Research Institute Method and apparatus for setting reference picture index of temporal merging candidate
US20150208086A1 (en) * 2012-10-03 2015-07-23 Mediatek Inc. Method and apparatus for inter-component motion prediction in three-dimensional video coding
CN105247858A (zh) * 2013-07-12 2016-01-13 联发科技(新加坡)私人有限公司 三维视频编码中子预测单元的视图间运动预测的方法
CN105637870A (zh) * 2013-09-13 2016-06-01 高通股份有限公司 使用不对称运动分割的视频译码技术
US20160323573A1 (en) * 2013-12-19 2016-11-03 Sharp Kabushiki Kaisha Image decoding device, image coding device, and residual prediction device

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"《Algorithm Description of Joint Exploration Test Model 7》", JOINT VIDEO EXPLORATION TEAM (JVET) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 7TH MEETING: TORINO, IT, 13 21 JULY 2017 DOCUMENT: JVET-G1001-V1, 21 July 2017 (2017-07-21) *

Also Published As

Publication number Publication date
WO2019066524A1 (ko) 2019-04-04
US20200244968A1 (en) 2020-07-30
KR20190038405A (ko) 2019-04-08
KR20230115281A (ko) 2023-08-02
US11509907B2 (en) 2022-11-22
US20230388517A1 (en) 2023-11-30
CN111164974B (zh) 2024-04-16
KR20240017882A (ko) 2024-02-08
KR20230113262A (ko) 2023-07-28
US20230388516A1 (en) 2023-11-30
CN116866562A (zh) 2023-10-10
KR20230114253A (ko) 2023-08-01
CN116489387A (zh) 2023-07-25
US20230049685A1 (en) 2023-02-16
CN116866561A (zh) 2023-10-10

Similar Documents

Publication Publication Date Title
CN111279695B (zh) 用于基于非对称子块的图像编码/解码的方法及装置
CN111164974B (zh) 图像编码/解码方法和设备以及非暂时性存储介质
CN110771169A (zh) 视频编码/解码方法和装置以及存储比特流的记录介质
CN112385215A (zh) 图像编码/解码方法和装置以及存储比特流的记录介质
CN111164978A (zh) 用于对图像进行编码/解码的方法和设备以及用于存储比特流的记录介质
CN112369021A (zh) 用于吞吐量增强的图像编码/解码方法和设备以及存储比特流的记录介质
CN112740685A (zh) 图像编码/解码方法和装置以及存储有比特流的记录介质
CN112740697A (zh) 图像编码/解码方法和装置及存储比特流的记录介质
CN112585976A (zh) 用于对图像进行编码/解码的方法和设备以及用于存储比特流的记录介质
CN112438048A (zh) 用于对图像进行编码/解码的方法和设备以及存储比特流的记录介质
CN112740694A (zh) 用于对图像进行编码/解码的方法和设备以及用于存储比特流的记录介质
CN112673629A (zh) 视频编码/解码方法和装置以及用于存储比特流的记录介质
CN112740671A (zh) 图像编码/解码方法和装置以及存储比特流的记录介质
CN113906740A (zh) 帧间预测信息编码/解码方法和装置
CN114342372A (zh) 帧内预测模式、以及熵编解码方法和装置
CN113940077A (zh) 用于视频编码/解码的虚拟边界信令方法和设备
CN113273188A (zh) 图像编码/解码方法和装置以及存储有比特流的记录介质
CN113196758A (zh) 图像编码/解码方法和设备以及存储比特流的记录介质
CN113574868A (zh) 图像编码/解码方法和设备以及存储比特流的记录介质
CN111247796A (zh) 图像编码/解码方法和装置以及存储比特流的记录介质
CN113228645A (zh) 图像编码/解码方法和装置以及存储有比特流的记录介质
CN113875235A (zh) 图像编码/解码方法和装置及存储比特流的记录介质
CN113841404A (zh) 视频编码/解码方法和设备以及存储比特流的记录介质
CN112740693A (zh) 图像编码/解码方法、装置和具有存储的比特流的记录介质
CN113574875A (zh) 基于帧内块复制的编/解码方法和装置及比特流存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230116

Address after: Daejeon, Korea

Applicant after: LX Semiconductor Technology Co.,Ltd.

Address before: Daejeon, Korea

Applicant before: ELECTRONICS AND TELECOMMUNICATIONS Research Institute OF KOREA

GR01 Patent grant
GR01 Patent grant