CN111279695A - 用于基于非对称子块的图像编码/解码的方法及装置 - Google Patents

用于基于非对称子块的图像编码/解码的方法及装置 Download PDF

Info

Publication number
CN111279695A
CN111279695A CN201880069795.8A CN201880069795A CN111279695A CN 111279695 A CN111279695 A CN 111279695A CN 201880069795 A CN201880069795 A CN 201880069795A CN 111279695 A CN111279695 A CN 111279695A
Authority
CN
China
Prior art keywords
block
sub
information
unit
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880069795.8A
Other languages
English (en)
Other versions
CN111279695B (zh
Inventor
全东山
李河贤
姜晶媛
高玄硕
林成昶
李镇浩
金晖容
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intellectual Discovery Co Ltd
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Priority to CN202410332565.3A priority Critical patent/CN118214854A/zh
Priority to CN202410332701.9A priority patent/CN118214855A/zh
Priority to CN202410333876.1A priority patent/CN118214857A/zh
Priority to CN202410332710.8A priority patent/CN118214856A/zh
Priority to CN202410332520.6A priority patent/CN118214853A/zh
Publication of CN111279695A publication Critical patent/CN111279695A/zh
Application granted granted Critical
Publication of CN111279695B publication Critical patent/CN111279695B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供了一种图像编码/解码方法和装置。本公开的图像解码方法可包括以下步骤:根据块分区结构将编码单元分区成多个子单元;并且基于所述子单元执行解码,其中,所述块分区结构是分区被执行使得分区出的子单元包括具有除了正方形形状和矩形形状之外的预定块形状的至少一个子单元的块分区结构。

Description

用于基于非对称子块的图像编码/解码的方法及装置
技术领域
本发明涉及一种用于对视频进行编码/解码的方法和设备以及一种存储比特流的记录介质。更具体地,本发明涉及一种用于基于至少一个非对称子块对视频进行编码/解码的方法和设备。
背景技术
近来,在各种应用领域中对高分辨率和高质量视频(诸如高清晰度(HD)和超高清晰度(UHD)视频)的需求已经增加。由于视频数据具有更高的分辨率和更高的质量,所以数据量相对于现有视频数据有所增加。因此,当使用诸如现有的有线和无线宽带线路的介质传输视频数据或将视频数据存储在现有的存储介质中时,传输和存储成本增加。为了解决随着视频数据的分辨率和质量的提高而出现的这些问题,可利用高效视频压缩技术。
视频压缩技术包括各种技术,诸如,从当前画面的先前或后续画面预测包括在当前画面中的像素值的帧间预测技术,使用当前画面中的像素信息预测包括在当前画面中的像素值的帧内预测技术,以及将短码分配给具有高出现频率的值并将长码分配给具有低出现频率的值的熵编码技术。可使用这样的视频压缩技术来有效地压缩并传输或存储视频数据。
在传统的视频编码/解码方法和设备中,编码/解码块始终具有正方形形状或矩形形状或者正方形形状和矩形形状两者,并且通过使用四叉树形式被划分。因此,考虑视频中的局部特性的编码/解码受到限制。
发明内容
技术问题
本发明的目的是提供一种用于使用各种非对称子块划分结构的视频编码/解码的方法和设备。
另外,本发明的另一目的是提供一种用于视频编码/解码的方法和设备,其中,针对非对称子块独立地执行预测。
另外,本发明的另一目的是提供一种存储通过本发明的用于视频编码/解码的方法和设备产生的比特流的记录介质。
另外,本发明的另一目的是提供一种用于对视频进行基于非对称子块的编码/解码的方法和设备,其中,四叉树后二叉树形式的块划分结构、四叉树和二叉树组合形式的块划分结构以及单独PU/TU树的块划分结构中的至少一个块划分结构被用于提高编码/解码效率。
另外,本发明的另一目的是提供一种用于视频编码/解码的方法和设备,其中,当前块被划分为至少一个非对称子块并且针对每个非对称子块不同地执行预测。
技术方案
一种根据本发明的对图像进行解码的方法,所述方法可包括:根据块划分结构将编码单元划分为多个子单元;并且基于所述子单元执行解码,其中,所述块划分结构是执行划分以包括具有除了正方形形状和矩形形状之外的预定块形状的至少一个子单元的块划分结构。
在根据本发明的对图像进行解码的方法中,其中,基于所述子单元执行解码的步骤包括:通过基于所述子单元执行帧内预测和帧间预测中的至少一个来执行解码。
在根据本发明的对图像进行解码的方法中,其中,基于所述子单元执行解码的步骤包括:通过基于所述子单元执行逆变换和反量化中的至少一个来执行解码。
在根据本发明的对图像进行解码的方法中,其中,所述块划分结构是对编码单元进行划分以包括三角形形状的子单元的块划分结构。
在根据本发明的对图像进行解码的方法中,其中,所述三角形形状是通过按照从编码单元的左上方到右下方的对角线边界对编码单元进行划分而获得的三角形形状和通过按照从编码单元的右上方到左下方的对角线边界对编码单元进行划分而获得的三角形形状中的至少一个。
在根据本发明的对图像进行解码的方法中,其中,所述块划分结构是基于表示编码单元是否被划分的标志被确定的。
在根据本发明的对图像进行解码的方法中,其中,所述块划分结构是基于表示编码单元是否被划分的标志和表示所述子单元的划分类型的索引被确定的。
在根据本发明的对图像进行解码的方法中,其中,所述子单元的划分类型表示所述子单元的划分方向。
另外,一种根据本发明的对图像进行编码的方法,所述方法可包括:根据块划分结构将编码单元划分为多个子单元;并且基于所述子单元执行编码,其中,所述块划分结构是执行划分以包括具有除了正方形形状和矩形形状之外的预定块形状的至少一个子单元的块划分结构。
在根据本发明的对图像进行编码的方法中,其中,基于所述子单元执行编码的步骤包括:通过基于所述子单元执行帧内预测和帧间预测中的至少一个来执行编码。
在根据本发明的对图像进行编码的方法中,其中,基于所述子单元执行编码的步骤包括:通过基于所述子单元执行变换和量化中的至少一个来执行编码。
在根据本发明的对图像进行编码的方法中,其中,所述块划分结构是对编码单元进行划分以包括三角形形状的子单元的块划分结构。
在根据本发明的对图像进行编码的方法中,其中,所述三角形形状是通过按照从编码单元的左上方到右下方的对角线边界对编码单元进行划分而获得的三角形形状和通过按照从编码单元的右上方到左下方的对角线边界对编码单元进行划分而获得的三角形形状中的至少一个。
在根据本发明的对图像进行编码的方法中,其中,所述块划分结构是基于表示编码单元是否被划分的标志被确定的。
在根据本发明的对图像进行编码的方法中,其中,所述块划分结构基于表示编码单元是否被划分的标志和表示所述子单元的划分类型的索引被确定的。
在根据本发明的对图像进行编码的方法中,其中,所述子单元的划分类型表示所述子单元的划分方向。
另外,一种根据本发明的计算机可读记录介质可存储通过根据本发明的图像编码方法产生的比特流。
有益效果
如上所述,根据本发明,本发明提供了一种用于使用各种非对称子块划分结构进行视频编码/解码的方法和设备。
另外,根据本发明,提供了一种用于视频编码/解码的方法和设备,其中,可针对非对称子块独立地执行预测。
另外,根据本发明,提供了一种存储通过本发明的用于视频编码/解码的方法和设备产生的比特流的记录介质。
另外,根据本发明,可提高视频编码和解码效率。
附图说明
图1是示出应用了本发明的编码设备的实施例的配置的框图。
图2是应用了本发明的解码设备的实施例的框图。
图3是示意性地示出当对视频进行编码和解码时的视频的划分结构的示图。
图4是示出帧内预测的实施例的示图。
图5是示出帧间预测的实施例的示图。
图6是示出变换和量化的示图。
图7是示出根据本发明的实施例的对视频进行解码的方法的流程图的示图。
图8是示出根据本发明的实施例的推导空间合并候选的方法的示图。
图9是示出根据本发明的实施例的推导时间合并候选的方法的示图。
图10是示出根据本发明的实施例的推导基于子块的时间空间组合合并候选的方法的示图。
图11是示出根据本发明的实施例的通过使用双向匹配来推导帧间预测信息的方法的示图。
图12是示出根据本发明的实施例的通过使用模板匹配方法来推导帧间预测信息的方法的示图。
图13是示出根据本发明的实施例的基于OMBC(重叠块运动补偿)推导帧间预测信息的方法的示图。
图14是示出根据本发明的实施例的四叉树划分、对称二叉树划分和非对称二叉树划分的示图。
图15是示出根据本发明的实施例的四叉树划分后对称二叉树划分的示图。
图16是示出根据本发明的实施例的非对称划分的示图。
图17是示出根据本发明的实施例的通过使用最低等级子块来推导子块的运动预测信息的方法的示图。
图18是根据本发明的实施例的视频编码方法的流程图的示图。
具体实施方式
可对本发明做出各种修改,并且存在本发明的各种实施例,现在将参照附图提供并详细描述本发明的各种实施例的示例。然而,尽管示例性实施例可被解释为包括本发明的技术构思和技术范围中的所有修改、等同形式或替代形式,但本发明不限于此。相似的参考标号指在各个方面相同或相似的功能。在附图中,为了清楚起见,元件的形状和尺寸可被夸大。在本发明的以下详细描述中,对通过图示的方式示出可实施本发明的具体实施例的附图进行参照。这些实施例被足够详细地描述以使本领域技术人员能够实施本公开。应该理解,本公开的各种实施例尽管不同,但不必是相互排他的。例如,在不脱离本公开的精神和范围的情况下,这里结合一个实施例描述的特定特征、结构和特性可在其它实施例中被实施。此外,应该理解,在不脱离本公开的精神和范围的情况下,每个公开的实施例内的各个元件的位置或布置可被修改。因此,以下详细描述不应以限制的含义来理解,并且本公开的范围仅由所附权利要求(在合适的解释的情况下,还连同权利要求所要求保护的等同形式的全部范围)来限定。
在说明书中使用的术语“第一”、“第二”等可被用于描述各种组件,但这些组件并不被解释为受限于这些术语。这些术语仅被用于将一个组件与其它组件区分开。例如,在不脱离本发明的范围的情况下,“第一”组件可被称为“第二”组件,并且“第二”组件也可类似地被称为“第一”组件。术语“和/或”包括多个项的组合或者是多个项中的任意一项。
将理解的是,在本说明书中,当元件仅被称为“连接到”或“结合到”另一元件而不是“直接连接到”或“直接结合到”所述另一元件时,所述元件可“直接连接到”或“直接结合到”所述另一元件,或者在所述元件与所述另一元件之间具有其他元件的情况下连接到或结合到所述另一元件。相反,应该理解,当元件被称为“直接结合”或“直接连接”到另一元件时,不存在中间元件。
此外,在本发明的实施例中示出的组成部件被独立地示出,以便呈现彼此不同的特性功能。因此,这并不意味着每个组成部件以单独的硬件或软件的组成单元被组成。换句话说,为了方便,每个组成部件包括枚举的组成部件中的每一个。因此,每个组成部件中的至少两个组成部件可被组合形成一个组成部件,或者一个组成部件可被划分为用于执行每个功能的多个组成部件。在没有脱离本发明的本质的情况下,每个组成部件被组合的实施例以及一个组成部件被划分的实施例也被包括在本发明的范围中。
在本说明书中使用的术语仅用于描述具体实施例,而不旨在限制本发明。除非以单数使用的表达在上下文中具有明显不同的含义,否则它包括复数表达。在本说明书中,将理解的是,诸如“包括……的”、“具有……的”等的术语旨在指明存在说明书中所公开的特征、数量、步骤、动作、元件、部件、或其组合,而并不旨在排除可存在或者可添加一个或更多个其它特征、数量、步骤、动作、元件、部件、或其组合的可能性。换句话说,当特定元件被称为“被包括”时,除相应元件以外的元件并不被排除,而是,附加的元件可被包括在本发明的实施例中或者是本发明的范围中。
此外,一些组成元件可能不是执行本发明的必要功能的不可缺的组成元件,而是仅提升其性能的可选组成元件。可通过仅包括用于实施本发明的实质的不可缺的组成部件而排除在提升性能时使用的组成元件来实施本发明。仅包括所述不可缺的组成元件而排除在仅提升性能时使用的可选组成元件的结构也被包括在本发明的范围中。
在下文中,将参照附图详细描述本发明的实施例。在描述本发明的示例性实施例时,因为公知的功能或结构可能不必要地模糊对本发明的理解,因此将不详细描述它们。附图中的相同的组成元件由相同的参考标号来表示,并且将省略对相同元件的重复描述。
在下文中,图像可指构成视频的画面,或者可指视频本身。例如,“对图像进行编码或解码或者进行编码和解码两者”可指“对运动画面进行编码或解码或者进行编码和解码两者”,并且可指“对运动画面的图像中的一个图像进行编码或解码或者进行编码和解码两者。”
在下文中,术语“运动画面”和“视频”可被用作相同的含义并且可彼此替换。
在下文中,目标图像可以是作为编码的目标的编码目标图像和/或作为解码的目标的解码目标图像。此外,目标图像可以是输入到编码设备的输入图像、以及输入到解码设备的输入图像。这里,目标图像可与当前图像具有相同的含义。
在下文中,术语“图像”、“画面”、“帧”和“屏幕”可被用作相同的含义并且彼此替换。
在下文中,目标块可以是作为编码的目标的编码目标块和/或作为解码的目标的解码目标块。此外,目标块可以是作为当前编码和/或解码的目标的当前块。例如,术语“目标块”和“当前块”可被用作相同的含义并且彼此替换。
在下文中,术语“块”和“单元”可被用作相同的含义并且彼此替换。或者“块”可表示特定单元。
在下文中,术语“区域”和“片段”可彼此替换。
在下文中,特定信号可以是表示特定块的信号。例如,原始信号可以是表示目标块的信号。预测信号可以是表示预测块的信号。残差信号可以是表示残差块的信号。
在实施例中,特定信息、数据、标志、索引、元素和属性等中的每一个可具有值。等于“0”的信息、数据、标志、索引、元素和属性的值可表示逻辑假或第一预定义值。换句话说,值“0”、假、逻辑假和第一预定义值可彼此替换。等于“1”的信息、数据、标志、索引、元素和属性的值可表示逻辑真或第二预定义值。换句话说,值“1”、真、逻辑真和第二预定义值可彼此替换。
当变量i或j用于表示列、行或索引时,i的值可以是等于或大于0的整数、或者等于或大于1的整数。也就是说,列、行、索引等可从0开始计数,或者可从1开始计数。
术语的描述
编码器:表示执行编码的设备。也就是说,表示编码设备。
解码器:表示执行解码的设备。也就是说,表示解码设备。
块:是M×N的样点阵列。这里,M和N可表示正整数,并且块可表示二维形式的样点阵列。块可指单元。当前块可表示在编码时成为目标的编码目标块,或者在解码时成为目标的解码目标块。此外,当前块可以是编码块、预测块、残差块和变换块中的至少一个。
样点:是构成块的基本单元。根据比特深度(Bd),样点可被表达为从0到2Bd-1的值。在本发明中,样点可被用作像素的含义。也就是说,样点、pel、像素可具有彼此相同的含义。
单元:可指编码和解码单元。当对图像进行编码和解码时,单元可以是通过对单个图像进行分区而产生的区域。此外,当在编码或解码期间将单个图像分区成子划分单元时,单元可表示子划分单元。也就是说,图像可被分区成多个单元。当对图像进行编码和解码时,可针对每个单元执行预定的处理。单个单元可被分区成尺寸小于该单元的尺寸的子单元。依据功能,单元可表示块、宏块、编码树单元、编码树块、编码单元、编码块、预测单元、预测块、残差单元、残差块、变换单元、变换块等。此外,为了将单元与块区分开,单元可包括亮度分量块、与亮度分量块相关联的色度分量块、以及每个颜色分量块的语法元素。单元可具有各种尺寸和形状,具体地,单元的形状可以是二维几何图形,诸如正方形形状、长方形形状、梯形形状、三角形形状、五边形形状等。此外,单元信息可包括指示编码单元、预测单元、变换单元等的单元类型以及单元尺寸、单元深度、单元的编码和解码的顺序等中的至少一个。
编码树单元:被配置有亮度分量Y的单个编码树块、以及与色度分量Cb和Cr相关的两个编码树块。此外,编码树单元可表示包括块和每个块的语法元素。可通过使用四叉树分区方法、二叉树分区方法和三叉树分区方法中的至少一个对每个编码树单元进行分区以配置诸如编码单元、预测单元、变换单元等的更低等级的单元。编码树单元可被用作用于指定在对作为输入图像的图像进行编码/解码时成为处理单元的样点块的术语。这里,四叉树可表示四元树。
编码树块:可被用作用于指定Y编码树块、Cb编码树块和Cr编码树块中的任意一个的术语。
邻近块:可表示与当前块相邻的块。与当前块相邻的块可表示与当前块的边界接触的块、或者位于距当前块预定距离内的块。邻近块可表示与当前块的顶点相邻的块。这里,与当前块的顶点相邻的块可表示与水平相邻于当前块的邻近块垂直相邻的块、或者与垂直相邻于当前块的邻近块水平相邻的块。
重建的邻近块:可表示与当前块相邻并且已经在空间/时间上被编码或解码的邻近块。这里,重建的邻近块可表示重建的邻近单元。重建的空间邻近块可以是在当前画面内并且已经通过进行编码或解码或者进行编码和解码两者而被重建的块。重建的时间邻近块是在参考图像内的与当前画面的当前块相应的位置处的块或所述块的邻近块。
单元深度:可表示单元的分区程度。在树结构中,最高节点(根节点)可与未被分区的第一单元相应。此外,最高节点可具有最小深度值。在这种情况下,最高节点的深度可以为等级0。深度为等级1的节点可表示通过对第一单元进行一次分区而产生的单元。深度为等级2的节点可表示通过对第一单元进行两次分区而产生的单元。深度为等级n的节点可表示通过对第一单元进行n次分区而产生的单元。叶节点可以是最低节点并且是不能被进一步分区的节点。叶节点的深度可以是最大等级。例如,最大等级的预定义值可以是3。根节点的深度可以是最低的,并且叶节点的深度可以是最深的。此外,当单元被表示为树结构时,单元存在于的等级可表示单元深度。
比特流:可表示包括编码图像信息的比特流。
参数集:与比特流内的配置中的头信息相应。视频参数集、序列参数集、画面参数集和自适应参数集中的至少一个可被包括在参数集中。此外,参数集可包括条带(slice)头和并行块(tile)头信息。
解析:可表示通过执行熵解码来确定语法元素的值,或者可表示熵解码本身。
符号:可表示编码/解码目标单元的语法元素、编码参数和变换系数值中的至少一个。此外,符号可表示熵编码目标或熵解码结果。
预测模式:可以是指示利用帧内预测编码/解码的模式或利用帧间预测编码/解码的模式的信息。
预测单元:可表示当执行预测(诸如帧间预测、帧内预测、帧间补偿、帧内补偿和运动补偿)时的基本单元。单个预测单元可被分区成具有更小尺寸的多个分区,或者可被分区成多个更低等级的预测单元。多个分区可以是在执行预测或补偿时的基本单元。通过对预测单元进行划分而产生的分区也可以是预测单元。
预测单元分区:可表示通过对预测单元进行分区而获得的形状。
参考画面列表可指包括用于帧间预测或运动补偿的一个或更多个参考画面的列表。存在几种类型的可用参考画面列表,所述可用参考画面列表包括LC(列表组合)、L0(列表0)、L1(列表1)、L2(列表2)、L3(列表3)。
帧间预测指示符可指当前块的帧间预测(单向预测、双向预测等)的方向。可选地,帧间预测指示符可指用于产生当前块的预测块的参考画面的数量。可选地,帧间预测指示符可指在对当前块执行帧间预测或运动补偿时所使用的预测块的数量。
预测列表利用标志指示是否使用特定参考画面列表中的至少一个参考画面来产生预测块。可使用预测列表利用标志来推导帧间预测指示符,并且相反地,可使用帧间预测指示符来推导预测列表利用标志。例如,当预测列表利用标志具有第一值零(0)时,它表示不使用参考画面列表中的参考画面来产生预测块。另一方面,当预测列表利用标志具有第二值一(1)时,它表示使用参考画面列表来产生预测块。
参考画面索引可指指示参考画面列表中的特定参考画面的索引。
参考画面可表示由特定块参考以实现对特定块进行帧间预测或运动补偿的目的的参考画面。可选地,参考画面可以是包括由当前块参考以进行帧间预测或运动补偿的参考块的画面。在下文中,术语“参考画面”和“参考图像”具有相同的含义并且可彼此替换。
运动矢量可以是用于帧间预测或运动补偿的二维矢量。运动矢量可表示编码/解码目标块与参考块之间的偏移。例如,(mvX,mvY)可表示运动矢量。这里,mvX可表示水平分量,并且mvY可表示垂直分量。
搜索范围可以是在帧间预测期间为了检索运动矢量而搜索的二维区域。例如,搜索范围的尺寸可以是M×N。这里,M和N均为整数。
运动矢量候选可指在对运动矢量进行预测时的预测候选块或预测候选块的运动矢量。此外,运动矢量候选可被包括在运动矢量候选列表中。
运动矢量候选列表可表示由一个或更多个运动矢量候选组成的列表。
运动矢量候选索引可表示在运动矢量候选列表中指示运动矢量候选的指示符。可选地,运动矢量候选索引可以是运动矢量预测因子的索引。
运动信息可表示包括以下项中的至少一项的信息:运动矢量、参考画面索引、帧间预测指示符、预测列表利用标志、参考画面列表信息、参考画面、运动矢量候选、运动矢量候选索引、合并候选和合并索引。
合并候选列表可表示由一个或更多个合并候选组成的列表。
合并候选可表示空间合并候选、时间合并候选、组合合并候选、组合双预测合并候选或零合并候选。合并候选可包括运动信息,诸如帧间预测指示符、针对每个列表的参考画面索引、运动矢量、预测列表利用标志和帧间预测指示符。
合并索引可表示在合并候选列表中指示合并候选的指示符。可选地,合并索引可指示在空间上/时间上与当前块相邻的重建块中的已推导出合并候选的块。可选地,合并索引可指示合并候选的至少一条运动信息。
变换单元:可表示在对残差信号执行编码/解码(诸如变换、逆变换、量化、反量化、变换系数编码/解码)时的基本单元。单个变换单元可被分区成具有更小尺寸的多个更低等级的变换单元。这里,变换/逆变换可包括第一变换/第一逆变换和第二变换/第二逆变换中的至少一个。
缩放:可表示将量化的等级乘以因子的处理。可通过对量化的等级进行缩放来产生变换系数。缩放也可被称为反量化。
量化参数:可表示当在量化期间使用变换系数来产生量化的等级时使用的值。量化参数还可表示当在反量化期间通过对量化的等级进行缩放来产生变换系数时使用的值。量化参数可以是被映射在量化步长上的值。
增量量化参数:可表示预测的量化参数与编码/解码目标单元的量化参数之间的差值。
扫描:可表示对单元、块或矩阵内的系数进行排序的方法。例如,将系数的二维矩阵改变为一维矩阵可被称为扫描,将系数的一维矩阵改变为二维矩阵可被称为扫描或逆扫描。
变换系数:可表示在编码器中执行变换之后产生的系数值。变换系数可表示在解码器中执行熵解码和反量化中的至少一个之后产生的系数值。通过对变换系数或残差信号进行量化而获得的量化的等级或者量化的变换系数等级也可落入变换系数的含义内。
量化的等级:可表示在编码器中通过对变换系数或残差信号进行量化而产生的值。可选地,量化的等级可表示作为在解码器中将被执行反量化的反量化目标的值。类似地,作为变换和量化的结果的量化的变换系数等级也可落入量化的等级的含义内。
非零变换系数:可表示具有除零之外的值的变换系数、或者具有除零之外的值的变换系数等级或量化的等级。
量化矩阵:可表示在被执行以提高主观图像质量或客观图像质量的量化处理或反量化处理中使用的矩阵。量化矩阵也可被称为缩放列表。
量化矩阵系数:可表示量化矩阵内的每个元素。量化矩阵系数也可被称为矩阵系数。
默认矩阵:可表示在编码器或解码器中预先定义的预定量化矩阵。
非默认矩阵:可表示在编码器或解码器中未被预先定义而是由用户用信号传送的量化矩阵。
统计值:针对具有可计算的特定值的变量、编码参数、常量值等之中的至少一个的统计值可以是相应特定值的平均值、加权平均值、加权和值、最小值、最大值、最频繁出现的值、中值、插值之中的一个或更多个。
图1是示出根据应用了本发明的实施例的编码设备的配置的框图。
编码设备100可以是编码器、视频编码设备或图像编码设备。视频可包括至少一个图像。编码设备100可顺序地对至少一个图像进行编码。
参照图1,编码设备100可包括运动预测单元111、运动补偿单元112、帧内预测单元120、切换器115、减法器125、变换单元130、量化单元140、熵编码单元150、反量化单元160、逆变换单元170、加法器175、滤波器单元180和参考画面缓冲器190。
编码设备100可通过使用帧内模式或帧间模式或者帧内模式和帧间模式两者来对输入图像执行编码。此外,编码设备100可通过对输入图像进行编码来产生包括编码信息的比特流,并输出产生的比特流。产生的比特流可被存储在计算机可读记录介质中,或者可通过有线/无线传输介质被流传输。当帧内模式被用作预测模式时,切换器115可被切换到帧内。可选地,当帧间模式被用作预测模式时,切换器115可被切换到帧间模式。这里,帧内模式可表示帧内预测模式,帧间模式可表示帧间预测模式。编码设备100可产生针对输入图像的输入块的预测块。此外,编码设备100可在产生预测块之后使用输入块和预测块的残差对残差块进行编码。输入图像可被称为作为当前编码目标的当前图像。输入块可被称为作为当前编码目标的当前块,或者被称为编码目标块。
当预测模式是帧内模式时,帧内预测单元120可使用已被编码/解码并与当前块相邻的块的样点作为参考样点。帧内预测单元120可通过使用参考样点来对当前块执行空间预测,或者通过执行空间预测来产生输入块的预测样点。这里,帧内预测可表示帧内部的预测。
当预测模式是帧间模式时,运动预测单元111可在执行运动预测时从参考图像检索与输入块最匹配的区域,并且通过使用检索到的区域来推导运动矢量。在这种情况下,搜索区域可被用作所述区域。参考图像可被存储在参考画面缓冲器190中。这里,当执行对参考图像的编码/解码时,参考图像可被存储在参考画面缓冲器190中。
运动补偿单元112可通过使用运动矢量对当前块执行运动补偿来产生预测块。这里,帧间预测可表示帧之间的预测或运动补偿。
当运动矢量的值不是整数时,运动预测单元111和运动补偿单元112可通过将插值滤波器应用于参考画面的部分区域来产生预测块。为了对编码单元执行画面间预测或运动补偿,可确定将跳过模式、合并模式、高级运动矢量预测(AMVP)模式和当前画面参考模式之中的哪个模式用于对包括在相应编码单元中的预测单元的运动预测和运动补偿。然后,依据所确定的模式,可不同地执行画面间预测或运动补偿。
减法器125可通过使用输入块和预测块的残差来产生残差块。残差块可被称为残差信号。残差信号可表示原始信号和预测信号之间的差。此外,残差信号可以是通过对原始信号与预测信号之间的差进行变换或量化或者变换和量化而产生的信号。残差块可以是块单元的残差信号。
变换单元130可通过对残差块执行变换来产生变换系数,并输出产生的变换系数。这里,变换系数可以是通过对残差块执行变换而产生的系数值。当变换跳过模式被应用时,变换单元130可跳过对残差块的变换。
可通过将量化应用于变换系数或应用于残差信号来产生量化的等级。在下文中,量化的等级在实施例中也可被称为变换系数。
量化单元140可通过根据参数对变换系数或残差信号进行量化来产生量化的等级,并输出产生的量化的等级。这里,量化单元140可通过使用量化矩阵对变换系数进行量化。
熵编码单元150可通过根据概率分布对由量化单元140计算出的值或者对在执行编码时计算出的编码参数值执行熵编码来产生比特流,并输出产生的比特流。熵编码单元150可对图像的样点信息和用于对图像进行解码的信息执行熵编码。例如,用于对图像进行解码的信息可包括语法元素。
当熵编码被应用时,符号被表示使得较少数量的比特被分配给具有高产生可能性的符号,并且较多数量的比特被分配给具有低产生可能性的符号,因此,可减小用于将被编码的符号的比特流的大小。熵编码单元150可使用诸如指数哥伦布、上下文自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等的用于熵编码的编码方法。例如,熵编码单元150可通过使用变长编码/码(VLC)表来执行熵编码。此外,熵编码单元150可推导目标符号的二值化方法和目标符号/二进制位的概率模型,并且通过使用推导的二值化方法和上下文模型来执行算术编码。
为了对变换系数等级(量化的等级)进行编码,熵编码单元150可通过使用变换系数扫描方法将二维块形式的系数改变为一维矢量形式。
编码参数可包括在编码器中被编码并且被用信号传送到解码器的诸如语法元素的信息(标志、索引等)以及在执行编码或解码时推导出的信息。编码参数可表示在对图像进行编码或解码时所需要的信息。例如,以下项中的至少一个值或组合形式可被包括在编码参数中:单元/块尺寸、单元/块深度、单元/块分区信息、单元/块形状、单元/块分区结构、是否进行四叉树形式的分区、是否进行二叉树形式的分区、二叉树形式的分区方向(水平方向或垂直方向)、二叉树形式的分区形式(对称分区或非对称分区)、当前编码单元是否通过三叉树分区被分区、三叉树分区的方向(水平方向或垂直方向)、三叉树分区的类型(对称类型或非对称类型)、当前编码单元是否通过多类型树分区被分区、多类型树分区的方向(水平方向或垂直方向)、多类型树分区的类型(对称类型或非对称类型)和多类型树分区的树(二叉树或三叉树)结构、预测模式(帧内预测或帧间预测)、亮度帧内预测模式/方向、色度帧内预测模式/方向、帧内分区信息、帧间分区信息、编码块分区标志、预测块分区标志、变换块分区标志、参考样点滤波方法、参考样点滤波器抽头、参考样点滤波器系数、预测块滤波方法、预测块滤波器抽头、预测块滤波器系数、预测块边界滤波方法、预测块边界滤波器抽头、预测块边界滤波器系数、帧内预测模式、帧间预测模式、运动信息、运动矢量、运动矢量差、参考画面索引、帧间预测角度、帧间预测指示符、预测列表利用标志、参考画面列表、参考画面、运动矢量预测因子索引、运动矢量预测因子候选、运动矢量候选列表、是否使用合并模式、合并索引、合并候选、合并候选列表、是否使用跳过模式、插值滤波器类型、插值滤波器抽头、插值滤波器系数、运动矢量尺寸、运动矢量的表示精度、变换类型、变换尺寸、首次(第一次)变换是否被使用的信息、二次变换是否被使用的信息、首次变换索引、二次变换索引、残差信号是否存在的信息、编码块样式、编码块标志(CBF)、量化参数、量化参数残差、量化矩阵、是否应用帧内环路滤波器、帧内环路滤波器系数、帧内环路滤波器抽头、帧内环路滤波器形状/形式、是否应用去块滤波器、去块滤波器系数、去块滤波器抽头、去块滤波器强度、去块滤波器形状/形式、是否应用自适应样点偏移、自适应样点偏移值、自适应样点偏移类别、自适应样点偏移类型、是否应用自适应环路滤波器、自适应环路滤波器系数、自适应环路滤波器抽头、自适应环路滤波器形状/形式、二值化/反二值化方法、上下文模型确定方法、上下文模型更新方法、是否执行常规模式、是否执行旁路模式、上下文二进制位、旁路二进制位、有效系数标志、最后有效系数标志、针对系数组的单元的编码标志、最后有效系数的位置、关于系数的值是否大于1的标志、关于系数的值是否大于2的标志、关于系数的值是否大于3的标志、关于剩余系数值的信息、符号信息、重建的亮度样点、重建的色度样点、残差亮度样点、残差色度样点、亮度变换系数、色度变换系数、量化的亮度等级、量化的色度等级、变换系数等级扫描方法、在解码器侧的运动矢量搜索区域的尺寸、在解码器侧的运动矢量搜索区域的形状、在解码器侧的运动矢量搜索的次数、关于CTU尺寸的信息、关于最小块尺寸的信息、关于最大块尺寸的信息、关于最大块深度的信息、关于最小块深度的信息、图像显示/输出顺序、条带标识信息、条带类型、条带分区信息、并行块标识信息、并行块类型、并行块分区信息、画面类型、输入样点的比特深度、重建样点的比特深度、残差样点的比特深度、变换系数的比特深度、量化的等级的比特深度、以及关于亮度信号的信息或关于色度信号的信息。
这里,用信号传送标志或索引可表示由编码器对相应的标志或索引进行熵编码并将其包括在比特流中,并且可表示由解码器从比特流对相应的标志或索引进行熵解码。
当编码设备100通过帧间预测执行编码时,编码的当前图像可被用作用于随后被处理的另一图像的参考图像。因此,编码设备100可对编码的当前图像进行重建或解码,或者将重建的或解码的图像作为参考图像存储在参考画面缓冲器190中。
量化的等级可在反量化单元160中被反量化,或者可在逆变换单元170中被逆变换。可由加法器175将经过反量化或逆变换的系数或者经过反量化和逆变换两者的系数与预测块相加。通过将经过反量化或逆变换的系数或者经过反量化和逆变换两者的系数与预测块相加,可产生重建块。这里,经过反量化或逆变换的系数或经过反量化和逆变换两者的系数可表示执行了反量化和逆变换中的至少一个的系数,并且可表示重建的残差块。
重建块可通过滤波器单元180。滤波器单元180可将去块滤波器、样点自适应偏移(SAO)和自适应环路滤波器(ALF)中的至少一个应用于重建样点、重建块或重建图像。滤波器单元180可被称为环内滤波器。
去块滤波器可去除在块之间的边界中产生的块失真。为了确定是否应用去块滤波器,可基于块中所包括的若干行或列中包括的样点来确定是否将去块滤波器应用于当前块。当将去块滤波器应用于块时,可根据所需的去块滤波强度来应用另一滤波器。
为了补偿编码误差,可通过使用样点自适应偏移将合适的偏移值与样点值相加。样点自适应偏移可以以样点为单位对经过去块的图像与原始图像的偏移进行校正。可使用考虑关于每个样点的边缘信息来应用偏移的方法,或者可使用以下方法:将图像的样点分区成预定数量的区域,确定偏移被应用的区域,并对确定的区域应用偏移。
自适应环路滤波器可基于经过滤波的重建图像和原始图像的比较结果来执行滤波。可将包括在图像中的样点分区成预定组,可确定将被应用于每个组的滤波器,并且可对每个组执行差异化滤波。是否应用ALF的信息可通过编码单元(CU)被用信号传送,并且将被应用于每个块的ALF的形式和系数可变化。
已经通过滤波器单元180的重建块或重建图像可被存储在参考画面缓冲器190中。由滤波器单元180处理的重建块可以是参考图像的一部分。也就是说,参考图像是由通过滤波器单元180处理的重建块组成的重建图像。存储的参考图像可稍后在帧间预测或运动补偿时被使用。
图2是示出根据应用了本发明的实施例的解码设备的配置的框图。
解码设备200可以是解码器、视频解码设备或图像解码设备。
参照图2,解码设备200可包括熵解码单元210、反量化单元220、逆变换单元230、帧内预测单元240、运动补偿单元250、加法器225、滤波器单元260和参考画面缓冲器270。
解码设备200可接收从编码设备100输出的比特流。解码设备200可接收存储在计算机可读记录介质中的比特流,或者可接收通过有线/无线传输介质被流传输的比特流。解码设备200可通过使用帧内模式或帧间模式对比特流进行解码。此外,解码设备200可产生通过解码而产生的重建图像或解码图像,并输出重建图像或解码图像。
当在解码时使用的预测模式是帧内模式时,切换器可被切换到帧内模式。可选地,当在解码时使用的预测模式是帧间模式时,切换器可被切换到帧间模式。
解码设备200可通过对输入比特流进行解码来获得重建的残差块,并产生预测块。当重建的残差块和预测块被获得时,解码设备200可通过将重建的残差块与预测块相加来产生成为解码目标的重建块。解码目标块可被称为当前块。
熵解码单元210可通过根据概率分布对比特流进行熵解码来产生符号。产生的符号可包括量化的等级形式的符号。这里,熵解码方法可以是上述熵编码方法的逆过程。
为了对变换系数等级(量化的等级)进行解码,熵解码单元210可通过使用变换系数扫描方法将单向矢量形式的系数改变为二维块形式。
可在反量化单元220中对量化的等级进行反量化,或者可在逆变换单元230中对量化的等级进行逆变换。量化的等级可以是进行反量化或逆变换或者进行反量化和逆变换两者的结果,并且可被产生为重建的残差块。这里,反量化单元220可将量化矩阵应用于量化的等级。
当使用帧内模式时,帧内预测单元240可通过对当前块执行空间预测来产生预测块,其中,空间预测使用与解码目标块相邻并且已经被解码的块的样点值。
当使用帧间模式时,运动补偿单元250可通过对当前块执行运动补偿来产生预测块,其中,运动补偿使用运动矢量以及存储在参考画面缓冲器270中的参考图像。
加法器225可通过将重建的残差块与预测块相加来产生重建块。滤波器单元260可将去块滤波器、样点自适应偏移和自适应环路滤波器中的至少一个应用于重建块或重建图像。滤波器单元260可输出重建图像。重建块或重建图像可被存储在参考画面缓冲器270中并且在执行帧间预测时被使用。由滤波器单元260处理的重建块可以是参考图像的一部分。也就是说,参考图像是由通过滤波器单元260处理的重建块组成的重建图像。存储的参考图像可稍后在帧间预测或运动补偿时被使用。
图3是示意性地示出当对图像进行编码和解码时的图像的分区结构的示图。图3示意性地示出将单个单元分区成多个更低等级的单元的示例。
为了有效地对图像进行分区,当进行编码和解码时,可使用编码单元(CU)。编码单元可被用作当对图像进行编码/解码时的基本单元。此外,编码单元可被用作用于在对图像进行编码/解码时区分帧内预测模式与帧间预测模式的单元。编码单元可以是用于预测、变换、量化、逆变换、反量化或对变换系数的编码/解码处理的基本单元。
参照图3,图像300按照最大编码单元(LCU)被顺序地分区,并且LCU单元被确定为分区结构。这里,LCU可以以与编码树单元(CTU)相同的含义被使用。单元分区可表示对与该单元相关联的块进行分区。在块分区信息中,可包括单元深度的信息。深度信息可表示单元被分区的次数或程度或者单元被分区的次数和程度两者。可基于树结构将单个单元分区成与深度信息分层地相关联的多个更低等级的单元。换句话说,单元和通过对该单元进行分区而产生的更低等级的单元可分别与节点和该节点的子节点相应。分区出的更低等级的单元中的每个可具有深度信息。深度信息可以是表示CU的尺寸的信息,并且可被存储在每个CU中。单元深度表示与对单元进行分区相关的次数和/或程度。因此,更低等级的单元的分区信息可包括关于更低等级的单元的尺寸的信息。
分区结构可表示编码单元(CU)在LCU 310内的分布。可根据是否将单个CU分区成多个(等于或大于2的正整数,包括2、4、8、16等)CU来确定这样的分布。通过分区产生的CU的水平尺寸和垂直尺寸可分别是分区之前的CU的水平尺寸和垂直尺寸的一半,或者可分别具有根据分区的次数而小于分区之前的水平尺寸和垂直尺寸的尺寸。CU可以被递归地分区成多个CU。通过递归分区,与分区之前的CU的高度和宽度之中的至少一个相比,分区之后的CU的高度和宽度之中的至少一个可减小。可递归地执行CU的分区,直到预定义的深度或预定义的尺寸为止。例如,LCU的深度可以是0,最小编码单元(SCU)的深度可以是预定义的最大深度。这里,如上所述,LCU可以是具有最大编码单元尺寸的编码单元,并且SCU可以是具有最小编码单元尺寸的编码单元。分区从LCU 310开始,随着CU的水平尺寸或垂直尺寸或者水平尺寸和垂直尺寸两者通过分区而减小,CU深度增加1。例如,对于每个深度,未被分区的CU的尺寸可以为2N×2N。此外,在被分区的CU的情况下,可将尺寸为2N×2N的CU分区成尺寸为N×N的四个CU。随着深度增加1,N的大小可减半。
此外,可通过使用CU的分区信息来表示CU是否被分区的信息。分区信息可以是1比特信息。除SCU之外的所有CU可包括分区信息。例如,当分区信息的值为1时,可不对CU进行分区,当分区信息的值为2时,可对CU进行分区。
参照图3,深度为0的LCU可以是64×64的块。0可以是最小深度。深度为3的SCU可以是8×8的块。3可以是最大深度。32×32的块和16×16的块的CU可分别被表示为深度1和深度2。
例如,当单个编码单元被分区成四个编码单元时,分区出的四个编码单元的水平尺寸和垂直尺寸可以是CU在被分区之前的水平尺寸和垂直尺寸的一半尺寸。在一个实施例中,当尺寸为32×32的编码单元被分区成四个编码单元时,分区出的四个编码单元中的每一个的尺寸可以为16×16。当单个编码单元被分区成四个编码单元时,可称编码单元可被分区成四叉树形式。
例如,当一个编码单元被分区成两个子编码单元时,该两个子编码单元中的每一个的水平尺寸或垂直尺寸(宽度或高度)可以是原始编码单元的水平尺寸或垂直尺寸的一半。例如,当尺寸为32×32的编码单元被垂直分区成两个子编码单元时,该两个子编码单元中的每一个可具有16×32的尺寸。例如,当尺寸为8×32的编码单元被水平分区成两个子编码单元时,该两个子编码单元中的每一个可具有8×16的尺寸。当一个编码单元被分区成两个子编码单元时,可称编码单元被二分区,或者根据二叉树分区结构被分区。
例如,当一个编码单元被分区成三个子编码单元时,可按照1:2:1的比例对编码单元的水平尺寸或垂直尺寸进行分区,从而产生水平尺寸或垂直尺寸的比例为1:2:1的三个子编码单元。例如,当尺寸为16×32的编码单元被水平分区成三个子编码单元时,该三个子编码单元以从最上方子编码单元到最下方子编码单元的顺序可分别具有16×8、16×16和16×8的尺寸。例如,当尺寸为32×32的编码单元被垂直划分为三个子编码单元时,该三个子编码单元以从左侧子编码单元到右侧子编码单元的顺序可分别具有8×32、16×32和8×32的尺寸。当一个编码单元被分区成三个子编码单元时,可称编码单元被三分区或者根据三叉树分区结构被分区。
在图3中,编码树单元(CTU)320是四叉树分区结构、二叉树分区结构和三叉树分区结构全部被应用的CTU的示例。
如上所述,为了对CTU进行分区,可应用四叉树分区结构、二叉树分区结构和三叉树分区结构中的至少一个。可根据预定的优先级顺序将各种树分区结构顺序地应用于CTU。例如,可将四叉树分区结构优先应用于CTU。不能再使用四叉树分区结构进行分区的编码单元可与四叉树的叶节点相应。与四叉树的叶节点相应的编码单元可用作二叉树和/或三叉树分区结构的根节点。也就是说,与四叉树的叶节点相应的编码单元可根据二叉树分区结构或三叉树分区结构被进一步分区,或者可不被进一步分区。因此,通过阻止从与四叉树的叶节点相应的编码单元的二叉树分区或三叉树分区得到的编码块被执行进一步的四叉树分区,块分区操作和/或用信号传送分区信息的操作可被有效执行。
可使用四分区信息用信号传送与四叉树的节点相应的编码单元被分区的事实。具有第一值(例如,“1”)的四分区信息可指示当前编码单元按照四叉树分区结构被分区。具有第二值(例如,“0”)的四分区信息可指示当前编码单元不按照四叉树分区结构被分区。四分区信息可以是具有预定长度(例如,一个比特)的标志。
在二叉树分区与三叉树分区之间可没有优先级。也就是说,与四叉树的叶节点相应的编码单元可进一步被执行二叉树分区和三叉树分区中的任意分区。此外,通过二叉树分区或三叉树分区产生的编码单元可被执行进一步的二叉树分区或进一步的三叉树分区,或者可不被进一步分区。
在二叉树分区和三叉树分区之间不存在优先级的树结构被称为多类型树结构。与四叉树的叶节点相应的编码单元可用作多类型树的根节点。可使用多类型树分区指示信息、分区方向信息和分区树信息中的至少一个来用信号传送是否对与多类型树的节点相应的编码单元进行分区。为了对与多类型树的节点相应的编码单元进行分区,可顺序地用信号传送多类型树分区指示信息、分区方向信息和分区树信息。
具有第一值(例如,“1”)的多类型树分区指示信息可指示当前编码单元将被执行多类型树分区。具有第二值(例如,“0”)的多类型树分区指示信息可指示当前编码单元将不被执行多类型树分区。
当与多类型树的节点相应的编码单元按照多类型树分区结构被进一步分区时,所述编码单元可包括分区方向信息。分区方向信息可指示当前编码单元将在哪个方向上根据多类型树分区被分区。具有第一值(例如,“1”)的分区方向信息可指示当前编码单元将被垂直分区。具有第二值(例如,“0”)的分区方向信息可指示当前编码单元将被水平分区。
当与多类型树的节点相应的编码单元按照多类型树分区结构被进一步分区时,当前编码单元可包括分区树信息。分区树信息可指示将被用于对多类型树的节点进行分区的树分区结构。具有第一值(例如,“1”)的分区树信息可指示当前编码单元将按照二叉树分区结构被分区。具有第二值(例如,“0”)的分区树信息可指示当前编码单元将按照三叉树分区结构被分区。
分区指示信息、分区树信息和分区方向信息均可以是具有预定长度(例如,一个比特)的标志。
四叉树分区指示信息、多类型树分区指示信息、分区方向信息和分区树信息中的至少任意一个可被熵编码/熵解码。为了对那些类型的信息进行熵编码/熵解码,可使用关于与当前编码单元相邻的邻近编码单元的信息。例如,当前编码单元的左侧邻近编码单元和/或上方邻近编码单元的分区类型(被分区或不被分区、分区树和/或分区方向)与当前编码单元的分区类型相似的可能性很高。因此,可从关于邻近编码单元的信息推导用于对关于当前编码单元的信息进行熵编码/熵解码的上下文信息。关于邻近编码单元的信息可包括四分区信息、多类型树分区指示信息、分区方向信息和分区树信息中的至少任意一个。
作为另一示例,在二叉树分区和三叉树分区中,可优先执行二叉树分区。也就是说,当前编码单元可首先被执行二叉树分区,并且随后可将与二叉树的叶节点相应的编码单元设置为用于三叉树分区的根节点。在这种情况下,对于与三叉树的节点相应的编码单元,可既不执行四叉树分区也不执行二叉树分区。
不能按照四叉树分区结构、二叉树分区结构和/或三叉树分区结构被分区的编码单元成为用于编码、预测和/或变换的基本单元。也就是说,所述编码单元不能被进一步分区以用于预测和/或变换。因此,在比特流中可不存在用于将编码单元分区成预测单元和/或变换单元的分区结构信息和分区信息。
然而,当编码单元(即,用于分区的基本单元)的尺寸大于最大变换块的尺寸时,可递归地对该编码单元进行分区,直到将该编码单元的尺寸减小到等于或小于最大变换块的尺寸为止。例如,当编码单元的尺寸为64×64时并且当最大变换块的尺寸为32×32时,可将该编码单元分区成用于变换的四个32×32的块。例如,当编码单元的尺寸为32×64并且最大变换块的尺寸为32×32时,可将该编码单元分区成用于变换的两个32×32的块。在这种情况下,不单独用信号传送编码单元的用于变换的分区,并且可通过编码单元的水平尺寸或垂直尺寸与最大变换块的水平尺寸或垂直尺寸之间的比较来确定编码单元的用于变换的分区。例如,当编码单元的水平尺寸(宽度)大于最大变换块的水平尺寸(宽度)时,可将该编码单元垂直地二等分。例如,当编码单元的垂直尺寸(长度)大于最大变换块的垂直尺寸(长度)时,可将该编码单元水平地二等分。
可在编码单元的更高等级用信号传送或确定编码单元的最大尺寸和/或最小尺寸的信息以及变换块的最大尺寸和/或最小尺寸的信息。所述更高等级可以是例如序列级、画面级、条带级等。例如,可将编码单元的最小尺寸确定为4×4。例如,可将变换块的最大尺寸确定为64×64。例如,可将变换块的最小尺寸确定为4×4。
可在编码单元的更高等级用信号传送或确定与四叉树的叶节点相应的编码单元的最小尺寸(四叉树最小尺寸)的信息和/或多类型树的从根节点到叶节点的最大深度(多类型树的最大树深度)的信息。例如,所述更高等级可以是序列级、画面级、条带级等。可针对画面内条带和画面间条带中的每一个用信号传送或确定四叉树的最小尺寸的信息和/或多类型树的最大深度的信息。
可在编码单元的更高等级用信号传送或确定CTU的尺寸与变换块的最大尺寸之间的差信息。例如,所述更高等级可以是序列级、画面级、条带级等。可基于编码树单元的尺寸和所述差信息来确定与二叉树的各个节点相应的编码单元的最大尺寸(在下文中,称为二叉树的最大尺寸)的信息。与三叉树的各个节点相应的编码单元的最大尺寸(在下文中,称为三叉树的最大尺寸)可依据条带的类型而变化。例如,针对画面内条带,三叉树的最大尺寸可以是32×32。例如,针对画面间条带,三叉树的最大尺寸可以是128×128。例如,可将与二叉树的各个节点相应的编码单元的最小尺寸(在下文中,称为二叉树的最小尺寸)和/或与三叉树的各个节点相应的编码单元的最小尺寸(在下文中,称为三叉树的最小尺寸)设置为编码块的最小尺寸。
作为另一示例,可在条带级用信号传送或确定二叉树的最大尺寸和/或三叉树的最大尺寸。可选地,可在条带级用信号传送或确定二叉树的最小尺寸和/或三叉树的最小尺寸。
依据上述各种块的尺寸信息和深度信息,四分区信息、多类型树分区指示信息、分区树信息和/或分区方向信息可被包括在比特流中或可不被包括在比特流中。
例如,当编码单元的尺寸不大于四叉树的最小尺寸时,该编码单元不包含四分区信息。因此,可从第二值推导四分区信息。
例如,当与多类型树的节点相应的编码单元的尺寸(水平尺寸和垂直尺寸)大于二叉树的最大尺寸(水平尺寸和垂直尺寸)和/或三叉树的最大尺寸(水平尺寸和垂直尺寸)时,该编码单元可不被二分区或三分区。因此,可不用信号传送多类型树分区指示信息,而是可从第二值推导多类型树分区指示信息。
可选地,当与多类型树的节点相应的编码单元的尺寸(水平尺寸和垂直尺寸)与二叉树的最大尺寸(水平尺寸和垂直尺寸)相同,和/或是三叉树的最大尺寸(水平尺寸和垂直尺寸)的两倍大时,该编码单元可不进一步被二分区或三分区。因此,可不用信号传送多类型树分区指示信息,而是可从第二值推导多类型树分区指示信息。这是因为,当按照二叉树分区结构和/或三叉树分区结构对编码单元进行分区时,产生了小于二叉树的最小尺寸和/或三叉树的最小尺寸的编码单元。
可选地,当与多类型树的节点相应的编码单元的深度等于多类型树的最大深度时,可不对该编码单元进一步进行二分区和/或三分区。因此,可不用信号传送多类型树分区指示信息,而是可从第二值推导多类型树分区指示信息。
可选地,只有当垂直方向二叉树分区、水平方向二叉树分区、垂直方向三叉树分区和水平方向三叉树分区中的至少一个对于与多类型树的节点相应的编码单元是可行的时,才可用信号传送多类型树分区指示信息。否则,可不对该编码单元进行二分区和/或三分区。因此,可不用信号传送多类型树分区指示信息,而是可从第二值推导多类型树分区指示信息。
可选地,只有当垂直方向二叉树分区和水平方向二叉树分区两者或者垂直方向三叉树分区和水平方向三叉树分区两者对于与多类型树的节点相应的编码单元是可行的时,才可用信号传送分区方向信息。否则,可不用信号传送分区方向信息,而是可从指示可能的分区方向的值推导分区方向信息。
可选地,只有当垂直方向二叉树分区和垂直方向三叉树分区两者或者水平方向二叉树分区和水平方向三叉树分区两者对于与多类型树的节点相应的编码树是可行的时,才可用信号传送分区树信息。否则,可不用信号传送分区树信息,而是可从指示可能的分区树结构的值推导分区树信息。
图4是示出帧内预测处理的示图。
图4中的从中心到外部的箭头可表示帧内预测模式的预测方向。
可通过使用当前块的邻近块的参考样点来执行帧内编码和/或解码。邻近块可以是重建的邻近块。例如,可通过使用包括在重建的邻近块中的参考样点的编码参数或值来执行帧内编码和/或解码。
预测块可表示通过执行帧内预测产生的块。预测块可与CU、PU和TU中的至少一个相应。预测块的单元可具有CU、PU和TU中的一个的尺寸。预测块可以是尺寸为2×2、4×4、16×16、32×32或64×64等的正方形块,或者可以是尺寸为2×8、4×8、2×16、4×16和8×16等的矩形块。
可根据针对当前块的帧内预测模式来执行帧内预测。当前块可具有的帧内预测模式的数量可以是固定值,并且可以是根据预测块的属性不同地确定的值。例如,预测块的属性可包括预测块的尺寸和预测块的形状等。
不管块尺寸为多少,可将帧内预测模式的数量固定为N。或者,帧内预测模式的数量可以是3、5、9、17、34、35、36、65或67等。可选地,帧内预测模式的数量可根据块尺寸或颜色分量类型或者块尺寸和颜色分量类型两者而变化。例如,帧内预测模式的数量可根据颜色分量是亮度信号还是色度信号而变化。例如,随着块尺寸变大,帧内预测模式的数量可增加。可选地,亮度分量块的帧内预测模式的数量可大于色度分量块的帧内预测模式的数量。
帧内预测模式可以是非角度模式或角度模式。非角度模式可以是DC模式或平面模式,并且角度模式可以是具有特定方向或角度的预测模式。帧内预测模式可由模式编号、模式值、模式数字、模式角度和模式方向中的至少一个来表示。帧内预测模式的数量可以是大于1的M,包括非角度模式和角度模式。
为了对当前块进行帧内预测,可执行确定是否可将包括在重建的邻近块中的样点用作当前块的参考样点的步骤。当存在不能用作当前块的参考样点的样点时,通过对包括在重建的邻近块中的样点中的至少一个样点值进行复制或执行插值或者执行复制和插值两者而获得的值可被用于替换样点的不可用样点值,因此,经过替换的样点值被用作当前块的参考样点。
当进行帧内预测时,可基于帧内预测模式和当前块尺寸将滤波器应用于参考样点和预测样点中的至少一个。
在平面模式的情况下,当产生当前块的预测块时,根据预测目标样点在预测块内的位置,可通过使用当前样点的上侧参考样点与左侧参考样点以及当前块的右上侧参考样点与左下侧参考样点的加权和来产生预测目标样点的样点值。此外,在DC模式的情况下,当产生当前块的预测块时,可使用当前块的上侧参考样点与左侧参考样点的平均值。此外,在角度模式的情况下,可通过使用当前块的上侧参考样点、左侧参考样点、右上侧参考样点和/或左下侧参考样点来产生预测块。为了产生预测样点值,可对实数单元执行插值。
可通过预测与当前块相邻存在的块的帧内预测模式来对当前块的帧内预测模式进行熵编码/熵解码。在当前块与邻近块的帧内预测模式相同时,可通过使用预定标志信息来用信号传送当前块与邻近块的帧内预测模式相同的信息。此外,可用信号传送多个邻近块的帧内预测模式中的与当前块的帧内预测模式相同的帧内预测模式的指示符信息。在当前块与邻近块的帧内预测模式不同时,可通过基于邻近块的帧内预测模式执行熵编码/熵解码来对当前块的帧内预测模式信息进行熵编码/熵解码。
图5是示出画面间预测处理的实施例的示图。
在图5中,矩形可表示画面。在图5中,箭头表示预测方向。根据画面的编码类型,可将画面分类为帧内画面(I画面)、预测画面(P画面)和双预测画面(B画面)。
可在不需要画面间预测的情况下通过帧内预测对I画面进行编码。可通过使用在相对于当前块的一个方向(即,前向或后向)上存在的参考画面,通过画面间预测来对P画面进行编码。可通过使用在相对于当前块的两个方向(即,前向和后向)上存在的参考画面,通过画面间预测来对B画面进行编码。当使用画面间预测时,编码器可执行画面间预测或运动补偿,并且解码器可执行相应的运动补偿。
在下文中,将对画面间预测的实施例进行详细描述。
可使用参考画面和运动信息来执行画面间预测或运动补偿。
可通过编码设备100和解码设备200中的每一个在画面间预测期间推导当前块的运动信息。可通过使用重建的邻近块的运动信息、同位块(也称为col块或共同定位块)的运动信息和/或与同位块相邻的块的运动信息来推导当前块的运动信息。同位块可表示先前重建的同位画面(也称为col画面或共同定位画面)内的在空间上与当前块位于相同位置的块。同位画面可以是包括在参考画面列表中的一个或更多个参考画面中的一个画面。
推导当前块的运动信息的方法可依据当前块的预测模式而变化。例如,作为用于画面间预测的预测模式,可存在AMVP模式、合并模式、跳过模式、当前画面参考模式等。合并模式可被称为运动合并模式。
例如,当AMVP被用作预测模式时,可将重建的邻近块的运动矢量、同位块的运动矢量、与同位块相邻的块的运动矢量和(0,0)运动矢量中的至少一个确定为针对当前块的运动矢量候选,并且通过使用运动矢量候选产生运动矢量候选列表。可通过使用产生的运动矢量候选列表来推导当前块的运动矢量候选。可基于推导出的运动矢量候选来确定当前块的运动信息。同位块的运动矢量或与同位块相邻的块的运动矢量可被称为时间运动矢量候选,并且重建的邻近块的运动矢量可被称为空间运动矢量候选。
编码设备100可计算当前块的运动矢量与运动矢量候选之间的运动矢量差(MVD),并且可对运动矢量差(MVD)执行熵编码。此外,编码设备100可对运动矢量候选索引执行熵编码并产生比特流。运动矢量候选索引可指示包括在运动矢量候选列表中的运动矢量候选中的最佳运动矢量候选。解码设备可对包括在比特流中的运动矢量候选索引执行熵解码,并且可通过使用经过熵解码的运动矢量候选索引从包括在运动矢量候选列表中的运动矢量候选中选择解码目标块的运动矢量候选。此外,解码设备200可将经过熵解码的MVD与通过熵解码而提取的运动矢量候选相加,从而推导解码目标块的运动矢量。
比特流可包括指示参考画面的参考画面索引。参考画面索引可通过编码设备100被熵编码,并且随后作为比特流被用信号传送到解码设备200。解码设备200可基于推导的运动矢量和参考画面索引信息来产生解码目标块的预测块。
推导当前的运动信息的方法的另一示例可以是合并模式。合并模式可表示合并多个块的运动的方法。合并模式可表示从邻近块的运动信息推导当前块的运动信息的模式。当应用合并模式时,可使用重建的邻近块的运动信息和/或同位块的运动信息来产生合并候选列表。运动信息可包括运动矢量、参考画面索引和画面间预测指示符中的至少一个。预测指示符可指示单向预测(L0预测或L1预测)或双向预测(L0预测和L1预测)。
合并候选列表可以是存储的运动信息的列表。包括在合并候选列表中的运动信息可以是零合并候选和新运动信息中的至少一个,其中,所述新运动信息是与当前块相邻的一个邻近块的运动信息(空间合并候选)、当前块的包括在参考画面内的同位块的运动信息(时间合并候选)和存在于合并候选列表中的运动信息的组合。
编码设备100可通过对合并标志和合并索引中的至少一个执行熵编码来产生比特流,并且可将比特流用信号传送到解码设备200。合并标志可以是指示是否针对每个块执行合并模式的信息,并且合并索引可以是指示当前块的邻近块中的哪个邻近块是合并目标块的信息。例如,当前块的邻近块可包括在当前块的左侧的左侧邻近块、被布置在当前块上方的上方邻近块和在时间上与当前块相邻的时间邻近块。
跳过模式可以是将邻近块的运动信息按照原样应用于当前块的模式。当应用跳过模式时,编码设备100可对哪个块的运动信息将被用作当前块的运动信息的事实的信息执行熵编码,以产生比特流,并且可将比特流用信号传送到解码设备200。编码设备100可不将关于运动矢量差信息、编码块标志和变换系数等级中的至少任意一个的语法元素用信号传送到解码设备200。
当前画面参考模式可表示当前块所属的当前画面内的先前重建的区域被用于预测的预测模式。这里,矢量可被用于指定先前重建的区域。可通过使用当前块的参考画面索引来对指示是否将在当前画面参考模式下对当前块进行编码的信息进行编码。可用信号传送指示当前块是否为在当前画面参考模式下被编码的块的标志或索引,并且可基于当前块的参考画面索引来推导所述标志或索引。在当前块在当前画面参考模式下被编码的情况下,可将当前画面添加到针对当前块的参考画面列表,以使当前画面位于参考画面列表中的固定位置或任意位置。所述固定位置可以是例如由参考画面索引0指示的位置,或者是列表中的最后一个位置。当将当前画面添加到参考画面列表,以使当前画面位于任意位置时,可用信号传送指示所述任意位置的参考画面索引。
图6是示出变换和量化处理的示图。
如图6中所示,对残差信号执行变换处理和/或量化处理,以产生量化的等级信号。残差信号是原始块与预测块(即,帧内预测块或帧间预测块)之间的差。预测块是通过帧内预测或帧间预测产生的块。变换可以是首次变换、二次变换或者首次变换和二次变换两者。对残差信号进行首次变换产生变换系数,并且对该变换系数进行二次变换产生二次变换系数。
从预先定义的各种变换方案中选择的至少一种方案被用于执行首次变换。例如,所述预先定义的变换方案的示例包括离散余弦变换(DCT)、离散正弦变换(DST)和Karhunen-Loève变换(KLT)。通过首次变换产生的变换系数可被执行二次变换。可根据当前块和/或当前块的邻近块的编码参数来确定用于首次变换和/或二次变换的变换方案。可选地,可通过变换信息的信令来确定变换方案。
由于残差信号通过首次变换和二次变换被量化,因此产生了量化的等级信号(量化系数)。依据块的帧内预测模式或块尺寸/形状,可根据对角线右上扫描、垂直扫描和水平扫描中的至少一个来扫描量化的等级信号。例如,当按照对角线右上扫描来扫描系数时,块形式的系数改变为一维矢量形式。除了对角线右上扫描之外,可依据变换块的帧内预测模式和/或尺寸来使用水平地扫描二维块形式的系数的水平扫描和垂直地扫描二维块形式的系数的垂直扫描。扫描的量化等级系数可被熵编码以被插入到比特流中。
解码器对比特流进行熵解码以获得量化等级系数。可通过逆扫描以二维块形式排列量化等级系数。对于逆扫描,可使用对角线右上扫描、垂直扫描和水平扫描中的至少一个。
然后,可对量化等级系数进行反量化,随后根据需要进行二次逆变换,并且最后根据需要进行首次逆变换,以产生重建的残差信号。
在下文中,参照图7至图18,将对根据本发明的实施例的执行子块划分或推导子块之间的预测信息或执行子块划分和推导子块之间的预测信息两者进行描述。
图7是示出根据本发明的实施例的对视频进行解码的方法的流程图的示图。
参照图7,在S701,解码器可根据块划分结构将编码单元划分为多个子单元。
另外,块划分结构可以是划分被执行使得包括具有除了正方形和矩形形状之外的预定块形状的至少一个子单元的块划分结构。
另外,块划分结构可以是划分被执行使得编码单元被划分为包括具有三角形形状的子单元的块划分结构。
另外,三角形形状可以是以下中的至少一个:通过按照从编码单元的左上方到右下方的对角线边界进行划分而获得的三角形形状和通过按照从编码单元的右上方到左下方的对角线边界进行划分而获得的三角形形状。
另外,可基于表示编码单元是否被划分的标志来确定块划分结构。
另外,可基于表示编码单元是否被划分的标志和表示子单元的划分类型的索引来确定块划分结构。
另外,子单元的划分类型可指子单元的划分方向。
另外,在S702,解码器可基于子单元执行解码。
另外,解码器可通过基于子单元执行帧内预测和帧间预测中的至少一个来执行解码。另外,解码器可通过基于子单元执行逆变换和反量化中的至少一个来执行解码。另外,解码器可以以子单元的最低等级子单元为单位执行解码。
将对推导帧间预测信息的方法进行描述。
当根据合并模式执行对当前块的帧间预测时,合并候选可包括空间合并候选、时间合并候选、基于子块的时间合并候选、基于子块的时间空间组合合并候选、组合合并候选、零合并候选等。合并候选可包括帧间预测指示符、参考视频列表的参考视频索引、运动矢量和画面顺序计数(POC)中的至少一个的帧间预测信息。
将对推导空间合并候选的方法进行描述。
从在空间上与将被编码/解码的当前块相邻的重建块,可推导当前块的空间合并候选。
图8是示出根据本发明的实施例的推导空间合并候选的方法的示图。
参照图8,可从与位于将被编码/解码的当前块X的左侧的块A1、位于当前块X的上方的块B1、位于当前块X的右上角的块B0、位于当前块X的左下角的块A0和位于当前块X的左上角的块B2中的至少一个相应的块推导运动信息。另外,可通过使用推导出的运动信息来确定当前块的空间合并候选。在示例中,推导出的运动信息可被用作当前块的空间合并候选。
空间合并候选可指在空间上与将被编码/解码的块相邻重建的块(或者,在空间上相邻的重建块的运动信息)。所述块可具有正方形形状或非正方形形状。另外,在空间上与将被编码/解码的块相邻重建的块可以以更低等级块(子块)为单位被划分。可针对每个更低等级块来推导至少一个空间合并候选。
推导空间合并候选可指推导空间合并候选并且将推导出的空间合并候选添加到合并候选列表。这里,被添加到合并候选列表的合并候选中的每一个可具有不同的运动信息。
可推导出多达maxNumSpatialMergeCand个空间合并候选。这里,maxNumSpatialMergeCand可以是包括0的正整数。在示例中,maxNumSpatialMVPCand可以是5。maxNumMergeCand可以是可被包括在合并候选列表中的合并候选的最大数量,并且可以是包括0的正整数。另外,numMergeCand可表示在预定的MaxNumMergeCand内的包括在实际合并候选列表中的合并候选的数量。另外,maxNumSpatialMergeCand、numMergeCand、MaxNumMergeCand的使用不限制本发明的范围。编码/解码设备可通过使用具有与numMergeCand和maxNumMergeCand相同含义的参数值来使用以上信息。
将对推导时间合并候选的方法进行描述。
可从在时间上与将被将被编码/解码的当前块相邻的块(即,在参考视频(参考画面)中重建的块)推导时间合并候选。在时间上与当前块相邻的参考视频可指同位视频(同位画面)。可以以序列/画面/条带/并行块/CTU/CU内的编码块单元中的至少一个为单位将同位视频的信息(在示例中,指示当前块的同位块的帧间预测指示符、参考视频索引和运动矢量信息中的至少一个)从编码器发送到解码器。可选地,可通过使用以下项在编码器/解码器中隐式地推导同位视频的信息:根据编码/解码顺序的至少一个分层结构、当前块或已经被编码/解码的在时间空间上相邻的块或者当前块和已经被编码/解码的在时间空间上相邻的块两者的运动信息(在示例中,帧间预测指示符或参考视频索引或两者)、按照序列/画面/条带/并行块等级的同位视频的帧间预测指示符以及参考视频索引信息。
这里,当推导当前块的时间合并候选时,对同位视频的选择或同位块在同位视频内的位置或者对同位视频的选择和同位块在同位视频内的位置两者可基于当前块的位置通过使用已被编码/解码的在时间空间上相邻的块的运动信息中的至少一个被选择。因此,同位视频内的相同位置处的块可被选择。可选地,可将当前块的同位块确定为在通过从所选择的同位视频内的当前块的相同位置移动了运动矢量的位置处的块,其中,所述运动矢量通过使用已经被编码/解码的在时间空间上相邻的块的运动矢量信息中的至少一个而获得。
这里,已经被编码/解码的在时间空间上相邻的块的运动矢量信息可以是运动矢量、参考视频索引、帧间预测指示符、POC和当前编码画面(或,条带)等级的同位视频的信息中的至少一个。
推导时间合并候选可指推导时间合并候选,并且当推导出的时间合并候选的运动信息与现有的合并候选列表不同时,将推导出的时间合并候选添加到合并候选列表。
可推导出多达maxNumTemporalMergeCand个时间合并候选。这里,maxNumTemporalMergeCand可以是包括0的正整数。在示例中,maxNumTemporalMergeCand可以是1。另外,maxNumTemporalMergeCand的使用不限制本发明的范围。编码/解码设备可通过使用具有与maxNumTemporalMergeCand相同含义的参数值来使用以上信息。
另外,使用时间合并候选的预测可被称为TMVP(时间运动矢量预测)。
图9是示出根据本发明的实施例的推导时间合并候选的方法的示图。
参照图9,可在位置H处的块或位置C3处的块中推导时间合并候选,其中,位置H处的块存在于位于将被编码/解码的当前视频的参考视频内的在空间上与将被编码/解码的当前块X相同的位置的同位块C的外部。
这里,当能够从位置H处的块推导时间合并候选时,可从位置H处的块推导出时间合并候选。否则,当不从位置H处的块推导出时间合并候选时,可从位置C3处的块推导时间合并候选。推导时间合并候选的顺序可变化。
另外,当预定位置或位置C3被帧内编码时,可在位置H或位置C3处的块中推导时间合并候选。当前块的同位块可具有正方形形状或非正方形形状。
当包括当前块的视频与当前块的参考视频之间的距离不同于包括同位块的视频与同位块的参考视频之间的距离时,可通过对同位块的运动矢量执行缩放来推导时间合并候选。可根据td与tb的比率(在示例中,比率=(tb/td))来执行对运动矢量的缩放。这里,td可表示同位视频(同位画面)的POC与同位块的参考视频的POC之间的差值。另外,tb可表示将被编码/解码的视频的POC与当前块的参考视频的POC之间的差值。
将对推导基于子块的时间合并候选进行描述。
可按照具有比当前块更小的尺寸、形状和更深的深度中的至少一个的子块单元从将被编码/解码的同位子块来推导时间合并候选。例如,子块可以是具有比当前块更小的水平长度或垂直长度的块,或者具有比当前块更深的深度或最小化的形状的块,或者可以是包括在当前块中的块。
将被编码/解码的子块的同位子块可具有正方形形状或非正方形形状。另外,可按照具有比当前块更小的尺寸、形状和更深深度中的至少一个的子块单元对当前块的同位块进行划分。可针对每个子块推导至少一个时间合并候选。
当通过按照子块单元执行划分来推导至少一个时间合并候选时,可根据子块的尺寸、形状和深度中的至少一个在利用图9描述的位置H或位置C3或者位置H和位置C3两处的同位子块中推导时间合并候选。可选地,通过使用存储在与按照从当前块的邻近块推导出的任意运动信息被移动的位置相关联的同位块的每个子块单元中的运动信息(在示例中,运动矢量、参考视频索引、帧间预测指示符和POC中的至少一个),可推导出至少一个时间合并候选。
当推导当前块或当前块的子块的时间合并候选时,可将从同位块内的同位子块获得的每个参考视频列表(在示例中,L0或L1或者L0和L1两者)的运动矢量缩放为当前块的与任意参考视频相关联的运动矢量。可选地,可通过执行缩放获得多个运动矢量作为从同位子块获得的与参考当前块的子块的所有参考视频中的至少一个参考视频相关联的运动矢量,并且然后可获得使用与每个参考视频相关联地被缩放的运动矢量的至少一个预测块。另外,可通过使用所获得的预测块的加权和来获得当前块或子块的预测块。
另外,使用基于子块的时间合并候选的预测可被称为ATMVP(替代时间运动矢量预测)。
将对推导基于子块的时间空间组合合并候选的方法进行描述。
可通过将当前块划分为子块并且通过针对所获得的每个子块单元使用在空间上相邻的子块和同位视频内的同位子块的至少一条运动信息来推导当前块的合并候选。
图10是示出根据本发明的实施例的推导基于子块的时间空间组合合并候选的方法的示图。
图10是示出由阴影表示的8×8当前块被划分为四个4×4子块(即,A、B、C和D块)的块结构的示图。可通过使用在时间空间上与每个子块相邻的子块的运动矢量信息来推导基于子块的时间空间组合合并候选。这里,运动矢量信息可指运动矢量、帧间预测指示符、参考视频索引、POC等。
在图10中,当在将当前块划分为子块之后根据运动补偿推导残差信号时,可通过执行在第一子块A的上方部分的子块a处开始从左侧到右侧的方向的扫描来获得运动信息。在示例中,当通过使用帧内预测方法对第一上方子块进行编码时,可顺序地扫描第二上方子块。换句话说,可执行针对上方子块的扫描直到找到包括可用的运动矢量信息的上方子块为止。
另外,在获得针对上方子块的可用的运动信息之后,可通过执行在第一子块A的左侧的子块c处开始从上方到下方的方向的扫描来获得可用的运动信息。
另外,在获得左侧子块或上方子块或者左侧子块和上方子块两者的在空间上相邻的运动信息之后,可通过获得当前子块的同位子块或同位块或当前子块的同位子块和同位块两者的运动信息来推导时间运动信息。
这里,同位块或同位块的子块的位置可以是利用图9描述的位置C3或位置H处的运动信息,或者可指由与当前块或同位块的子块相邻推导的运动矢量所补偿的位置处的同位块。可通过使用以上方法来获得在空间上与L0或L1或者L0和L1两者相邻的块的运动信息和在时间上相邻的块的运动信息中的至少一个。另外,基于获得的至少一条运动信息,可推导将被编码/解码的当前子块的基于子块的时间空间组合合并候选。
在示例中,针对L0或L1或者L0和L1两者,可执行对在所描述的针对当前块的子块的时间/空间子块中推导的至少一条运动矢量信息中的运动矢量的缩放以便与当前块的第一参考视频相关联。随后,通过使用多达三个经缩放的运动矢量的平均值、最大值、最小值、中值、加权值和众数中的至少一个,可推导第一当前子块A的运动矢量或第一子块A的时间空间组合合并候选。另外,可通过使用以上方法来推导子块B、C和D的时间空间组合合并候选。
另外,使用基于子块的时间空间组合合并候选的预测可被称为STMVP(时空运动矢量预测)。
将对推导附加合并候选进行描述。
可将修改的空间合并候选、修改的时间合并候选、组合合并候选和具有预定的运动信息值的合并候选中的至少一个推导为可在本发明中使用的附加合并候选。
这里,推导附加合并候选可指,当存在具有与存在于现有的合并候选列表中的合并候选不同的运动信息的合并候选时,将相应的合并候选添加到合并候选列表。
修改的空间合并候选可指通过使用上述方法推导的空间合并候选中的至少一个的运动信息被修改的合并候选。
修改的时间合并候选可指通过使用以上方法推导的至少一个时间合并候选的运动信息被修改的合并候选。
组合合并候选可指使用存在于合并候选列表中的以下合并候选的运动信息中的至少一条的合并候选:空间合并候选、时间合并候选、修改的空间合并候选、修改的时间合并候选、组合合并候选和具有预定的运动信息值的合并候选。这里,组合合并候选可指组合双向预测合并候选。另外,使用组合合并候选的预测可被称为CMP(组合运动预测)。
具有预定的运动信息值的合并候选可指运动矢量为(0,0)的零合并候选。同时,使用具有预定的运动信息值的合并候选的预测可被称为ZMP(零运动预测)。
可针对当前块的每个子块推导修改的空间合并候选、空间合并候选、修改的时间合并候选、时间合并候选、组合合并候选、具有预定的运动信息值的合并候选中的至少一个,并且可将针对每个子块推导的合并候选添加到合并候选列表。
可按照具有比将被编码/解码的当前块更小的尺寸、形状和更深的深度中的至少一个的子块单元推导帧间预测信息。在示例中,尺寸可指水平尺寸或垂直尺寸或者水平尺寸和垂直尺寸两者。
当按照当前块的子块单元推导帧间预测信息时,编码器/解码器可通过使用双向匹配(bilateral matching)方法和模板匹配方法中的至少一个来推导帧间预测信息。
当使用双向匹配方法时,可配置初始运动矢量列表。当配置初始运动矢量列表时,可使用与当前块相邻的运动矢量。
在示例中,可通过使用当前块的AMVP模式的预测运动矢量候选来配置初始运动矢量列表。
在另一示例中,可通过使用当前块的合并模式的合并候选来配置初始运动矢量列表。
在另一示例中,初始运动矢量列表可被配置有当前块的合并模式的L0或L1或者L0和L1两者的单向运动矢量。
在另一示例中,初始运动矢量列表可被配置有除了当前块的合并模式之外的其余块的运动矢量。
在另一示例中,可通过对以上示例的至少N个运动矢量进行组合来配置初始运动矢量列表。这里,N可表示大于0的正整数。
在另一示例中,初始运动矢量列表可被配置有列表0或列表1的一个方向的运动矢量。
图11是示出根据本发明的实施例的通过使用双向匹配方法来推导帧间预测信息的方法的示图。
参照图11,当存在于初始运动矢量列表中的运动矢量是存在于L0列表中的MV0时,在相对方向上的参考画面中,可推导存在于与MV0相同的轨迹上并且指示与由MV0指示的块最佳匹配的块的MV1。这里,可将具有由MV0和MV1指示的块之间的最小SAD(绝对差之和)的MV推导为当前子块的帧间预测信息。
图12是示出根据本发明的实施例的通过使用模板匹配方法来推导帧间预测信息的方法的示图。
通过使用图12中定义的模板,当前块的邻近块可被用作模板。这里,模板的水平(宽度)尺寸和垂直(高度)尺寸可与当前块的水平(宽度)尺寸和垂直(高度)尺寸相同或不同。
在示例中,当前块(Cur块)的上方部分可被用作模板。
在另一示例中,当前块的左侧部分可被用作模板。
在另一示例中,当前块的左侧部分和上方部分可被用作模板。
在另一示例中,在当前视频(Cur画面)的参考视频(Ref0)中,当前块的同位块的上方部分或左侧部分或者上方部分和左侧部分两者可被用作模板。
在另一示例中,可推导在当前块的模板与参考块的模板之间具有最小SAD的MV作为当前子块的帧间预测信息。
当按照当前块的子块单元推导帧间预测信息时,可执行亮度补偿。例如,可通过使用线性模型使以至少N个样点(其中,N是任意正整数)采样的当前块的空间邻近样点的亮度变化以及参考块的空间邻近样点的亮度变化近似。另外,可将线性模型应用于应用了当前子块的运动补偿的块以执行亮度补偿。
当按照当前块的子块单元推导帧间预测信息时,可执行基于仿射的空间运动预测和补偿。例如,针对当前块的左上方坐标的运动矢量和当前块的右上方的运动矢量,可按照当前块的子块单元通过使用仿射变换公式来产生运动矢量。另外,可通过使用产生的运动矢量来执行运动补偿。
图13是示出根据本发明的实施例的基于OMBC(重叠块运动补偿)推导帧间预测信息的方法的示图。
当按照当前块的子块单元推导帧间预测信息,将通过使用当前块的帧间预测信息补偿的块与通过使用包括在当前块中的左侧、右侧、上方和下方位置处的子块中的至少一个的帧间预测信息补偿的至少一个子块进行组合时,可产生基于OBMC的当前块的子块的预测块。
在示例中,可仅针对存在于当前块的内部的边界位置处的子块应用执行。
在另一示例中,可针对当前块的内部的所有子块应用执行。
在另一示例中,可针对存在于当前块的内部的左侧边界位置处的子块应用执行。
在另一示例中,可针对存在于当前块的内部的右侧边界位置处的子块应用执行。
根据本发明的实施例,可通过将视频划分为多个子块单元来对视频进行编码/解码。可使用具有相同含义的单元和块。
图14是示出根据本发明的实施例的四叉树划分、对称二叉树划分和非对称二叉树划分的示图。在图14中,w可表示块的水平尺寸,并且h可表示块的垂直尺寸。
参照图14,四叉树划分是一个块被划分为四个子块的划分形式,其中,四个子块的水平尺寸和垂直尺寸可以是被划分之前的块的水平和垂直尺寸的一半。
二叉树划分是一个块被划分为两个子块的划分形式,并且可包括对称二叉树划分(对称分割)或非对称二叉树划分(非对称分割)。这里,对称二叉树划分可包括水平方向对称划分和垂直方向对称划分。另外,非对称二叉树划分可包括水平方向非对称划分或垂直方向非对称划分或者水平方向非对称划分和垂直方向非对称划分两者。另外,二叉树的叶节点可指CU。
由对称二叉树划分的节点可具有相同的尺寸。另外,由非对称二叉树划分的节点可具有不同的尺寸。
根据本发明的实施例,作为划分结构,可存在四叉树(QT)划分。
参照图14,可通过使用四叉树结构将一个CTU递归地划分为多个CU。可基于CU单元来确定是使用帧内预测还是帧间预测。
在示例中,一个CU可被划分为至少M个PU。这里,M可以是等于或大于2的正整数。
在另一示例中,可通过使用四叉树结构将一个CU划分为至少N个TU。这里,N可以是等于或大于2的正整数。
根据本发明的实施例,作为划分结构,可存在四叉树后二叉树划分。四叉树后二叉树划分可指优先应用四叉树划分并且然后应用二叉树划分的划分结构。这里,四叉树的叶节点或二叉树的叶节点可指CU。
在示例中,可通过使用四叉树后二叉树划分将一个CTU递归地划分为两个或四个CU。这里,当CU被划分为两个CU时,可通过使用二叉树(BT)结构来执行划分,并且当CU被划分为四个CU时,可通过使用四叉树结构来执行划分。因为CTU被四叉树划分并且然后被二叉树划分,所以CU可具有正方形形状或非正方形(矩形)形状。
当通过使用四叉树后二叉树划分来对CU进行划分时,可用信号传送第一标志(指示是否执行四叉树划分或是否执行进一步的划分或者指示是否执行四叉树划分和是否执行进一步的划分两者的信息)和第一索引(指示是执行水平对称划分还是垂直对称划分或者是否执行进一步的划分或者执行水平对称划分还是垂直对称划分和是否执行进一步的划分两者的信息)中的至少一个。这里,当第一标志指示第一值时,第一标志可指示通过使用四叉树结构来执行划分,并且当第一标志指示第二值时,第一标志可指示不执行进一步的划分。另外,当第一索引指示第一值时,第一索引可指示不执行进一步的划分,当第一索引指示第二值时,第一索引可指示水平方向对称划分,并且当第一索引指示第三值时,第一索引可指示垂直方向对称划分。当第一标志指示第二值时,可用信号传送第一索引。另外,当基于CU的尺寸或深度或者尺寸和深度两者确定CU不能被进一步划分时,可不用信号传送第一标志或第一索引或者第一标志和第一索引两者。
图15是示出根据本发明的实施例的四叉树划分后对称二叉树划分的示图。在图15中,QT划分标志可指示是否执行四叉树划分,BT划分标志可指示是否执行二叉树划分,并且BT划分类型可指示是执行水平划分(或水平方向划分)还是垂直划分(或垂直方向划分)。
参照图15,可通过使用四叉树结构来对一个CTU进行划分。另外,可通过使用二叉树结构来对四叉树的叶节点进行另外的划分。这里,四叉树的叶节点或二叉树的叶节点可指CU。
在四叉树后二叉树划分结构中,CU可被用作用于执行预测和变换的单元而无需对CU进行另外的划分。换句话说,在四叉树后二叉树划分结构中,CU、PU和TU可具有相同的尺寸。另外,可按照CU单元确定是使用帧内预测还是帧间预测。换句话说,在四叉树后二叉树划分结构中,可按照正方形块单元或非正方形(矩形)块单元执行帧内预测、帧间预测、变换、逆变换、量化、反量化、熵编码/解码以及环内滤波中的至少一个。
CU可包括一个亮度(Y)分量块和两个色度(Cb/Cr)分量块。另外,CU可包括一个亮度分量块或两个色度分量块。另外,CU可包括一个亮度分量块、Cr色度分量块或Cb色度分量块。
根据本发明的实施例,作为划分结构,可存在二叉树后四叉树划分。
根据本发明的实施例,作为划分结构,可存在四叉树和二叉树组合划分。四叉树和二叉树组合划分可指在没有优先级的情况下应用四叉树划分和二叉树划分的划分结构。在上述四叉树后二叉树划分中,优先应用四叉树划分。然而,在四叉树和二叉树组合划分中,四叉树划分不是在先的,而是可首先应用二叉树划分。
可通过使用四叉树和二叉树组合划分结构将一个CTU递归地划分为两个CU或四个CU。在四叉树和二叉树组合划分结构中,可针对一个CU应用四叉树划分或二叉树划分。这里,当CU被划分为两个时,可通过使用二叉树来执行划分,并且当CU被划分为四个时,可通过使用四叉树来执行划分。另外,因为通过使用四叉树和二叉树组合结构对CTU进行划分来获得CU,所以CU可具有正方形或非正方形(矩形)形状。
通过使用四叉树和二叉树组合形式的块划分结构,可按照具有预定的水平尺寸和垂直尺寸或者更大的水平尺寸和垂直尺寸的所有非正方形块形状对视频进行编码/解码。
CTU内的亮度信号和色度信号可通过彼此不同的块划分结构被划分。例如,在特定条带(I条带)的情况下,CTU内的亮度信号和色度信号可通过彼此不同的块划分结构被划分。在其他条带(P或B条带)的情况下,CTU内的亮度信号和色度信号可通过相同的块划分结构被划分。这里,Cb信号和Cr信号可使用不同的帧内预测模式,并且Cb信号和Cr信号中的每一个的帧内预测模式可被熵编码/解码。可通过使用Cr信号的帧内预测模式对Cb信号的帧内预测模式进行熵编码/解码。相反,可通过使用Cb信号的帧内预测模式对Cr信号的帧内预测模式进行熵编码/解码。
将对基于子块推导帧内预测信息或帧间预测信息或者帧内预测信息和帧间预测信息两者的方法进行描述。
在下文中,将对子块划分方法进行描述。
当前块(CU)可具有正方形形状或矩形形状或正方形形状和矩形形状两者,并且可指四叉树、二叉树和三划分树中的至少一个的叶节点。另外,可以以当前块(CU)的尺寸、形状和深度中的至少一个为单位执行帧内预测或帧间预测或者帧内预测和帧间预测两者、首次/二次变换和逆变换、量化、反量化、熵编码/解码以及环内滤波编码/解码中的至少一个。
当前块可被划分为对称子块或非对称子块中的至少一个或者对称子块和非对称子块两者。可针对每个子块推导帧内预测信息或帧间预测信息或者帧内预测信息和帧间预测信息两者。这里,对称子块可指通过使用利用图14描述的四叉树、二叉树和三划分树划分结构中的至少一个而获得的子块。另外,非对称子块可指通过使用将利用图16描述的划分结构获得的子块,但其不限于此。非对称子块可指子块中的具有除了正方形或矩形形状或者正方形和矩形形状两者之外的形状的至少一个子块。
在图16中,在当前块被划分为两个子块时,所述两个子块可被分别定义为第一子块和第二子块。另外,第一子块可被称为子块A,并且第二子块可被称为子块B。
在当前块被划分为对称子块或非对称子块中的至少一个或者对称子块和非对称子块两者时,子块的最小尺寸可被定义为M×N。这里,M和N可分别表示大于0的正整数。另外,M和N可具有彼此相同或不同的值。在示例中,4×4块可被定义为最小尺寸子块。
在当前块被划分为对称子块或非对称子块中的至少一个或者对称子块和非对称子块两者时,对于特定块尺寸或特定块深度或者更小的特定块尺寸/更深的特定块深度,可不进一步执行块划分。特定块尺寸或特定块深度的信息可以以视频参数集(VPS)、序列参数集(SPS)、画面参数集(PPS),并行块头、条带头、CTU和CU中的至少一个为单位进行熵编码/解码。
特定块尺寸或特定块深度的信息可针对亮度信号和色度信号中的每一个被熵编码/解码,并且可具有彼此不同的参数值。
特定块尺寸或特定块深度的信息可针对Cb和Cr信号中的每一个被熵编码/解码,并且可具有不同的参数值。
特定块深度或特定块尺寸的信息可针对每个更高等级被熵编码/解码,并且可具有不同的参数值。
可基于当前块的尺寸或当前块的深度与预定阈值之间的比较来确定特定块尺寸或特定块深度的信息。预定阈值可指确定块结构的参考尺寸或深度。另外,可以以参考尺寸或参考深度的最小值和最大值中的至少一个的形式来表示预定阈值。另外,预定阈值可以是在编码器/解码器中被预先定义的值,可基于当前块的编码参数被可变地推导出,或者可通过比特流被用信号传送。
在示例中,在当前块的尺寸或深度等于或小于(或者等于或大于)预定阈值或者当前块的尺寸和深度都等于或小于(或者等于或大于)预定阈值时,可不执行将当前块划分为至少一个子块。例如,在当前块的水平长度和垂直长度之和等于或小于预定阈值时,可不执行将当前块划分为至少一个子块。
在另一示例中,在当前块的尺寸或深度小于或大于预定阈值或者当前块的尺寸和深度都小于或大于预定阈值时,可不执行将当前块划分为至少一个子块。例如,在当前块的水平长度和垂直长度之和小于预定阈值时,可不执行将当前块划分为至少一个子块。
在另一示例中,在当前块是深度为预定阈值的四叉树叶节点时,可不执行将当前块划分为至少一个子块。
在另一示例中,在当前块是深度为预定阈值的二叉树叶节点时,可不执行将当前块划分为至少一个子块。
在另一示例中,在当前块是通过使用仿射变换公式执行运动预测/补偿的四叉树、二叉树和三划分树中的至少一个的叶节点时,可不执行将当前块划分为至少一个子块或者可不执行将当前块划分为非对称子块。
在另一示例中,在当前块是四叉树、二叉树和三划分树中的至少一个的叶节点时,可不执行通过使用双向匹配方法和模板匹配方法中的至少一个来推导帧间预测信息,可不执行将当前块划分为至少一个子块或者可不执行将当前块划分为非对称子块。
在当前块被划分为至少一个非对称子块时,子块中的至少一个可具有除了正方形或矩形之外的任意形状。
根据本发明,在当前块被划分为至少一个非对称子块时,子块中的至少一个可具有三角形块形状。
图16是示出根据本发明的实施例的非对称划分的示图。在图16中,w可表示块的水平尺寸,并且h可表示块的垂直尺寸。
在图16(a)中,在当前块被划分为两个子块时,当前块可被划分为通过按照从左上方到右下方的对角线边界对当前块进行划分而获得的三角形形状的两个子块。这里,除了当前块的右上方区域(第二子块或子块B)之外的其余区域可被定义为第一子块或子块A。
在图16(b)中,在当前块被划分为两个子块时,当前块可被划分为通过按照从右上方到左下方的对角线边界对当前块进行划分而获得的三角形形状的两个子块。这里,除了当前块的右下方区域(第二子块或子块B)之外的其余区域可被定义为第一子块或子块A。
参照图16(a)和图16(b),在当前块被划分为四个子块时,当前块可被划分为通过按照从左上方到右下方的对角线边界并按照从右上方到左下方的对角线边界对当前块进行划分而获得的四个三角形形状的子块。可选地,当前块可被划分为通过按照从右上方到左下方的对角线边界并按照从左上方到右下方的对角线边界对当前块进行划分而获得的四个三角形形状的子块。
另外,划分为三角形形状的子块的操作可被应用于当前块(CU)的运动预测/补偿方法是跳过模式和合并模式中的至少一个的情况。
在图16(c)中,在当前块被划分为两个子块时,除了当前块的右下方区域(第二子块或子块B)之外的其余区域可被定义为第一子块或子块A。
在图16(d)中,在当前块被划分为两个子块时,除了当前块的左下方区域(第二子块或子块B)之外的其余区域可被定义为第一子块或子块A。
在图16(e)中,在当前块被划分为两个子块时,除了当前块的右上方区域(第二子块或子块B)之外的其余区域可被定义为第一子块或子块A。
在图16(f)中,在当前块被划分为两个子块时,除了当前块的左上方区域(第二子块或子块B)之外的其余区域可被定义为第一子块或子块A。
在图16(g)中,在当前块被划分为两个子块时,配置有当前块的部分上方部分、部分下方部分和部分左侧部分的“[”形状的区域可被定义为第一子块或子块A。另外,除了第一子块或子块A之外的其余区域可被定义为第二子块或子块B。
在图16(h)中,在当前块被划分为两个子块时,配置有当前块的部分上方部分、部分下方部分和部分右侧部分的“]”形状的区域可被定义为第一子块或子块A。另外,除了第一子块或子块A之外的其余区域可被定义为第二子块或子块B。
在图16(i)中,在当前块被划分为两个子块时,配置有当前块的部分下方部分、部分右侧部分和部分左侧部分的“凵”形状的区域可被定义为第一子块或子块A。此外,除了第一子块或子块A之外的其余区域可被定义为第二子块或子块B。
在图16(j)中,在当前块被划分为两个子块时,配置有当前块的部分上方部分、部分右侧部分和部分左侧部分的“П”形状的区域可被定义为第一子块或子块A。另外,除了第一子块或子块A之外的其余区域可以被定义为第二子块或子块B。
在图16(k)中,在当前块被划分为两个子块时,除了当前块的中心区域(第二子块或子块B)之外的其余区域可被定义为第一子块或子块A。
另外,在图16(a)至图16(k)中定义的第一子块(或子块A)和第二子块(或子块B)可彼此互换。
编码器/解码器可存储包括多个非对称划分形式的表或列表。在编码器中确定的当前块的非对称划分形式可以以索引或标志形式被发送到解码器。另外,编码器/解码器可基于当前块的编码参数来确定当前块的非对称划分形式。另外,编码器/解码器可从当前块的邻近块确定当前块的非对称划分形式。
在当前块被划分为至少一个非对称子块时,该子块可具有水平尺寸或垂直尺寸等于或小于当前块的水平尺寸(h)或垂直尺寸(v)或者水平尺寸和垂直尺寸都等于或小于当前块的水平尺寸(h)和垂直尺寸(v)的尺寸。
在图16中,在当前块被划分为两个子块时,子块可具有小于当前块的水平尺寸或垂直尺寸或者水平尺寸和垂直尺寸小于当前块的水平尺寸和垂直尺寸。
在图16(c)至图16(f)中,在当前块被划分为两个子块时,第二子块可具有水平尺寸和垂直尺寸相对于当前块的水平尺寸(w)尺寸和垂直尺寸(h)为(3/4)×w和(3/4)×h的尺寸。
在图16(g)至图16(h)中,在当前块被划分为两个子块时,第二子块可具有水平尺寸和垂直尺寸相对于当前块的水平尺寸(w)尺寸和垂直尺寸(h)为(3/4)×w和(2/4)×h的尺寸。
在图16(i)至图16(j)中,在当前块被划分为两个子块时,第二子块可具有水平和垂直尺寸相对于当前块的水平尺寸(w)尺寸和垂直尺寸(h)为(2/4)×w和(3/4)×h的尺寸。
在图16(k)中,第二子块可具有水平尺寸和垂直尺寸相对于当前块的水平尺寸(w)和垂直尺寸(h)为(2/4)×w和(2/4)×h的尺寸。
另外,上述第二子块的水平尺寸与垂直尺寸的比率可被设置为在编码器和解码器中预先定义的比率,或者可基于从编码器向解码器用信号传送的信息被获得。
当前块(CU)可具有正方形形状或矩形形状或者正方形形状和矩形形状两者。另外,可通过使用上述方法将当前块划分为至少一个非对称子块,使得可推导出帧内预测信息或帧间预测信息或者帧内预测信息和帧间预测信息两者。这里,可以以最低等级子块单元为单位针对每个子块推导帧内预测信息或帧间预测信息或者帧内预测信息和帧间预测信息两者,并且最低等级子块可指具有预定尺寸的最小块单元。例如,4×4块的块尺寸可被定义为最低等级子块。
另外,可以以VPS、SPS、PPS、并行块头、条带头、CTU和CU中的至少一个为单位对最低等级子块的尺寸信息进行熵编码/解码。
当前块(CU)可指四叉树、二叉树和三划分树中的至少一个的叶节点,并且可以以子块的尺寸、形状和深度中的至少一个为单位执行帧内预测或帧间预测或者帧内预测和帧间预测两者、首次/二次变换和逆变换、量化、反量化、熵编码/解码以及环内滤波编码/解码中的至少一个。
当前块(CU)可指四叉树、二叉树和三划分树中的至少一个的叶节点,可以以子块的尺寸、形状和深度中的至少一个为单位来执行用于对当前块进行编码/解码的帧内/帧间预测、首次/二次变换和逆变换、量化、反量化、熵编码/解码以及环内滤波编码/解码中的至少一个编码/解码。
在示例中,当对当前块(CU)进行编码时,可以以子块的尺寸、形状和深度中的至少一个为单位来执行帧内/帧间预测。可以以当前块的尺寸、形状和深度中的至少一个为单位来执行除了帧内/帧间预测之外的首次/二次变换和逆变换、量化、反量化、熵编码/解码以及环内滤波。
在另一示例中,在当前块被划分为两个子块(例如,第一子块和第二子块)时,可从第一子块和第二子块推导不同的帧内预测信息。
在另一示例中,在当前块被划分为两个子块(例如,第一子块和第二子块)时,可从第一子块和第二子块推导不同的帧间预测信息。
在另一示例中,在当前块被划分为两个子块(例如,第一子块和第二子块)时,可从第一子块和第二子块推导组合的帧内预测信息或帧间预测信息或者组合的帧内预测信息和帧间预测信息两者。这里,可从第一子块推导帧间预测信息,并且可从第二子块推导帧内预测信息。可选地,可从第一子块推导帧内预测信息,并且可从第二子块推导帧间预测信息。
在另一示例中,当对当前块(CU)进行编码时,可以以子块的尺寸、形状和深度中的至少一个为单位来执行首次/二次变换和逆变换。可以以当前块的尺寸、形状和深度中的至少一个为单位执行除了首次/二次变换和逆变换之外的帧内预测或帧间预测或者帧内预测和帧间预测两者、量化、反量化、熵编码/解码以及环内滤波。
在另一示例中,在当前块被划分为两个子块(例如,第一子块和第二子块)时,可针对第一子块或第二子块或者第一子块和第二子块两者省略首次/二次变换和逆变换,或者可针对第一子块或第二子块或者第一子块和第二子块两者执行不同的首次/二次变换和不同的逆变换。
在另一示例中,在当前块被划分为两个子块(例如,第一子块和第二子块)时,可针对第一子块或第二子块或者第一子块和第二子块两者省略二次变换和逆变换,或者可针对第一子块或第二子块或者第一子块和第二子块两者执行不同的首次/二次变换和不同的逆变换。
在另一示例中,当对当前块(CU)进行编码时,可以以子块的尺寸、形状和深度中的至少一个为单位来执行量化和反量化。可以以当前块的尺寸、形状和深度中的至少一个为单位来执行除了量化和反量化之外的帧内预测或帧间预测或者帧内预测和帧间预测两者、首次/二次变换和逆变换、熵编码/解码以及环内滤波。
在另一示例中,在当前块被划分为两个子块(例如,第一子块和第二子块)时,可针对第一子块或第二子块或者第一子块和第二子块两者省略量化及反量化,或者可针对第一子块或第二子块或者第一子块和第二子块两者执行不同的量化和不同的反量化。
在另一示例中,在当前块被划分为两个子块(例如,第一子块和第二子块)时,可根据起初在执行编码时设置的量化参数来对第一子块进行量化,并且可通过使用与起初设置的量化参数不同的量化参数来对第二子块进行编码/解码。这里,可显式地发送使用与起初设置的量化参数不同的量化参数的第二子块的量化参数或偏移或者量化参数和偏移两者,或者可根据在编码器/解码器中设置的方法隐式地推导第二子块的量化参数或偏移或者量化参数和偏移两者。
在另一示例中,在当前块被划分为两个子块(例如,第一子块和第二子块)时,可根据起初在执行编码时设置的量化参数来对第二子块进行量化,并且可通过使用与起初设置的量化参数不同的量化参数来对第一子块进行编码/解码。这里,可显式地发送使用与起初设置的量化参数不同的量化参数的第一子块的量化参数或偏移或者量化参数和偏移两者,或者可根据在编码器/解码器中设置的方法隐式地推导第一子块的量化参数或偏移或者量化参数和偏移两者。
在另一示例中,当对当前块(CU)进行编码时,可以以子块的尺寸、形状和深度中的至少一个为单位来执行熵编码/解码。可以以当前块的尺寸、形状和深度中的至少一个为单位来执行除了熵编码/解码之外的帧内预测或帧间预测或者帧内预测和帧间预测两者、首次/二次变换和逆变换、量化和反量化以及环内滤波。
在另一示例中,当对当前块(CU)进行编码时,可以以子块的尺寸、形状和深度中的至少一个为单位来执行环内滤波。可以以当前块的尺寸、形状和深度中的至少一个为单位执行除了环内滤波之外的帧内预测或帧间预测或者帧内预测和帧间预测两者、首次/二次变换和逆变换、熵编码/解码以及量化和反量化。
在另一示例中,在当前块被划分为两个子块(例如,第一子块和第二子块)时,可针对第一子块或第二子块或者第一子块和第二子块两者省略环内滤波,或者可针对第一子块或第二子块或者第一子块和第二子块两者执行不同的环内滤波。
在当前块被划分为对称子块或非对称子块中的至少一个或者对称子块和非对称子块两者时,可通过比特流按照块(CU)单元用信号传送是否执行划分为子块的标志或子块划分类型的索引信息或者是否执行划分为子块的标志和子块划分类型的索引信息两者。可选地,可基于当前块的编码参数可变地推导是否执行划分为子块的标志或子块划分类型的索引信息或者是否执行划分为子块的标志和子块划分类型的索引信息两者。这里,可通过使用利用图16(a)至图16(k)描述的至少一个非对称子块划分类型来定义子块划分类型,并且然后可执行对当前块的编码/解码。可选地,子块划分类型可以是除了利用图16(a)至图16(k)描述的对称子块划分类型之外的在编码器/解码器中预先定义的块形状,并且子块划分类型可包括子块中的除了正方形或矩形形状或者正方形和矩形形状两者之外的至少一个任意块形状。另外,子块划分类型可包括当前块的用于被划分为子块的划分方向、子块形状、当前块与子块之间的形成关系以及子块之间的形成关系中的至少一个的信息。
例如,当使用图16(a)至图16(k)中的至少一种类型时,可通过比特流用信号传送是否基于子块执行编码和解码的标志或子块分区索引(或子块划分类型)或者所述标志和子块分区索引两者,或者可基于当前块的编码参数可变地推导是否基于子块执行编码和解码的标志或子块划分索引(或子块划分类型)或者所述标志和子块分区索引两者。这里,当显式地发送索引信息时,可使用截断莱斯(Truncated rice)二值化方法、K阶指数哥伦布二值化方法、有限K阶指数哥伦布二值化方法、固定长度二值化方法、一元二值化方法和截断一元二值化方法中的至少一个。另外,可在执行二值化之后最终通过使用CABAC(ae(v))对当前块执行编码/解码。
另外,例如,当使用图16(a)和图16(b)的至少两种类型时,可用信号传送表示是否对当前块(CU)执行按照三角形形状的子块划分的标志。
可以以VPS、SPS、PPS、并行块头、条带头、CTU和CU中的至少一个为单位用信号传送标志。此外,可在特定条带(例如,B条带)的情况下用信号传送标志。
另外,当对当前块(CU)执行三角形形状的子块划分时,可用信号传送指示将CU划分为三角形形状的子块的方向信息和三角形形状的子块的运动信息中的至少一个的索引。可基于当前块的编码参数可变地推导索引。
另外,当标志指示第一值时,该标志可指示基于三角形形状的子块的运动预测/补偿可被用于产生当前块(CU)的预测样点。另外,同时,当标志指示第一值时,可用信号传送索引。
索引范围可从0到M。M可以是大于0的正整数。例如,M可以是39。
另外,编码器/解码器可存储用于从索引推导当前块被划分为任意子块的划分方向或子块的运动信息的列表的表。
表1是示出将当前块划分为三角形形状的子块的方向的查找表的示例。可基于上述索引来推导划分为三角形形状的子块的方向。
【表1】
Figure BDA0002467041460000471
参照表1,当TriangleDir的值为第一值0时,TriangleDir可指通过按照从左上方到右下方的对角线边界对当前块进行划分而将当前块划分为两个三角形形状的子块。例如,TriangleDir可表示图16(a)的划分形式。另外,当TriangleDir的值为第二值1时,TriangleDir可指通过按照从右上方到左下方的对角线边界对当前块进行划分而将当前块划分为两个三角形形状的子块。例如,TriangleDir可表示图16(b)的划分形式。另外,第一值和第二值可彼此互换。
另外,指示子块划分的方向的索引(merge_triangle_idx)范围可从0到39。可针对当前块用信号传送索引。索引信息可与指示在稍后将在表2中描述的在每个子块中使用的合并候选的索引信息相同。
另外,在编码器中被熵编码并且在解码器中被熵解码的标志和索引中的至少一个可使用以下二值化方法中的至少一个。
截断莱斯二值化方法
K阶指数哥伦布二值化方法
有限K阶指数哥伦布二值化方法
固定长度二值化方法
一元二值化方法
截断一元二值化方法
将对推导子块之间的帧内/帧内预测信息的方法进行描述。
在当前块被划分为对称子块或非对称子块中的至少一个或者对称子块和非对称子块两者时,可通过使用从每个子块推导子块之间不同的帧间预测信息、从每个子块推导子块之间不同的帧内预测信息以及推导子块之间的组合帧内/帧间预测信息中的至少一个来推导当前块的预测信息。
帧间预测信息可指用于运动预测/补偿的运动信息中的至少一个(例如,运动矢量、帧间预测指示符、参考视频索引、POC、跳过标志、合并标志、合并索引、仿射标志、OBMC标志、双向匹配标志或模板匹配标志或者双向匹配标志和模板匹配标志两者以及BIO(双向光流)中的至少一个)。此外,帧间预测信息和运动信息可被定义为相同的含义。
帧内预测信息可指用于产生帧内预测块的帧内预测模式信息(例如,MPM标志、MPM索引、选定模式集合标志、选定模式索引和其余模式索引中的至少一个)。
可通过比特流将帧内预测信息或帧间预测信息或者帧内预测信息和帧间预测信息两者从编码器显式地发送到解码器,或者可基于当前块或子块的尺寸、形状和深度中的至少一个或者当前块和子块的尺寸、形状和深度中的至少一个可变地推导帧内预测信息或帧间预测信息或者帧内预测信息和帧间预测信息两者。另外,可基于当前块或子块或者当前块和子块两者的编码参数可变地推导帧内预测信息或帧间预测信息或者帧内预测信息和帧间预测信息两者,或者可通过比特流用信号传送帧内预测信息或帧间预测信息或者帧内预测信息和帧间预测信息两者。
将对推导子块之间的帧间预测信息的方法进行描述。
在当前块被划分为对称子块或非对称子块中的至少一个或者对称子块和非对称子块两者时,可从每个子块推导子块之间不同的帧间预测信息。这里,可通过使用用于每个子块的跳过模式、合并模式、AMVP模式、使用仿射变换公式、双向匹配、模板匹配的运动预测/补偿以及基于OBMC的运动预测/补偿中的至少一种帧间预测方法来推导帧间预测信息。
在图16中,在当前块被划分为两个子块时,可从第一子块(或子块A)或第二子块(或子块B)推导不同的帧间预测信息。当推导第一子块的帧间预测信息时,可通过使用用于每个子块的跳过模式、合并模式、AMVP模式、使用仿射变换公式、双向匹配、模板匹配的运动预测/补偿以及基于OBMC的运动预测/补偿中的至少一个帧间预测方法来推导运动信息。另外,当推导第二子块的预测信息时,可通过使用用于每个子块的跳过模式、合并模式、AMVP模式、使用仿射变换公式、双向匹配、模板匹配的运动预测/补偿以及基于OBMC的运动预测/补偿中的至少一个帧间预测方法来推导运动信息。
在图16中,在当前块被划分为两个子块时,可以以最低等级子块为单位从每个子块推导运动信息。这里,最低等级子块可表示具有预定尺寸的最小块单元。例如,4×4块的块尺寸可被定义为最低等级子块。
在图16中,在当前块被划分为两个子块时,可根据每个子块形状对所有子块执行基于跳过模式的不同的运动预测/补偿。这里,可显式地发送当前块的两条不同的运动信息(例如,跳过标志或合并索引信息中的至少一个或者跳过标志和合并索引信息两者以及POC)。
在图16中,在当前块被划分为两个子块时,可根据每个子块形状针对所有子块执行基于合并模式的不同的运动预测/补偿。这里,可显式地发送当前块的两条不同的运动信息(例如,合并标志或合并索引信息中的至少一个或者跳过标志和合并索引信息两者以及POC)。
在图16(a)或图16(b)或者图16(a)和图16(b)两者中,在当前块被划分为两个三角形形状的子块时,可基于不同的运动信息来执行针对第一子块或第二子块或者第一子块和第二子块两者的基于合并模式的运动预测/补偿。这里,可通过基于每个子块的不同的合并候选配置合并候选列表来推导当前块的两条不同的运动信息。例如,可通过配置包括空间合并候选、时间合并候选、组合合并候选、零合并候选等的合并候选列表并且通过使用每个子块的不同的合并候选来推导当前块的运动信息。N可表示大于0的自然数值。当配置合并候选列表时,当相应的合并候选包括双向运动信息时,配置有单向预测候选的合并候选列表可被配置以减少存储器带宽。例如,针对双向运动信息,可将L0或L1运动信息添加到列表,或者可将L0和L1运动信息的平均值或加权和添加到列表。另外,当使用用于每个子块的不同的合并候选时,可使用预定义值。
在示例中,当使用用于每个子块的不同的合并候选时,针对第一子块(或子块A),可使用合并候选列表内的第N候选,并且针对第二子块(或子块B),可使用合并候选列表内的第M候选。N和M可以是包括0的自然数,并且N和M可彼此相同或不同。另外,N和M可以是在编码器/解码器中预先定义的值。
在另一示例中,当使用用于每个子块的不同的合并候选时,针对与每个子块相关联的合并候选(或合并候选的索引信息),可定义并使用合并候选组(或合并候选组列表或表)。合并候选组可包括用于每个子块的一对合并候选作为元素。另外,当配置有空间合并候选、时间合并候选、组合合并候选、零合并候选等的合并候选的数量是N时,与每个子块相关联的每个合并候选可具有从0到N-1的值。这里,N是包括0的自然数。
表2示出表示在每个子块中使用的合并候选的查找表的示例。
【表2】
Figure BDA0002467041460000501
参照表2,如图16(a)或图16(b)中所示,在当前块被划分为两个三角形形状的子块时,A可表示第一子块(或子块A),并且B可表示第二子块(或子块B)。另外,当配置有空间合并候选、时间合并候选,组合合并候选、零合并候选等的合并候选的数量是5时,A和B可分别具有从0到4的值。
另外,指示被映射到每个子块的合并候选的索引信息的索引(merge_triangle_idx)范围可以是从0到M。M可以是大于0的正整数。例如,在表2中,M可以是39。可针对当前块用信号传送索引。因此,可基于索引推导子块的运动信息。另外,索引信息可与表1中描述的指示子块的划分方向信息的索引信息相同。
另外,编码器/解码器可存储用于从索引推导当前块被划分为任意子块的划分方向或子块的运动信息的表或列表。
在图16中,在当前块被划分为两个子块时,可针对第一子块执行基于双向匹配的运动预测/补偿,并且可针对第二子块执行基于模板匹配的运动预测/补偿。这里,可从编码器显式地发送每个子块的运动信息(例如,运动矢量、帧间预测指示符、参考视频索引和POC中的至少一个),或者可在编码器/解码器中隐式地推导每个子块的运动信息(例如,运动矢量、帧间预测指示符、参考视频索引和POC中的至少一个)。
在图16中,在当前块被划分为两个子块时,可针对第一子块执行基于模板匹配的运动预测/补偿,并且可针对第二子块执行基于双向匹配的运动预测/补偿。这里,可从编码器显式地发送每个子块的运动信息(例如,运动矢量、帧间预测指示符、参考视频索引和POC中的至少一个),或者可在编码器/解码器中隐式地推导每个子块的运动信息(例如,运动矢量、帧间预测指示符、参考视频索引和POC中的至少一个)。
在图16中,在当前块被划分为两个子块时,可通过使用在空间上相邻的块的运动信息来执行针对第一子块的运动预测/补偿,并且可通过使用跳过模式、合并模式、AMVP模式、仿射变换公式和基于双向匹配、模板匹配的运动预测/补偿和基于OBMC的运动预测/补偿中的至少一个帧间预测方法来推导第二子块的帧间预测信息。
在图16中,在当前块被划分为两个子块时,可通过使用在空间上相邻的块的运动信息来执行针对第二子块的运动预测/补偿,并且可通过使用跳过模式、合并模式、AMVP模式、仿射变换公式和基于双向匹配、模板匹配的运动预测/补偿以及基于OBMC的运动预测/补偿中的至少一个帧间预测方法来推导第一子块的帧间预测信息。
另外,通过使用在空间上相邻的块的运动信息,可以以具有预定尺寸的最低等级子块为单位来推导第一子块或第二子块或者第一子块和第二子块两者的用于执行运动预测/补偿的运动信息。
图17是示出根据本发明的实施例的通过使用最低等级子块来推导子块的运动预测信息的方法的示图。
在图16(c)中,在当前块被划分为两个非对称子块并且通过使用在空间上相邻的块的运动信息来执行针对第一子块的运动预测/补偿时,参照图17,以第一子块的最低等级子块为单位来执行针对第一子块的运动预测/补偿,因此可将位于最低等级子块的左侧或上方或者左侧和上方两者处的在空间上相邻的最低等级子块的运动信息隐式地推导为第一子块的运动信息。这里,最低等级子块的尺寸可以是4×4。这里,可通过使用AMVP模式显式地推导第二子块的运动信息。
在图17中,可通过使用在空间上相邻的左侧、上方和左上方最低等级子块的运动信息中的至少一个来推导第一子块的最低等级子块中的左上方最低等级子块的运动信息。这里,左上方最低等级子块的运动信息可使用在空间上相邻的左侧、上方和左上方最低等级子块中的一个最低等级子块的运动信息,或者可基于多达三个相邻的最低等级子块的平均值、众数、加权和中的至少一个来推导运动信息。
在图17中,可通过使用在空间上相邻的左侧最低等级子块或上方最低等级子块中的至少一个或者左侧最低等级子块和上方最低等级子块两者来推导第一子块的最低等级子块的运动信息。
在图17中,当运动信息不存在于在空间上相邻的左侧最低等级子块或上方最低等级子块或者左侧最低等级子块和上方最低等级子块两者中时,针对第一子块的最低等级子块的运动信息,可在与在空间上相邻的左侧最低等级子块或上方最低等级子块或者左侧最低等级子块和上方最低等级子块两者相邻的左侧最低等级子块或上方最低等级子块或者左侧最低等级子块和上方最低等级子块两者中推导运动信息。
在图17中,当运动信息不存在在空间上相邻的左侧最低等级子块或上方最低等级子块或者左侧最低等级子块和上方最低等级子块两者中时,可利用通过使用AMVP模式推导出的第二子块的运动信息来代替第一子块的最低等级子块的运动信息。
在图16中,在当前块被划分为两个子块时,可通过使用合并候选列表的运动信息来执行针对第一子块的运动预测/补偿,并且可通过使用跳过模式、合并模式、AMVP模式、仿射变换公式和基于双向匹配、模板匹配的运动预测/补偿和基于OBMC的运动预测/补偿中的至少一个帧间预测方法来推导第二子块的帧间预测信息。可选地,可通过使用合并候选列表的运动信息来执行针对第二子块的运动预测/补偿,并且可通过使用跳过模式、合并模式、AMVP模式、仿射变换公式和基于双向匹配、模板匹配的运动预测/补偿和基于OBMC的运动预测/补偿中的至少一个帧间预测方法来推导第一子块的帧间预测信息。
根据上述示例,通过使用合并候选列表的运动信息中的至少一个,可以以具有预定尺寸的最低等级子块为单位来推导运动预测/补偿被执行的第一子块或第二子块或者第一子块和第二子块两者的运动信息。
在图16(c)中,在当前块被划分为两个非对称子块时,可通过使用合并候选列表的运动信息中的至少一个来隐式地推导第一子块的运动信息。
在示例中,当前块的合并候选列表的第一条运动信息可被推导为第一子块的运动信息。
在另一示例中,可通过使用在图9的A0、A1、B0、B1、B2、C3和H中推导的运动信息中的至少一个来推导第一子块的运动信息。
在另一示例中,可通过使用在图9的A0、A1和B2中推导的运动信息中的至少一个来推导位于第一子块的左侧处的最低等级子块的运动信息。另外,可通过使用在图9的B0、B1和B2中推导的运动信息中的至少一个来推导位于第一子块的上方处的最低等级子块的运动信息。
在图16中,在当前块被划分为两个子块时,可通过使用在AMVP模式中使用的运动信息来执行针对第一子块的运动预测/补偿,并且可通过使用跳过模式、合并模式、AMVP模式、仿射变换公式和基于双向匹配、模板匹配的运动预测/补偿和基于OBMC的运动预测/补偿中的至少一个帧间预测方法来推导第二子块的帧间预测信息。可选地,可通过使用在AMVP模式中使用的运动信息来执行针对第二子块的运动预测/补偿,并且可通过使用跳过模式、合并模式、AMVP模式、仿射变换公式和基于双向匹配、模板匹配的运动预测/补偿和基于OBMC的运动预测/补偿中的至少一个帧间预测方法来推导第一子块的帧间预测信息。
根据上述示例,通过使用在AMVP模式中使用的运动信息中的至少一个,可以以具有预定尺寸的最低等级子块为单位推导运动预测/补偿被执行的第一子块或第二子块或者第一子块和第二子块两者的运动信息。
在图16(a)中,在当前块被划分为两个非对称子块时,可通过使用在AMVP模式中使用的运动矢量候选列表的运动信息中的至少一个来隐式地推导第一子块的运动信息。
在示例中,可将在当前块的AMVP模式中使用的运动矢量候选列表的第一条运动信息推导为第一子块的运动信息。
在另一示例中,可通过使用零运动矢量推导第一子块的运动信息。
在下文中,将对推导子块之间的帧内预测信息的方法进行描述。
在当前块被划分为对称子块或非对称子块中的至少一个或者对称子块和非对称子块两者时,可从每个子块推导子块之间不同的帧内预测信息。这里,针对当前块的子块,可以以最低等级子块为单位来推导不同的帧内预测信息。最低等级子块可指具有预定尺寸的最小块单元。4×4块尺寸可被定义为最低等级子块的尺寸。
在图16中,在当前块被划分为两个子块时,可以以具有预定尺寸的最低等级子块为单位从第一子块(或子块A)或第二子块(或子块B)推导帧内预测信息。
在图16(c)中,当通过使用在空间上相邻的块的帧内预测信息针对第一子块执行帧内预测时,参照图17,可以以第一子块的最低等级子块为单位来执行针对第一子块的运动预测/补偿,并且因此可将位于最低等级子块的左侧或上方或者左侧和上方两者处的在空间上相邻的最低等级子块的帧内预测信息隐式地推导为第一子块的运动信息。这里,最低等级子块的尺寸可以是4×4。这里,针对第二子块的帧内预测信息,可通过使用与当前块相邻的参考样点隐式地推导使第二子块的失真最小化的帧内预测模式信息。
例如,针对失真,可通过使用与当前块相邻的参考样点来产生当前块尺寸的预测块,并且可将在实际的第二子块区域中的SAD(绝对差和)或SATD(绝对变换差和)或者SAD(绝对差和)和SATD(绝对变换差和)两者成为最小值的帧内预测模式推导为第二子块的帧内预测模式。
在图17中,可通过使用在空间上相邻的左侧、上方和左上方最低等级子块的帧内预测模式信息中的至少一个来推导第一子块的最低等级子块中的左上方最低等级子块的帧内预测模式。这里,可将在空间上相邻的左侧、上方和左上方最低等级子块中的一个最低等级子块的帧内预测模式信息用作左上方最低等级子块的帧内预测模式信息。可选地,可通过使用邻近的最低等级子块的多达三条帧内预测模式的平均值、众数、加权和中的至少一个来推导当前最低等级子块的帧内预测模式信息。
在图17中,可通过使用在空间上相邻的左侧最低等级子块或上方最低等级子块中的至少一个或者左侧最低等级子块和上方最低等级子块两者来推导第一子块的最低等级子块的帧内预测模式信息。
在图17中,当帧内预测模式信息不存在于在空间上相邻的左侧最低等级子块或上方最低等级子块或者左侧最低等级子块和上方最低等级子块两者中时,可在与在空间上相邻的左侧最低等级子块或上方最低等级子块或者左侧最低等级子块和上方最低等级子块两者相邻的最低等级子块中推导第一子块的最低等级子块的帧内预测模式信息。邻近可以是在左侧或上方或者左侧和上方两侧。
在图17中,当帧内预测模式信息不存在于在空间上相邻的左侧最低等级子块或上方最低等级子块或者左侧最低等级子块和上方最低等级子块两者中时,可利用在第二子块中推导的帧内预测模式信息来替换第一子块的最低等级子块的帧内预测模式信息。
当产生第一子块的帧内预测块时,以最低等级子块为单位,可在产生至少一个帧内预测块之后通过使用预测块的加权和来产生最终预测块。
例如,根据上述方法,可通过使用以最低等级子块为单位在第一子块中隐式推导出的帧内预测模式来产生预测块(pred_1),然后可通过将在第二子块中推导的帧内预测模式应用于第一子块的最低等级子块来产生预测块(pred_2)。随后,可通过pred_1或pred_2或者pred_1和pred_2两者的加权和或平均值来产生第一子块的最低等级子块的预测块。
在下文中,将对推导子块之间的组合帧内/帧间预测信息的方法进行描述。
在当前块被划分为对称子块或非对称子块中的至少一个或者对称子块和非对称子块两者时,可从每个子块推导子块之间不同的帧内预测信息或帧间预测信息或者帧内预测信息和帧间预测信息。这里,针对当前块的子块,可以以最低等级子块为单位推导帧内预测信息或帧间预测信息或者不同的帧内预测信息和帧间预测信息两者。最低等级子块可指具有预定尺寸的最小块单元。4×4块尺寸可被定义为最低等级子块的尺寸。
在图16中,在当前块被划分为两个子块时,可从第一子块推导帧内预测信息,并且可从第二子块推导帧间预测信息。
在图16中,在当前块被划分为两个子块时,可从第一子块以最低等级子块为单位推导帧内预测信息,并且可从第二子块推导帧间预测信息。
在图16中,在当前块被划分为两个子块时,可从第一子块推导帧内预测信息,并且可从第二子块以最低等级子块为单位推导帧间预测信息。
在图16中,在当前块被划分为两个子块时,可从第一子块以最低等级子块为单位推导帧内预测信息,并且可从第二子块以最低等级子块为单位推导帧间预测信息。
在图16中,在当前块被划分为两个子块时,可从第一子块推导帧间预测信息,并且可从第二子块推导帧内预测信息。
在图16中,在当前块被划分为两个子块时,可从第一子块以最低等级子块为单位推导帧间预测信息,并且可从第二子块推导帧内预测信息。
在图16中,在当前块被划分为两个子块时,可从第一子块推导帧间预测信息,并且可从第二子块以最低等级子块为单位推导帧内预测信息。
在图16中,在当前块被划分为两个子块时,可从第一子块以最低等级子块为单位推导帧间预测信息,并且可从第二子块以最低等级子块为单位推导帧内预测信息。
图18是根据本发明的实施例的视频编码方法的流程图的示图。
参照图18,在S1801,编码器可根据块划分结构将编码单元划分为多个子单元。
另外,块划分结构可以是划分被执行使得包括具有除了正方形形状和矩形形状之外的预定块形状的至少一个子单元的块划分结构。
另外,块划分结构可以是划分被执行使得编码单元被划分为包括三角形形状的子单元的块划分结构。
另外,三角形形状可以是以下中的至少一个:通过按照从编码单元的左上方到右下方的对角线边界进行划分而获得的三角形形状和通过按照从编码单元的右上方到左下方的对角线边界进行划分而获得的三角形形状。
另外,可基于表示编码单元是否被划分的标志来确定块划分结构。
另外,可基于表示编码单元是否被划分的标志和表示子单元的划分类型的索引来确定块划分结构。
另外,子单元的划分类型可表示子单元的划分方向。
随后,在S1802,编码器可基于子单元执行编码。
另外,编码器可通过基于子单元执行帧内预测和帧间预测中的至少一个的预测来执行编码。另外,编码器可通过基于子单元执行变换和量化中的至少一个来执行编码。此外,编码器可按照子单元的最低等级子单元执行编码。
根据本发明的记录介质可存储通过视频编码方法产生的比特流,其中,所述方法包括:根据块划分结构将编码单元划分为多个子单元;并且基于子单元执行编码,其中,块划分结构包括具有除了正方形形状和矩形形状之外的预定块形状的至少一个子单元。
可在编码器和解码器中以相同的方法执行以上实施例。
应用以上实施例的顺序可在编码器与解码器之间不同,或者应用以上实施例的顺序可在编码器和解码器中相同。
可对每个亮度信号和色度信号执行以上实施例,或者可对亮度信号和色度信号相同地执行以上实施例。
应用本发明的以上实施例的块形状可具有正方形形状或非正方形形状。
可依据编码块、预测块、变换块、块、当前块、编码单元、预测单元、变换单元、单元和当前单元中的至少一个的尺寸来应用本发明的以上实施例。这里,尺寸可被定义为使得以上实施例被应用的最小尺寸或最大尺寸或者最小尺寸和最大尺寸两者,或者可被定义为以上实施例被应用于的固定尺寸。此外,在以上实施例中,可将第一实施例应用于第一尺寸,并且可将第二实施例应用于第二尺寸。换句话说,可依据尺寸组合地应用以上实施例。此外,当尺寸等于或大于最小尺寸且等于或小于最大尺寸时,可应用以上实施例。换句话说,当块尺寸被包括在特定范围内时,可应用以上实施例。
例如,在当前块的尺寸是8×8或更大时,可应用以上实施例。例如,在当前块的尺寸为4×4或更大时,可应用以上实施例。例如,在当前块的尺寸是16×16或更大时,可应用以上实施例。例如,在当前块的尺寸等于或大于16×16且等于或小于64×64时,可应用以上实施例。
可依据时间层来应用本发明的以上实施例。为了识别以上实施例可被应用于的时间层,可用信号传送相应标识符,并且可将以上实施例应用于由相应标识符标识的指定时间层。这里,所述标识符可被定义为以上实施例可被应用于的最低层或最高层或最低层和最高层两者,或者可被定义为指示实施例被应用于的特定层。此外,可定义实施例被应用于的固定时间层。
例如,在当前图像的时间层是最低层时,可应用以上实施例。例如,在当前图像的时间层标识符是1时,可应用以上实施例。例如,在当前图像的时间层是最高层时,可应用以上实施例。
可定义本发明的以上实施例被应用于的条带类型,并且可根据相应的条带类型来应用以上实施例。
在上述实施例中,基于具有一系列步骤或单元的流程图描述了方法,但是本发明不限于这些步骤的顺序,而是,一些步骤可与其他步骤同时执行或以不同的顺序执行。此外,本领域的普通技术人员应该理解,流程图中的步骤并不互相排斥,并且在不影响本发明的范围的情况下,可将其他步骤添加到流程图或者可将步骤中的一些步骤从流程图删除。
实施例包括示例的各个方面。可不描述各个方面的所有可能组合,但是本领域技术人员将能够认识到不同的组合。因此,本发明可包括权利要求范围内的所有替换、修改和改变。
本发明的实施例可以以程序指令的形式实现,其中,该程序指令可由各种计算机组件执行并且被记录在计算机可读记录介质中。计算机可读记录介质可单独地包括程序指令、数据文件、数据结构等,或者可包括程序指令、数据文件、数据结构等的组合。记录在计算机可读记录介质中的程序指令可以是为本发明专门设计和构建的,或者对于计算机软件技术领域的普通技术人员是公知的。计算机可读记录介质的示例包括磁记录介质(诸如,硬盘、软盘和磁带)、光学数据存储介质(诸如,CD-ROM或DVD-ROM)、磁光介质(诸如软光盘)以及被专门构造为存储和实现程序指令的硬件装置(诸如,只读存储器(ROM)、随机存取存储器(RAM)、闪存等)。程序指令的示例不仅包括由编译器格式化的机械语言代码,而且包括可由计算机使用解释器来实现的高级语言代码。硬件装置可被配置为由一个或更多个软件模块操作或者反之亦然,以实施根据本发明的处理。
尽管已经在特定项目(诸如,详细元件)以及有限的实施例和附图方面描述了本发明,但是它们仅被提供以帮助更全面地理解本发明,并且本发明不限于以上实施例。本发明所属领域的技术人员将理解,可对以上描述进行各种修改和改变。
因此,本发明的精神将不应限于上述实施例,并且权利要求及其等同形式的整个范围将落入本发明的范围和精神内。
工业适用性
本发明可被用于对图像进行编码/解码。

Claims (20)

1.一种对视频进行解码的方法,所述方法包括:
根据块划分结构将编码单元划分为多个子单元;并且
基于所述子单元执行解码,
其中,所述块划分结构是执行划分以包括具有除了正方形形状和矩形形状之外的预定块形状的至少一个子单元的块划分结构。
2.如权利要求1所述的方法,其中,基于所述子单元执行解码的步骤包括:通过基于所述子单元执行帧内预测和帧间预测中的至少一个来执行解码。
3.如权利要求1所述的方法,其中,基于所述子单元执行解码的步骤包括:通过基于所述子单元执行逆变换和反量化中的至少一个来执行解码。
4.如权利要求1所述的方法,其中,所述块划分结构是对编码单元进行划分以包括三角形形状的子单元的块划分结构。
5.如权利要求4所述的方法,其中,所述三角形形状是通过按照从编码单元的左上方到右下方的对角线边界对编码单元进行划分而获得的三角形形状和通过按照从编码单元的右上方到左下方的对角线边界对编码单元进行划分而获得的三角形形状中的至少一个。
6.如权利要求1所述的方法,其中,所述块划分结构是基于表示编码单元是否被划分的标志被确定的。
7.如权利要求1所述的方法,其中,所述块划分结构是基于表示编码单元是否被划分的标志和表示所述子单元的划分类型的索引被确定的。
8.如权利要求7所述的方法,其中,所述子单元的划分类型表示所述子单元的划分方向。
9.如权利要求1所述的方法,其中,基于所述子单元执行解码的步骤包括:以所述子单元的最低等级子单元为单位执行解码。
10.一种对视频进行编码的方法,所述方法包括:
根据块划分结构将编码单元划分为多个子单元;并且
基于所述子单元执行编码,
其中,所述块划分结构是执行划分以包括具有除了正方形形状和矩形形状之外的预定块形状的至少一个子单元的块划分结构。
11.如权利要求10所述的方法,其中,基于所述子单元执行编码的步骤包括:通过基于所述子单元执行帧内预测和帧间预测中的至少一个来执行编码。
12.如权利要求10所述的方法,其中,基于所述子单元执行编码的步骤包括:通过基于所述子单元执行变换和量化中的至少一个来执行编码。
13.如权利要求1所述的方法,其中,所述块划分结构是对编码单元进行划分以包括三角形形状的子单元的块划分结构。
14.如权利要求13所述的方法,其中,所述三角形形状是通过按照从编码单元的左上方到右下方的对角线边界对编码单元进行划分而获得的三角形形状和通过按照从编码单元的右上方到左下方的对角线边界对编码单元进行划分而获得的三角形形状中的至少一个。
15.如权利要求10所述的方法,其中,所述块划分结构是基于表示编码单元是否被划分的标志被确定的。
16.如权利要求10所述的方法,其中,所述块划分结构是基于表示编码单元是否被划分的标志和表示所述子单元的划分类型的索引被确定的。
17.如权利要求16所述的方法,所述子单元的划分类型表示所述子单元的划分方向。
18.如权利要求10所述的方法,其中,基于所述子单元执行编码的步骤包括:以所述子单元的最低等级子单元为单位执行编码。
19.如权利要求18所述的方法,其中,所述最低等级子单元的尺寸为4×4。
20.一种存储通过视频编码方法产生的比特流的计算机可读记录介质,其中,所述方法包括:根据块划分结构将编码单元划分为至少一个子单元;并且
基于所述子单元执行编码,
其中,所述块划分结构是执行划分以包括具有除了正方形形状和矩形形状之外的预定块形状的至少一个子单元的块划分结构。
CN201880069795.8A 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置 Active CN111279695B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN202410332565.3A CN118214854A (zh) 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置
CN202410332701.9A CN118214855A (zh) 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置
CN202410333876.1A CN118214857A (zh) 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置
CN202410332710.8A CN118214856A (zh) 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置
CN202410332520.6A CN118214853A (zh) 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20170140206 2017-10-26
KR10-2017-0140206 2017-10-26
PCT/KR2018/012861 WO2019083334A1 (ko) 2017-10-26 2018-10-26 비대칭 서브 블록 기반 영상 부호화/복호화 방법 및 장치

Related Child Applications (5)

Application Number Title Priority Date Filing Date
CN202410332701.9A Division CN118214855A (zh) 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置
CN202410332710.8A Division CN118214856A (zh) 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置
CN202410332565.3A Division CN118214854A (zh) 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置
CN202410333876.1A Division CN118214857A (zh) 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置
CN202410332520.6A Division CN118214853A (zh) 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置

Publications (2)

Publication Number Publication Date
CN111279695A true CN111279695A (zh) 2020-06-12
CN111279695B CN111279695B (zh) 2024-03-29

Family

ID=66246581

Family Applications (6)

Application Number Title Priority Date Filing Date
CN202410332710.8A Pending CN118214856A (zh) 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置
CN202410332701.9A Pending CN118214855A (zh) 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置
CN202410333876.1A Pending CN118214857A (zh) 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置
CN202410332565.3A Pending CN118214854A (zh) 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置
CN202410332520.6A Pending CN118214853A (zh) 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置
CN201880069795.8A Active CN111279695B (zh) 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置

Family Applications Before (5)

Application Number Title Priority Date Filing Date
CN202410332710.8A Pending CN118214856A (zh) 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置
CN202410332701.9A Pending CN118214855A (zh) 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置
CN202410333876.1A Pending CN118214857A (zh) 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置
CN202410332565.3A Pending CN118214854A (zh) 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置
CN202410332520.6A Pending CN118214853A (zh) 2017-10-26 2018-10-26 用于基于非对称子块的图像编码/解码的方法及装置

Country Status (4)

Country Link
US (2) US11563954B2 (zh)
KR (1) KR20190046704A (zh)
CN (6) CN118214856A (zh)
WO (1) WO2019083334A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022117030A1 (en) * 2020-12-02 2022-06-09 Zhejiang Dahua Technology Co., Ltd. Systems and method for inter prediction based on a merge mode

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11516513B2 (en) * 2018-03-14 2022-11-29 Mediatek Inc. Method and apparatus of optimized splitting structure for video coding
TWI752331B (zh) 2018-06-29 2022-01-11 大陸商北京字節跳動網絡技術有限公司 當向Merge/AMVP添加HMVP候選時的部分/完全修剪
GB2588531B (en) 2018-06-29 2023-02-01 Beijing Bytedance Network Tech Co Ltd Concept of using one or multiple look up tables to store motion information of previously coded in order and use them to code following blocks
CN114125450B (zh) 2018-06-29 2023-11-17 北京字节跳动网络技术有限公司 一种用于处理视频数据的方法、装置和计算机可读介质
KR20240007298A (ko) 2018-06-29 2024-01-16 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 Lut에서의 모션 후보들의 검사 순서
KR102627814B1 (ko) 2018-06-29 2024-01-23 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 룩업 테이블의 업데이트: fifo, 제약된 fifo
TWI728390B (zh) 2018-06-29 2021-05-21 大陸商北京字節跳動網絡技術有限公司 查找表尺寸
CN114466197A (zh) 2018-06-29 2022-05-10 北京字节跳动网络技术有限公司 用于查找表更新的编码的运动信息的选择
EP3794824A1 (en) 2018-06-29 2021-03-24 Beijing Bytedance Network Technology Co. Ltd. Conditions for updating luts
TWI719526B (zh) 2018-07-02 2021-02-21 大陸商北京字節跳動網絡技術有限公司 查找表的更新
TWI820211B (zh) 2018-09-12 2023-11-01 大陸商北京字節跳動網絡技術有限公司 取決於總數減去k的開始檢查hmvp候選的條件
CN117768658A (zh) * 2018-11-06 2024-03-26 北京字节跳动网络技术有限公司 依赖位置的对运动信息的存储
CN113170183B (zh) * 2018-11-22 2024-04-02 北京字节跳动网络技术有限公司 用于具有几何分割的帧间预测的修剪方法
EP3900353A2 (en) * 2018-12-17 2021-10-27 InterDigital VC Holdings, Inc. Combining motion vector difference coding tools with other motion modes
CN113243108A (zh) * 2018-12-25 2021-08-10 北京达佳互联信息技术有限公司 利用三角形形状预测单元的视频编解码
WO2020135465A1 (en) 2018-12-28 2020-07-02 Beijing Bytedance Network Technology Co., Ltd. Modified history based motion prediction
CN116647694A (zh) * 2019-01-02 2023-08-25 北京大学 候选mv列表构建方法和装置
WO2020141833A1 (ko) * 2019-01-02 2020-07-09 디지털인사이트 주식회사 영상 복호화 방법, 영상 부호화 방법, 영상 복호화 장치, 영상 부호화 장치 및 컴퓨터 판독 가능한 기록 매체
JP7275286B2 (ja) 2019-01-10 2023-05-17 北京字節跳動網絡技術有限公司 Lut更新の起動
CN113383554B (zh) 2019-01-13 2022-12-16 北京字节跳动网络技术有限公司 LUT和共享Merge列表之间的交互
WO2020147772A1 (en) 2019-01-16 2020-07-23 Beijing Bytedance Network Technology Co., Ltd. Motion candidates derivation
KR102641302B1 (ko) * 2019-03-08 2024-02-27 가부시키가이샤 제이브이씨 켄우드 동화상 부호화 장치, 동화상 부호화 방법 및, 동화상 부호화 프로그램, 동화상 복호 장치, 동화상 복호 방법, 동화상 복호 프로그램 및 비트 스트림
US10742972B1 (en) * 2019-03-08 2020-08-11 Tencent America LLC Merge list construction in triangular prediction
WO2020182213A1 (en) * 2019-03-13 2020-09-17 Beijing Bytedance Network Technology Co., Ltd. Sub-block transform in transform skip mode
AU2020240048B2 (en) * 2019-03-18 2022-12-22 Tencent America LLC Method and apparatus for video coding
CN113615193B (zh) 2019-03-22 2024-06-25 北京字节跳动网络技术有限公司 Merge列表构建和其他工具之间的交互
KR20200144070A (ko) * 2019-06-17 2020-12-28 한국전자통신연구원 서브 블록 분할 기반 영상 부호화/복호화 방법 및 장치
CN114026864B (zh) * 2019-06-21 2023-07-07 华为技术有限公司 用于几何分割模式的色度样本权重推导
WO2021003126A1 (en) * 2019-07-02 2021-01-07 Beijing Dajia Internet Information Technology Co., Ltd. Methods and apparatuses for video coding using triangle partition
CN114303380B (zh) * 2019-08-27 2024-04-09 华为技术有限公司 用于几何划分标志的索引的cabac译码的编码器、解码器及对应方法
US11412264B2 (en) * 2019-09-24 2022-08-09 Qualcomm Incorporated Parameter set signaling for video coding
EP4022908A4 (en) * 2019-09-25 2022-11-09 Huawei Technologies Co., Ltd. METHOD AND DEVICE FOR SIMPLIFIED GEOMETRIC FUSION MODE FOR INTERPREDICTION
EP4022902A4 (en) * 2019-09-25 2022-11-23 Huawei Technologies Co., Ltd. TRIANGULAR FUSION MODE HARMONIZATION WITH WEIGHTED PREDICTION
WO2020251414A2 (en) * 2019-09-29 2020-12-17 Huawei Technologies Co., Ltd. Method and apparatus of generating weighting masks for integer-slope split directions in inter prediction
KR20220070530A (ko) * 2019-10-10 2022-05-31 베이징 다지아 인터넷 인포메이션 테크놀로지 컴퍼니 리미티드 삼각형 분할을 이용한 비디오 코딩을 위한 방법 및 장치
WO2021107532A1 (ko) * 2019-11-26 2021-06-03 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2021104433A1 (en) 2019-11-30 2021-06-03 Beijing Bytedance Network Technology Co., Ltd. Simplified inter prediction with geometric partitioning
WO2021129694A1 (en) 2019-12-24 2021-07-01 Beijing Bytedance Network Technology Co., Ltd. High level syntax for inter prediction with geometric partitioning
WO2021200658A1 (ja) * 2020-04-02 2021-10-07 シャープ株式会社 動画像復号装置及び動画像復号方法
US11818395B2 (en) 2021-04-22 2023-11-14 Electronics And Telecommunications Research Institute Immersive video decoding method and immersive video encoding method
WO2023059100A1 (ko) * 2021-10-06 2023-04-13 현대자동차주식회사 기하학적 분할 모드를 이용한 비디오 부호화/복호화 방법 및 장치
WO2023195765A1 (ko) * 2022-04-07 2023-10-12 현대자동차주식회사 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
EP4258665A1 (en) * 2022-04-07 2023-10-11 Beijing Xiaomi Mobile Software Co., Ltd. Encoding/decoding video picture data

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120147961A1 (en) * 2010-12-09 2012-06-14 Qualcomm Incorporated Use of motion vectors in evaluating geometric partitioning modes
CN106375765A (zh) * 2010-12-06 2017-02-01 Sk电信有限公司 通过使用任意块的帧间预测编码/解码图像的方法和装置
KR20170023921A (ko) * 2017-02-24 2017-03-06 에스케이텔레콤 주식회사 다양한 형태의 블록 분할을 이용하는 영상 부호화/복호화 장치 및 방법

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6711211B1 (en) 2000-05-08 2004-03-23 Nokia Mobile Phones Ltd. Method for encoding and decoding video information, a motion compensated video encoder and a corresponding decoder
CN102215396A (zh) 2010-04-09 2011-10-12 华为技术有限公司 一种视频编解码方法和系统
DK2924995T3 (en) * 2010-07-09 2018-10-01 Samsung Electronics Co Ltd PROCEDURE FOR VIDEO DECODING, BY USING BLOCK COLLECTION
WO2012057583A2 (ko) 2010-10-28 2012-05-03 한국전자통신연구원 영상 정보 부호화 방법 및 복호화 방법
KR20120086131A (ko) 2011-01-25 2012-08-02 (주)휴맥스 모션 벡터 예측 방법 및 모션 벡터 복호화 방법
US9313494B2 (en) * 2011-06-20 2016-04-12 Qualcomm Incorporated Parallelization friendly merge candidates for video coding
US9736489B2 (en) * 2011-09-17 2017-08-15 Qualcomm Incorporated Motion vector determination for video coding
KR20130050407A (ko) * 2011-11-07 2013-05-16 오수미 인터 모드에서의 움직임 정보 생성 방법
CN104396248B (zh) 2012-10-12 2019-11-08 韩国电子通信研究院 图像编码/解码方法和使用其的装置
US9826244B2 (en) * 2013-01-08 2017-11-21 Qualcomm Incorporated Device and method for scalable coding of video information based on high efficiency video coding
KR102088801B1 (ko) 2013-03-07 2020-03-13 삼성전자주식회사 가변블록 사이즈 코딩 정보를 이용한 관심영역 코딩 방법 및 장치
KR102179383B1 (ko) * 2013-08-09 2020-11-16 삼성전자주식회사 병합 모드 결정 방법 및 장치
US10516884B2 (en) 2014-03-05 2019-12-24 Lg Electronics Inc. Method for encoding/decoding image on basis of polygon unit and apparatus therefor
KR102445242B1 (ko) * 2014-03-19 2022-09-21 삼성전자주식회사 경계 필터링을 수반한 비디오 부호화 및 비디오 복호화 방법 및 장치
US9743110B2 (en) * 2014-10-09 2017-08-22 Hfi Innovation Inc. Method of 3D or multi-view video coding including view synthesis prediction
KR20160095932A (ko) 2015-02-04 2016-08-12 한국전자통신연구원 비디오 부호화 장치 및 방법
KR102583501B1 (ko) * 2015-04-27 2023-09-27 엘지전자 주식회사 비디오 신호의 처리 방법 및 이를 위한 장치
US20170150156A1 (en) * 2015-11-25 2017-05-25 Qualcomm Incorporated Illumination compensation with non-square predictive blocks in video coding
KR20180134853A (ko) * 2016-05-06 2018-12-19 삼성전자주식회사 인터 프레임의 세그먼트를 부호화하기 위한 방법 및 전자 장치
KR102424417B1 (ko) * 2016-08-03 2022-07-22 주식회사 케이티 비디오 신호 처리 방법 및 장치
CN117041564A (zh) * 2016-11-29 2023-11-10 成均馆大学校产学协力团 影像编码/解码方法、装置以及对比特流进行存储的记录介质
KR20180082330A (ko) * 2017-01-09 2018-07-18 에스케이텔레콤 주식회사 영상 부호화 또는 복호화하기 위한 장치 및 방법
US10484703B2 (en) * 2017-02-07 2019-11-19 Mediatek Inc. Adapting merge candidate positions and numbers according to size and/or shape of prediction block
WO2018205914A1 (en) * 2017-05-10 2018-11-15 Mediatek Inc. Method and apparatus of reordering motion vector prediction candidate set for video coding
CN111567045A (zh) * 2017-10-10 2020-08-21 韩国电子通信研究院 使用帧间预测信息的方法和装置
WO2019103564A1 (ko) * 2017-11-27 2019-05-31 엘지전자 주식회사 영상 코딩 시스템에서 인터 예측에 따른 영상 디코딩 방법 및 장치
CN111971966A (zh) * 2018-03-30 2020-11-20 韩国电子通信研究院 图像编码/解码方法和设备以及存储比特流的记录介质
WO2020017840A1 (ko) * 2018-07-16 2020-01-23 엘지전자 주식회사 Dmvr에 기반하여 인터 예측을 수행하는 방법 및 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106375765A (zh) * 2010-12-06 2017-02-01 Sk电信有限公司 通过使用任意块的帧间预测编码/解码图像的方法和装置
US20120147961A1 (en) * 2010-12-09 2012-06-14 Qualcomm Incorporated Use of motion vectors in evaluating geometric partitioning modes
KR20170023921A (ko) * 2017-02-24 2017-03-06 에스케이텔레콤 주식회사 다양한 형태의 블록 분할을 이용하는 영상 부호화/복호화 장치 및 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022117030A1 (en) * 2020-12-02 2022-06-09 Zhejiang Dahua Technology Co., Ltd. Systems and method for inter prediction based on a merge mode

Also Published As

Publication number Publication date
CN118214857A (zh) 2024-06-18
CN118214855A (zh) 2024-06-18
US11563954B2 (en) 2023-01-24
CN118214854A (zh) 2024-06-18
US20200288150A1 (en) 2020-09-10
KR20190046704A (ko) 2019-05-07
CN118214856A (zh) 2024-06-18
CN118214853A (zh) 2024-06-18
CN111279695B (zh) 2024-03-29
WO2019083334A1 (ko) 2019-05-02
US20230106821A1 (en) 2023-04-06

Similar Documents

Publication Publication Date Title
CN111279695B (zh) 用于基于非对称子块的图像编码/解码的方法及装置
CN111837388B (zh) 使用样点滤波的图像编码/解码方法和设备
CN111149359A (zh) 用于对图像进行编码/解码的方法和装置以及存储有比特流的记录介质
CN111164978A (zh) 用于对图像进行编码/解码的方法和设备以及用于存储比特流的记录介质
CN111164974A (zh) 图像编码/解码方法和设备以及用于存储比特流的记录介质
CN112369021A (zh) 用于吞吐量增强的图像编码/解码方法和设备以及存储比特流的记录介质
CN111247796B (zh) 图像编码/解码方法和装置以及存储比特流的记录介质
CN112740697A (zh) 图像编码/解码方法和装置及存储比特流的记录介质
CN112771862A (zh) 通过使用边界处理对图像进行编码/解码的方法和设备以及用于存储比特流的记录介质
CN112585976A (zh) 用于对图像进行编码/解码的方法和设备以及用于存储比特流的记录介质
CN112673629A (zh) 视频编码/解码方法和装置以及用于存储比特流的记录介质
CN114342372A (zh) 帧内预测模式、以及熵编解码方法和装置
CN113273188A (zh) 图像编码/解码方法和装置以及存储有比特流的记录介质
CN112740671A (zh) 图像编码/解码方法和装置以及存储比特流的记录介质
CN114731409A (zh) 图像编码/解码方法和装置、以及存储比特流的记录介质
CN112740694A (zh) 用于对图像进行编码/解码的方法和设备以及用于存储比特流的记录介质
CN113261286A (zh) 用于推导帧内预测模式的方法和设备
CN113906740A (zh) 帧间预测信息编码/解码方法和装置
CN113196758A (zh) 图像编码/解码方法和设备以及存储比特流的记录介质
CN113826393A (zh) 图像编码/解码方法和装置以及存储比特流的记录介质
CN113841398A (zh) 一种基于子块划分的图像编码/解码方法及装置
CN113228643A (zh) 图像编码/解码方法和设备以及用于存储比特流的记录介质
CN113228645A (zh) 图像编码/解码方法和装置以及存储有比特流的记录介质
CN113228639A (zh) 图像编码/解码方法和装置以及存储有比特流的记录介质
CN113950831A (zh) 基于帧内块复制的编/解码方法、装置和比特流存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240528

Address after: Seoul City, Korea

Patentee after: INTELLECTUAL DISCOVERY Co.,Ltd.

Country or region after: Republic of Korea

Address before: Daejeon, Korea

Patentee before: ELECTRONICS AND TELECOMMUNICATIONS Research Institute OF KOREA

Country or region before: Republic of Korea