CN117499683A - 用于对图像进行编码/解码的方法和装置 - Google Patents

用于对图像进行编码/解码的方法和装置 Download PDF

Info

Publication number
CN117499683A
CN117499683A CN202311460021.7A CN202311460021A CN117499683A CN 117499683 A CN117499683 A CN 117499683A CN 202311460021 A CN202311460021 A CN 202311460021A CN 117499683 A CN117499683 A CN 117499683A
Authority
CN
China
Prior art keywords
block
size
tree
division
partition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311460021.7A
Other languages
English (en)
Inventor
林成昶
姜晶媛
高玄硕
李镇浩
李河贤
全东山
金晖容
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Publication of CN117499683A publication Critical patent/CN117499683A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)

Abstract

本发明涉及一种用于对图像进行编码/解码的方法和装置。对此,所述图像解码方法包括以下步骤:根据块划分结构将编码树单元划分为至少一个编码单元;并且基于编码单元执行解码,其中,所述块划分结构可以是在执行四叉树划分之后执行二叉树划分和三叉树划分中的至少一个的块划分结构。

Description

用于对图像进行编码/解码的方法和装置
本申请是申请日为2018年9月20日,申请号为201880060206.X,发明名称为“用于对图像进行编码/解码的方法和装置以及存储有比特流的记录介质”的发明专利申请的分案申请。
技术领域
本发明涉及一种图像编码/解码方法、图像编码/解码设备以及存储有比特流的记录介质。具体地,本发明涉及一种使用各种块划分结构的图像编码/解码方法和设备。
背景技术
近来,在各种应用领域中,对诸如高清(HD)图像和超高清(UHD)图像的高分辨率和高质量图像的需求已经增加。然而,与传统的图像数据相比,更高分辨率和更高质量的图像数据具有增加的数据量。因此,当通过使用诸如传统的有线和无线宽带网络的介质来发送图像数据时,或者当通过使用传统的存储介质来存储图像数据时,发送和存储的成本增加。为了解决随着图像数据的分辨率和质量的提高而出现的这些问题,对于更高分辨率和更高质量的图像,需要高效的图像编码/解码技术。
图像压缩技术包括各种技术,包括:帧间预测技术,从当前画面的先前或后续画面来预测当前画面中包括的像素值;帧内预测技术,通过使用当前画面中的像素信息来预测当前画面中包括的像素值;变换和量化技术,用于压缩残差信号的能量;熵编码技术,将短码分配给具有高出现频率的值,并且将长码分配给具有低出现频率的值;等等。图像数据可通过使用这样的图像压缩技术被有效地压缩,并且可被发送或存储。
同时,在图像编码/解码中,编码单元(CU)可被用于有效地划分图像。编码单元可被用作图像编码/解码的基本单元。
在传统的图像编码/解码方法和设备中,编码单元具有正方形形状并且始终以四叉树形式被划分。因此,在对图像进行编码或解码以适应各种局部内容特征时受到限制。
发明内容
技术问题
因此,考虑到在现有技术中出现的以上问题而做出本发明,并且本发明的目的是提供一种用于使用各种块划分结构对图像进行编码/解码以提高图像编码/解码效率的方法和设备。
技术方案
一种根据本发明的对图像进行解码的方法,所述方法可包括:根据块划分结构将编码树单元(CTU)划分为至少一个编码单元(CU);并且执行基于CU的解码,其中,所述块划分结构被配置为使得在执行四叉树划分之后执行二叉树划分和三叉树划分中的至少一个。
在根据本发明的对图像进行解码的方法中,其中,基于CU的解码是通过基于每个编码单元执行帧内预测或帧间预测或者帧内预测和帧间预测两者来实现的。
在根据本发明的对图像进行解码的方法中,其中,基于CU的解码是通过基于每个编码单元执行逆变换和反量化中的至少一个来实现的。
在根据本发明的对图像进行解码的方法中,其中,二叉树包括垂直二叉树和水平二叉树,并且三叉树包括垂直三叉树和水平三叉树。
在根据本发明的对图像进行解码的方法中,其中,所述块划分结构是基于第一标志、第二标志、第三标志和第四标志中的至少一个来确定的,其中,第一标志指示是否需要执行四叉树划分,第二标志指示是否需要执行二叉树/三叉树划分,第三标志指示垂直划分或水平划分,第四标志指示二叉树划分或三叉树划分。
在根据本发明的对图像进行解码的方法中,其中,所述块划分结构是基于以下项中的至少一项来确定的:四叉树根节点尺寸、最小允许的四叉树叶节点尺寸、最大允许的二叉树根节点尺寸、最大允许的三叉树根节点尺寸、最大允许的二叉树/三叉树深度、最小允许的二叉树叶节点尺寸和最小允许的三叉树叶节点尺寸。
在根据本发明的对图像进行解码的方法中,其中,以下项中的至少一项被包括在序列参数集(SPS)中:四叉树根节点尺寸、最小允许的四叉树叶节点尺寸、最大允许的二叉树根节点尺寸、最大允许的三叉树根节点尺寸、最大允许的二叉树/三叉树深度、最小允许的二叉树叶节点尺寸和最小允许的三叉树叶节点尺寸。
在根据本发明的对图像进行解码的方法中,其中,所述块划分结构是基于最大允许的变换尺寸来确定的。
在根据本发明的对图像进行解码的方法中,其中,当编码树单元被包括在帧内条带中时,所述编码树单元的亮度信号的块划分结构和所述编码树单元的色度信号的块划分结构被彼此独立地确定。
一种根据本发明的对图像进行编码的方法,所述方法可包括:根据块划分结构将编码树单元(CTU)划分为至少一个编码单元(CU);并且执行基于CU的编码,其中,所述块划分结构被配置为使得首先执行四叉树划分然后执行二叉树划分和三叉树划分中的至少一个。
在根据本发明的对图像进行编码的方法中,其中,基于CU的编码是通过基于每个编码单元执行帧内预测或帧间预测或者帧内预测和帧间预测两者来实现的。
在根据本发明的对图像进行编码的方法中,其中,基于CU的编码是通过基基于每个编码单元执行逆变换和反量化中的至少一个来实现的。
在根据本发明的对图像进行编码的方法中,其中,所述块划分结构是基于以下项中的至少一项被限制的:四叉树根节点尺寸、最小允许的四叉树叶节点尺寸、最大允许的二叉树根节点尺寸、最大允许的三叉树根节点尺寸、最大允许的二叉树/三叉树深度、最小允许的二叉树叶节点尺寸和最小允许的三叉树叶节点尺寸。
在根据本发明的对图像进行编码的方法中,其中,以下项中的至少一项被包括在序列参数集(SPS)中:四叉树根节点尺寸、最小允许的四叉树叶节点尺寸、最大允许的二叉树根节点尺寸、最大允许的三叉树根节点尺寸、最大允许的二叉树/三叉树深度、最小允许的二叉树叶节点尺寸和最小允许的三叉树叶节点尺寸。
在根据本发明的对图像进行编码的方法中,其中,所述块划分结构是基于最大允许的变换尺寸来确定的。
在根据本发明的对图像进行编码的方法中,其中,当编码树单元被包括在帧内条带中时,所述编码树单元的亮度信号的块划分结构和所述编码树单元的色度信号的块划分结构被彼此独立地确定。
一种存储程序的计算机可读记录介质,当所述程序被处理器执行时执行以下图像编码方法:根据块划分结构将编码树单元(CTU)划分为至少一个编码单元(CU);并且执行基于CU的编码,其中,所述块划分结构被配置为使得首先执行四叉树划分然后执行二叉树划分和三叉树划分中的至少一个。
有益效果
本发明可提供一种用于使用各种块划分结构对图像进行编码/解码以提高图像编码/解码效率的方法和设备。
根据本发明,可提高图像编码/解码效率。
根据本发明,可降低图像编码器和图像解码器的计算复杂度。
附图说明
图1是示出根据本发明的实施例的编码设备的配置的框图;
图2是示出根据本发明的实施例的解码设备的配置的框图;
图3是示意性地示出当对图像进行编码和解码时图像的分区结构的示图;
图4是示出根据本发明的实施例的四叉树划分、对称二叉树(SBT)划分和非对称二叉树(ABT)划分的示图;
图5示出四叉树加对称二叉树划分结构的示例;
图6是示出首先通过四叉树划分然后通过对称二叉树划分而被划分的编码树单元(CTU)以及相应树结构的示图;
图7示出四叉树加非对称二叉树划分结构的示例;
图8是示出根据本发明的实施例的在四叉树加非对称二叉树划分结构中递归地执行非对称二叉树划分的示图;
图9是示出四叉树加非对称二叉树划分的信令的示图;
图10示出可按照2的幂划分的四叉树加移位二叉树划分结构的示例;
图11示出不可以按照2的幂划分的四叉树加移位二叉树划分结构的示例;
图12是示出四叉树加移位二叉树划分结构的信令的示图;
图13示出根据本发明的实施例的四叉树和二叉树组合划分结构;
图14示出根据本发明的实施例的四叉树加二叉树/三叉树划分结构;
图15示出根据本发明的实施例的针对每种块类型的垂直二叉树划分(BI_VER_SPLIT)、水平二叉树划分(BI_HOL_SPLIT)、垂直三叉树划分(TRI_VER_SPLIT)和水平三叉树划分(TRI_HOL_SPLIT);
图16是示出在四叉树加二叉树/三叉树划分结构中可用的划分模式的示图;
图17是示出根据本发明的实施例的在每种可用的划分模式下的比特分配的示图;
图18是示出四叉树加二叉树/三叉树划分结构的信令的示图;
图19是示出关于划分为正方形的划分的信息的信令的示图;
图20是示出根据本发明的实施例的分离PU/TU树划分结构的示图;
图21是示出在每个四叉树深度和每个二叉树深度首先通过四叉树划分然后通过二叉树划分而被划分的CTU的示例的示图;
图22是示出CTU中的色度信号Cb和色度信号Cr通过四叉树加二叉树划分被不同地划分的示例的示图;
图23是示出用于对重建的量化矩阵系数进行扫描的示例性扫描方法的示图;
图24是示出根据本发明的实施例的图像解码方法的流程图;以及
图25是示出根据本发明的实施例的图像编码方法的流程图。
具体实施方式
可对本发明做出各种修改,并且存在本发明的各种实施例,其中,现在将参照附图提供所述各种实施例的示例并且将详细描述所述各种实施例的示例。然而,本发明不限于此,尽管示例性实施例可被解释为包括本发明的技术构思和技术范围内的所有修改、等同形式或替换形式也是如此。相似的参考标号指在各方面相同或相似的功能。在附图中,为了清楚起见,元件的形状和尺寸可被夸大。在本发明的以下详细描述中,对通过图示的方式示出可实施本发明的具体实施例的附图进行参照。这些实施例被足够详细地描述以使本领域技术人员能够实施本公开。应该理解,本公开的各种实施例尽管不同,但不必是相互排他的。例如,在不脱离本公开的精神和范围的情况下,这里结合一个实施例描述的特定特征、结构和特性可在其它实施例中被实施。此外,应该理解,在不脱离本公开的精神和范围的情况下,每个公开的实施例内的各个元件的位置或布置可被修改。因此,以下详细描述不应以限制的含义来理解,并且本公开的范围仅由所附权利要求(在合适的解释的情况下,还连同权利要求所要求保护的等同物的全部范围)来限定。
在说明书中使用的术语“第一”、“第二”等可被用于描述各种组件,但这些组件并不被解释为受限于这些术语。这些术语仅被用于将一个组件与另一组件区分开。例如,在不脱离本发明的范围的情况下,“第一”组件可被称为“第二”组件,并且“第二”组件也可类似地被称为“第一”组件。术语“和/或”包括多个项的组合或者是多个项中的任意一项。
将理解的是,在本说明书中,当元件仅被称为“连接到”或“结合到”另一元件而不是“直接连接到”或“直接结合到”另一元件时,所述元件可“直接连接到”或“直接结合到”所述另一元件,或者在所述元件与所述另一元件之间具有其他元件的情况下连接到或结合到所述另一元件。相反,应该理解,当元件被称为“直接结合”或“直接连接”到另一元件时,不存在中间元件。
此外,在本发明的实施例中示出的组成部件被独立地示出,以便呈现彼此不同的特性功能。因此,这并不意味着每个组成部件以单独的硬件或软件的组成单元被组成。换句话说,为了方便,每个组成部件包括枚举的组成部件中的每一个。因此,每个组成部件中的至少两个组成部件可被组合形成一个组成部件,或者一个组成部件可被划分为用于执行每个功能的多个组成部件。在没有脱离本发明的本质的情况下,每个组成部件被组合的实施例以及一个组成部件被划分的实施例也被包括在本发明的范围中。
在本说明书中使用的术语仅用于描述具体实施例,而不旨在限制本发明。以单数使用的表达包括复数表达,除非它在上下文中具有明显不同的含义。在本说明书中,将理解,诸如“包括……的”、“具有……的”等的术语旨在指明存在说明书中所公开的特征、数量、步骤、动作、元件、部件、或其组合,而并不旨在排除可存在或者可添加一个或更多个其它特征、数量、步骤、动作、元件、部件、或其组合的可能性。换句话说,当特定元件被称为“被包括”时,除相应元件以外的元件并不被排除,而是,附加的元件可被包括在本发明的实施例中或者是本发明的范围中。
此外,一些组成元件可以不是执行本发明的必要功能的不可缺的组成元件,而是仅提升其性能的可选组成元件。可通过仅包括用于实施本发明的实质的不可缺的组成部件而排除在用于提升性能的组成元件来实施本发明。仅包括所述不可缺的组成元件而排除在仅用于提升性能的可选组成元件的结构也被包括在本发明的范围中。
在下文中,将参照附图详细描述本发明的实施例。在描述本发明的示例性实施例时,将不详细描述公知功能或结构,这是因为它们会不必要地模糊对本发明的理解。附图中的相同的组成元件由相同的参考标号来表示,并且对相同元件的重复描述将被省略。
在下文中,图像可指构成视频的画面,或者可指视频本身。例如,“对图像进行编码或解码或者进行编码和解码两者”可指“对运动画面进行编码或解码或者进行编码和解码两者”,并且可指“对运动画面的图像中的一个图像进行编码或解码或者进行编码和解码两者。”
在下文中,术语“运动画面”和“视频”可被用作相同的含义并且可彼此替换。
在下文中,目标图像可以是作为编码目标的编码目标图像和/或作为解码目标的解码目标图像。此外,目标图像可以是输入到编码设备的输入图像、以及输入到解码设备的输入图像。这里,目标图像可与当前图像具有相同的含义。
在下文中,术语“图像”、“画面”、“帧”和“屏幕”可被用作相同的含义并且彼此替换。
在下文中,目标块可以是作为编码目标的编码目标块和/或作为解码目标的解码目标块。此外,目标块可以是作为当前编码和/或解码的目标的当前块。例如,术语“目标块”和“当前块”可被用作相同的含义并且彼此替换。
在下文中,术语“块”和“单元”可被用作相同的含义并且彼此替换。或者“块”可表示特定单元。
在下文中,术语“区域”和“片段”可彼此替换。
在下文中,特定信号可以是表示特定块的信号。例如,原始信号可以是表示目标块的信号。预测信号可以是表示预测块的信号。残差信号可以是表示残差块的信号。
在实施例中,特定信息、数据、标志、索引、元素和属性等中的每一个可具有值。等于“0”的信息、数据、标志、索引、元素和属性的值可表示逻辑假或第一预定义值。换言之,值“0”、假、逻辑假和第一预定义值可彼此替换。等于“1”的信息、数据、标志、索引、元素和属性的值可表示逻辑真或第二预定义值。换句话说,值“1”、真、逻辑真和第二预定义值可彼此替换。
当变量i或j用于表示列、行或索引时,i的值可以是等于或大于0的整数、或者等于或大于1的整数。也就是说,列、行、索引等可从0开始计数,或者可从1开始计数。
术语描述
编码器:表示执行编码的设备。也就是说,表示编码设备。
解码器:表示执行解码的设备。也就是说,表示解码设备。
块:是M×N的样点阵列。这里,M和N可表示正整数,并且块可表示二维形式的样点阵列。块可指单元。当前块可表示在编码时成为目标的编码目标块,或者在解码时成为目标的解码目标块。此外,当前块可以是编码块、预测块、残差块和变换块中的至少一个。
样点:是构成块的基本单元。根据比特深度(Bd),样点可被表示为从0到2Bd-1的值。在本发明中,样点可被用作像素的含义。也就是说,样点、pel、像素可具有彼此相同的含义。
单元:可指编码和解码单元。当对图像进行编码和解码时,单元可以是通过对单个图像进行分区而生成的区域。此外,当在编码或解码期间将单个图像分区为子划分单元时,单元可表示子划分单元。也就是说,图像可被分区为多个单元。当对图像进行编码和解码时,可执行针对每个单元的预定处理。单个单元可被分区为尺寸小于该单元的尺寸的子单元。依据功能,单元可表示块、宏块、编码树单元、编码树块、编码单元、编码块、预测单元、预测块、残差单元、残差块、变换单元、变换块等。此外,为了将单元与块区分开,单元可包括亮度分量块、与亮度分量块相关联的色度分量块、以及每个颜色分量块的语法元素。单元可具有各种尺寸和形状,具体地,单元的形状可以是二维几何图形,诸如正方形、长方形、梯形、三角形、五边形等。此外,单元信息可包括指示编码单元、预测单元、变换单元等的单元类型以及单元尺寸、单元深度、单元的编码和解码的顺序等中的至少一个。
编码树单元:被配置有亮度分量Y的单个编码树块以及与色度分量Cb和Cr相关的两个编码树块。此外,编码树单元可表示包括块和每个块的语法元素。可通过使用四叉树分区方法、二叉树分区方法和三叉树分区方法中的至少一个对每个编码树单元进行分区,以配置诸如编码单元、预测单元、变换单元等的更低等级的单元。编码树单元可被用作用于指定在对作为输入图像的图像进行编码/解码时成为处理单元的样点块的术语。这里,四叉树可表示四元树。
编码树块:可用作用于指定Y编码树块、Cb编码树块和Cr编码树块中的任意一个的术语。
邻近块:可表示与当前块相邻的块。与当前块相邻的块可表示与当前块的边界接触的块、或者位于距当前块预定距离内的块。邻近块可表示与当前块的顶点相邻的块。这里,与当前块的顶点相邻的块可表示与水平相邻于当前块的邻近块垂直相邻的块、或者与垂直相邻于当前块的邻近块水平相邻的块。
重建的邻近块:可表示与当前块相邻并且已经在空间/时间上被编码或解码的邻近块。这里,重建的邻近块可表示重建的邻近单元。重建的空间邻近块可以是在当前画面内并且已经通过编码或解码或者编码和解码两者而被重建的块。重建的时间邻近块是在参考图像内的与当前画面的当前块对应的位置处的块或所述块的邻近块。
单元深度:可表示单元的分区程度。在树结构中,最高节点(根节点)可与未被分区的第一单元对应。此外,最高节点可具有最小深度值。在这种情况下,最高节点的深度可以为等级0。深度为等级1的节点可表示通过对第一单元进行一次分区而生成的单元。深度为等级2的节点可表示通过对第一单元进行两次分区而生成的单元。深度为等级n的节点可表示通过对第一单元进行n次分区而生成的单元。叶节点可以是最低节点并且是不能被进一步分区的节点。叶节点的深度可以是最大等级。例如,最大等级的预定义值可以是3。根节点的深度可以是最低的,并且叶节点的深度可以是最深的。此外,当单元被表示为树结构时,单元所在的等级可表示单元深度。
比特流:可表示包括编码图像信息的比特流。
参数集:与比特流内的配置之中的头信息对应。视频参数集、序列参数集、画面参数集和自适应参数集中的至少一个可被包括在参数集中。此外,参数集可包括条带(slice)头和并行块(tile)头信息。
解析:可表示通过执行熵解码来确定语法元素的值,或者可表示熵解码本身。
符号:可表示编码/解码目标单元的语法元素、编码参数和变换系数值中的至少一个。此外,符号可表示熵编码目标或熵解码结果。
预测模式:可以是指示利用帧内预测被编码/解码的模式或利用帧间预测被编码/解码的模式的信息。
预测单元:可表示当执行预测(诸如帧间预测、帧内预测、帧间补偿、帧内补偿和运动补偿)时的基本单元。单个预测单元可被分区为具有更小尺寸的多个分区,或者可被分区为多个更低等级的预测单元。多个分区可以是在执行预测或补偿时的基本单元。通过划分预测单元而生成的分区也可以是预测单元。
预测单元分区:可表示通过对预测单元进行分区而获得的形状。
参考画面列表:可指包括用于帧间预测或运动补偿的一个或更多个参考画面的列表。存在几种类型的可用参考画面列表,所述可用参考画面列表包括LC(列表组合)、L0(列表0)、L1(列表1)、L2(列表2)、L3(列表3)。
帧间预测指示符:可指当前块的帧间预测(单向预测、双向预测等)的方向。可选地,帧间预测指示符可指用于生成当前块的预测块的参考画面的数量。可选地,帧间预测指示符可指在对当前块执行帧间预测或运动补偿时所使用的预测块的数量。
预测列表利用标志:指示是否使用特定参考画面列表中的至少一个参考画面来生成预测块。可使用预测列表利用标志来推导帧间预测指示符,并且相反地,可使用帧间预测指示符来推导预测列表利用标志。例如,当预测列表利用标志具有第一值零(0)时,它表示不使用参考画面列表中的参考画面来生成预测块。另一方面,当预测列表利用标志具有第二值一(1)时,它表示使用参考画面列表来生成预测块。
参考画面索引:可指指示参考画面列表中的特定参考画面的索引。
参考画面:可表示为了对特定块进行帧间预测或运动补偿的目的而由特定块参考的参考画面。可选地,参考画面可以是包括由当前块参考以进行帧间预测或运动补偿的参考块的画面。在下文中,术语“参考画面”和“参考图像”具有相同的含义并且可彼此替换。
运动矢量:可以是用于帧间预测或运动补偿的二维矢量。运动矢量可表示编码/解码目标块与参考块之间的偏移。例如,(mvX,mvY)可表示运动矢量。这里,mvX可表示水平分量,并且mvY可表示垂直分量。
搜索范围:可以是在帧间预测期间为了检索运动矢量而搜索的二维区域。例如,搜索范围的尺寸可以是M×N。这里,M和N均为整数。
运动矢量候选:可指在对运动矢量进行预测时的预测候选块或预测候选块的运动矢量。此外,运动矢量候选可被包括在运动矢量候选列表中。
运动矢量候选列表:可表示由一个或更多个运动矢量候选组成的列表。
运动矢量候选索引:可表示指示在运动矢量候选列表中的运动矢量候选的指示符。可选地,运动矢量候选索引可以是运动矢量预测因子的索引。
运动信息:可表示包括以下项中的至少一项的信息:运动矢量、参考画面索引、帧间预测指示符、预测列表利用标志、参考画面列表信息、参考画面、运动矢量候选、运动矢量候选索引、合并候选和合并索引。
合并候选列表:可表示由一个或更多个合并候选组成的列表。
合并候选:可表示空间合并候选、时间合并候选、组合合并候选、组合双向预测合并候选或零合并候选。合并候选可包括运动信息,诸如帧间预测指示符、针对每个列表的参考画面索引、运动矢量、预测列表利用标志和帧间预测指示符。
合并索引:可表示在合并候选列表中指示合并候选的指示符。可选地,合并索引可指示在空间上/时间上与当前块相邻的重建块之中的已推导出合并候选的块。可选地,合并索引可指示合并候选的至少一条运动信息。
变换单元:可表示在对残差信号执行编码/解码(诸如变换、逆变换、量化、反量化、变换系数编码/解码)时的基本单元。单个变换单元可被分区为具有更小尺寸的多个更低等级的变换单元。这里,变换/逆变换可包括第一变换/第一逆变换和第二变换/第二逆变换中的至少一个。
缩放:可表示将量化的等级乘以因子的处理。可通过对量化的等级进行缩放来生成变换系数。缩放也可被称为反量化。
量化参数:可表示当在量化期间使用变换系数来生成量化的等级时使用的值。量化参数还可表示当在反量化期间通过对量化的等级进行缩放来生成变换系数时使用的值。量化参数可以是按量化步长映射的值。
增量量化参数:可表示编码/解码目标单元的预测的量化参数与量化参数之间的差值。
扫描:可表示对单元、块或矩阵内的系数进行排序的方法。例如,将系数的二维矩阵改变为一维矩阵可被称为扫描,将系数的一维矩阵改变为二维矩阵可被称为扫描或逆扫描。
变换系数:可表示在编码器中执行变换之后生成的系数值。变换系数可表示在解码器中执行熵解码和反量化中的至少一个之后生成的系数值。通过对变换系数或残差信号进行量化而获得的量化的等级或者量化的变换系数等级也可落入变换系数的含义内。
量化的等级:可表示在编码器中通过对变换系数或残差信号进行量化而生成的值。可选地,量化的等级可表示作为在解码器中将被执行反量化的反量化目标的值。类似地,作为变换和量化的结果的量化的变换系数等级也可落入量化的等级的含义内。
非零变换系数:可表示具有除零之外的值的变换系数、或者具有除零之外的值的变换系数等级或量化的等级。
量化矩阵:可表示在被执行以提高主观图像质量或客观图像质量的量化处理或反量化处理中使用的矩阵。量化矩阵也可被称为缩放列表。
量化矩阵系数:可表示量化矩阵内的每个元素。量化矩阵系数也可被称为矩阵系数。
默认矩阵:可表示在编码器或解码器中预先定义的预定量化矩阵。
非默认矩阵:可表示在编码器或解码器中未被预先定义而是由用户用信号发送的量化矩阵。
统计值:针对具有可计算的特定值的变量、编码参数、常量值等之中的至少一个的统计值可以是相应特定值的平均值、加权平均值、加权和值、最小值、最大值、最频繁出现的值、中值、插值之中的一个或更多个。
图1是示出根据应用了本发明的实施例的编码设备的配置的框图。
编码设备100可以是编码器、视频编码设备或图像编码设备。视频可包括至少一个图像。编码设备100可顺序地对至少一个图像进行编码。
参照图1,编码设备100可包括运动预测单元111、运动补偿单元112、帧内预测单元120、切换器115、减法器125、变换单元130、量化单元140、熵编码单元150、反量化单元160、逆变换单元170、加法器175、滤波器单元180和参考画面缓冲器190。
编码设备100可通过使用帧内模式或帧间模式或者帧内模式和帧间模式两者来对输入图像执行编码。此外,编码设备100可通过对输入图像进行编码来生成包括编码信息的比特流,并输出生成的比特流。生成的比特流可被存储在计算机可读记录介质中,或者可通过有线/无线传输介质被流传输。当帧内模式被用作预测模式时,切换器115可切换到帧内。可选地,当帧间模式被用作预测模式时,切换器115可切换到帧间模式。这里,帧内模式可表示帧内预测模式,帧间模式可表示帧间预测模式。编码设备100可生成针对输入图像的输入块的预测块。此外,编码设备100可在生成预测块之后使用输入块和预测块的残差对残差块进行编码。输入图像可被称为作为当前编码目标的当前图像。输入块可被称为作为当前编码目标的当前块,或者被称为编码目标块。
当预测模式是帧内模式时,帧内预测单元120可使用已被编码/解码并与当前块相邻的块的样点作为参考样点。帧内预测单元120可通过使用参考样点来对当前块执行空间预测,或者通过执行空间预测来生成输入块的预测样点。这里,帧内预测可表示帧内部的预测。
当预测模式是帧间模式时,运动预测单元111可在执行运动预测时从参考图像检索与输入块最匹配的区域,并且通过使用检索到的区域来推导运动矢量。在这种情况下,搜索区域可被用作所述区域。参考图像可被存储在参考画面缓冲器190中。这里,当执行了对参考图像的编码/解码时,参考图像可被存储在参考画面缓冲器190中。
运动补偿单元112可通过使用运动矢量对当前块执行运动补偿来生成预测块。这里,帧间预测可表示帧之间的预测或运动补偿。
当运动矢量的值不是整数时,运动预测单元111和运动补偿单元112可通过将插值滤波器应用于参考画面的部分区域来生成预测块。为了对编码单元执行画面间预测或运动补偿,可确定将跳过模式、合并模式、高级运动矢量预测(AMVP)模式和当前画面参考模式之中的哪个模式用于对包括在相应编码单元中的预测单元的运动预测和运动补偿。然后,依据所确定的模式,可不同地执行画面间预测或运动补偿。
减法器125可通过使用输入块和预测块的残差来生成残差块。残差块可被称为残差信号。残差信号可表示原始信号与预测信号之间的差。此外,残差信号可以是通过对原始信号与预测信号之间的差进行变换或量化或者进行变换和量化而生成的信号。残差块可以是块单元的残差信号。
变换单元130可通过对残差块执行变换来生成变换系数,并输出生成的变换系数。这里,变换系数可以是通过对残差块执行变换而生成的系数值。当变换跳过模式被应用时,变换单元130可跳过对残差块的变换。
可通过将量化应用于变换系数或应用于残差信号来生成量化的等级。在下文中,量化的等级在实施例中也可被称为变换系数。
量化单元140可通过根据参数对变换系数或残差信号进行量化来生成量化的等级,并输出生成的量化的等级。这里,量化单元140可通过使用量化矩阵对变换系数进行量化。
熵编码单元150可通过根据概率分布对由量化单元140计算出的值或者对在执行编码时计算出的编码参数值执行熵编码来生成比特流,并输出生成的比特流。熵编码单元150可对图像的样点信息和用于对图像进行解码的信息执行熵编码。例如,用于对图像进行解码的信息可包括语法元素。
当熵编码被应用时,符号被表示使得较少数量的比特被分配给具有高生成可能性的符号,并且较多数量的比特被分配给具有低生成可能性的符号,因此,可减小用于将被编码的符号的比特流的大小。熵编码单元150可使用诸如指数哥伦布、上下文自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等的用于熵编码的编码方法。例如,熵编码单元150可通过使用可变长度编码/码(VLC)表来执行熵编码。此外,熵编码单元150可推导目标符号的二值化方法和目标符号/二进制位的概率模型,并且通过使用推导出的二值化方法和上下文模型来执行算术编码。
为了对变换系数等级(量化的等级)进行编码,熵编码单元150可通过使用变换系数扫描方法将二维块形式的系数改变为一维矢量形式。
编码参数可包括在编码器中被编码并且被用信号发送到解码器的诸如语法元素的信息(标志、索引等)以及在执行编码或解码时推导出的信息。编码参数可表示在对图像进行编码或解码时所需要的信息。例如,以下项中的至少一个值或组合形式可被包括在编码参数中:单元/块尺寸、单元/块深度、单元/块分区信息、单元/块形状、单元/块分区结构、是否进行四叉树形式的分区、是否进行二叉树形式的分区、二叉树形式的分区方向(水平方向或垂直方向)、二叉树形式的分区形式(对称分区或非对称分区)、当前编码单元是否通过三叉树分区被分区、三叉树分区的方向(水平方向或垂直方向)、三叉树分区的类型(对称类型或非对称类型)、当前编码单元是否通过多类型树分区被分区、多类型树分区的方向(水平方向或垂直方向)、多类型树分区的类型(对称类型或非对称类型)和多类型树分区的树(二叉树或三叉树)结构、预测模式(帧内预测或帧间预测)、亮度帧内预测模式/方向、色度帧内预测模式/方向、帧内分区信息、帧间分区信息、编码块分区标志、预测块分区标志、变换块分区标志、参考样点滤波方法、参考样点滤波器抽头、参考样点滤波器系数、预测块滤波方法、预测块滤波器抽头、预测块滤波器系数、预测块边界滤波方法、预测块边界滤波器抽头、预测块边界滤波器系数、帧内预测模式、帧间预测模式、运动信息、运动矢量、运动矢量差、参考画面索引、帧间预测角度、帧间预测指示符、预测列表利用标志、参考画面列表、参考画面、运动矢量预测因子索引、运动矢量预测因子候选、运动矢量候选列表、是否使用合并模式、合并索引、合并候选、合并候选列表、是否使用跳过模式、插值滤波器类型、插值滤波器抽头、插值滤波器系数、运动矢量大小、运动矢量的表示精度、变换类型、变换尺寸、首次(第一次)变换是否被使用的信息、二次变换是否被使用的信息、首次变换索引、二次变换索引、残差信号是否存在的信息、编码块样式、编码块标志(CBF)、量化参数、量化参数残差、量化矩阵、是否应用帧内环路滤波器、帧内环路滤波器系数、帧内环路滤波器抽头、帧内环路滤波器形状/形式、是否应用去块滤波器、去块滤波器系数、去块滤波器抽头、去块滤波器强度、去块滤波器形状/形式、是否应用自适应样点偏移、自适应样点偏移值、自适应样点偏移类别、自适应样点偏移类型、是否应用自适应环路滤波器、自适应环路滤波器系数、自适应环路滤波器抽头、自适应环路滤波器形状/形式、二值化/反二值化方法、上下文模型确定方法、上下文模型更新方法、是否执行常规模式、是否执行旁路模式、上下文二进制位、旁路二进制位、有效系数标志、最后有效系数标志、针对系数组的单元的编码标志、最后有效系数的位置、关于系数的值是否大于1的标志、关于系数的值是否大于2的标志、关于系数的值是否大于3的标志、关于剩余系数值的信息、符号信息、重建的亮度样点、重建的色度样点、残差亮度样点、残差色度样点、亮度变换系数、色度变换系数、量化的亮度等级、量化的色度等级、变换系数等级扫描方法、在解码器侧的运动矢量搜索区域的尺寸、在解码器侧的运动矢量搜索区域的形状、在解码器侧的运动矢量搜索的次数、关于CTU尺寸的信息、关于最小块尺寸的信息、关于最大块尺寸的信息、关于最大块深度的信息、关于最小块深度的信息、图像显示/输出顺序、条带标识信息、条带类型、条带分区信息、并行块标识信息、并行块类型、并行块分区信息、画面类型、输入样点的比特深度、重建样点的比特深度、残差样点的比特深度、变换系数的比特深度、量化的等级的比特深度、以及关于亮度信号的信息或关于色度信号的信息。
这里,用信号发送标志或索引可表示由编码器对相应的标志或索引进行熵编码并将其包括在比特流中,并且可表示由解码器从比特流对相应的标志或索引进行熵解码。
当编码设备100通过帧间预测执行编码时,编码的当前图像可被用作用于随后被处理的另一图像的参考图像。因此,编码设备100可对编码的当前图像进行重建或解码,或者将重建或解码的图像作为参考图像存储在参考画面缓冲器190中。
量化的等级可在反量化单元160中被反量化,或者可在逆变换单元170中被逆变换。可由加法器175将经过反量化或逆变换的系数或者经过反量化和逆变换两者的系数与预测块相加。通过将经过反量化或逆变换的系数或者经过反量化和逆变换两者的系数与预测块相加,可生成重建块。这里,经过反量化或逆变换的系数或经过反量化和逆变换两者的系数可表示执行了反量化和逆变换中的至少一个的系数,并且可表示重建的残差块。
重建块可通过滤波器单元180。滤波器单元180可将去块滤波器、样点自适应偏移(SAO)和自适应环路滤波器(ALF)中的至少一个应用于重建样点、重建块或重建图像。滤波器单元180可被称为环内滤波器。
去块滤波器可去除在块之间的边界中生成的块失真。为了确定是否应用去块滤波器,可基于块中所包括的若干行或列中包括的样点来确定是否将去块滤波器应用于当前块。当将去块滤波器应用于块时,可根据所需的去块滤波强度来应用另一滤波器。
为了补偿编码误差,可通过使用样点自适应偏移将合适的偏移值与样点值相加。样点自适应偏移可以以样点为单位对经过去块的图像与原始图像的偏移进行校正。可使用考虑关于每个样点的边缘信息来应用偏移的方法,或者可使用以下方法:将图像的样点分区为预定数量的区域,确定偏移被应用的区域,并对确定的区域应用偏移。
自适应环路滤波器可基于经过滤波的重建图像和原始图像的比较结果来执行滤波。可将包括在图像中的样点分区为预定组,可确定将被应用于每个组的滤波器,并且可对每个组执行不同的滤波。是否应用ALF的信息可通过编码单元(CU)被用信号发送,并且将被应用于每个块的ALF的形式和系数可变化。
已经通过滤波器单元180的重建块或重建图像可被存储在参考画面缓冲器190中。由滤波器单元180处理的重建块可以是参考图像的一部分。也就是说,参考图像是由滤波器单元180处理的重建块组成的重建图像。存储的参考图像可稍后在帧间预测或运动补偿时被使用。
图2是示出根据实施例的应用了本发明的解码设备的配置的框图。
解码设备200可以是解码器、视频解码设备或图像解码设备。
参照图2,解码设备200可包括熵解码单元210、反量化单元220、逆变换单元230、帧内预测单元240、运动补偿单元250、加法器225、滤波器单元260和参考画面缓冲器270。
解码设备200可接收从编码设备100输出的比特流。解码设备200可接收存储在计算机可读记录介质中的比特流,或者可接收通过有线/无线传输介质被流传输的比特流。解码设备200可通过使用帧内模式或帧间模式对比特流进行解码。此外,解码设备200可生成通过解码而生成的重建图像或解码图像,并输出重建图像或解码图像。
当在解码时使用的预测模式是帧内模式时,切换器可被切换到帧内。可选地,当在解码时使用的预测模式是帧间模式时,切换器可被切换到帧间模式。
解码设备200可通过对输入的比特流进行解码来获得重建残差块,并生成预测块。当重建残差块和预测块被获得时,解码设备200可通过将重建残差块与预测块相加来生成成为解码目标的重建块。解码目标块可被称为当前块。
熵解码单元210可通过根据概率分布对比特流进行熵解码来生成符号。生成的符号可包括量化的等级形式的符号。这里,熵解码方法可以是上述熵编码方法的逆过程。
为了对变换系数等级(量化的等级)进行解码,熵解码单元210可通过使用变换系数扫描方法将单向矢量形式的系数改变为二维块形式。
可在反量化单元220中对量化的等级进行反量化,或者可在逆变换单元230中对量化的等级进行逆变换。量化的等级可以是进行反量化或逆变换或者进行反量化和逆变换两者的结果,并且可被生成为重建的残差块。这里,反量化单元220可将量化矩阵应用于量化的等级。
当使用帧内模式时,帧内预测单元240可通过对当前块执行空间预测来生成预测块,其中,空间预测使用与解码目标块相邻并且已经被解码的块的样点值。
当使用帧间模式时,运动补偿单元250可通过对当前块执行运动补偿来生成预测块,其中,运动补偿使用运动矢量以及存储在参考画面缓冲器270中的参考图像。
加法器225可通过将重建残差块与预测块相加来生成重建块。滤波器单元260可将去块滤波器、样点自适应偏移和自适应环路滤波器中的至少一个应用于重建块或重建图像。滤波器单元260可输出重建图像。重建块或重建图像可被存储在参考画面缓冲器270中并且在执行帧间预测时被使用。由滤波器单元260处理的重建块可以是参考图像的一部分。也就是说,参考图像是由滤波器单元260处理的重建块组成的重建图像。存储的参考图像可稍后在帧间预测或运动补偿时被使用。
图3是示意性地示出当对图像进行编码和解码时图像的分区结构的示图。图3示意性地示出将单个单元分区为多个更低等级的单元的示例。
为了有效地对图像进行分区,当进行编码和解码时,可使用编码单元(CU)。编码单元可被用作当对图像进行编码/解码时的基本单元。此外,编码单元可被用作用于在对图像进行编码/解码时区分帧内预测模式与帧间预测模式的单元。编码单元可以是用于预测、变换、量化、逆变换、反量化或对变换系数的编码/解码处理的基本单元。
参照图3,图像300按照最大编码单元(LCU)被顺序地分区,并且LCU单元被确定为分区结构。这里,LCU可以以与编码树单元(CTU)相同的含义被使用。单元分区可表示对与该单元相关联的块进行分区。在块分区信息中,可包括单元深度的信息。深度信息可表示单元被分区的次数或程度或者单元被分区的次数和程度两者。可基于树结构将单个单元分区为与深度信息分层地相关联的多个更低等级的单元。换言之,单元和通过对该单元进行分区而生成的更低等级的单元可分别与节点和该节点的子节点相应。分区出的更低等级的单元中的每一个可具有深度信息。深度信息可以是表示CU的尺寸的信息,并且可被存储在每个CU中。单元深度表示与对单元进行分区相关的次数和/或程度。因此,更低等级的单元的分区信息可包括关于更低等级的单元的尺寸的信息。
分区结构可表示LCU 310内的编码单元(CU)的分布。可根据是否将单个CU分区为多个(等于或大于2的正整数,包括2、4、8、16等)CU来确定这样的分布。通过分区生成的CU的水平尺寸和垂直尺寸可分别是分区之前的CU的水平尺寸和垂直尺寸的一半,或者可根据分区的次数而分别具有小于分区之前的水平尺寸和垂直尺寸的尺寸。CU可以被递归地分区为多个CU。通过递归分区,与分区之前的CU的高度和宽度之中的至少一个相比,分区之后的CU的高度和宽度之中的至少一个可减小。可递归地执行CU的分区,直到预定义的深度或预定义的尺寸为止。例如,LCU的深度可以是0,最小编码单元(SCU)的深度可以是预定义的最大深度。这里,如上所述,LCU可以是具有最大编码单元尺寸的编码单元,并且SCU可以是具有最小编码单元尺寸的编码单元。分区从LCU 310开始,当CU的水平尺寸或垂直尺寸或者水平尺寸和垂直尺寸两者通过分区而减小时,CU深度增加1。例如,对于每个深度,未被分区的CU的尺寸可以为2N×2N。此外,在被分区的CU的情况下,可将尺寸为2N×2N的CU分区为尺寸为N×N的四个CU。当深度增加1时,N的大小可减半。
此外,可通过使用CU的分区信息来表示CU是否被分区的信息。分区信息可以是1比特信息。除SCU之外的所有CU可包括分区信息。例如,当分区信息的值为1时,可不对CU进行分区,当分区信息的值为2时,可对CU进行分区。
参照图3,具有深度0的LCU可以是64×64的块。0可以是最小深度。具有深度3的SCU可以是8×8的块。3可以是最大深度。32×32的块和16×16的块的CU可分别被表示为深度1和深度2。
例如,当单个编码单元被分区为四个编码单元时,分区出的四个编码单元的水平尺寸和垂直尺寸可以是CU在被分区之前的水平尺寸和垂直尺寸的一半大小。在一个实施例中,当尺寸为32×32的编码单元被分区为四个编码单元时,分区出的四个编码单元中的每一个的尺寸可以为16×16。当单个编码单元被分区为四个编码单元时,可称编码单元可被分区为四叉树形式。
例如,当一个编码单元被分区为两个子编码单元时,该两个子编码单元中的每一个的水平尺寸或垂直尺寸(宽度或高度)可以是原始编码单元的水平尺寸或垂直尺寸的一半。例如,当尺寸为32×32的编码单元被垂直分区为两个子编码单元时,该两个子编码单元中的每一个可具有16×32的尺寸。例如,当尺寸为8×32的编码单元被水平分区为两个子编码单元时,该两个子编码单元中的每一个可具有8×16的尺寸。当一个编码单元被分区为两个子编码单元时,可称编码单元被二分区,或者根据二叉树分区结构被分区。
例如,当一个编码单元被分区为三个子编码单元时,可以以1:2:1的比例对编码单元的水平尺寸或垂直尺寸进行分区,从而产生水平尺寸或垂直尺寸的比例为1:2:1的三个子编码单元。例如,当尺寸为16×32的编码单元被水平分区为三个子编码单元时,这三个子编码单元按照从最上方子编码单元到最下方子编码单元的顺序可分别具有16×8、16×16和16×8的尺寸。例如,当尺寸为32×32的编码单元被垂直划分为三个子编码单元时,这三个子编码单元按照从左侧子编码单元到右侧子编码单元的顺序可分别具有8×32、16×32和8×32的尺寸。当一个编码单元被分区为三个子编码单元时,可称编码单元被三分区或者根据三叉树分区结构被分区。
在图3中,编码树单元(CTU)320是被应用了所有四叉树分区结构、二叉树分区结构和三叉树分区结构的CTU的示例。
如上所述,为了对CTU进行分区,可应用四叉树分区结构、二叉树分区结构和三叉树分区结构中的至少一个。可根据预定的优先级顺序将各种树分区结构顺序地应用于CTU。例如,可将四叉树分区结构优先应用于CTU。不能再使用四叉树分区结构进行分区的编码单元可与四叉树的叶节点对应。与四叉树的叶节点对应的编码单元可用作二叉树分区结构和/或三叉树分区结构的根节点。也就是说,与四叉树的叶节点对应的编码单元可按照二叉树分区结构或三叉树分区结构被进一步分区,或者可不被进一步分区。因此,通过防止由对与四叉树的叶节点对应的编码单元进行二叉树分区或三叉树分区而产生的编码块被执行进一步的四叉树分区,可有效地执行块分区和/或用信号发送分区信息。
可使用四分区信息用信号发送与四叉树的节点对应的编码单元被分区的事实。具有第一值(例如,“1”)的四分区信息可指示当前编码单元按照四叉树分区结构被分区。具有第二值(例如,“0”)的四分区信息可指示当前编码单元未按照四叉树分区结构被分区。四分区信息可以是具有预定长度(例如,一个比特)的标志。
在二叉树分区与三叉树分区之间可没有优先级。也就是说,与四叉树的叶节点对应的编码单元可进一步被执行二叉树分区和三叉树分区中的任意分区。此外,通过二叉树分区或三叉树分区生成的编码单元可被执行进一步的二叉树分区或进一步的三叉树分区,或者可不被进一步分区。
在二叉树分区和三叉树分区中不存在优先级的树结构被称为多类型树结构。与四叉树的叶节点对应的编码单元可用作多类型树的根节点。可使用多类型树分区指示信息、分区方向信息和分区树信息中的至少一个来用信号发送是否对与多类型树的节点对应的编码单元进行分区。为了对与多类型树的节点对应的编码单元进行分区,可顺序地用信号发送多类型树分区指示信息、分区方向和分区树信息。
具有第一值(例如,“1”)的多类型树分区指示信息可指示当前编码单元将被执行多类型树分区。具有第二值(例如,“0”)的多类型树分区指示信息可指示当前编码单元将不经历多类型树分区。
当与多类型树的节点对应的编码单元根据多类型树分区结构被进一步分区时,所述编码单元可包括分区方向信息。分区方向信息可指示当前编码单元将在哪个方向上被分区以用于多类型树分区。具有第一值(例如,“1”)的分区方向信息可指示当前编码单元将被垂直分区。具有第二值(例如,“0”)的分区方向信息可指示当前编码单元将被水平分区。
当与多类型树的节点对应的编码单元按照多类型树分区结构被进一步分区时,当前编码单元可包括分区树信息。分区树信息可指示将被用于对多类型树的节点进行分区的树分区结构。具有第一值(例如,“1”)的分区树信息可指示当前编码单元将按照二叉树分区结构被分区。具有第二值(例如,“0”)的分区树信息可指示当前编码单元将按照三叉树分区结构被分区。
分区指示信息、分区树信息和分区方向信息均可以是具有预定长度(例如,一个比特)的标志。
四叉树分区指示信息、多类型树分区指示信息、分区方向信息和分区树信息中的至少任意一个可被熵编码/熵解码。为了对那些类型的信息进行熵编码/熵解码,可使用关于与当前编码单元相邻的邻近编码单元的信息。例如,当前编码单元的左侧邻近编码单元和/或上方邻近编码单元的分区类型(被分区或不被分区、分区树和/或分区方向)与当前编码单元的分区类型相似的可能性很高。因此,可从关于邻近编码单元的信息推导出用于对关于当前编码单元的信息进行熵编码/熵解码的上下文信息。关于邻近编码单元的信息可包括四分区信息、多类型树分区指示信息、分区方向信息和分区树信息中的至少任意一个。
作为另一示例,在二叉树分区和三叉树分区中,可优先执行二叉树分区。也就是说,当前编码单元可首先被执行二叉树分区,并且随后可将与二叉树的叶节点对应的编码单元设置为用于三叉树分区的根节点。在这种情况下,对于与三叉树的节点对应的编码单元,可既不执行四叉树分区也不执行二叉树分区。
不能按照四叉树分区结构、二叉树分区结构和/或三叉树分区结构被分区的编码单元成为用于编码、预测和/或变换的基本单元。也就是说,所述编码单元不能被进一步分区以用于预测和/或变换。因此,在比特流中可不存在用于将编码单元分区为预测单元和/或变换单元的分区结构信息和分区信息。
然而,当编码单元(即,用于分区的基本单元)的尺寸大于最大变换块的尺寸时,可递归地对编码单元进行分区,直到将编码单元的尺寸减小到等于或小于最大变换块的尺寸为止。例如,当编码单元的尺寸为64×64时并且当最大变换块的尺寸为32×32时,可将编码单元分区为用于变换的四个32×32的块。例如,当编码单元的尺寸为32×64并且最大变换块的尺寸为32×32时,可将编码单元分区为用于变换的两个32×32的块。在这种情况下,不单独用信号发送编码单元的用于变换的分区,并且可通过编码单元的水平尺寸或垂直尺寸与最大变换块的水平尺寸或垂直尺寸之间的比较来确定编码单元的用于变换的分区。例如,当编码单元的水平尺寸(宽度)大于最大变换块的水平尺寸(宽度)时,可将编码单元垂直地二等分。例如,当编码单元的垂直尺寸(长度)大于最大变换块的垂直尺寸(长度)时,可将编码单元水平地二等分。
可在编码单元的更高等级用信号发送或确定编码单元的最大尺寸和/或最小尺寸的信息以及变换块的最大尺寸和/或最小尺寸的信息。所述更高等级可以是例如序列级、画面级、条带级等。例如,可将编码单元的最小尺寸确定为4×4。例如,可将变换块的最大尺寸确定为64×64。例如,可将变换块的最小尺寸确定为4×4。
可在编码单元的更高等级用信号发送或确定与四叉树的叶节点对应的编码单元的最小尺寸(四叉树最小尺寸)的信息和/或从多类型树的根节点到叶节点的最大深度(多类型树的最大树深度)的信息。例如,所述更高等级可以是序列级、画面级、条带级等。可针对画面内条带和画面间条带中的每一个用信号发送或确定四叉树的最小尺寸的信息和/或多类型树的最大深度的信息。
可在编码单元的更高等级用信号发送或确定CTU的尺寸与变换块的最大尺寸之间的差信息。例如,所述更高等级可以是序列级、画面级、条带级等。可基于编码树单元的尺寸和所述差信息来确定与二叉树的各个节点对应的编码单元的最大尺寸(在下文中,称为二叉树的最大尺寸)的信息。与三叉树的各个节点对应的编码单元的最大尺寸(在下文中,称为三叉树的最大尺寸)可依据条带的类型而变化。例如,针对画面内条带,三叉树的最大尺寸可以是32×32。例如,针对画面间条带,三叉树的最大尺寸可以是128×128。例如,可将与二叉树的各个节点对应的编码单元的最小尺寸(在下文中,称为二叉树的最小尺寸)和/或与三叉树的各个节点对应的编码单元的最小尺寸(在下文中,称为三叉树的最小尺寸)设置为编码块的最小尺寸。
作为另一示例,可在条带级用信号发送或确定二叉树的最大尺寸和/或三叉树的最大尺寸。可选地,可在条带级用信号发送或确定二叉树的最小尺寸和/或三叉树的最小尺寸。
依据上述各种块的尺寸信息和深度信息,四分区信息、多类型树分区指示信息、分区树信息和/或分区方向信息可被包括在比特流中或可不被包括在比特流中。
例如,当编码单元的尺寸不大于四叉树的最小尺寸时,编码单元不包含四分区信息。因此,可从第二值推导出四分区信息。
例如,当与多类型树的节点对应的编码单元的尺寸(水平尺寸和垂直尺寸)大于二叉树的最大尺寸(水平尺寸和垂直尺寸)和/或三叉树的最大尺寸(水平尺寸和垂直尺寸)时,编码单元可不被二分区或三分区。因此,可不用信号发送多类型树分区指示信息,而是可从第二值推导出多类型树分区指示信息。
可选地,当与多类型树的节点对应的编码单元的尺寸(水平尺寸和垂直尺寸)与二叉树的最大尺寸(水平尺寸和垂直尺寸)相同,和/或是三叉树的最大尺寸(水平尺寸和垂直尺寸)的两倍大时,编码单元可不被进一步二分区或三分区。因此,可不用信号发送多类型树分区指示信息,而是可从第二值推导出多类型树分区指示信息。这是因为,当按照二叉树分区结构和/或三叉树分区结构对编码单元进行分区时,生成了小于二叉树的最小尺寸和/或三叉树的最小尺寸的编码单元。
可选地,当与多类型树的节点对应的编码单元的深度等于多类型树的最大深度时,可不对编码单元进行进一步的二分区和/或三分区。因此,可不用信号发送多类型树分区指示信息,而是可从第二值推导出多类型树分区指示信息。
可选地,只有当垂直方向二叉树分区、水平方向二叉树分区、垂直方向三叉树分区和水平方向三叉树分区中的至少一个对于与多类型树的节点对应的编码单元是可行的时,才可用信号发送多类型树分区指示信息。否则,可不对编码单元进行二分区和/或三分区。因此,可不用信号发送多类型树分区指示信息,而是可从第二值推导出多类型树分区指示信息。
可选地,只有当垂直方向二叉树分区和水平方向二叉树分区两者或者垂直方向三叉树分区和水平方向三叉树分区两者对于与多类型树的节点对应的编码单元是可行的时,才可用信号发送分区方向信息。否则,可不用信号发送分区方向信息,而是可从指示可能的分区方向的值推导出分区方向信息。
可选地,只有当垂直方向二叉树分区和垂直方向三叉树分区两者或者水平方向二叉树分区和水平方向三叉树分区两者对于与多类型树的节点对应的编码树是可行的时,才可用信号发送分区树信息。否则,可不用信号发送分区树信息,而是可从指示可能的分区树结构的值推导出分区树信息。
已经参照图3描述了四叉树划分、二叉树划分、三叉树划分和组合树划分。在下文中,将参照图4至图23描述根据其他各种实施例的图像分区结构。
图4是示出根据本发明的实施例的四叉树划分、对称二叉树(SBT)划分和非对称二叉树(ABT)划分的示图。在图4中,w表示块的水平尺寸(宽度)并且h表示块的垂直尺寸(高度)。
参照图4,四叉树划分是指一种将一个块划分为四个子块的划分类型,其中,从划分得到的子块中的每个子块的水平尺寸和垂直尺寸分别是原始块的水平尺寸和垂直尺寸的一半。
二叉树划分是指一种将一个块划分为两个子块的划分类型。存在两种类型的二叉树划分:对称和非对称。对于对称二叉树划分,存在两种类型:水平和垂直。对于非对称二叉树划分,也存在两种类型:水平和垂直。另一方面,二叉树叶节点是指编码单元(CU)。
通过对称二叉树划分生成的多个节点具有相等的尺寸。另一方面,通过非对称二叉树划分生成的多个节点具有不同的尺寸。
在图4中,作为非对称二叉树划分的示例,示出了1:3、3:1、1:7和7:1的水平和垂直非对称二叉树划分结构。
四叉树加二叉树(QT+BT)划分
本发明的一个实施例提供了一种四叉树加二叉树划分结构。四叉树加二叉树划分结构是指一种块首先被执行四叉树划分然后被执行二叉树划分的分区结构。
例如,在四叉树加二叉树划分结构中,首先通过四叉树划分来划分编码树单元(CTU),然后通过二叉树划分来进一步划分每个四叉树叶节点。这里,二叉树叶节点或四叉树叶节点是编码单元(CU)。
在四叉树加二叉树划分结构中,二叉树划分仅指对称二叉树划分(即,四叉树划分之后对称二叉树划分)或指对称二叉树划分与非对称二叉树划分的组合(即,四叉树划分之后非对称二叉树划分)。
对于四叉树划分之后对称二叉树划分(以下称为四叉树加二叉树划分),用信号发送第一标志或第一索引或者第一标志和第一索引两者,其中,第一标志指示是否需要执行四叉树划分,第一索引指示水平对称划分、垂直对称划分或不再划分。第一标志可具有指示需要执行四叉树划分的第一值或指示不需要执行进一步划分的第二值。第一索引可具有指示不需要执行进一步划分的第一值、指示需要执行水平对称划分的第二值或指示需要执行垂直对称划分的第三值。仅当第一标志具有第二值时才用信号发送第一索引。此外,当基于CU的尺寸和/或深度确定CU不能被进一步划分时,不用信号发送第一标志和/或第一索引。
对于另一示例,针对四叉树加对称二叉树划分结构,用信号发送第一标志、第二标志和第三标志中的至少一个,其中,第一标志指示是否需要执行四叉树划分,第二标志指示是否需要执行二叉树划分,第三标志指示水平对称划分或垂直对称划分。第一标志可具有指示需要执行四叉树划分的第一值或指示不需要执行进一步划分的第二值。第二标志可具有指示需要执行二叉树划分的第一值或指示不需要执行进一步划分的第二值。第三标志可具有指示需要执行水平对称划分的第一值或指示需要执行垂直对称划分的第二值。仅当第一标志具有第二值时,才用信号发送第二标志。仅当第二标志具有第一值时,才用信号发送第三标志。此外,当基于CU的尺寸和/或深度确定CU不能被进一步划分时,不用信号发送第一标志、第二标志和/或第三标志。
图5示出四叉树加对称二叉树划分结构的示例。在图5中,QT划分标志指示是否需要执行四叉树划分,BT划分标志指示是否需要执行二叉树划分,BT划分类型指示水平划分(宽度方向划分)或垂直划分(高度方向划分)。
图6是示出首先通过四叉树划分然后通过对称二叉树划分而被划分出的编码树单元(CTU)以及相应的树结构的示图。在图6中,实线表示通过四叉树划分而生成的分区,并且虚线表示通过二叉树划分而生成的分区。
当二叉树划分被执行时,用信号发送指示水平对称划分或垂直对称划分的标志。在图6的树结构中,0表示水平对称划分,并且1表示垂直对称划分。
图7示出根据本发明的实施例的四叉树加非对称二叉树划分结构。
参照图7,存在各种类型的四叉树加非对称二叉树划分:四叉树划分(QT_SPLIT)、水平对称划分(HOR)、垂直对称划分(VER)、水平上侧非对称划分(HOR_UP)、水平下侧非对称划分(HOR_DOWN)、垂直左侧非对称划分(VER_LEFT)和垂直右侧非对称划分(VER_RIGHT)。因此,在四叉树加非对称二叉树划分(即,四叉树划分之后非对称二叉树划分)的情况下,将块划分为正方形子块或非正方形子块是可行的。
图8是示出在四叉树加非对称二叉树划分结构中递归地执行非对称二叉树划分的示图。
参照图8,已被执行非对称二叉树划分的块通过非对称二叉树划分进一步被递归地划分。在这种情况下,将非对称二叉树划分结构分类为二对称划分、二非对称划分(以2的幂划分尺寸(例如,S/4或3*S/4))、三非对称二划分(例如,S/3或2*S/3)。这里,S表示更高等级的块的水平尺寸或垂直尺寸。
在此期间,对于四叉树加非对称二叉树划分,用信号发送以下标志中的至少一个,其中,第一标志指示是否需要执行四叉树划分,第二标志指示是否需要执行二叉树划分,第三标志指示水平划分或垂直划分,第四标志指示对称划分或非对称划分,第五标志指示非对称划分的类型(例如,左侧/上方或右侧/下方)。第一标志可具有指示需要执行四叉树划分的第一值或指示不需要执行进一步划分的第二值。第二标志可具有指示需要执行二叉树划分的第一值或指示不需要执行进一步划分的第二值。第三标志可具有指示水平划分的第一值或指示垂直划分的第二值。第四标志可具有指示对称划分的第一值或指示非对称划分的第二值。第五标志可具有指示左侧或上侧的第一值或者指示右侧或下侧的第二值。仅当第一标志具有第二值时,才用信号发送第二标志。仅当第二标志具有第一值时,才用信号发送第三标志和第四标志。仅当第四标志具有第二值时,才用信号发送第五标志。此外,当基于CU的尺寸和/或深度确定CU不能被进一步划分时,不用信号发送第一标志、第二标志、第三标志、第四标志和/或第五标志。这里,可用信号发送指示非对称划分的第一索引,而非第五标志。
另一方面,第一标志、第二标志、第三标志、第四标志和第五标志(或第一索引)作为单独的各条信息而被用信号发送,或者第一标志至第五标志中的一些或全部可作为单条信息而被一起用信号发送。
在比CU更高的等级(例如,视频序列级、画面级、条带级、并行块级或CTU级)用信号发送二叉树划分可用性信息和非对称划分可用性信息中的至少一个。在这种情况下,基于二叉树划分可用性信息和非对称划分可用性中的至少一个来确定是否用信号发送第二标志、第三标志、第四标志和第五标志(或第一索引)。例如,当二叉树划分不可用时,不用信号发送第二标志、第三标志、第四标志和第五标志(或第一索引)。例如,当二叉树划分可用并且非对称划分不可用时,不用信号发送第四标志和第五标志(或第一索引)。
可选地,基于CU的尺寸和/或深度,确定是可通过二叉树划分还是可通过非对称划分来划分CU。例如,当兴趣CU具有不能被非对称划分的尺寸时,不用信号发送针对兴趣CU的第四标志和第五标志(或第一索引)。
图9是示出四叉树加非对称二叉树划分结构的信令的示图。
参照图9,可通过用信号发送四叉树加对称二叉树划分结构以及最多两个二进制位来表示四叉树加非对称二叉树划分结构。
在图9中,第一个二进制位指示是否将使用非对称二叉树划分。当第一个二进制位是指示将使用非对称二叉树划分的“非对称”时,另外用信号发送指示非对称划分的类型的第二个二进制位。
另一方面,如图9中所示的所添加的两个二进制位被熵编码/熵解码为单个上下文。
作为四叉树加非对称二叉树划分的示例,存在一种称为“四叉树加移位二叉树划分”的分区结构。四叉树加移位二叉树划分是指首先执行四叉树划分并且然后执行具有移位的二叉树划分的分区结构。
图10和图11示出四叉树加移位二叉树划分的示例。
图10示出可以以2的幂划分的四叉树加移位二叉树划分的一个实施例。
在图10中,第一行分别示出四叉树划分、水平对称划分和垂直对称划分的示例。在图10中,第二行示出沿各个方向的1:3的移位二叉树划分的示例,并且第三行示出沿各个方向的3:5的移位二叉树划分的示例。
当块的水平尺寸或垂直尺寸是2n(n是正整数)并且等于或小于M(这里,M是正整数(例如,16))时,该块被执行具有1:3的划分比例的移位二叉树划分,从而生成尺寸为1/4和3/4的更小的子块。当块的水平尺寸或垂直尺寸是2n并且大于M时,该块被执行具有3:5的划分比例的移位二叉树划分,从而生成尺寸为3/8和5/8的子块。
图11示出不可以以2的幂划分的四叉树加移位二叉树划分结构的一个实施例。
第一行、第二行和第三行分别示出沿各个方向的具有1:2、1:4和2:3的划分比例的移位二叉树划分的示例。
当块的水平尺寸或垂直尺寸不是2n(n是正整数)而是3×2n时,该块被执行具有1:2的划分比例的移位二叉树划分,从而生成尺寸为1/3和2/3的子块。当块的水平尺寸或垂直尺寸不是2n而是5×2n时,该块被执行具有1:4的划分比例的移位二叉树划分,从而生成尺寸为1/5和4/5的子块,或者被执行以2:3的划分比例的移位二叉树划分,从而生成尺寸为2/5和3/5的子块。
图12是用于描述四叉树加具有移位的二叉树(QT+BTS)划分结构的信令的示图。
可根据划分方向和划分比例来确定通过具有移位的二叉树(BTS)结构的划分。
基于先前划分的划分方向对二叉树划分方向进行熵编码/熵解码。换句话说,可用信号发送正交划分或平行划分,而不用信号发送水平划分或垂直划分。
正交划分是指相对于先前划分的反向划分。例如,当先前划分是垂直方向划分并且用信号发送正交划分时,当前块被执行水平划分。
相反,平行划分是指与先前划分同向划分。例如,当先前划分是垂直方向划分并且用信号发送平行划分时,当前块被执行垂直划分。
参照图12,根据规则设置第一划分。对于两个划分方向(正交和平行),用信号发送两个二进制标志(即,perpend_split_flag和parallel_split_flag)。随后,使用二元决策树用信号发送划分比例。
在图12中,由于在正交划分下构建的分层树与在平行划分下构建的分层树相同,因此未示出相同的分层树结构。当特定节点仅具有一个子节点(叶节点)时,不用信号发送划分信息。
当根据四叉树加非对称二叉树划分结构来划分CU时,在2×6、2×14、6×2、14×2或更大的块尺寸等级确定需要执行哪种预测(帧内预测或帧间预测)。
在四叉树加二叉树划分结构中,用于下一个块划分的参数被定义,并且然后在更高等级的单元被熵编码/熵解码。更高等级的单元包括视频参数集(VPS)、序列参数集(SPS)、画面参数集(PPS)、并行块头、条带头和编码树单元(CTU)中的至少一个。
CTUSize表示四叉树根节点尺寸。
MinQtSize表示最小允许的四叉树叶节点尺寸。
MaxBtSize表示最大允许的二叉树根节点尺寸。
MaxBTDepth表示最大允许的二叉树深度。
MinBtSize表示最小允许的二叉树叶节点尺寸。
上述块划分结构的参数中的至少一个可被用作亮度信号和色度信号中的至少一个的参数。
此外,分别针对亮度信号和色度信号,对块划分结构的参数中的至少一个进行熵编码/熵解码,以针对亮度信号和色度信号具有不同参数值。此外,分别针对Cb信号和Cr信号,对块划分结构的参数中的至少一个进行熵编码/熵解码,以针对Cb信号和Cr信号具有不同的参数值。
块划分结构的参数中的至少一个可被用作每种条带类型(即,I、P或B)的参数。
此外,分别针对每种条带类型,对块划分结构的参数中的至少一个进行熵编码/熵解码,以针对各种条带类型具有不同的参数值。
此外,可基于当前块的深度或尺寸与预定阈值之间的比较结果来确定块划分结构的参数中的至少一个。预定阈值是指决定块结构的参考深度或尺寸。可以以最小值和最大值中的至少一个的形式表示阈值。预定阈值是在编码器和解码器侧预设的固定值或者是基于当前块或邻近块的编码参数推导出的可变值。可选地,预定阈值可作为包括在比特流中的一条信息被用信号发送。
作为四叉树加二叉树划分结构的示例,CTUSize被设置为128×128个亮度样点或64×64个色度样点。
在每个维度(宽度和高度的每个)将MinQTSize设置为16×16个样点、将MaxBTSize设置为64×64个样点、将MinBTSize设置为4×4个样点,并且将MaxBTDepth设置为四(4)。
CTU被执行四叉树划分以生成四叉树叶节点。
递归地执行四叉树划分直到达到MinQTSize为止。
四叉树叶节点的尺寸范围为从尺寸为16×16个样点(即MinQTSize)到尺寸为128×128个样点(即CTUSize)。
当四叉树叶节点的尺寸为128×128个样点时,由于它的MaxBTsize大于64×64个样点,因此不执行二叉树划分。否则(即,当四叉树叶节点的尺寸小于64×64个样点时),通过二叉树划分来划分四叉树叶节点。换句话说,当四叉树叶节点的尺寸不大于MaxBTSize时,通过二叉树划分来递归地划分四叉树叶节点。因此,四叉树叶节点用作二叉树的根节点并且二叉树深度可为零。
当二叉树深度达到MaxBTDEpth=4时,不进一步执行二叉树划分。当二叉树节点的水平尺寸(宽度)等于MinBTSize=4时,二叉树节点不被执行另外的水平对称划分。类似地,当二叉树节点的垂直尺寸(高度)等于MinBTSize=4时,二叉树节点不被执行另外的垂直对称划分。当二叉树节点的水平尺寸(宽度)等于MinBTSize=4时,二叉树节点不被执行另外的垂直对称划分。类似地,当二叉树节点的垂直尺寸等于MinBTSize=4时,二叉树节点不被执行另外的水平对称划分。
这些二叉树叶节点被执行包括预测、变换、量化、反量化、逆变换和变换系数编码/解码的处理中的至少一个,而不被执行另外的划分。
CTUSize、MinQTSize、MaxBTSize、MaxBTDepth和MinBTSize的上述值仅出于说明性目的而被提供,并且不限于此。
在四叉树加二叉树划分结构中,当将被执行四叉树划分的块尺寸、划分深度和区域中的至少一个与将被执行二叉树划分的块尺寸、划分深度和区域中的至少一个相同时,一起用信号发送四叉树分区结构的信息和二叉树分区结构的信息。在这种情况下,当四叉树划分结构与二叉树划分结构之间的块尺寸、划分深度和区域中的至少一个的重叠最小时,针对块尺寸、划分深度和区域中的至少一个,可用信号发送仅四叉树划分结构的信息,并且可用信号发送仅二叉树划分结构的信息。
为此,可基于预定阈值与块尺寸、划分深度和区域中的至少一个之间的比较来确定针对四叉树加二叉树块划分结构的参数中的至少一个。预定阈值可表示用于确定块结构的参考块尺寸、参考划分深度和参考区域中的至少一个。可以以最小值和最大值中的至少一个的形式表示阈值。预定阈值是在编码器侧和解码器侧预设的固定值或者是基于当前块或邻近块的编码参数推导出的可变值。可选地,预定阈值可作为包括在比特流中的一条信息而被用信号发送。
例如,在编码器侧和解码器侧,最小允许的四叉树叶节点尺寸MinQTSize可被设置为固定值N×N,并且最大允许的二叉树根节点尺寸MaxBTSize可被设置为固定值M×M。这里,M小于N。例如,N是固定值16,并且M是固定值8。
四叉树和二叉树组合(CQB)划分
根据本发明的一个实施例的分区结构可以是四叉树和二叉树组合(CQB)划分结构。四叉树和二叉树组合划分结构是指无优先级地执行四叉树划分和二叉树划分的分区结构。如上所述,在四叉树加二叉树划分结构中,必须首先执行四叉树划分。然而,在四叉树和二叉树组合(CQB)划分结构中,四叉树划分不必先于二叉树划分。也就是说,二叉树划分可先于四叉树划分。
图13示出根据本发明的实施例的四叉树和二叉树组合划分结构。
参照图13,在四叉树和二叉树组合划分结构中,CU被执行四叉树划分或二叉树划分。这里,当CU将被划分为两个更小的单元时,将通过二叉树划分来划分CU。同时,当CU将被划分为四个更小的单元时,将通过四叉树划分来划分CU。由于CU是通过对CTU执行四叉树和二叉树组合划分来生成的,因此每个CU可具有正方形形状或非正方形(长方形)形状。
通过使用四叉树和二叉树组合划分结构,可以以宽度不小于第一特定值且高度不小于第二特定值的非正方形块的形式对图像进行编码/解码。
对于四叉树和二叉树组合划分,用信号发送第一索引或第二索引或者第一索引和第二索引两者,其中,第一索引指示四叉树划分、二叉树划分或不再划分,第二索引指示水平划分或垂直划分。
第一索引可具有指示不再划分的第一值、指示四叉树划分的第二值或指示二叉树划分的第三值。第一标志可具有指示水平划分(即,宽度方向划分)的第一值或指示垂直划分(即,高度方向划分)的第二值。仅当第一索引具有第三值时,才用信号发送第一标志。
这里,当基于第一索引的值执行四叉树划分时,从划分得到的所有子节点的尺寸在每个围度上是父节点的尺寸的一半。在这种情况下,所有子节点包括四个节点,并且具有相等的尺寸。这里,父节点是指将被划分的目标块,并且子节点是指通过划分目标块而生成的块。每个子节点的尺寸为M×N。这里,M和N均为正整数,诸如1、2、4、8、16、32等。
当基于第一索引和第一标志,块以二叉树结构的形式被划分时,指示划分位置信息的第二索引被另外用信号发送。
基于划分位置信息以二叉树结构的形式对当前块进行划分。对于水平二叉树划分,划分位置信息是指相对于父节点的位置、尺寸和形状中的至少一个的每N个样点的偏移(每N样点偏移)。在这种情况下,从父节点的上端的每N样点偏移或从父节点的下端的每N样点偏移可表示划分位置信息。其中,N是正整数,诸如1、2、4、8、16、32等。
类似地,对于垂直二叉树划分,划分位置信息是指相对于父节点的位置、尺寸和形状中的至少一个的每N个样点的偏移(每N样点偏移)。在这种情况下,从父节点的左端的每N样点偏移或从父节点的右端的每N样点偏移可表示划分位置信息。
以指示预先配置的偏移集内的值的索引的形式用信号发送划分位置信息,其中,所述偏移集是基于块的宽度(水平尺寸)或高度(垂直尺寸)而被配置的。
这里,作为用于偏移的处理单位的N值在更高等级的单元被熵编码/熵解码,然后被用于表示四叉树和二叉树组合划分结构。更高等级的单元包括视频参数集(VPS)、序列参数集(SPS)、画面参数集(PPS)、并行块头、条带头和编码树单元(CTU)中的至少一个。N值可被用作亮度信号和色度信号中的至少一个的参数。此外,可分别针对亮度信号和色度信号对N值进行熵编码/熵解码,以针对亮度信号和色度信号具有不同的参数值。可分别针对Cb信号和Cr信号对N值进行熵编码/熵解码,以针对Cb信号和Cr信号具有不同的值。N值可被用作每种条带类型(I、P或B)的参数。此外,可分别针对每种条带类型对N值进行熵编码/熵解码,以针对各种条带类型具有不同的参数值。
N值可以是在编码器侧和解码器侧预设的固定值或者是基于当前块或邻近块的编码参数推导出的可变值。此外,根据N值,基于当前块的深度或尺寸来执行上下文模型确定和上下文模型更新中的至少一个。可选地,基于指示块划分结构的另一标志或索引来执行上下文模型确定和上下文模型更新中的至少一个。
上述索引和标志中的至少一个在CU级、CTU级或更高等级被熵编码/熵解码。可选地,索引和标记中的至少一个可以是在编码器侧和解码器侧预设的固定值或者可以是基于当前块或邻近块的编码参数推导出的可变值。
根据索引和标志中的至少一个,基于当前块的深度或尺寸来执行上下文模型确定和上下文模型更新中的至少一个。基于指示块划分结构的另一标志和另一索引来执行上下文模型确定和上下文模型更新中的至少一个。
CTU可通过四叉树结构或二叉树结构被划分。此时,四叉树叶节点或二叉树叶节点是指编码单元(CU)。
在四叉树和二叉树组合划分结构中,下一个块的划分结构的参数被定义,在更高等级被熵编码/熵解码,并且被用于表示四叉树和二叉树组合的形式块划分结构。更高等级包括视频参数集(VPS)、序列参数集(SPS)、画面参数集(PPS)、并行块头、条带头和CTU中的至少一个。
CTUSize表示根节点尺寸。
MinCUSize表示最小允许的叶节点尺寸。
MaxCUDepth表示最大允许的CU深度。
上述块划分结构的参数中的至少一个可被用作亮度信号和色度信号中的至少一个的参数。
此外,分别针对亮度信号和色度信号对块划分结构的参数中的至少一个进行熵编码/熵解码,以针对亮度信号和色度信号具有不同的参数值。分别针对Cb信号和Cr信号对块划分结构的参数中的至少一个进行熵编码/熵解码,以针对Cb信号和Cr信号具有不同的参数值。
块划分结构的参数中的至少一个可被用作每种条带类型(即,I、P或B)的参数。
此外,分别针对每种条带类型对块划分结构的参数中的至少一个进行熵编码/熵解码,以针对各种条带类型具有不同的参数值。
此外,可基于当前块的深度或尺寸与预定阈值之间的比较结果来确定块划分结构的参数中的至少一个。预定阈值是指确定块结构的参考深度或尺寸。可以以最小值和最大值中的至少一个的形式表示阈值。预定阈值是在编码器侧和解码器侧预设的固定值或者是基于当前块或邻近块的编码参数推导出的可变值。可选地,预定阈值可作为包括在比特流中的一条信息而被用信号发送。
例如,在四叉树和二叉树组合划分结构中,CTUSize是尺寸为128×128个亮度样点或尺寸为64×64个色度样点。
将MinCUSize设置为4×4个样点,并且将MaxCUDepth设置为五(5)。CTU被执行四叉树划分或二叉树划分以生成叶节点。递归地执行四叉树划分或二叉树划分直到块尺寸达到MinCUSize为止。
当CU深度达到MaxCUDepth=5时,不再执行划分。此外,当四叉树节点的水平尺寸或垂直尺寸等于MinCUSize=4时,不再执行划分。当二叉树节点的水平尺寸等于MinCUSize=4时,不再执行水平对称划分。类似地,当二叉树节点的垂直尺寸等于MinCUSize=4时,不再执行垂直对称划分。此外,当二叉树节点的水平尺寸等于MinCUSize=4时,不再执行垂直对称划分。类似地,当二叉树节点的垂直尺寸等于MinCUSize=4,不再执行水平对称划分。
当CU通过使用四叉树和二叉树组合划分结构被划分时,以尺寸为2×4、4×4、4×2、4×8、8×4或更大(被设置为MinCUSize的叶节点尺寸)的块为单位确定使用帧内预测和帧间预测之中的哪种预测模式。叶节点被执行诸如预测、变换、量化、反量化、逆变换和变换系数编码/解码的处理中的至少一个,而不被执行进一步的划分。
CTUSize、MinCuSize和MaxCuDepth的上述值是出于说明性目的而被提供的,并且不限于此。
四叉树加二叉树和三叉树(QT+BTTT)
本发明的一个实施例提供了一种四叉树加二叉树/三叉树划分结构。四叉树加二叉树/三叉树划分是指一种首先执行四叉树划分并且其次执行二叉树划分或三叉树划分的分区结构。这里,二叉树/三叉树可以是已经参照图3描述的组合树。因此,四叉树加二叉树/三叉树划分结构可被称为四叉树加多类型树划分结构。
图14示出在四叉树加二叉树/三叉树划分中使用的划分形式,其中,(a)表示四叉树划分,(b)表示垂直二叉树划分,(c)表示水平二叉树划分,(d)表示垂直三叉树划分,以及(e)表示水平三叉树划分。
图15示出包括根据块类型的垂直二叉树划分(BI_VER_SPLIT)、水平二叉树划分(BI_HOL_SPLIT)、垂直三叉树划分(TRI_VER_SPLIT)和水平三叉树划分的分区的示例。BI_VER_SPLIT、BI_HOL_SPLIT、TRI_VER_SPLIT和TRI_HOL_SPLIT分别表示垂直二叉树划分模式、水平二叉树划分模式、垂直三叉树划分模式和水平三叉树划分模式。除此之外,还存在另外的划分模式:NO_SPLIT,指示不再划分;以及QUAD_SPLIT,指示四叉树划分模式。
当四叉树加二叉树/三叉树划分被执行时,首先通过四叉树划分来划分CTU,然后通过二叉树划分和三叉树划分中的至少一个来进一步递归地划分最大尺寸的CU。例如,当CTU的尺寸为256×256时,将CTU划分为四个128×128的CU,每个128×128的CU是最大CU并且可被更深地划分。
通过使用二叉树/三叉树划分结构,可生成正方形CU和非正方形CU。
当CTU的尺寸为128×128时,CTU可不被执行四叉树划分。
在上述实施例中,CU的形式由CU的水平尺寸与垂直尺寸的比例来表示。例如,当水平尺寸与垂直尺寸相同时,CU可被表示为1:1的CU或正方形CU。当水平尺寸为64并且垂直尺寸为16时,CU被表示为1:4的CU或非正方形CU。
基于允许的块划分类型、最小允许的尺寸和最大允许的尺寸执行块分区,来执行块划分。也就是说,基于针对每种块划分类型的最小尺寸和最大尺寸的信息来确定可允许的块划分模式的数量。
具体地,针对当前CU的可允许的划分模式依据更高等级的信令而变化。例如,对于每种CU形式,用更高等级的参数集或头用信号发送最大尺寸和最小尺寸。(这里,所有尺寸均以log2刻度表示,并且minus2是通过从log2刻度原始尺寸减去2而获得的值。)
log2_cu_11_ratio_max_minus2:1:1的CU的最大允许的尺寸。
log2_cu_11_ratio_min_minus2:1:1的CU的最小允许的尺寸。
log2_cu_12_ratio_max_minus2:1:2的CU或2:1的CU(更长边)的最大允许的尺寸。
log2_cu_12_ratio_min_minus2:1:2或2:1的CU(更长边)的最小允许的尺寸。
log2_cu_14_ratio_max_minus2:1:4或4:1的CU(更长边)的最大允许的尺寸。
log2_cu_14_ratio_min_minus2:1:4或4:1的CU(更长边)的最小允许的尺寸。
log2_tri_split_max_minus2:三叉树划分(更长边)的最大允许的尺寸。
log2_tri_split_min_minus2:三叉树分区(更长边)的最小允许的尺寸。
例如,当CU的尺寸为128×128个样点并且log2_cu_12_ratio_max_minus2为4(即,1:2的CU的最大允许的尺寸为64)时,不允许垂直划分模式和水平划分模式。
对于另一示例,当CU的水平尺寸大于64并且垂直尺寸为64时,将不允许水平二叉树划分。此外,CU的水平尺寸大于64并且垂直尺寸为64,不用信号发送与水平二叉树划分相关的信息。否则,允许水平二叉树划分,并且用信号发送与水平二叉树划分相关的信息。
对于另一示例,当CU的垂直尺寸大于64并且水平尺寸为64时,不允许垂直二叉树划分。此外,当CU的垂直尺寸大于64并且水平尺寸为64时,不用信号发送与垂直二叉树划分相关的信息。否则,允许垂直二叉树划分,并且用信号发送与垂直二叉树划分相关的信息。
CU的水平尺寸和/或垂直尺寸不限于64。CU的水平尺寸和/或垂直尺寸不可与M的值进行比较。此外,M具有与变换单元或逆变换单元的水平尺寸和/或垂直尺寸的最大值相同的值。此外,M具有与变换矩阵或逆变换矩阵的水平尺寸和/或垂直尺寸的最大值相同的值。
M的值可在包括视频参数集(VPS)、序列参数集(SPS)、画面参数集(PPS)、并行块头、条带头和编码树单元(CTU)的一个或更多个等级被熵编码/熵解码。可选地,M可以是在编码器侧和解码器侧预设的值。
对于另一示例,当CU的尺寸为128×128个样点并且log2_tri_split_max_minus2为4(即,三叉树最大允许的尺寸为64)时,可不允许三叉树划分模式。也就是说,CU的水平尺寸大于64并且垂直尺寸大于64,可不允许三叉树划分。可选地,当CU的水平尺寸或垂直尺寸大于64时,可不用信号发送与三叉树划分相关的信息。当CU的水平尺寸和垂直尺寸等于或小于64时,允许三叉树划分。此外,当CU的水平尺寸或垂直尺寸等于或小于64时,不用信号发送与三叉树划分相关的信息。在这种情况下,作为三叉树划分,使用水平三叉树划分和垂直三叉树划分中的至少一个。
对于另一示例,当CU的水平尺寸和垂直尺寸两者大于64时,可不允许三叉树划分。此外,当CU的水平尺寸和垂直尺寸两者大于64时,不用信号发送与三叉树划分相关的信息。因此,当CU的水平尺寸和垂直尺寸两者等于或小于64时,可允许三叉树划分。此外,当CU的水平尺寸和垂直尺寸两者等于或小于64时,可用信号发送与三叉树划分相关的信息。在这种情况下,作为三叉树划分,可使用水平三叉树划分和垂直三叉树划分中的至少一个。
对于另一示例,当CU的水平尺寸大于64并且垂直尺寸等于64时,可不允许三叉树划分。此外,当CU的水平尺寸大于64并且垂直尺寸等于64时,可不用信号发送与三叉树划分相关的信息。因此,当CU的水平尺寸和垂直尺寸两者等于或小于64时,可允许三叉树划分。此外,当CU的水平尺寸和垂直尺寸两者等于或小于64时,可用信号发送与三叉树划分相关的信息。在这种情况下,作为三叉树划分,使用水平三叉树划分和垂直三叉树划分中的至少一个。
对于另一示例,当CU的垂直尺寸大于64并且水平尺寸等于64时,不允许三叉树划分。此外,当CU的垂直尺寸大于64并且水平尺寸等于64时,不用信号发送与三叉树划分相关的信息。因此,当CU的水平尺寸和垂直尺寸两者等于或小于64时,允许三叉树划分。此外,当CU的水平尺寸和垂直尺寸两者等于或小于64时,用信号发送与三叉树划分相关的信息。在这种情况下,作为三叉树划分,使用水平三叉树划分和垂直三叉树划分中的至少一个。
CU的水平尺寸和/或垂直尺寸不限于64。CU的水平尺寸和/或垂直尺寸可与N进行比较。N可具有与变换块或逆变换块的水平尺寸和/或垂直尺寸的最大值相同的值。可选地,N可具有与变换矩阵或逆变换矩阵的水平尺寸和/或垂直尺寸的最大值相同的值。
可以以视频参数集(VPS)、序列参数集(SPS)、画面参数集(PPS)、并行块头、条带头和编码树单元(CTU)中的至少一个为单位对N的值进行熵编码/熵解码。N可以是在编码器侧和解码器侧预设的值。
图16是用于描述在四叉树加二叉树/三叉树划分结构中可允许的划分模式的示图。
当当前CU的尺寸为64×64个样点,log2_tri_split_max_minus2为4(即,允许三叉树划分的CU最大尺寸为64),log2_cu_12_ratio_max_minus2为4(即,1:2的CU的最大允许的尺寸为64),并且log2_cu_14_ratio_max_minus2为3(即,1:4的CU的最大允许的尺寸为32)时,不允许用于生成尺寸为16×64或64×16的CU的垂直三叉树模式(TRI_VER_SPLIT),或者不允许用于生成尺寸为16×64或64×16的CU的水平三叉树模式(TRI_HOR_SPLIT)。
当当前CU的尺寸为32×64,log2_tri_split_max_minus2为4(即,允许三叉树划分的最大CU尺寸为64),log2_cu_12_ratio_max_minus2为4(即,1:2的CU的最大允许的尺寸为64),并且log2_cu_14_ratio_max_minus2为3(即1:4的CU的最大允许的尺寸为32)时,不允许用于生成尺寸为16×64或64×16的CU的垂直二叉树模式(BI_VER_SPLIT)和垂直三叉树模式(TRI_VER_SPLIT)。
图17是示出在每个可允许的划分模式下的比特分配的实施例的示图。
参照图17,当可允许的划分模式的数量为一个时,分配一个比特用于表示划分模式。当可允许的划分模式的数量为两个时,最多分配两个比特用于表示划分模式。当可允许的划分模式的数量为三个或四个时,最多分配三个比特用于表示划分模式。
图18是用于描述四叉树加二叉树/三叉树划分结构的信令的示图。
参照图18,当当前块根据四叉树加二叉树/三叉树划分结构被划分时,第一个二进制位表示是否执行四叉树划分,第二个二进制位表示是否执行二叉树/三叉树划分,第三个二进制位指示垂直划分或水平划分,第四个二进制位指示二叉树划分或三叉树划分,并且第五个二进制位和第六个二进制位表示二叉树划分的类型。
图18中所示的二进制位作为多个语法元素(或多条信息)或者作为一个语法元素(或一条信息)被用信号发送。当所述二进制位作为多个语法元素被用信号发送时,用信号发送第一标志、第二标志、第三标志、第四标志和第一索引中的至少一个,其中,第一标志指示是否执行四叉树划分,第二标志指示是否执行二叉树/三叉树划分,第三标志指示垂直划分或水平划分,第四标志指示二叉树划分或三叉树划分,第一索指示二叉树划分的类型。
在图18中,第三个二进制位指示垂直划分或水平划分,第四个二进制位指示二叉树划分或三叉树划分。然而,本发明不限于此。第三个二进制位可指示二叉树划分和三叉树划分中的至少一个,并且第四个二进制位可指示水平划分和垂直划分中的至少一个。
在四叉树加二叉树/三叉树划分结构中,以下参数被定义并且在更高等级被熵编码/熵解码。更高等级的单元包括视频参数集(VPS)、序列参数集(SPS)、画面参数集(PPS)、并行块头、条带头和编码树单元(CTU)中的至少一个。
CTUSize表示四叉树根节点尺寸。
MinQtSize表示最小允许的四叉树叶节点尺寸。
MaxBtSize表示最大允许的二叉树根节点尺寸。
MaxTtSize表示最大允许的三叉树根节点尺寸。
MaxMttDepth表示最大允许的二叉树/三叉树深度。
MinBtSize表示最小允许的叶节点尺寸。
MinTtSize表示最小允许的三叉树叶节点尺寸。
水平尺寸或垂直尺寸大于最大变换尺寸的块被自动划分。也就是说,当块的水平尺寸和垂直尺寸中的至少一个大于最大变换尺寸时,在没有显式信令的情况下自动执行四叉树划分。
例如,在没有显式信令(即,隐式)的情况下,水平尺寸或垂直尺寸大于最大变换尺寸(即,64)的编码单元(CU)(或编码块(CB))被假定为通过四叉树划分被进一步划分。
在另一实施例中,在帧内条带中,当CU的水平尺寸或垂直尺寸大于64时,编码块标志(CBF)的值被假定为零。
在帧内条带中,针对水平尺寸或垂直尺寸大于64的CU,推导并应用跳过模式。
另一方面,在帧间条带中,针对水平尺寸或垂直尺寸大于128的CU,应用跳过模式和AMVP模式(CBF=0)中的至少一个。AMVP模式的CBF不被用信号发送而被假定为零。
在四叉树加二叉树/三叉树划分结构中,可能存在重叠的划分模式。在这种情况下,特定的划分结构可被禁止以防止重叠的划分模式。
例如,连续两次沿第一方向的二叉树划分可在某些情况下产生与以下组合处理相同的分区:首先执行一次沿第一方向的三叉树划分并且然后对中心位置的块执行一次沿第一方向的二叉树划分。也就是说,由连续两次二叉树划分产生的分区可与由以下组合处理产生的分区重叠:由一次三叉树划分和随后的在中心位置的块处的一次二叉树划分组成。因此,为了防止重叠的分区,可不允许在三叉树划分被执行之后对中心位置的块进行二叉树划分。
在四叉树加二叉树/三叉树划分结构中,树节点块可存在于图像的下边界或可跨越图像的右边界。为了使所有的CU能够出现在图像的边界内,可以以下面描述的方式划分存在于下边界或跨越右边界的树节点块。
(1)当树节点块覆盖图像的下边界和右边界两者时,
-当当前块是四叉树节点块并且其尺寸大于最小允许的四叉树叶节点尺寸时,通过四叉树划分来划分当前块,并且
-否则,通过水平二叉树划分来划分当前块。
(2)当树节点块覆盖图像的下边界时,
-当当前块是四叉树节点块并且其尺寸大于最小允许的四叉树叶节点尺寸且大于最大允许的二叉树根节点尺寸时,通过四叉树划分来划分当前块,
-当当前块是四叉树节点块并且其尺寸大于最小允许的四叉树叶节点尺寸且小于最大允许的二叉树根节点尺寸时,通过四叉树划分或水平二叉树划分来划分当前块,并且
-否则,通过水平二叉树划分来划分当前块。
(3)当树节点块的图像覆盖右边界时,
-当当前块是四叉树节点块并且其尺寸大于最小允许的四叉树叶节点尺寸且大于最大允许的二叉树根节点尺寸时,通过四叉树划分来划分当前块,
-当当前块是四叉树节点块并且其尺寸大于最小允许的四叉树叶节点尺寸且等于或小于最大允许的二叉树根节点尺寸时,通过四叉树划分或垂直二叉树划分来划分当前块,并且
-否则,通过垂直二叉树划分来划分当前块。
划分为正方形(STS)
本发明的一个实施例提供了一种划分为正方形(STS)的划分结构。划分为正方形的划分结构是指在四叉树加二叉树/三叉树划分中除了执行二叉树/三叉树划分之外还进一步执行正方形划分的分区结构。这里,划分为正方形的划分是指将块划分为正方形子块的处理。也就是说,在四叉树加二叉树/三叉树划分中,当块的水平尺寸与垂直尺寸的比例为1:1、1:4或4:1时,应用划分为正方形的结构。例如,当划分为正方形的结构被应用于尺寸为64×16的块时,生成四个尺寸为16×16的CU。
在本实施例中,图19示出针对关于STS结构的信息的信令的二值化表。
根据本发明的上述实施例的划分结构中的叶节点被定义为CU。在这种情况下,CU被用作预测或变换的基本单元,而无需被另外划分。也就是说,在四叉树加二叉树划分结构、四叉树和二叉树组合划分结构、四叉树加二叉树/三叉树划分结构以及划分为正方形的划分结构中,CU、PU和TU可在以上划分结构中的至少一个中具有相同的形状和尺寸。
此外,可基于每个CU来确定选择帧内预测或帧间预测。也就是说,在四叉树加二叉树块划分结构中,可基于每个正方形块或每个非正方形(长方形)块来执行帧内预测、帧间预测、变换、逆变换、量化、反量化、熵编码/熵解码和环内滤波中的至少一个处理。
一个CU由一个亮度分量块Y以及两个色度分量块Cb和Cr组成。可选地,一个CU可仅由一个亮度分量块组成或仅由两个色度分量块组成。进一步可选地,一个CU可仅由一个亮度分量块组成,仅由Cr色度分量块组成或仅由Cb色度分量块组成。
分离PU/TU树划分
本发明的一个实施例提供了一种分离PU/TU树划分结构。分离PU/TU树划分结构是指CTU不被划分为CU而是被划分为PU和TU的分区结构。可通过四叉树划分、二叉树划分、三叉树划分和划分为正方形的划分中的至少一个来执行PU划分和TU划分。可基于每个PU或每个TU来用信号发送关于PU或TU的划分信息。
例如,当PU被划分时,用信号发送指示是否通过四叉树划分结构来进一步划分PU或者是否不执行进一步划分的第一标志。当TU被划分时,用信号发送指示是否通过四叉树结构来划分TU或者是否不执行进一步划分的第一标志。
图20是示出分离PU/TU树划分的一个示例的示图。
在分离PU/TU树划分中,一个PU可包括多个TU,或者一个TU可包括多个PU。也就是说,一个PU的边界可包括多个TU的边界,并且一个TU的边界可包括多个PU的边界。
在分离PU/TU树结构中,由于不执行对CU的块划分,因此将PU的叶节点用作仅用于帧内预测、帧间预测和运动补偿的最佳单元,并且将TU的叶节点用作仅用于变换、逆变换、量化、反量化和变换系数编码/解码的最佳单元。也就是说,基于每个PU来确定是使用帧内预测还是使用帧间预测。
对于分离PU/TU树划分,在视频参数集(VPS)、序列参数集(SPS)、画面参数集(PPS)、并行块头、条带头、CTU和CU中的至少一个等级对CTU的最大/最小尺寸信息、PU的最大/最小尺寸信息、PU的最大深度信息、TU的最大/最小尺寸信息中和TU的最大深度信息中的至少一个进行熵编码/熵解码。此外,CTU的最大/最小尺寸信息、PU的最大/最小尺寸信息、PU的最大深度信息、TU的最大/最小尺寸信息中和TU的最大深度信息中的至少一个是在编码器侧和解码器侧预设的固定值,或者是从当前块的编码参数推导出的可变值。
例如,CTU的尺寸为128×128,PU的最大尺寸可以是128×128,并且TU的最大尺寸可以是128×128。此外,PU的最小尺寸和TU的最小尺寸可以是4×4。PU的深度的范围可从零到与最小尺寸4×4对应的值,其中,在PU的尺寸等于CTU的尺寸时该PU的深度为零。类似地,TU的深度的范围可从零到与最小尺寸4×4对应的值,其中,在TU的尺寸等于CTU的尺寸时该TU的深度为零。
对于分离PU/TU树划分中的PU划分和TU划分,可使用上述CU划分方法。
用信号发送指示需要使用哪种划分结构的划分结构信息。划分结构信息指示四叉树加二叉树划分、四叉树和二叉树组合划分、四叉树加二叉树/三叉树划分、划分为正方形的划分和分离PU/TU树划分中的至少一个。这里,可在视频参数集(VPS)、序列参数集(SPS)、画面参数集(PPS)、并行块头、条带头和CTU中的至少一个等级用信号发送划分结构信息。
在下面描述的实施例中,至少一种方法或者两种或更多种方法的任意组合可被用于上述划分结构中的至少一个,其中,上述划分结构包括四叉树加二叉树划分、四叉树和二叉树组合划分、四叉树加二叉树/三叉树划分、划分为正方形的划分以及分离PU/TU树划分。
也就是说,以下描述中的块划分结构是指四叉树加二叉树划分、四叉树和二叉树组合划分、四叉树加二叉树/三叉树划分、划分为正方形的划分以及分离PU/TU树划分中的至少一个。
根据本发明的实施例的块划分结构除了针对CU划分是有效的外,针对PU划分或TU划分也是有效的。
对于用作帧内预测、帧间预测和运动补偿的基本单元的PU,可使用上述块划分结构中的至少一个来递归地划分PU。在这种情况下,对于每个PU,多个邻近PU中的最接近的邻近PU的编码参数的至少一个参数可被用于帧内预测、帧间预测和运动补偿中的至少一个。
可使用上述块划分结构中的至少一个来递归地划分用作变换、逆变换、量化、反量化和变换系数编码/解码的基本单元的每个TU。在这种情况下,对于每个TU,多个邻近TU中的最接近的邻近TU的编码参数中的至少一个可被用于变换、逆变换、量化、反量化和变换系数编码/解码中的至少一个。
此外,当通过使用上述块划分结构来划分TU以生成多个块时,可通过使用在对每个块执行首次变换之后生成的DC系数来对每个块执行另外的变换。类似地,通过使用在对每个块执行首次逆变换然后执行逆变换期间生成的每个块的DC系数来执行另外的逆变换。最接近的PU(或TU)是与当前PU(或TU)共享水平边界或垂直边界的PU(或TU),或者是与当前PU(或TU)的顶点邻接的PU。
在根据本发明的一个实施例的块划分结构中,运动信息(例如,运动矢量、参考画面索引、帧间预测指示符等)基于每个最小尺寸的CU被存储,并被用于帧间预测或运动补偿。例如,最小尺寸的CU是由MinQTSize、MinBTSize和MinCUSize指示的块尺寸。
在根据本发明的一个实施例的块划分结构中,基于树结构,可以以最小块尺寸或者等于或小于CTU的更大尺寸为单位用信号发送从如下信息中选择的在单元等级(诸如TU)必要的至少一条信息:量化参数、编码块标志、变换跳过模式信息、指示首次变换是否将被执行的信息、指示二次变换是否将被执行的信息、首次变换索引、二次变换索引、指示重叠变换是否将被执行的信息。这里,变换跳过模式信息可被包括在将被用信号发送的首次变换索引中。
重叠变换是指在执行变换时除了对当前块的残差块数据进行变换之外还对当前块的邻近块的残差块数据进行变换以消除块之间的不连续性的处理。可依据块尺寸和帧内预测模式/方向中的至少一个来确定重叠变换是否将被执行。可根据可分离的变换属性通过两种类型的一维变换来执行重叠变换。
在根据本发明的一个实施例的块划分结构中,依据块尺寸/形状来确定CU、PU和TU中的至少一个的扫描顺序或编码/解码顺序。
在根据本发明的一个实施例的划分结构中,可使用熵解码的划分信息,根据当前块的形状(正方形或非正方形)和尺寸中的至少一个划分当前块。此外,当划分当前块时,仅可允许针对当前块的反向划分。例如,当首先沿水平方向划分当前块时,仅可沿垂直方向执行对当前块的另外的划分。相反,当首先沿垂直方向划分当前块时,仅可沿水平方向执行对当前块的另外的划分。
例如,在根据本发明的一个实施例的块划分结构中,当当前块是二叉树节点并且当前块将按照一个更深的深度被进一步划分时,不执行划分为非正方形(非正方形划分),而仅执行划分为正方形(正方形划分)。可使用第一标志(指示划分为正方形或不再划分)来用信号发送这种另外的划分。在这种情况下,由于仅需要用信号发送指示划分为正方形的划分信息,因此可节省用于用信号发送指示划分为非正方形的划分信息的比特数。
类似地,在根据本发明的一个实施例的块划分结构中,当当前块是二叉树节点并且当前块将按照一个更深的深度被进一步划分时,不对当前块执行划分为正方形,而仅执行划分为非正方形。利用第一标志(指示划分为非正方形或不再划分)来用信号发送另外的划分。在这种情况下,由于仅需要用信号发送关于划分为非正方形的划分信息,因此可节省用于用信号发送指示划分为正方形的划分信息的比特数。
图21示出针对每个四叉树深度和每个二叉树深度通过块划分结构(即,四叉树加二叉树划分)被分区的CTU的示例。图21示出亮度信号和色度信号通过不同类型的四叉树加二叉树划分结构被划分的CTU的示例。图22示出Cb色度信号和Cr色度信号通过不同类型的四叉树加二叉树划分结构被划分的CTU的示例。
这里,CTU内的亮度信号和色度信号具有不同的划分结构的划分方法不仅限于对四叉树加二叉树划分结构有效,而且还对四叉树和二叉树组合划分结构、四叉树加二叉树/三叉树划分结构、划分为正方形的划分结构以及分离PU/TU树划分结构有效。
如在图21的示例中,CTU内的亮度信号和色度信号可通过不同的块划分结构被划分。例如,特定条带(例如,I条带或帧内条带)中的CTU内的亮度信号和色度信号可通过不同的块划分结构被划分,而其他条带(P条带和B条带)中的每个中的CTU内的亮度信号和色度信号可具有相同的块划分结构。
参照图21,当CTU的尺寸为128×128时,将CTU划分为四个尺寸为64×64的亮度信号块以及四个尺寸为32×32的色度信号块,并且可将不同类型的四叉树或二叉树划分分别应用于亮度信号块和色度信号块。
当CTU内的亮度信号和色度信号通过不同的块划分结构被划分时,可用信号发送指示在亮度信号块内是否存在至少一个具有非零值的变换系数的编码块标志(CBF),并且还可用信号发送针对色度信号块的CBF标志。
当CTU内的亮度信号和色度信号分别通过不同的块划分结构被划分时,根据指示亮度信号或色度信号的信息、块划分结构、块尺寸和块形状中的任意一个,分别用信号发送针对亮度信号的帧内预测模式和针对色度信号的帧内预测模式。
当CTU内的亮度信号和色度信号分别通过不同的块划分结构被划分时,在对色度信号执行帧内预测时,一起使用相应亮度信号的帧内预测模式和重建的邻近色度信号块的帧内预测模式中的至少一个或至少两个。在这种情况下,可通过基于当前色度信号块的位置计算相应亮度信号块的位置,通过识别位于计算出的位置的亮度信号的帧内预测模式和与计算出的位置相邻的邻近亮度信号块的帧内预测模式,并且通过从识别出的帧内预测模式中选择至少一个帧内预测模式,来推导同位亮度信号的帧内预测模式。
当CTU内的亮度信号和色度信号分别通过不同的块划分结构被划分时,可根据对信号是亮度信号还是色度信号的确定、块划分结构、块尺寸和块形状中的至少一个,将包括去块滤波、自适应样点偏移滤波和自适应环内滤波的滤波方法中的至少一种滤波方法不同地应用于亮度信号和色度信号。
当CTU内的亮度信号和色度信号分别通过不同的块划分结构被划分时,通过禁止颜色间分量预测,来减少用信号发送颜色间分量预测方法所需的信息,从而提高编码效率,其中,在所述颜色间分量预测中,基于重建的亮度信号来获得色度信号的预测块。
如在图22的示例中,当CTU内的Cb色度信号和Cr色度信号可分别通过不同的块划分结构被划分时。
参照图22,当CTU的尺寸为128×128时,将CTU划分为四个尺寸为64×64的亮度信号块、四个尺寸为32×32的Cb色度信号块以及四个尺寸为32×32的Cr色度信号块。然后,可将各种类型的四叉树和二叉树划分结构中的至少一个应用于亮度信号块、Cb色度信号块和Cr色度信号块。
例如,在特定条带(I条带)中,CTU内的Cb色度信号和Cr色度信号可分别通过不同的块划分结构被划分。此外,可利用不同的帧内预测模式对Cb色度信号和Cr色度信号进行编码/解码,并且可分别对Cb色度信号和Cr色度信号的帧内预测模式进行熵编码/熵解码。可通过使用Cr色度信号的帧内预测模式来对Cb色度信号的帧内预测模式进行熵编码/熵解码。相反,可通过使用Cb色度信号的帧内预测模式来对Cr色度信号的帧内预测模式进行熵编码/熵解码。
当作为CTU内的色度信号的Cb信号和Cr信号分别通过不同的块划分结构被划分时,可用信号发送Cb信号块的编码块标志(CBF),并且可用信号发送Cr信号块的编码块标志(CBF)。
当作为CTU内的色度信号的Cb信号和Cr信号分别通过不同的块划分结构被划分时,根据对信号是Cb信号还是Cr信号的确定、块分区结构、块尺寸和块形状中的至少一个,分别用信号发送Cb信号的帧内预测模式和Cr信号的帧内预测模式。
当作为CTU内的色度信号的Cb信号和Cr信号分别通过不同的块划分结构被划分时,当对Cb/Cr信号执行帧内预测时,可使用同位Cb/Cr信号块的帧内预测模式和重建的邻近Cb/Cr信号块的帧内预测模式中的至少一个或至少两个。
当作为CTU内的色度信号的Cb信号和Cr信号分别通过不同的块划分结构被划分时,依据指示Cb信号或Cr信号的信息、块划分结构、块尺寸和块形状,对Cb信号和Cr信号不同地执行去块滤波、自适应样点偏移和自适应环内滤波中的至少一个。
当作为一个CTU内的色度信号的Cb信号和Cr信号分别通过不同的划分结构被划分时,通过禁止颜色间分量残差信号预测方法,可节省用信号发送关于颜色间分量残差信号预测方法的信息所需的信息,并且因此可提高编码效率,其中,在所述颜色间分量残差信号预测方法中,基于重建的Cb/Cr残差信号来执行对Cb/Cr残差信号的预测。
在根据本发明的一个实施例的块划分结构中,可在块尺寸等于或小于特定块尺寸并且块分区深度等于或小于特定块分区深度的条件下不执行进一步划分。
这里,可在视频参数集(VPS)、序列参数集(SPS)、画面参数集(PPS)、并行块头、条带头、CTU和CU中的至少一个等级对特定块尺寸或特定块分区深度的信息进行熵编码/熵解码。
此外,可在每一个等级对特定块尺寸或特定块分区深度的信息进行熵编码/熵解码,以具有不同的参数值。
此外,可分别针对亮度信号和色度信号对特定块尺寸或特定块分区深度的信息进行熵编码/熵解码,以具有不同的参数值。
此外,可分别针对Cb色度信号和Cr色度信号对特定块尺寸或特定块分区深度的信息进行熵编码/熵解码,以具有不同的参数值。
此外,可基于当前块的深度或尺寸与预定阈值之间的比较来确定关于特定块尺寸或特定块深度的信息。预定阈值是指确定块结构的参考深度或尺寸。预定阈值可以以最小值和最大值中的至少一个的形式来表示。预定阈值可以是在编码器侧和解码器侧预设的固定值,是基于当前块的编码参数推导出的可变值,或者是作为被包括在比特流内而被用信号发送的值。
此时,可依据特定块尺寸或特定块深度的信息不执行进一步的块划分。因此,当块尺寸等于或小于特定块尺寸时或者当块深度等于或小于特定块深度时,可不用信号发送指示划分结构的标志和索引中的至少一个。
例如,在四叉树加二叉树/三叉树划分结构中,当根据特定块尺寸或特定块深度不执行进一步的划分时,可不用信号发送第一标志、第二标志、第三标志、第四标志和第一索引中的至少一个,其中,第一标志指示是否需要执行四叉树划分,第二标志指示是否需要执行二叉树/三叉树划分,第三标志指示水平划分或垂直划分,第四标志指示二叉树划分或三叉树划分,第一索引指示二叉树划分的类型。
例如,当CU通过四叉树加二叉树划分结构被划分时,可不用信号发送第一标志和第一索引中的至少一个,其中,第一标志指示是需要执行四叉树划分还是不需要执行进一步的划分,并且第一索引指示水平对称划分、垂直对称划分或不再划分。
例如,当CU通过使用四叉树加二叉树划分结构被划分时,可不用信号发送第一标志、第二标志和第三标志中的至少一个,其中,第一标志指示是需要执行四叉树划分还是不需要执行进一步的划分,第二标志指示是需要执行二叉树划分还是不需要执行进一步的划分,并且第三标志指示水平对称划分或垂直对称划分。
例如,当CU通过作为四叉树加二叉树划分结构的一种类型的二叉树对称划分来被划分时,可不用信号发送指示水平对称划分、垂直对称划分或不再划分的第一索引。
例如,当CU通过使用作为四叉树加二叉树划分结构的一种类型的二叉树非对称划分结构来被划分时,可不用信号发送第一标志、第二标志和第三标志(或第一索引)中的至少一个,其中,第一标志指示水平划分或垂直划分,第二标志指示对称划分或非对称划分,并且第三标志或第一索引指示各种非对称划分类型中的特定非对称划分类型。
例如,当CU通过使用四叉树和二叉树组合划分结构被划分时,可不用信号发送第一索引、第一标志和第二索引中的至少一个,其中,第一索引指示四叉树划分、二叉树划分或不再划分,第一标志指示水平划分或垂直划分,并且第二索引指示划分位置信息。
例如,当PU通过使用分离PU/TU树划分结构被划分时,可不用信号发送指示是需要执行四叉树划分还是不需要执行进一步的划分的第一标志。
例如,当TU通过使用分离PU/TU树划分结构被划分时,可不用信号发送指示是需要执行四叉树划分还是不需要执行进一步的划分的第一标志。
在根据本发明的一个实施例的块划分结构中,可通过使用变换、逆变换、量化和反量化中的至少一个来对变换系数(包括量化的等级)进行编码/解码。
当执行变换或逆变换时,消除了与高频分量对应的一部分变换系数,而仅保留了与低频分量对应的变换系数。高频分量变换系数位于变换系数块的右下方区域内,并且低频分量变换系数位于变换系数块的左上方区域内。当系数块的尺寸等于或大于M×N的尺寸时,可执行消除高频分量变换系数的处理。这里,M和N是正整数,并且两者可以都是例如64。
例如,当存在尺寸为M×N的块并且M等于或大于64时,保留位于左侧32列内的变换系数。当N等于或大于64时,仅保留上方32行内的变换系数。
例如,当存在尺寸为M×N的块并且M等于或大于32时,仅保留左侧16列内的变换系数。当N等于或大于64时,仅保留上方32行内的变换系数。
例如,当存在尺寸为M×N的块并且M等于或大于64时,仅保留左侧32列内的变换系数。当N等于或大于16时,仅保留上方8行内的变换系数。
一部分高频分量变换系数可以以等于或小于输入信号的比特深度的比特深度被执行量化或反量化,并且一部分低频分量变换系数可以以等于或大于输入信号的比特深度的比特深度被执行量化或反量化。在这种情况下,当块的水平尺寸和垂直尺寸等于或大于M×N时,对高频分量变换系数执行以低比特深度执行量化/反量化的处理。这里,M和N是正整数,并且两者都是例如64。
例如,当存在尺寸为64×64的块时,将尺寸为32×32的左上方区域视为低频分量区域,位于其他区域内的变换系数以比输入信号的比特深度更低的比特深度被执行量化或反量化,并且位于尺寸为32×32的左上方区域内的变换系数以与输入信号相同的比特深度被执行量化或反量化。
一部分高频分量变换系数可以以比当前块的量化参数更大的量化参数被执行量化或反量化,并且一部分低频分量变换系数可以以等于或小于当前块的量化参数的量化参数被执行量化或反量化。在这种情况下,当水平尺寸和垂直尺寸等于或大于M×N(其中,M和N是正整数,并且两者可以都是例如64)时,可执行以比当前块的量化参数更大的量化参数对高频分量变换系数执行量化或反量化的处理。
例如,当存在尺寸为64×64的块时,将尺寸为32×32的左上方区域视为低频分量区域。通过使用作为P值(其中,P是正整数)与当前块的量化参数之和的量化参数来对位于剩余区域内的变换系数执行量化或反量化。另一方面,通过使用当前块的量化参数来对位于尺寸为32×32的左上方区域内的变换系数执行量化或反量化。
将一部分残差信号沿着比特平面划分为最高有效位(MSB)和最低有效位(LSB)。接下来,针对MSB和LSB中的每个执行包括以下处理的各种处理中的至少一个:首次变换、二次变换、量化、首次逆变换、二次逆变换、反量化和熵编码/熵解码。
例如,当残差信号由11个比特组成时,高6位被分类为MSB并且低5位被分类为LSB。当块的水平尺寸和垂直尺寸等于或大于M×N(其中,M和N是正整数,并且两者都是例如64)时,执行该处理。
将一部分变换系数沿着比特平面被划分为MSB和LSB。接下来,可使用不同的量化参数分别对MSB和LSB执行量化或反量化。可通过使用等于或小于当前块的量化参数的量化参数对MSB执行量化或反量化,并且可通过使用大于当前块的量化参数的量化参数对LSB执行量化或反量化。
例如,当用于量化或反量化的输入信号由10个比特组成时,高5位被分类为MSB,并且低5位被分类为LSB。在这种情况下,当块的水平尺寸和垂直尺寸等于或大于M×N(其中,M和N是正整数,并且两者都是例如64)时,执行上述处理。
在根据本发明的一个实施例的块划分结构中,CU可具有非正方形形状,并且在量化和反量化处理中使用的量化矩阵可具有非正方形形状。
在编码器侧,对系数矩阵中的量化系数进行扫描,以将二维阵列的量化系数转换一维阵列的量化系数。在解码器侧,对矩阵中的量化系数进行扫描,以将重建的一维阵列的量化系数变换为非正方形的二维阵列的量化系数。布置在二维量化矩阵中的量化系数可以是在编码器侧和解码器侧定义的默认量化矩阵。
图23示出对重建的量化系数矩阵进行扫描的示例性方法。
例如,如图23的(a)中所示,对角线扫描被用于将一维矩阵的重建的量化系数变换为二维矩阵的量化系数。在这种情况下,沿从左下角到右上角方向的对角线向上方向执行扫描。当从左下角向右上角执行扫描时,这种扫描被称为右上扫描。当从右上角向左下角执行扫描时,这种扫描被称为左下扫描。图23的(a)示出对角线右上扫描的示例。
对于另一示例,如图23的(b)中所示,垂直扫描被用于将重建的一维量化系数矩阵变换为二维量化系数矩阵。这种垂直扫描是一种优先扫描第一列中的系数的方法。
对于另一示例,如图23的(c)中所示,执行水平扫描以将重建的一维量化系数矩阵变换成二维量化系数矩阵。水平扫描是一种优先扫描第一行中的系数的方法。
对于另一示例,如图23的(d)中所示,基于块的对角线扫描被用于将重建的一维量化系数矩阵变换为二维量化系数矩阵。在这种情况下,块尺寸可以是4×4,并且如图23的(d)中所示从左下角到右上角执行扫描或从右上角到左下角执行扫描。图23的(d)示出针对尺寸为8×4的块的基于块的对角线扫描的右上扫描的示例。
对于另一示例,如图23的(e)中所示,针对8×4的块执行基于块的垂直扫描以将重建的一维量化系数矩阵变换成二维量化系数矩阵。在这种情况下,块尺寸可以是4×4,并且首先扫描位于第一列的块。
对于另一示例,如图23的(f)中所示,针对4×8的块执行基于块的水平扫描以将重建的一维量化系数矩阵变换为二维量化系数矩阵。在这种情况下,块尺寸可以是4×4,并且首先扫描位于第一行的块。
也就是说,如上述示例中,当用于非正方形块的量化矩阵具有非正方形形状时,当量化矩阵被扫描时以非正方形形状执行扫描。可选地,首先将非正方形量化矩阵划分为M×M的正方形块,逐个地对这些正方形块进行顺序扫描,并且还可对特定的正方形块进行扫描,其中,M是正整数。
可通过反量化将重建的二维量化矩阵中的量化系数重建为非正方形的二维量化矩阵。在这种情况下,可通过使用上采样、插值、DC矩阵系数替换或子采样来重建二维量化矩阵。下面将描述重建量化矩阵的示例。
例如,在针对尺寸为16×4的变换系数块使用的量化矩阵的情况下,针对y位置(行或垂直方向)对16×16的重建的量化矩阵进行子采样,以重建16×4的量化矩阵。
对于另一示例,在针对尺寸为4×16的变换系数块使用的量化矩阵的情况下,针对x位置(列或水平方向)对尺寸为16×16的重建的量化矩阵进行子采样,以重建4×16的量化矩阵。
对于另一示例,在针对尺寸为32×8的变换系数块使用的量化矩阵的情况下,针对y位置(行或垂直方向)对尺寸为32×32的重建的量化矩阵进行子采样,以重建32×8的量化矩阵。
对于另一示例,在针对尺寸为8×32的变换系数块使用的量化矩阵的情况下,针对x位置(列或水平方向)对尺寸为32×32的重建的量化矩阵进行子采样,以重建8×32的量化矩阵。
在根据本发明的一个实施例的块划分结构中,可将重建的邻近块的编码参数中的至少一个用作当前块的编码参数。
例如,重建的邻近块的单元分区信息、指示四叉树划分被执行的分区信息、指示二叉树划分是否被执行的分区信息、二叉树形式的划分方向、二叉树形式的划分类型(对称或非对称)中的至少一个被用作以下信息中的至少一个:当前块的单元分区信息、四叉树分区信息、二叉树分区信息、二叉树划分方向和二叉树划分类型。
例如,指示重建的邻近块是否通过四叉树划分被划分的第一标志、指示二叉树/三叉树划分是否被执行的第二标志、指示水平划分或垂直划分的第三标志以及指示二叉树划分或三叉树划分的第四标志中的至少一个被用作以下标志中的至少一个:指示当前块是否通过四叉树划分被划分的第一标志、指示当前块是否通二叉树/三叉树划分被划分的第二标志、指示垂直划分或水平划分的第三标志以及指示二叉树划分或三叉树划分的第四标志。
在根据本发明的一个实施例的块划分结构中,重建的邻近块的编码参数中的至少一个被用于推导当前块的编码参数中的至少一个。
例如,重建的邻近块的单元分区信息、指示重建的邻近块是否通过四叉树划分被划分的四叉树分区信息、指示重建的邻近块是否通过二叉树划分被划分的二叉树分区信息、二叉树划分的划分方向和二叉树划分的划分类型中的至少一个被用于推导关于当前块的至少一条信息,其中,关于当前块的至少一条信息包括当前块的单元分区信息、指示当前块是否通过四叉树划分被划分的信息、指示当前块是否通过二叉树划分被划分的信息、二叉树划分的划分方向和二叉树划分的划分类型。在这种情况下,重建的邻近块的编码参数中的至少一个被用于推导当前块的编码参数中的至少一个。这意味着当前块的编码参数中的至少一个是通过重建的邻近块的编码参数中的至少一个被确定的。
例如,指示重建的邻近块是否通过四叉树划分被划分的第一标志、指示重建的邻近块是否通过二叉树/三叉树划分被划分的第二标志、指示垂直划分或水平划分的第三标志以及指示二叉树划分或三叉树划分的第四标志中的至少一个可被用于推导如下标志中的至少一个:指示当前块是否通过四叉树划分被划分的第一标志、指示当前块是否通过二叉树/三叉树划分被划分的第二标志、指示垂直划分或水平划分的第三标志以及指示二叉树划分和三叉树划分中的至少一个的第四标志。
在根据本发明的一个实施例的块划分结构中,重建的邻近块的编码参数中的至少一个可被用于当前块的帧内预测。
例如,可将重建的邻近块的帧内预测模式、帧内预测方向、参考样点滤波方法、预测块滤波方法、预测块滤波器抽头和预测块滤波器系数中的至少一个用于当前块的预测处理。
在根据本发明的一个实施例的块划分结构中,重建的邻近块的编码参数中的至少一个可被用于当前块的帧间预测或运动补偿。
例如,可在当前块的帧间预测处理或运动补偿处理中使用重建的邻近块的如下信息中的至少一个:帧间预测模式、运动信息、运动矢量、参考画面索引、帧间预测方向、帧间预测指示符、参考画面列表、运动矢量预测因子、运动矢量候选列表、关于合并模式是否被使用的合并模式利用信息、候选列表、合并候选、合并候选列表、关于跳过模式是否被使用的跳过模式利用信息、插值滤波器类型、插值滤波器抽头、运动矢量大小、运动矢量表示精度。
在根据本发明的一个实施例的块划分结构中,重建的邻近块的编码参数中的至少一个可被用于当前块的变换、逆变换、量化或反量化。这里,变换包括首次变换和二次变换中的至少一个,并且逆变换包括首次逆变换和二次逆变换中的至少一个。
例如,可在对当前块进行变换、逆变换、量化或反量化的处理中使用重建的邻近块的如下信息中的至少一个:变换类型、变换尺寸、关于首次变换是否被使用的信息、关于二次变换是否被使用的信息、首次变换索引、二次变换索引、指示是否存在残差信号的信息、编码块模式、编码块标志、量化参数和量化矩阵。
在根据本发明的一个实施例的块划分结构中,可在对当前块进行熵编码/熵解码的处理中使用重建的邻近块的编码参数中的至少一个。
例如,可在对对当前块进行熵编码/熵解码的处理中使用重建的邻近块的如下信息中的至少一个:单元分区信息、关于四叉树划分是否被执行的信息、关于二叉树划分是否被执行的信息、二叉树划分的划分方向、二叉树划分的划分类型。这里,熵编码/熵解码可包括各种处理,诸如二值化/反二值化方法确定、上下文模型确定、上下文模型更新、常规模式执行和旁路模式执行。
例如,可将如下标志中的至少一个用于对当前块进行熵编码/熵解码:指示重建的邻近块是否通过四叉树划分被划分的第一标志、指示重建的邻近块是否通过二叉树/三叉树划分被划分的第二标志、指示垂直划分或水平划分的第三标志以及指示二叉树划分和三叉树划分中的至少一个的第四标志。
在根据本发明的一个实施例的块划分结构中,重建的邻近块的编码参数中的至少一个可被用于包括当前块的如下滤波的滤波方法:帧内环路滤波、去块滤波、自适应样点偏移和自适应环内滤波。
例如,可在将诸如去块滤波器、自适应样点偏移滤波器和自适应环内滤波器的滤波器中的至少一个应用于当前块的处理中使用重建的邻近块的如下信息:关于帧内环路滤波器是否被应用于重建的邻近块的信息、帧内环路滤波器系数、帧内环路滤波器抽头、帧内环路滤波器形状、帧内环路滤波器类型、关于去块滤波器是否被应用的信息、去块滤波器系数、去块滤波器抽头、去块滤波器强度、去块滤波器形状、去块滤波器类型、关于自适应样点偏移是否被应用的信息、自适应样点偏移值、自适应样点偏移类别、指示自适应环内滤波器是否被应用的信息、自适应环内滤波器系数、自适应环内滤波器抽头、自适应环内滤波器形状、自适应环内滤波器类型。
在根据本发明的一个实施例的块划分结构中,亮度信号块的编码参数中的至少一个可被用作色度信号块的编码参数中的至少一个。
在根据本发明的一个实施例的块划分结构中,亮度信号块的编码参数中的至少一个可被用于推导色度信号块的编码参数中的至少一个。
在根据本发明的一个实施例的块划分结构中,亮度信号块的编码参数中的至少一个可被用于对色度信号块进行如下处理中的至少一个:帧内预测、帧间预测、运动补偿、变换、逆变换、量化、反量化、熵编码/熵解码、帧内环路滤波、去块滤波、自适应样点偏移、自适应环内滤波。
在根据本发明的一个实施例的块划分结构中,Cb(或Cr)信号块的编码参数中的至少一个可被用作Cr(或Cb)信号块的编码参数中的至少一个。
在根据本发明的一个实施例的块划分结构中,Cb(或Cr)信号块的编码参数中的至少一个可被用于推导Cr(或Cb)信号块的编码参数中的至少一个。
在根据本发明的一个实施例的块划分结构中,Cb(或Cr)信号块的编码参数中的至少一个可被用于对Cr(或Cb)信号块进行如下处理中的至少一个:帧内预测、帧间预测、运动补偿、变换、逆变换、量化、反量化、熵编码/熵解码、帧内环路滤波、去块滤波、自适应样点偏移和自适应环内滤波。
对于通过根据本发明的一个实施例的块划分结构生成的每个块,可对下面描述的至少一条信息进行熵编码/熵解码。此外,可基于下面描述的多条经过熵编码/熵解码的信息中的至少一条信息以及块尺寸和块形状中的至少一个来执行由下面描述的经过熵编码/熵解码的信息所指示的方法。
-运动信息可包括运动矢量、参考画面索引、帧间预测指示符、跳过模式利用信息(skip_flag)、合并模式利用信息(merge_flag)、合并索引信息(merge_index)、运动矢量分辨率信息、重叠块运动补偿信息、局部照度补偿信息、仿射运动补偿信息、解码器运动矢量推导信息和双向光流信息中的至少一个。
-运动矢量分辨率信息可以是指示特定分辨率被用于运动矢量和运动矢量差值中的至少一个的信息。分辨率是指精度。特定分辨率可以是像素间单位、1/2pel单位、1/4pel单位,1/8pel单位,1/16pel单位,1/32pel单位和1/64pel单位中的至少一个。
-重叠块运动补偿信息可以是指示当执行对当前块的运动补偿时是否通过使用与当前块相邻的空间邻近块的运动矢量来计算当前块的预测块的加权和的信息。
-局部照度补偿信息可以是指示当生成当前块的预测块时是否使用加权因子和偏移值中的至少一个的信息。这里,加权因子和偏移值是基于参考块计算出的值。
-仿射运动补偿信息可以是指示仿射运动模型是否被用于当前块的运动补偿的信息。这里,仿射运动模型是使用多个参数将一个块划分为多个子块并使用代表性运动矢量来计算各个子块的运动矢量的模型。
-解码器运动矢量推导信息可以是指示运动补偿所需的运动矢量是否在解码器中被推导并被使用的信息。依据解码器运动矢量推导信息,关于运动矢量的信息可不被熵编码/熵解码。当解码器运动矢量推导信息指示运动矢量在解码器中被推导然后被使用时,关于合并模式的信息可被熵编码/熵解码。也就是说,解码器运动矢量推导信息可指示合并模式是否在解码器中被使用。
-双向光流信息可以是指示是否通过以像素或子块为单位修正运动矢量来执行运动补偿的信息。依据双向光流信息,可不对以像素或子块为单位的运动矢量进行熵编码/熵解码。这里,运动矢量修正是指以像素或子块为单位改变基于块的运动矢量的值的处理。
另一方面,在编码器中被编码且在解码器中被解码的标志和索引中的至少一个可使用下面描述的二值化方法中的至少一种。
截断莱斯二值化方法
K阶指数哥伦布二值化方法
受限K阶指数哥伦布二值化方法
固定长度二值化方法
一元二值化方法
截断一元二值化方法
图24是示出根据本发明的一个实施例的图像解码方法的流程图。
参照图24,解码器通过使用块划分结构将编码树单元(CTU)划分为至少一个编码单元(CU)(S2401)。
块划分结构被配置为使得:在执行四叉树划分之后执行二叉树划分和三叉树划分中的至少一个。
二叉树包括垂直二叉树和水平二叉树,并且三叉树包括垂直三叉树和水平三叉树。
基于第一标志、第二标志、第三标志和第四标志中的至少一个确定块划分结构,其中,第一标志指示四叉树划分是否被执行,第二标志指示二叉树/三叉树划分是否被执行,第三标志指示垂直划分或水平划分,第四标志指示二叉树划分或三叉树划分。
基于如下信息中的至少一个确定块划分结构:四叉树根节点尺寸、最小允许的四叉树叶节点尺寸、最大允许的二叉树根节点尺寸、最大允许的三叉树根节点尺寸、最大允许的二叉树/三叉树划分深度、最小允许的二叉树叶节点尺寸和最小允许的三叉树叶节点尺寸。
如下信息中的至少一个被包括在序列参数集中:四叉树根节点尺寸、最小允许的四叉树叶节点尺寸、最大允许的二叉树根节点尺寸、最大允许的三叉树根节点尺寸、最大允许的二叉树/三叉树划分深度、最小允许的二叉树叶节点尺寸和最小允许的三叉树叶节点尺寸。
基于最大变换尺寸来确定块划分结构。
当CTU被包括在帧内条带中时,独立地确定CTU内的亮度信号块和相应色度信号块的块划分结构。
解码器以编码单元(CU)为单位执行解码(S2402)。
解码器通过以编码单元(CU)为单位执行帧内预测和帧间预测中的至少一个或两个来执行解码。解码器通过以编码单元(CU)为单位执行逆变换或反量化中的至少一个来执行解码。
图25是示出根据本发明的一个实施例的图像编码方法的流程图。
参照图25,编码器根据块划分结构将一个编码树单元(CTU)划分为至少一个编码单元(CU)(S2501)。
块划分结构被配置为使得:在执行四叉树划分之后执行二叉树划分和三叉树划分中的至少一个。
二叉树包括垂直二叉树和水平二叉树,并且三叉树包括垂直三叉树和水平三叉树。
通过使用第一标志、第二标志、第三标志和第四标志中的至少一个来表示块划分结构,其中,第一标志指示四叉树划分是否被执行,第二标志指示二叉树/三叉树划分是否被执行,第三标志指示垂直划分或水平划分,第四标志指示二叉树划分或三叉树划分。
基于如下信息中的至少一个限制块划分结构:四叉树根节点尺寸、最小允许的四叉树叶节点尺寸、最大允许的二叉树根节点尺寸、最大允许的三叉树根节点尺寸、最大允许的二叉树/三叉树划分深度、最小允许的二叉树叶节点尺寸和最小允许的三叉树叶节点尺寸。
如下信息中的至少一个被包括在将被编码的序列参数集中:四叉树根节点尺寸、最小允许的四叉树叶节点尺寸、最大允许的二叉树根节点尺寸、最大允许的三叉树根节点尺寸、最大允许的二叉树/三叉树划分深度、最小允许的二叉树叶节点尺寸和最小允许的三叉树叶节点尺寸。
基于最大变换尺寸来确定块划分结构。
当CTU被包括在帧内条带中时,独立地确定CTU内的亮度信号和相应色度信号的块划分结构。
编码器以编码单元(CU)为单位执行编码(S2502)。
编码器通过以编码单元为单位执行帧内预测和帧间预测中的至少一个或两个来执行编码。
根据本发明的一方面的记录介质存储通过执行图像编码方法而生成的比特流,其中,所述图像编码方法包括:根据块划分结构将编码树单元划分为至少一个编码单元;并且以编码单元为单位执行编码,其中,所述块划分结构被配置为使得:在执行四叉树划分之后执行二叉树划分和三叉树划分中的至少一个。
可在编码器和解码器中以相同的方法执行以上实施例。
应用于以上实施例的顺序在编码器与解码器之间可不同,或者应用于以上实施例的顺序在编码器和解码器中可相同。
可对每个亮度信号和色度信号执行以上实施例,或者可对亮度信号和色度信号相同地执行以上实施例。
应用本发明的以上实施例的块形状可具有正方形形状或非正方形形状。
可依据如下项中的至少一个的尺寸来应用本发明的以上实施例:编码块、预测块、变换块、块、当前块、编码单元、预测单元、变换单元、单元和当前单元。这里,尺寸可被定义为上述实施例被应用的最小尺寸或最大尺寸或者最小尺寸和最大尺寸两者,或者尺寸可被定义为应用了以上实施例的固定尺寸。此外,在以上实施例中,可将第一实施例应用于第一尺寸,并且可将第二实施例应用于第二尺寸。换句话说,可依据尺寸组合地应用以上实施例。此外,当尺寸等于或大于最小尺寸并且等于或小于最大尺寸时,可应用以上实施例。换句话说,当块尺寸被包括在特定范围内时,可应用以上实施例。
例如,当当前块的尺寸为8×8或更大时,可应用以上实施例。例如,当当前块的尺寸为4×4或更大时,可应用以上实施例。例如,当当前块的尺寸为16×16或更大时,可应用以上实施例。例如,当当前块的尺寸等于或大于16×16并且等于或小于64×64时,可应用以上实施例。
可依据时间层来应用本发明的以上实施例。为了标识可应用以上实施例的时间层,可用信号发送另外的标识符,并且可将以上实施例应用于由相应标识符标识的指定时间层。这里,标识符可被定义为可应用以上实施例的最低层或最高层或者最低层和最高层两者,或者可被定义为指示应用实施例的特定层。此外,可定义应用实施例的固定时间层。
例如,当当前图像的时间层是最低层时,可应用以上实施例。例如,当当前图像的时间层标识符是1时,可应用以上实施例。例如,当当前图像的时间层是最高层时,可应用以上实施例。
可定义应用本发明的以上实施例的条带类型,并且可依据相应条带类型应用以上实施例。
在上述实施例中,基于具有一系列步骤或单元的流程图描述了所述方法,但是本发明不限于这些步骤的顺序,而是,一些步骤可与其他步骤同时执行或以不同的顺序执行。此外,本领域的普通技术人员应该理解,流程图中的步骤并不互相排斥,并且在不影响本发明的范围的情况下,可将其他步骤添加到流程图或者可将流程图中的步骤中的一些步骤从流程图删除。
实施例包括示例的各个方面。可不描述各个方面的所有可能的组合,但是本领域技术人员将能够认识到不同的组合。因此,本发明可包括权利要求范围内的所有替换、修改和改变。
本发明的实施例可以以程序指令的形式实现,其中,该程序指令可由各种计算机组件执行并且被记录在计算机可读记录介质中。计算机可读记录介质可单独地包括程序指令、数据文件、数据结构等,或者可包括程序指令、数据文件、数据结构等的组合。记录在计算机可读记录介质中的程序指令可以是为本发明专门设计和构建的,或者对于计算机软件技术领域的普通技术人员是公知的。计算机可读记录介质的示例包括磁记录介质(诸如,硬盘、软盘和磁带)、光学数据存储介质(诸如,CD-ROM或DVD-ROM)、磁光介质(诸如软光盘)以及被专门构造为存储和实现程序指令的硬件装置(诸如,只读存储器(ROM)、随机存取存储器(RAM)、闪存等)。程序指令的示例不仅包括由编译器格式化的机械语言代码,而且包括可由计算机使用解释器来实现的高级语言代码。硬件装置可被配置为由一个或更多个软件模块操作或者反之亦可,以进行根据本发明的处理。
尽管已经在特定项(诸如,详细元件)以及有限的实施例和附图方面描述了本发明,但是它们仅被提供以帮助更全面地理解本发明,并且本发明不限于以上实施例。本发明所属领域的技术人员将理解,可对以上描述进行各种修改和改变。
因此,本发明的精神将不应限于上述实施例,并且所附权利要求及其等同物的整个范围将落入本发明的范围和精神内。
工业适用性
本发明可被用于对图像进行编码/解码。

Claims (7)

1.一种对视频进行解码的方法,所述方法包括:
对当前块的残差系数进行解码;
对当前块的残差系数执行反量化;以及
对通过反量化得到的当前块的反量化的残差系数执行逆变换,
其中,包括在除了当前块的左上区域之外的剩余区域中的残差系数具有0值。
2.根据权利要求1所述的方法,其中,所述左上区域的尺寸是基于当前块的尺寸适应性确定的。
3.根据权利要求1所述的方法,其中,通过将缩放因子乘以残差系数来执行反量化,并且
其中,所述缩放因子以预定尺寸的区域为单位被不同地确定。
4.根据权利要求1所述的方法,其中,逆变换包括第二逆变换和第一逆变换。
5.根据权利要求1所述的方法,其中,当前块是通过对父节点编码块进行划分而生成的多个块之一,
其中,当父节点编码块跨越画面的下边界和右边界时,父节点编码块通过四叉树分区被隐式划分。
6.一种对视频进行编码的方法,所述方法包括:
获得当前块的残差样点;
对当前块的残差样点执行变换;
对通过变换得到的当前块的变换系数执行量化;以及
将通过量化得到的残差系数编码到比特流中,
其中,包括在除了当前块的左上区域之外的剩余区域中的残差系数被设置为0值。
7.一种发送通过编码方法生成的比特流的方法,所述方法包括:
获得当前块的残差样点;
对当前块的残差样点执行变换;
对通过变换得到的当前块的变换系数执行量化;以及
将通过量化得到的残差系数编码到比特流中,
其中,包括在除了当前块的左上区域之外的剩余区域中的残差系数被设置为0值。
CN202311460021.7A 2017-09-20 2018-09-20 用于对图像进行编码/解码的方法和装置 Pending CN117499683A (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
KR10-2017-0121006 2017-09-20
KR20170121006 2017-09-20
KR10-2018-0071825 2018-06-22
KR20180071825 2018-06-22
CN201880060206.XA CN111149359B (zh) 2017-09-20 2018-09-20 用于对图像进行编码/解码的方法和装置以及存储有比特流的记录介质
PCT/KR2018/011139 WO2019059676A1 (ko) 2017-09-20 2018-09-20 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201880060206.XA Division CN111149359B (zh) 2017-09-20 2018-09-20 用于对图像进行编码/解码的方法和装置以及存储有比特流的记录介质

Publications (1)

Publication Number Publication Date
CN117499683A true CN117499683A (zh) 2024-02-02

Family

ID=65810473

Family Applications (4)

Application Number Title Priority Date Filing Date
CN202311460050.3A Pending CN117499684A (zh) 2017-09-20 2018-09-20 用于对图像进行编码/解码的方法和装置
CN201880060206.XA Active CN111149359B (zh) 2017-09-20 2018-09-20 用于对图像进行编码/解码的方法和装置以及存储有比特流的记录介质
CN202311459880.4A Pending CN117499682A (zh) 2017-09-20 2018-09-20 用于对图像进行编码/解码的方法和装置
CN202311460021.7A Pending CN117499683A (zh) 2017-09-20 2018-09-20 用于对图像进行编码/解码的方法和装置

Family Applications Before (3)

Application Number Title Priority Date Filing Date
CN202311460050.3A Pending CN117499684A (zh) 2017-09-20 2018-09-20 用于对图像进行编码/解码的方法和装置
CN201880060206.XA Active CN111149359B (zh) 2017-09-20 2018-09-20 用于对图像进行编码/解码的方法和装置以及存储有比特流的记录介质
CN202311459880.4A Pending CN117499682A (zh) 2017-09-20 2018-09-20 用于对图像进行编码/解码的方法和装置

Country Status (4)

Country Link
US (1) US11677940B2 (zh)
KR (2) KR102501105B1 (zh)
CN (4) CN117499684A (zh)
WO (1) WO2019059676A1 (zh)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2020009056A (es) * 2018-03-01 2020-12-03 Arris Entpr Llc Sistema y método de almacenamiento de información de movimiento para codificación y señalizacion de video.
EP3794820A1 (en) * 2018-05-17 2021-03-24 Telefonaktiebolaget LM Ericsson (publ) Deblocking of implicit transform unit boundaries
KR20210066812A (ko) * 2018-10-02 2021-06-07 소니그룹주식회사 화상 처리 장치 및 방법, 그리고 프로그램
CN111083484A (zh) 2018-10-22 2020-04-28 北京字节跳动网络技术有限公司 基于子块的预测
WO2020084474A1 (en) 2018-10-22 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Gradient computation in bi-directional optical flow
EP3878175B1 (en) * 2018-11-08 2024-03-27 InterDigital VC Holdings, Inc. Quantization for video encoding or decoding based on the surface of a block
EP3857879A4 (en) 2018-11-12 2022-03-16 Beijing Bytedance Network Technology Co., Ltd. SIMPLIFICATION OF COMBINED INTER-INTRA PREDICTION
BR112021009099A2 (pt) * 2018-11-12 2021-08-10 Huawei Technologies Co., Ltd. codificador de vídeo, decodificador de vídeo e métodos de codificação ou decodificação de uma imagem
JP7241870B2 (ja) 2018-11-20 2023-03-17 北京字節跳動網絡技術有限公司 部分的な位置に基づく差分計算
WO2020103872A1 (en) 2018-11-20 2020-05-28 Beijing Bytedance Network Technology Co., Ltd. Prediction refinement for combined inter intra prediction mode
JP6835177B2 (ja) * 2018-11-30 2021-02-24 株式会社Jvcケンウッド 画像復号化装置、画像復号化方法及び画像復号化プログラム
CN116744008A (zh) * 2018-12-15 2023-09-12 华为技术有限公司 图像重建方法和装置
CN111355951B (zh) * 2018-12-24 2023-11-10 华为技术有限公司 视频解码方法、装置及解码设备
CN112584177B (zh) * 2018-12-28 2022-05-31 杭州海康威视数字技术股份有限公司 一种编解码方法及其设备
CN111526362B (zh) * 2019-02-01 2023-12-29 华为技术有限公司 帧间预测方法和装置
CN113366855A (zh) * 2019-02-03 2021-09-07 北京字节跳动网络技术有限公司 基于条件的非对称四叉树分割
WO2020162536A1 (ja) * 2019-02-08 2020-08-13 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
US11870997B2 (en) * 2019-03-05 2024-01-09 Vid Scale, Inc. Affine motion model derivation method
EP3915259A4 (en) 2019-03-06 2022-03-30 Beijing Bytedance Network Technology Co., Ltd. USE OF A CONVERTED UNIVERSITY PREDICTION CANDIDATE
WO2020182213A1 (en) * 2019-03-13 2020-09-17 Beijing Bytedance Network Technology Co., Ltd. Sub-block transform in transform skip mode
CN114501008B (zh) * 2019-03-21 2023-12-19 三星电子株式会社 视频解码方法和视频编码方法
EP3925217A4 (en) * 2019-03-25 2023-03-08 HFI Innovation Inc. METHOD AND DEVICE FOR QUANTIZATION MATRIX CALCULATION AND REPRESENTATION FOR VIDEO CODING
KR20230169434A (ko) 2019-04-02 2023-12-15 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 디코더 측 움직임 벡터 유도
US11616966B2 (en) * 2019-04-03 2023-03-28 Mediatek Inc. Interaction between core transform and secondary transform
SG11202112279WA (en) 2019-05-11 2021-12-30 Beijing Bytedance Network Technology Co Ltd Selective use of coding tools in video processing
KR20210135337A (ko) * 2019-05-14 2021-11-12 엘지전자 주식회사 적응적 루프 필터 기반 비디오 또는 영상 코딩
US11863754B2 (en) * 2019-05-15 2024-01-02 Hyundai Motor Company Method and for reconstructing chroma block and video decoding apparatus
MX2021014277A (es) * 2019-05-24 2022-01-06 Digital Insights Inc Metodo y aparato de codificacion de video que utilizan conjunto de parametros adaptativos.
KR102488925B1 (ko) * 2019-06-19 2023-01-13 엘지전자 주식회사 크로마 블록의 적응적 크기 제한을 이용한 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법
CN113906754A (zh) * 2019-06-25 2022-01-07 韩国电子通信研究院 图像编码/解码方法和设备
KR20220036939A (ko) 2019-07-26 2022-03-23 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 비디오 코딩 모드의 블록 크기 종속적 사용
WO2021018084A1 (en) * 2019-07-26 2021-02-04 Beijing Bytedance Network Technology Co., Ltd. Interdependence of transform size and coding tree unit size in video coding
KR102448518B1 (ko) * 2019-08-15 2022-09-27 베이징 다지아 인터넷 인포메이션 테크놀로지 컴퍼니 리미티드 비디오 코딩의 작은 크로마 블록 크기 제한
US11323743B2 (en) * 2019-08-26 2022-05-03 Tencent America LLC Interaction between CU partitions and sub-block transform
US11496774B2 (en) * 2019-08-27 2022-11-08 Tencent America LLC Header syntax for QT/BT/TT size
BR112022003732A2 (pt) * 2019-09-02 2022-10-11 Beijing Bytedance Network Tech Co Ltd Método e aparelho para processamento de dados de vídeo, e, meios de armazenamento e de gravação legíveis por computador não transitórios
CN114556916B (zh) * 2019-10-12 2023-11-17 北京字节跳动网络技术有限公司 视频编解码工具的高级语法
US11706461B2 (en) * 2021-03-18 2023-07-18 Tencent America LLC Method and apparatus for video coding
CN113225556A (zh) * 2021-05-31 2021-08-06 杭州当虹科技股份有限公司 视频编码方法
CN113660490A (zh) * 2021-06-24 2021-11-16 浙江大华技术股份有限公司 编码单元的划分方法、编码方法、电子装置及存储介质

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6711211B1 (en) 2000-05-08 2004-03-23 Nokia Mobile Phones Ltd. Method for encoding and decoding video information, a motion compensated video encoder and a corresponding decoder
KR20120035096A (ko) * 2010-10-04 2012-04-13 한국전자통신연구원 쿼드 트리 변환 구조에서 부가 정보의 시그널링 방법 및 장치
US9467701B2 (en) * 2012-04-05 2016-10-11 Qualcomm Incorporated Coded block flag coding
KR20150027530A (ko) 2013-09-04 2015-03-12 한국전자통신연구원 Hevc 부호화 장치 및 이를 이용한 부호화 방법
KR101737861B1 (ko) 2014-01-20 2017-05-19 한국전자통신연구원 변환 깊이 기반 dct 사이즈 결정 장치 및 방법
US10142642B2 (en) * 2014-06-04 2018-11-27 Qualcomm Incorporated Block adaptive color-space conversion coding
WO2016090568A1 (en) 2014-12-10 2016-06-16 Mediatek Singapore Pte. Ltd. Binary tree block partitioning structure
CN115134608A (zh) * 2015-06-11 2022-09-30 杜比实验室特许公司 使用自适应去块滤波编码和解码图像的方法及其装置
KR102520403B1 (ko) 2015-06-12 2023-04-11 삼성전자 주식회사 무선 통신 시스템에서 채널 상태 정보 보고 방법 및 장치
KR102365165B1 (ko) 2015-11-24 2022-02-18 삼성전자주식회사 부호화 순서 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
WO2017088170A1 (en) 2015-11-27 2017-06-01 Mediatek Inc. Entropy coding the binary tree block partitioning structure
EP3363199B1 (en) * 2015-11-27 2021-05-19 MediaTek Inc. Method and apparatus of entropy coding and context modelling for video and image coding
US10819978B2 (en) 2016-01-11 2020-10-27 Samsung Electronics Co., Ltd. Image encoding method and apparatus, and image decoding method and apparatus
WO2017138791A1 (ko) * 2016-02-12 2017-08-17 삼성전자 주식회사 영상 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR102028015B1 (ko) * 2016-05-02 2019-10-02 한양대학교 산학협력단 화면 내 예측을 이용한 영상 부호화/복호화 방법 및 장치
CA3025334C (en) * 2016-05-25 2021-07-13 Arris Enterprises Llc Binary ternary quad tree partitioning for jvet coding of video data
US10805631B2 (en) * 2016-09-23 2020-10-13 Lg Electronics Inc. Method and apparatus for performing prediction using template-based weight
KR102491176B1 (ko) 2016-10-10 2023-01-20 삼성전자주식회사 픽처 외곽선의 부호화 단위를 부호화 또는 복호화하는 방법 및 장치
US10779004B2 (en) * 2016-10-12 2020-09-15 Mediatek Inc. Methods and apparatuses of constrained multi-type-tree block partition for video coding
US20190253737A1 (en) * 2016-12-26 2019-08-15 Nec Corporation Video encoding method, video decoding method, video encoding device, video decoding device, and program
KR102435881B1 (ko) * 2017-05-26 2022-08-24 에스케이텔레콤 주식회사 영상 부호화 또는 복호화하기 위한 장치 및 방법

Also Published As

Publication number Publication date
US20210368172A1 (en) 2021-11-25
KR102501105B1 (ko) 2023-02-17
KR20190033036A (ko) 2019-03-28
WO2019059676A1 (ko) 2019-03-28
CN111149359A (zh) 2020-05-12
KR20230024956A (ko) 2023-02-21
CN117499684A (zh) 2024-02-02
US11677940B2 (en) 2023-06-13
CN111149359B (zh) 2023-11-17
CN117499682A (zh) 2024-02-02

Similar Documents

Publication Publication Date Title
CN111149359B (zh) 用于对图像进行编码/解码的方法和装置以及存储有比特流的记录介质
CN111373755B (zh) 图像编码/解码方法和装置以及存储比特流的记录介质
CN111247799B (zh) 图像编码/解码方法和装置以及存储有比特流的记录介质
CN110870315B (zh) 用于对图像进行编码/解码的方法和装置以及存储比特流的记录介质
CN111837388B (zh) 使用样点滤波的图像编码/解码方法和设备
CN116866563A (zh) 图像编码/解码方法、存储介质以及图像数据的传输方法
CN117528070A (zh) 编码/解码视频的方法和设备以及存储比特流的记录介质
KR20180040088A (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
CN112740684A (zh) 用于对图像进行编码/解码的方法和装置以及用于存储比特流的记录介质
US20230269372A1 (en) Method and device for encoding/decoding image, and recording medium having stored bitstream

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination