CN113841404A - 视频编码/解码方法和设备以及存储比特流的记录介质 - Google Patents

视频编码/解码方法和设备以及存储比特流的记录介质 Download PDF

Info

Publication number
CN113841404A
CN113841404A CN202080036953.7A CN202080036953A CN113841404A CN 113841404 A CN113841404 A CN 113841404A CN 202080036953 A CN202080036953 A CN 202080036953A CN 113841404 A CN113841404 A CN 113841404A
Authority
CN
China
Prior art keywords
block
current block
prediction
mode
intra prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202080036953.7A
Other languages
English (en)
Other versions
CN113841404B (zh
Inventor
李镇浩
姜晶媛
李河贤
林成昶
金晖容
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Priority to CN202410791137.7A priority Critical patent/CN118784869A/zh
Priority to CN202410791138.1A priority patent/CN118784870A/zh
Priority to CN202410791147.0A priority patent/CN118784871A/zh
Publication of CN113841404A publication Critical patent/CN113841404A/zh
Application granted granted Critical
Publication of CN113841404B publication Critical patent/CN113841404B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本文公开了一种用于对图像进行编码/解码的方法和设备。根据本发明的图像解码方法包括:从比特流获得当前块的预测信息,并且通过基于所述预测信息执行预测来生成所述当前块的预测块。在此,所述预测信息包括当前块的分区预测信息。生成所述预测块的步骤包括:从所述当前块的邻近块获得参考样点,将插值滤波器应用于参考样点,以及通过使用应用了插值滤波器的所述参考样点来生成预测块。基于所述当前块的分区预测信息确定插值滤波器。

Description

视频编码/解码方法和设备以及存储比特流的记录介质
技术领域
本发明涉及一种图像编码/解码方法和设备,以及一种用于存储比特流的记录介质。更具体地,本发明涉及用于选择插值滤波器的图像编码/解码方法和设备,以及用于存储比特流的记录介质。
背景技术
最近,在各种应用中,对诸如高清(HD)或超高清(UHD)图像的高分辨率和高质量图像的需求已经增加。随着图像的分辨率和质量提高,数据量相应地增加。当通过诸如有线或无线宽带信道的现有传输介质传输图像数据时或者当存储图像数据时,这是传输成本和存储成本增加的原因之一。为了解决高分辨率和高质量图像数据的这些问题,需要高效的图像编码/解码技术。
存在各种视频压缩技术,诸如从先前画面或后续画面内的像素的值预测当前画面内的像素的值的帧间预测技术、从当前画面的另一区域内的像素的值预测当前画面的区域内的像素的值的帧内预测技术、压缩残差信号的能量的变换和量化技术、以及向频繁出现的像素值分配较短码而向较少出现的像素值分配较长码的熵编码技术。
发明内容
技术问题
本公开是提供一种具有提高的编码/解码效率的视频编码/解码方法和设备。
本公开是提供一种用于通过选择插值滤波器来对图像进行编码/解码的方法和设备。
本公开是提供一种存储由根据本公开的图像解码方法或设备生成的比特流的记录介质。
技术方案
根据本公开的一个方面的一种图像解码方法,所述图像解码方法包括:从比特流获得当前块的预测信息;并且通过基于所述预测信息执行预测来生成所述当前块的预测块,其中,所述预测信息包括当前块的分区预测信息,其中,生成所述预测块的步骤包括:从所述当前块的邻近块获得参考样点;将插值滤波器应用于所述参考样点;以及通过使用应用了插值滤波器的所述参考样点来生成所述预测块,以及其中,基于所述当前块的分区预测信息来确定插值滤波器。
根据实施例,插值滤波器被确定为彼此不同的两个插值滤波器中的一个。
根据实施例,所述当前块的分区预测信息包括是否执行所述当前块的分区预测和当前块的分区方向。
根据实施例,所述当前块的分区方向是垂直方向或水平方向。
根据实施例,所述预测信息包括关于多个参考样点线的信息,并且基于关于所述多个参考样点线的信息来确定所述插值滤波器。
根据实施例,所述预测信息包括用于所述当前块的所述邻近块的基于矩阵的预测模式信息,并且当对所述邻近块执行基于矩阵的帧内预测时,所述邻近块的帧内预测模式被认为是平面模式。
根据实施例,所述邻近块是位于当前块的左下方的块或右上方的块。
根据实施例,当所述当前块的亮度块的帧内预测模式为基于矩阵的帧内预测模式时,所述当前块的色度块的帧内预测模式被推导为平面模式。
根据实施例,所述预测信息包括所述当前块的残差信号预测信息,并且基于残差信号预测信息确定所述当前块的帧内预测模式。
根据实施例,基于残差信号预测信息将所述当前块的帧内预测模式确定为水平预测模式和垂直预测模式之一。
根据本公开的另一方面的一种图像编码方法,所述图像编码方法包括:确定当前块的预测模式;通过基于所述当前块的预测模式执行预测来生成所述当前块的预测块;以及对包括当前块的所述预测模式的所述当前块的预测信息进行编码,其中,所述预测信息包括当前块的分区预测信息,其中,生成所述预测块的步骤包括:从所述当前块的邻近块获得参考样点;将插值滤波器应用于所述参考样点;以及通过使用应用了插值滤波器的所述参考样点来生成所述预测块,以及其中,基于所述当前块的所述分区预测信息来确定插值滤波器。
根据实施例,插值滤波器被确定为彼此不同的两个插值滤波器中的一个。
根据实施例,当前块的分区预测信息包括是否执行所述当前块的分区预测和所述当前块的分区方向。
根据实施例,所述预测信息包括关于多个参考样点线的信息,并且基于关于所述多个参考样点线的信息来确定插值滤波器。
根据实施例,所述预测信息包括用于所述当前块的所述邻近块的基于矩阵的预测模式信息,并且当对所述邻近块执行基于矩阵的帧内预测时,所述邻近块的帧内预测模式被认为是平面模式。
根据实施例,所述邻近块是位于所述当前块的左下方块或右上方的块。
根据实施例,当所述当前块的亮度块的帧内预测模式为基于矩阵的帧内预测模式时,所述当前块的色度块的帧内预测模式被推导为平面模式。
根据实施例,所述预测信息包括所述当前块的残差信号预测信息,以及基于残差信号预测信息确定所述当前块的帧内预测模式。
根据实施例,基于残差信号预测信息将所述当前块的帧内预测模式确定为水平预测模式和垂直预测模式之一。
一种非暂时性计算机可读记录介质,被配置为存储通过根据本公开另一方面的图像编码方法生成的比特流,其中,所述图像编码方法包括:确定当前块的预测模式;通过基于所述当前块的预测模式执行预测来生成当前块的预测块;以及对包括所述当前块的所述预测模式的所述当前块的预测信息进行编码,其中,所述预测信息包括所述当前块的分区预测信息,其中,生成所述预测块的步骤包括:从所述当前块的邻近块获得参考样点;将插值滤波器应用于所述参考样点;以及通过使用应用了插值滤波器的所述参考样点来生成所述预测块,以及其中,基于所述当前块的分区预测信息来确定插值滤波器。
有益效果
根据本公开,由此提供了一种具有提高的编码/解码效率的图像编码/解码方法和设备。
此外,根据本公开,提供了一种用于通过选择插值滤波器来对图像进行编码/解码的方法和设备。
此外,根据本公开,提供了一种存储由根据本公开的图像编码方法或设备生成的比特流的记录介质。
另外,根据本公开,提供了一种存储由根据本公开的图像解码设备接收和解码的比特流的记录介质并被用于图像恢复。
附图说明
图1是示出根据应用了本发明的实施例的编码设备的配置的框图。
图2是示出根据实施例并且应用了本发明的解码设备的配置的框图。
图3是示意性地示出当对图像进行编码和解码时图像的分区结构的示图。
图4是示出帧内预测处理的示图。
图5是示出画面间预测处理的实施例的示图。
图6是示出变换和量化处理的示图。
图7是示出能够被用于帧内预测的参考样点的示图。
图8是用于说明根据本发明实施例的帧内预测处理的示图。
图9是用于说明亮度块与色度块之间的关系的示图。
图10是用于说明根据本发明的实施例的被用于推导当前块的帧内预测模式的邻近块的帧内预测模式的示图。
图11是用于说明根据本发明实施例的根据当前块的尺寸和/或形状的DC预测的实施例的示图。
图12是用于说明根据本发明的实施例的在颜色分量之间执行帧内预测的处理的示图。
图13是用于说明根据本发明的实施例的样点线单元预测的示例的示图。
具体实施方式
可对本发明进行各种修改,并且存在本发明的各种实施例,其中,现在将参照附图来提供本发明的各种实施例的示例并对其进行详细描述。然而,本发明不限于此,尽管示例性实施例可被解释为包括本发明的技术构思和技术范围内的所有修改、等同或替代。在各个方面,相似的附图标号指代相同或相似的功能。在附图中,为了清楚,可夸大元件的形状和尺寸。在本发明的以下详细描述中,参照以图示的方式示出了可实践本发明的特定实施例的附图。足够详细地描述了这些实施例以使本领域技术人员能够实施本公开。应理解,本公开的各种实施例尽管不同,但不必是互斥的。例如,在不脱离本公开的精神和范围的情况下,结合一个实施例在此描述的特定特征、结构和特性可在其他实施例中被实现。此外,应理解,在不脱离本公开的精神和范围的情况下,可修改每个公开的实施例内的各个元件的位置或布置。因此,以下详细描述不应被视为具有限制意义,并且本公开的范围仅由所附权利要求(在被合适地解释的情况下,还连同权利要求所要求保护的等同物的全部范围)来限定。
说明书中使用的术语“第一”、“第二”等可用于描述各种组件,但是组件不应解释为限于这些术语。这些术语仅用于将一个组件与其他组件区分开。例如,在不脱离本发明的范围的情况下,“第一”组件可被命名为“第二”组件,并且“第二”组件也可被类似地命名为“第一”组件。术语“和/或”包括多个项的组合或多个项中的任意一项。
将理解的是,在本说明书中,当元件被简单称为“连接到”或“耦接到”另一元件而不是“直接连接到”或“直接耦接到”另一元件时,元件可“直接连接到”另一元件或“直接耦接到”另一元件,或者在元件与另一元件之间介入有其他元件的情况下被连接到或耦接到另一元件。相反,应理解,当元件被称为“直接耦接”或“直接连接”到另一元件时,不存在中间元件。
此外,本发明的实施例中所示的构成部分被独立地示出,以表示彼此不同的特征功能。因此,这并不表示每个构成部分都以单独的硬件或软件的构成单元构成。换言之,为了方便,每个构成部分包括列举出的构成部分中的每个构成部分。因此,每个构成部分的至少两个构成部分可被组合以形成一个构成部分,或者一个构成部分可被分区为多个构成部分以执行每种功能。如果没有脱离本发明的实质,则每个构成部分被组合的实施例和一个构成部分被分区的实施例也包括在本发明的范围内。
本说明书中使用的术语仅用于描述特定实施例,而不旨在限制本发明。除非在上下文中具有明显不同的含义,否则以单数形式使用的表述包括复数形式的表述。在本说明书中,将理解,诸如“包括”、“具有”等的术语旨在指示存在说明书中公开的特征、数字、步骤、动作、元件、部件或其组合,而并不旨在排除可存在或可添加一个或更多个其他特征、数字、步骤、动作、元件、部件或其组合的可能性。换言之,当特定元素被称为“被包括”时,并不排除除了对应元素之外的元素,而是可在本发明的实施例或本发明的范围中包括另外的元素。
此外,某些组成部分可能不是执行本发明的基本功能的必不可少的组成部分,而是仅提高其性能的选择性组成部分。可通过仅包括用于实现本发明的本质的必不可少的组成部分而不包括用于提高性能的组成部分来实现本发明。仅包括必不可少的组成部分而不包括仅用于提高性能的选择性组成部分的结构也包括在本发明的范围内。
在下文中,将参照附图详细描述本发明的实施例。在描述本发明的示例性实施例时,将不详细描述公知的功能或构造,因为它们可能不必要地模糊对本发明的理解。附图中相同的构成元件由相同的附图标号表示,并且对相同元件的重复描述将被省略。
在下文中,图像可指构成视频的画面,或者可指视频本身。例如,“对图像进行编码或解码或者进行编码和解码两者”可指“对运动画面进行编码或解码或者进行编码和解码两者”,并且可指“对运动画面的图像中的一个图像进行编码或解码或者进行编码和解码两者”。
在下文中,术语“运动画面”和“视频”可用作相同的含义并且可彼此替换。
在下文中,目标图像可以是作为编码目标的编码目标图像和/或作为解码目标的解码目标图像。此外,目标图像可以是输入到编码设备的输入图像、以及输入到解码设备的输入图像。这里,目标图像可与当前图像具有相同的含义。
在下文中,术语“图像”、“画面”、“帧”和“屏幕”可被用作相同的含义并且可彼此替换。
在下文中,目标块可以是作为编码目标的编码目标块和/或作为解码目标的解码目标块。此外,目标块可以是作为当前编码和/或解码的目标的当前块。例如,术语“目标块”和“当前块”可被用作相同的含义并且可彼此替换。
在下文中,术语“块”和“单元”可被用作相同的含义并且可彼此替换。或者“块”可表示特定单元。
在下文中,术语“区域”和“片段”可彼此替换。
在下文中,特定信号可以是表示特定块的信号。例如,原始信号可以是表示目标块的信号。预测信号可以是表示预测块的信号。残差信号可以是表示残差块的信号。
在实施例中,特定信息、数据、标志、索引、元素和属性等中的每个可具有值。信息、数据、标志、索引、元素和属性的值等于“0”可表示逻辑假或第一预定义值。换言之,值“0”、假、逻辑假和第一预定义值可彼此替换。信息、数据、标志、索引、元素和属性的值等于“1”可表示逻辑真或第二预定义值。换言之,值“1”、真、逻辑真和第二预定义值可彼此替换。
当变量i或j用于表示列、行或索引时,i的值可以是等于或大于0的整数,或者是等于或大于1的整数。即,列、行、索引等可从0开始计数,或者可从1开始计数。
术语的描述
编码器:表示执行编码的设备。也就是说,表示编码设备。
解码器:表示执行解码的设备。也就是说,表示解码设备。
块:是M×N的样点阵列。这里,M和N可表示正整数,并且块可表示二维形式的样点阵列。块可指单元。当前块可表示在编码时成为目标的编码目标块,或者在解码时成为目标的解码目标块。此外,当前块可以是编码块、预测块、残差块和变换块中的至少一个。
样点:是构成块的基本单元。根据比特深度(Bd),样点可被表示为从0到2Bd-1的值。在本发明中,样点可被用作像素的含义。也就是说,样点、pel、像素可具有彼此相同的含义。
单元:可指编码和解码单元。当对图像进行编码和解码时,单元可以是通过对单个图像进行分区而生成的区域。此外,当在编码或解码期间将单个图像分区为子分区单元时,单元可表示子分区单元。也就是说,图像可被分区为多个单元。当对图像进行编码和解码时,可执行针对每个单元的预定处理。单个单元可被分区为尺寸小于该单元的尺寸的子单元。根据功能,单元可表示块、宏块、编码树单元、编码树块、编码单元、编码块、预测单元、预测块、残差单元、残差块、变换单元、变换块等。此外,为了将单元与块区分开,单元可包括亮度分量块、与亮度分量块相关联的色度分量块、以及每个颜色分量块的语法元素。单元可具有各种尺寸和形状,具体地,单元的形状可以是二维几何图形,诸如正方形、矩形、梯形、三角形、五边形等。此外,单元信息可包括指示编码单元、预测单元、变换单元等的单元类型以及单元尺寸、单元深度、单元的编码和解码的顺序等中的至少一个。
编码树单元:被配置有亮度分量Y的单个编码树块以及与色度分量Cb和Cr相关的两个编码树块。此外,编码树单元可表示包括块和每个块的语法元素。可通过使用四叉树分区方法、二叉树分区方法和三叉树分区方法中的至少一个对每个编码树单元进行分区,以配置诸如编码单元、预测单元、变换单元等的更低等级的单元。编码树单元可被用作用于指定在对作为输入图像的图像进行编码/解码时成为处理单元的样点块的术语。这里,四叉树可表示四元树。
当编码块的尺寸在预定范围内时,可仅使用四叉树分区进行分区。这里,所述预定范围可被定义为能够仅使用四叉树分区进行分区的编码块的最大尺寸和最小尺寸中的至少一个。可通过比特流用信号发送指示允许四叉树分区的编码块的最大/最小尺寸的信息,并且可在序列、画面参数、并行块组或条带(片段)中的至少一个单元中用信号发送所述信息。可选地,编码块的最大/最小尺寸可以是编码器/解码器中预定的固定尺寸。例如,当编码块的尺寸与256×256至64×64对应时,仅使用四叉树分区来进行分区是可能的。可选地,当编码块的尺寸大于最大转换块的尺寸时,仅使用四叉树分区来进行分区是可能的。这里,将被分区的块可以是编码块和变换块中的至少一个。在这种情况下,指示编码块的分区的信息(例如,split_flag)可以是指示是否执行四叉树分区的标志。当编码块的尺寸落在预定范围内时,仅使用二叉树或三叉树分区来进行分区是可能的。在这种情况下,对四叉树分区的以上描述可以以相同方式被应用于二叉树分区或三叉树分区。
编码树块:可用作用于指定Y编码树块、Cb编码树块和Cr编码树块中的任意一个的术语。
邻近块:可表示与当前块相邻的块。与当前块相邻的块可表示与当前块的边界接触的块、或者位于距当前块预定距离内的块。邻近块可表示与当前块的顶点相邻的块。这里,与当前块的顶点相邻的块可表示与水平相邻于当前块的邻近块垂直相邻的块、或者与垂直相邻于当前块的邻近块水平相邻的块。
重建邻近块:可表示与当前块相邻并且已经在空间/时间上被编码或解码的邻近块。这里,重建邻近块可表示重建邻近单元。重建空间邻近块可以是在当前画面内并且已经通过编码或解码或者编码和解码两者而被重建的块。重建时间邻近块是在参考图像内的与当前画面的当前块对应的位置处的块或所述块的邻近块。
单元深度:可表示单元的分区程度。在树结构中,最高节点(根节点)可与未被分区的第一单元对应。此外,最高节点可具有最小深度值。在这种情况下,最高节点的深度可以是等级0。深度为等级1的节点可表示通过对第一单元进行一次分区而生成的单元。深度为等级2的节点可表示通过对第一单元进行两次分区而生成的单元。深度为等级n的节点可表示通过对第一单元进行n次分区而生成的单元。叶节点可以是最低节点并且是不能被进一步分区的节点。叶节点的深度可以是最大等级。例如,所述最大等级的预定义值可以是3。根节点的深度可以是最低的,并且叶节点的深度可以是最深的。此外,当单元被表示为树结构时,单元所存在于的等级可表示单元深度。
比特流:可表示包括编码图像信息的比特流。
参数集:与比特流内的配置之中的头信息对应。视频参数集、序列参数集、画面参数集和自适应参数集中的至少一个可被包括在参数集中。此外,参数集可包括条带(slice)头、并行块(tile)组头和并行块头信息。术语“并行块组”表示一组并行块并且与条带具有相同的含义。
自适应参数集可表示可通过在不同画面、子画面、条带、并行块组、并行块或分块(brick)中被参考而被共享的参数集。此外,可通过参考针对画面内的子画面、条带、并行块组、并行块或分块的不同自适应参数集来使用自适应参数集中的信息。
此外,关于自适应参数集,可通过使用针对画面内的子画面、条带、并行块组、并行块或分块的不同自适应参数集的标识符来参考不同自适应参数集。
此外,关于自适应参数集,可通过使用针对子画面内的条带、并行块组、并行块或分块的不同自适应参数集的标识符来参考不同自适应参数集。
此外,关于自适应参数集,可通过使用针对条带内的并行块或分块的不同自适应参数集的标识符来参考不同自适应参数集。
此外,关于自适应参数集,可通过使用针对并行块内的分块的不同自适应参数集的标识符来参考不同自适应参数集。
关于自适应参数集标识符的信息可被包括在子画面的参数集或头中,并且与该自适应参数集标识符对应的自适应参数集可被用于子画面。
关于自适应参数集标识符的信息可被包括在并行块的参数集或头中,并且与该自适应参数集标识符对应的自适应参数集可被用于并行块。
关于自适应参数集标识符的信息可被包括在分块的头中,并且与该自适应参数集标识符对应的自适应参数集可被用于分块。
画面可被分区为一个或更多个并行块行以及一个或更多个并行块列。
子画面可被分区为画面内的一个或更多个并行块行以及一个或更多个并行块列。子画面可以是画面内的具有矩形/正方形形式的区域,并且可包括一个或更多个CTU。此外,至少一个或更多个并行块/分块/条带可被包括在一个子画面内。
并行块可以是画面内的具有矩形/正方形形式的区域,并且可包括一个或更多个CTU。此外,并行块可被分区为一个或更多个分块。
分块可表示并行块内的一个或更多个CTU行。并行块可被分区为一个或更多个分块,并且每个分块可具有至少一个或更多个CTU行。未被分区为两个或更多个的并行块可表示分块。
条带可包括画面内的一个或更多个并行块,并且可包括并行块内的一个或更多个分块。
解析:可表示通过执行熵解码来确定语法元素的值,或者可表示熵解码本身。
符号:可表示编码/解码目标单元的语法元素、编码参数和变换系数值中的至少一个。此外,符号可表示熵编码目标或熵解码结果。
预测模式:可以是指示利用帧内预测而被编码/解码的模式或利用帧间预测而被编码/解码的模式的信息。
预测单元:可表示当执行预测(诸如帧间预测、帧内预测、帧间补偿、帧内补偿和运动补偿)时的基本单元。单个预测单元可被分区为具有更小尺寸的多个分区,或者可被分区为多个更低等级的预测单元。多个分区可以是在执行预测或补偿时的基本单元。通过分区预测单元而生成的分区也可以是预测单元。
预测单元分区:可表示通过对预测单元进行分区而获得的形状。
参考画面列表可指包括用于帧间预测或运动补偿的一个或更多个参考画面的列表。存在若干类型的可用参考画面列表,包括LC(列表组合)、L0(列表0)、L1(列表1)、L2(列表2)、L3(列表3)。
帧间预测指示符可指当前块的帧间预测的方向(单向预测、双向预测等)。可选地,帧间预测指示符可指用于生成当前块的预测块的参考画面的数量。可选地,帧间预测指示符可指在对当前块执行帧间预测或运动补偿时使用的预测块的数量。
预测列表利用标志指示是否使用特定参考画面列表中的至少一个参考画面来生成预测块。可使用预测列表利用标志来推导帧间预测指示符,并且相反地,可使用帧间预测指示符来推导预测列表利用标志。例如,当预测列表利用标志具有第一值零(0)时,它表示参考画面列表中的参考画面不被用于生成预测块。另一方面,当预测列表利用标志具有第二值一(1)时,它表示参考画面列表被用于生成预测块。
参考画面索引可指指示参考画面列表中的特定参考画面的索引。
参考画面可表示由特定块参考以用于特定块的帧间预测或运动补偿的目的的参考画面。可选地,参考画面可以是包括由当前块参考以用于帧间预测或运动补偿的参考块的画面。在下文中,术语“参考画面”和“参考图像”具有相同的含义并且可互换。
运动矢量可以是用于帧间预测或运动补偿的二维矢量。运动矢量可表示编码/解码目标块与参考块之间的偏移。例如,(mvX,mvY)可表示运动矢量。这里,mvX可表示水平分量,并且mvY可表示垂直分量。
搜索范围可以是在帧间预测期间被搜索以检索运动矢量的二维区域。例如,搜索范围的尺寸可以是M×N。这里,M和N都是整数。
运动矢量候选可指在对运动矢量进行预测时的预测候选块或预测候选块的运动矢量。此外,运动矢量候选可被包括在运动矢量候选列表中。
运动矢量候选列表可表示由一个或更多个运动矢量候选组成的列表。
运动矢量候选索引可表示指示运动矢量候选列表中的运动矢量候选的指示符。可选地,它可以是运动矢量预测因子的索引。
运动信息可表示包括包括运动矢量、参考画面索引、帧间预测指示符、预测列表利用标志、参考画面列表信息、参考画面、运动矢量候选、运动矢量候选索引、合并候选和合并索引的项中的至少一项的信息。
合并候选列表可表示由一个或更多个合并候选组成的列表。
合并候选可表示空间合并候选、时间合并候选、组合合并候选、组合双预测合并候选或零合并候选。合并候选可包括诸如帧间预测指示符、每个列表的参考画面索引、运动矢量、预测列表利用标志和帧间预测指示符的运动信息。
合并索引可表示指示合并候选列表中的合并候选的指示符。可选地,合并索引可指示在空间上/时间上与当前块相邻的重建块中的块,其中,已从该块推推导合并候选。可选地,合并索引可指示合并候选的至少一条运动信息。
变换单元:可表示在对残差信号执行编码/解码(诸如变换、逆变换、量化、反量化、变换系数编码/解码)时的基本单元。单个变换单元可被分区为具有更小尺寸的多个更低等级的变换单元。这里,变换/逆变换可包括第一变换/第一逆变换和第二变换/第二逆变换中的至少一个。
缩放:可表示将量化的等级乘以因子的处理。可通过对量化的等级进行缩放来生成变换系数。缩放也可被称为反量化。
量化参数:可表示当在量化期间使用变换系数来生成量化的等级时使用的值。量化参数还可表示当在反量化期间通过对量化的等级进行缩放来生成变换系数时使用的值。量化参数可以是被映射在量化步长上的值。
增量量化参数:可表示预测的量化参数与编码/解码目标单元的量化参数之间的差值。
扫描:可表示对单元、块或矩阵内的系数进行排序的方法。例如,将系数的二维矩阵改变为一维矩阵可被称为扫描,将系数的一维矩阵改变为二维矩阵可被称为扫描或逆扫描。
变换系数:可表示在编码器中执行变换之后生成的系数值。变换系数可表示在解码器中执行熵解码和反量化中的至少一个之后生成的系数值。通过对变换系数或残差信号进行量化而获得的量化的等级或者量化的变换系数等级也可落入变换系数的含义内。
量化的等级:可表示在编码器中通过对变换系数或残差信号进行量化而生成的值。可选地,量化的等级可表示作为在解码器中经历反量化的反量化目标的值。类似地,作为变换和量化的结果的量化的变换系数等级也可落入量化的等级的含义内。
非零变换系数:可表示具有除零之外的值的变换系数、或者具有除零之外的值的变换系数等级或量化的等级。
量化矩阵:可表示在为了提高主观图像质量或客观图像质量而执行的量化处理或反量化处理中使用的矩阵。量化矩阵也可被称为缩放列表。
量化矩阵系数:可表示量化矩阵内的每个元素。量化矩阵系数也可被称为矩阵系数。
默认矩阵:可表示在编码器或解码器中预先定义的预定量化矩阵。
非默认矩阵:可表示在编码器或解码器中未被预先定义而是由用户用信号发送的量化矩阵。
统计值:针对具有可计算的特定值的变量、编码参数、常量值等之中的至少一个的统计值可以是对应特定值的平均值、求和值、加权平均值、加权和值、最小值、最大值、最频繁出现的值、中值、插值之中的一个或更多个。
图1是示出根据应用了本发明的实施例的编码设备的配置的框图。
编码设备100可以是编码器、视频编码设备或图像编码设备。视频可包括至少一个图像。编码设备100可顺序地对至少一个图像进行编码。
参照图1,编码设备100可包括运动预测单元111、运动补偿单元112、帧内预测单元120、切换器115、减法器125、变换单元130、量化单元140、熵编码单元150、反量化单元160、逆变换单元170、加法器175、滤波器单元180和参考画面缓冲器190。
编码设备100可通过使用帧内模式或帧间模式或者帧内模式和帧间模式两者来执行输入图像的编码。此外,编码设备100可通过对输入图像进行编码来生成包括编码信息的比特流,并输出生成的比特流。生成的比特流可被存储在计算机可读记录介质中,或者可通过有线/无线传输介质被流传输。当帧内模式被用作预测模式时,切换器115可切换到帧内。可选地,当帧间模式被用作预测模式时,切换器115可切换到帧间模式。这里,帧内模式可表示帧内预测模式,帧间模式可表示帧间预测模式。编码设备100可生成针对输入图像的输入块的预测块。此外,编码设备100可在生成预测块之后使用输入块和预测块的残差对残差块进行编码。输入图像可被称为作为当前编码目标的当前图像。输入块可被称为作为当前编码目标的当前块,或者被称为编码目标块。
当预测模式是帧内模式时,帧内预测单元120可使用已被编码/解码并与当前块相邻的块的样点作为参考样点。帧内预测单元120可通过使用参考样点来对当前块执行空间预测,或者通过执行空间预测来生成输入块的预测样点。这里,帧内预测可表示帧内部的预测。
当预测模式是帧间模式时,运动预测单元111可在执行运动预测时从参考图像检索与输入块最匹配的区域,并且通过使用检索到的区域来推导运动矢量。在这种情况下,搜索区域可被用作所述区域。参考图像可被存储在参考画面缓冲器190中。这里,当执行对参考图像的编码/解码时,参考图像可被存储在参考画面缓冲器190中。
运动补偿单元112可通过使用运动矢量对当前块执行运动补偿来生成预测块。这里,帧间预测可表示帧之间的预测或运动补偿。
当运动矢量的值不是整数时,运动预测单元111和运动补偿单元112可通过将插值滤波器应用于参考画面的部分区域来生成预测块。为了对编码单元执行画面间预测或运动补偿,可确定跳过模式、合并模式、高级运动矢量预测(AMVP)模式和当前画面参考模式之中的哪个模式被用于对包括在对应编码单元中的预测单元的运动预测和运动补偿。然后,根据所确定的模式,可不同地执行画面间预测或运动补偿。
减法器125可通过使用输入块和预测块的差来生成残差块。残差块可被称为残差信号。残差信号可表示原始信号和预测信号之间的差。此外,残差信号可以是通过对原始信号与预测信号之间的差进行变换或量化或者变换和量化而生成的信号。残差块可以是块单元的残差信号。
变换单元130可通过对残差块执行变换来生成变换系数,并输出生成的变换系数。这里,变换系数可以是通过对残差块执行变换而生成的系数值。当变换跳过模式被应用时,变换单元130可跳过对残差块的变换。
可通过将量化应用于变换系数或应用于残差信号来生成量化的等级。在下文中,量化的等级在实施例中也可被称为变换系数。
量化单元140可通过根据参数对变换系数或残差信号进行量化来生成量化的等级,并输出生成的量化的等级。这里,量化单元140可通过使用量化矩阵对变换系数进行量化。
熵编码单元150可通过根据概率分布对由量化单元140计算出的值或者对在执行编码时计算出的编码参数值执行熵编码来生成比特流,并输出生成的比特流。熵编码单元150可对图像的样点信息和用于对图像进行解码的信息执行熵编码。例如,用于对图像进行解码的信息可包括语法元素。
当熵编码被应用时,符号被表示使得较少数量的比特被分配给具有高生成可能性的符号,并且较多数量的比特被分配给具有低生成可能性的符号,因此,可减小用于将被编码的符号的比特流的大小。熵编码单元150可使用诸如指数Golomb、上下文自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等的用于熵编码的编码方法。例如,熵编码单元150可通过使用变长编码/码(VLC)表来执行熵编码。此外,熵编码单元150可推导目标符号的二值化方法和目标符号/二进制位的概率模型,并且通过使用推导的二值化方法和上下文模型来执行算术编码。
为了对变换系数等级(量化的等级)进行编码,熵编码单元150可通过使用变换系数扫描方法将二维块形式的系数改变为一维矢量形式。
编码参数可包括编码器中被编码并且被用信号发送到解码器的诸如语法元素的信息(标志、索引等)以及在执行编码或解码时推推导的信息。编码参数可表示在对图像进行编码或解码时所需要的信息。例如,以下项中的至少一个值或组合形式可被包括在编码参数中:单元/块尺寸、单元/块深度、单元/块分区信息、单元/块形状、单元/块分区结构、是否进行四叉树形式的分区、是否进行二叉树形式的分区、二叉树形式的分区方向(水平方向或垂直方向)、二叉树形式的分区形式(对称分区或非对称分区)、当前编码单元是否通过三叉树分区被分区、三叉树分区的方向(水平方向或垂直方向)、三叉树分区的类型(对称类型或非对称类型)、当前编码单元是否通过多类型树分区被分区、多类型树分区的方向(水平方向或垂直方向)、多类型树分区的类型(对称类型或非对称类型)、多类型树分区的树(二叉树或三叉树)结构、预测模式(帧内预测或帧间预测)、亮度帧内预测模式/方向、色度帧内预测模式/方向、帧内分区信息、帧间分区信息、编码块分区标志、预测块分区标志、变换块分区标志、参考样点滤波方法、参考样点滤波器抽头、参考样点滤波器系数、预测块滤波方法、预测块滤波器抽头、预测块滤波器系数、预测块边界滤波方法、预测块边界滤波器抽头、预测块边界滤波器系数、帧内预测模式、帧间预测模式、运动信息、运动矢量、运动矢量差、参考画面索引、帧间预测角度、帧间预测指示符、预测列表利用标志、参考画面列表、参考画面、运动矢量预测因子索引、运动矢量预测因子候选、运动矢量候选列表、是否使用合并模式、合并索引、合并候选、合并候选列表、是否使用跳过模式、插值滤波器类型、插值滤波器抽头、插值滤波器系数、运动矢量大小、运动矢量的表示精度、变换类型、变换尺寸、初级(第一)变换是否被使用的信息、次级变换是否被使用的信息、初级变换索引、次级变换索引、残差信号是否存在的信息、编码块样式、编码块标志(CBF)、量化参数、量化参数残差、量化矩阵、是否应用帧内环路滤波器、帧内环路滤波器系数、帧内环路滤波器抽头、帧内环路滤波器形状/形式、是否应用去块滤波器、去块滤波器系数、去块滤波器抽头、去块滤波器强度、去块滤波器形状/形式、是否应用自适应样点偏移、自适应样点偏移值、自适应样点偏移类别、自适应样点偏移类型、是否应用自适应环路滤波器、自适应环路滤波器系数、自适应环路滤波器抽头、自适应环路滤波器形状/形式、二值化/逆二值化方法、上下文模型确定方法、上下文模型更新方法、是否执行常规模式、是否执行旁路模式、上下文二进制位、旁路二进制位、有效系数标志、最后有效系数标志、针对系数组的单元的编码标志、最后有效系数的位置、关于系数的值是否大于1的标志、关于系数的值是否大于2的标志、关于系数的值是否大于3的标志、关于其余系数值的信息、符号信息、重建亮度样点、重建色度样点、残差亮度样点、残差色度样点、亮度变换系数、色度变换系数、量化的亮度等级、量化的色度等级、变换系数等级扫描方法、在解码器侧的运动矢量搜索区域的尺寸、在解码器侧的运动矢量搜索区域的形状、在解码器侧的运动矢量搜索的次数、关于CTU尺寸的信息、关于最小块尺寸的信息、关于最大块尺寸的信息、关于最大块深度的信息、关于最小块深度的信息、图像显示/输出顺序、条带标识信息、条带类型、条带分区信息、并行块标识信息、并行块类型、并行块分区信息、并行块组标识信息、并行块组类型、并行块组分区信息、画面类型、输入样点的比特深度、重建样点的比特深度、残差样点的比特深度、变换系数的比特深度、量化的等级的比特深度、以及关于亮度信号的信息或关于色度信号的信息。
这里,用信号发送标志或索引可表示由编码器对对应标志或索引进行熵编码并将其包括在比特流中,并且可表示由解码器从比特流对对应标志或索引进行熵解码。
当编码设备100通过帧间预测执行编码时,编码的当前图像可被用作用于随后被处理的另一图像的参考图像。因此,编码设备100可对编码的当前图像进行重建或解码,或者将重建或解码的图像作为参考图像存储在参考画面缓冲器190中。
量化的等级可在反量化单元160中被反量化,或者可在逆变换单元170中被逆变换。可由加法器175将经过反量化或逆变换的系数或者经过反量化和逆变换两者的系数与预测块相加。通过将经过反量化或逆变换的系数或者经过反量化和逆变换两者的系数与预测块相加,可生成重建块。这里,经过反量化或逆变换的系数或经过反量化和逆变换两者的系数可表示执行了反量化和逆变换中的至少一个的系数,并且可表示重建残差块。
重建块可通过滤波器单元180。滤波器单元180可将去块滤波器、样点自适应偏移(SAO)和自适应环路滤波器(ALF)中的至少一个应用于重建样点、重建块或重建图像。滤波器单元180可被称为环内滤波器。
去块滤波器可去除在块之间的边界中生成的块失真。为了确定是否应用去块滤波器,可基于块中所包括的若干行或列中包括的样点来确定是否将去块滤波器应用于当前块。当将去块滤波器应用于块时,可根据所需的去块滤波强度来应用另一滤波器。
为了补偿编码误差,可通过使用样点自适应偏移将合适的偏移值与样点值相加。样点自适应偏移可以以样点为单位对经过去块的图像与原始图像的偏移进行校正。可使用考虑关于每个样点的边缘信息来应用偏移的方法,或者可使用以下方法:将图像的样点分区为预定数量的区域,确定偏移被应用的区域,并对确定的区域应用偏移。
自适应环路滤波器可基于经滤波的重建图像和原始图像的比较结果来执行滤波。可将包括在图像中的样点分区为预定组,可确定将被应用于每个组的滤波器,并且可对每个组执行差异化滤波。是否应用ALF的信息可通过编码单元(CU)被用信号发送,并且将被应用于每个块的ALF的形式和系数可变化。
已经通过滤波器单元180的重建块或重建图像可被存储在参考画面缓冲器190中。由滤波器单元180处理的重建块可以是参考图像的一部分。也就是说,参考图像是由滤波器单元180处理的重建块组成的重建图像。存储的参考图像可稍后在帧间预测或运动补偿中被使用。
图2是示出根据实施例并且应用了本发明的解码设备的配置的框图。
解码设备200可以是解码器、视频解码设备或图像解码设备。
参照图2,解码设备200可包括熵解码单元210、反量化单元220、逆变换单元230、帧内预测单元240、运动补偿单元250、加法器255、滤波器单元260和参考画面缓冲器270。
解码设备200可接收从编码设备100输出的比特流。解码设备200可接收存储在计算机可读记录介质中的比特流,或者可接收通过有线/无线传输介质被流传输的比特流。解码设备200可通过使用帧内模式或帧间模式对比特流进行解码。此外,解码设备200可生成通过解码而生成的重建图像或解码图像,并输出重建图像或解码图像。
当在解码时使用的预测模式是帧内模式时,切换器可被切换到帧内。可选地,当在解码时使用的预测模式是帧间模式时,切换器可被切换到帧间模式。
解码设备200可通过对输入比特流进行解码来获得重建残差块,并生成预测块。当重建残差块和预测块被获得时,解码设备200可通过将重建残差块与预测块相加来生成成为解码目标的重建块。解码目标块可被称为当前块。
熵解码单元210可通过根据概率分布对比特流进行熵解码来生成符号。生成的符号可包括量化的等级形式的符号。这里,熵解码方法可以是上述熵编码方法的逆处理。
为了对变换系数等级(量化的等级)进行解码,熵解码单元210可通过使用变换系数扫描方法将单向矢量形式的系数改变为二维块形式。
可在反量化单元220中对量化的等级进行反量化,或者可在逆变换单元230中对量化的等级进行逆变换。量化的等级可以是进行反量化或逆变换或者进行反量化和逆变换两者的结果,并且可被生成为重建残差块。这里,反量化单元220可将量化矩阵应用于量化的等级。
当使用帧内模式时,帧内预测单元240可通过对当前块执行空间预测来生成预测块,其中,空间预测使用与解码目标块相邻并且已经被解码的块的样点值。
当使用帧间模式时,运动补偿单元250可通过对当前块执行运动补偿来生成预测块,其中,运动补偿使用运动矢量以及存储在参考画面缓冲器270中的参考图像。
加法器255可通过将重建残差块与预测块相加来生成重建块。滤波器单元260可将去块滤波器、样点自适应偏移和自适应环路滤波器中的至少一个应用于重建块或重建图像。滤波器单元260可输出重建图像。重建块或重建图像可被存储在参考画面缓冲器270中并且在执行帧间预测时被使用。由滤波器单元260处理的重建块可以是参考图像的一部分。也就是说,参考图像是由滤波器单元260处理的重建块组成的重建图像。存储的参考图像可稍后在帧间预测或运动补偿中被使用。
图3是示意性地示出当对图像进行编码和解码时图像的分区结构的示图。图3示意性地示出将单个单元分区为多个更低等级的单元的示例。
为了有效地对图像进行分区,当进行编码和解码时,可使用编码单元(CU)。编码单元可被用作当对图像进行编码/解码时的基本单元。此外,编码单元可被用作用于在对图像进行编码/解码时区分帧内预测模式与帧间预测模式的单元。编码单元可以是用于预测、变换、量化、逆变换、反量化、或对变换系数的编码/解码处理的基本单元。
参照图3,图像300按照最大编码单元(LCU)被顺序地分区,并且LCU单元被确定为分区结构。这里,LCU可以以与编码树单元(CTU)相同的含义被使用。单元分区可表示对与该单元相关联的块进行分区。在块分区信息中,可包括单元深度的信息。深度信息可表示单元被分区的次数或程度或者单元被分区的次数和程度两者。可基于树结构将单个单元分区为与深度信息分层地相关联的多个更低等级的单元。换言之,单元和通过对该单元进行分区而生成的更低等级的单元可分别与节点和该节点的子节点对应。分区出的更低等级的单元中的每个可具有深度信息。深度信息可以是表示CU的尺寸的信息,并且可被存储在每个CU中。单元深度表示与对单元进行分区相关的次数和/或程度。因此,更低等级的单元的分区信息可包括关于更低等级的单元的尺寸的信息。
分区结构可表示LCU 310内的编码单元(CU)的分布。可根据是否将单个CU分区为多个(包括2、4、8、16等的等于或大于2的正整数)CU来确定这样的分布。通过分区生成的CU的水平尺寸和垂直尺寸可分别是分区之前的CU的水平尺寸和垂直尺寸的一半,或者可根据分区的次数而分别具有小于进行分区之前的水平尺寸和垂直尺寸的尺寸。CU可被递归地分区为多个CU。通过递归分区,与分区之前的CU的高度和宽度之中的至少一个相比,分区之后的CU的高度和宽度之中的至少一个可减小。可递归地执行CU的分区,直到预定义的深度或预定义的尺寸为止。例如,LCU的深度可以是0,最小编码单元(SCU)的深度可以是预定义的最大深度。这里,如上所述,LCU可以是具有最大编码单元尺寸的编码单元,并且SCU可以是具有最小编码单元尺寸的编码单元。分区从LCU 310开始,当CU的水平尺寸或垂直尺寸或者水平尺寸和垂直尺寸两者通过分区而减小时,CU深度增加1。例如,对于每个深度,未被分区的CU的尺寸可以是2N×2N。此外,在被分区的CU的情况下,可将尺寸为2N×2N的CU分区为尺寸为N×N的四个CU。随着深度增加1,N的大小可减半。
此外,可通过使用CU的分区信息来表示CU是否被分区的信息。分区信息可以是1比特信息。除SCU之外的所有CU可包括分区信息。例如,当分区信息的值为第一值时,CU可不被分区,当分区信息的值为第二值时,CU可被分区。
参照图3,具有深度0的LCU可以是64×64的块。0可以是最小深度。具有深度3的SCU可以是8×8的块。3可以是最大深度。32×32的块和16×16的块的CU可分别被表示为深度1和深度2。
例如,当单个编码单元被分区为四个编码单元时,分区出的四个编码单元的水平尺寸和垂直尺寸可以是CU在被分区之前的水平尺寸和垂直尺寸的一半大小。在一个实施例中,当尺寸为32×32的编码单元被分区为四个编码单元时,分区出的四个编码单元中的每个可具有16×16的尺寸。当单个编码单元被分区为四个编码单元时,可称编码单元可被分区为四叉树形式。
例如,当一个编码单元被分区为两个子编码单元时,该两个子编码单元中的每个子编码单元的水平尺寸或垂直尺寸(宽度或高度)可以是原始编码单元的水平尺寸或垂直尺寸的一半。例如,当尺寸为32×32的编码单元被垂直分区为两个子编码单元时,该两个子编码单元中的每个子编码单元可具有16×32的尺寸。例如,当尺寸为8×32的编码单元被水平分区为两个子编码单元时,该两个子编码单元中的每个子编码单元可具有8×16的尺寸。当一个编码单元被分区为两个子编码单元时,可称编码单元被二分区或者按照二叉树分区结构被分区。
例如,当一个编码单元被分区为三个子编码单元时,可以以1:2:1的比例对编码单元的水平尺寸或垂直尺寸进行分区,从而产生水平尺寸或垂直尺寸的比例为1:2:1的三个子编码单元。例如,当尺寸为16×32的编码单元被水平分区为三个子编码单元时,该三个子编码单元以从最上方子编码单元到最下方子编码单元的顺序可分别具有16×8、16×16和16×8的尺寸。例如,当尺寸为32×32的编码单元被垂直分区为三个子编码单元时,该三个子编码单元以从左侧子编码单元到右侧子编码单元的顺序可分别具有8×32、16×32和8×32的尺寸。当一个编码单元被分区为三个子编码单元时,可称编码单元被三分区或者按照三叉树分区结构被分区。
在图3中,编码树单元(CTU)320是四叉树分区结构、二叉树分区结构和三叉树分区结构全都被应用的CTU的示例。
如上所述,为了对CTU进行分区,可应用四叉树分区结构、二叉树分区结构和三叉树分区结构中的至少一个。可根据预定的优先级顺序将各种树分区结构顺序地应用于CTU。例如,可将四叉树分区结构优先应用于CTU。不能再使用四叉树分区结构进行分区的编码单元可与四叉树的叶节点对应。与四叉树的叶节点对应的编码单元可用作二叉树和/或三叉树分区结构的根节点。也就是说,与四叉树的叶节点对应的编码单元可按照二叉树分区结构或三叉树分区结构被进一步分区,或者可不被进一步分区。因此,通过防止从与四叉树的叶节点对应的编码单元的二叉树分区或三叉树分区得到的编码单元经历进一步的四叉树分区,块分区操作和/或用信号发送分区信息的操作可被有效执行。
可使用四分区信息用信号发送与四叉树的节点对应的编码单元被分区的事实。具有第一值(例如,“1”)的四分区信息可指示当前编码单元按照四叉树分区结构被分区。具有第二值(例如,“0”)的四分区信息可指示当前编码单元未按照四叉树分区结构被分区。四分区信息可以是具有预定长度(例如,一个比特)的标志。
在二叉树分区与三叉树分区之间可能没有优先级。也就是说,与四叉树的叶节点对应的编码单元可进一步经历二叉树分区和三叉树分区中的任意分区。此外,通过二叉树分区或三叉树分区生成的编码单元可经历进一步的二叉树分区或进一步的三叉树分区,或者可不被进一步分区。
在二叉树分区和三叉树分区之间不存在优先级的树结构被称为多类型树结构。与四叉树的叶节点对应的编码单元可用作多类型树的根节点。可使用多类型树分区指示信息、分区方向信息和分区树信息中的至少一个来用信号发送是否对与多类型树的节点对应的编码单元进行分区。为了对与多类型树的节点对应的编码单元进行分区,可顺序地用信号发送多类型树分区指示信息、分区方向信息和分区树信息。
具有第一值(例如,“1”)的多类型树分区指示信息可指示当前编码单元将经历多类型树分区。具有第二值(例如,“0”)的多类型树分区指示信息可指示当前编码单元将不经历多类型树分区。
当与多类型树的节点对应的编码单元按照多类型树分区结构被进一步分区时,所述编码单元可包括分区方向信息。分区方向信息可指示当前编码单元将在哪个方向上针对多类型树分区被分区。具有第一值(例如,“1”)的分区方向信息可指示当前编码单元将被垂直分区。具有第二值(例如,“0”)的分区方向信息可指示当前编码单元将被水平分区。
当与多类型树的节点对应的编码单元按照多类型树分区结构被进一步分区时,当前编码单元可包括分区树信息。分区树信息可指示将被用于对多类型树的节点进行分区的树分区结构。具有第一值(例如,“1”)的分区树信息可指示当前编码单元将按照二叉树分区结构被分区。具有第二值(例如,“0”)的分区树信息可指示当前编码单元将按照三叉树分区结构被分区。
分区指示信息、分区树信息和分区方向信息均可以是具有预定长度(例如,一个比特)的标志。
四叉树分区指示信息、多类型树分区指示信息、分区方向信息和分区树信息中的至少任意一个可被熵编码/熵解码。为了对那些类型的信息进行熵编码/熵解码,可使用关于与当前编码单元相邻的邻近编码单元的信息。例如,当前编码单元的左侧邻近编码单元和/或上方邻近编码单元的分区类型(被分区或不被分区、分区树和/或分区方向)与当前编码单元的分区类型相似的可能性很高。因此,可从关于邻近编码单元的信息推导用于对关于当前编码单元的信息进行熵编码/熵解码的上下文信息。关于邻近编码单元的信息可包括四分区信息、多类型树分区指示信息、分区方向信息和分区树信息中的至少任意一个。
作为另一示例,在二叉树分区和三叉树分区中,可优先执行二叉树分区。也就是说,当前编码单元可首先经历二叉树分区,并且随后可将与二叉树的叶节点对应的编码单元设置为用于三叉树分区的根节点。在这种情况下,对于与三叉树的节点对应的编码单元,可既不执行四叉树分区也不执行二叉树分区。
不能按照四叉树分区结构、二叉树分区结构和/或三叉树分区结构被分区的编码单元成为用于编码、预测和/或变换的基本单元。也就是说,所述编码单元不能被进一步分区以用于预测和/或变换。因此,在比特流中可能不存在用于将编码单元分区为预测单元和/或变换单元的分区结构信息和分区信息。
然而,当编码单元(即,用于分区的基本单元)的尺寸大于最大变换块的尺寸时,可递归地对编码单元进行分区,直到将编码单元的尺寸减小到等于或小于最大变换块的尺寸为止。例如,当编码单元的尺寸为64×64时并且当最大变换块的尺寸为32×32时,可将编码单元分区为用于变换的四个32×32的块。例如,当编码单元的尺寸为32×64并且最大变换块的尺寸为32×32时,可将编码单元分区为用于变换的两个32×32的块。在这种情况下,不单独用信号发送编码单元的针对变换的分区,并且可通过编码单元的水平尺寸或垂直尺寸与最大变换块的水平尺寸或垂直尺寸之间的比较来确定编码单元的针对变换的分区。例如,当编码单元的水平尺寸(宽度)大于最大变换块的水平尺寸(宽度)时,可将编码单元垂直地二等分。例如,当编码单元的垂直尺寸(高度)大于最大变换块的垂直尺寸(高度)时,可将编码单元水平地二等分。
编码单元的最大和/或最小尺寸的信息以及变换块的最大和/或最小尺寸的信息可在编码单元的更高等级被用信号发送或确定。所述更高等级可以是例如序列级、画面级、条带级、并行块组级、并行块级等。例如,编码单元的最小尺寸可被确定为4×4。例如,变换块的最大尺寸可被确定为64×64。例如,变换块的最小尺寸可被确定为4×4。
与四叉树的叶节点对应的编码单元的最小尺寸(四叉树最小尺寸)的信息和/或从多类型树的根节点到叶节点的最大深度(多类型树的最大树深度)的信息可在编码单元的更高等级被用信号发送或被确定。例如,所述更高等级可以是序列级、画面级、条带级、并行块组级、并行块级等。可针对画面内条带和画面间条带中的每一个用信号发送或确定四叉树的最小尺寸的信息和/或多类型树的最大深度的信息。
可在编码单元的更高等级用信号发送或确定CTU的尺寸与变换块的最大尺寸之间的差信息。例如,所述更高等级可以是序列级、画面级、条带级、并行块组级、并行块级等。可基于编码树单元的尺寸和所述差信息来确定与二叉树的各个节点对应的编码单元的最大尺寸(在下文中,称为二叉树的最大尺寸)的信息。与三叉树的各个节点对应的编码单元的最大尺寸(在下文中,称为三叉树的最大尺寸)可根据条带的类型而变化。例如,针对画面内条带,三叉树的最大尺寸可以是32×32。例如,针对画面间条带,三叉树的最大尺寸可以是128×128。例如,与二叉树的各个节点对应的编码单元的最小尺寸(在下文中,称为二叉树的最小尺寸)和/或与三叉树的各个节点对应的编码单元的最小尺寸(在下文中,称为三叉树的最小尺寸)可被设置为编码块的最小尺寸。
作为另一示例,可在条带级用信号发送或确定二叉树的最大尺寸和/或三叉树的最大尺寸。可选地,可在条带级用信号发送或确定二叉树的最小尺寸和/或三叉树的最小尺寸。
根据上述各种块的尺寸和深度信息,四分区信息、多类型树分区指示信息、分区树信息和/或分区方向信息可被包括或可不被包括在比特流中。
例如,当编码单元的尺寸不大于四叉树的最小尺寸时,编码单元不包括四分区信息。可推断四分区信息为第二值。
例如,当与多类型树的节点对应的编码单元的尺寸(水平尺寸和垂直尺寸)大于二叉树的最大尺寸(水平尺寸和垂直尺寸)和/或三叉树的最大尺寸(水平尺寸和垂直尺寸)时,编码单元可不被二分区或三分区。因此,可不用信号发送多类型树分区指示信息,但可推断多类型树分区指示信息为第二值。
可选地,当与多类型树的节点对应的编码单元的尺寸(水平尺寸和垂直尺寸)与二叉树的最大尺寸(水平尺寸和垂直尺寸)相同和/或是三叉树的最大尺寸(水平尺寸和垂直尺寸)的两倍大时,编码单元可不被进一步二分区或三分区。因此,可不用信号发送多类型树分区指示信息,而是可推导多类型树分区指示信息为第二值。这是因为当按照二叉树分区结构和/或三叉树分区结构对编码单元进行分区时,小于二叉树的最小尺寸和/或三叉树的最小尺寸的编码单元被生成。
可选地,可基于虚拟流水线数据单元的尺寸(在下文中,流水线缓冲器尺寸)来限制二叉树分区或三叉树分区。例如,当通过二叉树分区或三叉树分区将编码单元分区为不适合流水线缓冲器尺寸的子编码单元时,对应的二叉树分区或三叉树分区可能受到限制。流水线缓冲器尺寸可以是最大变换块的尺寸(例如,64×64)。例如,当流水线缓冲器尺寸是64×64时,可限制下面的分区。
-用于编码单元的N×M(N和/或M是128)三叉树分区
-用于编码单元的水平方向的128×N(N<=64)二叉树分区
-用于编码单元的垂直方向的N×128(N<=64)二叉树分区
可选地,当与多类型树的节点对应的编码单元的深度等于多类型树的最大深度时,编码单元可不被进一步二分区和/或三分区。因此,可不用信号发送多类型树分区指示信息,但可推断多类型树分区指示信息为第二值。
可选地,仅当垂直方向二叉树分区、水平方向二叉树分区、垂直方向三叉树分区和水平方向三叉树分区中的至少一个对于与多类型树的节点对应的编码单元是可能的时,可用信号发送多类型树分区指示信息。否则,编码单元可不被二分区和/或三分区。因此,可不用信号发送多类型树分区指示信息,但可推断多类型树分区指示信息为第二值。
可选地,仅当垂直方向二叉树分区和水平方向二叉树分区两者或垂直方向三叉树分区和水平方向三叉树分区两者对于与多类型树的节点对应的编码单元是可能的时,可用信号发送分区方向信息。否则,可不用信号发送分区方向信息,但是可推导分区方向信息为指示可能的分区方向的值。
可选地,仅当垂直方向二叉树分区和垂直方向三叉树分区两者或水平方向二叉树分区和水平方向三叉树分区两者对于与多类型树的节点对应的编码树是可能的时,可用信号发送分区树信息。否则,可不用信号发送分区树信息,而是可推导分区树信息为指示可能的分区树结构的值。
图4是示出帧内预测处理的示图。
图4中从中心到外部的箭头可表示帧内预测模式的预测方向。
可通过使用当前块的邻近块的参考样点来执行帧内编码和/或解码。邻近块可以是重建邻近块。例如,可通过使用包括在重建邻近块中的参考样点的编码参数或值来执行帧内编码和/或解码。
预测块可表示通过执行帧内预测而生成的块。预测块可与CU、PU和TU中的至少一个对应。预测块的单元可具有CU、PU和TU中的一个的尺寸。预测块可以是尺寸为2×2、4×4、16×16、32×32或64×64等的正方形块,或者可以是尺寸为2×8、4×8、2×16、4×16和8×16等的矩形块。
可根据针对当前块的帧内预测模式来执行帧内预测。当前块可具有的帧内预测模式的数量可以是固定值,并且可以是根据预测块的属性不同地确定的值。例如,预测块的属性可包括预测块的尺寸和预测块的形状等。
不管块尺寸为多少,可将帧内预测模式的数量固定为N。或者,帧内预测模式的数量可以是3、5、9、17、34、35、36、65或67等。可选地,帧内预测模式的数量可根据块尺寸或颜色分量类型或者块尺寸和颜色分量类型两者而变化。例如,帧内预测模式的数量可根据颜色分量是亮度信号还是色度信号而变化。例如,随着块尺寸变大,帧内预测模式的数量可增加。可选地,亮度分量块的帧内预测模式的数量可大于色度分量块的帧内预测模式的数量。
帧内预测模式可以是非角度模式或角度模式。非角度模式可以是DC模式或平面模式,并且角度模式可以是具有特定方向或角度的预测模式。帧内预测模式可由模式编号、模式值、模式数字、模式角度和模式方向中的至少一个来表示。帧内预测模式的数量可以是大于1的M,包括非角度模式和角度模式。为了对当前块进行帧内预测,可执行确定是否可将包括在重建邻近块中的样点用作当前块的参考样点的步骤。当存在不能用作当前块的参考样点的样点时,通过对包括在重建邻近块中的样点中的至少一个样点值进行复制或执行插值或者进行复制和插值两者而获得的值可被用于替换样点的不可用样点值,因此替换后的样点值被用作当前块的参考样点。
图7是示出能够用于帧内预测的参考样点的示图。
如图7所示,参考样点线0至参考样点线3中的至少一个可用于当前块的帧内预测。在图7中,片段A和片段F的样点可分别利用最接近片段B和片段E的样点被填充,而不是从重建邻近块进行检索。可用信号发送指示将被用于当前块的帧内预测的参考样点线的索引信息。例如,在图7中,参考样点线指示符0、1和2可作为指示参考样点线0、1和2的索引信息被用信号发送。在当前块的上方边界是CTU的边界时,仅参考样点线0可以是可用的。因此,在这种情况下,可不用信号发送索引信息。当除了参考样点线0之外的参考样点线被使用时,可不执行稍后将描述的针对预测块的滤波。
当进行帧内预测时,可基于帧内预测模式和当前块尺寸将滤波器应用于参考样点和预测样点中的至少一个。
在平面模式的情况下,当生成当前块的预测块时,根据预测目标样点在预测块内的位置,可通过使用当前块的上方参考样点与左侧参考样点以及当前块的右上方参考样点与左下方参考样点的加权和来生成预测目标样点的样点值。此外,在DC模式的情况下,当生成当前块的预测块时,可使用当前块的上方参考样点与左侧参考样点的平均值。此外,在角度模式的情况下,可通过使用当前块的上方参考样点、左侧参考样点、右上方参考样点和/或左下方参考样点来生成预测块。为了生成预测样点值,可执行实数单元的插值。
在颜色分量之间的帧内预测的情况下,可基于第一颜色分量的对应重建块来生成第二颜色分量的当前块的预测块。例如,第一颜色分量可以是亮度分量,并且第二颜色分量可以是色度分量。对于颜色分量之间的帧内预测,可基于模板推导第一颜色分量与第二颜色分量之间的线性模型的参数。模板可包括当前块的上方和/或左侧邻近样点以及与其对应的第一颜色分量的重建块的上方和/或左侧邻近样点。例如,可使用模板中的样点中具有最大值的第一颜色分量的样点值及与其对应的第二颜色分量的样点值,以及模板中的样点中具有最小值的第一颜色分量的样点值及与其对应的第二颜色分量的样点值来推导线性模型的参数。当推导线性模型的参数时,可将对应重建块应用于线性模型以生成当前块的预测块。根据视频格式,可对第一颜色分量的重建块和对应重建块的邻近样点执行子样点。例如,当第二颜色分量的一个样点与第一颜色分量的四个样点对应时,可对第一颜色分量的四个样点进行子样点以计算一个对应样点。在这种情况下,可基于对应的被子样点的样点执行线性模型的参数推导和颜色分量之间的帧内预测。是否执行颜色分量之间的帧内预测以和/或者模板的范围可作为帧内预测模式被用信号发送。
当前块可在水平方向或垂直方向上被分区为两个子块或四个子块。可顺序地重建被分区的子块。也就是说,可对子块执行帧内预测以生成子预测块。此外,可对子块执行反量化和/或逆变换以生成子残差块。可通过将子预测块与子残差块相加来生成重建子块。重建子块可用作后续子块的帧内预测的参考样点。子块可以是包括预定数量(例如,16)或更多个样点的块。因此,例如,在当前块是8×4的块或4×8的块时,当前块可被分区为两个子块。此外,在当前块是4×4的块时,当前块可不被分区为子块。在当前块具有其它尺寸时,当前块可被分区为四个子块。可用信号发送关于是否基于子块和/或分区方向(水平或垂直)执行帧内预测的信息。可限于仅在使用参考样点线0时执行基于子块的帧内预测。当执行基于子块的帧内预测时,可不执行稍后将描述的针对预测块的滤波。
可通过对被帧内预测的预测块执行滤波来生成最终预测块。可通过将预定权重应用于滤波目标样点、左侧参考样点、上方参考样点和/或左上方参考样点来执行滤波。可基于块尺寸、帧内预测模式和预测块中的滤波目标样点的位置中的至少一个来确定用于滤波的权重和/或参考样点(范围、位置等)。可仅在预定帧内预测模式(例如,DC、平面、垂直、水平、对角线和/或相邻对角线模式)的情况下执行滤波。相邻对角线模式可以是对对角线模式加上k或从对角线模式减去k的模式。例如,k可以是8或更小的正整数。
可通过预测与当前块相邻存在的块的帧内预测模式来对当前块的帧内预测模式进行熵编码/熵解码。在当前块与邻近块的帧内预测模式相同时,可通过使用预定标志信息来用信号发送当前块与邻近块的帧内预测模式相同的信息。此外,可用信号发送多个邻近块的帧内预测模式之中的与当前块的帧内预测模式相同的帧内预测模式的指示符信息。在当前块与邻近块的帧内预测模式不同时,可通过基于邻近块的帧内预测模式执行熵编码/熵解码来对当前块的帧内预测模式信息进行熵编码/熵解码。
图5是示出画面间预测处理的实施例的示图。
在图5中,矩形可表示画面。在图5中,箭头表示预测方向。根据画面的编码类型,可将画面分类为帧内画面(I画面)、预测画面(P画面)和双预测画面(B画面)。
可在不需要画面间预测的情况下通过帧内预测对I画面进行编码。可通过使用在相对于当前块的一个方向(即,前向或后向)上存在的参考画面,通过画面间预测来对P画面进行编码。可通过使用在相对于当前块的两个方向(即,前向和后向)上存在的参考画面,通过画面间预测来对B画面进行编码。当使用画面间预测时,编码器可执行画面间预测或运动补偿,并且解码器可执行对应运动补偿。
在下文中,将详细描述画面间预测的实施例。
可使用参考画面和运动信息来执行画面间预测或运动补偿。
可通过编码设备100和解码设备200中的每一个在画面间预测期间推导当前块的运动信息。可通过使用重建邻近块的运动信息、同位置块(也称为col块或同位块)的运动信息和/或与同位块相邻的块的运动信息来推导当前块的运动信息。同位块可表示先前重建的同位置画面(也称为col画面或同位画面)内的在空间上与当前块位于相同位置的块。同位画面可以是包括在参考画面列表中的一个或更多个参考画面中的一个画面。
运动信息的推导方法可根据当前块的预测模式而不同。例如,应用于帧间预测的预测模式包括AMVP模式、合并模式、跳过模式、具有运动矢量差的合并模式、子块合并模式、几何分区模式、帧间-帧内组合预测模式、仿射模式等。这里,合并模式可被称为运动合并模式。
例如,当AMVP被用作预测模式时,可将重建邻近块的运动矢量、同位块的运动矢量、与同位块相邻的块的运动矢量和(0,0)运动矢量中的至少一个确定为针对当前块的运动矢量候选,并且通过使用运动矢量候选生成运动矢量候选列表。可通过使用生成的运动矢量候选列表来推导当前块的运动矢量候选。可基于推导的运动矢量候选来确定当前块的运动信息。同位置块的运动矢量或与同位置块相邻的块的运动矢量可被称为时间运动矢量候选,并且重建邻近块的运动矢量可被称为空间运动矢量候选。
编码设备100可计算当前块的运动矢量与运动矢量候选之间的运动矢量差(MVD),并且可对运动矢量差(MVD)执行熵编码。此外,编码设备100可对运动矢量候选索引执行熵编码并生成比特流。运动矢量候选索引可指示包括在运动矢量候选列表中的运动矢量候选之中的最佳运动矢量候选。解码设备可对包括在比特流中的运动矢量候选索引执行熵解码,并且可通过使用经过熵解码的运动矢量候选索引从包括在运动矢量候选列表中的运动矢量候选中选择解码目标块的运动矢量候选。此外,解码设备200可将经过熵解码的MVD与通过熵解码而提取的运动矢量候选相加,从而推导解码目标块的运动矢量。
另外,编码设备100可对计算出的MVD的分辨率信息执行熵编码。解码设备200可使用MVD分辨率信息来调整被熵解码的MVD的分辨率。
另外,编码设备100基于仿射模型计算当前块中的运动矢量和运动矢量候选之间的运动矢量差(MVD),并对MVD执行熵编码。解码设备200通过根据被熵解码的MVD和仿射控制运动矢量候选的总和推导解码目标块的仿射控制运动矢量来基于每个子块推导运动矢量。
比特流可包括指示参考画面的参考画面索引。参考画面索引可通过编码设备100被熵编码,并且随后作为比特流被用信号发送到解码设备200。解码设备200可基于推推导的运动矢量和参考画面索引信息来生成解码目标块的预测块。
推导当前块的运动信息的方法的另一示例可以是合并模式。合并模式可表示合并多个块的运动的方法。合并模式可表示从邻近块的运动信息推导当前块的运动信息的模式。当应用合并模式时,可使用重建邻近块的运动信息和/或同位置块的运动信息来生成合并候选列表。运动信息可包括运动矢量、参考画面索引和画面间预测指示符中的至少一个。所述预测指示符可指示单向预测(L0预测或L1预测)或双向预测(L0预测和L1预测)。
合并候选列表可以是存储的运动信息的列表。包括在合并候选列表中的运动信息可以是以下至少一个:与当前块相邻的邻近块的运动信息(空间合并候选)、参考画面中的当前块的同位置块的运动信息(时间合并候选)、通过合并候选列表中存在的运动信息的组合而生成的新运动信息、在当前块之前被编码/解码的块的运动信息(基于历史的合并候选)、以及零合并候选。
编码设备100可通过对合并标志和合并索引中的至少一个执行熵编码来生成比特流,并且可将比特流用信号发送到解码设备200。合并标志可以是指示是否针对每个块执行合并模式的信息,并且合并索引可以是指示当前块的邻近块中的哪个邻近块是合并目标块的信息。例如,当前块的邻近块可包括位于当前块的左侧的左侧邻近块、被布置在当前块上方的上方邻近块和在时间上与当前块相邻的时间邻近块。
另外,编码设备100对合并候选的运动信息中的用于校正运动矢量的校正信息执行熵编码,并将其用信号发送到解码设备200。解码设备200可基于校正信息校正由合并索引选择的合并候选的运动矢量。这里,校正信息可包括关于是否执行校正的信息、校正方向信息和校正尺寸信息中的至少一个。如上所述,基于用信号发送的校正信息对合并候选的运动矢量进行校正的预测模式可被称为具有运动矢量差的合并模式。
跳过模式可以是将邻近块的运动信息照原样应用于当前块的模式。当应用跳过模式时,编码设备100可对哪个块的运动信息将被用作当前块的运动信息的事实的信息执行熵编码,以生成比特流,并且可将比特流用信号发送到解码设备200。编码设备100可不将关于运动矢量差信息、编码块标志和变换系数等级中的至少任意一个的语法元素用信号发送到解码设备200。
子块合并模式可表示以编码块(CU)的子块为单位推导运动信息的模式。当应用子块合并模式时,可使用参考图像中的与当前子块同位置的子块的运动信息(基于子块的时间合并候选)和/或仿射控制点运动矢量合并候选来生成子块合并候选列表。
几何分区模式可表示通过将当前块分区为预定方向来推导运动信息,使用推导的运动信息中的每一个来推导每个预测样点,并且通过对推导的预测样点中的每一个进行加权来推导当前块的预测样点的模式。
帧间-帧内组合预测模式可表示通过对由帧间预测生成的预测样点和由帧内预测生成的预测样点进行加权来推导当前块的预测样点的模式。
解码设备200可自行校正推导的运动信息。解码设备200可基于由推导的运动信息指示的参考块搜索预定区域,并推导具有最小SAD的运动信息作为经过校正的运动信息。
解码设备200可使用光流对经由帧间预测推导的预测样点进行补偿。
图6是示出变换和量化处理的示图。
如图6中所示,对残差信号执行变换处理和/或量化处理,以生成量化的等级信号。残差信号是原始块与预测块(即,帧内预测块或帧间预测块)之间的差。预测块是通过帧内预测或帧间预测生成的块。所述变换可以是初级变换、次级变换或者初级变换和次级变换两者。对残差信号的初级变换生成变换系数,并且对变换系数的次级变换生成次级变换系数。
从预先定义的各种变换方案中选择的至少一种方案被用于执行初级变换。例如,所述预定义的变换方案的示例包括离散余弦变换(DCT)、离散正弦变换(DST)和Karhunen-Loève变换(KLT)。通过初级变换生成的变换系数可经历次级变换。可根据当前块和/或当前块的邻近块的编码参数来确定用于初级变换和/或次级变换的变换方案。可选地,可用信号发送指示变换方案的变换信息。基于DCT的变换可包括例如DCT-2、DCT-8等。基于DST的变换可包括例如DST-7。
可通过对残差信号或对执行初级变换和/或次级变换的结果执行量化来生成量化的等级信号(量化系数)。根据块的帧内预测模式或块尺寸/形状,可根据对角线右上扫描、垂直扫描和水平扫描中的至少一个来扫描量化的等级信号。例如,当按照对角线右上扫描来扫描系数时,块形式的系数改变为一维矢量形式。除了对角线右上扫描之外,根据帧内预测模式和/或变换块的尺寸,可使用水平地扫描二维块形式的系数的水平扫描或垂直地扫描二维块形式的系数的垂直扫描。扫描的量化的等级系数可被熵编码以插入比特流中。
解码器对比特流进行熵解码以获得量化的等级系数。量化的等级系数可通过逆扫描以二维块形式被布置。对于逆扫描,可使用对角线右上扫描、垂直扫描和水平扫描中的至少一个。
量化的等级系数随后可被反量化,然后根据需要被次级逆变换,最后根据需要被初级逆变换,以生成重建残差信号。
可在环内滤波之前针对通过帧内预测或帧间预测重建的亮度分量执行动态范围中的逆映射。动态范围可被分区为16个相等的段,并且可用信号发送针对每个段的映射函数。可在条带级或并行块组级用信号发送映射函数。可基于映射函数推导用于执行逆映射的逆映射函数。在逆映射区域中执行环内滤波、参考画面存储和运动补偿,并且通过帧间预测生成的预测块经由使用映射函数的映射被转换到映射区域,然后被用于生成重建块。然而,由于在映射区域中执行帧内预测,因此经由帧内预测生成的预测块可被用于生成重建块而无需映射/逆映射。
在当前块是色度分量的残差块时,可通过对映射区域的色度分量执行缩放来将残差块转换到逆映射区域。可在条带级或并行块组级用信号发送缩放的可用性。只有当针对亮度分量的映射可用并且亮度分量的分区和色度分量的分区遵循相同的树结构时,才可应用缩放。可基于与色差块对应的亮度预测块的样点值的平均值来执行缩放。在这种情况下,在当前块使用帧间预测时,亮度预测块可表示映射的亮度预测块。可通过使用亮度预测块的样点值的平均值所属的片段的索引参考查找表来推导缩放所需的值。最后,通过使用推导的值对残差块进行缩放,可将残差块转换到逆映射区域。然后,可在逆映射区域中执行色度分量块恢复、帧内预测、帧间预测、环内滤波和参考画面存储。
可通过序列参数集用信号发送指示亮度分量和色度分量的映射/逆映射是否可用的信息。
可基于指示当前画面中的当前块与参考块之间的位移的块矢量来生成当前块的预测块。以这种方式,用于参考当前画面生成预测块的预测模式被称为帧内块复制(IBC)模式。IBC模式可被应用于M×N(M<=64,N<=64)编码单元。IBC模式可包括跳过模式、合并模式、AMVP模式等。在跳过模式或合并模式的情况下,构建合并候选列表,并且用信号发送合并索引,使得可指定一个合并候选。指定的合并候选的块矢量可用作当前块的块矢量。合并候选列表可包括空间候选、基于历史的候选、基于两个候选的平均值的候选和零合并候选中的至少一个。在AMVP模式的情况下,可用信号发送差块矢量。此外,可从当前块的左侧邻近块和上方邻近块推导预测块矢量。可用信号发送将使用的邻近块的索引。IBC模式中的预测块被包括在当前CTU或左侧CTU中并且被限于已经重建的区域中的块。例如,可限制块矢量的值,使得当前块的预测块按照编码/解码顺序位于当前块所属的64×64的块之前的三个64×64的块的区域中。通过以这种方式限制块矢量的值,可减少根据IBC模式实施方案的存储器消耗和装置复杂度。
在下文中,将参照图8至图13描述本发明的实施例。
图8是用于说明根据本发明实施例的帧内预测处理的示图。
参照图8,当前块的帧内预测处理可包括推导帧内预测模式(S810)、配置参考样点(S820)、执行帧间预测(S830)以及预测残差信号(S840)。然而,该处理不限于此,并且可进一步包括当前块的帧内预测所需的额外步骤。
在根据实施例推导帧内预测模式中(S810),可推导当前块的帧内预测模式。例如,可通过使用邻近块的帧内预测模式、来自比特流的当前块的帧内预测模式的熵编码/解码、邻近块的编码参数、颜色分量的帧内预测模式和残差信号预测信息中的至少一个来推导当前块的帧内预测模式。另外,基于当前块的帧内预测模式以及当前块的尺寸和形状中的至少一个,可将第一角度模式改变为第二角度模式。
在根据实施例配置参考样点中(S820),可配置用于当前块的帧内预测的参考样点。例如,可通过执行参考样点选择、参考样点填充和参考样点滤波中的至少一个来配置参考样点。
在根据实施例执行帧内预测中(S830),可执行当前块的帧内预测。可通过非角度预测、角度预测、基于位置信息的预测和颜色分量间预测中的至少一个来执行帧内预测。
另外,在执行帧内预测时,可对预测样点执行滤波。例如,基于当前块的帧内预测模式、当前块的水平尺寸和垂直尺寸、当前块的形状以及预测样点的位置中的至少一个,可对当前块内的至少一个预测样点执行滤波。这里,滤波器类型(例如,滤波器系数、滤波器抽头和滤波器形状中的至少一个)可以是不同的。
在根据实施例预测残差信号中(S840),可预测当前块的残差信号。例如,对于当前块的第一残差信号,可以以当前块内的样点线、样点和预定组中的至少一个为单元执行预测,因此可生成第二残差信号。
在下文中,将根据本发明的实施例详细描述推导帧内预测模式(S810)。在本说明书中,编码/解码可表示熵编码/解码。
根据实施例,可使用至少一个重建的邻近块来推导当前块的帧内预测模式。这里,重建的邻近块的位置可以是预定的固定位置或通过编码/解码推导的位置。
例如,当当前块的尺寸为W×H且当前块的左上角样点的坐标为(0,0)时,邻近块可为与坐标(-1,H-1)、(W-1,-1)、(W,-1)、(-1,H)及(-1,-1)相邻的块和所述块的邻近块当中的至少一个。这里,W和H可分别指示当前块的水平长度(=宽度)和垂直长度(=高度),或者当前块内的样点数量。
根据实施例,为了推导当前块的帧内预测模式,可考虑邻近块是否可用。当邻近块位于至少一个预定单元(例如画面、条带、并行块和编码树单元(CTU))的边界外部、被帧间预测或通过使用PCM模式进行编码时,邻近块可被确定为不可用。
这里,不可用邻近块的帧内预测模式可由预定帧内预测模式替换。这里,预定帧内预测模式可以是DC模式、平面模式、垂直模式、水平模式和/或对角线模式。
例如,当邻近块为帧间预测块且示出是否组合帧间预测和帧内预测的指示符(例如,ciip_flag)具有特定值(例如,‘1’)时,可将邻近块推导为平面模式。
可将当前块的帧内预测模式推导为预定位置中的邻近块的帧内预测模式或为两个或更多个邻近块的帧内预测模式的统计值。在本说明书中,统计值可表示平均值、最大值、最小值、众值、中值、加权平均值和插值中的至少一个。
根据实施例,为了推导当前块的帧内预测模式,可考虑邻近块的帧内预测模式是否是角度模式。例如,当邻近块的帧内预测模式为非角度模式时,可推导非角度模式为当前块的帧内预测模式。作为另一示例,当邻近块的帧内预测模式为非角度模式时,可通过使用除非角度模式之外的其它邻近块的帧内预测模式来推导当前块的帧内预测模式。
根据实施例,为了推导当前块的帧内预测模式,可确定当前块的帧内预测模式是否对应于预定的帧内预测模式。
例如,当确定当前块的帧内预测模式对应于平面模式时,可将当前块的帧内预测模式推导为平面模式。同时,当当前块的帧内预测模式不对应于平面模式时,可配置最可能模式(MPM)列表,并且可基于MPM候选指示符(例如,mpm_idx)推导当前块的帧内预测模式。
根据实施例,为了推导当前块的帧内预测模式,可通过使用邻近块的帧内预测模式来配置一个或多个MPM列表。包括在MPM列表中的候选模式的数量N可具有固定值或根据当前块的尺寸和/或形状被确定。另外,MPM列表可被配置为使得不存在重叠模式。
在此,当可用候选模式的数量小于N时,可将可用候选模式当中的预定候选模式添加到MPM列表。例如,可将通过对角度模式调整预定偏移而获得的模式添加到MPM列表。这里,预定偏移可以是正整数(例如,1、2、3、4等)。可选地,可将水平模式、垂直模式、45度模式、135度模式、225度模式和非角度模式中的至少一个添加到MPM列表。
可选地,当配置MPM列表时,可总是包括非角度模式(例如,DC模式、平面模式等)。因为通过使用上方参考样点和左侧参考样点两者来执行预测,非角度模式可具有很高的发生概率。因此,由于DC模式和平面模式总是被添加到MPM列表,因此可减少用信号发送帧内预测模式的比特开销。
根据实施例,可使用不同颜色分量的帧内预测模式来推导当前块的帧内预测模式。
例如,当当前块为色度块时,可使用与色度块相对应的亮度块的帧内预测模式。在此,可存在一或多个对应亮度块,并且可基于色度块的尺寸和形状和/或编码参数中的至少一个来确定对应亮度块的数量。可选地,可基于亮度块的尺寸和形状和/或编码参数中的至少一个来确定对应亮度块。
当对应亮度块的帧内预测模式为基于矩阵的帧内预测(MIP)模式或帧内块复制(IBC)预测模式时,可推导预定帧内预测模式为色度块的帧内预测模式。例如,当亮度块的帧内预测模式为MIP模式时,可推导平面模式为色度块的帧内预测模式。可选地,当亮度块的帧内预测模式为IBC预测模式时,可推导DC模式为色度块的帧内预测模式。
在此,基于矩阵的帧内预测(MIP)可以是通过乘以预定义的矩阵或针对先前解码的邻近块的样点先前发送的矩阵来生成当前块的预测样点的预测方法。
与色度块相对应的亮度块可包括多个分区。多个分区中的全部或一些可以具有不同的帧内预测模式。
可基于对应亮度块内的多个分区中的全部或一些推导色度块的帧内预测模式。在此,可通过色度块与亮度块之间的尺寸、形状、深度及其它信息的比较而选择性地使用一些分区(多个分区中的全部或一些)。
另外,可选择性地使用亮度块内与色度块内的预定位置相对应的位置处的分区。在此情况下,预定位置可表示色度块的中心样点或角样点(例如,左上方样点)的位置。
根据本发明实施例的推导颜色分量之间的帧内预测模式的方法不限于使用对应亮度块的帧内预测模式。例如,可通过使用对应亮度块的MPM列表和MPM候选指示符(例如,mpm_idx)中的至少一个来推导色度块的帧内预测模式。另外,可通过共享对应亮度块的MPM列表及MPM候选指示符中的至少一个来推导色度块的帧内预测模式。
图9是用于说明亮度块和色度块之间的关系的示图。
参照图9,颜色分量之间的比率可为4:2:0,并且与色度块相对应的亮度块可为A、B、C及D中的至少一个。
可通过使用与色度块内的左上方位置(0,0)相对应的亮度块A的帧内预测模式或与色度块的中心样点(nS/2,nS/2)的位置相对应的亮度块D的帧内预测模式来推导色度块的帧内预测模式。这里,色度块内的预定位置不限于(0,0)及(nS/2,nS/2),并且可以是色度块内的右上方、左下方和/或右下方样点的位置。
可基于色度块的形状来确定色度块内的预定位置。例如,当色度块的形状为正方形时,色度块内的预定位置可为中心样点的位置。另外,当色度块的形状为矩形时,色度块内的预定位置可为左上方样点的位置。可选地,在以上示例中,正方形色度块内的预定位置和矩形色度块内的预定位置可以是彼此相反的。
另外,可通过使用与色度块的尺寸相对应的亮度块内的一或多个帧内预测模式的统计值推导色度块的帧内预测模式。在此,统计值可以是平均值、最大值、最小值、众值、中值、加权平均值和插值中的至少任何一个。
例如,参照图9,可推导与亮度块A和D的帧内预测模式的平均值相对应的模式或与对应于色度块的尺寸的亮度块A、B、C及D的帧内预测模式的平均值相对应的模式为色度块的帧内预测模式。
当存在可用亮度块的多个帧内预测模式时,可选择帧内预测模式中的全部或一些。这里,可基于色度块内的预定位置或基于色度块和/或亮度块的尺寸、形状和/或深度来选择亮度块的帧内预测模式中的全部或一些。通过使用由此选择的亮度块的帧内预测模式,可推导色度块的帧内预测模式。
例如,可将与色度块内的左上方样点的位置(0,0)相对应的亮度块A的尺寸与对应于色度块内的中心样点的位置(nS/2,nS/2)的亮度块D的尺寸进行比较。因此,可通过使用相对较大的亮度块D的帧内预测模式推导色度块的帧内预测模式。
另外,当色度块的尺寸在预定范围内时,可通过使用与色度块内的左上方样点的位置(0,0)相对应的亮度块的帧内预测模式来推导色度块的帧内预测模式。
这里,可基于经由比特流用信号发送的信息、关于色度块和/或亮度块的尺寸的信息、关于色度块和/或亮度块的深度的信息和在编码器/解码器中预定义的信息当中的至少一条信息推导预定范围。
另外,当色度块的形状为矩形时,可通过使用与色度块内的中心样点的位置(nS/2,nS/2)相对应的亮度块的帧内预测模式来推导色度块的帧内预测模式。
在关于图9的以上描述中,通过使用亮度块的帧内预测模式推导色度块的帧内预测模式可包括亮度块的帧内预测模式照原样被用作色度块的帧内预测模式的情况。
另外,除了亮度块的帧内预测模式照原样被用作色度块的帧内预测模式的情况之外,还可包括通过使用被用以推导亮度块的帧内预测模式的信息(例如,mpm_idx、MPL列表等)推导色度块的帧内预测模式的情况。
另外,与色度块内的预定位置相对应的亮度块的帧内预测模式可被用以推导色度块的MPM列表。这里,可编码和用信号发送色度块的信息(例如,mpm_idx等)。可与亮度块的MPM列表类似的方式配置色度块的MPM列表。可选地,色度块的MPM候选可包括邻近色度块的帧内预测模式或对应亮度块的帧内预测模式或两者。
当配置色度块的MPM列表时,如果指示当前块的帧内预测模式是否被包括在MPM列表中的指示符(例如,MPM标志)为“0”,那么可配置包括一个或多个帧内预测模式的第二MPM列表。另外,第二MPM候选指示符(例如,2nd_mpm_idx)可被用于推导当前块的帧内预测模式。在此,可对指示当前块的帧内预测模式是否被包括在第二MPM列表中的第二MPM指示符(例如,第二MPM标志)进行编码/解码。类似于第一MPM列表,可通过使用邻近块的帧内预测模式来配置第二MPM列表。在此,包括在第一MPM列表中的帧内预测模式可不被包括在第二MPM列表中。用于推导当前块的帧内预测模式的MPM列表的数量不限于1或2,而是可使用N个MPM列表(这里,N是正整数)。
作为另一示例,可配置两个MPM列表,并且可用信号发送指示当前块的帧内预测模式是否被包括在两个MPM列表中的信息(例如,MPM_flag)。当当前块的帧内预测模式被包括在两个MPM列表中的至少一个中时,可用信号发送指示当前块的帧内预测模式是否被包括在第一MPM列表中的第一MPM指示符(例如,first_mpm_flag)。
例如,当first_mpm_flag具有第一值(例如,1)时,其可表示当前块的帧内预测模式被包括在第一MPM列表中。当first_mpm_flag具有第一值时,基于关于第一MPM列表的索引信息,可将当前块的帧内预测模式确定为包括在第一MPM列表中的MPM候选中的一个。在此,当第一MPM列表仅包括一个MPM候选时,可不用信号发送单独的索引信息。在此情况下,当first_mpm_flag具有第一值时,可将当前块的帧内预测模式确定为包括在第一MPM列表中的一个MPM候选。
例如,当first_mpm_flag具有第二值(例如,0)时,其可表示当前块的帧内预测模式没有被包括在第一MPM列表中。当first_mpm_flag具有第二值时,可确定当前块的帧内预测模式被包括在第二MPM列表中。因此,在此情况下,可用信号发送指示包括在第二MPM列表中的模式中的一个的索引信息。可将当前块的帧内预测模式确定为包括在第二MPM列表中的MPM候选当中的由索引信息指定的一个MPM候选。
当当前块的帧内预测模式没有被包括在多个MPM列表中的一个中时,可对当前块的亮度分量的帧内预测模式进行编码/解码。另外,可对色度分量的帧内预测模式进行编码/解码或者基于对应亮度分量的帧内预测模式来推导色度分量的帧内预测模式。
当当前块被分区成多个子块时,可基于上述方法中的至少一个来推导每个子块的帧内预测模式。可选地,如上所述,针对当前块推导的帧内预测模式可一致地被用于子块中的每个。
子块的尺寸和/或形状可以是预定尺寸(例如,4×4)和/或形状。可选地,可基于当前块的尺寸和/或形状来确定子块的尺寸和/或形状。
另外,可基于当前块的邻近块是否被分区或者基于当前块的邻近块的帧内预测模式来确定子块的尺寸。例如,可通过基于邻近块具有不同帧内预测模式的边界分区当前块来确定子块的尺寸。可选地,当基于邻近块是帧内预测编码块还是帧间预测编码块对当前块进行分区的时候,可确定子块的尺寸。
根据实施例,可对示出通过使用邻近块的帧内预测模式推导当前块的帧内预测模式的指示符(例如,NDIP_flag)进行编码/解码。这里,可在当前块和子块中的至少一个的每个单元中对指示符进行编码/解码。可选地,可仅在当前块或子块的尺寸为预定尺寸或在预定范围内时对指示符进行编码/解码。
可基于当前块的水平长度或垂直长度来确定当前块的尺寸是否为预定尺寸。例如,当水平长度或垂直长度是能够被分区的长度时,可将当前块的尺寸确定为预定尺寸。
当当前块被分区成多个子块时,可以以Z字形顺序或并行地推导多个子块的帧内预测模式。可通过推导当前块的帧内预测模式的至少一种方法来推导子块的帧内预测模式。在此,当前块的邻近块可被用作每个子块的邻近块。另外,当前块内的子块可被用作每个子块的邻近块。
可通过使用当前块的帧内预测模式和与每个子块的位置(0,0)处的样点的左侧和上方相邻的块的帧内预测模式的平均值来推导当前块内的子块的帧内预测模式。例如,当当前块的帧内预测模式大于与每个子块的位置(0,0)处的样点的左侧和上方相邻的块的帧内预测模式的平均值时,推导的帧内预测模式可减小平均值的一半。否则,也就是说,当前块的帧内预测模式等于或小于与每个子块的位置(0,0)处的样点的左侧和上方相邻的块的帧内预测模式的平均值,推导的帧内预测模式可增加。
可通过视频参数集(VPS)、序列参数集(SPS)、画面参数集(PPS)、自适应参数集(APS)、条带头和并行块头中的至少一个用信号发送关于帧内预测的信息。这里,对于预定块尺寸或更小的块尺寸,可不用信号发送关于帧内预测的至少一条信息。当不用信号发送关于帧内预测的至少一条信息时,可使用关于在编码/解码当前块之前被编码/解码的块(例如上方块)的帧内预测的信息。
图10是用于说明根据本发明的实施例的被用于推导当前块的帧内预测模式的邻近块的帧内预测模式的示图。
当推导当前块的帧内预测模式时,可通过使用邻近块的帧内预测模式来推导MPM候选。
例如,参照图10,可通过使用与当前块的左侧相邻的邻近块的帧内预测模式A以及与当前块的上方相邻的邻近块的帧内预测模式B来推导MPM候选。这里,可通过使用A和B的统计值(例如,平均值、最大值、最小值、众值、中值、加权平均值和插值中的至少任何一个)来推导MPM候选。
另外,可通过将预定偏移(例如,1、2、3、…)与A、B或A和B的统计值相加或从A、B或A和B的统计值减去预定偏移(例如,1、2、3、…)来推导MPM候选。
另外,可通过将模运算(%)和/或偏移应用于A、B或A和B的统计值来推导MPM候选。
当推导当前块的帧内预测模式时,可基于参考样点线指示符(例如,intra_luma_ref_idx)、块分区指示符(例如,intra_subblock_flag、intra_subpartitions_mode_flag等)、块分区方向指示符(例如,intra_subblock_type_flag、intra_subpartitions_split_flag等)、基于矩阵的帧内预测(MIP)指示符(例如,intra_mip_flag)以及示出是否组合帧间预测和帧内预测的指示符(例如,ciip_flag)中的至少一个来推导MPM或帧内预测模式。
参考样点线指示符指示可用于帧内预测的多个参考样点线中的一个,并且可具有0、1和2之中的值。
块分区指示符可指示是否通过分区成子块来预测当前块。例如,当块分区指示符具有特定值(例如,“1”)时,当前块可被设置为通过分区成子块来预测。
当通过分区成子块来预测当前块时,块分区方向指示符可指示分区方向。例如,当块分区方向指示符具有值0时,当前块可被设置为水平分区。另一方面,当块分区方向指示符的值为1时,当前块可被设置为垂直分区。可选地,作为变型示例,当块分区方向指示符具有值0时,当前块可不被分区成子块。当块分区方向指示符的值为1时,当前块可被设置为通过进行水平分区来预测。当块分区方向指示符具有值2时,当前块可被设置为通过进行垂直分区来预测。
MIP指示符可指示是否对当前块执行基于矩阵的帧内预测。例如,当MIP指示符具有特定值(例如,“1”)时,可设置对当前块执行MIP。换句话说,当前块的帧内预测模式可被设置为MIP模式。
在此,根据是否执行MIP,可不同地推导帧内预测模式。
例如,根据是否执行MIP,可通过改变MPM的数量来推导帧内预测模式。例如,当执行基于矩阵的帧内预测时,可配置三个MPM。当不执行基于矩阵的帧内预测时,可配置五个MPM。换句话说,当执行基于矩阵的帧内预测时,可使用比其他方式(即,当不执行基于矩阵的帧内预测时)更少数量的MPM。
作为另一示例,根据是否执行基于矩阵的帧内预测,可不同地设置帧内预测模式的数量。例如,当执行基于矩阵的帧内预测时,可根据当前块的尺寸不同地设置帧内预测模式的数量。例如,当当前块的尺寸较大时,可使用较大数量的帧内预测模式。可选地,当当前块的尺寸较小时,可使用较大数量的帧内预测模式。可选地,当不执行基于矩阵的帧内预测时,帧内预测模式的数量可以是固定的,而无论当前块的尺寸。
作为另一示例,根据是否执行基于矩阵的帧内预测,可使用不同方法来推导邻近块的帧内预测模式。例如,当执行基于矩阵的帧内预测时,邻近块的帧内预测模式可被改变为预定帧内预测模式,然后基于当前块的尺寸和邻近块的尺寸被推导。可选地,当不执行基于矩阵的帧内预测时,邻近块的帧内预测模式可不被改变。
例如,当对邻近块执行基于矩阵的帧内预测时,邻近块的帧内预测模式可被推导为预定帧内预测模式(例如,平面模式)。具体地,当邻近块的MIP指示符(例如,intra_mip_flag)具有特定值(例如,1)时,也就是说,当对邻近块执行基于矩阵的帧内预测时,邻近块的帧内预测模式可被推导为预定帧内预测模式(例如,平面模式)。
这里,邻近块可表示与当前块的左下方或当前块的右上方相邻的块。
根据实施例,可基于参考样点线指示符来确定当前块的帧内预测模式是否是预定预测模式。例如,预定预测模式可以是平面模式。
例如,当参考样点线指示符具有特定值(例如,0)并且当前块的帧内预测模式被确定为平面模式时,当前块的帧内预测模式可被推导为平面模式。同时,当当前块的帧内预测模式被确定为不是平面模式时,可配置MPM列表,并且可基于MPM候选指示符推导当前块的帧内预测模式。在以上示例中,可基于指示当前块的帧内预测模式是否为平面模式的单独信息来确定当前块的帧内预测模式是否为平面模式。仅当参考样点线指示符具有特定值(例如,0)时,可用信号发送单独的信息。
另外,当参考样点线指示符不具有特定值(例如,0)时,可跳过确定当前块的帧内预测模式是否是预定预测模式。换句话说,当参考样点线指示符具有不同于0的值时,可配置MPM列表,并且可基于MPM候选指示符推导当前块的帧内预测模式,而无需确定当前块的帧内预测模式是否是预定预测模式。例如,当参考样点线指示符不具有特定值(例如,0)时,可不用信号发送指示当前块的帧内预测模式是否是平面模式的单独信息。
根据实施例,可配置当前块的MPM列表,而无论参考样点线指示符(例如,intra_luma_ref_idx)和子块分区预测信息(例如,intra_subblock_flag、intra_subpartitions_mode_flag、intra_subblock_type_flag、intra_subpartitions_split_flag等)。
例如,参照图10,可基于与当前块的左侧相邻的邻近块的帧内预测模式A以及与当前块的上方相邻的邻近块的帧内预测模式B来配置当前块的MPM列表。
当A和B是相同模式且为角度模式(例如,大于1的模式)时,可配置按A、2+((A+61)%64)、2+((A-1)%64)、DC和2+((A+60)%64)的顺序包括五个MPM候选的MPM列表。
作为另一示例,当A和B是不同模式并且两者都是角度模式时,三个MPM候选可按A、B和DC的顺序优先被包括在MPM列表中。另外,A和B中的较大模式以及A和B中的较小模式可分别被确定为maxAB和minAB。在此,当maxAB与minAB之间的差大于1但小于63时,可按2+((maxAB+61)%64)和2+((maxAB-1)%64)的顺序添加两个MPM候选,因此,可配置总共包括五个MPM候选的MPM列表。可选地,当maxAB与minAB之间的差为1或等于或大于63时,可按2+((maxAB+60)%64)和2+((maxAB)%64)的顺序添加两个MPM候选,因此,可配置总共包括五个MPM候选的MPM列表。
作为另一示例,当A和B为不同模式时,一个为角度模式而另一个为非角度模式,可配置按maxAB、DC、2+((maxAB+61)%64)、2+((maxAB-1)%64和2+((maxAB+60)%64的顺序包括五个MPM候选的MPM列表。
在除上述情况之外的其它情况下,例如,当A和B相同且为非角度模式(例如,等于或小于1的模式)时,或者当A和B不同但两者都是非角度模式时,可配置按DC、50、18、46和54的顺序包括五个MPM候选的MPM列表。
另外,当执行当前块的组合帧间和帧内预测时,不推导MPM,并且可通过使用平面模式来执行当前块的帧内预测。
例如,当组合帧间和帧内预测指示符(例如,ciip_flag)为1(或为真)时,可将当前块的帧内预测模式确定为平面模式。
根据实施例,当推导当前块的帧内预测模式时,可使用残差信号预测信息。残差信号预测信息可包括残差信号预测应用信息和/或残差信号预测方向信息。残差信号预测应用信息可以是指示是否对当前块应用残差信号预测的信息。当对当前块应用残差信号预测时,残差信号预测方向信息可以是指示残差信号的预测方向的信息。残差信号的预测方向可被确定为水平方向和垂直方向之一。当残差信号预测应用信息指示对当前块应用残差信号预测时,可用信号发送残差信号预测方向信息。当对当前块应用残差信号预测时,可基于残差信号预测方向信息推导当前块的帧内预测模式。例如,当残差信号预测方向是水平方向时,当前块的帧内预测模式可被推导为水平模式。可选地,当残差信号预测方向是垂直方向时,当前块的帧内预测模式可被推导为垂直模式。
这里,残差信号预测信息可被描述为块差分脉冲编码调制(block differentialpulse coded modulation,BDPCM)方向指示符(例如,intra_bdpcm_luma_dir_flag)。换句话说,当执行残差信号预测时,BDPCM方向指示符可指示预测方向。例如,当BDPCM方向指示符具有第一值(例如,0)时,残差信号预测方向可被设置为水平方向。另外,当BDPCM方向指示符具有第二值(例如,1)时,残差信号预测方向可被设置为垂直方向。
当对当前块执行残差信号预测时,可将预定的帧内预测模式存储为当前块的帧内预测模式。
例如,平面模式可被存储为当前块的帧内预测模式。
可选地,DC模式可被存储为当前块的帧内预测模式。
可选地,包括在MPM列表中的预定模式可被存储为当前块的帧内预测模式。例如,存在于MPM列表的第一位置中的帧内预测模式可被存储为当前块的帧内预测模式。
可选地,对应于与残差信号的预测方向相同的方向的帧内预测模式可被存储为当前块的帧内预测模式。例如,当水平执行残差信号预测时,与水平模式相对应的“模式18”可被存储为当前块的帧内预测模式。另外,当垂直执行残差信号预测时,与垂直模式相对应的“模式50”可被存储为当前块的帧内预测模式。
例如,当BDPCM方向指示符(例如,intra_bdpcm_luma_dir_flag)具有第一值(例如,0)时,可在水平方向上执行残差信号预测。因此,作为残差信号预测方向的水平方向(例如,“模式18”)可被存储为当前块的帧内预测模式。
另外,当BDPCM方向指示符(例如,intra_bdpcm_luma_dir_flag)具有第二值(例如,1)时,可在垂直方向上执行残差信号预测。因此,作为残差信号预测方向的垂直方向(例如,“模式50”)可被存储为当前块的帧内预测模式。
当通过使用MPM列表推导当前块的帧内预测模式时,可用信号发送帧内预测模式信息。帧内预测模式信息可以是MPM指示符(例如,intra_luma_mpm_flag或MPM标志)、MPM候选指示符(例如,mpm_idx或intra_luma_mpm_idx)、平面模式指示符(例如,intra_luma_planar_flag)和/或残差模式指示符(例如,intra_luma_mpm_remainder)中的至少一个。
MPM指示符(例如,intra_luma_mpm_flag或MPM标志)可指示在MPM列表中是否存在与当前块的帧内预测模式相同的模式。这里,当MPM指示符具有第一值(例如,1)时,可用信号发送指示MPM列表中的候选模式当中的哪个模式是与当前块的帧内预测模式相同的模式的MPM候选指示符(例如,mpm_idx或intra_luma_mpm_idx)。可选地,相反,当MPM指示符具有第二值(例如,0)时,可用信号发送指示除了MPM模式之外的模式当中的当前块的帧内预测模式的残差模式指示符(例如,intra_luma_mpm_remainder)。
平面模式指示符(例如,intra_luma_planar_flag)可指示当前块的帧内预测模式是否能够被推导为平面模式。例如,当intra_luma_planar_flag具有第一值(例如,1)时,当前块的帧内预测模式可被推导为平面模式。可选地,当intra_luma_planar_flag具有第二值(例如,0)时,可用信号发送intra_luma_mpm_idx,并且可从MPM列表推导当前块的帧内预测模式。第一值和第二值可被相反地定义。
另外,基于参考样点线相关信息(例如,intra_luma_ref_idx)、子块分区预测相关信息(例如,intra_subblock_flag、intra_subpartitions_mode_flag、intra_subblock_type_flag、intra_subpartitions_split_flag等)、MIP相关信息(例如,intra_mip_flag)和CIIP相关信息(例如,ciip_flag)中的至少一个,可不用信号发送帧内预测信息中的至少一条。
例如,当intra_luma_ref_idx具有特定值(例如,0)时,可不用信号发送intra_luma_mpm_flag或intra_luma_mpm_remainder。因此,可用信号发送intra_luma_mpm_idx,并且因此可推导当前模式的帧内预测模式。
作为另一示例,当intra_luma_ref_idx不具有特定值(例如,0)时,可不用信号发送intra_luma_planar_flag。因此,可用信号发送intra_luma_mpm_idx,并且因此可推导当前模式的帧内预测模式。
作为另一示例,当对当前块执行基于矩阵的帧内预测时,即,当intra_mip_flag具有特定值(例如,1)时,可不用信号发送intra_luma_planar_flag。因此,可用信号发送intra_luma_mpm_flag或intra_luma_mpm_idx,并且因此可推导当前块的帧内预测模式。
作为另一示例,当对当前块执行子块分区预测时,即,当intra_subpartitions_mode_flag具有特定值(例如,1)时,可不用信号发送intra_luma_mpm_flag或intra_luma_mpm_remainder。因此,可仅用信号发送intra_luma_mpm_idx,并且因此可推导当前模式的帧内预测模式。
作为另一示例,当对当前块执行组合帧间和帧内预测(CIIP)时,即,当ciip_flag具有特定值(例如,1)时,可不用信号发送intra_luma_mpm_flag、intra_luma_mpm_idx或intra_luma_mpm_remainder,并且可将当前块的帧内预测模式推导为平面模式。
在下文中,将根据本发明的实施例详细描述配置参考样点(S820)。
基于在上述推导帧内预测模式(S810)中推导的帧内预测模式,可构建用于帧内预测的参考样点。在下文中,在本说明书中,当前块可表示预测块或具有比预测块更小的尺寸和/或形状的子块。
可通过使用与当前块相邻的一个或多个重建样点或其组合来构建参考样点。另外,可对构建的参考样点执行滤波。
用于配置参考样点的重建样点线的数量和/或位置可根据当前块在编码树块内的位置而不同。这里,多个重建样点线中的每个重建样点可照原样用作参考样点。可选地,可通过对重建样点执行预定滤波且使用滤波的重建样点来生成参考样点。应用滤波器的重建样点可属于相同重建样点线或不同重建样点线。
重建参考样点可被表达为ref[m,n],并且应用或未应用滤波的邻近重建样点可被表达为rec[m,n]。这里,m或n可以是表示样点位置的预定整数。另外,当当前块内的左上方样点的位置是(0,0)时,与当前块的左上方相邻的参考样点的位置可被设置为(-1,-1)。
为了配置参考样点,可确定邻近重建样点的可用性。这里,当邻近重建样点位于画面、条带、并行块及CTU的至少一个区域外部时,所述样点可被确定为不可用。另外,当对当前块执行受约束帧内预测且邻近重建样点位于通过帧间预测而编码/解码的块中时,所述样点可被确定为不可用。
当邻近重建样点被确定为不可用时,可使用另一可用邻近重建样点来替换不可用样点。
例如,从左下方样点位置开始,相邻的可用样点可被使用并替换不可用样点。
另外,可通过使用可用样点的组合来替换不可用样点。例如,可通过使用位于不可用样点的任一侧上的可用样点的平均值来替换不可用样点。
另外,可通过使用关于可用参考样点的信息来替换不可用样点。这里,可通过不使用相邻的可用参考样点的值而是使用任意值来替换不可用样点。任意值可以是可用样点值的平均值或考虑可用样点值的梯度的值。可选地,可使用平均值和梯度两者。这里,可基于相邻可用样点的差值来确定梯度。可选地,除了平均值之外,也可使用最大值、最小值、中值或施加任意权重的加权和。这里,可基于可用样点和不可用样点之间的距离来确定任意权重。
上述方法可应用于所有上方参考样点和左侧参考样点,或者仅应用于任意方向。另外,当通过使用多个参考样点线来配置当前块的参考样点线时,也可应用所述方法。
可基于当前块的帧内预测模式和块的尺寸/形状中的至少一个来确定是否要对一个或多个构建的参考样点执行滤波。当执行滤波时,滤波器类型可根据当前块的帧内预测模式和块的尺寸和形状中的至少一个而变得不同。
当对当前块执行子块分区预测时,可构建用于每个子块的参考样点。这里,参考样点的水平长度或垂直长度可以是每个子块的水平长度或垂直长度的两倍。
例如,当当前块的尺寸为M×N并且当前块被水平分区为四个相等的部分使得每个子块具有M×(N/4)的尺寸时,子块的参考样点可具有2*M的水平长度和2*(N/4)的垂直长度。换句话说,基于执行预测和变换的块的尺寸,可构建具有2*水平长度和2*垂直长度的参考样点。
在下文中,将根据本发明的实施例详细描述执行帧内预测(S830)。
可基于通过上述推导帧内预测模式(S810)和上述配置参考样点(S820)推导的帧内预测模式和参考样点来执行当前块的帧内预测。
当推导的帧内预测模式是DC模式时,可使用一个或多个构建的参考样点的平均值。在本文中,可对位于当前块的边界上的一个或多个预测样点执行滤波。可基于当前块的尺寸和形状中的至少一个来不同地执行通过DC模式的预测。例如,可基于当前块的尺寸和/或形状以及参考样点线指示符来指定在DC模式中使用的参考样点的范围。
图11是用于说明根据本发明实施例的根据当前块的尺寸和/或形状的DC预测的实施例的示图。
参照图11的(a),当当前块是正方形时,可通过使用当前块的上方样点和左侧样点的平均值来执行DC预测。
另外,当当前块不是正方形时,可选择性地使用与当前块的左侧或上方相邻的邻近样点。例如,如图11的(b)所示,当当前块是矩形时,可通过使用与当前块的水平长度和垂直长度之间的较长者相邻的参考样点的平均值来执行DC预测。
另外,当当前块的尺寸是预定尺寸或在预定范围内时,可在当前块的上方或左侧参考样点中选择由参考样点线指示符指示的参考样点线的预定样点,并且可通过使用由此选择的样点的平均值来执行DC预测。
预定尺寸可表示在编码器/解码器中预定义的N×M的固定尺寸。这里,N和M是大于0的整数,并且可相同或不同。
预定范围可表示用于选择当前块的参考样点的阈值。阈值可被实现为最大值和最小值中的至少一个。在此,最小值和/或最大值可以是在编码器/解码器中预定义的固定值或在编码器中被编码并用信号发送的可变值。
如上所述,一个或多个参考样点的平均值可被用于DC预测。为了计算平均值,可使用参考样点的数量进行除法。这里,当参考样点的数量是2n(n是正整数)时,执行除法可通过二进制移位运算代替。
在非正方形块的情况下,如果使用上方参考样点和左侧参考样点两者,那么参考样点的数量可不为2n。在此情况下,移位运算可不被用于代替除法运算。因此,如在以上实施例中,通过仅使用2n个上方或左侧参考样点,除法运算可由移位运算代替。
当帧内预测模式是平面模式时,可根据用于当前块的帧内预测的目标样点的位置使用考虑到与至少一个或多个构建的参考样点的距离的加权和。
当帧内预测模式是方向模式时,可使用存在于帧内预测的目标样点的位置处的预定角度线上和周围的一个或多个参考样点。
当执行方向预测时,可基于当前块的形状将帧内预测模式改变为预定模式。换句话说,当帧内预测模式是方向模式并且块的水平尺寸和垂直尺寸彼此不同时,可基于水平尺寸和垂直尺寸之间的比率将帧内预测模式改变为预定模式。块的宽度和高度之间的比率(whRaito)可由whRatio=Abs(Log2(nW/nH))来确定。这里,nW和nH可分别是块的水平和垂直长度,并且Abs(x)可表示x的绝对值。
例如,当前块的水平尺寸大于其垂直尺寸,从左下方预测的预定方向模式可被改变为从右上方预测的方向模式。换句话说,当满足以下所有条件时,可将预定偏移应用于帧内预测模式,因此可通过predModeIntra=predModeIntra+65来改变帧内预测模式。这里,predModeIntra可表示帧内预测模式。
(1)块的水平尺寸大于其垂直尺寸。
(2)predModeIntra等于或大于2。
(3)predModeIntra小于预定模式。这里,当whRatio为1时,预定模式可以是8,并且当whRatio大于1时,预定模式可以是(8+2*whRatio)。可选地,可将预定模式固定为(8+2*whRatio),而无论whRatio的大小。
另外,当前块的垂直尺寸大于其水平尺寸,从右上方预测的预定方向模式可被改变为从左下方预测的模式。换句话说,当满足以下所有条件时,可将预定偏移应用于帧内预测模式,因此可通过predModeIntra=predModeIntra-67来改变帧内预测模式。
(1)块的垂直尺寸大于其水平尺寸。
(2)predModeIntra等于或小于66。
(3)predModeIntra大于预定模式。这里,当whRatio为1时,预定模式可以是60,并且当whRatio大于1时,预定模式可以是(60-2*whRatio)。可选地,可将预定模式固定为(60-2*whRatio),而无论whRatio的大小。
当通过将当前块分区成子块来执行预测时,可通过共同使用基于当前块推导的一个帧内预测模式来预测每个子块。在这种情况下,可基于子块的形状(例如,块的水平和垂直尺寸)将帧内预测模式改变为预定模式。换句话说,可基于当前块的尺寸通过使用邻近帧内预测模式推导当前块的帧内预测模式。基于通过分区当前块获得的子块的水平尺寸和垂直尺寸,可将推导的当前块的帧内预测模式改变为预定模式。
例如,当前块的尺寸可为32×32,帧内预测模式(predModeIntra)可为4,并且可通过在水平方向上将当前块分区成四个相等部分来构建子块。这里,基于每个子块的尺寸32×8,可通过应用上述方法来改变帧内预测模式(predModeIntra)4。换句话说,由于whRatio为2,子块的水平尺寸大于其垂直尺寸,predModeIntra大于2,并且predModeIntra小于(8+2*2),因此帧内预测模式可改变为69(=4+65)。
作为另一示例,当前块的尺寸可为32×8,帧内预测模式(predModeIntra)可为4,并且可通过在垂直方向上将当前块分区成四个相等部分来构建子块。这里,基于每个子块的尺寸8×8,可通过应用上述方法来改变帧内预测模式(predModeIntra)4。然而,在这种情况下,由于通过应用该方法子块的水平和垂直尺寸变得相同,因此可不改变帧内预测模式。
当执行方向预测时,可基于当前块的尺寸和/或形状、水平长度、垂直长度和帧内预测模式中的至少一个来确定插值滤波器。这里,插值滤波器可包含第一插值滤波器和第二插值滤波器。例如,第一插值滤波器可为三次滤波器,并且第二插值滤波器可为高斯滤波器。
根据实施例,可通过将水平模式或垂直模式与当前块的帧内预测模式(preModeIntra)之间的差值与预定阈值进行比较来确定插值滤波器。可如下确定差值(Diff)。
差值(Diff)=Min(Abs(PredModeIntra-50),Abs(PredModeIntra-18))
换句话说,差值(Diff)可被确定为垂直模式(50)与当前块的帧内预测模式(predModeIntra)之间的差的绝对值(Abs)和水平模式(18)与当前块的帧内预测模式(predModeIntra)之间的差的绝对值(Abs)中的较小者(Min)。
当所述差值等于或小于预定阈值时,插值滤波器可被确定为第一插值滤波器。当所述差值超过所述阈值时,插值滤波器可被确定为第二插值滤波器。
根据实施例,可基于通过使用当前块的水平尺寸和垂直尺寸的组合确定的预定阈值(TH)来确定插值滤波器。这里,可如下确定当前块的水平尺寸和垂直尺寸的组合。
当前块的水平尺寸和垂直尺寸的组合(S)=(Log2(nTbW)+Log2(nTbH))>>1
换句话说,当前块的水平尺寸和垂直尺寸的组合(S)可被确定为当前块的水平尺寸(nTbW)的对数值(Log2)与当前块的垂直尺寸(nTbH)的对数值(Log2)之间的平均值。
表1示出基于当前块的水平尺寸和垂直尺寸的组合确定阈值的示例。
根据当前块的水平尺寸和垂直尺寸的组合,可如表1中所示确定阈值。
表1
S=2 S=3 S=4 S=5 S=6
TH[S] 16 14 2 0 0
这里,当差值(Diff)等于或小于阈值(TH)时,插值滤波器可被确定为第一插值滤波器。当所述差值超过所述阈值时,插值滤波器可被确定为第二插值滤波器。
表2示出基于当前块的水平尺寸和垂直尺寸的组合确定阈值的示例。
另外,由于根据阈值确定第一插值滤波器和第二插值滤波器,因此当通过如表2所示改变阈值来选择插值滤波器时,可提高压缩效率。
表2
S=2 S=3 S=4 S=5 S=6
TH[S] 16 14 4 0 0
因此,当当前块的水平尺寸和垂直尺寸的组合为2时,可总是确定为第一插值滤波器。另外,当S为3时,如果帧内预测模式差值(Diff)等于或小于12,则可确定为第一插值滤波器。否则,也就是说,如果帧内预测模式差值(Diff)超过12,那么可确定为第二插值滤波器。当S等于或大于5时,可总是确定为第二插值滤波器。
可选地,当既不使用表1也不使用表2时,可通过单独的公式推导阈值(TH)。
例如,可使用以下公式来推导阈值(TH)。
TH=1<<(6-S)
换句话说,如上面的公式所示,可基于当前块的水平尺寸和垂直尺寸的组合(S)来确定阈值(TH)。例如,根据该式,当S为2、3、4、5和6时,TH可分别为16、8、4、2和1。
可选地,可基于当前块的帧内预测模式将当前块的水平尺寸和垂直尺寸的组合(S)确定为当前块的水平尺寸或垂直尺寸。
例如,当当前块的帧内预测模式大于对角线模式34时,可将当前块的水平长度(nTbW)确定为当前块的水平尺寸和垂直尺寸的组合(S)。换句话说,当当前块的帧内预测模式大于对角线模式34时,S可为Log2(nTbW)。
另外,当当前块的帧内预测模式等于或小于对角线模式34时,可将当前块的垂直长度(nTbH)确定为当前块的水平尺寸和垂直尺寸的组合(S)。换句话说,当当前块的帧内预测模式等于或小于对角线模式34时,S可为Log2(nTbH)。
作为另一示例,可通过比较当前块的帧内预测模式与通过将预定偏移应用于对角线模式34而获得的值来确定尺寸组合。例如,当当前块的帧内预测模式大于34+6时,可将当前块的水平长度确定为当前块的水平尺寸和垂直尺寸的组合。可选地,当当前块的帧内预测模式小于34-6时,可将当前块的垂直长度确定为当前块的水平尺寸和垂直尺寸的组合。这里,当没有满足任何条件时,可将当前块的水平长度和垂直长度的平均值确定为当前块的水平尺寸和垂直尺寸的组合。
根据实施例,可基于当前块的参考样点线相关信息(例如,intra_luma_ref_idx)和子块分区预测信息(例如,intra_subblock_flag、intra_subpartitions_mode_flag、intra_subblock_type_flag、intra_subpartitions_split_flag等)中的至少一个来确定插值滤波器。这里,当帧内预测模式为复制整数位置处的参考样点的模式(例如,2、34、66)时,可不确定插值滤波器,并且可复制及预测整数位置处的参考样点。可选地,在第一插值滤波器的滤波器系数当中,可使用与整数位置相对应的滤波器系数。
表3至表6示出了基于帧内预测模式、参考样点线相关信息和子块分区预测信息来确定插值滤波器的示例。
例如,如表3所示,当参考样点线指示符不具有特定值(例如,0)(例如,intra_luma_ref_idx!=0)时,可使用第一插值滤波器来执行方向预测。
作为另一示例,如表3中所示,当通过将当前块分区成子块(例如,intra_subblock_flag=1)来执行预测时,可基于当前块的帧内预测模式、当前块的水平尺寸和垂直尺寸中的至少一个来确定插值滤波器。根据该方法,当在不与阈值进行比较的情况下满足预定条件时,可使用第一插值滤波器。
表3
Figure BDA0003361276230000521
例如,参照表3,当当前块的帧内预测模式等于或大于34且当前块的水平长度(W)等于或小于8时,或当当前块的帧内预测模式小于34且当前块的垂直长度(H)等于或小于8时,可根据参考样点线指示符和/或是否通过将当前块分区成子块来执行预测而不同地确定插值滤波器。
例如,当参考样点线指示符不为0(例如,intra_luma_ref_idx!=0)时,可选择第一插值滤波器,而无论是否满足当前块的帧内预测模式的条件。
作为另一示例,当满足当前块的帧内预测模式的条件并且通过将当前块分区成子块(例如,intra_subblock_flag=1)来执行预测时,可选择第一插值滤波器。
作为另一示例,当不满足当前块的帧内预测模式的条件且通过将当前块分区成子块(例如,intra_subblock_flag=1)来执行预测时,可通过当前块的帧内预测模式与阈值之间的比较来选择第一插值滤波器或第二插值滤波器。
作为另一示例,当参考样点线指示符为0(例如,intra_luma_ref_idx=0)并且当前块未被分区成子块(例如,intra_subblock_flag!=1)时,可通过当前块的帧内预测模式与阈值之间的比较来选择第一插值滤波器或第二插值滤波器,而无论是否满足当前块的帧内预测模式的条件。
当通过将当前块分区成子块来执行预测时,可去除该示例的预定条件,从而降低复杂度。
参照表4,可通过比较当前块的帧内预测模式与阈值的方法确定第一插值滤波器或第二插值滤波器来执行方向预测。
表4
Figure BDA0003361276230000522
Figure BDA0003361276230000531
例如,参考表4,当当前块的帧内预测模式是插值预测模式并且参考样点线指示符不是0(例如,intra_luma_ref_idx!=0)时,可选择第一插值滤波器。可选地,当参考样点线指示符为0(例如,intra_luma_ref_idx=0)时或当通过将当前块分区成子块(例如,intra_subblock_flag=1)来执行预测时,可通过当前块的帧内预测模式与阈值之间的比较来选择第一插值滤波器或第二插值滤波器。
例如,当确定将滤波器应用于参考样点且参考样点线指示符不为0时,可总是应用第一插值滤波器。同时,当两个条件都不满足时,可通过与阈值的比较来确定插值滤波器。
表5
Figure BDA0003361276230000532
例如,参照表5,当当前块的帧内预测模式是插值预测模式并且参考样点线指示符不是0(例如,intra_luma_ref_idx!=0)或者通过将当前块分区为子块来执行预测(例如,intra_subblock_flag=1)时,可选择第一插值滤波器。可选地,当参考样点线指示符为0(例如,intra_luma_ref_idx=0)并且当前块未被分区成子块时,可通过当前块的帧内预测模式与阈值之间的比较来选择第一插值滤波器或第二插值滤波器。
例如,当参考样点线指示符(intra_luma_ref_idx)不为0或通过在水平或垂直方向上将当前块分区成子块来执行预测时,可选择三次滤波器作为插值滤波器。
例如,当参考样点线(intra_luma_ref_idx)为0并且当前块未被分区为子块时,可通过比较上述“当前块的帧内预测模式与水平模式或垂直模式之间的差值(Diff)”和上述预定阈值(TH)来确定插值滤波器。具体地讲,当差值(Diff)大于阈值(TH)时,可选择高斯滤波器作为插值滤波器。可选地,相反,当差值(Diff)等于或小于阈值(TH)时,可选择三次滤波器作为插值滤波器。这里,如上所述,可通过以下公式计算差值(Diff)。
差值(Diff)=Min(Abs(PredModeIntra-50),Abs(PredModeIntra-18))
换句话说,差值(Diff)可被确定为垂直模式(50)与当前块的帧内预测模式(predModeIntra)之间的差的绝对值(Abs)和水平模式(18)与当前块的帧内预测模式(predModeIntra)之间的差的绝对值(Abs)中的较小者(Min)。
另外,如上所述,可基于当前块的水平尺寸和垂直尺寸的组合(S)来确定阈值(TH)。这里,组合可如下确定。
组合(S)=(Log2(nTbW)+Log2(nTbH))>>1
换句话说,组合(S)可被确定为当前块的水平尺寸(nTbW)的对数值(Log2)与当前块的垂直尺寸(nTbH)的对数值(Log2)之间的平均值。
作为变型示例,可根据当前块的水平尺寸和垂直尺寸的组合(S)来确定阈值(TH),如表6所示。
表6
S=2 S=3 S=4 S=5 S=6 S=7
TH[S] 24 14 2 0 0 0
表7
Figure BDA0003361276230000541
另外,参照表7,当当前块的帧内预测模式是插值预测模式并且参考样点线指示符不是0(例如,intra_luma_ref_idx!=0)时,可选择第一插值滤波器。可选地,当通过将当前块分区成子块(例如,intra_subblock_flag=1)来执行预测时,可选择第二插值滤波器。可选地,当两个条件都不满足时,可通过当前块的帧内预测模式与阈值之间的比较来选择第一插值滤波器和第二插值滤波器中的一个。
在基于位置信息的帧内预测模式的情况下,基于编码/解码或推导的位置信息生成的重建样点块可被用作当前块的帧内预测块。可选地,解码器可搜索并推导将被用作当前块的帧内预测块的重建样点块。
可作为当前块的标志显式地用信号发送或可隐式地推导基于位置信息的帧内预测模式是否被应用于当前块。在本说明书中,指示基于位置信息的帧内预测模式是否被应用于当前块的标志可被称为帧内块复制(IBC)标志。
例如,当包括当前块的并行块组是不参考其它画面的I并行块组且当前块不是跳过块时,可用信号发送IBC标志。
另外,当包括当前块的并行块组是I并行块组且当前块不是一般帧内预测模式时,可用信号发送IBC标志。
可用信号发送指示基于位置信息的帧内预测模式是否在当前块的较高等级(例如,序列等级等)可用的可用性信息。这里,可仅在可用性信息指示可用时显式地用信号发送IBC标志。
当不用信号发送IBC标志时,可基于当前块所属的并行块组的属性隐式地推导IBC标志值。
例如,当当前块属于I并行块组时,IBC标志值可被推导为可用信息的值。
另外,当当前块属于P并行块组或B并行块组时,IBC标志值可被推导为0。
当IBC标志值为1时,其可表示基于位置信息的帧内预测模式被应用于当前块。当IBC标志值为0时,其可表示基于位置信息的帧内预测模式不被应用于当前块。
可恢复位置信息以执行基于位置信息的帧内预测。当前块和重建样点块两者被包括在当前画面中,并且位置信息可以是关于当前块与重建样点块之间的位置差的信息。这里,恢复位置信息可类似于重建帧间预测的运动矢量的方式。
例如,类似于帧间预测中的合并模式,可从邻近块的位置信息恢复位置信息。在这方面,可用信号发送指示合并模式的信息(例如,MergeFlag=1),并且可配置包括N个(N是正整数)候选的合并候选列表。
例如,N可以是5。换句话说,可配置包括五个合并候选的合并候选列表。这里,五个合并候选可与帧间预测的五个空间合并候选相同,并且用于被添加到合并候选列表的优先级顺序也可相同。所有五个空间合并候选可被包括在合并候选列表中。另外,当包括在合并候选列表中的候选的数量小于5时,可包括额外候选。
这里,额外候选的位置信息可以是根据预定规则从已被包括在合并候选列表中的候选中选择的两个候选的位置信息的平均值或加权平均值。两个选择的候选可为合并候选列表的第一候选和第二候选。
可选地,根据预定规则从候选列表中选择的候选可被包括为当前块的额外候选,其中,该选择的候选被用于基于先前块的位置信息的帧内预测。当用信号发送的索引信息被应用于由此配置的合并候选列表时,可恢复当前块的位置信息。
例如,可将位置信息恢复为位置信息与残差位置信息的预测位置信息总和。在这方面,可用信号发送指示其不是合并模式的信息(例如,MergeFlag=0),并且预测因子的候选可以是当前块的左侧块和上方块。
在此,可通过使用左侧块的位置信息和上方块的位置信息来配置列表,并且可通过应用用信号发送的索引来推导当前块的预测位置信息。当列表中包括两条或更少条预测位置信息时,可将已被包括的预测位置信息的舍入信息和/或零位置信息添加到列表。
当亮度信息和色度信息被分区成相同树结构时,可基于亮度块的位置信息推导色度块的位置信息。另一方面,当亮度信息和色度信息被分区成不同树结构时,色度块可被分区成每个具有预定尺寸(例如,4×4)的子块,并且可基于对应位置处的亮度块的位置信息推导每个子块的位置信息。
推导的位置信息可被更新到预定列表中以用于推导下一块的位置信息。这里,预定列表可表示上述“用于基于先前块的位置信息的帧内预测的候选列表”。这里,可确认将被添加的位置信息是否已被包括在列表中。当相同的位置信息被包括在列表中时,从列表中移除相应的位置信息,并且移动在移除的位置信息之后的多条位置信息的位置,从而填充移除的位置信息的位置。然后,可将待添加的位置信息添加到列表的最终位置。当列表中没有相同的位置信息时,可在列表的末尾添加待添加的位置信息。
当推导当前块的位置信息时,该信息可被用于生成当前块的预测块。待应用位置信息的画面可以是恢复的当前画面。例如,当通过使用恢复的当前画面作为参考图像并使用位置信息作为运动矢量来执行帧间预测时,可从恢复的当前画面生成当前块的预测块。
可通过使用当前块的恢复的亮度信号来执行色度信号的帧内预测。另外,通过使用当前块的一个恢复的色度信号Cb或Cb的残差信号,可执行另一色度信号Cr的帧内预测。
可通过组合上述一种或多种预测方法来执行帧内预测。例如,可凭借通过使用预定的非方向帧内预测模式预测的块和通过使用预定的方向帧内预测模式预测的块的加权和来构建当前块的帧内预测块。这里,可根据当前块的帧内预测模式、块的尺寸和样点的位置中的至少一个来不同地应用权重。
可选地,在色度块的情况下,可凭借通过使用预定帧内预测模式预测的块与通过使用亮度块的恢复信号预测的块的加权和来构建色度块的帧内预测块。这里,预定帧内预测模式可为用于推导色度块的帧内预测模式的模式中的一个。在色度块的情况下,如上所述,可通过编码信息用信号发送是否通过使用两个预测块的加权和来构建最终预测块。
在方向模式的情况下,基于方向预测模式,可重建上面构建的参考样点。例如,当方向预测模式是使用左侧或上方存在的所有参考样点的模式时,可为左侧或上方参考样点配置一维布置。可选地,可通过移动左参考样点来构建上方参考样点。可通过使用一个或多个左侧参考样点的加权和来构建上方参考样点。
可选地,可以以当前块的预定样点组为单元执行不同的方向帧内预测。这里,预定样点组单元可以是块、子块、线或单个样点。
图12是用于说明根据本发明的实施例的在颜色分量之间执行帧内预测的处理的示图。
根据本发明的实施例,可执行颜色分量之间的帧内预测。
参照图12,在颜色分量之间执行帧内预测的处理可包括重建颜色分量块(S1210)、推导预测参数(S1220)和/或在颜色分量之间执行预测(S1230)。然而,该处理可不限于这些步骤。
颜色分量可表示亮度信号、色度信号、红色、绿色、蓝色、Y、Cb和Cr中的至少一个。可通过使用第二颜色分量、第三颜色分量和第四颜色分量中的至少一个来执行对第一颜色分量的预测。这里,用于预测的颜色分量的信号可以是原始信号、恢复信号、残差信号和预测信号中的至少一个。
当对第二颜色分量目标块执行帧内预测时,可使用对应于第二颜色分量目标块的第一颜色分量的对应块的样点、对应块的邻近块的样点或者两者。
例如,当对色度分量块Cb或Cr执行帧内预测时,可使用与色度分量块相对应的重建亮度分量块Y。
可选地,当对Cr分量块执行帧内预测时,可使用Cb分量块。
可选地,当对第四分量块执行帧内预测时,可使用与第四分量块相对应的第一颜色分量块、第二颜色分量块和/或第三颜色分量块中的至少一个或多个的组合。
可基于当前块的编码参数来确定颜色分量之间的帧内预测是否可能。当前块的编码参数可包括包含当前块的条带类型、当前块是否是二元树划分以及当前块的尺寸和形状中的至少一个。
例如,当目标块的尺寸是CTU尺寸、超过预定尺寸或在预定尺寸范围内时,可确定颜色分量之间的帧内预测对于目标块是可实施的。
具体来说,当当前块被包括在I条带中且当前块的亮度分量和色度分量不是二元树划分时,可确定颜色分量之间的帧内预测对于当前块是可实施的。二元树划分可表示根据分离的树结构划分当前块的亮度分量及色度分量。
另外,当目标块的条带类型不是I条带时,可确定颜色分量之间的帧内预测对于目标块是可实施的。因此,例如,当目标块的条带类型是P条带或B条带时,可确定颜色分量之间的帧内预测对于目标块是可实施的。
另外,当目标块的形状是预定形状时,可确定颜色分量之间的帧内预测对于目标块是可实施的。这里,如果目标块是矩形的,则可不被执行颜色分量之间的帧内预测,并且上述实施例可以以相反的方式被实施。
当确定颜色分量之间的帧内预测对于当前块是可实施的时,可对当前块执行颜色分量之间的帧内预测。可选地,当确定颜色分量之间的帧内预测对于当前块是可实施的时,可单独地用信号发送关于颜色分量之间的帧内预测是否应用于当前块的信息。在这种情况下,基于关于颜色分量之间的帧内预测是否应用于当前块的信息,可最终确定是否将颜色分量之间的帧内预测应用于当前块。
还可基于预测目标块的对应块和对应块的邻近块的至少一个编码参数来确定是否执行颜色分量之间的帧内预测。
例如,当在受约束帧内预测(CIP)环境中对对应块进行帧间预测时,可不执行颜色分量之间的帧内预测。
另外,当对应块的帧内预测模式是预定模式时,可执行颜色分量之间的帧内预测。
另外,可基于对应块和邻近块的多条CBF(编码块标志)信息中的至少一条信息来确定是否在颜色分量之间执行帧内预测。这里,CBF信息可以是示出是否存在残差信号的信息。
编码参数不限于块的预测模式,并且可使用可用于编码/解码的各种参数。
参照图12,为了执行颜色分量之间的帧内预测,可执行重建颜色分量块的步骤(S1210)。
当通过使用第一颜色分量块预测第二颜色分量块时,可重建第一颜色分量块。
例如,当图像的颜色空间为YcbCr且颜色分量之间的比率为4:4:4、4:2:2和4:2:0中的一个时,颜色分量之间的块的尺寸可不同。因此,当通过使用具有不同尺寸的第一颜色分量块来预测第二颜色分量块时,可重建第一颜色分量块以使两个块具有相同的尺寸。在此情况下,重建块可包括第一颜色分量对应块的样点和邻近块的样点中的至少一个。
在上述构建参考样点的步骤中,可用信号发送与多个参考样点线中的预定线相对应的指示符(例如,intra_luma_ref_idx)。这里,在重建步骤中,可通过使用与用信号发送的指示符相对应的预定线来执行重建。
例如,当参考样点线指示符(intra_luma_ref_idx)为3时,可通过使用与第一颜色分量对应块相邻的第四参考样点线来执行重建。这里,当通过使用两个或更多个参考样点线来执行重建时,可额外使用第三参考样点线。
另外,当参考样点线指示符(intra_luma_ref_idx)为1时,可通过使用与第一颜色分量对应块相邻的第二参考样点线来执行重建。
这里,重建处理可不使用未通过参考样点线指示符指示的参考样点线。例如,参考样点线指示符指示第一参考样点线、第二参考样点线和第四参考样点线中的一个,在重建处理中可不使用第三参考样点线。换句话说,当对当前块执行帧内预测时,可能无法从存储器访问和获得与第三参考样点线相对应的样点。
当第一颜色分量块和第二颜色分量块具有相同的划分方案时,可使用在重建处理中使用指示符的方法。
例如,当一个CTU中的第一颜色分量块和第二颜色分量块两者具有相同的单树划分方案时,可执行基于指示符的重建处理。
在重建处理中,当第二颜色分量目标块的边界和与其对应的第一颜色分量块的边界中的至少一个是预定区域的边界时,可不同地选择用于重建的参考样点。这里,上方参考样点线和左侧参考样点线的数量可不同。另外,预定区域可以是画面、条带、并行块、CTU和CU中的至少一个。
例如,当第一颜色分量对应块的上方边界是预定区域的边界时,可通过不使用上方参考样点而仅使用左侧参考样点来执行重建。
另外,当第一颜色分量对应块的左侧边界是预定区域的边界时,可通过不使用左侧参考样点而仅使用上方参考样点来执行重建。
另外,可使用N个上方参考样点线和M个左侧参考样点线。例如,当上方边界是预定区域的边界时,N可以是1。可选地,当左侧边界为预定区域的边界时,M也可以为1。
另外,无论它是否是预定区域的边界,都可通过使用第一颜色分量对应块的N个上方参考样点线和/或M个左侧参考样点线来执行重建。
根据本发明的实施例,为了执行颜色分量之间的帧内预测,可执行推导预测参数的步骤(S1220)。
可通过使用在步骤S1210中重建的第一颜色分量对应块的参考样点和第二颜色分量预测目标块的参考样点中的至少一个来推导预测参数。在下文中,在本说明书中,第一颜色分量和第一颜色分量块可分别表示重建的第一颜色分量和重建的第一颜色分量块。
例如,可通过基于第一颜色分量对应块的帧内预测模式适应性地使用重建的第一颜色分量的参考样点来推导预测参数。在本文中,还可基于第一颜色分量对应块的帧内预测模式适应性地使用第二颜色分量的参考样点。
根据本发明的实施例,为了执行颜色分量之间的帧内预测,可执行在颜色分量之间执行预测的步骤(S1230)。
当在步骤S1220中推导预测参数时,可通过使用推导的预测参数中的至少一个来执行颜色分量之间的帧内预测。
颜色分量之间的预测方法也可被应用于帧间预测模式。例如,当对当前块执行帧间预测时,可对第一颜色分量执行帧间预测,并且可对第二颜色分量执行颜色分量之间的预测。例如,第一颜色分量可为亮度分量,并且第二颜色分量可为色度分量。
另外,可根据第一颜色分量的编码参数适应性地执行颜色分量之间的预测。
例如,可根据第一颜色分量的CBF信息来确定是否在颜色分量之间执行预测。这里,CBF信息可以是示出是否存在残差信号的信息。
换句话说,当第一颜色分量的CBF为1时,可对第二颜色分量执行颜色分量之间的预测。另一方面,当第一颜色分量的CBF为0时,可不对第二颜色分量执行颜色分量之间的预测,而是对第二颜色分量执行帧间预测。
另外,可单独地用信号发送指示是否执行颜色分量之间的预测的标志。这里,可基于CCLM指示符(cclm_mode_flag)来确定是否执行颜色分量之间的预测。例如,当CCLM指示符(cclm_mode_flag)为1(或真)时,可确定对色度块执行颜色分量之间的预测。如果不存在CCLM指示符(cclm_mode_flag)值,那么可确定不执行颜色分量之间的预测。
当执行颜色分量之间的预测时,如果第一颜色分量的编码模式是帧间预测模式,则可对第二颜色分量执行颜色分量之间的预测。
例如,当对当前块执行帧间预测时,可对第一颜色分量执行帧间预测,并且可对第二颜色分量执行颜色分量之间的预测。这里,第一颜色分量可为亮度分量,并且第二颜色分量可为色度分量。
可通过使用亮度分量的重建样点或预测样点来执行颜色分量之间的预测。例如,在执行对亮度分量的帧间预测之后,可通过应用预测样点的颜色分量之间的预测参数来执行色度分量的预测。这里,预测样点可表示对其执行运动补偿、运动校正、重叠块运动补偿(OBMC)和双向光学(BIO)流中的至少一个的样点。
可基于第一颜色分量的编码参数适应性地执行颜色分量之间的预测。例如,可根据第一颜色分量的CBF信息来确定是否在颜色分量之间执行预测。CBF信息可以是示出是否存在残差信号的信息。
换句话说,当第一颜色分量的CBF为1时,可对第二颜色分量执行颜色分量之间的预测。另一方面,当第一颜色分量的CBF为0时,可不对第二颜色分量执行颜色分量之间的预测,而是对第二颜色分量执行帧间预测。
另外,可用信号发送指示是否执行颜色分量之间的预测的标志。例如,可在CU或PU的单元中用信号发送是否执行颜色分量之间的预测。这里,可基于CCLM指示符(cclm_mode_flag)来确定是否执行颜色分量之间的预测。
当第一颜色分量的编码参数满足预定条件时,可用信号发送指示是否执行颜色分量之间的预测的标志。
例如,当第一颜色分量的CBF为1时,可通过用信号发送指示是否执行颜色分量之间的预测的标志来确定是否执行颜色分量预测。
当对第二颜色分量执行颜色分量之间的预测时,可使用第二颜色分量的画面间运动预测或补偿值。
例如,可通过使用第一颜色分量的帧间预测信息来执行第二颜色分量的画面间运动预测或补偿,并且可通过颜色分量之间的预测值和第二颜色分量的画面间运动补偿值的加权和来执行预测。
可选地,当当前块的帧间预测模式是合并模式时,可凭借通过使用与合并索引相对应的运动信息预测的值与通过在颜色分量之间执行预测预测的值的加权和来执行当前块的第二颜色分量的预测。
这里,用于在颜色分量之间执行预测的第一颜色分量块可以是来自帧间预测(例如,使用合并模式)的预测值和重建值中的至少一个。
另外,加权和的权重可以是1:1。
在下文中,将根据本发明的实施例描述预测残差信号的步骤(S840)。
根据实施例,对于当前块的第一残差信号,可以以当前块内的样点线、样点和预定组中的至少一个为单元执行预测,因此可生成第二残差信号。这里,第一残差信号可以是与原始块和预测块之间的差相对应的信号,或者是通过对变换系数进行解码而生成的信号。第二残差信号可以是通过在当前块的样点线、样点和预定组内的至少一个单元中加上或减去第一残差信号而生成的信号。预定组可以是多个样点或多个样点线。
图13是用于说明根据本发明的实施例的样点线单元预测的示例的示图。
根据实施例,可通过对基于原始块和预测块之间的差生成的第一残差块执行样点线单元预测来生成第二残差块。例如,参照图13,可在如图13的(b)中的垂直方向上或在如图13的(c)中的水平方向上对图13的(a)中所示的8×8尺寸的当前块执行样点线单元预测。
当如13的图(b)所示在垂直方向上执行样点线单元预测时,不对第一残差块的线0执行预测,并且第一残差块的线0可被分配给第二残差块的线0。换句话说,第二残差块[x][0]=第一残差块[x][0]。这里,残差块[x][y]可表示坐标(x,y)的残差样点值。
另外,对于第一残差块的线n,作为预测值的线n和线n-1之间的差可被生成为第二残差信号。例如,第二残差块[x][y]=第一残差块[x][y]-第一残差块[x][y-1]。
可对第二残差块的残差样点值执行熵编码。
另外,与图13的(b)相关的方法也可被应用于如图13的(c)所示的在水平方向上执行样点线单元预测的情况。
图13的(b)的方法和图13的(c)的方法可分别对应于上述垂直残差信号预测和水平残差信号预测。
根据实施例,可通过对经由熵解码生成的第一残差块执行样点线单元预测或重建来生成第二残差块。例如,参照图13,可以像图13的(b)中那样在垂直方向上执行样点线单元预测或重建,或者像图13的(c)中那样在水平方向上执行样点线单元预测或重建。
当如图13的(c)所示在水平方向上执行样点线单元预测或重建时,不对第一残差块的线0执行样点线单元预测和重建,并且可将第一残差块的线0分配给第二残差块的线0。换句话说,第二残差块[0][y]=第一残差块[0][y]。
另外,对于第一残差块的线n,作为预测值的线n和线n-1的总和可被生成为第二残差信号。例如,第二残差块[x][y]=第一残差块[x][y]+第一残差块[x-1][y]。
可通过将生成的第二残差块与通过帧内预测生成的预测块相加来重建当前块。这里,用于帧内预测的帧内预测模式可具有与样点线单元残差块预测相同的方向。
例如,当在水平方向上执行样点线单元残差块预测时,可通过使用作为水平帧内预测模式的模式18来执行帧内预测。
与样点线单元预测一样,可执行预定的组单元残差信号预测。可在编码器和解码器中以相同的方法执行上述实施例。
可在编码器和解码器中以相同的方法执行上述实施例。
上述实施例中的至少一个实施例或组合可被用于对视频进行编码/解码。
应用于上述实施例的顺序在编码器与解码器之间可不同,或者应用于上述实施例的顺序在编码器和解码器中可相同。
可对每个亮度信号和每个色度信号执行上述实施例,或者可对亮度信号和色度信号相同地执行上述实施例。
应用了本发明的上述实施例的块形式可具有正方形形式或非正方形形式。
由编码器熵编码和由解码器熵解码的语法元素(标志、索引等)中的至少一个可使用以下二值化方法中的至少一个。
截断莱斯二值化方法
k阶指数哥伦布二值化方法
受限制的k阶指数哥伦布二值化方法
定长二值化方法
一元二值化方法
截断一元二值化方法
截断二元二值化方法
可根据编码块、预测块、变换块、块、当前块、编码单元、预测单元、变换单元、单元和当前单元中的至少一个的尺寸来应用本发明的上述实施例。这里,尺寸可被定义为最小尺寸或最大尺寸或者最小尺寸和最大尺寸两者,使得上述实施例被应用,或者尺寸可被定义为应用上述实施例的固定尺寸。此外,在上述实施例中,第一实施例可被应用于第一尺寸,并且第二实施例可被应用于第二尺寸。换句话说,可根据尺寸组合地应用上述实施例。此外,当尺寸等于或大于最小尺寸且等于或小于最大尺寸时,可应用上述实施例。换句话说,当块尺寸被包括在特定范围内时,可应用上述实施例。
例如,当当前块的尺寸为8×8或更大时,可应用上述实施例。例如,当当前块的尺寸仅为4×4时,可应用上述实施例。例如,当当前块的尺寸为16×16或更小时,可应用上述实施例。例如,当当前块的尺寸等于或大于16×16且等于或小于64×64时,可应用上述实施例。
可根据时间层来应用本发明的上述实施例。为了标识可应用上述实施例的时间层,对应标识符可被用信号发送,并且可将上述实施例应用于由所述对应标识符标识的指定时间层。这里,标识符可被定义为可应用上述实施例的最低层或最高层或者最低层和最高层两者,或者可被定义为指示应用所述实施例的特定层。此外,可定义应用所述实施例的固定时间层。
例如,当当前图像的时间层是最低层时,可应用上述实施例。例如,当当前图像的时间层标识符是1时,可应用上述实施例。例如,当当前图像的时间层是最高层时,可应用上述实施例。
可定义应用本发明的上述实施例的条带类型或并行块组类型,并且可根据对应的条带类型或并行块组类型来应用上述实施例。
在上述实施例中,基于具有一系列步骤或单元的流程图描述了所述方法,但是本发明不限于所述步骤的顺序,而是一些步骤可与其他步骤同时执行或按不同的顺序执行。此外,本领域普通技术人员应理解,流程图中的步骤不彼此排斥,并且在不影响本发明的范围的情况下,可将其他步骤添加到流程图,或者可从流程图删除一些步骤。
所述实施例包括示例的各个方面。可不描述针对各个方面的所有可能组合,但是本领域技术人员将能够认识到不同的组合。因此,本发明可包括权利要求的范围内的所有替换、修改和改变。
可以以可由各种计算机组件执行并被记录在计算机可读记录介质中的程序指令的形式实现本发明的实施例。计算机可读记录介质可包括单独的程序指令、数据文件、数据结构等或者程序指令、数据文件、数据结构等的组合。记录在计算机可读记录介质中的程序指令可以是针对本发明专门设计和构建的,或者是计算机软件技术领域的普通技术人员公知的。计算机可读记录介质的示例包括被具体构建为存储和实现程序指令的磁记录介质(诸如硬盘、软盘和磁带)、光学数据存储介质(诸如CD-ROM或DVD-ROM)、磁光介质(诸如软光盘)以及硬件装置(诸如只读存储器(ROM)、随机存取存储器(RAM)、闪存等)。程序指令的示例不仅包括由编译器格式化的机器语言代码,还包括可由计算机使用解释器实现的高级语言代码。硬件装置可被配置为由一个或更多个软件模块操作以进行根据本发明的处理,反之亦可。
虽然已经根据诸如详细元件的特定项以及有限的实施例和附图描述了本发明,但是提供它们仅是为了帮助对本发明的更大体的理解,并且本发明不限于上述实施例。本发明所属领域的技术人员将理解,可从上述描述进行各种修改和改变。
因此,本发明的精神不应限于上述实施例,并且权利要求及其等同物的整体范围将落入本发明的范围和精神内。
工业适用性
本发明可被用于对图像进行编码或解码。

Claims (20)

1.一种图像解码方法,所述图像解码方法包括:
从比特流获得当前块的预测信息;并且
通过基于所述预测信息执行预测来生成所述当前块的预测块,
其中,所述预测信息包括所述当前块的分区预测信息,
其中,生成所述预测块的步骤包括:
从所述当前块的邻近块获得参考样点;
将插值滤波器应用于所述参考样点;以及
通过使用应用了插值滤波器的所述参考样点来生成所述预测块,并且
其中,基于所述当前块的分区预测信息来确定插值滤波器。
2.根据权利要求1所述的图像解码方法,
其中,插值滤波器被确定为彼此不同的两个插值滤波器中的一个。
3.根据权利要求1所述的图像解码方法,
其中,所述当前块的分区预测信息包括是否执行所述当前块的分区预测和所述当前块的分区方向。
4.根据权利要求3所述的图像解码方法,
其中,所述当前块的分区方向是垂直方向或水平方向。
5.根据权利要求1所述的图像解码方法,
其中,所述预测信息包括关于多个参考样点线的信息,
其中,基于所述关于多个参考样点线的信息来确定插值滤波器。
6.根据权利要求1所述的图像解码方法,
其中,所述预测信息包括用于所述当前块的所述邻近块的基于矩阵的预测模式信息,并且
其中,当对所述邻近块执行基于矩阵的帧内预测时,所述邻近块的帧内预测模式被认为是平面模式。
7.根据权利要求6所述的图像解码方法,
其中,所述邻近块为位于所述当前块的左下方的块或右上方的块。
8.根据权利要求1所述的图像解码方法,
其中,当所述当前块的亮度块的帧内预测模式为基于矩阵的帧内预测模式时,所述当前块的色度块的帧内预测模式被推导为平面模式。
9.根据权利要求1所述的图像解码方法,
其中,所述预测信息包括所述当前块的残差信号预测信息,并且基于残差信号预测信息确定所述当前块的帧内预测模式。
10.根据权利要求9所述的图像解码方法,
其中,基于残差信号预测信息将所述当前块的所述帧内预测模式确定为水平预测模式和垂直预测模式之一。
11.一种图像编码方法,所述图像编码方法包括:
确定当前块的预测模式;
通过基于所述当前块的所述预测模式执行预测来生成所述当前块的预测块;以及
对包括所述当前块的所述预测模式的所述当前块的预测信息进行编码,
其中,所述预测信息包括所述当前块的分区预测信息,
其中,生成所述预测块的步骤包括:
从所述当前块的邻近块获得参考样点;
将插值滤波器应用于所述参考样点;以及
通过使用应用了插值滤波器的所述参考样点来生成所述预测块,并且
其中,基于所述当前块的分区预测信息来确定插值滤波器。
12.根据权利要求11所述的图像编码方法,
其中,插值滤波器被确定为彼此不同的两个插值滤波器中的一个。
13.根据权利要求11所述的图像编码方法,
其中,所述当前块的分区预测信息包括是否执行所述当前块的分区预测和所述当前块的分区方向。
14.根据权利要求11所述的图像编码方法,
其中,所述预测信息包括关于多个参考样点线的信息,
其中,基于所述关于多个参考样点线的信息来确定插值滤波器。
15.根据权利要求11所述的图像编码方法,
其中,所述预测信息包括用于所述当前块的所述邻近块的基于矩阵的预测模式信息,并且
其中,当对所述邻近块执行基于矩阵的帧内预测时,所述邻近块的帧内预测模式被认为是平面模式。
16.根据权利要求15所述的图像编码方法,
其中,所述邻近块为位于所述当前块的左下方的块或右上方的块。
17.根据权利要求11所述的图像编码方法,
其中,当所述当前块的亮度块的帧内预测模式为基于矩阵的帧内预测模式时,所述当前块的色度块的帧内预测模式被推导为平面模式。
18.根据权利要求11所述的图像编码方法,
其中,所述预测信息包括所述当前块的残差信号预测信息,并且
基于残差信号预测信息确定所述当前块的帧内预测模式。
19.根据权利要求18所述的图像编码方法,
其中,基于残差信号预测信息将所述当前块的帧内预测模式确定为水平预测模式和垂直预测模式之一。
20.一种非暂时性计算机可读记录介质,被配置为存储通过图像编码方法生成的比特流,
其中,所述图像编码方法包括:
确定当前块的预测模式;
通过基于所述当前块的所述预测模式执行预测来生成所述当前块的预测块;以及
对包括所述当前块的所述预测模式的所述当前块的预测信息进行编码,
其中,所述预测信息包括所述当前块的分区预测信息,
其中,生成所述预测块的步骤包括:
从所述当前块的邻近块获得参考样点;
将插值滤波器应用于所述参考样点;以及
通过使用应用了插值滤波器的所述参考样点来生成所述预测块,以及
其中,基于所述当前块的分区预测信息来确定插值滤波器。
CN202080036953.7A 2019-06-18 2020-06-08 视频编码/解码方法和设备以及存储比特流的记录介质 Active CN113841404B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202410791137.7A CN118784869A (zh) 2019-06-18 2020-06-08 视频编码/解码方法和设备以及存储比特流的记录介质
CN202410791138.1A CN118784870A (zh) 2019-06-18 2020-06-08 视频编码/解码方法和设备以及存储比特流的记录介质
CN202410791147.0A CN118784871A (zh) 2019-06-18 2020-06-08 视频编码/解码方法和设备以及存储比特流的记录介质

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2019-0072495 2019-06-18
KR20190072495 2019-06-18
PCT/KR2020/007413 WO2020256324A1 (ko) 2019-06-18 2020-06-08 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체

Related Child Applications (3)

Application Number Title Priority Date Filing Date
CN202410791138.1A Division CN118784870A (zh) 2019-06-18 2020-06-08 视频编码/解码方法和设备以及存储比特流的记录介质
CN202410791137.7A Division CN118784869A (zh) 2019-06-18 2020-06-08 视频编码/解码方法和设备以及存储比特流的记录介质
CN202410791147.0A Division CN118784871A (zh) 2019-06-18 2020-06-08 视频编码/解码方法和设备以及存储比特流的记录介质

Publications (2)

Publication Number Publication Date
CN113841404A true CN113841404A (zh) 2021-12-24
CN113841404B CN113841404B (zh) 2024-07-05

Family

ID=74037491

Family Applications (4)

Application Number Title Priority Date Filing Date
CN202410791138.1A Pending CN118784870A (zh) 2019-06-18 2020-06-08 视频编码/解码方法和设备以及存储比特流的记录介质
CN202410791137.7A Pending CN118784869A (zh) 2019-06-18 2020-06-08 视频编码/解码方法和设备以及存储比特流的记录介质
CN202410791147.0A Pending CN118784871A (zh) 2019-06-18 2020-06-08 视频编码/解码方法和设备以及存储比特流的记录介质
CN202080036953.7A Active CN113841404B (zh) 2019-06-18 2020-06-08 视频编码/解码方法和设备以及存储比特流的记录介质

Family Applications Before (3)

Application Number Title Priority Date Filing Date
CN202410791138.1A Pending CN118784870A (zh) 2019-06-18 2020-06-08 视频编码/解码方法和设备以及存储比特流的记录介质
CN202410791137.7A Pending CN118784869A (zh) 2019-06-18 2020-06-08 视频编码/解码方法和设备以及存储比特流的记录介质
CN202410791147.0A Pending CN118784871A (zh) 2019-06-18 2020-06-08 视频编码/解码方法和设备以及存储比特流的记录介质

Country Status (6)

Country Link
US (1) US20220232206A1 (zh)
EP (1) EP3989577A4 (zh)
KR (1) KR20200144480A (zh)
CN (4) CN118784870A (zh)
MX (1) MX2021014605A (zh)
WO (1) WO2020256324A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022186620A1 (ko) * 2021-03-04 2022-09-09 현대자동차주식회사 인트라 예측의 예측 신호를 개선하는 비디오 코딩방법 및 장치
US20230079960A1 (en) * 2021-09-15 2023-03-16 Tencent America LLC On propagating intra prediction mode information of ibc block by using block vector

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102939760A (zh) * 2010-04-05 2013-02-20 三星电子株式会社 用于基于变换和反变换执行内插的方法和设备
CN103765884A (zh) * 2011-06-28 2014-04-30 三星电子株式会社 使用非对称插值滤波器的图像插值的方法及其设备
US20150189276A1 (en) * 2012-07-09 2015-07-02 Nippon Telegraph And Telephone Corporation Video encoding method and apparatus, video decoding method and apparatus, and programs therefor
CN109845265A (zh) * 2016-10-19 2019-06-04 数字洞察力有限公司 使用自适应插值滤波器的视频编码方法及装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6120707B2 (ja) * 2013-07-08 2017-04-26 ルネサスエレクトロニクス株式会社 動画像符号化装置およびその動作方法
CN109792516B (zh) * 2016-10-04 2021-05-25 联发科技股份有限公司 图像和视频编解码中用于帧内色度编解码的方法及装置
CN118660159A (zh) * 2016-10-04 2024-09-17 Lx 半导体科技有限公司 图像编码/解码方法和图像数据的发送方法
CN117041554A (zh) * 2018-10-06 2023-11-10 华为技术有限公司 使用插值滤波器进行帧内预测的方法和装置
CN117915085A (zh) * 2018-10-07 2024-04-19 三星电子株式会社 用于编码或解码视频信号的视频信号处理方法和设备
US11178414B2 (en) * 2019-02-27 2021-11-16 Mediatek Inc. Classification for multiple merge tools
CN118694973A (zh) * 2019-02-28 2024-09-24 数码士有限公司 基于帧内预测的视频信号处理方法和装置
JP7410168B2 (ja) * 2019-03-14 2024-01-09 エルジー エレクトロニクス インコーポレイティド イントラ予測を行う画像符号化/復号方法、装置、およびビットストリームを伝送する方法
WO2020197202A1 (ko) * 2019-03-26 2020-10-01 엘지전자 주식회사 Mpm 리스트에 기반한 인트라 예측 방법 및 그 장치
CN114449265B (zh) * 2019-03-28 2023-07-07 华为技术有限公司 用于帧内平滑的方法和装置
EP3903485A4 (en) * 2019-04-27 2022-03-02 Huawei Technologies Co., Ltd. ENCODER, DECODER AND CORRESPONDING INTRA PREDICTION METHODS
CN113785572B (zh) * 2019-05-02 2022-12-16 北京字节跳动网络技术有限公司 使用多个参考滤波器的帧内视频编解码
CN113892262A (zh) * 2019-05-27 2022-01-04 Sk电信有限公司 帧内模式候选配置方法和视频解码设备
CN113966610A (zh) * 2019-06-11 2022-01-21 韦勒斯标准与技术协会公司 使用块dpcm预测方法的视频信号处理方法和设备
JP7401566B2 (ja) * 2019-06-24 2023-12-19 ヒョンダイ モーター カンパニー 動画データのイントラ予測コーディングのための方法及び記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102939760A (zh) * 2010-04-05 2013-02-20 三星电子株式会社 用于基于变换和反变换执行内插的方法和设备
CN103765884A (zh) * 2011-06-28 2014-04-30 三星电子株式会社 使用非对称插值滤波器的图像插值的方法及其设备
US20150189276A1 (en) * 2012-07-09 2015-07-02 Nippon Telegraph And Telephone Corporation Video encoding method and apparatus, video decoding method and apparatus, and programs therefor
CN109845265A (zh) * 2016-10-19 2019-06-04 数字洞察力有限公司 使用自适应插值滤波器的视频编码方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KENNETH ANDERSSON 等: "CE5-2.1 and CE5-2.2: Deblocking on 4x4 sample grids", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 JVET-O0060-V1 *

Also Published As

Publication number Publication date
KR20200144480A (ko) 2020-12-29
CN118784869A (zh) 2024-10-15
EP3989577A1 (en) 2022-04-27
WO2020256324A1 (ko) 2020-12-24
US20220232206A1 (en) 2022-07-21
CN118784871A (zh) 2024-10-15
EP3989577A4 (en) 2023-07-05
MX2021014605A (es) 2022-01-18
CN113841404B (zh) 2024-07-05
CN118784870A (zh) 2024-10-15

Similar Documents

Publication Publication Date Title
CN112740685B (zh) 图像编码/解码方法和装置以及存储有比特流的记录介质
CN113273213B (zh) 图像编码/解码方法和设备以及存储比特流的记录介质
CN112740686B (zh) 用于帧内预测模式编码/解码的方法和设备以及用于存储比特流的记录介质
CN112335250A (zh) 用于对图像进行编码/解码的方法和设备以及用于存储比特流的记录介质
CN112740680A (zh) 图像编码/解码方法和设备以及存储比特流的记录介质
CN112740697A (zh) 图像编码/解码方法和装置及存储比特流的记录介质
CN112740671A (zh) 图像编码/解码方法和装置以及存储比特流的记录介质
CN113574875A (zh) 基于帧内块复制的编/解码方法和装置及比特流存储介质
CN114342372A (zh) 帧内预测模式、以及熵编解码方法和装置
CN113940077A (zh) 用于视频编码/解码的虚拟边界信令方法和设备
CN112740694A (zh) 用于对图像进行编码/解码的方法和设备以及用于存储比特流的记录介质
CN113228651A (zh) 量化矩阵编码/解码方法和装置以及存储比特流的记录介质
CN113273188A (zh) 图像编码/解码方法和装置以及存储有比特流的记录介质
CN113906740A (zh) 帧间预测信息编码/解码方法和装置
CN113196758A (zh) 图像编码/解码方法和设备以及存储比特流的记录介质
CN113545052A (zh) 图像编码/解码方法和装置以及存储比特流的记录介质
CN112806018A (zh) 图像编码/解码方法和设备以及存储比特流的记录介质
CN113574868A (zh) 图像编码/解码方法和设备以及存储比特流的记录介质
CN113228681A (zh) 图像编码/解码方法和装置以及存储比特流的记录介质
CN114600455A (zh) 图像编码/解码方法和设备以及存储比特流的记录介质
CN113826393A (zh) 图像编码/解码方法和装置以及存储比特流的记录介质
CN113875235A (zh) 图像编码/解码方法和装置及存储比特流的记录介质
CN114503566A (zh) 图像编码/解码方法和设备以及存储比特流的记录介质
CN113841398A (zh) 一种基于子块划分的图像编码/解码方法及装置
CN113906743A (zh) 量化矩阵编码/解码方法和装置、以及存储比特流的记录介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant