CN112385215A - 图像编码/解码方法和装置以及存储比特流的记录介质 - Google Patents

图像编码/解码方法和装置以及存储比特流的记录介质 Download PDF

Info

Publication number
CN112385215A
CN112385215A CN201980045499.9A CN201980045499A CN112385215A CN 112385215 A CN112385215 A CN 112385215A CN 201980045499 A CN201980045499 A CN 201980045499A CN 112385215 A CN112385215 A CN 112385215A
Authority
CN
China
Prior art keywords
block
intra prediction
mode
current block
prediction mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980045499.9A
Other languages
English (en)
Inventor
李镇浩
姜晶媛
李河贤
林成昶
金晖容
金在坤
都志勳
尹庸旭
朴都铉
李英烈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Industry Academy Cooperation Foundation of Sejong University
University Industry Cooperation Foundation of Korea Aerospace University
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Industry Academy Cooperation Foundation of Sejong University
University Industry Cooperation Foundation of Korea Aerospace University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI, Industry Academy Cooperation Foundation of Sejong University, University Industry Cooperation Foundation of Korea Aerospace University filed Critical Electronics and Telecommunications Research Institute ETRI
Publication of CN112385215A publication Critical patent/CN112385215A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供了一种图像编码/解码方法和装置。根据本发明的图像解码方法可包括以下步骤:重建用于指示当前块的帧内预测模式是否为预定帧内预测模式的MFM指示符;基于MFM指示符,推导当前块的帧内预测模式;并且基于所述帧内预测模式通过对当前块执行帧内预测来生成当前块的预测块。

Description

图像编码/解码方法和装置以及存储比特流的记录介质
技术领域
本发明涉及一种图像编码/解码方法和设备。更具体地,本发明涉及一种包括帧内预测模式编码或帧间颜色分量预测的图像编码/解码方法和设备。
背景技术
近来,在各种应用中对诸如高清(HD)或超高清(UHD)图像的高分辨率和高质量图像的需求已经增加。随着图像的分辨率和质量提高,数据量相应地增加。当通过诸如有线或无线宽带信道的现有传输介质传输图像数据时或者当存储图像数据时,这是传输成本和存储成本增加的原因之一。为了解决高分辨率和高质量图像数据的这些问题,需要高效的图像编码/解码技术。
存在各种视频压缩技术,诸如从先前画面或后续画面内的像素的值对当前画面内的像素的值进行预测的帧间预测技术、从当前画面的另一区域内的像素的值对当前画面的区域内的像素的值进行预测的帧内预测技术、压缩残差信号的能量的变换和量化技术、以及将较短的码分配给频繁出现的像素值而将较长的码分配给较少出现的像素值的熵编码技术。
随着帧内预测模式的数量增加,用于用信号发送预测模式的比特开销增加。传统编解码器构建并使用最可能模式(MPM)列表以有效地用信号发送当前块的帧内预测模式。MPM列表由能够很好地以概率方式表示当前块的帧内预测模式的候选预测模式组成,并且较少的二进制位被分配给MPM列表中包括的帧内预测模式,由此实现更有效的用信号发送。
MPM列表包括在确定的位置处的邻近块的模式作为候选模式。然而,当块分区多样化时,邻近块的预测模式也多样化。因此,从确定的位置推导出的模式可能实际上不是以概率方式最频繁出现的模式。
此外,推导当前MPM候选的位置是相对接近的邻近块的位置,使得MPM候选可不包括各种候选。
此外,随着分辨率增加,特定模式的出现概率也增加,并且将被分配给除特定模式之外的模式的二进制位的数量也增加,这对于编码可能是低效的。
在构建MPM列表时,根据邻近块的尺寸/形状不同地分配预测模式的索引,使得针对当前块的候选列表可由与邻近块具有低相关性的模式组成。
在帧间颜色分量预测中,使用固定且受限的参考样点来对线性预测模型进行预测,而不管当前块的尺寸、形状、邻近模式等如何,然后使用这种模型从亮度信号预测色度信号,这可能导致帧间颜色分量预测的性能降级。
在估计用于帧间颜色分量预测的线性模型时,通过仅使用亮度分量的最小值/最大值来推导线性预测模型可能导致帧间颜色分量预测的性能降级。
发明内容
技术问题
本发明的目的在于提供一种具有提高的编码/解码效率的图像编码/解码方法和设备。
本发明的另一目的在于提供一种执行具有提高的性能的帧内预测模式编码的图像编码/解码方法和设备。
本发明的另一目的在于提供一种执行具有提高的性能的帧间颜色分量预测的图像编码/解码方法和设备。
本发明的另一目的在于提供一种存储由本发明的图像编码方法/设备生成的比特流的记录介质。
本发明的另一目的在于提供一种存储比特流的记录介质,其中,所述比特流由根据本发明的图像解码设备接收、解码并使用以重建图像。
技术方案
根据本发明的实施例的图像解码方法可包括:重建指示当前块的帧内预测模式是否为预定帧内预测模式的最频繁模式(MFM)指示符;基于MFM指示符推导当前块的帧内预测模式;并且通过基于所述帧内预测模式对当前块执行帧内预测来生成当前块的预测块。
在根据本发明的图像解码方法中,所述预定帧内预测模式可以是平面模式。
在根据本发明的图像解码方法中,当MFM指示符具有第一值时,可将当前块的帧内预测模式推导为所述预定帧内预测模式。
在根据本发明的图像解码方法中,当MFM指示符具有第二值时,可基于当前块的邻近块的帧内预测模式来构建最可能模式(MPM)列表,并且可基于MPM列表推导当前块的帧内预测模式。
在根据本发明的图像解码方法中,MPM列表可被构建为不包括所述预定帧内预测模式。
在根据本发明的图像解码方法中,当前块的邻近块可包括当前块的右上方块和当前块的左下方块中的至少一个。
在根据本发明的图像解码方法中,当邻近块的帧内预测模式不可用时,可将邻近块的不可用帧内预测模式设置为平面模式。
在根据本发明的图像解码方法中,MPM列表可包括五个MPM候选。
在根据本发明的图像解码方法中,所述方法还可包括:重建指示当前块的帧内预测模式是否被包括在MPM列表中的MPM指示符,并且仅当MPM指示符具有第一值时,可从比特流重建MFM指示符。
在根据本发明的图像解码方法中,可选择多条参考样点线中的一条以执行帧内预测,并且仅当所选择的参考样点线是第一参考样点线时,可对所述参考样点线执行滤波。
根据本发明的另一实施例的图像编码方法可包括:确定当前块的帧内预测模式,通过基于所述帧内预测模式对当前块执行帧内预测来生成当前块的预测块,确定当前块的帧内预测模式是否为预定帧内预测模式,并且基于确定的结果,对最频繁模式(MFM)指示符进行编码。
在根据本发明的图像编码方法中,所述预定帧内预测模式可以是平面模式。
在根据本发明的图像编码方法中,当当前块的帧内预测模式是所述预定模式时,可将MFM指示符编码为第一值。
在根据本发明的图像编码方法中,当当前块的帧内预测模式不是所述预定模式时,可将MFM指示符编码为第二值,可基于当前块的邻近块的帧内预测模式来构建最可能模式(MPM)列表,并且可基于MPM列表对当前块的帧内预测模式进行编码。
在根据本发明的图像编码方法中,MPM列表可被构建为不包括所述预定帧内预测模式。
在根据本发明的图像编码方法中,当前块的邻近块可包括当前块的右上方块和当前块的左下方块中的至少一个。
在根据本发明的图像编码方法中,当邻近块的帧内预测模式不可用时,可将邻近块的不可用帧内预测模式设置为平面模式。
在根据本发明的图像编码方法中,所述方法还可包括:对指示当前块的帧内预测模式是否被包括在MPM列表中的MPM指示符进行编码,并且其中,仅当MPM指示符具有第一值时,可对MFM指示符进行编码。
根据本发明的另一实施例的计算机可读记录介质可以是存储比特流的计算机可读记录介质,其中,所述比特流由图像解码设备接收、解码并使用以重建图像,所述比特流可包括指示当前块的帧内预测模式是否为预定帧内预测模式的最频繁模式(MFM)指示符,MFM指示符可被用于推导当前块的帧内预测模式,并且所述帧内预测模式可被用于通过对当前块执行帧内预测来生成当前块的预测块。
根据本发明的另一实施例的计算机可读记录介质可存储由根据本发明的图像编码方法和/或设备生成的比特流。
有益效果
根据本发明,可提供一种具有提高的编码/解码效率的图像编码/解码方法和设备。
根据本发明,可提供一种执行具有提高的性能的帧内预测模式编码的图像编码/解码方法和设备。
根据本发明,可提供一种执行具有提高的性能的帧间颜色分量预测的图像编码/解码方法和设备。
根据本发明,可提供一种存储由本发明的图像编码方法/设备生成的比特流的记录介质。
根据本发明,可提供一种存储比特流的记录介质,其中,所述比特流由根据本发明的图像解码设备接收到、解码并使用以重建图像。
附图说明
图1是示出根据应用了本发明的实施例的编码设备的配置的框图。
图2是示出根据应用了本发明的实施例的解码设备的配置的框图。
图3是示意性地示出当对图像进行编码和解码时图像的分区结构的示图。
图4是示出帧内预测处理的示图。
图5是示出画面间预测处理的实施例的示图。
图6是示出变换和量化处理的示图。
图7是示出能够被用于帧内预测的参考样点的示图。
图8是示出根据本发明的实施例的帧内预测编码/解码的示图。
图9是示出通过使用子块来推导帧内预测模式的方法的示图。
图10是示出确定MFM的示例的示图。
图11是示出当前块的空间邻近块的示图。
图12是示出当前块的时间邻近块的示图。
图13是示出用于构建MPM列表的可用邻近块的示图。
图14是示出邻近块的部分位置的示图。
图15是示出使用可用样点来替换不可用样点的示例的示图。
图16是示出确定针对帧间颜色分量预测的线性参数的方法的示图。
图17是示出对帧内预测模式的方向进行分类的示例的示图。
图18是示出根据帧内预测模式构建参考样点的方法的示图。
图19是示出根据邻近块的预测模式构建线性模型的方法的示图。
图20是示出根据帧内预测模式的参考样点集的示图。
图21是示出方向根据当前块的模式编号和邻近块的模式编号而变化的示例的示图。
图22是示出表示针对扩展的方向角度的预测模式的模式编号的示图
图23是示出通过根据当前块改变邻近块的预测模式来构建MPM列表的示例的示图。
图24是示出通过根据当前块改变邻近块的预测模式来构建MPM列表的另一示例的示图。
图25是示出用于推导MPM候选的邻近块的位置的示例的示图。
图26是示出用于推导MPM候选的邻近块的位置的另一示例的示图。
图27是示出在确定帧内预测模式时使用MFM和MPM的示例的示图。
图28是示出在对MPM候选和MFM候选执行ISP方法的情况下的帧内预测模式确定方法的示例的示图。
图29是示出在对MPM候选和MFM候选执行ISP方法的情况下的帧内预测模式确定方法的另一示例的示图。
具体实施方式
可对本发明进行各种修改,并且存在本发明的各种实施例,其中,现在将参照附图提供并详细描述本发明的各种实施例的示例。然而,虽然示例性实施例可被解释为包括本发明的技术构思和技术范围中的所有修改、等同或替代,但是本发明不限于此。相似的附图标号指代在各个方面的相同或相似的功能。在附图中,为了清楚起见,元件的形状和尺寸可被夸大。在本发明的以下详细描述中,参照通过说明的方式示出可实践本发明的具体实施例的附图。充分详细地描述这些实施例以使得本领域技术人员能够实现本公开。应理解,本公开的各种实施例虽然不同,但是不必相互排斥。例如,在不脱离本公开的精神和范围的情况下,这里结合一个实施例描述的特定特征、结构和特性可在其他实施例内实现。此外,应理解,在不脱离本公开的精神和范围的情况下,可修改每个公开的实施例内的各个元件的位置或布置。因此,以下详细描述不应被认为是限制意义的,并且本公开的范围仅由适当解释的所附权利要求以及权利要求所要求保护的等同物的全部范围来限定。
在说明书中使用的术语“第一”、“第二”等可被用于描述各种组件,但是组件不应被解释为限于该术语。该术语仅被用于将一个组件与其它组件区分开。例如,在不脱离本发明的范围的情况下,“第一”组件可被称为“第二”组件,并且“第二”组件也可类似地被称为“第一”组件。术语“和/或”包括多个项的组合或多个术语中的任意一个。
将理解,当元件在本说明书中被简单地称为“连接到”或“耦接到”另一元件而非“直接连接到”或“直接耦接到”另一元件时,它可“直接连接到”或“直接耦接到”另一元件,或者在有其它元件介于该元件与另一元件之间的情况下被连接到或耦接到另一元件。相反,应理解,当元件被称为“直接耦接”或“直接连接”到另一元件时,不存在中间元件。
此外,在本发明的实施例中所示的构成部件被独立地示出,以便表示彼此不同的特性功能。因此,这不表示各个构成部件以分离的硬件或软件为构成单元来构成。换句话说,为了方便,各个构成部件包括所列举的构成部件中的每一个。因此,可将各个构成部件中的至少两个构成部件组合以形成一个构成部件,或者可将一个构成部件划分为多个构成部件以执行每个功能。若不脱离本发明的本质,将各个构成部件组合的实施例以及对一个构成部件划分的实施例也被包括在本发明的范围内。
本说明书中使用的术语仅被用于描述特定实施例,而不旨在限制本发明。以单数形式使用的表达涵盖复数形式的表达,除非它在上下文中具有明显不同的含义。在本说明书中,需理解的是,诸如“包括”、“具有”等的术语旨在指示说明书中所公开的特征、数字、步骤、动作、元件、部件或其组合的存在,而不旨在排除可存在或可添加一个或更多个其他特征、数字、步骤、动作、元件、部件或其组合的可能性。换句话说,当特定元件被称为“被包括”时,不排除除了对应元件之外的元件,而是可在本发明的实施例或本发明的范围中包括附加元件。
此外,一些构件可以不是执行本发明的必要功能的不可缺少的构件,而是仅改善其性能的选择性构件。可通过仅包括除了用于改善性能的构件之外的用于实现本发明的本质的不可缺少的构成部件来实现本发明。仅包括除了用于仅改善性能的选择性构件之外的不可缺少的构件的结构也被包括在本发明的范围内。
在下文中,将参照附图详细描述本发明的实施例。在描述本发明的示例性实施例时,由于公知的功能或结构可能不必要地使对本发明的理解模糊不清,因此将不详细描述公知的功能或结构。附图中的相同的构成元件由相同的附图标号表示,并且将省略对相同元件的重复描述。
在下文中,图像可表示构成视频的画面,或者可表示视频本身。例如,“图像的编码或解码或者编码和解码两者”可表示“运动画面的编码或解码或者编码和解码两者”,并且可表示“运动画面的多个图像中的一个图像的编码或解码或者编码和解码两者”。
在下文中,术语“运动画面”和“视频”可被用作相同的含义并且彼此替换。
在下文中,目标图像可以是作为编码的目标的编码目标图像和/或作为解码的目标的解码目标图像。此外,目标图像可以是输入到编码设备的输入图像以及输入到解码设备的输入图像。这里,目标图像可与当前图像具有相同的含义。
在下文中,术语“图像”、“画面”、“帧”和“屏幕”可被用作相同的含义并且彼此替换。
在下文中,目标块可以是作为编码的目标的编码目标块和/或作为解码的目标的解码目标块。此外,目标块可以是作为当前编码和/或解码的目标的当前块。例如,术语“目标块”和“当前块”可被用作相同的含义并且彼此替换。
在下文中,术语“块”和“单元”可被用作相同的含义并且彼此替换。或者,“块”可表示特定单元。
在下文中,术语“区域”和“片段”可被彼此替换。
在下文中,特定信号可以是表示特定块的信号。例如,原始信号可以是表示目标块的信号。预测信号可以是表示预测块的信号。残差信号可以是表示残差块的信号。
在实施例中,特定信息、数据、标志、索引、元素和属性等中的每一个可具有值。信息、数据、标志、索引、元素和属性的值等于“0”可表示逻辑假或第一预定义值。换句话说,值“0”、假、逻辑假和第一预定义值可被彼此替换。信息、数据、标志、索引、元素和属性的值等于“1”可表示逻辑真或第二预定义值。换句话说,值“1”、真、逻辑真和第二预定义值可被彼此替换。
当变量i或j被用于表示列、行或索引时,i的值可以是等于或大于0或者等于或大于1的整数。也就是说,列、行、索引等可从0开始计数或者可从1开始计数。
术语的描述
编码器:表示执行编码的设备。即,表示编码设备。
解码器:表示执行解码的设备。即,表示解码设备。
块:是样点的M×N的阵列。这里,M和N可表示正整数,并且块可表示二维形式的样点阵列。块可指代单元。当前块可表示在编码时成为目标的编码目标块,或者在解码时成为目标的解码目标块。此外,当前块可以是编码块、预测块、残差块和变换块中的至少一个。
样点:是构成块的基本单元。可根据比特深度(Bd)将样点表示为从0至2Bd-1的值。在本发明中,样点可被用作像素的含义。也就是说,样点、pel、像素可具有彼此相同的含义。
单元:可指编码单元和解码单元。当对图像进行编码和解码时,单元可以是通过对单个图像进行分区而生成的区域。此外,当在编码或解码期间将单个图像分区为子划分单元时,单元可表示子划分单元。也就是说,可将图像分区为多个单元。当对图像进行编码和解码时,可执行针对每个单元的预定处理。单个单元可被分区为具有比该单元的尺寸小的尺寸的子单元。根据功能,单元可表示块、宏块、编码树单元、编码树块、编码单元、编码块、预测单元、预测块、残差单元、残差块、变换单元、变换块等。此外,为了将单元与块区分开,单元可包括亮度分量块、与亮度分量块相关联的色度分量块以及每个颜色分量块的语法元素。单元可具有各种尺寸和形式,并且特别地,单元的形式可以是诸如正方形形状、矩形形状、梯形形状、三角形形状、五边形形状等的二维几何图形。此外,单元信息可包括指示编码单元、预测单元、变换单元等的单元类型以及单元尺寸、单元深度、单元的编码和解码的顺序等中的至少一个。
编码树单元:被配置有亮度分量Y的单个编码树块以及与色度分量Cb和Cr相关的两个编码树块。此外,编码树单元可表示包括块和每个块的语法元素。可通过使用四叉树分区方法、二叉树分区方法和三叉树分区方法中的至少一种来对每个编码树单元进行分区,以配置诸如编码单元、预测单元、变换单元等的更低等级的单元。编码树单元可被用作用于指定当对作为输入图像的图像进行编码/解码时成为处理单元的样点块的术语。这里,四叉树可表示四元树。
当编码块的尺寸在预定范围内时,可仅使用四叉树分区进行划分。这里,所述预定范围可被定义为可仅使用四叉树分区进行划分的编码块的最大尺寸和最小尺寸中的至少一个。指示允许进行四叉树分区的编码块的最大/最小尺寸的信息可通过比特流被用信号发送,并且可以以序列、画面参数、并行块组或条带(片段)中的至少一个为单位用信号发送所述信息。可选地,编码块的最大/最小尺寸可以是编码器/解码器中预定的固定尺寸。例如,当编码块的尺寸对应于256×256至64×64时,可仅使用四叉树分区进行划分。可选地,当编码块的尺寸大于最大变换块的尺寸时,可仅使用四叉树分区进行划分。这里,将被划分的块可以是编码块和变换块中的至少一个。在这种情况下,指示编码块的划分的信息(例如,split_flag)可以是指示是否执行四叉树分区的标志。当编码块的尺寸落在预定范围内时,可仅使用二叉树或三叉树分区进行划分。在这种情况下,四叉树分区的以上描述可以以相同方式被应用于二叉树分区或三叉树分区。
编码树块:可被用作用于指定Y编码树块、Cb编码树块和Cr编码树块中的任意一个的术语。
邻近块:可表示与当前块相邻的块。与当前块相邻的块可表示与当前块的边界接触的块,或者距当前块位于预定距离内的块。邻近块可表示与当前块的顶点相邻的块。这里,与当前块的顶点相邻的块可表示与水平相邻于当前块的邻近块垂直相邻的块,或者与垂直相邻于当前块的邻近块水平相邻的块。
重建的邻近块:可表示与当前块相邻且已经在空间/时间上被编码或解码的邻近块。这里,重建的邻近块可表示重建的邻近单元。重建的空间邻近块可以是当前画面内的且已经通过编码或解码或者编码和解码两者被重建的块。重建的时间邻近块是参考图像内的与当前画面的当前块对应的位置处的块或该块的邻近块。
单元深度:可表示单元的分区程度。在树结构中,最高节点(根节点)可与未被分区的第一单元对应。此外,最高节点可具有最小深度值。在这种情况下,最高节点可具有等级0的深度。深度为等级1的节点可表示通过对第一单元进行一次分区而生成的单元。深度为等级2的节点可表示通过对第一单元进行两次分区而生成的单元。深度为等级n的节点可表示通过对第一单元进行n次分区而生成的单元。叶节点可以是最低节点和不能被进一步分区的节点。叶节点的深度可以是最大等级。例如,最大等级的预定义值可以是3。根节点的深度可以是最低的,并且叶节点的深度可以是最深的。此外,当单元被表达为树结构时,单元所在的等级可表示单元深度。
比特流:可表示包括编码图像信息的比特流。
参数集:与比特流内的配置中的头信息对应。视频参数集、序列参数集、画面参数集和自适应参数集中的至少一个可被包括在参数集中。此外,参数集可包括条带头、并行块组头和并行块头信息。术语“并行块组”表示一组并行块并且与条带具有相同的含义。
解析:可表示通过执行熵解码来确定语法元素的值,或者可表示熵解码本身。
符号:可表示编码/解码目标单元的语法元素、编码参数和变换系数值中的至少一个。此外,符号可表示熵编码目标或熵解码结果。
预测模式:可以是指示利用帧内预测进行编码/解码的模式或利用帧间预测进行编码/解码的模式的信息。
预测单元:可表示当执行预测(诸如帧间预测、帧内预测、帧间补偿、帧内补偿和运动补偿)时的基本单元。单个预测单元可被分区为具有更小尺寸的多个分区,或者可被分区为多个更低等级的预测单元。多个分区可以是在执行预测或补偿时的基本单元。通过划分预测单元而生成的分区也可以是预测单元。
预测单元分区:可表示通过对预测单元进行分区而获得的形式。
参考画面列表可指包括用于帧间预测或运动补偿的一个或更多个参考画面的列表。存在多种类型的可用参考画面列表,包括LC(列表组合)、L0(列表0)、L1(列表1)、L2(列表2)、L3(列表3)。
帧间预测指示符可指当前块的帧间预测(单向预测、双向预测等)的方向。可选地,它可指用于生成当前块的预测块的参考画面的数量。可选地,它可指在对当前块执行帧间预测或运动补偿时使用的预测块的数量。
预测列表利用标志指示是否使用特定参考画面列表中的至少一个参考画面来生成预测块。可使用预测列表利用标志来推导帧间预测指示符,并且相反地,可使用帧间预测指示符来推导预测列表利用标志。例如,当预测列表利用标志具有第一值零(0)时,这表示参考画面列表中的参考画面不被用于生成预测块。另一方面,当预测列表利用标志具有第二值一(1)时,这表示参考画面列表被用于生成预测块。
参考画面索引可指指示参考画面列表中的特定参考画面的索引。
参考画面可表示为了特定块的帧间预测或运动补偿的目的而由特定块参考的参考画面。可选地,参考画面可以是包括由当前块参考以进行帧间预测或运动补偿的参考块的画面。在下文中,术语“参考画面”和“参考图像”具有相同的含义并且可被互换。
运动矢量可以是用于帧间预测或运动补偿的二维矢量。运动矢量可表示编码/解码目标块与参考块之间的偏移。例如,(mvX,mvY)可表示运动矢量。此处,mvX可表示水平分量,并且mvY可表示垂直分量。
搜索范围可以是被搜索以在帧间预测期间检索运动矢量的二维区域。例如,搜索范围的尺寸可以是M×N。这里,M和N都是整数。
当对运动矢量进行预测时,运动矢量候选可指预测候选块或预测候选块的运动矢量。此外,运动矢量候选可被包括在运动矢量候选列表中。
运动矢量候选列表可表示由一个或更多个运动矢量候选组成的列表。
运动矢量候选索引可表示指示运动矢量候选列表中的运动矢量候选的指示符。可选地,运动矢量候选索引可以是运动矢量预测因子的索引。
运动信息可表示包括以下项中的至少一项的信息,其中,所述项包括运动矢量、参考画面索引、帧间预测指示符、预测列表利用标志、参考画面列表信息、参考画面、运动矢量候选、运动矢量候选索引、合并候选和合并索引。
合并候选列表可表示由一个或更多个合并候选组成的列表。
合并候选可表示空间合并候选、时间合并候选、组合合并候选、组合双预测合并候选或零合并候选。合并候选可包括运动信息,诸如帧间预测指示符、针对每个列表的参考画面索引、运动矢量、预测列表利用标志和帧间预测指示符。
合并索引可表示指示合并候选列表中的合并候选的指示符。可选地,合并索引可指示空间上/时间上与当前块相邻的重建块中的已推导出合并候选的块。可选地,合并索引可指示合并候选的至少一条运动信息。
变换单元:可表示当执行编码/解码(诸如残差信号的变换、逆变换、量化、反量化、变换系数编码/解码)时的基本单元。单个变换单元可被分区为具有更小尺寸的多个更低等级的变换单元。这里,变换/逆变换可包括首次变换/首次逆变换和二次变换/二次逆变换中的至少一个。
缩放:可表示将量化的等级乘以因子的处理。可通过对量化的等级进行缩放来生成变换系数。缩放还可被称为反量化。
量化参数:可表示当在量化期间使用变换系数来生成量化的等级时所使用的值。量化参数还可表示当在反量化期间通过对量化的等级进行缩放来生成变换系数时所使用的值。量化参数可以是映射在量化步长上的值。
差量量化参数:可表示编码/解码目标单元的预测的量化参数与量化参数之间的差值。
扫描:可表示对单元、块或矩阵内的系数进行排序的方法。例如,将系数的二维矩阵改变为一维矩阵可被称为扫描,并且将系数的一维矩阵改变为二维矩阵可被称为扫描或逆扫描。
变换系数:可表示在编码器中执行变换之后生成的系数值。变换系数可表示在解码器中执行熵解码和反量化中的至少一个之后生成的系数值。通过对变换系数或残差信号进行量化而获得的量化的等级或者量化的变换系数等级也可落入变换系数的含义内。
量化的等级:可表示通过在编码器中对变换系数或残差信号进行量化而生成的值。可选地,量化的等级可表示作为在解码器中经历反量化的反量化目标的值。类似地,作为变换和量化的结果的量化的变换系数等级也可落入量化的等级的含义内。
非零变换系数:可表示具有除了零之外的值的变换系数或者具有除了零之外的值的变换系数等级或量化的等级。
量化矩阵:可表示在为了提高主观或客观图像质量而执行的量化处理或反量化处理中所使用的矩阵。量化矩阵还可被称为缩放列表。
量化矩阵系数:可表示量化矩阵内的每个元素。量化矩阵系数还可被称为矩阵系数。
默认矩阵:可表示在编码器或解码器中预先定义的预定量化矩阵。
非默认矩阵:可表示未在编码器或解码器中预先定义但由用户用信号发送的量化矩阵。
统计值:针对具有可计算的特定值的变量、编码参数、常数值等中的至少一个的统计值可以是对应特定值的平均值、和值、加权平均值、加权和值、最小值、最大值、最频繁值、中值、插值中的一个或更多个。
图1是示出根据应用了本发明的实施例的编码设备的配置的框图。
编码设备100可以是编码器、视频编码设备或图像编码设备。视频可包括至少一个图像。编码设备100可顺序地对至少一个图像进行编码。
参照图1,编码设备100可包括运动预测单元111、运动补偿单元112、帧内预测单元120、切换器115、减法器125、变换单元130、量化单元140、熵编码单元150、反量化单元160、逆变换单元170、加法器175、滤波器单元180和参考画面缓冲器190。
编码设备100可通过使用帧内模式或帧间模式或者帧内模式和帧间模式两者来执行输入图像的编码。此外,编码设备100可通过对输入图像进行编码来生成包括经过编码的信息的比特流,并输出生成的比特流。生成的比特流可被存储在计算机可读记录介质中,或者可通过有线/无线传输介质被流传输。当帧内模式被用作预测模式时,切换器115可被切换到帧内。可选地,当帧间模式被用作预测模式时,切换器115可被切换到帧间模式。这里,帧内模式可表示帧内预测模式,并且帧间模式可表示帧间预测模式。编码设备100可针对输入图像的输入块生成预测块。此外,编码设备100可在预测块被生成之后使用预测块与输入块的残差对残差块进行编码。输入图像可被称为作为当前编码目标的当前图像。输入块可被称为作为当前编码目标的当前块,或者被称为编码目标块。
当预测模式是帧内模式时,帧内预测单元120可将已被编码/解码且与当前块相邻的块的样点用作参考样点。帧内预测单元120可通过使用参考样点针对当前块执行空间预测,或者通过执行空间预测来生成输入块的预测样点。这里,帧内预测可表示帧内的预测。
当预测模式是帧间模式时,运动预测单元111可在执行运动预测时从参考图像检索与输入块最佳匹配的区域,并且通过使用检索到的区域来推导运动矢量。在这种情况下,搜索区域可被用作该区域。参考图像可被存储在参考画面缓冲器190中。这里,当执行针对参考图像的编码/解码时,参考图像可被存储在参考画面缓冲器190中。
运动补偿单元112可通过使用运动矢量针对当前块执行运动补偿来生成预测块。这里,帧间预测可表示帧间的预测或运动补偿。
当运动矢量的值不是整数时,运动预测单元111和运动补偿单元112可通过将插值滤波器应用于参考画面的部分区域来生成预测块。为了对编码单元执行画面间预测或运动补偿,可确定跳过模式、合并模式、高级运动矢量预测(AMVP)模式和当前画面参考模式中的哪一种模式被用于包括在对应编码单元中的预测单元的运动预测和运动补偿。然后,可根据所确定的模式不同地执行画面间预测或运动补偿。
减法器125可通过使用预测块和输入块的差来生成残差块。残差块可被称为残差信号。残差信号可表示原始信号与预测信号之间的差。此外,残差信号可以是通过对原始信号与预测信号之间的差进行变换或量化或者变换和量化而生成的信号。残差块可以是块单元的残差信号。
变换单元130可通过执行残差块的变换来生成变换系数,并输出所生成的变换系数。这里,变换系数可以是通过执行残差块的变换而生成的系数值。当变换跳过模式被应用时,变换单元130可跳过残差块的变换。
可通过将量化应用于变换系数或残差信号来生成量化的等级。在下文中,量化的等级在实施例中还可被称为变换系数。
量化单元140可通过根据参数对变换系数或残差信号进行量化来生成量化的等级,并输出所生成的量化的等级。这里,量化单元140可通过使用量化矩阵来对变换系数进行量化。
熵编码单元150可通过根据概率分布对由量化单元140计算出的值或对在执行编码时计算出的编码参数值执行熵编码来生成比特流,并输出所生成的比特流。熵编码单元150可执行对图像的样点信息和用于对图像进行解码的信息的熵编码。例如,用于对图像进行解码的信息可包括语法元素。
当熵编码被应用时,符号被表示为使得将较小数量的比特分配给具有高生成机会的符号并将较大数量的比特分配给具有低生成机会的符号,因此,可减小针对将被编码的符号的比特流的大小。熵编码单元150可使用用于熵编码的编码方法,诸如指数Golomb、上下文自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等。例如,熵编码单元150可通过使用可变长度编码/码(VLC)表来执行熵编码。此外,熵编码单元150可推导目标符号的二值化方法以及目标符号/二进制位的概率模型,并且通过使用推导出的二值化方法和上下文模型来执行算术编码。
为了对变换系数等级(量化的等级)进行编码,熵编码单元150可通过使用变换系数扫描方法将二维块形式的系数改变为一维矢量形式。
编码参数可包括诸如在编码器中被编码并被用信号发送到解码器的语法元素的信息(标志、索引等)以及在执行编码或解码时推导出的信息。编码参数可表示在对图像进行编码或解码时所需的信息。例如,以下项中的至少一个值或组合形式可被包括在编码参数中:单元/块尺寸、单元/块深度、单元/块分区信息、单元/块形状、单元/块分区结构、是否进行四叉树形式的分区、是否进行二叉树形式的分区、二叉树形式的分区方向(水平方向或垂直方向)、二叉树形式的分区形式(对称分区或非对称分区)、是否通过三叉树分区对当前编码单元进行分区、三叉树分区的方向(水平方向或垂直方向)、三叉树分区的类型(对称分区或非对称分区)、是否通过多类型树分区对当前编码单元进行分区、多类型树分区的方向(水平方向或垂直方向)、多类型树分区的类型(对称分区或非对称分区)、多类型树分区的树结构(二叉树或三叉树)、预测模式(帧内预测或帧间预测)、亮度帧内预测模式/方向、色度帧内预测模式/方向、帧内分区信息、帧间分区信息、编码块分区标志、预测块分区标志、变换块分区标志、参考样点滤波方法、参考样点滤波器抽头、参考样点滤波器系数、预测块滤波方法、预测块滤波器抽头、预测块滤波器系数、预测块边界滤波方法、预测块边界滤波器抽头、预测块边界滤波器系数、帧内预测模式、帧间预测模式、运动信息、运动矢量、运动矢量差、参考画面索引、帧间预测角度、帧间预测指示符、预测列表利用标志、参考画面列表、参考画面、运动矢量预测因子索引、运动矢量预测因子候选、运动矢量候选列表、是否使用合并模式、合并索引、合并候选、合并候选列表、是否使用跳过模式、插值滤波器类型、插值滤波器抽头、插值滤波器系数、运动矢量大小、运动矢量的表示精度、变换类型、变换尺寸、是否使用初次(首次)变换的信息、是否使用二次变换的信息、初次变换索引、二次变换索引、是否存在残差信号的信息、编码块样式、编码块标志(CBF)、量化参数、量化参数残差、量化矩阵、是否应用帧内环路滤波器、帧内环路滤波器系数、帧内环路滤波器抽头、帧内环路滤波器形状/形式、是否应用去块滤波器、去块滤波器系数、去块滤波器抽头、去块滤波器强度、去块滤波器形状/形式、是否应用自适应样点偏移、自适应样点偏移值、自适应样点偏移类别、自适应样点偏移类型、是否应用自适应环路滤波器、自适应环路滤波器系数、自适应环路滤波器抽头、自适应环路滤波器形状/形式、二值化/逆二值化方法、上下文模型确定方法、上下文模型更新方法、是否执行常规模式、是否执行旁路模式、上下文二进制位、旁路二进制位、有效系数标志、最后有效系数标志、针对系数组的单元的编码标志、最后有效系数的位置、针对系数值是否大于1的标志、针对系数值是否大于2的标志、针对系数值是否大于3的标志、关于其余系数值的信息、符号信息、重建的亮度样点、重建的色度样点、残差亮度样点、残差色度样点、亮度变换系数、色度变换系数、量化的亮度等级、量化的色度等级、变换系数等级扫描方法、在解码器侧的运动矢量搜索区域的大小、在解码器侧的运动矢量搜索区域的形状、在解码器侧的运动矢量搜索的次数、关于CTU尺寸的信息、关于最小块尺寸的信息、关于最大块尺寸的信息、关于最大块深度的信息、关于最小块深度的信息、图像显示/输出顺序、条带识别信息、条带类型、条带分区信息、并行块识别信息、并行块类型、并行块分区信息、并行块组识别信息、并行块组类型、并行块组分区信息、画面类型、输入样点的比特深度、重建样点的比特深度、残差样点的比特深度、变换系数的比特深度、量化的等级的比特深度、以及关于亮度信号的信息或关于色度信号的信息。
这里,用信号发送标志或索引可表示对应标志或索引由编码器熵编码并被包括在比特流中,并且可表示对应标志或索引由解码器从比特流熵解码。
当编码设备100通过帧间预测执行编码时,经过编码的当前图像可被用作针对随后被处理的另一图像的参考图像。因此,编码设备100可对经过编码的当前图像进行重建或解码,或者将重建的或经过解码的图像作为参考图像存储在参考画面缓冲器190中。
量化的等级可在反量化单元160中被反量化,或者可在逆变换单元170中被逆变换。可通过加法器175将经过反量化的系数或经过逆变换的系数或者经过反量化和逆变换两者的系数与预测块相加。通过将经过反量化的系数或经过逆变换的系数或者经过反量化和逆变换两者的系数与预测块相加,可生成重建块。这里,经过反量化的系数或经过逆变换的系数或者经过反量化和逆变换两者的系数可表示被执行反量化和逆变换中的至少一个的系数,并且可表示重建的残差块。
重建块可通过滤波器单元180。滤波器单元180可将去块滤波器、样点自适应偏移(SAO)和自适应环路滤波器(ALF)中的至少一个应用于重建样点、重建块或重建图像。滤波器单元180可被称为环内滤波器。
去块滤波器可去除在块之间的边界中生成的块失真。为了确定是否应用去块滤波器,可基于包括在块中的若干行或列中所包括的样点来确定是否将去块滤波器应用于当前块。当去块滤波器被应用于块时,可根据所需的去块滤波强度来应用另一滤波器。
为了补偿编码误差,可通过使用样点自适应偏移将适当的偏移值与样点值相加。样点自适应偏移可按样点单元校正经过去块的图像与原始图像的偏移。将图像的样点分区为预定数量的区域、确定被应用偏移的区域并将该偏移应用于所确定的区域的方法或者考虑关于每个样点的边缘信息来应用偏移的方法可被使用。
自适应环路滤波器可基于经过滤波的重建图像与原始图像的比较结果来执行滤波。包括在图像中的样点可被分区为预定组,可确定将被应用于每个组的滤波器,并且可针对每个组执行差分滤波。可按编码单元(CU)用信号发送是否应用ALF的信息,并且将被应用于每个块的ALF的形式和系数可变化。
已通过滤波器单元180的重建块或重建图像可被存储在参考画面缓冲器190中。由滤波器单元180处理的重建块可以是参考图像的一部分。也就是说,参考图像是由经过滤波器单元180处理的重建块组成的重建图像。可稍后在帧间预测或运动补偿中使用存储的参考图像。
图2是示出根据实施例的且应用了本发明的解码设备的配置的框图。
解码设备200可以是解码器、视频解码设备或图像解码设备。
参照图2,解码设备200可包括熵解码单元210、反量化单元220、逆变换单元230、帧内预测单元240、运动补偿单元250、加法器225、滤波器单元260和参考画面缓冲器270。
解码设备200可接收从编码设备100输出的比特流。解码设备200可接收存储在计算机可读记录介质中的比特流,或者可接收通过有线/无线传输介质被流传输的比特流。解码设备200可通过使用帧内模式或帧间模式对比特流进行解码。此外,解码设备200可生成通过解码生成的重建图像或经过解码的图像,并输出重建图像或经过解码的图像。
当在解码时使用的预测模式是帧内模式时,可将切换器切换到帧内。可选地,当在解码时使用的预测模式是帧间模式时,可将切换器切换到帧间模式。
解码设备200可通过对输入的比特流进行解码来获得重建的残差块,并生成预测块。当获得重建的残差块和预测块时,解码设备200可通过将重建的残差块与预测块相加来生成成为解码目标的重建块。解码目标块可被称为当前块。
熵解码单元210可通过根据概率分布对比特流进行熵解码来生成符号。所生成的符号可包括量化的等级形式的符号。这里,熵解码方法可以是上述熵编码方法的逆过程。
为了对变换系数等级(量化的等级)进行解码,熵解码单元210可通过使用变换系数扫描方法将单向矢量形式的系数改变为二维块形式。
量化的等级可在反量化单元220中被反量化,或者可在逆变换单元230中被逆变换。量化的等级可以是反量化或逆变换或者反量化和逆变换两者的结果,并且可被生成为重建的残差块。这里,反量化单元220可将量化矩阵应用于量化的等级。
当帧内模式被使用时,帧内预测单元240可通过针对当前块执行空间预测来生成预测块,其中,所述空间预测使用与解码目标块相邻且已被解码的块的样点值。
当帧间模式被使用时,运动补偿单元250可通过针对当前块执行运动补偿来生成预测块,其中,所述运动补偿使用存储在参考画面缓冲器270中的参考图像和运动矢量。
加法器225可通过将重建的残差块与预测块相加来生成重建块。滤波器单元260可将去块滤波器、样点自适应偏移和自适应环路滤波器中的至少一个应用于重建块或重建图像。滤波器单元260可输出重建图像。重建块或重建图像可被存储在参考画面缓冲器270中,并且在执行帧间预测时被使用。由滤波器单元260处理的重建块可以是参考图像的一部分。也就是说,参考图像是由经过滤波器单元260处理的重建块组成的重建图像。可稍后在帧间预测或运动补偿中使用存储的参考图像。
图3是示意性地示出当对图像进行编码和解码时图像的分区结构的示图。图3示意性地示出将单个单元分区为多个更低等级的单元的示例。
为了高效地对图像进行分区,当进行编码和解码时,可使用编码单元(CU)。当对图像进行编码/解码时,编码单元可被用作基本单元。此外,当对图像进行编码/解码时,编码单元可被用作用于将帧内预测模式和帧间预测模式区分开的单元。编码单元可以是用于变换系数的预测、变换、量化、逆变换、反量化或编码/解码处理的基本单元。
参照图3,图像300按最大编码单元(LCU)被顺序地分区,并且LCU单元被确定为分区结构。这里,可以以与编码树单元(CTU)相同的含义使用LCU。单元分区可表示对与该单元相关联的块进行分区。在块分区信息中,可包括单元深度的信息。深度信息可表示单元被分区的次数或程度或者次数和程度两者。可基于树结构将单个单元分区为分层地与深度信息相关联的多个更低等级的单元。换句话说,单元和通过对该单元进行分区而生成的更低等级的单元可分别与节点和该节点的子节点对应。分区出的更低等级的单元中的每一个可具有深度信息。深度信息可以是表示CU的尺寸的信息,并且可被存储在每个CU中。单元深度表示与对单元进行分区相关的次数和/或程度。因此,更低等级的单元的分区信息可包括关于更低等级的单元的尺寸的信息。
分区结构可表示LCU 310内的编码单元(CU)的分布。可根据是否将单个CU分区为多个(等于或大于2的正整数,包括2、4、8、16等)CU来确定这样的分布。通过分区生成的CU的水平尺寸和垂直尺寸可分别是分区之前的CU的水平尺寸和垂直尺寸的一半,或者可根据分区的次数分别具有比分区之前的水平尺寸和垂直尺寸小的尺寸。CU可被递归地分区为多个CU。通过递归分区,与分区之前的CU的高度和宽度中的至少一个相比,分区之后的CU的高度和宽度中的至少一个可减小。可递归地执行CU的分区直到预定义深度或预定义尺寸为止。例如,LCU的深度可以是0,并且最小编码单元(SCU)的深度可以是预定义的最大深度。这里,如上所述,LCU可以是具有最大编码单元尺寸的编码单元,SCU可以是具有最小编码单元尺寸的编码单元。从LCU 310开始分区,随着CU的水平尺寸或垂直尺寸或者水平尺寸和垂直尺寸两者通过分区而减小,CU深度增加1。例如,对于每个深度,未被分区的CU可具有2N×2N的尺寸。此外,在被分区的CU的情况下,尺寸为2N×2N的CU可被分区为尺寸为N×N的四个CU。N的大小可随着深度增加1而减小至一半。
此外,可通过使用CU的分区信息来表示CU是否被分区的信息。分区信息可以是1比特信息。除了SCU之外的所有CU可包括分区信息。例如,当分区信息的值是第一值时,CU可不被分区,当分区信息的值是第二值时,CU可被分区。
参照图3,深度为0的LCU可以是64×64的块。0可以是最小深度。深度为3的SCU可以是8×8的块。3可以是最大深度。32×32的块和16×16的块的CU可分别被表示为深度1和深度2。
例如,当单个编码单元被分区为四个编码单元时,四个分区出的编码单元的水平尺寸和垂直尺寸可以是被分区之前的CU的水平尺寸和垂直尺寸的一半尺寸。在一个实施例中,当尺寸为32×32的编码单元被分区为四个编码单元时,四个分区出的编码单元中的每一个可具有16×16的尺寸。当单个编码单元被分区为四个编码单元时,可称该编码单元可被分区为四叉树形式。
例如,当一个编码单元被分区为两个子编码单元时,所述两个子编码单元中的每个子编码单元的水平尺寸或垂直尺寸(宽度或高度)可以是原始编码单元的水平尺寸或垂直尺寸的一半。例如,当尺寸为32×32的编码单元被垂直分区为两个子编码单元时,所述两个子编码单元中的每个子编码单元可具有16×32的尺寸。例如,当尺寸为8×32的编码单元被水平分区为两个子编码单元时,所述两个子编码单元中的每个子编码单元可具有8×16的尺寸。当一个编码单元被分区为两个子编码单元时,可以说该编码单元被二分区或按二叉树分区结构被分区。
例如,当一个编码单元被分区为三个子编码单元时,编码单元的水平尺寸或垂直尺寸可以以1:2:1的比率被分区,从而产生水平尺寸或垂直尺寸的比率为1:2:1的三个子编码单元。例如,当尺寸为16×32的编码单元被水平分区为三个子编码单元时,该三个子编码单元可按照从最上方子编码单元到最下方子编码单元的顺序分别具有16×8、16×16和16×8的尺寸。例如,当尺寸为32×32的编码单元被垂直划分为三个子编码单元时,该三个子编码单元可按照从左侧子编码单元到右侧子编码单元的顺序分别具有8×32、16×32和8×32的尺寸。当一个编码单元被分区为三个子编码单元时,可称该编码单元被三分区或按三叉树分区结构被分区。
在图3中,编码树单元(CTU)320是四叉树分区结构、二叉树分区结构和三叉树分区结构均被应用的CTU的示例。
如上所述,为了对CTU进行分区,可应用四叉树分区结构、二叉树分区结构和三叉树分区结构中的至少一个。可根据预定优先级顺序将各种树分区结构顺序地应用于CTU。例如,四叉树分区结构可优先被应用于CTU。不能再使用四叉树分区结构进行分区的编码单元可与四叉树的叶节点对应。与四叉树的叶节点对应的编码单元可用作二叉树和/或三叉树分区结构的根节点。也就是说,与四叉树的叶节点对应的编码单元可通过二叉树分区结构或三叉树分区结构被进一步分区,或者可不被进一步分区。因此,通过防止由与四叉树的叶节点对应的编码单元的二叉树分区或三叉树分区产生的编码块经历进一步的四叉树分区,可高效地执行块分区和/或用信号发送分区信息的操作。
可使用四分区信息来用信号发送与四叉树的节点对应的编码单元被分区的事实。具有第一值(例如,“1”)的四分区信息可指示当前编码单元按四叉树分区结构被分区。具有第二值(例如,“0”)的四分区信息可指示当前编码单元不按四叉树分区结构被分区。四分区信息可以是具有预定长度(例如,一个比特)的标志。
在二叉树分区与三叉树分区之间可不存在优先级。也就是说,与四叉树的叶节点对应的编码单元可进一步经历二叉树分区和三叉树分区中的任意分区。此外,通过二叉树分区或三叉树分区生成的编码单元可经历进一步的二叉树分区或进一步的三叉树分区,或者可不被进一步分区。
在二叉树分区与三叉树分区之间不存在优先级的树结构被称为多类型树结构。与四叉树的叶节点对应的编码单元可用作多类型树的根节点。可使用多类型树分区指示信息、分区方向信息和分区树信息中的至少一个来用信号发送是否对与多类型树的节点对应的编码单元进行分区。对于与多类型树的节点对应的编码单元的分区,可顺序地用信号发送多类型树分区指示信息、分区方向和分区树信息。
具有第一值(例如,“1”)的多类型树分区指示信息可指示当前编码单元将经历多类型树分区。具有第二值(例如,“0”)的多类型树分区指示信息可指示当前编码单元将不经历多类型树分区。
当按多类型树分区结构对与多类型树的节点对应的编码单元进行进一步分区时,编码单元可包括分区方向信息。分区方向信息可指示当前编码单元针对多类型树分区将在哪个方向上被分区。具有第一值(例如,“1”)的分区方向信息可指示当前编码单元将被垂直分区。具有第二值(例如,“0”)的分区方向信息可指示当前编码单元将被水平分区。
当按多类型树分区结构对与多类型树的节点对应的编码单元进行进一步分区时,当前编码单元可包括分区树信息。分区树信息可指示将被用于多类型树的节点的分区的树分区结构。具有第一值(例如,“1”)的分区树信息可指示当前编码单元将按二叉树分区结构被分区。具有第二值(例如,“0”)的分区树信息可指示当前编码单元将按三叉树分区结构被分区。
分区指示信息、分区树信息和分区方向信息均可以是具有预定长度(例如,一个比特)的标志。
四叉树分区指示信息、多类型树分区指示信息、分区方向信息和分区树信息中的至少任意一个可被熵编码/熵解码。对于那些类型的信息的熵编码/熵解码,可使用关于与当前编码单元相邻的邻近编码单元的信息。例如,当前编码单元的左邻近编码单元和/或上邻近编码单元的分区类型(分区或不分区、分区树以及/或者分区方向)与当前编码单元的分区类型相似的可能性较高。因此,可从关于邻近编码单元的信息推导用于对关于当前编码单元的信息进行熵编码/熵解码的上下文信息。关于邻近编码单元的信息可包括四分区信息、多类型树分区指示信息、分区方向信息和分区树信息中的至少任意一个。
作为另一示例,在二叉树分区和三叉树分区中,可优先执行二叉树分区。也就是说,当前编码单元可首先经历二叉树分区,然后可将与二叉树的叶节点对应的编码单元设置为用于三叉树分区的根节点。在这种情况下,可不对与三叉树的节点对应的编码单元执行四叉树分区或二叉树分区。
不能按四叉树分区结构、二叉树分区结构和/或三叉树分区结构分区的编码单元成为用于编码、预测和/或变换的基本单元。也就是说,该编码单元不能被进一步分区以进行预测和/或变换。因此,用于将该编码单元分区为预测单元和/或变换单元的分区结构信息和分区信息可不存在于比特流中。
然而,当编码单元(即,用于分区的基本单元)的尺寸大于最大变换块的尺寸时,编码单元可被递归地分区,直到编码单元的尺寸减小到等于或小于最大变换块的尺寸为止。例如,当编码单元的尺寸是64×64时并且当最大变换块的尺寸是32×32时,编码单元可被分区为四个32×32的块以进行变换。例如,当编码单元的尺寸是32×64并且最大变换块的尺寸是32×32时,编码单元可被分区为两个32×32的块以进行变换。在这种情况下,用于变换的编码单元的分区不单独被用信号发送,并且可通过编码单元的水平尺寸或垂直尺寸与最大变换块的水平尺寸或垂直尺寸之间的比较来确定。例如,当编码单元的水平尺寸(宽度)大于最大变换块的水平尺寸(宽度)时,编码单元可被垂直二等分。例如,当编码单元的垂直尺寸(长度)大于最大变换块的垂直尺寸(长度)时,编码单元可被水平二等分。
编码单元的最大尺寸和/或最小尺寸的信息以及变换块的最大尺寸和/或最小尺寸的信息可被用信号发送或者在编码单元的更高等级被确定。所述更高等级可以是例如序列级、画面级、条带级、并行块组级、并行块级等。例如,编码单元的最小尺寸可被确定为4×4。例如,变换块的最大尺寸可被确定为64×64。例如,变换块的最小尺寸可被确定为4×4。
与四叉树的叶节点对应的编码单元的最小尺寸(四叉树最小尺寸)的信息和/或从多类型树的根节点到叶节点的最大深度(多类型树的最大树深度)的信息可被用信号发送或者在编码单元的更高等级被确定。例如,所述更高等级可以是序列级、画面级、条带级、并行块组级、并行块级等。四叉树的最小尺寸的信息和/或多类型树的最大深度的信息可被用信号发送或者针对画面内条带和画面间条带中的每一个被确定。
CTU的尺寸与变换块的最大尺寸之间的差信息可被用信号发送或在编码单元的更高等级被确定。例如,所述更高等级可以是序列级、画面级、条带级、并行块组级、并行块级等。可基于编码树单元的尺寸和所述差信息来确定与二叉树的各个节点对应的编码单元的最大尺寸(在下文中,称为二叉树的最大尺寸)的信息。与三叉树的各个节点对应的编码单元的最大尺寸(在下文中,称为三叉树的最大尺寸)可根据条带的类型而变化。例如,对于画面内条带,三叉树的最大尺寸可以是32×32。例如,对于画面间条带,三叉树的最大尺寸可以是128×128。例如,与二叉树的各个节点对应的编码单元的最小尺寸(在下文中,称为二叉树的最小尺寸)和/或与三叉树的各个节点对应的编码单元的最小尺寸(在下文中,称为三叉树的最小尺寸)可被设置为编码块的最小尺寸。
作为另一示例,二叉树的最大尺寸和/或三叉树的最大尺寸可被用信号发送或在条带级被确定。可选地,二叉树的最小尺寸和/或三叉树的最小尺寸可被用信号发送或在条带级被确定。
根据上述各种块的尺寸和深度信息,四分区信息、多类型树分区指示信息、分区树信息和/或分区方向信息可被包括在比特流中或可不被包括在比特流中。
例如,当编码单元的尺寸不大于四叉树的最小尺寸时,该编码单元不包含四分区信息。因此,可从第二值推导四分区信息。
例如,当与多类型树的节点对应的编码单元的尺寸(水平尺寸和垂直尺寸)大于二叉树的最大尺寸(水平尺寸和垂直尺寸)和/或三叉树的最大尺寸(水平尺寸和垂直尺寸)时,编码单元可不被二分区或三分区。因此,多类型树分区指示信息可不被用信号发送,但可从第二值被推导出。
可选地,当与多类型树的节点对应的编码单元的尺寸(水平尺寸和垂直尺寸)与二叉树的最大尺寸(水平尺寸和垂直尺寸)相同并且/或者是三叉树的最大尺寸(水平尺寸和垂直尺寸)的两倍大时,编码单元可不被进一步二分区或三分区。因此,多类型树分区指示信息可不被用信号发送,但可从第二值被推导。这是因为当按二叉树分区结构和/或三叉树分区结构对编码单元进行分区时,生成了小于二叉树的最小尺寸和/或三叉树的最小尺寸的编码单元。
可选地,可基于虚拟流水线数据单元的尺寸(在下文中,流水线缓冲器尺寸)来限制二叉树分区或三叉树分区。例如,当通过二叉树分区或三叉树分区将编码单元划分为不适合流水线缓冲器尺寸的子编码单元时,对应的二叉树分区或三叉树分区可被限制。流水线缓冲器尺寸可以是最大变换块的尺寸(例如,64×64)。例如,当流水线缓冲器尺寸是64×64时,下面的划分可被限制。
-针对编码单元的N×M(N和/或M是128)三叉树分区
-针对编码单元的水平方向上的128×N(N<=64)二叉树分区
-针对编码单元的垂直方向上的N×128(N<=64)二叉树分区
可选地,当与多类型树的节点对应的编码单元的深度等于多类型树的最大深度时,该编码单元可不被进一步二分区和/或三分区。因此,多类型树分区指示信息可不被用信号发送,但可从第二值被推导出。
可选地,仅当针对与多类型树的节点对应的编码单元进行垂直方向二叉树分区、水平方向二叉树分区、垂直方向三叉树分区和水平方向三叉树分区中的至少一个是可能的时,可用信号发送多类型树分区指示信息。否则,编码单元可不被二分区和/或三分区。因此,多类型树分区指示信息可不被用信号发送,但可从第二值被推导出。
可选地,仅当针对与多类型树的节点对应的编码单元进行垂直方向二叉树分区和水平方向二叉树分区两者或者垂直方向三叉树分区和水平方向三叉树分区两者是可能的时,可用信号发送分区方向信息。否则,分区方向信息可不被用信号发送,但可从指示可能的分区方向的值被推导出。
可选地,仅当针对与多类型树的节点对应的编码单元进行垂直方向二叉树分区和垂直方向三叉树分区两者或者水平方向二叉树分区和水平方向三叉树分区两者是可能的时,可用信号发送分区树信息。否则,分区树信息可不被用信号发送,但可从指示可能的分区树结构的值被推导出。
图4是示出帧内预测处理的示图。
图4中的从中心到外部的箭头可表示帧内预测模式的预测方向。
可通过使用当前块的邻近块的参考样点来执行帧内编码和/或帧内解码。邻近块可以是重建的邻近块。例如,可通过使用重建的邻近块中所包括的参考样点的编码参数或值来执行帧内编码和/或帧内解码。
预测块可表示通过执行帧内预测而生成的块。预测块可对应于CU、PU和TU中的至少一个。预测块的单元可具有CU、PU和TU中的一个的尺寸。预测块可以是尺寸为2×2、4×4、16×16、32×32或64×64等的正方形块,或者可以是尺寸为2×8、4×8、2×16、4×16和8×16等的矩形块。
可根据针对当前块的帧内预测模式来执行帧内预测。当前块可具有的帧内预测模式的数量可以是固定值,并且可以是根据预测块的属性而不同地确定的值。例如,预测块的属性可包括预测块的尺寸和预测块的形状等。
帧内预测模式的数量可被固定为N,而不管块尺寸如何。或者,帧内预测模式的数量可以是3、5、9、17、34、35、36、65或67等。可选地,帧内预测模式的数量可根据块尺寸或颜色分量类型或者块尺寸和颜色分量类型两者而变化。例如,帧内预测模式的数量可根据颜色分量是亮度信号还是色度信号而变化。例如,随着块尺寸变大,帧内预测模式的数量可增加。可选地,亮度分量块的帧内预测模式的数量可大于色度分量块的帧内预测模式的数量。
帧内预测模式可以是非角度模式或角度模式。非角度模式可以是DC模式或平面模式,并且角度模式可以是具有特定方向或角度的预测模式。帧内预测模式可由模式编号、模式值、模式数字、模式角度和模式方向中的至少一个表示。帧内预测模式的数量可以是大于1的M,包括非角度模式和角度模式。为了对当前块进行帧内预测,可执行确定包括在重建的邻近块中的样点是否可被用作当前块的参考样点的步骤。当不可被用作当前块的参考样点的样点存在时,通过对重建的邻近块中包括的样点中的至少一个样点值进行复制或执行插值或者对重建的邻近块中包括的样点中的至少一个样点值进行复制和执行插值两者而获得的值可被用于替换样点的不可用样点值,因此替换后的样点值被用作当前块的参考样点。
图7是示出能够被用于帧内预测的参考样点的示图。
如图7中所示,参考样点线0至参考样点线3中的至少一条可被用于当前块的帧内预测。在图7中,片段A和片段F的样点可分别用与片段B和片段E最接近的样点来填充,而不是从重建的邻近块得到。可用信号发送指示将被用于当前块的帧内预测的参考样点线的索引信息。当当前块的上边界是CTU的边界时,只有参考样点线0可以是可用的。因此,在这种情况下,可不用信号发送索引信息。当除了参考样点线0之外的参考样点线被使用时,可不执行稍后将描述的针对预测块的滤波。
当进行帧内预测时,可基于帧内预测模式和当前块尺寸/形状将滤波器应用于参考样点和预测样点中的至少一个。
在平面模式的情况下,当生成当前块的预测块时,根据预测目标样点在预测块内的位置,可通过使用当前样点的上侧和左侧参考样点以及当前块的右上侧和左下侧参考样点的加权和来生成预测目标样点的样点值。此外,在DC模式的情况下,当生成当前块的预测块时,可使用当前块的上侧和左侧参考样点的平均值。此外,在角度模式的情况下,可通过使用当前块的上侧、左侧、右上侧和/或左下侧参考样点来生成预测块。为了生成预测样点值,可执行实数单位的插值。
在颜色分量之间的帧内预测的情况下,可基于第一颜色分量的对应的重建块来生成第二颜色分量的针对当前块的预测块。例如,第一颜色分量可以是亮度分量,并且第二颜色分量可以是色度分量。对于颜色分量之间的帧内预测,可基于模板来推导第一颜色分量与第二颜色分量之间的线性模型的参数。模板可包括当前块的上邻近样点和/或左邻近样点以及与其对应的第一颜色分量的重建块的上邻近样点和/或左邻近样点。例如,可使用第一颜色分量的在模板中的样点之中具有最大值的样点值和与其对应的第二颜色分量的样点值以及第一颜色分量的在模板中的样点之中具有最小值的样点值和与其对应的第二颜色分量的样点值来推导线性模型的参数。当推导线性模型的参数时,可将对应的重建块应用于线性模型以生成针对当前块的预测块。根据视频格式,可对第一颜色分量的重建块和对应的重建块的邻近样点执行子采样。例如,当第二颜色分量的一个样点对应于第一颜色分量的四个样点时,可对第一颜色分量的四个样点进行子采样以计算一个对应样点。在这种情况下,可基于对应的经过子采样的样点执行线性模型的参数推导和颜色分量之间的帧内预测。是否执行颜色分量之间的帧内预测和/或模板的范围可作为帧内预测模式被用信号发送。
当前块可在水平方向或垂直方向上被分区为两个或四个子块。分区出的子块可被依次重建。也就是说,可对子块执行帧内预测以生成子预测块。此外,可对子块执行反量化和/或逆变换以生成子残差块。可通过将子预测块与子残差块相加来生成重建的子块。重建的子块可被用作用于子子块的帧内预测的参考样点。子块可以是包括预定数量(例如,16)或更多个样点的块。因此,例如,当当前块是8×4的块或4×8的块时,当前块可被分区为两个子块。此外,当当前块是4×4的块时,当前块可不被分区为子块。当当前块具有其它尺寸时,当前块可被分区为四个子块。关于是否基于子块和/或分区方向(水平或垂直)执行帧内预测的信息可被用信号发送。基于子块的帧内预测可仅限于在使用参考样点线0时被执行。当执行基于子块的帧内预测时,可不执行稍后将描述的针对预测块的滤波。
可通过对经过帧内预测的预测块执行滤波来生成最终预测块。可通过将预定权重应用于滤波目标样点、左参考样点、上参考样点和/或左上参考样点来执行滤波。用于滤波的权重和/或参考样点(范围、位置等)可基于块尺寸、帧内预测模式和滤波目标样点在预测块中的位置中的至少一个来被确定。可仅在预定帧内预测模式(例如,DC、平面、垂直、水平、对角线和/或相邻对角线模式)的情况下执行滤波。相邻对角线模式可以是将k与对角线模式相加或从对角线模式减去k的模式。例如,k可以是正整数8或更小的正整数。
可通过对邻近于当前块存在的块的帧内预测模式进行预测来对当前块的帧内预测模式进行熵编码/熵解码。当当前块和邻近块的帧内预测模式相同时,可通过使用预定的标志信息来用信号发送当前块和邻近块的帧内预测模式为相同的信息。此外,可用信号发送多个邻近块的帧内预测模式中的与当前块的帧内预测模式相同的帧内预测模式的指示符信息。当当前块和邻近块的帧内预测模式不同时,可通过基于邻近块的帧内预测模式执行熵编码/熵解码来对当前块的帧内预测模式信息进行熵编码/熵解码。
图5是示出画面间预测处理的实施例的示图。
在图5中,矩形可表示画面。在图5中,箭头表示预测方向。画面可按其编码类型被分类为帧内画面(I画面)、预测画面(P画面)和双预测画面(B画面)。
可通过帧内预测来对I画面进行编码,而不需要画面间预测。可通过使用在针对当前块的一个方向(即,前向或后向)上存在的参考画面进行画面间预测来对P画面进行编码。可通过使用在针对当前块的两个方向(即,前向和后向)上预设的参考画面进行画面间预测来对B画面进行编码。当使用画面间预测时,编码器可执行画面间预测或运动补偿,并且解码器可执行对应的运动补偿。
下面,将详细描述画面间预测的实施例。
可使用参考画面和运动信息来执行画面间预测或运动补偿。
可通过编码设备100和解码设备200中的每一个在画面间预测期间推导当前块的运动信息。可通过使用重建的邻近块的运动信息、同位置块(也称为col块或同位块)和/或与同位块相邻的块的运动信息来推导当前块的运动信息。同位块可表示先前重建的同位置画面(也被称为col画面或同位画面)内的在空间上位于与当前块相同的位置处的块。同位画面可以是参考画面列表中包括的一个或更多个参考画面中的一个画面。
运动信息的推导方法可根据当前块的预测模式而不同。例如,针对帧间预测应用的预测模式包括AMVP模式、合并模式、跳过模式、具有运动矢量差的合并模式、子块合并模式、三角形分区模式、帧间-帧内组合预测模式、仿射模式等。这里,合并模式可被称为运动合并模式。
例如,当AMVP被用作预测模式时,重建的邻近块的运动矢量、同位块的运动矢量、与同位块相邻的块的运动矢量和(0,0)运动矢量中的至少一个可被确定为针对当前块的运动矢量候选,并且通过使用运动矢量候选来生成运动矢量候选列表。可通过使用所生成的运动矢量候选列表来推导当前块的运动矢量候选。可基于推导出的运动矢量候选来确定当前块的运动信息。同位置块的运动矢量或与同位置块相邻的块的运动矢量可被称为时间运动矢量候选,并且重建的邻近块的运动矢量可被称为空间运动矢量候选。
编码设备100可计算当前块的运动矢量与运动矢量候选之间的运动矢量差(MVD)并可对运动矢量差(MVD)执行熵编码。此外,编码设备100可对运动矢量候选索引执行熵编码并生成比特流。运动矢量候选索引可指示运动矢量候选列表中包括的运动矢量候选中的最优运动矢量候选。解码设备可对包括在比特流中的运动矢量候选索引执行熵解码,并可通过使用经过熵解码的运动矢量候选索引从包括在运动矢量候选列表中的运动矢量候选中选择解码目标块的运动矢量候选。此外,解码设备200可将经过熵解码的MVD与通过熵解码提取出的运动矢量候选相加,从而推导解码目标块的运动矢量。
另外,编码设备100可对计算出的MVD的分辨率信息执行熵编码。解码设备200可使用MVD分辨率信息来调整经过熵解码的MVD的分辨率。
另外,编码设备100基于仿射模型计算当前块中的运动矢量与运动矢量候选之间的运动矢量差(MVD),并对MVD执行熵编码。解码设备200通过经过熵解码的MVD和仿射控制运动矢量候选之和推导解码目标块的仿射控制运动矢量,来基于每个子块推导运动矢量。
比特流可包括指示参考画面的参考画面索引。参考画面索引可由编码设备100熵编码,然后作为比特流被用信号发送到解码设备200。解码设备200可基于推导出的运动矢量和参考画面索引信息生成解码目标块的预测块。
推导当前块的运动信息的方法的另一示例可以是合并模式。合并模式可表示合并多个块的运动的方法。合并模式可表示从邻近块的运动信息推导当前块的运动信息的模式。当应用合并模式时,可使用重建的邻近块的运动信息和/或同位置块的运动信息来生成合并候选列表。运动信息可包括运动矢量、参考画面索引和画面间预测指示符中的至少一个。所述预测指示符可指示单向预测(L0预测或L1预测)或者双向预测(L0预测和L1预测)。
合并候选列表可以是所存储的运动信息的列表。包括在合并候选列表中的运动信息可以是以下项中的至少一项:与当前块相邻的邻近块的运动信息(空间合并候选)、当前块的参考画面中的同位置块的运动信息(时间合并候选)、通过合并候选列表中存在的运动信息的组合而生成的新运动信息、在当前块之前被编码/解码的块的运动信息(基于历史的合并候选)以及零合并候选。
编码设备100可通过对合并标志和合并索引中的至少一个执行熵编码来生成比特流,并且可将比特流用信号发送到解码设备200。合并标志可以是指示是否针对每个块执行合并模式的信息,并且合并索引可以是指示当前块的邻近块之中的哪个邻近块是合并目标块的信息。例如,当前块的邻近块可包括在当前块左侧的左邻近块、设置在当前块上方的上邻近块以及时间上与当前块相邻的时间邻近块。
另外,编码设备100对合并候选的运动信息中的用于校正运动矢量的校正信息执行熵编码,并将其用信号发送到解码设备200。解码设备200可基于校正信息对根据合并索引选择的合并候选的运动矢量进行校正。这里,校正信息可包括关于是否执行校正的信息、校正方向信息和校正大小信息中的至少一个。如上所述,基于用信号发送的校正信息对合并候选的运动矢量进行校正的预测模式可被称为具有运动矢量差的合并模式。
跳过模式可以是将邻近块的运动信息按原样应用于当前块的模式。当应用跳过模式时,编码设备100可对哪个块的运动信息将被用作当前块的运动信息的事实的信息执行熵编码以生成比特流,并且可将比特流用信号发送到解码设备200。编码设备100可不将关于运动矢量差信息、编码块标志和变换系数等级中的至少任意一个的语法元素用信号发送到解码设备200。
子块合并模式可表示以编码块(CU)的子块为单位推导运动信息的模式。当应用子块合并模式时,可使用参考图像中的与当前子块同位置的子块的运动信息(基于子块的时间合并候选)和/或仿射控制点运动矢量合并候选来生成子块合并候选列表。
三角形分区模式可表示进行以下操作的模式:通过沿对角线方向对当前块进行分区来推导运动信息,使用推导出的运动信息中的每个运动信息来推导每个预测样点,并且通过对推导出的预测样点中的每个预测样点进行加权来推导当前块的预测样点。
帧间-帧内组合预测模式可表示进行以下操作的模式:通过对由帧间预测生成的预测样点和由帧内预测生成的预测样点进行加权来推导当前块的预测样点。
解码设备200可自行校正推导出的运动信息。解码设备200可基于由推导出的运动信息指示的参考块来搜索预定区域,并将具有最小SAD的运动信息推导为校正后的运动信息。
解码设备200可使用光流来对经由帧间预测推导出的预测样点进行补偿。
图6是示出变换和量化处理的示图。
如图6中所示,对残差信号执行变换处理和/或量化处理,以生成量化的等级信号。残差信号是原始块与预测块(即,帧内预测块或帧间预测块)之间的差。预测块是通过帧内预测或帧间预测生成的块。所述变换可以是初次变换、二次变换或者初次变换和二次变换两者。对残差信号的初次变换产生变换系数,并且对变换系数的二次变换产生二次变换系数。
从预先定义的各种变换方案中选择的至少一种方案被用于执行初次变换。例如,所述预定义的变换方案的示例包括离散余弦变换(DCT)、离散正弦变换(DST)和Karhunen-Loève变换(KLT)。通过初次变换生成的变换系数可经历二次变换。可根据当前块和/或当前块的邻近块的编码参数来确定用于初次变换和/或二次变换的变换方案。可选地,可用信号发送指示变换方案的变换信息。基于DCT的变换可包括例如DCT-2、DCT-8等。基于DST的变换可包括例如DST-7。
可通过对残差信号或执行初次变换和/或二次变换的结果执行量化来生成量化的等级信号(量化系数)。根据块的帧内预测模式或块尺寸/形状,可根据对角线右上扫描、垂直扫描和水平扫描中的至少一个来扫描量化的等级信号。例如,当按照对角线右上扫描来扫描系数时,块形式的系数变为一维矢量形式。除了对角线右上扫描之外,可根据变换块的帧内预测模式和/或尺寸来使用水平地扫描二维块形式的系数的水平扫描或垂直地扫描二维块形式的系数的垂直扫描。扫描的量化等级系数可被熵编码以被插入到比特流中。
解码器对比特流进行熵解码以获得量化等级系数。可通过逆扫描以二维块形式排列量化等级系数。对于逆扫描,可使用对角线右上扫描、垂直扫描和水平扫描中的至少一个。
然后,量化等级系数可被反量化,然后根据需要被二次逆变换,并且最后根据需要被初次逆变换,以生成重建的残差信号。
可在环内滤波之前针对通过帧内预测或帧间预测重建的亮度分量来按照动态范围执行逆映射。动态范围可被划分为16个相等的片段,并且可用信号发送针对每个片段的映射函数。可在条带级或并行块组级用信号发送映射函数。可基于所述映射函数推导用于执行逆映射的逆映射函数。在逆映射区域中执行环内滤波、参考画面存储和运动补偿,并且经由使用所述映射函数的映射,通过帧间预测生成的预测块被转换为映射区域,然后被用于生成重建块。然而,由于在映射区域中执行了帧内预测,因此经由帧内预测生成的预测块可在不进行映射/逆映射的情况下被用于生成重建块。
当当前块是色度分量的残差块时,可通过对映射区域的色度分量执行缩放来将残差块转换为逆映射区域。可在条带级或并行块组级用信号发送缩放的可用性。仅当针对亮度分量的映射可用并且亮度分量的划分和色度分量的划分遵循相同的树结构时,可应用缩放。可基于与色差块对应的亮度预测块的样点值的平均值来执行缩放。在这种情况下,当当前块使用帧间预测时,亮度预测块可表示经过映射的亮度预测块。可通过使用亮度预测块的样点值的平均值所属的片段的索引参考查找表来推导缩放所需的值。最后,通过使用推导出的值对残差块进行缩放,可将残差块切换到逆映射区域。然后,可在逆映射区域中执行色度分量块恢复、帧内预测、帧间预测、环内滤波和参考画面存储。
可通过一组序列参数用信号发送指示亮度分量和色度分量的映射/逆映射是否可用的信息。
可基于指示当前画面中的当前块与参考块之间的位移的块矢量来生成当前块的预测块。以这种方式,用于参考当前画面生成预测块的预测模式被称为帧内块复制(IBC)模式。IBC模式可被应用于M×N(M<=64,N<=64)的编码单元。IBC模式可包括跳过模式、合并模式、AMVP模式等。在跳过模式或合并模式的情况下,合并候选列表被构建,并且合并索引被用信号发送,使得一个合并候选可被指定。指定的合并候选的块矢量可被用作当前块的块矢量。合并候选列表可包括空间候选、基于历史的候选、基于两个候选的平均值的候选和零合并候选中的至少一个。在AMVP模式的情况下,可用信号发送差块矢量。此外,可从当前块的左侧邻近块和上方邻近块推导预测块矢量。可用信号发送将使用的邻近块的索引。IBC模式下的预测块被包括在当前CTU或左侧CTU中并且限于已经重建的区域中的块。例如,可限制块矢量的值,使得当前块的预测块位于按照编码/解码顺序在当前块所属的64×64的块之前的三个64×64的块的区域中。通过以这种方式限制块矢量的值,可减少根据IBC模式实施方式的内存消耗和装置复杂度。
图8是示出根据本发明的实施例的帧内预测编码/解码的示图。
在步骤S510,可推导帧内预测模式。
可使用以下方法中的至少一种方法来推导针对当前块的帧内预测模式:使用预定模式(N个模式)和/或邻近块的帧内预测模式的推导方法;对当前块的帧内预测模式进行熵编码/熵解码的方法;以及根据条带类型自适应地推导预测模式的方法。
帧内预测模式可包括各种模式,诸如DC、平面、位置相关帧内预测组合(PDPC)、线性模型(LM)、角度预测、当前画面参考(CPR)模式等。
当前块的尺寸可由W×H表示,并且W和H皆可具有作为正整数的值a·2n(a=1,2,3,…,n=0,1,2,3,4,…)。
可使用预定帧内预测模式和/或邻近块的帧内预测模式来推导当前块的帧内预测模式。
预定帧内预测模式可包括从可用帧内预测模式选择的N个模式。这里,N可以是包括1的正整数。
邻近块可以是空间上/时间上与当前块相邻的邻近块。
预定帧内预测模式和/或邻近块的帧内预测模式可被用于构建最频繁模式(MFM)。MFM可包括一个或N个帧内预测模式。在推导MFM时,MFM的数量和/或推导MFM的方法可基于当前块的尺寸、形状、颜色分量和条带类型中的至少一个而变化。
可从邻近块推导MFM。
当从邻近块推导N个帧内预测模式时,基于每个子块推导N个MFM。
例如,N个MFM可通过搜索邻近块的模式来推导出,并且可被用作预测模式。
例如,特定模式可根据邻近块的梯度值被定义为MFM,并且可被用作预测模式。
例如,N个MFM可通过搜索邻近块的预测模式来推导出,并且可被用作预测模式。
图9是示出通过使用子块推导帧内预测模式的方法的示图。
如图9(a)中所示,子块可存在于当前块的左侧、上方和右侧。在下文中,将描述子块存在于当前块的左侧和上方的示例。
子块的尺寸可等于或大于最小CU的尺寸。子块的尺寸可由Wsub×Hsub表示,并且Wsub和Hsub皆可具有作为正整数的值a·2n(a=1,2,3,…,n=0,1,2,3,4,…)。
可根据当前块的尺寸和/或形状来各种地确定针对子块的搜索范围。搜索可指推导一个或更多个邻近子块的帧内预测模式。
图9(b)示出当前块的尺寸为16×16并且子块的尺寸为4×4的示例。图9(c)示出当前块的尺寸为16×8并且子块的尺寸为4×4的示例。然而,当前块的尺寸和子块的尺寸不限于上述示例。
在图9(b)和图9(c)中所示的示例中,当当前块的尺寸为W×H时,将被搜索以推导帧内预测模式的子块的数量可以是(nW×nH+1)或d×(nW×mH)+d2(n=0,1,2,3,…,m=0,1,2,3,…,d=0,1,2,3,…)。
在图9(c)中所示的示例中,当当前块为矩形形状时,n>m、n<m或n=m是可能的。此外,dv>dh、dv<dh或dv=dh是可能的。
子块的尺寸和/或针对子块的搜索范围可根据颜色分量而变化。例如,对于色度块,已用于亮度块的子块可经受比率为1:x(x=1,2,3,…)的子取样,然后可被使用。
在从一个或更多个邻近块推导出的帧内预测模式中,预定模式可被推导为MFM。预定模式可指出现频率最高的模式、与预定位置处的邻近块对应的模式以及一个或更多个帧内预测模式的组合中的至少一个。基于当前块的尺寸/形状、邻近块的尺寸/形状和邻近块的帧内预测模式中的至少一个,推导MFM的方法可变化。
图10是示出确定MFM的示例的示图。
在图10(a)至图10(c)中,n、m和d都具有值1。
在图10(a)中,出现频率最高的模式是模式18。在这种情况下,MFM可被推导为模式18。
在图10(b)中所示的示例中,基于包括邻近块的CTU、CU、PU和TU中的至少一个的尺寸,推导MFM的方法可变化。例如,当从子块推导出的模式具有相同频率时,通过根据邻近块的尺寸改变加权因子来推导MFM。例如,在图10(b)中所示的示例中,通过将高加权因子应用于邻近块为较大尺寸的块,模式18可被推导为MFM。可选地,通过将高加权因子应用于邻近块为较小尺寸的块,模式17可被推导为MFM。
在图10(c)中所示的示例中,邻近块的尺寸与图10(b)中所示的示例中的尺寸相同,但是当前块为矩形形状。在这种情况下,在基于每个子块推导出的预测模式中,出现频率最高的模式为模式17,使得MFM可被推导为模式17。
可构建最可能模式(MPM)以推导当前块的帧内预测模式。可从MPM候选列表排除上述MFM。例如,当MFM为模式18时,构建排除模式18的MPM候选列表。
可对指示当前块的帧内预测模式是否为MFM的指示符进行编码/解码。例如,当MFM指示符具有第一值(例如,“1”)时,推导出的MFM被设置为当前块的帧内预测模式。
当存在两个或更多个MFM时,对附加的MFM索引进行编码/解码。MFM索引可以是指示N个MFM中的一个MFM的索引。
当MFM指示符具有第二值(例如,“0”)时,对MPM指示符进行编码/解码。MPM指示符可以是指示当前块的帧内预测模式是否为MPM的指示符。
在基于每个子块对模式进行预测时,可从已经被编码/解码的邻近块的部分位置推导帧内预测模式。
可根据块的条带类型、颜色分量、尺寸/形状中的至少一个来确定邻近块的部分位置。
图14是示出邻近块的部分位置的示图。
如图14(a)中所示,部分位置可以是L、A和AL。基于所述部分位置,可应用上述推导MFM的方法。
可选地,如图14(b)中所示,部分位置可以是L、A、AR、LB和AL。
当包括当前块的条带是条带I时,在图14(a)或图14(b)中所示的位置处或者在预定的指定位置处推导MFM。当所述条带是条带P或条带B时,改变邻近块的位置。
当当前块是亮度块时,在图14(a)或14(b)中所示的位置处或者在预定的指定位置处推导MFM。当当前块是色度块时,改变邻近块的位置。
当当前块为正方形形状时,在图14(a)或图14(b)中所示的位置处或者在预定的指定位置处推导MFM。当当前块为矩形形状时,改变邻近块的位置。
在基于每个子块对模式进行预测时,可通过搜索全部邻近块或通过搜索邻近块的一部分来推导预测模式。
在基于每个子块对模式进行预测时,可从空间邻近块推导帧内预测模式。当前块的空间邻近块可以是已经被编码/解码的块。
图11是示出当前块的空间邻近块的示图。
在图11中,块a至块m是当前块的邻近块。阴影块是帧间预测块,并且其余块是帧内预测块。
如图11(a)中所示,当全部邻近块被帧内预测时,通过基于每个子块搜索全部邻近块来推导当前块的MFM。
如图11(b)中所示,当邻近块中的一些邻近块被帧内预测时,通过基于每个子块仅搜索经过帧内预测的邻近块来推导当前块的MFM。
在图11(b)中所示的示例中,当邻近块中的一些邻近块被帧间预测时,从针对对应邻近块的参考画面找到帧内预测模式,并且将该帧内预测模式替换用于推导当前块的预测模式的帧内预测模式。从基于每个子块找到的包括经过替换的帧内预测模式的预测模式,可推导当前块的MFM。
在基于每个子块对模式进行预测时,可从时间邻近块推导帧内预测模式。
当前块的时间邻近块可以是存在于已经被编码/解码的参考画面内的参考块。参考画面可以是存储在参考画面缓冲器(也被称为解码画面缓冲器DPB)中的至少一个画面。
图12是示出当前块的时间邻近块的示图。
在推导当前块的帧内预测模式时,基于每个子块搜索参考块的空间邻近块以推导当前块的MFM。
例如,如图11(a)中所示,当对参考块的全部空间邻近块进行帧内预测时,基于每个子块搜索全部邻近块以推导当前块的MFM。
例如,如图11(b)中所示,当对参考块的一些空间邻近块进行帧内预测时,基于每个子块仅搜索经过帧内预测的邻近块以推导当前块的MFM。
例如,如图11(b)中所示,当对参考块的一些空间邻近块进行帧间预测时,从针对对应邻近块的参考画面找到帧内预测模式,并且将该帧内预测模式替换用于推导当前块的预测模式的帧内预测模式。从基于每个子块找到的包括经过替换的帧内预测模式的预测模式,可推导当前块的MFM。
在基于每个子块推导帧内预测模式时,可通过空间和/或时间模板匹配来推导帧内预测模式。
当通过模板匹配来推导帧内预测模式时,对指示是否执行模板匹配的指示符进行编码/解码。
当模板匹配指示符具有第一值(例如,“1”)时,从通过执行模板匹配找到的块推导当前块的MFM。
当模板匹配指示符具有第二值(例如,“0”)时,从基于每个子块找到的预测模式推导当前块的MFM,其中,所述子块在当前块周围。
可使用空间和时间模板匹配方法中的至少一种匹配方法。
当空间模板匹配和时间模板匹配两者可行时,对指示使用哪种模板匹配的索引进行编码/解码。
当模板匹配索引具有第一值(例如,“0”)时,执行空间模板匹配(或时间模板匹配)。
当模板匹配索引具有第二值(例如,“1”)时,执行时间模板匹配(或空间模板匹配)。
当执行空间模板匹配时,从当前块的邻近块构建空间模板。例如,与图9中所示的子块的构建一样,空间模板可被构建为具有各种尺寸和深度。
通过使用构建的模板,可在已经被编码/解码的块中的搜索范围内找到最相似的模板。
搜索范围可被指定为画面、条带、CTU、邻近区域等。例如,搜索范围可被指定为当前画面、当前条带、当前CTU周围的预定CTU的范围。可在指定的搜索范围中搜索与所构建的空间模板最相似的模板。
这里,可对与搜索范围相关的CTU索引(CTU_index)进行编码/解码。例如,当CTU_index为0时,搜索范围为CTU 0。
例如,可在当前块的邻近区域内执行搜索。当存在至少一个邻近区域时,对用于指定所述至少一个邻近区域的至少一个索引(Region_index)进行编码/解码。例如,当Region_index为0时,搜索范围为Region 0。
搜索最相似的模板可对应于搜索与当前块的模板具有最小差的模板,并且可使用绝对差之和(SAD)方法等。
可基于每个子块从通过执行模板匹配找到的块推导当前块的MFM。推导过程可与上述从空间/时间邻近块推导MFM的方法的推导过程相同。
当执行时间模板匹配时,当前块的时间模板存在于已经被编码/解码的参考画面内。参考画面可以是存储在参考画面缓冲器(也被称为经解码画面缓冲器DPB)中的至少一个画面。
可从当前块的时间邻近块构建时间模板。例如,如与图9中所示的子块的构建一样,时间模板可被构建为具有各种尺寸和深度。时间模板可以是存在于参考画面内的参考块的邻近块。
通过使用构建的模板,可从参考画面内的与当前块的位置对应的位置附近找到最相似的模板。
搜索最相似的模板可对应于搜索与当前块的模板具有最小差的模板,并且可使用绝对差之和(SAD)方法等。
可基于每个子块从通过执行模板匹配找到的块推导当前块的MFM。推导过程可与上述从空间/时间邻近块推导MFM的方法的推导过程相同。
为了对当前块的帧内预测模式进行编码/解码,帧内预测模式中的N个预定模式可被推导为MFM。MFM可包括各种模式,诸如DC、平面、PDPC、LM、角度模式等。
可根据模式的特性来选择N个预定模式。
例如,可将N个非角度模式选为MFM。例如,当帧内预测模式包括35个模式(DC、平面和33个角度模式)时,将DC模式和平面模式选为MFM。可选地,当帧内预测模式包括67个模式(DC、平面和65个角度模式)时,将DC模式和平面模式选为MFM。这里,可对指示N个模式中的一个模式的索引进行编码/解码。
例如,共同选择的帧内预测模式可被选为MFM。
当帧内预测模式包括35个模式或67个模式(包括如上所述的两个非角度模式)时,将共同选择的DC模式和平面模式(N=2)选为MFM。可选地,可将共同选择的DC模式或平面模式(N=1)选为MFM。可选地,当共同选择角度模式中的一个模式时,将对应角度模式选为MFM。
这里,当N为2或更大时,对指示N个模式中的一个模式的索引进行编码/解码。
共同选择的模式可在编码器/解码器中被预定义。共同选择的模式可被用于每个预定单元的更新。所述预定单元可以是视频、序列、画面、条带、并行块和CTU中的至少一个。对于更新,可存储关于每种模式的使用频率的信息。每次改变预定单元时,可基于所存储的关于使用频率的信息来选择共同选择的一个或更多个模式。可选地,可基于每个预定单元用信号发送关于共同选择的一个或更多个模式的信息。
可从MPM候选列表的构建排除被推导为MFM的模式。例如,当DC模式和/或平面模式被选为MFM时,在构建MPM候选列表时排除DC模式和/或平面模式。
可确定推导出的MFM是否与当前块的帧内预测模式相同。例如,当MFM为平面模式且当前块的帧内预测模式为平面模式时,使用MFM对当前块的帧内预测模式进行编码/解码。当当前块的帧内预测模式与MFM不同时,构建MPM列表。当MPM列表包括当前块的帧内预测模式时,使用MPM索引来对当前块的帧内预测模式进行编码/解码。
可对指示当前块的帧内预测模式是否为MFM的指示符进行编码/解码。当当前块的帧内预测模式与MFM相同时,MFM指示符具有第一值(例如,“1”)。否则,MFM指示符具有第二值(例如,“0”)。
当MFM包括至少两个模式或N个模式时,对皆指示N个模式中的一个模式的附加MFM索引进行编码/解码。
图27是示出在确定帧内预测模式时使用MFM和MPM的示例的示图。
如图27(a)中所示,可执行关于MPM指示符的确定,然后可执行关于MFM指示符的确定。
在图27(a)中,可在步骤S2701确定MPM指示符是指示真还是假。当MPM指示符指示真(例如,“1”)时,在步骤S2702确定MFM指示符是指示真还是假。
当MFM指示符指示真(例如,“1”)时,在步骤S2703将预定模式推导为当前块的帧内预测模式。预定模式可以是例如平面模式或DC模式。可选地,可存在多个预定模式(例如,两个非角度模式)。在这种情况下,可将由MFM索引指示的模式推导为当前块的帧内预测模式。
当MFM指示符指示假(例如,“0”)时,在步骤S2704,将除MFM之外的MPM候选中的由MPM索引指示的模式推导为当前块的帧内预测模式。
当MPM指示符指示假(例如,“0”)时,在步骤S2705,将除MPM候选之外的模式中的由Non_MPM索引指示的模式推导为当前块的帧内预测模式。
如图27(b)中所示,可执行关于MFM指示符的确定,然后可执行关于MPM指示符的确定。
在图27(b)中,可在步骤S2711确定MFM指示符是指示真还是假。当MFM指示符指示真(例如,“1”)时,在步骤S2712将预定模式推导为当前块的帧内预测模式。预定模式可以是例如平面模式或DC模式。可选地,可存在多个预定模式(例如,两个非角度模式)。在这种情况下,可将由MFM索引指示的模式推导为当前块的帧内预测模式。
当MFM指示符指示假(例如,“0”)时,在步骤S2713确定MPM指示符指示真还是假。当MPM指示符指示真(例如,“1”)时,在步骤S2714,将除MFM之外的MPM候选中的由MPM索引指示的模式推导为当前块的帧内预测模式。
当MPM指示符指示假(例如,“0”)时,在步骤S2715,将除MPM候选之外的模式中的由Non_MPM索引指示的模式推导为当前块的帧内预测模式。
可通过关于各种帧内预测方法的指示符推断或暗示MFM指示符和MPM指示符中的至少一个。
这里,各种帧内预测方法包括多参考线(MRL)、帧内子分区(ISP)和矩阵帧内预测(MIP)方法中的至少一种方法。
例如,假设仅对MPM候选和MFM候选中的一个或更多个候选执行各种帧内预测方法,当指示各种帧内预测方法的指示符为1时,这推断/暗示MPM指示符和MFM指示符中的至少一个指示真(例如,“1”)。这里,如上面参照图27所述,在执行关于MPM指示符的确定之前或之后执行关于MFM指示符的确定。
例如,假设对MPM候选和MFM候选执行各种帧内预测方法中的ISP方法。
图28是示出在对MPM候选和MFM候选执行ISP方法的情况下的帧内预测模式确定方法的示例的示图。
在图28中所示的示例中,关于MFM指示符的确定在关于MPM指示符的确定之前。
首先,可在步骤S2801确定MIP指示符是指示真(例如,“1”)还是假(例如,“0”)。当MIP指示符指示真时,在步骤S2807执行MIP模式。当MIP指示符指示假时,在步骤S2802确定MRL指示符是指示真(例如,“1”)还是假(例如,“0”)。当MRL指示符指示真时,在步骤S2808和步骤S2809省略关于MFM指示符和MPM指示符的确定。在这种情况下,可省略用信号发送MFM指示符和MPM指示符;可推断MFM指示符和MPM指示符分别指示“假”和“真”;并且在步骤S2810,可基于用信号发送的MPM索引来推导当前块的帧内预测模式。
当MRL指示符指示假时,在步骤S2803确定ISP指示符是指示真(例如,“1”)还是假(例如,“0”)。当ISP指示符指示真时,在步骤S2811确定MFM指示符是指示真(例如,“1”)还是假(例如,“0”)。
在步骤S2811,当MFM指示符指示假时,在步骤S2809省略关于MPM指示符的确定。在这种情况下,可省略用信号发送MPM指示符,可推断MPM指示符指示“真”,并且可在步骤S2810基于用信号发送的MPM索引推导当前块的帧内预测模式。
在步骤S2811,当MFM指示符指示真时,在步骤S2812,将预定模式确定为当前块的帧内预测模式。当存在两个或更多个预定模式时,基于MFM索引将所述两个或更多个预定模式中的一个模式确定为当前块的帧内预测模式。
当ISP指示符指示假时,在步骤S2804确定MFM指示符是指示真(例如,“1”)还是假(例如,“0”)。
在步骤S2804,当MFM指示符指示真时,在步骤S2812,将预定模式确定为当前块的帧内预测模式。
在步骤S2804,当MFM指示符指示假时,在步骤S2805确定MPM指示符是指示真(例如,“1”)还是假(例如,“0”)。当MPM指示符指示真时,在步骤S2810,基于用信号发送的MPM索引推导当前块的帧内预测模式。当MPM索引指示假时,基于作为指示除MFM候选和MPM候选之外的模式中的一个模式的信息的Non_MPM索引来确定当前块的帧内预测模式。
图29是示出在对MPM候选和MFM候选执行ISP方法的情况下的帧内预测模式确定方法的另一示例的示图。
在图29中所示的示例中,关于MPM指示符的确定在关于MFM指示符的确定之前。
步骤S2901、步骤S2902和步骤S2906可分别对应于步骤S2801、步骤S2802和步骤S2807。此外,类似于图28中所示的示例,当MRL指示符指示真时,在步骤S2907省略关于MFM指示符和MPM指示符的确定,并且在步骤S2908根据MPM索引确定当前块的帧内预测模式。
在步骤S2903,当ISP指示符指示真时,在步骤S2909省略关于MPM指示符的确定。例如,可不用信号发送MPM指示符,并且可推断MPM指示符指示“真”,并且可在步骤S2910确定MFM指示符是指示真(例如,“1”)还是假(例如,“0”)。
当MFM指示符指示真时,执行步骤S2911。当MFM指示符指示假时,执行步骤S2908。
当ISP指示符指示假时,在步骤S2914确定MPM指示符是指示真(例如,“1”)还是假(例如,“0”)。当MPM指示符指示真时,接着进行到步骤S2910,并且后续步骤如上所述。当MPM指示符指示假时,接着进行到步骤S2905。
步骤S2905、步骤S2908和步骤S2911可分别对应于步骤S2806、步骤S2810和步骤S2812。
例如,当仅对MPM候选执行各种帧内预测方法中的至少一种方法而不对MFM候选执行时,推断或暗示MPM指示符指示“真”并且MFM指示符指示“假”。
例如,当对MPM候选执行MRL方法但不对MFM候选执行MRL方法时,不用信号发送MFM指示符并推断MFM指示符指示“假”。此外,可不用信号发送MPM指示符,并且可推断MPM指示符指示“真”。在这种情况下,在除了预定模式(MFM候选)之外的MPM候选中,由MPM索引指示的模式可被确定为当前块的帧内预测模式。
为了通过使用MPM推导当前块的帧内预测模式,可构建包括M个帧内预测模式作为MPM候选的MPM列表。可从已经被编码/解码的邻近块的帧内预测模式推导MPM候选。可基于当前块的条带类型、颜色分量、尺寸和形状中的至少一个来确定包括在MPM列表中的MPM候选的最大数量。
用于推导MPM候选的邻近块是变化的。例如,图9(a)中所示的子块位置中的至少一个可被用作邻近块。当存在多个用于推导MPM候选的邻近块时,邻近块的顺序根据当前块的条带类型、颜色分量、尺寸和形状中的至少一个而变化。
图25是示出用于推导MPM候选的邻近块的位置的示例的示图。
图26是示出用于推导MPM候选的邻近块的位置的另一示例的示图。
如图25中所示,当当前块的左上方坐标是(XCb,yCB)时,用于推导MPM候选的上方邻近块A是包括坐标(xCB,yCB-1)的最左侧块。此外,用于推导MPM候选的左侧邻近块L可以是包括坐标(xCB-1,yCB)的最上方块。
可选地,如图26中所示,当当前块的左上方坐标是(xCB,yCB)时,用于推导MPM候选的上方邻近块A是包括坐标(xCB+W-1,yCB-1)的块。此外,用于推导MPM候选的左侧邻近块L可以是包括坐标(xCB-1,yCB+H-1)的块。
在图25和图26中,当前块的尺寸是W×H,并且W和H可彼此相同或不同。
当左侧邻近块和/或上方邻近块不可用时,将针对不可用邻近块的帧内预测模式设置为非角度模式。例如,平面模式可被设置为不可用邻近块的帧内预测模式。
例如,当MPM候选的最大数量是3时,使用图14(a)中所示的位置L、A和AL处的邻近块。邻近块的推导顺序可依次为L、A和AL,但不限于此。
例如,当当前块是水平长的矩形形状时,推导顺序是A、L和AL。可选地,可根据顺序L、A和AL来构建MPM列表。
可选地,可使用图14(a)中所示的位置A和位置L处的邻近块的帧内预测模式来构建三个MPM的列表。例如,当位置A处的帧内预测模式和位置L处的帧内预测模式相同且是非角度(DC或平面)模式时,构建MPM列表{平面,DC,垂直}。当位置A处的帧内预测模式和位置L处的帧内预测模式相同且是角度模式时,构建MPM列表{L,2+((L+61)%64),2+((L-1)%64)}。
例如,当MPM候选的最大数量为6时,使用图14(a)中所示的位置A和位置L处的邻近块的帧内预测模式来构建六个MPM的列表。例如,当位置A处的帧内预测模式和位置L处的帧内预测模式相同且是非角度(DC或平面)模式时,构建MPM列表{平面,DC,垂直,水平,垂直-4,垂直+4}。当位置A和位置L处的帧内预测模式相同且是角度模式时,构建MPM列表{L,平面,DC,L-1,L+1,L-2}。
例如,当位置A处的帧内预测模式和位置L处的帧内预测模式彼此不同并且所述两种模式是角度模式时,构建包括位置L和位置A的MPM列表。
在上述示例中,将预定整数与已经包括在MPM列表中的MPM候选相加或从已经包括在MPM列表中的MPM候选减去预定整数,使得另一MPM候选被推导出。这里,预定整数可以是1、2、4或任意整数。
例如,当MPM候选的最大数量是6时,使用图14(b)中所示的位置L、A、LB、AR和AL处的邻近块。邻近块的推导顺序可依次为L、A、LB、AR和AL,但不限于此。例如,当当前块是水平长的矩形形状时,推导顺序是A、L、LB、AR和AL。
当使用最频繁模式(MFM)时,构建N个模式或N个列表,无论MPM列表的构建如何。例如,即使特定模式被推导为MFM,也构建包括推导出的MFM的MPM列表。例如,当MFM是平面模式时,MPM的示例包括平面模式。
可选地,当使用MFM时,构建排除MFM的MPM列表。例如,当MFM是DC模式和平面模式时,构建排除DC模式和平面模式的模式的MPM列表。例如,当MFM是模式18时,构建排除模式18的MPM列表。
当存在一个MFM时,构建仅包括五个MPM候选的MPM列表。例如,仅当MFM指示符具有第二值(例如,“0”或“假”)时,构建MPM列表。
在下文中,在上方相邻块的帧内预测模式为A;左侧相邻块的帧内预测模式为L;并且MFM为平面模式的情况下,将描述构建包括五个MPM候选的MPM列表的方法。
当帧内预测模式A和帧内预测模式L两者是非角度模式(即,DC模式或平面模式)时,仅DC模式被包括在MPM列表中。其余四个MPM候选可以是预定角度模式。预定角度模式可包括例如垂直模式和水平模式。通过将预定偏移与垂直模式和水平模式相加或从垂直模式和水平模式减去预定偏移而获得的模式可被包括在MPM列表中。预定偏移可以是例如-4和+4。因此,除了垂直模式和水平模式之外,诸如“垂直模式-4”、“垂直模式+4”等的模式还可被包括在MPM列表中。然而,偏移不限于上述示例,并且可以是预定整数。
当帧内预测模式A和帧内预测模式L是相同的角度模式时,MPM列表包括角度模式以及通过将预定偏移与角度模式相加或从角度模式减去预定偏移而获得的模式。此外,DC模式可作为默认模式被包括在MPM列表中。例如,MPM列表可由{L,L-1,L+1,DC,L-2}组成。
当帧内预测模式A和帧内预测模式L是不同的角度模式时,帧内预测模式A和帧内预测模式L被包括在MPM列表中。此外,DC模式可作为默认模式被包括在MPM列表中。可基于帧内预测模式A与帧内预测模式L之间的差来确定其余MPM候选。也就是说,确定通过从帧内预测模式A和帧内预测模式L的值中选择的较大值减去较小值而获得的结果值是否在预定范围内,并且根据确定的结果,使用不同的方法来确定其余MPM候选。
当帧内预测模式A和帧内预测模式L中的一个是非角度模式并且另一个是角度模式时,MPM列表包括角度模式以及通过将预定偏移与角度模式相加或从角度模式减去预定偏移而获得的模式。此外,DC模式可作为默认模式被包括在MPM列表中。
可与上述从邻近子块推导N个MFM的方法(在下文中,称为“方法[1]”)类似地构建MPM列表。
例如,基于已经被编码/解码的邻近子块的预测模式的出现频率来推导N个MPM候选,使得MPM列表被构建。
在图10(a)中所示的示例中,当N为2时,模式18和模式15基于出现频率被包括在MPM列表中。
例如,当两个或更多个子块的预测模式的出现频率相同时,根据包括对应子块的块的尺寸来确定优先级。包括子块的块可以是CTU、CU、PU和TU中的至少一个。
可与上述通过在帧内预测模式中选择N个模式来推导MFM的方法(在下文中,称为“方法[2]”)类似地构建MPM列表。
例如,可通过在帧内预测模式中选择频繁出现的N个模式作为MPM候选来构建MPM列表。
MPM列表可包括时间和/或空间邻近块的预测模式作为MPM候选(在下文中,称为“方法[3]”)。
例如,当MPM候选的最大数量为6时,将图9中所示的当前块周围的相邻子块中的至少一个子块的帧内预测模式确定为MPM候选。可选地,可对一个或更多个空间邻近块的帧内预测模式进行组合以构建MPM列表。
例如,当MPM候选的最大数量为6时,使用与M个参考块对应的帧内预测模式。基于存在于考虑POC与当前画面接近的参考画面中的参考块的顺序来确定M个参考块。可选地,可对一个或更多个时间邻近块的帧内预测模式进行组合以建构MPM列表。
例如,当MPM候选的最大数量为6时,使用当前块的空间邻近块的帧内预测模式和参考块的帧内预测模式。
当不存在空间邻近块的帧内预测模式时,将与对应空间邻近块处于相同位置的参考块的帧内预测模式用作替代模式。可选地,可将与空间邻近块的运动信息对应的参考块的帧内预测模式用作替代模式。
可选地,可对一个或更多个空间/时间邻近块的帧内预测模式进行组合以构建MPM列表。
当方法[1]、[2]和[3]中的至少一种方法不能填满MPM列表时,使用所述方法的组合或类似模式来填充MPM列表。
使用方法[1]、[2]和[3]的顺序可以是[1]-[2]-[3]或[2]-[1]-[3],但不限于此。例如,当方法[1]不能填满MPM列表时,使用方法[2]或方法[3]。可选地,当已经包括在MPM列表中的角度MPM候选模式是K时,通过添加诸如K+a、K-a(a是整数1或更大的整数)等的模式来构建MPM列表。
推导MPM候选的顺序可根据当前块的形状而变化。
例如,在当前块的尺寸为W×H且W>H的情况下,当应用方法[1]、[2]或[3]时,优先考虑上方邻近块来推导空间邻近块和/或时间邻近块的预测模式。
在当前块的尺寸为W×H且W>H的情况下,当应用方法[1]、[2]或[3]时,优选考虑左侧邻近块来推导空间邻近块和/或时间邻近块的预测模式。
图13是示出用于建构MPM列表的可用邻近块的示图。
如图13中所示,至少一个已经被编码/解码的邻近块可存在于当前块的上方、左侧和右侧。可根据已经被编码/解码的邻近块存在的位置来不同地构建MPM列表。
例如,当已经被编码/解码的块存在于右侧和上方时,通过从右侧和上方处的至少一个空间和/或时间邻近块推导MPM候选来构建MPM列表。
例如,当已经被编码/解码的块存在于右侧、上方和左侧的全部时,通过从右侧、上方和左侧处的至少一个空间和/或时间邻近块推导MPM候选来构建MPM列表。
可构建一个或更多个MPM列表。例如,可构建三个MPM列表,诸如MPM列表1、MPM列表2和MPM列表3。这里,包括在各个MPM列表中的帧内预测模式可彼此不重叠。
MPM列表包括的MPM候选的最大数量可根据条带类型而变化。例如,在条带I的情况下,MPM候选的最大数量可以是6。在条带P或条带B的情况下,MPM候选的最大数量可以是3。
MPM候选的最大数量可根据颜色分量而变化。例如,在亮度分量的情况下,MPM候选的最大数量可以是6。在色度分量的情况下,MPM候选的最大数量可以是3。
帧内预测模式可由模式编号来表示。取决于模式编号的方向可根据当前块的尺寸和/或形状而变化。因此,即使邻近块的模式与当前块的模式相同,各个方向也可不同。针对当前块的MPM列表可由邻近块的模式或与邻近块的模式最相似的模式组成。
根据当前块的尺寸和/或形状,可用帧内预测的方向可变化。例如,预测方向的范围、预测方向的角度等可变化。也就是说,预测角度可扩展到预定方向,并且针对扩展到该方向的预测角度的模式可代替针对未使用的预测角度的模式。
可根据当前块的形状和/或当前块的水平长度与垂直长度之间的比率(高宽比)来确定扩展的角度预测的角度。例如,当当前块是水平长的矩形形状时,角度预测可以是135度角或更大。此外,针对扩展的角度的模式的模式编号可由-45度角与0度角之间的现有模式的模式编号来替换。
例如,当当前块为垂直长的矩形形状时,角度预测可以是-45度或更小。此外,针对扩展的角度的模式的模式编号可由90度角与135度角之间的现有模式的模式编号来替换。
图21是示出方向根据当前块的模式编号和邻近块的模式编号而变化的示例的示图。
如上所述,基于模式编号的方向可根据块的尺寸和/或形状而变化。因此,当当前块和邻近块的尺寸和/或形状不同时,邻近块的角度模式不被包括在可用于当前块的角度模式中。
例如,如图21(a)中所示,当当前块为正方形形状并且邻近块为水平长的矩形形状时,邻近块的角度模式中的针对扩展的角度的模式不可用于当前块。
类似地,如图21(b)至21(j)中所示,当当前块和邻近块的尺寸和/或形状不同时,邻近块的角度模式是不可用于当前块的角度模式。
当邻近块的角度模式不可用于当前块时,与邻近块的帧内预测模式相似的预测模式被用于构建针对当前块的MPM列表。
在下文中,将描述通过使用图14(a)中所示的位置L和A处的预测模式来推导6个MPM候选的方法。这里,67个帧内预测模式可包括平面(模式0)、DC(模式1)以及范围从-45度角至135度角的角度模式(模式2至模式66)。然而,用于推导MPM候选的邻近块的位置不限于位置L和A,并且MPM候选的最大数量不限于6。
当当前块为水平长的矩形形状时,提供135度角或更大的角度模式。当当前块为垂直长的矩形形状时,提供-45度角或更小的角度模式。存在与扩展的方向角度一样多的不可用的现有方向角度。针对扩展的方向角度的预测模式可由针对不可用的现有方向角度的预测模式的模式编号来表示。
图22是示出表示针对扩展的方向角度的预测模式的模式编号的示图。
现有角度模式和角度如图22(a)中所示。
如图22(b)中所示,当当前块为水平长的矩形形状时,扩展的方向角度是例如137度角(粗体箭头)。在这种情况下,-45度的方向角度不可用。因此,针对137度角的预测模式可由模式2来表示。
类似地,当当前块为垂直长的矩形形状时,针对-47度的扩展的方向角度的预测模式由模式66来表示。
图23是示出通过根据当前块改变邻近块的预测模式来构建MPM列表的示例的示图。
如上所述,邻近块的预测模式和当前块的预测模式可在方向上彼此相反。因此,根据当前块和邻近块的尺寸和/或形状,可自适应地重新定义针对当前块的MPM列表。
例如,当邻近块为水平长的矩形形状并且预测模式是模式2时,实际预测角度超过135度角。因此,邻近块的预测模式可被重新定义为模式66,其中,模式66是正方形形状的当前块的可用模式中的最相似的模式。
例如,当邻近块为垂直长的矩形形状并且预测模式为模式66时,实际预测角度不超过-45度角。因此,邻近块的预测模式可被重新定义为模式2,其中,模式2是正方形形状的当前块的可用模式中的最相似的模式。
通过使用邻近块的重新定义的预测模式,可建构针对当前块的MPM列表。
例如,如图23(a)中所示,使用邻近块的预测模式推导出的针对当前块的MPM列表可由{模式2,平面,DC,模式66,模式3,模式65}组成。考虑当前块与邻近块的尺寸和/或形状的差,可重新定义针对当前块的推导出的MPM列表。如图23(b)中所示的重新定义的MPM列表可由{模式66,平面,DC,模式65,模式2,模式64}组成。
图24是示出通过根据当前块改变邻近块的预测模式来构建MPM列表的另一示例的示图。
在图24(a)中,在重新定义之前,邻近块L和邻近块A具有相同的预测模式,即,模式2。考虑块的尺寸和/或形状,可重新定义每个邻近块的预测模式。重新定义的模式同样为模式66,针对当前块的MPM列表可由{L,平面,DC,L-1,L+1,L-2}={模式66,平面,DC,模式65,模式2,模式64}组成。
在图24(b)中,在重新定义之前,邻近块L和邻近块A具有不同的预测模式,即,模式2和模式3。然而,重新定义的模式可同样为模式66。在这种情况下,针对当前块的MPM列表可由{L,L-1,平面,DC,L-2,L+2}={模式66,模式65,平面,DC,模式64,模式3}组成。也就是说,当重新定义之前的邻近块的预测模式不同但重新定义的预测模式相同时,使用模式L+1(或模式L-1)作为邻近块A的模式来构建MPM列表。
当前块的帧内预测模式可被熵编码/熵解码。
当前块的帧内预测模式可基于每个块被熵编码/熵解码。
关于将被熵编码/熵解码的帧内预测的信息可包括以下项中的至少一项:指示是否进行最可能模式(MFM)匹配的标志;指示N个MFM模式中的一个MFM模式的索引;指示是否进行模板匹配的标志;指示模板匹配区域的索引;指示是否进行最可能模式(MPM)匹配的标志(例如,prev_intra_luma_pred_flag);指示MPM列表中的MPM候选中的一个候选的索引(例如,mpm_idx);指示非MPM候选模式是否属于选择的模式集的标志(例如,selected_mode_set_flag);指示包括在选择的模式集中的模式中的一个模式的索引(例如,selected_mode_idx);指示不是MPM候选且不被包括在选择的模式集中的非MPM非选择模式中的一个模式的索引(例如,non_selected_mode_idx);针对亮度分量的帧内预测模式信息(例如,rem_intra_luma_pred_mode);针对色度分量的帧内预测模式信息(例如,intra_chroma_pred_mode);以及指示针对帧间颜色分量预测的参考集的索引。
可不基于条带类型、块的尺寸和形状中的至少一个用信号发送关于帧内预测的信息中的至少一条信息。
例如,当当前块为预定尺寸和/或当前块为矩形形状时,不用信号发送关于针对当前块的帧内预测的信息中的至少一条信息。在这种情况下,对于不被用信号发送的信息,关于已经被编码/解码的先前块或上方块的信息可被使用。
当对关于帧内预测的信息进行熵编码/熵解码时,使用以下二值化方法中的至少一种方法。
-截断莱斯(rice)二值化方法
-k阶Exp_Golomb二值化方法
-有限k阶Exp_Golomb二值化方法
-固定长度二值化方法
-一元二值化方法
-截断一元二值化方法
-截断二元二值化方法
当对关于帧内预测或通过二值化生成的二进制信息的信息执行熵编码/熵解码时,使用以下项中的至少一项。
-基于上下文的自适应二进制算术编码(CABAC)
-基于上下文的自适应可变长度编码(CAVLC)
-旁路编码
可通过使用当前块的条带类型、尺寸和形状以及邻近块的预测模式中的至少一个,自适应地对关于帧内预测或二进制信息的信息执行熵编码/熵解码。
例如,当左侧邻近块的帧内预测模式与上方邻近块的帧内预测模式相同时,执行CABAC,当左侧邻近块的帧内预测模式与上方邻近块的帧内预测模式不同时,执行旁路编码。
例如,当左侧邻近块的帧内预测模式与上方邻近块的帧内预测模式相同时,使用第一上下文模型来执行CABAC。当左侧邻近块的帧内预测模式与上方邻近块的帧内预测模式不同时,使用第二上下文模型来执行CABAC。
例如,当当前块的条带类型为条带I时,使用第一上下文模型来执行CABAC。当当前块的条带类型为条带P时,使用第二上下文模型来执行CABAC。当当前块的条带类型为条带B时,使用第三上下文模型来执行CABAC。
将参照图14(b)描述通过使用MFM和MPM来推导当前块的帧内预测模式的示例。
如图14(b)中所示,为了推导MFM和/或MPM,可使用当前块的邻近块L、A、LB、AR和AL的帧内预测模式。例如,在邻近块的帧内预测模式中,可将具有最高出现频率的帧内预测模式确定为MFM。针对邻近块的帧内预测模式的推导顺序可依次为L、A、LB、AR和AL。当存在具有最高出现频率的一个或更多个帧内预测模式时,将首先推导出的模式确定为MFM。当当前块的帧内预测模式与推导出的MFM匹配时,指示是否进行匹配的标志MFM_flag被设置为具有第一值(例如,“1”),然后被用信号发送。
此外,可推导N个MPM候选。例如,可推导三个MPM候选。可将与用于推导MFM的邻近块相同的邻近块的帧内预测模式推导为MPM候选。针对MPM候选的推导顺序可依次为L、A、平面、DC、LB、AR、AL、垂直、水平。可将不与MFM匹配的三个模式确定为MPM候选。当MFM_flag具有第二值(例如,“0”)时,用信号发送指示当前块的帧内预测模式是否为推导出的MPM候选中的任意一个候选的标志MPM_flag。
当MPM_flag具有第一值(例如,“1”)时,另外用信号发送指示MPM候选中的与当前块的帧内预测模式相同的模式的索引信息MPM_idx。为了用信号发送MPM_idx,可对一个或更多个二进制位执行上下文编码/解码。例如,可对MPM_idx的第一个二进制位执行使用一个或更多个(例如,两个)上下文模型的编码/解码。当对MPM_idx的第一个二进制位执行使用上下文模型的编码/解码时,使用邻近块的帧内预测模式。例如,当邻近块A的帧内预测模式和邻近块L的帧内预测模式相同时,使用第一上下文模型。当邻近块A的帧内预测模式和邻近块L的帧内预测模式不同时,使用第二上下文模型。可选地,当邻近块A的帧内预测模式和邻近块L的帧内预测模式相同时,使用上下文模型。当邻近块A的帧内预测模式和邻近块L的帧内预测模式不同时,执行旁路编码/解码。
当MPM_flag具有第二值(例如,“0”)时,对其余模式执行熵编码/熵解码。这里,当其余模式的数量不是2n时,使用截断二元二值化方法对当前块的帧内预测模式进行编码/解码。
将参照图14(b)描述通过使用MFM来推导当前块的帧内预测模式的示例。
如图14(b)中所示,可使用当前块的邻近块L、A、LB、AR和AL的帧内预测模式。例如,根据邻近块的帧内预测模式的出现频率,可确定MFM 0、MFM 1、MFM 2、…、MFM N。例如,可存在四个MFM。用于推导MFM的邻近块的顺序可依次为L、A、平面、DC、LB、AR、AL、垂直和水平。当存在多个具有相同的出现频率的模式时,按照所述顺序推导MFM。
可用信号发送指示MFM 0是否与当前块的帧内预测模式匹配的标志MFM0_flag。当MFM0_flag具有第一值(例如,“1”)时,将MFM 0确定为当前块的帧内预测模式,并且不用信号发送关于帧内预测模式的其他信息。当MFM0_flag具有第二值(例如,“0”)时,用信号发送指示MFM 1、MFM 2、…、MFM N中的任意一个是否与当前块的帧内预测模式相同的MFM_flag。当MFM_flag具有第一值(例如,“1”)时,另外用信号发送指示N个MFM中的一个MFM的MFM_idx。当MFM_flag具有第二值(例如,“0”)时,用信号发送用于从除MFM 0至MFM N之外的帧内预测模式确定当前块的帧内预测模式的信息。
将参照图14(b)描述通过使用MPM来推导当前块的帧内预测模式的示例。
如图14(b)中所示,可使用当前块的邻近块L、A、LB、AR和AL的帧内预测模式。例如,可推导三个MPM候选。在邻近块的帧内预测模式中,可将具有最高出现频率的帧内预测模式推导为MPM 0。推导邻近块的帧内预测模式的顺序可依次为例如L、A、LB、AR和AL。当存在两个或更多个具有最高出现频率的帧内预测模式时,可将首先推导出的模式确定为MPM 0。当当前块的帧内预测模式与MPM 0匹配时,指示是否进行匹配的标志MPM0_flag被设置为具有第一值(例如,“1”),然后被用信号发送。
此外,可推导两个MPM候选。例如,根据顺序L、A、平面、DC、LB、AR、AL和垂直,不与MPM 0匹配的两种模式可被选择并被确定为MPM 1和MPM 2。在图14、本发明的其他附图和说明书的描述中,诸如L、A等的块标识字母还可指代对应块的帧内预测模式。当MPM0_flag具有第二值(例如,“0”)时,用信号发送指示当前块的帧内预测模式是否与推导出的MPM 1和推导出的MPM2中的任意一个匹配的标志MPM_flag。当MPM_flag具有第一值(例如,“1”)时,另外用信号发送指示除MPM 0之外的MPM候选中的一个MPM候选的索引信息MPM_idx。由MPM_idx指示的MPM候选可被设置为当前块的帧内预测模式。
可使用上述各种熵编码/熵解码方法中的至少一种方法对MPM_idx和关于其余模式的信息进行编码/解码。
在上述示例中,为了对邻近块的帧内预测模式的出现频率进行计数,使用邻近块L、A、LB、AR和AL的帧内预测模式,但是邻近块不限于上述示例。
在步骤S520,可构建参考样点。
为了基于推导出的帧内预测模式执行帧内预测,可构建参考样点。可使用当前块周围的一个或更多个重建样点或其组合来构建参考样点。此外,可将滤波应用于构建的参考样点。多条重建样点线上的重建样点中的每一个可照原样被用于构建参考样点。可选地,通过在同一条重建样点线上的样点之间进行滤波,可构建参考样点。可选地,通过在不同的重建样点线上的样点之间进行滤波,可构建参考样点。构建的参考样点可由ref[m,n]来表示,并且邻近重建样点或通过对该邻近重建样点进行滤波而获得的样点可由rec[m,n]来表示。这里,m或n可以是预定整数。当当前块的水平尺寸和垂直尺寸分别由W和H来表示并且当前块内的左上样点的位置是(0,0)时,当前块的左上参考样点的位置被设置为(-1,-1)。
可使用与当前块相邻的一条或更多条重建样点线来构建参考样点。
可在图7中所示的多条重建样点线中选择一条线来构建参考样点。这里,可用信号发送针对所选择的重建样点线的指示符。
可选地,可使用图7中的两条或更多条重建样点线的组合来构建参考样点。例如,如方程式1中所示,可使用加权和来构建参考样点,其中,根据与当前块的距离来分配不同的加权因子。
[方程式1]
ref[-1,-1]=(rec[-2,-1]+2*rec[-1,-1]+rec[-1,-2]+2)>>2
ref[x,-1]=(rec[x,-2]+3*rec[x,-1]+2)>>2,(x=0~2*W-1)
ref[-1,y]=(rec[-2,y]+3*rec[-1,y]+2)>>2,(y=0~2*H-1)
基于距当前块的距离和当前块的帧内预测模式中的至少一个,计算多个重建样点的平均值、最大值、最小值和中值中的至少一个,从而构建参考样点。
通过这种处理,可构建一条或更多条参考样点线。
可以以不同方式构建当前块的上参考样点和当前块的左参考样点。可对指示用于构建参考样点的方法的信息进行编码/解码。例如,可对指示是否使用多条重建样点线的信息进行编码/解码。
可确定用于构建参考样点的邻近重建样点的可用性。
例如,当邻近重建样点位于包括当前块的画面、条带、并行块和CTU中的至少一个区域外时,确定邻近重建样点不可用。例如,当邻近重建样点被包括在帧间预测块中时,确定邻近重建样点不可用。
当确定邻近重建样点不可用时,另一可用邻近重建样点被用于替换不可用邻近重建样点。例如,可使用以下方法中的至少一种方法来替换不可用邻近重建样点。
图15是示出使用可用样点来替换不可用样点的示例的示图。
例如,可用从由数字0表示的左下样点的位置开始的可用样点来填充不可用样点。例如,在图15中所示的示例中,可用第一可用样点的样点值“a”来填充前四个不可用样点。此外,可用紧接在前的可用样点的样点值“b”来填充后续的13个不可用样点。
例如,可使用可用样点的组合来填充不可用样点。例如,可使用位于一组不可用样点的两端处的可用样点来填充不可用样点。在这种情况下,可用第一可用样点的样点值“a”来填充前四个不可用样点。然后,可使用两个可用样点的样点值“b”和“c”来填充后续的13个不可用样点。例如,可使用“b”和“c”的平均值或加权平均值。应用于加权平均值的加权因子可与到可用样点的距离成反比。也就是说,可向距当前不可用样点较短距离的可用样点分配较大的加权因子。
可将滤波应用于一个或更多个构件的参考样点。这里,可基于当前块的帧内预测模式、尺寸和形状中的至少一个来确定是否应用滤波。此外,当应用滤波时,滤波器类型可基于当前块的帧内预测模式、尺寸和形状中的至少一个而变化。
当使用多条参考样点线时,针对每条参考样点线不同地应用滤波。例如,是否应用滤波可变化,或者滤波器类型可变化。例如,可将滤波应用于与当前块相邻的第一参考样点线,并且可不将滤波应用于第二参考样点线。例如,可将不同类型的滤波器应用于第一参考样点线和第二参考样点线。
当执行帧内预测时,使用应用了滤波的参考样点以及未应用滤波的参考样点两者。
当应用滤波时,基于当前块的帧内预测模式、尺寸和形状中的至少一个,选择并应用3抽头滤波器、5抽头滤波器和7抽头滤波器中的至少一个。
在步骤S530,基于推导出的帧内预测模式和参考样点,可对当前块执行帧内预测。
例如,可对当前块执行非角度帧内预测。非角度帧内预测模式可以是除角度模式之外的任意模式。
可选地,可对当前块执行角度帧内预测。可使用包括水平模式和垂直模式的具有各种角度的模式中的至少一个来执行角度预测模式。
可选地,可对当前块执行基于位置信息的帧内预测。可对位置信息进行编码/解码,并且可将该位置处的重建块推导为当前块的帧内预测块。可选地,解码器可搜索与当前块相似的块。可将找到的块推导为当前块的帧内预测块。重建块或找到的块可以是包括在当前画面中的重建块。
可选地,可对当前块执行帧间颜色分量帧内预测。
为了执行帧间颜色分量帧内预测,可构建至少一个线性模型。
为了构建线性模型,可确定使亮度分量与颜色分量之间的回归误差最小化的参数。
图16是示出确定针对帧间颜色分量预测的线性参数的方法的示图。
可使用图16中所示的参考样点的位置通过方程式2来确定当前块的线性参数α和β。
[方程式2]
Figure BDA0002885398940000551
当存在两个或更多个线性模型时,确定多个线性参数。
将被参考以确定线性参数的样点的各种位置可被构建。
可根据已经被编码/解码的亮度块的帧内预测模式来构建不同的参考样点。
图17是示出对帧内预测模式的方向进行分类的示例的示图。
如图17中所示,帧内预测模式中的角度模式可被分类为具有左正(LeftPositive)、上正(Above Positive)和负(Negative)模式的方向中的一个方向。
图18是示出根据帧内预测模式构建参考样点的方法的示图。
如图18中所示,可使用当前块周围的参考样点区域中的至少一个区域来构建参考样点。参考样点区域可由一条或更多条参考样点线组成。
例如,当亮度块的帧内预测模式是非角度模式时,使用一条或更多条参考样点线来构建一个或更多个线性模型。
例如,当亮度块的帧内预测模式为左正模式中的一个时,使用左样点(L1、L2、…)中的一个或更多个参考样点来构建一个或更多个线性模型。
例如,当亮度块的帧内预测模式为上正模式中的一个时,使用上样点(A1、A2、…)中的一个或更多个参考样点来构建一个或更多个线性模型。
例如,当亮度块的帧内预测模式为垂直模式时,使用上样点(A1、A3、…)中的一个或更多个参考样点来构建一个或更多个线性模型。
例如,当亮度块的帧内预测模式为水平模式时,使用左样点(L1、L3、…)中的一个或更多个参考样点来构建一个或更多个线性模型。
例如,当亮度块的帧内预测模式为负模式中的一个时,使用左上样点(AL)、上样点(A)和左样点(L)中的一个或更多个参考样点来构建一个或更多个线性模型。
这里,针对亮度块的构建的参考样点可根据线性参数被用于替换针对色度块的参考样点,由此当前色度块被帧内预测。这里,可将经过编码/解码的亮度块的预测模式和现有色度预测模式中的至少一个选为当前色度块的帧内预测模式。
为了构建线性模型,可确定使两个颜色分量Cb与Cr之间的回归误差最小化的参数。
使用图16中所示的参考样点的位置,可确定当前块的线性参数。
例如,可如方程式3中所示确定用于通过使用色度分量Cb来推导色度分量Cr的线性参数。
[方程式3]
Figure BDA0002885398940000571
λ=∑(Cb(n)Cb(n))>>9
例如,可如方程式4中所示确定用于通过使用色度分量Cr来推导另一色度分量Cb的线性参数。
[方程式4]
Figure BDA0002885398940000572
λ=∑(Cr(n)Cr(n))>>9
这里,可用信号发送针对选择的帧间颜色分量预测的指示符。
可构建用于确定线性参数的参考样点的各种位置。例如,可针对亮度分量和色度分量使用相同的参考样点区域来构建线性模型。
考虑运算的复杂度,使用简单的运算来推导线性参数,从而构建线性模型。
例如,使用图16中所示的参考样点的位置的线性模型可如下被表示。可如在方程式5中确定针对当前块的线性模型的线性参数。
[方程式5]
PredC=α×RecL十β
Figure BDA0002885398940000573
当存在m个线性模型被使用时,m个线性参数(α1m1m)被确定。
在一些情况下,m个模型可彼此不同。
例如,可通过根据RecL分配阈值来确定要使用的模型。
例如,当指示线性模型的数量的m为1时,通过对各种模型进行组合来确定参数α和β。
例如,当存在参数α1和α2时,参数α被确定为参数α1和α2的平均值。
例如,当存在参数β1和β2时,参数β被确定为参数β1和β2的平均值。
为了推导参数α和β,可如下使用参考样点。此外,至少一种方法被用于m个模型中的每一个以推导参数α和β。
这里,LA和LB可以是针对亮度分量的参考样点,并且CA和CB可以是针对色度分量的参考样点。
例如,LA可以是针对亮度分量的参考样点的第n最大值,并且LB可以是针对亮度分量的参考样点的第n最小值。CA和CB可分别是与LA和LB对应的针对色度分量的参考样点值。
例如,LA可以是针对亮度分量的参考样点的第n最大值和第n-1最大值的平均值。LB可以是针对亮度分量的参考样点的第n最小值和第n-1最小值的平均值。这里,CA可以是与针对亮度分量的参考样点的第n最大值和第n-1最大值对应的针对色度分量的参考样点值的平均值。此外,CB可以是与针对亮度分量的参考样点的第n最小值和第n-1最小值对应的针对色度分量的参考样点值的平均值。这里,n可以是2。在这种情况下,LA可以是针对亮度分量的参考样点的第一最大值和第二最大值的平均值,并且LB可以是第一最小值和第二最小值的平均值。此外,CA可以是与针对亮度分量的参考样点的第一最大值和第二最大值对应的针对色度分量的参考样点值的平均值。此外,CB可以是与针对亮度分量的参考样点的第一最小值和第二最小值对应的针对色度分量的参考样点值的平均值。
例如,LA可以是针对亮度分量的参考样点的第n最大值。LB可以是针对亮度分量的参考样点的第n最小值。这里,CA可以是针对色度分量的参考样点的第n最大值,并且CB可以是针对色度分量的参考样点的第n最小值。
例如,LA可以是针对亮度分量的参考样点的第n最大值和第n-1最大值的平均值。LB可以是针对亮度分量的参考样点的第n最小值和第n-1最小值的平均值。这里,CA可以是针对色度分量的参考样点的第n最大值和第n-1最大值的平均值。CB可以是针对色度分量的参考样点的第n最小值和第n-1最小值的平均值。
例如,基于全部亮度分量的平均值,针对亮度分量的参考样点可被划分为两组。这里,LA可以是针对亮度分量的第一组的参考样点的平均值,并且LB可以是针对亮度分量的第二组的参考样点的平均值。这里,CA可以是针对色度分量的第一组的参考样点的平均值,并且CB可以是针对色度分量的第二组的参考样点的平均值。
此外,LC可以是针对亮度分量的参考样点,并且CC可以是针对色度分量的参考样点。
例如,LC可以是针对亮度分量的参考样点的第n最小值或最大值,并且CC可以是与LC对应的针对色度分量的参考样点值。
例如,LC可以是针对亮度分量的全部参考样点的平均值,并且CC可以是针对色度分量的全部参考样点的平均值。
例如,LC可以是针对亮度分量的参考样点的最大值和最小值的平均值(例如,(最大值+最小值+1)>>1)。CC可以是针对色度分量的参考样点的最大值和最小值的平均值。
可根据块的尺寸、形状以及邻近块是否被帧内预测中的至少一个来构建不同的参考样点。
例如,当当前块的尺寸小于预定尺寸时,使用一条或更多条参考样点线来构建一个或更多个线性模型。
图19是示出根据邻近块的预测模式来构建线性模型的方法的示图。
在图19中,块a至块m是当前块的邻近块。阴影块是帧间预测块,其余块是帧内预测块。
如图19(a)中所示,当当前块的全部邻近块被帧内预测时,使用属于经过帧内预测的邻近块的样点中的至少一个样点来构建线性模型。
如图19(b)中所示,当当前块的邻近块中的一些上方邻近块被帧间预测时,使用属于经过帧内预测的邻近块的样点中的至少一个样点来构建线性模型。
如图19(c)中所示,当当前块的邻近块中的一些左侧邻近块被帧间预测时,使用属于经过帧内预测的邻近块的样点中的至少一个样点来构建线性模型。
可构建各种参考样点集,并且可对指示这里使用的参考样点集的索引进行编码/解码。
可根据当前块的尺寸来构建不同的参考样点集。
参照图18,将描述构建参考样点集的各种示例。
在当前块的尺寸为4×4的情况下,构建各种组,诸如{A1,L1}、{A1,A2,L1,L2}、{A1,A3,L1,L3}、{A1,A3,A5,L1,L3,L5}、{A1,A2,A5,L1,L3,L5}等,并且在其中选择至少一个组,从而构建参考样点集。
在当前块的尺寸为8×8的情况下,构建各种组,诸如{A1,L1}、{A1,A2,L1,L2}、{A1,A3,L1,L3}等,并且在其中选择至少一个组,从而构建参考样点集。
将4×4尺寸或8×8尺寸的块设置为单位块,并且可针对任意尺寸的当前块基于单位块中的至少一个来构建参考样点集。可选地,可使用两个或更多个单位块的组合。这里,构建各种组,诸如{A1,L1}、{A1,A2,L1}、{L1,L2,A1}、{L1,L2,L3,L4,A1}、{A1,A2,A3,A4,L1}等,并且在其中选择至少一个组,从而构建参考样点集。
可根据当前块的帧内预测模式来构建不同的参考样点集。
图20是示出根据帧内预测模式的参考样点集的示图。
在当前块的帧内预测模式是非角度的情况下,构建各种组,诸如{L1,A1}、{L3,A3}、{L1,L3,A1,A3}、{L1,L3,L5,A1,A3,A5}等,并且在其中选择至少一个组,从而构建参考样点集。
在当前块的帧内预测模式是左正预测模式的情况下,构建各种组,诸如{L1,L2}、{L1,L2,AL1}、{L1,L4,AL1}、{L1,L2,L3,L4,AL1}、{L1,L2,L3,L4,L5,L6}、{L1,L2,L3,L4,AL1,AL2,AL3,AL4}等,并且在其中选择至少一个组,从而构建参考样点集。例如,如图20(a)中所示,参考样点集可被构建为由{L1,L2}组成的组。
在当前块的帧内预测模式是上正预测模式的情况下,构建各种组,诸如{A1,A2}、{A1,A2,AL1}、{A1,A4,AL1}、{A1,A2,A3,A4,AL1}、{A1,A2,A3,A4,A5,A6}、{A1,A2,A3,A4,AL1,AL2,AL3,AL4}等,并且在其中选择至少一个组,从而构建参考样点集。例如,如图20(b)中所示,参考样点集可被构建为由{A1,A2}组成的组。
在当前块的帧内预测模式是垂直预测模式的情况下,构建各种组,诸如{A1}、{A1,A3}、{A1,A3,A5}等,并且在其中选择至少一个组,从而构建参考样点集。例如,如图20(c)中所示,该集可被构建为由{A1,A3,A5,A7}组成的组。
在当前块的帧内预测模式是水平预测模式的情况下,构建各种组,诸如{L1}、{L1,L3}、{L1,L3,L5}等,并且在其中选择至少一个组,从而构建参考样点集。例如,如图20(d)中所示,该集可被构建为由{L1,L3,L5,L7}组成的组。
在当前块的帧内预测模式是负预测模式的情况下,构建各种组,诸如{L1,A1,AL1}、{L1,L2,A1,A2,AL1}、{L1,L3,A1,A3,AL1,AL2,AL3,AL4}、{L1,L2,L3,L4,A1,A2,A3,A4,AL1,AL2,AL3,AL4}等,并且在其中选择至少一个组,从而构建参考样点集。
可针对亮度分量根据应用于当前块的降采样滤波器的类型来建构不同的参考样点集。
对于降采样,可选择性地应用2抽头滤波器、4抽头滤波器和6抽头滤波器中的至少一个。
在降采样滤波器在垂直方向上使用亮度样点的情况下,建构各种组,诸如{A1}、{A1,A3}、{A1,A3,A5}等,并且在其中选择至少一个组,由此建构参考样点集。
在降采样滤波器在水平方向上使用亮度样点的情况下,建构各种组,诸如{L1}、{L1,L3}、{L1,L3,L5}等,并且在其中选择至少一个组,由此建构参考样点集。
在降采样滤波器在-45度对角线方向上使用亮度样点的情况下,建构各种组,诸如{L1,A1,AL1}、{L1,L2,A1,A2,AL1}、{L1,L3,A1,A3,AL1,AL2,AL3,AL4}、{L1,L2,L3,L4,A1,A2,A3,A4,AL1,AL2,AL3,AL4}等,并且在其中选择至少一个组,由此建构参考样点集。
在降采样滤波器在水平方向、垂直方向和-45度对角线方向上使用亮度样点的情况下,建构各种组,诸如{L1,A1}、{L3,A3}、{L1,L3,A1,A3}、{L1,L3,L5,A1,A3,A5}等,并且在其中选择至少一个组,由此建构参考样点集。
可对用于指示多个参考样点集中的一个参考样点集的索引进行熵编码/熵解码。这里,可使用以下方法中的至少一种方法:截断莱斯二值化方法、k阶Exp_Golomb二值化方法、有限k阶Exp_Golomb二值化方法、固定长度二值化方法、一元二值化方法、截断一元二值化方法和截断二元二值化方法。
可在编码器和解码器中以相同的方法执行上述实施例。
上述实施例中的至少一个或组合可被用于对视频进行编码/解码。
应用以上实施例的顺序在编码器与解码器之间可不同,或者应用以上实施例的顺序在编码器和解码器中可相同。
可对每个亮度信号和色度信号执行以上实施例,或者可对亮度信号和色度信号相同地执行以上实施例。
应用本发明的以上实施例的块形状可具有正方形形状或非正方形形状。
可根据编码块、预测块、变换块、块、当前块、编码单元、预测单元、变换单元、单元和当前单元中的至少一个的尺寸来应用本发明的以上实施例。这里,尺寸可被定义为使得以上实施例被应用的最小尺寸或最大尺寸或者最小尺寸和最大尺寸两者,或者可被定义为以上实施例被应用于的固定尺寸。此外,在以上实施例中,可将第一实施例应用于第一尺寸,并且可将第二实施例应用于第二尺寸。换句话说,可根据尺寸组合地应用以上实施例。此外,当尺寸等于或大于最小尺寸且等于或小于最大尺寸时,可应用以上实施例。换句话说,当块尺寸被包括在特定范围内时,可应用以上实施例。
例如,当当前块的尺寸是8×8或更大时,可应用以上实施例。例如,当当前块的尺寸仅是4×4时,可应用以上实施例。例如,当当前块的尺寸是16×16或更小时,可应用以上实施例。例如,当当前块的尺寸等于或大于16×16且等于或小于64×64时,可应用以上实施例。
可根据时间层来应用本发明的以上实施例。为了识别以上实施例可被应用于的时间层,可用信号发送对应标识符,并且可将以上实施例应用于由对应标识符标识的指定时间层。这里,标识符可被定义为以上实施例可被应用于的最低层或最高层或最低层和最高层两者,或者可被定义为指示该实施例被应用于的特定层。此外,可定义实施例被应用于的固定时间层。
例如,在当前图像的时间层是最低层时,可应用以上实施例。例如,在当前图像的时间层标识符是1时,可应用以上实施例。例如,在当前图像的时间层是最高层时,可应用以上实施例。
可定义本发明的以上实施例被应用于的条带类型或并行块组类型,并且可根据对应的条带类型或并行块组类型来应用以上实施例。
在上述实施例中,基于具有一系列步骤或单元的流程图描述了方法,但是本发明不限于这些步骤的顺序,而是一些步骤可与其他步骤同时执行或以不同的顺序执行。此外,本领域的普通技术人员应该理解,流程图中的步骤并不互相排斥,并且在不影响本发明的范围的情况下,可将其他步骤添加到流程图或者可将步骤中的一些步骤从流程图删除。
实施例包括示例的各个方面。可不描述各个方面的所有可能的组合,但是本领域技术人员将能够认识到不同的组合。因此,本发明可包括权利要求范围内的所有替换、修改和改变。
本发明的实施例可以以程序指令的形式实现,其中,该程序指令可由各种计算机组件执行并且被记录在计算机可读记录介质中。计算机可读记录介质可单独地包括程序指令、数据文件、数据结构等,或者可包括程序指令、数据文件、数据结构等的组合。记录在计算机可读记录介质中的程序指令可以是为本发明专门设计和构建的,或者对于计算机软件技术领域的普通技术人员是公知的。计算机可读记录介质的示例包括磁记录介质(诸如,硬盘、软盘和磁带)、光学数据存储介质(诸如,CD-ROM或DVD-ROM)、磁光介质(诸如软光盘)以及被专门构建为存储和实现程序指令的硬件装置(诸如,只读存储器(ROM)、随机存取存储器(RAM)、闪存等)。程序指令的示例不仅包括由编译器格式化的机械语言代码,而且包括可由计算机使用解释器来实现的高级语言代码。硬件装置可被配置为由一个或更多个软件模块操作或者反之亦可,以进行根据本发明的处理。
尽管已经在特定项目(诸如,详细元件)以及有限的实施例和附图方面描述了本发明,但是它们仅被提供以帮助更全面地理解本发明,并且本发明不限于以上实施例。本发明所属领域的技术人员将理解,可对以上描述进行各种修改和改变。
因此,本发明的精神不应限于上述实施例,并且所附权利要求及其等同物的整个范围将落入本发明的范围和精神内。
工业实用性
本发明可被用于对图像进行编码或解码。

Claims (20)

1.一种图像解码方法,包括:
重建指示当前块的帧内预测模式是否为预定帧内预测模式的最频繁模式(MFM)指示符;
基于MFM指示符推导当前块的帧内预测模式;并且
通过基于所述帧内预测模式对当前块执行帧内预测来生成当前块的预测块。
2.如权利要求1所述的图像解码方法,其中,所述预定帧内预测模式是平面模式。
3.如权利要求1所述的图像解码方法,其中,当MFM指示符具有第一值时,将当前块的帧内预测模式推导为所述预定帧内预测模式。
4.如权利要求1所述的图像解码方法,其中,当MFM指示符具有第二值时,基于当前块的邻近块的帧内预测模式来构建最可能模式(MPM)列表,并且基于MPM列表推导当前块的帧内预测模式。
5.如权利要求4所述的图像解码方法,其中,MPM列表被构建为不包括所述预定帧内预测模式。
6.如权利要求4所述的图像解码方法,其中,当前块的邻近块包括当前块的右上方块和当前块的左下方块中的至少一个。
7.如权利要求4所述的图像解码方法,其中,当邻近块的帧内预测模式不可用时,将邻近块的不可用帧内预测模式设置为平面模式。
8.如权利要求4所述的图像解码方法,其中,MPM列表包括五个MPM候选。
9.如权利要求4所述的图像解码方法,还包括:
重建指示当前块的帧内预测模式是否被包括在MPM列表中的MPM指示符,
其中,仅当MPM指示符具有第一值时,从比特流重建MFM指示符。
10.如权利要求1所述的图像解码方法,其中,选择多条参考样点线中的一条以执行所述帧内预测,并且
仅当所选择的参考样点线是第一参考样点线时,对所述参考样点线执行滤波。
11.一种图像编码方法,包括:
确定当前块的帧内预测模式;
通过基于所述帧内预测模式对当前块执行帧内预测来生成当前块的预测块;
确定当前块的帧内预测模式是否为预定帧内预测模式;并且
基于确定的结果,对最频繁模式(MFM)指示符进行编码。
12.如权利要求11所述的图像编码方法,其中,所述预定帧内预测模式是平面模式。
13.如权利要求11所述的图像编码方法,其中,当当前块的帧内预测模式是所述预定模式时,将MFM指示符编码为第一值。
14.如权利要求11所述的图像编码方法,其中,当当前块的帧内预测模式不是所述预定模式时,将MFM指示符编码为第二值,基于当前块的邻近块的帧内预测模式来构建最可能模式(MPM)列表,并且基于MPM列表对当前块的帧内预测模式进行编码。
15.如权利要求14所述的图像编码方法,其中,MPM列表被构建为不包括所述预定帧内预测模式。
16.如权利要求14所述的图像编码方法,其中,当前块的邻近块包括当前块的右上方块和当前块的左下方块中的至少一个。
17.如权利要求14所述的图像编码方法,其中,当邻近块的帧内预测模式不可用时,将邻近块的不可用帧内预测模式设置为平面模式。
18.如权利要求14所述的图像编码方法,还包括:
对指示当前块的帧内预测模式是否被包括在MPM列表中的MPM指示符进行编码,
其中,仅当MPM指示符具有第一值时,对MFM指示符进行编码。
19.如权利要求11所述的图像编码方法,其中,选择多条参考样点线中的一条以执行所述帧内预测,并且
仅当所选择的参考样点线是第一参考样点线时,对所述参考样点线执行滤波。
20.一种存储比特流的计算机可读记录介质,其中,所述比特流由图像解码设备接收、解码并使用以重建图像,其中,所述比特流包括指示当前块的帧内预测模式是否为预定帧内预测模式的最频繁模式(MFM)指示符,
MFM指示符被用于推导当前块的帧内预测模式,并且
所述帧内预测模式被用于通过对当前块执行帧内预测来生成当前块的预测块。
CN201980045499.9A 2018-07-06 2019-07-05 图像编码/解码方法和装置以及存储比特流的记录介质 Pending CN112385215A (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
KR10-2018-0078553 2018-07-06
KR20180078553 2018-07-06
KR10-2018-0112725 2018-09-20
KR20180112725 2018-09-20
KR20180170437 2018-12-27
KR10-2018-0170437 2018-12-27
KR20190053116 2019-05-07
KR10-2019-0053116 2019-05-07
PCT/KR2019/008260 WO2020009514A1 (ko) 2018-07-06 2019-07-05 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체

Publications (1)

Publication Number Publication Date
CN112385215A true CN112385215A (zh) 2021-02-19

Family

ID=69060487

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980045499.9A Pending CN112385215A (zh) 2018-07-06 2019-07-05 图像编码/解码方法和装置以及存储比特流的记录介质

Country Status (4)

Country Link
US (2) US11818340B2 (zh)
KR (1) KR20200005480A (zh)
CN (1) CN112385215A (zh)
WO (1) WO2020009514A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116366845A (zh) * 2018-03-09 2023-06-30 韩国电子通信研究院 使用样点滤波的图像编码/解码方法和设备
WO2020058894A1 (en) 2018-09-19 2020-03-26 Beijing Bytedance Network Technology Co., Ltd. Multiple prediction blocks for one intra-coded block
WO2020077003A1 (en) * 2018-10-10 2020-04-16 Interdigital Vc Holdings, Inc. Affine mode signaling in video encoding and decoding
CN116939199A (zh) * 2019-03-11 2023-10-24 日本放送协会 图像编码装置、图像解码装置和程序
CN118138754A (zh) 2019-06-14 2024-06-04 北京字节跳动网络技术有限公司 处理视频单元边界和虚拟边界
CN113994671B (zh) 2019-06-14 2024-05-10 北京字节跳动网络技术有限公司 基于颜色格式处理视频单元边界和虚拟边界
US11507838B2 (en) * 2019-06-28 2022-11-22 Intel Corporation Methods and apparatus to optimize execution of a machine learning model
JP7291846B2 (ja) * 2019-07-09 2023-06-15 北京字節跳動網絡技術有限公司 適応ループフィルタリングのためのサンプル決定
KR102648121B1 (ko) 2019-07-11 2024-03-18 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 적응적 루프 필터링에서의 샘플 패딩
CN117676168A (zh) * 2019-07-15 2024-03-08 北京字节跳动网络技术有限公司 自适应环路滤波中的分类
EP4018652A4 (en) 2019-09-22 2022-11-02 Beijing Bytedance Network Technology Co., Ltd. FILLING METHOD IN AN ADAPTIVE LOOP FILTER
JP7326600B2 (ja) 2019-09-27 2023-08-15 北京字節跳動網絡技術有限公司 異なるビデオユニット間の適応ループフィルタリング
CN112616057A (zh) 2019-10-04 2021-04-06 Oppo广东移动通信有限公司 图像预测方法、编码器、解码器以及存储介质
JP7454042B2 (ja) 2019-10-10 2024-03-21 北京字節跳動網絡技術有限公司 適応ループ・フィルタリングにおける利用可能でないサンプル位置でのパディング・プロセス
EP4090014A4 (en) * 2020-01-08 2024-01-03 Guangdong Oppo Mobile Telecommunications Corp., Ltd. ENCODING METHOD, DECODING METHOD, ENCODER, DECODER, AND STORAGE MEDIUM
CN111586405B (zh) * 2020-04-24 2022-03-29 中南大学 一种多功能视频编码中基于alf滤波的预测模式快速选择方法
CN117813818A (zh) * 2021-08-18 2024-04-02 Lg 电子株式会社 基于帧内预测模式执行参考样本滤波的图像编码/解码方法和装置以及用于发送比特的方法
WO2023081322A1 (en) * 2021-11-03 2023-05-11 Beijing Dajia Internet Information Technology Co., Ltd. Intra prediction modes signaling

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1232126C (zh) * 2002-09-30 2005-12-14 三星电子株式会社 图像编码方法和装置以及图像解码方法和装置
US9532058B2 (en) 2011-06-03 2016-12-27 Qualcomm Incorporated Intra prediction mode coding with directional partitions
CN103609110B (zh) * 2011-06-13 2017-08-08 太阳专利托管公司 图像解码方法、图像编码方法、图像解码装置、图像编码装置及图像编码解码装置
PT2887670T (pt) * 2011-06-28 2017-09-18 Samsung Electronics Co Ltd Método e aparelho para codificar vídeo e método e aparelho para descodificar vídeo, acompanhados com intra previsão
KR101611409B1 (ko) * 2011-09-28 2016-04-14 한국전자통신연구원 인트라 예측 모드 부호화/복호화 방법 및 장치
EP3276958A4 (en) 2015-03-23 2018-08-29 LG Electronics Inc. Method for processing image on basis of intra prediction mode and apparatus therefor
US10547854B2 (en) 2016-05-13 2020-01-28 Qualcomm Incorporated Neighbor based signaling of intra prediction modes
WO2018080135A1 (ko) * 2016-10-28 2018-05-03 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
EP3422716A1 (en) * 2017-06-26 2019-01-02 Thomson Licensing Method and apparatus for most probable mode (mpm) sorting and signaling in video encoding and decoding
CN110662065A (zh) * 2018-06-29 2020-01-07 财团法人工业技术研究院 图像数据解码方法及解码器、图像数据编码方法及编码器

Also Published As

Publication number Publication date
US20240064295A1 (en) 2024-02-22
KR20200005480A (ko) 2020-01-15
US20210281838A1 (en) 2021-09-09
WO2020009514A1 (ko) 2020-01-09
US11818340B2 (en) 2023-11-14

Similar Documents

Publication Publication Date Title
CN112385215A (zh) 图像编码/解码方法和装置以及存储比特流的记录介质
CN113273213B (zh) 图像编码/解码方法和设备以及存储比特流的记录介质
CN111279695A (zh) 用于基于非对称子块的图像编码/解码的方法及装置
CN111164974A (zh) 图像编码/解码方法和设备以及用于存储比特流的记录介质
CN112740685A (zh) 图像编码/解码方法和装置以及存储有比特流的记录介质
CN112369021A (zh) 用于吞吐量增强的图像编码/解码方法和设备以及存储比特流的记录介质
CN112740697A (zh) 图像编码/解码方法和装置及存储比特流的记录介质
CN112740684A (zh) 用于对图像进行编码/解码的方法和装置以及用于存储比特流的记录介质
CN113574875A (zh) 基于帧内块复制的编/解码方法和装置及比特流存储介质
CN112673629A (zh) 视频编码/解码方法和装置以及用于存储比特流的记录介质
CN112740694A (zh) 用于对图像进行编码/解码的方法和设备以及用于存储比特流的记录介质
CN113273188A (zh) 图像编码/解码方法和装置以及存储有比特流的记录介质
CN114342372A (zh) 帧内预测模式、以及熵编解码方法和装置
CN113261286A (zh) 用于推导帧内预测模式的方法和设备
CN112740671A (zh) 图像编码/解码方法和装置以及存储比特流的记录介质
CN113906740A (zh) 帧间预测信息编码/解码方法和装置
CN113574868A (zh) 图像编码/解码方法和设备以及存储比特流的记录介质
CN113228681A (zh) 图像编码/解码方法和装置以及存储比特流的记录介质
CN113170104A (zh) 使用基于区域的帧间/帧内预测的编码/解码方法和设备
CN113875235A (zh) 图像编码/解码方法和装置及存储比特流的记录介质
CN113841399A (zh) 图像编码/解码方法和设备
CN113841404A (zh) 视频编码/解码方法和设备以及存储比特流的记录介质
CN113950831A (zh) 基于帧内块复制的编/解码方法、装置和比特流存储介质
CN113906743A (zh) 量化矩阵编码/解码方法和装置、以及存储比特流的记录介质
CN113545052A (zh) 图像编码/解码方法和装置以及存储比特流的记录介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination