CN113287310A - 用于对图像信号进行编码/解码方法及其装置 - Google Patents

用于对图像信号进行编码/解码方法及其装置 Download PDF

Info

Publication number
CN113287310A
CN113287310A CN202080006953.2A CN202080006953A CN113287310A CN 113287310 A CN113287310 A CN 113287310A CN 202080006953 A CN202080006953 A CN 202080006953A CN 113287310 A CN113287310 A CN 113287310A
Authority
CN
China
Prior art keywords
block
transform
current block
sub
motion information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080006953.2A
Other languages
English (en)
Inventor
李培根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xris Corp
Original Assignee
Xris Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xris Corp filed Critical Xris Corp
Publication of CN113287310A publication Critical patent/CN113287310A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

根据本发明的用于对图像进行解码的方法包括以下步骤:在水平方向上或垂直方向上将编码块分区为多个子块;确定是否将第二逆变换应用于所述编码块;以及当确定将第二逆变换应用于所述编码块时,将第二逆变换应用于所述多个子块中的至少一个子块。

Description

用于对图像信号进行编码/解码方法及其装置
技术领域
本公开涉及一种视频信号编码/解码方法及其装置。
背景技术
随着显示面板变得更大,需要更高质量的视频服务。高清视频服务的最大问题是数据量大大地增加。为了解决以上问题,正在积极进行提高视频压缩率的研究。作为代表性示例,视频编码联合协作组(JCT-VC)在2009年由国际电信联盟-电信(ITU-T)下的运动图像专家组(MPEG)和视频编码专家组(VCEG)组建。JCT-VC提出高效视频编码(HEVC),一种压缩性能是H.264/AVC的约两倍且在2013年1月25日被批准为标准的视频压缩标准。然而,随着高清视频服务的快速发展,HEVC的性能逐渐显示出它的局限性。
发明内容
技术目的
本公开的目的是提供一种用于在对视频信号进行编码/解码中执行第二变换的方法及其装置。
本公开的目的是提供一种用于在对视频信号进行编码/解码中确定是否将第二变换应用于应用了子分区帧内编码方法的编码块的方法及其装置。
本公开的目的是提供一种用于在对视频信号进行编码/解码中将第二变换应用于编码块中包括的子块的方法及其装置。
可从本公开获得的技术目的不限于上述技术目的,并且本公开所属技术领域的普通技术人员可从以下描述清楚地理解其他未提及的技术目的。
技术方案
根据本公开的视频信号解码方法包括:在水平方向上或垂直方向上将编码块分区为多个子块,确定是否将第二逆变换应用于所述编码块,以及当确定将第二逆变换应用于所述编码块时,将第二逆变换应用于所述多个子块中的至少一个子块。在此情况下,是否应用第二逆变换的确定可以基于经由比特流用信号发送的索引信息,并且所述索引信息可仅当多个子块中的至少一个子块的尺寸等于或大于阈值时被用信号发送。
根据本公开的视频信号编码方法包括:在水平方向或垂直方向上将编码块分区为多个子块,确定是否将第二变换应用于所述编码块,以及当确定将第二变换应用于所述编码块时,将第二变换应用于所述多个子块中的至少一个子块。在这种情况下,通过将所述多个子块中的至少一个子块的尺寸与阈值进行比较来确定是否对指定是否执行第二变换的索引信息进行编码。
在根据本公开的视频信号解码方法中,当所述多个子块中的至少一个子块的尺寸小于阈值时,可省略对所述索引信息的解码,并且当省略对所述信息的解码时,可推断索引信息的值指示不应用第二逆变换。
在根据本公开的视频信号解码方法中,可基于逆变换矩阵执行第二逆变换,并且可基于所述编码块的帧内预测模式和所述信息来确定逆变换矩阵。
在根据本公开的视频信号解码方法中,基于帧内预测模式,可确定逆变换矩阵集,并且基于所述索引信息可选择包括在确定的逆变换矩阵集中的多个逆变换矩阵候选中的一个。
在根据本公开的视频信号解码方法中,当帧内预测模式为非方向模式时被选择的逆变换矩阵集可以与当帧内预测模式是方向模式时被选择的逆变换矩阵集不同。
在根据本公开的视频信号解码方法中,当将BDPCM方案应用于所述编码块时,可以省略对索引信息的解码。
为本公开简单概述的特征仅是本公开的下文描述的详细描述的示例性方面,并且不限制本公开的范围。
技术效果
根据本公开,可以通过对残差信号执行多次变换来提高编码/解码效率。
根据本公开,可通过允许对应用子分区帧内编码方法的编码块进行第二变换来提高编码/解码效率。
可从本公开获得的效果可以不受上述效果的限制,并且本公开所属技术领域的普通技术人员可以从以下描述中清楚地理解其他未提及的效果。
附图说明
图1是示出根据本公开的实施例的视频编码装置(编码器)的框图的示图。
图2是示出根据本公开的实施例的视频解码装置(解码器)的框图的示图。
图3是示出根据本公开的实施例的基本编码树单元的示图。
图4是示出编码块的各种分区类型的示图。
图5是示出对CTU进行分区的方面的示例的示图。
图6是根据本公开的实施例的帧间预测方法的流程图。
图7是在合并模式下推导当前块的运动信息的处理的流程图。
图8是示出用于推导合并候选的候选块的示图。
图9是示出用于推导合并候选的候选块的示图。
图10是用于解释运动信息表的更新方面的示图。
图11是示出运动信息表的更新方面的示图。
图12是示出保存的运动信息候选的索引被更新的示例的示图。
图13是示出代表性子块的位置的示图。
图14是示出仅针对合并候选中的一部分合并候选执行冗余校验的示例的示图。
图15是示出对特定合并候选的冗余校验被省略的示例的示图。
图16是示出包括在与当前块相同的合并处理区域中的候选块被设置为不可用作合并候选的示例的示图。
图17是示出当当前块被包括在合并处理区域中时推导针对当前块的合并候选的示例的示图。
图18是示出临时运动信息表的示图。
图19是示出使运动信息表和临时运动信息表一致的示例的示图。
图20是根据本公开的实施例的帧内预测方法的流程图。
图21是示出帧内预测模式的示图。
图22和图23是示出将参考样点排列成行的一维阵列的示例的示图。
图24是示出由具有平行于x轴的直线的方向帧内预测模式形成的角度的示图。
图25是示出在当前块具有非正方形形状的情况下获得预测样点的方面的示图。
图26是示出广角帧内预测模式的示图。
图27是示出垂直方向上的分区和水平方向上的分区的示例的示图。
图28是示出确定编码块的分区形状的示例的示图。
图29是示出确定编码块的分区形状的示例的示图。
图30是示出按每个子块确定是否执行变换跳过的示例的示图。
图31是示出子块使用相同变换类型的示例的示图。
图32和33是示出子变换块编码方法的应用方面的示图。
图34和35示出了根据作为变换目标的子块的位置的水平方向变换类型和垂直方向变换类型。
图36是示出当简化因子为16时的变换系数的编码方面的示图。
图37和图38是示出作为第二变换的目标的区域的示图。
图39是示出多种不可分变换矩阵候选的示例。
具体实施方式
在下文中,将参照附图详细描述本公开的实施例。
基于块来执行图像编码和解码。在示例中,对于编码块、变换块或预测块,可执行编码/解码处理,诸如变换、量化、预测、环内滤波、重建等。
在下文中,编码/解码目标块被称为“当前块”。在示例中,当前块可表示根据编码/解码的当前处理的编码块、变换块或预测块。
此外,本说明书中使用的术语“单元”表示用于执行特定编码/解码处理的基本单元,并且“块”可被理解为表示具有预定尺寸的样点阵列。除非另有说明,否则“块”和“单元”可被可互换地使用。在示例中,在稍后描述的示例中,编码块和编码单元可被理解为具有彼此相同的含义。
图1是示出根据本公开的实施例的图像编码设备(编码器)的框图的示图。
参照图1,图像编码设备100可包括画面分区单元110、预测单元120和125、变换单元130、量化单元135、重排单元160、熵编码单元165、反量化单元140、逆变换单元145、滤波器单元150和存储器155。
图1中描述的组件被独立地示出,以便示出图像编码设备中的不同特征功能,并且该图不表示每个组件由单独的硬件或一个软件单元构成。也就是说,每个组件仅是为了便于解释而被列举出的,各个组件中的至少两个组件可构成一个组件,或者一个组件可被分区为可执行其功能的多个组件。甚至对各个组件进行集成的实施例以及对组件进行分区的实施例也被包括在本公开的范围中,除非它们脱离本公开的精神。
此外,一些组件不是执行本公开的必要功能的必需部件,而是仅用于提升性能的可选组件。本公开可利用除了仅用于提升性能的组件之外的用于实现本公开的精神的必要组件来实现,并且仅包括除了仅用于提升性能的可选组件之外的必要组件的结构也被包括在本公开的范围内。
画面分区单元110可将输入画面分区为至少一个处理单元。就此而言,处理单元可以是预测单元(PU)、变换单元(TU)或编码单元(CU)。在画面分区单元110中,可将单个画面分区为多个编码单元、预测单元和变换单元的组合,并且可通过根据预定条件(例如,代价函数)选择编码单元、预测单元和变换单元的组合来对画面进行编码。
例如,可将单个画面分区为多个编码单元。为了将画面分区为编码单元,可使用诸如四叉树结构的递归树结构,并且源自诸如单个图像或最大编码单元的根的编码单元可被分区为其他编码单元,并且可具有与分区出的编码单元一样多的子节点。根据特定限制不再被分区的编码单元成为叶节点。即,当假设仅正方形分区可用于单个编码单元时,单个编码单元可被分区为最多四个其他编码单元。
在下文中,在本公开的实施例中,编码单元可被用作用于编码的单元或可被用作用于解码的单元。
可通过将单个编码单元分区为具有相同尺寸的至少一个正方形或矩形来获得预测单元,或者可以以一个预测单元在形状和/或尺寸上可与另一预测单元不同的方式将单个编码单元分区为预测单元。
在基于正被执行帧内预测的编码块生成预测单元时,当编码单元不是最小编码单元时,可在不执行分区为多个N×N的预测单元的情况下执行帧内预测。
预测单元120和125可包括执行帧间预测的帧间预测单元120以及执行帧内预测的帧内预测单元125。可确定是对预测单元执行帧间预测还是帧内预测,并且可确定根据每种预测方法的详细信息(例如,帧内预测模式、运动矢量、参考画面等)。就此而言,被执行预测的处理单元可与确定了预测方法及其细节的处理单元不同。例如,可基于预测单元来确定预测方法、预测模式等,并且可基于变换单元来执行预测。所生成的预测块与原始块之间的残差值(残差块)可被输入到变换单元130。此外,用于预测的预测模式信息、运动矢量信息等可由熵编码单元165使用残差值来编码,并且可被发送到解码器。当使用特定编码模式时,原始块在不通过预测单元120或125生成预测块的情况下被按原样编码并被发送到解码单元。
帧间预测单元120可基于关于当前画面的先前画面和后续画面中的至少一个的信息来对预测单元进行预测,或者在一些情况下,可基于关于当前画面中的一些编码区域的信息来对预测单元进行预测。帧间预测单元120可包括参考画面插值单元、运动预测单元和运动补偿单元。
参考画面插值单元可从存储器155接收参考画面信息,并且从参考画面生成整数像素或更小像素的像素信息。在亮度像素的情况下,可使用具有不同系数的8抽头的基于DCT的插值滤波器,以便生成关于整数像素或针对1/4像素单位的更小像素的像素信息。在色度信号的情况下,可使用具有不同滤波器系数的4抽头的基于DCT的插值滤波器,以便生成关于整数像素或针对1/8像素单位的更小像素的像素信息。
运动预测单元可基于由参考画面插值单元插值的参考画面来执行运动预测。作为用于计算运动矢量的方法,可使用各种方法,诸如基于全搜索的块匹配算法(FBMA)、三步搜索(TSS)算法、新三步搜索(NTS)算法等。基于经过插值的像素,运动矢量可具有以1/2像素或1/4像素为单位的运动矢尺寸。运动预测单元可通过改变运动预测方法来对当前预测单元进行预测。作为运动预测方法,可使用各种方法,诸如跳过方法、合并方法、高级运动矢量预测(AMVP)方法、帧内块复制方法等。
帧内预测单元125可基于关于当前块周围的参考像素的信息(是当前画面中的像素信息)生成预测单元。当当前预测单元的邻近块是被执行帧间预测的块,并且因此参考像素是被执行帧间预测的像素时,包括在被执行帧间预测的块中的参考像素可被替换为关于被执行帧内预测的邻近块的参考像素的信息。换句话说,当参考像素不可用时,可使用可用参考像素中的至少一个参考像素来替换不可用参考像素信息。
帧内预测中的预测模式可包括根据预测方向使用参考像素信息的方向预测模式以及在执行预测时不使用方向信息的非方向模式。用于对亮度信息进行预测的模式可不同于用于对色度信息进行预测的模式。为了对色度信息进行预测,可使用关于用于对亮度信息进行预测的帧内预测模式的信息或关于预测的亮度信号的信息。
在执行帧内预测时,当预测单元的尺寸与变换单元相同时,可基于位于预测单元的左侧、左上方和上方的像素对预测单元执行帧内预测。然而,在执行帧内预测时,当预测单元的尺寸与变换单元不同时,可通过使用参考像素基于变换单元来执行帧内预测。此外,使用N×N分区的帧内预测可仅被用于最小编码单元。
在帧内预测方法中,可在根据预测模式将自适应帧内平滑(AIS)滤波器应用于参考像素之后生成预测块。应用于参考像素的AIS滤波器的类型可变化。为了执行帧内预测方法,可从当前预测单元周围存在的预测单元的帧内预测模式对针对当前预测单元的帧内预测模式进行预测。在通过使用从邻近预测单元预测出的模式信息对针对当前预测单元的预测模式进行预测时,当针对当前预测单元的帧内预测模式与邻近预测单元的帧内预测模式相同时,可通过使用预定标志信息来发送指示当前预测单元和邻近预测单元具有相同预测模式的信息。当针对当前预测单元的预测模式与邻近预测单元的预测模式不同时,可执行熵编码以对关于针对当前块的预测模式的信息进行编码。
此外,可生成包括关于残差值的信息的残差块,其中,所述残差值是通过预测单元120或125而被执行预测的预测单元与该预测单元的原始块之间的差值。所生成的残差块可被输入到变换单元130。
变换单元130可通过使用诸如离散余弦变换(DCT)或离散正弦变换(DST)的变换方法来对残差块执行变换,其中,所述残差块包括关于原始块与由预测单元120或125生成的预测单元之间的残差值的信息。就此而言,DCT变换核包括DCT2或DCT8中的至少一个,并且DST变换核包括DST7。可基于关于用于生成残差块的预测单元的帧内预测模式的信息来确定是应用DCT还是DST以便对残差块执行变换。可跳过针对残差块的变换。可对指示是否跳过针对残差块的变换的标志进行编码。对于尺寸小于或等于阈值的残差块、亮度分量的残差块或4:4:4格式下的色度分量的残差块,可允许变换跳过。
量化单元135可对由变换单元130变换到频域的值执行量化。量化系数可根据块或图像的重要性而变化。在量化单元135中计算出的值可被提供给反量化单元140和重排单元160。
重排单元160可对针对量化的残差值的系数值执行重排。
重排单元160可通过系数扫描方法将二维块形式的系数改变为一维矢量形式的系数。例如,重排单元160可通过使用Z字形扫描方法从DC系数扫描到高频域中的系数,以便将系数改变为一维矢量的形式。根据变换单元的尺寸和帧内预测模式,可使用垂直方向扫描或水平方向扫描,而不是Z字形扫描,其中,在垂直方向扫描中在列方向上对二维块形式的系数进行扫描,在水平方向扫描中在行方向上对二维块形式的系数进行扫描。换句话说,可根据变换单元的尺寸和帧内预测模式来确定使用Z字形扫描、垂直方向扫描和水平方向扫描中的哪种扫描方法。
熵编码单元165可基于由重排单元160计算出的值来执行熵编码。熵编码可使用各种编码方法,例如,指数哥伦布编码、上下文自适应可变长度编码(CAVLC)或上下文自适应二进制算术编码(CABAC)。
熵编码单元165可对从重排单元160以及预测单元120和125获得的各种类型的信息(诸如关于残差值系数的信息和关于编码单元的块类型的信息、关于预测模式的信息、关于分区单元的信息、关于预测单元的信息、关于分区单元的信息、关于预测单元的信息和关于发送单元的信息、关于运动矢量的信息、关于参考帧的信息、关于块插值的信息、滤波信息等)进行编码。
熵编码单元165可对从重排单元160输入的编码单元的系数进行熵编码。
反量化单元140可对在量化单元135中量化的值执行反量化,并且逆变换单元145可对在变换单元130中变换的值执行逆变换。由反量化单元140和逆变换单元145生成的残差值可与由包括在预测单元120和125中的运动估计单元、运动补偿单元或帧内预测单元预测出的预测单元相加,以便生成重建块。
滤波器单元150可包括去块滤波器、偏移校正单元和自适应环路滤波器(ALF)中的至少一个。
去块滤波器可去除由于重建画面中的块之间的边界而发生的块失真。为了确定是否执行去块,可基于块中包括的若干行和若干列中所包括的像素来确定是否将去块滤波器应用于当前块。当去块滤波器被应用于块时,根据所需的去块滤波强度应用强滤波器或弱滤波器。此外,在应用去块滤波器时,当执行水平方向滤波和垂直方向滤波时,水平方向滤波和垂直方向滤波可被配置为被并行处理。
偏移校正单元可通过相对于被执行去块的图像的以像素为单位的偏移来校正原始图像。为了对特定画面执行偏移校正,将偏移应用于在将图像的像素分区为预定数量的区域之后确定的区域的方法或者根据每个像素的边缘信息应用偏移的方法可被使用。
可基于通过将经过滤波的重建图像与原始图像进行比较而获得的值来执行自适应环路滤波(ALF)。可将图像中包括的像素分区为预定组,将被应用于所述组中的每个组的滤波器可被确定,并且可对每个组单独执行滤波。可针对亮度信号的每个编码单元(CU)发送关于是否应用ALF的信息,并且将被应用的ALF滤波器的形状和滤波器系数可基于每个块而变化。可选地,可应用具有相同形状(固定的形状)的ALF滤波器,而不管将被应用滤波器的块的特征如何。
在存储器155中,可存储通过滤波器单元150计算出的重建块或画面。当执行帧间预测时,可将所存储的重建块或画面提供给预测单元120或125。
图2是示出根据本公开的实施例的图像解码设备(解码器)的框图的示图。
参照图2,图像解码设备200可包括:熵解码单元210、重排单元215、反量化单元220、逆变换单元225、预测单元230和235、滤波器单元240和存储器245。
当从编码器输入了图像比特流时,可根据图像编码设备的逆处理对输入的比特流进行解码。
熵解码单元210可根据由图像编码器的熵编码单元进行的熵编码的逆处理来执行熵解码。例如,与由图像编码器设备执行的方法相关联,可应用各种方法,诸如指数哥伦布编码、上下文自适应可变长度编码(CAVLC)或上下文自适应二进制算术编码(CABAC)。
熵解码单元210可对关于由编码器执行的帧内预测和帧间预测的信息进行解码。
重排单元215可基于在编码器中使用的重排方法对由熵解码单元210熵解码的比特流执行重排。以一维矢量形式表示的系数可被重建并被重排为二维块形式的系数。重排单元215可通过下述方法来执行重排:接收与在编码器中执行的系数扫描相关的信息并基于在编码器中执行的扫描顺序进行逆扫描。
反量化单元220可基于从编码器接收到的量化参数和经过重排的块的系数值来执行反量化。
逆变换单元225可执行与由图像编码器中的变换单元对量化结果执行的变换(即,DCT或DST)相反的逆变换(即,逆DCT或逆DST)。就此而言,DCT变换核可包括DCT2或DCT8中的至少一个,并且DST变换核可包括DST7。可选地,当在图像编码器中跳过了变换时,也不在逆变换单元225中执行逆变换。可基于由图像编码器确定的发送单元来执行逆变换。图像解码器的逆变换单元225可根据诸如预测方法、当前块的尺寸、预测方向等的多条信息选择性地执行变换方法(例如,DCT或DST)。
预测单元230或235可基于从熵解码单元210接收到的与预测块相关的信息以及从存储器245接收到的关于先前解码的块或画面的信息来生成预测块。
如上所述,作为图像编码器的操作,在执行帧内预测时,当预测单元的尺寸与变换单元相同时,可基于位于预测单元的左侧、左上方和上方的像素对预测单元执行帧内预测。然而,在执行帧内预测时,当预测单元的尺寸与变换单元不同时,可通过使用参考像素基于变换单元来执行帧内预测。此外,使用N×N分区的帧内预测可仅被用于最小编码单元。
预测单元230和235可包括PU确定模块、帧间预测单元和帧内预测单元。PU确定单元可接收从熵解码单元210输入的各种类型的信息(诸如关于预测单元的信息、关于帧内预测方法的预测模式的信息、关于帧间预测方法的运动预测的信息等),对当前编码单元中的预测单元进行分区,并且确定对预测单元执行帧间预测还是帧内预测。通过使用从图像编码器接收到的在当前预测单元的帧间预测中所需的信息,帧间预测单元230可基于关于包括当前预测单元的当前画面的先前画面和后续画面中的至少一个的信息来对当前预测单元执行帧间预测。可选地,可基于关于包括当前预测单元的当前画面中的一些预重建区域的信息来执行帧间预测。
为了执行帧间预测,可基于编码单元确定将跳过模式、合并模式、AMVP模式或帧内块复制模式中的哪种方法用作针对包括在编码单元中的预测单元的运动预测方法。
帧内预测单元235可基于关于当前画面内的像素的信息来生成预测块。当预测单元是已被执行帧内预测的预测单元时,可基于从图像编码器接收到的关于预测单元的帧内预测模式的信息来执行帧内预测。帧内预测单元235可包括自适应帧内平滑(AIS)滤波器、参考像素插值模块或DC滤波器。AIS滤波器可对当前块的参考像素执行滤波,并且可根据针对当前预测单元的预测模式来确定是否应用滤波器。当对当前块的参考像素执行AIS滤波时,可使用从图像编码器接收到的关于AIS滤波器的信息和预测单元的预测模式。当针对当前块的预测模式是不应用AIS滤波的模式时,可不应用AIS滤波器。
当预测单元的预测模式是基于通过对参考像素进行插值而获得的像素值执行帧内预测的预测模式时,参考像素插值单元可对参考像素进行插值以便生成具有整数或更小的单位的参考像素。当针对当前预测单元的预测模式是在不对参考像素进行插值的情况下生成预测块的预测模式时,可不对参考像素进行插值。当针对当前块的预测模式是DC模式时,DC滤波器可通过滤波来生成预测块。
可将重建块或重建画面提供给滤波器单元240。滤波器单元240可包括去块滤波器、偏移校正模块和ALF。
可从图像编码器接收关于去块滤波器是否已被应用于对应块或对应画面的信息以及关于当去块滤波器被应用时是应用强滤波器还是弱滤波器的信息。图像解码器的去块滤波器可从图像编码器接收关于去块滤波器的信息,并且图像解码器可对对应块执行去块滤波。
偏移校正单元可基于在执行编码时应用于图像的偏移校正的类型、关于偏移值的信息等对重建图像执行偏移校正。
可基于从编码器接收到的关于是否应用ALF的信息、关于ALF系数的信息等将ALF应用于编码单元。以上ALF信息可通过被包括在特定参数集中而被提供。
在存储器245中,可存储重建画面或重建块以便用作参考画面或参考块,并且可将重建画面提供给输出单元。
图3是示出根据本公开的实施例的基本编码树单元的示图。
最大编码块可被定义为编码树块。可将单个画面分区为多个编码树单元(CTU)。CTU可以是最大尺寸的编码单元,并且可被称作最大编码单元(LCU)。图3是示出将单个画面分区为多个CTU的示例的示图。
可在画面级或序列级定义CTU的尺寸。同样,可通过画面参数集或序列参数集用信号发送表示CTU的尺寸的信息。
在示例中,针对序列内的整个画面的CTU的尺寸可被设置为128×128。可选地,可将128×128或256×256中的任意一个确定为画面级的CTU的尺寸。在示例中,CTU可被设置为在第一画面具有128×128的尺寸,并且在第二画面具有256×256的尺寸。
可通过对CTU进行分区来生成编码块。编码块表示用于执行编码/解码的基本单元。在示例中,可针对每个编码块执行预测或变换,或者可针对每个编码块确定预测编码模式。就此而言,预测编码模式表示生成预测图像的方法。在示例中,预测编码模式可包括帧内预测、帧间预测、当前画面参考(CPR)、帧内块复制(IBC)或组合预测。对于编码块,可通过使用帧内预测、帧间预测、当前画面参考或组合预测中的至少一个的预测编码模式来生成编码块的预测块。
可以以比特流用信号发送表示针对当前块的预测编码模式的信息。在示例中,该信息可以是表示预测编码模式是帧内模式还是帧间模式的1比特标志。当针对当前块的预测编码模式被确定为帧间模式时,当前画面参考或组合预测可以是可用的。
当前画面参考将当前画面设置为参考画面,并且从当前画面内的已被编码/解码的区域获得当前块的预测块。就此而言,当前画面表示包括当前块的画面。可以以比特流用信号发送表示当前画面参考是否被应用于当前块的信息。在示例中,该信息可以是1比特标志。当该标志为真时,可将针对当前块的预测编码模式确定为当前画面参考,并且当该标志为假时,可将针对当前块的预测编码模式确定为帧间预测。
可选地,可基于参考画面索引来确定当前块的预测编码模式。在示例中,当参考画面索引指示当前画面时,可将针对当前块的预测编码模式确定为当前画面参考。当参考画面索引指示除了当前画面之外的画面时,可将针对当前块的预测编码模式确定为帧间预测。换句话说,当前画面参考是使用关于当前画面内的已被编码/解码的区域的信息的预测方法,并且帧间预测是使用关于已被编码/解码的另一画面的信息的预测方法。
组合预测表示将帧内预测、帧间预测和当前画面参考中的至少两个进行组合的组合编码模式。在示例中,当组合预测被应用时,可基于帧内预测、帧间预测或当前画面参考中的任意一个来生成第一预测块,并且可基于帧内预测、帧间预测或当前画面参考中的另一个来生成第二预测块。当生成了第一预测块和第二预测块时,可通过计算第一预测块和第二预测块的平均值或加权和来生成最终预测块。可以以比特流用信号发送表示是否将组合预测应用于当前块的信息。该信息可以是1比特标志。
图4是示出编码块的各种分区类型的示图。
可基于四叉树分区、二叉树分区或三叉树分区将编码块分区为多个编码块。可基于四叉树分区、二叉树分区或三叉树分区将分区出的编码块再次分区为多个编码块。
四叉树分区表示将当前块分区为四个块的方法。作为四叉树分区的结果,当前块可被分区为四个正方形分区(参照图4(a)的“SPLIT_QT”)。
二叉树分区表示将当前块分区为两个块的方法。沿着垂直方向(即,使用穿过当前块的垂直线)将当前块分区为两个块的操作可被称为垂直方向二叉树分区,并且沿着水平方向(即,使用穿过当前块的水平线)将当前块分区为两个块的操作可被称为水平方向二叉树分区。作为二叉树分区的结果,当前块可被分区为两个非正方形分区。图4(b)的“SPLIT_BT_VER”是示出垂直方向二叉树分区的结果的示图,并且图4(c)的“SPLIT_BT_HOR”是示出水平方向二叉树分区的结果的示图。
三叉树分区表示将当前块分区为三个块的方法。沿着垂直方向(即,使用穿过当前块的两条垂直线)将当前块分区为三个块的操作可被称为垂直方向三叉树分区,并且沿着水平方向(即,使用穿过当前块的两条水平线)将当前块分区为三个块的操作可被称为水平方向三叉树分区。作为三叉树分区的结果,当前块可被分区为三个非正方形分区。就此而言,位于当前块的中心的分区的宽度/高度可以是其他分区的宽度/高度的两倍。图4(d)的“SPLIT_TT_VER”是示出垂直方向三叉树分区的结果的示图,而图4(e)的“SPLIT_TT_HOR”是示出水平方向三叉树分区的结果的示图。
CTU的分区次数可被定义为分区深度。CTU的最大分区深度可在序列级或画面级被确定。因此,CTU的最大分区深度可基于序列或画面而变化。
可选地,可针对每种分区方法独立地确定最大分区深度。在示例中,允许四叉树分区的最大分区深度可与允许二叉树分区和/或三叉树分区的最大分区深度不同。
编码器可以以比特流用信号发送表示当前块的分区类型和分区深度中的至少一个的信息。解码器可基于通过对比特流进行解析而获得的该信息来确定CTU的分区类型和分区深度。
图5是示出对CTU进行分区的方面的示例的示图。
通过使用四叉树分区、二叉树分区和/或三叉树分区来对编码块进行分区的操作可被称为多树分区。
通过应用多树分区对编码块进行分区而生成的编码块可被称为子编码块。当编码块的分区深度为k时,子编码块的分区深度被设置为k+1。
相反,对于分区深度为k+1的编码块,分区深度为k的编码块可被称为父编码块。
可基于父编码块的分区类型和邻近编码块的分区类型中的至少一个来确定当前编码块的分区类型。就此而言,邻近编码块可以是与当前编码块相邻的块,并且包括上方邻近块、左侧邻近块或与当前编码块的左上角相邻的邻近块中的至少一个。就此而言,所述分区类型可包括是否应用四叉树分区、是否应用二叉树分区、二叉树分区的方向、是否应用三叉树分区或三叉树分区的方向。
为了确定编码块的分区类型,可以以比特流用信号发送表示编码块是否被分区的信息。该信息是1比特标志“split_cu_flag”,并且当该标志为真时,它可表示编码块通过多树分区方法被分区。
当split_cu_flag为真时,可以以比特流用信号发送表示编码块是否通过四叉树分区被分区的信息。该信息是1比特标志split_qt_flag,并且当该标志为真时,编码块可被分区为四个块。
在示例中,在图5中所示的示例中,CTU通过四叉树分区被分区,并且因此生成分区深度为1的四个编码块。此外,示出了再次将四叉树分区应用于通过四叉树分区生成的四个编码块中的第一编码块和第四编码块。结果,可生成分区深度为2的四个编码块。
此外,通过再次将四叉树分区应用于分区深度为2的编码块,可生成分区深度为3的编码块。
当四叉树分区不被应用于编码块时,可根据编码块的尺寸、编码块是否位于画面边界、最大分区深度或邻近块的分区类型中的至少一个来确定是否针对编码块执行二叉树分区或三叉树分区。当确定针对编码块执行二叉树分区或三叉树分区时,可以以比特流用信号发送表示分区方向的信息。该信息可以是1比特标志mtt_split_cu_vertical_flag。可基于该标志确定分区方向是垂直方向还是水平方向。此外,可以以比特流用信号发送表示二叉树分区或三叉树分区中的哪一个被应用于编码块的信息。该信息可以是1比特标志mtt_split_cu_binary_flag。可基于该标志确定是二叉树分区被应用于编码块还是三叉树分区被应用于编码块。
在示例中,在图5中所示的示例中,垂直方向二叉树分区被应用于分区深度为1的编码块,垂直方向三叉树分区被应用于通过分区生成的编码块中的左侧编码块,并且垂直方向二叉树分区被应用于右侧编码块。
帧间预测是一种通过使用关于先前画面的信息对当前块进行预测的预测编码模式。在示例中,先前画面内的与当前块相同位置处的块(在下文中,同位块)可被设置为当前块的预测块。在下文中,基于当前块的同位块生成的预测块可被称为同位预测块。
相反,当存在于先前画面中的对象已移动到当前画面中的另一位置时,可通过使用对象的运动来有效地预测当前块。例如,当通过将先前画面与当前画面进行比较来确定对象的运动方向和尺寸时,可根据对象的运动信息生成当前块的预测块(或预测图像)。在下文中,通过使用运动信息生成的预测块可被称为运动预测块。
可通过从当前块减去预测块来生成残差块。就此而言,在对象移动的情况下,可通过使用运动预测块而不是使用同位预测块来减小残差块的能量,因此可提高残差块的压缩性能。
如上,通过使用运动信息生成预测块的操作可被称为运动估计预测。在大多数帧间预测中,可基于运动补偿预测来生成预测块。
运动信息可包括运动矢量、参考画面索引、预测方向和双向加权因子索引中的至少一个。运动矢量表示对象的运动方向和尺寸。参考画面索引指定参考画面列表中包括的参考画面中的当前块的参考画面。预测方向指示单向L0预测、单向L1预测或双向预测(L0预测和L1预测)中的任意一个。可根据当前块的预测方向使用L0方向运动信息和L1方向运动信息中的至少一个。双向加权因子索引指定应用于L0预测块的加权因子和应用于L1预测块的加权因子。
图6是根据本公开的实施例的帧间预测方法的流程图。
参照图6,帧间预测方法包括:确定针对当前块的帧间预测模式(S601),根据所确定的帧间预测模式获得当前块的运动信息(S602),并且基于所获得的运动信息执行针对当前块的运动补偿预测(S603)。
就此而言,帧间预测模式可表示用于确定当前块的运动信息的各种方法,并且包括使用平移运动信息的帧间预测模式、使用仿射运动信息的帧间预测模式。在示例中,使用平移运动信息的帧间预测模式可包括合并模式和运动矢量预测模式,并且使用仿射运动信息的帧间预测模式可包括仿射合并模式和仿射运动矢量预测模式。可基于与当前块邻近的邻近块或通过对比特流进行解析而获得的信息来确定关于当前块的运动信息。
可从另一块的运动信息推导当前块的运动信息。就此而言,另一块可以是在当前块之前通过帧间预测被编码/解码的块。将当前块的运动信息设置为与另一块的运动信息相同的操作可被定义为合并模式。此外,将另一块的运动矢量设置为当前块的运动矢量的预测值的操作可被定义为运动矢量预测模式。
图7是在合并模式下推导当前块的运动信息的处理的流程图。
可推导当前块的合并候选(S701)。可从在当前块之前通过帧间预测被编码/解码的块推导当前块的合并候选。
图8是示出用于推导合并候选的候选块的示图。
候选块可包括邻近块或非邻近块中的至少一个,其中,所述邻近块包括与当前块相邻的样点,所述非邻近块包括与当前块不相邻的样点。在下文中,确定候选块的样点被定义为基本样点。此外,与当前块相邻的基本样点被称作邻近基本样点,并且与当前块不相邻的基本样点被称作非邻近基本样点。
邻近基本样点可被包括在当前块的最左侧列的邻近列或当前块的最上方行的邻近行中。在示例中,当当前块的左上样点的坐标为(0,0)时,包括位置(-1,H-1)、(W-1,-1)、(W,-1)、(-1,H)或(-1,-1)处的基本样点的块中的至少一个可被用作候选块。参照示图,索引0至4的邻近块可被用作候选块。
非邻近基本样点表示距与当前块相邻的基本样点的x轴距离或y轴距离中的至少一个具有预定义值的样点。在示例中,包括距左基本样点的x轴距离是预定义值的基本样点的块、包括距上基本样点的y轴距离是预定义值的非邻近样点的块或者包括距左上基本样点的x轴距离和y轴距离是预定义值的非邻近样点的块中的至少一个块可被用作候选块。预定义值可以是诸如4、8、12、16等的自然数。参照附图,索引5至26的块中的至少一个块可被用作候选块。
可将不位于与邻近基本样点相同的垂直线、水平线或对角线上的样点设置为非邻近基本样点。
在下文中,候选块当中包括邻近基本样点的候选块被称作邻近块,而包括非邻近基本样点的块被称作非邻近块。
当当前块与候选块之间的距离等于或大于阈值时,可以将候选块设置为不可用作合并候选。可基于编码树单元的尺寸来确定阈值。在示例中,可以将阈值设置为编码树单元的高度(ctu_height)或将偏移添加到编码树单元的高度的值或从编码树单元的高度减去偏移的值(例如,ctu_height±N)。作为编码器和解码器中的预定义值,可以将偏移N设置为4、8、16、32或ctu_height。
当当前块的y轴坐标与包括在候选块中的样点的y轴坐标之间的差大于阈值时,可确定候选块不可用作合并候选。
可选地,可以将不属于与当前块相同的编码树单元的候选块设置为不可用作合并候选。在示例中,当基本样点在当前块所属的编码树单元的上边界之外时,可以将包括基本样点的候选块设置为不可用作合并候选。
如果当前块的上边界与编码树单元的上边界接近,则可以确定多个候选块不可用作合并候选以降低当前块的编码/解码效率。为了解决这样的问题,可以设置候选块,使得当前块的左侧位置处的候选块的数量大于当前块的上部位置处的候选块的数量。
图9是示出用于推导合并候选的候选块的示图。
如在图9所示的示例中,可以将属于当前块的N个上方块列的上方块和属于当前块的M个左侧块列的左侧块设置为候选块。在这种情况下,可以通过设置M大于N来将左侧候选块的数量设置为大于上方候选块的数量。
在示例中,可以将当前块中的基本样点的y轴坐标与可以用作候选块的上方块的y轴坐标之间的差设置为不超过当前块的高度的N倍。另外,可以将当前块中的基本样点的x轴坐标与可以用作候选块的左侧块的x轴坐标之间的差设置为不超过当前块的宽度的M倍。
在示例中,在图9所示的示例中,示出了将属于当前块的2个上方块列的块和属于当前块的5个左侧块列的块设置为候选块。
可从包括在画面中不同于当前块的时间邻近块推导合并候选。在示例中,可从包括在同位画面中的同位块推导合并候选。可以将包括在参考画面列表中的参考画面中的任何一个设置为同位画面。可以以比特流用信号发送识别参考画面当中的同位画面的索引信息。或者,可以将参考画面中具有预定义索引的参考画面确定为同位画面。
合并候选的运动信息可被设置为与候选块的运动信息相同。在示例中,候选块的运动矢量、参考画面索引、预测方向或双向权重索引中的至少一个可被设置为合并候选的运动信息。
可生成包括合并候选的合并候选列表(S702)。
可根据预定顺序分配合并候选列表中的合并候选的索引。在示例中,可按照从左侧邻近块推导出的合并候选、从上方邻近块推导出的合并候选、从右上方邻近块推导出的合并候选、从左下方邻近块推导出的合并候选、从左上方邻近块推导出的合并候选和从时间邻近块推导出的合并候选的顺序来分配索引。
当多个合并候选被包括在合并候选中时,可选择多个合并候选中的至少一个合并候选(S703)。具体地,可以以比特流用信号发送用于指定多个合并候选中的任意一个合并候选的信息。在示例中,可以以比特流用信号发送表示合并候选列表中包括的合并候选中的任意一个合并候选的索引的信息merge_idx。
当包括在合并候选列表中的合并候选的数量小于阈值时,包括在运动信息表中的运动信息候选可作为合并候选被添加到合并候选列表。就此而言,所述阈值可以是可被包括在合并候选列表中的合并候选的最大数量或者从所述合并候选的最大数量减去偏移的值。偏移可以是诸如1或2等的自然数。
运动信息表包括从当前画面中的基于帧间预测被编码/解码的块推导出的运动信息候选。在示例中,包括在运动信息表中的运动信息候选的运动信息可被设置为与基于帧间预测被编码/解码的块的运动信息相同。就此而言,运动信息可包括运动矢量、参考画面索引、预测方向或双向权重索引中的至少一个。
包括在运动信息表中的运动信息候选也可被称作帧间区域合并候选或预测区域合并候选。
可在编码器和解码器中预定义可被包括在运动信息表中的运动信息候选的最大数量。在示例中,可被包括在运动信息表中的运动信息候选的最大数量可以是1、2、3、4、5、6、7、8或更大(例如,16)。
可选地,可以以比特流用信号发送表示可被包括在运动信息表中的运动信息候选的最大数量的信息。可以以序列级、画面级或条带级用信号发送所述信息。所述信息可表示可被包括在运动信息表中的运动信息候选的最大数量。可选地,所述信息可表示可被包括在运动信息表中的运动信息候选的最大数量与可被包括在合并候选列表中的合并候选的最大数量之间的差。
可选地,可根据画面尺寸、条带尺寸或编码树单元尺寸来确定可被包括在运动信息表中的运动信息候选的最大数量。
运动信息表可以以画面、条带、并行块(tile)、分块(brick)、编码树单元或编码树单元线(行或列)为单位被初始化。在示例中,当条带被初始化时,运动信息表也被初始化,因此运动信息表可不包括任何运动信息候选。
可选地,可以以比特流用信号发送表示运动信息表是否将被初始化的信息。可在条带级、并行块级、分块级或块级用信号发送所述信息。可使用预配置的运动信息表,直到所述信息指示运动信息表的初始化为止。
可选地,关于初始运动信息候选的信息可在画面参数集或条带头中被用信号发送。尽管条带被初始化,但是运动信息表可包括初始运动信息候选。因此,可针对作为条带中的第一编码/解码目标的块使用初始运动信息候选。
可选地,可将包括在先前编码树单元的运动信息表中的运动信息候选设置为初始运动信息候选。在示例中,可将先前编码树单元的运动信息表中包括的运动信息候选中的具有最小索引或具有最大索引的运动信息候选设置为初始运动信息候选。
按照编码/解码顺序对块进行编码/解码,并且可按照编码/解码顺序将基于帧间预测被编码/解码的块顺序地设置为运动信息候选。
图10是用于解释运动信息表的更新方面的示图。
对于当前块,当执行帧间预测(S1001)时,可基于当前块推导运动信息候选(S1002)。运动信息候选的运动信息可被设置为与当前块的运动信息相同。
当运动信息表为空时(S1003),可将基于当前块推导出的运动信息候选添加到运动信息表(S1004)。
当运动信息表已包括运动信息候选时(S1003),可执行针对当前块的运动信息(或基于当前块推导出的运动信息候选)的冗余校验(S1005)。冗余校验在于确定运动信息表中的预存储的运动信息候选的运动信息是否与当前块的运动信息相同。可针对运动信息表中的所有预存储的运动信息候选执行冗余校验。可选地,可针对运动信息表中的预存储的运动信息候选中的索引超过或低于阈值的运动信息候选执行冗余校验。可选地,可针对预定义数量的运动信息候选执行冗余校验。在示例中,可将具有最小索引或具有最大索引的2个运动信息候选确定为用于冗余校验的目标。
当不包括与当前块具有相同运动信息的运动信息候选时,可将基于当前块推导出的运动信息候选添加到运动信息表(S1008)。可基于运动信息候选的运动信息(例如,运动矢量/参考画面索引等)是否相同来确定运动信息候选是否相同。
就此而言,当最大数量的运动信息候选已被存储在运动信息表中时(S1006),可删除最老的运动信息候选(S1007),并且可将基于当前块推导出的运动信息候选添加到运动信息表(S1008)。就此而言,最老的运动信息候选可以是具有最大索引或最小索引的运动信息候选。
运动信息候选可由相应索引标识。当从当前块推导出的运动信息候选被添加到运动信息表时,可将最小索引(例如,0)分配给该运动信息候选,并且预存储的运动信息候选的索引可增加1。就此而言,当最大数量的运动信息候选已被存储在运动信息表中时,去除具有最大索引的运动信息候选。
可选地,当将从当前块推导出的运动信息候选添加到运动信息表时,可将最大索引分配给该运动信息候选。在示例中,当运动信息表中的预存储的运动信息候选的数量小于最大值时,可将与预存储的运动信息候选的数量具有相同的值的索引分配给该运动信息候选。可选地,当运动信息表中的预存储的运动信息候选的数量等于最大值时,可将从最大值减去1得到的索引分配给该运动信息候选。可选地,去除具有最小索引的运动信息候选,并且将其余的预存储的运动信息候选的索引减小1。
图11是示出运动信息表的更新方面的示图。
假设当将从当前块推导出的运动信息候选添加到运动信息表时,将最大索引分配给该运动信息候选。此外,假设最大数量的运动信息候选已被存储在运动信息表中。
当将从当前块推导出的运动信息候选HmvpCand[n+1]添加到运动信息表HmvpCandList时,可删除预存储的运动信息候选中的具有最小索引的运动信息候选HmvpCand[0],并且其余的运动信息候选的索引可减小1。此外,可将从当前块推导出的运动信息候选HmvpCand[n+1]的索引设置为最大值(对于图14中所示的示例,n)。
当预存储了与基于当前块推导出的运动信息候选相同的运动信息候选时(S1005),可不将基于当前块推导出的运动信息候选添加到运动信息表(S1009)。
可选地,在将基于当前块推导出的运动信息候选添加到运动信息表时,可去除与该运动信息候选相同的预存储的运动信息候选。在这种情况下,产生与预存储的运动信息候选的索引被重新更新时相同的效果。
图12是示出预存储的运动信息候选的索引被更新的示例的示图。
当与从当前块推导出的运动信息候选mvCand相同的预存储的运动信息候选的索引为hIdx时,可去除该预存储的运动信息候选,并且索引大于hIdx的运动信息候选的索引可减小1。在示例中,图15中所示的示例示出了在运动信息表HvmpCandList中删除与mvCand相同的HmvpCand[2],并且从HmvpCand[3]到HmvpCand[n]的索引减小1。
而且,可将基于当前块推导出的运动信息候选mvCand添加到运动信息表的末尾。
可选地,分配给与基于当前块推导出的运动信息候选相同的预存储的运动信息候选的索引可被更新。例如,可将预存储的运动信息候选的索引改变为最小值或最大值。
可将包括在预定区域中的块的运动信息设置为不被添加到运动信息表。在示例中,可不将基于包括在合并处理区域中的块的运动信息推导出的运动信息候选添加到运动信息表。由于针对包括在合并处理区域中的多个块的编码/解码顺序未被定义,因此将所述多个块中的任意一个块的运动信息用于所述多个块中的另一块的帧间预测是不合适的。因此,可不将基于包括在合并处理区域中的块推导出的运动信息候选添加到运动信息表。
可选地,可将小于预设尺寸的块的运动信息设置为不被添加到运动信息表。在示例中,可不将基于宽度或高度小于4或8的编码块的运动信息或者4×4尺寸的编码块的运动信息推导出的运动信息候选添加到运动信息表。
当以子块为单位执行运动补偿预测时,可基于包括在当前块中的多个子块当中的代表性子块的运动信息推导出运动信息候选。在示例中,当子块合并候选用于当前块时,可基于子块当中的代表性子块的运动信息推导出运动信息候选。
可以按以下顺序推导出子块的运动矢量。首先,可选择包括在当前块的合并候选列表中的合并候选中的一个,并且可基于所选择的合并候选的运动矢量推导出初始移位矢量(shVector)。并且,可通过将初始移位矢量与编码块中的每一子块的基本样点(例如,左上方样点或中心样点)的位置(xSb,ySb)相加推导出基本样点的位置为(xColSb,yColSb)的移位子块。下面的等式1示出了用于推导出移位子块的等式。
[等式1]
(xColSb,yColSb)=(xSb+shVector[O]>>4,ySb+shVector[1]>>4)
然后,可以将与包括(xColSb,yColSb)的子块的中心位置相对应的同位块的运动矢量设置为包括(xSb,ySb)的子块的运动矢量。
代表性子块可意指包括当前块的左上方样点、中心样点、右下方样点、右上方样点或左下方样点的子块。
图13是示出代表性子块的位置的示图。
图13(a)表示将当前块的左上方位置处的子块设置为代表性子块的示例,并且图13(b)表示将当前块的中心位置处的子块设置为代表性子块的示例。当以子块为单位执行运动补偿预测时,可基于包括当前块的左上方样点的子块或包括当前块的中心样点的子块的运动矢量推导出当前块的运动信息候选。
基于当前块的帧间预测模式,可确定当前块是否将用作运动信息候选。在示例中,可将基于仿射运动模型编码/解码的块设置为不可用作运动信息候选。因此,尽管通过帧间预测编码/解码当前块,但当当前块的帧间预测模式为仿射预测模式时,可不基于当前块更新运动信息表。
可选地,可以基于当前块的运动矢量分辨率、是否应用合并偏移编码方法、是否应用组合预测或是否应用三角分区中的至少一个来确定当前块是否将用作运动信息候选。在示例中,针对当前块的运动信息分辨率等于或大于2个整数像素的情况、组合预测应用于当前块的情况、三角分区应用于当前块的情况或合并偏移编码方法应用于当前块的情况中的至少一个,可将当前块设置为不可用作运动信息候选。
可选地,可基于包括在基于仿射运动模型编码/解码的块中的子块中的至少一个的子块矢量推导出运动信息候选。在示例中,可通过使用当前块的左上方位置处的子块、中心位置处的子块或右上方位置处的子块推导出运动信息候选。可选地,可将多个子块的子块矢量的平均值设置为运动信息候选的运动矢量。
当包括在当前块的合并候选列表中的合并候选的数量小于阈值时,包括在运动信息表中的运动信息候选可作为合并候选被添加到合并候选列表。按照按升序或降序反映运动信息候选的索引的排序的顺序执行附加处理。在示例中,首先可将具有最大索引的运动信息候选添加到当前块的合并候选列表。
当包括在运动信息表中的运动信息候选被添加到合并候选列表时,可执行运动信息候选与合并候选列表中的预存储的合并候选之间的冗余校验。作为冗余校验的结果,可不将与预存储的合并候选具有相同的运动信息的运动信息候选添加到合并候选列表。
可仅针对包括在运动信息表中的运动信息候选中的一部分运动信息候选执行冗余校验。在示例中,可仅针对索引超过或低于阈值的运动信息候选执行冗余校验。可选地,可仅针对具有最大索引或最小索引的N个运动信息候选执行冗余校验。可选地,可仅针对合并候选列表中的预存储的合并候选中的一部分合并候选执行冗余校验。在示例中,可仅针对索引超过或低于阈值的合并候选或从特定位置处的块推导出的合并候选执行冗余校验。就此而言,特定位置可包括当前块的左侧邻近块、上方邻近块、右上方邻近块或左下方邻近块中的至少一个。
图14是示出仅针对一部分合并候选执行冗余校验的示例的示图。
当运动信息候选HmvpCand[j]被添加到合并候选列表时,可针对运动信息候选执行对具有最大索引的2个合并候选mergeCandList[NumMerge-2]和mergeCandList[NumMerge-1]的冗余校验。就此而言,NumMerge可示出可用空间合并候选和时间合并候选的数量。
不同于所示的示例,当运动信息候选HmvpCand[j]被添加到合并候选列表时,可针对运动信息候选执行对具有最小索引的2个合并候选的冗余校验。例如,可检查mergeCandList[0]和mergeCandList[1]是否与HmvpCand[j]相同。
可选地,可仅针对从特定位置推导出的合并候选执行冗余校验。在示例中,可针对从位于当前块的左侧或当前块的上方的邻近块推导出的合并候选中的至少一个执行冗余校验。当在合并候选列表中不存在从特定位置推导出的合并候选时,可在不进行冗余校验的情况下将运动信息候选添加到合并候选列表。
当运动信息候选HmvpCand[j]被添加到合并候选列表时,可针对运动信息候选执行对具有最大索引的2个合并候选mergeCandList[NumMerge-2]和mergeCandList[NumMerge-1]的冗余校验。就此而言,NumMerge可示出可用空间合并候选和时间合并候选的数量。
可仅针对运动信息候选中的一部分运动信息候选执行对合并候选的冗余校验。在示例中,可仅针对运动信息表中包括的运动信息候选中的具有大索引或最小索引的N个运动信息候选执行冗余校验。在示例中,可仅针对具有包括在运动信息表中的运动信息候选的编号和差低于阈值的索引的运动信息候选执行冗余校验。当所述阈值为2时,可仅针对运动信息表中包括的运动信息候选中的具有最大索引值的3个运动信息候选执行冗余校验。对于除了上述3个运动信息候选之外的运动信息候选,可省略冗余校验。当省略冗余校验时,可将运动信息候选添加到合并候选列表,而不管是否存在与合并候选相同的运动信息。
相反,将冗余校验设置为仅针对具有包括在运动信息表中的运动信息候选的编号和差超过所述阈值的索引的运动信息候选来执行。
可在编码器和解码器中重新定义执行冗余校验的运动信息候选的数量。在示例中,所述阈值可以是诸如0、1或2的整数。
可选地,可基于包括在合并候选列表中的合并候选的数量或包括在运动信息表中的运动信息候选的数量中的至少一个来确定所述阈值。
当发现与第一运动信息候选相同的合并候选时,可在针对第二运动信息候选的冗余校验中省略对与第一运动信息候选相同的合并候选的冗余校验。
图15是示出省略对特定合并候选的冗余校验的示例的示图。
当索引为i的运动信息候选HmvpCand[i]被添加到合并候选列表时,执行该运动信息候选与合并候选列表中的预存储的合并候选之间的冗余校验。就此而言,当发现与运动信息候选HmvpCand[i]相同的合并候选mergeCandlist[j]时,可在不将运动信息候选HmvpCand[i]添加到合并候选列表的情况下执行索引为i-1的运动信息候选HmvpCand[i-1]与合并候选之间的冗余校验。就此而言,可省略运动信息候选HmvpCand[i-1]与合并候选mergeCandList[j]之间的冗余校验。
在示例中,在图15中所示的示例中,确定HmvpCand[i]和mergeCandList[2]相同。因此,可在不将HmvpCand[i]添加到合并候选列表的情况下执行针对HmvpCand[i-1]的冗余校验。就此而言,可省略HmvpCand[i-1]与mergeCandList[2]之间的冗余校验。
当包括在当前块的合并候选列表中的合并候选的数量小于阈值时,除了运动信息候选之外,可另外包括成对合并候选或零合并候选中的至少一个。成对合并候选表示具有从对多于2个合并候选的运动矢量求平均而获得的值作为运动矢量的合并候选,并且零合并候选表示运动矢量为0的合并候选。
对于当前块的合并候选列表,可按照以下顺序添加合并候选。
空间合并候选-时间合并候选-运动信息候选-(仿射运动信息候选)-成对合并候选-零合并候选。
空间合并候选表示从邻近块或非邻近块中的至少一个推导出的合并候选,并且时间合并候选表示从先前参考画面推导出的合并候选。仿射运动信息候选表示从通过仿射运动模型被编码/解码的块推导出的运动信息候选。
也可在运动矢量预测模式下使用运动信息表。在示例中,当包括在当前块的运动矢量预测候选列表中的运动矢量预测候选的数量小于阈值时,包括在运动信息表中的运动信息候选可被设置为针对当前块的运动矢量预测候选。具体地,运动信息候选的运动矢量可被设置为运动矢量预测候选。
如果包括在当前块的运动矢量预测候选列表中的运动矢量预测候选中的任意一个被选择,则可将所选的候选设置为当前块的运动矢量预测因子。然后,在对当前块的运动矢量残差值进行解码之后,可通过将运动矢量预测因子和运动矢量残差值相加来获得当前块的运动矢量。
可按照以下顺序配置当前块的运动矢量预测候选列表。
空间运动矢量预测候选-时间运动矢量预测候选-运动信息候选-(仿射运动信息候选)-零运动矢量预测候选
空间运动矢量预测候选表示从邻近块或非邻近块中的至少一个推导出的运动矢量预测候选,并且时间运动矢量预测候选表示从先前参考画面推导出的运动矢量预测候选。仿射运动信息候选表示从通过仿射运动模型被编码/解码的块推导出的运动信息候选。零运动矢量预测候选表示运动矢量的值为0的候选。
大于编码块的合并处理区域可被定义。合并处理区域中包括的编码块可被并行地处理,而不被顺序地编码/解码。就此而言,不被顺序地编码/解码表示编码/解码的顺序未被定义。因此,可独立地对合并处理区域中包括的块的编码/解码处理进行处理。可选地,包括在合并处理区域中的块可共享合并候选。就此而言,可基于合并处理区域推导合并候选。
根据上述特征,合并处理区域可被称为并行处理区域、共享合并区域(SMR)或合并估计区域(MER)。
可基于编码块推导当前块的合并候选。但是,当当前块被包括在大于当前块的合并处理区域中时,包括在与当前块相同的合并处理区域中的候选块可被设置为不可用作合并候选。
图16是示出包括在与当前块相同的合并处理区域中的候选块被设置为不可用作合并候选的示例的示图。
在图16(a)中所示的示例中,在CU5的解码/解码中,包括与CU5相邻的基本样点的块可被设置为候选块。就此而言,包括在与CU5相同的合并处理区域中的候选块x3和x4可被设置为不可用作CU5的合并候选。但是,未包括在与CU5相同的合并处理区域中的候选块x0、x1和x2可被设置为可用作合并候选。
在图16(b)中所示的示例中,在CU8的解码/解码中,包括与CU8相邻的基本样点的块可被设置为候选块。就此而言,包括在与CU8相同的合并处理区域中的候选块x6、x7和x8可被设置为不可用作合并候选。但是,未包括在与CU8相同的合并处理区域中的候选块x5和x9可被设置为可用作合并候选。
可选地,当当前块被包括在合并处理区域中时,可将与当前块和合并处理区域相邻的邻近块设置为候选块。
图17是示出当当前块被包括在合并处理区域中时推导针对当前块的合并候选的示例的示图。
如在图17(a)所示的示例中,与当前块相邻的邻近块可被设置为用于推导当前块的合并候选的候选块。就此而言,包括在与当前块相同的合并处理区域中的候选块可被设置为不可用作合并候选。在示例中,在推导针对编码块CU3的合并候选时,包括在与编码块CU3相同的合并处理区域中的上方邻近块y3和右上方邻近块y4可被设置为不可用作编码块CU3的合并候选。
通过按照预定义顺序对与当前块相邻的邻近块进行扫描,可推导合并候选。在示例中,所述预定义顺序可以是y1、y3、y4、y0和y2的顺序。
当可从与当前块相邻的邻近块推导的合并候选的数量小于从合并候选的最大数量减去偏移的值或所述最大数量时,可如图17(b)中所示的示例通过使用与合并处理区域相邻的邻近块来推导针对当前块的合并候选。在示例中,与包括编码块CU3的合并处理区域相邻的邻近块可被设置为针对编码块CU3的候选块。就此而言,与合并处理区域相邻的邻近块可包括左侧邻近块x1、上方邻近块x3、左下方邻近块x0、右上方邻近块x4或左上方邻近块x2中的至少一个。
通过按照预定义顺序对与合并处理区域相邻的邻近块进行扫描,可推导合并候选。在示例中,所述预定义顺序可以是x1、x3、x4、x0和x2的顺序。
总之,可通过按照以下扫描顺序对候选块进行扫描来推导针对包括在合并处理区域中的编码块CU3的合并候选。
(y1,y3,y4,y0,y2,x1,x3,x4,x0,x2)
但是,上面示出的候选块的扫描顺序仅示出了本公开的示例,并且可按照与以上示例不同的顺序对候选块进行扫描。可选地,可基于当前块或合并处理区域的尺寸或形状中的至少一个来自适应地确定扫描顺序。
合并处理区域可以是正方形或非正方形的。可以以比特流用信号发送用于确定合并处理区域的信息。该信息可包括表示合并处理区域的形状的信息或表示合并处理区域的尺寸的信息中的至少一个。当合并处理区域是非正方形时,可以以比特流用信号发送表示合并处理区域的尺寸的信息、表示合并处理区域的宽度或高度的信息或者表示合并处理区域的宽高比的信息中的至少一个。
可基于以比特流用信号发送的信息、画面分辨率、条带的尺寸或并行块的尺寸中的至少一个来确定合并处理区域的尺寸。
如果针对包括在合并处理区域中的块执行运动补偿预测,则可将基于被执行运动补偿预测的块的运动信息推导出的运动信息候选添加到运动信息表。
但是,如果从包括在合并处理区域中的块推导出的运动信息候选被添加到运动信息表,则可能发生在对合并处理区域中的编码/解码实际上比该块慢的其它块的编码/解码中使用从该块推导出的运动信息候选的情况。换句话说,虽然应该在合并处理区域中包括的块的编码/解码中排除块之间的依赖性,但是可能发生通过使用合并处理区域中包括的其他块的运动信息来执行运动预测补偿的情况。为了解决这样的问题,虽然完成了对合并处理区域中包括的块的编码/解码,但是可不将完成了编码/解码的块的运动信息添加到运动信息表。
可选地,可仅使用合并处理区域内的预定义位置处的块来更新运动信息表。预定义位置的示例可包括位于合并处理区域的左上方的块、位于合并处理区域的右上方的块、位于合并处理区域的左下方的块、位于合并处理区域的右下方的块、位于合并处理区域的中心的块、与合并处理区域的右边界相邻的块和与合并处理区域的下边界相邻的块中的至少一个。作为示例,可仅用与合并处理区域的右下角相邻的块的运动信息来更新运动信息表,并且可不用其它块的运动信息来更新运动信息表。
可选地,在完成了对包括在合并处理区域中的全部块的解码之后,可将从所述块推导出的运动信息候选添加到运动信息表。也就是说,虽然包括在合并处理区域中的块被编码/解码,但可不更新运动信息表。
在示例中,如果针对合并处理区域中包括的块执行运动补偿预测,则可按照预定义顺序将从所述块推导出的运动信息候选添加到运动信息表。就此而言,可按照合并处理区域或编码树单元中的编码块的扫描顺序来确定所述预定义顺序。扫描顺序可以是光栅扫描、水平扫描、垂直扫描或Z字形扫描中的至少一个。可选地,可基于每个块的运动信息或具有相同运动信息的块的数量来确定所述预定义顺序。
可选地,包括单向运动信息的运动信息候选可在包括双向运动信息的运动信息候选之前被添加到运动信息表。相反,包括双向运动信息的运动信息候选可在包括单向运动信息的运动信息候选之前被添加到运动信息表。
可选地,可按照在合并处理区域或编码树单元中高使用频率或低使用频率的顺序将运动信息候选添加到运动信息表。
当当前块被包括在合并处理区域中且包括在当前块的合并候选列表中的合并候选的数量小于最大数量时,可将包括在运动信息表中的运动信息候选添加到合并候选列表。就此而言,可将从包括在与当前块相同的合并处理区域中的块推导出的运动信息候选设置为不被添加到当前块的合并候选列表。
可选地,当当前块被包括在合并处理区域中时,可设置为不使用包括在运动信息表中的运动信息候选。换句话说,虽然包括在当前块的合并候选列表中的合并候选的数量小于最大数量,但是可不将包括在运动信息表中的运动信息候选添加到合并候选列表。
在另一示例中,可配置关于合并处理区域或编码树单元的运动信息表。这个运动信息表起到临时存储合并处理区域中包括的块的运动信息的作用。为了将一般运动信息表与针对合并处理区域或编码树单元的运动信息表区分开,针对合并处理区域或编码树单元的运动信息表被称为临时运动信息表。而且,存储在临时运动信息表中的运动信息候选被称为临时运动信息候选。
图18是示出临时运动信息表的示图。
可配置针对编码树单元或合并处理区域的临时运动信息表。当对包括在编码树单元或合并处理区域中的当前块执行运动补偿预测时,可不将该块的运动信息添加到运动信息表HmvpCandList。作为替代,可将从该块推导出的临时运动信息候选添加到临时运动信息表HmvpMERCandList。换句话说,添加到临时运动信息表的临时运动信息候选可不被添加到运动信息表。因此,运动信息表可不包括基于包括当前块的编码树单元或合并处理区中所包括的块的运动信息推导出的运动信息候选。
可选地,可仅将合并处理区域中包括的块中的一些块的运动信息添加到临时运动信息表。作为示例,仅合并处理区域内的预定义位置处的块可被用于更新运动信息表。所述预定义位置可包括位于合并处理区域的左上方的块、位于合并处理区域的右上方的块、位于合并处理区域的左下方的块、位于合并处理区域的右下方的块、位于合并处理区域的中心的块、与合并处理区域的右边界相邻的块和与合并处理区域的下边界相邻的块中的至少一个。作为示例,可仅将与合并处理区域的右下角相邻的块的运动信息添加到临时运动信息表,并且可不将其它块的运动信息添加到临时运动信息表。
临时运动信息表能够包括的临时运动信息候选的最大数量可被设置为等于运动信息表能够包括的运动信息候选的最大数量。可选地,可根据编码树单元或合并处理区域的尺寸来确定临时运动信息表能够包括的临时运动信息候选的最大数量。可选地,可将临时运动信息表能够包括的临时运动信息候选的最大数量设置为小于运动信息表能够包括的运动信息候选的最大数量。
包括在编码树单元或合并处理区域中的当前块可被设置为不使用关于对应的编码树单元或合并处理区域的临时运动信息表。换句话说,当包括在当前块的合并候选列表中的合并候选的数量小于阈值时,可将包括在运动信息表中的运动信息候选添加到合并候选列表,并且可不将包括在临时运动信息表中的临时运动信息候选添加到合并候选列表。因此,包括在与当前块相同的编码树单元或相同的合并处理区域中的其他块的运动信息可不被用于当前块的运动补偿预测。
如果完成了对编码树单元或合并处理区域中包括的全部块的编码/解码,则可使运动信息表和临时运动信息表一致。
图19是示出使运动信息表和临时运动信息表一致的示例的示图。
如果完成了对包括在编码树单元或合并处理区域中的全部块的编码/解码,则如在图19中所示的示例中,可在运动信息表中更新包括在临时运动信息表中的临时运动信息候选。
就此而言,包括在临时运动信息表中的临时运动信息候选可按照插入在临时运动信息表中的顺序(换句话说,按照索引值的升序或降序)被添加到运动信息表。
在另一示例中,包括在临时运动信息表中的临时运动信息候选可按照预定义顺序被添加到运动信息表。就此而言,可按照合并处理区域或编码树单元中的编码块的扫描顺序来确定所述预定义顺序。扫描顺序可以是光栅扫描、水平扫描、垂直扫描或Z字形扫描中的至少一个。可选地,可基于每个块的运动信息或具有相同运动信息的块的数量来确定所述预定义顺序。
可选地,包括单向运动信息的临时运动信息候选可在包括双向运动信息的临时运动信息候选之前被添加到运动信息表。相反,包括双向运动信息的临时运动信息候选可在包括单向运动信息的临时运动信息候选之前被添加到运动信息表。
可选地,可按照在合并处理区域或编码树单元中高使用频率或低使用频率的顺序将临时运动信息候选添加到运动信息表。
在包括在临时运动信息表中的临时运动信息候选被添加到运动信息表的情况下,可执行针对临时运动信息候选的冗余校验。在示例中,当与包括在临时运动信息表中的临时运动信息候选相同的运动信息候选被预存储在运动信息表中时,可不将该临时运动信息候选添加到运动信息表。就此而言,可针对包括在运动信息表中的运动信息候选中的一部分运动信息候选执行冗余校验。在示例中,可针对索引超过或低于阈值的运动信息候选执行冗余校验。在示例中,当临时运动信息候选等于索引高于预定义值的运动信息候选时,可不将该临时运动信息候选添加到运动信息表。
这可限制将从与当前块相同的编码树单元或相同的合并处理区域中包括的块推导出的运动信息候选用作当前块的合并候选。为此,可针对运动信息候选另外存储块的地址信息。块的地址信息可包括块的位置、块的地址、块的索引、包括块的合并处理区域的位置、包括块的合并处理区域的地址、包括块的合并处理区域的索引、包括块的编码树区域的位置、包括块的编码树区域的地址或包括块的编码树区域的索引中的至少一个。
帧内预测通过使用已经被编码/解码并且在当前块周围的重建样点来预测当前块。就此而言,可将应用环内滤波器之前的重建样点用于当前块的帧内预测。
帧内预测方法包括基于矩阵的帧内预测以及根据邻近重建样点的方向的帧内预测。可以以比特流用信号发送指示当前块的帧内预测方法的信息。所述信息可以是1比特标志。可选地,可基于当前块的位置、当前块的尺寸、当前块的形状或邻近块的帧内预测方法中的至少一个来确定当前块的帧内预测。在示例中,当当前块呈现为跨越画面边界时,可设置为使得基于矩阵的帧内预测方法不被应用于当前块。
基于矩阵的帧内预测方法是基于存储在编码器和解码器中的矩阵和当前块周围的重建样点的矩阵乘积来获得当前块的预测块的方法。可以以比特流用信号发送用于指定多个预存储的矩阵中的任意一个矩阵的信息。解码器可基于上述信息和当前块的尺寸来确定用于对当前块执行帧内预测的矩阵。
一般帧内预测是一种基于非方向帧内预测模式或方向帧内预测模式获得当前块的预测块的方法。在下文中,将参考附图详细描述基于一般帧内预测的帧内预测的处理。
图20是根据本公开的实施例的帧内预测方法的流程图。
可以确定当前块的参考样点线(S2001)。参考样点线是指包括在远离当前块的上方和/或左侧的第k线中的一组参考样点。可以从在当前块周围编码/解码的重建样点推导出参考样点。
可以以比特流用信号发送标识多个参考样点线中的当前块的参考样点线的索引信息。在示例中,可以以比特流用信号发送用于指定当前块的参考样点线的索引信息intra_luma_ref_idx。可按每个编码块用信号发送索引信息。
多个参考样点线可以包括在当前块的上方和/或左侧的第一线、第二线或第三线中的至少一个。由多个参考样点线中的与当前块的上方相邻的行和与当前块的左侧相邻的列组成的参考样点线可以被称为相邻参考样点线,并且其他参考样点线可以被称为非相邻参考样点线。
表1示出了分配给每个候选参考样点线的索引。
【表1】
Figure GDA0003163807220000311
Figure GDA0003163807220000321
基于当前块的位置、尺寸、形状或邻近块的预测编码模式中的至少一个,可以确定当前块的参考样点线。在一个示例中,当当前块邻接画面、并行块、条带或编码树单元的边界时,可以将相邻参考样点线确定为当前块的参考样点线。参考样点线可以包括位于当前块上方的上方参考样点和位于当前块左侧的左侧参考样点。上方参考样点和左侧参考样点可从当前块周围的重建样点推导出。重建样点可处于应用环内滤波器之前的状态。
接下来,可以确定当前块的帧内预测模式(S2002)。对于当前块的帧内预测模式,可以将非方向帧内预测模式或方向帧内预测模式中的至少一个确定为当前块的帧内预测模式。非方向帧内预测模式包括平面(planar)及DC,且方向帧内预测模式包括从左下方对角线方向到右上方对角线方向的33或65个模式。
图21是示出帧内预测模式的示图。
图21(a)示出了35个帧内预测模式,图21(b)示出了67个帧内预测模式。
可以定义比图21所示更多或更少数量的帧内预测模式。
基于与当前块相邻的邻近块的帧内预测模式,可以设置MPM(Most Probable Mode最可能模式)。就此而言,邻近块可包括与当前块的左侧相邻的左侧邻近块和与当前块的上方相邻的上方邻近块。
可以在编码器和解码器中预设包括在MPM列表中的MPM的数量。在示例中,MPM的数量可以是3、4、5或6。可选地,可以以比特流用信号发送表示MPM的数量的信息。可选地,可基于邻近块的预测编码模式、当前块的尺寸、形状或参考样点线索引中的至少一个来确定MPM的数量。在示例中,虽然当确定相邻参考样点线为当前块的参考样点线时可以使用N个MPM,但是当确定非相邻参考样点线为当前块的参考样点线时可以使用M个MPM。由于M是小于N的自然数,在示例中,N可以是6并且M可以是5、4或3。因此,虽然当当前块的参考样点线的索引为0且MPM标志为真时,可以确定当前块的帧内预测模式为6个候选帧内预测模式中的任一个,但是当当前块的参考样点线的索引大于0且MPM标志为真时,可以确定当前块的帧内预测模式为5个候选帧内预测模式中的任一个。
可选地,可以使用固定数量(例如,6或5)的MPM候选,而不管当前块的参考样点线的索引如何。
当将基于矩阵的帧内预测应用于邻近块时,可通过将邻近块的帧内预测模式推断为平面来推导出MPM候选。
当将帧内BDPCM应用于邻近块时,可通过将邻近块的帧内预测模式推断为默认模式来推导出MPM候选。在这种情况下,默认模式可以是DC、平面、垂直方向或水平方向中的至少一个。
可选地,基于邻近块的帧内BDPCM应用方向,可以确定邻近块的帧内预测模式。在示例中,当将水平方向上的帧内BDPCM应用于邻近块时,可推断邻近块的帧内预测模式是在水平方向上。另一方面,当将垂直方向上的帧内BDPCM应用于邻近块时,可推断邻近块的帧内预测模式是在垂直方向上。
可生成包括多个MPM的MPM列表,并且可以以比特流用信号发送指示与当前块的帧内预测模式相同的MPM是否包括在MPM列表中的信息。由于所述信息是1比特标志,因此其可被称作MPM标志。当MPM标志表示MPM列表中包括与当前块相同的MPM时,可以以比特流用信号发送识别MPM中的一个的索引信息。在示例中,可以以比特流用信号发送指定多个MPM中的任一个的索引信息mpm_idx。可将由索引信息指定的MPM设置为当前块的帧内预测模式。当MPM标志表示MPM列表中不包括与当前块相同的MPM时,可以以比特流用信号发送指示除MPM以外的剩余帧内预测模式中的任一个的剩余模式信息。剩余模式信息表示当将索引重新分配给除MPM之外的剩余帧内预测模式时对应于当前块的帧内预测模式的索引值。解码器可以通过以升序排列MPM并将剩余模式信息与MPM进行比较来确定当前块的帧内预测模式。在示例中,当剩余模式信息等于或小于MPM时,可通过将1与剩余模式信息相加推导出当前块的帧内预测模式。
在推导出当前块的帧内预测模式时,可以省略将MPM的部分与剩余模式信息进行比较。在示例中,可从比较目标中排除MPM中的非方向帧内预测模式中的MPM。当将非方向帧内预测模式设置为MPM时,剩余模式信息清楚地指示方向帧内预测模式,因此可以通过将除非方向帧内预测模式之外的剩余MPM与剩余模式信息进行比较推导出当前块的帧内预测模式。代替从比较目标中排除非方向帧内预测模式,可以在将非方向帧内预测模式的数量添加到剩余模式信息之后将结果值与剩余MPM进行比较。
代替将默认模式设置为MPM,可以以比特流用信号发送指示当前块的帧内预测模式是否为默认模式的信息。所述信息是1比特标志,并且所述标志可被称作默认模式标志。可仅在MPM标志表示与当前块相同的MPM包括在MPM列表中时用信号发送默认模式标志。如上所述,默认模式可以包括平面、DC、垂直方向模式或水平方向模式中的至少一个。在示例中,当平面被设置为默认模式时,默认模式标志可指示当前块的帧内预测模式是否为平面。当默认模式标志指示当前块的帧内预测模式不是默认模式时,可将由索引信息指示的MPM中的一个设置为当前块的帧内预测模式。
当使用默认模式标志时,可以将其设置为不将与默认模式相同的帧内预测模式设置为MPM。在示例中,当默认模式标志指示当前块的帧内预测模式是否为平面时,可通过使用排除对应于平面的MPM的5个MPM推导出当前块的帧内预测模式。
当将多个帧内预测模式设置为默认模式时,可进一步用信号发送指示默认模式中的任一个的索引信息。可以将当前块的帧内预测模式设置为由索引信息指示的默认模式。
当当前块的参考样点线的索引不为0时,可以设置为不使用默认模式。在示例中,当非相邻参考样点线被确定为当前块的参考样点线时,可以设置为不使用诸如DC模式或平面模式的非方向帧内预测模式。因此,当参考样点线的索引不为0时,可不用信号发送默认模式标志,且可将默认模式标志的值推断为预定义值(即,假)。
当确定当前块的帧内预测模式时,可以基于所确定的帧内预测模式来获得当前块的预测样点(S2003)。
当选择DC模式时,可基于参考样点的平均值生成当前块的预测样点。详细地,可以基于参考样点的平均值来生成预测块内的所有样点的值。可以使用与当前块的上方相邻的上方参考样点和与当前块的左侧相邻的左侧参考样点中的至少一个推导出平均值。
当推导平均值时使用的参考样点的数量或范围可以基于当前块的形状而变化。在示例中,当当前块为宽度大于高度的非正方形块时,可通过使用上方参考样点来计算平均值。相反,当当前块是宽度小于高度的非正方形块时,可以通过使用左侧参考样点来计算平均值。换句话说,当当前块的宽度和高度不同时,可以使用与更大长度相邻的参考样点来计算平均值。可选择地,可以基于当前块的宽度和高度之间的比率来确定是通过使用上方参考样点还是通过使用左侧参考样点来计算平均值。
当选择平面模式时,可以通过使用水平方向预测样点和垂直方向预测样点来获得预测样点。就此而言,可基于与预测样点位于同一水平线处的左侧参考样点和右侧参考样点来获得水平方向预测样点,并且可基于与预测样点位于同一垂直线处的上方参考样点和下方参考样点来获得垂直方向预测样点。就此而言,可以通过复制与当前块的右上角相邻的参考样点来生成右侧参考样点,并且可以通过复制与当前块的左下角相邻的参考样点来生成下方参考样点。可以基于左侧参考样点和右侧参考样点的加权和获得水平方向预测样点,并且可以基于上方参考样点和下方参考样点的加权和获得垂直方向预测样点。就此而言,可以根据预测样点的位置来确定分配给每个参考样点的加权因子。可以基于水平方向预测样点和垂直方向预测样点的平均值或加权和来获得预测样点。当使用加权和时,可以基于预测样点的位置来确定分配给水平方向预测样点和垂直方向预测样点的加权因子。
当选择方向预测模式时,可以确定表示所选择的方向预测模式的预测方向(或预测角度)的参数。下面的表2表示用于每个帧内预测模式的intraPredAng的帧内方向参数。
【表2】
PredModeIntra 1 2 3 4 5 6 7
IntraPredAng - 32 26 21 17 13 9
PredModeIntra 8 9 10 11 12 13 14
IntraPredAng 5 2 0 -2 -5 -9 -13
PredModeIntra 15 16 17 18 19 20 21
IntraPredAng -17 -21 -26 -32 -26 -21 -17
PredModeIntra 22 23 24 25 26 27 28
IntraPredAng -13 -9 -5 -2 0 2 5
PredModeIntra 29 30 31 32 33 34
IntraPredAng 9 13 17 21 26 32
表2表示每个帧内预测模式的帧内方向参数,其中当定义35个帧内预测模式时,其索引是2至34中的一个。当定义方向帧内预测模式为大于33个时,可以通过细分表2来设置每个帧内预测模式的帧内方向参数。将当前块的上方参考样点和左侧参考样点排列成线,然后可以基于帧内方向参数的值获得预测样点。就此而言,当帧内方向参数的值为负值时,可以将左侧参考样点和上方参考样点排列成线。
图22和图23是分别示出将参考样点排列成线的一维排列的示例的示图。
图22是示出在垂直方向上排列参考样点的垂直方向一维排列的示图,并且图23是示出在水平方向上排列参考样点的水平方向一维排列的示图。假设定义了35种帧内预测模式,将描述图22和23的示例。
当帧内预测模式索引是11至18中的任何一个时,可以应用水平方向的一维排列,其中上方参考样点逆时针旋转,并且当帧内预测模式索引是19至25中的任何一个时,可以应用垂直方向的一维排列,其中左侧参考样点顺时针旋转。当将参考样点排列成线时,可以考虑帧内预测模式角度。
可以基于帧内方向参数来确定参考样点确定参数。参考样点确定参数可以包括用于指定样点的参考样点索引,以及用于确定应用于参考样点的加权因子的加权因子参数。
可以通过下面的等式2和3分别获得参考样点索引iIdx和加权因子参数ifact
【等式2】
iIdx=(y+1)*Pang/32
【等式3】
ifact=[(y+1)*Pang]&31
在等式2和3中,Pang表示帧内方向参数。由参考样点索引iIdx指定的参考样点对应于整数像素。
为了推导出预测样点,可以指定至少一个参考样点。具体地,根据预测模式的斜率,可以指定用于推导出预测样点的参考样点的位置。在示例中,可通过使用参考样点索引iIdx来指定用于推导出预测样点的参考样点。
就此而言,当帧内预测模式的斜率不由一个参考样点表示时,可以通过对多个参考样点执行插值来生成预测样点。在示例中,当帧内预测模式的斜率是预测样点和第一参考样点之间的斜率与预测样点和第二参考样点之间的斜率之间的值时,可以通过对第一参考样点和第二参考样点执行插值来获得预测样点。换句话说,当根据帧内预测角度的角度线不通过位于整数像素处的参考样点时,可以通过对与位于角度线通过的位置的左侧和右侧或者上方和下方相邻的参考样点执行插值来获得预测样点。
下面的等式4表示基于参考样点获得预测样点的示例。
【等式4】
P(x,y)=((32-ifact)/32)*Ref_1D(x+iIdx+1)+(ifact/32)*Ref_1D(x+iIdx+2)
在等式4中,P表示预测样点,Ref_1D表示排列成线的参考样点中的任何一个。就此而言,参考样点的位置可通过预测样点的位置(x,y)和参考样点索引iIdx来确定。
当帧内预测模式的斜率可能由一个参考样点表示时,设置加权因子参数ifact为0。因此,可以简化等式4为下面的等式5。
【等式5】
P(x,y)=Ref_1D(x+iIdxd+1)
可以基于多个帧内预测模式执行当前块的帧内预测。在示例中,可以针对每个预测样点推导出帧内预测模式,并且可以基于分配给每个预测样点的帧内预测模式推导出预测样点。
可选地,可以为每个区域推导出帧内预测模式,可以基于分配给每个区域的帧内预测模式来执行每个区域的帧内预测。就此而言,该区域可以包括至少一个样点。可以基于当前块的尺寸、当前块的形状和当前块的帧内预测模式中的至少一个自适应地确定区域的尺寸和形状中的至少一个。可选地,可以独立于当前块的尺寸或形状在编码器和解码器中预定义区域的尺寸和形状中的至少一个。
图24是示出在方向帧内预测模式和平行于x轴的直线之间形成的角度的示图。
如图24中所示的示例,方向预测模式可存在于左下方对角线方向与右上方对角线方向之间。描述在x轴和方向预测模式之间形成的角度,方向预测模式可以存在于45度(左下方对角线方向)到-135度(右上方对角线方向)。
当当前块是非正方形时,可能存这样的情况:通过使用位于根据帧内预测角度的角度线上的参考样点中的、位置比靠近根据当前块的帧内预测模式的预测样点的参考样点更远的参考样点,推导预测样点。
图25是示出在当前块为非正方形时获得预测样点的方面的示图。
在示例中,如图25(a)所示的示例,假设当前块是宽度大于高度的非正方形,并且当前块的帧内预测模式是具有0度至45度的角度的方向帧内预测模式。在上述情况下,当在位于根据上述角度的角度模式下的参考样点中推导当前块的右列周围的预测样点A时,可能存在使用远离预测样点的左侧参考样点L的情况,而不是使用靠近预测样点的上方参考样点T。
在另一示例中,如图25(b)所示的示例,假设当前块是高度大于宽度的非正方形,并且当前块的帧内预测模式是从-90度到-135度的方向帧内预测模式。在上述情况下,当在位于根据上述角度的角度模式下的参考样点中推导当前块的下方行周围的预测样点A时,可能存在使用远离预测样点的上方参考样点T的情况,而不是使用靠近预测样点的上方参考样点L。
为了解决上述问题,当当前块是非正方形时,可以用反方向的帧内预测模式替换当前块的帧内预测模式。因此,对于非正方形块,可使用具有大于或小于图21中所示的方向预测模式的角度的角度的方向预测模式。可以定义上述方向帧内预测模式为广角帧内预测模式。广角帧内预测模式表示不属于45度到-135度范围的方向帧内预测模式。
图26是示出广角帧内预测模式的示图。
在图26中所示的示例中,具有从-1到-14的索引的帧内预测模式及具有从67到80的索引的帧内预测模式表示广角帧内预测模式。
在图26中,示出了角度大于45度的14个广角帧内预测模式(从-1到-14)和角度小于-135度的4个广角帧内预测模式(从67到80)。然而,可以定义更多或更少数量的广角帧内预测模式。
当使用广角帧内预测模式时,可以将上方参考样点的长度设置为2W+1,并且可以将左侧参考样点的长度设置为2H+1。
通过使用广角帧内预测模式,可以通过使用参考样点T来预测图26(a)所示的样点A,并且可以通过参考样点L来预测图26(b)所示的样点A。
除了传统帧内预测模式和N个广角帧内预测模式之外,还可以使用总共67+N个帧内预测模式。在示例中,表3表示当定义20个广角帧内预测模式时用于帧内预测模式的帧内方向参数。
【表3】
Figure GDA0003163807220000391
Figure GDA0003163807220000401
当当前块是非正方形,并且在S2502中获得的当前块的帧内预测模式属于变换范围时,可变换当前块的帧内预测模式为广角帧内预测模式。可以基于当前块的尺寸、形状或比率中的至少一个来确定变换范围。就此而言,所述比率可表示当前块的宽度与高度之间的比率。当当前块是宽度大于高度的非正方形时,可以将变换范围设置为从右上方对角线方向的帧内预测模式索引(例如,66)到(右上方对角线方向的帧内预测模式索引-N)。就此而言,可以基于当前块的比率来确定N。当当前块的帧内预测模式属于变换范围时,可以将帧内预测模式变换为广角帧内预测模式。变换可以是从帧内预测模式减去预定义值,并且预定义值可以是排除广角帧内预测模式的帧内预测模式的总数(例如,67)。
在以上示例中,可以将从数字66到数字53的帧内预测模式分别变换为从数字-1到数字-14的广角帧内预测模式。
当当前块是高度大于宽度的非正方形时,可以设置变换范围为从左下方对角线方向的帧内预测模式索引(例如,2)到(左下方对角线方向的帧内预测模式索引+M)。就此而言,可以基于当前块的比率来确定M。当当前块的帧内预测模式属于变换范围时,可以将帧内预测模式变换为广角帧内预测模式。变换可以是将预定义值与帧内预测模式相加,并且预定义值可以是排除广角帧内预测模式的方向帧内预测模式的总数(例如,65)。
在以上示例中,可分别变换从数字2到数字15的帧内预测模式为从数字67到数字80的广角帧内预测模式。
在下文中,属于变换范围的帧内预测模式被称为广角帧内预测替换模式。
可以基于当前块的比率来确定变换范围。在示例中,表4和表5分别示出了定义了排除广角帧内预测模式的35个帧内预测模式的情况和定义了排除广角帧内预测模式的67个帧内预测模式的情况的变换范围。
【表4】
条件 替换的帧内预测模式
W/H=2 模式2、3、4
W/H>2 模式2、3、4、5、6
W/H=1
H/W=1/2 模式32、33、34
H/W<1/2 模式30、31、32、33、34
【表5】
条件 替换的帧内预测模式
W/H=2 模式2、3、4、5、6、7
W/H>2 模式2、3、4、5、6、7、8、9、10、11
W/H=1
H/W=1/2 模式61、62、63、64、65、66
H/W<1/2 模式57、58、59、60、61、62、63、64、65、66
如表4和表5中所示的示例,包括在变换范围中的广角帧内预测替换模式的数量可根据当前块的比率而变化。可以进一步细分当前块的比率以设置如下表6所示的变换范围。
【表6】
条件 替换的帧内预测模式
W/H=16 模式12、13、14、15
W/H=8 模式12、13
W/H=4 模式2、3、4、5、6、7、8、9、10、11
H/W=2 模式2、3、4、5、6、7
H/W=1
W/H=1/2 模式61、62、63、64、65、66
W/H=1/4 模式57、58、59、60、61、62、63、64、65、66
W/H=1/8 模式55、56
H/W=1/16 模式53、54、55、56
当确定非相邻参考样点线为当前块的参考样点线时,或者当使用用于选择多个参考样点线中的一个的多线帧内预测编码方法时,可以配置预测方法为不使用广角帧内预测模式。也就是说,尽管当前块具有非正方形形状,并且当前块的帧内预测模式属于变换范围,但是可以不变换当前块的帧内预测模式为广角帧内预测模式。可选地,当确定当前块的帧内预测模式为广角帧内预测模式时,预测方法可以被配置为使得非相邻参考样点线不可用作当前块的参考样点线,或者可以被配置为不使用用于选择多个参考样点线中的一个的多线帧内预测编码方法。当不使用多线帧内预测编码方法时,可以确定相邻参考样点线为当前块的参考样点线。
当不使用广角帧内预测模式时,可以将refW和refH中的每一个设置为nTbW和nTbH的和。因此,与当前块间隔开i的非相邻参考样点线可以包括除了左上方参考样点之外的(nTbW+nTbH+offsetX[i])个上方参考样点和(nTbW+nTbH+offsetY[i])个左侧参考样点。也就是说,与当前块间隔开i的非相邻参考样点线可以包括(2nTbW+2nTbH+offsetX[i]+offsetY[i]+1)个参考样点。例如,当whRatio的值大于1时,可以设置offsetX的值为大于offsetY的值。在一个示例中,当可以设置offsetX的值为1时,可以设置offsetY的值为0。相反,当whRatio的值小于1时,可以设置offsetY的值为大于offsetX的值。在一个示例中,可以设置offsetX的值为0,并且可以设置offsetY的值为1。
由于在传统帧内预测模式之外还使用广角帧内预测模式,编码广角帧内预测模式的资源可能会增加,因此,编码效率可能会降低。因此,不是按原样对广角帧内预测模式进行编码,而是对广角帧内预测模式的替换帧内预测模式进行编码,以便提高编码效率。
在示例中,当通过使用编号67的广角帧内预测模式对当前块进行编码时,可将作为编号67的广角替换帧内预测模式的编号2编码为当前块的帧内预测模式。另外,当通过使用编号-1的广角帧内预测模式对当前块进行编码时,可将作为编号-1的广角替换帧内预测模式的编号66编码为当前块的帧内预测模式。
解码器可对当前块的帧内预测模式进行解码,并确定解码的帧内预测模式是否属于变换范围。当解码的帧内预测模式是广角替换帧内预测模式时,可将帧内预测模式变换为广角帧内预测模式。
可选地,当通过广角帧内预测模式对当前块进行编码时,可以按原样对广角帧内预测模式进行编码。
可基于上文所描述的MPM列表执行帧内预测模式的编码。具体地讲,当在广角帧内预测模式中对邻近块进行编码时,可基于与广角帧内预测模式对应的广角替换帧内预测模式来设置MPM。
编码块或变换块可被分区成多个子块(或子分区)。当编码块或变换块被分区成多个子块时,可以对每个子块执行预测、变换和量化。编码块或变换块被分区为多个子块可以被定义为子分区帧内编码方法。
可以以比特流用信号发送表示是否应用子分区帧内编码方法的信息。该信息可以是1比特标志。在示例中,可以以比特流用信号发送表示是否将编码块或变换块分区成多个子块的语法因子“intra_subpartitions_mode_flag”。
可选地,可以基于编码块或变换块的尺寸、形状或帧内预测模式中的至少一个来确定是否应用子分区帧内编码方法。在示例中,当编码块的帧内预测模式是非方向帧内预测模式(例如,平面或DC)或预定义的方向帧内预测模式(例如,水平方向上的帧内预测模式、垂直方向上的帧内预测模式或对角线方向上的帧内预测模式)时,可以不应用子分区帧内编码方法。可选地,当编码块的尺寸小于阈值时,可将子分区帧内编码方法设置为不使用。
可选地,当基于编码块的帧内预测模式执行子块的帧内预测时,可以基于包括在邻近子块中的重建样点是否应该被用作子块的帧内预测中的参考样点来确定是否应用子分区帧内编码方法。在示例中,当编码块的帧内预测模式是对角线方向上的帧内预测模式或广角帧内预测模式,并且在基于帧内预测模式对子块执行帧内预测而邻近子块可能不被用作参考样点时,可以设置不使用子分区帧内编码方法。
可选地,当编码块的高度和宽度的比率等于或大于阈值或等于或小于阈值时,可设置不使用子分区帧内编码方法。可选地,当编码块的高度或宽度中的至少一个等于或小于阈值时,可不使用子分区帧内编码方法。在示例中,当编码块的宽度或高度等于或小于阈值时,或者当编码块的高度和宽度都等于或小于阈值时,可不使用子分区帧内编码方法。可选地,当编码块中包括的样点的数量等于或小于阈值时,可不使用子分区帧内编码方法。阈值可以在编码器和解码器中具有预定义值。可选地,可以以比特流用信号发送用于确定阈值的信息。
可选地,可以基于编码块或变换块的尺寸、形状或帧内预测模式中的至少一个来确定是否用信号发送表示是否应用子分区帧内编码方法的标志。在示例中,仅当编码块的高度和宽度都等于或小于阈值时和/或当编码块的尺寸等于或大于阈值时,可以编码和用信号发送表示是否应用子分区帧内编码方法的标志。当不对表示是否应用子分区帧内编码方法的标志进行编码时,可不应用子分区帧内编码方法。
当不使用子分区帧内编码方法时,可以省略语法因子intra_subpartitions_mode_flag的信令。当省略标志的信令时,可以认为标志表示不应用子分区帧内编码方法。
当应用子分区帧内编码方法时,可以确定编码块或变换块的分区形状。在这种情况下,分区形状表示编码块或变换块的分区方向。在示例中,垂直方向上的分区可指通过使用至少一条垂直线来对编码块或变换块进行分区,并且水平方向上的分区可指通过使用至少一条水平线来对编码块或变换块进行分区。
图27是示出垂直方向上的分区和水平方向上的分区的示例的示图。
图27(a)表示将编码块分区为2个子块的例子,图27(b)表示将编码块分区为4个子块的例子。
可以以比特流用信号发送用于确定编码块或变换块的分区形状的信息。在示例中,可用信号发送表示垂直方向上的分区是否被应用于编码块或变换块或水平方向上的分区是否被应用于编码块或变换块的信息。该信息可以是1比特标志intra_subpart_type_flag。当标志的值为1时,表示在水平方向上分区编码块或变换块,并且当标志的值为0时,表示在垂直方向上分区编码块或变换块。
可选地,可以基于编码块或变换块的尺寸、形状或帧内预测模式来确定编码块或变换块的分区形状。在示例中,可以基于编码块的宽度和高度的比率来确定编码块的分区形状。例如,当表示编码块的高宽比的值whRatio等于或大于第一阈值时,可以将垂直方向上的分区应用于编码块。否则,可将水平方向上的分区应用于编码块。
图28是示出确定编码块的分区形状的示例的示图。
为了便于描述,假设第一阈值为2。在图28(a)所示的示例中,编码块的whRatio为1,其小于第一阈值。因此,可省略表示编码块的分区形状的信息的编码,并且可将水平方向上的分区应用于编码块。
在图28(b)所示的示例中,编码块的whRatio为2,其与第一阈值相同。因此,可省略表示编码块的分区形状的信息的编码,并且可将垂直方向上的分区应用于编码块。
可通过使用符号与第一阈值相反的第二阈值来确定编码块的分区形状。在示例中,当whRatio的值等于或小于第二阈值时,可以将水平方向上的分区应用于编码块,否则,可以将垂直方向上的分区应用于编码块。第一阈值和第二阈值的绝对值可以相同,并且它们的符号可以不同。在示例中,当第一阈值是N(在这种情况下,N是诸如1、2、4等的整数)时,第二阈值可以是-N。
图29是示出确定编码块的分区形状的示例的示图。
为了便于描述,假设第二阈值为-2。在图29(a)所示的示例中,编码块的whRatio为-1,其大于第二阈值。因此,可省略表示编码块的分区形状的信息的编码,并且可将垂直方向上的分区应用于编码块。
在图29(b)所示的示例中,编码块的whRatio为-2,其与第二阈值相同。因此,可省略表示编码块的分区形状的信息的编码,并且可将水平方向上的分区应用于编码块。
可选地,可以基于第一阈值和第二阈值确定编码块的分区形状。在示例中,当whRatio的值等于或大于第一阈值时,可以将水平方向上的分区应用于编码块,并且当whRatio的值等于或小于第二阈值时,可以将垂直方向上的分区应用于编码块。当whRatio的值存在于第一阈值和第二阈值之间时,可以通过解析比特流中的信息来确定当前块的分区形状。
可以在编码器和解码器中预定义第一阈值和第二阈值。可选地,可以按每个序列、画面或条带定义第一阈值和第二阈值。
可选地,可基于编码块或变换块的尺寸来确定分区形状。在示例中,当编码块的尺寸为N×n时,可以应用垂直方向上的分区,并且当编码块的尺寸为n×N时,可以应用水平方向上的分区。在这种情况下,n可以是小于N的自然数。N和/或n可以是编码器和解码器中的预定义值。可选地,可以以比特流用信号发送用于确定N及/或n的信息。在示例中,N可以是32、4、128或256等。因此,当编码块的尺寸是128×n(在这种情况下,n是诸如16、32或64等的自然数)时,可以应用垂直方向上的分区,并且当编码块的尺寸是n×128时,可以应用水平方向上的分区。
可选地,可以基于编码块或变换块的帧内预测模式来确定编码块或变换块的分区形状。在示例中,当编码块的帧内预测模式是在水平方向上或在类似于水平方向的方向上时,可以将垂直方向上的分区应用于编码块。在这种情况下,类似于水平方向的方向上的帧内预测模式表示与水平方向上的帧内预测模式(例如,图21(b)所示的INTRA_ANGULAR18)的索引差值等于或小于阈值的帧内预测模式(例如,INTRA_ANGULAR18±N)。另一方面,当编码块的帧内预测模式在垂直方向上或在类似于垂直方向的方向上时,可以将水平方向上的分区应用于编码块。在这种情况下,类似于垂直方向的方向上的帧内预测模式表示与垂直方向上的帧内预测模式(例如,图21(b)所示的INTRA_ANGULAR50)的索引差值等于或小于阈值的帧内预测模式(例如,INTRA_ANGULAR50±N)。在这种情况下,阈值N可以是编码器和解码器中的预定义值。可选地,可在序列级、画面级或条带级中用信号发送用于确定阈值N的信息。
当垂直方向上的分区和水平方向上的分区都可用时,可通过解析表示编码块的分区形状的信息来确定编码块的分区形状。
可基于编码块或变换块的尺寸或形状中的至少一个来确定子块的数量。在示例中,当编码块的宽度或高度中的任一个为8且另一个为4时,可将编码块分区成2个子块。另一方面,当编码块的宽度和高度都等于或大于8时,或者当编码块的宽度或高度中的任一个大于8时,编码块可被分区为4个子块。总之,当编码块具有4×4尺寸时,可不分区编码块成子块。当编码块具有4×8或8×4尺寸时,可将编码块分区成2个子块。否则,可将编码块分区成4个子块。
可选地,可以以比特流用信号发送表示子块的尺寸或形状或子块的数量的信息。子块的尺寸或形状可由表示子块的数量的信息确定。可选地,可以通过表示子块的尺寸或形状的信息来确定子块的数量。
当应用子分区帧内编码方法时,通过对编码块或变换块进行分区而生成的子块可以使用相同的帧内预测模式。在示例中,可以基于与编码块邻近的邻近块的帧内预测模式推导出用于编码块的MPM,并且可以基于推导出的MPM来确定用于编码块的帧内预测模式。当确定编码块的帧内预测模式时,每一子块可通过使用确定的帧内预测模式来执行帧内预测。
当应用子分区帧内编码方法时,可以确定MPM中的任何一个为编码块的帧内预测模式。换句话说,当应用子分区帧内编码方法时,尽管没有用信号发送MPM标志,可以认为MPM标志是真的。
可选地,当应用子分区帧内编码方法时,可以确定预定义的候选帧内预测模式中的任何一个为编码块的帧内预测模式。在示例中,可以确定水平方向上的帧内预测模式、垂直方向上的帧内预测模式、对角线方向上的帧内预测模式(例如左上方帧内预测模式、右上方帧内预测模式或左下方帧内预测模式中的至少一个)或非方向帧内预测模式(例如平面或DC中的至少一个)中的任何一个为编码块的帧内预测模式。可以以比特流用信号发送指定预定义的候选帧内预测模式中的任何一个的索引信息。可选地,根据编码块的分区方向,候选帧内预测模式的数量和/或类型可以不同。在示例中,当将水平方向上的分区应用于编码块时,可以将非方向帧内预测模式、垂直方向上的帧内预测模式、左上方对角线方向上的帧内预测模式或右上方对角线方向上的帧内预测模式中的至少一个设置为候选帧内预测模式。另一方面,当将垂直方向上的分区应用于编码块时,可以将非方向帧内预测模式、水平方向上的帧内预测模式、左上方对角线方向上的帧内预测模式或左下方对角线方向上的帧内预测模式中的至少一个设置为候选帧内预测模式。
可个别地确定子块的量化参数。因此,可不同地设置每一子块的量化参数的值。可对表示与先前子块的量化参数的差值的信息进行编码以确定每一子块的量化参数。在示例中,对于第N子块,可对第N子块的量化参数与第N-1子块的量化参数之间的不同值进行编码。
可以通过使用参考样点来执行子块的帧内预测。在此情况下,可从与子块相邻的邻近块的重建样点推导出参考样点。当与子块相邻的邻近块是包括在与所述子块相同的编码块中的其它子块时,可基于该其它子块的重建样点推导出所述子块的参考样点。在示例中,当第一子块位于第二子块的左侧或上方时,可从第一子块的重建样点推导出第二子块的参考样点。为此,不可在子块之间应用并行帧内预测。换句话说,编码/解码可以针对编码块中包括的子块顺序地进行。因此,在完成第一子块的编码/解码之后,可以执行第二子块的帧内预测。
当应用子分区帧内编码方法时,可以设置不使用选择多个参考样点线候选中的任何一个的多线帧内预测编码方法。当不使用多线帧内预测编码方法时,可以确定与每个子块相邻的相邻参考样点线为每个子块的参考样点线。可选地,当当前块的参考样点线的索引大于0时,可以省略对表示是否应用子分区帧内编码方法的语法因子intra_subpartitions_mode_flag的编码。当省略语法intra_subpartitions_mode_flag的编码时,可不应用子分区帧内编码方法。
可针对与子块之间的边界相邻的样点执行滤波。可针对预测样点或重建样点执行滤波。在示例中,当假定第二子块与第一子块的右侧相邻时,可通过使用与第一子块的右边界接界的重建样点来对与第二子块的左边界接界的预测样点或重建样点进行滤波。
可基于帧内预测模式、子块的尺寸或子块的数量中的至少一个来确定是否将滤波器应用于与子块之间的边界相邻的样点。
当通过执行帧内预测生成预测块时,可以基于包括在预测块中的每个预测样点的位置来更新预测样点。这种更新方法可以被称为基于样点位置的帧内加权预测方法(或位置相关预测组合,PDPC)。
可以通过考虑当前块的尺寸或形状、帧内预测模式、当前块的参考样点线、当前块的尺寸或颜色分量来确定是否将使用PDPC。在示例中,当当前块的帧内预测模式为平面、DC、垂直方向、水平方向、索引值小于垂直方向的模式或索引值大于水平方向的模式中的至少一个时,可使用PDPC。可选地,可仅在当前块的宽度或高度中的至少一个大于4时使用PDPC。可选地,可仅在当前块的参考画面线的索引为0时使用PDPC。可选地,可仅在当前块的参考画面线的索引等于或大于预定义值时使用PDPC。可选地,PDPC可仅用于亮度分量。可选地,可以根据是否满足两个或更多个列举的条件来确定是否使用PDPC。
可选地,可以根据是否使用子分区帧内编码方法来确定是否使用PDPC。在示例中,当将子分区帧内编码方法应用于编码块或变换块时,可以设置不使用PDPC。可选地,当将子分区帧内编码方法应用于编码块或变换块时,可以将PDPC应用于多个子块中的至少一个子块。在此情况下,可基于编码块或子块的尺寸、形状、位置、帧内预测模式或参考样点线索引中的至少一个来确定以PDPC为目标的子块。在示例中,可以将PDPC应用于与编码块的上边界和/或左边界相邻的子块或与编码块的下边界和/或右边界相邻的子块。可选地,基于子块的尺寸或形状,可以设置为将PDPC应用于编码块中包括的所有子块,或者可以设置为不将PDPC应用于编码块中包括的所有子块。在示例中,当子块的宽度或高度中的至少一个小于阈值时,可省略PDPC的应用。在另一示例中,PDPC可应用于编码块中的所有子块。
可选地,可根据通过对编码块或变换块进行分区而生成的子块的尺寸、形状、帧内预测模式或参考画面索引中的至少一个是否满足预设条件来按每个子块确定是否应用PDPC。在示例中,当子块的宽度或高度中的至少一个大于4时,可将PDPC应用于子块。
在另一示例中,可以以比特流用信号发送表示是否应用PDPC的信息。
可选地,可基于当前块的尺寸、形状或帧内预测模式或预测样点的位置中的至少一个来确定应用PDPC的区域。在示例中,当当前块的帧内预测模式具有大于垂直方向的索引时,可以不修改x轴坐标或y轴坐标中的至少一个大于阈值的预测样点,并且可以仅对x轴坐标或y轴坐标等于或小于阈值的预测样点执行修改。可选地,当当前块的帧内预测模式具有小于水平方向的索引时,可以不修改x轴坐标或y轴坐标中的至少一个大于阈值的预测样点,并且可以仅对x轴坐标或y轴坐标等于或小于阈值的预测样点执行修改。在这种情况下,可以基于当前块的尺寸、形状或帧内预测模式中的至少一个来确定阈值。
当通过帧内预测样点获得预测样点时,可以基于所获得的预测样点的位置来确定被用于修改预测样点的参考样点。
可以通过在对当前块执行帧内预测之后将预测样点与当前块的原始样点进行差值运算来获得残差信号。在这种情况下,可以在推导出特定位置处的残差信号与邻近残差信号之间的差之后对推导出的差进行编码,而不是按原样对特定位置处的残差信号进行编码。在此情况下,残差信号可表示残差样点、通过变换残差样点生成的变换系数或通过跳过变换生成的系数。
例如,可以在对属于第一线的残差信号和属于第二线的残差信号进行差值运算之后执行对差值残差值的编码,而不是按原样对属于第二线的残差信号进行编码。在这种情况下,对于第一线和第二线,x轴坐标或y轴坐标中的至少一个可以是不同的。
在示例中,编码器可通过变换残差样点来生成变换系数,并且对生成的变换系数与通过对邻近变换系数进行差值运算而推导出的变换系数之间的差进行编码。解码器可将属于第一线的变换系数设置为第二残差信号的变换系数预测值,并通过将解码的差值运算变换系数与变换系数预测值相加推导出第二变换系数。
如上所述,当在对残差信号进行差值运算之后对残差差值进行编码/解码时,这可被称为帧内BDPCM(基于块的Delta脉冲编码调制)。只有当确定当前块的预测编码模式为帧内预测时,才可以使用帧内BDPCM。
当应用帧内BDPCM时,可以将当前块的预测样点设置为0。换句话说,当应用帧内BDPCM时,可以设置残差样点为重建样点。
可选地,当应用帧内BDPCM时,可以基于帧内预测推导出当前块的预测样点。在这种情况下,可以根据帧内BDPCM方向来确定当前块的帧内预测模式。在示例中,当帧内BDPCM方向为水平时,可以基于水平方向上的帧内预测模式来获得预测样点。当帧内BDPCM方向为垂直时,可以基于垂直方向上的帧内预测模式获得预测样点。
可选地,可以通过使用默认帧内预测模式来导出当前块的预测样点。默认帧内预测模式可以是DC、平面、水平或垂直中的任何一个。可以在编码器和解码器中预定义默认帧内预测模式。可以编码和用信号发送指定默认帧内预测模式中的一个的信息。
可选地,可从多个MPM候选中的一个推导出帧内预测模式。
当将帧内BDPCM应用于当前块时,可强制使用相邻的参考样点线。换句话说,可以通过省略指定参考样点线中的一个的索引信息的信令并通过使用相邻的参考样点线来获得预测样点。
当应用帧内BDPCM方法时,可以在比特流中用信号发送用于确定帧内BDPCM方向的信息。在示例中,可以以比特流用信号发送表示帧内BDPCM方向的标志intra_bdpcm_dir_flag。当语法intra_bdpcm_dir_flag为0时,它表示应用水平方向上的BDPCM,而当语法intra_bdpcm_dir_flag为1时,它表示应用垂直方向上的BDPCM。
可选地,可以基于当前块的尺寸或形状来确定帧内BDPCM方向。在示例中,当当前块具有宽度大于高度的非正方形形状时,可确定应用水平方向上的BDPCM。另一方面,当当前块具有高度大于宽度的非正方形形状时,可确定应用垂直方向上的BDPCM。
可选地,可以通过考虑与当前块相邻的邻近块的帧内预测模式来确定帧内BDPCM方向。在示例中,当当前块的左侧块和上方块的至少一个帧内预测模式在水平方向上或在与其类似的方向上时,可以将水平方向上的BDPCM应用于当前块。在这种情况下,类似于水平方向的方向是指与水平方向上的帧内预测模式的差等于或小于阈值的帧内预测模式。可选地,当当前块的左侧块和上方块的至少一个帧内预测模式在垂直方向上或在与其类似的方向上时,可以将垂直方向上的BDPCM应用于当前块。在这种情况下,类似于垂直方向的方向是指与垂直方向上的帧内预测模式的差等于或小于阈值的帧内预测模式。
当应用水平方向上的BDPCM时,可以对残差信号和邻近残差信号的上方的残差信号之间的差值进行编码。解码器可以通过将上方残差信号与解码的差值相加推导出残差信号。
当应用垂直方向上的BDPCM时,可以对残差信号和邻近残差信号的左侧的残差信号之间的差值进行编码。解码器可以通过将左侧残差信号与解码的差值相加推导出残差信号。
可选地,可以应用非方向BDPCM。在示例中,DC BDPCM是指对预定位置处的残差信号与预定位置处的邻近残差信号的平均值之间的差进行编码/解码。平面BDPCM是指对水平方向上的差值(预定位置处的残差信号与位于该预定位置处的残差信号的水平方向上的残差信号之间的差)和垂直方向上的差值(预定位置处的残差信号与位于该预定位置处的残差信号的垂直方向上的残差信号之间的差)的平均或加权和结果进行编码/解码。
可以以比特流用信号发送用于指定可用BDPCM模式的信息。该信息可以是表示是否应用非方向BDPCM的信息或用于指定可应用于当前块的多个BDPCM候选中的任何一个的信息。
可以以比特流用信号发送表示是否将对当前块应用帧内BDPCM的信息。在示例中,可以以比特流用信号发送标志intra_bdpcm_flag。当语法intra_bdpcm_flag为1时,这表示将帧内BDPCM应用于当前块。当语法intra_bdpcm_flag为0时,这表示不将帧内BDPCM应用于当前块。
在画面级或序列级,可以用信号发送表示帧内BDPCM的可用性的信息。在示例中,可以通过序列参数集(SPS)来用信号发送表示帧内BDPCM的可用性的标志sps_intra_bdpcm_flag。当语法sps_intra_bdpcm_flag为1时,这表示关于序列参数集的画面可以使用帧内BDPCM。当语法sps_intra_bdpcm_flag为0时,这表示关于序列参数集的画面不可以使用帧内BDPCM。可以仅在sps_intra_bdpcm_flag为1时用信号发送表示是否将帧内BDPCM应用于当前块的intra_bdpcm_flag。
当将帧内BDPCM应用于当前块时,可以将PDPC设置为不使用。
当将帧内BDPCM应用于当前块时,可以设置为强制应用变换跳过。换句话说,当将帧内BDPCM应用于当前块时,该值可以被认为是1,尽管不用信号发送表示是否应用变换跳过的transform_skip_flag。
组合预测模式是通过组合两个以上的预测模式来生成预测图像的方法。在示例中,当应用组合预测模式时,可以通过对基于第一预测模式生成的第一预测块和基于第二预测模式生成的第二预测块求平均或者通过使用它们的加权和运算来生成预测块。预测模式可包括帧内预测模式、合并模式、AMVP模式、跳过模式、帧内块复制模式或调色板模式中的至少一个。在示例中,第一预测模式可以是合并模式,并且第二预测模式可以是帧内预测模式。
当使用组合合并模式和帧内预测模式的组合预测模式时,可以通过基于运动信息获得的第一预测块和基于预定帧内预测模式获得的第二预测块的预测的加权来生成当前块的预测块。可从由以比特流用信号发送的索引merge_idx指定的合并候选推导出当前块的运动信息。可以将当前块的帧内预测模式设置为预定义的帧内预测模式。预定义的帧内预测模式可以是平面、DC、水平或垂直模式。可选地,可以将邻近块的帧内预测模式设置为当前块的帧内预测模式。
可以以比特流用信号发送表示组合预测模式是否应用于当前块的标志。在示例中,可以以比特流用信号发送语法ciip_flag。当语法的值ciip_flag为1时,这表示将组合预测模式应用于当前块。当语法的值ciip_flag为0时,这表示不将组合预测模式应用于当前块。当不将组合预测模式应用于当前块时,可以应用合并偏移编码方法或三角形分区方法中的至少一个。
可通过从原始图像减去预测图像来推导残差图像。就此而言,当将残差图像转换到频域时,即使从频率分量去除了高频分量,图像的主观图像质量也不会显著下降。因此,当高频分量的值被变换为小值时,或者当高频分量的值被设置为0时,可在不导致大的视觉失真的情况下提高压缩效率。反映上述特征,可对当前块执行变换,以便将残差图像分解为二维频率分量。可通过使用诸如DCT(离散余弦变换)、DST(离散正弦变换)等的变换方法来执行变换。
DCT是通过使用余弦变换将残差图像分解(或变换)为二维频率分量,而DST是通过使用正弦变换将残差图像合成(或变换)为二维频率分量。作为变换残差图像的结果,频率分量可以表示为基本图像。在示例中,当对N×N尺寸的块执行DCT变换时,可以获得N2个基本模式分量。可以通过变换获得包括在N×N尺寸的块中的每个基本模式分量的尺寸。根据所使用的变换方法,基本模式分量的尺寸可以被称为DCT系数或DST系数。
变换方法DCT主要用于变换分布有大量非零低频分量的图像。变换方法DST主要用于分布有大量高频分量的图像。
还可以通过使用除DCT或DST之外的变换方法来变换残差图像。
在下文中,将残差图像变换为二维频率分量被称为二维图像变换。另外,通过变换获得的基本模式分量的尺寸被称为变换系数。在示例中,变换系数可指DCT系数或DST系数。当应用以下描述的第一变换和第二变换两者时,变换系数可以指根据第二变换的结果生成的基本模式分量。另外,应用变换跳过的残差样点也被称作变换系数。
可以以块为单位确定变换方法。可以基于当前块的预测编码模式、当前块的尺寸或当前块的形状中的至少一个来确定变换方法。在示例中,当当前块通过帧内预测模式编码且当前块的尺寸小于N×N时,可以通过使用DST变换方法执行变换。另一方面,当不满足条件时,可以通过使用DCT变换方法来执行变换。
可以不对残差图像的一些块执行二维图像变换。不执行二维图像变换可被称为变换跳过。变换跳过表示不将第一变换及第二变换应用于当前块。当应用变换跳过时,可以将量化应用于不执行变换的残差值。
可以基于当前块的尺寸或形状中的至少一个来确定是否允许对当前块进行变换跳过。在示例中,仅当当前块的尺寸小于阈值时,可应用变换跳过。阈值与当前块的宽度、高度或样点的数量中的至少一个相关,且可被定义为32×32等。可选地,可仅针对正方形块允许变换跳过。在示例中,对于32×32、16×16、8×8或4×4尺寸的正方形块,可允许变换跳过。可选地,只有当不使用子分区帧内编码方法时,才可以允许变换跳过。
可选地,当将子分区帧内编码方法应用于当前块时,可以确定是否按每个子分区应用变换跳过。
图30是示出按每个子块确定是否执行变换跳过的示例的示图。
可将变换跳过仅应用于多个子块的部分。在示例中,如在图30中所示的示例中,可设置将变换跳过应用于当前块的上方位置处的子块且不将变换跳过应用于下方位置处的子块。
可基于以比特流用信号发送的信息来确定不允许变换跳过的子块的变换类型。在示例中,可以基于将在下文中描述的tu_mts_idx来确定变换类型。
可选地,可基于子块的尺寸确定子块的变换类型。在示例中,可基于子块的宽度是否等于或大于和/或等于或小于阈值来确定水平方向变换类型,并且可基于子块的高度是否等于或大于和/或等于或小于阈值来确定垂直方向变换类型。
可选地,可针对编码块用信号发送用于确定变换类型的信息,且可将由该信息指定的变换类型共同应用于包括在编码块中的子块。换句话说,可以同样地设置编码块中的子块的变换类型。
在通过使用DCT或DST对当前块执行变换之后,可再次对经过变换的当前块执行变换。就此而言,基于DCT或DST的变换可被定义为第一变换,并且再次对应用了第一变换的块执行变换可被定义为第二变换。
可通过使用多个变换核候选中的任意一个来执行第一变换。在示例中,可通过使用DCT2、DCT8或DST7中的任意一个来执行第一变换。
不同变换核可用于水平方向及垂直方向。可以比特流用信号发送表示水平方向上的变换核与垂直方向上的变换核的组合的信息。在示例中,上述tu_mts_idx可指示水平方向上的变换核与垂直方向上的变换核的组合中的一个。
第一变换的处理单元可不同于第二变换。在示例中,可对8×8块执行第一变换,且可对经变换的8×8块内的4×4尺寸的子块执行第二变换。可选地,可针对属于3个4×4尺寸的子块的变换系数执行第二变换。所述3个子块可包括位于当前块的左上方的子块、邻近所述子块的右侧的子块及邻近所述子块的下方的子块。可选地,可对8×8尺寸的块执行第二变换。
还可以将不执行第二变换的剩余区域中的变换系数设置为0。
可选地,可对4×4块执行第一变换,且可对包括经变换的4×4块的具有8×8尺寸的区域执行第二变换。
可以以比特流用信号发送表示当前块的变换类型的信息。该信息可以是索引信息tu_mts_idx,这表示用于水平方向的变换类型和用于垂直方向的变换类型的组合中的一个。
基于由索引信息tu_mts_idx指定的变换类型候选,可确定用于垂直方向的变换核及用于水平方向的变换核。表7表示根据tu_mts_idx的变换类型组合。
【表7】
Figure GDA0003163807220000551
可确定变换类型为DCT2、DST7或DCT8中的一个。可选地,变换跳过可插入变换类型候选中。
当使用表7时,当tu_mts_idx为0时,可以在水平方向上应用DCT2,并且可以在垂直方向上应用DCT2。当tu_mts_idx为2时,可以在水平方向上应用DCT8,并且可以在垂直方向上应用DCT7。
当应用子分区帧内编码方法时,可以独立地确定子块的变换核。在示例中,可按每个子块编码和用信号发送用于指定变换类型组合候选的信息。因此,子块之间的变换核可不同。
可选地,子块可使用相同变换类型。在此情况下,可仅针对第一子块用信号发送指定变换类型组合候选的tu_mts_idx。可选地,可以在编码块级用信号发送tu_mts_idx,并且可以通过参考在编码块级用信号发送的tu_mts_idx来确定子块的变换类型。可选地,可以基于子块中的一个子块的尺寸、形状或帧内预测模式中的至少一个来确定变换类型,并且可以将所确定的变换类型设置为用于所有子块。
图31是示出子块使用相同变换类型的示例的示图。
当在水平方向上将编码块分区时,可将编码块的上方位置处的子块(Sub-CU0)的变换类型设置为与下方位置处的子块(Sub-CU1)的变换类型相同。在示例中,如在图31(a)中所示的示例中,当基于针对上方子块用信号发送的tu_mts_idx确定水平变换类型和垂直变换类型时,也可将所确定的变换类型应用于下方子块。
当在垂直方向上将编码块分区时,可将编码块的左侧位置处的子块(Sub-CU0)的变换类型设置为与右侧位置处的子块(Sub-CU1)的变换类型相同。在示例中,如在图31(b)中所示的示例中,当基于针对左侧子块用信号发送的tu_mts_idx确定水平变换类型和垂直变换类型时,也可将所确定的变换类型应用于右侧子块。
可以基于当前块的尺寸或形状、非零系数的数量、是否执行第二变换或是否应用子分区帧内编码方法中的至少一个来确定是否对索引信息进行编码。在示例中,当将子分区帧内编码方法应用于当前块时,或者当非零系数的数量等于或小于阈值时,可以省略索引信息的信令。当省略索引信息的信令时,可将默认变换类型应用于当前块。
默认变换类型可包括DCT2或DST7中的至少一个。当有多个默认变换类型时,可通过考虑当前块的尺寸、形状或帧内预测模式、是否执行第二变换或是否应用子分区帧内编码方法中的至少一个来选择多个默认变换类型中的一个。在示例中,可以基于当前块的宽度是否在预设范围内将多个变换类型中的一个确定为水平方向变换类型,并且可以基于当前块的高度是否在预设范围内将多个变换类型中的一个确定为垂直方向变换类型。可选地,可根据当前块的尺寸、形状或帧内预测模式或是否执行第二变换来不同地确定默认模式。
可选地,当在当前块中仅存在DC分量的变换系数时,可以将水平方向变换类型和垂直方向变换类型设置为默认变换类型。在示例中,当在当前块中仅存在DC分量的变换系数时,可以将水平方向变换类型和垂直方向变换类型设置为DCT2。
可基于当前块的尺寸或形状确定阈值。在示例中,当当前块的尺寸等于或小于32×32时,可将阈值设置为2,并且当当前块大于32×32时(例如,当当前块为32×64或64×32尺寸的编码块时),可将阈值设置为4。
多个查找表可以预先存储在编码装置/解码装置中。分配给变换类型组合候选的索引值、变换类型组合候选的类型或变换类型组合候选的数量中的至少一个对于多个查找表中的每一个可以是不同的。
基于当前块的尺寸、形状或帧内预测模式、是否应用第二变换或是否将变换跳过应用于邻近块中的至少一个,可选择用于当前块的查找表。
在示例中,当当前块的尺寸等于或小于4×4时,或当通过帧间预测对当前块进行编码时,可使用第一查找表,以及当当前块的尺寸大于4×4时,或当通过帧内预测对当前块进行编码时,可使用第二查找表。
可选地,可以以比特流用信号发送指示多个查找表中的一个的信息。解码装置可基于该信息选择当前块的查找表。
在另一示例中,可基于当前块的尺寸、形状、预测编码模式或帧内预测模式、是否应用第二变换或是否将变换跳过应用于邻近块中的至少一个来自适应地确定分配给变换类型组合候选的索引。在示例中,在当前块的尺寸为4×4时分配给变换跳过的索引可小于在当前块的尺寸大于4×4时分配给变换跳过的索引。具体地,当当前块的尺寸为4×4时,可以将索引0分配给变换跳过,并且当当前块大于4×4且等于或小于16×16时,可以将大于0的索引(例如,索引1)分配给变换跳过。当当前块大于16×16时,可以将最大值(例如,5)分配给变换跳过的索引。
可选地,当通过帧间预测对当前块进行编码时,可以将索引0分配给变换跳过。当通过帧内预测对当前块进行编码时,可以将大于0的索引(例如,索引1)分配给变换跳过。
可选地,当当前块是通过帧间预测编码的4×4尺寸的块时,可以将索引0分配给变换跳过。另一方面,当当前块未通过帧间预测编码时,或当当前块大于4×4时,可将大于0的索引(例如,索引1)分配给变换跳过。
还可使用不同于表7中列举的变换类型组合候选的变换类型组合候选。在示例中,可使用包括应用于水平方向变换或垂直方向变换中的一个的变换跳过及应用于另一个的变换核(例如DCT2、DCT8或DST7等)的变换类型组合候选。在这种情况下,可以基于当前块的尺寸(例如,宽度和/或高度)、形状、预测编码模式或帧内预测模式中的至少一个来确定变换跳过将用作水平方向还是垂直方向的变换类型候选。
可以以比特流用信号发送表示是否显式地用信号发送用于确定当前块的变换类型的索引信息的信息。在示例中,可以在序列级用信号发送表示对于通过帧内预测编码的块是否允许显式变换类型确定的信息sps_explicit_intra_mts_flag和/或表示对于通过帧间预测编码的块是否允许显式变换类型确定的信息sps_explicit_intra_mts_flag。
当允许显式变换类型确定时,可以基于在比特流中用信号发送的索引信息tu_mts_idx来确定当前块的变换类型。另一方面,当不允许显式变换类型确定时,可基于当前块的尺寸或形状、是否允许以子块为单位执行变换、包括非零变换系数的子块的位置、是否执行第二变换或是否应用子分区帧内编码方法中的至少一个来确定变换类型。在示例中,可基于当前块的宽度确定当前块的水平方向变换类型,并且可基于当前块的高度确定当前块的垂直方向变换类型。举例来说,当当前块的宽度小于4或大于16时,可将水平方向变换类型确定为DCT2。否则,可将水平方向变换类型确定为DST7。当当前块的高度小于4或大于16时,可将垂直方向变换类型确定为DCT2。否则,可将垂直方向变换类型确定为DST7。在这种情况下,可基于当前块的尺寸、形状或帧内预测模式中的至少一个来确定要与宽度和高度进行比较的阈值,以确定水平方向变换类型和垂直方向变换类型。
可选地,当当前块具有高度和宽度相同的正方形形状时,可将水平方向变换类型和垂直方向变换类型设置为相同,但是当当前块具有高度和宽度彼此不同的非正方形形状时,可将水平方向变换类型和垂直方向变换类型设置为不同。在示例中,当当前块的宽度大于高度时,可将水平方向变换类型确定为DST7,并且可将垂直方向变换类型确定为DCT2。当当前块的高度大于宽度时,可以将垂直方向变换类型确定为DST7,并且可以将水平方向变换类型确定为DCT2。
根据是否允许显式变换类型确定,变换类型候选的数量和/或类型或变换类型组合候选的数量和/或类型可不同。在示例中,当允许显式变换类型确定时,DCT2、DST7及DCT8可用作变换类型候选。因此,可将水平方向变换类型和垂直方向变换类型中的每一个设置为DCT2、DST8或DCT8。当不允许显式变换类型确定时,仅DCT2及DST7可用作变换类型候选。因此,可将水平方向变换类型及垂直方向变换类型中的每一个确定为DCT2或DST7。
可将编码块或变换块分区成多个子块,且可仅对多个子块的部分执行变换。将变换仅应用于多个子块的部分可以被定义为子变换块编码方法。
图32和图33是示出子变换块编码方法的应用方面的示图。
图32是示出仅对4个子块中的一个子块执行变换的示例的示图,图33是示出仅对2个子块中的任何一个子块执行变换的示例的示图。在图32和图33中,假设仅对标记了“目标”的子块执行变换。
如在图32所示的示例中,在通过使用相互正交的垂直线和水平线将编码块分区为4个子块之后,可以仅对子块中的一个执行变换和量化。可以将不执行变换的子块中的变换系数设置为0。
可选地,如在图33所示的示例中,在通过使用垂直线或水平线将编码块划分为2个子块之后,可以仅对子块中的一个执行变换和量化。可以将不执行变换的子块中的变换系数设置为0。
可以以比特流用信号发送表示是否将子变换块编码方法应用于编码块的信息。该信息可以是1比特标志cu_sbt_flag。当标志为1时,它表示仅对通过分区编码块或变换块而生成的多个子块的部分执行变换,并且当标志为0时,它表示在不将编码块或变换块分区成子块的情况下执行变换。
可基于编码块的尺寸、形状或预测编码模式、或者组合预测模式是否用于编码块中的至少一个来确定子变换块编码方法是否可用于编码块。在示例中,当满足编码块的宽度或高度中的至少一个等于或大于阈值的情况、对编码块应用帧间预测的情况或不对编码块应用组合预测模式的情况中的至少一个时,子变换块编码方法可用于编码块。在这种情况下,阈值可以是诸如4、8或16等的自然数。
可选地,当编码块的宽度和高度之间的比率大于阈值时,可能不允许应用子变换块编码方法。
当将帧内预测应用于编码块时或者当应用帧内块复制模式时,可以确定子变换块编码方法不可用。
可选地,可以基于是否将子分区帧内编码方法应用于编码块来确定子变换块编码方法是否可用于编码块。在示例中,当应用子分区帧内编码方法时,可以确定子变换块编码方法可用。
当确定子变换块编码方法可用于编码块时,可以以比特流用信号发送语法cu_sbt_flag。根据解析的cu_sbt_flag的值,可以确定是否应用子变换块编码方法。
另一方面,当确定子变换块编码方法不可用于编码块时,可以省略语法cu_sbt_flag的信令。当省略语法cu_sbt_flag的信令时,可以确定不将子变换块编码方法应用于编码块。
当将子变换编码方法应用于编码块时,可以以比特流用信号发送表示编码块的分区形状的信息。表示编码块的分区形状的信息可包括表示编码块是否被分区为包括1/4尺寸的子块的信息、表示编码块的分区方向的信息或表示子块的数量的信息中的至少一个。
在示例中,当语法cu_sbt_flag为1时,可用信号发送表示编码块是否被分区为包括1/4尺寸的子块的标志cu_sbt_quadtree_flag。
当语法cu_sbt_quadtree_flag为1时,这表示编码块被分区为包括1/4尺寸的子块。在示例中,编码块可被分区为1/4尺寸的子块及3/4尺寸的子块,或可被分区为每一个具有1/4尺寸的四个子块。当编码块被分区以包括1/4尺寸的子块时,这可被称作四叉树分区。当语法cu_sbt_quad_tree_flag为1时,可以将编码块的1/4尺寸的子块设置为变换目标。
当语法cu_sbt_quadtree_flag为0时,它表示编码块被分区为包括1/2尺寸的子块。在示例中,可通过使用1条垂直线或1条水平线将编码块分区为2个1/2尺寸的子块。将编码块分割成2个1/2尺寸的子块可被称作二叉树分区。当语法cu_sbt_quad_tree_flag的值为0时,编码块的1/2尺寸的子块可以被包括在编码块中。
另外,可以以比特流用信号发送表示编码块的分区方向的标志。在示例中,可以编码和用信号发送表示是否将水平方向分区应用于编码块的标志cu_sbt_horizontal_flag。当cu_sbt_horizontal_flag的值为1时,表示应用了使用与编码块的上方和下方平行的至少一条分区线的水平方向分区。当cu_sbt_horizontal_flag的值为0时,表示应用使用与编码块的左侧和右侧平行的至少一条分区线的垂直方向分割。
根据编码块的尺寸或形状,可确定编码块的分区形状。在示例中,当编码块的宽度或高度中的至少一个等于或大于第一阈值时,四叉树分区可以是可用的。在示例中,第一阈值可以是诸如4、8或16的自然数。第一阈值可被称为四叉树阈值。
当确定四叉树分区可用时,可以以比特流用信号发送语法cu_sbt_quadtree_flag。根据解析的cu_sbt_quadtree_flag的值,可以确定是否将四叉树分区应用于编码块。
当确定四叉树分区不可用时,可省略语法cu_sbt_quadtree_flag的信令。当省略语法cu_sbt_quadtree_flag的信令时,可确定将二叉树分区应用于编码块。
表8示出用于确定是否解析语法cu_sbt_quadtree_flag的语法结构。
【表8】
Figure GDA0003163807220000611
Figure GDA0003163807220000621
在表8中,变量allowSbtVerQ表示是否允许垂直方向上的四叉树分区,并且变量allowSbtHorQ表示是否允许水平方向上的四叉树分区。可以基于四叉树阈值来确定变量allowSbtVerQ和allowSbtHorQ。在示例中,当四叉树阈值为16时,可基于编码块的宽度是否等于或大于16来确定allowSbtVerQ,并且可基于编码块的高度是否等于或大于16来确定allowSbtHorQ。
如在表8所示的示例中,当所有变量allowSbtVerQ和allowSbtHorQ为真时,可以从比特流中解析语法cu_sbt_quad_flag。在示例中,当编码块是16×8时,变量allowSbtHorQ被设置为假,因此可以省略对语法cu_sbt_quad_flag的解析。可选地,当编码块是8×16时,变量allowSbtVerQ被设置为假,因此可以省略对语法cu_sbt_quad_flag的解析。当省略对语法cu_sbt_quad_flag的解析时,可以将二叉树分区应用于编码块。
可选地,与表8中所示的示例不同,当变量allowSbtVerQ或变量allowSbtHorQ中的任何一个为真时,可以解析语法cu_sbt_quad_flag。换句话说,当编码块的宽度和高度中的仅任一个等于或大于四叉树阈值时,四叉树分区可以是可用的。
可选地,尽管编码块的宽度或高度中的任一个等于或大于第一阈值,但是当编码块的宽度或高度中的另一个等于或小于第二阈值时,可以确定编码块的四叉树分区不可用。在这种情况下,第二阈值可以具有小于第一阈值的值。在示例中,第二阈值可以是诸如2、4或8的自然数。
变量allowSbtHorH表示水平方向上的二叉树分区是否可用。当编码块的高度等于或大于阈值时,可以将水平方向上的二叉树分区设置为可用。变量allowSbtVerH表示垂直方向上的二叉树分区是否可用。当编码块的宽度等于或大于阈值时,可以将垂直方向上的二叉树分区设置为可用。在这种情况下,阈值可以是诸如4、8或16的自然数。
当水平方向上的四叉树/二叉树分区和垂直方向上的四叉树/二叉树分区两者都可用时,可以以比特流用信号发送语法cu_sbt_horizontal_flag。根据语法cu_sbt_horizontal_flag的值,可将水平方向上的分区或垂直方向上的分区应用于编码块。
另一方面,当水平方向上的四叉树/二叉树分区和垂直方向上的四叉树/二叉树分区中的仅一个可用时,可省略语法cu_sbt_horizontal_flag的信令。当省略语法cu_sbt_horizontal_flag的信令时,可应用水平方向上的四叉树/二叉树分区和垂直方向上的四叉树/二叉树分区中的可用一个。
当水平方向上的二叉树分区或垂直方向上的二叉树分区不可用时,可省略语法cu_sbt_horizontal_flag的信令。
当省略语法cu_sbt_horizontal_flag的信令并且变量allowSbtHorH为真时,可以将水平方向上的二叉树分区应用于编码块。
当省略语法cu_sbt_horizontal_flag的信令并且变量allowSbtVerH为真时,可以将垂直方向上的二叉树分区应用于编码块。
可以以比特流用信号发送用于指定多个子块当中的作为变换目标的子块的信息。在示例中,可以以比特流用信号发送语法cu_sbt_pos_flag。语法cu_sbt_pos_flag表示变换目标是否是编码块中的第一子块。在示例中,当将水平方向上的四叉树/二叉树分区应用于编码块时,当cu_sbt_flag为1时,将最左侧子块确定为变换目标,并且当cu_sbt_flag为0时,将最右侧子块确定为变换目标。当将垂直方向上的四叉树/二叉树分区应用于编码块时,当cu_sbt_pos_flag为1时,将最上方子块确定为变换目标,并且当cu_sbt_pos_flag为0时,将最下方子块确定为变换目标。
可通过考虑编码块的分区方向和子块的位置来确定子块的变换类型。在示例中,当在垂直方向上分区编码块且对子块当中位于左侧位置的子块执行变换时,可将水平方向变换类型和垂直方向变换类型设置为不同。
图34和图35示出了根据作为变换目标的子块的位置的水平方向变换类型和垂直方向变换类型。
在图34所示的示例中,当作为变换的目标的子块包括编码块的左上方样点或右下方样点时,可将水平方向变换类型和垂直方向变换类型设置为相同。在示例(图34所示的示例)中,示出了当作为变换的目标的子块包括编码块的左上方样点时,将水平方向变换类型和垂直方向变换类型设置为DCT8,并且当作为变换的目标的子块包括编码块的右下方样点时,将水平方向变换类型和垂直方向变换类型设置为DST7。
当作为变换目标的子块包括编码块的右上方样点或左下方样点时,可将水平方向变换类型和垂直方向变换类型设置为不同。在示例中,图34所示的示例示出了当作为变换目标的子块包括编码块的右上方样点时,将水平方向变换类型设置为DST7,并且将垂直方向变换类型设置为DCT8。当作为变换目标的子块包括编码块的左下样点时,将水平方向变换类型设置为DCT8,并且将垂直方向变换类型设置为DST7。
与图34所示的示例不同,当编码块中包括左上方样点的子块或包括右下方样点的子块被确定为变换目标时,可将水平方向变换类型和垂直方向变换类型设置为不同,并且当编码块中包括右上方样点的子块或包括左下样点的子块被确定为变换目标时,可将水平方向变换类型和垂直方向变换类型设置为相同。
图34示出将高度和宽度分别是编码块的1/2的子块设置为变换目标。与所示示例不同,可将宽度与编码块相同但高度为编码块的1/4的子块或高度与编码块相同但宽度为编码块的1/4的子块设置为变换目标。
在图35所示的示例中,当作为变换目标的子块包括编码块的左上方样点时,可将水平方向变换类型和垂直方向变换类型设置为不同。在示例中,在图35中所示的示例中,当应用水平方向上的二叉树分区且上方子块被确定为变换目标时,可将水平方向变换类型设置为DST7,并且可将垂直方向变换类型设置为DCT7。当应用垂直方向上的二叉树分区且左侧子块被确定为变换目标时,可将水平方向变换类型设置为DCT8,并且可将垂直方向变换类型设置为DST7。
与图35所示的示例不同,当作为变换目标的子块包括编码块的左上方样点时,可将水平方向变换类型和垂直方向变换类型设置为相同,并且当作为变换目标的子块包括编码块的右下方样点时,可将水平方向变换类型和垂直方向变换类型设置为不同。
当作为变换目标的子块包括编码块的右下方样点时,可将水平方向变换类型和垂直方向变换类型设置为相同。在示例中,在图35中所展示的示例中,当应用水平方向上的二叉树分区且下方子块被确定为变换目标时,可将水平方向变换类型和垂直方向变换类型设置为DST7。当应用垂直方向上的二叉树分区且将右侧子块确定为变换目标时,可将水平方向变换类型和垂直方向变换类型设置为DST7。
如在上述示例中,可根据作为编码块中的变换目标的子块的位置来确定是否将水平方向变换类型和垂直方向变换类型设置为相同。另外,可根据作为编码块中的变换目标的子块的位置来确定水平方向变换类型和垂直方向变换类型。
对于子块,可以省略对表示是否存在非零系数(例如,CBF)的信息的编码。当省略对CBF的编码时,可以基于执行变换的块的位置来确定每个子块中是否包括非零残差系数。在示例中,当应用二叉树分区的编码块中的右侧或下方位置处的子块被确定为变换目标时,可以推断左侧或上方位置处的子块的CBF值为0,并且可以推断右侧或下方位置处的子块的CBF值为1。可选地,当应用二叉树分区的编码块中的左侧或下方位置处的子块被确定为变换目标时,可以推断左侧或上方位置处的子块的CBF值为1,并且可以推断右侧或下方位置处的子块的CBF值为0。
可针对执行第一变换的块执行第二变换。可对已应用第一变换的变换块中的左上区执行第二变换。
如果对已经执行了第一变换和第二变换的残差系数进行编码,则解码装置可以对变换块执行作为第二变换的逆过程的第二逆变换,并且对已经执行了第二逆变换的变换块执行作为第一变换的逆过程的第一逆变换。
可以基于当前块的尺寸、残差系数的数量、编码模式或帧内预测模式或者是否应用子分区帧内编码方法中的至少一个来确定是否将第二变换应用于当前块。编码器可对表示是否应用第二变换的信息进行编码并且将所述信息用信号发送到解码器。可选地,编码器和解码器可基于相同条件确定是否执行第二变换。
在示例中,可以以比特流用信号发送表示是否执行第二变换的信息。具体地说,可用信号发送表示是否执行第二变换的标志或指定是否执行第二变换的索引信息和用于第二变换的变换核。
表9表示以比特流用信号发送表示是否执行第二变换的标志lfnst_flag的示例。当标志lfnst_flag的值为0时,这表示不对当前块执行第二变换。另一方面,当标志lfnst_flag的值为1时,这表示对当前块执行第二变换。
【表9】
Figure GDA0003163807220000661
可选地,可以以比特流用信号发送语法lfnst_idx。当索引的值lfnst_idx为0时,表示不对当前块执行第二变换。另一方面,当索引lfnst_idx大于0时,表示对当前块执行第二变换。当索引的值lfnst_idx大于0时,lfnst_idx可被用于指定用于执行第二变换的变换核。
可选地,可通过将当前块的宽度或高度中的至少一个与阈值进行比较来确定是否执行第二变换。在示例中,当当前块的宽度和高度的最小值小于阈值时,可不执行第二变换。在这种情况下,阈值可以是诸如4、8或16的自然数。
可选地,当通过帧间预测编码当前块时,可不应用第二变换。
可选地,尽管通过帧内预测对当前块进行编码,但是当执行基于矩阵的帧内预测时,可不应用第二变换。
可选地,可基于水平方向上的变换核是否与垂直方向上的变换核相同来确定是否执行第二变换。在示例中,可仅当水平方向上的变换核与垂直方向上的变换核相同时执行第二变换。可选地,可仅当水平方向上的变换核不同于垂直方向上的变换核时执行第二变换。
可选地,可仅当预定义变换核被用于水平方向变换和垂直方向变换时允许第二变换。在示例中,当DCT2变换核被用于水平方向上的变换和垂直方向上的变换时,可允许第二变换。
可选地,当将子分区帧内编码方法应用于当前块时,可仅当DCT2变换核被用于水平方向上的变换和垂直方向上的变换时允许第二变换。
可选地,可基于当前块的非零变换系数的数量确定是否执行第二变换。在示例中,当当前块的非零变换系数的数量小于阈值或与阈值相同时,可设置为不使用第二变换,且当当前块的非零变换系数的数量大于阈值时,可设置为使用第二变换。只有当通过帧内预测对当前块进行编码时,才可以允许使用第二变换。
可选地,可基于当前块的最后非零变换系数的位置确定是否执行第二变换。在示例中,当当前块的最后非零变换系数的x轴坐标或y轴坐标中的至少一个大于阈值时,或当当前块的最后非零变换系数所属的子块的x轴坐标或y轴坐标中的至少一个大于阈值时,可不执行第二变换。在这种情况下,可以在编码器和解码器中预定义阈值。可选地,可基于当前块的尺寸或形状确定阈值。
可选地,当在当前块中仅存在DC分量的变换系数时,可设置为不执行第二变换。在这种情况下,DC分量表示当前块中左上方位置处的变换系数。
可基于组合预测编码模式是否被应用于当前块来确定是否执行第二变换。在示例中,当组合预测编码模式被应用于当前块时,可以设置为不执行第二变换。
可选地,当应用组合预测编码模式时,可以基于当前块的尺寸或形状、帧内预测模式或权重中的至少一个来确定是否执行第二变换。
可选地,当应用组合预测编码模式时,可以设置为用信号发送表示是否对当前块执行第二变换的信息。例如,当将组合预测编码模式应用于当前块时,可以用信号发送索引lfnst_idx。
可选地,可确定是否执行第二变换,而不管是否应用组合预测编码模式。
可选地,可以基于是否将子分区帧内编码方法应用于当前块来确定是否允许第二变换。在示例中,当将子分区帧内编码方法应用于当前块时,可以设置为不将第二变换应用于当前块。
可选地,当将子分区帧内编码方法应用于当前块时,可以设置为应用第二变换。举例来说,当将垂直方向分区或水平方向分区应用于当前块时,可用信号发送表示是否将第二变换应用于当前块的索引信息。可通过索引信息确定是否应用第二变换和/或用于第二变换的变换核。另一方面,当不将子分区帧内编码方法应用于当前块时,可以省略索引信息的编码。可选地,当不将子分区帧内编码方法应用于当前块时,可基于是否满足预设条件来确定是否对表示是否应用第二变换的索引信息进行编码。在这种情况下,预设条件可以与非零系数的位置、非零系数的数量或当前块的尺寸中的至少一个有关。在示例中,当非零系数的数量等于或大于1时,当非零系数的数量是1但不包括在当前块的4×4左上方区域中时,或当非零系数的扫描顺序(非零系数不包括在当前块的4×4区域中)等于或小于阈值时,可对索引信息编码并用信号发送索引信息。否则,可以省略对索引信息的编码。
当不用信号发送索引信息时,可推断索引信息的值指示不应用第二变换。
可选地,可基于子块的尺寸、宽度、高度或形状中的至少一个来确定是否应用第二变换。在示例中,当子块的尺寸、宽度或高度中的至少一个小于阈值时,可设置为不应用第二变换。具体地,当子块的尺寸、宽度或高度中的至少一个小于阈值时,可以省略对索引信息的编码。可在编码块级用信号发送表示是否执行第二变换的信息。可基于在编码块级用信号发送的信息来确定是否将第二变换应用于属于编码块的子块。
阈值可以在编码器和解码器中具有预定义值。在示例中,可将阈值设置为2、4或8等。可选地,可基于当前块的分区方向或包括在当前块中的子块的数量中的至少一个来确定阈值。
可选地,可以通过使用与用于确定是否应用第二变换的当前块相关的参数(列举于上面)来确定是否对表示是否应用第二变换的语法进行编码。
在示例中,当当前块的尺寸、残差系数的数量、编码模式或帧内预测模式或者是否应用子分区帧内编码方法中的至少一个不满足预设条件时,可以省略对表示是否应用第二变换的语法的编码。在示例中,可以省略对lfnst_flag或lfnst_idx的编码,并且其值可被推断为0。换句话说,当省略语法的编码时,可以不应用第二变换。
当将帧内BDPCM应用于当前块时,可以不执行第二变换。当将帧内BDPCM应用于当前块时,可以省略表示是否执行第二变换的语法元素的信令,并且可以将其值推导为0。表10表示对于应用了帧内BDPCM的块省略lfnst_idx的信令的示例。
【表10】
Figure GDA0003163807220000691
可选地,当将帧内BDPCM应用于当前块时,可以省略表示是否执行变换跳过的语法元素(例如,transform_skip_flag)的信令。当将帧内BDPCM应用于当前块时,可以省略标志transform_skip_flag的信令,并且可以将其值推断为1。换句话说,当应用帧内BDPCM时,可以不对当前块应用变换。
当确定不将变换应用于当前块时,可不应用第一变换及第二变换两者。因此,当跳过当前块的变换时,可省略表示是否执行第二变换的语法元素的信令,并且可以将其值推断为0。最后,当将帧内BDPCM应用于当前块时,可以省略表示是否执行第二变换的语法元素lfnst_idx的信令。
基于上述描述,将详细描述在编码器和解码器中执行第二变换的方法。
可针对当前块中的左上方区域执行第二变换。应用第二变换的目标区域可以具有预定义的尺寸或预定义的形状。应用第二变换的目标区域可以具有诸如4×4或8×8的正方形块形状或诸如4×8或8×4的非正方形块形状。
可选地,当当前块被均匀分区为N个区域时,可以将N个区域中的至少一个区域设置为目标区域。在这种情况下,N可以是诸如2、4、8或16的自然数。可以在编码器和解码器中预定义变量N。可选地,可以基于当前块的尺寸和/或形状来确定变量N。
可选地,可基于变换系数的数量确定目标区域。在示例中,可以根据预定扫描顺序将预定数量的变换系数确定为目标区域。
可选地,可以对用于指定目标区域的尺寸和/或形状的信息进行编码并以比特流发送该信息。该信息可以包括表示目标区域的尺寸的信息或表示目标区域包括的4×4块的数量的信息中的至少一个。
可选地,可以将整个当前块设置为目标区域。在示例中,当当前块的尺寸与目标区域的最小尺寸(例如,4×4)相同时,可将整个当前块设置为第二变换的目标。
可以以不可分的形状应用第二变换。因此,第二变换也可被称作不可分二次变换(NSST)。
应用第二变换的区域中的变换系数可以被排列在单列中。在示例中,当针对N×N尺寸的目标区执行第二变换时,可将包括在目标区中的变换系数转换为N2×1尺寸的输入矩阵。当4×4尺寸的块被设置为目标区域时,可以将包括在目标区域中的变换系数转换为16×1尺寸的输入矩阵。当8×8尺寸的块被设置为目标区域时,可以将包括在目标区域中的变换系数转换为64×1尺寸的输入矩阵。
不可分变换矩阵可应用于通过将包括在目标区域中的变换系数排列成行而生成的输入矩阵。可根据输入矩阵的尺寸而不同地确定不可分变换矩阵的尺寸。
在示例中,当输入矩阵的尺寸为N2×1时,可基于N2×N2尺寸的不可分变换矩阵执行第二变换。举例来说,当输入矩阵的尺寸为16×1时,可使用16×16尺寸的不可分变换矩阵,且当输入矩阵的尺寸为64×1时,可使用64×64尺寸的不可分变换矩阵。
可将多个不可分变换矩阵存储于编码器及解码器中。可以以比特流用信号发送用于指定多个不可分变换矩阵中的任一个的信息。
可选地,可基于在第一变换中使用的当前块的尺寸、形状、量化参数、帧内预测模式或变换类型中的至少一个来指定不可分变换矩阵。
可选地,可基于在第一变换中使用的当前块的尺寸、形状、量化参数、帧内预测模式或变换类型中的至少一个来指定可由当前块使用的不可分变换矩阵候选。当存在可由当前块使用的多个不可分变换矩阵候选时,可对指示多个不可分变换矩阵候选中的一个的信息进行编码并用信号发送该信息。
可通过将不可分变换矩阵与输入矩阵相乘来获得变换矩阵。在示例中,等式6示出了获得变换矩阵A'的示例。
【等式6】
A′=T*A
在等式6中,T表示不可分变换矩阵,并且A表示输入矩阵。当矩阵T的尺寸是N2×N2并且矩阵A的尺寸是N2×1时,可以获得N2×1尺寸的变换矩阵A'。在示例中,当使用16×1尺寸的输入矩阵及16×16尺寸的不可分变换矩阵时,可获得16×1尺寸的变换矩阵A'。可选地,当使用64×1尺寸的输入矩阵和64×64尺寸的不可分变换矩阵时,可获得64×1尺寸的变换矩阵A'。
当获得变换矩阵A'时,可以将变换矩阵A'中的分量设置为当前块中的N×N尺寸的块的变换系数。可以将排除N×N尺寸的块的剩余区域中的变换系数设置为默认值。在示例中,可将不执行第二变换的区域中的变换系数设置为0。
可通过使用行的数量小于列的数量的不可分变换矩阵来执行第二变换。在示例中,可将(k×N2)尺寸的不可分变换矩阵应用于(N2×1)尺寸的输入矩阵。在这种情况下,k可以具有小于N2的值。在示例中,k可以是N2/2、N2/4或3N2/4等。k可以被称为简化因子。
因此,可以获得小于输入矩阵的(k×1)尺寸的变换矩阵。这样,输出尺寸小于输入矩阵的变换矩阵的第二变换可以被称为简化二次变换。
等式7表示应用简化二次变换的示例。
【等式7】
AR=R*A
在等式7中,R表示k×N2尺寸的不可分变换矩阵。k(行的数量)小于N2(列的数量)的不可分变换矩阵可被称作简化的不可分变换矩阵。AR表示k×1尺寸的变换矩阵。具有尺寸小于输入矩阵A的变换矩阵AR可以被称为简化变换矩阵。
当获得简化变换矩阵AR时,可以将简化变换矩阵AR中的分量设置为当前块中的至少一个或更多个M×M尺寸的块的变换系数。在这种情况下,M可以是小于N的自然数。可以根据简化因子k来确定M×M尺寸的块的数量。可以将排除至少一个M×M尺寸的块的剩余区域的变换系数设置为默认值。在示例中,可以将剩余区域中的变换系数设置为0。
图36是示出当简化因子为16时的变换系数的编码方面的示图。
可将包括在8×8尺寸的目标区域中的变换系数变换成64×1尺寸的输入矩阵,且可通过使用16×64尺寸的不可分变换矩阵来获得16×1尺寸的变换矩阵。
可以将16×1尺寸的变换矩阵设置为4×4块的变换系数,并且可以将其他区域中的变换系数设置为0。
未示出,但是当简化因子k为32时,可以将32×1尺寸的变换矩阵设置为8×4块或4×8块的变换系数,并且可以将其他区域中的变换系数设置为0。
当简化因子k为48时,可将48×1尺寸的变换矩阵设置为三个4×4块的变换系数,并且可将其它区域中的变换系数设置为0。具体地,变换矩阵可以被设置为当前块的左上方位置处的4×4块、与左上方块的右侧相邻的4×4块和与左上方块的下方相邻的4×4块的变换系数。
可以基于当前块的尺寸或形状或帧内预测模式中的至少一个来确定变换矩阵。在示例中,基于当前块的帧内预测模式,可以确定变换矩阵集,并且可以选择包括在变换矩阵集中的多个变换矩阵候选中的一个。可以对指定多个变换矩阵候选中应用于当前块的变换矩阵的索引信息进行编码并用信号发送该索引信息。
当将排除由第二变换生成的变换系数的剩余变换系数设置为0时,解码器可基于最后非零残差系数的位置确定是否执行第二变换。在示例中,当最后残差系数位于存储由第二变换生成的变换系数的块外部时,可确定不执行第二变换。换句话说,解码器可仅在最后残差系数位于存储由第二变换生成的变换系数的块中时执行针对第二变换的逆变换。
可基于当前块的尺寸或形状中的至少一个来确定是否执行简化的第二变换。在示例中,当当前块的宽度或高度中的至少一个大于阈值时,可应用简化的第二变换,否则,可应用一般的第二变换。在这种情况下,阈值可以是诸如4、8或16的自然数。
可选地,可根据目标区域的尺寸来确定是否执行简化的第二变换。在示例中,当针对4×4尺寸的目标区执行第二变换时,可应用一般的第二变换。在示例中,对于4×4尺寸的目标区域,可通过使用16×16尺寸的不可分变换矩阵来执行第二变换。
另一方面,当对8×8尺寸的目标区域执行第二变换时,可应用简化的第二变换。在示例中,对于8×8尺寸的目标区域,可通过使用48×64、32×64或16×64尺寸的不可分变换矩阵来执行第二变换。
当执行针对简化的第二变换的逆变换时,输出矩阵的尺寸具有大于输入矩阵的尺寸的值。在示例中,当简化因子k是16时,可以通过对16×1尺寸的输入矩阵执行逆变换来获得64×1尺寸的输出矩阵。
当将子分区帧内编码方法应用于编码块时,编码块可被分区为多个子块。当将子分区帧内编码方法应用于编码块时,可以设置为不应用第二变换。
可选地,可基于子分区的形状或尺寸来确定是否执行第二变换。在示例中,当编码块被分区成宽度或高度为4的子分区时,可应用第二变换。换句话说,仅当子分区具有4×L或L×4形状时,可应用第二变换。在这种情况下,L表示等于或大于4的整数。
可选地,仅当子分区的宽度及高度的最小值等于或大于预定义阈值时,可应用第二变换。在这种情况下,阈值可以是诸如4、8或16的整数。
如在以上示例中,当子分区的形状或尺寸满足预定义条件时,可以以比特流用信号发送表示是否应用第二变换的信息。在示例中,当子分区为4×L或L×4时,或当子分区的宽度及高度的最小值等于或大于阈值时,可用信号发送指示是否执行第二变换的语法lfnst_idx。
另一方面,当子分区的形状或尺寸不满足预定义条件时,可以省略表示对是否应用第二变换的信息的编码/解码。在示例中,当子分区的宽度和高度的最小值小于阈值时,可以省略对语法lfnst_idx的编码/解码。当省略对语法lfnst_idx的编码/解码时,可以将其值推导为0。
当确定应用第二变换时,可将第二变换应用于编码块中预定义位置处的子块或分区索引小于阈值的子块。在这种情况下,可将左侧子块的分区索引设置为具有小于右侧子块的分区索引的值,或者可将上方子块的分区索引设置为具有小于下方子块的分区索引的值。在示例中,第二变换可仅应用于编码块中的第一子块。
可选地,可将第二变换应用于所有子块中的每一个。
可选地,当确定在编码块级执行第二变换时,可基于每一子块的属性自适应地确定是否将第二变换应用于每一子块。在这种情况下,子块的属性可以包括子块所包括的残差系数的数量、是否将变换跳过应用于子块或是否将变换核应用于子块中的至少一个。
可以基于子块的尺寸来确定用于第二变换的目标区域的尺寸。在示例中,可将包括16个样点的4×4尺寸的块、包括32个样点的两个4×4尺寸的块、包括48个样点的三个4×4尺寸的块或包括64个样点的四个4×4尺寸的块设置为用于第二变换的目标区域。根据目标区域的尺寸,可以应用一般的第二变换,或者可以应用简化的第二变换。
可以基于子块的尺寸来确定用于第二变换的目标区域的尺寸。在示例中,当子块的宽度或高度中的至少一个小于阈值时,可将包括N个样点的区域设置为用于第二变换的目标区域。另一方面,当子块的宽度和高度等于或大于阈值时,可将包括M个样点的区域设置为用于第二变换的目标区域。在这种情况下,M可以是大于N的自然数。在示例中,N可以是16或32,并且M可以是48或64。另外,阈值可以是自然数,诸如2、4、8或16等。
可以将用于第二变换的目标区域设置为不扩展到子块的边界之外。换句话说,当用于第二变换的目标区域跨过两个或更多个子块时,可以设置为不执行第二变换。
图37和图38是示出用于第二变换的目标区域的示图。
当将水平方向上的分区应用于16×16尺寸的编码块时,可以将编码块分区成16×4尺寸的子块。如在所示示例中,当子块具有N×4尺寸(N是大于4的整数)时,可将用于第二变换的目标区域的高度设置为不超过4。
换句话说,如在图37(a)中所示的示例中,可将用于第二变换的目标区域设置为4×4或8×4尺寸的区域。
另一方面,如在图37(b)中所示的示例中,可不允许设置用于第二变换的诸如4×8或8×8的目标区域。
当将垂直方向上的分区应用于16×16尺寸的编码块时,可将编码块分区成4×16尺寸的子块。如在所示示例中,当子块具有4×N尺寸(N是大于4的整数)时,可将用于第二变换的目标区域的宽度设置为不超过4。
换句话说,如在图38(a)中所示的示例中,可将用于第二变换的目标区域设置为4×4或4×8尺寸的区域。
另一方面,如在图38(b)中所示的示例中,可不允许设置用于第二变换的诸如8×4或8×8的目标区域。
解码器可对比特流中的残差系数进行解码并且通过对残差系数执行反量化推导出变换系数。当通过第一变换和第二变换生成变换系数时,可通过对变换系数执行第二逆变换和第一逆变换推导出残差样点。
当确定对当前块执行第二变换时,可确定作为第二逆变换的目标的目标区域。当应用一般第二变换时,可以将用于第二逆变换的目标区域的尺寸设置为与用于第二变换的目标区域的尺寸相同。在示例中,当通过使用16×16尺寸的不可分变换矩阵对4×4尺寸的区域执行第二变换时,可将第二逆变换应用于4×4尺寸的区域。
另一方面,当应用简化的第二变换时,用于第二逆变换的目标区域的尺寸可以具有小于用于第二变换的目标区域的尺寸的值。在示例中,当通过使用64×48尺寸的简化变换矩阵对8×8尺寸的区执行第二变换时,可对包括48个样点(例如,三个4×4尺寸的块)的区执行第二逆变换。
在解码器中,可以基于当前块的尺寸来确定用于第二逆变换的目标区域。在这种情况下,当前块可以表示作为执行第二逆变换的目标的编码块或变换块。在示例中,当当前块的宽度或高度中的至少一个小于阈值时,可配置目标区域以包括16个样点。另一方面,当当前块的宽度和高度等于或大于阈值时,可配置目标区域以包括48个样点。
可以通过将包括在目标区域中的变换系数排列成行来生成输入矩阵。在这种情况下,当将简化的第二变换应用于当前块时,可以基于与简化因子k一样多的变换系数生成输入矩阵。在示例中,当简化因子k为16时,可基于包括在4×4尺寸的左上方块中的变换系数生成输入矩阵。当简化因子k为32时,可基于包括在左上方块和与左上方块的右侧或下方相邻的4×4尺寸的邻近块中的变换系数生成输入矩阵。当简化因子k为48时,可基于左上方块、与左上方块的右侧相邻的4×4尺寸的邻近块和与左上方块的下方相邻的4×4尺寸的邻近块的变换系数生成输入矩阵。
可以在编码器和解码器中预定义简化因子k。可选地,可以以比特流用信号发送用于确定简化因子k的信息。可选地,可基于当前块的尺寸或形状来确定简化因子k。
可通过将输入矩阵与不可分逆变换矩阵相乘来获得变换矩阵。不可分逆变换矩阵可以是等式6至等式7中所示的不可分变换矩阵的对称矩阵。等式8和等式9示出了通过使用不可分逆变换矩阵获得变换矩阵的示例。
【等式8】
A′=TT*A
当将一般第二变换应用于当前块时,可通过将输入矩阵A乘以不可分逆变换矩阵TT推导出变换矩阵。在示例中,可以通过将16×16尺寸的逆变换矩阵TT与16×1尺寸的输入矩阵A相乘推导出16×1尺寸的变换矩阵。
当获得变换矩阵A'时,可以将变换矩阵A'中的分量设置为当前块中的N×N尺寸的块的变换系数。在示例中,可以将16×1尺寸的变换矩阵设置为4×4块的变换系数。
【等式9】
A′=RT*A
当将简化的第二变换应用于当前块时,可通过将输入矩阵A乘以简化的不可分逆变换矩阵RT推导出变换矩阵A'。在示例中,可通过将64×16尺寸的简化的不可分逆变换矩阵RT与16×1尺寸的输入矩阵A相乘推导出64×1尺寸的变换矩阵。
可选地,可通过将64×32尺寸的简化的不可分逆变换矩阵RT与32×1尺寸的输入矩阵A相乘推导出64×1尺寸的变换矩阵。
可选地,可通过将64×48尺寸的简化的不可分逆变换矩阵RT与48×1尺寸的输入矩阵A相乘推导出48×1尺寸的变换矩阵。
当获得变换矩阵A'时,可以将变换矩阵A'中的分量设置为当前块中的N×N尺寸的块的变换系数。在示例中,可以将64×1尺寸的变换矩阵设置为8×8块的变换系数。
可基于以比特流用信号发送的索引信息或当前块的尺寸或帧内预测模式中的至少一个确定不可分逆变换矩阵。在示例中,可基于当前块的尺寸确定不可分逆变换矩阵的尺寸,并且可基于当前块的帧内预测模式而确定不可分逆变换矩阵集。当通过当前块的帧内预测模式确定不可分逆变换矩阵集时,可由索引lfnst_idx指定包括在不可分逆变换矩阵集中的对应于当前块的尺寸的多个不可分逆变换矩阵候选中的至少一个。
不可分逆变换矩阵集可包括多个不可分逆变换矩阵候选。在此情况下,在具有不同索引的不可分逆变换矩阵集之间,逆变换矩阵候选的类型或数量中的至少一个可不同。
表11表示基于帧内预测模式确定不可分逆变换集的示例。在表11中,predModeIntra表示帧内预测模式的索引,且lfnstTrSetIdx表示不可分逆变换集的索引。
【表11】
predModeIntra lfnstTrSetIdx
predModeIntra<0 1
0<=predModeIntra<=1 0
2<=predModeIntra<=12 1
13<=predModeIntra<=23 2
24<=predModeIntra<=44 3
45<=predModeIntra<=55 2
56<=predModeIntra<=80 1
81<=predModeIntra<=83 0
在示例中,当当前块的帧内预测模式为平面时,可选择索引为0的不可分逆变换矩阵集。之后,可基于当前块的尺寸以及lfnst_idx的值来确定不可分逆变换矩阵。
可通过进一步简化表11来确定不可分逆变换集。在示例中,表11可以如表12中那样被简化。
【表12】
predModeIntra lfnstTrSetIdx
predModeIntra<0 1
0<=predModeIntra<=1 0
2<=predModeIntra<50 1
50<=predModeIntra<=83 2
可选地,可通过仅考虑帧内预测模式是方向还是非方向来选择不可分逆变换矩阵集。表13表示基于帧内预测模式是方向还是非方向来确定不可分逆变换矩阵集的示例。
【表13】
predModeIntra lfnstTrSetIdx
0<=predModeIntra<=1 0
否则 1
可选地,在存储了定义帧内预测模式与不可分逆变换矩阵集之间的映射关系的多个查找表之后,可通过使用多个查找表中的一个来确定不可分逆变换矩阵集。在示例中,当确定不可分逆变换矩阵集时,可选择性地使用表11到表13中的一个。
可以以比特流用信号发送指定多个查找表中的一个的信息。可在序列级、画面级、条带级或块级用信号发送所述信息。
可选地,可以基于当前块的尺寸或形状或在第一变换中应用的变换核中的至少一个来选择多个查找表中的一个。
当使用预定义尺寸的逆变换矩阵时,可以设置为不使用基于帧内预测模式确定不可分逆变换矩阵集的方法。在示例中,当使用48×16尺寸的逆变换矩阵时,可省略基于帧内预测模式确定不可分逆变换矩阵集的处理。
如上述描述,可将多个不可分变换矩阵候选中的一个应用于当前块。在此情况下,不可分变换矩阵候选中的每一个可具有至少一个不同尺寸或系数。
图39是示出多种不可分变换矩阵候选的示例。
假设4×4子块是第二逆变换的目标。
如在图39(a)中所示的示例中,可通过使用64×16尺寸的不可分逆变换矩阵推导出64×1尺寸的变换矩阵。可以将推导出的变换矩阵设置为8×8尺寸的块的变换系数。
如在图39(b)中所示的示例中,可通过使用32×16尺寸的不可分逆变换矩阵推导出32×1尺寸的变换矩阵。可以将推导出的变换矩阵设置为4×8或8×4尺寸的块的变换系数。
如在图39(c)中所示的示例中,可通过使用48×16尺寸的不可分逆变换矩阵推导出48×1尺寸的变换矩阵。可以将推导出的变换矩阵设置为三个4×4尺寸的块的变换系数。在这三个4×4尺寸的块中的左上方块中存在非零变换系数,并且在其它块中,块中的变换系数的值可以被设置为0。
可以基于是否将子分区帧内编码方法应用于当前块来确定将应用于当前块的不可分逆变换矩阵。在示例中,可选地,当将子分区帧内编码方法应用于当前块时,可设置为应用32×16尺寸的不可分逆变换矩阵。
可选地,可基于是否将子分区帧内编码方法应用于当前块而不同地确定不可分逆变换矩阵候选的类型或数量。在示例中,仅当子分区帧内编码方法应用于当前块时,可将32×16尺寸的不可分逆变换矩阵用作候选。
当将子分区帧内编码方法应用于当前块并且应用32×16尺寸的不可分逆变换矩阵时,通过执行第二逆变换推导出的块的尺寸或形状可以根据子分区的尺寸或形状而不同。
在示例中,当将垂直方向上的分区应用于当前块时(例如,当子分区具有4×L形状时),可将通过执行第二逆变换获得的32×1尺寸的变换矩阵设置为4×8尺寸的块的变换系数。另一方面,当将水平方向上的分区应用于当前块时(例如,当子分区具有L×4形状时),可将通过执行第二逆变换获得的32×1尺寸的变换矩阵设置为8×4尺寸的块的变换系数。
尽管不应用子分区帧内预测编码方法,但是当通过帧内预测对当前块进行编码并且其尺寸为4×L或L×4时,可以应用32×16尺寸的不可分矩阵。
当将子分区帧内编码方法应用于当前块时,可将第二逆变换和第一逆变换应用于由当前块包括的多个子块中的每一个。
可选地,可将第二逆变换和第一逆变换应用于多个子块中预定义位置处的子块或分区索引小于阈值的子块。在示例中,第二变换可仅被应用于当前块的最上位置处的子分区或当前块的最左位置处的子分区,并且可不被应用于剩余子分区。
当应用子分区帧内编码方法时,可以将用于第二逆变换的目标区域确定为4×4尺寸。可选地,可以根据子块的尺寸自适应地确定目标区域的尺寸。在示例中,当子分区的宽度和高度的最小值为4时,可以将4×4尺寸的区域设置为目标区域。
可选地,对于4×N或N×4形状的子块,可以将8×4尺寸的区域设置为目标区域。在这种情况下,N表示等于或大于8的整数。
可以通过将包括在子块中的目标区域中的变换系数排列成行来生成输入矩阵。在示例中,当目标区域被设置为4×4尺寸时,包括在目标区域中的变换系数可以被变换为16×1形状的输入矩阵。可选地,当目标区域被设置为4×8或8×4尺寸时,包括在目标区域中的变换系数可以被变换为32×1形状的输入矩阵。
可通过将输入矩阵乘以不可分变换矩阵推导出变换矩阵。在示例中,可通过将16×16尺寸的不可分变换矩阵与16×1尺寸的输入矩阵相乘来获得16×1尺寸的变换矩阵。可选地,可通过将32×32尺寸的不可分变换矩阵与32×1尺寸的输入矩阵相乘来获得32×1尺寸的变换矩阵。
当获得变换矩阵时,可以将变换矩阵中的分量设置为子块的变换系数。在示例中,可以将16×1尺寸的变换矩阵设置为4×4尺寸的块的变换系数。可选地,可以将32×1尺寸的变换矩阵设置为4×8或8×4尺寸的左上方块的变换系数。
当将第二逆变换应用于子块时,可将预定义变换核应用于子块的水平方向上的变换以及垂直方向上的变换。在示例中,可将应用第二逆变换的子块的水平方向上的变换核以及垂直方向上的变换核设置为DCT2。
可以基于是否将子变换块编码方法应用于编码块来确定是否允许第二变换。在示例中,当将子变换块编码方法应用于编码块时,可以设置为不应用第二变换。
可选地,当将子变换块编码方法应用于编码块时,可以设置为仅对多个子块中的至少一个可用子块应用第二变换。在此情况下,可用子块可表示多个子块当中执行第一变换的块。
可以根据子块的尺寸或形状来确定子块中用于第二变换的目标区域的尺寸。在示例中,当子块的高度或宽度中的至少一个小于阈值时,可针对4×4区域执行第二变换。另一方面,当子块的高度或高度中的至少一个等于或大于阈值时,可对8×8区域执行第二变换。
可基于子块的尺寸、形状、位置或分区索引中的至少一个来确定是否将第二变换应用于子块。在示例中,可仅将第二变换应用于包括编码块的左上方样点的子块。可选地,仅当子块的高度或宽度中的至少一个大于阈值时,可应用第二变换。
可选地,可以以比特流用信号发送表示是否将第二变换应用于子块的信息。
当应用子变换块编码方法时,可以设置为不允许简化的第二变换。可选地,尽管应用了子变换块编码方法,但是可以基于子块的尺寸或形状中的至少一个来确定是否执行简化的第二变换。
可通过预测样点与残差样点之和推导出执行了变换的子块的重建样点。另一方面,预测样点可被设置为省略变换的子块中的重建样点。量化是为了减少块的能量,并且量化处理包括将变换系数除以特定常数值的处理。常数值可以由量化参数推导出,并且量化参数可以被定义为从1到63的值。
当获得当前块的重建块时,可以经由环内滤波来减少在量化和编码处理中发生的信息损失。环内滤波器可包括去块滤波器、样点自适应偏移滤波器(SAO)或自适应环路滤波器(ALF)中的至少一个。在下文中,在应用环内滤波器之前的重建块被称作第一重建块,并且在应用环内滤波器之后的重建块被称作第二重建块。
可通过将去块滤波器、SAO或ALF中的至少一个应用于第一重建块来获得第二重建块。就此而言,可在应用去块滤波器之后应用SAO或ALF。
将如关于解码处理或编码处理所描述的实施例分别应用于编码处理或解码处理的操作可被包括在本公开的范围中。在本公开的范围内,操作按照预定顺序发生的实施例可被修改为操作按照与所述预定顺序不同的顺序发生的实施例。
虽然基于一系列操作或流程图描述了上述实施例,但是所述实施例不将方法的操作的时间序列顺序限制于此。在另一示例中,操作可根据需要同时执行或按照与其不同的顺序来执行。此外,在上述实施例中,构成框图的组件中的每个组件(例如,单元、模块等)可以以硬件装置或软件的形式来实现。多个组件可被彼此组合为可使用单个硬件装置或软件来实现的单个组件。可使用可经由各种计算机组件执行的程序指令来实现上述实施例。指令可被记录在计算机可读存储介质中。计算机可读存储介质可在其中单独地或彼此组合地包括程序指令、数据文件、数据结构等。计算机可读存储介质的示例包括磁介质(诸如硬盘、软盘和磁带)、光学存储介质(诸如CD-ROM、DVD)和磁光介质(诸如软光盘)以及被专门配置为在其中存储并执行程序指令的硬件装置(诸如ROM、RAM、闪存等)。硬件装置可被配置为如一个或更多个软件模块进行操作以执行根据本公开的处理,反之亦可。
工业实用性
本公开可被应用于对视频进行编码/解码的电子装置。

Claims (11)

1.一种对视频进行解码的方法,所述方法包括:
在水平方向上或垂直方向上将编码块分区为多个子块;
确定是否将第二逆变换应用于所述编码块;以及
当确定将第二逆变换应用于所述编码块时,将第二逆变换应用于所述多个子块中的至少一个子块,
其中,是否应用第二逆变换是基于经由比特流用信号发送的索引信息确定的,并且
其中,仅当所述多个子块中的至少一个子块的尺寸等于或大于阈值时,所述索引信息被用信号发送。
2.根据权利要求1所述的方法,其中,当所述多个子块中的至少一个子块的尺寸小于所述阈值时,省略对所述索引信息的解码,并且
其中,当省略对所述信息的解码时,推断所述索引信息的值指示不应用第二逆变换。
3.根据权利要求1所述的方法,其中,基于逆变换矩阵执行第二逆变换,以及
其中,所述逆变换矩阵是基于所述编码块的帧内预测模式和所述信息确定的。
4.根据权利要求3所述的方法,其中,基于帧内预测模式,逆变换矩阵集被确定,以及
其中,基于所述索引信息,包括在确定的逆变换矩阵集中的多个逆变换矩阵候选中的一个逆变换矩阵候选被选择。
5.根据权利要求4所述的方法,其中,当帧内预测模式为非方向模式时被选择的逆变换矩阵集与当帧内预测模式为方向模式时被选择的逆变换矩阵集不同。
6.根据权利要求1所述的方法,其中,当将BDPCM方案应用于所述编码块时,省略对所述索引信息的解码。
7.一种对视频进行编码的方法,所述方法包括:
在水平方向上或垂直方向上将编码块分区为多个子块;
确定是否将第二变换应用于所述编码块;以及
当确定将第二变换应用于所述编码块时,将第二变换应用于所述多个子块中的至少一个子块,
其中,通过将所述多个子块中的至少一个子块的尺寸与阈值进行比较来确定是否对指定是否执行第二变换的索引信息进行编码。
8.根据权利要求7所述的方法,其中,基于变换矩阵执行第二变换,并且
其中,所述变换矩阵是从基于当前块的帧内预测模式确定的变换矩阵集推导出的。
9.根据权利要求8所述的方法,其中,所述索引信息被设置为指定包括在变换矩阵集中的多个变换矩阵候选中的一个变换矩阵候选的值。
10.根据权利要求9所述的方法,其中,当帧内预测模式为非方向模式时被选择的不可分逆变换矩阵集与当帧内预测模式为方向模式时被选择的不可分逆变换矩阵集不同。
11.根据权利要求7所述的方法,其中,当将BDPCM方案应用于所述编码块时,省略对所述索引信息的编码。
CN202080006953.2A 2019-06-10 2020-06-10 用于对图像信号进行编码/解码方法及其装置 Pending CN113287310A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
KR10-2019-0067888 2019-06-10
KR20190067888 2019-06-10
KR20190073786 2019-06-20
KR10-2019-0073784 2019-06-20
KR10-2019-0073786 2019-06-20
KR20190073784 2019-06-20
PCT/KR2020/007510 WO2020251254A1 (ko) 2019-06-10 2020-06-10 영상 신호 부호화/복호화 방법 및 이를 위한 장치

Publications (1)

Publication Number Publication Date
CN113287310A true CN113287310A (zh) 2021-08-20

Family

ID=73781853

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080006953.2A Pending CN113287310A (zh) 2019-06-10 2020-06-10 用于对图像信号进行编码/解码方法及其装置

Country Status (5)

Country Link
US (2) US20220014743A1 (zh)
KR (1) KR20200141399A (zh)
CN (1) CN113287310A (zh)
WO (1) WO2020251254A1 (zh)
ZA (1) ZA202108679B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070039273A (ko) * 2005-10-07 2007-04-11 성균관대학교산학협력단 움직임보상 시간축 필터링을 이용한 다시점 비디오 부호화및 복호화 방법 및 장치
KR20120005984A (ko) * 2010-07-09 2012-01-17 삼성전자주식회사 변환 계수의 엔트로피 부호화/복호화 방법 및 장치
WO2017043769A1 (ko) * 2015-09-10 2017-03-16 삼성전자 주식회사 부호화 장치, 복호화 장치 및 그 부호화 방법 및 복호화 방법
KR20180085526A (ko) * 2017-01-19 2018-07-27 가온미디어 주식회사 효율적 변환을 처리하는 영상 복호화 및 부호화 방법
CN108886613A (zh) * 2016-03-28 2018-11-23 株式会社Kt 用于处理视频信号的方法和装置
CN109417636A (zh) * 2016-06-24 2019-03-01 韩国电子通信研究院 用于基于变换的图像编码/解码的方法和设备
KR20190033403A (ko) * 2017-09-21 2019-03-29 에스케이텔레콤 주식회사 해상도 향상 기법을 이용한 영상의 부호화 및 복호화
CN109644276A (zh) * 2016-08-01 2019-04-16 韩国电子通信研究院 图像编码/解码方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107105279B (zh) * 2011-09-23 2020-03-06 株式会社Kt 用于引导合并候选块的方法和使用该方法的设备
FR3038484B1 (fr) * 2015-07-01 2017-07-28 Ateme Procede d'encodage d'image et equipement pour la mise en oeuvre du procede
US10681379B2 (en) * 2015-09-29 2020-06-09 Qualcomm Incorporated Non-separable secondary transform for video coding with reorganizing
US10448056B2 (en) * 2016-07-15 2019-10-15 Qualcomm Incorporated Signaling of quantization information in non-quadtree-only partitioned video coding
CN116866570A (zh) * 2016-10-04 2023-10-10 株式会社Kt 用于处理视频信号的方法和装置
CN110944170B (zh) * 2018-09-24 2023-05-02 北京字节跳动网络技术有限公司 扩展Merge预测
CN113905239A (zh) * 2018-12-29 2022-01-07 深圳市大疆创新科技有限公司 视频处理方法和设备
WO2020197202A1 (ko) * 2019-03-26 2020-10-01 엘지전자 주식회사 Mpm 리스트에 기반한 인트라 예측 방법 및 그 장치
WO2020207498A1 (en) * 2019-04-12 2020-10-15 Beijing Bytedance Network Technology Co., Ltd. Chroma coding mode determination based on matrix-based intra prediction
WO2020216299A1 (en) * 2019-04-23 2020-10-29 Beijing Bytedance Network Technology Co., Ltd. Use of secondary transform in coded video
US11190758B2 (en) * 2019-04-25 2021-11-30 Qualcomm Incorporated Block-based quantized residual domain pulse code modulation assignment for intra prediction mode derivation
JP7269373B2 (ja) * 2019-05-10 2023-05-08 北京字節跳動網絡技術有限公司 ビデオ処理方法、装置、記憶媒体及び記憶方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070039273A (ko) * 2005-10-07 2007-04-11 성균관대학교산학협력단 움직임보상 시간축 필터링을 이용한 다시점 비디오 부호화및 복호화 방법 및 장치
KR20120005984A (ko) * 2010-07-09 2012-01-17 삼성전자주식회사 변환 계수의 엔트로피 부호화/복호화 방법 및 장치
WO2017043769A1 (ko) * 2015-09-10 2017-03-16 삼성전자 주식회사 부호화 장치, 복호화 장치 및 그 부호화 방법 및 복호화 방법
CN108886613A (zh) * 2016-03-28 2018-11-23 株式会社Kt 用于处理视频信号的方法和装置
CN109417636A (zh) * 2016-06-24 2019-03-01 韩国电子通信研究院 用于基于变换的图像编码/解码的方法和设备
CN109644276A (zh) * 2016-08-01 2019-04-16 韩国电子通信研究院 图像编码/解码方法
KR20180085526A (ko) * 2017-01-19 2018-07-27 가온미디어 주식회사 효율적 변환을 처리하는 영상 복호화 및 부호화 방법
KR20190033403A (ko) * 2017-09-21 2019-03-29 에스케이텔레콤 주식회사 해상도 향상 기법을 이용한 영상의 부호화 및 복호화

Also Published As

Publication number Publication date
US20220014743A1 (en) 2022-01-13
KR20200141399A (ko) 2020-12-18
WO2020251254A1 (ko) 2020-12-17
ZA202108679B (en) 2022-07-27
US20240031574A1 (en) 2024-01-25

Similar Documents

Publication Publication Date Title
CN112673637B (zh) 用于对图像信号进行编码/解码的方法及其装置
KR102608847B1 (ko) 영상 신호 부호화/복호화 방법 및 이를 위한 장치
CN112219397B (zh) 用于对视频信号编码/解码的方法及其装置
KR102617439B1 (ko) 영상 신호 부호화/복호화 방법 및 이를 위한 장치
CN112514384A (zh) 视频信号编码/解码方法及其装置
CN113329224A (zh) 视频信号编码/解码方法以及用于所述方法的设备
CN112425160A (zh) 用于对视频信号进行编码/解码的方法及其设备
CN113039799B (zh) 图像信号编码/解码方法及其设备
CN112930683A (zh) 用于对图像信号进行编码/解码的方法及其设备
CN113170130A (zh) 图像信号编码/解码方法及其装置
US20240179312A1 (en) Method for encoding/decoding image signal, and device for same
CN112544083B (zh) 图像信号编码/解码方法及用于其的装置
CN112470479B (zh) 视频信号编码/解码方法及存储介质
CN113711596A (zh) 图像信号编码/解码方法及其装置
CN112236996A (zh) 视频信号编码/解码方法及其装置
CN112236998A (zh) 用于对视频信号进行编码/解码的方法及其装置
EP4020984A1 (en) Method for encoding/decoding image signal and device therefor
CN113170199B (zh) 用于对图像信号进行编码/解码的方法及其装置
CN113439439A (zh) 用于对图像信号进行编码/解码的方法及其装置
CN116112684A (zh) 用于对图像信号进行编码/解码的方法及其装置
CN112956198A (zh) 用于对图像信号进行编码/解码的方法及其装置
CN113287310A (zh) 用于对图像信号进行编码/解码方法及其装置
CN113170164A (zh) 用于对图像信号进行编码/解码的方法及其装置
CN118632017A (zh) 视频信号编码/解码方法及其装置
CN118632020A (zh) 视频信号编码/解码方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination