CN112673637A - 用于对图像信号进行编码/解码的方法及其装置 - Google Patents

用于对图像信号进行编码/解码的方法及其装置 Download PDF

Info

Publication number
CN112673637A
CN112673637A CN202080005033.9A CN202080005033A CN112673637A CN 112673637 A CN112673637 A CN 112673637A CN 202080005033 A CN202080005033 A CN 202080005033A CN 112673637 A CN112673637 A CN 112673637A
Authority
CN
China
Prior art keywords
block
motion information
prediction
mode
current block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202080005033.9A
Other languages
English (en)
Other versions
CN112673637B (zh
Inventor
李培根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apple Inc
Original Assignee
Xris Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xris Corp filed Critical Xris Corp
Publication of CN112673637A publication Critical patent/CN112673637A/zh
Application granted granted Critical
Publication of CN112673637B publication Critical patent/CN112673637B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

根据本发明的用于对图像进行解码的方法可包括以下步骤:推导当前块的残差系数;对所述残差系数进行反量化;通过对反量化的残差系数执行逆变换来推导共同残差信号;并且基于所述共同残差信号推导第一色度分量的第一残差信号和第二色度分量的第二残差信号。

Description

用于对图像信号进行编码/解码的方法及其装置
技术领域
本公开涉及一种视频信号编码/解码方法及其装置。
背景技术
随着显示面板变得更大,需要更高质量的视频服务。高清视频服务的最大问题是数据量大大地增加。为了解决以上问题,正在积极进行提高视频压缩率的研究。作为代表性示例,视频编码联合协作组(JCT-VC)在2009年由国际电信联盟-电信(ITU-T)下的运动图像专家组(MPEG)和视频编码专家组(VCEG)组建。JCT-VC提出高效视频编码(HEVC),一种压缩性能是H.264/AVC的约两倍且在2013年1月25日被批准为标准的视频压缩标准。然而,随着高清视频服务的快速发展,HEVC的性能逐渐显示出它的局限性。
发明内容
技术目的
本公开的目的在于提供一种在对视频信号进行编码/解码时对色度分量的残差分量进行联合编码的方法以及用于执行所述方法的装置。
本公开的目的在于提供一种在对视频信号进行编码/解码时选择性地使用生成针对色度分量的联合色度信号的各种方法的方法以及用于执行所述方法的装置。
本公开的目的在于提供一种在对视频信号进行编码/解码时执行二次变换的方法以及用于执行所述方法的装置。
可从本公开获得的技术目的不限于上述技术目的,并且本公开所属技术领域的普通技术人员可从以下描述清楚地理解其他未提及的技术目的。
技术方案
根据本公开的视频信号解码方法可包括:推导当前块的残差系数,对所述残差系数进行反量化,通过针对反量化的残差系数执行逆变换来推导联合残差信号,并且基于所述联合残差信号推导针对第一色度分量的第一残差信号和针对第二色度分量的第二残差信号。
根据本公开的视频信号编码方法可包括:基于针对第一色度分量的第一残差信号和针对第二色度分量的第二残差信号生成联合残差信号,对所述联合残差信号进行变换,通过对经过变换的联合残差信号进行量化来推导残差系数,并且对所述残差系数进行编码。
根据本公开的视频信号解码方法还可包括:将多个残差信号重建模式候选中的一个残差信号重建模式候选确定为针对当前块的残差信号重建模式。
在根据本公开的视频信号解码方法中,推导第一残差信号的方法在当在所述多个残差信号重建模式候选中选择第一残差信号重建模式时与当在所述多个残差信号重建模式候选中选择第二残差信号重建模式时之间可不同。
在根据本公开的视频信号解码方法中,当选择了第一残差信号重建模式时,可将第一残差信号推导为与所述联合残差信号相同,并且当选择了第二残差信号重建模式时,可将第一残差信号推导为与所述联合残差信号具有相反的符号,或者通过对所述联合残差信号进行缩放来推导第一残差信号。
在根据本公开的视频信号解码方法中,还可包括:对用于指定残差信号重建模式的信息进行解析。
在根据本公开的视频信号解码方法中,所述信息可包括第一标志和第二标志,其中,第一标志表示当前块中是否存在第一色度分量的非零变换系数,第二标志表示当前块中是否存在第二色度分量的非零变换系数。
在根据本公开的视频信号解码方法中,第一残差信号可与所述联合残差信号具有相同的符号,并且第二残差信号可与所述联合残差信号具有相反的符号。
将理解,前述概括的特征是本公开的以下详细描述的示例性方面,而不限制本公开的范围。
技术效果
根据本公开,可通过对色度分量的残差分量进行联合编码来提高视频信号的编码/解码效率。
根据本公开,可通过选择性地使用生成联合色度信号的各种方法来提高视频信号的编码/解码效率。
根据本公开,可通过多次针对残差信号执行变换来提高编码/解码效率。
可从本公开获得的效果可不受上述效果的限制,并且本公开所属技术领域的普通技术人员可从以下描述清楚地理解其他未提及的效果。
附图说明
图1是示出根据本公开的实施例的视频编码装置(编码器)的框图的示图。
图2是示出根据本公开的实施例的视频解码装置(解码器)的框图的示图。
图3是示出根据本公开的实施例的基本编码树单元的示图。
图4是示出编码块的各种分区类型的示图。
图5是示出对CTU进行分区的方面的示例的示图。
图6是根据本公开的实施例的帧间预测方法的流程图。
图7是在合并模式下推导当前块运动信息的处理的流程图。
图8是示出用于推导合并候选的候选块的示图。
图9是示出用于推导合并候选的候选块的示图。
图10是用于解释运动信息表的更新方面的示图。
图11是示出运动信息表的更新方面的示图。
图12是示出更新预存储的运动信息候选的索引的示例的示图。
图13是示出代表性子块的位置的示图。
图14示出按帧间预测模式生成运动信息表的示例。
图15示出按运动矢量分辨率生成运动信息表的示例。
图16示出应用了合并偏移编码方法的块的运动信息被存储在单独的运动信息表中的示例。
图17是示出将包括在长期运动信息表中的运动信息候选添加到合并候选列表的示例的示图。
图18是示出仅针对合并候选中的一部分合并候选执行冗余校验的示例的示图。
图19是示出对特定合并候选的冗余校验被省略的示例的示图。
图20是示出与当前块包括在同一合并处理区域中的候选块被设置为不可用作合并候选的示例的示图。
图21是示出当当前块被包括在合并处理区域中时推导针对当前块的合并候选的示例的示图。
图22是示出临时运动信息表的示图。
图23是示出使运动信息表和临时运动信息表一致的示例的示图。
图24是示出通过使用对角线将编码块分区为多个预测单元的示例的示图。
图25是示出编码块被分区为两个预测单元的示例的示图。
图26示出编码块被分区为多个不同尺寸的预测块的示例。
图27是示出用于推导分区模式合并候选的邻近块的示图。
图28是用于解释按预测单元确定邻近块的可用性的示例的示图。
图29和图30是示出基于第一预测样点和第二预测样点的加权和运算来推导预测样点的示例的示图。
图31是根据本公开的实施例的帧内预测方法的流程图。
图32是示出帧内预测模式的示图。
图33和图34是示出将参考样点排列为一条线的一维阵列的示例的示图。
图35是示出由方向帧内预测模式与平行于x轴的直线形成的角度的示图。
图36是示出当当前块具有非正方形形状时获得预测样点的方面的示图。
图37是示出广角帧内预测模式的示图。
图38是示出垂直方向分区和水平方向分区的示例的示图。
图39是示出确定编码块的分区类型的示例的示图。
图40是示出确定编码块的分区类型的示例的示图。
图41是示出基于编码块的帧内预测模式确定编码块的分区类型的示例的示图。
图42是用于描述编码块的分区方面的示图。
图43是示出按子块确定是否执行变换跳过的示例的示图。
图44是示出子块使用相同的变换类型的示例的示图。
图45和图46是示出子变换块编码方法的应用方面的示图。
图47和图48示出根据作为变换的目标的子块的位置的水平方向变换类型和垂直方向变换类型。
图49是示出当缩减因子为16时变换系数的编码方面的示图。
图50和图51是示出针对可用子块执行二次变换的示例的示图。
图52和图53是示出根据本公开的实施例的联合色度残差变换方法的流程图的示图。
具体实施方式
在下文中,将参照附图详细描述本公开的实施例。
基于块来执行图像编码和解码。在示例中,对于编码块、变换块或预测块,可执行编码/解码处理,诸如变换、量化、预测、环内滤波、重建等。
在下文中,编码/解码目标块被称为“当前块”。在示例中,当前块可表示根据编码/解码的当前处理的编码块、变换块或预测块。
此外,本说明书中使用的术语“单元”表示用于执行特定编码/解码处理的基本单元,并且“块”可被理解为表示具有预定尺寸的样点阵列。除非另有说明,否则“块”和“单元”可被可互换地使用。在示例中,在稍后描述的示例中,编码块和编码单元可被理解为具有彼此相同的含义。
图1是示出根据本公开的实施例的图像编码设备(编码器)的框图的示图。
参照图1,图像编码设备100可包括画面分区单元110、预测单元120和125、变换单元130、量化单元135、重排单元160、熵编码单元165、反量化单元140、逆变换单元145、滤波器单元150和存储器155。
图1中描述的组件被独立地示出,以便示出图像编码设备中的不同特征功能,并且该图不表示每个组件由单独的硬件或一个软件单元构成。也就是说,每个组件仅是为了便于解释而被列举出的,各个组件中的至少两个组件可构成一个组件,或者一个组件可被划分为可执行其功能的多个组件。甚至对各个组件进行集成的实施例以及对组件进行划分的实施例也被包括在本公开的范围中,除非它们脱离本公开的精神。
此外,一些组件不是执行本公开的必要功能的必需部件,而是仅用于提升性能的可选组件。本公开可利用除了仅用于提升性能的组件之外的用于实现本公开的精神的必要组件来实现,并且仅包括除了仅用于提升性能的可选组件之外的必要组件的结构也被包括在本公开的范围内。
画面分区单元110可将输入画面分区为至少一个处理单元。就此而言,处理单元可以是预测单元(PU)、变换单元(TU)或编码单元(CU)。在画面分区单元110中,可将单个画面分区为多个编码单元、预测单元和变换单元的组合,并且可通过根据预定条件(例如,代价函数)选择编码单元、预测单元和变换单元的组合来对画面进行编码。
例如,可将单个画面分区为多个编码单元。为了将画面分区为编码单元,可使用诸如四叉树结构的递归树结构,并且源自诸如单个图像或最大编码单元的根的编码单元可被分区为其他编码单元,并且可具有与分区出的编码单元一样多的子节点。根据特定限制不再被分区的编码单元成为叶节点。即,当假设仅正方形分区可用于单个编码单元时,单个编码单元可被分区为最多四个其他编码单元。
在下文中,在本公开的实施例中,编码单元可被用作用于编码的单元或可被用作用于解码的单元。
可通过将单个编码单元分区为具有相同尺寸的至少一个正方形或矩形来获得预测单元,或者可以以一个预测单元在形状和/或尺寸上可与另一预测单元不同的方式将单个编码单元分区为预测单元。
在基于正被执行帧内预测的编码块生成预测单元时,当编码单元不是最小编码单元时,可在不执行分区为多个N×N的预测单元的情况下执行帧内预测。
预测单元120和125可包括执行帧间预测的帧间预测单元120以及执行帧内预测的帧内预测单元125。可确定是对预测单元执行帧间预测还是帧内预测,并且可确定根据每种预测方法的详细信息(例如,帧内预测模式、运动矢量、参考画面等)。就此而言,被执行预测的处理单元可与确定了预测方法及其细节的处理单元不同。例如,可基于预测单元来确定预测方法、预测模式等,并且可基于变换单元来执行预测。所生成的预测块与原始块之间的残差值(残差块)可被输入到变换单元130。此外,用于预测的预测模式信息、运动矢量信息等可由熵编码单元165使用残差值来编码,且可被发送到解码器。当使用特定编码模式时,原始块在不通过预测单元120或125生成预测块的情况下被按原样编码并被发送到解码单元。
帧间预测单元120可基于关于当前画面的先前画面和后续画面中的至少一个的信息来对预测单元进行预测,或者在一些情况下,可基于关于当前画面中的一些编码区域的信息来对预测单元进行预测。帧间预测单元120可包括参考画面插值单元、运动预测单元和运动补偿单元。
参考画面插值单元可从存储器155接收参考画面信息,并且从参考画面生成整数像素或更小像素的像素信息。在亮度像素的情况下,可使用具有不同系数的8抽头的基于DCT的插值滤波器,以便生成关于整数像素或针对1/4像素单位的更小像素的像素信息。在色度信号的情况下,可使用具有不同滤波器系数的4抽头的基于DCT的插值滤波器,以便生成关于整数像素或针对1/8像素单位的更小像素的像素信息。
运动预测单元可基于由参考画面插值单元插值的参考画面来执行运动预测。作为用于计算运动矢量的方法,可使用各种方法,诸如基于全搜索的块匹配算法(FBMA)、三步搜索(TSS)算法、新三步搜索(NTS)算法等。基于经过插值的像素,运动矢量可具有以1/2像素或1/4像素为单位的运动矢大小。运动预测单元可通过改变运动预测方法来对当前预测单元进行预测。作为运动预测方法,可使用各种方法,诸如跳过方法、合并方法、高级运动矢量预测(AMVP)方法、帧内块复制方法等。
帧内预测单元125可基于关于当前块周围的参考像素的信息(是当前画面中的像素信息)生成预测单元。当当前预测单元的邻近块是被执行帧间预测的块,并且因此参考像素是被执行帧间预测的像素时,包括在被执行帧间预测的块中的参考像素可被替换为关于被执行帧内预测的邻近块的参考像素的信息。换句话说,当参考像素不可用时,可使用可用参考像素中的至少一个参考像素来替换不可用参考像素信息。
帧内预测中的预测模式可包括根据预测方向使用参考像素信息的方向预测模式以及在执行预测时不使用方向信息的非方向模式。用于对亮度信息进行预测的模式可不同于用于对色度信息进行预测的模式。为了对色度信息进行预测,可使用关于用于对亮度信息进行预测的帧内预测模式的信息或关于预测的亮度信号的信息。
在执行帧内预测时,当预测单元的尺寸与变换单元相同时,可基于位于预测单元的左侧、左上方和上方的像素对预测单元执行帧内预测。然而,在执行帧内预测时,当预测单元的尺寸与变换单元不同时,可通过使用参考像素基于变换单元来执行帧内预测。此外,使用N×N分区的帧内预测可仅被用于最小编码单元。
在帧内预测方法中,可在根据预测模式将自适应帧内平滑(AIS)滤波器应用于参考像素之后生成预测块。应用于参考像素的AIS滤波器的类型可变化。为了执行帧内预测方法,可从当前预测单元周围存在的预测单元的帧内预测模式对针对当前预测单元的帧内预测模式进行预测。在通过使用从邻近预测单元预测出的模式信息对针对当前预测单元的预测模式进行预测时,当针对当前预测单元的帧内预测模式与邻近预测单元的帧内预测模式相同时,可通过使用预定标志信息来发送指示当前预测单元和邻近预测单元具有相同预测模式的信息。当针对当前预测单元的预测模式与邻近预测单元的预测模式不同时,可执行熵编码以对关于针对当前块的预测模式的信息进行编码。
此外,可生成包括关于残差值的信息的残差块,其中,所述残差值是通过预测单元120或125而被执行预测的预测单元与该预测单元的原始块之间的差值。所生成的残差块可被输入到变换单元130。
变换单元130可通过使用诸如离散余弦变换(DCT)或离散正弦变换(DST)的变换方法来对残差块执行变换,其中,所述残差块包括关于原始块与由预测单元120或125生成的预测单元之间的残差值的信息。就此而言,DCT变换核包括DCT2或DCT8中的至少一个,并且DST变换核包括DST7。可基于关于用于生成残差块的预测单元的帧内预测模式的信息来确定是应用DCT还是DST以便对残差块执行变换。可跳过针对残差块的变换。可对指示是否跳过针对残差块的变换的标志进行编码。对于尺寸小于或等于阈值的残差块、亮度分量的残差块或4:4:4格式下的色度分量的残差块,可允许变换跳过。
量化单元135可对由变换单元130变换到频域的值执行量化。量化系数可根据块或图像的重要性而变化。在量化单元135中计算出的值可被提供给反量化单元140和重排单元160。
重排单元160可对针对量化的残差值的系数值执行重排。
重排单元160可通过系数扫描方法将二维块形式的系数改变为一维矢量形式的系数。例如,重排单元160可通过使用Z字形扫描方法从DC系数扫描到高频域中的系数,以便将系数改变为一维矢量的形式。根据变换单元的尺寸和帧内预测模式,可使用垂直方向扫描或水平方向扫描,而不是Z字形扫描,其中,在垂直方向扫描中在列方向上对二维块形式的系数进行扫描,在水平方向扫描中在行方向上对二维块形式的系数进行扫描。换句话说,可根据变换单元的尺寸和帧内预测模式来确定使用Z字形扫描、垂直方向扫描和水平方向扫描中的哪种扫描方法。
熵编码单元165可基于由重排单元160计算出的值来执行熵编码。熵编码可使用各种编码方法,例如,指数哥伦布编码、上下文自适应可变长度编码(CAVLC)或上下文自适应二进制算术编码(CABAC)。
熵编码单元165可对从重排单元160以及预测单元120和125获得的各种类型的信息(诸如关于残差值系数的信息和关于编码单元的块类型的信息、关于预测模式的信息、关于分区单元的信息、关于预测单元的信息和关于发送单元的信息、关于运动矢量的信息、关于参考帧的信息、关于块插值的信息、滤波信息等)进行编码。
熵编码单元165可对从重排单元160输入的编码单元的系数进行熵编码。
反量化单元140可对在量化单元135中量化的值执行反量化,并且逆变换单元145可对在变换单元130中变换的值执行逆变换。由反量化单元140和逆变换单元145生成的残差值可与由包括在预测单元120和125中的运动估计单元、运动补偿单元或帧内预测单元预测出的预测单元相加,以便生成重建块。
滤波器单元150可包括去块滤波器、偏移校正单元和自适应环路滤波器(ALF)中的至少一个。
去块滤波器可去除由于重建画面中的块之间的边界而发生的块失真。为了确定是否执行去块,可基于块中包括的若干行和若干列中所包括的像素来确定是否将去块滤波器应用于当前块。当去块滤波器被应用于块时,根据所需的去块滤波强度应用强滤波器或弱滤波器。此外,在应用去块滤波器时,当执行水平方向滤波和垂直方向滤波时,水平方向滤波和垂直方向滤波可被配置为被并行处理。
偏移校正单元可通过相对于被执行去块的图像的以像素为单位的偏移来校正原始图像。为了对特定画面执行偏移校正,将偏移应用于在将图像的像素分区为预定数量的区域之后确定的区域的方法或者根据每个像素的边缘信息应用偏移的方法可被使用。
可基于通过将经过滤波的重建图像与原始图像进行比较而获得的值来执行自适应环路滤波(ALF)。可将图像中包括的像素分区为预定组,将被应用于所述组中的每个组的滤波器可被确定,并且可对每个组单独执行滤波。可针对亮度信号的每个编码单元(CU)发送关于是否应用ALF的信息,并且将被应用的ALF滤波器的形状和滤波器系数可基于每个块而变化。可选地,可应用具有相同形状(固定的形状)的ALF滤波器,而不管将被应用滤波器的块的特征如何。
在存储器155中,可存储通过滤波器单元150计算出的重建块或画面。当执行帧间预测时,可将所存储的重建块或画面提供给预测单元120或125。
图2是示出根据本公开的实施例的图像解码设备(解码器)的框图的示图。
参照图2,图像解码设备200可包括:熵解码单元210、重排单元215、反量化单元220、逆变换单元225、预测单元230和235、滤波器单元240和存储器245。
当从编码器输入了图像比特流时,可根据图像编码设备的逆处理对输入的比特流进行解码。
熵解码单元210可根据由图像编码器的熵编码单元进行的熵编码的逆处理来执行熵解码。例如,与由图像编码器设备执行的方法相关联,可应用各种方法,诸如指数哥伦布编码、上下文自适应可变长度编码(CAVLC)或上下文自适应二进制算术编码(CABAC)。
熵解码单元210可对关于由编码器执行的帧内预测和帧间预测的信息进行解码。
重排单元215可基于在编码器中使用的重排方法对由熵解码单元210熵解码的比特流执行重排。以一维矢量形式表示的系数可被重建并被重排为二维块形式的系数。重排单元215可通过下述方法来执行重排:接收与在编码器中执行的系数扫描相关的信息并基于在编码器中执行的扫描顺序进行逆扫描。
反量化单元220可基于从编码器接收到的量化参数和经过重排的块的系数值来执行反量化。
逆变换单元225可执行与由图像编码器中的变换单元对量化结果执行的变换(即,DCT或DST)相反的逆变换(即,逆DCT或逆DST)。就此而言,DCT变换核可包括DCT2或DCT8中的至少一个,并且DST变换核可包括DST7。可选地,当在图像编码器中跳过了变换时,也不在逆变换单元225中执行逆变换。可基于由图像编码器确定的发送单元来执行逆变换。图像解码器的逆变换单元225可根据诸如预测方法、当前块的尺寸、预测方向等的多条信息选择性地执行变换方法(例如,DCT或DST)。
预测单元230或235可基于从熵解码单元210接收到的与预测块相关的信息以及从存储器245接收到的关于先前解码的块或画面的信息来生成预测块。
如上所述,作为图像编码器的操作,在执行帧内预测时,当预测单元的尺寸与变换单元相同时,可基于位于预测单元的左侧、左上方和上方的像素对预测单元执行帧内预测。然而,在执行帧内预测时,当预测单元的尺寸与变换单元不同时,可通过使用参考像素基于变换单元来执行帧内预测。此外,使用N×N分区的帧内预测可仅被用于最小编码单元。
预测单元230和235可包括PU确定模块、帧间预测单元和帧内预测单元。PU确定模块可接收从熵解码单元210输入的各种类型的信息(诸如关于预测单元的信息、关于帧内预测方法的预测模式的信息、关于帧间预测方法的运动预测的信息等),对当前编码单元中的预测单元进行划分,并且确定对预测单元执行帧间预测还是帧内预测。通过使用从图像编码器接收到的在当前预测单元的帧间预测中所需的信息,帧间预测单元230可基于关于包括当前预测单元的当前画面的先前画面和后续画面中的至少一个的信息来对当前预测单元执行帧间预测。可选地,可基于关于包括当前预测单元的当前画面中的一些预重建区域的信息来执行帧间预测。
为了执行帧间预测,可基于编码单元确定将跳过模式、合并模式、AMVP模式或帧内块复制模式中的哪种方法用作针对包括在编码单元中的预测单元的运动预测方法。
帧内预测单元235可基于关于当前画面内的像素的信息来生成预测块。当预测单元是已被执行帧内预测的预测单元时,可基于从图像编码器接收到的关于预测单元的帧内预测模式的信息来执行帧内预测。帧内预测单元235可包括自适应帧内平滑(AIS)滤波器、参考像素插值模块或DC滤波器。AIS滤波器可对当前块的参考像素执行滤波,并且可根据针对当前预测单元的预测模式来确定是否应用滤波器。当对当前块的参考像素执行AIS滤波时,可使用从图像编码器接收到的关于AIS滤波器的信息和预测单元的预测模式。当针对当前块的预测模式是不应用AIS滤波的模式时,可不应用AIS滤波器。
当预测单元的预测模式是基于通过对参考像素进行插值而获得的像素值执行帧内预测的预测模式时,参考像素插值单元可对参考像素进行插值以便生成具有整数或更小的单位的参考像素。当针对当前预测单元的预测模式是在不对参考像素进行插值的情况下生成预测块的预测模式时,可不对参考像素进行插值。当针对当前块的预测模式是DC模式时,DC滤波器可通过滤波来生成预测块。
可将重建块或重建画面提供给滤波器单元240。滤波器单元240可包括去块滤波器、偏移校正模块和ALF。
可从图像编码器接收关于去块滤波器是否已被应用于对应块或对应画面的信息以及关于当去块滤波器被应用时是应用强滤波器还是弱滤波器的信息。图像解码器的去块滤波器可从图像编码器接收关于去块滤波器的信息,并且图像解码器可对对应块执行去块滤波。
偏移校正单元可基于在执行编码时应用于图像的偏移校正的类型、关于偏移值的信息等对重建图像执行偏移校正。
可基于从编码器接收到的关于是否应用ALF的信息、关于ALF系数的信息等将ALF应用于编码单元。以上ALF信息可通过被包括在特定参数集中而被提供。
在存储器245中,可存储重建画面或重建块以便用作参考画面或参考块,并且可将重建画面提供给输出单元。
图3是示出根据本公开的实施例的基本编码树单元的示图。
最大编码块可被定义为编码树块。可将单个画面分区为多个编码树单元(CTU)。CTU可以是最大尺寸的编码单元,并且可被称作最大编码单元(LCU)。图3是示出将单个画面分区为多个CTU的示例的示图。
可在画面级或序列级定义CTU的尺寸。同样,可通过画面参数集或序列参数集用信号发送表示CTU的尺寸的信息。
在示例中,针对序列内的整个画面的CTU的尺寸可被设置为128×128。可选地,可将128×128或256×256中的任意一个确定为画面级的CTU的尺寸。在示例中,CTU可被设置为在第一画面具有128×128的尺寸,并且在第二画面具有256×256的尺寸。
可通过对CTU进行分区来生成编码块。编码块表示用于执行编码/解码的基本单元。在示例中,可针对每个编码块执行预测或变换,或者可针对每个编码块确定预测编码模式。就此而言,预测编码模式表示生成预测图像的方法。在示例中,预测编码模式可包括帧内预测、帧间预测、当前画面参考(CPR)、帧内块复制(IBC)或组合预测。对于编码块,可通过使用帧内预测、帧间预测、当前画面参考或组合预测中的至少一个的预测编码模式来生成编码块的预测块。
可以以比特流用信号发送表示针对当前块的预测编码模式的信息。在示例中,该信息可以是表示预测编码模式是帧内模式还是帧间模式的1比特标志。当针对当前块的预测编码模式被确定为帧间模式时,当前画面参考或组合预测可以是可用的。
当前画面参考将当前画面设置为参考画面,并且从当前画面内的已被编码/解码的区域获得当前块的预测块。就此而言,当前画面表示包括当前块的画面。可以以比特流用信号发送表示当前画面参考是否被应用于当前块的信息。在示例中,该信息可以是1比特标志。当该标志为真时,可将针对当前块的预测编码模式确定为当前画面参考,并且当该标志为假时,可将针对当前块的预测编码模式确定为帧间预测。
可选地,可基于参考画面索引来确定当前块的预测编码模式。在示例中,当参考画面索引指示当前画面时,可将针对当前块的预测编码模式确定为当前画面参考。当参考画面索引指示除了当前画面之外的画面时,可将针对当前块的预测编码模式确定为帧间预测。换句话说,当前画面参考是使用关于当前画面内的已被编码/解码的区域的信息的预测方法,并且帧间预测是使用关于已被编码/解码的另一画面的信息的预测方法。
组合预测表示将帧内预测、帧间预测和当前画面参考中的至少两个进行组合的组合编码模式。在示例中,当组合预测被应用时,可基于帧内预测、帧间预测或当前画面参考中的任意一个来生成第一预测块,并且可基于帧内预测、帧间预测或当前画面参考中的另一个来生成第二预测块。当生成了第一预测块和第二预测块时,可通过计算第一预测块和第二预测块的平均值或加权和来生成最终预测块。可以以比特流用信号发送表示是否将组合预测应用于当前块的信息。该信息可以是1比特标志。
图4是示出编码块的各种分区类型的示图。
可基于四叉树分区、二叉树分区或三叉树分区将编码块分区为多个编码块。可基于四叉树分区、二叉树分区或三叉树分区将分区出的编码块再次分区为多个编码块。
四叉树分区表示将当前块分区为四个块的方法。作为四叉树分区的结果,当前块可被分区为四个正方形分区(参照图4(a)的“SPLIT_QT”)。
二叉树分区表示将当前块分区为两个块的方法。沿着垂直方向(即,使用穿过当前块的垂直线)将当前块分区为两个块的操作可被称为垂直方向二叉树分区,并且沿着水平方向(即,使用穿过当前块的水平线)将当前块分区为两个块的操作可被称为水平方向二叉树分区。作为二叉树分区的结果,当前块可被分区为两个非正方形分区。图4(b)的“SPLIT_BT_VER”是示出垂直方向二叉树分区的结果的示图,并且图4(c)的“SPLIT_BT_HOR”是示出水平方向二叉树分区的结果的示图。
三叉树分区表示将当前块分区为三个块的方法。沿着垂直方向(即,使用穿过当前块的两条垂直线)将当前块分区为三个块的操作可被称为垂直方向三叉树分区,并且沿着水平方向(即,使用穿过当前块的两条水平线)将当前块分区为三个块的操作可被称为水平方向三叉树分区。作为三叉树分区的结果,当前块可被分区为三个非正方形分区。就此而言,位于当前块的中心的分区的宽度/高度可以是其他分区的宽度/高度的两倍。图4(d)的“SPLIT_TT_VER”是示出垂直方向三叉树分区的结果的示图,而图4(e)的“SPLIT_TT_HOR”是示出水平方向三叉树分区的结果的示图。
CTU的分区次数可被定义为分区深度。CTU的最大分区深度可在序列级或画面级被确定。因此,CTU的最大分区深度可基于序列或画面而变化。
可选地,可针对每种分区方法独立地确定最大分区深度。在示例中,允许四叉树分区的最大分区深度可与允许二叉树分区和/或三叉树分区的最大分区深度不同。
编码器可以以比特流用信号发送表示当前块的分区类型和分区深度中的至少一个的信息。解码器可基于通过对比特流进行解析而获得的该信息来确定CTU的分区类型和分区深度。
图5是示出对CTU进行分区的方面的示例的示图。
通过使用四叉树分区、二叉树分区和/或三叉树分区来对编码块进行分区的操作可被称为多树分区。
通过应用多树分区对编码块进行分区而生成的编码块可被称为子编码块。当编码块的分区深度为k时,子编码块的分区深度被设置为k+1。
相反,对于分区深度为k+1的编码块,分区深度为k的编码块可被称为父编码块。
可基于父编码块的分区类型和邻近编码块的分区类型中的至少一个来确定当前编码块的分区类型。就此而言,邻近编码块可以是与当前编码块相邻的块,并且包括上方邻近块、左侧邻近块或与当前编码块的左上角相邻的邻近块中的至少一个。就此而言,所述分区类型可包括是否应用四叉树分区、是否应用二叉树分区、二叉树分区的方向、是否应用三叉树分区或三叉树分区的方向。
为了确定编码块的分区类型,可以以比特流用信号发送表示编码块是否被分区的信息。该信息是1比特标志“split_cu_flag”,并且当该标志为真时,它可表示编码块通过多树分区方法被分区。
当split_cu_flag为真时,可以以比特流用信号发送表示编码块是否通过四叉树分区被分区的信息。该信息是1比特标志split_qt_flag,并且当该标志为真时,编码块可被分区为四个块。
在示例中,在图5中所示的示例中,CTU通过四叉树分区被分区,并且因此生成分区深度为1的四个编码块。此外,示出了再次将四叉树分区应用于通过四叉树分区生成的四个编码块中的第一编码块和第四编码块。结果,可生成分区深度为2的四个编码块。
此外,通过再次将四叉树分区应用于分区深度为2的编码块,可生成分区深度为3的编码块。
当四叉树分区不被应用于编码块时,可根据编码块的尺寸、编码块是否位于画面边界、最大分区深度或邻近块的分区类型中的至少一个来确定是否针对编码块执行二叉树分区或三叉树分区。当确定针对编码块执行二叉树分区或三叉树分区时,可以以比特流用信号发送表示分区方向的信息。该信息可以是1比特标志mtt_split_cu_vertical_flag。可基于该标志确定分区方向是垂直方向还是水平方向。此外,可以以比特流用信号发送表示二叉树分区或三叉树分区中的哪一个被应用于编码块的信息。该信息可以是1比特标志mtt_split_cu_binary_flag。可基于该标志确定是二叉树分区被应用于编码块还是三叉树分区被应用于编码块。
在示例中,在图5中所示的示例中,垂直方向二叉树分区被应用于分区深度为1的编码块,垂直方向三叉树分区被应用于通过分区生成的编码块中的左侧编码块,并且垂直方向二叉树分区被应用于右侧编码块。
帧间预测是一种通过使用关于先前画面的信息对当前块进行预测的预测编码模式。在示例中,先前画面内的与当前块相同位置处的块(在下文中,同位块)可被设置为当前块的预测块。在下文中,基于当前块的同位块生成的预测块可被称为同位预测块。
相反,当存在于先前画面中的对象已移动到当前画面中的另一位置时,可通过使用对象的运动来有效地预测当前块。例如,当通过将先前画面与当前画面进行比较来确定对象的运动方向和尺寸时,可根据对象的运动信息生成当前块的预测块(或预测图像)。在下文中,通过使用运动信息生成的预测块可被称为运动预测块。
可通过从当前块减去预测块来生成残差块。就此而言,在对象移动的情况下,可通过使用运动预测块而不是使用同位预测块来减小残差块的能量,因此可提高残差块的压缩性能。
如上,通过使用运动信息生成预测块的操作可被称为运动估计预测。在大多数帧间预测中,可基于运动补偿预测来生成预测块。
运动信息可包括运动矢量、参考画面索引、预测方向和双向加权因子索引中的至少一个。运动矢量表示对象的运动方向和大小。参考画面索引指定参考画面列表中包括的参考画面中的当前块的参考画面。预测方向指示单向L0预测、单向L1预测或双向预测(L0预测和L1预测)中的任意一个。可根据当前块的预测方向使用L0方向运动信息和L1方向运动信息中的至少一个。双向加权因子索引指定应用于L0预测块的加权因子和应用于L1预测块的加权因子。
图6是根据本公开的实施例的帧间预测方法的流程图。
参照图6,帧间预测方法包括:确定针对当前块的帧间预测模式S601,根据所确定的帧间预测模式获得当前块的运动信息S602,并且基于所获得的运动信息执行针对当前块的运动补偿预测S603。
就此而言,帧间预测模式可表示用于确定当前块的运动信息的各种方法,并且包括使用平移运动信息的帧间预测模式、使用仿射运动信息的帧间预测模式。在示例中,使用平移运动信息的帧间预测模式可包括合并模式和运动矢量预测模式,并且使用仿射运动信息的帧间预测模式可包括仿射合并模式和仿射运动矢量预测模式。可基于与当前块邻近的邻近块或通过对比特流进行解析而获得的信息来确定关于当前块的运动信息。
可从另一块的运动信息推导当前块的运动信息。就此而言,另一块可以是在当前块之前通过帧间预测被编码/解码的块。将当前块的运动信息设置为与另一块的运动信息相同的操作可被定义为合并模式。此外,将另一块的运动矢量设置为当前块的运动矢量的预测值的操作可被定义为运动矢量预测模式。
图7是在合并模式下推导当前块的运动信息的处理的流程图。
可推导当前块的合并候选S701。可从在当前块之前通过帧间预测被编码/解码的块推导当前块的合并候选。
图8是示出用于推导合并候选的候选块的示图。
候选块可包括邻近块或非邻近块中的至少一个,其中,所述邻近块包括与当前块相邻的样点,所述非邻近块包括与当前块不相邻的样点。在下文中,确定候选块的样点被定义为基本样点。此外,与当前块相邻的基本样点被称作邻近基本样点,并且与当前块不相邻的基本样点被称作非邻近基本样点。
邻近基本样点可被包括在当前块的最左侧列的邻近列或当前块的最上方行的邻近行中。在示例中,当当前块的左上样点的坐标为(0,0)时,包括位置(-1,H-1)、(W-1,-1)、(W,-1)、(-1,H)或(-1,-1)处的基本样点的块中的至少一个可被用作候选块。参照示图,索引0至4的邻近块可被用作候选块。
非邻近基本样点表示距与当前块相邻的基本样点的x轴距离或y轴距离中的至少一个具有预定义值的样点。在示例中,包括距左基本样点的x轴距离是预定义值的基本样点的块、包括距上基本样点的y轴距离是预定义值的非邻近样点的块或者包括距左上基本样点的x轴距离和y轴距离是预定义值的非邻近样点的块中的至少一个块可被用作候选块。预定义值可以是诸如4、8、12、16等的自然数。参照附图,索引5至26的块中的至少一个块可被用作候选块。
可将不位于与邻近基本样点相同的垂直线、水平线或对角线上的样点设置为非邻近基本样点。
在下文中,候选块中的包括邻近基本样点的候选块被称为邻近块,并且包括非邻近基本样点的候选块被称为非邻近块。
当当前块与候选块之间的距离等于或大于阈值时,候选块可被设置为不可用作合并候选。可基于编码树单元的尺寸来确定所述阈值。在示例中,阈值可被设置为编码树单元的高度(ctu_height)或者将偏移与编码树单元的高度相加或从编码树单元的高度减去偏移而得到的值(ctu_height±N)。当偏移N是编码装置和解码装置中的预定义值时,它可被设置为4、8、16、32或ctu_height。
当当前块的y轴坐标与包括在候选块中的样点的y轴坐标之间的差大于阈值时,候选块可被确定为不可用作合并候选。
可选地,可将不属于与当前块相同的编码树单元的候选块设置为不可用作合并候选。在示例中,当基本样点在当前块所属的编码树单元的上边界之外时,包括该基本样点的候选块可被设置为不可用作合并候选。
当当前块的上边界与编码树单元的上边界邻接时,多个候选块可被确定为不可用作合并候选,所以当前块的编码/解码效率可能降低。为了解决这样的问题,可设置位于当前块的左侧的候选块的数量大于位于当前块的上方的候选块的数量。
图9是示出用于推导合并候选的候选块的示图。
如在图9中所示的示例中,属于当前块的上方的N个块行的上方块以及属于当前块的左侧的M个块列的左侧块可被设置为候选块。在这种情况下,可通过将M设置为大于N来将左侧候选块的数量设置为大于上方候选块的数量。
在示例中,当前块中的基本样点的y轴坐标与可被用作候选块的上方块的y轴坐标之间的差可被设置为不超过当前块的高度的N倍。此外,当前块中的基本样点的x轴坐标与可被用作候选块的左侧块的x轴坐标之间的差可被设置为不超过当前块的宽度的M倍。
在示例中,图9中所示的示例示出了属于当前块的上方的两个块行的块以及属于当前块的左侧的五个左侧块列的块被设置为候选块。
可从不同于当前块的画面中包括的时间邻近块推导合并候选。在示例中,可从同位画面中包括的同位块推导合并候选。参考画面列表中包括的参考画面中的任意一个可被设置为同位画面。可以以比特流用信号发送标识参考画面中的同位画面的索引信息。可选地,可将参考画面中的具有预定义索引的参考画面确定为同位画面。
合并候选的运动信息可被设置为与候选块的运动信息相同。在示例中,候选块的运动矢量、参考画面索引、预测方向或双向权重索引中的至少一个可被设置为合并候选的运动信息。
可生成包括合并候选的合并候选列表S702。
可根据预定顺序分配合并候选列表中的合并候选的索引。在示例中,可按照从左侧邻近块推导出的合并候选、从上方邻近块推导出的合并候选、从右上方邻近块推导出的合并候选、从左下方邻近块推导出的合并候选、从左上方邻近块推导出的合并候选和从时间邻近块推导出的合并候选的顺序分配索引。
当多个合并候选被包括在合并候选中时,可选择多个合并候选中的至少一个合并候选S703。具体地,可以以比特流用信号发送用于指定多个合并候选中的任意一个合并候选的信息。在示例中,可以以比特流用信号发送表示合并候选列表中包括的合并候选中的任意一个合并候选的索引的信息merge_idx。
当包括在合并候选列表中的合并候选的数量小于阈值时,包括在运动信息表中的运动信息候选可作为合并候选被添加到合并候选列表。就此而言,所述阈值可以是可被包括在合并候选列表中的合并候选的最大数量或者从所述合并候选的最大数量减去偏移的值。偏移可以是诸如1或2等的自然数。
运动信息表包括从当前画面中的基于帧间预测被编码/解码的块推导出的运动信息候选。在示例中,包括在运动信息表中的运动信息候选的运动信息可被设置为与基于帧间预测被编码/解码的块的运动信息相同。就此而言,运动信息可包括运动矢量、参考画面索引、预测方向或双向权重索引中的至少一个。
包括在运动信息表中的运动信息候选也可被称作帧间区域合并候选或预测区域合并候选。
可在编码器和解码器中预定义可被包括在运动信息表中的运动信息候选的最大数量。在示例中,可被包括在运动信息表中的运动信息候选的最大数量可以是1、2、3、4、5、6、7、8或更大(例如,16)。
可选地,可以以比特流用信号发送表示可被包括在运动信息表中的运动信息候选的最大数量的信息。可以以序列级、画面级或条带级用信号发送所述信息。所述信息可表示可被包括在运动信息表中的运动信息候选的最大数量。可选地,所述信息可表示可被包括在运动信息表中的运动信息候选的最大数量与可被包括在合并候选列表中的合并候选的最大数量之间的差。
可选地,可根据画面尺寸、条带尺寸或编码树单元尺寸来确定可被包括在运动信息表中的运动信息候选的最大数量。
运动信息表可以以画面、条带、并行块(tile)、分块(brick)、编码树单元或编码树单元线(行或列)为单位被初始化。在示例中,当条带被初始化时,运动信息表也被初始化,因此运动信息表可不包括任何运动信息候选。
可选地,可以以比特流用信号发送表示运动信息表是否将被初始化的信息。可在条带级、并行块级、分块级或块级用信号发送所述信息。可使用预配置的运动信息表,直到所述信息指示运动信息表的初始化为止。
可选地,关于初始运动信息候选的信息可在画面参数集或条带头中被用信号发送。尽管条带被初始化,但是运动信息表可包括初始运动信息候选。因此,可针对作为条带中的第一编码/解码目标的块使用初始运动信息候选。
可选地,可将包括在先前编码树单元的运动信息表中的运动信息候选设置为初始运动信息候选。在示例中,可将先前编码树单元的运动信息表中包括的运动信息候选中的具有最小索引或具有最大索引的运动信息候选设置为初始运动信息候选。
按照编码/解码顺序对块进行编码/解码,并且可按照编码/解码顺序将基于帧间预测被编码/解码的块顺序地设置为运动信息候选。
图10是解释运动信息表的更新方面的图。
对于当前块,当执行帧间预测S1001时,可基于当前块推导运动信息候选S1002。运动信息候选的运动信息可被设置为与当前块的运动信息相同。
当运动信息表为空时S1003,可将基于当前块推导出的运动信息候选添加到运动信息表S1004。
当运动信息表已包括运动信息候选S1003时,可执行针对当前块的运动信息(或基于当前块推导出的运动信息候选)的冗余校验S1005。冗余校验在于确定运动信息表中的预存储的运动信息候选的运动信息是否与当前块的运动信息相同。可针对运动信息表中的所有预存储的运动信息候选执行冗余校验。可选地,可针对运动信息表中的预存储的运动信息候选中的索引超过或低于阈值的运动信息候选执行冗余校验。可选地,可针对预定义数量的运动信息候选执行冗余校验。在示例中,可将具有最小索引或具有最大索引的2个运动信息候选确定为用于冗余校验的目标。
当不包括与当前块具有相同运动信息的运动信息候选时,可将基于当前块推导出的运动信息候选添加到运动信息表S1008。可基于运动信息候选的运动信息(例如,运动矢量/参考画面索引等)是否相同来确定运动信息候选是否相同。
就此而言,当最大数量的运动信息候选已被存储在运动信息表中时S1006,可删除最老的运动信息候选S1007,并且可将基于当前块推导出的运动信息候选添加到运动信息表S1008。就此而言,最老的运动信息候选可以是具有最大索引或最小索引的运动信息候选。
运动信息候选可由相应索引标识。当从当前块推导出的运动信息候选被添加到运动信息表时,可将最小索引(例如,0)分配给该运动信息候选,并且预存储的运动信息候选的索引可增加1。就此而言,当最大数量的运动信息候选已被存储在运动信息表中时,去除具有最大索引的运动信息候选。
可选地,当将从当前块推导出的运动信息候选添加到运动信息表时,可将最大索引分配给该运动信息候选。在示例中,当运动信息表中的预存储的运动信息候选的数量小于最大值时,可将与预存储的运动信息候选的数量具有相同的值的索引分配给该运动信息候选。可选地,当运动信息表中的预存储的运动信息候选的数量等于最大值时,可将从最大值减去1得到的索引分配给该运动信息候选。可选地,去除具有最小索引的运动信息候选,并且将其余的预存储的运动信息候选的索引减小1。
图11是示出运动信息表的更新方面的示图。
假设当将从当前块推导出的运动信息候选添加到运动信息表时,将最大索引分配给该运动信息候选。此外,假设最大数量的运动信息候选已被存储在运动信息表中。
当将从当前块推导出的运动信息候选HmvpCand[n+1]添加到运动信息表HmvpCandList时,可删除预存储的运动信息候选中的具有最小索引的运动信息候选HmvpCand[0],并且其余的运动信息候选的索引可减小1。此外,可将从当前块推导出的运动信息候选HmvpCand[n+1]的索引设置为最大值(对于图11中所示的示例,n)。
当预存储了与基于当前块推导出的运动信息候选相同的运动信息候选时S1005,可不将基于当前块推导出的运动信息候选添加到运动信息表S 1009。
可选地,在将基于当前块推导出的运动信息候选添加到运动信息表时,可去除与该运动信息候选相同的预存储的运动信息候选。在这种情况下,产生与预存储的运动信息候选的索引被重新更新时相同的效果。
图12是示出预存储的运动信息候选的索引被更新的示例的示图。
当与从当前块推导出的运动信息候选mvCand相同的预存储的运动信息候选的索引为hIdx时,可去除该预存储的运动信息候选,并且索引大于hIdx的运动信息候选的索引可减小1。在示例中,图12中所示的示例示出了在运动信息表HvmpCandList中删除与mvCand相同的HmvpCand[2],并且从HmvpCand[3]到HmvpCand[n]的索引减小1。
而且,可将基于当前块推导出的运动信息候选mvCand添加到运动信息表的末尾。
可选地,分配给与基于当前块推导出的运动信息候选相同的预存储的运动信息候选的索引可被更新。例如,可将预存储的运动信息候选的索引改变为最小值或最大值。
可将包括在预定区域中的块的运动信息设置为不被添加到运动信息表。在示例中,可不将基于包括在合并处理区域中的块的运动信息推导出的运动信息候选添加到运动信息表。由于针对包括在合并处理区域中的多个块的编码/解码顺序未被定义,因此将所述多个块中的任意一个块的运动信息用于所述多个块中的另一块的帧间预测是不合适的。因此,可不将基于包括在合并处理区域中的块推导出的运动信息候选添加到运动信息表。
可选地,可将小于预设尺寸的块的运动信息设置为不被添加到运动信息表。在示例中,可不将基于宽度或高度小于4或8的编码块的运动信息或者4×4尺寸的编码块的运动信息推导出的运动信息候选添加到运动信息表。
当基于每个子块执行运动补偿预测时,可基于当前块中包括的多个子块中的代表性子块的运动信息来推导运动信息候选。在示例中,当子块合并候选被用于当前块时,可基于子块中的代表性子块的运动信息来推导运动信息候选。
子块的运动矢量可按照以下顺序被推导。首先,可选择当前块的合并候选列表中包括的合并候选中的任意一个,并且可基于所选的合并候选的运动矢量推导初始移位矢量(shVector)。而且,可通过将初始移位矢量与编码块中的每个子块的基本样点(例如,左上样点或中心样点)的位置(xSb,ySb)相加来推导基本样点在位置(xColSb,yColSb)的移位子块。下面的方程式1示出用于推导移位子块的公式。
【方程式1】
(xColSb,yColSb)=(xSb+shVector[0]>>4,ySb+shVector[1]>>4)
然后,与包括(xColSb,yColSb)的子块的中心位置对应的同位块的运动矢量可被设置为包括(xSb,ySb)的子块的运动矢量。
代表性子块可表示包括当前块的左上样点、中心样点、右下样点、右上样点或左下样点的子块。
图13是示出代表性子块的位置的示图。
图13的(a)示出位于当前块的左上方的子块被设置为代表性子块的示例,并且图13的(b)示出位于当前块的中心的子块被设置为代表性子块的示例。当基于子块执行运动补偿预测时,可基于包括当前块的左上样点或包括当前块的中心样点的子块的运动矢量推导当前块的运动信息候选。
基于当前块的帧间预测模式,可确定当前块是否将被用作运动信息候选。在示例中,基于仿射运动模型被编码/解码的块可被设置为不可用作运动信息候选。因此,尽管通过帧间预测对当前块进行编码/解码,但是当当前块的帧间预测模式是仿射预测模式时,可不基于当前块更新运动信息表。
可选地,基于当前块的运动矢量分辨率、合并偏移编码方法是否被应用、组合预测是否被应用或者三角形分区是否被应用中的至少一个,可确定当前块是否将被用作运动信息候选。在示例中,在以下情况中的至少一个情况下,当前块可被设置为不可用作运动信息候选:当前块的运动信息分辨率等于或大于2整数像素的情况、组合预测被应用于当前块的情况、或者合并偏移编码方法被应用于当前块的情况。
可选地,可基于包括在基于仿射运动模型被编码/解码的块中的子块的至少一个子块矢量来推导运动信息候选。在示例中,可通过使用位于当前块的左上方、中心或右上方的子块来推导运动信息候选。可选地,可将多个子块的子块矢量的平均值设置为运动信息候选的运动矢量。
可选地,可基于根据仿射运动模型被编码/解码的块的仿射种子矢量的平均值来推导运动信息候选。在示例中,当前块的第一仿射种子矢量、第二仿射种子矢量或第三仿射种子矢量的至少一个平均值可被设置为运动信息候选的运动矢量。
可选地,可按帧间预测模式配置运动信息表。在示例中,可定义针对通过帧内块复制被编码/解码的块的运动信息表、针对基于平移运动模型被编码/解码的块的运动信息表以及针对基于仿射运动模型被编码/解码的块的运动信息表中的至少一个运动信息表。根据当前块的帧间预测模式,可选择多个运动信息表中的任意一个运动信息表。
图14示出按帧间预测模式生成运动信息表的示例。
当块基于非仿射运动模型被编码/解码时,可将基于该块推导出的运动信息候选mvCand添加到非仿射运动信息表HmvpCandList。另一方面,当块基于仿射运动模型被编码/解码时,可将基于以上模型推导出的运动信息候选mvAfCand添加到仿射运动信息表HmvpCandList。
上述块的仿射种子矢量可被存储在从基于仿射运动模型被编码/解码的块推导出的运动信息候选中。因此,该运动信息候选可被用作用于推导当前块的仿射种子矢量的合并候选。
可选地,可按运动矢量分辨率配置运动信息表。在示例中,用于存储运动矢量分辨率为1/16像素的运动信息的运动信息表、用于存储运动矢量分辨率为1/4像素的运动信息的运动信息表、用于存储运动矢量分辨率为1/2像素的运动信息的运动信息表、用于存储运动矢量分辨率为整数像素的运动信息的运动信息表或者用于存储运动矢量分辨率为4整数像素的运动信息的运动信息表中的至少一个运动信息表可被定义。
图15示出按运动矢量分辨率生成运动信息表的示例。
当块的运动矢量分辨率具有1/4像素时,块的运动信息mvCand可被存储在四分之一像素运动信息表HmvpQPCandList中。另一方面,当块的运动矢量分辨率具有整数像素时,块的运动信息mvCand可被存储在整数像素运动信息表HmvpIPCandList中。当块的运动矢量分辨率具有4整数像素时,块的运动信息mvCand可被存储在4整数像素运动信息表Hmvp4IPCandList中。
基于当前块的运动矢量分辨率,可通过选择运动信息表来推导当前块的合并候选。在示例中,当当前块的运动矢量分辨率为1/4像素时,可通过使用四分之一像素运动信息表HmvpQPCandList来推导当前块的合并候选。另一方面,当当前块的运动矢量分辨率是整数像素时,可通过使用整数像素运动信息表HmvpIPCandList来推导当前块的合并候选。
可选地,应用了合并偏移编码方法的块的运动信息可被存储在单独的运动信息表中。
图16示出应用了合并偏移编码方法的块的运动信息被存储在单独的运动信息表中的示例。
当合并偏移矢量编码方法未被应用于块时,块的运动信息mvCand可被存储在运动信息表HmvpCandList中。另一方面,当合并偏移矢量编码方法被应用于块时,块的运动信息mvCand可不被存储在运动信息表HmvpCandList中,而是可被存储在合并偏移运动信息表HmvpMMVDCandList中。
基于合并偏移矢量编码方法是否被应用于当前块,可选择运动信息表。在示例中,当合并偏移编码方法未被应用于当前块时,可通过使用运动信息表HmvpCandList来推导当前块的合并候选。另一方面,当合并偏移编码方法被应用于当前块时,可通过使用合并偏移运动信息表HmvpMMVDCandList来推导当前块的合并候选。
除了所描述的运动信息表之外,还可定义附加运动信息表。除了上述运动信息表(在下文中,被称作第一运动信息表)之外,还可定义长期运动信息表(在下文中,被称作第二运动信息表)。就此而言,长期运动信息表包括长期运动信息候选。
当第一运动信息表和第二运动信息表两者为空时,首先,可将运动信息候选添加到第二运动信息表。在可用于第二运动信息表的运动信息候选的数量达到最大数量之后,可将运动信息候选添加到第一运动信息表。
可选地,可将一个运动信息候选添加到第二运动信息表和第一运动信息表两者。
就此而言,填满的第二运动信息表可不再执行更新。可选地,当经过解码的区域在条带中超过预定比率时,可更新第二运动信息表。可选地,可每N条编码树单元线更新第二运动信息表。
另一方面,每当通过帧间预测生成了编码/解码块时,可更新第一运动信息表。但是,添加到第二运动信息表的运动信息候选可被设置为不被用于更新第一运动信息表。
可以以比特流用信号发送用于选择第一运动信息表或第二运动信息表中的任意一个的信息。当包括在合并候选列表中的合并候选的数量小于阈值时,包括在由所述信息指示的运动信息表中的运动信息候选可作为合并候选被添加到合并候选列表。
可选地,可基于当前块的尺寸、当前块的形状、当前块的帧间预测模式、双向预测是否被应用于当前块、运动矢量是否被修正或者三角形分区是否被应用于当前块来选择运动信息表。
可选地,当即使包括在第一运动信息表中的运动信息候选被添加,包括在合并候选列表中的合并候选的数量也小于最大数量时,还可将包括在第二运动信息表中的运动信息候选添加到合并候选列表。
图17是示出将包括在长期运动信息表中的运动信息候选添加到合并候选列表的示例的示图。
在包括在合并候选列表中的合并候选的数量小于最大数量的情况下,可将包括在第一运动信息表HmvpCandList中的运动信息候选添加到合并候选列表。当即使包括在第一运动信息表中的运动信息候选被添加到合并候选列表,包括在合并候选列表中的合并候选的数量也小于最大数量时,还可将包括在长期运动信息表HmvpLTCandList中的运动信息候选添加到合并候选列表。
运动信息候选可被设置为包括除了运动信息之外的附加信息。在示例中,块的尺寸、形状或分区信息中的至少一个可被另外存储在运动信息候选中。当配置当前块的合并候选列表时,可仅使用运动信息候选中的尺寸、形状或分区信息与当前块相同或相似的运动信息候选,或者可将尺寸、形状或分区信息与当前块相同或相似的运动信息候选预先添加到合并候选列表。可选地,可按块尺寸、形状或分区信息生成运动信息表。可通过使用多个运动信息表中的与当前块的形状、尺寸或分区信息匹配的运动信息表来配置当前块的合并候选列表。
当包括在当前块的合并候选列表中的合并候选的数量小于阈值时,包括在运动信息表中的运动信息候选可作为合并候选被添加到合并候选列表。按照按升序或降序反映运动信息候选的索引的排序的顺序执行附加处理。在示例中,首先可将具有最大索引的运动信息候选添加到当前块的合并候选列表。
当包括在运动信息表中的运动信息候选被添加到合并候选列表时,可执行运动信息候选与合并候选列表中的预存储的合并候选之间的冗余校验。作为冗余校验的结果,可不将与预存储的合并候选具有相同的运动信息的运动信息候选添加到合并候选列表。
可仅针对包括在运动信息表中的运动信息候选中的一部分运动信息候选执行冗余校验。在示例中,可仅针对索引超过或低于阈值的运动信息候选执行冗余校验。可选地,可仅针对具有最大索引或最小索引的N个运动信息候选执行冗余校验。可选地,可仅针对合并候选列表中的预存储的合并候选中的一部分合并候选执行冗余校验。在示例中,可仅针对索引超过或低于阈值的合并候选或从特定位置处的块推导出的合并候选执行冗余校验。就此而言,特定位置可包括当前块的左侧邻近块、上方邻近块、右上方邻近块或左下方邻近块中的至少一个。
图18是示出仅针对一部分合并候选执行冗余校验的示例的示图。
当运动信息候选HmvpCand[j]被添加到合并候选列表时,可针对运动信息候选执行对具有最大索引的2个合并候选mergeCandList[NumMerge-2]和mergeCandList[NumMerge-1]的冗余校验。就此而言,NumMerge可示出可用空间合并候选和时间合并候选的数量。
不同于所示的示例,当运动信息候选HmvpCand[j]被添加到合并候选列表时,可针对运动信息候选执行对具有最小索引的2个合并候选的冗余校验。例如,可检查mergeCandList[0]和mergeCandList[1]是否与HmvpCand[j]相同。
可选地,可仅针对从特定位置推导出的合并候选执行冗余校验。在示例中,可针对从位于当前块的左侧或当前块的上方的邻近块推导出的合并候选中的至少一个执行冗余校验。当在合并候选列表中不存在从特定位置推导出的合并候选时,可在不进行冗余校验的情况下将运动信息候选添加到合并候选列表。
当运动信息候选HmvpCand[j]被添加到合并候选列表时,可针对运动信息候选执行对具有最大索引的2个合并候选mergeCandList[NumMerge-2]和mergeCandList[NumMerge-1]的冗余校验。就此而言,NumMerge可示出可用空间合并候选和时间合并候选的数量。
可仅针对运动信息候选中的一部分运动信息候选执行对合并候选的冗余校验。在示例中,可仅针对运动信息表中包括的运动信息候选中的具有大索引或最小索引的N个运动信息候选执行冗余校验。在示例中,可仅针对具有包括在运动信息表中的运动信息候选的编号和差低于阈值的索引的运动信息候选执行冗余校验。当所述阈值为2时,可仅针对运动信息表中包括的运动信息候选中的具有最大索引值的3个运动信息候选执行冗余校验。对于除了上述3个运动信息候选之外的运动信息候选,可省略冗余校验。当省略冗余校验时,可将运动信息候选添加到合并候选列表,而不管是否存在与合并候选相同的运动信息。
相反,将冗余校验设置为仅针对具有包括在运动信息表中的运动信息候选的编号和差超过所述阈值的索引的运动信息候选来执行。
可在编码器和解码器中重新定义执行冗余校验的运动信息候选的数量。在示例中,所述阈值可以是诸如0、1或2的整数。
可选地,可基于包括在合并候选列表中的合并候选的数量或包括在运动信息表中的运动信息候选的数量中的至少一个来确定所述阈值。
当发现与第一运动信息候选相同的合并候选时,可在针对第二运动信息候选的冗余校验中省略对与第一运动信息候选相同的合并候选的冗余校验。
图19是示出省略对特定合并候选的冗余校验的示例的示图。
当索引为i的运动信息候选HmvpCand[i]被添加到合并候选列表时,执行该运动信息候选与合并候选列表中的预存储的合并候选之间的冗余校验。就此而言,当发现与运动信息候选HmvpCand[i]相同的合并候选mergeCandlist[j]时,可在不将运动信息候选HmvpCand[i]添加到合并候选列表的情况下执行索引为i-1的运动信息候选HmvpCand[i-1]与合并候选之间的冗余校验。就此而言,可省略运动信息候选HmvpCand[i-1]与合并候选mergeCandList[j]之间的冗余校验。
在示例中,在图19中所示的示例中,确定HmvpCand[i]和mergeCandList[2]相同。因此,可在不将HmvpCand[i]添加到合并候选列表的情况下执行针对HmvpCand[i-1]的冗余校验。就此而言,可省略HmvpCand[i-1]与mergeCandList[2]之间的冗余校验。
当包括在当前块的合并候选列表中的合并候选的数量小于阈值时,除了运动信息候选之外,可另外包括成对合并候选或零合并候选中的至少一个。成对合并候选表示具有从对多于2个合并候选的运动矢量求平均而获得的值作为运动矢量的合并候选,并且零合并候选表示运动矢量为0的合并候选。
对于当前块的合并候选列表,可按照以下顺序添加合并候选。
空间合并候选-时间合并候选-运动信息候选-(仿射运动信息候选)-成对合并候选-零合并候选
空间合并候选表示从邻近块或非邻近块中的至少一个推导出的合并候选,并且时间合并候选表示从先前参考画面推导出的合并候选。仿射运动信息候选表示从通过仿射运动模型被编码/解码的块推导出的运动信息候选。
可在运动矢量预测模式下使用运动信息表。在示例中,当包括在当前块的运动矢量预测候选列表中的运动矢量预测候选的数量小于阈值时,包括在运动信息表中的运动信息候选可被设置为针对当前块的运动矢量预测候选。具体地,运动信息候选的运动矢量可被设置为运动矢量预测候选。
如果包括在当前块的运动矢量预测候选列表中的运动矢量预测候选中的任意一个被选择,则可将所选的候选设置为当前块的运动矢量预测因子。然后,在对当前块的运动矢量残差值进行解码之后,可通过将运动矢量预测因子和运动矢量残差值相加来获得当前块的运动矢量。
可按照以下顺序配置当前块的运动矢量预测候选列表。
空间运动矢量预测候选-时间运动矢量预测候选-运动信息候选-(仿射运动信息候选)-零运动矢量预测候选
空间运动矢量预测候选表示从邻近块或非邻近块中的至少一个推导出的运动矢量预测候选,并且时间运动矢量预测候选表示从先前参考画面推导出的运动矢量预测候选。仿射运动信息候选表示从通过仿射运动模型被编码/解码的块推导出的运动信息候选。零运动矢量预测候选表示运动矢量的值为0的候选。
大于编码块的合并处理区域可被定义。合并处理区域中包括的编码块可被并行地处理,而不被顺序地编码/解码。就此而言,不被顺序地编码/解码表示编码/解码的顺序未被定义。因此,可独立地对合并处理区域中包括的块的编码/解码处理进行处理。可选地,包括在合并处理区域中的块可共享合并候选。就此而言,可基于合并处理区域推导合并候选。
根据上述特征,合并处理区域可被称为并行处理区域、共享合并区域(SMR)或合并估计区域(MER)。
可基于编码块推导当前块的合并候选。然而,当当前块被包括在大于当前块的合并处理区域中时,包括在与当前块相同的合并处理区域中的候选块可被设置为不可用作合并候选。
图20是示出包括在与当前块相同的合并处理区域中的候选块被设置为不可用作合并候选的示例的示图。
在图20的(a)中所示的示例中,在CU5的编码/解码中,包括与CU5相邻的基本样点的块可被设置为候选块。就此而言,包括在与CU5相同的合并处理区域中的候选块x3和x4可被设置为不可用作CU5的合并候选。但是,未包括在与CU5相同的合并处理区域中的候选块x0、x1和x2可被设置为可用作合并候选。
在图23的(b)中所示的示例中,在CU8的编码/解码中,包括与CU8相邻的基本样点的块可被设置为候选块。就此而言,包括在与CU8相同的合并处理区域中的候选块x6、x7和x8可被设置为不可用作合并候选。然而,未包括在与CU8相同的合并处理区域中的候选块x5和x9可被设置为可用作合并候选。
可选地,当当前块被包括在合并处理区域中时,可将与当前块和合并处理区域相邻的邻近块设置为候选块。
图21是示出当当前块被包括在合并处理区域中时推导针对当前块的合并候选的示例的示图。
如在图21的(a)所示的示例中,与当前块相邻的邻近块可被设置为用于推导当前块的合并候选的候选块。就此而言,包括在与当前块相同的合并处理区域中的候选块可被设置为不可用作合并候选。在示例中,在推导针对编码块CU3的合并候选时,包括在与编码块CU3相同的合并处理区域中的上方邻近块y3和右上方邻近块y4可被设置为不可用作编码块CU3的合并候选。
通过按照预定义顺序对与当前块相邻的邻近块进行扫描,可推导合并候选。在示例中,所述预定义顺序可以是y1、y3、y4、y0和y2的顺序。
当可从与当前块相邻的邻近块推导的合并候选的数量小于从合并候选的最大数量减去偏移的值或所述最大数量时,可如图21的(b)中所示的示例通过使用与合并处理区域相邻的邻近块来推导针对当前块的合并候选。在示例中,与包括编码块CU3的合并处理区域相邻的邻近块可被设置为针对编码块CU3的候选块。就此而言,与合并处理区域相邻的邻近块可包括左侧邻近块x1、上方邻近块x3、左下方邻近块x0、右上方邻近块x4或左上方邻近块x2中的至少一个。
通过按照预定义顺序对与合并处理区域相邻的邻近块进行扫描,可推导合并候选。在示例中,所述预定义顺序可以是x1、x3、x4、x0和x2的顺序。
总之,可通过按照以下扫描顺序对候选块进行扫描来推导针对包括在合并处理区域中的编码块CU3的合并候选。
(y1,y3,y4,y0,y2,x1,x3,x4,x0,x2)
但是,上面示出的候选块的扫描顺序仅示出了本公开的示例,并且可按照与以上示例不同的顺序对候选块进行扫描。可选地,可基于当前块或合并处理区域的尺寸或形状中的至少一个来自适应地确定扫描顺序。
合并处理区域可以是正方形或非正方形的。可以以比特流用信号发送用于确定合并处理区域的信息。该信息可包括表示合并处理区域的形状的信息或表示合并处理区域的尺寸的信息中的至少一个。当合并处理区域是非正方形时,可以以比特流用信号发送表示合并处理区域的尺寸的信息、表示合并处理区域的宽度或高度的信息或者表示合并处理区域的宽高比的信息中的至少一个。
可基于以比特流用信号发送的信息、画面分辨率、条带的尺寸或并行块的尺寸中的至少一个来确定合并处理区域的尺寸。
如果针对包括在合并处理区域中的块执行运动补偿预测,则可将基于被执行运动补偿预测的块的运动信息推导出的运动信息候选添加到运动信息表。
但是,如果从包括在合并处理区域中的块推导出的运动信息候选被添加到运动信息表,则可能发生在对合并处理区域中的编码/解码实际上比该块慢的其它块的编码/解码中使用从该块推导出的运动信息候选的情况。换句话说,虽然应该在合并处理区域中包括的块的编码/解码中排除块之间的依赖性,但是可能发生通过使用合并处理区域中包括的其他块的运动信息来执行运动预测补偿的情况。为了解决这样的问题,虽然完成了对合并处理区域中包括的块的编码/解码,但是可不将完成了编码/解码的块的运动信息添加到运动信息表。
可选地,可通过仅使用合并处理区域中的预定义位置处的块来更新运动信息表。预定义位置可包括合并处理区域中的左上方位置处的块、右上方位置处的块、左下方位置处的块、右下方位置处的块、中心位置处的块、与右边界相邻的块或与下边界相邻的块中的至少一个。在示例中,可在运动信息表中仅更新与合并处理区域中的右下角相邻的块的运动信息,并且可不在运动信息表中更新其它块的运动信息。
可选地,在包括在合并处理区域中的所有块都被解码之后,可将从所述块推导出的运动信息候选添加到运动信息表。换句话说,虽然包括在合并处理区域中的块被编码/解码,但可不更新运动信息表。
在示例中,如果针对合并处理区域中包括的块执行运动补偿预测,则可按照预定义顺序将从所述块推导出的运动信息候选添加到运动信息表。就此而言,可按照合并处理区域或编码树单元中的编码块的扫描顺序来确定所述预定义顺序。扫描顺序可以是光栅扫描、水平扫描、垂直扫描或Z字形扫描中的至少一个。可选地,可基于每个块的运动信息或具有相同运动信息的块的数量来确定所述预定义顺序。
可选地,包括单向运动信息的运动信息候选可在包括双向运动信息的运动信息候选之前被添加到运动信息表。相反,包括双向运动信息的运动信息候选可在包括单向运动信息的运动信息候选之前被添加到运动信息表。
可选地,可按照在合并处理区域或编码树单元中高使用频率或低使用频率的顺序将运动信息候选添加到运动信息表。
当当前块被包括在合并处理区域中且包括在当前块的合并候选列表中的合并候选的数量小于最大数量时,可将包括在运动信息表中的运动信息候选添加到合并候选列表。就此而言,可将从包括在与当前块相同的合并处理区域中的块推导出的运动信息候选设置为不被添加到当前块的合并候选列表。
可选地,当当前块被包括在合并处理区域中时,可设置为不使用包括在运动信息表中的运动信息候选。换句话说,虽然包括在当前块的合并候选列表中的合并候选的数量小于最大数量,但是可不将包括在运动信息表中的运动信息候选添加到合并候选列表。
在另一示例中,可配置关于合并处理区域或编码树单元的运动信息表。这个运动信息表起到临时存储合并处理区域中包括的块的运动信息的作用。为了将一般运动信息表与针对合并处理区域或编码树单元的运动信息表区分开,针对合并处理区域或编码树单元的运动信息表被称为临时运动信息表。而且,存储在临时运动信息表中的运动信息候选被称为临时运动信息候选。
图22是示出临时运动信息表的示图。
可配置针对编码树单元或合并处理区域的临时运动信息表。当对包括在编码树单元或合并处理区域中的当前块执行运动补偿预测时,可不将该块的运动信息添加到运动信息表HmvpCandList。作为替代,可将从该块推导出的临时运动信息候选添加到临时运动信息表HmvpMERCandList。换句话说,添加到临时运动信息表的临时运动信息候选可不被添加到运动信息表。因此,运动信息表可不包括基于包括当前块的编码树单元或合并处理区中所包括的块的运动信息推导出的运动信息候选。
可选地,可仅将合并处理区域中包括的块中的一些块的运动信息添加到临时运动信息表。在示例中,仅合并处理区域中的预定义位置处的块可被用于更新运动信息表。预定义位置可包括合并处理区域中的左上方位置处的块、右上方位置处的块、左下方位置处的块、右下方位置处的块、中心位置处的块、与右边界相邻的块和与下边界相邻的块中的至少一个。在示例中,可仅将与合并处理区域中的右下角相邻的块的运动信息添加到临时运动信息表,并且可不将其它块的运动信息添加到临时运动信息表。
临时运动信息表可包括的临时运动信息候选的最大数量可被设置为等于运动信息候选的最大数量。可选地,可根据编码树单元或合并处理区域的尺寸来确定临时运动信息表可包括的临时运动信息候选的最大数量。可选地,可将临时运动信息表可包括的临时运动信息候选的最大数量设置为小于运动信息表可包括的运动信息候选的最大数量。
包括在编码树单元或合并处理区域中的当前块可被设置为不使用关于对应的编码树单元或合并处理区域的临时运动信息表。换句话说,当包括在当前块的合并候选列表中的合并候选的数量小于阈值时,可将包括在运动信息表中的运动信息候选添加到合并候选列表,并且可不将包括在临时运动信息表中的临时运动信息候选添加到合并候选列表。因此,包括在与当前块相同的编码树单元或相同的合并处理区域中的其他块的运动信息可不被用于当前块的运动补偿预测。
如果完成了对编码树单元或合并处理区域中包括的所有块的编码/解码,则可使运动信息表和临时运动信息表一致。
图23是示出使运动信息表和临时运动信息表一致的示例的示图。
如果完成了对包括在编码树单元或合并处理区域中的所有块的编码/解码,则如在图23中所示的示例中,可在运动信息表中更新包括在临时运动信息表中的临时运动信息候选。
就此而言,包括在临时运动信息表中的临时运动信息候选可按照插入在临时运动信息表中的顺序(换句话说,按照索引值的升序或降序)被添加到运动信息表。
在另一示例中,包括在临时运动信息表中的临时运动信息候选可按照预定义顺序被添加到运动信息表。就此而言,可按照合并处理区域或编码树单元中的编码块的扫描顺序来确定所述预定义顺序。扫描顺序可以是光栅扫描、水平扫描、垂直扫描或Z字形扫描中的至少一个。可选地,可基于每个块的运动信息或具有相同运动信息的块的数量来确定所述预定义顺序。
可选地,包括单向运动信息的临时运动信息候选可在包括双向运动信息的临时运动信息候选之前被添加到运动信息表。相反,包括双向运动信息的临时运动信息候选可在包括单向运动信息的临时运动信息候选之前被添加到运动信息表。
可选地,可按照在合并处理区域或编码树单元中高使用频率或低使用频率的顺序将临时运动信息候选添加到运动信息表。
在包括在临时运动信息表中的临时运动信息候选被添加到运动信息表的情况下,可执行针对临时运动信息候选的冗余校验。在示例中,当与包括在临时运动信息表中的临时运动信息候选相同的运动信息候选被预存储在运动信息表中时,可不将该临时运动信息候选添加到运动信息表。就此而言,可针对包括在运动信息表中的运动信息候选中的一部分运动信息候选执行冗余校验。在示例中,可针对索引超过或低于阈值的运动信息候选执行冗余校验。在示例中,当临时运动信息候选等于索引高于预定义值的运动信息候选时,可不将该临时运动信息候选添加到运动信息表。
这可限制将从与当前块相同的编码树单元或相同的合并处理区域中包括的块推导出的运动信息候选用作当前块的合并候选。为此,可针对运动信息候选另外存储块的地址信息。块的地址信息可包括块的位置、块的地址、块的索引、包括块的合并处理区域的位置、包括块的合并处理区域的地址、包括块的合并处理区域的索引、包括块的编码树区域的位置、包括块的编码树区域的地址或包括块的编码树区域的索引中的至少一个。
可将编码块分区为多个预测单元,并且可针对分区出的预测单元中的每个预测单元执行预测。在这种情况下,预测单元表示用于执行预测的基本单元。
可通过使用垂直线、水平线、斜线或对角线中的至少一个来对编码块进行分区。由分区线分区出的预测单元可具有诸如三角形、四边形、梯形或五边形的形状。在示例中,编码块可被分区为两个三角形预测单元、两个梯形预测单元、两个四边形预测单元、或者一个三角形预测单元和一个五边形预测单元。
可以以比特流用信号发送用于确定对编码块进行分区的线的数量、角度或位置中的至少一个的信息。在示例中,可以以比特流用信号发送表示编码块的分区类型候选中的一个分区类型候选的信息,或者可以以比特流用信号发送指定对编码块进行分区的多个线候选中的一个线候选的信息。在示例中,可以以比特流用信号发送指示多个线候选中的一个线候选的索引信息。
对于多个候选线中的每个候选线,角度或位置中的至少一个可不同。可基于当前块的尺寸或形状、可用合并候选的数量或者特定位置处的邻近块是否可用作合并候选来确定可用于当前块的线候选的数量。
可选地,可以以比特流用信号发送用于确定线候选的数量或类型的信息。在示例中,可通过使用1比特标志来确定角度比对角线大的斜线和/或角度比对角线小的斜线是否可用作线候选。可在序列级、画面级或序列级用信号发送所述信息。
可选地,基于编码块的帧内预测模式或帧间预测模式、可用合并候选的位置或邻近块的分区类型中的至少一个,可自适应地确定对编码块进行分区的线的数量、角度或位置中的至少一个。
当编码块被分区为多个预测单元时,可针对每个分区出的预测单元执行帧内预测或帧间预测。
图24是示出通过使用对角线将编码块分区为多个预测单元的示例的示图。
如在图24的(a)和(b)中所示的示例中,可通过使用对角线将编码块分区为两个三角形预测单元。
图24的(a)和(b)示出了通过使用连接编码块的两个顶点的对角线将编码块分区为两个预测单元。但是,可通过使用线的至少一端不穿过编码块的顶点的斜线将编码块分区为两个预测单元。
图25是示出编码块被分区为两个预测单元的示例的示图。
如在图25的(a)和(b)中所示的示例中,可通过使用两端分别邻接编码块的上边界和下边界的斜线将编码块分区为两个预测单元。
可选地,如在图25的(c)和(d)中所示的示例中,可通过使用两端分别邻接编码块的左边界和右边界的斜线将编码块分区为两个预测单元。
可选地,可将编码块分区为具有不同尺寸的两个预测单元。在示例中,可通过将对编码块进行分区的斜线设置为与形成一个顶点的两个边界相交来将编码块分区为具有不同尺寸的两个预测单元。
图26示出编码块被分区为多个不同尺寸的预测块的示例。
如在图26的(a)和(b)中所示的示例中,可通过将连接编码块的左上方和右下方的对角线设置为穿过编码块的左边界、右边界、上边界或下边界而不是左上角或右下角来将编码块分区为具有不同尺寸的两个预测单元。
可选地,如在图26的(c)和(d)中所示的示例中,可通过将连接编码块的右上方和左下方的对角线设置为穿过编码块的左边界、右边界、上边界或下边界而不是左上角或右下角来将编码块分区为具有不同尺寸的两个预测单元。
通过对编码块进行分区而生成的预测单元中的每个预测单元被称为“第N预测单元”。在示例中,在图24至图26中所示的示例中,PU1可被定义为第一预测单元,并且PU2可被定义为第二预测单元。第一预测单元可表示包括编码块中的左下方位置处的样点或左上方位置处的样点的预测单元,并且第二预测单元可表示包括编码块中的右上方位置处的样点或右下方位置处的样点的预测单元。
相反地,包括编码块中的右上方位置处的样点或右下方位置处的样点的预测单元可被定义为第一预测单元,并且包括编码块中的左下方位置处的样点或左上方位置处的样点的预测单元可被定义为第二预测单元。
当通过使用水平线、垂直线、对角线或斜线对编码块进行分区时,这可被称为预测单元分区。通过应用预测单元分区而生成的预测单元可根据其形状被称为三角形预测单元、四边形预测单元或五边形预测单元。
在下面的实施例中,将假设通过使用对角线对编码块进行分区。具体地,当通过使用对角线将编码块分区为两个预测单元时,这被称为对角线分区或三角形分区。但是,即使当通过使用与垂直线、水平线或对角线具有不同的角度的斜线来对编码块进行分区时,也可根据下述实施例对预测单元进行编码/解码。换句话说,与下面描述的三角形预测单元的编码/解码相关的事项也可被应用于四边形预测单元或五边形预测单元的编码/解码。
可基于条带类型、可被包括在合并候选列表中的合并候选的最大数量、编码块的尺寸、编码块的形状、编码块的预测编码模式或父节点的分区方面中的至少一个来确定预测单元分区是否将被应用于编码块。
在示例中,可基于当前条带是否为B类型来确定预测单元分区是否将被应用于编码块。仅当当前条带为B类型时,可允许预测单元分区。
可选地,可基于包括在合并候选列表中的合并候选的最大数量是否等于或大于2来确定预测单元分区是否将被应用于编码块。仅当包括在合并候选列表中的合并候选的最大数量等于或大于2时,可允许预测单元分区。
可选地,当宽度或高度中的至少一个大于64时,在64×64尺寸的数据处理单元被冗余地访问的硬件的实现期间可能出现缺点。因此,当编码块的宽度或高度中的至少一个大于阈值时,可不允许将编码块分区为多个预测单元。在示例中,当编码块的宽度或高度中的至少一个大于64时(例如,当宽度或高度中的至少一个为128时),可不使用预测单元分区。
可选地,通过考虑可由实现的硬件同时处理的样点的最大数量,可不允许预测单元分区用于样点的数量大于阈值的编码块。在示例中,可不允许预测单元分区用于样点的数量大于4096的编码树块。
可选地,可不允许预测单元分区用于包括在编码块中的样点的数量小于阈值的编码块。在示例中,当包括在编码块中的样点的数量小于64时,可将预测单元分区设置为不被应用于编码块。
可选地,可基于编码块的宽高比是否小于第一阈值或者编码块的宽高比是否大于第二阈值中的至少一个来确定预测单元分区是否将被应用于编码块。在这种情况下,如以下方程式2中所示,编码块的宽高比whRatio可被确定为编码块的宽度CbW和高度CbH的比率。
【方程式2】
whRatio=abs(Log2(CbW/CbH))
可选地,当编码块的宽高比小于第一阈值或大于第二阈值时,预测单元分区可被应用于编码块。在示例中,当第一阈值为4时,可不允许预测单元分区用于64×4或4×64尺寸的编码块。
可选地,基于父节点的分区类型,可确定是否允许预测单元分区。在示例中,当基于四叉树分区对编码块、父节点进行分区时,预测单元分区可被应用于编码块、叶节点。另一方面,当基于二叉树或三叉树分区对编码块、父节点进行分区时,可将预测单元分区设置为不可允许用于编码块、叶节点。
可选地,基于编码块的预测编码模式,可确定是否允许预测单元分区。在示例中,仅当通过帧内预测对编码块进行编码时,当通过帧间预测对编码块进行编码时,或者当通过预定义的帧间预测模式对编码块进行编码时,可允许预测单元分区。在这种情况下,预定义的帧间预测模式可包括合并模式、运动矢量预测模式、仿射合并模式或仿射运动矢量预测模式中的至少一个。
可选地,基于并行处理区域的尺寸,可确定是否允许预测单元分区。在示例中,当编码块的尺寸大于并行处理区域的尺寸时,可不使用预测单元分区。
通过考虑上面列举的状况中的两个或更多个,可确定预测单元分区是否将被应用于编码块。
在另一示例中,可以以比特流用信号发送表示预测单元分区是否将被应用于编码块的信息。可在序列级、画面级、条带级或块级用信号发送所述信息。例如,表示预测单元分区是否被应用于编码块的标志triangle_partition_flag可在编码块级被用信号发送。
当确定将预测单元分区应用于编码块时,可以以比特流用信号发送表示对编码块进行分区的线的数量或线的位置的信息。
在示例中,当编码块由对角线分区时,可以以比特流用信号发送表示对编码块进行分区的对角线的方向的信息。在示例中,可以以比特流用信号发送表示对角线的方向的标志triangle_partition_type_flag。该标志表示编码块是否由连接左上方和右下方的对角线分区,或者编码块是否由连接右上方和左下方的对角线分区。当编码块由连接左上方和右下方的对角线分区时,这可被称为左侧三角形分区类型,并且当编码块由连接右上方和左下方的对角线分区时,这可被称为右侧三角形分区类型。在示例中,当所述标志的值为0时,这可表示编码块的分区类型为左侧三角形分区类型,并且当所述标志的值为1时,这可表示编码块的分区类型为右侧三角形分区类型。
此外,可以以比特流用信号发送表示预测单元的尺寸是否相同的信息或表示对编码块进行分区的对角线的位置的信息。在示例中,当表示预测单元的尺寸的信息表示预测单元的尺寸相同时,可省略对表示对角线的位置的信息的编码,并且可通过使用穿过编码块的两个顶点的对角线来将编码块分区为两个预测单元。另一方面,当表示预测单元的尺寸的信息表示预测单元的尺寸不相同时,可基于表示对角线的位置的信息来确定对编码块进行分区的对角线的位置。在示例中,当左侧三角形分区类型被应用于编码块时,位置信息可表示对角线是否与编码块的左边界和下边界相交或者对角线是否与上边界和右边界相交。可选地,当右侧三角形分区类型被应用于编码块时,位置信息可表示对角线是否与编码块的右边界和下边界相交或者对角线是否与上边界和左边界相交。
可在编码块级用信号发送表示编码块的分区类型的信息。因此,可按应用了预测单元分区的编码块来确定分区类型。
在另一示例中,可用信号发送表示针对序列、画面、条带、并行块或编码树单元的分区类型的信息。在这种情况下,可将序列、画面、条带、并行块或编码树单元中的应用对角线分区的编码块的分区类型设置为相同。
可选地,用于确定在编码树单元中应用预测单元分区的第一编码单元的分区类型的信息可被编码并被用信号发送,并且可将第二个或稍后应用预测单元分区的编码单元设置为使用与第一编码单元相同的分区类型。
在另一示例中,编码块的分区类型可基于邻近块的分区类型而被确定。在这种情况下,邻近块可包括与编码块的左上角相邻的邻近块、与右上角相邻的邻近块、与左下角相邻的邻近块、位于上方的邻近块或位于左侧的邻近块中的至少一个。在示例中,可将当前块的分区类型设置为与邻近块的分区类型相同。可选地,可基于左侧三角形分区类型是否被应用于左上方邻近块或者右侧三角形分区类型是否被应用于右上方邻近块或左下方邻近块来确定当前块的分区类型。
为了针对第一预测单元和第二预测单元执行运动预测补偿,可推导第一预测单元和第二预测单元中的每一个的运动信息。在这种情况下,可从包括在合并候选列表中的合并候选推导第一预测单元和第二预测单元的运动信息。为了在一般合并候选列表与用于推导预测单元的运动信息的合并候选列表之间进行区分,用于推导预测单元的运动信息的合并候选列表被称为分区模式合并候选列表或三角形合并候选列表。此外,分区模式合并候选列表中包括的合并候选被称为分区模式合并候选或三角形合并候选。但是,应用上述推导合并候选的方法和上述构建合并候选列表的方法以推导分区模式合并候选并构建分区模式合并候选列表的操作也被包括在本公开的范围中。
可以以比特流用信号发送用于确定可被包括在分区模式合并候选列表中的分区模式合并候选的最大数量的信息。所述信息可表示可被包括在合并候选列表中的合并候选的最大数量与可被包括在分区模式合并候选列表中的分区模式合并候选的最大数量之间的差。
可从编码块的空间邻近块和时间邻近块推导分区模式合并候选。
图27是示出用于推导分区模式合并候选的邻近块的示图。
可通过使用位于编码块的上方的邻近块、位于编码块的左侧的邻近块或包括在与编码块不同的画面中的同位块中的至少一个来推导分区模式合并候选。上方邻近块可包括以下块中的至少一个:包括位于编码块的上方的样点(xCb+CbW-1,yCb-1)的块、包括位于编码块的上方的样点(xCb+CbW,yCb-1)的块或包括位于编码块的上方的样点(xCb-1,yCb-1)的块。左侧邻近块可包括以下块中的至少一个:包括位于编码块的左侧的样点(xCb-1,yCb+CbH-1)的块或包括位于编码块的左侧的样点(xCb-1,yCb+CbH)的块。同位块可被确定为同位画面中的包括与编码块的右上角相邻的样点(xCb+CbW,yCb+CbH)的块或包括位于编码块的中心的样点(xCb/2,yCb/2)的块中的一个。
可按照预定义顺序搜索邻近块,并且分区模式合并候选列表可根据所述预定义顺序被配置有分区模式合并候选。在示例中,可按照B1、A1、B0、A0、C0、B2和C1的顺序搜索分区模式合并候选以配置分区模式合并候选列表。
可基于分区模式合并候选列表推导预测单元的运动信息。换句话说,预测单元可共享单个分区模式合并候选列表。
为了推导预测单元的运动信息,可以以比特流用信号发送用于指定分区模式合并候选列表中包括的分区模式合并候选中的至少一个分区模式合并候选的信息。在示例中,可以以比特流用信号发送用于指定分区模式合并候选中的至少一个分区模式合并候选的索引信息merge_triangle_idx。
索引信息可指定第一预测单元的合并候选和第二预测单元的合并候选的组合。在示例中,下表1是表示根据索引信息merge_triangle_idx的合并候选的组合的示例。
【表1】
merge_triangle_idx 0 1 2 3 4 5 6 7 8
第一预测单元 1 0 0 0 2 0 0 1 3
第二预测单元 0 1 2 1 0 3 4 0 0
merge_triangle_idx 9 10 11 12 13 14 15 16 17
第一预测单元 4 0 1 1 0 0 1 1 1
第二预测单元 0 2 2 2 4 3 3 4 4
merge_triangle_idx 18 19 20 21 22 23 24 25 26
第一预测单元 1 2 2 2 4 3 3 3 4
第二预测单元 3 1 0 1 3 0 2 4 0
merge_triangle_idx 27 28 29 30 31 32 33 34 35
第一预测单元 3 2 4 4 2 4 3 4 3
第二预测单元 1 3 1 1 3 2 2 3 1
merge_triangle_idx 36 37 38 39
第一预测单元 2 2 4 3
第二预测单元 4 4 2 4
当索引信息merge_triangle_idx的值为1时,这表示从索引为1的合并候选推导第一预测单元的运动信息并且从索引为0的合并候选推导第二预测单元的运动信息。可通过索引信息merge_triangle_idx来确定用于推导第一预测单元的运动信息的分区模式合并候选以及用于推导第二预测单元的运动信息的分区模式合并候选。还可基于索引信息确定应用对角线分区的编码块的分区类型。换句话说,索引信息可指定第一预测单元的合并候选、第二预测单元的合并候选和编码块的分区方向的组合。当编码块的分区类型由索引信息确定时,可不对表示对编码块进行分区的对角线的方向的信息triangle_partition_type_flag进行编码。表2表示针对索引信息merge_triangle_idx的编码块的分区类型。
【表2】
merge_triangle_idx 0 1 2 3 4 5 6 7 8
TriangleDir 0 1 1 0 0 1 1 1 0
merge_triangle_idx 9 10 11 12 13 14 15 16 17
TriangleDir 0 0 0 1 0 0 0 0 1
merge_triangle_idx 18 19 20 21 22 23 24 25 26
TriangleDir 1 1 1 0 0 1 1 1 1
merge_triangle_idx 27 28 29 30 31 32 33 34 35
TriangleDir 1 1 1 0 0 1 0 1 0
merge_triangle_idx 36 37 38 39
TriangleDir 0 1 0 0
当变量TriangleDir为0时,这表示左侧三角形分区类型被应用于编码块,并且当变量TriangleDir为1时,这表示右侧三角形分区类型被应用于编码块。通过将表1和表2进行组合,索引信息merge_triangle_idx可被设置为指定第一预测单元的合并候选、第二预测单元的合并候选和编码块的分区方向的组合。在另一示例中,可用信号发送仅针对第一预测单元和第二预测单元中的一个预测单元的索引信息,并且可基于所述索引信息确定针对第一预测单元和第二预测单元中的另一个预测单元的合并候选的索引。在示例中,可基于表示分区模式合并候选中的一个分区模式合并候选的索引的索引信息merge_triangle_idx来确定第一预测单元的合并候选。而且,可基于merge_triangle_idx指定第二预测单元的合并候选。在示例中,可通过将偏移与索引信息merge_triangle_idx相加或从索引信息merge_triangle_idx减去偏移来推导第二预测单元的合并候选。偏移可以是诸如1或2的整数。在示例中,第二预测单元的合并候选可被确定为具有通过将1与merge_triangle_idx相加而获得的值作为索引的分区模式合并候选。当merge_triangle_idx指示分区模式合并候选中的具有最大索引值的分区模式合并候选时,可从索引为0的分区模式合并候选或具有从merge_triangle_idx减去1的值作为索引的分区模式合并候选推导第二预测单元的运动信息。
可选地,可从与由索引信息指定的第一预测单元的分区模式合并候选具有相同的参考画面的分区模式合并候选推导第二预测单元的运动信息。在这种情况下,与第一预测单元的分区模式合并候选具有相同的参考画面的分区模式合并候选可表示L0参考画面或L1参考画面中的至少一个与第一预测单元的分区模式合并候选相同的分区模式合并候选。当存在多个与第一预测单元的分区模式合并候选具有相同的参考画面的分区模式合并候选时,可基于合并候选是否包括双向运动信息或者合并候选的索引与索引信息之间的差值中的至少一个来选择任意一个。
在另一示例中,可针对第一预测单元和第二预测单元中的每一个用信号发送索引信息。在示例中,可以以比特流用信号发送用于确定第一预测单元的分区模式合并候选的第一索引信息1st_merge_idx以及用于确定第二预测单元的分区模式合并候选的第二索引信息2nd_merge_idx。可从基于第一索引信息1st_merge_idx确定的分区模式合并候选推导第一预测单元的运动信息,并且可从基于第二索引信息2nd_merge_idx确定的分区模式合并候选推导第二预测单元的运动信息。
第一索引信息1st_merge_idx可表示分区模式合并候选列表中包括的分区模式合并候选中的一个分区模式合并候选的索引。第一预测单元的分区模式合并候选可被确定为由第一索引信息1st_merge_idx指示的分区模式合并候选。
由第一索引信息1st_merge_idx指示的分区模式合并候选可被设置为不可用作第二预测单元的分区模式合并候选。因此,第二预测单元的第二索引信息2nd_merge_idx可表示除了由第一索引信息指示的分区模式合并候选之外的其余分区模式合并候选中的任意一个分区模式合并候选的索引。当第二索引信息2nd_merge_idx的值小于第一索引信息1st_merge_idx的值时,第二预测单元的分区模式合并候选可被确定为具有由第二索引信息2nd_merge_idx表示的索引信息的分区模式合并候选。另一方面,当第二索引信息2nd_merge_idx的值等于或大于第一索引信息1st_merge_idx的值时,第二预测单元的分区模式合并候选可被确定为具有通过将第二索引信息2nd_merge_idx的值加1而获得的值作为索引的分区模式合并候选。
可选地,根据包括在分区模式合并候选列表中的分区模式合并候选的数量,可确定第二索引信息是否被用信号发送。在示例中,当可被包括在分区模式合并候选列表中的分区模式合并候选的最大数量不超过2时,可省略用信号发送第二索引信息的操作。当省略了用信号发送第二索引信息的操作时,可通过将偏移与第一索引信息相加或从第一索引信息减去偏移来推导第二分区模式合并候选。在示例中,当可被包括在分区模式合并候选列表中的分区模式合并候选的最大数量为2且第一索引信息指示索引0时,可通过将1与第一索引信息相加来推导第二分区模式合并候选。可选地,当可被包括在分区模式合并候选列表中的分区模式合并候选的最大数量为2且第一索引信息指示1时,可通过从第一索引信息减去1来推导第二分区模式合并候选。
可选地,当省略了用信号发送第二索引信息的操作时,第二索引信息可被推测为默认值。在这种情况下,默认值可以是0。可通过将第一索引信息与第二索引信息进行比较来推导第二分区模式合并候选。在示例中,当第二索引信息小于第一索引信息时,可将索引为0的合并候选设置为第二分区模式合并候选,并且当第二索引信息与第一索引信息相同或大于第一索引信息时,可将索引为1的合并候选设置为第二分区模式合并候选。
当分区模式合并候选具有单向运动信息时,分区模式合并候选的单向运动信息可被设置为预测单元的运动信息。另一方面,当分区模式合并候选具有双向运动信息时,L0运动信息或L1运动信息中的仅一个可被设置为预测单元的运动信息。可基于分区模式合并候选的索引或另一预测单元的运动信息来确定L0运动信息或L1运动信息中的哪一个将被采用。
在示例中,当分区模式合并候选的索引为偶数时,预测单元的L0运动信息可被设置为0,并且分区模式合并候选的L1运动信息可被设置为预测单元的L1运动信息。另一方面,当分区模式合并候选的索引为奇数时,预测单元的L1运动信息可被设置为0,并且分区模式合并候选的L0运动信息可被设置为0。相反,当分区模式合并候选的索引为偶数时,分区模式合并候选的L0运动信息可被设置为预测单元的L0运动信息,并且当分区模式合并候选的索引为奇数时,分区模式合并候选的L1运动信息可被设置为预测单元的L1运动信息。可选地,对于第一预测单元,当针对第一预测单元的分区模式合并候选是偶数时,分区模式合并候选的L0运动信息可被设置为第一预测单元的L0运动信息,但是对于第二预测单元,当针对第二预测单元的分区模式合并候选是奇数时,分区模式合并候选的L1运动信息可被设置为第二预测单元的L1运动信息。
可选地,当第一预测单元具有L0运动信息时,第二预测单元的L0运动信息可被设置为0,并且分区模式合并候选的L1运动信息可被设置为第二预测单元的L1信息。另一方面,当第一预测单元具有L1运动信息时,第二预测单元的L1运动信息可被设置为0,并且分区模式合并候选的L0运动信息可被设置为第二预测单元的L0运动信息。
用于推导第一预测单元的运动信息的分区模式合并候选列表可被设置为与用于推导第二预测单元的运动信息的分区模式合并候选列表不同。
在示例中,当基于针对第一预测单元的索引信息来指定分区模式合并候选列表中的用于推导第一预测单元的运动信息的分区模式合并候选时,可通过使用包括除了由索引信息指示的分区模式合并候选之外的其余分区模式合并候选的分区模式合并列表来推导第二预测单元的运动信息。具体地,可从其余分区模式合并候选中的一个分区模式合并候选推导第二预测单元的运动信息。
因此,包括在第一预测单元的分区模式合并候选列表中的分区模式合并候选的最大数量可与包括在第二预测单元的分区模式合并候选列表中的分区模式合并候选的最大数量不同。在示例中,当第一预测单元的分区模式合并候选列表包括M个合并候选时,第二预测单元的分区模式合并候选列表可包括除了由第一预测单元的索引信息指示的分区模式合并候选之外的M-1个合并候选。
在另一示例中,除了通过考虑预测单元的形状或位置之外,可通过基于与编码块相邻的邻近块推导每个预测单元的合并候选来确定邻近块的可用性。
图28是用于解释按预测单元确定邻近块的可用性的示例的示图。
与第一预测单元不相邻的邻近块可被设置为不可用于第一预测单元,并且与第二预测单元不相邻的邻近块可被设置为不可用于第二预测单元。
在示例中,如在图28的(a)中所示的示例中,当左侧三角形分区类型被应用于编码块时,与编码块相邻的邻近块中的与第一预测单元相邻的块A1、A0和A2可被确定为可用于第一预测单元,但是块B0和B1可被确定为不可用于第一预测单元。因此,针对第一预测单元的分区模式合并候选列表可包括从块A1、A0和A2推导出的分区模式合并候选,但它可不包括从块B0和B1推导出的分区模式合并候选。
如在图28的(b)中所示的示例中,当左侧三角形分区类型被应用于编码块时,与第二预测单元相邻的块B0和B1可被确定为可用于第二预测单元,但是块A1、A0和A2可被确定为不可用于第二预测单元。因此,针对第二预测单元的分区模式合并候选列表可包括从块B0和B1推导出的分区模式合并候选,但它可不包括从块A1、A0和A2推导出的分区模式合并候选。
因此,可基于预测单元的位置或编码块的分区类型中的至少一个来确定预测单元可使用的分区模式合并候选的数量或分区模式合并候选的范围。
在另一示例中,合并模式可仅被应用于第一预测单元和第二预测单元中的一个。而且,第一预测单元和第二预测单元中的另一个的运动信息可被设置为与应用合并模式的预测单元的运动信息相同,或者可通过对应用合并模式的预测单元的运动信息进行修正被推导出。
在示例中,可基于分区模式合并候选推导第一预测单元的运动矢量和参考画面索引,并且可通过对第一预测单元的运动矢量进行修正来推导第二预测单元的运动矢量。在示例中,可通过将修正运动矢量{Rx,Ry}与第一预测单元的运动矢量{mvD1LXx,mvD1LXy}相加或从第一预测单元的运动矢量{mvD1LXx,mvD1LXy}减去修正运动矢量{Rx,Ry}来推导第二预测单元的运动矢量。第二预测单元的参考画面索引可被设置为与第一预测单元的参考画面索引相同。
可以以比特流用信号发送用于确定表示第一预测单元的运动矢量与第二预测单元的运动矢量之间的差的修正运动矢量的信息。所述信息可包括表示修正运动矢量的大小的信息或表示修正运动矢量的符号的信息中的至少一个。
可选地,可基于预测单元的位置或索引或应用于编码块的分区类型中的至少一个来推导修正运动矢量的符号。
在另一示例中,可用信号发送第一预测单元和第二预测单元中的一个的运动矢量和参考画面索引。第一预测单元和第二预测单元中的另一个的运动矢量可通过对用信号发送的运动矢量进行修正被推导出。
在示例中,基于以比特流用信号发送的信息,可确定第一预测单元的运动矢量和参考画面索引。而且,可通过对第一预测单元的运动矢量进行修正来推导第二预测单元的运动矢量。在示例中,可通过将修正运动矢量{Rx,Ry}与第一预测单元的运动矢量{mvD1LXx,mvD1LXy}相加或从第一预测单元的运动矢量{mvD1LXx,mvD1LXy}减去修正运动矢量{Rx,Ry}来推导第二预测单元的运动矢量。第二预测单元的参考画面索引可被设置为与第一预测单元的参考画面索引相同。
在另一示例中,合并模式可仅被应用于第一预测单元和第二预测单元中的一个。而且,可基于应用合并模式的预测单元的运动信息推导第一预测单元和第二预测单元中的另一个的运动信息。在示例中,可将第一预测单元的运动矢量的对称运动矢量设置为第二预测单元的运动矢量。在这种情况下,对称运动矢量可表示与第一预测单元的运动矢量具有相同的大小但具有至少一个相反符号的x轴分量或y轴分量的运动矢量,或者表示与通过对第一预测单元的运动矢量进行缩放而获得的缩放后的矢量具有相同的大小但具有至少一个相反符号的x轴分量或y轴分量的运动矢量。在示例中,当第一预测单元的运动矢量为(MVx,MVy)时,第二预测单元的运动矢量可被设置为作为该运动矢量的对称运动矢量的(MVx,-MVy)、(-MVx,MVy)或(-MVx,-MVy)。
第一预测单元和第二预测单元中的不应用合并模式的预测单元的参考画面索引可被设置为与应用合并模式的预测单元的参考画面索引相同。可选地,不应用合并模式的预测单元的参考画面索引可被设置为预定义值。在这种情况下,预定义值可以是参考画面列表中的最小索引或最大索引。可选地,可以以比特流用信号发送指定不应用合并模式的预测单元的参考画面索引的信息。可选地,可从与应用合并模式的预测单元的参考画面所属的参考画面列表不同的参考画面列表选择不应用合并模式的预测单元的参考画面。在示例中,当从L0参考画面列表选择应用合并模式的预测单元的参考画面时,可从L1参考画面列表选择不应用合并模式的预测单元的参考画面。在这种情况下,可基于应用合并模式的预测单元的参考画面与当前画面之间的画面顺序计数(POC)差来推导不应用合并模式的预测单元的参考画面。在示例中,当从L0参考画面列表选择应用合并模式的预测单元的参考画面时,可选择L1参考画面列表中的与当前画面的差值和应用合并模式的预测单元的参考画面与当前画面之间的差值相同或相似的参考画面作为不应用合并模式的预测单元的参考画面。
当第一预测单元的参考画面与当前画面之间的画面顺序计数差值不同于第二预测单元的参考画面与当前画面之间的画面顺序计数差值时,可将应用合并模式的预测单元的缩放后的运动矢量的对称运动矢量设置为不应用合并模式的预测单元的运动矢量。在这种情况下,可基于每个参考画面与当前画面之间的画面顺序计数差值来执行缩放。
在另一示例中,在推导第一预测单元和第二预测单元中的每一个的运动矢量之后,可将修正矢量与推导出的运动矢量相加或从推导出的运动矢量减去修正矢量。在示例中,可通过将第一修正矢量与基于第一合并候选推导出的第一运动矢量相加或从基于第一合并候选推导出的第一运动矢量减去第一修正矢量来推导第一预测单元的运动矢量,并且可通过将第二修正矢量与基于第二合并候选推导出的第二运动矢量相加或从基于第二合并候选推导出的第二运动矢量减去第二修正矢量来推导第二预测单元的运动矢量。可以以比特流用信号发送用于确定第一修正矢量或第二修正矢量中的至少一个的信息。所述信息可包括用于确定修正矢量的大小的信息或用于确定修正矢量的符号的信息中的至少一个。
第二修正矢量可以是第一修正矢量的对称运动矢量。在这种情况下,可仅针对第一修正矢量和第二修正矢量中的一个用信号发送用于确定修正矢量的信息。在示例中,当通过以比特流用信号发送的信息将第一修正矢量确定为(MVDx,MVDy)时,可将作为第一修正矢量的对称运动矢量的(-MVDx,MVDy)、(MVDx,-MVDy)或(-MVDx,-MVDy)设置为第二修正矢量。根据每个预测单元的参考画面的画面顺序计数,可将通过对第一修正矢量进行缩放而获得的缩放后的运动矢量的对称运动矢量设置为第二修正矢量。
在另一示例中,可基于合并候选推导第一预测单元和第二预测单元中的一个的信息,并且可基于以比特流用信号发送的信息来确定另一个的运动信息。在示例中,可针对第一预测单元用信号发送合并索引,并且可针对第二预测单元用信号发送用于确定运动矢量的信息和用于确定参考画面的信息中的至少一个信息。第一预测单元的运动信息可被设置为与由合并索引指定的合并候选的运动信息相同。第二预测单元的运动信息可由以比特流用信号发送的用于确定运动矢量的信息和用于确定参考画面的信息中的至少一个来指定。
可基于第一预测单元的运动信息和第二预测单元的运动信息来执行针对每个编码块的运动预测补偿预测。在这种情况下,可能在第一预测单元和第二预测单元的边界上产生质量劣化。在示例中,质量连续性可能在第一预测单元和第二预测单元的边界上的边缘周围恶化。为了降低边界上的质量劣化,可通过平滑滤波器或加权预测来推导预测样点。
可基于根据第一预测单元的运动信息获得的第一预测样点和根据第二预测单元的运动信息获得的第二预测样点的加权和运算来推导应用对角线分区的编码块中的预测样点。可选地,可从基于第一预测单元的运动信息确定的第一预测块推导第一预测单元的预测样点,并且可从基于第二预测单元的运动信息确定的第二预测块推导第二预测单元的预测样点,但是,可基于包括在第一预测块中的第一预测样点和包括在第二预测块中的第二预测样点的加权和运算来推导第一预测单元和第二预测单元的边界区域上的预测样点。在示例中,下面的方程式3表示推导第一预测单元和第二预测单元的预测样点的示例。
【方程式3】
P(x,y)=w1*P1(x,y)+(1-w1)*P2(x,y)
在方程式3中,P1表示第一预测样点,并且P2表示第二预测样点。w1表示应用于第一预测样点的权重,并且(1-w1)表示应用于第二预测样点的权重。如在方程式3中所示的示例中,可通过从常数值减去应用于第一预测样点的权重来推导应用于第二预测样点的权重。
当左侧三角形分区类型被应用于编码块时,边界区域可包括具有相同的x轴坐标和y轴坐标的预测样点。另一方面,当右侧三角形分区类型被应用于编码块时,边界区域可包括x轴坐标和y轴坐标的总和等于或大于第一阈值并且等于或小于第二阈值的预测样点。
可基于编码块的尺寸、编码块的形状、预测单元的运动信息、预测单元的运动矢量差值、参考画面的画面顺序计数或者对角线边界上的第一预测样点与第二预测样点之间的差值中的至少一个来确定边界区域的尺寸。
图29和图30是示出基于第一预测样点和第二预测样点的加权和运算推导预测样点的示例的示图。图29示出左侧三角形分区类型被应用于编码块的情况,并且图30示出右侧三角形分区类型被应用于编码块的情况。此外,图29的(a)和图30的(a)是表示针对亮度分量的预测方面的示图,并且图29的(b)和图30的(b)是表示针对色度分量的预测方面的示图。
在所示的示图中,在第一预测单元和第二预测单元的边界周围的预测样点上标记的数字表示应用于第一预测样点的权重。在示例中,当在预测样点上标记的数字为N时,可通过将权重N/8应用于第一预测样点并将权重(1-(N/8))应用于第二预测样点来推导预测样点。
在非边界区域中,可将第一预测样点或第二预测样点确定为预测样点。查看图29中的示例,可将基于第一预测单元的运动信息推导出的第一预测样点确定为属于第一预测单元的区域中的预测样点。另一方面,基于第二预测单元的运动信息推导出的第二预测样点可被确定为属于第二预测单元的区域中的预测样点。
查看图30中的示例,可将基于第一预测单元的运动信息推导出的第一预测样点确定为x轴坐标和y轴坐标的总和小于第一阈值的区域中的预测样点。另一方面,可将基于第二预测单元的运动信息推导出的第二预测样点确定为x轴坐标和y轴坐标的总和大于第二阈值的区域中的预测样点。
可基于编码块的尺寸、编码块的形状或颜色分量中的至少一个来确定用于确定非边界区域的阈值。在示例中,当针对亮度分量的阈值被设置为N时,针对色度分量的阈值可被设置为N/2。
可基于第一预测样点和第二预测样点的加权和运算推导包括在边界区域中的预测样点。在这种情况下,可基于预测样点的位置、编码块的尺寸、编码块的形状或颜色分量中的至少一个来确定应用于第一预测样点和第二预测样点的权重。
在示例中,如图29的(a)中所示的示例中,可通过将相同的权重应用于第一预测样点和第二预测样点来推导具有相同的x轴坐标和y轴坐标的预测样点。可通过将应用于第一预测样点和第二预测样点的权重比率设置为(3:1)或(1:3)来推导x轴坐标与y轴坐标之间的差的绝对值为1的预测样点。此外,可通过将应用于第一预测样点和第二预测样点的权重比率设置为(7:1)或(1:7)来推导x轴坐标与y轴坐标之间的差的绝对值为2的预测样点。
可选地,如图29的(b)中所示的示例中,可通过将相同的权重应用于第一预测样点和第二预测样点来推导具有相同的x轴坐标和y轴坐标的预测样点,并且可通过将应用于第一预测样点和第二预测样点的权重比率设定为(7:1)或(1:7)来推导x轴坐标与y轴坐标之间的差的绝对值为1的预测样点。
在示例中,如图30的(a)中所示的示例中,可通过将相同的权重应用于第一预测样点和第二预测样点来推导x轴坐标和y轴坐标的总和比编码块的宽度或高度小1的预测样点。可通过将应用于第一预测样点和第二预测样点的权重比率设置为(3:1)或(1:3)来推导x轴坐标和y轴坐标的总和与编码块的宽度或高度相同或者比编码块的宽度或高度小2的预测样点。可通过将应用于第一预测样点和第二预测样点的权重比率设置为(7:1)或(1:7)来推导x轴坐标和y轴坐标的总和比编码块的宽度或高度大1或者比编码块的宽度或高度小3的预测样点。
可选地,如图30的(b)中所示的示例中,可通过将相同的权重应用于第一预测样点和第二预测样点来推导x轴坐标和y轴坐标的总和比编码块的宽度或高度小1的预测样点。可通过将应用于第一预测样点和第二预测样点的权重比率设置为(7:1)或(1:7)来推导x轴坐标和y轴坐标的总和与编码块的宽度或高度相同或者比编码块的宽度或高度小2的预测样点。
在另一示例中,可通过考虑预测样点的位置或编码块的形状来确定权重。方程式4至方程式6表示当左侧三角形分区类型被应用于编码块时推导权重的示例。方程式4表示当编码块为正方形时推导应用于第一预测样点的权重的示例。
【方程式4】
w1=(x-y+4)/8
在方程式4中,x和y表示预测样点的位置。当编码块为非正方形时,可如在以下方程式5或方程式6中推导应用于第一预测样点的权重。方程式5表示编码块的宽度大于高度的情况,并且方程式6表示编码块的宽度小于高度的情况。
【方程式5】
w1=((x/whRatio)-y+4)/8
【方程式6】
w1=(x-(y*whRatio)+4)/8
当右侧三角形分区类型被应用于编码块时,可如在方程式7至方程式9中确定应用于第一预测样点的权重。方程式7表示当编码块为正方形时推导应用于第一预测样点的权重的示例。
【方程式7】
w1=(CbW-1-x-y)+4)/8
在方程式7中,CbW表示编码块的宽度。当编码块为非正方形时,可如在下面的方程式8或方程式9中推导应用于第一预测样点的权重。方程式8表示编码块的宽度大于高度的情况,并且方程式9表示编码块的宽度小于高度的情况。
【方程式8】
w1=(CbH-1-(x/whRatio)-y)+4)/8
【方程式9】
w1=(CbW-1-x-(y*whRatio)+4)/8
在方程式8中,CbH表示编码块的高度。
如在所示的示例中,可通过向第一预测样点赋予比第二预测样点更大的权重来推导边界区域中的预测样点中的包括在第一预测单元中的预测样点,并且可通过向第二预测样点赋予比第一预测样点更大的权重来推导边界区域中的预测样点中的包括在第二预测单元中的预测样点。
当对角线分区被应用于编码块时,对帧内预测模式和合并模式进行组合的组合预测模式可被设置为不被应用于编码块。
当编码块的编码/解码完成时,完成了编码/解码的编码块的运动信息可被存储以用于后续编码块的编码/解码。可以以具有预设尺寸的子块为单位存储运动信息。在示例中,具有预设尺寸的子块可具有4×4尺寸。可选地,根据编码块的尺寸或形状,可不同地确定子块的尺寸或形状。
当子块属于第一预测单元时,第一预测单元的运动信息可被存储为子块的运动信息。另一方面,当子块属于第二预测单元时,第二预测单元的运动信息可被存储为子块的运动信息。
当子块在第一预测单元和第二预测单元的边界上时,第一预测单元的运动信息和第二预测单元的运动信息中的任意一个可被设置为子块的运动信息。在示例中,可将第一预测单元的运动信息设置为子块的运动信息,或者可将第二预测单元的运动信息设置为子块的运动信息。
在另一示例中,当子块在第一预测单元和第二预测单元的边界上时,可从第一预测单元推导子块的L0运动信息和L1运动信息中的任意一个,并且可从第二预测单元推导子块的L0运动信息和L1运动信息中的另一个。在示例中,可将第一预测单元的L0运动信息设置为子块的L0运动信息,并且可将第二预测单元的L1运动信息设置为子块的L1运动信息。但是,当第一预测单元和第二预测单元仅具有L0运动信息或仅具有L1运动信息时,可通过选择第一预测单元或第二预测单元中的任意一个来确定子块的运动信息。可选地,可将第一预测单元和第二预测单元的运动矢量平均值设置为子块的运动矢量。
可在运动信息表中更新完成了编码/解码的编码块的运动信息。在这种情况下,可将应用预测单元分区的编码块的运动信息设置为不被添加到运动信息表。
可选地,可仅将通过对编码块进行分区而生成的多个预测单元中的任意一个预测单元的运动信息添加到运动信息表。在示例中,虽然第一预测单元的运动信息可被添加到运动信息表,但第二预测单元的运动信息可不被添加到运动信息表。在这种情况下,可基于编码块的尺寸、编码块的形状、预测单元的尺寸、预测单元的形状、或是否针对预测单元执行双向预测中的至少一个来选择将被添加到运动信息表的预测单元。
可选地,可将通过对编码块进行分区而生成的多个预测单元中的每个预测单元的运动信息添加到运动信息表。在这种情况下,可在编码装置和解码装置中预定义针对运动信息表的添加顺序。在示例中,包括左上样点或左下角样点的预测单元的运动信息可在另一预测单元的运动信息之前被添加到运动信息表。可选地,可基于每个预测单元的合并索引或参考画面索引或者运动矢量的大小中的至少一个来确定针对运动信息表的添加顺序。
可选地,对第一预测单元的运动信息和第二预测单元的运动信息进行组合的运动信息可被添加到运动信息表。可从第一预测单元推导组合运动信息的L0运动信息和L1运动信息中的任意一个,并且可从第二预测单元推导L0运动信息和L1运动信息中的另一个。
可选地,基于第一预测单元的参考画面是否与第二预测单元的参考画面相同,可确定将被添加到运动信息表的运动信息。在示例中,当第一预测单元的参考画面与第二预测单元的参考画面不同时,第一预测单元和第二预测单元中的任意一个的运动信息或者对第一预测单元和第二预测单元进行组合的运动信息可被添加到运动信息表。另一方面,当第一预测单元的参考画面与第二预测单元的参考画面相同时,可将第一预测单元的运动矢量和第二预测单元的运动矢量的平均值添加到运动信息表。
可选地,基于编码块的尺寸、编码块的形状或编码块的分区形状,可确定将被添加到运动信息表的运动矢量。在示例中,当右侧三角形分区被应用于编码块时,第一预测单元的运动信息可被添加到运动信息表。另一方面,当左侧三角形分区被应用于编码块时,第二预测单元的运动信息可被添加到运动信息表,或者对第一预测单元的运动信息和第二预测单元的运动信息进行组合的运动信息可被添加到运动信息表。
可单独定义用于存储应用预测单元分区的编码块的运动信息的运动信息表。在示例中,应用预测单元分区的编码块的运动信息可被存储在分区模式运动信息表中。分区模式运动信息表可被称为三角形运动信息表。换句话说,未应用预测单元分区的编码块的运动信息可被存储在一般运动信息表中,并且应用预测单元分区的编码块的运动信息可被存储在分区模式运动信息表中。应用上述预测单元分区的编码块的运动信息被添加到运动信息表的实施例可被应用于更新分区模式运动信息表。在示例中,第一预测单元的运动信息、第二预测单元的运动信息、对第一预测单元的运动信息和第二预测单元的运动信息进行组合的运动信息以及对第一预测单元的运动矢量和第二预测单元的运动矢量求平均的运动信息可被添加到分区模式运动信息表。
当预测模式分区未被应用于编码块时,可通过使用一般运动信息表推导合并候选。另一方面,当预测模式分区被应用于编码块时,可通过使用分区模式运动信息表推导合并候选。
帧内预测是一种用于通过使用已经被编码/解码且在当前块周围的重建样点来对当前块执行预测的方法。就此而言,在应用环内滤波器之前的重建样点可被用于当前块的帧内预测。
帧内预测方法包括基于矩阵的帧内预测以及利用邻近重建样点的根据方向的帧内预测。可以以比特流用信号发送指示当前块的帧内预测方法的信息。所述信息可以是1比特标志。可选地,可基于当前块的位置、当前块的尺寸、当前块的形状或邻近块的帧内预测方法中的至少一个来确定当前块的帧内预测。在示例中,当存在跨越画面边界的当前块时,可设置为使得基于矩阵的帧内预测方法不被应用于当前块。
基于矩阵的帧内预测方法是一种基于存储在编码器和解码器中的矩阵与当前块周围的重建样点的矩阵乘积来获得当前块的预测块的方法。可以以比特流用信号发送用于指定多个预存储的矩阵中的任意一个矩阵的信息。解码器可基于上述信息和当前块的尺寸来确定用于对当前块执行帧内预测的矩阵。
一般帧内预测是一种基于非方向帧内预测模式或方向帧内预测模式获得当前块的预测块的方法。在下文中,将参照附图描述基于一般帧内预测的帧内预测的处理。
图31是示出根据本公开的实施例的帧内预测方法的流程图的示图。
可确定当前块的参考样点线S3101。参考样点线表示与当前块的上方和/或左侧间隔的第k条线中包括的一组参考样点。可从已经被编码/解码的在当前块周围的重建样点推导参考样点。
可以以比特流用信号发送标识多条参考样点线中的针对当前块的参考样点线的索引信息。在示例中,可以以比特流用信号发送用于指定针对当前块的参考样点线的索引信息intra_luma_ref_idx。所述索引信息可基于编码块被用信号发送。
多条参考样点线可包括当前块的上方和/或左侧的第一条线、第二条线或第三条线中的至少一个。多条参考样点线中的包括与当前块的上方相邻的行和与当前块的左侧相邻的列的参考样点线可被称为相邻参考样点线,并且其余参考样点线可被称为非相邻参考样点线。
表3示出分配给候选参考样点线中的每条候选参考样点线的索引。
【表3】
索引(intra_luma_ref_idx) 参考样点线
0 相邻参考样点线
1 第一非相邻参考样点线
2 第二非相邻参考样点线
基于当前块的位置、尺寸、形状或其邻近块的预测编码模式中的至少一个,可确定针对当前块的参考样点线。在一个示例中,当当前块与画面、并行块、条带或编码树单元的边界邻接时,相邻参考样点线可被确定为针对当前块的参考样点线。参考样点线可包括位于当前块的上方的上参考样点和位于当前块的左侧的左参考样点。可从当前块周围的重建样点推导上参考样点和左参考样点。重建样点可处于应用环内滤波器之前的状态。
接下来,可确定针对当前块的帧内预测模式S3102。就此而言,可将非方向帧内预测模式或方向帧内预测模式中的至少一个确定为针对当前块的帧内预测模式。非方向帧内预测模式包括平面模式和DC模式。方向帧内预测模式包括从左下对角线方向到右上对角线方向的33或65个模式。
图32是示出帧内预测模式的示图。
图32的(a)示出35个帧内预测模式。图32的(b)示出67个帧内预测模式。
可定义比图32中所示的帧内预测模式的数量更多或更少数量的帧内预测模式。
基于与当前块相邻的邻近块的帧内预测模式,可设置MPM(最可能模式)。就此而言,邻近块可包括与当前块的左侧相邻的左侧邻近块和与当前块的上方相邻的上方邻近块。
可在编码装置和解码装置中预先设置包括在MPM列表中的MPM的数量。在示例中,MPM的数量可以是3、4、5或6。可选地,可以以比特流用信号发送表示MPM的数量的信息。可选地,可基于邻近块的预测编码模式、当前块的尺寸、形状或参考样点线索引中的至少一个来确定MPM的数量。在示例中,当相邻参考样点线被确定为当前块的参考样点线时N个MPM可被使用,而当非相邻参考样点线被确定为当前块的参考样点线时M个MPM可被使用。在M是小于N的自然数时,在示例中,N可以是6并且M可以是5、4或3。因此,当当前块的参考样点线的索引为0且MPM标志为真时,当前块的帧内预测模式可被确定为6个候选帧内预测模式中的任意一个,而当当前块的参考样点线的索引大于0且MPM标志为真时,当前块的帧内预测模式可被确定为5个候选帧内预测模式中的任意一个。
可选地,可使用固定数量(例如,6或5)个MPM候选,而不管当前块的参考样点线的索引如何。
当基于矩阵的帧内预测被应用于邻近块时,邻近块的帧内预测模式可被视为平面并且可推导MPM候选。
当帧内BDPCM被应用于邻近块时,邻近块的帧内预测模式可被视为默认模式并且可推导MPM候选。在这种情况下,默认模式可以是DC、平面、垂直方向或水平方向中的至少一个。
可选地,基于邻近块的帧内BDPCM应用方向,可确定邻近块的帧内预测模式。在示例中,当水平方向上的帧内BDPCM被应用于邻近块时,邻近块的帧内预测模式可被视为具有水平方向。另一方面,当垂直方向上的帧内BDPCM被应用于邻近块时,邻近块的帧内预测模式可被视为具有垂直方向。
可生成包括多个MPM的MPM列表,并且可以以比特流用信号发送表示与当前块的帧内预测模式相同的MPM是否被包括在MPM列表中的信息。在所述信息是1比特标志时,它可被称为MPM标志。当MPM标志表示与当前块相同的MPM被包括在MPM列表中时,可以以比特流用信号发送标识MPM中的一个MPM的索引信息。在示例中,可以以比特流用信号发送指定多个MPM中的任意一个MPM的索引信息mpm_idx。由索引信息指定的MPM可被设置为当前块的帧内预测模式。当MPM标志表示与当前块相同的MPM未被包括在MPM列表中时,可以以比特流用信号发送指示除MPM以外的其余帧内预测模式中的任意一个帧内预测模式的其余模式信息。其余模式信息指示与除MPM以外重新分配索引的其余帧内预测模式中的当前块的帧内预测模式对应的索引值。解码装置按照升序排列MPM,并且通过将其余模式信息与MPM进行比较来确定当前块的帧内预测模式。在示例中,当其余模式信息与MPM相同或小于MPM时,可通过将1与其余模式信息相加来推导当前块的帧内预测模式。
当推导当前块的帧内预测模式时,可省略一部分MPM与其余模式信息之间的比较。在示例中,可从比较目标排除MPM中的作为非方向帧内预测模式的MPM。当非方向帧内预测模式被设置为MPM时,显然,其余模式信息指示方向帧内预测模式,所以可通过将排除非方向帧内预测模式的其余MPM与其余模式信息进行比较来推导当前块的帧内预测模式。作为从比较目标排除非方向帧内预测模式的替代,可将非方向帧内预测模式的数量与其余模式信息相加以将其结果值与其余MPM进行比较。
作为将默认模式设置为MPM的替代,可以以比特流用信号发送表示当前块的帧内预测模式是否是默认模式的信息。所述信息可以是1比特标志,并且所述标志可被称为默认模式标志。仅当MPM标志表示与当前块相同的MPM被包括在MPM列表中时,可用信号发送默认模式标志。如上所述,默认模式可包括平面、DC、垂直方向模式或水平方向模式中的至少一个。在示例中,当平面被设置为默认模式时,默认模式标志可指示当前块的帧内预测模式是否为平面。当默认模式标志指示当前块的帧内预测模式不是默认模式时,MPM中的由索引信息指示的一个MPM可被设置为当前块的帧内预测模式。
当使用默认模式标志时,可将与默认模式相同的帧内预测模式设置为不被设置为MPM。在示例中,当默认模式标志指示当前块的帧内预测模式是否是平面时,可通过使用排除与平面对应的MPM的5个MPM来推导当前块的帧内预测模式。
当多个帧内预测模式被设置为默认模式时,还可用信号发送指示默认模式中的任意一个默认模式的索引信息。当前块的帧内预测模式可被设置为由索引信息指示的默认模式。
当当前块的参考样点线的索引不为0时,可设置为不使用默认模式。在示例中,当非相邻参考样点线被确定为当前块的参考样点线时,可设置为不使用诸如DC模式或平面模式的非方向帧内预测模式。因此,当参考样点线的索引不为0时,可不用信号发送默认模式标志,并且可将默认模式标志的值推断为预定义值(即,假)。
当针对当前块的帧内预测模式被确定时,可基于所确定的帧内预测模式来获得针对当前块的预测样点S3503。
在DC模式被选择的情况下,基于参考样点的平均值来生成针对当前块的预测样点。详细地,可基于参考样点的平均值来生成预测块内的所有样点的值。可使用与当前块的上方相邻的上参考样点和与当前块的左侧相邻的左参考样点中的至少一个来推导平均值。
在推导平均值时使用的参考样点的数量或范围可基于当前块的形状而变化。在示例中,当当前块是宽度大于高度的非正方形块时,可通过使用上参考样点来计算平均值。反之,当当前块是宽度小于高度的非正方形块时,可通过使用左参考样点来计算平均值。换句话说,当当前块的宽度和高度不同时,可使用与更大长度相邻的参考样点来计算平均值。可选地,可基于当前块的宽高比来确定是通过使用上参考样点还是通过使用左参考样点来计算平均值。
当平面模式被选择时,可通过使用水平方向预测样点和垂直方向预测样点来获得预测样点。就此而言,可基于与预测样点位于同一水平线的左参考样点和右参考样点来获得水平方向预测样点,并且可基于与预测样点位于同一垂直线的上参考样点和下参考样点来获得垂直方向预测样点。就此而言,可通过复制与当前块的右上角相邻的参考样点来生成右参考样点,并且可通过复制与当前块的左下角相邻的参考样点来生成下参考样点。可基于左参考样点和右参考样点的加权和来获得水平方向预测样点,并且可基于上参考样点和下参考样点的加权和来获得垂直方向预测样点。就此而言,可根据预测样点的位置来确定分配给每个参考样点的加权因子。可基于水平方向预测样点和垂直方向预测样点的平均值或加权和来获得预测样点。当使用加权和时,可基于预测样点的位置来确定分配给水平方向预测样点和垂直方向预测样点的加权因子。
当方向预测模式被选择时,可确定表示所选的方向预测模式的预测方向(或预测角度)的参数。下面的表4表示针对每个帧内预测模式的intraPredAng的帧内方向参数。
【表4】
PredModeIntra 1 2 3 4 5 6 7
IntraPredAng - 32 26 21 17 13 9
PredModeIntra 8 9 10 11 12 13 14
IntraPredAng 5 2 0 -2 -5 -9 -13
PredModeIntra 15 16 17 18 19 20 21
IntraPredAng -17 -21 -26 -32 -26 -21 -17
PredModeIntra 22 23 24 25 26 27 28
IntraPredAng -13 -9 -5 -2 0 2 5
PredModeIntra 29 30 31 32 33 34
IntraPredAng 9 13 17 21 26 32
表4表示每个帧内预测模式的帧内方向参数,其中,当35个帧内预测模式被定义时,每个帧内预测模式的索引是2至34中的一个。当方向帧内预测模式被定义为多于33时,可通过对表4进行细分来设置每个帧内预测模式的帧内方向参数。针对当前块的上参考样点和左参考样点被排列为一条线,然后可基于帧内方向参数的值获得预测样点。就此而言,当帧内方向参数的值为负值时,左参考样点和上参考样点可被排列为一条线。
图33和图34是示出将参考样点排列为一条线的一维阵列的示例的示图。
图33示出参考样点被排列在垂直方向上的垂直方向上的一维阵列的示例,并且图34示出参考样点被排列在水平方向上的水平方向上的一维阵列的示例。通过假设定义了35个帧内预测模式的情况来描述图33和34的实施例。
当帧内预测模式索引是11至18中的任意一个时,可应用逆时针旋转上参考样点的水平方向上的一维阵列,并且当帧内预测模式索引是19至25中的任意一个时,可应用顺时针旋转左参考样点的垂直方向上的一维阵列。在将参考样点排列为一条线时,可考虑帧内预测模式角度。
基于帧内方向参数,可确定参考样点确定参数。参考样点确定参数可包括用于指定参考样点的参考样点索引和用于确定应用于参考样点的权重的权重参数。
可通过下面的方程式10和方程式11分别获得参考样点索引iIdx和加权因子参数ifact。
【方程式10】
iIdx=(y+1)*Pang/32
【方程式11】
ifact=[(y+1)*Pang]&31
在方程式10和方程式11中,Pang表示帧内方向参数。由参考样点索引iIdx指定的参考样点对应于整数像素。
为了推导预测样点,可指定至少一个参考样点。详细地,根据预测模式的斜率,可指定用于推导预测样点的参考样点的位置。在示例中,可通过使用参考样点索引iIdx来指定用于推导预测样点的参考样点。
就此而言,当帧内预测模式的斜率不由一个参考样点表示时,可通过对多个参考样点执行插值来生成预测样点。在示例中,当帧内预测模式的斜率是预测样点与第一参考样点之间的斜率和预测样点与第二参考样点之间的斜率之间的值时,可通过对第一参考样点和第二参考样点执行插值来获得预测样点。换句话说,当根据帧内预测角度的角度线不穿过位于整数像素的参考样点时,可通过对位置与角度线穿过的位置的左侧和右侧或者上方和下方相邻的参考样点执行插值来获得预测样点。
下面的方程式12表示基于参考样点获得预测样点的示例。
【方程式12】
P(x,y)=((32-ifact)/32)*Ref_1D(x+iIdx+1)+(ifact/32)*Ref_1D(x+iIdx+2)
在方程式12中,P表示预测样点,并且Ref_1D表示被排列为一条线的参考样点中的任意一个参考样点。就此而言,可通过预测样点的位置(x,y)和参考样点索引iIdx来确定参考样点的位置。
当帧内预测模式的斜率可能由一个参考样点来表示时,加权因子参数ifact被设置为0。因此,方程式12可被简化为下面的方程式13。
【方程式13】
P(x,y)=Ref_1D(x+iIdx+1)
基于多个帧内预测模式,可执行针对当前块的帧内预测。在示例中,可按预测样点推导帧内预测模式,并且可基于分配给预测样点的帧内预测模式来推导预测样点。
可选地,可按区域推导帧内预测模式,并且可基于分配给每个区域的帧内预测模式来执行针对每个区域的帧内预测。在这种情况下,区域可包括至少一个样点。可基于当前块的尺寸或形状或者帧内预测模式中的至少一个自适应地确定区域的尺寸或形状中的至少一个。可选地,可在编码装置和解码装置中独立地预定义区域的尺寸或形状中的至少一个,而不管当前块的尺寸或形状如何。
图35是示出由方向帧内预测模式与平行于x轴的直线所形成的角度的示图。
如在图35中所示的示例中,方向预测模式可存在于左下对角线方向与右上对角线方向之间。如由x轴和方向预测模式形成的角度所描述的,方向预测模式可存在于45度(左下对角线方向)与-135度(右上对角线方向)之间。
当当前块是非正方形时,可能存在如下情况:通过使用位于根据帧内预测角度的角度线处的参考样点中的位置比与根据针对当前块的帧内预测模式的预测样点接近的参考样点更远的参考样点来推导预测样点。
图36是示出当当前块具有非正方形形状时获得预测样点的方面的示图。
在示例中,如在图36的(a)中所示的示例中,假设当前块具有宽度大于高度的非正方形形状,并且当前块的帧内预测模式是具有从0度至45度的角度的方向帧内预测模式。在这种情况下,当推导当前块的右侧列附近的预测样点A时,可能发生以下情况:位于符合所述角度的角度模式中的参考样点之中的远离预测样点的左参考样点L而不是与预测样点接近的上参考样点T被使用。
在另一示例中,如在图36的(b)中所示的示例中,假设当前块具有高度大于宽度的非正方形形状,并且当前块的帧内预测模式是从-90度到-135度的方向帧内预测模式。在这种情况下,当推导当前块的下方行附近的预测样点A时,可能发生以下情况:位于符合所述角度的角度模式中的参考样点之中的远离预测样点的上参考样点T而不是与预测样点接近的左参考样点L被使用。
为了解决上述问题,当当前块是非正方形时,可利用相反方向的帧内预测模式替换针对当前块的帧内预测模式。因此,对于非正方形块,可使用角度大于或小于图32中所示的方向预测模式的角度的方向预测模式。上述方向帧内预测模式可被定义为广角帧内预测模式。广角帧内预测模式表示不属于45度到-135度的范围的方向帧内预测模式。
图37是示出广角帧内预测模式的示图。
在图37中所示的示例中,索引从-1到-14的帧内预测模式以及索引从67到80的帧内预测模式表示广角帧内预测模式。
在图37中,示出了角度大于45度的14个广角帧内预测模式(从-1到-14)以及角度小于-135度的14个广角帧内预测模式(从67到80)。然而,可定义更多或更少数量的广角帧内预测模式。
当使用广角帧内预测模式时,上参考样点的长度可被设置为2W+1,并且左参考样点的长度可被设置为2H+1。
在使用广角帧内预测模式时,可通过使用参考样点T来预测图37的(a)中所示的样点A,并且可通过使用参考样点L来预测图37的(b)中所示的样点A。
除了N个广角帧内预测模式之外还用现有帧内预测模式构成的总共67+N个帧内预测模式可被使用。在示例中,表5表示当定义了20个广角帧内预测模式时帧内预测模式的帧内方向参数。
【表5】
Figure BDA0002967663620000611
Figure BDA0002967663620000621
当当前块是非正方形并且在S2502获得的当前块的帧内预测模式属于转换范围时,可将当前块的帧内预测模式转换为广角帧内预测模式。可基于当前块的尺寸或形状或比率中的至少一个来确定转换范围。就此而言,所述比率可表示当前块的宽高比。当当前块具有宽度大于高度的非正方形形状时,可将转换范围设置为从右上对角线方向上的帧内预测模式索引(例如,66)到(从右上对角线方向上的帧内预测模式的索引减去N)。在这种情况下,可基于当前块的比率来确定N。当当前块的帧内预测模式属于转换范围时,帧内预测模式可被转换为广角帧内预测模式。可通过从帧内预测模式减去预定义值来执行转换,并且所述预定义值可以是排除广角帧内预测模式的帧内预测模式的总数(例如,67)。
通过实施例,可将第66号到第53号之间的帧内预测模式中的每个帧内预测模式分别转换为第-1号到第-14号之间的广角帧内预测模式。
当当前块具有高度大于宽度的非正方形形状时,可将转换范围设置为从左下对角线方向上的帧内预测模式索引(例如,2)到(左下对角线方向上的帧内预测模式的索引+M)。在这种情况下,可基于当前块的比率来确定M。当当前块的帧内预测模式属于转换范围时,帧内预测模式可被转换为广角帧内预测模式。可通过将预定义值与帧内预测模式相加来执行转换,并且所述预定义值可以是排除广角帧内预测模式的方向帧内预测模式的总数(例如,65)。
通过实施例,可将第2号到第15号之间的帧内预测模式中的每个帧内预测模式分别转换为第67号至第80号之间的广角帧内预测模式。
在下文中,属于转换范围的帧内预测模式被称为广角替换帧内预测模式。
可基于当前块的比率来确定转换范围。在示例中,表6和表7分别表示当定义了35个帧内预测模式时和当定义了67个帧内预测模式时(排除广角帧内预测模式)的转换范围。
【表6】
条件 替换帧内预测模式
W/H=2 模式2,3,4
W/H>2 模式2,3,4,5,6
W/H=1
H/W=1/2 模式32,33,34
H/W<1/2 模式30,31,32,33,34
【表7】
条件 替换帧内预测模式
W/H=2 模式2,3,4,5,6,7
W/H>2 模式2,3,4,5,6,7,8,9,10,11
W/H=1
H/W=1/2 模式61,62,63,64,65,66
H/W<1/2 模式57,58,59,60,61,62,63,64,65,66
如在表6和表7中所示的示例中,根据当前块的比率,包括在转换范围中的广角替换帧内预测模式的数量可变化。通过对当前块的比率进行细分,可如下表8中进一步细分转换范围。
【表8】
Figure BDA0002967663620000631
Figure BDA0002967663620000641
当非相邻参考样点线被确定为当前块的参考样点线时,或者当选择多条参考样点线中的任意一条的多线帧内预测编码方法被使用时,可设置为不使用广角帧内预测模式。换句话说,虽然当前块是非正方形的并且当前块的帧内预测模式属于转换范围,但是当前块的帧内预测模式可不被转换为广角帧内预测模式。可选地,当当前块的帧内预测模式被确定为广角帧内预测模式时,可设置为使非相邻参考样点线不可用作当前块的参考样点线,或者不使用选择多条参考样点线中的任意一条的多线帧内预测编码方法。当不使用多线帧内预测编码方法时,可将相邻参考样点线确定为当前块的参考样点线。
当不使用广角帧内预测模式时,可将refW和refH设置为nTbW和nTbH的总和。因此,与当前块的距离为i的非相邻参考样点可包括除了左上参考样点之外的(nTbW+nTbH+offsetX[i])个上参考样点和(nTbW+nTbH+offsetY[i])个左参考样点。换句话说,与当前块的距离为i的非相邻参考样点可包括(2nTbW+2nTbH+offsetX[i]+offsetY[i]+1)个参考样点。例如,当whRatio的值大于1时,offsetX的值可被设置为大于offsetY的值。在示例中,offsetX的值可被设置为1,并且offsetY的值可被设置为0。另一方面,当whRatio的值小于1时,offsetY的值可被设置为大于offsetX的值。在示例中,offsetX的值可被设置为0,并且offsetY的值可被设置为1。
由于除了现有帧内预测模式之外还使用广角帧内预测模式,因此对广角帧内预测模式进行编码所需的资源可能增加并且编码效率可能降低。因此,作为按原样对广角帧内预测模式进行编码的替代,可对针对广角帧内预测模式的替换帧内预测模式进行编码以提高编码效率。
在示例中,当通过使用第67号的广角帧内预测模式对当前块进行编码时,可将第2号(第67号的广角替换帧内预测模式)编码为当前块的帧内预测模式。此外,当当前块被编码为第-1号的广角帧内预测模式时,可将第66号(第-1号的广角替换帧内预测模式)编码为当前块的帧内预测模式。
解码装置可对当前块的帧内预测模式进行解码,并判断经过解码的帧内预测模式是否被包括在转换范围中。当经过解码的帧内预测模式是广角替换帧内预测模式时,该帧内预测模式可被转换为广角帧内预测模式。
可选地,当当前块被编码为广角帧内预测模式时,广角帧内预测模式可按原样被编码。
可基于上述MPM列表执行帧内预测模式的编码。具体地,当邻近块被编码为广角帧内预测模式时,可基于与广角帧内预测模式对应的广角替换帧内预测模式来设置MPM。
编码块或变换块可被分区为多个子块(或子分区)。当编码块或变换块被分区为多个子块时,可针对每个子块执行预测、变换和量化。将编码块或变换块分区为多个子块的操作可被定义为子分区帧内编码方法。
可以以比特流用信号发送表示子分区帧内编码方法是否被应用的信息。所述信息可以是1比特标志。在示例中,可以以比特流用信号发送表示编码块或变换块是否被分区为多个子块的语法元素“intra_subpartitions_mode_flag”。
可选地,可基于编码块或变换块的尺寸、形状或帧内预测模式中的至少一个来确定子分区帧内编码方法是否被应用。在示例中,当编码块的帧内预测模式是非方向帧内预测模式(例如,平面或DC)或者预定义的方向帧内预测模式(例如,水平方向上的帧内预测模式、垂直方向上的帧内预测模式或对角线方向上的帧内预测模式)时,可设置为不应用子分区帧内编码方法。可选地,当编码块的尺寸小于阈值时,可设置为不应用子分区帧内编码方法。
可选地,当基于编码块的帧内预测模式执行针对子块的帧内预测时,可基于包括在邻近子块中的重建样点是否应被用作用于子块的帧内预测的参考样点来确定子分区帧内编码方法是否被应用。在示例中,当编码块的帧内预测模式是对角线方向上的帧内预测模式或广角帧内预测模式,并且邻近子块在基于帧内预测模式针对子块执行帧内预测时不能被用作参考样点时,可设置为不使用子分区帧内编码方法。
可选地,当编码块的高宽比等于或大于阈值或者等于或小于阈值时,可设置为不使用子分区帧内编码方法。可选地,当编码块的高度或宽度中的至少一个等于或小于阈值时,可设置为不使用子分区帧内编码方法。在示例中,当编码块的宽度或高度等于或小于阈值时,或者当编码块的高度和宽度两者等于或小于阈值时,子分区帧内编码方法可不被使用。可选地,当编码块中包括的样点的数量等于或小于阈值时,子分区帧内编码方法可不被使用。阈值可在编码装置和解码装置中具有预定义值。可选地,可以以比特流用信号发送用于确定阈值的信息。
可选地,可基于编码块或变换块的尺寸、形状或帧内预测模式中的至少一个来确定是否用信号发送指示子分区帧内编码方法是否被应用的标志。在示例中,仅当编码块的高度和宽度两者等于或小于阈值时以及/或者当编码块的尺寸等于或大于阈值时,指示子分区帧内编码方法是否被应用的标志可被编码并被用信号发送。当指示子分区帧内编码方法是否被应用的标志未被编码时,子分区帧内编码方法可不被应用。
当不使用子分区帧内编码方法时,可省略用信号发送语法元素intra_subpartitions_mode_flag的操作。当省略了用信号发送所述标志的操作时,所述标志可被视为指示子分区帧内编码方法未被应用。
当子分区帧内编码方法被应用时,可确定编码块或变换块的分区类型。在这种情况下,分区类型表示编码块或变换块的分区方向。在示例中,在垂直方向上进行分区可表示通过使用至少一条垂直线对编码块或变换块进行分区,并且在水平方向上进行分区可表示通过使用至少一条水平线对编码块或变换块进行分区。
图38是示出垂直方向分区和水平方向分区的示例的示图。
图38的(a)表示编码块被分区为2个子块的示例,并且图38(b)的表示编码块被分区为4个子块的示例。
可以以比特流用信号发送用于确定编码块或变换块的分区类型的信息。在示例中,可用信号发送表示垂直方向分区是否被应用于编码块或变换块或者水平方向分区是否被应用于编码块或变换块的信息。所述信息可以是1比特标志intra_subpart_type_flag。当所述标志的值为1时,这表示编码块或变换块在水平方向上被分区,并且当所述标志的值为0时,这表示编码块或变换块在垂直方向上被分区。
可选地,可基于编码块或变换块的尺寸、形状或帧内预测模式来确定编码块或变换块的分区类型。在示例中,可基于编码块的宽高比来确定编码块的分区类型。例如,当表示编码块的高宽比的whRatio的值等于或大于第一阈值时,可将垂直方向分区应用于编码块。否则,可将水平方向分区应用于编码块。
图39是示出确定编码块的分区类型的示例的示图。
为了便于描述,假设第一阈值为2。在图39的(a)中所示的示例中,编码块的whRatio为小于第一阈值的1。因此,可省略对表示编码块的分区类型的信息的编码,并且可将水平方向分区应用于编码块。
在图39(b)中所示的示例中,编码块的whRatio为与第一阈值相同的2。因此,可省略对表示编码块的分区类型的信息的编码,并且可将垂直方向分区应用于编码块。
可通过使用符号与第一阈值相反的第二阈值来确定编码块的分区类型。在示例中,当whRatio的值等于或小于第二阈值时,可将水平方向分区应用于编码块,否则,可将垂直方向分区应用于编码块。第一阈值和第二阈值的绝对值可相同,并且它们的符号可不同。在示例中,当第一阈值是N(在这种情况下,N是诸如1、2、4等的整数)时,第二阈值可以是-N。
图40是示出确定编码块的分区类型的示例的示图。
为了便于描述,假设第二阈值为-2。在图40的(a)中所示的示例中,编码块的whRatio为大于第二阈值的-1。因此,可省略对表示编码块的分区类型的信息的编码,并且可将垂直方向分区应用于编码块。
在图40的(b)中所示的示例中,编码块的whRatio为与第二阈值相同的-2。因此,可省略对表示编码块的分区类型的信息的编码,并且可将水平方向分区应用于编码块。
可选地,可基于第一阈值和第二阈值确定编码块的分区类型。在示例中,当whRatio的值等于或大于第一阈值时,可将水平方向分区应用于编码块,并且当whRatio的值等于或小于第二阈值时,可将垂直方向分区应用于编码块。当whRatio的值存在于第一阈值与第二阈值之间时,可通过对比特流中的信息进行解析来确定编码块的分区类型。
可在编码装置和解码装置中预定义第一阈值和第二阈值。可选地,可按序列、画面或条带定义第一阈值和第二阈值。
可选地,可基于编码块或变换块的尺寸确定分区类型。在示例中,当编码块的尺寸为N×n时,可应用垂直方向分区,并且当编码块的尺寸为n×N时,可应用水平方向分区。在这种情况下,n可以是小于N的自然数。N和/或n可以是编码装置和解码装置中的预定义值。可选地,可以以比特流用信号发送用于确定N和/或n的信息。在示例中,N可以是32、64、128或256等。因此,当编码块的尺寸为128×n(在这种情况下,n是诸如16、32或64等的自然数)时,可应用垂直方向分区,并且当编码块的尺寸是n×128时,可应用水平方向分区。
可选地,可基于编码块或变换块的帧内预测模式来确定编码块或变换块的分区类型。在示例中,当编码块的帧内预测模式具有水平方向或具有与水平方向相似的方向时,可将垂直方向分区应用于编码块。在这种情况下,具有与水平方向相似的方向的帧内预测模式表示与水平方向上的帧内预测模式(例如,图32的(b)中所示的INTRA_ANGULAR18)的索引差值等于或小于阈值的帧内预测模式(例如,INTRA_ANGULAR18±N)。另一方面,当编码块的帧内预测模式具有垂直方向或具有与垂直方向相似的方向时,可将水平方向分区应用于编码块。在这种情况下,具有与垂直方向相似的方向的帧内预测模式表示与垂直方向上的帧内预测模式(例如,图32(b)中所示的INTRA_ANGULAR50)的索引差值等于或小于阈值的帧内预测模式(例如,INTRA_ANGULAR50±N)。在这种情况下,阈值N可以是编码装置和解码装置中的预定义值。可选地,可在序列级、画面级或条带级用信号发送用于确定阈值N的信息。
图41是示出基于编码块的帧内预测模式确定编码块的分区类型的示例的示图。
如在图41的(a)中所示的示例中,当编码块的帧内预测模式具有与垂直方向相似的方向时,可将水平方向分区应用于编码块。
另一方面,如在图41的(b)中所示的示例中,当编码块的帧内预测模式具有与水平方向相似的方向时,可将垂直方向分区应用于编码块。
与示出的示例相反,当编码块的帧内预测模式具有水平方向或具有与水平方向相似的方向时,可应用水平方向分区,并且当编码块的帧内预测模式具有垂直方向或具有与垂直方向相似的方向时,可应用垂直方向分区。
当垂直方向分区或水平方向分区被应用时,可基于通过对编码块或变换块进行分区而生成的子块的宽度或高度中的至少一个是否小于阈值来确定编码块或变换块的分区类型。在这种情况下,阈值可以是诸如2、4或8等的整数。
图42是用于描述编码块的分区方面的示图。
如果水平方向分区被应用于图42的(a)中所示的4×8尺寸的编码块,则编码块被分区为2×8尺寸的子块。在这种情况下,子块的宽度小于阈值,所以水平方向分区不可用于编码块。另一方面,如果垂直方向分区被应用于4×8尺寸的编码块,则编码块被分区为4×4尺寸的子块。由于子块的宽度和高度都等于或大于阈值,因此垂直方向分区可用于编码块。由于仅垂直方向分区可用于编码块,因此可省略对表示编码块的分区类型的信息的编码,并且可将垂直方向分区应用于编码块。
如果垂直方向分区被应用于图42的(b)中所示的8×4尺寸的编码块,则编码块被分区为8×2尺寸的子块。在这种情况下,子块的高度小于阈值,所以垂直方向分区不可用于编码块。另一方面,如果水平方向分区被应用于8×4尺寸的编码块,则编码块被分区为4×4尺寸的子块。由于子块的宽度和高度都等于或大于阈值,因此水平方向分区可用于编码块。由于仅水平方向分区可用于编码块,因此可省略对表示编码块的分区类型的信息的编码,并且可将垂直方向分区应用于编码块。
如果垂直方向分区和水平方向分区都可用,则可通过对指示编码块的分区类型的信息进行解析来确定编码块的分区类型。
可基于编码块或变换块的尺寸或形状中的至少一个来确定子块的数量。在示例中,当编码块的宽度或高度中的一个为8且另一个为4时,编码块可被分区为2个子块。另一方面,当编码块的宽度和高度都为8或更大时,或者当编码块的宽度或高度中的一个大于8时,编码块可被分区为4个子块。总之,当编码块具有4×4尺寸时,编码块可不被分区为子块。当编码块具有4×8或8×4尺寸时,编码块可被分区为2个子块。否则,编码块可被分区为4个子块。
可选地,可以以比特流用信号发送表示子块的尺寸或形状或者子块的数量的信息。子块的尺寸或形状可由表示子块的数量的信息来确定。可选地,可通过表示子块的尺寸或形状的信息来确定子块的数量。
当子分区帧内编码方法被应用时,通过对编码块或变换块进行分区而生成的子块可使用相同的帧内预测模式。在示例中,可基于与编码块相邻的邻近块的帧内预测模式来推导针对编码块的MPM,并且可基于推导出的MPM来确定针对编码块的帧内预测模式。当编码块的帧内预测模式被确定时,每个子块可通过使用所确定的帧内预测模式来执行帧内预测。
当子分区帧内编码方法被应用时,MPM中的一个MPM可被确定为编码块的帧内预测模式。换句话说,当子分区帧内编码方法被应用时,虽然MPM标志未被用信号发送,但是MPM标志可被推断为真。
可选地,当子分区帧内编码方法被应用时,预定义的候选帧内预测模式中的一个候选帧内预测模式可被确定为编码块的帧内预测模式。在示例中,具有水平方向的帧内预测模式、具有垂直方向的帧内预测模式、具有对角线方向的帧内预测模式(例如,左上帧内预测模式、右上帧内预测模式或左下帧内预测模式中的至少一个)或者非方向帧内预测模式(例如,平面或DC中的至少一个)中的一个可被确定为编码块的帧内预测模式。可以以比特流用信号发送指定预定义的候选帧内预测模式中的一个候选帧内预测模式的索引信息。可选地,根据编码块的分区方向,候选帧内预测模式的数量和/或类型可不同。在示例中,当水平方向分区被应用于编码块时,非方向帧内预测模式、具有垂直方向的帧内预测模式、具有左上对角线方向的帧内预测模式或具有右上对角线方向的帧内预测模式中的至少一个可被设置为候选帧内预测模式。另一方面,当垂直方向分区被应用于编码块时,非方向帧内预测模式、具有水平方向的帧内预测模式、具有左上对角线方向的帧内预测模式或具有左下对角线方向的帧内预测模式中的至少一个可被设置为候选帧内预测模式。
根据本公开的实施例,子块的至少一个帧内预测模式可与其他子块不同地被设置。在示例中,可通过将偏移与第(N-1)子块的帧内预测模式相加或从第(N-1)子块的帧内预测模式减去偏移来推导第N子块的帧内预测模式。可在编码装置和解码装置中预定义偏移。可选地,可基于编码块的尺寸、形状或帧内预测模式、子块的尺寸或形状、子块的数量、或者编码块的分区方向中的至少一个来推导偏移。可选地,可以以比特流用信号发送用于推导偏移的信息。
可选地,当第(N-1)子块的帧内预测模式为非方向模式时,第N子块的帧内预测模式也可被设置为与第(N-1)子块的帧内预测模式相同,并且当第(N-1)子块的帧内预测模式为方向模式时,通过将偏移与第(N-1)子块的帧内预测模式相加或从第(N-1)子块的帧内预测模式减去偏移而推导出的帧内预测模式可被设置为第N子块的帧内预测模式。
可选地,可将方向帧内预测模式应用于多个子块中的一部分子块,并且可将非方向帧内预测模式应用于其余部分子块。可通过考虑子块的尺寸、形状或位置或者子块的数量中的至少一个来确定应用非方向帧内预测模式的子块。可选地,仅当应用于多个子块中的一个子块的方向帧内预测模式是预定义值时,可将非方向帧内预测模式应用于另一子块。
可选地,可从MPM推导每个子块的帧内预测模式。对此,可针对每个子块用信号发送指定MPM中的任意一个MPM的索引信息。
可选地,可从预定义的候选帧内预测模式推导每个子块的帧内预测模式。对此,可针对每个子块用信号发送指定预定义的候选帧内预测模式中的任意一个候选帧内预测模式的索引信息。可按子块不同地设置候选帧内预测模式的数量和/或类型。
可选地,可以以比特流用信号发送表示子块的帧内预测模式是否被设置为相同的信息。
可分别确定子块的量化参数。因此,可不同地设置每个子块的量化参数的值。表示与先前子块的量化参数的差值的信息可被编码以确定每个子块的量化参数。在示例中,对于第N子块,第N子块的量化参数与第(N-1)子块的量化参数之间的差值可被编码。
可通过使用参考样点来执行子块的帧内预测。在这种情况下,可从与子块相邻的邻近块的重建样点推导参考样点。当与子块相邻的邻近块是与所述子块包括在同一编码块中的另一子块时,可基于所述另一子块的重建样点推导所述子块的参考样点。在示例中,当第一子块位于第二子块的左侧或上方时,可从第一子块的重建样点推导第二子块的参考样点。对此,可不在子块之间应用并行帧内预测。换句话说,可针对编码块中包括的子块依次进行编码/解码。因此,在完成了第一子块的编码/解码之后,可执行针对第二子块的帧内预测。
当子分区帧内编码方法被应用时,可设置为不使用选择多条参考样点线候选中的任意一条参考样点线候选的多线帧内预测编码方法。当不使用多线帧内预测编码方法时,可将与每个子块相邻的相邻参考样点线确定为每个子块的参考样点线。可选地,当当前块的参考样点线的索引大于0时,可省略对表示子分区帧内编码方法是否被应用的语法元素intra_subpartitions_mode_flag的编码。当省略了对语法intra_subpartitions_mode_flag的编码时,子分区帧内编码方法可被不应用。
可选地,虽然应用了子分区帧内编码方法,但是可使用多线帧内预测编码方法。对此,可针对每个子块用信号发送用于指定参考样点线的索引信息。可选地,可仅针对多个子块中的任意一个子块用信号发送用于指定参考样点线的索引信息,并且所述索引信息还可被应用于其余子块。可选地,可针对编码块用信号发送用于指定参考样点线的索引信息,并且包括在编码块中的多个子块可共享所述索引信息。
可选地,多线帧内预测编码方法可仅被用于子块中的预定义位置处的子块或具有预定义分区索引的子块。在示例中,可仅针对多个子块中的分区索引为0的子块或者与编码块的上边界或左边界邻接的子块用信号发送指定参考样点线候选中的任意一条参考样点线候选的索引信息。多线帧内预测编码方法可不被应用于其余子块。因此,其余子块可通过使用相邻参考样点线来执行帧内预测。
当预测块作为帧内预测的结果而被生成时,可基于包括在预测块中的预测样点的每个位置来更新预测样点。这样的更新方法可被称为基于样点位置的帧内加权预测方法(或位置相关预测组合PDPC)。
可考虑当前块的尺寸、形状或帧内预测模式、当前块的参考样点线、当前块的尺寸或者颜色分量来确定是否使用PDPC。在示例中,当当前块的帧内预测模式为平面、DC、垂直方向、水平方向、索引值小于垂直方向的模式或索引值大于水平方向的模式中的至少一个时,可使用PDPC。可选地,仅当当前块的宽度或高度中的至少一个大于4时,可使用PDPC。可选地,仅当当前块的参考画面线的索引为0时,可使用PDPC。可选地,仅当当前块的参考画面线的索引超过预定义值时,可使用PDPC。可选地,可仅针对亮度分量使用PDPC。可选地,可根据以上列举的条件中的多于2个条件是否被满足来确定是否使用PDPC。
可选地,基于子分区帧内编码方法是否被使用,可确定是否使用PDPC。在示例中,当子分区帧内编码方法被应用于编码块或变换块时,可将PDPC设置为不被使用。可选地,当子分区帧内编码方法被应用于编码块或变换块时,可将PDPC应用于多个子块中的至少一个子块。在这种情况下,可基于编码块或子块的尺寸、形状、位置、帧内预测模式或参考样点线索引中的至少一个来确定作为PDPC的目标的子块。在示例中,可将PDPC应用于与编码块的上边界和/或左边界相邻的子块或者与编码块的下边界和/或右边界相邻的子块。可选地,基于子块的尺寸或形状,可设置为将PDPC应用于编码块中包括的所有子块,或者不将PDPC应用于编码块中包括的所有子块。在示例中,当子块的宽度或高度中的至少一个小于阈值时,可省略对PDPC的应用。在另一示例中,PDPC可被应用于编码块中的所有子块。
可选地,基于通过对编码块或变换块进行分区而生成的子块的尺寸、形状、帧内预测模式或参考画面索引中的至少一个是否满足预设条件,可针对每个子块确定是否应用PDPC。在示例中,当子块的宽度或高度中的至少一个大于4时,可将PDPC应用于子块。
在另一示例中,可以以比特流用信号发送示出PDPC是否被应用的信息。
可选地,基于当前块的尺寸、形状或帧内预测模式或者预测样点的位置中的至少一个,可确定应用PDPC的区域。在示例中,当当前块的帧内预测模式具有大于垂直方向的索引时,可不对x轴坐标或y轴坐标中的至少一个大于阈值的预测样点进行校正,并且可仅对x轴坐标或y轴坐标等于或小于阈值的预测样点进行校正。可选地,当当前块的帧内预测模式具有小于水平方向的索引时,可不对x轴坐标或y轴坐标中的至少一个大于阈值的预测样点进行校正,并且可仅对x轴坐标或y轴坐标等于或小于阈值的预测样点进行校正。在这种情况下,阈值可基于当前块的尺寸、形状或帧内预测模式中的至少一个来确定。
当通过帧内预测样点获得了预测样点时,可基于所获得的预测样点的位置来确定用于对预测样点进行校正的参考样点。
可通过从原始图像减去预测图像来推导残差图像。就此而言,当将残差图像转换到频域时,即使从频率分量去除了高频分量,图像的主观图像质量也不会显著下降。因此,当高频分量的值被变换为小值时,或者当高频分量的值被设置为0时,可在不导致大的视觉失真的情况下提高压缩效率。反映上述特征,可对当前块执行变换,以便将残差图像分解为二维频率分量。可通过使用诸如DCT(离散余弦变换)、DST(离散正弦变换)等的变换方法来执行变换。
DCT用于通过使用余弦变换将残差图像分解(或变换)为二维频率分量,并且DST用于通过使用正弦变换将残差图像合成(或变换)为二维频率分量。作为对残差图像进行变换的结果,频率分量可被表示为基本图像。在示例中,当针对N×N尺寸的块执行DCT变换时,可获得N2个基本模式分量。可通过变换获得N×N尺寸的块中包括的基本模式分量中的每个基本模式分量的尺寸。根据所使用的变换方法,基本模式分量的尺寸可被称为DCT系数或DST系数。
变换方法DCT主要被用于对分布有许多非零低频分量的图像进行变换。变换方法DST主要被用于分布有许多高频分量的图像。
还可通过使用除了DCT或DST之外的变换方法来对残差图像进行变换。
在下文中,将残差图像变换为二维频率分量的操作被称为二维图像变换。此外,通过变换获得的基本模式分量的尺寸被称为变换系数。在示例中,变换系数可表示DCT系数或DST系数。当以下描述的首次变换和二次变换两者被应用时,变换系数可表示通过二次变换的结果生成的基本模式分量。此外,应用变换跳过的残差样点也被称为变换系数。
可以以块为单位确定变换方法。可基于当前块的预测编码模式、当前块的尺寸或当前块的形状中的至少一个来确定变换方法。在示例中,当通过帧内预测模式对当前块进行编码并且当前块的尺寸小于N×N时,可通过使用DST变换方法来执行变换。另一方面,当不满足所述条件时,可通过使用DCT变换方法来执行变换。
对于残差图像的一些块,可不执行二维图像变换。不执行二维图像变换可被称为变换跳过。变换跳过表示首次变换和二次变换不被应用于当前块。当变换跳过被应用时,可将量化应用于不执行变换的残差值。
可基于当前块的尺寸或形状中的至少一个来确定针对当前块是否允许变换跳过。在示例中,仅当当前块的尺寸小于阈值时,可应用变换跳过。阈值与当前块的宽度、高度或样点的数量中的至少一个相关,并且可被定义为32×32等。可选地,可仅针对正方形块允许变换跳过。在示例中,针对32×32、16×16、8×8或4×4尺寸的正方形块,可允许变换跳过。可选地,仅当子分区帧内编码方法不被使用时,可允许变换跳过。
可选地,当子分区帧内编码方法被应用于当前块时,可针对每个子块确定是否应用变换跳过。
图43是示出按子块确定是否执行变换跳过的示例的示图。
变换跳过可仅被应用于多个子块中的一部分子块。在示例中,如在图43中所示的示例中,可设置为将变换跳过应用于当前块的上方位置处的子块并且不将变换跳过应用于下方位置处的子块。
可基于以比特流用信号发送的信息来确定不允许变换跳过的子块的变换类型。在示例中,可基于tu_mts_idx来确定变换类型,这将在下面进行描述。
可选地,可基于子块的尺寸来确定子块的变换类型。在示例中,可基于子块的宽度是否等于或大于以及/或者等于或小于阈值来确定水平方向变换类型,并且可基于子块的高度是否等于或大于以及/或者等于或小于阈值来确定垂直方向变换类型。
在通过使用DCT或DST对当前块执行变换之后,可再次对经过变换的当前块执行变换。就此而言,基于DCT或DST的变换可被定义为首次变换,并且再次对应用了首次变换的块执行变换可被定义为二次变换。
可通过使用多个变换核候选中的任意一个来执行首次变换。在示例中,可通过使用DCT2、DCT8或DST7中的任意一个来执行首次变换。
不同变换核可被用于水平方向和垂直方向。可以以比特流用信号发送表示水平方向的变换核和垂直方向的变换核的组合的信息。
首次变换的处理单元可不同于二次变换。在示例中,可对8×8的块执行首次变换,并且可对经过变换的8×8的块内的4×4尺寸的子块执行二次变换。可选地,可针对属于3个4×4尺寸的子块的变换系数执行二次变换。所述3个子块可包括位于当前块的左上方的子块、与该子块的右侧邻近的子块和与该子块的下方邻近的子块。可选地,可针对8×8尺寸的块执行二次变换。
还可将不执行二次变换的其余区域中的变换系数设置为0。
可选地,可对4×4的块执行首次变换,并且可对包括经过变换的4×4的块的尺寸为8×8的区域执行二次变换。
可以以比特流用信号发送表示是否执行二次变换的信息。在示例中,可用信号发送表示是否执行二次变换的标志或者指定是否执行二次变换的索引信息以及用于二次变换的变换核。在示例中,当索引信息为0时,这表示不针对当前块执行二次变换。另一方面,当索引信息大于0时,可通过索引信息确定用于二次变换的变换核。
可选地,可基于水平方向变换核和垂直方向变换核是否彼此相同来确定是否执行二次变换。在一个示例中,可仅在水平方向变换核和垂直方向变换核彼此相同时执行二次变换。可选地,可仅在水平方向变换核和垂直方向变换核彼此不同时执行二次变换。
可选地,可仅在预定义变换核被用于水平方向变换和垂直方向变换时允许二次变换。在一个示例中,当DCT2变换核被用于水平方向上的变换和垂直方向上的变换时,可允许二次变换。可选地,当子分区帧内编码方法被应用于当前块时,仅当DCT2变换核被用于水平方向上的变换和垂直方向上的变换时,可允许二次变换。
可选地,可基于当前块的非零变换系数的数量来确定是否执行二次变换。在一个示例中,当当前块的非零变换系数的数量小于或等于阈值时,预测方法可被配置为不使用二次变换。当当前块的非零变换系数的数量大于阈值时,预测方法可被配置为使用二次变换。只要使用帧内预测对当前块进行编码,预测方法就可被配置为使用二次变换。
可选地,可基于当前块的最后非零变换系数的位置来确定是否执行二次变换。在示例中,当当前块的最后非零变换系数的x轴坐标或y轴坐标中的至少一个大于阈值时,或者当当前块的最后非零变换系数所属的子块的x轴坐标或y轴坐标中的至少一个大于阈值时,可不执行二次变换。在这种情况下,可在编码装置和解码装置中预定义阈值。可选地,可基于当前块的尺寸或形状来确定阈值。
可选地,当在当前块中仅存在DC分量的变换系数时,可设置为不执行二次变换。在这种情况下,DC分量表示当前块中的左上方位置处的变换系数。
可选地,当基于矩阵的帧内预测被应用于当前块时,可设置为不执行二次变换。
可以以比特流用信号发送表示当前块的变换类型的信息。所述信息可以是表示针对水平方向的变换类型和针对垂直方向的变换类型的组合中的一个组合的索引信息tu_mts_idx。
基于由索引信息tu_mts_idx指定的变换类型候选,可确定针对垂直方向的变换核和针对水平方向的变换核。表9表示根据tu_mts_idx的变换类型组合。
【表9】
Figure BDA0002967663620000761
变换类型可被确定为DCT2、DST7或DCT8中的一个。可选地,变换跳过可被插入在变换类型候选中。
当使用表9时,当tu_mts_idx为0时,可在水平方向上和在垂直方向上应用DCT2。当tu_mts_idx为2时,可在水平方向上应用DCT8,并且可在垂直方向上应用DCT7。
当子分区帧内编码方法被应用时,可独立地确定子块的变换核。在示例中,用于指定变换类型组合候选的信息可按子块被编码并被用信号发送。因此,子块之间的变换核可不同。
可选地,子块可使用相同的变换类型。在这种情况下,可仅针对第一子块用信号发送指定变换类型组合候选的tu_mts_idx。可选地,可在编码块级用信号发送tu_mts_idx,并且可通过参考在编码块级被用信号发送的tu_mts_idx来确定子块的变换类型。可选地,可基于子块中的一个子块的尺寸、形状或帧内预测模式中的至少一个来确定变换类型,并且可将所确定的变换类型设置为用于所有子块。
图44是示出子块使用相同的变换类型的示例的示图。
当编码块在水平方向上被分区时,可将编码块的上方位置处的子块(Sub-CU0)的变换类型设置为与下方位置处的子块(Sub-CU1)的变换类型相同。在示例中,如在图44的(a)中所示的示例中,当针对上方子块基于被用信号发送的tu_mts_idx确定了水平变换类型和垂直变换类型时,所确定的变换类型也可被应用于下方子块。
当编码块在垂直方向上被分区时,可将编码块的左侧位置处的子块(Sub-CU0)的变换类型设置为与右侧位置处的子块(Sub-CU1)的变换类型相同。在示例中,如在图44的(b)中所示的示例中,当针对左侧子块基于被用信号发送的tu_mts_idx确定了水平变换类型和垂直变换类型时,所确定的变换类型也可被应用于右侧子块。
可基于当前块的尺寸或形状、非零系数的数量、二次变换是否被执行或者子分区帧内编码方法是否被应用中的至少一个来确定是否对索引信息进行编码。在示例中,当子分区帧内编码方法被应用于当前块时,或者当非零系数的数量等于或小于阈值时,可省略用信号发送索引信息的操作。当省略用信号发送索引信息的操作时,可将默认变换类型应用于当前块。
默认变换类型可包括DCT2或DST7中的至少一个。当存在多个默认变换类型时,可通过考虑当前块的尺寸、形状或帧内预测模式、二次变换是否被执行或者子分区帧内编码方法是否被应用中的至少一个来选择多个默认变换类型中的一个默认变换类型。在示例中,可基于当前块的宽度是否在预设范围中来将多个变换类型中的一个变换类型确定为水平方向变换类型,并且可基于当前块的高度是否在预设范围中来将多个变换类型中的一个变换类型确定为垂直方向变换类型。可选地,可根据当前块的尺寸、形状或帧内预测模式或者二次变换是否被执行来不同地确定默认模式。
可选地,当在当前块中仅存在DC分量的变换系数时,水平方向变换类型和垂直方向变换类型可被设置为默认变换类型。在示例中,当在当前块中仅存在DC分量的变换系数时,水平方向变换类型和垂直方向变换类型可被设置为DCT2。
可基于当前块的尺寸或形状确定阈值。在示例中,当当前块的尺寸等于或小于32×32时,可将阈值设置为2,并且当当前块大于32×32时(例如,当当前块为32×64或64×32尺寸的编码块时),可将阈值设置为4。
多个查找表可被预先存储在编码装置/解码装置中。分配给变换类型组合候选的索引值、变换类型组合候选的类型或变换类型组合候选的数量中的至少一个对于多个查找表中的每个查找表可以是不同的。
基于当前块的尺寸、形状或帧内预测模式、二次变换是否被应用或者变换跳过是否被应用于邻近块中的至少一个,可选择针对当前块的查找表。
在示例中,当当前块的尺寸等于或小于4×4时,或者当当前块通过帧间预测被编码时,可使用第一查找表,并且当当前块的尺寸大于4×4时,或者当当前块通过帧内预测被编码时,可使用第二查找表。
可选地,可以以比特流用信号发送指示多个查找表中的一个查找表的信息。解码装置可基于所述信息选择针对当前块的查找表。
在另一示例中,可基于当前块的尺寸、形状、预测编码模式或帧内预测模式、二次变换是否被应用或者变换跳过是否被应用于邻近块中的至少一个来自适应地确定分配给变换类型组合候选的索引。在示例中,在当前块的尺寸为4×4时分配给变换跳过的索引可小于在当前块的尺寸大于4×4时分配给变换跳过的索引。具体地,当当前块的尺寸为4×4时,可将索引0分配给变换跳过,并且当当前块大于4×4且等于或小于16×16时,可将大于0的索引(例如,索引1)分配给变换跳过。当当前块大于16×16时,可将最大值(例如,5)分配给变换跳过的索引。
可选地,当当前块通过帧间预测被编码时,可将索引0分配给变换跳过。当当前块通过帧内预测被编码时,可将大于0的索引(例如,索引1)分配给变换跳过。
可选地,当当前块是通过帧间预测被编码的4×4尺寸的块时,可将索引0分配给变换跳过。另一方面,当当前块不是通过帧间预测被编码时,或者当当前块大于4×4时,可将大于0的索引(例如,索引1)分配给变换跳过。
还可使用与表9中列出的变换类型组合候选不同的变换类型组合候选。在示例中,可使用由应用于水平方向变换或垂直方向变换中的一个的变换跳过以及应用于水平方向变换或垂直方向变换中的另一个的变换核(诸如DCT2、DCT8或DST7等)组成的变换类型组合候选。在这种情况下,可基于当前块的尺寸(例如,宽度和/或高度)、形状、预测编码模式或帧内预测模式中的至少一个来确定变换跳过是否将被用作针对水平方向或垂直方向的变换类型候选。
可以以比特流用信号发送表示用于确定当前块的变换类型的索引信息是否被显式地用信号发送的信息。在示例中,可在序列级用信号发送表示针对通过帧内预测被编码的块是否允许显式变换类型确定的信息sps_explicit_intra_mts_flag以及/或者表示针对通过帧间预测被编码的块是否允许显式变换类型确定的信息sps_explicit_inter_mts_flag。
当允许显式变换类型确定时,可基于以比特流被用信号发送的索引信息tu_mts_idx来确定当前块的变换类型。另一方面,当不允许显式变换类型确定时,可基于当前块的尺寸或形状、是否允许以子块为单位执行变换、包括非零变换系数的子块的位置、二次变换是否被执行或者子分区帧内编码方法是否被应用中的至少一个来确定变换类型。在示例中,可基于当前块的宽度确定当前块的水平方向变换类型,并且可基于当前块的高度确定当前块的垂直方向变换类型。例如,当当前块的宽度小于4或大于16时,可将水平方向变换类型确定为DCT2。否则,可将水平方向变换类型确定为DST7。当当前块的高度小于4或大于16时,可将垂直方向变换类型确定为DCT2。否则,可将垂直方向变换类型确定为DST7。在这种情况下,可基于当前块的尺寸、形状或帧内预测模式中的至少一个来确定将与宽度和高度进行比较的阈值,以确定水平方向变换类型和垂直方向变换类型。
可选地,当当前块具有高度和宽度相同的正方形形状时,可将水平方向变换类型和垂直方向变换类型设置为相同,但是当当前块具有高度和宽度彼此不同的非正方形形状时,可不同地设置水平方向变换类型和垂直方向变换类型。在示例中,当当前块的宽度大于高度时,可将水平方向变换类型确定为DST7,并且可将垂直方向变换类型确定为DCT2。当当前块的高度大于宽度时,可将垂直方向变换类型确定为DST7,并且可将水平方向变换类型确定为DCT2。
变换类型候选的数量和/或类型或者变换类型组合候选的数量和/或类型可根据显式变换类型确定是否被允许而不同。在示例中,当显式变换类型确定被允许时,DCT2、DST7和DCT8可被用作变换类型候选。因此,水平方向变换类型和垂直方向变换类型中的每一个可被设置为DCT2、DST8或DCT8。当显式变换类型确定不被允许时,仅DCT2和DST7可被用作变换类型候选。因此,可将水平方向变换类型和垂直方向变换类型中的每一个确定为DCT2或DST7。
编码块或变换块可被分区为多个子块,并且可仅针对多个子块中的部分子块执行变换。仅将变换应用于多个子块中的部分子块的操作可被定义为子变换块编码方法。
图45和46是示出子变换块编码方法的应用方面的示图。
图45是示出仅针对4个子块中的一个子块执行变换的示例的示图,图50是示出仅针对2个子块中的任意一个子块执行变换的示例的示图。在图45和图46中,假设仅针对标记了“目标”的子块执行变换。
如在图45中所示的示例中,在通过使用相互正交的垂直线和水平线将编码块分区为4个子块之后,可仅针对它们中的一个子块执行变换和量化。未执行变换的子块中的变换系数可被设置为0。
可选地,如在图46中所示的示例中,在通过使用垂直线或水平线将编码块分区为2个子块之后,可仅针对它们中的一个子块执行变换和量化。未执行变换的子块中的变换系数可被设置为0。
可以以比特流用信号发送表示子变换块编码方法是否被应用于编码块的信息。所述信息可以是1比特标志cu_sbt_flag。当所述标志为1时,这表示仅针对通过对编码块或变换块进行分区而生成的多个子块中的部分子块执行变换,并且当标志为0时,这表示在未将编码块或变换块分区为子块的情况下执行变换。
可基于编码块的尺寸、形状或预测编码模式或者组合预测模式是否被用于编码块中的至少一个来确定子变换块编码方法是否可被用于编码块。在示例中,当以下情况中的至少一个情况被满足时,子变换块编码方法可用于编码块:编码块的宽度或高度中的至少一个等于或大于阈值的情况、帧间预测被应用于编码块的情况、或者组合预测模式未被应用于编码块的情况。在这种情况下,阈值可以是诸如4、8或16等的自然数。
可选地,当编码块的宽高比大于阈值时,可不允许应用子变换块编码方法。
当帧内预测被应用于编码块时或者当帧内块复制模式被应用时,子变换块编码方法可被确定为不可用。
可选地,可基于子分区帧内编码方法是否被应用于编码块来确定子变换块编码方法是否可用于编码块。在示例中,当子分区帧内编码方法被应用时,子变换块编码方法可被确定为可用。
当子变换块编码方法被确定可用于编码块时,可以以比特流用信号发送语法cu_sbt_flag。根据经过解析的cu_sbt_flag的值,可确定子变换块编码方法是否被应用。
另一方面,当子变换块编码方法被确定为不可用于编码块时,可省略用信号发送语法cu_sbt_flag的操作。当省略用信号发送语法cu_sbt_flag的操作时,可确定不将子变换块编码方法应用于编码块。
当子变换编码方法被应用于编码块时,可以以比特流用信号发送表示编码块的分区形状的信息。表示编码块的分区形状的信息可包括表示编码块是否被分区为4个子块的信息、表示编码块的分区方向的信息或表示子块的数量的信息中的至少一个。
在示例中,当语法cu_sbt_flag为1时,可用信号发送表示编码块是否被分区为4个子块的标志cu_sbt_quadtree_flag。当语法cu_sbt_quadtree_flag为1时,这表示编码块被分区为4个子块。在示例中,可通过使用3条垂直线或3条水平线将编码块分区为4个子块,或者可通过使用1条垂直线和1条水平线将编码块分区为4个子块。将编码块分区为4个子块的操作可被称为四叉树分区。
当语法cu_sbt_quadtree_flag为0时,这表示编码块被分区为2个子块。在示例中,可通过使用1条垂直线或1条水平线将编码块分区为2个子块。将编码块分区为2个子块的操作可被称为二叉树分区。当语法cu_sbt_quad_tree_flag的值为0时,尺寸为编码块的1/2的子块可被包括在该编码块中。
此外,可以以比特流用信号发送表示编码块的分区方向的标志。在示例中,表示水平方向分区是否被应用于编码块的标志cu_sbt_horizontal_flag可被编码并被用信号发送。当cu_sbt_horizontal_flag的值为1时,这表示使用与编码块的上侧和下侧平行的至少一条分区线的水平方向分区被应用。当cu_sbt_horizontal_flag的值为0时,这表示使用与编码块的左侧和右侧平行的至少一条分区线的垂直方向分区被应用。
根据编码块的尺寸或形状,可确定编码块的分区形状。在示例中,当编码块的宽度或高度中的至少一个等于或大于第一阈值时,四叉树分区可以是可用的。在示例中,第一阈值可以是诸如4、8或16的自然数。第一阈值可被称为四叉树阈值。
当四叉树分区被确定为可用时,可以以比特流用信号发送语法cu_sbt_quadtree_flag。根据经过解析的cu_sbt_quadtree_flag的值,可确定四叉树分区是否被应用于编码块。
当四叉树分区被确定为不可用时,可省略用信号发送语法cu_sbt_quadtree_flag的操作。当省略用信号发送语法cu_sbt_quadtree_flag的操作时,可确定将二叉树分区应用于编码块。
表10示出用于确定是否对语法cu_sbt_quadtree_flag进行解析的语法结构。
【表10】
Figure BDA0002967663620000831
Figure BDA0002967663620000841
在表10中,变量allowSbtVerQ表示是否允许垂直方向上的四叉树分区,并且变量allowSbtHorQ表示是否允许水平方向上的四叉树分区。可基于四叉树阈值来确定变量allowSbtVerQ和allowSbtHorQ。在示例中,当四叉树阈值为16时,可基于编码块的宽度是否等于或大于16来确定allowSbtVerQ,并且可基于编码块的高度是否等于或大于16来确定allowSbtHorQ。
如在表10中所示的示例中,当变量allowSbtVerQ和allowSbtHorQ都为真时,可从比特流对语法cu_sbt_quad_flag进行解析。在示例中,当编码块是16×8时,变量allowSbtHorQ被设置为假,所以可省略对语法cu_sbt_quad_flag的解析。可选地,当编码块是8×16时,变量allowSbtVerQ被设置为假,所以可省略对语法cu_sbt_quad_flag的解析。当省略对语法cu_sbt_quad_flag的解析时,二叉树分区可被应用于编码块。
可选地,与表10中所示的示例不同,当变量allowSbtVerQ或变量allowSbtHorQ中的任意一个为真时,可对语法cu_sbt_quad_flag进行解析。换句话说,当编码块的宽度和高度中的仅任意一个等于或大于四叉树阈值时,四叉树分区可以是可用的。
可选地,虽然编码块的宽度或高度中的任意一个等于或大于第一阈值,但是当编码块的宽度或高度中的另一个等于或小于第二阈值时,编码块的四叉树分区可被确定为不可用。在这种情况下,第二阈值可具有小于第一阈值的值。在示例中,第二阈值可以是诸如2、4或8的自然数。
变量allowSbtHorH表示水平方向上的二叉树分区是否可用。当编码块的高度等于或大于阈值时,水平方向上的二叉树分区可被设置为可用。变量allowSbtVerH表示垂直方向上的二叉树分区是否可用。当编码块的宽度等于或大于阈值时,垂直方向上的二叉树分区可被设置为可用。在这种情况下,阈值可以是诸如4、8或16的自然数。
当水平方向上的四叉树分区/二叉树分区和垂直方向上的四叉树分区/二叉树分区都可用时,可以以比特流用信号发送语法cu_sbt_horizontal_flag。根据语法cu_sbt_horizontal_flag的值,可将水平方向上的分区或垂直方向上的分区应用于编码块。
另一方面,当水平方向上的四叉树分区/二叉树分区和垂直方向上的四叉树分区/二叉树分区中的仅一个可用时,可省略用信号发送语法cu_sbt_horizontal_flag的操作。当省略用信号发送语法cu_sbt_horizontal_flag的操作时,水平方向上的四叉树分区/二叉树分区和垂直方向上的四叉树分区/二叉树分区中的可用的一个可被应用。
可选地,可基于编码块的形状来确定编码块的分区类型。在示例中,可基于编码块的宽高比是否大于阈值来确定是否允许四叉树分区、是否允许水平方向上的四叉树分区/二叉树分区或者是否允许垂直方向上的四叉树分区/二叉树分区中的至少一个。阈值可以是诸如2、3或4等的自然数。
表11示出确定基于编码块的形状来确定是否允许分区类型的示例。
【表11】
Figure BDA0002967663620000861
Figure BDA0002967663620000871
在表11中,变量allowSbtHorH表示是否允许水平方向上的二叉树分区,并且变量allowSbtVerH表示是否允许垂直方向上的二叉树分区。
当编码块的宽度大于高度的两倍时,变量allowSbtHorH可被设置为假。换句话说,当编码块的宽度大于高度的两倍时,可不允许水平方向上的二叉树分区。
当编码块的高度大于宽度的两倍时,变量allowSbtVerH可被设置为假。换句话说,当编码块的高度大于宽度的两倍时,可不允许垂直方向上的二叉树分区。
当水平方向上的二叉树分区或垂直方向上的二叉树分区不可用时,可省略用信号发送语法cu_sbt_horizontal_flag的操作。
当省略用信号发送语法cu_sbt_horizontal_flag的操作并且变量allowSbtHorH为真时,水平方向上的二叉树分区可被应用于编码块。
当省略用信号发送语法cu_sbt_horizontal_flag的操作并且变量allowSbtVerH为真时,垂直方向上的二叉树分区可被应用于编码块。
可以以比特流用信号发送用于指定多个子块中的作为变换的目标的子块的信息。在示例中,可以以比特流用信号发送语法cu_sbt_pos_flag。语法cu_sbt_pos_flag表示变换目标是否是编码块中的第一子块。在示例中,当水平方向上的四叉树分区/二叉树分区被应用于编码块时,当cu_sbt_flag为1时,最左侧子块被确定为变换目标,并且当cu_sbt_flag为0时,最右侧子块被确定为变换目标。当垂直方向上的四叉树分区/二叉树分区被应用于编码块时,当cu_sbt_pos_flag为1时,最上方子块被确定为变换目标,并且当cu_sbt_pos_flag为0时,最下方子块被确定为变换目标。
当编码块被分区为高度和宽度分别是编码块的1/2的4个子块时,可用信号发送指定4个子块中的任意一个子块的索引cu_sbt_pos_idx,而不是标志cu_sbt_pos_flag。语法cu_sbt_pos_idx可具有从0到3的值,并且具有由cu_sbt_pos_idx指示的索引的子块可被确定为变换目标。
可选地,当编码块被分区为4个子块时,多个子块可被选为变换目标。多个子块可在水平方向或垂直方向上彼此邻近。
可通过考虑编码块的分区方向和子块的位置来确定子块的变换类型。在示例中,当编码块在垂直方向上被分区并且针对子块中的左侧位置处的子块执行变换时,可不同地设置水平方向变换类型和垂直方向变换类型。
图47和图48示出根据作为变换的目标的子块的位置的水平方向变换类型和垂直方向变换类型。
在图47中所示的示例中,当作为变换的目标的子块包括编码块的左上样点或右下样点时,水平方向变换类型和垂直方向变换类型可被设置为相同。在示例中,图51中所示的示例示出了当作为变换的目标的子块包括编码块的左上样点时,水平方向变换类型和垂直方向变换类型被设置为DCT8,并且当作为变换的目标的子块包括编码块的右下样点时,水平方向变换类型和垂直方向变换类型被设置为DST7。
当作为变换的目标的子块包括编码块的右上样点或左下样点时,水平方向变换类型和垂直方向变换类型可被不同地设置。在示例中,图47中所示的示例示出了当作为变换的目标的子块包括编码块的右上样点时,水平方向变换类型被设置为DST7,并且垂直方向变换类型被设置为DCT8。当作为变换的目标的子块包括编码块的左下样点时,水平方向变换类型被设置为DCT8,并且垂直方向变换类型被设置为DST7。
与图47中所示的示例不同,当编码块中的包括左上样点的子块或包括右下样点的子块被确定为变换目标时,水平方向变换类型和垂直方向变换类型可被不同地设置,并且当编码块中的包括右上样点的子块或包括左下样点的子块被确定为变换目标时,水平方向变换类型和垂直方向变换类型可被设置为相同。
图47示出了高度和宽度分别是编码块的1/2的子块被设置为变换目标。与示出的示例不同,宽度与编码块相同但高度为编码块的1/4的子块或者高度与编码块相同但宽度为编码块的1/4的子块可被设置为变换目标。
在图48中所示的示例中,当作为变换的目标的子块包括编码块的左上样点时,水平方向变换类型和垂直方向变换类型可被不同地设置。在示例中,在图48中所示的示例中,当水平方向上的二叉树分区被应用并且上方子块被确定为变换目标时,水平方向变换类型可被设置为DST7,并且垂直方向变换类型可被设置为DCT7。当垂直方向上的二叉树分区被应用并且左侧子块被确定为变换目标时,水平方向变换类型可被设置为DCT8,并且垂直方向变换类型可被设置为DST7。
与图48中所示的示例不同,当作为变换的目标的子块包括编码块的左上样点时,水平方向变换类型和垂直方向变换类型可被设置为相同,并且当作为变换的目标的子块包括编码块的右下样点时,水平方向变换类型和垂直方向变换类型可被不同地设置。
当作为变换的目标的子块包括编码块的右下样点时,水平方向变换类型和垂直方向变换类型可被设置为相同。在示例中,在图48中所示的示例中,当水平方向上的二叉树分区被应用并且下方子块被确定为变换目标时,水平方向变换类型和垂直方向变换类型可被设置为DST7。当垂直方向上的二叉树分区被应用并且右侧子块被确定为变换目标时,水平方向变换类型和垂直方向变换类型可被设置为DST7。
如在上述示例中,可根据编码块中的作为变换的目标的子块的位置来确定水平方向变换类型和垂直方向变换类型是否被设置为相同。此外,可根据编码块中的作为变换的目标的子块的位置来确定水平方向变换类型和垂直方向变换类型。
对于子块,可省略对表示是否存在非零系数的信息(例如,CBF)的编码。当省略对CBF的编码时,可基于执行了变换的块的位置来确定非零残差系数是否被包括在每个子块中。在示例中,当应用了二叉树分区的编码块中的右侧或下方位置处的子块被确定为变换目标时,针对左侧或上方位置处的子块的CBF值可被推断为0,并且针对右侧或下方位置处的子块的CBF值可被推断为1。可选地,当应用了二叉树分区的编码块中的左侧或下方位置处的子块被确定为变换目标时,左侧或上方位置处的子块的CBF值可被推断为1,并且右侧或下方位置处的子块的CBF值可被推断为0。
可针对执行了首次变换的块执行二次变换。可针对已应用了首次变换的变换块中的左上方子区域执行二次变换。
如果已执行了首次变换和二次变换的残差系数被编码,则解码装置可针对变换块执行作为二次变换的逆处理的二次逆变换,并且针对已执行了二次逆变换的变换块执行作为首次变换的逆处理的首次逆变换。
可基于当前块的尺寸、残差系数的数量、编码模式或帧内预测模式或者子分区帧内编码方法是否被应用于当前块中的至少一个来确定二次变换是否被应用于当前块。
在示例中,当当前块的宽度或高度中的至少一个小于阈值时,可不执行二次变换。在这种情况下,阈值可以是诸如4、8或16的自然数。
可选地,当包括在当前块中的残差系数的数量等于或小于阈值时,可不针对当前块执行二次变换。在示例中,当当前块仅包括DC分量的单个残差系数时,可不执行二次变换。
可选地,当当前块通过帧间预测被编码时,可设置为不应用二次变换。
可选地,虽然当前块通过帧内预测被编码,但是当执行基于矩阵的帧内预测时,可设置为不应用二次变换。
可以以比特流用信号发送表示二次变换是否被应用的信息。在示例中,所述信息可以是表示二次变换是否被应用的标志或指定在二次变换中使用的不可分离变换矩阵的索引信息中的一个。当以比特流被用信号发送的标志或索引的值为0时,这表示二次变换未被应用。当标志或索引的值等于或大于1时,这表示二次变换被应用。
可选地,可通过使用上面列举的与当前块相关的用于确定二次变换是否被应用的参数来确定是否对表示二次变换是否被应用的语法进行编码。
在示例中,当当前块的尺寸、残差系数的数量、编码模式或帧内预测模式或者子分区帧内编码方法是否被应用中的至少一个不满足预设条件时,可省略对表示二次变换是否被应用的语法的编码。当省略了对所述语法的编码时,二次变换可不被应用。
基于上述描述,将详细描述在编码装置和解码装置中执行二次变换的方法。
可对当前块中的左上方子区域执行二次变换。子区域可具有预定义尺寸或预定义形状。执行二次变换的子区域可具有诸如4×4或8×8的正方形块形状或者诸如4×8或8×4的非正方形块形状。
可选地,当当前块被均匀地分区为N个区域时,N个区域中的至少一个区域可被设置为子区域。在这种情况下,N可以是诸如2、4、8或16的自然数。可在编码装置和解码装置中预定义变量N。可选地,可基于当前块的尺寸和/或形状来确定变量N。
可选地,可基于变换系数的数量来确定子区域。在示例中,可根据预定扫描顺序将预定数量的变换系数确定为子区域。
可选地,用于指定子区域的尺寸和/或形状的信息可被编码并以比特流被发送。所述信息可包括表示子区域的尺寸的信息或表示包括在子区域中的4×4的块的数量的信息中的至少一个。
可选地,可将整个当前块设置为子区域。在示例中,当当前块的尺寸与子区域的最小尺寸(例如,4×4)相同时,整个当前块可被设置为用于二次变换的目标。
二次变换可以以不可分离形式被应用。因此,二次变换也可被称为不可分离二次变换(NSST)。
应用二次变换的子区域中的变换系数可被排列在单个列中。在示例中,当针对N×N尺寸的子区域执行二次变换时,可将包括在子区域中的变换系数转换为N2×1尺寸的输入矩阵。当4×4尺寸的块被设置为子区域时,包括在子区域中的变换系数可被转换为16×1尺寸的输入矩阵。当8×8尺寸的块被设置为子区域时,包括在子区域中的变换系数可被转换为64×1尺寸的输入矩阵。
不可分离变换矩阵可被应用于通过将包括在子区域中的变换系数排列为一条线而生成的输入矩阵。不可分离变换矩阵的尺寸可根据输入矩阵的尺寸而不同地确定。
在示例中,当输入矩阵的尺寸为N2×1时,可基于N2×N2尺寸的不可分离变换矩阵执行二次变换。例如,当输入矩阵的尺寸为16×1时,可使用16×16尺寸的不可分离变换矩阵,并且当输入矩阵的尺寸为64×1时,可使用64×64尺寸的不可分离变换矩阵。
多个不可分离变换矩阵可被存储在编码装置和解码装置中。可以以比特流用信号发送用于指定多个不可分离变换矩阵中的任意一个不可分离变换矩阵的信息。
可选地,可基于在首次变换中使用的当前块的尺寸、形状、量化参数、帧内预测模式或变换类型中的至少一个来指定不可分离变换矩阵。
可选地,可基于在首次变换中使用的当前块的尺寸、形状、量化参数、帧内预测模式或变换类型中的至少一个来指定可由当前块使用的不可分离变换矩阵候选。当存在多个可由当前块使用的不可分离变换矩阵候选时,指示所述多个不可分离变换矩阵候选中的一个不可分离变换矩阵候选的信息可被编码并被用信号发送。
可通过将不可分离变换矩阵与输入矩阵相乘来获得变换矩阵。在示例中,方程式14示出获得变换矩阵A'的示例。
【方程式14】
A′=T*A
在方程式14中,T表示不可分离变换矩阵,并且A表示输入矩阵。当矩阵T的尺寸是N2×N2并且矩阵A的尺寸是N2×1时,可获得N2×1尺寸的变换矩阵A'。在示例中,当使用16×1尺寸的输入矩阵和16×16尺寸的不可分离变换矩阵时,可获得16×1尺寸的变换矩阵A'。可选地,当使用64×1尺寸的输入矩阵和64×64尺寸的不可分离变换矩阵时,可获得64×1尺寸的变换矩阵A'。
当获得了变换矩阵A'时,变换矩阵A'中的分量可被设置为当前块中的N×N尺寸的块的变换系数。不包括所述N×N尺寸的块的残差区域中的变换系数可被设置为默认值。在示例中,未执行二次变换的区域中的变换系数可被设置为0。
可通过使用行的数量小于列的数量的不可分离变换矩阵来执行二次变换。在示例中,(k×N2)尺寸的不可分离变换矩阵可被应用于(N2×1)尺寸的输入矩阵A。在这种情况下,k可具有小于N2的值。在示例中,k可以是N2/2、N2/4或3N2/4等。k可被称为缩减因子。
结果,可获得小于输入矩阵的(k×1)尺寸的变换矩阵。这样,输出尺寸小于输入矩阵的变换矩阵的二次变换可被称为缩减二次变换。
方程式15表示应用缩减二次变换的示例。
【方程式15】
AR=R*A
在方程式15中,R表示k×N2尺寸的不可分离变换矩阵。行的数量k小于列的数量N2的不可分离变换矩阵可被称为缩减不可分离变换矩阵。AR表示k×1尺寸的变换矩阵。尺寸小于输入矩阵A的变换矩阵AR可被称为缩减变换矩阵。
当获得了缩减变换矩阵AR时,可将缩减变换矩阵AR中的分量设置为当前块中的至少一个或更多个M×M尺寸的块的变换系数。在这种情况下,M可以是小于N的自然数。可根据缩减因子k来确定M×M尺寸的块的数量。可将不包括至少一个M×M尺寸的块的残差区域的变换系数设置为默认值。在示例中,残差区域中的变换系数可被设置为0。
图49是示出当缩减因子为16时变换系数的编码方面的示图。
可将包括在8×8尺寸的子区域中的变换系数变换为64×1尺寸的输入矩阵,并且可通过使用16×64尺寸的不可分离变换矩阵来获得16×1尺寸的变换矩阵。
16×1尺寸的变换矩阵可被设置为4×4的块的变换系数,并且其他区域中的变换系数可被设置为0。
虽然未示出,但是当缩减因子k为32时,32×1尺寸的变换矩阵可被设置为8×4的块或4×8的块的变换系数,并且其他区域中的变换系数可被设置为0。
当缩减因子k为48时,可将48×1尺寸的变换矩阵设置为三个4×4的块的变换系数,并且可将其它区域中的变换系数设置为0。具体地,可将变换矩阵设置为当前块的左上方位置处的4×4的块、与所述左上方块的右侧相邻的4×4的块和与所述左上方块的下方相邻的4×4的块的变换系数。
当不包括由二次变换生成的变换系数的残差变换系数被设置为0时,解码装置可基于最后非零残差系数的位置确定是否执行二次变换。在示例中,当最后残差系数位于存储由二次变换生成的变换系数的块之外时,可确定不执行二次变换。换句话说,仅当最后残差系数位于存储由二次变换生成的变换系数的块中时,解码装置可执行针对二次变换的逆变换。
可基于当前块的尺寸或形状中的至少一个来确定是否执行缩减二次变换。在示例中,当当前块的宽度或高度中的至少一个大于阈值时,可应用缩减二次变换,否则,可应用一般二次变换。在这种情况下,阈值可以是诸如4、8或16的自然数。
可选地,可根据子区域的尺寸来确定是否执行缩减二次变换。在示例中,当针对4×4尺寸的子区域执行二次变换时,可应用一般二次变换。在示例中,对于4×4尺寸的子区域,可通过使用16×16尺寸的不可分离变换矩阵来执行二次变换。
另一方面,当针对8×8尺寸的子区域执行二次变换时,可应用缩减二次变换。在示例中,对于8×8尺寸的子区域,可通过使用48×64、32×64或16×64尺寸的不可分离变换矩阵来执行二次变换。
当执行针对缩减二次变换的逆变换时,输出矩阵的尺寸具有大于输入矩阵的尺寸的值。在示例中,当缩减因子k是16时,可通过针对16×1尺寸的输入矩阵执行逆变换来获得64×1尺寸的输出矩阵。
解码装置可对比特流中的残差系数进行解码并且通过对残差系数执行反量化来推导变换系数。当通过首次变换和二次变换生成了变换系数时,可通过针对变换系数执行二次逆变换和首次逆变换来推导残差样点。
当确定对当前块执行二次变换时,可确定作为二次逆变换的目标的子区域。如上所述,子区域可包括正方形块、非正方形块或多个块。
可通过将包括在子区域中的变换系数排列为一条线来生成输入矩阵。在这种情况下,当缩减二次变换被应用于当前块时,可基于与缩减因子k一样多的变换系数来生成输入矩阵。在示例中,当缩减因子k为16时,可基于包括在4×4尺寸的左上方块中的变换系数来生成输入矩阵。当缩减因子k为32时,可基于包括在左上方块以及与该左上方块的右侧或下方相邻的4×4尺寸的邻近块中的变换系数来生成输入矩阵。当缩减因子k为48时,可基于左上方块、与该左上方块的右侧相邻的4×4尺寸的邻近块以及与该左上方块的下方相邻的4×4尺寸的邻近块的变换系数来生成输入矩阵。
可在编码装置和解码装置中预定义缩减因子k。可选地,可以以比特流用信号发送用于确定缩减因子k的信息。可选地,可基于当前块的尺寸或形状来确定缩减因子k。
可通过将输入矩阵与不可分离逆变换矩阵相乘来获得变换矩阵。不可分离逆变换矩阵可以是方程式14至方程式15中所示的不可分离变换矩阵的对称矩阵。方程式16和方程式17示出通过使用不可分离逆变换矩阵来获得变换矩阵的示例。
【方程式16】
A′=TT*A
当一般二次变换被应用于当前块时,可通过将输入矩阵A乘以不可分离逆变换矩阵TT来推导变换矩阵。在示例中,可通过将16×16尺寸的逆变换矩阵TT与16×1尺寸的输入矩阵A相乘来推导16×1尺寸的变换矩阵。
当获得了变换矩阵A'时,变换矩阵A'中的分量可被设置为当前块中的N×N尺寸的块的变换系数。在示例中,16×1尺寸的变换矩阵可被设置为4×4的块的变换系数。
【方程式17】
A′=RT*A
当缩减二次变换被应用于当前块时,可通过将输入矩阵A乘以缩减不可分离逆变换矩阵RT来推导变换矩阵A'。在示例中,可通过将64×16尺寸的缩减不可分离逆变换矩阵RT与16×1尺寸的输入矩阵A相乘来推导64×1尺寸的变换矩阵。
可选地,可通过将64×32尺寸的缩减不可分离逆变换矩阵RT与32×1尺寸的输入矩阵A相乘来推导64×1尺寸的变换矩阵。
可选地,可通过将64×48尺寸的缩减不可分离逆变换矩阵RT与48×1尺寸的输入矩阵A相乘来推导48×1尺寸的变换矩阵。
当获得了变换矩阵A'时,变换矩阵A'中的分量可被设置为当前块中的N×N尺寸的块的变换系数。在示例中,64×1尺寸的变换矩阵可被设置为8×8的块的变换系数。
当子分区帧内编码方法被应用于当前块时,可设置为不应用二次变换。
可选地,当子分区帧内编码被应用于当前块并且宽度或高度中的至少一个大于阈值时,可设置为应用二次变换。阈值可以是诸如2、4、8或16的自然数。在示例中,仅当当前块被分区为4×N或N×4形状的分区时,二次变换可被应用于当前块。在这种情况下,N可以是等于或大于4的自然数。
可选地,当子分区帧内编码被应用于当前块时,仅当预定义变换类型被用于首次变换时,二次变换可被应用于当前块。在这种情况下,预定义变换类型可包括DCT2、DST7或DCT8中的至少一个。
二次变换可仅被应用于当前块中包括的多个子分区中的部分子分区。在示例中,二次变换可仅被应用于当前块的最上方位置处的子分区或当前块的最左侧位置处的子分区,并且可不被应用于其余子分区。
可选地,还可确定是否在编码块级应用二次变换,但是多个子分区中的至少一个子分区可被设置为用于二次变换的子区域。在示例中,当前块的最上方位置处的子分区或当前块的最左侧位置处的子分区可被包括在子区域中。
可选地,还可将子区域设置为包括编码块中的左上方正方形块,但是子区域不跨越多个子分区。
可选地,根据编码块的尺寸,可将编码块中的左上方4×4尺寸的块或8×8尺寸的块设置为子区域。
当包括在当前块中的子分区被设置为子区域时,可通过将包括在子区域中的变换系数排列为一条线来生成输入矩阵。在示例中,当4×8或8×4形状的子分区被设置为子区域时,包括在子区域中的变换系数可被转换为32×1形状的输入矩阵。
可通过将输入矩阵乘以不可分离变换矩阵来推导变换矩阵。在示例中,可通过将32×32尺寸的不可分离变换矩阵与32×1尺寸的输入矩阵相乘来获得32×1尺寸的变换矩阵。
当获得了变换矩阵时,变换矩阵中的分量可被设置为子区域中的子分区的变换系数。除了子区域之外的其余子分区中的变换系数可被设置为0。
可基于子变换块编码方法是否被应用于编码块来确定是否允许二次变换。在示例中,当子变换块编码方法被应用于编码块时,可设置为不应用二次变换。
可选地,当子变换块编码方法被应用于编码块时,可仅在多个子块中的至少一个可用子块中使用二次变换。在这种情况下,可用子块可表示多个子块中的执行了首次变换的块。
图50和图51是示出针对可用子块执行二次变换的示例的示图。图50示出应用二叉树分区的情况的示例,图51示出应用四叉树分区的情况的示例。
当二叉树分区被应用于编码块时,可针对两个子块中的执行了首次变换的子块执行二次变换。在示例中,当编码块在垂直方向上被分区并且仅针对编码块中的左侧子块执行了首次变换时,可针对左侧子块中的N×N尺寸的左上方区域执行二次变换。未执行首次变换的右侧子区域以及左侧子块中的除了所述N×N尺寸的区域之外的其余区域中的变换系数可被设置为0。
另一方面,当仅针对编码块中的右侧子块执行了首次变换时,可针对右侧子块中的N×N尺寸的左上方区域执行二次变换。未执行首次变换的左侧子块以及右侧子块中的除了执行二次变换的所述N×N尺寸的区域之外的其余区域中的变换系数可被设置为0。
当编码块在水平方向上被分区并且仅针对编码块中的上方子块执行了首次变换时,可针对上方子块中的N×N尺寸的左上方区域执行二次变换。未执行首次变换的下方子块以及上方子块中的除了执行二次变换的所述N×N尺寸的区域之外的其余区域中的变换系数可被设置为0。
当编码块在水平方向上被分区并且仅针对编码块中的下方子块执行了首次变换时,可针对下方子块中的N×N尺寸的左下方区域执行二次变换。未执行首次变换的上方子块以及下方子块中的除了执行二次变换的所述N×N尺寸的区域之外的其余区域中的变换系数可被设置为0。
当四叉树分区被应用于编码块时,可仅针对四个子块中的执行了首次变换的子块执行二次变换。在示例中,可针对执行了首次变换的子块的N×N尺寸的左上方区域执行二次变换。
可根据子块的尺寸或形状来确定子块中的子区域的尺寸。在示例中,当子块的高度或宽度中的至少一个小于阈值时,可针对4×4的区域执行二次变换。另一方面,当子块的高度或高度中的至少一个等于或大于阈值时,可针对8×8的区域执行二次变换。
可基于子块的尺寸、形状、位置或分区索引中的至少一个来确定是否将二次变换应用于子块。在示例中,二次变换可仅被应用于包括编码块的左上样点的子块。可选地,仅当子块的高度或宽度中的至少一个大于阈值时,可应用二次变换。
可选地,可以以比特流用信号发送表示二次变换是否被应用于子块的信息。
当子变换块编码方法被应用时,可设置为不允许缩减二次变换。可选地,虽然应用了子变换块编码方法,但是可基于子块的尺寸或形状中的至少一个来确定缩减二次变换是否被执行。
可通过预测样点与残差样点之和来推导执行了变换的子块的重建样点。另一方面,预测样点可被设置为省略了变换的子块中的重建样点。量化用于降低块的能量,并且量化处理包括将变换系数除以特定常数值的处理。所述常数值可由量化参数来推导,并且量化参数可被定义为从1到63的值。
编码装置可对通过执行变换和/或量化而生成的系数(在下文中,称为残差系数)进行编码。在这种情况下,可按颜色分量对残差系数进行编码。在示例中,针对亮度分量的残差系数、针对第一色度分量(例如,Cb分量)的残差系数和针对第二色度分量(例如,Cr分量)的残差系数可被独立地编码。解码装置可通过对比特流中的关于残差系数的信息进行解码来对残差系数进行解码,并且通过针对残差系数执行反量化和/或逆变换来获得残差样点。可通过将包括残差样点的残差块和预测块相加来获得针对当前块的重建块。
在这种情况下,可能发生色度分量之间的信号特性相似的情况。具体地,可能发生以下情况:Cb分量的样点值和Cr分量的样点值具有彼此相似的值的情况、或者Cb分量的预测样点的值和/或Cr分量的预测样点的值具有相互相似性的情况。
在这种情况下,Cr分量的残差样点的值和Cb分量的残差样点的值可具有相互相似性。在示例中,当Cr分量的残差样点的值与Cb分量的残差样点的值相似时,可能发生以下情况:Cr分量的残差样点的值与Cb分量的残差样点的值具有相似的绝对值但具有相反符号的情况、或者Cr分量的残差样点的绝对值是Cb分量的残差样点的绝对值的N倍的情况等。
如在上述情况下,当Cb分量的残差信号和Cr分量的残差信号具有相互相似性时,可省略对Cb分量或Cr分量中的任意一个的残差信号的编码,并且可从经过编码的另一色度分量的残差信号推导省略了编码的色度分量的残差信号。可选地,可对表示Cb分量和Cr分量的改进残差信号进行编码,而非针对Cb分量和Cr分量的残差信号进行编码。所述改进残差信号可被称为联合残差信号。
在这种情况下,残差信号可表示残差样点或者通过将变换和/或量化应用于残差样点而生成的残差系数中的至少一个。
在省略针对第一色度分量和第二色度分量中的至少一个的残差信号的编码之后从改进残差信号推导省略了编码的残差信号的方法可被称为联合色度残差变换方法。在这种情况下,第一色度分量可表示Cb分量或Cr分量中的一个,或者可表示U分量或V分量中的一个。第二色度分量可表示另一个。
为了便于描述,第一色度分量的残差信号被称为第一残差信号,并且第二色度分量的残差信号被称为第二残差信号。
在下文中,将详细描述根据联合色度残差变换方法的编码装置和解码装置的操作。
图52和图53是示出根据本公开的实施例的联合色度残差变换方法的流程图的示图。
图52表示应用联合色度残差变换方法的编码装置的操作,并且图53表示应用联合色度残差变换方法的解码装置的操作。图53中所示的实施例还可在编码装置中被使用以生成重建图像。
可推导针对第一残差信号和第二残差信号的改进残差信号,以确定是否应用联合色度残差变换方法S5201。当图像被重建时,改进残差信号可被设置为第一残差信号或第二残差信号。
编码装置可省略对第一残差信号和第二残差信号的编码,并针对改进残差信号执行编码。
可基于第一残差信号或第二残差信号中的至少一个来推导改进残差信号。在示例中,第一残差信号或第二残差信号可被设置为改进残差信号。
可选地,可通过对第一残差信号和第二残差信号求平均来推导改进残差信号。下面的方程式18示出通过改进残差信号推导第一残差信号和第二残差信号的平均值的示例。
【方程式18】
ResCb′=(ResCb+ResCr+1)>>1
可选地,可基于第一残差信号与第二残差信号的差来推导改进残差信号。下面的方程式19示出基于第一残差信号与第二残差信号之间的差推导改进残差信号的示例。
【方程式19】
ResCb′=(ResCb-ResCr)
在方程式18和方程式19中,ResCb'表示改进残差信号。ResCb表示针对Cb分量的残差信号。可通过从Cb分量的原始信号减去Cb分量的预测信号来推导ResCb。ResCr表示针对Cr分量的残差信号。可通过从Cr分量的原始信号减去Cr分量的预测信号来推导ResCr。
可选地,可基于第一残差信号和第二残差信号之和来推导改进残差信号。
在示例中,可将第一残差信号和第二残差信号之和推导为改进残差信号,或者可将使第一残差信号和第二残差信号之和的符号反转得到的值推导为改进残差信号。
可选地,可通过对第一残差信号和第二残差信号之和进行缩放或者对第一残差信号与第二残差信号的差进行缩放来推导改进残差信号。
方程式20至方程式22示出推导改进残差信号的各种示例。
【方程式20】
ResCb′=(ResCb-ResCr)>>1
【方程式21】
ResCb′=(ResCb-ResCr+2)>>2
【方程式22】
ResCb′=(ResCb-ResCr+2)>>2
编码装置可测量用于生成改进残差信号的各种方法的代价(RD-cost),并使用最低代价生成方法来生成改进残差信号S5202。
编码装置可确定联合色度残差变换方法是否被应用于当前块S5203。编码装置可基于在联合色度变换方法被应用时计算的代价RD-cost和在联合色度变换方法不被应用时计算的代价RD-cost来确定是否应用联合色度变换方法。
编码装置可对表示联合色度残差变换方法是否被应用的标志进行编码S5204。在示例中,可以以比特流用信号发送语法joint_cbcr_flag。可在块级、条带级或画面级用信号发送语法joint_cbcr_flag。
当确定应用联合色度残差变换方法时,可基于所确定的改进残差信号生成方法来确定残差信号重建模式。编码装置可对指定所确定的改进残差信号生成方法或与所确定的改进残差信号生成方法对应的残差信号重建模式的信息进行编码并用信号发送。
所述信息可以是表示多个模式中的一个模式的索引或标志。在示例中,可以以比特流用信号发送表示多个模式中的一个模式的语法joint_cbcr_weight_idx。表12表示根据改进残差信号生成方法的语法joint_cbcr_weight_idx。
【表12】
Figure BDA0002967663620001001
可选地,可通过使用表示是否存在针对第一色度分量的非零变换系数的CBF(ced_block_flag)以及表示是否存在针对第二色度分量的非零变换系数的CBF来指定残差信号重建模式。
编码装置可根据所确定的残差信号重建模式来确定针对Cb分量的cbf_cr和针对Cr分量的cr_cbf的值。
解码装置可对比特流中的改进残差信号信息进行解码并推导改进残差信号。在这种情况下,改进残差信号可以是残差系数或者通过针对残差系数执行反量化和/或逆变换而生成的残差块。解码装置可基于联合色度残差变换方法是否被应用来从改进残差信号推导第一残差信号和第二残差信号。
具体地,解码装置可确定联合色度残差变换方法是否被应用于当前块S5301。解码装置可基于从比特流解析的信息确定联合色度变换方法是否被应用。在示例中,当语法joint_cbcr_flag的值为1时,这表示联合色度残差变换方法被应用于当前块。当语法joint_cbcr_flag的值为0时,这表示联合色度残差变换方法不被应用于当前块。
当确定应用联合色度残差变换方法时,可从比特流对用于指定残差信号重建模式的信息进行解析,并且可基于经过解析的信息来指定残差信号重建模式S5302。
所述信息可以是用于指定多个残差信号重建模式中的一个残差信号重建模式的索引或标志。在示例中,可基于以比特流被用信号发送的语法joint_cbcr_weight_idx来确定残差信号重建模式。
可选地,可基于针对第一色度分量的CBF和/或针对第二色度分量的CBF来确定残差信号重建模式。
当残差信号重建模式被确定时,可根据所确定的残差信号重建模式推导第一色度分量的残差信号和第二色度分量的残差信号S5303。根据残差信号重建模式,可不同地确定推导残差信号的方法。
在示例中,当索引为0的残差信号重建模式被选择时,第一色度分量的残差信号可被设置为与改进残差信号相同。第二色度分量的残差信号的绝对值可被设置为与改进残差信号的绝对值相同,并且符号可被设置为与改进残差信号相同或不同。
当索引为2的残差信号重建模式被选择时,第一色度分量的残差信号可被设置为改进残差信号。可通过对改进残差信号进行缩放来推导第二色度分量的残差信号的绝对值,并且符号可被设置为与改进残差信号相同或不同。
当索引为3的残差信号重建模式被选择时,第二色度分量的残差信号可被设置为改进残差信号。可通过对改进残差信号进行缩放来推导第一色度分量的残差信号的绝对值,并且符号可被设置为与改进残差信号相同。
可根据第一色度分量的CBF和/或第二色度分量的CBF来确定改进残差信号是否与第一色度分量的残差信号相同或者改进残差信号是否与第二色度分量的残差信号相同。
在示例中,当针对Cb分量的CBF(cb_cbf)为1时,这表示针对Cb分量对残差系数进行编码。当语法cb_cbf为1时,可通过对针对Cb分量的残差系数进行解码或者对经过解码的针对Cb分量的残差系数执行反量化和/或逆变换来推导改进残差信号。当语法cb_cbf为1时,Cb分量的残差信号可被设置为与改进残差信号相同。
当语法cb_cbf为0时,这表示针对Cb分量不对残差系数进行编码。当语法cb_cbf为0时,或者当cb_cbf为0且cr_cbf为1时,可通过对针对Cr分量的残差系数进行解码或者对经过解码的针对Cr分量的残差系数执行反量化和/或逆变换来推导改进残差信号。当语法cb_cbf为0时,Cr分量的残差信号可被设置为与改进残差信号相同。
可选地,可基于Cr分量的CBF(cr_cbf)来确定改进残差信号是否与Cr分量的残差信号相同。
可以以比特流用信号发送表示第一色度分量的残差信号或第二色度分量的残差信号中的至少一个是否具有与改进残差信号不同的符号的信息。在示例中,可以以比特流用信号发送语法joint_cbcr_sign_flag。当语法joint_cbcr_sign_flag为0时,这表示第一色度分量和第二色度分量的符号与改进残差信号相同。另一方面,当语法joint_cbcr_sign_flag为1时,这表示第一色度分量或第二色度分量中的一个的符号与改进残差信号不同。
当第一残差信号和第二残差信号被设置为与改进残差信号相同时,可通过将第一预测信号与改进残差信号相加来推导第一色度分量的重建图像,并且可通过将第二预测信号与改进残差信号相加来推导第二色度分量的重建图像。在示例中,方程式23示出第一残差信号和第二残差信号被设置为与改进残差信号相同的示例。
【方程式23】
RecCb=DResCb+PredCb
RecCr=DResCb+PredCr
另一方面,当第一残差信号被推导为与改进残差信号相同并且第二残差信号与改进残差信号具有相同的绝对值但具有不同的符号时,可通过将第一预测信号与改进残差信号相加来推导第一色度分量的重建图像,并且可通过从第二预测信号减去改进残差信号来推导第二色度分量的重建图像。在示例中,方程式24示出第一残差信号和第二残差信号的符号被不同地设置的示例。
【方程式24】
RecCb=DResCb′+PredCb
RecCr=-DResCb′+PredCr
在方程式23和方程式24中,DResCb'表示经过解码的改进残差信号。可通过针对残差系数执行反量化和/或逆变换来获得DResCb'。RecCb表示Cb分量的重建信号,并且PredCb表示Cb分量的预测信号。RecCr表示Cr分量的重建信号,并且PredCr表示Cr分量的预测信号。
可省略对指定残差信号重建模式的值的语法的编码,并且可通过使用与当前块相邻的邻近样点来确定残差信号重建模式。在示例中,可通过使用与Cb块相邻的邻近Cb样点和与Cr块相邻的邻近Cr样点来推导残差信号重建模式。
可选地,可通过与当前块相邻的邻近块的残差信号重建模式来推导当前块的残差信号重建模式。在示例中,与当前块的上方或左侧相邻的邻近块的残差信号重建模式可被设置为当前块的残差信号重建模式。
当联合色度残差变换方法被应用于当前块时,可设置为不允许变换跳过以对变换残差信号进行解码。在示例中,当语法joint_cbcr_flag为1时,可省略对表示变换跳过是否被应用的标志transform_skip_flag的编码,并且所述标志值可被推断为0。
可选地,虽然应用了联合色度残差变换方法,但是可允许变换跳过。在这种情况下,根据残差信号重建模式,可仅针对第一色度分量或第二色度分量中的一个允许变换跳过。
当变换跳过被应用时,可将改进残差信号生成模式或残差信号重建模式的值设置为默认值。
可根据当前画面的颜色格式来确定是否允许联合色度残差变换方法。在示例中,仅当当前画面的颜色格式为4:2:0或4:2:2时,可允许联合色度残差变换方法,并且当当前画面的颜色格式为4:4:4时,可不允许联合色度残差变换方法。
可选地,虽然当前画面的颜色格式为4:4:4,但是可允许联合色度残差变换方法。
可选地,可基于当前块的尺寸、形状或编码模式中的至少一个来确定是否允许联合色度残差变换方法。在示例中,当当前块的尺寸等于或大于阈值或者等于或小于阈值时,可允许联合色度残差变换方法。可选地,仅当当前块通过帧间预测被编码时,可允许联合色度残差变换方法。
当不允许联合色度变换方法时,可省略对语法joint_cbcr_flag的编码,并且语法joint_cbcr_flag的值可被推断为0。
还可对亮度分量与色度分量之间的残差信号进行联合编码/解码。在示例中,联合残差信号编码/解码方法可被应用于亮度分量和Cb分量,或者联合残差信号编码/解码方法可被应用于亮度分量和Cr分量。
仅当当前画面的颜色格式为4:4:4时,可允许亮度分量与色度分量之间的联合残差信号编码/解码方法。
当获得了当前块的重建块时,可经由环内滤波来减少在量化和编码处理中产生的信息损失。环内滤波器可包括去块滤波器、样点自适应偏移滤波器(SAO)或自适应环路滤波器(ALF)中的至少一个。在下文中,应用环内滤波器之前的重建块被称为第一重建块,并且应用环内滤波器之后的重建块被称为第二重建块。
可通过将去块滤波器、SAO或ALF中的至少一个应用于第一重建块来获得第二重建块。在这种情况下,可在应用去块滤波器之后应用SAO或ALF。
将如关于解码处理或编码处理所描述的实施例分别应用于编码处理或解码处理的操作可被包括在本公开的范围中。在本公开的范围内,操作按照预定顺序发生的实施例可被修改为操作按照与所述预定顺序不同的顺序发生的实施例。
虽然基于一系列操作或流程图描述了上述实施例,但是所述实施例不将方法的操作的时间序列顺序限制于此。在另一示例中,操作可根据需要同时执行或按照与其不同的顺序来执行。此外,在上述实施例中,构成框图的组件中的每个组件(例如,单元、模块等)可以以硬件装置或软件的形式来实现。多个组件可被彼此组合为可使用单个硬件装置或软件来实现的单个组件。可使用可经由各种计算机组件执行的程序指令来实现上述实施例。指令可被记录在计算机可读存储介质中。计算机可读存储介质可在其中单独地或彼此组合地包括程序指令、数据文件、数据结构等。计算机可读存储介质的示例包括磁介质(诸如硬盘、软盘和磁带)、光学存储介质(诸如CD-ROM、DVD)和磁光介质(诸如软光盘)以及被专门配置为在其中存储并执行程序指令的硬件装置(诸如ROM、RAM、闪存等)。硬件装置可被配置为如一个或更多个软件模块进行操作以执行根据本公开的处理,反之亦可。
工业实用性
本公开可被应用于对视频进行编码/解码的电子装置。

Claims (12)

1.一种视频解码方法,包括:
推导当前块的残差系数;
对所述残差系数进行反量化;
通过针对反量化的残差系数执行逆变换来推导联合残差信号;并且
基于所述联合残差信号推导针对第一色度分量的第一残差信号和针对第二色度分量的第二残差信号。
2.如权利要求1所述的方法,其中,所述方法还包括:将多个残差信号重建模式候选中的一个残差信号重建模式候选确定为针对当前块的残差信号重建模式。
3.如权利要求2所述的方法,其中,第一残差信号的推导方法在当在所述多个残差信号重建模式候选中选择第一残差信号重建模式时与当在所述多个残差信号重建模式候选中选择第二残差信号重建模式时之间不同。
4.如权利要求3所述的方法,其中,当选择了第一残差信号重建模式时,第一残差信号被推导为与所述联合残差信号相同,并且当选择了第二残差信号重建模式时,第一残差信号被推导为与所述联合残差信号具有相反的符号,或者通过对所述联合残差信号进行缩放来推导第一残差信号。
5.如权利要求2所述的方法,其中,所述方法还包括:对用于指定残差信号重建模式的信息进行解析。
6.如权利要求5所述的方法,其中,所述信息包括第一标志和第二标志,其中,第一标志表示当前块中是否存在第一色度分量的非零变换系数,第二标志表示当前块中是否存在第二色度分量的非零变换系数。
7.如权利要求1所述的方法,其中,第一残差信号与所述联合残差信号具有相同的符号,并且第二残差信号与所述联合残差信号具有相反的符号。
8.一种视频编码方法,包括:
基于针对第一色度分量的第一残差信号和针对第二色度分量的第二残差信号生成联合残差信号;
对所述联合残差信号进行变换;
通过对经过变换的联合残差信号进行量化来推导残差系数;并且
对所述残差系数进行编码。
9.如权利要求8所述的方法,其中,所述方法还包括:将多个联合残差信号生成模式中的一个联合残差信号生成模式确定为针对当前块的残差信号生成模式。
10.如权利要求8所述的方法,其中,所述方法还包括:对用于指定与所述联合残差信号生成模式对应的残差信号重建模式的信息进行编码。
11.如权利要求10所述的方法,其中,所述信息包括第一标志和第二标志,其中,第一标志表示当前块中是否存在第一色度分量的非零变换系数,第二标志表示当前块中是否存在第二色度分量的非零变换系数。
12.如权利要求8所述的方法,其中,第一残差信号与所述联合残差信号具有相同的符号,并且第二残差信号与所述联合残差信号具有相反的符号。
CN202080005033.9A 2019-03-12 2020-03-12 用于对图像信号进行编码/解码的方法及其装置 Active CN112673637B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
KR20190027938 2019-03-12
KR10-2019-0027938 2019-03-12
KR20190056770 2019-05-15
KR10-2019-0056770 2019-05-15
PCT/KR2020/003482 WO2020185022A1 (ko) 2019-03-12 2020-03-12 영상 신호 부호화/복호화 방법 및 이를 위한 장치

Publications (2)

Publication Number Publication Date
CN112673637A true CN112673637A (zh) 2021-04-16
CN112673637B CN112673637B (zh) 2024-07-26

Family

ID=72427181

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080005033.9A Active CN112673637B (zh) 2019-03-12 2020-03-12 用于对图像信号进行编码/解码的方法及其装置

Country Status (5)

Country Link
US (2) US11418811B2 (zh)
KR (1) KR20200109276A (zh)
CN (1) CN112673637B (zh)
WO (1) WO2020185022A1 (zh)
ZA (1) ZA202104683B (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102517389B1 (ko) * 2019-02-05 2023-04-03 베이징 다지아 인터넷 인포메이션 테크놀로지 컴퍼니 리미티드 인트라 서브-파티션 코드 모드를 이용한 비디오 코딩
US20220295068A1 (en) * 2019-03-13 2022-09-15 Hyundai Motor Company Method and device for efficiently applying transform skip mode to data block
JP7404387B2 (ja) 2019-04-12 2023-12-25 北京字節跳動網絡技術有限公司 ビデオ処理方法、装置、記憶媒体及び記憶方法
KR102436368B1 (ko) * 2019-04-16 2022-08-25 엘지전자 주식회사 변환 인덱스를 이용하는 영상 코딩
CN116684612A (zh) 2019-04-16 2023-09-01 Lg电子株式会社 图像编解码方法、数字存储介质和数据发送方法
CN118175313A (zh) * 2019-04-16 2024-06-11 Lg电子株式会社 图像解码和编码方法、数据的发送方法及存储介质
CN117499656A (zh) 2019-04-16 2024-02-02 北京字节跳动网络技术有限公司 帧内编解码模式下的矩阵推导
WO2020218793A1 (ko) * 2019-04-20 2020-10-29 엘지전자 주식회사 Bdpcm에 기반한 영상 코딩 방법 및 그 장치
CN117097912A (zh) 2019-05-01 2023-11-21 北京字节跳动网络技术有限公司 基于矩阵的帧内预测的上下文编码
WO2020221373A1 (en) 2019-05-01 2020-11-05 Beijing Bytedance Network Technology Co., Ltd. Matrix-based intra prediction using filtering
WO2020226424A1 (ko) * 2019-05-08 2020-11-12 엘지전자 주식회사 Mip 및 lfnst를 수행하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법
WO2020235960A1 (ko) * 2019-05-22 2020-11-26 엘지전자 주식회사 Bdpcm 에 대한 영상 디코딩 방법 및 그 장치
BR112021022868A2 (pt) 2019-05-22 2022-01-04 Beijing Bytedance Network Tech Co Ltd Método de processamento de vídeos, aparelho para processar dados de vídeo e meios de armazenamento e gravação não transitórios legíveis por computador
JP2022535726A (ja) 2019-05-31 2022-08-10 北京字節跳動網絡技術有限公司 行列ベースイントラ予測における制約されたアップサンプリングプロセス
CN113950836B (zh) 2019-06-05 2024-01-12 北京字节跳动网络技术有限公司 基于矩阵的帧内预测的上下文确定
CN116980597A (zh) * 2019-06-19 2023-10-31 Lg电子株式会社 图像解码和编码设备及发送设备
US12081775B2 (en) * 2019-08-31 2024-09-03 Lg Electronics Inc. Video or image coding method and device therefor
WO2021052490A1 (en) 2019-09-19 2021-03-25 Beijing Bytedance Network Technology Co., Ltd. Scaling window in video coding
MX2022002916A (es) 2019-09-19 2022-04-06 Beijing Bytedance Network Tech Co Ltd Derivacion de posiciones de muestra de referencia en codificacion de video.
BR112022006453A2 (pt) 2019-10-05 2022-09-27 Beijing Bytedance Network Tech Co Ltd Método de processamento de dados de dados de vídeo, aparelho para processar dados de vídeo, meio de armazenamento não transitório legível por computador e meio de gravação não transitório legível por computador
CN114556918A (zh) 2019-10-12 2022-05-27 北京字节跳动网络技术有限公司 细化视频编解码工具的使用和信令
CN117376557A (zh) 2019-10-13 2024-01-09 北京字节跳动网络技术有限公司 参考图片重采样与视频编解码工具之间的相互作用
JP7404526B2 (ja) 2019-10-28 2023-12-25 北京字節跳動網絡技術有限公司 カラーコンポーネントに基づくシンタックスシグナリング及び構文解析
CN115152230A (zh) 2019-12-27 2022-10-04 抖音视界有限公司 视频图片标头中的条带类型的信令
WO2024002699A1 (en) * 2022-06-29 2024-01-04 Interdigital Ce Patent Holdings, Sas Intra sub-partition improvements

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120281752A1 (en) * 2009-12-08 2012-11-08 Thomson Licensing Methods and apparatus for adaptive residual updating of template matching prediction for video encoding and decoding
CN104081775A (zh) * 2011-10-17 2014-10-01 株式会社Kt 用于图像编码/解码的方法和装置
US20160112719A1 (en) * 2011-05-20 2016-04-21 Kt Corporation Method and apparatus for intra prediction within display screen
CN109417636A (zh) * 2016-06-24 2019-03-01 韩国电子通信研究院 用于基于变换的图像编码/解码的方法和设备

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI513327B (zh) 2011-04-15 2015-12-11 Dolby Lab Licensing Corp 高動態範圍影像的編碼、解碼及表示
KR102305587B1 (ko) 2011-09-20 2021-09-28 엘지전자 주식회사 영상 정보 인코딩/디코딩 방법 및 장치
CN110971905B (zh) 2014-03-14 2023-11-17 Vid拓展公司 编解码视频内容的方法、装置和存储介质
US9838662B2 (en) 2014-10-10 2017-12-05 Qualcomm Incorporated Harmonization of cross-component prediction and adaptive color transform in video coding
KR102601732B1 (ko) 2016-05-31 2023-11-14 삼성디스플레이 주식회사 영상 부호화 방법 및 영상 복호화 방법
CN112204963B (zh) 2018-03-29 2024-06-07 弗劳恩霍夫应用研究促进协会 逐块图像编码的帧内预测模式概念
US10951898B2 (en) * 2018-10-11 2021-03-16 Lg Electronics Inc. Image decoding method and device using residual information in image coding system
CN114390282B (zh) 2018-11-12 2023-09-08 Lg电子株式会社 图像解码方法、图像编码方法和数据发送方法
PH12019000380A1 (en) 2018-12-17 2020-09-28 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120281752A1 (en) * 2009-12-08 2012-11-08 Thomson Licensing Methods and apparatus for adaptive residual updating of template matching prediction for video encoding and decoding
US20160112719A1 (en) * 2011-05-20 2016-04-21 Kt Corporation Method and apparatus for intra prediction within display screen
CN104081775A (zh) * 2011-10-17 2014-10-01 株式会社Kt 用于图像编码/解码的方法和装置
CN109417636A (zh) * 2016-06-24 2019-03-01 韩国电子通信研究院 用于基于变换的图像编码/解码的方法和设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JANI LAINEMA: "《CE7-related: Joint coding of chrominance residuals》", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 13TH MEETING: MARRAKECH, MA, 9–18 JAN. 2019, pages 1 - 5 *

Also Published As

Publication number Publication date
US20210306666A1 (en) 2021-09-30
CN112673637B (zh) 2024-07-26
US11418811B2 (en) 2022-08-16
US20230055563A1 (en) 2023-02-23
WO2020185022A1 (ko) 2020-09-17
ZA202104683B (en) 2022-06-29
KR20200109276A (ko) 2020-09-22

Similar Documents

Publication Publication Date Title
CN112673637B (zh) 用于对图像信号进行编码/解码的方法及其装置
KR102608847B1 (ko) 영상 신호 부호화/복호화 방법 및 이를 위한 장치
CN112425160B (zh) 用于对视频信号进行编码/解码的方法及其设备
US20230283773A1 (en) Video signal encoding/decoding method and device therefor
CN112514380A (zh) 用于对视频信号进行编码/解码的方法及其设备
CN113170130A (zh) 图像信号编码/解码方法及其装置
CN113039799B (zh) 图像信号编码/解码方法及其设备
CN113347429A (zh) 图像信号编码/解码方法及其设备
CN113574878A (zh) 用于对视频信号进行编码/解码的方法及其设备
CN112236996B (zh) 视频信号编码/解码方法及其装置
CN112544083B (zh) 图像信号编码/解码方法及用于其的装置
CN113711596A (zh) 图像信号编码/解码方法及其装置
CN112470479B (zh) 视频信号编码/解码方法及存储介质
CN112236998A (zh) 用于对视频信号进行编码/解码的方法及其装置
CN112970251A (zh) 用于对图像信号进行编码/解码的方法及其装置
CN113170199B (zh) 用于对图像信号进行编码/解码的方法及其装置
CN113439439A (zh) 用于对图像信号进行编码/解码的方法及其装置
CN116112684A (zh) 用于对图像信号进行编码/解码的方法及其装置
CN112956198A (zh) 用于对图像信号进行编码/解码的方法及其装置
CN113287310A (zh) 用于对图像信号进行编码/解码方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220408

Address after: California, USA

Applicant after: APPLE Inc.

Address before: Gyeonggi Do city of South Korea

Applicant before: Xris Co.,Ltd.

GR01 Patent grant
GR01 Patent grant