CN112352427B - 基于图像块的非对称二元分区的视频编码和解码的方法和装置 - Google Patents

基于图像块的非对称二元分区的视频编码和解码的方法和装置 Download PDF

Info

Publication number
CN112352427B
CN112352427B CN201980040727.3A CN201980040727A CN112352427B CN 112352427 B CN112352427 B CN 112352427B CN 201980040727 A CN201980040727 A CN 201980040727A CN 112352427 B CN112352427 B CN 112352427B
Authority
CN
China
Prior art keywords
block
residual
partition
blocks
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201980040727.3A
Other languages
English (en)
Other versions
CN112352427A (zh
Inventor
F.莱林内克
F.加尔平
T.波伊里尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InterDigital VC Holdings Inc
Original Assignee
InterDigital VC Holdings Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by InterDigital VC Holdings Inc filed Critical InterDigital VC Holdings Inc
Publication of CN112352427A publication Critical patent/CN112352427A/zh
Application granted granted Critical
Publication of CN112352427B publication Critical patent/CN112352427B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Abstract

描述不同的实施方式,具体是提出了基于图像块的非对称二元分区的视频编码和解码的实现方式。该编码方法包括对于画面,其中,画面的至少一个分量被划分为样本的块,将块分区为块分区,其中,至少一个块分区具有在宽度和/或高度上等于与2的幂不同的正整数的大小,基于块分区的预测与块分区之间的差来获得残差;将残差分割成至少两个残差块,其大小在宽度和高度上等于2的幂,以及编码至少两个残差块。提出了其他实施例,对于画面的边界上的块分区,设置最大和/或最小块大小以及对应的解码方法。

Description

基于图像块的非对称二元分区的视频编码和解码的方法和 装置
技术领域
公开了用于将视频编码到比特流的方法和装置。还公开了对应的解码方法和装置。
背景技术
为了压缩视频数据,使用画面间预测以利用视频源信号的不同画面之间的时间冗余或者使用画面内预测以利用源信号的单个画面中的空间冗余来编码画面的块形区域。为此,取决于使用的压缩标准,可以指定画面中的各种块大小。然后可以使用变换进一步压缩预测残差以去除变换块内部的相关性,在其被量化并且最终甚至使用熵编码被压缩之前。
在HEVC视频压缩标准(也称为推荐ITU-T H.265)中,画面被分区为所谓的编码树单元(CTU),其是编码的基本单元,类似于早期标准中的宏块。CTU通常包括三个编码树块(一个用于亮度样本的块和两个用于色度样本的块)以及相关联的语法元素。可以将编码树单元进一步分割为编码单元(CU),其是用于预测类型决定(即,执行画面间还是画面内预测)的最小编码元素。最后,还可以将编码单元分割为一个或多个预测单元(PU),以改进预测效率。此外,为了编码预测残差,可以将CU分割为变换单元(TU),其中,变换单元封装变换块,每个变换块是用于施加相同变换的画面分量的样本的方形块。要注意的是,变换单元不必与预测单元对齐,使得例如可能执行跨越来自多个预测单元的残差的单个变换,反之亦然。
在HEVC标准中,为各种逻辑编码单元和对应的编码块定义各种块大小,使得在编码和解码处理期间的适当调整或选择允许优化压缩效率。HEVC中编码单元的分区总是遵循四叉树分割处理,其包括将CU划分为大小相等的4个子编码单元(子CU)。因此,所有HEVC编码单元具有正方形形状,其宽度和高度等于2的幂。
尤其是对于图像块的非对称二元分区,需要增加编码单元表示和分割的灵活性以优化编码器和解码器复杂性和压缩效率之间的权衡。
发明内容
根据本公开的一方面,公开一种用于编码画面的方法,其中,画面的至少一个分量被划分为样本的一个或多个块。这种方法包括将一个块分区为块分区,其中至少一个块分区具有在宽度和/或高度上等于与2的幂不同的正整数的大小;基于块分区的预测与块分区之间的差来获得残差;将残差分割成至少两个残差块,其大小在宽度和高度上等于2的幂;以及变换至少两个残差块为变换系数,量化变换系数,并且熵编码量化的变换系数。
根据本公开的另一方面,公开一种用于编码画面的装置,其中,画面的至少一个分量被划分为样本的一个或多个块。这种设备包括用于将块划分为块分区的部件,其中,至少一个块分区具有在宽度和/或高度上等于与2的幂不同的正整数的大小;用于通过预测块分区并且从块分区减去该预测来生成残差的部件;用于将生成的残差分割成至少两个残差块的部件,至少两个残差块具有在宽度和高度上等于2的幂的大小;以及用于变换至少两个残差块为变换系数,量化变换系数,并且熵编码量化的变换系数的部件。
根据本公开的一方面,提供一种编码画面进行编码的装置,该装置包括处理器以及耦合至处理器的至少一个存储器,该处理器被配置为将一个块分区为块分区,其中至少一个块分区具有在宽度和/或高度上等于与2的幂不同的正整数的大小;基于块分区的预测与块分区之间的差来获得残差;将残差分割成至少两个残差块,其大小在宽度和高度上等于2的幂;以及变换至少两个残差块为变换系数,量化变换系数,并且熵编码量化的变换系数。
根据本公开的另一方面,公开了一种用于解码视频的方法,其中,画面的至少一个分量被划分为样本的一个或多个块。这种方法包括在比特流中接收量化的变换系数;熵解码,去量化和逆变换变换系数以获得在宽度和高度上等于2的幂的大小的残差块;合并至少两个残差块以重构块分区的残差,块分区具有在宽度和高度上等于与2的幂不同的正整数的大小;以及基于块分区的预测和块分区来重构画面的块。
根据本公开的另一方面,公开一种用于解码视频的装置,其中,画面的至少一个分量被划分为样本的一个或多个块。这种装置包括用于在比特流中接收量化的变换系数的部件;用于熵解码,去量化和逆变换变换系数以获得在宽度和高度上等于2的幂的大小的残差块的部件;用于合并至少两个残差块以重构块分区的残差的部件,块分区具有在宽度和高度上等于与2的幂不同的正整数的大小;以及用于基于块分区的预测和块分区来重构画面的块的部件。
根据本公开的一方面,提供一种用于解码视频的装置,该装置包括处理器以及耦合至处理器的至少一个存储器,该处理器被配置为在比特流中接收量化的变换系数;熵解码,去量化和逆变换变换系数以获得在宽度和高度上等于2的幂的大小的残差块;合并至少两个残差块以重构块分区的残差,块分区具有在宽度和高度上等于与2的幂不同的正整数的大小;以及基于块分区的预测和块分区来重构画面的块。
本公开还提供一种信号,该信号包括根据前述任一描述的方法或装置生成的视频数据。本实施例还提供包括指令的计算机程序产品,该指令在由计算机执行时使计算机实施所描述的方法。
本公开还提供计算机可读存储介质,其上存储有根据上述方法生成的比特流。本公开还提供用于发送根据上述方法生成的比特流的方法和装置。
上面呈现主题的简化概述,以便提供对主题实施例的一些方面的基本理解。该概述不是该主题的广泛综述。其不旨在标识实施例的关键/重要要素或描绘主题的范围。其唯一目的是以简化的形式呈现本主题的一些概念,作为稍后提出的更详细描述的序言。
从以下参考附图进行的例示性实施例的详细描述,本公开的附加特征和优点将变得明显。
附图说明
图1例示根据HEVC标准的用以表示编码的画面的编码树单元和编码树概念,
图2例示根据HEVC标准的将编码树单元划分为编码单元,预测单元和变换单元,
图3例示HEVC标准中使用的用于将编码单元分区为预测单元的各种分区类型,
图4例示编码树单元以四叉树和二叉树形式被分割以及编码树单元的对应编码树表示的示例,
图5例示附加编码单元二元非对称分割模式,
图6例示可能的CU分割模式的扩展集合,包括水平和垂直三叉树分割模式,
图7例示编码结构的示例,该编码结构被选择为利用编码树单元的四叉树分解和嵌入四叉树的二叉树分解对示例性画面编码,
图8例示仅使用四叉树分解在示例性画面的画面边界上进行块分区的示例,
图9例示仅使用四叉树和二叉树分解在示例画面的画面边界上进行块分区的示例,
图10例示根据本公开实施例的使用四叉树,二叉树和非对称二叉树分解在示例性画面的画面边界上进行块分区的示例,
图11例示分层级的B画面时间编码结构,
图12例示根据本公开的第二实施例的在给定时间层的给定条带中大块和/或小块大小的使用频率的计算,
图13例示根据本公开的第二实施例的允许非对称二叉树划分的最大和/或最小块大小的调整,
图14例示根据本公开的第二实施例的第一变型的用于限制非对称二叉树分区模式的使用的方法,
图15例示根据本公开的第二实施例的第二变型的用于限制非对称二叉树分区模式的使用的方法,
图16例示根据本公开的第二实施例的第三变型的用于限制非对称二叉树分区模式的使用的方法,
图17例示根据本公开的第四实施例的第一变型的用于将在宽度或高度上大小等于3的倍数的编码单元分割成大小等于2的幂的两个变换单元的方法,
图18例示根据本公开的第四实施例的第二变型的用于将编码单元分割为两个变换单元的方法,
图19例示根据本公开的第四实施例的第三变型的用于将编码单元分割为三个变换单元的方法,
图20例示根据本公开的第四实施例的第四变型的用于通过模拟三叉树分区将编码单元分割为变换单元的方法,
图21例示根据本公开的实施例的示例性编码器,
图22例示根据本公开的实施例的示例性解码器,
图23例示其中实现各个方面和实施例的系统的示例的框图,
图24例示根据本公开的实施例的解码方法,
图25例示根据本公开的实施例的编码方法。
具体实施方式
一种或多种实现方式的技术领域总地与视频压缩有关。与现有的视频压缩系统相比,至少一些实施例还涉及改进压缩效率。至少一个实施例提出在压缩效率方面改进块的非对称二元分区,编码时间与压缩之间的折衷以及仅支持大小等于3的幂的变换。
在HEVC视频压缩标准中,画面被划分为所谓的编码树单元(CTU),其大小典型为64x64、128x128或256x256像素。每个CTU由压缩域中的编码树表示。这是CTU的四叉树划分,其中每个叶片称为编码单元(CU),如图1所示,其描绘两个CTU。在这种情况下,左侧CTU照原样直接使用,而右侧CTU基于由CTU覆盖的画面区域的信号特性被分区为多个较小的部分。箭头指示各个部分的预测运动矢量。
然后,每个CU被给予一些帧内或帧间预测参数(预测信息)。为此,将其在空间上分区为一个或多个预测单元(PU),每个PU均分配有一些预测信息。帧内或帧间编码模式在CU级别分配,如图2所示。
根据在比特流中发信号通知的分区类型,完成编码单元分区为(多个)预测单元。对于帧内编码单元,仅使用图3例示的分区类型2Nx2N和NxN。这意味着在帧内编码单元中仅使用正方形预测单元。相反,帧间编码单元可以使用图3所示的所有分区类型。
根据HEVC标准,在“变换树”之后,编码单元也以递归的方式被划分为所谓的变换单元。因此,变换树是编码单元的四叉树划分,并且变换单元是变换树的叶片。变换单元封装对应于所考虑的正方形空间区域的每个画面分量的正方形变换块。变换块是单个分量中样本的正方形块,在其中应用了相同的变换。
新兴的视频压缩工具包括压缩域中的编码树单元表示,其允许在压缩域中以更灵活的方式表示画面数据。编码树的这种灵活表示的优点是,与HEVC标准的CU/PU/TU布置相比,它提供增加的压缩效率。所谓的四叉树加二叉树(QTBT)编码工具提供这种增加的灵活性。它包括编码树,其中,编码单元可以以四叉树和二叉树的方式被分割。在图4中例示使用QTBT的编码树单元的块分区和对应的编码树表示的示例。
编码单元的分割通过率失真优化过程在编码器侧决定,该过程包括确定最小率失真成本的CTU的QTBT表示。在QTBT技术中,CU具有正方形或矩形形状。编码单元的大小始终是2的幂,典型从4到128。除了用于编码单元的各种矩形形状外,这种新的CTU表示与HEVC相比还具有以下不同特征。
·CTU的QTBT分解分为两个阶段:首先以四叉树的方式分割CTU,然后可以以二元方式进一步划分每个四叉树的叶片。这在图4的右侧例示,其中实线表示四叉树分解阶段,并且虚线表示空间上嵌入四叉树叶片的二元分解。在二叉树的每个分割节点中,一标志发信号通知使用水平分割(0)还是垂直分割(1),对于四叉树分割,不需要指示分割类型。
·在条带内部,亮度和色度块分区结构被分离,并且被独立决定。
·不再采用CU分区成预测单元或变换单元。换句话说,每个编码单元系统地由单个预测单元(之前的2N×2N个预测单元分区类型)和单个变换单元(不分区为变换树)组成。
与QTBT技术相比,在压缩中的画面编码单元表示领域中的至少一个实施例改进压缩效率。
图5例示在非对称编码单元编解码器架构中建议的附加CU二元非对称分割模式。引入具有新矩形形状的编码单元,这由称为非对称分割模式的新二元分割模式产生。这意味着添加新的矩形CU形状。这些新形状在于宽度和/或高度等于3·2n。此外,宽度或高度大小为3的倍数的CU可以进一步以二元方式水平或垂直分割。
结果,将通过提议的非对称二元分割模式之一进行分割,例如HOR_UP(水平向上)的大小为(w,h)(宽度和高度)的正方形编码单元,将导致2个各自具有矩形大小的子编码单元。
另外,可以使用CU的所谓的三叉树分区,从而导致图6中给出的可能分区的集合。三叉树在于在考虑的取向上将CU分割成相对于父CU大小为(1/4,1/2,1/4)树子CU。
图7例示由编码器为示例性画面选择的编码单元。可以看到,在该示例性画面中经常使用非对称编码单元。还注意,这些附加的编码单元拓扑结构有助于使编码结构在空间上与原始信号中包含的结构和不连续性相匹配。
以下部分描述至少一种实现方式。其被如下组织。首先,描述改进画面的边界上的块分区的第一实施例的各种实现方式。然后,描述在编码器侧或解码器侧上实施的根据块大小来适配非对称二元分区的第二实施例的不同实现方式。此外,公开了用于编码树的快速率失真搜索的新启发方法。最后,提出了支持仅具有等于2的幂的变换大小的ABT(非对称二叉树分割)的至少一个实施例。
改进的画面的边界上的块分区
在多功能视频编解码器参考软件(下文称为VTM-1.0或BMS-1.0)中,通过以四叉树方式或对称二叉树方式在画面边界的取向上分割当前块来处理画面边界上的块分区。在BMS-1.0中,如果当前块部分位于当前画面之外,则不允许三叉树分割,并且对称二元分割模式被标记为隐式。隐式分割意味着它是唯一允许的分割(被单独处理的四叉树分割除外),这也意味着解码器在无需任何专用分割模式解析的情况下推断此分割。通过引入非对称二元分割,如果分割恰好在画面边界上,建议使用非对称二元分割作为隐式分割。在这种情况下,使用ABT分割导致更大的CU,由此更好的编码效率。
这在图8至图10中针对示例性画面被描绘,图8至图10示出用于不同分区方法的画面边界处理。图8示出当仅应用四叉树分割时的结果分区,图9示出四叉树和二叉树分割,并且图10示出四叉树,二叉树和非对称二叉树分割。如图10所示可以看到,使用ABT分割导致更大的CU,例如在画面的左下角。
编码器和解码器侧根据块大小自适应使用非对称二元分区
本部分介绍以改进编码时间和压缩效率之间的权衡的方式限制ABT使用的规范方法的实现。
该方法包括:根据要被分区的编码单元的大小,以及根据相同帧内周期(IntraPeriod)中已经编码/解码的条带中的大块和/或小块大小的平均使用率,激活非对称二元分割模式(HOR_UP,…,VER_RIGHT)。
实际上,非对称二元分区工具引入新的块大小6、12、24和48。块大小6典型仅在色度中使用,它以420颜色格式对应于亮度分量中的块大小12。
已经注意到,对于某种类型的视频内容的压缩效率,大块大小48可能是有利压缩效率的。而且,块大小12被广泛地用于许多类型的视频内容上,但是对于其中较大的块大小(例如32、48、64)有利的视频内容的利益有限。
根据第二实施例的变型,这里的方法在于设置允许非对称二元分区的最大和/或最小CU大小(在宽度或高度上)。
对于要被编码和解码的每个条带考虑这样的最大和/或最小CU大小。
根据第二实施例的变型,对于某些块大小的ABT(非对称二叉树)的激活或不激活仅发生在非帧内条带或画面或图块(tile)组或图块(即类型为P或B的帧间条带)中。
根据第二实施例的另一变型,最大和/或最小CU大小在条带报头中发信号通知,并且由解码器在解析条带报头时获得。根据第二实施例的另一变型,以与在编码器侧相同的方式在解码器侧确定最大/最小CU大小阈值。
根据第二实施例的另一变型,根据所考虑的条带的时间层,对每个条带确定最大和/或最小大小阈值。时间层对应于根据图11中所示的层级B画面结构编码的视频中的时间可伸缩性层。
图12例示用于计算给定时间层中的条带中的大块和/或小块使用的频率的方法的实施例。该方法包括计数所考虑的条带中的块的总数以及条带中的大块和/或小块的总数。大块被理解为宽度或高度大于或等于给定阈值(例如48)的块。小块被理解宽度或高度小于或等于给定阈值(例如12)的块。因此,大小为48x4的CU在这里被视为大块。此外,大小12x32的CU被视为这里的小尺寸。在编码器侧计算该大块/小块使用率。根据第二实施例的变型,还在解码器侧计算大块/小块使用率。注意,在编码器侧,一旦条带被编码,就对每个条带执行图12的方法。
基于给定时间层中已编码条带中大/小块的计算频率,编码器确定允许非对称二元分区的最大和/或最小块大小。此处理在图13中例示。这些最大和最小块大小分别标记为maxABTSize和minABTSize。
根据实施例,该方法包括:对于给定条带,利用要编码的时间层TLayer,测试在当前时间层中是否在当前帧内周期中已经编码了先前条带。这通过测试编码块numBlock[TLayer]的数量是否严格大于零来确定。如果是这样,则将相同时间层的前一个条带中的大块的使用频率与阈值(典型25%)比较。如果它低于阈值,则将约束施加到maxABTSize值。典型地,在这种情况下将此值设置为32。这将不允许在下一个要处理的条带中在大小为64或更高的块中使用ABT。
类似地,将在相同时间层的前一条带中的小块的使用频率与阈值(典型为25%)比较。如果它低于阈值,则对minABTSize值施加约束。通常,在这种情况下,此值设置为16。这将不允许在下一个要处理的条带中在大小为12或更小的块中ABT的使用。
根据实施例,图12和图13的方法仅在编码器侧发生。在那种情况下,在比特流中发信号通知maxABTSize和/或minABTSize量,以使解码器知道允许或不允许以哪种块大小进行ABT分区。
根据实施例,图12和图13的方法仅在编码器侧发生,但是在比特流中没有发信号通知maxABTSize和/或minABTSize量。在那种情况下,无论所考虑的序列和时间层中的先前条带中的ABT使用频率如何,都使用常规的CU分割语法。
根据实施例,图12和图13的方法在编码器和解码器侧都发生,并且在解码器处执行的方法与在编码器侧执行的方法完全相同。在这种情况下,可以避免条带报头中的maxABTSize和/或minABTSize的信令,以节省一些比特。
图14、图15和图16示出非限制性示例性方法,其可以在编码器侧和解码器侧上以完全相同的方式在两侧使用来限制ABT分区模式的使用。这些方法考虑要处理的CU的宽度和高度,以及先前计算出的maxABTSize和minABTSize的约束。
在图14的方法中,如果CU的宽度和高度中的至少一个超过maxABTSize或具有小于minABTSize的值,则不允许所有ABT分区模式,而在图15的变型中,如果CU的宽度和高度二者超过maxABTSize或者具有小于minABTSize的值,则不允许ABT分区模式。图16的变型允许单独不允许垂直或水平ABT分割模式。
用于在某些块大小中启用或禁用ABT分区的使用的上述公开方法有利地减少在率失真优化处理中评估的分割模式的数量,从而使其速度更快。此外,这种编码器加速带来非常有限的编码效率损失。
用于编码树的快速率失真搜索的新启发式方法
本部分呈现在编码器侧的编码树的率失真搜索期间,关于非对称二元分割模式HOR_UP,…,VER_RIGHT的选择的附加编码器加速方法。
该方法包括在已经测试的分割模式(QT_SPLIT,HOR,VER)导致最佳CU(处于跳过模式且没有被分区为子CU)的情况下不激活ABT分割模式。在那种情况下并且如果已经测试了HOR的对称二元分割模式VER,则不为当前CU评估ABT分割模式。
此外,如果已经测试水平二元对称分割模式HOR并且如果到目前为止找到的最佳CU没有被分区并且具空(null)残差,则不激活水平非对称分割模式HOR_UP和HOR_DOWN。
类似地,如果已经测试垂直二元对称分割模式VER并且到目前为止找到的最佳CU没有被分区并且具有空残差,则不激活垂直非对称分割模式VER_LEFT和VER_RIGHT。
支持仅变换大小等于2的幂的ABT
以先前提出的方式的非对称二叉树分割为QTBT设计引入附加变换大小。为了避免增加解码器设计中支持的变换的数量,有必要在宽度和高度上大小等于2的幂的块上处理残差变换,量化和熵编码。
至少一个实施例提出将在宽度或高度上大小等于3的倍数的编码单元分割成大小等于2的幂的变换单元的方法。公开了所考虑的CU内部的变换单元的若干种布置,并且对应于提出的实施例。
根据图17所示的第一实施例,参考大小被归一化为“1”的父CU根据非对称分割模式HOR_UP被分割为两个较小的子CU(在下文中也简称为CU)。所示示例基于HOR_UP模式,但是,相同方法可以被应用用于其他非对称分割模式。
由于非对称分割,两个CU之一具有宽度或高度是3的倍数的大小,在所示示例中为下面的CU。宽度或高度是3的倍数的大小的CU被分割成两个TU(变换单元),与CU相比,其分割比率为(1/3,2/3),因此相对于父CU的相对大小为1/4和1/2。因此,这导致大小等于2的幂的两个TU。如图17所示,最小TU在这种情况下在第一个位置,最大TU在第二个位置。根据图18例示的另一实施例,CU与TU之间的分割比率是(2/3,1/3),这意味着最大的TU首先出现在所考虑的CU中。
根据第三实施例,与所考虑的CU相比,CU被分割成具有相对大小(1/3、1/3、1/3)的三个TU。这在图19中示出。该第三实施例可以与帧内CU有关,这是因为如在HEVC中一样,当将CU分割成TU时,则基于TU到TU执行帧内预测。这意味着在帧内预测所考虑的CU中随后的TU之前,首先编码和重构给定的TU。因此,该分割为三个小尺寸的TU可能有助于确保良好的帧内预测,这当预测的块大小较小时执行地更好。
根据第四实施例,以从拓扑观点来看所得到的整个块分区模拟三叉树分区的方式对分区成变换单元进行布置。这在图20中例示。为此,该方法包括以下步骤:
-获得导致在宽度和/或高度上大小等于3的倍数的当前CU的一种或两种非对称分割模式。
-对于在先前步骤中获得的每个非对称分割模式,根据与所获得的非对称分割模式相反的模式的非对称模式,将当前CU分为两个TU。图20例示该实施例的若干种情况。因此,如果所考虑的非对称CU分割为(1/4,3/4),则以率(2/3,1/3)执行TU分割。此外,如果非对称CU分割为(3/4,1/4),则TU分割为(1/3,2/3)。
-此外,在宽度和高度上大小是3的倍数的CU的情况下,在图20的实施例中,CU被划分为4个变换单元。
根据另一实施例,(1/3、1/3、1/3)TU分割仅在帧内CU中使用。
根据另一实施例,帧内CU的TU分割取决于帧内预测方向。选择使得最小的TU位于最接近用于帧内预测所考虑的CU的参考样本的位置。
根据另一实施例,从帧内预测方向推导帧内CU的TU分割。选择使得最大TU位于最接近用于帧内预测所考虑的CU的参考样本。
根据另一实施例,具有最小率失真成本的TU分割被选择,并且在比特流中发信号通知。
根据另一实施例,如果当前TU的预测需要从所考虑的CU周围的一些周围信息推导出的一些预测参数,则在TU到TU的基础上执行该预测参数的推导。该实施例典型涉及基于跨分量线性模型的帧内预测(称为LM模式),或基于模板匹配的帧间预测。
请注意,将在宽度或高度上大小不是2的幂的CU分割为大小等于2的幂的变换单元的概念可能不限于具有CU分割比率(1/4,3/4)的ABT情况。它可能适用于其他一些非对称二叉树分割情况。例如,CU的非对称二元分割可以在于以等于或等于3/8和5/8的分割比率来在宽度或高度上分割CU。在这种情况下,大小分别等于3·2n和5·2n的两个子CU来自于该分割然后,可以将这两个Tu以与上述非对称二元CU分割相同的取向分割为变换单元。可以将第一子CU在取向上以分割比率1/3和2/3划分为两个TU。第二子CU可以以分割比率3/5和2/5划分为两个TU。
附加实施例和信息本节描述各种方面,包括工具,特征,实施例,模型,方法等。这些方面中的许多方面被专门描述,并且至少为了示出各个特性,被以听起来可能受到限制的方式描述。然而,这是为了描述的清楚,并且不限制那些方面的应用或范围。实际上,所有不同方面都可以组合和互换以提供进一步的方面。此外,这些方面也可以与先前申请中描述的方面组合和互换。
本文中描述和设想的方面可以以许多不同的形式实现。下面的图21,图22和图23提供了一些实施例,但是可以设想其他实施例,并且图21、22和23的讨论不限制实施方式的范围。这些方面中的至少一个方面一般涉及视频编码和解码,并且至少另一个方面一般涉及传输所生成或编码的比特流。这些和其他方面可以实现为方法,装置,其上存储有用于根据所描述的任何方法编码或解码视频数据的指令的计算机可读存储介质,和/或其上存储有根据所描述的任何方法生成的比特流的计算机可读存储介质。
在本申请中,术语“重构”和“解码”可以互换使用,术语“像素”和“样本”可以互换使用,术语“图像”,“画面”和“帧”可以互换使用。通常但并非必须,术语“重构”在编码器侧使用,而“解码”在解码器侧使用。
描述了各种方法,并且每个方法包括用于实现所描述的方法的一个或多个步骤或动作。除非方法的适当操作需要特定的步骤或动作顺序,否则可以修改或组合特定步骤和/或动作的顺序和/或使用。
本文件中描述的各种方法和其他方面可用于修改模块,例如,视频编码器100和解码器200的图像分区,变换/逆变换,帧内预测,熵编码和/或解码模块(102、235、125、250、160,260、145、230),如图21和图22所示。此外,本方面不限于VVC或HEVC,并且可以应用于例如其他标准和推荐,无论是现有的还是未来开发的,以及任何此类标准和推荐(包括VVC和HEVC)的扩展。除非另有说明或技术上禁止,否则本文件中描述的各个方面可以单独使用或组合使用。
本文件中使用各种数值,例如maxABTSize或MinABTsize。特定值仅出于示例目的,并且描述的方面不限于这些特定值。
图21例示示例性编码器100。可以设想该编码器100的变型,但是为了清楚起见,下面描述编码器100,而没有描述所有预期的变型。。
在被编码之前,视频序列可以经过预编码处理(101),例如,对输入的彩色画面应用颜色变换(例如,从RGB 4:4:4到YCbCr 4:2:0的转换),或者执行输入画面分量的重新映射,以便获得对压缩更有弹性的信号分布(例如,使用颜色分量之一的直方图均衡化)。元数据可以与预处理相关联,并附加到比特流。
在编码器100中,画面由编码器元件编码,如下所述。要编码的画面例如以CU为单元分区(102)并处理。例如使用帧内或帧间模式编码每个单元。当单元以帧内模式编码时,其执行帧内预测(160)。在帧间模式中,执行运动估计(175)和补偿(170)。编码器决定(105)帧内模式或帧间模式中的哪一个用于编码该单元,并且例如通过预测模式标志指示帧内/帧间决定。通过从原始图像块中减去(110)预测块来计算预测残差。
然后预测残差被变换(125)和量化(130)。熵编码(145)量化的变换系数以及运动矢量和其他语法元素,以输出比特流。编码器可以跳过该变换,并且将量化直接应用于未变换的残差信号。编码器还可以绕过变换和量化两者,即,在不应用变换或量化处理的情况下直接编码残差。
编码器对编码块进行解码,以为进一步的预测提供参考。量化的变换系数被去量化(140)并且逆变换(150)以解码预测残差。组合(155)解码的预测残差和预测块,重构图像块。环内滤波器(165)被应用于重构的画面,以例如执行去块/SAO(样本自适应偏移)滤波以减少编码伪像。滤波图像被存储在参考画面缓冲器(180)中。
图22例示示例性视频解码器200的块图。在示例性解码器200中,由解码器元件解码比特流,如下面描述。视频解码器200一般执行与图1中描述的编码通道相反的解码通道。编码器100也一般执行视频解码作为编码视频数据的一部分。
具体地,解码器的输入包括可由视频编码器100生成的视频比特流。首先熵解码(230)该比特流,以获得变换系数,运动矢量,和其他编码信息。画面分区信息指示画面如何被分区。因此,解码器可以根据解码的画面分区信息来划分(235)画面。去量化(240)和逆变换(250)变换系数以解码预测残差。组合(255)解码的预测残差和预测块,重构图像块。可以从帧内预测(260)或运动补偿预测(即,帧间预测)(275)获得(270)预测块。将环内滤波器(265)应用于重构的图像。滤波的图像存储在参考画面缓冲器(280)处。
解码的画面可以进一步经历后解码处理(285),例如,逆颜色变换(例如,从YCbCr4:2:0到RGB 4:4:4的转换)或逆重新映射,其对预编码处理(101)中执行的重新映射处理执行逆过程。后解码处理可以使用在预编码处理中推导出并在比特流中用信号通知的元数据。
图23例示其中实现各个方面和实施例的系统的示例的块图。系统1000可以体现为包括下面描述的各种组件的设备,并且被配置为执行本文件描述的一个或多个方面。这样的设备的示例包括但不限于各种电子设备,诸如个人计算机,膝上型计算机,智能电话,平板计算机,数字多媒体机顶盒,数字电视接收器,个人视频记录系统,连接的家用电器和服务器。系统1000的元件可以单独或组合地体现在单个集成电路,多个IC和/或分立组件中。例如,在至少一个实施例中,系统1000的处理和编码器/解码器元件分布在多个IC和/或分立组件上。在各种实施例中,系统1000通过例如通信总线或通过专用输入和/或输出端口可通信地耦合到其他类似系统或其他电子设备。在各个实施例中,系统1000被配置为实现本文件中描述的一个或多个方面。
系统1000包括至少一个处理器1010,其被配置为执行加载在其中的指令,用于实现例如本文件描述的各种方面。处理器1010可以包括嵌入式存储器,输入输出接口和本领域已知的各种其他电路。系统1000还包括至少一个存储器1020(例如,易失性存储器设备,非易失性存储器设备)。系统1000包括存储设备1040,其可以包括非易失性存储器和/或易失性存储器,包括但不限于EEPROM,ROM,PROM,RAM,DRAM,SRAM,闪存,磁盘驱动器和/或光盘驱动器。作为非限制性示例,存储设备1040可以包括内部存储设备,附接的存储设备和/或网络可存取存储设备。
系统1000还可以包括编码器/解码器模块1000,其被配置为例如处理数据以提供编码的视频或解码的视频,并且编码器/解码器模块1030可以包括其本身的处理器和存储器。编码器/解码器模块1030表示可以被包括在设备中以执行编码和/或解码功能的(多个)模块。如所知,设备可以包括编码和解码模块中的之一或两者。另外,如本领域技术人员已知的,编码器/解码器模块1030可以实现为系统1000的单独元件,或者可以并入处理器1010内作为硬件和软件的组合。
要加载到处理器1010或编码器/解码器1030上以执行本文件描述的各种方面的程序代码可以存储在存储设备1040中,并且随后加载到存储器1020上用于由处理器1010执行。根据各种实施例,处理器1010,存储器1020,存储设备1040和编码器/解码器模块1030中的一个或多个可以在执行本文件描述的处理期间存储各种项目中的一个或多个,这样的存储项目包括但不限于输入视频,解码视频或解码视频的部分,比特流,矩阵,变量以及从等式,公式,操作和操作逻辑获得的中间或者最终结果。
在若干个实施例中,处理器1010和/或编码器/解码器模块1030内部的存储器用于存储指令并为编码或解码期间所需的处理提供工作存储器。然而,在其他实施例中,处理设备外部的存储器(例如,处理设备可以是处理器1010或编码器/解码器模块1030)被用于这些功能中的一个或多个。外部存储器可以是存储器1020和/或存储设备1040,例如,动态易失性存储器和/或非易失性闪存。在各种实施例中,外部非易失性闪存用于存储电视的操作系统。在至少一个实施例中,诸如RAM之类的快速外部动态易失性存储器被用作用于诸如MPEG-2,HEVC或VVC(通用视频编码)之类的视频编码和解码操作的工作存储器。
如块1130所示,可以通过各种输入设备来提供对系统1900的元件的输入。这种输入设备包括但不限于(i)接收例如由广播公司通过无线方式发送的RF信号的RF部分,(ii)复合输入端子,(iii)USB输入端子,和/或(iv)HDMI输入端子。
在各种实施例中,块1130的输入设备具有相关联的本领域中已知的相应输入处理元件。例如,RF部分可以与以下必需的元件相关联:(i)选择所需频率(也称为选择信号,或将信号限制在频带内),(ii)下转换所选信号,(iii)再次将频带限制到较窄的频带以选择(例如)在某些实施例中可以称为信道的信号频带,(iv)解调下转换并限制频带的信号,(v)执行纠错,以及(vi)解复用以选择所需的数据分组流。各种实施例的RF部分包括一个或多个执行这些功能的元件,例如,频率选择器,信号选择器,频带限制器,信道选择器,滤波器,下转换器,解调器,纠错器和解复用器。RF部分可以包括执行各种这些功能的调谐器,包括例如将接收到的信号下转换为较低频率(例如,中频或近基带频率)或基带。在一个机顶盒实施例中,RF部分及其相关的输入处理元件接收通过有线(例如,电缆)介质传输的RF信号,并通过滤波,下转换和再次滤波到所需频带来执行频率选择。各种实施例重新布置上述(和其他)元件的顺序,移除这些元件中的一些,和/或添加执行类似或不同功能的其他元件。添加元件可以包括在现有元件之间的插入元件,例如,插入放大器和模数转换器。在各个实施例中,RF部分包括天线。
另外,USB和/或HDMI端子可以包括相应的接口处理器,用于通过USB和/或HDMI连接将系统1000连接到其他电子设备。要理解,输入处理的各个方面,例如里德-所罗门纠错,可以根据需要例如在单独的输入处理IC内或在处理器1010内实现。类似地,USB或HDMI接口处理的各方面可以根据需要在单独的接口IC内或在处理器1010内实现。解调,纠错和解复用的流被提供给各种处理元件,包括例如处理器1010和与存储器和存储元件结合操作的编码器/解码器1030,以根据需要处理数据流以在输出设备上呈现。
系统1000的各种元件可以设置在集成壳体内。在集成壳体内,可以使用合适的连接装置1140,例如本领域已知的内部总线,包括I2C,总线,接线和印刷电路板,来互连各种元件并在它们之间传输数据。
系统1000包括使得能够经由通信信道1060与其他设备通信的通信接口1050。通信接口1050可以包括但不限于配置为在通信信道1060上发送和接收数据的收发器。通信接口1050可以包括但不限于调制解调器或网卡,并且通信信道1060可以例如在有线和/或无线介质内实现
在各种实施例中,使用诸如IEEE 802.11的Wi-Fi网络将数据流传输到系统1000。这些实施例的Wi-Fi信号在适配于Wi-Fi通信的通信信道1060和通信接口1050上被接收。这些实施例的通信信道1060典型连接到接入点或路由器,该接入点或路由器提供对包括因特网的外部网络的访问,以允许流传输应用和其他空中通信。其他实施例使用机顶盒向系统1000提供流传输的数据,该机顶盒通过输入块1130的HDMI连接来传递数据。其他实施例也使用输入块1130的RF连接向系统1000提供流传输的数据。
系统1000可以向包括显示器1100,扬声器1110和其他外围设备1120的各种输出设备提供输出信号。其他外围设备1120在实施例的各种示例中包括独立DVR,盘播放器,立体系统,照明系统和其他基于系统1000的输出提供功能的设备中的一个或多个。在各种实施例中,控制信号在系统1000与显示器1100,扬声器1110,或其他外围设备1120之间使用诸如AV.Link,CEC或使得能够在有或没有用户干预的情况下进行设备到设备的控制的其他通信协议之类的信令通信。输出设备可以通过各个接口1070、1080和1090经由专用连接而通信地耦合至系统1000。可替代地,输出设备可以经由通信接口1050使用通信信道1060而连接至系统1000。显示器1100和扬声器1110可以与系统1000的其他组件集成到电子设备(例如电视机)中的单独单元中。在各种实施例中,显示接口1070包括显示驱动器,例如,时序控制器(T Con)芯片。
例如,如果输入1130的RF部分是单独的机顶盒的一部分,则显示器1100和扬声器1110可以与一个或多个其他组件分开。在显示器1100和扬声器1110是外部组件的各种实施例中,可以经由专用输出连接(包括例如HDMI端口,USB端口或COMP输出)来提供输出信号。
实施例可以通过由处理器1010实现的计算机软件或者由硬件,或者由硬件和软件的组合来实施。作为非限制性示例,实施例可以由一个或多个集成电路实现。作为非限制性实施例,存储器1020可以是适合于技术环境的任何类型,并且可以使用任何适当的数据存储技术来实现,诸如光存储设备,磁存储设备,基于半导体的存储设备,固定存储器和可移动存储器。作为非限制性示例,处理器1010可以是适合于技术环境的任何类型,并且可以包括微处理器,通用计算机,专用计算机和基于多核架构的处理器中的一个或多个。
图24例示根据至少一个实施例的一般方面的示例性编码方法1200。访问要编码的视频的画面块。如上所述,在步骤1210中,将块分区为块分区,其中至少一个块分区具有在宽度和/或高度上等于与2的幂不同的正整数的大小,具体是宽度和/或高度为3的倍数。在步骤1220,通过预测块分区,具体是通过帧内或帧间预测,并从块分区减去预测,来生成残差。在步骤1230,将生成的残差分割为至少两个残差块,其在宽度和高度上大小等于2的幂。在步骤1240,通过二维块变换将至少两个残差块变换为变换系数,变换系数被量化和熵编码。可以重复上述方法,直到画面中具有在宽度和/或高度上大小等于3的倍数的所有块都已被编码为止。
解码方法将在某种程度上以相反的顺序执行操作并且进行“逆”操作,如图25所示,其例示根据至少一个实施例的一般方面的示例性解码方法1300。在步骤1310中,例如经由图23例示的系统1000的输入块1130,接收包括量化的变换系数以及运动矢量和其他语法元素的比特流。量化的变换系数在步骤1320中被熵解码,去量化和逆变换以获得在宽度和高度上大小等于2的幂的残差块。在步骤1330中至少两个残差块被合并,以重构在宽度和/或高度上大小等于与2的幂不同的正整数的块分区的残差,具体是,宽度和/或高度是3的倍数。最后,通过在步骤1340中预测块分区并将残差与预测的块分区组合,来重构画面的块。
上面呈现简化的解码和编码方法,以便提供主题实施例的一些方面的基本理解。这样,编码和解码步骤不限于上述子步骤。通过以下例示性实施例的详细描述,本公开的附加特征,变型和优点将变得明显。
各种实现方式涉及解码。本申请中使用的“解码”可以涵盖例如对接收到的编码序列执行的全部或部分处理,以便产生适合于显示的最终输出。在各种实施例中,这样的处理包括通常由解码器执行的一个或多个处理,例如,熵解码,逆量化,逆变换和差分解码。在各种实施例中,这样的处理还包括或者可替代地包括由本申请中描述的各种实现方式的由解码器执行的处理,例如,从平铺的(打包的)画面中提取画面,确定用于非对称二叉树分区的参数,以及然后根据确定的ABT参数确定画面分割模式。
作为另外的示例,在一个实施例中,“解码”仅是指熵解码,在另一实施例中,“解码”仅是指差分解码,并且在另一实施例中,“解码”是指熵解码和差分解码的组合。短语“解码处理”意图具体指操作的子集还是广义上指更广泛的解码处理,基于特定描述的上下文将是清楚的,并且相信本领域技术人员将很好地理解。
各种实现方式涉及编码。以与上述关于“解码”的讨论类似的方式,在本申请中使用的“编码”可以涵盖例如对输入视频序列执行的全部或部分处理,以便产生编码的比特流。在各种实施例中,这样的处理包括典型由编码器执行的一个或多个处理,例如,分区,差分编码,变换,量化和熵编码。在各种实施例中,这样的处理还包括或者可替代地包括由本申请中描述的各种实现方式的由编码器执行的处理。
作为另外的示例,在一个实施例中,“编码”仅是指熵编码,在另一实施例中,“编码”仅是指差分编码,并且在另一实施例中,“编码”是指熵编码和差分编码的组合。短语“编码处理”意图具体指操作的子集还是广义上指更广泛的编码处理,基于特定描述的上下文将是清楚的,并且相信本领域技术人员将很好地理解
注意,本文所使用的语法元素(例如,MaxABTsize和/或MinABTsize)是描述性术语。因此,它们不排除使用其他语法元素名称。可以使用其他术语,诸如TCH_LARGE_BLOCK或TCH_SMALL_BLOCK。
当将附图作为流程图呈现时,应当理解,其还提供对应装置的框图。类似地,当将附图表示为框图时,应理解,其还提供对应方法/处理的流程图。
各个实施例涉及率失真优化。具体地,在编码处理期间,经常在给定计算复杂性的约束的情况下,通常要考虑率和失真之间的平衡或折衷。通常将率失真优化公式化为最小化率失真函数,其是率和失真的加权和。有多种解决率失真优化问题的方法。例如,这些方法可以基于包括所有考虑的模式或编码参数值的所有编码选项的广泛测试,以及其编码成本和编码和解码之后的重构信号的相关失真的完整评估。也可以使用更快的方法来节省编码复杂性,具体地基于预测或预测残差信号而不是重构的来计算近似失真。也可以使用这两种方法的混合,诸如通过使用仅对某些可能的编码选项的近似失真,以及对其他编码选项的完全失真。其他方法仅评估可能的编码选项的子集合。更一般地,许多方法采用各种技术中的任何一种来执行优化,但是优化不一定是编码成本和相关失真二者的完整评估。
本文描述的实现方式和方面可以在例如方法或处理,装置,软件程序,数据流或信号中实现。即使仅在单个实现形式的上下文中讨论(例如,仅作为方法讨论),讨论的特征的实现方式也可以以其他形式(例如,装置或程序)来实现。装置可以在例如适当的硬件,软件和固件中实现。方法例如可以在例如,处理器中实现,该处理器一般指代处理设备,包括例如计算机,微处理器,集成电路或可编程逻辑设备。处理器也包括通信设备,例如计算机,蜂窝电话,便携/个人数字助理(“PDA”),以及便于终端用户之间的信息通信的其他设备。
对“一个实施例”或“实施例”或“一个实现方式”或“实现方式”的引用以及其其他变型意味着结合实施例描述的具体特征,结构,特性等包括在至少一个实施例中。因此,在整个文件中出现在各个地方的短语“在一个实施例中”或“在实施例中”或“在一个实现方式中”或“在实现方式中”以及任何其他变型的出现不一定都指代同一个实施例。
另外,本文件可以涉及“确定”各种信息。确定信息可以包括例如估计信息,计算信息,预测信息或从存储器检索信息中的一个或多个。
此外,本文件可以涉及“访问”各种信息。访问信息可以包括例如接收信息,检索信息(例如,从存储器中),存储信息,移动信息,复制信息,计算信息,确定信息,预测信息或估计信息中的一个或多个。
另外,本文件可以涉及“接收”各种信息。与“访问”一样,接收意图是广义术语。接收信息可以包括例如访问信息或检索信息(例如,从存储器中)中的一个或多个。此外,“接收”典型在操作期间以一种方式或其他方式,涉及例如,存储信息,处理信息,传送信息,移动信息,复制信息,擦除信息,计算信息,确定信息,预测信息或估计信息。
要认识到,例如在“A/B”,“A和/或B”和“A和B中的至少一个”的情况中的以下“/”,“和/或”和“至少一个”的使用意图包括仅对第一所列选项(A)的选择、或仅对第二所列选项(B)的选择、或对两个选项(A和B)的选择。作为进一步的例子,在“A、B和/或C”和“A、B和C中的至少一个”的情况中,这样的措辞意图包括仅对第一所列选项(A)的选择、或仅对第二所列选择(B)的选择、或仅对第三所列选项(C)的选择、或仅对第一和第二所列选项(A和B)的选择、或仅对第一和第三所列选项(A和C)的选择、或仅对第二和第三所列选项(B和C)的选择、或对全部三个选项(A和B和C)的选择。如同对于本领域和相关领域中的普通技术人员来说清楚地,可以对于所列出的许多项目扩展该措辞。
另外,如本文使用,词语“信号”除了其他方面涉及将事物指向对应的解码器。例如,在某些实施例中,编码器发信号通知用于ABT的多个参数中的特定一个。以这种方式,在实施例中,在编码器侧和解码器侧都使用相同的参数。因此,例如,编码器可以向解码器发送(显式信令)特定参数,使得解码器可以使用相同的特定参数。相反,如果解码器已经具有特定参数以及其他参数,则可以使用信令而无需发送(隐式信令)以简单地允许解码器知道并选择特定参数。通过避免传输任何实际函数,在各种实施例中实现比特节省。要理解,可以以多种方式来完成信令。例如,在各种实施例中,一个或多个语法元素,标志等用于用信号发送信息到对应的解码器。尽管前面涉及词语“信号”的动词形式,但词语“信号”在本文中也可以用作名词。
将对于本领域技术人员明显的是,实现方式可以产生被格式化以携带例如可以存储或传送的信息的各种信号。该信息可以包括例如用于执行方法的指令或由描述的实施方式之一产生数据。例如,可以格式化信号以携带描述的实施例的比特流。这样的信号可以被格式化,例如作为电磁波(例如,使用频谱的射频部分)或者作为基带信号。格式化可以包括,例如编码数据流和用编码数据流调制载波。信号携带的信息可以是例如模拟或数字信息。如已知,信号可以通过各种不同的有线或无线链路传送。信号可以存储在处理器可读介质上。
我们已经描述多个实施例。这些实施例提供了至少为包括跨越各种不同权利要求种类和类型的所有组合的以下广义的权利要求:
·非对称二叉树分区被约束/参数化,以改进解码器和/或编码器中的压缩效率。
·非对称二叉树分区响应于编码单元的大小,以在解码器和/或编码器中处理。
·非对称二叉树分区响应于解码器和/或编码器中的画面边界。
·块分区优先化最大化画面内部的块大小的分割模式。
·如果分割边界与画面边界匹配,则块分区将ABT优先于BT。
·在解码器和/或编码器中启用/禁用非对称块分区。
·启用或禁用非对称二叉树分区是基于已编码条带中大块/小块的平均使用。
·启用或禁用非对称二叉树分区包括设置最大和/或最小CU大小(在宽度或高度上),由此确定允许非对称二叉树分区的范围,
·启用或禁用非对称二叉树分区应用于非帧内条带(即,帧间P或B条带),
·设置最大和/或最小CU大小(在宽度或高度上),称为MaxABTsize和/或MinABTsize,响应于已编码条带中大/小块的平均使用,
·已编码条带中的最大和/或最小CU大小是在编码器中计算的,在编码器中编码的,然后传输到解码器/由解码器接收的。
·在编码器和解码器中计算已编码条带中的最大和/或最小CU大小。
·对于给定的时间层计算已编码条带中的最大和/或最小CU大小。
·对于给定时间层,基于统计(大小大于最大CU大小和/或小于最小CU大小的块的百分比)计算已编码条带中的最大和/或最小CU大小。
·插入信令语法元素,使解码器能够识别最大和/或最小CU大小。
·基于这些语法元素,选择分割模式以应用于解码器。
·根据另一实施例,TU分割适配于支持仅利用两个变换大小的幂的ABT,其中
ο(1/3,1/3,1/3)CU分区为Tu
ο最小的子TU作为分区中的第一个子TU
ο最大的子TU作为分区中的第一个子TU
ο利用3的倍数的CU内部的Tu的TT仿真
ο帧内情况:参考样本附近的最小子TU,这取决于内部预测方向
ο根据所考虑的编码单元的编码模式推断TU分区
ο在各种子TU布置和相关联的信令之间的率失真优化选择
ο在暗示块的预测参数的空间传播/推导的预测模式的情况下,在TU至TU的基础上进行
·包含一个或多个描述的语法元素或其变型的比特流或信号。
·插入信令语法元素,使解码器能够以与编码器使用的方式相对应的方式适配残差。
·创建和/或发送和/或接收和/或解码包括一个或多个描述的语法元素或其变型的比特流或信号。
·根据所描述的任何实施例的对图像进行图像分区的电视机,机顶盒,手机,平板电脑或其他电子设备。
·根据描述的任何实施例执行图像分区,并显示(例如,使用监视器,屏幕或其他类型的显示)作为结果的图像的电视,机顶盒,手机,平板电脑或其他电子设备。
·根据描述的任何实施例,调谐(例如,使用调谐器)信道以接收包括编码图像的信号,并执行图像分区的电视,机顶盒,手机,平板电脑或其他电子设备。
·根据描述的任何实施例,通过无线方式接收(例如,使用天线)包括编码图像的信号,并执行图像分区的电视,机顶盒,手机,平板电脑或其他电子设备。
在整个本公开中,还支持和构想了各种其他广义的和特定化的实施例和权利要求。

Claims (24)

1.一种包括解码画面的方法,其中,画面被划分为样本的一个或多个块,并且其中,样本的块被进一步分区为至少两个块分区,所述解码还包括:
-在比特流中接收量化的变换系数;
-对变换系数进行熵解码,去量化和逆变换以获得块分区的残差;和
-基于块分区的预测和块分区的残差来重构样本的块,其中,根据用作画面的边界处的块的隐式分割的非对称二元分区来获得至少一个块分区。
2.根据权利要求1所述的方法,其中,至少一个块分区具有在宽度或高度上等于3的倍数的大小。
3.根据权利要求2所述的方法,其中,对变换系数进行逆变换以获得在宽度或高度上大小等于3的倍数的块分区的残差,还包括将在宽度和高度上大小等于2的幂的至少两个残差块合并为块分区的残差。
4.根据权利要求3的方法,其中,通过以下之一来获得在宽度或高度上大小等于3的倍数的块分区的残差:
-合并两个残差块,其中,一个残差块是另一个残差块的大小的两倍;
-合并相等大小的三个残差块;
-合并四个残差块。
5.根据权利要求4所述的方法,其中,合并相等大小的三个残差块仅用于帧内预测的块分区。
6.根据权利要求5的方法,其中,合并用于帧内预测的块分区取决于帧内预测方向。
7.一种设备,包括存储器和被配置为解码画面的一个或多个处理器,画面被划分为样本的一个或多个块,并且其中,样本的块被进一步分区为至少两个块分区,所述一个或多个处理器还被配置为:
-在比特流中接收量化的变换系数;
-对变换系数进行熵解码,去量化和逆变换以获得块分区的残差;和
-基于块分区的预测和块分区的残差来重构样本的块,根据用作画面的边界处的块的隐式分割的非对称二元分区来获得至少一个块分区。
8.根据权利要求7所述的设备,其中,至少一个块分区具有在宽度或高度上等于3的倍数的大小。
9.根据权利要求8所述的设备,其中,通过将在宽度和高度上大小等于2的幂的至少两个残差块合并为块分区的残差来获得在宽度或高度上大小等于3的倍数的块分区的残差。
10.根据权利要求9所述的设备,其中,通过以下之一获得在宽度或高度上大小等于3的倍数的块分区的残差:
-合并两个残差块,其中,一个残差块是另一个残差块的大小的两倍;
-合并相等大小的三个残差块;
-合并四个残差块。
11.根据权利要求10所述的设备,其中,合并相等大小的三个残差块仅用于帧内预测的块分区。
12.根据权利要求11所述的设备,其中,合并用于帧内预测的块分区取决于帧内预测方向。
13.一种包括编码画面的方法,其中,画面被划分为样本的一个或多个块,所述编码还包括:
-将样本的块分区为至少两个块分区,其中,根据用作画面的边界处的块的隐式分割的非对称二元分区来获得至少一个块分区;
-基于块分区的预测和块分区之间的差来获得块分区的残差;和
-将块分区的残差变换为变换系数,对变换系数进行量化,并对量化的变换系数进行熵编码。
14.根据权利要求13所述的方法,其中,至少一个块分区具有在宽度或高度上等于3的倍数的大小。
15.根据权利要求14所述的方法,其中,将块分区的残差变换为变换系数还包括:将残差分割为在宽度和高度上大小等于2的幂的至少两个残差块。
16.根据权利要求15所述的方法,其中,根据以下之一将在宽度或高度上大小等于3的倍数的块分区的残差分割为至少两个残差块:
-将块分区的残差分割成两个残差块,其中,一个残差块是另一个残差块的大小的两倍;
-将块分区的残差分割成相等大小的三个残差块;
-将块分区的残差分割成四个残差块。
17.根据权利要求16所述的方法,其中,将块分区分割为相等大小的三个残差块仅用于帧内预测的块分区。
18.根据权利要求17所述的方法,其中,分割帧内预测的块分区取决于帧内预测方向。
19.一种设备,包括:存储器和被配置为编码画面的一个或多个处理器,其中,画面被划分为样本的一个或多个块,所述一个或多个处理器还被配置为:
-将样本的块分区为至少两个块分区,其中,根据用作画面的边界处的块的隐式分割的非对称二元分区来获得至少一个块分区;
-基于块分区的预测和块分区之间的差来获得块分区的残差;和
-将块分区的残差变换为变换系数,对变换系数进行量化,并对量化的变换系数进行熵编码。
20.根据权利要求19所述的设备,其中,至少一个块分区具有在宽度或高度上等于3的倍数的大小。
21.根据权利要求20所述的设备,其中,通过将块分区的残差分割为在宽度和高度上大小等于2的幂的至少两个残差块来获得块分区的残差。
22.根据权利要求21所述的设备,其中,根据以下之一将在宽度或高度上大小等于3的倍数的块分区的残差分割为至少两个残差块:
-将块分区的残差分割成两个残差块,其中,一个残差块是另一个残差块的大小的两倍;
-将块分区的残差分割成相等大小的三个残差块;
-将块分区的残差分割成四个残差块。
23.根据权利要求22所述的设备,其中,将块分区的残差分割为相等大小的三个残差块仅用于帧内预测的块分区。
24.根据权利要求23所述的设备,其中,分割帧内预测的块分区的残差取决于帧内预测方向。
CN201980040727.3A 2018-06-18 2019-06-13 基于图像块的非对称二元分区的视频编码和解码的方法和装置 Active CN112352427B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18305758.7 2018-06-18
EP18305758 2018-06-18
PCT/US2019/036929 WO2019245841A1 (en) 2018-06-18 2019-06-13 Method and apparatus for video encoding and decoding based on asymmetric binary partitioning of image blocks

Publications (2)

Publication Number Publication Date
CN112352427A CN112352427A (zh) 2021-02-09
CN112352427B true CN112352427B (zh) 2024-04-09

Family

ID=62791695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980040727.3A Active CN112352427B (zh) 2018-06-18 2019-06-13 基于图像块的非对称二元分区的视频编码和解码的方法和装置

Country Status (6)

Country Link
US (1) US11956430B2 (zh)
EP (1) EP3808083A1 (zh)
KR (1) KR20210020915A (zh)
CN (1) CN112352427B (zh)
BR (1) BR112020024082A2 (zh)
WO (1) WO2019245841A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210217205A1 (en) * 2020-01-09 2021-07-15 Tencent America LLC Techniques and apparatus for explicit quad-tree and binary-tree partitioning for geometry coding
US11363285B2 (en) * 2020-02-20 2022-06-14 Tencent America LLC Block partitioning at picture boundaries
CN113286152B (zh) * 2020-02-20 2023-05-23 腾讯美国有限责任公司 视频解码方法、装置、计算机设备及存储介质
WO2022028855A1 (en) * 2020-08-07 2022-02-10 Interdigital Vc Holdings France, Sas Combining abt with vvc sub-block-based coding tools
WO2022117402A2 (en) * 2020-12-03 2022-06-09 Interdigital Vc Holdings France, Sas Intra prediction for asymmetric partition
KR20230174244A (ko) * 2021-04-19 2023-12-27 인터디지털 씨이 페이튼트 홀딩스, 에스에이에스 Abt를 위한 vvc 규범적 및 인코더 측 적응들

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102648631A (zh) * 2009-12-01 2012-08-22 数码士有限公司 用于编码/解码高分辨率图像的方法和设备
AU2012232972A1 (en) * 2012-09-28 2014-04-17 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the prediction units of a coding unit
WO2015142075A1 (ko) * 2014-03-19 2015-09-24 삼성전자 주식회사 3d 영상에 관련된 블록의 파티션 경계에서 필터링 수행 방법
KR20160078318A (ko) * 2016-06-23 2016-07-04 에스케이텔레콤 주식회사 영상 부호화/복호화 방법 및 장치
WO2017123980A1 (en) * 2016-01-15 2017-07-20 Qualcomm Incorporated Multi-type-tree framework for video coding
CN107005718A (zh) * 2014-12-10 2017-08-01 联发科技(新加坡)私人有限公司 使用二叉树块分区的视频编码的方法
WO2017219342A1 (en) * 2016-06-24 2017-12-28 Mediatek Inc. Methods of signaling quantization parameter for quad-tree plus binary tree structure

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101484280B1 (ko) 2009-12-08 2015-01-20 삼성전자주식회사 임의적인 파티션을 이용한 움직임 예측에 따른 비디오 부호화 방법 및 장치, 임의적인 파티션을 이용한 움직임 보상에 따른 비디오 복호화 방법 및 장치
US20130163664A1 (en) 2011-12-22 2013-06-27 Qualcomm Incorporated Unified partition mode table for intra-mode coding
US10244253B2 (en) * 2013-09-13 2019-03-26 Qualcomm Incorporated Video coding techniques using asymmetric motion partitioning
US11146821B2 (en) * 2016-05-25 2021-10-12 Arris Enterprises Llc JVET coding block structure with asymmetrical partitioning
WO2018037723A1 (ja) * 2016-08-26 2018-03-01 シャープ株式会社 画像復号装置及び画像符号化装置
US10609423B2 (en) * 2016-09-07 2020-03-31 Qualcomm Incorporated Tree-type coding for video coding
US20180109812A1 (en) 2016-10-14 2018-04-19 Media Tek Inc. Block partitioning using tree structures
KR20190112735A (ko) * 2017-01-31 2019-10-07 샤프 가부시키가이샤 비디오 코딩을 위해 비디오 블록들로 화상을 파티셔닝하기 위한 시스템들 및 방법들
US20180367818A1 (en) * 2017-06-15 2018-12-20 Futurewei Technologies, Inc. Block Partition Structure in Video Compression
CA3106615A1 (en) * 2017-07-17 2019-01-24 Industry-University Cooperation Foundation Hanyang University Method and apparatus for encoding/decoding image
WO2019047763A1 (en) * 2017-09-08 2019-03-14 Mediatek Inc. METHODS AND APPARATUSES FOR PROCESSING IMAGES IN AN IMAGE OR VIDEO ENCODING SYSTEM
US11412220B2 (en) * 2017-12-14 2022-08-09 Interdigital Vc Holdings, Inc. Texture-based partitioning decisions for video compression
WO2019219066A1 (zh) * 2018-05-16 2019-11-21 华为技术有限公司 一种编解码方法及装置
MX2020012809A (es) * 2018-05-30 2021-02-15 Huawei Tech Co Ltd Extension de profundidad de arbol multi-tipo para manejo de limite de imagen.
TWI723433B (zh) * 2018-06-21 2021-04-01 大陸商北京字節跳動網絡技術有限公司 改進的邊界分割
WO2020003183A1 (en) * 2018-06-29 2020-01-02 Beijing Bytedance Network Technology Co., Ltd. Partitioning of zero unit
CN113824968A (zh) * 2020-06-18 2021-12-21 富士通株式会社 编码单元划分方法、图像编解码方法和装置
WO2022019613A1 (ko) * 2020-07-20 2022-01-27 한국전자통신연구원 기하학적 분할을 사용하는 영상 부호화/복호화를 위한 방법, 장치 및 기록 매체

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102648631A (zh) * 2009-12-01 2012-08-22 数码士有限公司 用于编码/解码高分辨率图像的方法和设备
AU2012232972A1 (en) * 2012-09-28 2014-04-17 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the prediction units of a coding unit
WO2015142075A1 (ko) * 2014-03-19 2015-09-24 삼성전자 주식회사 3d 영상에 관련된 블록의 파티션 경계에서 필터링 수행 방법
CN107005718A (zh) * 2014-12-10 2017-08-01 联发科技(新加坡)私人有限公司 使用二叉树块分区的视频编码的方法
WO2017123980A1 (en) * 2016-01-15 2017-07-20 Qualcomm Incorporated Multi-type-tree framework for video coding
KR20160078318A (ko) * 2016-06-23 2016-07-04 에스케이텔레콤 주식회사 영상 부호화/복호화 방법 및 장치
WO2017219342A1 (en) * 2016-06-24 2017-12-28 Mediatek Inc. Methods of signaling quantization parameter for quad-tree plus binary tree structure

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Description of SDR, HDR, and 360° video coding technology proposal by Fraunhofer HHI.Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 10th Meeting: San Diego, US, 10–20 Apr. 2018,JVET-J0014-v4.2018,全文. *

Also Published As

Publication number Publication date
US20210258576A1 (en) 2021-08-19
BR112020024082A2 (pt) 2021-02-09
US11956430B2 (en) 2024-04-09
CN112352427A (zh) 2021-02-09
EP3808083A1 (en) 2021-04-21
KR20210020915A (ko) 2021-02-24
WO2019245841A1 (en) 2019-12-26

Similar Documents

Publication Publication Date Title
CN112352427B (zh) 基于图像块的非对称二元分区的视频编码和解码的方法和装置
CN113228650B (zh) 基于块的表面的视频编码或解码的量化
EP3703366A1 (en) Method and device for picture encoding and decoding
US20240089437A1 (en) Chroma quantization parameter adjustment in video encoding and decoding
CN114208178A (zh) 用于视频编码和解码的二次变换
WO2020254335A1 (en) Lossless mode for versatile video coding
CN112385212A (zh) 用于视频编码或解码的语法元素
CN112771874A (zh) 用于画面编码和解码的方法和设备
CN112823522A (zh) 用于广角帧内预测的方向
CN113302924A (zh) 用于视频编码和解码的量化
CN112189341A (zh) 用于视频编码和解码的量化参数预测
KR20210128497A (ko) 비디오 인코딩 및 디코딩을 위한 엔트로피 코딩
EP3641312A1 (en) Method and apparatus for determining chroma quantization parameters when using separate coding trees for luma and chroma
CN113273198A (zh) 用于视频编码和解码的多个编码单元之间的参数分组
US20220360781A1 (en) Video encoding and decoding using block area based quantization matrices
EP3591971A1 (en) Chroma quantization parameter adjustment in video encoding and decoding
US20220038704A1 (en) Method and apparatus for determining chroma quantization parameters when using separate coding trees for luma and chroma
EP3664450A1 (en) Method and device for picture encoding and decoding
CN116158078A (zh) 将abt与基于vvc子块的编码工具组合
EP3591969A1 (en) Syntax elements for video encoding or decoding
CN113170149A (zh) 用于图片编码和解码的方法和设备
CN115336267A (zh) 用于联合色度编码块的缩放过程
CN112913248A (zh) 用译码类型或译码树类型的信令进行视频编码和解码的方法和装置
CN114731430A (zh) 与多个变换选择、矩阵加权帧内预测或多参考线帧内预测结合的用于视频编码和解码的帧内子分区

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant