CN112204968A - 使用图片边界处理对图片进行编码和解码的装置和方法 - Google Patents

使用图片边界处理对图片进行编码和解码的装置和方法 Download PDF

Info

Publication number
CN112204968A
CN112204968A CN201980036096.8A CN201980036096A CN112204968A CN 112204968 A CN112204968 A CN 112204968A CN 201980036096 A CN201980036096 A CN 201980036096A CN 112204968 A CN112204968 A CN 112204968A
Authority
CN
China
Prior art keywords
segmentation
picture
predetermined block
modes
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201980036096.8A
Other languages
English (en)
Other versions
CN112204968B (zh
Inventor
亚当·维科夫斯基
瓦勒日·乔治
托比亚斯·欣茨
海科·施瓦茨
德特勒夫·马尔佩
托马斯·威甘德
杰基·马
延斯·勃兰登堡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN112204968A publication Critical patent/CN112204968A/zh
Application granted granted Critical
Publication of CN112204968B publication Critical patent/CN112204968B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种用于对图片(12)进行编码的装置(10),所述装置被配置为:使用递归多树划分来将图片(12)划分为叶块,使用图片(12)到叶块的划分,将图片(12)基于块编码在数据流(14)中,其中,所述装置(10)被配置为在将图片(12)划分为叶块时,针对与所述多树划分的预定树级别相对应并且延伸超过图片(12)的边界的预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c),根据图片(12)的边界与预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)相交的位置,缩减用于分割预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)的可用分割模式集合,以便获得一个或多个分割模式的缩减集合,其中,如果缩减集合的基数为1,则所述装置(10)被配置为应用分割预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)的缩减集合的分割模式,以及如果缩减集合的基数大于1,则所述装置(10)被配置为选择缩减集合的分割模式中的一个分割模式,并且应用所选的分割模式中的一个分割模式来分割预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c),并在数据流(14)中用信号通知所述选择。本发明还涉及用于对图片(12)进行解码的设备(20),用于对图片(12)进行编码的方法以及用于对图片(12)进行解码的方法。

Description

使用图片边界处理对图片进行编码和解码的装置和方法
技术领域
本发明涉及图片和视频编码。本发明的实施例涉及将特定大小的输入图片和视频数据划分为较小实体的特定方式。特别地,本发明的实施例涉及递归图片信号划分中的图片边界处理。
背景技术
在现代视频编码应用中,特定大小的输入视频信号被划分为较小的组块(chunk)[1]。这种划分由多个结构组成,这些结构具有与每个级别相关联的特定信息和描述。在最新的视频编解码器H.265/HEVC[1]中,最重要的细分是细分为宏块。这些宏块或编码树单元(CTU)是具有预定义大小(例如,32×32或64×64个亮度样本)的二叉树结构,从而跨越编码图片上的固定网格。所有其他划分级别均根据该刚性细分进行定义。例如,根据包含的CTU来定义分为切片(slice)和图块(tile)的更粗略的高级别划分。
在H.265/HEVC[1]中,从每个CTU开始,用信号通知四叉树结构提供了将刚性CTU递归地划分为柔性子结构的方法。在每个级别上,在已定义的参数范围内,都将推断或用信号通知应分割为四个子块或以指定级别编码的块。递归地重复此过程,直到无法通过当前的高级别参数定义进一步的分割为止,或者直到读取到指示不应在当前级别上执行进一步的分割的标志为止。在这种情况下,将读取编码单元及其子结构的信令。
有时可以省略四叉树分割的信令,并将其推断为“真”或“假”。最值得注意的是,由于刚性性质,CTU不一定与视频图片边界对齐。在这种情况下,如果四叉树划分结构中的CTU或子块未完全包含在图片边界中,则将在没有显式信令的情况下将分割标志推断为肯定的。如果在分割之后,子块完全位于视频图片边界之外,则将不再针对该块读取进一步的信令。
在功能超过H.265/HEVC[1]的未来视频标准的开发中,四叉树递归分割结构通过不同的分割配置进行了扩展[2]。如果未将块分割为四个二叉树子部分,则用信号通知二叉分割,其指示应使用1/2的分割率来将该块分割成两个矩形块。该信令还包括分割是应该水平地还是竖直地应用的信息。可以使用二叉树分割语法将此类矩形块进一步递归分割为较小的二叉树或矩形块。这种增强的分割树被称为QTBT[2]。QTBT使用隐式四叉分割来处理图片边界,与H.265/HEVC标准[1]完全相同。在QTBT中,如果块超出图片边界,则将推断四叉分割,并且将不读取任何信令。
在[5]中,描述了一种新颖的划分方法,即通用二叉分割(GBS),它可以不包含四叉分割,但也可以与四叉分割一起使用。在这种方法中,可以用信号通知二叉分割,以用除1/2之外的分割比率来执行分割(在QTBT中,二叉分割在当前块的中间执行分割)。还可以使用相对于先前的分割的语法来用信号通知分割(例如,垂直和平行而不是水平和竖直)。
但是,传统的划分方法在处理图片边界时是相当刚性的。如上所述,常规划分方法可以在图片边界处使用隐式四叉分割。即,现有技术在图片边界处使用完全隐式的分割推导。这样的隐式信令可以实现良好的信令效率。但是,这只可以提供低的灵活性。
因此,本发明的一个目的是增强现有的划分方法,使其在图像边界处理中更加灵活,同时减少用于用信号通知图像边界处理的比特预算。
发明内容
本发明通过提供根据权利要求1的用于对图片进行编码的装置、根据权利要求10的用于对图片进行解码的装置、根据权利要求19的用于对图片进行编码的方法、根据权利要求20的用于对图片进行解码的方法以及根据权利要求21的计算机程序,来提供一种解决方案。
第一方面涉及一种用于对图片进行编码的装置。该装置被配置为使用递归多树划分来将图片划分为叶块。即,该装置被配置为使用所述递归多树划分来将图片划分为较小的组块。所述较小的组块可以是一定大小的块。通过逐步遍历多树,图片的划分可以从第一级别的树根块开始,并且其可以在叶块处结束,叶块是多树的最后的块,并且因此是划分的最小实体。在树根块和所划分的叶块之间,该装置可以逐步地从一个分区树级别转到一个或多个后续分区树级别,其中在每个树级别上,将特定树级别上的当前块划分成两个或更多个较小的块。例如,在HEVC中,树根块可以是所谓的宏块或编码树单元(CTU),并且叶块可以是所谓的子块或编码单元(CU)。因此,CTU可以被划分为一个或多个CU,其中,在树根块与叶块之间的树级别上的叶块或任何块可以被称为子块。此外,在本公开中,树根块或叶块,或在树根块与叶块之间的树级别上的任何块可以被称为预定块。因此,预定块可以对应于多树划分的预定树级别。该装置可以利用基于块的编码方案,即,该装置被配置为通过使用将图片划分为叶块来将图片基于块编码为数据流。划分也可以称为分割。将树根块划分为较小的叶块可以使用用于将块分割为较小的子块的某种分割方案。这些分割方案也可以称为分割模式,其可以在每个树级别上变化。此外,预定块可以包括预定大小。当将预定块布置为图片上的网格时,可能发生如下情况:某些预定块由于其尺寸可能延伸超过图片边界。例如,预定块的第一部分可以位于图片内部,而所述预定块的第二部分可以位于图片外部。因此,图片边界可以与预定块相交。通常,图片边界可以在不同位置处与预定块相交。例如,图片边界可以水平或竖直地与预定块相交,或水平和竖直地与预定块相交,其中图片拐角将被包含在预定块中。为了处理这些情况,本发明提供以下解决方案。在将图片划分为叶块时,该装置被配置为:与现有技术使用的完全隐式分割导出相比,通过使用缩减分割模式集合,来划分与多树划分的预定树级别相对应并且延伸超过图片边界的预定块。根据本发明,该设备被配置为:根据图片边界与所述预定块相交的上述位置,来缩减用于分割预定块的可用分割模式集合。因此,该装置获得一个或多个分割模式的缩减集合。缩减集合可以包括一基数,其指示在缩减分割模式集合中可用的分割模式的数量。因此,如果缩减集合的基数是1,即,如果缩减集合仅包括一个分割模式,则该装置被配置为应用缩减集合的分割模式来分割预定块。如果缩减集合的基数大于1,即,如果缩减集合包括两个或更多个不同的分割模式,则该装置被配置选择缩减集合的这些分割模式中的一个,并且应用所选的分割模式中的一个来分割预定块,其中该装置在数据流中用信号通知其相应的选择。换句话说,本发明的装置可以预选择缩减分割模式集合来分割当前的预定块。所述预选择可以取决于块相对于图片边界的当前位置。因此,本发明的装置可以仅需要从预选择的缩减分割模式集合中选择合适的分割模式。这减少了用于在数据流中用信号通知所选的分割模式的比特预算,因为不需要传输有关分割本身的信息,并且如果缩减分割集合包括多于一个分割模式,则只需要例如利用一个箱来用信号通知其余的不确定性。
第二方面涉及一种用于解码图片的装置。该装置被配置为使用递归多树划分来将图片划分为叶块。该装置还被配置为使用图片到叶块的划分,从数据流中基于块解码图片。该装置还被配置为:在将图片划分为叶块时,针对与多树划分的预定树级别相对应并且延伸超过图片的边界的预定块,根据边界与预定块相交的位置,缩减用于分割预定块的可用分割模式集合,以获得一个或多个分割模式的缩减集合。如果缩减集合的基数为1,则该装置被配置为应用缩减集合的分割模式来分割预定块,并且如果缩减集合的基数大于1,则该装置被配置为根据数据流中的信号,选择缩减集合的分割模式中的一个分割模式,并且应用分割模式的所选的一个分割模式来分割预定块。关于用于解码图片的所述装置的优点,参考以上描述用于编码图片的装置的优点的段落。
第三方面涉及一种用于编码图片的方法,该方法包括使用递归多树划分来将图片划分为叶块的步骤。该方法还包括以下步骤:使用图片到叶块的划分,将图片基于块编码为数据流。该方法还包括以下步骤:在将图片划分为叶块时,针对与多树划分的预定树级别相对应并且延伸超过图片的边界的预定块,根据边界与预定块相交的位置,缩减用于分割预定块的可用分割模式集合,以获得一个或多个分割模式的缩减集合。如果缩减集合的基数为1,则该方法包括以下步骤:应用缩减集合的分割模式来分割预定块;并且如果缩减集合的基数大于1,则该方法包括以下步骤:选择缩减集合的分割模式中的一个分割模式,并且应用分割模式的所选的一个分割模式来分割预定块,并在数据流中用信号通知该选择。关于用于编码图片的所述方法的优点,参考以上描述用于编码图片的装置的优点的段落。
第四方面涉及一种用于解码图片的方法,该方法包括使用递归多树划分来将图片划分为叶块的步骤。该方法还包括以下步骤:使用图片到叶块的划分,从数据流中基于块解码图片。该方法还包括以下步骤:在将图片划分为叶块时,针对与多树划分的预定树级别相对应并且延伸超过图片的边界的预定块,根据边界与预定块相交的位置,缩减用于分割预定块的可用分割模式集合,以获得一个或多个分割模式的缩减集合。如果缩减集合的基数为1,则该方法包括以下另一步骤:应用缩减集合的分割模式来分割预定块;并且如果缩减集合的基数大于1,则该方法包括以下另一步骤:根据数据流中的信号,选择缩减集合的分割模式中的一个分割模式,并且应用分割模式的所选的一个分割模式来分割预定块。关于用于解码图片的所述方法的优点,参考以上描述用于编码图片的装置的优点的段落。
根据第五方面,提供了计算机程序,其中每个计算机程序被配置为:当在计算机或信号处理器上被执行时,实现上述方法,使得上述方法由计算机程序之一来实现。
附图说明
本发明的有利方面是独立权利要求的主题。下面将参照附图示例性地描述在从属权利要求中定义的本申请的优选实施例,在附图中,
图1示出了作为编码器的示例的用于对图片进行预测性编码的装置的框图,在该装置中可以实现根据本申请的实施例的帧内预测概念,
图2示出了作为解码器的示例的与图1的装置匹配的用于对图片进行预测性解码的装置的框图,在该装置中可以实现根据本申请的实施例的帧内预测概念,
图3示出了说明用于预测残差信号、预测信号和重构信号之间的关系的示例的示意图,以示出分别针对编码模式选择、变换选择和变换性能设置细分的可能性,
图4A示出了根据本概念的编码器的实施例,
图4B示出了根据本概念的解码器的实施例,
图5A示出了完全不受限制的决策树,其包括完整的可用分割模式集合,
图5B示出了根据本概念的包括缩减分割模式集合的受限决策树,
图5C示出了另一完全不受限制的决策树,其包括完整的可用分割模式集合,
图5D示出了根据本概念的包括缩减分割模式集合的受限决策树,
图6示出了块如何延伸超过图片边界的不同情况的示意图,
图7A示出了四叉分割模式的示例,
图7B示出了竖直双分割模式的示例,
图7C示出了水平双分割模式的示例,
图7D示出了垂直三叉分割模式的示例,
图7E示出了水平三叉分割模式的示例,
图8A示出了仅使用四叉分割将宏块分割为叶块的示例,
图8B示出了使用从缩减分割模式集合中选择的四叉分割、竖直双分割和水平双分割将宏块分割为叶块的示例,
图9示出了根据本概念的用于对图片进行编码的方法的框图,以及
图10示出了根据本概念的用于对图片进行解码的方法的框图。
具体实施方式
在以下描述中,通过相同或等同附图标记来表示相同或等同元件或者具有相同或等同功能的元件。
附图的以下描述可以仅描述本文描述的概念的多个说明性和非限制性示例和实施例中的一些。CTU可以被描述为宏块的非限制性示例,而CU可以被描述为子块的非限制性示例。此外,(例如,矩形)图片可以由例如多个图块组成,每个图块本身表示图像。在HEVC[1]中,例如针对全向视频,这种图块化由图片图块的高级概念使用和处理。这种图块化在CTU分辨率下可用。如果放宽了这种限制,则“编码图片”可能由多个图块组成,每个图块都有自己的边界和内容。在这个意义上,编码图片可能包含更多的图片边界,其中每个图块都用其自己的“图片数据”边界构成其自己的“图片数据”,本发明中所述的相同规则可以适用于这种情况。因此,如果在本文中使用术语“图片边界”,则其还可以包括例如属于一个或多个图块的“当前图片数据边界”。
对附图的以下描述从呈现对用于对视频的图片进行编码的基于块的预测性编解码器的编码器和解码器的描述开始,以形成可以在其中加入实施例的编码框架的示例。针对图1至图3描述了编码器和解码器。在下文中,将呈现对本申请的概念的实施例的描述,以及关于如何将这些概念加入到图1的编码器和图2的解码器中的描述,然而通过随后的图4和以下内容描述的实施例也可用于形成不根据基于图1和图2的编码器和解码器的编码框架操作的编码器和解码器。
图1示出了用于示例性地使用基于变换的残差编码来将图片12预测性地编码在数据流14中的装置。使用附图标记10指示用于编码的装置或编码器。图2示出了用于解码的对应装置或解码器20,其可以是被配置为还使用基于变换的残差解码来从数据流14中预测性地解码图片12'的装置,其中,撇号被用于指示由解码器20重构的图像12’可以按照由预测残差信号的量化引入的编码损失从最初由装置10进行编码的图片12中导出。图1和图2示例性地使用基于变换的预测残差编码,然而本申请的实施例不限于这种预测残差编码。对于参照图1和图2描述的其他细节也是如此,这将在下文中概述。
编码器10可以被配置为对预测残差信号进行空间到频谱变换,并将由此获得的预测残差信号编码到数据流14中。同样地,解码器20可以被配置为对来自数据流14的预测残差信号进行解码,并且对由此获得的预测残差信号进行频谱到空间变换。
在内部,编码器10可以包括预测残差信号形成器22,该预测残差信号形成器22生成预测残差24,以便测量预测信号26与原始信号(即,与图片12)的偏差。预测残差信号形成器22可以例如是减法器,其从原始信号(即,从图片12)中减去预测信号。然后,编码器10还包括变换器28,其对预测残差信号24进行空间到频谱变换以获得频谱域预测残差信号24',该频谱域预测残差信号24'然后由也包括在编码器10中的量化器32进行量化。这种量化的预测残差信号24”被编码到比特流14中。为此,编码器10可以可选地包括熵编码器34,该熵编码器34将变换和量化后的预测残差信号熵编码到数据流14中。预测残差26由编码器10的预测级36基于被编码到数据流14中并可从数据流14中解码的预测残差信号24”生成。为此,如图1所示,预测级36可以在内部包括去量化器38,该去量化器38对预测残差信号24”进行去量化,从而获得除了量化损失之外与信号24’相对应的频谱域预测残差信号24”',接着是逆变换器40,其对后一个预测残差信号24”'进行逆变换,即频谱到空间变换,以获得预测残差信号24””,除量化损失外,该预测残差信号24””与原始预测残差信号24相对应。然后,预测级36的组合器42例如通过相加来重新组合预测信号26和预测残差信号24””,以获得重构信号46,即原始信号12的重构。重构信号46可以对应于信号12’。然后,预测级36的预测模块44通过使用例如空间预测(即帧内预测)和/或时间预测(即帧间预测),基于信号46来生成预测信号26。
同样,如图2所示,解码器20可以在内部由与预测级36相对应并以与预测级36相对应的方式互连的组件组成。具体地,解码器20的熵解码器50可以对来自数据流的量化谱域预测残差信号24”进行熵解码,然后,以以上针对预测级36的模块所描述的方式进行互连和协作的解量化器52、逆变换器54、组合器56和预测模块58基于预测残差信号24”来恢复重构信号,使得,如图2所示,组合器56的输出产生重构信号,即图片12'。
尽管上面没有具体描述,但是很容易明白,编码器10可以根据某种优化方案(例如,以优化某种速率和失真相关标准(即,编码成本)的方式)来设置一些编码参数,包括例如预测模式、运动参数等。例如,编码器10和解码器20以及对应的模块44、58分别可以支持不同的预测模式,例如,帧内编码模式和帧间编码模式。编码器和解码器在这些预测模式类型之间进行切换所依据的粒度可以对应于将图片12和12'分别细分为编码段或编码块。例如,以这些编码段为单位,可以将图片细分为帧内编码的块和帧间编码的块。帧内编码块是基于相应块的空间上的、已经被编码/解码的邻域来预测的,如下面更详细地概述的。可以存在包括方向性或角度帧内编码模式在内的若干种帧内编码模式,并为各个帧内编码的片段选择帧内编码模式,根据该帧内编码模式,通过沿着特定于各个方向性帧内编码模式的某个方向,将邻域的样本值外插到相应的帧内编码的片段中来填充各个片段。帧内编码模式还可以例如还包括一种或多种其他模式,例如DC编码模式和/或平面帧内编码模式,根据DC编码模式,对各个帧内编码的块的预测将DC值分配给各个帧内编码的片段内的所有样本,根据平面帧内编码模式,各个块的预测被近似或确定为由二维线性函数描述的在各个帧内编码的块的样本位置上的样本值的空间分布,其中基于相邻样本来驱动由二维线性函数定义的平面的斜率和和偏移。与此相比,可以例如在时间上预测帧间编码块。对于帧间编码块,可以在数据流中用信号通知运动矢量,该运动矢量指示图片12所属的视频的先前编码的图片的一部分的空间位移,在该位移处,对先前编码/解码的图片进行采样,以便获得用于相应的帧间编码块的预测信号。这意味着,除了数据流14所包括的残差信号编码(例如,表示量化的谱域预测残差信号24”的熵编码的变换系数水平)之外,数据流14还可以在其中编码用于向各个块分配编码模式的编码模式参数,一些块的预测参数(例如,帧间编码段的运动参数),以及可选的其他参数(例如,用于控制和用信号通知图片12和12'分别细分为段的参数)。解码器20使用这些参数以与编码器相同的方式细分图片,将相同的预测模式分配给段,并执行相同的预测以产生相同的预测信号。
图3示出了一方面的经重构的图片12’与另一方面的在数据流中用信号通知的预测残差信号24””和预测信号26的组合之间的关系。如上所述,该组合可以是加法。预测信号26在图3中被示为将图片区域细分为使用阴影线示意性表示的帧内编码块和未用阴影线示意性表示的帧间编码块。细分可以是任何细分,例如将图片区域规则地细分为多行的块和多列的块,或者将图片12多树细分为不同大小的叶块,例如四叉树等细分为块,其中在图3中示出规则细分和多树细分的混合,其中首先将图片区域细分为多行和多列的树根块,然后根据递归多树细分将树根块进一步细分。再次,数据流14可以具有编码到其中的用于帧内编码的块80的帧内编码模式,其将若干种支持的帧内编码模式之一分配给相应的帧内编码的块80。进一步的细节在下面描述。对于帧间编码块82,数据流14可以具有一个或多个编码到其中的运动参数。一般而言,帧间编码块82不限于在时间上被编码。备选地,帧间编码的块82可以是从除了当前图片12本身之外的先前编码的部分预测的任何块,诸如图片12所属的视频的先前编码的图片,或者在编码器10和解码器20分别为可缩放编码器和解码器的情况下,为另一视图或层级较低的层的图片。图3中的预测残差信号24”'也被示为图片区域到块84的细分。这些块可以被称为变换块,以便将其与编码块80和82区分开。实际上,图3示出了编码器10和解码器20可以分别使用两种不同的细分将图片12和图片12’细分为块,即,一个细分为编码块80和82,并且另一个细分为变换块84。两种细分可能是相同的,即每个编码块80和82可以同时形成变换块84,但是图3示出了如下情况,其中例如到变换块84的细分形成到编码块80、82的细分的扩展,以便块80和82的两个块之间的任何边界都覆盖两个块84之间的边界,或者换句话说,每个块80、82与变换块84之一重合,或者与变换块84的集群重合。但是,也可以彼此独立地确定或选择细分,使得变换块84可以替代地与块80、82之间的块边界相交。就细分为变换块84而言,类似的陈述因此是正确的,正如关于细分为块80、82提出的那样,即块84可以是:将图片区域规则细分为按行和按列排列的块的结果,图片区域的递归多树细分的结果或其组合,或者任何其他种类的分块。顺便说一句,应注意,块80、82和84不限于二叉树、矩形或任何其他形状。
图3示出了预测信号26和预测残差信号24””的组合直接产生重构信号12’。然而,应注意,根据替代实施例,可以将一个以上的预测信号26与预测残差信号24””相组合以产生图片12’。
在图3中,变换块84应具有以下含义。变换器28和逆变换器54以这些变换块84为单位执行它们的变换。例如,许多编解码器对所有变换块84使用某种类型的DST或DCT。一些编解码器允许跳过变换,使得对于某些变换块84,直接在空间域中对预测残差信号进行编码。然而,根据以下描述的实施例,编码器10和解码器20以它们支持几种变换的方式来配置。例如,编码器10和解码器20支持的变换可以包括:
οDCT-II(或DCT-III),其中DCT代表离散余弦变换
οDST-IV,其中DST代表离散正弦变换
οDCT-IV
οDST-VII
ο恒等变换(IT)
自然地,尽管变换器28将支持这些变换的所有正向变换版本,但解码器20或逆变换器54将支持其相应的后向或逆版本:
ο逆DCT-II(或逆DCT-III)
ο逆DST-IV
ο逆DCT-IV
ο逆DST-VII
ο恒等变换(IT)
后续描述提供了关于编码器10和解码器20可以支持哪些变换的更多细节。无论如何,应该注意的是,一组被支持的变换可以仅包括一种变换,例如一种频谱到空间或空间到频谱的变换。
如上面已经概述的,图1至图3作为示例被呈现,其中可以实施以下进一步描述的概念以便形成根据本申请的编码器10和解码器20的特定示例。就此而言,图1的编码器10和图2的解码器20表示了本文下面描述的编码器和解码器的可能的实施方式。然而,图1和图2仅是示例。然而,根据本申请的实施例的编码器可以使用以下更详细地概述的概念来执行图片12的基于块的编码,并且该编码器与图1的编码器具有如下不同之处:例如,该编码器不是视频编码器,而是静止图片编码器;该编码器不支持帧间预测;或者该编码器以与图3所例示的方式不同的方式来执行细分为块80;或者甚至该编码器不使用变换预测残差编码,其中替代地直接在空间域中编码预测残差。同样,根据本申请的实施例的解码器可以使用以下进一步概述的帧内预测编码概念来执行从数据流14中对图片12’的基于块的解码,但是该解码器可以与图2的解码器20例如在以下方面不同:不是视频编码器而是静止图片编码器,不支持帧间预测,或者以与参照图3描述的方式不同的方式将图片12’细分为块,和/或不在变换域从数据流14中导出预测残差,而是例如在空间域中导出。
图4A示出了用于将图片12编码在数据流14中的装置10的实施例。图片12可以被细分为块,或者例如在基于HEVC的编解码器的情况下被细分为宏块,也称为CTU 101a、101b、...、101o。
在下文中也称为编码器10的装置10被配置为将宏块101a、101b、…、101o进一步划分为较小的子块102a、102b、102c、102d,并且最终划分为叶块(其中叶块尚未在图4A中示出,但稍后将参照图8A和图8B进行描述)。编码器10被配置为通过使用递归多树划分来将图片12划分为叶块。为了进一步处理所述叶块,编码器10被配置为将图片12基于块编码到数据流14中,即,通过对叶块进行编码来进行。
图片12到数据流14中的所述基于块的编码可以包括数据流14中的相应信令,该信令尤其可以包括关于在数据流14中的划分的指示,例如用于指示一个或多个划分参数(例如,用于划分当前块的分割模式和分割比)的指示。
关于多树划分,可以沿着分割树(例如,图5A至图5D)对块进行划分,其中,分割树的每个节点可以属于图片中的相应块。如果块被分割,则分割树可以在后续的分割级别(也称为划分级别)上继承后续的树节点。可以在一个或多个划分级别上完成数据流14中的上述信令。根据一些示例,可以在一个或多个划分级别上在数据流14中用信号通知划分参数(例如,分割模式,分割比等),并且在一些其他示例中,可以在每个划分级别上在数据流14中用信号通知划分参数(例如,分割模式,分割比等)。根据另一示例,可以在分割树中的划分级别上在数据流14中用信号通知划分参数,其中处于所述划分级别上的树节点可以属于位于要被编码的图片12的图片边界处的一个或多个块。数据流14中的上述信令可以与本文描述的每个发明构思和对应的实施例结合使用。
返回图4A,可以看出,宏块101a、101b、…、101o是预定大小的二叉树结构,其跨图片12上的固定网格。由于该固定网格可能超过图片12的大小,因此有时可能发生以下情况:所述网格的宏块101a、101b、…、101o中的一些可能超出图片12的边界。在图4A中,借助于宏块101e、101m和101o示例性地示出了这种情况。
例如,关于宏块101e,宏块101e的左上部和左下部可以位于图片12内部,而宏块101e的右上部和右下部可以位于图片12外部。因此,宏块101e延伸超过图片12的边界,使得图片12的所述边界在特定位置与宏块101e相交,该特定位置即宏块101e的左上部和左下部依据其位于图片12的内部而宏块101e的右上部和右下部依据其位于图片12的外部的位置。
例如,关于宏块101o,仅宏块101o的左上部位于图片12内部,而宏块101o的右上部、右下部和左下部位于图片12外部。此外,关于宏块101m,宏块101m的左上部和右上部位于图片12内部,而宏块101m的左下部和右下部位于图片12外部。因此,图片12的相应边界在不同位置处与各个宏块101e、101m、101o相交。将在稍后在参照图6的文本中说明关于宏块的位置,特别是宏块101e、101m、101o相对于图片12的边界的位置的更多细节。
如上所述,宏块101a、101b、…,101o可以被划分为较小的子块,并最终被划分为叶块。针对子块102a、102b、102c、102d示出了非限制性示例。子块本身可以经历划分,直到到达叶块为止。划分也可以称为分割,其中可以通过使用不同的分割模式来执行宏块和子块的这种分割。示例可以是四叉分割、水平二叉分割(也称为双分割)、竖直双分割、水平三叉分割(也称为三分割)和竖直三叉分割。可以使用二叉决定树来执行分割信令,其中可以以如上所述的方式在数据流14中指示所述分割信令。
为了简要说明这种决策树,将参照图5A至图5D,这些图将图片边界处的分割信令与图片内部的分割信令进行比较。图5A和图5C描绘了可以用于图片内部的分割信令的完全不受限制的决策树,而图5B和图5D描绘了根据本概念的可以用于图片边界处的分割信令的示例性受限决策树。
图5A中的完全不受限制的决策树可以在本概念中用作可用分割模式集合,其可以例如基于[2]中所述的四叉树加二叉树(QTBT)结构。QTBT方案包括用于将块分割为较小的块的可用分割模式集合,该可用分割模式集合包含四种所示的分割模式,即,四叉分割、无分割、竖直分割或水平分割。因此,在每次将块划分成较小的块时,现有技术的编码器可能总是必须逐步通过完全不受限制的决策树,即,通过完整的可用分割模式集合。可以看出,为了实现决策树中的水平或竖直分割(即叶块),必须花费三个箱(bin)。编码器还必须在数据流中分别用信号通知选择的分割模式。然而,在图片边界处,现有技术可能执行隐式四叉分割并避免在数据流中用信号通知任何相关指示。这导致对图片边界处的块的相当不灵活的处理。
图5C中的完全不受限制的决策树可以在本概念中用作可用分割模式集合,其可以例如基于[2]和[3]中所述的四叉树加二叉树(QTBT)加多类型树(MTT)结构。QTBT+MTT方案包括用于将块分割为较小的块的可用分割模式集合,该可用分割模式集合包含六种所示的分割模式,即,四叉分割、无分割、竖直二叉分割、竖直三叉分割、水平二叉分割和水平三叉分割。因此,在每次将块划分成较小的块时,现有技术的编码器可能总是必须逐步通过完全不受限制的决策树,即,通过完整的可用分割模式集合。在该示例中,为了实现决策树中的水平或竖直分割(即叶块),必须花费四个箱。编码器还必须在数据流中分别用信号通知选择的分割模式。然而,在图片边界处,现有技术可能执行隐式四叉分割并避免在数据流中用信号通知任何相关指示。与图5A相比,这导致对图片边界处的块的处理更加不灵活。
因此,根据本发明,编码器10被配置为:至少针对位于图片边界处的那些预定块(宏块或子块),即,至少部分地位于图片12内部的那些预定块,缩减可用分割模式集合,以提供缩减分割模式集合,如之前参照图4A所示的预定块101e、101m和101o示例性地描述的。
如在图5B和图5D中示例性地示出的,上述缩减分割模式集合可以例如确切地包括两个分割模式。替代地,缩减分割模式集合可以包括两个以上的分割模式,或者确切地包括一个分割模式。
例如,缩减分割模式集合可以包括四叉分割(图7A)和竖直分割。竖直分割可以例如是竖直二叉分割(图7B)或竖直三叉分割(图7D)。
附加地或替代地,缩减分割模式集合可以例如包括四叉分割和水平分割。水平分割可以例如是水平二叉分割(图7C)或水平三叉分割(图7E)。
附加地或替代地,缩减分割模式集合可以例如包括竖直分割和水平分割。水平分割可以例如是水平二叉分割或水平三叉分割,并且竖直分割可以例如是垂直二叉分割或竖直三叉分割。
附加地或替代地,缩减分割模式集合可以例如仅包括四叉分割。
附加地或替代地,例如在四叉分割可能不可用的情况下,缩减分割模式集合可以例如包括水平(二叉或三叉)分割或竖直(二叉或三叉)分割。
附加地或替代地,缩减分割模式可以例如确切地包括一个预定的分割模式,其可以是水平分割或竖直分割。选择哪个分割可以取决于预定块相对于相应的图片边界的位置,例如,在底部图片边界的情况下可以选择水平分割,而在右侧图片边界的情况下可以选择竖直分割。水平分割可以是水平双分割或水平三叉分割。竖直分割可以是竖直双分割或水平三叉分割。如在决策树中可见,例如在图5D中,在缩减集合中,仅水平或竖直分割中的一个可用。
在以上每种情况下,二叉分割中的一个或多个可以例如包括1/2的分割比。
概括地说,根据本文描述的创新原理的缩减分割集合可以包括以下分割:
(a)如果存在这样的分割:不受限制的分割,其在被应用时将不会阻碍对给定块的进一步细分。
(b)如果存在这样的分割:将创建与图片边界平行的边缘的分割,以及
i.如果存在这样的分割并且对于给定块允许这样的分割:被设置在分割块的中间的分割,或者
ii.如果存在这样的分割并且对于给定块允许这样的分割:将创建与图片边界并置的划分边缘的分割。
在本发明的特定非限制性实施例中,该实施例基于QTBT但是对于[3]和[4]以及提供上述不同分割可能性的其他划分方案也有效:四叉分割、竖直三叉分割、竖直二叉分割(例如,具有1/2的分割比)、水平三叉分割和水平二叉分割(例如,具有1/2的分割比)(见图7A至图7E);根据本文描述的创新原理的缩减分割集合可以是:
·四叉分割(a)和例如分割比为1/2的竖直双分割(b)-i或竖直三叉分割(b)-ii
·四叉分割(a)和例如分割比为1/2的水平双分割(b)-i或水平三叉分割(b)-ii
·四叉分割(a)或水平或竖直二叉或三叉分割,例如,具有分割比1/2(例如,由于某些限制四叉分割可能不可用)。
因此,根据本发明原理的缩减分割模式集合可以包括用于分割图片边界处的块的分割模式中的预选的分割模式。编码器10可以选择缩减分割模式集合中包含的分割模式中的一个,以用于对图片边界处的块进行划分,并且编码器10可以在数据流14中用信号通知所选择的分割模式。因此,当与现有技术中的隐式四叉分割相比较时,本概念可以针对图片边界处的块扩展信令。然而,编码器10可能仅需要用信号通知数据流14中的不确定性,这将信令工作量保持在可观的水平。然而,与现有技术相比,本概念在划分图片边界处的块时提供了更高的灵活性。这种灵活性的获得可以补偿和/或优于稍高的信令工作量。
即使图5B可以示例性地示出包括两个不同的分割模式(即,四叉分割和竖直双分割)的缩减分割模式集合,但是缩减集合也可以包括四叉分割和水平双分割,或竖直双分割和水平双分割,或如上所述的任何其他组合。根据示例,缩减分割模式集合可以包括至少一个分割模式。根据另一示例,缩减分割模式集合可以包括至少两个不同的分割模式。根据又一示例,缩减分割模式集合可以确切地仅包括两个不同的分割模式,即使可用分割模式集合可以包含不止这两个不同的分割模式。
对应当包含在缩减分割模式集合中的分割模式的选择可以取决于相应的预定块101e、101m、101o相对于图片12的边界的位置,即,取决于图片12的边界与预定块101e、101m、101o相交的位置。
换句话说,编码器10被配置为:在将图片12划分为叶块时,针对与多树划分的预定树级别相对应并且延伸超过图片12的边界的预定块101e、101m、101o,根据图片12的边界与预定块101e、101m、101o相交的位置,缩减用于分割预定块101e、101m、101o的可用分割模式集合,以获得一个或多个分割模式的缩减集合。
根据本发明,如果缩减集合的基数为1,即,如果缩减分割模式集合仅包括一种分割模式,则编码器10被配置为应用缩减集合的该分割模式来分割预定块101e、101m、101o。
然而,如果缩减集合的基数大于1,即,如果缩减分割模式集合包括两个或更多个分割模式,则编码器10被配置为选择缩减集合的这些分割模式中的一个,并且应用所选的分割模式中的一个来分割预定块101e、101m、101o。此外,编码器10被配置为以如上所述的方式在数据流14中发信号通知相应的选择,即,所选择的分割模式。例如,编码器10可以通过设置1比特标志来用信号通知该选择。然而,如上所述,仅必须在数据流14中用信号通知包含在已经缩减的分割模式集合中的分割模式之间的不确定性。
如上所述,缩减集合的基数可以确切地为1或确切地为2。
图4B示出了用于解码数据流14中的图片12的对应装置20,所述装置在下文也被称为解码器20。
解码器20被配置为使用递归多树划分来将图片12划分为叶块,并且使用图片12到叶块的划分,从数据流14中基于块解码图片12。
解码器20还被配置为:在将图片12划分为叶块时,针对与多树划分的预定树级别相对应并且延伸超过图片12的边界的预定块,根据图片12的边界与预定块相交的位置,缩减用于分割预定块的可用分割模式集合,以获得一个或多个分割模式的缩减集合。
同样,如果缩减集合的基数为1,即,如果缩减分割模式集合仅包括一种分割模式,则解码器20被配置为应用缩减集合的分割模式来分割预定块。
如果缩减集合的基数大于1,即,如果缩减分割模式集合包括两个或更多个分割模式,则解码器20被配置为根据数据流14中的信号来选择缩减集合的分割模式中的一个,并且应用所选的分割模式中的一个来分割预定块。即,解码器20可以从数据流14中导出信号,该信号向解码器20指示用于划分的分割模式。该信号可以是上文提及的1比特标志,其先前可能已经被编码器10打包到数据流中。
因此,本文描述的概念提供了边界处理的新颖机制。它可以适用于通常在特定级别上允许多于一个分割的所有递归划分方法。同样,当与现有技术的隐式分割相比时,本概念可以针对图片边界处的块来扩展信令。然而,与现有技术相比,本概念在划分图片边界处的块时提供了更高的灵活性。根据本概念,这种灵活性的获得可以补偿和/或优于缩减分割模式集合的稍高的信令工作量。
在图6中描绘了本概念的非限制性示例,其示出了类似于图4A的被划分图片12。但是,图6示出了更多的一些细节,即尺寸为wfxhf(宽x高)的图片12,例如,该图片12被细分为块(例如,宏块101a、101b、…、101o)、较小的子块以及最终的叶块。突出显示了三个特定的宏块,并用带圆圈的数字1、2和3对其进行了编号。这些示例性突出显示的宏块可以对应于如图4所示的先前描述的宏块101e、101m、101o。此外,将在下文中参照图8A和8B在稍后稍微详细地讨论叶块。
图6示出了将图片12划分成具有固定大小的刚性宏块结构(例如,H.265/HEVC[1]中的或具有超过H.265/HEVC[2]的功能的未来视频标准中的CTU划分)。在该示例中,可以假设视频信号分辨率可以在空间上不限于单个宏块101a、101b、...、101o的大小的倍数。如果给出了这些前提条件,则可以推断出宏块行的最后一个宏块和/或最后一个宏块行中的所有宏块可能超过图片12的至少一个边界。在这种情况下,将此宏块分为编码单元(CU)、预测单元(PU)和变换单元(TU)或任何其他类型的子CTU级分区的低级划分,应当确保已编码分区位于图片12的边界内部。本文所述的概念可以允许定义用于划分块的缩减分割集合,例如,宏块101m由位置xb,yb定义,宽度为wb,并且高度为hb,在以下六种实例中的至少一种实例中,其块可能会超出尺寸为wfxhf的图片12的边界:
C1:对应于框101e,即,101e的右上角未被包含图片12中,左下角被包含在图片12中(左上角位于图片12内部):
xb+wb>wf;yb+hb≤hf;xb≥0;yb≥0
C2:对应于块101m,即,101m的右上角被包含在图片12中,左下角未被包含在图片12中(左上角位于图片12内部):
xb+wb≤wf;yb+hb>hf;xb≥0;yb≥0
C3:对应于块101o,即,右上角和左下角均未被包含在图12中(左上角位于图片12内部):
xb+wb>wf;yb+hb>hf;xb≥0;yb≥0
C4:块的左上角未被包含在图片中,左下角未被包含在图片12中,右上角被包含在图片12中:xb<0;yb≥0;xb+wb>0(此实例可以与实例1等同地处理,并且没有单独详述)
C5:块的左上角未被包含在图片12中,右上角未被包含在图片12中,左下角被包含在图片12中:xb≥0;yb<0;yb+hb>0(此实例可以与实例2等同地处理,并且没有单独详述)
C6:图片12中仅包含以下块角之一:右下、右上或左下(这种实例将与实例3等同地处理,并且没有单独详述)
如果对于特定的预定块和图片12,实例C1至C6均不成立,则该预定块可能位于图片12的边界之外,并且可能与本文所述的概念无关。一次可以有一个以上的实例成立,具体地,实例对C1和C4、C2和C5、或C3和C6可以同时成立。由于这些实例对将全部被等同地处理,因此无需单独地处理具体的星座图(constellation)。
为了处理这些实例C1至C6中的至少一个,本概念提供分割模式的缩减集合,其可以包括从实际可用的分割模式集合中选择的一个或多个分割模式。
编码器10可以根据所使用的基于块的编码方案来选择该实际可用的分割模式集合。根据示例,编码器10可以被配置为基于以下方式确定用于预定块的可用分割模式集合:
·独立于预定块相对于图片边界的位置,和/或
·取决于预定块所依据的先前树级别的一系列分割模式。
解码器20也是如此。根据示例,解码器20可以被配置为基于以下方式确定用于预定块的可用分割模式集合:
·独立于预定块相对于图片边界的位置,和/或
·取决于预定块所依据的先前树级别的一系列分割模式。
同样,为了处理上述实例C1至C6中的至少一个,本概念提供分割模式的缩减集合,其可以包括从实际可用的分割模式集合中选择的一个或多个分割模式。
例如,缩减分割集合可以包含以下分割:
(a)假设存在这样的分割:不受限制的分割,其在被应用时,将不会对给定块的进一步分割施加任何限制。
(b)对于实例C1和C2,假设存在这样的分割:将创建与图片12的边界平行的边缘的分割。
i.假设存在这样的分割并且对于给定块允许这样的分割:被设置在分割块的中间的分割。
ii.假设存在这样的分割并且对于给定块允许这样的分割:将创建与图片12的边界共位的划分边缘的分割。
换句话说,编码器10可以被配置为:为了将可用分割模式集合缩减为一个或多个分割模式的缩减集合,从可用分割模式集合中选择以下中的至少一项:
·第一分割模式,包括不对在预定树级别之后的后续树级别的一个或多个后续分割施加任何限制的分割(例如,参见上述分割(a)),以及
·第二分割模式,包括沿着与预定块中的边界位置平行的至少一条分割线,将预定块分割为两个或三个子块的分割,并且该分割线至少是以下情况之一:在预定块的内部居中(例如,参见上述分割(b)-i),或与图片12的边界共位(例如,参见上述分割(b)-ii)。
对于解码器20分别也是如此。即,解码器20可以被配置为:为了将可用分割模式集合缩减为一个或多个分割模式的缩减集合,从可用分割模式集合中选择以下中的至少一项:
·第一分割模式,包括不对在预定树级别之后的后续树级别的一个或多个后续分割施加任何限制的分割(例如,参见分割(a)),以及
·第二分割模式,包括沿着与预定块中的边界位置平行的至少一条分割线,将预定块分割为两个或三个子块的分割,并且该分割线至少是以下情况之一:在预定块的内部居中(例如,参见上述分割(b)-i),或与图片12的边界共位(例如,参见上述分割(b)-ii)。
如果在针对指定块的所使用的划分方法中分割(b)-ii不可用,则分割(b)-i可以被包含在缩减分割集合中。分割(b)-i通常优于分割(b)-ii。如上所述,在缩减分割集合中可以包括至少一个分割。
根据示例,分割(a)可以是四叉分割,并且分割(b)-i可以是水平双分割或竖直双分割中的至少一者。根据另一示例,如果图片12的边界位于所划分的块的1/4或3/4中,则可以将[3]和[4]中所述的额外引入的分割之一用于(b)-ii。在特定的实施方式中,具有1/2的分割比的竖直或水平分割与在[3]和/或[4]中引入的额外分割相比,可以是优选的。
在图7A至图7E中示意性地示出了上述分割。图7A示出了四叉分割,其中预定块701(宏块或子块)被分割成四个相等的分区71a、71b、71c、71d。图7B示出了分割比为1/2的的竖直双分割,其中预定块702(宏块或子块)被分割成两个相等的竖直分区72a、72b。图7C示出了分割比为1/2的的水平双分割,其中预定块703(宏块或子块)被分割成两个相等的水平分区73a、73b。图7D示出了如[3]中所述的竖直三叉分割,其中预定块704(宏块或子块)被分割成三个竖直分区74a、74b、74c。图7E示出了如[3]中所述的水平三叉分割,其中预定块705(宏块或子块)被分割成三个水平分区75a、75b、75c。
根据示例,如果图片12的相应边界与相应的预定块702相交,使得图片12的位于相应块702内部的边界也是竖直的,即,平行于竖直分割线,则可以应用图7B所示的竖直双分割。例如,对于图6中所示的块101e,这种情况可能成立。
如果图片12的相应边界与相应的预定块703相交,使得图片12的位于相应块703内部的边界也是水平的,即,平行于水平分割线,则可以应用图7C所示的水平双分割。例如,对于图6中所示的块101m,这种情况可能成立。
根据可以利用广义二叉分割(GBS)的又一示例,分割(a)可以是分割比为1/2的垂直分割(假如分割树到目前为止是不受限制的,其可以是GBS中的默认分割)或者在通用GBS树用作四叉树结构的子树的情况下是四叉分割。竖直和水平分割(可能转换为垂直/平行语义)可以用作分割(b)-i或(b)-ii(可能带有相应适用的分割修饰符)。同样,修饰符为1/2的分割可以是优选的,即使其他分割将提供与图片12的边界共位的分割。
在又一个示例中,该示例可以基于QTBT但是对于[3]和[4]中所述的方案以及提供以下三种分割可能性的任何其他划分方案也可能有效:四叉分割、分割比为1/2的竖直分割和分割比为1/2的水平分割,三个示例性缩减分割集合(RSS)可以是:
RSS1:四叉分割(a)和分割比为1/2的竖直分割(b)-i
RSS2:四叉分割(a)和分割比为1/2的水平分割(b)-i
RSS3:四叉分割(a)或分割比为1/2的垂直分割或水平分割(b)-i。
这些示例性缩减分割模式集合,即RSS1、RSS2和RSS3,可以是可用分割模式集合的子集的一个非限制性示例。即,缩减分割模式集合可以包括在可用分割模式集合中(对于预定树级别下的预定块)可用的一个或多个可用分割。可用分割模式集合中包含的分割的数量可以根据编码方案而变化,而缩减分割模式集合中包含的分割的数量可以根据相应的预定块(即,要在当前树级别下被划分的块)相对于图片12的边界的位置而变化。
如上所述,编码器10可以确定可用分割模式集合。即,编码器10可以选择性地选择哪些分割模式(例如,四叉分割、竖直双分割、水平双分割等)应被包含在可用分割模式集合中。
例如,上述基于块的编码方案可以包括分割模式的原始集合,该原始集合包括四叉分割、至少一个水平双分割(可能具有不同的修饰符)和至少一个竖直双分割(可能具有不同的修饰符)。
但是,某些分割,尤其是某些双分割,可能是限制性的。例如,如果将双分割应用于预定块,则可能不允许将四叉分割作为后续的分割。换句话说,如果先前树级别的先前分割不包含限制性分割中的一种,特别是限制性双分割中的一种,则仅在某个树级别上允许四叉分割。
相应地,如果在预定树级别上将限制性分割中的一种(特别是限制性双分割中的一种)应用于预定块,则后续的分割可以仅包含上述原始集合但是没有四叉分割。
因此,根据实施例,编码器10可以被配置为确定可用分割模式集合为:
·如果预定块所依据的先前树级别的所有分割模式都在限制性双分割集合之外,则可用分割模式集合等于包括四叉分割、至少一个水平双分割和至少一个竖直双分割的原始分割模式集合,以及
·如果预定块所依据的前一树级别的分割模式是限制性双分割集合的一个分割模式,则可用分割模式集合等于从所述原始分割模式集合中减去所述四叉分割得到的集合。
解码器20也是如此。因此,解码器20可以被配置为将可用分割模式集合确定为:
·如果预定块所依据的先前树级别的所有分割模式都在限制性双分割集合之外,则可用分割模式集合等于包括四叉分割、至少一个水平双分割和至少一个竖直双分割的原始分割模式集合,以及
·如果预定块所依据的前一树级别的分割模式是限制性双分割集合的一个分割模式,则可用分割模式集合等于从所述原始分割模式集合中减去所述四叉分割得到的集合。
附加地或替代地,上述原始分割模式集合可以包括至少一个水平三叉分割(可能具有不同的修饰符)和至少一个竖直三叉分割(可能具有不同的修饰符)。
如上所述,编码器10可以缩减可用分割模式集合,以便提供缩减分割模式集合。因此,编码器10可以针对每个预定块从上述可用分割模式集合中选择性地选出分割模式(即,一个或多个分割模式)的缩减的子集。然后,仅这些选择性地选出的分割模式可以被包含在缩减分割模式集合中。因此,缩减分割模式集合可以包括上述根据分割(a)的四叉分割中的至少一种,以及根据分割(b)-i或分割(b)-ii的分割中的一种。
因此,根据实施例,编码器10可以被配置为,为了将可用分割模式集合缩减为一个或多个分割模式的缩减集合,从可用分割模式集合中选择以下中的至少一项:
·四叉分割(a),以及
·双分割,其沿着与预定块702、703中的图片边界的位置平行的分割线,将预定块702、703分割成两个子块72a、72b、73a、73b,并且该分割线至少是以下情况之一:根据分割(b)-i在预定块内部居中,以及根据分割(b)-ii与边界共位。
同样,解码器20也是如此。即,解码器20可以被配置为:为了将可用分割模式集合缩减为一个或多个分割模式的缩减集合,从可用分割模式集合中选择以下中的至少一项:
·四叉分割(a),以及
·双分割,其沿着与预定块702、703中的图片边界的位置平行的分割线,将预定块702、703分割成两个子块72a、72b、73a、73b,并且该分割线至少是以下情况之一:根据分割(b)
-i在预定块内部居中,以及根据分割(b)-ii与边界共位。
同样,分割(b)-i可以包括双分割(可能具有不同的修饰符,但是优选地具有分割比1/2),而分割(b)-ii可以包括双分割和/或三叉分割(可能具有不同的修饰符)。
因此,根据实施例,编码器10可以被配置为,为了将可用分割模式集合缩减为一个或多个分割模式的缩减集合,从可用分割模式集合中选择以下中的至少一项:
·四叉分割(a),以及
·三叉分割,其沿着与预定块704、705中的图片边界的位置平行的分割线,将预定块704、705分割成三个子块74a、74b、74c、75a、75b、75c,并且该分割线根据分割(b)-ii与边界共位。
同样,解码器20也是如此。即,解码器20可以被配置为:为了将可用分割模式集合缩减为一个或多个分割模式的缩减集合,从可用分割模式集合中选择以下中的至少一项:
·四叉分割(a),以及
·三叉分割,其沿着与预定块704、705中的图片边界的位置平行的分割线,将预定块704、705分割成三个子块74a、74b、74c、75a、75b、75c,并且该分割线根据分割(b)-ii与边界共位。
图8A和图8B示出了如何将本文描述的概念与图片边界处理一起应用于基于块的编码方案的示例。
在该示例中,图8A示出了对可以与如图6所示的宏块101o相对应的预定块的划分。块101o的阴影部分表示图片12的右下角的位置。该示例示出了通过仅应用四叉分割来将宏块101o划分为较小的子块。
各个子块中指示的数字可以指示必须应用的四叉分割的数目,以便达到如图8A中所示的宏块101o的叶块划分。第一四叉分割将宏块101o拆分成四个相等的子块801a、801b、801c、801d。可以看出,仅左侧的两个子块801a、801d仍可以包括图片12的边界。右侧的两个子块801b、801c位于图片12的外部,并且不再包括图片12的边界。它们可以被丢弃。
第二四叉分割将左侧的两个子块801a、801d再次拆分为四个较小的子块。可以看出,左侧的两个子块802a、802b(从第二四叉分割导出)位于图片12内部,并且不再包含图片边界。因此,可以根据所使用的划分方法,使用不受限制的分割集合来进一步划分这两个子块802a、802b。在本文中可能不针对本概念进一步详细描述对这些块的进一步划分。
但是,其余的子块(从第二四叉分割导出)必须进行第三次划分,因为它们全部仍可能包含图片边界。所述第三划分产生叶块,其由数字“3”指示。
图8B示出了备选划分,其应用本文描述的缩减分割集合的构思。每个子块中的数字指示必须应用以便达到如图8B所示的宏块101o的叶块分割的四叉分割和非四叉分割(例如,双分割)的数量。第一个数字可以指示四叉分割的数量,第二个数字可以指示非四叉分割的数量。
例如,针对左上侧的叶块802a(1,1),应用一个四叉分割和一个竖直双分割。针对相邻的右侧的叶块802b(1,2),应用一个四叉分割和两个竖直双分割。针对相邻的下侧的叶块802c(2,1),应用两个四叉分割和一个水平双分割。针对图片12的右下角的叶块802d(3,0),应用三个四叉分割而没有应用非四叉分割。
在图8B中,实线指示由四叉分割创建的边缘(分割线),虚线指示由竖直双分割创建的边缘(分割线),并且虚点划线指示由水平双分割创建的边缘(分割线)。
更详细地,作为第一树级别上的第一分割,可以应用四叉分割,其产生四个相等的子块801a、801b、801c、801d。可以看出,仅左侧的两个子块801a、801d仍可以包括图片12的边界。右侧的两个子块801b、801c位于图片12的外部,并且不再包括图片12的边界。它们可以被丢弃。
现在可以在第二树级别上进一步划分左上侧的子块801a。为了子块801a的划分,可以提供缩减分割集合。例如,可以提供包括四叉分割和竖直双分割中的至少一个或仅包括竖直双分割的缩减分割集合。在图8B所示的示例中,子块801a可以在第二树级别上经历修饰符为1/2的竖直双分割,其中,分割线811在块801a的内部居中。因此,结果可以创建左上侧的子块802a。
利用本构思,仅必须应用一个四叉分割和一个竖直双分割(并且因此仅应用两个树级别)就能达到作为叶块的子块802a。相反,在图8A中,需要两个块802a、802b来覆盖图片12的与图8B的仅一个块802a相同的区域。
此外,现在可以在第三树级别上进一步划分图8B中的右侧相邻的块802b。为了子块802b的划分,可以再次提供缩减分割集合。例如,由于先前的分割已经是竖直双分割,使得不允许后续的四叉分割,因此可以提供至少包括竖直双分割的缩减分割集合。在图8B所示的示例中,子块802b可以在第三树级别上经历修饰符为1/2的竖直双分割,其中,分割线812在块802b的内部居中并且与图片边界共位。因此,结果可以在第三树级别上创建左侧的子块803a,其中所述左侧的子块803a是叶块,但是其也可以通过利用所使用的划分方法来进一步划分。
利用本构思,仅必须应用一个四叉分割和两个竖直双分割(并且因此仅应用三个树级别)就能获得作为叶块的子块803a。相反,在图8A中,需要四个块来覆盖图片12的与图8B的仅一个块803a相同的区域。然而,如果编码器10决定这样做,则如果总是从缩减分割集合中选择四叉分割,则也可以应用分割8A。
此外,图8B中的下侧相邻的块802d可以分别从第一树级别和第二树级别上的两个连续的四叉分割导出,并且块802d现在可以在第三树级别进一步被划分。为了子块802d的划分,可以再次提供缩减分割集合。例如,可以提供至少包括四叉分割和水平双分割的缩减分割集合,或者仅包括水平双分割的缩减分割集合。在图8B所示的示例中,子块802d可以在第三树级别上经历修饰符为1/2的水平双分割,其中,分割线813在块802d的内部居中并且与图片边界共位。因此,结果可以在第三树级别上创建子块803b,其中,所述子块803b是叶块。
利用本构思,仅必须应用两个四叉分割和一个水平双分割(并且因此仅应用三个树级)就能达到作为叶块的子块803b。相反,在图8A中,需要两个块来覆盖图片12的与图8B的仅一个块803b相同的区域。
块803c也可以是可以从三个连续的四叉分割导出的叶块。叶块803c的该示例可以与图8A所示的相同块的四叉分割划分相同。该语法仅允许在分割模式的缩减集合中提供四叉分割,因为图片12的拐角被包含在通向叶块803c的块中。
根据示例,编码器10可以被配置为:为了将可用分割模式集合缩减为一个或多个分割模式的缩减集合,仅在预定块超出图片的拐角时才从可用分割模式集合中选择四叉分割。
解码器20也是如此。相应地,解码器20可以被配置为:为了将可用分割模式集合缩减为一个或多个分割模式的缩减集合,仅在预定块超出图片的拐角时才从可用分割模式集合中选择四叉分割。
如图8B所示,所产生的叶块802a、803a、803b、803c表示处理图片12的边界所需的最小划分。附加地或替代地,所产生的叶块802a、803a、803b、803c可以在所使用的划分方法的给定限制内被进一步分割。
通常,假如最终结果至少包含一个有效分割,则缩减分割集合可能会受到进一步的限制。这些限制可能是但不限于:
·针对指定块大小的分割可用性(参见图8B)
·针对指定深度的分割可用性。
通过以下示例并再次参照图5A和5B来简要说明后一种要点“针对指定深度的分割可用性”:
为了确保最佳效率,尽管使用了某些信令来代替纯隐式分割导出,但仅需要用信令通知有限的信息。最值得注意的是,不需要传输有关分割本身的信息。在上面讨论的图片边界情况C1至C3(参见图6)中,将执行分割。如果缩减分割集合集包含多于一个元素,则仅需要用信号通其余的不确定性。在基于上述QTBT的特定实施例中,针对情况C1(请参见图5B)和C2,将需要传输一个二进制信号,并且在情况C3中,将不需要信令,因为C1可能包括包含四叉分割和竖直双分割的缩减分割集合,C2可能包括包含四叉分割和水平双分割的缩减分割集合,并且C3可能包括仅包含四叉分割的缩减分割集合。
在本概念中可以应用其他语法限制。例如,如果分割导致出现额外的限制,则如果分割块与图片边界重叠,则可能会完全或部分丢弃这些限制。根据示例,可以限制随后的二叉分割(binary split)的数量(与四叉分割相对)(例如,如果分割是受限树的一部分,如果分割不是默认分割,或者如果该方法用作四叉树结构的补充)。
如果将二叉分割作为缩减集合的一部分应用于图片边界,则其可能不算在此限制的施加中。
因此,根据示例,如果应用来自缩减集合的双分割并且连续双分割的数量被限制为连续双分割的预定最大数量,则编码器10被配置为:如果在图片边界上应用所述连续双分割,则不对该连续双分割进行计数。
解码器20也是如此。因此,如果应用来自缩减集合的双分割并且连续双分割的数量被限制为连续双分割的预定最大数量,则解码器20被配置为:如果在图片边界上应用所述连续双分割,则不对该连续双分割进行计数。
甚至在图片边界上都可能会进一步施加其他限制(例如,当用作四叉树结构的补充时),例如在不同于四叉分割的任何分割之后禁止四叉分割。
图9示出了根据本构思的对图片12进行编码的方法的框图。
在框901中,使用递归多树划分来将图片划分为叶块。
在框902中,使用图片到叶块的划分,将图片基于块编码在数据流中。
在框903中,针对预定块,根据图片的边界与预定块相交的位置,来缩减用于分割预定块的可用分割模式集合,以获得一个或多个分割模式的缩减结合。
如果缩减集合的基数为1(C=1),则应用缩减集合的分割模式来分割预定块,如框904所示。
如果缩减集合的基数大于一,则选择缩减集合的分割模式中的一个,并且应用分割模式中的所选的一个分割模式来分割预定块,如框905所示。
在框906中,在数据流中用信号通知所述选择,即,来自分割模式的缩减集合中的分割模式中的所选的一个分割模式。
图10示出了根据本构思的对图片12进行解码的方法的框图。
在框1001中,使用递归多树划分来将图片划分为叶块。
在框1002中,使用图片到叶块的划分,从数据流中基于块解码图片。
在框1003中,针对预定块,根据图片的边界与预定块相交的位置,来缩减用于分割预定块的可用分割模式集合,以获得一个或多个分割模式的缩减结合。
如果缩减集合的基数为1(C=1),则应用缩减集合的分割模式来分割预定块,如框1004所示。
如果缩减集合的基数大于一,则选择缩减集合的分割模式中的一个,并且应用分割模式中的所选的一个分割模式来分割预定块,如框1005所示。
如框1006所示,从分割模式的缩减集合中选择分割模式中的一个分割模式是基于数据流中的信号化来进行的。
也可以以与所描绘的顺序不同的顺序来执行分别由图9和图10的框图中的框表示的方法步骤。
尽管已经在装置的上下文中描述了一些方面,但是将清楚的是,这些方面还表示对对应方法的描述,其中,框或设备对应于方法步骤或方法步骤的特征。类似地,在方法步骤的上下文中描述的方面也表示对对应框或项或者对应装置的特征的描述。可以由(或使用)硬件设备(诸如,微处理器、可编程计算机或电子电路)来执行一些或全部方法步骤。在一些实施例中,可以由这种装置来执行最重要方法步骤中的一个或多个方法步骤。
根据某些实现要求,本发明的实施例可以用硬件或软件实现,或者至少部分用硬件实现,或至少部分用软件实现。可以使用其上存储有电子可读控制信号的数字存储介质(例如,软盘、DVD、蓝光、CD、ROM、PROM、EPROM、EEPROM或闪存)来执行实现,该电子可读控制信号与可编程计算机系统协作(或者能够与之协作)从而执行相应方法。因此,数字存储介质可以是计算机可读的。
根据本发明的一些实施例包括具有电子可读控制信号的数据载体,其能够与可编程计算机系统协作以便执行本文所述的方法之一。
通常,本发明的实施例可以实现为具有程序代码的计算机程序产品,程序代码可操作以在计算机程序产品在计算机上运行时执行方法之一。程序代码可以例如存储在机器可读载体上。
其他实施例包括存储在机器可读载体上的计算机程序,该计算机程序用于执行本文所述的方法之一。
换言之,本发明的方法的实施例因此是具有程序代码的计算机程序,该程序代码用于在计算机程序在计算机上运行时执行本文所述的方法之一。
因此,本发明方法的另一实施例是其上记录有计算机程序的数据载体(或者数字存储介质或计算机可读介质),该计算机程序用于执行本文所述的方法之一。数据载体、数字存储介质或记录的介质通常是有形的和/或非暂时性的。
因此,本发明方法的另一实施例是表示计算机程序的数据流或信号序列,所述计算机程序用于执行本文所述的方法之一。数据流或信号序列可以例如被配置为经由数据通信连接(例如,经由互联网)传送。
另外的实施例包括处理装置,例如,计算机或可编程逻辑器件,所述处理装置被配置为或适于执行本文所述的方法之一。
另一实施例包括其上安装有计算机程序的计算机,该计算机程序用于执行本文所述的方法之一。
根据本发明的另一实施例包括被配置为向接收机(例如,以电子方式或以光学方式)传送计算机程序的装置或系统,该计算机程序用于执行本文所述的方法之一。接收器可以是例如计算机、移动设备、存储设备等。装置或系统可以例如包括用于向接收器传送计算机程序的文件服务器。
在一些实施例中,可编程逻辑器件(例如,现场可编程门阵列)可以用于执行本文所述的方法的功能中的一些或全部。在一些实施例中,现场可编程门阵列可以与微处理器协作以执行本文所述的方法之一。通常,方法优选地由任意硬件装置来执行。
本文描述的装置可以使用硬件装置、或者使用计算机、或者使用硬件装置和计算机的组合来实现。
本文描述的方法可以使用硬件装置、或者使用计算机、或者使用硬件装置和计算机的组合来执行。
上述实施例对于本发明的原理仅是说明性的。应当理解的是,本文所述的布置和细节的修改和变形对于本领域其他技术人员将是显而易见的。因此,旨在仅由所附专利权利要求的范围来限制而不是由借助对本文的实施例的描述和解释所给出的具体细节来限制。
参考文献
[1]ITU-T and ISO/IEC.High efficiency video coding.ITU-TRecommendation H.265|ISO/IEC 23008 10(HEVC),edition 1,2013;edition 2,2014.
[2]J.Chen,E.Alshina,G.J.Sullivan,J.-R.Ohm,J.Boyce,AlgorithmDescription of Joint Exploration Test Model 6(JEM 6),JVET,doc.JVET-F1001,April 2017.
[3]X.Li,H.-C.Chuang,J.Chen,M.Karczewicz,L.Zhang,X.Zhao,A.Said,Multi-Type-Tree,JVET,doc.JVET-D0117,Oct.2016.
[4]F.Le Léannec,T.Poirier,F.Urban,Asymmetric Coding Units in QTBT,JVET,doc.JVET-D0064,Oct.2016.
[5]Not yet published European patent application No.17182209.1(尚未公开的欧洲专利申请No.17182209.1)。

Claims (22)

1.一种用于对图片(12)进行编码的装置(10),所述装置被配置为:
使用递归多树划分来将所述图片(12)划分为叶块,
使用所述图片(12)到所述叶块的划分,将所述图片(12)基于块编码在数据流(14)中,
其中,所述装置(10)被配置为在将所述图片(12)划分为所述叶块时,
针对与所述多树划分的预定树级别相对应并且延伸超过所述图片(12)的边界的预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c),根据所述图片(12)的边界与所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)相交的位置,缩减用于分割所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)的可用分割模式集合,以便获得一个或多个分割模式的缩减集合,
其中,如果所述缩减集合的基数为1,则所述装置(10)被配置为应用所述缩减集合的分割模式来分割所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c),以及
如果所述缩减集合的基数大于1,则所述装置(10)被配置为选择所述缩减集合的分割模式中的一个分割模式,并且应用分割模式中的所选的一个分割模式来分割所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c),并在所述数据流(14)中用信号通知所述选择。
2.根据权利要求1所述的装置(10),其中,所述装置(10)被配置为:为了将所述可用分割模式集合缩减为一个或多个分割模式的所述缩减集合,从所述可用分割模式集合中选择以下中的至少一项:
第一分割模式,所述第一分割模式不对在所述预定树级别之后的后续树级别的一个或多个后续分割施加任何限制,以及
第二分割模式,所述第二分割模式沿着与所述预定块(801a)中的图片边界的位置平行的分割线(811)将所述预定块(801a)分割为两个子块(802a、802b),并且所述分割线(811)至少是以下情况之一:与所述图片(12)的边界共位,以及在所述预定块(801a)的内部居中。
3.根据权利要求1所述的装置(10),其中,所述装置(10)被配置为:为了将所述可用分割模式集合缩减为一个或多个分割模式的所述缩减集合,从所述可用分割模式集合中选择:
一个预定分割模式,所述预定分割模式沿着与所述预定块(801a;802d)中的图片边界的位置平行的第一分割线(811;813),将所述预定块(801a;802d)分割成两个子块(802a、802b;803b、803d),所述分割线(811;813)至少是以下情况之一:与所述图片(12)的边界共位,以及在所述预定块(801a)的内部居中。
4.根据权利要求3所述的装置(10),
其中,所述预定分割模式是竖直双分割或水平双分割。
5.根据权利要求1至4中的一项所述的装置(10),其中,所述装置(10)被配置为基于以下方式确定用于所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)的所述可用分割模式集合:
独立于所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)相对于所述图片边界的位置,和/或
取决于所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)所依据的先前树级别的一系列分割模式。
6.根据权利要求1至5中的任一项所述的装置(10),其中,所述装置(10)被配置为确定用于所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)的所述可用分割模式集合为:
如果所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)所依据的先前树级别的所有分割模式都在限制性双分割集合之外,则所述可用分割模式集合等于包括四叉分割、至少一个水平双分割和至少一个竖直双分割的原始分割模式集合,以及
如果所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)所依据的前一树级别的分割模式是限制性双分割集合的一个分割模式,则所述可用分割模式集合等于从所述原始分割模式集合中减去所述四叉分割得到的集合。
7.根据权利要求6所述的装置(10),其中,所述装置(10)被配置为:为了将所述可用分割模式集合缩减为一个或多个分割模式的所述缩减集合,从所述可用分割模式集合中选择以下中的至少一项:
所述四叉分割,以及
双分割,所述双分割沿着与所述预定块(801a;802d)中的所述图片边界的位置平行的分割线(811;813),将所述预定块(801a;802d)分割为两个子块(802a、802b;803b、803d),所述分割线(811;813)至少是以下情况之一:与所述图片边界共位,以及在所述预定块(801a;802d)的内部居中。
8.根据权利要求7所述的装置(10),其中,如果应用来自所述缩减集合的双分割并且连续双分割的数量被限制为连续双分割的预定最大数量,则所述装置(10)被配置为:如果在图片边界上应用连续双分割,则不对所述连续双分割进行计数。
9.根据权利要求6所述的装置(10),其中,所述装置(10)被配置为:为了将所述可用分割模式集合缩减为一个或多个分割模式的所述缩减集合,仅在所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)超出所述图片(12)的拐角时才从所述可用分割模式集合中选择所述四叉分割。
10.一种用于对图片(12)进行解码的装置(20),所述装置被配置为:
使用递归多树划分来将所述图片(12)划分为叶块,
使用所述图片(12)到叶块的划分,从数据流(14)中基于块解码所述图片(12),
其中,所述装置(20)被配置为在将所述图片(12)划分为所述叶块时,
针对与所述多树划分的预定树级别相对应并且延伸超过所述图片(12)的边界的预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c),根据图片边界与所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)相交的位置,缩减用于分割所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)的可用分割模式集合,以获得一个或多个分割模式的缩减集合,其中
如果所述缩减集合的基数为1,则所述装置(20)被配置为应用所述缩减集合的分割模式来分割所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c),以及
如果所述缩减集合的基数大于1,则所述装置(20)被配置为根据所述数据流中的信号化选择所述缩减集合的分割模式中的一个分割模式,并且应用分割模式中的所选的一个分割模式来分割所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)。
11.根据权利要求10所述的装置(20),其中,所述装置(20)被配置为:为了将所述可用分割模式集合缩减为一个或多个分割模式的所述缩减集合,从所述可用分割模式集合中选择以下中的至少一项:
第一分割模式,所述第一分割模式不对在所述预定树级别之后的后续树级别的一个或多个后续分割施加任何限制,以及
第二分割模式,所述第二分割模式沿着与所述预定块(801a)中的图片边界的位置平行的分割线(811)将所述预定块(801a)分割为两个子块(802a、802b),所述分割线(811)至少是以下情况之一:与所述图片边界共位,以及在所述预定块(801a)的内部居中。
12.根据权利要求10所述的装置(20),其中,所述装置(20)被配置为:为了将所述可用分割模式集合缩减为一个或多个分割模式的所述缩减集合,从所述可用分割模式集合中选择:
一个预定分割模式,所述预定分割模式沿着与所述预定块(801a;802d)中的图片边界的位置平行的第一分割线(811;813),将所述预定块(801a;802d)分割成两个子块(802a、802b;803b、803d),并且所述分割线(811;813)至少是以下情况之一:与所述图片(12)的边界共位,以及在所述预定块(801a;802d)的内部居中。
13.根据权利要求12所述的装置(10),
其中,所述预定分割模式是竖直双分割或水平双分割。
14.根据权利要求10至13中的一项所述的装置(20),其中,所述装置(20)被配置为基于以下方式确定用于所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)的所述可用分割模式集合:
独立于所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)相对于所述图片边界的位置,和/或
取决于所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)所依据的先前树级别的一系列分割模式。
15.根据权利要求10至14中的任一项所述的装置(20),其中,所述装置(20)被配置为确定用于所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)的所述可用分割模式集合为:
如果所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)所依据的先前树级别的所有分割模式都在限制性双分割集合之外,则所述可用分割模式集合等于包括四叉分割、至少一个水平双分割和至少一个竖直双分割的原始分割模式集合,以及
如果所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)所依据的前一树级别的分割模式是限制性双分割集合的一个分割模式,则所述可用分割模式集合等于从所述原始分割模式集合中减去所述四叉分割得到的集合。
16.根据权利要求15所述的装置(20),其中,所述装置(20)被配置为:为了将所述可用分割模式集合缩减为一个或多个分割模式的所述缩减集合,从所述可用分割模式集合中选择以下中的至少一项:
所述四叉分割,以及
双分割,所述双分割模式沿着与所述预定块(801a)中的图片边界的位置平行的分割线(811)将所述预定块(801a)分割为两个子块(802a、802b),并且所述分割线(811)至少是以下情况之一:与所述图片边界共位,以及在所述预定块(801a)的内部居中。
17.根据权利要求16所述的装置(20),其中,如果应用来自所述缩减集合的双分割并且连续双分割的数量被限制为连续双分割的预定最大数量,则所述装置(20)被配置为:如果在图片边界上应用连续双分割,则不对所述连续双分割进行计数。
18.根据权利要求15所述的装置(20),其中,所述装置(20)被配置为:为了将所述可用分割模式集合缩减为一个或多个分割模式的所述缩减集合,仅在所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)超出所述图片(12)的拐角时才从所述可用分割模式集合中选择所述四叉分割。
19.一种用于对图片(12)进行编码的方法,所述方法包括以下步骤:
使用递归多树划分来将所述图片(12)划分为叶块,
使用所述图片(12)到所述叶块的划分,将所述图片(12)基于块编码在数据流(14)中,
其中,所述方法还包括以下步骤:在将所述图片(12)划分为所述叶块时,
针对与所述多树划分的预定树级别相对应并且延伸超过所述图片(12)的边界的预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c),根据图片边界与所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)相交的位置,缩减用于分割所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)的可用分割模式集合,以便获得一个或多个分割模式的缩减集合,其中
如果所述缩减集合的基数为1,则所述方法包括以下步骤:应用所述缩减集合的分割模式来分割所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c),以及
如果所述缩减集合的基数大于1,则所述方法包括以下步骤:选择所述缩减集合的分割模式中的一个分割模式,并且应用分割模式中的所选的一个分割模式来分割所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c),并在所述数据流(14)中用信号通知所述选择。
20.一种用于对图片(12)进行解码的方法,所述方法包括以下步骤:
使用递归多树划分来将所述图片(12)划分为叶块,
使用所述图片(12)到叶块的划分,从数据流(14)中基于块解码所述图片(12),
其中,所述方法还包括以下步骤:在将所述图片(12)划分为所述叶块时,
针对与所述多树划分的预定树级别相对应并且延伸超过所述图片(12)的边界的预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c),根据图片边界与所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)相交的位置,缩减用于分割所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)的可用分割模式集合,以便获得一个或多个分割模式的缩减集合,其中
如果所述缩减集合的基数为1,则所述方法包括以下另外的步骤:应用所述缩减集合的分割模式来分割所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c),以及
如果所述缩减集合的基数大于1,则所述方法包括以下另外的步骤:根据所述数据流(14)中的信号化选择所述缩减集合的分割模式中的一个分割模式,并且应用分割模式中的所选的一个分割模式来分割所述预定块(801a、801b、801c、801d、802a、802b、802d、803a、803b、803c)。
21.一种计算机程序,所述计算机程序当在计算机或信号处理器上执行时,用于实现权利要求19或20所述的方法。
22.一种通过权利要求19或20所述的方法获得的数据流。
CN201980036096.8A 2018-03-29 2019-03-21 使用图片边界处理对图片进行编码和解码的装置和方法 Active CN112204968B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18165218.1 2018-03-29
EP18165218 2018-03-29
PCT/EP2019/057170 WO2019185456A1 (en) 2018-03-29 2019-03-21 Apparatus and method for encoding and decoding a picture using picture boundary handling

Publications (2)

Publication Number Publication Date
CN112204968A true CN112204968A (zh) 2021-01-08
CN112204968B CN112204968B (zh) 2024-03-15

Family

ID=61868349

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980036096.8A Active CN112204968B (zh) 2018-03-29 2019-03-21 使用图片边界处理对图片进行编码和解码的装置和方法

Country Status (7)

Country Link
US (3) US11146789B2 (zh)
EP (2) EP3777147B1 (zh)
JP (2) JP7179080B2 (zh)
KR (2) KR102480688B1 (zh)
CN (1) CN112204968B (zh)
TW (2) TWI796638B (zh)
WO (1) WO2019185456A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022218322A1 (en) * 2021-04-13 2022-10-20 Beijing Bytedance Network Technology Co., Ltd. Boundary handling for coding tree split

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11470359B2 (en) * 2018-03-30 2022-10-11 Sharp Kabushiki Kaisha Systems and methods for partitioning video blocks at a boundary of a picture for video coding
WO2019234613A1 (en) * 2018-06-05 2019-12-12 Beijing Bytedance Network Technology Co., Ltd. Partition tree with partition into 3 sub-blocks by horizontal and vertical splits
JP6835177B2 (ja) * 2018-11-30 2021-02-24 株式会社Jvcケンウッド 画像復号化装置、画像復号化方法及び画像復号化プログラム

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003021971A1 (en) * 2001-08-28 2003-03-13 Ntt Docomo, Inc. Moving picture encoding/transmission system, moving picture encoding/transmission method, and encoding apparatus, decoding apparatus, encoding method, decoding method, and program usable for the same
WO2011128269A1 (en) * 2010-04-13 2011-10-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Video coding using multi-tree sub - divisions of images
CN102948149A (zh) * 2010-04-16 2013-02-27 Sk电信有限公司 视频编码/解码设备和方法
US20130136180A1 (en) * 2011-11-29 2013-05-30 Futurewei Technologies, Inc. Unified Partitioning Structures and Signaling Methods for High Efficiency Video Coding
CN103477635A (zh) * 2010-10-08 2013-12-25 弗兰霍菲尔运输应用研究公司 支持块分割及块合并的图像编码技术
US20140140405A1 (en) * 2012-11-16 2014-05-22 Qualcomm Incorporated Device and method for scalable coding of video information
US20160373766A1 (en) * 2015-06-22 2016-12-22 Cisco Technology, Inc. Block-based video coding using a mixture of square and rectangular blocks
WO2017157249A1 (en) * 2016-03-16 2017-09-21 Mediatek Inc. Method and apparatus of video data processing with restricted block size in video coding
US20170347123A1 (en) * 2016-05-25 2017-11-30 Arris Enterprises Llc Jvet coding block structure with asymmetrical partitioning
US20180070110A1 (en) * 2016-09-07 2018-03-08 Qualcomm Incorporated Tree-type coding for video coding
CN107836117A (zh) * 2015-07-15 2018-03-23 联发科技(新加坡)私人有限公司 用于视频和图像编解码的有条件的二叉树块分割结构的方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101452713B1 (ko) * 2009-10-30 2014-10-21 삼성전자주식회사 픽처 경계의 부호화 단위를 부호화, 복호화 하는 방법 및 장치
EP3383043A1 (en) 2017-03-27 2018-10-03 Thomson Licensing Methods and apparatus for picture encoding and decoding
CN116320470A (zh) 2017-10-20 2023-06-23 富士通株式会社 动态图像解码装置、动态图像解码方法和存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003021971A1 (en) * 2001-08-28 2003-03-13 Ntt Docomo, Inc. Moving picture encoding/transmission system, moving picture encoding/transmission method, and encoding apparatus, decoding apparatus, encoding method, decoding method, and program usable for the same
WO2011128269A1 (en) * 2010-04-13 2011-10-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Video coding using multi-tree sub - divisions of images
CN102948149A (zh) * 2010-04-16 2013-02-27 Sk电信有限公司 视频编码/解码设备和方法
CN103477635A (zh) * 2010-10-08 2013-12-25 弗兰霍菲尔运输应用研究公司 支持块分割及块合并的图像编码技术
US20130136180A1 (en) * 2011-11-29 2013-05-30 Futurewei Technologies, Inc. Unified Partitioning Structures and Signaling Methods for High Efficiency Video Coding
US20140140405A1 (en) * 2012-11-16 2014-05-22 Qualcomm Incorporated Device and method for scalable coding of video information
US20160373766A1 (en) * 2015-06-22 2016-12-22 Cisco Technology, Inc. Block-based video coding using a mixture of square and rectangular blocks
CN107836117A (zh) * 2015-07-15 2018-03-23 联发科技(新加坡)私人有限公司 用于视频和图像编解码的有条件的二叉树块分割结构的方法
WO2017157249A1 (en) * 2016-03-16 2017-09-21 Mediatek Inc. Method and apparatus of video data processing with restricted block size in video coding
CN108713320A (zh) * 2016-03-16 2018-10-26 联发科技股份有限公司 视频编码中限制块尺寸的视频数据处理方法与装置
US20170347123A1 (en) * 2016-05-25 2017-11-30 Arris Enterprises Llc Jvet coding block structure with asymmetrical partitioning
US20180070110A1 (en) * 2016-09-07 2018-03-08 Qualcomm Incorporated Tree-type coding for video coding

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022218322A1 (en) * 2021-04-13 2022-10-20 Beijing Bytedance Network Technology Co., Ltd. Boundary handling for coding tree split

Also Published As

Publication number Publication date
US20220078421A1 (en) 2022-03-10
KR20200143694A (ko) 2020-12-24
KR20230003413A (ko) 2023-01-05
US20210014490A1 (en) 2021-01-14
KR102480688B1 (ko) 2022-12-23
TW202131699A (zh) 2021-08-16
JP7179080B2 (ja) 2022-11-28
EP3777147B1 (en) 2023-02-01
US20240064300A1 (en) 2024-02-22
TWI723365B (zh) 2021-04-01
US11146789B2 (en) 2021-10-12
TWI796638B (zh) 2023-03-21
TW201943280A (zh) 2019-11-01
JP2021519547A (ja) 2021-08-10
EP4192010A1 (en) 2023-06-07
CN112204968B (zh) 2024-03-15
WO2019185456A1 (en) 2019-10-03
EP3777147A1 (en) 2021-02-17
JP2023017980A (ja) 2023-02-07
US11843774B2 (en) 2023-12-12

Similar Documents

Publication Publication Date Title
JP6931690B2 (ja) コンテンツをエンコードする方法及び計算装置
JP6856554B2 (ja) ブロック統合およびスキップモードをサポートする画像符号化
CN112204968B (zh) 使用图片边界处理对图片进行编码和解码的装置和方法
CN113395517B (zh) 视频信号编码/解码方法及其设备
CN113507603B (zh) 图像信号编码/解码方法及其设备
CN113225560A (zh) 视频编码/解码方法、视频编码/解码装置和存储介质
WO2019016287A1 (en) APPARATUS AND METHOD FOR ENCODING IMAGES
US20230388496A1 (en) Encoding and decoding a picture
KR20240067981A (ko) 픽쳐 경계 처리를 사용하여 픽쳐를 인코딩하고 디코딩하는 장치 및 방법
JP7436663B2 (ja) サンプルブロックの変換済み表現についてのコーディングコンセプト

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant