CN114073093A - 三角形分割的合并索引的信令通知 - Google Patents
三角形分割的合并索引的信令通知 Download PDFInfo
- Publication number
- CN114073093A CN114073093A CN202080049012.7A CN202080049012A CN114073093A CN 114073093 A CN114073093 A CN 114073093A CN 202080049012 A CN202080049012 A CN 202080049012A CN 114073093 A CN114073093 A CN 114073093A
- Authority
- CN
- China
- Prior art keywords
- merge candidate
- candidate index
- index
- triangle
- merge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000011664 signaling Effects 0.000 title description 74
- 238000000638 solvent extraction Methods 0.000 title description 22
- 238000000034 method Methods 0.000 claims abstract description 129
- 238000013507 mapping Methods 0.000 claims abstract description 42
- 230000008569 process Effects 0.000 abstract description 44
- 238000009795 derivation Methods 0.000 abstract description 36
- 241000023320 Luma <angiosperm> Species 0.000 description 37
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 37
- 239000013598 vector Substances 0.000 description 37
- 238000005192 partition Methods 0.000 description 33
- 230000015654 memory Effects 0.000 description 28
- 230000006870 function Effects 0.000 description 22
- 238000012545 processing Methods 0.000 description 18
- 238000004891 communication Methods 0.000 description 17
- 230000011218 segmentation Effects 0.000 description 12
- 238000012360 testing method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000006835 compression Effects 0.000 description 7
- 238000007906 compression Methods 0.000 description 7
- 238000005457 optimization Methods 0.000 description 6
- 238000013139 quantization Methods 0.000 description 6
- 241000209094 Oryza Species 0.000 description 5
- 235000007164 Oryza sativa Nutrition 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 230000002457 bidirectional effect Effects 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 5
- 235000009566 rice Nutrition 0.000 description 5
- 238000001914 filtration Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000003936 working memory Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
描述了不同的实现方式,特别是提供了视频编码和解码的实现方式。因此,编码或解码包括获得合并候选索引,其能够在基于三角形形状的运动补偿中使用的列表中导出基于三角形形状的运动补偿候选列表中的第一合并候选索引和第二合并候选索引两者。根据特定特征,映射函数确定合并候选索引的可能组合的子集中的两个索引的导出过程。
Description
技术领域
本实施例中的至少一个总体上涉及例如用于视频编码或解码的方法或装置,并且更具体地,涉及一种方法或装置,该方法或装置包括信令通知单个合并候选索引,该单个合并候选索引能够在基于三角形形状的运动补偿中使用的基于三角形形状的运动补偿候选列表中导出第一合并候选索引和第二合并候选索引。
背景技术
一个或多个实现的领域技术领域通常涉及视频压缩。至少一些实施例涉及与诸如HEVC(HEVC是指“ITU的ITU-T H.265电信标准化部门(10/2014),系列H:视听和多媒体系统、视听服务基础设施-运动视频编码、高效视频编码、ITU-T H.265建议”中描述的高效视频编码,也称为H.265和MPEG-H第2部分)的现有视频压缩系统相比,或者与诸如VVC(通用视频编码,联合视频专家团队JVET正在开发的新标准)的开发中的视频压缩系统相比,提高压缩效率。
具体而言,至少一些实施例还涉及通过修改将用于帧间预测的三角形分割模式的信令,在比特率节省或复杂度降低方面提高视频压缩效率。
发明内容
本发明的目的是克服现有技术的至少一个缺点。为此,根据至少一个实施例的一般方面,提出了一种用于解码的方法。该解码方法包括:解码表示基于三角形形状的运动补偿候选列表的合并候选索引的语法元素;以及通过使用由运动补偿候选列表中的第一合并候选索引指示的位置处的合并候选的运动信息和由运动补偿候选列表中的第二合并候选索引指示的位置处的合并候选的运动信息,执行基于三角形形状的运动补偿来解码图片的块。根据特定特征,该方法还包括从所解码的语法元素中导出基于三角形形状的运动补偿候选列表中的第一合并候选索引和第二合并候选索引。因此,该方法限制了信令,并减少了用于信令通知合并候选的2个索引的比特数。
根据至少一个实施例的另一个一般方面,提出了一种用于编码的方法。该编码方法包括:通过使用由运动补偿候选列表中的第一合并候选索引指示的位置处的合并候选的运动信息和由运动补偿候选列表中的第二合并候选索引指示的位置处的合并候选的运动信息,执行基于三角形形状的运动补偿来编码图片的块。根据特定特征,确定合并候选索引,其中合并候选索引能够导出基于三角形形状的运动补偿候选列表中的第一合并候选索引和第二合并候选索引,因此该编码方法还包括编码表示基于三角形形状的运动补偿候选列表的合并候选索引的语法元素。因此,该方法限制了信令,并减少了测试组合的数量,从而降低了编码器的复杂度。
根据至少一个实施例的另一个一般方面,映射函数确定从合并候选索引导出第一合并候选索引和第二合并候选索引。
根据至少一个实施例的另一个一般方面,合并候选索引是基于三角形形状的运动补偿候选列表中的第一合并候选索引;并且第二合并候选索引是从第一合并候选索引导出的。因此,映射函数确定以下之一:在第一合并候选索引等于0的情况下,将第二合并候选索引设置为1,否则将第二合并候选索引设置为0;或者在第一合并候选索引等于0的情况下,将第二合并候选索引设置为1,否则将第二合并候选索引设置为第一合并候选索引的一半。
根据至少一个实施例的另一个一般方面,语法元素指示合并候选索引是第一合并候选索引还是第二合并候选索引;并且在语法元素指示合并候选索引是第一合并候选索引的情况下,从第一合并候选索引导出第二合并候选索引,或者在语法元素指示合并候选索引是第二合并候选索引的情况下,从第二合并候选索引导出第一合并候选索引。因此,在语法元素指示合并候选索引是第一合并候选索引的情况下,映射函数确定以下之一:在第一合并候选索引等于0的情况下,将第二合并候选索引设置为1,否则将第二合并候选索引设置为0;在第一合并候选索引等于0的情况下,将第二合并候选索引设置为1,否则将第二合并候选索引设置为第一合并候选索引的一半。
根据至少一个实施例的另一个一般方面,合并候选索引的范围大于基于三角形形状的运动补偿候选列表的范围,并且小于基于三角形形状的运动补偿候选列表的范围的两倍。因此,映射函数确定以下之一:在合并候选索引等于0的情况下,将第一合并候选索引设置为0,并将第二合并候选索引设置为1;在合并候选索引大于0并且小于基于三角形形状的运动补偿候选列表的范围的情况下,将第一合并候选索引设置为合并候选索引,并将第二合并候选索引设置为0;否则,将第一合并候选索引设置为合并候选索引减去基于三角形形状的运动补偿候选列表的范围,并将第二合并候选索引设置为第一合并候选索引加上偏移。
根据至少一个实施例的另一个一般方面,基于三角形形状的运动补偿候选列表的合并候选索引进一步指示以下之一:对角线边界的划分方向或倾斜边界的角度和距离。
根据至少一个实施例的另一个一般方面,提出了一种用于编码的设备,包括用于实现编码方法的任何一个实施例的部件。
根据至少一个实施例的另一个一般方面,提供了一种用于解码的设备,包括用于实现解码方法的任何一个实施例的部件。
根据至少一个实施例的另一个一般方面,提供了一种用于编码的装置,包括一个或多个处理器和至少一个存储器。一个或多个处理器被配置为实现编码方法的任何一个实施例。
根据至少一个实施例的另一个一般方面,提供了一种用于解码的装置,包括一个或多个处理器和至少一个存储器。一个或多个处理器被配置为实现解码方法的任何一个实施例。
根据至少一个实施例的另一个一般方面,提供了一种非暂时性计算机可读介质,包含根据任何前述描述的方法或装置生成的数据内容。
根据至少一个实施例的另一个一般方面,提供了一种信号,包括根据任何前述描述的方法或装置生成的视频数据。
本实施例中的一个或多个还提供了一种计算机可读存储介质,其上存储有根据上述任何方法对视频数据进行编码或解码的指令。本实施例还提供了一种计算机可读存储介质,其上存储有根据上述方法生成的比特流。本实施例还提供了一种用于发送根据上述方法生成的比特流的方法和装置。本实施例还提供了一种计算机程序产品,包括用于执行所描述的任何方法的指令。
附图说明
图1示出了表示压缩的HEVC图片的编码树单元(CTU)和编码树(CT)概念的示例。
图2示出了将编码树单元划分为编码单元、预测单元和变换单元的示例。
图3a示出了用于帧间预测的编码单元的三角形分割的示例。
图3b示出了用于帧间预测的编码单元的几何分割的示例。
图4示出了为帧间预测中使用的三角形分割模式选择单向预测运动矢量的示例。
图5示出了根据至少一个实施例的一般方面的解码方法的示例。
图6示出了根据至少一个实施例的一般方面的编码方法的示例。
图7示出了其中可以实现实施例的各个方面的视频编码器的实施例的框图。
图8示出了其中可以实现实施例的各个方面的视频编码器的实施例的框图。
图9示出了其中可以实现实施例的各个方面的示例装置的框图。
具体实施方式
应当理解,附图和描述已经被简化以示出与清楚理解本原理相关的元件,同时为了清楚起见,消除了在典型编码和/或解码设备中发现的许多其他元件。应当理解,尽管术语第一和第二在本文中可以用来描述各种元件,但是这些元件不应该受到这些术语的限制。这些术语仅用于区分一个元件和另一个元件。
各种实施例是相对于图片的编码/解码来描述的。它们可以被应用于编码/解码图片的部分,诸如条带或片,或者整个图片序列。此外,针对块的解码(例如,编码单元CU)描述了各种实施例,并且这些实施例容易导出到块的编码。
上文描述了各种方法,并且每种方法包括用于实现所述方法的一个或多个步骤或动作。除非该方法的正确操作需要步骤或动作的特定顺序,否则可以修改或组合特定步骤和/或动作的顺序和/或使用。
在HEVC视频压缩标准中,图片被划分为所谓的编码树单元(CTU),其大小通常为64x64、128x128或256x256像素。图1示出了表示压缩的HEVC图片的编码树单元(CTU)和编码树(CT)概念的示例。每个CTU由压缩的域中的编码树表示。这是CTU的四叉树划分,其中每个叶子被称为编码单元(CU),如图1所示。然后给每个单元一些帧内或帧间预测参数(预测信息)。为此,它在空间上被分割成一个或多个预测单元(PU),每个PU被分配一些预测信息。如图2所示,帧内或帧间编码模式在CU级被分配。在HEVC中,每个PU只分配一个运动矢量。该运动矢量用于所考虑的PU的运动补偿时间预测。因此,在HEVC中,链接预测块和其参考块的运动模型仅包含平移。
VVC的最新发展中的三角形分割信令的限制
在VVC,帧间预测支持几何分割模式(GPM)。几何分割模式允许在CU中处理倾斜的运动边界。几何分割是三角形分割模式(TPM)的扩展,其中两个分割之间的倾斜边界的角度和位置是可配置的。几何分割模式仅适用于8x8或更大的CU。几何分割模式是在CU级导出的,作为(包括常规合并模式、MMVD模式、子块合并模式和CIIP模式的)其他合并模式之后的剩余合并模式。在下文中,为了使读者更好地理解,本原理针对三角形分割模式进行描述,然而,对于提出相同技术问题(诸如几何分割模式)的类似分割模式,将明确地导出出至少一个实施例。
图3a示出了用于帧间预测的编码单元的三角形分割模式的示例。当使用三角形分割模式时,使用如图3a所示的对角线划分或反对角线划分,将CU均匀地划分成两个三角形形状的分割(分割1、分割2)。CU中的每个三角形分割都使用其自身的运动进行帧间预测的;对于每个分割仅允许单向预测,也就是说,每个分割具有一个运动矢量和一个参考索引。应用单向预测运动约束以确保与传统双向预测相同,每个CU仅需要两个运动补偿预测。使用下面描述的过程导出每个分割的单向预测运动。
如果三角形分割模式用于当前CU,则如下所述,进一步信令通知指示三角形分割方向(对角线或反对角线)的标志和两个合并索引(每个分割一个)。在条带级明确信令通知最大TPM候选的数量,并指定TMP合并索引的语法二进制化。在预测每个三角形分割之后,使用具有自适应权重的混合处理来调整沿着对角线或反对角线的样点值。这是整个CU的预测信号,然后变换和量化过程将像在其他预测模式中一样应用于整个CU。最后,使用三角形分割模式预测的CU的运动场以4x4单元存储。
图3b示出了用于帧间预测的编码单元的几何分割模式的示例。当使用几何分割模式时,沿着倾斜边界将CU均匀地划分成两个分割(分割1,分割2)。其中一个分割(分割2)是三角形分割。倾斜边界的角度(angle)和位置(d)是可配置的。
图4示出了为帧间预测中使用的三角形分割模式选择单向预测运动矢量的示例。对于VVC中的几何分割,以相同的方式执行2个单向预测运动矢量的选择。单向预测候选列表从根据扩展合并预测过程构建的合并候选列表中直接导出。将n表示为三角形单向预测候选列表中的单向预测运动的索引。X等于n的奇偶性的第n个扩展合并候选的LX运动矢量被用作三角形分割模式的第n个单向预测运动矢量。这些运动矢量在图4中用“x”标记。在第n个扩展合并候选的对应的LX运动矢量不存在的情况下,相同候选的L(1-X)运动矢量被代替用作三角形分割模式的单向预测运动矢量。
最多有5个单向预测候选,并且编码器必须在2个划分方向上测试所有候选组合(每个分割一个)。因此,测试组合的最大数量为40(5*4*2),其中将三角形合并候选的最大数量设置为5并且测试所有组合(其中MaxNumTriangleMergeCand=5,并且nb_combinations=MaxNumTriangleMergeCand*(MaxNumTriangleMergeCand-1)*2)。
关于信令并且如上所述,三角形分割模式需要信令通知(i)指示三角形分割方向的二进制标志,以及(ii)在导出是否使用三角形分割模式之后的两个合并索引。
下面是VVC规范版本中涉及三角形分割信令的部分(粗体)。有利的是,用于合并三角形模式的亮度运动矢量的当前导出过程允许通过不对不应该发生的n等于m的情况进行编码来节省比特。
7.3.7.7合并数据语法
7.4.8.7合并数据语义
…
变量MergeTriangleFlag[x0][y0],指定当解码B条带时是否使用基于三角形形状的运动补偿来生成当前编码单元的预测样点。导出如下:
–如果以下所有条件都为真,则mergeriagleflag[x0][y0]设置为等于1:
–sps_triangle_enabled_flag等于1。
–slice_type等于B。
–general_merge_flag[x0][y0]等于1。
–MaxNumTriangleMergeCand大于或等于2。
–cbwidth*cbHeight大于或等于64。
–regular_merge_flag[x0][y0]等于0。
–mmvd_merge_flag[x0][y0]等于0。
–merge_subblock_flag[x0][y0]等于0。
–ciip_flag[x0][y0]等于0。
–否则,MergeTriangleFlag[x0][y0]设置为等于0。
merge_triangle_split_dir[x0][y0]指定合并三角形模式的划分方向。阵列索引x0、y0指定所考虑的编码块的左上角亮度样点相对于图片的左上角亮度样点的位置(x0,y0)。
当merge_triangle_split_dir[x0][y0]不存在时,推断其等于0。
merge_triangle_idx0[x0][y0]指定基于三角形形状的运动补偿候选列表的第一合并候选索引,其中x0,y0指定所考虑的编码块的左上角亮度样点相对于图片的左上角亮度样点的位置(x0,y0)。
当merge_triangle_idx0[x0][y0]不存在时,推断其等于0。
merge_triangle_idx1[x0][y0]指定基于三角形形状的运动补偿候选列表的第二合并候选索引,其中x0,y0指定所考虑的编码块的左上角亮度样点相对于图片的左上角亮度样点的位置(x0,y0)。
当merge_triangle_idx1[x0][y0]不存在时,推断其等于0。
…
8.5.4.2合并三角形模式的亮度运动矢量的导出过程
…
运动矢量mvA和mvB、参考索引refIdxA和refIdxB以及预测列表标志predListFlagA和predListFlagB通过以下有序步骤导出:
1.使用亮度位置(xCb,yCb)、变量cbWidth和cbHeight输入调用8.5.2.2条款中指定的合并模式的亮度运动矢量的导出过程,并且输出为亮度运动矢量mvL0[0][0]、mvL1[0][0]、参考索引refIdxL0、refIdxL1、预测列表利用标志preflagL0[0][0]和preflagL1[0][0]、双向预测权重索引bcwIdx和合并候选列表mergeCandList。
2.变量m和n分别是三角形分割0和1的合并索引,使用merge_triangle_idx0[xCb][yCb]和merge_triangle_idx1[xCb][yCb]导出变量m和n,如下所示:
m=merge_triangle_idx0[xCb][yCb] (8-447)
n=merge_triangle_idx1[xCb][yCb]+(merge_triangle_idx1[xCb][yCb]>=m)?1:0 (8-448)
3…
表9-11 –语法元素和相关联的二进制化(其中FL:固定长度编码,TR:截断莱斯编码,…)
表9-17–将ctxInc分配给带有上下文编码的二进制数的语法元素(其中bypass代表无上下文和等概率)
期望使用三角形分割模式来简化当前包含在每个CU的标志(merge_triangle_split_dir[][])后跟两个索引(merge_triangle_idx0[][],merge_triangle_idx1[][])中的三角形分割模式信令。尽管在VVC中,几何分割模式信令适于指示倾斜边界的角度和距离,但是合并候选的两个索引的信令保持与针对三角形分割模式呈现的信令相同。实际上,语法元素merge_gpm_partition_idx[x0][y0]替换了二进制语法元素merge_triangle_split_dir[x0][y0]。语法元素merge_gpm_partition_idx[x0][y0]指示几何分割模式的角度和位置。然后,合并的候选索引(除了它们的名称)保持相同。因此,合并索引的简化对于VVC和将以帧间合并模式实现这种类型的分割的任何标准来说也是期望的。
至少一个主要实施例涉及用于信令通知用于帧间预测的三角形分割的方法。至少一个实施例还涉及一种用于对视频进行编码/解码的方法,该方法包括根据所公开的方法中的任何一种来信令通知用于帧间预测的三角形分割。至少一个实施例涉及一种方法,包括获得表示基于三角形形状的运动补偿候选列表的合并候选索引的语法元素;从所解码的语法元素中导出基于三角形形状的运动补偿候选列表中的第一合并候选索引和第二合并候选索引;以及使用由运动补偿候选列表中的第一合并候选索引指示的位置处的合并候选的运动信息和由运动补偿候选列表中的第二合并候选索引指示的位置处的合并候选的运动信息来执行基于三角形形状的运动补偿。在本申请中,术语“基于三角形形状的运动补偿”是指沿着正方形或矩形块形状的倾斜边界的运动补偿。因此,术语“基于三角形形状的运动补偿”和“基于几何形状的运动补偿”可以互换使用。
至少一个实施例包括从一个索引中导出另一个索引。有利的是,至少一个实施例限制了信令,并减少了测试组合的数量,从而降低了编码器的复杂度。在第一变型中,索引之一(例如merge_triangle_idx1[][])没有被信令通知,并且这个索引(例如merge_triangle_idx1[][])是从信令通知的索引(例如merge_triangle_idx0[][])中导出的。在第二变型中,索引之一(例如merge_triangle_idx1[][])没有被信令通知,指示哪个索引被发送的标志(例如0指示merge_triangle_idx0[][]被发送,并且1表示merge_triangle_idx1[][]被发送)被信令通知,没有信令通知的索引也从信令通知(发送)的索引中导出。在第三变型中,至少一个实施例包括扩展信令通知的索引以支持更多的候选组合。在第四变型中,至少一个实施例包括用表示划分方向和三角形合并候选索引的一个单索引替换所有信令。
在以下部分中,描述了根据不同实施例的使用帧间预测中使用的三角形分割模式进行解码的方法的实施例。还描述了编码方法的对应实施例。
执行基于三角形形状的运动补偿的解码或编码方法的至少一个主要实施例。
在下文中,三角形CU的两个单向预测候选,每个三角形分割一个,分别表示为Cand0和Cand1。
这些单向预测候选中的每一个Candx对应于merge_triangle_idxx,表示为idxx,并且与运动矢量mvx及其在参考图片列表Ly上的索引refidxx的参考帧相关联(其中y由索引idxx的奇偶性给出)。
图5示出了根据至少一个实施例的一般方面的解码方法的示例。在下文中,针对解码方法描述了用于信令通知/导出基于三角形形状的运动补偿候选列表的合并候选索引的不同实施例,但是本领域技术人员将容易地针对编码方法导出本原理。因此,用于(例如,使用TPM的编码单元CU)解码图片中的块的方法10包括,在步骤11中,解码表示基于三角形形状的运动补偿候选列表的合并候选索引的语法元素。然后,在步骤12中,从所解码的语法元素中导出基于三角形形状的运动补偿候选列表中的第一合并候选索引idx0和第二合并候选索引idx1。实际上,映射函数允许从合并候选索引中导出第一合并候选索引和第二合并候选索引。在下文中,描述了映射函数的各种非限制性示例以及不同的变型。有利的是,合并三角形候选索引的导出过程允许通过不对不应该发生的两个索引相等的情况进行编码来节省比特,否则对于分割是不合理的。然后,在步骤13中,通过使用由运动补偿候选列表Ly中的第一合并候选索引idx0指示的位置处的合并候选Cand0的运动信息和由运动补偿候选列表Ly中的第二合并候选索引idx1指示的位置处的合并候选Cand1的运动信息,执行基于三角形形状的运动补偿来解码样点块。
图6示出了根据至少一个实施例的一般方面的编码方法的示例。用于(例如,使用TPM的编码单元CU)对图片中的样点块进行编码的方法20包括,在步骤21中,确定基于三角形形状的运动补偿候选列表的合并候选索引,其中合并候选索引能够导出基于三角形形状的运动补偿候选列表中的第一合并候选索引和第二合并候选索引。实际上,如上所述,解码器和编码器共有的映射函数允许从合并候选索引中导出第一合并候选索引和第二合并候选索引。有利的是,合并三角形候选索引的导出过程允许通过不对两个索引相等的情况进行编码来节省比特。此外,导出过程有利地允许在编码时减少合并候选的测试组合的数量,从而降低编码器的复杂度。本领域技术人员将理解,在编码过程期间,映射函数允许的合并候选Cand0和Cand1的可能组合都被测试。这里,与完全搜索相比,用本原理仅测试候选对的子集。这对于几何分割更加有效,其中多于2个(对角线或反对角线)分割方案是可能的。简而言之,使用来自合并索引的合并候选的可能组合之一的基于三角形形状的运动补偿被确定为编码过程期间样点块的编码模式。然后,在步骤22中,通过使用在由运动补偿候选列表Ly中的第一合并候选索引idx0指示的位置处的合并候选Cand0的运动信息和在由运动补偿候选列表Ly中的第二合并候选索引idx1指示的位置处的合并候选Cand1的运动信息,执行基于三角形形状的运动补偿,对样点块进行编码。最后,在步骤23中,还为解码器编码表示基于三角形形状的运动补偿候选列表的合并候选索引的语法元素。
在下文中,描述了用于导出两个合并候选索引的映射函数的非限制性示例。
第一变型:移除一个信令通知的索引,并从一个索引中导出另一个索引
用于信令通知用于帧间预测的三角形分割的方法的至少一个主要实施例包括信令通知单向预测候选列表中的单向预测候选的第一索引(例如merge_triangle_idx0[][]),以及从信令通知的第一索引导出单向预测候选的第二索引(例如merge_triangle_idx1[][])。因此,第二索引是从用信令通知的第一索引隐式解码(或导出)的。从另一个单向预测候选索引导出单向预测候选索引之一与第一索引和第二索引之间的任何预定义映射方案兼容,并且不限于下文描述的示例。
因此,为了减少三角形合并模式的信令,可以通过从另一个idx1-x导出索引idxx之一来移除一个索引的信令。在这种情况下,两个索引中只有一个必须被信令通知。
在下文中,用信令通知的idx0从idx0导出idx1的两个非限制性示例,但是本领域技术人员将会清楚地应用所描述的任何方法来用信令通知的idx1从idx1导出idx0。
表3示出了用于从idx0导出idx1的idx0和idx1之间的映射的两个非限制性示例。
从idx0导出idx1的过程的第一个示例由表4中的X表示:
(i)如果idx0是0,则idx1被设置为1,
(ii)如果idx0大于0,则idx1被设置为0。
这个映射是由映射函数:n=(m>0)?0:1编码的,其中变量m=idx0和n=idx1分别是三角形分割0和1的合并索引。
从idx0导出idx1的过程的第二个示例由表4中的O表示:
(i)idx1设置为idx0的一半,其中idx0≠idx1(即:0->1,1->0,2->1,3->1,4->2)。
表4 idx0和idx1之间的映射(X:导出的第一个示例,O:导出到一半的第二个示例)
将值关联到除了idx0的相同值之外的依赖于idx0的idx1的任何其他映射都与本原理兼容。
此外,通过从一个单索引中导出另一个单索引idxx,它减少了编码器处的测试组合的最大数量。它从40个组合(如上文限制部分所述的5*4*2)变为只有10个组合(5*2=MaxNumTriangleMergeCand*2),从而在速率失真优化循环的迭代次数方面降低了编码器的复杂度。
在变型中,映射是规范的,并且被解码器所知。根据其他变型,映射被信令通知给解码器。因此,在变型中,在条带/片标头中信令通知映射表/函数,条带/片标头指示条带/片中的所有亮度CU都使用这种TPM导出方法。在另一变型中,在图片参数集(PPS)中信令通知映射表/函数,图片参数集(PPS)指示在帧中的所有亮度CU都使用这种TPM导出方法。在另一变型中,在序列参数集(SPS)中信令通知映射表/函数,序列参数集(SPS)指示序列中的所有亮度CU都使用该TPM导出方法。
下面给出了修改VVC规范的一个示例(其中删除线表示移除,并且下划线表示添加),其中涉及到三角形分割信令(用粗体突出显示),例如对于第一个映射示例(n=(m>0)?0:1):
7.3.7.7合并数据语法
7.4.8.7合并数据语义
…
merge_triangle_split_dir[x0][y0]指定合并三角形模式的划分方向。阵列索引x0、y0指定所考虑的编码块的左上角亮度样点相对于图片的左上角亮度样点的位置(x0,y0)。
当merge_triangle_split_dir[x0][y0]不存在时,推断其等于0。
merge_triangle_idx0[x0][y0]指定基于三角形形状的运动补偿候选列表的第一合并候选索引,其中x0,y0指定所考虑的编码块的左上角亮度样点相对于图片的左上角亮度样点的位置(x0,y0)。
当merge_triangle_idx0[x0][y0]不存在时,推断其等于0。
…
8.5.4.2合并三角形模式的亮度运动矢量的导出过程
…
运动矢量mvA和mvB、参考索引refIdxA和refIdxB以及预测列表标志predListFlagA和predListFlagB通过以下有序步骤导出:
1.使用亮度位置(xCb,yCb)、变量cbWidth和cbHeight输入调用8.5.2.2条款中指定的合并模式的亮度运动矢量的导出过程,并且输出为亮度运动矢量mvL0[0][0]、mvL1[0][0]、参考索引refIdxL0、refIdxL1、预测列表利用标志preflagL0[0][0]和preflagL1[0][0]、双向预测权重索引bcwIdx和合并候选列表mergeCandList。
m=merge_triangle_idx0[xCb][yCb] (8-447)
n=(m>0)?0:1 (8-448)
3…
表9 11–语法元素和相关联的二进制化(其中FL:固定长度编码,TR:截断莱斯编码,…)
表9-17–将ctxInc分配给带有上下文编码的二进制数的语法元素(其中bypass代表无上下文和等概率)
第二变型:用指示信令通知的索引的标志替换一个信令通知的索引,并从一个索
引中导出另一个索引
用于信令通知用于帧间预测的三角形分割的方法的至少一个主要实施例包括信令通知指示哪个索引被信令通知的标志(例如,merge_triangle_idx_num0指示merge_triangle_idx0[][]被信令通知,并且1指示merge_triangle_idx1[][]被信令通知),信令通知单向预测候选列表中的单向预测候选的第一索引(merge_triangle_idx[][]),以及从信令通知的第一索引(idxx)导出单向预测候选的第二索引(idx1-x)。至于第一变型,第二索引(idx1-x)是从信令通知的第一索引(idxx)隐式解码(或导出)的,但是这第二变型进一步允许增加候选对的数量。从一个单向预测候选索引中导出另一个单向预测候选索引与两个索引之间的任何预定义映射方案兼容,并且不限于下文用表6和7描述的示例。
由于合并候选索引是在CU级被信令通知,所以添加的标志也应该在CU级被信令通知。然而,根据进一步的非限制性示例,对于整个条带/图片,在(作为条带级或图片级的,…)较高级信令通知标志。
因此,为了减少三角形合并模式的信令,可以用指示哪个索引idxx被信令通知的标志替代一个索引的信令,从而定义另一个索引idx1-x的导出过程。在这种情况下,只需信令通知两个索引中的一个和一个标志。
表示为merge_triangle_idx_num的信令通知的标志指示以下信令通知的索引idxx的编号(x)。如果信令通知idx0,那idx1必须从idx0导出,否则这是idx0必须从idx1导出。这个标志可以是基于上下文的,也可以绕过CABAC编码。
表6示出了idxx和idx1-x之间的映射的非限制性示例,该映射用于从idxx导出idx1-x,其中表6中的X表示merge_triangle_idx_num为0的情况,并且O表示merge_triangle_idx_num为1的情况。
(i)如果merge_triangle_idx_num为0(即idx0被信令通知)
a.如果idx0为0,则idx1设置为1,
b.并且如果idx0大于0,则idx1设置为0。
(ii)如果merge_triangle_idx_num为1(即idx1被信令通知)
a.idx0设置为0,并且idx1设置为idx1+2。
表7idx0和idx1之间的映射(X:idx1来自信令通知的idx0,O:idx0来自信令通知的idx1)
在本示例中,无论是idx0还是idx1被信令通知,都应用相同的导出过程。在这种情况下,由于两个索引对是公共的((0,1)和(1,0)),当idx1被信令通知时,它必然大于1。因此,可以信令通知idx1–2来代替idx1。
如前所述,将值关联到除了idxx的相同值之外的依赖于idxx的idx1-x的任何其他映射都与本原理兼容。根据另一个非限制性示例,导出过程是idxx的一半(0->1,1->0,2->1,3->1,4->2),如前面针对第一变型所述。
表7示出了映射的另一个非限制性示例,该映射对于两种x情况将值关联到除了idxx的相同值之外的依赖于idxx的idx1-x。如果映射有几个共同的索引对,则可以信令通知idx1-nb_common_pairs来代替idx1(如表6所示,其中对(0,1)和(1,0)是共同的,并从idx1的信令中移除)。
表8 idx0和idx1之间的另一个映射(X:idx1来自信令通知的idx0,O:idx0来自信令通知的idx1)
此外,通过从一个idxx导出另一个索引idx1-x,它减少了编码器处的测试组合的最大数量。在本示例中,它从40个组合(5*4*2,如上文限制部分所述)降低到只有16个((5+3)*2),并且在没有公共对的映射的情况下,最多只有20个((5+5)*2=2*MaxNumTriangleMergeCand*2)(如表8所示)。无论如何,它将测试组合的数量减少到不到一半,从而降低了编码器的复杂度。
下面给出了涉及三角形分割信令的VVC规范的一个修改示例(粗体不变)(删除线表示移除,并且下划线表示添加),用于表6所示的变量映射:
7.3.7.7合并数据语法
7.4.8.7合并数据语义
…
merge_triangle_split_dir[x0][y0]指定合并三角形模式的划分方向。阵列索引x0、y0指定所考虑的编码块的左上角亮度样点相对于图片的左上角亮度样点的位置(x0,y0)。
当merge_triangle_split_dir[x0][y0]不存在时,推断其等于0。
merge_triangle_idx_num[x0][y0]指定要解码哪个merge_triangle_idx。阵列索
引x0、y0指定所考虑的编码块的左上角亮度样点相对于图片的左上角亮度样点的位置(x0,
y0)。
当merge_triangle_idx_num[x0][y0]不存在时,推断其等于0。
merge_triangle_idx[x0][y0]指定基于三角形形状的运动补偿候选列表的第
(merge_triangle_idx_num+1)个合并候选索引,其中x0,y0指定所考虑的编码块的左上角
亮度样点相对于图片的左上角亮度样点的位置(x0,y0)。
当merge_triangle_idx[x0][y0]不存在时,推断其等于0。
…
8.5.4.2合并三角形模式的亮度运动矢量的导出过程
…
运动矢量mvA和mvB、参考索引refIdxA和refIdxB以及预测列表标志predListFlagA和predListFlagB通过以下有序步骤导出:
1.使用亮度位置(xCb,yCb)、变量cbWidth和cbHeight输入调用8.5.2.2条款中指定的合并模式的亮度运动矢量的导出过程,并且输出为亮度运动矢量mvL0[0][0]、mvL1[0][0]、参考索引refIdxL0、refIdxL1、预测列表利用标志preflagL0[0][0]和preflagL1[0][0]、双向预测权重索引bcwIdx和合并候选列表mergeCandList。
2.变量m和n分别是三角形分割0和1的合并索引,使用merge_triangle_idx_num [xCb][yCb]和merge_triangle_idx[xCb][yCb]
-如果(merge_triangle_idx_num[xCb][yCb]==1)
则m=0
(8-447)
n=merge_triangle_idx[xCb][yCb]+2(=nb_common_pairs,其依赖于映射)
(8-448)
-否则
m=merge_triangle_idx[xCb][yCb] (8-449)
n=(m>0)?0:1 (8-450)
3…
表9 11–语法元素和相关联的二进制化(其中FL:固定长度编码,TR:截断莱斯编码,…)
表9 17–将ctxInc分配给带有上下文编码的二进制数的语法元素(其中bypass代表无上下文和等概率)
第三变型:增加索引动态
在第三变型中,至少一个实施例包括扩展信令通知的索引。因此,用于信令通知用于帧间预测的三角形分割的方法的至少一个主要实施例包括信令通知单向预测候选列表中的扩展索引,以及从信令通知的扩展索引导出单向预测候选的第一索引和第二索引。根据一个特定特征,动态的扩展是基于MaxNumTriangleMergeCand的。根据另一个特定特征,动态的扩展在[0到(MaxNumTriangleMergeCand*(MaxNumTriangleMergeCand–1))-MaxNumTriangleMergeCand]的范围内。
在第一变型和第二变型两者的实施例中,移除了许多测试的组合。为了保留它们中的一些,同时仍然移除一个信令通知的索引,扩展信令通知的索引的动态是有利的。
以下非限制性示例示出了与第一变型相组合的索引动态扩展,但是所有描述的扩展也可以应用于第二变型。换句话说,合并候选索引的范围大于基于三角形形状的运动补偿候选列表的范围,并且小于基于三角形形状的运动补偿候选列表的范围的两倍。
如表11所述,索引动态的一个示例扩展可以是idx0扩展了MaxNumTriangleMergeCand-2(这里5-2=3)的大小:
(i)如果idx0是0,则idx1被设置为1(如在第一变型中),
(ii)如果idx0大于0且小于5,则idx1被设置为0(如在第一变型中),
(iii)如果idx0大于4,则idx0设置为idx0-5,并且idx1设置为idx0+2(添加了扩展索引)。
表11 idx0和idx1之间的映射(X:信令通知的idx0,O:平移的扩展idx0)
同样,如前所述,扩展索引的其他几个导出过程是可能的,因为任何其他映射将idx0关联到有效值并将idx1关联到除了idx0的相同值之外的依赖于idx0的值。
扩展大小可以是0(相当于第一个变量)到15之间的(包括0和15的)任何值,达到测试组合的最大数量(=(5*4)-5=(MaxNumTriangleMergeCand*(MaxNumTriangleMergeCand–1))-MaxNumTriangleMergeCand)。此外,这个扩展大小必须依赖于Candx(MaxNumTriangleMergeCand)的最大数量,才能灵活地使用这个信令通知的最大值。
与第一变型(公共部分不存在)相比,下面给出了涉及三角形分割信令的VVC规范的修订示例(粗体不变)(删除线表示移除,并且下划线表示添加):
8.5.4.2合并三角形模式的亮度运动矢量的导出过程
…
运动矢量mvA和mvB、参考索引refIdxA和refIdxB以及预测列表标志predListFlagA和predListFlagB通过以下有序步骤导出:
1.使用亮度位置(xCb,yCb)、变量cbWidth和cbHeight输入调用8.5.2.2条款中指定的合并模式的亮度运动矢量的导出过程,并且输出为亮度运动矢量mvL0[0][0]、mvL1[0][0]、参考索引refIdxL0、refIdxL1、预测列表利用标志preflagL0[0][0]和preflagL1[0][0]、双向预测权重索引bcwIdx和合并候选列表mergeCandList。
m=merge_triangle_idx0[xCb][yCb]-(merge_triangle_idx0[xCb][yCb]>=
MaxNumTriangleMergeCand)?MaxNumTriangleMergeCand:0 (8-447)n=(merge_
triangle_idx0[xCb][yCb]>=MaxNumTriangleMergeCand)?m+2:(m>0)?0:1 (8-448)
3…
表9 11–语法元素和相关联的二进制化(其中FL:固定长度编码,TR:截断莱斯编码,…)
表9-17–将ctxInc分配给带有上下文编码的二进制数的语法元素(其中bypass代表无上下文和等概率)
第四变型:增加索引动态
在第四变型中,至少一个实施例包括用表示划分方向和三角形合并候选索引的一个单索引替换所有信令。因此,用于信令通知用于帧间预测的三角形分割的方法的至少一个主要实施例包括信令通知表示三角形划分方向的广义索引、来自单向预测候选列表的单向预测候选的第一索引和第二索引。
在第四变型实施例中,使用映射到划分方向和合并索引的组合的信令通知的索引,将先前的第三变型实施例推广到索引和划分方向的任何组合。表14描述了映射的示例。
表14:映射信令通知的索引和三角形组合
同样,如前所述,对于将信令通知的索引映射到idx0、idx1和划分方向,其他几种导出过程也是可能的。
本领域的技术人员将清楚地导出GPM的这种变型,其中表中的索引已经被用于信令通知倾斜边界的角度和距离两者。扩展表可以进一步定义合并候选索引。
与第一变型(删除线表示移除,并且下划线表示添加)相比,下面给出了涉及三角形分割信令的VVC规范的修改示例(粗体):
7.3.7.7合并数据语法
7.4.8.7合并数据语义
…
merge_triangle_idx[x0][y0]指定基于三角形形状的运动补偿候选列表的合并
候选索引和划分方向的组合,其中x0,y0指定所考虑的编码块的左上角亮度样点相对于图
片的左上角亮度样点的位置(x0,y0)。
当merge_triangle_idx0[x0][y0]不存在时,推断其等于0。
…
8.5.4.2合并三角形模式的亮度运动矢量的导出过程
…
运动矢量mvA和mvB、参考索引refIdxA和refIdxB以及预测列表标志predListFlagA和predListFlagB通过以下有序步骤导出:
1.使用亮度位置(xCb,yCb)、变量cbWidth和cbHeight输入调用8.5.2.2条款中指定的合并模式的亮度运动矢量的导出过程,并且输出为亮度运动矢量mvL0[0][0]、mvL1[0][0]、参考索引refIdxL0、refIdxL1、预测列表利用标志preflagL0[0][0]和preflagL1[0][0]、双向预测权重索引bcwIdx和合并候选列表mergeCandList。
merge_triangle_split_dir=signaled_merge_triangle_split_dir[merge_
triangle_idx[xCb][yCb]] (8-447)
m=merge_triangle_idx0[merge_triangle_idx[xCb][yCb]] (8-448)
n=merge_triangle_idx1[merge_triangle_idx[xCb][yCb]] (8-449)
3…
表9-11–语法元素和相关联的二进制化(其中FL:固定长度编码,TR:截断莱斯编码,…)
表9-17–将ctxInc分配给带有上下文编码的二进制数的语法元素(其中bypass代表无上下文和等概率)
附加实施例和信息
本申请描述了各个方面,包括工具、特征、实施例、模型、方法等。这些方面中的许多方面被具体地描述,并且至少为了显示个体特征,通常以听起来可能是限制性的方式来描述。然而,这是为了描述清楚的目的,并不限制那些方面的应用或范围。事实上,所有不同的方面可以被组合和互换以提供进一步的方面。此外,这些方面也可以与较早的申请中描述的方面组合和互换。
本申请中描述和预期的方面可以以许多不同的形式实现。下面的图7、图8和图9提供了一些实施例,但是可以预期其他实施例,并且图7、图8和图9的讨论并不限制实现方式的广度。这些方面中的至少一个通常涉及视频编码和解码,并且至少一个其他方面通常涉及发送生成或编码的比特流。这些和其他方面可以实现为方法、装置、其上存储有根据所描述的任何方法对数据进行编码或解码的指令的计算机可读存储介质、和/或其上存储有根据所描述的任何方法生成的比特流的计算机可读存储介质。
在本申请中,术语“重建的”和“解码的”可以互换使用,术语“像素”和“样点”可以互换使用,术语“图像”、“图片”和“帧”可以互换使用。
本文描述了各种方法,并且每种方法包括用于实现所描述的方法的一个或多个步骤或动作。除非该方法的正确操作需要步骤或动作的特定顺序,否则可以修改或组合特定步骤和/或动作的顺序和/或使用。
本申请中描述的各种方法和其他方面可以用于修改模块,例如,如图7和图8所示的视频编码器100和解码器200的运动补偿模块(170,275)。此外,本方面不限于VVC或HEVC,并且可以应用于例如其他标准和建议,无论是现有的还是未来开发的,以及(包括VVC和HEVC的)任何这样的标准和建议的扩展。除非另有说明,或者技术上排除,本申请中描述的方面可以单独使用或者组合使用。
在本申请中使用了各种数值,例如,三角形分割模式候选的最大数量。特定值用于示例目的并且所描述的方面不限于这些特定值。
图7示出了编码器100。预期了该编码器100的变型,但是为了清楚的目的,在下面描述编码器100,而不描述所有预期的变型。
在被编码之前,视频序列可以经历预编码处理(101),例如,对输入彩色图片应用颜色变换(例如,从RGB 4:4:4到YCbCr 4:2:0的转换),或者执行输入图片分量的重新映射,以便获得对压缩更有弹性的信号分布(例如,使用颜色分量之一的直方图均衡化)。元数据可以与预处理相关联,并附加到比特流。
在编码器100中,图片由编码器元件编码,如下所述。要编码的图片被分割(102)并以例如CU为单元进行处理。使用例如帧内或帧间模式对每个单元进行编码。当单元以帧内模式被编码时,它执行帧内预测(160)。在帧间模式中,执行运动估计(175)和补偿(170)。编码器决定(105)帧内模式或帧间模式中的哪一个用于编码该单元,并通过例如预测模式标志来指示帧内/帧间决定。例如,通过从原始图像块中减去(110)预测块来计算预测残差。
预测残差然后被变换(125)和量化(130)。量化的变换系数以及运动矢量和其他语法元素被熵编码(145)以输出比特流。编码器可以跳过变换并直接对未变换的残差信号应用量化。编码器可以绕过变换和量化两者,即直接编码残差,而不应用变换或量化过程。
编码器对编码块进行解码,来为进一步的预测提供参考。量化的变换系数被去量化(140)和逆变换(150)以解码预测残差。组合(155)解码的预测残差和预测块,重建图像块。环路滤波器(165)被应用于重建的图片,以执行例如去块/采样自适应偏移(SAO)滤波来减少编码伪像。滤波后的图片存储在参考图片缓冲器(180)中。
图8示出了视频解码器200的框图。在解码器200中,比特流由如下所述的解码器元件解码。视频解码器200通常执行与图7中描述的编码轮次相反的解码轮次。编码器100通常还执行视频解码作为编码视频数据的部分。
特别地,解码器的输入包括视频比特流,该比特流可以由视频编码器100生成。比特流首先被熵解码(230)以获得变换系数、运动矢量和其他编码信息。图片分割信息指示图片是如何被分割的。因此,解码器可以根据解码的图像分割信息来划分(235)图像。变换系数被去量化(240)和逆变换(250)以解码预测残差。组合(255)解码的预测残差和预测块,重建图像块。预测块可以从帧内预测(260)或运动补偿预测(即,帧间预测)(275)中获得(270)。将环路滤波器(265)应用于重建的图像。过滤后的图像存储在参考图片缓冲器(280)中。
解码的图片可以进一步经历解码后处理(285),例如逆颜色变换(例如,从YCbCr4:2:0到RGB 4:4:4的转换)或者执行在预编码处理(101)中执行的重新映射的逆过程的逆重新映射。后解码处理可以使用在预编码处理中导出并在比特流中信令通知的元数据。
图9示出了其中实现了各个方面和实施例的系统的示例的框图。系统1000可以体现为包括以下描述的各种组件的设备,并且被配置为执行本文档中描述的各方面中的一个或多个。这种设备的示例包括但不限于各种电子设备,诸如个人计算机、膝上型计算机、智能手机、平板计算机、数字多媒体机顶盒、数字电视接收机、个人视频记录系统、连接的家用电器和服务器。系统1000的元件可以单独或组合体现在单个集成电路(IC)、多个IC和/或分立组件中。例如,在至少一个实施例中,系统1000的处理和编码器/解码器元件分布在多个IC和/或分立组件上。在各种实施例中,系统1000经由例如通信总线或通过专用输入和/或输出端口来通信耦合到一个或多个其他系统或其他电子设备。在各种实施例中,系统1000被配置成实现本文档中描述的各方面中的一个或多个。
系统1000包括至少一个处理器1010,处理器1010被配置为执行加载在其中的指令,该指令用于实现例如本文档中描述的各个方面。处理器1010可以包括嵌入式存储器、输入输出接口和本领域已知的各种其他电路。系统1000包括至少一个存储器1020(例如,易失性存储器设备和/或非易失性存储器设备)。系统1000包括存储设备1040,其可以包括非易失性存储器和/或易失性存储器,包括但不限于电可擦除可编程只读存储器(EEPROM)、只读存储器(ROM)、可编程只读存储器(PROM)、随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、磁盘驱动器和/或光盘驱动器。作为非限制性示例,存储设备1040可以包括内部存储设备、(包括可拆卸和不可拆卸存储设备的)附加存储设备和/或网络可访问存储设备。
系统1000包括编码器/解码器模块1030,其被配置为例如处理数据以提供编码的视频和/或解码的视频,并且编码器/解码器模块1030可以包括其自己的处理器和存储器。编码器/解码器模块1030表示可以被包括在设备中以执行编码和/或解码功能的(多个)模块。众所周知,设备可以包括编码和解码模块中的一者或两者。此外,编码器/解码器模块1030可以被实现为系统1000的单独的元件,或者可以作为本领域技术人员已知的硬件和软件的组合并入处理器1010内。
要加载到处理器1010或编码器/解码器1030上以执行本文档中描述的各个方面的程序代码可以存储在存储设备1040中,并且随后加载到存储器1020上以供处理器1010进行。根据各种实施例,处理器1010、存储器1020、存储设备1040和编码器/解码器模块1030中的一个或多个可以在执行本文档中描述的过程期间存储各种项目中的一个或多个。这种存储的项目可以包括但不限于输入视频、解码视频或解码视频的部分、比特流、矩阵、变量以及来自等式、公式、操作和操作逻辑的处理的中间或最终结果。
在一些实施例中,处理器1010和/或编码器/解码器模块1030内部的存储器用于存储指令,并为编码或解码期间所需的处理提供工作存储器。然而,在其他实施例中,处理设备外部的存储器(例如,处理设备可以是处理器1010或编码器/解码器模块1030)用于这些功能中的一个或多个。外部存储器可以是存储器1020和/或存储设备1040,例如动态易失性存储器和/或非易失性闪存。在几个实施例中,外部非易失性闪速存储器用于存储例如电视的操作系统。在至少一个实施例中,诸如RAM的快速外部动态易失性存储器被用作视频编码和解码操作的工作存储器,诸如,用于MPEG-2(MPEG指的是运动图片专家组,MPEG-2也称为ISO/IEC 13818,并且13818-1也称为H.222,并且13818-2也称为H.262)、HEVC(HEVC指的是高效视频编码,也称为H.265和MPEG-H第2部分)、或VVC(通用视频编码,联合视频专家团队JVET正在开发的新标准)。
系统1000的元件的输入可以通过各种输入设备来提供,如块1130所示。这种输入设备包括但不限于以下内容:(i)接收例如由广播公司通过空中发送的射频信号(RF)的RF部分,(ii)组件(COMP)输入终端(或COMP输入终端的集合),(iii)通用串行总线(USB)输入终端,和/或(iv)高清晰度多媒体接口(HDMI)输入终端。图9中未示出的其他示例包括合成视频。
在各种实施例中,块1130的输入设备具有本领域已知的相关联的相应输入处理元件。例如,RF部分可以与适于以下内容的元件相关联:(i)选择期望的频率(也称为选择信号,或者将信号频带限制到频带),(ii)下变频所选择信号,(iii)再次频带限制到较窄的频带,以选择(例如)在某些实施例中可以称为信道的信号频带,(iv)解调下变频和频带限制的信号,(v)执行纠错,以及(vi)解复用以选择期望的数据分组流。各种实施例的RF部分包括执行这些功能的一个或多个元件,例如频率选择器、信号选择器、频带限制器、信道选择器、滤波器、下变频器、解调器、纠错器和解复用器。RF部分可以包括执行(包括例如将接收到的信号下变频到较低频率(例如,中频或近基带频率)或基带的)各种这些功能的调谐器。在一个机顶盒实施例中,RF部分及其相关联的输入处理元件接收通过有线(例如,电缆)介质发送的RF信号,并通过滤波、下变频和再次滤波到期望的频带来执行频率选择。各种实施例重新布置上述(和其他)元件的顺序,移除这些元件中的一些,和/或添加执行相似或不同功能的其他元件。添加元件可以包括在现有元件之间插入元件,例如插入放大器和模数转换器。在各种实施例中,RF部分包括天线。
此外,USB和/或HDMI终端可以包括相应的接口处理器,用于通过USB和/或HDMI连接将系统1000连接到其他电子设备。应当理解,输入处理(例如里德-所罗门纠错)的各个方面可以根据需要在例如单独的输入处理IC或处理器1010内实现。类似地,USB或HDMI接口处理的各方面可以根据需要在单独的接口IC内或处理器1010内实现。解调、纠错和解复用的流被提供给各种处理元件,包括例如处理器1010和编码器/解码器1030,处理器1010和编码器/解码器1030与存储器和存储元件组合操作,以根据需要处理数据流,以呈现在输出设备上。
系统1000的各个元件可以设置在集成外壳内。在集成外壳内,各种元件可以使用合适的连接布置1140(例如本领域已知的(包括IC间(I2C)总线、布线和印刷电路板的)内部总线)互连并在其间传输数据。
系统1000包括能够经由通信信道1060与其他设备通信的通信接口1050。通信接口1050可以包括但不限于被配置为通过通信信道1060发送和接收数据的收发器。通信接口1050可以包括但不限于调制解调器或网卡,并且通信信道1060可以例如在有线和/或无线介质中实现。
在各种实施例中,使用诸如Wi-Fi网络的无线网络(例如IEEE 802.11(IEEE指电气和电子工程师协会)),将数据流式传输或以其他方式提供给系统1000。这些实施例的Wi-Fi信号是通过适于Wi-Fi通信的通信信道1060和通信接口1050接收的。这些实施例的通信信道1060典型地连接到接入点或路由器,该接入点或路由器提供对包括互联网的外部网络的访问,以允许流应用和其他超顶(over the top)通信。其他实施例使用通过输入块1130的HDMI连接递送数据的机顶盒向系统1000提供流式数据。还有其他实施例使用输入块1130的RF连接向系统1000提供流式数据。如上所述,各种实施例以非流式方式提供数据。此外,各种实施例使用无线网络而不是Wi-Fi网络,例如蜂窝网络或蓝牙网络。
系统1000可以向(包括显示器1100、扬声器1110和其他外围设备1120的)各种输出设备提供输出信号。各种实施例的显示器1100包括例如触摸屏显示器、有机发光二极管(OLED)显示器、弯曲显示器和/或可折叠显示器中的一个或多个。显示器1100可以用于电视机、平板电脑、膝上型电脑、手机(移动电话)或其他设备。显示器1100也可以与其他组件集成(例如,如在智能电话中),或者分开(例如,用于膝上型电脑的外部监视器)。在实施例的各种示例中,其他外围设备1120包括独立数字视频盘(或数字多功能盘)(对两个术语来说都是DVR)、磁盘播放器、立体声系统和/或照明系统中的一个或多个。各种实施例使用一个或多个外围设备1120,外围设备1120基于系统1000的输出提供功能。例如,磁盘播放器执行播放系统1000的输出的功能。
在各种实施例中,使用诸如AV的信令在系统1000和显示器1100、扬声器1110或其他外围设备1120之间通信控制信号。链路、消费电子控制(CEC)或其他通信协议,可在用户干预或不干预的情况下实现设备到设备控制。输出设备可以通过相应的接口1070、1080和1090经由专用连接通信地耦合到系统1000。替代地,输出设备可以使用通信信道1060经由通信接口1050连接到系统1000。显示器1100和扬声器1110可以与电子设备(诸如例如电视机)中的系统1000的其他组件集成在单个单元中。在各种实施例中,显示接口1070包括显示驱动器,诸如例如时序控制器(T Con)芯片。
例如,如果输入1130的RF部分是单独的机顶盒的部分,则显示器1100和扬声器1110可替代地与其他组件中的一个或多个分开。在显示器1100和扬声器1110是外部组件的各种实施例中,输出信号可以经由(包括例如HDMI端口、USB端口或COMP输出的)专用输出连接来提供。
实施例可以通过处理器1010实现的计算机软件、或者通过硬件、或者通过硬件和软件的组合来执行。作为非限制性示例,实施例可以由一个或多个集成电路来实现。作为非限制性示例,存储器1020可以是适合于技术环境的任何类型,并且可以使用任何适当的数据存储技术(诸如光存储器设备、磁存储器设备、基于半导体的存储器设备、固定存储器和可移动存储器)来实现。作为非限制性示例,处理器1010可以是适合于技术环境的任何类型,并且可以涵盖微处理器、通用计算机、专用计算机和基于多核架构的处理器中的一个或多个。
各种实现方式涉及解码。本申请中使用的“解码”可以涵盖例如对接收的编码序列执行的全部或部分处理,以便产生适合显示的最终输出。在各种实施例中,这些过程包括通常由解码器执行的一个或多个过程,例如熵解码、逆量化、逆变换和差分解码。在各种实施例中,这样的过程也或者替代地包括由本申请中描述的各种实现方式的解码器执行的过程,例如,使用三角形分割模式的运动补偿预测,其中从信令通知的语法元素中导出基于三角形形状的运动补偿候选列表中的至少一个合并候选索引。
作为进一步的示例,在一个实施例中,“解码”仅指熵解码,在另一个实施例中,“解码”仅指差分解码,并且在另一个实施例中,“解码”指熵解码和差分解码的组合。基于具体描述的上下文,短语“解码过程”是旨在具体指操作的子集还是通常指更广泛的解码过程将是清楚的,并且被认为是本领域技术人员很好理解的
各种实现方式涉及编码。以类似于上面关于“解码”的讨论的方式,本申请中使用的“编码”可以涵盖例如对输入视频序列进行的全部或部分处理,以便产生编码的比特流。在各种实施例中,这些过程包括通常由编码器执行的一个或多个过程,例如,分割、差分编码、变换、量化和熵编码。在各种实施例中,这样的过程也或者替代地包括由本申请中描述的各种实现方式的编码器执行的过程,例如,使用三角形分割模式的运动补偿预测,其中从信令通知的语法元素中导出基于三角形形状的运动补偿候选列表中的至少一个合并候选索引。
作为进一步的示例,在一个实施例中,“编码”仅指熵编码,在另一个实施例中,“编码”仅指差分编码,并且在另一个实施例中,“编码”指差分编码和熵编码的组合。基于具体描述的上下文,短语“编码过程”是旨在具体指操作的子集还是通常指更广泛的编码过程将是清楚的,并且被认为是本领域技术人员很好理解的。
注意,本文使用的语法元素(例如,merge_triangle_idx_num[x0][y0],merge_triangle_idx[x0][y0])是描述性术语。因此,它们不排除使用其他语法元素名称。
当附图呈现为流程图时,应当理解,它还提供了对应装置的框图。类似地,当附图呈现为框图时,应当理解,它还提供了对应的方法/过程的流程图。
各种实施例涉及速率失真优化。特别是,在编码过程期间,通常会考虑速率和失真之间的平衡或权衡,通常会受到计算复杂度的限制。速率失真优化通常被表述为最小化速率失真函数,它是速率和失真的加权和。有不同的方法来解决速率失真优化问题。例如,这些方法可以基于对(包括所有考虑的模式或编码参数值的)所有编码选项的广泛测试以及对它们的编码成本和编码和解码后重建的信号的相关失真的完整评估。还可以使用更快的方法来节省编码复杂度,特别是基于预测或预测残差信号而不是重建的信号来计算近似失真。也可以混合使用这两种方法,例如只对一些可能的编码选项使用近似失真,而对其他编码选项使用完全失真。其他方法只评估可能的编码选项的子集。有利地,覆盖基于三角形形状的运动补偿候选列表的可能对的子集的所公开的信令提供了这种更快的方法。更一般地,许多方法采用多种技术中的任何一种来进行优化,但是优化不一定是对编码成本和相关失真两者的完整评估。
本文描述的实现方式和方面可以在例如方法或过程、装置、软件程序、数据流或信号中实现。即使仅在单一实现方式的形式的上下文中讨论(例如,仅作为方法讨论),所讨论的特征的实现方式也可以以其他形式(例如,装置或程序)实现。装置可以在例如适当的硬件、软件和固件中实现。这些方法可以在例如处理器中实现,处理器通常指(包括例如计算机、微处理器、集成电路或可编程逻辑设备的)处理设备。处理器还包括通信设备,诸如例如计算机、蜂窝电话、便携式/个人数字助理(“PDA”)以及促进终端用户之间信息通信的其他设备。
对“一个实施例”或“实施例”或“一个实现方式”或“实现方式”,以及其其他变型的引用,意味着结合该实施例描述的特定特征、结构、特性等被包括在至少一个实施例中。因此,短语“在一个实施例中”或“在实施例中”或“在一个实现方式中”或“在实现方式中”的出现,以及出现在本申请各处的任何其他变型,不一定都指同一实施例。
此外,本申请可以指“确定”各种信息片段。确定信息可以包括例如估计信息、计算信息、预测信息或从存储器中检索信息中的一个或多个。
此外,本申请可以指“访问”各种信息片段。访问信息可以包括例如接收信息、(例如,从存储器)检索信息、存储信息、移动信息、复制信息、计算信息、确定信息、预测信息或估计信息中的一个或多个。
此外,本申请可以指“接收”各种信息片段。接收与“访问”一样,是一个广义的术语。接收信息可以包括例如访问信息或(例如,从存储器)检索信息中的一个或多个。此外,在诸如例如存储信息、处理信息、发送信息、移动信息、复制信息、擦除信息、计算信息、确定信息、预测信息或估计信息的操作期间,通常以一种或另一种方式涉及“接收”。
应当理解,使用以下“/”、“和/或”和“……中的至少一个”中的任何一个,例如,在“A/B”、“A和/或B”和“A和B中的至少一个”的情况下,旨在涵盖仅选择第一个列出的选项(A),或仅选择第二个列出的选项(B),或选择两个选项(A和B)。作为另一个示例,在“A、B和/或C”和“A、B和C中的至少一个”的情况下,这样的措辞旨在涵盖仅选择第一个列出的选项(A),或仅选择第二个列出的选项(B),或仅选择第三个列出的选项(C),或仅选择第一个和第二个列出的选项(A和B),或仅选择第一和第三个列出的选项(A和C),或仅选择第二和第三个列出的选项(B和C),或选择所有三个选项(A和B和C)。正如本领域和相关领域的普通技术人员清楚的那样,这可以扩展到与列出的一样多的项目。
此外,如本文所使用的,单词“信令通知”尤其是指向对应的解码器指示某物。例如,在某些实施例中,编码器信令通知多个映射函数中的特定一个,用于导出基于三角形形状的运动补偿候选列表中的至少一个合并候选索引。这样,在一个实施例中,在编码器侧和解码器侧两者都使用相同的参数。因此,例如,编码器可以向解码器发送(显式信令通知)特定参数,使得解码器可以使用相同的特定参数。相反,如果解码器已经具有特定参数以及其他参数,则可以使用信令通知而不发送(隐式信令通知)来简单地允许解码器知道并选择特定参数。通过避免任何实际功能的传输,在各种实施例中实现了比特节省。应当理解,信令通知可以以多种方式完成。例如,在各种实施例中,一个或多个语法元素、标志等用于向对应的解码器信令通知信息。虽然前面提到了单词“信令通知”的动词形式,但是在这里也可以使用单词“信号”作为名词。
对于本领域普通技术人员来说显而易见的是,实现方式可以产生各种信号,这些信号被格式化以携带例如可以被存储或传输的信息。该信息可以包括例如用于进行方法的指令,或者由所描述的实现方式之一产生的数据。例如,信号可以被格式化以携带描述的实施例的比特流。这种信号可以例如被格式化为电磁波(例如,使用频谱的射频部分)或格式化为基带信号。格式化可以包括,例如,编码数据流和用编码的数据流调制载波。信号携带的信息可以是例如模拟或数字信息。众所周知,信号可以通过各种不同的有线或无线链路来发送。该信号可以存储在处理器可读介质上。
我们描述了多个实施例。这些实施例的特征可以单独或以跨越各种权利要求类别和类型的任何组合提供。此外,实施例可以包括单独或以跨越各种权利要求类别和类型的任何组合的以下特征、设备或方面中的一个或多个:
·修改应用于解码器和/或编码器中的帧间预测过程的三角形分割的信令。
·根据任何公开的方法,对视频进行编码/解码包括用于帧间预测的三角形分割的信令。
·在信令中插入表示基于三角形形状的运动补偿候选列表中的索引的语法元素。
·从表示基于三角形形状的运动补偿候选列表中的索引的信令通知的语法元素中导出基于三角形形状的运动补偿候选列表中的至少一个合并候选索引。
·在信令中插入表示单向预测候选列表中的单向预测候选的第一索引的语法元素,并从第一索引导出单向预测候选的第二索引。
·在信令中插入指示哪个索引被信令通知的标志和表示单向预测候选列表中的单向预测候选的第一索引的语法元素,并从第一索引导出单向预测候选的第二索引。
·在信令中插入表示单向预测候选列表中的单向预测候选的扩展索引的语法元素,并从第一索引导出单向预测候选的第二索引。
·在信令中插入表示对划分方向进行编码的广义索引的语法元素、来自单向预测候选列表的单向预测候选的第一索引和第二索引。
·在信令中插入使解码器能够识别要使用的三角形分割(TPM)导出过程的语法元素。
·用于导出包含n=(m>0)?0:1的三角形分割的映射函数,其中n是导出的索引,并且m是信令通知的索引。
·应用映射函数导出基于三角形形状的运动补偿候选,用于解码器处的帧间预测。
·包括一个或多个所述语法元素或其变型的比特流或信令。
·包括传达根据所描述的任何实施例生成的信息的语法的比特流或信令。
·在信令中插入使解码器能够以与编码器使用的方式相对应的方式执行基于三角形形状的运动补偿的语法元素。
·在条带/片标头中的信令中插入语法元素,该语法元素使解码器能够以与编码器使用的方式相对应的方式使用TPM导出,该条带/片标头指示条带/片中的所有亮度CU都使用该TPM导出方法。
·在图像参数集(PPS)中的信令中插入语法元素,该语法元素使解码器能够以与编码器使用的方式相对应的方式使用TPM导出,该图像参数集(PPS)指示帧中的所有亮度CU都使用该TPM导出方法。
·在序列参数集(SPS)中的信令中插入语法元素,该语法元素使解码器能够以与编码器使用的方式相对应的方式使用TPM导出,该序列参数集(SPS)指示序列中的所有亮度CU都使用该TPM导出方法。
·创建和/或发送和/或接收和/或解码包括一个或多个所述语法元素或其变型的比特流或信令。
·根据所描述的任何实施例创建和/或发送和/或接收和/或解码。
·根据所描述的任何实施例的方法、过程、装置、存储指令的介质、存储数据或信令的介质。
·电视、机顶盒、手机、平板电脑或根据所描述的任何实施例执行TPM导出的其他电子设备。
·电视、机顶盒、手机、平板电脑或根据所描述的任何实施例执行TPM导出并显示(例如,使用监视器、屏幕或其他类型的显示器)所得图像的其他电子设备。
·电视、机顶盒、手机、平板电脑或(例如使用调谐器)选择信道来接收包括编码的图像的信令并根据所描述的任何实施例执行TPM导出参数的其他电子设备。
·电视、机顶盒、手机、平板电脑或通过空中(例如,使用天线)接收包括编码的图像的信令并根据所描述的任何实施例执行TPM导出的其他电子设备。
Claims (14)
1.一种用于解码的方法,包括:
解码(11)表示基于三角形形状的运动补偿候选列表的合并候选索引的语法元素;
从所解码的语法元素中导出(12)所述基于三角形形状的运动补偿候选列表中的第一合并候选索引和第二合并候选索引;以及
通过使用由所述运动补偿候选列表中的所述第一合并候选索引指示的位置处的合并候选的运动信息和由所述运动补偿候选列表中的所述第二合并候选索引指示的位置处的合并候选的运动信息,执行基于三角形形状的运动补偿,来解码(13)图片的块。
2.一种用于解码的装置,包括一个或多个处理器,其中所述一个或多个处理器被配置为:
解码表示基于三角形形状的运动补偿候选列表的合并候选索引的语法元素;
从所解码的语法元素中导出所述基于三角形形状的运动补偿候选列表中的第一合并候选索引和第二合并候选索引;以及
通过使用由所述运动补偿候选列表中的所述第一合并候选索引指示的位置处的合并候选的运动信息和由所述运动补偿候选列表中的所述第二合并候选索引指示的位置处的合并候选的运动信息,执行基于三角形形状的运动补偿,来解码图片的块。
3.一种用于编码的方法,包括:
确定(21)基于三角形形状的运动补偿候选列表的合并候选索引,其中所述合并候选索引能够导出所述基于三角形形状的运动补偿候选列表中的第一合并候选索引和第二合并候选索引;
通过使用由所述运动补偿候选列表中的所述第一合并候选索引指示的位置处的合并候选的运动信息和由所述运动补偿候选列表中的所述第二合并候选索引指示的位置处的合并候选的运动信息,执行基于三角形形状的运动补偿,来编码(22)图片的块;以及
编码(23)表示基于三角形形状的运动补偿候选列表的所述合并候选索引的语法元素。
4.一种用于编码的装置,包括一个或多个处理器,其中所述一个或多个处理器被配置为:
确定基于三角形形状的运动补偿候选列表的合并候选索引,其中所述合并候选索引能够导出所述基于三角形形状的运动补偿候选列表中的第一合并候选索引和第二合并候选索引;
通过使用由所述运动补偿候选列表中的所述第一合并候选索引指示的位置处的合并候选的运动信息和由所述运动补偿候选列表中的所述第二合并候选索引指示的位置处的合并候选的运动信息,执行基于三角形形状的运动补偿,来编码图片的块;以及
编码表示基于三角形形状的运动补偿候选列表的所述合并候选索引的语法元素。
5.根据权利要求1或3中任一项所述的方法或根据权利要求2或4中任一项所述的设备,其中映射函数确定从所述合并候选索引导出第一合并候选索引和第二合并候选索引。
6.根据权利要求1或3、5中任一项所述的方法或根据权利要求2或4-5中任一项所述的设备,其中,所述合并候选索引是所述基于三角形形状的运动补偿候选列表中的所述第一合并候选索引;并且其中所述第二合并候选索引是从所述第一合并候选索引导出的。
7.根据权利要求6所述的方法或根据权利要求6所述的设备,其中所述映射函数确定以下之一:
在所述第一合并候选索引等于0的情况下,将所述第二合并候选索引设置为1,否则将所述第二合并候选索引设置为0;
在所述第一合并候选索引等于0的情况下,将所述第二合并候选索引设置为1,否则将所述第二合并候选索引设置为所述第一合并候选索引的一半。
8.根据权利要求1或3、5中任一项所述的方法或根据权利要求2或4-5中任一项所述的设备,其中语法元素指示所述合并候选索引是所述第一合并候选索引还是所述第二合并候选索引;并且其中在所述语法元素指示所述合并候选索引是所述第一合并候选索引的情况下,从所述第一合并候选索引导出所述第二合并候选索引,或者其中在所述语法元素指示所述合并候选索引是所述第二合并候选索引的情况下,从所述第二合并候选索引导出所述第一合并候选索引。
9.根据权利要求8所述的方法或根据权利要求8所述的设备,其中在所述语法元素指示所述合并候选索引是所述第一合并候选索引的情况下,所述映射函数确定以下之一:
在所述第一合并候选索引等于0的情况下,将所述第二合并候选索引设置为1,否则将所述第二合并候选索引设置为0;
在所述第一合并候选索引等于0的情况下,将所述第二合并候选索引设置为1,否则将所述第二合并候选索引设置为所述第一合并候选索引的一半。
10.根据权利要求1或3、5中任一项所述的方法或根据权利要求2或4-5中任一项所述的设备,其中所述合并候选索引的范围大于所述基于三角形形状的运动补偿候选列表的范围,并且小于所述基于三角形形状的运动补偿候选列表的范围的两倍。
11.根据权利要求10所述的方法或根据权利要求10所述的设备,其中所述映射函数确定以下之一:
在所述合并候选索引等于0的情况下,将所述第一合并候选索引设置为0,并将所述第二合并候选索引设置为1;
在所述合并候选索引大于0并且小于所述基于三角形形状的运动补偿候选列表的范围的情况下,将所述第一合并候选索引设置为所述合并候选索引,并将所述第二合并候选索引设置为0;
否则,将所述第一合并候选索引设置为所述合并候选索引减去所述基于三角形形状的运动补偿候选列表的范围,并将所述第二合并候选索引设置为第一合并候选索引加上偏移。
12.根据权利要求1或3、5-11中任一项所述的方法或根据权利要求2或4-11中任一项所述的设备,其中基于三角形形状的运动补偿候选列表的所述合并候选索引进一步指示以下之一:对角线边界的划分方向或倾斜边界的角度和距离。
13.一种包含根据权利要求3的方法或权利要求4的装置生成的数据内容的非暂时性计算机可读介质。
14.一种包括程序代码指令的非暂时性计算机可读介质,当在计算机上执行所述程序时,执行权利要求1所述的解码方法或执行权利要求3所述的编码方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19305906 | 2019-07-03 | ||
EP19305906.0 | 2019-07-03 | ||
PCT/EP2020/068744 WO2021001514A1 (en) | 2019-07-03 | 2020-07-02 | Signaling of merge indices for triangle partitions |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114073093A true CN114073093A (zh) | 2022-02-18 |
Family
ID=67658268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080049012.7A Pending CN114073093A (zh) | 2019-07-03 | 2020-07-02 | 三角形分割的合并索引的信令通知 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230156190A1 (zh) |
EP (1) | EP3994893A1 (zh) |
CN (1) | CN114073093A (zh) |
WO (1) | WO2021001514A1 (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107071458A (zh) * | 2010-12-14 | 2017-08-18 | M&K控股株式会社 | 用于编码运动画面的设备 |
-
2020
- 2020-07-02 CN CN202080049012.7A patent/CN114073093A/zh active Pending
- 2020-07-02 EP EP20736678.2A patent/EP3994893A1/en active Pending
- 2020-07-02 WO PCT/EP2020/068744 patent/WO2021001514A1/en unknown
- 2020-07-02 US US17/622,134 patent/US20230156190A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107071458A (zh) * | 2010-12-14 | 2017-08-18 | M&K控股株式会社 | 用于编码运动画面的设备 |
CN107071459A (zh) * | 2010-12-14 | 2017-08-18 | M&K控股株式会社 | 用于编码运动画面的设备 |
Non-Patent Citations (1)
Title |
---|
YAO-JEN CHANG 等: "Non-CE4: On triangle mergemodes", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11》, 21 March 2019 (2019-03-21), pages 1 - 5 * |
Also Published As
Publication number | Publication date |
---|---|
WO2021001514A1 (en) | 2021-01-07 |
EP3994893A1 (en) | 2022-05-11 |
US20230156190A1 (en) | 2023-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240314337A1 (en) | Method and device for picture encoding and decoding | |
CN113228650B (zh) | 基于块的表面的视频编码或解码的量化 | |
US20230164314A1 (en) | Method and apparatus for deblocking an image | |
CN113196781B (zh) | 管理编解码工具组合和限制 | |
CN113016180B (zh) | 用于视频编码和解码的虚拟管线 | |
US20220038684A1 (en) | Multi-reference line intra prediction and most probable mode | |
CN112889287B (zh) | 广义双向预测和加权预测 | |
CN112970264A (zh) | 基于相邻样本相关参数模型的译码模式的简化 | |
CN113170146A (zh) | 用于图片编码和解码的方法和设备 | |
CN112771874B (zh) | 用于画面编码和解码的方法和设备 | |
CN112740674A (zh) | 使用双预测进行视频编码和解码的方法和装置 | |
KR20210018270A (ko) | 비디오 인코딩 또는 디코딩을 위한 신택스 요소들 | |
KR20220123666A (ko) | 가중-예측 파라미터들의 추정 | |
KR20220123643A (ko) | 삼각형 병합 모드에서의 서브-블록 병합 후보들 | |
CN114097235A (zh) | 用于仿射和sbtmvp运动矢量预测模式的hmvc | |
CN114073093A (zh) | 三角形分割的合并索引的信令通知 | |
KR20210074388A (ko) | 코딩 유형 또는 코딩 트리 유형의 시그널링을 이용한 비디오 인코딩 및 디코딩을 위한 방법 및 장치 | |
CN114270829A (zh) | 局部照明补偿标志继承 | |
KR20240089756A (ko) | 다층 코딩 및 디코딩을 위한 alf aps | |
CN116158078A (zh) | 将abt与基于vvc子块的编码工具组合 | |
CN117501692A (zh) | 用于视频编码和解码的模板匹配预测 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20231108 Address after: Paris France Applicant after: Interactive digital CE patent holding Co. Address before: Seville, France Applicant before: Interactive digital VC holding France |
|
TA01 | Transfer of patent application right |