CN112740674A - 使用双预测进行视频编码和解码的方法和装置 - Google Patents

使用双预测进行视频编码和解码的方法和装置 Download PDF

Info

Publication number
CN112740674A
CN112740674A CN201980060122.0A CN201980060122A CN112740674A CN 112740674 A CN112740674 A CN 112740674A CN 201980060122 A CN201980060122 A CN 201980060122A CN 112740674 A CN112740674 A CN 112740674A
Authority
CN
China
Prior art keywords
predictor
block
prediction value
samples
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980060122.0A
Other languages
English (en)
Inventor
F·莱纳内克
T·波里尔
P·博尔德斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InterDigital VC Holdings Inc
Original Assignee
InterDigital VC Holdings Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by InterDigital VC Holdings Inc filed Critical InterDigital VC Holdings Inc
Publication of CN112740674A publication Critical patent/CN112740674A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

描述了不同的实现方式,尤其呈现了使用具有双预测的运动补偿的视频编码和解码的实现方式。所述编码方法包括:对于图片,使用第一参考图片获得所述图片的块的第一预测值;使用第二参考图片获得所述图片的所述块的第二预测值;使用所述第一预测值及所述第二预测值来形成用于双预测帧间预测中的所述块的第三预测值,其中所述第三预测值是作为所述第一预测值与所述第二预测值的加权平均值而被获得;并且其中在所述加权预测中使用的权重取决于所述样本在所述块中的位置。还给出了其它实施例,用于实现块三角形分区预测,用于使用多个模式实现块分区预测,以及用于解码方法中的相应运动补偿。

Description

使用双预测进行视频编码和解码的方法和装置
1.技术领域
公开了一种用于将视频编码为比特流的方法和装置。还公开了相应的解码方法和装置。至少一些实施例进一步涉及视频压缩方案中的帧间编码块的双预测(bi-prediction)。
2.背景技术
一个或多个实现方式的技术领域主要涉及视频压缩。为了实现高压缩效率,图像和视频编码方案通常采用预测和变换以利用视频内容中的空间和时间冗余。通常,帧内或帧间预测用于利用帧内或帧间相关性,然后对原始块与预测块之间的差(其通常被表示为预测误差或预测残差)进行变换、量化和熵编码。为了重构所述视频,通过与所述熵编码、量化、变换和预测相对应的逆处理来对所述压缩数据进行解码。在HEVC视频压缩标准(也称为推荐ITU-TH.265)中,帧间预测中使用的双预测过程包括对2个单向预测信号求平均。图1示出了HEVC中的双预测过程。如图1所示,2个单向预测的平均是以比输入比特深度或内部比特深度更高的精度进行的。双预测公式如方程式1所示,其中偏移(offset)和移位(shift)用于将最终预测值(predictor)归一化到输入比特深度:
Pbidir=(PL0+PL1+offset)>>shift 方程式1
由于在中间级中没有舍入,HEVC内插滤波器允许某些实现方式优化。
视频压缩技术的最新补充包括各种工业标准、各种版本的参考软件和/或文档,例如由JVET(联合视频探索团队)组开发的联合探索模型(JEM)和后来的VTM(通用视频编码(VVC)测试模型)。目标是对现有HEVC(高效视频编码)标准做进一步改进。例如,在视频编解码器的更新近的方法中,多个权重被用于对2个单向预测进行平均以获得双向预测。通常,所使用的权重是{-1/4,5/4},{3/8,5/8}或{1/2,1/2}({1/2,1/2}是在HEVC中实现的权重),并且所述双预测公式如方程式2中那样被修改。对于整个块只使用一个权重。
Pbidir=((1-w1)*PL0+w1*PL1+offset)≥shift 方程式2
在视频编解码器的另一方法中,在合并模式中使用三角形预测。图2示出了将编码单元CU分割成两个三角形预测单元。如图2中所示,在沿着对角线边缘的对角线或逆对角线方向上,将CU分割成两个三角形预测单元PU0和PU1。CU中的每一三角形预测单元是使用其自身的运动向量和从合并候选列表导出的参考帧索引而被帧间预测的。在此上下文中,将自适应加权过程应用于所述两个三角形预测单元之间的对角线或逆对角线边缘,以导出整个CU的最终预测。图3示出了对所述两个三角形预测单元之间的对角线边缘的加权过程。所述三角形预测单元模式仅应用于跳过或合并模式中的CU。当将所述三角形预测单元模式应用于所述CU时,用信号发送指示一将所述CU分割成两个三角形预测单元的方向的索引以及所述两个三角形预测单元的运动向量。对于两个预测单元,可导出具有5个单向预测值的公共列表,检查与经典合并过程中相同的空间和时间位置,但是仅使用单向向量。如果没有足够的候选,则不将冗余运动向量添加到所述列表中,并且在所述列表的末尾添加零运动向量。对于给定的预测单元,运动向量预测值的数量是5,对于每个对角线,测试20个组合(5*4=20,相同的运动向量预测值不能用于两个PU)。所述索引的范围从0到39,并且参见表2,使用该查找表来从所述索引中导出每个PU的分割方向和运动向量。给定三元组的第一元素给出了对角线方向,第二和第三元素分别给出了PU0和PU1的预测值索引。索引语法如表1所示。
Figure BDA0002974699210000031
表1:三角形分区和对应的合并索引语法
Figure BDA0002974699210000041
表2:用于确定对角线方向和预测值的查找表
图4示出了根据特定压缩方案的用于三角形分区的子块运动向量存储。在一种实现方式中,为每个4×4子块存储运动向量。当三角形分区用于CU时,用于每一分区的运动向量以相同方式针对每一子块而被存储,但对于边缘上的子块,仅存储来自一个PU的运动向量,如图4中所示。
帧间编码块的双预测与三角形分区的组合引发实施问题。因此,需要一种用于双预测的较少计算的方法。因此,揭示若干实施例以改进关于帧间编码块的双预测。
3.发明内容
根据本公开的一方面,公开了一种用于对图片进行编码的方法。此方法包括:使用第一参考图片获得所述图片的块的第一预测值;使用第二参考图片获得所述图片的所述块的第二预测值;使用所述第一预测值及所述第二预测值来形成用于双预测帧间预测中的所述图片的所述块的第三预测值,其中所述第三预测值是作为所述第一预测值与所述第二预测值的加权平均值而被获得的;并且其中所述第三预测值的样本通过将第一权重应用于所述第一预测值的样本并且通过将第二权重应用于所述第二预测值的样本来获得;所述第三预测值的所述样本、所述第一预测值的所述样本和所述第二预测值的所述样本共享所述块中的相同位置;并且第一权重和第二权重取决于所述样本在所述块中的所述位置。
根据本公开的另一方面,公开了一种用于对图片进行编码的装置。用于使用第一参考图片获得所述图片的块的第一预测值的装置;用于使用第二参考图片获得所述图片的所述块的第二预测值的装置;用于使用所述第一预测值及所述第二预测值在双预测帧间预测中形成所述图片的所述块的第三预测值的装置,其中所述第三预测值是作为所述第一预测值与所述第二预测值的加权平均值而被获得的;并且其中所述第三预测值的样本通过将第一权重应用于所述第一预测值的样本并且通过将第二权重应用于所述第二预测值的样本来获得;所述第三预测值的所述样本、所述第一预测值的所述样本和所述第二预测值的所述样本共享所述块中的相同位置;并且第一权重和第二权重取决于所述样本在所述块中的所述位置。.
根据本公开的一方面,提供了一种用于对图片进行编码的装置,该装置包括处理器和耦合到处理器的至少一个存储器,该处理器被配置为实现所述编码方法的任何变型。
根据本公开的另一方面,公开了一种用于对视频进行解码的方法。该方法包括:在比特流中接收经编码的视频数据,且针对运动补偿,使用第一参考图片获得所述图片的块的第一预测值;使用第二参考图片获得所述图片的所述块的第二预测值;使用所述第一预测值及所述第二预测值来形成用于双预测帧间预测中的所述图片的所述块的第三预测值,其中所述第三预测值是作为所述第一预测值与所述第二预测值的加权平均值而被获得的;并且其中所述第三预测值的样本通过将第一权重应用于所述第一预测值的样本并且通过将第二权重应用于所述第二预测值的样本来获得;所述第三预测值的所述样本、所述第一预测值的所述样本和所述第二预测值的所述样本共享所述块中的相同位置;并且其中第一权重和第二权重取决于所述样本在所述块中的所述位置。
根据本公开的另一方面,公开了一种用于对视频进行解码的装置。此装置包括:用于在比特流中接收经编码的视频数据的装置和用于处理运动补偿的装置,所述用于处理运动补偿的装置进一步包括用于使用第一参考图片获得图片的块的第一预测值的装置;用于使用第二参考图片获得所述图片的所述块的第二预测值的装置;用于使用所述第一预测值及所述第二预测值在双预测帧间预测中形成所述图片的所述块的第三预测值的装置,其中所述第三预测值是作为所述第一预测值与所述第二预测值的加权平均值而被获得;其中所述第三预测值的样本通过将第一权重应用于所述第一预测值的样本并且通过将第二权重应用于所述第二预测值的样本来获得;所述第三预测值的所述样本、所述第一预测值的所述样本和所述第二预测值的所述样本共享所述块中的相同位置;并且其中第一权重和第二权重取决于所述样本在所述块中的所述位置。
根据本公开的一方面,提供了一种用于解码视频的装置,该装置包括处理器和耦合到处理器的至少一个存储器,该处理器被配置为在比特流中接收所编码的视频数据并且实现所述解码方法的任何变型。
本公开还提供了一种信号,该信号包括根据前述说明中的任一项的方法或装置生成的视频数据。本发明实施例还提供了一种包括指令的计算机程序产品,当由计算机执行时,所述指令使计算机执行所描述的方法。
本公开还提供了一种计算机可读存储介质,其上存储有根据上述方法生成的比特流。本公开还提供了一种用于发送根据上述方法生成的比特流的方法和装置。
以上给出了本主题的简化概述,以便提供对本主题实施例的一些方面的基本理解。本概述不是对本主题的详尽综述。其并非旨在标识各实施例的关键/重要元素或描绘本主题的范围。其唯一目的是以简化形式呈现本主题的一些概念,作为稍后呈现的更详细描述的序言。
从以下参照附图进行的对说明性实施例的详细描述中,本公开的附加特征和优点将变得显而易见
4.附图的简要说明
图1示出了根据HEVC标准的双预测过程;
图2示出了根据特定压缩方案将编码单元CU分割成两个三角形预测单元;
图3示出了根据特定压缩方案对两个三角形预测单元之间的对角线边缘的加权过程;
图4示出了根据特定压缩方案的用于三角形分区的子块运动向量存储;
图5示出了根据特定压缩方案的用于经双预测的三角形分区的运动补偿过程;
图6示出了根据特定压缩方案的用于经单预测的三角形分区的运动补偿过程;
图7示出了根据本发明实施例的适于三角形预测的经修改运动补偿过程的示例;
图8示出了根据本公开的实施例的多个对角线图案(pattern)的示例;
图9和图10示出了根据本发明实施例的多个图案的其它示例;
图11示出了所提出的运动向量存储的实施例;
图12示出了根据本公开的实施例的示例性编码器;
图13示出了根据本公开的实施例的示例性解码器;
图14示出了系统的示例的框图,其中实现了各个方面和实施例;
图15示出了根据本公开实施例的在解码方法或编码方法中的任何一种中实现的加权双预测。
具体实施方式
应当理解,附图和描述已经被简化以示出与清楚理解本原理相关的元件,同时为了清楚起见,去除了在典型的编码和/或解码设备中存在的许多其它元件。应当理解,尽管术语第一和第二在本文中可以用于描述各种元件,但是这些元件不应当受这些术语限制。这些术语仅用于将一个元件与另一个元件区分。
相对于图片的编码/解码,描述了各种实施例。它们可以被应用于编码/解码图片的一部分(诸如,切片或图块),或者图片的整个序列。
上文描述了各种方法,并且每个方法包括用于实现所描述的方法的一个或多个步骤或动作。除非方法的正确操作需要特定顺序的步骤或动作,否则可修改或组合特定步骤和/或动作的顺序和/或使用。
至少一些实施例涉及用于包括加权双预测的视频编码或视频解码的方法,其中所述加权双预测的权重取决于样本在所编码或解码视频的图片的块中的位置。
对于双预测的三角形分区的加权运动补偿的第一个问题是:每个PU都是双预测的,因此涉及在2个预测之间的边缘上的加权处理。图5示出了用于经双预测的三角形分区的运动补偿过程。对于如图3所示的边缘上的样本,如图5所示,需要4次运动补偿。因此,需要一种较少计算的方法。
已经提出了第一种解决方案,其将三角形PU限制为单预测以减小存储带宽。图6示出了用于单预测三角形分区的运动补偿过程。在这种情况下,所述运动补偿过程被简化,如图6所示,然而,这种解决方案仍然可以从关于过程精度的改进中获益。至少一个实施例涉及改进帧间编码块的双预测过程的精度。
在双预测三角形分区的增强中,需要通过添加更多图案来改进压缩效率。然后,用于双预测分区的加权运动补偿的第二个问题是在没有编码关于分区和运动向量的组合的索引的较大成本的情况下,用信号发送所添加的模式。至少一个实施例涉及改进帧间编码块的双预测过程的信令。
第三个问题是用于边缘上子块中每个PU的运动向量的存储。对于边缘上的样本,在2个预测之间进行加权,这意味着至少2个运动向量被用于预测该样本,但是在存储器中仅存储用于预测当前PU的运动向量,这可能导致与相邻块的次优运动传播。至少一个实施例涉及改进帧间编码块的双预测过程的运动向量的存储。
因此,揭示若干实施例以改进帧间编码块的双预测。
一般实施例
加权双预测1500的一般方法的至少一个实施例在图15中示出。本领域技术人员可以在视频编码方法或视频解码方法的运动补偿过程中的任何一个中容易地实现这种方法,其中,输入信息的获得可在编码方法中的RDO环路中被确定,或者在解码器中从接收的数据中解码。根据本原理,加权双预测的权重取决于样本在编码或解码视频的图片的块中的位置。因此,三角形分区的处理有利地作为加权预测来执行,且导致帧间编码块的双预测过程的精度增加,如稍后解释的。
首先,在图15的1510处,针对要编码/解码的图片的块,获得第一预测值和第二预测值。用于所述块的第一预测值使用存储在列表L0中的第一参考图片,且用于所述块的第二预测值使用存储在列表L1中的第二参考图片。通过双向帧间预测,将这2个单向预测值组合起来形成第三预测值。
根据此后描述的不同实施例,在1520,获得用于确定位置相关权重的至少一个信息。这个步骤是可选的。根据非限制性实施例,第一信息指示用三角形分区来分割所述图片的所述块,第二信息指示所述块的所述三角形分区的边缘的方向,第三信息指示所述三角形分区的所述边缘的位置。根据另一实施例,所述块的所述分割不限于三角形分区,以及如图9所示了沿着边缘将块更一般地分割成2个分区。然后,用于确定位置相关权重的信息是一指示了利用边缘分区来分割所述图片的所述块的信息。根据非限制性实施例,第四信息指示所谓的“三角形分区”的边缘是垂直或水平的(而不是对角线的)。根据另一实施例,在确定位置相关权重时使用的信息是与颜色分量有关的信息。如果块是亮度块或色度块,则该块中的样本的数目可以不同,因此,所述权重也根据所述颜色分量来确定。除此之外,所述权重也根据所述块的大小来确定。根据另一实施例,双预测中的所述位置相关权重不限于三角形或边缘分区,因此信息更一般地是在确定位置相关权重时使用的任何信息。
如先前所描述,在特定实施例中,使用多个权重来对2个单向预测求平均以获得一双向预测。根据非限制性示例,所使用的权重是{-1/4,5/4}、{3/8,5/8}或{1/2,1/2},其中仅一对权重被用于整个块。本发明原理有利地与在一权重集合中选择基于块的权重相兼容,其中样本的位置相关权重从所选择的基于块的权重而被导出的。换句话说,根据样本的位置和预测值的所选择的基于块的权重来确定该样本的权重。因此,在1530,可选地,在一权重集合中,确定所选择的基于块的权重。
在1540,确定所述块中的样本的位置相关权重。根据特定实施例,所述块中的样本的位置相关权重进一步从所获得的信息、所选择的基于块的权重、所述块的分量、所述块的大小中的至少一者导出。通过将第一权重应用于第一预测值的样本并通过将第二权重应用于第二预测值的样本来获得第三预测值的样本。因此,根据所述样本在所述块中的位置来确定所述第一和第二权重。所述第三预测值的所述样本、所述第一预测值的所述样本和所述第二预测值的所述样本在所述块中共享相同的位置,这些样本在所述块中共位。
根据实施例,将位置相关权重双向帧间预测用于三角形预测。由于每一三角形预测单元被限于单预测,因此将所述三角形预测实施为双预测,其中第一权重和第二权重取决于样本位置。在三角形分区的情况下,所述第一权重和第二权重取决于所述样本与所述块的三角形分区的边缘之间的距离。然而,本原理不限于三角形分区,并且可以容易地扩展到所述块的其他分区,这其中包括水平/垂直边缘并且包括多个图案。下文描述不同的变型和改进。用于计算权重的所述块中的边缘的位置是从一指示将所述块分割成2个分区的至少一个信息获得的。此外,在一种变型中,用信号发送所述至少一个信息,以允许与编码方法相对应的解码方法使用相同的信息进行双预测。例如,在编码方法中,对所述至少一个用信号发送的信息进行熵编码。例如,在解码方法中,从所述用信号发送的信息的熵解码,获得所述至少一个信息。
然而,双预测中的位置相关权重不限于三角形或边缘分区。例如,本发明原理还与avec组合帧内间预测(中权重依赖于没有其它分区的样本位置)兼容。
一旦获得样本相关权重,在1550处,处理所述双预测过程。所述第三预测值(也称为双向预测值)作为所述第一预测值和所述第二预测值的加权平均值而被获得。有利地,所述加权平均值按照与所述预测值的比特深度相比增加的比特深度而被处理。然后,在1560处,对较大比特深度上的加权平均值进行移位和裁切(clip)以获得与所述第一和第二预测值相同的比特深度上的所述第三预测值。
在1570,所述双预测结束,并且输出用于编码或解码的图像块的所述第三预测值。
实施例1
因此,编码或解码方法的至少一个实施例涉及以增加的精度对三角形分区的边缘上的样本进行加权。图7示出了根据实施例的用于三角形预测的修改的运动补偿过程的示例。由于每一三角形预测单元被限于单预测,因此处理具有样本位置相关加权因子的双预测以获得三角形预测。这种修改的运动补偿过程是用图3和图4所示的位置相关权重来实现的,在该过程中,用于对2个单预测P1和P2求平均的权重对于每个样本可以是不同的。该权重取决于当前样本S0、S1、S2或S3与2个三角形PUS P1和P2之间的边缘之间的距离。例如,对于分区边缘上的样本S0,第一权重W1等于4/8,第二权重W2等于4/8。例如,对于远离分区边缘的样本S1,第一权重W1等于1/8,第二权重W2等于7/8。相反,对于距分区的边缘相同距离的样本S2,第一权重W1等于7/8,并且第二权重W2等于1/8。并且,当样本S3和分区的边缘之间的距离在限定值以上时,第一权重W1等于8/8,并且第二权重W2等于0/8。如图7所示,有利地,移位到输入比特深度和裁切被推迟到对所述样本进行加权之后,从而有利于扩展精度。在此实施例中,第一信息指示利用三角形分区来对图片的块进行分割,例如根据图3所示的左上至右下的方向。例如,一专用语法(如triangle_flag(三角形_标志))被用来指示所述块的三角形分区。在亮度分量的大小为NxN(例如,如图3中的N=8)的块中,该块中的位置(x,y)处的权重W1例如通过以下获得(x和y在范围[0,N-1]中):
W1=(Clip(0,8,(x-y)+4)且W2=8-W1
所得到的权重在范围[0-8]内,因此,获得了加权和的增加的精度,并且随后进行移位和裁切操作以将比特深度减小到所述第三预测值的比特深度。如图3所示,位置(x,y)处的权重W1对于色度分量是不同的。
实施例2
所述编码或解码方法的至少一个实施例还涉及对适于多个分区图案的三角形分区的边缘上的样本进行加权。有利地,指示所述多个分区图案的布置的信息被用来确定所述不同分区图案的块中的边缘。因此,确定所述样本在所述块中相对于所述边缘的位置,例如距离。图8示出了根据实施例的多个对角线图案的示例。期望这种多个对角线图案(其中定义2个(TL2BR或TR2BL)或更多(TL2BR_1_4,TL2BR_3_4,TR2BL_1_4,TR2BL_3_4)图案)来改进编码效率。例如,如图8所示,所述对角线可以被移位(移位1/4或3/4)或旋转(左上到右下TL2BR或右上到左下TR2BL)。
至少一个实施例涉及具有多个分区(例如三角形分区)的双预测。根据变化特征,对所述多个图案与运动向量预测值的索引的编码是分开的。实际上,如果来自图8的6个图案被实现为双预测的三角形分区,则6*20=180个组合将必须在编码器处被测试。下面在实施例5的变型中描述各种编码器加速实现。
因此,描述专用语法,其将使用语法元素diagonal_dir[x0][y0],diagonal_pos[x0][y0]的关于图案的信令与关于运动向量候选列表most_probable_idx中的运动向量索引的信令相分离。因此,指示所述块的三角形分区的边缘的方向的所述第二信息为diagonal_dir[x0][y0]语法元素,且指示所述三角形分区的边缘的位置的所述第三信息为diagonal_pos[x0][y0]语法元素。这样的语法元素被熵编码、分别被解码,并且在表4和5中提出了二进制化。
Figure BDA0002974699210000141
Figure BDA0002974699210000151
表3:用于多个图案的修改的语法
diagonal_dir[x0][y0]指定了将所述块的2个预测单元分离的对角线的方向,其中x0、y0指定所考虑的预测块的左上亮度样本相对于图片的左上亮度样本的位置(x0、y0)。图2和图8中示出了各种对角线方向的示例。
Figure BDA0002974699210000152
表4:关于diagonal_dir语法元素的二值化
diagonal_pos[x0][y0]指定了将所述块的2个预测单元分开的对角线的位置,其中x0、y0指定所考虑的预测块的左上亮度样本相对于图片的左上亮度样本的位置(x0、y0)。图8示出了各种对角线位置的示例。
Figure BDA0002974699210000153
表5:关于diagonal_pos语法元素的二进制化
实施例3
在另一个变型中,其它边缘可用作水平、垂直或从块的角到中间的边缘,如图9和10所示。例如,图9示出了附加的图案,其中边缘是水平的(HOR,HOR_1_4,HOR_3_4)或垂直的(VER,VER_1_4,VER_3_4),并位于块的中间(HOR,VER)或四分之一(HOR_1_4,HOR_3_4,VER_1_4,VER_3_4)处。图10示出了另外的图案,其中所述边缘在块的角开始并在块的中间结束。当然,与本发明原理兼容的沿着边缘的分区不限于所描述的图案,并且本领域技术人员将容易地将使用位置相关加权因子的修改的运动补偿处理应用于其它分区图案。根据本实施例,修改所述语法以添加如表6所示的新图案。
Figure BDA0002974699210000161
表6:所提出的用于对角线加上水平和垂直分区的语法
在另一变型中,对指示应用于边缘上的平均的其它权重的语法元素进行编码。
实施例4
所述至少一个实施例还适于存储在分区的边缘上的运动向量。在经典帧间模式中,当使用双预测时,2个运动向量(每个列表1个)存储在4×4子块中。在三角形模式合并中,在其中每一PU被限于单预测的变化形式中,如图11中所示在边缘上使用的2个运动向量被有利地存储在相应的2个列表中。因此,该方法不需要额外的成本就可以实现。结合方程式2,运动向量可以被储存,其分别具有来自列表0与列表1的运动向量的给定权重w0与w1,此允许运动向量的较佳传播,因此对于邻近块有较佳的预测。
实施例5的变型
实施例5涉及用于运动补偿的编码器加速。在编码器处,当使用更多的图案时,测试组合的最大数目增加很多,因为对于一给定的图案,使用关于运动向量预测值的20个组合。对于任何组合,求平均被处理以便评估候选。至少一个实施例涉及减少测试组合的数量。根据一个特征,通过使用SATD(绝对变换差的和)的快速估计,仅对最佳预测值进行RDOQ(速率失真优化量化)处理。
在第一变型中,不对使用在列表的末尾添加的零运动向量预测值的组合进行测试。例如,在所述列表的预测值4、5是追加的零运动向量的情况下,针对给定的图案,仅测试3*2=6个组合,而不是20个。在6个图案的情况下,测试6*6=36个组合,而不是6*20=240。
在第二变型中,对使用在经典合并中选择的运动向量的组合进行测试,而不测试其他组合。首先,确定所述经典合并的最佳合并候选。然后恢复取决于所述最佳候选是单向还是双向的一个或2个运动向量。如果这些运动向量处于三角形PU的运动向量预测值的列表中,那么关于可能组合的测试被减少到关于含有这些运动向量预测值的组合的测试。
在第三变型中,运动向量预测值用SAD或SATD来排序。由于所有的组合都是使用最多5个运动向量预测值来进行的,因此使用SAD或SATD根据所有5个单向运动向量预测值的似然性来对它们进行排序。保持N(N<5)个最佳运动向量,或者去除大于阈值的预测值。因此,减少了可能的组合的数量。
附加实施例和信息
本申请描述了多个方面,这其中包括工具、特征、实施例、模型、方法等。这些方面中的许多方面被描述为具有特异性,并且至少为了示出个体特性,通常以可能听起来受限的方式来描述。然而,这是为了描述清楚的目的,并且不限制那些方面的应用或范围。实际上,所有不同的方面可以组合和互换以提供另外的方面。此外,这些方面也可以与在较早的文档中描述的方面组合和互换。
本申请中描述和预期的方面可以以许多不同的形式实现。以下图12、13和14提供了一些实施例,但是可以设想其他实施例,并且对图12、13和14的讨论不限制实现的广度。所述方面中的至少一个方面主要涉及视频编码和解码,并且至少一个其它方面主要涉及传送所生成或编码的比特流。这些和其它方面可以被实现为方法、装置、其上存储有用于根据所描述的任何方法来编码或解码视频数据的指令的计算机可读存储介质、和/或其上存储有根据所描述的任何方法生成的比特流的计算机可读存储介质。
在本申请中,术语“重建”和“解码”可以互换使用,术语“像素”和“样本”可以互换使用,术语“图像”、“图片”和“帧”可以互换使用。通常,但不是必须的,术语“重构”在编码器侧使用,而“解码”在解码器侧使用。
本文描述了各种方法,并且每种方法包括用于实现所描述的方法的一个或多个步骤或动作。除非所述方法的正确操作需要特定顺序的步骤或动作,否则可修改或组合特定步骤和/或动作的顺序和/或使用。
本申请中描述的各种方法和其它方面可用于修改模块,例如,图12所示的视频编码器100的熵编码145、运动补偿170和运动估计175以及图13所示的视频解码器200的熵解码230和运动补偿275模块。此外,本发明不限于VVC或HEVC,并且可应用于例如其它标准和提案(无论是预先存在的还是将来开发的)以及任何此类标准和提案(包括VVC和HEVC)的扩展。除非另外指出或在技术上排除,本申请中描述的方面可以单独或组合使用。
在本申请中使用各种数值,例如分区的数量或相对权重的值。具体值是出于示例目的,并且所描述的方面不限于这些具体值。
图12示出了编码器100。可以设想该编码器100的变型,但是为了清楚起见,下面描述编码器100,而没有描述所有预期的变型。
在被编码之前,视频序列可以经历预编码处理(101),例如,对输入颜色图片应用颜色变换(例如,从RGB 4:4:4到YCbCr 4:2:0的转换),或者执行输入图片分量的重新映射,以便获得对压缩更有弹性的信号分布(例如,使用所述颜色分量之一的直方图均衡)。元数据可以与所述预处理相关联,并且被附加到比特流。
在编码器100中,如下所述,由编码器元件对图片进行编码。以例如CU为单位分区(102)并处理要编码的图片。使用例如帧内或帧间模式来编码每个单元。当以帧内模式对单元进行编码时,其执行帧内预测(160)。在帧间模式中,执行运动估计(175)和补偿(170)。所述编码器决定(105)使用帧内模式或帧间模式中的哪一者来对所述单元进行编码,并且通过例如预测模式标志来指示所述帧内/帧间决定。例如,通过从原始图像块中减去(110)预测块来计算预测残差。
然后,对所述预测残差进行变换(125)和量化(130)。对所量化的变换系数以及运动向量和其它语法元素进行熵编码(145)以输出比特流。所述编码器可以跳过所述变换,并直接对未变换的残差信号应用量化。所述编码器可以绕过变换和量化这两者,即,直接对所述残差进行编码而不应用所述变换或量化处理。
所述编码器对编码块进行解码,以提供用于进一步预测的参考。对所量化的变换系数进行解量化(140)和逆变换(150)以对预测残差进行解码。组合(155)所解码的预测残差和预测块,重构图像块。环内滤波器(165)被应用于所重构的图片,以执行例如解块/SAO(样本自适应偏移)滤波,从而减少编码伪像。将所滤波的图像存储在参考图片缓冲器(180)中。
图13示出了视频解码器200的框图。在解码器200中,如下所述,由解码器元件解码比特流。视频解码器200通常执行与如图13中所描述的编码过程互逆的解码过程。所述编码器100通常还执行视频解码作为编码视频数据的一部分。
特别地,所述解码器的输入包括视频比特流,其可以由视频编码器100生成。所述比特流首先被熵解码(230)以获得变换系数、运动向量和其它编码信息。图片分区信息指示所述图片如何被分区。所述解码器因此可以根据所解码的图片分区信息来划分(235)所述图片。所述变换系数被解量化(240)和逆变换(250)以解码所述预测残差。将所解码的预测残差与预测块进行组合(255),重构图像块。所述预测块可以从帧内预测(260)或运动补偿预测(即,帧间预测)(275)获得(270)。环内滤波器(265)被应用于所重构的图像。将所滤波的图像存储在参考图片缓冲器(280)中。
解码后的图片可以进一步经历解码后处理(285),例如,逆颜色变换(例如,从YCbCr 4:2:0到RGB 4:4:4的转换)或执行在预编码处理(101)中执行的所述重新映射过程的逆重新映射。所述解码后处理可以使用在所述预编码处理中导出并且在所述比特流中用信号发送的元数据。
图14示出了其中实现了各个方面和实施例的系统的示例的框图。系统1000可以被实现为包括以下描述的各种组件的设备,并且被配置为执行本文中描述的一个或多个方面。此类设备的示例包括但不限于各种电子设备,诸如个人计算机、膝上型计算机、智能电话、平板计算机、数字多媒体机顶盒、数字电视接收机、个人视频记录系统、连接的家用电器和服务器。系统1000的元件可以单独地或组合地被实现在单个集成电路(IC)、多个IC和/或分立组件中。例如,在至少一个实施例中,系统1000的处理和编码器/解码器元件分布在多个IC和/或分立组件上。在各种实施例中,所述系统1000经由例如通信总线或通过专用输入和/或输出端口而被通信地耦合到一个或多个其他系统或其他电子设备。在各种实施例中,所述系统1000被配置为实现本文中描述的一个或多个方面。
所述系统1000包括至少一个处理器1010,其被配置为执行加载在其中的指令,以用于实现例如本文中描述的各个方面。处理器1010可以包括嵌入式存储器、输入输出接口和本领域已知的各种其它电路。所述系统1000包括至少一个存储器1020(例如,易失性存储器设备和/或非易失性存储器设备)。系统1000包括存储设备1040,其可以包括非易失性存储器和/或易失性存储器,这其中包括但不限于电可擦除可编程只读存储器(EEPROM)、只读存储器(ROM)、可编程只读存储器(PROM)、随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、磁盘驱动器和/或光盘驱动器。作为非限制性示例,所述存储设备1040可以包括内部存储设备、附接的存储设备(包括可拆卸的存储设备和不可拆卸的存储设备)和/或网络可访问的存储设备。
系统1000包括编码器/解码器模块1030,其被配置为例如处理数据以提供所编码的视频或所解码的视频,并且所述编码器/解码器模块1030可以包括其自己的处理器和存储器。所述编码器/解码器模块1030表示可包括在设备中以执行编码和/或解码功能的模块(一个或多个)。如已知的,设备可以包括所述编码模块和解码模块中的一个或两个。另外,编码器/解码器模块1030可实施为系统1000的单独元件或可并入处理器1010内作为如所属领域的技术人员已知的硬件与软件的组合。
要加载到处理器1010或编码器/解码器1030上以执行本文档中描述的各个方面的程序代码可以存储在存储设备1040中,并且随后加载到存储器1020上以供处理器1010执行。根据各种实施例,处理器1010、存储器1020、存储设备1040和编码器/解码器模块1030中的一者或多者可以在执行本文中描述的过程期间存储各种项中的一者或多者。这些存储的项可以包括但不限于输入视频、所解码的视频或该解码的视频的部分、比特流、矩阵、变量以及来自方程式、公式、运算和运算逻辑的处理的中间或最终结果。
在一些实施例中,所述处理器1010和/或所述编码器/解码器模块1030内的存储器用于存储指令,并且提供用于在编码或解码期间需要的处理的工作存储器。然而,在其它实施例中,所述处理设备(例如,所述处理设备可为所述处理器1010或所述编码器/解码器模块1030)外部的存储器用于这些功能中的一者或多者。外部存储器可以是存储器1020和/或存储设备1040,例如,动态易失性存储器和/或非易失性闪存。在几个实施例中,外部非易失性闪存用于存储例如电视的操作系统。在至少一个实施例中,诸如RAM的快速外部动态易失性存储器被用作视频编码和解码操作的工作存储器,诸如用于MPEG-2(MPEG是指运动图像专家组,MPEG-2也被称为ISO/IEC13818,并且13818-1也被称为H.222,并且13818-2也被称为H.262)、HEVC(HEVC是指高效视频编码,也被称为H.265和MPEG-H部分2)、或VVC(通用视频编码,由联合视频团队专家JVET开发的新标准)的工作存储器。
如框1130中所示,可以通过各种输入设备来提供对系统1000的元件的输入。这样的输入设备包括但不限于:(i)接收例如由广播者通过空中传输的射频(RF)信号的RF部分,(ii)分量(COMP)输入端子(或一组分量输入端子),(iii)通用串行总线(USB)输入端子,和/或(iv)高清晰度多媒体接口(HDMI)输入端子。图10中未示出的其它示例包括合成视频。
在各种实施例中,框1130的输入设备具有本领域已知的相关联的相应输入处理元件。例如,所述RF部分可以与适合于以下的元件相关联:(i)选择期望频率(也称为选择信号,或将信号频带限制到一频带),(ii)将所选择的信号下变频,(iii)再次将频带限制到较窄频带,以选择(例如)在某些实施例中可以称为信道的信号频带,(iv)解调所述下变频且频带限制的信号,(v)执行纠错,和(vi)解复用以选择期望的数据分组流。各种实施例的RF部分包括一个或多个元件以执行这些功能,例如,频率选择器、信号选择器、限带器、信道选择器、滤波器、下变频器、解调器、纠错器和解复用器。所述RF部分可以包括执行各种这些功能的调谐器,这些功能包括例如将所接收的信号下变频到较低频率(例如,中频或近基带频率)或基带。在一个机顶盒实施例中,所述RF部分及其相关的输入处理元件接收通过有线(例如,电缆)介质发送的RF信号,并通过滤波、下变频和再次滤波来执行到期望频带的频率选择。各种实施例重新安排上述(和其它)元件的顺序,移除这些元件中的一些,和/或添加执行类似或不同功能的其它元件。添加元件可以包括在现有元件之间插入元件,例如插入放大器和模数转换器。在各种实施例中,所述RF部分包括天线。
另外,USB和/或HDMI终端可以包括用于通过USB和/或HDMI连接将系统1000连接到其它电子设备的相应接口处理器。应当理解,输入处理的各个方面(例如,,所罗门纠错)可以根据需要在例如单独的输入处理IC或处理器1010内实现。类似地,USB或HDMI接口处理的各方面可以根据需要在单独的接口IC内或在处理器1010内实现。解调、纠错和解复用的流被提供给各种处理元件,这其中包括例如处理器1010和编码器/解码器1030,其与存储器和存储元件结合操作以根据需要来处理所述数据流以便在输出设备上呈现。
系统1000的各种元件可以设置在集成壳体内。在该集成壳体内,各种元件可以使用合适的连接布置(例如,本领域已知的内部总线,包括IC间(I2C)总线、布线和印刷电路板)互连并在其间传输数据。
所述系统1000包括通信接口1050,其使得能够经由通信信道1060与其他设备通信。所述通信接口1050可以包括但不限于被配置为通过通信信道1060发送和接收数据的收发器。所述通信接口1050可以包括但不限于调制解调器或网卡,并且所述通信信道1060可以例如在有线和/或无线介质内实现。
在各种实施例中,使用无线网络(例如,Wi-Fi网络,例如IEEE 802.11(IEEE是指电气和电子工程师协会)),将数据流式传输或以其他方式提供给所述系统1000。这些实施例的Wi-Fi信号通过适用于Wi-Fi通信的通信信道1060和通信接口1050来接收。这些实施例的通信信道1060通常连接到接入点或路由器,所述接入点或路由器提供对包括因特网的外部网络的接入以允许流式传输应用和其它云上通信。其它实施例使用通过输入框1130的HDMI连接来传递数据的机顶盒而向系统1000提供流式传输的数据。还有一些实施例使用输入框1130的RF连接而向所述系统1000提供流式传输的数据。如上所述,各种实施例以非流式传输方式提供数据。另外,各种实施例使用除Wi-Fi之外的无线网络,例如,蜂窝网络或蓝牙网络。
所述系统1000可以向各种输出设备(包括显示器1100、扬声器1110和其他外围设备1120)提供输出信号。各种实施例的显示器1100包含以下中的一者或多者:例如触摸屏显示器、有机发光二极管(OLED)显示器、弯曲显示器和/或可折叠显示器。所述显示器1100可以用于电视、平板电脑、膝上型计算机、蜂窝电话(移动电话)或其他设备。所述显示器1100还可与其它组件集成(例如,如在智能电话中),或是单独的(例如,用于膝上型计算机的外部监视器)。在各实施例的各示例中,所述其它外围设备1120包括以下中的一者或多者:独立数字视频盘(或数字多功能盘)(DVR,针对这两项)、盘播放器、立体声系统和/或照明系统。各种实施例使用一个或多个外围设备1120,其基于系统1000的输出来提供功能。例如,盘播放器执行播放所述系统1000的输出的功能。
在各种实施例中,使用信令(诸如,AV.Link(AV.链路)、消费电子控制(CEC)、或在有或没有用户干预的情况下实现设备到设备控制的其他通信协议)在系统1000和显示器1100、扬声器1110或其它外围设备1120之间传送控制信号。所述输出设备可以经由通过相应接口1070、1080和1090的专用连接而通信地耦合到系统1000。作为替代,所述输出设备可以使用通信信道1060经由通信接口1050连接到系统1000。所述显示器1100和扬声器1110可以与系统1000的其它组件一起集成在电子设备(例如电视机)中的单个单元中。在各种实施例中,显示接口1070包括显示驱动器,例如定时控制器((T Con)芯片。
例如,如果输入1130的RF部分是单独机顶盒的一部分,则所述显示器1100和扬声器1110可以备选地与其它组件中的一个或多个分离。在所述显示器1100和扬声器1110是外部组件的各种实施例中,所述输出信号可以经由专用输出连接来提供,所述专用输出连接例如包括HDMI端口、USB端口或COMP输出。
这些实施例可以由处理器1010或由硬件实现的计算机软件或由硬件和软件的组合来实现。作为非限制性示例,所述实施例可以由一个或多个集成电路实现。所述存储器1020可以是适合于技术环境的任何类型,并且可以使用任何适当的数据存储技术来实现,作为非限制性示例,诸如光学存储器设备、磁存储器设备、基于半导体的存储器设备、固定存储器和可移动存储器。所述处理器1010可以是适合于技术环境的任何类型,并且作为非限制性示例,可以包含以下中的一者或多者:微处理器、通用计算机、专用计算机和基于多核架构的处理器。
各种实现方式涉及解码。如本申请中所使用的,“解码”可以包括例如对接收到的编码序列执行的全部或部分处理,以便产生适合于显示的最终输出。在各种实施例中,此类过程包括通常由解码器执行的过程中的一个或多个,例如熵解码、逆量化、逆变换和差分解码。在各种实施例中,此类过程还或替代地包含由本申请案中所描述的各种实施方案的解码器执行的过程,例如,解码双预测标志、解码用于双预测的分区及预测值列表中的索引、根据块中的像素的位置确定权重(尤其是沿着PU的分区的边缘)、以及使用双预测及所确定的权重在帧间执行运动补偿。
作为进一步的示例,在一个实施例中,“解码”仅指熵解码,在另一实施例中,“解码”仅指差分解码,并且在另一实施例中,“解码”指熵解码和差分解码的组合。短语“解码过程”是旨在具体地指代操作的子集还是一般地指代更广泛的解码过程,这基于具体描述的上下文将是清楚的,并且相信是本领域技术人员所充分理解的。
各种实现涉及编码。以与以上关于“解码”的讨论类似的方式,如在本申请中使用的“编码”可以包括例如对输入视频序列执行的以便产生编码比特流的过程的全部或部分。在各种实施例中,此类过程包括通常由编码器执行的一个或多个过程,例如,分区、差分编码、变换、量化和熵编码。在各种实施例中,此类过程还或替代地包含由本申请案中所描述的各种实施方案的编码器执行的过程,例如,在使用运动补偿和运动预测的双预测方案中确定预测值(其中双预测的权重是基于块中的像素的位置的(尤其是沿着PU的分区的边缘)、使用双预测在帧间中执行运动补偿、对双预测标志进行编码,对用于双预测的分区进行编码、以及对预测值列表中的索引进行编码。
作为进一步的示例,在一个实施例中,“编码”仅指熵编码,在另一实施例中,“编码”仅指差分编码,而在另一实施例中,“编码”指差分编码和熵编码的组合。短语“编码过程”的旨在具体地指代操作的子集还是一般地指代更广泛的编码过程,这将基于具体描述的上下文而变得清楚,并且相信是本领域技术人员所充分理解的。
注意,如本文所使用的语法元素(例如,diagonal_dir,diagonal_pos,diagonal_flag,partition_dir,partition_pos)是描述性术语。因此,它们不排除使用其它语法元素名称。
当附图被呈现为流程图时,应当理解,它还提供了对应装置的框图。类似地,当附图被呈现为框图时,应当理解,它还提供了对应的方法/过程的流程图。
各种实施例涉及例如当在编码器处测试双预测多分区PU的组合时的速率失真优化。特别地,在编码过程期间,通常考虑速率和失真之间的平衡或折衷,通常给出计算复杂度的约束。所述速率失真优化通常被公式化为最小化速率失真函数,该速率失真函数是速率和失真的加权和。存在不同的方法来解决速率失真优化问题。例如,这些方法可以基于对所有编码选项的广泛测试,这其中包括所有考虑的模式或编码参数值,且对它们的编码成本和在编码和解码之后的重构信号的相关失真进行完整评估。还可以使用更快的方法来节省编码复杂度,特别是基于预测或预测残差信号而不是重构信号来计算近似失真。还可以使用这两种方法的混合,例如通过仅对一些可能的编码选项使用近似失真,而对其他编码选项使用完全失真。其它方法仅评估可能的编码选项的子集。更一般地,许多方法采用各种技术中的任何一种来执行所述优化,但是该优化不一定是对编码成本和相关失真这两者的完整评估。
本文描述的实现方式和方面可以在例如方法或过程、装置、软件程序、数据流或信号中实现。即使仅在单一形式的实现的上下文中被讨论(例如,仅作为方法而被讨论),所讨论的特征的实现也可以以其他形式(例如,装置或程序)来实现。例如,可以以适当的硬件、软件和固件来实现装置。所述方法可以在例如处理器中实现,所述处理器通常指处理设备,这其中包括例如计算机、微处理器、集成电路或可编程逻辑设备。处理器还包括通信设备,例如计算机、蜂窝电话、便携式/个人数字助理(“PDA”)和便于终端用户之间的信息通信的其他设备。
对“一个实施例”或“一实施例”或“一个实现方式”或“一实现方式”以及其它变化形式的提及意味着结合该实施例描述的特定特征、结构、特性等包含于至少一个实施例中。因此,在本申请中的各个地方出现的短语“在一个实施例中”或“在一实施例中”或“在一个实现方式中”或“在一实现方式中”以及任何其他变型的出现不一定都指同一实施例。
另外,本申请可以涉及“确定”各种信息。确定该信息可以包括例如以下一者或多者:估计该信息、计算该信息、预测该信息或从存储器检索该信息。
此外,本申请可以涉及“访问”各种信息。访问该信息可以包括例如以下一者或多者:接收该信息、检索该信息(例如,从存储器检索该信息)、存储该信息、移动该信息、复制该信息、计算该信息、确定该信息、预测该信息或估计该信息。
另外,本申请可以指“接收”各种信息。如同“访问”一样,接收旨在是广义的术语。接收所述信息可以包括例如以下一者或多者:访问该信息或(例如从存储器)检索该信息。此外,在诸如存储信息、处理信息、发送信息、移动信息、复制信息、擦除信息、计算信息、确定信息、预测信息或估计信息的操作期间,通常以一种方式或另一种方式涉及“接收”。
应当理解,例如在“A/B”、“A和/或B”以及“A和B中的至少一者”的情况下,使用以下“/”、“和/或”以及“中的至少一者”中的任意者旨在涵盖仅对第一列出的选项(A)的选择、或仅对第二列出的选项(B)的选择、或对两个选项(A和B)的选择。作为进一步的示例,在“A、B和/或C”和“A、B和C中的至少一者”的情况下,这样的措词旨在包括仅选择第一个列出的选项(A)、或者仅选择第二个列出的选项(B)、或者仅选择第三个列出的选项(C)、或者仅选择第一个和第二个列出的选项(A和B)、或者仅选择第一个和第三个列出的选项(A和C)、或者仅选择第二个和第三个列出的选项(B和C)、或者选择所有三个选项(A和B和C)。如本领域和相关领域的普通技术人员所清楚的,这可以扩展到所列的多个项目。
此外,如本文所使用的,词语“信号”尤其是指向对应的解码器指示某物。例如,在某些实施例中,编码器发信号发送用于改进的双预测的多个参数中的特定一个参数,例如用于发信号发送块的分区和相关联的权重。这样,在一实施例中,在编码器侧和解码器侧使用相同的参数。因此,例如,编码器可以向解码器发送(显式地用信号发送)特定参数,使得解码器可以使用该相同的特定参数。相反,如果解码器已经具有所述特定参数以及其它参数,则可以使用信令而不进行发送(隐式地用信号发送),以简单地允许解码器知道并选择所述特定参数。通过避免任何实际功能的传输,在各种实施例中实现了比特节省。应当理解,可以以各种方式来实现信令。例如,在各种实施例中,一个或多个语法元素、标志等被用于将信息用信号发送给对应的解码器。虽然前述内容涉及词语“信号”的动词形式,但是词语“信号”在本文中也可以用作名词。
如对于本领域普通技术人员将显而易见的,实现方式可以产生被格式化以携带例如可以被存储或发送的信息的各种信号。该信息可以包括例如用于执行方法的指令,或者由所描述的实现方式之一产生的数据。例如,信号可以被格式化以携带所描述的实施例的比特流。这种信号可以被格式化为例如电磁波(例如,使用频谱的射频部分)或基带信号。所述格式化可以包括例如对数据流进行编码并且利用所编码的数据流对载波进行调制。所述信号携带的信息可以是例如模拟或数字信息。如已知的,所述信号可以通过各种不同的有线或无线链路来传输。所述信号可以存储在处理器可读介质上。
我们描述了多个实施例。这些实施例的特征可以单独提供或以任何组合提供。此外,跨越各种权利要求类别和类型,实施例可以单独或以任意组合包括以下特征、设备或方面中的一者或多者:
·修改在解码器和/或编码器中应用的双预测过程。
·在解码器和/或编码器中应用具有增加的精度的双预测方法。
·在解码器和/或编码器中为双预测方法在同一PU中启用若干权重。
·在解码器和/或编码器中,根据像素相对于PU的分区的边缘的位置,确定双预测方法的PU中的权重。
·在解码器和/或编码器中,根据像素相对于PU的多个分区的边缘的位置,确定双预测方法的PU中的权重。
·在所述信令中插入使所述解码器能够识别供双预测方法使用的PU分区的语法元素,且可选地,插入每一像素的权重。
·基于这些语法元素,选择所述分区和所述权重,以供所述双预测方法在所述解码器处应用。
·使用单预测运动模型来将它们组合成根据所讨论的任何实施例的编码器和/或解码器处的加权双预测。
·包括所描述的语法元素中的一者或多者或其变型的比特流或信号。
·在所述信令中插入使得所述解码器能够以对应于编码器所使用的方式的方式执行运动补偿的语法元素。
·创建和/或发送和/或接收和/或解码包括一个或多个所描述的语法元素或其变型的比特流或信号。
·TV、机顶盒、蜂窝电话、平板电脑或其他电子设备,其根据所描述的任何实施例执行帧间双预测。
·TV、机顶盒、蜂窝电话、平板电脑或其他电子设备,其根据所描述的任何实施例执行帧间双预测,并且显示(例如,使用监视器、屏幕或其他类型的显示器)所得到的图像。
·TV、机顶盒、蜂窝电话、平板电脑或其他电子设备,其调谐(例如,使用调谐器)信道以接收包括所编码的图像的信号,并且根据所描述的任何实施例执行帧间双预测。
·TV、机顶盒、蜂窝电话、平板电脑或其他电子设备,其通过空中接收(例如,使用天线)包括所编码的图像的信号,并且根据所描述的任何实施例在帧间参数中执行双预测。

Claims (14)

1.一种用于视频编码的方法,其包括:
使用第一参考图片获得(1510)图片的块的第一预测值;
使用第二参考图片获得(1510)所述图片的所述块的第二预测值;
使用(1540、1550)所述第一预测值和所述第二预测值来形成双预测帧间预测中的所述图片的所述块的第三预测值,其中所述第三预测值是作为所述第一预测值和所述第二预测值的加权平均值而被获得的;以及
其中所述第三预测值的样本通过将第一权重应用于所述第一预测值的样本并通过将第二权重应用于所述第二预测值的样本而被获得;所述第三预测值的所述样本、所述第一预测值的所述样本和所述第二预测值的所述样本在所述块中共享相同的位置;并且其中所述第一权重和所述第二权重取决于所述样本在所述块中的所述位置。
2.一种用于视频解码的方法,其包括:
使用第一参考图片获得(1510)图片的块的第一预测值;
使用第二参考图片获得(1510)所述图片的所述块的第二预测值;
使用(1540、1550)所述第一预测值和所述第二预测值来形成双预测帧间预测中的所述图片的所述块的第三预测值,其中所述第三预测值是作为所述第一预测值和所述第二预测值的加权平均值而被获得的;以及
其中所述第三预测值的样本通过将第一权重应用于所述第一预测值的样本并通过将第二权重应用于所述第二预测值的样本而被获得;所述第三预测值的所述样本、所述第一预测值的所述样本和所述第二预测值的所述样本在所述块中共享相同的位置;并且其中第一权重和第二权重取决于所述样本在所述块中的所述位置。
3.一种用于视频编码的设备,其包括:
一个或多个处理器,其中所述一个或多个处理器被配置为:
使用第一参考图片获得图片的块的第一预测值;
使用第二参考图片获得所述图片的所述块的第二预测值;
使用所述第一预测值和所述第二预测值来形成双预测帧间预测中所述图片的所述块的第三预测值,其中所述第三预测值是作为所述第一预测值和所述第二预测值的加权平均值而被获得的;以及
其中所述第三预测值的样本通过将第一权重应用于所述第一预测值的样本并通过将第二权重应用于所述第二预测值的样本而被获得;所述第三预测值的所述样本、所述第一预测值的所述样本和所述第二预测值的所述样本在所述块中共享相同的位置;并且其中所述第一权重和所述第二权重取决于所述块中的所述样本的所述位置。
4.一种用于视频解码的设备,其包括:
一个或多个处理器,其中所述一个或多个处理器被配置为:
使用第一参考图片获得图片的块的第一预测值;
使用第二参考图片获得所述图片的所述块的第二预测值;
使用所述第一预测值和所述第二预测值来形成双预测帧间预测中所述图片的所述块的第三预测值,其中所述第三预测值是作为所述第一预测值和所述第二预测值的加权平均值而获得的;以及
其中所述第三预测值的样本通过将第一权重应用于所述第一预测值的样本并通过将第二权重应用于所述第二预测值的样本而被获得;所述第三预测值的所述样本、所述第一预测值的所述样本和所述第二预测值的所述样本在所述块中共享相同的位置;并且其中所述第一权重和所述第二权重取决于所述块中的所述样本的所述位置。
5.根据权利要求1或2所述的方法,或根据权利要求3或4所述的装置,其中所述第一预测值和所述第二预测值的所述加权平均值在一大于或等于所述第一预测值、第二预测值和第三预测值的比特深度的比特深度上被处理。
6.根据权利要求1、2和5中任一项所述的方法,或根据权利要求3-5中任一项所述的装置,其中一指示利用三角形分区对所述图片的所述块进行分割的第一信息被获得,所述第一权重和所述第二权重取决于所述样本与所述块的所述三角形分区的边缘之间的距离。
7.根据权利要求6所述的方法或根据权利要求6所述的装置,其中一指示指示所述图片的所述块的所述三角形分区的所述边缘的方向的第二信息被获得。
8.根据权利要求6或7所述的方法,或根据权利要求6或7所述的装置,其中一指示所述块中所述三角形分区的所述边缘的位置的第三信息被获得。
9.根据权利要求6、7和8中任一项所述的方法,或根据权利要求6、7和8中任一项所述的装置,其中一指示所述三角形分区的所述边缘在所述块中是垂直或水平的第四信息被获得。
10.根据权利要求6-9中任一项所述的方法或根据权利要求6-9中任一项所述的装置,其中所述第一信息、第二信息、第三信息或第四信息中的至少一者被熵编码或熵解码。
11.根据权利要求1、2和5-10中任一项所述的方法,或根据权利要求3-10中任一项所述的装置,其中所述图片的所述块包括亮度分量和两个色度分量,并且其中所述第一权重和所述第二权重进一步取决于所述亮度分量或色度分量。
12.一种非暂时性计算机可读介质,包含根据权利要求3-11中任一项所述的装置或者通过权利要求1、2和4-11中任一项所述的方法生成的数据内容,用于使用处理器进行回放。
13.一种计算机程序产品,包括计算指令,所述计算指令用于在由一个或多个处理器执行时执行根据权利要求1、2和5-11中任一项所述的方法。
14.一种包括所编码的视频的信号,该信号通过执行以下步骤而被形成:
使用第一参考图片获得图片的块的第一预测值;
使用第二参考图片获得所述图片的所述块的第二预测值;
使用所述第一预测值和所述第二预测值来形成双预测帧间预测中所述图片的所述块的第三预测值,其中所述第三预测值是作为所述第一预测值和所述第二预测值的加权平均值而被获得的;以及
其中所述第三预测值的样本通过将第一权重应用于所述第一预测值的样本并通过将第二权重应用于所述第二预测值的样本而被获得;所述第三预测值的所述样本、所述第一预测值的所述样本和所述第二预测值的所述样本在所述块中共享相同的位置;并且其中第一权重和第二权重取决于所述块中的所述样本的所述位置。
CN201980060122.0A 2018-09-21 2019-09-18 使用双预测进行视频编码和解码的方法和装置 Pending CN112740674A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18306231.4 2018-09-21
EP18306231 2018-09-21
PCT/US2019/051653 WO2020061147A1 (en) 2018-09-21 2019-09-18 Method and apparatus for video encoding and decoding using bi-prediction

Publications (1)

Publication Number Publication Date
CN112740674A true CN112740674A (zh) 2021-04-30

Family

ID=67436823

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980060122.0A Pending CN112740674A (zh) 2018-09-21 2019-09-18 使用双预测进行视频编码和解码的方法和装置

Country Status (7)

Country Link
US (2) US11677976B2 (zh)
EP (1) EP3854079A1 (zh)
JP (1) JP7502278B2 (zh)
KR (1) KR20210062055A (zh)
CN (1) CN112740674A (zh)
IL (1) IL281533A (zh)
WO (1) WO2020061147A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020073920A1 (en) * 2018-10-10 2020-04-16 Mediatek Inc. Methods and apparatuses of combining multiple predictors for block prediction in video coding systems
CN111418205B (zh) 2018-11-06 2024-06-21 北京字节跳动网络技术有限公司 用于帧间预测的运动候选
JP7451873B2 (ja) * 2019-03-08 2024-03-19 株式会社Jvcケンウッド 画像符号化装置、画像符号化方法及び画像符号化プログラム
EP4262202A1 (en) * 2022-04-13 2023-10-18 Panasonic Intellectual Property Corporation of America Encoder, decoder, encoding method, and decoding method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013068566A1 (en) * 2011-11-11 2013-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Adaptive partition coding
CN107710762A (zh) * 2015-06-19 2018-02-16 诺基亚技术有限公司 用于视频编码和解码的装置、方法、以及计算机程序

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9497473B2 (en) * 2013-10-03 2016-11-15 Qualcomm Incorporated High precision explicit weighted prediction for video coding
US9986236B1 (en) 2013-11-19 2018-05-29 Google Llc Method and apparatus for encoding a block using a partitioned block and weighted prediction values
JP2015192381A (ja) * 2014-03-28 2015-11-02 ソニー株式会社 画像処理装置及び画像処理方法
WO2016138513A1 (en) * 2015-02-27 2016-09-01 Arris Enterprises, Inc. Modification of unification of intra block copy and inter signaling related syntax and semantics
KR20210049822A (ko) 2018-09-07 2021-05-06 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 비디오 코딩 시스템 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013068566A1 (en) * 2011-11-11 2013-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Adaptive partition coding
CN107710762A (zh) * 2015-06-19 2018-02-16 诺基亚技术有限公司 用于视频编码和解码的装置、方法、以及计算机程序

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
RU-LING LIAO: "CE10: Triangular prediction unit mode (CE10.3.1 and CE10.3.2)(JVET-K0144-v2)", 《JOINT VIDEO EXPLORATION TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 11TH MEETING: LJUBLJANA, SI, 10–18 JUL. 2018》, pages 1 - 6 *
TADAMASA TOMA: "Description of SDR video coding technology proposal by Panasonic(JVET-J0020-v1)", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 10TH MEETING: SAN DIEGO, US, 10–20 APR. 2018》, pages 1 - 73 *
YONGJO AHN: "CE10-related: Diagonal motion partitions on top of MTT block structure(JVET-K0270)", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 11TH MEETING: LJUBLJANA, SI, 10–18 JULY 2018》, pages 1 - 9 *

Also Published As

Publication number Publication date
IL281533A (en) 2021-05-31
US11677976B2 (en) 2023-06-13
WO2020061147A8 (en) 2021-04-22
US20210352320A1 (en) 2021-11-11
JP7502278B2 (ja) 2024-06-18
KR20210062055A (ko) 2021-05-28
JP2022502905A (ja) 2022-01-11
WO2020061147A1 (en) 2020-03-26
US20230362405A1 (en) 2023-11-09
EP3854079A1 (en) 2021-07-28

Similar Documents

Publication Publication Date Title
US20230164314A1 (en) Method and apparatus for deblocking an image
CN113170146A (zh) 用于图片编码和解码的方法和设备
JP7502278B2 (ja) 双予測を使用するビデオエンコーディングおよびデコーディングのための方法および装置
CN112889287A (zh) 广义双向预测和加权预测
US20230232037A1 (en) Unified process and syntax for generalized prediction in video coding/decoding
WO2020096898A1 (en) Video encoding or decoding using block extension for overlapped block motion compensation
CN112771874A (zh) 用于画面编码和解码的方法和设备
CN117597933A (zh) 空间局部光照补偿
KR20220123666A (ko) 가중-예측 파라미터들의 추정
CN113875253A (zh) 用于利用光流基于边界平滑的运动补偿进行视频编码和解码的方法和装置
US20240171731A1 (en) Geometric partitions with switchable interpolation filter
US20230023837A1 (en) Subblock merge candidates in triangle merge mode
CN114208194A (zh) 用于视频编码和解码的帧间预测参数推导
CN113424540A (zh) 帧内预测模式扩展
KR20220052991A (ko) 스위칭가능한 보간 필터들
CN114270829A (zh) 局部照明补偿标志继承
WO2024078896A1 (en) Template type selection for video coding and decoding
WO2024033116A1 (en) Geometric partition mode boundary prediction
KR20240056576A (ko) 템플릿 매칭에 기초한 비디오 인코딩 및 디코딩을 위한 크로마 예측
WO2023194106A1 (en) Motion information parameters propagation based on intra prediction direction
CN114073093A (zh) 三角形分割的合并索引的信令通知
CN118120228A (zh) 基于模板匹配的用于视频编码和解码的色度预测
KR20220061137A (ko) 비디오 코딩을 위한 코딩 모드 정보 전파
CN114097235A (zh) 用于仿射和sbtmvp运动矢量预测模式的hmvc
CN112806013A (zh) 仿射模式下基于块大小的运动矢量编码

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination