CN114270844A - 用于视频编码和解码的运动向量处理 - Google Patents

用于视频编码和解码的运动向量处理 Download PDF

Info

Publication number
CN114270844A
CN114270844A CN202080054531.2A CN202080054531A CN114270844A CN 114270844 A CN114270844 A CN 114270844A CN 202080054531 A CN202080054531 A CN 202080054531A CN 114270844 A CN114270844 A CN 114270844A
Authority
CN
China
Prior art keywords
motion vector
precision
level
information
coding mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080054531.2A
Other languages
English (en)
Inventor
F·莱莱昂内克
A·罗伯特
F·加尔平
T·波里尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Interactive Digital Vc Holdings France Ltd
Original Assignee
Interactive Digital Vc Holdings France Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Interactive Digital Vc Holdings France Ltd filed Critical Interactive Digital Vc Holdings France Ltd
Publication of CN114270844A publication Critical patent/CN114270844A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/521Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

对图片信息进行编码或解码可涉及确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式确定与运动向量信息的第一部分相关联的第一精度等级,及与所述运动向量信息的第二部分相关联的第二精度等级,其中所述运动向量信息与所述当前译码单元相关联;基于所述运动向量信息、以及所述第一精度等级和所述第二精度等级,获得与所述当前译码单元相关联的运动向量;以及基于译码模式和运动向量,对包括在所述当前译码单元中的所述图片信息的至少一部分进行编码或解码。

Description

用于视频编码和解码的运动向量处理
技术领域
本公开涉及视频编码和解码。
背景技术
为了实现高压缩效率,图像和视频译码方案通常采用预测和变换以利用视频内容中的空间和时间冗余。通常,帧内或帧间预测用于利用帧内或帧间相关性,然后对通常表示为预测误差或预测残差的原始图片块与预测图片块之间的差异进行变换、量化和熵译码。预测过程的一方面可以涉及基于运动向量的运动补偿时间预测,如下面进一步解释的。为了重构视频,通过与预测、变换、量化和熵译码对应的逆处理来解码压缩数据。
发明内容
一般来说,实施例的示例可以涉及一种方法,该方法包括:确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与运动向量信息的第一部分相关联的第一精度等级,及与所述运动向量信息的第二部分相关联的第二精度等级,其中所述运动向量信息与所述当前译码单元相关联;基于所述运动向量信息、以及所述第一精度等级和所述第二精度等级,获得与所述当前译码单元相关联的运动向量;以及基于所述译码模式和所述运动向量,对包括在所述当前译码单元中的图片信息的至少一部分进行解码。
一般来说,实施例的另一示例可涉及一种方法,所述方法包括:确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与运动向量信息的第一部分相关联的第一精度等级,及与所述运动向量信息的第二部分相关联的第二精度等级,其中所述运动向量信息与所述当前译码单元相关联;基于所述运动向量信息、以及所述第一精度等级和所述第二精度等级,获得与所述当前译码单元相关联的运动向量;以及基于所述译码模式和所述运动向量,对所述图片信息的至少一部分进行编码。
一般来说,实施例的另一示例可涉及包括一个或多个处理器的装置,所述一个或多个处理器被配置为确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与运动向量信息的第一部分相关联的第一精度等级,及与所述运动向量信息的第二部分相关联的第二精度等级,其中所述运动向量信息与所述当前译码单元相关联;基于所述运动向量信息、以及所述第一精度等级和所述第二精度等级,获得与所述当前译码单元相关联的运动向量;以及基于所述译码模式和所述运动向量,对所述图片信息的至少一部分进行解码。
一般来说,实施例的另一示例可涉及包括一个或多个处理器的装置,所述一个或多个处理器被配置为确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与运动向量信息的第一部分相关联的第一精度等级,及与所述运动向量信息的第二部分相关联的第二精度等级,其中所述运动向量信息与所述当前译码单元相关联;基于所述运动向量信息、以及所述第一精度等级和所述第二精度等级,获得与图片信息的译码单元相关联的运动向量;以及基于所述译码模式和所述运动向量,对所述图片信息的至少一部分进行编码。
一般来说,实施例的另一示例可涉及一种方法,所述方法包括:确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与运动向量残差的第一分量相关联的第一精度等级及与所述运动向量残差的第二分量相关联的第二精度等级,所述运动向量残差与所述当前译码单元相关联;基于所述运动向量残差、以及所述第一精度等级和所述第二精度等级,获得与所述当前译码单元相关联的运动向量;以及基于所述译码模式和所述运动向量,对包括在所述当前译码单元中的图片信息的至少一部分进行解码。
一般来说,实施例的另一示例可涉及一种方法,所述方法包括:确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与运动向量残差的第一分量相关联的第一精度等级及与所述运动向量残差的第二分量相关联的第二精度等级,所述运动向量残差与所述当前译码单元相关联;基于所述运动向量残差、以及所述第一精度等级和所述第二精度等级,获得与所述当前译码单元相关联的运动向量;以及基于所述译码模式和所述运动向量,对所述图片信息的至少一部分进行编码。
一般来说,实施例的另一示例可涉及包括一个或多个处理器的装置,所述一个或多个处理器被配置为确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与运动向量残差的第一分量相关联的第一精度等级,以及与所述运动向量残差的第二分量相关联的第二精度等级,所述运动向量残差与所述当前译码单元相关联;基于所述运动向量残差、以及所述第一精度等级和所述第二精度等级,获得与所述当前译码单元相关联的运动向量;以及基于所述译码模式和所述运动向量,对所述图片信息的至少一部分进行解码。
一般来说,实施例的另一示例可涉及包括一个或多个处理器的装置,所述一个或多个处理器被配置为确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与运动向量残差的第一分量相关联的第一精度等级,以及与所述运动向量残差的第二分量相关联的第二精度等级,所述运动向量残差与所述当前译码单元相关联;基于所述运动向量残差、以及所述第一精度等级和所述第二精度等级,获得与图片信息的译码单元相关联的运动向量;以及基于所述译码模式和所述运动向量,对所述图片信息的至少一部分进行编码。
一般来说,实施例的另一示例可涉及一种方法,所述方法包括:确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与对应于第一参考图片列表的第一运动向量残差相关联的第一精度等级,以及与对应于第二参考图片列表的第二运动向量残差相关联的第二精度等级;基于所述第一运动向量残差和所述第一精度等级,获得第一运动向量,且基于所述第二运动向量残差和所述第二精度等级,获得第二运动向量;以及基于所述译码模式、以及所述第一运动向量和所述第二运动向量,对所述图片信息的至少一部分进行解码。
一般来说,实施例的另一示例可涉及一种方法,所述方法包括:确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式确定与对应于第一参考图片列表的第一运动向量残差相关联的第一精度等级,以及与对应于第二参考图片列表的第二运动向量残差相关联的第二精度等级;基于所述第一运动向量残差和所述第一精度等级,获得第一运动向量,且基于所述第二运动向量残差和所述第二精度等级,获得第二运动向量;以及基于所述译码模式以及所述第一和第二运动向量,对所述图片信息的至少一部分进行编码。
一般来说,实施例的另一示例可涉及包括一个或多个处理器的装置,所述一个或多个处理器被配置为确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与对应于第一参考图片列表的第一运动向量残差相关联的第一精度等级,以及与对应于第二参考图片列表的第二运动向量残差相关联的第二精度等级;基于所述第一运动向量残差和所述第一精度等级,获得第一运动向量,且基于所述第二运动向量残差和所述第二精度等级,获得第二运动向量;以及基于所述译码模式、以及所述第一运动向量和所述第二运动向量,对所述图片信息的至少一部分进行解码。
一般来说,实施例的另一示例可涉及包括一个或多个处理器的装置,所述一个或多个处理器被配置为确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与对应于第一参考图片列表的第一运动向量残差相关联的第一精度等级,以及与对应于第二参考图片列表的第二运动向量残差相关联的第二精度等级;基于所述第一运动向量残差和所述第一精度等级,获得第一运动向量,且基于所述第二运动向量残差和所述第二精度等级,获得第二运动向量;以及基于所述译码模式、以及所述第一运动向量和所述第二运动向量,对所述图片信息的至少一部分进行编码。
一般来说,实施例的另一示例可涉及被格式化以包含编码的图片信息的比特流,其中通过基于根据本发明的方法的实施例的实例中的任何一者或一者以上处理所述图片信息来编码所述经编码图片信息。
通常,实施例的一个或多个其它示例还可以提供计算机可读存储介质,例如,非易失性计算机可读存储介质,其上存储有用于根据本文描述的方法或装置对诸如视频数据的图片信息进行编码或解码的指令。一个或多个实施例还可以提供一种计算机可读存储介质,其上存储有根据本文描述的方法或装置生成的比特流。一个或多个实施例还可以提供用于发送或接收根据本文描述的方法或装置生成的比特流的方法和装置。
如以下所解释的,构想了各种修改和实施例,其可提供对视频编码和/或解码系统的改进,包括但不限于增加的压缩效率和/或译码效率和/或处理效率和/或降低的复杂度中的一个或多个。
以上给出了本主题的简化概述,以便提供对本公开的一些方面的基本理解。本概述不是对本主题的详尽综述。其并非旨在标识各实施例的关键/重要元素或描绘本主题的范围。其唯一目的是以简化形式呈现本主题的一些概念,作为以下提供的更详细描述的序言。
附图说明
通过结合附图考虑下面的详细描述,可以更好地理解本公开,其中:
图1提供描绘视频编码器的实施例的示例的框图;
图2提供描绘视频解码器的实施例的示例的框图;
图3示出了可以用于表示压缩图片的译码树单元(CTU)和译码树概念;
图4示出了译码树单元(CTU)和CTU到译码单元(CU)、预测单元(PU)和变换单元(TU)的划分;
图5示出了在诸如VVC草案5的AMVP模式中的空间和时间运动向量预测候选的示例;
图6示出了在诸如VVC草案5的AMVP模式中的运动向量预测候选的计算;
图7示出了仿射运动模型的实例;
图8示出了基于4×4子CU的仿射运动向量场的实例;
图9示出了空间位置(A0、A1、B0、B1和B2)的示例,从这些空间位置检索CPVM预测候选以在仿射AMVP模式(诸如VTM草案3的模式)下预测当前CU的仿射模型;
图10示出了用于诸如VTM的仿射AMVP CU的运动向量预测处理;
图11说明了在仿射AMVP模式下构建CPVMP候选列表的示例;
图12至图27示出了根据本公开的各个方面、实施例和特征的示例;
图28提供了示出根据本文描述的各个方面和实施例的装置的实施例的示例的框图;
图29示出了根据本公开的实施例的示例;以及
图30示出了根据本公开的实施例的另一示例。
应当理解,附图是为了说明各个方面和实施例的示例的目的,并且不一定是唯一可能的配置。在所有附图中,相同的参考标记表示相同或相似的特征。
具体实施方式
在附图中,图1示出了视频编码器100的示例,例如HEVC编码器。HEVC是由视频编码 联合合作组(JCT-VC)开发的压缩标准(参见,例如,“ITU-T H.265 ITU的电信标准段(10/2014),系列H:视听和多媒体系统,视听服务的基础设施-运动视频的译码、高效率视频译码、ITU-T H.265建议书”)。图1还可示出其中对HEVC标准作出改进的编码器或采用类似于HEVC的技术的编码器,例如基于或改进于由联合视频专家组(JVET)开发的JEM(联合探索模型)的编码器,例如,与开发工作指定的通用视频译码(VVC)相关联。
在本申请中,术语“重构”和“解码”可以互换使用,术语“像素”和“样本”可以互换使用,并且术语“图片”和“帧”可以互换使用。
HEVC规范在“块”与“单元”之间进行区分,其中“块”寻址样本阵列中的特定区域(例如,亮度、Y),而“单元”包含所有编码的颜色分量(Y、Cb、Cr或单色)的共位块、语法元素及与所述块相关联的预测数据(例如,运动向量)。
为了译码,将图片划分为具有可配置大小的正方形的译码树块(CTB),并且将译码树块的连续集合分组为片。译码树单元(CTU)包含编码的颜色分量的CTB。CTB是将四叉树划分成译码块(CB)的根,且译码块可划分成一个或一个以上预测块(PB)且形成将四叉树划分成变换块(TB)的根。对应于译码块、预测块和变换块,译码单元(CU)包括预测单元(PU)和变换单元(TU)的树结构集合,PU包括所有颜色分量的预测信息,并且TU包括每个颜色分量的残差译码语法结构。亮度分量的CB、PB和TB的大小适用于相应的CU、PU和TU。在本申请中,术语“块”可以用于表示CTU、CU、PU、TU、CB、PB和TB中的任何一者。另外,“块”也可以用于指代如H.264/AVC或其他视频编码标准中指定的宏块和分区,并且更一般地指代各种大小的数据阵列。
在图1的编码器100中,如下所述,由编码器元件对图片进行编码。在输入处提供要编码的图片信息,并且对其进行映射(101)和图像划分(102)。映射(101)通常应用于每个样本,并将1D函数应用于输入样本值以将其转换为其它样本值。例如,1D函数可以扩展采样值范围,并且提供码字在码字范围上的更佳分布。图像划分(102)将图像分割成不同大小和形状的块,以便优化速率-失真折衷。映射和划分使得能够如上所述以CU为单位处理图片信息。每一CU是使用帧内或帧间模式编码的。当CU以帧内模式编码时,其执行帧内预测(160)。在帧间模式中,执行运动估计(175)和补偿(170)。编码器决定(105)将帧内模式或帧间模式中哪一者用于编码CU,并且通过预测模式标志来指示帧内/帧间决定。帧内或帧间预测决定(105)之后是前向映射(191)以产生预测块。通常,前向映射处理(191)类似于映射(101)并且可以与映射互补。通过从原始图像块中减去(110)预测块来计算预测残差。
然后,对预测残差进行变换(125)和量化(130)。对量化的变换系数以及运动向量和其它语法元素进行熵译码(145)以输出比特流。编码器也可跳过变换,并在4×4 TU的基础上直接对未变换的残差信号应用量化。编码器还可以绕过变换和量化,即,直接对残差进行译码而不应用变换或量化过程。在直接PCM译码中,不应用预测,并且编码单元样本被直接译码到比特流中。
编码器对编码块进行解码,以提供用于进一步预测的参考。对量化变换系数进行去量化(140)和逆变换(150)以对预测残差进行解码。组合(155)解码的预测残差和预测块,重构图被像块。环内滤波器(165)被应用于重构的图像,例如,执行去块/SAO(采样自适应偏移)滤波以减少编码伪像。逆映射(190)是正向映射(191)的逆。将滤波图像存储在参考图片缓冲器(180)中。
图2示出例如HEVC解码器等视频解码器200的示例的框图。在示例解码器200中,信号或比特流由如下所述的解码器元件解码。视频解码器200通常执行与如图1中所描述的编码回合互逆的解码回合,其执行视频解码作为编码视频数据的部分。图2还可示出其中对HEVC标准作出改进的解码器或采用类似于HEVC的技术的解码器,例如基于JEM或在JEM上改进的解码器。
具体地,解码器的输入包括可以由诸如图1的视频编码器100的视频编码器生成的视频信号或比特流。所述信号或比特流首先被熵解码(230),随后被划分(210)以获得变换系数、运动向量和其它译码信息。划分(210)基于解码的数据将图像划分为不同大小和形状的块。变换系数被去量化(240)和逆变换(250)以解码预测残差。将解码的预测残差与预测块进行组合(255),图像块被重构。预测块可以从帧内预测(260)或运动补偿预测(即,帧间预测)(275)获得(270)。高级运动向量预测(AMVP)和合并模式技术可用于导出用于运动补偿的运动向量,其可使用内插滤波器来计算参考块的子整数样本的内插值。环内滤波器(265)被应用于重构的图像。将滤波图像存储在参考图片缓冲器(280)中。
在HEVC视频压缩标准中,采用运动补偿时间预测来利用存在于视频的连续图像之间的冗余。为此,将运动向量与每一预测单元(PU)相关联。每个译码树单元(CTU)由压缩域中的译码树(CT)表示。这是CTU的四叉树划分,其中每个叶被称为译码单元(CU),如图3中所示。
然后,每个CU被给予一些帧内或帧间预测参数或预测信息(预测信息)。为此,CU在空间上被划分成一个或一个以上预测单元(PU),每一PU被指派一些预测信息。如图4所示,在CU级上分配帧内或帧间译码模式,其示出了将译码树单元划分为译码单元、预测单元和变换单元的示例。为了对CU进行译码,从相邻的重构样本(帧内预测)或从存储在解码图片缓冲器(DPB)中的先前重构图片(帧间预测)构建预测块或预测单元(PU)。接下来,对作为原始样本和PU样本之间的差而计算的残差样本进行变换和量化。
确切地,一个运动向量(MV)被分配给HEVC中的每个PU。该运动向量用于所考虑的PU的运动补偿时间预测。因此,在HEVC中,链接预测块及其参考块的运动模型简单地包括平移。
HEVC中采用两种模式来编码运动数据。它们分别被称为AMVP(自适应运动向量预测)和合并(Merge)。AMVP基本上涉及用信号发送用于预测当前PU的参考图片(一个或多个)、运动向量预测值(predictor)索引(在两个预测值的列表中取得)和运动向量差。合并模式涉及用信号发送和解码收集在运动数据预测值的列表中的一些运动数据的索引。该列表由六个候选组成,并且在解码器和编码器侧以相同的方式构造。因此,合并模式旨在导出从合并列表中取得的一些运动信息。合并列表通常包含与一些空间和时间周围块相关联的运动信息,当当前PU正在被处理时,这些块在它们的解码状态中可用。
除了HEVC之外的编解码器和视频压缩工具,例如联合探索模型(JEM)和由JVET(联合视频探索团队)小组在被称为VVC测试模型(VTM)的通用视频译码(VVC)参考软件中开发的编解码器和视频压缩工具,可以提供与HEVC的模式和特征不同的或除了HEVC的模式和特征之外的各种模式和特征。例如,将以非限制性方式关于VVC草案5来解释本公开的一个或多个方面。也就是说,在VVC草案5的上下文中的解释仅仅是为了便于解释。本文描述的方面和实施例可以应用于其他环境,例如其他标准、应用、硬件、软件等。
对于HEVC,VVC草案5的AMVP模式涉及可用于在AMVP模式中预测CU的运动信息的两个运动向量预测候选。在VVC草案5的AMVP模式中可用的空间和时间运动向量预测候选在图5中示出。然而,构建AMVP候者的集合的过程稍有不同。首先,执行将所计算的候选舍入到与当前CU相关联的运动向量分辨率。这涉及VVC草案5的自适应运动向量分辨率(AMVR)工具,下面将进一步讨论。此外,在TMVP候选之后考虑作为基于历史的运动向量预测值(HMVP)的附加候选者,以填充AMVP候选列表。图6中示出了所描述的过程,其示出了在VVC草案5的AMVP模式下计算运动向量预测候选的示例。如可以看到的,在AMVP候选列表构建过程中,在时间运动向量预测值(TMVP)之后考虑HMVP候选。还可以注意到,在图6的处理的最后步骤,AMVP中构建的运动向量预测值候选被舍入到与AMVR(自适应运动向量分辨率)相关联的精度等级,其中AMVR与当前正在处理的译码单元相关联。VVC的AMVR译码工具将在下面进一步讨论。
如上所述,除了HEVC之外的编解码器和视频压缩工具可以提供不同的或附加的特征。例如,VVC草案5支持HEVC的平移模型之外的附加运动模型,以提供改进的时间预测。为了促进这种附加模型,PU可以在空间上被划分为子PU,并且更鲁棒的模型可以用于向每个PU分配专用的运动向量。举例来说,在VVC中引入的运动模型是仿射运动补偿,其涉及使用仿射模型来表示CU中的运动向量。
图7示出了用于两个控制点(图7的左侧)或三个控制点(图7的右侧)的运动模型。两个控制点的仿射运动场(也称为4参数仿射模型)涉及所考虑的块内的每个位置(x,y)的以下运动向量分量值:
Figure BDA0003492189880000111
等式1:4参数仿射模型,用于在CU内产生运动场以进行预测
其中(v0x,v0y)和(v1x,v1y)是用于产生仿射运动场的所谓的控制点运动向量,(v0x,v0y)是运动向量左上角控制点,且(v1x,v1y)是运动向量右上角控制点。
等式1可基于如由等式3定义的仿射模型参数a和b而被重写为等式2:
Figure BDA0003492189880000121
等式2:4参数仿射模型,用于表示以4参数仿射模式译码的CU的基于子块的运动场
Figure BDA0003492189880000122
等式3:用于4参数仿射模型的仿射模型参数
具有三个控制点的模型(称为6参数仿射运动模型)也可用于表示给定译码单元的基于子块的运动场。在6参数仿射模型的情况下,如等式4、5和6中那样计算运动场:
Figure BDA0003492189880000123
等式4:6参数仿射运动场,用于表示以6参数仿射模式译码的CU的基于子块的运动场
Figure BDA0003492189880000124
等式5:6参数仿射运动场的替换表示
Figure BDA0003492189880000125
等式6:用于6参数仿射模型的仿射模型参数
实际上,为了保持复杂性合理,针对所考虑CU的4×4子块(子CU)的每一样本计算相同的运动向量,如图8中所示出,其展示用于两个控制点模型(图8的左侧)和三个控制点模型(图8的右侧)的基于4×4子CU的仿射运动向量场。在每个子块的中心位置处,根据控制点运动向量计算仿射运动向量。获得的运动向量(MV)以1/16像素精度表示。
在VVC草案5中,可在仿射AMVP模式下预测具有大于8x8的大小的CU。这通过在CU级译码的比特流中的标志来用信号通知。用于所述帧间CU的仿射运动场的产生包含确定控制点运动向量(CPMV),其由解码器通过运动向量差加控制点运动向量预测(CPMVP)的相加而获得。CPMVP是用作当前CU的CPMV的预测值的运动向量对(对于由2个控制点运动向量指定的4参数仿射模型)或三元组(对于由3个控制点运动向量指定的6参数仿射模型)。
当前CU的CPMVP可从仿射相邻CU继承(如在仿射合并模式中)。图9示出了从中检索继承的CPMVP的空间位置,图9展示了空间位置(A0、A1、B0、B1和B2),从中检索CPMV预测候选以在例如VTM草案3中的仿射AMVP下预测当前CU的仿射模型。如果继承的CPMVP的参考图像等于当前CU的参考图像,则认为其有效。
仿射AMVP候选还可根据非仿射运动向量构造。这是通过分别在每个集合(A,B,C)和(D,E)和/或(F,G)中采用运动向量预测值来实现的,如图10所示,其示出了用于诸如VTM中的仿射AMVP CU的运动向量预测。图11中示出了构造仿射AMVP中的CPVMP候选列表的更详细的示例。
运动补偿工具的另一示例是包含在VVC草案5中可用的帧内块复制工具(IBC)。它是涉及向所考虑的CU分派所谓的块向量的CU级帧内译码模式。块向量指示当前CU与参考块之间的位移,所述参考块是当前图片内的样本的已重构构块。
VVC草案5的自适应运动向量分辨率(AMVR)译码工具提供了用于以各种准确度(或精度,或分辨率)等级用信号通知CU的运动向量和其运动向量预测值之间的运动向量差(MVd)的装置。在HEVC中,片报头标识(use_integer_mv_flag)指示MVd是以四分之一像素准确度还是以整数像素准确度译码。这意味着所考虑的片中的所有CU以相同MVd精度等级进行译码/解码。在VVC草案5中,可以用信号通知一些CU级信息以指示CU的MVd信息的分辨率。AMVR可以应用于以正常AMVP或仿射AMVP模式译码的CU。
在正常AMVP模式中,所支持的MVd分辨率等级是四分之一亮度样本、整数亮度样本或四亮度样本。在仿射AMVP模式中,所支持的MVd分辨率等级是四分之一亮度样本、整数亮度样本或1/16亮度样本。关于CU层级的AMVR信息的信令涉及第一标志,其指示针对MVd信息使用四分之一亮度样本准确度。如果不使用四分之一亮度样本精度,那么第二标志指示在正常AMVP模式中使用整数亮度样本或4亮度样本准确度等级。在仿射AMVP模式的情况下,第二标志指示整数亮度样本或1/16亮度样本准确度等级的使用。最后,如图6中所示的示例所示,将运动向量预测值舍入到与MVd的AMVR精度相同的AMVR精度,以确保重构的运动向量具有期望的精度等级。
关于IBC(帧内块复制)帧内译码模式,根据针对IBC译码CU用信号通知的amvr_precision_flag,运动向量精度可为1亮度样本分辨率或4亮度样本分辨率。
图12示出了根据VVC草案5在AMVP和AMVR模式下的CU的运动信息的重构的实例,更具体来说,图12中所示的示例示出用于重构将在翻译AMVP模式(与仿射AMVP模式相对)下译码的输入CU的运动向量的过程,其中AMVR对于此CU是活动的。这个过程发生在解码器侧。该过程的输入是已经解析的译码单元。
图12中所示出的过程开始于测试当前CU是否采用根据L0参考图片列表中所含有的参考图片的时间预测。如果是,则应用以下四个步骤。
-应用AMVR处理的相反处理。这涉及将与L0参考图片相关联的解析的MVd(运动向量差)转换为由解码器用来表示运动数据的内部精度。
-下一步骤涉及计算当前CU的参考图片L0的AMVP候选列表。这遵循已经参考图6解释的过程。一旦完成此操作,当前参考图片列表中的当前CU的运动向量预测值是已知的且被记录为AMVPCand[mvpIdxL0],其中mvpIdxL0是用于当前CU的MV预测值候选的索引,且其是从解析过程产生的。
-下一步骤将当前参考图片列表中的当前CU的运动向量重构为MV预测值与解析的运动向量差的和。
-接下来,在所考虑的编解码器中根据运动向量的内部表示来修剪重构的运动向量。
所述过程的下一步骤测试当前块是否采用根据参考图片列表L1中所含有的参考图片的时间预测。如果是,则应用与上述相同的过程,但是在参考图像列表L1的情况下。作为图12的过程的结果,获得两个重构的运动向量MVL0和MVL1以用于当前帧间CU,且随后用于当前CU的运动补偿时间预测。
一般来说,本公开的一个方面涉及提高诸如上述VVC草案5的方法的压缩效率,例如,由AMVR工具提供的译码增益。例如,VVC草案5的现有AMVR工具涉及通常为x和y坐标选择MVd译码的分辨率等级。通常,本文所述的实施例的至少一个示例在AMVR工具中提供了增加的灵活性。作为实例,至少一个实施例提供译码的运动向量差(MVd)的x值与y值之间的不同准确度等级。作为另一示例,在双预测译码单元的情况下,至少一个实施例提供L0和L1运动向量差译码之间的不同准确度等级。
一般来说,本文描述的实施例(本文中称为实施例1)的至少一个实例涉及在IBC译码的译码单元的情况下对块向量的两个分量的分辨率进行区分。
图13中示出了对以IBC模式译码的CU的运动数据的解析的示例,其涉及解析当前CU的MVd(运动向量差),接着解析与当前CU相关联的标志(例如,指定为mvp_l0_flag的标志)指示使用哪一MV预测值来译码当前CU的块向量。如果对于当前CU,AMVR是允许的,则解析与当前CU关联的标志,例如,指定为amvr_precision_flag的标志,以获得默认1亮度样本MV分辨率是否用于当前CU或者是否使用4亮度像素分辨率的指示。
图14示出了根据VVC草案5以IBC模式编码的CU的运动数据的解码器重构的示例。图14中的示例包括应用解码器侧AMVR过程:通过将当前CU的解析的MVd向量从译码的AMVR精度等级转换为用于运动向量表示的内部精度。然后,通过将用于当前CU的MV预测值与内部精度转换的运动向量差(MVd)相加来重构当前CU的块向量。接着,修剪重构的MV以提供有效的MV表示,例如,根据VVC草案5的有效MV表示。
图15示出了根据本实施例的以IBC模式译码的CU的运动数据的解析的示例。该示例涉及解析当前CU的MVd(运动向量差),然后解析与当前CU相关联的标志,例如指定为mvp_l0_flag的标志,指示哪个运动向量预测值被用于译码当前CU的块向量。然后,在针对当前CU,AMVR是允许的情况下,解析与当前CU相关联的标志,例如,指定为amvr_precision_flag的标志,以获得针对译码的MVd的x或y分量,默认1亮度样本MV分辨率是否用于当前CU或是否使用4亮度像素分辨率的指示。接下来,如果此标志为真且译码的MVd的x分量为非零,那么解析标志,例如,指定为amvr_flag_x的标志,以获得当前MVd的x分量是以默认1亮度样本精度等级还是以4亮度样本精度等级而用信号通信的指示。接下来,在两个标志(例如,amvr_precision_flag和amvr_flag_x)均为真的情况下,接着解析标志(例如,指定为amvr_flag_y的标志)以获得当前MVd的y分量是以默认1亮度样本精度等级还是以4亮度样本精度等级而用信号通知的指示。否则,如果amvr_precision_flag为真并且amvr_flag_x为假,则amvr_flag_y被推断为真。最后,在amvr_precision_flag为假的情况下,amvr_flag_x和amvr_flag_y两者都被推断为假。
图16示出了根据本实施例的以IBC模式译码的CU的运动数据的解码器重构的示例。该示例包括应用解码器侧AMVR过程:通过首先将当前CU的解析的MVd向量的x分量从x分量的译码AMVR精度等级转换到运动向量表示的内部精度。然后,对y分量应用解码器侧AMVR过程:通过将当前CU的解析的MVd向量的y分量从y分量的译码AMVR精度等级转换到运动向量表示的内部精度。然后,通过将用于当前CU的MV预测值与内部精度转换的运动向量差(MVd)相加来重构当前CU的块向量。接着,修剪重构的MV以提供有效的MV表示,例如,根据VVC草案5的有效MV表示。
在附加到本文档的语法结构列表1中示出了适于实现实施例的当前示例(实施例1)的coding_unit语法结构的示例。
一般来说,本文描述的实施例的至少一个其它实例(本文称为实施例2)涉及在平移AMVP运动补偿的情况下x和y运动向量分量的解耦分辨率。
图17示出了对以AMVP模式(例如,根据VVC草案5)译码的CU的AMVR数据的解析,其涉及解析与当前CU相关联的第一标志(例如,指定为amvr_flag的标志),且接着在第一标志为真的情况下,解析与当前CU相关联的第二标志(例如,指定为amvr_precision_flag的标志)。第一标志,例如amvr_flag语法元素,指示是否使用默认的1/4亮度样本精度等级来译码当前CU的MV数据。接着,如果第一标志为真,那么解析与当前CU相关联的第二标志,例如amvr_precision_flag,以指示默认的1亮度样本或4亮度样本MV分辨率是否用于当前CU。
图18中示出了根据本实施例的解析以AMVP模式译码的CU的AMVR数据的实例,且其涉及解析与当前CU相关联的标志,例如,指定为amvr_flag的标志。然后,如果amvr_flag为真并且L0或L1列表MVd的解码x分量为非零,则解析另一标志,例如指定为amvr_flag_x,以指示是否以默认1/4亮度样本精度等级而用信号通知当前MVd的x分量。接下来,如果标志amvr_precision_flag和amvr_flag_x都为真,则解析另一个标志,例如指定为amvr_flag_y的标志,以指示当前MVd的y分量是否以默认1/4亮度样本精度等级而被用信号通知。否则,如果amvr_precision_flag为真并且amvr_flag_x为假,则amvr_flag_y被推断为真。其它情况存在如下:
-如果amvr_precision_flag是假,则amvr_flag_x和amvr_flag_y两者都被推断为假;
-如果amvr_flag为真,则当前CU的amvr_precision_flag指示默认的1亮度样本或4亮度样本MV分辨率是否用于当前CU;
-如果amvr_flag_x为真,则用于MVd的x分量的精度等级是amvr_flag和amvr_precision_flag所指示的精度等级;
-如果amvr_flag_y为真,则用于MVd的y分量的精度等级是amvr_flag和amvr_precision_flag所指示的精度等级。
图19示出了在本实施例中将以平移AMVP模式(与仿射AMVP模式相反)译码的输入CU的运动向量的重构的示例,其中AMVR对于此CU是活动的。这个过程发生在解码器侧。该过程的输入是已经解析的译码单元。
图19中的示例通过测试当前CU是否采用根据L0参考图片列表中所含有的参考图片的时间预测而开始。如果是,则应用以下四个步骤。
-在译码MVd的x分量上应用AMVR处理的逆处理。这包括将与L0参考图片相关联的解析的MVd(运动向量差)的x分量从用于L0列表Mvd的x分量的译码的精度等级转换到解码器用来表示运动数据的内部精度。
-接下来,在译码的MVd的y分量上应用AMVR处理的逆处理。这涉及将与L0参考图像相关联的解析的MVd(运动向量差)的y分量从用于L0列表MVd的y分量译码的精度等级转换为解码器用来表示运动数据的内部精度。
-接下来,计算当前CU的参考图片L0的AMVP候选列表。这遵循已经参考图6解释的过程。一旦完成此操作,当前参考图片列表中的当前CU的运动向量预测值就是已知的且被记为AMVPCand[mvpIdxL0],其中mvpIdxL0是用于当前CU的MV预测值候选的索引,且其是从解析过程产生的。
-接着,重构当前参考图片列表中的当前CU的运动向量作为MV预测值与解析的且按分量精度转换的运动向量差的和。
-最后,在所考虑的编解码器中根据运动向量的内部表示来修剪重构的运动向量。
接下来,图19的示例测试当前块是否采用根据参考图片列表L1中所含有的参考图片的时间预测。如果是,则应用与上述相同的过程,但是在参考图像列表L1的情况下。
结果,图19的示例获得两个经重构运动向量MVL0和MVL1以用于当前帧间CU,且随后用于当前CU的运动补偿时间预测。
在附加到本文档的语法结构列表2中示出了适于实现实施例的当前示例(实施例2)的coding_unit语法结构的示例。
通常,本文描述的实施例的至少一个其他示例(本文称为实施例3)涉及在仿射运动补偿的情况下x和y运动向量分量的解耦分辨率。图20中示出了解析例如根据VVC草案5以仿射AMVP模式译码的CU的AMVR数据的示例。图20的示例涉及在至少一个控制点运动向量具有非零的相关联MVd的情况下解析当前CU的标志,例如指定的amvr_flag。然后,如果amvr_flag为真,则解析当前CU的另一标志,例如指定的amvr_precision_flag。amvr_flag语法元素指示是否使用默认的1/4亮度样本精度等级来对当前CU的MV数据进行译码。然后,如果amvr_flag为真,则解析当前CU的标志amvr_precision_flag。其指示1亮度样本或4亮度样本MV分辨率是否用于当前CU。
图21中示出了根据本实施例的解析以仿射AMVP模式译码的CU的AMVR数据的示例,图21的示例涉及解析与当前CU相关联的标志,例如指定的amvr_flag。然后,如果amvr_flag为真并且解码的L0或L1列表MVd的x分量对于当前CU的至少一个CPMV而言为非零,则解析例如被指定为amvr_flag_x的另一标志。其指示每一CPMV的MVd的x分量是否以默认1/4亮度样本精度等级中而被用信号通知。接下来,如果两个标志amvr_precision_flag和amvr_flag_x都为真,则解析例如指定为amvr_flag_y的另一个标志。其指示当前MVd的y分量是否针对每一CPMV以默认1/4亮度样本精度等级而被用信号通知。否则,如果amvr_precision_flag为真并且amvr_flag_x为假,则amvr_flag_y被推断为真。最后,在amvr_precision_flag为假的情况下,amvr_flag_x和amvr_flag_y两者都被推断为假。
根据本实施例的标志值和相关解释的组合的其它例子包括以下内容。如果amvr_flag为真,则当前CU的amvr_precision_flag指示默认的1亮度样本或4亮度样本MV分辨率是否用于当前CU。如果amvr_flag_x为真,则用于每个CPMV的MVd的x分量的精度等级是由amvr_flag和amvr_precision_flag指示的精度等级。如果amvr_flag_y为真,则用于每个CPMV的MVd的y分量的精度等级是由amvr_flag和amvr_precision_flag指示的精度等级。
图22示出了对于例如根据VVC草案5将以仿射AMVP模式(与平移AMVP模式相反)译码的输入CU的运动向量的重构的示例,其中AMVR对于该CU是有效的。图22的示例中涉及的该处理发生在解码器侧。该处理的输入是已经解析的译码单元。
在图22中,处理开始于测试当前仿射AMVP CU是否采用根据L0参考图片列表中所包含的参考图片的时间预测。如果是,则应用以下四个步骤。
-针对L0列表的每个CPMV,AMVR过程的逆过程被应用于MVd。这包括将与L0参考图片相关联的每个CPMV的解析的MVd(运动向量差)从用于L0列表Mvd的译码的精度等级转换到由解码器用来表示运动数据的内部精度。
-接下来,计算当前CU的参考图片L0的CPVM候选预测值的仿射AMVP列表。这遵循已经参考图11解释的过程。一旦完成此操作,当前参考图片列表中的当前CU的运动向量预测值是已知的且被记为AMVPCand[mvpIdxL0],其中mvpIdxL0是用于当前CU的CPMV预测值候选的索引,且其是从解析过程产生。
-接着,将当前参考图片列表中的当前CU的控制点运动向量重构为其相应MV预测值与解析的运动向量差的和。
-最后,根据运动向量在所考虑的编解码器中的内部表示来修剪重构的控制点运动向量,并根据VVC草案5规范来构造当前CU中包含的与当前参考图片列表相关联的仿射运动场。
图22的实例中的处理的下一步骤涉及测试当前块是否采用根据参考图片列表L1中所含有的参考图片的时间预测。如果是,则应用与上述相同的处理,但是在参考图像列表L1的情况下。
作为图22的示例的处理的结果,分别针对参考图片列表L0和参考图片列表L1获得当前CU的两个重构的仿射运动向量场,且所述两个重构的仿射运动向量场随后用于当前CU的运动补偿时间预测。
图23示出了根据本实施例的仿射AMVP译码的CU的解码器侧运动数据重构。即,图23示出了在本实施例中将以仿射AMVP模式(与平移AMVP模式相反)译码的输入CU的运动向量的重构,其中AMVR对于此CU是活动的。这个过程发生在解码器侧。该过程的输入是已经解析的译码单元。
图23的示例中的处理通过测试当前仿射AMVP CU是否采用根据L0参考图片列表中所含有的参考图片的时间预测而开始。如果是,则应用以下四个步骤。
-AMVR处理的逆处理应用于L0列表的每个CPMV的译码的MVd的x分量。这包括将与L0参考图片相关联的每个CPMV的解析的MVd(运动向量差)的x分量从用于L0列表Mvd的x分量的译码的精度等级转换到解码器用来表示运动数据的内部精度。
-接下来,将AMVR过程的逆过程应用于L0参考列表的每个CPMV的译码的MVd的y分量。这包括将与L0参考图像相关联的每个CPMV的解析的MVd(运动向量差)的y分量从用于L0列表Mvd的y分量的译码的精度等级转换到由解码器用来表示运动数据的内部精度。
-接下来,计算当前CU的参考图片L0的仿射AMVP候选列表。这遵循已经参考图11解释的过程。一旦完成此操作,当前参考图片列表中的当前CU的运动向量预测值是已知的且被记为AMVPCand[mvpIdxL0],其中mvpIdxL0是用于当前CU的MV预测值候选的索引,且其是从解析过程产生的。
-接着,将当前参考图片列表中的当前CU的控制运动向量重构为其相应CPMV预测值与其针对当前CU的每个CPMV的相应解析的运动向量差的总和。
-最后,修剪重构的CPMV,并且相对于L0参考图片产生当前CU的仿射运动场。
所述过程的下一步骤测试当前块是否采用根据参考图片列表L1中所含有的参考图片的时间预测。如果是,则应用上述处理,但是在参考图片列表L1的情况下。
图23的示例的处理的结果是针对当前仿射AMVP CU获得的列表L0和列表L1的两个重构的运动场。这些重构的运动场随后用于当前CU的运动补偿时间预测。
在附加到本文档的语法结构列表3中示出了适于实现实施例的当前示例(实施例3)的译码单元语法结构的示例。
一般来说,本文所描述的实施例的至少一个其它实例(本文中称为实施例4)涉及在AMVP平移运动补偿的情况下L0和L1参考图片列表中的解耦运动向量分辨率。一方面涉及在L0和L1参考列表之间解耦AMVR精度等级。图24描绘根据本实施例的对以AMVP模式译码的CU的AMVR数据的解析。
在图24中,首先解析当前CU的例如指定为amvr_flag的标志。然后,如果amvr_flag为真并且L0列表的解码MVd为非零,则解析指定为例如amvr_flag_L0的另一标志。它指示列表L0的当前MVd是否以默认1/4亮度样本精度等级而被用信号通知。接下来,如果两个标志amvr_precision_flag和amvr_flag_L0都为真,则解析另一个指定为例如amvr_flag_L1的标志。它指示是否以默认1/4亮度样本精度等级用信号通知与列表L1相关联的当前MVd。否则,如果amvr_precision_flag为真并且amvr_flag_L0为假,则amvr_flag_L1被推断为真。最后,如果amvr_precision_flag为假,则amvr_flag_L0和amvr_flag_L1都被推断为假。
根据本实施例的标志值的组合和相关解释的其它示例如下。如果amvr_flag为真,则当前CU的amvr_precision_flag指示默认的1亮度样本或4亮度样本MV分辨率是否用于当前CU。如果amvr_flag_L0为真,则用于列表L0的MVd的精度等级是由amvr_flag和amvr_precision_flag指示的精度等级。如果amvr_flag_L1为真,则用于列表L1的MVd的精度等级是由amvr_flag和amvr_precision_flag指示的精度等级。
图25示出了根据实施例的本实例的将以平移AMVP模式(与仿射AMVP模式相反)译码的输入CU的运动向量的重构的实例,其中AMVR对于此CU是活动的。这种重构发生在解码器侧。输入是已经被解析的译码单元。图25中的实例通过测试当前CU是否采用根据L0参考图片列表中所含有的参考图片的时间预测而开始。如果是,则应用以下四个步骤。
-AMVR处理的逆处理应用于与L0列表相关联的译码的MVd。这包括将与L0参考图片相关联的解析的MVd(运动向量差)从用于L0列表Mvd的译码的精度等级转换到由解码器用来表示运动数据的内部精度。
-接下来,计算当前CU的参考图片L0的AMVP候选列表。这遵循已经参考图6解释的过程。一旦完成此操作,当前参考图片列表中的当前CU的运动向量预测值是已知的且被记为AMVPCand[mvpIdxL0],其中mvpIdxL0是用于当前CU的MV预测值候选的索引,且其是从解析过程产生的。
-接着,将当前参考图片列表中的当前CU的运动向量重构为MV预测值与解析的运动向量差的和。
-最后,根据在所考虑的编解码器中运动向量的内部表示来修剪重构的运动向量。
图25的示例中的下一步骤涉及测试当前块是否采用根据参考图片列表L1中所含有的参考图片的时间预测。如果是,则应用上述相同的过程,但是在参考图像列表L1的情况下。结果,图25的示例提供两个重构的运动向量MVL0和MVL1以用于当前帧间CU,且随后用于当前CU的运动补偿时间预测。
在附加到本文档的语法结构列表4中示出了适于实现实施例的当前示例(实施例4)的coding_unit语法结构的示例。
一般来说,本文所描述的实施例的至少一个其它实例(本文中称为实施例5)涉及在仿射运动补偿的情况下L0和L1参考图片列表中的解耦运动向量分辨率。一方面涉及在仿射AMVP译码的CU的情况下,在L0参考列表与L1参考列表之间解耦AMVR精度等级。图26中示出了根据本实施例的解析以仿射AMVP模式译码的CU的AMVR数据的示例。
图26的示例涉及首先分析与当前CU相关联的标志(例如,指定为amvr_flag的标志)的处理。然后,如果amvr_flag为真并且解码的L0 MVd对于当前CU的至少一个CPMV是非零的,则解析例如被指定为amvr_flag_L0的另一个标志。其指示对于参考图片列表L0,每一CPMV的MVd是否以默认1/4亮度样本精度等级而被用信号通知。接下来,如果标志amvr_precision_flag和amvr_flag_L0都为真,则解析标志amvr_flag_L1。其指示针对参考图片列表L1是否以默认1/4亮度样本精度等级而用信号通知当前MVd。否则,如果amvr_precision_flag是真并且amvr_flag_L0是假,则amvr_flag_L1被推断为真。最后,如果amvr_precision_flag是假,则amvr_flag_L0和amvr_flag_L1都被推断为假。
如下是标志值的其它组合和相关解释的示例。如果amvr_flag为真,则解析当前CU的amvr_precision_flag。其指示默认的1亮度样本或4亮度样本MV分辨率是否用于当前CU。如果amvr_flag_L0为真,则用于与参考图像列表L0相关联的每个CPMV的MVd的精度等级是由amvr_flag和amvr_precision_flag指示的精度等级。如果amvr_flag_L1为真,则用于参考列表L1的每个CPMV的MVd的精度等级是由amvr_flag和amvr_precision_flag指示的精度等级。
图27示出了在本实施例中将以仿射AMVP模式(与平移AMVP模式相反)译码的输入CU的运动向量的重构的示例,其中AMVR对于此CU是活动的。与图27的示例相关联的处理发生在解码器侧。该过程的输入是已经解析的译码单元。
图27的示例的处理通过测试当前仿射AMVP CU是否采用根据L0参考图片列表中所含有的参考图片的时间预测而开始。如果是,则应用以下四个步骤。
-对于L0列表的每个CPMV,AMVR过程的逆过程被应用于MVd。这包括将与L0参考图像相关联的每个CPMV的解析的MVd(运动向量差)从用于L0列表Mvd的译码的精度等级转换到由解码器用来表示运动数据的内部精度。
-接下来,计算当前CU的参考图片L0的AMVP候选列表。这遵循已经参考图11解释的过程。一旦完成此操作,当前参考图片列表中的当前CU的运动向量预测值是已知的且被指定为AMVPCand[mvpIdxL0],其中mvpIdxL0是用于当前CU的CPMV预测值候选的索引,且其是从解析过程产生的。
-接着,将当前参考图片列表中的当前CU的控制点运动向量确定为CPMV预测值与当前CU的每一CPMV的解析的运动向量差的总和。
-最后,修剪重构的CMVS,并相对于L0参考图片产生当前CU的重构仿射运动场。
所述过程的下一步骤测试当前仿射AMVP块是否采用根据参考图片列表L1中所含有的参考图片的时间预测。如果是,则应用上述处理,但是在参考图片列表L1的情况下。作为图27的示例的处理的结果,针对当前仿射AMVP CU获得列表L0和列表L1的两个重构的运动场,且其随后用于当前CU的运动补偿时间预测。
在附加到本文档的语法结构列表5中示出了适于实现实施例的当前示例(实施例5)的coding_unit语法结构的示例。
根据本文描述的一个或多个实施例的涉及视频编码和/或解码的系统可以单独地或以各种布置组合地提供以下非限制性特征示例中的一个或多个:
·运动向量差(或MV残差)的译码中的精度等级在译码的运动向量差的x分量和y分量之间进行区分。
·在不使用对称运动向量差译码的双预测块的情况下,在L0和L1参考图像列表之间区分运动向量差(或MV残差)译码中的精度等级。
·在所考虑的块通过诸如VVC的帧内块复制模式译码的情况下,运动向量差(或MV残差)的译码中的精度等级在译码运动向量差的x分量和y分量之间进行区分。
·在所考虑的块通过诸如VVC的帧间平移AMVP模式来译码的情况下,运动向量差(或MV残差)的译码中的精度等级在译码的运动向量差的x分量和y分量之间进行区分。
·在所考虑的块通过VVC的帧间仿射AMVP模式来译码的情况下,运动向量差(或MV残差)的译码中的精度等级在所译码的运动向量差的x分量和y分量之间进行区分。
·在双向预测块的情况下,在L0与L1参考图片列表之间区分运动向量差(或MV残差)的译码中的精度等级,其中不使用对称运动向量差译码且所考虑的块通过VVC的帧间平移AMVP模式来译码。
·在双预测块的情况下,在L0和L1参考图片列表之间区分运动向量差(或MV残差)的译码中的精度等级,其中不使用对称运动向量差译码,并且其中通过VVC的帧间仿射AMVP模式对所考虑的块进行译码。
本文档描述了实施例、特征、模型、方法等的各种示例。许多这样的示例被描述为具有特定性,并且至少为了示出个体特性,通常以可能看起来具有限制性的方式来描述。然而,这是为了描述清楚的目的,并且不限制应用或范围。实际上,本文所述的实施例、特征等的各种示例可以各种方式组合和互换,以提供实施例的另外的示例。
通常,在本文档中描述和设想的实施例的示例可以以许多不同的形式来实现。上述图1和2以及下述图28提供了一些实施例,但是可以想到其他实施例,并且对图1、2和28的讨论不限制实现的广度。至少一个实施例一般提供与视频编码和/或解码相关的示例,并且至少一个其它实施例一般涉及传送所生成或编码的比特流或信号。这些和其它实施例可被实现为方法、装置、其上存储有用于根据所描述的方法中的任一种来编码或解码视频数据的指令的计算机可读存储介质、和/或其上存储有根据所描述的方法中的任一种生成的比特流或信号的计算机可读存储介质。
术语HDR(高动态范围)和SDR(标准动态范围)用于本公开中。那些术语通常向本领域普通技术人员传达动态范围的特定值。然而,也意图在另外的实施例中,其中对HDR的引用被理解为意味着“较高动态范围”,而对SDR的引用被理解为意味着“较低动态范围”。这样的附加实施例不受可能经常与术语“高动态范围”和“标准动态范围”相关联的动态范围的任何特定值的约束。
本文描述了各种方法,并且每种方法包括用于实现所描述的方法的一个或多个步骤或动作。除非方法的正确操作需要特定顺序的步骤或动作,否则可修改或组合特定步骤和/或动作的顺序和/或使用。
本文档中描述的各种方法和其它方面可用于修改视频编码器和/或解码器的模块,例如图1中所示的编码器100的运动补偿和/或运动估计模块170和175以及图2中所示的解码器200的运动补偿模块275。此外,本发明的方面不限于VVC或HEVC,且可应用于(例如)其它标准和建议(无论是先前存在的还是将来开发的),以及任何此类标准和建议(包含VVC和HEVC)的扩展。除非另外指出或在技术上排除,否则本文中所描述的方面可单独或组合使用。
例如,在本文档中使用了各种数值。具体值是出于示例目的,并且所描述的方面不限于这些具体值。
图28示出了其中可以实现各个方面和实施例的系统的示例的框图。系统1000可以被实现为包括以下描述的各种组件的设备,并且被配置为执行本文中描述的一个或多个方面。此类设备的示例包括但不限于各种电子设备,诸如个人计算机、膝上型计算机、智能电话、平板计算机、数字多媒体机顶盒、数字电视接收机、个人视频记录系统、连接的家用电器和服务器。系统1000的元件可以单独地或组合地实现在单个集成电路、多个IC和/或分立组件中。例如,在至少一个实施例中,系统1000的处理和编码器/解码器元件分布在多个IC和/或分立组件上。在各种实施例中,系统1000经由例如通信总线或通过专用输入和/或输出端口通信地耦合到其他类似系统或其他电子设备。在各种实施例中,系统1000被配置为实现本文中描述的一个或多个方面。
系统1000包括至少一个处理器1010,其被配置为执行加载在其中的指令,以用于实现例如本文中描述的各个方面。处理器1010可以包括嵌入式存储器、输入输出接口和本领域已知的各种其它电路。系统1000包括至少一个存储器1020(例如,易失性存储器设备和/或非易失性存储器设备)。系统1000包括存储设备1040,其可以包括非易失性存储器和/或易失性存储器,包括但不限于EEPROM、ROM、PROM、RAM、DRAM、SRAM、闪存、磁盘驱动器和/或光盘驱动器。作为非限制性示例,存储设备1040可以包括内部存储设备、附接的存储设备和/或网络可访问的存储设备。
系统1000包括编码器/解码器模块1030,其被配置为例如处理数据以提供编码视频或解码视频,并且编码器/解码器模块1030可以包括其自己的处理器和存储器。编码器/解码器模块1030表示可包括在设备中以执行编码和/或解码功能的模块(一个或多个)。如已知的,设备可以包括编码和解码模块中的一个或两个。另外,编码器/解码器模块1030可实施为系统1000的单独元件或可并入处理器1010内作为如所属领域的技术人员已知的硬件与软件的组合。
要加载到处理器1010或编码器/解码器1030上以执行本文档中描述的各个方面的程序代码可以存储在存储设备1040中,并且随后加载到存储器1020上以供处理器1010执行。根据各种实施例,处理器1010、存储器1020、存储设备1040和编码器/解码器模块1030中的一者或多者可以在执行本文中描述的过程期间存储各种项中的一者或多者。这些存储的项可以包括但不限于输入视频、解码视频或解码视频的部分、比特流或信号、矩阵、变量以及来自等式、公式、运算和运算逻辑的处理的中间或最终结果。
在若干实施例中,处理器1010和/或编码器/解码器模块1030内的存储器用于存储指令,且提供用于在编码或解码期间需要的处理的工作存储器。然而,在其它实施例中,处理设备外部的存储器(例如,处理设备可为处理器1010或编码器/解码器模块1030)用于这些功能中的一者或一者以上。外部存储器可以是存储器1020和/或存储设备1040,例如,动态易失性存储器和/或非易失性闪存。在几个实施例中,外部非易失性闪存用于存储电视的操作系统。在至少一个实施例中,诸如RAM的快速外部动态易失性存储器被用作视频编码和解码操作的工作存储器,诸如MPEG-2、HEVC或VVC(通用视频译码)。
如框1130中所示,可以通过各种输入设备来提供对系统1000的元件的输入。这样的输入设备包括但不限于(i)接收例如由广播公司通过空中传输的RF信号的RF部分,(ii)复合输入端子,(iii)USB输入端子,和/或(iv)HDMI输入端子。
在各种实施例中,框1130的输入设备具有本领域已知的相关联的相应输入处理元件。例如,RF部分可以与用于以下的元件相关联:(i)选择期望频率(也称为选择信号,或将信号频带限制到频带),(ii)下变频选择的信号,(iii)再次频带限制到较窄频带以选择(例如)在某些实施例中可以称为信道的信号频带,(iv)解调下变频和频带限制的信号,(v)执行纠错,和(vi)解复用以选择期望的数据分组流。各种实施例的RF部分包括一个或多个元件以执行这些功能,例如,频率选择器、信号选择器、限带器、信道选择器、滤波器、下变频器、解调器、纠错器和解复用器。RF部分可以包括执行各种这些功能的调谐器,这些功能包括例如将接收信号下变频到较低频率(例如,中频或近基带频率)或基带。在一个机顶盒实施例中,RF部分及其相关的输入处理元件接收通过有线(例如,电缆)介质发送的RF信号,并通过滤波、下变频和再次滤波到期望的频带来执行频率选择。各种实施例重新安排上述(和其它)元件的顺序,移除这些元件中的一些,和/或添加执行类似或不同功能的其它元件。添加元件可以包括在现有元件之间插入元件,例如,插入放大器和模数转换器。在各种实施例中,RF部分包括天线。
另外,USB和/或HDMI端子可以包括用于通过USB和/或HDMI连接将系统1000连接到其它电子设备的相应接口处理器。应当理解,输入处理的各个方面,例如,里德-所罗门纠错,可以在例如单独的输入处理IC或处理器1010内实现。类似地,USB或HDMI接口处理的各方面可以在单独的接口IC内或在处理器1010内实现。解调、纠错和解复用的流被提供给各种处理元件,包括例如处理器1010和编码器/解码器1030,其与存储器和存储元件结合操作以处理数据流以便在输出设备上呈现。
系统1000的各种元件可设置在集成壳体内。在集成壳体内,各种元件可使用合适的连接布置1140互连并在其间传输数据,所述连接布置例如本领域已知的内部总线,包括I2C总线、布线和印刷电路板。
系统1000包括通信接口1050,其使得能够经由通信信道1060与其他设备通信。通信接口1050可以包括但不限于被配置为通过通信信道1060发送和接收数据的收发信机。通信接口1050可以包括但不限于调制解调器或网卡,并且通信信道1060可以例如在有线和/或无线介质内实现。
在各种实施例中,使用诸如IEEE 802.11的Wi-Fi网络将数据流式传输到系统1000。这些实施例的Wi-Fi信号通过适用于Wi-Fi通信的通信信道1060和通信接口1050来接收。这些实施例的通信信道1060通常连接到接入点或路由器,所述接入点或路由器提供对包括因特网的外部网络的接入以允许流式应用和其它过顶通信。其它实施例使用通过输入块1130的HDMI连接传递数据的机顶盒向系统1000提供流数据。还有一些实施例使用输入块1130的RF连接向系统1000提供流数据。
系统1000可以向各种输出设备提供输出信号,包括显示器1100、扬声器1110和其他外围设备1120。在各实施例的各示例中,其他外围设备1120包括以下一者或多者:独立DVR、盘播放器、立体声系统、照明系统、以及基于系统1000的输出提供功能的其他设备。在各种实施例中,使用诸如AV.链路、CEC或其他使得能够在有或没有用户干预的情况下进行设备到设备控制的通信协议的信令在系统1000和显示器1100、扬声器1110或其它外围设备1120之间传送控制信号。输出设备可以经由通过相应接口1070、1080和1090的专用连接通信地耦合到系统1000。或者,输出设备可以使用通信信道1060经由通信接口1050连接到系统1000。显示器1100和扬声器1110可以与系统1000的其它组件一起集成在电子设备(例如电视机)中的单个单元中。在各种实施例中,显示接口1070包括显示驱动器,例如,定时控制器(T con)芯片。
例如,如果输入1130的RF部分是单独机顶盒的一部分,则显示器1100和扬声器1110可以备选地与其它组件中的一者或多者分离。在显示器1100和扬声器1110是外部组件的各种实施例中,输出信号可以经由专用输出连接来提供,所述专用输出连接例如包括HDMI端口、USB端口或COMP输出。
这些实施例可以由处理器1010或硬件、或硬件和软件的组合实现的计算机软件来实现。作为非限制性示例,实施例可以由一个或多个集成电路实现。存储器1020可以是适合于技术环境的任何类型,并且可以使用任何适当的数据存储技术来实现,作为非限制性示例,诸如光学存储器设备、磁存储器设备、基于半导体的存储器设备、固定存储器和可移动存储器。处理器1010可以是适合于技术环境的任何类型,并且可以包含作为非限制性示例的以下一者或多者:微处理器、通用计算机、专用计算机和基于多核架构的处理器。
图29示出了实施例的另一个示例,在图29中,在2910,确定与包括图片信息的当前译码单元相关联的译码模式。举例来说,译码模式可包含如上文所描述的帧内块译码(IBC)模式、平移自适应运动向量预测(AMVP)模式、仿射AMVP模式等。然后,在2920,基于译码模式,确定第一精度等级和第二精度等级,例如,基于各种标志和对所述标志的值的测试而确定,如上文所描述。所述第一精度等级与运动向量信息的第一部分相关联。举例来说,运动向量信息可包括残差(或运动向量差(MVd)),且与第一部分相关联的第一精度等级可为残差或MVd的x分量的准确度。所述第二精度等级与所述运动向量信息的第二部分相关联。例如,与第二部分相关联的第二精度等级可以是残差或MVd的y分量的准确度。作为实例,精度等级或准确度可为例如1/16亮度样本、1/4亮度样本、整数亮度样本或四亮度样本的值。在仿射AMVP模式中,所支持的MVd分辨率等级可为四分之一亮度样本或整数亮度样本。在2930,基于运动向量信息、以及第一精度等级和第二精度等级,例如使用如上所述的定义的精度或准确度来组合运动向量预测值和运动向量残差,获得与当前译码单元相关联的运动向量。在2940,基于译码模式和运动向量,对图片信息的至少一部分进行解码,以产生解码的图片信息。
图30示出了实施例的另一个示例,图30中,在3010,确定与包括图片信息的当前译码单元相关联的译码模式。举例来说,译码模式可包含如上文所描述的帧内块译码(IBC)模式、平移自适应运动向量预测(AMVP)模式、仿射AMVP模式等。然后,在3020,基于译码模式,确定第一精度等级和第二精度等级,例如,基于各种标志和如上文所描述的标志的值的测试来确定所述第一精度等级和第二精度等级。所述第一精度等级与运动向量信息的第一部分相关联。举例来说,运动向量信息可为残差或运动向量差(MVd),且与第一部分相关联的第一精度等级可为残差的x分量的准确度。第二精度等级与运动向量信息的第二部分(例如,残差的y分量的准确度)相关联。作为示例,精度等级或准确度可为例如1/16亮度样本、1/4亮度样本、整数亮度样本或四亮度样本的值。在仿射AMVP模式中,所支持的MVd分辨率等级是四分之一亮度样本或整数亮度样本。在3030,基于运动向量信息、以及第一精度等级和第二精度等级(例如,如上文所描述使用所定义的精度或准确度组合运动向量预测值与运动向量残差)来获得与当前译码单元相关联的运动向量。在3040,基于译码模式和运动向量对图片信息的至少一部分进行编码,以产生编码的图片信息。
在实施例的另一示例中,如上文所述确定译码模式、以及第一精度等级和第二精度等级。然而,在此示例中,运动向量信息可包括对应于第一参考图片列表(例如,L0 MVd)的第一运动向量残差和对应于第二参考图片列表(例如,L1 MVd)的第二运动向量残差。在此情况下,第一精度等级与运动向量信息的包括第一运动向量残差的部分相关联,且第二精度等级与运动向量信息的包括第二运动向量残差的部分相关联。基于所述第一运动向量残差及所述第一精度等级获得第一运动向量,且基于所述第二运动向量残差及所述第二精度等级获得第二运动向量。然后,基于第一运动向量、第二运动向量和译码模式对图像信息进行解码或编码。
在本公开中,各种实现方式涉及解码。如本申请中所使用的,“解码”可以包括例如对接收到的编码序列执行的全部或部分处理,以便产生适合于显示的最终输出。在各种实施例中,此类过程包括通常由解码器执行的过程中的一者或多者,例如熵解码、逆量化、逆变换和差分解码。在各种实施例中,此类过程还或替代地包含由本申请中所描述的各种实施方案的解码器执行的过程,例如,从图块的(封装的)图片中提取图片,确定上采样滤波器以使用且接着上采样图片,以及将图片翻转回其既定定向。
作为进一步的示例,在一个实施例中,“解码”仅指熵解码,在另一实施例中,“解码”仅指差分解码,并且在另一实施例中,“解码”指熵解码和差分解码的组合。短语“解码过程”是否旨在具体地指代操作的子集或一般地指代更广泛的解码过程基于具体描述的上下文将是清楚的,并且相信是本领域技术人员所充分理解的。
此外,各种实现方式涉及编码。以与以上关于“解码”的讨论类似的方式,如在本申请中使用的“编码”可以包括例如对输入视频序列执行的处理的全部或部分,以便产生编码的比特流或信号。在各种实施例中,此类过程包括通常由编码器执行的一个或多个过程,例如,划分、差分编码、变换、量化和熵编码。在各种实施例中,这样的过程还或替代地包括由本申请中描述的各种实现的编码器执行的过程。
作为进一步的示例,在一个实施例中,“编码”仅指熵编码,在另一实施例中,“编码”仅指差分编码,而在另一实施例中,“编码”指差分编码和熵编码的组合。短语“编码过程”是否旨在具体地指代操作的子集或一般地指代更广泛的编码过程将基于具体描述的上下文而变得清楚,并且相信是本领域技术人员所充分理解的。
注意,这里使用的语法元素是描述性术语。因此,它们不排除使用其它语法元素名称。
当附图被呈现为流程图时,应当理解,它还提供了对应装置的框图。类似地,当附图被呈现为框图时,应当理解,它还提供了对应的方法/过程的流程图。
各种实施例涉及率失真优化。特别地,在编码过程期间,通常考虑速率和失真之间的平衡或折衷,通常给出计算复杂度的约束。率失真优化通常被公式化为最小化率失真函数,率失真函数是速率和失真的加权和。存在不同的方法来解决率失真优化问题。例如,这些方法可以基于对所有编码选项的广泛测试,包括所有考虑的模式或译码参数值,在译码和解码之后对它们的译码成本和重构信号的相关失真进行完整评估。还可以使用更快的方法来节省编码复杂度,特别是基于预测或预测残差信号而不是重构信号来计算近似失真。还可以使用这两种方法的混合,例如通过仅对一些可能的编码选项使用近似失真,而对其他编码选项使用完全失真。其它方法仅评估可能的编码选项的子集。更一般地,许多方法采用各种技术中的任何一种来执行优化,但是优化不一定是对编码成本和相关失真两者的完整评估。
本文描述的实现方式和方面可以在例如方法或过程、装置、软件程序、数据流或信号中实现。即使仅在单一形式的实现的上下文中讨论(例如,仅作为方法讨论),所讨论的特征的实现也可以以其他形式(例如,装置或程序)来实现。例如,可以以适当的硬件、软件和固件来实现装置。所述方法可以在例如处理器中实现,所述处理器通常指处理设备,包括例如计算机、微处理器、集成电路或可编程逻辑设备。处理器还包括通信设备,例如计算机、蜂窝电话、便携式/个人数字助理(“PDA”)和便于终端用户之间的信息通信的其他设备。
对“一个实施例”、“实施例”或“一个实现”或“实现”以及其它变型的提及意味着结合实施例描述的特定特征、结构、特性等包含于至少一个实施例中。因此,在贯穿本文的各个地方出现的短语“在一个实施例中”、“在实施例中”或“在一个实现中”或“在实现中”以及任何其他变型的出现不一定都指同一实施例。
另外,本文档可以指“获得”各种信息。获得信息可以包括例如以下一者或多者:确定信息、估计信息、计算信息、预测信息或从存储器检索信息。
此外,本文档可以指“访问”各种信息。访问信息可以包括例如以下一者或多者:接收信息、检索信息(例如,从存储器)、存储信息、移动信息、复制信息、计算信息、确定信息、预测信息或估计信息。
另外,本文档可以指“接收”各种信息。如同“访问”一样,接收旨在是广义的术语。接收信息可以包括例如访问信息或(例如从存储器)检索信息中的一者或多者。此外,在诸如存储信息、处理信息、发送信息、移动信息、复制信息、擦除信息、计算信息、确定信息、预测信息或估计信息的操作期间,通常以一种方式或另一种方式涉及“接收”。
应当理解,例如在“A/B”、“A和/或B”、“A或B中的一者或多者”以及“A和B中的至少一者”的情况下,使用以下“/”、“和/或”、“中的一者或多者”以及“中的至少一者”中的任何一者旨在涵盖仅对第一列出的选项(A)的选择、或仅对第二列出的选项(B)的选择、或对两个选项(A和B)的选择。作为进一步的示例,在“A、B和/或C”、“A、B或C中的一者或多者”和“A、B和C中的至少一者”的情况下,这样的措词旨在包括仅选择第一列出的选项(A),或仅选择第二列出的选项(B),或仅选择第三列出的选项(C),或仅选择第一和第二列出的选项(A和B),或仅选择第一和第三列出的选项(A和C),或仅选择第二和第三列出的选项(B和C),或选择所有三个选项(A和B和C)。如本领域和相关领域的普通技术人员所清楚的,这可以扩展到所列的多个项目。
此外,如本文所使用的,词语“信号/用信号通知”尤其是指向对应的解码器指示某物。例如,在某些实施例中,编码器用信号通知多个参数中的特定一者以用于细化。这样,在一个实施例中,在编码器侧和解码器侧使用相同的参数。因此,例如,编码器可以向解码器发送(显式信令)特定参数,使得解码器可以使用相同的特定参数。相反,如果解码器已经具有特定参数以及其它参数,则可以使用信令而不进行发送(隐式信令),以简单地允许解码器知道并选择特定参数。通过避免任何实际功能的传输,在各种实施例中实现了比特节省。应当理解,可以以各种方式来实现信令。例如,在各种实施例中,一个或多个语法元素、标志等被用于将信息用信号通知给对应的解码器。虽然前述内容涉及词语“信号/用信号通知”的动词形式,但是词语“信号/用信号通知”在本文中也可以用作名词。
如对于本领域普通技术人员将显而易见的,实现可以产生被格式化以携带例如可以被存储或发送的信息的各种信号。该信息可以包括例如用于执行方法的指令,或者由所描述的实现之一产生的数据。例如,信号可以被格式化以携带所描述的实施例的比特流或信号。这种信号可以被格式化为例如电磁波(例如,使用频谱的射频部分)或基带信号。格式化可以包括例如对数据流进行编码并且利用编码的数据流对载波进行调制。信号携带的信息可以是例如模拟或数字信息。如已知的,信号可以通过各种不同的有线或无线链路来传输。该信号可以存储在处理器可读介质上。
在本公开中还支持和考虑了各种一般化的以及特殊化的实施例。根据本公开的实施例的示例包括但不限于以下内容。
一般来说,实施例的示例可以涉及一种方法,该方法包括:确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与运动向量信息的第一部分相关联的第一精度等级,及与所述运动向量信息的第二部分相关联的第二精度等级,其中所述运动向量信息与所述当前译码单元相关联;基于所述运动向量信息、以及所述第一精度等级和所述第二精度等级,获得与所述当前译码单元相关联的运动向量;以及基于所述译码模式和所述运动向量,对包括在所述当前编码单元中的图片信息的至少一部分进行解码。
一般来说,实施例的另一示例可涉及一种方法,所述方法包括:确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与运动向量信息的第一部分相关联的第一精度等级,及与所述运动向量信息的第二部分相关联的第二精度等级,其中所述运动向量信息与所述当前译码单元相关联;基于所述运动向量信息、以及所述第一精度等级和所述第二精度等级,获得与所述当前译码单元相关联的运动向量;以及基于所述译码模式和所述运动向量,对所述图片信息的至少一部分进行编码。
一般来说,实施例的另一示例可涉及包括一个或多个处理器的装置,所述一个或多个处理器被配置为确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与运动向量信息的第一部分相关联的第一精度等级,及与所述运动向量信息的第二部分相关联的第二精度等级,其中所述运动向量信息与所述当前译码单元相关联;基于所述运动向量信息、以及所述第一精度等级和所述第二精度等级,获得与所述当前译码单元相关联的运动向量;以及基于所述译码模式和所述运动向量,对所述图片信息的至少一部分进行解码。
一般来说,实施例的另一示例可涉及包括一个或多个处理器的装置,所述一个或多个处理器被配置为确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与运动向量信息的第一部分相关联的第一精度等级,及与所述运动向量信息的第二部分相关联的第二精度等级,其中所述运动向量信息与所述当前译码单元相关联;基于所述运动向量信息、以及所述第一精度等级和所述第二精度等级,获得与图片信息的译码单元相关联的运动向量;以及基于所述译码模式和所述运动向量,对所述图片信息的至少一部分进行编码。
一般来说,实施例的另一示例可涉及一种方法,所述方法包括:确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与运动向量残差的第一分量相关联的第一精度等级及与所述运动向量残差的第二分量相关联的第二精度等级,所述运动向量残差与所述当前译码单元相关联;基于所述运动向量残差、以及所述第一精度等级和所述第二精度等级,获得与所述当前译码单元相关联的运动向量;以及基于所述译码模式和所述运动向量,对包括在所述当前译码单元中的图片信息的至少一部分进行解码。
一般来说,实施例的另一示例可涉及一种方法,所述方法包括:确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与运动向量残差的第一分量相关联的第一精度等级及与所述运动向量残差的第二分量相关联的第二精度等级,所述运动向量残差与所述当前译码单元相关联;基于所述运动向量残差、以及所述第一精度等级和所述第二精度等级,获得与所述当前译码单元相关联的运动向量;以及基于所述译码模式和所述运动向量,对所述图片信息的至少一部分进行编码。
一般来说,实施例的另一示例可涉及包括一个或多个处理器的装置,所述一个或多个处理器被配置为确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与运动向量残差的第一分量相关联的第一精度等级,以及与所述运动向量残差的第二分量相关联的第二精度等级,所述运动向量残差与所述当前译码单元相关联;基于所述运动向量残差、以及所述第一精度等级和所述第二精度等级,获得与所述当前译码单元相关联的运动向量;以及基于所述译码模式和所述运动向量,对所述图片信息的至少一部分进行解码。
一般来说,实施例的另一示例可涉及包括一个或多个处理器的装置,所述一个或多个处理器被配置为确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与运动向量残差的第一分量相关联的第一精度等级,以及与所述运动向量残差的第二分量相关联的第二精度等级,所述运动向量残差与所述当前译码单元相关联;基于所述运动向量残差、以及所述第一精度等级和所述第二精度等级,获得与图片信息的译码单元相关联的运动向量;以及基于所述译码模式和所述运动向量,对所述图片信息的至少一部分进行编码。
一般来说,实施例的另一示例可涉及一种方法,所述方法包括:确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与对应于第一参考图片列表的第一运动向量残差相关联的第一精度等级,以及与对应于第二参考图片列表的第二运动向量残差相关联的第二精度等级;基于所述第一运动向量残差和所述第一精度等级,获得第一运动向量,且基于所述第二运动向量残差和所述第二精度等级,获得第二运动向量;以及基于所述译码模式、以及所述第一运动向量和所述第二运动向量,对所述图片信息的至少一部分进行解码。
一般来说,实施例的另一示例可涉及一种方法,所述方法包括:确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与对应于第一参考图片列表的第一运动向量残差相关联的第一精度等级,以及与对应于第二参考图片列表的第二运动向量残差相关联的第二精度等级;基于所述第一运动向量残差和所述第一精度等级,获得第一运动向量,且基于所述第二运动向量残差和所述第二精度等级,获得第二运动向量;以及基于所述译码模式、以及所述第一运动向量和第二运动向量,对所述图片信息的至少一部分进行编码。
一般来说,实施例的另一示例可涉及包括一个或多个处理器的装置,所述一个或多个处理器被配置为确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与对应于第一参考图片列表的第一运动向量残差相关联的第一精度等级,以及与对应于第二参考图片列表的第二运动向量残差相关联的第二精度等级;基于所述第一运动向量残差和所述第一精度等级,获得第一运动向量,且基于所述第二运动向量残差和所述第二精度等级,获得第二运动向量;以及基于所述译码模式、以及所述第一运动向量和所述第二运动向量,对所述图片信息的至少一部分进行解码。
一般来说,实施例的另一示例可涉及包括一个或多个处理器的装置,所述一个或多个处理器被配置为确定与包括图片信息的当前译码单元相关联的译码模式;基于所述译码模式,确定与对应于第一参考图片列表的第一运动向量残差相关联的第一精度等级,以及与对应于第二参考图片列表的第二运动向量残差相关联的第二精度等级;基于所述第一运动向量残差和所述第一精度等级,获得第一运动向量,且基于所述第二运动向量残差和所述第二精度等级,获得第二运动向量;以及基于所述译码模式、以及所述第一运动向量和所述第二运动向量,对所述图片信息的至少一部分进行编码。
一般来说,实施例的另一示例可以涉及根据本文描述的实施例的一个或多个示例的方法或装置,其中第一分量对应于运动向量残差的x分量;而第二分量对应于运动向量残差的y分量。
一般来说,实施例的另一示例可以涉及根据本文描述的实施例的一个或多个示例的方法或装置,其中第一精度等级表示第一运动向量残差的第一准确度等级;且第二精度等级表示所述第二运动向量残差的第二精度等级。
一般来说,实施例的另一示例可涉及根据本文描述的实施例的一个或多个示例的方法或装置,其中第一准确度等级不同于第二准确度等级。
一般来说,实施例的另一示例可涉及根据本文所描述的实施例的一个或多个示例的方法或装置,其中译码模式包括帧内块复制模式。
一般来说,实施例的另一示例可涉及根据本文所描述的实施例的一个或多个示例的方法或装置,其中译码模式包括平移自适应运动向量预测模式。
一般来说,实施例的另一实例可涉及根据本文所描述的实施例的一个或多个示例的方法或装置,其中译码模式包括仿射自适应运动向量预测模式。
一般来说,实施例的另一实例可涉及被格式化以包含编码的图片信息的比特流,其中通过基于根据本发明的方法的实施例的示例中的任何一者或多者处理所述图片信息来编码所述编码的图片信息。
一般来说,实施例的一个或多个其它示例还可以提供计算机可读存储介质,例如,非易失性计算机可读存储介质,其上存储有用于根据本文描述的方法或装置对诸如视频数据的图片信息进行编码或解码的指令。
一般来说,实施例的至少一个示例可以涉及包括指令的计算机程序产品,所述指令当由计算机执行时,使计算机执行根据本文描述的实施例的一个或多个示例的方法。
一般来说,实施例的至少一个示例可以涉及存储可执行程序指令的非暂时性计算机可读介质,所述可执行程序指令使执行指令的计算机执行根据本文描述的实施例的一个或多个示例的方法。
一般来说,实施例的至少一个示例可以涉及包括根据本文描述的实施例的任何一个或多个示例生成的数据的信号。
一般来说,实施例的至少一个实例可涉及比特流,其经格式化以包含根据本文中所描述的实施例的示例中的任何一者或多者而产生的语法元素及编码的图像信息。
一般来说,实施例的至少一个示例可以涉及计算机可读存储介质,其上存储有根据本文描述的方法或装置生成的比特流。
一般来说,实施例的至少一个示例可以涉及传送或接收根据本文描述的方法或装置生成的比特流或信号。
一般来说,实施例的至少一个示例可以涉及包括根据本文描述的实施例的示例中的任何一个或多个的装置的设备;以及(i)天线,被配置为接收信号,所述信号包括表示所述图像信息的数据,(ii)频带限制器,被配置为将所接收的信号限制到包括表示所述图像信息的所述数据的频带,以及(iii)显示器,被配置为显示根据所述图像信息的图像。
一般来说,实施例的至少一个示例可以涉及如本文所述的设备,其中,所述设备包括以下中的一者:电视、电视信号接收机、机顶盒、网关设备、移动设备、蜂窝电话、平板电脑、或其他电子设备。
已经描述了各种实施例。实施例可以包括跨越各种不同的权利要求类别和类型的单独的或以任何组合的以下特征或实体中的任何特征或实体:
·在编码器和/或解码器中提供译码运动向量差值(或MV残差)的精度等级,所述精度等级在所述译码的运动向量差值的x分量和y分量之间被区分;
·在双预测块的情况下,在编码器和/或解码器中提供译码运动向量差(或MV残差)的精度等级,所述精度等级在L0和L1参考图像列表之间被区分,其中不使用对称运动向量差译码;
·在编码器和/或解码器中提供译码运动向量差(或MV残差)的精度等级,所述精度等级在译码的运动向量差的x分量和y分量之间被区分,其中所考虑的块通过诸如VVC的帧内块复制模式来译码;
·在编码器和/或解码器中提供译码运动向量差(或MV残差)的精度等级,所述精度等级在所述译码的运动向量差的x分量和y分量之间被区分,其中所考虑的块通过诸如VVC的帧间平移AMVP模式来译码;
·在编码器和/或解码器中提供译码运动向量差(或MV残差)的精度等级,所述精度等级在所述译码的运动向量差的x分量和y分量之间被区分,所考虑的块通过VVC的帧间仿射AMVP模式来译码;
·在双预测块的情况下,在编码器和/或解码器中提供译码运动向量差(或MV残差)的精度等级,所述精度等级在L0和L1参考图像列表之间被区分,其中不使用对称运动向量差译码,并且其中通过诸如VVC的帧间平移AMVP模式对所考虑的块进行译码;
·在双预测块的情况下,在编码器和/或解码器中提供译码运动向量差(或MV残差)的精度等级,所述精度等级在L0和L1参考图像列表之间被区分,其中不使用对称运动向量差译码,并且其中通过诸如VVC的帧间仿射AMVP模式来译码所考虑的块。
·在编码器和/或解码器中提供诸如VVC的AMVR工具中的增加的灵活性;
·在编码器和/或解码器中提供用于在译码的运动向量差(MVd)的x值和y值之间区分的精度等级;
·在双预测编码单元的情况下,在编码器和/或解码器中提供用于区分L0和L1运动向量差编码之间的精度等级。
·在编码器和/或解码器中提供根据任何实施例、特征或实体的AMVR工具(例如VVC的AMVR工具)中的增加的灵活性,单独地或以任何组合,如本文所述,还基于提供降低的复杂性和/或改进的压缩效率。
·在所述信令中插入语法元素,所述语法元素使得所述编码器和/或解码器能够单独地或以任何组合根据所述实施例、特征或实体中的任一者提供编码和/或解码,如本文所描述。
·基于这些语法元素,单独地或以任何组合选择所述特征或实体,如本文所述以在解码器处应用。
·一种包括所描述的语法元素中的一者或多者或其变型的比特流或信号。
·在所述信令中插入语法元素,所述语法元素使得所述解码器能够以与编码器所使用的编码方式相对应的方式提供解码。
·创建和/或发送和/或接收和/或解码包括一个或多个所描述的语法元素或其变型的比特流或信号。
·一种TV、机顶盒、蜂窝电话、平板电脑或其他电子设备,其提供根据实施例、特征或实体中的任一者单独地或以任何组合的方式应用编码和/或解码,如本文所述。
·一种TV、机顶盒、蜂窝电话、平板电脑或其他电子设备,其单独地或以任何组合地根据任何实施例、特征或实体执行编码和/或解码,如本文所述,并且显示(例如,使用监视器、屏幕或其他类型的显示器)所得图像。
·一种TV、机顶盒、蜂窝电话、平板电脑或其他电子设备,其调谐(例如,使用调谐器)频道以接收包括编码图像的信号,并且如本文所述单独地或以任何组合根据实施例、特征或实体中的任一者执行编码和/或解码。
·一种TV、机顶盒、蜂窝电话、平板电脑或其他电子设备,其通过空中接收(例如,使用天线)包括编码图像的信号,并且单独地或以任何组合根据实施例、特征或实体中的任一者执行编码和/或解码,如本文所述。
·一种存储程序代码的计算机程序产品,所述程序代码在由根据任一实施例、特征或实体的计算机编码和/或解码时单独地或以任何组合来执行,如本文所述。
·一种包括可执行程序指令的非暂时性计算机可读介质,所述可执行程序指令使计算机执行所述指令以单独地或以任何组合的方式实现根据实施例、特征或实体中的任一者的编码和/或解码,如本文所述。
在本公开中,还支持和设想了各种其它一般化的以及特殊化的实施例。
语法结构列表1:根据实施例1的coding_unit语法结构的示例。
Figure BDA0003492189880000481
Figure BDA0003492189880000491
Figure BDA0003492189880000501
Figure BDA0003492189880000511
语法结构列表2:根据实施例2的coding_unit语法结构的示例。
Figure BDA0003492189880000521
Figure BDA0003492189880000531
Figure BDA0003492189880000541
Figure BDA0003492189880000551
语法结构列表3:根据实施例3的coding_unit语法结构的示例。
Figure BDA0003492189880000561
Figure BDA0003492189880000571
Figure BDA0003492189880000581
Figure BDA0003492189880000591
语法结构列表4:根据实施例4的coding_unit语法结构的示例。
Figure BDA0003492189880000601
Figure BDA0003492189880000611
Figure BDA0003492189880000621
Figure BDA0003492189880000631
语法结构列表5:根据实施例5的coding_unit语法结构的示例。
Figure BDA0003492189880000641
Figure BDA0003492189880000651
Figure BDA0003492189880000661
Figure BDA0003492189880000671

Claims (29)

1.一种方法,包括:
确定与包括图片信息的当前译码单元相关联的译码模式;
基于所述译码模式,确定与运动向量信息的第一部分相关联的第一精度等级,及与所述运动向量信息的第二部分相关联的第二精度等级,其中所述运动向量信息与所述当前译码单元相关联;
基于所述运动向量信息、以及所述第一精度等级和所述第二精度等级,获得与所述当前译码单元相关联的运动向量;以及
基于所述译码模式和所述运动向量,对包括在所述当前译码单元中的所述图片信息的至少一部分进行解码。
2.一种方法,包括:
确定与包括图片信息的当前译码单元相关联的译码模式;
基于所述译码模式,确定与运动向量信息的第一部分相关联的第一精度等级,及与所述运动向量信息的第二部分相关联的第二精度等级,其中所述运动向量信息与所述当前译码单元相关联;
基于所述运动向量信息、以及所述第一精度等级和所述第二精度等级,获得与所述当前译码单元相关联的运动向量;以及
基于所述译码模式和所述运动向量,对所述图片信息的至少一部分进行编码。
3.一种装置,包括:
一个或多个处理器,被配置为:
确定与包括图片信息的当前译码单元相关联的译码模式;
基于所述译码模式,确定与运动向量信息的第一部分相关联的第一精度等级,及与所述运动向量信息的第二部分相关联的第二精度等级,其中所述运动向量信息与所述当前译码单元相关联;
基于所述运动向量信息、以及所述第一精度等级和所述第二精度等级,获得与所述当前译码单元相关联的运动向量;以及
基于所述译码模式和所述运动向量,对所述图片信息的至少一部分进行解码。
4.一种装置,包括:
一个或多个处理器,被配置为:
确定与包括图片信息的当前译码单元相关联的译码模式;
基于所述译码模式,确定与运动向量信息的第一部分相关联的第一精度等级,及与所述运动向量信息的第二部分相关联的第二精度等级,其中所述运动向量信息与所述当前译码单元相关联;
基于所述运动向量信息、以及所述第一精度等级和所述第二精度等级,获得与图片信息的译码单元相关联的运动向量;以及
基于所述译码模式和所述运动向量,对所述图片信息的至少一部分进行编码。
5.根据前述权利要求中任一项所述的方法或装置,其中,所述运动向量信息包括运动向量残差。
6.根据权利要求1-4中任一项所述的方法或装置,其中所述运动向量信息包括对应于第一参考图片列表的第一运动向量残差及对应于第二参考图片列表的第二运动向量残差。
7.一种方法,包括:
确定与包括图片信息的当前译码单元相关联的译码模式;
基于所述译码模式,确定与运动向量残差的第一分量相关联的第一精度等级,及与所述运动向量残差的第二分量相关联的第二精度等级,其中所述运动向量残差与所述当前译码单元相关联;
基于所述运动向量残差、以及所述第一精度等级和所述第二精度等级,获得与所述当前译码单元相关联的运动向量;以及
基于所述译码模式和所述运动向量,对包括在所述当前译码单元中的所述图片信息的至少一部分进行解码。
8.一种方法,包括:
确定与包括图片信息的当前译码单元相关联的译码模式;
基于所述译码模式,确定与运动向量残差的第一分量相关联的第一精度等级,及与所述运动向量残差的第二分量相关联的第二精度等级,其中所述运动向量残差与所述当前译码单元相关联;
基于所述运动向量残差、以及所述第一精度等级和所述第二精度等级,获得与所述当前译码单元相关联的运动向量;以及
基于所述译码模式和所述运动向量,对所述图片信息的至少一部分进行编码。
9.一种装置,包括:
一个或多个处理器,被配置为:
确定与包括图片信息的当前译码单元相关联的译码模式;
基于所述译码模式,确定与运动向量残差的第一分量相关联的第一精度等级,及与所述运动向量残差的第二分量相关联的第二精度等级,其中所述运动向量残差与所述当前译码单元相关联;
基于所述运动向量残差、以及所述第一精度等级和所述第二精度等级,获得与所述当前译码单元相关联的运动向量;以及
基于所述译码模式和所述运动向量,对所述图片信息的至少一部分进行解码。
10.一种装置,包括:
一个或多个处理器,被配置为:
确定与包括图片信息的当前译码单元相关联的译码模式;
基于所述译码模式,确定与运动向量残差的第一分量相关联的第一精度等级,及与所述运动向量残差的第二分量相关联的第二精度等级,其中所述运动向量残差与所述当前译码单元相关联;
基于所述运动向量残差、以及所述第一精度等级和所述第二精度等级,获得与图片信息的译码单元相关联的运动向量;以及
基于所述译码模式和所述运动向量,对所述图片信息的至少一部分进行编码。
11.根据权利要求5或7-10中任一项所述的方法或装置,其中
所述第一分量对应于所述运动向量残差的x分量;
所述第二分量对应于所述运动向量残差的y分量;
所述第一精度等级表示所述x分量的第一准确度等级;以及
所述第二精度等级表示所述y分量的第二准确度等级。
12.根据权利要求11所述的方法或装置,其中,所述第一准确度等级不同于所述第二准确度等级。
13.根据前述权利要求中任一项所述的方法或装置,其中所述译码模式包括帧内块复制模式。
14.根据权利要求1-12中任一项所述的方法或装置,其中所述译码模式包括平移自适应运动向量预测模式。
15.根据权利要求1-12中任一项所述的方法或装置,其中所述译码模式包括仿射自适应运动向量预测模式。
16.一种方法,包括:
确定与包括图片信息的当前译码单元相关联的译码模式;
基于所述译码模式,确定与第一运动向量残差相关联的第一精度等级和与第二运动向量残差相关联的第二精度等级,其中所述第一运动向量残差对应于第一参考图片列表,所述第二运动向量残差对应于第二参考图片列表;
基于所述第一运动向量残差和所述第一精度等级,获得第一运动向量,以及基于所述第二运动向量残差和所述第二精度等级,获得第二运动向量;以及
基于所述译码模式、以及所述第一运动向量和所述第二运动向量,对所述图片信息的至少一部分进行解码。
17.一种方法,包括:
确定与包括图片信息的当前译码单元相关联的译码模式;
基于所述译码模式,确定与第一运动向量残差相关联的第一精度等级和与第二运动向量残差相关联的第二精度等级,其中所述第一运动向量残差对应于第一参考图片列表,所述第二运动向量残差对应于第二参考图片列表;
基于所述第一运动向量残差和所述第一精度等级,获得第一运动向量,以及基于所述第二运动向量残差和所述第二精度等级,获得第二运动向量;以及
基于所述译码模式、以及所述第一运动向量和所述第二运动向量,对所述图片信息的至少一部分进行编码。
18.一种装置,包括:
一个或多个处理器,被配置为:
确定与包括图片信息的当前译码单元相关联的译码模式;
基于所述译码模式,确定与第一运动向量残差相关联的第一精度等级和与第二运动向量残差相关联的第二精度等级,其中所述第一运动向量残差对应于第一参考图片列表,所述第二运动向量残差对应于第二参考图片列表;
基于所述第一运动向量残差和所述第一精度等级,获得第一运动向量,以及基于所述第二运动向量残差和所述第二精度等级,获得第二运动向量;以及
基于所述译码模式、以及所述第一运动向量和所述第二运动向量,对所述图片信息的至少一部分进行解码。
19.一种装置,包括:
一个或多个处理器,被配置为:
确定与包括图片信息的当前译码单元相关联的译码模式;
基于所述译码模式,确定与第一运动向量残差相关联的第一精度等级和与第二运动向量残差相关联的第二精度等级,其中所述第一运动向量残差对应于第一参考图片列表,所述第二运动向量残差对应于第二参考图片列表;
基于所述第一运动向量残差和所述第一精度等级,获得第一运动向量,以及基于所述第二运动向量残差和所述第二精度等级,获得第二运动向量;以及
基于所述译码模式、以及所述第一运动向量和所述第二运动向量,对所述图片信息的至少一部分进行编码。
20.根据权利要求6或16-19中任一项所述的方法或装置,其中
所述第一精度等级表示所述第一运动向量残差的第一准确度等级;以及
所述第二精度等级表示所述第二运动向量残差的第二准确度等级。
21.根据权利要求20所述的方法或装置,其中所述第一准确度等级不同于所述第二准确度等级。
22.根据权利要求6或16-21中任一项所述的方法或设备,其中所述译码模式包括平移自适应运动向量预测模式。
23.根据权利要求6或16-21中任一项所述的方法或设备,其中所述译码模式包括仿射自适应运动向量预测模式。
24.一种包括指令的计算机程序产品,所述指令在由计算机执行时使所述计算机执行根据权利要求1、2、7、8、11-17或20-23中任一项所述的方法。
25.一种非暂态计算机可读介质,存储可执行程序指令,所述可执行程序指令使执行所述指令的计算机执行根据权利要求1、2、7、8、11-17或20-23中任一项所述的方法。
26.一种信号,包括根据权利要求1、2、7、8、11-17或20-23中任一项所述的方法生成的数据。
27.一种比特流,其经格式化以包括根据权利要求1、2、7、8、11-17或20-23中任一项所述的方法的语法元素和编码的图像信息。
28.一种设备,包括:
根据权利要求3-6、9-15或18-23中任一项所述的装置;以及
以下至少一者:(i)天线,被配置为接收信号,所述信号包括表示所述图像信息的数据,(ii)频带限制器,被配置为将所接收的信号限制到包括表示所述图像信息的所述数据的频带,及(iii)显示器,被配置为显示来自所述图像信息的图像。
29.根据权利要求28所述的设备,其中所述设备包括以下中的一者:电视、电视信号接收器、机顶盒、网关设备、移动设备、手机、平板计算机、或其它电子设备。
CN202080054531.2A 2019-06-20 2020-06-18 用于视频编码和解码的运动向量处理 Pending CN114270844A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19305795 2019-06-20
EP19305795.7 2019-06-20
PCT/EP2020/066862 WO2020254459A1 (en) 2019-06-20 2020-06-18 Motion vector processing for video encoding and decoding

Publications (1)

Publication Number Publication Date
CN114270844A true CN114270844A (zh) 2022-04-01

Family

ID=67437684

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080054531.2A Pending CN114270844A (zh) 2019-06-20 2020-06-18 用于视频编码和解码的运动向量处理

Country Status (5)

Country Link
US (1) US20220360813A1 (zh)
EP (1) EP3987796A1 (zh)
KR (1) KR20220047729A (zh)
CN (1) CN114270844A (zh)
WO (1) WO2020254459A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022197137A1 (ko) * 2021-03-19 2022-09-22 현대자동차주식회사 성분별 적응적 공간해상도를 갖는 움직임벡터를 이용하는 비디오 코딩방법 및 장치
US20230396797A1 (en) * 2022-06-06 2023-12-07 Tencent America LLC Translational motion vector coding in affine mode

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1265649C (zh) * 2002-01-24 2006-07-19 株式会社日立制作所 运动图像的编码方法、解码方法、编码装置及解码装置
US10531116B2 (en) * 2014-01-09 2020-01-07 Qualcomm Incorporated Adaptive motion vector resolution signaling for video coding
US11012715B2 (en) * 2018-02-08 2021-05-18 Qualcomm Incorporated Intra block copy for video coding

Also Published As

Publication number Publication date
US20220360813A1 (en) 2022-11-10
KR20220047729A (ko) 2022-04-19
EP3987796A1 (en) 2022-04-27
WO2020254459A1 (en) 2020-12-24

Similar Documents

Publication Publication Date Title
WO2020102067A1 (en) Virtual pipeline for video encoding and decoding
US20240171750A1 (en) Motion vector derivation in video encoding and decoding
US20220060688A1 (en) Syntax for motion information signaling in video coding
CN112753222A (zh) 视频编码和解码中的运动矢量预测
US20240064316A1 (en) Chroma processing for video encoding and decoding
US20220360813A1 (en) Motion vector processing for video encoding and decoding
CN113647112A (zh) 用于视频编码和解码的熵编解码
US20230018401A1 (en) Motion vector prediction in video encoding and decoding
JP2024513873A (ja) 切り替え可能な補間フィルタを用いる幾何学的分割
US11785236B2 (en) Parameter grouping among plural coding units for video encoding and decoding
CN114208194A (zh) 用于视频编码和解码的帧间预测参数推导
EP3706423A1 (en) Local illumination compensation for video encoding or decoding
US20220345693A1 (en) Coding mode information propagation for video coding
US20220295057A1 (en) Switchable interpolation filters
US20230024223A1 (en) Intra sub partitions for video encoding and decoding combined with multiple transform selection, matrix weighted intra prediction or multi-reference-line intra prediction
US20210344925A1 (en) Block size based motion vector coding in affine mode
EP3700201A1 (en) Separate coding trees for luma and chroma prediction
EP3706419A1 (en) Multi-model local illumination compensation for video encoding or decoding
WO2022101018A1 (en) A method and an apparatus for encoding or decoding a video
JP2022537222A (ja) 局所照明補正フラグインヘリタンス

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination