CN113826388A - 用于混合视频编码的编码器、解码器、方法及视频比特流以及计算机程序 - Google Patents

用于混合视频编码的编码器、解码器、方法及视频比特流以及计算机程序 Download PDF

Info

Publication number
CN113826388A
CN113826388A CN202080035664.5A CN202080035664A CN113826388A CN 113826388 A CN113826388 A CN 113826388A CN 202080035664 A CN202080035664 A CN 202080035664A CN 113826388 A CN113826388 A CN 113826388A
Authority
CN
China
Prior art keywords
decoder
video sequence
motion vector
processing scheme
encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080035664.5A
Other languages
English (en)
Inventor
本杰明·布罗斯
马丁·温肯
阿纳斯塔西娅·亨克尔
保罗·凯德尔
伊万·祖帕西奇
海科·施瓦尔茨
德特勒夫·马尔佩
托马斯·威甘德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN113826388A publication Critical patent/CN113826388A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种用于混合视频编码的编码器,编码器用于基于输入视频内容提供视频序列的编码表示,并且编码器被配置为:确定与视频序列的部分相关的一个或多个句法元素;基于一个或多个句法元素所描述的属性来选择待被应用于视频序列的部分的处理方案,处理方案用于获取用于在视频序列的部分内的整数和/或分数位置处的运动补偿预测的样本;将指示所选处理方案的索引进行编码,使得给定的经编码索引值根据一个或多个句法元素所描述的属性表示不同处理方案;以及提供比特流作为视频序列的编码表示,比特流包括一个或多个句法元素与经编码索引。

Description

用于混合视频编码的编码器、解码器、方法及视频比特流以及 计算机程序
技术领域
根据本发明的实施例涉及用于混合视频编码的编码器及解码器。根据本发明的另外实施例涉及用于混合视频编码的方法。根据本发明的另外实施例涉及用于混合视频编码的视频比特流。
背景技术
所有现代视频编码标准都采用利用运动向量(MVs)的分数样本准确度的运动补偿预测(MCP)。为了获得在分数样本位置处的参考图片的样本值,使用内插滤波。
在使用四分之一亮度样本的运动向量准确度的高效视频编码(HEVC)标准中,有15个分数亮度样本位置是使用各种一维有限脉冲响应(FIR)滤波器计算的。然而,对于每个分数样本位置,内插滤波器是固定的。
代替针对每个分数样本位置具有固定内插滤波器,可以从内插滤波器的集合中为每个分数样本位置选择内插滤波器。允许在片段(slice)级别上在不同内插滤波器之间进行切换的方法包括不可分离的自适应内插滤波器(AIF)[1]、可分离的自适应内插滤波器(SAIF)[2]、带偏移的切换内插滤波(SIFO)[3]及增强型自适应内插滤波器(EAIF)[4]。依每个片段显式地用信号发送内插滤波器系数(例如在AIF、SAIF、EAIF中),或指示使用预定内插滤波器的集合中的哪一个内插滤波器(例如在SIFO中)。
即将到来的通用视频编码(VVC)标准的当前草案[5]支持所谓的自适应运动向量分辨率(AMVR)。使用AMVR,在以下可能性中可以共同选择运动向量预测器(MVP)与运动向量差(MVD)的准确度:
-四分之一样本(QPEL):四分之一亮度样本的运动向量准确度;
-全样本(FPEL):亮度样本的运动向量准确度;
-4样本(4PEL):四个亮度样本的运动向量准确度。
为了选择期望准确度,在比特流中传输额外的句法元素。在双向预测的情况下,所指示准确度应用于list0与list1。AMVR在跳过(skip)与合并(merge)模式中不可用。此外,如果所有MVD都等于零,则AMVR不可用。在使用除QPEL以外的任何其他准确度的情况下,在添加MVD以获得MV之前,首先将MVP舍入至指定准确度。
本公开的一些实施例可以实现上述概念中的一个或多个,或者可以在其上下文中使用。例如,实施例可以实现HEVC或VVC标准,并且可以使用AMVR与上述MV准确度。
期望有一种用于编码、解码以及传输视频数据的概念,该概念提供比特率、复杂度与混合视频编码的可达质量之间的改进折衷。
发明内容
本公开的方面涉及一种用于混合视频编码(例如,利用预测误差的预测与变换编码的视频编码)的编码器,该编码器用于基于输入视频内容提供视频序列的编码表示,以及该编码器被配置为:确定与视频序列的部分(例如,区块)相关的一个或多个句法元素(例如,运动向量准确度句法元素);基于一个或多个句法元素所描述的属性(例如,通过一个或多个句法元素用信号发送的解码器设置或通过一个或多个句法元素用信号发送的视频序列的部份的特性)来选择待被(例如,解码器)应用于视频序列的部分的处理方案(例如,内插滤波器),该处理方案用于获取用于在视频序列的部分内的整数和/或分数位置处的运动补偿预测的样本(例如有关于视频序列,例如样本,例如分数样本);将指示所选处理方案的索引进行编码(例如根据一个或多个句法元素),使得给定的经编码索引值根据一个或多个句法元素(例如根据一个或多个句法元素的值)所描述的属性表示(例如关联于)不同处理方案;以及提供(例如传输、上载、储存成文件)比特流作为视频序列的编码表示,该比特流包括一个或多个句法元素与经编码索引。
基于部分的属性来选择待被应用于部分的处理方案,允许例如根据部分的特性使所应用处理方案适配该部分。例如,可以为视频序列的不同部分选择不同处理方案。例如,特定的处理方案可能特别有益于将具有给定属性的部份进行编码,因为特定的处理方案可以适于促进特别有效的编码和/或促成具有给定属性的部分的编码表示具有特别高质量。因此,根据部分的属性来选择处理方案(例如,其中可能的处理方案的集合可以适配于部分的属性)可以同时提高视频序列的整体效率与编码质量。编码的效率可以指编码的低计算量,或者可以指经编码信息的高压缩率。
通过提供指示所选处理方案的经编码索引,可以确保该部分的适当解码。由于经编码索引的给定值可以根据部分的属性来表示不同处理方案,因此编码器可以根据属性来适配索引的编码。例如,该经编码索引的可能值的数量可被限制为可应用于具有属性的部分的处理方案的数量。因此,即使可选的处理方案(例如与不同属性相关联)的总数很大,经编码索引也可能需要少量的比特(例如,其可以适配于鉴于当前考虑的部分的实际属性可选的处理方案的数量)。因此,编码器可以利用关于该部分的属性的知识,通过确定一个或多个句法元素,该知识对于编码器是可用的,以有效地对索引进行编码。尽管可以在比特流中指示所选处理方案,但是根据属性选择处理方案(其中与可用的不同处理方案的总数相比,属性可以减少当前考虑的部分的可能的处理方案的数量)并根据属性对索引进行编码的组合可以因此提高编码的整体效率。
根据实施例,编码器被配置为根据一个或多个句法元素所描述的属性来适配将索引值映射到经编码索引值的映射规则。根据属性来适配映射规则可以确保索引可被编码以使得给定的经编码索引值根据属性来表示不同处理方案。
根据实施例,编码器被配置为根据一个或多个句法元素所描述的属性来适配用于提供经编码索引的二进制代码(bins)的数量,该经编码索引指示所选处理方案。因此,编码器可以使二进制代码的数量适配于对于属性允许的处理方案的数量,使得若对于该属性,少量的处理方案是允许的,则编码器可以使用少量的二进制代码,从而减小比特流的尺寸。
根据实施例,编码器被配置为鉴于一个或多个句法元素所描述的属性来确定允许的处理方案的集合并从所确定集合中选择处理方案。通过鉴于属性确定允许的处理方案的集合,编码器可以从一个或多个句法元素中推断出关于可选的处理方案的信息。因此,编码器使用从确定一个或多个句法元素已经可用的信息来选择处理方案,因此提高编码的效率。此外,依靠处理方案的集合来选择处理方案可以将允许的处理方案的数量限制到处理方案的集合,从而能够将索引编码成为较小尺寸的经编码索引。
根据实施例,编码器被配置为确定对于视频序列的部分单个处理方案是否是允许的,并且响应于发现对于视频序列的部分仅单个处理方案(例如空间滤波器或内插滤波器)是允许的而选择性地省略对经编码索引的包含。因此,编码器可以例如从该部分的属性推断对于该部分单个处理方案是允许的,并且选择该单个处理方案作为待被应用于该部分的处理方案。在比特流中省略对经编码索引的包含可以减小比特流的尺寸。
根据实施例,编码器被配置为选择将索引值映射到经编码索引值的映射规则,使得表示经编码索引值的二进制代码的数量适配于对于视频序列的部分允许的处理方案的数量。因此,编码器可以使二进制代码的数量适配于对于部分允许的处理方案的数量,使得若对于该部分少量的处理方案是允许的,则经编码索引可以具有少量的二进制代码,因此减小比特流的尺寸。
根据实施例,在编码器中,处理方案是滤波器(例如内插滤波器)或滤波器(例如,内插滤波器)的集合(例如,通过运动向量的分数部分参数化的)。
根据实施例,在编码器中,滤波器的集合中的滤波器可分别应用于(例如,在空间方向,例如x方向和/或y方向上依次可应用的一维滤波器)视频序列的部分。因此,可以单独地选择滤波器,增加了选择滤波器的灵活性,使得滤波器的集合可以非常准确地适配于部分的属性。
根据实施例,编码器被配置为为视频帧或图片内的不同区块(例如,不同的预测单元PU和/或编码单元CU和/或编码树单元CTU)选择不同处理方案(例如,不同内插滤波器)(不同内插滤波器用于视频序列的不同部分中或单个视频帧或图片的不同部分中的相同分数样本位置处)。因此,处理方案的选择可以考虑不同区块的各个属性,因此有利于增强区块的编码或编码效率,或减小比特流的尺寸。
根据实施例,编码器被配置为将指示所选处理方案的索引进行编码(例如,根据一个或多个句法元素)使得给定的经编码索引值根据运动向量准确度(例如,其可以使用在比特流中的句法元素来用信号发送,并且可以例如从以下值中选出一个:QPEL、HPEL、FPEL、4PEL)表示(如,关联于)不同处理方案。因此,索引的编码可以取决于MV准确度,例如取决于对于该MV准确度允许的处理方案的数量。由于对于MV准确度的一些设置,允许的处理方案的数量可以小于对于其他的允许的处理方案的数量,这是减小比特流的尺寸的有效方式。
根据实施例,在编码器中,一个或多个句法元素包括运动向量准确度(例如,四分之一样本,二分之一样本,全样本)、分数样本位置、区块尺寸、区块形状、预测假设的数量(例如,用于单一预测的一个假设,用于双预测的两个假设)、预测模式(例如,平移帧间(translational inter)、仿射帧间(affine inter)、平移合并(translational merge)、仿射合并(affine merge)、组合的帧内/帧间(combined inter/intra))、经编码残差信号的可用性(例如经编码区块标志)、经编码残差信号的谱属性、参考图片信号(例如运动数据限定的参考区块,参考区块内的来自并置的预测单元PUs的区块边缘,参考信号的高或低频特性)、环路滤波器数据(例如来自样本自适应偏移滤波器SAO的边缘偏移或频带偏移分类,解区块滤波器决策及边界强度)、运动向量长度(例如,仅针对长运动向量或特定方向启用额外的平滑滤波器)或自适应运动向量分辨率模式中的至少一个。
根据实施例,编码器被配置为将指示所选处理方案(例如,根据一个或多个句法元素)的索引进行编码,使得给定的经编码索引值根据运动向量的分数部分(或多个分数部分)表示(例如关联于)不同处理方案(例如,其中根据考虑的部分的所有运动向量是否指向整数样本位置,例如亮度样本位置,使用不同编码方案)。因此,编码器可以使索引的编码适配于对于运动向量的分数部分允许的多种处理方案。由于可以从该部分确定运动向量的分数部分,因此这是减小比特流的尺寸的有效方式。
根据实施例,编码器被配置为,为运动向量准确度(例如子样本运动向量准确度,如HPEL),其在最大运动向量准确度(例如比之前提到的运动向量准确度更好的子样本运动向量分辨率,如QPEL)与最小运动向量准确度(例如4PEL)之间,或为在最大运动向量准确度(例如QPEL)与全样本运动向量准确度(例如FPEL)之间的运动向量准确度(例如HPEL),选择性地确定处理方案的集合(例如“多可能性编码”),并从所确定集合中选择处理方案。例如,对于最大MV准确度,可能有一个特别有效的处理方案,因此可能有益的是不确定处理方案的集合,同时对于最大或全样本MV准确度,选择处理方案可能是不必要的,因为可能没有可选的处理方案可被应用。相比之下,对于最大MV准确度与全样本或最小MV准确度之间的MV准确度,可能特别有益的是将处理方案适配于该部分的属性。
根据实施例,编码器被配置为将用于在第一FIR滤波(例如,HEVC滤波)(例如,HEVC8-抽头滤波)、第二FIR滤波与第三FIR滤波之间进行选择的索引(处理方案索引,if_idx)进行编码。
根据实施例,编码器被配置为将用于在第一FIR滤波(例如,HEVC滤波)(例如,HEVC8-抽头滤波)与第二FIR滤波之间进行选择的索引(处理方案索引,if_idx)进行编码。
根据实施例,编码器被配置为在具有不同特性(例如较强低通特性对较弱低通特性)的处理方案(例如内插滤波器)之间进行选择(例如切换)。例如,具有强低通特性的处理方案或滤波器可以衰减高频噪声分量,使得可以增强视频序列的编码表示的质量。
根据实施例,编码器被配置为根据运动向量准确度和运动向量的分数样本位置或分数部分(或多个分数部分)选择映射规则。因此,编码器可将索引的编码适配于用于MV准确度与运动向量的分数部分允许的多种处理方案。由于可以从一个或多个句法元素来确定MV准确度与运动向量的分数部分,因此使用这些属性来确定多个允许的处理方案并相应地选择映射规则可以是非常有效的。
根据实施例,编码器被配置为根据运动向量准确度决定处理方案(例如,内插滤波器)的可用集合。
根据实施例,编码器被配置为在四分之一样本运动向量分辨率、二分之一样本运动向量分辨率、全样本运动向量分辨率及四样本运动向量分辨率之间进行选择(例如,其中在选择二分之一样本运动向量分辨率的情况下,选择性地包括描述处理方案或内插滤波器的索引元素,以及其中在其他情况下例如描述处理方案的索引元素被省略)。
根据实施例,在编码器中,处理方案包括一个或多个FIR滤波器。FIR滤波器是用于处理视频序列的特别稳定的滤波器。
本公开的另一方面涉及一种用于混合视频编码(例如,利用预测误差的预测及变换编码的视频编码)的编码器,编码器用于基于输入视频内容提供视频序列的编码表示。编码器被配置为:确定与视频序列的部分(例如区块)相关的一个或多个句法元素(例如运动向量准确度句法元素);基于一个或多个句法元素所描述的属性(例如,通过一个或多个句法元素用信号发送的解码器设置或通过一个或多个句法元素用信号发送的视频序列的部份的特性)来选择待被(例如,解码器)应用于视频序列的部分的处理方案(例如内插滤波器),该处理方案用于获取用于在视频序列的部分内的整数和/或分数位置处的运动补偿预测的样本(例如,有关于视频序列,例如样本,例如分数样本);根据一个或多个句法元素(例如,根据一个或多个句法元素的值)所描述的属性来选择用于提供指示所选处理方案的经编码索引的熵编码方案(其中,例如,若鉴于一个或多个考虑的句法元素仅一个处理方案是允许的,则熵编码方案所指定的二进制代码的数量可以等于零);以及提供(例如,传输、上载、储存成文件)比特流作为视频序列的编码表示,该比特流包括一个或多个句法元素并包括经编码索引(例如,若所选的二进制代码的数量大于零)。
基于部分的属性来选择待被应用于该部分的处理方案,提供关于先前方面所描述的等效功能与优点。此外,根据属性来选择熵编码方案能够使经编码索引的提供适配于该属性。例如,经编码索引的可能值的数量可被限制为可应用于具有该属性的部分的处理方案的数量。因此,即使对于不同部分可选的处理方案的总数很大,经编码索引也可能需要比特流中的少量的比特或甚至不需要比特。因此,基于关于部分的属性的知识来选择熵编码方案(通过确定一个或多个句法元素,该知识对于编码器是可用的),可以提供经编码索引的有效提供。因此,尽管所选处理方案可被指示在比特流中,但是根据属性来选择处理方案与熵编码方案可以因此提高编码的整体效率。
根据实施例,在编码器中,熵编码方案包括用于提供经编码索引的二值化方案。由于根据属性选择熵编码方案,因此根据属性可适配二值化方案,使得二值化方案可以提供经编码索引的特短表示。
根据实施例,在编码器中,二值化方案包括待被用于提供经编码索引的二进制代码的数量。因此,根据属性可以适配待被用于提供经编码索引的二进制代码的数量,使得编码器能够选择少量的二进制代码或者甚至不选择二进制代码来提供经编码索引,从而提供有效的编码。
根据实施例,编码器被配置为根据一个或多个句法元素所描述的属性来适配将索引值映射到经编码索引值的映射规则。
根据实施例,编码器被配置为根据一个或多个句法元素所描述的属性来适配用于提供经编码索引的二进制代码的数量,该经编码索引指示所选处理方案。
根据实施例,编码器被配置为鉴于一个或多个句法元素所描述的属性来确定允许的处理方案的集合,并从所确定集合中选择处理方案。
根据实施例,编码器被配置为确定对于视频序列的部分单个处理方案是否是允许的,并且响应于发现对于视频序列的部分仅单个处理方案(例如空间滤波器或内插滤波器)是允许的,选择性地省略对经编码索引的包含。
根据实施例,编码器被配置为选择将索引值映射到经编码索引值的映射规则,使得表示经编码索引值的二进制代码的数量适配于对于视频序列的部分允许的处理方案的数量。
根据实施例,在编码器中,处理方案是滤波器(例如,内插滤波器)或滤波器(例如,内插滤波器)的集合(例如,通过运动向量的分数部分参数化的)。
根据实施例,在编码器中,滤波器的集合中的滤波器可分别应用(例如,在空间方向,例如x方向和/或y方向上依次可应用的一维滤波器)于视频序列的部分。
根据实施例,编码器被配置为为视频帧或图片内的不同区块(例如,不同的预测单元PU和/或编码单元CU和/或编码树单元CTU)选择不同处理方案(例如,不同内插滤波器)(不同内插滤波器用于视频序列的不同部分中或单个视频帧或“图片”的不同部分中的相同分数样本位置)。
根据实施例,编码器被配置为将指示所选处理方案的索引进行编码(例如,根据一个或多个句法元素),使得给定的经编码索引值根据运动向量准确度(例如,其可以使用在比特流中的句法元素来用信号发送,以及可以例如从以下值中选出一个:QPEL、HPEL、FPEL、4PEL)表示(例如,关联于)不同处理方案。
根据实施例,在编码器中,一个或多个句法元素包括运动向量准确度(例如,四分之一样本,二分之一样本,全样本)、分数样本位置、区块尺寸、区块形状、预测假设的数量(例如,用于单一预测的一个假设,用于双预测的两个假设)、预测模式(例如,平移帧间、仿射帧间、平移合并、仿射合并、组合的帧间/帧内)、经编码残差信号的可用性(例如经编码区块标志)、经编码残差信号的谱属性、参考图片信号(例如运动数据限定的参考区块,参考区块内的来自并置的预测单元PUs的区块边缘,参考信号的高或低频特性)、环路滤波器数据(例如来自样本自适应偏移滤波器SAO的边缘偏移或频带偏移分类,解区块滤波器决策及边界强度)、运动向量长度(例如仅针对长运动向量或特定方向启用额外的平滑滤波器)或自适应运动向量分辨率模式中的至少一个。
根据实施例,编码器被配置为将指示所选处理方案的索引进行编码(例如根据一或多个句法元素),使得给定的经编码索引值根据运动向量的分数部分(或多个分数部分)表示(例如,关联于)不同处理方案(其中,例如根据考虑的部分的所有运动向量是否指向整数样本位置,例如亮度样本位置,使用不同编码方案)。
根据实施例,编码器被配置为为在最大运动向量准确度(例如,比之前提到的运动向量准确度更好的子样本运动向量分辨率)与最小运动向量准确度(例如,4PEL)之间的运动向量准确度(例如,子样本运动向量准确度,如HPEL)或为在最大运动向量准确度(例如,QPEL)与全样本运动向量准确度(例如,FPEL)之间的运动向量准确度(例如,HPEL)选择性地确定处理方案的集合(例如“多可能性编码”),并从所确定集合中选择处理方案。
根据实施例,编码器被配置为对用于在第一FIR滤波(例如,HEVC滤波)(例如,HEVC8-抽头滤波)、第二FIR滤波与第三FIR滤波之间进行选择的索引(处理方案索引,if_idx)进行编码。
根据实施例,编码器被配置为对用于在第一FIR滤波(例如,HEVC滤波)(例如,HEVC8-抽头滤波)与第二FIR滤波之间进行选择的索引(处理方案索引,if_idx)进行编码。
根据实施例,编码器被配置为在具有不同特性(例如较强低通特性对较弱低通特性)的处理方案(例如内插滤波器)之间进行选择(例如切换)。
根据实施例,编码器被配置为根据运动向量准确度和运动向量的分数样本位置或分数部分(多个分数部分)选择映射规则。
根据实施例,编码器被配置为根据运动向量准确度决定处理方案(例如,内插滤波器)的可用集合。
根据实施例,编码器被配置为在四分之一样本运动向量分辨率、二分之一样本运动向量分辨率、全样本运动向量分辨率以及四样本运动向量分辨率之间进行选择(例如,其中在选择二分之一样本运动向量分辨率的情况下,选择性地包括描述处理方案或内插滤波器的索引元素,以及其中在其他情况下例如描述处理方案的索引元素被省略)。
根据实施例,在编码器中,处理方案包括一个或多个FIR滤波器。
本公开的另一方面涉及一种用于混合视频解码(例如,利用预测误差的预测及变换解码的视频解码)的解码器,解码器用于基于视频序列的编码表示提供输出视频内容,解码器被配置为:获得(例如接收、下载、从文件打开)作为视频序列的编码表示的比特流;从比特流中识别与视频序列的部分(例如区块)相关的一个或多个句法元素(例如运动向量准确度句法元素)(以及经编码索引);基于一个或多个句法元素与索引(可以以编码形式包含在比特流中)来识别用于视频序列的部分的处理方案(例如内插滤波器,例如由编码器所选择的),该处理方案用于获取用于在视频序列的部分内的整数和/或分数位置处的运动补偿预测的样本(例如有关于视频序列,例如样本,例如分数样本),其中解码器被配置为根据一个或多个句法元素(例如根据一个或多个句法元素的值)将不同处理方案分配到给定的经编码索引值;以及将所识别处理方案应用于视频序列的部分。
解码器基于该思想,基于句法元素与索引来识别用于部分的处理方案,尽管表示索引的值的给定的经编码索引值可以与各种处理方案相关联。通过根据句法元素将处理方案分配给经编码索引值可以实现处理方案的识别。因此,解码器可以使用句法元素所提供的信息从可能与经编码索引值相关联的不同处理方案中识别处理方案。由于给定的经编码索引值可被分配给若干种处理方案,比特流的信息密度可能特别高,但解码器仍可以识别处理方案。
根据实施例,在解码器中,处理方案是滤波器(例如,内插滤波器)或滤波器(例如,多个内插滤波器)的集合(例如,通过运动向量的分数部分参数化的)。
根据实施例,在解码器中,滤波器的集合中的滤波器可分别应用于(例如,在空间方向,例如x方向和/或y方向上依次可应用的一维滤波器)视频序列的部分。
根据实施例,解码器被配置为根据运动向量的分数部分(多个分数部分)(例如,根据一个或多个运动向量的分数部分)选择(例如应用)滤波器(例如,内插滤波器)(例如若运动向量端点位于全样本位置或在所考虑方向上位于全样本位置处,通过选择,例如应用,第一滤波器,以及若运动向量端点位于全样本之间或在所考虑方向上位于全样本之间,通过选择,例如应用,与第一滤波器不同的第二滤波器)。
根据实施例,解码器被配置为根据运动向量的分数部分(或多个分数部分)选择(例如应用)不同滤波器(例如内插滤波器)用于在第一方向(例如x)上进行滤波以及在第二方向(例如y)上进行滤波。
根据实施例,解码器被配置为选择(例如应用)不同滤波器(例如内插滤波器)用于在第一方向上进行滤波以及在第二方向上进行滤波,使得较强低通滤波器应用于运动向量的(一个或多个或所有)分数部分(或多个分数部分)位于全样本上(例如,若(多个)二分之一样本准确运动向量指向(多个)全样本位置)的方向上的滤波(当与应用于运动向量的分数部分(或多个分数部分)位于全样本之间的方向上的滤波相比时)。
根据实施例,解码器被配置为根据运动向量的一个或多个分数部分(或多个分数部分)选择(例如应用;例如每滤波方向单独地)通过句法元素(例如内插滤波器索引if_idx)用信号发送的滤波器(例如内插滤波器)或预定滤波器(其中,例如,当考虑第一方向的位置坐标时,若运动向量的一个或多个分数部分(或多个分数部分)位于全样本之间,则通过句法元素用信号发送的滤波器被选中用于在第一方向上进行滤波,以及其中,例如,当考虑第二方向的位置坐标时,若运动向量的所有分数部分(或多个分数部分)位于全样本上,则预定滤波器被选中用于在与第一方向不同的第二方向上进行滤波)。
根据实施例,解码器被配置为根据运动向量的一个或多个分数部分(或多个分数部分)选择(例如应用;例如每滤波方向单独地)通过滤波器句法元素(例如内插滤波器索引if_idx)用信号发送的第一滤波器(例如内插滤波器)或通过滤波器句法元素用信号发送的第二滤波器(其中,例如,当考虑第一方向的位置坐标时,若运动向量的一个或多个分数部分(或多个分数部分)位于全样本之间,则通过滤波器句法元素用信号发送的第一滤波器被选中用于在第一方向上进行滤波,以及其中,例如,当考虑第二方向的位置坐标时,若运动向量的所有分数部分(或多个分数部分)位于全样本上,则通过滤波器句法元素用信号发送的第二滤波器被选中用于在与第一方向不同的第二方向上进行滤波)。
根据实施例,解码器被配置为在合并模式中从相邻区块接管滤波器选择(例如,选择性地根据运动向量是否与相邻区块的运动向量相同)。
根据实施例,在解码器中,所选(例如应用的)处理方案限定亮度分量的(例如空间)滤波和/或色度分量的(例如空间)滤波。
根据实施例,解码器被配置为根据预测模式选择(例如应用)滤波器。
根据实施例,解码器被配置为根据一个或多个句法元素适配映射规则,该映射规则将经编码索引值映射到指示处理方案的指示(例如索引值)。
根据实施例,解码器被配置为根据一个或多个句法元素适配用于识别经编码索引的二进制代码的数量,该经编码索引指示所选处理方案。
根据实施例,解码器被配置为鉴于一个或多个句法元素确定允许的处理方案的集合,从所确定集合中基于一个或多个句法元素与索引识别待被应用的处理方案。
根据实施例,解码器被配置为确定对于视频序列的部分单个处理方案是否的允许的,并且响应于发现对于视频序列的部分仅单个处理方案(例如空间滤波器或内插滤波器)是允许的,选择性地省略对经编码索引的识别。
根据实施例,解码器被配置为选择映射规则,该映射规则将经编码索引值映射到指示处理方案的指示(例如索引值),使得表示经编码索引值的二进制代码的数量适配于对于视频序列的部分允许的处理方案的数量。
根据实施例,解码器被配置为为视频帧或图片内的不同区块(例如,不同的预测单元PU和/或编码单元CU和/或编码树单元CTU)选择(例如应用)不同处理方案(例如,不同内插滤波器)(不同内插滤波器用于视频序列的不同部分中或单个视频帧或“图片”的不同部分中的相同分数样本位置)。
根据实施例,解码器被配置为将指示所选处理方案的索引进行编码(例如,根据一个或多个句法元素),使得给定的经编码索引值根据运动向量准确度(例如,其可以使用比特流中的句法元素来用信号发送,以及可以例如从以下值中选出一个:QPEL、HPEL、FPEL、4PEL)表示(例如,关联于)不同处理方案。
根据实施例,一个或多个句法元素包括运动向量准确度(例如,四分之一样本,二分之一样本,全样本)、分数样本位置、区块尺寸、区块形状、预测假设的数量(例如,用于单一预测的一个假设,用于双预测的两个假设)、预测模式(例如,平移帧间、仿射帧间、平移合并、仿射合并、组合的帧间/帧内)、经编码残差信号的可用性(例如经编码区块标志)、经编码残差信号的谱属性、参考图片信号(例如运动数据限定的参考区块,参考区块内的来自并置的预测单元PUs的区块边缘,参考信号的高或低频特性)、环路滤波器数据(例如来自样本自适应偏移滤波器SAO的边缘偏移或频带偏移分类,解区块滤波器决策及边界强度)、运动向量长度(例如仅针对长运动向量或特定方向启用额外的平滑滤波器)或自适应运动向量分辨率模式中的至少一个。
根据实施例,解码器被配置为将指示所选处理方案的索引进行解码(例如根据一个或多个句法元素),使得给定的经编码索引值根据运动向量的分数部分(或多个分数部分)表示(例如关联于)不同处理方案(其中,例如根据考虑的部分的所有运动向量是否指向整数样本位置,例如亮度样本位置,使用不同编码方案)。
根据实施例,解码器被配置为为在最大运动向量准确度(例如比之前提到的运动向量准确度更好的子样本运动向量分辨率,例如QPEL)与最小运动向量准确度(例如4PEL)之间的运动向量准确度(例如子样本运动向量准确度,例如HPEL)或为在最大运动向量准确度(例如QPEL)与全样本运动向量准确度(例如FPEL)之间的运动向量准确度(例如HPEL)选择性地确定处理方案的集合(例如“多可能性编码”),从所确定集合中识别待被应用的处理方案。
根据实施例,解码器被配置为将用于在第一FIR滤波(例如,HEVC滤波)(例如,HEVC8-抽头滤波)、第二FIR滤波与第三FIR之间进行选择的索引(处理方案索引,if_idx)进行解码。
根据实施例,解码器被配置为将用于在第一FIR滤波(例如,HEVC滤波)(例如,HEVC8-抽头滤波)与第二FIR滤波之间进行选择的索引(处理方案索引,if_idx)进行解码。
根据实施例,解码器被配置为应用具有不同特性(例如较强低通特性对较弱低通特性)的处理方案(例如内插滤波器)。
根据实施例,解码器被配置为根据运动向量准确度及运动向量的分数样本位置或分数部分(多个分数部分)选择映射规则。
根据实施例,解码器被配置为根据运动向量准确度确定处理方案(例如,内插滤波器)的可用集合。
根据实施例,解码器被配置为应用四分之一样本运动向量分辨率、二分之一样本运动向量分辨率、全样本运动向量分辨率或四样本运动向量分辨率中的一个(其中,例如,在选择二分之一样本运动向量分辨率的情况下,选择性地包括描述处理方案或内插滤波器的索引元素,以及其中,在其他情况下例如描述处理方案的索引元素被省略)。
根据实施例,在解码器中,处理方案包括一个或多个FIR滤波器。
本公开的另一方面涉及一种用于混合视频解码(例如,利用预测误差的预测及变换解码的视频解码)的解码器,解码码器用于基于视频序列的编码表示提供输出视频内容,解码器被配置为:获得(例如接收、下载、从文件打开)作为视频序列的编码表示的比特流;从比特流中识别与视频序列的部分(例如区块)相关的一个或多个句法元素(例如运动向量准确度句法元素);根据一个或多个句法元素来确定在比特流中用于提供经编码索引的熵编码方案,该经编码索引指示用于视频序列的部分的处理方案(例如内插滤波器,例如由编码器所选择的),该处理方案用于获取用于在视频序列的部分内的整数和/或分数位置处的运动补偿预测的样本(例如有关于视频序列,例如样本,例如分数样本);若所确定熵编码方案指定大于零的二进制代码的数量,在比特流中识别经编码索引并且将该索引进行解码;若所确定编码方案所指定的二进制代码的数量大于零,基于一个或多个句法元素并基于经解码索引识别(例如选择)处理方案(或若所确定的二进制代码的数量为零,仅基于一个或多个句法元素识别处理方案);以及将所识别处理方案应用于视频序列的部分。
解码器基于该思想,通过基于句法元素确定熵编码方案来识别用于部分的处理方案。从所确定熵编码方案中,解码器可以推断如何识别处理方案。通过识别熵编码方案所指定的二进制代码的数量是否大于零,解码器可以推断通过该熵编码方案在比特流中编码的信息,独立于二进制代码的数量。换句话说,解码器可以使用二进制代码的数量为零的信息来识别处理方案。此外,由于解码器可以使用句法元素与索引来从中识别处理方案,所以即使给定的经编码索引值可以与各种处理方案相关联,解码器也可以识别处理方案。因此,即使在比特流中用于传输关于处理方案的信息的二进制代码的数量是少量或甚至为零,解码器也可以识别处理方案。
根据实施例,在解码器中,熵编码方案包括用于提供经编码索引的二值化方案。
根据实施例,在解码器中,二值化方案包括用于提供经编码索引的二进制代码的数量。
根据实施例,在解码器中,处理方案是滤波器(例如内插滤波器)或滤波器(例如多个内插滤波器)的集合(例如通过运动向量的分数部分参数化的)。
根据实施例,在解码器中,在滤波器的集合中的滤波器分别可应用于(例如在空间方向,如x方向和/或y方向上依次可应用的一维滤波器)视频序列的部分。
根据实施例,解码器被配置为根据运动向量的分数部分(或多个分数部分)(例如根据一个或多个运动向量的分数部分)选择(例如应用)滤波器(例如内插滤波器)(例如,若运动向量端点位于全样本位置或在所考虑方向上位于全样本位置处,通过选择,例如应用,第一滤波器,以及若运动向量端点位于全样本之间或在所考虑方向上位于全样本之间,通过选择,例如应用,不同于第一滤波器的第二滤波器)。
根据实施例,解码器被配置为根据运动向量的分数部分(或多个分数部分)选择(例如应用)不同滤波器(例如内插滤波器)用于在第一方向(例如x)上进行滤波以及在第二方向(例如y)上进行滤波。
根据实施例,解码器被配置为选择(例如应用)不同滤波器(例如内插滤波器)用于在第一方向上进行滤波以及在第二方向上进行滤波,使得较强低通滤波应用于运动向量的(一个或多个或所有)分数部分(或多个分数部分)位于全样本上(例如,若(多个)二分之一样本准确运动向量指向(多个)全样本位置)的方向上的滤波(当与应用于运动向量的分数部分(或多个分数部分)位于全样本之间的方向的滤波相比时)。
根据实施例,解码器被配置为根据运动向量的一个或多个分数部分(或多个分数部分)选择(例如应用;例如每滤波方向单独地)通过句法元素(例如内插滤波器索引if_idx)用信号发送的滤波器(例如内插滤波器)或预定滤波器(其中,例如,当考虑第一方向的位置坐标时,若运动向量的一个或多个分数部分(或多个分数部分)位于全样本之间,则通过句法元素用信号发送的滤波器被选中用于在第一方向上进行滤波,以及其中,例如,当考虑第二方向的位置坐标时,若运动向量的所有分数部分(或多个分数部分)位于全样本上,则预定滤波器被选中用于在与第一方向不同的第二方向上进行滤波)。
根据实施例,解码器被配置为根据运动向量的一个或多个分数部分(或多个分数部分)选择(例如应用;例如每滤波方向单独地)通过滤波器句法元素(例如内插滤波器索引if_idx)用信号发送的第一滤波器(例如内插滤波器)或通过滤波器句法元素用信号发送的第二滤波器(其中,例如,当考虑第一方向的位置坐标时,若运动向量的一个或多个分数部分(或多个分数部分)位于多个全样本之间,则通过滤波器句法元素用信号发送的第一滤波器被选中用于在第一方向上进行滤波,以及其中,例如,当考虑第二方向的位置坐标时,若运动向量的所有分数部分(或多个分数部分)位于全样本上,则通过滤波器句法元素用信号发送的第二滤波器被选中用于在与第一方向不同的第二方向上进行滤波)。
根据实施例,解码器被配置为在合并模式中从相邻区块接管滤波器选择(例如,选择性地根据运动向量是否与相邻区块的运动向量相同)。
根据实施例,在解码器中,所选(例如应用的)处理方案限定亮度分量的(例如空间)滤波和/或色度分量的(例如空间)滤波。
根据实施例,解码器被配置为根据预测模式来选择(例如应用)滤波器。
根据实施例,解码器被配置为根据一个或多个句法元素适配映射规则,该映射规则将经编码索引值映射到指示处理方案的指示(例如索引值)。
根据实施例,解码器被配置为根据一个或多个句法元素适配用于识别经编码索引的二进制代码的数量,该经编码索引指示所选处理方案。
根据实施例,解码器被配置为鉴于一个或多个句法元素确定允许的处理方案的集合,从所确定集合中基于一个或多个句法元素与索引识别待被应用的处理方案。
根据实施例,解码器被配置为确定对于视频序列的部分单个处理方案是否是允许的,并且响应于发现对于视频序列的部分仅单个处理方案(例如空间滤波器或内插滤波器)是允许的,选择性地省略对经编码索引的识别。
根据实施例,解码器被配置为选择映射规则,该映射规则将经编码索引值映射到指示处理方案的指示(例如索引值),使得表示经编码索引值的二进制代码的数量适配于对于视频序列的部分允许的处理方案的数量。
根据实施例,解码器被配置为为视频帧或图片内的不同区块(例如,不同的预测单元PU和/或编码单元CU和/或编码树单元CTU)选择(例如应用)不同处理方案(例如,不同内插滤波器)(不同内插滤波器用于视频序列的不同部分中或单个视频帧或“图片”的不同部分中的相同分数样本位置)。
根据实施例,解码器被配置为将指示所选处理方案的索引进行解码(例如,根据一个或多个句法元素),使得给定的经编码索引值根据运动向量准确度(例如,其可以使用比特流中的句法元素来用信号发送,以及可以例如从以下值中选出一个:QPEL、HPEL、FPEL、4PEL)表示(如,关联于)不同处理方案。
根据实施例,在解码器中,一个或多个句法元素包括运动向量准确度(例如,四分之一样本,二分之一样本,全样本)、分数样本位置、区块尺寸、区块形状、预测假设的数量(例如,用于单一预测的一个假设,用于双预测的两个假设)、预测模式(例如,平移帧间、仿射帧间、平移合并、仿射合并、组合的帧间/帧内)、经编码残差信号的可用性(例如经编码区块标志)、经编码残差信号的谱属性、参考图片信号(例如运动数据限定的参考区块,参考区块内的来自并置的预测单元PUs的区块边缘,参考信号的高或低频特性)、环路滤波器数据(例如来自样本自适应偏移滤波器SAO的边缘偏移或频带偏移分类,解区块滤波器决策及边界强度)、运动向量长度(例如仅针对长运动向量或特定方向启用额外的平滑滤波器)或自适应运动向量分辨率模式中的至少一个。
根据实施例,解码器被配置为将指示所选处理方案的索引进行解码(例如根据一个或多个句法元素),使得给定的经编码索引值根据运动向量的分数部分(或多个分数部分)表示(例如关联于)不同处理方案(其中,例如根据考虑的部分的所有运动向量是否指向整数样本位置,例如亮度样本位置,使用不同编码方案)。
根据实施例,解码器被配置为,为运动向量准确度(例如子样本运动向量准确度,例如HPEL),其在最大运动向量准确度(例如比之前提到的运动向量准确度更好的子样本运动向量分辨率,例如QPEL)与最小运动向量准确度(例如4PEL)之间,或为在最大运动向量准确度(例如QPEL)与全样本运动向量准确度(例如FPEL)之间的运动向量准确度(例如HPEL),选择性地确定处理方案的集合(例如“多可能性编码”),从所确定集合中识别待被应用的处理方案。
根据实施例,解码器被配置为将用于在第一FIR滤波(例如,HEVC滤波)(例如,HEVC8-抽头滤波)、第二FIR滤波与第三FIR之间进行选择的索引(处理方案索引,if_idx)进行解码。
根据实施例,解码器被配置为将用于在第一FIR滤波(例如,HEVC滤波)(例如,HEVC8-抽头滤波)与第二FIR滤波之间进行选择的索引(处理方案索引,if_idx)进行解码。
根据实施例,解码器被配置为应用具有不同特性(例如较强低通特性对较弱低通特性)的处理方案(例如内插滤波器)。
根据实施例,解码器被配置为根据运动向量准确度及运动向量的分数样本位置或分数部分(多个分数部分)选择映射规则。
根据实施例,解码器被配置为根据运动向量准确度确定处理方案(例如,内插滤波器)的可用集合。
根据实施例,解码器被配置为应用四分之一样本运动向量分辨率、二分之一样本运动向量分辨率、全样本运动向量分辨率或四样本运动向量分辨率中的一个(其中,例如,在选择二分之一样本运动向量分辨率的情况下,选择性地包括描述处理方案或内插滤波器的索引元素,以及其中,在其他情况下例如描述处理方案的索引元素被省略)。
根据实施例,处理方案包括一个或多个FIR滤波器。
本公开的另一方面涉及一种用于混合视频编码(例如,利用预测误差的预测与变换编码的视频编码)的方法,该方法用于基于输入视频内容提供视频序列的编码表示,(例如由编码器所执行的方法),该方法包括:确定与视频序列的部分(例如,区块)相关的一个或多个句法元素(例如,运动向量准确度句法元素);基于一个或多个句法元素所描述的属性(例如,通过一个或多个句法元素用信号发送的解码器设置或通过一个或多个句法元素用信号发送的视频序列的部份的特性)来选择待被(例如,解码器)应用于视频序列的部分的处理方案(例如,内插滤波器),该处理方案用于获取用于在视频序列的部分内的整数和/或分数位置处的运动补偿预测的样本(例如有关于视频序列,例如样本,例如分数样本);将指示所选处理方案的索引进行编码(例如根据一个或多个句法元素),使得给定的经编码索引值根据一个或多个句法元素(例如根据一个或多个句法元素的值)所描述的属性表示(例如关联于)不同处理方案;以及提供(例如传输、上载、储存成文件)比特流作为视频序列的编码表示,该比特流包括一个或多个句法元素与经编码索引。
本公开的另一方面涉及一种用于混合视频编码(例如,利用预测误差的预测及变换编码的视频编码)的方法,该方法用于基于输入视频内容提供视频序列的编码表示,(例如由编码器所执行的方法),该方法包括:确定与视频序列的部分(例如区块)相关的一个或多个句法元素(例如运动向量准确度句法元素);基于一个或多个句法元素所描述的属性(例如,通过一个或多个句法元素用信号发送的解码器设置或通过一个或多个句法元素用信号发送的视频序列的部份的特性)来选择待被(例如,解码器)应用于视频序列的部分的处理方案(例如内插滤波器),该处理方案用于获取用于在视频序列的部分内的整数和/或分数位置处的运动补偿预测的样本(例如,有关于视频序列,例如样本,例如分数样本);根据一个或多个句法元素(例如,根据一个或多个句法元素的值)所描述的属性来选择用于提供指示所选处理方案的经编码索引的熵编码方案(其中,例如,若鉴于一个或多个考虑的句法元素仅一个处理方案是允许的,则熵编码方案所指定的二进制代码的数量可以等于零);以及提供(例如,传输、上载、储存成文件)比特流作为视频序列的编码表示,该比特流包括一个或多个句法元素并包括经编码索引(例如,若所选的二进制代码的数量大于零)。
本公开的另一方面涉及一种用于混合视频解码(例如,利用预测误差的预测及变换解码的视频解码)的方法,该方法用于基于视频序列的编码表示提供输出视频内容,(例如,由解码器所执行的方法),该方法包括:获得(例如接收、下载、从文件打开)作为视频序列的编码表示的比特流;从比特流中识别与视频序列的部分(例如区块)相关的一个或多个句法元素(例如运动向量准确度句法元素)(以及经编码索引);基于一个或多个句法元素与索引(可以以编码形式包含在比特流中)来识别用于视频序列的部分的处理方案(例如内插滤波器,例如由编码器所选择的),该处理方案用于获取用于在视频序列的部分内的整数和/或分数位置处的运动补偿预测的样本(例如有关于视频序列,例如样本,例如分数样本),其中该方法根据一个或多个句法元素(例如根据一个或多个句法元素的值)将不同处理方案分配到给定的经编码索引值;以及将所识别处理方案应用于视频序列的部分。
本公开的另一方面涉及一种用于混合视频解码(例如,利用预测误差的预测及变换解码的视频解码)的方法,该方法用于基于视频序列的编码表示提供输出视频内容,(例如,由解码器所执行的方法),该方法包括:获得(例如接收、下载、从文件打开)作为视频序列的编码表示的比特流;从比特流中识别与视频序列的部分(例如区块)相关的一个或多个句法元素(例如运动向量准确度句法元素);根据一个或多个句法元素来确定在比特流中用于提供经编码索引的熵编码方案,该经编码索引指示用于视频序列的部分的处理方案(例如内插滤波器,例如由编码器所选择的),该处理方案用于获取用于在视频序列的部分内的整数和/或分数位置处的运动补偿预测的样本(例如有关于视频序列,例如样本,例如分数样本);若所确定熵编码方案指定大于零的二进制代码的数量,在比特流中识别经编码索引并且将该索引进行解码;若所确定熵编码方案所指定的二进制代码的数量大于零,基于一个或多个句法元素并基于经解码索引识别(例如选择)处理方案(或若所确定的二进制代码的数量为零,仅基于一个或多个句法元素识别处理方案);以及将所识别处理方案应用于视频序列的部分。
本公开的另一方面涉及一种用于混合视频编码(例如,利用预测误差的预测及变换编码的视频编码)的视频比特流,该视频比特流描述视频序列(例如,以视频序列的编码表示的形式),其中该视频比特流包括与视频序列的部分(例如区块)相关的一个或多个句法元素(例如运动向量准确度句法元素);其中至少对于视频序列的部分中的一些,该视频比特流包括处理方案索引比特流元素(例如,描述待被视频解码器使用的内插滤波器,例如if_idx);其中处理方案索引比特流元素(例如,其描述待被视频解码器执行的滤波或内插滤波)的存在根据一个或多个其他句法元素而变化(例如,使得针对另一句法元素的第一值或针对多个其他句法元素的值的第一组合,处理方案索引比特流元素呈现,以及例如,使得针对另一句法元素的第二值或针对多个其他句法元素的值的第二组合,处理方案索引比特流元素被省略)。
本公开的另一方面涉及一种用于混合视频编码(例如,利用预测误差的预测及变换编码的视频编码)的视频比特流,该比特流描述视频序列(例如,以视频序列的编码表示的形式),其中该视频比特流包括与视频序列的部分(例如区块)相关的一个或多个句法元素(例如运动向量准确度句法元素);其中至少对于视频序列的部分中的一些,该视频比特流包括处理方案索引比特流元素(例如,描述待被视频解码器使用的内插滤波器,例如if_idx);其中,处理方案索引比特流元素的二进制代码的数量根据与视频序列的部分相关的一个或多个句法元素而变化(例如,使得处理方案索引比特流元素的二进制代码的数量适配于对于视频序列的部分允许的处理方案的数量;例如,使得当对于视频序列的部分仅单个处理方案是允许的时,处理方案索引比特流元素的二进制代码的数量等于零,例如处理方案索引比特流元素被省略)。
本公开的另一方面涉及一种用于混合视频编码(例如,利用预测误差的预测及变换编码的视频编码)的视频比特流,该比特流描述视频序列(例如,以视频序列的编码表示的形式),其中该视频比特流包括与视频序列的部分(例如区块)相关的一个或多个句法元素(例如运动向量准确度句法元素);其中至少对于视频序列的部分中的一些,该视频比特流包括处理方案索引比特流元素(例如,描述待被视频解码器使用的内插滤波器,例如if_idx);其中,处理方案索引比特流元素的码字的含义(例如,经编码索引值)根据与视频序列的部分相关的一个或多个句法元素而变化(例如,使得根据与视频序列的部分相关的一个或多个句法元素来分配不同处理方案到给定的经编码索引值)。
本公开的另一方面涉及一种用于混合视频解码的解码器,解码器用于基于视频序列的编码表示提供输出视频内容,该解码器被配置为:获得作为视频序列的编码表示的比特流;从比特流中识别与视频序列的部分相关的一个或多个句法元素;根据一个或多个句法元素来选择用于视频序列的部分的处理方案,其中该处理方案完全由部分的属性与运动向量的分数部分指定(其中,属性由一个或多个句法元素描述);该处理方案用于获取用于在视频序列的部分内的整数和/或分数位置处的运动补偿预测的样本;以及将所识别处理方案应用于视频序列的部分。
由于解码码器可以基于一个或多个句法元素选择处理方案,所以解码器可以在不需要专门用于处理方案的句法元素的情况下为部分选择处理方案。因此,即使在比特流中未明显地指示处理方案,解码器也可以选择该处理方案,从而比特流可以特别小。当解码器使用一个或多个句法元素来获得处理方案时,解码器可以以一个或多个句法元素所提供的粒度来选择处理方案。因此,解码器可以有效地使用比特流中已经提供的信息来以精细粒度选择处理方案,而无需比特流中的额外比特。运动向量的分数部分可以特别精确地表征待被用于获得样本的处理方案,因为运动向量可被用于运动补偿预测。因此,基于运动向量的分数部分可以快速且可靠地选择处理方案。
根据实施例,指定处理方案的部分的属性与运动向量准确度、样本(待通过处理方案获得)的分数位置以及待被用于部分的预测模式中的一种或两种或全部相关。由于处理方案可被用于获得用于运动补偿预测的样本,因此MV准确度可以提供关于待被用于该部分的合适处理方案的精确提示。由于不同处理方案可被用于全样本、二分之一样本与四分之一样本位置,因此样本的分数位置可以限制允许的处理方案的数量,或甚至指定处理方案。用于解码视频序列的部分的一个或多个句法元素可以指示运动向量准确度、样本的分数位置及预测模式中的一个或多个或全部。因此,解码器主要从已经可用的信息来推断处理方案。
根据实施例,该部分是预测单元(PU)或编码单元(CU),以及其中解码器被配置为针对视频序列的不同部分单独地选择处理方案。针对不同的预测单元或编码单元单独地选择处理方案使得处理方案能够以特别精细的粒度适配视频序列的局部特性。这种精确适配允许从特别小尺寸的比特流对部分进行解码和/或可以能够特别快速地解码。由于根据一个或多个句法元素来选择处理方案,因此在不增大比特流的尺寸的情况下,针对不同的预测单元或编码单元单独地确定处理方案是可能的。
根据实施例,解码器被配置为针对视频序列的不同部分中的相同分数样本位置使用不同处理方案。
根据实施例,解码器被配置为在PU或CU级别切换处理方案以适配局部图像特性。
根据实施例,一个或多个句法元素中没有一个明显地专用于指示处理方案。
本公开的另一方面涉及一种用于混合视频解码的解码器,解码器用于基于视频序列的编码表示提供输出视频内容,该解码器被配置为:获得作为视频序列的编码表示的比特流;从比特流中识别与视频序列的部分相关的一个或多个句法元素;根据运动向量准确度来选择用于视频序列的部分的处理方案,该处理方案用于获取用于在视频序列的部分内的整数和/或分数位置处的运动补偿预测的样本;以及将所识别处理方案应用于视频序列的部分。
根据实施例,解码器被配置为根据运动向量准确度与样本(待通过处理方案获得)的分数位置选择处理方案。
根据实施例,解码器被配置为额外地根据待被用于部分的预测模式选择处理方案。
根据实施例,部分是预测单元(PU)或编码单元(CU),以及其中解码器被配置为针对视频序列的不同部分单独地选择处理方案。针对不同的预测单元或编码单元单独地选择处理方案使得处理方案能够以特别精细的粒度适配视频序列的局部特性。这种精确适配允许从特别小尺寸的比特流对部分进行解码和/或可以能够特别快速地解码。由于根据一个或多个句法元素来选择处理方案,因此在不增大比特流的尺寸的情况下,针对不同的预测单元或编码单元单独地确定处理方案是可能的。
根据实施例,解码器被配置为针对视频序列的不同部分中的相同分数样本位置使用不同处理方案。
根据实施例,解码器被配置为在PU或CU级别切换处理方案以适配局部图像特性。
根据实施例,一个或多个句法元素中没有一个明显地专用于指示处理方案。
本公开的另一方面涉及一种用于混合视频解码的解码器,解码器用于基于视频序列的编码表示提供输出视频内容,该解码器被配置为:获得作为视频序列的编码表示的比特流;从比特流中识别与视频序列的部分相关的一个或多个句法元素;以PU粒度或CU粒度并根据一个或多个句法元素来确定用于视频序列的部分的处理方案,该处理方案用于获取用于在视频序列的部分内的整数和/或分数位置处的运动补偿预测的样本;以及将所识别处理方案应用于视频序列的部分。
根据实施例,解码器被配置为针对视频序列的不同部分中的相同分数样本位置使用不同处理方案。
根据实施例,解码器被配置为在PU或CU级别切换处理方案以适配局部图像特性。
根据实施例,一个或多个句法元素中没有一个明显地专用于指示处理方案。
根据实施例,在解码器中,处理方案是滤波器(例如,内插滤波器)或滤波器(例如,多个内插滤波器)的集合(例如,通过运动向量的分数部分参数化的)。
根据实施例,在解码器中,滤波器的集合中的滤波器可分别应用于(例如,在空间方向,例如x方向和/或y方向上依次可应用的一维滤波器)视频序列的部分。
根据实施例,解码器被配置为根据运动向量的分数部分(或多个分数部分)选择(例如应用)不同滤波器(例如内插滤波器)用于在第一方向(例如x)上进行滤波以及在第二方向(例如y)上进行滤波。
根据实施例,解码器被配置为选择(例如应用)不同滤波器(例如内插滤波器)用于在第一方向上进行滤波以及在第二方向上进行滤波,使得较强低通滤波器应用于运动向量的(一个或多个或所有)分数部分(或多个分数部分)位于全样本上(例如,若(多个)二分之一样本准确运动向量指向(多个)全样本位置)的方向上的滤波(当与应用于运动向量的分数部分(或多个分数部分)位于全样本之间的方向上的滤波相比时)。
根据实施例,解码器被配置为在合并模式中从相邻区块接管滤波器选择(例如,选择性地根据运动向量是否与相邻区块的运动向量相同)。
根据实施例,在解码器中,所选(例如应用的)处理方案限定亮度分量的(例如空间)滤波和/或色度分量的(例如空间)滤波。
根据实施例,解码器被配置为为视频帧或图片内的不同区块(例如,不同的预测单元PU和/或编码单元CU和/或编码树单元CTU)选择(例如应用)不同处理方案(例如,不同内插滤波器)(不同内插滤波器用于视频序列的不同部分中或单个视频帧或“图片”的不同部分中的相同分数样本位置)。
根据实施例,一个或多个句法元素包括运动向量准确度(例如,四分之一样本,二分之一样本,全样本)、分数样本位置、区块尺寸、区块形状、预测假设的数量(例如,用于单一预测的一个假设,用于双预测的两个假设)、预测模式(例如,平移帧间、仿射帧间、平移合并、仿射合并、组合的帧间/帧内)、经编码残差信号的可用性(例如经编码区块标志)、经编码残差信号的谱属性、参考图片信号(例如运动数据限定的参考区块,参考区块内的来自并置的预测单元PUs的区块边缘,参考信号的高或低频特性)、环路滤波器数据(例如来自样本自适应偏移滤波器SAO的边缘偏移或频带偏移分类,解区块滤波器决策及边界强度)、运动向量长度(例如仅针对长运动向量或特定方向启用额外的平滑滤波器)或自适应运动向量分辨率模式中的至少一个。
根据实施例,解码器被配置为,为运动向量准确度(例如子样本运动向量准确度,例如HPEL),其在最大运动向量准确度(例如比之前提到的运动向量准确度更好的子样本运动向量分辨率,例如QPEL)与最小运动向量准确度(例如4PEL)之间,或为在最大运动向量准确度(例如QPEL)与全样本运动向量准确度(例如FPEL)之间的运动向量准确度(例如HPEL),选择性地确定处理方案的集合(例如“多可能性编码”),从所确定集合中识别待被应用的处理方案。
根据实施例,解码器被配置为应用具有不同特性(例如较强低通特性对较弱低通特性)的处理方案(例如内插滤波器)。
根据实施例,解码器被配置为应用四分之一样本运动向量分辨率、二分之一样本运动向量分辨率、全样本运动向量分辨率或四样本运动向量分辨率中的一个。
根据实施例,在解码器中,处理方案包括一个或多个FIR滤波器。
本公开的另一方面涉及一种用于混合视频编码的编码器,编码器用于基于输入视频内容提供视频序列的编码表示,该编码器被配置为:确定与视频序列的部分相关的一个或多个句法元素;基于一个或多个句法元素所描述的属性来选择待被应用于视频序列的部分的处理方案,其中处理方案完全由部分的属性与运动向量的分数部分指定,该处理方案用于获取用于在视频序列的部分内的整数和/或分数位置处的运动补偿预测的样本;提供比特流作为视频序列的编码表示,该比特流包括一个或多个句法元素。
根据实施例,一个或多个句法元素所描述的属性与运动向量准确度、样本(待通过处理方案获得)的分数位置以及待被用于部分的预测模式中的一种或两种或全部相关。
根据实施例,该部分是预测单元(PU)或编码单元(CU),以及其中编码器被配置为针对视频序列的不同部分单独地选择处理方案。
根据实施例,编码器被配置为针对视频序列的不同部分中的相同分数样本位置使用不同处理方案。
根据实施例,编码器被配置为在PU或CU级别切换处理方案以适配局部图像特性。
根据实施例,一个或多个句法元素中没有一个明显地专用于指示处理方案。
本公开的另一方面涉及一种用于混合视频编码的编码器,编码器用于基于输入视频内容提供视频序列的编码表示,该编码器被配置为:确定与视频序列的部分相关的一个或多个句法元素;基于一个或多个句法元素所描述的运动向量准确度来选择待被应用于视频序列的部分的处理方案,其中处理方案完全由部分的属性与运动向量的分数部分指定;提供比特流作为视频序列的编码表示,该比特流包括一个或多个句法元素。
根据实施例,编码器被配置为基于运动向量准确度与样本(待通过处理方案获得)的分数位置选择处理方案。
根据实施例,编码器被配置为额外地根据待被用于部分的预测模式选择处理方案。
根据实施例,部分是预测单元(PU)或编码单元(CU),以及其中编码器被配置为针对视频序列的不同部分单独地选择处理方案。
根据实施例,编码器被配置为针对视频序列的不同部分中的相同分数样本位置使用不同处理方案。
根据实施例,编码器被配置为在PU或CU级别切换处理方案以适配局部图像特性。
根据实施例,一个或多个句法元素中没有一个明显地专用于指示处理方案。
本公开的另一方面涉及一种用于混合视频编码的编码器,编码器用于基于输入视频内容提供视频序列的编码表示,该编码器被配置为:确定与视频序列的部分相关的一个或多个句法元素;以PU粒度或CU粒度,基于一个或多个句法元素所描述的运动向量准确度来选择待被应用于视频序列的部分的处理方案,其中处理方案完全由部分的属性与运动向量的分数部分指定;提供比特流作为视频序列的编码表示,该比特流包括一个或多个句法元素。
根据实施例,编码器被配置为针对视频序列的不同部分中的相同分数样本位置使用不同处理方案。
根据实施例,编码器被配置为在PU或CU级别切换处理方案以适配局部图像特性。
根据实施例,一个或多个句法元素中没有一个明显地专用于指示处理方案。
根据实施例,编码器被配置为鉴于一个或多个句法元素所描述的属性,确定允许的处理方案的集合,并从所确定集合中选择处理方案。
根据实施例,在编码器中,处理方案是滤波器(例如,内插滤波器)或滤波器(例如,多个内插滤波器)的集合(例如,通过运动向量的分数部分参数化的)。
根据实施例,在编码器中,滤波器的集合中的滤波器可分别应用于(例如,在空间方向,例如x方向和/或y方向上依次可应用的一维滤波器)视频序列的部分。
根据实施例,编码器被配置为为视频帧或图片内的不同区块(例如,不同的预测单元PU和/或编码单元CU和/或编码树单元CTU)选择不同处理方案(例如,不同内插滤波器)(不同内插滤波器用于视频序列的不同部分中或单个视频帧或“图片”的不同部分中的相同分数样本位置)。
根据实施例,在编码器中,一个或多个句法元素包括运动向量准确度(例如,四分之一样本,二分之一样本,全样本)、分数样本位置、区块尺寸、区块形状、预测假设的数量(例如,用于单一预测的一个假设,用于双预测的两个假设)、预测模式(例如,平移帧间、仿射帧间、平移合并、仿射合并、组合的帧间/帧内)、经编码残差信号的可用性(例如经编码区块标志)、经编码残差信号的谱属性、参考图片信号(例如运动数据限定的参考区块,参考区块内的来自并置的预测单元PUs的区块边缘,参考信号的高或低频特性)、环路滤波器数据(例如来自样本自适应偏移滤波器SAO的边缘偏移或频带偏移分类,解区块滤波器决策及边界强度)、运动向量长度(例如仅针对长运动向量或特定方向启用额外的平滑滤波器)或自适应运动向量分辨率模式中的至少一个。
根据实施例,编码器被配置为,为运动向量准确度(例如子样本运动向量准确度,例如HPEL),其在最大运动向量准确度(例如比之前提到的运动向量准确度更好的子样本运动向量分辨率,例如QPEL)与最小运动向量准确度(例如4PEL)之间,或为在最大运动向量准确度(例如QPEL)与全样本运动向量准确度(例如FPEL)之间的运动向量准确度(例如HPEL),选择性地确定处理方案的集合(例如“多可能性编码”),并从所确定集合中选择处理方案。
本公开的另一方面涉及一种用于混合视频解码的方法,该方法用于基于视频序列的编码表示提供输出视频内容,该方法包括:获得作为视频序列的编码表示的比特流;从比特流中识别与视频序列的部分相关的一个或多个句法元素;根据一个或多个句法元素来选择用于视频序列的部分的处理方案,其中该处理方案完全由部分的属性与运动向量的分数部分指定;该处理方案用于获取用于在视频序列的部分内的整数和/或分数位置处的运动补偿预测的样本;以及将所识别处理方案应用于视频序列的部分。
根据实施例,编码器被配置为在四分之一样本运动向量分辨率、二分之一样本运动向量分辨率、全样本运动向量分辨率以及四样本运动向量分辨率中进行选择。
根据实施例,在编码器中,处理方案包括一个或多个FIR滤波器。FIR滤波器是用于处理视频序列的特别稳定的滤波器。
本公开的另一方面涉及一种用于混合视频解码的方法,该方法用于基于视频序列的编码表示提供输出视频内容,该方法包括:获得作为视频序列的编码表示的比特流;从比特流中识别与视频序列的部分相关的一个或多个句法元素;根据运动向量准确度来选择用于视频序列的部分的处理方案,该处理方案用于获取用于在视频序列的部分内的整数和/或分数位置处的运动补偿预测的样本;以及将所识别处理方案应用于视频序列的部分。
本公开的另一方面涉及一种用于混合视频解码的方法,该方法用于基于视频序列的编码表示提供输出视频内容,该方法包括:获得作为视频序列的编码表示的比特流;从比特流中识别与视频序列的部分相关的一个或多个句法元素;以PU粒度或CU粒度并根据一个或多个句法元素来确定用于视频序列的部分的处理方案,该处理方案用于获取用于在视频序列的部分内的整数和/或分数位置处的运动补偿预测的样本;以及将所识别处理方案应用于视频序列的部分。
本公开的另一方面涉及一种用于混合视频编码的方法,该方法用于基于输入视频内容提供视频序列的编码表示,该方法包括:确定与视频序列的部分相关的一个或多个句法元素;基于一个或多个句法元素所描述的属性来选择待被应用于视频序列的部分的处理方案,其中处理方案完全由部分的属性与运动向量的分数部分指定,该处理方案用于获取用于在视频序列的部分内的整数和/或分数位置处的运动补偿预测的样本;提供比特流作为视频序列的编码表示,该比特流包括一个或多个句法元素。
本公开的另一方面涉及一种用于混合视频编码的方法,该方法用于基于输入视频内容提供视频序列的编码表示,该方法包括:确定与视频序列的部分相关的一个或多个句法元素;基于一个或多个句法元素所描述的运动向量准确度来选择待被应用于视频序列的部分的处理方案,该处理方案用于获取用于在视频序列的部分内的整数和/或分数位置处的运动补偿预测的样本;提供比特流作为视频序列的编码表示,该比特流包括一个或多个句法元素。
本公开的另一方面涉及一种用于混合视频编码的方法,该方法用于基于输入视频内容提供视频序列的编码表示,该方法包括:确定与视频序列的部分相关的一个或多个句法元素;以PU粒度或CU粒度,基于一个或多个句法元素所描述的属性来选择待被应用于视频序列的部分的处理方案,该处理方案用于获取用于在视频序列的部分内的整数和/或分数位置处的运动补偿预测的样本;提供比特流作为视频序列的编码表示,该比特流包括一个或多个句法元素。
本公开的另一方面涉及一种计算机程序,用于在计算机上运行该计算机程序时执行用于混合视频编码的任何所描述方法。
所描述的解码器提供类似于关于编码器所描述的功能与优点,反之亦然,在某种意义上,涉及编码器特征的编码器的功能与优点等效地应用于解码器的对应特征,其中解码取代编码,反之亦然。举例来说,若编码器的特征使得能够将信息进行编码在特别小尺寸的比特流中或有效编码,则解码器的对应特征可使得从小尺寸的比特流中能够得出信息或有效解码。换句话说,本文中关于编码器公开的任何特征、功能及细节可选择性地被单独地或组合地包括在解码器中,反之亦然。
所描述的用于混合视频编码的方法依赖于与上述编码器及解码器相同的思想,从而提供相同或等效的功能及优点。该方法可以可选地与本文中关于对应的编码器及解码器描述的任何特征、功能与细节组合(或补充)。用于混合视频编码的方法可以可选地与上述特征、功能及细节单独地或以其任何组合来组合。
附图说明
本文中参考附图与图式描述本公开的实施例。
图1显示编码器的示意性表示,编码器可以实现所公开概念,
图2显示解码器的示意性表示,解码器可以实现所公开概念,
图3示出根据实施例的编码器或解码器所使用的信号,
图4示出根据实施例的可以用在运动补偿预测中的分数样本位置,
图5示出根据实施例的编码器,
图6示出根据另一实施例的编码器,
图7示出根据实施例的解码器,
图8示出根据另一实施例的解码器,
图9显示根据实施例的用于混合视频编码的方法的流程图,
图10显示根据另一实施例的用于混合视频编码的方法的流程图,
图11显示根据另一实施例的用于混合视频编码的方法的流程图,
图12显示根据另一实施例的用于混合视频编码的方法的流程图,
图13示出根据另一实施例的编码器,
图14显示根据另一实施例的用于混合视频编码的方法的流程图,
图15显示根据另一实施例的用于混合视频编码的方法的流程图,
图16显示根据另一实施例的用于混合视频编码的方法的流程图,
图17显示根据另一实施例的用于混合视频编码的方法的流程图,
图18显示根据另一实施例的用于混合视频编码的方法的流程图,
图19显示根据另一实施例的用于混合视频编码的方法的流程图。
具体实施方式
在下文中,将描述不同的发明实施例及方面。
并且,通过所附权利要求定义进一步的实施例。
应当注意,由权利要求定义的任何实施例可以通过本文中描述的任何细节(特征与功能)来补充。
并且,本文中描述的实施例可以单独使用,而且也可以通过权利要求中包括的任何特征来补充。
另外,应当注意,本文中所述的各个方面可单独地或组合地使用。因此,可以将细节添加到所述各个方面的每一个,而无需将细节增加到所述多个方面中的另一个。
还应当注意,本公开明显地或隐含地描述在视频编码器(用于提供输入视频信号的编码表示的设备)及视频解码器(用于基于编码表示提供视频信号的解码表示的设备)中可使用的特征。因此,本文中描述的任何特征可以在视频编码器的上下文中及在视频解码器的上下文中使用。
此外,本文中公开的与方法有关的特征与功能也可以使用在设备中(配置为执行这种功能)。此外,本文中公开的关于设备的任何特征与功能也可以在对应的方法中使用。换句话说,本文中公开的方法可以通过关于设备描述的任何特征与功能来补充。
并且,如同将在“实现替代方案”部分中描述的,本文中描述的任何特征与功能可以以硬件或软件来实现,或者可以使用硬件与软件的组合来实现。
此外,本文中描述的任何特征及句法元素可以选择性地单独地及组合地引入视频比特流中。
在下面的描述中,详细讨论实施例,但是,应当理解,实施例提供可以嵌入在各式各样的视频编码器与视频解码器中的许多适用概念。所讨论的特定实施例仅是实现及使用本概念的特定方式的说明,并且不限制实施例的范围。在下面的实施例的描述中,相同或相似的组件或具有相同功能的元件被提供有相同的附图标记或以相同的名称标识,并且被设有相同附图标记或使用相同的名称标识的元件的重复描述通常会被省略。因此,为具有相同或相似附图标记或以相同名称识别的元件所提供的描述可以相互交换或可以在不同实施例中彼此应用。在下面的描述中,阐述许多细节以提供本公开的实施例的更彻底的解释。然而,对于本领域技术人员将显而易见的是,可以在没有这些具体细节的情况下实现其他实施例。在其他实例中,以框图形式而不是细节显示众所皆知的结构与设备,以避免混淆本文中所述的示例。另外,除非另外特别说明,否则本文中描述的不同实施例的特征可以彼此组合。
1.编解码框架的示例
附图的以下描述从用于将视频的多个图片进行编解码的基于区块的预测编解码器的编码器与解码器的描述的呈现开始,以形成本发明的实施例可能建立于其中的编解码框架的示例。关于图1至图3描述各自的编码器与解码器。以下,将对本发明的概念的实施例进行描述,并且描述关于如何将这些概念分别建立到图1与图2的编码器与解码器,但是用随后的图4与以下描述的实施例也可以用于形成不根据基于图1与2的编码器与解码器建构的编解码框架进行操作的编码器与解码器。
图1显示一种用于示例性地使用基于变换的残差编码将图片12预测地编码为数据流14的设备。使用附图标记10指示该设备或编码器。图2显示对应的解码器20,即,被配置为也使用基于变换的残差解码从数据流14预测地解码图片12’的设备20,其中在预测残差信号的量化引入的编码损失方面,撇号已用来指示由解码器20重建的图片12’偏离通过设备10最初编码的图片12。图1与图2示例性地使用基于变换的预测残差编解码,但是本申请的实施例不限于这种预测残差编解码。如同将在下文中概述的,关于图1与图2描述的其他细节也是如此。
编码器10被配置为使预测残差信号受到空间到频谱变换,并且将由此获得的预测残差信号编码到数据流14。类似地,解码器20被配置为从数据流解码预测残差信号,并且将使由此获得的预测残差信号受到频谱到空间变换。
在内部地,编码器10可以包括预测残差信号形成器22,该预测残差信号形成器22产生预测残差24以便测量预测信号26与原始信号(例如图片)的偏差。预测残差信号形成器22可以例如是减法器,它从原始信号,即从图片12中减去预测信号。编码器10然后还包括变换器28,该变换器使预测残差信号24受到空间到频谱变换以获得谱域预测残差信号24’,然后也通过编码器10所包括的量化器32进行量化。量化的预测残差信号24”被编码到比特流14中。为此,编码器10可选择性地包括熵编码器34,该熵编码器34将经过变换与量化的预测残差信号进行熵编码到数据流14中。基于编码到数据流14中以及从数据流14中可解码的预测残差信号24”,编码器10的预测级36产生预测信号26。为此,如图1所示,预测级36可以在内部地包括解量化器38,该解量化器38将预测残差信号24”进行解量化,以获取谱域预测残差信号24”’,该信号除了量化损失之外对应于信号24’,紧接着通过逆变换器40,使得后者的预测残差信号24”’受到逆变换,即频谱到空间变换,以获得预测残差信号24””,预测残差信号24””对应原始预测残差信号24(除了量化损失外)。然后,预测级36的组合器42例如通过相加来重新组合预测信号26与预测残差信号24””,以获得重建信号46,即原始信号12的重建。重建信号46可以对应于信号12’。然后,预测级36的预测模块44通过使用例如空间预测,即图片内预测、和/或时间预测,即图片间预测,基于信号46来产生预测信号26。
同样,如图2所示,解码器20可以在内部由对应预测级36的组件组成,以及以对应于预测级36的方式互相连接。特别地,解码器20的熵解码器50可以从数据流熵解码量化的谱域预测残差信号24”,然后以上述关于预测级36的模块的方式相互连接与协作的解量化器52、逆变换器54、组合器56与预测模块58基于预测残差信号24”恢复重建信号,使得如图2所示,组合器56的输出产生重建信号,即图片12’。
尽管上面没有具体描述,但是很容易明白,根据一些优化方案,例如以优化一些速率及失真有关的标准(即编码成本)的方式,编码器10可以设置一些编码参数,包括例如预测模式、运动参数等。例如,编码器10与解码器20以及对应的模块44、58分别可以支持不同的预测模式,例如帧内编码模式与帧间编码模式。编码器与解码器在这些预测模式类型之间切换的粒度可以分别对应于图片12与12’到编码区段或编码区块的细分。例如,以这些编码区段为单位,可以将图片细分为帧内编码的区块与帧间编码的区块。基于相应区块的空间、已经编码/解码的邻域来预测帧内编码的区块,如下面更详细地概述。可以存在几种帧内编码模式并且针对各自的帧内编码区段被选择,帧内编码模式包括方向或角度帧内编码模式,根据该方向或角度帧内编码模式,通过沿某个方向推断邻域的样本值将相应的区段填充到相应的帧内编码区段,该某个方向是针对相应的方向帧内编码模式指定的。帧内编码模式也可以例如包括一个或多个其他的模式,例如DC编码模式和/或平面帧内编码模式,根据DC编码模式,相应的帧内编码区块的预测分配DC值给相应的帧内编码区段内的所有样本,根据平面帧内编码模式,相应区块的预测被近似或确定为相应的帧内编码区块的样本位置上通过二维线性函数描述的样本值的空间分布,具有基于相邻样本由二维线性函数限定的平面的驱动倾斜与偏移。与此相比,例如可以在时间上预测帧间编码区块。对于帧间编码区块,可以在数据流中用信号发送运动向量,该运动向量指示图片12所属的视频的先前编码图片12的部分的空间位移,在该处对先前编码/解码图片进行取样,以获得相应的帧间编码区块的预测信号。这意味着,除了数据流14所包括的残差信号编码,例如表示量化的谱域预测残差信号24”的熵编码的变换系数级别之外,数据流14可以具有编码在其中的用于分配编码模式到各种区块的编码模式参数、某些区块的预测参数,例如,帧间编码区段的运动参数,以及可选的其他参数,例如,分别用于控制以及用信号发送图片12与12’到区段的细分的参数。解码器20使用这些参数以与编码器相同的方式细分图片,将相同的预测模式分配给区段,并且执行相同的预测以产生相同的预测信号。
图3示出一方面重建信号(即重建图片12’)以及另一方面在数据流14中用信号发送的预测残差信号24””与预测信号26的组合之间的关系。如上所述,组合可以是加法。预测信号26在图3中被示出为将图片区域细分为帧内编码区块以及帧间编码区块,帧内编码区块使用阴影示意性地指示,帧间编码区块使用非阴影示意性地指示。该细分可以是任何细分,例如将图片区域规则细分为正方形区块或非正方形区块的列与行,或者将图片12进行多树细分为从树根区块到各种尺寸的多个叶区块,例如四叉树细分等,其中图3示出它们的混合,其中图片区域首先细分为树根区块的列与行,然后根据回归多树细分进一步细分为一个或多个叶区块。例如,图片12、12’可以细分为编码区块80、82,例如该编码区块可以表示编码树区块,并且可以进一步细分为更小的编码区块83。
再次,数据流14可以具有针对帧内编码区块80的编码到其中的帧内编码模式,其将几种支持的帧内编码模式之一分配给对应的帧内编码区块80。对于帧间编码区块82,数据流14可以具有编码到其中的一个或多个运动参数。一般而言,帧间编码区块82不限于时间上的编码。可替代地,帧间编码区块82可以是从当前图片12本身之外的先前编码部分所预测的任何区块,例如图片12所属的视频的先前编码图片,或在编码器与解码器分别是可伸缩编码器与解码器时,另一视图的或分层上较低层的图片。
图3中的预测残差信号24””也被示出为图片区域到区块84的细分。这些区块可以称为变换区块,以与编码区块80与82区别。实际上,图3示出编码器10与解码器20可以分别使用图片12与图片12’到多个区块的两种不同的细分,即,分别成为编码区块80与82的一种细分,以及成为变换区块84的另一种细分。两种细分可能是相同的,即每个编码区块80与82可以同时形成变换区块84,但是图3示出这样一种情况,例如,细分为变换区块84形成细分为编码区块80、82的扩展,使得区块80与82的两个区块之间的任何边界覆盖两个区块84之间的边界,或者换句话说,每个区块80、82与变换区块84中的一个一致,或与变换区块84的群集一致。但是,也可以彼此独立地确定或选择细分,使得变换区块84可以可替代地跨越区块80、82之间的区块边界。就细分为变换区块而言,与关于细为区块80、82时所提到的那些类似的陈述是正确的,即区块84可以是将图片区域规则细分为多个区块的结果(有或没有排列成列与行),图片区域的回归多树细分、或其组合或任何其他种类的区块化的结果。顺便说一句,应注意,区块80、82与84不限于正方形、矩形或任何其他形状。
图3进一步示出预测信号26与预测残差信号24””的组合直接产生重建信号12’。然而,应当注意,根据替代实施例,可以将多于一个的预测信号26与预测残差信号24””相组合以产生图片12’。
如上面已经概述的,图1至图3作为示例呈现,其中可以实施下面进一步描述的发明概念以形成根据本申请的编码器与解码器的特定示例。就此而言,图1与图2的编码器与解码器可以分别表示以下本文中描述的编码器与解码器的可能实现方式。然而,图1与图2仅是示例。然而,根据本申请的实施例的编码器可以使用下面更详细概述的概念来执行图片12的基于区块的编码。同样地,根据本申请的实施例的解码器可以使用下面进一步概述的解码概念执行从数据流14的图片12’的基于区块的解码,但是例如可以与图2的解码器20的不同之处在于:以与关于图3描述的方式不同的方式将图片12’细分为多个区块,和/或在于:不是在变换域中从数据流得出预测残差,而是例如在空间域中。
2.根据图4的分数样本
本公开的实施例可以是运动补偿预测的概念的一部分,该运动补偿预测可以是帧间预测的示例,因为可以通过预测模块44、58应用它。MCP可以以分数样本准确度执行。举例来说,样本可以指图片或视频序列的像素或位置,其中全样本位置可以指在图片或视频序列中用信号发送的多个位置,并且分数样本位置可以指全样本位置之间的位置。
图4显示用于四分之一样本亮度内插的整数样本401(具有大写字母的阴影块)与分数样本位置411(具有小写字母的非阴影块)。图4所示的样本可以形成视频序列的部分400或可以是视频序列的部分400。此外,非阴影块并带有小写字母指示四分之一样本分辨率的分数样本位置411。例如,部分400可以表示亮度编码区块或者可以是其一部分。因此,图4可以表示用于四分之一样本亮度内插的一个方案。然而,亮度编码区块仅仅是编码区块的一个示例,其可以在MCP的上下文中使用。也可以使用视频序列的样本或色度样本,使用颜色平面的其他方案,例如三颜色平面,来执行MCP。例如,具有四分之一样本分辨率的分数样本位置411包括二分之一样本位置415与四分之一样本位置417。
分数样本位置411可以通过内插滤波从全样本401获得。用于内插滤波的不同方案可以是可能的。用于内插滤波的方案可以提供一组内插滤波器,该内插滤波器的每个表示用于获得一个或多个特定分数样本位置的规则。
作为内插滤波的示例,关于图4描述了用在HEVC中用于获得15个分数亮度样本位置,例如,区块412中的非阴影分数样本位置的方案。用于内插滤波的HEVC方案利用表1中列出的FIR滤波器。
2.1 HEVC中的内插滤波
在使用四分之一亮度样本的运动向量准确度的HEVC中,存在使用各种一维FIR滤波器计算的15个分数亮度样本位置(例如,如图4所示)。然而,对于每个分数样本位置,内插滤波器是固定的。
滤波器 系数
HEVC(8-抽头) h[i]=[-1 4 -11 40 40 -11 4-1]i=-3…4
HEVC(7-抽头) q[i]=[-1 4 -10 58 17 -5 1]i=-3…3
表1
该方案包括一个用于二分之一样本(HPEL)位置的对称8-抽头滤波器h[i]:通过水平地滤波整数样本位置A-3,0至A4,0来计算位置b0,0,通过垂直地滤波整数样本位置A0,-3至A0,4来计算位置h0,0,以及使用相同的8-抽头滤波器通过如上所述的水平滤波首先计算HPEL位置b0,-3至b0,4紧接着垂直滤波这些来计算位置j0,0
b0,0=∑i=-3..4Ai,0h[i],h0,0=∑j=-3..4A0,jh[j],j0,0=∑j=-3..4b0,jh[j]
用于四分之一样本(QPEL)位置的具有系数q[i]的一个非对称7-抽头滤波器:再次在这里,通过在垂直或水平方向上最近整数样本位置的一维滤波来计算仅具有一个分数样本分量的位置:
a0,0=∑i=-3..3Ai,0q[i],c0,0=∑i=-2..4Ai,0q[1-i]
d0,0=∑j=-3..3A0,jq[j],n0,0=∑j=-2..4A0,jq[1-j]
通过最近分数样本位置的垂直滤波来计算所有其他QPEL位置。对于具有垂直HPEL分量的位置,使用HPEL 8-抽头滤波器:
j0,0=∑j=-3..4a0,jh[j]或i0,0=∑j=-3..4a0,jh[j],k0,0=∑j=-3..4c0,jh[j]
对于具有垂直QPEL分量的位置,使用QPEL 7-抽头滤波器:
e0,0=∑j=-3..4a0,jh[j],f0,0=∑j=-3..4b0,jh[j],g0,0=∑j=-3..4c0,jh[j]
p0,0=∑j=-2..4a0,jq[1-j],q0,0=∑j=-2..4b0,jq[1-j],r0,0=∑j=-2..4c0,jq[1-j]
可以应用此方案来获得如图4所示的分数样本位置。
3.根据图5、图6与图13的编码器
图5示出根据实施例的用于混合视频编码的编码器500。编码器500被配置用于基于输入视频内容512提供视频序列的编码表示514。编码器500被配置为确定与视频序列的部分585相关的一个或多个句法元素520,例如通过句法确定模块521。此外,编码器500被配置为基于该一个或多个句法元素520所描述的属性来选择待被应用于视频序列的部分585的处理方案540。例如编码器包括用于选择处理方案540的处理方案选择器541。处理方案540用于获取用于在视频序列的部分585内的整数和/或分数位置处的运动补偿预测的样本,例如样本401、411、415、417。编码器被配置为例如通过索引编码器561对索引550进行编码,其中索引550指示所选处理方案540,使得给定的经编码索引值根据一个或多个句法元素520所描述的属性表示不同处理方案。此外,编码器500被配置为提供包括一个或多个句法元素520与经编码索引560的比特流作为视频序列的编码表示514。举例来说,编码器500包括编码器模块590,例如熵编码器,用于提供编码表示514。索引编码器561可以是编码器模块590的部分或可以是单独的。
图6示出根据另一实施例的用于混合视频编码的编码器600。编码器600被配置用于基于输入视频内容512提供视频序列的编码表示614。编码器600被配置为确定与视频序列的部分585相关的一个或多个句法元素520,例如通过句法确定模块521。此外,编码器600被配置为基于一个或多个句法元素520所描述的属性来选择待被应用于视频序列的部分585的处理方案540。例如,编码器600包括用于选择处理方案540的处理方案选择器541。处理方案540用于获取用于视频序列的部分585内的整数和/或分数位置处的运动补偿预测的样本,例如样本401、411、415、417。编码器600被配置为根据一个或多个句法元素520所描述的属性来选择熵编码方案662,该熵编码方案662用于提供经编码索引660,该经编码索引660指示所选处理方案540。此外编码器600被配置为提供包括一个或多个句法元素520并包括经编码索引560的比特流作为视频序列的编码表示514。经编码索引值可以表示经编码索引660的值。
图13示出根据另外实施例的用于混合视频编码的编码器1300。编码器1300被配置用于基于输入视频内容512提供视频序列的编码表示1314。编码器1300被配置为确定与视频序列的部分585有关的一个或多个句法元素520。
根据实施例,编码器1300被配置为基于一个或多个句法元素520所描述的属性来选择待被应用于视频序列的部分585的处理方案540,其中处理方案540完全由部分585的属性与运动向量的分数部分来指定,其中处理方案540用于获取用于在视频序列的部分(585)内的整数和/或分数位置处的运动补偿预测的样本401、411、415、417。
根据替代实施例,编码器1300被配置为基于一个或多个句法元素520所描述的运动向量准确度选择待被应用于视频序列的部分585的处理方案。
根据另一替代实施例,编码器1300被配置为以PU粒度或CU粒度,基于一个或多个句法元素520所描述的属性来选择待被应用于视频序列的部分785的处理方案540。
此外,编码器1300被配置为提供包括一个或多个句法元素520的比特流作为视频序列的编码表示1314。
根据实施例,编码器1300被配置为,如果所确定一个或多个句法元素520指示HEPL的MV准确度,并且如果预测模式是平移帧间、平移合并以及组合的帧间/帧内中的一个,则针对待被获得的样本的HPEL位置选择不是标准处理方案的另一处理方案。
除非另有说明,以下描述等效地应用于根据图5的编码器500、根据图6的编码器600及根据图13的编码器1300。
例如,编码器500、600、1300接收视频序列作为输入视频内容,并且提供视频序列的编码表示514、614、1314,视频序列可以包括多个视频帧。句法确定模块521可以例如通过分割视频序列或其视频帧,或者通过从用于划分视频序列的模块获得部分585来获得视频序列的部分585。部分585可以是视频序列的划分成例如编码树单元或编码单元或编码树区块或编码区块的结果,如关于图3所描述的。例如,部分585可以从用于图1或图2的预测模块44、58的图片间或图片内预测的视频序列的划分所产生。句法确定模块521可以进一步基于部分585以及可选择地基于视频序列的其他部分来确定一个或多个句法元素520。
编码器500、600、1300可选择地包括处理模块544,该处理模块544用于将处理方案540应用到部分585来获取点划线箭头所指示的预测信号。例如,预测信号可被用于获得视频序列的编码表示514、614、1314。例如,可以根据关于图1中的编码器10描述的方案来执行将输入视频内容512编码为编码表示514、614、1314,其中图片12可以表示视频内容512以及比特流14可以包括编码表示514、614、1314。例如,处理模块544可以包括预测模块44或可以对应预测模块44,使得处理方案540可以表示用于预测模块44的输入,预测模块44可以使用用于MCP的处理方案540以提供预测信号,例如使用在说明书的介绍部分中介绍的AMVR。
根据实施例,处理方案540是滤波器或滤波器的集合。例如,一个或多个滤波器可以是FIR滤波器,例如内插滤波器。
例如,处理方案540可以是内插滤波器,如在2.1节中描述的8-抽头滤波器与7-抽头滤波器,或者类似的内插滤波器,其可以用于获得分数样本位置,例如针对MCP。在本发明的多个实施例中,可以支持两个额外的1D 6-抽头低通FIR滤波器,其可以代替HEVC 8-抽头滤波器(如表2中所描述的系数h[i])应用。在下文中,内插滤波器可以用作处理方案的一个示例。
例如,处理方案540可以具有谱特性,例如低通或高通特性,使得编码器500、600、1300可以被配置为在具有不同特性的处理方案之间进行选择。
根据实施例,编码器500、600被配置为为视频帧或图片内的不同区块选择不同处理方案。
例如,通过编码器500、600、1300,视频序列的视频帧可以被分割成多个区块或部分,例如图3中的区块80、82、83所指示的。例如,编码器500、600、1300可以针对部分80、82、83中的每个获得预测信号26。编码器500、600、1300可以针对视频帧的不同部分单独地选择处理方案540。在此上下文中,视频帧的部分或区块可以指由视频帧的分割的第一回归产生的规则尺寸的区块或第一级区块,例如编码树区块或编码树单元,例如编码区块80或82。并且,编码器500、600、1300可以针对这样的部分或第一级区块或编码树单元的不同子部分,例如针对编码区块83选择不同的处理方案。编码器500、600、1300甚至可以针对编码区块或编码单元的不同部分或区块选择不同处理方案。
因此,编码器500、600、1300可以在视频序列的图片或视频帧的精细粒度下适配内插滤波器,允许适配于一个片段(slice)、图块(tile)或图片内的局部特性,即在小于片段或图块或图片的尺寸的粒度下。
因此,编码器500、600、1300可以确定关于部分585的尺寸或形状的信息,如区块尺寸或区块形状,并且将此信息提供为一个或多个句法元素520。并且,编码器500、600、1300可以确定或获得其他参数,其他参数可以用在图片内或图片间预测模型的上下文中。例如,编码器500、600、1300可以例如通过用于获得预测信号的处理模块544来确定待被应用于部分585的MV准确度,该预测信号用于对部分585进行编码。
因此,一个或多个句法元素520可以包括运动向量准确度、分数样本位置、区块尺寸、区块形状、预测假设的数量、预测模式、经编码残差信号的可用性、经编码残差信号的谱属性、参考图片信号、环路滤波器数据、运动向量长度或自适应运动向量分辨率模式中的至少一个。
例如,编码器500、600、1300可以从已经确定的属性或处理步骤中得出处理方案540,其可以通过一个或多个句法元素520指示。例如,在HEVC或VVC的合并模式的情况下,使用的内插滤波器可以从所选合并候选者继承。在另一个实施例中,可能可以通过显式信令覆盖从合并候选者继承的内插滤波器。
根据实施例,编码器500、600、1300被配置为根据一个或多个句法元素所描述的属性来确定可允许的处理方案的集合,并且从所确定集合中选择处理方案540。例如,处理方案选择器541可以从一个或多个句法元素520推断,处理方案的实体的哪些处理方案与部分585是兼容的或可以有益地应用于部分585,以便获得视频序列或特别是部分585的有效编码。
换句话说,根据一个或多个句法元素520所指示的部分585的一个或多个属性,对于该部分585,一个或多个处理方案是可用的、可允许或可选择的。因此,对于部分585来说,可以仅一种处理方案是可允许的。在这种情况下,编码器500、600可以选择该唯一可允许的处理方案作为处理方案540。由于在这种情况下,可以从一个或多个句法元素520唯一地识别处理方案,因此编码器500、600可以跳过在编码表示514、614中提供经编码索引550、560,以避免比特流中的冗余信息与信令开销。在对于部分585超过一个处理方案是可允许的情况下,编码器可以将该可允许的多个处理方案确定为允许用于部分585的处理方案的集合,并且可以从该处理方案的集合中选择处理方案540。在后一种情况下,编码器500、600可以将经编码索引560、660编码在编码表示514、614中,用于指示所选处理方案540。在第6节中描述的实施例可以是这种实施例的一个示例。
因此,在某些情况下,处理方案或内插滤波器可以适配于视频帧的不同部分,而无需显式地用信号发送所应用的处理方案或内插滤波器。因此,在包括编码表示514、516的比特流中可能不需要额外的比特。
根据可对应于编码器1300的实施例,在所有情况下基于一个或多个句法元素所描述的属性唯一地确定处理方案,使得在编码表示1314中不需要处理方案540的明确指示,编码表示1314具有专用于处理方案540的经编码索引。因此,根据实施例,编码器1300可以不需要确定是否对经编码索引进行编码,或者可以不需要选择编码方案。
根据实施例,编码器500、600、1300被配置为根据运动向量准确度来确定处理方案的可用集合。例如,该内插滤波器的可用(或可允许)集合可以通过针对区块选择的运动向量准确度(使用专用句法元素来用信号发送)来确定。
例如,一个或多个句法元素520可以例如通过使用在6.1.2节中关于表3描述的用于用信号发送MV准确度的方案来指示为部分585所选择的MV准确度。
根据实施例,编码器500、600、1300被配置为在四分之一样本运动向量分辨率、二分之一样本运动向量分辨率、全样本运动向量分辨率以及四样本运动向量分辨率之间进行选择。
根据实施例,编码器500、600、1300被配置为,为在最大运动向量准确度与最小运动向量准确度之间的运动向量准确度或为在最大运动向量准确度与全样本运动向量准确度之间的运动向量准确度选择性地确定处理方案的集合,以及从所确定集合中选择处理方案540。
例如,在一个实施例中,对于半亮度样本的准确度,可以支持内插滤波器的多个集合,而对于所有其他可能的运动向量准确度,可以使用内插滤波器的默认集合。
根据编码器500、600的一个实施例,在AMVR模式指示HPEL准确度(amvr模式=2)的情况下,可以通过每CU一个句法元素(if_idx)来显式地用信号发送内插滤波器:
-如果if_idx等于0,则指示使用HEVC内插滤波器的滤波器系数h[i]用于产生HPEL位置;
-如果if_idx等于1,则指示使用平顶滤波器的滤波器系数h[i](见下表)用于产生HPEL位置;
-如果if_idx等于2,则指示使用高斯滤波器的滤波器系数h[i](见下表)用于产生HPEL位置;
-当CU以合并模式编码并且通过从邻近区块复制(多个)运动向量而不修改(多个)运动向量来产生合并候选者时,索引if_idx也被复制。如果if_idx大于0,则使用两个非HEVC滤波器(平顶或高斯)中的一个对HPEL位置进行滤波。
滤波器 MV分辨率 系数h[i] if_idx 二值化
HEVC(8-抽头) HPEL [-1 4-11 40 40-11 4-1] 0 0
平顶(6-抽头) HPEL [-3 4 31 31 4-3] 1 10
高斯(6-抽头) HPEL [3 9 20 20 9 3] 2 11
表2
为了获得经编码索引560、660,编码器500、600可以应用映射规则,该映射规则将索引550或指示所选处理方案540的索引映射到经编码索引560、660。例如,映射规则可以对应于二值化方案。编码器500、600可以根据允许的处理方案的数量来适配经编码索引560、660,使得经编码索引560、660需要少量的比特。
例如,编码器500、600可以根据运动向量准确度和/或运动向量的分数样本位置或分数部分来选择处理方案,并且相应地选择映射规则。
编码器500、600可进一步根据一个或多个句法元素520所描述的属性来适配用于提供经编码索引560、660的二进制代码的数量,例如通过适配映射规则。
因此,编码器500、600可以选择将索引值映射到经编码索引值的映射规则,使得表示经编码索引值的二进制代码的数量适配于对于视频序列的部分585可允许的处理方案的数量。
例如,用于提供经编码索引560的二进制代码的数量可以取决于考虑到属性而允许的处理方案的数量。例如,如果仅允许一种处理方案,则二进制代码的数量可以为零。表2显示三个可允许的处理方案以及用于经编码索引560、660的最大数量三个的二进制代码,以及用于将索引值映射到经编码索引值的对应映射规则的示例。
例如,表2显示用于将if_idx映射到经编码索引值的映射规则的一个实施例。对于不同的MV准确度,映射规则可以不同。
在表2描述的实施例中,可以只针对HPEL位置修改内插滤波器。如果运动向量指向整数亮度样本位置,则在所有情况下均不使用内插滤波器。如果运动向量指向表示全样本x(或y)位置与二分之一样本y(或x)位置的参考图片位置,则所选的半像素滤镜仅应用于垂直(或水平方向)。此外,仅影响亮度分量的滤波,对于色度分量,在所有情况下都使用常规的色度内插滤波器。
if_idx索引可以对应于索引550与if_idx的二值化值,例如,如表2所指示,可以对应于经编码索引560、660。因此,索引编码器561可以基于二值化方案,例如在表2的最后一栏中指示的二值化方案,从索引550得出经编码索引560。在编码器600的上下文中,在表2的最后一栏中指示的二值化方案可以对应于由编码方案选择器661所选择的熵编码方案662,或是熵编码方案662的一部分,基于该方案,编码器模块690可以提供经编码索引660,例如经编码索引可以对应于表2中显示的二值化数值或对应其编码表示。例如,编码器600可以选择熵编码方案662所基于的属性可以对应于MV准确度。因此,表2显示一种情况的示例,其中一个或多个句法元素520指示部分585的MV准确度是HPEL。
根据实施例,编码器500、600被配置为确定是否单个处理方案540对于视频序列的部分585是可允许的,并且响应于发现仅单个处理方案540对于视频序列的部分585是可允许的,选择性地省略对经编码索引的包含。例如,编码器500可以省略将经编码索引560包含到编码表示514。例如,编码器600可以选择熵编码方案662,这指示没有经编码索引660被包含于编码表示614中或指示在比特流中用于经编码索引660的二进制代码或比特的数量为零。
根据实施例,自适应滤波器选择被扩展到色度分量。例如,编码器500、600可以根据色度分量的属性来选择处理方案540。色度分量可以是色度编码区块的部分,该色度编码区块可以与亮度编码区块相关联。例如,部分585可以是亮度编码区块的部分和/或色度编码区块的部分。
4.根据图7及图8的解码器
图7示出根据实施例的用于混合视频解码的解码器700。解码器700被配置为基于视频序列的编码表示714提供输出视频内容712。编码表示714可以对应于通过编码器500、600、1300所提供的编码表示514、614、1314。解码器700被配置为获得作为视频序列的编码表示714的比特流,并且被配置为从比特流中识别与视频序列的部分785相关的一个或多个句法元素520,视频序列的部分785可以对应于输入视频内容512的部分585。
根据实施例,解码器700包括用于识别一个或多个句法元素520的句法识别器721,句法元素520可能已经被编码器500、600编码成编码表示714。此外,解码器700被配置为基于一个或多个句法元素520与索引550识别用于视频序列的部分785的处理方案540,处理方案540用于获取用于在视频序列的部分785内的整数位置401和/或分数位置411、415、417处的运动补偿预测的样本401、411、415、417,其中解码器700被配置为根据一个或多个句法元素520将不同处理方案分配到给定的经编码索引值。
例如,处理方案选择器741可以基于一个或多个句法元素520从编码表示714确定索引550,并且随后可以使用一个或多个句法元素520和/或索引550来确定处理方案540。取决于一个或多个句法元素520,处理方案选择器741也可推断编码表示714以及一个或多个句法元素520不包括索引550,并且可以从一个或多个句法元素520推导出索引550。
根据替代实施例,解码器700被配置为根据一个或多个句法元素520来选择用于视频序列的部分785的处理方案540,其中处理方案完全由部分785的属性与运动向量的分数部分指定,以及其中处理方案540用于获取用于在视频序列的部分785内的整数和/或分数位置处的运动补偿预测的样本401、411、415、417。
根据另一替代实施例,解码器700被配置为根据运动向量准确度选择用于视频序列的部分785的处理方案540。
根据另一替代实施例,解码器700被配置为以PU粒度或CU粒度并根据一个或多个句法元素520来确定用于视频序列的部分785的处理方案540。
此外,解码器700被配置为例如通过处理模块744将所识别处理方案540应用于视频序列的部分785。
图8示出根据另一实施例的一种用于混合视频解码的解码器800。解码器800被配置为基于视频序列的编码表示714提供输出视频内容812。编码表示714可以对应于由编码器500、600提供的编码表示514、614。解码器800被配置为获得作为视频序列的编码表示714的比特流,并且被配置为从比特流中识别与视频序列的部分785相关的一个或多个句法元素520,视频序列的部分785可以对应于输入视频内容512的部分585。例如,解码器700包括用于识别一个或多个句法元素的句法识别器821,句法元素可能已经被编码器500、600编码为编码表示714。此外,解码器800被配置为根据一个或多个句法元素520确定在比特流中用于提供经编码索引的熵编码方案662,经编码索引指示用于视频序列的部分785的处理方案540,该处理方案540用于获取用于在视频序列的部分785内的整数和/或分数位置处的运动补偿预测的样本401、411、415、417。例如,解码器800包括编码方案选择器861,该编码方案选择器861可以对应于编码器600的编码方案选择器661,用于基于一个或多个句法元素520确定编码方案662。解码器800还被配置为若所确定熵编码方案662指定大于零的二进制代码的数量,例如通过处理方案选择器841,在比特流中识别经编码索引并且将该索引进行解码。解码器800还被配置为若所确定编码方案所指定的二进制代码的数量大于零,基于一个或多个句法元素520并基于经解码索引识别处理方案540。例如,处理方案选择器841可以识别处理方案540。此外,解码器800被配置为例如通过处理模块844将所识别处理方案540应用于视频序列的部分785,处理模块844可以对应于处理模块744。
解码器700、800可以基于输入视频内容512从由编码器500、600提供的编码表示514、614、1314获得输出视频内容712、812,使得输出视频内容712、812可以对应于输入视频内容512,除了如量化损失的编码损失之外。因此,编码器500、600及其特征的描述可以等效地应用于解码器700、800,但是可以反转执行一些处理。例如,编码器500、600的涉及编码的特征可以对应于解码器700、800的涉及解码的特征。
例如,解码器700、800可以从编码器500、600、1300所提供的编码表示714、814、1314读取或解码一个或多个句法元素520。因此,编码器500、600、1300及解码器700、800、1300可以应用等效的假设或知识,用于从一个或多个句法元素520来确定处理方案540。
举例来说,经编码索引560、660可指示解码器700、800可能无法从一个或多个句法元素520得出的信息,使得解码器700、800的一些实施例可基于经编码索引560、660确定处理方案540。举例来说,若解码器700、800从一个或多个句法元素520得出几种处理方案是可允许的,例如,解码器700、800的一些实施例可以从用于获取索引(例如该索引550)的编码表示714、814解码经编码索引560、660。然而,要指出的是,并非解码器700的所有实施例都被配置为得出几种处理方案是否是可允许的。解码器700的一些实施例可以被配置为例如在所有情况下或独立于一个或多个句法元素520的指示,从编码表示1314的一个或多个句法元素推断处理方案540。因此,解码器700的实施例可以从一个或多个句法元素520推断处理方案540,而无需将明显地专用于处理方案540的索引进行解码。
因此,尽管没有明确重复组件的描述,一个或多个句法元素520、处理方案540、部分585、索引550、可选择地经编码索引560、660以及编码器500、600、1300的更多细节的特征、功能、优点与示例可以等效地应用于解码器700、800。
例如,解码器700、800可以以图2的解码器20实现。例如,处理模块744、844可以包括预测模块58或者可以对应于预测模块58,使得处理方案540可以表示用于预测模块58的输入,预测模块可以使用针对MCP的处理方案540用于提供预测信号59。编码器500、600与解码器700、800之间的关系可以对应于如第1节所述的编码器10与解码器20之间的关系。
根据实施例,解码器700、800被配置为确定单个处理方案540对于视频序列的部分785是否是可允许的,并且响应于发现仅单个处理方案540对于视频序列的部分785是可允许的,选择性地省略对经编码索引的识别。
举例来说,解码器700可以基于一个或多个句法元素520来确定单个处理方案540对于部分785是否是可允许的。取决于结果,解码器700可以识别或将解码经编码索引,该经编码索引可对应于经编码索引560、660,或者解码器700可以省略或跳过对经编码索引的识别,并且可以选择对于部分785是可允许的单个处理方案。
根据另一示例,解码器800可以从熵编码方案662中得出是否从编码表示814解码经编码索引。若有经编码索引要被解码,解码器800可以解码该经编码索引,该经编码索引可以对应经编码索引560、660,以确定可以对应于索引550的索引,并且基于该索引来确定处理方案540。若没有经编码索引要被解码,解码器800可以省略或跳过对经编码索引的解码,并且基于一个或多个句法元素520来确定处理方案540。
根据实施例,解码器700、800被配置为根据运动向量的分数部分来选择滤波器。例如,运动向量可以由涉及两个不同方向的两个分量表示。例如,运动向量可以由水平分量及垂直分量表示。水平与垂直可表示图片或视频帧的平面中的两个正交方向。因此,运动向量的分数部分可以指具有分数分辨率的MV的分量。
根据实施例,解码器700、800被配置为根据运动向量的分数部分来选择不同滤波器用于在第一方向进行滤波以及在第二方向进行滤波。例如,解码器700、800可以根据描述MV在第一方向上的分量的MV的第一分量,以及根据描述MV在第二方向上的分量的MV的第二分量,选择不同滤波器。
编码表示514、614、714、1314可以是编码器500、600、1300所提供的视频比特流的部分,该视频比特流包括输入视频内容的视频序列的多个部分的编码表示。
根据实施例,用于混合视频编码的视频比特流包括与视频序列的部分585相关的一个或多个句法元素520,该视频比特流描述视频序列。视频比特流至少对于视频序列的部分中的一些包括处理方案540索引比特流元素,其中,处理方案540索引比特流元素的存在根据一个或多个其他句法元素520而变化。例如,视频比特流可以对应于或可以包括编码表示514、614、714。
根据实施例,用于混合视频编码的视频比特流包括与视频序列的部分585相关的一个或多个句法元素520,该视频比特流描述视频序列。视频比特流至少针对视频序列的部分中的一些包括处理方案540索引比特流元素,其中,处理方案540索引比特流元素的二进制代码的数量根据与视频序列的部分585相关的一个或多个句法元素520而变化。例如,视频比特流可以对应于或可以包括编码表示514、614、714。
根据实施例,用于混合视频编码的视频比特流包括与视频序列的部分585相关的一个或多个句法元素520,该视频比特流描述视频序列。视频比特流至少对于视频序列的部分中的一些包括处理方案540索引比特流元素,其中,处理方案540索引比特流元素的码字的含义根据与视频序列的部分585相关的一个或多个句法元素520而变化。例如,视频比特流可以对应于或可以包括编码表示514、614、714。
5.根据图9,图10,图11和图12的用于混合视频编码的方法
图9显示根据实施例的一种用于混合视频编码的方法5000的流程图。方法5000用于基于输入视频内容512提供视频序列的编码表示514,方法5000包括确定与视频序列的部分585相关的一个或多个句法元素520的步骤5001。步骤5002包括基于一个或多个句法元素520所描述的属性来选择待被应用于视频序列的部分585的处理方案540,该处理方案540用于获取用于在视频序列的部分585内的整数和/或分数位置处的运动补偿预测的样本401、411、415、417。步骤5003包括将指示所选处理方案540的索引进行编码,使得给定的经编码索引值根据一个或多个句法元素520所描述的属性表示不同处理方案。步骤5004包括提供比特流作为视频序列的编码表示,该比特流包括一个或多个句法元素520与经编码索引。
图10显示根据实施例的一种用于混合视频编码的方法6000的流程图。方法6000用于基于输入视频内容提供视频序列的编码表示,方法6000包括确定与视频序列的部分585相关的一个或多个句法元素520的步骤6001。步骤6002包括基于一个或多个句法元素520所描述的属性来选择待被应用于视频序列的部分585的处理方案540,该处理方案540用于获取用于在视频序列的部分585内的整数和/或分数位置处的运动补偿预测的样本401、411、415、417。步骤6003包括根据一个或多个句法元素520所描述的属性来选择用于提供经编码索引的熵编码方案,该经编码索引指示所选处理方案540。步骤6004包括提供比特流作为视频序列的编码表示,该比特流包括一个或多个句法元素520并包括经编码索引。
图11显示根据实施例的一种用于混合视频编码的方法7000的流程图。方法7000用于基于视频序列的编码表示提供输出视频内容,方法7000包括获得作为视频序列的编码表示的比特流的步骤7001。步骤7002包括从比特流中识别与视频序列的部分785相关的一个或多个句法元素。步骤7003包括基于一个或多个句法元素520与索引来识别用于视频序列的部分785的处理方案540,该处理方案540用于获取用于在视频序列的部分785内的整数和/或分数位置处的运动补偿预测的样本401、411、415、417,其中该方法根据一个或多个句法元素520将不同处理方案分配到给定的经编码索引值。步骤7004包括将所识别处理方案540应用于视频序列的部分785。
图12显示根据实施例的一种用于混合视频编码的方法8000的流程图。方法8000用于基于视频序列的编码表示提供输出视频内容,方法8000包括获得作为视频序列的编码表示的比特流的步骤8001。步骤8002包括从比特流中识别与视频序列的部分785相关的一个或多个句法元素520。步骤8003包括根据一个或多个句法元素520确定在比特流中用于提供经编码索引的熵编码方案662,该经编码索引指示用于视频序列的部分785的处理方案540,该处理方案540用于获取用于在视频序列的部分785内的整数和/或分数位置处的运动补偿预测的样本401、411、415、417。步骤8004包括若所确定熵编码方案指定大于零的二进制代码的数量,在比特流中识别经编码索引并且将该索引进行解码。步骤8005包括若所确定熵编码方案所指定的二进制代码的数量大于零,基于一个或多个句法元素520并基于经解码索引识别处理方案540。步骤8006包括将所识别处理方案540应用于视频序列的部分785。
图14显示根据实施例的一种用于混合视频编码的方法7100的流程图。方法7100用于基于视频序列的编码表示1314提供输出视频内容712,方法7100包括:获得7101作为视频序列的编码表示714的比特流;从比特流中识别7102与视频序列的部分785相关的一个或多个句法元素520;根据一个或多个句法元素520来选择7103用于视频序列的部分785的处理方案540,其中处理方案完全由部分785的属性与运动向量的分数部分指定,该处理方案540用于获取用于在视频序列的部分785内的整数和/或分数位置处的运动补偿预测的样本401、411、415、417;将所识别处理方案540应用于7104视频序列的部分785。
图15显示根据实施例的一种用于混合视频编码的方法7200的流程图。方法7200用于基于视频序列的编码表示1314提供输出视频内容712,方法7200包括:获得7201作为视频序列的编码表示714的比特流;从比特流中识别7202与视频序列的部分785相关的一个或多个句法元素520;根据运动向量准确度选择7203用于视频序列的部分785的处理方案540,该处理方案540用于获取用于在视频序列的部分785内的整数和/或分数位置处的运动补偿预测的样本401、411、415、417;将所识别处理方案540应用于7204视频序列的部分785。
图16显示根据实施例的一种用于混合视频编码的方法7300的流程图。方法7300用于基于视频序列的编码表示1314提供输出视频内容712,方法7300包括:获得7301作为视频序列的编码表示714的比特流;从比特流中识别7302与视频序列的部分785相关的一个或多个句法元素520;以PU粒度或CU粒度并根据一个或多个句法元素520来确定7303用于视频序列的部分785的处理方案540,该处理方案540用于获取用于在视频序列的部分785内的整数和/或分数位置处的运动补偿预测的样本401、411、415、417;将所识别处理方案540应用于7304视频序列的部分785。
图17显示根据实施例的一种用于混合视频编码的方法1310的流程图。方法1310用于基于输入视频内容512提供视频序列的编码表示1314,方法1310包括:确定1311与视频序列的部分585相关的一个或多个句法元素520;基于一个或多个句法元素520所描述的属性来选择1312待被应用于视频序列的部分585的处理方案540,其中处理方案完全由部分585的属性与运动向量的分数部分来指定,该处理方案540用于获取用于在视频序列的部分585内的整数和/或分数位置处的运动补偿预测的样本401、411、415、417;提供1313比特流作为视频序列的编码表示1314,该比特流包括一个或多个句法元素520。
图18显示根据实施例的一种用于混合视频编码的方法1320的流程图。方法1320用于基于输入视频内容512提供视频序列的编码表示1314,方法1320包括:确定1321与视频序列的部分585相关的一个或多个句法元素520;基于一个或多个句法元素520所描述的运动向量准确度来选择1322待被应用于视频序列的部分585的处理方案540,该处理方案540用于获取用于在视频序列的部分785内的整数和/或分数位置处的运动补偿预测的样本401、411、415、417;提供1323比特流作为视频序列的编码表示1314,该比特流包括一个或多个句法元素520。
图19显示根据实施例的一种用于混合视频编码的方法1330的流程图。方法1330用于基于输入视频内容512提供视频序列的编码表示1314,方法1330包括:确定1331与视频序列的部分585相关的一个或多个句法元素520;以PU粒度或CU粒度,基于一个或多个句法元素520所描述的属性来选择1332待被应用于视频序列的部分585的处理方案540,该处理方案540用于获取用于在视频序列的部分785内的整数和/或分数位置处的运动补偿预测的样本401、411、415、417;提供1333比特流作为视频序列的编码表示1314,该比特流包括一个或多个句法元素520。
6.进一步的实施例
在许多或可能的所有当前视频编码标准中,包括当前的VVC草案[5],内插滤波器对于每个分数样本位置都是固定的。(此处的“分数样本位置”是指四个周围FPEL或整数位置之间的相对位置)。本发明的实施例允许针对视频序列的不同部位(例如,部分)中的相同分数样本位置使用不同的内插滤波器(例如,处理方案)。先前提到用于切换内插滤波的方法(参阅“技术背景”部分)有个缺点是它们仅允许以粗粒度(即片段级别)在不同内插滤波器之间进行切换,以及选择可以通过传输各个FIR滤波器系数(如AIF及其变体)来明显地用信号发送。
允许以精细的粒度(例如,PU/CU或CTU级别)切换内插滤波器,允许更好地适配局部图像特性(例如,除了高精度HEVC内插滤波器以外,有益于使用具有不同特性的滤波器,例如具有较强低通特性的滤波器,用于衰减高频噪声成分)。然而,就所需比特率而言,对于每个PU所使用的内插滤波器的显式地用信号发送可能太昂贵。因此,本发明的实施例根据解码器(例如,因为它们通过一个或多个句法元素520指示,可以是编码表示514、614、1314的部分)也知悉的给定部分或区域(视频序列的部份)的属性通过限制可用于视频序列的该给定部分或区域(例如,PU/CU、CTU、片段、帧等)的内插滤波器来避免该信令开销。在仅一个内插滤波器保持可用的情况下,不需要进一步用信号发送。在多于一个保持可用的情况下,可以仅传输使用哪个可用的内插滤波器。(请注意,此处及下文中,“内插滤波”是任何信号处理中的广义含义,其被应用以在给定的、可能为分数样本的、位置获取参考样本,并且也可包括FPEL位置的滤波。)
根据本发明的实施例,在当前区块具有某些属性(由其他经解码句法元素的值所给定)时,才可能改变所使用的内插滤波器。在此,可以区分两种情况:
情况1:对于区块的给定属性(由其他句法元素所确定),仅支持内插滤波器的一个特定集合。在此,术语“内插滤波器的集合”是指这样的事实:实际使用的滤波器也确实取决于子样本位置(如在利用子样本准确度的常规视频编码中一样)。然后,属性确定所使用的内插滤波器的集合,并且运动向量的分数部分确定实际滤波器(或者,若通过可分离的滤波器指定滤波,则为水平与垂直滤波器)。由于内插滤波器完全由区块的属性与运动向量的分数部分指定,因此在这种情况下不传输额外的句法元素。
情况2:对于区块的给定属性,支持内插滤波器的多个集合。在这种情况下,可以通过编码对应的句法元素(例如,到所支持集合的列表中的索引)来选择内插滤波器的集合。所使用的内插滤波器(来自所选集合)可以再次通过运动向量的分数部分确定。
请注意,两种情况可能在相同图片中得到支持。这意味着对于具有第一属性的区块,可以使用内插滤波器的固定集合(此集合可以与内插滤波器的常规集合相同,或者可以与常规集合有所偏离)。以及对于具有第二属性的区块,可以支持内插滤波器的多个集合,并且通过所传输的滤波器索引(或任何其他方式)确定选中的滤波器。另外,区块可以具有第三属性,在这种情况下,可以使用内插滤波器的其他集合(一个或多个)。
可用于限制可用的内插滤波器的视频序列的部位或区域(视频序列的部分)的这些属性包括:
-MV准确度(例如QPEL、HPEL、FPEL等),即针对不同运动向量准确度可以支持内插滤波器的不同集合
-分数样本位置
-区块尺寸或,更一般而言,区块形状
-预测假设的数量(即1个用于单预测,2个用于双预测等),例如额外的平滑滤波器仅用于单预测
-预测模式(例如平移帧间、仿射帧间、平移合并、仿射合并、组合的帧间/帧内)
-经编码残差信号的可用性(例如HEVC中的经编码区块标志)
-经编码残差信号的谱属性
-参考图片信号(运动数据限定的参考区块),例如
o参考区块内的来自并置的Pus的区块边缘
o参考信号的高或低频特性
-环路滤波器数据,例如
o来自样本自适应偏移滤波器(SAO)的边缘偏移或频带偏移分类
o解区块滤波器决策及边界强度
-MV长度,例如仅针对长MVs或特定方向启用额外的平滑滤波器
这些属性中的两个或更多个的组合(例如MV准确度与分数样本位置)也是可能的(请参见上文)。
在本发明的一个实施例中,可用的内插滤波器可以直接链接到MV准确度。特别地,额外的或不同的内插滤波器(相对于HEVC或VVC内插滤波器)仅可用于使用特定MV准确度(例如,HPEL)编码的区块,并且例如仅应用于HPEL位置。在这种情况下,用信号发送MV准确度可以使用类似于VVC的AMVR的方案(参见第6.1.2节)。若仅一个内插滤波器(即替换该应的HEVC或VVC内插滤波器)是可用的,则不需要进一步用信号发送。如果有多于一个内插滤波器是可用的,则仅对于使用给定的MV准确度的区块,可以用信号发送所使用的内插滤波器的指示,而对于所有其他块,信令不变。
在本发明的一个实施例中,在HEVC或VVC的合并模式的情况下,所使用的内插滤波器可以从所选合并候选者继承。在另一个实施例中,有可能通过显式地用信号发送从合并候选者中覆盖所继承的内插滤波器。
6.1本发明的进一步实施例
在本发明的实施例中,内插滤波器的可用集合可由针对区块选中的运动向量准确度(其使用专用句法元素来用信号发送)来确定。对于半亮度样本的准确度,可以支持内插滤波器的多个集合,而对于所有其他可能的运动向量准确度,使用内插滤波器的默认集合。
6.1.1内插滤波器集合
在本发明的实施例中,可以支持两个额外的1D 6-抽头低通FIR滤波器,其可以代替HEVC 8-抽头滤波器(具有上述系数h[i])被应用。
6.1.2信号化
通过HPEL分辨率从当前VVC草案用截断的一元二值化来扩展AMVR CU句法,并且针对额外的二进制代码添加一个CABAC上下文:
-若至少一个MVD大于零,索引才呈现
-若索引等于零,则它指示QPEL准确度及HEVC内插滤波器
-若索引等于1,则它指示所有MVDs具有HPEL MV准确度,并且在被添加到MVPs前需要移位到QPEL准确度,该MVPs舍入到HPEL准确度
-若索引等于2或3,它分别指示FPEL或4PEL准确度,并且不应用内插滤波
Figure BDA0003351695330000311
Figure BDA0003351695330000321
表3
根据当前区块左侧与上方的相邻区块的AMVR模式的值可以在三个上下文中选择在QPEL与其他准确度之间切换的第一二进制代码的上下文。若两个相邻区块均具有QPELAMVR模式,则上下文为0,否则,若仅一个相邻区块未使用QPEL AMVR模式,则上下文为1,并且否则(两个相邻区块均未使用QPEL AMVR模式),该上下文为2。
在AMVR模式指示HPEL准确度(amvr模式=2)的情况下,可以每CU通过一个句法元素(if_idx)显式地用信号发送内插滤波器:
-若if_idx等于0,则它指示HEVC的滤波器系数h[i]用于产生HPEL位置
-若if_idx等于1,则它指示平顶滤波器(参见第3节的表2)的滤波器系数h[i]用于产生该HPEL位置
-若if_idx等于2,则它指示高斯滤波器(参见第3节的表2)的滤波器系数h[i]用于产生HPEL位置
当CU以合并模式编码并且通过从相邻区块复制(多个)运动向量而不修改(多个)运动向量来产生合并候选者时,索引if_idx也被复制。若if_idx大于0,则使用两个非HEVC滤波器(平顶或高斯)之一对HPEL位置进行滤波。
在特定实施例中,可以仅针对HPEL位置修改内插滤波器。如果运动向量指向整数亮度样本位置,则在所有情况下均不使用内插滤波器。如果运动向量指向表示全样本x(或y)位置与二分之一样本y(或x)位置的参考图片位置,则所选的半像素滤波器仅应用于垂直(或水平方向)。此外,仅影响亮度分量的滤波,对于色度分量,在所有情况下都使用常规色度内插滤波器。
所描述的实施例的可能变更可以包括以下方面:
-针对HPEL准确度的内插滤波器的集合也包括针对全样本位置的变更的滤波器。这意味着,若二分之一样本准确运动向量指向x(或y)方向上的全样本位置,则也可以在水平(或垂直)方向上应用较强低通滤波。
-若选择全亮度样本或4亮度样本的运动向量准确度,则也可以应用参考样本的滤波。在此,可以支持单个滤波器或多个滤波器。
-自适应滤波器选择被扩展到色度分量。
-所选滤波器进一步取决于是使用单还是双预测。
7.实施方式替代方案
尽管已经在设备的上下文中描述一些方面,但是很明显,这些方面也表示对应方法的描述,其中区块或装置对应于方法步骤或方法步骤的特征。类似地,在方法步骤的上下文中描述的方面也表示对对应设备的对应区块或项目或特征的描述。方法步骤中的一些或全部可以由(或使用)硬件设备,例如,微处理器、可编程计算机或电子电路执行。在一些实施例中,最重要的方法步骤中的一个或多个可以由这样的设备执行。
取决于某些实施要求,本发明的实施例可以在硬件或软件中实施。可以使用数字储存介质执行实施方式,例如软盘、DVD、CD、ROM、PROM、EPROM、EEPROM或FLASH内存,数字储存介质上储存电子可读控制信号,这些信号可以与可编程计算机系统协作(或能够协作),使得执行相应的方法。因此,数字储存介质可以是计算机可读的。
根据本发明的一些实施例包括具有电子可读控制信号的数据载体,该电子可读控制信号能够与可编程计算机系统协作,使得执行本文中描述的方法之一。
通常,本发明的实施例可以实现为具有程序代码的计算机程序产品,当计算机程序产品在计算机上运行时,该程序代码可操作用于执行方法的一种。程序代码可以例如储存在机器可读载体上。
其他实施例包括储存在机器可读载体上用于执行本文中描述的方法之一的计算机程序。
换句话说,因此,本发明方法的实施例是一种计算机程序,该计算机程序具有当计算机程序在计算机上运行时用于执行本文中描述的方法之一的程序代码。
因此,本发明方法的另一实施例是一种数据载体(或数字储存介质,或计算机可读介质),该数据载体包括记录在其上用于执行本文中描述的方法之一的计算机程序。数据载体、数字储存介质或记录介质通常是有形的和/或非瞬时的。
因此,本发明方法的另一实施例是表示计算机程序的数据流或信号序列,该计算机程序用于执行本文中描述的方法之一。数据流或信号序列可以例如配置为经由数据通信连接,例如经由因特网来传输。
另一实施例包括处理装置,例如计算机或可编程逻辑设备,被配置为或适于执行本文中描述的方法之一。
另一实施例包括一种计算机,该计算机上安装用于执行本文中描述的方法之一的计算机程序。
根据本发明的另一实施例包括一种设备或系统,该设备或系统被配置为(例如,电子地光学地)将用于执行本文中描述的方法之一的计算机程序传送到接收器。接收器可以是例如计算机、移动装置、储存装置等。该装置或系统可以例如包括用于将计算机程序传送到接收器的文件服务器。
在一些实施例中,可编程逻辑设备(例如现场可编程门阵列)可用于执行本文中描述的方法的一些或全部功能。在一些实施例中,现场可编程门阵列可能与微处理器协作以执行本文中描述的方法之一。通常,方法较佳地由任何硬件设备执行。
可以使用硬设备,或使用计算机,或使用硬件设备与计算机的组合来实现本文中描述的设备。
本文中描述的设备或本文中描述的设备的任何组件可以至少部分地以硬件和/或软件来实现。
可以使用硬件设备,或使用计算机,或使用硬件设备与计算机的组合来执行本文中描述的方法。
本文中描述的方法或本文中描述的设备的任何组件可以至少部分地通过硬件和/或软件执行。
上面描述的实施例仅用于说明本发明的原理。应当理解,本文中描述的设置与细节的修改及变化对于本领域技术人员将是显而易见的。因此,本发明的意图仅由即将来临的专利权利要求的范围限制,而不受通过本文中的实施例的描述与解释所呈现的具体细节的限制。
参考文献
[1]Yuri Vatis,Bernd Edler,Dieu Thanh Nguyen,
Figure BDA0003351695330000331
Ostermann,"Two-dimensional non-separable Adaptive Wiener Interpolation Filter for H.264/AVC",ITU-T SG 16/Q.6 Doc.VCEG-Z17,釜山,韩国,2005年4月.
[2]S.Wittmann,T.Wedi,“Separable Adaptive Interpolation Filter,”document COM16-C219,ITU-T,2007年6月.
[3]M.Karczewicz,Y.Ye,and P.Chen,“Switched interpolation filter withoffset,”document COM16-C463,ITU-T,2008年4月.
[4]Y.Ye and M.Karczewicz,“Enhanced Adaptive Interpolation Filter,”document COM16-C464,ITU-T,2008年4月.
[5]B.Bross,J.Chen,S.Liu(editors),“Versatile Video Coding(Draft 4),”document JVET-M1001,2019年1月.

Claims (156)

1.一种用于混合视频编码的编码器(500),所述编码器(500)用于基于输入视频内容(512)提供视频序列的编码表示(514),所述编码器(500)被配置为:
确定与所述视频序列的部分(585)相关的一个或多个句法元素(520);
基于所述一个或多个句法元素(520)所描述的属性,选择待被应用于所述视频序列的部分(585)的处理方案(540),所述处理方案(540)用于获取用于在所述视频序列的部分(585)内的整数和/或分数位置处的运动补偿预测的样本(401;411;415;417);
将指示所选处理方案(540)的索引(550)进行编码,使得给定的经编码索引值根据所述一个或多个句法元素(520)所描述的属性表示不同处理方案;以及
提供包括所述一个或多个句法元素(520)与所述经编码索引(560)的比特流作为所述视频序列的编码表示(514)。
2.如前述权利要求1所述的编码器(500),其中所述编码器(500)被配置为根据所述一个或多个句法元素(520)所描述的属性来适配将索引值映射到经编码索引值的映射规则。
3.如前述权利要求中任一项所述的编码器(500),其中所述编码器(500)被配置为根据所述一个或多个句法元素(520)所描述的属性来适配用于提供指示所选处理方案(540)的所述经编码索引(560)的二进制代码的数量。
4.如前述权利要求中任一项所述的编码器(500),其中所述编码器(500)被配置为鉴于所述一个或多个句法元素所描述的属性来确定允许的处理方案的集合,并且从所确定集合中选择处理方案(540)。
5.如前述权利要求中任一项所述的编码器(500),其中所述编码器(500)被配置为确定对于所述视频序列的部分(585)单个处理方案(540)是否是允许的,并且响应于发现对于所述视频序列的部分(585)仅单个处理方案(540)是允许的,选择性地省略对经编码索引的包含。
6.如前述权利要求中任一项所述的编码器(500),其中所述编码器(500)被配置为选择将索引值映射到经编码索引值的映射规则,使得表示所述经编码索引值的二进制代码的数量适配于对于所述视频序列的部分(585)允许的处理方案的数量。
7.如前述权利要求中任一项所述的编码器(500),其中所述处理方案(540)是滤波器或滤波器的集合。
8.如权利要求7所述的编码器(500),其中所述滤波器的集合中的滤波器分别可应用于所述视频序列的部分(585)。
9.如前述权利要求中任一项所述的编码器(500),其中所述编码器(500)被配置为:为视频帧或图片内的不同区块选择不同处理方案。
10.如前述权利要求中任一项所述的编码器(500),其中所述编码器(500)被配置为将指示所选处理方案(540)的所述索引(550)进行编码,使得给定的经编码索引值根据运动向量准确度表示不同处理方案。
11.如前述权利要求中任一项所述的编码器(500),其中所述一个或多个句法元素(520)包括运动向量准确度、分数样本位置、区块尺寸、区块形状、预测假设的数量、预测模式、经编码残差信号的可用性、所述经编码残差信号的谱属性、参考图片信号、环路滤波器数据、运动向量长度或自适应运动向量分辨率模式中的至少一个。
12.如前述权利要求中任一项所述的编码器(500),其中所述编码器(500)被配置为将指示所选处理方案(540)的所述索引(550)进行编码,使得给定的经编码索引值根据运动向量的分数部分表示不同处理方案。
13.如前述权利要求中任一项所述的编码器(500),其中所述编码器(500)被配置为:为在最大运动向量准确度与最小运动向量准确度之间的运动向量准确度或为在最大运动向量准确度与全样本运动向量准确度之间的运动向量准确度选择性地确定处理方案的集合,并从所确定集合中选择处理方案(540)。
14.如前述权利要求中任一项所述的编码器(500),其中所述编码器(500)被配置为将用于在第一FIR滤波、第二FIR滤波与第三FIR滤波之间进行选择的索引(550)进行编码。
15.如前述权利要求中任一项所述的编码器(500),其中所述编码器(500)被配置为将用于在第一FIR滤波与第二FIR滤波之间进行选择的索引(550)进行编码。
16.如前述权利要求中任一项所述的编码器(500),其中所述编码器(500)被配置为在具有不同特性的处理方案之间进行选择。
17.如权利要求2或6所述的编码器(500),其中所述编码器(500)被配置为根据运动向量准确度以及运动向量的分数样本位置或分数部分来选择所述映射规则。
18.如前述权利要求中任一项所述的编码器(500),其中所述编码器(500)被配置为根据运动向量准确度确定处理方案的可用集合。
19.如前述权利要求中任一项所述的编码器(500),其中所述编码器(500)被配置为在四分之一样本运动向量分辨率、二分之一样本运动向量分辨率、全样本运动向量分辨率以及四样本运动向量分辨率之间进行选择。
20.如前述权利要求中任一项所述的编码器(500),其中所述处理方案(540)包括一个或多个FIR滤波器。
21.一种用于混合视频编码的编码器(600),所述编码器(600)用于基于输入视频内容(512)提供视频序列的编码表示(614),所述编码器(600)被配置为:
确定与所述视频序列的部分(585)相关的一个或多个句法元素(520);
基于所述一个或多个句法元素(520)所描述的属性,选择待被应用于所述视频序列的部分(585)的处理方案(540),所述处理方案(540)用于获取用于在所述视频序列的部分(585)内的整数和/或分数位置处的运动补偿预测的样本(401;411;415;417);
根据所述一个或多个句法元素(520)所描述的属性,选择用于提供指示所选处理方案(540)的经编码索引(660)的熵编码方案(662);以及
提供包括所述一个或多个句法元素(520)并包括所述经编码索引(660)的比特流作为所述视频序列的编码表示(614)。
22.如权利要求21所述的编码器(600),其中所述熵编码方案包括用于提供所述经编码索引的二值化方案。
23.如权利要求22所述的编码器(600),其中所述二值化方案包括待被用于提供所述经编码索引的二进制代码的数量。
24.如权利要求21至23中任一项所述的编码器(600),其中所述编码器(600)被配置为根据所述一个或多个句法元素所描述的属性来适配将索引值映射到经编码索引值的映射规则。
25.如权利要求21至24中任一项所述的编码器(600),其中所述编码器(600)被配置为根据所述一个或多个句法元素所描述的属性来适配用于提供指示所选处理方案(540)的所述经编码索引的二进制代码的数量。
26.如权利要求21至25中任一项所述的编码器(600),其中所述编码器(600)被配置为鉴于所述一个或多个句法元素所描述的属性来确定允许的处理方案的集合,并从所确定集合中选择处理方案(540)。
27.如权利要求21至26中任一项所述的编码器(600),其中所述编码器(600)被配置为确定对于所述视频序列的部分(585)单个处理方案(540)是否是允许的,并且响应于发现对于所述视频序列的部分(585)仅单个处理方案(540)是允许的,选择性地省略对经编码索引的包含。
28.如权利要求21至27中任一项所述的编码器(600),其中所述编码器(600)被配置为选择将索引值映射到经编码索引值的映射规则,使得表示所述经编码索引值的二进制代码的数量适配于对于所述视频序列的部分(585)允许的处理方案的数量。
29.如权利要求21至28中任一项所述的编码器(600),其中所述处理方案(540)是滤波器或滤波器的集合。
30.如权利要求29所述的编码器(600),其中所述滤波器的集合中的滤波器分别可应用于所述视频序列的部分(585)。
31.如权利要求21至30中任一项所述的编码器(600),其中所述编码器(600)被配置为:为视频帧或图片内的不同区块选择不同处理方案。
32.如权利要求21至31中任一项所述的编码器(600),其中所述编码器(600)被配置为将指示所选处理方案(540)的所述索引进行编码,使得给定的经编码索引值根据运动向量准确度表示不同处理方案。
33.如权利要求21至32中任一项所述的编码器(600),其中所述一个或多个句法元素包括运动向量准确度、分数样本位置、区块尺寸、区块形状、预测假设的数量、预测模式、经编码残差信号的可用性、所述经编码残差信号的谱属性、参考图片信号、环路滤波器数据、运动向量长度或自适应运动向量分辨率模式中的至少一个。
34.如权利要求21至33中任一项所述的编码器(600),其中所述编码器(600)被配置为将指示所选处理方案(540)的所述索引进行编码,使得给定的经编码索引值根据运动向量的分数部分表示不同处理方案。
35.如权利要求21至34中任一项所述的编码器(600),其中所述编码器(600)被配置为:为在最大运动向量准确度与最小运动向量准确度之间的运动向量准确度或为在最大运动向量准确度与全样本运动向量准确度之间的运动向量准确度选择性地确定处理方案的集合,并从所确定集合中选择处理方案(540)。
36.如权利要求21至35中任一项所述的编码器(600),其中所述编码器(600)被配置为将用于在第一FIR滤波、第二FIR滤波与第三FIR滤波之间进行选择的索引进行编码。
37.如权利要求21至35中任一项所述的编码器(600),其中所述编码器(600)被配置为将用于在第一FIR滤波与第二FIR滤波之间进行选择的索引进行编码。
38.如权利要求21至36中任一项所述的编码器(600),其中所述编码器(600)被配置为在具有不同特性的处理方案之间进行选择。
39.如权利要求24或28所述的编码器(600),其中所述编码器(600)被配置为根据运动向量准确度以及运动向量的分数样本位置或分数部分来选择所述映射规则。
40.如权利要求21至39中任一项所述的编码器(600),其中所述编码器(600)被配置为根据运动向量准确度确定处理方案的可用集合。
41.如权利要求21至40中任一项所述的编码器(600),其中所述编码器(600)被配置为在四分之一样本运动向量分辨率、二分之一样本运动向量分辨率、全样本运动向量分辨率以及四样本运动向量分辨率之间进行选择。
42.如前述权利要求中任一项所述的编码器(500;600),其中所述处理方案(540)包括一个或多个FIR滤波器。
43.一种用于混合视频解码的解码器(700),所述解码器(700)用于基于视频序列的编码表示(714)提供输出视频内容(712),所述解码器(700)被配置为:
获得作为所述视频序列的编码表示(714)的比特流;
从所述比特流中识别与所述视频序列的部分(785)相关的一个或多个句法元素(520);
基于所述一个或多个句法元素(520)与索引(550)来识别用于所述视频序列的部分(785)的处理方案(540),所述处理方案(540)用于获取用于在所述视频序列的部分(785)内的整数位置(401)和/或分数位置(411;415;417)处的运动补偿预测的样本(401;411;415;417),其中所述解码器(700)被配置为根据所述一个或多个句法元素(520)向给定的经编码索引值分配不同处理方案;以及
将所识别处理方案(540)应用于所述视频序列的部分(785)。
44.如权利要求43所述的解码器(700),其中所述处理方案(540)是滤波器或滤波器的集合。
45.如权利要求44所述的解码器(700),其中所述滤波器的集合中的滤波器分别可应用于所述视频序列的部分(785)。
46.如权利要求43至45中任一项所述的解码器(700),其中所述解码器(700)被配置为根据运动向量的分数部分来选择滤波器。
47.如权利要求43至46中任一项所述的解码器(700),其中所述解码器(700)被配置为根据运动向量的分数部分来选择不同滤波器用于在第一方向上进行滤波以及在第二方向上进行滤波。
48.如权利要求43至47中任一项所述的解码器(700),其中所述解码器(700)被配置为选择不同滤波器用于在第一方向上进行滤波以及在第二方向上进行滤波,使得较强低通滤波应用于在运动向量的分数部分位于全样本(401)上的方向上的滤波。
49.如权利要求43至48中任一项所述的解码器(700),其中所述解码器(700)被配置为根据运动向量的一个或多个分数部分来选择通过句法元素用信号发送的滤波器或预定滤波器。
50.如权利要求43至49中任一项所述的解码器(700),其中所述解码器(700)被配置为根据运动向量的一个或多个分数部分来选择通过滤波器句法元素用信号发送的第一滤波器或通过所述滤波器句法元素用信号发送的第二滤波器。
51.如权利要求43至50中任一项所述的解码器(700),其中所述解码器(700)被配置为在合并模式中从相邻区块接管滤波器选择。
52.如权利要求43至51中任一项所述的解码器(700),其中所选处理方案(540)限定亮度分量的滤波和/或色度分量的滤波。
53.如权利要求43至52中任一项所述的解码器(700),其中所述解码器(700)被配置为根据预测模式选择滤波器。
54.如权利要求43至53中任一项所述的解码器(700),其中所述解码器(700)被配置为根据所述一个或多个句法元素(520)适配将经编码索引值映射到指示处理方案(540)的指示的映射规则。
55.如权利要求43至54中任一项所述的解码器(700),其中所述解码器(700)被配置为根据所述一个或多个句法元素(520)适配用于识别所述经编码索引的二进制代码的数量,所述经编码索引指示所选处理方案(540)。
56.如权利要求43至55中任一项所述的解码器(700),其中所述解码器(700)被配置为鉴于所述一个或多个句法元素(520)确定允许的处理方案的集合,其中基于所述一个或多个句法元素(520)与所述索引从所确定集合中识别待被应用的处理方案(540)。
57.如权利要求43至56中任一项所述的解码器(700),其中所述解码器(700)被配置为确定对于所述视频序列的部分(785)单个处理方案(540)是否是允许的,并且响应于发现对于所述视频序列的部分(785)仅单个处理方案(540)是允许的,选择性地省略对经编码索引的识别。
58.如权利要求43至57中任一项所述的解码器(700),其中所述解码器(700)被配置为选择将经编码索引值映射到指示处理方案(540)的指示的映射规则,使得表示所述经编码索引值的二进制代码的数量适配于对于所述视频序列的部分(785)允许的处理方案的数量。
59.如权利要求43至58中任一项所述的解码器(700),其中所述解码器(700)被配置为:为视频帧或图片内的不同区块选择不同处理方案。
60.如权利要求43至59中任一项所述的解码器(700),其中所述解码器(700)被配置为将指示所选处理方案(540)的所述索引进行解码,使得给定的经编码索引值根据运动向量准确度表示不同处理方案。
61.如权利要求43至60中任一项所述的解码器(700),其中所述一个或多个句法元素(520)包括运动向量准确度、分数样本位置、区块尺寸、区块形状、预测假设的数量、预测模式、经编码残差信号的可用性、所述经编码残差信号的谱属性、参考图片信号、环路滤波器数据、运动向量长度或自适应运动向量分辨率模式中的至少一个。
62.如权利要求43至61中任一项所述的解码器(700),其中所述解码器(700)被配置为将指示所选处理方案(540)的所述索引进行解码,使得给定的经编码索引值根据运动向量的分数部分表示不同处理方案。
63.如权利要求43至62中任一项所述的解码器(700),其中所述解码器(700)被配置为:为在最大运动向量准确度与最小运动向量准确度之间的运动向量准确度或为在最大运动向量准确度与全样本运动向量准确度之间的运动向量准确度选择性地确定处理方案的集合,其中从所确定集合中识别待被应用的处理方案(540)。
64.如权利要求43至63中任一项所述的解码器(700),其中所述解码器(700)被配置为将用于在第一FIR滤波、第二FIR滤波与第三FIR之间进行选择的索引进行解码。
65.如权利要求43至63中任一项所述的解码器(700),其中所述解码器(700)被配置为将用于在第一FIR滤波与第二FIR滤波之间进行选择的索引进行解码。
66.如权利要求43至64中任一项所述的解码器(700),其中所述解码器(700)被配置为应用具有不同特性的处理方案。
67.如权利要求54或58所述的解码器(700),其中所述解码器(700)被配置为根据运动向量准确度以及运动向量的分数样本位置或分数部分来选择所述映射规则。
68.如权利要求43至67中任一项所述的解码器(700),其中所述解码器(700)被配置为根据运动向量准确度确定处理方案的可用集合。
69.如权利要求43至68中任一项所述的解码器(700),其中所述解码器(700)被配置为应用四分之一样本运动向量分辨率、二分之一样本运动向量分辨率、全样本运动向量分辨率或四样本运动向量分辨率中的一个。
70.如权利要求43至69中任一项所述的解码器(700),其中所述处理方案(540)包括一个或多个FIR滤波器。
71.一种用于混合视频解码的解码器(800),所述解码器(800)用于基于视频序列的编码表示(714)提供输出视频内容(812),所述解码器(800)被配置为:
获得作为所述视频序列的编码表示(714)的比特流;
从所述比特流中识别与所述视频序列的部分(785)相关的一个或多个句法元素(520);
根据所述一个或多个句法元素(520),确定在所述比特流中用于提供经编码索引(560),(660)的熵编码方案(662),所述经编码索引指示用于所述视频序列的部分(785)的处理方案(540),所述处理方案(540)用于获取用于在所述视频序列的部分(785)内的整数和/或分数位置处的运动补偿预测的样本(401;411;415;417);
如果所确定熵编码方案(662)指定大于零的二进制代码的数量,在所述比特流中识别所述经编码索引并且将所述索引进行解码;
如果所确定编码方案所指定的二进制代码的数量大于零,基于所述一个或多个句法元素(520)并基于经解码索引识别所述处理方案(540);以及
将所识别处理方案(540)应用于所述视频序列的部分(785)。
72.如权利要求71所述的解码器(800),其中所述熵编码方案包括用于提供所述经编码索引的二值化方案。
73.如权利要求72所述的解码器,其中所述二值化方案包括用于提供所述经编码索引的二进制代码的数量。
74.如权利要求71至73中任一项所述的解码器(800),其中所述处理方案(540)是滤波器或滤波器的集合。
75.如权利要求74所述的解码器(800),其中所述滤波器的集合中的滤波器分别可应用于所述视频序列的部分(785)。
76.如权利要求71至75中任一项所述的解码器(800),其中所述解码器(800)被配置为根据运动向量的分数部分来选择滤波器。
77.如权利要求71至76中任一项所述的解码器(800),其中所述解码器(800)被配置为根据运动向量的分数部分来选择不同滤波器用于在第一方向上进行滤波以及在第二方向上进行滤波。
78.如权利要求71至77中任一项所述的解码器(800),其中所述解码器(800)被配置为选择不同滤波器用于在第一方向上进行滤波以及在第二方向上进行滤波,使得较强低通滤波应用于运动向量的分数部分位于全样本(401)上的方向上的滤波。
79.如权利要求71至78中任一项所述的解码器(800),其中所述解码器(800)被配置为根据运动向量的一个或多个分数部分来选择通过句法元素用信号发送的滤波器或预定滤波器。
80.如权利要求71至79中任一项所述的解码器(800),其中所述解码器(800)被配置为根据运动向量的一个或多个分数部分来选择通过滤波器句法元素用信号发送的第一滤波器或通过所述滤波器句法元素用信号发送的第二滤波器。
81.如权利要求71至80中任一项所述的解码器(800),其中所述解码器(800)被配置为在合并模式中从相邻区块接管滤波器选择。
82.如权利要求71至81中任一项所述的解码器(800),其中所选处理方案(540)限定亮度分量的滤波和/或色度分量的滤波。
83.如权利要求71至82中任一项所述的解码器(800),其中所述解码器(800)被配置为根据预测模式选择滤波器。
84.如权利要求71至83中任一项所述的解码器(800),其中所述解码器(800)被配置为根据所述一个或多个句法元素(520)适配将经编码索引值映射到指示处理方案(540)的指示的映射规则。
85.如权利要求71至84中任一项所述的解码器(800),其中所述解码器(800)被配置为根据所述一个或多个句法元素(520)适配用于识别所述经编码索引的二进制代码的数量,所述经编码索引指示所选处理方案(540)。
86.如权利要求71至85中任一项所述的解码器(800),其中所述解码器(800)被配置为鉴于所述一个或多个句法元素(520)确定允许的处理方案的集合,其中基于所述一个或多个句法元素(520)与所述索引从所确定集合中识别待被应用的处理方案(540)。
87.如权利要求71至86中任一项所述的解码器(800),其中所述解码器(800)被配置为确定对于视频序列的部分(785)单个处理方案(540)是否是允许的,并且响应于发现对于所述视频序列的部分(785)仅单个处理方案(540)是允许的,选择性地省略对经编码索引的识别。
88.如权利要求71至87中任一项所述的解码器(800),其中所述解码器(800)被配置为选择将经编码索引值映射到指示处理方案(540)的指示的映射规则,使得表示所述经编码索引值的二进制代码的数量适配于对于所述视频序列的部分(785)允许的处理方案的数量。
89.如权利要求71至88中任一项所述的解码器(800),其中所述解码器(800)被配置为:为视频帧或图片内的不同区块选择不同处理方案。
90.如权利要求71至89中任一项所述的解码器(800),其中所述解码器(800)被配置为将指示所选处理方案(540)的索引进行解码,使得给定的经编码索引值根据运动向量准确度表示不同处理方案。
91.如权利要求71至90中任一项所述的解码器(800),其中所述一个或多个句法元素(520)包括运动向量准确度、分数样本位置、区块尺寸、区块形状、预测假设的数量、预测模式、经编码残差信号的可用性、所述经编码残差信号的谱属性、参考图片信号、环路滤波器数据、运动向量长度或自适应运动向量分辨率模式中的至少一个。
92.如权利要求71至91中任一项所述的解码器(800),其中所述解码器(800)被配置为将指示所选处理方案(540)的索引(500)进行解码,使得给定的经编码索引值根据运动向量的分数部分表示不同处理方案。
93.如权利要求71至92中任一项所述的解码器(800),其中所述解码器(800)被配置为:为在最大运动向量准确度与最小运动向量准确度之间的运动向量准确度或为在最大运动向量准确度与全样本运动向量准确度之间的运动向量准确度选择性地确定处理方案的集合,其中从所确定集合中识别待被应用的处理方案(540)。
94.如权利要求71至93中任一项所述的解码器(800),其中所述解码器(800)被配置为将用于在第一FIR滤波、第二FIR滤波与第三FIR之间进行选择的索引进行解码。
95.如权利要求71至93中任一项所述的解码器(800),其中所述解码器(800)被配置为将用于在第一FIR滤波与第二FIR滤波之间进行选择的索引进行解码。
96.如权利要求71至94中任一项所述的解码器(800),其中所述解码器(800)被配置为应用具有不同特性的处理方案。
97.如权利要求84或88所述的解码器(800),其中所述解码器(800)被配置为根据运动向量准确度以及运动向量的分数样本位置或分数部分来选择所述映射规则。
98.如权利要求71至97中任一项所述的解码器(800),其中所述解码器(800)被配置为根据运动向量准确度确定处理方案的可用集合。
99.如权利要求71至98项中任一项所述的解码器(800),其中所述解码器(800)被配置为应用四分之一样本运动向量分辨率、二分之一样本运动向量分辨率、全样本运动向量分辨率或四样本运动向量分辨率中的一个。
100.如权利要求43至99中任一项所述的解码器(700;800),其中所述处理方案(540)包括一个或多个FIR滤波器。
101.一种用于混合视频编码的方法(5000),所述方法(5000)用于基于输入视频内容(512)提供视频序列的编码表示(514),所述方法(5000)包括:
确定(5001)与所述视频序列的部分(585)相关的一个或多个句法元素(520);
基于所述一个或多个句法元素(520)所描述的属性,选择(5002)待被应用于所述视频序列的部分(585)的处理方案(540),所述处理方案(540)用于获取用于在所述视频序列的部分(585)内的整数和/或分数位置处的运动补偿预测的样本(401;411;415;417);
将指示所选处理方案(540)的索引进行编码(5003),使得给定的经编码索引值根据所述一个或多个句法元素(520;)所描述的属性表示不同处理方案;以及
提供(5004)包括所述一个或多个句法元素(520)与所述经编码索引的比特流作为所述视频序列的编码表示。
102.一种用于混合视频编码的方法(6000),所述方法用于基于输入视频内容提供视频序列的编码表示,所述方法包括:
确定(6001)与所述视频序列的部分(585)相关的一个或多个句法元素(520);
基于所述一个或多个句法元素(520)所描述的属性,选择(6002)待被应用于所述视频序列的部分(585)的处理方案(540),所述处理方案(540)用于获取用于在所述视频序列的部分(585)内的整数和/或分数位置处的运动补偿预测的样本(401;411;415;417);
根据所述一个或多个句法元素(520)所描述的属性,选择(6003)用于提供经编码索引的熵编码方案,所述经编码索引指示所选处理方案(540);以及
提供(6004)包括所述一个或多个句法元素(520)并包括所述经编码索引的比特流作为所述视频序列的编码表示。
103.一种用于混合视频解码的方法(7000),所述方法用于基于视频序列的编码表示提供输出视频内容,所述方法包括:
获得(7001)作为所述视频序列的编码表示的比特流;
从所述比特流中识别(7002)与所述视频序列的部分(785)相关的一个或多个句法元素(520);
基于所述一个或多个句法元素(520)与索引,识别(7003)用于所述视频序列的部分(785)的处理方案(540),所述处理方案(540)用于获取用于在所述视频序列的部分(785)内的整数和/或分数位置处的运动补偿预测的样本(401;411;415;417),其中所述方法根据所述一个或多个句法元素(520)向给定的经编码索引值分配不同处理方案;以及
将所识别处理方案(540)应用(7004)于所述视频序列的部分(785)。
104.一种用于混合视频解码的方法(8000),所述方法用于基于视频序列的编码表示提供输出视频内容,所述方法包括:
获得(8001)作为所述视频序列的编码表示的比特流;
从所述比特流中识别(8002)与所述视频序列的部分(785)相关的一个或多个句法元素(520);
根据所述一个或多个句法元素(520),确定(8003)在所述比特流中用于提供经编码索引的熵编码方案(662),所述经编码索引指示用于所述视频序列的部分(785)的处理方案(540),所述处理方案(540)用于获取用于在所述视频序列的部分(785)内的整数和/或分数位置处的运动补偿预测的样本(401;411;415;417);
如果所确定熵编码方案指定大于零的二进制代码的数量,在所述比特流中识别(8004)所述经编码索引并且将所述索引进行解码;
如果所确定熵编码方案所指定的二进制代码的数量大于零,基于所述一个或多个句法元素(520)并基于经解码索引识别(8005)所述处理方案(540);以及
将所识别处理方案(540)应用(8006)于所述视频序列的部分(785)。
105.一种用于混合视频编码的视频比特流,所述视频比特流描述视频序列,
其中所述视频比特流包括与所述视频序列的部分(585)相关的一个或多个句法元素(520);
其中至少对于所述视频序列的部分中的多个,所述视频比特流包括处理方案(540)索引比特流元素;
其中,所述处理方案(540)索引比特流元素的存在根据一个或多个其他句法元素(520)而变化。
106.一种用于混合视频编码的视频比特流,所述比特流描述视频序列,
其中所述视频比特流包括与所述视频序列的部分(585)相关的一个或多个句法元素(520);
其中至少对于所述视频序列的部分中的多个,所述视频比特流包括处理方案(540)索引比特流元素;
其中,所述处理方案(540)索引比特流元素的二进制代码的数量根据与所述视频序列的部分(585)相关的所述一个或多个句法元素(520)而变化。
107.一种用于混合视频编码的视频比特流,所述比特流描述视频序列,
其中所述视频比特流包括与所述视频序列的部分(585)相关的一个或多个句法元素(520);
其中至少对于所述视频序列的部分中的多个,所述视频比特流包括处理方案(540)索引比特流元素;
其中,所述处理方案(540)索引比特流元素的码字的含义根据与所述视频序列的部分(585)相关的所述一个或多个句法元素(520)而变化。
108.一种计算机程序,用于在计算机上运行所述计算机程序时执行如权利要求101至104中任一项所述的方法。
109.一种用于混合视频解码的解码器(700),所述解码器(700)用于基于视频序列的编码表示(714)提供输出视频内容(712),所述解码器(700)被配置为:
获得作为所述视频序列的编码表示(714)的比特流;
从所述比特流中识别与所述视频序列的部分(785)相关的一个或多个句法元素(520);
根据所述一个或多个句法元素(520),选择用于所述视频序列的部分(785)的处理方案(540),其中所述处理方案完全由所述部分(785)的属性与运动向量的分数部分指定;
所述处理方案(540)用于获取用于在所述视频序列的部分(785)内的整数和/或分数位置处的运动补偿预测的样本(401;411;415;417);以及
将所识别处理方案(540)应用于所述视频序列的部分(785)。
110.如权利要求109所述的解码器,其中指定所述处理方案(540)的所述部分(785)的属性与运动向量准确度、所述样本(401;411;415;417)的分数位置以及待被用于所述部分(785)的预测模式的一种或两种或全部相关。
111.一种用于混合视频解码的解码器(700),所述解码器(700)用于基于视频序列的编码表示(714)提供输出视频内容(712),所述解码器(700)被配置为:
获得作为所述视频序列的编码表示(714)的比特流;
从所述比特流中识别与所述视频序列的部分(785)相关的一个或多个句法元素(520);
根据运动向量准确度,选择用于所述视频序列的部分(785)的处理方案(540),所述处理方案(540)用于获取用于在所述视频序列的部分(785)内的整数和/或分数位置处的运动补偿预测的样本(401;411;415;417);
将所识别处理方案(540)应用于所述视频序列的部分(785)。
112.如权利要求111所述的解码器(700),其中所述解码器(700)被配置为根据运动向量准确度与所述样本的分数位置选择所述处理方案(540)。
113.如权利要求111或112所述的解码器(700),其中所述解码器(700)被配置为额外地根据待被用于所述部分(785)的预测模式选择所述处理方案(540)。
114.如权利要求109至113中任一项所述的解码器(700),其中所述部分(785)是预测单元(PU)或编码单元(CU),以及其中所述解码器(700)被配置为针对所述视频序列的不同部分单独地选择所述处理方案(540)。
115.一种用于混合视频解码的解码器(700),所述解码器(700)用于基于视频序列的编码表示(714)提供输出视频内容(712),所述解码器(700)被配置:
获得作为所述视频序列的编码表示(714)的比特流;
从所述比特流中识别与所述视频序列的部分(785)相关的一个或多个句法元素(520);
以PU粒度或CU粒度并根据所述一个或多个句法元素(520),确定用于所述视频序列的部分(785)的处理方案(540),所述处理方案(540)用于获取用于在所述视频序列的部分(785)内的整数和/或分数位置处的运动补偿预测的样本(401;411;415;417);
将所识别处理方案(540)应用于所述视频序列的部分(785)。
116.如权利要求109至115中任一项所述的解码器(700),其中所述解码器(700)被配置为针对所述视频序列的不同部分中的相同分数样本位置使用不同处理方案。
117.如权利要求109至116中任一项所述的解码器(700),其中所述解码器(700)被配置为在PU或CU级别切换所述处理方案以适配局部图像特性。
118.如权利要求109至117项中任一项所述的解码器(700),其中所述一个或多个句法元素(520)中没有一个明显地专用于指示所述处理方案。
119.如权利要求109至118中任一项所述的解码器(700),其中所述处理方案(540)是滤波器或滤波器的集合。
120.如权利要求119所述的解码器(700),其中所述滤波器的集合中的滤波器分别可应用于所述视频序列的部分(785)。
121.如权利要求109至120中任一项所述的解码器(700),其中所述解码器(700)被配置为根据运动向量的分数部分来选择不同滤波器用于在第一方向上进行滤波以及在第二方向上进行滤波。
122.如权利要求109至121中任一项所述的解码器(700),其中所述解码器(700)被配置为选择不同滤波器用于在第一方向上进行滤波以及在第二方向上进行滤波,使得较强低通滤波应用于运动向量的分数部分位于全样本(401)上的方向上的滤波。
123.如权利要求109至122中任一项所述的解码器(700),其中所述解码器(700)被配置为在合并模式中从相邻区块接管滤波器选择。
124.如权利要求109至123中任一项所述的解码器(700),其中所选处理方案(540)限定亮度分量的滤波和/或色度分量的滤波。
125.如权利要求109至124中任一项所述的解码器(700),其中所述解码器(700)被配置为:为视频帧或图片内的不同区块选择不同处理方案。
126.如权利要求109至125中任一项所述的解码器(700),其中所述一个或多个句法元素(520)包括运动向量准确度、分数样本位置、区块尺寸、区块形状、预测假设的数量、预测模式、经编码残差信号的可用性、所述经编码残差信号的谱属性、参考图片信号、环路滤波器数据、运动向量长度或自适应运动向量分辨率模式中的至少一个。
127.如权利要求109至126中任一项所述的解码器(700),其中所述解码器(700)被配置为:为在最大运动向量准确度与最小运动向量准确度之间的运动向量准确度或为在最大运动向量准确度与全样本运动向量准确度之间的运动向量准确度选择性地确定处理方案的集合,其中从所确定集合中识别待被应用的处理方案(540)。
128.如权利要求109至127中任一项所述的解码器(700),其中所述解码器(700)被配置为应用具有不同特性的处理方案。
129.如权利要求109至128中任一项所述的解码器(700),其中所述解码器(700)被配置为应用四分之一样本运动向量分辨率、二分之一样本运动向量分辨率、全样本运动向量分辨率或四样本运动向量分辨率中的一个。
130.如权利要求109至129中任一项所述的解码器(700),其中所述处理方案(540)包括一个或多个FIR滤波器。
131.一种用于混合视频编码的编码器(1300),所述编码器(1300)用于基于输入视频内容(512)提供视频序列的编码表示(1314),所述编码器(1300)被配置为:
确定与所述视频序列的部分(585)相关的一个或多个句法元素(520);
基于所述一个或多个句法元素(520)所描述的属性,选择待被应用于所述视频序列的部分(585)的处理方案(540),其中所述处理方案(540)完全由所述部分(585)的属性以及运动向量的分数部分指定,
所述处理方案(540)用于获取用于在所述视频序列的部分(585)内的整数和/或分数位置处的运动补偿预测的样本(401;411;415;417);
提供包括所述一个或多个句法元素(520)的比特流作为所述视频序列的编码表示(1314)。
132.如权利要求131所述的编码器(1300),其中所述一个或多个句法元素(520)所描述的属性与运动向量准确度、所述样本(401;411;415;417)的分数位置以及待被用于所述部分(785)的预测模式的一种或两种或全部相关。
133.一种用于混合视频编码的编码器(1300),所述编码器(1300)用于基于输入视频内容(512)提供视频序列的编码表示(1314),所述编码器(1300)被配置为:
确定与所述视频序列的部分(585)相关的一个或多个句法元素(520);
基于所述一个或多个句法元素(520)所描述的运动向量准确度,选择待被应用于所述视频序列的部分(585)的处理方案(540),所述处理方案(540)用于获取用于在所述视频序列的部分(785)内的整数和/或分数位置处的运动补偿预测的样本(401;411;415;417);
提供包括所述一个或多个句法元素(520)的比特流作为所述视频序列的编码表示(1314)。
134.如权利要求133所述的编码器(1300),其中所述编码器(1300)被配置为基于所述运动向量准确度以及所述样本的分数位置选择所述处理方案(540)。
135.如权利要求133或134所述的编码器(1300),其中所述编码器(1300)被配置为额外地根据待被用于所述部分(785)的预测模式选择所述处理方案(540)。
136.如权利要求131至135中任一项所述的编码器(1300),其中所述部分(785)是预测单元(PU)或编码单元(CU),以及其中所述编码器(1300)被配置为针对所述视频序列的不同部分单独地选择所述处理方案(540)。
137.一种用于混合视频编码的编码器(1300),所述编码器(1300)用于基于输入视频内容(512)提供视频序列的编码表示(1314),所述编码器(1300)被配置为:
确定与所述视频序列的部分(585)相关的一个或多个句法元素(520);
以PU粒度或CU粒度,基于所述一个或多个句法元素(520)所描述的属性,选择待被应用于所述视频序列的部分(585)的处理方案(540),所述处理方案(540)用于获取用于在所述视频序列的部分(785)内的整数和/或分数位置处的运动补偿预测的样本(401;411;415;417);
提供包括所述一个或多个句法元素(520)的比特流作为所述视频序列的编码表示(1314)。
138.如权利要求131至137中任一项所述的编码器(1300),其中所述编码器(1300)被配置为针对所述视频序列的不同部分中的相同分数样本位置使用不同处理方案。
139.如权利要求131至138中任一项所述的编码器(1300),其中所述编码器(1300)被配置为在PU或CU级别切换所述处理方案以适配局部图像特性。
140.如权利要求131至139中任一项所述的编码器(1300),其中所述一个或多个句法元素(520)中没有一个明显地专用于指示所述处理方案。
141.如权利要求131至140中任一项所述的编码器(1300),其中所述编码器(1300)被配置为鉴于所述一个或多个句法元素所描述的属性,确定允许的处理方案的集合,并从所确定集合中选择处理方案(540)。
142.如权利要求131至141中任一项所述的编码器(1300),其中所述处理方案(540)是滤波器或滤波器的集合。
143.如权利要求142所述的编码器(1300),其中所述滤波器的集合中的滤波器分别可应用于所述视频序列的部分(785)。
144.如权利要求131至143中任一项所述的编码器(1300),其中所述编码器被配置为:为视频帧或图片的不同区块选择不同处理方案。
145.如权利要求131至144中任一项所述的编码器(1300),其中所述一个或多个句法元素(520)包括运动向量准确度、分数样本位置、区块尺寸、区块形状、预测假设的数量、预测模式、经编码残差信号的可用性、所述经编码残差信号的谱属性、参考图片信号、环路滤波器数据、运动向量长度或自适应运动向量分辨率模式中的至少一个。
146.如权利要求131至145项中任一项所述的编码器(1300),其中所述编码器被配置为:为在最大运动向量准确度与最小运动向量准确度之间的运动向量准确度或为在最大运动向量准确度与全样本运动向量准确度之间的运动向量准确度选择性地确定处理方案的集合,并从所确定集合中选择所述处理方案(540)。
147.如权利要求131至146中任一项所述的编码器(1300),其中所述编码器被配置为在具有不同特性的处理方案之间进行选择。
148.如权利要求131至147中任一项所述的编码器(1300),其中所述编码器被配置为在四分之一样本运动向量分辨率、二分之一样本运动向量分辨率、全样本运动向量分辨率以及四样本运动向量分辨率之间进行选择。
149.如权利要求131至148中任一项所述的编码器(1300),其中所述处理方案(540)包括一个或多个FIR滤波器。
150.一种用于混合视频解码的方法(7100),所述方法用于基于视频序列的编码表示(1314)提供输出视频内容(712),所述方法包括:
获得(7101)作为所述视频序列的编码表示(714)的比特流;
从所述比特流中识别(7102)与所述视频序列的部分(785)相关的一个或多个句法元素(520);
根据所述一个或多个句法元素(520),选择(7103)用于所述视频序列的部分(785)的处理方案(540),其中所述处理方案(540)完全由所述部分(785)的属性以及运动向量的分数部分指定;
所述处理方案(540)用于获取用于在所述视频序列的部分(785)内的整数和/或分数位置处的运动补偿预测的样本(401;411;415;417);
将所识别处理方案(540)应用(7104)于所述视频序列的部分(785)。
151.一种用于混合视频解码的方法(7200),所述方法用于基于视频序列的编码表示(1314)提供输出视频内容(712),所述方法包括:
获得(7201)作为所述视频序列的编码表示(714)的比特流;
从所述比特流中识别(7202)与所述视频序列的部分(785)相关的一个或多个句法元素(520);
根据运动向量准确度,选择(7203)用于所述视频序列的部分(785)的处理方案(540),所述处理方案(540)用于获取用于在所述视频序列的部分(785)内的整数和/或分数位置处的运动补偿预测的样本(401;411;415;417);
将所识别处理方案(540)应用(7204)于所述视频序列的部分(785)。
152.一种用于混合视频解码的方法(7300),所述方法用于基于视频序列的编码表示(1314)提供输出视频内容(712),所述方法包括:
获得(7301)作为所述视频序列的编码表示(714)的比特流;
从所述比特流中识别(7302)与所述视频序列的部分(785)相关的一个或多个句法元素(520);
以PU粒度或CU粒度并根据所述一个或多个句法元素(520),确定(7303)用于所述视频序列的部分(785)的处理方案(540),所述处理方案(540)用于获取用于在所述视频序列的部分(785)内的整数和/或分数位置处的运动补偿预测的样本(401;411;415;417);
将所识别处理方案(540)应用(7304)于所述视频序列的部分(785)。
153.一种用于混合视频编码的方法(1310),所述方法用于基于输入视频内容(512)提供视频序列的编码表示(1314),所述方法(1310)包括:
确定(1311)与所述视频序列的部分(585)相关的一个或多个句法元素(520);
基于所述一个或多个句法元素(520)所描述的属性,选择(1312)待被应用于所述视频序列的部分(585)的处理方案(540),其中所述处理方案完全由所述部分(585)的属性以及运动向量的分数部分指定,
所述处理方案(540)用于获取用于在所述视频序列的部分(585)内的整数和/或分数位置处的运动补偿预测的样本(401;411;415;417);
提供(1313)包括所述一个或多个句法元素(520)的比特流作为所述视频序列的编码表示(1314)。
154.一种用于混合视频编码的方法(1320),所述方法用于基于输入视频内容(512)提供视频序列的编码表示(1314),所述方法包括:
确定(1321)与所述视频序列的部分(585)相关的一个或多个句法元素(520);
基于所述一个或多个句法元素(520)所描述的运动向量准确度,选择(1322)待被应用于所述视频序列的部分(585)的处理方案(540),所述处理方案(540)用于获取用于在所述视频序列的部分(785)内的整数和/或分数位置处的运动补偿预测的样本(401;411;415;417);
提供(1323)包括所述一个或多个句法元素(520)的比特流作为所述视频序列的编码表示(1314)。
155.一种用于混合视频编码的方法(1330),所述方法用于基于输入视频内容(512)提供视频序列的编码表示(1314),所述方法包括:
确定(1331)与所述视频序列的部分(585)相关的一个或多个句法元素(520);
以PU粒度或CU粒度,基于所述一个或多个句法元素(520)所描述的属性,选择(1332)待被应用于所述视频序列的部分(585)的处理方案(540),所述处理方案(540)用于获取用于在所述视频序列的部分(785)内的整数和/或分数位置处的运动补偿预测的样本(401;411;415;417);
提供(1333)包括所述一个或多个句法元素(520)的比特流作为所述视频序列的编码表示(1314)。
156.一种计算机程序,用于在计算机上运行所述计算机程序时执行如权利要求150至155中任一项所述的方法。
CN202080035664.5A 2019-03-12 2020-03-12 用于混合视频编码的编码器、解码器、方法及视频比特流以及计算机程序 Pending CN113826388A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19162403 2019-03-12
EP19162403.0 2019-03-12
PCT/EP2020/056730 WO2020182965A1 (en) 2019-03-12 2020-03-12 Encoders, decoders, methods, and video bit streams, and computer programs for hybrid video coding

Publications (1)

Publication Number Publication Date
CN113826388A true CN113826388A (zh) 2021-12-21

Family

ID=65861205

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080035664.5A Pending CN113826388A (zh) 2019-03-12 2020-03-12 用于混合视频编码的编码器、解码器、方法及视频比特流以及计算机程序

Country Status (9)

Country Link
US (1) US12010337B2 (zh)
EP (1) EP3939272A1 (zh)
JP (2) JP7358497B2 (zh)
KR (1) KR20210134392A (zh)
CN (1) CN113826388A (zh)
BR (1) BR112021017844A2 (zh)
MX (1) MX2021010898A (zh)
TW (2) TWI752435B (zh)
WO (1) WO2020182965A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11425414B2 (en) * 2019-08-05 2022-08-23 Tencent America LLC Method and apparatus for video coding
US11366811B2 (en) * 2020-05-21 2022-06-21 Sap Se Data imprints techniques for use with data retrieval methods
US20230140628A1 (en) * 2021-11-04 2023-05-04 Meta Platforms, Inc. Novel buffer format for a two-stage video encoding process
WO2023134731A1 (en) * 2022-01-13 2023-07-20 Mediatek Inc. In-loop neural networks for video coding

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011054879A2 (en) * 2009-11-06 2011-05-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Hybrid video coding
WO2012071643A1 (en) * 2010-11-29 2012-06-07 Ebrisk Video Inc. Method and system for adaptive interpolation in digital video coding
US20120314771A1 (en) * 2009-08-21 2012-12-13 Sk Telecom Co., Ltd. Method and apparatus for interpolating reference picture and method and apparatus for encoding/decoding image using same
CN107710765A (zh) * 2015-06-12 2018-02-16 高通股份有限公司 分组用于视频译码的调色盘旁通槽
WO2018067848A1 (en) * 2016-10-05 2018-04-12 Qualcomm Incorporated Systems and methods of switching interpolation filters

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6968008B1 (en) * 1999-07-27 2005-11-22 Sharp Laboratories Of America, Inc. Methods for motion estimation with adaptive motion accuracy
US20120230407A1 (en) * 2011-03-11 2012-09-13 General Instrument Corporation Interpolation Filter Selection Using Prediction Index
JP6693009B2 (ja) 2015-09-21 2020-05-13 シェンチュン エバーグリーン セラピューティクス カンパニー・リミテッド プロゲストーゲンの肺送達方法
EP3354028B1 (en) * 2015-09-25 2021-09-15 Huawei Technologies Co., Ltd. Apparatus and method for video motion compensation with selectable interpolation filter
EP3264768A1 (en) * 2016-06-30 2018-01-03 Thomson Licensing Method and apparatus for video coding with adaptive motion information refinement
CN117376586A (zh) * 2018-09-07 2024-01-09 华为技术有限公司 用于视频译码中帧内预测和帧间预测的插值滤波方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120314771A1 (en) * 2009-08-21 2012-12-13 Sk Telecom Co., Ltd. Method and apparatus for interpolating reference picture and method and apparatus for encoding/decoding image using same
WO2011054879A2 (en) * 2009-11-06 2011-05-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Hybrid video coding
WO2012071643A1 (en) * 2010-11-29 2012-06-07 Ebrisk Video Inc. Method and system for adaptive interpolation in digital video coding
CN107710765A (zh) * 2015-06-12 2018-02-16 高通股份有限公司 分组用于视频译码的调色盘旁通槽
WO2018067848A1 (en) * 2016-10-05 2018-04-12 Qualcomm Incorporated Systems and methods of switching interpolation filters

Also Published As

Publication number Publication date
BR112021017844A2 (pt) 2021-11-30
JP7358497B2 (ja) 2023-10-10
MX2021010898A (es) 2021-11-12
TWI752435B (zh) 2022-01-11
JP2023169385A (ja) 2023-11-29
TW202139710A (zh) 2021-10-16
TWI810596B (zh) 2023-08-01
EP3939272A1 (en) 2022-01-19
KR20210134392A (ko) 2021-11-09
US12010337B2 (en) 2024-06-11
WO2020182965A1 (en) 2020-09-17
US20210409755A1 (en) 2021-12-30
TW202046734A (zh) 2020-12-16
JP2022526244A (ja) 2022-05-24

Similar Documents

Publication Publication Date Title
CN107710764B (zh) 确定用于视频译码的照明补偿状态的系统及方法
CN110719478B (zh) 跨分量帧内预测模式导出
US9344744B2 (en) Apparatus for intra predicting a block, apparatus for reconstructing a block of a picture, apparatus for reconstructing a block of a picture by intra prediction
CN113273203B (zh) 两步交叉分量预测模式
JP2024003124A (ja) 行列ベースイントラ予測における制約されたアップサンプリングプロセス
JP7358497B2 (ja) ハイブリッドビデオコード化のためのエンコーダ、デコーダ、方法、およびビデオビットストリーム、ならびにコンピュータプログラム
CN111373755A (zh) 图像编码/解码方法和装置以及存储比特流的记录介质
CN113691807B (zh) 视频信号编码/解码方法以及用于所述方法的设备
US20160073107A1 (en) Method and apparatus for video encoding/decoding using intra prediction
JP2022534320A (ja) マトリクスベースイントラ予測のためのコンテキスト決定
US11032542B2 (en) Method and a device for image encoding and decoding
KR20210006390A (ko) 적응적 모션 벡터 레졸루션을 이용하는 비디오 신호 처리 방법 및 장치
CN114145013A (zh) 调色板模式编解码的模式确定
JP2023126972A (ja) タイル独立性制約を使用したインター予測概念
CN113475062A (zh) 确定屏幕内容编解码的条件
CN114145018A (zh) 调色板模式的量化处理
JP2023143946A (ja) クロマデブロックフィルタリングのための量子化パラメータオフセット
CN113475077A (zh) 调色板模式使用指示的独立编解码
CN113615188A (zh) 调色板模式使用指示的联合编解码
CN110730349A (zh) 用于微块的约束
CN115516863A (zh) 用于分割语法的熵编解码
RU2817405C1 (ru) Способ, оборудование и устройства для кодирования и декодирования
WO2023246901A1 (en) Methods and apparatus for implicit sub-block transform coding
Ylä-Outinen Coding efficiency and complexity optimization of Kvazaar HEVC encoder
CN117941353A (zh) 非二元块上的帧内预测

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40065899

Country of ref document: HK