CN115699744A - 双向预测校正系统和方法 - Google Patents

双向预测校正系统和方法 Download PDF

Info

Publication number
CN115699744A
CN115699744A CN202180043524.7A CN202180043524A CN115699744A CN 115699744 A CN115699744 A CN 115699744A CN 202180043524 A CN202180043524 A CN 202180043524A CN 115699744 A CN115699744 A CN 115699744A
Authority
CN
China
Prior art keywords
coding unit
parameter associated
value
prediction
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202180043524.7A
Other languages
English (en)
Other versions
CN115699744B (zh
Inventor
李新伟
陈杰
廖如伶
叶琰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Damo Institute Hangzhou Technology Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN202410194201.3A priority Critical patent/CN118075450A/zh
Publication of CN115699744A publication Critical patent/CN115699744A/zh
Application granted granted Critical
Publication of CN115699744B publication Critical patent/CN115699744B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • H04N19/54Motion estimation other than block-based using feature points or meshes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本公开提供一种视频解码方法。示例性方法包括:从比特流解码获得用于编码单元的第一参数,并基于第一参数确定用于编码单元的候选;基于与候选相关联的第二参数的值确定与编码单元相关联的第二参数的值,其中第二参数指示双向预测校正是否被启用;以及响应于与编码单元相关联的第二参数的值指示双向预测校正被启用,对编码单元执行双向预测校正。

Description

双向预测校正系统和方法
相关申请的交叉引用
本公开要求于2020年8月3日提交的美国临时申请第63/060624号的优先权,其全部内容通过引用并入本文。
技术领域
本公开总体上涉及视频处理,并且更具体地,涉及双向预测校正系统和方法。
背景技术
视频是一组捕获视觉信息的静态图片(或“帧”)。为了减少存储空间和传输带宽,可以在存储或传输视频之前对其进行压缩,并且在显示之前对视频进行解压缩。压缩处理通常被称为编码,而解压缩处理通常被称为解码。存在使用标准化视频编码技术的各种视频编码格式,这些标准化视频编码技术通常都是基于预测、变换、量化、熵编码和环路内滤波。由标准化组织开发了指定特定视频编码格式的视频编码标准,诸如高效视频编码(例如HEVC/H.265)标准、通用视频编码(例如VVC/H.266)标准和AVS标准。随着视频标准中采用越来越先进的视频编码技术,新的视频编码标准的编码效率越来越高。
发明内容
本公开的实施例提供一种视频处理方法和视频处理设备。该方法可以包括:从比特流解码用于编码单元的第一参数,并基于第一参数确定用于该编码单元的候选;基于与该候选相关联的第二参数的值确定与该编码单元相关联的第二参数的值,其中第二参数指示双向预测校正是否被启用;以及响应于与该编码单元相关联的第二参数的值指示双向预测校正被启用,对该编码单元执行双向预测校正。
该设备可以包括存储指令集的存储器;和一个或多个处理器,一个或多个处理器被配置为执行指令集以使设备执行:从比特流解码用于编码单元的第一参数,并基于第一参数确定用于该编码单元的候选;基于与高候选相关联的第二参数的值确定与该编码单元相关联的第二参数的值,其中第二参数指示双向预测校正是否被启用;以及响应于与该编码单元相关联的第二参数的值指示双向预测校正被启用,对该编码单元执行双向预测校正。
本公开的实施例还提供了一种非瞬时性计算机可读介质,其存储存储指令集,该指令集可由计算机的至少一个处理器执行以使计算机执行处理视频内容的方法,该方法包括:从比特流解码用于编码单元的第一参数,并基于第一参数确定用于该编码单元的候选;基于与该候选相关联的第二参数的值确定与该编码单元相关联的第二参数的值,其中第二参数指示双向预测校正是否被启用;以及响应于与该编码单元相关联的第二参数的值指示双向预测校正被启用,对该编码单元执行双向预测校正。
附图说明
在以下具体实施方式和附图中示出了本公开的实施例和各个方面。图中所示的各种特征不是按比例绘制的。
图1示出了根据本公开的一些实施例的示出示例性视频序列的结构的示意图。
图2A示出了根据本公开的一些实施例的示出混合视频编码系统的示例性编码处理的示意图。
图2B示出了根据本公开的一些实施例的示出混合视频编码系统的另一示例性编码处理的示意图。
图3A示出了根据本公开的一些实施例的示出混合视频编码系统的示例性解码处理的示意图。
图3B示出了根据本公开的一些实施例的示出混合视频编码系统的另一示例性解码处理的示意图。
图4示出了根据本公开的一些实施例的用于对视频进行编码或解码的示例性设备的框图。
图5是示出了根据本公开的一些实施例的用于空间运动向量预测(SMVP)推导的示例性相邻块的示意图。
图6是示出了根据本公开的一些实施例的最终运动向量表达(UMVE)中的示例性运动推导的示意图。
图7是示出了根据本公开的一些实施例的基于仿射模型的示例性控制点的示意图。
图8是示出了根据本公开的一些实施例的每个子块的中心采样的示例性运动向量的示意图。
图9是根据本公开的一些实施例的示例性视频解码方法的流程图。
图10是根据本公开的一些实施例的示例性视频解码方法的流程图。
图11是根据本公开的一些实施例的示例性视频解码方法的流程图。
图12是根据本公开的一些实施例的示例性视频编码方法的流程图。
图13是根据本公开的一些实施例的示例性视频编码方法的流程图。
图14是根据本公开的一些实施例的示例性视频编码方法的流程图。
具体实施方式
现在将详细参考在附图中示出其示例的示例性实施例。以下描述参考附图,其中不同附图中的相同标号表示相同或相似的元件,除非另有说明。在以下示例性实施例的描述中阐述的实现方式并不代表与本公开一致的所有实现方式。相反,它们仅仅是与所附权利要求中所述的本公开相关方面一致的装置和方法的示例。下面更详细地描述本公开的特定方面。如果与通过引用并入的术语和/或定义相冲突,则以本文提供的术语和定义为准。
ITU-T视频编码专家组(ITU-T VCEG)和ISO/IEC运动图片专家组(ISO/IEC MPEG)的联合视频专家组(JVET)当前正在开发通用视频编码(VVC/H.266)标准。VVC标准的目的在于使其前身,即高效视频编码(HEVC/H.265)标准的压缩效率加倍。换句话说,VVC的目标是使用一半带宽实现与HEVC/H.265相同的主观质量。
为了使用一半带宽实现与HEVC/H.265相同的主观质量,JVET已经开发了超越HEVC的使用联合探索模型(JEM)参考软件的技术。随着编码技术被并入JEM中,JEM获得了比HEVC实质上更高的编码性能。
VVC标准最近已经被开发并且继续包括提供更好压缩性能的更多编码技术。VVC基于与在诸如HEVC、H.264/AVC、MPEG2、H.263等当前视频压缩标准中使用的同一混合视频编码系统。
视频是以时间顺序布置为存储视觉信息的一组静态图片(或“帧”)。视频捕获设备(例如,相机)可以用于按时间顺序捕获和存储这些图片,并且视频回放装置(例如,电视、计算机、智能电话、平板计算机、视频播放器或具有显示功能的任何终端用户终端)可以用于按时间顺序显示这些图片。此外,在一些应用中,视频捕获装置可以实时地将所捕获的视频发送到视频回放设备(例如,具有监视器的计算机),以例如用于进行监视、会议或直播。
为了减少这样的应用所需的存储空间和传输带宽,可以在存储和传输之前压缩视频,并且在显示之前解压缩视频。压缩和解压缩可以由处理器(例如,通用计算机的处理器)或专用硬件执行的软件来实施。用于压缩的模块通常被称为“编码器”,而用于解压缩的模块通常被称为“解码器”。编码器和解码器可以被统称为“编解码器”。编码器和解码器可以被实施为各种合适的硬件、软件或其组合中的任何一种。例如,编码器和解码器的硬件实施方式可以包括电路,例如一个或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑或其任何组合。编码器和解码器的软件实施方式可以包括程序代码、计算机可执行指令、固件或固定在计算机可读介质中的任何合适的计算机实施的算法或处理。视频压缩和解压缩可以通过各种算法或标准,例如MPEG-1、MPEG-2、MPEG-4、H.26x系列等来实施。在一些应用中,编解码器可以对于第一编码标准的视频进行解压缩,并且使用第二编码标准重新压缩被解压缩的视频,在这样的情况下,编解码器可以被称为“转码器”。
视频编码处理可以识别并保留可用于重建图片的有用信息,并且忽略对于重建来说不重要的信息。如果不能完全重建被忽略的不重要的信息,则这样的编码处理可以被称为“有损的”。否则,可以被称为“无损的”。大多数编码处理是有损的,这是为了减少所需存储空间和传输带宽而做出的妥协。
正被编码的图片(称为“当前图片”)的有用信息包括相对于参考图片(例如,先前经编码和重建的图片)的改变。这样的改变可以包括像素的位置改变、亮度改变或颜色改变,其中位置改变是最被关注的。表征对象的一组像素的位置变化可以反映对象在参考图片和当前图片之间的运动。
在不参考另一图片的情况下编码的图片(即,其是其自身的参考图片)被称为“I图片”。如果使用帧内预测或帧间预测基于一个参考图片预测图片中的一些或所有块(例如,通常指视频图片的一些部分的块)(例如,单向预测),那么将该图片称作“P图片”。如果用两个参考图片来预测图片中的至少一个块(例如,双向预测),则该图片被称为“B图片”。
本公开涉及用于处理符合上述视频编码标准的视频内容的方法和设备。
图1示出了根据本公开的一些实施例的示例性视频序列100的结构。视频序列100可以是直播视频或已经被捕获和存档的视频。视频100可以是现实生活视频、计算机生成的视频(例如,计算机游戏视频)或其组合(例如,具有增强现实效果的现实生活视频)。视频序列100可以来自视频捕获设备(例如,照相机)、含有先前捕获的视频档案(例如,存储在存储设备中的视频文件)或用于从视频内容提供商接收视频的视频馈送接口(例如,视频广播收发器)。
如图1所示,视频序列100可以包括沿着时间线按照时间顺序布置的一系列图片,包括图片102、104、106和108。图片102-106是连续的,并且在图片106和108之间有更多的图片。在图1中,图片102是I图片,其参考图片是图片102本身。图片104是P图片,如箭头所示,其参考图片是图片102。图片106是B图片,如箭头所示,其参考图片是图片104和108。在一些实施例中,图片(例如,图片104)的参考图片可不紧接在该图片之前或之后。例如,图片104的参考图片可以是图片102之前的图片。应注意,图片102-106的参考图片仅为示例,并且本公开并没有将参考图片的实施例限制为图1中所示示例。
通常,由于这样的任务的计算复杂性,视频编解码器不会一次编码或解码整个图片。相反,它们可以将图片分割成基础片段,并且逐段地对图片进行编码或解码。在本公开中,这样的基础片段被称为基础处理单元(“BPU”)。例如,图1中的结构110示出了视频序列100的图片(例如,图片102-108中的任何一个)的示例结构。在结构110中,图片被划分成4×4基础处理单元,其边界被示为虚线。在一些实施例中,基础处理单元在一些视频编码标准(例如,MPEG族、H.261、H.263或H.264/AVC)中可以被称为“宏块”,或者在一些其他视频编码标准(例如,H.265/HEVC或H.266/VVC)中可以被称为“编码树单元”(“CTU”)。基础处理单元在图片中可具有可变大小,例如128×128、64×64、32×32、16×16、4×8、16×32,或任何任意形状和大小的像素。可以基于编码效率和基础处理单元中要保留的细节的程度之间的平衡来为图片选择基础处理单元的大小和形状。CTU是最大的块单元,并且可以包括多达128×128个亮度样本(加上对应的色度样本,这取决于色度格式)。CTU可以使用四叉树、二叉树、三叉树或其组合进一步被划分为编码单元(CU)。
基础处理单元可以是逻辑单元,其可以包括存储在计算机存储器中(例如,在视频帧缓冲器中)的一组不同类型的视频数据。例如,彩色图片的基础处理单元可以包括表示非彩色的亮度信息的亮度分量(Y)、表示颜色信息的一个或多个色度分量(例如,Cb和Cr),和相关联的语法元素,其中亮度和色度分量可以具有与基础处理单元相同的大小。在一些视频编码标准(例如,H.265/HEVC或H.266/VVC)中,亮度和色度分量可以被称为“编码树块”(“CTB”)。对基础处理单元执行的任何操作都可以对其亮度和色度分量中的每一个重复执行。
视频编码具有多个操作阶段,其示例在图2A-2B和图3A-3B中示出。对于每一阶段,基础处理单元的大小仍可能对于处理而言过大,并且因此可进一步划分成本公开中称为“基础处理子单元”的片段。在一些实施例中,基础处理子单元在一些视频编码标准(例如,MPEG族、H.261、H.263或H.264/AVC)中可以被称为“块”,或者在一些其他视频编码标准(例如,H.265/HEVC或H.266/VVC)中可以被称为“编码单元”(“CU”)。基础处理子单元可以具有与基础处理单元相同或更小的大小。类似于基础处理单元,基础处理子单元也是逻辑单元,其可包括存储于计算机存储器(例如,视频帧缓冲器)中的一组不同类型的视频数据(例如,Y、Cb、Cr和相关联的语法元素)。对基础处理子单元执行的任何操作都可以对其亮度和色度分量中的每一个重复执行。应当注意,可以根据处理需要将这样的划分执行到跟进一步的程度。还应注意,不同阶段可使用不同的方案来划分基础处理单元。
例如,在模式决定阶段(图2B中示出了其示例),编码器可以决定对于基础处理单元使用什么预测模式(例如,图片内预测或图片间预测),但是基础处理单元可能会由于太大而使得编码器不能做出这样的决定。编码器可以将基础处理单元分成多个基础处理子单元(例如,如H.265/HEVC或H.266/VVC中的CU),并且对于每个单独的基础处理子单元决定预测类型。
对于另一示例,在预测阶段(图2A-2B中示出其示例),编码器可以以基础处理子单元(例如,CU)来执行预测操作。然而,在一些情况下,基础处理子单元可能对于编码器来说仍然太大而使得编码器无法处理。编码器可以进一步将基础处理子单元划分成能够对其执行预测操作的更小的片段(例如,在H.265/HEVC或H.266/VVC中称为“预测块”或“PB”)。
对于另一示例,在变换阶段(图2A-2B中示出其示例),编码器可对剩余的基础处理子单元(例如,CU)执行变换操作。然而,在一些情况下,基础处理子单元可能对于编码器来说仍然太大而使得编码器不能处理。编码器还可以将基础处理子单元进一步划分成能够对其执行变换操作的更小的片段(例如,在H.265/HEVC或H.266/VVC中称为“变换块”或“TB”)。应注意,同一基础处理子单元的划分方案在预测阶段和变换阶段可以不同。例如,在H.265/HEVC或H.266/VVC中,同一个CU的预测块和变换块可以具有不同大小和数量。
在图1的结构110中,基础处理单元112被进一步划分成3×3个基础处理子单元,其边界被示为虚线。同一图片的不同基础处理单元可以按照不同方案划分为基础处理子单元。
在一些实现方式中,为了向视频编码和解码提供并行处理和差错恢复的能力,图片可以被划分成用于处理的区域,从而对于图片的区域,编码或解码处理可以不依赖于来自图片的任何其他区域的信息。换句话说,可以独立地处理图片的每个区域。通过这样做,编解码器可以并行处理图片的不同区域,从而提高编码效率。此外,当区域的数据在处理中被破坏或在网络传输中丢失时,编解码器可以正确地编码或解码同一图片的其他区域,而不依赖于被破坏的或丢失的数据,从而提供差错恢复能力。在一些视频编码标准中,图片可以被划分成不同类型的区域。例如,H.265/HEVC和H.266/VVC提供两种类型的区域:“条带”和“切块”。还应当注意,视频序列100的不同图片可以具有用于将图片划分成区域的不同分割方案。
例如,在图1中,结构110被划分成三个区域114、116和118,其边界被示为结构110内的实线。区域114包括四个基础处理单元。区域116和118中的每一个包括六个基础处理单元。应注意,图1中的基础处理单元、基础处理子单元和结构110的区域仅是示例,并且本公开不限制其实施例。
图2A示出了根据本公开的实施例的示例性编码处理200A的示意图。例如,编码处理200A可由编码器执行。如图2A所示,编码器可以根据处理200A将视频序列202编码成视频比特流228。与图1中的视频序列100类似地,视频序列202可以包括以时间顺序排列的一组图片(称为“原始图片”)。与图1中的结构110类似地,视频序列202的每个原始图片可以被编码器划分成基础处理单元、基础处理子单元或区域以用于处理。在一些实施例中,编码器可以以基础处理单元对视频序列202的每个原始图片执行处理200A。例如,编码器可以以循环方式执行处理200A,其中编码器可以在处理200A的一次循环中编码一个基础处理单元。在一些实施例中,编码器可以对视频序列202的每个原始图片的区域(例如,区域114-118)并行地执行处理200A。
在图2A中,编码器可以将视频序列202的原始图片的基础处理单元(称为“原始BPU”)馈送到预测阶段204,以生成预测数据206和预测BPU 208。编码器可以从原始BPU中减去预测BPU 208以生成剩余BPU 210。编码器可以将剩余BPU 210馈送到变换阶段212和量化阶段214以生成量化变换系数216。编码器可将预测数据206和量化变换系数216馈送到二进制编码阶段226以产生视频比特流228。上述标记202、204、206、208、210、212、214、216、226和228可以被称为“前向路径”。在处理200A期间,在量化阶段214之后,编码器可以将量化变换系数216馈送到逆量化阶段218和逆变换阶段220,以生成重建剩余BPU 222。编码器可以将重建剩余BPU 222添加到预测BPU 208以生成预测参考224,其在预测阶段204中用于处理200A的下一个循环。处理200A的上述标记218、220、222和224可以被称为“重建路径”。重建路径可以用于确保编码器和解码器两者使用相同的参考数据进行预测。
编码器可以循环地执行处理200A,以对原始图片的每个原始BPU(在前向路径中)进行编码,并且生成用于对原始图片的下一个原始BPU(在重建路径中)进行编码的预测参考224。在对原始图片的所有原始BPU进行编码之后,编码器可以继续对视频序列202中的下一图片进行编码。
参考处理200A,编码器可以接收由视频捕获设备(例如,相机)生成的视频序列202。本文所使用的术语“接收”可以指接收、输入、获取、检索、获得、读取、访问或以任何方式的用于输入数据的任何动作。
在预测阶段204,在当前循环中,编码器可以接收原始BPU和预测参考224,并且执行预测操作以生成预测数据206和预测BPU 208。预测参考224可以从处理200A的先前循环的重建路径生成。预测阶段204的目的是通过从原始BPU和预测参考224提取预测数据206来减少信息冗余,该预测数据可以用于将原始BPU重建为预测BPU 208。
理想地,预测BPU 208可以与原始BPU相同。然而,由于非理想的预测和重建操作,预测BPU 208通常与原始BPU略有不同。为了记录这样的差异,在生成预测BPU 208之后,编码器可以从原始BPU中减去它以生成残余BPU 210。例如,编码器可以从原始BPU的相应像素的值中减去预测BPU 208的像素的值(例如,灰度值或RGB值)。作为原始BPU和预测BPU 208的对应像素之间的这样的减法的结果,残余BPU 210的每个像素可以具有残余值。与原始BPU相比,预测数据206和残余BPU 210可以具有更少的比特,但是它们可以用于重建原始BPU而没有显著的质量劣化。因此,原始BPU被压缩。
为了进一步压缩残余BPU 210,在变换阶段212,编码器可以通过将残余BPU 210分解成一组二维“基础图案”来减少其空间冗余,每个基础图案与“变换系数”相关联。基础图案可以具有相同的大小(例如,残余BPU 210的大小)。每个基础图案可以表示残余BPU 210的变化频率(例如,亮度变化的频率)分量。没有一种基础图案可以从任何其他基础图案的任何组合(例如线性组合)中获得。换句话说,分解可以将残余BPU 210的变化分解到频域中。这样的分解类似于函数的离散傅立叶变换,其中基础图案类似于离散傅立叶变换的基本函数(例如,三角函数),并且变换系数类似于与基本函数相关联的系数。
不同的变换算法可以使用不同的基础图案。在变换阶段212可使用各种变换算法,诸如离散余弦变换、离散正弦变换等。变换阶段212的变换是可逆的。也就是说,编码器可以通过变换的逆操作(称为“逆变换”)来复原残余BPU 210。例如,为了复原残余BPU 210的像素,逆变换可以是将基础图案的对应像素的值乘以相应的关联系数,并将乘积相加以产生加权和。对于视频编码标准来说,编码器和解码器两者都可以使用相同的变换算法(因此使用相同的基础图案)。因此,编码器可以仅记录变换系数,解码器可以在没有从编码器接收基础图案的情况下根据该变换系数重建残余BPU 210。与残余BPU 210相比,变换系数可以具有更少的比特,但是它们可以用于重建残余BPU 210而没有显著的质量劣化。因此,残余BPU 210被进一步压缩。
编码器可以在量化阶段214进一步压缩变换系数。在变换过程中,不同的基础图案可以表示不同的变化频率(例如,亮度变化频率)。由于人眼通常能更好地识别低频变化,因此编码器可以忽略高频变化的信息而不会在解码中引起显著的质量劣化。例如,在量化阶段214,编码器可以通过将每个变换系数除以整数值(称为“量化比例因子”)并将商舍入到其最近的整数来生成量化变换系数216。在这样的操作之后,高频基础图案的一些变换系数可以被转换为零,并且低频基础图案的变换系数可以被转换为较小的整数。编码器可以忽略零值的量化变换系数216,由此进一步压缩变换系数。量化过程也是可逆的,其中量化变换系数216可在量化逆运算中被重建为变换系数(称为“逆量化”)。
因为编码器在舍入操作中忽略了这样的除法的余数,所以量化阶段214可以是有损的。通常,量化阶段214可在处理200A中造成最多的信息损失。信息损失越大,量化变换系数216需要的比特数越少。为了获得不同程度的信息丢失,编码器可以使用量化参数或量化处理的任何其他参数的不同值。
在二进制编码阶段226,编码器可使用二进制编码技术对预测数据206和量化变换系数216进行编码,该二进制编码技术可以例如是熵编码、可变长度编码、算术编码、霍夫曼编码、上下文自适应二进制算术编码或任何其他无损或有损压缩算法。在一些实施例中,除了预测数据206和量化变换系数216之外,编码器可在二进制编码阶段226编码其他信息,诸如预测阶段204使用的预测模式、预测操作的参数、变换阶段212的变换类型、量化处理的参数(例如,量化参数)、编码器控制参数(例如,比特率控制参数)等。编码器可以使用二进制编码阶段226的输出数据来生成视频比特流228。在一些实施例中,视频比特流228可以被进一步分组以用于网络传输。
参考处理200A的重建路径,在逆量化阶段218,编码器可以对量化变换系数216执行逆量化,以生成重建变换系数。在逆变换阶段220,编码器可以基于重建变换系数生成重建残余BPU 222。编码器可以将重建残余BPU 222添加到预测BPU 208,以生成将在处理200A的下一个循环中使用的预测参考224。
应当注意,处理200A的其他变化可用于编码视频序列202。在一些实施例中,处理200A的各个阶段可以由编码器以不同的顺序执行。在一些实施例中,处理200A的一个或多个阶段可以组合成单个阶段。在一些实施例中,处理200A的单个阶段可以被划分成多个阶段。例如,变换阶段212和量化阶段214可组合成单个阶段。在一些实施例中,处理200A可以包括额外的阶段。在一些实施例中,处理200A可以省略图2A中的一个或多个阶段。
图2B示出了根据本公开的实施例的另一示例性编码处理200B的示意图。处理200B可以是通过修改处理200A而获得的。例如,处理200B可以由符合混合视频编码标准(例如,H.26x系列)的编码器使用。与处理200A相比,处理200B的前向路径另外包括模式决定阶段230,并将预测阶段204划分成空间预测阶段2042和时间预测阶段2044。处理200B的重建路径另外包括环路滤波阶段232和缓冲器234。
通常,预测技术可以被分类成两种类型:空间预测和时间预测。空间预测(例如,图片内预测或“帧内预测”)可以使用来自同一图片中的一个或多个已经编码的相邻BPU的像素来预测当前BPU。也就是说,空间预测中的预测参考224可包括相邻BPU。空间预测可以减少图片的固有空间冗余。时间预测(例如,图片间预测或“帧间预测”)可使用来自一个或多个已编码图片的区域来预测当前BPU。也就是说,时间预测中的预测参考224可包括经编码图片。时间预测可以减少图片的固有时间冗余。
参考处理200B,在前向路径中,编码器在空间预测阶段2042和时间预测阶段2044执行预测操作。例如,在空间预测阶段2042,编码器可以执行帧内预测。对于正被编码的图片的原始BPU,预测参考224可以包括在同一图片中已经被编码(在前向路径中)和被重建(在重建路径中)的一个或多个相邻BPU。编码器可以通过外推邻近BPU来生成预测BPU 208。外推技术可以包括例如线性外推或插值、多项式外推或插值等。在一些实施例中,编码器可以在像素级执行外推,诸如通过外推预测BPU 208的每个像素的对应像素值。用于外推的相邻BPU可以位于相对于原始BPU的各种方向上,例如垂直方向(例如,原始BPU的顶部上)、水平方向(例如,原始BPU的左侧)、对角线方向(例如,原始BPU的左下、右下、左上或右上)或在所使用的视频编码标准中界定的任何方向。对于帧内预测,预测数据206可以包括例如所使用的邻近BPU的位置(例如,坐标)、所使用的邻近BPU的大小、外推的参数、所使用的邻近BPU相对于原始BPU的方向等。
对于另一示例,在时间预测阶段2044,编码器可执行帧间预测。对于当前图片的原始BPU,预测参考224可以包括已经被编码(在前向路径中)和重建(在重建路径中)的一个或多个图片(称为“参考图片”)。在一些实施例中,可以逐个BPU对参考图片进行编码和重建。例如,编码器可以将重建残余BPU 222添加到预测BPU 208以生成重建BPU。当生成同一图片的所有重建BPU时,编码器可以生成重建图片作为参考图片。编码器可以执行“运动估计”操作,以在参考图片的范围(称为“搜索窗口”)中搜索匹配区域。参考图片中搜索窗口的位置可以基于当前图片中原始BPU的位置来确定。例如,搜索窗口可以以参考图片中具有与当前图片中的原始BPU相同的坐标的位置为中心,并且可以向外扩展预定距离。当编码器在搜索窗口中识别(例如,通过使用像素递归算法、块匹配算法等)与原始BPU相似的区域时,编码器可以将这样的区域确定为匹配区域。匹配区域可以具有与原始BPU不同的大小(例如,小于、等于、大于或具有不同的形状)。因为参考图片和当前图片在时间线中在时间上分离(例如,如图1中所示),所以可认为随着时间的推移,匹配区域“移动”到原始BPU的位置。编码器可以将这样的运动的方向和距离记录为“运动向量”。当使用多个参考图片(例如,如图1中的图片106)时,编码器可以搜索匹配区域,并对于每个参考图像确定其关联的运动图片。在一些实施例中,编码器可以向相应匹配参考图片的匹配区域的像素值分配权重。
运动估计可以用于识别各种类型的运动,诸如平移、旋转、缩放等。对于帧间预测,预测数据206可以包括例如匹配区域的位置(例如,坐标)、与匹配区域相关联的运动向量、参考图片的数量、与参考图片相关联的权重等。
为了生成预测BPU 208,编码器可以执行“运动补偿”操作。运动补偿可以用于基于预测数据206(例如,运动向量)和预测参考224来重建预测BPU 208。例如,编码器可以根据运动向量移动参考图片的匹配区域,其中编码器可以预测当前图片的原始BPU。当使用多个参考图片时(例如,如图1中的图片106),编码器可根据匹配区域的相应运动向量和平均像素值来移动参考图片的匹配区域。在一些实施例中,如果编码器已经向相应匹配参考图片的匹配区域的像素值分配了权重,则编码器可以将移动的匹配区域的像素值的加权和相加。
在一些实施例中,帧间预测可以是单向的或双向的。单向帧间预测可以使用与当前图片在同一时间方向上的一个或多个参考图片。例如,图1中的图片104是单向帧间预测图片,其中参考图片(例如,图片102)位于图片104之前。双向帧间预测可以使用当前图片的两个时间方向上的一个或多个参考图片。例如,图1中的图片106是双向帧间预测图片,其中参考图片(例如,图片104和108)在图片104的两个时间方向上。
仍然参考处理200B的前向路径,在空间预测2042和时间预测阶段2044之后,在模式决定阶段230,编码器可为处理200B的当前循环选择预测模式(例如,帧内预测或帧间预测中的一个)。例如,编码器可执行率失真优化技术,在该技术中,编码器可以对预测模式进行选择以最小化根据候选预测模式的码率和在该候选预测模式下重建参考图片的失真的成本函数的值。取决于所选择的预测模式,编码器可以生成对应的预测BPU 208和预测数据206。
在处理200B的重建路径中,如果在前向路径中选择了帧内预测模式,则在生成预测参考224(例如,当前图片中已经编码和重建的当前BPU)之后,编码器可以直接将预测参考224馈送到空间预测阶段2042以供以后使用(例如,用于当前图片的下一BPU的外推)。编码器可将预测参考224馈送到环路滤波阶段232,在该环路滤波阶段,编码器可将环路滤波器应用于预测参考224以减少或消除在预测参考224的编码期间引入的失真(例如,块效应)。编码器可以在环路滤波阶段232应用各种环路滤波器技术,例如去块、采样自适应偏移、自适应环路滤波器等。经环路滤波的参考图片可存储在缓冲器234(或“解码图片缓冲器”)中以供以后使用(例如,用作视频序列202的后续图片的帧间预测参考图片)。编码器可以将一个或多个参考图片存储在缓冲器234中以在时间预测阶段2044使用。在一些实施例中,编码器可以将二进制编码阶段226的环路滤波器的参数(例如,环路滤波器强度)与量化变换系数216、预测数据206和其他信息一起进行编码。
图3A示出了根据本公开的实施例的示例性解码处理300A的示意图。处理300A可以是对应于图2A中的压缩处理200A的解压缩处理。在一些实施例中,处理300A可以类似于处理200A的重建路径。解码器可以根据处理300A将视频比特流228解码成视频流304。视频流304可以与视频序列202非常相似。然而,由于压缩和解压缩处理(例如,图2A-2B中的量化阶段214)中的信息丢失,通常,视频流304与视频序列202不相同。与图2A-2B中的处理200A和200B类似地,解码器可以以基础处理单元(BPU)来对编码为视频比特流228的每个图片执行处理300A。例如,解码器可以以循环方式执行处理300A,在该循环方式中,解码器可以在处理300A的一次循环中对基础处理单元进行解码。在一些实施例中,解码器可以针对编码为视频比特流228中的每个图片的多个区域(例如,区域114-118)并行地执行处理300A。
在图3A中,解码器可将与经编码图片的基础处理单元(称为“编码BPU”)相关联的视频比特流228的一部分馈送到二进制解码阶段302。在二进制解码阶段302,解码器可将该一部分解码成预测数据206和量化变换系数216。解码器可以将量化变换系数216馈送到逆量化阶段218和逆变换阶段220,以生成重建残余BPU 222。解码器可以将预测数据206馈送到预测阶段204以生成预测BPU 208。解码器可以将重建残余BPU 222添加到预测BPU 208以生成预测参考224。在一些实施例中,预测参考224可以存储在缓冲器(例如,计算机存储器中的解码图片缓冲器)中。解码器可将预测参考224馈送到预测阶段204以用于在处理300A的下一循环中执行预测操作。
解码器可以循环地执行处理300A,以对编码图片的每个编码BPU进行解码,并生成用于对编码图片的下一个编码BPU进行编码的预测参考224。在对编码图片的所有编码BPU进行解码之后,解码器可以将该图片输出到视频流304以进行显示,并且继续对视频比特流228中的下一个编码图片进行解码。
在二进制解码阶段302,解码器可以执行编码器所使用的二进制编码技术(例如,熵编码、可变长度编码、算术编码、霍夫曼编码、上下文自适应二进制算术编码、或任何其他无损压缩算法)的逆运算。在一些实施例中,除了预测数据206和量化变换系数216之外,解码器可以在二进制解码阶段302对其他信息进行解码,这些其他信息例如可以是预测模式、预测操作的参数、变换类型、量化处理的参数(例如,量化参数)、编码器控制参数(例如,比特率控制参数)等。在一些实施例中,如果视频比特流228以分组的形式通过网络传输,则解码器可以在将视频比特流228馈送到二进制解码阶段302之前对其进行去分组处理。
图3B示出了根据本公开的实施例的另一示例性解码处理300B的示意图。处理300B可以是通过对处理300A进行修改而获得的。例如,处理300B可以由符合混合视频编码标准(例如,H.26x系列)的解码器使用。与处理300A相比,处理300B额外地将预测阶段204划分成空间预测阶段2042和时间预测阶段2044,并且额外地包括环路滤波阶段232和缓冲器234。
在处理300B中,对于正被解码的编码图片(称为“当前图片”)的编码基础处理单元(称为“当前BPU”),由解码器从二进制解码阶段302解码获得的预测数据206可以根据编码器使用什么预测模式来编码当前BPU而包括各种类型的数据。例如,如果编码器使用帧内预测来编码当前BPU,则预测数据206可以包括指示帧内预测的预测模式指示符(例如,标志值)、帧内预测操作的参数等。帧内预测操作的参数可以包括例如用作参考的一个或多个相邻BPU的位置(例如,坐标)、相邻BPU的大小、外推参数、相邻BPU相对于原始BPU的方向等。对于另一示例,如果编码器使用帧间预测来编码当前BPU,则预测数据206可以包括指示帧间预测的预测模式指示符(例如,标志值)、帧间预测操作的参数等。帧间预测操作的参数可以包括例如与当前BPU相关联的参考图片的数量、分别与参考图片相关联的权重、一个或多个匹配区域在各自参考图片中的位置(例如,坐标)、分别与匹配区域相关联的一个或多个运动向量等。
基于预测模式指示符,解码器可以决定是在空间预测阶段2042执行空间预测(例如,帧内预测)还是在时间预测阶段2044执行时间预测(例如,帧间预测)。参考图2B已经详细描述了执行这样的空间预测或时间预测的细节,并且在下文中将不再重复。在执行这样的空间预测或时间预测之后,解码器可以生成预测BPU 208。解码器可以将预测BPU 208和重建残余BPU 222相加,以生成预测参考224,如参考图3A所描述的那样。
在处理300B中,解码器可将预测参考224馈送到空间预测阶段2042或时间预测阶段2044,以在处理300B的下一循环中执行预测操作。例如,如果在空间预测阶段2042使用帧内预测来解码当前BPU,则在生成预测参考224(例如,经解码的当前BPU)之后,解码器可以直接将预测参考224馈送给空间预测阶段2042以供后续使用(例如,用于当前图片的下一BPU的外推)。如果在时间预测阶段2044使用帧间预测对当前BPU进行解码,则在生成预测参考224(例如,其中所有BPU都已被解码的参考图片)之后,解码器可以将预测参考224馈送到环路滤波阶段232以减少或消除失真(例如,块效应)。解码器可以以如参考图2B所描述的方式将环路滤波器应用于预测参考224。经环路滤波后的参考图片可存储在缓冲器234(例如,计算机存储器中的解码图片缓冲器)中以供后续使用(例如,用作视频比特流228的后续的编码图片的帧间预测参考图片)。解码器可以将一个或多个参考图片存储在缓冲器234中以在时间预测阶段2044使用。在一些实施例中,预测数据可以还包括环路滤波器的参数(例如,环路滤波器强度)。在一些实施例中,当预测数据206的预测模式指示符指示使用帧间预测来编码当前BPU时,预测数据包括环路滤波器的参数。
图4是根据本公开的实施例的用于编码或解码视频的示例性设备400的框图。如图4所示,设备400可以包括处理器402。当处理器402执行本文描述的指令时,设备400可以成为用于视频编码或解码的专用机器。处理器402可以是能够操纵或处理信息的任何类型的电路。例如,处理器402可以包括任何数量的中央处理单元(或“CPU”)、图形处理单元(或“GPU”)、神经处理单元(“NPU”)、微控制器单元(“MCU”)、光学处理器、可编程逻辑控制器、微控制器、微处理器、数字信号处理器、知识产权(IP)核、可编程逻辑阵列(PLA)、可编程阵列逻辑(PAL)、通用阵列逻辑(GAL)、复杂可编程逻辑器件(CPLD)、现场可编程门阵列(FPGA)、片上系统(SoC)、专用集成电路(ASIC)等的任何组合。在一些实施例中,处理器402还可以是被分组为单个逻辑组件的一组处理器。例如,如图4所示,处理器402可以包括多个处理器,包括处理器402a、处理器402b和处理器402n。
设备400还可以包括被配置为存储数据(例如,指令集、计算机代码、中间数据等)的存储器404。例如,如图4所示,被存储的数据可以包括程序指令(例如,用于实施处理200A、200B、300A或300B中的阶各个段的程序指令)和用于处理的数据(例如,视频序列202、视频比特流228或视频流304)。处理器402可以(例如,经由总线410)访问程序指令和用于处理的数据,并且执行程序指令以对用于处理的数据执行操作或操纵。存储器404可以包括高速随机存取存储设备或非易失性存储设备。在一些实施例中,存储器404可以包括任意数量的随机存取存储器(RAM)、只读存储器(ROM)、光盘、磁盘、硬盘驱动器、固态驱动器、闪存驱动器、安全数字(SD)卡、记忆棒、紧凑型闪存(CF)卡等的任意组合。存储器404还可以是分组为单个逻辑组件的一组存储器(图4中未示出)。
总线410可以是在设备400内部的组件之间传送数据的通信设备,例如内部总线(例如,CPU-存储器总线)、外部总线(例如,通用串行总线端口、外围组件互连高速端口)等。
为了便于解释而不导致不清楚,在本公开中,处理器402和其他数据处理电路被统称为“数据处理电路”。数据处理电路可以完全实施为硬件,或者实施为软件、硬件或固件的组合。另外,数据处理电路可以是单个独立模块,或者可以完全或部分地组合到设备400的任何其他组件中。
设备400还可以包括网络接口406,以提供与网络(例如,因特网、内联网、局域网、移动通信网络等)的有线或无线通信。在一些实施例中,网络接口406可以包括任何数量的网络接口控制器(NIC)、射频(RF)模块、应答器、收发器、调制解调器、路由器、网关、有线网络适配器、无线网络适配器、蓝牙适配器、红外适配器、近场通信(“NFC”)适配器、蜂窝网络芯片等的任何组合。
在一些实施例中,可选地,设备400还可以包括外围接口408,以提供到一个或多个外围设备的连接。如图4所示,外围设备可以包括但不限于光标控制设备(例如,鼠标、触摸板或触摸屏)、键盘、显示器(例如,阴极射线管显示器、液晶显示器或发光二极管显示器)、视频输入设备(例如,照相机或耦接到视频档案的输入接口)等。
应注意,视频编解码器(例如,执行处理200A、200B、300A或300B的编解码器)可实施为设备400中的任何软件或硬件模块的任何组合。例如,处理200A、200B、300A或300B的一些或所有阶段可以被实施为设备400的一个或多个软件模块,例如可以被加载到存储器404中的程序指令。对于另一示例,处理200A、200B、300A或300B的一些或所有阶段可以被实施为设备400的一个或多个硬件模块,例如专用数据处理电路(例如,FPGA、ASIC、NPU等)。
在2002年在中国建立的音频视频编码标准(AVS)工作组当前正在开发AVS3视频标准,即第三代AVS视频标准。AVS3标准的前身AVS1和AVS2分别在2006年和2016年作为中国国家标准发行。在2017年12月,AVS工作组发出了对于提案的征集(CfP),以正式地开始第三代AVS标准AVS3的开发。在2018年12月,工作组选择高性能模型(HPM)作为AVS3标准开发的新参考软件平台。HPM中的初始技术继承自AVS2标准,并且基于此,越来越多的新的高级视频编码技术被采用以提高压缩性能。在2019年,AVS3标准的第一阶段已结束,并且与其前身AVS2相比获得了超过20%的编码性能增益,而AVS3标准的第二阶段仍在AVS3的第一阶段之上开发以获得更好的编码效率。
AVS3标准基于在诸如AVS1、AVS2、H.264/AVC、H.265/HEVC等的现代视频压缩标准中使用的同一混合视频编码系统。如图1所示,输入视频被逐块处理。在AVS3中,编码树单元(CTU)是最大的块单元,并且可以大到128×128个亮度样本(根据色度格式可以加上对应的色度样本)。CTU可以使用四叉树、二叉树或扩展二叉树进一步划分成编码单元(CU)。在划分结构的叶节点处,发送诸如编码模式(帧内模式或帧间模式)的编码信息、在帧间编码的情况下的运动信息(参考索引、运动向量差等)和量化残余系数。如果使用帧内预测(也称为空间预测),则使用空间相邻样本来预测当前块。如果使用帧间预测(也称为时间预测或运动补偿预测),则使用来自称为参考图片的已经编码的图片的样本来预测当前块。帧间预测可使用单向预测或双向预测。在单向预测中,仅使用指向一个参考图片的一个运动向量来生成当前块的预测信号;并且在双向预测中,使用其中每个运动向量指向其自身的参考图片的两个运动向量来产生当前块的预测信号。运动向量和参考索引被发送到解码器以识别当前块的预测信号来自哪里。在帧内或帧间预测之后,模式决定和编码器控制块例如基于率失真优化方法来选择用于当前块的最佳预测模式。基于最佳预测模式,根据输入的视频块生成预测块且从其中减去预测块。将预测残余发送到变换和量化模块以生成量化残余系数。然后,对量化残余系数进行逆量化和逆变换,以获得重建残余。在环路滤波之前,将预测块和重建残余加在一起以形成重建块,该重建块用于提供用于帧内预测的参考样本。可以将诸如去块、样本自适应偏移SAO及自适应环路滤波器ALF等环路滤波应用于重建块,以在环路滤波之后形成重建块,该重建块存储于解码图片缓冲器中且用以提供用于帧间预测的参考样本。诸如编码模式(帧内或帧间预测)、帧内预测模式的编码信息、运动信息、量化残余系数等被发送到熵编码模块,以在被打包到输出视频比特流中之前进一步降低码率。
在AVS3中,支持双向梯度校正技术用于双向预测帧间模式。双向梯度校正(BGC)使用两个双向参考块之间的差异来校正预测块。对于双向预测帧间模式,通过对从两个不同参考图片获得的或者使用两个不同运动向量的两个双向预测块pred0和pred1求平均,来生成预测块predBI。BGC基于以下等式进一步计算校正预测块Pred:
Figure BDA0004004257350000201
其中k是校正强度因子,并且在AVS3中被设置为3。对于在双向预测帧间模式中编码并且满足BGC应用条件的块,标志BgcFlag被信令以指示是否使用BGC。当使用BGC时,索引BgcIdx被进一步信令以指示使用哪种校正方法。使用上下文编码的二进位来信令BgcFlag和BgcIdx两者。
BGC应用条件为:1)使用双向预测模式对当前块进行编码;2)当前块的亮度样本的数量不小于256;3)当前块的预测模式不是跳过模式或直接模式;4)BGC仅应用于亮度样本;5)当前图片的显示顺序位于两个参考图片之间。两个参考图片中的一个位于当前图片之前,另一个参考图片在显示顺序上位于当前图片之后。
跳过模式和直接模式是AVS3中的两种特殊帧间模式,在这两种模式中,包括参考标号和运动向量的运动信息没有被信令在比特流中,而是在解码器侧以与编码器所使用的规则相同的规则推导获得。这两种模式共享相同的运动信息推导规则,并且它们之间的差异在于跳过模式通过将残余设置为零来跳过残余的信令。与正常的帧间模式相比,尽管编码器必须遵循标准中规定的规则来推导运动向量和参考索引,以执行帧间预测,但是在跳过模式和直接模式中可以节省专用于运动信息的比特。因此,跳过模式和直接模式适合于当前块的运动信息接近空间或时间相邻块的运动信息的情况,这是因为运动信息的推导是基于空间或时间相邻块来进行的。
为了推导在跳过模式和直接模式中的帧间预测中使用的运动信息,编码器首先推导获得运动候选的列表,然后选择它们中的一个来执行帧间预测。在比特流中信令被选择的候选的标号。在解码器侧,解码器推导获得与编码器相同的运动候选列表,使用从比特流解析的标号来获得用于帧间预测的运动,然后执行帧间预测。
当前在AVS3中,在候选列表中存在12个候选,如下所述。
第一候选是时间运动向量预测(TMVP),其是从特定参考帧中的共置块的运动向量(MV)推导获得的。这里的特定参考帧在用于B帧的列表1中或用于P帧的列表0中被指定为参考标号为0的参考帧。当该共置块的运动向量不可用时,依据空间相邻块的运动向量推导获得的运动向量预测子(MVP)被用作TMVP。
第二、第三和第四候选是空间运动向量预测(SMVP)。图5是示出了根据本公开的一些实施例的用于空间运动向量预测(SMVP)推导的示例性相邻块的示意图。如图5所示,SMVP是从六个相邻块F、G、C、B、A、D推导获得的,第二候选是双向预测候选,第三候选是列表0中基于参考帧的单向预测候选,并且第四候选是列表1中基于参考帧的单向预测候选。这三个候选被设置为按指定顺序排列的六个相邻块的第一可用MV。在SMVP候选之后,添加运动向量角度预测候选(MVAP)和基于历史的运动向量预测候选(HMVP)。
基于历史的运动向量预测(HMVP)是从先前编码或解码的块的运动信息推导而获得的。在编码或解码经帧间编码的块之后,将运动信息添加到HMVP表的最后条目,其中HMVP表的大小被设置为8。当将新的运动候选插入到表中时,利用有约束的先进先出(FIFO)规则,在该规则中首先应用冗余校验以发现表中是否存在相同的运动候选。如果找到,则将相同的运动候选移动到表的最后一个条目,而不是插入新的相同条目。HMVP表中的候选将用作跳过模式和直接模式的HMVP候选。从最后一个条目到第一个条目来检查HMVP表。如果HMVP表中的候选与跳过模式和直接模式的候选列表中的任何时间运动向量预测(TMVP)候选和空间运动向量预测(SMVP)候选不同,则将HMVP表中的候选放入跳过模式和直接模式的候选列表中作为HMVP候选。如果HMVP表中的候选与TMVP候选或SMVP候选中的一个相同,则不将此候选放入跳过模式和直接模式的候选列表中。在本公开中,该处理被称为剪枝。
除了其中隐式推导获得的运动信息被直接用于预测块生成的跳过模式或直接模式之外,在AVS3中还引入了最终运动向量表达。最终运动向量表达(UMVE)标志被信令来指定是否对于块使用UMVE模式。
在UMVE中,在选择跳过候选或直接候选之后,通过信令运动向量差(MVD)信息来进行进一步的筛选。该进一步信息包括跳过候选或直接候选标志、用于指定偏移运动距离的指标和用于指示偏移运动方向的指标。在UMVE模式中,选择跳过候选或直接候选中的两个候选中的一个作为基础运动向量和起点。方向指标表示MVD相对于起点的方向。图6是示出了根据本公开的一些实施例的UMVE中的示例性运动推导的示意图。方向指标可以表示四个方向,如图6所示。距离指标指定运动幅度信息,并且指示从起点的预定偏移。表1和表2中规定了距离指标和预定偏移的关系。可以在图片头中信令确定是使用表1还是表2的标志。
表1:用于UMVE模式的5个MVD偏移
MVD偏移(pel)) 11//44 1/2 1 2 4
表2:用于UMVE模式的8个MVD偏移
MVD偏移(Pel) 11//4 11//2 1 2 4 8 16 32
在AVS3中,将帧间预测滤波器应用于直接模式以对预测块进行滤波。如果当前块是通过直接模式编码的,而不是通过仿射运动补偿(AFFINE)或UMVE模式编码的,则可以信令指示是否使用帧间预测滤波器(InterPF)的标志。在解码器侧,当解析出的InterPF标志为真时,解码器执行与编码器相同的滤波操作。存在两种滤波方法,并且信令InterPF指标以指示使用哪种滤波方法。
当InterPF指标等于1时,InterPF滤波器使用预测块和当前块的上、下、右、左侧的相邻像素根据以下等式进行加权平均,以得到最终的预测块:
Pred(x,y)=(Pred_inter(x,y)*5+Pred_Q(x,y)*3)>>3 (等式2)
Pred_Q(x,y)=(Pred_V(x,y)+Pred_H(x,y)+1)>>2 (等式3)
Pred_V(x,y)=((h-1-y)*Rec(x,-1)+(y+1)*Rec(-1,h)+(h>>1))>>log2(h) (等式4)
Pred_H(x,y)=((w-1-x)*Rec(-1,y)+(x+1)*Rec(w,-1)+(w>>1))>>log2(w) (等式5)
其中Pred_inter是未滤波的预测块,Pred是最终的预测块,Rec表示重建相邻像素。当前块的宽度和高度分别由W和H表示。
当InterPF指标等于1时,InterPF滤波器使用预测块和当前块的上和左侧的相邻像素根据下面的等式进行加权平均,以得到最终的预测块:
Pred(x,y)=f(x)*Rec(-1,y)+f(y)*Rec(x,-1)+(1-f(x)-f(y))*Pred_inter(x,y) (等式6)
其中f(x)和f(y)是两个加权因子。
在AVS3中,应用基于块的仿射运动补偿预测。AFFINE可表示诸如放大/缩小、旋转、透视运动不规则的运动,就好像在真实世界中一样。图7是根据本公开的一些实施例示出仿射模型所基于的示例性控制点的示意图。如图7所示,块的仿射运动场由两个控制点(4个参数)或三个控制点运动向量(6个参数)的运动信息来描述。AFFINE应用于大于16×16的块。
图8是示出了根据本公开的一些实施例的每个子块的中心采样的示例性运动向量的示意图。为了推导每个8×8亮度子块的运动向量,如图8所示,根据两个或三个控制点(CP)计算每个子块的中心采样的运动向量,并舍入到1/16分数精度。然后执行运动补偿以利用推导获得的运动向量生成每个子块的预测。
还存在两种仿射运动帧间预测模式:AFFINE跳过或直接模式和AFFINE帧间模式。
对于AFFINE跳过模式或直接模式,基于空间相邻块的运动信息生成当前块的控制点的运动向量(CPMV)。可以存在最多五个AFFINE跳过候选或直接候选,并且可以信令指示哪个候选将用于当前块的标号。AFFINE跳过候选或直接候选由以下三种类型形成:
1.从相邻块的CPMV外推获得的继承仿射跳过候选/直接候选;
2.使用相邻块的平移MV推导获得的构建仿射跳过候选/直接候选CPMV;以及
3.零运动向量。
在从相邻块的仿射运动模型推导获得的两个继承仿射候选中可以存在一个最大的。当识别出相邻仿射块时,其控制点运动向量用于推导当前块的仿射跳过或直接列表中的CPMV候选。构建仿射候选意味着通过组合每个控制点的相邻运动信息来构建该候选。控制点的运动信息是从图5所示的指定空间相邻者和时间相邻者推导获得的。CPMVk(k=1,2,3,4)表示第k个控制点CPk的运动向量。对于CPMV1,检查A->B->D块,并使用第一可用块的MV。对于CPMV2,检查G->C块,并且对于CPMV3,使用F块。对于CPMV4,如果时间运动向量预测(TMVP)可用,则将其用作CPMV4。在获得四个控制点的MV之后,基于运动信息构建仿射跳过/直接候选。使用控制点MV的以下组合来按顺序构建:{CPMV1,CPMV2,CPMV3}、{CPMV1,CPMV2,CPMV4}、{CPMV1,CPMV3,CPMV4}、{CPMV2,CPMV3,CPMV4}、{CPMV1,CPMV2}、{CPMV1,CPMV3}
3个CPMV的组合构建6-参数仿射合并候选,并且2个CPMV的组合构建4-参数仿射合并候选。
在检查继承的仿射跳过或直接候选和构建的仿射跳过或直接候选之后,如果列表仍然不满,则将零MV插入到列表的末尾。
对于AFFINE帧间模式,在比特流中信令当前块的CPMV与它们的预测(CPMVP)的差。
如果BGC满足所有BGC应用条件,则将BGC应用于双向预测帧间编码块。然而,现有的设计使得BGC的应用受到了许多限制。例如,BGC不能应用于跳过或直接模式编码的块,即使该模式是双向预测帧间模式。结果,BGC不能被应用于基于跳过候选或直接候选的编码工具,诸如UMVE、InterPF等。另外,BGC不能应用于当前帧的显示顺序不在两个参考帧之间的块。因此,BGC不能被应用于低延迟帧,并且在低延迟配置中被禁用。此外,BGC不能应用于色度块。
因此,目前的BGC设计不适合于上述条件。此外,上述限制可能对BGC的编码性能具有负面影响。
本公开提供了对上述问题中的一些或全部的解决方案。本公开公开的实施例可以提高BGC的编码性能,使其在不同条件下得到更广泛的应用。提供以下示例性方法来解决上述问题。
图9-11是根据本公开的一些实施例的示例性视频解码方法的流程图。该方法可由解码器执行(例如,由图3A的处理300A或图3B的处理300B执行)。图12-14是根据本公开的一些实施例的示例性视频编码方法的流程图。该方法可由编码器执行(例如,由图2A的处理200A或图2B的处理200B执行)。图9-14的方法可以由设备(例如,图4的设备400)的一个或多个软件或硬件组件来执行。例如,处理器(例如,图4的处理器402)可以执行图5中的方法。在一些实施例中,该方法可以由计算机程序产品来实现,该计算机程序产品包括在计算机可读介质中,包括由计算机(例如,图4的设备400)执行的诸如程序代码的计算机可执行指令。
本公开提供的一些实施例意在扩展BGC校正方法。如上所述,有两种校正方法来校正BGC中的双向预测块,其分别由BgcIdx=0和BgcIdx=1表示。然而,这两种方法可能不足以表示当前块的原始信号与P0、P1之间的关系。在本公开的一些实施例中,可以扩展BGC校正方法。图9的解码方法和图12的编码方法是为技术方案而提供的。
图9的解码方法可以包括以下步骤。
在步骤901中,解码来自比特流的编码单元的第一参数。
在步骤902中,基于第一参数确定用于编码单元的候选。在一些实施例中,候选是TMVP、SMVP、MVAP、HMVP、UMVE、InterPF、仿射继承、仿射构建或零仿射候选中的一个。
在步骤903中,基于与候选相关联的第二参数的值确定与编码单元相关联的第二参数的值。第二参数指示双向预测校正是否被启用。在一些实施例中,第二参数可以是标志BgcFlag。在一些实施例中,与编码单元相关联的第二参数的值等于与候选相关联的第二参数的值。
在步骤904中,响应于与编码单元相关联的第二参数的值指示双向预测校正被启用,对编码单元执行双向预测校正。
在一些实施例中,基于与候选相关联的第三参数的值确定与编码单元相关联的第三参数的值,其中与编码单元相关联的第三参数指示执行双向预测校正方法中的一种。第三参数可以是BgcIdx。
图12的编码方法可以包括以下步骤。
在步骤1201中,对于编码单元确定候选。
在步骤1202中,基于与候选相关联的第二参数的值确定与编码单元相关联的第二参数的值,其中第二参数指示双向预测校正是否被启用。
在步骤1203中,响应于与编码单元相关联的第二参数的值指示双向预测校正被启用,使用双向预测校正来对编码单元进行编码。
在步骤1204中,将与候选相关联的第一参数编码到比特流。
在一些实施例中,基于以下等式来确定校正的预测块Pred:
Figure BDA0004004257350000271
其中m和n是两个不同的校正强度因子,并且可以被设置为任何非负整数值以形成两种不同的校正方法。在一个示例中,m和n分别被设置为3和2。
在一些实施例中,基于以下等式来确定校正的预测块Pred:
Figure BDA0004004257350000272
其中m和n是两个不同的校正强度因子,并且可以被设置为任何非负整数值以形成四种不同的校正方法。在一个示例中,m和n分别被设置为3和2。以此方式,有四种BGC校正方法,分别由BgcIdx=0、BgcIdx=1、BgcIdx=2和BgcIdx=3表示。
当标志BgcFlag为真时,可使用经上下文编码二进位和/或旁路二进位来信令索引BgcIdx。例如,如表3所示,可以用两个固定的二进位来信令4个BgcIdxes。所有二进位以旁路二进位或上下文二进位编码。
表3:具有固定二进位的BgcIdx的二进制表示
BgcIdx 0 1 2 3
码字 00 01 10 11
例如,4个BgcIdxes可以用一元截短二进位来信令,如表4所示。所有二进位以旁路二进位来编码。
表4:具有一元截短二进位的BgcIdx的二进制表示
BgcIdx 0 1 2 3
码字 0 10 110 111
在一些实施例中,基于以下等式来确定校正的预测块Pred:
Figure BDA0004004257350000281
其中因子p、q、r和s可以被设置为任何正整数值,并且因子t、u、v和w可以被设置为任何正整数值,以形成四种不同的校正方法。在一个示例中,p、q、r、s、t、u、v和w分别被设置为1、1、3、3、3、3、2和2。信令方法可以类似于以上结合表3和表4描述的那些方法。
扩展BGC校正方法能够适应更多的情况,并提高BGC的编码性能。
在本公开的一些实施例中,对于跳过或直接模式编码的块,可基于跳过或直接候选指标从相邻块推断BgcFlag和BgcIdx,并且然后通过所获得的BgcFlag和BgcIdx对预测块进行校正,从而BGC可应用于跳过或直接模式。
具体地,为了推导在跳过和直接模式中的帧间预测中使用的BGC信息,当在编码器侧和解码器侧推导获得跳过候选或直接候选时,节省了相邻块的BgcFlag和BgcIdx。跳过候选或直接候选含有相邻块的运动向量、参考标号、BgcFlag和BgcIdxes。当编码器选择跳过候选或直接候选标号或者解码器解析获得跳过候选或直接候选标号时,其首先使用对应的运动向量和参考标号来执行帧间预测,然后使用对应的BgcFlags和BgcIdxes来对预测块进行预测。以此方式,BGC可以被应用于跳过模式或直接模式,而无需信令BgcFlag和BgcIdx。跳过候选或直接候选包括TMVP、SMVP、MVAP和HMVP。BGC可以被应用于一种或多种类型的运动向量预测。
在一些实施例中,BGC以如下方式应用于双向预测SMVP和HMVP:
-对于TMVP,对应的BgcFlag和BgcIdx被设置为0;
-对于双向预测SMVP,从获得双向预测SMVP的空间相邻块继承对应的BgcFlag和BgcIdx;对于两个单向预测SMVP,相应的BgcFlag和BgcIdx被设置为0;
-对于MVAP,相应的BgcFlag和BgcIdx被设置为0;以及
-对于HMVP,当推导获得HMVP表时,先前编码或解码的帧间块的BGC信息也被添加到HMVP表的最后条目。从HMVP表中继承对应的BgcFlag和BgcIdx。
本公开的一些实施例可以将BGC扩展到跳过模式或直接模式编码的块,并且提高编码性能。
在本公开的一些实施例中,BGC可以与基于跳过候选或直接候选的其他编码工具组合。
在一些实施例中,BGC可以与UMVE组合。如上所述,对于每个跳过候选或直接候选标号,推导获得相应的BgcFlag和相应的BgcFlag。对于UMVE编码的块,可以基于基本运动向量的跳过候选或直接候选标号从相应的BgcFlag和BgcIdx继承BgcFlag和BgcIdx。
在一些实施例中,BGC可以与InterPF组合。如上所述,对于每个跳过候选或直接候选指标,推导获得相应的BgcFlag和相应的BgcIdx。对于InterPF编码的块,BgcFlag和BgcIdx可以基于跳过候选或直接候选标号从相应的BgcFlag和BgcIdx继承。
例如,首先用BgcFlag和BgcIdx校正未经滤波的当前预测块。然后,校正的当前预测块被用于帧间滤波器以获得最终的当前预测块。
对于另一示例,未经滤波的当前预测块没有被校正。当前块的滤波操作不变。准备继承的BgcFlag和BgcIdx以便于其他块来继承。
在一些实施例中,BGC可以与AFFINE跳过模式/直接模式组合。
例如,对于AFFINE跳过模式/直接模式,显式信令当前块的BgcFlag和BgcIdx。编码器可以选择所允许的BgcFlag和BgcIdx的任何值,并且在比特流中信令所选择的值。作为第一示例,由编码器选择包括继承仿射跳过候选或直接候选、构建仿射跳过候选或直接候选以及零运动向量的所有种类的仿射跳过候选或直接候选的BgcFlag和BgcIdx并且将其在比特流中信令。作为第二示例,由编码器选择仿射跳过候选或直接候选中的一些的BgcFlag和BgcIdx并且将其在比特流中信令。例如,仅对于构建的仿射跳过候选或直接候选,可以选择BgcFlag和BgcIdx,而对于其他候选(例如,继承的仿射跳过候选或直接候选),从相邻块推断BgcFlag和BgcIdx或将其固定为默认值。
对于另一示例,对于AFFINE跳过模式/直接模式,从相邻块推断BBgcFlag和BgcIdx。
对于继承的仿射跳过候选或直接候选,还节省了相邻块的BgcFlag和BgcIdx,从而当前块的BgcFlag和BgcIdx可以分别从借用所使用的CPMV的相邻块的BgcFlag和BgcIdx继承。
对于构建的仿射跳过候选或直接候选的每一个,根据该构建的仿射跳过候选或直接候选的CP推导BgcFlag和BgcIdx,并且如果该构建的仿射跳过候选/直接候选被用于块,则推导获得的BgcFlag和BgcIdx也用于块。对于每个CP,相邻块被用于推导相应的CPMV。相邻块也用于推导CP的BgcFlag和BgcIdx。对于CP1,检查图4中的A->B->D块,并且节省了第一可用块的MV、BBgcFlag和BgcIdx。对于CP2,检查G->C块,并且节省了第一可用块的MV、BgcFlag和BgcIdx。对于CP3,节省了块F的MV、BgcFlag和BgcIdx。对于CP4,如果时间运动向量预测(TMVP)可用,则将其用作CP4,并且将CP4的BgcFlag和BgcIdx设置为0。因此,需要指定规则以从最多4个BgcFlag和BgcIdxes推导活得用于构建的仿射跳过候选或直接候选的一个BgcFlag和一个BgcIdx。
在第一示例中,如果所有CP具有相同的BgcFlag和BgcIdx,则BgcFlag和BgcIdx被用于构建的仿射跳过候选或直接候选;否则将当前块的BgcFlag设置为0。
在第二示例中,构建的仿射跳过候选或直接候选的BgcFlag和BgcIdx分别是最可能的BgcFlag和BgcIdx。并且最可能的BgcFlag和BgcIdx分别是被构建的仿射跳过候选或直接候选的最多CP使用的BgcFlag和BgcIdx。
在第三示例中,对于正常双向预测帧间模式,可将其视为Pred0与Pred1的相等权重加权平均值。使用bgcweight>>k表示Pred0的权重,基于以下等式用bgcweight标记不同的校正方法:
Figure BDA0004004257350000301
构建的仿射跳过候选或直接候选的bgcweight是在构建的仿射跳过候选或直接候选的CP的所有bgcweights中最接近相等权重(bgcweight=4)的候选。
例如,对于具有2个CP(CPa,CPb)的构建的仿射合并候选对象,
Diffa=|CPabgcweight–相等权重|
Diffb=|CPbbgcweight–相等权重|
如果(Diffa<=Diffb)
那么仿射跳过候选/直接候选bgcweight=CPabgcweight
否则仿射跳过候选/直接候选bgcweight=CPbbgcweight。
然后,利用仿射跳过候选或直接候选bgcweight,可以推导获得BgcFlag和BgcIdx。
在第四示例中,CPbgcweight的平均值被用作构建的仿射跳过候选或直接候选的bgcweight。然后,利用仿射跳过候选或直接候选bgcweight,可以推导获得BgcFlag和BgcIdx。
在第五示例中,使用构建的仿射跳过候选/直接候选的第一CP的BgcFlag和BgcIdx。具体地,对于构建的仿射跳过/直接候选{CPMV1,CPMV2,CPMV3}、{CPMV1,CPMV2,CPMV4}、{CPMV1,CPMV3,CPMV4}、{CPMV1,CPMV2}和{CPMV1,CPMV3},使用CP1的BgcFlag和BgcIdx;对于构建的仿射跳过候选/直接候选{CPMV2,CPMV3,CPMV4},使用CP2的BgcFlag和BgcIdx。
在现有设计中,BGC在低延迟配置中被禁用。本公开的一些实施例可以去除对两个参考帧和当前帧之间的显示顺序的限制,使得BGC可以应用于低延迟图片。用于低延迟图片的BGC方法可以与非低延迟图片所使用的BGC方法相同或不同。此外,本公开的一些实施例可以用于低延迟图片以改善编码性能。
可以提供图11的解码方法和图14的编码方法用于这样的技术方案。
图11的方法可以包括以下步骤。
在步骤1101中,确定与满足多个条件的编码单元相关联的第一参数的值,其中第一参数指示双向预测校正是否被启用。
在一些实施例中,多个条件包括:确定编码单元的两个参考图片列表;确定两个参考图片列表中的参考图片按显示次序是否位于与编码单元相关联的当前图片之前;以及响应于两个参考图片列表中的参考图片按显示次序位于与编码单元相关联的当前图片之前,确定编码单元满足多个条件。
在步骤1102中,响应于与编码单元相关联的第一参数的值指示双向预测校正被启用,对编码单元执行双向预测校正。
在一些实施例中,确定与编码单元相关联的第二参数的值,其中与编码单元相关联的第二参数指示对编码单元执行双向预测校正方法中的一种。第二参数可以是BgcIdx。
在一些实施例中,可以进行以下步骤:获得编码单元的第一预测与第二预测,其中使用编码单元的运动来预测第一预测和第二预测;通过将正确的强度因子应用于第一预测和第二预测之间的差确定第三预测;以及通过对第一预测和第二预测求平均再加上第三预测,使用第一预测、第二预测和第三预测来对编码单元进行解码。
在一些实施例中,第一预测与第二预测之间的差是以下中的一个:第一预测与第二预测之间的差值等于第一预测减去第二预测;或者第一预测与第二预测之间的差值等于第二预测减去第一预测。
在一些实施例中,正确的强度因子是1/8。
图14的编码方法可以包括以下步骤。
在步骤1401中,确定与满足多个条件的编码单元相关联的第一参数的值,其中第一参数指示双向预测校正是否被启用。
在步骤1402中,响应于与编码单元相关联的第一参数的值指示双向预测校正被启用,对编码单元执行双向预测校正。
在一些实施例中,消除了当前帧的显示顺序必须在两个参考帧的显示顺序之间的限制。低延迟和非低延迟图片都可以根据下面的等
式10以相同的方式将BGC应用于双向预测块:
Figure BDA0004004257350000321
其中Pred0和Pred1分别表示通过第一运动向量和第二运动向量获得的预测块。
在一些实施例中,还去除了当前帧的显示次序在两个参考帧的显示次序之间的限制,同时低延迟和非低延迟图片以不同的方式将BGC应用于双向预测块。对于非低延迟图片,校正方法与上述相同。对于低延迟图片,校正因子可以被设置为2或除3之外的其他非负整数值。
在一些实施例中,对于低延迟图片,可以基于以下等式来确定校正方法:
Figure BDA0004004257350000331
其中k被设置为3。同时,因子k可以被设置为任何非负整数值。
在一些实施例中,对于低延迟图片,可以基于以下等式来确定校正方法:
Figure BDA0004004257350000332
其中m和n分别被设置为3和2。同时,因子m和n可以被设置为任何非负整数值。
在一些实施例中,对于低延迟图片,可以基于以下等式来确定校正方法:
Figure BDA0004004257350000333
其中m和n分别被设置为3和2。同时,因子m和n可以设置为任意非负整数值,以形成四种不同的校正方法。信令方法可以与上述相同。
在一些实施例中,对于低延迟图片,可以基于以下等式来确定校正方法:
Figure BDA0004004257350000334
其中p、q、r、s、t、u、v和w分别被设置为1、1、3、3、3、3、2和2。同时,因子p、q、r和s可以被设置为任何正整数值,并且因子t、u、v和w可以被设置为任何正整数值,以形成四种不同的校正方法。信令方法可以与上述相同。所公开的方法可以将BGC扩展到低延迟图片,从而可以在低延迟配置中启用BGC。同时,可以在随机访问和低延迟配置中提高编码性能。
在常规设计中,针对色度块禁用BGC。本公开的一些实施例可使用从位于同一位置的亮度块继承的BgcFlag及BgcIdx来在BgcFlag等于1时以与上述相同的方式来校正当前预测色度块。以此方式,BGC被扩展到色度块,并且可以改进编码性能。
提供图10的解码方法和图13的编码方法用于解决上述问题。图10的解码方法可以包括以下步骤。
在步骤1001中,基于与亮度编码单元相关联的第一参数的值确定与色度编码单元相关联的第一参数的值,其中一个第一参数指示双向预测校正是否被启用。在一些实施例中,亮度编码单元是色度编码单元的共置块。
在步骤1002中,响应于与色度编码单元相关联的第一参数的值指示双向预测校正被启用,对色度编码单元执行双向预测校正。
在一些实施例中,基于与亮度编码单元相关联的第二参数的值确定与色度编码单元相关联的第二参数的值,其中一个第二参数指示对色度编码单元执行双向预测校正方法中的一种。
在一些实施例中,从比特流解码获得与亮度编码单元相关联的第一参数和第二参数。
在一些实施例中,从由从比特流解码获得的第三参数确定的候选继承与亮度编码单元相关联的第一参数和第二参数。
图13的编码方法可以包括以下步骤。
在步骤1301中,基于与亮度编码单元相关联的第一参数的值确定与色度编码单元相关联的第一参数的值,其中一个第一参数指示双向预测校正是否被启用。
在步骤1302中,响应于与色度编码单元相关联的第一参数的值指示双向预测校正被启用,对色度编码单元执行双向预测校正。
可以预期,可以组合本公开的上述实施例以提高编码性能。
本公开的一些实施例可以将BGC扩展到单向预测块以补偿图片之间的亮度改变。
在一些实施例中,当使用单向预测模式对块进行编码时,信令指示是否将权重施加于预测样本的标志。当标志等于1时,信令权重指标以指示将什么权重施加于预测采样。当标志等于0时,预测采样不采用任何权重并且直接与残余相加。例如,可以基于以下等式利用uniweight来校正或更新当前亮度预测块:
Pred=clip(Preduni*uniweight) (等式15)
其中
Figure BDA0004004257350000351
uniweight是正值。
在一些实施例中,当指示是否校正预测采样的标志等于1时,信令额外偏移指标以指示将什么偏移施加于预测采样。例如,可以基于以下等式利用uniweight和unioffset来校正或更新当前亮度预测块:
Pred=clip(Preduni*uniweight+unioffset),(等式16)
其中
Figure BDA0004004257350000352
unioffset∈[-20,-10,0,10,20]。uniweight是正值,而unioffset是整数值。
另外,可以对于跳过或直接编码的块,从相邻块继承标志及指标。
应当理解,本领域的普通技术人员可以将所描述的实施例中的一些组合成一个实施例。
在一些实施例中,还提供了包括指令的非瞬时性计算机可读存储介质,并且指令可以由设备(诸如所公开的编码器和解码器)执行,以用于执行上述方法。非瞬时性介质的常见形式包括例如软盘、柔性盘、硬盘、固态驱动器、磁带或任何其他磁性数据存储介质、CD-ROM、任何其他光学数据存储介质、具有孔图案的任何物理介质、RAM、PROM和EPROM、FLASH-EPROM或任何其他闪存、NVRAM、高速缓存、寄存器、任何其他存储器芯片或盒和它们的联网版本。该设备可以包括一个或多个处理器(CPU)、输入/输出接口、网络接口和/或存储器。
应当注意,这里的关系术语,诸如“第一”和“第二”,仅用于将实体或操作与另一实体或操作区分开,而不要求或暗示这样的实体或操作之间的任何实际关系或顺序。此外,词语“包括(comprising)”、“具有(having)”、“含有(containing)”和“包括(including)”和其他类似形式在含义上是等同的并且是开放式的,因为在这样的词语中的任一个之后的一个或多个项目不意味着是这一个或多个项目的穷举列表,或者意味着仅限于所列出的一个或多个项目。
除非另有说明,否则本文所用术语“或”包括所有可能的组合,除非是不可行的。例如,如果陈述数据库可以包括A或B,则除非另外特别陈述或不可行,否则数据库可以包括A或B,或A和B。作为第二个示例,如果陈述数据库可以包括A、B或C,则除非另外特别陈述或不可行,否则数据库可以包括A、或B、或C、或A和B、或A和C、或B和C、或A和B和C。
应当理解,上述实施例可以由硬件、或软件(程序代码)、或硬件和软件的组合来实施。如果由软件实施,则它可以被存储在上述计算机可读介质中。当由处理器执行时,软件可以执行所公开的方法。本公开中描述的计算单元和其他功能单元可以由硬件、或软件、或硬件和软件的组合来实施。本领域的普通技术人员还将理解,上述模块/单元中的多个可以被组合为一个模块/单元,并且上述模块/单元中的每一个可以被进一步划分成多个子模块/子单元。
所公开的实施例还可以使用以下条款来描述:
1.一种视频解码方法,包括:
从比特流解码获得用于编码单元的第一参数,并基于第一参数确定用于编码单元的候选;
基于与候选相关联的第二参数的值确定与编码单元相关联的第二参数的值,其中第二参数指示双向预测校正是否被启用;以及
响应于与编码单元相关联的第二参数的值指示双向预测校正被启用,对编码单元执行双向预测校正。
2.根据条款1所述的方法,还包括:
确定与编码单元相关联的第二参数的值等于与候选相关联的第二参数的值。
3.根据条款1所述的方法,还包括:
基于与候选相关联的第三参数的值确定与编码单元相关联的第三参数的值,其中第三参数指示执行双向预测校正方法中的一种。
4.根据条款1至3中任一条款所述的方法,其中候选是TMVP、SMVP、MVAP、HMVP、UMVE、InterPF、仿射继承、仿射构建或零仿射候选中的一个。
5.根据条款1和4中任一条款所述的方法,其中候选是TMVP、MVAP或零仿射候选,基于与候选相关联的第二参数的值确定与编码单元相关联的第二参数的值还包括:
将与编码单元相关联的第二参数的值设置为禁用,并且禁用编码单元的双向预测校正。
6.根据条款1和4中任一条款所述的方法,其中候选是仿射构建候选,基于与候选相关联的第二参数的值确定与编码单元相关联的第二参数的值还包括:
确定用于编码单元的多个控制点,其中多个控制点包括至少第一控制点;
确定与编码单元相关联的第二参数的值和第三参数的值分别等于与第一控制点相关联的第二参数的值和第三参数的值。
7.根据条款1至6中任一条款所述的方法,其中第二参数是标志,并且第三参数是指标。
8.一种视频解码方法,包括:
基于与亮度编码单元相关联的第四参数的值确定与色度编码单元相关联的第四参数的值,其中第四参数指示双向预测校正是否被启用;以及
响应于与色度编码单元相关联的第四参数的值指示双向预测校正被启用,对色度编码单元执行双向预测校正。
9.根据条款8所述的方法,其中
亮度编码单元是色度编码单元的共置块。
10.根据条款8所述的方法,还包括:
基于与亮度编码单元相关联的第五参数的值,确定与色度编码单元相关联的第五参数的值,其中第五参数指示对色度编码单元执行双向预测校正方法中的一种。
11.根据条款8至10中任一条款所述的方法,其中:
从比特流解码获得与亮度编码单元相关联的第四参数和第五参数。
12.根据条款8至10中任一条款所述的方法,其中:
从由从比特流解码获得的第六参数确定的候选继承与亮度编码单元相关联的第四参数和第五参数。
13.一种视频解码方法,包括:
确定与满足多个条件的编码单元相关联的第七参数的值,其中第七参数指示双向预测校正是否被启用;以及
响应于与编码单元相关联的第七参数的值指示双向预测校正被启用,对编码单元执行双向预测校正。
14.根据条款13所述的方法,其中多个条件包括:
确定编码单元的两个参考图片列表;
确定两个参考图片列表中的参考图片是否按显示次序位于与编码单元相关联的当前图片之前;以及
响应于两个参考图片列表中的参考图片按显示次序位于与编码单元相关联的当前图片之前,确定编码单元满足多个条件。
15.根据条款13所述的方法,还包括:
确定与编码单元相关联的第八参数的值,其中第八参数指示对编码单元执行双向预测校正方法中的一种。
16.根据条款13所述的方法,还包括:
获得编码单元的第一预测与第二预测,其中使用编码单元的运动来预测第一预测和第二预测;
通过将校正强度因子施加于第一预测和第二预测之间的差来确定第三预测;以及
通过对第一预测和第二预测计算平均并加上第三预测,使用该第一预测、第二预测和第三预测来对编码单元进行解码。
17.根据条款16所述的方法,其中第一预测与第二预测之间的差是以下中的一个:
第一预测与第二预测之间的差值等于第一预测减去第二预测;或
第一预测与第二预测之间的差值等于第二预测减去第一预测。
18.根据条款16所述的方法,其中校正强度因子是1/8。
19.一种视频编码方法,包括:
确定用于编码单元的候选;
基于与候选相关联的第二参数的值确定与编码单元相关联的第二参数的值,其中第二参数指示双向预测校正是否被启用;
响应于与编码单元相关联的第二参数的值指示双向预测校正被启用,使用双向预测校正对编码单元进行编码;以及
将与候选相关联的第一参数编码到比特流。
20.根据条款19所述的方法,还包括:
确定与编码单元相关联的第二参数的值等于与候选相关联的第二参数的值。
21.根据条款19所述的方法,还包括:
基于与候选相关联的第三参数的值确定与编码单元相关联的第三参数的值,其中第三参数指示执行双向预测校正方法中的一种。
22.根据条款19至21中任一条款所述的方法,其中候选是TMVP、SMVP、MVAP、HMVP、UMVE、InterPF、仿射继承、仿射构建或零仿射候选中的一个。
23.根据条款22所述的方法,其中,候选是TMVP、MVAP或零仿射候选,基于与候选相关联的第二参数的值确定与编码单元相关联的第二参数的值还包括:
将与编码单元相关联的第二参数的值设置为禁用,并且对于该编码单元禁用双向预测校正。
24.根据条款19和22中任一条款所述的方法,其中,候选是仿射构建候选,基于与候选相关联的第二参数的值确定与编码单元相关联的第二参数的值还包括:
确定用于编码单元的多个控制点,其中多个控制点包括至少第一控制点;
确定与编码单元相关联的第二参数的值和第三参数的值分别等于与第一控制点相关联的第二参数的值和第三参数的值。
25.根据条款19至24中任一条款所述的方法,其中第二参数是标志,并且第三参数是指标。
26.一种视频编码方法,包括:
基于与亮度编码单元相关联的第四参数的值确定与色度编码单元相关联的第四参数的值,其中第四参数指示双向预测校正是否被启用;
响应于与色度编码单元相关联的第四参数的值指示双向预测校正被启用,对色度编码单元执行双向预测校正。
27.根据条款26所述的方法,其中,
亮度编码单元是色度编码单元的共置块。
28.根据条款26所述的方法,还包括:
基于与亮度编码单元相关联的第五参数的值,确定与色度编码单元相关联的第五参数的值,其中第五参数指示对色度编码单元执行双向预测校正方法中的一种。
29.根据条款26至28中任一条款所述的方法,其中
将与亮度编码单元相关联的第四参数和第五参数编码到比特流。
30.根据条款26至28中任一条款所述的方法,还包括:
确定用于亮度编码单元的候选;
将与亮度编码单元相关联的第四参数和第五参数继承给候选,以及
将与候选相关联的第六参数编码到比特流。
31.一种视频编码方法,包括:
确定与满足多个条件的编码单元相关联的第七参数的值,其中第七参数指示双向预测校正是否被启用;
响应于与编码单元相关联的第七参数的值指示双向预测校正被启用,对编码单元执行双向预测校正。
32.根据条款31所述的方法,其中多个条件包括:
确定编码单元的两个参考图片列表;
确定两个参考图片列表中的所有参考图片是否按显示次序位于与编码单元相关联的当前图片之前;以及
响应于两个参考图片列表中的所有参考图片按显示次序位于与编码单元相关联的当前图片之前,确定编码单元满足多个条件。
33.根据条款31所述的方法,还包括:
确定与编码单元相关联的第八参数的值,其中第八参数指示对编码单元执行双向预测校正方法中的一种。
34.一种视频处理设备,包括:存储指令集的存储器;和
一个或多个处理器,一个或多个处理器被配置为执行指令集以使设备执行:
从比特流解码获得用于编码单元的第一参数,并基于第一参数确定用于编码单元的候选;
基于与候选相关联的第二参数的值确定与编码单元相关联的第二参数的值,其中第二参数指示双向预测校正是否被启用;以及
响应于与编码单元相关联的第二参数的值指示双向预测校正被启用,对编码单元执行双向预测校正。
35.根据条款34所述的设备,其中一个或多个处理器被配置为执行指令集以使设备进一步执行:
确定与编码单元相关联的第二参数的值等于与候选相关联的第二参数的值。
36.根据条款34所述的设备,其中一个或多个处理器被配置为执行指令集以使装置进一步执行:
基于与候选相关联的第三参数的值确定与编码单元相关联的第三参数的值,其中第三参数指示执行双向预测校正方法中的一种。
37.根据条款34至36中任一条款所述的设备,其中候选是TMVP、SMVP、MVAP、HMVP、UMVE、InterPF、仿射继承、仿射构建或零仿射候选中的一个。
38.根据条款34和37中任一条款所述的设备,其中候选是TMVP、MVAP或零仿射候选,基于与候选相关联的第二参数的值确定与编码单元相关联的第二参数的值还包括:
将与编码单元相关联的第二参数的值设置为禁用,并且对于该编码单元禁用双向预测校正。
39.根据条款34和37中任一条款所述的设备,其中候选是仿射构建候选,基于与候选相关联的第二参数的值确定与编码单元相关联的第二参数的值还包括:
确定用于编码单元的多个控制点,其中多个控制点包括至少第一控制点;
确定与编码单元相关联的第二参数的值和第三参数的值分别等于与第一控制点相关联的第二参数的值和第三参数的值。
40.根据条款34至39中任一条款所述的设备,其中第二参数是标志,并且第三参数是指标。
41.一种视频解码设备,包括:
存储指令集的存储器;和
一个或多个处理器,一个或多个处理器被配置为执行指令集以使设备执行:
基于与亮度编码单元相关联的第四参数的值确定与色度编码单元相关联的第四参数的值,其中第四参数指示双向预测校正是否被启用;
响应于与色度编码单元相关联的第四参数的值指示双向预测校正被启用,对色度编码单元执行双向预测校正。
42.根据条款41所述的设备,其中
亮度编码单元是色度编码单元的共置块。
43.根据条款41所述的设备,其中一个或多个处理器被配置为执行指令集以使设备进一步执行:
基于与亮度编码单元相关联的第五参数的值,确定与色度编码单元相关联的第五参数的值,其中第五参数指示对色度编码单元执行双向预测校正方法中的一种。
44.根据条款41至43中任一条款所述的设备,其中:
从比特流解码获得与亮度编码单元相关联的第四参数和第五参数。
45.根据条款41至43中任一条款所述的设备,其中:
从由从比特流解码获得的第六参数确定的候选继承与亮度编码单元相关联的第四参数和第五参数。
46.一种视频解码设备,包括:
存储指令集的存储器;和
一个或多个处理器,一个或多个处理器被配置为执行指令集以使设备执行:
确定与满足多个条件的编码单元相关联的第七参数的值,其中第七参数指示双向预测校正是否被启用;
响应于与编码单元相关联的第七参数的值指示双向预测校正被启用,对编码单元执行双向预测校正。
47.根据条款46所述的设备,其中多个条件包括:
确定编码单元的两个参考图片列表;
确定两个参考图片列表中的参考图片是否按显示次序位于与编码单元相关联的当前图片之前;以及
响应于两个参考图片列表中的参考图片按显示次序位于与编码单元相关联的当前图片之前,确定编码单元满足多个条件。
48.根据条款46所述的设备,其中一个或多个处理器被配置为执行指令集以使设备进一步执行:
确定与编码单元相关联的第八参数的值,其中第八参数指示对编码单元执行双向预测校正方法中的一种。
49.根据条款46所述的设备,其中一个或多个处理器被配置为执行指令集以使设备进一步执行:
获得编码单元的第一预测与第二预测,其中使用编码单元的运动来预测第一预测和第二预测;
通过将校正强度因子应用于第一预测和第二预测之间的差来确定第三预测;以及
通过对第一预测和第二预测进行平均计算并再与第三预测相加,来使用第一预测、第二预测和第三预测对编码单元进行解码。
50.根据权利要求49所述的设备,其中第一预测与第二预测之间的差是以下中的一个:
第一预测与第二预测之间的差值等于第一预测减去第二预测;或
第一预测与第二预测之间的差值等于第二预测减去第一预测。
51.根据条款49所述的设备,其中校正强度因子是1/8。
52.一种视频编码设备,包括:
存储指令集的存储器;和
一个或多个处理器,一个或多个处理器被配置为执行指令集以使设备执行:
确定用于编码单元的候选;
基于与候选相关联的第二参数的值确定与编码单元相关联的第二参数的值,其中第二参数指示双向预测校正是否被启用;
响应于与编码单元相关联的第二参数的值指示双向预测校正被启用,使用双向预测校正对编码单元进行编码;以及
将与候选相关联的第一参数编码到比特流。
53.根据条款52所述的设备,其中一个或多个处理器被配置为执行指令集以使设备进一步执行:
确定与编码单元相关联的第二参数的值等于与候选相关联的第二参数的值。
54.根据条款52所述的设备,其中一个或多个处理器被配置为执行指令集以使设备进一步执行:
基于与候选相关联的第三参数的值确定与编码单元相关联的第三参数的值,其中第三参数指示执行双向预测校正方法中的一种。
55.根据条款52至54中任一条款所述的设备,其中候选是TMVP、SMVP、MVAP、HMVP、UMVE、InterPF、仿射继承、仿射构建或零仿射候选中的一个。
56.根据条款55所述的设备,其中候选是TMVP、MVAP或零仿射候选,基于与候选相关联的第二参数的值确定与编码单元相关联的第二参数的值还包括:
将与编码单元相关联的第二参数的值设置为禁用,并且对于编码单元禁用双向预测校正。
57.根据条款52和55中任一条款所述的设备,其中候选是仿射构建候选,基于与候选相关联的第二参数的值确定与编码单元相关联的第二参数的值还包括:
确定用于编码单元的多个控制点,其中多个控制点包括至少第一控制点;
确定与编码单元相关联的第二参数的值和第三参数的值分别等于与第一控制点相关联的第二参数的值和第三参数的值。
58.根据条款52至57中任一条款所述的设备,其中第二参数是标志,并且第三参数是指标。
59.一种视频编码装置,包括:
存储指令集的存储器;和
一个或多个处理器,一个或多个处理器被配置为执行指令集以使设备执行:
基于与亮度编码单元相关联的第四参数的值确定与色度编码单元相关联的第四参数的值,其中第四参数指示双向预测校正是否被启用;
响应于与色度编码单元相关联的第四参数的值指示双向预测校正被启用,对色度编码单元执行双向预测校正。
60.根据条款59所述的设备,其中
亮度编码单元是色度编码单元的共置块。
61.根据条款59所述的设备,其中一个或多个处理器被配置为执行指令集以使设备进一步执行:
基于与亮度编码单元相关联的第五参数的值,确定与色度编码单元相关联的第五参数的值,其中第五参数指示对色度编码单元执行双向预测校正方法中的一种。
62.根据条款59至61中任一条款所述的设备,其中
将与亮度编码单元相关联的第四参数和第五参数编码到比特流。
63.根据条款59至61中任一条款所述的设备,其中一个或多个处理器被配置为执行指令集以使设备进一步执行:
确定用于亮度编码单元的候选;
将与亮度编码单元相关联的第四参数和第五参数继承给候选,以及
将与候选相关联的第六参数编码到比特流。
64.一种视频编码设备,包括:
确定与满足多个条件的编码单元相关联的第七参数的值,其中第七参数指示双向预测校正是否被启用;以及
响应于与编码单元相关联的第七参数的值指示双向预测校正被启用,对编码单元执行双向预测校正。
65.根据条款64所述的设备,其中多个条件包括:
确定编码单元的两个参考图片列表;
确定两个参考图片列表中的所有参考图片是否按显示次序位于与编码单元相关联的当前图片之前;以及
响应于两个参考图片列表中的所有参考图片按显示次序位于与编码单元相关联的当前图片之前,确定编码单元满足多个条件。
66.根据条款64所述的设备,其中一个或多个处理器被配置为执行指令集以使设备进一步执行:
确定与编码单元相关联的第八参数的值,其中第八参数指示对编码单元执行双向预测校正方法中的一种。
67.一种非瞬时性计算机可读介质,所述非瞬时性计算机可读介质存储有指令集,该指令集可由计算机的至少一个处理器执行以使计算机执行视频解码方法,方法包括:
从比特流解码获得用于编码单元的第一参数,并基于第一参数确定用于编码单元的候选;
基于与候选相关联的第二参数的值确定与编码单元相关联的第二参数的值,其中第二参数指示双向预测校正是否被启用;以及
响应于与编码单元相关联的第二参数的值指示双向预测校正被启用,对编码单元执行双向预测校正。
68.根据条款67所述的非瞬时性计算机可读介质,其中至少一个处理器被配置为执行指令集以使计算机进一步执行:
确定与编码单元相关联的第二参数的值等于与候选相关联的第二参数的值。
69.根据条款67所述的非瞬时性计算机可读介质,其中至少一个处理器被配置为执行指令集以使计算机进一步执行:
基于与候选相关联的第三参数的值确定与编码单元相关联的第三参数的值,其中第三参数指示执行双向预测校正方法中的一种。
70.根据权利要求67至69中任一项所述的非瞬时性计算机可读介质,其中候选是TMVP、SMVP、MVAP、HMVP、UMVE、InterPF、仿射继承、仿射构建或零仿射候选中的一个。
71.根据条款67和70中任一条款所述的非瞬时性计算机可读介质,其中候选是TMVP、MVAP或零仿射候选,基于与候选相关联的第二参数的值确定与编码单元相关联的第二参数的值还包括:
将与编码单元相关联的第二参数的值设置为禁用,并且对于编码单元禁用双向预测校正。
72.根据条款67和70中任一条款所述的非瞬时性计算机可读介质,其中候选是仿射构建候选,基于与候选相关联的第二参数的值确定与编码单元相关联的第二参数的值还包括:
确定用于编码单元的多个控制点,其中多个控制点包括至少第一控制点;
确定与编码单元相关联的第二参数的值和第三参数的值分别等于与第一控制点相关联的第二参数的值和第三参数的值。
73.根据条款67至72中任一条款的非瞬时性计算机可读介质,其中第二参数是标志,并且第三参数是指标。
74.一种非瞬时性计算机可读介质,该非瞬时性计算机可读介质存储有指令集,该指令集可由计算机的至少一个处理器执行以使计算机执行视频解码方法,方法包括:
基于与亮度编码单元相关联的第四参数的值确定与色度编码单元相关联的第四参数的值,其中第四参数指示双向预测校正是否被启用;以及
响应于与色度编码单元相关联的第四参数的值指示双向预测校正被启用,对色度编码单元执行双向预测校正。
75.根据条款74所述的非瞬时性计算机可读介质,其中
亮度编码单元是色度编码单元的共置块。
76.根据条款74所述的非瞬时性计算机可读介质,还包括:
基于与亮度编码单元相关联的第五参数的值,确定与色度编码单元相关联的第五参数的值,其中第五参数指示对色度编码单元执行双向预测校正方法中的一种。
77.根据条款74至76中任一条款所述的非瞬时性计算机可读介质,其中:
从比特流解码获得与亮度编码单元相关联的第四参数和第五参数。
78.根据条款74至76中任一条款所述的非瞬时性计算机可读介质,其中:
从由从比特流解码获得的第六参数确定的候选继承与亮度编码单元相关联的第四参数和第五参数。
79.一种非瞬时性计算机可读介质,该非瞬时性计算机可读介质存储有指令集,该指令集可由计算机的至少一个处理器执行以使计算机执行视频解码方法,方法包括:
确定与满足多个条件的编码单元相关联的第七参数的值,其中第七参数指示双向预测校正是否被启用;以及
响应于与编码单元相关联的第七参数的值指示双向预测校正被启用,对编码单元执行双向预测校正。
80.根据条款79所述的非瞬时性计算机可读介质,其中多个条件包括:
确定编码单元的两个参考图片列表;
确定两个参考图片列表中的参考图片是否按显示次序位于与编码单元相关联的当前图片之前;以及
响应于两个参考图片列表中的参考图片按显示次序位于与编码单元相关联的当前图片之前,确定编码单元满足多个条件。
81.根据条款79所述的非瞬时性计算机可读介质,还包括:
确定与编码单元相关联的第八参数的值,其中第八参数指示对编码单元执行双向预测校正方法中的一种。
82.根据条款79所述的非瞬时性计算机可读介质,还包括:
获得编码单元的第一预测与第二预测,其中使用编码单元的运动来预测第一预测和第二预测;
通过将校正强度因子应用于第一预测和第二预测之间的差来确定第三预测;以及
通过对第一预测和第二预测进行平均计算并与第三预测相加,来使用第一预测、第二预测和第三预测对编码单元进行解码。
83.根据条款82所述的非瞬时性计算机可读介质,其中第一预测和第二预测之间的差是以下中的一个:
第一预测与第二预测之间的差值等于第一预测减去第二预测;或
第一预测与第二预测之间的差值等于第二预测减去第一预测。
84.根据条款82所述的非瞬时性计算机可读介质,其中校正强度因子是1/8。
85.一种非瞬时性计算机可读介质,该非瞬时性计算机可读介质存储有指令集,该指令集可由计算机的至少一个处理器执行以使计算机执行视频编码方法,方法包括:
确定用于编码单元的候选;
基于与候选相关联的第二参数的值确定与编码单元相关联的第二参数的值,其中第二参数指示双向预测校正是否被启用;
响应于与编码单元相关联的第二参数的值指示双向预测校正被启用,用双向预测校正对编码单元进行编码;以及
将与候选相关联的第一参数编码到比特流。
86.根据条款85所述的非瞬时性计算机可读介质,还包括:
确定与编码单元相关联的第二参数的值等于与候选相关联的第二参数的值。
87.根据条款85所述的非瞬时性计算机可读介质,其中至少一个处理器被配置为执行指令集以使计算机进一步执行:
基于与候选相关联的第三参数的值确定与编码单元相关联的第三参数的值,其中第三参数指示执行双向预测校正方法中的一种。
88.根据条款85至87中任一条款所述的非瞬时性计算机可读介质,其中候选是TMVP、SMVP、MVAP、HMVP、UMVE、InterPF、仿射继承、仿射构建或零仿射候选中的一个。
89.根据条款88所述的非瞬时性计算机可读介质,其中候选为TMVP、MVAP或零仿射候选,基于与候选相关联的第二参数的值确定与编码单元相关联的第二参数的值还包括:
将与编码单元相关联的第二参数的值设置为禁用,并且对于编码单元禁用双向预测校正。
90.根据条款85和88中任一条款所述的非瞬时性计算机可读介质,其中候选是仿射构建候选,基于与候选相关联的第二参数的值确定与编码单元相关联的第二参数的值还包括:
确定用于编码单元的多个控制点,其中多个控制点包括至少第一控制点;
确定与编码单元相关联的第二参数的值和第三参数的值分别等于与第一控制点相关联的第二参数的值和第三参数的值。
91.根据条款85至90中任一条款所述的非瞬时性计算机可读介质,其中第二参数是标志,并且第三参数是指标。
92.一种非瞬时性计算机可读介质,该非瞬时性计算机可读介质存储有指令集,该指令集可由计算机的至少一个处理器执行以使计算机执行视频编码方法,方法包括:
基于与亮度编码单元相关联的第四参数的值确定与色度编码单元相关联的第四参数的值,其中第四参数指示双向预测校正是否被启用;
响应于与色度编码单元相关联的第四参数的值指示双向预测校正被启用,对色度编码单元执行双向预测校正。
93.根据条款92所述的非瞬时性计算机可读介质,其中
亮度编码单元是色度编码单元的共置块。
94.根据条款92所述的非瞬时性计算机可读介质,还包括:
基于与亮度编码单元相关联的第五参数的值,确定与色度编码单元相关联的第五参数的值,其中第五参数指示对色度编码单元执行双向预测校正方法中的一种。
95.根据条款92至94中任一条款所述的非瞬时性计算机可读介质,其中
与亮度编码单元相关联的第四参数和第五参数被编码到比特流。
96.根据条款92至94中任一条款的非瞬时性计算机可读介质,还包括:
确定用于亮度编码单元的候选;
将与亮度编码单元相关联的第四参数和第五参数继承给候选,以及
将与候选相关联的第六参数编码到比特流。
97.一种非瞬时性计算机可读介质,该非瞬时性计算机可读介质存储有指令集,该指令集可由计算机的至少一个处理器执行以使计算机执行视频解码方法,方法包括:
确定与满足多个条件的编码单元相关联的第七参数的值,其中第七参数指示双向预测校正是否被启用;
响应于与编码单元相关联的第七参数的值指示双向预测校正被启用,对编码单元执行双向预测校正。
98.根据条款97所述的非瞬时性计算机可读介质,其中多个条件包括:
确定编码单元的两个参考图片列表;
确定两个参考图片列表中的所有参考图片是否按显示次序位于与编码单元相关联的当前图片之前;以及
响应于两个参考图片列表中的所有参考图片按显示次序位于与编码单元相关联的当前图片之前,确定编码单元满足多个条件。
99.根据条款97所述的非瞬时性计算机可读介质,还包括:
确定与编码单元相关联的第八参数的值,其中第八参数指示对编码单元执行双向预测校正方法中的一种。
在前述说明书中,已经参考可以随实现方式而变化的许多具体细节描述了实施例。可以对所描述的实施例进行某些调整和修改。考虑到本文公开的本公开的说明书和实践,其他实施例对于本领域技术人员来说是显而易见的。说明书和实施例仅是示例性的,本公开的真实范围和精神由所附权利要求书限定。还意图是,图中所示的步骤的顺序仅用于说明性目的,并且不意图限于任何特定的步骤顺序。因此,本领域技术人员可以理解,在实现相同方法时,这样的步骤可以以不同的顺序执行。
在附图和说明书中,已经公开了示例性实施例。然而,可以对这样的实施例进行许多变化和修改。因此,尽管采用了特定术语,但是它们仅在一般和描述性意义上使用,而不是为了限制的目的。

Claims (99)

1.一种视频解码方法,包括:
从比特流解码用于编码单元的第一参数,
基于所述第一参数确定用于所述编码单元的候选;
基于与所述候选相关联的第二参数的值确定与所述编码单元相关联的第二参数的值,其中与所述编码单元相关联的所述第二参数指示双向预测校正是否被启用;以及
响应于与所述编码单元相关联的所述第二参数的值指示所述双向预测校正被启用,对所述编码单元执行所述双向预测校正。
2.根据权利要求1所述的方法,还包括:
确定与所述编码单元相关联的所述第二参数的值等于与所述候选相关联的所述第二参数的值。
3.根据权利要求1所述的方法,还包括:
基于与所述候选相关联的第三参数的值确定与所述编码单元相关联的第三参数的值,其中与所述编码单元相关联的所述第三参数指示执行双向预测校正方法中的一种。
4.根据权利要求1至3中任一项所述的方法,其中所述候选是TMVP、SMVP、MVAP、HMVP、UMVE、InterPF、仿射继承的候选、仿射构建的候选或零仿射候选中的一个。
5.根据权利要求1和4中任一项所述的方法,其中所述候选是TMVP、MVAP或零仿射候选,并且其中基于与所述候选相关联的所述第二参数的值确定与所述编码单元相关联的所述第二参数的值还包括:
将与所述编码单元相关联的所述第二参数的值设置为禁用,以及
对于所述编码单元禁用所述双向预测校正。
6.根据权利要求1和4中任一项所述的方法,其中所述候选是仿射构建候选,并且其中基于与所述候选相关联的所述第二参数的值确定与所述编码单元相关联的所述第二参数的值还包括:
确定用于所述编码单元的多个控制点,其中所述多个控制点包括至少第一控制点;
确定与所述编码单元相关联的所述第二参数的值和所述第三参数的值分别等于与所述第一控制点相关联的第二参数的值和第三参数的值。
7.根据权利要求1至6中任一项所述的方法,其中与所述编码单元相关联的所述第二参数是标志,并且与所述编码单元相关联的第三参数是指标。
8.一种视频解码方法,包括:
基于与亮度编码单元相关联的第一参数的值确定与色度编码单元相关联的第一参数的值,其中与所述色度编码单元相关联的所述第一参数指示双向预测校正是否被启用;以及
响应于与所述色度编码单元相关联的所述第一参数的值指示所述双向预测校正被启用,对所述色度编码单元执行所述双向预测校正。
9.根据权利要求8所述的方法,其中
所述亮度编码单元是所述色度编码单元的共置块。
10.根据权利要求8所述的方法,还包括:
基于与所述亮度编码单元相关联的第二参数的值确定与所述色度编码单元相关联的第二参数的值,其中与所述色度编码单元相关联的所述第二参数指示对所述色度编码单元执行双向预测校正方法中的一种。
11.根据权利要求8至10中任一项所述的方法,其中:
从比特流解码获得与所述亮度编码单元相关联的所述第一参数和所述第二参数。
12.根据权利要求8至10中任一项所述的方法,其中:
从由从比特流解码获得的第三参数确定的候选继承与所述亮度编码单元相关联的所述第一参数和所述第二参数。
13.一种视频解码方法,包括:
确定与满足多个条件的编码单元相关联的第一参数的值,其中与所述编码单元相关联的所述第一参数指示双向预测校正是否被启用;以及
响应于与所述编码单元相关联的所述第一参数的值指示所述双向预测校正被启用,对所述编码单元执行所述双向预测校正。
14.根据权利要求13所述的方法,其中所述多个条件包括:
确定所述编码单元的两个参考图片列表;
确定所述两个参考图片列表中的参考图片是否按显示次序位于与所述编码单元相关联的当前图片之前;以及
响应于所述两个参考图片列表中的所述参考图片按所述显示次序位于与所述编码单元相关联的所述当前图片之前,确定所述编码单元满足所述多个条件。
15.根据权利要求13所述的方法,还包括:
确定与所述编码单元相关联的第二参数的值,其中与所述编码单元相关联的所述第二参数指示对所述编码单元执行双向预测校正方法中的一种。
16.根据权利要求13所述的方法,还包括:
获得用于所述编码单元的第一预测与第二预测,其中使用所述编码单元的运动来预测所述第一预测和所述第二预测;
通过将校正强度因子应用于所述第一预测与所述第二预测之间的差来确定第三预测;以及
通过对所述第一预测和所述第二预测进行平均计算并与所述第三预测相加,来使用所述第一预测、所述第二预测和所述第三预测对所述编码单元进行解码。
17.根据权利要求16所述的方法,其中所述第一预测与所述第二预测之间的差是以下中的一个:
所述第一预测与所述第二预测之间的差值等于所述第一预测减去所述第二预测;或者
所述第一预测与所述第二预测之间的差值等于所述第二预测减去所述第一预测。
18.根据权利要求16所述的方法,其中所述校正强度因子是1/8。
19.一种视频编码方法,包括:
确定用于编码单元的候选;
基于与所述候选相关联的第二参数的值确定与所述编码单元相关联的第二参数的值,其中与所述编码单元相关联的所述第二参数指示双向预测校正是否被启用;
响应于与所述编码单元相关联的所述第二参数的值指示所述双向预测校正被启用,使用所述双向预测校正对所述编码单元进行编码;以及
将与所述候选相关联的第一参数编码到比特流。
20.根据权利要求19所述的方法,还包括:
确定与所述编码单元相关联的所述第二参数的值等于与所述候选相关联的所述第二参数的值。
21.根据权利要求19所述的方法,还包括:
基于与所述候选相关联的第三参数的值确定与所述编码单元相关联的第三参数的值,其中与所述编码单元相关联的所述第三参数指示执行双向预测校正方法中的一种。
22.根据权利要求19至21中任一项所述的方法,其中所述候选是TMVP、SMVP、MVAP、HMVP、UMVE、InterPF、仿射继承候选、仿射构建候选或零仿射候选中的一个。
23.根据权利要求22所述的方法,其中所述候选是TMVP、MVAP或零仿射候选,基于与所述候选相关联的所述第二参数的值确定与所述编码单元相关联的所述第二参数的值还包括:
将与所述编码单元相关联的所述第二参数的值设置为禁用,并且对于所述编码单元禁用所述双向预测校正。
24.根据权利要求19和22中任一项所述的方法,其中所述候选是仿射构建候选,基于与所述候选相关联的所述第二参数的值确定与所述编码单元相关联的所述第二参数的值还包括:
确定用于所述编码单元的多个控制点,其中所述多个控制点至少包括第一控制点;
确定与所述编码单元相关联的所述第二参数的值和所述第三参数的值分别等于与所述第一控制点相关联的第二参数的值和第三参数的值。
25.根据权利要求19至24中任一项所述的方法,其中与所述编码单元相关联的所述第二参数是标志,并且与所述编码单元相关联的所述第三参数是指标。
26.一种视频编码方法,包括:
基于与亮度编码单元相关联的第一参数的值确定与色度编码单元相关联的第一参数的值,其中与所述色度编码单元相关联的所述第一参数指示双向预测校正是否被启用;
响应于与所述色度编码单元相关联的所述第一参数的值指示所述双向预测校正被启用,对所述色度编码单元执行所述双向预测校正。
27.根据权利要求26所述的方法,其中
所述亮度编码单元是所述色度编码单元的共置块。
28.根据权利要求26所述的方法,还包括:
基于与所述亮度编码单元相关联的第二参数的值确定与所述色度编码单元相关联的第二参数的值,其中与所述色度编码单元相关联的所述第二参数指示对所述色度编码单元执行双向预测校正方法中的一种。
29.根据权利要求26至28中任一项所述的方法,其中:
与所述亮度编码单元相关联的所述第一参数和所述第二参数被编码到比特流。
30.根据权利要求26至28中任一项所述的方法,还包括:
确定用于所述亮度编码单元的候选;
将与所述亮度编码单元相关联的所述第一参数和所述第二参数继承给所述候选,以及
将与所述候选相关联的第三参数编码到比特流。
31.一种视频编码方法,包括:
确定与满足多个条件的编码单元相关联的第一参数的值,其中所述第一参数指示双向预测校正是否被启用;以及
响应于与所述编码单元相关联的所述第一参数的值指示所述双向预测校正被启用,对所述编码单元执行所述双向预测校正。
32.根据权利要求31所述的方法,其中所述多个条件包括:
确定所述编码单元的两个参考图片列表;
确定所述两个参考图片列表中的所有参考图片是否按显示次序位于与所述编码单元相关联的当前图片之前;以及
响应于所述两个参考图片列表中的所有所述参考图片按显示次序位于与所述编码单元相关联的所述当前图片之前,确定所述编码单元满足所述多个条件。
33.根据权利要求31所述的方法,还包括:
确定与所述编码单元相关联的第二参数的值,其中所述第二参数指示对所述编码单元执行双向预测校正方法中的一种。
34.一种视频处理设备,包括存储指令集的存储器;和
一个或多个处理器,所述一个或多个处理器被配置为执行所述指令集以使所述设备执行:
从比特流解码获得用于编码单元的第一参数,并基于所述第一参数确定用于所述编码单元的候选;
基于与所述候选相关联的第二参数的值确定与所述编码单元相关联的第二参数的值,其中与所述编码单元相关联的所述第二参数指示双向预测校正是否被启用;以及
响应于与所述编码单元相关联的所述第二参数的值指示所述双向预测校正被启用,对所述编码单元执行所述双向预测校正。
35.根据权利要求34所述的设备,其中所述一个或多个处理器被配置为执行所述指令集以使所述设备进一步执行:
确定与所述编码单元相关联的所述第二参数的值等于与所述候选相关联的所述第二参数的值。
36.根据权利要求34所述的设备,其中所述一个或多个处理器被配置为执行所述指令集以使所述设备进一步执行:
基于与所述候选相关联的第三参数的值确定与所述编码单元相关联的第三参数的值,其中与所述编码单元相关联的所述第三参数指示执行双向预测校正方法中的一种。
37.根据权利要求34至36中任一项所述的设备,其中所述候选是TMVP、SMVP、MVAP、HMVP、UMVE、InterPF、仿射继承候选、仿射构建候选或零仿射候选中的一个。
38.根据权利要求34和37中任一项所述的设备,其中所述候选是TMVP、MVAP或零仿射候选,基于与所述候选相关联的所述第二参数的值确定与所述编码单元相关联的所述第二参数的值还包括:
将与所述编码单元相关联的所述第二参数的值设置为禁用,并且对于所述编码单元禁用所述双向预测校正。
39.根据权利要求34和37中任一项所述的设备,其中所述候选是仿射构建候选,基于与所述候选相关联的所述第二参数的值确定与所述编码单元相关联的所述第二参数的值还包括:
确定用于所述编码单元的多个控制点,其中所述多个控制点至少包括第一控制点;
确定与所述编码单元相关联的所述第二参数的值和所述第三参数的值分别等于与所述第一控制点相关联的第二参数的值和第三参数的值。
40.根据权利要求34至39中任一项所述的设备,其中与所述编码单元相关联的所述第二参数是标志,并且与所述编码单元相关联的第三参数是指标。
41.一种视频解码设备,包括:
存储指令集的存储器;和
一个或多个处理器,所述一个或多个处理器被配置为执行所述指令集以使所述设备执行:
基于与亮度编码单元相关联的第一参数的值确定与色度编码单元相关联的第一参数的值,其中与所述色度编码单元相关联的所述第一参数指示双向预测校正是否被启用;以及
响应于与所述色度编码单元相关联的所述第一参数的值指示所述双向预测校正被启用,对所述色度编码单元执行所述双向预测校正。
42.根据权利要求41所述的设备,其中
所述亮度编码单元是所述色度编码单元的共置块。
43.根据权利要求41所述的设备,其中所述一个或多个处理器被配置为执行所述指令集以使所述设备进一步执行:
基于与所述亮度编码单元相关联的第二参数的值确定与所述色度编码单元相关联的第二参数的值,其中与所述色度编码单元相关联的所述第二参数指示对所述色度编码单元执行双向预测校正方法中的一种。
44.根据权利要求41至43中任一项所述的设备,其中:
从比特流解码获得与所述亮度编码单元相关联的第四参数和第五参数。
45.根据权利要求41至43中任一项所述的设备,其中:
从由从比特流解码获得的第六参数确定的候选继承与所述亮度编码单元相关联的所述第四参数和所述第五参数。
46.一种视频解码设备,包括:
存储指令集的存储器;和
一个或多个处理器,所述一个或多个处理器被配置为执行所述指令集以使所述设备执行:
确定与满足多个条件的编码单元相关联的第一参数的值,其中与所述编码单元相关联的所述第一参数指示双向预测校正是否被启用;以及
响应于与所述编码单元相关联的所述第一参数的值指示所述双向预测校正被启用,对所述编码单元执行所述双向预测校正。
47.根据权利要求46所述的设备,其中所述多个条件包括:
确定所述编码单元的两个参考图片列表;
确定所述两个参考图片列表中的参考图片是否按显示次序位于与所述编码单元相关联的当前图片之前;以及
响应于所述两个参考图片列表中的所述参考图片按所述显示次序位于与所述编码单元相关联的所述当前图片之前,确定所述编码单元满足所述多个条件。
48.根据权利要求46所述的设备,其中所述一个或多个处理器被配置为执行所述指令集以使所述设备进一步执行:
确定与所述编码单元相关联的第二参数的值,其中与所述编码单元相关联的所述第二参数指示对所述编码单元执行双向预测校正方法中的一种。
49.根据权利要求46所述的设备,其中所述一个或多个处理器被配置为执行所述指令集以使所述设备进一步执行:
获得用于所述编码单元的第一预测与第二预测,其中使用所述编码单元的运动来预测所述第一预测和所述第二预测;
通过将校正强度因子应用于所述第一预测与所述第二预测之间的差来确定第三预测;以及
通过对所述第一预测和所述第二预测进行平均计算并与所述第三预测相加,来使用所述第一预测、所述第二预测和所述第三预测对所述编码单元进行解码。
50.根据权利要求49所述的设备,其中所述第一预测与所述第二预测之间的所述差是以下中的一个:
所述第一预测与所述第二预测之间的差值等于所述第一预测减去所述第二预测;或者
所述第一预测与所述第二预测之间的差值等于所述第二预测减去所述第一预测。
51.根据权利要求49所述的设备,其中所述校正强度因子是1/8。
52.一种视频编码设备,包括:
存储指令集的存储器;和
一个或多个处理器,所述一个或多个处理器被配置为执行所述指令集以使所述设备执行:
确定用于编码单元的候选;
基于与所述候选相关联的第二参数的值确定与所述编码单元相关联的第二参数的值,其中与所述编码单元相关联的所述第二参数指示双向预测校正是否被启用;
响应于与所述编码单元相关联的所述第二参数的值指示所述双向预测校正被启用,使用所述双向预测校正对所述编码单元进行编码;以及
将与所述候选相关联的第一参数编码到比特流。
53.根据权利要求52所述的设备,其中所述一个或多个处理器被配置为执行所述指令集以使所述设备进一步执行:
确定与所述编码单元相关联的所述第二参数的值等于与所述候选相关联的所述第二参数的值。
54.根据权利要求52所述的设备,其中所述一个或多个处理器被配置为执行所述指令集以使所述设备进一步执行:
基于与所述候选相关联的第三参数的值确定与所述编码单元相关联的第三参数的值,其中与所述编码单元相关联的所述第三参数指示执行双向预测校正方法中的一种。
55.根据权利要求52至54中任一项所述的设备,其中所述候选是TMVP、SMVP、MVAP、HMVP、UMVE、InterPF、仿射继承候选、仿射构建候选或零仿射候选中的一个。
56.根据权利要求55所述的设备,其中所述候选是TMVP、MVAP或零仿射候选,基于与所述候选相关联的所述第二参数的值确定与所述编码单元相关联的所述第二参数的值还包括:
将与所述编码单元相关联的所述第二参数的值设置为禁用,并且对于所述编码单元禁用所述双向预测校正。
57.根据权利要求52和55中任一项所述的设备,其中所述候选是仿射构建候选,基于与所述候选相关联的所述第二参数的值确定与所述编码单元相关联的所述第二参数的值还包括:
确定用于所述编码单元的多个控制点,其中所述多个控制点至少包括第一控制点;
确定与所述编码单元相关联的所述第二参数的值和所述第三参数的值分别等于与所述第一控制点相关联的第二参数的值和第三参数的值。
58.根据权利要求52至57中任一项所述的设备,其中与所述编码单元相关联的所述第二参数是标志,并且与所述编码单元相关联的第三参数是指标。
59.一种视频编码设备,包括:
存储指令集的存储器;和
一个或多个处理器,所述一个或多个处理器被配置为执行所述指令集以使所述设备执行:
基于与亮度编码单元相关联的第一参数的值确定与色度编码单元相关联的第一参数的值,其中与所述色度编码单元相关联的所述第一参数指示双向预测校正是否被启用;以及
响应于与所述色度编码单元相关联的所述第一参数的值指示所述双向预测校正被启用,对所述色度编码单元执行所述双向预测校正。
60.根据权利要求59所述的设备,其中
所述亮度编码单元是所述色度编码单元的共置块。
61.根据权利要求59所述的设备,其中所述一个或多个处理器被配置为执行所述指令集以使所述设备进一步执行:
基于与所述亮度编码单元相关联的第二参数的值确定与所述色度编码单元相关联的第二参数的值,其中与所述色度编码单元相关联的所述第二参数指示对所述色度编码单元执行双向预测校正方法中的一种。
62.根据权利要求59至61中任一项所述的设备,其中
与所述亮度编码单元相关联的所述第一参数和所述第二参数被编码到比特流。
63.根据权利要求59至61中任一项所述的设备,其中所述一个或多个处理器被配置为执行所述指令集以使所述设备进一步执行:
将与所述亮度编码单元相关联的所述第一参数和所述第二参数继承给所述候选,以及
将与所述候选相关联的第三参数编码到比特流。
64.一种视频编码设备,包括:
确定与满足多个条件的编码单元相关联的第一参数的值,其中所述第一参数指示双向预测校正是否被启用;以及
响应于与所述编码单元相关联的所述第一参数的值指示所述双向预测校正被启用,对所述编码单元执行所述双向预测校正。
65.根据权利要求64所述的设备,其中所述多个条件包括:
确定所述编码单元的两个参考图片列表;
确定所述两个参考图片列表中的所有参考图片是否按显示次序位于与所述编码单元相关联的当前图片之前;以及
响应于所述两个参考图片列表中的所有所述参考图片按显示次序位于与所述编码单元相关联的所述当前图片之前,确定所述编码单元满足所述多个条件。
66.根据权利要求64所述的设备,其中所述一个或多个处理器被配置为执行所述指令集以使所述设备进一步执行:
确定与所述编码单元相关联的第二参数的值,其中所述第二参数指示对所述编码单元执行双向预测校正方法中的一种。
67.一种非瞬时性计算机可读介质,所述非瞬时性计算机可读介质存储有指令集,所述指令集可由计算机的至少一个处理器执行以使所述计算机执行视频解码方法,所述方法包括:
从比特流解码获得用于编码单元的第一参数,并基于所述第一参数确定用于所述编码单元的候选;
基于与所述候选相关联的第二参数的值确定与所述编码单元相关联的第二参数的值,其中与所述编码单元相关联的所述第二参数指示双向预测校正是否被启用;以及
响应于与所述编码单元相关联的所述第二参数的值指示所述双向预测校正被启用,对所述编码单元执行所述双向预测校正。
68.根据权利要求67所述的非瞬时性计算机可读介质,其中所述至少一个处理器被配置为执行所述指令集以使所述计算机进一步执行:
确定与所述编码单元相关联的所述第二参数的值等于与所述候选相关联的所述第二参数的值。
69.根据权利要求67所述的非瞬时性计算机可读介质,其中所述至少一个处理器被配置为执行所述指令集以使所述计算机进一步执行:
基于与所述候选相关联的第三参数的值确定与所述编码单元相关联的第三参数的值,其中与所述编码单元相关联的所述第三参数指示执行双向预测校正方法中的一种。
70.根据权利要求67至69中任一项所述的非瞬时性计算机可读介质,其中所述候选是TMVP、SMVP、MVAP、HMVP、UMVE、InterPF、仿射继承候选、仿射构建候选或零仿射候选中的一个。
71.根据权利要求67和70中任一项所述的非瞬时性计算机可读介质,其中所述候选是TMVP、MVAP或零仿射候选,基于与所述候选相关联的所述第二参数的值确定与所述编码单元相关联的所述第二参数的值还包括:
将与所述编码单元相关联的所述第二参数的值设置为禁用,并且对于所述编码单元禁用所述双向预测校正。
72.根据权利要求67和70中任一项所述的非瞬时性计算机可读介质,其中所述候选是仿射构建候选,基于与所述候选相关联的所述第二参数的值确定与所述编码单元相关联的所述第二参数的值还包括:
确定用于所述编码单元的多个控制点,其中所述多个控制点至少包括第一控制点;
确定与所述编码单元相关联的所述第二参数的值和所述第三参数的值分别等于与所述第一控制点相关联的第二参数的值和第三参数的值。
73.根据权利要求67至72中任一项所述的非瞬时性计算机可读介质,其中与所述编码单元相关联的所述第二参数是标志,并且与所述编码单元相关联的第三参数是指标。
74.一种非瞬时性计算机可读介质,所述非瞬时性计算机可读介质存储有指令集,所述指令集可由计算机的至少一个处理器执行以使所述计算机执行视频解码方法,所述方法包括:
基于与亮度编码单元相关联的第一参数的值确定与色度编码单元相关联的第一参数的值,其中与所述色度编码单元相关联的所述第一参数指示双向预测校正是否被启用;以及
响应于与所述色度编码单元相关联的所述第一参数的值指示所述双向预测校正被启用,对所述色度编码单元执行所述双向预测校正。
75.根据权利要求74所述的非瞬时性计算机可读介质,其中
所述亮度编码单元是所述色度编码单元的共置块。
76.根据权利要求74所述的非瞬时性计算机可读介质,还包括:
基于与所述亮度编码单元相关联的第二参数的值确定与所述色度编码单元相关联的第二参数的值,其中与所述色度编码单元相关联的所述第二参数指示对所述色度编码单元执行双向预测校正方法中的一种。
77.根据权利要求74至76中任一项所述的非瞬时性计算机可读介质,其中:
从比特流解码获得与所述亮度编码单元相关联的第四参数和第五参数。
78.根据权利要求74至76中任一项所述的非瞬时性计算机可读介质,其中:
从由从比特流解码获得的第六参数确定的候选继承与所述亮度编码单元相关联的所述第四参数和所述第五参数。
79.一种非瞬时性计算机可读介质,所述非瞬时性计算机可读介质存储有指令集,所述指令集能够由计算机的至少一个处理器执行以使所述计算机执行视频解码方法,所述方法包括:
确定与满足多个条件的编码单元相关联的第一参数的值,其中与所述编码单元相关联的所述第一参数指示双向预测校正是否被启用;以及
响应于与所述编码单元相关联的所述第一参数的值指示所述双向预测校正被启用,对所述编码单元执行所述双向预测校正。
80.根据权利要求79所述的非瞬时性计算机可读介质,其中所述多个条件包括:
确定所述编码单元的两个参考图片列表;
确定所述两个参考图片列表中的参考图片是否按显示次序位于与所述编码单元相关联的当前图片之前;以及
响应于所述两个参考图片列表中的所述参考图片按所述显示次序位于与所述编码单元相关联的所述当前图片之前,确定所述编码单元满足所述多个条件。
81.根据权利要求79所述的非瞬时性计算机可读介质,还包括:
确定与所述编码单元相关联的第二参数的值,其中与所述编码单元相关联的所述第二参数指示对所述编码单元执行双向预测校正方法中的一种。
82.根据权利要求79所述的非瞬时性计算机可读介质,还包括:
获得用于所述编码单元的第一预测与第二预测,其中使用所述编码单元的运动来预测所述第一预测和所述第二预测;
通过将校正强度因子应用于所述第一预测与所述第二预测之间的差;来确定第三预测;以及
通过对所述第一预测和所述第二预测进行平均计算并与所述第三预测相加,来使用所述第一预测、所述第二预测和所述第三预测对所述编码单元进行解码。
83.根据权利要求82所述的非瞬时性计算机可读介质,其中所述第一预测与所述第二预测之间的所述差是以下中的一个:
所述第一预测与所述第二预测之间的差值等于所述第一预测减去所述第二预测;或者
所述第一预测与所述第二预测之间的差值等于所述第二预测减去所述第一预测。
84.根据权利要求82所述的非瞬时性计算机可读介质,其中所述校正强度因子是1/8。
85.一种非瞬时性计算机可读介质,所述非瞬时性计算机可读介质存储有指令集,所述指令集可由计算机的至少一个处理器执行以使所述计算机执行视频编码方法,所述方法包括:
确定用于编码单元的候选;
基于与所述候选相关联的第二参数的值确定与所述编码单元相关联的第二参数的值,其中与所述编码单元相关联的所述第二参数指示双向预测校正是否被启用;
响应于与所述编码单元相关联的所述第二参数的值指示所述双向预测校正被启用,用所述双向预测校正对所述编码单元进行编码;以及
将与所述候选相关联的第一参数编码到所述比特流。
86.根据权利要求85所述的非瞬时性计算机可读介质,还包括:
确定与所述编码单元相关联的所述第二参数的值等于与所述候选相关联的所述第二参数的值。
87.根据权利要求85所述的非瞬时性计算机可读介质,其中所述至少一个处理器被配置为执行所述指令集以使所述计算机进一步执行:
基于与所述候选相关联的第三参数的值确定与所述编码单元相关联的第三参数的值,其中与所述编码单元相关联的所述第三参数指示执行双向预测校正方法中的一种。
88.根据权利要求85至87中任一项所述的非瞬时性计算机可读介质,其中所述候选是TMVP、SMVP、MVAP、HMVP、UMVE、InterPF、仿射继承候选、仿射构建候选或零仿射候选中的一个。
89.根据权利要求88所述的非瞬时性计算机可读介质,其中所述候选是TMVP、MVAP或零仿射候选,基于与所述候选相关联的所述第二参数的值确定与所述编码单元相关联的所述第二参数的值还包括:
将与所述编码单元相关联的所述第二参数的值设置为禁用,并且对于所述编码单元禁用所述双向预测校正。
90.根据权利要求85和88中任一项所述的非瞬时性计算机可读介质,其中所述候选是仿射构建候选,基于与所述候选相关联的所述第二参数的值确定与所述编码单元相关联的所述第二参数的值还包括:
确定用于所述编码单元的多个控制点,其中所述多个控制点至少包括第一控制点;
确定与所述编码单元相关联的所述第二参数的值和所述第三参数的值分别等于与所述第一控制点相关联的第二参数的值和第三参数的值。
91.根据权利要求85至90中任一项所述的非瞬时性计算机可读介质,其中与所述编码单元相关联的所述第二参数是标志,并且与所述编码单元相关联的所述第三参数是指标。
92.一种非瞬时性计算机可读介质,所述非瞬时性计算机可读介质存储有指令集,所述指令集能够由计算机的至少一个处理器执行以使所述计算机执行视频编码方法,所述方法包括:
基于与亮度编码单元相关联的第一参数的值确定与色度编码单元相关联的第一参数的值,其中与所述色度编码单元相关联的所述第一参数指示双向预测校正是否被启用;
响应于与所述色度编码单元相关联的所述第一参数的值指示所述双向预测校正被启用,对所述色度编码单元执行所述双向预测校正。
93.根据权利要求92所述的非瞬时性计算机可读介质,其中
所述亮度编码单元是所述色度编码单元的共置块。
94.根据权利要求92所述的非瞬时性计算机可读介质,还包括:
基于与所述亮度编码单元相关联的第二参数的值确定与所述色度编码单元相关联的第二参数的值,其中与所述色度编码单元相关联的所述第二参数指示对所述色度编码单元执行双向预测校正方法中的一种。
95.根据权利要求92至94中任一项所述的非瞬时性计算机可读介质,其中
与所述亮度编码单元相关联的所述第一参数和所述第二参数被编码到比特流。
96.根据权利要求92至94中任一项所述的非瞬时性计算机可读介质,还包括:
确定用于所述亮度编码单元的候选;
将与所述亮度编码单元相关联的所述第一参数和所述第二参数继承给所述候选,以及
将与所述候选相关联的第三参数编码到比特流。
97.一种非瞬时性计算机可读介质,所述非瞬时性计算机可读介质存储有指令集,所述指令集可由计算机的至少一个处理器执行以使所述计算机执行视频编码方法,所述方法包括:
确定与满足多个条件的编码单元相关联的第一参数的值,其中所述第一参数指示双向预测校正是否被启用;以及
响应于与所述编码单元相关联的所述第一参数的值指示所述双向预测校正被启用,对所述编码单元执行所述双向预测校正。
98.根据权利要求97所述的非瞬时性计算机可读介质,其中所述多个条件包括:
确定所述编码单元的两个参考图片列表;
确定所述两个参考图片列表中的所有参考图片是否按显示次序位于与所述编码单元相关联的当前图片之前;以及
响应于所述两个参考图片列表中的所有所述参考图片按显示次序位于与所述编码单元相关联的所述当前图片之前,确定所述编码单元满足所述多个条件。
99.根据权利要求66所述的非瞬时性计算机可读介质,还包括:
确定与所述编码单元相关联的第二参数的值,其中所述第二参数指示对所述编码单元执行双向预测校正方法中的一种。
CN202180043524.7A 2020-08-03 2021-08-03 双向预测校正系统和方法 Active CN115699744B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410194201.3A CN118075450A (zh) 2020-08-03 2021-08-03 双向预测校正系统和方法

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063060624P 2020-08-03 2020-08-03
US63/060,624 2020-08-03
US17/391,542 2021-08-02
US17/391,542 US11582474B2 (en) 2020-08-03 2021-08-02 Systems and methods for bi-directional gradient correction
PCT/CN2021/110338 WO2022028422A1 (en) 2020-08-03 2021-08-03 Systems and methods for bi-directional prediction correction

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202410194201.3A Division CN118075450A (zh) 2020-08-03 2021-08-03 双向预测校正系统和方法

Publications (2)

Publication Number Publication Date
CN115699744A true CN115699744A (zh) 2023-02-03
CN115699744B CN115699744B (zh) 2024-03-26

Family

ID=80004687

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202180043524.7A Active CN115699744B (zh) 2020-08-03 2021-08-03 双向预测校正系统和方法
CN202410194201.3A Pending CN118075450A (zh) 2020-08-03 2021-08-03 双向预测校正系统和方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202410194201.3A Pending CN118075450A (zh) 2020-08-03 2021-08-03 双向预测校正系统和方法

Country Status (4)

Country Link
US (1) US11582474B2 (zh)
EP (1) EP4189960A4 (zh)
CN (2) CN115699744B (zh)
WO (1) WO2022028422A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11582474B2 (en) 2020-08-03 2023-02-14 Alibaba Group Holding Limited Systems and methods for bi-directional gradient correction

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108605137A (zh) * 2016-03-01 2018-09-28 联发科技股份有限公司 利用仿射运动补偿的视频编码方法与装置
WO2018230493A1 (ja) * 2017-06-14 2018-12-20 シャープ株式会社 動画像復号装置、動画像符号化装置、予測画像生成装置及び動きベクトル導出装置
CN110572666A (zh) * 2018-06-05 2019-12-13 北京字节跳动网络技术有限公司 非对称加权Merge和其它编码工具的交互
US20200014931A1 (en) * 2018-07-06 2020-01-09 Mediatek Inc. Methods and Apparatuses of Generating an Average Candidate for Inter Picture Prediction in Video Coding Systems
CN110944193A (zh) * 2018-09-24 2020-03-31 北京字节跳动网络技术有限公司 视频编码和解码中的加权双向预测
CN110944185A (zh) * 2018-09-21 2020-03-31 腾讯美国有限责任公司 视频解码的方法和装置、计算机设备及存储介质
CN111436227A (zh) * 2018-11-12 2020-07-21 北京字节跳动网络技术有限公司 在视频处理中使用组合帧间-帧内预测
CN111448797A (zh) * 2018-11-16 2020-07-24 北京字节跳动网络技术有限公司 用于帧间预测插值的参考尺寸

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105491390B (zh) 2015-11-30 2018-09-11 哈尔滨工业大学 混合视频编码标准中帧内预测方法
WO2020084476A1 (en) 2018-10-22 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Sub-block based prediction
US11025936B2 (en) 2019-01-25 2021-06-01 Tencent America LLC Method and apparatus for video coding
MX2021010770A (es) * 2019-03-08 2021-09-28 Sharp Kk Aparato de decodificacion de video.
CN112004091B (zh) * 2020-07-31 2021-08-03 浙江大华技术股份有限公司 帧间预测方法及其相关装置
US11582474B2 (en) 2020-08-03 2023-02-14 Alibaba Group Holding Limited Systems and methods for bi-directional gradient correction
CN112055221B (zh) * 2020-08-07 2021-11-12 浙江大华技术股份有限公司 一种帧间预测方法、视频编码方法及电子设备和存储介质
CN112565768B (zh) * 2020-12-02 2023-02-28 浙江大华技术股份有限公司 一种帧间预测方法、编解码系统及计算机可读存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108605137A (zh) * 2016-03-01 2018-09-28 联发科技股份有限公司 利用仿射运动补偿的视频编码方法与装置
WO2018230493A1 (ja) * 2017-06-14 2018-12-20 シャープ株式会社 動画像復号装置、動画像符号化装置、予測画像生成装置及び動きベクトル導出装置
CN110572666A (zh) * 2018-06-05 2019-12-13 北京字节跳动网络技术有限公司 非对称加权Merge和其它编码工具的交互
US20200014931A1 (en) * 2018-07-06 2020-01-09 Mediatek Inc. Methods and Apparatuses of Generating an Average Candidate for Inter Picture Prediction in Video Coding Systems
CN110944185A (zh) * 2018-09-21 2020-03-31 腾讯美国有限责任公司 视频解码的方法和装置、计算机设备及存储介质
CN110944193A (zh) * 2018-09-24 2020-03-31 北京字节跳动网络技术有限公司 视频编码和解码中的加权双向预测
CN111436227A (zh) * 2018-11-12 2020-07-21 北京字节跳动网络技术有限公司 在视频处理中使用组合帧间-帧内预测
CN111448797A (zh) * 2018-11-16 2020-07-24 北京字节跳动网络技术有限公司 用于帧间预测插值的参考尺寸

Also Published As

Publication number Publication date
US11582474B2 (en) 2023-02-14
CN118075450A (zh) 2024-05-24
US20220038727A1 (en) 2022-02-03
EP4189960A1 (en) 2023-06-07
EP4189960A4 (en) 2024-07-10
CN115699744B (zh) 2024-03-26
WO2022028422A1 (en) 2022-02-10

Similar Documents

Publication Publication Date Title
US12010297B2 (en) Methods for constructing a merge candidate list
US20230362384A1 (en) Methods and systems for cross-component sample adaptive offset
CN114902670A (zh) 用信号通知子图像划分信息的方法和装置
US11638019B2 (en) Methods and systems for prediction from multiple cross-components
CN114788284B (zh) 用于在调色板模式下对视频数据进行编码的方法和装置
CN115699744B (zh) 双向预测校正系统和方法
CN118511507A (zh) 视频预测模式的加权
US20210266548A1 (en) Signaling of maximum transform size and residual coding method
CN115443650A (zh) 用于帧间预测的角度加权预测
US11451801B2 (en) Methods for coding video data in palette mode
US11924417B2 (en) Methods and systems for cross-component adaptive loop filter
US11711528B2 (en) Systems and methods for liner model derivation
CN115443655A (zh) 用于处理视频编码中自适应颜色变换和低频不可分离变换的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230802

Address after: Room 516, floor 5, building 3, No. 969, Wenyi West Road, Wuchang Street, Yuhang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba Dharma Institute (Hangzhou) Technology Co.,Ltd.

Address before: Box 847, four, Grand Cayman capital, Cayman Islands, UK

Applicant before: ALIBABA GROUP HOLDING Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant