CN113475075A - 基于共享Merge列表的运动预测 - Google Patents

基于共享Merge列表的运动预测 Download PDF

Info

Publication number
CN113475075A
CN113475075A CN202080013647.1A CN202080013647A CN113475075A CN 113475075 A CN113475075 A CN 113475075A CN 202080013647 A CN202080013647 A CN 202080013647A CN 113475075 A CN113475075 A CN 113475075A
Authority
CN
China
Prior art keywords
sub
block
motion
video
merge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202080013647.1A
Other languages
English (en)
Other versions
CN113475075B (zh
Inventor
张莉
张凯
刘鸿彬
许继征
王悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Original Assignee
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd, ByteDance Inc filed Critical Beijing ByteDance Network Technology Co Ltd
Publication of CN113475075A publication Critical patent/CN113475075A/zh
Application granted granted Critical
Publication of CN113475075B publication Critical patent/CN113475075B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种视频处理的方法,包括:确定视频的第一视频单元是帧内块复制(IBC)Merge共享节点,并且将所述第一视频单元划分为多个子块,其中在所述第一视频单元下的以IBC Merge模式编解码的子块被并行处理;推导所述第一视频单元下的第一子块的运动信息;并且使用所述推导的运动信息进行所述视频的比特流表示和所述第一子块之间的转换,其中在所述第一子块的运动信息的推导中,省略所述第一视频下的任何其他子块的运动信息。

Description

基于共享Merge列表的运动预测
相关申请的交叉引用
本申请要求于2019年2月13日提交的标题为“在共享的Merge列表下的运动预测”的PCT/CN2019/074964的权益,其全部公开内容通过引用合并于此。
技术领域
本文件涉及视频和图像编解码技术。
背景技术
数字视频仍占据因特网和其他数字通信网络上的最大的带宽使用。随着能够接收和显示视频的所连接的用户设备的数量增加,预计数字视频使用的带宽需求将继续增长。
发明内容
所公开的技术可以由视频或图像解码器或编码器实施例使用,在该实施例中使用共享的Merge列表下的运动预测。
在一个示例方面,公开了一种处理视频的方法。该方法包括:确定视频的第一视频单元是帧内块复制(IBC)Merge共享节点,并且将所述第一视频单元划分为多个子块,其中在所述第一视频单元下的以IBC Merge模式编解码的子块被并行处理;推导所述第一视频单元下的第一子块的运动信息;并且使用所述推导的运动信息进行所述视频的比特流表示和所述第一子块之间的转换,其中在所述第一子块的运动信息的推导中,省略所述第一视频下的任何其他子块的运动信息。
在另一示例方面,一种视频处理的方法,包括:确定视频的第一视频单元是帧内块复制(IBC)高级运动矢量预测(AMVP)共享节点,并且将所述第一视频单元划分为多个子块,其中在所述第一视频单元下的以IBC AMVP模式编解码的子块被并行处理;推导所述第一视频单元下的第一子块的运动信息;并且使用所述推导的运动信息进行所述视频的比特流表示和所述第一子块之间的转换,其中在所述第一子块的运动信息的推导中,省略所述第一视频下的任何其他子块的运动信息。
在另一示例方面,一种视频处理的方法,包括:确定视频的第一视频单元是帧间高级运动矢量预测(AMVP)运动共享节点,并且将所述第一视频单元划分为多个子块,其中在所述第一视频单元下的以帧间AMVP模式编解码的子块被并行处理;推导所述第一视频单元下的以帧间AMVP模式编解码的所述多个子块的第一子块的运动信息;并且基于所述推导的运动信息,进行所述多个子块中的第一子块和包括所述第一视频单元的所述视频的比特流表示之间的转换,其中在所述第一子块的运动信息的推导中,省略所述第一视频单元下的任何其他子块的运动信息。
在另一示例方面,一种视频处理的方法,包括:确定视频的第一视频单元为参数共享节点,并且所述第一视频单元被划分为多个子块;在所述第一子块和包括所述第一视频单元的所述视频的比特流表示之间的转换期间,推导在所述第一视频单元下的所述多个子块中的第一子块的参数,其中所述第一子块使用编解码工具编解码;并且基于参数进行所述转换,其中,在转换过程中推导的与所述编解码工具相关联的所述参数独立于相同参数共享节点下的第二子块的信息。
在另一示例方面,一种视频处理的方法,包括:确定视频的第一视频单元是运动共享节点,并且将所述第一视频单元划分为作为叶节点的多个子块;推导在所述第一视频单元下的第一子块的运动候选列表;并且基于所述运动候选列表,进行以第一模式编解码的所述多个子块中的所述第一子块和包括所述第一视频单元的所述视频的比特流表示之间的转换,其中,以上述第一模式编解码的所述多个子块中的第二子块的运动信息在所述运动候选列表的构建过程中省略;并且其中,当编码或解码所述第一子块时,从基于历史的运动矢量预测(HMVP)表中推导的运动候选不被添加到所述运动候选列表。
在另一示例方面,一种视频处理的方法,包括:在第一视频块和包含所述第一视频块的视频的比特流表示之间的转换期间,通过使用当所述第一视频块处于运动共享节点之外时用于所述第一视频块的第一候选列表构建技术构建的运动列表来预测所述第一视频块的运动信息;在第一视频单元的第二视频块和所述视频的比特流表示之间的转换期间,通过使用以用于所述第二视频块的第二候选列表构建技术构建的Merge列表来预测所述第二视频块的运动信息,所述第二候选列表构建技术不同于所述第一候选列表构建技术,并且所述第一视频单元是共享节点块;并且基于所述第一视频块和所述第二视频块的所述预测的运动信息来进行所述转换。
在另一示例方面,一种视频处理的方法,包括:维持一个或多个表,其中,每个表包括从先前处理的视频块推导的运动候选,该先前处理的视频块在视频的第一视频块之前被处理;推导所述第一视频块的运动信息;当启用至少一个解码器侧运动矢量推导(DMVD)技术时,对运动信息应用细化;使用细化的运动信息在所述第一视频块的比特流表示和所述第一视频块之间进行转换;以及确定是否使用细化的运动信息或未细化的运动信息以用于更新一个或多个表。
在另一示例方面,一种视频处理的方法,包括:维持一个或多个表,其中,每个表包括从先前处理的视频块推导的运动候选,该先前处理的视频块在视频的第一视频块之前被处理;推导所述第一视频块的运动信息;当启用至少一个解码器侧运动矢量推导(DMVD)技术时,对运动信息应用细化;使用细化的运动信息在所述第一视频块的比特流表示和所述第一视频块之间进行转换;以及以所述第一视频块的未细化的运动信息来更新所述一个或多个表。
在另一示例方面,一种视频处理的方法,包括:维持一个或多个表,其中,每个表包括从先前处理的视频块推导的运动候选,该先前处理的视频块在视频中的第一视频块之前被处理;推导所述第一视频块的运动信息;基于所述运动信息是否从一个或多个表中推导,使用至少一个解码器侧运动矢量推导(DMVD)技术来确定启用或禁用所述第一视频块的运动信息的细化;基于所述确定,在所述视频的比特流表示和所述第一视频块之间进行转换。
在另一个示例方面,上述方法可以由包含处理器的视频编码器设备实现。
在又一个示例方面,这些方法可以以处理器可执行指令的形式体现并存储在计算机可读程序介质上。
这些和其他方面将在本文件中进一步描述。
附图说明
图1示出了用于Merge候选列表构建的推导过程的示例。
图2示出了空域Merge候选的位置的示例。
图3示出了考虑用于空域Merge候选的冗余校验的候选对的示例。
图4示出了N×2N和2N×N分割的第二PU的位置的示例。
图5示出了针对时域Merge候选的运动矢量缩放的示例。
图6示出了时域Merge候选C0和C1的候选位置的示例。
图7示出了组合的双向预测Merge候选的示例。
图8示出了运动矢量预测候选的推导过程的示例。
图9示出了针对空域运动矢量候选的运动矢量缩放的示例。
图10A示出了(从左上角到右下角划分)135度分割类型的示例。
图10B示出了将CU划分成两个三角预测单元(两个划分模式)的示例。
图11示出了相邻块的位置的示例。
图12示出了用于TPM标志编解码中的上下文选择的相邻块(A和L)的示例。
图13A和13B示出了简化的仿射运动模型的示例。
图14示出了每个子块的仿射MVF的示例。
图15示出了4参数仿射模型(a)和6参数仿射模型(b)的示例。
图16示出了针对继承的仿射候选的AF_INTER的MVP的示例。
图17示出了针对构建的仿射候选的AF_INTER的MVP的示例。
图18示出了AF_MERGE的候选的示例。
图19示出了仿射Merge模式的候选位置的示例。
图20示出了图片内块复制的示例。
图21示出了仿射Merge模式的候选位置的示例。
图22示出了修改的Merge列表构建过程的示例。
图23示出了Merge共享节点的示例。
图24是视频处理装置的示例的框图。
图25示出了视频编码器的示例实现方式的框图。
图26是视频处理方法的示例的流程图。
图27是视频处理方法的示例的流程图。
图28是视频处理方法的示例的流程图。
图29是视频处理方法的示例的流程图。
图30是视频处理方法的示例的流程图。
图31是视频处理方法的示例的流程图。
图32是视频处理方法的示例的流程图。
图33是视频处理方法的示例的流程图。
图34是视频处理方法的示例的流程图。
图35是视频处理方法的示例的流程图。
图36是视频处理方法的示例的流程图。
图37是视频处理方法的示例的流程图。
图38是视频处理方法的示例的流程图。
图39是视频处理方法的示例的流程图。
具体实施方式
本文件提供了可由图像或视频比特流的解码器使用的各种技术,以提高解压缩的或解码的数字视频或图像的质量。为简便起见,本文使用术语“视频”既包括图片序列(传统上称为视频),也包括单个图像。此外,视频编码器还可在编码过程中实现这些技术,以便重建用于进一步编码的解码帧。
在本文件中使用章节标题是为了易于理解,并且不将实施例和技术限于相应的章节。这样,一个章节的实施例可以与其他章节的实施例组合。
1.概要
本发明涉及视频编解码技术。具体而言,其涉及视频编解码中的运动矢量编解码。它可以应用于像HEVC之类的现有的视频编解码标准或者待最终确定的标准(通用视频编解码)。它也可以适用于未来的视频编解码标准或视频编解码器。
2.背景
视频编解码标准主要是通过众所周知的ITU-T和ISO/IEC标准的发展而得以演进。ITU-T制作了H.261和H.263标准,ISO/IEC制作了MPEG-1和MPEG-4Visual标准,并且两个组织联合制作了H.262/MPEG-2视频标准和H.264/MPEG-4高级视频编解码(Advanced VideoCoding,AVC)标准和H.265/HEVC标准。从H.262开始,视频编解码标准基于混合视频编解码结构,其中利用时域预测加变换编解码。为了探索HEVC之外的未来视频编解码技术,由VCEG和MPEG于2015年联合成立联合视频探索团队(JVET)。从那时起,JVET采用了许多新方法并将其纳入名为联合勘探模型(JEM)的参考软件。2018年4月,VCEG(Q6/16)和ISO/IEC JTC1SC29/WG11(MPEG)之间的联合视频专家团队(JVET)成立,致力于VVC标准,与HEVC相比,其比特率降低了50%。
图25是视频编码器的示例实现方式的框图。图25示出了实现了具有内置的反馈路径的编码器实现方式,其中视频编码器还执行视频解码功能(重构视频数据的压缩表示以用于下一视频数据的编码)。
2.1 HEVC/H.265中的帧间预测
每个帧间预测的PU具有对于一个或两个参考图片列表的运动参数。运动参数包括运动矢量和参考图片索引。也可以使用inter_pred_idc来信令通知对两个参考图片列表中一个的使用。运动矢量可以明确地被编解码为相对于预测器的增量。
当使用跳过(skip)模式来编解码CU时,一个PU与该CU相关联,并且不存在显著的残差系数,不存在编解码的运动矢量增量或参考图片索引。指定Merge模式,由此从相邻PU——包括空域和时域候选——得到用于当前PU的运动参数。Merge模式可以应用于任何帧间预测的PU,而不仅适用于跳过模式。Merge模式的替代方案是运动参数的显式传输(explicit transmission),其中运动矢量(更确切地,相比于运动矢量预测器的运动矢量差(MVD))、每个参考图片列表的对应参考图片索引、参考图片列表使用对每个PU被显式信令通知。这样的模式在本公开中被命名为高级运动矢量预测。
当信令指示要使用两个参考图片列表中的一个时,PU从一个样本块产生。这被称为“单向预测”。单向预测可用于P条带和B条带。
当信令指示要使用两个参考图片列表时,PU从两个样本块产生。这被称为“双向预测”。双向预测仅可用于B条带。
下文提供了在HEVC中指定的帧间预测模式的详细信息。说明将从Merge模式开始。
2.1.1参考图片列表
在HEVC中,术语帧间预测用于表示从当前解码的图片以外的参考图片的数据元素(例如,采样值或运动矢量)推导的预测。像在H.264/AVC中一样,可以从多个参考图片来预测图片。用于帧间预测的参考图片被组织在一个或多个参考图片列表中。参考索引标识应使用列表中的哪些参考图片来创建预测信号。
单个参考图片列表——列表0(List 0)被用于P条带,并且两个参考图片列表——列表0(List 0)和列表1(List 1)被用于B条带。应当注意,就捕获/显示顺序而言,列表0/1中包含的参考图片可以是来自过去和将来的图片。
2.1.2 Merge模式
2.1.2.1 Merge模式的候选的推导
当使用Merge模式预测PU时,从比特流解析出指向Merge候选列表(Mergecandidates list)中的条目的索引,并且该索引被用于检索运动信息。该列表的构建在HEVC标准中明确并可以根据以下步骤顺序进行总结:
步骤1:初始候选推导
步骤1.1:空域候选推导
步骤1.2:空域候选的冗余校验
步骤1.3:时域候选推导
步骤2:附加候选插入
步骤2.1:创建双向预测候选
步骤2.2:插入零运动候选
在图1中也示意性地描绘了这些步骤。对于空域Merge候选推导,在位于五个不同位置的候选中选择最多四个Merge候选。对于时域Merge候选推导,在两个候选中选择最多一个Merge候选。由于在解码器处假设每个PU的候选的数量为常数,因此当从步骤1得到的候选的数量未达到在条带报头中信令通知的最大Merge候选数量(MaxNumMergeCand)时,生成附加的候选。由于候选的数量是恒定的,因此使用二进制一元截断(TU)来编码最佳Merge候选的索引。如果CU的尺寸等于8,则当前CU的所有PU共享单个Merge候选列表,该单个Merge候选列表与2N×2N预测单元的Merge候选列表相同。
在下文中,详细描述了与前述步骤相关联的操作。
2.1.2.2空域候选的推导
在空域Merge候选的推导中,在位于图2中描绘的位置中的候选中选择最多四个Merge候选。推导的顺序是A1、B1、B0、A0和B2。仅当位置A1、B1、B0、A0的任何PU不可用时(例如,因为该PU属于另一个条带(slice)或片(tile))或者是帧内编解码时,才考虑位置B2。在添加位置A1处的候选之后,对剩余候选的添加进行冗余校验,该冗余校验确保具有相同运动信息的候选被排除在列表之外,从而改进编解码效率。为了降低计算复杂度,在所提到的冗余校验中并未考虑所有可能的候选对。相反,仅考虑与图3中的箭头链接的对,并且仅当如果用于冗余校验的对应候选具有不同的运动信息时,则该候选才被添加到列表中。
2.1.2.2.1Merge估计区域(MER)
重复的运动信息的另一个来源是与不同于2N×2N的分割相关联的“第二PU”。作为示例,图4分别描绘了针对N×2N和2N×N的情况的第二PU。在当前PU被分割为N×2N时,位置A1处的候选不被考虑用于列表构建。事实上,通过添加该候选将导致具有相同运动信息的两个预测单元,这对于在编解码单元中仅具有一个PU的情况是冗余的。类似地,在当前PU被分割为2N×N时,不考虑位置B1
2.1.2.3时域候选的推导
在此步骤中,只有一个候选被添加到列表中。特别地,在该时域Merge候选的推导中,基于并置(co-located)的PU来推导缩放的运动矢量,该并置的PU属于相对于给定参考图片列表内的当前图片具有最小POC差异的图片。在条带报头中明确地信令通知用于并置的PU的推导的参考图片列表。如图5中虚线所示,获得了用于时域Merge候选的缩放的运动矢量的推导,该用于时域Merge候选的缩放的运动矢量使用POC距离tb和td而从并置的PU的运动矢量被缩放,其中tb被定义为当前图片的参考图片与该当前图片之间的POC差异,并且td被定义为并置图片的参考图片与该并置图片之间的POC差异。时域Merge候选的参考图片索引被设置为等于零。在HEVC说明书中描述了缩放过程的实际实现。对于B条带,获得两个运动矢量并将其组合以产生双向预测Merge候选,该两个运动矢量中的一个用于参考图片列表0(list 0)而另一个用于参考图片列表1(list 1)。
如图6所示,在属于参考帧的并置的PU(Y)中,在候选C0和C1之间选择用于时域候选的位置。如果位置C0处的PU不可用、被帧内编解码的或在当前编解码树单元(CTU,即LCU,最大编解码单元)之外,则使用位置C1。否则,在时域Merge候选的推导中使用位置C0
2.1.2.4附加候选插入
除了空域和时域Merge候选之外,还存在两种附加类型的Merge候选:组合的双向预测Merge候选和零Merge候选。通过利用空域和时域Merge候选来生成组合的双向预测Merge候选。组合的双向预测Merge候选仅用于B条带。通过将初始候选的第一参考图片列表运动参数与另一个候选的第二参考图片列表运动参数组合来生成组合的双向预测候选。如果这两个元组(tuple)提供不同的运动假设,则它们将形成一个新的双向预测候选。作为示例,图7示出了以下情况,其中在该过程中原始列表(在左方)中具有mvL0和refIdxL0或mvL1和refIdxL1的两个候选被用于创建组合的双向预测Merge候选,该组合的双向预测Merge候选被添加到最终列表(在右方)。关于被认为生成这些附加Merge候选的组合有诸多规则。
零运动候选被插入以填充Merge候选列表中的剩余条目,并且因此达到MaxNumMergeCand容量。这些候选具有零空域位移和参考图片索引,该参考图片索引从零开始并且每当新的零运动候选被添加到列表时则增加。
更具体地,依次执行以下步骤,直到Merge列表已满为止:
将变量numRef设置为与用于P条带的列表0相关联的参考图片的数目,或者设置为用于B条带的两个列表中的参考图片的最小数目;
添加非重复的零运动候选:
对于变量i为0…numRef-1,对于列表0(如果P条带)或两个列表(如果B条带)添加MV设置为(0,0)且参考图片索引设置为i的默认运动候选。
添加重复的零运动候选,其中MV设置为(0,0),列表0的参考图片索引设置为0(如果P条带),两个列表的参考图片索引设置为0(如果B条带)。
最后,不对这些候选进行冗余校验。
2.1.3 AMVP
AMVP利用运动矢量与相邻PU的空域-时域相关性,该空域-时域相关性用于运动参数的显式传输。对于每个参考图片列表,通过下述操作来构建运动矢量候选列表:首先校验左方、上方在时域上相邻PU位置的可用性,移除冗余候选,并添加零矢量,以使候选列表为恒定长度。然后,编码器可以从候选列表中选择最佳预测器,并传输指示所选候选的对应索引。与Merge索引信令类似,使用一元截断来编码最佳运动矢量候选的索引。在这种情况下要编码的最大值是2(参见图8)。在以下的节中,提供了关于运动矢量预测候选的推导过程的细节。
2.1.3.1AMVP候选的推导
图8总结了用于运动矢量预测候选的推导过程。
在运动矢量预测中,考虑两种类型的运动矢量候选:空域运动矢量候选和时域运动矢量候选。如图2示出的,对于空域运动矢量候选推导,最终基于位于五个不同位置的每个PU的运动矢量来推导两个运动矢量候选。
对于时域运动矢量候选推导,从基于两个不同的并置位置推导的两个候选中选择一个运动矢量候选。在制作空域-时域候选的第一列表之后,移除列表中的重复的运动矢量候选。如果潜在候选的数量大于2,则从列表中移除其在相关联的参考图片列表内的参考图片索引大于1的运动矢量候选。如果空域-时域运动矢量候选的数量小于2,则将附加的零运动矢量候选添加到列表中。
2.1.3.2空域运动矢量候选
在空域运动矢量候选的推导中,在五个潜在候选中考虑最多两个候选,该五个潜在候选来自位于如图2示出的位置的PU,这些位置与运动Merge的那些位置相同。当前PU的左侧的推导顺序被定义为A0、A1以及缩放的A0、缩放的A1。当前PU的上侧的推导顺序被定义为B0、B1、B2、缩放的B0、缩放的B1、缩放的B2。因此,对于每一侧,存在四种可用作运动矢量候选的情况,其中两种情况不需要使用空域缩放,并且两种情况使用空域缩放。四种不同的情况总结如下。
无空域缩放
(1)相同的参考图片列表,以及相同的参考图片索引(相同的POC)
(2)不同的参考图片列表,但是相同的参考图片(相同的POC)
空域缩放
(3)相同的参考图片列表,但是不同的参考图片(不同的POC)
(4)不同的参考图片列表,以及不同的参考图片(不同的POC)
首先校验无空域缩放情况,接下来校验空域缩放。不管参考图片列表如何,当POC在相邻PU的参考图片与当前PU的参考图片之间是不同的时,考虑空域缩放。如果左方候选的所有PU都不可用或者是被帧内编解码的,则允许对上方运动矢量进行缩放,以帮助左方和上方MV候选的并行推导。否则,对上侧运动矢量不允许空域缩放。
在空域缩放过程中,以与时域缩放类似的方式缩放相邻PU的运动矢量,如图9所示,主要差异在于当前PU的参考图片列表和索引被给定为作为输入;实际缩放过程与时域缩放过程相同。
2.1.3.3时域运动矢量候选
除了参考图片索引推导之外,用于时域Merge候选的推导的所有过程与用于空域运动矢量候选的推导的过程相同(见图6)。将参考图片索引信令通知给解码器。
2.2 VVC中的帧间预测方法
有几种用于帧间预测改进的新编解码工具,例如用于针对仿射块和平移运动块信令通知MVD的自适应运动矢量差分辨率(AMVR)、仿射预测模式、三角预测模式(TPM)、替代TMVP(ATMVP)、广义双向预测(GBI)、双向光流(BIO)、帧内块复制(IBC)等。
2.2.1自适应运动矢量差分辨率
在HEVC中,当use_integer_mv_flag在条带头中等于0时,以四分之一亮度样本为单位信令通知(在PU的运动矢量与预测运动矢量之间的)运动矢量差(MVD)。在VVC中,引入了局部自适应运动矢量分辨率(LAMVR)。
2.2.1.1用于平移运动块的AMVR
在VVC中,MVD可以以四分之一亮度样本、整数亮度样本或四个亮度样本(即1/4像素、1像素、4像素)为单位进行编解码。在编解码单元(CU)级别控制MVD分辨率,并且向具有至少一个非零MVD分量的每个CU,有条件地信令通知MVD分辨率标志。
对于具有至少一个非零MVD分量的CU,信令通知第一标记,以指示是否在CU中使用四分之一亮度样本MV精度。当第一标志(等于1)指示未使用四分之一亮度样本MV精度时,信令通知另一个标志,以指示是否使用整数亮度样本MV精度或四个亮度样本MV精度。
当CU的第一MVD分辨率标志为零,或未针对CU编解码(意味着CU中的所有MVD均为零)时,四分之一亮度样本MV分辨率被用于该CU。当CU使用整数亮度样本MV精度或四个亮度样本MV精度时,该CU的AMVP候选列表中的MVP被取整到对应的精度。
2.2.1.2仿射运动块的AMVR
类似于用于平移运动块的设计(又称为普通AMVR模式),AMVR模式扩展到仿射编解码块(又称为仿射AMVR模式)。
对于仿射AMVR模式,支持三种MV/MVD分辨率,即{1/16,1/4,1}像素。
2.2.2三角预测模式
三角预测模式(TPM)的概念是为了引入用于运动补偿预测的新三角分割。如图10所示,它将CU在对角线方向或对角线反向方向上分成两个三角预测单元。CU中的每个三角预测单元使用其自己的单向预测运动矢量和参考帧索引来帧间预测,该单向预测运动矢量和参考帧索引是从单个单向预测候选列表中推导的。在预测三角预测单元之后,对角线边缘进行自适应加权处理。然后,将变换和量化过程应用于整个CU。注意,此模式仅适用于Merge模式(注意:跳过模式被视为特殊的Merge模式)。
2.2.2.1 TPM的单向预测候选列表
被称为TPM运动候选列表的单向预测候选列表包括五个单向预测运动矢量候选。其从七个相邻块推导而来,该七个相邻块包括五个空域相邻块(1至5)和两个时域上并置的块(6至7),如图11所示。收集七个相邻块的运动矢量,并根据以下顺序将其放入单向预测候选列表中:单向预测运动矢量、双向预测运动矢量的L0运动矢量、双向预测运动矢量的L1运动矢量的顺序以及双向预测运动矢量的L0和L1运动矢量的平均运动矢量。如果候选数量少于五个,则将零运动矢量添加到列表中。在此列表中为TPM添加的运动候选称为TPM候选,从空域/时域块推导的运动信息称为常规运动候选。
更具体地,涉及以下步骤:
当从空域相邻块中添加常规运动候选时,以完全修剪操作从A1、B1、B0、A0、B2、Col和Col2中获得常规运动候选(对应于图11中的块1-7)。
设置变量numCurrMergeCand=0。
对于从A1、B1、B0、A0、B2、Col和Col2推导的每个常规运动候选,如果未修剪并且numCurrMergeCand小于5,如果常规运动候选是单向预测的(来自列表0或列表1),则将其作为TPM候选直接添加到Merge列表中,并且numCurrMergeCand增加1。这样的TPM候选被称为“原始单向预测的候选”。
应用完全修剪。
对于从A1、B1、B0、A0、B2、Col和Col2推导的并且numCurrMergeCand小于5的每个常规运动候选,如果常规运动候选是双向预测的,则将来自列表0的运动信息作为新的TPM候选添加到TPM Merge列表(即,修改为来自列表0的单向预测),并将numCurrMergeCand增加1。这样的TPM候选被称为“截断的列表0-预测的候选”。
应用完全修剪。
对于从A1、B1、B0、A0、B2、Col和Col2推导的并且numCurrMergeCand小于5的每个常规运动候选,如果常规运动候选是双向预测的,则将来自列表1的运动信息添加到TPM Merge列表(即,修改为来自列表1的单向预测),并将numCurrMergeCand增加1。这样的TPM候选被称为“截断的列表1-预测的候选”。
应用完全修剪。
对于从A1、B1、B0、A0、B2、Col和Col2推导的并且numCurrMergeCand小于5的每个常规运动候选,如果常规运动候选是双向预测的,
如果列表0参考图片的条带QP小于列表1参考图片的条带QP,则列表1的运动信息首先缩放到列表0参考图片,并且将两个MV的平均值(一个来自原始列表0,并且另一个是来自列表1的缩放的MV)添加到TPM Merge列表中,这样的候选被称为来自列表0运动候选的平均的单向预测,并将numCurrMergeCand增加1。
否则,首先将列表0的运动信息缩放到列表1参考图片,然后将两个MV的平均值(一个来自原始列表1,并且另一个是来自列表0的缩放的MV)添加到TPM Merge列表中,这样的TPM候选被称为来自列表1运动候选的平均的单向预测,并将numCurrMergeCand增加1。
进行完全修剪。
如果numCurrMergeCand小于5,则添加零运动矢量候选。
当将候选插入列表时,如果必须将其与所有先前添加的候选进行比较以查看其是否与其中一个相同,则此过程称为完全修剪。
2.2.2.2自适应加权过程
在预测每个三角预测单元之后,将自适应加权过程应用于两个三角预测单元之间的对角边,以推导整个CU的最终预测。如下定义两个加权因子组:
第一加权因子组:{7/8、6/8、4/8、2/8、1/8}和{7/8、4/8、1/8}分别用于亮度和色度样本;
第二加权因子组:{7/8、6/8、5/8、4/8、3/8、2/8、1/8}和{6/8、4/8、2/8}分别用于亮度和色度样本。
基于两个三角预测单元的运动矢量的比较来选择加权因子组。当两个三角预测单元的参考图片彼此不同或者它们的运动矢量差大于16个像素时,使用第二加权因子组。否则,使用第一加权因子组。
2.2.2.3三角预测模式(TPM)的信令通知
可以首先信令通知指示是否使用TPM的一位标志。之后,进一步信令通知两个划分模式的指示(如图10所示),以及为两个分割中的每一个选择的Merge索引。
2.2.2.3.1 TPM标志的信令通知
分别用W和H表示一个亮度块的宽度和高度。如果W*H<64,则禁用三角预测模式。
当以仿射模式对一个块进行编解码时,三角预测模式也被禁用。
当以Merge模式对一个块进行编解码时,可以信令通知一位标志以指示是否对该块是否启用或禁用三角预测模式。
基于以下等式,用3个上下文对标志进行编解码:
Ctx index=((left block Lavailable&&Lis coded with TPM?)1:0)+((Aboveblock Aavailable&&A is coded with TPM?)1:0)。
2.2.3仿射运动补偿预测
在HEVC中,对于运动补偿预测(MCP)仅应用平移运动模型。而在现实世界中,存在许多种运动,例如放大/缩小、旋转、透视运动和其它不规则的运动。在VVC中,简化的仿射变换运动补偿预测应用于4-参数仿射模型和6-参数仿射模型。如图13所示,该块的仿射运动场由4-参数仿射模型的两个控制点运动矢量(CPMV)和6-参数仿射模型的3个CPMV描述。
块的运动矢量场(MVF)由以下等式分别以等式(1)中的4-参数仿射模型(其中4-参数定义为变量a,b,e和f)和等式(2)中的6-参数仿射模型(其中4-参数定义为变量a,b,c,d,e和f)描述:
Figure BDA0003205942650000151
Figure BDA0003205942650000152
其中(mvh 0,mvh 0)是左顶角控制点的运动矢量,并且(mvh 1,mvh 1)是右顶角控制点的运动矢量,并且(mvh 2,mvh 2)是左下角控制点的运动矢量,所有三个运动矢量被称为控制点运动矢量(CPMV),(x,y)代表相对于当前块内左上角样本的代表点的坐标,并且(mvh(x,y),mvv(x,y))是为位于(x,y)的样本所推导的运动矢量。CP运动矢量可以被信令通知(如在仿射AMVP模式中)或即时推导(如在仿射Merge模式中)。w和h是当前块的宽度和高度。实践中,该除法是通过取整操作并右移实现。在VTM中,代表点定义为子块的中心位置,例如,当子块的左上角相对于当前块内左上角样本的坐标为(xs,ys),代表点的坐标定义为(xs+2,ys+2)。对于每个子块(即,VTM中的4×4),代表点别用于推导整个子块的运动矢量。
为了进一步简化运动补偿预测,应用基于子块的仿射变换预测。为了推导每个M×N(在当前VVC中,M和N两者都被设置为4)子块的运动矢量,如图14所示,根据等式(1)和(2)计算每个子块的中心样本的运动矢量并将其取整至1/16的分数精度。然后,可以应用1/16像素的运动补偿插值滤波器,以利用推导的运动矢量生成每个子块的预测。1/16像素的插值滤波器通过仿射模式引入。
在MCP之后,每个子块的高精度运动矢量以与正常运动矢量相同的精度被取整并保存。
2.2.3.1仿射预测的信令通知
与平移运动模型相似,由于仿射预测,也存在用于信令通知辅助信息的两种模式。它们是仿射_INTER和仿射_MERGE模式。
2.2.3.2 AF_INTER模式
对于宽度和高度均大于8的CU,可以应用AF_INTER模式。在比特流中信令通知CU级别的仿射标志,以指示是否使用AF_INTER模式。
在此模式下,对于每个参考图片列表(列表0或列表1),仿射AMVP候选列表按以下顺序由三种类型的仿射运动预测符构建,其中每个候选包括当前块的估计的CPMV。在编码器侧(诸如在图17中的mv0 mv1 mv2)发现的最佳CPMV与估计的CPMV之差被信令通知。另外,进一步信令通知从其推导估计的CPMV的仿射AMVP候选的索引。
继承的仿射运动预测符
检查顺序类似于HEVC AMVP列表构建中的空域MVP的检查顺序。首先,从进行了仿射编解码,并且具有与当前块相同的参考图片的{A1,A0}中的第一个块推导左继承的仿射运动预测符。其次,从以仿射编解码并且具有与当前块中相同的参考图片的{B1,B0,B2}中的第一块推导上述继承的仿射运动预测符。在图16中示出了五个块A1,A0,B1,B0,B2。
一旦发现相邻块以仿射模式编解码,则覆盖该相邻块的编解码单元的CPMV被用于推导当前块的CPMV的预测符。例如,如果A1以非仿射模式编解码,并且A0以4-参数仿射模式编解码,则左继承的仿射MV预测符将从A0推导。在这种情况下,覆盖A0的CU的CPMV,如图18(b)中的左上CPMV的
Figure BDA0003205942650000161
和右上CPMV的
Figure BDA0003205942650000162
所标记的,被用于推导当前块的估计的CPMV,用
Figure BDA0003205942650000163
标记当前块的左上(坐标(x0,y0))、右上(坐标(x1,y1))和右下位置(坐标(x2,y2))。
构建的仿射运动预测符
构建的仿射运动预测符包括控制点运动矢量(CPMV),该控制点运动矢量是从具有相同参考图片的相邻帧间编解码块推导的,如图17所示。如果当前仿射运动模型为4-参数仿射,则CPMV的数量为2,否则,如果当前仿射运动模型为6-参数仿射,则CPMV的数量为3。左上CPMV
Figure BDA0003205942650000164
由在以帧间编解码并且具有与当前块相同的参考图片的{A,B,C}组中的第一块处的MV推导。右上CPMV
Figure BDA0003205942650000165
由在以帧间编解码并且具有与当前块相同的参考图片的{D,E}组中的第一块处的MV推导。左下CPMV
Figure BDA0003205942650000166
由在以帧间编解码并且具有与当前块相同的参考图片的{F,G}组中的第一块处的MV推导。
如果当前的仿射运动模型是4-参数仿射,则只有找到
Figure BDA0003205942650000167
Figure BDA0003205942650000168
二者时,才会将构建的仿射运动预测符插入候选列表,即,将
Figure BDA0003205942650000169
Figure BDA00032059426500001610
用作当前块的左上(坐标(x0,y0))、右上(坐标(x1,y1))位置的估计的CPMV。
如果当前的仿射运动模型是6-参数仿射,则只有找到所有
Figure BDA00032059426500001611
Figure BDA0003205942650000171
时,才会将构建的仿射运动预测符插入候选列表,即,将
Figure BDA0003205942650000172
and
Figure BDA0003205942650000173
用作当前块的左上(坐标为(x0,y0))、右上(坐标为(x1,y1))和右下(坐标(x2,y2))位置的估计CPMV。
当将构建的仿射运动预测符插入候选列表时,不应用修剪过程。
正常AMVP运动预测符
以下情况适用直到仿射运动预测符的数量达到最大。
通过将所有CPMV设置为等于
Figure BDA0003205942650000174
(如果可用)来推导仿射运动预测符。
通过将所有CPMV设置为等于
Figure BDA0003205942650000175
(如果可用)来推导仿射运动预测符。
通过将所有CPMV设置为等于
Figure BDA0003205942650000176
(如果可用)来推导仿射运动预测符。
通过将所有CPMV设置为等于HEVC TMVP(如果可用)来推导仿射运动预测符。
通过将所有CPMV设置为零MV来推导仿射运动预测符。
注意,在构建仿射运动预测符中已经推导了
Figure BDA0003205942650000177
在AF_INTER模式中,当使用4/6参数仿射模式时,需要2/3控制点,并且因此需要为这些控制点编解码2/3MVD,如图15所示。提出MV可以如下推导,即,从mvd0预测mvd1和mvd2
Figure BDA0003205942650000178
Figure BDA0003205942650000179
Figure BDA00032059426500001710
其中,
Figure BDA00032059426500001711
mvdi和mv1分别是左顶像素(i=0)、右顶像素(i=1)或左底像素(i=2)的预测运动矢量、运动矢量差异和运动矢量,如图15(b)所示。注意,两个运动矢量(例如,mvA(xA,yA)和mvB(xB,yB))的相加等于单独地两个分量的求和。即,newMV=mvA+mvB以及newMV的两个分量分别设置为(xA+xB)和(yA+yB)。
2.2.3.3 AF_MERGE模式
当以AF_MERGE模式应用CU时,它从有效的相邻重建块中得到以仿射模式编解码的第一块。并且,如图18(a)所示,候选块的选择顺序是从左、上、右上、左下到左上(依次由A,B,C,D,E表示)。例如,如果如图18(b)中的A0所示以仿射模式对相邻的左下块进行编解码,则取回包含块A的相邻CU/PU的左上角和右上角的左下角的控制点(CP)运动矢量mv0 N,mv1 N和mv2 N。并且基于mv0 N,mv1 N和mv2 N计算当前CU/PU上的左上角/右上/左下的运动矢量mv0 C,mv1 C和mv2 C(仅用于6-参数仿射模型)。应注意在VTM-2.0中,位于左上角的子块(例如,VTM中的4×4块)存储mv0,如果当前块是仿射编解码的,则位于右上角的子块存储mv1。如果使用6-参数仿射模型对当前块进行编解码,则位于左下角的子块将存储mv2;否则(使用4-参数仿射模型),LB存储mv2’。其它子块存储用于MC的MV。
在根据等式(1)和(2)中的简化的仿射运动模型推导当前CU mv0 C,mv1 C和mv2 C的CPMV之后,生成该当前CU的MVF。为了识别当前CU是否使用AF_MERGE模式编解码,当存在至少一个相邻块以仿射模式编解码时,可以在比特流中信令通知仿射标志。
作为示例,仿射Merge候选列表通过以下步骤构建:
插入继承的仿射候选
继承的仿射候选是指候选是从其有效领域仿射编解码的块的仿射运动模型推导的。从相邻块的仿射运动模型中推导最多两个继承的仿射候选,并将其插入到候选列表中。对于左预测器,扫描顺序为{A0,A1};对于上预测器,扫描顺序为{B0,B1,B2}。
插入构建的仿射候选
如果仿射Merge候选列表中的候选数量小于MaxNum仿射Cand(例如,5),则将构建的仿射候选插入到候选列表中。构建的仿射候选是指通过组合每个控制点的相邻运动信息来构建候选。
首先,从图19所示的指定的空域领域和时域领域推导控制点的运动信息。CPk(k=1、2、3、4)表示第k个控制点。A0,A1,A2,B0,B1,B2和B3是用于预测CPk的空域位置(k=1、2、3);T是用于预测CP4的时域位置。
CP1,CP2,CP3和CP4的坐标分别是(0,0),(W,0),(H,0)和(W,H),其中W和H是当前块的宽度和高度。
根据以下优先级顺序获得每个控制点的运动信息:
-对于CP1,检查优先级为B2->B3->A2。如果B2可用,则使用B2。否则,如果B2不可用,则使用B3。如果B2和B3都不可用,则使用A2。如果三个候选都不可用,则无法获得CP1的运动信息。
-对于CP2,检查优先级为B1->B0。
-对于CP3,检查优先级为A1->A0。
-对于CP4,使用T。
其次,使用控制点的组合来构建仿射Merge候选。
需要三个控制点的运动信息来构建6-参数仿射候选。可以从以下四个组合中的一个选择三个控制点:({CP1,CP2,CP4},{CP1,CP2,CP3},{CP2,CP3,CP4},{CP1,CP3,CP4})。{CP1,CP2,CP3},{CP2,CP3,CP4},{CP1,CP3,CP4}的组合将转换为由左上、右上和左下控制点表示的6-参数运动模型。
需要两个控制点的运动信息来构建4-参数仿射候选。可以从以下两个组合中的一个选择两个控制点:({CP1,CP2},{CP1,CP3})。这两个组合将转换为由左上和右上控制点表示的4-参数运动模型。
按照以下顺序将构建的仿射候选的组合插入到候选列表中:
{CP1,CP2,CP3},{CP1,CP2,CP4},{CP1,CP3,CP4},{CP2,CP3,CP4},{CP1,CP2},{CP1,CP3}。
对于每个组合,检查每个CP的列表X的参考索引,如果它们全部相同,则该组合具有用于列表X的有效CPMV。如果该组合对于列表0和列表1都没有有效的CPMV,则将此组合被标记为无效。否则,它是有效的,并将CPMV放入子块Merge列表中。
用零运动矢量填充
如果仿射Merge候选列表中的候选数量小于5,则将具有零参考索引的零运动矢量插入到候选列表中,直到列表已满。
更具体地,对于子块Merge候选列表,将4参数Merge候选的MV设置为(0,0)并且将预测方向来自列表0的单向预测(对于P条带)和双向预测(对于B条带)。
2.2.4当前图片参考
在HEVC屏幕内容编解码扩展(SCC)中采用了帧内块复制(即,IBC或图片块内补偿),也称为当前图片参考(CPR)。该工具对于屏幕内容视频的编解码非常有效,因为在相同的图片中重复的样式经常出现在文本和图形丰富的内容中。将具有相同或相似样式的先前重构的块用作预测符可以有效地减少预测误差并因此提高编解码效率。块内补偿的示例在图20中示出。
类似于HEVC SCC中的CRP的设计,在VVC中,在序列和图片级别信令通知IBC模式的使用。在序列参数集(SPS)处启用IBC模式时,可以在图片级别启用它。当在图片级别处启用IBC模式时,当前重建的图片将被视为参考图片。因此,在现有的VVC帧间模式之上无需在块级别上进行语法更改以信令通知IBC模式的信号的使用。
主要特征:
将其视为特殊的帧间模式。因此,Merge和跳过模式也可用于IBC模式。Merge候选列表构建是统一的,包含来自相邻位置的Merge候选,这些候选以IBC模式或HEVC帧间模式编解码。取决于所选的Merge索引,处于Merge或跳过模式的当前块可以合并到IBC模式编解码的领域中或合并到具有以不同图片作为参考图片的正常帧间模式编解码的领域。
IBC模式的运动矢量(也称为块矢量)以整数像素精度进行编解码,但由于在插值和去方块(deblocking)阶段需要四分之一像素精度,因此在解码后以1/16像素精度存储在存储器中。当用于IBC模式的运动矢量预测时,存储的矢量预测符将右移4。
搜索范围:限制在当前CTU之内。
当启用仿射模式/三角模式/GBI/加权预测时,不允许进行CPR。
2.2.5 VVC中的Merge列表设计
VVC中支持三种不同的Merge列表构建过程:
子块Merge候选列表:它包括ATMVP和仿射Merge候选。仿射模式和ATMVP模式两者共享一个Merge列表构建过程。在此,可以按顺序添加ATMVP和仿射Merge候选。子块Merge列表的大小在条带头中信令通知,最大值为5。
单向预测TPM Merge列表:对于三角预测模式,即使两个分割可以选择自己的Merge候选索引,也共享两个分割的一个Merge列表构建过程。当构建该Merge列表时,检查该块的空域相邻块和两个时域块。从空域领域和时域块推导的运动信息在我们的IDF中称为常规运动候选。这些常规运动候选被进一步用于推导多个TPM候选。请注意,变换是在整个块级别进行的,即使两个分割可以使用不同的运动矢量来生成自己的预测块。单向预测TPM Merge列表尺寸被固定为5。
常规Merge列表:对于剩余的编解码块,共享一个Merge列表的构建过程。在此,可以按顺序插入空域/时域/HMVP、成对组合的双向预测Merge候选和零运动候选。在条带头中信令通知常规Merge列表的大小,并且最大值为6。MMVD,
IBC Merge列表:它以与常规Merge列表类似的方式完成。
2.2.5.1子块Merge候选列表
提出将所有子块相关运动候选放入除了非子块Merge候选的常规Merge列表之外,还放入单独的Merge列表中。
将与子块相关的运动候选放入称为“子块Merge候选列表”的单独的Merge列表中。
在一个示例中,子块Merge候选列表包括仿射Merge候选、以及ATMVP候选和/或基于子块的STMVP候选。
子块Merge候选列表按以下顺序填充候选:
ATMVP候选(可以是可用的或不可用的);
仿射Merge列表(包括继承的仿射候选;以及构建的仿射候选)
填充为零MV 4-参数仿射模型
2.2.5.1.1 ATMVP(又称为子块时域运动矢量预测器,SbTMVP)
ATMVP的基本思想是为一个块推导多组时域运动矢量预测值。每个子块分配有一组预测器。当生成ATMVP Merge候选时,应用以下过程:
a.按顺序检查图2所示的相邻块A1,以找到第一个帧间编解码的但不是CPR编解码的块,标记为块X;
b.初始化TMV=(0,0)。如果存在块X的MV(标记为MV’),则参考并置的参考图片(如在条带头中用信号通知),将TMV设置为等于MVn。
c.假设当前块的中心点为(x0,y0),则在并置图片中将对应位置(x0,y0)定位为M=(x0+MV’x,y0+MV’y)。找到覆盖M的块Z。
i.如果Z是帧内编解码的,则ATMVP不可用;
ii.如果Z是帧间编解码的,则将块Z的两个列表的MVZ_0和MVZ_1缩放为(Reflist0 index 0)和(Reflist 1 index 0)以作为MVdefault0,MVdefault1,并储存。
d.对于每个8×8子块,假设其中心点为(x0S,y0S),然后将并置图片中将对应的(x0S,y0S)位置定位为MS=(x0S+MV’x,y0S+MV’y)。找到覆盖MS的块ZS。
i.如果ZS是帧内编解码的,则将MVdefault0、MVdefault1分配给子块;
ii.如果ZS是帧间编解码的,则块ZS的两个列表的MVZS_0和MVZS_1被缩放为(Reflist 0 index 0)和(Reflist 1 index 0),并且被分配给子块。
2.2.5.2常规Merge列表
与Merge列表设计不同,在VVC中,采用了基于历史的运动矢量预测(HMVP)方法。
在HMVP中,存储了先前编解码的运动信息。将先前编解码的块的运动信息定义为HMVP候选。多个HMVP候选存储在一个名为HMVP表的表中,并且在即时编码/解码处理期间维持该表。当开始对新的片/LCU行/条带进行编码/解码时,HMVP表被清空。每当存在帧间编解码块和非子块、非TPM模式时,相关联的运动信息就会作为新的HMVP候选添加到表的最后一个条目。整个编解码流程如图21所示。
HMVP候选可以在AMVP和Merge候选列表两者的构建过程中使用。图22示出了修改的Merge候选列表构建过程。当在TMVP候选插入之后,Merge候选列表未满时,可以利用存储在HMVP表中的HMVP候选来填充Merge候选列表。考虑到一个块通常就运动信息而言与最近的相邻块具有更高的相关性,因此以索引的降序插入表中的HMVP候选。最先将表中的最后一个条目添加到列表中,而最后添加第一个条目。类似地,冗余移除被应用于HMVP候选。一旦可用Merge候选的总数达到允许被信令通知的Merge候选的最大数量,则Merge候选列表构建过程终止。
注意,所有的空域/时域/HMVP候选都应以非IBC模式进行编解码。否则,不允许将其添加到常规Merge候选列表中。
HMVP表包含多达5个常规运动候选,并且每个候选都是唯一的。
2.2.5.3 IBC Merge列表
当添加IBC时,HMVP候选也适用于IBC Merge列表。
更具体地,可以存储另外5个IBC候选。在当前的实现方式中,常规候选和IBC候选存储在相同HMVP表中。但是,它们是独立使用和更新的。前M个(M<=5)候选用于常规Merge/AMVP列表的使用;并且剩余的N个候选(N<=5)用于IBC模式的使用。维持两个计数器以指示HMVP表中有多少常规运动候选和有多少IBC运动候选。因此,等于使用2个HMVP表,一个用于常规Merge模式,并且另一个用于IBC模式。
共享与常规MV Merge相同的过程,但是不允许TMVP,零矢量意味着不可用,因为它是无效的。注意,对于空域相邻块,仅当其以IBC模式编解码时,相关联的运动信息才可以被添加到IBC Merge列表。同时,对于HMVP部分,仅最后几个HMVP候选(其是存储的IBC运动候选)可以在IBC Merge列表中考虑。
2.2.6共享Merge列表
为了降低解码器复杂度并支持并行编码,提议为CU划分树中一个祖先节点的所有叶编解码单元(CU)共享相同的Merge候选列表,以实现小的跳过/Merge编解码的CU的并行处理。祖先节点被称为Merge共享节点。在Merge共享节点作为叶CU的情况下,在Merge共享节点处生成共享Merge候选列表。
更具体地,可以适用如下:
如果块具有不大于32(例如,8×4或4×8)的亮度样本,并且被划分成2个4×4的子块,则使用非常小的块(例如,两个相邻的4×4块)之间的Merge列表。
如果块具有大于32的亮度样本,但是,在划分之后,至少一个子块小于阈值(32),则划分的所有子块共享相同的Merge列表(例如,16×4或4×16三元划分或8×8四元划分)。
这种限制仅适用于常规Merge模式,而不适用于TPM和IBC模式。
2.2.6.1Merge共享节点下的子块的HMVP表更新和使用
分配了临时的HMVP表。在此之前,必须先将原始HMVP表复制到临时HMVP表,然后再输入一个共享区域的第一个CU。
在图23所示的示例:Merge共享模式的示例,将一个8×8QT划分为4个4×4CU。在执行第一个CU(例如,左上方的4×4CU)之前,必须将历史列表复制到临时HMVP表(HmvpCandListShared[])中,并对于在共享的父级(图中的Merge共享节点)中的每个4×4,如果使用常规Merge模式进行编解码,则其需要Merge模式的历史列表,并且使用临时HMVP表中的候选运动。
然而,在解码一个4×4CU之后,如果它是Merge或AMVP或IBC模式,则原始HMVP表将相应地更新。也就是说,对于在共享的父级(图中的Merge共享节点)中的每个4×4中,如果使用非常规Merge模式——诸如AMVP模式——进行编解码,则其需要AMVP模式的历史列表,并且使用原始HMVP表中的运动候选,该原始HMVP表可能包含相同Merge共享节点下其他子块的运动信息。
3.由实施例解决的问题的示例
共享Merge列表的当前设计具有以下问题:
共享Merge列表仅适用于常规Merge模式。如果一个块以IBC模式编解码,则它可能仍会使用其相邻块的运动信息,这与共享Merge列表的概念冲突。
对于较小的块,如果启用了相同的跨分量线性模型(CCLM)/局部照明补偿(LIC),则它们将依赖于子块的相邻重构样本来编解码另一个子块。这种设计降低了流水线的吞吐量。
需要两个HMVP表,一个是原始HMVP表(其包括常规和IBC模式两者的运动候选),一个是临时HMVP表,用于对共享Merge列表进行编解码。高速缓存的大小增加了一倍。
如果共享Merge列表应用于所有类型的模式,则对于一个Merge共享节点,可能需要构建多个共享Merge列表,并且每个共享Merge列表对应于一个给定模式(诸如,常规Merge模式、TPM、IBC等)。这样的设计仍然非常复杂。
4.实施例的示例
下面的详细技术应被视为示例以解释一般概念。这些技术不应被狭义地解释。此外,可以以任何方式组合这些技术。
1.IBC Merge共享节点下的所有子块可以共享相同的IBC Merge候选列表。
a.在一个示例中,任何子块,如果以IBC Merge模式进行编解码,则其使用为IBCMerge共享节点构建的相同IBC Merge候选列表。
b.在一个示例中,不允许将子块的运动信息添加到相同运动共享节点下的另一个子块的IBC Merge候选列表中。
c.在一个示例中,为整体共享节点块构建IBC Merge候选列表,并且IBC Merge候选列表由从共享节点块划分的所有子块共享。
d.在一示例中,可以维持两个HMVP表,一个全局表和一个临时表。
i.在对运动共享节点下的第一子块进行解码之前,将全局HMVP表复制到临时HMVP表。
ii.在相同运动共享节点下的子块的运动信息可以用于更新全局HMVP表,但是不允许用于更新临时HMVP表。
iii.临时HMVP表中的运动候选可以用于构建IBC Merge候选列表,但是不允许全局HMVP表中的运动候选用于构建IBC Merge候选列表。
iv.对于不在运动共享节点下的块(诸如,具有大小等于8×16的块),全局HMVP表中的运动候选可以用于构建IBC Merge候选列表,并且这些块的解码运动信息可以用于更新全局HMVP表。
2.运动共享节点下的所有子块可以共享相同的运动候选列表,诸如AMVP候选列表、TPM候选列表。
a)在一个示例中,为共享节点块整体构建候选列表。
b)在一个示例中,对于这样的运动候选列表构建过程,不允许在运动候选列表中考虑这些子块中的任何一个的运动信息。
c)这些方法也可以适用于IBC模式,诸如IBC AMVP候选列表、IBC TPM候选列表。
2.参数共享节点下的所有子块可以共享相同的跨分量线性模型(CCLM)/局部照明补偿(LIC)参数或在解码器侧推导的其他参数。
a)在一个示例中,为作为整体的共享节点块推导共享参数。
b)在一个示例中,不允许将这些子块中的任何一个块的重构样本用于这些子块中的另一个块的参数推导过程。
c)在一个示例中,不允许将这些子块中的任何一个块的参考样本用于这些子块中的另一个块的参数推导过程。
3.提议当在运动/Merge/IBC Merge共享节点下对子块进行编码/解码时,不允许为共享的Merge/AMVP候选列表添加从HMVP表推导的运动候选。
a)在一个示例中,共享的Merge/AMVP候选列表不包含任何HMVP候选。
b)在一个示例中,当遇到运动/Merge/IBC Merge共享节点时,不允许从HMVP表中检查/添加运动候选。
c)
4.对于以上项目符号,IBC Merge共享节点/运动共享节点和/或参数共享节点可以被定义为与用于常规Merge模式的Merge共享节点相同。
a)在一个示例中,如果块内的亮度样本的数量不大于(或小于)阈值,并且其被进一步划分,则将该块称为IBC Merge共享节点/运动共享节点和/或参数共享节点。
b)如果块内的亮度样本的数量大于阈值,但是,在划分之后,至少一个子块小于阈值,这样的块被称为IBC Merge共享节点/运动共享节点和/或参数共享节点。
c)在一个示例中,阈值被定义为32或64或128。
d)可替代地,如果将一个块划分为多个子块,并且至少一个子块的宽度等于M,和/或至少一个子块的高度等于N,则将该块称为IBC Merge共享节点/运动共享节点和/或参数共享节点。在一个示例中,M和N都被设置为4。
e)可替代地,可以使用IBC Merge共享节点和/或运动共享节点和/或参数共享节点的不同阈值/M和N的设置/定义。
5.由DMVD技术(例如,DMVR)而细化的运动信息不被允许用来更新HMVP表。
6.提议针对从HMVP表推导的运动候选禁用DMVD处理。
a)在一个示例中,如果Merge候选是直接从HMVP表中复制的,则跳过DMVD处理。
b)在一个示例中,如果通过HMVP表中的运动候选来生成Merge候选,诸如,从HMVP表中的至少一个候选推导的成对的双向预测候选,则跳过DMVD处理。
c)可替代地,此外,由DMVD处理得到的一个块的细化运动信息可以用于更新HMVP表。
7.提议对Merge/运动/IBC Merge/参数共享节点下的所有子块禁用HMVP表更新处理。在这种情况下,临时HMVP表将被完全移除。
a)在一个示例中,在对共享节点下的第一子块进行编码/解码之前以及在对共享节点下的最后一个子块进行编码/解码之后,HMVP表保持不变。
b)可替代地,可以仅针对某个子块(例如,编码/解码顺序中的最后一个块)启用HMTP表更新处理。
c)可替代地,可以首先存储所有子块的运动信息,并且可以利用多个代表性运动信息的一个或多个来更新HMVP表。
8.在使用共享的Merge/运动列表对块进行编解码之后,如何更新HMVP表可能取决于编解码模式信息。
a)在一个示例中,编解码模式信息包括常规Merge模式和IBC模式。
9.一致性比特流应满足以下条件:当找到Merge/IBC Merge/运动共享节点时,所有Merge编解码的子块共享相同模式。
a)在一个示例中,如果子块以常规Merge模式编解码,则所有子块都应以常规Merge模式编解码。
b)在一个示例中,对于所有子块,如果一个子块以TPM模式编解码,则所有子块均应以TPM编解码。
c)在一个示例中,对于所有子块,如果一个子块以IBC Merge模式编解码,则所有子块均应以IBC模式编解码。
10.提议当找到Merge共享节点时,所有子块共享相同的Merge列表和列表中的相同运动候选。
a)在一个示例中,对于所有子块,所选择的运动候选索引可以仅被编解码一次。
i.在一个示例中,可以仅以编码/解码顺序为第一Merge编解码的子块编解码所选择的运动候选索引。
b)可替代地,仍然可以与当前设计一样对多个运动候选索引进行编解码,但是,一致性比特流应满足全部被限制为相同。
11.提议当找到Merge共享节点时,对于一个特定模式类型(例如常规Merge模式、IBC Merge模式、三角模式),所有子块共享相同的Merge列表和列表中的相同运动候选。
a)在一个示例中,对于所有子块,所选择的模式索引可以仅被编解码一次。
i.在一个示例中,可以以编码/解码顺序仅对第一Merge编解码的子块的所选择的模式索引进行编解码。
b)可替代地,仍然可以与当前设计一样对多个模式索引进行编解码,但是,一致性比特流应满足全部被限制为相同。
c)可替代地,仅允许一种特定的Merge模式类型,诸如常规Merge模式。
i.在这种情况下,其他种类的模式类型(例如TPM、IBC模式)的信令通知可以被跳过。
12.提议对于常规块和对于Merge/运动/IBC Merge共享节点块,候选列表构建过程是不同的。
a)在一个示例中,可以将更多候选放入共享节点块的Merge列表中。
b)在一个示例中,可以访问空域相邻块/时域块的不同相对位置,以获取共享节点块的Merge候选。
c)在一个示例中,是否添加运动候选和/或如何从HMVP表添加运动候选可取决于当前块是否为共享节点块。
d)在一个示例中,可以访问更多空域相邻块以获取共享节点块的Merge候选。
e)在一个示例中,可以访问更多时域相邻块以获取共享节点块的Merge候选。
图24是视频处理装置2400的框图。装置2400可用于实现本文所述的一个或多个方法。装置2400可以被实现在智能手机、平板计算机、计算机、物联网(IoT)接收器等中。装置2400可以包括一个或多个处理器2402、一个或多个存储器2404和视频处理硬件2406。处理器2402可以被配置为实现本文所述的一个或多个方法。存储器(多个存储器)2404可用于存储用于实现本文所述的方法和技术的数据和代码。视频处理硬件2406可用于在硬件电路中实现本文所述的一些技术。
图26是用于处理视频的方法2600的流程图。方法2600包括:识别(2605)组成帧内块复制(IBC)Merge共享节点的子视频块,以及使用与IBC Merge共享节点有关的IBC Merge候选列表进行(2610)子视频块的进一步处理。
图27是用于处理视频的方法2700的流程图。方法2700包括确定(2705)从基于历史的运动矢量预测(HMVP)表中推导运动候选,基于从HMVP表推导运动候选的确定,而确定(2710)DMVD处理的操作状态,该操作状态为启用或禁用,并且根据DMVD处理的操作状态进行(2715)视频块的进一步处理。
图28是用于处理视频的方法2800的流程图。方法2800包括确定(2805)子视频块与节点有关,该节点是以下中的一个或多个:Merge共享节点、运动共享节点、帧内块复制(IBC)Merge共享节点或参数共享节点,基于所述子视频块与所述节点相关的确定,而确定(2810)基于历史的运动矢量预测(HMVP)表更新技术的操作状态,该操作状态为启用或禁用,以及根据HMVP表更新技术的操作状态,对视频块进行(2815)进一步的处理。
图29是用于处理视频的方法2900的流程图。方法2900包括:确定(2905)关于第一视频块的编解码模式信息;基于编解码模式信息的确定,而确定(2910)进行基于历史的运动矢量预测(HMVP)表更新技术的特性,以及根据具有该特性的HMVP表更新技术,对第一视频块进行(2915)进一步的处理。
图30是用于处理视频的方法3000的流程图。方法3000包括:对第一视频块进行(3005)第一候选列表构建技术,以及对第二视频块进行(3010)第二候选列表构建技术,第一视频块和第二视频块是不同类型的视频块,并且第二个视频块是以下之一:Merge共享节点块、运动共享节点块或帧内块复制(IBC)Merge共享节点块,并且第一候选列表构建技术不同于第二候选列表构建技术。
图31是用于处理视频的方法3100的流程图。方法3100包括确定(3105)视频的第一视频单元是帧内块复制(IBC)Merge共享节点,并且将第一视频单元划分成多个子块,其中在所述第一视频单元下的以IBC Merge模式编解码的子块被并行处理;推导(3110)第一视频单元下的第一子块的运动信息;并使用推导的运动信息在视频的比特流表示和第一子块之间进行(3115)转换,其中在所述第一子块的运动信息的推导中,省略所述第一视频下的任何其他子块的运动信息。
图32是用于处理视频的方法3200的流程图。方法3200包括确定(3205)视频的第一视频单元是帧内块复制(IBC)高级运动矢量预测(AMVP)共享节点,并且将所述第一视频单元划分为多个子块,其中在所述第一视频单元下的以IBC AMVP模式编解码的子块被并行处理;推导(3210)第一视频单元下的第一子块的运动信息;并使用所推导的运动信息在视频的比特流表示和第一子块之间进行(3215)转换,其中在所述第一子块的运动信息的推导中,省略所述第一视频下的任何其他子块的运动信息。
图33是用于处理视频的方法3300的流程图。方法3300包括确定(3305)视频的第一视频单元是帧间高级运动矢量预测(AMVP)运动共享节点,并且将所述第一视频单元划分为多个子块,其中在所述第一视频单元下的以帧间AMVP模式编解码的子块被并行处理;推导(3310)在第一视频单元下以帧间AMVP模式编解码的多个子块中的第一子块的运动信息;以及基于推导的运动信息,在多个子块的第一子块与包括第一视频单元的视频的比特流表示之间进行(3315)转换,其中在所述第一子块的运动信息的推导中,省略所述第一视频单元下的任何其他子块的运动信息。
图34是用于处理视频的方法3400的流程图。方法3400包括确定(3405)视频的第一视频单元是参数共享节点,并且所述第一视频单元被划分为多个子块;在所述第一子块和包括所述第一视频单元的所述视频的比特流表示之间的转换期间,推导(3410)第一视频单元下的多个子块中的第一子块的参数,其中,第一子块使用编解码工具编解码;并基于参数进行(3415)转换,其中,在转换过程中推导的与所述编解码工具相关联的所述参数独立于相同参数共享节点下的第二子块的信息。
图35是用于处理视频的方法3500的流程图。方法3500包括确定(3505)视频的第一视频单元是运动共享节点,并且将所述第一视频单元划分为作为叶节点的多个子块;推导(3510)第一视频单元下的第一子块的运动候选列表;以及基于运动候选列表,进行(3515)以第一模式编解码的所述多个子块中的所述第一子块和包括所述第一视频单元的所述视频的比特流表示之间的转换,其中,以上述第一模式编解码的所述多个子块中的第二子块的运动信息在所述运动候选列表的构建过程中省略,并且其中,当编码或解码所述第一子块时,从基于历史的运动矢量预测(HMVP)表中推导的运动候选不被添加到所述运动候选列表。
图36是用于处理视频的方法3600的流程图。方法3600包括在第一视频块和包含所述第一视频块的视频的比特流表示之间的转换期间,通过使用当所述第一视频块处于运动共享节点之外时用于第一视频块的第一候选列表构建技术构建的运动列表来预测(3605)第一视频块的运动信息;在第一视频单元的第二视频块和所述视频的比特流表示之间的转换期间,通过使用以用于所述第二视频块的第二候选列表构建技术构建的Merge列表来预测(3610)所述第二视频块的运动信息,所述第二候选列表构建技术不同于所述第一候选列表构建技术,并且所述第一视频单元是共享节点块;以及基于所述第一和第二视频块的所述预测的运动信息进行(3615)转换。
图37是用于处理视频的方法3700的流程图。方法3700包括维持(3705)一个或多个表,其中,每个表包括从先前处理的视频块推导的运动候选,该先前处理的视频块在视频的第一视频块之前被处理;推导(3710)所述第一视频块的运动信息;当启用至少一个解码器侧运动矢量推导(DMVD)技术时,对运动信息应用(3715)细化;使用细化的运动信息在所述第一视频块的比特流表示和所述第一视频块之间进行(3720)转换;以及确定(3725)是否使用细化的运动信息或未细化的运动信息以用于更新一个或多个表。
图38是用于处理视频的方法3800的流程图。方法3800包括维持(3805)一个或多个表,其中,每个表包括从先前处理的视频块推导的运动候选,该先前处理的视频块在视频的第一视频块之前被处理;推导(3810)第一视频块的运动信息;当启用至少一个解码器侧运动矢量推导(DMVD)技术时,对运动信息应用(3815)细化;使用细化的运动信息在所述第一视频块的比特流表示和所述第一视频块之间进行(3820)转换;以及以所述第一视频块的未细化的运动信息来更新(3825)一个或多个表。
图39是用于处理视频的方法3900的流程图。方法3900包括维持(3905)一个或多个表,其中,每个表包括从先前处理的视频块推导的运动候选,该先前处理的视频块在视频中的第一视频块之前被处理;推导(3910)第一视频块的运动信息;基于所述运动信息是否从一个或多个表中推导,使用至少一个解码器侧运动矢量推导(DMVD)技术来确定(3915)启用或禁用所述第一视频块的运动信息的细化;以及基于所述确定,在所述视频的比特流表示和所述第一视频块之间进行(3920)转换。
参考方法2600-3900,在本文的第4节中描述了共享Merge列表下的运动预测及其使用的一些示例。
参考方法2600-3900,可以在视频比特流中编码视频块,其中可以通过使用与共享Merge列表下的运动预测有关的比特流生成规则来实现比特效率。
在本公开中提供了以下示例。
1.一种视频处理方法,包括:确定视频的第一视频单元是帧内块复制(IBC)Merge共享节点,并且将所述第一视频单元划分为多个子块,其中在所述第一视频单元下的以IBCMerge模式编解码的子块被并行处理;推导所述第一视频单元下的第一子块的运动信息;并且使用所述推导的运动信息进行所述视频的比特流表示和所述第一子块之间的转换,其中在所述第一子块的运动信息的推导中,省略所述第一视频下的任何其他子块的运动信息。
2.一种视频处理方法,包括:确定视频的第一视频单元是帧内块复制(IBC)高级运动矢量预测(AMVP)共享节点,并且将所述第一视频单元划分为多个子块,其中在所述第一视频单元下的以IBC AMVP模式编解码的子块被并行处理;推导所述第一视频单元下的第一子块的运动信息;并且使用所述推导的运动信息进行所述视频的比特流表示和所述第一子块之间的转换,其中在所述第一子块的运动信息的推导中,省略所述第一视频下的任何其他子块的运动信息。
3.一种视频处理方法,包括:确定视频的第一视频单元是帧间高级运动矢量预测(AMVP)运动共享节点,并且将所述第一视频单元划分为多个子块,其中在所述第一视频单元下的以帧间AMVP模式编解码的子块被并行处理;推导所述第一视频单元下的以帧间AMVP模式编解码的所述多个子块的第一子块的运动信息;并且基于所述推导的运动信息,进行所述多个子块中的第一子块和包括所述第一视频单元的所述视频的比特流表示之间的转换,其中在所述第一子块的运动信息的推导中,省略所述第一视频单元下的任何其他子块的运动信息。
4.如示例1至3中任一项所述的方法,还包括,构建所述第一子块的运动候选列表,其中从所述运动候选列表推导所述第一子块的所述运动信息。
5.如示例4所述的方法,其中在所述第二子块和所述比特流表示之间的转换期间由所述第二子块使用所述第一子块的运动候选列表。
6.如示例1至4中任一项所述的方法,其中,当到达所述第一视频单元时,构建单个运动候选列表,并且所述构建的单个运动候选列表由从所述第一视频单元划分的所有子块共享。
7.如示例4至6中任一项所述的方法,其中所述运动候选列表通过维持全局基于历史的运动矢量预测(HMVP)表和临时HMVP表来构建,其中每个表包括从之前处理的视频块推导的运动候选。
8.如示例7所述的方法,还包括:将全局HMVP表复制到临时HMVP表;以及在将全局HMVP表复制到临时HMVP表之后,对所述运动共享节点下的所述第一子块解码。
9.如示例7所述的方法,其中,在相同的运动共享节点下的子块的运动信息被用于更新全局HMVP表,而不用于更新临时HMVP表。
10.如示例7所述的方法,其中,临时HMVP表中存储的运动候选被用于预测所述第一视频单元中的子块的运动信息,而全局HMVP表中的运动候选不被用于构建所述单个运动候选列表。
11.如示例7所述的方法,其中,对于不在所述运动共享节点之下的块,所述全局HMVP表中的运动候选被用于构建所述块的运动候选列表。
12.如示例7所述的方法,其中,对于不在所述运动共享节点之下的块,这些块的运动信息被用于进一步更新所述全局HMVP表。
13.如示例1至12中任一项所述的方法,其中,在所述运动候选列表的构建过程中,将任何所述子块的运动信息排除在添加到所述运动候选列表之外。
14.一种视频处理方法,包括:确定视频的第一视频单元为参数共享节点,并且所述第一视频单元被划分为多个子块;在所述第一子块和包括所述第一视频单元的所述视频的比特流表示之间的转换期间,推导在所述第一视频单元下的所述多个子块中的第一子块的参数,其中所述第一子块使用编解码工具编解码;并且基于参数进行所述转换,其中,在转换过程中推导的与所述编解码工具相关联的所述参数独立于相同参数共享节点下的第二子块的信息。
15.如示例14所述的方法,其中,所述编解码工具包括跨分量线性模型(CCLM)、局部照明补偿(LIC)参数、亮度映射和色度缩放(LMCS)或解码器侧推导的其他参数中的至少一个。
16.如示例14所述的方法,其中,在相同参数共享节点下的子块共享所述多个子块中两个子块的相同参数,所述多个子块中的两个子块用相同的编解码工具编解码,并且在解码器侧推导相关联的参数。
17.如示例14所述的方法,其中,共享的参数是从所述第一视频单元外部的信息推导的。
18.如示例14所述的方法,其中,在相同参数共享节点下的任何一个子块的重构样本不用于在所述相同参数共享节点下的所述子块中的另一子块的参数推导过程。
19.如示例14所述的方法,其中,在相同参数共享节点下的任何一个子块的参考样本不用于在所述相同参数共享节点下的所述子块中的另一子块的参数推导过程。
20.一种视频处理方法,包括:确定视频的第一视频单元是运动共享节点,并且将所述第一视频单元划分为作为叶节点的多个子块;推导在所述第一视频单元下的第一子块的运动候选列表;并且基于所述运动候选列表,进行以第一模式编解码的所述多个子块中的所述第一子块和包括所述第一视频单元的所述视频的比特流表示之间的转换,其中,以上述第一模式编解码的所述多个子块中的第二子块的运动信息在所述运动候选列表的构建过程中省略;并且其中,当编码或解码所述第一子块时,从基于历史的运动矢量预测(HMVP)表中推导的运动候选不被添加到所述运动候选列表。
21.如示例20所述的方法,其中,所述第一子块的所述运动候选列表是IBC Merge候选列表,并且所述第一和第二子块是以Merge模式编解码的IBC编解码块。
22.如示例20所述的方法,其中,所述第一子块的所述运动候选列表是IBC高级运动矢量预测(AMVP)候选列表,并且所述第一和第二子块是以AMVP模式编解码的IBC编解码块。
23.如示例20所述的方法,其中,所述第一子块的所述运动候选列表是帧间Merge候选列表,并且所述第一和第二子块是以Merge模式编解码的帧间编解码块。
24.如示例20所述的方法,其中,所述第一子块的所述运动候选列表是帧间高级运动矢量预测(AMVP)候选列表,并且所述第一和第二子块是以AMVP模式编解码的帧间编解码块。
25.如示例1-24所述的方法,其中,从基于历史的运动矢量预测(HMVP)表推导的运动候选在所述第一子块的运动候选列表构建期间不被添加到所述运动候选列表。
26.如示例1-25所述的方法,其中,所述运动共享节点和/或参数共享节点被定义为与用于常规Merge模式的Merge共享节点相同。
27.如示例26所述的方法,其中,如果所述块内的亮度样本的数量不大于第一阈值,则所述第一视频单元是运动共享节点。
28.如示例27所述的方法,其中,如果所述第一视频单元内的亮度样本的数量不大于第二阈值,则所述第一视频单元是参数共享节点。
29.如示例26所述的方法,其中,如果所述第一视频单元内的亮度样本的数量大于第一阈值,并且在划分之后,至少一个子块小于所述第一阈值,则所述第一视频单元是运动共享节点。
30.如示例29所述的方法,其中,如果所述第一视频单元内的亮度样本的数量大于第二阈值,并且在划分之后,至少一个子块小于所述第二阈值,则所述第一视频单元是参数共享节点。
31.如示例27-30中任一项所述的方法,其中,所述第一阈值和第二阈值选自32、64和128。
32.如示例31所述的方法,其中,所述第一阈值不同于所述第二阈值。
33.如示例1-32所述的方法,其中,基于找到的Merge共享节点或帧内块复制(IBC)Merge共享节点,满足一致性比特流,并且Merge编解码的每个所述子块共享相同的模式。
34.如示例33所述的方法,其中,所述相同模式是常规Merge模式。
35.如示例33所述的方法,其中,所述相同模式是三角预测模式(TPM)。
36.如示例33所述的方法,其中,所述相同模式是帧内块复制(IBC)Merge模式。
37.如示例33所述的方法,其中,当找到Merge共享节点时,Merge共享节点的所有子块共享相同Merge列表和相同Merge列表中的相同运动候选。
38.如示例37所述的方法,其中,对于Merge共享节点的所有子块,仅对选定的运动候选索引进行一次编解码。
39.如示例38所述的方法,其中,仅基于子块作为编码顺序或解码顺序中的第一Merge编解码的子块而对所选择的运动候选索引编解码。
40.如示例37所述的方法,其中,多个运动候选索引被编解码,并且对于一致性比特流,所有多个运动候选索引被限制为相同。
41.如示例33所述的方法,其中,当找到Merge共享节点时,所有子块共享Merge列表和该模式类型的Merge列表中的运动候选。
42.如示例41所述的方法,其中,所述模式类型是常规Merge模式、帧内块复制(IBC)Merge模式或三角预测模式。
43.如示例42所述的方法,其中,对于Merge共享节点的所有子块,仅对选定的运动候选索引进行一次编解码。
44.如示例43所述的方法,其中,仅基于子块作为编码顺序或解码顺序中的第一Merge编解码的子块而对所选择的运动候选索引编解码。
45.如示例42所述的方法,其中,多个运动候选索引被编解码,并且对于一致性比特流,所有多个运动候选索引被限制为相同。
46.如示例41所述的方法,其中,仅允许一种Merge模式类型。
47.如示例46所述的方法,其中,仅允许的所述一种Merge模式类型是常规Merge模式。
48.如示例46所述的方法,其中,除了仅允许的所述一种Merge模式以外的模式类型的信令通知被跳过。
49.一种视频处理方法,包括:在第一视频块和包含所述第一视频块的视频的比特流表示之间的转换期间,通过使用当所述第一视频块处于运动共享节点之外时用于所述第一视频块的第一候选列表构建技术构建的运动列表来预测所述第一视频块的运动信息;在第一视频单元的第二视频块和所述视频的比特流表示之间的转换期间,通过使用以用于所述第二视频块的第二候选列表构建技术构建的Merge列表来预测所述第二视频块的运动信息,所述第二候选列表构建技术不同于所述第一候选列表构建技术,并且所述第一视频单元是共享节点块;并且基于所述第一视频块和所述第二视频块的所述预测的运动信息来进行所述转换。
50.如示例49所述的方法,其中,所述共享节点块是以下中的一个:Merge共享节点块、运动共享节点块或帧内块复制(IBC)Merge共享节点块。
51.如示例49或50所述的方法,其中,在所述第二候选列表构建技术中比在所述第一候选列表构建技术中更多的候选被放入Merge列表。
52.如示例49或50所述的方法,其中,所述第二候选列表构建技术包括:访问空域相邻块或时域块的不同相对位置以得到Merge候选。
53.如示例49或50所述的方法,还包括:基于待处理的所述块是否为共享节点块,而确定是否添加来自HMVP表的运动候选和/或如何添加来自HMVP表的运动候选。
54.如示例49或50所述的方法,其中,所述第二候选列表构建技术比所述第一候选列表构建技术访问更多的空域相邻块,以得到Merge候选。
55.如示例49或50所述的方法,其中,所述第二候选列表构建技术比所述第一候选列表构建技术访问更多的时域相邻块,以得到Merge候选。
56.一种视频解码装置,包括处理器,该处理器被配置为实现示例1至55中的一个或多个所述的方法。
57.一种视频编码装置,包括处理器,该处理器被配置为实现示例1至55中的一个或多个所述的方法。
58.一种其上存储有计算机代码的计算机程序产品,该代码在由处理器执行时使处理器实现示例1至55中任一项所述的方法。
该方法可以包括:其中,将第一子视频块的运动信息排除在添加到相同运动共享节点的第二子视频块的IBC Merge候选列表之外。
该方法可以包括:其中,进行子视频块的进一步处理包括,维持基于全局基于历史的运动矢量预测(HMVP)表和临时HMVP表。
该方法可以包括:将内容从全局HMVP表复制到临时HMVP表;以及这将内容从全局HMVP表复制到临时HMVP表之后,解码第一子视频块。
该方法可以包括:其中,第一子视频块的运动信息用于更新全局HMVP表,而不用于更新临时HMVP表。
该方法可以包括:其中,存储在临时HMVP表中的运动候选用于构建IBC Merge候选列表。
该方法可以包括:其中,子视频块组成运动共享节点,并且子视频块共享相同的运动候选列表。
该方法可以包括:其中,相同的运动候选列表是高级运动矢量预测(AMVP)候选列表。
该方法可以包括:其中,为共享节点块构建相同的运动候选列表。
该方法可以包括:其中,子视频块组成参数共享节点,并且子视频块共享相同的跨分量线性模型(CCLM),局部照明补偿(LIC)参数,或在解码器端推导的其他参数。
该方法可以包括:其中,为共享节点块推导共享的参数。
该方法可以包括:其中,在子视频块的第二子视频块的参数推导过程中不使用子视频块的第一子视频块的重构样本。
该方法可以包括:其中,在子视频块的第二子视频块的参数推导过程中不使用子视频块的第一子视频块的参考样本。
该方法可以包括:其中,从基于历史的运动矢量预测(HMVP)表推导的运动候选不被添加到IBC Merge候选列表。
该方法可以包括:其中,运动共享节点或参数共享节点被定义为与用于常规Merge模式的Merge共享节点相同。
该方法可以包括:其中,DMVD处理是解码器侧运动矢量推导(DMVD)过程。
该方法可以包括:其中,基于从HMVP表复制的Merge候选而禁用操作状态。
该方法可以包括:其中,基于以来自HMVP表的运动候选生成的Merge候选而禁用操作状态。
该方法可以包括:用视频块的细化的运动信息来更新HMVP表,其中操作状态被启用。
所述方法可包括:其中,对作为编码顺序或解码顺序中的最后的块的子视频块中的第一个子视频块启用操作状态。
该方法可以包括:其中,基于找到的Merge共享节点或帧内块复制(IBC)Merge共享节点来满足一致性比特流,并且被Merge编解码的每个子视频块共享相同的模式。
该方法可以包括:其中,相同模式是常规Merge模式。
该方法可以包括:其中,所述相同模式是三角预测模式(TPM)。
该方法可以包括:其中,所述相同模式是帧内块复制(IBC)Merge模式。
该方法可以包括:其中,找到Merge共享节点,并且该Merge共享节点的子视频块共享Merge列表并且共享Merge列表中的运动候选。
该方法可以包括:其中,针对子视频块编解码选择的运动候选索引。
该方法可以包括:其中,基于作为编码顺序或解码顺序中的第一Merge编解码的子视频块的子视频块,对选择的运动候选索引进行编解码。
该方法可以包括:其中,找到Merge共享节点,并且子视频块共享Merge列表和该模式类型的Merge列表中的运动候选。
该方法可以包括,其中,所述模式类型是常规Merge模式、帧内块复制(IBC)Merge模式或三角预测模式。
应当理解,公开的技术可以体现在视频编码器或解码器中,以使用增强的编解码树结构来提高压缩效率。
本文件中描述的公开和其他解决方案、示例、实施例、模块和功能操作可以以数字电子电路实现,或者以计算机软件、固件或硬件实现,包括本文件中公开的结构及其结构等同物,或者以它们中的一个或多个的组合实现。公开和其他实施例可以实现为一个或多个计算机程序产品,即,在计算机可读介质上编码的一个或多个计算机程序指令模块,用于由数据处理装置执行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读传播信号的物质组合、或者它们中的一个或多个的组合。术语“数据处理装置”涵盖用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机或多个处理器或计算机。除了硬件之外,该装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统、或者它们中的一个或多个的组合的代码。传播信号是人工生成的信号,例如机器生成的电信号、光信号或电磁信号,其被生成以对信息进行编码以便传输到合适的接收器设备。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言编写,包括编译或解释语言,并且可以以任何形式来部署计算机程序,包括独立程序或适合在计算环境中使用的模块、组件、子例程或其他单元。计算机程序并不必需对应于文件系统中的文件。程序可以存储在文件的保存其他程序或数据(例如,存储在标志语言文档中的一个或多个脚本)的部分中,存储在专用于所讨论的程序的单个文件中,或存储在多个协调文件中(例如,存储一个或多个模块、子程序或代码部分的文件)。可以部署计算机程序以在一个计算机上或在位于一个站点上或分布在多个站点上并通过通信网络互连的多个计算机上执行。
本文件中描述的过程和逻辑流程可以由执行一个或多个计算机程序的一个或多个可编程处理器执行,以通过对输入数据进行操作并生成输出来执行功能。过程和逻辑流程也可以由专用逻辑电路执行,并且装置也可以实现为专用逻辑电路,例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
举例来说,适合于执行计算机程序的处理器包括通用和专用微处理器、以及任何种类的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括或可操作地耦合到用于存储数据的一个或多个大容量存储设备,例如磁盘、磁光盘或光盘,以从该一个或多个大容量存储设备接收数据,或将数据传输到该一个或多个大容量存储设备,或者既接收又传递数据。然而,计算机不需要具有这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如内部硬盘或可移动磁盘;磁光盘;以及CD ROM和DVD-ROM磁盘。处理器和存储器可以由专用逻辑电路补充或并入专用逻辑电路中。
虽然本专利文件包含许多细节,但这些细节不应被解释为对任何主题或可要求保护的范围的限制,而是作为特定于特定发明的特定实施例的特征的描述。在本专利文件中,在单独的实施例的上下文中描述的某些特征也可以在单个实施例中组合实现。相反,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合在多个实施例中实现。此外,尽管上面的特征可以描述为以某些组合起作用并且甚至最初如此要求权利保护,但是在某些情况下,可以从所要求保护的组合中去除来自该组合的一个或多个特征,并且所要求保护的组合可以指向子组合或子组合的变型。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应该被理解为要求以所示的特定顺序或按顺序执行这样的操作,或者执行所有示出的操作,以实现期望的结果。此外,在本专利文件中描述的实施例中的各种系统组件的分开不应被理解为在所有实施例中都要求这种分开。
仅描述了几个实现方式和示例,并且可以基于本专利文件中描述和示出的内容来做出其他实现方式、增强和变型。

Claims (58)

1.一种视频处理方法,包括:
确定视频的第一视频单元是帧内块复制(IBC)Merge共享节点,并且将所述第一视频单元划分为多个子块,其中在所述第一视频单元下的以IBC Merge模式编解码的子块被并行处理;
推导所述第一视频单元下的第一子块的运动信息;以及
使用所述推导的运动信息进行所述视频的比特流表示和所述第一子块之间的转换,
其中所述第一子块的运动信息的推导中,省略所述第一视频下的任何其他子块的运动信息。
2.一种视频处理方法,包括:
确定视频的第一视频单元是帧内块复制(IBC)高级运动矢量预测(AMVP)共享节点,并且将所述第一视频单元划分为多个子块,其中在所述第一视频单元下的以IBC AMVP模式编解码的子块被并行处理;
推导所述第一视频单元下的第一子块的运动信息;以及
使用所述推导的运动信息进行所述视频的比特流表示和所述第一子块之间的转换,
其中所述第一子块的运动信息的推导中,省略所述第一视频下的任何其他子块的运动信息。
3.一种视频处理方法,包括:
确定视频的第一视频单元是帧间高级运动矢量预测(AMVP)运动共享节点,并且将所述第一视频单元划分为多个子块,其中在所述第一视频单元下的以帧间AMVP模式编解码的子块被并行处理;
推导所述第一视频单元下的以帧间AMVP模式编解码的所述多个子块的第一子块的运动信息;以及
基于所述推导的运动信息,进行所述多个子块中的第一子块和包括所述第一视频单元的所述视频的比特流表示之间的转换,
其中在所述第一子块的运动信息的推导中,省略所述第一视频单元下的任何其他子块的运动信息。
4.如权利要求1至3中任一项所述的方法,还包括,构建所述第一子块的运动候选列表,其中从所述运动候选列表推导所述第一子块的所述运动信息。
5.如权利要求4所述的方法,其中在所述第二子块和所述比特流表示之间的转换期间由所述第二子块使用所述第一子块的运动候选列表。
6.如权利要求1至4中任一项所述的方法,其中,当到达所述第一视频单元时,构建单个运动候选列表,并且所述构建的单个运动候选列表由从所述第一视频单元划分的所有子块共享。
7.如权利要求4至6中任一项所述的方法,其中,所述运动候选列表通过维持全局基于历史的运动矢量预测(HMVP)表和临时HMVP表来构建,其中每个表包括从之前处理的视频块推导的运动候选。
8.如权利要求7所述的方法,还包括:
将全局HMVP表复制到临时HMVP表;以及
在将全局HMVP表复制到临时HMVP表之后,对所述运动共享节点下的所述第一子块解码。
9.如权利要求7所述的方法,其中,在相同的运动共享节点下的子块的运动信息被用于更新全局HMVP表,而不用于更新临时HMVP表。
10.如权利要求7所述的方法,其中,临时HMVP表中存储的运动候选被用于预测所述第一视频单元中的子块的运动信息,全局HMVP表中的运动候选不被用于构建所述单个运动候选列表。
11.如权利要求7所述的方法,其中,对于不在所述运动共享节点之下的块,所述全局HMVP表中的运动候选被用于构建所述块的运动候选列表。
12.如权利要求7所述的方法,其中,对于不在所述运动共享节点之下的块,这些块的运动信息被用于进一步更新所述全局HMVP表。
13.如权利要求1至12中任一项所述的方法,其中,在所述运动候选列表的构建过程中,将任何所述子块的运动信息排除在添加到所述运动候选列表之外。
14.一种视频处理方法,包括:
确定视频的第一视频单元为参数共享节点,并且所述第一视频单元被划分为多个子块;
在所述第一子块和包括所述第一视频单元的所述视频的比特流表示之间的转换期间,推导在所述第一视频单元下的所述多个子块中的第一子块的参数,其中所述第一子块使用编解码工具编解码;以及
基于参数进行所述转换,
其中,在转换过程中推导的与所述编解码工具相关联的所述参数独立于相同参数共享节点下的第二子块的信息。
15.如权利要求14所述的方法,其中,所述编解码工具包括跨分量线性模型(CCLM)、局部照明补偿(LIC)参数、亮度映射和色度缩放(LMCS)或解码器侧推导的其他参数中的至少一个。
16.如权利要求14所述的方法,其中,在相同参数共享节点下的子块共享所述多个子块中两个子块的相同参数,所述多个子块中的两个子块用相同的编解码工具编解码,并且在解码器侧推导相关联的参数。
17.如权利要求14所述的方法,其中,共享的参数是从所述第一视频单元外部的信息推导的。
18.如权利要求14所述的方法,其中,在相同参数共享节点下的任何一个子块的重构样本不用于在所述相同参数共享节点下的所述子块中的另一子块的参数推导过程。
19.如权利要求14所述的方法,其中,在相同参数共享节点下的任何一个子块的参考样本不用于在所述相同参数共享节点下的所述子块中的另一子块的参数推导过程。
20.一种视频处理方法,包括:
确定视频的第一视频单元是运动共享节点,并且将所述第一视频单元划分为作为叶节点的多个子块;
推导在所述第一视频单元下的第一子块的运动候选列表;以及
基于所述运动候选列表,进行以第一模式编解码的所述多个子块中的所述第一子块和包括所述第一视频单元的所述视频的比特流表示之间的转换,
其中,以所述第一模式编解码的所述多个子块中的第二子块的运动信息在所述运动候选列表的构建过程中省略;以及
其中,当编码或解码所述第一子块时,从基于历史的运动矢量预测(HMVP)表中推导的运动候选不被添加到所述运动候选列表。
21.如权利要求20所述的方法,其中,所述第一子块的所述运动候选列表是IBC Merge候选列表,并且所述第一和第二子块是以Merge模式编解码的IBC编解码块。
22.如权利要求20所述的方法,其中,所述第一子块的所述运动候选列表是IBC高级运动矢量预测(AMVP)候选列表,并且所述第一和第二子块是以AMVP模式编解码的IBC编解码块。
23.如权利要求20所述的方法,其中,所述第一子块的所述运动候选列表是帧间Merge候选列表,并且所述第一和第二子块是以Merge模式编解码的帧间编解码块。
24.如权利要求20所述的方法,其中,所述第一子块的所述运动候选列表是帧间高级运动矢量预测(AMVP)候选列表,并且所述第一和第二子块是以AMVP模式编解码的帧间编解码块。
25.如权利要求1至24中任一项所述的方法,其中,从基于历史的运动矢量预测(HMVP)表推导的运动候选在所述第一子块的运动候选列表构建期间不被添加到所述运动候选列表。
26.如权利要求1至25中任一项所述的方法,其中,所述运动共享节点和/或参数共享节点被定义为与用于常规Merge模式的Merge共享节点相同。
27.如权利要求26所述的方法,其中,如果所述块内的亮度样本的数量不大于第一阈值,则所述第一视频单元是运动共享节点。
28.如权利要求27所述的方法,其中,如果所述第一视频单元内的亮度样本的数量不大于第二阈值,则所述第一视频单元是参数共享节点。
29.如权利要求26所述的方法,其中,如果所述第一视频单元内的亮度样本的数量大于第一阈值,并且在划分之后,至少一个子块小于所述第一阈值,则所述第一视频单元是运动共享节点。
30.如权利要求29所述的方法,其中,如果所述第一视频单元内的亮度样本的数量大于第二阈值,并且在划分之后,至少一个子块小于所述第二阈值,则所述第一视频单元是参数共享节点。
31.如权利要求27至30中任一项所述的方法,其中,所述第一阈值和第二阈值选自32、64和128。
32.如权利要求31所述的方法,其中,所述第一阈值不同于所述第二阈值。
33.如权利要求1至32中任一项所述的方法,其中,基于找到的Merge共享节点或帧内块复制(IBC)Merge共享节点,满足一致性比特流,并且Merge编解码的每个所述子块共享相同的模式。
34.如权利要求33所述的方法,其中,所述相同模式是常规Merge模式。
35.如权利要求33所述的方法,其中,所述相同模式是三角预测模式(TPM)。
36.如权利要求33所述的方法,其中,所述相同模式是帧内块复制(IBC)Merge模式。
37.如权利要求33所述的方法,其中,当找到Merge共享节点时,Merge共享节点的所有子块共享相同Merge列表和相同Merge列表中的相同运动候选。
38.如权利要求37所述的方法,其中,对于Merge共享节点的所有子块,仅对选定的运动候选索引进行一次编解码。
39.如权利要求38所述的方法,其中,仅基于子块作为编码顺序或解码顺序中的第一Merge编解码的子块而对所选择的运动候选索引进行编解码。
40.如权利要求37所述的方法,其中,多个运动候选索引被编解码,并且对于一致性比特流,所有多个运动候选索引被限制为相同。
41.如权利要求33所述的方法,其中,当找到Merge共享节点时,所有子块共享Merge列表和模式类型的Merge列表中的运动候选。
42.如权利要求41所述的方法,其中,所述模式类型是常规Merge模式、帧内块复制(IBC)Merge模式或三角预测模式。
43.如权利要求42所述的方法,其中,对于Merge共享节点的所有子块,仅对选定的运动候选索引进行一次编解码。
44.如权利要求43所述的方法,其中,仅基于子块作为编码顺序或解码顺序中的第一Merge编解码的子块而对所选择的运动候选索引进行编解码。
45.如权利要求42所述的方法,其中,多个运动候选索引被编解码,并且对于一致性比特流,所有多个运动候选索引被限制为相同。
46.如权利要求41所述的方法,其中,仅允许一种Merge模式类型。
47.如权利要求46所述的方法,其中,仅允许的所述一种Merge模式类型是常规Merge模式。
48.如权利要求46所述的方法,其中,除了仅允许的所述一种Merge模式以外的模式类型的信令通知被跳过。
49.一种视频处理方法,包括:
在第一视频块和包含所述第一视频块的视频的比特流表示之间的转换期间,通过使用当所述第一视频块处于运动共享节点之外时用于所述第一视频块的第一候选列表构建技术构建的运动列表来预测所述第一视频块的运动信息;
在第一视频单元的第二视频块和所述视频的比特流表示之间的转换期间,通过使用以用于所述第二视频块的第二候选列表构建技术构建的Merge列表来预测所述第二视频块的运动信息,所述第二候选列表构建技术不同于所述第一候选列表构建技术,并且所述第一视频单元是共享节点块;以及
基于所述第一和第二视频块的所述预测的运动信息进行所述转换。
50.如权利要求49所述的方法,其中,所述共享节点块是以下中的一个:Merge共享节点块、运动共享节点块或帧内块复制(IBC)Merge共享节点块。
51.如权利要求49或50所述的方法,其中,在所述第二候选列表构建技术中比在所述第一候选列表构建技术中更多的候选被放入Merge列表。
52.如权利要求49或50所述的方法,其中,所述第二候选列表构建技术包括:访问空域相邻块或时域块的不同相对位置以得到Merge候选。
53.如权利要求49或50所述的方法,还包括:基于待处理的块是否为共享节点块,而确定是否添加来自HMVP表的运动候选和/或如何添加来自HMVP表的运动候选。
54.如权利要求49或50所述的方法,其中,所述第二候选列表构建技术比所述第一候选列表构建技术访问更多的空域相邻块,以得到Merge候选。
55.如权利要求49或50所述的方法,其中,所述第二候选列表构建技术比所述第一候选列表构建技术访问更多的时域相邻块,以得到Merge候选。
56.一种视频解码装置,包括:处理器,配置为实现如权利要求1至55中的一项或多项所述的方法。
57.一种视频编码装置,包括:处理器,配置为实现如权利要求1至55中的一项或多项所述的方法。
58.一种计算机程序产品,包括存储在其上的计算机代码,所述代码在由处理器执行时,使得所述处理器实现如权利要求1至55中任一项所述的方法。
CN202080013647.1A 2019-02-13 2020-02-13 基于共享Merge列表的运动预测 Active CN113475075B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2019074964 2019-02-13
CNPCT/CN2019/074964 2019-02-13
PCT/CN2020/075081 WO2020164543A1 (en) 2019-02-13 2020-02-13 Motion prediction based on shared merge list

Publications (2)

Publication Number Publication Date
CN113475075A true CN113475075A (zh) 2021-10-01
CN113475075B CN113475075B (zh) 2023-09-08

Family

ID=72045116

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202080013647.1A Active CN113475075B (zh) 2019-02-13 2020-02-13 基于共享Merge列表的运动预测
CN202080013644.8A Pending CN113424535A (zh) 2019-02-13 2020-02-13 基于运动矢量预测表的历史更新

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202080013644.8A Pending CN113424535A (zh) 2019-02-13 2020-02-13 基于运动矢量预测表的历史更新

Country Status (3)

Country Link
US (1) US11863771B2 (zh)
CN (2) CN113475075B (zh)
WO (2) WO2020164543A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021068955A1 (en) 2019-10-12 2021-04-15 Beijing Bytedance Network Technology Co., Ltd. Use and signaling of refining video coding tools
WO2021129866A1 (en) 2019-12-27 2021-07-01 Beijing Bytedance Network Technology Co., Ltd. Signaling of slice types in video pictures headers
CN115278360B (zh) * 2022-07-18 2023-11-07 天翼云科技有限公司 一种视频数据处理方法及电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120257678A1 (en) * 2011-04-11 2012-10-11 Minhua Zhou Parallel Motion Estimation in Video Coding
CN103931196A (zh) * 2011-09-09 2014-07-16 Lg电子株式会社 帧间预测方法及其装置
US20140355687A1 (en) * 2011-12-28 2014-12-04 JVC Kenwood Corporation Moving picture coding device, moving picture coding method and moving picture coding program, and moving picture decoding device, moving picture decoding method and moving picture decoding program
CN107079161A (zh) * 2014-09-01 2017-08-18 寰发股份有限公司 用于屏幕内容以及视频编码的帧内图片块复制的方法
US20170332095A1 (en) * 2016-05-16 2017-11-16 Qualcomm Incorporated Affine motion prediction for video coding
WO2018012851A1 (ko) * 2016-07-12 2018-01-18 한국전자통신연구원 영상 부호화/복호화 방법 및 이를 위한 기록 매체
US20180270500A1 (en) * 2017-03-14 2018-09-20 Qualcomm Incorporated Affine motion information derivation
US20180359483A1 (en) * 2017-06-13 2018-12-13 Qualcomm Incorporated Motion vector prediction

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110176611A1 (en) * 2010-01-15 2011-07-21 Yu-Wen Huang Methods for decoder-side motion vector derivation
CN102860006B (zh) * 2010-02-05 2016-11-23 瑞典爱立信有限公司 管理预测运动向量候选
KR101630688B1 (ko) * 2010-02-17 2016-06-16 삼성전자주식회사 움직임 예측 장치 및 방법과 영상 처리 장치
CN102215386B (zh) * 2010-04-09 2013-03-27 华为技术有限公司 视频图像块处理方法及装置
CN107105279B (zh) * 2011-09-23 2020-03-06 株式会社Kt 用于引导合并候选块的方法和使用该方法的设备
US10271064B2 (en) * 2015-06-11 2019-04-23 Qualcomm Incorporated Sub-prediction unit motion vector prediction using spatial and/or temporal motion information
EP3357245A4 (en) * 2015-11-05 2019-03-13 MediaTek Inc. METHOD AND DEVICE OF INTERPRESSATION USING AN AVERAGE MOTION VECTOR FOR VIDEO CODING
GB2561507B (en) * 2016-01-07 2021-12-22 Mediatek Inc Method and apparatus for affine merge mode prediction for video coding system
KR20180084663A (ko) * 2017-01-16 2018-07-25 세종대학교산학협력단 영상 신호 부호화/복호화 방법 및 장치
US20180242024A1 (en) * 2017-02-21 2018-08-23 Mediatek Inc. Methods and Apparatuses of Candidate Set Determination for Quad-tree Plus Binary-tree Splitting Blocks
US10701366B2 (en) * 2017-02-21 2020-06-30 Qualcomm Incorporated Deriving motion vector information at a video decoder
US10595035B2 (en) * 2017-03-22 2020-03-17 Qualcomm Incorporated Constraining motion vector information derived by decoder-side motion vector derivation
WO2020065520A2 (en) 2018-09-24 2020-04-02 Beijing Bytedance Network Technology Co., Ltd. Extended merge prediction
EP3854092A4 (en) 2018-11-02 2021-11-17 Beijing Bytedance Network Technology Co. Ltd. KEEPING TABLES FOR THE STORAGE OF HMVP CANDIDATES
US11032560B2 (en) * 2019-01-17 2021-06-08 Tencent America LLC Method and apparatus for video coding without updating the HMVP table

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120257678A1 (en) * 2011-04-11 2012-10-11 Minhua Zhou Parallel Motion Estimation in Video Coding
US20150237370A1 (en) * 2011-04-11 2015-08-20 Texas Instruments Incorporated Parallel motion estimation in video coding
CN103931196A (zh) * 2011-09-09 2014-07-16 Lg电子株式会社 帧间预测方法及其装置
US20140355687A1 (en) * 2011-12-28 2014-12-04 JVC Kenwood Corporation Moving picture coding device, moving picture coding method and moving picture coding program, and moving picture decoding device, moving picture decoding method and moving picture decoding program
CN107079161A (zh) * 2014-09-01 2017-08-18 寰发股份有限公司 用于屏幕内容以及视频编码的帧内图片块复制的方法
US20170332095A1 (en) * 2016-05-16 2017-11-16 Qualcomm Incorporated Affine motion prediction for video coding
WO2018012851A1 (ko) * 2016-07-12 2018-01-18 한국전자통신연구원 영상 부호화/복호화 방법 및 이를 위한 기록 매체
US20180270500A1 (en) * 2017-03-14 2018-09-20 Qualcomm Incorporated Affine motion information derivation
US20180359483A1 (en) * 2017-06-13 2018-12-13 Qualcomm Incorporated Motion vector prediction

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHUN-CHIA CHEN ET AL.: "CE4.3.1: Shared merging candidate list", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 13TH MEETING: MARRAKECH, MA, 9–18 JAN. 2019》, pages 1 - 4 *
LI ZHANG ET AL.: "CE4: History-based Motion Vector Prediction (Test 4.4.7)", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 12TH MEETING: MACAO, CN, 3–12 OCT. 2018》, pages 1 - 6 *

Also Published As

Publication number Publication date
US20210368187A1 (en) 2021-11-25
CN113475075B (zh) 2023-09-08
US11863771B2 (en) 2024-01-02
CN113424535A (zh) 2021-09-21
WO2020164544A1 (en) 2020-08-20
WO2020164543A1 (en) 2020-08-20

Similar Documents

Publication Publication Date Title
US11457226B2 (en) Side information signaling for inter prediction with geometric partitioning
JP7212161B2 (ja) イントラブロックコピーモードとインター予測ツールとの間の相互作用
TWI727338B (zh) 用信號通知的運動向量精度
CN112970253B (zh) 用于预测的运动候选列表构建
WO2019244051A1 (en) Selected mvd precision without mvp truncation
TWI736923B (zh) 擴展Merge模式
US11895320B2 (en) History-based motion vector prediction
CN113039800A (zh) 用于基于历史的仿射参数的修剪方法
CN114009037A (zh) 帧内块复制模式的运动候选列表构建
WO2020143774A1 (en) Merge with mvd based on geometry partition
CN113439444A (zh) 用于仿射的多hmvp
CN114175636A (zh) 自适应参数集中的自适应环路滤波的指示
US11956431B2 (en) Conditional application of inter prediction with geometric partitioning in video processing
CN113475075B (zh) 基于共享Merge列表的运动预测
CN113796084A (zh) 运动矢量和预测样点细化
WO2020143643A1 (en) Control method for merge with mvd
CN112997496B (zh) 仿射预测模式的改进
CN113994682A (zh) 具有默认参数的基于历史的运动矢量预测
CN113557720B (zh) 视频处理方法、装置以及非暂态计算机可读介质
CN114097219A (zh) 基于历史的运动矢量预测表中的运动信息的存储

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant