CN113056920A - 基于子块的帧间预测的协调方法 - Google Patents

基于子块的帧间预测的协调方法 Download PDF

Info

Publication number
CN113056920A
CN113056920A CN201980076059.XA CN201980076059A CN113056920A CN 113056920 A CN113056920 A CN 113056920A CN 201980076059 A CN201980076059 A CN 201980076059A CN 113056920 A CN113056920 A CN 113056920A
Authority
CN
China
Prior art keywords
block
picture
sbtmvp
motion vector
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201980076059.XA
Other languages
English (en)
Other versions
CN113056920B (zh
Inventor
张凯
张莉
刘鸿彬
许继征
王悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Original Assignee
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd, ByteDance Inc filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN202311821092.5A priority Critical patent/CN117692634A/zh
Publication of CN113056920A publication Critical patent/CN113056920A/zh
Application granted granted Critical
Publication of CN113056920B publication Critical patent/CN113056920B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • H04N19/54Motion estimation other than block-based using feature points or meshes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

描述了用于数字视频编解码的设备、系统和方法,其包括基于子块的帧间预测方法。用于视频处理的示例性方法包括:对于视频的当前块与所述视频的比特流表示之间的转换,基于在所述转换期间是否启用时域运动矢量预测(TMVP)或是否将当前图片参考(CPR)编解码模式用于所述转换,确定基于子块的Merge候选列表中的最大候选数和/或是否将基于子块的时域运动矢量预测(SbTMVP)候选添加到所述基于子块的Merge候选列表中;以及基于所述确定执行所述转换。

Description

基于子块的帧间预测的协调方法
相关申请的交叉引用
根据适用专利法和/或适用于巴黎公约的规则,本申请及时要求2018年11月22日提交的国际专利申请No.PCT/CN2018/116889、2018年12月29日提交的国际专利申请No.PCT/CN2018/125420、2019年8月13日提交的国际专利申请No.PCT/CN2019/100396和2019年9月22日提交的国际专利申请No.PCT/CN2019/107159号的优先权和权益。出于美国法律的所有目的,通过引用将上述申请的全部公开并入,作为本申请公开的一部分。
技术领域
该专利文件涉及图像和视频编解码和解码。
背景技术
尽管视频压缩有所进步,数字视频在互联网和其他数字通信网络上仍占最大的带宽使用量。随着能够接收和显示视频的连接用户设备的数量增加,预计数字视频使用所需的带宽将继续增长。
发明内容
描述了与数字视频编解码有关的设备、系统和方法,其包括基于子块的帧间预测方法。所描述的方法可以应用于现有视频编解码标准(例如,高效视频编解码(HEVC)和/或通用视频编解码(VVC))和未来视频编解码标准或视频编解码器。
在一个代表性方面,所公开的技术可以用于提供视频处理的方法。该方法包括:对于视频的当前块与视频的比特流表示之间的转换,基于在转换期间是否启用时域运动矢量预测(TMVP)或是否将当前图片参考(CPR)编解码模式用于转换,确定基于子块的Merge候选列表中的最大候选数(ML)和/或是否将基于子块的时域运动矢量预测(SbTMVP)候选添加到基于子块的Merge候选列表中;以及基于确定执行转换。
在另一个代表性方面,所公开的技术可以用于提供视频处理的方法。该方法包括:对于视频的当前块与视频的比特流表示之间的转换,基于是否在转换期间启用时域运动矢量预测(TMVP)、基于子块的时域运动矢量预测(SbTMVP)和仿射编解码模式,确定基于子块的Merge候选列表中的最大候选数(ML);以及基于确定执行转换。
在又一个代表性方面,所公开的技术可以用于提供视频处理的方法。该方法包括:对于视频的第一视频片段的当前块与视频的比特流表示之间的转换,确定由于时域运动矢量预测(TMVP)模式在第一视频段级别被禁用而对转换禁用基于子块的运动矢量预测(SbTMVP)模式;以及基于确定执行转换,其中,比特流表示符合格式,格式指定是否包括SbTMVP模式的指示和/或SbTMVP模式的指示在Merge候选列表中相对于所述TMVP模式的指示的位置。
在又一个代表性方面,所公开的技术可以用于提供视频处理的方法。该方法包括:在使用基于子块的时域运动矢量预测(SbTMVP)工具或时域运动矢量预测(TMVP)工具编码的视频的当前块与视频的比特流表示之间执行转换,其中,基于与SbTMVP工具或TMVP工具相关联的运动矢量的压缩,使用掩模选择性地掩蔽当前块或当前块的子块的对应位置的坐标,以及其中,掩模的应用包括计算坐标的值与掩模的值之间的按位与运算。
在又一个代表性方面,所公开的技术可以用于提供视频处理的方法。该方法包括:基于视频的视频片段的当前块的一个或多个特性,对基于子块的运动矢量预测(SbTMVP)工具在当前块上的应用,确定当前块的有效对应区域;以及基于确定,执行当前块与视频的比特流表示之间的转换。
在又一个代表性方面,所公开的技术可以用于提供视频处理的方法。该方法包括:对于使用基于子块的时域运动矢量预测(SbTMVP)工具编码的视频的当前块,确定默认运动矢量;以及基于确定,执行当前块与视频的比特流表示之间的转换,其中,在不从覆盖与当前块的中心位置相关联的并置图片中的对应位置的块中获得运动矢量的情况下,确定默认运动矢量。
在又一个代表性方面,所公开的技术可以用于提供视频处理的方法。该方法包括:对于视频的视频片段的当前块,在当前块的当前图片是参考图片列表X中索引被设置为M的参考图片的情况下,推断对视频片段禁用基于子块的时域运动矢量预测(SbTMVP)工具或时域运动矢量预测(TMVP)工具,其中M和X为整数,并且其中X=0或X=1;以及基于推断,执行当前块和视频的比特流表示之间的转换。
在又一个代表性方面,所公开的技术可以用于提供视频处理的方法。该方法包括:对于视频的当前块,在当前块的当前图片是参考图片列表X中索引被设置为M的参考图片的情况下,确定启用基于子块的时域运动矢量预测(SbTMVP)工具的应用,其中M和X为整数;以及基于确定,执行当前块和视频的比特流表示之间的转换。
在又一个代表性方面,所公开的技术可以用于提供视频处理的方法。该方法包括:执行视频的当前块与视频的比特流表示之间的转换,其中,当前块用基于子块的编码工具进行编码,并且其中,执行转换包括在启用或禁用基于子块的时域运动矢量预测(SbTMVP)工具的情况下,通过统一方法使用多个二进制位(N)对子块Merge索引进行编码。
在又一个代表性方面,所公开的技术可以用于提供视频处理的方法。该方法包括:对于使用基于子块的时域运动矢量预测(SbTMVP)工具进行编码的视频的当前块,确定由SbTMVP工具使用的运动矢量,以在不同于包括当前块的当前图片的图片中定位对应的块;以及基于确定,执行当前块与视频的比特流表示之间的转换。
在又一个代表性方面,所公开的技术可以用于提供视频处理的方法。该方法包括:对于视频的当前块和视频的比特流表示之间的转换,基于是否对当前块的转换启用仿射预测,来确定是否将零运动仿射Merge候选插入子块Merge候选列表中;以及基于确定来执行转换。
在又一个代表性方面,所公开的技术可以用于提供视频处理的方法。该方法包括:对于使用子块Merge候选列表的视频的当前块和视频的比特流表示之间的转换,在子块Merge候选列表未满的情况下,将零运动非仿射填充候选插入到子块Merge候选列表中;以及在插入之后执行转换。
在又一个代表性方面,所公开的技术可以用于提供视频处理的方法。该方法包括:对于视频的当前块和视频的比特流表示之间的转换,使用确定运动矢量是从覆盖并置图片中相应位置的块的一个或多个运动矢量中推导的规则来确定运动矢量;以及基于运动矢量来执行转换。
在又一个示例方面,公开了一种视频编解码器装置。视频编解码器装置包括处理器被配置为实现本文描述的方法的处理器。
在又一个示例方面,公开了一种视频解码器装置。视频解码器装置包括处理器被配置为实现本文描述的方法的处理器。
在另一方面,公开了一种其上存储有代码的计算机可读介质。当由处理器执行时,该代码使处理器实现本文档中描述的方法。
在本文档中描述了这些以及其他方面。
附图说明
图1是用于Merge候选列表构造的推导过程的示例。
图2示出了空域Merge候选的示例位置。
图3示出了考虑用于空域Merge候选的冗余检查的候选对的示例。
图4A和图4B示出了N×2N和2N×N分割的第二预测单元(PU)的示例位置。
图5是用于时域Merge候选的运动矢量缩放的示例说明。
图6示出了时域Merge候选的示例候选位置C0和C1。
图7示出了组合的双向预测Merge候选的示例。
图8示出了用于运动矢量预测候选的示例推导过程。
图9是用于空域运动矢量候选的运动矢量缩放的示例说明。
图10示出了用于CU的可选时域运动矢量预测(ATMVP)运动预测的示例。
图11示出了具有四个子块(A-D)及其临近块(a-d)的一个CU的示例。
图12是以不同的MV精度进行编码的示例的流程图。
图13A和图13B分别示出了135度的分割类型(从左上角到右下角的分割)和45度的分割模式。
图14示出了临近块的位置的示例。
图15示出了上方和左侧块的示例。
图16A和16B分别示出了2个控制点运动矢量(CPMV)和3个CPMV的示例。
图17示出了每个子块的仿射运动矢量场(MVF)的示例。
图18A和18B分别示出了4个和6个参数仿射模型的示例。
图19示出了继承的仿射候选的AF_INTER的MVP的示例。
图20示出了在AF_INTER中构造仿射运动预测器的示例。
图21A和21B示出了AF_MERGE中的仿射编码中的控制点运动矢量的示例。
图22示出了仿射Merge模式的候选位置的示例。
图23示出帧内图片块复制操作的示例。
图24示出了并置图片中的有效对应区域的示例。
图25示出了用于基于历史的运动矢量预测的示例流程图。
图26示出了修改的Merge列表构造过程。
图27示出了当当前块在基本区域内时所提出的有效区域的示例实施例。
图28示出了当当前块不在基本区域内时有效区域的示例实施例。
图29A和29B分别示出了用于识别默认运动信息的位置的现有示例和提议示例。
图30-42是用于视频处理方法的示例的流程图。
图43是用于实现本文中描述的可视媒体解码或可视媒体编码技术的硬件平台的示例的框图。
图44是其中可以实现所公开的技术的示例视频处理系统的框图。
具体实施方式
本文档提供了可由视频比特流的解码器用来改善解压缩或解码的数字视频或图像的质量的各种技术。此外,视频编解码器还可在编码过程期间实现这些技术,以便重构用于进一步编码的解码帧。
在本文档中使用章节标题是为了易于理解,并且不将实施例和技术限于相应的章节。这样,一个部分的实施例可以与其他部分的实施例组合。
1.综述
该专利文档涉及视频编解码技术。具体地,它涉及视频编解码中的运动矢量编码。它可以应用于现有的视频编解码标准(例如HEVC),或者待定的标准(多功能视频编解码)。它也可能适用于未来的视频编解码标准或视频编解码器。
2.引言
视频编解码标准主要通过公知的ITU-T和ISO/IEC标准的发展而发展。ITU-T制作了H.261和H.263,ISO/IEC制作了MPEG-1和MPEG-4Visual,这两个组织共同制作了H.262/MPEG-2视频和H.264/MPEG-4增强视频编解码(AVC)和H.265/HEVC标准。从H.262开始,视频编解码标准基于混合视频编解码结构,其中利用了时域预测和变换编码。为了探索HEVC之外的未来视频编解码技术,VCEG和MPEG于2015年联合成立了联合视频探索小组(JVET)。此后,JVET采纳了许多新方法并将其引入到名为“联合探索模型”(JEM)的参考软件中。2018年4月,VCEG(Q6/16)和ISO/IEC JTC1 SC29/WG11(MPEG)之间的联合视频专家团队(JVET)成立,以致力于目标是与HEVC相比其降低50%比特率的VVC标准。
可以在以下位置找到最新版本的VVC草案,即多功能视频编解码(草案3):
http://phenix.it-sudparis.eu/jvet/doc_end_user/documents/12_Macao/ wg11/JVET-L1001-v2.zip
可以在以下位置找到名为VTM的VVC的最新参考软件:
https://vcgit.hhi.fraunhofer.de/jvet/VVCSoftware_VTM/tags/VTM-3.0rc1
2.1HEVC/H.265中的帧间预测
每个帧间预测的PU都有一个或两个参考图片列表的运动参数。运动参数包括运动矢量和参考图片索引。两个参考图片列表之一的使用也可以使用inter_pred_idc发信令通知。运动矢量可显式地编码为相对于预测器的增量。
当CU采用跳过模式编码时,一个PU与CU相关联,并且没有显著的残差系数,没有编码运动矢量增量或参考图片索引。指定了一种Merge模式,通过该模式,可以从临近的PU(包括空域和时域候选)中获取当前PU的运动参数。Merge模式可以应用于任何帧间预测的PU,而不仅仅是跳过模式。Merge模式的另一种选择是运动参数的显式传输,其中运动矢量(更精确地,与运动矢量预测器相比的运动矢量差(MVD))、每个参考图片列表的对应的参考图片索引、以及参考图片列表的使用都会根据每个PU显式地发信令通知。在本公开中,这样的模式被命名为高级运动矢量预测(AMVP)。
当信令指示要使用两个参考图片列表中的一个时,从一个样点块中生成PU。这被称为“单向预测”。单向预测对P条带(slice)和B条带都可用。
当信令指示要使用两个参考图片列表时,从两个样点块中生成PU。这被称为“双向预测”。双向预测仅对B条带可用。
下文提供了在HEVC中规定的关于帧间预测模式的细节。描述将从Merge模式开始。
2.1.1参考图片列表
在HEVC中,术语帧间预测用于表示从当前解码图片以外的参考图片的数据元素(例如,样点值或运动矢量)中推导的预测。像在H.264/AVC中一样,可以从多个参考图片中预测图片。用于帧间预测的参考图片被组织在一个或多个参考图片列表中。参考索引标识应使用列表中的哪些参考图片来创建预测信号。
单个参考图片列表,列表0用于P条带,两个参考图片列表,列表0和列表1用于B条带。应当注意,就捕获/显示顺序而言,列表0/1中包含的参考图片可能来自过去和将来的图片。
2.1.2Merge模式
2.1.2.1Merge模式的候选的推导
当使用Merge模式预测PU时,从比特流解析指向Merge候选列表中的条目的索引并将其用于检索运动信息。HEVC标准中指定了此列表的构造(construction),并且该列表的构造可以根据以下步骤顺序进行总结:
·步骤1:原始候选推导
ο步骤1.1:空域候选推导
ο步骤1.2:空域候选的冗余校验
ο步骤1.3:时域候选推导
·步骤2:插入附加的候选
ο步骤2.1:创建双向预测候选
ο步骤2.2:插入零运动候选
这些步骤也在图1中示意性地示出。对于空域Merge候选推导,在位于五个不同位置的候选当中选择最多四个Merge候选。对于时域Merge候选推导,在两个候选当中选择最多一个Merge候选。由于在解码器处假设恒定数量的候选用于每个PU,因此当从步骤1获得的候选的数量未达到在条带标头中用信令通知的最大Merge候选数量(MaxNumMergeCand)时,生成附加的候选。由于候选的数量是恒定的,因此使用截断的一元二值化(TruncatedUnary binarization,TU)来编码最佳Merge候选的索引。如果CU的尺寸等于8,则当前CU的所有PU共享单个Merge候选列表,其与2N×2N预测单元的Merge候选列表相同。
在下文中,详细描述了与前述步骤相关联的操作。
2.1.2.2空域候选的推导
在空域Merge候选的推导中,在位于图2描绘的位置的候选当中选择最多四个Merge候选。推导的顺序是A1、B1、B0、A0和B2。仅当位置A1、B1、B0、A0的任何PU不可用(例如,因为它属于另一条带或片)或者是帧内编码时,才考虑位置B2。在添加位置A1处的候选之后,对剩余候选的添加进行冗余校验,其确保具有相同运动信息的候选被排除在列表之外,使得编码效率提高。为了降低计算复杂度,在所提到的冗余校验中并未考虑所有可能的候选对。相反,仅考虑图3中用箭头连接的对,并且仅在用于冗余校验的对应候选具有不一样的运动信息时,才将候选添加到列表。重复运动信息的另一来源是与不同于2N×2N的分区相关联的“第二PU”。作为示例,图4A和4B描绘了分别针对N×2N和2N×N的情况的第二PU。当当前PU被分区为N×2N时,位置A1处的候选不被考虑用于列表建构。实际上,通过添加该候选将导致具有相同运动信息的两个预测单元,这对于在编码单元中仅具有一个PU是多余的。类似地,当当前PU被分区为2N×N时,不考虑位置B1
2.1.2.3时域候选的推导
在该步骤中,只有一个候选被添加到列表中。具体地,在该时域Merge候选的推导中,基于并置的PU来推导缩放的运动矢量,该并置的PU属于给定参考图片列表内与当前图片具有最小POC差的图片。在条带标头中明确地用信令通知要用于推导并置的PU的参考图片列表。如图5的虚线所示,获得了针对时域Merge候选的缩放运动矢量,其是使用POC距离tb和td从并置的PU的运动矢量缩放的,其中tb被定义为当前图片的参考图片与当前图片之间的POC差,td被定义为是并置的图片的参考图片与并置的图片之间的POC差。时域Merge候选的参考图片索引被设置为等于零。HEVC规范中描述了缩放过程的实际实现。对于B条带,获得两个运动矢量,一个用于参考图片列表0,另一用于参考图片列表1,并且结合该两个运动矢量以获得双向预测Merge候选。
图5是针对时域Merge候选的运动矢量缩放的推导的说明。
在属于参考帧的并置的PU(Y)中,在候选C0和C1之间选择时域候选的位置,如图6所示。如果位置C0处的PU不可用、是帧内编码的、或者在当前编码树单元(CTU aka.LCU、最大编码单元)行之外,则使用位置C1。否则,位置C0用于时域Merge候选的推导。
图6示出了时域Merge候选的候选位置的示例C0和C1。
2.1.2.4附加(Additional)候选插入
除了空域和时域Merge候选之外,还存在两种附加类型的Merge候选:组合的双向预测Merge候选和零Merge候选。通过利用空域和时域Merge候选来生成组合的双向预测Merge候选。组合的双向预测Merge候选仅用于B条带。通过将原始候选的第一参考图片列表运动参数与另一候选的第二参考图片列表运动参数组合来生成组合的双向预测候选。如果这两个元组提供不同的运动假设,它们将形成一个新的双向预测候选。例如,图7示出了当原始列表中的两个候选(左侧)中具有mvL0和refIdxL0或mvL1和refIdxL1,其被用于创建添加到最终列表(右侧)的组合的双向预测Merge候选的情况。关于组合有许多规则,这些规则被认为可以生成这些附加的Merge候选。
插入零运动候选以填充Merge候选列表中的剩余条目,从而达到MaxNumMergeCand容量。这些候选具有零空域位移和参考图片索引,该参考图片索引从零开始并且每当新的零运动候选被添加到列表时增加。
更具体地,依次执行以下步骤,直到Merge列表已满:
1.将变量numRef设置为与用于P条带的列表0相关联的参考图片的数量,或为用于B条带两个列表中的参考图片的最小数量;
2.添加非重复的零运动候选:
对于变量i为0…numRef-1,对于列表0(如果为P条带)或两个列表(如果为B条带),添加默认运动候选(将MV设置为(0,0),并将参考图片索引设置为i)。
3.添加重复的零运动候选,其中MV设置为(0,0),列表0的参考图片索引设置为0(如果为P条带),两个列表的参考图片索引都设置为0(如果为B条带)。
最后,不对这些候选执行冗余检查。
2.1.3高级运动矢量预测(AMVP)
AMVP利用运动矢量与相邻PU的时空相关性,其用于运动参数的显式传输。对于每个参考图片列表,通过首先校验在时域上相邻的PU位置的上方,左侧的可用性,移除冗余候选并添加零矢量以使候选列表为恒定长度来建构运动矢量候选列表。然后,编码器可以从候选列表中选择最佳预测器,并发送指示所选候选的对应索引。与Merge索引信令类似,使用截断的一元来编码最佳运动矢量候选的索引。在这种情况下要编码的最大值是2(参见图8)。在以下章节中,提供了关于运动矢量预测候选的推导过程的细节。
2.1.3.1AMVP候选的推导
图8概括了运动矢量预测候选的推导过程。
在运动矢量预测中,考虑两种类型的运动矢量候选:空域运动矢量候选和时域运动矢量候选。对于空域运动矢量候选推导,基于位于图2中所示的五个不同位置的每个PU的运动矢量最终推导两个运动矢量候选。
对于时域运动矢量候选推导,从两个候选中选择一个运动矢量候选,其是基于两个不同的并置的位置推导的。在产生时空候选的第一列表之后,移除列表中的重复的运动矢量候选。如果潜在候选的数量大于2,则从列表中移除相关联的参考图片列表内的其参考图片索引大于1的运动矢量候选。如果空时运动矢量候选的数量小于2,则将附加的零运动矢量候选添加到列表中。
2.1.3.2空域运动矢量候选
在空域运动矢量候选的推导中,在五个潜在候选当中考虑最多两个候选,其从位于如图2中所示的位置的PU中推导,那些位置与运动Merge的位置相同。将当前PU的左侧的推导顺序定义为A0、A1,以及缩放的A0、缩放的A1。将当前PU的上侧的推导顺序定义为B0、B1、B2,缩放的B0、缩放的B1、缩放的B2。因此,对于每一侧,存在可以用作运动矢量候选的四种情况,其中两种情况不需要使用空域缩放,两种情况使用空域缩放。四种不同的情况总结如下。
·无空域缩放
-(1)相同的参考图片列表,以及相同的参考图片索引(相同的POC)
-(2)不同的参考图片列表,但相同的参考图片(相同的POC)
·空域缩放
-(3)相同的参考图片列表,但不同的参考图片(不同的POC)
-(4)不同的参考图片列表,以及不同的参考图片(不同的POC)
首先校验无空域缩放的情况,然后校验空域缩放。当POC在相邻PU的参考图片与当前PU的参考图片之间不同而不管参考图片列表时,考虑空域缩放。如果左候选的所有PU都不可用或者是帧内编码的,则允许对上述运动矢量进行缩放以帮助左和上MV候选的并行推导。否则,不允许对上述运动矢量进行空域缩放。
在空域缩放过程中,以与时域缩放类似的方式缩放相邻PU的运动矢量。如图9所示,主要区别是将参考图片列表和当前PU的索引作为输入给出;实际缩放过程与时域缩放过程相同。
2.1.3.3时域运动矢量候选
除了参考图片索引推导之外,用于推导时域Merge候选的所有过程与用于推导空域运动矢量候选的过程相同(参见图6)。将参考图片索引用信令通知给解码器。
2.2JEM中基于子CU的运动矢量预测方法
在具有QTBT的JEM中,每个CU可以针对每个预测方向具有至多一组运动参数。通过将大CU划分成子CU并且推导大CU的所有子CU的运动信息,在编码器中考虑两个子CU级运动矢量预测方法。可选时域运动矢量预测(Alternative Temporal Motion VectorPrediction,ATMVP)方法允许每个CU从比并置参考图片中的当前CU小的多个块中提取多组运动信息。在空时运动矢量预测(Spatial-Temporal Motion Vector Prediction,STMVP)方法中,通过使用时域运动矢量预测值和空域相邻运动矢量来递归地推导子CU的运动矢量。
为了保留用于子CU运动预测的更准确的运动场,当前禁用参考帧的运动压缩。
图10示出了针对CU的ATMVP运动预测的示例。
2.2.1可选时域运动矢量预测
在可选时域运动矢量预测(ATMVP)方法中,通过从小于当前CU的块中提取多组运动信息(包括运动矢量和参考索引)来修改运动矢量时域运动矢量预测(TMVP)。在一些实施方式中,子CU是正方形N×N块(默认情况下N被设置为4)。
ATMVP以两个步骤预测CU内的子CU的运动矢量。第一步是利用所谓的时域矢量识别参考图片中的对应块。参考图片被称为运动源图片。第二步是将当前CU划分成子CU,并从对应于每个子CU的块中获得运动矢量以及每个子CU的参考索引。
在第一步中,由当前CU的空域临近块的运动信息确定参考图片和对应块。为了避免临近块的重复扫描过程,使用当前CU的Merge候选列表中的第一Merge候选。第一可用运动矢量及其相关联的参考索引被设置为时域矢量和运动源图片的索引。这样,在ATMVP中,与TMVP相比,可以更准确地识别对应块,其中对应块(有时称为并置块)总是相对于当前CU位于右下或中心位置。
在第二步中,通过向当前CU的坐标添加时域矢量,通过运动源图片中的时域矢量来识别子CU的对应块。对于每个子CU,其对应块(覆盖中心样点的最小运动网格)的运动信息用于推导子CU的运动信息。在识别出对应的N×N块的运动信息之后,以与HEVC的TMVP相同的方式将其转换为当前子CU的参考索引和运动矢量,其中运动缩放和其他过程也适用。例如,解码器校验是否满足低时延条件(即,当前图片的所有参考图片的POC小于当前图片的POC)并且可能使用运动矢量MVx(对应于参考图片列表X的运动矢量)来预测每个子CU的运动矢量MVy(其中X等于0或1并且Y等于1-X)。
2.2.2空时运动矢量预测(STMVP)
在该方法中,按照光栅扫描顺序递归地推导子CU的运动矢量。图11示出了该概念。让我们考虑包含四个4×4子CU A,B,C和D的8×8CU。当前帧中临近的4×4块被标记为a,b,c和d。
子CU A的运动推导通过识别其两个空域邻居开始。第一邻居是子CU A上方的N×N块(块c)。如果该块c不可用或者是帧内编码,则(从块c开始,从左到右)校验子CU A上方的其他N×N个块。第二邻居是子CU A左侧的块(块b)。如果块b不可用或者是帧内编码,则(从块b开始,从上到下)校验子CU A左侧的其他块。从每个列表的临近块获得的运动信息被缩放到给定列表的第一参考帧。接下来,通过遵循与HEVC中指定的TMVP推导相同的过程来推导子块A的时域运动矢量预测(Temporal Motion Vector Predictor,TMVP)。提取位置D处的并置块的运动信息并对应地缩放。最后,在检索和缩放运动信息之后,对于每个参考列表,所有可用的运动矢量(最多3个)被分别平均。平均运动矢量被指定为当前子CU的运动矢量。
2.2.3子CU运动预测模式信令通知
子CU模式被启用为附加的Merge候选,并且不需要附加的语法元素来信令通知该模式。将两个附加的Merge候选添加到每个CU的Merge候选列表以表示ATMVP模式和STMVP模式。如果序列参数集指示启用了ATMVP和STMVP,则最多使用七个Merge候选。附加的Merge候选的编码逻辑与HM中的Merge候选相同,这意味着,对于P或B条带中的每个CU,两个附加的Merge候选需要另外两个RD校验。
在JEM中,所有Merge索引的二进位(bin)都由CABAC进行上下文编码。而在HEVC中,仅第一个二进位是上下文编码的,而剩余的二进位是上下文旁路编码的。
2.3VVC中的帧间预测方法
有几种用于帧间预测改进的新编码工具,诸如用于信令MVD的自适应运动矢量差分分辨率(AMVR)、仿射预测模式、三角预测模式(TPM)、ATMVP、广义双向预测(GBI)、双向光流(BIO)。
2.3.1自适应运动矢量差分分辨率
在HEVC中,当条带标头中的use_integer_mv_flag等于0时,以四分之一亮度样点为单位信令通知(PU的运动矢量和预测运动矢量之间的)运动矢量差(Motion VectorDifference,MVD)。在VVC中,引入了局部自适应运动矢量分辨率(Locally AdaptiveMotion Vector Resolution,LAMVR)。在VVC中,MVD可以以四分之一亮度样点、整数亮度样点或四亮度样点(即,1/4像素、1像素、4像素)为单位进行编码。在编码单元(CU)级控制MVD分辨率,并且对于具有至少一个非零MVD分量的每个CU有条件地信令通知MVD分辨率标志。
对于具有至少一个非零MVD分量的CU,信令通知第一标记以指示在CU中是否使用四分之一亮度样点MV精度。当第一标志(等于1)指示不使用四分之一亮度样点MV精度时,信令通知另一标志以指示是使用整数亮度样点MV精度还是四亮度样点MV精度。
当CU的第一MVD分辨率标志为零或未针对CU编码(意味着CU中的所有MVD均为零)时,对于CU使用四分之一亮度样点MV分辨率。当CU使用整数亮度样点MV精度或四亮度样点MV精度时,CU的AMVP候选列表中的MVP被取整到对应的精度。
在编码器中,CU级RD校验用于确定将哪个MVD分辨率用于CU。即,对于每个MVD分辨率,执行三次CU级RD校验。为了加快编码器速度,在JEM中应用以下编码方案。
·在具有常规四分之一亮度样点MVD分辨率的CU的RD校验期间,存储当前CU的运动信息(整数亮度样点准确度)。存储的运动信息(在取整之后)被用作在RD校验期间针对具有整数亮度样点和4亮度样点MVD分辨率的相同CU的进一步小范围运动矢量细化的起点,使得耗时的运动估计过程不重复三次。
·有条件地调用具有4亮度样点MVD分辨率的CU的RD校验。对于CU,当RD成本整数亮度样点MVD分辨率远大于四分之一亮度样点MVD分辨率时,跳过针对CU的4亮度样点MVD分辨率的RD校验。
编码过程如图12所示。首先,测试1/4像素MV,并计算RD成本并将其表示为RDCost0,然后测试整数MV,并将RD成本表示为RDCost1。如果RDCost1<th*RDCost0(其中th为正值),则测试4像素MV;否则,跳过4像素MV。基本上,在检查整数或4像素MV时,对于1/4像素MV已知运动信息和RD成本等,可以将其重新使用以加快整数或4像素MV的编码过程。
2.3.2三角预测模式
三角预测模式(TPM)的概念是引入用于运动补偿预测的新三角分割。如图所示。参照图13A-13B,其将CU沿对角线方向或对角线反向方向划分为两个三角预测单元。CU中的每个三角预测单元使用从单个单向预测候选列表中推导的参考帧索引和其自己的单向预测运动矢量来进行帧间预测。在预测三角预测单元之后,对对角线边缘执行自适应加权处理。然后,将变换和量化过程应用于整个CU。注意,该模式仅应用于Merge模式(注意:跳过模式被视为特殊的Merge模式)。
图13A-13B是将CU划分为两个三角预测单元(两个划分模式)的图示:13A:135度分割类型(从左上角到右下角划分);图13B:45度划分模式。
2.3.2.1TPM的单向预测候选列表
被称为TPM运动候选列表的单向预测候选列表由五个单向预测运动矢量候选组成。如图14所示,它是从包括五个空域临近块(1到5)和两个时域并置块(6到7)的七个临近块推导出的。根据单向预测运动矢量、双向预测运动矢量的L0运动矢量、双向预测运动矢量的L1运动矢量、和双向预测运动矢量的L0和L1运动矢量的平均运动矢量的顺序,收集七个临近块的运动矢量并将其放入单向预测候选列表中。如果候选数量少于五个,则将零运动矢量添加到列表中。在此列表中为TPM添加的运动候选称为TPM候选,从空域/时域块推导的运动信息称为常规运动候选。
更具体地说,涉及以下步骤:
1)当从空域临近块中添加常规运动候选时,通过完整的裁剪操作从A1,B1,B0,A0,B2,Col和Col2(对应于图14中的块1-7)中获得常规运动候选。
2)设置变量numCurrMergeCand=0
3)对于从A1,B1,B0,A0,B2,Col和Col2推导的每个常规运动候选(如果未裁剪并且numCurrMergeCand小于5),如果常规运动候选是单向预测的(来自列表0或列表1),则将其作为TPM候选直接添加到Merge列表中,且numCurrMergeCand增加1。这样的TPM候选称为“原始单向预测的候选”。
应用完全裁剪
4)对于从A1,B1,B0,A0,B2,Col和Col2推导的每个运动候选(如果未裁剪并且numCurrMergeCand小于5),如果常规运动候选是双向预测的,则列表0中的运动信息为作为新的TPM候选被添加到TPM Merge列表(即修改为来自列表0的单向预测),且numCurrMergeCand增加1。这样的TPM候选被称为“截断(Truncated)的列表0预测的候选”。
应用完全裁剪
5)对于从A1,B1,B0,A0,B2,Col和Col2推导的每个运动候选(如果未裁剪并且numCurrMergeCand小于5),如果常规运动候选是双向预测的,则列表1中的运动信息被添加到TPM Merge列表(即,修改为来自列表1的单向预测),且numCurrMergeCand增加1。这样的TPM候选被称为“截断的列表1预测的候选”。
应用完全裁剪
6)对于从A1,B1,B0,A0,B2,Col和Col2推导的每个运动候选(如果未裁剪并且numCurrMergeCand小于5),如果常规运动候选是双向预测,
–如果列表0参考图片的条带QP小于列表1参考图片的条带QP,则列表1的运动信息首先被缩放为列表0参考图片,并且两个MV(一个来自原始列表0,另一个是来自列表1的缩放MV)的平均值被添加到TPMMerge列表中,这样的候选被称为来自列表0运动候选的平均单向预测,且numCurrMergeCand增加1。
–否则,首先将列表0的运动信息缩放到列表1参考图片,然后将两个MV(一个来自原始列表1,另一个是来自列表0的缩放MV)的平均值添加到TPM Merge列表中,这样的TPM候选被称为来自列表1运动候选的平均单向预测,且numCurrMergeCand增加1。
应用完全裁剪
7)如果numCurrMergeCand小于5,则添加零运动矢量候选。
将候选插入列表时,如果必须将其与所有先前添加的候选进行比较以查看其是否与其中一个相同,则此过程称为完全裁剪。
2.3.2.2自适应加权过程
在预测每个三角预测单元之后,将自适应加权过程应用于两个三角预测单元之间的对角边缘,以推导整个CU的最终预测。两个加权因子组定义如下:
·第一加权因子组:{7/8、6/8、4/8、2/8、1/8}和{7/8、4/8、1/8}分别用于亮度和色度样点;
·第二加权因子组:{7/8、6/8、5/8、4/8、3/8、2/8、1/8}和{6/8、4/8、2/8}分别用于亮度和色度样点。
基于两个三角预测单元的运动矢量的比较来选择加权因子组。当两个三角预测单元的参考图片彼此不同或者它们的运动矢量差大于16个像素时,使用第二加权因子组。否则,使用第一加权因子组。
2.3.2.3三角预测模式(TPM)的信令通知
可以首先用信令通知指示是否使用TPM的一位标志。然后,进一步用信令通知两个划分模式的指示(如图13A-13B所示),以及为两个分割中的每个分割选择的Merge索引。
2.3.2.3.1TPM标志的信令
让我们分别用W和H表示一个亮度块的宽度和高度。如果W*H<64,则禁用三角预测模式。
当以仿射模式对一个块进行编码时,也禁用三角预测模式。
当以Merge模式对一个块进行编码时,可以用信令通知一位标志以指示是否对该块启用或禁用了三角预测模式。
基于以下等式,用3个上下文对标志进行编码:
Ctx索引=((左侧块L可用&&L用TPM编码?)1:0)+((上方块A可用&&A用TPM编码?)1:0);
图15示出了在TPM标志编码中用于上下文选择的临近块(A和L)的示例。
2.3.2.3.2用信令通知两个划分模式的指示(如图13所示),以及为两个分割中的每个分割选择的Merge索引
注意,联合编码划分模式和两个分割的Merge索引。在现有的实现方式中,限制了两个分割不能使用相同的参考索引。因此,存在2(划分模式)*N个(Merge候选的最大数量)*(N-1)个可能性,其中N被设置为5。一个指示被编码,并且从下面定义的数组中推导划分模式、两个Merge索引和编码指示之间的映射:
const uint8_t g_TriangleCombination[TRIANGLE_MAX_NUM_CANDS][3]={
{0,1,0},{1,0,1},{1,0,2},{0,0,1},{0,2,0},
{1,0,3},{1,0,4},{1,1,0},{0,3,0},{0,4,0},
{0,0,2},{0,1,2},{1,1,2},{0,0,4},{0,0,3},
{0,1,3},{0,1,4},{1,1,4},{1,1,3},{1,2,1},
{1,2,0},{0,2,1},{0,4,3},{1,3,0},{1,3,2},
{1,3,4},{1,4,0},{1,3,1},{1,2,3},{1,4,1},
{0,4,1},{0,2,3},{1,4,2},{0,3,2},{1,4,3},
{0,3,1},{0,2,4},{1,2,4},{0,4,2},{0,3,4}};
划分模式(45度或135度)=g_TriangleCombination[用信令通知的指示][0];
候选A的Merge索引=g_TriangleCombination[用信令通知的指示][1];
候选B的Merge索引=g_TriangleCombination[用信令通知的指示][2];
一旦推导出了两个运动候选A和B,就可以从A或B中设置两个分割的运动信息(PU1和PU2)。PU1是否使用Merge候选A或B的运动信息取决于两个运动候选的预测方向。表1示出了具有两个分割的两个推导的运动候选A和B之间的关系。
表1:从推导的两个Merge候选(A,B)推导分割的运动信息
Figure BDA0003072137370000171
Figure BDA0003072137370000181
merge_triangle_idx在[0,39]范围内,包括端点。K阶指数哥伦布(exp-Golomb,EG)码用于merge_triangle_idx的二值化,其中K设置为1。
第K阶EG
为了用更少的比特编码较大的数字(以使用更多的比特编码较小的数字为代价),可以使用非负整数参数k来概括。以k阶指数哥伦布(exp-Golomb)码编码非负整数x:
1.使用上述的0阶exp-Golomb码对
Figure BDA0003072137370000183
进行编码,然后
2.将x mod 2k编码为二进制位。
表1:Exp-Golomb-k编码示例
Figure BDA0003072137370000182
2.3.3仿射运动补偿预测
在HEVC中,运动补偿预测(MCP)仅应用平移运动模型。然而,在真实世界中可能存在多种运动,例如放大/缩小、旋转、透视运动和其他不规则运动。在VVC中,简化的仿射变换运动补偿预测适用于4参数仿射模型和6参数仿射模型。如图16A-16B所示,通过用于4参数仿射模型(图16A)的两个控制点运动矢量(CPMV)和用于6参数仿射模型(图16B)的3个CPMV来描述块的仿射运动场。
块的运动矢量场(MVF)由以下等式与等式(1)中的4参数仿射模型(其中4参数定义为变量a,b,e和f)和等式(2)中的4参数仿射模型(其中6参数定义为变量a,b,c,d,e和f)来描述:
Figure BDA0003072137370000191
其中(mvh 0,mvh 0)是左上角控制点的运动矢量,(mvh 1,mvh 1)是右上角控制点的运动矢量,(mvh 2,mvh 2)是左下角的运动矢量控制点的运动矢量,所有这三个运动矢量都称为控制点运动矢量(CPMV),(x,y)代表相对于当前块内左上角样点的代表点的坐标,并且(mvh(x,y),mvv(x,y))是为位于(x,y)的样点推导的运动矢量。CP运动矢量可以被发信令通知(例如在仿射AMVP模式中)或被即时推导(例如在仿射Merge模式中)。w和h是当前块的宽度和高度。在实践中,除法是通过取整和右移来实现的。在VTM中,代表点定义为子块的中心位置,例如,当子块的左上角相对于当前块内左上角样点的坐标为(xs,ys),代表点的坐标被定义为(xs+2,ys+2)。对于每个子块(即VTM中的4x4),代表点用于推导整个子块的运动矢量。
为了进一步简化运动补偿预测,应用了基于子块的仿射变换预测。为了推导每个M×N(在当前VVC中,M和N都设置为4)子块的运动矢量,如图17所示,根据等式(1)和(2)计算出每个子块的中心样点的运动矢量,并被取整到1/16的分数精度。然后,将适用于1/16像素的运动补偿插值滤波器应用于生成具有推导运动矢量的每个子块的预测。仿射模式引入了1/16像素的插值滤波器。
在MCP之后,对每个子块的高精度运动矢量进行取整并保存为与常规运动矢量相同的精度。
2.3.3.1仿射预测的信令
类似于平移运动模型,由于仿射预测,也存在两种用于发信令通知辅助信息的模式。它们是AFFINE_INTER和AFFINE_MERGE模式。
2.3.3.2AF_INTER模式
对于宽度和高度均大于8的CU,可以应用AF_INTER模式。在比特流中用信令通知CU级的仿射标志,以指示是否使用AF_INTER模式。
在此模式下,对于每个参考图片列表(列表0或列表1),仿射AMVP候选列表按以下顺序由三种类型的仿射运动预测器构成,其中每个候选包括当前块的估计CPMV。用信令通知在编码器侧(诸如图20中的mv0,mv1,mv2)找到的最佳CPMV和估计的CPMV的差异。另外,进一步用信令通知从其推导估计的CPMV的仿射AMVP候选的索引。
1)继承的仿射运动预测器
检查顺序类似于HEVC AMVP列表构造中的空域MVP。首先,从{A1,A0}中的第一块推导左继承的仿射运动预测器,该第一块被仿射编码,并且具有与当前块相同的参考图片。其次,从{B1,B0,B2}中的第一块推导上述继承的仿射运动预测器,该第一块被仿射编码,并且具有与当前块相同的参考图片。在图19中示出了五个块A1,A0,B1,B0,B2。
一旦发现临近块被以仿射模式编码,则覆盖该临近块的编码单元的CPMV被用于推导当前块的CPMV的预测器。例如,如果A1用非仿射模式编码,而A0用4参数仿射模式编码,则左继承的仿射MV预测器将从A0推导。在这种情况下,覆盖A0的CU的CPMV,如图21中左上角的CPMV的
Figure BDA0003072137370000201
和右上角的CPMV的
Figure BDA0003072137370000202
所示,用于推导当前块的估计CPMV,由用于当前块的左上(坐标(x0,y0))、右上(坐标(x1,y1))和右下(坐标(x2,y2))位置的
Figure BDA0003072137370000203
表示。
2)构造仿射运动预测器
构造的仿射运动预测器由从具有相同的参考图片的相邻帧间编码块推导的控制点运动矢量(CPMV)组成,如图20所示。如果当前仿射运动模型为4参数仿射,则CPMV的数量为2,否则,如果当前仿射运动模型为6参数仿射,则CPMV的数量为3。左上角的CPMV
Figure BDA0003072137370000204
是由{A,B,C}组中第一块处的MV推导的,该组被帧间编码,并具有与当前块相同的参考图片。右上角的CPMV
Figure BDA0003072137370000205
是由{D,E}组中第一块处的MV推导的,该组被帧间编码,并具有与当前块相同的参考图片。左下角的CPMV
Figure BDA0003072137370000206
是由{F,G}组中第一块处的MV推导的,该组被帧间编码,并具有与当前块相同的参考图片。
-如果当前仿射运动模型是4参数仿射,则只有当
Figure BDA0003072137370000207
Figure BDA0003072137370000208
都已知时,才会将构造的仿射运动预测器插入到候选列表中,即将
Figure BDA0003072137370000209
用作当前块的左上(坐标(x0,y0))、右上(坐标(x1,y1))位置的估计CPMV。
-如果当前仿射运动模型是6参数仿射,则只有当
Figure BDA00030721373700002010
Figure BDA00030721373700002011
都已知时,才会将构造的仿射运动预测器插入到候选列表中,即
Figure BDA0003072137370000211
Figure BDA0003072137370000212
用作当前块的左上(坐标(x0,y0))、右上(坐标(x1,y1))和右下(坐标(x2,y2))位置的估计CPMV。
当将构造的仿射运动预测器插入候选列表时,不应用裁剪过程。
3)常规AMVP运动预测器
应用以下内容,直到仿射运动预测器的数量达到最大值为止。
1)通过将所有CPMV设置为等于
Figure BDA0003072137370000213
(如果可用)来推导仿射运动预测器。
2)通过将所有CPMV设置为等于
Figure BDA0003072137370000214
(如果可用)来推导仿射运动预测器。
3)通过将所有CPMV设置为等于
Figure BDA0003072137370000215
(如果可用)来推导仿射运动预测器。
4)通过将所有CPMV设置为等于HEVC TMVP(如果可用)来推导仿射运动预测器。
5)通过将所有CPMV设置为零MV来推导仿射运动预测器。
注意,
Figure BDA0003072137370000216
已经在构造的仿射运动预测器中推导出。
图18A示出了4参数仿射模型的示例。图18B示出了6参数仿射模型的示例。
图19示出了继承的仿射候选的AF_INTER的MVP的示例。
图20示出了构造的仿射候选的AF_INTER的MVP的示例。
在AF_INTER模式下,当使用4/6参数仿射模式时,需要2/3个控制点,因此,需要为这些控制点编码2/3个MVD,如图18所示。在现有的实现中,提出推导MV,如下所示,即,从mvd0预测mvd1和mvd2
Figure BDA0003072137370000217
Figure BDA0003072137370000218
Figure BDA0003072137370000219
其中
Figure BDA00030721373700002110
mvdi和mv1分别是左上像素(i=0)、右上像素(i=1)或左下像素(i=2)的预测运动矢量、运动矢量差和运动矢量,如图18B所示。请注意,两个运动矢量(例如mvA(xA,yA)和mvB(xB,yB))的加和分别等于两个分量的总和,即newMV=mvA+mvB,且newMV的两个分量分别被设置为(xA+xB)和(yA+yB)。
2.3.3.3AF_MERGE模式
当以AF_MERGE模式应用CU时,它从有效的邻居重构块中获得以仿射模式编码的第一块。并且候选块的选择顺序是从左、上、右上,左下到左上(依次由A,B,C,D,E表示),如图21所示。例如,如果邻居左下块以仿射模式被编码,如图21B中的A0所示,则获取包含块A的相邻CU/PU的左上角、右上角和左下角的控制点(CP)运动矢量mv0 N、mv1 N和mv2 N。基于mv0 N、mv1 N和mv2 N计算当前CU/PU左上角/右上/左下的运动矢量mv0 C、mv1 C和mv2 C(仅用于6参数仿射模型)。应该注意的是,在VTM-2.0中,如果当前块为仿射编码的,则位于左上角的子块(例如,VTM中的4×4块)存储mv0,位于右上角的子块存储mv1。如果使用6参数仿射模型对当前块进行编码,则位于左下角的子块存储mv2;否则(使用4参数仿射模型对当前块进行编码),LB存储mv2’。其他子块存储用于MC的MV。
在推导当前CU的CPMVmv0 C、mv1 C和mv2 C之后,根据简化的仿射运动模型等式(1)和(2),生成当前CU的MVF。为了识别当前CU是否以AF_MERGE模式编码,当至少一个邻近块以仿射模式编码时,在比特流中用信令通知仿射标志。
在一些现有的实现中,仿射Merge候选列表通过以下步骤构造:
1)插入继承的仿射候选
继承的仿射候选是指该候选是从其有效邻居仿射编码块的仿射运动模型推导的。从临近块的仿射运动模型中推导最多两个继承的仿射候选,并将其插入到候选列表中。对于左预测器,扫描顺序为{A0,A1};对于上述预测器,扫描顺序为{B0,B1,B2}。
2)插入构造的仿射候选
如果仿射Merge候选列表中的候选数量小于MaxNumAffineCand(例如5),则将构造的仿射候选插入到候选列表中。构造仿射候选是指通过组合每个控制点的邻居运动信息来构造候选。
a)首先从图22所示的指定空域邻居和时域邻居中推导控制点的运动信息。CPk(k=1,2,3,4)表示第k个控制点。A0,A1,A2,B0,B1,B2和B3是用于预测CPk(k=1、2、3)的空域位置;T是用于预测CP4的时域位置。
CP1,CP2,CP3和CP4的坐标分别是(0,0),(W,0),(H,0)和(W,H),其中W和H是当前块的宽度和高度。
根据以下优先级顺序获得每个控制点的运动信息:
–对于CP1,检查优先级为B2->B3->A2。如果B2可用,则使用B2。否则,如果B2不可用,则使用B3。如果B2和B3都不可用,则使用A2。如果这三个候选都不可用,则无法获得CP1的运动信息。
–对于CP2,检查优先级为B1→B0;
–对于CP3,检查优先级为A1→A0;
–对于CP4,使用T。
b)其次,使用控制点的组合来构造仿射Merge候选。
I.需要三个控制点的运动信息来构造6参数仿射候选。可以从以下四个组合({CP1,CP2,CP4},{CP1,CP2,CP3},{CP2,CP3,CP4},{CP1,CP3,CP4})中的一个中选择三个控制点。组合{CP1,CP2,CP3},{CP2,CP3,CP4},{CP1,CP3,CP4}将转换为由左上、右上和左下控制点表示的6参数运动模型。
II.需要两个控制点的运动信息来构造4参数仿射候选。可以从两个组合({CP1,CP2},{CP1,CP3})中的一个中选择两个控制点。这两个组合将转换为由左上和右上控制点表示的4参数运动模型。
III.按照以下顺序将构造的仿射候选的组合插入到候选列表中:
{CP1,CP2,CP3},{CP1,CP2,CP4},{CP1,CP3,CP4},{CP2,CP3,CP4},{CP1,CP2},{CP1,CP3}
i.对于每个组合,检查每个CP的列表X的参考索引,如果它们都相同,则此组合具有针对列表X的有效CPMV。如果组合对于列表0和列表1均没有有效的CPMV,则该组合被标记为无效。否则,它是有效的,并将CPMV放入子块Merge列表中。
3)填充零运动矢量
如果仿射Merge候选列表中的候选的数量小于5,则将具有零参考索引的零运动矢量插入候选列表中,直到列表已满。
更具体地,对于子块Merge候选列表,具有MV设置为(0,0)且预测方向设置为列表0的单向预测(对于P条带)和双向预测(对于B条带)的4参数Merge候选。
2.3.4当前图片参考
HEVC屏幕内容编码扩展(SCC)中采用了帧内块复制(也称为IBC或帧内图片块补偿),也称为当前图片参考(CPR)。该工具对于屏幕内容视频的编码非常有效,因为在同一图片中经常出现文本和图形丰富内容的重复模式。将具有相同或相似图案的先前重构的块用作预测器可以有效地减少预测误差并因此提高编码效率。帧内块补偿的示例在图23中示出。
类似于HEVC SCC中的CRP的设计,在VVC中,在序列和图片级上用信令通知IBC模式的使用。在序列参数集(SPS)上启用IBC模式时,可以在图片级启用IBC模式。当在图片级启用IBC模式时,当前的重构图片将被视为参考图片。因此,在现有的VVC帧间模式之上无需在块级上进行语法更改即可用信令通知IBC模式的使用。
主要特征:
–被视为常规的帧间模式。因此,Merge和跳过模式也可用于IBC模式。Merge候选列表构造是统一的,包含来自相邻位置的Merge候选,这些Merge候选以IBC模式或HEVC帧间模式进行编码。根据所选的Merge索引,处于Merge或跳过模式下的当前块可以合并为IBC模式编码的邻居或以不同图片作为参考图片的、常规帧间模式编码的一个。
–用于IBC模式的块矢量预测和编码方案重用了HEVC帧间模式下用于运动矢量预测和编码的方案(AMVP和MVD编码)。
–IBC模式的运动矢量(也称为块矢量)以整数像素精度进行编码,但由于在插值和解块(deblocking)阶段需要四分之一像素精度,因此在解码后以1/16像素精度存储在内存中。当用于IBC模式的运动矢量预测时,存储的矢量预测器将右移4。
–搜索范围:仅限于当前CTU之内。
–启用仿射模式/三角模式/GBI/加权预测时,不允许使用CPR。
2.3.5VVC中的Merge列表设计
VVC支持三种不同的Merge列表构造过程:
1)子块Merge候选列表:它包括ATMVP和仿射Merge候选。仿射模式和ATMVP模式共享一个Merge列表构造过程。在此,可以按顺序添加ATMVP和仿射Merge候选。子块Merge列表的尺寸在条带标头中用信令通知,且最大值为5。
2)单向预测TPM Merge列表:对于三角预测模式,即使两个分割可以选择他们自己的Merge候选索引,也共享两个分割的一个Merge列表构造过程。当构造该Merge列表时,检查该块的空域临近块和两个时域块。从空域邻居和时域块推导的运动信息在我们的IDF中称为常规运动候选。这些常规运动候选进一步被用来推导多个TPM候选。请注意,变换是在整个块级执行的,即使两个分割可能使用不同的运动矢量来生成他们自己的预测块。双向预测TPM Merge列表尺寸固定为5。
3)常规Merge列表:对于剩余的编码块,共享一个Merge列表构造过程。在此,可以依次插入空域/时域/HMVP、成对组合的双向预测Merge候选和零运动候选。常规Merge列表的尺寸在条带标头中用信令通知,且最大值为6。
2.3.5.1子块Merge候选列表
建议将除了与非子块Merge候选的常规Merge列表之外的所有子块相关运动候选放入单独的Merge列表中。
将与子块相关的运动候选放在单独的Merge列表中,命名为“子块Merge候选列表”。
在一个示例中,子块Merge候选列表包括仿射Merge候选、ATMVP候选和/或基于子块的STMVP候选。
2.3.5.1.1另一个ATMVP实施例
在此贡献中,将常规Merge列表中的ATMVP Merge候选移至仿射Merge列表的第一位置。这样,新列表中的所有Merge候选(即基于子块的Merge候选列表)都基于子块编码工具。
2.3.5.1.1VTM-3.0中的ATMVP
在VTM-3.0中,除了常规Merge候选列表之外,还添加了特殊Merge候选列表,称为子块Merge候选列表(又称为仿射Merge候选列表)。子块Merge候选列表按以下顺序填充候选:
b.ATMVP候选(可能可用或不可用);
c.继承的仿射候选;
d.构造的仿射候选;
e.填充为零MV 4参数仿射模型
子块Merge候选列表中的最大候选数量(表示为ML)推导如下:
1)如果ATMVP使用标志(例如,该标志可以命名为“sps_sbtmvp_enabled_flag”)为开(on)(等于1),但仿射使用标志(例如,该标志可以命名为“sps_affine_enabled_flag”)为关(off)(等于0),则将ML设置为等于1。
2)如果ATMVP使用标志为关(等于0),并且仿射使用标志为关(等于0),则将ML设置为等于0。在这种情况下,不使用子块Merge候选列表。
3)否则(仿射使用标志为开(等于1),ATMVP使用标志为开或关),从编码器向解码器用新号发送ML。有效的ML为0<=ML<=5。
当构造子块Merge候选列表时,首先检查ATMVP候选。如果以下任一条件为真,则跳过ATMVP候选,并且不将其放入子块Merge候选列表中。
1)ATMVP使用标志为关;
2)任何TMVP使用标志(例如,当在条带级别信令通知时,该标志可以命名为“slice_temporal_mvp_enabled_flag”);
3)参考列表0中参考索引为0的参考图片与当前图片相同(为CPR)
VTM-3.0中的ATMVP比JEM中简单得多。当生成ATMVP Merge候选时,应用以下过程:
a.如图22所示,检查临近块A1、B1、B0、A0,以便于找到第一个帧间编码但不是CPR编码的块,记为块X;
b.初始化TMV=(0,0)。如果存在块X的MV(记为MV'),参考并置的参考图片(如在条带标头中用信令通知的),则将TMV设置为等于MV'。
c.假设当前块的中心点是(x0,y0),则按照M=(x0+MV’x,y0+MV’y)在并置图片对(x0,y0)的对应位置进行定位。找到覆盖M的块Z。
i.如果Z是帧内编码的,则ATMVP不可用;
ii.如果Z是帧间编码的,则将块Z的两个列表的MVZ_0和MVZ_1缩放到(Reflist 0索引0)和(Reflist 1索引0),作为MVdefault0、MVdefault1,并进行存储。
d.对于每个8x8子块,假设其中心点为(x0S,y0S),则按照MS=(x0S+MV’x,y0S+MV’y)在并置图片中对(x0S,y0S)的对应位置进行定位。找到覆盖MS的块ZS。
i.如果ZS是帧内编码的,则将MVdefault0、MVdefault1分配给子块;
ii.如果ZS帧间编码的,则将块ZS的两个列表的MVZS_0和MVZS_1缩放到(Reflist0索引0)和(Reflist 1索引0),并分配给子块;
ATMVP中的MV裁剪和掩蔽:
当在并置图片中定位诸如M或MS的对应位置时,其被裁剪到预定区域内。CTU尺寸为S×S,在VTM-3.0中,S=128。假设并置的CTU的左上角位置是(xCTU,yCTU),则(xN,yN)处的对应位置M或MS将被裁剪到有效区域xCTU<=xN<xCTU+S+4;yCTU<=yN<yCTU+S。
除了裁剪之外,(xN,yN)还被掩蔽为xN=xN&MASK,yN=yN&MASK,其中MASK是等于~(2N-1)的整数,并且N=3,以将最低的3比特置为0。因此xN和yN必须是8的倍数(“~”表示按位补码运算符)。
图24示出了并置图片中的有效对应区域的示例。
2.3.5.1.3条带标头中的语法设计
Figure BDA0003072137370000271
2.3.5.2常规Merge列表
与Merge列表设计不同,在VVC中,采用了基于历史的运动矢量预测(HMVP)方法。
在HMVP中,存储了先前编码的运动信息。将先前编码的块的运动信息定义为HMVP候选。多个HMVP候选存储在一个名为HMVP表的表中,并且该表在即时编码/解码过程中进行维护。当开始对新条带进行编码/解码时,将清空HMVP表。每当存在帧间编码块时,相关联的运动信息就会作为新的HMVP候选添加到表的最后一项。总体编码流程在图25中示出。
HMVP候选可以在AMVP和Merge候选列表构造过程中使用。图26示出了修改的Merge候选列表构造过程(以蓝色突出显示)。当在插入TMVP候选之后Merge候选列表未满时,可以利用存储在HMVP表中的HMVP候选来填充Merge候选列表。考虑到一个块通常在运动信息方面与最近的临近块具有较高的相关性,以索引的降序插入表中的HMVP候选。表中的最后一个条目被首先添加到列表中,第一个条目被最后添加。类似地,对HMVP候选应用冗余去除。一旦可用Merge候选的总数达到允许用信令通知的Merge候选的最大数量,则Merge候选列表构造过程终止。
2.4MV取整
在VVC中,当MV右移时,要求将其向零取整。对于将要右移N比特的MV(MVx,MVy),其结果MV’(MVx’,MVy’)将以公式化的方式推导如下:
MVx’=(MVx+((1<<N)>>1)-(MVx>=0?1:0))>>N;
MVy’=(MVy+((1<<N)>>1)-(MVy>=0?1:0))>>N;
2.5参考图片重重新采样(RPR)的实施例
ARC,又称为参考图片重新采样(RPR)已被合并到一些现有和即将发布的视频标准中。
在RPR的一些实施例中,如果并置图片具有与当前图片不同的分辨率,则禁用TMVP。此外,当参考图片具有与当前图片不同的分辨率时,禁用BDOF和DMVR。
为了在参考图片具有与当前图片不同的分辨率时处理常规的MC,插值部分定义如下:
8.5.6.3分数样点插值过程
8.5.6.3.1概述
此过程的输入是:
–亮度位置(xSb,ySb),指定当前编码子块相对于当前图片的左上角亮度样点的左上角样点;
–变量sbWidth,指定当前编码子块的宽度,
–变量sbHeight,指定当前编码子块的高度,
–运动矢量偏移mvOffset,
–细化的运动矢量refMvLX,
–所选参考图片样点数组refPicLX,
–半样点插值滤波器索引hpelIfIdx,
–双向光流标志bdofFlag,
–变量cIdx,指定当前块的颜色分量索引。
该过程的输出是:
–预测样点值的(sbWidth+brdExtSize)x(sbHeight+brdExtSize)数组predSamplesLX。
预测块边界扩展尺寸brdExtSize的推导如下:
brdExtSize=(bdofFlag||(inter_affine_flag[xSb][ySb]&&sps_affine_prof_enabled_flag))?2:0 (8-752)
将变量fRefWidth设置为等于亮度样点中参考图片的PicOutputWidthL。
将变量fRefHeight设置为等于亮度样点中参考图片的PicOutputHeightL。
将运动矢量mvLX设置为等于(refMvLX-mvOffset)。
–如果cIdx等于0,则应用以下操作:
–缩放因子及其定点表示定义为
hori_scale_fp=((fRefWidth<<14)+(PicOutputWidthL>>1))/PicOutputWidthL(8-753)
vert_scale_fp=((fRefHeight<<14)+(PicOutputHeightL>>1))/PicOutputHeightL(8-754)
–令(xIntL,yIntL)为以全样点单元给出的亮度位置,且(xFracL,yFracL)为以1/16样点单元给出的偏移。这些变量仅在本条中用于指定参考样点数组refPicLX内部的分数样点位置。
–将参考样点填充(xSbIntL,ySbIntL)的边界块的左上坐标设置为等于(xSb+(mvLX[0]>>4),ySb+(mvLX[1]>>4))。
–对于预测亮度样点数组predSamplesLX内部的每个亮度样点位置(xL=0..sbWidth-1+brdExtSize,yL=0..sbHeight-1+brdExtSize),对应的预测亮度样点值predSamplesLX[xL][yL]推导如下:
–令(refxSbL,refySbL)和(refxL,refyL)为以1/16样点单元给出的运动矢量(refMvLX[0],refMvLX[1])指向的亮度位置(refMvLX[0],refMvLX[1])。变量refxSbL,refxL,refySbL和refyL的推导如下:
refxSbL=((xSb<<4)+refMvLX[0])*hori_scale_fp (8-755)
refxL=((Sign(refxSb)*((Abs(refxSb)+128)>>8)+xL*((hori_scale_fp+8)>>4))+32)>>6 (8-756)
refySbL=((ySb<<4)+refMvLX[1])*vert_scale_fp (8-757)
refyL=((Sign(refySb)*((Abs(refySb)+128)>>8)+yL*((vert_scale_fp+8)>>4))+32)>>6 (8-758)
–变量xIntL,yIntL,xFracL和yFracL的推导如下:
xIntL=refxL>>4 (8-759)
yIntL=refyL>>4 (8-760)
xFracL=refxL&15 (8-761)
yFracL=refyL&15 (8-762)
–如果bdofFlag等于真(TRUE)或(sps_affine_prof_enabled_flag等于TRUE并且inter_affine_flag[xSb][ySb]等于TRUE),并且以下条件中的一个或多个为真,则预测亮度样点值predSamplesLX[xL][yL]是通过调用第8.5.6.3.3条中指定的亮度整数样点获取过程以(xIntL+(xFracL>>3)-1),yIntL+(yFracL>>3)-1)和refPicLX作为输入来推导的。
1.xL等于0。
2.xL等于sbWidth+1。
3.yL等于0。
4.yL等于sbHeight+1。
–否则,预测亮度样点值predSamplesLX[xL][yL]通过调用第8.5.6.3.2节中指定的亮度样点8抽头插值滤波过程以(xIntL-(brdExtSize>0?1:0)、yIntL-(brdExtSize>0?1:0))、(xFracL,yFracL),(xSbIntL,ySbIntL)、refPicLX、hpelIfIdx、sbWidth、sbHeight和(xSb,ySb)作为输入来推导。
–否则(cIdx不等于0),应用以下操作:
–令(xIntC,yIntC)为以全样点单元给出的色度位置,且(xFracC,yFracC)为以1/32样点单元给出的偏移。这些变量仅在本条中用于指定参考样点数组refPicLX内部的常规分数样点位置。
–将参考样点填充(xSbIntC,ySbIntC)的边界块的左上坐标设置为等于((xSb/SubWidthC)+(mvLX[0]>>5),(ySb/SubHeightC)+(mvLX[1]>>5))。
–对于预测色度样点数组predSamplesLX内部的每个色度样点位置(xC=0..sbWidth-1,yC=0..sbHeight-1),对应的预测色度样点值predSamplesLX[xC][yC]的推导如下:
–令(refxSbC,refySbC)和(refxC,refyC)为以1/32样点单元给出的运动矢量(mvLX[0],mvLX[1])指向的色度位置。变量refxSbC、efySbC、efxC和refyC的推导如下:
refxSbC=((xSb/SubWidthC<<5)+mvLX[0])*hori_scale_fp (8-763)
refxC=((Sign(refxSbC)*((Abs(refxSbC)+256)>>9)+xC*((hori_scale_fp+8)>>4))+16)>>5 (8-764)
refySbC=((ySb/SubHeightC<<5)+mvLX[1])*vert_scale_fp (8-765)
refyC=((Sign(refySbC)*((Abs(refySbC)+256)>>9)+yC*((vert_scale_fp+8)>>4))+16)>>5 (8-766)
–变量xIntC、yIntC、xFracC和FracC的推导如下:
xIntC=refxC>>5 (8-767)
yIntC=refyC>>5 (8-768)
xFracC=refyC&31 (8-769)
yFracC=refyC&31 (8-770)
–预测样点值predSamplesLX[xC][yC]是通过调用第8.5.6.3.4节中指定的过程以(xIntC,yIntC)、xFracC,yFracC)、xSbIntC,ySbIntC)、bWidth、bHeight和refP作为输入推导的。
8.5.6.3.2亮度样点插值滤波过程
该程的输入为
–以全样点为单位的亮度位置(xIntL,yIntL),
–以分数样点为单位的亮度位置(xFracL,yFracL),
–以全样点为单位的亮度位置(xSbIntL,ySbIntL),指定相对于参考图片的左上亮度样点的参考样点填充的边界块的左上样点,
–亮度参考样点数组refPicLXL,
–半样点内插滤波器索引hpelIfIdx,
–变量sbWidth,指定当前子块的宽度,
–变量sbHeight,指定当前子块的高度,
–亮度位置(xSb,ySb),指定相对于当前图片的左上角亮度样点的当前子块的左上角样点;
该过程的输出是预测的亮度样点值predSampleLXL
变量shift1、shift2和shift3的推导如下:
–将变量shift1设置为等于Min(4,BitDepthY-8),将变量shift2设置为等于6,并且将变量shift3设置为等于Max(2,14-BitDepthY)。
–将变量picW设置为等于pic_width_in_luma_samples,将变量picH设置为等于pic_height_in_luma_samples。
等于xFracL或yFracL的每个1/16分数样点位置p的亮度插值滤波器系数fL[p]的推导如下:
–如果MotionModelIdc[xSb][ySb]大于0,并且sbWidth和sbHeight都等于4,则在表8-12中指定亮度插值滤波器系数fL[p]。
–否则,根据hpelIfIdx,在表8-11中指定亮度插值滤波器系数fL[p]。
对于i=0..7,以全样点为单位的亮度位置(xInti,yInti)推导如下:
–如果subpic_drawn_as_pic_flag[SubPicIdx]等于1,则应用以下操作:
xInti=Clip3(SubPicLeftBoundaryPos,SubPicRightBoundaryPos,xIntL+i-3)(8-771)
yInti=Clip3(SubPicTopBoundaryPos,SubPicBotBoundaryPos,yIntL+i-3) (8-772)
–否则(subpic_aged_as_pic_flag[SubPicIdx]等于0),应用以下操作:
xInti=Clip3(0,picW-1,sps_ref_wraparound_enabled_flag?
ClipH((sps_ref_wraparound_offset_minus1+1)*MinCbSizeY,picW,xIntL+i-3): (8-773)xIntL+i-3)
yInti=Clip3(0,picH-1,yIntL+i-3)(8-774)
对于i=0..7,对以全样点为单位的亮度位置进一步进行如下修改:
xInti=Clip3(xSbIntL-3,xSbIntL+sbWidth+4,xInti) (8-775)
yInti=Clip3(ySbIntL-3,ySbIntL+sbHeight+4,yInti) (8-776)
预测亮度样点值predSampleLXL的推导如下:
–如果xFracL和yFracL都等于0,则predSampleLXL的值推导如下:
predSampleLXL=refPicLXL[xInt3][yInt3]<<shift3 (8-777)
–否则,如果xFracL不等于0并且yFracL等于0,则predSampleLXL的值推导如下:
Figure BDA0003072137370000331
–否则,如果xFracL等于0且yFracL不等于0,则predSampleLXL的值推导如下:
Figure BDA0003072137370000332
–否则,如果xFracL不等于0并且yFracL不等于0,则predSampleLXL的值推导如下:
–n=0..7的样点数组temp[n]的推导如下:
Figure BDA0003072137370000333
–预测亮度样点值predSampleLXL的推导如下:
Figure BDA0003072137370000334
表8-11–每个1/16分数样点位置p的亮度插值滤波器系数fL[p]的规范
Figure BDA0003072137370000341
表8-12–仿射运动模式下每个1/16分数样点位置p的亮度插值滤波器系数fL[p]的规范。
Figure BDA0003072137370000342
8.5.6.3.3亮度整数样点获取过程
该过程的输入为:
–以全样点为单位的亮度位置(xIntL,yIntL),
–亮度参考样点数组refPicLXL
该过程的输出是预测的亮度样点值predSampleLXL
将变量shift设置为等于Max(2,14-BitDepthY)。
将变量picW设置为等于pic_width_in_luma_samples,并且将变量picH设置为等于pic_height_in_luma_samples。
以全样点为单位的亮度位置(xInt,yInt)推导如下:
xInt=Clip3(0,picW-1,sps_ref_wraparound_enabled_flag? (8-782)
ClipH((sps_ref_wraparound_offset_minus1+1)*MinCbSizeY,picW,xIntL):xIntL)
yInt=Clip3(0,picH-1,yIntL) (8-783)
预测的亮度样点值predSampleLXL的推导如下:
predSampleLXL=refPicLXL[xInt][yInt]<<shift3 (8-784)
8.5.6.3.4色度样点插值过程
该过程的输入为:
–以全样点为单位的色度位置(xIntC,yIntC),
–以1/32分数样点为单位的色度位置(xFracC,yFracC),
–以全样点为单位的色度位置(xSbIntC,ySbIntC),指定相对于参考图片的左上色度样点的参考样点填充的边界块的左上样点,
–变量sbWidth,指定当前子块的宽度,
–变量sbHeight,指定当前子块的高度,
–色度参考样点数组refPicLXC
该过程的输出是预测的色度样点值predSampleLXC
变量shift1、shift2和shift3的推导如下:
–将变量shift1设置为等于Min Min(4,BitDepthC-8),将变量shift2设置为等于6,将变量shift3设置为等于Max(2,14-BitDepthC)。
–将变量picWC设置为等于pic_width_in_luma_samples/SubWidthC,并且将变量picHC设置为等于pic_height_in_luma_samples/SubHeightC。
表8-13中指定了等于xFracC或yFracC的每个1/32分数样点位置p的色度插值滤波器系数fC[p]。
将变量xOffset设置为等于(sps_ref_wraparound_offset_minus1+1)*MinCbSizeY)/SubWidthC。
对于i=0..3,以全样点为单位的色度位置(xInti,yInti)推导如下:
–如果subpic_tained_as_pic_flag[SubPicIdx]等于1,则应用以下操作:
xInti=Clip3(SubPicLeftBoundaryPos/SubWidthC,SubPicRightBoundaryPos/SubWidthC,xIntL+i)(8-785)
yInti=Clip3(SubPicTopBoundaryPos/SubHeightC,SubPicBotBoundaryPos/SubHeightC,yIntL+i) (8-786)
–否则(subpic_aged_as_pic_flag[SubPicIdx]等于0),应用以下操作:
xInti=Clip3(0,picWC-1,sps_ref_wraparound_enabled_flag?ClipH(xOffset,picWC,xIntC+i-1): (8-787)xIntC+i-1)
yInti=Clip3(0,picHC-1,yIntC+i-1)(8-788)
对于i=0..3,对以全样点为单位的色度位置(xInti,yInti)进行如下进一步修改:
xInti=Clip3(xSbIntC-1,xSbIntC+sbWidth+2,xInti) (8-789)
yInti=Clip3(ySbIntC-1,ySbIntC+sbHeight+2,yInti) (8-790)
预测的色度样点值predSampleLXC推导如下:
–如果xFracC和yFracC都等于0,则predSampleLXC的值推导如下:
predSampleLXC=refPicLXC[xInt1][yInt1]<<shift3 (8-791)
–否则,如果xFracC不等于0并且yFracC等于0,则predSampleLXC的值推导如下:
Figure BDA0003072137370000361
–否则,如果xFracC等于0并且yFracC不等于0,则predSampleLXC的值推导如下:
Figure BDA0003072137370000362
–否则,如果xFracC不等于0并且yFracC不等于0,则predSampleLXC的值推导如下:
–n=0..3的样点数组temp[n]推导如下:
Figure BDA0003072137370000371
–预测的色度样点值predSampleLXC推导如下:
predSampleLXC=(fC[yFracC][0]*temp[0]+
fC[yFracC][1]*temp[1]+
fC[yFracC][2]*temp[2]+
(8-795)
fC[yFracC][3]*temp[3])>>shift2
表8-13–每个1/32分数样点位置p的色度插值滤波器系数fC[p]的规范
Figure BDA0003072137370000372
Figure BDA0003072137370000381
2.6采用子图片的实施例
利用现有实施方式中的子图片的当前语法设计,子图片的位置和尺寸推导如下:
Figure BDA0003072137370000382
Figure BDA0003072137370000391
subpics_present_flag等于1指示在SPS RBSP语法中当前存在子图片参数。subpics_present_flag等于0指示在SPS RBSP语法中当前不存在子图片参数。.
注2(NOTE 2)–当比特流是子比特流提取过程的结果并且仅包含子比特流提取过程的输入比特流的子图片的子集时,可能需要在SPSs的RBSP中将subpics_present_flag的值设置为等于1。
max_subpics_minus1加1指定CVS中可能存在的最大子图片数。max_subpics_minus1必须在0到254的范围内。值255保留给ITU-T|ISO/IEC用于将来使用。
subpic_grid_col_width_minus1加1指定以4个样点为单位的子图片标识符网格的每个元素的宽度。语法元素的长度为Ceil(Log2(pic_width_max_in_luma_samples/4))比特。
变量NumSubPicGridCols推导如下:
NumSubPicGridCols=(pic_width_max_in_luma_samples+subpic_grid_col_width_minus1*4+3)/(subpic_grid_col_width_minus1*4+4) (7-5)
subpic_grid_row_height_minus1加1指定以4个样点为单位的子图片标识符网格中每个元素的高度。语法元素的长度为Ceil(Log2(pic_height_max_in_luma_samples/4))比特。
变量NumSubPicGridRows推导如下:
NumSubPicGridRows=(pic_height_max_in_luma_samples+subpic_grid_row_height_minus1*4+3)/(subpic_grid_row_height_minus1*4+4) (7-6)
subpic_grid_idx[i][j]指定网格位置(i,j)的子图片索引。语法元素的长度为Ceil(Log2(max_subpics_minus1+1))比特。
变量SubPicTop[subpic_grid_idx[i][j]]、SubPicLeft[subpic_grid_idx[i][j]]、SubPicWidth[subpic_grid_idx[i][j]]、SubPicHeight[subpic_grid_idx[i][j]]、和NumSubPics推导如下:
Figure BDA0003072137370000401
subpic_treated_as_pic_flag[i]等于1指定将CVS中每个编码图片的第i个子图片视为不包括环路滤波操作的解码过程中的图片。
subpic_tained_as_pic_flag[i]等于0指定在CVS中的每个编码图片的第i个子图片不被视为在不包括环路滤波操作的解码过程中的图片。如果subpic_aged_as_pic_flag[i]不存在,则将subpic_aged_as_pic_flag[i]的值推断为等于0。
2.7组合帧内预测(CIIP)
在VVC中采用组合帧间帧内预测(CIIP)作为特殊Merge候选。它只能为W<=64和H<=64的WxH块启用。
3.现有实施方式的缺点
在VVC的当前设计中,ATMVP具有以下问题:
1)是否应用ATMVP在条带级别和CU级别不匹配;
2)在条带标头中,即使禁用了TMVP,也可以启用ATMVP。同时,ATMVP标志在TMVP标志之前用信令通知。
3)掩蔽总是在不考虑MV是否被压缩的情况下完成的;
4)有效的对应区域可能太大;
5)TMV的推导过于复杂;
6)在某些情况下,ATMVP可能不可用,因此需要更好的默认MV。
7)ATMVP中的MV缩放方法可能没有效率;
8)ATMVP应考虑CPR情况;
9)即使禁用仿射预测,也可以将默认的零仿射Merge候选放入列表中。
10)当前图片被视为长期参考图片,而其他图片被视为短期参考图片。对于ATMVP和TMVP候选,将来自并置图片中的时域块的运动信息缩放到具有固定参考索引(即,对于当前设计中的每个参考图片列表为0)的参考图片。但是,当启用CPR模式时,当前图片也被视为参考图片,并且可以将当前图片添加到索引等于0的参考图片列表0(RefPicList0)。
a.对于TMVP,如果以CPR模式对时域块进行编码,并且RefPicList0的参考图片是短参考图片,则将TMVP候选设置为不可用。
b.如果索引等于0的RefPicList0的参考图片是当前图片,并且当前图片是帧内随机访问点(IRAP)图片,则将ATMVP候选设置为不可用。
c.对于块内的ATMVP子块,当从时域块推导子块的运动信息时,如果以CPR模式对时域块进行编码,则将默认的ATMVP候选(从由当前块的起始TMV和中心位置标识的时域块推导)用于填充子块的运动信息。
11)将MV右移至整数精度,但不遵循VVC中的取整取整规则。
12)由于其指向并置的图片,因此直接使用在ATMVP中用于在不同图片中定位对应块的MV(MVx,MVy)(例如,0中的TMV)。这是基于所有图片都具有相同分辨率的假设。但是,当启用RPR时,可以使用不同的图片分辨率。对于识别并置图片中的对应块以推导子块运动信息存在的类似问题。
13)如果一个块的宽度或高度大于32,并且最大变换块尺寸为32,则对于CIIP编码的块,以CU尺寸生成帧内预测信号;而以TU尺寸生成帧间预测信号(将当前块递归划分为多个32x32块)。使用CU来推导帧内预测信号会导致较低的效率。
当前的设计存在一些问题。首先,如果索引等于0的RefPicList0的参考图片是当前图片,并且当前图片不是IRAP图片,则仍将调用ATMVP过程,但由于没有任何时域运动矢量可以缩放到当前图片,因此它找不到任何可用的ATMVP候选。
4.实施例和技术的示例
下面的技术和实施例的逐项列表应被认为是解释一般概念的示例。不应狭义地解释这些技术。此外,这些技术可以在编码器或解码器实施例中以任何方式组合。
1.应考虑是否允许TMVP和/或是否使用CPR来决定/解析子块Merge候选列表中的最大候选数量和/或决定是否应将ATMVP候选添加到候选列表中。将子块Merge候选列表中的最大候选数量表示为ML。
a)在一个示例中,在确定或解析子块Merge候选列表中的最大候选数量时,如果ATMVP使用标志为关(等于0)或TMVP被禁用,则推断ATMVP不适用。
i.在一个示例中,ATMVP使用标志为开(等于1)并且TMVP被禁用,不将ATMVP候选添加到子块Merge候选列表或ATMVP候选列表中。
ii.在一个示例中,ATMVP使用标志为开(等于1),并且TMVP被禁用,并且仿射使用标志为关(等于0),则将ML设置为等于0,这意味着子块Merge不适用。
iii.在一个示例中,ATMVP使用标志为开(等于1),并且TMVP启用,并且仿射使用标志为关(等于0),则将ML设置为等于1。
b)在一个示例中,当决定或解析子块Merge候选列表中的最大候选数量时,如果ATMVP使用标志为关(等于0)或当前图片的并置参考图片是当前图片本身,则推断ATMVP不适用。
i.在一个示例中,ATMVP使用标志为开(等于1)并且当前图片的并置参考图片是当前图片本身,不将ATMVP候选添加到子块Merge候选列表或ATMVP候选列表中。
ii.在一个示例中,ATMVP使用标志为开(等于1),并且当前图片的并置参考图片是当前图片本身,并且仿射使用标志为关(等于0),则将ML设置为等于0,这意味着子块Merge不适用。
iii.在一个示例中,ATMVP使用标志为开(等于1),并且当前图片的并置参考图片不是当前图片本身,并且仿射使用标志为关(等于0),则将ML设置为等于1。
c)在一个示例中,在决定或解析子块Merge候选列表中的最大候选数量时,如果ATMVP使用标志为关(等于0),或者参考列表0中参考图片索引为0的参考图片是当前图片本身,则推断ATMVP不适用。
i.在一个示例中,ATMVP使用标志为开(等于1),并且参考列表0中参考图片索引为0的并置参考图片是当前图片本身,不将ATMVP候选添加到子块Merge候选列表或ATMVP候选列表中。
ii.在一个示例中,ATMVP使用标志为开(等于1),并且参考列表0中参考图片索引为0的参考图片是当前图片本身,并且仿射使用标志为关(等于0),则将ML设置为等于0,这意味着子块Merge不适用。
iii.在一个示例中,ATMVP使用标志为开(等于1),并且参考列表0中参考图片索引为0的参考图片不是当前图片本身,并且仿射使用标志为关(等于0),则将ML设置为等于1。
d)在一个示例中,在决定或解析子块Merge候选列表中的最大候选数量时,如果ATMVP使用标志为关(等于0),或者参考列表1中参考图片索引为0的参考图片是当前图片本身,则推断ATMVP不适用。
i.在一个示例中,ATMVP使用标志为开(等于1)并且参考列表1中参考图片索引为0的并置参考图片是当前图片本身,不将ATMVP候选添加到子块Merge候选列表或ATMVP候选列表中。
ii.在一个示例中,ATMVP使用标志为开(等于1),并且参考列表1中参考图片索引为0的参考图片是当前图片本身,并且仿射使用标志为关(等于0),则将ML设置为等于0,这意味着子块Merge不适用。
iii.在一个示例中,ATMVP使用标志为开(等于1),并且参考列表1中参考图片索引为0的参考图片不是当前图片本身,并且仿射使用标志为关(等于0),则将ML设置为等于1。
2.提出如果在条带/片/图片级别禁用TMVP,则隐式禁用ATMVP,并且不用信令通知ATMVP标志。
a)在一个示例中,在条带标头/片标头/PPS中的TMVP标志之后,用信令通知ATMVP标志。
b)在一个示例中,可以不在条带标头/片标头/PPS中用信令通知ATMVP或/和TMVP标志,而仅在SPS标头中用信令通知。
3.是否以及如何掩蔽ATMVP中的对应位置取决于是否以及如何压缩MV。假设(xN,yN)是用当前块/子块的坐标和并置图片中的起始运动矢量(例如,TMV)计算出的对应位置。
a)在一个示例中,如果不需要压缩MV(例如,在SPS中用信令通知的sps_disable_motioncompression为1),则不掩蔽(xN,yN);否则,(需要压缩MV)将(xN,yN)掩蔽为xN=xN&MASK,yN=yN&MASK,其中MASK是等于~(2M-1)的整数,并且M可以是诸如3或4的整数。
b)假设每个2Kx2K块中用于MV存储结果的MV压缩方法共享相同的运动信息,并且ATMVP过程中的掩蔽定义为~(2M-1)。建议K可以不等于M,例如,M=K+1。
c)ATMVP和TMVP中使用的MASK可以相同,也可以不同。
4.在一个示例中,MV压缩方法可以是灵活的。
a)在一个示例中,可以在无压缩、8×8压缩(条目3.a中的M=3)或16×16压缩(条目3.a中的M=4)之间选择MV压缩方法。
b)在一个示例中,可以在VPS/SPS/PPS/条带标头/片组标头中用信令通知MV压缩方法。
c)在一个示例中,可以在不同的标准配置文件/级别/层中差异化地设置MV压缩方法。
5.ATMVP中的有效对应区域可以是自适应的;
a)例如,有效对应区域可能取决于当前块的宽度和高度;
b)例如,有效对应区域可以取决于MV压缩方法;
i.在一个示例中,如果不使用MV压缩方法,则有效对应区域较小。
如果使用MV压缩方法,则有效对应区域较大。
6.ATMVP中的有效对应区域可以基于小于CTU区域的尺寸为M×N的基本区域。例如,VTM-3.0中的CTU尺寸为128×128,而基本区域尺寸可以为64×64。假设当前块的宽度和高度为W和H。
a)在一个示例中,如果W<=M并且H<=N,意味着当前块在基本区域内,则ATMVP中的有效对应区域是并置基本区域和并置图片中的扩展。图27示出了示例。
i.例如,假设并置基本区域的左上角位置是(xBR,yBR),则(xN,yN)处的对应位置将被裁剪到有效区域xBR<=xN<xBR+M+4;yBR<=yN<yBR+N。
图27示出了当当前块在基本区域(BR)内时所提出的有效区域的示例实施例。
图28示出了当当前块不在基本区域内时有效区域的示例实施例。
b)在一个示例中,如果W>M且H>N,这意味着当前块不在基本区域内,则将当前块分为几部分。每个部分在ATMVP中都有单独的有效对应区域。对于当前块中的位置A,其在并置块中的对应位置B应该在位置A所在部分的有效对应区域内。
i.例如,将当前块被分为不重叠的基本区域。一个基本区域的有效对应区域是其并置基本区域和并置图片中的扩展。图28示出了示例。
1.例如,假设当前块中的位置A在一个基本区域R中。将在并置图片中R的并置基本区域表示为CR。并置块中A的对应位置是位置B。CR的左上角位置是(xCR,yCR),则(xN,yN)处的位置B将被裁剪到有效区域xCR<=xN<xCR+M+4;yCR<=yN<yCR+N。
7.提出将ATMVP中用于在不同图片中定位对应块的运动矢量(例如,2.3.5.1.2中的TMV)推导为:
a)在一个示例中,始终将TMV设置为等于默认MV,诸如(0,0)。
i.在一个示例中,默认MV在VPS/SPS/PPS/条带标头/片组标头/CTU/CU中用信令通知。
b)在一个示例中,通过以下方法将TMV设置为存储在HMVP表中的一个MV;
i.如果HMVP列表为空,则将TMV设置为等于默认MV,诸如(0,0)
ii.否则(HMVP列表不为空),
1.可以将TMV设置为等于HMVP表中存储的第一个元素;
2.可替代地,可以将TMV设置为等于HMVP表中存储的最后一个元素;
3.可替代地,可以仅将TMV设置为等于存储在HMVP表中的特定MV。
a.在一个示例中,特定MV引用参考列表0。
b.在一个示例中,特定MV引用参考列表1。
c.在一个示例中,特定MV引用参考列表0中的特定参考图片,诸如索引为0的参考图片。
d.在一个示例中,特定MV引用参考列表1中的特定参考图片,诸如索引为0的参考图片。
e.在一个示例中,特定MV引用并置图片。
4.可替代地,如果找不到存储在HMVP表中的特定MV(例如,条目3中提到的),则可以将TMV设置为等于默认MV;
a.在一个示例中,仅搜索存储在HMVP表中的第一个元素以找到特定MV。
b.在一个示例中,仅搜索存储在HMVP表中的最后一个元素以找到特定MV。
c.在一个示例中,搜索存储在HMVP表中的一些或全部元素以找到特定MV。
5.可替代地,此外,从HMVP获得的TMV不能引用当前图片本身。
6.可替代地,如果从HMVP表获得的TMV不引用并置图片,则可以将从HMVP表获得的TMV其缩放到并置图片。
c)在一个示例中,将TMV设置为一个特定临近块的一个MV。不涉及其他临近块。
i.特定临近块可以是图22中的块A0、A1、B0、B1、B2。
ii.如果满足以下条件,则可以将TMV设置为等于默认MV
1.特定临近块不存在;
2.特定临近块不是帧间编码的;
iii.只能将TMV设置为等于存储在特定临近块中的特定MV。
1.在一个示例中,特定MV引用参考列表0。
2.在一个示例中,特定MV引用参考列表1。
3.在一个示例中,特定MV引用参考列表0中的特定参考图片,诸如索引为0的参考图片。
4.在一个示例中,特定MV引用参考列表1中的特定参考图片,诸如索引为0的参考图片。
5.在一个示例中,特定MV引用并置图片。
6.如果不能找到存储在特定临近块中的特定MV,则可以将TMV设置为等于默认MV;
iv.如果从特定临近块获得的TMV不引用并置图片,则可以将从特定临近块获得的TMV缩放到并置图片。
v.从特定临近块获得的TMV不能引用当前图片本身。
8.如2.3.5.1.2中公开的ATMVP中使用的MVdefault0和MVdefault1可推导为
a)在一个示例中,将MVdefault0和MVdefault1设置为等于(0,0);
b)在一个示例中,从HMVP推导MVdefaultX(X=0或1),
i.如果HMVP列表为空,则将MVdefaultX设置为等于预定义的默认MV,诸如(0,0)。
1.预定义的默认MV在VPS/SPS/PPS/条带标头/片组标头/CTU/CU中用信令通知。
ii.否则(HMVP列表不为空),
1.可以将MVdefaultX设置为等于HMVP表中存储的第一个元素。
2.可以将MVdefaultX设置为等于HMVP表中存储的最后一个元素。
3.可以仅将MVdefaultX设置为等于存储在HMVP表中的特定MV。
a.在一个示例中,特定MV引用参考列表X。
b.在一个示例中,特定MV引用参考列表X中的特定参考图片,诸如索引为0的参考图片。
4.如果不能找到存储在HMVP表中的特定MV,则可以将MVdefaultX设置为等于预定义的默认MV;
a.在一个示例中,仅搜索存储在HMVP表中的第一个元素。
b.在一个示例中,仅搜索存储在HMVP表中的最后一个元素。
c.在一个示例中,搜索存储在HMVP表中的一些或全部元素。
5.如果从HMVP表获得的MVdefaultX不引用并置图片,则可以将从HMVP表获得的MVdefaultX缩放为并置图片。
6.从HMVP获得的MVdefaultX不能引用当前图片本身。
c)在一个示例中,从临近块推导MVdefaultX(X=0或1)。
i.临近块可以包括图22中的块A0、A1、B0、B1、B2。
1.例如,这些块中只有一个用于推导MVdefaultX。
2.可替代地,这些块中的一些或全部用于推导MVdefaultX。
a.依次检查这些块,直到找到有效的MVdefaultX。
3.如果从所选的一个或多个临近块中找不到有效的MVdefaultX,则将其设置为等于预定义的默认MV,诸如(0,0)。
a.预定义的默认MV在VPS/SPS/PPS/条带标头/片组标头/CTU/CU中用信令通知。
ii.在以下条件下,无法从特定临近块中找到有效的MVdefaultX
1.特定临近块不存在;
2.特定临近块不是帧间编码的;
iii.可以仅将MVdefaultX设置为等于存储在特定临近块中的特定MV;
1.在一个示例中,特定MV引用参考列表X。
2.在一个示例中,特定MV引用参考列表X中的特定参考图片,诸如索引为0的参考图片。
iv.可以将从特定临近块获得的MVdefaultX缩放为特定参考图片,诸如参考列表X中索引为0的参考图片。
v.从特定临近块获得的MVdefaultX不能引用当前图片本身。
9.对于子块或非子块ATMVP候选,如果并置图片中子块/整个块的时域块用CPR模式进行编码,则可替代地可以利用默认运动候选。
a)在一个示例中,默认运动候选可以被定义为与当前块的中心位置相关联的运动候选(例如,如在2.3.5.1.2中公开的在ATMVP中使用的MVdefault0和/或MVdefault1)。
b)在一个示例中,如果可用,则默认运动候选可以被定义为(0,0)运动矢量,并且两个参考图片列表参考图片索引都等于0。
10.提出可以基于在子块运动信息推导过程中使用的位置的定位来推导用于ATMVP过程的默认运动信息(例如,如2.3.5.1.2中所公开的用于ATMVP的MVdefault0和MVdefault1)。通过该提出的方法,对于该子块,由于直接分配默认运动信息,因此无需进一步推导运动信息。
a)在一个示例中,不是使用当前块的中心位置,而是利用当前块内的子块(例如,中心子块)的中心位置。
b)现有的和提出的实施方式的示例分别在图29A和29B中示出。
11.提出ATMVP候选对于以下方法始终可用:
a)假设当前块的中心点是(x0,y0),则在并置图片中将(x0,y0)的对应位置定位为M=(x0+MV’x,y0+MV’y)。找到覆盖M的块Z。如果Z是帧内编码的,则MVdefault0、MVdefault1通过第6条中提出的某些方法推导。
b)可替代地,不定位块Z以获取运动信息,直接应用第8条中提出的某些方法以获取MVdefault0和MVdefault1。
c)可替代地,ATMVP过程中使用的默认运动候选始终可用。如果基于当前设计(例如,时域块是帧内编码的)将其设置为不可用,则可以利用其他运动矢量而不是默认运动候选。
i.在一个示例中,可以应用通过引用并入本文的国际申请PCT/CN2018/124639中的解决方案。
d)可替代地,此外,ATMVP候选是否始终可用取决于其他高级语法信息。
i.在一个示例中,仅当将条带/片/图片标头或其他视频单元处的ATMVP启用标记设置为真时,才可以将ATMVP候选始终设置为可用。
ii.在一个示例中,仅当将条带标头/图片标头或其他视频单元中的ATMVP启用标志设置为真并且当前图片不是IRAP图片并且当前图片未插入参考索引等于0的RefPicList0中时,以上方法才适用。
e)将固定索引或固定索引组分配给ATMVP候选。当ATMVP候选始终不可用时,可以将固定索引/组索引推断为其他类型的运动候选(诸如仿射候选)。
12.提出是否将零运动仿射Merge候选放入子块Merge候选列表中应取决于是否启用仿射预测。
a)例如,如果仿射使用标志为关(sps_affine_enabled_flag等于0),则不将零运动仿射Merge候选放入子块Merge候选列表中。
b)可替代地,此外,添加非仿射候选的默认运动矢量候选。
13.提出可以将非仿射填充候选放入子块Merge候选列表中。
a)如果子块Merge候选列表未满,则可以添加零运动非仿射填充候选。
b)当选择这样的填充候选时,应当将当前块的affine_flag设置为0。
c)可替代地,如果子块Merge候选列表未满并且仿射使用标志为关,则将零运动非仿射填充候选放入子块Merge候选列表中。
14.假设MV0和MV1表示覆盖对应位置的块的参考列表0和参考列表1中的MV(例如,MV0和MV1可以是2.3.5.1.2节中描述的MVZ_0和MVZ_1或MVZS_0和MVZS_1)。MV0’和MV1’表示要为当前块或子块推导的参考列表0和参考列表1中的MV。则应通过缩放以下内容来推导MV0’和MV1’。
a)MV0,如果并置图片在参考列表1中;
b)MV1,如果并置图片在参考列表0中。
15.当将当前图片视为参考图片列表X(PicRefListX,例如X=0)中索引被设置为M(例如0)的参考图片时,ATMVP和/或TMVP启用/禁用标志对于条带/片或其他类型的视频单元可以被推断为假。这里,对于ATMVP/TMVP过程期间的PicRefListX,M可以等于时域块的运动信息应当缩放到的目标参考图片索引。
a)可替代地,此外,上述方法仅在当前图片是帧内随机接入点(IRAP)图片时适用。
b)在一个示例中,当将当前图片视为PicRefListX中索引被设置为M(例如0)的参考图片和/或将当前图片视为PicRefListY中索引被设置为N(例如0)的参考图片时,ATMVP和/或TMVP启用/禁用标志可以被推断为假。变量M和N表示在TMVP或ATMVP过程中使用的目标参考图片索引。
c)对于ATMVP过程,限制确认比特流应遵循以下规则:从中推导当前块的运动信息的并置图片不应是当前图片。
d)可替代地,当上述条件为真时,不调用ATMVP或TMVP过程。
16.提出如果当前块的参考图片列表X(PicRefListX,例如X=0)中索引被设置为M(例如0)的参考图片是当前图片,则仍可对该块启用ATMVP。
a)在一个示例中,所有子块的运动信息都指向当前图片。
b)在一个示例中,当从时域块获得子块的运动信息时,应通过至少一个指向时域块的当前图片的参考图片来对时域块进行编码。
c)在一个示例中,当从时域块获得子块的运动信息时,不应用缩放操作。
17.不管是否使用ATMVP,都对齐子块Merge索引的编解码方法。
a)在一个示例中,对于前L个二进制位,将它们进行上下文编码。对于其余的二进制位,它们将被旁路编码。在一示例中,L被设置为1。
b)可替代地,对于所有二进制位,将它们进行上下文编码。
18.可以将用于ATMVP中以定位不同图片(例如0中的TMV)中的对应块的MV(MVx,MVy)以与MV缩放过程中相同的取整方法右移至整数精度(表示为(MVx’,MVy’))。
a)可替代地,可以将用于ATMVP中以定位不同图片(例如0中的TMV)中的对应块的MV以与MV平均过程中相同的取整方法右移至整数精度。
b)可替代地,可以将用于ATMVP中以定位不同图片(例如0中的TMV)中的对应块的MV以与自适应MV分辨率(AMVR)过程中相同的取整方法右移至整数精度。
19.可以将用于ATMVP中以定位不同图片(例如0中的TMV)中的对应块的MV(MVx,MVy)通过向零取整右移至整数精度(表示为(MVx’,MVy’))。
a)例如,MVx’=(MVx+((1<<N)>>1)-(MVx>=0?1:0))>>N;N是表示MV分辨率的整数,例如N=4。
i.例如,MVx’=(MVx+(MVx>=0?7:8))>>4。
b)例如,MVy’=(MVy+((1<<N)>>1)-(MVy>=0?1:0))>>N;N是表示MV分辨率的整数,例如N=4。
i.例如,MVy’=(MVy+(MVy>=0?7:8))>>4。
20.在一个示例中,条目18和条目19中的MV(MVx,MVy)用于定位对应块,以推导在ATMVP中使用的默认运动信息,诸如使用子块的中心位置和移位的MV,或使用当前块的左上角位置和移位的MV。
a)在一个示例中,MV(MVx,MVy)用于定位对应块,以在ATMVP过程期间推导当前块中子块的运动信息,诸如使用子块的中心位置和移位的MV。
21.在条目18、19、20中提出的方法还可以应用于需要通过运动矢量来定位不同图片或当前图片中的参考块的其他编解码工具。
22.在ATMVP中用来在不同图片中定位对应块(例如,0中的TMV)的MV(MVx,MVy)可以被缩放,即使它指向并置图片。
a)在一个示例中,如果并置图片(或其中的一致性窗口)的宽度和/或高度与当前图片(或其中的一致性窗口)的宽度和/或高度不同,则可以缩放MV。
b)假设并置图片的(一致性窗口的)宽度和高度分别表示为W1和H1。当前图片(的一致性窗口的)宽度和高度分别表示为W2和H2。则可以将MV(MVx,MVy)缩放为MVx’=MVx*W1/W2,以及MVy’=MVy*H1/H2。
23.在ATMVP过程中用于推导运动信息的当前块的中心点(诸如2.3.5.1.2中的位置(x0,y0))可以通过缩放和/或添加偏移来进一步修改。
a)在一个示例中,如果并置图片(或其中的一致性窗口)的宽度和/或高度与当前图片(或其中的一致性窗口)的宽度和/或高度不同,则可以进一步修改中心点。
b)假设在并置图片中一致性窗口的左上位置表示为X1和Y1。当前图片中定义的一致性窗口的左上位置表示为X2和Y2。并置图片的(一致性窗口的)宽度和高度分别表示为W1和H1。当前图片的(一致性窗口的)宽度和高度分别表示为W2和H2。则可以将(x0,y0)修改为x0’=(x0-X2)*W1/W2+X1以及y0’=(y0-Y2)*H1/H2+Y1。
i.可替代地,x0’=x0*W1/W2,y0’=y0*H1/H2。
24.在ATMVP过程中用于推导运动信息的对应位置(例如2.3.5.1.2中的位置M)可以通过缩放和/或添加偏移来进一步修改。
a)在一个示例中,如果并置图片(或其中的一致性窗口)的宽度和/或高度与当前图片(或其中的一致性窗口)的宽度和/或高度不同,则可以进一步修改对应位置。
b)假设在并置图片中一致性窗口的左上位置表示为X1和Y1。当前图片中定义的一致性窗口的左上位置表示为X2和Y2。并置图片的(一致性窗口的)宽度和高度分别表示为W1和H1。当前图片的(一致性窗口的)宽度和高度分别表示为W2和H2。则可以将M(x,y)修改为x’=(x-X2)*W1/W2+X1以及y’=(y-Y2)*H1/H2+Y1。
i.可替代地,x’=x*W1/W2,y’=y*H1/H2.
子图片相关
25.在一个示例中,如果位置(i,j)和(i,j-1)属于不同的子图片,则可以将在(j-1)列处结束的子图片S的宽度设置为等于j减去子图片S的最左侧列。
a)基于现有实施方式的实施例突出显示如下。
Figure BDA0003072137370000531
26.在一个示例中,可以将在(NumSubPicGridRows-1)行处结束的子图片S的高度设置为等于(NumSubPicGridRows-1)减去子图片S的最顶部行然后加1。
a)基于现有实施方式的实施例突出显示如下。
Figure BDA0003072137370000532
Figure BDA0003072137370000541
27.在一个示例中,可以将在(NumSubPicGridColumns-1)列处结束的子图片S的宽度设置为等于(NumSubPicGridColumns-1)减去子图片S的最左侧列再加1。
a)基于现有实施方式的实施例突出显示如下。
Figure BDA0003072137370000542
Figure BDA0003072137370000551
28.子图片网格必须是CTU尺寸的整数倍。
a)基于现有实施方式的实施例突出显示如下。
subpic_grid_col_width_minus1加1以CtbSizeY为单位单位指定子图片标识符网格的每个元素的宽度。语法元素的长度为Ceil(Log2(pic_width_max_in_luma_samples/CtbSizeY))比特。
变量NumSubPicGridCols的推导如下:
NumSubPicGridCols=(pic_width_max_in_luma_samples+subpic_grid_col_width_minus1*CtbSizeY+CtbSizeY-1)/(subpic_grid_col_width_minus1*CtbSizeY+CtbSizeY)(7-5)
subpic_grid_row_height_minus1加1以4个样点为单位单位指定子图片标识符网格中每个元素的高度。语法元素的长度为Ceil(Log2(pic_height_max_in_luma_samples/CtbSizeY))比特。
变量NumSubPicGridRows的推导如下:
NumSubPicGridRows=(pic_height_max_in_luma_samples+subpic_grid_row_height_minus1*CtbSizeY+CtbSizeY-1)/(subpic_grid_row_height_minus1*CtbSizeY+CtbSizeY)(7-6)
29.添加了一致性约束,以确保子图片不能彼此重叠,并且所有子图片必须覆盖整个图片。
a)基于现有实施方式的实施例突出显示如下
如果以下条件同时满足,则任何subpic_grid_idx[i][j]必须等于idx:
i>=SubPicTop[idx]and i<SubPicTop[idx]+SubPicHeight[idx].
j>=SubPicLeft[idx]and j<SubPicLeft[idx]+SubPicWidth[idx].
如果以下条件不同时满足,则任何subpic_grid_idx[i][j]必须不同于idx:
i>=SubPicTop[idx]and i<SubPicTop[idx]+SubPicHeight[idx].
j>=SubPicLeft[idx]and j<SubPicLeft[idx]+SubPicWidth[idx].
RPR相关
30.用信令通知表示为RPR_flag的语法元素(例如标志)以指示是否可以在视频单元(例如,序列)中使用RPR。RPR_flag可以在SPS、VPS或DPS中用信令通知。
a)在一个示例中,如果用信令通知不使用RPR(例如RPR_flag为0),则在PPS中用信令通知的所有宽度/高度必须与在SPS中用信令通知的最大宽度/最大高度相同。
b)在一个示例中,如果用信令通知不使用RPR(例如RPR_flag为0),则不用信令通知PPS中的所有宽度/高度,并将PPS中的所有宽度/高度推断为在SPS中用信令通知的最大宽度/最大高度。
c)在一个示例中,如果用信令通知不使用RPR(例如RPR_flag为0),则在解码过程中不使用一致性窗口信息。否则(用信令通知要使用RPR),可以在解码过程中使用一致性窗口信息。
31.提出可以取决于参考图片的分辨率是否不同于当前图片,或者参考图片的宽度和/或高度是否大于当前图片的宽度和/或高度,来选择在运动补偿过程中用来推导当前块的预测块的插值滤波器。
a.在一个示例中,当满足条件A时,可以应用具有较少抽头的插值滤波器,其中条件A取决于当前图片和/或参考图片的维度。
i.在一个示例中,条件A是参考图片的分辨率不同于当前图片。
ii.在一个示例中,条件A是参考图片的宽度和/或高度大于当前图片的宽度和/或高度。
iii.在一个示例中,条件A是W1>a*W2和/或H1>b*H2,其中(W1,H1)表示参考图片的宽度和高度,并且(W2,H2)表示当前图片的宽度和高度,a和b是两个因子,例如a=b=1.5。
iv.在一个示例中,条件A还可以取决于是否使用双向预测。
1)仅当对当前块使用双向预测时,满足条件A。
v.在一个示例中,条件A可取决于M和N,其中M和N表示当前块的宽度和高度。
1)例如,仅当M*N<=T时满足条件A,其中T是诸如64的整数。
2)例如,仅当M<=T1或N<=T2时满足条件A,其中T1和T2是整数,例如T1=T2=4。
3)例如,仅当M<=T1且N<=T2时满足条件A,其中T1和T2是整数,例如T1=T2=4。
4)例如,仅当M*N<=T或M<=T1或N<=T2时满足条件A,其中T、T1和T2是整数,例如T=64,T1=T2=4。
5)在一个示例中,以上子项目中的较小条件可以用较大条件代替。
vi.在一个示例中,应用了1抽头滤波器。换句话说,输出未经滤波的整数像素作为插值结果。
vii.在一个示例中,当参考图片的分辨率不同于当前图片时,应用双线性滤波器。
viii.在一个示例中,当参考图片的分辨率不同于当前图片或者参考图片的宽度和/或高度大于当前图片的宽度和/或高度时,应用4抽头滤波器或6抽头滤波器。
1)6抽头滤波器还可以用于仿射运动补偿。
2)4抽头滤波器还可用于色度样点的插值。
b.是否应用和/或如何应用条目31中公开的方法可以取决于颜色分量。
i.例如,方法仅应用于亮度分量。
c.是否应用和/或如何应用条目31中公开的方法可以取决于插值滤波方向。
i.例如,方法仅应用于水平滤波。
ii.例如,方法仅应用于垂直滤波。
CIIP相关
32.在CIIP过程中使用的帧内预测信号可以在TU级别而不是CU级别完成(例如,使用TU而不是CU外部的参考样点)。
a)在一个示例中,如果CU宽度或高度大于最大变换块尺寸,则可以将CU划分为多个TU,并且可以例如使用TU外部的参考样点为每个TU生成帧内/帧间预测。
b)在一个示例中,如果最大变换尺寸K小于64(诸如K=32),则CIIP中使用的帧内预测将像在常规帧内编码块中一样以递归方式执行。
c)例如,将KM×KN的CIIP编码块划分为MN个K×K块,其中M和N为整数,对每个K×K块进行帧内预测。随后编码/解码的K×K块的帧内预测可以取决于先前编码/解码的K×K块的重构样点。
5.附加示例实施例
5.1实施例#1:SPS/PPS/条带标头/片组标头中的语法设计示例
与VTM3.0.1rc1参考软件相比的更改以大号粗体字体突出显示,如下所示:
Figure BDA0003072137370000581
5.2实施例#2:SPS/PPS/条带标头/片组标头中的语法设计示例
7.3.2.1序列参数集RBSP语法
Figure BDA0003072137370000582
Figure BDA0003072137370000591
sps_sbtmvp_enabled_flag等于1指定基于子块的时域运动矢量预测器可在CVS中用于解码slice_type不等于I的所有条带的图片。sps_sbtmvp_enabled_flag等于0指定在CVS中不使用基于子块的时域运动矢量预测器。当不存在sps_sbtmvp_enabled_flag时,其推断为等于0。
five_minus_max_num_subblock_merge_cand指定从5中减去条带中支持的基于子块的Merge运动矢量预测(MVP)候选的最大数量。当不存在five_minus_max_num_subblock_merge_cand时,推断其等于5-sps_sbtmvp_enabled_flag。基于子块的Merge MVP候选的最大数量MaxNumSubblockMergeCand的推导如下:
MaxNumSubblockMergeCand=5-five_minus_max_num_subblock_merge_cand (7-45)
MaxNumSubblockMergeCand的值应在0到5的范围内(包括0和5)。
8.3.4.2子块Merge模式中运动矢量和参考索引的推导过程
该过程的输入是:
..[不改变当前的VVC规范草案]。
该过程的输出是:
...[不改变当前的VVC规范草案]。
变量numSbX、numSbY和子块Merge候选列表subblockMergeCandList通过以下有序步骤推导:
当sps_sbtmvp_enabled_flag等于1并且(当前图片是IRAP并且参考图片列表0的索引0是当前图片)不为真时,应用以下步骤:
用亮度编码块位置(xCb,yCb)、亮度编码块宽度cbWidth、亮度编码块高度cbHeight和亮度编码块宽度作为输入,调用来自如第8.3.2.3条中指定的临近编码单元的Merge候选的推导过程,并且输出是可用性标志availableFlagA0、availableFlagA1、availableFlagB0、availableFlagB1和availableFlagB2,参考索引refIdxLXA0、refIdxLXA1、refIdxLXB0、refIdxLXB1和refIdxLXB2,预测列表利用标志predFlagLXA0、predFlagLXA1、predFlagLXB0、predFlagLXB1和predFlagLXB2,以及运动矢量mvLXA0、mvLXA1、mvLXB0、mvLXB1和mvLXB2,其中X为0或1。
用亮度位置(xCb,yCb)、亮度编码块宽度cbWidth、亮度编码块高度cbHeight,可用性标志availableFlagA0、availableFlagA1、availableFlagB0、availableFlagB1,参考索引refIdxLXA0、refIdxLXA1、refIdxLXB0、refIdxLXB1,预测列表利用标志predFlagLXA0、predFlagLXA1、predFlagLXB0、predFlagLXB1,以及运动矢量mvLXA0、mvLXA1、mvLXB0、mvLXB1作为输入,调用如第8.3.4.3条中指定的基于子块的时域Mergee候选的推导过程,并且输出为可用性标志availableFlagSbCol、水平方向和垂直方向上的亮度编码子块的数量numSbX和numSbY、参考索引refIdxLXSbCol、亮度运动矢量mvLXSbCol[xSbIdx][ySbIdx]和预测列表利用标志predFlagLXSbCol[xSbIdx][ySbIdx],其中xSbIdx=0..numSbX–1,ySbIdx=0..numSbY-1并且X为0或1。
当sps_affine_enabled_flag等于1时,样点位置(xNbA0,yNbA0)、(xNbA1,yNbA1)、(xNbA2,yNbA2)、(xNbB0,yNbB0)、(xNbB1,yNbB1)、(xNbB2,yNbB2)、(xNbB3,yNbB3),以及变量numSbX和numSbY的推导如下:
[不改变当前的VVC规范草案]。
5.3实施例#3MV取整的示例
语法更改基于现有实施方式。
8.5.5.3基于子块的时域Mergee候选的推导过程
–ColPic内部并置子块的位置(xColSb,yColSb)推导如下。
1.应用以下步骤:
yColSb=Clip3(yCtb,Min(CurPicHeightInSamplesY-1,yCtb+(1<<CtbLog2SizeY)-1),ySb+((tempMv[1]+8–(tempMv[1]>=0))>>4))
–如果subpic_treated_as_pic_flag[SubPicIdx]等于1,应用以下步骤:
xColSb=Clip3(xCtb,Min(SubPicRightBoundaryPos,xCtb+(1<<CtbLog2SizeY)+3),xSb+((tempMv[0]+8+(tempMV[0]>=0))>>4))
–否则(subpic_treated_as_pic_flag[SubPicIdx]等于0),应用以下步骤:
xColSb=Clip3(xCtb,Min(CurPicWidthInSamplesY-1,xCtb+(1<<CtbLog2SizeY)+3),xSb+(tempMv[0]+8+(tempMV[0]>=0))>>4))
8.5.5.4基于子块的时域Merge基础运动数据的推导过程
ColPic内部并置块的位置(xColCb,yColCb)推导如下。
应用以下步骤:
yColCb=Clip3(yCtb,Min(CurPicHeightInSamplesY-1,yCtb+(1<<CtbLog2SizeY)-1),yColCtrCb+((tempMv[1]+8–(tempMv[1]>=0))>>4))
–如果subpic_treated_as_pic_flag[SubPicIdx]等于1,则应用以下步骤:
xColCb=Clip3(xCtb,Min(SubPicRightBoundaryPos,xCtb+(1<<CtbLog2SizeY)+3),xColCtrCb+((tempMv[0]+8+(tempMV[0]>=0))>>4))
–否则(subpic_treated_as_pic_flag[SubPicIdx]等于0)应用以下步骤:
xColCb=Clip3(xCtb,Min(CurPicWidthInSamplesY-1,xCtb+(1<<CtbLog2SizeY)+3),xColCtrCb+((tempMv[0]+8+(tempMV[0]>=0))>>4))
5.3实施例#3:MV取整的示例
语法变化基于现有实施方式。
8.5.5.3基于子块的时域Merge候选的推导过程
–ColPic内部并置子块的位置(xColSb,yColSb)推导如下。
1.应用以下步骤:
-yColSb=Clip3(yCtb,Min(CurPicHeightInSamplesY-1,yCtb+(1<<CtbLog2SizeY)-1),ySb+((tempMv[1]+8–(tempMv[1]>=0))>>4))
–如果subpic_treated_as_pic_flag[SubPicIdx]等于1,则应用以下步骤:
-xColSb=Clip3(xCtb,Min(SubPicRightBoundaryPos,xCtb+(1<<CtbLog2SizeY)+3),xSb+((tempMv[0]+8+(tempMV[0]>=0))>>4))
–否则(subpic_treated_as_pic_flag[SubPicIdx]等于0),应用以下步骤:
-xColSb=Clip3(xCtb,Min(CurPicWidthInSamplesY-1,xCtb+(1<<CtbLog2SizeY)+3),xSb+(tempMv[0]+8+(tempMV[0]>=0))>>4))
8.5.5.4基于子块的时域Merge基础运动数据的推导过程
ColPic内部并置块的位置(xColCb,yColCb)推导如下。
–应用以下步骤:
-yColCb=Clip3(yCtb,Min(CurPicHeightInSamplesY-1,yCtb+(1<<CtbLog2SizeY)-1),yColCtrCb+((tempMv[1]+8–(tempMv[1]>=0))>>4))
–如果subpic_treated_as_pic_flag[SubPicIdx]等于1,应用以下步骤:
-xColCb=Clip3(xCtb,Min(SubPicRightBoundaryPos,xCtb+(1<<CtbLog2SizeY)+3),xColCtrCb+((tempMv[0]+8+(tempMV[0]>=0))>>4))
–否则(subpic_treated_as_pic_flag[SubPicIdx]等于0),应用以下步骤:
-xColCb=Clip3(xCtb,Min(CurPicWidthInSamplesY-1,xCtb+(1<<CtbLog2SizeY)+3),xColCtrCb+((tempMv[0]+8+(tempMV[0]>=0))>>4))
5.4实施例#4:MV取整的第二示例
8.5.5.3基于子块的时域Merge候选的推导过程
该过程的输入为:
–当前亮度编码块的左上样点相对于当前图片的左上亮度样点的亮度位置(xCb,yCb),
–变量cbWidth,指定亮度样点中当前编码块的宽度,
–变量cbHeight,指定亮度样点中当前编码块的高度。
–临近编码单元的可用性标志availableFlagA1
–临近编码单元的参考索引refIdxLXA1,其中X为0或1
–临近编码单元的预测列表利用标志predFlagLXA1,其中X为0或1
–临近编码单元的1/16分数样点精度的运动矢量mvLXA1,其中X为0或1。
该过程的输出为:
–可用性标志availableFlagSbCol,
–水平方向和垂直方向上的亮度编码子块的数量numSbX和numSbY,
–参考索引refIdxL0SbCol和refIdxL1SbCol,
–1/16分数样点精度的亮度运动矢量mvL0SbCol[xSbIdx][ySbIdx]和mvL1SbCol[xSbIdx][ySbIdx],其中xSbIdx=0..numSbX-1,ySbIdx=0..numSbY-1,
–预测列表利用标志predFlagL0SbCol[xSbIdx][ySbIdx]和predFlagL1SbCol[xSbIdx][ySbIdx],xSbIdx=0..numSbX-1,其中ySbIdx=0..numSbY-1。
可用性标志availableFlagSbCol推导如下。
–如果以下条件中的一个或多个为真,则将availableFlagSbCol设置为等于0。
––slice_temporal_mvp_enabled_flag等于0。
––sps_sbtmvp_enabled_flag等于0。
––cbWidth小于8。
––cbHeight小于8。
–否则,应用以下有序步骤:
1.包含当前编码块的亮度编码树块的左上样点的位置(xCtb,yCtb)与当前亮度编码块的右下中心样点的位置(xCtr,yCtr)推导如下:
-xCtb=(xCb>>CtuLog2Size)<<CtuLog2Size (8-542)
-yCtb=(yCb>>CtuLog2Size)<<CtuLog2Size (8-543)
-xCtr=xCb+(cbWidth/2) (8-544)
-yCtr=yCb+(cbHeight/2) (8-545)
2.将亮度位置(xColCtrCb,yColCtrCb)设置为等于在ColPic内覆盖由(xCtr,yCtr)给出的相对于由ColPic指定的并置图片的左上亮度样点的位置的并置亮度编码块的左上样点。
3.用位置(xCtb,yCtb)、位置(xColCtrCb,yColCtrCb)、可用性标志availableFlagA1、预测列表利用标志predFlagLXA1、参考索引refIdxLXA1以及运动矢量mvLXA1作为输入(其中X为0和1),调用如第8.5.5.4条中指定的基于子块的示域Merge基础运动数据的推导过程,且运动矢量ctrMvLX、并置块的预测列表利用标志ctrPredFlagLX以及时域运动矢量tempMv作为输出,其中X为0和1。
4.变量availableFlagSbCol推导如下:
–如果ctrPredFlagL0和ctrPredFlagL1都等于0,则将availableFlagSbCol设置为等于0。
–否则,将availableFlagSbCol设置为等于1。
当availableFlagSbCol等于1时,应用以下步骤:
–变量numSbX、numSbY、sbWidth、sbHeight和refIdxLXSbCol推导如下:
-numSbX=cbWidth>>3(8-546)
-numSbY=cbHeight>>3(8-547)
-sbWidth=cbWidth/numSbX(8-548)
-sbHeight=cbHeight/numSbY(8-549)
-refIdxLXSbCol=0(8-550)
–对于xSbIdx=0..numSbX-1和ySbIdx=0..numSbY–1,运动矢量mvLXSbCol[xSbIdx][ySbIdx]和预测列表利用标志predFlagLXSbCol[xSbIdx][ySbIdx]推导如下:
–指定当前编码子块的左上样点相对于当前图片的左上亮度样点的亮度位置(xSb,ySb)推导如下:
-xSb=xCb+xSbIdx*sbWidth+sbWidth/2(8-551)
-ySb=yCb+ySbIdx*sbHeight+sbHeight/2(8-552)
–ColPic中并置子块的位置(xColSb,yColSb)推导如下。
1.应用以下步骤:
-yColSb=Clip3(yCtb,Min(CurPicHeightInSamplesY-1,yCtb+(1<<CtbLog2SizeY)-1),ySb+((tempMv[1]+8–(tempMv[1]>=0?1:0))>>4)) (8-553)
–如果subpic_treated_as_pic_flag[SubPicIdx]等于1,则应用以下步骤:
-xColSb=Clip3(xCtb,Min(SubPicRightBoundaryPos,xCtb+(1<<CtbLog2SizeY)+3),xSb+((tempMv[0]+8–(tempMv[0]>=0?1:0))>>4)) (8-554)
–否则(subpic_treated_as_pic_flag[SubPicIdx]等于0),应用以下步骤:
-xColSb=Clip3(xCtb,Min(CurPicWidthInSamplesY-1,xCtb+(1<<CtbLog2SizeY)+3),xSb+((tempMv[0]+8–(tempMv[0]>=0?1:0))>>4)) (8-555)
–变量currCb指定当前图片内覆盖当前编码子块的亮度编码块。
–变量colCb指定ColPic内覆盖由((xColSb>>3)<<3,(yColSb>>3)<<3)给出的修改位置的亮度编码块。
–将亮度位置(xColCb,yColCb)设置为等于由colCb指定的并置亮度编码块相对于由ColPic指定的并置图片的左上亮度样点的左上样点。
–用currCb、colCb、(xColCb,yColCb)、设置为等于0的refIdxL0以及设置为等于1的sbFlag作为输入,调用如8.5.2.12条中指定的并置运动矢量的推导过程,并且将输出赋值给子块的运动矢量mvL0SbCol[xSbIdx][ySbIdx]和availableFlagL0SbCol。
–用currCb、colCb、(xColCb,yColCb)、设置为等于0的refIdxL1以及设置为等于1的sbFlag作为输入,调用如8.5.2.12条中指定的并置运动矢量的推导过程,并且将输出赋值给子块的运动矢量mvL1SbCol[xSbIdx][ySbIdx]和availableFlagL1SbCol。
–当availableFlagL0SbCol和availableFlagL1SbCol都等于0时,对于X为0和1应用以下步骤:
-mvLXSbCol[xSbIdx][ySbIdx]=ctrMvLX (8-556)
-predFlagLXSbCol[xSbIdx][ySbIdx]=ctrPredFlagLX (8-557)
8.5.5.4基于子块的时域Merge基础运动数据的推导过程该过程的输入为:
–包含当前编码块的亮度编码树块的左上样点的位置(xCtb,yCtb),
–覆盖右下中心样点的并置亮度编码块的左上样点的位置(xColCtrCb,yColCtrCb)。
–临近编码单元的可用性标志availableFlagA1
–临近编码单元的参考索引refIdxLXA1
–临近编码单元的预测列表利用标志predFlagLXA1
–临近编码单元的1/16分数样点精度的运动矢量mvLXA1
该过程的输出为:
–运动矢量ctrMvL0和ctrMvL1,
–预测利用标志ctrPredFlagL0和ctrPredFlagL1,
–时域运动矢量tempMv。
将变量tempMv设置如下:
-tempMv[0]=0 (8-558)
-tempMv[1]=0 (8-559)变量currPic指定当前图片。
当availableFlagA1等于TRUE时,应用以下步骤:
–如果以下所有条件为真,则将tempMv设置为等于mvL0A1
–predFlagL0A1等于1,
–DiffPicOrderCnt(ColPic,RefPicList[0][refIdxL0A1])等于0,
–否则,如果以下所有条件为真,则将tempMv设置为等于mvL1A1
–slice_type等于B,
–predFlagL1A1等于1,
–DiffPicOrderCnt(ColPic,RefPicList[1][refIdxL1A1])等于0。
ColPic内并置块的位置(xColCb,yColCb)推导如下。
–应用以下步骤:
-yColCb=Clip3(yCtb,Min(CurPicHeightInSamplesY-1,yCtb+(1<<CtbLog2SizeY)-1),yColCtrCb+((tempMv[1]+8-(tempMv[1]>=0?1:0))>>4)) (8-560)
–如果subpic_treated_as_pic_flag[SubPicIdx]等于1,应用以下步骤:
-xColCb=Clip3(xCtb,Min(SubPicRightBoundaryPos,xCtb+(1<<CtbLog2SizeY)+3),xColCtrCb+((tempMv[0]+8–(tempMv[0]>=0?1:0))>>4)) (8-561)
–否则(subpic_treated_as_pic_flag[SubPicIdx]等于0),应用以下步骤:
-xColCb=Clip3(xCtb,Min(CurPicWidthInSamplesY-1,xCtb+(1<<CtbLog2SizeY)+3),xColCtrCb+((tempMv[0]+8–(tempMv[0]>=0?1:0))>>4)) (8-562)
将数组colPredMode设置为等于由ColPic指定的并置图片的预测模式数组CuPredMode[0]。
运动矢量ctrMvL0和ctrMvL1,以及预测列表利用标志ctrPredFlagL0和ctrPredFlagL1推导如下:
–如果colPredMode[xColCb][yColCb]等于MODE_INTER,则应用以下步骤:
–变量currCb指定在当前图片内覆盖(xCtrCb,yCtrCb)的亮度编码块。
–变量colCb指定在ColPic内覆盖由((xColCb>>3)<<3,(yColCb>>3)<<3)给出的修改位置的亮度编码块。
–将亮度位置(xColCb,yColCb)设置为等于由colCb指定的并置亮度编码块相对于由ColPic指定的并置图片的左上亮度样点的左上样点。
–用currCb、colCb、(xColCb,yColCb)、设置为等于0的refIdxL0以及设置为等于1的sbFlag作为输入,调用在8.5.2.12条中指定的并置运动矢量推导过程,并且将输出赋值给ctrMvL0和ctrPredFlagL0。
–用currCb、colCb、(xColCb,yColCb)、设置为等于0的refIdxL1以及设置为等于1的sbFlag作为输入,调用在8.5.2.12条中指定的并置运动矢量推导过程,并且将输出赋值给ctrMvL1和ctrPredFlagL1。
–否则,应用以下步骤:
-ctrPredFlagL0=0 (8-563)
-ctrPredFlagL1=0 (8-564)
5.5实施例#5:MV取整的第三示例
8.5.5.3基于子块的时域Merge候选的推导
该过程的输入为:
–当前亮度编码块的左上样点相对于当前图片的左上亮度样点的亮度位置(xCb,yCb),
–变量cbWidth,指定亮度样点中当前编码块的宽度,
–变量cbHeight,指定亮度样点中当前编码块的高度。
–临近编码单元的可用性标志availableFlagA1
–临近编码单元的参考索引refIdxLXA1,其中X为0或1,
–临近编码单元的预测列表利用标志predFlagLXA1,其中X为0或1,
–临近编码单元的1/16分数样点精度的运动矢量mvLXA1,其中X为0或1。
该过程的输出为:
–可用性标志availableFlagSbCol,
–水平方向和垂直方向上的亮度编码子块的数量numSbX和numSbY,
–参考索引refIdxL0SbCol和refIdxL1SbCol,
–1/16分数样点精度的亮度运动矢量mvL0SbCol[xSbIdx][ySbIdx]和mvL1SbCol[xSbIdx][ySbIdx],其中xSbIdx=0..numSbX-1,ySbIdx=0..numSbY-1,
–预测列表利用标志predFlagL0SbCol[xSbIdx][ySbIdx]和predFlagL1SbCol[xSbIdx][ySbIdx],其中xSbIdx=0..numSbX-1,ySbIdx=0..numSbY-1。
可用性标志availableFlagSbCol推导如下。
–如果以下条件中的一个或多个为真,则将availableFlagSbCol设置为等于0。
–slice_temporal_mvp_enabled_flag等于0。
–sps_sbtmvp_enabled_flag等于0。
–cbWidth小于8。
–cbHeight小于8。
–否则,应用以下有序步骤:
5.包含当前编码块的亮度编码树块的左上样点的位置(xCtb,yCtb)和当前亮度编码块的右下中心样点的位置(xCtr,yCtr)推导如下:
-xCtb=(xCb>>CtuLog2Size)<<CtuLog2Size (8-542)
-yCtb=(yCb>>CtuLog2Size)<<CtuLog2Size (8-543)
-xCtr=xCb+(cbWidth/2) (8-544)
-yCtr=yCb+(cbHeight/2) (8-545)
6.将亮度位置(xColCtrCb,yColCtrCb)设置为等于在ColPic内覆盖由(xCtr,yCtr)给出的位置的并置亮度编码块相对于由ColPic指定的并置图片的左上亮度样点的左上样点。
7.用位置(xCtb,yCtb)、位置(xColCtrCb,yColCtrCb)、可用性标志availableFlagA1、预测列表利用标志predFlagLXA1、参考索引refIdxLXA1以及运动矢量mvLXA1作为输入,其中X为0和1,调用如在第8.5.5.4条中指定的基于子块的时域Merge基础运动数据的推导过程,并将运动矢量ctrMvLX、并置块的预测列表利用标志ctrPredFlagLX以及时域运动矢量tempMv作为输出,其中X为0和1。
8.变量availableFlagSbCol推导如下:
–如果ctrPredFlagL0和ctrPredFlagL1都等于0,则将availableFlagSbCol设置为等于0。
–否则,将availableFlagSbCol设置为等于1。
当availableFlagSbCol等于1时,应用以下步骤:
–变量numSbX、numSbY、sbWidth、sbHeight和refIdxLXSbCol推导如下:
-numSbX=cbWidth>>3(8-546)
-numSbY=cbHeight>>3(8-547)
-sbWidth=cbWidth/numSbX(8-548)
-sbHeight=cbHeight/numSbY(8-549)
-refIdxLXSbCol=0(8-550)
–对于xSbIdx=0..numSbX-1和ySbIdx=0..numSbY-1,运动矢量mvLXSbCol[xSbIdx][ySbIdx]和预测列表利用标志predFlagLXSbCol[xSbIdx][ySbIdx]推导如下:
–指定当前编码子块的左上样点相对于当前图片的左上亮度样点的亮度位置(xSb,ySb)推导如下:
-xSb=xCb+xSbIdx*sbWidth+sbWidth/2(8-551)
-ySb=yCb+ySbIdx*sbHeight+sbHeight/2(8-552)
–ColPic内并置子块的位置(xColSb,yColSb)推导如下:
1.应用以下步骤:
-yColSb=Clip3(yCtb,Min(CurPicHeightInSamplesY-1,yCtb+(1<<CtbLog2SizeY)-1),ySb+((tempMv[1]+(tempMv[1]>=0?7:8))>>4)) (8-553)
–如果subpic_treated_as_pic_flag[SubPicIdx]等于1,则应用以下步骤:
-xColSb=Clip3(xCtb,Min(SubPicRightBoundaryPos,xCtb+(1<<CtbLog2SizeY)+3),xSb+((tempMv[0]+(tempMv[0]>=0?7:8))>>4)) (8-554)
–否则(subpic_treated_as_pic_flag[SubPicIdx]等于0),应用以下步骤:
-xColSb=Clip3(xCtb,Min(CurPicWidthInSamplesY-1,xCtb+(1<<CtbLog2SizeY)+3),xSb+((tempMv[0]+(tempMv[0]>=0?7:8))>>4)) (8-555)
–变量currCb指定在当前图片内覆盖当前编码子块的亮度编码块。
–变量colCb指定在ColPic内覆盖由((xColSb>>3)<<3,(yColSb>>3)<<3)给出的修改位置的亮度编码块。
–将亮度位置(xColCb,yColCb)设置为等于由colCb指定的并置亮度编码块相对于由ColPic指定的并置图片的左上亮度样点的左上样点。
–用currCb、colCb、(xColCb,yColCb)、设置为等于0的refIdxL0以及设置为等于1的sbFlag作为输入,调用如在8.5.2.12条中指定的并置运动矢量推导过程,并且将输出赋值给子块的运动矢量mvL0SbCol[xSbIdx][ySbIdx]和availableFlagL0SbCol。
–用currCb、colCb、(xColCb,yColCb)、设置为等于0的refIdxL1以及设置为等于1的sbFlag作为输入,调用如在8.5.2.12条中指定的并置运动矢量推导过程,并且将输出赋值给子块的运动矢量mvL1SbCol[xSbIdx][ySbIdx]和availableFlagL1SbCol。
–当availableFlagL0SbCol和availableFlagL1SbCol都等于0时,对于X为0和1,应用以下步骤:
-mvLXSbCol[xSbIdx][ySbIdx]=ctrMvLX (8-556)
-predFlagLXSbCol[xSbIdx][ySbIdx]=ctrPredFlagLX (8-557)
8.5.5.4基于子块的时域Merge基础运动数据的推导过程
该过程的输入为:
–包含当前编码块的亮度编码树块的左上样点的位置(xCtb,yCtb),
–覆盖右下中心样点的并置亮度编码块的左上样点的位置(xColCtrCb,yColCtrCb)。
–临近编码单元的可用性标志availableFlagA1
–临近编码单元的参考索引refIdxLXA1
–临近编码单元的预测列表利用标志predFlagLXA1
–临近编码单元的1/16分数样点精度的运动矢量mvLXA1
该过程的输出为:
–运动矢量ctrMvL0和ctrMvL1,
–预测列表利用标志ctrPredFlagL0和ctrPredFlagL1,
–时域运动矢量tempMv。
将变量tempMv设置如下:
-tempMv[0]=0 (8-558)
-tempMv[1]=0 (8-559)
变量currPic指定当前图片。
当availableFlagA1等于TRUE时,应用以下步骤:
–如果以下所有条件都为真,则将tempMv设置为等于mvL0A1
–predFlagL0A1等于1
–DiffPicOrderCnt(ColPic,RefPicList[0][refIdxL0A1])等于0,
–否则,如果以下所有条件都为真,则将tempMv设置为等于mvL1A1
–slice_type等于B,
–predFlagL1A1等于1,
–DiffPicOrderCnt(ColPic,RefPicList[1][refIdxL1A1])等于0。
ColPic内并置块的位置(xColCb,yColCb)推导如下。
–应用以下步骤:
-yColCb=Clip3(yCtb,Min(CurPicHeightInSamplesY-1,yCtb+(1<<CtbLog2SizeY)-1),yColCtrCb+((tempMv[1]+(tempMv[1]>=0?7:8))>>4)) (8-560)
–如果subpic_treated_as_pic_flag[SubPicIdx]等于1,则应用以下步骤:
-xColCb=Clip3(xCtb,Min(SubPicRightBoundaryPos,xCtb+(1<<CtbLog2SizeY)+3),xColCtrCb+((tempMv[0]+(tempMv[0]>=0?7:8))>>4)) (8-561)
–否则(subpic_treated_as_pic_flag[SubPicIdx]等于0),应用以下步骤:
-xColCb=Clip3(xCtb,Min(CurPicWidthInSamplesY-1,xCtb+(1<<CtbLog2SizeY)+3),xColCtrCb+((tempMv[0]+(tempMv[0]>=0?7:8))>>4)) (8-562)
将数组colPredMode设置为等于由ColPic指定的并置图片的预测模式数组CuPredMode[0]。
运动矢量ctrMvL0和ctrMvL1,以及预测列表利用标志ctrPredFlagL0和ctrPredFlagL1推导如下:
–如果colPredMode[xColCb][yColCb]等于MODE_INTER,则应用以下步骤:
–变量currCb指定在当前图片内覆盖(xCtrCb,yCtrCb)的亮度编码块。
–变量colCb指定在ColPic内覆盖由((xColCb>>3)<<3,(yColCb>>3)<<3)给出的修改位置的亮度编码块。
–将亮度位置(xColCb,yColCb)设置为等于由colCb指定的并置亮度编码块相对于由ColPic指定的并置图片的左上亮度样点的左上样点。
–用currCb、colCb、(xColCb,yColCb)、设置为等于0的refIdxL0以及设置为等于1的sbFlag作为输入,调用在第8.5.2.12条中指定的并置运动矢量的推导过程,并将输出赋值给ctrMvL0和ctrPredFlagL0。
–用currCb、colCb、(xColCb,yColCb)、设置为等于0的refIdxL1以及设置为等于1的sbFlag作为输入,调用在第8.5.2.12条中指定的并置运动矢量的推导过程,并将输出赋值给ctrMvL1和ctrPredFlagL1。
–否则,应用以下步骤:
-ctrPredFlagL0=0 (8-563)
-ctrPredFlagL1=0 (8-564)
8.5.6.3分数样点插值过程
8.5.6.3.1概述
该过程的输入为:
–指定当前编码子块的左上样点相对于当前图片的左上亮度样点的亮度位置(xSb,ySb);
–变量sbWidth,指定当前编码子块的宽度,
–变量sbHeight,指定当前编码子块的高度,
–运动矢量偏移mvOffset,
–细化的运动矢量refMvLX,
–所选参考图片样点数组refPicLX,
–半样点插值滤波器索引hpelIfIdx,
–双向光流标志bdofFlag,
–变量cIdx,指定当前块的颜色分量索引。
该过程的输出为:
–预测样点值的(sbWidth+brdExtSize)x(sbHeight+brdExtSize)数组predSamplesLX。
预测块边界扩展尺寸brdExtSize推导如下:
-brdExtSize=(bdofFlag||(inter_affine_flag[xSb][ySb]&&sps_affine_prof_enabled_flag))?2:0 (8-752)
将变量fRefWidth设置为等于亮度样点中参考图片的PicOutputWidthL。
将变量fRefHeight设置为等于亮度样点中参考图片的PicOutputHeightL。
将运动矢量mvLX设置为等于(refMvLX-mvOffset)。
–如果cIdx等于0,则应用以下步骤:
–缩放因子及其定点表示定义为
-hori_scale_fp=((fRefWidth<<14)+(PicOutputWidthL>>1))/PicOutputWidthL (8-753)
-vert_scale_fp=((fRefHeight<<14)+(PicOutputHeightL>>1))/PicOutputHeightL (8-754)
–令(xIntL,yIntL)为以全样点单元给出的亮度位置,并且(xFracL,yFracL)为以1/16样点单元给出的偏移。这些变量仅在本条中用于指定参考样点数组refPicLX内的分数样点位置。
–将参考样点填充的边界块的左上坐标(xSbIntL,ySbIntL)设置为等于(xSb+(mvLX[0]>>4),ySb+(mvLX[1]>>4))。
–对于预测亮度样点数组predSamplesLX内的每个亮度样点位置(xL=0..sbWidth-1+brdExtSize,yL=0..sbHeight-1+brdExtSize),对应的预测亮度样点值predSamplesLX[xL][yL]推导如下:
–令(refxSbL,refySbL)和(refxL,refyL)为以1/16样点单元给出的运动矢量(refMvLX[0],refMvLX[1])指向的亮度位置(refMvLX[0],refMvLX[1])。变量refxSbL、refxL、refySbL和refyL推导如下:
-refxSbL=((xSb<<4)+refMvLX[0])*hori_scale_fp (8-755)
-refxL=((Sign(refxSb)*((Abs(refxSb)+128)>>8)+xL*((hori_scale_fp+8)>>4))+32)>>6 (8-756)
-refySbL=((ySb<<4)+refMvLX[1])*vert_scale_fp (8-757)
-refyL=((Sign(refySb)*((Abs(refySb)+128)>>8)+yL*((vert_scale_fp+8)>>4))+32)>>6 (8-758)
–变量xIntL、yIntL、xFracL和yFracL推导如下:
-xIntL=refxL>>4(8-759)
-yIntL=refyL>>4(8-760)
-xFracL=refxL&15(8-761)
-yFracL=refyL&15(8-762)
–如果满足以下所有条件,则将using6TapFlag设置为1:
–cbWidth[0][xSb][ySb]<=4||cbHeight[0][xSb][ySb]<=4||cbWidth[0][xSb][ySb]*cbHeight[0][xSb][ySb]<=64.
–PredFlagL0[xSb][ySb]==1&&PredFlagL1[xSb][ySb]==1.
–如果bdofFlag等于TRUE或(sps_affine_prof_enabled_flag等于TRUE并且inter_affine_flag[xSb][ySb]等于TRUE),并且以下条件中的一个或多个为真,则通过调用如第8.5.6.3.3条中指定的亮度整数样点获取过程并以(xIntL+(xFracL>>3)-1),yIntL+(yFracL>>3)-1)和refPicLX为输入来推导预测亮度样点值predSamplesLX[xL][yL]。
1.xL等于0。
2.xL等于sbWidth+1。
3.yL等于0。
4.yL等于sbHeight+1。
–否则,通过调用如第8.5.6.3.2条中指定的亮度样点8抽头插值滤波过程,并以(xIntL-(brdExtSize>0?1:0),yIntL-(brdExtSize>0?1:0))、(xFracL,yFracL)、(xSbIntL,ySbIntL)、refPicLX、hpelIfIdx、sbWidth、sbHeight和(xSb,ySb)以及using6TapFlag为输入来推导预测亮度样点值predSamplesLX[xL][yL]。
–否则(cIdx不等于0),应用以下步骤:
–令(xIntC,yIntC)为以全样点单元给出的色度位置,并且(xFracC,yFracC)为以1/32样点单元给出的偏移。这些变量仅在本条中用于指定参考样点数组refPicLX内的常规分数样点位置。
–将参考样点填充的边界块的左上坐标(xSbIntC,ySbIntC)设置为等于((xSb/SubWidthC)+(mvLX[0]>>5),(ySb/SubHeightC)+(mvLX[1]>>5))。
–对于预测色度样点数组predSamplesLX中的每个色度样点位置(xC=0..sbWidth-1,yC=0..sbHeight-1),对应的预测色度样点值predSamplesLX[xC][yC]推导如下:
–令(refxSbC,refySbC)和(refxC,refyC)为以1/32样点单元给出的运动矢量(mvLX[0],mvLX[1])指向的色度位置。变量refxSbC、refySbC、refxC和refyC推导如下:
-refxSbC=((xSb/SubWidthC<<5)+mvLX[0])*hori_scale_fp (8-763)
-refxC=((Sign(refxSbC)*((Abs(refxSbC)+256)>>9)+xC*((hori_scale_fp+8)>>4))+16)>>5 (8-764)
-refySbC=((ySb/SubHeightC<<5)+mvLX[1])*vert_scale_fp (8-765)
-refyC=((Sign(refySbC)*((Abs(refySbC)+256)>>9)+yC*((vert_scale_fp+8)>>4))+16)>>5 (8-766)
–变量xIntC、yIntC、xFracC和yFracC推导如下:
-xIntC=refxC>>5(8-767)
-yIntC=refyC>>5(8-768)
-xFracC=refyC&31(8-769)
-yFracC=refyC&31(8-770)
–以(xIntC,yIntC)、(xFracC,yFracC)、(xSbIntC,ySbIntC)、sbWidth、sbHeight和refPicLX为输入,通过调用第8.5.6.3.4节中指定的过程来推导预测样点值predSamplesLX[xC][yC]。
8.5.6.3.2亮度样点插值滤波过程
该过程的输入为:
–以全样点为单位的亮度位置(xIntL,yIntL),
–以分数样点为单位的亮度位置(xFracL,yFracL),
–以全样点为单位的亮度位置(xSbIntL,ySbIntL),用于参考样点填充的边界块相对于参考图片的左上亮度样点的左上样点,
–亮度参考样点数组refPicLXL
–半样点插值滤波器索引hpelIfIdx,
–变量sbWidth,指定当前子块的宽度,
–变量sbHeight,指定当前子块的高度,
–指定当前子块的左上角样点相对于当前图片的左上角亮度样点的亮度位置(xSb,ySb);
–using6TapFlag标志,指定是否使用6抽头插值滤波器。
该过程的输出为预测的亮度样点值predSampleLXL
变量shift1、shift2和shift3推导如下:
–将变量shift1设置为等于Min(4,BitDepthY-8),将变量shift2设置为等于6,将变量shift3设置为等于Max(2,14-BitDepthY)。
–将变量picW设置为等于pic_width_in_luma_samples,将变量picH设置为等于pic_height_in_luma_samples。
等于xFracL或yFracL的每个1/16分数样点位置p的亮度插值滤波器系数fL[p]推导如下:
–如果满足以下条件中的至少一个,则在表8-12中指定亮度插值滤波器系数fL[p]。
–MotionModelIdc[xSb][ySb]大于0,并且sbWidth和sbHeight都等于4,
–using6TapFlag等于1。
–否则,取决于hpelIfIdx在表8-11中指定亮度插值滤波器系数fL[p]。
对于i=0..7,以全样点为单位的亮度位置(xInti,yInti)推导如下:
–如果subpic_tained_as_pic_flag[SubPicIdx]等于1,则应用以下步骤:
-xInti=Clip3(SubPicLeftBoundaryPos,SubPicRightBoundaryPos,xIntL+i-3)(8-771)
-yInti=Clip3(SubPicTopBoundaryPos,SubPicBotBoundaryPos,yIntL+i-3)(8-772)
–否则(subpic_aged_as_pic_flag[SubPicIdx]等于0),应用以下步骤:
-xInti=Clip3(0,picW-1,sps_ref_wraparound_enabled_flag?ClipH((sps_ref_wraparound_offset_minus1+1)*MinCbSizeY,picW,xIntL+i-3):(8-773)
xIntL+i-3)
-yInti=Clip3(0,picH-1,yIntL+i-3)(8-774)
对于i=0..7,对以全样点为单位的亮度位置进一步进行如下修改:
-xInti=Clip3(xSbIntL-3,xSbIntL+sbWidth+4,xInti)(8-775)
-yInti=Clip3(ySbIntL-3,ySbIntL+sbHeight+4,yInti)(8-776)
预测的亮度样点值predSampleLXL推导如下:
–如果xFracL和yFracL都等于0,则predSampleLXL的值推导如下:
-predSampleLXL=refPicLXL[xInt3][yInt3]<<shift3(8-777)
–否则,如果xFracL不等于0并且yFracL等于0,则predSampleLXL的值推导如下:
Figure BDA0003072137370000765
–否则,如果xFracL等于0且yFracL不等于0,则predSampleLXL的值推导如下:
Figure BDA0003072137370000761
–否则,如果xFracL不等于0并且yFracL不等于0,则predSampleLXL的值推导如下:
–n=0..7的样点数组temp[n]推导如下:
Figure BDA0003072137370000762
–预测的亮度样点值predSampleLXL推导如下:
Figure BDA0003072137370000763
表8-11–每个1/16分数样点位置p的亮度插值滤波器系数fL[p]的规范
Figure BDA0003072137370000764
Figure BDA0003072137370000771
表8-12–仿射运动模式下每个1/16分数样点位置p的亮度插值滤波器系数fL[p]的规范
Figure BDA0003072137370000772
图30是用于视频处理的方法3000的流程图。方法3000包括,在操作3010,对于视频的当前块与视频的比特流表示之间的转换,基于在转换期间是否启用时域运动矢量预测(TMVP)或是否将当前图片参考(CPR)编解码模式用于转换,确定基于子块的Merge候选列表中的最大候选数(ML)和/或是否将基于子块的时域运动矢量预测(SbTMVP)候选添加到基于子块的Merge候选列表中。
方法3000包括,在操作3020,基于确定执行转换。
图31是用于视频处理的方法3100的流程图。方法3100包括,在操作3110,对于视频的当前块与视频的比特流表示之间的转换,基于是否在转换期间启用时域运动矢量预测(TMVP)、基于子块的时域运动矢量预测(SbTMVP)和仿射编解码模式,确定基于子块的Merge候选列表中的最大候选数(ML)。
方法3100包括,在操作3120,基于确定执行转换。
图32是用于视频处理的方法3200的流程图。方法3200包括,在操作3210,对于视频的第一视频片段的当前块与视频的比特流表示之间的转换,确定由于时域运动矢量预测(TMVP)模式在第一视频段级别被禁用而对转换禁用基于子块的运动矢量预测(SbTMVP)模式。
方法3200包括,在操作3220,基于确定执行转换,比特流表示符合格式,所述格式指定是否包括SbTMVP模式的指示和/或SbTMVP模式的指示在Merge候选列表中相对于所述TMVP模式的指示的位置。
图33是用于视频处理的方法3300的流程图。方法3300包括,在操作3310,在使用基于子块的时域运动矢量预测(SbTMVP)工具或时域运动矢量预测(TMVP)工具编码的视频的当前块与视频的比特流表示之间执行转换,基于与SbTMVP工具或TMVP工具相关联的运动矢量的压缩,使用掩模选择性地掩蔽当前块或当前块的子块的对应位置的坐标,以及掩模的应用包括计算坐标的值与掩模的值之间的按位与运算。
图34是用于视频处理的方法3400的流程图。方法3400包括,在操作3410,基于视频的视频片段的当前块的一个或多个特性,对基于子块的运动矢量预测(SbTMVP)工具在当前块上的应用,确定当前块的有效对应区域。
方法3400包括,在操作3420,基于确定,执行当前块与视频的比特流表示之间的转换。
图35是用于视频处理的方法3500的流程图。方法3500包括,在操作3510,对于使用基于子块的时域运动矢量预测(SbTMVP)工具编码的视频的当前块,确定默认运动矢量。
方法3500包括,在操作3520,基于确定,执行当前块与视频的比特流表示之间的转换,在不从覆盖与当前块的中心位置相关联的并置图片中的对应位置的块中获得运动矢量的情况下,确定默认运动矢量。
图36是用于视频处理的方法3600的流程图。方法3600包括,在操作3610,对于视频的视频片段的当前块,在当前块的当前图片是参考图片列表X中索引被设置为M的参考图片的情况下,推断对视频片段禁用基于子块的时域运动矢量预测(SbTMVP)工具或时域运动矢量预测(TMVP)工具,M和X为整数,并且X=0或X=1。
方法3600包括,在操作3620,基于推断,执行上述当前块和上述视频的比特流表示之间的转换。
图37是用于视频处理的方法3700的流程图。方法3700包括,在操作3710,对于视频的当前块,在上述当前块的当前图片是参考图片列表X中索引被设置为M的参考图片的情况下,确定启用基于子块的时域运动矢量预测(SbTMVP)工具的应用,M和X为整数。
方法3700包括,在操作3720,基于确定,执行当前块和视频的比特流表示之间的转换。
图38是用于视频处理的方法3800的流程图。方法3800包括,在操作3810,执行视频的当前块与视频的比特流表示之间的转换,当前块用基于子块的编解码工具进行编码,其中执行转换包括在启用或禁用基于子块的时域运动矢量预测(SbTMVP)工具的情况下,通过统一方法使用多个二进制位(N)对子块Merge索引进行编码。
图39是用于视频处理的方法3900的流程图。方法3900包括,在操作3910,对于使用基于子块的时域运动矢量预测(SbTMVP)工具进行编码的视频的当前块,确定由SbTMVP工具使用的运动矢量,以在不同于包括当前块的当前图片的图片中定位对应的块。
方法3900包括,在操作3920,基于确定,执行当前块与视频的比特流表示之间的转换。
图40是用于视频处理的方法4000的流程图。方法4000包括,在操作4010,对于视频的当前块和视频的比特流表示之间的转换,基于是否对当前块的转换启用仿射预测,来确定是否将零运动仿射Merge候选插入子块Merge候选列表中。
方法4000包括,在操作4020,基于确定执行转换。
图41是用于视频处理的方法4100的流程图。方法4100包括,在操作4110,对于使用子块Merge候选列表的视频的当前块和视频的比特流表示之间的转换,在子块Merge候选列表未满的情况下,将零运动非仿射填充候选插入到子块Merge候选列表中。
方法4100包括,在操作4120,在插入之后执行转换。
图42是用于视频处理的方法4200的流程图。方法4200包括,在操作4210,对于视频的当前块和视频的比特流表示之间的转换,使用确定运动矢量是从覆盖并置图片中相应位置的块的一个或多个运动矢量中推导的规则来确定运动矢量。
方法4200包括,在操作4220,基于运动矢量来执行转换。
图43是视频处理装置4300的框图。装置4300可用于实现这里描述的一个或多个方法。装置4300可以体现在智能手机、平板电脑、计算机、物联网(IoT)接收器等中。装置4300可以包括一个或多个处理器4302、一个或多个存储器4304和视频处理硬件4306。处理器4302可以被配置为实现在本文中描述的一种或多种方法。尽管一些实施例可以在没有存储器的情况下操作,但是可以将(一个或多个)存储器4304用于存储用于实现这里描述的方法和技术的数据和代码。视频处理硬件4306可用于在硬件电路中实现本文档中描述的一些技术。
在一些实施例中,视频编解码方法可以使用如关于图43所描述的在硬件平台上实现的装置来实现。
所公开技术的一些实施例包含做出决策或确定以启用视频处理工具或模式。在示例中,当启用视频处理工具或模式时,编码器将在视频块的处理中使用或实现该工具或模式,但是不一定基于该工具或模式的使用来修改结果比特流。也就是说,从视频块到视频的比特流表示的转换将在基于决策或确定启用视频处理工具或模式时使用视频处理工具或模式。在另一示例中,当启用视频处理工具或模式时,解码器将基于视频处理工具或模式已经知道比特流已被修改的情况下处理比特流。也就是说,将使用基于决策或确定而启用的视频处理工具或模式来执行从视频的比特流表示到视频块的转换。
所公开技术的一些实施例包含做出决策或确定以禁用视频处理工具或模式。在示例中,当禁用视频处理工具或模式时,编码器将在视频块到视频的比特流表示的转换中不使用该工具或模式。在另一示例中,当禁用视频处理工具或模式时,解码器将在知道尚未使用基于决策或确定启用的视频处理工具或模式修改比特流的情况下处理比特流。
图44是示出其中可实现本文中所公开的各种技术的示例视频处理系统4400的框图。各种实施方式可以包括系统4400的一些或全部组件。系统4400可以包括用于接收视频内容的输入4402。视频内容可以以原始或未压缩的格式(例如8或10位多分量像素值)接收,或者可以以压缩或编码的格式接收。输入4402可以代表网络接口、外围总线接口或存储接口。网络接口的示例包括有线接口(诸如以太网、无源光网络(PON)等)和无线接口(诸如Wi-Fi或蜂窝接口)。
系统4400可以包括可以实现本文中描述的各种编码或编解码方法的编码组件4404。编码组件4404可以减少从编码组件4404的输入4402到输出的视频的平均比特率,以产生视频的编码表示。因此,编码技术有时称为视频压缩或视频转码技术。如组件4406所表示的,编码组件4404的输出可以被存储或经由所连接的通信来发送。在输入4402处接收的视频的存储或传送的比特流(或编码)表示可以被组件4408使用,以生成被发送到显示接口4410的像素值或可显示视频。从比特流表示中生成用户可见视频的过程有时称为视频解压缩。此外,尽管某些视频处理操作被称为“编码”操作或工具,但是应当理解,在编码器处使用编解码工具或操作,并且将由编码器执行反向编码结果的相应解码工具或操作。
外围总线接口或显示接口的示例可以包括通用串行总线(USB)或高清多媒体接口(HDMI)或Displayport等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文中描述的技术可以体现在各种电子设备中,诸如移动电话、膝上型计算机、智能电话或其他能够执行数字数据处理和/或视频显示的设备。
在一些实施例中,可以实现以下技术解决方案:
A1.一种视频处理方法,包括:对于视频的当前块与视频的比特流表示之间的转换,基于在转换期间是否启用时域运动矢量预测(TMVP)或是否将当前图片参考(CPR)编解码模式用于转换,确定基于子块的Merge候选列表中的最大候选数(ML)和/或是否将基于子块的时域运动矢量预测(SbTMVP)候选添加到基于子块的Merge候选列表中;以及基于确定执行转换。
A2.根据解决方案A1的方法,其中在禁用TMVP工具或禁用SbTMVP工具的情况下,禁用SbTMVP候选的使用。
A3.根据解决方案A2的方法,其中确定ML包括:基于是否禁用SbTMVP工具或TMVP工具,从基于子块的Merge候选列表中排除SbTMVP候选。
A4.一种视频处理方法,包括:对于视频的当前块与视频的比特流表示之间的转换,基于是否在转换期间启用时域运动矢量预测(TMVP)、基于子块的时域运动矢量预测(SbTMVP)和仿射编解码模式,确定基于子块的Merge候选列表中的最大候选数(ML);以及基于确定执行转换。
A5.根据解决方案A4的方法,其中,在启用仿射编解码模式的情况下,动态设置ML并在比特流表示中用信令通知ML。
A6.根据解决方案A4的方法,其中,在禁用仿射编解码模式的情况下,预先定义ML。
A7.根据解决方案A2或A6的方法,其中确定ML包括:在禁用TMVP工具、启用SbTMVP工具并且禁用当前块的仿射编解码模式的情况下,将ML设置为零。
A8.根据解决方案A2或A6的方法,其中确定ML包括:在启用SbTMVP工具、启用TMVP工具并且禁用当前块的仿射编解码模式的情况下,将ML设置为一。
A9.根据解决方案A1的方法,其中,在禁用SbTMVP工具或者当前块的当前图片的并置参考图片是当前图片的情况下,禁用SbTMVP候选的使用。
A10.根据解决方案A9的方法,其中,确定ML包括:基于是否禁用SbTMVP工具或当前图片的并置参考图片是否是当前图片,从基于子块的Merge候选列表中排除SbTMVP候选。
A11.根据解决方案A9的方法,其中,确定ML包括:在当前图片的并置参考图片是当前图片并且禁用当前块的仿射编码的情况下,将ML设置为零。
A12.根据解决方案A9的方法,其中确定ML包括:在启用SbTMVP工具、当前图片的并置参考图片不是当前图片,并且禁用当前块的仿射编码的情况下,将ML设置为1。
A13.根据解决方案A1的方法,其中在禁用SbTMVP工具或参考图片列表0(L0)中参考图片索引为0的参考图片是当前块的当前图片的情况下,禁用SbTMVP候选的使用。
A14.根据解决方案A13的方法,其中,确定ML包括:基于是否禁用SbTMVP工具或L0中参考图片索引为0的参考图片是否是当前图片,从基于子块的Merge候选列表中排除SbTMVP候选。
A15.根据解决方案A13的方法,其中确定ML包括:在启用SbTMVP工具、L0中参考图片索引为0的参考图片是当前图片,并且禁用当前块的仿射编码的情况下,将ML设置为零。
A16.根据解决方案A13的方法,其中确定ML包括:在启用SbTMVP工具、L0中参考图片索引为0的参考图片不是当前图片,并且禁用当前块的仿射编码的情况下,将ML设置为一。
A17.根据解决方案A1的方法,其中,在禁用SbTMVP工具或者参考图片列表1(L1)中参考图片索引为0的参考图片是当前块的当前图片的情况下,禁用SbTMVP候选的使用。
A18.根据解决方案A17的方法,其中确定ML包括:基于是否禁用SbTMVP工具或L1中参考图片索引为0的参考图片是否是当前图片,从基于子块的Merge候选列表中排除SbTMVP候选。
A19.根据解决方案A17的方法,其中,确定ML包括:在启用SbTMVP工具、L1中参考图片索引为0的参考图片是当前图片,并且禁用当前块的仿射编码的情况下,将ML设置为零。
A20.根据解决方案A17的方法,其中,确定ML包括:在启用SbTMVP工具、L1中参考图片索引为0的参考图片不是当前图片,并且禁用当前块的仿射编码的情况下,将ML设置为一。
A21.一种视频处理方法,包括:对于视频的第一视频片段的当前块与视频的比特流表示之间的转换,确定由于时域运动矢量预测(TMVP)模式在第一视频段级别被禁用而对转换禁用基于子块的运动矢量预测(SbTMVP)模式;以及基于确定执行转换,其中,比特流表示符合格式,格式指定是否包括SbTMVP模式的指示和/或SbTMVP模式的指示在Merge候选列表中相对于所述TMVP模式的指示的位置。
A22.根据解决方案A21的方法,其中,第一视频片段是序列、条带、片或图片。
A23.根据解决方案A21的方法,其中,由于在第一视频段级别上包括TMVP模式的指示,格式指定省略SbTMVP模式的指示。
A24.根据解决方案A21的方法,其中,格式指定SbTMVP模式的指示以解码顺序在第一视频片段级别处于TMVP模式的指示之后。
A25.根据解决方案A21至A24中任一项的方法,其中,在TMVP模式被指示为禁用的情况下,格式指定省略SbTMVP模式的指示。
A26.根据解决方案A21的方法,其中,格式指定在视频的序列级别处包括SbTMVP模式的指示,并且在第二视频片段级别处省略SbTMVP模式的指示。
A27.根据解决方案A26的方法,其中,处于第二视频片段级别的第二视频片段是条带、片或图片。
A28.根据解决方案A1至A27中任一项的方法,转换从比特流表示生成当前块。
A29.根据解决方案A1至A27中任一项的方法,其中,转换从当前块生成比特流表示。
A30.根据解决方案A1至A27中任一项的方法,其中,执行转换包括基于一个或多个解码规则来解析比特流表示。
A31.一种视频系统中的装置,包括处理器和其上具有指令的非暂时性存储器,其中指令在由处理器执行时使处理器实现解决方案A1至A30中的一项或多项的方法。
A32.一种存储在非暂时性计算机可读介质上的计算机程序产品,计算机程序产品包括用于进行解决方案A1至A30中的一项或多项的方法的程序代码。
在一些实施例中,可以实现以下技术解决方案:
B1.一种视频处理方法,包括:在使用基于子块的时域运动矢量预测(SbTMVP)工具或时域运动矢量预测(TMVP)工具编码的视频的当前块与视频的比特流表示之间执行转换,其中,基于与SbTMVP工具或TMVP工具相关联的运动矢量的压缩,使用掩模选择性地掩蔽当前块或当前块的子块的对应位置的坐标,以及其中,掩模的应用包括计算坐标的值与掩模的值之间的按位与运算。
B2.根据解决方案1的方法,其中,坐标是(xN,yN),并且掩模(MASK)是等于~(2M-1)的整数,其中,M是整数,其中,掩模的应用导致掩蔽的坐标(xN',yN'),其中xN'=xN&MASK并且yN'=yN&MASK,并且其中“~”是按位非(NOT)运算,并且“&”是按位与运算。
B3.根据解决方案B2的方法,其中,M=3或M=4。
B4.根据解决方案B2或B3的方法,其中,多个尺寸为2K×2K的子块基于运动矢量的压缩共享相同的运动信息,并且其中,K是不等于M的整数。
B5.根据解决方案B4的方法,其中,M=K+1。
B6.根据解决方案B1的方法,其中,在确定与SbTMVP工具或TMVP工具相关联的运动矢量未被压缩之后,不应用掩模。
B7.根据解决方案B1至B6中任一项的方法,其中,SbTMVP工具的掩模与TMVP工具的掩模相同。
B8.根据解决方案B1至B6中任一项的方法,其中,ATMVP工具的掩模与TMVP工具的掩模不同。
B9.根据解决方案B1的方法,其中,压缩的类型是无压缩、8×8压缩或16×16压缩。
B10.根据解决方案B9的方法,其中,在视频参数集(VPS)、序列参数集(SPS)、图片参数集(PPS)、条带标头或片组标头中用信令通知压缩的类型。
B11.根据解决方案B9或B10的方法,其中,压缩的类型基于与当前块相对应的标准配置文件、级别或层级。
B12.一种视频处理方法,包括:基于视频的视频片段的当前块的一个或多个特性,对基于子块的运动矢量预测(SbTMVP)工具在当前块上的应用,确定当前块的有效对应区域;以及基于确定,执行当前块与视频的比特流表示之间的转换。
B13.根据解决方案B12的方法,其中,一个或多个特性包括当前块的高度或宽度。
B14.根据解决方案B12的方法,其中,一个或多个特性包括与当前块相关联的运动矢量的压缩的类型。
B15.根据解决方案B14的方法,其中,在压缩的类型包括无压缩的情况下,有效对应区域为第一尺寸,并且其中,在压缩的类型包括K×K压缩的情况下,有效对应区域为大于第一尺寸的第二尺寸。
B16.根据解决方案B12的方法,其中,有效对应区域的尺寸基于具有小于编码树单元(CTU)区域的尺寸的尺寸为M×N的基本区域,并且其中,当前块的尺寸是W×H。
B17.根据解决方案B16的方法,其中,CTU区域的尺寸是128×128,并且其中,M=64并且N=64。
B18.根据解决方案B16的方法,其中,在W≤M且H≤N的情况下,有效对应区域是并置基本区域和并置图片中的扩展。
B19.根据解决方案B16的方法,其中,在确定W>M且H>N时,将当前块分割为若干部分,并且其中,若干部分中的每个包括用于SbTMVP工具的应用的单独的有效对应区域。
B20.一种视频处理方法,包括:对于使用基于子块的时域运动矢量预测(SbTMVP)工具编码的视频的当前块,确定默认运动矢量;以及基于确定,执行当前块与视频的比特流表示之间的转换,其中,在不从覆盖与当前块的中心位置相关联的并置图片中的对应位置的块中获得运动矢量的情况下,确定默认运动矢量。
B21.根据解决方案B20的方法,其中,将默认运动矢量设置为(0,0)。
B22.根据解决方案B20的方法,其中,从基于历史的运动矢量预测(HMVP)表中推导默认运动矢量。
B23.根据解决方案B22的方法,其中,在HMVP表为空的情况下,将默认运动矢量设置为(0,0)。
B24.根据解决方案B22的方法,其中,默认运动矢量是预定义的,并且在视频参数集(VPS)、序列参数集(SPS)、图片参数集(PPS)、条带标头、片组标头、编码树单元(CTU)或编码单元(CU)中用信令通知。
B25.根据解决方案22的方法,其中,在HMVP表为非空的情况下,将默认运动矢量设置为存储在HMVP表中的第一个元素。
B26.根据解决方案B22的方法,其中,在HMVP表为非空的情况下,将默认运动矢量设置为存储在HMVP表中的最后一个元素。
B27.根据解决方案B22的方法,其中,在HMVP表为非空的情况下,将默认运动矢量设置为存储在HMVP表中的特定运动矢量。
B28.根据解决方案B27的方法,其中,特定运动矢量引用参考列表0。
B29.根据解决方案B27的方法,其中,特定运动矢量引用参考列表1。
B30.根据解决方案B27的方法,其中,特定运动矢量引用参考列表0中的特定参考图片。
B31.根据解决方案B27的方法,其中,特定运动矢量引用参考列表1中的特定参考图片。
B32.根据解决方案B30或B31的方法,其中,特定参考图片具有索引0。
B33.根据解决方案B27的方法,其中,特定运动矢量引用并置图片。
B34.根据解决方案B22的方法,其中,在HMVP表中的搜索过程找不到特定运动矢量的情况下,将默认运动矢量设置为预定的默认运动矢量。
B35.根据解决方案B34的方法,其中,搜索过程仅搜索HMVP表的第一个元素或仅搜索最后一个元素。
B36.根据解决方案B34的方法,其中,搜索过程仅搜索HMVP表的元素的子集。
B37.根据解决方案B22的方法,其中默认运动矢量不引用当前块的当前图片。
B38.根据解决方案B22的方法,其中在默认运动矢量不引用并置图片的情况下,将默认运动矢量缩放到并置图片。
B39.根据解决方案B20的方法,其中,从临近块推导默认运动矢量。
B40.根据解决方案B39的方法,其中,临近块(A0)的右上角与当前块的左下角直接相邻,或者临近块(A1)的右下角与当前块的左下角直接相邻,或者临近块(B0)的左下角与当前块的右上角直接相邻,或者临近块(B1)的右下角与当前块的右上角直接相邻,或者临近块(B2)的右下角与当前块的左上角直接相邻。
B41.根据解决方案B40的方法,其中,默认运动矢量仅从临近块A0、A1、B0、B1和B2中的一个推导。
B42.根据解决方案B40的方法,其中,默认运动矢量从临近块A0、A1、B0、B1和B2中的一个或多个推导。
B43.根据解决方案B40的方法,其中,在不能在临近块A0、A1、B0、B1和B2的任何一个中找到有效默认运动矢量的情况下,将默认运动矢量设置为预定义的默认运动矢量。
B44.根据解决方案B43的方法,其中,在视频参数集(VPS)、序列参数集(SPS)、图片参数集(PPS)、条带标头、片组标头、编码树单元(CTU)或编码单元(CU)中用信令通知预定义的默认运动矢量。
B45.根据解决方案B43和B44的方法,其中,预定义的默认运动矢量是(0,0)。
B46.根据解决方案B39的方法,其中,将默认运动矢量设置为来自临近块的特定运动矢量。
B47.根据解决方案B46的方法,其中,特定运动矢量引用参考列表0。
B48.根据解决方案B46的方法,其中,特定运动矢量引用参考列表1。
B49.根据解决方案B46的方法,其中,特定运动矢量引用参考列表0中的特定参考图片。
B50.根据解决方案B46的方法,其中,特定运动矢量引用参考列表1中的特定参考图片。
B51.根据解决方案B49或B50的方法,其中,特定参考图片具有索引0。
B52.根据解决方案B46的方法,其中,特定运动矢量引用并置图片。
B53.根据解决方案B20的方法,其中,在覆盖并置图片中的对应位置的块是帧内编码的情况下,使用默认运动矢量。
B54.根据解决方案B20的方法,其中,在未定位覆盖并置图片中的对应位置的块的情况下,修改推导方法。
B55.根据解决方案B20的方法,其中默认运动矢量候选总是可用的。
B56.根据解决方案B20的方法,其中,在确定默认运动矢量候选被设置为不可用时,以替代方式推导默认运动矢量。
B57.根据解决方案B20的方法,其中,默认运动矢量的可用性基于与视频片段相关联的比特流表示中的语法信息。
B58.根据解决方案B57的方法,其中,语法信息包括启用SbTMVP工具的指示,并且其中,视频片段是条带、片或图片。
B59.根据解决方案B58的方法,其中,当前块的当前图片不是帧内随机接入点(IRAP)图片,并且当前图片未插入到参考索引为0的参考图片列表0(L0)中。
B60.根据解决方案B20的方法,其中在启用SbTMVP工具的情况下,将固定索引或固定索引组分配给与SbTMVP工具相关联的候选,并且其中在禁用SbTMVP工具的情况下,将固定索引或固定索引组分配给与除了SbTMVP工具以外的编解码工具关联的候选。
B61.一种视频处理方法,包括:对于视频的视频片段的当前块,在当前块的当前图片是参考图片列表X中索引被设置为M的参考图片的情况下,推断对视频片段禁用基于子块的时域运动矢量预测(SbTMVP)工具或时域运动矢量预测(TMVP)工具,其中M和X为整数,并且其中X=0或X=1;以及基于推断,执行当前块和视频的比特流表示之间的转换。
B62.根据解决方案B61的方法,其中,M对应于目标参考图片索引,对于用于SbTMVP工具或TMVP工具的参考图片列表X,将时域块的运动信息缩放到目标参考图片索引。
B63.根据解决方案B61的方法,其中,当前图片是帧内随机接入点(IRAP)图片。
B64.一种视频处理方法,包括:对于视频的当前块,在当前块的当前图片是参考图片列表X中索引被设置为M的参考图片的情况下,确定启用基于子块的时域运动矢量预测(SbTMVP)工具的应用,其中M和X为整数;以及基于确定,执行当前块和视频的比特流表示之间的转换。
B65.根据解决方案B64的方法,其中,与当前块的每个子块对应的运动信息引用当前图片。
B66.根据解决方案B64的方法,其中,从时域块推导当前块的子块的运动信息,并且其中时域块用引用时域块的当前图片的至少一个参考图片进行编码。
B67.根据解决方案B66的方法,其中,转换不包括缩放操作。
B68.一种视频处理方法,包括:执行视频的当前块与视频的比特流表示之间的转换,其中,当前块用基于子块的编解码工具进行编码,并且其中,执行转换包括在启用或禁用基于子块的时域运动矢量预测(SbTMVP)工具的情况下,通过统一方法使用多个二进制位(N)对子块Merge索引进行编码。
B69.根据解决方案B68的方法,其中,对多个二进制位中的第一数量的二进制位(L)进行上下文编码,并且其中对第二数量的二进制位(N-L)进行旁路编码。
B70.根据解决方案B69的方法,其中,L=1。
B71.根据解决方案B68的方法,其中,对多个二进制位中的每个进行上下文编码。
B72.根据解决方案B1至B71中任一项的方法,转换从比特流表示生成当前块。
B73.根据解决方案B1至B71中任一项的方法,其中,转换从当前块生成比特流表示。
B74.根据解决方案B1至B71中任一项的方法,其中执行转换包括基于一个或多个解码规则来解析比特流表示。
B75.一种视频系统中的装置,包括处理器和其上具有指令的非暂时性存储器,其中,指令在由处理器执行时使处理器实现解决方案B1至B74中的一项或多项的方法。
B76.一种存储在非暂时性计算机可读介质上的计算机程序产品,计算机程序产品包括用于进行根据解决方案B1至B74中的一项或多项的方法的程序代码。
在一些实施例中,可以实现以下技术解决方案:
C1.一种视频处理方法,包括:对于使用基于子块的时域运动矢量预测(SbTMVP)工具进行编码的视频的当前块,确定由SbTMVP工具使用的运动矢量,以在不同于包括当前块的当前图片的图片中定位对应的块;以及基于确定,执行当前块与视频的比特流表示之间的转换。
C2.根据解决方案C1的方法,其中,将运动矢量设置为默认运动矢量。
C3.根据解决方案C2的方法,其中,默认运动矢量是(0,0)。
C4.根据解决方案C2的方法,其中,在视频参数集(VPS)、序列参数集(SPS)、图片参数集(PPS)、条带标头、片组标头、编码树单元(CTU)或编码单元(CU)中用信令通知默认运动矢量。
C5.根据解决方案C1的方法,其中,将运动矢量设置为存储在基于历史的运动矢量预测(HMVP)表中的运动矢量。
C6.根据解决方案C5的方法,其中,在HMVP表为空的情况下,将运动矢量设置为默认运动矢量。
C7.根据解决方案C6的方法,其中,默认运动矢量是(0,0)。
C8.根据解决方案C5的方法,其中,在HMVP表为非空的情况下,将运动矢量设置为存储在HMVP表中的第一个运动矢量。
C9.根据解决方案5的方法,其中在HMVP表为非空的情况下,将运动矢量设置为存储在HMVP表中的最后一个运动矢量。
C10.根据解决方案C5的方法,其中在HMVP表为非空的情况下,将运动矢量设置为存储在HMVP表中的特定运动矢量。
C11.根据解决方案C10的方法,其中,特定运动矢量引用参考列表0。
C12.根据解决方案C10的方法,其中,特定运动矢量引用参考列表1。
C13.根据解决方案C10的方法,其中,特定运动矢量引用参考列表0中的特定参考图片。
C14.根据解决方案C10的方法,其中,特定运动矢量引用参考列表1中的特定参考图片。
C15.根据解决方案C13或C14的方法,其中,特定参考图片具有索引0。
C16.根据解决方案C10的方法,其中,特定运动矢量引用并置图片。
C17.根据解决方案C5的方法,其中在HMVP表中的搜索过程找不到特定运动矢量的情况下,将运动矢量设置为默认运动矢量。
C18.根据解决方案C17的方法,其中,搜索过程仅搜索HMVP表的第一个元素或仅搜索最后一个元素。
C19.根据解决方案C17的方法,其中,搜索过程仅搜索HMVP表的元素的子集。
C20.根据解决方案C5的方法,其中,存储在HMVP表中的运动矢量不引用当前图片。
C21.根据解决方案C5的方法,其中,在存储在HMVP表中的运动矢量不引用并置图片的情况下,将存储在HMVP表中的运动矢量缩放到并置图片。
C22.根据解决方案C1的方法,其中,将运动矢量设置为特定临近块的特定运动矢量。
C23.根据解决方案C22的方法,其中,临近块(A0)的右上角与当前块的左下角直接相邻,或者临近块(A1)的右下角与当前块的左下角直接相邻,或者临近块(B0)的左下角与当前块的右上角直接相邻,或者临近块(B1)的右下角与当前块的右上角直接相邻,或者临近块(B2)的右下角与当前块的左上角直接相邻。
C24.根据解决方案C1的方法,其中,在特定临近块不存在的情况下,将运动矢量设置为默认运动矢量。
C25.根据解决方案C1的方法,其中,在未对特定的临近块进行帧间编码的情况下,将运动矢量设置为默认运动矢量。
C26.根据解决方案C22的方法,其中,特定运动矢量引用参考列表0。
C27.根据解决方案C22的方法,其中,特定运动矢量引用参考列表1。
C28.根据解决方案C22的方法,其中,特定运动矢量引用参考列表0中的特定参考图片。
C29.根据解决方案C22的方法,其中,特定运动矢量引用参考列表1中的特定参考图片。
C30.根据解决方案C28或C29的方法,其中,特定参考图片具有索引0。
C31.根据解决方案C22或C23的方法,其中,特定运动矢量引用并置图片。
C32.根据解决方案C22或C23的方法,其中在特定临近块不引用并置图片的情况下,将运动矢量设置为默认运动矢量。
C33.根据解决方案C24至C32中的任一项的方法,其中,默认运动矢量是(0,0)。
C34.根据解决方案C1的方法,其中,在无法找到存储在特定临近块中的特定运动矢量的情况下,将运动矢量设置为默认运动矢量。
C35.根据解决方案22的方法,其中在特定运动矢量不引用并置图片的情况下,将特定运动矢量缩放到并置图片。
C36.根据解决方案C22的方法,其中,特定运动矢量不引用当前图片。
C37.根据解决方案C1至C36中的任一项的方法,转换从比特流表示生成当前块。
C38.根据解决方案C1至C36中任一项的方法,其中,转换从当前块生成比特流表示。
C39.根据解决方案C1至C36中任一项的方法,其中,执行转换包括基于一个或多个解码规则来解析比特流表示。
C40.一种视频系统中的装置,包括处理器和其上具有指令的非暂时性存储器,其中,指令在由处理器执行时使处理器实现解决方案C1至C39中的一项或多项的方法。
C41.一种存储在非暂时性计算机可读介质上的计算机程序产品,计算机程序产品包括用于进行解决方案C1至C39中的一项或多项的方法的程序代码。
在一些实施例中,可以实现以下技术解决方案:
D1.一种视频处理方法,包括:对于视频的当前块和视频的比特流表示之间的转换,基于是否对当前块的转换启用仿射预测,来确定是否将零运动仿射Merge候选插入子块Merge候选列表中;以及基于确定来执行转换。
D2.根据解决方案D1的方法,其中,在比特流表示中的仿射使用标志为关闭的情况下,不将零运动仿射Merge候选插入到子块Merge候选列表中。
D3.根据解决方案D2的方法,还包括:在仿射使用标志为关闭的情况下,将作为非仿射候选的默认运动矢量候选插入到子块Merge候选列表中。
D4.一种视频处理方法,包括:对于使用子块Merge候选列表的视频的当前块和视频的比特流表示之间的转换,在子块Merge候选列表未满的情况下,将零运动非仿射填充候选插入到子块Merge候选列表中;以及在插入之后执行转换。
D5.根据解决方案D4的方法,还包括:将当前块的仿射使用标志设置为零。
D6.根据解决方案D4的方法,其中,插入还基于比特流表示中的仿射使用标志是否关闭。
D7.一种视频处理方法,包括:对于视频的当前块和视频的比特流表示之间的转换,使用规则来确定运动矢量,所述规则确定运动矢量是从覆盖并置图片中对应位置的块的一个或多个运动矢量中推导的;以及基于运动矢量来执行转换。
D8.根据解决方案D7的方法,其中,一个或多个运动矢量包括分别表示参考列表0和参考列表D1中的运动矢量的MV0和MV1,并且其中要推导的运动矢量包括表示参考列表0和参考列表1中的运动矢量的MV0'和MV1'。
D9.根据解决方案D8的方法,其中,在并置图片在参考列表0中的情况下,基于MV0来推导MV0'和MV1'。
D10.根据解决方案D8的方法,其中,在并置图片在参考列表1中的情况下,基于MV1来推导MV0'和MV1'。
D11.根据解决方案D1至D10中的任一项的方法,转换从比特流表示生成当前块。
D12.根据解决方案D1至D10中的任一项的方法,其中,转换从当前块生成比特流表示。
D13.根据解决方案D1至D10中的任一项的方法,其中,执行转换包括基于一个或多个解码规则来解析比特流表示。
D14.一种视频系统中的装置,包括处理器和其上具有指令的非暂时性存储器,其中,指令在由处理器执行时使处理器实现解决方案D1至D13中的一项或多项的方法。
D15.一种存储在非暂时性计算机可读介质上的计算机程序产品,计算机程序产品包括用于进行解决方案D1至D13中的一项或多项的方法的程序代码。
本文档中描述公开和其他解决方案、示例、实施例、模块和功能操作可以在数字电子电路、或计算机软件、固件或硬件中实现,包括本文档中所公开的结构及其结构等效体,或其中一个或多个的组合。本说明中描述的主题的实现可以实现为一个或多个计算机程序产品,即一个或多个编码在有形的且非易失的计算机可读介质上的计算机程序指令的模块,以供数据处理装置执行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储设备、影响机器可读传播信号的物质组成或其中一个或其中多个的组合。术语“数据处理单元”或“数据处理装置”包括用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机或多处理器或计算机组。除硬件外,该装置还可以包括为计算机程序创建执行环境的代码,例如,构成处理器固件的代码、协议栈、数据库管理系统、操作系统或其中一个或多个的组合。传播的信号是人为生成的信号,例如,机器生成的电、光或电磁信号,其被生成以编码信息以传输到合适的接收器设备。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言(包括编译语言或解释语言)编写,并且可以以任何形式部署,包括作为独立程序或作为模块、组件、子程序或其他适合在计算环境中使用的单元。计算机程序不一定与文件系统中的文件对应。程序可以存储在保存其他程序或数据的文件的部分中(例如,存储在标记语言文档中的一个或多个脚本)、专用于该程序的单个文件中、或多个协调文件(例如,存储一个或多个模块、子程序或部分代码的文件)中。计算机程序可以部署在一台或多台计算机上来执行,这些计算机位于一个站点上或分布在多个站点上,并通过通信网络互连。
本说明书中描述的处理和逻辑流可以通过一个或多个可编程处理器执行,该处理器执行一个或多个计算机程序,通过在输入数据上操作并生成输出来执行功能。处理和逻辑流也可以通过特殊用途的逻辑电路来执行,并且装置也可以实现为特殊用途的逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
例如,适于执行计算机程序的处理器包括通用和专用微处理器,以及任何类型数字计算机的任何一个或多个。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是执行指令的处理器和存储指令和数据的一个或多个存储设备。通常,计算机还将包括一个或多个用于存储数据的大容量存储设备,例如,磁盘、磁光盘或光盘,或通过操作耦合到一个或多个大容量存储设备来从其接收数据或将数据传输到一个或多个大容量存储设备,或两者兼有。然而,计算机不一定具有这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如,内部硬盘或可移动硬盘;磁光盘;以及CD ROM和DVD ROM盘。处理器和存储器可以由专用逻辑电路来补充,或合并到专用逻辑电路中。
虽然本专利文件包含许多细节,但不应将其解释为对任何主题或权利要求范围的限制,而应解释为对特定技术的特定实施例的特征的描述。本专利文件在单独实施例的上下文描述的某些特征也可以在单个实施例中组合实施。相反,在单个实施例的上下文中描述的各种功能也可以在多个实施例中单独实施,或在任何合适的子组合中实施。此外,尽管上述特征可以描述为在某些组合中起作用,甚至最初要求是这样,但在某些情况下,可以从组合中移除权利要求组合中的一个或多个特征,并且权利要求的组合可以指向子组合或子组合的变体。
同样,尽管附图中以特定顺序描述了操作,但这不应理解为要获得想要的结果必须按照所示的特定顺序或顺序执行此类操作,或执行所有说明的操作。此外,本专利文件所述实施例中各种系统组件的分离不应理解为在所有实施例中都需要这样的分离。
仅描述了一些实现和示例,其他实现、增强和变体可以基于本专利文件中描述和说明的内容做出。

Claims (32)

1.一种视频处理方法,包括:
对于视频的当前块与所述视频的比特流表示之间的转换,基于在所述转换期间是否启用时域运动矢量预测(TMVP)或是否将当前图片参考(CPR)编解码模式用于所述转换,确定基于子块的Merge候选列表中的最大候选数(ML)和/或是否将基于子块的时域运动矢量预测(SbTMVP)候选添加到所述基于子块的Merge候选列表中;以及
基于所述确定执行所述转换。
2.根据权利要求1所述的方法,其中在禁用所述TMVP工具或禁用SbTMVP工具的情况下,禁用所述SbTMVP候选的使用。
3.根据权利要求2所述的方法,其中确定ML包括:
基于是否禁用所述SbTMVP工具或所述TMVP工具,从所述基于子块的Merge候选列表中排除所述SbTMVP候选。
4.一种视频处理方法,包括:
对于视频的当前块与所述视频的比特流表示之间的转换,基于是否在所述转换期间启用时域运动矢量预测(TMVP)、基于子块的时域运动矢量预测(SbTMVP)和仿射编解码模式,确定基于子块的Merge候选列表中的最大候选数(ML);以及
基于所述确定执行所述转换。
5.根据权利要求4所述的方法,其中,在启用所述仿射编解码模式的情况下,动态设置ML并在所述比特流表示中用信令通知ML。
6.根据权利要求4所述的方法,其中,在禁用所述仿射编解码模式的情况下,预先定义ML。
7.根据权利要求2或6所述的方法,其中确定ML包括:
在禁用所述TMVP工具、启用SbTMVP工具并且禁用所述当前块的仿射编解码模式的情况下,将ML设置为零。
8.根据权利要求2或6所述的方法,其中确定ML包括:
在启用SbTMVP工具、启用所述TMVP工具并且禁用所述当前块的仿射编解码模式的情况下,将ML设置为一。
9.根据权利要求1所述的方法,其中,在禁用SbTMVP工具或者所述当前块的当前图片的并置参考图片是所述当前图片的情况下,禁用所述SbTMVP候选的所述使用。
10.根据权利要求9所述的方法,其中,确定ML包括:
基于是否禁用所述SbTMVP工具或所述当前图片的所述并置参考图片是否是所述当前图片,从所述基于子块的Merge候选列表中排除所述SbTMVP候选。
11.根据权利要求9所述的方法,其中,确定ML包括:
在所述当前图片的所述并置参考图片是所述当前图片并且禁用所述当前块的仿射编码的情况下,将ML设置为零。
12.根据权利要求9所述的方法,其中,确定ML包括:
在启用所述SbTMVP工具、所述当前图片的所述并置参考图片不是所述当前图片,并且禁用所述当前块的仿射编码的情况下,将ML设置为一。
13.根据权利要求1所述的方法,其中在禁用SbTMVP工具或参考图片列表0(L0)中参考图片索引为0的参考图片是所述当前块的当前图片的情况下,禁用所述SbTMVP候选的所述使用。
14.根据权利要求13所述的方法,其中确定ML包括:
基于是否禁用所述SbTMVP工具或L0中参考图片索引为0的所述参考图片是否是所述当前图片,从所述基于子块的Merge候选列表中排除所述SbTMVP候选。
15.根据权利要求13所述的方法,其中确定ML包括:
在启用所述SbTMVP工具、L0中参考图片索引为0的所述参考图片是所述当前图片,并且禁用所述当前块的仿射编码的情况下,将ML设置为零。
16.根据权利要求13所述的方法,其中确定ML包括:
在启用所述SbTMVP工具、L0中参考图片索引为0的所述参考图片不是所述当前图片,并且禁用所述当前块的仿射编码的情况下,将ML设置为一。
17.根据权利要求1所述的方法,其中,在禁用SbTMVP工具或者参考图片列表1(L1)中参考图片索引为0的参考图片是所述当前块的当前图片的情况下,禁用所述SbTMVP候选的所述使用。
18.根据权利要求17所述的方法,其中确定ML包括:
基于是否禁用所述SbTMVP工具或L1中参考图片索引为0的所述参考图片是否是所述当前图片,从所述基于子块的Merge候选列表中排除所述SbTMVP候选。
19.根据权利要求17所述的方法,其中,确定ML包括:
在启用所述SbTMVP工具、L1中参考图片索引为0的所述参考图片是所述当前图片,并且禁用所述当前块的仿射编码的情况下,将ML设置为零。
20.根据权利要求17所述的方法,其中,确定ML包括:
在启用所述SbTMVP工具、L1中参考图片索引为0的所述参考图片不是所述当前图片,并且禁用所述当前块的仿射编码的情况下,将ML设置为一。
21.一种视频处理方法,包括:
对于视频的第一视频片段的当前块与所述视频的比特流表示之间的转换,确定由于时域运动矢量预测(TMVP)模式在第一视频段级别被禁用而对所述转换禁用基于子块的运动矢量预测(SbTMVP)模式;以及
基于所述确定执行所述转换,
其中,所述比特流表示符合格式,所述格式指定是否包括所述SbTMVP模式的指示和/或所述SbTMVP模式的指示在Merge候选列表中相对于所述TMVP模式的指示的位置。
22.根据权利要求21所述的方法,其中,所述第一视频片段是序列、条带、片或图片。
23.根据权利要求21所述的方法,其中,由于在第一视频段级别上包括所述TMVP模式的所述指示,所述格式指定省略所述SbTMVP模式的所述指示。
24.根据权利要求21所述的方法,其中,所述格式指定所述SbTMVP模式的所述指示以解码顺序在所述第一视频片段级别处于所述TMVP模式的所述指示之后。
25.根据权利要求21至24中任一项所述的方法,其中,在所述TMVP模式被指示为禁用的情况下,所述格式指定省略所述SbTMVP模式的所述指示。
26.根据权利要求21所述的方法,其中,所述格式指定在所述视频的序列级别处包括所述SbTMVP模式的所述指示,并且在第二视频片段级别处省略所述SbTMVP模式的所述指示。
27.根据权利要求26所述的方法,其中,处于所述第二视频片段级别的第二视频片段是条带、片或图片。
28.根据权利要求1至27中任一项所述的方法,所述转换从所述比特流表示生成所述当前块。
29.根据权利要求1至27中任一项所述的方法,其中,所述转换从所述当前块生成所述比特流表示。
30.根据权利要求1至27中任一项所述的方法,其中,执行所述转换包括基于一个或多个解码规则来解析所述比特流表示。
31.一种视频系统中的装置,包括处理器和其上具有指令的非暂时性存储器,其中所述指令在由所述处理器执行时使所述处理器实现权利要求1至30中的一项或多项所述的方法。
32.一种存储在非暂时性计算机可读介质上的计算机程序产品,所述计算机程序产品包括用于进行权利要求1至30中的一项或多项所述的方法的程序代码。
CN201980076059.XA 2018-11-22 2019-11-22 基于子块的帧间预测的协调方法 Active CN113056920B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311821092.5A CN117692634A (zh) 2018-11-22 2019-11-22 数字视频编解码的装置、方法和计算机可读记录介质

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
CNPCT/CN2018/116889 2018-11-22
CN2018116889 2018-11-22
CNPCT/CN2018/125420 2018-12-29
CN2018125420 2018-12-29
CN2019100396 2019-08-13
CNPCT/CN2019/100396 2019-08-13
CNPCT/CN2019/107159 2019-09-22
CN2019107159 2019-09-22
PCT/CN2019/120301 WO2020103940A1 (en) 2018-11-22 2019-11-22 Coordination method for sub-block based inter prediction

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202311821092.5A Division CN117692634A (zh) 2018-11-22 2019-11-22 数字视频编解码的装置、方法和计算机可读记录介质

Publications (2)

Publication Number Publication Date
CN113056920A true CN113056920A (zh) 2021-06-29
CN113056920B CN113056920B (zh) 2024-05-24

Family

ID=

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210337199A1 (en) * 2019-01-09 2021-10-28 Huawei Technologies Co., Ltd. Sub-picture Position Constraints In Video Coding

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130243093A1 (en) * 2012-03-16 2013-09-19 Qualcomm Incorporated Motion vector coding and bi-prediction in hevc and its extensions
US20130336407A1 (en) * 2012-06-15 2013-12-19 Qualcomm Incorporated Temporal motion vector prediction in hevc and its extensions
WO2014166109A1 (en) * 2013-04-12 2014-10-16 Mediatek Singapore Pte. Ltd. Methods for disparity vector derivation
CN104768015A (zh) * 2014-01-02 2015-07-08 联发科技(新加坡)私人有限公司 视频编码方法及装置
US20160100189A1 (en) * 2014-10-07 2016-04-07 Qualcomm Incorporated Intra bc and inter unification
CN105493505A (zh) * 2014-06-19 2016-04-13 微软技术许可有限责任公司 统一的帧内块复制和帧间预测模式
CN107079157A (zh) * 2014-09-12 2017-08-18 Vid拓展公司 用于视频编码的分量间去相关
WO2018030773A1 (ko) * 2016-08-11 2018-02-15 한국전자통신연구원 영상 부호화/복호화 방법 및 장치
US20180199057A1 (en) * 2017-01-12 2018-07-12 Mediatek Inc. Method and Apparatus of Candidate Skipping for Predictor Refinement in Video Coding
WO2018129539A1 (en) * 2017-01-09 2018-07-12 Qualcomm Incorporated Encoding optimization with illumination compensation and integer motion vector restriction
GB201815564D0 (en) * 2018-09-21 2018-11-07 Canon Kk Video coding and decoding

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130243093A1 (en) * 2012-03-16 2013-09-19 Qualcomm Incorporated Motion vector coding and bi-prediction in hevc and its extensions
CN104170381A (zh) * 2012-03-16 2014-11-26 高通股份有限公司 在高效率视频译码及其扩展中的运动矢量译码及双向预测
US20130336407A1 (en) * 2012-06-15 2013-12-19 Qualcomm Incorporated Temporal motion vector prediction in hevc and its extensions
WO2014166109A1 (en) * 2013-04-12 2014-10-16 Mediatek Singapore Pte. Ltd. Methods for disparity vector derivation
CN104768015A (zh) * 2014-01-02 2015-07-08 联发科技(新加坡)私人有限公司 视频编码方法及装置
CN105493505A (zh) * 2014-06-19 2016-04-13 微软技术许可有限责任公司 统一的帧内块复制和帧间预测模式
CN107079157A (zh) * 2014-09-12 2017-08-18 Vid拓展公司 用于视频编码的分量间去相关
US20160100189A1 (en) * 2014-10-07 2016-04-07 Qualcomm Incorporated Intra bc and inter unification
WO2018030773A1 (ko) * 2016-08-11 2018-02-15 한국전자통신연구원 영상 부호화/복호화 방법 및 장치
WO2018129539A1 (en) * 2017-01-09 2018-07-12 Qualcomm Incorporated Encoding optimization with illumination compensation and integer motion vector restriction
US20180199057A1 (en) * 2017-01-12 2018-07-12 Mediatek Inc. Method and Apparatus of Candidate Skipping for Predictor Refinement in Video Coding
GB201815564D0 (en) * 2018-09-21 2018-11-07 Canon Kk Video coding and decoding

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BENJAMIN BROSS等: "Versatile Video Coding (Draft 3)", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 12TH MEETING: MACAO, CN, 3–12 OCT. 2018, DOCUMENT: JVET-L1001》 *
NA ZHANG等: "CE4.4.11: Combined Average Merge Candidates", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 12TH MEETING: MACAO, CN, 3–12 OCT. 2018, DOCUMENT: JVET-L0071》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210337199A1 (en) * 2019-01-09 2021-10-28 Huawei Technologies Co., Ltd. Sub-picture Position Constraints In Video Coding

Also Published As

Publication number Publication date
JP7319365B2 (ja) 2023-08-01
CN113170198B (zh) 2022-12-09
CN113170198A (zh) 2021-07-23
US11140386B2 (en) 2021-10-05
CN117692634A (zh) 2024-03-12
KR20210090176A (ko) 2021-07-19
US20210160531A1 (en) 2021-05-27
EP3857896A4 (en) 2021-12-01
KR102660160B1 (ko) 2024-04-24
US20210152816A1 (en) 2021-05-20
EP3857896A1 (en) 2021-08-04
US11632541B2 (en) 2023-04-18
WO2020103942A1 (en) 2020-05-28
CN113056916A (zh) 2021-06-29
EP4325849A3 (en) 2024-04-17
JP2024038053A (ja) 2024-03-19
KR20240024335A (ko) 2024-02-23
WO2020103943A1 (en) 2020-05-28
US20240107007A1 (en) 2024-03-28
EP4325849A2 (en) 2024-02-21
US11671587B2 (en) 2023-06-06
JP2023156316A (ja) 2023-10-24
JP2022507590A (ja) 2022-01-18
WO2020103940A1 (en) 2020-05-28
US20210274188A1 (en) 2021-09-02
CN113056915B (zh) 2024-03-26
US20210377521A1 (en) 2021-12-02
WO2020103944A1 (en) 2020-05-28
US11431964B2 (en) 2022-08-30
CN113056915A (zh) 2021-06-29
US20210185346A1 (en) 2021-06-17

Similar Documents

Publication Publication Date Title
CN113170198B (zh) 子块时域运动矢量预测
CN114467308B (zh) 视频处理中的参考图片重采样
CN113853793A (zh) 基于光流的帧间编码的语法信令
US11871025B2 (en) Motion precision in sub-block based inter prediction
CN113261292B (zh) 基于子块的帧间预测中默认运动候选的构造方法
CN113056920B (zh) 基于子块的帧间预测的协调方法
WO2021027862A1 (en) Motion precision in sub-block based inter prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant