CN113950840A - 帧内块复制编解码的块的Merge候选的约束 - Google Patents

帧内块复制编解码的块的Merge候选的约束 Download PDF

Info

Publication number
CN113950840A
CN113950840A CN202080038735.7A CN202080038735A CN113950840A CN 113950840 A CN113950840 A CN 113950840A CN 202080038735 A CN202080038735 A CN 202080038735A CN 113950840 A CN113950840 A CN 113950840A
Authority
CN
China
Prior art keywords
ibc
video
candidates
merge
maximum number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080038735.7A
Other languages
English (en)
Inventor
张莉
许继征
张凯
刘鸿彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Original Assignee
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd, ByteDance Inc filed Critical Beijing ByteDance Network Technology Co Ltd
Publication of CN113950840A publication Critical patent/CN113950840A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

描述了用于在使用块矢量信令通知和/或Merge候选时的基于帧内块编解码的视频的解码或编码的方法、装置和系统。用于视频处理的示例方法包括:在视频的视频区域和所述视频的比特流表示之间进行转换,其中,所述比特流表示基于在所述视频区域的转换期间使用的第一类型的IBC候选的最大数量,选择性地包括帧内块复制(IBC)高级运动矢量预测(AMVP)模式的运动矢量差(MVD)有关的语法元素,其中,当应用IBC模式时,从对应于所述视频区域的视频图片中的其它样点来预测所述视频区域的样点。

Description

帧内块复制编解码的块的Merge候选的约束
相关申请的交叉引用
根据适用的专利法和/或巴黎公约的规定,提出本申请是为了及时要求于2019年5月25日提交的国际专利申请第PCT/CN2019/088454号的优先权和权益。出于法律的所有目的,上述申请的全部公开内容通过引用并入作为本申请公开内容的一部分。
技术领域
本文件涉及视频和图像编解码和解码技术。
背景技术
数字视频仍占据因特网和其它数字通信网络上的最大的带宽使用。随着能够接收和显示视频的所连接的用户设备的数量增加,预计数字视频使用的带宽需求将继续增长。
发明内容
公开的技术可由视频或图像解码器或编码器实施例使用,其中在使用块矢量信令通知和/或Merge候选时,进行基于帧内块编解码的视频的解码或编码。
在一个代表性方面,公开了一种视频处理方法。该方法包括:在视频的视频区域和所述视频的比特流表示之间进行转换,其中,所述比特流表示基于所述视频区域的转换期间使用的第一类型的IBC候选的最大数量,选择性地包括帧内块复制(IBC)高级运动矢量预测(AMVP)模式的运动矢量差(MVD)有关的语法元素,其中,当应用IBC模式时,从对应于所述视频区域的视频图片中的其它样点来预测所述视频区域的样点。
在另一个代表性方面,公开了一种视频处理方法。该方法包括:对于视频的视频区域和所述视频的比特流表示之间的转换,确定对所述视频区域禁用帧内块复制(IBC)模式的使用并在所述视频的序列级启用所述IBC模式的使用的指示,以及基于所述确定进行所述转换,其中,当应用了所述IBC模式时,从对应于所述视频区域的视频图片中的其它样点来预测所述视频区域的样点。
在又一个代表性方面,公开了一种视频处理方法。该方法包括:在视频的视频区域和所述视频的比特流表示之间进行转换,其中,所述比特流表示基于所述视频区域的转换期间使用的第一类型的IBC候选的最大数量选择性地包括关于帧内块复制(IBC)模式的使用的指示和/或一个或多个IBC有关的语法元素,其中,当应用了所述IBC模式时,从对应于所述视频区域的视频图片中的其它样点来预测所述视频区域的样点。
在又一个代表性方面,公开了一种视频处理方法。该方法包括:在视频的视频区域和所述视频的比特流表示之间进行转换,其中,在所述视频区域的转换期间使用的第一类型的帧内块复制(IBC)候选的最大数量的指示,独立于在所述转换期间使用的帧间模式的Merge候选的最大数量在所述比特流表示中信令通知,其中,当应用了所述IBC模式时,从对应于所述视频区域的视频图片中的其它样点来预测所述视频区域的样点。
在又一个代表性方面,公开了一种视频处理方法。该方法包括:在视频的视频区域和所述视频的比特流表示之间进行转换,其中,在所述视频区域的转换期间使用的帧内块复制(IBC)运动候选的最大数量(表示为maxIBCCandNum)是IBC Merge候选的最大数量(表示为maxIBCMrgNum)和IBC高级运动矢量预测(AMVP)候选的最大数量(表示为maxIBCAMVPNum)的函数,其中,当应用了所述IBC模式时,从对应于所述视频区域的视频图片中的其它样点来预测所述视频区域的样点。
在又一个代表性方面,公开了一种视频处理方法。该方法包括:在视频的视频区域和所述视频的比特流表示之间进行转换,其中,在所述视频区域的转换期间使用的帧内块复制(IBC)运动候选的最大数量(表示为maxIBCCandNum)基于所述视频区域的编解码的模式信息。
在又一个代表性方面,公开了一种视频处理方法。该方法包括:在视频的视频区域和所述视频的比特流表示之间进行转换,其中,解码的帧内块复制(IBC)高级运动矢量预测(AMVP)Merge索引或解码的IBC Merge索引小于帧内块复制(IBC)运动候选的最大数量(表示为maxIBCCandNum)。
在又一个代表性方面,公开了一种视频处理方法。该方法包括:在视频的视频区域和所述视频的比特流表示之间的转换期间,确定帧内块复制(IBC)替代运动矢量预测器(AMVP)候选索引或IBC Merge候选索引无法识别在块矢量候选列表中的块矢量候选,以及基于所述确定在所述转换期间使用默认预测块。
在又一个代表性方面,公开了一种视频处理方法。该方法包括:在视频的视频区域和所述视频的比特流表示之间的转换期间,确定帧内块复制(IBC)替代运动矢量预测器(AMVP)候选索引或IBC Merge候选索引无法识别在块矢量候选列表中的块矢量候选,以及基于所述确定通过将所述视频区视为具有无效块矢量进行所述转换。
在又一个代表性方面,公开了一种视频处理方法。该方法包括:在视频的视频区域和所述视频的比特流表示之间的转换期间,确定帧内块复制(IBC)替代运动矢量预测器(AMVP)候选索引或IBC Merge候选索引无法满足条件,基于所述确定生成补充块矢量(BV)候选列表,以及使用所述补充BV候选列表进行所述转换。
在又一个代表性方面,公开了一种视频处理方法。该方法包括:在视频的视频区域和所述视频的比特流表示之间进行转换,其中,帧内块复制(IBC)高级运动矢量预测(AMVP)候选的最大数量(表示为maxIBCAMVPNum)不等于二。
在另一个示例方面,上述方法可以由包括处理器的视频解码器设备实现。
在另一个示例方面,上述方法可以由包括处理器的视频编码器设备实现。
在又一个示例方面,这些方法可以以处理器可执行指令的形式实现并存储在计算机可读程序介质上。
这些和其它方面将在本文件中进一步描述。
附图说明
图1示出了用于Merge候选列表构建的导出过程的示例。
图2示出了空域Merge候选的示例位置。
图3示出了考虑用于空域Merge候选的冗余检查的候选对的示例。
图4A和4B示出了Nx2N和2NxN分割的第二预测单元(PU)的位置的示例。
图5是对于时域Merge候选的运动矢量缩放的图示。
图6示出了时域Merge候选C0和C1的候选位置的示例。
图7示出了组合的双向预测Merge候选的示例。
图8总结了运动矢量预测候选的导出过程。
图9是对于空域运动矢量候选的运动矢量缩放的图示。
图10A和10B分别示出了4-参数仿射运动模型和6-参数仿射运动模型。
图11是每个子块的仿射运动矢量场(MVF)的示例。
图12示出了仿射Merge模式的候选位置的示例
图13示出了修改的Merge列表构建过程的示例。
图14示出了基于三角分割的帧间预测的示例。
图15示出了最终运动矢量表达(UMVE)搜索过程的示例。
图16示出了UMVE搜索点的示例。
图17示出了在DMVR中的list 0和list 1之间镜像的MVD(0,1)的示例。
图18示出了可以在一次迭代中检查的MV的示例。
图19示出了帧内块复制(IBC)的示例。
图20A-20K是用于视频处理的方法的示例的流程图。
图21是视频处理设备的示例的框图。
图22是其中可以实现所公开的技术的示例视频处理系统的框图。
具体实施方式
本文件提供了可由图像或视频比特流的解码器使用的各种技术,以提高解压缩的或解码的数字视频或图像的质量。为简便起见,本文使用术语“视频”既包括图片序列(传统上称为视频),也包括单个图像。此外,视频编码器还可在编码过程期间实现这些技术,以便重建用于进一步编码的解码帧。
在本文件中使用章节标题是为了易于理解,并且不将实施例和技术限于相应的章节。因此,一个章节的实施例可以与其它章节的实施例组合。
1.概要
本发明涉及视频编解码技术。具体而言,其涉及运动矢量编解码。它可以应用于像HEVC之类的现有的视频编解码标准或者待最终确定的标准(通用视频编解码)。它也可以适用于未来的视频编解码标准或视频编解码器。
2.背景
视频编解码标准主要是通过众所周知的ITU-T和ISO/IEC标准的发展而得以演进。ITU-T制作了H.261和H.263标准,ISO/IEC制作了MPEG-1和MPEG-4Visual标准,并且两个组织联合制作了H.262/MPEG-2视频标准和H.264/MPEG-4高级视频编解码(Advanced VideoCoding,AVC)标准和H.265/HEVC标准。从H.262开始,视频编解码标准基于混合视频编解码结构,其中利用时域预测加变换编解码。为了探索HEVC之外的未来视频编解码技术,由VCEG和MPEG于2015年联合成立联合视频探索团队(JVET)。从那时起,JVET采用了许多新方法并将其纳入名为联合探索模型(JEM)的参考软件。2018年4月,VCEG(Q6/16)和ISO/IEC JTC1SC29/WG11(MPEG)之间的联合视频专家团队(JVET)成立,致力于VVC标准,目标是与HEVC相比降低50%比特率。
最新版本的VVC草案,即多功能视频编解码(草案5)可以在以下位置找到:
phenix.it-sudparis.eu/jvet/doc_end_user/documents/14_Geneva/wg11/JVET-N1001-v2.zip
名为VTM的VVC的最新参考软件可以在以下位置找到:
vcgit.hhi.fraunhofer.de/jvet/VVCSoftware_VTM/tags/VTM-5.0
2.1HEVC/H.265中的帧间预测
对于帧间编解码的编解码单元(CU),其可以根据分割模式以一个预测单元(PU)、两个PU进行编解码。每个帧间预测的PU具有对于一个或两个参考图片列表的运动参数。运动参数包括运动矢量和参考图片索引。也可以使用inter_pred_idc来信令通知对两个参考图片列表中一个的使用。运动矢量可以明确地被编解码为相对于预测器的增量。
当使用跳过(skip)模式来编解码CU时,一个PU与该CU相关联,并且不存在显著的残差系数,不存在编解码的运动矢量增量或参考图片索引。指定Merge模式,由此从相邻PU——包括空域和时域候选——获得用于当前PU的运动参数。Merge模式可以应用于任何帧间预测的PU,而不仅适用于跳过模式。Merge模式的替代方案是运动参数的显式传输(explicit transmission),其中,运动矢量(更确切地,相比于运动矢量预测器的运动矢量差(MVD))、每个参考图片列表的对应参考图片索引以及参考图片列表使用对每个PU被显式信令通知。这样的模式在本公开中被命名为高级运动矢量预测(AMVP)。
当信令通知指示要使用两个参考图片列表中的一个时,PU从一个块的样点产生。这被称为“单向预测”。单向预测可用于P条带和B条带。
当信令通知指示要使用两个参考图片列表时,PU从两个块的样点产生。这被称为“双向预测”。双向预测仅可用于B条带。
下文提供了在HEVC中规定的帧间预测模式的详细信息。说明将从Merge模式开始。
2.1.1参考图片列表
在HEVC中,术语帧间预测用于表示从当前解码的图片以外的参考图片的数据元素(例如,样点值或运动矢量)导出的预测。像在H.264/AVC中一样,可以从多个参考图片来预测图片。用于帧间预测的参考图片被组织在一个或多个参考图片列表中。参考索引识别应使用列表中的哪些参考图片来创建预测信号。
单个参考图片列表——list 0(List 0)被用于P条带,并且两个参考图片列表——list 0(List 0)和list 1(List 1)被用于B条带。应当注意,就捕获/显示顺序而言,list 0/1中包含的参考图片可以是来自过去和将来的图片。
2.1.2Merge模式
2.1.2.1Merge模式的候选的导出
当使用Merge模式预测PU时,从比特流解析出指向Merge候选列表(Mergecandidates list)中的条目的索引,并且该索引被用于检索运动信息。该列表的构建在HEVC标准中规定并可以根据以下步骤顺序进行总结:
步骤1:初始候选导出
步骤1.1:空域候选导出
步骤1.2:空域候选的冗余检查
步骤1.3:时域候选导出
步骤2:附加候选插入
步骤2.1:创建双向预测候选
步骤2.2:插入零运动候选
在图1中也示意性地描绘了这些步骤。对于空域Merge候选导出,在位于五个不同位置的候选中选择最多四个Merge候选。对于时域Merge候选导出,在两个候选中选择最多一个Merge候选。由于在解码器处假设每个PU的候选的数量为常数,因此当从步骤1获得的候选的数量未达到在条带头中信令通知的Merge候选的最大数量(MaxNumMergeCand)时,生成附加的候选。由于候选的数量是恒定的,因此使用截断一元二值化(TU)来编码最佳Merge候选的索引。如果CU的尺寸等于8,则当前CU的所有PU共享单个Merge候选列表,该单个Merge候选列表与2N×2N预测单元的Merge候选列表相同。
在下文中,详细描述了与前述步骤相关联的操作。
图1示出了Merge候选列表构建的导出过程的示例。
2.1.2.2空域候选导出
在空域Merge候选的导出中,在位于图2中描绘的位置中的候选中选择最多四个Merge候选。导出的顺序是A1、B1、B0、A0和B2。仅当位置A1、B1、B0、A0的任何PU不可用时(例如,因为该PU属于另一个条带(slice)或片(tile))或者是帧内编解码时,才考虑位置B2。在添加位置A1处的候选之后,对剩余候选的添加进行冗余检查,该冗余检查确保具有相同运动信息的候选被排除在列表之外,从而改进编解码效率。为了降低计算复杂度,在所提到的冗余检查中并未考虑所有可能的候选对。相反,仅考虑与图3中的箭头链接的对,并且仅当如果用于冗余检查的对应候选具有不同的运动信息时,则该候选才被添加到列表中。重复的运动信息的另一个来源是与不同于2Nx2N的分割相关联的“第二PU”。作为示例,图4分别描绘了对于N×2N和2N×N的情况的第二PU。当当前PU被分割为N×2N时,位置A1处的候选不被考虑用于列表构建。事实上,通过添加该候选将导致具有相同运动信息的两个预测单元,这对于在编解码单元中仅具有一个PU是冗余的。类似地,当当前PU被分割为2N×N时,不考虑位置B1
图2示出了空域Merge候选的示例位置。
图3示出了考虑用于空域Merge候选的冗余检查的候选对的示例。
图4示出了Nx2N和2NxN分割的第二PU的位置的示例。
2.1.2.3时域候选导出
在此步骤中,只有一个候选被添加到列表中。特别地,在该时域Merge候选的导出中,基于共位(co-located)的PU来导出缩放的运动矢量,该共位的PU属于相对于给定参考图片列表内的当前图片具有最小POC差的图片。在条带头中显式信令通知用于共位的PU的导出的参考图片列表。如图5中虚线所示,获得了用于时域Merge候选的缩放的运动矢量,该用于时域Merge候选的缩放的运动矢量使用POC距离tb和td而从共位的PU的运动矢量被缩放,其中tb被定义为当前图片的参考图片与该当前图片之间的POC差,并且td被定义为共位图片的参考图片与该共位图片之间的POC差。时域Merge候选的参考图片索引被设置为等于零。在HEVC规范中描述了缩放过程的实际实现。对于B条带,获得两个运动矢量并将其组合以产生双向预测Merge候选,该两个运动矢量中的一个用于参考图片list 0(list 0)而另一个用于参考图片list 1(list 1)。
图5示出了对于时域Merge候选的运动矢量缩放的图示。
如图6所示,在属于参考帧的共位的PU(Y)中,在候选C0和C1之间选择用于时域候选的位置。如果位置C0处的PU不可用、被帧内编解码或在当前编解码树单元(CTU,即LCU,最大编解码单元)之外,则使用位置C1。否则,在时域Merge候选的导出中使用位置C0
图6示出了时域Merge候选C0和C1的候选位置的示例。
2.1.2.4附加候选插入
除了空域和时域Merge候选之外,还存在两种附加类型的Merge候选:组合的双向预测Merge候选和零Merge候选。通过利用空域和时域Merge候选来生成组合的双向预测Merge候选。组合的双向预测Merge候选仅用于B条带。通过将初始候选的第一参考图片列表运动参数与另一个候选的第二参考图片列表运动参数进行组合来生成组合的双向预测候选。如果这两个元组(tuple)提供不同的运动假设,则它们将形成一个新的双向预测候选。作为示例,图7描绘了以下情况,在该情况中原始列表(在左方)中具有mvL0和refIdxL0或mvL1和refIdxL1的两个候选被用于创建组合的双向预测Merge候选,该组合的双向预测Merge候选被添加到最终列表(在右方)。关于被认为生成这些附加Merge候选的组合有诸多规则。
图7示出了组合的双向预测Merge候选的示例。
零运动候选被插入以填充Merge候选列表中的剩余条目,并且因此达到MaxNumMergeCand容量。这些候选具有零空域位移和参考图片索引,该参考图片索引从零开始并且每当新的零运动候选被添加到列表时则增加。最终,对这些候选不进行冗余检查。
2.1.3 AMVP
AMVP利用运动矢量与相邻PU的空域-时域相关性,该空域-时域相关性用于运动参数的显式传输。对于每个参考图片列表,通过下述操作来构建运动矢量候选列表:首先检查左方、上方在时域上相邻PU位置的可用性,移除冗余候选,并添加零矢量,以使候选列表为恒定长度。然后,编码器可以从候选列表中选择最佳预测器,并传输指示所选候选的对应索引。与Merge索引信令通知类似,使用截断一元来编码最佳运动矢量候选的索引。在这种情况下要编码的最大值是2(参见图8)。在以下章节中,提供了关于运动矢量预测候选的导出过程的细节。
2.1.3.1 AMVP候选的导出
图8总结了用于运动矢量预测候选的导出过程。
图8示出了运动矢量预测候选的导出过程的示例。
在运动矢量预测中,考虑两种类型的运动矢量候选:空域运动矢量候选和时域运动矢量候选。如图2示出的,对于空域运动矢量候选导出,最终基于位于五个不同位置的每个PU的运动矢量来导出两个运动矢量候选。
对于时域运动矢量候选导出,从基于两个不同的共位位置导出的两个候选中选择一个运动矢量候选。在制作空域-时域候选的第一列表之后,移除列表中的重复的运动矢量候选。如果潜在候选的数量大于2,则从列表中移除其在相关联的参考图片列表内的参考图片索引大于1的运动矢量候选。如果空域-时域运动矢量候选的数量小于2,则将附加的零运动矢量候选添加到列表中。
2.1.3.2空域运动矢量候选
在空域运动矢量候选的导出中,在五个潜在候选中考虑最多两个候选,该五个潜在候选来自位于如图2示出的位置的PU,这些位置与运动Merge的那些位置相同。当前PU的左侧的导出顺序被定义为A0、A1和缩放的A0、缩放的A1。当前PU的上侧的导出顺序被定义为B0、B1、B2、缩放的B0、缩放的B1、缩放的B2。因此,对于每一侧,存在四种可用作运动矢量候选的情况,其中两种情况不需要使用空域缩放,并且两种情况使用空域缩放。四种不同的情况总结如下。
无空域缩放
-(1)相同的参考图片列表,以及相同的参考图片索引(相同的POC)
-(2)不同的参考图片列表,但是相同的参考图片(相同的POC)
空域缩放
-(3)相同的参考图片列表,但是不同的参考图片(不同的POC)
-(4)不同的参考图片列表,以及不同的参考图片(不同的POC)
首先检查无空域缩放情况,接下来检查空域缩放。不管参考图片列表如何,当POC在相邻PU的参考图片与当前PU的参考图片之间是不同的时,考虑空域缩放。如果左方候选的所有PU都不可用或者是被帧内编解码的,则允许对上方运动矢量进行缩放,以帮助左方和上方MV候选的并行导出。否则,对上方运动矢量不允许空域缩放。
图9是对于空域运动矢量候选的运动矢量缩放的图示。
在空域缩放过程中,以与时域缩放类似的方式缩放相邻PU的运动矢量,如图9所示。主要差异在于当前PU的参考图片列表和索引被给定为作为输入;实际缩放过程与时域缩放过程相同。
2.1.3.3时域运动矢量候选
除了参考图片索引导出之外,用于时域Merge候选的导出的所有过程与用于空域运动矢量候选的导出的过程相同(见图6)。将参考图片索引信令通知给解码器。
2.2 VVC中的帧间预测方法
存在几种新的用于帧间预测改进的编解码工具,诸如用于信令通知MVD的自适应运动矢量差分辨率(AMVR)、具有运动矢量差的Merge(MMVD),三角预测模式(TPM)、组合帧内-帧间预测(CIIP)、高级TMVP(ATMVP,又称为SbTMVP)、仿射预测模式、广义双向预测(GBI)、解码器侧运动矢量细化(DMVR)和双向光流(BIO,又称为BDOF)。
VVC中支持三种不同的Merge列表构建过程:
1)子块Merge候选列表:它包括ATMVP和仿射Merge候选。仿射模式和ATMVP模式两者共享一个Merge列表构建过程。在此,可以按顺序添加ATMVP和仿射Merge候选。子块Merge列表的尺寸在条带头中信令通知,最大值为5。
2)常规Merge列表:对于剩余的编解码块,共享一个Merge列表的构建过程。在此,可以按顺序插入空域/时域/HMVP、成对组合的双向预测Merge候选和零运动候选。在条带头中信令通知常规Merge列表的尺寸,并且最大值为6。MMVD、TPM、CIIP依赖于常规Merge列表。
3)IBC Merge列表:其以与常规Merge列表类似的方式完成。
类似地,VVC支持三个AMVP列表:
1)仿射AMVP候选列表
2)常规AMVP候选列表
3)IBC AMVP候选列表:由于采用了JVET-N0843,因此与IBC Merge列表的构建过程相同
2.2.1 VVC中的编解码块结构
在VVC中,采用四叉树/二叉树/三叉树(QT/BT/TT)结构将图片分为正方形或矩形块。
除了QT/BT/TT,还在VVC中采用单独的树(也称为双重编解码树)以用于I帧。通过单独的树,分别为亮度和色度分量信令通知编解码块结构。
此外,CU被设置为等于PU和TU,除了用几种特定的编解码方法编解码的块(诸如,帧内子分割预测,其中PU等于TU,但是小于CU,以及对于帧间编解码块的子块变换,其中PU等于CU,但TU小于PU)。
2.2.2仿射预测模式
在HEVC中,对于运动补偿预测(MCP)仅应用平移运动模型。而在现实世界中,存在许多种运动,例如放大/缩小、旋转、透视运动和其它不规则的运动。在VVC中,简化的仿射变换运动补偿预测应用于4-参数仿射模型和6-参数仿射模型。如图10A-10B所示,该块的仿射运动场由4-参数仿射模型的两个控制点运动矢量(CPMV)和6-参数仿射模型的3个CPMV描述。
图10A和10B示出了:10A:简化的仿射运动模型参数仿射,10B:6-参数仿射模式。
块的运动矢量场(MVF)由以下等式分别以等式(1)中的4-参数仿射模型(其中4-参数定义为变量a、b、e和f)和等式(2)中的6-参数仿射模型(其中4-参数定义为变量a、b、c、d、e和f)描述:
Figure BDA0003372935180000111
Figure BDA0003372935180000121
其中(mvh 0,mvh 0)是左上角控制点的运动矢量,并且(mvh 1,mvh 1)是右顶角控制点的运动矢量,并且(mvh 2,mvh 2)是左下角控制点的运动矢量,所有三个运动矢量被称为控制点运动矢量(CPMV),(x,y)代表相对于当前块内左上样点的代表点的坐标,并且(mvh(x,y),mvv(x,y))是为位于(x,y)的样点所导出的运动矢量。CP运动矢量可以被信令通知(如在仿射AMVP模式中)或即时导出(如在仿射Merge模式中)。w和h是当前块的宽度和高度。实践中,该除法是通过取整操作右移实现。在VTM中,代表点定义为子块的中心位置,例如,当子块的左上角相对于当前块内左上样点的坐标为(xs,ys),代表点的坐标定义为(xs+2,ys+2)。对于每个子块(即,VTM中的4X4),代表点被用于导出整个子块的运动矢量。
为了进一步简化运动补偿预测,应用基于子块的仿射变换预测。为了导出每个M×N(在当前VVC中,M和N两者都被设置为4)子块的运动矢量,如图11所示,根据等式(1)和(2)计算每个子块的中心样点的运动矢量并将其取整至1/16的分数准确度。然后,可以应用1/16像素的运动补偿插值滤波器,以利用导出的运动矢量生成每个子块的预测。1/16像素的插值滤波器通过仿射模式引入。
图11是每个子块的仿射MVF的示例。
在MCP之后,每个子块的高准确度运动矢量以与正常运动矢量相同的准确度被取整并保存。
2.2.3对于整个块的MERGE
2.2.3.1平移的常规Merge模式的Merge列表构建
2.2.3.1.1基于历史的运动矢量预测(HMVP)
与Merge列表设计不同,在VVC中,采用了基于历史的运动矢量预测(HMVP)方法。
在HMVP中,存储了先前编解码的运动信息。将先前编解码的块的运动信息定义为HMVP候选。多个HMVP候选存储在一个名为HMVP表的表中,并且在即时编码/解码处理期间维持该表。当开始对新的片/LCU行/条带进行编解码/解码时,HMVP表被清空。每当存在帧间编解码块和非子块、非TPM模式时,相关联的运动信息就会作为新的HMVP候选添加到表的最后一个条目。整个编解码流程如图12所示。
2.2.3.1.2常规Merge列表构建过程
常规Merge列表(用于平移运动)的构建可以根据以下步骤序列进行总结:
·步骤1:导出空域候选
·步骤2:插入HMVP候选
·步骤3:插入成对平均候选
·步骤4:默认运动候选
HMVP候选可以在AMVP和Merge候选列表两者的构建过程中使用。图13描绘了修改的Merge候选列表构建过程(蓝色高亮)。当在TMVP候选插入之后,Merge候选列表未满时,可以利用存储在HMVP表中的HMVP候选来填充Merge候选列表。考虑到一个块通常就运动信息而言与最近的相邻块具有更高的相关性,因此以索引的降序插入表中的HMVP候选。最先将表中的最后一个条目添加到列表中,而最后添加第一个条目。类似地,冗余移除被应用于HMVP候选。一旦可用Merge候选的总数达到允许被信令通知的Merge候选的最大数量,则Merge候选列表构建过程终止。
注意,所有的空域/时域/HMVP候选都应以非IBC模式进行编解码。否则,不允许将其添加到常规Merge候选列表中。
HMVP表包含多达5个常规运动候选,并且每个候选都是唯一的。
2.2.3.2三角预测模式(TPM)
在VTM4中,支持三角分割模式用于帧间预测。三角分割模式仅适用于8x8或更大且以Merge模式编解码而不以MMVD或CIIP模式编解码的CU。对于满足这些条件的CU,信令通知CU级的标志以指示是否应用了三角分割模式。
当使用该模式时,如图13所示,使用对角线划分或反对角线划分将CU均匀地划分为两个三角形分割。CU中的每个三角分割都是使用自己的运动进行帧间预测的;每个分割仅允许单向预测,即每个分割具有一个运动矢量和一个参考索引。应用单向预测运动约束以确保与常规双向预测相同,每个CU仅需要两个运动补偿的预测。
图14示出了基于三角分割的帧间预测的示例。
如果CU级标志指示当前CU是使用三角分割模式编解码的,则进一步信令通知指示三角分割的方向(对角线或反对角线)的标志以及两个Merge索引(每个分割一个)。在预测每个三角分割之后,使用具有自适应权重的混合处理来调整沿对角线或反对角线边缘的样点值。这是整个CU的预测信号,并且与在其它预测模式中一样,变换和量化过程将应用于整个CU。最后,使用三角分割模式预测的CU的运动场以4x4单元存储。
常规Merge候选列表被重新用于三角分割Merge预测,而没有额外的运动矢量修剪。对于常规Merge候选列表中的每个Merge候选,其L0或L1运动矢量中有且仅有一个用于三角预测。另外,选择L0与L1运动矢量的顺序基于其Merge索引奇偶校验。通过这种方案,可以直接使用常规Merge列表。
2.2.3.3MMVD
在JVET-L0054中,提出了最终运动矢量表达(UMVE,也称为MMVD)。UMVE可通过提出的运动矢量表达方法用于跳过或Merge模式。
UMVE重复使用与VVC中的常规Merge候选列表中所包括的Merge候选相同的Merge候选。在Merge候选之中,可以选择基本候选,并通过提出的运动矢量表达方法对其进一步扩展。
UMVE提供了一种新的运动矢量差(MVD)表示方法,其中使用起点、运动幅度和运动方向来表示MVD。
图15示出了UMVE搜索过程的示例。
图16示出了UMVE搜索点的示例。
该提出的技术照原样使用Merge候选列表。但是,只有默认Merge类型(MRG_TYPE_DEFAULT_N)的候选才会考虑UMVE的扩展。
基本候选索引定义起点。基本候选索引如下指示列表中候选中的最佳候选。
表1:基本候选IDX
基本候选IDX 0 1 2 3
第N MVP 第1MVP 第2MVP 第3MVP 第4MVP
如果基本候选的数量等于1,则不信令通知基本候选IDX。
距离索引是运动幅度信息。距离索引指示距起点信息的预定义距离。预定义的距离如下:
表2.距离IDX
Figure BDA0003372935180000151
方向索引表示MVD相对于起点的方向。方向索引可以表示四个方向,如下所示。
表3.方向IDX
方向IDX 00 01 10 11
x-轴 + N/A N/A
y-轴 N/A N/A +
在发送跳过标志或Merge标志之后立即信令通知UMVE标志。如果跳过或Merge标志为真(TURE),则解析UMVE标志。如果UMVE标志等于1,则解析UMVE语法。但是,如果不是1,则解析仿射标志。如果仿射标志等于1,则为仿射模式;但是,如果不等于1,则将为VTM的跳过/Merge模式解析跳过/Merge索引。
由于UMVE候选,不需要附加的行缓冲器。因为软件的跳过/Merge候选直接用作基本候选。使用输入的UMVE索引,可以在运动补偿之前确定MV的补充。无需为此保留长行缓冲区。
在当前的通用测试条件下,可以选择Merge候选列表中的第一或第二Merge候选作为基本候选。
UMVE也被称为具有MV差的Merge(MMVD)。
2.2.3.4组合的帧内-帧间预测(CIIP)
在JVET-L0100中,提出了多假设预测,其中组合的帧内预测和帧间预测是生成多个假设的一种方法。
当将多假设预测应用于改善帧内模式时,多假设预测将一个帧内预测和一个Merge索引预测组合。在Merge CU中,当标志为真时,信令通知一个标志用于Merge模式以从帧内候选列表中选择帧内模式。对于亮度分量,帧内候选列表仅从一个帧内预测模式——即平面模式导出。从帧内和帧间预测应用于预测块的权重由两个相邻块(A1和B1)的编解码模式(帧内或非帧内)确定。
2.2.4基于子块的Merge技术
建议将所有与子块有关的运动候选不仅放入非子块Merge候选的常规Merge列表,还放入单独的Merge列表中。
将与子块有关的运动候选放在单独的Merge列表中,该列表命名为“子块Merge候选列表”。
在一个示例中,子块Merge候选列表包括ATMVP候选和仿射Merge候选。
子块Merge候选列表按以下顺序填充候选:
a.ATMVP候选(可能可用或不可用);
b.仿射Merge列表(包括继承的仿射候选;和构建的仿射候选)
c.填充为零MV 4-参数仿射模型
2.2.4.1.1 ATMVP(又称为子块时域运动矢量预测器,SbTMVP)
ATMVP的基本思想是为一个块导出多组时域运动矢量预测器。每个子块分配有一组运动信息。当生成ATMVP Merge候选时,将以8x8级而不是整个块级进行运动补偿。
2.2.5常规帧间模式(AMVP)
2.2.5.1 AMVP运动候选列表
类似于HEVC中的AMVP设计,可以导出多达2个AMVP候选。但是,也可以在TMVP候选之后添加HMVP候选。HMVP表中的HMVP候选以索引的升序(即,从等于0的索引,最旧的索引)遍历。可以检查多达4个HMVP候选,以找到其参考图片是否与目标参考图片相同(即,相同的POC值)。
2.2.5.2 AMVR
在HEVC中,当条带头中的use_integer_mv_flag等于0时,以四分之一的亮度样点为单位信令通知(运动矢量与PU的预测运动矢量之间的)运动矢量差(MVD)。在VVC中,引入了局部自适应运动矢量分辨率(AMVR)。在VVC中,可以以四分之一亮度样点、整数亮度样点或四亮度样点(即,1/4像素、1像素、4像素)为单位对MVD进行编解码。MVD分辨率被控制在编解码单元(CU)级,并且对具有至少一个非零MVD分量的每个CU有条件地信令通知MVD分辨率标志。
对于具有至少一个非零MVD分量的CU,信令通知第一标志以指示在CU中是否使用四分之一亮度样点MV精度。当第一标志(等于1)指示未使用四分之一亮度样点MV精度时,信令通知另一标志以指示是使用整数亮度样点MV精度还是使用四亮度样点MV精度。
当CU的第一MVD分辨率标志为零或未为CU编解码时(意味着CU中的所有MVD均为零),四分之一亮度样点MV分辨率被用于CU。当CU使用整数亮度样点MV精度或四亮度样点MV精度时,CU的AMVP候选列表中的MVP会取整到对应的精度。
2.2.5.3 JVET-N1001-v2中的对称运动矢量差
在JVET-N1001-v2中,对称运动矢量差(SMVD)被应用于双向预测中的运动信息编解码。
首先,在条带级,以N1001-v2中规定的以下步骤分别导出变量RefIdxSymL0和RefIdxSymL1,以指示在SMVD模式中使用的list 0/1的参考图片索引。当两个变量中的至少一个等于-1时,应禁用SMVD模式。
2.2.6运动信息的细化
2.2.6.1解码器侧运动矢量细化(DMVR)
在双向预测操作中,对于一个块区域的预测,将分别使用list 0的运动矢量(MV)和list 1的MV形成的两个预测块进行组合以形成单个预测信号。在解码器侧运动矢量细化(DMVR)方法中,进一步对双向预测的两个运动矢量进行细化。
对于VVC中的DMVR,假定list 0和list 1之间的MVD镜像如图17所示,并进行双边匹配以细化MV,即在几个MVD候选中找到最佳的MVD。用MVL0(L0X,L0Y)和MVL1(L1X,L1Y)表示两个参考图片列表的MV。将list 0的(MvdX,MvdY)表示的、可将成本函数(例如,SAD)最小化的MVD定义为最佳MVD。对于SAD函数,其定义为以list 0参考图片中的运动矢量(L0X+MvdX,L0Y+MvdY)导出的list 0的参考块与以list 1的参考图片中的运动矢量(L1X-MvdX,L1Y-MvdY)导出的list 1的参考块之间的SAD。
运动矢量细化过程可以迭代两次。在每个迭代中,可以分两步检查最多6个MVD(具有整数像素精度),如图18所示。在第一步骤中,检查MVD(0,0)、(-1,0)、(1,0)、(0,-1)、(0,1)。在第二步骤中,可以选择并进一步检查MVD(-1,-1)、(-1、1)、(1,-1)或(1、1)中的一个。假设函数Sad(x,y)返回MVD(x,y)的SAD值。在第二步骤中检查的由(MvdX,MvdY)表示的MVD如下决定:
MvdX=-1;
MvdY=-1;
If(Sad(1,0)<Sad(-1,0))
MvdX=1;
If(Sad(0,1)<Sad(0,-1))
MvdY=1;
在第一迭代中,起点是信令通知的MV,并且在第二迭代中,起点是信令通知的MV加上在第一迭代中选择的最佳MVD。仅在一个参考图片为前一图片而另一参考图片为后一图片且两个参考图片与当前图片的图片顺序计数距离相同时才应用DMVR。
图17示出了在DMVR中的list 0和list 1之间镜像的MVD(0,1)的示例。
图18示出了可以在一次迭代中检查的MV的示例。
为了进一步简化DMVR的过程,JVET-M0147对JEM中的设计提出了一些改进。更具体地,VTM-4.0(即将发布)采用的DMVR设计具有以下主要功能:
·当list 0和list 1之间的(0,0)位置SAD小于阈值时,提前终止。
·当对于某些位置,list 0和list 1之间的SAD为零时,提前终止。
·DMVR的块尺寸:W*H>=64&&H>=8,其中W和H是块的宽度和高度。
·对于CU尺寸>16*16的DMVR,将CU划分为16x16的多个子块。如果仅CU的宽度或高度大于16,则仅在垂直或水平方向上划分。
·参考块尺寸(W+7)*(H+7)(用于亮度)。
·25点基于SAD的整数像素搜索(即,(+-)2细化搜索范围,单级)
·基于双线性插值的DMVR。
·基于“参数误差表面等式”的子像素细化。仅当最小SAD成本不等于零且最佳MVD在上一次MV细化迭代中为(0,0)时,才进行此过程。
·亮度/色度MC w/参考块填充(如果需要)。
·仅用于MC和TMVP的细化MV。
2.2.6.1.1 DMVR的使用
当以下条件均为真时,可以启用DMVR:
–SPS中的DMVR启用标志(即,sps_dmvr_enabled_flag)等于1
–TPM标志,帧间仿射标志和子块Merge标志(ATMVP或仿射Merge),MMVD标志均等于0
–Merge标志等于1
–当前块是双向预测的,并且list 1中的当前图片与参考图片之间的POC距离等于list 0中的参考图片与当前图片之间的POC距离
–当前CU的高度大于或等于8
–亮度样点的数量(CU宽度*高度)大于或等于64
2.2.6.1.2基于“参数误差表面等式”的子像素细化
该方法总结如下:
1.仅当中心位置是给定迭代中的最佳成本位置时,才计算参数误差表面拟合。
2.中心位置成本和距中心的(-1,0)、(0,-1)、(1,0)和(0,1)位置的成本用于拟合以下形式的二维抛物线误差表面等式
E(x,y)=A(x-x0)2+B(y-y0)2+C
其中(x0,y0)对应于成本最小的位置,并且C对应于最小成本值。通过求解5个未知数中的5个等式,可计算出(x0,y0)为:
x0=(E(-1,0)-E(1,0))/(2(E(-1,0)+E(1,0)-2E(0,0)))
y0=(E(0,-1)-E(0,1))/(2((E(0,-1)+E(0,1)-2E(0,0)))
可以通过调整进行除法的精度(即,计算出多少位的商)以将(x0,y0)计算为任何所需的子像素精度。对于1/16像素准确度,仅需计算商的绝对值的4位,这有助于每个CU所需的2次除法的基于快速移位的减法的实现。
3.将计算出的(x0,y0)添加到整数距离细化MV以获得子像素准确的细化增量MV。
2.2.6.2双向光流(BDOF)
2.3帧内块复制
HEVC屏幕内容编解码扩展(HEVC-SCC)和当前VVC测试模型(VTM-4.0)已采用了帧内块复制(IBC),又称当前图片参考。IBC将运动补偿的概念从帧间编解码扩展到了帧内编解码。如图18所示,当应用IBC时,当前块由同一图片中的参考块预测。在对当前块进行编解码或解码之前,必须已经重建了参考块中的样点。尽管IBC对于大多数相机捕获的序列而言效率不高,但它示出了屏幕内容的显着编解码增益。原因是屏幕内容图片中有很多重复的模式,诸如图标和文本字符。IBC可以有效地移除这些重复模式之间的冗余。在HEVC-SCC中,如果选择当前图片作为其参考图片,则帧间编解码的编解码单元(CU)可以应用IBC。在这种情况下,MV被重命名为块矢量(BV),并且BV始终具有整数像素精度。为了与主配置文件HEVC兼容,当前图片在解码图片缓冲器(Decoded Picture Buffer,DPB)中被标记为“长期”参考图片。应当注意,类似地,在多视图/3D视频编解码标准中,视图间参考图片也被标记为“长期”参考图片。
在BV找到其参考块之后,可以通过复制参考块来生成预测。可以通过从原始信号中减去参考像素来获得残差。然后,可以像在其它编解码模式中一样应用变换和量化。
图19是帧内块复制的示例。
然而,当参考块在图片之外、或与当前块重叠、或在重建区域之外、或在受某些约束限制的有效区域之外时,未定义部分或全部像素值。基本上,有两种解决此问题的方案。一种是禁止这种情况,例如在比特流一致性中。另一种是对那些未定义的像素值应用填充。以下子章节详细描述了方案。
2.3.1 VVC测试模型中的IBC(VTM4.0)
在当前的VVC测试模型(例如VTM-4.0设计)中,整个参考块应与当前的编解码树单元(CTU)一致,且不与当前块重叠。因此,不需要填充参考或预测块。IBC标志被编解码为当前CU的预测模式。因此,每个CU总共存在三种预测模式:MODE_INTRA\MODE_INTER和MODE_IBC。
2.3.1.1 IBC Merge模式
在IBC Merge模式中,从比特流中解析指向IBC Merge候选列表中的条目的索引。IBC Merge列表的构建可以根据以下步骤序列进行总结:
·步骤1:导出空域候选
·步骤2:插入HMVP候选
·步骤3:插入成对平均候选
在空域Merge候选的导出中,在位于如附图2所描绘的A1、B1、B0、A0和B2所示的位置的候选当中选择最多四个Merge候选。导出的顺序是A1、B1、B0、A0和B2。仅当位置A1、B1、B0、A0的任何PU不可用(例如,因为它属于另一条带或片)或者没有用IBC模式进行编解码时,才考虑位置B2。在添加位置A1处的候选之后,对剩余候选的插入进行冗余检查,其确保具有相同运动信息的候选被排除在列表之外,使得编解码效率提高。
在插入空域候选之后,如果IBC Merge列表尺寸仍小于最大IBC Merge列表尺寸,则可以插入来自HMVP表的IBC候选。插入HMVP候选时执行冗余检查。
最后,将成对平均候选插入IBC Merge列表。
当由Merge候选识别的参考块在图片之外、或者与当前块重叠、或者在重建区域之外、或者在受某些约束限制的有效区域之外时,Merge候选被称为无效Merge候选。
注意,可将无效的Merge候选插入到IBC Merge列表中。
2.3.1.2 IBC AMVP模式
在IBC AMVP模式中,指向IBC AMVP列表中条目的AMVP索引是从比特流中解析出来的。IBC AMVP列表的构建可以根据以下步骤序列进行总结:
·步骤1:导出空域候选
ο检查A0、A1,直到找到可用的候选。
ο检查B0、B1、B2,直到找到可用的候选。
·步骤2:插入HMVP候选
·步骤3:插入零候选
在插入空域候选之后,如果IBC AMVP列表尺寸仍然小于最大IBC AMVP列表尺寸,则可以插入来自HMVP表的IBC候选。
最后,将零候选插入到IBC AMVP列表中。
2.3.1.3色度IBC模式
在当前的VVC中,在子块级进行色度IBC模式中的运动补偿。色度块将被分割为几个子块。每个子块确定对应亮度块是否具有块矢量以及有效性(如果存在)。当前VTM中存在编码器约束,其中如果当前色度CU中的所有子块都具有有效的亮度块矢量,则将测试色度IBC模式。例如,在YUV 420视频上,色度块为NxM,然后共位的亮度区域为2Nx2M。色度块的子块尺寸为2x2。有几个步骤进行色度mv导出,然后进行块复制过程。
1)色度块将首先被分割为(N>>1)*(M>>1)个子块。
2)具有坐标为(x,y)的左上样点的每个子块取回对应的亮度块,该亮度块覆盖了坐标为(2x,2y)的相同左上样点。
3)编码器检查取回的亮度块的块矢量(bv)。如果满足以下条件之一,则bv被视为无效。
a.对应亮度块的bv不存在。
b.由bv识别的预测块尚未重建。
c.由bv识别的预测块与当前块部分或完全重叠。
4)将子块的色度运动矢量设置为对应亮度子块的运动矢量。
当所有子块都找到有效的bv时,在编码器处允许IBC模式。
下面列出了IBC块的解码过程。与IBC模式中的色度运动矢量导出有关的部分用双粗化括号包括,即,{{a}}指示“a”与IBC模式中的色度运动矢量导出有关。
8.6.1在IBC预测中编解码的编解码单元的一般解码过程
此过程的输入是:
–亮度位置(xCb,yCb),指定当前编解码块的左上样点相对于当前图片的左上亮度样点,
–变量cbWidth,指定亮度样点中当前编解码块的宽度,
–变量cbHeight,指定亮度样点中当前编解码块的高度,
–变量treeType,指定使用单树还是双树,并且如果使用双树,则它指定当前树是对应于亮度分量还是色度分量。
该过程的输出是环路滤波之前的修改后的重建图片。
以亮度位置(xCb,yCb)、亮度样点中的当前编解码块的宽度cbWidth和亮度样点中的当前编解码块的高度cbHeight以及变量treeType作为输入来调用第8.7.1节中规定的量化参数的导出过程。
以ibc预测模式编解码的编解码单元的解码过程包括以下有序的步骤:
1.当前编解码单元的运动矢量分量导出如下:
1.如果treeType等于SINGLE_TREE或DUAL_TREE_LUMA,则适用以下:
–以亮度编解码块位置(xCb,yCb)、亮度编解码块宽度cbWidth和亮度编解码块高度cbHeight作为输入,并以亮度运动矢量mvL[0][0]作为输出,调用第8.6.2.1节规定的运动矢量分量的导出过程。
–当treeType等于SINGLE_TREE时,以亮度运动矢量mvL[0][0]作为输入,并以色度运动矢量mvC[0][0]作为输出,调用第8.6.2.9节中色度运动矢量的导出过程。
–水平方向中的亮度编解码子块的数量numSbX和垂直方向中的亮度编解码子块的数量numSbY均设置为等于1。
1.否则,如果treeType等于DUAL_TREE_CHROMA,则适用以下:
–水平方向中的亮度编解码子块的数量numSbX和垂直方向中的亮度编解码子块的数量numSbY导出如下:
numSbX=((cbWidth>>2) (8-886)
numSbY=((cbHeight>>2)) (8-887)
–{{对于xSbIdx=0..numSbX-1,ySbIdx=0..numSbY-1,色度运动矢量mvC[xSbIdx][ySbIdx]如下导出:
–亮度运动矢量mvL[xSbIdx][ySbIdx]如下导出:
–共位亮度编解码单元的位置(xCuY,yCuY)如下导出:
xCuY=xCb+xSbIdx*4 (0-1)
yCuY=yCb+ySbIdx*4 (0-2)
–如果CuPredMode[xCuY][yCuY]等于MODE_INTRA,则适用以下:
mvL[xSbIdx][ySbIdx][0]=0 (0-3)
mvL[xSbIdx][ySbIdx][1]=0 (0-4)
predFlagL0[xSbIdx][ySbIdx]=0 (0-5)
predFlagL1[xSbIdx][ySbIdx]=0 (0-6)
–否则(CuPredMode[xCuY][yCuY]等于MODE_IBC),则适用以下:
mvL[xSbIdx][ySbIdx][0]=MvL0[xCuY][yCuY][0] (0-7)
mvL[xSbIdx][ySbIdx][1]=MvL0[xCuY][yCuY][1] (0-8)
predFlagL0[xSbIdx][ySbIdx]=1 (0-9)
predFlagL1[xSbIdx][ySbIdx]=0 (0-10)}}
–以mvL[xSbIdx][ySbIdx]作为输入,并以mvC[xSbIdx][ySbIdx]作为输出,调用第8.6.2.9节中的色度运动矢量的导出过程。
–比特流一致性的要求是色度运动矢量mvC[xSbIdx][ySbIdx]应遵守以下约束:
–当以当前色度位置(xCurr,yCurr)设置为等于(xCb/SubWidthC,yCb/SubHeightC)并且相邻色度位置(xCb/SubWidthC+(mvC[xSbIdx][ySbIdx][0]>>5),yCb/SubHeightC+(mvC[xSbIdx][ySbIdx][1]>>5))作为输入来调用第6.4.X节[编辑(BB):相邻块可用性检查过程tbd]规定的块可用性的导出过程时,输出应等于真。
–当以当前色度位置(xCurr,yCurr)设置为等于(xCb/SubWidthC,yCb/SubHeightC)并且相邻色度位置(xCb/SubWidthC+(mvC[xSbIdx][ySbIdx][0]>>5)+cbWidth/SubWidthC–1,yCb/SubHeightC+(mvC[xSbIdx][ySbIdx][1]>>5)+cbHeight/SubHeightC-1)作为输入来调用第6.4.X节[编辑(BB):相邻块可用性检查过程tbd]规定的块可用性的导出过程时,输出应等于真。
–以下条件中的一个或二者应为真:
–(mvC[xSbIdx][ySbIdx][0]>>5>)+xSbIdx*2+2小于或等于0。
–(mvC[xSbIdx][ySbIdx][1]>>5)+ySbIdx*2+2小于或等于0。
2.当前编解码单元的预测样点导出如下:
–如果treeType等于SINGLE_TREE或DUAL_TREE_LUMA,则当前编解码单元的预测样点导出如下:
–以亮度编解码块位置(xCb,yCb)、亮度编解码块宽度cbWidth和亮度编解码块高度cbHeight、水平方向中的亮度编解码子块的数量numSbX和垂直方向中的亮度编解码子块的数量numSbY、亮度运动矢量mvL[xSbIdx][ySbIdx](其中xSbIdx=0..numSbX-1,而ySbIdx=0..numSbY-1)、变量cIdx设置为等于0作为输入,并且作为预测亮度样点的(cbWidth)x(cbHeight)矩阵predSamplesL的ibc预测样点(predSamples)作为输出,来调用第8.6.3.1节规定的ibc块的解码过程。
–否则,如果treeType等于SINGLE_TREE或DUAL_TREE_CHROMA,则当前编解码单元的预测样点导出如下:
––以亮度编解码块位置(xCb,yCb)、亮度编解码块宽度cbWidth和亮度编解码块高度cbHeight、水平方向中的亮度编解码子块的数量numSbX和垂直方向中的亮度编解码子块的数量numSbY、色度运动矢量mvC[xSbIdx][ySbIdx](其中xSbIdx=0..numSbX-1,而ySbIdx=0..numSbY-1)、变量cIdx设置为等于1作为输入,并且作为色度分量Cb的预测色度样点的(cbWidth/2)x(cbHeight/2)矩阵predSamplesCb的ibc预测样点(predSamples)作为输出,来调用第8.6.3.1节规定的ibc块的解码过程。
––以亮度编解码块位置(xCb,yCb)、亮度编解码块宽度cbWidth和亮度编解码块高度cbHeight、水平方向中的亮度编解码子块的数量numSbX和垂直方向中的亮度编解码子块的数量numSbY、色度运动矢量mvC[xSbIdx][ySbIdx](其中xSbIdx=0..numSbX-1,而ySbIdx=0..numSbY–1)、变量cIdx设置为等于2作为输入,并且作为色度分量Cr的预测色度样点的(cbWidth/2)x(cbHeight/2)矩阵predSamplesCr的ibc预测样点(predSamples)作为输出,来调用第8.6.3.1节规定的ibc块的解码过程。
3.变量NumSbX[xCb][yCb]和NumSbY[xCb][yCb]分别设置为等于numSbX和numSbY。
4.当前编解码单元的残差样点导出如下:
–当treeType等于SINGLE_TREE或treeType等于DUAL_TREE_LUMA时,以位置(xTb0,yTb0)设置为等于亮度位置(xCb,yCb),宽度nTbW设置为等于亮度编解码块宽度cbWidth,高度nTbH设置为等于亮度编解码块高度cbHeight,并且变量cIdxset设置为等于0作为输入,并且矩阵resSamplesL作为输出,来调用第8.5.8节中规定的以帧间预测模式编解码的编解码块的残差信号的解码过程。
–当treeType等于SINGLE_TREE或treeType等于DUAL_TREE_CHROMA时,以位置(xTb0,yTb0)设置为等于色度位置(xCb/2,yCb/2),宽度nTbW设置为等于色度编解码块宽度cbWidth/2,高度nTbH设置为等于色度编解码块高度cbHeight/2,并且变量cIdxset设置为等于1作为输入,并且矩阵resSamplesCb作为输出,来调用第8.5.8节中规定的以帧间预测模式编解码的编解码块的残差信号的解码过程。
–当treeType等于SINGLE_TREE或treeType等于DUAL_TREE_CHROMA时,以位置(xTb0,yTb0)设置为等于色度位置(xCb/2,yCb/2),宽度nTbW设置为等于色度编解码块宽度cbWidth/2,高度nTbH设置为等于色度编解码块高度cbHeight/2,并且变量cIdxset设置为等于2作为输入,并且矩阵resSamplesCr作为输出,来调用第8.5.8节中规定的以帧间预测模式编解码的编解码块的残差信号的解码过程。
5.当前编解码单元的重建样点导出如下:
–当treeType等于SINGLE_TREE或treeType等于DUAL_TREE_LUMA时,以块位置(xB,yB)设置为等于(xCb,yCb),块宽度bWidth设置为cbWidth,块高度bHeight设置为cbHeight,变量cIdx设置为0,将(cbWidth)x(cbHeight)矩阵predSamples设置为等于predSamplesL,并且将(cbWidth)x(cbHeight)矩阵resSamples设置为等于resSamplesL作为输入,并且输出为环路滤波之前的修改的重建图片,来调用第8.7.5节中规定的颜色分量的图片重建过程。
–当treeType等于SINGLE_TREE或treeType等于DUAL_TREE_CHROMA时,以块位置(xB,yB)设置为等于(xCb/2,yCb/2),块宽度bWidth设置为cbWidth/2,块高度bHeight设置为cbHeight/2,变量cIdx设置为1,将(cbWidth/2)x(cbHeight/2)矩阵predSamples设置为等于predSamplesCb,并且将(cbWidth/2)x(cbHeight/2)矩阵resSamples设置为等于resSamplesCb作为输入,并且输出为环路滤波之前的修改的重建图片,来调用第8.7.5节中规定的颜色分量的图片重建过程。
–当treeType等于SINGLE_TREE或treeType等于DUAL_TREE_CHROMA时,以块位置(xB,yB)设置为等于(xCb/2,yCb/2),块宽度bWidth设置为cbWidth/2,块高度bHeight设置为cbHeight/2,变量cIdx设置为2,将(cbWidth/2)x(cbHeight/2)矩阵predSamples设置为等于predSamplesCr,并且将(cbWidth/2)x(cbHeight/2)矩阵resSamples设置为等于resSamplesCr作为输入,并且输出为环路滤波之前的修改的重建图片,来调用第8.7.5节中规定的颜色分量的图片重建过程。
2.3.2 IBC的最新进展(在VTM5.0中)
2.3.2.1单个BV列表
VVC采用了JVET-N0843。在JVET-N0843中,IBC中用于Merge模式和AMVP模式的BV预测器将共享公共的预测器列表,该列表包含以下元素:
·2个空域相邻位置(如图2中的A1、B1)
·5个HMVP条目
·默认的零矢量
列表中的候选数量由从条带头导出的变量控制。对于Merge模式,将最多使用此列表的前6个条目;对于AMVP模式,将使用此列表的前2个条目。并且该列表符合共享的Merge列表区域要求(在SMR中共享相同的列表)。
除了上述的BV预测器候选列表之外,JVET-N0843还提议简化HMVP候选与现有Merge候选(A1、B1)之间的修剪操作。在简化中,最多将进行2次修剪操作,因为其仅将第一HMVP候选与(一个或多个)空域Merge候选进行比较。
2.3.2.1.1解码过程
8.6.2.2 IBC亮度运动矢量预测的导出过程
仅当CuPredMode[xCb][yCb]等于MODE_IBC时才调用此过程,其中(xCb,yCb)指定当前亮度编解码块的左上样点相对于当前图片的左上亮度样点。
此过程的输入是:
–当前亮度编解码块的左上样点相对于当前图片的左上亮度样点的亮度位置(xCb,yCb),
–变量cbWidth,指定亮度样点中当前编解码块的宽度,
–变量cbHeight,指定亮度样点中当前编解码块的高度。
此过程的输出是:
–1/16分数样点准确度mvL中的亮度运动矢量。
变量xSmr、ySmr、smrWidth、smrHeight和smrNumHmvpIbcCand如下导出:
xSmr=IsInSmr[xCb][yCb]?SmrX[xCb][yCb]:xCb (0-11)
ySmr=IsInSmr[xCb][yCb]?SmrY[xCb][yCb]:yCb (0-12)
smrWidth=IsInSmr[xCb][yCb]?SmrW[xCb][yCb]:cbWidth (0-13)
smrHeight=IsInSmr[xCb][yCb]?SmrH[xCb][yCb]:cbHeight(0-14)
smrNumHmvpIbcCand=IsInSmr[xCb][yCb]?NumHmvpSmrIbcCand:NumHmvpIbcCand(0-15)
亮度运动矢量mvL通过以下有序步骤导出:
1.以亮度编解码块位置(xCb,yCb)设置为等于(xSmr,ySmr),亮度编解码块宽度cbWidth和亮度编解码块的高度cbHeight设置为等于smrWidth和smrHeight作为输入,并且输出是可用性标志availableFlagA1、availableFlagB1和运动矢量mvA1和mvB1,来调用第8.6.2.3条中规定的从相邻编解码单元进行空域运动矢量候选的导出过程。
2.运动矢量候选列表mvCandList的构建如下:
i=0
if(availableFlagA1)
mvCandList[i++]=mvA1 (8-915)
if(availableFlagB1)
mvCandList[i++]=mvB1
3.变量numCurrCand设置为等于mvCandList中Merge候选的数量。
4.当numCurrCand小于MaxNumMergeCandand且smrNumHmvpIbcCand大于0时,将以mvCandList,isInSmr设置为等于IsInSmr[xCb][yCb]以及numCurrCand作为输入,并且修改的mvCandList和numCurrCand作为输出来调用8.6.2.4中规定的基于IBC历史的运动矢量候选的导出过程。
5.当numCurrCand小于MaxNumMergeCand时,以下内容适用,直到numCurrCand等于MaxNumMergeCand:
1.mvCandList[numCurrCand][0]设置为等于0。
2.mvCandList[numCurrCand][1]设置为等于0。
3.numCurrCand增加1。
6.变量mvIdx如下导出:
mvIdx=general_merge_flag[xCb][yCb]?merge_idx[xCb][yCb]:mvp_l0_flag[xCb][yCb](0-17)
7.进行以下分配:
mvL[0]=mergeCandList[mvIdx][0] (0-18)
mvL[1]=mergeCandList[mvIdx][1] (0-19)
2.3.2.2 IBC的尺寸限制
在最新的VVC和VTM5中,建议在先前的VTM和VVC版本中的当前比特流约束之上,显式使用语法约束以禁用128x128 IBC模式,这使得IBC标志的存在取决于CU尺寸<128x128。
2.3.2.3 IBC的共享的Merge列表
为了降低解码器复杂度并支持并行编码,JVET-M0147提出了CU划分树中的一个祖先节点的所有叶编解码单元(CU)共享相同的Merge候选列表,以启用小的跳过/Merge编解码的CU的并行处理。祖先节点被称为Merge共享节点。假设Merge共享节点是叶CU,在Merge共享节点处生成共享Merge候选列表。
更具体地说,可以适用以下:
-如果块具有亮度样点不大于32,并划分为2个4x4子代块(child block),则使用在非常小的块(例如,两个相邻的4x4块)之间的共享Merge列表。
-如果块具有亮度样点大于32,但是在划分之后,至少一个子块小于阈值(32),该划分的所有子代块共享相同的Merge列表(例如,16x4或4x16三元划分或8x8四元划分)。
这样的限制仅应用于IBC Merge模式。
2.4编解码单元和Merge模式的语法表和语义
7.3.5.1一般条带头语法
Figure BDA0003372935180000291
Figure BDA0003372935180000301
7.3.7.5编解码单元语法
Figure BDA0003372935180000302
Figure BDA0003372935180000311
Figure BDA0003372935180000321
7.3.7.7 Merge数据语法
Figure BDA0003372935180000331
Figure BDA0003372935180000341
7.4.6.1一般条带头语义
six_minus_max_num_merge_cand指定从6减去的条带中支持的Merge运动矢量预测(MVP)候选的最大数量。Merge MVP候选的最大数量MaxNumMergeCand如下导出:
MaxNumMergeCand=6-six_minus_max_num_merge_cand(7-57)
MaxNumMergeCand的值应在1到6的范围中(包括端值)。
five_minus_max_num_subblock_merge_cand指定从5减去的条带中支持的基于子块的Merge运动矢量预测(MVP)候选的最大数量。当不存在five_minus_max_num_subblock_merge_cand时,则推断其等于5-sps_sbtmvp_enabled_flag。基于子块的Merge MVP候选的最大数量MaxNumSubblockMergeCand如下导出:
MaxNumSubblockMergeCand=5-five_minus_max_num_subblock_merge_cand(7-58)
MaxNumSubblockMergeCand的值应在0到5的范围中(包括端值)。
7.4.8.5编解码单元语义
pred_mode_flag等于0指定当前编解码单元是在帧间预测模式中编解码的。pred_mode_flag等于1指定当前编解码单元是在帧内预测模式中编解码的。
当不存在pred_mode_flag时,可如下推断:
–如果cbWidth等于4并且cbHeight等于4,则pred_mode_flag推断为等于1。
–否则,在解码I条带时,将pred_mode_flag推断为等于1,而在分别解码P或B条带时,将pred_mode_flag推断为等于0。
对于x=x0..x0+cbWidth-1且y=y0..y0+cbHeight-1,变量CuPredMode[x][y]如下导出:
–如果pred_mode_flag等于0,则将CuPredMode[[x][y]设置为等于MODE_INTER。
–否则(pred_mode_flag等于1),将CuPredMode[x][y]设置为等于MODE_INTRA。
pred_mode_ibc_flag等于1指定当前编解码单元是在IBC预测模式中编解码的。pred_mode_ibc_flag等于0指定当前编解码单元未在IBC预测模式中编解码。
当不存在pred_mode_ibc_flag时,可如下推断:
–如果cu_skip_flag[x0][y0]等于1,并且cbWidth等于4,且cbHeight等于4,则pred_mode_ibc_flag推断为等于1。
–否则,如果cbWidth和cbHeight都等于128,则pred_mode_ibc_flag推断为等于0。
–否则,当解码I条带时,将pred_mode_ibc_flag推断为等于sps_ibc_enabled_flag的值;并且当分别解码P或B条带时,将pred_mode_ibc_flag的值推断为等于0。
当pred_mode_ibc_flag等于1时,对于x=x0..x0+cbWidth-1且y=y0..y0+cbHeight-1,将变量CuPredMode[x][y]设置为等于MODE_IBC。
general_merge_flag[x0][y0]指定是否从相邻的帧间预测分割中推断当前编解码单元的帧间预测参数。矩阵索引x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
当不存在general_merge_flag[x0][y0]时,可如下推断:
–如果cu_skip_flag[x0][y0]等于1,则推断general_merge_flag[x0][y0]等于1。
–否则,推断general_merge_flag[x0][y0]等于0。
mvp_l0_flag[x0][y0]指定list 0的运动矢量预测器索引,其中x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度图片样点的位置(x0,y0)。
当不存在mvp_l0_flag[x0][y0]时,则将其推断为等于0。
mvp_l1_flag[x0][y0]与mvp_l0_flag具有相同的语义,其中l0和list 0分别被l1和list 1代替。
inter_pred_idc[x0][y0]指定根据表7-10,list 0、list 1或双向预测是否用于当前编解码单元。矩阵索引x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
表7-10–关联到帧间预测模式的名称
Figure BDA0003372935180000361
当不存在inter_pred_idc[x0][y0]时,则将其推断为等于PRED_L0。
7.4.8.7 Merge数据语义
regular_merge_flag[x0][y0]等于1指定使用常规Merge模式生成当前编解码单元的帧间预测参数。矩阵索引x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
当不存在regular_merge_flag[x0][y0]时,可如下推断:
–如果以下所有条件为真,则将regular_merge_flag[x0][y0]推断为等于1:
–sps_mmvd_enabled_flag等于0。
–general_merge_flag[x0][y0]等于1。
–cbWidth*cbHeight等于32。
–否则,推断regular_merge_flag[x0][y0]等于0。
mmvd_merge_flag[x0][y0]等于1指定使用具有运动矢量差的Merge模式生成当前编解码单元的帧间预测参数。矩阵索引x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
当不存在mmvd_merge_flag[x0][y0]时,可如下推断:
–如果以下所有条件为真,则将mmvd_merge_flag[x0][y0]推断为等于1:
–sps_mmvd_enabled_flag等于1。
–general_merge_flag[x0][y0]等于1。
–cbWidth*cbHeight等于32。
–regular_merge_flag[x0][y0]等于0。
–否则,推断mmvd_merge_flag[x0][y0]等于0。
mmvd_cand_flag[x0][y0]指定是否将Merge候选列表中的第一(0)或第二(1)候选与从mmvd_distance_idx[x0][y0]和mmvd_direction_idx[x0][y0]导出的运动矢量差一起使用。矩阵索引x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
当不存在mmvd_cand_flag[x0][y0]时,则将其推断为等于0。
mmvd_distance_idx[x0][y0]指定用于导出MmvdDistance[x0][y0]的索引,如表7-12所示。矩阵索引x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
表7-12–基于mmvd_distance_idx[x0][y0]的MmvdDistance[x0][y0]的规定
Figure BDA0003372935180000371
Figure BDA0003372935180000381
mmvd_direction_idx[x0][y0]指定用于导出MmvdSign[x0][y0]的索引,如表7-13中所指定。矩阵索引x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
表7-13–基于mmvd_direction_idx[x0][y0]的MmvdSign[x0][y0]的规定
Figure BDA0003372935180000382
Merge加MVD偏移的两个分量MmvdOffset[x0][y0]如下导出:
MmvdOffset[x0][y0][0]=(MmvdDistance[x0][y0]<<2)*MmvdSign[x0][y0][0](0-21)
MmvdOffset[x0][y0][1]=(MmvdDistance[x0][y0]<<2)*MmvdSign[x0][y0][1](0-22)
merge_subblock_flag[x0][y0]指定是否从相邻块中推断当前编解码单元的基于子块的帧间预测参数。矩阵索引x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。当不存在merge_subblock_flag[x0][y0]时,则将其推断为等于0。
merge_subblock_idx[x0][y0]指定基于子块的Merge候选列表的Merge候选索引,其中x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
当不存在merge_subblock_idx[x0][y0]时,则将其推断为等于0。
ciip_flag[x0][y0]指定是否将组合的帧间图片Merge和帧内图片预测应用于当前编解码单元。矩阵索引x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
当不存在ciip_flag[x0][y0]时,则将其推断为等于0。
当ciip_flag[x0][y0]等于1时,具有x=xCb..xCb+cbWidth-1和y=yCb..yCb+cbHeight-1的变量IntraPredModeY[x][y]设置为等于INTRA_PLANAR。
指定在解码B条带时是否使用基于三角形的运动补偿来生成当前编解码单元的预测样点的变量MergeTriangleFlag[x0][y0],导出如下:
–如果以下所有条件为真,则将MergeTriangleFlag[x0][y0]设置为等于1:
–sps_triangle_enabled_flag等于1。
–slice_type等于B。
–general_merge_flag[x0][y0]等于1。
–MaxNumTriangleMergeCand大于或等于2。
–cbWidth*cbHeight大于或等于64。
–regular_merge_flag[x0][y0]等于0。
–mmvd_merge_flag[x0][y0]等于0。
–merge_subblock_flag[x0][y0]等于0。
–ciip_flag[x0][y0]等于0。
–否则,将MergeTriangleFlag[x0][y0]设置为等于0。
merge_triangle_split_dir[x0][y0]指定Merge三角模式的划分方向。矩阵索引x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
当不存在merge_triangle_split_dir[x0][y0]时,则将其推断为等于0。
merge_triangle_idx0[x0][y0]指定基于三角形的运动补偿候选列表的第一Merge候选索引,其中x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
当不存在merge_triangle_idx0[x0][y0]时,则将其推断为等于0。
merge_triangle_idx1[x0][y0]指定基于三角形的运动补偿候选列表的第二Merge候选索引,其中x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
当不存在merge_triangle_idx1[x0][y0]时,则推断其等于0。
merge_idx[x0][y0]指定Merge候选列表的Merge候选索引,其中x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
当不存在merge_idx[x0][y0]时,可如下推断:
–如果mmvd_merge_flag[x0][y0]等于1,则将merge_idx[x0][y0]推断为等于mmvd_cand_flag[x0][y0]。
–否则(mmvd_merge_flag[x0][y0]等于0),则将merge_idx[x0][y0]推断为等于0。
3由实施例解决的技术问题的示例
当前的IBC可能具有以下问题:
1.对于P/B条带,可将多少个IBC运动(BV)候选添加到IBC运动列表中被设置为与常规Merge列表尺寸相同。因此,如果禁用了常规Merge模式,则也将禁用IBC Merge模式。但是,考虑到其巨大的收益,即使禁用常规Merge模式,也希望启用IBC Merge模式。
2.IBC AMVP和IBC Merge模式共享相同的运动(BV)候选列表构建过程。在条带头中信令通知由Merge候选的最大数量(例如,MaxNumMergeCand)指示的列表尺寸。对于IBCAMVP的情况,只能从两个IBC运动候选中的一个中选择BV预测器。
a.当BV候选列表尺寸为1时,在这种情况下,不需要BV预测器索引的信令通知。
b.当BV候选列表尺寸为0时,IBC Merge和AMVP模式均应禁用。但是,在当前设计中,仍然会信令通知BV预测器索引。
3.可以在序列级启用IBC,但是,由于信令通知的BV列表尺寸,可以禁用IBC,但是仍然信令通知IBC模式和有关语法的指示,这浪费了比特。
4示例技术和实施例
下面的详细发明应被认为是示例以解释一般概念。这些发明不应狭义地解释。此外,这些发明可以以任何方式组合。
在本发明中,解码器侧运动矢量导出(DMVD)包括进行运动估计以导出或细化块/子块运动信息的DMVR和FRUC,以及进行样点方面的运动细化的BIO之类的方法。
可以通过maxIBCCandNum基于在BV候选列表中导出或预测BV来表示BV候选的最大数量(即,BV候选列表尺寸)。
将IBC Merge候选的最大数量表示为maxIBCMrgNum,将IBC AMVP候选的最大数量表示为maxIBCAMVPNum。注意,跳过模式可以视为所有系数等于0的特殊Merge模式。
1.即使对序列启用了IBC,也可能对图片/条带/片/片组/组块或其它视频单元禁用IBC(例如,IBC AMVP和/或IBC Merge)模式。
a.在一个示例中,可以在图片/条带/片/片组/组块或其它视频单元级(诸如,在PPS、APS、条带头、图片头等中)信令通知是否启用了IBC AMVP和/或IBC Merge模式的指示。
i.在一个示例中,该指示可以是标志。
ii.在一个示例中,指示可以是多个允许的BV预测器。当允许的BV预测器的数量等于0时,指示IBC AMVP和/或Merge模式被禁用。
1)可替代地,可以以预测的方式信令通知允许的BV预测器的数量。
a.例如,可以信令通知X减去允许的BV预测器数量,其中X是固定数,诸如2。
iii.可替代地,此外,可以诸如基于视频内容是否是屏幕内容还或sps_ibc_enabled_flag而有条件地信令通知该指示。
b.在一个示例中,当视频内容不是屏幕内容(诸如,相机捕获的或混合的内容)时,可以禁用IBC模式。
c.在一个示例中,当视频内容是相机捕获的内容时,可以禁用IBC模式。
2.是否信令通知IBC的使用(例如,pred_mode_ibc_flag)和IBC有关的语法元素可以取决于maxIBCCandNum(例如,maxIBCCandNum被设置为等于MaxNumMergeCand)。
a.在一个示例中,当maxIBCCandNum等于0时,可以跳过对于I条带使用IBC跳过模式(例如,cu_skip_flag)的信令通知,并且推断IBC被禁用。
b.在一个示例中,当maxIBCMrgNum等于0时,可以跳过对于I条带使用IBC跳过模式(例如,cu_skip_flag)的信令通知,并且推断IBC跳过模式被禁用。
c.在一个示例中,当maxIBCCandNum等于0时,可以跳过使用IBC Merge/IBC AMVP模式(例如,pred_mode_ibc_flag)的信令通知,并且推断IBC被禁用。
d.在一个示例中,当maxIBCCandNum等于0并且当前块以IBC模式编解码时,可以跳过Merge模式(例如,general_merge_flag)的信令通知,并且推断IBC Merge模式被禁用。
i.可替代地,推断当前块以IBC AMVP模式编解码。
e.在一个示例中,当maxIBCMrgNum等于0并且当前块以IBC模式编解码时,可以跳过Merge模式(例如,general_merge_flag)的信令通知,并且推断IBC Merge模式被禁用。
i.可替代地,推断当前块以IBC AMVP模式编解码。
3.是否信令通知IBC AMVP模式的与运动矢量差有关的语法元素可以取决于maxIBCCandNum(例如,maxIBCCandNum被设置为等于MaxNumMergeCand)。
a.在一个示例中,当maxIBCCandNum等于0时,可以跳过IBC AMVP模式的运动矢量预测器索引(例如,mvp_10_flag)的信令通知,并且推断IBC AMVP模式被禁用。
b.在一个示例中,当maxIBCCandNum等于0时,可以跳过运动矢量差(例如,mvd_coding)的信令通知,并且推断IBC AMVP模式被禁用。
c.在一个示例中,在maxIBCCandNum大于K(例如,K=0或1)的条件下,可以对IBCAMVP模式的运动矢量预测器索引和/或运动矢量预测器的精度和/或运动矢量差的精度进行编解码。
i.在一个示例中,如果maxIBCCandNum等于1,则可以不信令通知IBC AMVP模式的运动矢量预测器索引(例如,mvp_10_flag)。
1)在一个示例中,在这种情况下,可将IBC AMVP模式的运动矢量预测器索引(例如,mvp_10_flag)推断为诸如0的值。
ii.在一个示例中,如果maxIBCCandNum等于0,则可以跳过对于IBC AMVP模式的运动矢量预测器的精度和/或运动矢量差的精度(例如,amvr_precision_flag)的信令通知。
iii.在一个示例中,可以在maxIBCCandNum大于0的条件下,信令通知IBC AMVP模式的运动矢量预测器的精度和/或运动矢量差的精度(例如,amvr_precision_flag)。
4.建议可将maxIBCCandNum从常规Merge候选的最大数量解耦。
a.在一个示例中,可以直接信令通知maxIBCCandNum。
i.可替代地,当对条带启用IBC时,一致性比特流应满足maxIBCCandNum大于0。
b.在一个示例中,可以信令通知maxIBCCandNum和其它语法元素/固定值的预测编解码。
i.在一个示例中,可以对常规Merge列表尺寸与maxIBCCandNum之间的差进行编解码。
ii.在一个示例中,(K减去maxIBCCandNum)可以被编解码,例如,K=5或6。
iii.在一个示例中,(maxIBCCandNum减去K)可以被编解码,例如,K=0或2。
c.在一个示例中,可以根据上述方法信令通知maxIBCMrgNum和/或maxIBCAMVPNum的指示。
5.可将maxIBCCandNum设置为等于Func(maxIBCMrgNum,maxIBCAMVPNum)
a.在一个示例中,maxIBCAMVPNum固定为2,并且maxIBCCandNum设置为Func(maxIBCMrgNum,2)。
b.在一个示例中,Func(a,b)返回两个变量a和b之间的较大值。
6.maxIBCCandNum可以根据一个块的编解码模式信息来确定。即,可将多少BV候选添加到BV候选列表可以取决于块的模式信息。
a.在一个示例中,如果一个块以IBC Merge模式编解码,则可将maxIBCCandNum设置为等于maxIBCMrgNum。
b.在一个示例中,如果一个块以IBC AMVP模式编解码,则可将maxIBCCandNum设置为等于maxIBCAMVPNum。
7.一致性比特流应满足解码的IBC AMVP或IBC Merge索引小于maxIBCCandNum。
a.在一个示例中,一致性比特流应满足解码的IBC AMVP索引小于maxIBCAMVPNum。
b.在一个示例中,一致性比特流应满足解码的IBC Merge索引小于maxIBCMrgNum(例如2)。
8.当IBC AMVP或IBC Merge候选索引无法在BV候选列表中识别BV候选时(例如,IBC AMVP或Merge候选索引不小于maxIBCCandNum,或者解码的IBC AMVP索引不小于maxIBCAMVPNum,或者解码的IBC Merge索引不小于maxIBCMrgNum),则可以使用默认的预测块。
a.在一个示例中,默认预测块中的所有样点都被设置为(1<<(比特深度-1))。
b.在一个示例中,可将默认的BV分配给块。
9.当IBC AMVP或IBC Merge候选索引无法在BV候选列表中识别BV候选时(例如,IBC AMVP或Merge候选索引不小于maxIBCCandNum,或者解码的IBC AMVP索引不小于maxIBCAMVPNum,或者解码的IBC Merge索引不小于maxIBCMrgNum),则可以该块视为具有无效BV的IBC块。
a.在一个示例中,可将应用到具有无效BV的块的过程应用于该块。
10.可以在某些条件下构建补充的BV候选列表,诸如,解码的IBC AMVP或IBCMerge索引不小于maxIBCCandNum。
a.在一个示例中,补充BV候选列表由以下步骤中的一个或多个构建(依次或以交织的方式):
i.添加HMVP候选
1)以HMVP候选索引的升序,从HMVP表中的第K个条目开始(例如,K=0)
2)以HMVP候选索引的降序,从HMVP表中的倒数第K个条目开始(例如,K=0或K=maxIBCCandNum–IBC AMVP/IBC Merge索引,或K=maxIBCCandNum–1–IBC AMVP/IBC Merge索引)
ii.使用具有maxIBCCandNum候选的BV候选列表从可用候选导出虚拟BV候选。
1)在一个示例中,可将偏移添加到BV候选的水平和/或垂直分量上以获得虚拟BV候选。
2)在一个示例中,可将偏移添加到HMVP表中的HMVP候选的水平和/或垂直分量上以获得虚拟BV候选。
iii.添加默认候选
1)在一个示例中,可以添加(0,0)作为默认候选。
2)在一个示例中,可以根据当前块的维度导出默认候选。
11.maxIBCAMVPNum可以不等于2。
a.可替代地,此外,可以信令通知可以大于1的索引,而不是信令通知指示运动矢量预测器索引的标志(例如,mvp_10_flag)。
i.在一个示例中,可以用一元/截断一元/固定长度/指数哥伦布/其它二值化方法对索引进行二值化。
ii.在一个示例中,索引的二进制的二进制数(bin)字符串的二进制数可以被上下文编解码或旁路编解码。
1)在一个示例中,可以对索引的二进制的二进制数字符串的前K个(例如,K=1)位进行上下文编解码,并且剩余位进行旁路编解码。
b.在一个示例中,maxIBCAMVPNum可以大于maxIBCMrgNum。
i.可替代地,此外,可将BV候选列表中的前maxIBCMrgNum个BV候选用于IBC Merge编解码块。
12.即使将maxIBCCandNum设置为0(例如,MaxNumMergeCand=0),仍然可以构建IBC BV候选列表。
a.在一个示例中,可以在启用IBC AMVP模式时构建Merge列表。
b.在一个示例中,当IBC Merge模式被禁用时,Merge列表可以被构建为包含多达maxIBCAMVPNum个BV候选。
13.对于以上公开的方法,术语“maxIBCCandNum”可以由“maxIBCMrgNum”或“maxIBCAMVPNum”代替。
14.对于以上公开的方法,术语“maxIBCCandNum”和/或“maxIBCMrgNum”可以由MaxNumMergeCand代替,该MaxNumMergeCand可以代表常规Merge列表的Merge候选的最大数量。
5实施例
在JVET-N1001-v5上新添加的部分包含在双粗体花括号内,即,{{a}}指示已添加“a”,而删除的部分包含在双粗体括号内,即,[[a]]表示“a”已被删除。
5.1实施例#1
可以在条带头/PPS/APS/DPS中信令通知IBC运动候选的最大数量的指示(例如,用于IBC AMVP和/或IBC Merge)。
7.3.5.1一般条带头语法
Figure BDA0003372935180000461
Figure BDA0003372935180000471
{{max_num_merge_cand_minus_max_num_IBC_cand指定从MaxNumMergeCand减去的条带中支持的IBC Merge模式候选的最大数量。IBC Merge模式候选的最大数量MaxNumIBCMergeCand如下导出:
MaxNumIBCMergeCand=MaxNumMergeCand-max_num_merge_cand_minus_max_num_IBC_cand
当存在max_num_merge_cand_minus_max_num_IBC_cand时,MaxNumIBCMergeCand的值应在2(或0)至MaxNumMergeCand的范围内(包括端值)。当不存在max_num_merge_cand_minus_max_num_IBC_cand时,MaxNumIBCMergeCand设置为等于0。当MaxNumIBCMergeCand等于0时,当前条带不允许使用IBC Merge模式和IBC AMVP模式。}}
可替代地,MaxNumIBCMergeCand的指示的信令通知可以替换为:
Figure BDA0003372935180000481
MaxNumIBCMergeCand=5-five_minus_max_num_IBC_cand}}
5.2实施例#2
建议将IBC BV列表的最大数量从同时控制IBC和常规帧间模式的MaxNumMergeCand更改为单独的变量MaxNumIBCMergeCand。
8.6.2.2 IBC亮度运动矢量预测的导出过程
仅当CuPredMode[xCb][yCb]等于MODE_IBC时才调用此过程,其中(xCb,yCb)指定相对于当前图片的左上亮度样点的当前亮度编解码块的左上样点。
此过程的输入是:
–当前亮度编解码块左上样点相对于当前图片左上亮度样点的亮度位置(xCb,yCb),
–变量cbWidth,指定亮度样点中当前编解码块的宽度,
–变量cbHeight,指定亮度样点中当前编解码块的高度。
此过程的输出是:
–1/16分数样点准确度mvL的亮度运动矢量。
变量xSmr、ySmr、smrWidth、smrHeight和smrNumHmvpIbcCand如下导出:
xSmr=IsInSmr[xCb][yCb]?SmrX[xCb][yCb]:xCb(8-910)
ySmr=IsInSmr[xCb][yCb]?SmrY[xCb][yCb]:yCb(8-911)
smrWidth=IsInSmr[xCb][yCb]?SmrW[xCb][yCb]:cbWidth
(8-912)
smrHeight=IsInSmr[xCb][yCb]?SmrH[xCb][yCb]:cbHeight
(8-913)
smrNumHmvpIbcCand=IsInSmr[xCb][yCb]?NumHmvpSmrIbcCand:NumHmvpIbcCand
(8-914)
亮度运动矢量mvL通过以下有序步骤导出:
1.以将亮度编解码块位置(xCb,yCb)设置为等于(xSmr,ySmr),亮度编解码块宽度cbWidth、亮度编解码块高度cbHeight设置为等于smrWidth和smrHeight作为输入,并且输出是可用性标志availableFlagA1、availableFlagB1和运动矢量mvA1和mvB1,来调用第8.6.2.3条中规定的从相邻编解码单元的空域运动矢量候选的导出过程。
2.运动矢量候选列表mvCandList的构建如下:
i=0
if(availableFlagA1)
mvCandList[i++]=mvA1 (8-915)
if(availableFlagB1)
mvCandList[i++]=mvB1
3.变量numCurrCand设置为等于mvCandList中Merge候选的数量。
4.当numCurrCand小于[[MaxNumMergeCand]]{{MaxNumIBCMergeCand}}并且smrNumHmvpIbcCand大于0时,以mvCandList、将isInSmr设置为等于IsInSmr[xCb][yCb]和numCurrCand作为输入,并且将修改的mvCandList和numCurrCand作为输出,来调用8.6.2.4中规定的基于IBC历史的运动矢量候选的导出过程。
5.当numCurrCand小于[[MaxNumMergeCand]]{{MaxNumIBCMergeCand}}时,以下内容适用,直到numCurrCand等于MaxNumMergeCand:
1.mvCandList[numCurrCand][0]设置为等于0。
2.mvCandList[numCurrCand][1]设置为等于0。
3.numCurrCand增加1。
6.变量mvIdx如下导出:
mvIdx=general_merge_flag[xCb][yCb]?merge_idx[xCb][yCb]:mvp_l0_flag[xCb][yCb](0-29)
7.进行以下分配:
mvL[0]=mergeCandList[mvIdx][0](8-917)
mvL[1]=mergeCandList[mvIdx][1](8-918)
在一个示例中,如果当前块是IBC Merge模式,则将MaxNumIBCMergeCand设置为MaxNumMergeCand;并且如果当前块为IBC AMVP模式,则将MaxNumIBCMergeCand设置为2。
在一个示例中,诸如使用实施例#1,从信令通知的信息中导出MaxNumIBCMergeCand。
5.3实施方案#3
根据允许的IBC候选的最大数量,对IBC有关的语法元素进行有条件的信令通知。在一个示例中,MaxNumIBCMergeCand被设置为等于MaxNumMergeCand。
7.3.7.5编解码单元语法
Figure BDA0003372935180000501
Figure BDA0003372935180000511
cu_skip_flag[x0][y0]等于1指定对于当前编解码单元,当解码P或B条带时,在cu_skip_flag[x0][y0]]之后,除了以下一个或多个语法元素外,不再解析其它语法元素:IBC模式标志pred_mode_ibc_flag[x0][y0]{{如果MaxNumIBCMergeCand大于0}},以及merge_data()语法结构;当解码I条带{{并且MaxNumIBCMergeCand大于0}}时,在cu_skip_flag[x0][y0]之后将不再解析除merge_idx[x0][y0]之外的其它语法元素。cu_skip_flag[x0][y0]等于0指示不跳过编解码单元。矩阵索引x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
当不存在cu_skip_flag[x0][y0]时,则将其推断为等于0。
pred_mode_ibc_flag等于1指定当前编解码单元以IBC预测模式编解码。pred_mode_ibc_flag等于0指定当前编解码单元不以IBC预测模式编解码。
当不存在pred_mode_ibc_flag时,可如下推断:
–如果cu_skip_flag[x0][y0]等于1,且cbWidth等于4,cbHeight等于4,则pred_mode_ibc_flag被推断为等于1。
–否则,如果cbWidth和cbHeight都等于128,则pred_mode_ibc_flag被推断为等于0。
–否则,当解码I条带{{并且MaxNumIBCMergeCand大于0}}时,pred_mode_ibc_flag被推断为等于sps_ibc_enabled_flag的值,并且当分别解码P或B条带时,pred_mode_ibc_flag被推断为等于0。
5.4实施例#3
根据允许的IBC候选的最大数量,对IBC有关的语法元素进行有条件的信令通知。
Figure BDA0003372935180000521
Figure BDA0003372935180000531
在一个示例中,MaxNumIBCAMVPCand可以被设置为MaxNumIBCMergeCand或MaxNumMergeCand。
图20A示出了用于视频处理的示例方法2000。方法2000包括:在操作2002,在视频的视频区域和所述视频的比特流表示之间进行转换,比特流表示基于所述视频区域的转换期间使用的第一类型的IBC候选的最大数量,选择性地包括帧内块复制(IBC)高级运动矢量预测(AMVP)模式的运动矢量差(MVD)有关的语法元素。在一些实施例中,当应用IBC模式时,从对应于所述视频区域的视频图片中的其它样点来预测所述视频区域的样点。
图20B示出了用于视频处理的示例方法2005。方法2005包括:在操作2007,对于视频的视频区域和所述视频的比特流表示之间的转换,确定对所述视频区域禁用帧内块复制(IBC)模式的使用并在所述视频的序列级启用所述IBC模式的使用的指示。
方法2005包括,在操作2009,基于所述确定进行所述转换。在一些实施例中,当应用了所述IBC模式时,从对应于所述视频区域的视频图片中的其它样点来预测所述视频区域的样点。
图20C示出了用于视频处理的示例方法2010。方法2010包括:在操作2012,在视频的视频区域和所述视频的比特流表示之间进行转换,比特流表示基于在所述视频区域的转换期间使用的第一类型的IBC候选的最大数量,选择性地包括关于帧内块复制(IBC)模式的使用的指示和/或一个或多个IBC有关的语法元素。在一些实施例中,当应用了所述IBC模式时,从对应于所述视频区域的视频图片中的其它样点来预测所述视频区域的样点。
图20D示出了用于视频处理的示例方法2020。方法2020包括:在操作2022,在视频的视频区域和所述视频的比特流表示之间进行转换,在所述视频区域的转换期间使用的第一类型的帧内块复制(IBC)候选的最大数量的指示,独立于在所述转换期间使用的帧间模式的Merge候选的最大数量在所述比特流表示中信令通知。在一些实施例中,当应用了所述IBC模式时,从对应于所述视频区域的视频图片中的其它样点来预测所述视频区域的样点。
图20E示出了用于视频处理的示例方法2030。方法2030包括:在操作2032,在视频的视频区域和所述视频的比特流表示之间进行转换,在所述视频区域的转换期间使用的帧内块复制(IBC)运动候选的最大数量是IBC Merge候选的最大数量和IBC高级运动矢量预测(AMVP)候选的最大数量的函数。在一些实施例中,当应用了所述IBC模式时,从对应于所述视频区域的视频图片中的其它样点来预测所述视频区域的样点。
图20F示出了用于视频处理的示例方法2040。方法2040包括:在操作2042,在视频的视频区域和所述视频的比特流表示之间进行转换,在所述视频区域的转换期间使用的帧内块复制(IBC)运动候选的最大数量基于所述视频区域的编解码的模式信息。
图20G示出了用于视频处理的示例方法2050。方法2050包括:在操作2052,在视频的视频区域和所述视频的比特流表示之间进行转换,解码的帧内块复制(IBC)高级运动矢量预测(AMVP)Merge索引或解码的IBC Merge索引小于帧内块复制(IBC)运动候选的最大数量。
图20H示出了用于视频处理的示例方法2060。方法2060包括:在操作2062,在视频的视频区域和所述视频的比特流表示之间的转换期间,确定帧内块复制(IBC)替代运动矢量预测器(AMVP)候选索引或IBC Merge候选索引无法识别在块矢量候选列表中的块矢量候选。
方法2060包括:在操作2064,基于所述确定在所述转换期间使用默认预测块。
图20I示出了用于视频处理的示例方法2070。方法2070包括:在操作2072,在视频的视频区域和所述视频的比特流表示之间的转换期间,确定帧内块复制(IBC)替代运动矢量预测器(AMVP)候选索引或IBC Merge候选索引无法识别在块矢量候选列表中的块矢量候选。
方法2070包括:在操作2074,基于所述确定通过将所述视频区视为具有无效块矢量进行所述转换。
图20J示出了用于视频处理的示例方法2080。方法2080包括:在操作2082,在视频的视频区域和所述视频的比特流表示之间的转换期间,确定帧内块复制(IBC)替代运动矢量预测器(AMVP)候选索引或IBC Merge候选索引无法满足条件。
方法2080包括:在操作2084,基于所述确定生成补充块矢量(BV)候选列表。
方法2080包括:在操作2086,使用所述补充BV候选列表进行所述转换。
图20K示出了用于视频处理的示例方法2090。方法2090包括:在操作2092,在视频的视频区域和所述视频的比特流表示之间进行转换,帧内块复制(IBC)高级运动矢量预测(AMVP)候选的最大数量不等于2。
图21是视频处理设备2100的框图。设备2100可用于实现本文所述的一个或多个方法。设备2100可以被实现在智能手机、平板计算机、计算机、物联网(IoT)接收器等中。设备2100可以包括一个或多个处理器2102、一个或多个存储器2104和视频处理硬件2106。(一个或多个)处理器2102可以被配置为实现本文所述的一个或多个方法。存储器(多个存储器)2104可用于存储用于实现本文所述的方法和技术的数据和代码。视频处理硬件2106可用于在硬件电路中实现本文所述的一些技术。视频处理硬件2106可以部分或全部地以专用硬件或图像处理单元(GPU)或专业信号处理块的形式包括在(一个或多个)处理器2102内。
在一些实施例中,视频编解码方法可以使用如关于图21所描述的在硬件平台上实现的设备来实现。
所公开技术的一些实施例包括作出决定或确定以启用视频处理工具或模式。在一个示例中,当启用视频处理工具或模式时,编码器将在处理视频块时使用或实现该工具或模式,但不一定基于工具或模式的使用来修改所产生的比特流。也就是说,从视频块到视频的比特流表示的转换将在基于决定或确定启用视频处理工具或模式时使用视频处理工具或模式。在另一个示例中,当启用视频处理工具或模式时,解码器将在已经知道比特流已基于视频处理工具或模式而被修改的情况下处理比特流。即,将使用基于决定或确定而启用的视频处理工具或模式来进行从视频的比特流表示到视频块的转换。
所公开技术的一些实施例包括作出决定或确定以禁用视频处理工具或模式。在一个示例中,当视频处理工具或模式被禁用时,编码器将在视频块到视频的比特流表示的转换中不使用该工具或模式。在另一示例中,当视频处理工具或模式被禁用时,解码器将在已经知道未使用基于决定或确定而启用的视频处理工具或模式来修改比特流的情况下处理比特流。
图22是示出其中可实现本文中所公开的各种技术的示例视频处理系统2200的框图。各种实现方式可以包括系统2200的一些或全部组件。系统2200可以包括用于接收视频内容的输入2202。视频内容可以以原始或未压缩的格式(例如8或10比特多分量像素值)接收,或者可以以压缩或编码的格式接收。输入2202可以代表网络接口、外围总线接口或存储接口。网络接口的示例包括有线接口(诸如以太网、无源光网络(PON)等)和无线接口(诸如Wi-Fi或蜂窝接口)。
系统2200可以包括可以实现本文中描述的各种编解码或编码方法的编解码组件2204。编解码组件2204可以减少从编解码组件2204的输入2202到输出的视频的平均比特率,以产生视频的编解码表示。因此,编解码技术有时称为视频压缩或视频转码技术。如组件2206所表示的,编解码组件2204的输出可以被存储或经由所连接的通信来发送。在输入2202处接收的视频的存储或传送的比特流(或编解码)表示可以被组件2208使用,以生成被发送到显示接口2210的像素值或可显示视频。从比特流表示中生成用户可见视频的过程有时称为视频解压缩。此外,尽管某些视频处理操作被称为“编解码”操作或工具,但是应当理解,在编码器处使用编解码工具或操作,并且将由编解码器执行反向编解码结果的对应解码工具或操作。
外围总线接口或显示接口的示例可以包括通用串行总线(USB)或高清多媒体接口(HDMI)或Displayport等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文中描述的技术可以实现在各种电子设备中,诸如移动电话、膝上型计算机、智能电话或其它能够执行数字数据处理和/或视频显示的设备。
在一些实施例中,可以实现以下技术方案:
A1.一种视频处理方法,包括:在视频的视频区域和所述视频的比特流表示之间进行转换,其中,所述比特流表示基于在所述视频区域的转换期间使用的第一类型的IBC候选的最大数量,选择性地包括帧内块复制(IBC)高级运动矢量预测(AMVP)模式的运动矢量差(MVD)有关的语法元素,其中,当应用IBC模式时,从对应于所述视频区域的视频图片中的其它样点来预测所述视频区域的样点。
A2.如方案A1所述的方法,其中,MVD有关的语法元素包括以下中的至少一个:编解码的运动矢量预测器索引、运动矢量预测器的编解码的精度、运动矢量差和IBC AMVP模式的运动矢量差的编解码的精度。
A3.如方案A1所述的方法,其中,基于所述第一类型的IBC候选的最大数量小于或等于K,所述比特流表示排除了对于IBC AMVP模式的MDV有关的语法元素的信令通知,并将所述IBC AMVP模式推断为禁用,并且其中,K是整数。
A4.如方案A1所述的方法,其中,基于所述第一类型的IBC候选的最大数量小于或等于K,所述比特流表示排除了对于运动矢量差的信令通知,并将所述IBC AMVP模式推断为禁用,并且其中,K是整数。
A5.如方案A1所述的方法,其中,基于所述第一类型的IBC候选的所述最大数量大于K,所述比特流表示选择性地包括以下中的至少一个:编解码的运动矢量预测器索引、运动矢量预测器的编解码的精度和IBC AMVP模式的运动矢量差的编解码的精度,并且其中,K是整数。
A6.如方案A3至A5中任一项所述的方法,其中,K=0或K=1。
A7.如方案A1所述的方法,其中,基于所述第一类型的IBC候选的最大数量等于1,所述比特流表示排除IBC AMVP模式的运动矢量预测器索引。
A8.如方案A19所述的方法,其中,所述IBC AMVP模式的运动矢量预测器索引被推断为零。
A9.如方案A1所述的方法,其中,基于所述第一类型的IBC候选的最大数量等于零,所述比特流表示排除运动矢量预测器的精度和/或所述IBC AMVP模式的运动矢量差的精度。
A10.如方案A1所述的方法,其中,基于所述第一类型的IBC候选的最大数量大于零,所述比特流表示排除运动矢量预测器的精度和/或所述IBC AMVP模式的运动矢量差的精度。
A11.如方案A1至A10中任一项所述的方法,其中,所述第一类型的IBC候选的最大数量是IBC运动候选的最大数量(表示为maxIBCCandNum)。
A12.如方案A1至A10中任一项所述的方法,其中,所述第一类型的IBC候选的最大数量是IBC Merge候选的最大数量(表示为maxIBCMrgNum)。
A13.如方案A1至A10中任一项所述的方法,其中,所述第一类型的IBC候选的最大数量是IBC高级运动矢量预测(AMVP)候选的最大数量(表示为maxIBCAMVPNum)。
A14.如方案A1至A10中任一项所述的方法,其中,所述第一类型的IBC候选的最大数量在所述比特流表示中信令通知。
A15.一种视频处理方法,包括:对于视频的视频区域和所述视频的比特流表示之间的转换,确定对所述视频区域禁用帧内块复制(IBC)模式的使用并在所述视频的序列级启用所述IBC模式的使用的指示;以及基于所述确定进行所述转换,其中,当应用所述IBC模式时,从对应于所述视频区域的视频图片中的其它样点来预测所述视频区域的样点。
A16.如方案A15所述的方法,其中,所述视频区域对应于所述视频图片的图片、条带、片、片组或组块。
A17.如方案A15或A16中所述的方法,其中,所述比特流表示包括与所述确定相关联的指示。
A18.如方案A17所述的方法,其中,所述指示在图片、条带、片、组块或自适应参数集(APS)中信令通知。
A19.如方案A18所述的方法,其中,所述指示在图片参数集(PPS)、条带头、图片头、片头、片组头或组块头中信令通知。
A20.如方案A15所述的方法,其中,基于所述视频的视频内容不同于屏幕内容来禁用所述IBC模式。
A21.如方案A15所述的方法,其中,基于所述视频的视频内容是相机捕获的内容来禁用所述IBC模式。
A22.一种视频处理方法,包括:在视频的视频区域和所述视频的比特流表示之间进行转换,其中,所述比特流表示基于在所述视频区域的转换期间使用的第一类型的IBC候选的最大数量,选择性地包括关于帧内块复制(IBC)模式的使用的指示和/或一个或多个IBC有关的语法元素,其中,当应用所述IBC模式时,从对应于所述视频区域的视频图片中的其它样点来预测所述视频区域的样点。
A23.如方案A22所述的方法,其中,所述第一类型的IBC候选的最大数量被设置为等于帧间编解码块的Merge候选的最大数量。
A24.如方案A22所述的方法,其中,基于所述第一类型的IBC候选的最大数量等于零,所述比特流表示排除IBC跳过模式的信令通知,并且所述IBC跳过模式被推断为禁用。
A25.如方案A22所述的方法,其中,基于所述第一类型的IBC候选的最大数量等于零,所述比特流表示排除IBC Merge模式或IBC高级运动矢量预测(AMVP)模式的信令通知,并且所述IBC模式被推断为禁用。
A26.如方案A22所述的方法,其中,基于所述第一类型的IBC候选的最大数量等于零,所述比特流表示排除Merge模式的信令通知,并且IBC Merge模式被推断为禁用。
A27.如方案A22至A26中任一项所述的方法,其中,所述第一类型的IBC候选的最大数量是IBC运动候选的最大数量(表示为maxIBCCandNum)、IBC Merge候选的最大数量(表示为maxIBCMrgNum)或IBC高级运动矢量预测(AMVP)候选的最大数量(表示为maxIBCAMVPNum)。
A28.如方案A22至A26中任一项所述的方法,其中,所述第一类型的IBC候选的最大数量在所述比特流表示中信令通知。
A29.如方案A1至A28中任一项所述的方法,其中,所述转换包括:从所述比特流表示生成所述视频区域的像素值。
A30.如方案A1至A28中任一项所述的方法,其中,所述转换包括:从所述视频区域的像素值生成所述比特流表示。
A31.一种视频处理设备,包括处理器,该处理器被配置为实现方案A1到A30中的任一项或多项所述的方法。
A32.一种存储程序代码的计算机可读介质,该程序代码在被执行时,使得处理器实现方案A1到A30中的任一项或多项所述的方法。
在一些实施例中,可以实现以下技术方案:
B1.一种视频处理方法,包括:在视频的视频区域和所述视频的比特流表示之间进行转换,其中,在所述视频区域的转换期间使用的第一类型的帧内块复制(IBC)候选的最大数量的指示,独立于在所述转换期间使用的帧间模式的Merge候选的最大数量在所述比特流表示中信令通知,其中,当应用所述IBC模式时,从对应于所述视频区域的视频图片中的其它样点来预测所述视频区域的样点。
B2.如方案B1所述的方法,其中,所述第一类型的IBC候选的最大数量直接在所述比特流表示中信令通知。
B3.如方案B1所述的方法,其中,由于对于所述视频区域的转换启用了IBC模式,所述第一类型的IBC候选的最大数量大于零。
B4.如方案B1至B3中任一项所述的方法,还包括:使用另一个值预测性地编解码所述第一类型的IBC候选的最大数量(表示为maxNumIBC)。
B5.如方案B4所述的方法,其中,所述第一类型的IBC候选的最大数量的指示被设置为所述预测性编解码之后的差。
B6.如方案B5所述的方法,其中,所述差在所述另一个值和所述第一类型的IBC候选的最大数量之间。
B7.如方案B6所述的方法,其中,所述另一个值是常规Merge列表的尺寸(S),其中(S-maxNumIBC)在所述比特流中信令通知,并且其中S是整数。
B8.如方案B6所述的方法,其中,所述另一个值是固定的整数(K),并且其中(K-maxNumIBC)在所述比特流中信令通知。
B9.如方案B8所述的方法,其中,K=5或K=6。
B10.如方案B6至B9中任一项所述的方法,其中,所述第一类型的IBC候选的最大数量被导出为(K–在所述比特流中信令通知的所述最大数量的指示)。
B11.如方案B5所述的方法,其中,所述差在所述第一类型的IBC候选的最大数量和所述另一个值之间。
B12.如方案B11所述的方法,其中,所述另一个值是固定的整数(K),并且其中(maxNumIBC–K)在所述比特流中信令通知。
B13.如方案B12所述的方法,其中K=0或K=2。
B14.如方案B11至B13中任一项所述的方法,其中,所述第一类型的IBC候选的最大数量被导出为(在所述比特流中信令通知的所述最大数量的指示+K)。
B15.如方案B1至B14中任一项所述的方法,其中,所述第一类型的IBC候选的最大数量是IBC运动候选的最大数量(表示为maxIBCCandNum)。
B16.如方案B1至B14中任一项所述的方法,其中,所述第一类型的IBC候选的最大数量是IBC Merge候选的最大数量(表示为maxIBCMrgNum)。
B17.如方案B1至B14中任一项所述的方法,其中,所述第一类型的IBC候选的最大数量是IBC高级运动矢量预测(AMVP)候选的最大数量(表示为maxIBCAMVPNum)。
B18.一种视频处理方法,包括:在视频的视频区域和所述视频的比特流表示之间进行转换,其中,在所述视频区域的转换期间使用的帧内块复制(IBC)运动候选的最大数量(表示为maxIBCCandNum)是IBC Merge候选的最大数量(表示为maxIBCMrgNum)和IBC高级运动矢量预测(AMVP)候选的最大数量(表示为maxIBCAMVPNum)的函数,其中,当应用所述IBC模式时,从对应于所述视频区域的视频图片中的其它样点来预测所述视频区域的样点。
B19.如方案B18所述的方法,其中,maxIBCAMVPNum等于2。
B20.如方案B18或B19中所述的方法,其中,所述函数返回其较大的对象。
B21.一种视频处理方法,包括:在视频的视频区域和所述视频的比特流表示之间进行转换,其中,在所述视频区域的转换期间使用的帧内块复制(IBC)运动候选的最大数量(表示为maxIBCCandNum)基于所述视频区域的编解码的模式信息。
B22.如方案B21所述的方法,其中,基于所述视频区域以IBC Merge模式编解码,maxIBCCandNum被设置为IBC Merge候选的最大数量(表示为maxIBCMrgNum)。
B23.如方案B21所述的方法,其中,基于所述视频区域以IBC AMVP模式编解码,maxIBCCandNum被设置为IBC高级运动矢量预测(AMVP)候选的最大数量(表示为maxIBCAMVPNum)。
B24.一种视频处理方法,包括:在视频的视频区域和所述视频的比特流表示之间进行转换,其中,解码的帧内块复制(IBC)高级运动矢量预测(AMVP)Merge索引或解码的IBCMerge索引小于IBC运动候选的最大数量(表示为maxIBCCandNum)。
B25.如方案B24所述的方法,其中,解码的IBC AMVP Merge索引小于IBC AMVP候选的最大数量(表示为maxIBCAMVPNum)。
B26.如方案B24所述的方法,其中,所述解码的IBC Merge索引小于IBC Merge候选的最大数量(表示为maxIBCMrgNum)。
B27.如方案B26所述的方法,其中,maxIBCMrgNum=2。
B28.一种视频处理方法,包括:在视频的视频区域和所述视频的比特流表示之间的转换期间,确定帧内块复制(IBC)替代运动矢量预测器(AMVP)候选索引或IBC Merge候选索引无法识别在块矢量候选列表中的块矢量候选;以及基于所述确定在所述转换期间使用默认预测块。
B29.如方案B28所述的方法,其中,默认预测块的每个样点被设置为(1<<(比特深度-1)),其中比特深度是正整数。
B30.如方案B28所述的方法,其中,默认块矢量被分配给默认预测块。
B31.一种视频处理方法,包括:在视频的视频区域和所述视频的比特流表示之间的转换期间,确定帧内块复制(IBC)替代运动矢量预测器(AMVP)候选索引或IBC Merge候选索引无法识别在块矢量候选列表中的块矢量候选;以及基于所述确定通过将所述视频区视为具有无效块矢量进行所述转换。
B32.一种视频处理方法,包括:在视频的视频区域和所述视频的比特流表示之间的转换期间,确定帧内块复制(IBC)替代运动矢量预测器(AMVP)候选索引或IBC Merge候选索引无法满足条件;基于所述确定生成补充块矢量(BV)候选列表;以及使用所述补充BV候选列表进行所述转换。
B33.如方案B32所述的方法,其中,所述条件包括所述IBC AMVP候选索引或所述IBC Merge候选索引不小于用于所述视频区域的IBC运动候选的最大数量的。
B34.如方案B32或B33所述的方法,其中,所述补充BV候选矢量列表使用以下步骤生成:添加一个或多个基于历史的运动矢量预测(HMVP)候选,从其它BV候选生成一个或多个虚拟BV候选;以及添加一个或多个默认候选。
B35.如方案B34所述的方法,其中,所述步骤按顺序进行。
B36.如方案B34所述的方法,其中,所述步骤以交织的方式进行。
B37.一种视频处理方法,包括:在视频的视频区域和所述视频的比特流表示之间进行转换,其中,帧内块复制(IBC)高级运动矢量预测(AMVP)候选的最大数量(表示为maxIBCAMVPNum)不等于二。
B38.如方案B37所述的方法,其中,所述比特流表示排除指示运动矢量预测器索引的标志,并且包括具有大于一的值的索引。
B39.如方案B38所述的方法,其中使用一元、截断一元、固定长度或指数哥伦布表示对所述索引进行二进制编解码。
B40.如方案B38所述的方法,其中,所述索引的二进制的二进制数字符串的二进制数是上下文编解码的或旁路编解码的。
B41.如方案B37所述的方法,其中,maxIBCAMVPNum大于IBC Merge候选的最大数量(表示为maxIBCMrgNum)。
B42.一种视频处理的方法,包括在视频区域和所述视频区域的比特流表示之间的转换期间,确定帧内块复制(IBC)运动候选的最大数量为零,以及基于所述确定通过在所述转换期间生成IBC块矢量候选列表来进行所述转换。
B43.如方案B42所述的方法,其中,所述转换还包括基于IBC高级运动矢量预测(AMVP)模式对于所述视频区域的转换被启用而生成Merge列表。
B44.如方案B42所述的方法,其中,所述转换还包括基于IBC Merge模式对于所述视频区域的转换被禁用而生成具有长度达IBC AMVP候选的最大数量的Merge列表。
B45.如方案B1至B44中任一项所述的方法,其中,所述转换包括:从所述比特流表示生成所述视频区域的像素值。
B46.如方案B1至B44中任一项所述的方法,其中,所述转换包括:从所述视频区域的像素值生成所述比特流表示。
B47.一种视频处理设备,包括处理器,该处理器被配置为实现如方案B1至B46中的任一项或多项所述的方法。
B48.一种存储程序代码的计算机可读介质,该程序代码在被执行时,使得所述处理器实现方案B1到B46中的任一项或多项所述的方法。
在一些实施例中,可以实现以下技术方案:
C1.一种视频处理方法,包括:在视频的视频区域和视频区域的比特流表示之间的转换期间,确定对于视频区域禁用帧内块复制模式并对视频的其它视频区域启用帧内块复制模式;以及基于所述确定进行转换;其中,在帧内块复制模式中,从对应于所述视频区域的视频图片中的其它像素来预测所述视频区域的像素。
C2.如方案C1所述的方法,其中,视频区域对应于视频图片或视频图片的条带或片或片组或组块。
C3.如方案C1-C2中的任一项所述的方法,其中,比特流表示包括关于确定的指示。
C4.如方案C3所述的方法,其中,所述指示被包括在图片或条带或片或片组或组块级。
C5.一种视频处理的方法,包括:在视频的视频区域和所述视频的比特流表示之间进行转换,其中,所述比特流表示选择性地包括指示,所述指示关于确定在所述视频区域的转换期间使用的IBC运动候选的最大数量(指示为maxIBCCandNum)等于在所述转换期间使用的Merge候选的最大数量(指示为MaxNumMergeCand)。
C6.如方案C5所述的方法,其中,maxIBCCandNum等于零,并且由于maxIBCCCardNum等于零,所以比特流表示排除了某些IBC信息的信令通知。
C7.一种视频处理的方法,包括:在视频的视频区域和所述视频的比特流表示之间进行转换,其中,所述比特流表示取决于在所述视频区域的转换期间使用的帧内块复制运动候选的最大数量的值(指示为maxIBCCandNum)满足条件,包括帧内块复制替代运动矢量预测器的运动矢量差有关的语法元素;其中,在所述帧内块复制模式中,从对应于所述视频区域的视频图片中的其它像素来预测所述视频区域的像素。
C8.如方案C7所述的方法,其中,所述条件包括maxIBCCandNum等于在所述转换期间使用的Merge候选的最大数量(指示为MaxNumMergeCand)。
C9.如方案C8所述的方法,其中maxIBCCandNum等于0,并且由于maxIBCCandNum等于0,因此从比特流表示中省略了对帧内块复制替代运动矢量预测器的运动矢量预测器索引的信令通知。
C10.如方案C8所述的方法,其中,maxIBCCandNum等于0,并且由于maxIBCCandNum等于0,因此从比特流表示中省略了对于帧内块复制替代运动矢量预测器的运动矢量差的信令通知。
C11.一种视频处理的方法,包括:在视频的视频区域和所述视频的比特流表示之间进行转换,其中,在所述视频区域的转换期间使用的帧内块复制运动候选的最大数量(指示为maxIBCCandNum),独立于在所述转换中使用的Merge候选的最大数量(指示为MaxNumMergeCand)在所述比特流表示中信令通知;其中,帧内块复制对应于其中从对应于所述视频区域的视频图片中的其它像素来预测所述视频区域的像素的模式。
C12.如方案C11所述的方法,其中,由于对于所述视频区域的转换被启用帧内块复制,MaxIBCCandNum大于零。
C13.如方案C11-C12中的任一项所述的方法,其中,通过使用另一个值进行预测性编解码,在比特流表示中信令通知maxIBCCandNum。
C14.如方案C13所述的方法,其中,另一个值是MaxNumMergeCand。
C15.如方案C13所述的方法,其中,另一个值是常数K。
C16.一种视频处理的方法,包括:在视频的视频区域和所述视频的比特流表示之间进行转换,其中,在所述视频区域的转换期间使用的帧内块复制(IBC)运动候选的最大数量(指示为maxIBCCandNum)取决于所述视频区域的编解码模式信息;其中,IBC对应于从对应于所述视频区域的视频图片中的其它像素来预测所述视频区域的像素的模式。
C17.如方案C16所述的方法,当以IBC Merge模式对块编解码时,将maxIBCCandNum设置为IBC Merge候选的最大数量,表示为maxIBCMrgNum。
C18.如方案C16所述的方法,当以IBC替代运动矢量预测候选(AMVP)模式对块编解码时,将maxIBCCandNum设置为IBC AMVP数量的最大数量,表示为maxIBCAMVPNum。
C19.如方案C17所述的方法,maxIBCMrgNum在条带头中信令通知。
C20.如方案C17所述的方法,maxIBCMrgNum设置为与允许的非IBC平移Merge候选的最大数量相同。
C21.如方案C18所述的方法,maxIBCAMVPNum设置为2。
C22.一种视频处理的方法,包括:在视频的视频区域和所述视频的比特流表示之间进行转换,其中,在所述视频区域的转换期间使用的帧内块复制(IBC)运动候选的最大数量(指示为maxIBCCandNum)是IBC Merge候选的最大数量(表示为maxIBCMrgNum)和IBC替代运动矢量预测候选数量的最大数量(表示为maxIBCAMVPNum)的第一函数;其中,IBC对应于从对应于所述视频区域的视频图片中的其它像素来预测所述视频区域的像素的模式。
C23.如方案C22所述的方法,其中,maxIBCAMVPNum等于2。
C24.如方案C22-C23所述的方法,其中,在所述转换期间,解码的IBC替代运动矢量预测器索引小于maxIBCAMVPNum。
C25.一种视频处理的方法,包括:在视频的视频区域和所述视频的比特流表示之间的转换期间,确定帧内块复制替代运动矢量预测器索引或帧内块复制Merge候选索引无法识别块矢量候选列表中的块矢量候选;以及基于所述确定在所述转换期间使用默认的预测块。
C26.一种视频处理的方法,包括:在视频的视频区域和所述视频的比特流表示之间的转换期间,确定帧内块复制替代运动矢量预测器索引或帧内块复制Merge候选索引无法识别块矢量候选列表中的块矢量候选;以及基于所述确定通过将所述视频区域视为具有无效块矢量而进行转换。
C27.一种视频处理的方法,包括:在视频的视频区域和所述视频的比特流表示之间的转换期间,确定帧内块复制替代运动矢量预测器索引或帧内块复制Merge候选索引无法满足条件;以及基于所述确定生成补充块矢量(BV)候选列表;以及使用所述补充块矢量候选列表进行所述转换。
C28.如方案C27所述的方法,其中,所述条件包括帧内块复制替代运动矢量预测器索引或所述帧内块复制Merge候选索引小于视频区域的帧内块复制候选的最大数量。
C29.如方案C27-C28中任一项所述的方法,其中,所述补充BV候选矢量列表使用以下步骤生成:生成基于历史的运动矢量预测器候选,从其它BV候选生成虚拟的BV候选;以及添加默认候选。
C30.如方案C29所述的方法,其中,所述步骤按顺序进行。
C31.如方案C29所述的方法,其中,所述步骤以交织的方式进行。
C32.一种视频处理的方法,包括:在视频的视频区域和所述视频的比特流表示之间进行转换,其中,IBC替代运动矢量预测候选的最大数量(表示为maxIBCAMVPNum)不等于2;其中,IBC对应于从对应于所述视频区域的视频图片中的其它像素来预测所述视频区域的像素的模式。
C33.如方案C32所述的方法,其中,比特流表示排除指示运动矢量预测器索引的第一标志,并且包括具有大于一的值的索引。
C34.如方案C32-C33中的任一项所述的方法,其中,使用以一元/截断一元/固定长度/指数哥伦布/其他二值化表示的二值化来对索引进行编解码。
C35.一种视频处理的方法,包括:在视频区域和所述视频区域的比特流表示之间的转换期间,确定帧内块复制(IBC)候选的最大数量为零,以及基于所述确定通过在所述转换期间生成IBC块矢量候选列表来进行所述转换;其中,IBC对应于从对应于所述视频区域的视频图片中的其它像素来预测所述视频区域的像素的模式。
C36.如方案C35所述的方法,其中,所述转换还包括:通过假设对于所述视频区域的转换启用了IBC替代运动矢量预测器模式来生成Merge列表。
C37.如方案C34所述的方法,其中,所述转换还包括:在对于所述视频区域的转换禁用IBC Merge模式的情况下,生成Merge列表,该Merge列表的长度具有达到IBC高级运动矢量预测器候选的最大数量。
C38.如方案C1-C37中的任一项所述的方法,其中,所述转换包括:从所述比特流表示生成所述视频区域的像素值。
C39.如方案C1-C37中的任一项所述的方法,其中,所述转换包括:从所述视频区域的像素值生成所述比特流表示。
C40.一种视频处理设备,包括处理器,该处理器被配置为实施如方案C1至C39中的任一项或多项所述的方法。
C41.一种存储程序代码的计算机可读介质,该程序代码在被执行时,使得所述处理器实现如方案C1至C39中的任一项或多项所述的方法。
本文件中描述的公开和其它方案、示例、实施例、模块和功能操作可以以数字电子电路实现,或者以计算机软件、固件或硬件实现,包括本文件中公开的结构及其结构等同物,或者以它们中的一个或多个的组合实现。公开和其它实施例可以实现为一个或多个计算机程序产品,即,在计算机可读介质上编码的一个或多个计算机程序指令模块,用于由数据处理设备执行或控制数据处理设备的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器装置、影响机器可读传播信号的物质组成、或者它们中的一个或多个的组合。术语“数据处理装置”涵盖用于处理数据的所有设备、装置和机器,包括例如可编程处理器、计算机或多个处理器或计算机。除了硬件之外,该设备还可以包括为所讨论的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统、或者它们中的一个或多个的组合的代码。传播信号是人工生成的信号,例如机器生成的电信号、光信号或电磁信号,其被生成以对信息进行编码以便传输到合适的接收器设备。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言编写,包括编译或解释语言,并且可以以任何形式来部署计算机程序,包括独立程序或适合在计算环境中使用的模块、组件、子例程或其它单元。计算机程序并不必需对应于文件系统中的文件。程序可以存储在文件的保存其它程序或数据(例如,存储在标志语言文档中的一个或多个脚本)的部分中,存储在专用于所讨论的程序的单个文件中,或存储在多个协调文件中(例如,存储一个或多个模块、子程序或代码部分的文件)。可以部署计算机程序以在一个计算机上或在位于一个站点上或分布在多个站点上并通过通信网络互连的多个计算机上执行。
本文件中描述的过程和逻辑流程可以由执行一个或多个计算机程序的一个或多个可编程处理器执行,以通过对输入数据进行操作并生成输出来执行功能。过程和逻辑流程也可以由专用逻辑电路执行,并且设备也可以实现为专用逻辑电路,例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
举例来说,适合于执行计算机程序的处理器包括通用和专用微处理器、以及任何种类的数字计算机的任一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器装置。通常,计算机还将包括或可操作地耦合到用于存储数据的一个或多个大容量存储装置(例如磁盘、磁光盘或光盘),以从该一个或多个大容量存储装置接收数据,或将数据传输到该一个或多个大容量存储装置,或者既接收又传输数据。然而,计算机不需要具有这样的装置。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器装置,包括例如半导体存储器装置,例如EPROM、EEPROM和闪存装置;磁盘,例如内部硬盘或可移动磁盘;磁光盘;以及CD ROM和DVD-ROM磁盘。处理器和存储器可以由专用逻辑电路补充或并入专用逻辑电路中。
虽然本专利文件包含许多细节,但这些细节不应被解释为对任何主题或可要求保护的范围的限制,而是作为特定于特定技术的特定实施例的特征的描述。在本专利文件中,在单独的实施例的上下文中描述的某些特征也可以在单个实施例中组合实现。相反,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合在多个实施例中实现。此外,尽管上面的特征可以描述为以某些组合起作用并且甚至最初如此要求权利保护,但是在某些情况下,可以从所要求保护的组合中去除来自该组合的一个或多个特征,并且所要求保护的组合可以指向子组合或子组合的变型。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应该被理解为要求以所示的特定顺序或按顺序执行这样的操作,或者执行所有示出的操作,以实现期望的结果。此外,在本专利文件中描述的实施例中的各种系统组件的分开不应被理解为在所有实施例中都要求这种分开。
仅描述了几个实现方式和示例,并且可以基于本专利文件中描述和示出的内容来作出其它实现方式、增强和变型。

Claims (48)

1.一种视频处理方法,包括:
在视频的视频区域和所述视频的比特流表示之间进行转换,其中,在所述视频区域的转换期间使用的第一类型的帧内块复制IBC候选的最大数量的指示,独立于在所述转换期间使用的帧间模式的Merge候选的最大数量在所述比特流表示中信令通知,
其中,当应用所述IBC模式时,从对应于所述视频区域的视频图片中的其他样点来预测所述视频区域的样点。
2.如权利要求1所述的方法,其中,所述第一类型的IBC候选的最大数量直接在所述比特流表示中信令通知。
3.如权利要求1所述的方法,其中,由于对于所述视频区域的转换启用了IBC模式,所述第一类型的IBC候选的最大数量大于零。
4.如权利要求1至3中任一项所述的方法,还包括:
使用另一个值预测性地编解码所述第一类型的IBC候选的最大数量(表示为maxNumIBC)。
5.如权利要求4所述的方法,其中,所述第一类型的IBC候选的最大数量的指示被设置为所述预测性编解码之后的差。
6.如权利要求5所述的方法,其中,所述差在所述另一个值和所述第一类型的IBC候选的最大数量之间。
7.如权利要求6所述的方法,其中,所述另一个值是常规Merge列表的尺寸(S),其中(S-maxNumIBC)在所述比特流中信令通知,并且其中S是整数。
8.如权利要求6所述的方法,其中,所述另一个值是固定的整数(K),并且其中,(K-maxNumIBC)在所述比特流中信令通知。
9.如权利要求8所述的方法,其中,K=5或K=6。
10.如权利要求6至9中任一项所述的方法,其中,所述第一类型的IBC候选的最大数量被导出为(K–在所述比特流中信令通知的所述最大数量的指示)。
11.如权利要求5所述的方法,其中,所述差在所述第一类型的IBC候选的最大数量和所述另一个值之间。
12.如权利要求11所述的方法,其中,所述另一个值是固定的整数(K),并且其中(maxNumIBC–K)在所述比特流中信令通知。
13.如权利要求12所述的方法,其中K=0或K=2。
14.如权利要求11至13中任一项所述的方法,其中,所述第一类型的IBC候选的最大数量被导出为(在所述比特流中信令通知的所述最大数量的指示+K)。
15.如权利要求1至14中任一项所述的方法,其中,所述第一类型的IBC候选的最大数量是IBC运动候选的最大数量(表示为maxIBCCandNum)。
16.如权利要求1至14中任一项所述的方法,其中,所述第一类型的IBC候选的最大数量是IBC Merge候选的最大数量(表示为maxIBCMrgNum)。
17.如权利要求1至14中任一项所述的方法,其中,所述第一类型的IBC候选的最大数量是IBC高级运动矢量预测(AMVP)候选的最大数量(表示为maxIBCAMVPNum)。
18.一种视频处理方法,包括:
在视频的视频区域和所述视频的比特流表示之间进行转换,其中,在所述视频区域的转换期间使用的帧内块复制IBC运动候选的最大数量(表示为maxIBCCandNum),是IBCMerge候选的最大数量(表示为maxIBCMrgNum)和IBC高级运动矢量预测(AMVP)候选的最大数量(表示为maxIBCAMVPNum)的函数,
其中,当应用所述IBC模式时,从对应于所述视频区域的视频图片中的其他样点来预测所述视频区域的样点。
19.如权利要求18所述的方法,其中,maxIBCAMVPNum等于2。
20.如权利要求18或19所述的方法,其中,所述函数返回其较大的对象。
21.一种视频处理方法,包括:
在视频的视频区域和所述视频的比特流表示之间进行转换,其中,在所述视频区域的转换期间使用的帧内块复制IBC运动候选的最大数量(表示为maxIBCCandNum),基于所述视频区域的编解码的模式信息。
22.如权利要求21所述的方法,其中,基于所述视频区域以IBC Merge模式编解码,maxIBCCandNum被设置为IBC Merge候选的最大数量(表示为maxIBCMrgNum)。
23.如权利要求21所述的方法,其中,基于所述视频区域以IBC AMVP模式编解码,maxIBCCandNum被设置为IBC高级运动矢量预测(AMVP)候选的最大数量(表示为maxIBCAMVPNum)。
24.一种视频处理方法,包括:
在视频的视频区域和所述视频的比特流表示之间进行转换,其中,解码的帧内块复制IBC高级运动矢量预测AMVP Merge索引或解码的IBC Merge索引小于IBC运动候选的最大数量(表示为maxIBCCandNum)。
25.如权利要求24所述的方法,其中,所述解码的IBC AMVP Merge索引小于IBC AMVP候选的最大数量(表示为maxIBCAMVPNum)。
26.如权利要求24所述的方法,其中,所述解码的IBC Merge索引小于IBC Merge候选的最大数量(表示为maxIBCMrgNum)。
27.如权利要求26所述的方法,其中,maxIBCMrgNum=2。
28.一种视频处理方法,包括:
在视频的视频区域和所述视频的比特流表示之间的转换期间,确定帧内块复制IBC替代运动矢量预测器AMVP候选索引或IBC Merge候选索引无法识别在块矢量候选列表中的块矢量候选;以及
基于所述确定在所述转换期间使用默认预测块。
29.如权利要求28所述的方法,其中,所述默认预测块的每个样点被设置为(1<<(BitDepth-1)),其中BitDepth是正整数。
30.如权利要求28所述的方法,其中,默认块矢量被分配到所述默认预测块。
31.一种视频处理方法,包括:
在视频的视频区域和所述视频的比特流表示之间的转换期间,确定帧内块复制IBC替代运动矢量预测器AMVP候选索引或IBC Merge候选索引无法识别在块矢量候选列表中的块矢量候选;以及
基于所述确定通过将所述视频区视为具有无效块矢量进行所述转换。
32.一种视频处理方法,包括:
在视频的视频区域和所述视频的比特流表示之间的转换期间,确定帧内块复制IBC替代运动矢量预测器AMVP候选索引或IBC Merge候选索引无法满足条件;
基于所述确定生成补充块矢量BV候选列表;以及
使用所述补充BV候选列表进行所述转换。
33.如权利要求32所述的方法,其中,所述条件包括所述IBC AMVP候选索引或所述IBCMerge候选索引不小于用于所述视频区域的IBC运动候选的最大数量。
34.如权利要求32或33所述的方法,其中,所述补充BV候选矢量列表使用以下步骤生成:
添加一个或多个基于历史的运动矢量预测(HMVP)候选,
从其它BV候选生成一个或多个虚拟BV候选;以及
添加一个或多个默认候选。
35.如权利要求34所述的方法,其中,所述步骤按顺序进行。
36.如权利要求34所述的方法,其中,所述步骤以交织的方式进行。
37.一种视频处理方法,包括:
在视频的视频区域和所述视频的比特流表示之间进行转换,其中,帧内块复制IBC高级运动矢量预测AMVP候选的最大数量(表示为maxIBCAMVPNum)不等于二。
38.如权利要求37所述的方法,其中,所述比特流表示排除指示运动矢量预测器索引的标志,并且包括具有大于一的值的索引。
39.如权利要求38所述的方法,其中,使用一元、截断一元、固定长度或指数哥伦布表示对所述索引进行二进制编解码。
40.如权利要求38所述的方法,其中,所述索引的二进制的二进制数字符串的二进制数被上下文编解码或旁路编解码。
41.如权利要求37所述的方法,其中,maxIBCAMVPNum大于IBC Merge候选的最大数量(表示为maxIBCMrgNum)。
42.一种视频处理的方法,包括:
在视频区域和所述视频区域的比特流表示之间的转换期间,确定帧内块复制IBC运动候选的最大数量为零,以及
基于所述确定通过在所述转换期间生成IBC块矢量候选列表来进行所述转换。
43.如权利要求42所述的方法,其中,所述转换还包括基于IBC高级运动矢量预测(AMVP)模式对于所述视频区域的转换被启用而生成Merge列表。
44.如权利要求42所述的方法,其中,所述转换还包括基于IBC Merge模式对于所述视频区域的转换被禁用而生成具有长度达IBC AMVP候选的最大数量的Merge列表。
45.如权利要求1至44中任一项所述的方法,其中,所述转换包括从所述比特流表示生成所述视频区域的像素值。
46.如权利要求1至44中任一项所述的方法,其中,所述转换包括从所述视频区域的像素值生成所述比特流表示。
47.一种视频处理装置,包括:处理器,被配置为实现权利要求1至46中的任一项所述的方法。
48.一种存储程序代码的计算机可读介质,该程序代码在被执行时,使得处理器实现如权利要求1至46中任一项所述的方法。
CN202080038735.7A 2019-05-25 2020-05-25 帧内块复制编解码的块的Merge候选的约束 Pending CN113950840A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2019088454 2019-05-25
CNPCT/CN2019/088454 2019-05-25
PCT/CN2020/092033 WO2020238838A1 (en) 2019-05-25 2020-05-25 Constraints on merge candidates in intra-block copy coded blocks

Publications (1)

Publication Number Publication Date
CN113950840A true CN113950840A (zh) 2022-01-18

Family

ID=73551880

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202080037629.7A Active CN113853783B (zh) 2019-05-25 2020-05-25 对帧内块复制编解码的块的块矢量的编解码
CN202080038735.7A Pending CN113950840A (zh) 2019-05-25 2020-05-25 帧内块复制编解码的块的Merge候选的约束

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202080037629.7A Active CN113853783B (zh) 2019-05-25 2020-05-25 对帧内块复制编解码的块的块矢量的编解码

Country Status (6)

Country Link
US (2) US11616973B2 (zh)
EP (1) EP3954117A4 (zh)
JP (2) JP7332721B2 (zh)
KR (1) KR102649200B1 (zh)
CN (2) CN113853783B (zh)
WO (2) WO2020238838A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023237017A1 (en) * 2022-06-07 2023-12-14 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114080813A (zh) * 2019-06-14 2022-02-22 Lg 电子株式会社 使用运动矢量的图像编译的方法和装置
JP7460664B2 (ja) * 2019-06-19 2024-04-02 エルジー エレクトロニクス インコーポレイティド 決定された予測モードを適用して予測サンプルを生成する映像デコーディング方法及びその装置
US11553197B2 (en) * 2019-08-05 2023-01-10 Tencent America LLC Method and apparatus for intra picture block compensation
US11778217B2 (en) * 2021-02-22 2023-10-03 Tencent America LLC High level syntax control for screen content coding
US11917165B2 (en) * 2021-08-16 2024-02-27 Tencent America LLC MMVD signaling improvement
WO2023098829A1 (en) * 2021-12-01 2023-06-08 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing
WO2023177695A1 (en) * 2022-03-14 2023-09-21 Beijing Dajia Internet Information Technology Co., Ltd. Inter prediction in video coding
WO2023193691A1 (en) * 2022-04-05 2023-10-12 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing
WO2023193721A1 (en) * 2022-04-05 2023-10-12 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing
WO2023198063A1 (en) * 2022-04-11 2023-10-19 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing
WO2023236914A1 (en) * 2022-06-06 2023-12-14 Mediatek Inc. Multiple hypothesis prediction coding
WO2024044404A1 (en) * 2022-08-26 2024-02-29 Beijing Dajia Internet Information Technology Co., Ltd. Methods and devices using intra block copy for video coding

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105847831B (zh) * 2010-11-23 2019-08-09 Lg电子株式会社 视频编码装置和视频解码装置
SI3833023T1 (sl) * 2012-04-12 2022-06-30 Jvckenwood Corporation Konstruiranje seznama kandidatov za spajanje
EP3058736B1 (en) * 2013-10-14 2019-02-27 Microsoft Technology Licensing, LLC Encoder-side options for intra block copy prediction mode for video and image coding
CN103561263B (zh) * 2013-11-06 2016-08-24 北京牡丹电子集团有限责任公司数字电视技术中心 基于运动矢量约束和加权运动矢量的运动补偿预测方法
US9554141B2 (en) * 2013-11-18 2017-01-24 Arris Enterprises, Inc. Intra block copy for intra slices in high efficiency video coding (HEVC)
JP6373008B2 (ja) * 2013-12-27 2018-08-15 三菱電機株式会社 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
US20150271515A1 (en) * 2014-01-10 2015-09-24 Qualcomm Incorporated Block vector coding for intra block copy in video coding
JP6482191B2 (ja) * 2014-06-12 2019-03-13 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
US10785486B2 (en) * 2014-06-19 2020-09-22 Microsoft Technology Licensing, Llc Unified intra block copy and inter prediction modes
US9948949B2 (en) * 2014-06-20 2018-04-17 Qualcomm Incorporated Intra block copy block vector signaling for video coding
KR102034938B1 (ko) * 2014-09-01 2019-10-21 에이치에프아이 이노베이션 인크. 스크린 콘텐츠 및 비디오 코딩을 위한 인트라 픽처 블록 카피의 방법
US9918105B2 (en) * 2014-10-07 2018-03-13 Qualcomm Incorporated Intra BC and inter unification
US10200713B2 (en) * 2015-05-11 2019-02-05 Qualcomm Incorporated Search region determination for inter coding within a particular picture of video data
WO2016200984A1 (en) * 2015-06-08 2016-12-15 Vid Scale, Inc. Intra block copy mode for screen content coding
CN108141619B (zh) * 2015-10-19 2020-11-20 联发科技股份有限公司 管理已解码图像缓存器的方法及装置
GB2547053B (en) * 2016-02-08 2020-07-08 Canon Kk Methods, devices, and computer programs for combining the use of intra-layer prediction and inter-layer prediction with scalability & screen content features
CN116506596A (zh) * 2016-08-03 2023-07-28 株式会社Kt 视频解码方法、视频编码方法和视频数据的传送方法
US10390015B2 (en) * 2016-08-26 2019-08-20 Qualcomm Incorporated Unification of parameters derivation procedures for local illumination compensation and cross-component linear model prediction
CA3222158A1 (en) * 2016-10-04 2018-04-12 Kt Corporation Method and apparatus for processing video signal
KR102435500B1 (ko) * 2016-10-06 2022-08-23 세종대학교산학협력단 비디오 신호의 복호화 방법 및 이의 장치
JP2019129371A (ja) * 2018-01-23 2019-08-01 富士通株式会社 動画像符号化装置、動画像符号化方法、動画像復号装置、動画像復号方法、及び動画像符号化用コンピュータプログラムならびに動画像復号用コンピュータプログラム
US10462483B1 (en) * 2018-04-26 2019-10-29 Tencent America LLC Method and apparatus for video coding
US10841602B2 (en) * 2018-07-16 2020-11-17 Tencent America LLC Hierarchical tiles
GB2579763B (en) * 2018-09-21 2021-06-09 Canon Kk Video coding and decoding
WO2020171681A1 (ko) * 2019-02-19 2020-08-27 주식회사 윌러스표준기술연구소 인트라 예측 기반 비디오 신호 처리 방법 및 장치
EP3930327A4 (en) * 2019-03-08 2022-06-01 Guangdong Oppo Mobile Telecommunications Corp., Ltd. PREDICTION PROCESS, ENCODER, DECODER, AND COMPUTER STORAGE MEDIA
US11350083B2 (en) * 2019-04-19 2022-05-31 Qualcomm Incorporated Intra block copy merging data syntax for video coding
US11394990B2 (en) 2019-05-09 2022-07-19 Tencent America LLC Method and apparatus for signaling predictor candidate list size
JP7405870B2 (ja) 2019-05-24 2023-12-26 華為技術有限公司 Ibcマージ・リストのために使用する符号化器、復号器、及び対応する方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023237017A1 (en) * 2022-06-07 2023-12-14 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing

Also Published As

Publication number Publication date
EP3954117A4 (en) 2022-06-08
KR20220012239A (ko) 2022-02-03
CN113853783A (zh) 2021-12-28
CN113853783B (zh) 2023-12-15
EP3954117A1 (en) 2022-02-16
WO2020238837A1 (en) 2020-12-03
WO2020238838A1 (en) 2020-12-03
JP2023156417A (ja) 2023-10-24
KR102649200B1 (ko) 2024-03-18
US11616973B2 (en) 2023-03-28
US20230164348A1 (en) 2023-05-25
JP7332721B2 (ja) 2023-08-23
JP2022534201A (ja) 2022-07-28
US20220046272A1 (en) 2022-02-10

Similar Documents

Publication Publication Date Title
CN113853783B (zh) 对帧内块复制编解码的块的块矢量的编解码
CN113170099B (zh) 块内拷贝模式和帧间预测工具之间的交互
CN113424525B (zh) 解码器侧细化工具的尺寸选择性应用
CN114097228B (zh) 具有几何分割模式编解码的运动候选列表
CN113924771B (zh) 子块Merge模式中的语法信令
CN114128258B (zh) 视频编解码中的变换块尺寸的限制
CN114009037A (zh) 帧内块复制模式的运动候选列表构建
CN113924783A (zh) 用于视频编解码的组合式帧内和帧内块复制预测
CN114450959A (zh) 视频编解码中的几何分割模式
CN113994699B (zh) 视频编解码的运动候选列表构建
CN113924778A (zh) 具有三角形分割的帧内块复制
CN114556915B (zh) 几何分割模式中被编解码的块的去块
CN113966616B (zh) 使用临近块信息的运动候选列表构建
CN113475075B (zh) 基于共享Merge列表的运动预测
CN113994682A (zh) 具有默认参数的基于历史的运动矢量预测
CN114097219A (zh) 基于历史的运动矢量预测表中的运动信息的存储
CN115152229A (zh) merge估计区域下IBC块的BV列表构建过程

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination