CN113424534A - 自适应运动矢量分辨率的多个语法元素 - Google Patents
自适应运动矢量分辨率的多个语法元素 Download PDFInfo
- Publication number
- CN113424534A CN113424534A CN202080013267.8A CN202080013267A CN113424534A CN 113424534 A CN113424534 A CN 113424534A CN 202080013267 A CN202080013267 A CN 202080013267A CN 113424534 A CN113424534 A CN 113424534A
- Authority
- CN
- China
- Prior art keywords
- motion vector
- mode
- amvr
- block
- affine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000033001 locomotion Effects 0.000 title claims abstract description 440
- 239000013598 vector Substances 0.000 title claims abstract description 267
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 24
- 238000000034 method Methods 0.000 claims abstract description 242
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims abstract description 207
- 238000006243 chemical reaction Methods 0.000 claims abstract description 28
- 238000012545 processing Methods 0.000 claims abstract description 26
- 230000007704 transition Effects 0.000 claims abstract description 22
- 230000000007 visual effect Effects 0.000 claims abstract description 11
- 241000023320 Luma <angiosperm> Species 0.000 claims description 71
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 claims description 71
- 230000011664 signaling Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 15
- 230000015654 memory Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 description 62
- 238000009795 derivation Methods 0.000 description 41
- 230000002123 temporal effect Effects 0.000 description 30
- 238000004422 calculation algorithm Methods 0.000 description 17
- 230000002146 bilateral effect Effects 0.000 description 16
- 238000005516 engineering process Methods 0.000 description 13
- 230000003287 optical effect Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 238000005286 illumination Methods 0.000 description 7
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 230000002457 bidirectional effect Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 101100025317 Candida albicans (strain SC5314 / ATCC MYA-2876) MVD gene Proteins 0.000 description 1
- 241000723655 Cowpea mosaic virus Species 0.000 description 1
- 101150079299 MVD1 gene Proteins 0.000 description 1
- 101100537098 Mus musculus Alyref gene Proteins 0.000 description 1
- 101150095908 apex1 gene Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 229910003460 diamond Inorganic materials 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 101150023404 mvd gene Proteins 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/523—Motion estimation or motion compensation with sub-pixel accuracy
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
一种用于视觉媒体处理的方法,包括:对于当前视频块和当前视频块的比特流表示之间的转换,做出使用一个或多个精度来表示运动信息的确定,运动信息包括在使用自适应运动矢量分辨率(AMVR)的仿射帧间模式或正常帧间模式中的转换期间使用的运动矢量和/或运动矢量预测器和/或运动矢量差;以及基于对一个或多个精度的确定来执行转换,其中,在比特流表示中使用多个语法元素来用信令通知一个或多个精度。
Description
相关申请的交叉引用
根据适用的《专利法》和/或《巴黎公约》的规定,本申请是为了及时要求2019年2月1日提交的国际专利申请PCT/CN2019/074433的优先权和权益。出于法律上的所有目的,以引用方式将上述申请的全部公开并入,作为本申请的公开的一部分。
技术领域
该专利文件涉及视频编码和解码技术、设备和系统。
背景技术
尽管视频压缩有所进步,数字视频在互联网和其他数字通信网络上仍占最大的带宽使用量。随着能够接收和显示视频的连接用户设备的数量增加,预计数字视频使用所需的带宽将继续增长。
发明内容
所公开的技术涉及视频编码技术。具体而言,涉及重构后滤波器,例如图像/视频编码中的双边滤波器。它可以应用于现有的视频编码标准(例如HEVC)或待定的标准(多功能视频编码)。它也可能适用于未来的视频编码标准或视频编解码器。
在一个代表性的方面,所公开的技术可以用于提供一种用于视觉媒体处理的方法。该方法包括:对于当前视频块和所述当前视频块的比特流表示之间的转换,做出使用一个或多个精度来表示运动信息的确定,所述运动信息包括在使用自适应运动矢量分辨率(AMVR)的仿射帧间模式或正常帧间模式中的转换期间使用的运动矢量和/或运动矢量预测器和/或运动矢量差;以及基于对所述一个或多个精度的确定来执行所述转换,其中,在所述比特流表示中使用多个语法元素来用信令通知所述一个或多个精度。
在一个代表性的方面,所公开的技术可以用于提供一种用于视觉媒体处理的方法。该方法包括:对于当前视频块和所述当前视频块的比特流表示之间的转换,做出使用一个或多个精度来表示运动信息的确定,所述运动信息包括在使用自适应运动矢量分辨率(AMVR)的帧内块复制(IBC)模式中的转换期间使用的运动矢量和/或运动矢量预测器和/或运动矢量差;基于所述一个或多个精度的确定来执行所述转换,其中,在所述比特流表示中使用多个语法元素来用信令通知所述一个或多个精度;其中,基于在IBC模式中从所述当前视频块的图片推导的块矢量来执行所述转换。
在另一个代表性方面,上述方法以处理器可执行代码的形式体现并存储在计算机可读程序介质中。
在又一个代表性方面,公开了一种被配置为或可操作为执行上述方法的设备。该设备可以包括被编程为实现该方法的处理器。
在又一个代表性方面,视频解码器装置可以实现本文所述的一种或多种方法。
在再一个代表性方面,视频编码器装置可以实现本文所述的一种或多种方法。
在附图、说明书和权利要求书中更详细地描述了所公开技术的上述和其他方面以及特征。
附图说明
图1示出了构造Merge候选列表的示例。
图2示出了空域候选的位置的示例。
图3示出了经受空域Merge候选的冗余检查的候选对的示例。
图4A和4B示出了基于当前块的尺寸和形状的第二预测单元(PU)的位置的示例。
图5示出了用于时域Merge候选的运动矢量缩放的示例。
图6示出了时域Merge候选的候选位置的示例。
图7示出了生成组合的双向预测Merge候选的示例。
图8示出了构造运动矢量预测候选的示例。
图9示出了用于空域运动矢量候选的运动矢量缩放的示例。
图10示出了将可选时域运动矢量预测(ATMVP)算法用于编码单元(CU)的运动预测的示例。
图11示出了由空域-时域运动矢量预测(STMVP)算法使用的具有子块和临近块的编码单元(CU)的示例。
图12A和12B示出了当使用重叠块运动补偿(OBMC)算法时子块的示例快照。
图13示出了用于推导局部照明补偿(LIC)算法的参数的临近样点的示例。
图14示出了简化的仿射运动模型的示例。
图15示出了每个子块的仿射运动矢量场(MVF)的示例。
图16示出了AF_INTER仿射运动模式的运动矢量预测(MVP)的示例。
图17A和17B分别示出了4参数和6参数仿射模型的示例。
图18A和18B示出了AF_MERGE仿射运动模式的示例候选。
图19示出了模式匹配运动矢量推导(PMMVD)模式中的双边匹配的示例,其是基于帧速率上转换(FRUC)算法的特殊Merge模式。
图20示出了FRUC算法中的模板匹配的示例。
图21示出了FRUC算法中的单边运动估计的示例。
图22示出了由双向光流(BDOF)算法使用的光流轨迹的示例。
图23A和23B示出了使用没有块扩展的双向光流(BDOF)算法的示例快照。
图24示出了基于双边模板匹配的解码器侧运动矢量细化(DMVR)算法的示例。
图25示出了用于视频编码的示例方法的流程图。
图26是用于实现本文中描述的视觉媒体解码或视觉媒体编码技术的硬件平台的示例的框图。
图27示出了对称模式的示例。
图28是其中可以实现所公开的技术的示例视频处理系统的框图。
图29示出了用于视频处理的示例方法的流程图。
图30示出了用于视频处理的示例方法的流程图。
具体实施方式
由于对更高分辨率视频的需求的增加,在现代技术中普遍存在视频编码方法和技术。视频编解码器通常包括压缩或解压缩数字视频的电子电路或软件,并且不断改进以提供更高的编码效率。视频编解码器将未压缩视频转换为压缩格式,反之亦然。视频质量、用于表示视频的数据量(由比特率确定)、编码和解码算法的复杂度、对数据丢失和错误的敏感性、编辑的简易性、随机访问和端到端时延(延迟)之间存在复杂的关系。压缩格式通常符合标准视频压缩规范,例如,高效视频编码(HEVC)标准(也称为H.265或MPEG-H第2部分)、要完成的通用视频编码标准、或其他当前和/或未来的视频编码标准。
所公开的技术的实施例可以应用于现有视频编码标准(例如,HEVC、H.265)和未来标准以改进压缩性能。在本文档中使用章节标题以提高描述的可读性,并且不以任何方式将讨论或实施例(和/或实现)限制于仅相应的部分。
1.HEVC/H.265中的帧间预测的示例
多年来,视频编码标准已经显著改进,并且现在部分地提供高编码效率和对更高分辨率的支持。诸如HEVC和H.265的最新标准基于混合视频编码结构,其中利用时域预测加变换编码。
1.1.预测模式的示例
每个帧间预测的PU(预测单元)具有用于一个或两个参考图片列表的运动参数。在一些实施例中,运动参数包括运动矢量和参考图片索引。在其他实施例中,也可以使用inter_pred_idc来信令通知两个参考图片列表中的一个的使用。在又一其他实施例中,可以将运动矢量明确地编码为相对于预测器的增量。
当用跳过模式对CU进行编码时,一个PU与CU相关联,并且不存在显著的残差系数、没有编码的运动矢量增量或参考图片索引。指定Merge模式,从而从临近PU获得当前PU的运动参数,包括空域和时域候选。Merge模式可以应用于任何帧间预测的PU,而不仅应用于跳过模式。Merge模式的替代是运动参数的显式传输,其中,对于每个PU,明确地用信令通知运动矢量、每个参考图片列表的对应参考图片索引和参考图片列表使用。
当信令指示将使用两个参考图片列表中的一个时,从一个样点块产生PU。这被称为“单向预测(uni-prediction)”。单向预测可用于P条带和B条带两者。
当信令指示将使用两个参考图片列表时,从两个样点块产生PU。这被称为“双向预测(bi-prediction)”。双向预测仅适用于B条带。
1.1.1.1构造用于Merge模式的候选的实施例
当使用Merge模式预测PU时,从比特流解析指向Merge候选列表中的条目的索引并将其用于检索运动信息。该列表的构造(construction)可以根据以下步骤顺序进行总结:
·步骤1:原始候选推导
·步骤1.1:空域候选推导
·步骤1.2:空域候选的冗余检查
·步骤1.3:时域候选推导
·步骤2:插入额外的候选
·步骤2.1:创建双向预测候选
·步骤2.2:插入零运动候选
图1示出了基于上面总结的步骤序列构造Merge候选列表的示例。对于空域Merge候选推导,在位于五个不同位置的候选当中选择最多四个Merge候选。对于时域Merge候选推导,在两个候选当中选择最多一个Merge候选。由于在解码器处假设恒定数量的候选用于每个PU,因此当候选的数量未达到在条带标头中用信令通知的最大Merge候选数量(MaxNumMergeCand)时,生成额外的候选。由于候选的数量是恒定的,因此使用截断的一元二值化(Truncated Unary binarization,TU)来编码最佳Merge候选的索引。如果CU的尺寸等于8,则当前CU的所有PU共享单个Merge候选列表,其与2N×2N预测单元的Merge候选列表相同。
1.1.2构造空域Merge候选
在空域Merge候选的推导中,在位于图2描绘的位置的候选当中选择最多四个Merge候选。推导的顺序是A1、B1、B0、A0和B2。仅当位置A1、B1、B0、A0的任何PU不可用(例如,因为它属于另一条带或区块)或者是帧内编码时,才考虑位置B2。在添加位置A1处的候选之后,对剩余候选的添加进行冗余检查,其确保具有相同运动信息的候选被排除在列表之外,使得编码效率提高。
为了降低计算复杂度,在所提到的冗余检查中并未考虑所有可能的候选对。相反,仅考虑图3中用箭头连接的对,并且仅在用于冗余检查的对应候选具有不一样的运动信息时,才将候选添加到列表。重复运动信息的另一来源是与不同于2N×2N的分割相关联的“第二PU”。作为示例,图4A和4B描绘了分别针对N×2N和2N×N的情况的第二PU。当当前PU被分割为N×2N时,位置A1处的候选不被考虑用于列表构造。在一些实施例中,通过添加该候选可能导致具有相同运动信息的两个预测单元,这对于在编码单元中仅具有一个PU是多余的。类似地,当当前PU被分割为2N×N时,不考虑位置B1。
1.1.3构造时域Merge候选
在该步骤中,只有一个候选被添加到列表中。具体地,在该时域Merge候选的推导中,基于共同定位的PU来推导缩放的运动矢量,该共同定位的PU属于给定参考图片列表内与当前图片具有最小POC差的图片。在条带标头中明确地用信令通知要用于推导共同定位的PU的参考图片列表。
图5示出了针对时域Merge候选(如虚线)的缩放运动矢量的推导的示例,其是使用POC距离tb和td从共同定位的PU的运动矢量缩放的,其中tb被定义为当前图片的参考图片与当前图片之间的POC差,td被定义为是共同定位的图片的参考图片与共同定位的图片之间的POC差。时域Merge候选的参考图片索引被设置为等于零。对于B条带,获得两个运动矢量,一个用于参考图片列表0,另一用于参考图片列表1,并且结合该两个运动矢量以获得双向预测Merge候选。
在属于参考帧的共同定位的PU(Y)中,在候选C0和C1之间选择时域候选的位置,如图6所示。如果位置C0处的PU不可用、是帧内编码的、或者在当前CTU之外,则使用位置C1。否则,位置C0用于时域Merge候选的推导。
1.1.4构造Merge候选的额外类型
除了空时Merge候选之外,还存在两种额外类型的Merge候选:组合的双向预测Merge候选和零Merge候选。通过利用空时Merge候选来生成组合的双向预测Merge候选。组合的双向预测Merge候选仅用于B条带。通过将原始候选的第一参考图片列表运动参数与另一候选的第二参考图片列表运动参数组合来生成组合的双向预测候选。如果这两个元组提供不同的运动假设,它们将形成一个新的双向预测候选。
图7示出了该过程的示例,其中原始列表中的两个候选(左侧的710)中具有mvL0和refIdxL0或mvL1和refIdxL1,其被用于创建添加到最终列表(右侧)的组合的双向预测Merge候选的情况。
插入零运动候选以填充Merge候选列表中的剩余条目,从而达到MaxNumMergeCand容量。这些候选具有零空域位移和参考图片索引,该参考图片索引从零开始并且每当新的零运动候选被添加到列表时增加。这些候选使用的参考帧的数量是1和2,分别用于单向和双向预测。在一些实施例中,不对这些候选执行冗余检查。
1.1.5用于并行处理的运动估计区域的示例
为了加速编码处理,可以并行执行运动估计,从而同时推导给定区域内的所有预测单元的运动矢量。从空域邻域推导Merge候选可能干扰并行处理,因为一个预测单元直到其相关联的运动估计完成时才能从临近PU推导运动参数。为了减轻编码效率和处理等待时域之间的折衷,可以定义运动估计区域(Motion Estimation Region,MER),MER的尺寸在图片参数集(PPS)中使用“log2_parallel_merge_level_minus2”语法元素信令通知。当定义MER时,落入同一区域的Merge候选被标记为不可用,因此在列表构造中不予考虑。
1.2高级运动矢量预测(AMVP)的实施例
AMVP利用运动矢量与临近PU的时空相关性,其用于运动参数的显式传输。其通过首先检查在时域上临近的PU位置的上方,左侧的可用性,移除冗余候选并添加零矢量以使候选列表为恒定长度来构造运动矢量候选列表。然后,编码器可以从候选列表中选择最佳预测器,并发送指示所选候选的对应索引。与Merge索引信令类似,使用截断的一元来编码最佳运动矢量候选的索引。在这种情况下要编码的最大值是2(参见图8)。在以下部分中,提供了关于运动矢量预测候选的推导过程的细节。
1.2.1构造运动矢量预测候选的示例
图8总结了运动矢量预测候选的推导过程,并且可以针对每个参考图片列表以索引作为输入来实现。
在运动矢量预测中,考虑两种类型的运动矢量候选:空域运动矢量候选和时域运动矢量候选。对于空域运动矢量候选推导,最终基于位于先前在图2中所示的五个不同位置的每个PU的运动矢量推导两个运动矢量候选。
对于时域运动矢量候选推导,从两个候选中选择一个运动矢量候选,其是基于两个不同的共同定位的位置推导的。在产生时空候选的第一列表之后,移除列表中的重复的运动矢量候选。如果潜在候选的数量大于2,则从列表中移除相关联的参考图片列表内的其参考图片索引大于1的运动矢量候选。如果空时运动矢量候选的数量小于2,则将额外的零运动矢量候选添加到列表中。
1.2.2构造空域运动矢量候选
在空域运动矢量候选的推导中,在五个潜在候选当中考虑最多两个候选,其从位于如先前在图2中所示的位置的PU中推导,那些位置与运动Merge的位置相同。将当前PU的左侧的推导顺序定义为A0、A1,以及缩放的A0、缩放的A1。将当前PU的上侧的推导顺序定义为B0、B1、B2,缩放的B0、缩放的B1、缩放的B2。因此,对于每一侧,存在可以用作运动矢量候选的四种情况,其中两种情况不需要使用空域缩放,两种情况使用空域缩放。四种不同的情况总结如下:
没有空域缩放
(1)相同的参考图片列表,以及相同的参考图片索引(相同的POC)
(2)不同的参考图片列表,但相同的参考图片(相同的POC)
空域缩放
(3)相同的参考图片列表,但不同的参考图片(不同的POC)
(4)不同的参考图片列表,以及不同的参考图片(不同的POC)
首先检查无空域缩放的情况,然后检查空域缩放。当POC在临近PU的参考图片与当前PU的参考图片之间不同而不管参考图片列表时,考虑空域缩放。如果左候选的所有PU都不可用或者是帧内编码的,则允许对上述运动矢量进行缩放以帮助左和上MV候选的并行推导。否则,不允许对上述运动矢量进行空域缩放。
如图9的示例所示,对于空域缩放的情况,以与时域缩放类似的方式缩放临近PU的运动矢量。一个区别是将参考图片列表和当前PU的索引作为输入给出;实际缩放过程与时域缩放过程相同。
1.2.3构造时域运动矢量候选
除了参考图片索引推导之外,用于推导时域Merge候选的所有过程与用于推导空域运动矢量候选的过程相同(如图6的示例所示)。在一些实施例中,将参考图片索引用信令通知给解码器。
2.联合探索模型(JEM)中的帧间预测方法的示例
在一些实施例中,使用称为联合探索模式(JEM)的参考软件来探索未来的视频编码技术。在JEM中,在若干编码工具中采用基于子块的预测,诸如仿射预测、可选时域运动矢量预测(ATMVP)、空时运动矢量预测(STMVP)、双向光流(BDOF或BIO)、帧速率上转换(FRUC、局部自适应运动矢量分辨率(LAMVR)、重叠块运动补偿(OBMC)、局部照明补偿(LIC)和解码器侧运动矢量细化(DMVR)。
2.1基于子CU的运动矢量预测的示例
在具有四叉树加二叉树(QTBT)的JEM中,每个CU可以针对每个预测方向具有至多一组运动参数。在一些实施例中,通过将大CU划分成子CU并且推导大CU的所有子CU的运动信息,在编码器中考虑两个子CU级运动矢量预测方法。可选时域运动矢量预测(Alternative Temporal Motion Vector Prediction,ATMVP)方法允许每个CU从比并置参考图片中的当前CU小的多个块中提取多组运动信息。在空时运动矢量预测(Spatial-Temporal Motion Vector Prediction,STMVP)方法中,通过使用时域运动矢量预测值和空域临近运动矢量来递归地推导子CU的运动矢量。在一些实施例中,为了保留用于子CU运动预测的更准确的运动场,可能禁用参考帧的运动压缩。
2.1.1可选时域运动矢量预测(ATMVP)的示例
在ATMVP方法中,通过从小于当前CU的块中提取多组运动信息(包括运动矢量和参考索引)来修改时域运动矢量预测(TMVP)方法。
图10示出了CU 1000的ATMVP运动预测过程的示例。该ATMVP 1000方法以两个步骤预测CU 1000内的子CU 1001的运动矢量。第一步是利用时域矢量识别参考图片1050中的对应块1051。参考图片1050也被称为运动源图片。第二步是将当前CU 1000划分成子CU 1001,并从对应于每个子CU的块中获得运动矢量以及每个子CU的参考索引。
在第一步骤中,由当前CU 1000的空域临近块的运动信息确定参考图片1050和对应块。为了避免临近块的重复扫描过程,使用当前CU 1000的Merge候选列表中的第一Merge候选。第一可用运动矢量及其相关联的参考索引被设置为时域矢量和运动源图片的索引。这样,与TMVP相比,可以更准确地识别对应块,其中对应块(有时称为并置块)总是相对于当前CU位于右下或中心位置。
在第二步骤中,通过向当前CU的坐标添加时域矢量,通过运动源图片1050中的时域矢量来识别子CU 1051的对应块。对于每个子CU,其对应块(例如,覆盖中心样点的最小运动网格)的运动信息用于推导子CU的运动信息。在识别出对应的N×N块的运动信息之后,以与HEVC的TMVP相同的方式将其转换为当前子CU的参考索引和运动矢量,其中运动缩放和其他过程也适用。例如,解码器检查是否满足低时延条件(例如,当前图片的所有参考图片的POC小于当前图片的POC)并且可能使用运动矢量MVx(例如,对应于参考图片列表X的运动矢量)来预测每个子CU的运动矢量MVy(例如,其中X等于0或1并且Y等于1-X)。
2.1.2空时运动矢量预测(STMVP)的示例
在STMVP方法中,按照光栅扫描顺序递归地推导子CU的运动矢量。图11示出了具有四个子块和临近块的一个CU的示例。考虑包含四个4×4子CU A(1101),B(1102),C(1103)和D(1104)的8×8CU1100。当前帧中的临近4×4块被标记为a(1111),b(1112),c(1113)和d(1114)。
子CU A的运动推导通过识别其两个空域邻居开始。第一邻居是子CU A1101上方的N×N块(块c 1103)。如果该块c(1113)不可用或者是帧内编码,则(从块c 1113开始,从左到右)检查子CU A(1101)上方的其他N×N个块。第二邻居是子CU A1101左侧的块(块b 1112)。如果块b(1112)不可用或者是帧内编码,则(从块b 1112开始,从上到下)检查子CU A 1101左侧的其他块。从每个列表的临近块获得的运动信息被缩放到给定列表的第一参考帧。接下来,通过遵循与HEVC中指定的TMVP推导相同的过程来推导子块A 1101的时域运动矢量预测(Temporal Motion Vector Predictor,TMVP)。提取D 1104处的并置块的运动信息并对应地缩放。最后,在检索和缩放运动信息之后,对于每个参考列表,所有可用的运动矢量被分别平均。平均运动矢量被指定为当前子CU的运动矢量。
2.1.3子CU运动预测模式信令的示例
在一些实施例中,子CU模式被启用为额外的Merge候选,并且不需要额外的语法元素来信令通知该模式。将两个额外的Merge候选添加到每个CU的Merge候选列表以表示ATMVP模式和STMVP模式。在一些实施例中,如果序列参数集指示启用了ATMVP和STMVP,则可以最多使用七个Merge候选。额外的Merge候选的编码逻辑与HM中的Merge候选相同,这意味着,对于P或B条带中的每个CU,两个额外的Merge候选可能需要另外两个RD检查。在一些实施例中,例如,在JEM中,所有Merge索引的二进制位(bin)都由CABAC(基于上下文的自适应二进制算术编码)进行上下文编码。在其他实施例中,例如,在HEVC中,仅第一个二进制位是上下文编码的,而剩余的二进制位是上下文旁路编码的。
2.2自适应运动矢量差分辨率
在一些实施例中,当条带标头中的use_integer_mv_flag等于0时,以四分之一亮度样点为单位信令通知(PU的运动矢量和预测运动矢量之间的)运动矢量差(MotionVector Difference,MVD)。在JEM中,引入了局部自适应运动矢量分辨率(LocallyAdaptive Motion Vector Resolution,LAMVR)。在JEM中,MVD可以以四分之一亮度样点、整数亮度样点或四亮度样点为单位进行编码。在编码单元(CU)级控制MVD分辨率,并且对于具有至少一个非零MVD分量的每个CU有条件地信令通知MVD分辨率标志。
对于具有至少一个非零MVD分量的CU,信令通知第一标记以指示在CU中是否使用四分之一亮度样点MV精度。当第一标志(等于1)指示不使用四分之一亮度样点MV精度时,信令通知另一标志以指示是使用整数亮度样点MV精度还是四亮度样点MV精度。
当CU的第一MVD分辨率标志为零或未针对CU编码(意味着CU中的所有MVD均为零)时,对于CU使用四分之一亮度样点MV分辨率。当CU使用整数亮度样点MV精度或四亮度样点MV精度时,CU的AMVP候选列表中的MVP被取整到对应的精度。
在编码器中,CU级RD检查用于确定将哪个MVD分辨率用于CU。即,对于每个MVD分辨率,执行三次CU级RD检查。为了加快编码器速度,在JEM中应用以下编码方案。
--在具有正常四分之一亮度样点MVD分辨率的CU的RD检查期间,存储当前CU的运动信息(整数亮度样点精度)。存储的运动信息(在取整之后)被用作在RD检查期间针对具有整数亮度样点和4亮度样点MVD分辨率的相同CU的进一步小范围运动矢量细化的起点,使得耗时的运动估计过程不重复三次。
--有条件地调用具有4亮度样点MVD分辨率的CU的RD检查。对于CU,当RD成本整数亮度样点MVD分辨率远大于四分之一亮度样点MVD分辨率时,跳过针对CU的4亮度样点MVD分辨率的RD检查。
2.3更高的运动矢量存储精度的示例
在HEVC中,运动矢量精度是四分之一像素(4:2:0视频的四分之一亮度样点和八分之一色度样点)。在JEM中,内部运动矢量存储和Merge候选的精度增加到1/16像素。更高的运动矢量精度(1/16像素)用于以跳过/Merge模式编码的CU的运动补偿帧间预测。对于使用正常AMVP模式编码的CU,使用整数像素或四分之一像素运动。
具有与HEVC运动补偿插值滤波器相同的滤波器长度和归一化因子的SHVC上样点插值滤波器被用作额外的分数像素位置的运动补偿插值滤波器。在JEM中色度分量运动矢量精度是1/32样点,通过使用两个临近的1/16像素分数位置的滤波器的平均来推导1/32像素分数位置的额外的插值滤波器。
2.4重叠块运动补偿OBMC的示例
在JEM中,可以使用CU级的语法来打开和关闭OBMC。当在JEM中使用OBMC时,除了CU的右边界和下边界之外,对所有运动补偿(Motion Compensation,MC)块边界执行OBMC。此外,它还应用于亮度和色度分量。在JEM中,MC块对应于编码块。当用子CU模式(包括子CUMerge、仿射和FRUC模式)编码CU时,CU的每个子块是MC块。为了以统一的方式处理CU边界,针对所有MC块边界以子块级执行OBMC,其中子块尺寸被设置为等于4×4,如图12A和12B所示。
图12A示出了CU/PU边界处的子块,阴影子块是OBMC应用的位置。类似地,图12B示出了ATMVP模式中的子块。
当OBMC应用于当前子块时,除了当前运动矢量之外,四个连接的临近子块的运动矢量(如果可用且与当前运动矢量不同)也用于推导当前子块的预测块。组合基于多个运动矢量的这些多个预测块以生成当前子块的最终预测信号。
将基于临近子块的运动矢量的预测块表示为PN,其中N指示临近的上、下、左和右子块的索引,并且将基于当前子块的运动矢量的预测块表示为PC。当PN是基于包含与当前子块相同的运动信息的临近子块的运动信息时,不从PN执行OBMC。否则,将每个PN样点添加到PC中的相同样点中,即将PN的四行/列添加到PC。将加权因子{1/4,1/8,1/16,1/32}用于PN,并且将加权因子{3/4,7/8,15/16,31/32}用于PC。例外是小MC块(即,当编码块的高度或宽度等于4或用子CU模式编码CU时),对其仅将PN的两行/列添加到PC。在这种情况下,将加权因子{1/4,1/8}用于PN,并且将加权因子{3/4,7/8}用于PC。对于基于垂直(水平)临近子块的运动矢量生成的PN,将PN的相同行(列)中的样点添加到具有相同加权因子的PC。
在JEM中,对于尺寸小于或等于256个亮度样点的CU,信令通知CU级标志以指示是否对当前CU应用OBMC。对于尺寸超过256个亮度样点或未使用AMVP模式进行编码的CU,默认应用OBMC。在编码器处,当将OBMC应用于CU时,在运动估计阶段期间考虑其影响。由OBMC使用上侧临近块和左侧临近块的运动信息形成的预测信号用于补偿当前CU的原始信号的上边界和左边界,然后应用正常运动估计处理。
2.5局部照明补偿(LIC)的示例
照明补偿LIC是基于用于光照变化的线性模式,使用缩放因子a和偏移b。并且针对每个帧间模式编码的编码单元(CU)自适应地启用或禁用它。
当LIC应用于CU时,采用最小平方误差方法来通过使用当前CU的临近样点及其对应的参考样点来推导参数a和b。图13示出了用于推导IC算法的参数的临近样点的示例。更具体地,如图13所示,使用CU的子采样(2:1子采样)的临近样点和参考图片中的(由当前CU或子CU的运动信息识别的)对应样点。推导IC参数并将其分别应用于每个预测方向。
当用Merge模式编码CU时,以类似于Merge模式中的运动信息复制的方式从临近块复制LIC标志;否则,向CU信令通知LIC标志以指示是否应用LIC。
当针对图片启用LIC时,需要额外的CU级RD检查以确定是否将LIC应用于CU。当为CU启用LIC时,分别针对整数像素运动搜索和分数像素运动搜索,使用去均值绝对差之和(Mean-Removed Sum Of Absolute Difference,MR-SAD)和去均值绝对哈达玛变换差之和(Mean-Removed Sum Of Absolute Hadamard-Transformed Difference,MR-SATD),而不是SAD和SATD。
为了降低编码复杂度,在JEM中应用以下编码方案。
当当前图片与其参考图片之间没有明显的光照变化时,对于整个图片禁用LIC。为了识别这种情况,在编码器处计算当前图片和当前图片的每个参考图片的直方图。如果当前图片与当前图片的每个参考图片之间的直方图差小于给定阈值,则对当前图片禁用LIC;否则,对当前图片启用LIC。
2.6仿射运动补偿预测的示例
在HEVC中,仅将平移运动模式应用于运动补偿预测(Motion CompensationPrediction,MCP)。然而,相机和对象可能存在多种运动,例如放大/缩小、旋转、透视运动和/或其他不规则运动。另一方面,在JEM中,应用简化的仿射变换运动补偿预测。图14示出了块1400的仿射运动场由两个控制点运动矢量V0和V1描述的示例。块1400的运动矢量场(Motion Vector Field,MVF)由以下等式描述:
如图14所示,(v0x,v0y)是左上角控制点的运动矢量,(v1x,v1y)是右上角控制点的运动矢量。为了进一步简化运动补偿预测,可以应用基于子块的仿射变换预测。子块尺寸M×N如以下推导:
这里,MvPre是运动矢量分数精度(例如,在JEM中是1/16),(v2x,v2y)是根据等式1计算的左下控制点的运动矢量。如果需要,可以向下调整M和N,以使其分别为w和h的除数。
图15示出了块1500的每个子块的仿射MVF的示例。为了推导每个M×N子块的运动矢量,根据等式1计算每个子块的中心样点的运动矢量,并取整到运动矢量分数精度(例如,JEM中的1/16)。然后,应用运动补偿插值滤波器,以利用所推导的运动矢量生成每个子块的预测。在MCP之后,对每个子块的高精度运动矢量进行取整,并将其以与正常运动矢量相同的精度保存。
2.6.1 AF_INTER模式的实施例
在JEM中,存在两种仿射运动模式:AF_INTER模式和AF_MERGE模式。对于宽度和高度都大于8的CU,可以应用AF_INTER模式。在比特流中用信令通知CU级的仿射标志以指示是否使用AF_INTER模式。在AF_INTER模式中,使用临近块构造具有运动矢量对{(v0,v1)|v0={vA,vB,vc},v1={vD,vE}}的候选列表。
图16示出了AF_INTER模式中的块1600的运动矢量预测(MVP)的示例。如图16所示,从子块A、B或C的运动矢量中选择v0。可以根据参考列表来缩放来自临近块的运动矢量。还可以根据用于临近块的参考的图片顺序计数(POC)、用于当前CU的参考的POC和当前CU的POC之间的关系来缩放来自临近块的运动矢量。从临近子块D和E中选择v1的方法是类似的。如果候选列表的数量小于2,则可以由通过复制每个AMVP候选而组成的运动矢量对来填充列表。当候选列表大于2时,可以首先根据临近运动矢量(例如,基于候选对中的两个运动矢量的相似性)对候选进行排序。在一些实施例中,保留前两个候选。在一些实施例中,用速率失真(RD)成本检查来确定将哪个运动矢量对候选选择为当前CU的控制点运动矢量预测(Control Point Motion Vector Prediction,CPMVP)。在比特流中可以用信令通知指示候选列表中的CPMVP的位置的索引。在确定当前仿射CU的CPMVP之后,应用仿射运动估计并找到控制点运动矢量(Control Point Motion Vector,CPMV)。然后在比特流中用信令通知CPMV和CPMVP的差。
在AF_INTER模式下,当使用4/6参数仿射模式时,需要2/3个控制点,因此,需要为这些控制点编码2/3MVD,如图17所示。在现有实现中,MV的推导如下所示,例如,从mvd0预测mvd1和mvd2。
这里,mvdi和mvi分别是左上像素(i=0)、右上像素(i=1)或左下像素(i=2)的预测运动矢量、运动矢量差和运动矢量,如图18B所示。在一些实施例中,两个运动矢量(例如mvA(xA,yA)和mvB(xB,yB))的加和分别等于两个分量的总和。例如,newMV=mvA+mvB暗示newMV的两个分量分别被设置为(xA+xB)和(yA+yB)。
2.6.2.AF_INTER模式下的快速仿射ME算法的示例
在仿射模式的一些实施例中,需要联合确定2个或3个控制点的MV。联合直接搜索多个MV在计算上很复杂。例如,提出了快速仿射ME算法,并将其应用于VTM/BMS中。
例如,针对4参数仿射模型描述了快速仿射ME算法,该思想可以扩展到6参数仿射模型。
将(a 1)替换为a’,使得运动矢量重写为:
假设两个控制点(0,0)和(0,w)的运动矢量是已知的,则从等式(5)可以得出仿射参数如下:
运动矢量可以矢量形式重写为:
这里,P=(x,y)是像素位置,
在一些实施例中,在编码器上,AF_INTER的MVD可以迭代得出。将MVi(P)表示为在第i次迭代中针对位置P导出的MV,dMVC i表示为在第i次迭代中为MVC更新的增量。然后在第(i+1)次迭代中,
将Picref表示为参考图片,将Piccur表示为当前图片,并表示Q=P+MVi(P)。如果将MSE用作匹配标准,那么可以将需要最小化的函数写成:
在一些实施例中,可以将MVD导出过程进行n次迭代,且最终MVD的计算可以如下所示:
2.6.3 AF_MERGE模式的实施例
当在AF_MERGE模式中应用CU时,它从有效的临近重建块获得用仿射模式编码的第一个块。图18A示出了当前CU 1800的候选块的选择顺序的示例。如图18A所示,选择顺序可以是从当前CU 1800的左(1801)、上(1802)、右上(1803)、左下(1804)到左上(1805)。图18B示出了AF_MERGE模式中的当前CU 1800的候选块的另一示例。如果临近左下块1801以仿射模式进行编码,如图18B所示,推导包含块A的CU的左上角、右上角和左下角的运动矢量v2、v3和v4。并且根据v2、v3和v4计算当前CU 1800左上角的运动矢量v0。可以相应地计算当前CU的右上方的运动矢量v1。
在根据等式(1)中的仿射运动模式计算当前CU的CPMV v0和v1之后,可以生成当前CU的MVF。为了识别当前CU是否以AF_MERGE模式进行编码,当至少有一个临近块以仿射模式进行编码时,可以在比特流中用信令通知仿射标志。
2.7模式匹配的运动矢量推导(PMMVD)的示例
PMMVD模式是基于帧速率上转换(Frame-Rate Up Conversion,FRUC)方法的特殊Merge模式。利用该模式,在解码器侧推导块的运动信息,而不是发信令通知块的运动信息。
当CU的Merge标志为真时,可以向CU信令通知FRUC标志。当FRUC标志为假时,可以信令通知Merge索引并使用常规Merge模式。当FRUC标志为真时,可以信令通知额外的FRUC模式标志以指示将使用哪种方法(例如,双边匹配或模板匹配)来推导该块的运动信息。
在编码器侧,关于是否对CU使用FRUC Merge模式的决定是基于对正常Merge候选所做的RD成本选择。例如,通过使用RD成本选择来检查CU的多种匹配模式(例如,双边匹配和模板匹配)。引起最小成本的匹配模式与其他CU模式进一步比较。如果FRUC匹配模式是最有效的模式,则对于CU将FRUC标志设置为真,并且使用相关的匹配模式。
典型地,FRUC Merge模式中的运动推导过程具有两个步骤:首先执行CU级运动搜索,然后进行子CU级运动细化。在CU级,基于双边匹配或模板匹配,推导整个CU的原始运动矢量。首先,生成MV候选列表,并且选择引起最小匹配成本的候选作为进一步CU级细化的起点。然后,在起点附近执行基于的双边匹配或模板匹配的局部搜索。将最小匹配成本的MV结果作为整个CU的MV。随后,以推导的CU运动矢量作为起点,进一步在子CU级细化运动信息。
例如,对于W×H CU运动信息推导执行以下推导过程。在第一阶段,推导整个W×HCU的MV。在第二阶段,该CU进一步被划分成M×M个子CU。M的值的计算方法如(16)所示,D是预定义的划分深度,在JEM中默认设置为3。然后推导每个子CU的MV。
图19示出了在帧速率上转换(FRUC)方法中使用的双边匹配的示例。,通过在两个不同参考图片(1910,1911)中沿当前CU(1900)的运动轨迹找到两个块之间的最接近匹配,使用双边匹配来推导当前CU的运动信息。在连续运动轨迹的假设下,指向两个参考块的运动矢量MV0(1901)和MV1(1902)与当前图片和两个参考图片之间的时域距离(例如,TD0(1903)和TD1(1904))成比例。在一些实施例中,当当前图片1900在时域上在两个参考图片(1910,1911)之间并且从当前图片到两个参考图片的时域距离相同时,双边匹配成为基于镜像的双向MV。
图20示出了在帧速率上转换(FRUC)方法中使用的模板匹配的示例。模板匹配用于通过找到当前图片中的模板(当前CU的顶部和/或左侧临近块)与参考图片2010中的块(例如,与模板的尺寸相同)之间的最接近匹配来推导当前CU 2000的运动信息。除了上述FRUCMerge模式之外,模板匹配也可以应用于AMVP模式。在JEM和HEVC两者中所做的那样,AMVP有两个候选。通过模板匹配方法,推导新的候选。如果由模板匹配新推导的候选与第一现有AMVP候选不同,则将其插入AMVP候选列表的最开始处,然后将列表尺寸设置为2(例如,通过移除第二现有AMVP候选)。当应用于AMVP模式时,仅应用CU级搜索。
在CU级处设置的MV候选可以包括以下:(1)如果当前CU处于AMVP模式,则为原始AMVP候选,(2)所有Merge候选,(3)插值MV场中的几个MV(稍后描述),以及顶部和左侧临近运动矢量。
当使用双边匹配时,可以将Merge候选的每个有效MV用作输入,以生成假设双边匹配的情况下的MV对。例如,在参考列表A中,Merge候选的一个有效MV是(MVa,refa)。然后,在其他参考列表B中找到其配对的双边MV的参考图片refb,使得refa和refb在时域上位于当前图片的不同侧。如果这样的refb在参考列表B中不可用,则refb被确定为与refa不同的参考,并且其到当前图片的时域距离是列表B中的最小值。在确定refb之后,通过基于当前图片refa和refb之间的时域距离来缩放MVa来推导MVb。
在一些实施例中,来自插值MV场的四个MV也可以被添加到CU级候选列表。更具体地,添加当前CU的位置(0,0)、(W/2,0)、(0,H/2)和(W/2,H/2)处的插值MV。当FRUC应用于AMVP模式时,原始AMVP候选也被添加到CU级MV候选集。在一些实施例中,在CU级,对于AMVPCU,将15个MV添加到候选列表,对于MergeCU,将13个MV添加到候选列表。
在子CU级处设置的MV候选包括:(1)从CU级搜索确定的MV,(2)顶部、左侧、左上角和右上角的临近MV,(3)来自参考图片的并置MV的缩放版本,(4)一个或多个4个ATMVP候选(最多4个),(5)一个或多个STMVP候选(例如,最多4个)。来自参考图片的缩放MV如下推导。遍历两个列表中的参考图片。参考图片中的子CU的并置位置处的MV被缩放到起始CU级MV的参考。ATMVP和STMVP候选可以仅限于前四个。在子CU级,一个或多个MV(例如,最多17个)被添加到候选列表中。
插值MV场的生成。在对帧进行编码之前,基于单边ME为整个图片生成插值运动场。然后,运动场可以稍后用作CU级或子CU级MV候选。
在一些实施例中,两个参考列表中的每个参考图片的运动场以4×4块级遍历。图21示出了FRUC方法中的单边运动估计(ME)2100的示例。对于每个4×4块,如果与块相关联的运动通过当前图片中的4×4块并且块未被分配任何插值运动,则参考块的运动根据时域距离TD0和TD1(以与HEVC中的TMVP的MV缩放的方式相同的方式)被缩放到当前图片,并且将缩放的运动分配给当前帧中的块。如果没有缩放的MV被分配给4×4块,则在插值运动场中将块的运动标记为不可用。
插值和匹配成本。当运动矢量指向分数样点位置时,需要运动补偿插值。为了降低复杂度,替代常规8抽头HEVC插值,可以将双线性插值用于双边匹配和模板匹配。
匹配成本的计算在不同步骤处有点不同。当从CU级的候选集中选择候选时,匹配成本可以是双边匹配或模板匹配的绝对和之差(Absolute Sum Difference,SAD)。在确定起始MV之后,子CU级搜索的双边匹配的匹配成本C计算如下:
这里,w是加权因子。在一些实施例中,w可以设置为4。MV和MVs分别指示当前MV和起始MV。SAD仍可以用作子CU级搜索的模板匹配的匹配成本。
在FRUC模式中,仅通过使用亮度样点来推导MV。推导的运动将用于MC帧间预测的亮度和色度两者。在确定MV之后,使用用于亮度的8抽头插值滤波器和用于色度的4抽头插值滤波器来执行最终MC。
MV细化是基于模式的MV搜索,以双边匹配成本或模板匹配成本为标准。在JEM中,支持两种搜索模式—无限制中心偏置菱形搜索(Unrestricted Center-Biased DiamondSearch,UCBDS)和自适应交叉搜索,分别在CU级和子CU级进行MV细化。对于CU和子CU级MV细化两者,以四分之一亮度样点MV精度直接搜索MV,并且接着是八分之一亮度样点MV细化。将用于CU和子CU步骤的MV细化的搜索范围设置为等于8个亮度样点。
在双边匹配Merge模式中,应用双向预测,因为CU的运动信息是基于在两个不同的参考图片中沿当前CU的运动轨迹的两个块之间的最近匹配推导的。在模板匹配Merge模式中,编码器可以从列表0中的单向预测、列表1中的单向预测或双向预测当中为CU选择。可以选择基于如下的模板匹配成本:
如果costBi<=factor*min(cost0,cost1)
则使用双向预测;
否则,如果cost0<=cost1
则使用列表0中的单向预测;
否则,
使用列表1中的单向预测;
这里,cost0是列表0模板匹配的SAD,cost1是列表1模板匹配的SAD,costBi是双向预测模板匹配的SAD。例如,当factor的值等于1.25时,这意味着选择过程偏向于双向预测。帧间预测方向选择可以应用于CU级模板匹配过程。
2.8双向光流(bi-directional optical flow,BIO)的示例
双向光流(BIO)方法是样点方式的运动细化,其在用于双向预测的逐块运动补偿之上执行。在一些实施例中,样点级运动细化不使用信令。
图22示出了双向光流(BIO)方法中的示例光流轨迹。这里,τ0和τ1表示到参考帧的距离,如图21所示。基于Ref0和Ref1的POC计算距离t0和τ1:τ0=POC(当前)-POC(Ref0),τ1=POC(Ref1)-POC(当前)。如果两个预测都来自相同的时域方向(两者都来自过去或都来自未来),则sign是不同的即,τ0·τ1<0。在这种情况下,仅当预测不是来自相同的时刻(即,τ0≠τ1)时才应用BIO,两个参考区域都具有非零运动(MVx0,MVy0,MVx1,MVy1≠0)并且块运动矢量与时域距离成比例(MVx0/MVx1=MVy0/MVy1=-τ0/τ1)。
通过最小化点A和B中的值之间的差Δ来确定运动矢量场(vx,vy)。图9示出了运动轨迹和参考帧平面的交叉的示例。模式仅使用Δ的局部泰勒展开的第一线性项:
上述等式中的所有值都取决于样点位置,表示为(i′,j′)。假设运动在局部周围区域是一致的,在以当前预测点为中心的(2M+1)×(2M+1)的方形窗口Ω内最小化Δ,其中M等于2:
对于该优化问题,JEM使用简化方法,首先在垂直方向上进行最小化,然后在水平方向上进行最小化。由此产生以下:
其中,
为了避免除以零或非常小的值,在等式28和29中可以引入正则化参数r和m。
r=500·4d-8 (31)
m=700·4d-8 (32)
这里d是视频样点的比特深度。
为了使BIO的存储器访问与常规双向预测运动补偿保持相同,仅针对当前块内的位置计算所有预测和梯度值I(k),图23A示出了块2300外部的访问位置的示例。如图23A所示,在等式(30)中,以在预测块的边界上的当前预测点为中心的(2M+1)×(2M+1)方形窗口Ω需要访问块外部的位置。在JEM中,将块外部的I(k),的值设置为等于块内最近的可用值。例如,这可以实施为填充区域2301,如图23B所示。
利用BIO,可以针对每个样点细化运动场。为了降低计算复杂度,在JEM中使用基于块的BIO设计。可以基于4×4的块计算运动细化。在基于块的BIO中,可以聚合4×4的块中的所有样点的等式30中的sn的值,然后将sn的聚合值用于推导4×4块的BIO运动矢量偏移。更具体地,以下公式可以用于基于块的BIO推导:
这里,bk表示属于预测块的第k个4×4块的样点集。将等式28和29中的sn替换为((sn,bk)>>4),以推导相关联的运动矢量偏移。
在一些情景下,由于噪声或不规则运动,BDOF的MV团(MV regiment)可能不可靠。因此,在BIO中,MV团的尺寸被阈值裁剪。基于当前图片的参考图片是否都来自一个方向来确定阈值。例如,如果当前图片的所有参考图片都来自一个方向,则将阈值的值设置为12×214-d;否则,将其设置为12×213-d。
可以利用使用与HEVC运动补偿过程(例如,2D可分离有限脉冲响应(FIR))一致的操作的运动补偿插值来同时计算BIO的梯度。在一些实施例中,根据块运动矢量的分数部分,该2D可分离FIR的输入是与运动补偿过程和分数位置(fracX,fracY)相同的参考帧样点。对于水平梯度首先使用与具有去缩放偏移d-8的分数位置fracY相对应的BIOfilterS垂直插值信号。然后在水平方向上应用梯度滤波器BIOfilterG,该BIOfilterG与具有去缩放偏移18-d的分数位置fracX相对应。对于垂直梯度首先使用与具有去缩放偏移d-8的分数位置fracY相对应的BIOfilterG垂直应用梯度滤波器。然后在水平方向上使用BIOfilterS执行信号位移,该BIOfilterS与具有去缩放偏移18-d的分数位置fracX相对应。用于梯度计算的插值滤波器BIOfilterG和用于信号位移的插值滤波器BIOfilterS的长度可以较短(例如,6抽头),以保持合理的复杂度。表1示出了可以用于BIO中块运动矢量的不同分数位置的梯度计算的滤波器的示例。表2示出了可以用于BIO中预测信号生成的插值滤波器的示例。
表1:用于BIO中梯度计算的示例性滤波器
分数像素位置 | 梯度的插值滤波器(BIOfilterG) |
0 | {8,-39,-3,46,-17,5} |
1/16 | {8,-32,-13,50,-18,5} |
1/8 | {7,-27,-20,54,-19,5} |
3/16 | {6,-21,-29,57,-18,5} |
1/4 | {4,-17,-36,60,-15,4} |
5/16 | {3,-9,-44,61,-15,4} |
3/8 | {1,-4,-48,61,-13,3} |
7/16 | {0,1,-54,60,-9,2} |
1/2 | {-1,4,-57,57,-4,1} |
表2:用于BIO中预测信号生成的示例性插值滤波器
分数像素位置 | 预测信号的插值滤波器(BIOfilterS) |
0 | {0,0,64,0,0,0} |
1/16 | {1,-3,64,4,-2,0} |
1/8 | {1,-6,62,9,-3,1} |
3/16 | {2,-8,60,14,-5,1} |
1/4 | {2,-9,57,19,-7,2} |
5/16 | {3,-10,53,24,-8,2} |
3/8 | {3,-11,50,29,-9,2} |
7/16 | {3,-11,44,35,-10,3} |
1/2 | {3,-10,35,44,-11,3} |
在JEM中,当两个预测来自不同的参考图片时,BIO可以应用于所有双预测块。当为CU启用局部照明补偿(LIC)时,可以禁用BIO。
在一些实施例中,OBMC在正常MC过程之后应用于块。为了降低计算复杂度,在OBMC过程中可以不应用BIO。这意味着BIO仅在使用其自身的MV时才应用于块的MC过程,并且在OBMC过程中使用临近块的MV时不应用于MC过程。
2.9解码器侧运动矢量细化(DMVR)的示例
在双向预测操作中,对于一个块区域的预测,将分别使用list0的运动矢量(MV)和list1的MV形成的两个预测块进行组合以形成单个预测信号。在解码器侧运动矢量细化(Decoder-Side Motion Vector Refinement,DMVR)方法中,通过双边模板匹配过程进一步细化双向预测的两个运动矢量。双边模板匹配应用在解码器中,以在双边模板和参考图片中的重建样点之间执行基于失真的搜索,以便获得细化的MV而无需传输附加的运动信息。
在DMVR中,分别从列表0的原始MV0和列表1的MV1,将双边模板生成为两个预测块的加权组合(即平均),如图24所示。模板匹配操作包括计算所生成的模板与参考图片中的(在原始预测块周围的)样点区域之间的成本度量。对于两个参考图片中的每个,将产生最小模板成本的MV考虑为该列表的更新MV以替换原始MV。在JEM中,对每个列表搜索九个MV候选。该九个MV候选包括原始MV和8个与原始MV在水平或垂直方向上或两个方向上具有一个亮度样点偏移的环绕的MV。最后,将两个新的MV,即如图24中所示的MV0'和MV1',用于生成最终的双向预测结果。将绝对差之和(SAD)用作成本度量。
将DMVR应用于双向预测的Merge模式,其中一个MV来自过去的参考图片,另一MV来自未来的参考图片,而无需传输额外的语法元素。在JEM中,当对CU启用LIC、仿射运动、FRUC或子CU Merge候选时,不应用DMVR。
2.10对称运动矢量差的示例
对称运动矢量差(SMVD)可以用于更有效地对MVD进行编码。
首先,在条带级别上,变量BiDirPredFlag、RefIdxSymL0和RefIdxSymL1推导如下:
·搜索参考图片列表0中最接近当前图片的前向参考图片。如果找到,则将RefIdxSymL0设置为等于前向图片的参考索引。
·搜索参考图片列表1中最接近当前图片的后向参考图片。如果找到,则将RefIdxSymL1设置为等于后向图片的参考索引。
·如果找到前向和后向图片二者,则将BiDirPredFlag设置为等于1。
·否则,适用以下内容:
·搜索参考图片列表0中最接近当前图片的后向参考图片。如果找到,则将RefIdxSymL0设置为等于后向图片的参考索引。
·搜索参考图片列表1中最接近当前图片的前向参考图片。如果找到,则将RefIdxSymL1设置为等于前向图片的参考索引。
·如果找到后向和前向图片二者,则将BiDirPredFlag设置为等于1。否则,将BiDirPredFlag设置为等于0。
其次,在CU级别上,如果CU的预测方向为双向预测且BiDirPredFlag等于1,则显式地用信令通知指示是否使用对称模式的对称模式标志。
当该标志为真时,仅显式地用信令通知mvp_l0_flag、mvp_l1_flag和MVD0。对于列表0和列表1,将参考索引分别设置为等于RefIdxSymL0、RefIdxSymL1。仅将MVD1设置等于–MVD0。将最终运动矢量示出以下公式中。
图27示出了对称模式的示例。
表3中以粗体和/或斜体示出了编码单元语法中的修改。
表3:编码单元语法中的修改
3.上下文自适应二进制算术编码(CABAC)
3.1 HEVC中的CABAC设计
3.1.1 HEVC中的上下文表示和初始化过程
在HEVC中,对于每个上下文变量,初始化两个变量pStateIdx和valMps。
从8比特表条目initValue中,将两个4比特变量slopeIdx和offsetIdx推导如下:
slopeIdx=initValue>>4
offsetIdx=initValue&15 (5)
在上下文变量的初始化中使用的变量m和n从lopedIdx和offsetIdx中推导如下:
m=slopeIdx*5-45
n=(offsetIdx<<3)-16 (6)
赋值给pStateIdx和valMps进行初始化的两个值是从表示为SliceQpY的条带的亮度量化参数中推导的。给定变量m和n,初始化指定如下:
preCtxState=Clip3(1,126,((m*Clip3(0,51,SliceQpY))>>4)+n)
valMps=(preCtxState<=63)?0:1 (7)
pStateIdx=valMps?(preCtxState-64):(63-preCtxState)
3.1.2 HEVC中的状态转换过程
该过程的输入是当前pStateIdx,与ctxTable和ctxIdx相关联的上下文变量的解码值binVal和valMps值。
该过程的输出是与ctxIdx相关联的上下文变量的更新的pStateIdx和valMps。
取决于解码值binVal,与ctxIdx相关联的两个变量pStateIdx和valMps的更新在(37)推导如下:
3.2 VVC中的CABAC设计
VVC中的上下文自适应二进制算术编码器(BAC)已在VVC中进行了更改,这在上下文更新过程和算术编码器方面均不同于HEVC。
这是最近采用的提案(JVET-M0473,CE测试5.1.13)的摘要。
表4:VCC中CABAC修改的摘要
3.2.1 VVC中的上下文初始化过程
在VVC中,从SliceQpY推导用于初始化的赋值给pStateIdx0和pStateIdx1的两个值。给定变量m和n,初始化指定如下:
preCtxState=Clip3(0,127,((m*Clip3(0,51,SliceQpY))>>4)+n)pStateIdx0=initStateIdxToState[preCtxState]>>4
pStateIdx1=initStateIdxToState[preCtxState] (9)
3.2.2 VVC中的状态转换过程
该过程的输入是当前的pStateIdx0和pStateIdx1,以及解码值binVal。
该过程的输出是与ctxIdx相关联的上下文变量的更新的pStateIdx0和pStateIdx1。
从与ctxTable和ctxInc相关联的shiftIdx值推导变量shift0(对应于VVC表4中CABAC修改的摘要中的变量a)和shift1(对应于VVC表4e中CABAC修改的摘要中的变量b)。
shift0=(shiftIdx>>2)+2
shift1=(shiftIdx&3)+3+shift0 (10)
取决于解码值binVal,与ctxIdx相关联的两个变量pStateIdx0和pStateIdx1的更新推导如下:
pStateIdx0=pStateIdx0-(pStateIdx0>>shift0)+(1023*binVal>>shift0)
pStateIdx1=pStateIdx1-(pStateIdx1>>shift1)+(16383*binVal>>shift1)(11)
4.现有实施方式的缺点
在一些现有实施方式中,当可以从仿射编码块的多个MV/MVD精度的集合中选择MV/MV差(MVD)时,仍然不确定如何获得更准确的运动矢量。
在其他现有实施方式中,MV/MVD精度信息在确定应用于仿射模式的AMVR的整体编码增益方面也起着重要作用,但是实现这一目标仍然不确定。
5.使用AMVR的仿射模式的MV预测器的示例方法
当前公开的技术的实施例克服了现有实施方式的缺点,从而提供了具有更高的编码效率的视频编码。基于所公开的技术,在以下对各种实施方式所描述的示例中阐述了可以增强现有和未来的视频编码标准的使用自适应运动矢量分辨率(AMVR)的仿射模式的运动矢量预测器的推导和信令。下面提供的所公开的技术的示例解释了一般概念,并不意为被解释为限制性的。在一个示例中,除非明确指出相反,否则可以对这些示例中描述的各种特征进行组合。
在一些实施例中,当应用AMVR时,可以将以下示例应用于仿射模式或正常模式。这些示例假定精度Prec(即MV具有1/(2^Prec)精度)用于在AF_INTER模式中对MVD进行编码或在正常帧间模式中对MVD进行编码。运动矢量预测器(例如,从临近块MV继承的)及其精度分别由MVPred(MVPredX,MVPredY)和PredPrec表示。
支持AMVR的仿射模式的改进
1.允许的MVD精度集可能因图片而异,因条带而异或因块而异。
a.在一个示例中,允许的MVD精度集可以取决于编码信息,诸如块尺寸、块形状等。
b.可以预先定义允许的MV精度集,诸如{1/16,1/4,1}。
c.可以在SPS/PPS/VPS/序列标头/图片标头/条带标头/CTU组等中用信令通知允许的MV精度的指示。
d.从允许的MV精度集中选择的MV精度的信令还取决于针对块所允许的MV精度的数量。
2.将语法元素用信令通知到解码器以指示仿射帧间模式中所使用的MVD精度。
a.在一个示例中,仅一个单一语法元素用于指示应用于仿射模式和AMVR模式的MVD精度。
i.在一个示例中,使用相同的语义,即对于AMVR和仿射模式,将相同的语法元素值映射到相同的MVD精度。
ii.可替代地,对于AMVR模式和仿射模式,单一语法元素的语义不同。也就是说,对于AMVR和仿射模式,可以将语法元素的相同值映射到不同的MVD精度。
b.在一个示例中,当仿射模式使用与AMVR相同的MVD精度集(例如MVD精度集为{1,1/4,4}像素)时,在仿射模式中重用AMVR中的MVD精度语法元素,即仅使用一个单一语法元素。
i.可替代地,此外,当在CABAC编码器/解码器中对该语法元素进行编码/解码时,可以将相同或不同的上下文模型用于AMVR和仿射模式。
ii.可替代地,此外,该语法元素在AMVR和仿射模式中可以具有不同的语义。例如,等于0、1和2的语法元素分别指示AMVR中的1/4像素、1像素和4像素MV精度,而在仿射模式中,等于0、1和2的语法元素指示1/4像素、1/16像素和1像素MV精度。
c.在一个示例中,当仿射模式使用与AMVR相同数量的MVD精度,但使用不同的MVD精度集时(例如,AMVR的MVD精度集为{1,1/4,4}像素,而仿射模式的MVD精度集为{1/16、1/4、1}像素),则在仿射模式中重用AMVR中的MVD精度语法元素,即,仅使用一个单一语法元素。
i.可替代地,此外,当在CABAC编码器/解码器中对该语法元素进行编码/解码时,可以将相同或不同的上下文模用于AMVR和仿射模式。
ii.可替代地,此外,该语法元素在AMVR和仿射模式中可以具有不同的语义。
d.在一个示例中,仿射模式比AMVR使用更少的MVD精度,在仿射模式中重用AMVR中的MVD精度语法元素。然而,仅语法元素值的子集对仿射模式有效。
i.可替代地,此外,当在CABAC编码器/解码器中对该语法元素进行编码/解码时,可以将相同或不同的上下文模型用于AMVR和仿射模式。
ii.可替代地,此外,该语法元素在AMVR和仿射模式中可以具有不同的语义。
e.在一个示例中,仿射模式比AMVR使用更多的MVD精度,在仿射模式中重用AMVR中的MVD精度语法元素。然而,这样的类语法元素被扩展,以在仿射模式中允许更多值。
i.可替代地,此外,当在CABAC编码器/解码器中对该语法元素进行编码/解码时,可以将相同或不同的上下文模型用于AMVR和仿射模式。
ii.可替代地,此外,该语法元素在AMVR和仿射模式中可以具有不同的语义。
f.在一个示例中,将新的语法元素用于对仿射模式的MVD精度进行编码,即,使用两个不同的语法元素对AMVR和仿射模式的MVD精度进行编码。
g.在以下一个或所有条件为真的情况下,可以用信令通知仿射模式的MVD精度的指示的语法:
i.所有控制点的MVD都不为零。
ii.至少一个控制点的MVD不为零。
iii.一个控制点(例如第一CPMV)的MVD不为零
在这种情况下,当上述条件中的一个或所有条件均不满足时,无需用信令通知MVD精度。
h.可以用上下文对用于仿射模式或AMVR模式的MVD精度的指示的语法元素进行编码,并且上下文取决于编码信息。
i.在一个示例中,当仅存在一个单一语法元素时,上下文可以取决于当前块是否以仿射模式进行编码。
i.在一个示例中,上下文可以取决于临近块的块尺寸/块形状/MVD精度/时域层索引/预测方向等。
j.可以在SPS/PPS/VPS/序列标头/图片标头/条带标头/CTU组等中用信令通知是否为仿射模式启用多个MVD精度。
i.在一个示例中,是否用信令通知对仿射模式启用或禁用多个MVD精度的信息可以取决于其他语法元素。例如,当启用仿射模式时,用信令通知对仿射模式启用或禁用多个MV和/或MVP和/或MVD精度的信息;并且当禁用仿射模式时,不用信令通知该信息并将其推断为0。
k.可替代地,可以在仿射帧间模式中用信令通知多个语法元素以指示所使用的MV和/或MVP和/或MVD精度(在以下讨论中,它们统称为“MVD精度”)。
i.在一示例中,用于指示仿射帧间模式和正常帧间模式中所使用的MVD精度的语法元素可以不同。
1.指示仿射帧间模式和普通帧间模式中所使用的MVD精度的语法元素的数量可以不同。
2.指示仿射帧间模式和正常帧间模式中所使用的MVD精度的语法元素的语义可以不同。
3.对指示仿射帧间模式和正常帧间模式中所使用的MVD精度的一个语法元素进行编码的算术编码中的上下文模型可以不同。
4.对指示仿射帧间模式和正常帧间模式中所使用的MVD精度的一个语法元素进行编码的算术编码中的上下文模型进行推导的方法可以不同。
ii.在一个示例中,可以用信令通知第一语法元素(例如amvr_flag)以指示是否在仿射编码块中应用AMVR。
1.有条件地用信令通知第一语法元素。
a.在一个示例中,当以某种模式(例如,CPR/IBC模式)对当前块进行编码时,跳过第一语法元素(amvr_flag)的信令。
b.在一个示例中,当所有CPMV的MVD(包括水平分量和垂直分量)都为零时,跳过第一语法元素(amvr_flag)的信令。
c.在一个示例中,当一个选定的CPMV的MVD(包括水平分量和垂直分量)都为零时,跳过第一语法元素(amvr_flag)的信令。
i.在一个示例中,所选择的CPMV的MVD是要被编码/解码的第一CPMV的MVD。
d.在一个示例中,当对仿射编码块启用多个MVD精度的使用为假时,跳过第一语法元素(amvr_flag)的信令。
e.在一个示例中,可以在以下条件下用信令通知第一语法元素:
i.对仿射编码块启用多个MVD精度的使用为真,并且当前块以仿射模式进行编码;
ii.可替代地,对仿射编码块启用多个MVD精度的使用为真,当前块以仿射模式进行编码,并且CPMV的MVD的至少一个分量不等于0。
iii.可替代地,对仿射编码块启用多个MVD精度的使用为真,当前块以仿射模式进行编码,并且所选CPMV的MVD的至少一个分量不等于0。
1.在一个示例中,所选择的CPMV的MVD是要被编码/解码的第一CPMV的MVD。
2.当AMVR不应用于仿射编码块或第一语法元素不存在时,使用默认MV和/或MVD精度。
a.在一个示例中,默认精度为1/4像素。
b.可替代地,,将默认精度设置为仿射编码块的运动补偿中使用的精度。
3.例如,如果amvr_flag等于0,则仿射模式的MVD精度为1/4像素;否则,仿射模式的MVD精度可以是其他值。
a.可替代地,此外,还可以经由第二语法元素用信令通知其他的MVD精度。
iii.在一个示例中,可以用信令通知第二语法元素(诸如amvr_coarse_precision_flag)以指示仿射模式的MVD精度。
1.在一个示例中,是否用信令通知第二语法元素可以取决于第一语法元素。例如,仅当第一语法元素为1时才用信令通知第二语法元素。
2.在一个示例中,如果第二语法元素为0,则仿射模式的MVD精度为1像素;否则,仿射模式的MVD精度为1/16像素。
3.在一个示例中,如果第二语法元素为0,则仿射模式的MVD精度为1/16像素;否则,仿射模式的MVD精度为全像素。
iv.在一个示例中,用于指示在仿射帧间模式中所使用的MVD精度的语法元素与具有相同名称但用于指示在正常帧间模式中所使用的MVD精度的语法元素共享相同的上下文模型。
1.可替代地,用于指示在仿射帧间模式中所使用的MVD精度的语法元素与具有相同名称但用于指示在正常帧间模式中所使用的MVD精度的语法元素使用不同的上下文模型。
3.是否在仿射编码块上应用或如何在仿射编码块上应用AMVR可以取决于当前块的参考图片。
a.在一个示例中,如果参考图片是当前图片,则不应用AMVR,即,在当前块中应用帧内块复制。
仿射模式中编码器的AVMR快速算法
对于IMV=i,将仿射模式和AMVP模式的RD成本(实际RD成本,或SATD/SSE/SAD成本加上粗略的比特成本)表示为affineCosti和amvpCosti,其中i=0、1或2。这里,IMV=0表示1/4像素MV,并且对于AMVP模式,IMV=1表示整数MV,对于仿射模式,IMV=1表示1/16像素,并且对于AMVP模式,IMV=2表示4像素MV,对于仿射模式,IMV=2表示整数MV。将Merge模式的RD成本表示为mergeCost。
4.建议如果当前CU的母(parent)CU的最佳模式不是AF_INTER模式或AF_MERGE模式,则对当前CU的仿射模式禁用AMVR。
a.可替代地,如果当前CU的母CU的最佳模式不是AF_INTER模式,则对当前CU的仿射模式禁用AMVR。
5.建议如果affineCost0>th1*amvpCost0,则对仿射模式禁用AMVR,其中th1为正阈值。
a.可替代地,另外,如果min(affineCost0,amvpCost0)>th2*mergeCost,则对仿射模式禁用AMVR,其中th2为正阈值。
b.可替代地,另外,如果affineCost0>th3*affineCost1,则对仿射模式禁用整数MV,其中th3为正阈值。
6.建议如果amvpCost0>th4*affineCost0,则对AMVP模式禁用AMVR,其中th4为正阈值。
a.可替代地,如果min(affineCost0,amvpCost0)>th5*mergeCost,则对AMVP模式禁用AMVR,其中th5是正阈值。
7.建议在一个MV精度中获得的4/6参数仿射模型可以用作其他MV精度的候选起始搜索点。
a.在一个示例中,在1/16MV中获得的4/6参数仿射模型可以用作其他MV精度的候选起始搜索点。
b.在一个示例中,在1/4MV中获得的4/6参数仿射模型可以用作其他MV精度的候选起始搜索点。
8.如果当前块的母块未选择仿射模式,则在当前块的编码器处不检查仿射模式的AMVR。
9.可以利用先前编码的帧/条带/片/CTU行中仿射编码块的不同MV精度的使用的统计信息来提前终止当前条带/片/CTU行中仿射编码块的MV精度的率失真计算。
a.在一个示例中,记录具有一定MV精度的仿射编码块的百分比。如果百分比太低,则跳过对对应MV精度的检查。
b.在一个示例中,利用具有相同时域层的先前编码的帧来决定是否跳过某个MV精度。
对仿射AMVR进行编码的上下文
10.对用于对仿射AMVR码进行编码的每个上下文,建议设置变量(由shiftIdx表示)以控制与该上下文相关联的两个概率更新速度。
a.在一个示例中,较快的更新速度由(shiftIdx>>2)+2定义。
b.在一个示例中,较慢的更新速度由(shiftIdx&3)+3+shift0定义
c.在一个示例中,一致性比特流应遵循推导的较快的更新速度应在[2,5]范围内的规则。
d.在一个示例中,一致性比特流应遵循推导的较快的更新速度应在[3,6]范围内的规则。
11.建议当对一个块的AMVR模式进行编码时,对上下文建模不允许临近块的仿射AMVR模式信息。
a.在一个示例中,可利用临近块的AMVR模式索引,并且排除临近块的仿射AMVR模式信息。表5(包括表5-1和5-2)中示出了一个示例,其中(xNbL,yNbL)和(xNbA,yNbA)表示左侧和上方临近块。在一个示例中,上下文索引偏移ctxInc=(condL&&availableL)+(condA&&availableA)+ctxSetIdx*3。
表5-1–使用左侧和上方语法元素的ctxInc规范
表5-2–使用左侧和上方语法元素的ctxInc规范
b.可替代地,还可以利用临近块的仿射AMVR模式信息,但是是与函数一起使用,而不是直接使用。在一个示例中,当仿射编码的临近块的amvr_mode[xNbL][yNbL]指示某个MV精度(诸如1/4像素MV精度)时,如表6-1中所述的函数func可以返回真。在一个示例中,当仿射编码的临近块的amvr_flag[xNbL][yNbL]指示某个MV精度(诸如1/4像素MV精度)时,如表6-2中所述的函数func可以返回真。
表6-1–使用左侧和上方语法元素的ctxInc规范
表6-2–使用左侧上方语法元素的ctxInc规范
c.可替代地,还可以利用临近块的仿射AMVR模式信息来对AMVR模式(应用于正常帧间模式)的第一语法元素(例如,amvr_flag)进行编码。表6-3和6-4给出了一些示例。
表6-3–使用左侧和上方语法元素的ctxInc规范
表6-4–使用左侧和上方语法元素的ctxInc规范
d.当AMVR模式信息由多个语法元素(例如,表示为amvr_flag、amvr_coarse_precision_flag的第一和第二语法元素)表示时,上述语法amvr_mode可以由多个语法元素中的任何一个替换,并且仍然可以应用上述方法。
12.建议当对仿射AMVR模式进行编码时,可以利用临近块的AMVR模式信息进行上下文编码。
a.在一个示例中,直接使用临近块的AMVR模式信息。表7中示出了一个示例。可替代地,此外,上下文索引偏移ctxInc=(condL&&
availableL)+(condA&&availableA)+ctxSetIdx*3。
表7–使用左侧和上方语法元素的ctxInc规范
b.可替代地,不允许将临近块的AMVR模式信息用于上下文建模。
表8中示出了一个示例。
表8–使用左侧和上方语法元素的ctxInc规范
c.可替代地,还可以利用临近块的AMVR模式信息,但是是与函数一起使用,而不是直接使用。在一个示例中,当非仿射编码的临近块的amvr_mode[xNbL][yNbL]指示某个MV精度(诸如1/4像素MV精度)时,如表9中所述的函数func可以返回真。
表9–使用左侧和上方语法元素的ctxInc规范
d.当仿射AMVR模式信息由多个语法元素(例如,表示为amvr_flag,amvr_coarse_precision_flag的第一和第二语法元素)表示时,上述语法amvr_mode可以由多个语法元素中的任何一个替换,并且仍然可以应用上述方法。
SMVD和仿射SMVD的快速算法
当检查SMVD模式时,假设当前所选择的最佳模式为CurBestMode,并且AMVR中AMVRMVD精度为MvdPrec或者仿射AMVR的MVD精度为MvdPrecAff。
13.取决于当前所选择的最佳模式(即CurBestMode)、AMVR中的MVD精度,可以跳过SMVD模式。
a.在一个示例中,如果CurBestMode是Merge模式或/和UMVE模式,则可以不检查SMVD模式。
b.在一个示例中,如果未使用SMVD模式对CurBestMode进行编码,则可以不检查SMVD模式。
c.在一个示例中,如果CurBestMode是仿射模式,则可以不检查SMVD模式。
d.在一个示例中,如果CurBestMode是子块Merge模式,则可以不检查SMVD模式。
e.在一个示例中,如果CurBestMode是仿射SMVD模式,则可以不检查SMVD模式。
f.在一个示例中,如果CurBestMode是仿射Merge模式,则可以不检查SMVD模式。
g.在一个示例中,以上快速方法(即项目符号13.a-13.f)可以仅应用于某些MVD精度。
i.在一个示例中,仅当MVD精度大于或等于精度(例如,整数像素精度)时,才可以应用上述快速方法。
ii.在一个示例中,仅当MVD精度大于精度(例如,整数像素精度)时,才可以应用上述快速方法。
iii.在一个示例中,仅当MVD精度小于或等于精度(例如,整数像素精度)时,才可以应用上述快速方法。
iv.在一个示例中,仅当MVD精度小于精度(例如,整数像素精度)时,才可以应用上述快速方法。
14.取决于当前所选择的最佳模式(即CurBestMode)、仿射AMVR中的MVD精度,可以跳过仿射SMVD模式。
a.在一个示例中,如果CurBestMode是Merge模式或/和UMVE模式,则可以不检查仿射SMVD模式。
b.在一个示例中,如果未使用仿射SMVD模式对CurBestMode进行编码,则可以不检查仿射SMVD模式。
c.在一个示例中,如果CurBestMode是子块Merge模式,则可以不检查仿射SMVD模式。
d.在一个示例中,如果CurBestMode是SMVD模式,则可以不检查仿射SMVD模式。
e.在一个示例中,如果CurBestMode是仿射Merge模式,则可以不检查仿射SMVD模式。
f.在一个示例中,上述快速方法(即项目符号14.a-14.e)可以仅应用于某些MVD精度。
i.在一个示例中,仅当仿射MVD精度大于或等于精度(例如,整数像素精度)时,才可以应用上述快速方法。
ii.在一个示例中,仅当仿射MVD精度大于精度(例如,整数像素精度)时,才可以应用上述快速方法。
iii.在一个示例中,仅当仿射MVD精度小于或等于精度(例如,整数像素精度)时,才可以应用以上快速方法。
iv.在一个示例中,仅当仿射MVD精度小于精度(例如,整数像素精度)时,才可以应用上述快速方法。
15.上述提出的方法可以在某些条件下应用,诸如块尺寸、条带/图片/片类型或运动信息。
a.在一个示例中,当块尺寸包含小于M*H个样点,例如16或32或64个亮度样点时,不允许所提出的方法。
b.可替代地,当块的宽度或/和高度的最小尺寸小于或不大于X时,不允许所提出的方法。在一个示例中,将X设置为8。
c.可替代地,当块的宽度或/和高度的最小尺寸不小于X时,不允许所提出的方法。在一个示例中,将X设置为8。
d.可替代地,当块的宽度>th1或>=th1和/或块的高度>th2或>=th2时,不允许所提出的方法。在一个示例中,将th1和/或th2设置为8。
e.可替代地,当块的宽度<th1或<=th1和/或块的高度<th2或<=th2时,不允许所提出的方法。在一个示例中,将th1和/或th2设置为8。
f.可替代地,是启用还是禁用上述方法和/或应用哪种方法可以取决于块尺寸、视频处理数据单元(VPDU)、图片类型、低延迟检查标志、当前块或先前编码块的编码信息(诸如例如参考图片、单向或双向预测)。
16.当是否应用帧内块复制(IBC,又称为当前图片参考(CPR))时,可以以不同的方式执行仿射模式的AMVR方法。
a.在一个示例中,如果块是由IBC编码的,则不能使用仿射模式的AMVR。
b.在一个示例中,如果块是由IBC编码的,则可以使用仿射模式的AMVR,但是候选MV/MVD/MVP精度可以与用于非IBC编码的仿射编码块的候选MV/MVD/MVP精度不同。
17.本文中的所有术语“条带”都可以替换为“片组”或“片”。
18.在VPS/SPS/PPS/条带标头/片组标头中,等于1的语法元素(例如no_amvr_constraint_flag)指定指示是否启用AMVR的语法元素(例如sps_amvr_enabled_flag)以及指示是否启用仿射AMVR的语法元素(例如sps_affine_avmr_enabled_flag)二者均应等于0是比特流一致性的要求。等于0的语法元素(例如no_amvr_constraint_flag)不施加约束。
19.在VPS/SPS/PPS/条带标头/片组标头或其他视频数据单元中,可以用信令通知语法元素(例如,no_affine_amvr_constraint_flag)。
a.在一个示例中,no_affine_amvr_constraint_flag等于1指定指示是否启用仿射AMVR的语法元素(例如sps_affine_avmr_enabled_flag)应等于0是比特流一致性的要求。等于0的语法元素(例如no_affine_avvr_constraint_flag)不施加约束。
6.实施例
下面的粗体、斜体部分示出了修改后的规范。
6.1实施例1:对仿射AMVR模式的使用的指示
可以在SPS/PPS/VPS/APS/序列标头/图片头/片组标头等中用信令通知。本节介绍SPS中的信令。
6.1.1 SPS语法表
将替代SPS语法表给出如下:
语义
sps_affine_amvr_enabled_flag等于1指定将自适应运动矢量差分辨率用于仿射帧间模式的运动矢量编码。amvr_enabled_flag等于0指定自适应运动矢量差分辨率不用于仿射帧间模式的运动矢量编码。
6.2仿射AMVR模式信息的解析过程
仿射AMVR模式信息的语法可以重用AMVR模式信息的语法(应用于正常帧间模式)。可替代地,可以利用不同的语法元素。
可以有条件地用信令通知仿射AMVR模式信息。下面的不同实施例示出了条件的一些示例。
6.2.1实施例#1:CU语法表
6.2.2实施例2:可替代的CU语法表设计
6.2.3实施例3:第三CU语法表设计
6.2.4实施例4:用AMVR和仿射模式的不同语法的语法表设计
在一个示例中,conditionsA定义如下:
(sps_affine_amvr_enabled_flag&&inter_affine_flag==1&&
(MvdCpL0[x0][y0][0][0]!=0||MvdCpL0[x0][y0][0][1]!=0||
MvdCpL1[x0][y0][0][0]!=0||MvdCpL1[x0][y0][0][1]!=0||
MvdCpL0[x0][y0][1][0]!=0||MvdCpL0[x0][y0][1][1]!=0||
MvdCpL1[x0][y0][1][0]!=0||MvdCpL1[x0][y0][1][1]!=0||
MvdCpL0[x0][y0][2][0]!=0||MvdCpL0[x0][y0][2][1]!=0||
MvdCpL1[x0][y0][2][0]!=0||MvdCpL1[x0][y0][2][1]!=0))
可替代地,conditionsA定义如下:
(sps_affine_amvr_enabled_flag&&inter_affine_flag==1&&
(MvdCpL0[x0][y0][0][0]!=0||MvdCpL0[x0][y0][0][1]!=0||
MvdCpL1[x0][y0][0][0]!=0||MvdCpL1[x0][y0][0][1]!=0||)
可替代地,conditionsA定义如下:
(sps_affine_amvr_enabled_flag&&inter_affine_flag==1&&
(MvdCpLX[x0][y0][0][0]!=0||MvdCpLX[x0][y0][0][1]!=0)
其中,X为0或1。
可替代地,conditionsA定义如下:
(sps_affine_amvr_enabled_flag&&inter_affine_flag==1)
在一个示例中,conditionsB定义如下:
!sps_cpr_enabled_flag||!(inter_pred_idc[x0][y0]==PRED_L0&&ref_idx_l0[x0][y0]==num_ref_idx_l0_active_minus1)
可替代地,conditionsB定义如下:
!sps_cpr_enabled_flag||!(pred_mode[x0][y0]==CPR)
可替代地,conditionsB定义如下:
!sps_ibc_enabled_flag||!(pred_mode[x0][y0]==IBC)
当利用不同的语法元素对AMVR或仿射AMVR进行编码时,可以相应地应用应用于仿射AMVR的用于6.5中的实施例的上下文建模和/或上下文。
6.2.5语义
amvr_flag[x0][y0]指定运动矢量差的分辨率。阵列索引x0、y0指定所考虑的编码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。amvr_flag[x0][y0]等于0指定运动矢量差的分辨率为亮度样点的1/4。amvr_flag[x0][y0]等于1指定运动矢量差的分辨率还由amvr_coarse_precisoin_flag[x0][y0]指定。
当不存在amvr_flag[x0][y0]时,可以如下推断:
–如果sps_cpr_enabled_flag等于1,则推断amvr_flag[x0][y0]等于1。
–否则(sps_cpr_enabled_flag等于0),推断amvr_flag[x0][y0]等于0。
amvr_coarse_precisoin_flag[x0][y0]等于1指定当inter_affine_flag等于0时,运动矢量差的分辨率为四亮度样点,而当inter_affine_flag等于1时,为1亮度样点。阵列索引x0、y0指定所考虑的编码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
当amvr_coarse_precisoin_flag[x0][y0]不存在时,将其推断为等于0。
如果inter_affine_flag[x0][y0]等于0,则将变量MvShift设置为等于(amvr_flag[x0][y0]+amvr_coarse_precisoin_flag[x0][y0])<<1,并且将变量MvdL0[x0][y0][0]、MvdL0[x0][y0][1]、MvdL1[x0][y0][0]、MvdL1[x0][y0][1]修改如下:
MvdL0[x0][y0][0]=MvdL0[x0][y0][0]<<(MvShift+2) (7-70)
MvdL0[x0][y0][1]=MvdL0[x0][y0][1]<<(MvShift+2) (7-71)
MvdL1[x0][y0][0]=MvdL1[x0][y0][0]<<(MvShift+2) (7-72)
MvdL1[x0][y0][1]=MvdL1[x0][y0][1]<<(MvShift+2) (7-73)
如果inter_affine_flag[x0][y0]等于1,则将变量MvShift设置为等于(amvr_coarse_precisoin_flag?(amvr_coarse_precisoin_flag<<1):(-(amvr_flag<<1))),并且将变量MvdCpL0[x0][y][0][0]、MvdCpL0[x0][y0][0][1]、MvdCpL0[x0][y0][1][0]、MvdCpL0[x0][y0][1][1]、MvdCpL0[x0][y0][2][0]、MvdCpL0[x0][y0][2][1]修改如下:
MvdCpL0[x0][y0][0][0]=MvdCpL0[x0][y0][0][0]<<(MvShift+2)
(7-73)
MvdCpL1[x0][y0][0][1]=MvdCpL1[x0][y0][0][1]<<(MvShift+2)
(7-67)
MvdCpL0[x0][y0][1][0]=MvdCpL0[x0][y0][1][0]<<(MvShift+2)
(7-66)
MvdCpL1[x0][y0][1][1]=MvdCpL1[x0][y0][1][1]<<(MvShift+2)
(7-67)
MvdCpL0[x0][y0][2][0]=MvdCpL0[x0][y0][2][0]<<(MvShift+2)
(7-66)
MvdCpL1[x0][y0][2][1]=MvdCpL1[x0][y0][2][1]<<(MvShift+2)
(7-67)
可替代地,如果inter_affine_flag[x0][y0]等于1,则将变量MvShift设置为等于(affine_amvr_coarse_precisoin_flag?(affine_amvr_coarse_precisoin_flag<<1):(-(affine_amvr_flag<<1)))。
6.3运动矢量的取整过程
修改取整过程,使得当给定的rightShift值等于0(发生于1/16像素精度)时,将取整偏移设置为0而不是(1<<(rightShift-1))。
例如,将MV的取整过程的子条款修改如下:
该过程的输入是:
–运动矢量mvX,
–用于取整的右移参数rightShift,
–用于提高分辨率的左移参数leftShift。
该过程的输出是取整运动矢量mvX。
对于mvX的取整,适用以下内容:
offset=(rightShift==0)?0:(1<<(rightShift-1)) (8-371)
mvX[0]=(mvX[0]>=0?(mvX[0]+offset)>>rightShift:-((-mvX[0]+offset)>>rightShift))<<leftShift (8-372)
mvX[1]=(mvX[1]>=0?(mvX[1]+offset)>>rightShift:-((-mvX[1]+offset)>>rightShift))<<leftShift (8-373)
6.4解码过程
仿射运动矢量推导过程中调用的取整过程是用(MvShift+2)的输入执行的,而不是将输入固定为2。
亮度仿射控制点运动矢量预测器的推导过程
该过程的输入是:
–当前亮度编码块的左上样点相对于当前图片的左上亮度样点的亮度位置(xCb,yCb),
–两个变量cbWidth和cbHeight,指定当前亮度编码块的宽度和高度,
–当前编码单元refIdxLX的参考索引,X为0或1,
–控制点运动矢量的数量numCpMv。
该过程的输出是亮度仿射控制点运动矢量预测器mvpCpLX[cpIdx],X为0或1,并且cpIdx=0..numCpMv-1。
为了推导控制点运动矢量预测器候选列表cpMvpListLX,X为0或1,适用以下有序步骤:
将列表numCpMvpCandLX中的控制点运动矢量预测器候选的数目设置为等于0。
将变量availableFlagA和availableFlagB都设置为等于FALSE。
…
将设置为等于cpMvpLX[cpIdx]的mvX、设置为等于(MvShift+2)的rightShift、设置为等于(MvShift+2)的leftShift作为输入,并将取整的cpMvpLX[cpIdx](cpIdx=0..numCpMv-1)作为输出来调用第8.4.2.14节中指定的运动矢量取整过程。
…
将变量availableFlagA设置为TRUE。
将亮度编码块位置(xCb,yCb)、亮度编码块的宽度和高度(cbWidth,cbHeight)、临近亮度编码块位置(xNb,yNb)、临近亮度编码块的宽度和高度(nbW,nbH)以及控制点运动矢量的数量numCpMv作为输入,将控制点运动矢量预测器候选cpMvpLY[cpIdx](cpIdx=0..numCpMv-1)作为输出来调用第8.4.4.5节中指定的对来自临近块的亮度仿射控制点运动矢量的推导过程。
将设置为等于cpMvpLY[cpIdx]的mvX、设置为等于(MvShift+2)的rightShift、设置为等于(MvShift+2)的leftShift作为输入,并将取整的cpMvpLY[cpIdx](cpIdx=0..numCpMv-1)作为输出来调用第8.4.2.14节中指定的运动矢量取整过程。
…
将亮度编码块位置(xCb,yCb)、亮度编码块的宽度和高度(cbWidth,cbHeight)、临近块亮度编码块位置(xNb,yNb)、临近亮度编码块的宽度和高度(nbW,nbH)以及控制点运动矢量的数量numCpMv作为输入,将控制点运动矢量预测器候选cpMvpLX[cpIdx](cpIdx=0..numCpMv-1)作为输出来调用第8.4.4.5节中指定的对来自临近块的亮度仿射控制点运动矢量的推导过程。
将设置为等于cpMvpLX[cpIdx]的mvX、设置为等于(MvShift+2)的rightShift、设置为等于(MvShift+2)的leftShift作为输入,并将取整的cpMvpLX[cpIdx](cpIdx=0..numCpMv-1)作为输出来调用第8.4.2.14节中指定的运动矢量取整过程。
进行以下赋值:
cpMvpListLX[numCpMvpCandLX][0]=cpMvpLX[0] (8-618)
cpMvpListLX[numCpMvpCandLX][1]=cpMvpLX[1] (8-619)
cpMvpListLX[numCpMvpCandLX][2]=cpMvpLX[2] (8-620)
numCpMvpCandLX=numCpMvpCandLX+1 (8-621)
否则,如果PredFlagLY[xNbBk][yNbBk](Y=!X)等于1并且DiffPicOrderCnt(RefPicListY[RefIdxLY[xNbBk][yNbBk]],RefPicListX[refIdxLX])等于0,则适用以下内容:
将变量availableFlagB设置为TRUE。
将亮度编码块位置(xCb,yCb)、亮度编码块的宽度和高度(cbWidth,cbHeight)、临近块亮度编码块位置(xNb,yNb)、临近亮度编码块的宽度和高度(nbW,nbH)以及控制点运动矢量的数量numCpMv作为输入,并将控制点运动矢量预测器候选cpMvpLY[cpIdx](cpIdx=0..numCpMv-1)作为输出来调用第8.4.4.5节指定的对来自临近块的亮度仿射控制点运动矢量的推导过程。
将设置为等于cpMvpLY[cpIdx]的mvX、设置为等于(MvShift+2)的rightShift、设置为等于(MvShift+2)的leftShift作为输入,并将取整的cpMvpLY[cpIdx](cpIdx=0..numCpMv-1)作为输出来调用第8.4.2.14节中指定的运动矢量取整过程。
进行以下赋值:
cpMvpListLX[numCpMvpCandLX][0]=cpMvpLY[0] (8-622)
cpMvpListLX[numCpMvpCandLX][1]=cpMvpLY[1] (8-623)
cpMvpListLX[numCpMvpCandLX][2]=cpMvpLY[2] (8-624)
numCpMvpCandLX=numCpMvpCandLX+1 (8-625)
当numCpMvpCandLX小于2时,适用以下内容:
将亮度编码块位置(xCb,yCb)、亮度编码块宽度cbWidth、亮度编码块高度cbHeight以及当前编码单元refIdxLX的参考索引作为输入,并将可用性标志availableConsFlagLX、可用性标志availableFlagLX[cpIdx]和cpMvpLX[cpIdx](cpIdx=0..numCpMv-1)作为输出来调用第8.4.4.8节中指定的构造仿射控制点运动矢量预测候选的推导过程。
当availableConsFlagLX等于1,并且numCpMvpCandLX等于0时,进行以下赋值:
cpMvpListLX[numCpMvpCandLX][0]=cpMvpLX[0] (8-626)
cpMvpListLX[numCpMvpCandLX][1]=cpMvpLX[1] (8-627)
cpMvpListLX[numCpMvpCandLX][2]=cpMvpLX[2] (8-628)
numCpMvpCandLX=numCpMvpCandLX+1 (8-629)
以下适用于cpIdx=0..numCpMv-1:
当numCpMvpCandLX小于2并且availableFlagLX[cpIdx]等于1时,进行以下赋值:
cpMvpListLX[numCpMvpCandLX][0]=cpMvpLX[cpIdx] (8-630)
cpMvpListLX[numCpMvpCandLX][1]=cpMvpLX[cpIdx] (8-631)
cpMvpListLX[numCpMvpCandLX][2]=cpMvpLX[cpIdx] (8-632)
numCpMvpCandLX=numCpMvpCandLX+1 (8-633)
当numCpMvpCandLX小于2时,适用以下内容:
将亮度编码块位置(xCb,yCb)、亮度编码块宽度cbWidth、亮度编码块高度cbHeight以及refIdxLX作为输入,并且将可用性标志availableFlagLXCol和时域运动矢量预测器mvLXCol作为输出来进行第8.4.2.11节中指定的时域亮度运动矢量预测的推导过程。
当availableFlagLXCol等于1时,适用以下内容:
将设置为等于mvLXCol的mvX、设置为等于(MvShift+2)的rightShift、设置为等于(MvShift+2)的leftShift作为输入,并将取整的mvLXCol作为输出来调用第8.4.2.14节中指定的运动矢量取整过程。
进行以下赋值:
cpMvpListLX[numCpMvpCandLX][0]=mvLXCol(8-634)
cpMvpListLX[numCpMvpCandLX][1]=mvLXCol(8-635)
cpMvpListLX[numCpMvpCandLX][2]=mvLXCol(8-636)
numCpMvpCandLX=numCpMvpCandLX+1 (8-637)
当numCpMvpCandLX小于2时,重复以下内容,直到numCpMvpCandLX等于2,其中mvZero[0]和mvZero[1]都等于0:
cpMvpListLX[numCpMvpCandLX][0]=mvZero (8-638)
cpMvpListLX[numCpMvpCandLX][1]=mvZero (8-639)
cpMvpListLX[numCpMvpCandLX][2]=mvZero (8-640)
numCpMvpCandLX=numCpMvpCandLX+1 (8-641)
将仿射控制点运动矢量预测器cpMvpLX(X为0或1)推导如下:
cpMvpLX=cpMvpListLX[mvp_lX_flag[xCb][yCb]] (8-642)
构造的仿射控制点运动矢量预测候选的推导过程
该过程的输入是:
–亮度位置(xCb,yCb),指定相对于当前图片的左上亮度样点的当前亮度编码块的左上样点,
–两个变量cbWidth和cbHeight,指定当前亮度编码块的宽度和高度,
–当前预测单元分割refIdxLX的参考索引,X为0或1,
该过程的输出是:
–构造的仿射控制点运动矢量预测候选的可用性标志availableConsFlagLX,X为0或1
–可用性标志availableFlagLX[cpIdx],cpIdx=0..2并且X为0或1,
–构造的仿射控制点运动矢量预测候选cpMvLX[cpIdx],cpIdx=0..numCpMv-1且X为0或1。
在以下有序步骤中推导第一(左上)控制点运动矢量cpMvLX[0]和可用性标志availableFlagLX[0]:
将样点位置(xNbB2,yNbB2)、(xNbB3,yNbB3)和(xNbA2,yNbA2)分别设置为等于(xCb-1,yCb-1)、(xCb,yCb-1)和(xCb-1,yCb)。
将可用性标志availableFlagLX[0]设置为等于0,并且将cpMvLX[0]的两个分量都设置为等于0。
对于(xNbTL,yNbTL)(TL由B2、B3和A2替代),适用以下内容:
将亮度编码块位置(xCb,yCb)、亮度编码块宽度cbWidth、亮度编码块高度cbHeight、设置为等于(xNbTL,yNbTL)的亮度位置(xNbY,yNbY)作为输入,并将输出赋值给编码块可用性标志availableTL来调用节中指定的编码块的可用性推导过程。
当availableTL等于TRUE并且availableFlagLX[0]等于0时,适用以下内容:
如果PredFlagLX[xNbTL][yNbTL]等于1,并且DiffPicOrderCnt(RefPicListX[RefIdxLX[xNbTL][yNbTL]],RefPicListX[refIdxLX])等于0,并且应于RefIdxLTL[xNbTL][yNbTL]的参考图片不是当前图片,则将availableFlagLX[0]设置为等于1并进行以下赋值:
cpMvLX[0]=MvLX[xNbTL][yNbTL](8-643)
否则,当PredFlagLY[xNbTL][yNbTL](Y=!X)等于1并且DiffPicOrderCnt(RefPicListY[RefIdxLY[xNbTL][yNbTL]]时,RefPicListX[refIdxLX])等于0,并且对应到RefIdxLY[xNbTL][yNbTL]的参考图片不是当前图片,则将availableFlagLX[0]设置为等于1并进行以下赋值:
cpMvLX[0]=MvLY[xNbTL][yNbTL](8-644)
当availableFlagLX[0]等于1时,将设置为等于cpMvLX[0]的mvX、设置为等于(MvShift+2)的rightShift、设置为等于(MvShift+2)的leftShift作为输入,将取整的cpMvLX[0]作为输出来调用第8.4.2.14节中指定的运动矢量取整过程。
在以下有序步骤中推导第二(右上)控制点运动矢量cpMvLX[1]和可用性标志availableFlagLX[1]:
将样点位置(xNbB1,yNbB1)和(xNbB0,yNbB0)分别设置等于为(xCb+cbWidth-1,yCb-1)和(xCb+cbWidth,yCb-1)。
将可用性标志availableFlagLX[1]设置为等于0,并且将cpMvLX[1]的两个分量都设置为等于0。
对于(xNbTR,yNbTR)(TR由B1和B0替代),适用以下内容:
将亮度编码块位置(xCb,yCb)、亮度编码块宽度cbWidth、亮度编码块高度cbHeight、设置为等于(xNbTR,yNbTR)的亮度位置(xNbY,yNbY)作为输入,并将输出赋值给编码块可用性标志availableTR来调用第6.4.X节中指定的编码块的可用性推导过程。
当availableTR等于TRUE并且availableFlagLX[1]等于0时,适用以下内容:
如果PredFlagLX[xNbTR][yNbTR]等于1,并且DiffPicOrderCnt(RefPicListX[RefIdxLX[xNbTR][yNbTR]],RefPicListX[refIdxLX])等于0,并且对应于RefIdxLX[xNbTR][yNbTR]的参考图片不是当前图片,则将availableFlagLX[1]设置为等于1并进行以下赋值:
cpMvLX[1]=MvLX[xNbTR][yNbTR] (8-645)
否则,当PredFlagLY[xNbTR][yNbTR](Y=!X)等于1并且DiffPicOrderCnt(RefPicListY[RefIdxLY[xNbTR][yNbTR]],RefPicListX[refIdxLX])等于0,并且对应于RefIdxLY[xNbTR][yNbTR]的参考图片不是当前图片时,将availableFlagLX[1]设置为等于1并进行以下赋值:
cpMvLX[1]=MvLY[xNbTR][yNbTR] (8-646)
当availableFlagLX[1]等于1时,将置为等于cpMvLX[1]的mvX、设置为等于(MvShift+2)的rightShift、设置为等于(MvShift+2)的leftShift作为输入,并将取整的cpMvLX[1]作为输出来调用第8.4.2.14节中指定的运动矢量取整过程。
在以下有序步骤中推导第三(左下)控制点运动矢量cpMvLX[2]和可用性标志availableFlagLX[2]:
将样点位置(xNbA1,yNbA1)和(xNbA0,yNbA0)分别设置为等于(xCb-1,yCb+cbHeight-1)和(xCb-1,yCb+cbHeight)。
将可用性标志availableFlagLX[2]设置为等于0,并且将cpMvLX[2]的两个分量都设置为等于0。
对于(xNbBL,yNbBL)(BL由A1和A0替代),适用以下内容:
将亮度编码块位置(xCb,yCb)、亮度编码块宽度cbWidth、亮度编码块高度cbHeight、设置等于(xNbBL,yNbBL)的亮度位置(xNbY,yNbY)作为输入,并将输出赋值给编码块可用性标志availableBL来调用的第6.4.X节中指定的编码块的可用性推导过程。
当availableBL等于TRUE并且availableFlagLX[2]等于0时,适用以下条件:
如果PredFlagLX[xNbBL][yNbBL]等于1,并且DiffPicOrderCnt(RefPicListX[RefIdxLX[xNbBL][yNbBL]],RefPicListX[refIdxLX])等于0,并且对应于RefIdxLY[xNbBL]的参考图片不是当前图片,则将availableFlagLX[2]设置为等于1并进行以下赋值:
cpMvLX[2]=MvLX[xNbBL][yNbBL] (8-647)
否则,当PredFlagLY[xNbBL][yNbBL](Y=!X)等于1并且DiffPicOrderCnt(RefPicListY[RefIdxLY[xNbBL][yNbBL]]RefPicListX[refIdxLX])等于0,并且对应于RefIdxLY[xNbBL][yNbBL]的参考图片不是当前图片时,将availableFlagLX[2]设置为等于1并进行以下赋值:
cpMvLX[2]=MvLY[xNbBL][yNbBL] (8-648)
当availableFlagLX[2]等于1时,将设置为等于cpMvLX[2]的mvX、设置为等于(MvShift+2)的rightShift、设置为等于(MvShift+2)的leftShift作为输入,并将取整的cpMvLX[2]作为输出来调用第8.4.2.14中指定的运动矢量取整过程。
6.5上下文建模
用上下文编码二进制位将ctxInc赋值给语法元素:
使用左侧和上方语法元素的ctxInc规范
在一个示例中,上下文增加偏移ctxInc=(condL&&availableL)+(condA&&availableA)+ctxSetIdx*3。
可替代地,ctxInc=((condL&&availableL)||(condA&&availableA))+ctxSetIdx*3。
ctxInc=(condL&&availableL)+M*(condA&&availableA)+ctxSetIdx*3(例如M=2)
ctxInc=M*(condL&&availableL)+(condA&&availableA)+ctxSetIdx*3。(例如,M=2)。
用于mvr_flag的ctxIdx的initValue值:
当当前块为仿射或非仿射时,使用不同的上下文。
用于amvr_coarse_precisoin_flag的ctxIdx的initValue值:
当当前块为仿射或非仿射时,使用不同的上下文。
可以在下面描述的方法(例如方法2500)的上下文中并入上述示例,该方法可以在视频解码器或视频编码器处实现。
图25示出了用于视频解码的示例性方法的流程图。方法2500包括,在步骤2510,为当前视频块的仿射编码,做出使用(a)多个运动矢量差(MVD)精度或(b)自适应运动矢量差分辨率(AMVR)的确定,以及,在步骤2520,基于确定,执行当前视频块和当前视频块的比特流表示之间的转换。
方法2500包括,在步骤2520处,基于最终运动矢量执行比特流表示与当前块之间的转换,所述当前块使用支持自适应运动矢量分辨率(AMVR)过程的仿射帧间模式或正常帧间模式编码。在一些实施例中,该转换从比特流表示生成当前块(例如,可以在视频解码器中实现)。在其他实施例中,该转换从当前块生成比特流表示(例如,可以在视频编码器中实现)。
在一些实施例中,并且在示例1的上下文中,最终运动矢量的精度与当前块的存储的运动矢量的精度相同。在一个示例中,最终运动矢量的精度为1/16像素。在另一个示例中,最终运动矢量的精度为1/8像素。
在一些实施例中,并且在示例2的上下文中,方法2500还包括:在确定MVD的精度为分数(例如,大于1像素的精度)时,旁路MVP的缩放操作的步骤。在其他实施例中,方法2500还包括:在确定MVD的精度小于或等于1像素时缩放MVP的步骤。
在一些实施例中,并且在示例5的上下文中,使用仿射帧间模式对当前块进行编码,并且用信令通知的语法元素指示运动矢量的精度或运动矢量差的精度。在一个示例中,用信令通知的语法元素的值为0、1或2分别对应于运动矢量的精度为1/4像素、1/16像素和1像素。在另一个示例中,用信令通知的语法元素的值为0、1或2分别对应于运动矢量的精度为1/4像素、1像素和1/16像素。在又一示例中,用信令通知的语法元素的值为0、1或2分别对应于运动矢量的精度为1/16像素、1/4像素和1像素。
在一些实施例中,并且在示例6的上下文中,基于序列参数集(SPS)、图片参数集(PPS)、视频参数集(VPS)、条带标头、片标头、编码树单元(CTU)组、编码单元(CU)、预测单元(PU)或变换单元(TU)中的信令来启用AMVR过程。
在一些实施例中,并且在示例7的上下文中,在序列参数集(SPS)、图片参数集(PPS)、视频参数集(VPS)、条带标头、片标头、编码树单元(CTU)组、编码单元(CU)、预测单元(PU)或变换单元(TU)中用信令通知运动矢量差的精度或运动矢量的精度的允许值的集合。在一个示例中,针对当前块的每个编码树单元(CTU)用信令通知允许值的集合。在另一示例中,允许值的集合基于当前块的编解码模式或尺寸。在又一示例中,该组允许值基于条带类型、时域层索引或低延迟检查标志。在又一示例中,允许值的集合基于存储在解码图片缓冲器中的运动矢量的精度。
在上述实施例的一些实现中,MVP可以基于当前块的在空域或时域上临近的块。在上述实施例的其他实现中,MVP可以是默认的MVP。
6.公开技术的示例实现
图26是视频处理装置2600的框图。装置2600可用于实现这里描述的一个或多个方法。装置2600可以体现在智能手机、平板电脑、计算机、物联网(IoT)接收器等中。装置2600可以包括一个或多个处理器2602、一个或多个存储器3704和视频处理硬件2606。处理器2602可以被配置为实现在本文中描述的一种或多种方法(包括但不限于方法2800)。尽管一些实施例可以在没有存储器的情况下操作,但是可以将(一个或多个)存储器2604用于存储用于实现这里描述的方法和技术的数据和代码。视频处理硬件2606可用于在硬件电路中实现本文档中描述的一些技术。
在一些实施例中,视频编码方法可以使用如关于图26所描述的在硬件平台上实现的装置来实现。
可以使用以下基于条款的格式来描述各种技术和实施例。
1.一种用于视频编码的方法,包括:
为当前视频块的仿射编码,做出使用(a)多个运动矢量差(MVD)精度或(b)自适应运动矢量差分辨率(AMVR)的确定,以及
基于确定,执行当前视频块和当前视频块的比特流表示之间的转换。
2.根据条款1的方法,其中,基于比特流表示中的一个或多个语法元素来做出确定。
3.根据条款2的方法,其中,基于对当前视频块启用仿射编码,将一个或多个语法元素选择性地包括在比特流表示中。
4.根据条款1-3中任一项的方法,其中,用于仿射帧间模式的MVD精度不同于用于正常帧间模式编码的MVD精度。
5.根据条款2-4中任一项的方法,其中,使用基于上下文的编码来对一个或多个语法元素进行编码。
6.根据条款5的方法,其中,将不同的上下文模型用于当前视频块的仿射帧间编码和正常帧间模式编码。
7.根据条款1的方法,其中,基于第一语法元素做出确定,第一语法元素包括在比特流表示中以指示AMVR对仿射编码的当前视频块的适用性。
8.根据条款1的方法,其中,确定是在当前视频块的转换期间禁用AMVR,或者其中,确定是比特流表示中不存在第一语法元素,并且其中,转换使用默认运动矢量或默认运动矢量差精度。
9.根据条款8的方法,其中,默认精度是第1/4像素。
10.根据条款7的方法,其中,基于指示运动矢量差分的精度的第二语法元素做出确定。
11.根据条款7的方法,其中,在当前视频块的控制点运动矢量为零的情况下,从比特流表示中排除第一语法元素。
12.根据条款1至11中任一项的方法,其中,在转换期间使用帧内块复制的情况下,AMVR包括第一AMVR方案,并且在转换期间不使用帧内块复制模式的情况下,AMVR包括不同的第二AMVR方案。
13.根据条款2至12中任一项的方法,其中,在条带级别或图片级别或序列级别包括语法元素。
14.根据条款1至13中任一项的方法,其中,转换包括从比特流表示生成当前视频块的像素值,或者从当前视频块生成比特流表示。
15.一种视频系统中的装置,包括处理器和其上具有指令的非暂时性存储器,其中,指令在由处理器执行时使处理器实现条款1至14中任一项的方法。
16.一种存储在非暂时性计算机可读介质上的计算机程序产品,计算机程序产品包括用于执行条款1至14中任一项的方法的程序代码。
图27示出了对称模式的示例。
图28是示出其中可实现本文中所公开的各种技术的示例视频处理系统2800的框图。各种实施方式可以包括系统2800的一些或全部组件。系统2800可以包括用于接收视频内容的输入2802。视频内容可以以原始或未压缩的格式(例如8或10位多分量像素值)接收,或者可以以压缩或编码的格式接收。输入2802可以代表网络接口、外围总线接口或存储接口。网络接口的示例包括有线接口(诸如以太网、无源光网络(PON)等)和无线接口(诸如Wi-Fi或蜂窝接口)。
系统2800可以包括可以实现本文中描述的各种编码或编码方法的编码组件2804。编码组件2804可以减少从编码组件2804的输入2802到输出的视频的平均比特率,以产生视频的编码表示。因此,编码技术有时称为视频压缩或视频转码技术。如组件2806所表示的,编码组件2804的输出可以被存储或经由所连接的通信来发送。在输入2802处接收的视频的存储或传送的比特流(或编码)表示可以被组件2808使用,以生成被发送到显示接口2810的像素值或可显示视频。从比特流表示中生成用户可见视频的过程有时称为视频解压缩。此外,尽管某些视频处理操作被称为“编码”操作或工具,但是应当理解,在编码器处使用编码工具或操作,并且将由编码器执行反向编码结果的相应解码工具或操作。
外围总线接口或显示接口的示例可以包括通用串行总线(USB)或高清多媒体接口(HDMI)或Displayport等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文中描述的技术可以体现在各种电子设备中,诸如移动电话、膝上型计算机、智能电话或其他能够执行数字数据处理和/或视频显示的设备。
图29示出了用于视觉媒体处理的示例方法的流程图。该流程图的步骤示出了在本文档的第4部分中的示例2k中讨论的示例实施例的实现。在步骤2910,该过程对于当前视频块和所述当前视频块的比特流表示之间的转换,做出使用一个或多个精度来表示运动信息的确定,所述运动信息包括在使用自适应运动矢量分辨率(AMVR)的仿射帧间模式或正常帧间模式中的转换期间使用的运动矢量和/或运动矢量预测器和/或运动矢量差。在步骤2920,该过程基于对所述一个或多个精度的确定来执行所述转换,其中,在所述比特流表示中使用多个语法元素来用信令通知所述一个或多个精度。
图30示出了用于视觉媒体处理的示例方法的流程图。该流程图的步骤示出了在本文档的第4部分中的示例2kii1中讨论的示例实施例的实现。在步骤3010,该过程对于当前视频块和所述当前视频块的比特流表示之间的转换,做出使用一个或多个精度来表示运动信息的确定,所述运动信息包括在使用自适应运动矢量分辨率(AMVR)的帧内块复制(IBC)模式中的转换期间使用的运动矢量和/或运动矢量预测器和/或运动矢量差。在步骤3020,该过程基于对所述一个或多个精度的确定来执行所述转换,其中,在所述比特流表示中使用多个语法元素来用信令通知所述一个或多个精度,其中,基于在IBC模式中从所述当前视频块的图片推导的块矢量来执行所述转换。
现在以基于条款的格式呈现一些实施例。
1.一种视觉媒体处理的方法,包括:
对于当前视频块和当前视频块的比特流表示之间的转换,做出使用一个或多个精度来表示运动信息的确定,运动信息包括在使用自适应运动矢量分辨率(AMVR)的仿射帧间模式或正常帧间模式中的转换期间使用的运动矢量和/或运动矢量预测器和/或运动矢量差;以及
基于对一个或多个精度的确定来执行转换,其中,在比特流表示中使用多个语法元素来用信令通知一个或多个精度。
2.根据条款1的方法,还包括:
在比特流表示中选择性地用信令通知对应于多个精度的多个语法元素。
3.根据条款1-2中任一项或多项的方法,其中,多个语法元素包括至少第一语法元素,以指示是否应用默认运动精度。
4.根据条款1-3中任一项或多项的方法,其中,第一语法元素是amvr标志或运动信息精度标志。
5.根据条款1-4中任一项或多项的方法,其中,用于仿射帧间模式的至少运动信息精度不同于用于正常帧间模式的运动信息精度。
6.根据条款1-5中任一项或多项的方法,其中,多个语法元素中的至少一个使用基于上下文的编码进行编码,基于上下文的编码包括对至少一个上下文模型的使用。
7.根据条款6的方法,其中,用于仿射帧间编解码模式的上下文模型不同于用于正常帧间模式的上下文模型。
8.根据条款1-2中任一项或多项的方法,其中,确定是基于包括在比特流表示中以指示AMVR对当前视频块的适用性的第一语法元素做出的。
9.根据条款1-2中任一项或多项的方法,其中,:在确定比特流表示中不存在第一语法元素时,确定在当前视频块的转换期间禁用AMVR,并且其中,转换使用默认运动信息或默认运动信息精度。
10.根据条款1-2中任一项或多项的方法,其中,在确定比特流表示中不存在第一语法元素时,确定禁止使用多个精度来表示运动信息。
11.根据条款8的方法,其中,在当前视频块的所有控制点的运动矢量差(MVD)都为零的情况下,从比特流表示中排除第一语法元素。
12.根据条款8的方法,其中,在当前视频块的一个选定控制点的运动矢量差(MVD)为零的情况下,从比特流表示中排除第一语法元素。
13.根据条款8的方法,其中在对仿射帧间模式禁用AMVR的情况下,从比特流表示中排除第一语法元素。
14.根据条款11至13中任一项或多项的方法,其中,将仿射帧间模式用于当前视频块。
15.根据条款8的方法,其中,在对正常帧间模式禁用AMVR并且将正常帧间模式用于当前视频块的情况下,从比特流表示中排除第一语法元素。
16.根据条款8的方法,其中,默认运动信息精度是1/4亮度样点或1亮度样点或1/16亮度样点。
17.根据条款8的方法,其中,将默认运动信息精度设置为在运动补偿步骤期间使用的值。
18.根据条款1-2中任一项或多项的方法,其中,在确定比特流表示中不存在第一语法元素时,确定在当前视频块的转换期间启用AMVR。
19.一种视觉媒体处理的方法,包括:
对于当前视频块和当前视频块的比特流表示之间的转换,做出使用一个或多个精度来表示运动信息的确定,运动信息包括在使用自适应运动矢量分辨率(AMVR)的帧内块复制(IBC)模式中的转换期间使用的运动矢量和/或运动矢量预测器和/或运动矢量差;以及
基于对一个或多个精度的确定来执行转换,其中,在比特流表示中使用多个语法元素来用信令通知一个或多个精度;
其中,基于在IBC模式中从当前视频块的图片推导的块矢量来执行转换。
20.如条款19的方法,其中,确定是基于包括在比特流表示中以指示AMVR对当前视频块的适用性的第一语法元素做出的。
21.根据条款8或20中任一项或多项的方法,其中,确定基于指示用于表示运动信息的一个或多个精度的第二语法元素来进行。
22.根据条款21的方法,其中,当第二语法元素等于零时,运动信息精度取整数值,否则其中运动信息精度为4亮度样点。
23.根据条款21的方法,其中,当第二语法元素等于零时,运动信息精度为4亮度样点,否则其中运动信息精度取整数值。
24.根据条款21的方法,其中,第二语法元素的信令基于第一语法元素的值或者比特流表示中是否缺失第一语法元素。
25.根据条款21的方法,其中,当第二语法元素等于零时,运动信息精度取整数值,否则其中运动信息精度为1/16亮度样点。
26.根据条款21的方法,其中,当第二语法元素等于零时,运动信息精度为1/16亮度样点,否则其中运动信息精度取整数值。
27.根据条款6的方法,其中,将相同的上下文模型用于仿射帧间模式和正常帧间模式。
28.根据条款7或27中任一项或多项的方法,其中,将相同的语法元素用于仿射帧间编解码模式和正常帧间模式。
29.根据条款1至28中任一项或多项的方法,其中,在转换期间使用帧内块复制模式的情况下,AMVR包括第一AMVR方案,并且在转换期间不使用帧内块复制模式的情况下,AMVR包括不同的第二AMVR方案。
30.根据条款1至29中任一项或多项的方法,其中,在条带级别或图片级别或序列级别包括多个语法元素。
31.根据条款1至30中的任一项或多项的方法,其中,转换包括从比特流表示生成当前视频块的像素值,或者从当前视频块生成比特流表示。
32.一种视频系统中的装置,包括处理器和其上具有指令的非暂时性存储器,其中,指令在由处理器执行时使处理器实现根据条款1至31中任一项的方法。
33.一种存储在非暂时性计算机可读介质上的计算机程序产品,计算机程序产品包括用于执行根据条款1至31中任一项的方法的程序代码。
34.一种视频编码器装置,包括处理器,处理器配置为实现条款1-31中的任一项或多项的方法。
35.一种视频解码器装置,包括处理器,处理器配置为实现条款1-31中的任一项或多项的方法。
从前述内容可以理解,本文已经出于说明的目的描述了当前所公开的技术的具体实施例,但是在不脱离本发明的范围的情况下可以做出各种修改。因此,除了所附权利要求之外,当前所公开的技术不受限制。
本专利文档中描述的主题的实现方式和功能性操作可以在各种系统、数字电子电路中实施,或者在计算机软件、固件或硬件中实施,包括本说明书中公开的结构及其结构等同物,或者以他们的一个或多个的组合实施。本说明书中描述的主题的视线方式可以被实施为一个或多个计算机程序产品,即,在计算机可读介质上编码的一个或多个暂时性和非暂时性计算机程序指令模块,用于由数据处理装置运行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读传播信号的物质的合成、或者它们中的一个或多个的组合。术语“数据处理单元”和“数据处理装置”包括用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机或者多个处理器或计算机。除了硬件之外,装置可以包括为所讨论的计算机程序创建运行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统及其一个或多个的组合的代码。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言(包括编译语言或解释语言)编写,并且可以以任何形式部署,包括作为独立程序或作为模块、组件、子程序或其他适合在计算环境中使用的单元。计算机程序不一定与文件系统中的文件相对应。程序可以存储在保存其他程序或数据的文件的部分中(例如,存储在标记语言文档中的一个或多个脚本)、专用于所讨论的程序的单一文件中、或多个协调文件(例如,存储一个或多个模块、子程序或部分代码的文件)中。计算机程序可以部署在一台或多台计算机上来执行,这些计算机位于一个站点或分布在多个站点并通过通信网络互连。
本说明书中描述的处理和逻辑流可以由一个或多个可编程处理器执行,该一个或多个处理器运行一个或多个计算机程序,通过对输入数据进行操作并生成输出来执行功能。处理和逻辑流也可以由专用逻辑电路来执行,并且装置也可以实施为专用逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
例如,适用于运行计算机程序的处理器包括通用和专用微处理器、以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是执行指令的处理器和存储指令和数据的一个或多个存储设备。通常,计算机还将包括一个或多个用于存储数据的大容量存储设备,例如,磁盘、磁光盘或光盘,或可操作地耦合到一个或多个大容量存储设备,以从其接收数据或向其传送数据,或两者兼有。然而,计算机不一定需要具有这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备。处理器和存储器可以由专用逻辑电路来补充,或合并到专用逻辑电路中。
旨在将说明书与附图一起仅视为示例性的,其中示例性意味着示例。如这里所使用的,除非上下文另有明确说明,否则“或”的使用旨在包括“和/或”。
虽然本专利文档包含许多细节,但不应将其解释为对任何发明或要求保护的范围的限制,而应解释为特定于特定发明的特定实施例的特征的描述。本专利文档在分离的实施例的上下文描述的某些特征也可以在单个实施例中组合实施。相反,在单个实施例的上下文中描述的各种功能也可以在多个实施例中单独地实施,或在任何合适的子组合中实施。此外,虽然特征可以被描述为在某些组合中起作用,甚至最初这样要求保护,但在某些情况下,可以从要求保护的组合中删除组合中的一个或多个特征,并且要求保护的组合可以指向子组合或子组合的变体。
同样,尽管在附图中以特定顺序描述了操作,但这不应理解为要获得期望的结果必须按照所示的特定顺序或次序顺序来执行这些操作,或执行所有示出的操作。此外,本专利文档所述实施例中的各种系统组件的分离不应理解为在所有实施例中都需要这样的分离。
仅描述了一些实施方式和示例,其他实施方式、增强和变体可以基于本专利文档中描述和说明的内容做出。
Claims (35)
1.一种视觉媒体处理的方法,包括:
对于当前视频块和所述当前视频块的比特流表示之间的转换,做出使用一个或多个精度来表示运动信息的确定,所述运动信息包括在使用自适应运动矢量分辨率(AMVR)的仿射帧间模式或正常帧间模式中的转换期间使用的运动矢量和/或运动矢量预测器和/或运动矢量差;以及
基于对所述一个或多个精度的所述确定来执行所述转换,其中,在所述比特流表示中使用多个语法元素来用信令通知所述一个或多个精度。
2.根据权利要求1所述的方法,还包括:
在所述比特流表示中选择性地用信令通知对应于所述多个精度的所述多个语法元素。
3.根据权利要求1-2中任一项或多项所述的方法,其中,所述多个语法元素包括至少第一语法元素,以指示是否应用默认运动精度。
4.根据权利要求1-3中任一项或多项所述的方法,其中,所述第一语法元素是amvr标志或运动信息精度标志。
5.根据权利要求1-4中任一项或多项所述的方法,其中,用于所述仿射帧间模式的至少运动信息精度不同于用于所述正常帧间模式的运动信息精度。
6.根据权利要求1-5中任一项或多项所述的方法,其中,所述多个语法元素中的至少一个使用基于上下文的编码进行编码,所述基于上下文的编码包括对至少一个上下文模型的使用。
7.根据权利要求6所述的方法,其中,用于所述仿射帧间编解码模式的上下文模型不同于用于所述正常帧间模式的上下文模型。
8.根据权利要求1-2中任一项或多项所述的方法,其中,所述确定是基于包括在所述比特流表示中以指示AMVR对所述当前视频块的适用性的第一语法元素做出的。
9.根据权利要求1-2中任一项或多项所述的方法,其中,在确定所述比特流表示中不存在第一语法元素时,所述确定在所述当前视频块的转换期间禁用AMVR,并且其中,所述转换使用默认运动信息或默认运动信息精度。
10.根据权利要求1-2中任一项或多项所述的方法,其中,在确定所述比特流表示中不存在第一语法元素时,所述确定禁止使用所述多个精度来表示所述运动信息。
11.根据权利要求8所述的方法,其中,在所述当前视频块的所有控制点的运动矢量差(MVD)都为零的情况下,从所述比特流表示中排除所述第一语法元素。
12.根据权利要求8所述的方法,其中,在所述当前视频块的一个选定控制点的运动矢量差(MVD)为零的情况下,从所述比特流表示中排除所述第一语法元素。
13.根据权利要求8所述的方法,其中在对所述仿射帧间模式禁用AMVR的情况下,从所述比特流表示中排除所述第一语法元素。
14.根据权利要求11至13中任一项或多项所述的方法,其中,将所述仿射帧间模式用于所述当前视频块。
15.根据权利要求8所述的方法,其中,在对所述正常帧间模式禁用AMVR并且将所述正常帧间模式用于所述当前视频块的情况下,从所述比特流表示中排除所述第一语法元素。
16.根据权利要求8所述的方法,其中,所述默认运动信息精度是1/4亮度样点或1亮度样点或1/16亮度样点。
17.根据权利要求8所述的方法,其中,将所述默认运动信息精度设置为在运动补偿步骤期间使用的值。
18.根据权利要求1-2中任一项或多项所述的方法,其中,在确定所述比特流表示中不存在第一语法元素时,所述确定在所述当前视频块的转换期间启用AMVR。
19.一种视觉媒体处理的方法,包括:
对于当前视频块和所述当前视频块的比特流表示之间的转换,做出使用一个或多个精度来表示运动信息的确定,所述运动信息包括在使用自适应运动矢量分辨率(AMVR)的帧内块复制(IBC)模式中的转换期间使用的运动矢量和/或运动矢量预测器和/或运动矢量差;以及
基于对所述一个或多个精度的所述确定来执行所述转换,其中,在所述比特流表示中使用多个语法元素来用信令通知所述一个或多个精度;
其中,基于在IBC模式中从所述当前视频块的图片推导出的块矢量来执行所述转换。
20.如权利要求19所述的方法,其中,所述确定是基于包括在所述比特流表示中以指示AMVR对所述当前视频块的适用性的第一语法元素做出的。
21.根据权利要求8或20中任一项或多项所述的方法,其中,所述确定是基于指示用于表示所述运动信息的所述一个或多个精度的第二语法元素做出的。
22.根据权利要求21所述的方法,其中,当所述第二语法元素等于零时,所述运动信息精度取整数值,否则其中所述运动信息精度为4亮度样点。
23.根据权利要求21所述的方法,其中,当所述第二语法元素等于零时,所述运动信息精度为4亮度样点,否则其中所述运动信息精度取整数值。
24.根据权利要求21所述的方法,其中,所述第二语法元素的信令基于所述第一语法元素的值或者所述比特流表示中是否缺失所述第一语法元素。
25.根据权利要求21所述的方法,其中,当所述第二语法元素等于零时,所述运动信息精度取整数值,否则其中所述运动信息精度为1/16亮度样点。
26.根据权利要求21所述的方法,其中,当所述第二语法元素等于零时,所述运动信息精度为1/16亮度样点,否则其中所述运动信息精度取整数值。
27.根据权利要求6所述的方法,其中,将相同的上下文模型用于所述仿射帧间模式和所述正常帧间模式。
28.根据权利要求7或27中任一项或多项所述的方法,其中,将相同的语法元素用于所述仿射帧间编解码模式和所述正常帧间模式。
29.根据权利要求1至28中任一项或多项所述的方法,其中,在所述转换期间使用帧内块复制模式的情况下,AMVR包括第一AMVR方案,并且在所述转换期间不使用所述帧内块复制模式的情况下,AMVR包括不同的第二AMVR方案。
30.根据权利要求1至29中任一项或多项所述的方法,其中,在条带级别或图片级别或序列级别包括所述多个语法元素。
31.根据权利要求1至30中的任一项或多项所述的方法,其中,所述转换包括从所述比特流表示生成所述当前视频块的像素值,或者从所述当前视频块生成所述比特流表示。
32.一种视频系统中的装置,包括处理器和其上具有指令的非暂时性存储器,其中,所述指令在由所述处理器执行时使所述处理器实现根据权利要求1至31中任一项所述的方法。
33.一种存储在非暂时性计算机可读介质上的计算机程序产品,所述计算机程序产品包括用于执行根据权利要求1至31中任一项所述的方法的程序代码。
34.一种视频编码器装置,包括处理器,所述处理器配置为实现权利要求1-31中的任一项或多项所述的方法。
35.一种视频解码器装置,包括处理器,所述处理器配置为实现权利要求1-31中的任一项或多项所述的方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNPCT/CN2019/074433 | 2019-02-01 | ||
CN2019074433 | 2019-02-01 | ||
PCT/CN2020/074135 WO2020156525A1 (en) | 2019-02-01 | 2020-02-01 | Multiple syntax elements for adaptive motion vector resolution |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113424534A true CN113424534A (zh) | 2021-09-21 |
Family
ID=71840384
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080013267.8A Pending CN113424534A (zh) | 2019-02-01 | 2020-02-01 | 自适应运动矢量分辨率的多个语法元素 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113424534A (zh) |
WO (1) | WO2020156525A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023193721A1 (en) * | 2022-04-05 | 2023-10-12 | Beijing Bytedance Network Technology Co., Ltd. | Method, apparatus, and medium for video processing |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022228430A1 (en) * | 2021-04-27 | 2022-11-03 | Beijing Bytedance Network Technology Co., Ltd. | Method, device, and medium for video processing |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012060208A (ja) * | 2010-09-06 | 2012-03-22 | Nippon Telegr & Teleph Corp <Ntt> | 動画像符号化方法,動画像符号化装置,動画像復号方法,動画像復号装置およびそれらのプログラム |
CN102291581B (zh) * | 2011-09-09 | 2013-09-25 | 西安电子科技大学 | 支持帧场自适应运动估计的实现方法 |
US9319684B2 (en) * | 2012-08-21 | 2016-04-19 | Qualcomm Incorporated | Alternative transform in scalable video coding |
WO2015069734A1 (en) * | 2013-11-05 | 2015-05-14 | Arris Enterprises, Inc. | Bit depth variable for high precision data in weighted prediction syntax and semantics |
US10531116B2 (en) * | 2014-01-09 | 2020-01-07 | Qualcomm Incorporated | Adaptive motion vector resolution signaling for video coding |
US9918105B2 (en) * | 2014-10-07 | 2018-03-13 | Qualcomm Incorporated | Intra BC and inter unification |
CN108235007B (zh) * | 2016-12-12 | 2023-06-27 | 上海天荷电子信息有限公司 | 各模式使用不同精度同种编码参数的数据压缩方法和装置 |
-
2020
- 2020-02-01 CN CN202080013267.8A patent/CN113424534A/zh active Pending
- 2020-02-01 WO PCT/CN2020/074135 patent/WO2020156525A1/en active Application Filing
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023193721A1 (en) * | 2022-04-05 | 2023-10-12 | Beijing Bytedance Network Technology Co., Ltd. | Method, apparatus, and medium for video processing |
Also Published As
Publication number | Publication date |
---|---|
WO2020156525A1 (en) | 2020-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110933421B (zh) | 具有自适应运动矢量分辨率的仿射模式的语法重用 | |
CN110944195B (zh) | 具有自适应运动矢量分辨率的运动矢量的修改 | |
JP7235877B2 (ja) | アフィンモード適応型動きベクトル解像度を符号化するためのコンテキスト | |
CN110891174B (zh) | 不同视频块尺寸的仿射模式计算 | |
US12108072B2 (en) | Fast algorithms for symmetric motion vector difference coding mode | |
CN111010570B (zh) | 基于仿射运动信息的尺寸限制 | |
CN113661709B (zh) | 仿射高级运动矢量预测中的运动信息精度对齐 | |
CN113424534A (zh) | 自适应运动矢量分辨率的多个语法元素 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |