CN114747218A - Hmvp表的更新 - Google Patents
Hmvp表的更新 Download PDFInfo
- Publication number
- CN114747218A CN114747218A CN202080084219.8A CN202080084219A CN114747218A CN 114747218 A CN114747218 A CN 114747218A CN 202080084219 A CN202080084219 A CN 202080084219A CN 114747218 A CN114747218 A CN 114747218A
- Authority
- CN
- China
- Prior art keywords
- video
- candidate
- hmvp
- motion
- candidates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000033001 locomotion Effects 0.000 claims abstract description 269
- 238000000034 method Methods 0.000 claims abstract description 206
- 239000013598 vector Substances 0.000 claims abstract description 103
- 238000012545 processing Methods 0.000 claims abstract description 77
- 238000006243 chemical reaction Methods 0.000 claims abstract description 30
- 230000007704 transition Effects 0.000 claims abstract description 11
- 238000013138 pruning Methods 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 12
- 230000015654 memory Effects 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 6
- 230000003044 adaptive effect Effects 0.000 claims description 4
- 230000001419 dependent effect Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 description 45
- 238000009795 derivation Methods 0.000 description 31
- 238000000638 solvent extraction Methods 0.000 description 28
- 241000023320 Luma <angiosperm> Species 0.000 description 26
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 26
- 238000005192 partition Methods 0.000 description 21
- 230000002123 temporal effect Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 17
- 238000010276 construction Methods 0.000 description 11
- 238000013461 design Methods 0.000 description 6
- 230000011664 signaling Effects 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 230000002457 bidirectional effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 101150114515 CTBS gene Proteins 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- VQOXZBDYSJBXMA-NQTDYLQESA-N nystatin A1 Chemical compound O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/CC/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 VQOXZBDYSJBXMA-NQTDYLQESA-N 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 239000011449 brick Substances 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
公开了基于历史的运动矢量预测表的更新。一种视频处理的示例方法包括维护包括至少一个运动候选的基于历史的运动矢量预测(HMVP)表;执行视频的当前视频块和视频的比特流表示之间的转换;以及通过移除表中的第K个条目并将运动候选添加到HMVP表中来更新该表,其中K是正整数并且基于预定规则来确定,并且添加到HMVP表中的运动候选是从在转换期间推导的运动信息推导的。
Description
相关申请的交叉引用
根据适用的专利法和/或依据巴黎公约的规则,本申请是为了及时要求2019年12月6日提交的国际专利申请No.PCT/CN2019/123670的优先权和权益。国际专利申请No.PCT/CN2019/123670的全部公开通过引用而并入作为本申请的公开的一部分。
技术领域
本专利文档涉及图像和视频编码和解码。
背景技术
数字视频占互联网和其他数字通信网络上的最大带宽使用。随着能够接收和显示视频的连接用户设备的数量增加,预计对数字视频使用的带宽需求将继续增长。
发明内容
本文档公开了可以由视频编码器和解码器用来在视频编码或解码期间执行跨分量自适应环路滤波的技术。在一个示例方面,公开了一种视频处理的方法。
在一个示例方面,公开了一种视频处理的方法。该方法包括:执行视频的视频块和视频的比特流表示之间的转换;以及通过移除用于另一视频块的运动候选的表的第K个条目来选择性地更新该表,其中K是基于规则的正整数。
在一个示例方面,公开了一种视频处理的方法。该方法包括:执行视频的视频块和视频的比特流表示之间的转换;以及选择性地基于规则,通过移除用于另一视频块的运动候选的表中的现有候选而添加新候选来更新该表,其中该规则取决于现有候选的特性。
在一个示例方面,公开了一种视频处理的方法。该方法包括:执行视频的视频块和视频的比特流表示之间的转换;以及选择性地基于规则,通过在用于另一视频块的运动候选的表中从第0个位置起的第K个位置处添加基于转换的新候选来更新该表,其中K取决于规则。
在一个示例方面,公开了一种视频处理的方法。该方法包括:执行视频的视频处理单元的视频块和视频的比特流表示之间的转换;以及选择性地基于规则,更新用于另一视频块的运动候选的表,其中该规则取决于视频处理单元。
在一个示例方面,公开了一种视频处理的方法。该方法包括:维护包括至少一个运动候选的基于历史的运动矢量预测(HMVP)表;执行视频的当前视频块和视频的比特流表示之间的转换;以及通过移除表中的第K个条目并将运动候选添加到HMVP表中来更新该表,其中K是正整数并基于预定规则来确定,并且添加到HMVP表中的运动候选是从在转换期间推导的运动信息推导的。
在一个示例方面,公开了一种视频处理的方法。该方法包括:维护包括至少一个运动候选的基于历史的运动矢量预测(HMVP)表;执行视频的当前视频块和视频的比特流表示之间的转换;以及基于冗余候选在HMVP表中的位置,用运动候选更新该表,其中运动候选是从在转换期间推导的运动信息推导的,并且冗余候选与运动候选相同或类似。
在一个示例方面,公开了一种视频处理的方法。该方法包括:维护包括至少一个运动候选的基于历史的运动矢量预测(HMVP)表;执行视频的当前视频块和视频的比特流表示之间的转换;以及通过将运动候选添加到HMVP表中的第K个条目来更新该表,其中添加到HMVP表中的运动候选是从在转换期间推导的运动信息推导的,并且,K是正整数并基于预定规则来确定。
在一个示例方面,公开了一种视频处理的方法。该方法包括:维护包括至少一个运动候选的基于历史的运动矢量预测(HMVP)表;执行视频的视频块的视频处理单元和视频的比特流表示之间的转换;以及基于与视频处理单元相关联的一个或多个规则来更新HMVP表,其中该规则从一个视频处理单元到另一个视频处理单元而改变。
在又一个示例方面,公开了一种视频编码器装置。视频编码器包括被配置为实施上述方法的处理器。
在又一个示例方面,公开了一种视频编码器装置。视频编码器包括被配置为实施上述方法的处理器。
在又一个示例方面,公开了一种存储有代码的计算机可读介质。该代码以处理器可执行代码的形式体现本文描述的方法之一。
这些以及其他特征在整个本文档中描述。
附图说明
图1示出了典型的HEVC视频编码器(解码器建模元件用浅灰色阴影表示)。
图2示出了视频块分割的示例。
图3示出了MxM编解码单元或视频块的允许预测块的示例。
图4A-图4B示出了划分模式。
图5A-图5B示出了使用四叉树二叉树的划分模式示例。
图6(a)至(e)示出了各种块分割模式。
图7示出了Merge候选列表构建的推导过程。
图8示出了空域Merge候选的示例位置。
图9示出了被考虑用于空域Merge候选的冗余检查的候选对。
图10A-图10B示出了N×2N和2N×N分割(partition)的第二PU的位置。
图11是用于时域Merge候选的运动矢量缩放的图示。
图12示出了并置图片中的时域Merge候选C0和C1的候选位置。
图13示出了组合的双向预测Merge候选的示例。
图14示出了运动矢量预测候选的推导过程。
图15是用于空域运动矢量候选的运动矢量缩放的图示。
图16示出了基于历史的运动矢量预测(HMVP)的示例编解码流程。
图17示出了修改的Merge列表构建过程。
图18A-图18B示出了基于冗余移除的HMVP更新方法(移除一个冗余运动候选)。
图19A-图19B示出了基于冗余移除的HMVP更新方法(移除一个冗余运动候选)的示例。
图20示出了CU和PU分割示例。
图21示出了在AVS3中使用的当前块及其相邻(neighboring)块的示例。
图22A-图22D描绘了基于冗余移除的HMVP更新方法(表尺寸设置为L)的示例。
图23A-图23F描绘了HMVP表更新过程的示例。
图24是所公开的技术可以被实施的示例视频处理系统的框图。
图25是用于视频处理的示例硬件平台的框图。
图26是视频处理的示例方法的流程图。
图27是视频处理的示例方法的流程图。
图28是视频处理的示例方法的流程图。
图29是视频处理的示例方法的流程图。
图30是视频处理的示例方法的流程图。
具体实施方式
在本文档中使用章节标题是为了易于理解,而不是将每个章节中公开的技术和实施例的应用性仅限制于该章节。此外,在一些描述中使用H.266术语仅仅是为了易于理解,而不是为了限制所公开的技术的范围。因此,本文描述的技术也适用于其他视频编解码器设计。
1.介绍
本专利文档涉及视频编解码技术。具体地,它涉及图像/视频编解码中的运动矢量编解码。它可以被应用于现有的视频编解码标准(如HEVC)、或者待完成的标准(多功能视频编解码)、中国音频和视频编解码标准的第三代(AVS3)。它也可以适用于未来的视频编解码标准或视频编解码器。
2.简要描述
视频编解码标准主要通过众所周知的ITU-T和ISO/IEC标准的发展而演进。ITU-T制定了H.261和H.263,ISO/IEC制定了MPEG-1和MPEG-4Visual,并且这两个组织联合制定了H.262/MPEG-2视频和H.264/MPEG-4高级视频编解码(AVC)和H.265/HEVC标准。自H.262以来,视频编解码标准基于混合视频编解码结构,其中利用了时域预测加变换编解码。典型的HEVC编码器框架的示例在图1中描绘。
2.1.分割结构
2.1.1H.264/AVC中的分割树结构
先前标准中的编解码层的核心是宏块,其包含16×16亮度样点块,并且在4:2:0颜色采样的通常情况下,包含两个对应的8×8色度样点块。
帧内编解码块使用空域预测来利用像素之间的空域相关性。定义了两个分割:16×16和4×4。
帧间编解码块通过估计图片之间的运动来使用时域预测而不是空域预测。可以针对16×16宏块或其任何子宏块分割(16×8、8×16、8×8、8×4、4×8、4×4)独立地估计运动(参见图2)。仅允许每一子宏块分割一个运动矢量(MV)。
2.1.2.HEVC中的分割树结构
在HEVC中,通过使用表示为编解码树的四叉树结构将CTU划分为CU以适应各种局部特性。使用帧间图片(时域)还是帧内图片(空域)预测来编解码图片区域的决定是在CU级别进行的。可以根据PU划分类型将每个CU进一步划分为一个、两个或四个PU。在一个PU内部,应用相同的预测过程,并且基于PU将相关信息发送到解码器。在通过应用基于PU划分类型的预测过程来获得残差块之后,可以根据类似于CU的编解码树的另一个四叉树结构将CU分割为变换单元(TU)。HEVC结构的关键特征中的一个是它具有多个分割概念,包括CU、PU和TU。
在下文中,使用HEVC的混合视频编解码中涉及的各种特征如下突出显示。
1)编解码树单元和编解码树块(CTB)结构:HEVC中的模拟结构是编解码树单元(CTU),其具有由编码器选择的尺寸并且可以大于传统宏块。CTU由亮度CTB和对应的色度CTB以及语法元素组成。亮度CTB的尺寸L×L可以选择为L=16、32或64个样点,其中更大的尺寸通常能够实现更好的压缩。HEVC然后支持使用树结构和类似四叉树的信令将CTB分割为更小的块。
2)编解码单元(CU)和编解码块(CB):CTU的四叉树语法指定其亮度CB和色度CB的尺寸和位置。四叉树的根与CTU相关联。因此,亮度CTB的尺寸是亮度CB的最大支持尺寸。将CTU划分为亮度CB和色度CB是联合信令通知的。一个亮度CB和通常两个色度CB与相关联的语法一起形成编解码单元(CU)。CTB可以仅包含一个CU或者可以被划分以形成多个CU,并且每个CU具有分割成预测单元(PU)的相关联分割和变换单元(TU)的树。
3)预测单元和预测块(PB):使用帧间图片还是帧内图片预测来编解码图片区域的决定是在CU级别进行的。PU分割结构的根在CU级别。根据基本预测类型决定,亮度CB和色度CB然后可以进一步在尺寸上被划分,并且根据亮度和色度预测块(PB)而预测。HEVC支持从64×64下至4×4个样点的可变PB尺寸。图3示出了M×M CU的允许的PB的示例。
4)TU和变换块:使用块变换对预测残差进行编解码。TU树结构的根在CU级别。亮度CB残差可以与亮度变换块(TB)相同,或者可以进一步划分为更小的亮度TB。这同样适用于色度TB。针对正方形TB尺寸4×4、8×8、16×16和32×32定义类似于离散余弦变换(Discrete Cosine Transform,DCT)的函数的整数基函数。对于亮度帧内图片预测残差的4×4变换,可替代地指定从离散正弦变换(Discrete Sine Transform,DST)的形式推导的整数变换。
2.1.2.1.成为变换块和单元的树结构分割
对于残差编解码,CB可以被递归地分割为变换块(TB)。分割由残差四叉树信令通知。仅指定了正方形CB和TB分割,其中块可以被递归地划分为象限,如图4A-图4B所示。对于尺寸为M×M的给定亮度CB,标志信令通知其是否被划分为四个尺寸为M/2×M/2的块。如果可以进一步划分,如通过SPS中指示的残差四叉树的最大深度信令通知的,则为每个象限(quadrant)分配指示其是否被划分为四个象限的标志。由残差四叉树产生的叶节点块是通过变换编解码进一步处理的变换块。编码器指示其将使用的最大和最小亮度TB尺寸。当CB尺寸大于最大TB尺寸时,划分是隐式的。当划分将导致亮度TB尺寸小于指示的最小值时,不划分是隐式的。除了当亮度TB尺寸为4×4时(在这种情况下,单个4×4色度TB用于由四个4×4亮度TB覆盖的区域),色度TB尺寸在每个维度中是亮度TB尺寸的一半。在帧内图片预测的CU的情况下,(在CB内或外部的)最近的相邻TB的解码样点被用作用于帧内图片预测的参考数据。
与先前标准相反,HEVC设计允许TB跨越帧间图片预测的CU的多个PB,以最大化四叉树结构TB分割的潜在编解码效率益处。
2.1.2.2.父节点和子节点
根据四叉树结构划分CTB,四叉树结构的节点是编解码单元。四叉树结构中的多个节点包括叶节点和非叶节点。叶节点在树结构中没有子节点(即叶节点不被进一步划分)。非叶节点包括树结构的根节点。根节点对应于视频数据的初始视频块(例如,CTB)。对于多个节点中的每个相应的非根节点,相应的非根节点对应于视频块,该视频块是与相应的非根节点的树结构中的父节点相对应的视频块的子块。多个非叶节点中的每个相应的非叶节点在树结构中具有一个或多个子节点。
2.1.3.JEM中具有更大CTU的四叉树加二叉树块结构
为了探索HEVC以外的未来视频编解码技术,VCEG和MPEG于2015年联合成立了联合视频探索小组(JVET)。此后,JVET已经采用了许多新方法,并将其放入名为联合探索模型(JEM)的参考软件中。
2.1.3.1.QTBT块分割结构
不同于HEVC,QTBT结构移除了多个分割类型的概念,即,它移除了CU、PU和TU概念的分离,并且支持CU分割形状的更多灵活性。在QTBT块结构中,CU可以具有正方形或矩形形状。如图5A-图5B所示,首先通过四叉树结构分割编解码树单元(CTU)。通过二叉树结构进一步分割四叉树叶节点。在二叉树划分中有两种划分类型,对称水平划分和对称垂直划分。二叉树叶节点被称为编解码单元(CU),并且该分段用于预测和变换处理而无需任何进一步的分割。这意味着CU、PU和TU在QTBT编解码块结构中具有相同的块尺寸。在JEM中,CU有时由不同颜色分量的编解码块(CB)组成,例如,一个CU在4:2:0色度格式的P条带和B条带的情况下包含一个亮度CB和两个色度CB,并且有时由单个分量的CB组成,例如,一个CU在I条带的情况下仅包含一个亮度CB或只包含两个色度CB。
为QTBT分割方案定义以下参数。
–CTU尺寸:四叉树的根节点尺寸,与HEVC中的概念相同。
–MinQTSize:最小允许的四叉树叶节点尺寸。
–MaxBTSize:最大允许的二叉树根节点尺寸。
–MaxBTDepth:最大允许的二叉树深度。
–MinBTSize:最小允许二叉树叶节点尺寸。
在QTBT分割结构的一个示例中,CTU尺寸被设置为128×128个亮度样点,且具有两个对应的64×64色度样点块,MinQTSize被设置为16×16,MaxBTSize被设置为64×64,MinBTSize(针对宽度和高度两者)被设置为4×4,并且MaxBTDepth被设置为4。四叉树分割首先应用于CTU以生成四叉树叶节点。四叉树叶节点可以具有从16×16(即MinQTSize)至128×128(即CTU尺寸)的尺寸。如果叶四叉树节点为128×128,则它不会通过二叉树被进一步划分,因为它的尺寸超过MaxBTSize(即64×64)。否则,叶四叉树节点可以通过二叉树被进一步分割。因此,四叉树叶节点也是二叉树的根节点,并且其二叉树深度为0。当二叉树深度达到MaxBTDepth(即4)时,不考虑进一步的划分。当二叉树节点的宽度等于MinBTSize(即4)时,不考虑进一步的水平划分。类似地,当二叉树节点的高度等于MinBTSize时,不考虑进一步的垂直划分。二叉树的叶节点通过预测和变换过程被进一步处理,而无需任何进一步的分割。在JEM中,最大CTU尺寸为256×256个亮度样点。
图5A示出了通过使用QTBT进行块分割的示例,并且图5B示出了对应的树表示。实线指示四叉树划分,并且虚线指示二叉树划分。在二叉树的每个划分(即,非叶)节点中,信令通知一个标志以指示使用哪种划分类型(即,水平或垂直),其中0指示水平划分,并且1指示垂直划分。对于四叉树划分,不需要指示划分类型,因为四叉树划分总是水平和垂直地划分块以产生具有相同尺寸的4个子块。
另外,QTBT方案支持亮度和色度具有单独的QTBT结构的能力。目前,对于P条带和B条带,一个CTU中的亮度CTB和色度CTB共享相同的QTBT结构。然而,对于I条带,通过QTBT结构将亮度CTB分割为CU,并且通过另一个QTBT结构将色度CTB分割为色度CU。这意味着I条带中的CU由亮度分量的编解码块或两个色度分量的编解码块组成,并且P条带或B条带中的CU由所有三个颜色分量的编解码块组成。
在HEVC中,小块的帧间预测被限制,以减少运动补偿的存储器访问,使得对于4×8块和8×4块不支持双向预测,并且对于4×4块不支持帧间预测。在JEM的QTBT中,这些限制被移除。
2.1.4.VVC的三叉树
如所提出的,支持除了四叉树和二叉树之外的树类型。在实施方式中,引入了两个以上的三叉树(TT)分割,即水平和垂直中心侧三叉树,如图6(d)和(e)所示。
图6(a)四叉树分割6(b)垂直二叉树分割6(c)水平二叉树分割6(d)垂直中心侧三叉树分割6(e)水平中心侧三叉树分割。
有两个级别的树,区域树(四叉树)和预测树(二叉树或三叉树)。首先通过区域树(Region Tree,RT)对CTU进行分割。可以用预测树(Prediction Tree,PT)进一步划分RT叶。还可以用PT进一步划分PT叶,直到达到最大PT深度。PT叶是基本编解码单元。为方便起见,它仍被称为CU。CU不能被进一步划分。预测和变换都以与JEM相同的方式应用于CU。整个分割结构被命名为“多类型树”。
2.2.HEVC/H.265中的帧间预测
每个帧间预测的PU具有针对一个或两个参考图片列表的运动参数。运动参数包括运动矢量和参考图片索引。还可以使用inter_pred_idc信令通知两个参考图片列表中的一个的使用。运动矢量可以被显式地编解码为相对于预测值(predictor)的增量(delta),这样的编解码模式被称为AMVP模式。
当以跳过模式对CU进行编解码时,一个PU与CU相关联,并且不存在显著的残差系数、没有编解码的运动矢量增量或参考图片索引。指定Merge模式,由此从相邻PU获得当前PU的运动参数,包括空域和时域候选。Merge模式可以应用于任何帧间预测的PU,而不仅应用于跳过模式。Merge模式的可选方案是运动参数的显式传输,其中每个PU显式地信令通知运动矢量、每个参考图片列表的对应参考图片索引、以及参考图片列表使用。
当信令指示要使用两个参考图片列表中的一个时,从一个样点块产生PU。这被称为“单向预测”。单向预测可用于P条带和B条带两者。
当信令指示要使用参考图片列表中的两者时,从两个样点块产生PU。这被称为“双向预测”。双向预测仅可用于B条带。
下文提供了关于HEVC中指定的帧间预测模式的细节。描述将以Merge模式开始。
2.2.1.Merge模式
2.2.1.1.Merge模式的候选的推导
当使用Merge模式预测PU时,从比特流解析指向Merge候选列表中的条目的索引并将其用于检索运动信息。该列表的构建在HEVC标准中指定,并且可以根据以下步骤的序列概述:
·步骤1:初始候选推导
ο步骤1.1:空域候选推导
ο步骤1.2:空域候选的冗余检查
ο步骤1.3:时域候选推导
·步骤2:附加候选插入
ο步骤2.1:创建双向预测候选
ο步骤2.2:插入零运动候选
这些步骤也在图7中示意性描绘。对于空域Merge候选推导,在位于五个不同位置的候选当中选择最多四个Merge候选。对于时域Merge候选推导,在两个候选当中选择最多一个Merge候选。由于在解码器处假设每个PU的恒定数量的候选,因此当候选的数量未达到在条带头中信令通知的Merge候选的最大数量(MaxNumMergeCand)时,生成附加候选。由于候选的数量是恒定的,因此使用截断一元二值化(Unary Binarization,TU)来对最佳Merge候选的索引进行编码。如果CU的尺寸等于8,则当前CU的所有PU共享单个Merge候选列表,其与2N×2N预测单元的Merge候选列表相同。
在下文中,详细描述了与前述步骤相关联的操作。
2.2.1.2.空域候选推导
在对空域Merge候选的推导中,在位于图8中描绘的位置的候选当中选择最多四个Merge候选。推导的顺序是A1、B1、B0、A0和B2。仅当位置A1、B1、B0、A0的任何PU不可用(例如,因为它属于另一个条带或片)或者是帧内编解码时,才考虑位置B2。在添加位置A1处的候选之后,对剩余候选的添加进行冗余检查,其确保具有相同运动信息的候选被排除在列表之外,从而改进编解码效率。为了降低计算复杂性,在所提到的冗余检查中不考虑所有可能的候选对。相反,只考虑与图9中的箭头链接的对,并且仅当用于冗余检查的对应候选没有相同的运动信息,则候选才被添加到列表中。重复运动信息的另一个源是与不同于2N×2N的分割相关联的“第二PU”。作为示例,图10A-图10B分别描绘了N×2N和2N×N的情况下的第二PU。当当前PU被分割为N×2N时,位置A1处的候选不被考虑用于列表构建。实际上,通过添加该候选将导致两个预测单元具有相同的运动信息,这对于在编解码单元中只具有一个PU是冗余的。类似地,当当前PU被分割为2N×N时,不考虑位置B1。
2.2.1.3.时域候选推导
在该步骤中,仅一个候选被添加到列表。具体地,在对该时域Merge候选的推导中,基于属于与给定参考图片列表内的当前图片具有最小POC(Picture Order Count,图片顺序计数)差的图片的并置PU来推导缩放运动矢量。在条带头中显式地信令通知要用于推导并置PU的参考图片列表。如13中的虚线所示获得时域Merge候选的缩放运动矢量,该缩放运动矢量使用POC距离tb和td从并置PU的运动矢量缩放,其中tb被定义为当前图片的参考图片与当前图片之间的POC差,并且td被定义为并置图片的参考图片与并置图片之间的POC差。时域Merge候选的参考图片索引被设置为等于零。在HEVC规范中描述了缩放过程的实际实现。对于B条带,两个运动矢量(一个用于参考图片列表0,并且另一个用于参考图片列表1)被获得并组合,以产生双向预测Merge候选。
图11是用于时域Merge候选的运动矢量缩放的图示。
在属于参考帧的并置PU(Y)中,在候选C0和C1之间选择时域候选的位置,如图12中所描绘的。如果位置C0处的PU不可用、是帧内编解码的、或者在当前CTU外部,则使用位置C1。否则,位置C0用于对时域Merge候选的推导中。
2.2.1.4.附加候选插入
除了空时Merge候选之外,存在两种附加类型的Merge候选:组合的双向预测Merge候选和零Merge候选。通过利用空时Merge候选来生成组合的双向预测Merge候选。组合的双向预测Merge候选仅用于B条带。通过将初始候选的第一参考图片列表运动参数与另一个初始候选的第二参考图片列表运动参数组合来生成组合的双向预测候选。如果这两个元组提供不同的运动假设,它们将形成新的双向预测候选。作为示例,图13描绘了当具有mvL0和refIdxL0或mvL1和refIdxL1的原始列表(左边)中的两个候选用于创建被添加到最终列表(右边)的组合的双向预测Merge候选时的情况。有许多关于被考虑来生成这些附加Merge候选的组合的规则。
插入零运动候选以填充Merge候选列表中的剩余条目,并因此达到MaxNumMergeCand容量。这些候选具有零空域位移和参考图片索引,其从零开始并且每当新的零运动候选被添加到列表时增加。由这些候选使用的参考帧的数量对于单向预测和双向预测分别是1和2。最终,不对这些候选执行冗余检查。
2.2.1.5.用于并行处理的运动估计区域
为了加速编码过程,可以并行执行运动估计,由此同时推导给定区域内部的所有预测单元的运动矢量。从空域邻域推导Merge候选可能干扰并行处理,因为一个预测单元不能从相邻PU推导运动参数,直到其相关联的运动估计被完成。为了缓和编解码效率和处理时延之间的折衷,HEVC定义了运动估计区域(Motion Estimation Region,MER),其尺寸使用“log2_parallel_merge_level_minus2”语法元素在图片参数集中被信令通知。当定义了MER时,落入相同区域的Merge候选被标记为不可用,并且因此在列表构建中不考虑。
7.3.2.3图片参数集RBSP语法
7.3.2.3.1通用图片参数集RBSP语法
log2_parallel_merge_level_minus2加2指定变量Log2ParMrgLevel的值,其用于第8.5.3.2.2条中指定的Merge模式的亮度运动矢量的推导过程和第8.5.3.2.3条中指定的空域Merge候选的推导过程中。log2_parallel_merge_level_minus2的值应当在0至CtbLog2SizeY-2(含端点)的范围内。
变量Log2ParMrgLevel被推导如下:
Log2ParMrgLevel=log2_parallel_merge_level_minus2+2 (7-37)
注3-Log2ParMrgLevel的值指示Merge候选列表的并行推导的内置能力。例如,当Log2ParMrgLevel等于6时,可以并行推导64×64块中包含的所有预测单元(PU)和编解码单元(CU)的Merge候选列表。
2.2.2.AMVP模式下的运动矢量预测
运动矢量预测利用运动矢量与相邻PU的空时相关性,其用于运动参数的显式传输。它通过首先检查左方、上方时域上相邻的PU位置的可用性,移除冗余候选并添加零矢量以使候选列表为恒定长度来构建运动矢量候选列表。然后,编码器可以从候选列表中选择最佳预测值,并发送指示所选择的候选的对应索引。与Merge索引信令类似,使用截断一元来编码最佳运动矢量候选的索引。在这种情况下要被编码的最大值为2(参见图14)。在以下章节中,提供了关于运动矢量预测候选的推导过程的细节。
2.2.2.1.运动矢量预测候选的推导
图14概述了运动矢量预测候选的推导过程。
在运动矢量预测中,考虑两种类型的运动矢量候选:空域运动矢量候选和时域运动矢量候选。对于空域运动矢量候选推导,基于位于如图8所描绘的五个不同位置的每个PU的运动矢量,最终推导两个运动矢量候选。
对于时域运动矢量候选推导,从基于两个不同的并置位置而推导的两个候选选择一个运动矢量候选。在产生第一空时候选列表之后,移除列表中的重复的运动矢量候选。如果潜在候选的数量大于二,则从列表移除其相关联的参考图片列表内的参考图片索引大于1的运动矢量候选。如果空时运动矢量候选的数量小于二,则将附加的零运动矢量候选添加到列表。
2.2.2.2.空域运动矢量候选
在对空域运动矢量候选的推导中,在从位于如图8所描绘的位置的PU推导的五个潜在候选当中考虑最多两个候选。那些位置与运动Merge的位置相同。当前PU的左侧的推导顺序被定义为A0、A1、以及缩放A0、缩放A1。当前PU的上侧的推导顺序被定义为B0、B1、B2、缩放B0、缩放B1、缩放B2。对于每一侧,因此存在可用作运动矢量候选的四种情况,其中两种情况不需要使用空域缩放,并且两种情况使用空域缩放。四种不同的情况概述如下。
·没有空域缩放
-(1)相同的参考图片列表,以及相同的参考图片索引(相同的POC)
-(2)不同的参考图片列表,但是相同的参考图片(相同的POC)
·空域缩放
-(3)相同的参考图片列表,但是不同的参考图片(不同的POC)
-(4)不同的参考图片列表,以及不同的参考图片(不同的POC)
首先检查非空域缩放情况,然后空域缩放。当不管参考图片列表如何,POC在相邻PU的参考图片与当前PU的参考图片之间不同时,考虑空域缩放。如果左边候选的所有PU都不可用或者是帧内编解码的,则允许针对上面运动矢量的缩放以帮助对左边和上边MV候选的并行推导。否则,针对上面运动矢量不允许空域缩放。
在空域缩放过程中,以与时域缩放类似的方式缩放相邻PU的运动矢量,如图15所描绘的。主要差异是参考图片列表和当前PU的索引被给出作为输入;实际缩放过程与时域缩放的过程相同。
2.2.2.3.时域运动矢量候选
除了参考图片索引推导之外,用于推导时域Merge候选的所有过程与用于推导空域运动矢量候选的所有过程相同(参见图12)。向解码器信令通知参考图片索引。
2.2.2.4.Merge/AMVP信息的信令通知
对于AMVP模式,可以在比特流中信令通知四个部分,即,预测方向、参考索引、MVD和mv预测值候选索引(在下面的语法表中突出显示)。而对于Merge模式,可能只需要信令通知Merge索引。
语法表:
7.3.6.1通用条带段头语法
7.3.8.6预测单元语法
7.3.8.9运动矢量差语法
语义
five_minus_max_num_merge_cand指定从5减去的条带中支持的Merge MVP候选的最大数量。Merge MVP候选的最大数量MaxNumMergeCand被推导如下:
MaxNumMergeCand=5-five_minus_max_num_merge_cand (2-1)
MaxNumMergeCand的值必须在1至5(含端点)的范围内。
merge_flag[x0][y0]指定是否从相邻的帧间预测分割推断出当前预测单元的帧间预测参数。阵列索引x0、y0指定所考虑的预测块的左上方亮度样点相对于图片的左上方亮度样点的位置(x0,y0)。
当merge_flag[x0][y0]不存在时,它被推断如下:
-如果CuPredMode[x0][y0]等于MODE_SKIP,则merge_flag[x0][y0]被推断为等于1。
-否则,merge_flag[x0][y0]被推断为等于0。
merge_idx[x0][y0]指定Merge候选列表的Merge候选索引,其中x0、y0指定所考虑的预测块的左上方亮度样点相对于图片的左上方亮度样点的位置(x0,y0)。
2.3.VVC中的帧间模式编解码
在VVC中,平移运动和仿射运动以不同的方式处理。对于平移运动,采用增强的AMVP和Merge设计。
2.3.1.基于历史的运动矢量预测(HMVP)
与Merge列表设计不同,在VVC中,采用基于历史的运动矢量预测(HMVP)方法,其中维护HMVP表以存储来自先前编解码块的运动信息。这样的方法也被称为基于查找表的MVP方法。
可以在各种实施例中实施基于LUT的运动矢量预测技术以提供具有更高编解码效率的视频编解码,该技术使用存储有至少一个运动候选的一个或多个表(例如,查找表)来预测块的运动信息。查找表是可以用于包括运动候选以预测块的运动信息的表的示例,并且其他实施方式也是可能的。每个LUT可以包括一个或多个运动候选,每个运动候选与对应的运动信息相关联。运动候选的运动信息可以包括预测方向、参考索引/图片、运动矢量、LIC标志、仿射标志、运动矢量推导(MVD)精度和/或MVD值中的部分或全部。运动信息还可以包括块位置信息,以指示运动信息来自哪个块。
在针对各种实施方式描述的以下示例中阐述了基于所公开的技术的基于LUT的运动矢量预测,其可以增强现有和未来的视频编解码标准。因为LUT允许基于历史数据(例如,已经被处理的块)来执行编码/解码过程,所以基于LUT的运动矢量预测也可以被称为基于历史的运动矢量预测(HMVP)方法。在基于LUT的运动矢量预测方法中,在编码/解码过程期间维护具有来自先前编解码块的运动信息的一个或多个表。存储在LUT中的这些运动候选被称为HMVP候选。在一个块的编码/解码期间,LUT中的关联运动信息可以被添加到运动候选列表(例如,Merge/AMVP候选列表),并且在编码/解码一个块之后,LUT可以被更新。然后,更新的LUT用于对后续块进行编解码。也就是说,LUT中运动候选的更新基于块的编码/解码顺序。
在HMVP中,存储先前编解码的运动信息。先前编解码块的运动信息被定义为HMVP候选。多个HMVP候选被存储在名为HMVP表的表中,并且该表在编码/解码过程期间被即时(on-the-fly)维护。当开始编码/解码新的片/LCU行/条带时,HMVP表被清空。每当存在帧间编解码块和非子块、非三角形预测模式(非TPM)时,关联运动信息被添加到表的最后一个条目作为新的HMVP候选。图16中描绘了总体编解码流程。
2.3.1.1.常规Merge列表构建过程
常规Merge列表(用于平移运动)的构建可以根据以下步骤的序列概述:
·步骤1:推导空域Merge候选
·步骤1:推导时域Merge候选(TMVP,时域运动矢量预测)
·步骤2:插入HMVP候选
·步骤3:插入成对平均候选
·步骤4:默认运动候选
HMVP候选可以用于AMVP和Merge候选列表构建过程中。图17描绘了修改的Merge候选列表构建过程(以蓝色突出显示)。当Merge候选列表在TMVP候选插入之后未满时,存储在HMVP表中的HMVP候选可以用来填充Merge候选列表。考虑到一个块通常在运动信息方面与最近的相邻块具有更高的相关性,表中的HMVP候选以索引的降序被插入。表中的最后一个条目首先被添加到列表,而第一个条目被添加到最后。类似地,冗余移除被应用于HMVP候选。一旦可用Merge候选的总数达到允许信令通知的Merge候选的最大数量,Merge候选列表构建过程就终止。
注意,所有空域/时域/HMVP候选都应当以非IBC模式进行编解码。否则,不允许将其添加到常规Merge候选列表。
HMVP表包含多达5个运动候选,并且它们中的每一个是唯一的。
2.3.1.2.修剪过程
仅当用于冗余检查的对应候选不具有相同的运动信息时,候选才被添加到列表。这样比较过程被称为修剪过程。
空域候选之间的修剪过程取决于TPM对当前块的使用。
当当前块不以TPM模式(例如,常规Merge、MMVD、CIIP)进行编解码时,利用空域Merge候选的HEVC修剪过程(即,五次修剪)。
2.3.1.3.HMVP表更新
在以非TPM、非子块模式对帧间编解码块进行解码之后,HMVP表被更新。可以首先将当前块的运动信息与HMVP表中的所有可用HMVP候选进行修剪。
计数器被分配给HMVP表,其记录表中可用HMVP候选的数量。如果HMVP表被重置,它被初始化为0。
在更新过程期间有三种情况,如何处理每种情况描述如下:
1.如果找到一个相同的候选,则冗余候选从表中移除,并且所有剩余候选以索引减1被向前推动。然后当前块的运动信息在所有现有候选之后被添加到HMVP表。计数器保持不变。
2.如果没有找到相同的候选并且表未满,则当前块的运动信息在所有现有候选之后被添加到HMVP表。计数器增加1。
3.如果没有找到相同的候选并且表已满,则HMVP表中的第一个条目被移除,所有剩余候选以索引减1被向前推动。当前块的运动信息在所有现有候选之后被添加到HMVP表。计数器保持不变。
第一种情况和最后两种情况分别在图18A-图18B和图19A-图19B中进一步描绘。
图18A示出了当找到冗余候选,并且LUT在添加新的运动候选之前已满的情况。
图18B示出了当找到冗余候选,并且LUT在添加新的运动候选之前未满的情况。
图18A-图18B示出了基于冗余移除的HMVP更新方法(移除一个冗余运动候选)。
(图19A)没有找到冗余候选,并且LUT在添加新的运动候选之前已满,而图19B没有找到冗余候选,并且LUT在添加新的运动候选之前未满。
相关规范被定义如下:
8.5.2.16基于历史的运动矢量预测值候选列表的更新过程
该过程的输入为:
–1/16分数样点精度的亮度运动矢量mvL0和mvL1,
–参考索引refIdxL0和refIdxL1,
–预测列表利用标志predFlagL0和predFlagL1,
–双向预测权重索引bcwIdx,
–半样点插值滤波器索引hpelIfIdx。
MVP候选hMvpCand包括亮度运动矢量mvL0和mvL1、参考索引refIdxL0和refIdxL1、预测列表利用标志predFlagL0和predFlagL1、双向预测权重索引bcwIdx和半样点插值滤波器索引hpelIfIdx。
候选列表HmvpCandList通过以下有序步骤使用候选hMvpCand进行修改:
1.变量identicalCandExist被设置为等于FALSE,并且变量removeIdx被设置为等于0。
2.当NumHmvpCand大于0时,对于每个索引hMvpIdx(其中hMvpIdx=0..NumHmvpCand-1),以下步骤适用,直到identicalCandExist等于TRUE:
–当hMvpCand和HmvpCandList[hMvpIdx]具有相同的运动矢量和相同的参考索引时,identicalCandExist被设置为等于TRUE,并且removeIdx被设置为等于hMvpIdx。
3.候选列表HmvpCandList被更新如下:
–如果identicalCandExist等于TRUE或者NumHmvpCand等于5,则以下适用:
–对于每个索引i,其中(i=(removeIdx+1)..(NumHmvpCand-1)),HmvpCandList[i-1]被设置为等于HmvpCandList[i]。
–HmvpCandList[NumHmvpCand-1]被设置为等于hMvpCand。
–否则(identicalCandExist等于FALSE并且NumHmvpCand小于5),以下适用:
–HmvpCandList[NumHmvpCand++]被设置为等于hMvpCand。
2.3.2.平移运动的AMVP列表构建
HMVP在没有修剪的情况下被引入到AMVP列表。
2.4.VVC中的帧内块复制(IBC)模式
在IBC,共享AMVP和Merge列表,也就是说,利用相同的构建过程。对于4x4块,只有IBC HMVP表中的HMVP候选和零块矢量(BV)被添加到候选列表。对于其他情况,两个空域IBC候选、HMVP候选和零BV在部分修剪的情况下按顺序添加。
在对IBC编解码块进行解码之后,IBC HMVP表被相应地更新,以用于帧间模式的HMVP表的更新过程的类似方式。
对应的规范被提供如下:
8.5.2.6基于历史的块矢量预测值候选列表的更新过程
该过程的输入为:
–亮度块矢量bvL,以1/16分数样点精度。
候选列表HmvpIbcCandList通过以下有序步骤进行修改:
1.变量identicalCandExist被设置为等于FALSE,并且变量removeIdx被设置为等于0。
2.当NumHmvpIbcCand大于0时,对于每个索引hMvpIdx(其中hMvpIdx=0..NumHmvpIbcCand-1),以下步骤适用,直到identicalCandExist等于TRUE:
–当bvL等于HmvpIbcCandList[hMvpIdx]时,identicalCandExist被设置为等于TRUE,并且removeIdx被设置为等于hMvpIdx。
3.候选列表HmvpIbcCandList被更新如下:
–如果identicalCandExist等于TRUE或者NumHmvpIbcCand等于5,则以下适用:
–对于每个索引i,(其中i=(removeIdx+1)..(NumHmvpIbcCand-1)),HmvpIbcCandList[i-1]被设置为等于HmvpIbcCandList[i]。
–HmvpIbcCandList[NumHmvpIbcCand-1]被设置为等于bvL。
–否则(identicalCandExist等于FALSE并且NumHmvpIbcCand小于5),以下适用:
–HmvpIbcCandList[NumHmvpIbcCand++]被设置为等于bvL。
2.5.AVS2中的编解码结构
与HEVC类似,AVS2也采用基于CU、PU和TU的编解码/预测/变换结构的构思。首先,图片被划分为最大编解码单元(LCU),其由2N×2N个样点组成。一个LCU可以是单个CU,或者可以以四叉树分割结构被划分为四个更小的CU;如图20所示,CU可以被递归划分,直到其达到最小CU尺寸限制。一旦CU分层树的划分完成,叶节点CU就可以被进一步划分为PU。PU是用于帧内和帧间预测的基本单元,并且允许多个不同的形状来编码不规则图像模式,如图20所示。
图20示出了(a)AVS2中的最大可能的递归CU结构。(LCU尺寸=64,最大分层深度=4)。(b)AVS2中的跳过、帧内模式和帧间模式的可能PU划分,包括对称和非对称预测(对于帧内预测,d=1,2;并且对于帧间预测,d=0,1,2)。
2.6.AVS3中的帧间预测
类似于HEVC,有两种帧间编解码帧类型,P帧和B帧。P帧是使用单个参考图片的前向预测帧,而B帧是使用两个参考帧的包括前向、后向、双向预测和对称预测的双向预测帧。在B帧中,除了传统的前向、后向、双向和跳过/直接预测模式之外,对称预测被定义为特殊的双向预测模式,其中只有一个前向运动矢量(MV)被编解码,并且后向MV基于图片顺序计数(POC)距离从前向MV推导出。对称模式可以有效地表示对象的线性运动模型。
2.6.1.基于多运动模型的跳过/直接模式
当前块的SKIP模式的运动信息从先前解码块推导出,并且没有残差信息被编码。类似于SKIP模式,DIRECT模式没有要发送的运动信息,而预测残差和模式信息被发送。
作为其中利用仅来自一个时域预测块(CuSubtypeIdx等于0)的运动信息的传统SKIP和DIRECT模式的扩展,在AVS2和AVS3中引入了四个附加的基于运动模型的SKIP和DIRECT模式,即,双向DIRECT/SKIP模式(CuSubtypeIdx等于1)、对称DIRECT/SKIP模式(CuSubtypeIdx等于2)、后向DIRECT/SKIP模式(CuSubtypeIdx等于3)和前向DIRECT/SKIP模式(CuSubtypeIdx等于4)。
设计了一种基于优先级的运动信息推导方法,其考虑了块的运动模型(预测方向)。将更高的优先级分配给与当前块具有相同运动模型的相邻块的运动信息。
对于四个附加的基于运动模型的跳过/直接模式中的每一个,运动信息推导过程可以被划分为按顺序执行的三个步骤。
1)运动模型匹配搜索:如图21所示,在位置F、G、C、A、B、D处找到与当前块具有相同运动模型的相邻块的初始过程以该顺序进行。一旦找到与当前块共享相同运动模型的第一块,就将该块的运动信息分配给当前块。
2)人工搜索:在不存在与当前块共享相同运动模型的相邻块的情况下(即,从步骤1中没有找到结果),进行人工构建当前块的运动信息的第二过程。该过程从一个运动模型到另一个而变化。
a.对于双向DIRECT/SKIP模式,对有多少空域邻居以前向编解码(由Nfw表示)以及有多少空域邻居以后向编解码(由Nbw表示)进行计数。如果Nfw和Nbw都等于或大于1,则第一前向和第一后向预测块的运动信息的组合被分配给当前块。搜索顺序与第一步相同,即,从位置F、G、C、A、B和D开始。
b.对于对称DIRECT/SKIP模式,按顺序执行以下步骤
–对有多少空域邻居以双向编解码进行计数,由Nbi表示
–如果Nbi等于或大于2,则以F、G、C、A、B和D的扫描顺序的最后一个块(等于以D、B、A、C、G和F的扫描顺序的第一个块)的相邻双向预测块的运动信息的运动信息被分配给当前块。
–否则(如果Nbi小于2),如果Nbw等于或大于1,其中Nbw表示有多少空域邻居以后向编解码,则第一后向预测块的运动信息的后向运动矢量(由MvE1表示)被分配给当前块,并且前向运动矢量MvE0被设置为等于Clip3(-32768,32767,-MvE1)。搜索顺序与第一步相同,即,从位置F、G、C、A、B和D开始。
–否则(如果Nbi小于2且Nbw小于1),如果Nfw等于或大于1,其中Nfw表示有多少空域邻居以前向编解码,第一前向预测块的运动信息的前向运动矢量(由MvE0表示)被分配给当前块,并且后向运动矢量MvE1被设置为等于Clip3(-32768,32767,-MvE0)。搜索顺序与第一步相同,即,从位置F、G、C、A、B和D开始。
c.对于后向DIRECT/SKIP模式,对有多少空域邻居以双向编解码进行计数,由Nbi表示。最后一个相邻双向预测块的后向运动信息被分配给当前块。搜索顺序与第一步相同,即,从位置F、G、C、A、B和D开始。
d.对于前向DIRECT/SKIP模式,对有多少空域邻居以双向编解码进行计数,由Nbi表示。最后一个相邻双向预测块的前向运动信息被分配给当前块。搜索顺序与第一步相同,即,从位置F、G、C、A、B和D开始。
3)默认MV构建:只有当步骤1)和步骤2)都无法找到可用的运动矢量时,才调用该步骤。在AVS2/AVS3中,以下适用:
a.对于双向/对称跳过/直接模式,针对前向和后向都设置零运动矢量。
b.对于后向DIRECT/SKIP模式,后向运动矢量被设置为零MV,即,(0,0)。
c.对于前向DIRECT/SKIP模式,前向运动矢量被设置为零MV,即,(0,0)。
由于存在多个SKIP和DIRECT模式,因此需要在信令通知SKIP和DIRECT模式的运动模型时带来一些边信息。在AVS2参考软件RD3.0中,率失真优化方法用于选择编码块的模式。当计算新的SKIP和DIRECT模式的RD代价时,考虑边信息以产生更准确的代价值。
2.6.2.AVS3的HMVP
AVS3和VVC中HMVP设计的基本思想是相同的。然而,与VVC不同,merge/amvp列表中的HMVP候选索引由于空域/时域候选之间的修剪而动态改变,在AVS3中,HMVP候选被固定为从对于B条带等于4至11并且对于P条带等于2至9的索引开始。
表1.P图片的子CU类型
表2.B图片的子CU类型
更新过程与VVC中的相同。
3.所公开的技术解决方案解决的技术问题的示例
HMVP更新过程的当前设计具有以下问题:
1.它遵循这样的假设,即,更早添加的候选具有更低的机会被选择作为后续块的MVP。然而,这并不总是正确的。
4.技术和实施例的列表
下面的列表应该被视为解释一般构思的示例。这些项不应该以狭隘的方式解释。此外,这些项可以以任何方式组合。该IDF和其他IDF之间的组合也适用。
在本文档中,HMVP表是存储候选的表,其中候选不限于运动候选(例如,具有预测方向、参考索引/图片、运动矢量、LIC标志、仿射标志、MVD精度、MVD值、块位置信息、IBC编解码块的块矢量(BV)),它也可以是帧内模式候选或其他。
假设HMVP表尺寸由L表示,并且表中的每个候选与范围[0,L-1]内的索引相关联。
1.在HMVP表更新处理期间,代替移除HMVP表中首先(最早)添加的候选(例如,候选索引可能被设置为0),提出移除HMVP表中的第K个条目(即,索引等于K的HMVP候选),其中K是非零整数值。
a.在一个示例中,K是预定义的,例如,它被设置为1。
b.在一个示例中,K取决于HMVP表尺寸,即,要被存储在HMVP表中的候选的最大数量。
c.在一个示例中,K取决于如何利用HMVP表。
i.在一个示例中,当更新用于帧间编解码块的HMVP表时,K可以被设置为K0,并且当更新用于IBC编解码块的HMVP表时,K可以被设置为K1,其中K0不等于K1。
ii.在一个示例中,当更新用于帧内编解码块的HMVP表时,K可以被设置为等于K2。K2可以不等于K1或/和K0。
d.在一个示例中,K取决于编解码信息,诸如块维度、块位置、表已经被更新了多少次、表已经被更新的次数的奇偶性。
e.在一个示例中,K可以在比特流中被信令通知,诸如在序列/视频/图片/条带/片/子图片/图块(brick)/其他视频处理单元级别。
i.在一个示例中,K可以在SPS/PPS/图片头/条带头/VPS/DPS中被信令通知。
ii.在一个示例中,零从要为K信令通知的可能值中排除。
f.在一个示例中,对于HMVP表中的每个条目,可以进一步分配变量,诸如以指示候选的频率。
i.此外,可替代地,可以根据变量来确定要从表中移除哪个条目(例如,K的决定)。
g.在一个示例中,K可以即时自适应地改变。
i.在一个示例中,对于第一视频区域,K可以被设置为第一值,并且对于第二视频区域,K可以被设置为第二值,其中第一值和第二值不同。
ii.此外,可替代地,第一值或第二值可以等于0。
h.此外,可替代地,以上方法可以在某些条件下应用。
i.在一个示例中,当用新候选更新HMVP表时,如果表已满,并且在HMVP表中没有冗余候选(即,HMVP表中的候选与新候选相同或类似),则HMVP表中的第K个条目被移除。
ii.在一个示例中,当用新候选更新HMVP表时,如果在HMVP表中有冗余候选(即,HMVP表中的候选与新候选相同或类似),并且冗余候选与等于0的索引相关联,则HMVP表中的第K个条目被移除。
2.如何用新候选更新HMVP表可以取决于冗余(或类似)候选在表的何处(例如,冗余候选的索引)。
a.在一个示例中,如果冗余候选与等于N(例如,N=0或L-1)的索引相关联,则冗余候选可以首先被修改并存储在HMVP表中。
i.在一个示例中,与冗余候选相关联的运动矢量/BV可以通过添加一个或多个偏移或者被缩放来修改。
ii.在一个示例中,在更新的HMVP表中,修改的冗余候选可以与相同的索引(即,N)相关联。
3.当新候选用于更新HMVP表时,代替总是在修剪之后在所有现有候选之后添加新候选,提出将新候选添加到不是最后一个条目的倒数第K个条目(例如,索引等于L-1-K)。
a.在一个示例中,K小于或等于T,其中T是已经在表中的候选的数量。
b.如何添加新候选可以取决于HMVP表中冗余HMVP候选的索引。
c.在一个示例中,K是预定义的,例如,1。
i.在一个示例中,新候选被添加作为索引设置为(L-2)的候选,其中K=1。
d.在一个示例中,K取决于HMVP表尺寸,即,要被存储在HMVP表中的候选的最大数量。
e.在一个示例中,K取决于如何利用HMVP表。
i.在一个示例中,当更新用于帧间编解码块的HMVP表时,K可以被设置为K0,并且当更新用于IBC编解码块的HMVP表时,K可以被设置为K1,其中K0不等于K1。
ii.在一个示例中,当更新用于帧内编解码块的HMVP表时,K可以被设置为等于K2。K2可以不等于K1或/和K0。
f.在一个示例中,K取决于编解码信息,诸如块维度、块位置、表已经被更新了多少次、表已经被更新的次数的奇偶性。
g.在一个示例中,K可以在比特流中被信令通知,诸如在序列/视频/图片/条带/片/子图片/图块/其他视频处理单元级别。
i.在一个示例中,K可以在SPS/PPS/图片头/条带头/VPS/DPS中被信令通知。
h.在一个示例中,对于HMVP表中的每个条目,可以进一步分配变量,诸如以指示候选的频率。
i.此外,可替代地,可以根据变量来确定要从表中移除哪个条目(例如,K的决定)。
i.在一个示例中,K可以即时自适应地改变。
i.在一个示例中,对于第一视频区域,K可以被设置为第一值,并且对于第二视频区域,K可以被设置为第二值,其中第一值和第二值不同。
ii.此外,可替代地,第一值或第二值可以等于0。
j.在一个示例中,K可以取决于修剪结果,例如,在被更新之前,HMVP表中是否有一个相同或类似的候选。
4.用于更新HMVP表的规则可以从一个视频处理单元到另一个视频处理单元而改变。
a.在一个示例中,对于第一规则,应用修剪,并且对于第二规则,应用非修剪。
b.在一个示例中,对于第一规则,应用部分修剪(即,将要被添加的新候选与表中的部分现有候选进行比较),并且对于第二规则,应用完全修剪(即,将要被添加的新候选与表中的所有现有候选进行比较)。
c.在一个示例中,它可以取决于将如何使用HMVP表,例如,对于利用HMVP表的预测模式的块。
d.在一个示例中,编解码信息可以包括编解码模式信息。
i.在一个示例中,当更新用于帧间编解码块的HMVP表时,可以应用以上方法或现有方法(根据修剪结果的自适应顺序),并且当更新用于IBC编解码块的HMVP表时,可以应用FIFO规则。
5.是否和/或如何应用上述项目符号可以取决于编解码信息。
a.在一个示例中,编解码信息可以包括编解码模式信息。
i.在一个示例中,当更新用于帧间编解码块的HMVP表时,可以应用以上方法,并且当更新用于IBC编解码块的HMVP表时,可以应用现有方法。
5.实施例示例
5.1描绘HMVP表更新过程的图的示例
在图22C中,HMVP表更新过程被修改用于当表已满并且在HMVP表中的现有候选当中没有找到冗余候选时的情况。
图22A示出了以下情况:找到冗余候选,并且LUT在添加新的运动候选之前已满。
图22B示出了以下情况:找到冗余候选,并且LUT在添加新的运动候选之前未满。
图22C示出了以下情况:没有找到冗余候选,并且LUT在添加新的运动候选之前已满。
图22D示出了以下情况:没有找到冗余候选,并且LUT在添加新的运动候选之前未满。
在图23A-图23F中,HMVP表更新过程(对应于第4节的项目符号1中的K=1)被修改用于以下情况:
当表已满,并且在HMVP表中的现有候选中没有找到冗余候选时,请参考图23E。
当表已满,并且找到冗余候选为HMVP表中的第一个候选(HMVP0)时,请参考图23C。
当表未满,并且找到冗余候选为HMVP表中的第一个候选(HMVP0)时,请参考图23D。
图23A示出了以下情况:找到冗余候选(索引不等于0),并且LUT在添加新的运动候选之前已满。
图23B示出了以下情况:找到冗余候选(索引不等于0),并且LUT在添加新的运动候选之前未满。
图23C示出了以下情况:找到冗余候选(索引等于0),并且LUT在添加新的运动候选之前已满。
图23D示出了以下情况:找到冗余候选(索引等于0),并且LUT在添加新的运动候选之前未满。
图23E示出了以下情况:没有找到冗余候选,并且LUT在添加新的运动候选之前已满。
图23F示出了以下情况:没有找到冗余候选,并且LUT在添加新的运动候选之前未满。
5.2.AVS3规范之上的实施例#1
删除的文本标记有删除线,并且新添加的文本突出显示。
9.16更新历史运动信息表
完成当前预测单元的解码后,如果当前预测单元是帧内预测单元且不是仿射预测单元,当NumOfHmvpCand大于0时,根据当前预测块的运动信息更新历史运动信息表HmvpCandidateList否则,不执行本条定义的操作。
a)将hmvpIdx初始化为0。
b)如果CntHmvp等于0,则HmvpCandidateList[CntHmvp]等于当前预测单元的运动信息,CntHmvp加1。
c)否则,根据9.15定义的方法判断当前预测块的运动信息和HmvpCandidateList[hmvpIdx]是否相同:
1)如果运动信息相同,执行步骤d),否则,hmvpIdx加1。
2)如果hmvpIdx小于CntHmvp,执行步骤c);否则,执行步骤d)。
d)如果hmvpIdx小于CntHmvp,则:
1)i从hmvpIdx到CntHmvp-1,令HmvpCandidateList[i]等于HmvpCandidateList[i+1];
2)HmvpCandidateList[CntHmvp-1]等于当前预测单元的运动信息。否则,如果hmvpIdx等于CntHmvp且CntHmvp等于NumOfHmvpCand,则:
2)HmvpCandidateList[CntHmvp-1]等于当前预测单元的运动信息。否则,如果hmvpIdx等于CntHmvp且CntHmvp小于NumOfHmvpCand,则HmvpCandidateList[CntHmvp]等于当前预测单元的运动信息,CntHmvp加1。
5.3.VVC规范之上的实施例#1
8.5.2.6基于历史的块矢量预测值候选列表的更新过程该过程的输入为:
–亮度块矢量bvL,以1/16分数样点精度。
候选列表HmvpIbcCandList通过以下有序步骤进行修改:
4.变量identicalCandExist被设置为等于FALSE,并且变量removeIdx被设置为等于0。
5.当NumHmvpIbcCand大于0时,对于每个索引hMvpIdx(其中hMvpIdx=0..NumHmvpIbcCand-1),以下步骤适用,直到identicalCandExist等于TRUE:
–当bvL等于HmvpIbcCandList[hMvpIdx]时,identicalCandExist被设置为等于TRUE,并且removeIdx被设置为等于hMvpIdx。
6.候选列表HmvpIbcCandList被更新如下:
–如果identicalCandExist等于FALSE并且NumHmvpIbcCand等于5,则removeIdx被 设置为1。
–如果identicalCandExist等于TRUE或者NumHmvpIbcCand等于5,则以下适用:
–对于每个索引i,(其中i=(removeIdx+1)..(NumHmvpIbcCand-1)),HmvpIbcCandList[i-1]被设置为等于HmvpIbcCandList[i]。
–HmvpIbcCandList[NumHmvpIbcCand-1]被设置为等于bvL。
–否则(identicalCandExist等于FALSE并且NumHmvpIbcCand小于5),以下适用:
–HmvpIbcCandList[NumHmvpIbcCand++]被设置为等于bvL。
8.5.2.16.基于历史的运动矢量预测值候选列表的更新过程
该过程的输入为:
–以1/16分数样点精度的亮度运动矢量mvL0和mvL1,
–参考索引refIdxL0和refIdxL1,
–预测列表利用标志predFlagL0和predFlagL1,
–双向预测权重索引bcwIdx,
–半样点插值滤波器索引hpelIfIdx。
MVP候选hMvpCand包括亮度运动矢量mvL0和mvL1、参考索引refIdxL0和refIdxL1、预测列表利用标志predFlagL0和predFlagL1、双向预测权重索引bcwIdx和半样点插值滤波器索引hpelIfIdx。
候选列表HmvpCandList通过以下有序步骤使用候选hMvpCand进行修改:
1.变量identicalCandExist被设置为等于FALSE,并且变量removeIdx被设置为等于0。
2.当NumHmvpCand大于0时,对于每个索引hMvpIdx(其中hMvpIdx=0..NumHmvpCand-1),以下步骤适用,直到identicalCandExist等于TRUE:
–当hMvpCand和HmvpCandList[hMvpIdx]具有相同的运动矢量和相同的参考索引时,identicalCandExist被设置为等于TRUE,并且removeIdx被设置为等于hMvpIdx。
3.候选列表HmvpCandList被更新如下:
–如果identicalCandExist等于FALSE并且NumHmvpIbcCand等于5,则removeIdx被 设置为1。
–如果identicalCandExist等于TRUE或者NumHmvpCand等于5,则以下适用:
–对于每个索引i,其中(i=(removeIdx+1)..(NumHmvpCand-1)),HmvpCandList[i-1]被设置为等于HmvpCandList[i]。
–HmvpCandList[NumHmvpCand-1]被设置为等于hMvpCand。
–否则(identicalCandExist等于FALSE并且NumHmvpCand小于5),以下适用:
–HmvpCandList[NumHmvpCand++]被设置为等于hMvpCand。
图24是示出可以在其中实施本文公开的各种技术的示例视频处理系统1900的框图。各种实施方式可以包括系统1900的一些或所有组件。系统1900可以包括用于接收视频内容的输入1902。视频内容可以以例如8或10比特多分量像素值的原始或未压缩格式而接收,或者可以是压缩或编码格式。输入1902可以表示网络接口、外围总线接口或存储接口。网络接口的示例包括诸如以太网、无源光网络(Passive Optical Network,PON)等的有线接口和诸如Wi-Fi或蜂窝接口的无线接口。
系统1900可以包括可以实施本文档中描述的各种编解码或编码方法的编解码组件1904。编解码组件1904可以将来自输入1902的视频的平均比特率减小到编解码组件1904的输出,以产生视频的编解码表示。编解码技术因此有时被称为视频压缩或视频转码技术。编解码组件1904的输出可以被存储,或者经由如由组件1906表示的通信连接而发送。在输入1902处接收的视频的存储或通信传送的比特流(或编解码)表示可以由组件1908用于生成像素值或传送到显示接口1910的可显示视频。从比特流表示生成用户可视视频的过程有时被称为视频解压缩。此外,虽然某些视频处理操作被称为“编解码”操作或工具,但是将理解,编解码工具或操作在编码器处被使用,并且反转编码结果的对应的解码工具或操作将由解码器执行。
外围总线接口或显示接口的示例可以包括通用串行总线(Universal SerialBus,USB)、或高清晰度多媒体接口(High Definition Multimedia Interface,HDMI)、或显示端口(Displayport)等。存储接口的示例包括SATA(Serial Advanced TechnologyAttachment,串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以体现在各种电子设备中,诸如移动电话、膝上型电脑、智能电话、或能够执行数字数据处理和/或视频显示的其他设备。
图25是视频处理装置3600的框图。装置3600可以用来实施本文描述的方法中的一种或多种。装置3600可以体现在智能电话、平板电脑、计算机、物联网(Internet ofThings,IoT)接收器等中。装置3600可以包括一个或多个处理器3602、一个或多个存储器3604、以及视频处理硬件3606。(多个)处理器3602可以被配置为实施本文档中描述的一种或多种方法。存储器(多个存储器)3604可以用于存储用于实施本文描述的方法和技术的数据和代码。视频处理硬件3606可以用来以硬件电路实施本文档中描述的一些技术。
接下来提供一些实施例优选的解决方案列表。
以下解决方案示出了在先前章节(例如,项目符号1)中讨论的技术的示例实施例。
1.一种视频处理的方法(例如,图26中描绘的方法2600),包括:执行(2602)视频的视频块和视频的比特流表示之间的转换;以及通过移除用于另一视频块的运动候选的表的第K个条目来选择性地更新(2604)该表,其中K是基于规则的正整数。例如,规则指定完成更新的条件和不执行更新(例如,当没有要被添加的新候选时)的条件。
2.根据解决方案1所述的方法,其中,规则指定K=1。
3.根据解决方案1所述的方法,其中,规则指定K取决于表的尺寸。
4.根据解决方案1所述的方法,其中,规则指定K取决于视频块的转换的特性。
5.根据解决方案1所述的方法,其中,规则指定执行更新的条件。
6.根据解决方案5所述的方法,其中,条件是该表不具有与新候选类似的冗余候选,并且规则指定移除表中的第K个条目。
7.根据解决方案5所述的方法,其中,条件是该表包括与新候选类似的冗余候选,并且冗余候选对应于索引0,并且其中规则指定移除表中的第K个条目。
以下解决方案示出了在先前章节(例如,项目符号2)中讨论的技术的示例实施例。
8.一种视频处理的方法,包括:执行视频的视频块和视频的比特流表示之间的转换;以及选择性地基于规则,通过移除用于另一视频块的运动候选的表中的现有候选而添加新候选来更新该表,其中该规则取决于现有候选的特性。
9.根据解决方案8所述的方法,其中,现有候选的特性是现有候选的索引。
以下解决方案示出了在先前章节(例如,项目符号3)中讨论的技术的示例实施例。
10.一种视频处理的方法,包括:执行视频的视频块和视频的比特流表示之间的转换;以及选择性地基于规则,通过在用于另一视频块的运动候选的表中从第0个位置起的第K个位置处添加基于转换的新候选来更新该表,其中K取决于规则。
11.根据解决方案10所述的方法,其中,规则指定K取决于表中冗余候选的索引。
12.根据解决方案10所述的方法,其中,K=1,或者K取决于表的尺寸。
以下解决方案示出了在先前章节(例如,项目符号5)中讨论的技术的示例实施例。
13.一种视频处理的方法,包括:执行视频的视频处理单元的视频块和视频的比特流表示之间的转换;以及选择性地基于规则,更新用于另一视频块的运动候选的表,其中该规则取决于视频处理单元。
14.根据解决方案13所述的方法,其中,规则指定修剪是否被应用于对视频处理单元的更新。
15.根据解决方案13-14中任一项所述的方法,其中,取决于视频处理单元的特性,规则是指定应用部分修剪的第一规则或指定应用完全修剪的第二规则中的一个。
16.根据解决方案1-15中任一项所述的方法,其中,该表是基于历史的运动矢量预测表。
17.根据解决方案1-16中任一项所述的方法,其中,执行转换包括编码视频以生成编解码表示。
18.根据解决方案1-16中任一项所述的方法,其中,执行转换包括对编解码表示进行解析和解码以生成视频。
19.一种视频解码装置,包括被配置为实施根据解决方案1至18中的一项或多项所述的方法的处理器。
20.一种视频编码装置,包括被配置为实施根据解决方案1至18中的一项或多项所述的方法的处理器。
21.一种存储有计算机代码的计算机程序产品,该代码在由处理器执行时使处理器实施根据解决方案1至18中任一项所述的方法。
22.一种本文档中描述的方法、装置或系统。
图27示出了用于视频处理的示例方法的流程图。该方法包括维护(2702)包括至少一个运动候选的基于历史的运动矢量预测(HMVP)表;执行(2704)视频的当前视频块和视频的比特流表示之间的转换;以及通过移除表中的第K个条目并将运动候选添加到HMVP表中来更新(2706)该表,其中K是正整数并且基于预定规则来确定,并且添加到HMVP表中的运动候选是从在转换期间推导的运动信息推导的。
在一些示例中,执行转换至少部分基于HMVP表。
在一些示例中,预定规则指定K是预定义的。
在一些示例中,K被设置为1。
在一些示例中,预定规则指定K取决于HMVP表的尺寸。
在一些示例中,预定规则指定K取决于视频块的转换的一个或多个特性。
在一些示例中,当HMVP表用于帧间编解码块时,K被设置为K0,并且当HMVP表用于IBC编解码块时,K被设置为K1,其中K0不等于K1。
在一些示例中,当HMVP表用于帧内编解码块时,K被设置为等于K2,其中K2不等于K1或/和K0。
在一些示例中,预定规则指定K取决于与当前视频块相关联的编解码信息、表已经被更新了多少次以及表已经被更新的次数的奇偶性中的至少一个,其中编解码信息包括块维度和块位置中的至少一个。
在一些示例中,K在序列级别、视频级别、图片级别、条带级别、片级别、子图片级别、图块级别或其他视频处理单元级别中的至少一个的比特流中被信令通知。
在一些示例中,对于表中的每个条目,变量被分配以指示与该条目相关联的候选的频率,其中预定规则指定K根据变量来确定。
在一些示例中,预定规则指定K即时自适应地改变。
在一些示例中,对于第一视频区域,K被设置为第一值,并且对于第二视频区域,K被设置为第二值,其中第一值和第二值不同。
在一些示例中,第一值或第二值等于0。
在一些示例中,该更新在某些条件下被应用。
在一些示例中,当用运动候选更新该表时,如果表已满并且表中没有冗余候选,则表中的第K个条目被移除,其中冗余候选与新候选相同或类似。
在一些示例中,当用运动候选更新该表时,如果表中有冗余候选并且冗余候选与等于0的索引相关联,则表中的第K个条目被移除,其中冗余候选与新候选相同或类似。
图28示出了用于视频处理的示例方法的流程图。该方法包括维护(2802)包括至少一个运动候选的基于历史的运动矢量预测(HMVP)表;执行(2804)视频的当前视频块和视频的比特流表示之间的转换;以及基于冗余候选在HMVP表中的位置,用运动候选更新(2806)该表,其中运动候选是从在转换期间推导的运动信息推导的,并且冗余候选与运动候选相同或类似。
在一些示例中,执行转换至少部分基于HMVP表。
在一些示例中,如果冗余候选与HMVP表中等于N的索引相关联,则冗余候选首先被修改并存储在表中,N是整数。
在一些示例中,N=0或L-1,其中L是HMVP表的尺寸。
在一些示例中,与冗余候选相关联的运动矢量或块矢量通过添加一个或多个偏移或者被缩放来修改。
在一些示例中,在更新的HMVP表中,修改的冗余候选与相同的索引N相关联。
图29示出了用于视频处理的示例方法的流程图。该方法包括维护(2902)包括至少一个运动候选的基于历史的运动矢量预测(HMVP)表;执行(2904)视频的当前视频块和视频的比特流表示之间的转换;以及通过将运动候选添加到HMVP表中的第K个条目来更新(2906)该表,其中添加到HMVP表中的运动候选是从在转换期间推导的运动信息推导的,并且K是正整数并且基于预定规则来确定。
在一些示例中,执行转换至少部分基于HMVP表。
在一些示例中,预定规则指定K小于或等于T,其中T是已经在HMVP表中的候选的数量。
在一些示例中,如何添加运动候选取决于冗余候选在HVMP表中的索引,其中冗余候选与运动候选相同或类似。
在一些示例中,预定规则指定K是预定义的。
在一些示例中,K被设置为1。
在一些示例中,运动候选被添加作为索引设置为(L-2)的候选,其中L是HMVP表的尺寸。
在一些示例中,预定规则指定K取决于HMVP表的尺寸。
在一些示例中,预定规则指定K取决于视频块的转换的一个或多个特性。
在一些示例中,当HMVP表用于帧间编解码块时,K被设置为K0,并且当HMVP表用于IBC编解码块时,K被设置为K1,其中K0不等于K1。
在一些示例中,当HMVP表用于帧内编解码块时,K被设置为等于K2,其中K2不等于K1或/和K0。
在一些示例中,预定规则指定K取决于与当前视频块相关联的编解码信息、表已经被更新了多少次以及表已经被更新的次数的奇偶性中的至少一个,其中编解码信息包括块维度和块位置中的至少一个。
在一些示例中,K在序列级别、视频级别、图片级别、条带级别、片级别、子图片级别、图块级别或其他视频处理单元级别中的至少一个的比特流中被信令通知。
在一些示例中,对于HMVP表中的每个条目,变量被分配以指示与该条目相关联的候选的频率,其中预定规则指定K根据变量来确定。
在一些示例中,预定规则指定K即时自适应地改变。
在一些示例中,对于第一视频区域,K被设置为第一值,并且对于第二视频区域,K被设置为第二值,其中第一值和第二值不同。
在一些示例中,第一值或第二值等于0。
在一些示例中,预定规则指定K取决于修剪结果,该修剪结果指示在被更新之前,HMVP表中是否有一个相同或类似的候选。
图30示出了用于视频处理的示例方法的流程图。该方法包括维护(3002)包括至少一个运动候选的基于历史的运动矢量预测(HMVP)表;执行(3004)视频的当前视频块和视频的比特流表示之间的转换;以及基于与视频处理单元相关联的一个或多个规则来更新(3006)HMVP表,其中该规则从一个视频处理单元到另一个视频处理单元而改变。
在一些示例中,执行转换至少部分基于HMVP表。
在一些示例中,对于第一规则,应用修剪,并且对于第二规则,应用非修剪。
在一些示例中,对于第一规则,应用部分修剪,并且对于第二规则,应用完全修剪。
在一些示例中,规则根据视频处理单元的转换的一个或多个特性来确定。
在一些示例中,一个或多个特性包括处理单元的预测模式。
在一些示例中,规则基于视频处理单元的编解码模式信息来确定。
在一些示例中,当HMVP表用于帧间编解码块时,该规则从一个视频处理单元到另一个视频处理单元而改变,或者规则指定根据修剪结果的自适应顺序。
在一些示例中,当HMVP表用于IBC编解码块时,规则是FIFO规则。
在一些示例中,该更新取决于与视频块相关联的编解码信息。
在一些示例中,编解码信息包括编解码模式信息。
在一些示例中,该转换从比特流表示生成视频的视频块。
在一些示例中,该转换从视频的视频块生成比特流表示。
在本文档中,术语“视频处理”可以指视频编码、视频解码、视频压缩或视频解压缩。例如,可以在从视频的像素表示到对应的比特流表示的转换期间应用视频压缩算法,反之亦然。如语法所定义的,当前视频块的比特流表示可以例如对应于并置或者散布在比特流内不同位置的比特。例如,可以根据变换的和编解码的误差残差值并且还使用比特流中的头和其他字段中的比特来编码宏块。
本文档中描述的所公开的以及其他解决方案、示例、实施例、模块和功能操作可以在数字电子电路中、或者在计算机软件、固件或硬件(包括本文档中公开的结构及其结构等同物)中、或者在它们中的一个或多个的组合中被实施。所公开的以及其他实施例可以被实施为一个或多个计算机程序产品,即编码在计算机可读介质上的计算机程序指令的一个或多个模块,该计算机程序指令用于由数据处理装置执行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读传播信号的物质的组合、或它们中的一个或多个的组合。术语“数据处理装置”包含用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机、或多个处理器或计算机。除了硬件之外,装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统、或它们中的一个或多个的组合的代码。传播信号是被生成以对信息进行编码以用于发送到合适的接收器装置的人工生成的信号,例如机器生成的电信号、光学信号或电磁信号。
计算机程序(也已知为程序、软件、软件应用、脚本或代码)可以以任何形式的编程语言(包括编译或解释语言)编写,并且其可以以任何形式部署,包括作为独立程序或作为适合在计算环境中使用的模块、组件、子例程或其他单元。计算机程序不一定对应于文件系统中的文件。程序可以存储在保存其他程序或数据(例如,存储在标记语言文档中的一个或多个脚本)的文件的一部分中,存储在专用于所讨论的程序的单个文件中,或存储在多个协调文件中(例如,存储一个或多个模块、子程序或代码部分的文件)。计算机程序可以被部署以在一个计算机上或在位于一个站点上或跨多个站点分布并通过通信网络互连的多个计算机上执行。
本文档书中描述的过程和逻辑流程可以由执行一个或多个计算机程序的一个或多个可编程处理器执行,以通过对输入数据进行操作并生成输出来执行功能。过程和逻辑流程也可以由专用逻辑电路执行,并且装置也可以被实施为专用逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
适合于执行计算机程序的处理器包括例如通用和专用微处理器、以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个大容量存储设备(例如,磁盘、磁光盘或光盘),或可操作地耦合以从该一个或多个大容量存储设备接收数据或向该一个或多个大容量存储设备传递数据、或者从其接收数据并向其传递数据。然而,计算机不需要这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如内部硬盘或可换式磁盘;磁光盘;以及CD ROM和DVD-ROM磁盘。处理器和存储器可以由专用逻辑电路补充或并入专用逻辑电路中。
虽然本专利文档包含许多细节,但这些细节不应被解释为对任何主题或可能要求保护的范围的限制,而是作为特定于特定技术的特定实施例的特征的描述。在本专利文档中在单独的实施例的上下文中描述的某些特征也可以在单个实施例中组合实施。相反,在单个实施例的上下文中描述的各种特征也可以在多个实施例中分开实施或以任何合适的子组合实施。此外,尽管特征可以在上面描述为以某些组合起作用并且甚至最初如此要求保护,但是在一些情况下可以从组合排除来自所要求保护的组合的一个或多个特征,并且所要求保护的组合可以针对子组合或子组合的变化。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应该被理解为需要以所示的特定顺序或以先后顺序执行这样的操作或者执行所有示出的操作以实现期望的结果。此外,在本专利文档中描述的实施例中的各种系统组件的分离不应被理解为在所有实施例中都需要这样的分离。
仅描述了一些实施方式和示例,并且可以基于本专利文档中描述和示出的内容来进行其他实施方式、增强和变化。
Claims (57)
1.一种用于视频处理的方法,包括:
维护包括至少一个运动候选的基于历史的运动矢量预测(HMVP)表;
执行视频的当前视频块和所述视频的比特流表示之间的转换;以及
通过移除所述表中的第K个条目并将运动候选添加到所述HMVP表中来更新所述表,其中K是正整数并基于预定规则来确定,并且添加到所述HMVP表中的运动候选是从在所述转换期间推导的运动信息推导的。
2.根据权利要求1所述的方法,其中,执行转换至少部分基于所述HMVP表。
3.根据权利要求1或2所述的方法,其中,所述预定规则指定K是预定义的。
4.根据权利要求3所述的方法,其中,K被设置为1。
5.根据权利要求1所述的方法,其中,所述预定规则指定K取决于所述HMVP表的尺寸。
6.根据权利要求1所述的方法,其中,所述预定规则指定K取决于视频块的转换的一个或多个特性。
7.根据权利要求1所述的方法,其中,当所述HMVP表用于帧间编解码块时,K被设置为K0,并且当所述HMVP表用于IBC编解码块时,K被设置为K1,其中K0不等于K1。
8.根据权利要求7所述的方法,其中,当所述HMVP表用于帧内编解码块时,K被设置为等于K2,其中K2不等于K1或/和K0。
9.根据权利要求1所述的方法,其中,所述预定规则指定K取决于与所述当前视频块相关联的编解码信息、所述表已经被更新了多少次以及所述表已经被更新的次数的奇偶性中的至少一个,其中所述编解码信息包括块维度和块位置中的至少一个。
10.根据权利要求1-9中任一项所述的方法,其中,K在序列级别、视频级别、图片级别、条带级别、片级别、子图片级别、图块级别或其他视频处理单元级别中的至少一个的比特流中被信令通知。
11.根据权利要求1所述的方法,其中,对于所述表中的每个条目,变量被分配以指示与所述条目相关联的候选的频率,其中所述预定规则指定K根据所述变量来确定。
12.根据权利要求1所述的方法,其中,所述预定规则指定K即时自适应地改变。
13.根据权利要求12所述的方法,其中,对于第一视频区域,K被设置为第一值,并且对于第二视频区域,K被设置为第二值,其中所述第一值和所述第二值不同。
14.根据权利要求13所述的方法,其中,所述第一值或所述第二值等于0。
15.根据权利要求1-14中任一项所述的方法,其中,所述更新在某些条件下被应用。
16.根据权利要求15所述的方法,其中,当用所述运动候选更新所述表时,如果所述表已满并且所述表中没有冗余候选,则所述表中的第K个条目被移除,其中所述冗余候选与新候选相同或类似。
17.根据权利要求15所述的方法,其中,当用所述运动候选更新所述表时,如果所述表中有冗余候选并且所述冗余候选与等于0的索引相关联,则所述表中的第K个条目被移除,其中所述冗余候选与新候选相同或类似。
18.一种用于视频处理的方法,包括:
维护包括至少一个运动候选的基于历史的运动矢量预测(HMVP)表;
执行视频的当前视频块和所述视频的比特流表示之间的转换;以及
基于冗余候选在所述HMVP表中的位置,用运动候选更新所述表,其中所述运动候选是从在所述转换期间推导的运动信息推导的,并且所述冗余候选与所述运动候选相同或类似。
19.根据权利要求1所述的方法,其中,执行转换至少部分基于所述HMVP表。
20.根据权利要求18或19所述的方法,其中,如果所述冗余候选与所述HMVP表中等于N的索引相关联,则所述冗余候选首先被修改并存储在所述表中,N是整数。
21.根据权利要求20所述的方法,其中,N=0或L-1,其中L是所述HMVP表的尺寸。
22.根据权利要求21所述的方法,其中,与所述冗余候选相关联的运动矢量或块矢量通过添加一个或多个偏移或者被缩放来修改。
23.根据权利要求22所述的方法,其中,在更新的HMVP表中,修改的冗余候选与相同的索引N相关联。
24.一种用于视频处理的方法,包括:
维护包括至少一个运动候选的基于历史的运动矢量预测(HMVP)表;
执行视频的当前视频块和所述视频的比特流表示之间的转换;以及
通过将运动候选添加到所述HMVP表中的第K个条目来更新所述表,其中添加到所述HMVP表中的运动候选是从在所述转换期间推导的运动信息推导的,并且,K是正整数并基于预定规则来确定。
25.根据权利要求24所述的方法,其中,执行转换至少部分基于所述HMVP表。
26.根据权利要求24或25所述的方法,其中,所述预定规则指定K小于或等于T,其中T是已经在所述HMVP表中的候选的数量。
27.根据权利要求24所述的方法,其中,如何添加运动候选取决于HVMP表中冗余候选的索引,其中所述冗余候选与所述运动候选相同或类似。
28.根据权利要求24所述的方法,其中,所述预定规则指定K是预定义的。
29.根据权利要求28所述的方法,其中,K被设置为1。
30.根据权利要求29所述的方法,其中,所述运动候选被添加作为索引设置为(L-2)的候选,其中L是所述HMVP表的尺寸。
31.根据权利要求24所述的方法,其中,所述预定规则指定K取决于所述HMVP表的尺寸。
32.根据权利要求24所述的方法,其中,所述预定规则指定K取决于视频块的转换的一个或多个特性。
33.根据权利要求32所述的方法,其中,当所述HMVP表用于帧间编解码块时,K被设置为K0,并且当所述HMVP表用于IBC编解码块时,K被设置为K1,其中K0不等于K1。
34.根据权利要求33所述的方法,其中,当所述HMVP表用于帧内编解码块时,K被设置为等于K2,其中K2不等于K1或/和K0。
35.根据权利要求24所述的方法,其中,所述预定规则指定K取决于与所述当前视频块相关联的编解码信息、所述表已经被更新了多少次以及所述表已经被更新的次数的奇偶性中的至少一个,其中所述编解码信息包括块维度和块位置中的至少一个。
36.根据权利要求24-35中任一项所述的方法,其中,K在序列级别、视频级别、图片级别、条带级别、片级别、子图片级别、图块级别或其他视频处理单元级别中的至少一个的比特流中被信令通知。
37.根据权利要求24所述的方法,其中,对于所述HMVP表中的每个条目,变量被分配以指示与所述条目相关联的候选的频率,其中所述预定规则指定K根据所述变量来确定。
38.根据权利要求24所述的方法,其中,所述预定规则指定K即时自适应地改变。
39.根据权利要求38所述的方法,其中,对于第一视频区域,K被设置为第一值,并且对于第二视频区域,K被设置为第二值,其中所述第一值和所述第二值不同。
40.根据权利要求39所述的方法,其中,所述第一值或所述第二值等于0。
41.根据权利要求24所述的方法,其中,所述预定规则指定K取决于修剪结果,所述修剪结果指示在被更新之前,所述HMVP表中是否有一个相同或类似的候选。
42.一种用于视频处理的方法,包括:
维护包括至少一个运动候选的基于历史的运动矢量预测(HMVP)表;
执行视频的视频块的视频处理单元和所述视频的比特流表示之间的转换;以及
基于与所述视频处理单元相关联的一个或多个规则来更新所述HMVP表,其中所述规则从一个视频处理单元到另一个视频处理单元而改变。
43.根据权利要求42所述的方法,其中,执行转换至少部分基于所述HMVP表。
44.根据权利要求42或43所述的方法,其中,对于第一规则,应用修剪,并且对于第二规则,应用非修剪。
45.根据权利要求42或43所述的方法,其中,对于第一规则,应用部分修剪,并且对于第二规则,应用完全修剪。
46.根据权利要求42或43所述的方法,其中,所述规则根据所述视频处理单元的转换的一个或多个特性来确定。
47.根据权利要求46所述的方法,其中,所述一个或多个特性包括处理单元的预测模式。
48.根据权利要求42所述的方法,其中,所述规则基于所述视频处理单元的编解码模式信息来确定。
49.根据权利要求48所述的方法,其中,当所述HMVP表用于帧间编解码块时,所述规则从一个视频处理单元到另一个视频处理单元而改变,或者所述规则指定根据修剪结果的自适应顺序。
50.根据权利要求48所述的方法,其中,当所述HMVP表用于IBC编解码块时,所述规则是FIFO规则。
51.根据权利要求1-48中任一项所述的方法,其中,所述更新取决于与所述视频块相关联的编解码信息。
52.根据权利要求51所述的方法,其中,所述编解码信息包括编解码模式信息。
53.根据权利要求1-52中任一项所述的方法,其中,所述转换从所述比特流表示生成所述视频的视频块。
54.根据权利要求1-52中任一项所述的方法,其中,所述转换从所述视频的视频块生成所述比特流表示。
55.一种视频系统中的装置,包括处理器和其上具有指令的非暂时性存储器,其中所述指令在由所述处理器执行时使所述处理器实施根据权利要求1至54中任一项所述的方法。
56.一种存储在非暂时性计算机可读介质上的计算机程序产品,所述计算机程序产品包括用于执行根据权利要求1至54中任一项所述的方法的程序代码。
57.一种存储比特流表示的非暂时性计算机可读记录介质,所述比特流表示通过由视频处理装置执行的根据权利要求1-54中任一项所述的方法生成。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2019123670 | 2019-12-06 | ||
CNPCT/CN2019/123670 | 2019-12-06 | ||
PCT/CN2020/134287 WO2021110170A1 (en) | 2019-12-06 | 2020-12-07 | Updating of hmvp tables |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114747218A true CN114747218A (zh) | 2022-07-12 |
Family
ID=76221508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080084219.8A Pending CN114747218A (zh) | 2019-12-06 | 2020-12-07 | Hmvp表的更新 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114747218A (zh) |
WO (1) | WO2021110170A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118476221A (zh) * | 2021-10-28 | 2024-08-09 | 抖音视界有限公司 | 用于视频处理的方法、装置和介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10362330B1 (en) * | 2018-07-30 | 2019-07-23 | Tencent America LLC | Combining history-based motion vector prediction and non-adjacent merge prediction |
US10440378B1 (en) * | 2018-07-17 | 2019-10-08 | Tencent America LLC | Method and apparatus for history-based motion vector prediction with parallel processing |
CN110460859A (zh) * | 2019-08-21 | 2019-11-15 | 浙江大华技术股份有限公司 | 历史运动矢量列表的使用方法、编解码器及存储装置 |
WO2019223746A1 (en) * | 2018-05-23 | 2019-11-28 | Mediatek Inc. | Method and apparatus of video coding using bi-directional cu weight |
CN110536140A (zh) * | 2018-09-20 | 2019-12-03 | 北京达佳互联信息技术有限公司 | 视频编码方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10887597B2 (en) * | 2015-06-09 | 2021-01-05 | Qualcomm Incorporated | Systems and methods of determining illumination compensation parameters for video coding |
US10491902B1 (en) * | 2018-07-16 | 2019-11-26 | Tencent America LLC | Method and apparatus for history-based motion vector prediction |
-
2020
- 2020-12-07 WO PCT/CN2020/134287 patent/WO2021110170A1/en active Application Filing
- 2020-12-07 CN CN202080084219.8A patent/CN114747218A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019223746A1 (en) * | 2018-05-23 | 2019-11-28 | Mediatek Inc. | Method and apparatus of video coding using bi-directional cu weight |
US10440378B1 (en) * | 2018-07-17 | 2019-10-08 | Tencent America LLC | Method and apparatus for history-based motion vector prediction with parallel processing |
US10362330B1 (en) * | 2018-07-30 | 2019-07-23 | Tencent America LLC | Combining history-based motion vector prediction and non-adjacent merge prediction |
CN110536140A (zh) * | 2018-09-20 | 2019-12-03 | 北京达佳互联信息技术有限公司 | 视频编码方法及装置 |
CN110460859A (zh) * | 2019-08-21 | 2019-11-15 | 浙江大华技术股份有限公司 | 历史运动矢量列表的使用方法、编解码器及存储装置 |
Non-Patent Citations (1)
Title |
---|
LI ZHANG: "CE4: History-based Motion Vector Prediction (Test 4.4.7)", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 12TH MEETING: MACAO, CN, 3–12 OCT. 2018》, 2 October 2018 (2018-10-02), pages 2 * |
Also Published As
Publication number | Publication date |
---|---|
WO2021110170A1 (en) | 2021-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113383554B (zh) | LUT和共享Merge列表之间的交互 | |
CN111064961B (zh) | 视频处理方法和装置 | |
US11871023B2 (en) | Multi-motion model based video coding and decoding | |
CN113170183B (zh) | 用于具有几何分割的帧间预测的修剪方法 | |
US11962799B2 (en) | Motion candidates derivation | |
CN112970253B (zh) | 用于预测的运动候选列表构建 | |
CN113261290B (zh) | 基于修改历史的运动预测 | |
CN113228635B (zh) | 用于帧内块复制的运动候选列表构建方法 | |
CN113906738B (zh) | 仿射模式的自适应运动矢量差分辨率 | |
CN113273186A (zh) | Lut更新的调用 | |
KR20230003061A (ko) | 모션 정밀 신택스을 위한 엔트로피 코딩 | |
CN113196777B (zh) | 用于运动补偿的参考像素填充 | |
WO2021110170A1 (en) | Updating of hmvp tables | |
CN112997496B (zh) | 仿射预测模式的改进 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |