CN114128263A - 用于视频编解码中的自适应运动矢量分辨率的方法和设备 - Google Patents
用于视频编解码中的自适应运动矢量分辨率的方法和设备 Download PDFInfo
- Publication number
- CN114128263A CN114128263A CN202080049390.5A CN202080049390A CN114128263A CN 114128263 A CN114128263 A CN 114128263A CN 202080049390 A CN202080049390 A CN 202080049390A CN 114128263 A CN114128263 A CN 114128263A
- Authority
- CN
- China
- Prior art keywords
- current
- interpolation filter
- affine
- filter
- resolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000033001 locomotion Effects 0.000 title claims abstract description 121
- 238000000034 method Methods 0.000 title claims abstract description 67
- 239000013598 vector Substances 0.000 title claims abstract description 48
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 22
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims abstract description 162
- 238000005192 partition Methods 0.000 claims abstract description 71
- 230000011664 signaling Effects 0.000 claims abstract description 28
- 230000004044 response Effects 0.000 claims description 14
- 241000723655 Cowpea mosaic virus Species 0.000 claims 3
- 238000010586 diagram Methods 0.000 description 34
- 239000000523 sample Substances 0.000 description 29
- 238000013461 design Methods 0.000 description 23
- 230000002123 temporal effect Effects 0.000 description 18
- 230000008569 process Effects 0.000 description 14
- 238000012545 processing Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000000638 solvent extraction Methods 0.000 description 10
- 241000023320 Luma <angiosperm> Species 0.000 description 7
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 7
- 238000013139 quantization Methods 0.000 description 7
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000013074 reference sample Substances 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/523—Motion estimation or motion compensation with sub-pixel accuracy
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/527—Global motion vector estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/53—Multi-resolution motion estimation; Hierarchical motion estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
提供了一种用于视频编解码的方法。所述方法包括:由解码器确定当前编解码单元(CU)处于仿射模式或三角形分区模式;并且由所述解码器获得自适应运动矢量分辨率(AMVR)信令,所述AMVR信令指示从包括二分之一像素运动矢量差(MVD)分辨率的分辨率列表中选择所述当前CU的MVD分辨率。
Description
相关申请的交叉引用
本申请要求于2019年8月12日提交的申请号为62/885,812、题为“Methods andApparatus on Adaptive Motion Vector Resolution”的美国临时申请的优先权,其全部内容通过引用并入本文用于所有目的。
技术领域
本申请总体涉及视频编解码和压缩,并且具体地,但不限于用于视频编解码中的自适应运动矢量分辨率(AMVR)的方法和设备。
背景技术
数字视频由多种电子设备支持(诸如数字电视、膝上型计算机或台式计算机、平板计算机、数码相机、数字记录设备、数字媒体播放器、视频游戏控制台、智能电话、视频电话会议设备、视频流式传输设备等)。电子设备通过实现视频压缩/解压缩来发送、接收、编码、解码和/或存储数字视频数据。数字视频设备实现视频编解码技术,诸如由通用视频编解码(VVC)、联合探索测试模型(JEM)、MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4、第10部分、高级视频编解码(AVC)、ITU-TH.265/高效视频编解码(HEVC)定义的标准和此类标准的扩展中描述的那些技术。
视频编解码通常利用借助视频图像或序列中存在的冗余的预测方法(例如,帧间预测、帧内预测)。视频编解码技术的重要目标是在避免或最小化视频质量劣化时将视频数据压缩成使用更低比特率的形式。随着不断发展的视频服务变得可用,需要具有更好编解码效率的编码技术。
视频压缩通常包括执行空间(帧内)预测和/或时间(帧间)预测以减少或去除视频数据中固有的冗余。对于基于块的视频编解码,将视频帧分割成一个或多个条带,每个条带具有也可被称作编解码树单元(CTU)的多个视频块。可使用具有嵌套多类型树结构的四叉树将CTU分割成编解码单元(CU),其中CU定义共享相同预测模式的像素的区域。每个CTU可包含一个编解码单元(CU)或递归地被分割成更小的CU,直到达到预定义的最小CU尺寸为止。每个CU(也称为叶CU)包含一个或多个变换单元(TU)并且每个CU还包含一个或多个预测单元(PU)。每个CU可以以帧内模式、帧间模式或IBC模式被编解码。使用针对相同视频帧内的相邻块中的参考样点的空间预测来编码视频帧的帧内编解码的(I)条带中的视频块。视频帧的帧间编解码的(P或B)条带中的视频块可使用针对相同视频帧内的相邻块中的参考样点的空间预测或针对其它先前和/或未来的参考视频帧中的参考样点的时间预测。
在本公开的一些示例中,术语“单元”定义图像的覆盖所有分量(诸如亮度和色度)的区域;术语“块”用于定义覆盖特定分量(例如,亮度)的区域,并且当考虑色度采样格式(诸如4:2:0)时,不同分量(例如,亮度对色度)的块可在空间位置上不同。
基于先前被编码的参考块(例如,相邻块)的空间预测或时间预测产生将被编解码的当前视频块的预测块。可以通过块匹配算法来完成找到参考块的过程。表示将被编解码的当前块与预测块之间的像素差的残差数据被称作残差块或预测误差。根据指向形成预测块的参考帧中的参考块的运动矢量和残差块来编码帧间编解码块。确定运动矢量的过程通常被称为运动估计。根据帧内预测模式和残差块来编码帧内编解码的块。为了进一步压缩,将残差块从像素域变换到变换域(例如,频域),从而产生随后可被量化的残差变换系数。最初布置成二维阵列的量化的变换系数可被扫描以产生一维矢量的变换系数,并且随后被熵编码成视频比特流以实现甚至更多压缩。
随后将编码的视频比特流保存在计算机可读存储介质(例如,闪存)中,以由具有数字视频能力的另一电子设备存取或者被有线地或无线地直接发送到电子设备。电子设备随后通过例如解析编码的视频比特流以从比特流获得语义元素并且至少部分地基于从比特流获得的语义元素从编码的视频比特流将数字视频数据重建为其原始格式,执行视频解压缩(与以上描述的视频压缩相反的过程),并且将重建的数字视频数据渲染在电子设备的显示器上。
随着数字视频质量从高清晰度变为4K×2K或甚至8K×4K,将被编码/解码的视频数据量呈指数增长。在如何在保持解码的视频数据的图像质量的同时更有效地编码/解码视频数据方面,这是一个持续的挑战。
发明内容
一般来说,本公开描述与视频编解码中的自适应运动矢量分辨率(AMVR)相关的技术的示例。
根据本公开的第一方面,提供了一种用于视频编解码的方法,所述方法包括:由解码器确定当前编解码单元(CU)处于仿射模式或三角形分区模式;并且由所述解码器获得自适应运动矢量分辨率(AMVR)信令,所述AMVR信令指示从包括二分之一像素(pel)运动矢量差(MVD)分辨率的分辨率列表中选择所述当前CU的MVD分辨率。
根据本公开的第二方面,提供了一种用于视频编解码的设备,所述设备包括:一个或多个处理器;以及存储器,被配置为存储可由所述一个或多个处理器执行的指令;其中,所述一个或多个处理器在执行所述指令时被配置为:确定当前编解码单元(CU)是仿射模式或三角形分区模式;并且获得自适应运动矢量分辨率(AMVR)信令,其中,所述AMVR信令指示从包括二分之一像素运动矢量差(MVD)分辨率的分辨率列表中选择所述当前CU的MVD分辨率。
根据本公开的第三方面,提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质包括存储在其中的指令,其中,在由一个或多个处理器执行所述指令时,所述指令使所述一个或多个处理器执行操作,所述操作包括:确定当前编解码单元(CU)是仿射模式或三角形分区模式;并且获得自适应运动矢量分辨率(AMVR)信令,其中,所述AMVR信令指示从包括二分之一像素运动矢量差(MVD)分辨率的分辨率列表中选择所述当前CU的MVD分辨率。
附图说明
将通过参照附图中所示的具体示例来呈现本公开的示例的更详细的描述。鉴于这些附图仅描绘了一些示例,并且因此不被认为是对范围的限制,将通过使用附图利用附加的特征和细节来描述和解释示例。
图1是示出根据本公开的一些实施方式的示例性视频编码器的框图。
图2是示出根据本公开的一些实施方式的示例性视频解码器的框图。
图3是示出根据本公开的一些实施方式的多类型树结构中的块分区的示例的示图。
图4是示出根据本公开的一些实施方式的4参数仿射模型的示例的示图。
图5是示出根据本公开的一些实施方式的6参数仿射模型的示例的示图。
图6是示出根据本公开的一些实施方式的用于形成继承的仿射合并候选的相邻块的位置的示图。
图7是示出根据本公开的一些实施方式的从当前仿射CU的空间相邻仿射块的CPMV导出当前仿射CU的CPMV的示例的示图。
图8是示出根据本公开的一些实施方式的用于导出构建的仿射候选的相邻块的位置的示图。
图9是示出根据本公开的一些实施方式的三角形分区的示例的示图。
图10是示出根据本公开的一些实施方式的用于三角形模式的合并候选的单向预测运动选择的示例的示图。
图11是示出根据本公开的一些实施方式的用于产生三角形模式CU的运动场的示例的示图。
图12是示出根据本公开的一些实施方式的二分之一像素插值滤波器使用继承的示例的示图。
图13是示出根据本公开的一些实施方式的使用备选二分之一像素滤波器的基于子块的仿射运动补偿的示例的示图。
图14是示出根据本公开的一些实施方式的切换用于三角形模式的二分之一像素插值滤波器的示例的示图。
图15是示出根据本公开的一些实施方式的两个去噪滤波器的频率响应的示图。
图16是示出根据本公开的一些实施方式的用于在假设MV等于(1/2,1)的情况下应用整数像素去噪滤波器的方法的示图。
图17是示出根据本公开的一些实施方式的用于视频编解码的示例性装置的框图。
图18是示出根据本公开的一些实施方式的视频编解码中的自适应运动矢量分辨率(AMVR)的示例性过程的流程图。
具体实施方式
现在将详细参照具体实施方式,在附图中示出具体实施方式的示例。在以下详细描述中,阐述了很多非限制性具体细节以便帮助理解本文呈现的主题。但是对于本领域普通技术人员将显而易见的是,可以使用各种替代方案。例如,对于本领域普通技术人员将显而易见的是,本文呈现的主题可以在具有数字视频能力的许多类型的电子设备上实现。
本公开中使用的术语仅用于描述示例性示例的目的,并不旨在限制本公开。如在本公开和所附权利要求中使用的,单数形式“一”、“一个”和“该”也旨在包括复数形式,除非上下文另有明确说明。还应当理解,本文使用的术语“或”和“和/或”旨在表示和包括一个或多个相关联的所列项目的任何或所有可能的组合,除非上下文另有明确说明。
贯穿本说明书对“一个实施例”、“实施例”、“示例”、“一些实施例”、“一些示例”或类似语言的引用表示所描述的特定特征、结构或特性被包括在至少一个实施例或示例中。除非另有明确说明,否则结合一个或一些实施例描述的特征、结构、元件或特性也适用于其它实施例。
在整个公开内容中,除非另有明确说明,否则术语“第一”、“第二”、“第三”等都用作仅用于提及相关元件(例如,设备、组件、组合物、步骤等)的命名,而不指示任何空间或时间顺序。例如,“第一设备”和“第二设备”可以指两个单独形成的设备,或者同一设备的两个部分、组件或操作状态,并且可以被任意命名。
如本文所使用的,取决于上下文,术语“如果”或“当......时”可以被理解为表示“在......时”或“响应于......”。这些术语如果出现在权利要求中,则可以不指示相关限制或特征是有条件的或可选的。
术语“模块”、“子模块”、“电路”、“子电路”、“电路系统”、“子电路系统”、“单元”或“子单元”可以包括存储可以由一个或多个过程器执行的代码或指令的存储器(共享、专用或组合)。模块可以包括具有或不具有存储的代码或指令的一个或多个电路。模块或电路可以包括直接或间接连接的一个或多个组件。这些组件可以或可以不物理地附接到彼此或彼此相邻定位。
单元或模块可以纯粹通过软件、纯粹通过硬件或通过硬件和软件的组合来实现。在纯软件实施方式中,例如,单元或模块可以包括直接或间接链接在一起的功能上相关的代码块或软件组件,以便执行特定功能。
图1展示了示出可以与使用基于块的过程的许多视频编解码标准结合使用的示例性的基于块的混合视频编码器100的框图。在编码器100中,视频帧被分割为多个视频块以进行处理。对于每个给定视频块,基于帧间预测方法或帧内预测方法来形成预测。在帧间预测中,基于来自先前重建帧的像素,通过运动估计和运动补偿来形成一个或多个预测因子。在帧内预测中,基于当前帧中的重建像素来形成预测因子。通过模式决策,可以选择最佳预测因子来预测当前块。
表示当前视频块与其预测因子之间的差的预测残差被发送到变换电路102。然后变换系数从变换电路102被发送到量化电路104以用于熵减少。然后量化的系数被馈送到熵编解码电路106以产生压缩的视频比特流。如图1所示,来自帧间预测电路和/或帧内预测电路112的预测相关信息110(诸如视频块分区信息、运动矢量、参考图片索引和帧内预测模式)也通过熵编解码电路106被馈送并保存到压缩的视频比特流114中。
在编码器100中,为了预测的目的,还需要解码器相关电路以便重建像素。首先,通过反量化116和逆变换电路118重建预测残差。该重建的预测残差与块预测因子120组合以产生当前视频块的未经滤波的重建像素。
空间预测(或“帧内预测”)使用来自与当前视频块在相同视频帧中的已被编解码的相邻块的样点(被称为参考样点)的像素来预测当前视频块。
时间预测(也被称作“帧间预测”)使用来自已被编解码的的视频图片的重建的像素来预测当前视频块。时间预测减少了视频信号中固有的时间冗余。通常通过指示当前CU与其时间参考之间的运动量和方向的一个或多个运动矢量(MV)用信号发送给定编解码单元(CU)或编解码块的时间预测信号。此外,如果支持多个参考图片,则另外发送一个用于识别时间预测信号来自参考图片存储器中的哪个参考图片的参考图片索引。
在执行空间预测和/或时间预测之后,编码器100中的帧内/帧间模式判定电路121例如基于率失真优化方法来选择最佳预测模式。然后从当前视频块减去块预测因子120;并且使用变换电路102和量化电路104对得到的预测残差进行去相关。得到的量化的残差系数由反量化电路116反量化且由逆变换电路118逆变换以形成重建的残差,接着将重建的残差加回到预测块以形成CU的重建的信号。在将重建的CU放入图片缓冲器117的参考图片存储器中并用于编解码未来视频块之前,可对重建的CU进一步应用环路滤波115(诸如去块滤波器、样点自适应偏移(SAO)和/或自适应环路滤波器(ALF))。为了形成输出视频比特流114,编码模式(帧间或帧内)、预测模式信息、运动信息和量化的残差系数都被发送到熵编解码单元106,以进一步被压缩和打包以形成比特流。
例如,去块滤波器在AVC、HEVC以及当前版本的VVC中可用。在HEVC中,定义被称为SAO(样点自适应偏移)的附加环路滤波器以进一步提高编码效率。正在积极研究称为ALF(自适应环路滤波器)的另一环路滤波器。
这些环路滤波器操作是可选的。执行这些操作有助于提高编码效率和视觉质量。它们也可以被关闭,作为由编码器100做出的节省计算复杂度的决定。
应当注意,如果编码器100打开这些滤波器选项,则帧内预测通常基于未经滤波的重建像素,而帧间预测基于经滤波的重建像素。
图2是示出可以与许多视频编解码标准结合使用的示例性的基于块的视频解码器200的框图。该解码器200类似于驻留在图1的编码器100中的重建相关部分。在解码器200中,首先输入的视频比特流201通过熵解码202被解码,以导出量化的系数等级和预测相关信息。然后量化的系数等级通过反量化204和逆变换206被处理,以获得重建的预测残差。在帧内/帧间模式选择器212中实现的块预测因子机制被配置为基于解码的预测信息来执行帧内预测208或运动补偿210。通过使用求和器214将来自逆变换206的重建预测残差和通过块预测因子机制产生的预测输出求和以获得一组未经滤波的重建像素。
在将重建块存储在用作参考图片存储器的图片缓冲器213中之前,重建块可以进一步通过环路滤波器209。图片缓冲器213中的重建视频可以被发送以驱动显示设备,以及用于预测未来的视频块。在打开环路滤波器209的情况下,对这些重建的像素执行滤波操作以导出最终重建的视频输出222。
以上提及的视频编解码/解码标准(诸如VVC、JEM、HEVC、MPEG-4、第10部分)在概念上是类似的。例如,它们都使用基于块的处理。在联合视频专家组(JVET)会议中,JVET定义了通用视频编解码(VVC)和VVC测试模型1(VTM1)编码方法的第一草案。决定包括具有使用二元分割和三元分割编解码块结构作为VVC的初始新编解码特征的嵌套多类型树的四叉树。
与HEVC一样,VVC建立在基于块的混合视频编解码框架上。在VTM-1.0中,CU可以高达128×128像素。然而,与仅基于四叉树分割块的HEVC不同,在VVC中,一个编解码树单元(CTU)基于四叉树/二叉树/三叉树被分割成CU以适应变化的局部特性。另外,HEVC中的多个分区单元类型的概念被去除,即,CU、预测单元(PU)和变换单元(TU)的分离不再存在于VVC中;相反,每个CU总是用作用于预测和变换两者的基本单元,而无需进一步的分割。在多类型树结构中,首先通过四叉树结构分割一个CTU。接着,还可通过二叉树或三叉树结构分割每个四叉树叶节点。图3是示出多类型树结构中的块分区的示例的示图。存在五种分区类型:(a)四元分区;(b)垂直二元分区;(c)水平二元分区;(d)垂直三元分区;(e)水平三元分区。
仿射模式
在HEVC中,仅平移运动模型被应用于运动补偿预测。然而,在现实世界中,存在许多种类的运动(例如,放大/缩小、旋转、透视运动和其他不规则运动)。在VVC中,通过针对每个帧间编解码块用信号发送一个标志以指示是否将平移运动或仿射运动模型应用于帧间预测,支持仿射运动补偿预测。在当前VVC设计中,针对一个仿射编解码块支持包括4参数仿射模型和6参数仿射模型的两个仿射模型。
图4是示出4参数仿射模型的示例的示图;图5是示出6参数仿射模型的示例的示图。
4参数仿射模型具有以下参数:分别用于水平方向和垂直方向上的平移移动的两个参数、用于两个方向的缩放运动的一个参数和用于两个方向的旋转运动的一个参数。水平缩放参数等于垂直缩放参数;并且水平旋转参数等于垂直旋转参数。为了实现运动矢量和仿射参数的更好适应,在VVC中,将那些仿射参数转换成位于当前块的左上角和右上角的两个MV(也被称为控制点运动矢量(CPMV))。如图4中所示,块的仿射运动场由两个控制点MV(v0,v1)描述。基于控制点运动,一个仿射编解码块的运动场(vx,vy)由以下等式描述:
6参数仿射模型具有以下参数:分别用于水平方向和垂直方向上的平移移动的两个参数;用于水平方向上的缩放运动的一个参数和用于水平方向上的旋转运动的一个参数;用于垂直方向上的缩放运动的一个参数和用于垂直方向上的旋转运动的一个参数。6参数仿射运动模型利用也可被称作三个CPMV的三个MV被编解码。如图5中所示,一个6参数仿射块的三个控制点位于块的左上角、右上角和左下角。左上方控制点处的运动与平移运动相关,并且右上方控制点处的运动与水平方向上的旋转运动和缩放运动相关,并且左下方控制点处的运动与垂直方向上的旋转运动和缩放运动相关。与4参数仿射运动模型相比,6参数仿射运动模型的水平方向上的旋转运动和缩放运动可与垂直方向上的那些运动不同。假设在图5中(v0,v1,v2)是当前块的左上角、右上角和左下角处的MV,则通过以下等式使用控制点处的三个MV导出每个子块(vx,vy)的运动矢量:
在VVC中,仿射编解码块的CPMV存储于单独缓冲器中。存储的CPMV仅用于在仿射合并模式(即,从相邻仿射块的仿射CPMV继承仿射CPMV)和仿射显式模式(即,根据基于预测的方案用信号发送仿射CPMV)下产生仿射CPMV预测因子。在这些仿射模式下,从CPMV导出的子块MV用于运动补偿、平移MV的MV预测和去块。
为避免由于对CPMV的附加存储请求的图片线缓冲器尺寸增大,来自位于上方CTU中的编解码块的仿射运动数据继承被与来自位于相同CTU中的相邻块的仿射运动数据继承不同地对待。具体地,对于当前CU,如果用于仿射运动数据继承的空间相邻CU位于上方CTU中,则线缓冲器中的子块MV而非上方CTU中的CPMV被用于当前CU的仿射MV预测因子(MVP)导出。以这种方式,CPMV仅存储在本地缓冲器中而不是存储在线缓冲器中。如果使用6参数仿射模型编解码候选CU,则仿射模型降级为4参数模型。
仿射合并模式
仿射合并模式可以应用于宽度和高度两者都不小于8(即,大于或等于8)的CU。当应用仿射合并模式时,一个当前CU的CPMV基于其空间相邻CU的运动信息来产生。可存在多达五个仿射合并候选,并且用信号发送索引以指示在解码器处使用哪一个仿射合并候选。以下三种类型的候选用于形成仿射合并候选列表:
1)从相邻CU的CPMV推测的继承仿射合并候选;
2)使用相邻CU的平移MV导出的构建的仿射合并候选(或CPMV预测因子(CPMVP));以及
3)零MV。
图6是示出根据本公开的一些实施方式的用于形成继承的仿射合并候选的相邻块的位置的示图。在VVC中,最多存在从相邻仿射CU的CPMV导出的两个继承的仿射候选,其中,一个继承的仿射候选来自左侧相邻CU并且一个继承的仿射候选来自上方相邻CU。在当前块602的空间合并候选的导出中,在位于如图6所示的位置的候选中选择多个合并候选。对于左侧预测因子,扫描顺序是A0->A1,并且对于上方预测因子,扫描顺序是B0->B1->B2。仅选择来自每一侧的第一个继承候选。
图7是示出从当前仿射CU 710的空间相邻仿射块720的CPMV导出当前仿射CU710的CPMV的示例的示图。当相邻CU为仿射块时,其CPMV用于导出当前CU 710的CPMV。如图7中所示,当相邻左下方块A以仿射模式被编解码时,获得块A所属的CU的左上角、右上角和左下角的运动矢量v2、v3和v4。当块A通过4参数仿射模型被编解码时,将通过4参数仿射模型编解码当前CU 710,并且相应地从v2和v3计算当前CU 710的两个CPMV。在块A通过6参数仿射模型被编解码的情况下,将通过6参数仿射模型编解码当前CU 710并且从v2、v3和v4计算当前CU710的三个CPMV。
图8是示出根据本公开的一些实施方式的用以导出构建的仿射候选的相邻块的位置的示图。与继承的仿射候选不同,通过组合控制点位置处的相邻块的平移运动信息来产生构建的仿射候选。根据当前设计,图8中所示的空间相邻块和时间相邻块的运动信息用于导出构建的仿射候选的CPMV。CPMVk(k=1,2,3,4)表示当前块的第k个控制点。对于CPMV1,按顺序检查B2->B3->A2块,并使用第一个可用块的MV。同样地,对于CPMV2,按顺序检查B1→B0块,并且对于CPMV3,检查A1→A0块。对于CPMV4,如果时间运动矢量预测因子(TMVP)候选(即,T)可用,则使用TMVP候选。
仿射CPMV预测
在VVC中,仿射非合并模式可以应用于宽度和高度两者大于或等于16的编解码块。对于仿射非合并模式,在CU的比特流中用信号发送多达四个CPMV或六个CPMV(取决于应用4参数仿射模型还是6参数仿射模型)。具体地,首先用信号发送CU等级中的一个仿射标志以指示是否使用仿射模式。随后,用信号发送另一标志以在4参数仿射模型与6参数仿射模型之间进行选择。仿射CPMV候选列表尺寸为2,并且仿射CPMV候选列表通过根据以下顺序使用四种类型的CPMV候选而产生:
1)从相邻编解码块的CPMV推测的继承的仿射CPMV候选;
2)使用相邻4×4子块的MV导出的构建的仿射CPMV候选;
3)来自相邻编解码块的平移MV;以及
4)零MV。
另外,为了减少信令开销,将每个CPMV与其预测因子之间的差从编码器用信号发送到解码器。MV与其预测因子之间的差被称为运动矢量差(或MVD)。MVD包括x分量MV差和y分量MV差。由于4参数仿射模型具有两个CPMV,因此针对单向预测仿射块用信号发送两个MVD,并且针对双向预测仿射块用信号发送四个MVD。另一方面,假定6参数仿射模型具有三个CPMV,则分别针对单向预测仿射块用信号发送三个MVD并且针对双向预测仿射块用信号发送六个MVD。
三角形分区模式
在VVC中,针对帧间预测支持三角形预测单元分区方案。三角形分区模式仅应用于8×8或更大的CU。在当前设计中,将三角形分区模式作为一个特殊合并模式用信号发送。
图9是示出根据本公开的一些实施方式的三角形分区的示例的示图。当应用三角形模式时,使用如图9中所示的对角线分割910或反对角线分割920将一个CU均匀地分割成两个三角形分区。CU中的每个三角形分区利用其自身的运动信息(即,一个MV和一个参考索引)被单向预测。在三角形模式的当前设计中,从常规合并候选产生过程产生每个三角形分区的运动信息。具体地,在用信号发送方向标志以指示应用对角线分区或反对角线分区之后,还用信号发送两个合并索引(每个三角形分区一个合并索引)。另外,可对一个合并候选进行双向预测(即,具有L0运动和L1运动两者),并且可仅选择一个方向上的运动作为一个三角形分区的运动信息。
图10是示出根据本公开的一些实施方式的用于三角形模式的合并候选的单向预测运动选择的示例的示图。根据VVC规范,选择L0运动和L1运动的顺序基于其合并索引奇偶性。更具体地,如图10中所示,对于具有偶数索引的合并候选,首先选择其L0运动矢量以用于三角形预测。如果其不可用,则将替代地使用其L1运动矢量。可选地,对于具有奇数索引的候选,首先选择其L1运动矢量以用于三角形预测。如果其不可用,则将替代地使用其L0运动矢量。在预测每个三角形分区之后,使用具有自适应权重的融合处理来调整沿着对角线边缘或反对角线边缘的样点值。
与其它帧间块类似,每个三角形CU的运动存储于4×4单元中。图11是示出根据本公开的一些实施方式的用于产生三角形模式CU的运动场的示例的示图。假设应用对角线分区(如图9的左侧部分910所示),(Mv1,refIdx1)和(Mv2,refIdx2)分别用于表示如图11所示的分区1和分区2的单向预测运动信息。如果4×4单元位于非加权区域(例如,图11中的暗区域和空白区域)中,则依据该区域所属的分区针对该4×4单元存储(Mv1,refIdx1)或(Mv2,refIdx2)。否则,如果4×4单元在加权区域(例如,图11中的灰色区域)中,则根据以下过程从(Mv1,refIdx1)和(Mv2,refIdx2)导出将被存储的运动信息:
1)如果Mv1和Mv2来自不同的参考图片列表(一个来自L0并且另一个来自L1),则(Mv1,refIdx1)和(Mv2,refIdx2)被简单地组合以形成双向预测运动;
2)否则,如果Mv1和Mv2来自相同列表,则存储单向预测运动(Mv2,refIdx2)。
自适应运动矢量分辨率
在HEVC中,帧间非合并模式编解码块的MVD总是以四分之一像素为单位被用信号发送。在VVC中,引入称为自适应运动矢量分辨率(AMVR)的一个帧间编解码工具以减少MVD信令开销。具体地,AMVR允许以各种分辨率编解码一个帧间非合并块的MVD。根据当前编解码块是以常规帧间非合并模式还是仿射非合并模式被编解码,可自适应地选择编解码块的MVD的分辨率。对于以常规帧间非合并模式编解码的编解码块,可以选择四分之一像素、二分之一像素、整数像素或四像素的分辨率。对于以仿射非合并模式编解码的编解码块,可选择四分之一像素、十六分之一像素或整数像素的分辨率。
基于现有AMVR设计,如果当前编解码块具有至少一个非零MVD分量,则有条件地用信号发送一个AMVR指示标志。如果所有MVD分量(即,用于常规帧间非合并模式的列表L0和L1中的水平MVD和/或垂直MVD,或用于仿射非合并模式的所有CPMV的列表L0和L1中的水平MVD和/或垂直MVD)为零,则推断四分之一像素MVD分辨率。
因为允许的MVD分辨率的集合对于常规帧间模式和仿射模式是不同的,所以应用两种不同的方法来选择两种模式的MVD分辨率。具体地,对于一个常规帧间非合并编解码块,如果其具有至少一个非零MVD,则用信号发送第一标志amvr_flag以指示四分之一像素MVD分辨率是否用于编解码块。如果第一标志为0,则不用信号发送进一步的语义并且四分之一像素MVD分辨率用于当前块。否则,用信号发送第二标志hpel_amvr_flag以指示编解码块的MVD是否以二分之一像素分辨率被编解码。如果第二标志等于0,则不需要用信号发送其它语义元素并且二分之一像素MVD分辨率用于编解码的块。否则,用信号发送第三标志amvr_precision_flag以指示整数像素还是四像素MVD分辨率用于块。另一方面,对于仿射非合并编解码块,因为仅允许三个MVD分辨率(即,四分之一像素MVD分辨率、十六分之一像素MVD分辨率和整数像素MVD分辨率),所以仅需要用信号发送两个控制标志(即,amvr_flag和amvr_precision_flag)以指示选择的MVD分辨率。首先用信号发送标志amvr_flag以指示四分之一像素MVD分辨率是否用于当前仿射块。如果标志等于0,则以四分之一像素分辨率用信号发送当前仿射块的CPMV的MVD。否则,用信号发送标志amvr_precision_flag以指示十六分之一像素还是整数像素MVD分辨率用于仿射块。为了确保重建的MV具有与对应MVD相同的分辨率,在产生最终MV和/或CPMV之前,用于常规帧间非合并模式的MV预测因子和仿射非合并模式的CPMV预测预测因子将被四舍五入到与对应MVD的分辨率相同的分辨率。下表1示出选择具有码字集(即,二进制位串)的示例的常规非合并模式和仿射非合并模式的MVD分辨率的不同方法。
表1常规非合并模式和仿射非合并模式的MVD分辨率
另外,当针对一个常规非合并块选择了二分之一像素MVD分辨率时,使用一个备选6抽头高斯插值滤波器(例如,具有系数[3,9,20,20,9,3])在二分之一像素样点位置处产生亮度样点,而不是使用默认8抽头插值滤波器(例如,具有系数[-1,4,-11,40,40,-11,4,-1])。此外,在常规合并模式的情况下,除了从空间相邻块导出运动信息(即,参考图片索引和MV)之外,还从对应空间相邻块继承使用哪个插值滤波器(即,默认8抽头滤波器或备选6抽头滤波器)插值CU的二分之一像素亮度样点的信息。
图12是示出根据本公开的一些实施方式的二分之一像素插值滤波器使用继承的示例的示图。如图12中所示,尽管当前CU的空间相邻块A和B的MV处于二分之一像素精度(例如,),但应用不同插值滤波器来产生对应亮度分数样点。基于当前二分之一像素AMVR设计,如果选择的合并候选是块A(如merge_idx所指示),则将使用备选6抽头滤波器来产生二分之一像素亮度预测样点;否则,如果选择块B,则使用默认8抽头插值滤波器来以二分之一像素精度形成亮度预测样点。
AMVR工具可通过提供运动补偿的效率与MVD信令开销之间的更好权衡而提高帧间编解码效率。然而,现有AMVR设计或当前AMVR设计可能具有以下问题中的一个或多个。
首先,在当前AMVR设计中,仅针对常规非合并帧间CU(常规非合并帧间模式下的CU)启用二分之一像素精度,即,仅可针对常规帧间CU启用备选6抽头插值滤波器。另一方面,一个仿射CU的运动场(即,子块的运动信息)是从其CPMV导出的。依据CPMV的对应精度和仿射CU的尺寸,可以以二分之一像素精度计算仿射CU内部的一些子块的MV。在此情况下,默认插值滤波器与二分之一像素分数位置处的备选插值滤波器之间的自适应切换可为仿射模式提供附加编解码增益。
对于在当前设计中始终假设禁用备选6抽头二分之一像素滤波器的三角形分区模式也可能存在相同的问题。从常规合并候选的单向预测运动(L0或L1)产生每个三角形分区的运动信息。如果一个三角形分区的选择的MV处于二分之一像素精度并且针对对应合并候选启用备选6抽头插值滤波器,则应用备选插值滤波器产生分区的分数预测样点可进一步提高编码效率。
其次,在当前AMVR设计中,将不同数量的允许的MVD分辨率应用于常规帧间非合并模式和仿射非合并模式,其中四个MVD分辨率(即,四分之一像素、二分之一像素、一像素和四像素)用于常规帧间非合并模式;并且三个MVD分辨率(即,四分之一像素、十六分之一像素和一像素)用于仿射非合并模式。从标准化和/或实现的角度来看,这种非统一设计可能不是最佳的。
第三,根据当前AMVR设计,当对应MV指向一个真实二分之一像素样点位置(即,水平MV分量和垂直MV分量中的至少一个指代两个连续整数样点位置之间的中点)时,仅可启用备选6抽头高斯滤波器来产生亮度预测样点。假定整数样点位置也位于二分之一像素样点位置的网格上,则二分之一像素MV精度也可用于表示整数MV。基于当前AMVR设计,当一个二分之一像素MV指向一个整数样点位置时,不应用滤波器(即,直接从对应整数参考样点复制预测样点)。然而,实际上,在存在噪声(例如,由视频捕获设备引起的噪声或在特定编码/解码过程(诸如量化/反量化)期间产生的编码噪声)的情况下,位于时间参考图片中的整数样点位置处的重建样点可能不可靠。在这种情况下,即使当一个帧间块的MV指向一个整数样点位置时,应用具有去噪效果的特定低通滤波器可能更有益。
提出了进一步提高VVC中AMVR工具的效率的方法,从而解决以上问题中的一个或多个。
为了进一步提高仿射模式的编码效率,可在仿射模式下启用备选插值滤波器以产生一个仿射CU内的子块的二分之一像素预测样点。与现有常规帧间模式类似,可在仿射模式下以二分之一像素精度执行默认插值滤波器与备选插值滤波器之间的切换。
为了提高三角形分区模式的编码效率,还可在三角形分区模式下启用备选插值滤波器来产生两个三角形分区的L0和L1单向预测样点。另外,提出导出一个三角形CU内的每个4×4单元的插值使用信息(即,默认插值滤波器或备选插值滤波器)的方法。如果当前CU使用二分之一像素MV,则来自相邻三角形分区模式块的这样的信息可用于隐式地确定哪个插值滤波器应用于当前CU的二分之一像素运动补偿的插值。
为了减少存在于特定重建视频中的编码噪声并提高预测质量,当一个帧间CU参考整数样点位置处的参考样点时,可以应用具有去噪效果的低通滤波器。提出的去噪滤波器仅被应用于亮度分量,并且在指向整数样点位置的对应MV以二分之一像素精度表示时被启用。
针对仿射模式启用备选二分之一像素插值滤波器
在现有AMVR设计中,对于所有仿射CU(包括仿射非合并CU和仿射合并CU)始终禁用二分之一像素精度。然而,这种设计可能不是最佳的。首先,基于CPMV及一个仿射CU的尺寸,CU内的一些子块的导出的MV可能落在二分之一像素样点位置上。在此情况下,可通过包括一个备选插值滤波器并且在用于仿射模式的二分之一像素位置插值的两个滤波器之间切换来预期编码效率提高,而不是始终使用默认二分之一像素插值滤波器(即,8抽头滤波器)。其次,现有设计关于常规帧间模式和仿射模式分别支持的MV分辨率的数量是不统一的。
除现有四分之一像素、十六分之一像素和整数像素精度外,还提出针对仿射模式启用二分之一像素MVD精度。表2示出用于表示在一些示例中的所得仿射MVD分辨率的一个示例性二值化方法。与表1的右侧部分相比,在表2中所示的添加了二分之一像素MVD分辨率的示例中使用四个码字集。实际上,其他二值化方法也是可能的。例如,可基于每个MVD分辨率的各自的使用来交换不同MVD分辨率的码字中的至少一些。在一个示例中,可自适应地切换码字或甚至可自适应地选择允许的MVD分辨率的数量,其可在不同编码等级(诸如序列参数集(SPS)、图片参数集(PPS)、条带和/或编解码块组)被用信号发送。在这种情况下,编码器具有动态地选择仿射模式的MVD分辨率的期望数量,将最佳码字分配给每个分辨率并且在比特流中用信号发送该信息的灵活性。
表2具有二分之一像素精度的仿射MVD分辨率
此外,为了更好地仿射编解码性能,可启用备选插值滤波器来产生位于一个仿射CU内的子块的特定位置(例如,二分之一像素)处的预测样点。在此情况下,与现有常规帧间模式类似,当MVD具有二分之一像素精度的分辨率时,执行默认插值滤波器与备选插值滤波器之间的切换。具体地,当仿射二分之一像素分辨率被选择时,备选插值滤波器可在其MV指向二分之一像素位置处的一个参考样点时被应用于一个子块的运动补偿。否则(即,仿射AMVR MVD分辨率不为二分之一像素),可应用默认8抽头插值滤波器。在一个示例中,用于常规帧间模式的相同的6抽头二分之一像素插值滤波器(即,[3,9,20,20,9,3])可用作用于仿射模式的备选二分之一像素插值滤波器。在另一示例中,其它插值滤波器(例如,具有低通特性的插值滤波器)也可适用。尽管在以上示例中使用二分之一像素分辨率MVD来选择备选插值滤波器,但在一些其它示例中,也可使用其它MVD分辨率来实现不同插值滤波器之间的切换。
如图4和图5中所示,基于特定仿射模型(即,4参数仿射模型或6参数仿射模型),一个仿射CU中的子块的MV是从该CU的两个CPMV或三个CPMV导出的。依据具体位置,各种子块可以指不同分数样点位置处的参考样点。相应地,当提出的二分之一像素MVD分辨率被应用于用信号发送一个仿射CU的CPMV时,备选滤波器仅被应用于插值MV处于二分之一像素精度的子块的预测样点。
图13是示出根据本公开的一些实施方式的使用备选二分之一像素滤波器的基于子块的仿射运动补偿的示例的示图。在图13中,假设当前CU是通过6参数仿射模型预测的,并且和是左上角、右上角和左下角处的三个CPMV。给定三个CPMV的值,四个子块A、B、C和D的MV被计算为和VD=(1,1)。当应用提出的二分之一像素MVD分辨率时,对于子块A,因为VA在水平方向和垂直方向两者上处于二分之一像素精度,所以在水平方向和垂直方向两者上应用备选滤波器来产生二分之一像素分数样点;对于子块B和子块C,在一个方向上应用备选滤波器(垂直地用于MV VB在垂直方向上处于二分之一像素精度的子块B,并且水平地用于MV VC在水平方向上处于二分之一像素精度的子块C);对于子块D,因为MV的水平分量和垂直分量两者均处于整数精度,所以不需要应用滤波器。
除了用信号发送CPMV的显式仿射模式之外,二分之一像素备选滤波器也可应用于仿射合并模式。对于继承的仿射合并候选,因为其CPMV直接从相邻仿射块的CPMV推测的,所以通过重用对应空间邻居的相同滤波器使用决定来启用备选二分之一像素插值滤波器,即,使用与用于对应空间相邻仿射块的插值滤波器相同的插值滤波器(默认滤波器或备选滤波器)来产生二分之一像素位置处的分数样点。对于构建的仿射合并候选,由于对应CPMV是从相邻块的平移运动产生的,因此可应用不同方法来确定应在二分之一像素样点位置处应用哪个插值滤波器。在一个示例中,仅当备选滤波器应用于所有选择的相邻块(即,导出CU的CPMV所涉及的块)时应用备选插值滤波器。即,只要选择的相邻块中的一个不使用备选滤波器,则默认插值滤波器(即,8抽头滤波器)将在二分之一像素样点位置处被应用于当前仿射CU。在另一示例中,提出在存在使用备选插值滤波器的至少一个选择的相邻块时启用并使用备选插值滤波器。
针对三角形分区模式启用备选二分之一像素插值滤波器
根据当前VVC规范,仅允许默认8抽头插值滤波器用于在三角形分区模式下插值二分之一像素预测样点。因为即使对应的单向预测三角形合并候选是从通过常规二分之一像素AMVR模式编解码的相邻CU导出的,也不能使用备选插值滤波器,所以现有设计不是最佳的。为了提高三角形分区模式的编码效率,在本公开中提出在产生三角形分区模式的L0和L1单向预测样点时自适应地切换二分之一像素插值滤波器。具体地,与现有三角形模式设计不同,是选择默认插值滤波器还是备选插值滤波器来产生每个三角形分区的二分之一像素单向预测样点的决定是从对应合并候选继承的。
图14是示出根据本公开的一些实施方式的切换用于三角形模式的二分之一像素插值滤波器的示例的示图。在图14中,选择合并候选#0的L0 MV和合并候选#3的L1 MV来分别产生分区1和分区2的单向预测样点。另外,还假设两个选择的MV处于二分之一像素位置,但使用不同插值。如图14中所指示,默认8抽头滤波器用于分区1,并且备选6抽头滤波器用于分区2。这也表示合并候选#0具有除二分之一像素之外的MVD分辨率,并且合并候选#3具有二分之一像素的MVD分辨率。根据本公开,在图14中所示的示例中,应用于产生分区1和分区2的单向预测信号的插值滤波器可以是不同的。例如,默认8抽头插值滤波器(例如,具有系数[-1,4,-11,40,40,-11,4,-1])用于形成分区1的预测样点,而备选6抽头插值滤波器(例如,具有系数[3,9,20,20,9,3])用于分区2。
与运动信息类似,还需要针对一个三角形分区模式CU的每个4×4单元存储关于二分之一像素插值滤波器选择的信息;所述信息可用于确定在编码未来CU时应用哪个插值滤波器来插值二分之一像素预测样点。提出了以下示例性方法。
在一些示例中,如果4×4单元位于非加权区域(即,图11中的暗区域和空白区域)中,则直接从对应合并候选的滤波器选择信息继承4×4单元的二分之一像素滤波器选择信息。如果4×4单元在加权区域(图11中的灰色区域)中,则如下导出其对应二分之一像素插值滤波器信息:如果两个合并候选中的两者都在二分之一像素位置处使用备选插值滤波器,则存储备选插值滤波器;否则,存储默认插值滤波器。
在一些其它示例中,如果4×4单元位于非加权区域(即,图11中的暗区域和空白区域)中,则直接从对应合并候选的滤波器选择信息继承4×4单元的二分之一像素滤波器选择信息。对于加权区域(图11中的灰色区域)中的每个4×4单元,如下确定对应滤波器选择信息:如果两个合并候选中的至少一个在二分之一像素位置处使用备选插值滤波器,则存储备选插值滤波器;否则(即,没有合并候选应用备选滤波器),存储默认插值滤波器。
在一些其它示例中,二分之一像素滤波器选择的信息被设置为对于一个三角形CU内的所有4×4单元是相同的。仅当备选二分之一像素插值滤波器用于两个合并候选两者时,可在三角形分区模式下针对CU的所有4×4单元选择备选二分之一像素插值滤波器。可选地,当存在至少一个合并候选在二分之一像素位置处使用备选插值滤波器时,可针对所有4×4单元选择备选二分之一像素插值滤波器。
在一些示例中,针对仿射模式和三角形分区模式启用备选二分之一像素插值滤波器。解码器可首先确定当前编解码单元处于仿射模式或三角形分区模式,并且随后获得指示从包括二分之一像素MVD分辨率的分辨率列表中选择当前CU的MVD分辨率的AMVR信令。在确定当前CU处于仿射非合并模式并且选择了二分之一像素MVD分辨率时,可将备选插值滤波器应用于当前CU内的运动矢量处于二分之一像素精度的子块。在确定当前CU处于仿射合并模式时,可将备选插值滤波器应用于导出当前CU的控制点运动矢量(CPMV)中所涉及的相邻块中的全部或至少一个。在确定当前CU处于三角形分区模式时,从用于除二分之一像素以外的MVD分辨率的默认插值滤波器和用于二分之一像素MVD分辨率的备选插值滤波器中选择插值滤波器,以产生三角形分区模式下当前CU中的每个分区的预测信号。
在当前CU处于三角形分区模式时,可针对非加权区域中的4×4单元和加权区域中的4×4单元不同地导出当前CU中的每个4×4单元的滤波器选择信息。在一些示例中,可导出三角形分区模式下当前CU中的每个4×4单元的滤波器选择信息,其中所述滤波器选择信息是直接从非加权区域中的第一4×4单元的对应合并候选的滤波器选择信息继承的;并且其中所述滤波器选择信息是基于加权区域中的第二4×4单元的合并候选以预设方法导出的。预设方法可以是当将备选插值滤波器应用于两个合并候选中的两者或一者时,将备选插值滤波器应用于加权区域中的第二4×4单元。
针对小块禁用备选二分之一像素插值滤波器
在现有AMVR设计中,当对应MV处于二分之一像素精度时,允许备选插值滤波器用于所有可能的CU尺寸。然而,对于帧间预测,块尺寸通常具有对预测区域的特性的特定指示。例如,通常选择大预测块来预测具有简单纹理的平坦区域(例如,背景区域),而小预测块对于预测具有丰富边缘和纹理信息的区域更有用。相应地,由于备选插值滤波器的强低通特征,因此将备选插值滤波器应用于小预测块可能不太有益,这是因为它可能潜在地模糊重建的图片中的有意义的纹理细节。在这样的考虑下,可针对样点数量小于预定义阈值的CU禁用备选二分之一像素插值滤波器。即,可首先确定当前CU的尺寸,并且在确定当前CU的尺寸小于预定义值时,可禁用备选插值滤波器,而不管AMVR信令如何。
在一个示例中,提出仅针对尺寸小于预定义阈值的非合并CU禁用备选二分之一像素插值滤波器,而允许备选二分之一像素插值滤波器被用于合并CU。具体地,在此示例中,对于小的非合并CU,仅amvr_flag和amvr_precision_flag需要用信号发送,而标志hpel_amvr_flag不用信号发送但始终被推断为假。即,二分之一MVD分辨率不用于编解码的块,并且针对小的非合并CU禁用备选二分之一像素插值滤波器。在另一示例中,提出针对尺寸小于预定义阈值的非合并CU和合并CU两者禁用备选二分之一像素插值滤波器。另外,为了针对小的合并CU禁用备选二分之一像素插值滤波器,可应用两个不同的过程。在一个示例性过程中,对于小的合并CU,标志hpel_amvr_flag总是被设置为假。在另一示例性过程中,对于小的合并CU,仍然允许将hpel_amvr_flag设置为真,并且标志值的导出相对于当前VVC不变;然而,默认插值滤波器将始终应用于小的合并CU,而不管hpel_amvr_flag值如何。两个过程之间的主要区别在于是否允许小的合并CU的标志hpel_amvr_flag传播到其相邻的帧间CU中。第一过程不允许这种传播,而第二过程允许这种传播。
去除关于Hpel_Amvr_Flag的信令条件
在现有AVMR设计中,在随机存取(RA)配置中,始终假定针对位于层id>3的时间层的图片禁用备选二分之一像素插值滤波器。相应地,为了节省信令开销,不需要针对那些图片用信号发送标志hpel_amvr_flag。然而,这种设计对于实际的硬件实现是不友好的。给定解码器需要在决定是否需要针对一个帧间CU解析标志hpel_amvr_flag之前检查预测结构(即,当前比特流是否利用RA预测设置被编码)和当前图片的时间ID,可以减少整个熵解码的解析吞吐量。为了实现更硬件友好的设计,在本公开的一个示例中,可以去除这样的信令条件。此外,为了不增加编码时间,提出了通过在比特流中将对应的hpel_amvr_flag发送为假,在RA配置中始终针对具有时间层id>3的图片禁用备选二分之一像素插值滤波器。
用于整数像素样点位置处的运动补偿预测的去噪滤波器
在VVC标准中,当一个MV指向分数样点位置时,应用插值滤波器来产生预测样点。众所周知,这种分数样点插值对时间参考图片中的重建样点具有低通滤波效果。这样的低通滤波可潜在地去除存在于重建样点中的编码噪声。然而,当一个MV指向整数样点位置时,不应用滤波器,并且去噪过程不适用,这对于编码效率是不期望的。
为了解决这样的问题,提出了当帧间CU参考整数样点位置处的参考样点时,允许将具有去噪效果的低通滤波器应用于帧间CU。更具体地,可通过对应MVD分辨率信令,在整数样点位置处启用或禁用滤波器。当去噪滤波器被启用时,它被应用于参考整数样点位置处的参考样点的帧间CU;并且当去噪滤波器被关闭(即,禁用)时,默认复制操作(即,无插值滤波器)将被应用以产生整数像素预测样点。为了尽可能多地重用VVC中的现有AMVR信令设计,通过二分之一像素MVD分辨率控制提出的去噪滤波器的启用或禁用。具体地,假设非合并CU(仿射CU或非仿射CU)的MV指向整数位置,当使用二分之一像素MVD分辨率用信号发送整数位置MV时,将去噪滤波器应用于重建样点以产生CU的预测样点。否则(即,如果在用信号发送当前整数位置MV时未选择二分之一像素MVD分辨率),则将通过从参考图片中的对应整数样点位置直接复制重建样点来产生CU的预测样点。即,低通滤波器可应用于使用二分之一像素MVD分辨率用信号发送的整数位置MV的整数样点位置处的参考样点。
此外,与AMVR中的备选二分之一像素插值类似,关于是否启用或禁用用于合并模式(仿射模式或非仿射模式)的整数像素去噪滤波器的信息也可从其空间邻居继承。
在实践中,给定重建的视频的噪声等级(例如,依据应用的量化参数(QP)值),可根据本公开的示例应用不同的去噪滤波器。在一个示例中,可以应用以下两个低通滤波器:
滤波器#1:5抽头低通滤波器[11,13,16,13,11]
滤波器#2:7抽头低通滤波器[1,-5,11,50,11,-5,1]。
图15是示出根据本公开的一些实施方式的两个去噪滤波器的频率响应的示图,其中曲线1502表示滤波器#1的频率响应并且曲线1504表示滤波器#2的频率响应。
在一个示例中,可应用两个滤波器中的仅一个固定的去噪滤波器,且在CU等级在整数样点位置处自适应地启用或禁用一个固定的去噪滤波器。在另一示例中,可启用两个去噪滤波器,并且将一个附加标志从编码器用信号发送到解码器以指示选择哪个去噪滤波器。在又一示例中,可以允许去噪滤波器不时地变化而不是固定去噪滤波器。在这种情况下,编码器可以基于输入视频特性和编码参数设置来确定新的期望的去噪滤波器,并且在需要时在比特流中用信号发送它们。
在以上示例中,仅当MV的水平分量和垂直分量都是整数精度时才应用去噪滤波器。在一个MV分量是整数像素而另一MV分量是二分之一像素的情况下,不应用去噪滤波器;实际上,仍基于复制操作产生与整数像素MV分量相关联的方向上的预测样点。在一些其它示例中,可始终启用去噪滤波器或将去噪滤波器应用于一个方向(水平方向或垂直方向),只要相关联的水平MV分量或垂直MV分量处于整数像素精度即可。
图16是示出根据本公开的一些实施方式的用于在假设MV等于(1/2,1)的情况下应用整数像素去噪滤波器的方法的示图。在图16所示的示例中,当前CU的MV是(1/2,1),并且假设应用7抽头去噪滤波器(即,滤波器#2)。如图16的上部所示,因为水平MV是二分之一像素,所以即使CU的垂直MV是整数像素,在第一示例性方法中在垂直方向上也不应用滤波器(即,应用垂直复制操作)。这与启用去噪滤波器以在垂直方向上产生整数像素预测样点的第二示例性方法不同(如图16的下部所示)。
图17是示出根据本公开的一些实施方式的用于视频编解码的示例性装置的框图。装置1700可以是终端(诸如移动电话、平板计算机、数字广播终端、平板设备或个人数字助理)。
如图17所示,装置1700可以包括以下组件中的一个或多个:处理组件1702、存储器1704、电源组件1706、多媒体组件1708、音频组件1710、输入/输出(I/O)接口1712、传感器组件1714和通信组件1716。
处理组件1702通常控制装置1700的整体操作,诸如与显示、电话呼叫、数据通信、相机操作和记录操作有关的操作。处理组件1702可以包括用于执行指令以完成上述方法的全部或部分步骤的一个或多个处理器1720。此外,处理组件1702可以包括用于促进处理组件1702与其他组件之间的交互的一个或多个模块。例如,处理组件1702可以包括用于促进多媒体组件1708与处理组件1702之间的交互的多媒体模块。
存储器1704被配置为存储不同类型的数据以支持装置1700的操作。此类数据的示例包括用于在装置1700上操作的任何应用或方法的指令、联系人数据、电话簿数据、消息、图片、视频等。存储器1704可以由任何类型的易失性或非易失性存储设备或其组合来实现,并且存储器1704可以是静态随机存取存储器(SRAM)、电可以擦除可以编程只读存储器(EEPROM)、可以擦除可以编程只读存储器(EPROM)、可以编程只读存储器(PROM)、只读存储器(ROM)、磁存储器、闪存、磁盘或光盘。
电源组件1706为装置1700的不同组件供电。电源组件1706可以包括电源管理系统、一个或多个电源以及与为装置1700产生、管理和分配电力相关联的其他组件。
多媒体组件1708包括在装置1700和用户之间提供输出接口的屏幕。在一些示例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,则屏幕可以被实现为从用户接收输入信号的触摸屏。触摸面板可以包括用于感测触摸面板上的触摸、滑动和手势的一个或多个触摸传感器。触摸传感器不仅可以感测触摸或滑动动作的边界,而且可以检测与触摸或滑动操作相关的持续时间和压力。在一些示例中,多媒体组件1708可以包括前置相机和/或后置相机。当装置1700处于诸如拍摄模式或视频模式的操作模式时,前置相机和/或后置相机可以接收外部多媒体数据。
音频组件1710被配置为输出和/或输入音频信号。例如,音频组件1710包括麦克风(MIC)。当装置1700处于操作模式(诸如呼叫模式、录音模式和语音识别模式)时,麦克风被配置为接收外部音频信号。接收的音频信号可以进一步被存储在存储器1704中或经由通信组件1716被发送。在一些示例中,音频组件1710还包括用于输出音频信号的扬声器。
I/O接口1712提供处理组件1702与外围接口模块之间的接口。上述外围接口模块可以是键盘、点击轮、按钮等。这些按钮可以包括但不限于主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件1714包括用于在装置1700的不同方面中提供状态评估的一个或多个传感器。例如,传感器组件1714可以检测装置1700的开/关状态和组件的相对位置。例如,组件是装置1700的显示器和键盘。传感器组件1714还可以检测装置1700或装置1700的组件的位置变化、用户在装置1700上接触的存在或离开、装置1700的方向或加速度/减速度、以及装置1700的温度变化。传感器组件1714可以包括被配置为在没有任何物理触摸的情况下检测附近物体的存在的接近传感器。传感器组件1714还可以包括光学传感器,诸如在成像应用中使用的CMOS或CCD图像传感器。在一些示例中,传感器组件1714还可以包括加速度传感器、陀螺仪传感器、磁传感器、压力传感器或温度传感器。
通信组件1716被配置为促进装置1700与其它设备之间的有线或无线通信。装置1700可以基于诸如WiFi、4G或其组合的通信标准来接入无线网络。在示例中,通信组件1716经由广播信道从外部广播管理系统接收广播信号或广播相关信息。在示例中,通信组件1716还可以包括用于促进短距离通信的近场通信(NFC)模块。例如,NFC模块可以基于射频识别(RFID)技术、红外数据协会(IrDA)技术、超宽带(UWB)技术、蓝牙(BT)技术和其他技术来实现。
在示例中,装置1700可以由专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可以编程逻辑器件(PLD)、现场可以编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件中的一个或多个来实现,以执行上述方法。
非暂态计算机可读存储介质可以是例如硬盘驱动器(HDD)、固态驱动器(SSD)、闪存、混合驱动器或固态混合驱动器(SSHD)、只读存储器(ROM)、光盘只读存储器(CD-ROM)、磁带、软盘等。
图18是示出根据本公开的一些实施方式的视频编解码中的解码器侧运动矢量细化的示例性过程的流程图。
在步骤1802,解码器200(或设备1700)确定当前编解码单元(CU)处于仿射模式或三角形分区模式。
在步骤1804,解码器200(或设备1700)获得指示从包括二分之一像素运动矢量差(MVD)分辨率的分辨率列表中选择当前CU的MVD分辨率的自适应运动矢量分辨率(AMVR)信令。
本公开的描述已经出于说明的目的被呈现,并且不旨在穷举或限于本公开。受益于在前面的描述和相关联的附图中呈现的教导,许多修改、变化和替代实施方式对于本领域普通技术人员将是显而易见的。
选择和描述示例是为了解释本公开的原理,并且使本领域的其它技术人员能够理解本公开的各种实施方式,并且最好地利用基本原理和具有适合于预期的特定用途的各种修改的各种实施方式。因此,将理解,本公开的范围不限于所公开的实施方式的具体示例,并且修改和其它实施方式旨在被包括在本公开的范围内。
Claims (27)
1.一种视频编解码的方法,包括:
由解码器确定当前编解码单元CU处于仿射模式或三角形分区模式;并且
由所述解码器获得自适应运动矢量分辨率AMVR信令,所述AMVR信令指示从包括二分之一像素运动矢量差MVD分辨率的分辨率列表中选择所述当前CU的MVD分辨率。
2.如权利要求1所述的方法,还包括:响应于确定所述当前CU处于仿射非合并模式,在选择二分之一像素MVD分辨率时,将备选插值滤波器应用于所述当前CU内的运动矢量处于二分之一像素精度的子块,其中,所述备选插值滤波器与用于二分之一像素精度的默认插值滤波器不同。
3.如权利要求1所述的方法,还包括:
响应于确定所述当前CU处于仿射合并模式,在确定备选插值滤波器而非默认插值滤波器被应用于导出所述当前CU的控制点运动矢量CPMV中涉及的相邻块中的全部或至少一个时,应用所述备选插值滤波器。
4.如权利要求1所述的方法,其中,所述仿射模式下所述当前CU的分辨率列表包括四分之一像素、二分之一像素、十六分之一像素和整数像素的MVD分辨率。
5.如权利要求1所述的方法,还包括:
响应于确定所述当前CU处于所述三角形分区模式,从用于除二分之一像素以外的MVD分辨率的默认插值滤波器和用于二分之一像素MVD分辨率的备选插值滤波器中选择插值滤波器,以产生所述三角形分区模式下所述当前CU中的每个分区的预测信号。
6.如权利要求5所述的方法,还包括:导出所述三角形分区模式下所述当前CU中的每个4×4单元的滤波器选择信息,其中所述滤波器选择信息是直接从非加权区域中的第一4×4单元的对应合并候选的滤波器选择信息继承的;并且其中所述滤波器选择信息是基于加权区域中的第二4×4单元的合并候选以预设方法导出的。
7.如权利要求6所述的方法,其中,所述预设方法还包括:当将所述备选插值滤波器应用于两个合并候选中的两者或一者时,将所述备选插值滤波器应用于所述加权区域中的所述第二4×4单元。
8.如权利要求1到7中任一项权利要求所述的方法,还包括:确定所述当前CU的尺寸,并且在确定所述当前CU的尺寸小于预定义值时禁用备选插值滤波器,而不管所述AMVR信令如何。
9.如权利要求1所述的方法,还包括:将低通滤波器应用于使用二分之一像素MVD分辨率用信号发送的整数位置MV的整数样点位置处的参考样点。
10.一种用于视频编解码的设备,包括:
一个或多个处理器;以及
存储器,被配置为存储可由所述一个或多个处理器执行的指令;
其中,所述一个或多个处理器在执行所述指令时被配置为:
确定当前编解码单元CU是仿射模式或三角形分区模式;并且
获得自适应运动矢量分辨率AMVR信令,所述AMVR信令指示从包括二分之一像素运动矢量差MVD分辨率的分辨率列表中选择所述当前CU的MVD分辨率。
11.如权利要求10所述的设备,其中,所述一个或多个处理器还被配置为:响应于确定所述当前CU处于仿射非合并模式,在选择二分之一像素MVD分辨率时,将备选插值滤波器应用于所述当前CU内的运动矢量处于二分之一像素精度的子块,其中,所述备选插值滤波器与用于二分之一像素精度的默认插值滤波器不同。
12.如权利要求10所述的设备,其中,所述一个或多个处理器还被配置为:响应于确定所述当前CU处于仿射非合并模式,在确定备选插值滤波器而非默认插值滤波器被应用于导出所述当前CU的控制点运动矢量CPMV中涉及的相邻块中的全部或至少一个时,应用所述备选插值滤波器。
13.如权利要求10所述的设备,其中,所述仿射模式下所述当前CU的分辨率列表包括四分之一像素、二分之一像素、十六分之一像素和整数像素的MVD分辨率。
14.如权利要求10所述的设备,其中,所述一个或多个处理器还被配置为:响应于确定所述当前CU处于所述三角形分区模式,从用于除二分之一像素以外的MVD分辨率的默认插值滤波器和用于二分之一像素MVD分辨率的备选插值滤波器中选择插值滤波器,以产生所述三角形分区模式下所述当前CU中的每个分区的预测信号。
15.如权利要求14所述的设备,其中,所述一个或多个处理器还被配置为:导出所述三角形分区模式下所述当前CU中的每个4×4单元的滤波器选择信息,其中所述滤波器选择信息是直接从非加权区域中的第一4×4单元的对应合并候选的滤波器选择信息继承的;并且其中所述滤波器选择信息是基于加权区域中的第二4×4单元的合并候选以预设方法导出的。
16.如权利要求15所述的方法,其中,所述预设方法还包括:当将所述备选插值滤波器应用于两个合并候选中的两者或一者时,将所述备选插值滤波器应用于所述加权区域中的所述第二4×4单元。
17.如权利要求10到16中任一项权利要求所述的设备,其中,所述一个或多个处理器还被配置为:确定所述当前CU的尺寸,并且在确定所述当前CU的尺寸小于预定义值时禁用备选插值滤波器,而不管所述AMVR信令如何。
18.如权利要求10所述的设备,其中,所述一个或多个处理器还被配置为:将低通滤波器应用于使用二分之一像素MVD分辨率用信号发送的整数位置MV的整数样点位置处的参考样点。
19.一种非暂态计算机可读存储介质,包括存储在其中的指令,其中,在由一个或多个处理器执行所述指令时,所述指令使所述一个或多个处理器执行操作,所述操作包括:
确定当前编解码单元CU是仿射模式或三角形分区模式;并且
获得自适应运动矢量分辨率AMVR信令,所述AMVR信令指示从包括二分之一像素运动矢量差MVD分辨率的分辨率列表中选择所述当前CU的MVD分辨率。
20.如权利要求19所述的非暂态计算机可读存储介质,其中,所述操作还包括:响应于确定所述当前CU处于仿射非合并模式,在选择二分之一像素MVD分辨率时,将备选插值滤波器应用于所述当前CU内的运动矢量处于二分之一像素精度的子块,其中,所述备选插值滤波器与用于二分之一像素精度的默认插值滤波器不同。
21.如权利要求19所述的非暂态计算机可读存储介质,其中,所述操作还包括:响应于确定所述当前CU处于仿射非合并模式,在确定备选插值滤波器而非默认插值滤波器被应用于导出所述当前CU的控制点运动矢量CPMV中涉及的相邻块中的全部或至少一个时,应用所述备选插值滤波器。
22.如权利要求19所述的非暂态计算机可读存储介质,其中,所述仿射模式下所述当前CU的分辨率列表包括四分之一像素、二分之一像素、十六分之一像素和整数像素的MVD分辨率。
23.如权利要求19所述的非暂态计算机可读存储介质,其中,所述操作还包括:响应于确定所述当前CU处于所述三角形分区模式,从用于除二分之一像素以外的MVD分辨率的默认插值滤波器和用于二分之一像素MVD分辨率的备选插值滤波器中选择插值滤波器,以产生所述三角形分区模式下所述当前CU中的每个分区的预测信号。
24.如权利要求23所述的非暂态计算机可读存储介质,其中,所述操作还包括:导出所述三角形分区模式下所述当前CU中的每个4×4单元的滤波器选择信息,其中所述滤波器选择信息是直接从非加权区域中的第一4×4单元的对应合并候选的滤波器选择信息继承的;并且所述滤波器选择信息是基于加权区域中的第二4×4单元的合并候选以预设方法导出的。
25.如权利要求24所述的方法,其中,所述预设方法还包括:当将所述备选插值滤波器应用于两个合并候选中的两者或一者时,将所述备选插值滤波器应用于所述加权区域中的所述第二4×4单元。
26.如权利要求19到25中任一项权利要求所述的非暂态计算机可读存储介质,其中,所述操作还包括:确定所述当前CU的尺寸,并且在确定所述当前CU的尺寸小于预定义值时禁用备选插值滤波器,而不管所述AMVR信令如何。
27.如权利要求19所述的非暂态计算机可读存储介质,其中,所述操作还包括:将低通滤波器应用于使用二分之一像素MVD分辨率用信号发送的整数位置MV的整数样点位置处的参考样点。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962885812P | 2019-08-12 | 2019-08-12 | |
US62/885,812 | 2019-08-12 | ||
PCT/US2020/046026 WO2021030502A1 (en) | 2019-08-12 | 2020-08-12 | Methods and apparatuses for adaptive motion vector resolution in video coding |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114128263A true CN114128263A (zh) | 2022-03-01 |
CN114128263B CN114128263B (zh) | 2024-10-25 |
Family
ID=
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110031721A (ko) * | 2009-09-21 | 2011-03-29 | 한국전자통신연구원 | 기저계층의 화질을 향상시키는 스케일러블 비디오 부/복호화 방법 및 장치 |
WO2013031071A1 (ja) * | 2011-09-02 | 2013-03-07 | パナソニック株式会社 | 動画像復号装置、動画像復号方法、及び集積回路 |
WO2016183224A1 (en) * | 2015-05-11 | 2016-11-17 | Qualcomm Incorporated | Storage and signaling resolutions of motion vectors |
WO2017052409A1 (en) * | 2015-09-25 | 2017-03-30 | Huawei Technologies Co., Ltd. | Apparatus and method for video motion compensation with selectable interpolation filter |
WO2017156705A1 (en) * | 2016-03-15 | 2017-09-21 | Mediatek Inc. | Affine prediction for video coding |
CN107277506A (zh) * | 2017-08-15 | 2017-10-20 | 中南大学 | 一种基于自适应运动矢量精度的运动矢量精度快速选择方法及装置 |
CN108432250A (zh) * | 2016-01-07 | 2018-08-21 | 联发科技股份有限公司 | 用于视频编解码的仿射帧间预测的方法及装置 |
US20180270485A1 (en) * | 2015-09-24 | 2018-09-20 | Lg Electronics Inc. | Amvr-based image coding method and apparatus in image coding system |
US20190104319A1 (en) * | 2017-10-03 | 2019-04-04 | Qualcomm Incorporated | Coding affine prediction motion information for video coding |
WO2019066514A1 (ko) * | 2017-09-28 | 2019-04-04 | 삼성전자 주식회사 | 부호화 방법 및 그 장치, 복호화 방법 및 그 장치 |
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110031721A (ko) * | 2009-09-21 | 2011-03-29 | 한국전자통신연구원 | 기저계층의 화질을 향상시키는 스케일러블 비디오 부/복호화 방법 및 장치 |
WO2013031071A1 (ja) * | 2011-09-02 | 2013-03-07 | パナソニック株式会社 | 動画像復号装置、動画像復号方法、及び集積回路 |
WO2016183224A1 (en) * | 2015-05-11 | 2016-11-17 | Qualcomm Incorporated | Storage and signaling resolutions of motion vectors |
US20180270485A1 (en) * | 2015-09-24 | 2018-09-20 | Lg Electronics Inc. | Amvr-based image coding method and apparatus in image coding system |
WO2017052409A1 (en) * | 2015-09-25 | 2017-03-30 | Huawei Technologies Co., Ltd. | Apparatus and method for video motion compensation with selectable interpolation filter |
CN108432250A (zh) * | 2016-01-07 | 2018-08-21 | 联发科技股份有限公司 | 用于视频编解码的仿射帧间预测的方法及装置 |
WO2017156705A1 (en) * | 2016-03-15 | 2017-09-21 | Mediatek Inc. | Affine prediction for video coding |
CN107277506A (zh) * | 2017-08-15 | 2017-10-20 | 中南大学 | 一种基于自适应运动矢量精度的运动矢量精度快速选择方法及装置 |
WO2019066514A1 (ko) * | 2017-09-28 | 2019-04-04 | 삼성전자 주식회사 | 부호화 방법 및 그 장치, 복호화 방법 및 그 장치 |
US20190104319A1 (en) * | 2017-10-03 | 2019-04-04 | Qualcomm Incorporated | Coding affine prediction motion information for video coding |
Non-Patent Citations (3)
Title |
---|
"CE2: Adaptive Motion Vector Resolution for Affine Inter Mode (Test 2.1.2)", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 13TH MEETING: MARRAKECH, MA, 9–18 JAN. 2019,JVET-M0246, 9 January 2019 (2019-01-09) * |
"CE4: Switchable interpolation filter (CE4-1.1, CE4-1.2, CE4-1.3, CE4-1.4, CE4-1.5, CE4-1.6, CE4-1.7)", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 15TH MEETING: GOTHENBURG, SE, 3–12 JULY 2019,JVET-O0057-V2, 9 July 2019 (2019-07-09) * |
"Versatile Video Coding (Draft 6)", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 15TH MEETING: GOTHENBURG, SE, 3–12 JULY 2019,JVET-O2001-VE, 31 July 2019 (2019-07-31), pages 8 * |
Also Published As
Publication number | Publication date |
---|---|
WO2021030502A1 (en) | 2021-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113784132B (zh) | 用于帧间预测的运动向量舍入、截取和存储的方法和装置 | |
CN117221532B (zh) | 用于视频解码的方法、装置和存储介质 | |
WO2021030502A1 (en) | Methods and apparatuses for adaptive motion vector resolution in video coding | |
CN113824959B (zh) | 用于视频编码的方法、装置和存储介质 | |
JP2024016288A (ja) | ビデオコーディングにおけるデコーダ側動きベクトル補正のための方法および装置 | |
WO2021188598A1 (en) | Methods and devices for affine motion-compensated prediction refinement | |
CN116708802B (zh) | 用于针对视频编解码的预测相关残差缩放的方法和设备 | |
WO2022251211A1 (en) | Methods and devices for overlapped block motion compensation for inter prediction | |
WO2022081878A1 (en) | Methods and apparatuses for affine motion-compensated prediction refinement | |
CN114128263B (zh) | 用于视频编解码中的自适应运动矢量分辨率的方法和设备 | |
CN114009019A (zh) | 用于在视频编解码中用信令传递合并模式的方法和装置 | |
CN114342390B (zh) | 用于仿射运动补偿的预测细化的方法和装置 | |
CN114080808A (zh) | 用于视频编解码中的解码器侧运动矢量细化的方法和装置 | |
CN114051732A (zh) | 用于视频编解码中的解码器侧运动矢量细化的方法和装置 | |
CN114402618A (zh) | 用于视频编解码中的解码器端运动矢量细化的方法和装置 | |
CN114080807A (zh) | 利用三角分区进行视频编解码的方法和装置 | |
WO2021248135A1 (en) | Methods and apparatuses for video coding using satd based cost calculation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |