CN110431845A - 约束通过解码器侧运动向量推导导出的运动向量信息 - Google Patents
约束通过解码器侧运动向量推导导出的运动向量信息 Download PDFInfo
- Publication number
- CN110431845A CN110431845A CN201880019566.5A CN201880019566A CN110431845A CN 110431845 A CN110431845 A CN 110431845A CN 201880019566 A CN201880019566 A CN 201880019566A CN 110431845 A CN110431845 A CN 110431845A
- Authority
- CN
- China
- Prior art keywords
- motion vector
- exported
- poc
- diff
- difference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/587—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
描述与解码器侧运动向量推导DMVD有关的技术。例如,本公开描述与向运动信息应用一或多个约束条件有关的技术,所述运动信息例如是通过DMVD导出的运动向量MV,和/或初始MV和通过DMVD导出的MV之间的MV差。在某些实例中,在向所述DMVD应用所述约束条件时,只有符合所述约束条件的所述所导出运动信息被视为有效运动信息。可以在所述约束条件上设置条件。
Description
本申请要求2017年3月22日提交的第62/475,177号美国临时专利申请的权益,所述申请以全文引用的方式并入本文中。
技术领域
本公开涉及视频译码。
背景技术
数字视频能力可并入到各种装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子图书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的“智能电话”、视频电话会议装置、视频流式传输装置等等。数字视频装置实施视频译码技术,例如描述于由以下各项定义的标准中的那些技术:ITU-T H.261、ISO/IECMPEG-1Visual、ITU-T H.262或ISO/IEC MPEG-2Visual、ITU-T H.263、ITU-T H.264/MPEG-4第10部分高级视频译码(AVC)、ITU-T H.265/高效率视频译码(HEVC),以及这些标准的扩展,例如可分级视频译码(SVC)和多视图视频译码(MVC)扩展。视频装置可通过实施这些视频译码技术而更高效地传输、接收、编码、解码和/或存储数字视频信息。
视频译码技术包含空间(图片内)预测和/或时间(图片间)预测来减少或移除视频序列中固有的冗余。对于基于块的视频译码来说,视频切片(例如,视频图片或视频图片的一部分)可分割成视频块,视频块也可被称作译码树单元(CTU)、译码单元(CU)及/或译码节点。使用相对于相同图片中的相邻块中的参考样本的空间预测对图片的经帧内译码(I)切片中的视频块进行编码。图片的经帧间译码(P或B)切片中的视频块可使用相对于相同图片中的相邻块中的参考样本的空间预测,或相对于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间或时间预测产生待译码块的预测性块。残余数据表示待译码原始块与预测性块之间的像素差。经帧间译码块根据指向形成预测性块的参考样本块的运动向量及指示经译码块与预测性块之间的差的残余数据来编码。经帧内译码块根据帧内译码模式及残余数据来编码。为了进一步压缩,可将残余数据从像素域变换到变换域,从而产生残余变换系数,接着可量化所述残余变换系数。可扫描最初布置成二维阵列的经量化变换系数,以便产生变换系数的一维向量,且可应用熵译码以实现更多压缩。
发明内容
大体来说,本公开描述与解码器侧运动向量推导(DMVD)有关的技术。例如,本公开描述与向运动信息应用一或多个约束条件的技术有关,所述运动信息例如是通过DMVD导出的运动向量(MV),和/或初始MV和通过DMVD导出的MV之间的MV差。这些技术可应用于现有例如高效视频译码(HEVC)的视频编解码器中的任一个,和/或可为任何未来视频译码标准中的高效译码工具。在某些实例中,在将约束条件应用到利用DMVD导出的MV和/或MV差时,只有符合约束条件的所导出运动信息被视为有效运动信息。因此,如果没有使用约束条件,MV和最终选定MV的列表可能是不同的,这可以提高译码效率和/或减小位速率。在一些实例中,约束条件包含所导出MV是不是对称的、初始MV和通过DMVD方法导出的MV之间的MV差是不是对称的、所导出MV是不是反对称的、初始MV和通过DMVD方法导出的MV之间的MV差是不是反对称的。在一些实例中,显式地传送对称/反对称MV/MV差约束条件的启用。在其它实例中,约束条件可以根据一些经译码信息隐式地确定。在其它实例中,可以在约束条件上设置条件,使得约束条件仅在某些实例中应用。
在实例中,一种对来自经编码视频位流的视频数据进行解码的方法,所述方法包括:使用解码器侧运动向量推导(DMVD)生成多个所导出运动向量;基于成本度量,根据所述多个所导出运动向量确定第一所导出运动向量和第二所导出运动向量,包括确定所述第一所导出运动向量和所述第二所导出运动向量满足关于所述第一所导出运动向量和所述第二所导出运动向量之间的关系的至少一个约束条件,所述关系包括:所述第一所导出运动向量和所述第二所导出运动向量具有对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量具有伪对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量是反对称的、所述第一所导出运动向量和所述第二所导出运动向量具有反对称运动向量差或所述第一所导出运动向量和所述第二所导出的运动向量具有伪反对称运动向量差;以及使用双向预测,使用所确定的第一所导出运动向量和第二所导出运动向量对当前块进行解码。
在另一实例中,一种对视频数据进行编码的方法,所述方法包括:使用解码器侧运动向量推导(DMVD)生成多个所导出运动向量;基于成本度量,根据所述多个所导出运动向量确定第一所导出运动向量和第二所导出运动向量,包括确定所述第一所导出运动向量和所述第二所导出运动向量满足关于所述第一所导出运动向量和所述第二所导出运动向量之间的关系的至少一个约束条件,所述关系包括:第一所导出运动向量和所述第二所导出运动向量具有对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量具有伪对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量是反对称的、所述第一所导出运动向量和所述第二所导出运动向量具有反对称运动向量差或所述第一所导出运动向量和所述第二所导出运动向量具有伪反对称运动向量差;以及使用双向预测,使用所确定的第一所导出运动向量和第二所导出运动向量对当前块进行编码。
在另一实例中,一种经配置以对来自经编码视频位流的视频数据进行解码的设备,所述设备包括:存储器,其经配置以存储所述视频数据,以及与所述存储器通信的一或多个处理器,所述一或多个处理器经配置以:使用解码器侧运动向量推导(DMVD)生成多个所导出运动向量;基于成本度量,根据所述多个所导出运动向量确定第一所导出运动向量和第二所导出运动向量,包括确定所述第一所导出运动向量和所述第二所导出运动向量满足关于所述第一所导出运动向量和所述第二所导出运动向量之间的关系的至少一个约束条件,所述关系包括:所述第一所导出运动向量和所述第二所导出运动向量具有对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量具有伪对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量是反对称的、所述第一所导出运动向量和所述第二所导出运动向量具有反对称运动向量差或所述第一所导出运动向量和所述第二所导出的运动向量具有伪反对称运动向量差;以及使用双向预测,使用所确定的第一所导出运动向量和第二所导出运动向量对当前块进行解码。
在另一实例中,一种经配置以对视频数据进行编码的设备,所述设备包括:存储器,其经配置以存储所述视频数据,以及与所述存储器通信的一或多个处理器,所述一或多个处理器经配置以:使用解码器侧运动向量推导(DMVD)生成多个所导出运动向量;基于成本度量,根据所述多个所导出运动向量确定第一所导出运动向量和第二所导出运动向量,包括确定所述第一所导出运动向量和所述第二所导出运动向量满足关于所述第一所导出运动向量和所述第二所导出运动向量之间的关系的至少一个约束条件,所述关系包括:第一所导出运动向量和所述第二所导出运动向量具有对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量具有伪对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量是反对称的、所述第一所导出运动向量和所述第二所导出运动向量具有反对称运动向量差或所述第一所导出运动向量和所述第二所导出运动向量具有伪反对称运动向量差;以及使用双向预测,使用所确定的第一所导出运动向量和第二所导出运动向量对当前块进行解码。
在另一实例中,一种经配置以对来自经编码视频位流的视频数据进行解码的设备,所述设备包括:用于使用解码器侧运动向量推导(DMVD)生成多个所导出运动向量的装置;用于基于成本度量根据所述多个所导出运动向量确定第一所导出运动向量和第二所导出运动向量的装置,包括用于确定所述第一所导出运动向量和所述第二所导出运动向量满足关于所述第一所导出运动向量和所述第二所导出运动向量之间的关系的至少一个约束条件的装置,所述关系包括:所述第一所导出运动向量和所述第二所导出运动向量具有对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量具有伪对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量是反对称的、所述第一所导出运动向量和所述第二所导出运动向量具有反对称运动向量差或所述第一所导出运动向量和所述第二所导出的运动向量具有伪反对称运动向量差;以及用于使用双向预测使用所确定的第一所导出运动向量和第二所导出运动向量对当前块进行解码的装置。
在另一实例中,一种经配置以对视频数据进行编码的设备,所述设备包括:用于使用解码器侧运动向量推导(DMVD)生成多个所导出运动向量的装置;用于基于成本度量根据所述多个所导出运动向量确定第一所导出运动向量和第二所导出运动向量的装置,包括用于确定所述第一所导出运动向量和所述第二所导出运动向量满足关于所述第一所导出运动向量和所述第二所导出运动向量之间的关系的至少一个约束条件的装置,所述关系包括:所述第一所导出运动向量和所述第二所导出运动向量具有对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量具有伪对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量是反对称的、所述第一所导出运动向量和所述第二所导出运动向量具有反对称运动向量差或所述第一所导出运动向量和所述第二所导出的运动向量具有伪反对称运动向量差;以及用于使用双向预测使用所确定的第一所导出运动向量和第二所导出运动向量对当前块进行编码的装置。
在另一实例中,本公开描述一种存储指令的计算机可读存储媒体,所述指令在执行时使装置的一或多个处理器经配置以:使用解码器侧运动向量推导(DMVD)生成多个所导出运动向量;基于成本度量,根据所述多个所导出运动向量确定第一所导出运动向量和第二所导出运动向量,包括确定所述第一所导出运动向量和所述第二所导出运动向量满足关于所述第一所导出运动向量和所述第二所导出运动向量之间的关系的至少一个约束条件,所述关系包括:所述第一所导出运动向量和所述第二所导出运动向量具有对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量具有伪对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量是反对称的、所述第一所导出运动向量和所述第二所导出运动向量具有反对称运动向量差或所述第一所导出运动向量和所述第二所导出的运动向量具有伪反对称运动向量差;以及使用双向预测,使用所确定的第一所导出运动向量和第二所导出运动向量对当前块进行解码。
在另一实例中,本公开描述一种存储指令的计算机可读存储媒体,所述指令在执行时使装置的一或多个处理器经配置以:使用解码器侧运动向量推导(DMVD)生成多个所导出运动向量;基于成本度量,根据所述多个所导出运动向量确定第一所导出运动向量和第二所导出运动向量,包括确定所述第一所导出运动向量和所述第二所导出运动向量满足关于所述第一所导出运动向量和所述第二所导出运动向量之间的关系的至少一个约束条件,所述关系包括:所述第一所导出运动向量和所述第二所导出运动向量具有对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量具有伪对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量是反对称的、所述第一所导出运动向量和所述第二所导出运动向量具有反对称运动向量差或所述第一所导出运动向量和所述第二所导出的运动向量具有伪反对称运动向量差;以及使用双向预测,使用所确定的第一所导出运动向量和第二所导出运动向量对当前块进行解码。
附图及以下描述中阐述了一或多个实例的细节。其它特征、目标和优势将根据所述描述和图式并根据权利要求书而显而易见。
附图说明
图1是示出可利用用于执行本公开的解码器侧运动向量推导(DMVD)的技术的实例视频编码和解码系统的框图。
图2是示出可实施用于执行本公开的DMVD的技术的视频编码器的实例的框图。
图3是示出可实施用于执行本公开的DMVD的技术的视频解码器的实例的框图。
图4A和4B是示出从相邻块导出的空间运动向量候选项的概念图。
图5A和5B是示出时间运动向量预测符(TMVP)候选项的主块位置的概念图。
图6是示出与用于导出当前块的运动信息的双边匹配有关的概念的概念图。
图7是示出与用于导出当前块的运动信息的模板匹配有关的概念的概念图。
图8是示出实例帧速率上转换(FRUC)模板匹配过程的流程图。
图9是示出图8的FRUC模板匹配过程的实例所提议改变的流程图。
图10是示出与双向光流的实例有关的概念的概念图。
图11是示出8x4块的梯度计算的实例的概念图。
图12是示出与基于双边模板匹配的DMVD有关的概念的概念图。
图13A和13B是示出与重叠块运动补偿(OBMC)有关的概念的概念图。
图14A-14D是示出OBMC加权的概念图。
图15是示出与用于导出当前块的运动信息的双边匹配有关的概念的概念图。
图16是示出根据本公开中所描述的技术对视频数据进行解码的实例方法的流程图。
图17是示出根据本公开中所描述的技术对视频数据进行编码的实例方法的流程图。
具体实施方式
本公开描述与解码器侧运动向量推导(DMVD)有关的技术。本公开的技术可用作任何未来视频译码标准中的高效译码工具。
大体来说,本公开描述用于导出用于对视频数据块进行编码的运动信息(例如,一或多个运动向量、运动向量和/或运动向量差精度和一或多个参考图片索引)和用于通过视频解码器确定与通过视频编码器确定的运动信息相同的运动信息的技术。使用供视频编码器使用的相同(或互逆)推导技术,视频解码器可在不接收任何特定标识运动信息的语法元素的情况下确定用于对视频数据进行编码的运动信息。然而,在一些译码情形中,视频编码器仍可显式地传送用于对块进行编码的运动信息。
可参考视频译码器来描述本公开中的各种技术,其既定为可指代视频编码器或视频解码器的通用术语。除非另外明确陈述,否则不应假定相对于视频编码器或视频解码器描述的技术不可由视频编码器或视频解码器中的另一者来执行。例如,在许多情况下,视频解码器执行与视频编码器相同或有时互逆的译码技术,以便对经编码视频数据进行解码。在许多情况下,视频编码器还包含视频解码环路,且因此视频编码器执行视频解码作为对视频数据进行编码的一部分。因此,除非另外说明,否则本公开中相对于视频解码器描述的技术还可由视频编码器执行,且反之亦然。
本公开还可使用例如当前层、当前块、当前图片、当前切片等术语。在本公开的上下文中,术语当前既定识别当前正译码的层、块、图片、切片等,例如与先前经译码层、块、图片和切片或待译码块、图片和切片相反。
命名为高效视频译码(HEVC)(也被称作ITU-T H.265)的新视频译码标准,包含其范围扩展、多视图扩展(MV-HEVC)和可分级扩展(SHVC),是由关于视频译码的联合合作小组(JCT-VC)以及ITU-T视频译码专家组(VCEG)和ISO/IEC动画专家组(MPEG)的3D视频译码扩展建立(JCT-3V)联合合作小组开发的。在下文中被称为HEVC WD的HEVC规范可获自phenix.int-evry.fr/jct/doc_end_user/documents/14_Vienna/wg11/JCTVC-N1003-v1.zip。
ITU-T VCEG(Q6/16)和ISO/IEC MPEG(JTC 1/SC 29/WG 11)目前正在研究具有大大超过当前HEVC标准(包含其当前扩展及屏幕内容译码和高动态范围译码的近似项扩展)的压缩能力的压缩能力的未来视频译码技术的标准化的潜在需要。这些小组通过被称为联合视频探索小组(JVET)的联合协作工作一起致力于这一探索活动以评估由他们在这个领域中的专家提出的压缩技术设计。JVET在2015年10月19日到21日期间首次会见。并且,参考软件的版本,即,联合探索模型5(JEM 5)可获自jvet.hhi.fraunhofer.de/svn/svn_HMJEMSoftware/tags/HM-16.6-JEM-5.0。JEM 5的算法描述可获自phenix.it-sudparis.eu/jvet/doc_end_user/current_document.php?id=2714。
图1是说明可利用用于执行本公开的DMVD的技术的实例视频编码和解码系统10的框图。如图1所示,系统10包含源装置12,所述源装置12提供在稍后时间由目的地装置14解码的经编码视频数据。具体地说,源装置12通过计算机可读媒体16将视频数据提供到目的地装置14。源装置12和目的地装置14可包括各种装置中的任一个,包含桌上型计算机、笔记本计算机(即,膝上型计算机)、平板计算机、机顶盒、手持机(例如所谓的“智能”电话、所谓的“智能”平板)、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置等等。在一些情况下,源装置12和目的地装置14可经装备以用于无线通信。
目的地装置14可通过计算机可读媒体16接收待解码的经编码视频数据。计算机可读媒体16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一个实例中,计算机可读媒体16可包括使得源装置12能够实时地将经编码视频数据直接传输到目的地装置14的通信媒体。经编码视频数据可根据通信标准(例如无线通信协议)调制,并传输到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一或多个物理传输线。通信媒体可形成基于包的网络的一部分,例如局域网、广域网或全球网络(例如,互联网)。通信媒体可包含路由器、交换机、基站或可适用于促进源装置12与目的地装置14之间的通信的任何其它设备。
在一些实例中,经编码数据可从输出接口22输出到存储装置。类似地,经编码数据可通过输入接口从存储装置存取。存储装置可包含各种分布式或本地存取的数据存储媒体中的任一个,例如硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器,或任何其它合适的用于存储经编码视频数据的数字存储媒体。在另一实例中,存储装置可对应于文件服务器或另一可存储由源装置12生成的经编码视频的中间存储装置。目的地装置14可通过流式传输或下载从存储装置存取所存储视频数据。文件服务器可以是能够存储经编码视频数据并向目的地装置14传输所述经编码视频数据的任何类型的服务器。实例文件服务器包含网络服务器(例如,对于网站)、FTP服务器、网络连接存储(NAS)装置或本地磁盘驱动器。目的地装置14可通过包含互联网连接的任何标准数据连接存取经编码视频数据。这可包含无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等)或适用于存取存储在文件服务器上的经编码视频数据的这两者的组合。经编码视频数据从存储装置的传输可为流式传输、下载传输或其组合。
本公开的技术不一定限于无线应用或设置。所述技术可应用到视频译码以支持各种多媒体应用中的任一个,例如空中电视广播、有线电视传输、卫星电视传输、互联网流式视频传输,例如,通过HTTP的动态自适应流式传输(DASH)、编码到数据存储媒体上的数字视频、存储在数据存储媒体上的数字视频的解码或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频传输,从而支持各种应用,例如视频流式传输、视频回放、视频广播和/或视频电话。
在图1的实例中,源装置12包含视频源18、视频编码器20和输出接口22。目的地装置14包含输入接口28、视频解码器30和显示装置32。在其它实例中,源装置和目的地装置可包含其它组件或布置。例如,源装置12可从外部视频源18接收视频数据,例如外部相机。同样地,目的地装置14可与外部显示装置介接,而不是包含集成显示装置。根据本公开,源装置12的视频编码器20和/或目的地装置14的视频解码器30可经配置以执行本文中所描述的一或多种DMVD技术。例如,视频编码器20和/或视频解码器30可经配置以向以下各项应用一或多个约束条件:(1)通过DMVD导出的MV,和/或(2)初始MV和通过DMVD导出的MV之间的MV差。约束条件可包含关于通过DMVD过程导出的运动向量的限制。本公开的实例约束条件可包含授权MV和两个参考图片列表(例如,List0和List1)中的MVD之间的某一预定义关系的约束条件。在某些实例中,在向DMVD应用约束条件时,只有符合约束条件的所导出运动信息被视为有效运动信息。因此,如果没有使用约束条件,MV和最终选定MV的列表可能是不同的。在第一实例中,约束条件包含所导出MV是不是对称的。在第二实例中,约束条件包含初始MV和通过DMVD方法导出的MV之间的MV差是不是对称的。在第三实例中,约束条件包含所导出MV是不是反对称的。在第四实例中,约束条件包含初始MV和通过DMVD方法导出的MV之间的MV差是不是反对称的。在一些实例中,显式地传送对称/反对称MV/MV差约束条件的启用。在其它实例中,约束条件可以根据一些经译码信息隐式地确定。
在其它实例中,可以在约束条件上设置条件,使得约束条件仅在某些实例中应用。条件可包含关于约束条件启用的时间的限制。例如,(1)约束条件仅在初始MV对称时启用;(2)约束条件仅在初始MV伪对称时启用;(3)约束条件仅在初始MV反对称时启用;(4)约束条件仅在初始MV伪反对称时启用;(5)约束条件仅在初始MV不对称时启用;(6)约束条件仅在初始MV非伪对称时启用;(7)约束条件仅当初始MV非反对称时启用;(8)约束条件仅在初始MV非伪反对称时启用;(9)约束条件仅在初始MV的List0和List1参考图片均在当前图片之前或均在当前图片之后时启用;(10)约束条件仅在初始MV的List0和List1参考图片并非均在当前图片之前或并非均在当前图片之后启用;(11)约束条件仅在初始MV的参考索引均为零时启用;(12)约束条件仅在初始MV的参考索引并非均为零时启用;(13)约束条件仅在List0参考图片和当前图片之间的POC距离与List1参考图片和当前图片之间的POC距离相同时启用;(14)约束条件仅在List0参考图片和当前图片之间的POC距离与List1参考图片和当前图片之间的POC距离不同时启用;(15)在初始MV不对称时应用对称MV差的约束条件;和/或(16)在初始MV对称时应用反对称MV差的约束条件。
在另一实例中,可以确定性的方式指派对称约束条件的MV分辨率。在一个实例中,对于双边模板匹配的整数像素细化,应该施加无对称/伪对称/不对称约束条件,且前述约束条件仅用于半像素、四分之一像素或更高精度的运动细化。约束水平(处于哪一MV分辨率)可以通过SPS/PPS/切片标头传送。分辨率还可与是否启用其它运动细化工具(例如,BIO、子像素帧速率上转换(FRUC))一同判定。例如,在启用BIO时,约束条件不应施加于四分之一像素或更高精度的运动细化。
在另一实例中,根据List0(也被称作L0)和List1(也被称作L1)MV之间的绝对差、List0和List1 MV之间的经缩放(基于它们的相对POC距离)绝对差或List0和List1的经内插样本(即,此实例中的P0和P1)之间的初始SAD值,约束水平可以是自适应的。可替代地,(当前模板,P0)和(当前模板,P1)之间的SAD值的比率可用于判定应该在哪一MV分辨率下施加约束条件。在此实例中,如果SAD值的比率低于阈值,那么不应该施加任何前述对称约束条件。
此外,在一些实例中,基于条件,向所导出MV应用单个约束条件(例如,对称MV、对称MV差、反对称MV或反对称MV差)。在其它实例中,基于多个条件,向所导出MV应用多个约束条件。
图1示出的系统10仅仅是一个实例。用于执行本公开的DMVD的技术可由任何数字视频编码和/或解码装置执行。例如,用于约束以下各项的技术可由任何数字视频编码和/或解码装置执行:(1)通过DMVD导出的MV,和/或(2)初始MV和通过DMVD导出的MV之间的MV差。虽然本公开的技术大体上由视频编码装置执行,但是所述技术也可由视频编码器/解码器(通常被称作“编解码器(CODEC)”)执行。此外,本公开的技术还可由视频预处理器执行。源装置12和目的地装置14仅为此类译码装置的实例,其中源装置12生成经译码视频数据以供传输到目的地装置14。在一些实例中,装置12、14可以大体上对称的方式操作,使得装置12、14中的每一者包含视频编码和解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频传输,例如,用于视频流式传输、视频重放、视频广播或视频电话。
源装置12的视频源18可包含视频俘获装置,例如摄像机、含有先前所俘获视频的视频存档和/或用于从视频内容提供者接收视频的视频馈送接口。作为另一替代方案,视频源18可生成基于计算机图形的数据作为源视频,或实时视频、存档视频与计算机生成的视频的组合。在一些情况下,如果视频源18为摄像机,那么源装置12和目的地装置14可形成所谓的相机电话或视频电话。然而,如上文所提及,本公开中所描述的技术一般可应用于视频译码,且可应用于无线和/或有线应用。在每一情况下,俘获、预先俘获或计算机生成的视频可由视频编码器20编码。经编码视频信息可接着由输出接口22输出到计算机可读媒体16上。
计算机可读媒体16可包含瞬时媒体,例如无线广播或有线网络传输,或存储媒体(即,非暂时性存储媒体),例如硬盘、快闪驱动器、压缩光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(未展示)可从源装置12接收经编码视频数据,并且例如通过网络传输将经编码视频数据提供到目的地装置14。类似地,媒体生产设施(例如,光盘冲压设施)的计算装置可从源装置12接收经编码视频数据且生产含有经编码视频数据的光盘。因此,在各种实例中,计算机可读媒体16可理解为包含一或多个各种形式的计算机可读媒体。
目的地装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包含由视频编码器20定义的语法信息,所述语法信息还供视频解码器30使用,包含描述块和其它经译码单元的特性和/或处理的语法元素。显示装置32将经解码视频数据显示给用户,且可包括多种显示装置中的任一个,例如阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20和视频解码器30可根据视频译码标准操作,例如高效视频译码(HEVC)标准,它还被称作ITU-T H.265。可替代地,视频编码器20和视频解码器30可根据其它专用或行业标准操作,例如ITU-T H.264标准(或称为MPEG-4),第10部分,高级视频译码(AVC),或此类标准的扩展。然而,本公开的技术不限于任何特定译码标准。视频译码标准的其它实例包含MPEG-2和ITU-T H.263。尽管在图1中未示出,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器及解码器集成,且可包含适当的MUX-DEMUX单元或其它硬件及软件,以处理公共数据流或单独数据流中的音频和视频两者的编码。若适用,MUX-DEMUX单元可符合ITU H.223多路复用器协议或其它协议,例如,用户数据报协议(UDP)。
视频编码器20和视频解码器30各自可实施为各种合适的编码器和/或解码器电路系统中的任一个,例如一或多个微处理器、处理电路系统(包含固定功能电路系统和/或可编程处理电路系统)、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当技术部分地实施为软件时,装置可在合适的非暂时性计算机可读媒体中存储用于所述软件的指令,并使用一或多个处理器执行硬件中的指令以执行本公开的技术。视频编码器20和视频解码器30中的每一个可包含在一或多个编码器或解码器中,其中的任一个可集成为相应装置中的组合编码器/解码器(编解码器)的一部分。包含视频编码器20和/或视频解码器30的装置可包括集成电路、微处理器和/或无线通信装置,例如,蜂窝式电话。
一般来说,根据ITU-T H.265,视频图片可划分成可包含亮度和色度样本两者的一连串译码树单元(CTU)(或最大译码单元(LCU))。可替代地,CTU可包含单色数据(即,仅亮度样本)。位流内的语法数据可以定义CTU(就像素数目来说的最大译码单元)的大小。切片包含呈译码次序的数个相连CTU。视频图片可被分割成一或多个切片。每一CTU可根据四叉树而分裂成译码单元(CU)。一般来说,四叉树数据结构包含每CU一个节点,其中根节点对应于CTU。如果CU分裂成四个子CU,那么对应于CU的节点包含四个叶节点,每一叶节点对应于一个子CU。
四叉树数据结构的每一节点可提供对应CU的语法数据。例如,四叉树中的节点可包含分裂标志,其指示对应于节点的CU是否分裂成子CU。CU的语法元素可以递归地定义,且可以取决于所述CU是否分裂成若干个子CU。如果CU未进一步分割,那么它被称作叶CU。在本公开中,叶CU的四个子CU也将被称作叶CU,即使原始叶CU没有明确分裂也如此。例如,如果16×16大小的CU不进一步分裂,那么尽管16×16CU从未分裂,四个8×8子CU也将被称作叶CU。
CU具有与H.264标准的宏块类似的目的,但是CU不具有大小区别。例如,CTU可分裂成四个子节点(也被称作子CU),且每个子节点继而可为父节点且可分裂成另外四个子节点。最后未分裂的子节点(被称作四叉树的叶节点)包括译码节点,也被称作叶CU。与经译码位流相关联的语法数据可定义CTU可分裂的最大次数(被称作最大CU深度),且还可定义译码节点的最小大小。因此,位流还可定义最小译码单元(SCU)。本公开使用术语“块”指代在HEVC的上下文中的CU、预测单元(PU)或变换单元(TU)中的任一个,或在其它标准的上下文中的类似数据结构(例如,H.264/AVC中的宏块和其子块)。
CU包含译码节点和与所述译码节点相关联的预测单元(PU)和变换单元(TU)。CU的大小对应于译码节点的大小,且形状大体上为正方形。CU的大小范围可从8x8像素直到具有最大大小(例如,64x64像素或更大)的CTU的大小。每一CU可含有一或多个PU和一或多个TU。例如,与CU相关联的语法数据可描述CU分割成一或多个PU。分割模式在CU被跳过、经直接模式编码、经帧内预测模式编码或经帧间预测模式编码的情况下有所不同。PU可以分割成非正方形形状。例如,与CU相关联的语法数据还可描述CU根据四叉树划分成一或多个TU。TU的形状可为正方形或非正方形(例如,矩形)。
HEVC标准允许根据TU变换,TU对于不同CU可能是不同的。TU通常基于针对经分割CTU限定的给定CU内的PU(或CU的分割区)的大小进行大小设定,但可能并非始终如此。TU通常具有与PU(或CU的分区,例如在帧内预测的情况下)相同的大小或小于PU。在一些实例中,对应于CU的残余样本可以使用被称为“残余四叉树”(RQT)的四叉树结构细分成更小单元。RQT的叶节点可被称作变换单元(TU)。与TU相关联的像素差值可以进行变换以产生变换系数,所述变换系数可以量化。
在使用帧间预测预测时,叶CU可包含一或多个预测单元(PU)。大体来说,PU表示对应于对应CU全部或一部分的空间区域,并且可包含用于撷取和/或生成PU的参考样本的数据。此外,PU包含与预测有关的数据。在CU经帧间模式编码时,CU的一或多个PU可包含定义运动信息的数据,例如一或多个运动向量,或PU可经跳过模式译码。定义PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量指向的参考图片和/或运动向量的参考图片列表(例如,List0或List1)。
叶CU还可经帧内模式预测。大体来说,帧内预测涉及使用帧内模式预测叶CU(或其分割区)。视频译码器可选择一组相邻先前经译码像素供叶CU用于预测叶CU(或其分割区)。
叶CU还可包含一或多个变换单元(TU)。变换单元可以使用RQT(也被称作TU四叉树结构)来指定,如上文所论述。例如,分裂标志可指示叶CU是否分裂成四个变换单元。接着,每一TU可以进一步分裂成其它子TU。在TU未进一步分裂时,它可被称作叶TU。一般来说,对于帧内译码,所有属于叶CU的叶TU共享相同帧内预测模式。也就是说,相同帧内预测模式大体上应用于计算叶CU的所有TU的经预测值。对于帧内译码,视频编码器可使用帧内预测模式计算每一叶TU的残余值作为对应于TU的CU的部分和原始块之间的差。TU不必限于PU的大小。因此,TU可以大于或小于PU。对于帧内译码,CU的分割区或CU本身可以与CU的对应叶TU并置。在一些实例中,叶TU的最大大小可对应于对应叶CU的大小。
此外,叶CU的TU还可与相应四叉树数据结构相关联,所述四叉树数据结构被称为残余四叉树(RQT)。也就是说,叶CU可包含指示叶CU如何分割成TU的四叉树。TU四叉树的根节点大体上对应于叶CU,而CU四叉树的根节点大体上对应于CTU(或LCU)。RQT中未分裂的TU被称为叶TU。大体来说,除非以其它方式标注,否则本公开分别使用术语CU和TU来指代叶CU和叶TU。
视频序列通常包含一系列视频帧或图片,开始于随机存取点(RAP)图片。视频序列可在表征视频序列的序列参数集(SPS)中包含语法数据。图片的每一切片可包含描述相应切片的编码模式的切片语法数据。视频编码器20通常在单个视频切片内的视频块上操作,以便对视频数据进行编码。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小,且其大小可根据指定译码标准而不同。
举例来说,预测可针对各种大小的PU来执行。假设特定CU的大小是2Nx2N,帧内预测可在2Nx2N或NxN的PU大小上执行,且帧间预测可在2Nx2N、2NxN、Nx2N或NxN的对称PU大小上执行。帧间预测的不对称分割也可针对2NxnU、2NxnD、nLx2N和nRx2N的PU大小执行。在不对称分割中,CU的一个方向未分割,而其它方向被分割成25%和75%。CU中对应于25%分割区的部分由后跟着“上”、“下”、“左”或“右”指示的“n”指示。因此,例如,“2NxnU”是指水平分割成具有2Nx0.5N PU在顶部且具有2Nx1.5N PU在底部的2Nx2N CU。
在本公开中,“NxN”和“N乘N”可互换使用,用于指代视频块在竖直和水平维度上的像素尺寸,例如,16x16像素或16乘16像素。大体来说,16x16块将在竖直方向上具有16个像素(y=16)且在水平方向上具有16个像素(x=16)。同样地,NxN块大体上在竖直方向上具有N个像素且在水平方向上具有N个像素,其中N表示非负整数值。块中的像素可成行和列布置。此外,块不需要必须在水平方向上具有和在竖直方向上相同的像素数目。例如,块可包括NxM个像素,其中M不必等于N。
在使用CU的PU进行帧内预测性或帧间预测性译码之后,视频编码器20可计算CU的TU的残余数据。PU可包括描述在空间域(也被称作像素域)中生成预测性像素数据的方法或模式的语法数据,且TU可包括在向残余视频数据应用变换之后变换域中的系数,所述变换例如是离散余弦变换(DCT)、整数变换、小波变换或在概念上类似的变换。残余数据可对应于未经编码图片的像素和对应于PU的预测值之间的像素差。视频编码器20可形成包含表示CU的残余数据的经量化变换系数的TU。也就是说,视频编码器20可计算残余数据(呈残余块形式),变换残余块以产生变换系数块,并且接着量化变换系数以形成经量化变换系数。视频编码器20可形成包含经量化变换系数以及其它语法信息(例如,TU的分裂信息)的TU。
如上文所提到,在任何变换以产生变换系数后,视频编码器20可执行变换系数的量化。量化一般是指变换系数进行量化以可能地减少用于表示系数的数据量从而进一步压缩的过程。量化过程可减小与系数中的一些或全部相关联的位深度。例如,n位值可以在量化期间下舍入到m位值,其中n大于m。
在量化之后,视频编码器可扫描变换系数,从包含经量化变换系数的二维矩阵产生一维向量。扫描可以设计成在阵列前部放置更高能量(并且因此,更低频率)系数,并在阵列后部放置更低能量(并且因此,更高频率)系数。在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化变换系数,以产生可以经熵编码的串行化向量。在其它实例中,视频编码器20可执行自适应扫描。在扫描经量化变换系数以形成一维向量之后,视频编码器20可对一维向量进行熵编码,例如,根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法。视频编码器20还可对与经编码视频数据相关联的语法元素进行熵编码,以供视频解码器30在对视频数据进行解码时使用。
为执行CABAC,视频编码器20可向待传输符号指派上下文模型内的上下文。上下文可与(例如)符号的相邻值是不是非零有关。为执行CAVLC,视频编码器20可为待传输符号选择可变长度码。VLC中的码字可以构造成使得相对较短的代码对应于更有可能的符号,而更长代码对应于不太可能的符号。通过这种方式,相对于(例如)针对每一待传输符号使用等长码字,使用VLC可实现位节省。概率确定可基于指派给符号的上下文。
大体来说,视频解码器30执行与由视频编码器20执行的过程大体上类似但互逆的过程,以对经编码数据进行解码。例如,视频解码器30对经接收TU的系数进行逆量化和逆变换以重新产生残余块。视频解码器30使用经传送预测模式(帧内或帧间预测)以形成经预测块。接着,视频解码器30组合经预测块和残余块(在逐像素的基础上)以重新产生原始块。可执行额外处理,例如执行解块过程以减少沿着块边界的视觉假影。此外,视频解码器30可使用CABAC以与视频编码器20的CABAC编码过程大体上类似但互逆的方式对语法元素进行解码。
视频编码器20可以进一步将基于块的语法数据、基于图片的语法数据和基于序列的语法数据等语法数据以图片标头、块标头、切片标头的形式或将序列参数集(SPS)、图片参数集(PPS)或视频参数集(VPS)等其它语法数据发送到视频解码器30。
图2是示出可经配置以执行本公开的一或多种DMVD技术的视频编码器20的实例的框图。例如,视频编码器20可经配置以向以下各项应用一或多个约束条件:(1)通过DMVD导出的MV,和/或(2)初始MV和通过DMVD导出的MV之间的MV差。在某些实例中,在向DMVD应用约束条件时,只有符合约束条件的所导出运动信息被视为有效运动信息。因此,如果没有使用约束条件,MV和最终选定MV的列表可能是不同的。
在第一实例中,约束条件包含所导出MV是不是对称的。在第二实例中,约束条件包含初始MV和通过DMVD方法导出的MV之间的MV差是不是对称的。在第三实例中,约束条件包含所导出MV是不是反对称的。在第四实例中,约束条件包含初始MV和通过DMVD方法导出的MV之间的MV差是不是反对称的。在一些实例中,显式地传送对称/反对称MV/MV差约束条件的启用。在其它实例中,约束条件可以根据一些经译码信息隐式地确定。在其它实例中,可以在约束条件上设置条件,使得约束条件仅在一些实例中应用。
具体地说,视频编码器20可在重构环路期间执行本公开的DMVD技术,其包含由逆量化单元58、逆变换单元60和求和器62执行的过程。此外,如上文所论述,视频编码器20可以传送可帮助视频解码器(例如,视频解码器30)执行DMVD的特定值。
视频编码器20可在视频切片内执行视频块的帧内和帧间译码。帧内译码依赖于空间预测以减小或移除给定视频帧或图片内的视频的空间冗余。帧间译码依赖于时间预测以减小或移除视频序列的邻近帧或图片内的视频的时间冗余。帧内模式(I模式)可以指若干个基于空间的译码模式中的任一个。例如单向预测(P模式)或双向预测(B模式)的帧间模式可以指若干个基于时间的译码模式中的任一个。
如图2所示,视频编码器20接收待编码视频帧内的当前视频块。在图2的实例中,视频编码器20包含视频数据存储器66、模式选择单元40、参考图片存储器64(其还可被称作经解码图片缓冲器(DPB))、求和器50、变换处理单元52、量化单元54和熵编码单元56。模式选择单元40又包含运动补偿单元44、运动估计单元42、帧内预测单元46和分割单元48。对于视频块重构,视频编码器20还包含逆量化单元58、逆变换单元60和求和器62。还可包含解块滤波器(图2中未示出),用于对块边界进行滤波以从经重构视频去除成块效应假影。如果需要,解块滤波器通常会对求和器62的输出进行滤波。除了解块滤波器之外,还可使用额外滤波器(在环路中或在环路后)。此类滤波器为简洁起见未示出,但是如果需要,可以对求和器50的输出进行滤波(作为环路内滤波器)。
视频数据存储器66可经配置以存储通过视频编码器20的组件编码的视频数据。例如,可从视频源18获得存储在视频数据存储器101中的视频数据。经解码图片缓冲器116可以是存储参考视频数据以供视频编码器20对视频数据进行编码(例如,在帧内或帧间预测模式中)的参考图片存储器。视频数据存储器101可由各种存储器装置中的任一个形成,例如动态随机存取存储器(DRAM),包含同步DRAM(SDRAM)、磁阻RAM(MRAM)、电阻RAM(RRAM)或其它类型的存储器装置。视频数据存储器101可由相同存储器装置或不同存储器装置提供。在各种实例中,视频数据存储器101可与视频编码器20的其它组件一起在片上,或相对于那些组件在片外。
在编码过程期间,视频编码器20接收待译码视频帧或切片。帧或切片可以划分成多个视频块。运动估计单元42和运动补偿单元44相对于一或多个参考帧中的一或多个块对接收到的视频块执行帧间预测性编码以提供时间预测。帧内预测单元46可替代地相对于与待译码块相同的帧或切片中的一或多个相邻块对接收到的视频块执行帧内预测性编码以提供空间预测。视频编码器20可执行多遍译码,例如,以针对每一视频数据块选择适当的译码模式。
此外,分割单元48可基于对先前译码遍次中的先前分割方案的评估而将视频数据块分割成子块。例如,分割单元48可首先将帧或切片分割成CTU,并基于速率失真分析(例如,速率失真优化)将每一个CTU分割成子CU。模式选择单元40可进一步产生指示CTU分割成子CU的四叉树数据结构。四叉树的叶节点CU可包含一或多个PU和一或多个TU。
模式选择单元40可(例如)基于误差结果选择帧内或帧间预测模式中的一个,并且将所得经预测块提供到求和器50以生成残余数据,并将所得经预测块提供到求和器62以重构经编码块用作参考帧。模式选择单元40还向熵编码单元56提供语法元素,例如运动向量、帧内模式指示符、分割信息和其它此类语法信息。
运动估计单元42和运动补偿单元44可高度集成,但是出于概念性目的分开说明。由运动估计单元42执行的运动估计是生成运动向量的过程,所述运动向量估计视频块的运动。例如,运动向量可指示当前视频帧或图片内的视频块的PU相对于参考帧(或其它经译码单元)内的预测性块(其相对于当前帧(或其它经译码单元)内正被译码的当前块)的位移。预测性块是被发现在像素差方面与待译码块密切匹配的块,像素差可通过绝对差总和(SAD)、平方差总和(SSD)或其它差度量来确定。在一些实例中,视频编码器20可计算存储在参考图片存储器64中的参考图片的子整数像素位置的值。例如,视频编码器20可内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可相对于整数像素位置和分数像素位置执行运动搜索并以分数像素精度输出运动向量。
运动估计单元42通过比较经帧间译码切片中的视频块的PU的位置与参考图片的预测性块的位置来计算PU的运动向量。参考图片可选自第一参考图片列表(List0)或第二参考图片列表(List1),其中的每一个标识存储在参考图片存储器64中的一或多个参考图片。运动估计单元42将计算出的运动向量发送到熵编码单元56和运动补偿单元44。
由运动补偿单元44执行的运动补偿可涉及基于通过运动估计单元42确定的运动向量获取或生成预测性块。同样,在一些实例中,运动估计单元42和运动补偿单元44可以在功能上集成。在接收当前视频块的PU的运动向量后,运动补偿单元44可定位运动向量在一个参考图片列表中指向的预测性块。求和器50通过从正被译码的当前视频块的像素值减去预测性块的像素值形成像素差值来形成残余视频块,如下文所论述。大体来说,运动估计单元42执行相对于亮度分量的运动估计,并且运动补偿单元44针对色度分量和亮度分量两者使用基于亮度分量计算出的运动向量。模式选择单元40还可生成与视频块和视频切片相关联的语法元素,供视频解码器30在对视频切片的视频块进行解码时使用。
帧内预测单元46可对当前块进行帧内预测,以作为由运动估计单元42和运动补偿单元44执行的帧间预测的替代方案,如上文所描述。具体来说,帧内预测单元46可确定要用来对当前块进行编码的帧内预测模式。在一些实例中,帧内预测单元46可例如在单独的编码编次期间使用各种帧内预测模式对当前块进行编码,且帧内预测单元46(或模式选择单元40,在一些实例中)可在经测试模式中选择要使用的适当帧内预测模式。
例如,帧内预测单元46可针对各种经测试帧内预测模式使用速率失真分析来计算速率失真值,并且在经测试模式当中选择具有最佳速率失真特性的帧内预测模式。速率失真分析大体上确定经编码块和原始未经编码块之间的失真(或误差)量以及用于产生经编码块的位速率(即,位的数目),所述原始未经编码块先前以进行编码以产生经编码块。帧内预测单元46可针对各种经编码块根据失真和速率计算比率,以确定哪一帧内预测模式展现块的最佳速率失真值。
在选择块的帧内预测模式之后,帧内预测单元46可向熵编码单元56提供指示块的选定帧内预测模式的信息。熵编码单元56可对指示选定帧内预测模式的信息进行编码。视频编码器20可在可包含多个帧内预测模式索引表和多个经修改帧内预测模式索引表(也被称作码字映射表)的经传输位流配置数据中包含各种块的编码上下文的定义以及最可能用于每一个上下文的帧内预测模式、帧内预测模式索引表和经修改帧内预测模式索引表的指示。
视频编码器20通过从正被译码的原始视频块减去来自模式选择单元40的预测数据来形成残余视频块。求和器50表示执行这一减法运算的一或多个组件。变换处理单元52向残余块应用变换,例如离散余弦变换(DCT)或在概念上类似的变换,以产生包括变换系数值的视频块。可以使用小波变换、整数变换、子带变换、离散正弦变换(DST)或其它类型的变换,而不是DCT。在任何情况下,变换处理单元52向残余块应用变换,从而产生变换系数块。变换可将残余信息从像素域转换到变换域,例如频域。变换处理单元52可将所得变换系数发送到量化单元54。量化单元54量化变换系数以进一步减小位速率。量化过程可减小与系数中的一些或全部相关联的位深度。量化程度可通过调整量化参数来修改。
在量化之后,熵编码单元56对经量化变换系数进行熵译码。例如,熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵译码技术。在基于上下文的熵译码的情况下,上下文可基于相邻块。在熵编码单元56进行熵译码之后,经编码位流可传输到另一装置(例如,视频解码器30),或存档以供随后传输或撷取。
逆量化单元58和逆变换单元60分别应用逆量化和逆变换以在像素域中重构残余块。具体地说,求和器62将经重构建残余块与早先由运动补偿单元44或帧内预测单元46产生的运动补偿预测块相加以产生经重构建视频块,供在参考图片存储器64中存储。经重构建视频块可由运动估计单元42和运动补偿单元44用作参考块以对后续视频帧中的块进行帧间译码。
图3是示出可经配置以执行本公开的一或多种DMVD技术的视频解码器30的实例的框图。例如,视频解码器30可经配置以向以下各项应用一或多个约束条件:(1)通过DMVD导出的MV,和/或(2)初始MV和通过DMVD导出的MV之间的MV差。在某些实例中,在向DMVD应用约束条件时,只有符合约束条件的所导出运动信息被视为有效运动信息。因此,如果没有使用约束条件,MV和最终选定MV的列表可能是不同的。
在第一实例中,约束条件包含所导出MV是不是对称的。在第二实例中,约束条件包含初始MV和通过DMVD方法导出的MV之间的MV差是不是对称的。在第三实例中,约束条件包含所导出MV是不是反对称的。在第四实例中,约束条件包含初始MV和通过DMVD方法导出的MV之间的MV差是不是反对称的。在一些实例中,显式地传送对称/反对称MV/MV差约束条件的启用。在其它实例中,约束条件可以根据一些经译码信息隐式地确定。在其它实例中,可以在约束条件上设置条件,使得约束条件仅在一些实例中应用。
在图3的实例中,视频解码器30包含视频数据存储器68、熵解码单元70、运动补偿单元72、帧内预测单元74、逆量化单元76、逆变换单元78、参考图片存储器82和求和器80。在一些实例中,视频解码器30可执行与关于视频编码器20(图2)描述的编码遍次大体上互逆的解码遍次。运动补偿单元72可基于从熵解码单元70接收的运动向量而生成预测数据,而帧内预测单元74可基于从熵解码单元70接收的帧内预测模式指示符而生成预测数据。
视频数据存储器68可存储将由视频解码器30的组件解码的经编码视频数据,例如经编码视频位流。存储在视频数据存储器68中的视频数据可例如从计算机可读媒体16(例如,从本地视频源,例如相机)通过视频数据的有线或无线网络通信或通过存取物理数据存储媒体而获得。视频数据存储器68可形成存储来自经编码视频位流的经编码视频数据的经译码图片缓冲器(CPB)。参考图片存储器82可为存储用于供视频解码器30例如在帧内或帧间译码模式中对视频数据进行解码或用于输出的参考视频数据的存储器。视频数据存储器68和参考图片存储器82可由各种存储器装置中的任一种形成,例如DRAM,包含SDRAM、MRAM、RRAM或其它类型的存储器装置。视频数据存储器68和参考图片存储器82可由同一存储器装置或单独存储器装置提供。在各种实例中,视频数据存储器68与视频解码器30的其它组件一起在芯片上,或相对于那些组件在芯片外。
视频数据存储器68接收并存储位流的经编码视频数据(例如,NAL单元)。熵解码单元70可从视频数据存储器68接收经编码视频数据(例如,NAL单元),并且可解析NAL单元以获得语法元素。熵解码单元70可对NAL单元中的经熵编码语法元素进行熵解码。在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频切片和相关联的语法元素的视频块的经编码视频位流。视频解码器30的熵解码单元70对位流进行熵解码以生成经量化系数、运动向量或帧内预测模式指示符和其它语法元素。熵解码单元70将运动向量和其它语法元素转发到运动补偿单元72。视频解码器30可在视频切片层级和/或视频块层级处接收语法元素。
当视频切片译码为经帧内译码(I)切片时,帧内预测单元74可基于从当前帧或图片的先前解码的块传送的帧内预测模式和数据来生成当前视频切片的视频块的预测数据。当视频帧译码为经帧间译码(例如,B或P)切片时,运动补偿单元72基于从熵解码单元70接收的运动向量和其它语法元素来产生当前视频切片的视频块的预测性块。预测性块可由一个参考图片列表内的一个参考图片产生。视频解码器30可基于存储在参考图片存储器82中的参考图片使用默认构建技术来构建参考帧列表,即List0和List1。运动补偿单元72通过解析运动向量和其它语法元素来确定当前视频切片的视频块的预测信息,并使用所述预测信息来产生正被解码的当前视频块的预测性块。例如,运动补偿单元72使用接收到的语法元素中的一些来确定用于对视频切片的视频块进行译码的预测模式(例如,帧内或帧间预测)、帧间预测切片类型(例如,B切片或P切片)、切片的参考图片列表中的一或多个的构建信息、切片的每一经帧间编码视频块的运动向量、切片的每一经帧间译码视频块的帧间预测状态,和对当前视频切片中的视频块进行解码的其它信息。
运动补偿单元72还可基于内插滤波器执行内插。运动补偿单元72可使用视频编码器20在视频块的编码期间所使用的内插滤波器来计算参考块的子整数像素的内插值。在此情况下,运动补偿单元72可根据接收到的语法元素确定供视频编码器20使用的内插滤波器,并使用内插滤波器来产生预测性块。
逆量化单元76对提供于位流中且经熵解码单元70解码的经量化变换系数进行逆量化,即解量化。逆量化过程可包含使用视频解码器30针对视频切片中的每一视频块计算的量化参数QPY以确定量化程度,以及同样地,应该应用的逆量化的程度。
逆变换单元78向变换系数应用逆变换,例如,逆DCT、逆整数变换或概念上类似的逆变换过程,以便在像素域中产生残余块。
在运动补偿单元72基于运动向量和其它语法元素而生成当前视频块的预测性块之后,视频解码器30通过对来自逆变换单元78的残余块与由运动补偿单元72生成的对应预测性块进行求和来形成经解码视频块。求和器80表示执行这一求和运算的一或多个组件。如果需要,还可应用解块滤波器以对经解码块进行滤波,以便去除成块效应假影。还可使用其它环路滤波器(在译码环路中或在译码环路之后)以使像素转变平滑化,或以其它方式提高视频质量。接着,给定帧或图片中的经解码视频块存储在参考图片存储器82中,所述参考图片存储器82存储用于后续运动补偿的参考图片。参考图片存储器82还存储用于随后在显示装置上呈现的经解码视频,所述显示装置例如是图1的显示装置32。
根据本公开的技术,例如视频编码器20和视频解码器30的视频译码器可执行DMVD以导出当前视频数据块的运动信息。具体地说,这些技术可包含以下技术中的任一个或全部,无论是单独的还是呈任何组合形式。
本公开的一个概念是改进DMVD。如下文所论述,在若干个不同详细列举的方面中详述了所述技术。可以分别应用用于改进DMVD的以下技术。可替代地,可以一起应用本公开中描述的技术的任何组合。不管是分别应用还是呈任何组合形式应用,以下DMVD技术都可提高译码效率和/或降低位速率。例如,约束(1)通过DMVD导出的MV和/或(2)初始MV和通过DMVD导出的MV之间的MV差可以提高译码效率和/或降低位速率。在以上实例中的每一个中,可以基于某一条件来应用约束条件。
在HEVC中,切片中的最大译码单元被称作译码树块(CTB)或译码树单元(CTU)。CTB含有节点是译码单元的四叉树。在HEVC主规范中,CTB的大小可在16x16到64x64的范围内(但是技术上,可以支持8x8 CTB大小)。译码单元(CU)可为相同大小的CTB,但可以小到8x8。每一译码单元用一个模式译码。在CU经帧间译码时,它可以进一步分割成2个或4个预测单元(PU)或在没有应用进一步分割时变为一个PU。当在一个CU中存在两个PU时,这两个PU可以是一半大小的矩形或具有1/4或3/4大小的CU的两个矩形。在CU经帧间译码时,针对每一PU存在一组运动信息。此外,每一PU用唯一帧间预测模式译码以导出所述一组运动信息。
在HEVC标准中,存在两种帧间预测模式,分别名为预测单元(PU)的合并(跳过被视为合并的特殊情况)和高级运动向量预测(AMVP)模式。在AMVP或合并模式中,针对多个运动向量预测符维持运动向量(MV)候选项列表。当前PU的运动向量以及合并模式中的参考索引通过从MV候选项列表中获取一个候选项来生成。
MV候选项列表对于合并模式含有最多5个候选项,对于AMVP模式仅含有两个候选项。合并候选项可含有一组运动信息,例如,对应于两个参考图片列表(List0和List1)和参考索引的运动向量。如果合并候选项由合并索引标识,那么参考图片用于预测当前块,并且确定相关联的运动向量。然而,在来自List0或List1的每一潜在预测方向的AMVP模式下,参考索引需要与MV预测符(MVP)索引一起显式传送到MV候选项列表,因为AMVP候选项仅含有运动向量。在AMVP模式中,经预测运动向量可以进一步细化。如上方可见,合并候选项对应于完整的一组运动信息,而AMVP候选项仅含有特定预测方向和参考索引的一个运动向量。这两种模式的候选项以类似方式从相同空间和时间相邻块导出。
DMVD技术的概念是供视频译码器(例如,视频编码器20或视频解码器30)使用先前经解码信息导出运动信息,例如运动向量和预测方向。如本文中所使用,首字母缩写“MV”表示运动向量。List0和List1是构造为经解码图片缓冲器(DPB)或参考图片存储器82(在图3中)中的图片列表的两个列表。被称作参考图片索引的索引用于标识这些列表中的一个中的特定图片。对于单向预测,图片可选自这些列表中的任一个。对于双向预测,选择两个图片,每个列表一个(例如,一个来自List0,一个来自List1)。在当前方法中,针对一些DMVD技术,例如双边模板匹配和帧速率上转换(FRUC)模板匹配,独立确定通过DMVD导出的List0和List1 MV。在本公开中,在基于初始MV推导双向预测MV(例如,包含List0 MV和List1 MV的一对MV)时,可以应用对称/反对称MV和/或对称/反对称MV差的约束条件。在一些实例中,可以应用超过一个约束条件,例如应用对称MV约束条件和对称MV差约束条件。约束条件可包含一或多个条件。在一些实例中,在向DMVD应用约束条件(例如,通过向从DMVD导出的MV和/或MV差应用约束条件)时,只有符合(例如,通过)约束条件的所导出运动信息可以被视为有效运动信息。例如,符合(例如,通过)约束条件的从DMVD导出的MV可以被视为有效MV,而不符合约束条件的从DMVD导出的MV可以被视为无效MV。作为另一实例,符合约束条件的从DMVD导出的MV差可以被视为有效MV差,而不符合约束条件的从DMVD导出的MV差可以被视为无效MV差。在一些实例中,视频译码器(例如,视频编码器20或视频解码器30)可经配置以使用有效运动向量信息对视频数据(例如,当前视频数据块)进行译码,且不使用无效运动向量信息对视频数据(例如,当前视频数据块)进行译码。在一些实例中,有效运动向量信息可接着与其它有效运动向量信息相比较,并选择确定具有最低成本度量的有效运动向量信息。
对于特定PU(PU0),空间MV候选项从图4中所示的相邻块导出,但是用于从块生成候选项的方法对于合并和AMVP模式来说是不同的。在合并模式中,可以图4A中所示的数字次序导出最多四个空间MV候选项,次序如下:左(0,A1)、上(1,B1)、右上(2,B0)、左下(3,A0)和左上(4,B2),如图4A所示。
在AVMP模式中,相邻块划分成两个群组:由块0和1组成的左群组,以及由块2、3和4组成的上群组,如图4B所示。对于每一群组,参考与由经传送参考索引指示的参考图片相同的参考图片的相邻块中的潜在候选项具有最高优先级被选中形成所述群组的最终候选项。有可能所有相邻块都不含有指向相同参考图片的运动向量。因此,如果无法找到此类候选项,那么第一可用候选项将进行缩放以形成最终候选项,由此可以经补偿时间距离差异。
如果已启用且可用,那么时间运动向量预测符(TMVP)候选项在MV候选项列表中添加到空间运动向量候选项之后。TMVP候选项的运动向量推导过程对于合并和AMVP模式来说是相同的,但是在合并模式中TMVP候选项的目标参考索引可始终设置为0。用于TMVP候选项推导的主块位置是在并置PU之外的右下块,如图5A中示为块“T”,以补偿用于生成空间相邻候选项的左上块的偏置。然而,如果所述块位于当前CTB行之外或者运动信息不可用,那么所述块被PU的中心块取代。
TMVP候选项的运动向量从在切片级中指示的共址图片的共址PU导出。共址PU的运动向量被称作并置MV。类似于AVC中的时间直接模式,为导出TMVP候选项运动向量,共址MV需要进行缩放以补偿时间距离差异,如图5中所示。
下文论述合并模式和AMVP模式的若干个方面。
运动向量缩放:假设运动向量的值与图片的呈现时间距离成正比。运动向量使参考图片和含有运动向量的图片(即,含纳图片(containing picture))这两个图片相关联。在一运动向量用于预测另一运动向量时,基于图片次序计数(POC)值计算含纳图片和参考图片的距离。
对于待预测运动向量,它的相关联含纳图片和参考图片可以是不同的。因此,计算新距离(基于POC)。并且,运动向量基于这两个POC距离进行缩放。对于空间相邻候选项,这两个运动向量的含纳图片是相同的,而参考图片是不同的。在HEVC中,运动向量缩放适用于空间和时间相邻候选项的TMVP和AMVP两者。
人工运动向量候选项生成:如果运动向量候选项列表是不完整的(即,小于预定最大数目的候选项),那么人工运动向量候选项生成,并插入列表末尾,直到列表具有所有的候选项为止。
在合并模式中,存在两种类型的人工MV候选项:仅针对B切片导出的组合式候选项,以及在第一类型并不提供足够的人工候选项的情况下仅用于AMVP的零候选项。
对于已经在候选项列表中且具有必要的运动信息的每对候选项,双向组合式运动向量候选项可通过参考List0中的图片的第一候选项的运动向量与参考List1中的图片的第二候选项的运动向量的组合导出。
用于候选项插入的修剪过程:来自不同块的候选项可能恰好相同,这降低了合并/AMVP候选项列表的效率。可应用修剪过程来解决此问题。修剪过程比较一个候选项与当前候选项列表中的其它候选项以免插入在特定程度上相同的候选项。为减小复杂度,可以只应用有限数目的修剪过程,而不是将每一潜在候选项都与所有其它现有的候选项进行比较。
在JEM参考软件的一个实例中,存在若干个在解码器侧处导出或细化当前块的运动向量(MV)的帧间译码工具。这些DMVD方法详述如下。
图6和7是示出模式匹配的运动向量推导(PMMVD)的概念的概念图。PMMVD模式是基于帧速率上转换(FRUC)技术的特殊合并模式。通过此模式,块的运动信息在解码器侧处并不传送而是被导出。此技术包含在JEM的一个实例中。
在CU的合并标志为真时,传送CU的FRUC标志。在FRUC标志为假时,传送合并索引并使用规则合并模式。在FRUC标志为真时,传送指示将使用哪一方法(双边匹配或模板匹配)来导出块的运动信息的额外FRUC模式标志。
在运动推导过程期间,首先基于双边匹配或模板匹配导出整个CU的初始运动向量。首先,检查还被称作PMMVD种子的CU的合并列表,并且选择产生最小匹配成本(例如,速率失真(RD)成本)的候选项作为起点。接着,执行围绕起点基于双边匹配或模板匹配的局部搜索,且产生最小匹配成本的MV被视为整个CU的MV。随后,在子块层级处进一步细化运动信息,其中所导出CU运动向量为起点。
根据本公开的技术,可以基于例如通过DMVD导出的MV是对称的还是反对称的和/或(2)初始MV和通过DMVD导出的MV之间的MV差是对称还是反对称的,向所导出CU运动向量应用约束条件。在以上实例中的每一个中,可以基于例如关于初始MV或所导出MV的条件应用约束条件。
如图6中所示,双边匹配用于通过在两个不同的参考图片(Ref0和Ref1)中沿着当前块(Cur)的运动轨迹查找两个参考块(R0和R1)之间的最佳匹配来导出当前块的运动信息。运动轨迹可包含在将图像序列(例如,参考帧和当前帧)视为3维连续时空场时块中的像素穿过空间和时间所沿循的路径。假设连续运动轨迹,指向这两个参考块(R0和R1)的运动向量MV0和MV1与当前图片(Cur)和这两个参考图片(Ref0和Ref1)之间的时间距离成正比。所导出MV 600和602使用双边匹配导出,并且分别指向参考块R'0和R'1。作为特殊情况,当当前图片(Cur)在时间上位于这两个参考图片(Ref0和Ref1)之间且从当前图片到这两个参考图片的时间距离相同时,双边匹配变成基于镜像的双向MV。导出的运动向量600和602必然以类似方式成镜像。
如图7中所示,模板匹配用于通过查找当前图片中的模板(当前块的顶部和/或左侧相邻块)和参考图片(Ref0和Ref1)中的块(大小与模板相同)之间的最佳匹配来导出当前块(Cur)的运动信息。模板可包含块的相邻像素,所述块用于通过搜索R0和R1的相邻块来比较所关注块(Cur)与候选参考(具有MV0的R0和具有MV1的R1)或所导出参考(具有MV 700的R'0和具有MV 702的R'1)。接着,最为类似的参考用作预测。
在视频编码器20处,对于针对CU是否使用FRUC合并模式的判定是基于RD成本选择,如针对正常合并候选项所做的那样。也就是说,对于CU,均通过使用RD成本选择来检查这两个匹配模式(双边匹配和模板匹配)。产生最小成本的匹配模式进一步与其它CU模式相比较。如果FRUC匹配模式是最高效的,那么针对CU,FRUC标志设置为真,并使用相关匹配模式。
在第5次JVET会议(可获自http://phenix.it-sudparis.eu/jvet/的“FRUC模式中的增强模板匹配(Enhanced Template Matching in FRUC Mode)”,JVET-E0035)中,提议进一步改进FRUC模板匹配。示例性FRUC模板匹配模式的流程图在图8中示出。在第一步骤中,发现模板T0(和其对应的运动信息MV0)匹配来自list0参考图片的当前块的当前模板Tc。在第二步骤中,发现模板T1(和其对应的运动信息MV1)来自list1参考图片。使用所获得的运动信息MV0和MV1来执行双向预测以生成当前块的预测符。
FRUC模板匹配模式可以通过在单向预测和双向预测之间引入双向模板匹配和自适应选择来增强。在图9中对相对于图8的示例性修改加下划线。
双向模板匹配可以基于单向模板匹配来实施。如图8中所示,在第一模板匹配步骤中从List0参考图片中首先发现匹配模板T0(800)。应注意,此处,List0仅用作实例。实际上,在第一步骤中使用List0还是List1对当前模板和对应参考图片中的初始模板之间的初始失真成本是自适应的。初始模板可确定具有在执行第一模板匹配之前可用的当前块的初始运动信息。对应于极小初始模板失真成本的参考图片列表将用于第一模板匹配步骤。例如,如果对应于list0的初始模板失真成本不大于对应于List1的成本,那么在第一模板匹配步骤中使用List0,且在第二步骤中使用List1,接着,当前块的当前模板TC更新如下:
T'C=2*TC-T0
使用经更新当前模板T'C,而不是当前模板TC,在第二模板匹配中从List1参考图片中查找另一匹配模板T1(802)。因此,通过联合使用List0和List1参考图片来查找匹配模板T1(804)。此匹配过程被称作双向模板匹配。
用于运动补偿预测(MCP)的单向预测和双向预测之间的选择可基于模板匹配失真。如图9所示,在模板匹配期间,模板T0和Tc(当前模板)之间的失真可以被计算为cost0(900),当前模板可以更新(902),且模板T1和T'C(经更新当前模板)之间的失真可以被计算为cost1(904)。如果cost0小于0.5*cost1(906),那么可以向FRUC模板匹配模式应用基于MV0的单向预测(908);否则,应用基于MV0和MV1的双向预测(910)。应注意,cost0与0.5*cost1比较是因为cost1指示模板T1和T'C(经更新当前模板)之间的差,它是Tc(当前模板)和它的预测0.5*(T0+T1)之间的差的2倍。应注意,MCP可以应用到PU层级运动细化。子PU层级运动细化可保持不变。
根据本公开的技术,视频编码器20和视频解码器30可以基于以下在PU层级或子PU层级处约束从FRUC模板匹配模式(单向和双向)导出的运动向量:(1)约束条件包含所导出MV是不是对称的,(2)初始MV和通过DMVD方法导出的MV之间的MV差是不是对称的,(3)所导出MV是不是反对称的,和/或(4)初始MV和通过DMVD方法导出的MV之间的MV差是不是反对称的。可以在约束条件上设置条件,使得约束条件仅基于初始MV或FRUC模板应用。
图10是示出在JEM的一个实例中与双向光流有关的概念的概念图。双向光流(BIO)是在双向预测的情况下在分块运动补偿之外执行的逐像素运动细化。因为BIO补偿块内部的细微运动,所以启用BIO使得用于运动补偿的块大小变大。样本级运动细化不需要穷尽性的搜索或信号传送,因为有一个明确的公式给出每一样本的精细运动向量。
假设I(k)是在补偿块运动之后来自参考k(k=0、1)的亮度值,且分别是I(k)梯度的水平分量和竖直分量。假设光流有效,那么运动向量场(vx,vy)通过以下公式给出:
针对每一样本的运动轨迹组合光流公式与Hermite内插,得到一个独特的两端同时匹配函数值I(k)和导数的三阶多项式。在t=0时,此多项式的值是BIO预测:
此处,τ0和τ1表示如图10所示的到参考帧的距离。距离τ0和τ1基于Ref0和Ref1的POC来计算:τ0=POC(current)-POC(Ref0),τ1=POC(Ref1)-POC(current)。如果两个预测来自同一时间方向(均来自过去或均来自未来),那么符号不同τ0·τ1<0。在这种情况下,只有当预测不是来自同一时刻(τ0≠τ1)时才应用BIO,两个参考区都具有非零运动(MVx0,MVy0,MVx1,MVy1≠0),并且块运动向量与时间距离成正比(MVx0/MVx1=MVy0/MVy1=-τ0/τ1)。
运动向量场(vx,vy)通过最小化点A和B(图10上运动轨迹和参考帧平面的交点)中的值之间的差Δ来确定。模型仅使用Δ的局部泰勒展开式的第一个线性项:
(1)中的所有值都取决于样本位置(i′,j′),所述样本位置到目前为止被省略。假设运动在局部环境中是一致的,使中心位于当前预测点(i,j)的(2M+1)×(2M+1)正方形窗口Ω内部的Δ最小化:
对于这一优化问题,使用简化的求解,首先在竖直方向上最小化,然后在水平方向上最小化。得到:
其中,
为了避免被零或极小值除,在公式(2)、(3)中引入正则化参数r和m。
r=500·4d-8 (8)
m=700·4d-8 (9)
此处,d是输入视频的内部位深。
在一些实例中,BIO的MV细化可能并不可靠,因为有噪声或运动不规则。因此,在BIO中,MV细化的量值被截取为某一阈值(thBIO)。基于当前图片的所有参考图片是否全都来自一个方向来确定阈值。如果当前图片的当前图片的所有参考图片都来自一个方向,那么阈值设置为12×214-d,否则,它设置为12×213-d。
同时,使用与HEVC运动补偿过程(2D可分离有限脉冲响应(FIR))一致的操作利用运动补偿内插计算BIO的梯度。此2D可分离FIR的输入是与用于运动补偿过程和根据块运动向量的分数部分的分数位置(fracX,fracY)的相同的参考帧样本。在水平梯度信号首先使用对应于具有缩小移位d-8的分数位置fracY的BIOfilterS进行竖直内插的情况下,应用在水平方向上对应于缩小移位18-d的分数位置fracX的梯度滤波器BIOfilterG。在使用对应于缩小移位d-8的分数位置fracY的BIOfilterG来竖直应用竖直梯度的第一梯度滤波器的情况下,使用在水平方向上对应于缩小移位18-d的分数位置fracX的BIOfilterS来执行信号移位。用于梯度计算BIOfilterG和信号移位BIOfilterF的内插滤波器的长度较短(6抽头),以便保持复杂性在合理范围内。表1示出用于BIO中块运动向量的不同分数位置的梯度计算的滤波器。表2示出用于BIO中预测信号生成的内插滤波器。
图11是示出8x4块的梯度计算的实例的概念图。对于8x4块,视频译码器获取运动经补偿预测符并计算当前块内的所有像素的水平/竖直(HOR/VER)梯度,以及外面两排像素,因为求解每一像素的vx和vy需要中心位于每一像素的窗口Ω内的像素的HOR/VER梯度值和运动经补偿预测符,如公式(4)中所示。并且,在JEM的一个实例中,这个窗口的大小设置为5x5。因此,视频译码器(例如,视频编码器20和/或视频解码器30)获取运动经补偿预测符,并且计算在点A和B周围的外面两排像素的梯度。
表1:用于BIO中梯度计算的滤波器
分数像素位置 | 梯度的内插滤波器(BIOfilterG) |
0 | {8,-39,-3,46,-17,5} |
1/16 | {8,-32,-13,50,-18,5} |
1/8 | {7,-27,-20,54,-19,5} |
3/16 | {6,-21,-29,57,-18,5} |
1/4 | {4,-17,-36,60,-15,4} |
5/16 | {3,-9,-44,61,-15,4} |
3/8 | {1,-4,-48,61,-13,3} |
7/16 | {0,1,-54,60,-9,2} |
1/2 | {1,4,-57,57,-4,1} |
表2:用于BIO中预测信号生成的内插滤波器
分数像素位置 | 预测信号的内插滤波器(BIOfilterS) |
0 | {0,0,64,0,0,0} |
1/16 | {1,-3,64,4,-2,0} |
1/8 | {1,-6,62,9,-3,1} |
3/16 | {2,-8,60,14,-5,1} |
1/4 | {2,-9,57,19,-7,2} |
5/16 | {3,-10,53,24,-8,2} |
3/8 | {3,-11,50,29,-9,2} |
7/16 | {3,-11,44,35,-10,3} |
1/2 | {1,-7,38,38,-7,1} |
在JEM的实例中,在所述两个预测来自不同参考图片时向所有双向经预测块应用BIO。在针对CU启用局部光照补偿(LIC)时,停用BIO。
根据本公开的技术,视频编码器20和视频解码器30可以基于以下约束从BIO导出的运动向量:(1)约束条件包含所导出MV是不是对称的,(2)初始MV和通过DMVD方法导出的MV之间的MV差是不是对称的,(3)所导出MV是不是反对称的,和/或(4)初始MV和通过DMVD方法导出的MV之间的MV差是不是反对称的。可以在约束条件上设置条件,使得约束条件仅基于初始MV应用。
图12是示出与基于双边模板匹配的所提议解码器侧运动向量推导(DMVD)有关的概念的概念图。视频译码器可生成双边模板作为分别来自List0的初始MV0和List1的MV1的两个预测块(R0和R1)的加权组合,如图12中所示。在一个实例中,双边模板可以通过使用以下公式对List0和List1参考块(R0和R1)取平均来生成:(R0+R1)>>1或(R0+R1)/2。
模板匹配操作包含计算所生成模板和参考图片中的样本区域(在初始预测块周围)之间的成本量度。对于所述两个参考图片(R0和R1)中的每一个,产生最小模板成本的MV被视为所述列表的经更新MV,以代替初始MV(来自List0的MV0或来自List1的MV1)。最后,这两个新MV,即MV0'和MV1',如图12中所示,用于使双向预测规则化。如块匹配运动估计中所常用的,绝对差总和(SAD)用作成本量度。
解码器侧运动向量推导(DMVD)可应用于双向预测的合并模式,其中一个来自过去的参考图片,另一个来自将来的参考图片,而无需传输额外语法元素。在JEM4.0中,在针对一个CU选择LIC、仿射(affine)、子CU合并候选项或FRUC时,不应用DMVD。
根据本公开的技术,视频编码器20和视频解码器30可以基于以下约束从基于DMVD的双边模板匹配导出的运动向量:(1)约束条件包含所导出MV是不是对称的、(2)初始MV和通过DMVD方法导出的MV之间的MV差是不是对称的、(3)所导出MV是不是反对称的,和/或(4)初始MV和通过DMVD方法导出的MV之间的MV差是不是反对称的。可以在约束条件上设置条件,使得约束条件仅基于初始MV或双边模板应用。
图13A和13B是示出在JEM的实例中与重叠块运动补偿(OBMC)有关的概念的概念图。OBMC一直用于早期版本的视频标准,例如,在H.263中。在JEM的实例中,除了CU的右侧和底部边界以外,针对运动经补偿(MC)块边界执行OBMC。此外,OBMC应用于亮度和色度分量两者。在JEM的一个实例中,MC块对应于译码块。在CU用子CU模式(包含子CU合并、仿射和FRUC模式)译码时,CU的每一子块是MC块。为了以均匀方式处理CU边界,OBMC对于所有MC块边界都在子块层级处执行,其中子块大小设置成等于4x4,如图13A和13B中所示。
除了当前运动向量之外,视频编码器20和视频解码器30还可将OBMC应用到当前子块,如果可用且不与当前运动向量相同,那么四个经连接相邻子块的运动向量也用于导出当前子块的预测块。这些基于多个运动向量的多个预测块进行组合以生成当前子块的最终预测信号。
图14A-14D是示出OBMC加权的概念图。图14A-14D说明基于相邻子块的运动向量的预测块表示为PN,其中N指示相邻上方(图14A)、下方(图14B)、左侧(图14C)和右侧(图14D)子块的索引,且基于当前子块的运动向量的预测块表示为PC。在PN是基于含有与当前子块相同的运动信息的相邻子块的运动信息时,不从PN执行OBMC。在其它情况下,PN的每个像素添加到PC中的相同像素中,即,PN的四个行/列添加到PC中。加权因数{1/4,1/8,1/16,1/32}用于PN,且加权因数{3/4,7/8,15/16,31/32}用于PC。例外是小型MC块,(即,在译码块的高度或宽度等于4或CU用子CU模式译码时),其中PN仅有两个行/列添加到PC中。在此情况下,加权因数{1/4,1/8}用于PN,且加权因数{3/4,7/8}用于PC。对于基于竖直(水平)相邻子块的运动向量所生成的PN,在PN的相同行(列)中的像素添加到具有相同加权因数的PC中。应注意,BIO也应用于预测块PN的推导。
在JEM的实例中,对于大小小于或等于256个亮度样本的CU,传送指示OBMC是否应用于当前CU的CU层级标志。对于大小大于256个亮度样本或者不用AMVP模式译码的CU,默认应用OBMC。在编码器处,在OBMC应用于CU时,在运动估计阶段期间考虑它的影响。通过使用顶部相邻块和左侧相邻块的运动信息的预测信号用于补偿当前CU的原始信号的顶部和左侧边界,并且接着应用正常运动估计过程。
根据本公开的技术,视频编码器20和视频解码器30可基于以下约束从OBMC导出的运动向量:(1)约束条件包含所导出MV是不是对称的、(2)初始MV和通过DMVD方法导出的MV之间的MV差是不是对称的、(3)所导出MV是不是反对称的,和/或(4)初始MV和通过DMVD方法导出的MV之间的MV差是不是反对称的。可以在约束条件上设置条件,使得约束条件仅基于初始MV应用。
DMVD相关方法(例如,BIO、FRUC双边匹配、FRUC模板匹配、双边模板匹配等等)可提供有效位速率降低。本公开描述若干种可进一步改进DMVD的技术,从而可以提高译码效率和/或降低位速率。例如,约束(1)通过DMVD导出的MV和/或(2)初始MV和通过DMVD导出的MV之间的MV差可以提高译码效率和/或降低位速率。
下方的表3描述下文所使用的各种术语。
表3
对称运动向量——在一些实例中,通过DMVD导出的MV可受视频译码器(例如,视频编码器20或视频解码器30)约束,使得所导出MV必须对称。在一个实例中,为了对称,视频译码器(例如,视频编码器20或视频解码器30)可经配置以约束所导出MV,使得所导出MV符合以下相对于彼此的条件的一或多个(例如,所有):
1.L0_MV_X_Derived*(CURR_POC-L1_POC_Derived)=L1_MV_X_Derived*(CURR_POC-L0_POC_Derived),和/或
2.L0_MV_Y_Derived*(CURR_POC-L1_POC_Derived)=L1_MV_Y_Derived*(CURR_POC-L0_POC_Derived)。
在一些实例中,上方的条件(1)和(2)可分别被视为单独的对称MV约束条件,或者在同时应用时可被视为单个对称MV约束条件。在这方面,本文中提及启用约束条件可以指启用一个用作约束条件的条件。例如,提及启用对称MV约束条件可包含:(i)启用上方的条件(1),(ii)启用上方的条件(2),或(iii)启用条件(1)和(2)。
在一些实例中,为了实现进一步简化和/或译码改进,通过DMVD导出的MV可受视频译码器(例如,视频编码器20或视频解码器30)约束,使得可能需要所导出MV符合下方条件(其可被称作伪对称条件)中的一或多个(例如,所有、在条件(1)为真时的条件(a)和/或(b),和/或在条件(2)为真时的条件(c)和/或(d)):
1.当List0和List1参考图片均在当前图片之前或均在当前图片之后时(例如,(CURR_POC-L0_POC_Derived)*(CURR_POC-L1_POC_Derived)>0),
a.L0_MV_X_Derived=L1_MV_X_Derived,和/或
b.L0_MV_Y_Derived=L1_MV_Y_Derived;
和/或
2.当List0和List1参考图片并非均在当前图片之前或并非均在当前图片之后时(例如,(CURR_POC-L0_POC_Derived)*(CURR_POC-L1_POC_Derived)<0),
c.L0_MV_X_Derived=-1*L1_MV_X_Derived,和/或
d.L0_MV_Y_Derived=-1*L1_MV_Y_Derived。
在一些实例中,视频译码器(例如,视频编码器20或视频解码器30)可经配置以通过配置成使用(例如)初始MV的POC信息和/或所导出MV的POC信息来检查或确定POC差。例如,视频译码器(例如,视频编码器20或视频解码器30)可经配置以基于(例如)初始MV的POC信息和/或所导出MV的POC信息来检查或确定POC差。
对称运动向量差——在一些实例中,初始MV和通过DMVD导出的MV之间的MV差可受视频译码器(例如,视频编码器20或视频解码器30)约束,使得MV差必须对称。MV差是初始MV和通过DMVD导出的MV之间的差。MV差可基于X分量和Y分量来确定。在一个实例中,为了对称,视频译码器(例如,视频编码器20或视频解码器30)可经配置以需要所导出MV差符合以下条件中的一或多个(例如,所有):
1.L0_MV_X_Diff*(CURR_POC-L1_POC_Derived)=L1_MV_X_Diff*(CURR_POC-L0_POC_Derived),和/或
2.L0_MV_Y_Diff*(CURR_POC-L1_POC_Derived)=L1_MV_Y_Diff*(CURR_POC-L0_POC_Derived)。
在一些实例中,为了实现进一步简化和/或译码改进,通过DMVD导出的MV差可受视频译码器(例如,视频编码器20或视频解码器30)约束,使得可能需要所导出MV差符合以下条件(其可被称作伪对称条件)中的一或多个(例如,所有、在条件(1)为真时的条件(a)和/或(b),和/或在条件(2)为真时的条件(c)和/或(d)):
1.当List0和List1参考图片均在当前图片之前或均在当前图片之后时(例如,(CURR_POC-L0_POC_Init)*(CURR_POC-L1_POC_Init)>0),
a.L0_MV_X_Diff=L1_MV_X_Diff,和/或
b.L0_MV_Y_Diff=L1_MV_Y_Diff;
和/或
2.当List0和List1参考图片并非均在当前图片之前或并非均在当前图片之后时(例如,(CURR_POC-L0_POC_Init)*(CURR_POC-L1_POC_Init)<0),
c.L0_MV_X_Diff=-1*L1_MV_X_Diff,和/或
d.L0_MV_Y_Diff=-1*L1_MV_Y_Diff。
在一些实例中,视频译码器(例如,视频编码器20或视频解码器30)可经配置以通过配置成使用(例如)初始MV的POC信息和/或所导出MV的POC信息来检查或确定POC差。例如,视频译码器(例如,视频编码器20或视频解码器30)可经配置以基于(例如)初始MV的POC信息和/或所导出MV的POC信息来检查或确定POC差。
反对称运动向量——在一些实例中,通过DMVD导出的MV可受视频译码器(例如,视频编码器20或视频解码器30)约束,使得所导出MV必须反对称。在一个实例中,为了反对称,视频译码器(例如,视频编码器20或视频解码器30)可经配置以需要所导出MV符合以下条件中的一或多个(例如,所有):
1.L0_MV_X_Derived*(CURR_POC-L1_POC_Derived)=-1*L1_MV_X_Derived*(CURR_POC-L0_POC_Derived),和/或
2.L0_MV_Y_Derived*(CURR_POC-L1_POC_Derived)=-1*L1_MV_Y_Derived*(CURR_POC-L0_POC_Derived)。
在一些实例中,为了实现进一步简化和/或译码改进,通过DMVD导出的MV差可受视频译码器(例如,视频编码器20或视频解码器30)约束,使得可能需要所导出MV差符合以下条件(其可被称作伪反对称条件)中的一或多个(例如,所有、在条件(1)为真时的条件(a)和/或(b),和/或在条件(2)为真时的条件(c)和/或(d)):
1.当List0和List1参考图片均在当前图片之前或均在当前图片之后时(例如,(CURR_POC-L0_POC_Derived)*(CURR_POC-L1_POC_Derived)>0),
a.L0_MV_X_Derived=-1*L1_MV_X_Derived,和/或
b.L0_MV_Y_Derived=-1*L1_MV_Y_Derived;
和/或
2.当List0和List1参考图片并非均在当前图片之前或并非均在当前图片之后时(例如,(CURR_POC-L0_POC_Derived)*(CURR_POC-L1_POC_Derived)<0),
c.L0_MV_X_Derived=L1_MV_X_Derived,和/或
d.L0_MV_Y_Derived=L1_MV_Y_Derived。
在一些实例中,视频译码器(例如,视频编码器20或视频解码器30)可经配置以通过配置成使用(例如)初始MV的POC信息和/或所导出MV的POC信息来检查或确定POC差。例如,视频译码器(例如,视频编码器20或视频解码器30)可经配置以基于(例如)初始MV的POC信息和/或所导出MV的POC信息来检查或确定POC差。
反对称运动向量差——在一些实例中,初始MV和通过DMVD导出的MV之间的MV差可受视频译码器(例如,视频编码器20或视频解码器30)约束,使得MV差必须反对称。在一个实例中,为了反对称,视频译码器(例如,视频编码器20或视频解码器30)可经配置以需要所导出MV差符合以下条件中的一或多个(例如,所有):
1.L0_MV_X_Diff*(CURR_POC-L1_POC_Derived)=-1*L1_MV_X_Diff*(CURR_POC-L0_POC_Derived),和/或
2.L0_MV_Y_Diff*(CURR_POC-L1_POC_Derived)=-1*L1_MV_Y_Diff*(CURR_POC-L0_POC_Derived)。
在一些实例中,为了实现进一步简化和/或译码改进,通过DMVD导出的MV差可受视频译码器(例如,视频编码器20或视频解码器30)约束,使得可能需要所导出MV差符合以下条件(其可被称作伪反对称条件)中的一或多个(例如,所有、在条件(1)为真时的条件(a)和/或(b),和/或在条件(2)为真时的条件(c)和/或(d)):
1.当List0和List1参考图片均在当前图片之前或均在当前图片之后时(例如,(CURR_POC-L0_POC_Init)*(CURR_POC-L1_POC_Init)>0),
a.L0_MV_X_Diff=-1*L1_MV_X_Diff,和/或
b.L0_MV_Y_Diff=-1*L1_MV_Y_Diff;
和/或
2.当List0和List1参考图片并非均在当前图片之前或并非均在当前图片之后时(例如,(CURR_POC-L0_POC_Init)*(CURR_POC-L1_POC_Init)<0),
c.L0_MV_X_Diff=L1_MV_X_Diff,和/或
d.L0_MV_Y_Diff=L1_MV_Y_Diff。
在一些实例中,视频译码器(例如,视频编码器20或视频解码器30)可经配置以通过配置成使用(例如)初始MV的POC信息和/或所导出MV的POC信息来检查或确定POC差。例如,视频译码器(例如,视频编码器20或视频解码器30)可经配置以基于(例如)初始MV的POC信息和/或所导出MV的POC信息来检查或确定POC差。
应用MV/MV差约束条件的条件——在一些实例中,关于DMVD运动信息的约束条件(例如,对称/反对称MV/MV差约束条件)的启用可显式地传送或可根据一些经译码信息隐式地确定。在一些实例中,传送约束条件的启用或确定约束条件的启用可分别描述为传送已应用或将应用约束条件或确定约束条件已应用或将应用。
在一些实例中,视频编码器(例如,视频编码器20)可经配置以启用本文中所描述的MV和/或MV差约束条件中的一或多个。例如,视频编码器(例如,视频编码器20)可经配置以传送指示是否启用一或多个约束条件的一或多个值。
作为一个实例,视频编码器(例如,视频编码器20)可经配置以传送位流中对应于第一语法元素的值,其中对应于第一语法元素的值指示是否启用一或多个对称MV约束条件。值可以是指示启用的真值(例如,值1)或指示停用的虚值(例如,值0),或者值可以是指示启用的虚值(例如,值0)或指示停用的真值(例如,值1)。在一些实例中,视频编码器(例如,视频编码器20)可经配置以仅在启用一或多个对称MV约束条件时传送对应于第一语法元素的值。在其它实例中,视频编码器(例如,视频编码器20)可经配置以仅在停用一或多个对称MV约束条件时传送对应于第一语法元素的值。
作为另一实例,视频编码器(例如,视频编码器20)可经配置以传送位流中对应于第二语法元素的值,其中对应于第二语法元素的值指示是否启用一或多个对称MV差约束条件。值可以是指示启用的真值(例如,值1)或指示停用的虚值(例如,值0),或者值可以是指示启用的虚值(例如,值0)或指示停用的真值(例如,值1)。在一些实例中,视频编码器(例如,视频编码器20)可经配置以仅在启用一或多个对称MV差约束条件时传送对应于第二语法元素的值。在其它实例中,视频编码器(例如,视频编码器20)可经配置以仅在停用一或多个对称MV差约束条件时传送对应于第二语法元素的值。
作为另一实例,视频编码器(例如,视频编码器20)可经配置以传送位流中对应于第三语法元素的值,其中对应于第三语法元素的值指示是否启用一或多个反对称MV约束条件。值可以是指示启用的真值(例如,值1)或指示停用的虚值(例如,值0),或者值可以是指示启用的虚值(例如,值0)或指示停用的真值(例如,值1)。在一些实例中,视频编码器(例如,视频编码器20)可经配置以仅在启用一或多个反对称MV约束条件时传送对应于第三语法元素的值。在其它实例中,视频编码器(例如,视频编码器20)可经配置以仅在停用一或多个反对称MV约束条件时传送对应于第三语法元素的值。
作为另一实例,视频编码器(例如,视频编码器20)可经配置以传送位流中对应于第四语法元素的值,其中对应于第四语法元素的值指示是否启用一或多个反对称MV差约束条件。值可以是指示启用的真值(例如,值1)或指示停用的虚值(例如,值0),或者值可以是指示启用的虚值(例如,值0)或指示停用的真值(例如,值1)。在一些实例中,视频编码器(例如,视频编码器20)可经配置以仅在启用一或多个反对称MV差约束条件时传送对应于第四语法元素的值。在其它实例中,视频编码器(例如,视频编码器20)可经配置以仅在停用一或多个反对称MV差约束条件时传送对应于第四语法元素的值。
在一些实例中,视频译码器(例如,视频解码器30)可经配置以接收位流,并基于存在于位流中且对应于一或多个语法元素(例如,本文中所描述的第一、第二、第三和第四语法元素中的一或多个)的一或多个值确定本文中所描述的MV和/或MV差约束条件中的一或多个是否启用。
在其它实例中,视频译码器(例如,视频编码器20或视频解码器30)可经配置以基于其它经译码信息确定(例如,隐式地确定)本文中所描述的MV和/或MV差约束条件中的一或多个是否启用。
自适应地启用本文中所描述的一或多个约束条件(例如,对称/反对称MV/MV差约束条件中的一或多个)的若干个实例条件列出如下。
1.在一些实例中,本文中所描述的一或多个约束条件(例如,一或多个对称/反对称MV/MV差约束条件)可仅在初始MV对称时启用。
2.在一些实例中,本文中所描述的一或多个约束条件(例如,一或多个对称/反对称MV/MV差约束条件)可仅在初始MV伪对称时启用。
3.在一些实例中,本文中所描述的一或多个约束条件(例如,一或多个对称/反对称MV/MV差约束条件)可仅在初始MV反对称时启用。
4.在一些实例中,本文中所描述的一或多个约束条件(例如,一或多个对称/反对称MV/MV差约束条件)可仅在初始MV伪反对称时启用。
5.在一些实例中,本文中所描述的一或多个约束条件(例如,一或多个对称/反对称MV/MV差约束条件)可仅在初始MV不对称时启用。
6.在一些实例中,本文中所描述的一或多个约束条件(例如,一或多个对称/反对称MV/MV差约束条件)可仅在初始MV非伪对称时启用。
7.在一些实例中,本文中所描述的一或多个约束条件(例如,一或多个对称/反对称MV/MV差约束条件)可仅在初始MV非反对称时启用。
8.在一些实例中,本文中所描述的一或多个约束条件(例如,一或多个对称/反对称MV/MV差约束条件)可仅在初始MV非伪反对称时启用。
9.在一些实例中,本文中所描述的一或多个约束条件(例如,一或多个对称/反对称MV/MV差约束条件)可仅在初始MV的List0和List1参考图片均在当前图片之前或均在当前图片之后时启用。
10.在一些实例中,本文中所描述的一或多个约束条件(例如,一或多个对称/反对称MV/MV差约束条件)可仅在初始MV的List0和List1参考图片并非均在当前图片之前或并非均在当前图片之后时启用。
11.在一些实例中,本文中所描述的一或多个约束条件(例如,一或多个对称/反对称MV/MV差约束条件)可仅在初始MV的参考索引均为零时启用。
12.在一些实例中,本文中所描述的一或多个约束条件(例如,一或多个对称/反对称MV/MV差约束条件)可仅在初始MV的参考索引并非均为零时启用。
13.在一些实例中,本文中所描述的一或多个约束条件(例如,一或多个对称/反对称MV/MV差约束条件)可仅在List0参考图片和当前图片之间的POC距离与List1参考图片和当前图片之间的POC距离相同时启用。
14.在一些实例中,本文中所描述的一或多个约束条件(例如,一或多个对称/反对称MV/MV差约束条件)可仅在List0参考图片和当前图片之间的POC距离与List1参考图片和当前图片之间的POC距离不同时启用。
15.在一些实例中,一或多个对称MV差约束条件可以在初始MV不对称时应用,
16.在一些实例中,一或多个反对称MV差约束条件可以在初始MV对称时应用,
17.在一些实例中,可以确定性的方式指派对称约束条件中的一或多个的MV分辨率。在一个实例中,对于双边模板匹配的整数像素细化,应该施加无对称/伪对称/不对称约束条件,且前述约束条件仅用于半像素、四分之一像素或更高精度的运动细化。约束水平(处于哪一MV分辨率)可以通过SPS/PPS/切片标头传送。分辨率还可与是否启用其它运动细化工具(例如,BIO、子像素FRUC)一同判定。例如,在启用BIO时,约束条件不应施加于四分之一像素或更高精度的运动细化。
18.在一些实例中,根据List0和List1 MV之间的绝对差、List0和List1 MV之间的经缩放(基于它们的相对POC距离)绝对差或List0和List1的经内插样本(即,此实例中的P0和P1)之间的初始SAD值,约束水平可以是自适应的。在其它实例中,(当前模板,P0)和(当前模板,P1)之间的绝对差总和(SAD)值的比率可用于判定应该在哪一MV分辨率下施加约束条件。在此实例中,如果SAD值的比率低于阈值,那么不应该施加任何前述对称约束条件。
表4列出基于符合以上条件而应用的条件和约束条件的实例。
此实例在表4中示出为约束条件实例1,表4还包含不同约束条件的其它实例。
表4:条件和约束条件的实例
图15示出根据本公开的双边模板匹配的示例性用例。图15示出其中本文中所描述的一或多个伪对称MV差约束条件可以仅在初始MV不对称时应用到双边模板匹配的实例。根据此类实例,对于双边模板匹配,在初始MV不对称时,最终MV可以导出使得初始MV和最终MV之间的MV差必须是伪对称的。例如,如图15中所示,可首先使用List0(L0_MV_Init,指向块R0 1502)和List1(L1_MV_Init,指向块R1 1504)中的初始MV(例如,双向预测合并候选项的MV)通过对R0和R1取平均来导出双边模板1506,并且接着双边模板1506可用于搜索List0和List1中的最佳匹配块以查找最佳List0/List1MV。双边模板匹配可在预定义搜索范围(例如,-1到+1整数像素)内执行,所述预定义搜索范围的中心位于搜索块的List0/List1中的初始MV,例如,R'0 1508和R'1 1510。初始块(块R0 1502和块R1 1504)和搜索块(R'0 1508和R'1 1510)之间的差由相应的MV差(表示为L0_MV_Diff和L1_MV_Diff)示出。在一些实例中,List0和List1中仅具有伪对称MV差(比较L0_MV_Diff和L1_MV_Diff)的MV对可以被视为有效MV。接着,具有最佳匹配成本的有效MV对可以被视为通过双边模板匹配导出的最终MV。所示实例在上方示出的表4中表示为约束条件实例1。
图16是示出根据本公开的技术的实例方法的流程图。图16的技术可由目的地装置14或视频解码器30(请参见图1和3)中的一或多个来实施。
在本公开的一个实例中,视频解码器30可经配置以使用解码器侧运动向量推导(DMVD)生成多个所导出运动向量(100)。在一些实例中,使用DMVD生成所述多个所导出运动向量包括使用BIO过程、FRUC过程、双边匹配过程、FRUC模板匹配过程或双边模板匹配过程中的一个。在一些实例中,视频解码器30可基于确定第一和第二初始运动向量是否符合一或多个条件来生成所述多个所导出运动向量。视频解码器30可经配置以基于成本度量并确定是否符合约束条件来确定所述多个所导出运动向量中的第一所导出运动向量和第二所导出运动向量(102)。在实例中,成本度量包含绝对差总和。约束条件可包含第一所导出运动向量和第二所导出运动向量是具有对称运动向量差,还是具有伪对称运动向量差,还是反对称的,还是具有反对称运动向量差,还是具有伪反对称运动向量差。视频解码器30可经配置以确定第一所导出运动向量和第二所导出运动向量是具有对称运动向量差,还是具有伪对称运动向量差,还是反对称的,还是具有反对称运动向量差,还是具有伪反对称运动向量差。约束条件可以通过位流传送,可以进行推导或预编程。
在实例中,视频解码器30可经配置以确定第一所导出运动向量和第二所导出运动向量具有对称运动向量差包括确定:L0_MV_X_Diff*(CURR_POC-L1_POC_Derived)=L1_MV_X_Diff*(CURR_POC-L0_POC_Derived)或L0_MV_Y_Diff*(CURR_POC-L1_POC_Derived)=L1_MV_Y_Diff*(CURR_POC-L0_POC_Derived),其中:L0_MV_X_Diff是第一初始运动向量和第一所导出运动向量之间的差的X分量,L0_MV_Y_Diff是第一初始运动向量和第一所导出运动向量之间的差的Y分量,L1_MV_X_Diff是第二初始运动向量和第二所导出运动向量之间的差的X分量,L1_MV_Y_Diff是第二初始运动向量和第二所导出运动向量之间的差的Y分量,CURR_POC是当前图片的当前POC,L0_POC_Derived是第一运动向量列表的所导出POC,且L1_POC_Derived是第二运动向量列表的所导出POC。
在另一实例中,视频解码器30可经配置以确定第一所导出运动向量和第二所导出运动向量具有反对称运动向量差包括确定:L0_MV_X_Diff*(CURR_POC-L1_POC_Derived)=-1*L1_MV_X_Diff*(CURR_POC-L0_POC_Derived),或L0_MV_Y_Diff*(CURR_POC-L1_POC_Derived)=-1*L1_MV_Y_Diff*(CURR_POC-L0_POC_Derived),其中:L0_MV_X_Diff是第一初始运动向量和第一所导出运动向量之间的差的X分量,L0_MV_Y_Diff是第一初始运动向量和第一所导出运动向量之间的差的Y分量,L1_MV_X_Diff是第二初始运动向量和第二所导出运动向量之间的差的X分量,L1_MV_Y_Diff是第二初始运动向量和第二所导出运动向量之间的差的Y分量,CURR_POC是当前图片的当前POC,L0_POC_Derived是第一运动向量列表的所导出POC,且L1_POC_Derived是第二运动向量列表的所导出POC。
在另一实例中,视频解码器30可经配置以确定第一所导出运动向量和第二所导出运动向量反对称包括确定:L0_MV_X_Derived*(CURR_POC-L1_POC_Derived)=-1*L1_MV_X_Derived*(CURR_POC-L0_POC_Derived),或L0_MV_Y_Derived*(CURR_POC-L1_POC_Derived)=-1*L1_MV_Y_Derived*(CURR_POC-L0_POC_Derived),其中:L0_MV_X_Derived是第一所导出运动向量的X分量,L0_MV_Y_Derived是第一所导出运动向量的Y分量,L1_MV_X_Derived是第二所导出运动向量的X分量,L1_MV_Y_Derived是第二所导出运动向量的Y分量,CURR_POC是当前图片的当前POC,L0_POC_Derived是第一运动向量列表的所导出POC,且L1_POC_Derived是第二运动向量列表的所导出POC。
在另一实例中,视频解码器30可经配置以确定第一所导出运动向量和第二所导出运动向量具有伪对称运动向量差包括确定:L0_MV_X_Diff=L1_MV_X_Diff,L0_MV_Y_Diff=L1_MV_Y_Diff,L0_MV_X_Diff=-1*L1_MV_X_Diff,或L0_MV_Y_Diff=-1*L1_MV_Y_Diff;其中:L0_MV_X_Diff是第一初始运动向量和第一所导出运动向量之间的差的X分量,L0_MV_Y_Diff是第一初始运动向量和第一所导出运动向量之间的差的Y分量,L1_MV_X_Diff是第二初始运动向量和第二所导出运动向量之间的差的X分量,且L1_MV_Y_Diff是第二初始运动向量和第二所导出运动向量之间的差的Y分量。
在另一实例中,视频解码器30可经配置以确定第一所导出运动向量和第二所导出运动向量具有伪反对称运动向量差包括确定:L0_MV_X_Diff=L1_MV_X_Diff,L0_MV_Y_Diff=L1_MV_Y_Diff,L0_MV_X_Diff=-1*L1_MV_X_Diff,或L0_MV_Y_Diff=-1*L1_MV_Y_Diff;其中:L0_MV_X_Diff是第一初始运动向量和第一所导出运动向量之间的差的X分量,L0_MV_Y_Diff是第一初始运动向量和第一所导出运动向量之间的差的Y分量,L1_MV_X_Diff是第二初始运动向量和第二所导出运动向量之间的差的X分量,且L1_MV_Y_Diff是第二初始运动向量和第二所导出运动向量之间的差的Y分量。
在另一实例中,视频解码器30可经配置以确定运动向量候选项列表中的第一初始运动向量和运动向量候选项列表中的第二初始运动向量满足关于第一初始运动向量和第二初始运动向量之间的关系的至少一个条件,所述关系包括:第一初始运动向量和第二初始运动向量是对称的、第一初始运动向量和第二初始运动向量是伪对称的、第一初始运动向量和第二初始运动向量具有对称运动向量差、第一初始运动向量和第二初始运动向量是反对称的、第一初始运动向量和第二初始运动向量是伪反对称的,或第一初始运动向量和第二初始运动向量具有反对称运动向量差,其中生成所述多个所导出运动向量是基于第一初始运动向量和第二初始运动满足所述至少一个条件。
在另一实例中,视频解码器30可经配置以确定运动向量候选项列表中的第一初始运动向量和运动向量候选项列表中的第二初始运动向量是在当前图片之前还是在当前图片之后,其中基于成本度量根据所述多个所导出运动向量确定第一所导出运动向量和第二所导出运动向量进一步基于所述确定。
在另一实例中,视频解码器30可经配置以确定与第一运动向量候选项列表相关联的第一参考图片和当前图片之间的第一图片次序计数(POC)距离是否为零且与第二运动向量候选项列表相关联的第二参考图片和当前图片之间的第二POC距离是否为零,其中基于成本度量根据所述多个所导出运动向量确定第一所导出运动向量和第二所导出运动向量进一步基于所述确定。
在另一实例中,视频解码器30可经配置以确定与第一运动向量候选项列表相关联的第一参考图片和当前图片之间的第一图片次序计数(POC)距离是否为零且与第二运动向量候选项列表相关联的第二参考图片和当前图片之间的第二POC距离是否为零,其中基于成本度量根据所述多个所导出运动向量确定第一所导出运动向量和第二所导出运动向量进一步基于以下确定:确定与第一运动向量候选项列表相关联的第一参考图片和当前图片之间的第一POC距离为零且与第二运动向量候选项列表相关联的第二参考图片和当前图片之间的第二POC距离为零。
在另一实例中,视频解码器30可经配置以根据经编码视频位流确定至少一个约束条件。
视频解码器30可经配置以使用所确定的第一所导出运动向量和第二所导出运动向量对当前块进行解码(104)。
图17是示出根据本公开的技术的实例方法的流程图。图17的技术可由源装置12或视频编码器20(请参见图1和2)中的一或多个实施。
视频编码器20可经配置以使用DMVD生成多个所导出运动向量(200)。在一些实例中,视频编码器20可基于确定第一和第二初始运动向量是否符合一或多个条件来生成所述多个所导出运动向量。
视频编码器20可经配置以基于成本度量并确定是否符合约束条件来确定所述多个所导出运动向量中的第一所导出运动向量和第二所导出运动向量(202)。约束条件可包含第一所导出运动向量和第二所导出运动向量是具有对称运动向量差,还是具有伪对称运动向量差,还是反对称的,还是具有反对称运动向量差,还是具有伪反对称运动向量差。视频编码器20可经配置以使用所确定的第一所导出运动向量和第二所导出运动向量对当前块进行编码(204)。视频编码器20可经配置以对约束条件进行译码。视频编码器20可经进一步配置以通过位流发送约束条件。
应认识到,取决于实例,本文中所描述的技术中的任一者的某些动作或事件可用不同顺序来执行,可添加、合并或全部省略所述动作或事件(例如,实践所述技术未必需要所有所描述动作或事件)。此外,在某些实例中,可(例如)通过多线程处理、中断处理或多个处理器同时而非依序地执行动作或事件。
在一或多个实例中,所描述的功能可以用硬件、软件、固件或其任何组合实施。如果用软件实施,那么所述功能可作为一或多个指令或代码在计算机可读媒体上存储或传输,并且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,其对应于例如数据存储媒体的有形媒体,或通信媒体,所述通信媒体包含有助于例如根据通信协议将计算机程序从一处传递到另一处的任何媒体。以此方式,计算机可读媒体通常可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)通信媒体,例如信号或载波。数据存储媒体可为可由一或多个计算机或者一或多个处理器存取以撷取用于实施本公开中描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可以包含计算机可读媒体。
借助于实例而非限制,此类计算机可读存储媒体可包含RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器,或可用以存储呈指令或数据结构形式的所要程序代码且可由计算机存取的任何其它媒体。并且,适当地将任何连接称作计算机可读媒体。例如,如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输指令,那么同轴电缆、光纤电缆、双绞线、DSL或例如红外线、无线电和微波等无线技术包含在媒体的定义中。然而,应理解,所述计算机可读存储媒体和数据存储媒体并不包含连接、载波、信号或其它暂时性媒体,而是代替地针对非暂时性的有形存储媒体。如本文所使用的磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软盘及蓝光光盘,其中磁盘通常是以磁性方式再现数据,而光盘是用激光以光学方式再现数据。以上各项的组合也应包含在计算机可读媒体的范围内。
指令可由一或多个处理器执行,例如一或多个数字信号处理器(DSP)、通用微处理器、处理电路系统(包含固定功能电路系统和/或可编程处理电路系统)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它等效集成逻辑电路系统或离散逻辑电路系统。因此,如本文中所使用的术语“处理器”可指代上述结构或适合于实施本文中所描述的技术的任何其它结构中的任一个。另外,在一些方面中,本文中所描述的功能性可设置在经配置以用于编码和解码的专用硬件和/或软件模块内,或并入在组合编解码器中。而且,所述技术可完全实施于一或多个电路或逻辑元件中。
本公开的技术可实施于广泛多种装置或设备中,包括无线手持机、集成电路(IC)或一组IC(例如,芯片组)。本公开中描述各种组件、模块或单元以强调经配置以执行所公开的技术的装置的功能方面,但未必需要由不同硬件单元实现。确切地说,如上文所描述,各种单元可结合合适的软件和/或固件组合在编解码器硬件单元中,或由互操作硬件单元的集合来提供,所述硬件单元包含如上文所描述的一或多个处理器。
已描述各种实例。这些和其它实例在所附权利要求书的范围内。
Claims (30)
1.一种对来自经编码视频位流的视频数据进行解码的方法,所述方法包括:
使用解码器侧运动向量推导DMVD生成多个所导出运动向量;
基于成本度量,根据所述多个所导出运动向量确定第一所导出运动向量和第二所导出运动向量,包括:
确定所述第一所导出运动向量和所述第二所导出运动向量满足关于所述第一所导出运动向量和所述第二所导出运动向量之间的关系的至少一个约束条件,所述关系包括:所述第一所导出运动向量和所述第二所导出运动向量具有对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量具有伪对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量是反对称的、所述第一所导出运动向量和所述第二所导出运动向量具有反对称运动向量差或所述第一所导出运动向量和所述第二所导出的运动向量具有伪反对称运动向量差;以及
使用双向预测,使用所确定的所述第一所导出运动向量和所述第二所导出运动向量对当前块进行解码。
2.根据权利要求1所述的方法,其中使用DMVD生成所述多个所导出运动向量包括使用双向光流BIO过程、帧速率上转换FRUC过程、双边匹配过程、FRUC模板匹配过程或双边模板匹配过程中的一个。
3.根据权利要求1所述的方法,其中确定所述第一所导出运动向量和所述第二所导出运动向量具有所述对称运动向量差包括确定:
L0_MV_X_Diff*(CURR_POC-L1_POC_Derived)=L1_MV_X_Diff*(CURR_POC-L0_POC_Derived),或
L0_MV_Y_Diff*(CURR_POC-L1_POC_Derived)=L1_MV_Y_Diff*(CURR_POC-L0_POC_Derived),
其中:
L0_MV_X_Diff是第一初始运动向量和所述第一所导出运动向量之间的差的X分量,
L0_MV_Y_Diff是所述第一初始运动向量和所述第一所导出运动向量之间的差的Y分量,
L1_MV_X_Diff是第二初始运动向量和所述第二所导出运动向量之间的差的X分量,
L1_MV_Y_Diff是所述第二初始运动向量和所述第二所导出运动向量之间的差的Y分量,
CURR_POC是当前图片的当前图片次序计数POC,
L0_POC_Derived是第一运动向量列表的所导出POC,且
L1_POC_Derived是第二运动向量列表的所导出POC。
4.根据权利要求1所述的方法,其中确定所述第一所导出运动向量和所述第二所导出运动向量具有所述反对称运动向量差包括确定:
L0_MV_X_Diff*(CURR_POC-L1_POC_Derived)=-1*L1_MV_X_Diff*(CURR_POC-L0_POC_Derived),或
L0_MV_Y_Diff*(CURR_POC-L1_POC_Derived)=-1*L1_MV_Y_Diff*(CURR_POC-L0_POC_Derived)
其中:
L0_MV_X_Diff是第一初始运动向量和所述第一所导出运动向量之间的差的X分量,
L0_MV_Y_Diff是所述第一初始运动向量和所述第一所导出运动向量之间的差的Y分量,
L1_MV_X_Diff是第二初始运动向量和所述第二所导出运动向量之间的差的X分量,
L1_MV_Y_Diff是所述第二初始运动向量和所述第二所导出运动向量之间的差的Y分量,
CURR_POC是当前图片的当前图片次序计数POC,
L0_POC_Derived是第一运动向量列表的所导出POC,且
L1_POC_Derived是第二运动向量列表的所导出POC。
5.根据权利要求1所述的方法,其中确定所述第一所导出运动向量和所述第二所导出运动向量反对称包括确定:
L0_MV_X_Derived*(CURR_POC-L1_POC_Derived)=-1*L1_MV_X_Derived*(CURR_POC-L0_POC_Derived),或
L0_MV_Y_Derived*(CURR_POC-L1_POC_Derived)=-1*L1_MV_Y_Derived*(CURR_POC-L0_POC_Derived),
其中:
L0_MV_X_Derived是所述第一所导出运动向量的X分量,
L0_MV_Y_Derived是所述第一所导出运动向量的Y分量,
L1_MV_X_Derived是所述第二所导出运动向量的X分量,
L1_MV_Y_Derived是所述第二所导出运动向量的Y分量,
CURR_POC是当前图片的当前图片次序计数POC,
L0_POC_Derived是第一运动向量列表的所导出POC,且
L1_POC_Derived是第二运动向量列表的所导出POC。
6.根据权利要求1所述的方法,其中确定所述第一所导出运动向量和所述第二所导出运动向量具有所述伪对称运动向量差包括确定:
L0_MV_X_Diff=L1_MV_X_Diff,
L0_MV_Y_Diff=L1_MV_Y_Diff,
L0_MV_X_Diff=-1*L1_MV_X_Diff,或
L0_MV_Y_Diff=-1*L1_MV_Y_Diff;
其中:
L0_MV_X_Diff是第一初始运动向量和所述第一所导出运动向量之间的差的X分量,
L0_MV_Y_Diff是所述第一初始运动向量和所述第一所导出运动向量之间的差的Y分量,
L1_MV_X_Diff是第二初始运动向量和所述第二所导出运动向量之间的差的X分量,且
L1_MV_Y_Diff是所述第二初始运动向量和所述第二所导出运动向量之间的差的Y分量。
7.根据权利要求1所述的方法,其中确定所述第一所导出运动向量和所述第二所导出运动向量具有所述伪反对称运动向量差包括确定:
L0_MV_X_Diff=L1_MV_X_Diff,
L0_MV_Y_Diff=L1_MV_Y_Diff,
L0_MV_X_Diff=-1*L1_MV_X_Diff,或
L0_MV_Y_Diff=-1*L1_MV_Y_Diff;
其中:
L0_MV_X_Diff是第一初始运动向量和所述第一所导出运动向量之间的差的X分量,
L0_MV_Y_Diff是所述第一初始运动向量和所述第一所导出运动向量之间的差的Y分量,
L1_MV_X_Diff是第二初始运动向量和所述第二所导出运动向量之间的差的X分量,且
L1_MV_Y_Diff是所述第二初始运动向量和所述第二所导出运动向量之间的差的Y分量。
8.根据权利要求1所述的方法,其进一步包括:
确定运动向量候选项列表中的第一初始运动向量和所述运动向量候选项列表中的第二初始运动向量满足关于所述第一初始运动向量和所述第二初始运动向量之间的关系的至少一个条件,所述关系包括:所述第一初始运动向量和所述第二初始运动向量是对称的、所述第一初始运动向量和所述第二初始运动向量是伪对称的、所述第一初始运动向量和所述第二初始运动向量具有所述对称运动向量差、所述第一初始运动向量和所述第二初始运动向量是反对称的、所述第一初始运动向量和所述第二初始运动向量是伪反对称的,或所述第一初始运动向量和所述第二初始运动向量具有所述反对称运动向量差,
其中生成所述多个所导出运动向量是基于所述第一初始运动向量和所述第二初始运动满足所述至少一个条件。
9.根据权利要求1所述的方法,其进一步包括:
确定运动向量候选项列表中的第一初始运动向量和所述运动向量候选项列表中的第二初始运动向量是在当前图片之前还是在所述当前图片之后,
其中基于所述成本度量根据所述多个所导出运动向量确定所述第一所导出运动向量和所述第二所导出运动向量进一步基于所述确定。
10.根据权利要求1所述的方法,其进一步包括:
确定与第一运动向量候选项列表相关联的第一参考图片和当前图片之间的第一图片次序计数POC距离是否为零且与第二运动向量候选项列表相关联的第二参考图片和所述当前图片之间的第二POC距离是否为零,
其中基于所述成本度量根据所述多个所导出运动向量确定所述第一所导出运动向量和所述第二所导出运动向量进一步基于所述确定。
11.根据权利要求1所述的方法,其进一步包括:
确定与第一运动向量候选项列表相关联的第一参考图片和当前图片之间的第一图片次序计数POC距离是否为零且与第二运动向量候选项列表相关联的第二参考图片和所述当前图片之间的第二POC距离是否为零,
其中基于所述成本度量根据所述多个所导出运动向量确定所述第一所导出运动向量和所述第二所导出运动向量进一步基于所述确定。
12.根据权利要求1所述的方法,其进一步包括:
根据所述经编码视频位流确定所述至少一个约束条件。
13.根据权利要求1所述的方法,其中所述成本度量包含绝对差总和。
14.一种经配置以对来自经编码视频位流的视频数据进行解码的设备,所述设备包括:
存储器,其经配置以存储所述视频数据;以及
与所述存储器通信的一或多个处理器,所述一或多个处理器经配置以:
使用解码器侧运动向量推导DMVD生成多个所导出运动向量;
基于成本度量,根据所述多个所导出运动向量确定第一所导出运动向量和第二所导出运动向量,包括:
确定所述第一所导出运动向量和所述第二所导出运动向量满足关于所述第一所导出运动向量和所述第二所导出运动向量之间的关系的至少一个约束条件,所述关系包括:所述第一所导出运动向量和所述第二所导出运动向量具有对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量具有伪对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量是反对称的、所述第一所导出运动向量和所述第二所导出运动向量具有反对称运动向量差或所述第一所导出运动向量和所述第二所导出的运动向量具有伪反对称运动向量差;以及
使用双向预测,使用所确定的所述第一所导出运动向量和所述第二所导出运动向量对当前块进行解码。
15.根据权利要求14所述的设备,其中使用DMVD生成所述多个所导出运动向量包括使用双向光流BIO过程、帧速率上转换FRUC过程、双边匹配过程、FRUC模板匹配过程或双边模板匹配过程中的一个。
16.根据权利要求14所述的设备,其中所述确定所述第一所导出运动向量和所述第二所导出运动向量具有所述对称运动向量差包括确定:
L0_MV_X_Diff*(CURR_POC-L1_POC_Derived)=L1_MV_X_Diff*(CURR_POC-L0_POC_Derived)或
L0_MV_Y_Diff*(CURR_POC-L1_POC_Derived)=L1_MV_Y_Diff*(CURR_POC-L0_POC_Derived),
其中:
L0_MV_X_Diff是第一初始运动向量和所述第一所导出运动向量之间的差的X分量,
L0_MV_Y_Diff是所述第一初始运动向量和所述第一所导出运动向量之间的差的Y分量,
L1_MV_X_Diff是第二初始运动向量和所述第二所导出运动向量之间的差的X分量,
L1_MV_Y_Diff是所述第二初始运动向量和所述第二所导出运动向量之间的差的Y分量,
CURR_POC是当前图片的当前图片次序计数POC,
L0_POC_Derived是第一运动向量列表的所导出POC,且
L1_POC_Derived是第二运动向量列表的所导出POC。
17.根据权利要求14所述的设备,其中所述确定所述第一所导出运动向量和所述第二所导出运动向量具有所述反对称运动向量差包括确定:
L0_MV_X_Diff*(CURR_POC-L1_POC_Derived)=-1*L1_MV_X_Diff*(CURR_POC-L0_POC_Derived),或
L0_MV_Y_Diff*(CURR_POC-L1_POC_Derived)=-1*L1_MV_Y_Diff*(CURR_POC-L0_POC_Derived)
其中:
L0_MV_X_Diff是第一初始运动向量和所述第一所导出运动向量之间的差的X分量,
L0_MV_Y_Diff是所述第一初始运动向量和所述第一所导出运动向量之间的差的Y分量,
L1_MV_X_Diff是第二初始运动向量和所述第二所导出运动向量之间的差的X分量,
L1_MV_Y_Diff是所述第二初始运动向量和所述第二所导出运动向量之间的差的Y分量,
CURR_POC是当前图片的当前图片次序计数POC,
L0_POC_Derived是第一运动向量列表的所导出POC,且
L1_POC_Derived是第二运动向量列表的所导出POC。
18.根据权利要求14所述的设备,其中所述确定所述第一所导出运动向量和所述第二所导出运动向量反对称包括确定:
L0_MV_X_Derived*(CURR_POC-L1_POC_Derived)=-1*L1_MV_X_Derived*(CURR_POC-L0_POC_Derived),或
L0_MV_Y_Derived*(CURR_POC-L1_POC_Derived)=-1*L1_MV_Y_Derived*(CURR_POC-L0_POC_Derived),
其中:
L0_MV_X_Derived是所述第一所导出运动向量的X分量,
L0_MV_Y_Derived是所述第一所导出运动向量的Y分量,
L1_MV_X_Derived是所述第二所导出运动向量的X分量,
L1_MV_Y_Derived是所述第二所导出运动向量的Y分量,
CURR_POC是当前图片的当前图片次序计数POC,
L0_POC_Derived是第一运动向量列表的所导出POC,且
L1_POC_Derived是第二运动向量列表的所导出POC。
19.根据权利要求14所述的设备,其中所述确定所述第一所导出运动向量和所述第二
所导出运动向量具有所述伪对称运动向量差包括确定:
L0_MV_X_Diff=L1_MV_X_Diff,
L0_MV_Y_Diff=L1_MV_Y_Diff,
L0_MV_X_Diff=-1*L1_MV_X_Diff,或
L0_MV_Y_Diff=-1*L1_MV_Y_Diff;
其中:
L0_MV_X_Diff是第一初始运动向量和所述第一所导出运动向量之间的差的X分量,
L0_MV_Y_Diff是所述第一初始运动向量和所述第一所导出运动向量之间的差的Y分量,
L1_MV_X_Diff是第二初始运动向量和所述第二所导出运动向量之间的差的X分量,且
L1_MV_Y_Diff是所述第二初始运动向量和所述第二所导出运动向量之间的差的Y分量。
20.根据权利要求14所述的设备,其中所述确定所述第一所导出运动向量和所述第二所导出运动向量具有所述伪反对称运动向量差包括确定:
L0_MV_X_Diff=L1_MV_X_Diff,
L0_MV_Y_Diff=L1_MV_Y_Diff,
L0_MV_X_Diff=-1*L1_MV_X_Diff,或
L0_MV_Y_Diff=-1*L1_MV_Y_Diff;
其中:
L0_MV_X_Diff是第一初始运动向量和所述第一所导出运动向量之间的差的X分量,
L0_MV_Y_Diff是所述第一初始运动向量和所述第一所导出运动向量之间的差的Y分量,
L1_MV_X_Diff是第二初始运动向量和所述第二所导出运动向量之间的差的X分量,且
L1_MV_Y_Diff是所述第二初始运动向量和所述第二所导出运动向量之间的差的Y分量。
21.根据权利要求14所述的设备,其中所述一或多个处理器经进一步配置以:
确定运动向量候选项列表中的第一初始运动向量和所述运动向量候选项列表中的第二初始运动向量满足关于所述第一初始运动向量和所述第二初始运动向量之间的关系的至少一个条件,所述关系包括:所述第一初始运动向量和所述第二初始运动向量是对称的、所述第一初始运动向量和所述第二初始运动向量是伪对称的、所述第一初始运动向量和所述第二初始运动向量具有所述对称运动向量差、所述第一初始运动向量和所述第二初始运动向量是反对称的、所述第一初始运动向量和所述第二初始运动向量是伪反对称的,或所述第一初始运动向量和所述第二初始运动向量具有所述反对称运动向量差,
其中生成所述多个所导出运动向量是基于所述第一初始运动向量和所述第二初始运动满足所述至少一个条件。
22.根据权利要求14所述的设备,其中所述一或多个处理器经进一步配置以:
确定运动向量候选项列表中的第一初始运动向量和所述运动向量候选项列表中的第二初始运动向量是在当前图片之前还是在所述当前图片之后,
其中基于所述成本度量根据所述多个所导出运动向量确定所述第一所导出运动向量和所述第二所导出运动向量进一步基于所述确定。
23.根据权利要求14所述的设备,其中所述一或多个处理器经进一步配置以:
确定与第一运动向量候选项列表相关联的第一参考图片和当前图片之间的第一图片次序计数POC距离是否为零且与第二运动向量候选项列表相关联的第二参考图片和所述当前图片之间的第二POC距离是否为零,
其中基于所述成本度量根据所述多个所导出运动向量确定所述第一所导出运动向量和所述第二所导出运动向量进一步基于所述确定。
24.根据权利要求14所述的设备,其中所述一或多个处理器经进一步配置以:
确定与第一运动向量候选项列表相关联的第一参考图片和当前图片之间的第一图片次序计数POC距离是否为零且与第二运动向量候选项列表相关联的第二参考图片和所述当前图片之间的第二POC距离是否为零,
其中基于所述成本度量根据所述多个所导出运动向量确定所述第一所导出运动向量和所述第二所导出运动向量进一步基于以下确定:确定与所述第一运动向量候选项列表相关联的所述第一参考图片和所述当前图片之间的所述第一POC距离为零且与所述第二运动向量候选项列表相关联的所述第二参考图片和所述当前图片之间的所述第二POC距离为零。
25.根据权利要求14所述的设备,其中所述一或多个处理器经进一步配置以根据所述经编码视频位流确定所述至少一个约束条件。
26.根据权利要求14所述的设备,其中所述成本度量包含绝对差总和。
27.一种经配置以对来自经编码视频位流的视频数据进行解码的设备,所述设备包括:
用于使用解码器侧运动向量推导DMVD生成多个所导出运动向量的装置;
用于基于成本度量根据所述多个所导出运动向量确定第一所导出运动向量和第二所导出运动向量的装置,包括:
用于确定所述第一所导出运动向量和所述第二所导出运动向量满足关于所述第一所导出运动向量和所述第二所导出运动向量之间的关系的至少一个约束条件的装置,所述关系包括:所述第一所导出运动向量和所述第二所导出运动向量具有对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量具有伪对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量是反对称的、所述第一所导出运动向量和所述第二所导出运动向量具有反对称运动向量差或所述第一所导出运动向量和所述第二所导出的运动向量具有伪反对称运动向量差;
以及
用于使用双向预测使用所确定的所述第一所导出运动向量和所述第二所导出运动向量对当前块进行解码的装置。
28.根据权利要求27所述的设备,其中使用DMVD生成所述多个所导出运动向量包括使用双向光流BIO过程、帧速率上转换FRUC过程、双边匹配过程、FRUC模板匹配过程或双边模板匹配过程中的一个。
29.一种经配置以对视频数据进行编码的设备,所述设备包括:
存储器,其经配置以存储所述视频数据;以及
与所述存储器通信的一或多个处理器,所述一或多个处理器经配置以:
使用解码器侧运动向量推导DMVD生成多个所导出运动向量;
基于成本度量,根据所述多个所导出运动向量确定第一所导出运动向量和第二所导出运动向量,包括:
确定所述第一所导出运动向量和所述第二所导出运动向量满足关于所述第一所导出运动向量和所述第二所导出运动向量之间的关系的至少一个约束条件,所述关系包括:所述第一所导出运动向量和所述第二所导出运动向量具有对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量具有伪对称运动向量差、所述第一所导出运动向量和所述第二所导出运动向量是反对称的、所述第一所导出运动向量和所述第二所导出运动向量具有反对称运动向量差或所述第一所导出运动向量和所述第二所导出的运动向量具有伪反对称运动向量差;以及
使用双向预测,使用所确定的所述第一所导出运动向量和所述第二所导出运动向量对当前块进行编码。
30.根据权利要求29所述的设备,其中使用DMVD生成所述多个所导出运动向量包括使用双向光流BIO过程、帧速率上转换FRUC过程、双边匹配过程、FRUC模板匹配过程或双边模板匹配过程中的一个。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762475177P | 2017-03-22 | 2017-03-22 | |
US62/475,177 | 2017-03-22 | ||
US15/927,854 | 2018-03-21 | ||
US15/927,854 US10595035B2 (en) | 2017-03-22 | 2018-03-21 | Constraining motion vector information derived by decoder-side motion vector derivation |
PCT/US2018/023761 WO2018175720A1 (en) | 2017-03-22 | 2018-03-22 | Constraining motion vector information derived by decoder-side motion vector derivation |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110431845A true CN110431845A (zh) | 2019-11-08 |
CN110431845B CN110431845B (zh) | 2022-11-25 |
Family
ID=63583206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880019566.5A Active CN110431845B (zh) | 2017-03-22 | 2018-03-22 | 约束通过解码器侧运动向量推导导出的运动向量信息 |
Country Status (18)
Country | Link |
---|---|
US (1) | US10595035B2 (zh) |
EP (1) | EP3603069A1 (zh) |
JP (2) | JP7233376B2 (zh) |
KR (1) | KR20190127884A (zh) |
CN (1) | CN110431845B (zh) |
AU (2) | AU2018237346A1 (zh) |
BR (1) | BR112019019210A2 (zh) |
CA (1) | CA3053479A1 (zh) |
CL (1) | CL2019002680A1 (zh) |
CO (1) | CO2019010076A2 (zh) |
IL (1) | IL268646B (zh) |
MX (1) | MX2019011318A (zh) |
MY (1) | MY195629A (zh) |
PH (1) | PH12019501895A1 (zh) |
RU (1) | RU2767144C2 (zh) |
SG (1) | SG11201907531XA (zh) |
WO (1) | WO2018175720A1 (zh) |
ZA (1) | ZA201906240B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022262818A1 (en) * | 2021-06-18 | 2022-12-22 | Beijing Bytedance Network Technology Co., Ltd. | Method, apparatus, and medium for video processing |
Families Citing this family (68)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10595035B2 (en) * | 2017-03-22 | 2020-03-17 | Qualcomm Incorporated | Constraining motion vector information derived by decoder-side motion vector derivation |
JP7168593B2 (ja) * | 2017-07-03 | 2022-11-09 | ヴィド スケール インコーポレイテッド | 双方向オプティカルフローに基づいた動き補償予測 |
CN117615154A (zh) * | 2017-08-29 | 2024-02-27 | 株式会社Kt | 视频解码和编码方法及用于存储压缩视频数据的装置 |
EP3451665A1 (en) * | 2017-09-01 | 2019-03-06 | Thomson Licensing | Refinement of internal sub-blocks of a coding unit |
CN111201795B (zh) * | 2017-10-09 | 2022-07-26 | 华为技术有限公司 | 存储访问窗口和用于运动矢量修正的填充 |
US10652571B2 (en) * | 2018-01-25 | 2020-05-12 | Qualcomm Incorporated | Advanced motion vector prediction speedups for video coding |
US11575933B2 (en) | 2018-04-06 | 2023-02-07 | Vid Scale, Inc. | Bi-directional optical flow method with simplified gradient derivation |
US10863190B2 (en) | 2018-06-14 | 2020-12-08 | Tencent America LLC | Techniques for memory bandwidth optimization in bi-predicted motion vector refinement |
CN110620929B (zh) | 2018-06-19 | 2023-04-18 | 北京字节跳动网络技术有限公司 | 没有运动矢量预测截断的选择的运动矢量差精度 |
CN110662043B (zh) | 2018-06-29 | 2021-12-21 | 北京字节跳动网络技术有限公司 | 一种用于处理视频数据的方法、装置和计算机可读介质 |
SG11202012293RA (en) | 2018-06-29 | 2021-01-28 | Beijing Bytedance Network Technology Co Ltd | Update of look up table: fifo, constrained fifo |
EP3791585A1 (en) | 2018-06-29 | 2021-03-17 | Beijing Bytedance Network Technology Co. Ltd. | Partial/full pruning when adding a hmvp candidate to merge/amvp |
TWI731360B (zh) | 2018-06-29 | 2021-06-21 | 大陸商北京字節跳動網絡技術有限公司 | 查找表的使用條件 |
TWI728390B (zh) | 2018-06-29 | 2021-05-21 | 大陸商北京字節跳動網絡技術有限公司 | 查找表尺寸 |
EP3791586A1 (en) | 2018-06-29 | 2021-03-17 | Beijing Bytedance Network Technology Co. Ltd. | Concept of using one or multiple look up tables to store motion information of previously coded in order and use them to code following blocks |
CN110662052B (zh) | 2018-06-29 | 2022-07-08 | 北京字节跳动网络技术有限公司 | 更新查找表(lut)的条件 |
EP4322533A3 (en) | 2018-06-29 | 2024-03-06 | Beijing Bytedance Network Technology Co., Ltd. | Checking order of motion candidates in lut |
WO2020008349A1 (en) | 2018-07-02 | 2020-01-09 | Beijing Bytedance Network Technology Co., Ltd. | Merge index coding |
WO2020031059A1 (en) | 2018-08-04 | 2020-02-13 | Beijing Bytedance Network Technology Co., Ltd. | Constraints for usage of updated motion information |
MX2021002488A (es) * | 2018-09-04 | 2021-07-16 | Huawei Tech Co Ltd | Método de obtención de trama de referencia y aparato aplicado a la interpredicción bidireccional. |
WO2020053800A1 (en) | 2018-09-12 | 2020-03-19 | Beijing Bytedance Network Technology Co., Ltd. | How many hmvp candidates to be checked |
EP4325859A3 (en) | 2018-09-19 | 2024-05-15 | Beijing Bytedance Network Technology Co., Ltd. | Syntax reuse for affine mode with adaptive motion vector resolution |
WO2020084476A1 (en) | 2018-10-22 | 2020-04-30 | Beijing Bytedance Network Technology Co., Ltd. | Sub-block based prediction |
WO2020084475A1 (en) | 2018-10-22 | 2020-04-30 | Beijing Bytedance Network Technology Co., Ltd. | Utilization of refined motion vector |
WO2020084462A1 (en) | 2018-10-22 | 2020-04-30 | Beijing Bytedance Network Technology Co., Ltd. | Restrictions on decoder side motion vector derivation based on block size |
WO2020084461A1 (en) * | 2018-10-22 | 2020-04-30 | Beijing Bytedance Network Technology Co., Ltd. | Restrictions on decoder side motion vector derivation based on coding information |
CN117241017A (zh) | 2018-11-05 | 2023-12-15 | 北京字节跳动网络技术有限公司 | 数字视频编解码的方法、设备和系统 |
CN111436230A (zh) | 2018-11-12 | 2020-07-21 | 北京字节跳动网络技术有限公司 | 仿射预测的带宽控制方法 |
CN113170171B (zh) | 2018-11-20 | 2024-04-12 | 北京字节跳动网络技术有限公司 | 组合帧间帧内预测模式的预测细化 |
EP3861742A4 (en) | 2018-11-20 | 2022-04-13 | Beijing Bytedance Network Technology Co., Ltd. | DIFFERENCE CALCULATION BASED ON SPATIAL POSITION |
IL284179B2 (en) * | 2018-12-21 | 2024-06-01 | Vid Scale Inc | Differential coding of a symmetric motion vector |
WO2020141993A1 (en) * | 2019-01-02 | 2020-07-09 | Telefonaktiebolaget Lm Ericsson (Publ) | Side motion refinement in video encoding/decoding systems |
JP7275286B2 (ja) | 2019-01-10 | 2023-05-17 | 北京字節跳動網絡技術有限公司 | Lut更新の起動 |
WO2020143824A1 (en) | 2019-01-13 | 2020-07-16 | Beijing Bytedance Network Technology Co., Ltd. | Interaction between lut and shared merge list |
WO2020147772A1 (en) | 2019-01-16 | 2020-07-23 | Beijing Bytedance Network Technology Co., Ltd. | Motion candidates derivation |
US11025936B2 (en) * | 2019-01-25 | 2021-06-01 | Tencent America LLC | Method and apparatus for video coding |
CN113412623A (zh) | 2019-01-31 | 2021-09-17 | 北京字节跳动网络技术有限公司 | 记录仿射模式自适应运动矢量分辨率的上下文 |
WO2020156517A1 (en) * | 2019-01-31 | 2020-08-06 | Beijing Bytedance Network Technology Co., Ltd. | Fast algorithms for symmetric motion vector difference coding mode |
CN113383548A (zh) * | 2019-02-03 | 2021-09-10 | 北京字节跳动网络技术有限公司 | Mv精度和mv差编解码之间的相互作用 |
MX2021009529A (es) * | 2019-02-08 | 2021-09-23 | Beijing Dajia Internet Information Tech Co Ltd | Metodos y dispositivos para aplicar de forma selectiva el flujo optico bidireccional y el refinamiento del vector de movimiento en el decodificador para la codificacion de video. |
CN113424535A (zh) | 2019-02-13 | 2021-09-21 | 北京字节跳动网络技术有限公司 | 基于运动矢量预测表的历史更新 |
WO2020164575A1 (en) * | 2019-02-14 | 2020-08-20 | Beijing Bytedance Network Technology Co., Ltd. | Decoder side motion derivation based on processing parameters |
CN116915983B (zh) * | 2019-02-20 | 2024-04-16 | 北京达佳互联信息技术有限公司 | 用于视频解码的方法、计算设备、存储介质和程序产品 |
US11166037B2 (en) * | 2019-02-27 | 2021-11-02 | Mediatek Inc. | Mutual excluding settings for multiple tools |
CN116347103A (zh) * | 2019-02-28 | 2023-06-27 | 华为技术有限公司 | 编码器、解码器及相应的帧间预测方法 |
KR102647497B1 (ko) * | 2019-03-05 | 2024-03-13 | 엘지전자 주식회사 | 인터 예측을 위한 비디오 신호의 처리 방법 및 장치 |
JP2022521554A (ja) | 2019-03-06 | 2022-04-08 | 北京字節跳動網絡技術有限公司 | 変換された片予測候補の利用 |
CN113475076B (zh) * | 2019-03-11 | 2024-03-12 | 阿里巴巴集团控股有限公司 | 用于对视频数据进行编码的帧间预测方法 |
PL3941060T3 (pl) | 2019-03-12 | 2023-12-27 | Lg Electronics Inc. | Sposób i urządzenie inter-predykcji oparte na dmvr i bdof |
WO2020192611A1 (en) | 2019-03-22 | 2020-10-01 | Beijing Bytedance Network Technology Co., Ltd. | Interaction between merge list construction and other tools |
WO2020197290A1 (ko) * | 2019-03-26 | 2020-10-01 | 인텔렉추얼디스커버리 주식회사 | 영상 부호화/복호화 방법 및 장치 |
EP3922014A4 (en) | 2019-04-02 | 2022-04-06 | Beijing Bytedance Network Technology Co., Ltd. | DECODER SIDE MOTION VECTOR BYPASS |
WO2020211755A1 (en) * | 2019-04-14 | 2020-10-22 | Beijing Bytedance Network Technology Co., Ltd. | Motion vector and prediction sample refinement |
WO2020221256A1 (en) * | 2019-04-28 | 2020-11-05 | Beijing Bytedance Network Technology Co., Ltd. | Symmetric motion vector difference coding |
JP7303330B2 (ja) * | 2019-04-28 | 2023-07-04 | 北京字節跳動網絡技術有限公司 | 対称動きベクトル差分符号化 |
CN111586419B (zh) * | 2019-05-13 | 2022-03-25 | 北京达佳互联信息技术有限公司 | 视频解码方法、视频编码方法及装置 |
SG11202111843XA (en) * | 2019-05-16 | 2021-11-29 | Beijing Bytedance Network Technology Co Ltd | Sub-region based determination of motion information refinement |
KR20220027833A (ko) | 2019-06-03 | 2022-03-08 | 브이아이디 스케일, 인크. | 광류를 이용한 블록 경계 예측 정제 |
US11172212B2 (en) * | 2019-06-06 | 2021-11-09 | Qualcomm Incorporated | Decoder-side refinement tool on/off control |
KR102417212B1 (ko) * | 2019-06-17 | 2022-07-05 | 베이징 다지아 인터넷 인포메이션 테크놀로지 컴퍼니 리미티드 | 비디오 코딩에서의 디코더 측 모션 벡터 개선을 위한 방법들 및 장치들 |
US20200402546A1 (en) * | 2019-06-24 | 2020-12-24 | Seagate Technology Llc | Reducing base deck porosity |
WO2020262918A1 (ko) * | 2019-06-24 | 2020-12-30 | 엘지전자 주식회사 | 움직임 벡터를 이용한 영상 코딩 방법 및 장치 |
KR20210158399A (ko) * | 2019-06-24 | 2021-12-30 | 엘지전자 주식회사 | 인터 예측 기반 영상 코딩 방법 및 장치 |
US11190789B2 (en) * | 2019-06-30 | 2021-11-30 | Tencent America LLC | Method and apparatus for video coding using inter-prediction mode signaling to dertermine motion vectors |
US11272203B2 (en) * | 2019-07-23 | 2022-03-08 | Tencent America LLC | Method and apparatus for video coding |
KR20220038060A (ko) * | 2019-07-27 | 2022-03-25 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 참조 픽처 유형들에 따른 툴들의 사용의 제한들 |
CN110545425B (zh) * | 2019-08-21 | 2021-11-16 | 浙江大华技术股份有限公司 | 一种帧间预测方法、终端设备以及计算机存储介质 |
WO2021052495A1 (en) * | 2019-09-20 | 2021-03-25 | Beijing Bytedance Network Technology Co., Ltd. | Adaptive resolution change and scalable coding for screen contents |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100208797A1 (en) * | 2009-02-17 | 2010-08-19 | Electronics And Telecommunications Research Institute | Distributed video encoder and decoder, and distributed video encoding and decoding method |
WO2011096770A2 (ko) * | 2010-02-02 | 2011-08-11 | (주)휴맥스 | 영상 부호화/복호화 장치 및 방법 |
US20140092968A1 (en) * | 2012-10-01 | 2014-04-03 | Centre National De La Recherche Scientifique (C.N. R.S) | Method and device for motion information prediction refinement |
WO2015038937A1 (en) * | 2013-09-13 | 2015-03-19 | Qualcomm Incorporated | Video coding techniques using asymmetric motion partitioning |
US20160286232A1 (en) * | 2015-03-27 | 2016-09-29 | Qualcomm Incorporated | Deriving motion information for sub-blocks in video coding |
WO2017036414A1 (en) * | 2015-09-02 | 2017-03-09 | Mediatek Inc. | Method and apparatus of decoder side motion derivation for video coding |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101452859B1 (ko) * | 2009-08-13 | 2014-10-23 | 삼성전자주식회사 | 움직임 벡터를 부호화 및 복호화하는 방법 및 장치 |
WO2013006386A1 (en) | 2011-07-01 | 2013-01-10 | General Instrument Corporation | Motion vector prediction design simplification |
US10595035B2 (en) * | 2017-03-22 | 2020-03-17 | Qualcomm Incorporated | Constraining motion vector information derived by decoder-side motion vector derivation |
-
2018
- 2018-03-21 US US15/927,854 patent/US10595035B2/en active Active
- 2018-03-22 SG SG11201907531X patent/SG11201907531XA/en unknown
- 2018-03-22 MX MX2019011318A patent/MX2019011318A/es unknown
- 2018-03-22 RU RU2019133109A patent/RU2767144C2/ru active
- 2018-03-22 CN CN201880019566.5A patent/CN110431845B/zh active Active
- 2018-03-22 BR BR112019019210A patent/BR112019019210A2/pt unknown
- 2018-03-22 WO PCT/US2018/023761 patent/WO2018175720A1/en unknown
- 2018-03-22 KR KR1020197030837A patent/KR20190127884A/ko not_active Application Discontinuation
- 2018-03-22 JP JP2019551632A patent/JP7233376B2/ja active Active
- 2018-03-22 MY MYPI2019004629A patent/MY195629A/en unknown
- 2018-03-22 EP EP18716799.4A patent/EP3603069A1/en not_active Ceased
- 2018-03-22 AU AU2018237346A patent/AU2018237346A1/en not_active Abandoned
- 2018-03-22 CA CA3053479A patent/CA3053479A1/en active Pending
-
2019
- 2019-08-12 IL IL268646A patent/IL268646B/en unknown
- 2019-08-15 PH PH12019501895A patent/PH12019501895A1/en unknown
- 2019-09-18 CO CONC2019/0010076A patent/CO2019010076A2/es unknown
- 2019-09-20 ZA ZA2019/06240A patent/ZA201906240B/en unknown
- 2019-09-23 CL CL2019002680A patent/CL2019002680A1/es unknown
-
2021
- 2021-07-09 JP JP2021114322A patent/JP7278333B2/ja active Active
-
2023
- 2023-02-10 AU AU2023200756A patent/AU2023200756A1/en active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100208797A1 (en) * | 2009-02-17 | 2010-08-19 | Electronics And Telecommunications Research Institute | Distributed video encoder and decoder, and distributed video encoding and decoding method |
WO2011096770A2 (ko) * | 2010-02-02 | 2011-08-11 | (주)휴맥스 | 영상 부호화/복호화 장치 및 방법 |
US20140092968A1 (en) * | 2012-10-01 | 2014-04-03 | Centre National De La Recherche Scientifique (C.N. R.S) | Method and device for motion information prediction refinement |
WO2015038937A1 (en) * | 2013-09-13 | 2015-03-19 | Qualcomm Incorporated | Video coding techniques using asymmetric motion partitioning |
CN105637870A (zh) * | 2013-09-13 | 2016-06-01 | 高通股份有限公司 | 使用不对称运动分割的视频译码技术 |
US20160286232A1 (en) * | 2015-03-27 | 2016-09-29 | Qualcomm Incorporated | Deriving motion information for sub-blocks in video coding |
WO2017036414A1 (en) * | 2015-09-02 | 2017-03-09 | Mediatek Inc. | Method and apparatus of decoder side motion derivation for video coding |
CA2995507A1 (en) * | 2015-09-02 | 2017-03-09 | Mediatek Inc. | Method and apparatus of decoder side motion derivation for video coding |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022262818A1 (en) * | 2021-06-18 | 2022-12-22 | Beijing Bytedance Network Technology Co., Ltd. | Method, apparatus, and medium for video processing |
Also Published As
Publication number | Publication date |
---|---|
MY195629A (en) | 2023-02-03 |
US20180278949A1 (en) | 2018-09-27 |
RU2767144C2 (ru) | 2022-03-16 |
AU2018237346A1 (en) | 2019-09-05 |
JP7233376B2 (ja) | 2023-03-06 |
BR112019019210A2 (pt) | 2020-04-14 |
MX2019011318A (es) | 2019-11-12 |
US10595035B2 (en) | 2020-03-17 |
JP2020511859A (ja) | 2020-04-16 |
CA3053479A1 (en) | 2018-09-27 |
CL2019002680A1 (es) | 2020-05-29 |
PH12019501895A1 (en) | 2019-10-21 |
WO2018175720A1 (en) | 2018-09-27 |
KR20190127884A (ko) | 2019-11-13 |
ZA201906240B (en) | 2021-05-26 |
JP7278333B2 (ja) | 2023-05-19 |
CO2019010076A2 (es) | 2019-10-09 |
RU2019133109A3 (zh) | 2021-09-09 |
RU2019133109A (ru) | 2021-04-22 |
JP2021182743A (ja) | 2021-11-25 |
IL268646B (en) | 2022-02-01 |
EP3603069A1 (en) | 2020-02-05 |
CN110431845B (zh) | 2022-11-25 |
IL268646A (en) | 2019-10-31 |
SG11201907531XA (en) | 2019-10-30 |
AU2023200756A1 (en) | 2023-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110431845A (zh) | 约束通过解码器侧运动向量推导导出的运动向量信息 | |
TWI736872B (zh) | 基於解碼器側運動向量推導之運動向量預測推導之限制 | |
KR102611261B1 (ko) | 업데이트 대상 lut 또는 비업데이트 lut의 구별 | |
CN109155855B (zh) | 用于视频译码的仿射运动预测方法、装置及存储媒体 | |
CN104170381B (zh) | 在高效率视频译码及其扩展中的运动矢量译码及双向预测 | |
CN105637870B (zh) | 使用不对称运动分割的视频译码技术 | |
CN105379288B (zh) | 处理对视频译码的照明补偿 | |
CN110431842A (zh) | 解码器侧运动向量导出 | |
CN105556969B (zh) | 视频译码中使用视差向量的块识别 | |
CN110301135A (zh) | 在视频解码器处导出运动向量信息 | |
CN104322070B (zh) | 用于高效率视频译码的高级别语法扩展 | |
CN105874799B (zh) | 用于3d视频译码的基于块的高级残差预测 | |
CN104170380B (zh) | 视频译码中的视差矢量预测 | |
CN105144715B (zh) | 后向视图合成预测 | |
CN104969551B (zh) | 可缩放及多视角视频译码中的高级残差预测 | |
CN110036638A (zh) | 用于双向光学流(bio)的运动向量重建 | |
CN105122812B (zh) | 用于三维(3d)视频译码的高级合并模式 | |
CN109644272A (zh) | 用于建构候选列表的几何型优先级 | |
CN105379282B (zh) | 用于纹理译码的先进残余预测(arp)的方法和设备 | |
CN109691106A (zh) | 时间运动向量预测符的偏移向量识别 | |
CN110383839A (zh) | 仿射运动信息导出 | |
CN109792531A (zh) | 用于视频译码的运动向量译码 | |
CN110352598A (zh) | 基于双向光流(bio)的帧间预测细化 | |
CN107710764A (zh) | 确定用于视频译码的照明补偿状态的系统及方法 | |
CN107690810A (zh) | 确定用于视频译码的照明补偿状态的系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40010589 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |