CN113647105A - 指数分区的帧间预测 - Google Patents

指数分区的帧间预测 Download PDF

Info

Publication number
CN113647105A
CN113647105A CN202080025802.1A CN202080025802A CN113647105A CN 113647105 A CN113647105 A CN 113647105A CN 202080025802 A CN202080025802 A CN 202080025802A CN 113647105 A CN113647105 A CN 113647105A
Authority
CN
China
Prior art keywords
region
candidate
decoder
exponential
motion vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080025802.1A
Other languages
English (en)
Inventor
B·富尔赫特
H·卡瓦
V·阿季奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OP Solutions LLC
Original Assignee
OP Solutions LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OP Solutions LLC filed Critical OP Solutions LLC
Publication of CN113647105A publication Critical patent/CN113647105A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Abstract

一种解码器包括电路,该电路被配置为:接收比特流;经由指数分区模式将当前块分区成第一区域和第二区域;确定与第一区域或第二区域相关联的运动矢量,该确定包括构建候选列表;以及,利用确定的运动矢量解码当前块。本发明还描述了相关的设备、系统、技术和制品。

Description

指数分区的帧间预测
相关申请的交叉引用
本申请要求于2019年1月28日提交的题为“指数分区的帧间预测(INTERPREDICTION IN EXPONENTIAL PARTITIONING)”的美国临时专利申请第62/797,816号的优先权权益,该临时专利申请全文以引用方式并入本文。
技术领域
本发明总体上涉及视频压缩领域。特别地,本发明涉及指数分区的帧间预测。
背景技术
视频编解码器可包括压缩或解压缩数字视频的电子电路或软件。其可将未压缩视频转换成压缩格式,反之亦然。在视频压缩的背景中,视频压缩(和/或执行其中一些功能)的装置通常可被称为编码器,而视频解压缩(和/或执行其中一些功能)的装置可被称为解码器。
压缩数据的格式可符合标准视频压缩规范。压缩可为有损的,因为压缩的视频缺少原始视频中所存在的一些信息。这样做的后果可包括,解压视频相比于原始未压缩视频而言质量较低,因为没有充分信息来准确地重建原始视频。
在视频质量、用于表示视频的数据量(例如,由比特率所确定)、编码和解码算法的复杂性、对数据损失和误差的敏感性、编辑的便利性、随机访问、端至端延迟(例如,延迟时间)等之间可存在复杂关系。
发明内容
在一个方面,一种解码器包括电路,该电路配置为:接收比特流;通过指数分区模式将当前块分区成第一区域和第二区域;确定与第一区域或第二区域的区域相关联的运动矢量,其中该确定包括构建候选列表;和利用确定的运动矢量解码当前块。
在另一个方面,一种方法包括:由解码器接收比特流;通过指数分区模式通过解码器将当前块分区成第一区域和第二区域;由解码器确定与第一区域或第二区域的区域相关联的运动矢量,该确定包括构建候选列表;和利用确定的运动矢量由解码器解码当前块。
本文所描述主题的一种或多种变型的细节在下述附图和具体实施方式中得到阐述。本文所描述主题的其它特征和优点根据以下描述和附图并且根据权利要求书将为显而易见的。
附图说明
出于说明本发明的目的,附图示出了本发明的一个或多个实施例。然而,应当理解,本发明不限于附图所示的精确结构和器械,其中:
图1为示出像素块分区的一个实例的示意图;
图2为示出几何分区的一个实例的示意图;
图3示出了包括苹果的图片,该苹果未通过平直线段来有效地分区;
图4A为示出了根据当前主题的一些方面的指数分区的一个实例的示意图,该指数分区可增加压缩效率;
图4B为示出了示例性模板指数分区的一系列示意图;
图4C示出了与4个预定系数相关联的示例性曲线,该四个预定系数可限定示例性指数函数;
图4D示出了另一示例性块,该另一示例性块示出了将矩形块分区的不同起始P1和结束P2索引;
图5为示出潜在运动矢量候选项相对于根据指数分区法所分区的当前块实例的位置实例的示意图;
图6示出了具有注释的图5,从而示出包括第一区域的最左上亮度位置和第二区域的最右上亮度位置的亮度位置;图7为示出潜在运动矢量候选项相对于根据指数分区法所分区的当前块实例的位置的示意图;
图8示出了具有注释的图7,从而示出包括第二区域的最左下亮度位置和第二区域的最右上亮度位置的亮度位置;
图9为示出实例视频编码器的系统框图,该实例视频编码器能够利用帧间预测与指数分区编码视频;
图10示出了帧QTBT分区的一个实例;
图11示出了图8所示QTBT的CU水平上的指数分区的一个实例;
图12为过程流程图,示出了根据当前主题的一些方面通过指数分区和帧间预测对视频进行编码的过程实例,该过程实例可减小编码复杂性同时增加压缩效率。
图13为系统框图,示出了根据当前主题的一些方面能够使用指数分区和帧间预测对比特流进行解码的解码器实例;
图14为过程流程图,示出了根据当前主题的一些方面使用指数分区和帧间预测对比特流进行解码的过程实例;和
图15为计算系统的框图,该计算系统可用于实施本文所公开方法的任一或多者及其任何一个或多个部分。
附图未必按比例绘制,并且可通过虚线、示意性表示和片段式视图来示出。在某些情况下,可省略对于理解实施例非必需或使其它细节难以察觉的细节。各个图中的类似附图标号指示类似元件。
具体实施方式
当前主题的一些实施方式包括以非矩形区域执行帧间预测,这些非矩形区域已以曲线进行分区;该曲线可为直线或可不是直线。以非矩形块(其已以曲线进行分区)执行帧间预测可允许分区以更紧密地沿循物体边界,从而导致较低运动补偿预测误差,较小残差,和因而改善的压缩效率。在帧间预测期间,利用对于根据指数分区模式所确定的块(例如,编码单元、预测单元等)所预测的运动矢量,可执行运动补偿。运动矢量可利用高级运动矢量预测(AMVP)和/或经由合并模式进行预测,其中运动矢量选自运动矢量候选项的列表而无需编码运动矢量差值。
在指数分区中,矩形块可以曲线分区成非矩形区域;该非矩形区域在几何分区的情况下可包括平直线段,或可在更普遍情况下为非直线的曲线。利用非直线的曲线来将块分区可允许分区更紧密地沿循物体边界,从而带来较低的运动补偿预测误差,较小的残差,和因此而改善的压缩效率。在一些实施方式中,曲线可通过指数函数来表征。曲线(例如,指数函数)可利用预定系数进行确定,这些预定系数可在比特流中发出信号以由解码器使用。在一些实施方式中,指数分区对于大于或等于8×8亮度样本可为可用的。通过以曲线将矩形块分区,相比于限于平直线段分区的技术(诸如几何分区),当前主题对于某些物体可实现较大压缩效率。
运动补偿可包括一种预测视频帧或其部分的方式,该方式考虑到解释摄像机和/或视频中物体的运动的先前和/或未来帧。运动补偿可用于针对视频压缩的视频数据编码和解码,例如用于利用运动图像专家组(MPEG)-2(也称为高级视频编码(AVC))标准的编码和解码。运动补偿可关于基准图像至当前图像的变换描述图像。当相比于当前图像时,基准图像可为先前的或未来的。当图片可从先前所传送和/或存储图片进行准确地合成时,压缩效率可得到改善。
块分区可为在视频编码找出类似运动的区域的方法。某种形式的块分区可见于视频编解码标准中,包括MPEG-2、H.264(也称为AVC或MPEG-4第10部分)和H.265(也称为高效视频编码(HEVC))。在块分区方式实例中,视频帧的非重叠块可分区成矩形子块,以找出包含具有类似运动的像素的块分区。当块分区的所有像素具有类似运动时,这种方式可工作良好。块中的像素运动可关于先前编码帧来确定。
图1为示出像素的块分区的一个实例的示意图。初始矩形图像或块100可自身为子块(例如,编码树内的节点),可分区成矩形子块。例如,在110处,块100分区成两个矩形子块110a和110b。子块110a和110b然后可单独地处理。作为另一实例,在120处,块100分区成四个矩形子块120a,120b,120c和120d。子块可自身进一步划分,直至确定子块内的像素共享相同运动,达到最小块尺寸,或另一标准。当子块中的像素具有类似运动时,运动矢量可描述该区域中所有像素的运动。
仍参考图1,视频编码的一些方式可包括几何分区,该几何分区可为指数分区其中矩形块(例如,如图1所示)还通过平直线段划分成两个区域(可为非矩形的)的形式。例如,图2为示出几何分区的一个实例的示意图。实例矩形块200(可其具有M像素的宽度和N像素的高度,表示为M×N像素)可沿着平直线段P1P2 205划分成两个区域(区域0和区域1)。当区域0中的像素具有类似运动时,运动矢量可描述该区域中所有像素的运动。运动矢量可用于压缩区域0。类似地,当区域1中的像素具有类似运动时,相关运动矢量可描述区域1中像素的运动。可通过视频比特流中的编码位置P1和P2(或位置P1和P2的表示)向接收器(例如,解码器)发出此类几何分区的信号。
继续参考图2,当利用几何分区将视频数据编码时,可确定平直线段205(或更具体地,点P1和P2)。然而,平直线段可不能够以反映物体边界的方式将块分区。因此,以平直线段的分区可不能够以有效方式(例如,使得任何所得残差为小的)将块分区。在块可包含表示具有弯曲(例如,非平直)边界的物体或边界的像素(例如,亮度样本)的情况下,这可为真实的。例如,图3示出了包含苹果的图片的一个示例性实施例,该图片可未由平直线段有效地分区;所示苹果的图片包括一些矩形块,这些矩形块指示图片的一些部分,该图片在根据几何分区利用平直线段进行分区的情况下,该分区可未能紧密地沿循物体(例如,苹果)边界,此边界如图3所示为弯曲的。
图4A为示出利用非线性曲线的指数分区的一个非限制性实例的示意图,该非线性曲线根据当前主题的一些方面出于本公开的目的限定为非直线的曲线,该曲线可增加压缩效率。矩形块400可包括像素(例如,亮度样本)。作为仅出于说明目的而提供的非限制性实例,矩形块400可具有8×8像素的尺寸(例如,亮度样本)或更大。
在图4A中,矩形块400可分区成两个或更多个区域,出于示例性目的在图4A中示为区域0和区域1,分别表示为410和415,由弯曲线405分开。如此限定的每个区域中的所有亮度样本可视为类似运动,并且因此为利用相同运动矢量可表示的。为出于示例性目的而示出,区域410内的所有亮度样本可视为具有相同或类似运动并且可由相同运动矢量来表示。类似地,区域415内的所有亮度样本可视为具有相同或类似运动并且可由相同运动矢量来表示。如下文更全面地描述,相应运动矢量可根据AMVP模式或合并模式来确定。在一些实施方式中并且出于讨论的目的,划分矩形块400的弯曲线段405左侧或上方的所有亮度样本可视为属于区域0(410)。在一些实施方式中,划分矩形块400的弯曲线段405或上方的所有亮度样本可视为属于区域1(415)。在一些实施方式中,划分矩形块400的弯曲线段所穿过的所有亮度样本(即,线段之上和/或与线段相交的亮度样本)属于区域0(410)。在一些实施方式中,划分矩形块400的弯曲线段所穿过的所有亮度样本可视为属于区域1(415)。其它实施方式可为可能的,如本领域的技术人员在查看本公开的全文后将理解。
仍参考图4A,指数分区可在比特流中表示。在一些实施方式中,可利用指数分区模式并且可在比特流中发出适当参数信号。例如,可在比特流中通过发出预定指数分区模板信号来表示指数分区。图4B为示出模板分区420-435的非限制性实例的一系列示意图。在一些实施方式中,发出信号可通过包括关于所预定的这些规则(例如,模板)指数分区的一者或多者的索引来执行。这些规则指数分区可规定一组预定取向。例如,图4C示出了与4个预定目标(1,2,3,4)相关联的非限制示例性曲线。在一些实施方式中,多个目标曲率可改变。
继续参考图4B并且作为另一个非限制性实例,指数分区可通过发出预定系数在比特流中标准,诸如指数函数的系数,该预定系数指示曲率程度,该曲率程度可允许额外指数函数。
在一些实施方式中并且仍参考图4B,指数分区模式所用的多个模板420-435的预定模板可指示平直线段。例如,在图4C中,由系数1所索引的线段为直线,该直线可视为指数分区的具体情况,该指数分区为几何分区,如上文所描述。
在一些实施方式中,取向模板(如例如图4B所示)和预定模板(如例如图4C所示)两者可用于有效地发出大量潜在指数分区的任何指数模式信号;例如,模板可提供弯曲部分440,包括但不限于线段1和/或一个或多个非线性曲线2-4,弯曲部分440可包括指数曲线,这些指数曲线的任一者可由编码器、用户和/或自动过程进行选择以形成如本公开所描述的分区。
在一些实施方式中并且在此参考图4A,起始和结束索引可为预定的。例如,4A示出了起始于矩形块400的左下角部并且结束与矩形块400的右上角部的示例性弯曲线段。此类预定起始和结束索引可存储于解码器的存储器中。另选地或此外,在一些实施方式中,可在比特流中明确地发出起始和结束索引信号。例如,4D示出了另一实例块,该另一实例块示出了将矩形块400分区的不同起始P1和结束P2索引。可直接地发出起始P1和结束P2索引信号,或可通过索引指示成一组预定值。其它参数为可能的,如本领域的技术人员在查看本公开的全文后将理解。
仍参考图4A,帧间预测可利用已进行指数分区的区域来执行。用于运动补偿的运动矢量可通过利用AMVP或合并模式产生。在AMVP中,运动矢量预测可通过将索引发出至运动矢量候选列表中来进行,并且运动矢量差值(例如,残差)可在比特流中进行编码并且包括于其中。在合并模式中,运动矢量选自运动矢量候选列表而无需将运动矢量差值编码,从而允许当前块采用另一先前解码块的运动信息。在AMVP和合并模式两者中,候选列表可通过编码器和解码器两者来构建,并且可在比特流中发出候选列表中索引的信号。
图5为示出潜在空间运动矢量候选项相对于根据指数分区法所分区的示例性当前块1100的位置的非限制性实例的示意图。潜在空间运动矢量候选项可在AMVP模式或合并模式期间考虑用于构建运动矢量候选列表。作为非限制性实例,当前块1100可通过点P0和P1之间的曲线分区成两个区域,区域S0和区域S1。区域S0和区域S1的每一者可进行单向或双向预测。第一区域(区域S0)的空间候选项出于示例性目的示于图5中,并且可包括但不限于左下候选项A0、左侧候选项A1、左上候选项B2、上侧候选项B1和右上候选项B0。
如图5所示并且在一些实施方式中,每个位置(A0,A1,B2,B1和B0)可表示相应位置的块。例如但非限制地,左上候选项B2可表示驻留于紧邻区域S0的左侧并且紧邻于其上方的位置处的块;例如,如果S0的左上角部亮度位置为(0,0),那么左上候选项B2可驻留于位置(-1,-1)处。左下候选项A0可定位成紧邻P1的左侧和下方;例如并且非限制性地,如果P1的亮度位置为(P1x,P1y),那么左下候选项A0可驻留于位置(Plx-1,Ply+1)处。左侧候选项A1可定位成紧邻于P1的左侧;例如,左侧候选项A1可驻留于位置(Plx-1,Ply)处。上侧候选项B1可定位成紧邻于P0上方;例如,如果P0的亮度位置为(P0x,P0y),那么上侧候选项B1位于(P0x,P0y-1)处。右上候选项B0可定位成紧邻于第二区域S1中的上侧和最右亮度位置上方;例如,如果S1的右上角部位于(S0_宽度+Sl_宽度-1,0)处,那么右上候选项B0可位于(S0_width+Sl_width-1,-1)处,其中M=S0_width+Sl_width。其它位置为可能的,如本领域的技术人员在查看本公开的全文后将理解。图6示出了具有注释的图5,从而示出包括第一区域S0的最左上亮度位置和第二区域S1的最右上亮度位置的亮度位置。
在一些实施方式中并且仍参考图6,当构建区域S0的候选列表时,一些潜在候选项可自动地标记为不可用的,并且可从列表中移除;因为在存在指数分区的情况下,此类分区可执行以将具有不同运动信息的帧内的区域(或物体)分区。因此,可推断,与这些候选项相关联的块同样表示具有不同运动的另一物体,并且因此这些候选项可自动地标记为不可用的(例如,不进一步考虑,从列表移除,等等)。作为一个非限制性实例并且如上文图5所示,关于区域S0,左下候选项A0可自动地标记为不可用的,因为可能的是,区域S0未与位于左下候选项A0的块共享运动信息。类似地,关于区域S0,右上候选项B0可自动地标记为不可用的,因为可能的是,区域S0未与位于右上候选项B0的块共享运动信息。
图7为示出潜在运动矢量候选项相对于根据指数分区法分区的示例性当前块1400的位置的非限制性实例的示意图。可在AMVP模式或合并模式期间考虑使用潜在运动矢量候选项构建候选列表。当前块1400可已通过点P0和P1之间的曲线分区成两个区域,区域S0和区域S1。区域S0和区域S1的每一者可进行单向或双向预测。第二区域(区域S1)的候选项示出于图7中,并且可包括左下候选项A0、左侧候选项A1、左上候选项B2、上侧候选项B1和右上候选项B0。
如图7所示,每个位置(A0,A1,B2,B1和B0)可表示相应位置的块。例如,左上候选项B2可为驻留于紧邻区域S1的左侧并且紧邻区域S1上方的亮度位置处的块;例如,如果S1的左上角部亮度位置相邻于亮度位置坐标(P0x+1,P0y)的P0,那么左上候选项B2可驻留于位置(P0x,P0y-l)处,左下候选项A0可定位成紧邻于S1的最左下亮度位置的左侧并且处于其下方;例如,如果S1的最左下亮度位置为亮度位置(0,S0_height+Sl_height-1),那么左下候选项A0可驻留于位置(-1,S0_height+Sl_height)处,其中N=S0_height+S1_height。左侧候选项A1可定位成紧邻于S1的最左下亮度位置的左侧(例如,S1的左下角部);例如,如果S1的最左下亮度位置为亮度位置(0,S0_height+Sl_height-1),那么左侧候选项A1可驻留于亮度位置(-1,S0_height+1_height-1)处。上侧候选项B1可定位成紧邻于S1的最右上亮度位置上方;例如,如果S1的最右上亮度位置为(S0_width+Sl_width-1,0)处,那么上侧候选项B1可位于(S0_width+Sl_width-1,-1)处,其中M=S0_width+Sl_width。右上候选项B0可定位成紧邻于第二区域S1的最右上亮度位置的上方和其右侧;例如,如果S1的最右上亮度位置(例如,右上角部)位于(S0_width+Sl_width-1,0)处,那么右上候选项B0可位于(S0_width+Sl_width-1,-1)处。图8示出了具有注释的图7,从而示出包括第二区域S1的最左下亮度位置和第二区域S1的最右上亮度位置的亮度位置。
在一些实施方式中并且仍参考图8,当构建区域S1的候选列表时,一些潜在候选项可自动地标记为不可用的,并且可从列表移除;因为在存在指数分区的情况下,此类分区可执行以将具有不同运动信息的帧内的区域(或物体)分区。因此,可推断,与这些候选项相关联的块同样表示具有不同运动的另一物体,并且因此这些候选项可自动地标记为不可用的(例如,不进一步考虑,从列表移除,等等)。在图7的实例中,关于区域S1,左上候选项B2可自动地标记为不可用的,因为可能的是,区域S1未与位于左上候选项B2的块共享运动信息。
图9为示出视频编码器900的一个非限制性实例的系统框图,该视频编码器900能够利用帧间预测与指数分区编码视频。实例视频编码器900接收输入视频905,可根据处理方案对输入视频905进行初始地分段或划分,诸如树结构编码块分区方案(例如,四叉树加二叉树(QTBT))。树结构编码块分区方案的一个实例可包括将图像帧分区成称为编码树单元(CTU)的大块元素。在一些实施方式中,每个CTU还可一次或多次分区成称为编码单元(CU)的多个子块。这种分割的最终结果可包括可称为预测单元(PU)的子块组。还可利用变换树(TU)。此类分区方案可包括根据当前主题的一些方面而执行指数分区。图8示出了帧的QTBT分区的一个实例,并且图11示出了在图8所示的QTBT的CU水平上的指数分区的一个实例。
仍参考图9,实例视频编码器900可包括帧内预测处理器915、运动估计/补偿处理器920(还称为帧间预测处理器)、变换/量化处理器925、反量化/反变换处理器930、环内滤波器935、解码图像缓冲器940和熵编码处理器945;运动估计/补偿处理器920能够支持包括AMVP和合并模式的指数分区。在一些实施方式中,利用指数分区并且包括AMVP模式和合并模式的使用,运动估计/补偿处理器920可执行帧间预测。关于指数分区模式、AMVP模式和合并模式发出信号的比特流参数可输入至熵编码处理器945以用于包括于输出比特流950中。
在操作中,并且继续参考图9,可确定输入视频905的帧的每个块,无论是否经由帧内图像预测或利用运动估计/补偿来处理该块。块可提供至帧内预测处理器910或运动估计/补偿处理器920。如果块将经由帧内预测进行处理,那么帧内预测处理器910可执行处理以输出预测物。如果块将经由运动估计/补偿进行处理,那么运动估计/补偿处理器920可执行处理以输出预测物,该处理包括指数分区与AMVP模式和合并模式的使用。
仍参考图9,残差可通过从输入视频减去预测物来形成。残差可由变换/量化处理器925接收,变换/量化处理器925可执行变换处理(例如,离散余弦变换(DCT))以产生系数,该系数可量化。量化系数和任何相关信令信息可提供至熵编码处理器945以用于熵编码并且包括于输出比特流950中。熵编码处理器945可支持与指数分区模式、AMVP模式和合并模式相关的信令信息的编码。此外,量化系数可提供至反量化/反变换处理器930,反量化/反变换处理器930可再现像素,可与预测物组合并且由环内滤波器935进行处理,其输出可存储于解码图像缓冲器940中以由运动估计/补偿处理器920使用,运动估计/补偿处理器920能够支持指数分区模式、AMVP模式和合并模式。
图12为过程流程图,示出了根据当前主题的一些方面以指数分区和帧间预测将视频编码的实例过程1200,实例过程1200可减小编码复杂性同时增加压缩效率。在步骤1210,视频帧可经历初始块分段,例如利用树结构编码块分区方案,该树结构编码块分区方案可包括将图像帧分区成CTU和CU。在步骤1220,块可选择用于指数分区;指数分区可包括几何分区或可包括利用非线性曲线的指数分区。选择可包括根据度量规则而识别,将根据指数分区模式进行处理的块。
在步骤1230并且继续参考图12,可确定指数分区。弯曲线和/或线段(例如,405)和/或平直线和/或线段可确定,将块内所包括的像素根据其帧间运动分离成两个非矩形区域(例如,区域0和区域1),使得区域一者(例如,区域0)内的像素(例如,亮度样本)具有类似运动,并且另一区域(例如,区域1)内的像素具有类似运动。
在步骤1240并且继续参考图12,每个非矩形区域的运动信息可利用AMVP模式或合并模式进行确定和处理。当利用AMVP模式处理区域时,通过考虑空间候选项和时间候选项两者(包括如上文所描述的空间候选项)并且包括将一些候选项标记为不可用的,候选列表可构建。运动矢量可选自作为运动矢量预测的运动矢量候选项的列表,并且运动矢量差值(例如,残差)可进行计算。可确定候选列表的索引。在合并模式中,通过考虑空间候选项和时间候选项两者(包括上文所描述的空间候选项)并且包括将一些候选项标记为不可用的,候选列表可构建。运动矢量可选自运动矢量候选项的列表,以用于区域采用另一块的运动信息。可确定候选列表的索引。
在步骤1250并且继续参考图12,所确定指数分区和运动信息可在比特流中发出信号。将指数分区在比特流中发出信号可包括例如一个或多个预定模板和/或系数的索引。运动信息在利用AMVP处理区域时的信令可包括运动矢量差值(例如,残差)和运动矢量候选列表在比特流中的索引。运动信息在利用合并模式处理区域时的信令可包括运动矢量候选列表在比特流中的索引。
图13为系统框图,示出了根据当前主题的一些方面能够使用指数分区和帧间预测将比特流1370解码的实例解码器600。解码器600可包括熵解码器处理器1310、反量化和反变换处理器1320、去块滤波器1330、帧缓冲器1340、运动补偿处理器1350和帧内预测处理器1360。在一些实施方式中,比特流1370包括参数,这些参数关于指数分区模式、AMVP模式和合并模式发出信号。利用如本公开所描述的指数分区和帧间预测,运动补偿处理器1350可重建像素信息。
在操作中,比特流1370可由解码器600接收并且输入至熵解码器处理器1310,该熵将比特流解码成量化系数。量化系数可被提供至反量化和反变换处理器1320,反量化和反变换处理器1320可执行反量化和反变换以形成残差信号,该残差信号根据处理模式可被添加至运动补偿处理器1350或帧内预测处理器1360的输出。运动补偿处理器1350和帧内预测处理器1360的输出可包括基于先前解码块的块预测值。预测值和残差的总和可通过去块滤波器1330进行处理并且存储于帧缓冲器1350中。关于给定块(例如,CU或PU),当比特流1370发出信号(分区模式为指数分区)时,基于本文所描述的指数分区方式并且利用如本文所描述的AMVP或合并模式,运动补偿处理器1350可构建预测值。
图14为根据当前主题的一些方面示出实例过程1400的过程流程图,实例过程1400利用指数分区和利用帧间预测将比特流解码。在步骤1410,接收比特流。该接收可包括提取和/或解析比特流和比特流的相关信令信息,从而包括解析当前块和比特流的相关信令信息。
在步骤1420并且仍参考图14,当前块可经由指数分区模式分区成第一区域和第二区域。该分区可包括确定对于块是否启用指数分区(例如,正确),从而指示指数分区利用非线性曲线的使用。如果未启用指数分区模式(例如,错误),那么解码器可利用另选指数分区模式(诸如几何分区)而处理块;几何分区的参数(包括但不限于线段端点、系数等)可接收自比特流,如上文所描述。如果启用了指数分区模式(例如,真实),那么解码器可提取或确定表征指数分区的一个或多个参数。这些参数可包括例如指数系数索引、指数系数值、取向模板索引,和/或弯曲线(例如,P1P2)的起始和结束索引。提取或确定可包括识别并检索比特流的参数(例如,解析比特流)。
在步骤1430并且继续参考图14,可确定与第一区域或第二区域的区域相关联的运动矢量。确定运动矢量可包括确定区域的运动信息是否利用AMVP模式或合并模式进行确定。当利用AMVP模式处理区域时,通过考虑空间候选项和时间候选项两者(包括上文所描述的空间候选项)并且包括将一些候选项标记为不可用的,候选列表可构建。运动矢量可选自运动矢量候选项的列表,因为运动矢量预测和运动矢量差值(例如,残差)可进行计算。在合并模式中,该确定可包括构建每个区域的空间候选项和时间候选项的候选列表。关于每个区域,空间候选项可为如上文相对于图5至图8所描述的空间候选项。构建候选列表可包括将候选项自动地标记为不可用的和从候选列表移除不可用候选项。所构建候选列表的索引可从比特流进行解析并且用于从候选列表选择最终候选项。当前区域的运动信息可确定与最终候选项的运动信息相同(例如,区域的运动矢量可从最终候选项来采用)。
在步骤1440并且仍参考图14,当前块可利用该确定运动矢量来解码。
仍参考图14,虽然少数变型已在上文详细地描述,但是其它修改或添加为可能的。例如,在一些实施方式中,指数分区可适用于对称块(8×8,16×16,32×32,64×64,128×128等)以及各种非对称块(8×4,16×8等)。
继续参考图14,分区可基于编码器中的速率失真决策而在比特流中发出信号。编码可基于规则预定分区(例如,模板)、分区的时间和空间预测以及额外偏移的组合。每个指数分区区域可利用运动补偿预测或帧内预测。预测区域的边界可在添加残差之前进行平滑处理。关于残差编码,编码器可在整个块的常规矩形DCT和每个区域的形状自适应DCT之间进行选择。
仍参考图14,在一些实施方式中,可实施四叉树加二叉决策树(QTBT)。在QTBT中,在编码树单元水平,QTBT的分区参数可动态地衍生以适应于局部特性而无需传送任何开销。随后,在编码单元(CU)水平,联合分类器决策树结构可消除非必需迭代并且控制错误预测的风险。在一些实施方式中,作为在QTBT的每个叶节点处可用的额外分区选项,指数分区可为可用的。在一些实施方式中,作为QTBT分区的CU水平的额外编码工具,指数分区为可用的。例如,8示出了帧的QTBT分区的一个实例;并且图11示出了以图8所示QTBT的CU水平的指数分区的一个实例。
在一些实施方式中,解码器包括指数分区处理器,该指数分区处理器可生成当前块的指数分区并且提供从属过程的所有分区相关的信息。指数分区处理器可直接地影响运动补偿,因为在块进行指数分区的情况下,其可逐段执行。另外,分区处理器可将形状信息提供至帧内预测处理器和变换编码处理器。
在一些实施方式中,额外语法元素可以比特流的不同分层水平发出信号。为启用整个序列的指数分区,启用标志可在序列参数集(SPS)中进行编码。另外,CTU标志可以编码树单元(CTU)水平进行编码以指示任何编码单元(CU)是否利用指数分区。CU标志可进行编码以指示当前编码单元是否利用指数分区。规定块上的弯曲线的参数可进行编码。关于每个区域,标志可进行解码,这规定了当前区域是否进行帧间或帧内预测。
在一些实施方式中,可规定最小区域尺寸。
本文所描述的主题提供了许多技术优点。例如,当前主题的一些实施方式可提供块的分区,该分区增加了压缩效率。在一些实施方式中,通过以更密切地沿循物体边界的方式实施分区,可实现了有效视觉效果。类似地,在一些实施方式中,通过以更密切地沿循物体边界的方式实施分区,可减少物体边界处的块化伪像。
值得注意的是,本文所描述的方面和实施例的任一者或多者可利用以下项来方便地实施:数字电子电路、集成电路、特殊设计的专用集成电路(ASIC)、现场可编程门阵列(FPGA)、计算机硬件、固件、软件和/或其组合,如在一个或多个机器(例如,一个或多个计算装置(该一个或多个计算装置用作电子文件的用户计算装置)、一个或多个服务器装置(诸如文件服务器),等等)中所实现和/或实施,该一个或多个机器根据本说明书的教导内容进行编程,如对于计算机领域的技术人员将显而易见的。这些各个方面或特征可包括在一个或多个计算机程序和/或软件中的实施,该一个或多个计算机程序和/或软件为在包括至少一个可编程处理器的可编程系统上可执行的和/或可解释的,该至少一个可编程处理器出于专用和通用目的可联接以从存储系统、至少一个输入装置和至少一个输出装置接收数据和指令并且将数据和指令传送至其。适当软件编码可由熟练程序员基于本公开的教导内容而易于制备,如对于软件领域的技术人员将显而易见的。上文所讨论的采用软件和/或软件模块的方面和实施方式还可包括适当硬件,以用于协助该软件和/或软件模块的机器可执行指令的实施。
此类软件可为采用了机器可读存储介质的计算机程序产品。机器可读存储介质可为能够存储和/或编码由机器(例如,计算装置)执行的指令序列并且引起机器执行本文所描述方法和/或实施例的任一者的任何介质。机器可读存储介质的实例包括但不限于磁盘、光盘(例如CD、CD-R、DVD、DVD-R等)、磁光盘、只读存储器“ROM”装置、随机存取存储器“RAM”装置、磁卡、光卡、固态存储装置、EPROM、EEPROM、可编程逻辑装置(PLD),和/或其任何组合。如本文所用,机器可读介质旨在包括单一介质以及物理独立介质的集合,诸如,例如压缩盘或一个或多个硬盘驱动器与计算机存储器组合的集合。如本文所用,机器可读存储介质未包括临时形式的信号传送。
此类软件还可包括作为数据信号承载于数据载体(诸如,载波)上的信息(例如,数据)。例如,机器可执行信息可作为在数据载体中所实施的数据承载信号而包括在内,其中该信号编码了由机器(例如,计算装置)所执行的指令序列或其部分,以及任何相关信息(例如,数据结构和数据);该相关信息引起机器执行本文所描述方法和/或实施例的任一者。
计算装置的实例包括但不限于电子书阅读装置、计算机工作站、终端计算机、服务器计算机、手持装置(例如,平板计算机、智能电话等)、网络器具、网络路由器、网络交换机、网络桥接器,能够执行指令序列(规定了将由机器所采取的动作)的任何机器,和其任何组合。在一个实例中,计算装置可包括信息亭和/或可包括于信息亭中。
图15示出了计算机系统1500的示例性形式的计算装置的一个实施例的示意性表示,一组指令可在该计算装置内执行,该组指令用于使得控制系统执行本公开的方面和/或方法的任一者或多者。还可设想,多个计算装置可用于实施特别配置指令组以用于使得装置的一者或多者执行本公开的方面和/或方法的任一者或多者。计算机系统1500包括处理器1504和存储器1508,它们经由总线1512彼此通信并且与其它部件通信。利用多种总线架构的任一者,总线1512可包括数种类型总线结构的任一者,包括但不限于存储器总线、存储器控制器、外围总线、本地总线,和其任何组合。
存储器1508可包括各种部件(例如,机器可读介质),包括但不限于随机存取存储器部件、只读部件,和其任何组合。在一个实例中,基本输入/输出系统1516(BIOS)(包括有助于诸如在启动期间在计算机系统1500内的元件之间传输信息的基本路径)可存储于存储器1508中。存储器1508还可包括(例如,存储于一种或多种机器可读介质上的)指令(例如,软件)1520,指令1520实施本公开的方面和/或方法的任一者或多者。在另一个实例中,存储器1508还可包括任何数量的程序模块,包括但不限于操作系统、一个或多个应用程序、其它程序模块、程序数据,和其任何组合。
计算机系统1500还可包括存储装置1524。存储装置(例如,存储装置1524)的实例包括但不限于硬盘驱动器、磁盘驱动器、与光学介质组合的光盘驱动器、固态存储器装置,和其任何组合。存储装置1524可通过适当接口(未示出)连接至总线1512。实例接口包括但不限于SCSI、高级技术附件(ATA)、串行ATA、通用串行总线(USB)、IEEE 1394(火线),和其任何组合。在一个实例中,存储装置1524(或其一个或多个部件)可与计算机系统1500可移除地连接(例如,经由外部端口连接器(未示出))。特别地,存储装置1524和相关机器可读介质1528可向计算机系统1500提供机器可读指令、数据结构、程序模块和/或其它数据的非易失性和/或易失性存储。在一个实例中,软件1520可完全地或部分地驻留于机器可读介质1528内。在另一个实例中,软件1520可完全地或部分地驻留于处理器1504内。
计算机系统1500还可包括输入装置1532。在一个实例中,计算机系统1500的用户可经由输入装置1532将命令和/或其它信息输入至计算机系统1500。输入装置1532的实例包括但不限于字母数字输入装置(例如,键盘)、点击装置、操纵杆、游戏板、音频输入装置(例如,麦克风、语音应答系统等)、光标控制装置(例如,鼠标)、触摸板、光学扫描仪、视频捕获装置(例如,静止摄像机、视频摄像机)、触摸屏,和其任何组合。
输入装置1532经由多种接口的任一者(未示出)可连接至总线1512,该接口包括但不限于串行接口、并行接口、游戏端口、USB接口、火线接口、与总线1512的直接接口,和其任何组合。输入装置1532可包括触摸屏界面,该触摸屏界面可为下文所进一步讨论的显示器1536的一部分或可与其分开。输入装置1532可用作用户选择装置,以用于选择如上文所描述的图形界面的一个或多个图形表示。
用户还可经由存储装置1524(例如,可移动磁盘驱动器、闪存驱动器等)和/或网络接口装置1540将命令和/或其它信息输入至计算机系统1500。网络接口装置(诸如网络接口装置1540)可用于将计算机系统1500连接至多种网络的一者或多者,诸如网络1544,和与之连接的一个或多个远程装置1548。网络接口装置的实例包括但不限于网络接口卡(例如,移动网络接口卡、LAN卡)、调制解调器,和其任何组合。网络的实例包括但不限于广域网(例如,互联网、企业网络)、局域网(例如,与办公室、建筑物、校园或其它较小地理空间相关的网络)、电话网络、与电话/语音供应商相关的数据网络(例如,移动通信供应商数据和/或语音网络)、两个计算装置之间的直接连接,和其任何组合。网络(诸如网络1544)可采用有线和/或无线通信模式。一般来讲,可使用任何网络拓扑结构。信息(例如,数据、软件1520等)可经由网络接口装置1540通信至和/或自计算机系统1500。
计算机系统1500还可包括视频显示适配器1552以用于将可显示图片通信至显示装置,诸如显示装置1536。显示装置的实例包括但不限于液晶显示器(LCD)、阴极射线管(CRT)、等离子显示器、发光二极管(LED)显示器,和其任何组合。显示适配器1552和显示装置1536可结合处理器1504使用以提供本公开的一些方面的图形表示。除了显示装置,计算机系统1500还可包括一个或多个其它外围输出装置,包括但不限于音频扬声器、打印机,和其任何组合。此类外围输出装置经由外围接口1556可连接至总线1512。外围接口的实例包括但不限于串行端口、USB连接、火线连接、并行连接,和其任何组合。
前述内容已详细描述了本发明的例示性实施例。在不脱离本发明的精神和范围的情况下,可做出各种修改和添加。上文所描述各种实施例的每一者的特征可在适当情况下与其它所描述实施例的特征进行组合,以提供相关新实施例的多种特征组合。此外,虽然前述内容描述了多个独立实施例,但是本文已描述的实施例仅说明了本发明的原理应用。另外,尽管本文的特定方法可示出和/或描述成以特定次序执行,但是该次序在用以实现如本文所公开的实施例的技术范围内为高度可变的。因此,本描述旨在仅以实例的方式来进行,而非以其它方式限制本发明的范围。
在上述描述和权利要求书中,诸如“......的至少一者”或“......的一者或多者”的短语可出现于连结元件或特征列表之后。术语“和/或”也可出现于两个或更多个元件或特征的列表中。除非与所使用语境隐含地或明确地矛盾,此类短语旨在单独地意指所列出元件或特征的任一者,或意指与其它所叙述元件或特征的任一者组合的所叙述元件或特征的任一者。例如,短语“A和B的至少一者”、“A和B的一者或多者”和“A和/或B”各自旨在意指“单A、单B,或A和B一起”。类似解释也旨在用于包括三个或更多个项的列表。例如,短语“A、B和C的至少一者”、“A、B和C的一者或多者”和“A、B和/或C”各自旨在意指“单A、单B、单C、A和B一起、A和C一起、B和C一起,或A和B和C一起”。此外,上文和权利要求书所用的术语“基于”旨在意指“至少部分地基于”,使得未列举特征和元件也为可容许的。
本文所描述的主题可在系统、设备、方法和/或制品中实现,取决于期望配置。前述描述所阐述的实施方式未表示与本文所描述主题一致的所有实施方式。相反,它们仅为与所描述主题相关的方面一致的一些实例。虽然少数变型已在上文详细地描述,但是其它修改或添加为可能的。特别地,除了本文所阐述的那些之外,还可提供其它特征和/或变型。例如,上文所描述的实施方式可涉及所公开特征的各种组合和子组合和/或上文所公开的一些其它特征的组合和子组合。此外,附图所示和/或本文所描述的逻辑流程非必然地要求所示特定次序或顺序次序来实现期望结果。其它实施方式可落入下述权利要求书的范围内。

Claims (42)

1.一种解码器,所述解码器包括电路,所述电路配置为:
接收比特流;
通过指数分区模式将当前块分区成第一区域和第二区域;
确定与所述第一区域或所述第二区域的区域相关联的运动矢量,其中所述确定包括构建候选列表;以及
利用确定的运动矢量解码所述当前块。
2.根据权利要求1所述的解码器,其中构建所述候选列表包括评估左下候选项、左侧候选项、左上候选项、上侧候选项和右上候选项。
3.根据权利要求2所述的解码器,其中:
所述确定的运动矢量用于所述第一区域;
所述指数分区模式包括第一亮度位置和第二亮度位置之间的弯曲线段;
所述左下候选项位于第三亮度位置,所述第三亮度位置紧邻所述左侧并且紧邻所述第二亮度位置下方;
所述左侧候选项位于第四亮度位置,所述第四亮度位置紧邻所述第二亮度位置的所述左侧;
所述左上候选项位于第五亮度位置,所述第五亮度位置紧邻所述第一区域的最左上亮度位置的所述左侧上方并且紧邻所述左侧;
所述上侧候选项位于第六亮度位置,所述第六亮度位置紧邻所述第一亮度位置上方;和
所述右上候选项位于第七亮度位置,所述第七亮度位置紧邻所述第二区域的最右亮度位置上方。
4.根据权利要求2所述的解码器,其中:
所述确定的运动矢量用于所述第二区域;
所述指数分区模式包括第一亮度位置和第二亮度位置之间的弯曲线段;
所述左下候选项位于第三亮度位置,所述第三亮度位置紧邻所述左侧并且紧邻所述第二区域的最左下亮度位置下方;
所述左侧候选项位于第四亮度位置,所述第四亮度位置紧邻所述第二区域的所述左下亮度位置的所述左侧;
所述左上候选项位于第五亮度位置,所述第五亮度位置紧邻所述第一位置的所述左侧上方并且紧邻所述左侧;
所述上侧候选项位于第六亮度位置,所述第六亮度位置紧邻所述第二区域的最右上亮度位置上方;和
所述右上候选项位于第七亮度位置,所述第七亮度位置紧邻所述第二区域的所述最右上亮度位置的所述右侧上方并且紧邻所述右侧。
5.根据权利要求2所述的解码器,其中所述确定的运动矢量用于所述第二区域,所述解码器还配置为响应于确定所述候选项与所述第一区域共位而将所述候选项标记为不可用的。
6.根据权利要求2所述的解码器,其中所述确定的运动矢量用于所述第二区域,并且其中所述解码器还配置为响应于确定启用了所述指数分区模式而将所述左上候选项自动地标记为不可用的。
7.根据权利要求2所述的解码器,其中所述确定的运动矢量用于所述第一区域,所述解码器还配置为响应于确定启用了所述指数分区模式而将所述右上候选项自动地标记为不可用的。
8.根据权利要求2所述的解码器,其中所述确定的运动矢量用于所述第一区域,所述解码器还配置为响应于确定启用了所述指数分区模式而将所述左下候选项自动地标记为不可用的。
9.根据权利要求1所述的解码器,其中所述指数分区模式还包括几何分区模式。
10.根据权利要求1所述的解码器,还配置为确定对所述第一区域启用了合并模式。
11.根据权利要求1所述的解码器,还配置为重建所述当前块的像素数据,所述第一区域和第二区域为非矩形的。
12.根据权利要求1所述的解码器,其中在所述比特流中发出所述指数分区模式信号。
13.根据权利要求1所述的解码器,其中通过所述指数分区模式将所述当前块分区成所述第一区域和第二区域包括由预定模板所表征的弯曲线分区所述当前块。
14.根据权利要求13所述的解码器,其中通过预定系数值表征将所述当前块分区成所述第一区域和第二区域的所述弯曲线。
15.根据权利要求1所述的解码器,其中所述指数分区模式对于大于或等于8×8亮度样本的块尺寸为可用的。
16.根据权利要求1所述的解码器,还包括:
熵解码器处理器,所述熵解码器处理器配置为接收所述比特流并且将所述比特流解码成量化系数;
反量化和反变换处理器,所述反量化和反变换处理器配置为处理所述量化系数,包括执行反离散余弦变换;
去块滤波器;
帧缓冲器;以及
帧内预测处理器。
17.根据权利要求1所述的解码器,其中所述比特流包括指示所述指数分区模式对于所述当前块是否启用的参数。
18.根据权利要求1所述的解码器,其中所述当前块形成四叉树加二叉决策树的一部分。
19.根据权利要求18所述的解码器,其中所述当前块为所述四叉树加二叉决策树的非叶节点。
20.根据权利要求1所述的解码器,其中所述当前块为编码树单元或编码单元。
21.根据权利要求1所述的解码器,其中所述第一区域为编码单元或预测单元。
22.一种方法,所述方法包括:
由解码器接收比特流;
由所述解码器通过指数分区模式将当前块分区成第一区域和第二区域;
由所述解码器确定与所述第一区域或所述第二区域的区域相关联的运动矢量,所述确定包括构建候选列表;以及
由所述解码器利用确定的运动矢量解码所述当前块。
23.根据权利要求22所述的方法,其中构建所述候选列表包括评估左下候选项、左侧候选项、左上候选项、上侧候选项和右上候选项。
24.根据权利要求23所述的方法,其中:
所述确定的运动矢量用于所述第一区域;
所述指数分区模式包括第一亮度位置和第二亮度位置之间的弯曲线段;
所述左下候选项位于第三亮度位置,所述第三亮度位置紧邻所述左侧并且紧邻所述第二亮度位置下方;
所述左侧候选项位于第四亮度位置,所述第四亮度位置紧邻所述第二亮度位置的所述左侧;
所述左上候选项位于第五亮度位置,所述第五亮度位置紧邻所述第一区域的最左上亮度位置的所述左侧上方并且紧邻所述左侧;
所述上侧候选项位于第六亮度位置,所述第六亮度位置紧邻所述第一亮度位置上方;和
所述右上候选项位于第七亮度位置,所述第七亮度位置紧邻所述第二区域的最右亮度位置上方。
25.根据权利要求23所述的方法,其中:
所述确定的运动矢量用于所述第二区域;其中所述指数分区模式包括第一亮度位置和第二亮度位置之间的弯曲线段;
所述左下候选项位于第三亮度位置,所述第三亮度位置紧邻所述左侧并且紧邻所述第二区域的最左下亮度位置下方;
所述左侧候选项位于第四亮度位置,所述第四亮度位置紧邻所述第二区域的所述左下亮度位置的所述左侧;
所述左上候选项位于第五亮度位置,所述第五亮度位置紧邻所述第一位置的所述左侧上方并且紧邻所述左侧;
所述上侧候选项位于第六亮度位置,所述第六亮度位置紧邻所述第二区域的最右上亮度位置上方;和
所述右上候选项位于第七亮度位置,所述第七亮度位置紧邻所述第二区域的所述最右上亮度位置的所述右侧上方并且紧邻所述右侧。
26.根据权利要求23所述的方法,其中所述确定的运动矢量用于所述第二区域,并且还包括响应于确定所述候选项与所述第一区域共位而将所述候选项标记为不可用的。
27.根据权利要求23所述的方法,其中所述确定的运动矢量用于所述第二区域,并且所述方法还包括:
响应于确定启用了所述指数分区模式而将所述左上候选项自动地标记为不可用的。
28.根据权利要求23所述的方法,其中所述确定的运动矢量用于所述第一区域,并且所述方法还包括:
响应于确定启用了所述指数分区模式而将所述右上候选项自动地标记为不可用的。
29.根据权利要求23所述的方法,其中所述确定的运动矢量用于所述第一区域,并且所述方法还包括:
响应于确定启用了所述指数分区模式而将所述左下候选项自动地标记为不可用的。
30.根据权利要求22所述的方法,其中所述指数分区模式还包括几何分区模式。
31.根据权利要求22所述的方法,还包括确定对所述第一区域启用了合并模式或高级运动矢量预测模式。
32.根据权利要求22所述的方法,还包括重建所述当前块的像素数据,所述第一区域和第二区域为非矩形的。
33.根据权利要求22所述的方法,其中在所述比特流中发出所述指数分区模式信号。
34.根据权利要求22所述的方法,其中通过所述指数分区模式将所述当前块分区成所述第一区域和第二区域包括以由预定模板所表征的弯曲线分区所述当前块。
35.根据权利要求33所述的方法,其中通过预定系数值表征将所述当前块分区成所述第一区域和第二区域的所述弯曲线。
36.根据权利要求22所述的方法,其中所述指数分区模式对于大于或等于8×8亮度样本的块尺寸为可用的。
37.根据权利要求22所述的方法,其中所述解码器还包括:
熵解码器处理器,所述熵解码器处理器配置为接收所述比特流并且将所述比特流解码成量化系数;
反量化和反变换处理器,所述反量化和反变换处理器配置为处理所述量化系数,包括执行反离散余弦变换;
去块滤波器;
帧缓冲器;以及
帧内预测处理器。
38.根据权利要求22所述的方法,其中所述比特流包括指示所述指数分区模式对于所述当前块是否启用的参数。
39.根据权利要求22所述的方法,其中所述当前块形成四叉树加二叉决策树的一部分。
40.根据权利要求38所述的方法,其中所述当前块为所述四叉树加二叉决策树的非叶节点。
41.根据权利要求22所述的方法,其中所述当前块为编码树单元或编码单元。
42.根据权利要求22所述的方法,其中所述第一区域为编码单元或预测单元。
CN202080025802.1A 2019-01-28 2020-01-28 指数分区的帧间预测 Pending CN113647105A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962797816P 2019-01-28 2019-01-28
US62/797,816 2019-01-28
PCT/US2020/015408 WO2020159988A1 (en) 2019-01-28 2020-01-28 Inter prediction in exponential partitioning

Publications (1)

Publication Number Publication Date
CN113647105A true CN113647105A (zh) 2021-11-12

Family

ID=71841915

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080025802.1A Pending CN113647105A (zh) 2019-01-28 2020-01-28 指数分区的帧间预测

Country Status (9)

Country Link
US (1) US20210360271A1 (zh)
EP (1) EP3918791A4 (zh)
JP (2) JP2022523309A (zh)
KR (1) KR20210118151A (zh)
CN (1) CN113647105A (zh)
BR (1) BR112021014667A2 (zh)
MX (1) MX2021009028A (zh)
SG (1) SG11202108101SA (zh)
WO (1) WO2020159988A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11695967B2 (en) 2018-06-22 2023-07-04 Op Solutions, Llc Block level geometric partitioning
EP3861732A4 (en) * 2018-10-01 2022-07-06 OP Solutions, LLC EXPONENTIAL PARTITIONING METHODS AND SYSTEMS
SG11202108103WA (en) 2019-01-28 2021-08-30 Op Solutions Llc Inter prediction in geometric partitioning with an adaptive number of regions
CN113473141A (zh) * 2020-03-31 2021-10-01 Oppo广东移动通信有限公司 帧间预测方法、编码器、解码器及计算机可读存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1358027A (zh) * 2000-12-06 2002-07-10 Lg电子株式会社 视频数据编码/解码装置及方法
US20070201558A1 (en) * 2004-03-23 2007-08-30 Li-Qun Xu Method And System For Semantically Segmenting Scenes Of A Video Sequence
US20090196342A1 (en) * 2006-08-02 2009-08-06 Oscar Divorra Escoda Adaptive Geometric Partitioning For Video Encoding
US20090316009A1 (en) * 2008-06-20 2009-12-24 Atsushi Ito Apparatus, Method, and Program for Processing Image
KR20130002242A (ko) * 2011-06-28 2013-01-07 주식회사 케이티 영상 정보의 부호화 방법 및 복호화 방법
CN103004198A (zh) * 2010-07-15 2013-03-27 索尼公司 图像处理设备和图像处理方法
JP2014517658A (ja) * 2011-06-20 2014-07-17 クゥアルコム・インコーポレイテッド ビデオコーディングのための並列化フレンドリーなマージ候補
US20140247876A1 (en) * 2011-10-31 2014-09-04 Mitsubishi Electric Corporation Video encoding device, video decoding device, video encoding method, and video decoding method
CN105247863A (zh) * 2013-07-08 2016-01-13 联发科技(新加坡)私人有限公司 三维视频编码中简化的cabac编码方法
US20160366442A1 (en) * 2014-03-07 2016-12-15 Hongbin Liu Simplified sub-prediction unit (sub-pu) motion parameter inheritence (mpi)
US20170223377A1 (en) * 2016-01-29 2017-08-03 Google Inc. Last frame motion vector partitioning
CN107071458A (zh) * 2010-12-14 2017-08-18 M&K控股株式会社 用于编码运动画面的设备
WO2018028615A1 (en) * 2016-08-12 2018-02-15 Mediatek Inc. Methods and apparatuses of predictor-based partition in video processing system
US20180146209A1 (en) * 2011-01-07 2018-05-24 Ntt Docomo, Inc. Predictive encoding method, predictive encoding device, and predictive encoding program of motion vector, and, predictive decoding method, predictive decoding device, and predictive decoding program of motion vector

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8605786B2 (en) * 2007-09-04 2013-12-10 The Regents Of The University Of California Hierarchical motion vector processing method, software and devices
SI2924995T1 (sl) * 2010-07-09 2018-10-30 Samsung Electronics Co., Ltd. Postopek za dekodiranje videa z uporabo združevanja blokov

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1358027A (zh) * 2000-12-06 2002-07-10 Lg电子株式会社 视频数据编码/解码装置及方法
US20070201558A1 (en) * 2004-03-23 2007-08-30 Li-Qun Xu Method And System For Semantically Segmenting Scenes Of A Video Sequence
US20090196342A1 (en) * 2006-08-02 2009-08-06 Oscar Divorra Escoda Adaptive Geometric Partitioning For Video Encoding
US20090316009A1 (en) * 2008-06-20 2009-12-24 Atsushi Ito Apparatus, Method, and Program for Processing Image
CN103004198A (zh) * 2010-07-15 2013-03-27 索尼公司 图像处理设备和图像处理方法
CN107071458A (zh) * 2010-12-14 2017-08-18 M&K控股株式会社 用于编码运动画面的设备
US20180146209A1 (en) * 2011-01-07 2018-05-24 Ntt Docomo, Inc. Predictive encoding method, predictive encoding device, and predictive encoding program of motion vector, and, predictive decoding method, predictive decoding device, and predictive decoding program of motion vector
JP2014517658A (ja) * 2011-06-20 2014-07-17 クゥアルコム・インコーポレイテッド ビデオコーディングのための並列化フレンドリーなマージ候補
KR20130002242A (ko) * 2011-06-28 2013-01-07 주식회사 케이티 영상 정보의 부호화 방법 및 복호화 방법
US20140247876A1 (en) * 2011-10-31 2014-09-04 Mitsubishi Electric Corporation Video encoding device, video decoding device, video encoding method, and video decoding method
CN105247863A (zh) * 2013-07-08 2016-01-13 联发科技(新加坡)私人有限公司 三维视频编码中简化的cabac编码方法
US20160366442A1 (en) * 2014-03-07 2016-12-15 Hongbin Liu Simplified sub-prediction unit (sub-pu) motion parameter inheritence (mpi)
US20170223377A1 (en) * 2016-01-29 2017-08-03 Google Inc. Last frame motion vector partitioning
WO2018028615A1 (en) * 2016-08-12 2018-02-15 Mediatek Inc. Methods and apparatuses of predictor-based partition in video processing system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MAX BLÄSER等: "Geometry-based Partitioning for Predictive Video Coding with Transform Adaptation", 《2018 PICTURE CODING SYMPOSIUM (PCS)》 *

Also Published As

Publication number Publication date
JP2023101782A (ja) 2023-07-21
SG11202108101SA (en) 2021-08-30
EP3918791A4 (en) 2022-03-16
US20210360271A1 (en) 2021-11-18
MX2021009028A (es) 2021-10-13
KR20210118151A (ko) 2021-09-29
WO2020159988A1 (en) 2020-08-06
JP2022523309A (ja) 2022-04-22
EP3918791A1 (en) 2021-12-08
BR112021014667A2 (pt) 2021-09-28

Similar Documents

Publication Publication Date Title
CN113647105A (zh) 指数分区的帧间预测
US11695922B2 (en) Inter prediction in geometric partitioning with an adaptive number of regions
WO2020219940A1 (en) Global motion for merge mode candidates in inter prediction
KR20210118166A (ko) 적응형 개수의 영역들을 갖는 기하학적 파티셔닝을 위한 모양 적응 이산 코사인 변환
US20230239464A1 (en) Video processing method with partial picture replacement
JP7323220B2 (ja) 大域的運動を伴うフレームにおける候補
JP2023105073A (ja) 大域的運動を伴うフレームにおける適応型運動ベクトル予測候補
JP2023093765A (ja) 大域的運動を伴うフレームにおける選択的運動ベクトル予測候補
KR20220002989A (ko) 픽처 헤더 내의 글로벌 모션 벡터의 시그널링
CN113170175A (zh) 用于不可用参考图像的自适应时间滤波器
JP7482536B2 (ja) 適応的な数の領域を伴う幾何学的分割のための形状適応離散コサイン変換
US11825075B2 (en) Online and offline selection of extended long term reference picture retention
KR20210152567A (ko) 픽처 헤더 내의 글로벌 모션 벡터의 시그널링
EP3918799A1 (en) Explicit signaling of extended long term reference picture retention

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination