CN107925774A - 基于间预测模式的图像处理方法及其装置 - Google Patents

基于间预测模式的图像处理方法及其装置 Download PDF

Info

Publication number
CN107925774A
CN107925774A CN201680048849.3A CN201680048849A CN107925774A CN 107925774 A CN107925774 A CN 107925774A CN 201680048849 A CN201680048849 A CN 201680048849A CN 107925774 A CN107925774 A CN 107925774A
Authority
CN
China
Prior art keywords
mvd
motion vector
prediction
value
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201680048849.3A
Other languages
English (en)
Inventor
林宰显
朴婡利
徐廷东
南廷学
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN107925774A publication Critical patent/CN107925774A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)

Abstract

公开一种基于间预测模式的图像处理方法及其装置。具体地,一种基于间预测处理图像的方法可以包括以下步骤:确定运动矢量定标自适应是否被应用于块;当所述运动矢量定标自适应被应用于所述块时,对向下定标的MVD(运动矢量差)进行向上定标;使用所述向上定标的MVD和MVP(运动矢量预测因子)来导出用于所述块的MV(运动矢量);以及使用所述导出的MV来生成所述块的预测块。

Description

基于间预测模式的图像处理方法及其装置
技术领域
本发明涉及一种处理静止图像或运动图像的方法,并且更具体地,涉及一种基于间预测模式对静止图像或运动图像进行编码/解码的方法以及一种支持该方法的装置。
背景技术
压缩编码指的是经由通信线路发送数字化信息的一系列信号处理技术,或者以适用于存储介质的形式存储信息的技术。包括图片、图像、音频等等的介质可以是用于压缩编码的目标,并且具体地,对图片执行压缩编码的技术被称为视频图像压缩。
下一代视频内容被假定为是具有高空间分辨率、高帧速率和场景表示的高维度的特征。为了处理这样的内容,将导致在存储器存储、存储器存取速率和处理功率方面的急剧增长。
因此,需要设计一种有效率地处理下一代视频内容的编译工具。
发明内容
【技术问题】
本发明提出一种在间预测(或图片间预测)过程中自适应地改变运动矢量相关信息的定标的方法。
此外,本发明提出一种将运动矢量差分组成部分并对所述运动矢量差进行二进制编码的方法。
本发明要实现的技术目的不限于前述技术目的,并且本发明所属领域的普通技术人员显然可以从以下描述中理解上面未描述的其它技术目的。
【技术方案】
在本发明的一个方面中,一种基于间预测处理图像的方法,可以包括以下步骤:确定用于块的运动矢量定标自适应是否被应用;如果用于所述块的所述运动矢量定标自适应被应用,则对向下定标的MVD(运动矢量差)进行向上定标;使用所述向上定标的MVD和MVP(运动矢量预测因子)来导出用于所述块的MV(运动矢量);以及使用所述导出的MV来生成所述块的预测块。
在本发明的一个方面中,一种基于间预测处理图像的装置,可以包括:运动矢量定标自适应应用确定单元,所述运动矢量定标自适应应用确定单元确定用于块的运动矢量定标自适应是否被应用;运动参数解码单元,如果用于所述块的所述运动矢量定标自适应被应用,则所述运动参数解码单元对向下定标的MVD(运动矢量差)进行向上定标,并且使用所述向上定标的MVD和MVP(运动矢量预测器)来导出用于所述块的MV(运动矢量);以及预测块生成单元,所述预测块生成单元使用所述导出的MV来生成所述块的预测块。
优选地,可以通过对将MV减去MVP所获得的值应用round(四舍五入)、floor(向下舍入)和ceiling(向上舍入)运算中的至少任何一种来生成所述向下定标的MVD。
优选地,如果指示运动矢量定标自适应是否被应用的标志值是1,则可以确定要应用用于块的运动矢量定标自适应。
优选地,只有当所述向下定标的MVD不是0时才可以解析指示运动矢量定标自适应是否被应用的标志。
优选地,所述向下定标的MVD值可以被以区间为单位分组并被二进制编码。
优选地,可以将所述向下定标的MVD值编码为所述向下定标的MVD值所属于的区间的起始值和用于指示所述区间内的所述向下定标的MVD值的指示信息。
优选地,可以按区间的大小的比率向下定标并发送起始值。
优选地,区间的大小可以由编码器预先确定或者发送。
优选地,只有当所述向下定标的MVD值是2或以上时,所述向下定标的MVD值才可以被以区间为单位分组并被编码。
优选地,可以将区间的大小设定为2的平方数。
【有益效果】
依照本发明的实施例,可通过自适应地改变运动矢量相关信息的比例来减少运动矢量相关信息的绝对值。结果,可减少要发送的附加信息的量。
此外,依照本发明的实施例,可通过将运动矢量差分组成特定区间并对其进行二进制编码来减少用于对运动矢量差进行编码的信息的量。结果,可减少附加信息的量。
可以在本发明中获得的技术效果不限于上述的技术效果,并且本领域的技术人员可以从下面的描述中理解本文未提及的其它技术效果。
附图说明
附图作为用于帮助理解本发明的说明书的一部分被包括在此处,其提供本发明的实施例,并且借助以下的说明来描述本发明的技术特征。
图1图示作为本发明应用于的实施例的执行静止图像或者视频信号编码的编码器的示意性框图。
图2图示作为本发明应用于的实施例的执行静止图像或者视频信号解码的解码器的示意性框图。
图3是用于描述可以应用于本发明的编译单元的分割结构的图。
图4是用于描述可以应用于本发明的预测单元的图。
图5是本发明可以被应用于的实施例并且是图示间预测的方向的图。
图6是本发明可以被应用于的实施例并且图示用于1/4采样内插的整数和分数采样位置。
图7是本发明可以被应用于的实施例并且图示空间候选的位置。
图8是本发明可以被应用于的实施例并且是图示间预测方法的图。
图9是本发明可以被应用于的实施例并且是图示运动补偿过程的图。
图10图示根据本发明的实施例的通过应用运动矢量定标自适应来执行间预测的方法。
图11图示根据本发明的实施例的使用运动矢量定标自适应来执行间预测的方法。
图12图示根据本发明的实施例的使用运动矢量定标自适应来执行间预测的方法。
图13图示根据本发明的实施例的使用运动矢量定标自适应来执行间预测的方法。
图14图示根据本发明的实施例的对运动矢量差进行编码/解码的方法。
图15图示根据本发明的实施例的对运动矢量差进行编码的方法。
图16图示根据本发明的实施例的对运动矢量差进行编码的方法。
图17是图示根据本发明的实施例的内预测单元的图。
图18是图示根据本发明的实施例的基于间预测的图像处理方法的图。
具体实施方式
在下文中,本发明的优选实施例将通过参考伴随的附图来描述。在下面借助于伴随的附图描述的说明书将描述本发明示例性实施例,并且不意欲描述仅可以实现本发明的实施例。以下的描述包括特定细节以便提供对本发明的完全理解。但是,应该明白,对于本领域技术人员来说,无需特定细节,也可以实施本发明。
在一些情形中,为了防止本发明的技术概念不清楚,公知的结构或者设备可以被省略,或者可以围绕结构或者设备的核心功能将其描述为框图。
此外,虽然尽可能多地选择当前广泛地使用的常规术语作为本发明的术语,但是在特定情形中使用了由申请人任意选择的术语。由于在这样的情况下,术语的含义将在说明书的相应的部分中被清楚地描述,因此,应该明白,本发明将不是简单地由仅在本发明的描述中使用的术语来解释,而是应当理解术语的含义。
在以下的描述中使用的特定术语可以被提供以帮助理解本发明。此外,特定术语可以被修改为本发明的技术概念范围内的其他形式。例如,信号、数据、采样、图片、帧和块等可以在每个编译过程中被适当地替换和解释。
在下文中,在本说明书中,“处理单元”指的是执行编码/解码处理过程(诸如预测、变换和/或量化)的单元。在下文中,为了描述的方便起见,处理单元也可以被称作“单元”、“处理块”或者“块”。
处理单元可以被认为是具有包括用于亮度分量的单元和用于色度分量的单元的含义。例如,处理单元可以对应于编译树单元(CTU)、编译单元(CU)、预测单元(PU)或者变换单元(TU)。
此外,处理单元可以被认为是用于亮度分量的单元或者用于色度分量的单元。例如,处理单元可以对应于编译树块(CTB)、编译块(CB)、预测块(PB)或者用于亮度分量的变换块(TB)。可替选地,处理单元可以对应于编译树块(CTB)、编译块(CB)、预测块(PB)或者用于色度分量的变换块(TB)。
此外,处理单元基本上不局限于正方形块,并且可以以具有三个或更多个顶点的多边形形式来构建。
此外,在本说明书中,特定数据或信息的发送或接收可以被解释为将相应的数据或信息包括在包括编码的图像和与编码有关的数据的比特流内。
本发明可以被应用于的通用设备
图1图示作为本发明应用于的实施例的执行静止图像或者视频信号编码的编码器的示意性框图。
参考图1,编码器100可以包括视频分割单元110、减法器115、变换单元120、量化单元130、去量化单元140、逆变换单元150、滤波单元160、解码的图片缓冲器(DPB)单元170、预测单元180和熵编码单元190。此外,预测单元180可以包括间预测单元(inter-predictionunit)181和内预测单元(intra-prediction unit)182。
视频分割单元110将输入给编码器100的输入视频信号(或者图片或者帧)分割为一个或多个处理单元。
减法器115通过从输入视频信号减去由预测单元180(即,由间预测单元181或者内预测单元182)输出的预测信号(或者预测块)来生成残差信号(或者残差块)。生成的残差信号(或者残差块)被发送给变换单元120。
变换单元120通过将变换方案(例如,离散余弦变换(DCT)、离散正弦变换(DST)、基于图的变换(GBT)或者卡南-洛伊夫变换(KLT))应用于残差信号(或者残差块)来生成变换系数。在这种情况下,可以通过使用应用于残差块的预测模式和基于残差块的尺寸所确定的变换方案执行变换,变换单元120生成变换系数。
量化单元130量化变换系数,并且将其发送给熵编码单元190,并且熵编码单元190执行量化信号的熵编码操作,以及将其作为比特流输出。
同时,由量化单元130输出的量化的信号可以用于生成预测信号。例如,可以通过经由去量化单元140和逆变换单元150将去量化和逆变换应用于量化信号来重建残差信号。可以通过将重建的残差信号增加给由间预测单元181或者内预测单元182输出的预测信号来生成重建的信号。
同时,在这样的压缩过程期间,邻近块通过不同的量化参数来量化。因此,显示块边缘的伪影(artifact)可能出现。这样的现象被称为块伪影,其是用于评估图像质量的重要因素的一个。为了减少这样的伪影,可以执行滤波过程。经由这样的滤波过程,块伪影被除去,并且当前图片的误差同时被降低,从而改善图像质量。
滤波单元160将滤波应用于重建的信号,并且经由回放设备将其输出,或者将其发送给解码的图片缓冲器170。发送给解码的图片缓冲器170的滤波的信号可以在间预测单元181中用作参考图片。如上所述,可以以图片间预测模式,使用滤波的图片作为参考图片来改善编码速率以及图像质量。
解码的图片缓冲器170可以存储滤波的图片,以便在间预测单元181中将其用作参考图片。
间预测单元181参考重建的图片来执行时间预测和/或空间预测,以便除去时间冗余和/或空间冗余。
具体地,根据本发明的间预测单元181可以通过应用运动矢量定标自适应方法来导出运动参数。稍后对此进行详细的描述。
在这种情况下,块伪影或者环形伪影可能出现,因为用于执行预测的参考图片是变换的信号,当其被预先地编码/解码时,其在块单元中经历量化或者去量化。
因此,为了解决可归因于这样的信号或者量化的中断的性能退化,像素之间的信号可以通过将低通滤波器应用于间预测单元181而在子像素单元中被内插。在这种情况下,子像素指的是通过应用内插滤波器生成的虚拟像素,并且整数像素指的是存在于重建的图片之中的实际的像素。线性内插、双线性内插、维纳滤波器等等可以作为内插方法被应用。
内插滤波器可以应用于重建的图片,并且可以改善预测的精确度。例如,间预测单元181可以通过将内插滤波器应用于整数像素生成内插像素并且通过使用包括内插像素的内插块作为预测块来执行预测。
内预测单元182参考邻近现在要编码的块的采样来预测当前块。内预测单元182可以执行以下的过程以便执行内预测。首先,内预测单元182可以准备生成预测信号所必需的参考采样。此外,内预测单元182可以使用准备的参考采样来生成预测信号。其次,内预测单元182可以对预测模式进行编码。在这种情况下,可以经由参考采样填充和/或参考采样滤波来准备参考采样。量化误差可能存在,因为参考采样经历预测和重建过程。因此,为了降低这样的误差,可以对用于内预测的每个预测模式执行参考采样滤波过程。
经由间预测单元181或者内预测单元182生成的预测信号(或者预测块)可以用于生成重建的信号(或者重建的块),或者可以用于生成残差信号(或者残差块)。
图2图示作为本发明应用于的实施例的执行静止图像或者视频信号解码的解码器的示意性框图。
参考图2,解码器200可以包括熵解码单元210、去量化单元220、逆变换单元230、加法器235、滤波单元240、解码的图片缓冲器(DPB)250和预测单元260。此外,预测单元260可以包括间预测单元261和内预测单元262。
此外,经由解码器200输出的重建的视频信号可以经由回放设备来回放。
解码器200可以接收由在图1中示出的编码器100输出的信号(即,比特流)。熵解码单元210对接收的信号执行熵解码操作。
去量化单元220使用量化步长信息(quantization step size information),从熵解码的信号获得变换系数。
逆变换单元230通过应用逆变换方案对变换系数进行逆变换来获得残差信号(或者残差块)。
加法器235将获得的残差信号(或者残差块)与由预测单元260(即,间预测单元261或者内预测单元262)输出的预测信号(或者预测块)相加,从而生成重建的信号(或者重建的块)。
滤波单元240将滤波应用于重建的信号(或者重建的块),并且将滤波的信号输出给回放设备,或者将滤波的信号发送给解码的图片缓冲器250。发送给解码的图片缓冲器250的滤波的信号可以在间预测单元261中用作参考图片。
在本说明书中,在编码器100的滤波单元160、间预测单元181和内预测单元182中描述的实施例可以分别同等地应用于解码器的滤波单元240、间预测单元261和内预测单元262。
具体地,根据本发明的间预测单元261可以通过应用运动矢量定标自适应方法来导出运动参数。稍后对此进行详细的描述。
处理单元分割结构
通常,基于块的图像压缩方法被在静止图像或者视频的压缩技术(例如,HEVC)中使用。基于块的图像压缩方法是通过将其分割为特定块单元来处理图像的方法,并且可以降低存储器使用和计算的负载。
图3是描述可以应用于本发明的编译单元的分割结构的图。
编码器将单个图像(或者图片)分割为方格形式的编译树单元(CTU),并且按照光栅扫描顺序逐个地编码CTU。
在HEVC中,CTU的尺寸可以确定为64×64、32×32和16×16中的一个。编码器可以基于输入视频信号的分辨率或者输入视频信号的特征来选择和使用CTU的尺寸。CTU包括用于亮度分量的编译树块(CTB)和用于与其相对应的二个色度分量的CTB。
一个CTU可以以四叉树结构分割。也就是说,一个CTU可以被分割为每个具有正方形形式并且具有一半水平尺寸和一半垂直尺寸的四个单元,从而能够生成编译单元(CU)。四叉树结构的这样的分割可以递归地执行。也就是说,以四叉树结构从一个CTU分等级地分割CU。
CU指的是用于输入视频信号的处理过程(例如,执行内/间预测的编译)的基本单位。CU包括用于亮度分量的编译块(CB)和用于与亮度分量相对应的两个色度分量的CB。在HEVC中,CU尺寸可以被确定为64×64、32×32、16×16和8×8中的一个。
参考图3,四叉树的根节点与CTU有关。四叉树被分割,直到达到叶节点。叶节点对应于CU。
对此进行更详细地描述。CTU对应于根节点,并且具有最小的深度(即,深度=0)值。根据输入视频信号的特征,CTU可能不能被分割。在这种情况下,CTU对应于CU。
CTU可以以四叉树形式分割。因此,生成下节点,也就是说,深度1(深度=1)。此外,属于具有深度1的下节点并且不再分割的节点(即,叶节点)对应于CU。例如,在图3(b)中,对应于节点a、b和j的CU(a)、CU(b)和CU(j)已经从CTU分割一次,并且具有深度1。
具有深度1的节点中的至少一个可以以四叉树形式分割。因此,生成具有深度1的下节点(即,深度=2)。此外,属于具有深度2的下节点并且不再分割的节点(即,叶节点)对应于CU。例如,在图3(b)中,对应于节点c、h和i的CU(c)、CU(h)和CU(i)已经从CTU分割两次,并且具有深度2。
此外,具有深度2的节点中的至少一个可以以四叉树形式再次分割。因此,生成具有深度3(即,深度=3)的下节点。此外,属于具有深度3的下节点并且不再分割的节点(即,叶节点)对应于CU。例如,在图3(b)中,对应于节点d、e、f和g的CU(d)、CU(e)、CU(f)和CU(g)已经从CTU分割三次,并且具有深度3。
在编码器中,CU的最大尺寸或者最小尺寸可以基于视频图像的特征(例如,分辨率)或者通过考虑编码速率来确定。此外,有关最大或者最小尺寸的信息或者能够得到该信息的信息可以被包括在比特流中。具有最大尺寸的CU被称为最大编译单元(LCU),并且具有最小尺寸的CU被称为最小编译单元(SCU)。
此外,具有树结构的CU可以以预先确定的最大深度信息(或者最大等级信息)分等级地分割。此外,每个分割的CU可以具有深度信息。由于深度信息表示分割计数和/或CU的程度,其可以包括有关CU尺寸的信息。
由于LCU被以四叉树形状分割,所以SCU的尺寸可以通过使用LCU的尺寸和最大深度信息来获得。或者,相反地,LCU的尺寸可以通过使用SCU的尺寸和树的最大深度信息来获得。
对于单个CU,表示是否相应的CU被分割的信息(例如,分割的CU标志(split_cu_flag))可以转发给解码器。这个分割的信息被包括在除了SCU之外的所有CU中。例如,当表示是否分割的标志的值是“1”时,相应的CU被进一步分割为四个CU,并且当表示是否分割的标志的值是“0”时,相应的CU不再分割,并且可以执行用于相应的CU的处理过程。
如上所述,CU是执行内预测或者间预测的编译的基本单位。HEVC在预测单元(PU)中分割CU,以更加有效地编译输入视频信号。
PU是用于生成预测块的基本单位,并且即使在单个CU中,预测块也可以以PU为单位以不同的方式生成。但是,对于属于单个CU的PU不一起使用内预测和间预测,并且属于单个CU的PU通过相同的预测方法(即,内预测或者间预测)来编译。
PU不以四叉树结构分割,但是在单个CU中以预先确定的形状分割一次。这些将通过参考以下的附图来描述。
图4是描述可以应用于本发明的预测单元的图。
根据是否使用内预测模式或者间预测模式作为PU所属于的CU的编译模式,PU被不同地分割。
图4(a)图示使用内预测模式时的PU,并且图4(b)图示使用间预测模式时的PU。
参考图4(a),假设单个CU的尺寸是2N×2N(N=4、8、16和32),单个CU可以被分割为两种类型(即,2N×2N或者N×N)。
在这种情况下,如果单个CU被分割为2N×2N形状的PU,则这指的是仅一个PU存在于单个CU中。
同时,如果单个CU被分割为N×N形状的PU,则单个CU被分割为四个PU,并且对于每个PU单元生成不同的预测块。但是,只有在用于CU的亮度分量的CB的尺寸是最小尺寸(即,CU是SCU的情形)时,可以执行这样的PU分割。
参考图4(b),假设单个CU的尺寸是2N×2N(N=4、8、16和32),单个CU可以被分割为八个PU类型(即,2N×2N、N×N、2N×N、N×2N、nL×2N、nR×2N、2N×nU和2N×nD)。
像在内预测中一样,只有在用于CU的亮度分量的CB的尺寸是最小尺寸(即,CU是SCU的情形)时,可以执行N×N形状的PU分割。
间预测以在水平方向上分割的2N×N形状和以在垂直方向上分割的N×2N形状来支持PU分割。
此外,间预测以nL×2N、nR×2N、2N×nU和2N×nD形状来支持PU分割,其是不对称运动分割(AMP)。在这种情况下,“n”指的是2N的1/4值。但是,如果PU所属于的CU是最小尺寸的CU,则AMP可以不被使用。
为了在单个CTU中有效率地编码输入视频信号,可以经由如下的处理过程基于最小速率失真值来确定编译单元(CU)、预测单元(PU)和变换单元(TU)的最佳分割结构。例如,关于在64×64CTU中的最佳CU分割过程,可以经由从64×64尺寸的CU到8×8尺寸的CU的分割过程来计算速率失真成本。详细的过程如下。
1)生成最小速率失真值的PU和TU的最佳分割结构通过对64×64尺寸的CU执行间/内预测、变换/量化、去量化/逆变换和熵编码来确定。
2)PU和TU的最佳分割结构被确定以将64×64CU分割为32×32尺寸的四个CU,并且生成用于每个32×32CU的最小速率失真值。
3)PU和TU的最佳分割结构被确定以进一步将32×32CU分割为16×16尺寸的四个CU,并且生成用于每个16×16CU的最小速率失真值。
4)PU和TU的最佳分割结构被确定以进一步将16×16CU分割为8×8尺寸的四个CU,并且生成用于每个8×8CU的最小速率失真值。
5)通过将在过程3)中获得的16×16CU的速率失真值与在过程4)中获得的四个8×8CU的速率失真值的增加比较来确定在16×16块中的CU的最佳分割结构。也以相同的方式对于剩余的三个16×16CU来执行这个过程。
6)通过将在过程2)中获得的32×32CU的速率失真值与在过程5)中获得的四个16×16CU的速率失真值的增加比较来确定在32×32块中的CU的最佳分割结构。也以相同的方式对于剩余的三个32×32CU执行这个过程。
7)最后,在64×64块中CU的最佳分割结构通过将在过程1)中获得的64×64CU的速率失真值与在过程6)中获得的四个32×32CU的速率失真值的增加比较来确定。
在内预测模式中,预测模式被选择为PU单元,并且在实际的TU单元中对选择的预测模式执行预测和重建。
TU指的是执行实际的预测和重建的基本单位。TU包括用于亮度分量的变换块(TB)和用于与亮度分量相对应的两个色度分量的TB。
在图3的示例中,像在一个CTU被以四叉树结构分割以生成CU的示例中一样,从要编译的一个CU以四叉树结构分等级地分割TU。
因为TU被以四叉树结构分割,所以从CU分割的TU可以被分割为更小和更低的TU。在HEVC中,TU的尺寸可以被确定为32×32、16×16、8×8和4×4中的一个。
返回参考图3,四叉树的根节点被假设为与CU相关。四叉树被分割,直到达到叶节点,并且叶节点对应于TU。
对此进行更详细的描述。CU对应于根节点,并且具有最小的深度(即,深度=0)值。根据输入图像的特征,CU可能不能被分割。在这种情况下,CU对应于TU。
CU可以以四叉树形式分割。因此,生成具有深度1(深度=1)的下节点。此外,属于具有深度1的下节点并且不再分割的节点(即,叶节点)对应于TU。例如,在图3(b)中,对应于节点a、b和j的TU(a)、TU(b)和TU(j)已经从CU分割一次,并且具有深度1。
具有深度1的节点的至少一个可以再次以四叉树形式分割。因此,生成具有深度2(即,深度=2)的下节点。此外,属于具有深度2的下节点并且不再分割的节点(即,叶节点)对应于TU。例如,在图3(b)中,对应于节点c、h和i的TU(c)、TU(h)和TU(i)已经从CU分割两次并且具有深度2。
此外,具有深度2的节点的至少一个可以以四叉树形式再次分割。因此,生成具有深度3(即,深度=3)的下节点。此外,属于具有深度3的下节点并且不再分割的节点(即,叶节点)对应于CU。例如,在图3(b)中,对应于节点d、e、f和g的TU(d)、TU(e)、TU(f)和TU(g)已经从CU分割三次,并且具有深度3。
具有树结构的TU可以以预先确定的最大深度信息(或者最大等级信息)分等级地分割。此外,每个分割的TU可以具有深度信息。该深度信息可以包括有关TU的尺寸的信息,因为其指示分割数目和/或TU的程度。
指示是否相应的TU已经相对于一个TU被分割的信息(例如,分割的TU标记“split_transform_flag”)可以传送给解码器。分割信息被包括在除了最小尺寸的TU之外的所有TU中。例如,如果指示是否TU已经分割的标志的值是“1”,则相应的TU被分割为四个TU。如果指示是否TU已经分割的标志的值是“0”,则相应的TU不再分割。
预测
为了重建对其执行解码的当前处理单元,可以使用包括当前处理单元的当前图片或其它图片的已解码的部分。
仅使用当前图片用于重建(即,仅对其执行内预测)的图片(条带)可被称作内图片(intra-picture)或I图片(条带),为了预测每个单元使用最多一个运动矢量和参考索引的图片(条带)可以被称作预测图片或P图片(条带),并且使用最多两个运动矢量和参考索引的图片(条带)可以被称作双预测图片或者B图片(条带)。
内预测意指从同一解码的图片(或条带)的数据元素(例如,样本值)导出当前处理块的预测方法。也就是说,内预测意指参考当前图片内的重建区域来预测当前处理块的像素值的方法。
在下文中,对间预测进行更详细的描述。
间预测(inter-prediction)(或帧间预测(inter-frame prediction))
间预测意指基于除当前图片以外的图片的数据元素(例如,样本值或运动矢量)来导出当前处理块的预测方法。也就是说,间预测意指参考除当前图片以外的另一重建图片内的重建区域来预测当前处理块的像素值的方法。
间预测(或图片间预测)是用于去除存在于图片之间的冗余的技术,并且主要通过运动估计和运动补偿来执行。
图5是本发明可以被应用于的实施例并且是图示间预测的方向的图。
参考图5,间预测可以被划分成单向预测和双向预测,在所述单向预测中仅一个过去的图片或将来的图片被用作相对于单个块的时间轴上的参考图片,而在所述双向预测中过去的和将来的图片均同时被参考。
此外,单向预测可以被划分成正向预测和后向预测,在所述正向预测中使用在当前图片之前暂时显示(或者输出)的单个参考图片,而在后向预测中使用在当前图片之后暂时显示(或者输出)的单个参考图片。
在间预测过程(即,单向或双向预测)中,用于指定在预测当前块时使用哪一个参考区域(或参考块)的运动参数(或信息)包括间预测模式(在这种情况下,间预测模式可以指示参考方向(即,单向或双向)以及参考列表(即,L0、L1或双向))、参考索引(或参考图片索引或参考列表索引)和运动矢量信息。运动矢量信息可以包括运动矢量、运动矢量预测(MVP)或运动矢量差(MVD)。运动矢量差值意指运动矢量与运动矢量预测因子之间的差。
在单向预测中,使用单侧方向的运动参数。也就是说,可能需要一个运动参数来指定参考区域(或参考块)。
在双向预测中,使用两个方向的运动参数。在双向预测方法中,可以使用最多两个参考区域。两个参考区域可以存在于相同的参考图片中或者可以存在于不同的图片中。也就是说,在双向预测方法中,可以使用最多两个运动参数。两个运动矢量可以具有相同的参考图片索引或者可以具有不同的参考图片索引。在这种情况下,可以在当前图片之前暂时显示参考图片,或者可以在当前图片之后暂时显示(或者输出)参考图片。
编码器在间预测过程中执行在参考图片中搜索与当前处理块最相似的参考区域的运动估计。此外,编码器可以给解码器提供用于参考区域的运动参数。
编码器/解码器可以使用运动参数来获得当前处理块的参考区域。参考区域存在于具有参考索引的参考图片中。此外,由运动矢量指定的参考区域的像素值或内插值可以被用作当前处理块的预测因子。也就是说,使用运动信息来执行根据先前解码的图片预测当前处理块的图像的运动补偿。
为了减小与运动矢量信息有关的传送速率,可以使用利用先前解码的块的运动信息来获得运动矢量预测因子(mvp)并且仅发送相应的差(mvd)的方法。也就是说,解码器使用其它解码的块的运动信息来计算当前处理块的运动矢量预测因子并且使用与编码器的差异来获得当前处理块的运动矢量值。在获得运动矢量预测因子时,解码器可以使用其它已经解码的块的运动信息来获得各种运动矢量候选值,并且可以获得各种运动矢量候选值中的一个作为运动矢量预测因子。
-参考图片集和参考图片列表
为了管理多个参考图片,一组先前解码的图片被存储在解码的图片缓冲器(DPB)中以用于剩余图片的解码。
属于存储在DPB中的重建图片并且被用于间预测的重建图片被称作参考图片。换句话说,参考图片意指包括可以在解码序列的下一个图片的解码过程中被用于间预测的样本的图片。
参考图片集(RPS)意指与图片相关联的一组参考图片,并且包括解码序列中的所有先前关联的图片。参考图片集可以被用于解码序列中的关联图片或紧跟一图片之后的图片的间预测。也就是说,保持在解码的图片缓冲器(DPB)中的参考图片可以被称作参考图片集。编码器可以在每个条带头中给解码器提供序列参数集(SPS)(即,具有语法元素的语法结构)或参考图片集信息。
参考图片列表意指用于P图片(或条带)或B图片(或条带)的间预测的参考图片的列表。在这种情况下,参考图片列表可以被划分成两个参考图片列表,所述两个参考图片列表可以被称作参考图片列表0(或L0)和参考图片列表1(或L1)。此外,属于参考图片列表0的参考图片可以被称作参考图片0(或L0参考图片),而属于参考图片列表1的参考图片可以被称作参考图片1(或L1参考图片)。
在P图片(或条带)的解码过程中,可以使用一个参考图片列表(即,参考图片列表0)。在B图片(或条带)的解码过程中,可以使用两个参考图片列表(即,参考图片列表0和参考图片列表1)。可以通过参考图片集信息将用于区分每个参考图片的此类参考图片列表的信息提供给解码器。解码器基于参考图片集信息将参考图片添加到参考图片列表0或参考图片列表1。
为了识别参考图片列表内的任何一个特定参考图片,使用参考图片索引(或参考索引)。
-分数样本内插
用于间预测的当前处理块的预测块的样本是从通过参考图片索引识别的参考图片内的相应参考区域的样本值获得的。在这种情况下,参考图片内的相应参考区域指示通过运动矢量的水平分量和垂直分量所指示的位置的区域。除了运动矢量具有整数值的情况之外,分数样本内插被用于针对非整数样本坐标生成预测样本。例如,可以支持样本之间的距离的1/4定标的运动矢量。
在HEVC的情况下,亮度分量的分数样本内插在横向和纵向上应用8抽头滤波器。此外,色度分量的分数样本内插在横向和纵向上应用4抽头滤波器。
图6是本发明可以被应用于的实施例并且图示用于1/4样本内插的整数和分数样本位置。
参考图6,写入大写字母(A_i,j)的阴影块指示整数样本位置,而不具有写入小写字母(x_i,j)的阴影的块指示分数样本位置。
分数样本通过在水平方向和垂直方向上对整数样本值应用内插滤波器来生成。例如,在水平方向的情况下,可以基于要生成的分数样本将8抽头过滤器应用于在左侧的四个整数样本值和在右侧的四个整数样本值。
-间预测模式
在HEVC中,为了减少运动信息的量,可以使用合并模式和高级运动矢量预测(AMVP)。
1)合并模式
合并模式意指从空间或时间上的相邻块导出运动参数(或信息)的方法。
在合并模式下,一组可用候选包括空间邻近候选、时间候选和生成的候选。
图7是本发明可以被应用于的实施例并且图示空间候选的位置。
参考图7(a),确定根据{A1、B1、B0、A0、B2}的顺序每个空间候选块是否可用。在这种情况下,如果在内预测模式下未对候选块进行编码并且存在运动信息或者如果候选块位于当前图片(或条带)之外,则不能使用相应候选块。
在确定了空间候选的有效性之后,可以通过从当前处理块的候选块中排除不必要的候选块来配置空间合并候选。例如,如果当前预测块的候选块是同一编码块内的第一预测块,则可以排除除相应候选块以外的具有相同的运动信息的候选块。
当空间合并候选配置完成时,按照{T0、T1}的次序执行时间合并候选配置过程。
在时间候选配置中,如果参考图片的并置块的右下部块T0是可用的,则相应块被配置为时间合并候选。并置块意指存在于与选择的参考图片中的当前处理块相对应的位置中的块。相比之下,如果不是,则位于并置块的中心处的块T1被配置为时间合并候选。
可以在条带头中指定合并候选的最大数目。如果合并候选的数目大于最大数目,则维持具有比最大数目小的数目的空间候选和时间候选。如果不是,则通过组合迄今为止添加的候选来生成附加合并候选(即,组合双预测合并候选)的数目,直到候选的数目变成最大数目为止。
编码器使用上述方法来配置合并候选列表,并且将通过执行运动估计在合并候选列表中选择的候选块信息作为合并索引(例如,merge_idx[x0][y0]')发信号通知给解码器。图7(b)图示已经从合并候选列表中选择了B1块的情况。在这种情况下,可以将“索引1(Index1)”作为合并索引发信号通知给解码器。
解码器像编码器一样配置合并候选列表,并且从合并候选列表中的与来自编码器的合并索引相对应的候选块的运动信息导出关于当前预测块的运动信息。此外,解码器基于所导出的运动信息(即运动补偿)来生成用于当前处理块的预测块。
2)高级运动矢量预测(AMVP)模式
AMVP模式意指从相邻块导出运动矢量预测值的方法。因此,水平和垂直运动矢量差(MVD)、参考索引和间预测模式被发信号通知给解码器。水平和垂直运动矢量值使用所导出的运动矢量预测值和编码器提供的运动矢量差(MVDP)来计算。
也就是说,编码器配置运动矢量预测因子候选列表,并且将通过执行运动估计在运动矢量预测器候选列表中选择的运动参考标志(即,候选块信息)(例如,mvp_lX_flag[x0][y0]')发信号通知给解码器。解码器像编码器一样配置运动矢量预测器候选列表,并且使用运动矢量预测因子候选列表中的通过从编码器接收到的运动参考标志所指示的候选块的运动信息来导出当前处理块的运动矢量预测因子。此外,解码器使用所导出的运动矢量预测因子和由编码器发送的运动矢量差来获得当前处理块的运动矢量值。此外,解码器基于所导出的运动信息(即,运动补偿)生成用于当前处理块的预测块。
在AMVP模式的情况下,图7中的五个可用候选中的两个空间运动候选被选择。第一空间运动候选是从位于左侧的{A0、A1}集合中选择的,而第二空间运动候选是从位于顶部的{B0、B1、B2}集合中选择的。在这种情况下,如果相邻候选块的参考索引与当前预测块不相同,则运动矢量被定标。
如果作为搜索空间运动候选的结果而选择的候选的数目是2,则终止候选配置。如果选择的候选的数目小于2,则增加时间运动候选。
图8是本发明被应用于的实施例并且是图示间预测方法的图。
参考图8,解码器(具体地,图2中的解码器的间预测单元261)对用于处理块(例如,预测单元)的运动参数进行解码(S801)。
例如,如果已经对处理块应用了合并模式,则解码器可以对由编码器发信号通知的合并索引进行解码。此外,可以从通过合并索引所指示的候选块的运动参数导出当前处理块的运动参数。
此外,如果已经对处理块应用了AMVP模式,则解码器可以对由编码器发信号通知的水平和垂直运动矢量差(MVD)、参考索引以及间预测模式进行解码。此外,解码器可以从通过运动参考标志所指示的候选块的运动参数导出运动矢量预测因子,并且可以使用运动矢量预测因子和所接收到的运动矢量差来导出当前处理块的运动矢量值。
解码器使用经解码的运动参数(或信息)来对预测单元执行运动补偿(S802)。
也就是说,编码器/解码器使用经解码的运动参数来执行根据先前解码的图片预测当前单元的图像的运动补偿。
图9是本发明可以被应用于的实施例并且是图示运动补偿过程的图。
图9图示用于当前图片中的要编码的当前块的运动参数是单向预测、列表0内的第二图片、列表0以及运动矢量(-a,b)的情况。
在这种情况下,像在图9中一样,使用与列表0的第二图片中的当前块间隔开的位置(-a,b)的值(即,参考块的样本值)来预测当前块。
在双向预测的情况下,发送另一参考列表(例如,列表1)、参考索引和运动矢量差。解码器导出两个参考块并且基于这两个参考块预测当前块值。
运动信息定标改变方法
现有间预测(即,间预测)的运动矢量包括具有1/4-pel的定标的信息。运动矢量的值可以根据每个处理块而不同。如果运动矢量的值增加,则要从编码器发送到解码器的信息的量也增加。
本发明提出一种自适应地改变属于指示间预测块的附加信息并与运动矢量有关的信息的单位/定标以便改进间预测的性能的方法。此外,提出了一种从编码器向解码器发信号通知定标的改变的方法。
例如,在本发明中,运动矢量的定标可以根据情况被用作1/4像素(1/4-pel)或整数像素(int-pel)定标。因此,在不偏离不会使间预测块的准确度大大劣化的范围的情况下,可通过按照整数像素单位发送与运动矢量有关的信息来减少绝对值。结果,发信号通知给解码器的发送的附加信息的量减少。
实施例1
图10图示根据本发明的实施例的通过应用运动矢量定标自适应来执行间预测的方法。
参考图10,可以按照图片、条带或处理块单元确定是否应用MV定标自适应。在这种情况下,解码器可以基于编码器预先确定的规则来确定是否应用MV定标调整。可替选地,是否应用MV定标调整可以通过由编码器发信号通知的标志来指示。图10图示通过标志来指示是否应用MV定标调整的情况。
如果标志关闭(即,标志值是0)(即,如果应用广义运动估计(ME))(1001),则像在现有方法(例如,HEVC方法)中一样,可以使用运动矢量(MV)、运动矢量预测因子(MVP)和运动矢量差(MVd)。在这种情况下,MV、MVP和MVd中的全部均可以具有1/4-pel定标的值。
如果标志开启(即,标志值是1)(即,如果应用MV定标调整)(1002),则可以对MV和MVP应用round函数以便使MVd成为int-pel定标的值。如果对MV和MVP应用round函数,则可以获得1/4-pel定标的MV和MVP,每一个均具有int-pel定标的值。
同样地,MVd是通过将MV减去MVP所获得的差,并且因此可获得具有int-pel定标的值的1/4-pel定标的MVd。
也就是说,根据从将MV减去MVP获得的差所获得的值可以总是具有int-pel定标的值。在这种情况下,MVd被表达为1/4-pel定标,并且因此可以总是将MVd指示为4的倍数。
此外,编码器可以将经定标的MVd(即,MVd/4)传送到解码器(1003)。也就是说,编码器可以将MVd转换成int-pel定标(即,MVd/4)并且将其发送到解码器。如上所述,如果MVd/4被发送,则可减少用于发送MVd的信息的量。
图11图示根据本发明的实施例的使用运动矢量定标自适应来执行间预测的方法。
如上所述,解码器可以根据编码器预先确定的规则或者响应于由编码器发信号通知的标志来确定是否应用MV定标自适应。在这种情况下,图11图示标志由编码器发送的情况。
参考图11,解码器解析由编码器发送的标志(S1101)。
解码器导出MVP(S1102)。在这种情况下,解码器可以使用如上所述的先前解码的块的运动信息来获得MVP。
如果作为在S1101处解析标志的结果,标志开启,则解码器确定接收到的MVd是int-pel定标(即,定标的MVd)并执行MV定标自适应(S1103)。
也就是说,在步骤S1102处,解码器对所导出的MVP进行四舍五入(round(MVP))。此外,解码器将从编码器接收到的经定标的MVd乘以4。也就是说,解码器按照1/4-pel定标转换所接收到的定标的MVd。此外,解码器通过将经四舍五入的MVP和MVd相加来获得MV。在这种情况下,通过将从编码器接收到的经定标的MVd乘以4所获得的值是[round(MV)–round(MVP)]。如果该值与round(MVP)相加,则导出具有int-pel定标的值的1/4-pel定标的MV(即,round(MV))。
同时,如果作为在步骤S1101处解析标志的结果,标志关闭,则解码器确定所接收到的MVd是1/4-pel定标(即,尚未应用运动矢量定标自适应的MVd),并且像现有方法(例如,HEVC方法)一样执行广义MV生成过程(S1104)。
也就是说,解码器通过将在步骤S1102处导出的MVP和从编码器接收到的MVd相加来导出MV。在这种情况下,MV可以具有1/4-pel定标的值。
如上所述,如果应用MV定标自适应,则因为在MV中生成了错误所以失真可能增加,但是可减少用于发信号通知MVd的比特。因此,MV定标自适应可以被应用于从速率-失真成本(RD成本)获得增益的情况。
实施例2
在实施例1中所提出的方法中,通过对MV和MVP应用四舍五入(round)函数从相应差所获得的值可以总是具有int-pel定标的值。因此,如果该值用1/4-pel定标来表达,则它总是用4的倍数来表达。因此,通过以MVd/4形式将该值发送到解码器来减少附加信息的量。
然而,通常,round函数有误差。例如,如果四舍五入(round)被用作round函数,则round函数具有最大1/2的误差。例如,在实施例1中所提出的方法的情况下,MVd被计算为通过两个round函数所获得的操作的结果,并且因此最大误差加倍(每个函数各1/2)并且因此每个round函数具有一个int-pel的误差。因此,在根据本发明的实施例2中所提出的方法中,可减少误差,并且当MV定标自适应被应用时也可以按比例缩小MVd。
图12图示根据本发明的实施例的使用运动矢量定标自适应来执行间预测的方法。
如上所述,解码器可以根据编码器预先确定的规则或者响应于由编码器发信号通知的标志来确定是否应用MV定标自适应。在这种情况下,图12图示标志由编码器发送的情况。
如果标志关闭(即,标志值是0)(即,如果应用广义运动估计(ME))(1201),则可以像现有方法(例如,HEVC方法)一样使用运动矢量(MV)、运动矢量预测因子(MVP)和运动矢量差(MVd)。也就是说,MV、MVP和MVd中的全部均可以具有1/4-pel定标的值。
如果标志开启(即,标志值是1)(即,如果应用MV定标自适应)(1202),则与在实施例1中不同,不对MV和MVP直接应用round函数。因此,像在广义ME中一样,MVd是从MV与MVP之间的差获得的。
在这种情况下,依照实施例2中所提出的方法,可以将round函数应用于从MV与MVP之间的差所获得的MVd。结果,可以获得具有int-pel定标的值的1/4-pel定标的MVd。如上所述,MVd用1/4-pel定标来表达,并且可以总是将MVd指示为4的倍数。
因此,结果,编码器可以将定标的MVd(即,MVd/4)传送到解码器(1203)。也就是说,编码器可以按照int-pel定标(即,MVd/4)转换MVd并且将其传送到解码器。如上所述,如果MVd/4被发送,则可减少用于发送MVd的信息的量。
然而,在这种情况下,编码器使用通过将MVP和round(MV-MVP)相加所获得的值作为实际的MV以便使用与解码器的MV相同的MV。稍后对此进行更详细的描述。
在这种情况下,与在实施例1中所提出的方法中不同,round函数仅被应用于一个最终MVd。因此,最大误差变成1/2并且因此可被减少到实施例1中所提出的方法的一半。
图13图示根据本发明的实施例的使用运动矢量定标自适应来执行间预测的方法。
如上所述,解码器可以根据编码器预先确定的规则或者响应于由编码器发信号通知的标志来确定是否应用MV定标自适应。然而,图13图示标志由编码器发送的情况。
参考图13,解码器解析由编码器发送的标志(S1301)。
解码器导出MVP(S1302)。在这种情况下,如上所述,解码器可以使用先前解码的块的运动信息来获得MVP。
如果作为在S1301处解析标志的结果,标志开启,则解码器确定所接收到的MVd是int-pel定标(即,定标的MVd)并执行MV定标自适应(S1303)。
也就是说,解码器将从编码器接收到的定标的MVd乘以4。也就是说,解码器按照1/4-pel定标转换所接收到的定标的MVd。此外,解码器通过将在步骤S1302处接收到的MVP和MVd相加来获得MV。在这种情况下,通过将从编码器接收到的经定标的MVd乘以4所获得的值是[round(MV-MVP)]。如果该值与MVP相加,则导出1/4-pel定标的MV(即,round(MV-MVP)+MVP)。
同时,如果作为在步骤S1301处解析标志的结果,标志关闭,则解码器确定所接收到的MVd是1/4-pel定标(即,尚未应用运动矢量定标自适应的MVd),并且像在现有方法(例如,HEVC方法)中一样执行广义MV生成过程(S1304)。
也就是说,MV是通过将在步骤S1302处导出的MVP和从编码器接收到的MVd相加而导出的。在这种情况下,MV可以具有1/4-pel定标的值。
同时,在实施例1和2中,为了描述的方便,已经假定并描述了round函数,但是本发明不限于此。也就是说,可以使用ceiling运算或floor运算代替round运算。可替选地,可以选择性地组合并使用前述运算(即,round、ceiling和floor运算)。
此外,如果通过在实施例1和2中使用的MV定标自适应所获得的MVd是0,则可以不应用MV定标自适应。在这种情况下,可以在没有任何改变的情况下使用常规的运动信息。此原因是如果获得了0的MVd,则不能获得发送向下定标的MVd时的信息量减少效果。
因此,为了检查通过MV定标自适应所获得的MVd是否是0,解码器可以在运动信息之后特别是在MVd解析结束之后对于MV定标自适应执行标志解析。
此外,实施例1和2中所提出的方法通过减少MVd的信息的量来提高编译效率,并且可能不适用于像在合并模式下一样导出运动信息的情况。
在下文中,本发明提出附加地发信号通知运动矢量差(MVD)的方法。在这种情况下,MVD值(具体地,MVD绝对值-2)可以对应于前述定标的MVD和通过现有方法生成的MVD。
[表1]
参考表1,在现有间预测(即,间预测(inter-prediction))中,运动矢量差使用四个abs_mvd_greater0_flag、abs_mvd_greater1_flag、abs_mvd_minus2和mvd_sign_flag语法(或语义)来发信号通知。
在表2中列举了每种语法(或语义)的含义。
表2图示与运动矢量差(MVD)有关的语法(或语义)。
[表2]
语法 含义
abs_mvd_greater0_flag 指示MVd的绝对值是否大于0
abs_mvd_greater1_flag 指示MVd的绝对值是否大于1
abs_mvd_minus2 MVd的绝对值–2
mvd_sign_flag MVd的符号
参考表1和表2,关于具有最小值的MVD,可通过标志使用最少信息来编码。关于具有大值的MVD,绝对值和符号被编码。
在下文中,本发明提出一种方法,该方法将MVD的绝对值(abs_mvd_minus2)分组到特定区间中而不对该绝对值进行编码/解码,指示该绝对值指示哪一个值相对于向下定标的MVD值在区间中,并且对该绝对值进行编码/解码。因此,用于对MVD进行编码/解码的信息的量以及因此附加信息的量减少了。
在下文中,在本发明的描述中,为了描述的方便,“MVD的绝对值”(即,abs_mvd_minus2的值)被指示为“MVD-2”。
实施例3
图14图示根据本发明的实施例的对运动矢量差进行编码/解码的方法。
图14图示MVD-2的值每两个值被分组的情况。
参考图14,编码器可以使用与现有方法相同的方法来对具有值0、1的MVD进行编码。
此外,编码器可以针对每个区间每两个值对MVD-2的剩余值进行分组,可以通过将每个起始值按比例缩小到1/2(即,通过将起始值除以2)来使相应区间的起始值0、2、4、6、8、...变成较小的数0、1、2、3、4、...,并且可以执行编码。此外,可以使用附加标志,使得可选择属于每个区间的两个值中的任何一个。也就是说,可以将MVD-2值作为用于指示按比例缩小到1/2的MVD-2所属于的区间的起始值和MVD-2值在相应的区间内的位置的信息(例如,附加标志)传送到解码器。
因此,依照本实施例,附加标志用于发送MVD-2值。然而,附加标志的使用经由通过将相应MVD所属于的区间的起始值按比例缩小到1/2所获得的比特的增益被抵消。因此,可使用比用于现有MVD-2的传输的比特更少的比特来对MVD-2进行二进制编码。
解码器可以使用与现有方法相同的方法而从自编码器接收到的比特串中对具有值0、1的MVD进行解码。此外,解码器可以相对于MVD-2的剩余值从自编码器接收到的比特串中对MVD-2按比例缩小到1/2的区间的起始值和用于指示MVD-2值在相应区间内的位置的信息(例如,标志)进行解码。此外,解码器可以通过将经解码的起始值向上定标两倍来识别MVD-2所属于的区间,并且可以基于用于指示经解码的MVD-2值在相应区间内的位置的信息来识别MVD-2值。
实施例4
图15图示根据本发明的实施例的对运动矢量差进行编码的方法。
图15图示MVD-2值每三个值被分组的情况。
参考图15,编码器可以使用与现有方法相同的方法来对具有值0、1的MVD进行编码。
此外,编码器可以对于每个区间每三个值对MVD-2的剩余值进行分组,可以通过将起始值按比例缩小到1/3(即,通过将每个起始值除以3)来使各个区间的起始值0、3、6、9、...变成较小的数0、1、2、3、...。此外,可以使用附加索引,使得可选择属于每个区间的三个值中的任何一个。也就是说,可以将MVD-2值作为用于指示按比例缩小到1/3的MVD-2所属于的区间的起始值和该MVD-2值在相应区间内的位置的信息(例如,附加索引)传送到解码器。
在这种情况下,为了对附加索引进行编码,可以使用截断一元(TU)码。TU码被图示在表3和表4中。
[表3]
条目 TU码
a 0
a+1 10
a+2 11
[表4]
条目 TU码
a 1
a+1 01
a+2 00
表3和表4图示其码大小从“a”逐渐地增加到a+1和a+2的TU码,但是本发明不限于此。TU码的序列可以随机地改变。也就是说,可以将最小比特指派给“a+2”,并且码的大小可以朝着“a+1”和“a”增加。此外,可以使用最小比特被指派给“a+1”的形式的TU码。
在本实施例中,像在实施例3中一样,用于对附加索引进行编码的信息的量经由通过将用于MVD-2的每个区间的起始值按比例缩小到1/3并发送该值所获得的比特的增益被抵消。因此,可使用比用于现有MVD-2传输的比特更少的比特来对MVD-2进行二进制编码。
解码器可以使用与现有方法相同的方法来从自编码器接收到的比特串中对具有值0、1的MVD进行解码。此外,解码器可以相对于MVD-2的剩余值从自编码器接收到的比特串中对按比例缩小到1/3的MVD-2所属于的区间的起始值和用于指示该MVD-2值在相应区间内的位置的信息(例如,索引)进行解码。此外,解码器可以通过将经解码的起始值向上定标三倍来识别MVD-2所属于的区间,并且可以基于用于指示经解码的MVD-2值在相应区间内的位置的信息来识别MVD-2值。
实施例5
图16图示根据本发明的实施例的对运动矢量差进行编码的方法。
图16图示MVD-2值每四个值被分组的情况。
参考图16,编码器可以使用与现有方法相同的方法来对具有值0、1的MVD进行编码。
此外,编码器可以针对每个区间每四个值对MVD-2的剩余值进行分组,可以通过将起始值按比例缩小到1/4(即,通过将每个起始值除以4)来使每个区间的起始值0、4、8、...变成较小的数0、1、2、...,并且可以对起始值进行编码。此外,可以使用附加索引,使得可以选择属于每个区间的四个值中的任何一个。也就是说,可以将MVD-2值作为按比例缩小到1/4的MVD-2所属于的区间的起始值和用于指示该MVD-2在相应区间内的位置的信息(例如,附加索引)传送到解码器。
在这种情况下,为了对附加索引进行编码,可以使用固定2位码,或者可以使用不同形式的二进制编码,诸如TU码或哥伦布码。
解码器可以使用与现有方法相同的方法来从自编码器接收到的比特串中对具有值0、1的MVD进行解码。此外,解码器可以相对于MVD-2的剩余值从自编码器接收到的比特串中对向下定标1/4的MVD-2所属于的区间的起始值和用于指示该MVD-2在相应区间内的位置的信息(例如,索引)进行解码。此外,解码器可以通过将经解码的起始值向上定标四倍来识别MVD-2所属于的区间,并且可以基于用于指示经解码的MVD-2值在相应区间内的位置的信息来识别MVD-2值。
如果概括实施例3至5中所提出的方法,则它们可以使用针对每个区间每N个值对MVD-2进行分组的方法来概括。在这种情况下,每个区间的起始值可以通过将起始值按比例缩小到1/N变成较小的数并被编码。用于选择属于每个区间的N个值中的一个的附加信息(即,用于指示MVD-2在相应区间内的位置的信息,例如,标志或索引)是必需的。此外,为了对附加信息进行编码,可以使用特定二进制编码方法。
在这种情况下,解码器可以使用与现有方法相同的方法来从自编码器接收到的比特串中对具有值0、1的MVD进行解码。此外,解码器可以相对于MVD-2的剩余值从自编码器接收到的比特串中对按比例缩小到1/N的MVD-2所属于的区间的起始值和用于指示该MVD-2在相应区间内的位置的信息(例如,索引)进行解码。此外,解码器可以通过将经解码的起始值向上定标N倍来识别MVD-2所属于的区间,并且可以基于用于指示经解码的MVD-2值在相应区间内的位置的信息来识别MVD-2值。
同时,在实施例3至5中,已经图示了MVD-2值所属于的区间的起始值的情况,但是本发明不限于此。可以使用MVD-2值所属于的区间内的特定值(例如,每个区间的最后值)。
在这种情况下,N的大小可以被先前固定或者可以先前已经被编码器和解码器两者所知道。
此外,可以可变地确定对MVD-2的值进行分组的区间的大小N。在这种情况下,编码器可以向解码器发信号通知关于对MVD-2的值进行分组的区间的大小N的信息。
例如,可以通过序列参数集(SPS)、图片参数集(PPS)、视频参数集(VPS)、条带头等等来发送该信息,或者可以在CTB、CU或PU单元中发送该信息。例如,如果在SPS中发信号通知关于N的大小的信息,则在相应序列中针对每个区间每N个值对MVD-2进行分组,并且可以使用前述实施例中所描述的方法来对MVD-2进行二进制编码/解码。
相比之下,又例如,如果在条带头中发信号通知关于N的大小的信息,则编码器可以为每个条带设定不同值的最佳区间。在这种情况下,根据为每个条带所设定的N的大小来针对每个区间每N个值对MVD-2进行分组,并且可以使用前述实施例中所描述的方法来对MVD-2进行二进制编码/解码。
此外,可以将是否使用实施方式3至5中所描述的前述方法(即,针对每个区间对MVD-2的值进行分组并且对MVD-2所属于的组的起始值和识别MVD-2值的信息进行二值编码/解码的方法)发信号通知给解码器。例如,可以通过SPS、PPS、VPS或条带头来发信号通知该方法,或者可以在CTB、CU或PU单元中发信号通知该方法。
例如,可以在SPS中发信号通知是否相对于序列使用该方法,并且可以发信号通知是否在条带头的条带单元中使用该方法。如果确定要在条带单元中使用该方法,则可以相对于区间的大小N使用预先确定的固定值或者可以如上所述附加地发信号通知并使用区间的大小N。
同时,已经使用主指数哥伦布码来对现有MVD-2进行了二进制编码。如果N的大小是2的平方数并且索引被二进制编码为固定大小的比特以便选择N,也就是说,满足N=2^x,则获得与已经使用第(x+1)个指数哥伦布码的效果相同的效果。
表5图示在根据现有方法使用主指数哥伦布码来对MVD-2进行二进制编码的情况下的必要比特的数目。
[表5]
mvd abs_mvd_minus2 EG1_code_bit
0 - 0
1 - 0
2 0 2
3 1 2
4 2 3
5 3 3
6 4 3
7 5 3
8 6 4
9 7 4
10 8 4
11 9 4
12 10 4
13 11 4
14 12 4
15 13 4
16 14 5
17 15 5
18 16 5
19 17 5
20 18 5
21 19 5
22 20 5
23 21 5
24 22 5
25 23 5
26 24 5
27 25 5
28 26 5
29 27 5
参考表5,“abs_mvd_minus2”指示MVD-2的值,并且“EG1_code_bit”指示当MVD-2被转换成主指数哥伦布码时的比特的数目。
表6图示根据本发明的实施例的当对按比例缩小到1/2的MVD-2所属于的区间的起始值和在相应区间内用于指定MVD-2的索引进行编码时所需要的比特的数目。
[表6]
mvd abs_mvd_minus2 scale_down_mvd EG1_code_bit index_bit 总比特
0 - - 0 0
1 - - 0 0
2 0 0 2 1 3
3 1 0 2 1 3
4 2 1 2 1 3
5 3 1 2 1 3
6 4 2 3 1 4
7 5 2 3 1 4
8 6 3 3 1 4
9 7 3 3 1 4
10 8 4 3 1 4
11 9 4 3 1 4
12 10 5 3 1 4
13 11 5 3 1 4
14 12 6 4 1 5
15 13 6 4 1 5
16 14 7 4 1 5
17 15 7 4 1 5
18 16 8 4 1 5
19 17 8 4 1 5
20 18 9 4 1 5
21 19 9 4 1 5
22 20 10 4 1 5
23 21 10 4 1 5
24 22 11 4 1 5
25 23 11 4 1 5
26 24 12 4 1 5
27 25 12 4 1 5
28 26 13 4 1 5
29 27 13 4 1 5
表7图示根据本发明的实施例的当对按比例缩小到1/4的MVD-2所属于的区间的起始值和在相应区间内用于指定MVD-2的索引进行编码时所需要的比特的数目。
[表7]
参考表6和7,“abs_mvd_minus2”指示MVD-2的值,并且“scale_down_mvd”指示从MVD-2所属于的区间的起始值向下定标的值。EG1_code_bit指示当区间的经向下定标的起始值像在表5中一样被转换成主指数哥伦布码时的比特的数目。“index_bit”指示区分每N分组的每个区间内的元素所必需的比特的数目。“总比特”指示“EG1_code_bit”+“index_bit“。
如果将表5中的比特的数目“EG1_code_bit”与表6和表7中的总比特相比较,则在N=2^x的情况下获得与已经使用第(x+1)个指数哥伦布码的效果相同的效果。也就是说,在表6的情况下,因为N=2,所以可获得与已经使用辅指数哥伦布码的效果相同的效果。在表7的情况下,因为N=4,所以可获得与已经使用三元指数哥伦布码的效果相同的效果。
因此,在前述方法中,N的大小可以局限于仅2的平方数。在这种情况下,假定针对每个特定单元自适应地应用本发明中所提出的方法,不发信号通知N的大小,但是可以发信号通知用于对MVD-2进行二进制编码的指数哥伦布编码的程度。因此,可执行最好的二进制编译。
如果使用该方法,则如实施例3至5中所描述的,可以通过按比例缩小起始值来对MVD-2进行二进制编码/解码,而不附加地对区间的索引进行编码/解码,但是MVD-2本身的值可以被直接二进制编码/解码成第(x+1)个指数哥伦布码并使用。
图17是图示根据本发明的实施例的内预测单元的图。
在图17中,为了描述的方便,内预测单元182(参考图1)、262(参考图2)已经被图示为单个块,但是可以将内预测单元182实现成具有包括在编码器和/或解码器中的配置。
参考图17,内预测单元182、262实现图5至图16中所提出的功能、过程和/或方法。具体地,内预测单元182、262可以包括MV定标自适应应用确定单元1701、运动参数解码单元1702和预测块生成单元1703。
MV定标自适应应用确定单元1701确定是否对当前块应用MV定标自适应。
在这种情况下,解码器可以根据编码器预先确定的规则来确定是否应用MV定标自适应。可替选地,是否应用MV定标自适应可以通过由编码器发信号通知的标志来指示。
运动参数解码单元1702对用于当前块的运动参数进行解码。在这种情况下,运动参数解码单元1702可以使用图5至图16中所提出的功能、过程和/或方法来对用于当前块的运动参数进行解码。
在这种情况下,如果未对当前块应用MV定标自适应,则解码器可以确定已经发信号通知了未向下定标的MVD。
解码器可以像在现有方法中一样从相邻块的运动信息导出MVP,并且可以对由编码器发信号通知的MVD进行解码。此外,解码器可以通过将MVP和MVD加在一起来导出当前块的MV。在这种情况下,MV、MVP和MVd的全部均可以具有1/n-pel定标(例如,n=4)的值。
相比之下,如果未对当前块应用MV定标自适应,则解码器可以确定已经发信号通知了经向下定标的MVD。
因此,解码器对由编码器发信号通知的经向下定标的MVD进行向上定标。此外,像在现有方法中一样,解码器可以从相邻块的运动信息中导出MVP。此外,像在实施例1中一样,解码器可以通过将已经应用round运算的MVP和经向上定标的MVD加在一起来导出MV。在这种情况下,可以导出MV(即,round(MV)),即,具有int-pel定标的值的1/n-pel定标(例如,n=4)。可替选地,像在实施方式2中一样,可以通过将MVP和经向上定标的MVD加在一起来导出MV。在这种情况下,MV可以具有1/n-pel定标(例如,n=4)的值。
预测块生成单元1703使用解码的运动参数来生成用于当前块的预测块。
也就是说,预测块生成单元1703从参考图片内的通过运动矢量所识别的参考区域的样本值生成当前块的预测样本值。
图18是图示根据本发明的实施例的基于间预测的图像处理方法的图。
参考图18,解码器确定是否对当前块应用MV定标自适应(S1801)。
在这种情况下,解码器可以根据编码器预先确定的规则来确定是否应用MV定标自适应。可替选地,是否应用MV定标自适应可以通过由编码器发信号通知的标志来指示。
解码器对用于当前块的运动参数进行解码(S1802)。
在这种情况下,如果在步骤S1801处尚未对当前块应用MV定标自适应,则解码器可以确定已经发信号通知了未向下定标的MVD。
解码器可以像在现有方法中一样从相邻块的运动信息导出MVP,并且可以对由编码器发信号通知的MVD进行解码。此外,解码器可以通过将MVP和MVD加在一起来导出当前块的MV。在这种情况下,MV、MVP和MVd中的全部均可以具有1/n-pel定标(例如,n=4)的值。
相比之下,如果在步骤S1801处尚未对当前块应用MV定标自适应,则解码器可以确定已经发信号通知送了向下定标的MVD。
因此,解码器对由编码器发信号通知的经向下定标的MVD进行向上定标。此外,解码器可以像在现有方法中一样从相邻块的运动信息中导出MVP。此外,像在实施例1中一样,解码器可以通过将已经应用round运算的MVP和经向上定标的MVD加在一起来导出MV。在这种情况下,可以导出MV(即,round(MV)),即,具有int-pel定标的值的1/n-pel定标(例如,n=4)。可替选地,像在实施方式2中一样,可以通过将MVP和经向上定标的MVD加在一起来导出MV。在这种情况下,MV可以具有1/n-pel定标(例如,n=4)的值。
解码器使用经解码的运动参数来生成用于当前块的预测块(S1803)。
解码器使用经解码的运动参数来执行根据先前解码的图片预测当前单元的图像的运动补偿。也就是说,解码器从参考图片内的通过运动矢量所识别的参考区域的样本值生成当前块的预测样本值。
同时,可以根据实施例3至5的前述方法来对由编码器发信号通知的MVD或经向下定标的MVD的值进行编码/解码。
在这种情况下,如果MVD值是0、1,则可以使用与现有方法相同的方法来对其进行解码。
相比之下,如果MVD具有2或以上的值,则其可以作为MVD-2被发信号通知。在这种情况下,可以将MVD-2作为向下定标至1/N的MVD-2所属于的区间的起始值来发信号通知,并且可以根据实施例3至5的前述方法来发信号通知用于指示该MVD-2值在相应区间内的位置的信息(例如,索引)。
在前述实施例中,已经以特定形式组合了本发明的元素和特性。除非另外明确地描述,否则每个元素或特性可以被认为是可选的。每个元素或特性可以以不与其它元素或特性组合的形式来实现。此外,可以组合一些元素和/或特性以形成本发明的实施例。可以改变本发明的实施例中所描述的操作的次序。一个实施例的一些元素或特性可以被包括在另一实施例中或者可以用另一实施例的对应元素或特性替换。显然,实施例可以通过组合在权利要求中不具有明显引用关系的权利要求来配置,或者可以在提交申请之后通过修改作为新的权利要求被包括。
根据本发明的实施例可以通过各种手段(例如,硬件、固件、软件或它们的组合)来实现。在通过硬件实现的情况下,可以使用一个或多个专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理器件(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器等来实现本发明的实施例。
在通过固件或软件实现的情况下,可以以用于执行前述功能或操作的模块、过程或函数的形式实现本发明的实施例。软件代码可以被存储在存储器中并由处理器驱动。存储器可以位于处理器内部或外部,并且可通过各种已知手段与处理器交换数据。
对于本领域的技术人员而言显然的是,在不脱离本发明的必要特性的情况下,可以以其它特定形式实现本发明。因此,详细描述不应该被解释为从所有方面进行限制,而是应该被解释为说明性的。本发明的范围应该通过对所附权利要求的合理分析来确定,并且在本发明的等同范围内的所有变化均被包括在本发明的范围内。
【工业适用性】
已经出于说明性目的公开了本发明的前述优选的实施例,并且在不脱离所附权利要求中公开的本发明的技术精神和范围的情况下,本领域的技术人员可以改进、改变、替换或者添加各种其它实施例。

Claims (11)

1.一种基于间预测处理图像的方法,包括以下步骤:
确定用于块的运动矢量定标自适应是否被应用;
如果用于所述块的所述运动矢量定标自适应被应用,则对向下定标的MVD(运动矢量差)进行向上定标;
使用所述向上定标的MVD和MVP(运动矢量预测因子)来导出用于所述块的MV(运动矢量);以及
使用所述导出的MV来生成所述块的预测块。
2.根据权利要求1所述的方法,其中,所述向下定标的MVD是通过对从所述MV减去所述MVP所获得的值应用四舍五入(round)、向下舍入(floor)和向上舍入(ceiling)运算中的至少一种来生成的。
3.根据权利要求1所述的方法,其中,如果指示运动矢量定标自适应是否被应用的标志值是1,则确定要应用用于所述块的所述运动矢量定标自适应。
4.根据权利要求1所述的方法,其中,只有当所述向下定标的MVD不是0时,指示所述运动矢量定标自适应是否被应用的标志才被解析。
5.根据权利要求1所述的方法,其中,所述向下定标的MVD值被以区间为单位分组并被二进制编码。
6.根据权利要求5所述的方法,其中,所述向下定标的MVD值被编码为所述向下定标的MVD值所属于的区间的起始值和用于指示所述区间内的所述向下定标的MVD值的指示信息。
7.根据权利要求6所述的方法,其中,所述起始值被按所述区间的大小的比率向下定标并被发送。
8.根据权利要求7所述的方法,其中,所述区间的大小被预先确定或者从编码器发送。
9.根据权利要求5所述的方法,其中,只有当所述向下定标的MVD值是2或2以上时,所述向下定标的MVD值才被以区间为单位分组并编码。
10.根据权利要求5所述的方法,其中,所述区间的大小被设定为2的平方数。
11.一种基于间预测处理图像的装置,包括:
运动矢量定标自适应应用确定单元,所述运动矢量定标自适应应用确定单元确定用于块的运动矢量定标自适应是否被应用;
运动参数解码单元,如果用于所述块的所述运动矢量定标自适应被应用,则所述运动参数解码单元对向下定标的MVD(运动矢量差)进行向上定标,并且使用所述向上定标的MVD和MVP(运动矢量预测因子)来导出用于所述块的MV(运动矢量);以及
预测块生成单元,所述预测块生成单元使用所述导出的MV来生成所述块的预测块。
CN201680048849.3A 2015-08-24 2016-02-29 基于间预测模式的图像处理方法及其装置 Withdrawn CN107925774A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562208830P 2015-08-24 2015-08-24
US62/208,830 2015-08-24
US201562213627P 2015-09-03 2015-09-03
US62/213,627 2015-09-03
PCT/KR2016/002037 WO2017034113A1 (ko) 2015-08-24 2016-02-29 인터 예측 모드 기반 영상 처리 방법 및 이를 위한 장치

Publications (1)

Publication Number Publication Date
CN107925774A true CN107925774A (zh) 2018-04-17

Family

ID=58100521

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680048849.3A Withdrawn CN107925774A (zh) 2015-08-24 2016-02-29 基于间预测模式的图像处理方法及其装置

Country Status (5)

Country Link
US (4) US10798400B2 (zh)
EP (1) EP3343922A4 (zh)
KR (2) KR20240000649A (zh)
CN (1) CN107925774A (zh)
WO (1) WO2017034113A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021052369A1 (zh) * 2019-09-20 2021-03-25 杭州海康威视数字技术股份有限公司 一种解码、编码方法、装置及其设备

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017052009A1 (ko) * 2015-09-24 2017-03-30 엘지전자 주식회사 영상 코딩 시스템에서 amvr 기반한 영상 코딩 방법 및 장치
US11363253B2 (en) * 2016-05-13 2022-06-14 Vid Scale, Inc. Systems and methods for generalized multi-hypothesis prediction for video coding
CN111801946A (zh) 2018-01-24 2020-10-20 Vid拓展公司 用于具有降低的译码复杂性的视频译码的广义双预测
CN112055967B (zh) * 2018-04-02 2024-03-26 Lg电子株式会社 基于运动矢量的图像编码方法及其设备
US11483567B2 (en) 2018-09-22 2022-10-25 Lg Electronics Inc. Method and apparatus for processing video signals on basis of inter prediction
CN117676134A (zh) 2019-04-25 2024-03-08 北京字节跳动网络技术有限公司 对运动矢量差的约束
EP3973705A4 (en) * 2019-06-25 2022-09-28 Beijing Bytedance Network Technology Co., Ltd. MOTION VECTOR DIFFERENCE RESTRICTIONS
US20230156219A1 (en) * 2021-11-18 2023-05-18 Tencent America LLC MVD Scaling for Joint MVD Coding

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100246681A1 (en) * 2009-03-27 2010-09-30 Vixs Systems, Inc. Adaptive partition subset selection module and method for use therewith
US20120207220A1 (en) * 2009-08-21 2012-08-16 Sk Telecom Co., Ltd. Method and apparatus for encoding/decoding images using adaptive motion vector resolution
US20130177084A1 (en) * 2012-01-10 2013-07-11 Qualcomm Incorporated Motion vector scaling in video coding
US20140023144A1 (en) * 2011-03-21 2014-01-23 Lg Electronics Inc. Method for selecting motion vector predictor and device using same
CN103931194A (zh) * 2011-06-16 2014-07-16 弗兰霍菲尔运输应用研究公司 运动矢量差的熵编码
US20140286427A1 (en) * 2011-12-28 2014-09-25 JVC Kenwood Corporation Moving picture coding device, moving picture coding method, and moving picture coding program, and moving picture decoding device, moving picture decoding method, and moving picture decoding program

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5778192A (en) * 1995-10-26 1998-07-07 Motorola, Inc. Method and device for optimal bit allocation between different sources of information in digital video compression
US7499495B2 (en) * 2003-07-18 2009-03-03 Microsoft Corporation Extended range motion vectors
US7221296B2 (en) * 2005-08-22 2007-05-22 Streaming Networks (Pvt.) Ltd. Method and system for fast context based adaptive binary arithmetic coding
KR101678968B1 (ko) * 2009-08-21 2016-11-25 에스케이텔레콤 주식회사 참조 픽처 보간 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
KR101449696B1 (ko) 2009-08-21 2014-10-20 에스케이텔레콤 주식회사 차분 움직임 벡터의 정밀도를 고려한 움직임 벡터 부호화/복호화 방법 및 장치, 및 그를 위한 영상처리 장치 및 방법
US10327008B2 (en) * 2010-10-13 2019-06-18 Qualcomm Incorporated Adaptive motion vector resolution signaling for video coding
US9736472B2 (en) * 2011-08-19 2017-08-15 Telefonaktiebolaget Lm Ericsson (Publ) Motion vector processing
US20130170553A1 (en) * 2012-01-04 2013-07-04 Qualcomm Incorporated Coding motion vector difference
EP2822276B1 (en) 2012-02-29 2018-11-07 LG Electronics Inc. Inter-layer prediction method and apparatus using same
CN103533376B (zh) * 2012-07-02 2017-04-12 华为技术有限公司 帧间预测编码运动信息的处理方法、装置和编解码系统
US20150098504A1 (en) * 2013-10-09 2015-04-09 Qualcomm Incorporated Block vector coding for intra block copying
US9774881B2 (en) * 2014-01-08 2017-09-26 Microsoft Technology Licensing, Llc Representing motion vectors in an encoded bitstream
BR112016017201B1 (pt) * 2014-01-29 2023-09-26 Hfi Innovation Inc Método de codificação e decodificação para precisão adaptativa de vetor de movimento de um bloco de dados de vídeo
KR101479137B1 (ko) * 2014-03-10 2015-01-07 에스케이텔레콤 주식회사 예측 움직임벡터 색인부호화에 기반한 움직임정보 생성/복원 장치 및 방법, 및 그것을 이용한 영상 부호화/복호화 장치 및 방법
US9756354B2 (en) * 2014-03-17 2017-09-05 Qualcomm Incorporated Block vector predictor for intra block copying
US9930341B2 (en) * 2014-06-20 2018-03-27 Qualcomm Incorporated Block vector coding for intra block copying
US9854253B2 (en) * 2014-06-30 2017-12-26 Qualcomm Incorporated Method for motion vector difference (MVD) and intra block copy vector difference (BVD) coding of screen content video data
US10531113B2 (en) * 2014-10-31 2020-01-07 Samsung Electronics Co., Ltd. Method and device for encoding/decoding motion vector
US20160337662A1 (en) * 2015-05-11 2016-11-17 Qualcomm Incorporated Storage and signaling resolutions of motion vectors
KR101601813B1 (ko) 2015-06-30 2016-03-11 에스케이텔레콤 주식회사 인터 예측을 이용한 영상 복호화 방법 및 장치

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100246681A1 (en) * 2009-03-27 2010-09-30 Vixs Systems, Inc. Adaptive partition subset selection module and method for use therewith
US20120207220A1 (en) * 2009-08-21 2012-08-16 Sk Telecom Co., Ltd. Method and apparatus for encoding/decoding images using adaptive motion vector resolution
US20140023144A1 (en) * 2011-03-21 2014-01-23 Lg Electronics Inc. Method for selecting motion vector predictor and device using same
CN103931194A (zh) * 2011-06-16 2014-07-16 弗兰霍菲尔运输应用研究公司 运动矢量差的熵编码
US20140286427A1 (en) * 2011-12-28 2014-09-25 JVC Kenwood Corporation Moving picture coding device, moving picture coding method, and moving picture coding program, and moving picture decoding device, moving picture decoding method, and moving picture decoding program
US20130177084A1 (en) * 2012-01-10 2013-07-11 Qualcomm Incorporated Motion vector scaling in video coding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
无: ""Test Model under Consideration"", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 2ND MEETING: GENEVA, CH, 21-28 JULY, 2010》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021052369A1 (zh) * 2019-09-20 2021-03-25 杭州海康威视数字技术股份有限公司 一种解码、编码方法、装置及其设备

Also Published As

Publication number Publication date
WO2017034113A1 (ko) 2017-03-02
US11729411B2 (en) 2023-08-15
KR20240000649A (ko) 2024-01-02
US11368707B2 (en) 2022-06-21
US10798400B2 (en) 2020-10-06
EP3343922A1 (en) 2018-07-04
KR102617235B1 (ko) 2023-12-26
EP3343922A4 (en) 2019-07-24
US20230345033A1 (en) 2023-10-26
US20220337862A1 (en) 2022-10-20
US20200404314A1 (en) 2020-12-24
KR20180044269A (ko) 2018-05-02
US20180249171A1 (en) 2018-08-30

Similar Documents

Publication Publication Date Title
CN107925774A (zh) 基于间预测模式的图像处理方法及其装置
US10404997B2 (en) Method and apparatus for processing video signal
KR101904949B1 (ko) 향상된 인트라 예측 모드 시그날링
CN110024384A (zh) 基于帧间预测模式处理视频的方法和用于该方法的设备
CN108353176B (zh) 在图像编译系统中的基于amvr的图像编译方法和装置
US11622124B2 (en) Method and apparatus for encoding/decoding images using adaptive motion vector resolution
CN109155855A (zh) 用于视频译码的仿射运动预测
CN110100436A (zh) 使用导出色度模式译码视频数据
KR102038243B1 (ko) 인코딩 방법 및 장치, 디코딩 방법 및 장치, 및 컴퓨터 판독가능 저장 매체
CN109997363A (zh) 图像编码/解码方法和装置以及存储有比特流的记录介质
CN109716771A (zh) 用于视频译码的线性模型色度帧内预测
CN108141605A (zh) 帧内块复制合并模式及不可用帧内块复制参考区域的填充
CN109076218A (zh) 在视频译码中自适应环路滤波中的多个滤波器的混淆
CN108141595A (zh) 图像编码/解码方法及其设备
CN107925760A (zh) 基于间预测模式的图像处理方法及其装置
CN110089113A (zh) 图像编码/解码方法、设备以及用于存储比特流的记录介质
CN103975587A (zh) 使针对图像的一组重建样本的补偿偏移的编码/解码最优化的方法和装置
CN109076213A (zh) 基于间预测模式的图像处理方法及其装置
CN108540811A (zh) 使用亮度采样的色度块的内部预测方法以及使用其的装置
KR20230003061A (ko) 모션 정밀 신택스을 위한 엔트로피 코딩
CN108028924A (zh) 用于编码/解码图像的方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20180417