CN107197290B - 推导缩放的运动向量的方法、装置和计算机可读媒介 - Google Patents

推导缩放的运动向量的方法、装置和计算机可读媒介 Download PDF

Info

Publication number
CN107197290B
CN107197290B CN201710243546.3A CN201710243546A CN107197290B CN 107197290 B CN107197290 B CN 107197290B CN 201710243546 A CN201710243546 A CN 201710243546A CN 107197290 B CN107197290 B CN 107197290B
Authority
CN
China
Prior art keywords
candidate
motion vector
distance
block
scaling factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710243546.3A
Other languages
English (en)
Other versions
CN107197290A (zh
Inventor
庄子德
林建良
陈庆晔
陈渏纹
黄毓文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MediaTek Inc
Original Assignee
MediaTek Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MediaTek Inc filed Critical MediaTek Inc
Publication of CN107197290A publication Critical patent/CN107197290A/zh
Application granted granted Critical
Publication of CN107197290B publication Critical patent/CN107197290B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提出一种推导缩放的运动向量的方法、装置和计算机可读媒介。其中该方法包含:决定对应于当前块的当前图像与该当前块的当前运动向量指向的目标参考图像之间的第一图像距离;决定对应于候选块的候选图像与该候选块的候选运动向量指向的候选参考图像之间的第二图像距离;决定预缩放距离部分;通过将有关于该第一图像距离和该预缩放距离部分的乘法结果右移位q位,决定中间缩放因子;通过将该中间缩放因子截断至介于‑p与(p‑1)之间的范围,获取最终缩放因子;以及基于该候选运动向量和该最终缩放因子产生该缩放的运动向量。通过利用本发明,可增加运动向量的有效缩放比,进而提升相关系统的性能。

Description

推导缩放的运动向量的方法、装置和计算机可读媒介
技术领域
本发明是有关于视频编码,且特别地,本发明是有关于高效视频编码(High-Efficiency Video coding,以下简称HEVC)中以增加的有效缩放比来缩放候选运动向量以推导运动向量预测子(Motion Vector Predictor,以下简称MVP)。
背景技术
高效视频编码(High-Efficiency Video coding,HEVC)是由视频编码联合组(Joint Collaborative Team on Video Coding,以下简称JCT-VC)开发的一种新的国际编码标准。HEVC是基于混合型分块运动补偿的类余弦变换的变换编码架构(hybrid block-based motion-compensated DCT-like transform coding architecture)。其用于压缩的基本单元是一个2N×2N的方块,被称为编码单元(Coding Unit,以下简称CU),且每一个CU皆可被递归地分割为4个更小的CU,直到产生预设的最小尺寸。每一个CU可包含一个或多个预测单元(Prediction Units,以下简称PU)。PU的尺寸可以是2N×2N、2N×N、2N×nU、2N×nD、N×2N、nL×2N、nR×2N、或者N×N,其中2N×N、2N×nU、2N×nD以及N×2N、nL×2N、nR×2N分别对应于具有对称或不对称PU尺寸分割的2N×2N尺寸PU的水平和垂直划分。
为进一步增强HEVC中运动向量编码的编码效率,基于运动向量竞争的机制被用于从既定运动向量预测子(Motion Vector Predictor,以下简称MVP)候选项集合中选择一个运动向量预测子(MVP),所述MVP集合包含空间及时间MVP。在HEVC测试模型版本3.0(HEVCtest model version 3.0,以下简称HM-3.0)中,包含帧间(Inter)、跳过(Skip)以及合并(Merge)三种帧间预测模式。所述帧间模式是利用可与MVP一起使用的传输的运动向量差(Motion Vector Difference,以下简称MVD)来执行运动补偿预测,以推导运动向量(Motion Vectors,以下简称MV)。而跳过及合并模式则利用运动推理方法(MV=MVP+MVD,其中MVD为0)以从空间相邻块(空间候选项)或位于同位图像(co-located picture)中的时间块(时间候选项)来获取运动信息。上述同位图像为列表0(list 0)或列表1(list 1)中的第一参考图像,并于条带头(slice header)中表示。
当PU在跳过或者合并模式下编码时,除了所选候选项的索引之外,并不传输任何运动信息。至于跳过的PU(skip PU),则连残差信号(residual signal)也可以省略。对于HM-3.0中的帧间模式来说,先进运动向量预测(Advanced Motion Vector Prediction,以下简称AMVP)机制被用于从包含两个空间MVP以及一个时间MVP的AMVP候选项集合中选择一个MVP。此处的MVP是指运动向量预测子(Motion Vector Predictor)或者运动向量预测(Motion Vector Prediction)。而对于HM-3.0中的合并和跳过模式来说,合并机制则被用于从包含四个空间MVP及一个时间MVP的合并候选项集合中选择一个MVP。
对于帧间模式来说,参考图像索引被明确地传输到解码器。随后,可从用于既定参考图像索引的候选项集合中选择MVP。图1是依据HM-3.0用于帧间模式的MVP候选项集合的示意图,其中MVP候选项集合包含两个空间MVP和一个时间MVP:
1、左侧预测子(来自A0及A1的第一可用MV);
2、顶部预测子(来自B0、B1及Bn+1的第一可用MV);以及
3、时间预测子(来自TBR及TCTR的第一可用MV)。
上述时间预测子是从同位图像中的块(TBR或TCTR)中推导出来的,而所述的同位图像则是列表0或列表1中的第一参考图像。与所述时间预测子(MVP)相关的块可具有两个MV:一个MV来自列表0,一个MV来自列表1。所述时间MVP则依据下述规则从来自列表0或列表1的MV推导出来:
1、穿过(cross)当前图像的MV首先被选中;以及
2、若两个MV皆穿过或皆不穿过当前图像,则具有与当前列表相同的参考列表的MV被选中。
在HM-3.0中,若特定块是在合并模式下被编码,则MVP索引会被传送以表明MVP候选项集合中的哪一MVP被用于此欲被合并的块。为遵循运动信息共享的精神,每一合并的PU(merged PU)可重用被选候选项的MV、预测方向以及参考图像索引。请注意,若被选的MVP为时间MVP,则参考图形索引总是被设定为第一参考图像。图2是依据HM-3.0用于合并模式的MVP候选项集合的示意图,其中MVP候选项集合包含四个空间MVP和一个时间MVP:
1、左侧预测子(Am);
2、顶部预测子(Bn);
3、时间预测子(来自TBR及TCTR的第一可用MV);
4、右上方预测子(B0);以及
5、左下方预测子(A0)。
在HM-3.0中,为了避免出现空的候选项集合,帧间模式和合并模式都采用了一种程序(process)。当在帧间或合并模式下未推测出候选项时,此程序可以将具有0值的MV作为候选项添加至候选项集合。
基于率失真优化(Rate-Distortion Optimization,以下简称RDO)决策,编码器可从用于帧间、跳过、或合并模式的既定MVP列表中选择一个最终MVP,并在移除列表中的冗余MVP之后将所选MVP的索引传输至解码器。然而,由于时间MVP包含在MVP列表中,因此任何传输错误都可能导致解码器端的解析错误(parsing error),同时这种错误可能会传播(propagate)。当先前图像的MV未被正确解码时,将会出现编码器端的MVP列表与解码器端的MVP列表失配的状况。从而,后续MV的解码也可能受到影响,且此状况可能会在后续的多个图像中存在。
在HM-4.0中,为了解决与HM-3.0中合并/AMVP相关的解析问题,其使用了固定的MVP列表尺寸(fixed MVP list size)以解耦(decouple)MVP列表架构与MVP索引解析。此外,为了补偿因固定的MVP列表尺寸导致的编码性能损失,额外的MVP被分配给MVP列表中的空位。在此程序中,合并索引是利用截断的一元码来编码,其具有等于或者小于5的固定长度,而AMVP索引则是利用等于或者小于2的固定长度来编码。
HM-4.0的另一个变化是MVP位置的统一。如图3所示,合并及跳过皆使用相同的位置。对于HM-4.0中的合并模式来说,多达四个空间MVP可从A0、A1、B0和B1中推导出来,且一个时间MVP可从TBR或TCTR中推导出来。对于时间MVP来说,TBR首先被使用。若TBR不可用,则使用TCTR来替代。若四个空间MVP中有任何一个不可用,则块位置B2被使用以推导MVP来作为替代。在四个空间MVP和一个时间MVP推导程序之后,执行移除冗余MVP的程序。在冗余MVP移除之后,若可用的MVP数量小于5,则三种类型的额外MVP被推导出来并添加至MVP列表中。
在用于空间及时间MVP的推导中,MVP可与指向作为目标参考图像的相同参考图像的MV一并推导。另一方面,MVP可从指向不同参考图像的候选MV中推导出来。图4是基于与空间相邻候选块相关的各种类型的运动向量来推导空间MVP的范例的示意图,其中所述候选块包含空间相邻块A0、A1、B0、B1和B2,以及时间同位块TBR或TCTR。圆圈中的数字代表用于从各自的候选项中决定MVP的搜寻顺序。所述搜寻的最高优先级对应于指向既定参考列表中目标参考图像的MV。所述搜寻的第二高优先级对应于指向另一参考列表中目标参考图像的MV。所述搜寻的第三和第四优先级则分别对应于指向既定参考列表和其他参考列表中其他参考图像的MV。在图4的特定范例中,运动向量1和2的可用性可以一并检查,而运动向量3和4的可用性可一并检查。运动向量1和2的可用性先从候选块A0到A1检查,再从B0到B2检查。若不存在任何MV,则所述搜寻在所有块中检查运动向量3和4的可用性。当MVP是从指向不同参考图像的MV或者用于同位图像的MV中推导出时,所述MV需要被缩放以考虑不同的图像距离。图4所示的用于MVP推导的搜寻类型范例并非本发明的限制。举例来说,每一个块中运动向量1至4的可用性可一并检查。在另一范例中,运动向量1可按顺序先从A0到A1、再从B0到B2检查。若没有任何MV存在,则此搜寻可先从A0到A1、再从B0到B2检查运动向量2。若仍未得出MVP,则此程序会继续对运动向量3和运动向量4执行。
在空间和时间MVP的推导过程中,需要除法运算来缩放运动向量。缩放因子可基于图像距离比(picture distance ratio)而计算出来。举例来说,MVP可基于同位块的MV推导出来。图像距离缩放因子DistScaleFactor可根据下式计算:
Figure BDA0001269962480000051
其中POCcurr和POCref分别代表当前图像的图像顺序计数(Picture Order Counts,以下简称POC)和目标参考图像的图像顺序数值(POC),而POCtemp和POCtemp_ref则分别代表同位图像的POC和同位块的MV指向的参考图像的POC。虽然此处是以使用同位块的MV为例说明图像距离缩放因子的推导,然而,空间相邻块的MV也可被用于推导MVP,且对应的图像距离缩放因子的推导也可类似地说明。
在依据HM-4.0的实作中,当前图像和目标参考图像之间的POC距离,以及同位图像和同位块的MV指向的参考图像之间的POC距离,可首先被约束至一个既定范围,即:
DiffPOCcurr=clip(-128,127,POCcurr-POCref),
DiffPOCtemp=clip(-128,127,POCtemp-POCtemp_ref).
接着,可依据下式来计算缩放因子:
Figure BDA0001269962480000061
DistScaleFactor=clip(-1024,1023,(DiffPOCcurr×X+32)>>6) (3)
而缩放MVP则可通过将MV与距离缩放因子相乘得到,即:
ScaledMV=sign(DistScaleFactor×MV)×
((|DistScaleFactor×MV|+127)>>8) (4)
依公式(1)中形式的图像缩放因子需要除法运算,其硬件实施较为复杂,或者基于实作的软件需要消耗更多的CPU时间。基于HM-4.0的实施例的精髓在于利用乘数因子(公式(2)中的214)自左乘(pre-multiply)距离比,以使距离比变成整数。在公式(2)中,偏置项|DiffPOCtemp/2|被添加至214以照顾具有舍入(rounding)的数据转换。类似地,偏置32和127被添加至公式(3)和(4)以用于数据转换。所述乘数因子可利用简单的右移位操作进行补偿。由于缩放MV(ScaledMV)的计算不需要任何除法运算,因此,与公式(2)-(4)相关的实施例是一种较佳的实施方式。
在HM-4.0,如公式(3)所示,缩放因子(DistScaleFactor)被截断至范围[-1024,1023]。如公式(4)所示,缩放因子被右移位8位,其意味着有效缩放范围被限制在[-4,4)。Li等人揭露了一种用于低延迟编码系统以提升编码效率的参考图像选择方法(“Encodingoptimization to improve coding efficiency for low delay cases”,Li等人,ITU-TSG16 WP3及ISO/IEC JTC1/SC29/WG11视频编码联合组第6次会议:Torino,IT,2011年7月14-22日,档案编号:JCTVC-F701)。依据Li等人的方法,最近的(nearest)一个图像和三个高品质图像(具有低QP的图像)作为参考图像被用于低延迟的情形。图5是用于低延迟系统的参考图像配置范例的示意图,其中图像10为当前图像,图像9为最近的图像,以及图像0、4和8为三个高品质参考图像。块525对应于当前块,而块515则对应于相邻块。相邻块515有一个相关的MV 510,其被用于推导当前块525的当前MV 520的MVP。与当前MV相关的图像距离为6,而与候选MV相关的图像距离为1。因此,此实施例中的图像缩放因子为6,其超过可支持的缩放因子范围。从而,对应某些应用来说,有效缩放范围[-4,4]变得不足。
因此,需要开发一种机制来增加用于MV缩放的有效缩放比,而结合了增加的缩放因子的系统亦可提升其自身性能。
发明内容
本发明提出一种推导缩放的运动向量的方法,用于基于与候选块相关的候选运动向量来推导当前块的缩放的运动向量,该方法包含:决定对应于该当前块的当前图像与该当前块的当前运动向量指向的目标参考图像之间的第一图像距离;决定对应于该候选块的候选图像与该候选块的该候选运动向量指向的候选参考图像之间的第二图像距离;决定预缩放距离部分,其中该预缩放距离部分具有有关于将预缩放因子除以该第二图像距离的第一值,该预缩放因子对应2k,且k为正整数;通过将有关于该第一图像距离和该预缩放距离部分的乘法结果右移位q位,决定中间缩放因子,其中q为正整数;通过将该中间缩放因子截断至介于-p与(p-1)之间的范围,获取最终缩放因子,其中p为大于1024的正整数;以及基于该候选运动向量和该最终缩放因子产生该缩放的运动向量,其中,k和q分别被设定为14和6。
本发明另一实施例提供一种推导缩放的运动向量的装置,用于基于与候选块相关的候选运动向量来推导当前块的缩放的运动向量,该装置包含一个或多个电路用来:决定对应于该当前块的当前图像与该当前块的当前运动向量指向的目标参考图像之间的第一图像距离;决定对应于该候选块的候选图像与该候选块的该候选运动向量指向的候选参考图像之间的第二图像距离;决定预缩放距离部分,其中该预缩放距离部分具有有关于将预缩放因子除以该第二图像距离的第一值,该预缩放因子对应2k,且k为正整数;通过将有关于该第一图像距离和该预缩放距离部分的乘法结果右移位q位,决定中间缩放因子,其中q为正整数;通过将该中间缩放因子截断至介于-p与(p-1)之间的范围,获取最终缩放因子,其中p为大于1024的正整数;以及基于该候选运动向量和该最终缩放因子产生该缩放的运动向量,其中,k和q分别被设定为14和6。
本发明另一实施例提供一种非暂存性计算机可读媒介,存储有计算机可执行程序,当该计算机可执行程序被执行时,引起解码器进行以下步骤:决定对应于当前块的当前图像与该当前块的当前运动向量指向的目标参考图像之间的第一图像距离;决定对应于候选块的候选图像与该候选块的候选运动向量指向的候选参考图像之间的第二图像距离;决定预缩放距离部分,其中该预缩放距离部分具有有关于将预缩放因子除以该第二图像距离的第一值,该预缩放因子对应2k,且k为正整数;通过将有关于该第一图像距离和该预缩放距离部分的乘法结果右移位q位,决定中间缩放因子,其中q为正整数;通过将该中间缩放因子截断至介于-p与(p-1)之间的范围,获取最终缩放因子,其中p为大于1024的正整数;以及基于该候选运动向量和该最终缩放因子产生该缩放的运动向量,其中,k和q分别被设定为14和6。
通过利用本发明,可增加用于运动向量缩放的有效缩放比,进而提升整合增加后有效缩放比的相关系统的性能。
附图说明
图1是基于HM-3.0中先进运动向量预测(AMVP)的、用于推导帧间模式的MVP候选项集合的相邻块的配置范例的示意图。
图2是HM-3.0中用于推导跳过及合并模式的MVP候选项集合的相邻块的配置范例的示意图。
图3是HM-4.0中用于推导AMVP/合并模式的MVP候选项集合的相邻块的配置范例的示意图。
图4是HM-4.0中先进运动向量预测(AMVP)的MVP列表的搜寻顺序范例的示意图。
图5是低延迟编码系统中参考帧配置范例的示意图。
图6是整合了本发明实施例的系统的流程图范例的示意图,其中有效缩放比增加至超出-4至4的范围。
具体实施方式
如前文所述,有效缩放因子的范围对于某些视频编码系统来说是不足的,例如使用一个最近图像和三个最高品质图像的低延迟系统。为了克服与MVP推导相关的缩放因子的范围不足的问题,本发明的实施例增加了有效缩放范围。整合了本发明实施例的系统具有[-8,8)、[-16,16)或者[-32,32)的有效缩放范围,以适应具有较长时间距离的参考图像。
在依据HM-4.0的运动向量预测子(MVP)推导中,当MVP自指向不同参考图像的MV得出时,MV被缩放至目标参考图像以作为最终的MVP。在MV的缩放过程中,缩放因子由下述方程式(5)来定义:
ScalingFactor=(POCcurr–POCref)/(POCcol–POCcol_ref)=tb/td, (5)
其中,td为同位图像与同位图像的MV指向的参考图像之间的POC距离,而tb为当前图像与目标参考图像之间的POC距离。用于基于空间相邻块的MVP推导的缩放因子可以很容易计算出来。在HM-4.0中,缩放因子依据下列方程式计算:
X=(214+|td/2|)/td,以及 (6)
ScalingFactor=clip(-1024,1023,(tb×X+32)>>6) (7)
随后,缩放的MV可由下述方程式得出:
ScaledMV=sign(ScalingFactor×MV)×((abs(ScalingFactor×MV)+127))>>8) (8)
通过将方程式(7)的截断值增加至2048、4096或者8192,依据本发明的实施例可增加有效缩放比。举例来说,对方程式(7)可做出如下改变:
ScalingFactor=clip(-2048,2047,(tb×X+32)>>6), (9)
ScalingFactor=clip(-4096,4095,(tb×X+32)>>6),或者 (10)
ScalingFactor=clip(-8192,8191,(tb×X+32)>>6) (11)
从而,有效缩放范围可分别增加至[-8,8)、[-16,16)或者[-32,32)。
上述与图像距离缩放相关的无除法运算(division free operation)是通过数值X来达成的,数值X是由(1/td)与214相乘得到,如方程式(6)所示。随后在方程式(7)所示的ScalingFactor的推导中,乘数214可利用右移位6位来补偿,而在方程式(8)所示的缩放的MV的推导中,则利用右移位8位来补偿。虽然方程式(7)和(8)中分别利用了右移位6位和8位,但也可以利用其他配置。举例来说,可在方程式(7)和(8)中利用右移位7位和右移位7位来分别替代右移位6位和8位。在此实施例中,ScalingFactor的推导是基于(tb×X)右移位7位来替代右移位6位,从而ScalingFactor的最后数值被因子2缩小。从而,截断范围也被因子2缩小。在此实施例中,方程式(9)-(11)中的截断值分别变为1024、2048以及4096。从而,方程式(6)可被一般化为下述方程式:
ix=(2k+|td/2|)/td,以及 (12)
其中k为整数,且k=q+m。q和m都是整数,其中q对应距离缩放因子DistScalefactor推导过程中的右移位,而m则对应于缩放的MV scaled_MV_xy推导过程中的右移位。DistScalefactor和scaled_MV_xy可推导如下:
DistScalefactor=clip(-p,(p-1),(tb*ix+(1<<(q-1)))>>q),以及 (13)
scaled_MV_xy=(DistScaleFactor*MV_xy+(1<<(m-1))–1+(((DistScaleFactor*MV_xy)<0)?1:0))>>m (14)
其中p是与所需截断范围相关的整数,且p大于1024。举例来说,p可对应于2048、4096、或者8192,且q和m可分别对应于6和8。
图6是整合了本发明实施例的系统的流程图范例的示意图。首先,在步骤610中,决定对应于当前块的当前图像与当前块的当前运动向量指向的目标参考图像之间的第一图像距离。在步骤620中,决定对应于候选块的候选图像与候选块的候选MV指向的候选参考图像之间的第二图像距离。在步骤630中,决定对应于第一距离值与第二距离值之比的距离比。所述第一距离值与第一图像距离有关,而所述第二距离值则与第二图像距离有关。随后,在步骤640中,基于候选MV并依据所述距离比来产生缩放的MV,其中缩放的MV具有介于-m与n之间的有效缩放比,而m和n皆为大于4的正整数。在某些实施例中,m和n的值可以是8、16或者32。图6中的流程图仅为了说明具有增加的有效缩放比的运动向量缩放的范例,本领域的技术人员亦可通过重排步骤顺序、分割一或多个步骤、或整合一或多个步骤来实施本发明。
步骤630中的距离比可通过第一缩放因子和第二缩放因子计算得出,其中第一缩放因子与步骤610中决定的第一距离值有关,而第二缩放因子与步骤620中决定第二距离值有关。接着,通过将一乘积值截断至介于-p与(p-1)之间的范围来产生第一缩放因子,其中所述乘积值有关于通过将第一距离值与第二缩放因子相乘得到的第一组分以及将所述第一组分右移位6位,而p则大于1024。所述缩放的MV有关于通过将候选MV与第一缩放因子相乘得到的第二组分以及将第二组分右移位8位。
以上描述是为了使本领域的技术人员能够以上文中的特定实施方式及其需求来实现本发明。然而,本领域的技术人员应可对其进行各种变型与修饰,而本发明的基本精神也可以应用至其他实施例中。因此,本发明并非以所述特定实施例为限,而应以符合本发明宗旨及新特征的最广的范围为界。在上述详细描述中,阐述各种特定细节是为了便于对本发明有全面的了解,然而,本领域的技术人员应可理解,本发明也可在不限定这些具体细节中的一部分或者全部的情况下得以实施。
上述的根据本发明的实施例可以不同硬件、软件代码、或两者的结合来实施。举例来说,依据本发明的一个实施例,其可以是用来实施所述方法的、整合至视频压缩芯片中的电路,或是整合至视频压缩软件中的程序代码。依据本发明的另一个实施例,其也可以是数字信号处理器(Digital Signal Processor,DSP)上执行的、用来实施所述方法的程序代码。本发明亦可包含由计算机处理器、DSP、微处理器、或现场可编程门阵列(FieldProgrammable Gate Array,FPGA)执行的一系列功能。通过执行定义了本发明实施例特定方法的机器可读软件代码或固件代码,这些处理器可被设置为执行依据本发明的特定任务。所述软件代码或固件代码可通过不同的编程语言及不同格式/样式来开发。所述软件代码亦可符合不同的目标平台。然而,执行与本发明相应的任务的、具有不同代码格式、样式及语言的软件代码,以及其他方式形成的代码都应包含在本发明的范围内。
在不脱离本发明的精神及基本特征的前提下,本发明亦可用其他特定形式来实施。以上所述的实施例仅仅是为了说明本发明,并非本发明的限制。本发明的范围当所附的权利要求为准,凡依本发明权利要求所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (12)

1.一种推导缩放的运动向量的方法,用于基于与候选块相关的候选运动向量来推导当前块的缩放的运动向量,该方法包含:
决定对应于该当前块的当前图像与该当前块的当前运动向量指向的目标参考图像之间的第一图像距离;
决定对应于该候选块的候选图像与该候选块的该候选运动向量指向的候选参考图像之间的第二图像距离;
决定预缩放距离部分,其中该预缩放距离部分具有有关于将预缩放因子除以该第二图像距离的第一值,该预缩放因子对应2k,且k为正整数;
通过将有关于该第一图像距离和该预缩放距离部分的乘法结果右移位q位,决定中间缩放因子,其中q为正整数;
通过将该中间缩放因子截断至介于-p与(p-1)之间的范围,获取最终缩放因子,其中p为大于1024的正整数;以及
基于该候选运动向量和该最终缩放因子产生该缩放的运动向量,
其中,k和q分别被设定为14和6。
2.如权利要求1所述的方法,其特征在于,基于该候选运动向量和该最终缩放因子产生该缩放的运动向量进一步包括:
通过将有关于该候选运动向量和该最终缩放因子的乘法结果右移位m位,来产生该缩放的运动向量。
3.如权利要求2所述的方法,其特征在于,m被设定为8。
4.如权利要求3所述的方法,其特征在于,该候选运动向量和该缩放的运动向量之间的最大有效缩放比大于4。
5.如权利要求4所述的方法,其特征在于,p被设定为2(m+3)、2(m+4)或2(m+5)
6.如权利要求1所述的方法,其特征在于,该候选块对应于空间相邻块或时间同位块。
7.一种推导缩放的运动向量的装置,用于基于与候选块相关的候选运动向量来推导当前块的缩放的运动向量,该装置包含处理器,在执行程序代码时用来:
决定对应于该当前块的当前图像与该当前块的当前运动向量指向的目标参考图像之间的第一图像距离;
决定对应于该候选块的候选图像与该候选块的该候选运动向量指向的候选参考图像之间的第二图像距离;
决定预缩放距离部分,其中该预缩放距离部分具有有关于将预缩放因子除以该第二图像距离的第一值,该预缩放因子对应2k,且k为正整数;
通过将有关于该第一图像距离和该预缩放距离部分的乘法结果右移位q位,决定中间缩放因子,其中q为正整数;
通过将该中间缩放因子截断至介于-p与(p-1)之间的范围,获取最终缩放因子,其中p为大于1024的正整数;以及
基于该候选运动向量和该最终缩放因子产生该缩放的运动向量,
其中,k和q分别被设定为14和6。
8.如权利要求7所述的装置,其特征在于,基于该候选运动向量和该最终缩放因子产生该缩放的运动向量进一步包括:
通过将有关于该候选运动向量和该最终缩放因子的乘法结果右移位m位,来产生该缩放的运动向量。
9.如权利要求8所述的装置,其特征在于,m被设定为8。
10.如权利要求9所述的装置,其特征在于,该候选运动向量和该缩放的运动向量之间的最大有效缩放比大于4。
11.如权利要求10所述的装置,其特征在于,p被设定为2(m+3)、2(m+4)或2(m+5)
12.如权利要求7所述的装置,其特征在于,该候选块对应于空间相邻块或时间同位块。
CN201710243546.3A 2011-11-07 2012-11-07 推导缩放的运动向量的方法、装置和计算机可读媒介 Active CN107197290B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161556480P 2011-11-07 2011-11-07
US61/556,480 2011-11-07
CN201280054067.2A CN103918267B (zh) 2011-11-07 2012-11-07 推导缩放的运动向量的方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201280054067.2A Division CN103918267B (zh) 2011-11-07 2012-11-07 推导缩放的运动向量的方法

Publications (2)

Publication Number Publication Date
CN107197290A CN107197290A (zh) 2017-09-22
CN107197290B true CN107197290B (zh) 2020-02-18

Family

ID=48288532

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201280054067.2A Active CN103918267B (zh) 2011-11-07 2012-11-07 推导缩放的运动向量的方法
CN201710243546.3A Active CN107197290B (zh) 2011-11-07 2012-11-07 推导缩放的运动向量的方法、装置和计算机可读媒介

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201280054067.2A Active CN103918267B (zh) 2011-11-07 2012-11-07 推导缩放的运动向量的方法

Country Status (6)

Country Link
US (2) US9641837B2 (zh)
EP (1) EP2740271B1 (zh)
JP (1) JP5801492B2 (zh)
CN (2) CN103918267B (zh)
WO (1) WO2013067932A1 (zh)
ZA (1) ZA201401775B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2715613T3 (es) * 2011-06-28 2019-06-05 Lg Electronics Inc Método para fijar una lista de vectores de movimiento
US11876957B2 (en) * 2018-12-18 2024-01-16 Lg Electronics Inc. Method and apparatus for processing video data

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1408696A4 (en) * 2002-07-02 2008-04-09 Matsushita Electric Ind Co Ltd METHOD FOR EVALUATING MOTION VECTORS, METHOD FOR CYCLING A DYNAMIC IMAGE, METHOD FOR DECODING A DYNAMIC IMAGE
CN1213613C (zh) * 2003-09-12 2005-08-03 浙江大学 视频编解码中运动矢量的预测方法和装置
JP5125329B2 (ja) * 2007-08-31 2013-01-23 富士通セミコンダクター株式会社 符号化装置と符号化方法、および復号化装置と復号化方法
KR101752418B1 (ko) 2010-04-09 2017-06-29 엘지전자 주식회사 비디오 신호 처리 방법 및 장치

Also Published As

Publication number Publication date
CN103918267B (zh) 2017-05-17
EP2740271A4 (en) 2016-09-21
JP2014527777A (ja) 2014-10-16
CN103918267A (zh) 2014-07-09
ZA201401775B (en) 2016-08-31
US20170195687A1 (en) 2017-07-06
CN107197290A (zh) 2017-09-22
JP5801492B2 (ja) 2015-10-28
US9641837B2 (en) 2017-05-02
WO2013067932A1 (en) 2013-05-16
US9877041B2 (en) 2018-01-23
US20140247884A1 (en) 2014-09-04
EP2740271B1 (en) 2020-07-15
EP2740271A1 (en) 2014-06-11

Similar Documents

Publication Publication Date Title
CN110581997B (zh) 运动矢量精度细化
US10477234B2 (en) Method and apparatus for derivation of motion vector predictor candidate set
JP6949168B2 (ja) 映像符号化方法、および映像復号化方法
US9961364B2 (en) Method and apparatus of temporal motion vector prediction
CN113767637B (zh) 对称运动矢量差编解码
US8824558B2 (en) Method and apparatus of spatial motion vector prediction
US20200014931A1 (en) Methods and Apparatuses of Generating an Average Candidate for Inter Picture Prediction in Video Coding Systems
WO2020038349A1 (en) Methods and apparatus for generating affine candidates
JP2022507131A (ja) イントラブロックコピーのための履歴ベース動き候補リスト構築
US9094683B2 (en) Method of coding moving image and method of decoding moving image
CN113906738A (zh) 仿射模式的自适应运动矢量差分辨率
CN112997487A (zh) 仿射模式与其他帧间编解码工具之间的协调
EP2919462A1 (en) Video encoding method, video encoding device, and video encoding program
CN113767638A (zh) 对称运动矢量差编解码
JP2014143650A (ja) 動画像符号化装置、動画像符号化方法及び動画像復号装置ならびに動画像復号方法
CN107197290B (zh) 推导缩放的运动向量的方法、装置和计算机可读媒介

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant