CN1965583A - 搜索全局运动矢量的方法 - Google Patents

搜索全局运动矢量的方法 Download PDF

Info

Publication number
CN1965583A
CN1965583A CNA2005800181824A CN200580018182A CN1965583A CN 1965583 A CN1965583 A CN 1965583A CN A2005800181824 A CNA2005800181824 A CN A2005800181824A CN 200580018182 A CN200580018182 A CN 200580018182A CN 1965583 A CN1965583 A CN 1965583A
Authority
CN
China
Prior art keywords
motion vector
image
global motion
relevant
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800181824A
Other languages
English (en)
Inventor
W·P·李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1965583A publication Critical patent/CN1965583A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/527Global motion vector estimation

Abstract

本发明涉及搜索与视频序列的图像相关的全局运动矢量的方法,所述方法包括下列步骤:计算(PROJ)图像(f)沿预定轴的投影;基于与至少一个在前投影的图像相关的至少一个在前全局运动矢量,确定(PRED)与当前投影的图像(F(k))相关的当前全局运动矢量公式(I)的预测(vpred (k));基于预测的当前全局运动矢量,确定(SS)运动矢量搜索组;计算(CAL)候选运动矢量(vi (k))沿预定轴移位的在前投影图像(F(k-1))与下一投影的图像(F(k+r))之间的失真值,所述计算步骤对于运动矢量搜索组中的不同候选运动矢量进行迭代,当前全局运动矢量是最小化该失真值的候选运动矢量。

Description

搜索全局运动矢量的方法
技术领域
本发明涉及用于搜索与视频序列的图像(picture)相关的全局运动矢量的方法和设备。
本发明可以用于例如移动设备诸如照相机、移动电话或个人数字助理PDA中。
背景技术
用于运动估算的常规方法是根据失真测量在当前块和若干候选决组之间执行块匹配,并且随后选择引起最小失真的候选块。由于其水平和垂直分量可以是整数或非整数取样的平移运动而选择候选块。运动矢量MV限定参考图像中的候选块相比于在参考图像中具有与当前图像中的当前块相同的位置的块的相对位置。块匹配处理包括计算包含在当前图像中的当前块与包含在参考图像中的候选块之间的失真值的步骤。这个计算步骤例如是基于这两个块之间的绝对误差差值SAD之和的计算。通常,必须在其中查找候选块的搜索区域具有预定大小,一般具有给定数量的行,并且所述搜索区域内的每个候选块都必须被测试。
在所谓的全局运动估算的情况中,利用投影图像F来确定全局运动矢量,其中投影图像F对应于输入图像f沿水平(或垂直)方向的水平(或垂直)之和,如等式(1)中所示:
F ( i , k ) = Σ j = 0 N - 1 f ( i , j , k ) - - - ( 1 )
其中i表示图像的行,j表示图像的列,N表示图像的列数,而k表示时间。
当前图像F(k)的当前全局垂直运动矢量vi g(k)等于候选垂直全局运动矢量vi,其中对于该候选垂直全局运动矢量vi,在候选运动矢量vi在沿垂直轴的第一方向上移位的在前投影的图像F(k-1)与候选运动矢量vi在沿着与第一方向相反的第二方向移位的下一个投影的图像(F(k+1))之间的绝对差值SAD之和是最小的,如等式(2)所示:
v i g ( k ) arg min v i ∈ s i g Σ j = 0 M - 1 | F ( i - v i , k - 1 ) - F ( i + v i , k + 1 ) | - - - ( 2 )
其中M是图像的行数,而Si g是垂直搜索组。
根据等式(2),必须测试搜索组Si g内的每个候选运动矢量vi,以确定绝对差值SAD之和的最小值。该方法有时被称为全搜索方法。但是,这样的全搜索方法的计算是特别昂贵的,尤其是在高清晰图像的情况下。
发明内容
本发明的目的是提供一种搜索全局运动矢量的方法,该方法的计算强度低于现有技术的方法。
为此,根据本发明的搜索方法的特征在于,它包括下列步骤:
-计算图像沿预定轴的投影;
-基于与至少一个在前投影的图像相关的至少一个在前全局运动矢量,确定与当前投影的图像相关的当前全局运动矢量的预测;
-基于预测的当前全局运动矢量,确定运动矢量搜索组;
-计算候选运动矢量沿预定轴移位的在前投影图像与下一个投影图像之间的失真值,所述计算步骤对于运动矢量搜索组中的不同候选运动矢量进行迭代(重复)当前全局运动矢量为最小化该失真值的候选矢量。
结果,搜索组仅包括在全局运动矢量的预测周围的有限数量的候选运动矢量,而该搜索组比现有技术中的要宽得多,因为其被包括在下阈值vmin和上阈值vmax之间。因此,本发明允许降低搜索方法的计算成本。
根据本发明的一个实施例,预测的当前全局运动矢量是与在前投影图像相关的在前全局运动矢量。
根据本发明的更完善的实施例,预测的当前全局运动矢量是与在前投影图像组相关的在前全局运动矢量组的外插(extrapolation)。
根据本发明的一个实施例,搜索组包括范围[vpred-n,vpred+n],其中vpred是预测的全局运动矢量的值,而n是正值。有利地,搜索组还包括运动矢量候选者vpred+2q.n,其中q是不同于0到所述运动矢量候选者位于下阈值vmin和上阈值vmax之间的范围的整数。
本发明还涉及用于实施根据本发明的搜索方法的设备。
本发明涉及移动设备,其包括用于显示一系列图像的屏幕、这样的用于确定与当前图像相关的当前全局运动矢量的设备和用于根据当前全局运动矢量来补偿移动设备的运动的装置。
本发明涉及用于编码图像的视频编码器,所述编码器包括:用于提供编码图像的编码单元;用于根据编码图像提供解码图像的解码单元;用于交付(deliver)运动补偿图像的预测单元;用于将运动补偿图像加到解码图像上的加法器,所述加法器的输出被提供给预测单元的输入;用于从输入图像中减去运动补偿图像的减法器;和用于向预测单元提供全局运动矢量的设备。
本发明最后涉及包括用于实施所述方法的程序指令的计算机程序产品。
本发明的这些和其他方面从下面描述的实施例中将是明白的,并将参照下面描述的实施例进行阐述。
附图说明
现在,将参照附图通过示例的方式更详细地描述本发明,其中:
图1是根据本发明的搜索全局运动矢量的方法的方框图;
图2是根据本发明的减少的运动矢量搜索组的示意图;和
图3是实施根据本发明的搜索方法的编码设备的方框图。
具体实施方式
当前,被引入高端产品中的特征趋于转移到低端产品,并且甚至转移到移动产品。但是,这种转移通常需要更经济实施这些特征或某些修改,以适合市场。帧(速)率转换、交错(隔行)-逐级(逐行)转换和稳定拍摄(steady shot)是可以被引入到低端和/或移动产品中的特征的示例。
本发明旨在减少根据投影的图像获得图像序列内的全局运动矢量所需要的计算能力。在全局运动估算的上下文中,SAD操作的数量等于候选运动矢量的数量,如前所讨论的。候选运动矢量的数量与搜索组和全局运动矢量所需的分辨率成比例。在进行全局运动矢量的预测时,实现候选运动矢量数量的显著减少。因此,实施所述预测的搜索方法有助于更一致的运动估算。
根据本发明的搜索全局运动矢量的方法首先包括步骤PROJ,即计算输入图像f(i,j)沿水平或垂直轴的投影F(i),如以前等式(1)中所述。
该方法还包括步骤PRED,即确定与当前投影的图像F(k)相关的当前全局运动矢量vi g(k)的预测vpred(k)。该当前全局运动矢量的预测例如分别基于与至少一个在前投影图像相关的至少一个在前全局运动矢量。
根据本发明的实施例,当前全局运动矢量的预测等于与在前投影图像F(k-1)相关的在前全局运动矢量vi g(k-1)。
根据本发明的更完善的实施例,当前全局运动矢量的预测等于与一组在前投影图像{F(k-m),...,F(k-1)}相关的一组在前全局运动矢量{vi g(k-m),...,vi g(k-1)}的外插,其中m是绝对大于1的整数。该外插例如基于Lagrange(拉格朗日)线性外插(法)。由于这个外插技术的使用而实现更高的鲁棒性(强度)。
根据本发明的方法包括基于当前全局运动矢量的预测来确定运动矢量搜索组的步骤SS。对在预测的全局运动矢量周围的本地搜索组,执行全局运动矢量的搜索。
根据本发明的一个实施例,搜索组包括初始搜索范围[vpred-n,vpred+n],其中vpred是运动矢量的预测值,而n是整数。在这种情况下,搜索组包括2n+1个值,用于全像素分辨率。全局运动矢量的精确度主要取决于这个初始搜索组的大小,即,取决于n的值。
对于本领域技术人员而言,显然,n不一定是整数。例如,如果需要更准确的全局运动估算,则可以使用内插技术在子像素基础上移位投影图像。这导致非整数全局运动矢量。
对本领域技术人员而言,搜索组中的候选运动矢量不一定是等距的,这也将显然的。例如,候选运动矢量之间的距离可以基于二次函数或对数函数。这导致全局运动矢量的更为精细的调谐。
选择在初始搜索组外部的几个候选运动矢量增强该方法的鲁棒性。为此,搜索组还包括附加的候选运动矢量。这对于搜索方法将集中到实际的全局运动矢量的方式有影响。图2中给出了一组测试矢量的示例。整个组的候选运动矢量描述在下面的公式中:
{vk∈vpred-n,vpred+n,vpred+p·dv,p∈N}
{vk ∈[vmin,vmax],vpred+2q.n,q∈N,q≠0}
其中dv是运动矢量单元,其可以为非整数。
对本领域技术人员而言,将明白,搜索组的附加候选运动矢量不必是等距的。它们也可以基于二次函数或对数函数来确定,如前所述。
如下计算对于搜索方法的最大效率的最优候选运动矢量组。
可能的候选运动矢量的总数为: p max = v max - v min d v
初始搜索组中的候选运动矢量的数量为: s = 2 n d v
该方法的效率如下: η = p max p max s + s - 1
如下推导出最优搜索组: d ( p max s + s - 1 ) ds = 0 ⇒ s opt = ± p max , 并且最大效率
则为: ⇒ η = p max 2 p max - 1 ≈ p max 2
该搜索方法最后包括步骤CAL,即计算候选运动矢量vi(k)沿水平或垂直轴移位的在前投影图像F(k-1)与下一个投影图像F(k+r)之间的失真值,其中r是整数,正的或零。
例如,在帧速率上变换2的情况中,其中帧必须在新的时刻被内插(在这种情况中,恰好在中间),计算在候选运动矢量vi在沿水平或垂直轴的第一方向上移位的在前投影图像F(k-1)和候选运动矢量vi在与第一方向相反的第二方向移位的下一个投影图像F(k+1)之间的失真值,如前面的等式(2)中所述。
对于本领域技术人员而言,将明白,该移位并不一定是对称的。例如,在帧速率上变换3的情况中,必须分别地在原始帧时间的1/3和2/3上内插图像。
作为另一个示例,在前投影图像F(k-1)还可以相对于当前投影图像F(k)(即,非移位的投影图像)被移位。这个方法是可以例如用于图像稳定化的低成本解决方案。
计算步骤对于运动矢量搜索组中的不同候选运动矢量进行重复。当前全局运动矢量最后是最小化该失真值的候选运动矢量。
全局运动估算是对于整个图像的运动的度量,即较大或多个物体的平均或支配运动具有或多或少的相同运动。它在物体或照相机的摇摄(即,平移)的检测中找到其应用。它可以对于照相机系统用作稳定拍摄,其中补偿意外的照相机运动。对于显示系统而言,它可以是摇镜头-变焦距模式的一部分,作为用于去交错处理或帧速率上变换的运动估算的改进。
这样的所述运动估算能够足以结合序列中图像的适当分段来补偿视频序列的运动。图3示出了视频编码器的示例。这种视频编码器包括:第一(程序)块T/Q,其包括与量化块Q串联的直接频率变换决,其中量化块Q适于从输入分段的图像f中产生量化的分段图像;和熵编码块EC,适于从量化的分段图像中产生编码的分段图像BS。视频编码器还包括解码单元,该解码单元包括串联的逆量化决IQ和逆频率变换块IT,用于提供解码的分段图像。该编码器包括预测单元,其包括与运动补偿单元MC串联的图像存储器MEM,用于产生运动补偿的分段图像。它包括用于将解码的分段图像加到运动补偿的分段图像上的加法器和用于从输入的分段图像f中减去运动补偿的分段图像的减法器,这个减法器的结果被传送给块T/Q。视频编码器最后包括根据本发明的全局运动估算设备,用于向预测单元提供全局运动矢量。
上面仅通过示例描述了本发明的几个实施例,并且对于本领域技术人员来说,将明白在不背离由所附权利要求限定的本发明的范围的情况下,可以对所描述的实施例进行修改和改变。此外,在权利要求书中,括号之间的任何参考符号不应被认为是限制权利要求。术语“包括”并不排除除了权利要求中所列出之外的其他元素或步骤的存在。术语“一或一个”并不排除多个。本发明可以利用包括几个不同元素的硬件和利用合适编程的计算机来实现。在列举若干装置的设备权利要求中,可以利用同一个硬件项来实施这些装置中的若干装置。唯一事实是:在互不相同的独立权利要求中叙述的措施并不表示不能有益使用这些措施的组合。

Claims (9)

1.一种搜索与视频序列中的图像相关的全局运动矢量的方法,所述方法包括下列步骤:
-计算(PROJ)图像(f)沿预定轴的投影;
-基于与至少一个在前投影的图像相关的至少一个在前全局运动矢量,确定(PRED)与当前投影的图像(F(k))相关的当前全局运动矢量(vi g(k))的预测(Vpred(k));
-基于预测的当前全局运动矢量,确定(SS)运动矢量搜索组;
-计算(CAL)候选运动矢量(vi(k))沿预定轴移位的在前投影图像(F(k-1))与下一个投影的图像(F(k+r))之间的失真值,所述计算步骤对于运动矢量搜索组中的不同候选运动矢量进行迭代,当前全局运动矢量是最小化谊失真值的候选运动矢量。
2、如权利要求1所述的方法,其中预测的当前全局运动矢量是与在前投影的图像(F(k-1))相关的在前全局运动矢量(vi g(k-1))。
3、如权利要求1所述的方法,其中预测的当前全局运动矢量是与在前投影的图像组相关的在前全局运动矢量组的外插。
4、如权利要求1所述的方法,其中搜索组包括范围[Vpred-n,Vpred+n],其中Vpred是预测的全局运动矢量的值,并且n是正值。
5、如权利要求4所述的方法,其中搜索组还包括运动矢量候选者Vpred+2q.n,其中q是不同于从0到其中所述运动矢量候选者位于下阈值和上阈值之间的范围的整数。
6、一种用于搜索与视频序列中的图像相关的全局运动矢量的设备,所述设备包括:
-用于计算图像沿预定轴的投影的装置;
-用于基于与至少一个在前投影的图像相关的至少一个在前全局运动矢量来预测与当前投影的图像相关的当前全局运动矢量的装置;
-用于基于预测的当前全局运动矢量来确定运动矢量搜索组的装置;
-用于计算候选运动矢量沿预定轴移位的在前投影的图像与下一个投影的图像之间的失真值的装置,所述计算步骤对于运动矢量搜索组中的不同候选运动矢量进行迭代,当前全局运动矢量是最小化该失真值的候选运动矢量。
7、一种移动设备,其包括:用于显示一系列图像的屏幕;如权利要求6所述的用于确定与当前图像相关的当前全局运动矢量的设备;和用于基于当前全局运动矢量来补偿移动设备的运动的装置。
8、一种用于编码图像(f)的视频编码器,所述编码器包括:
-编码单元(T/Q,EC),用于提供编码的图像(BS),
-解码单元(IQ/IT),用于根据编码的图像来提供解码的图像,
-预测单元(MEM,MC),用于交付运动补偿的图像,
-加法器,用于将运动补偿的图像加到解码的图像上,所述加法器的输出被提供给预测单元的输入,
-减法器,用于从输入图像中减去运动补偿的图像,和
-如权利要求6所述的设备,用于向预测单元提供全局运动矢量。
9、一种计算机程序产品,包括程序指令,用于在所述程序由处理器执行时实施如权利要求1所述的方法。
CNA2005800181824A 2004-06-04 2005-05-31 搜索全局运动矢量的方法 Pending CN1965583A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP04300313 2004-06-04
EP04300313.6 2004-06-04

Publications (1)

Publication Number Publication Date
CN1965583A true CN1965583A (zh) 2007-05-16

Family

ID=34968630

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800181824A Pending CN1965583A (zh) 2004-06-04 2005-05-31 搜索全局运动矢量的方法

Country Status (6)

Country Link
US (1) US20070223588A1 (zh)
EP (1) EP1757103A1 (zh)
JP (1) JP2008502196A (zh)
KR (1) KR20070033345A (zh)
CN (1) CN1965583A (zh)
WO (1) WO2005120075A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101600106B (zh) * 2009-06-22 2012-10-03 北京大学 一种全局运动估计方法及装置

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4677351B2 (ja) * 2006-02-17 2011-04-27 キヤノン株式会社 動き補償器、動き補償処理方法、コンピュータプログラム及び記憶媒体
KR100891768B1 (ko) * 2007-05-02 2009-04-07 삼성전자주식회사 모션 벡터 탐색 방법
US8514939B2 (en) * 2007-10-31 2013-08-20 Broadcom Corporation Method and system for motion compensated picture rate up-conversion of digital video using picture boundary processing
JP2010128744A (ja) * 2008-11-27 2010-06-10 Toyota Infotechnology Center Co Ltd 対応ブロック探索装置
US8498493B1 (en) * 2009-06-02 2013-07-30 Imagination Technologies Limited Directional cross hair search system and method for determining a preferred motion vector
EP2560128B1 (en) 2011-08-19 2017-03-01 OCT Circuit Technologies International Limited Detecting a scene with a mobile electronic device
JP5921469B2 (ja) 2013-03-11 2016-05-24 株式会社東芝 情報処理装置、クラウドプラットフォーム、情報処理方法およびそのプログラム
US9800895B2 (en) * 2013-06-27 2017-10-24 Qualcomm Incorporated Depth oriented inter-view motion vector prediction
GB2524476B (en) * 2014-03-14 2016-04-27 Canon Kk Method, device and computer program for optimizing transmission of motion vector related information when transmitting a video stream
WO2018206551A1 (en) * 2017-05-09 2018-11-15 Koninklijke Kpn N.V. Coding spherical video data

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07222160A (ja) * 1994-02-07 1995-08-18 Sony Corp 動きベクトル検出装置
US6128047A (en) * 1998-05-20 2000-10-03 Sony Corporation Motion estimation process and system using sparse search block-matching and integral projection
US6285711B1 (en) * 1998-05-20 2001-09-04 Sharp Laboratories Of America, Inc. Block matching-based method for estimating motion fields and global affine motion parameters in digital video sequences
JP3538055B2 (ja) * 1999-02-15 2004-06-14 日本電気株式会社 動きベクトル検出装置
US7227896B2 (en) * 2001-10-04 2007-06-05 Sharp Laboratories Of America, Inc. Method and apparatus for global motion estimation

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101600106B (zh) * 2009-06-22 2012-10-03 北京大学 一种全局运动估计方法及装置

Also Published As

Publication number Publication date
US20070223588A1 (en) 2007-09-27
EP1757103A1 (en) 2007-02-28
KR20070033345A (ko) 2007-03-26
WO2005120075A1 (en) 2005-12-15
JP2008502196A (ja) 2008-01-24

Similar Documents

Publication Publication Date Title
CN1965583A (zh) 搜索全局运动矢量的方法
US11856218B2 (en) Motion candidate derivation based on spatial neighboring block in sub-block motion vector prediction
CN102075760B (zh) 快速运动估计方法及装置
EP2232873B1 (en) Adaptive motion estimation
BR102012013152A2 (pt) aparelho de decodificaÇço de vÍdeo, aparelho de codificaÇço de vÍdeo, mÉtodo de decodificaÇço de vÍdeo, mÉtodo de codificaÇço de vÍdeo e meio de armazenamento
EP1406449A2 (en) Interpolation apparatus and method for motion compensation
US11212554B2 (en) Method and apparatus for low-complexity bi-directional intra prediction in video encoding and decoding
CA2500307A1 (en) Implicit weighting of reference pictures in a video encoder
US20030161400A1 (en) Method and system for improved diamond motion search
US20030081682A1 (en) Unit for and method of motion estimation and image processing apparatus provided with such estimation unit
CN107646194A (zh) 用于视频运动补偿的装置和方法
US20220148131A1 (en) Image/video super resolution
CN100576914C (zh) 用于估计当前运动矢量的单元和方法
US20030086499A1 (en) Unit for and method of motion estimation and image processing apparatus provided with such motion estimation unit
US20030067988A1 (en) Fast half-pixel motion estimation using steepest descent
US6611559B1 (en) Apparatus and method of detecting motion vectors by calculating a correlation degree between each candidate block
CN103096083B (zh) 一种运动图像补偿方法及装置
US11729424B2 (en) Visual quality assessment-based affine transformation
Kovačević et al. Block-matching correlation motion estimation for frame-rate up-conversion
KR100810391B1 (ko) 움직임 보간을 이용한 프레임 레이트 변환 방법
CN101572816B (zh) 视频处理方法与电影模式侦测方法
Park A sub-pixel motion estimation skipping method for fast HEVC encoding
WO2022257953A1 (en) Method, device, and medium for video processing
WO2022257954A1 (en) Method, device, and medium for video processing
WO2023040972A1 (en) Method, apparatus, and medium for video processing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication