CN1816146A - 一种视频数据压缩中的运动矢量估计方法 - Google Patents

一种视频数据压缩中的运动矢量估计方法 Download PDF

Info

Publication number
CN1816146A
CN1816146A CN 200510001652 CN200510001652A CN1816146A CN 1816146 A CN1816146 A CN 1816146A CN 200510001652 CN200510001652 CN 200510001652 CN 200510001652 A CN200510001652 A CN 200510001652A CN 1816146 A CN1816146 A CN 1816146A
Authority
CN
China
Prior art keywords
search
point
motion
vector
estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200510001652
Other languages
English (en)
Inventor
匡先锋
杜梅竹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN 200510001652 priority Critical patent/CN1816146A/zh
Publication of CN1816146A publication Critical patent/CN1816146A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明公开了一种视频数据压缩中的运动矢量估计方法,该方法包括:A.确定当前匹配块的运动矢量预测集,并根据该运动矢量预测集确定起始搜索点;B.以步骤A所确定的起始搜索点为中心开始低匹配精度搜索,在搜索到的最佳匹配点达到预先配置的低匹配精度搜索的目标门限时,停止搜索;C.以步骤B所述达到目标门限时的最佳匹配点为中心开始高匹配精度搜索,在搜索得到的最佳匹配点达到预先配置的运动矢量估计的目标门限时,停止搜索,并以该达到运动矢量估计目标门限时的最佳匹配点作为目标匹配点,得到当前匹配块的运动矢量。应用本发明方法能够减少运动矢量估计的运算复杂度,并能够保证图像质量。

Description

一种视频数据压缩中的运动矢量估计方法
技术领域
本发明涉及视频数据压缩中的运动估计技术,特别涉及一种视频数据压缩中的运动矢量估计方法。
背景技术
在多媒体应用中,为了保证多媒体数据的存储和实时处理,必须采用一些技术来降低多媒体数据的数据量,视频数据压缩则是其中关键技术之一。在多媒体视频信号的传输过程中,视频信号中存在的大量冗余数据,该冗余数据就是进行视频数据压缩的基础,其中,多媒体视频信号的冗余度存在于结构和统计两方面。
在结构方面,冗余度表现为很强的空间相关性和时间相关性。所谓空间相关性为帧内相关性,所谓时间相关性即指帧间相关性。这是因为通常,图像大部分区域的信号变化缓慢,尤其是背景部分几乎不变,所以视频信号在相邻象素间、相邻行间乃至相邻帧间存在较强的相关性,这种相关性就表现为空间冗余和时间冗余。
在统计方面,冗余度表现为人眼在观察图像时的局限性。由于,人眼对图像的细节分辨率、运动分辨率和对比度分辨率的感知都有一定限度,所以相当多的图像信息对于人眼来说是无关紧要的,即使没有这些信息,人眼也认为图像是完好无损的。因此,这些信息就是冗余信息,在满足一定图像质量的前提下,可以适当减少信号精度,实现数据压缩。
现在已广泛应用的图像压缩编码方法与标准中,主要利用三种手段对图像进行处理:一、利用离散余弦变换(DCT)和矢量量化消除帧内相关性;二、利用运动估计消除帧间相关性;三、利用熵编码消除图像数据编码带来的冗余。其中,运动估计是比较传统的消除帧间相关性的方法。所谓运动估计就是:对于当前图像帧的数据首先在参考帧搜索与其最匹配的区域,计算当前帧的数据相对于参考帧数据的运动矢量,然后对所述当前帧与参考帧运动矢量的差值进行编码。
目前有多种运动估计方法,很重要的一种就是块匹配法。在块匹配法中,每帧图像被划分为二维的N×N象素的子块,一般N为16,假定每个子块内的所有象素作相等的平移运动,当前帧的N×N子块在参考帧对应子块的邻域窗口内搜索与之最匹配的子块,当前子块与参考帧的匹配块在二维平面上的位移即为运动估计得到的运动矢量。
在块匹配法的搜索匹配子块方法中,比较常用的是全搜索法。全搜索法是对当前帧的每一个匹配块在参考帧的特定范围(通常为邻域)内计算每个点的块匹配值,该邻域内的每个点为匹配点,然后将块匹配值最小的匹配点作为最佳匹配点,最佳匹配点对应的运动矢量即为当前匹配块的运动矢量。所谓块匹配值通常指:在所述参考帧搜索范围内的匹配点对应的匹配块中,每一象素点与当前匹配块中对应位置象素点之间灰度差绝对值的总和,即绝对差和(SAD)。定义当前匹配块左上角象素点的坐标为(x,y);参考帧中的搜索窗口即邻域窗口为:当前匹配块左上角象素点(x,y)横坐标水平方向左右各偏移Wx,纵坐标垂直方向上下各偏移Wy,构成的矩形搜索窗口;该矩形搜索窗口包含的象素点个数为(2×Wx+1)×(2×Wy+1)。如下式(1)所示,所述SAD的计算方法为:
SAD ( MV → ) = Σ m , n = 0 M - 1 , N - 1 | I t ( x + m , y + n ) - I t - i ( x + m + v x , y + n + v y ) | - - - ( 1 )
式(1)中,M×N为当前匹配块的大小,当前匹配块的象素点坐标为(x+m,y+n),m和n分别为当前匹配块象素点相对于当前匹配块左上角象素点(x,y)水平方向和垂直方向的位移,It(x+m,y+n)为当前匹配块中象素点的亮度值函数,其中,m的取值范围为[0..M-1],n的取值范围为[0..N-1]。(vx,vy)为参考帧搜索窗口内象素点对应匹配块相对于当前匹配块的运动矢量,所述参考帧内匹配块的各象素点坐标为(x+m+vx,y+n+vy),It-i(x+m+vx,y+n+vy)为参考帧内匹配块的象素点(x+m+vx,y+n+vy)的亮度值函数,其中,vx的取值范围为[-Wx..+Wx],vy的取值范围为
Figure A20051000165200071
全搜索算法要在整个矩形搜索窗口范围内寻找最佳的匹配点,因而要求进行(2×Wx+1)×(2×Wy+1)次匹配。通常取Wx=Wy=16,则要进行1089次匹配运算,运算量相当大。
为了减少运动估计的复杂度,出现了许多改进的快速运动矢量估计算法。比如:被MPEG-4国际标准接纳的菱形搜索算法。该方法采用模板进行搜索,包括:大菱形和小菱形两种搜索模式。但是,该算法不足之处在于,对运动激烈的图像进行运动估计时图像质量的损失比较大,因而不适合于质量要求较高的图像编码。
可见,现有的运动矢量估计方法中,如果要保证图像质量就得采用匹配次数较多、运算量很大的全搜索等方法;如果要减少运算量,以较少匹配次数得到运动矢量,就不得不接受损失较大的图像质量。因此,现有技术不能将高质量图像和低匹配次数两方面因素有效结合起来实现运动矢量估计。
发明内容
有鉴于此,本发明的主要目的在于提供一种视频数据压缩中的运动矢量估计方法,能够以较少匹配次数得到运动矢量,并可以使图像质量损失较小。
为达到上述目的,本发明的技术方案是这样实现的:
一种视频数据压缩中的运动矢量估计方法,该方法包括:
A.确定当前匹配块的运动矢量预测集,并根据该运动矢量预测集确定起始搜索点;
B.以步骤A所确定的起始搜索点为中心开始低匹配精度搜索,在搜索到的最佳匹配点达到预先配置的低匹配精度搜索的目标门限时,停止搜索;
C.以步骤B所述达到目标门限时的最佳匹配点为中心开始高匹配精度搜索,在搜索得到的最佳匹配点达到预先配置的运动矢量估计的目标门限时,停止搜索,并以该达到运动矢量估计目标门限时的最佳匹配点作为目标匹配点,得到当前匹配块的运动矢量。
其中,在执行所述步骤C之前,该方法进一步包括:判断该低匹配精度搜索得到的最佳匹配点对应的块匹配值是否低于所述运动矢量估计的目标门限。
其中,在执行所述步骤B之前,该方法进一步包括:判断步骤A中所确定的起始搜索点对应的块匹配值是否低于所述运动矢量估计的目标门限。
其中,在执行所述步骤B之前,该方法进一步包括:判断步骤A中所确定的起始搜索点对应的块匹配值是否低于步骤B所述低匹配精度搜索的目标门限,如果是,则以该起始搜索点作为最佳匹配点执行步骤C;否则执行步骤B。
其中,在执行所述步骤B之前,该方法进一步包括:判断步骤A中所确定的起始搜索点对应的运动矢量是否为零,如果是,则以该起始搜索点作为最佳匹配点执行步骤C;否则执行步骤B。
步骤A中,所述确定起始搜索点的方法为:计算所述运动矢量预测集中各运动矢量对应匹配点的块匹配值,确定块匹配值为最小匹配点为起始搜索点。
其中,所述步骤B包括:以步骤A所确定的起始搜索点为中心进行首次低匹配精度搜索,每进行一次低匹配精度搜索时,确定本次搜索的各匹配点中块匹配值最小的点为最佳匹配点,并判断该最佳匹配点对应的块匹配值是否低于预先配置的低匹配精度搜索的目标门限,如果是,则停止搜索;否则以本次搜索的最佳匹配点为中心继续进行下一次低匹配精度搜索。
其中,所述步骤C包括:以步骤B所述达到目标门限时的最佳匹配点为中心进行首次高匹配精度搜索,每进行一次高匹配精度搜索时,确定本次搜索的各匹配点中块匹配值最小的点为最佳匹配点,并判断该最佳匹配点对应的块匹配值是否低于预先配置的运动矢量估计的目标门限,如果是,则停止搜索;否则以本次搜索的最佳匹配点为中心继续进行下一次高匹配精度搜索。
步骤B中,所述低匹配精度搜索为非对称十字搜索。
步骤C中,所述高匹配精度搜索为小菱形搜索。
步骤A中,所述运动矢量预测集中包括:与当前匹配块相邻的匹配块的运动矢量,该与当前匹配块相邻的匹配块至少包括:当前匹配块的左方、正上方、右上方匹配块。
步骤A中,所述运动矢量预测集中进一步包括:当前匹配块的左方、正上方、和右上方匹配块的运动矢量的中值;或者,参考帧中与当前匹配块对应的匹配块的运动矢量;或者,二者组合。
步骤A中,所述运动矢量预测集中进一步包括:根据参考帧的运动矢量进行全局运动估计得到的当前匹配块全局运动预测矢量。
步骤A中,所述全局运动估计得到全局运动预测矢量的方法为:根据参考帧的运动矢量进行全局运动估计得到参数矢量,根据该参数矢量得到当前匹配块的全局运动预测矢量;所述全局运动估计中,使用基于最大似然准则的简化M估计得到参数矢量。
步骤A中,所述全局运动估计模型为六参数平面仿射变换模型。
步骤A中,所述运动矢量预测集中进一步包括:零运动矢量。
由上述方案可以看出,本发明的关键在于:在确定了当前匹配块的起始搜索点之后,首先进行低匹配精度的搜索,如非对称十字搜索;然后,当低匹配精度搜索到的最佳匹配点达到低匹配精度搜索的目标门限时,再以当前最佳匹配点为中心进行高匹配精度搜索,如小菱形搜索;从而最终搜索到目标匹配点,并根据该目标匹配点得到当前匹配块的运动矢量。
因此,本发明所提供的视频数据压缩中的运动矢量估计方法,结合低匹配精度和高匹配精度搜索的优势,使低匹配精度搜索和高匹配精度搜索均在各自准确度较高的精度范围内进行搜索,能够以较少的匹配次数得到较为精确的运动矢量,进而以较少运算量获得较高的图像质量。另外,本发明方法还进一步通过粗略的全局运动估计得到当前匹配块的全局运动预测矢量作为当前运动矢量估计的预测值之一,这样充分考虑到运动估计中的时间相关性和空间相关性,使运动矢量的预测值更加逼近于中心矢量,进一步加快了匹配速度,并能保证运动矢量估计的准确性。
附图说明
图1为本发明方法一较佳实施例处理流程示意图;
图2为本发明方法另一较佳实施例处理流程示意图。
具体实施方式
下面结合附图及具体实施例对本发明再作进一步详细的说明。
本发明结合了低匹配精度搜索和高匹配精度搜索的优点来共同完成运动矢量估计,主要包括处理步骤:A.确定运动矢量预测集,并根据该运动矢量预测集确定起始搜索点;B.以该起始搜索点为中心开始进行低匹配精度搜索,并在搜索到的最佳匹配点达到预先配置的低匹配精度搜索的目标门限时停止搜索;C.以低匹配精度搜索得到的最佳匹配点为中心开始进行高匹配精度搜索,在搜索到的最佳匹配点达到预先配置的运动矢量估计的目标门限时停止搜索,并将该高匹配精度搜索到的最佳匹配点作为目标匹配点,得到当前匹配块的运动矢量。这里,所述低匹配精度搜索就是业界通常所称的粗略搜索,可以采用非对称十字搜索等方法进行粗略搜索,所述高匹配精度搜索就是业界通常所称的精细搜索,可以采用小菱形搜索等方法进行精细搜索,本文仅以采用非对称十字搜索和小菱形搜索方法为例对本发明方法进行详细阐述,但并不排除采用其它低匹配精度搜索方法和高匹配精度搜索方法来实现本发明的可能性。
其中,步骤A中所述确定运动矢量预测集的方式主要有两种:一、主要考虑帧内的空间相关性,则将当前帧内与当前匹配块相邻的匹配块对应的运动矢量加入运动矢量预测集;二、除考虑空间相关性之外,还进一步考虑帧间的时间相关性,则除了将当前帧内与当前匹配块相邻的匹配块对应的运动矢量加入运动矢量预测集之外,还基于参考帧运动估计的运动矢量进行全局运动估计得到当前匹配块全局运动预测矢量,并将该全局运动预测矢量加入到该运动矢量预测集,另外还可以进一步将参考帧中当前匹配块对应位置匹配块运动估计时得到的运动矢量也加入该运动矢量预测集。
这里,所述当前帧内与当前匹配块相邻的匹配块至少包括:与当前匹配块相邻的左方、正上方和右上方的匹配块。在应用上述两种确定运动矢量预测集的方式时,由于业界实验已证实:与当前匹配块相邻的左边、正上方和右上方的匹配块对应的三个运动矢量的中值矢量与当前匹配块的运动矢量具有更大的相关性,因此,在考虑帧内的空间相关性时还可以进一步将所述与当前匹配块相邻的左边、正上方和右上方的匹配块对应的三个运动矢量的中值矢量加入该运动矢量预测集;另外,考虑到运动矢量可能为零的情况,因此在确定运动矢量预测集时,还可以进一步将零矢量加入该运动矢量预测集。
由以上描述可见,针对不同的图像处理需求,运动矢量预测集的确定方法有多种,因此该运动矢量预测集中所包含的运动矢量也有多种组合情况,本发明对此并不限定。如果采用上述第二种运动矢量预测集的确定方式,该运动矢量预测集应包含所述当前匹配块的全局运动预测矢量,则必须首先基于参考帧运动估计的运动矢量进行全局运动估计来得到该全局运动预测矢量。下面以采用所述第二种方式确定运动矢量预测集为例,对本发明方法加以详细说明。
图1为本发明方法一较佳实施例处理流程示意图。本实施例中,在确定运动矢量预测集时充分考虑了运动矢量的时间相关性和空间相关性。该所确定的运动矢量预测集S1如式(2)所示:
S 1 = { MV i → | MV median → , MV GM → , ( 0,0 ) → , MV left → , MV top → , MV top _ right → , MV ref → } - - - ( 2 )
其中, 分别表示与当前匹配块相邻的左方、正上方和右上方匹配块的运动矢量, 为当前匹配块的全局运动预测矢量,
Figure A20051000165200124
为所述参考帧中当前匹配块对应位置的匹配块运动估计时得到的运动矢量,
Figure A20051000165200125
为所述 的中值矢量,其计算方法为: MV median → = Median ( MV left → , MV top → , MV top _ right → ) . 这里,在进行图像处理时,当前帧能够得到参考帧运动估计时得到的每一个匹配块的运动矢量,具体如何得到属公知技术,本文不作描述。
如图1所示,具体处理包括:
步骤101:基于参考帧运动估计得到的运动矢量进行全局运动估计,得到当前匹配块的全局运动预测矢量。
其中,本发明采用的全局运动估计模型为六参数的平面仿射变换模型,该模型能够表示二维图像的平移、旋转等运动,具体全局运动估计过程简述如下:
设定当前帧象素点坐标为(x,y),参考帧对应位置的象素点坐标为(x′,y′),则从(x,y)到(x′,y′)的仿射变换表示为:x′=a1+a2x+a3y、y′=b1+b2x+b3y,其中,参数矢量为P=(a1,a2,a3,b1,b2,b3,)T
则第n个匹配块的运动矢量如式(3)所示:
v ( n ) = v x ( n ) v y ( n ) = x ′ ( n ) - x ( n ) y ′ ( n ) - y ( n ) = a 1 + a 2 x ( n ) + a 3 y ( n ) - x ( n ) b 1 + b 2 x ( n ) + b 3 y ( n ) + y ( n ) - - - ( 3 )
由于,v(n)是相对坐标,将其转化为绝对坐标表示为:
v x ( n ) + x ( n ) v y ( n ) + y ( n ) = 1 x ( n ) y ( n ) 0 0 0 0 0 0 1 x ( n ) y ( n ) · a 1 a 2 a 3 b 1 b 2 b 3 T - - - ( 4 )
又由于,式(3)对于帧内每一个匹配块均成立,因此根据式(4)可以得到:V=H·P
其中, V = v x ( 1 ) + x ( 1 ) v y ( 1 ) + y ( 1 ) · · · v x ( n ) + x ( n ) v y ( n ) + y ( n ) , H = 1 x ( 1 ) y ( 1 ) 0 0 0 0 0 0 1 x ( 1 ) y ( 1 ) · · · · · · · · · · · · · · · · · · 1 x ( n ) y ( n ) 0 0 0 0 0 0 1 x ( n ) y ( n )
因此,基于最小均方准则,可以估计得到最佳的参数矢量为:P=(HT·H)-1·HT·V。
但是,在基于块匹配的视频编码器中,由于人为的将图像分为宏块即上述的匹配块,造成计算出来的宏块的运动矢量并不是真正物体的运动矢量,比如:在图像的边缘计算出来的宏块的运动矢量就偏离真正图像物体的运动方向较大。因此,在采取最小均方误差进行估计时,这些矢量将对估计会产生很大的影响。
本发明为了避免最小均方准则估计将带来的较大误差,减少个别运动矢量对整个估计的影响,采取基于最大似然准则的简化M-估计(M-estimator)。
其中,定义: δ ( n ) ( k ) = a 1 ( k ) + a 2 ( k ) x ( n ) + a 3 ( k ) y ( n ) - x ( n ) b 1 ( k ) + b 2 ( k ) x ( n ) + b 3 ( k ) y ( n ) - y ( n ) 为第k次迭代估计得到的运动矢量,定义第k次迭代的误差为: ϵ ( n ) = | v x ( n ) - δ x ( n ) | + | v y ( n ) - δ y ( n ) | . 则每次迭代的方差用绝对误差和通过式(5)可以求得:
σ ϵ = 1 N * 0.6745 Σ n ϵ ( n ) - - - ( 5 )
另外,为了减少运算量,误差权重ω(n)(n))简化为式(6):
&omega; ( &epsiv; ) = 1 &epsiv; < c &sigma; &epsiv; 0 &epsiv; > c &sigma; &epsiv; - - - ( 6 )
其中,c为调整常数(Tuning Constant)。因而最终估计最佳参数矢量为:P=(HT·W·H)-1·HT·W·V。
其中, W = &omega; ( 1 ) 0 0 0 0 0 &omega; ( 1 ) 0 0 0 &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; 0 0 0 &omega; ( n ) 0 0 0 0 0 &omega; ( n )
根据上述估计得到的参数矢量P,可以进一步得到当前匹配块的全局运动预测矢量
Figure A20051000165200141
这里,对于帧内的每一个匹配块,在参数矢量P的基础上,能够得到全局运动预测矢量,其具体计算过程属公知技术,本文不作详述。
步骤102:将步骤101所估计得到的 与当前匹配块相邻的匹配块的运动矢量,包括:
Figure A20051000165200145
等,以及所述
Figure A20051000165200147
Figure A20051000165200148
加入运动矢量预测集,得到式(2)所示的运动矢量预测集S1
步骤103:计算步骤102所述S1中各运动矢量对应匹配点的块匹配值,选择块匹配值最小的匹配点作为起始搜索点。
其中,所述块匹配值即为背景技术所述SAD值,其计算方法如式(1)所示,这里不作详述。
步骤104:以步骤103所确定的起始搜索点为中心开始做首次宽度为W的非对称十字搜索。
其中,非对称十字搜索的一次搜索通常会搜索到一个以上的匹配点,关于具体一次搜索到几个匹配点在搜索之前预先配置,本发明并不限定一次搜索到的匹配点的数量。
这里,非对称十字搜索得到的匹配点集合S2表示如下:
S 2 = ( x , 0 ) x = &PlusMinus; 1 , &PlusMinus; 3 , &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; , W - 1 ( 0 , y ) y = &PlusMinus; 1 , &PlusMinus; 3 , &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; , W 2 - 1
其中,所述搜索宽度W的取值从理论上为2n,本实施例中,W设置为8,通常W也可以设置为16,但本发明并不限定W的具体取值。
步骤105:确定本次搜索到的最佳匹配点,判断该最佳匹配点的SAD值是否小于当前非对称十字搜索的目标门限T2,如果是,执行步骤107;否则执行步骤106。
其中,所述确定搜索到的最佳匹配点的方法为:计算本次搜索得到的各匹配点的SAD值,将SAD值最小的匹配点作为最佳匹配点。
步骤106:以步骤105所述SAD值最小的最佳匹配点为中心继续做下一次宽度为W的非对称十字搜索,返回步骤105。
步骤107:以步骤105所述SAD值最小的最佳匹配点为中心开始进行首次小菱形搜索。
其中,小菱形搜索一次搜索得到的匹配点为:在一定的搜索半径内,本次搜索中心周围的四个象素点。通常将小菱形搜索的半径配置为1,但本发明并不限定小菱形搜索半径的具体取值。
步骤108:计算本次搜索得到的各匹配点的SAD值,将SAD值最小的匹配点确定为最佳匹配点,并判断该最小SAD值是否小于小菱形搜索的目标门限T1,如果是,将该SAD值最小的匹配点作为目标匹配点得到当前匹配块的运动矢量,结束当前处理;否则执行步骤109。
其中,所述非对称十字搜索的目标门限T2即为低匹配精度搜索目标门限,所述小菱形搜索的目标门限T1即为整个运动矢量估计的目标门限;所述T1和T2预先进行配置,其具体取值可以根据经验值、或通过预先的仿真测试得到,本发明对此不作限定。
步骤109:以步骤108所述SAD值最小的最佳匹配点为中心继续做下一次小菱形搜索,返回步骤108。
图1所述的实施例中,充分利用非对称十字搜索在低匹配精度范围搜索时的准确性和小菱形搜索在高匹配精度范围搜索时的优势,并且此两种搜索方法的共同优点为:匹配次数少、匹配速度快。因此,本实施例通过较少次数的匹配就能以高准确度搜索得到运动矢量。
另外,本实施例考虑到帧间的时间相关性,将基于全局运动估计得到的
Figure A20051000165200151
作为运动矢量的预测值之一,进一步加强了中心矢量预测的准确性。这是由于:在运动比较激烈的图象中,通过模板搜索的方法取逼近中心矢量的方式比较耗费搜索时间,而粗略的全局运动估计的方法却适用于任何运动类型的场合,同时也能够比较精确的逼近中心矢量。
此外,考虑到步骤103所确定的起始搜索点的SAD值有可能已经小于非对称十字搜索的目标门限T2,此时,不必进行首次非对称十字搜索就可以直接开始小菱形搜索。另外,有些情况下,所述起始搜索点的SAD值甚至于已经小于运动矢量估计的目标门限T1,则可以不必进行任何搜索,直接确定该起始搜索点为目标匹配点得到当前匹配块的运动矢量。这样,将使运动矢量估计的运算量进一步减少,并更快得到当前匹配块的运动矢量。
基于此种思想,这里提供了另外一实施例。图2为本发明方法另一较佳实施例处理流程示意图。图2所述步骤201至步骤209,对应的,与图1所述步骤101至109基本相同;所不同的是:图2中步骤203与步骤204之间还包括步骤203a,并且步骤205的判断与步骤105的判断略有差别。如图2所示,具体处理为:
步骤201:基于参考帧运动估计得到的运动矢量进行全局运动估计,得到当前匹配块的全局运动预测矢量
Figure A20051000165200161
步骤202:将步骤201所估计得到的
Figure A20051000165200162
与当前匹配块相邻的匹配块的运动矢量,包括:
Figure A20051000165200164
等,以及所述
Figure A20051000165200166
加入运动矢量预测集,得到式(2)所示的运动矢量预测集S1
步骤203:计算步骤202所述S1中的各运动矢量对应匹配点的SAD值,选择SAD值最小的匹配点作为起始搜索点。
步骤203a:判断步骤203所述起始搜索点对应的SAD值:如果小于T1,则将该起始搜索点作为目标匹配点得到当前匹配块的运动矢量,结束当前处理;如果大于等于T1且小于T2,则执行步骤207;如果大于等于T2,则执行步骤204。
由于,非对称十字搜索得到的是低精度范围的匹配点,其块匹配值肯定要大于整个运动矢量估计得到的目标匹配点的块匹配值。因此,配置运动矢量估计的目标门限T1和非对称十字搜索的目标门限T2时,T1也要小于T2,则对于除小于T1、和大于等于T1且小于T2之外的情况,即为:大于等于T2。
另外,针对不同图像的处理,起始搜索点可能出现的SAD取值会有差异,因此本步骤也可以为:判断起始搜索点对应的SAD值是否小于T1,如果是,则将该起始搜索点作为目标匹配点得到当前匹配块的运动矢量,结束当前处理;否则执行步骤204;或者,判断起始搜索点对应的SAD值是否小于T2,如果是,则执行步骤207;否则执行步骤204。总之,不管本步骤进行的是何种判断,目的都在于在可能的情况下不进行运动矢量搜索,从而从整体上进一步减少运算次数,提高运动矢量估计的效率。
步骤204:以步骤203所确定的起始搜索点为中心开始做首次宽度为W的非对称十字搜索。
步骤205:确定本次搜索到的最佳匹配点,判断该最佳匹配点的SAD值:如果小于T1,则将该最佳匹配点作为目标匹配点得到当前匹配块的运动矢量;如果大于等于T1且小于T2,则执行步骤207;如果大于等于T2,则执行步骤206。
本步骤同样考虑到非对称十字搜索到的最佳匹配点对应SAD值可能已经小于运动矢量估计的目标门限T1,则不必进行下一步的小菱形搜索,也就进一步减少的匹配次数,使运动矢量估计更加高效。当然,对某些图像进行处理时,也可能会预见到在本步骤中,最佳匹配点的SAD值不可能小于T1,则本步骤205的处理也可以与上述步骤105相同,即仅判断该最佳匹配点的SAD值是否小于当前非对称十字搜索的目标门限T2,如果是,执行步骤207;否则执行步骤206。。
步骤206:以步骤205所述最小SAD值对应的匹配点为中心继续做下一次宽度为W的非对称十字搜索,返回步骤205。
步骤207:以步骤205所述最佳匹配点为中心开始进行首次小菱形搜索。
步骤208:计算本次搜索得到的各匹配点的SAD值,将SAD值最小的匹配点确定为最佳匹配点,并判断该最小SAD值是否小于T1,如果是,将该SAD值最小的最佳匹配点作为目标匹配点得到当前匹配块的运动矢量,结束当前处理;否则执行步骤209。
步骤209:以步骤208所述最佳匹配点为中心继续做下一次小菱形搜索,返回步骤208。
此外,考虑到如果该起始搜索点对应的矢量为 就说明当前匹配块相对于参考帧对应位置的匹配块来说位移较小,则应直接进行高匹配精度的小菱形搜索。因此,在执行上述步骤204之前还可以进一步执行步骤203b:判断该起始搜索点对应的矢量是否为
Figure A20051000165200182
如果是,执行步骤207;否则执行步骤204。
值得一提的是,图2所示实施例在MPEG-2MSSG测试平台的开放源代码上已完成测试,并取得了预期效果。其中,选择了具有代表性的从缓慢运动到剧烈运动的图像测试序列。测试结果表明:相对于MSSG的快速全搜索算法,采用本算法可以使得运算量降低90%以上,视频重建质量下降平均在0.02dB左右,最坏的情况下也只下降0.06dB。由此可见本发明在减少匹配次数、提高搜索速度的同时,能够保证较好的视频重建图像质量。
上述图1和图2所述的实施例中采用所述第二种方式确定运动矢量预测集,该运动矢量预测集中包含全局运动预测矢量 如果采用所述第一种方式确定运动矢量预测集,本发明的处理与图1和图2所示的处理步骤基本相同,所不同的仅仅在于:所确定的运动矢量预测不包含全局运动预测矢量 也就不必首先进行全局运动估计得到全局运动预测矢量 也就是说:不必执行上述步骤101和步骤201,并且,步骤102和步骤202中,不必将全局运动预测矢量 加入运动矢量预测集。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (16)

1、一种视频数据压缩中的运动矢量估计方法,其特征在于,该方法包括:
A.确定当前匹配块的运动矢量预测集,并根据该运动矢量预测集确定起始搜索点;
B.以步骤A所确定的起始搜索点为中心开始低匹配精度搜索,在搜索到的最佳匹配点达到预先配置的低匹配精度搜索的目标门限时,停止搜索;
C.以步骤B所述达到目标门限时的最佳匹配点为中心开始高匹配精度搜索,在搜索得到的最佳匹配点达到预先配置的运动矢量估计的目标门限时,停止搜索,并以该达到运动矢量估计目标门限时的最佳匹配点作为目标匹配点,得到当前匹配块的运动矢量。
2、根据权利要求1所述的方法,其特征在于,在执行所述步骤C之前,该方法进一步包括:判断该低匹配精度搜索得到的最佳匹配点对应的块匹配值是否低于所述运动矢量估计的目标门限。
3、根据权利要求1或2所述的方法,其特征在于,在执行所述步骤B之前,该方法进一步包括:判断步骤A中所确定的起始搜索点对应的块匹配值是否低于所述运动矢量估计的目标门限。
4、根据权利要求3所述的方法,其特征在于,在执行所述步骤B之前,该方法进一步包括:判断步骤A中所确定的起始搜索点对应的块匹配值是否低于步骤B所述低匹配精度搜索的目标门限,如果是,则以该起始搜索点作为最佳匹配点执行步骤C;否则执行步骤B。
5、根据权利要求4所述的方法,其特征在于,在执行所述步骤B之前,该方法进一步包括:判断步骤A中所确定的起始搜索点对应的运动矢量是否为零,如果是,则以该起始搜索点作为最佳匹配点执行步骤C;否则执行步骤B。
6、根据权利要求1所述的方法,其特征在于,步骤A中,所述确定起始搜索点的方法为:计算所述运动矢量预测集中各运动矢量对应匹配点的块匹配值,确定块匹配值为最小匹配点为起始搜索点。
7、根据权利要求1所述的方法,其特征在于,所述步骤B包括:以步骤A所确定的起始搜索点为中心进行首次低匹配精度搜索,每进行一次低匹配精度搜索时,确定本次搜索的各匹配点中块匹配值最小的点为最佳匹配点,并判断该最佳匹配点对应的块匹配值是否低于预先配置的低匹配精度搜索的目标门限,如果是,则停止搜索;否则以本次搜索的最佳匹配点为中心继续进行下一次低匹配精度搜索。
8、根据权利要求1所述的方法,其特征在于,所述步骤C包括:以步骤B所述达到目标门限时的最佳匹配点为中心进行首次高匹配精度搜索,每进行一次高匹配精度搜索时,确定本次搜索的各匹配点中块匹配值最小的点为最佳匹配点,并判断该最佳匹配点对应的块匹配值是否低于预先配置的运动矢量估计的目标门限,如果是,则停止搜索;否则以本次搜索的最佳匹配点为中心继续进行下一次高匹配精度搜索。
9、根据权利要求1、2、6、7或8所述的方法,其特征在于,步骤B中,所述低匹配精度搜索为非对称十字搜索。
10、根据权利要求1、2、6、7或8所述的方法,其特征在于,步骤C中,所述高匹配精度搜索为小菱形搜索。
11、根据权利要求1所述的方法,其特征在于,步骤A中,所述运动矢量预测集中包括:与当前匹配块相邻的匹配块的运动矢量,该与当前匹配块相邻的匹配块至少包括:当前匹配块的左方、正上方、右上方匹配块。
12、根据权利要求11所述的方法,其特征在于,步骤A中,所述运动矢量预测集中进一步包括:当前匹配块的左方、正上方、和右上方匹配块的运动矢量的中值;或者,参考帧中与当前匹配块对应的匹配块的运动矢量;或者,二者组合。
13、根据权利要求11或12所述的方法,其特征在于,步骤A中,所述运动矢量预测集中进一步包括:根据参考帧的运动矢量进行全局运动估计得到的当前匹配块全局运动预测矢量。
14、根据权利要求13所述的方法,其特征在于,步骤A中,所述全局运动估计得到全局运动预测矢量的方法为:根据参考帧的运动矢量进行全局运动估计得到参数矢量,根据该参数矢量得到当前匹配块的全局运动预测矢量;所述全局运动估计中,使用基于最大似然准则的简化M估计得到参数矢量。
15、根据权利要求13所述的方法,其特征在于,步骤A中,所述全局运动估计模型为六参数平面仿射变换模型。
16、根据权利要求11或12所述的方法,其特征在于,步骤A中,所述运动矢量预测集中进一步包括:零运动矢量。
CN 200510001652 2005-02-03 2005-02-03 一种视频数据压缩中的运动矢量估计方法 Pending CN1816146A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200510001652 CN1816146A (zh) 2005-02-03 2005-02-03 一种视频数据压缩中的运动矢量估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200510001652 CN1816146A (zh) 2005-02-03 2005-02-03 一种视频数据压缩中的运动矢量估计方法

Publications (1)

Publication Number Publication Date
CN1816146A true CN1816146A (zh) 2006-08-09

Family

ID=36908064

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200510001652 Pending CN1816146A (zh) 2005-02-03 2005-02-03 一种视频数据压缩中的运动矢量估计方法

Country Status (1)

Country Link
CN (1) CN1816146A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101867812A (zh) * 2010-04-16 2010-10-20 中山大学 一种利用边缘效应进行运动预测的视频数据压缩运动估计方法
CN102075760A (zh) * 2010-10-27 2011-05-25 无锡中星微电子有限公司 快速运动估计方法及装置
CN102378009A (zh) * 2011-11-14 2012-03-14 清华大学深圳研究生院 一种视差估计快速算法
CN102868879A (zh) * 2011-07-05 2013-01-09 北京大学 一种视频帧速率上转换方法及系统
CN105741257A (zh) * 2014-12-09 2016-07-06 联想(北京)有限公司 一种信息处理方法及电子设备

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101867812A (zh) * 2010-04-16 2010-10-20 中山大学 一种利用边缘效应进行运动预测的视频数据压缩运动估计方法
CN101867812B (zh) * 2010-04-16 2012-05-30 中山大学 一种利用边缘效应进行运动预测的视频数据压缩运动估计方法
CN102075760A (zh) * 2010-10-27 2011-05-25 无锡中星微电子有限公司 快速运动估计方法及装置
CN102075760B (zh) * 2010-10-27 2012-11-21 无锡中星微电子有限公司 快速运动估计方法及装置
CN102868879A (zh) * 2011-07-05 2013-01-09 北京大学 一种视频帧速率上转换方法及系统
CN102868879B (zh) * 2011-07-05 2015-04-29 北京大学 一种视频帧速率上转换方法及系统
CN102378009A (zh) * 2011-11-14 2012-03-14 清华大学深圳研究生院 一种视差估计快速算法
CN105741257A (zh) * 2014-12-09 2016-07-06 联想(北京)有限公司 一种信息处理方法及电子设备
CN105741257B (zh) * 2014-12-09 2018-08-31 联想(北京)有限公司 一种信息处理方法及电子设备

Similar Documents

Publication Publication Date Title
CN110087087B (zh) Vvc帧间编码单元预测模式提前决策及块划分提前终止方法
CN1675848A (zh) 用于执行高质量快速预测运动搜索的方法和设备
CN1215439C (zh) 执行可缩放的分层运动估算的装置与方法
CN1193620C (zh) 视频编码器的运动估计方法及系统
CN1835594A (zh) 在计算机上执行运动矢量检测处理的检测方法以及装置
CN1183489C (zh) 运动估计和模式判定的设备及其方法
CN1874519A (zh) 使用视频对称的帧内预测方法和设备及编解码方法及设备
CN1719901A (zh) 基于运动估计多分辨率方法及存储执行其程序的记录介质
CN1925617A (zh) 提高的运动估计、视频编码方法及使用所述方法的设备
CN1465193A (zh) 图像编码装置、图像译码装置、图像编码方法和图像译码方法
CN1906948A (zh) 利用旋转匹配预测运动的图像编码设备和方法
CN1756366A (zh) 视频编码
CN104067619A (zh) 视频解码器、视频编码器、视频解码方法以及视频编码方法
CN1610410A (zh) 帧内预测方法及装置
CN1258925C (zh) 多视角视频编解码预测补偿方法及装置
CN1885948A (zh) 视频编码的运动矢量空间预测方法
CN1236624C (zh) 多种块模式的快速整像素运动估计方法
CN1917642A (zh) 迭代计算全局运动参数集的方法和设备
CN1956547A (zh) 运动矢量检测装置及运动矢量检测方法
CN1794816A (zh) 运动图像压缩编码方法、运动图像压缩编码装置以及程序
CN1144469C (zh) 编码和解码图像中的像素的运动向量的方法
CN1604653A (zh) 差分编码方法
CN1816146A (zh) 一种视频数据压缩中的运动矢量估计方法
CN101056398A (zh) 一种多视编码过程中获取视差矢量的方法及编解码方法
CN1320830C (zh) 噪声估计方法和设备、以及利用其编码视频的方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication