CN102123283A - 视频帧率转换中的插值帧获取方法及其装置 - Google Patents

视频帧率转换中的插值帧获取方法及其装置 Download PDF

Info

Publication number
CN102123283A
CN102123283A CN2011100580130A CN201110058013A CN102123283A CN 102123283 A CN102123283 A CN 102123283A CN 2011100580130 A CN2011100580130 A CN 2011100580130A CN 201110058013 A CN201110058013 A CN 201110058013A CN 102123283 A CN102123283 A CN 102123283A
Authority
CN
China
Prior art keywords
fritter
interpolation
motion vector
bulk
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011100580130A
Other languages
English (en)
Other versions
CN102123283B (zh
Inventor
查林
黄崇基
俞海
贾永华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Software Co Ltd filed Critical Hangzhou Hikvision Software Co Ltd
Priority to CN 201110058013 priority Critical patent/CN102123283B/zh
Publication of CN102123283A publication Critical patent/CN102123283A/zh
Application granted granted Critical
Publication of CN102123283B publication Critical patent/CN102123283B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Systems (AREA)

Abstract

本发明涉及视频处理领域,公开了一种视频帧率转换中的插值帧获取方法及其装置。本发明中,将待求的插值帧划分成若干个大块,首先对大块进行双边运动向量估计,然后将大块分解为若干插值小块,以大块的运动向量为预测值,进行插值小块的双边运动向量估计。在得到整帧的插值小块的运动向量后,根据插值小块的运动向量进行插值,最终得到插值帧。通过分级估计出需要插值块的运动向量,可以提高插值块的运动向量准确度,更好地减少“背景取代物体”错误,从而保证插值帧图像质量高,视觉效果更好。而且,基于分级搜索,会带来更小的运算量,适合实时处理高清视频。

Description

视频帧率转换中的插值帧获取方法及其装置
技术领域
本发明涉及视频处理领域,特别涉及视频处理领域中的视频帧率转换技术。
背景技术
近年来,LCD显示器的应用越加广泛,但其缺陷是在显示动态画面时存在“拖尾”现象,造成动态物体解析度下降。其主要原因是LCD的保持显示特性:由于LCD的每一个像素在一帧时间内一直保持其亮度,持续作用于观看者的双眼,而人的双眼又具有视觉惰性,当LCD的画面切换到下一帧时,人眼仍暂留有上一帧画面的内容,从而产生“拖尾”现象。
目前解决“拖尾”现象较为常见的方法是提升帧频,即在原始相邻两帧之间插入一帧或多帧,这样,每个像素的发光时间缩短,相应地也就缩短了一帧图像对人眼的持续作用时间,减弱了人眼的视觉暂留,提高了动态解析度。
帧率转换中插值帧获取的方法主要包括两类,第一类是不考虑图像中物体的运动,非运动补偿的方法,如帧复制或帧平均。帧复制是指新插入的帧直接复制前一帧数据。帧平均是指新插入的帧使用前后两帧的平均值。这种方法实现简单,但在物体运动区域,会存在模糊现象;第二类是考虑物体的运动,运动补偿的方法,利用线性或非线性插值来完成插值帧。由于考虑了运动信息,因而具有较好的图像质量,然而运动估计容易产生错误,所以准确的运动估计,运动补偿算法直接影响了帧率转换的性能。
具体地说,目前主要有以下几种实现插帧的方法:
(1)直接拷贝原始帧,或者采用两帧的均值。然而,该方法由于不进行运动估计,会造成插值帧运动模糊,因此帧率转换效果差。
(2)直接从解码信息中获得运动向量(Motion Vector,简称“MV”)信息,利用或修正此MV,然后使用重叠块运动补偿(Overlapped BlockMotion Compensation,简称“OBMC”)等方法进行插值。分为以下步骤:
步骤一,获取MV:如果当前帧是P帧,直接从码流信息中获取MV。
如果当前帧是I帧,取前一帧获取的MV;如果当前宏块是I宏块,取周围不为I宏块的MV。
步骤二,对MV进行分类:使用绝对差值和(Sum of AbsoluteDifference,简称“SAD”)的方法对MV进行分类,如果小于特定阈值T,则合理,作为插值帧的MV;如果大于特定阈值T,则不合理,需要使用周围宏块的MV,选取周围宏块MV的原则为最小SAD。
然而,该方法应用不灵活,必须需要解码MV信息。而且准确度不高,插值帧容易出现瑕疵(因为对于不合理的MV,需要使用周围宏块的MV,但周围宏块有可能没有合理的MV;另外,即使SAD足够小,也不一定是合理MV,会出现“背景取代物体”的错误)。
(3)单边运动估计:计算前向MV,或者后向MV,然后再进行插帧。
然而,该方法在映射到插值帧MV时,有“空洞”或者“重叠”现象,并且此现象较难解决。
(4)双边运动估计,即以插值帧作为中心对称点,对称搜索MV,然后进行插帧,这样可以保证插值帧MV不会出现“空洞”或者“重叠”现象。可以求出更加准确的运动向量,获得更好质量的插值帧。但由于插值帧的不存在性,双边运动估计也会产生错误,其中最突出的就是“背景取代物体”错误;并且随着高清视频的普及,双边运动估计的运算量也进一步增大。
发明内容
本发明的目的在于提供一种视频帧率转换中的插值帧获取方法及其装置,以有效减少“背景取代物体”错误,并且避免巨大的运算量。
为解决上述技术问题,本发明的实施方式提供了一种视频帧率转换中的插值帧获取方法,包含以下步骤:
将待求的插值帧划分成L个大块,对每一个大块,执行以下步骤:
根据输入视频的当前帧和前一帧,对大块进行双边运动向量估计,得到大块的运动向量;
将大块分解为P个插值小块,以该大块的运动向量为预测值,对分解该大块后得到的各插值小块进行双边运动向量估计,得到各插值小块的运动向量;
在求得整帧的插值小块的运动向量后,根据得到的整帧的插值小块的运动向量进行插值,得到待求的插值帧;
其中,L、P均为自然数。
本发明的实施方式还提供了一种视频帧率转换中的插值帧获取装置,包含:
大块划分模块,用于将待求的插值帧划分成L个大块;
大块运动向量估计模块,用于对每一个大块,根据输入视频的当前帧和前一帧,对大块进行双边运动向量估计,得到大块的运动向量;
大块分解模块,用于将每一个大块分解为P个插值小块;
插值小块运动向量估计模块,用于以插值小块所属的大块的运动向量为预测值,对各插值小块进行双边运动向量估计,得到各插值小块的运动向量;
插值模块,用于在插值小块运动向量估计模块求得整帧的插值小块的运动向量后,根据得到的整帧的插值小块的运动向量进行插值,得到待求的插值帧;
其中,L、P均为自然数。
本发明实施方式与现有技术相比,主要区别及其效果在于:
将待求的插值帧划分成若干个大块,首先对大块进行双边运动向量估计,然后将大块分解为若干插值小块,以大块的运动向量为预测值,进行插值小块的双边运动向量估计。在得到整帧的插值小块的运动向量后,然后根据插值小块的MV进行插值,最终得到插值帧。通过分级估计出需要插值块的运动向量,可以提高插值块的运动向量准确度,更好地减少“背景取代物体”错误,从而保证插值帧图像质量高,视觉效果更好。而且,基于分级搜索,会带来更小的运算量,适合实时处理高清视频。
进一步地,对大块进行双边运动向量估计时,在大块的搜索范围内,对称地在当前帧和前一帧中进行大块匹配计算,并将计算到的最匹配的大块的运动向量作为所求的大块的运动向量。其中,大块的搜索范围通过以下方式确定:判断在大块周围的插值小块的运动向量的均值是否小于第一阈值T1,如果小于T1,则选用第一搜索范围S1;如果大于或等于T1,则选用第二搜索范围S2。对插值小块进行双边运动向量估计时,在插值小块的搜索范围内,对称地在当前帧和前一帧中进行插值小块匹配计算,并将计算到的最匹配的插值小块的运动向量作为所求的插值小块的运动向量。其中,插值小块的搜索范围通过以下方式确定:如果周围的插值小块运动向量的均值,与待求运动向量的插值小块所属大块的运动向量的差值小于第二阈值T2,则选用第三搜索范围S3;如果大于或等于T2,则选用第四搜索范围S4。通过动态改变搜索范围的方式,通过利用周围已计算的插值小块的运动向量,来动态选择当前块的搜索范围,可以在正确的搜索范围内搜索最优运动向量,避免错误,提高图像质量,提高视觉效果。而且,动态调节搜索范围,对于相对静止的大块运动估计,和预测值较准的插值小块运动估计,都会分配较小的搜索范围,从而减少运算量,缩短运算时间。
进一步地,采用快速搜索方式进行大块匹配计算和插值小块匹配计算,能进一步减少运算量,缩短运算时间。
进一步地,在分级双边运动估计中,大块块匹配使用SASD准则,不但减少计算量,而且减少噪声干扰;在插值小块块匹配使用SAD准则,能增加准确性。有利于图像质量,有利于减少实时处理高清视频。
附图说明
图1是根据本发明第一实施方式的视频帧率转换中的插值帧获取方法流程图;
图2是根据本发明第二实施方式中的双边运动估计示意图;
图3是根据本发明第二实施方式中的SASD分块方式示意图;
图4是根据本发明第二实施方式中的大块和周围的插值小块的位置关系示意图;
图5是根据本发明第二实施方式中进行分级双边运动估计的步骤细化流程图;
图6是根据本发明第二实施方式中的3*3运动向量滤波示意图;
图7是根据本发明第二实施方式中的采用OBMC插值的示意图;
图8是根据本发明第三实施方式的视频帧率转换中的插值帧获取装置结构示意图。
具体实施方式
在以下的叙述中,为了使读者更好地理解本申请而提出了许多技术细节。但是,本领域的普通技术人员可以理解,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请各权利要求所要求保护的技术方案。
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的实施方式作进一步地详细描述。
本发明第一实施方式涉及一种视频帧率转换中的插值帧获取方法,具体流程如图1所示。
在步骤110中,进行分级双边运动估计,估计出需要的插值小块的MV。具体地说,将待求的插值帧划分成L个大块(L为自然数),例如大块的尺寸为64*64像素,那么1024*768的图像就可以分成16*12个大块。对每一个大块进行以下操作:
根据输入视频的当前帧和前一帧,对大块进行双边运动向量估计,得到大块的运动向量(MV_Large)。
将大块分解为P个插值小块(P为自然数),以该大块的运动向量为预测值,对分解该大块后得到的各插值小块进行双边运动向量估计,得到各插值小块的运动向量(MV_Small)。
在求得整帧的插值小块的MV后,进入步骤120,对整帧的插值小块的运动向量的正确性进行检测,对错误的插值小块的运动向量进行修正。
接着,在步骤130中,判断错误的插值小块的运动向量的个数是否小于预设门限值,如果小于该预设门限值,则进入步骤140,根据得到的插值小块的运动向量,进行插值;如果大于或等于该预设门限值,则进入步骤150,直接进行帧复制,将得到的复制帧作为待求的插值帧输出。
在本实施方式中,通过分级估计出需要插值块的运动向量,可以提高插值块的运动向量准确度,更好地减少“背景取代物体”错误,从而保证插值帧图像质量高,视觉效果更好。而且,基于分级搜索,会带来更小的运算量,适合实时处理高清视频。
本发明第二实施方式涉及一种视频帧率转换中的插值帧获取方法。第二实施方式在第一实施方式的基础上进行了改进,主要改进之处在于:本实施方式中不仅采用分级的方式进行双边运动估计,而且在运动向量估计时,动态的改变搜索范围,以进一步提高图像质量,提高视觉效果,同时进一步减少运算量,缩短运算时间。另外,本实施方式也在第一实施方式的基础上,进行了细节上的补充。
具体地说,在本实施方式中,在步骤110中,通过以下方式,根据输入视频的当前帧和前一帧,对插值帧的某大块进行双边运动向量估计:
在大块的搜索范围内,以大块坐标为中心,对称地在当前帧f(n)和前一帧f(n-1)中进行大块匹配计算,采用的块匹配准则是绝对子块差值和(Sum ofAbsolute Sub-block Differences,简称“SASD”),如图2所示。并将计算到的最匹配的大块的运动向量作为所求的大块的运动向量。该SASD的求法如下:
先将大块划分成若干求和小块,例如将64*64的大块分成2*2个求和小块,那么每个求和小块的尺寸为32*32像素,然后求出每个求和小块的像素和(Sum of Sub-Block,简称“SSB”)如图3所示。假设所分的小块宽为w,高为h,小块左上角在图像f中的坐标为(m,n),那么SSB的计算如公式(1):
SSB ( m , n ) = Σ i = 0 w - 1 Σ j = 0 h - 1 f ( m + i , n + j ) - - - ( 1 )
其中,SSBn-1表示在前一帧(f(n-1)帧)中大块的求和小块的SSB,SSBn表示在当前帧(f(n)帧)中大块的求和小块的SSB。
在求出每个求和小块的SSB后,再求出大块包含的求和小块SSB的绝对差值和,即SASD。假设大块划分为A*B个求和小块,当前插值帧某大块的坐标为(x0,y0);那么在运动向量MV(mvx,mVy)下的SASD为:
SASD ( mv x , mv y ) = Σ i = 0 A - 1 Σ j = 0 B - 1 | SSB n - 1 ( x 0 + mv x + i * w , y 0 + mv y + j * h ) - SSB n ( x 0 - mv x + i * w , y 0 - mv y + j * h ) |
在大块的搜索范围内最小SASD所对应的运动向量,即为最匹配的大块的运动向量。也就是说,将在大块的搜索范围内求出最小的SASD对应的MV,作为所求大块的MV_Large。
需要说明的是,大块的搜索范围通过以下方式确定:判断在大块周围的插值小块的运动向量的均值是否小于第一阈值T1,如果小于T1,则选用第一搜索范围S1。如果大于或等于T1,则选用第二搜索范围S2。由于运动在一定区域内具有一致性,所以待求大块的搜索范围,可以从已求得的插值小块的MV中获取。若待求大块周围的插值小块MV的均值MV_Neighbor_Mean1小于特定阈值T1,则选用预先设定的SR1的搜索范围,如果MV_Neighbor_Mean不小于阈值T1,则选用预先设定的SR2的搜索范围(一般SR1会小于SR2,但取值都是经验值)。大块和周围的插值小块的位置关系如图4所示。
另外,值得一提的是,在大块的搜索范围内,求出最小的SASD对应的MV时,可分为全搜索和快速搜索,为了减少运算量,在本实施方式中采用快速搜索方式(如三步法(Three Step Search)和菱形搜索法(DiamondSearch)等)进行大块匹配计算。
在求出大块的运动向量后,将大块划分为若干插值小块,例如可以将64*64的大块分解为4*4个插值小块,那么插值小块的尺寸即为16*16个像素。如果在大块匹配计算中,求得的大块的最小SASD小于特定阈值T3,那么直接将对应的运动向量MV_Large赋给插值小块的运动向量MV_Small,即分解该大块后得到的各个插值小块的运动向量,均为插值小块所属的大块的MV_Large。如果在大块匹配计算中,求得的大块的最小SASD不小于特定阈值T3,那么还需要对分解得到的插值小块单独进行双边运动估计,并且在对插值小块进行双边运动估计时,以所属大块求得的运动向量MV_Large作为预测值。
具体地说,插值小块的双边运动估计与大块类似,在插值小块的搜索范围内,以插值帧的某小块坐标为中心,对称地在原始帧f(n-1)和f(n)中进行插值小块匹配计算,将计算到的最匹配的插值小块的运动向量作为所求的插值小块的运动向量。在插值小块匹配计算中,采用的块匹配准则是绝对差值和(Sum of Absolute Differences,简称“SAD”),即在插值小块的搜索范围内,求出最小的SAD,此时对应的MV即为所求插值小块的运动向量MV_Small。
假设插值小块的尺寸为m,n;插值小块在插值帧的坐标为(x0,y0);所属大块给定的预测值为(mvlx,mvly);那么在MV(mvx,mvy)下的SAD为::
SAD ( mv x , mv y ) = Σ i = 0 m - 1 Σ j = 0 n - 1 | f n - 1 ( x 0 + mvl x + mv x + i , y 0 + mvl y + mv y + j ) - f n ( x 0 - mvl x - mv x + i , y 0 - mv
需要说明的是,插值小块的搜索范围还是利用周围的插值小块的信息确定。具体地,如果待求插值小块周围的已求插值小块MV_Small的均值MV_Neighbor_Mean2接近于所属大块的MV_Large,即(MV_Neighbor_Mean2-MV_Large)小于特定阈值T2,那么选用预先设定的SR3的搜索范围,如果(MV_Neighbor_Mean2-MV_Large)不小于阈值T2,那么选用预先设定的SR4的搜索范围(一般SR3会小于SR4,但取值都是经验值)。
另外,值得一提的是,在插值小块的搜索范围内,求出最小的SAD对应的MV时,可分为全搜索和快速搜索,在本实施方式中采用快速搜索方式进行插值小块匹配计算,以减少运算量,缩短运算时间。
在分级双边运动估计中,大块块匹配使用SASD准则,不但减少计算量,而且减少噪声干扰。在插值小块块匹配使用SAD准则,能增加准确性。有利于图像质量,有利于实时处理高清视频。并且,通过动态改变搜索范围的方式,通过周围已有小块的运动向量,来动态选择当前块的搜索范围,可以在正确的搜索范围内搜索最优运动向量,避免错误,提高图像质量,提高视觉效果。而且,动态调节搜索范围,对于相对静止的大块运动估计,和预测值较准的插值小块运动估计,都会分配较小的搜索范围,从而减少运算量,缩短运算时间。
由此可见,通过如图5所示的流程,可以求得整帧插值小块的MV_Small。
在步骤120中,可以对插值小块MV_Small进行m*n的平滑滤波,对不一致(错误)的MV进行修正。假设进行3*3的MV平滑滤波,如图6所示,MV5和周围MV不一致,认为出错,那么使用3*3的滤波对MV5进行修正。
在步骤130中,可以通过以下方式判断错误的插值小块的MV的个数是否小于预设门限值,并根据判断结果执行相应的操作:
判断所求插值小块的最小SAD是否大于特地阈值T4,如果大于特定阈值T4,则增加计数器N,遍历整帧图像后,如果计数器N小于特定阈值T5(T5=N_Total*T6,其中N_Total为整帧插值小块的个数,T6为不大于1的特定阈值),则根据得到的整帧的插值小块的MV_Small进行插值,并输出插值帧,如果不小于T5,则进行帧复制,输出复制帧。
另外,如果决定根据得到的整帧的插值小块的MV进行插值,则在本实施方式中,可采用OBMC的方法进行插值,以消除由于分块引起的块效应。如图7所示,每个插值小块的MV为MV1,MV2,MV3,MV4,在区域A,4个小块邻接,那么使用公式(2)计算;在区域B,2个小块邻接,那么使用公式(3)计算;在中心区域C,没有邻接插值小块,那么采用公式(4)计算:
f ( x , y ) = ( Σ i = 1 4 ( f n - 1 ( x + mv ix , y + mv jy ) + f n ( x - mv ix , y - mv jy ) ) ) / 8 - - - ( 2 )
f ( x , y ) = ( Σ i = 3 4 ( f n - 1 ( x + mv ix , y + mv jy ) + f n ( x - mv ix , y - mv jy ) ) ) / 4 - - - ( 3 )
f(x,y)=(fn-1(x+mv4x,y+mv4y)+fn(x-mv4x,y-mv4y))/2                     (4)
OBMC的插值方法属于本领域的公知技术,在此不再赘述。
本发明的各方法实施方式均可以以软件、硬件、固件等方式实现。不管本发明是以软件、硬件、还是固件方式实现,指令代码都可以存储在任何类型的计算机可访问的存储器中(例如永久的或者可修改的,易失性的或者非易失性的,固态的或者非固态的,固定的或者可更换的介质等等)。同样,存储器可以例如是可编程阵列逻辑(Programmable Array Logic,简称“PAL”)、随机存取存储器(Random Access Memory,简称“RAM”)、可编程只读存储器(Programmable Read Only Memory,简称“PROM”)、只读存储器(Read-Only Memory,简称“ROM”)、电可擦除可编程只读存储器(Electrically Erasable Programmable ROM,简称“EEPROM”)、磁盘、光盘、数字通用光盘(Digital Versatile Disc,简称“DVD”)等等。
本发明第三实施方式涉及一种视频帧率转换中的插值帧获取装置。如图8所示,该视频帧率转换中的插值帧获取装置包含:
大块划分模块,用于将待求的插值帧划分成L个大块,其中,L为自然数。
大块运动向量估计模块,用于对每一个大块,根据输入视频的当前帧和前一帧,对大块进行双边运动向量估计,得到大块的运动向量。
大块分解模块,用于将每一个大块分解为P个插值小块,其中,P为自然数。
插值小块运动向量估计模块,用于以插值小块所属的大块的运动向量为预测值,对各插值小块进行双边运动向量估计,得到各插值小块的运动向量。
插值小块运动向量修正模块,用于对插值小块运动向量估计模块求得的整帧的插值小块的运动向量的正确性进行检测,对错误的插值小块的运动向量进行修正。
插值决定模块,用于判断错误的插值小块的运动向量的个数是否小于预设门限值,并在判定小于预设门限值时,触发插值模块。在判定大于或等于预设门限值时,触发用于直接进行帧复制的复制模块,将得到的复制帧作为待求的插值帧。
插值模块,用于在插值小块运动向量估计模块求得整帧的插值小块的运动向量后,根据得到的整帧的插值小块的运动向量进行插值,得到待求的插值帧。
不难发现,第一实施方式是与本实施方式相对应的方法实施方式,本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式中。
本发明第四实施方式涉及一种视频帧率转换中的插值帧获取装置。第四实施方式在第三实施方式的基础上进行了改进,主要改进之处在于:不仅采用分级的方式进行双边运动估计,而且在运动向量估计时,动态的改变搜索范围,以进一步提高图像质量,提高视觉效果,同时进一步减少运算量,缩短运算时间。另外,本实施方式也在第三实施方式的基础上,进行了细节上的补充。
在本实施方式中,视频帧率转换中的插值帧获取装置还包含大块搜索范围动态获取模块,用于判断在大块周围的插值小块的运动向量的均值是否小于第一阈值T1,并在小于T1时,选用第一搜索范围S 1作为该大块的搜索范围。在大于或等于T1时,选用第二搜索范围S2作为该大块的搜索范围,其中,S1和S2预先设定。
大块运动向量估计模块在进行双边运动向量估计时,在大块的搜索范围内,对称地在当前帧和前一帧中进行大块匹配计算,并将计算到的最匹配的大块的运动向量作为所求的大块的运动向量,并且,在大块的搜索范围内,对称地在当前帧和前一帧中进行大块匹配计算时,采用快速搜索方式进行大块匹配计算。大块运动向量估计模块在进行大块匹配计算时,采用的块匹配准则为绝对子块差值和SASD,计算到的最匹配的大块的运动向量即为在大块的搜索范围内最小SASD所对应的运动向量。
具体地说,大块运动向量估计模块包含以下子模块:
求和小块划分子模块,用于将大块划分为A*B个求和小块。
像素求和子模块,用于求出每个求和小块的像素和SSB。
SASD计算子模块,用于根据以下公式计算(mvx,mvy)下的SASD:
SASD ( mv x , mv y ) = Σ i = 0 A - 1 Σ j = 0 B - 1 | SSB n - 1 ( x 0 + mv x + i * w , y 0 + mv y + j * h ) - SSB n ( x 0 - mv x + i * w , y 0 - mv y + j * h ) |
其中,SSBn-1表示在前一帧中大块的求和小块的像素和,SSBn表示在当前帧中大块的求和小块的像素和,x0表示待求运动向量的大块在图像中的横坐标,y0表示待求运动向量的大块在图像中的纵坐标,w表示求和小块的宽,h表示求和小块的高,mvx和mvy为在所述大块的搜索范围内的向量取值。
视频帧率转换中的插值帧获取装置还包含插值小块搜索范围动态获取模块,用于判断在待求运动向量的插值小块周围的插值小块的运动向量的均值,与待求运动向量的插值小块所属大块的运动向量的差值是否小于第二阈值T2,并在小于T2时,选用第三搜索范围S3作为待求运动向量的插值小块的搜索范围。在大于或等于T2时,选用第四搜索范围S4作为待求运动向量的插值小块的搜索范围。其中,S3、S4预先设定。
插值小块运动向量估计模块在进行双边运动向量估计时,在插值小块的搜索范围内,对称地在当前帧和前一帧中进行插值小块匹配计算,并将计算到的最匹配的插值小块的运动向量作为所求的插值小块的运动向量。其中,在进行插值小块匹配计算时,采用快速搜索方式进行插值小块匹配计算。采用的块匹配准则为SAD,计算到的最匹配的插值小块的运动向量即为在插值小块的搜索范围内最小SAD所对应的运动向量。
需要说明的是,本实施方式的视频帧率转换中的插值帧获取装置还包含:赋值判断模块,用于判断待求运动向量的大块的搜索范围内的最小SASD是否小于第三阈值T3,并在判定小于T3时,直接将求得的该大块的运动向量赋值给分解该大块后得到的各插值小块的运动向量。并在大于或等于T3时,触发插值小块运动向量估计模块。
不难发现,第二实施方式是与本实施方式相对应的方法实施方式,本实施方式可与第二实施方式互相配合实施。第二实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第二实施方式中。
需要说明的是,本发明各设备实施方式中提到的各单元都是逻辑单元,在物理上,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现,这些逻辑单元本身的物理实现方式并不是最重要的,这些逻辑单元所实现的功能的组合是才解决本发明所提出的技术问题的关键。此外,为了突出本发明的创新部分,本发明上述各设备实施方式并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,这并不表明上述设备实施方式并不存在其它的单元。
虽然通过参照本发明的某些优选实施方式,已经对本发明进行了图示和描述,但本领域的普通技术人员应该明白,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

Claims (14)

1.一种视频帧率转换中的插值帧获取方法,其特征在于,包含以下步骤:
将待求的插值帧划分成L个大块,对每一个所述大块,执行以下步骤:
根据输入视频的当前帧和前一帧,对所述大块进行双边运动向量估计,得到所述大块的运动向量;
将所述大块分解为P个插值小块,以该大块的运动向量为预测值,对分解该大块后得到的各插值小块进行双边运动向量估计,得到各插值小块的运动向量;
在求得整帧的插值小块的运动向量后,根据得到的整帧的插值小块的运动向量进行插值,得到所述待求的插值帧;
其中,所述L、P均为自然数。
2.根据权利要求1所述的视频帧率转换中的插值帧获取方法,其特征在于,所述根据输入视频的当前帧和前一帧,对所述大块进行双边运动向量估计的步骤中,包含以下子步骤:
在大块的搜索范围内,对称地在所述当前帧和前一帧中进行大块匹配计算,并将计算到的最匹配的大块的运动向量作为所求的大块的运动向量;
其中,所述大块的搜索范围通过以下方式确定:
判断在大块周围的插值小块的运动向量的均值是否小于第一阈值T1,如果小于所述T1,则选用第一搜索范围S1;如果大于或等于所述T1,则选用第二搜索范围S2;
所述对分解该大块后得到的各插值小块进行双边运动向量估计的步骤中,包含以下子步骤:
在插值小块的搜索范围内,对称地在所述当前帧和前一帧中进行插值小块匹配计算,并将计算到的最匹配的插值小块的运动向量作为所求的插值小块的运动向量;
其中,所述插值小块的搜索范围通过以下方式确定:
如果周围的插值小块的运动向量的均值,与待求运动向量的插值小块所属大块的运动向量的差值小于第二阈值T2,则选用第三搜索范围S3;如果大于或等于所述T2,则选用第四搜索范围S4;
其中,所述S1、S2、S3、S4预先设定。
3.根据权利要求2所述的视频帧率转换中的插值帧获取方法,其特征在于,所述在大块的搜索范围内,对称地在所述当前帧和前一帧中进行大块匹配计算时,采用快速搜索方式进行所述大块匹配计算;
所述在插值小块的搜索范围内,对称地在所述当前帧和前一帧中进行插值小块匹配计算时,采用快速搜索方式进行所述插值小块匹配计算。
4.根据权利要求2所述的视频帧率转换中的插值帧获取方法,其特征在于,在进行所述大块匹配计算时,采用的块匹配准则为绝对子块差值和SASD,计算到的最匹配的大块的运动向量即为在所述大块的搜索范围内最小SASD所对应的运动向量;
其中,所述SASD通过以下方式计算得到:
将大块划分为A*B个求和小块,求出每个求和小块的像素和SSB;
根据以下公式计算(mvx,mvy)下的所述SASD:
SASD ( mv x , mv y ) = Σ i = 0 A - 1 Σ j = 0 B - 1 | SSB n - 1 ( x 0 + mv x + i * w , y 0 + mv y + j * h ) - SSB n ( x 0 - mv x + i * w , y 0 - mv y + j * h ) |
其中,SSBn-1表示在前一帧中大块的求和小块的像素和,SSBn表示在当前帧中大块的求和小块的像素和,x0表示待求运动向量的大块在图像中的横坐标,y0表示待求运动向量的大块在图像中的纵坐标,w表示求和小块的宽,h表示求和小块的高,mvx和mvy为在所述大块的搜索范围内的向量取值。
5.根据权利要求4所述的视频帧率转换中的插值帧获取方法,其特征在于,在将所述大块分解为P个插值小块的步骤之后,以该大块的运动向量为预测值,对分解该大块后得到的各插值小块进行双边运动向量估计的步骤之前,还包含以下步骤:
判断在大块的搜索范围内的最小SASD是否小于第三阈值T3,如果小于所述T3,则分解该大块后得到的P个插值小块的运动向量均为求得的该大块的运动向量;如果大于或等于所述T3,则再进入所述以该大块的运动向量为预测值,对分解该大块后得到的各插值小块进行双边运动向量估计的步骤。
6.根据权利要求2所述的视频帧率转换中的插值帧获取方法,其特征在于,在进行所述插值小块匹配计算时,采用的块匹配准则为绝对差值和SAD,计算到的最匹配的插值小块的运动向量即为在所述插值小块的搜索范围内最小SAD所对应的运动向量。
7.根据权利要求1至6中任一项所述的视频帧率转换中的插值帧获取方法,其特征在于,在求得整帧的插值小块的运动向量后,还包含以下步骤:
对所述整帧的插值小块的运动向量的正确性进行检测,对错误的插值小块的运动向量进行修正;
判断错误的插值小块的运动向量的个数是否小于预设门限值,如果小于所述预设门限值,则再进入所述根据得到的整帧的插值小块的运动向量,进行插值的步骤;如果大于或等于所述预设门限值,则直接进行帧复制,将得到的复制帧作为所述待求的插值帧。
8.一种视频帧率转换中的插值帧获取装置,其特征在于,包含:
大块划分模块,用于将待求的插值帧划分成L个大块;
大块运动向量估计模块,用于对每一个所述大块,根据输入视频的当前帧和前一帧,对所述大块进行双边运动向量估计,得到所述大块的运动向量;
大块分解模块,用于将每一个所述大块分解为P个插值小块;
插值小块运动向量估计模块,用于以插值小块所属的大块的运动向量为预测值,对各插值小块进行双边运动向量估计,得到各插值小块的运动向量;
插值模块,用于在所述插值小块运动向量估计模块求得整帧的插值小块的运动向量后,根据得到的整帧的插值小块的运动向量进行插值,得到所述待求的插值帧;
其中,所述L、P均为自然数。
9.根据权利要求8所述的视频帧率转换中的插值帧获取装置,其特征在于,所述大块运动向量估计模块在进行双边运动向量估计时,在大块的搜索范围内,对称地在所述当前帧和前一帧中进行大块匹配计算,并将计算到的最匹配的大块的运动向量作为所求的大块的运动向量;
所述视频帧率转换中的插值帧获取装置还包含大块搜索范围动态获取模块,用于判断在大块周围的插值小块的运动向量的均值是否小于第一阈值T1,并在小于所述T1时,选用第一搜索范围S1作为该大块的搜索范围;在大于或等于所述T1时,选用第二搜索范围S2作为该大块的搜索范围;
插值小块运动向量估计模块在进行双边运动向量估计时,在插值小块的搜索范围内,对称地在所述当前帧和前一帧中进行插值小块匹配计算,并将计算到的最匹配的插值小块的运动向量作为所求的插值小块的运动向量;
所述视频帧率转换中的插值帧获取装置还包含插值小块搜索范围动态获取模块,用于判断在待求运动向量的插值小块周围的插值小块的运动向量的均值,与待求运动向量的插值小块所属大块的运动向量的差值是否小于第二阈值T2,并在小于所述T2时,选用第三搜索范围S3作为待求运动向量的插值小块的搜索范围;在大于或等于所述T2时,选用第四搜索范围S4作为待求运动向量的插值小块的搜索范围;
其中,所述S1、S2、S3、S4预先设定。
10.根据权利要求9所述的视频帧率转换中的插值帧获取装置,其特征在于,所述大块运动向量估计模块在大块的搜索范围内,对称地在所述当前帧和前一帧中进行大块匹配计算时,采用快速搜索方式进行所述大块匹配计算;
所述插值小块运动向量估计模块在插值小块的搜索范围内,对称地在所述当前帧和前一帧中进行插值小块匹配计算时,采用快速搜索方式进行所述插值小块匹配计算。
11.根据权利要求9所述的视频帧率转换中的插值帧获取装置,其特征在于,所述大块运动向量估计模块在进行所述大块匹配计算时,采用的块匹配准则为绝对子块差值和SASD,计算到的最匹配的大块的运动向量即为在所述大块的搜索范围内最小SASD所对应的运动向量;
所述大块运动向量估计模块包含以下子模块:
求和小块划分子模块,用于将大块划分为A*B个求和小块;
像素求和子模块,用于求出每个求和小块的像素和SSB;
SASD计算子模块,用于根据以下公式计算(mvx,mvy)下的所述SASD:
SASD ( mv x , mv y ) = Σ i = 0 A - 1 Σ j = 0 B - 1 | SSB n - 1 ( x 0 + mv x + i * w , y 0 + mv y + j * h ) - SSB n ( x 0 - mv x + i * w , y 0 - mv y + j * h ) |
其中,SSB n-1表示在前一帧中大块的求和小块的像素和,SSBn表示在当前帧中大块的求和小块的像素和,x0表示待求运动向量的大块在图像中的横坐标,y0表示待求运动向量的大块在图像中的纵坐标,w表示求和小块的宽,h表示求和小块的高,mvx和mvy为在所述大块的搜索范围内的向量取值。
12.根据权利要求11所述的视频帧率转换中的插值帧获取装置,其特征在于,所述视频帧率转换中的插值帧获取装置还包含:
赋值判断模块,用于判断待求运动向量的大块的搜索范围内的最小SASD是否小于第三阈值T3,并在判定小于所述T3时,直接将求得的该大块的运动向量赋值给分解该大块后得到的各插值小块的运动向量;并在大于或等于所述T3时,触发所述插值小块运动向量估计模块。
13.根据权利要求9所述的视频帧率转换中的插值帧获取装置,其特征在于,所述插值小块运动向量估计模块在进行所述插值小块匹配计算时,采用的块匹配准则为绝对差值和SAD,计算到的最匹配的插值小块的运动向量即为在所述插值小块的搜索范围内最小SAD所对应的运动向量。
14.根据权利要求8至13中任一项所述的视频帧率转换中的插值帧获取装置,其特征在于,所述视频帧率转换中的插值帧获取装置还包含:
插值小块运动向量修正模块,用于对所述插值小块运动向量估计模块求得的整帧的插值小块的运动向量的正确性进行检测,对错误的插值小块的运动向量进行修正;
插值决定模块,用于判断错误的插值小块的运动向量的个数是否小于预设门限值,并在判定小于所述预设门限值时,触发所述插值模块;在判定大于或等于所述预设门限值时,触发用于直接进行帧复制的复制模块,将得到的复制帧作为所述待求的插值帧。
CN 201110058013 2011-03-11 2011-03-11 视频帧率转换中的插值帧获取方法及其装置 Active CN102123283B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110058013 CN102123283B (zh) 2011-03-11 2011-03-11 视频帧率转换中的插值帧获取方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110058013 CN102123283B (zh) 2011-03-11 2011-03-11 视频帧率转换中的插值帧获取方法及其装置

Publications (2)

Publication Number Publication Date
CN102123283A true CN102123283A (zh) 2011-07-13
CN102123283B CN102123283B (zh) 2013-10-30

Family

ID=44251709

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110058013 Active CN102123283B (zh) 2011-03-11 2011-03-11 视频帧率转换中的插值帧获取方法及其装置

Country Status (1)

Country Link
CN (1) CN102123283B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102595089A (zh) * 2011-12-29 2012-07-18 香港应用科技研究院有限公司 用于降减光晕的使用混合双向运动向量的帧率转换
WO2013100791A1 (en) * 2011-12-30 2013-07-04 Intel Corporation Method of and apparatus for scalable frame rate up-conversion
CN103220488A (zh) * 2013-04-18 2013-07-24 北京大学 一种视频帧率上转换装置及方法
US8913185B2 (en) 2013-04-03 2014-12-16 Huawei Technologies Co., Ltd. Multi-level bidirectional motion estimation method and device
CN104811723A (zh) * 2015-04-24 2015-07-29 宏祐图像科技(上海)有限公司 Memc技术中局部运动矢量修正方法
CN108012049A (zh) * 2016-10-31 2018-05-08 三星Sds株式会社 视频分析方法及其装置
WO2020052654A1 (en) * 2018-09-13 2020-03-19 Huawei Technologies Co., Ltd. Apparatus and method for conditional decoder-side motion vector refinement in video coding
CN111614911A (zh) * 2020-05-08 2020-09-01 Oppo广东移动通信有限公司 图像生成方法和装置、电子设备及存储介质
CN112789848A (zh) * 2018-10-12 2021-05-11 Jvc建伍株式会社 插补帧生成装置及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5748247A (en) * 1996-04-08 1998-05-05 Tektronix, Inc. Refinement of block motion vectors to achieve a dense motion field
CN1842165A (zh) * 2005-03-31 2006-10-04 株式会社东芝 产生内插帧的方法和装置
CN101207707A (zh) * 2007-12-18 2008-06-25 上海广电集成电路有限公司 一种基于运动补偿的帧频提升系统和方法
CN101600105A (zh) * 2009-06-30 2009-12-09 上海广电光电子有限公司 帧频提升方法
CN101621693A (zh) * 2009-07-31 2010-01-06 重庆大学 一种结合目标分割和不规则块补偿的帧频提升方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5748247A (en) * 1996-04-08 1998-05-05 Tektronix, Inc. Refinement of block motion vectors to achieve a dense motion field
CN1842165A (zh) * 2005-03-31 2006-10-04 株式会社东芝 产生内插帧的方法和装置
CN101207707A (zh) * 2007-12-18 2008-06-25 上海广电集成电路有限公司 一种基于运动补偿的帧频提升系统和方法
CN101600105A (zh) * 2009-06-30 2009-12-09 上海广电光电子有限公司 帧频提升方法
CN101621693A (zh) * 2009-07-31 2010-01-06 重庆大学 一种结合目标分割和不规则块补偿的帧频提升方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102595089A (zh) * 2011-12-29 2012-07-18 香港应用科技研究院有限公司 用于降减光晕的使用混合双向运动向量的帧率转换
CN102595089B (zh) * 2011-12-29 2014-01-29 香港应用科技研究院有限公司 用于降减光晕的使用混合双向运动向量的帧率转换
WO2013100791A1 (en) * 2011-12-30 2013-07-04 Intel Corporation Method of and apparatus for scalable frame rate up-conversion
CN104011771A (zh) * 2011-12-30 2014-08-27 英特尔公司 用于可缩放的帧速率上转换的方法和设备
US8913185B2 (en) 2013-04-03 2014-12-16 Huawei Technologies Co., Ltd. Multi-level bidirectional motion estimation method and device
CN103220488A (zh) * 2013-04-18 2013-07-24 北京大学 一种视频帧率上转换装置及方法
CN104811723A (zh) * 2015-04-24 2015-07-29 宏祐图像科技(上海)有限公司 Memc技术中局部运动矢量修正方法
CN104811723B (zh) * 2015-04-24 2018-03-16 宏祐图像科技(上海)有限公司 Memc技术中局部运动矢量修正方法
CN108012049A (zh) * 2016-10-31 2018-05-08 三星Sds株式会社 视频分析方法及其装置
WO2020052654A1 (en) * 2018-09-13 2020-03-19 Huawei Technologies Co., Ltd. Apparatus and method for conditional decoder-side motion vector refinement in video coding
US11563948B2 (en) 2018-09-13 2023-01-24 Huawei Technologies Co., Ltd. Apparatus and method for conditional decoder-side motion vector refinement in video coding
CN112789848A (zh) * 2018-10-12 2021-05-11 Jvc建伍株式会社 插补帧生成装置及方法
CN112789848B (zh) * 2018-10-12 2023-09-08 Jvc建伍株式会社 插补帧生成装置及方法
CN111614911A (zh) * 2020-05-08 2020-09-01 Oppo广东移动通信有限公司 图像生成方法和装置、电子设备及存储介质
CN111614911B (zh) * 2020-05-08 2022-12-09 Oppo广东移动通信有限公司 图像生成方法和装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN102123283B (zh) 2013-10-30

Similar Documents

Publication Publication Date Title
CN102123283B (zh) 视频帧率转换中的插值帧获取方法及其装置
US8929451B2 (en) External vectors in a motion estimation system
JP3640257B2 (ja) 動画像の画素を分類して画素の動きベクトルの予測フィールドを決定する方法
TWI455588B (zh) 以雙向、局部及全域移動評估為基礎之框率轉換
CN104219533B (zh) 一种双向运动估计方法和视频帧率上转换方法及系统
US11539976B2 (en) Motion estimation using collocated blocks
RU2461979C2 (ru) Устройство видеоотображения
CN103402098B (zh) 一种基于图像插值的视频插帧方法
KR100720722B1 (ko) 중간영상 생성방법 및 이 방법이 적용되는 입체영상디스플레이장치
CN101207707A (zh) 一种基于运动补偿的帧频提升系统和方法
JP4741836B2 (ja) 質量中心の繰り返し使用によるカメラパンベクトルのロバスト推定
CN105100807A (zh) 一种基于运动矢量后处理的帧率提升方法
JP2005204066A (ja) 補間画像生成方法および装置
US8610826B2 (en) Method and apparatus for integrated motion compensated noise reduction and frame rate conversion
CN103338377A (zh) 用于确定运动估计中最优运动矢量的方法
KR20070076337A (ko) 에지영역 판단장치 및 에지영역 판단방법
CN103369208A (zh) 自适应去隔行方法及装置
JP2000253422A (ja) 2次元映像からの立体映像生成方法
CN102065263B (zh) 影像插补处理装置及其方法
Huang et al. Algorithm and architecture design of multirate frame rate up-conversion for ultra-HD LCD systems
US20130235274A1 (en) Motion vector detection device, motion vector detection method, frame interpolation device, and frame interpolation method
CN103096009B (zh) 图像处理装置和方法以及图像显示装置和方法
CN107124617A (zh) 运动估计运动补偿中随机矢量的生成方法及系统
KR101359351B1 (ko) 연산 스킵 기법에 의한 고속 스테레오 영상 정합 방법
US8405767B2 (en) Image processing device

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: HANGZHOU HIKVISION DIGITAL TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: HANGZHOU HAIKANG WEISHI SOFTWARE CO., LTD.

Effective date: 20120905

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 310012 HANGZHOU, ZHEJIANG PROVINCE TO: 310051 HANGZHOU, ZHEJIANG PROVINCE

TA01 Transfer of patent application right

Effective date of registration: 20120905

Address after: Hangzhou City, Zhejiang province 310051 Binjiang District East Road Haikang Science Park No. 700, No. 1

Applicant after: Hangzhou Hikvision Digital Technology Co., Ltd.

Address before: Xihu District Ma Cheng Road Hangzhou City, Zhejiang province 310012 Hikvision Building No. 36

Applicant before: Hangzhou Haikang Weishi Software Co., Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20110713

Assignee: Hangzhou Hikvision Technology Co.,Ltd.

Assignor: Hangzhou Hikvision Digital Technology Co.,Ltd.

Contract record no.: X2021330000212

Denomination of invention: Interpolation frame acquisition method and device in video frame rate conversion

Granted publication date: 20131030

License type: Common License

Record date: 20210901