CN102572418A - 一种帧间编码的运动预测方法和系统 - Google Patents

一种帧间编码的运动预测方法和系统 Download PDF

Info

Publication number
CN102572418A
CN102572418A CN2010106101084A CN201010610108A CN102572418A CN 102572418 A CN102572418 A CN 102572418A CN 2010106101084 A CN2010106101084 A CN 2010106101084A CN 201010610108 A CN201010610108 A CN 201010610108A CN 102572418 A CN102572418 A CN 102572418A
Authority
CN
China
Prior art keywords
motion
value
regional
frame
macro block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010106101084A
Other languages
English (en)
Other versions
CN102572418B (zh
Inventor
舒倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yunzhou Multimedia Technology Co., Ltd.
Original Assignee
Shenzhen Temobi Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Temobi Science and Technology Co Ltd filed Critical Shenzhen Temobi Science and Technology Co Ltd
Priority to CN201010610108.4A priority Critical patent/CN102572418B/zh
Priority to PCT/CN2011/072791 priority patent/WO2012088806A1/zh
Publication of CN102572418A publication Critical patent/CN102572418A/zh
Application granted granted Critical
Publication of CN102572418B publication Critical patent/CN102572418B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/521Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/527Global motion vector estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提出一种帧间编码的运动预测方法,先根据当前帧的相对变化复杂度信息所在的阈值范围,判断是否进入全局运动预测;如果是进入全局运动预测,判断选定的判定区域是否为强一致性运动趋势,如果是则获取当前帧的运动方向为全局运动方向,获取相应的方向判定,结束;如果不是强一致运动趋势,则根据各区域的运动,进行全局运动方向的弱判定。利用本发明方法,一方面可以提升压缩率,另一方面可以提升压缩速度,即对存在全局运动的视频源进行压缩时,可通过统一判断的方式确定运动预测,而无需像仅依赖基于宏块、子块的运动预测方法对每个宏块子块依次作判断。

Description

一种帧间编码的运动预测方法和系统
技术领域
本发明涉及视频编码领域,尤其涉及一种帧间编码的运动预测方法和系统。
背景技术
视频编码中视频源的帧间信息冗余度极大,从而使得帧间编码方法在视频编码中显得尤为重要。目前主流的基于宏块、子块的运动补偿方法,在常规运动时,可以达到较好的效果,但当出现全局运动时,相应的压缩难度提升,这个问题在低码率压缩时更为严重。出现此问题,固然是由于编码源本身的复杂度引起的,但另一方面却也是现有基于宏块、子块的运动补偿的方法存在缺陷的原因。基于宏块、子块的运动补偿的方法割裂了区域及全局相关性,从而当存在全局运动时,仅使用该方法不能很好的消除帧间信息的冗余度,从而使得低码率下的压缩质与量的矛盾尤为突出。此外,逐个判定的模式也浪费了计算资源。
发明内容
本发明实施例的目的在于提出一种帧间编码的运动预测方法,旨在解决现有技术基于宏块、子块的运动补偿的方法割裂了区域及全局相关性,从而当存在全局运动时,不能很好的消除帧间信息的冗余度,从而使得低码率下的压缩质与量的矛盾尤为突出的问题。
本发明实施例方法是这样实现的,一种帧间编码的运动预测方法,所述方法包括:
根据当前帧的相对变化复杂度信息所在的阈值范围,判断是否进入全局运动预测,如果是,则
判断选定的判定区域是否为强一致性运动趋势,如果是,则
获取当前帧为全局运动,获取相应的方向判定,结束。
优选地,所述步骤“判断选定的判定区域是否为强一致性运动趋势”还包括:
如果选定的区域不是强一致运动趋势,则根据各区域的运动,进行全局运动方向的弱判定。
本发明实施例的另一目的在于提出一种帧间编码的运动预测系统,所述系统包括:
进入全局运动预测判断模块:用于根据当前帧的相对变化复杂度信息所在的阈值范围,判断是否进入全局运动预测;即如果当前帧的相对变化复杂度信息大于第一阈值,则认为当前帧与前一帧极度近似,判定当前帧为Skip帧(前后两帧近乎无运动,可直接复制前一帧图像);如果当前帧它的相对变化复杂度信息在第一阈值和第二阈值之间,则不进入全局运动预测;如果当前帧的相对变化复杂度信息小于第二阈值,则进入全局运动预测,即进入强一致性运动趋势判断模块,其中第一阈值大于第二阈值。
强一致性运动趋势判断模块:用于判断选定的判定区域是否为强一致性运动趋势,如果是则获取当前帧为全局运动,获取相应的方向判定,结束;如果否则进入弱一致性运动趋势判断模块;
弱一致性运动趋势判断模块,用于判断选定的判定区域是否为弱一致性运动趋势,如果是则获取当前帧相应的方向判定,结束;如果否则判定当前帧不存在全局运动。
本发明的有益效果
本发明提出一种帧间编码的运动预测方法,先根据当前帧的相对变化复杂度信息所在的阈值范围,判断是否进入全局运动预测;如果是进入全局运动预测,判断选定的判定区域是否为强一致性运动趋势,如果是则获取当前帧的运动方向为全局运动方向,获取相应的方向判定,结束;如果不是强一致运动趋势,则根据各区域的运动,进行全局运动方向的弱判定。利用本发明方法,一方面可以提升压缩率,另一方面可以提升压缩速度,即对存在全局运动的视频源进行压缩时,可通过统一判断的方式确定运动预测,而无需像仅依赖基于宏块、子块的运动预测方法对每个宏块子块依次作判断。
附图说明
图1是本发明实施例的一种帧间编码的运动预测方法流程图;
图2是本发明实施例的一种帧间编码的运动预测系统结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图和实施例,对本发明进行进一步详细说明,为了便于说明,仅示出了与本发明实施例相关的部分。应当理解,此处所描写的具体实施例,仅仅用于解释本发明,并不用以限制本发明。
本发明提出一种帧间编码的运动预测方法,先根据当前帧的相对变化复杂度信息所在的阈值范围,判断是否进入全局运动预测;如果是进入全局运动预测,判断选定的判定区域是否为强一致性运动趋势,如果是则获取当前帧的运动方向为全局运动方向,获取相应的方向判定,结束;如果不是强一致运动趋势,则根据各区域的运动,进行全局运动方向的弱判定。利用本发明方法,一方面可以提升压缩率,另一方面可以提升压缩速度,即对存在全局运动的视频源进行压缩时,可通过统一判断的方式确定运动预测,而无需像仅依赖基于宏块、子块的运动预测方法对每个宏块子块依次作判断。
图1所示为本发明实施例一种帧间编码的运动预测方法流程图,所述方法包括以下步骤:
S11,根据当前帧的相对变化复杂度信息所在的阈值范围,判断是否进入全局运动预测;
具体为:如果当前帧的相对变化复杂度信息大于第一阈值,则认为当前帧与前一帧极度近似,判定当前帧为Skip帧(前后两帧近乎无运动,可直接复制前一帧图像);如果当前帧它的相对变化复杂度信息在第一阈值和第二阈值之间,则不进入全局运动预测;如果当前帧的相对变化复杂度信息小于第二阈值,则进入全局运动预测,即进入步骤S12。其中第一阈值大于第二阈值。
所述是否进入全局运动预测方法的程序描述如下:
if(tis_framest>Thres1)
则第t帧与第t-1帧极度近似,判定第t帧为Skip帧
if(tis_framest<Thres2)
则运用全局运动预测方法进行预测
if(Thres2≤tis_framest≤Thres1)
则无全局运动趋势,进入基于宏块、块的运动预测
其中:Thres1、Thres2为相应的第一阈值和第二阈值判定阈值
tis_framest表示:第t帧的相对变化复杂度信息;
所述当前帧的相对变化复杂度信息求取方法如下:
A):根据宏块运动信息、宏块纹理信息提取各宏块相对变化复杂度信息;
a)宏块运动信息:当前宏块内像素与前一帧相应宏块内的像素值差值的均方差。
ti_Mbt,m,n=std[ft(i,j|(i,j)∈Mbt,m,n)-fi-1(i,j|(i,j)∈Mbt-1,m,n)]
b)宏块纹理信息:当前宏块内像素值的均方差。
si_Mbt,m,n=std[ft(i,j|(i,j)∈Mbt,m,n)],
if(si_Mbt,m,n=0)
则,判定当前宏块为单点宏块,即整个宏块所有像素值即为相同的一个像素值;
c)宏块相对变化复杂度信息:
tis _ Mb t , m , n = ti _ Mb t , m , n / si _ Mb t , m , n , si _ Mb t , m , n ≠ 0 0 , si _ Mb t , m , n = 0
其中:Mbt,m,n表示第t帧第m行n列的宏块;
Mbt-1,m,n表示;第t-1帧第m行n列的宏块;
ft(i,j)表示第t帧第i行j列的像素值;
ft(i,j|(i,j)∈Mbt,m,n)表示;表示第t帧中属于Mbt,m,n的第i行j列的像素值;
ft-1(i,j|(i,j)∈Mbt-1,m,n)表示;表示第t-1帧中属于Mbt-1,m,n的第i行j列的像素值;
std表示均方差;
ti_Mbt,m,n表示:Mbt,m,n的宏块运动信息;
si_Mbt,m,n表示:Mbt,m,n的宏块纹理信息;
B):基于宏块相对变化复杂度信息,获取当前帧的相对变化复杂度信息;
tis _ frames t = count t + + , tis _ Mb t , m , n < Thres 0 count t , else
其中:Thres0为相应的第零判定阈值;
tis_framest表示:第t帧的相对变化复杂度信息;
tis_Mbt,m,n表示:Mbt,m,n的宏块相对变化复杂度信息
S12,判断选定的判定区域是否为强一致性运动趋势,如果是则获取当前帧的运动方向为全局运动方向,获取相应的方向判定,结束;如果否则进入步骤S13;
所述判定区域需同时满足以下条件:
条件1:判定区域为背景区域;
当存在全局运动时,一般具有背景运动趋势一致,而前景则一般存在相对运动的特点;
条件2:至少选取两个判定区域;
条件3:在每个判定区域作所有方向的检测;
所有方向包括:左侧运动、右侧运动、上侧运动、下侧运动、静止;
具体实施时可根据需要及计算量的综合考虑选取更多或更少的方向。考虑实际运动中以水平、垂直、静止三种运动最为常见,本发明实施例以左侧运动、右侧运动、上侧运动、下侧运动、静止这五种方向为例进行说明。
所述“判断选定的判定区域是否为强一致性运动趋势”具体方法为
S121:以宏块为单位,求取判定区域内的宏块预测方向;
本发明实施例中选定两个判定区域Re gion5,Re gion6,对判定区域Re gion5,Re gion6内的宏块,分别具体做如下计算:
计算左侧运动预测值和当前编码值差值的均方差,获取左侧运动预测残差;
计算右侧运动预测值和当前编码值差值的均方差,获取右侧运动预测残差;
计算上侧运动预测值和当前编码值差值的均方差,获取上侧运动预测残差;
计算下侧运动预测值和当前编码值差值的均方差,获取下侧运动预测残差;
计算静止预测值和当前编码值差值的均方差,获取静止运动预测残差;
具体计算公式如下:
diffLeft=std[ft,m,n(i,j)-predL_ft-1m′,n′(i,j)|Mbt,m,n∈Re gion5∪Re gion6]
diffRight=std[ft,m,n(i,j)-predR_ft-1,m′,n′(i,j)|Mbt,m,n∈Re gion5∪Re gion6]
diffUp=std[ft,m,n(i,j)-predU_ft-1,m′,n′(i,j)|Mbt,m,n∈Re gion5∪Re gion6]
diffDown=std[ft,m,n(i,j)-predD_ft-1,m′,n′(i,j)|Mbt,m,n∈Re gion5∪Re gion6]
diffStatic=std[ft,m,n(i,j)-predS_ft-1,m,n(i,j)|Mbt,m,n∈Re gion5∪Re gion6]
其中:Mbt,m,n表示第t帧第m行n列的宏块;
Mbt,m,n:为当前编码第t帧第m行n列的宏块;
ft,m,n(i,j):为Mbt,m,n中第i行第j列的像素值;
ft(i,j)表示第t帧第i行j列的像素值;
std表示均方差;
diffLeft为左侧运动预测残差、predL_ft-1,m′,n′(i,j)为利用前一帧图像对当前宏块作左侧运动估计的预测值;
diffRight为右侧运动预测残差、predR_ft-1,m′,n′(i,j)为利用前一帧图像对当前宏块作右侧运动估计的预测值;
diffup为上侧运动预测残差、predU_ft-1,m′,n′(i,j)为利用前一帧图像对当前宏块作上侧运动估计的预测值;
diffdown为下侧运动预测残差、predD_ft-1,m′,n′(i,j)为利用前一帧图像对当前宏块作下侧运动估计的预测值;
diffStatic为静止运动预测残差、predS_ft-1,m,n(i,j)为利用前一帧图像对当前宏块作静止运动估计的预测值;
S122:统计各区域中所有方向的运动宏块数;即在各区域内,宏块预测残差最小的方向上运动宏块数加一;所述各区域中所有方向为左侧运动、右侧运动、上侧运动、下侧运动、静止方向;
各区域内,运动宏块数统计方法的具体程序如下:
if(min(diffLeft,diffRight,diffUp,diffDownt,diffStatic)=diffLeft)
       CountLeft,j++
if(min(diffLeft,diffRight,diffUp,diffDownt,diffStatic)=diffRight)
       CountRight,j++
if(min(diffLeft,diffRight,diffUp,diffDownt,diffStatic)=ddiffUp)
       CountUp,j++
if(min(diffLeft,diffRight,diffUp,diffDownt,diffStatic)=diffDownt)
       CountDown,j++
if(min(diffLeft,diffRight,diffUp,diffDownt,diffStatic)=diffStatic)
       CountStatic,j++
其中,CountLeft,j,CountRight,j,CountUp,j,CountDown,j CountStatic,j分别表示选定的判定区域Re gionj左侧运动、右侧运动、上侧运动、下侧运动、静止宏块的数量,当j等于5或6时,Re gionj表示两个不同选定的判定区域;
min(a,b,c,c,d)表示求五个值中的最小值;
S123:基于各区域中相应方向的运动宏块数的统计信息,判定该区域的信息是否可用;
即一个区域内如果相反运动方向的宏块数的差值小于第一方向判定阈值Thresd1或者该区域内五个运动方向(左侧运动、右侧运动、上侧运动、下侧运动、静止)宏块数的最大值与次大值的差值小于第二方向判定阈值Thresd2,则认为该区域的信息不可用。
详细程序如下:
if(abs(CountLeft,j-CountRight,j)<Thresd1‖abs(CountUp,j-CountDown,j)<Thresd1‖max(CountLeft,j,CountRight,j,CountUp,j,CountDown,j,CountStatic,j)-lessmax(CountLeft,j,CountRight,j,CountUp,j,CountDown,j,CountStatic,j)<Thresd2)
则,该区域信息不可用
其中,CountLeft,j,CountRight,j,CountUp,j,CountDown,j,CountStatic,j分别表示选定的判定区域Re gionj左侧运动、右侧运动、上侧运动、下侧运动、静止宏块的数量,当j等于5或6时,Re gionj表示两个不同选定的判定区域;max(a,b,c,c,d),lessmax(a,b,c,c,d)分别为求五个值中的最大值和次大值,Thresd1为第一方向判定阈值,Thresd2为第二方向判定阈值;
S124:根据选定的判定区域的运动趋势作所有运动方向的判定,
即一个区域内宏块数最多的运动方向,则判定为该区域的运动方向;
if(Regionj有效)则获取其运动方向判定
direction j = Left , max ( Count Left , j , Count Right , j , Count Up , j , Count Down , j , Count Static , j ) = Count Left , j Right , max ( Count Left , j , Count Right , j , Count Up , j , Count Down , j , Count Static , j ) = Count Right , j Up , max ( Count Left , j , Count Right , j , Count Up , j , Count Down , j , Count Static , j ) = Count Up , j Down , max ( Count Left , j , Count Right , j , Count Up , j , Count Down , j , Count Static , j ) = Count Down , j Static , max ( Count Left , j , Count Right , j Count Up , j , Count Down , j , Count Static , j ) = Count Static , j
其中directionj为选定的判定区域Regionj的运动方向,其分为左侧运动方向Left、右侧运动方向Right、上侧运动方向Up、下侧运动方向Down、静止Static;CountLeft,j,CountRight,j,CountUp,j,CountDown,j,CountStatic,j分别表示区域Re gionj左侧运动、右侧运动、上侧运动、下侧运动、静止宏块的数量,当j等于5或6时,Regionj表示两个不同的选定的判定区域;max(a,b,c,c,d)表示求五个值中的最大值;
S125:根据各区域的运动,进行全局运动方向的强判定;
即两个区域的运动方向一致且都不属于静止方向,并且每个区域相应运动方向上的宏块数大于相应第三方向判定阈值Thresd3;或者两个区域的运动方向不一致但其中一个区域运动方向为静止并且另一非静止方向的区域其相应运动方向的宏块数大于相应第四方向判定阈值Thresd4;那么即可获取全局运动方向,结束全局运动预测判断,否则,进入S13。
Figure BSA00000401292700082
Figure BSA00000401292700083
Figure BSA00000401292700084
获取方向结束全局运动预测判断
else
Figure BSA00000401292700086
Figure BSA00000401292700087
获取方向结束全局运动预测判断
否则,进入S13
其中
Figure BSA00000401292700088
为第t帧的运动方向,Thresd3、Thresd4分别为第三方向判定阈值和第四方向判定阈值;
direction5:判定区域Region5的运动方向
direction6:判定区域Region6的运动方向
Figure BSA00000401292700091
判定区域Region5的运动方向上的宏块数
判定区域Region6的运动方向上的宏块数
S13,根据各区域的运动,进行全局运动方向的弱判定;
具体方法步骤如下:
S131:计算各类区域的方向差值mn,即计算各区域最大运动方向宏块数与次大运动方向宏块数的差值,同类区域的最小值即为该类区域的方向差值;
if(Region5,Region6均有效)
mn = min j = 5,6 ( max ( Count Left , j , Count Right , j , Count Up , j Count Down , j , Count Static , j ) -
less max ( Count Left , j , Count Right , j , Count Up , j , Count Down , j Count Static , j ) )
if(只Region5有效)
mn = min j = 5 ( max ( Count Left , j , Count Right , j , Count Up , j , Count Down , j , Count Static , j ) -
less max ( Count Left , j , Count Right , j , Count Up , j , Count Down , j , Count Static , j ) )
if(只Region6有效)
mn = min j = 6 ( max ( Count Left , j , Count Right , j , Count Up , j , Count Down , j , Count Static , j ) -
less max ( Count Left , j , Count Right , j , Count Up , j , Count Down , j , Count Static , j ) )
S132:即根据各区域各类情况择优选取,确定全局运动方向;
如果两个区域信息只有一个区域有效,
如果满足该区域运动方向的宏块数小于相应的第五方向判定阈值Thresd5且该区域的方向差值满足相应的第六方向判定阈值Thresd6;或者满足该区域运动方向的宏块数大于相应的第七方向判定阈值Thresd7
则全局运动方向即为该有效区域的运动方向;
详细程序描述如下:
if((只Region5有效&&
(Countdirection5,5≤Thresd5&&mn>Thresd6)‖(Countdirection5,5>Thresd7))‖
(只Region6有效&&
(Countdirection6,6≤Thresd5&&mn>Thresd6)‖(Countdirection6,6<Thresd7)))
direction t frame = direction j , Region j 有效
else
无全局运动
本发明实施例提出一种帧间编码的运动预测方法,先根据当前帧的相对变化复杂度信息所在的阈值范围,判断是否进入全局运动预测;如果是进入全局运动预测,判断选定的判定区域是否为强一致性运动趋势,如果是则获取当前帧的运动方向为全局运动方向,获取相应的方向判定,结束;如果不是强一致运动趋势,则根据各区域的运动,进行全局运动方向的弱判定。利用本发明方法,一方面可以提升压缩率,另一方面可以提升压缩速度,即对存在全局运动的视频源进行压缩时,可通过统一判断的方式确定运动预测,而无需像仅依赖基于宏块、子块的运动预测方法对每个宏块子块依次作判断。
如图2所示为本发明实施例一种帧间编码的运动预测系统结构示意图,所述系统包括:
进入全局运动预测判断模块:用于根据当前帧的相对变化复杂度信息所在的阈值范围,判断是否进入全局运动预测;即如果当前帧的相对变化复杂度信息大于第一阈值,则认为当前帧与前一帧极度近似,判定当前帧为Skip帧(前后两帧近乎无运动,可直接复制前一帧图像);如果当前帧它的相对变化复杂度信息在第一阈值和第二阈值之间,则不进入全局运动预测;如果当前帧的相对变化复杂度信息小于第二阈值,则进入全局运动预测,即进入强一致性运动趋势判断模块,其中第一阈值大于第二阈值。
强一致性运动趋势判断模块:判断选定的判定区域是否为强一致性运动趋势,如果是则获取当前帧为全局运动,获取相应的方向判定,结束;如果否则进入弱一致性运动趋势判断模块;
所述“判断选定的判定区域是否为强一致性运动趋势”具体为:
以宏块为单位,求取判定区域内的宏块预测方向;
统计各区域中所有方向的运动宏块数;
基于各区域中相应方向的运动宏块数的统计信息,判定该区域的信息是否可用;
根据选定的判定区域的运动趋势作所有运动方向的判定;
根据各区域的运动,进行全局运动方向的强判定;
弱一致性运动趋势判断模块,判断选定的判定区域是否为弱一致性运动趋势,如果是则获取当前帧相应的方向判定,结束;如果否则判定当前帧不存在全局运动;
所述“判断选定的判定区域是否为弱一致性运动趋势”具体为:计算各类区域的方向差值,即计算各区域最大运动方向宏块数与次大运动方向宏块数的差值,同类区域的最小值即为该类区域的方向差值;即根据各区域各类情况择优选取,确定全局运动方向;
所述各类情况为:
如果两个区域信息只有一个区域有效,
如果满足该区域运动方向的宏块数小于相应的第五方向判定阈值且该区域的方向差值满足相应的第六方向判定阈值;或者满足该区域运动方向的宏块数大于相应的第七方向判定阈值;
则全局运动方向即为该有效区域的运动方向;
本发明实施例提出一种帧间编码的运动预测方法,先根据当前帧的相对变化复杂度信息所在的阈值范围,判断是否进入全局运动预测;如果是进入全局运动预测,判断选定的判定区域是否为强一致性运动趋势,如果是则获取当前帧的运动方向为全局运动方向,获取相应的方向判定,结束;如果不是强一致运动趋势,则根据各区域的运动,进行全局运动方向的弱判定。利用本发明方法,一方面可以提升压缩率,另一方面可以提升压缩速度,即对存在全局运动的视频源进行压缩时,可通过统一判断的方式确定运动预测,而无需像仅依赖基于宏块、子块的运动预测方法对每个宏块子块依次作判断。
本领域的普通技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序指令相关硬件来完成的,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质可以为ROM、RAM、磁盘、光盘等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (17)

1.一种帧间编码的运动预测方法,其特征在于,所述方法包括:
根据当前帧的相对变化复杂度信息所在的阈值范围,判断是否进入全局运动预测,如果是,则
判断选定的判定区域是否为强一致性运动趋势,如果是,则
获取当前帧为全局运动,获取相应的方向判定,结束。
2.如权利要求1所述的帧间编码的运动预测方法,其特征在于,所述步骤“判断选定的判定区域是否为强一致性运动趋势”还包括:
如果选定的区域不是强一致运动趋势,则根据各区域的运动,进行全局运动方向的弱判定。
3.如权利要求1所述的帧间编码的运动预测方法,其特征在于,所述“根据当前帧的相对变化复杂度信息所在的阈值范围,判断是否进入全局运动预测,”具体为:
如果当前帧的相对变化复杂度信息大于第一阈值,则认为当前帧与前一帧极度近似,判定当前帧为Skip帧;如果当前帧它的相对变化复杂度信息在第一阈值和第二阈值之间,则不进入全局运动预测;如果当前帧的相对变化复杂度信息小于第二阈值,则进入全局运动预测,即进入权利要求1所述的步骤“判断选定的判定区域是否为强一致性运动趋势”,其中第一阈值大于第二阈值。
4.如权利要求1所述的帧间编码的运动预测方法,其特征在于,所述的当前帧的相对变化复杂度信息求取方法如下:
根据宏块运动信息、宏块纹理信息提取各宏块相对变化复杂度信息;
基于宏块相对变化复杂度信息,获取当前帧的相对变化复杂度信息。
5.如权利要求4所述的帧间编码的运动预测方法,其特征在于,所述“根据宏块运动信息、宏块纹理信息提取各宏块相对变化复杂度信息”具体为:
求取宏块运动信息:即当前宏块内像素与前一帧相应宏块内的像素值差值的均方差;
ti_Mbt,m,n=std[ft(i,j|(i,j)∈Mbt,m,n)-ft-1(i,j|(i,j)∈Mbt-1,m,n)]
求取宏块纹理信息:即当前宏块内像素值的均方差;
si_Mbt,m,n=std[ft(i,j|(i,j)∈Mbt,m,n)],
if(si_Mbt,m,n=0)
则判定当前宏块为单点宏块,即整个宏块所有像素值即为相同的一个像素值;
求取宏块相对变化复杂度信息:
tis _ Mb t , m , n = ti _ Mb t , m , n / si _ Mb t , m , n , si _ Mb t , m , n &NotEqual; 0 0 , si _ Mb t , m , n = 0
其中:Mbt,m,n表示第t帧第m行n列的宏块;
Mbt-1,m,n表示;第t-1帧第m行n列的宏块;
ft(i,j)表示第t帧第i行j列的像素值;
ft(i,j|(i,j)∈Mbt,m,n)表示;表示第t帧中属于Mbt,m,n的第i行j列的像素值;
ft-1(i,j|(i,j)∈Mbt-1,m,n)表示;表示第t-1帧中属于Mbt-1,m,n的第i行j列的像素值;
std表示均方差;
ti_Mbt,m,n表示:Mbt,m,n的宏块运动信息;
si_Mbt,m,n表示:Mbt,m,n的宏块纹理信息。
6.如权利要求4所述的帧间编码的运动预测方法,其特征在于,所述“基于宏块相对变化复杂度信息,获取当前帧的相对变化复杂度信息”具体为:
tis _ frames t = count t + + , tis _ Mb t , m , n < Thres 0 count t , else
其中:Thres0为相应的第零判定阈值;
tis_framest表示:第t帧的相对变化复杂度信息;
tis_Mbt,m,n表示:Mbt,m,n的宏块相对变化复杂度信息。
7.如权利要求1所述的帧间编码的运动预测方法,其特征在于,
所述判定区域需同时满足以下条件:
条件1:判定区域为背景区域;
条件2:至少选取两个判定区域;
条件3:在每个判定区域作所有方向的检测,所有方向包括:左侧运动、右侧运动、上侧运动、下侧运动、静止。
8.如权利要求7所述的帧间编码的运动预测方法,其特征在于,条件3可替换为;在每个判定区域,根据需要及计算量的综合考虑选取不同的方向进行检测。
9.如权利要求1所述的帧间编码的运动预测方法,其特征在于,
所述“判断选定的判定区域是否为强一致性运动趋势”具体包括以下步骤:
以宏块为单位,求取判定区域内的宏块预测方向;
统计各区域中所有方向的运动宏块数;
基于各区域中相应方向的运动宏块数的统计信息,判定该区域的信息是否可用;
根据选定的判定区域的运动趋势作所有运动方向的判定;
根据各区域的运动,进行全局运动方向的强判定。
10.如权利要求9所述的帧间编码的运动预测方法,其特征在于,所述“以宏块为单位,求取判定区域内的宏块预测方向”具体为:
对所述选定的判定区域内的宏块,分别具体做如下计算:
计算左侧运动预测值和当前编码值差值的均方差,获取左侧运动预测残差;
计算右侧运动预测值和当前编码值差值的均方差,获取右侧运动预测残差;
计算上侧运动预测值和当前编码值差值的均方差,获取上侧运动预测残差;
计算下侧运动预测值和当前编码值差值的均方差,获取下侧运动预测残差;
计算静止预测值和当前编码值差值的均方差,获取静止运动预测残差。
11.如权利要求9所述的帧间编码的运动预测方法,其特征在于,所述“统计各区域中所有方向的运动宏块数”具体为:
在各区域内,宏块预测残差最小的方向上运动宏块数加一。
12.如权利要求9所述的帧间编码的运动预测方法,其特征在于,所述“基于各区域中相应方向的运动宏块数的统计信息,判定该区域的信息是否可用”具体为:
一个区域内如果相反运动方向的宏块数的差值小于第一方向判定阈值或者该区域内五个运动方向(左侧运动、右侧运动、上侧运动、下侧运动、静止)宏块数的最大值与次大值的差值小于第二方向判定阈值,则认为该区域的信息不可用。
13.如权利要求9所述的帧间编码的运动预测方法,其特征在于,所述“根据选定的判定区域的运动趋势作所有运动方向的判定”具体为:
一个区域内宏块数最多的运动方向,则判定为该区域的运动方向。
14.如权利要求2所述的帧间编码的运动预测方法,其特征在于,所述“根据各区域的运动,进行全局运动方向的强判定”具体为:
如果两个判定区域的运动方向一致且都不属于静止方向,并且每个区域相应运动方向上的宏块数大于相应第三方向判定阈值;或者两个区域的运动方向不一致但其中一个区域运动方向为静止并且另一非静止方向的区域其相应运动方向的宏块数大于相应第四方向判定阈值;那么即可获取全局运动方向,结束全局运动预测判断,否则,进入权利要求2中的“根据各区域的运动,进行全局运动方向的弱判定”。
15.如权利要求2所述的帧间编码的运动预测方法,其特征在于,所述“根据各区域的运动,进行全局运动方向的弱判定”具体包括:
计算各类区域的方向差值,即计算各区域最大运动方向宏块数与次大运动方向宏块数的差值,同类区域的最小值即为该类区域的方向差值;
根据各区域各类情况择优选取,确定全局运动方向。
16.如权利要求15所述的帧间编码的运动预测方法,其特征在于,所述“根据各区域各类情况择优选取,确定全局运动方向”具体为:
如果两个区域信息只有一个区域有效,
如果满足该区域运动方向的宏块数小于相应的第五方向判定阈值且该区域的方向差值满足相应的第六方向判定阈值;或者满足该区域运动方向的宏块数大于相应的第七方向判定阈值;
则全局运动方向即为该有效区域的运动方向。
17.一种帧间编码的运动预测系统,其特征在于,所述系统包括:
进入全局运动预测判断模块:用于根据当前帧的相对变化复杂度信息所在的阈值范围,判断是否进入全局运动预测;即如果当前帧的相对变化复杂度信息大于第一阈值,则认为当前帧与前一帧极度近似,判定当前帧为Skip帧(前后两帧近乎无运动,可直接复制前一帧图像);如果当前帧它的相对变化复杂度信息在第一阈值和第二阈值之间,则不进入全局运动预测;如果当前帧的相对变化复杂度信息小于第二阈值,则进入全局运动预测,即进入强一致性运动趋势判断模块,其中第一阈值大于第二阈值;
强一致性运动趋势判断模块:用于判断选定的判定区域是否为强一致性运动趋势,如果是则获取当前帧为全局运动,获取相应的方向判定,结束;如果否则进入弱一致性运动趋势判断模块;
弱一致性运动趋势判断模块,用于判断选定的判定区域是否为弱一致性运动趋势,如果是则获取当前帧相应的方向判定,结束;如果否则判定当前帧不存在全局运动。
CN201010610108.4A 2010-12-28 2010-12-28 一种帧间编码的运动预测方法和系统 Expired - Fee Related CN102572418B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201010610108.4A CN102572418B (zh) 2010-12-28 2010-12-28 一种帧间编码的运动预测方法和系统
PCT/CN2011/072791 WO2012088806A1 (zh) 2010-12-28 2011-04-14 一种帧间编码的运动预测方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010610108.4A CN102572418B (zh) 2010-12-28 2010-12-28 一种帧间编码的运动预测方法和系统

Publications (2)

Publication Number Publication Date
CN102572418A true CN102572418A (zh) 2012-07-11
CN102572418B CN102572418B (zh) 2014-09-03

Family

ID=46382261

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010610108.4A Expired - Fee Related CN102572418B (zh) 2010-12-28 2010-12-28 一种帧间编码的运动预测方法和系统

Country Status (2)

Country Link
CN (1) CN102572418B (zh)
WO (1) WO2012088806A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103517078A (zh) * 2013-09-29 2014-01-15 清华大学深圳研究生院 分布式视频编码中边信息生成方法
CN108810549A (zh) * 2018-06-06 2018-11-13 天津大学 一种面向低功耗的流媒体播放方法
CN109194955A (zh) * 2018-11-16 2019-01-11 深圳市梦网百科信息技术有限公司 一种场景切换检测方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1568015A (zh) * 2003-06-27 2005-01-19 中国科学院计算技术研究所 多视角视频编解码预测补偿方法及装置
CN101207810A (zh) * 2006-12-21 2008-06-25 联想(北京)有限公司 一种h264视频编码快速模式选择方法和装置
CN101835044A (zh) * 2010-04-23 2010-09-15 南京邮电大学 一种频率域分布式视频编码中的分类组合方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101127912B (zh) * 2007-09-14 2010-11-17 浙江大学 利用动态背景帧的视频编码方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1568015A (zh) * 2003-06-27 2005-01-19 中国科学院计算技术研究所 多视角视频编解码预测补偿方法及装置
CN101207810A (zh) * 2006-12-21 2008-06-25 联想(北京)有限公司 一种h264视频编码快速模式选择方法和装置
CN101835044A (zh) * 2010-04-23 2010-09-15 南京邮电大学 一种频率域分布式视频编码中的分类组合方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103517078A (zh) * 2013-09-29 2014-01-15 清华大学深圳研究生院 分布式视频编码中边信息生成方法
CN108810549A (zh) * 2018-06-06 2018-11-13 天津大学 一种面向低功耗的流媒体播放方法
CN108810549B (zh) * 2018-06-06 2021-04-27 天津大学 一种面向低功耗的流媒体播放方法
CN109194955A (zh) * 2018-11-16 2019-01-11 深圳市梦网百科信息技术有限公司 一种场景切换检测方法及系统
CN109194955B (zh) * 2018-11-16 2021-04-30 深圳市梦网视讯有限公司 一种场景切换检测方法及系统

Also Published As

Publication number Publication date
WO2012088806A1 (zh) 2012-07-05
CN102572418B (zh) 2014-09-03

Similar Documents

Publication Publication Date Title
CN103517069B (zh) 一种基于纹理分析的hevc帧内预测快速模式选择方法
TWI445411B (zh) 在譯碼單元之視頻譯碼中執行局部運動向量推導之方法與相應裝置
CN1934871B (zh) 在视频编码中对帧间预测进行模式判定的方法和系统
CN101116345B (zh) 对视频通信的运动向量的时间估计
CN101448159B (zh) 一种基于率失真代价和模式频率的快速帧间模式选择方法
CN102316317B (zh) 一种生成图像预测值的方法和装置
CN101090502B (zh) 一种预测质量可控的快速运动估值方法
CN103188493B (zh) 图像编码装置及图像编码方法
CN101815218A (zh) 基于宏块特征的快速运动估计视频编码方法
CN101378504B (zh) 用于h.264编码的块匹配运动估计方法
US20090226105A1 (en) Adaptive motion estimation coding
CN104539962A (zh) 一种融合视觉感知特征的可分层视频编码方法
CN106878711A (zh) 视频编码和解码
CN101127912A (zh) 利用动态背景帧的视频编码方法
CN103297781A (zh) 一种基于纹理方向的hevc帧内编码方法、装置和系统
CN101621694B (zh) 一种运动估计方法、系统及显示终端
CN102572418A (zh) 一种帧间编码的运动预测方法和系统
CN105120282A (zh) 一种时域依赖的码率控制比特分配方法
CN103067704A (zh) 一种基于编码单元层次提前跳过的视频编码方法和系统
CN101895739B (zh) 基于块统计特性的编码方法
CN102158702B (zh) 自适应h.264码率控制方法
CN102547264B (zh) 一种帧间编码的运动预测方法和系统
CN106303528A (zh) 一种码流平移场景检测方法及系统
CN101313581A (zh) 视频图像编码方法及设备
US8442335B2 (en) Method for modifying a reference block of a reference image, method for encoding or decoding a block of an image by help of a reference block and device therefore and storage medium or signal carrying a block encoded by help of a modified reference block

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: SHENZHEN YUNZHOU MULTIMEDIA TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: SHENZHEN TEMOBI SCIENCE + TECHNOLOGY CO., LTD.

Effective date: 20140801

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20140801

Address after: Unit B4 9 building 518057 Guangdong city of Shenzhen province Nanshan District high in the four EVOC Technology Building No. 31

Applicant after: Shenzhen Yunzhou Multimedia Technology Co., Ltd.

Address before: 19, building 18, Changhong technology building, 518057 South twelve Road, South tech Zone, Nanshan District hi tech Zone, Guangdong, Shenzhen

Applicant before: Shenzhen Temobi Science & Tech Development Co.,Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP02 Change in the address of a patent holder

Address after: The central Shenzhen city of Guangdong Province, 518057 Keyuan Road, Nanshan District science and Technology Park No. 15 Science Park Sinovac A Building 1 unit 403, No. 405 unit

Patentee after: Shenzhen Yunzhou Multimedia Technology Co., Ltd.

Address before: Unit B4 9 building 518057 Guangdong city of Shenzhen province Nanshan District high in the four EVOC Technology Building No. 31

Patentee before: Shenzhen Yunzhou Multimedia Technology Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140903

Termination date: 20191228