CN1960491A - 基于h.264压缩域运动对象实时分割方法 - Google Patents

基于h.264压缩域运动对象实时分割方法 Download PDF

Info

Publication number
CN1960491A
CN1960491A CN 200610116363 CN200610116363A CN1960491A CN 1960491 A CN1960491 A CN 1960491A CN 200610116363 CN200610116363 CN 200610116363 CN 200610116363 A CN200610116363 A CN 200610116363A CN 1960491 A CN1960491 A CN 1960491A
Authority
CN
China
Prior art keywords
motion vector
motion
sigma
vector field
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200610116363
Other languages
English (en)
Other versions
CN100486336C (zh
Inventor
刘志
张兆杨
陆宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai University
University of Shanghai for Science and Technology
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN 200610116363 priority Critical patent/CN100486336C/zh
Publication of CN1960491A publication Critical patent/CN1960491A/zh
Application granted granted Critical
Publication of CN100486336C publication Critical patent/CN100486336C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出了一种基于匹配矩阵的H.264压缩域运动对象实时分割方法,分割所依赖的唯一信息是从H.264视频提取出的基于4×4块均匀采样的运动矢量场。首先对连续多帧的运动矢量场进行归一化并且迭代后向投影,获得累积运动矢量场以增强显著的运动信息。然后对累积运动矢量场进行全局运动补偿,同时采用快速的统计区域生长算法按照运动相似性将其分割成多个区域。利用上述两方面结果,提出基于匹配矩阵的运动对象分割方法,使之能有效的在视频序列中进行对象的跟踪与更新、对象的合并与分裂、新对象的出现以及对象消失等多种情况。对MPEG-4测试序列的实验结果表明,在一台CPU为3.0GHz,内存为512M的计算机上处理CIF格式的视频序列,平均每帧的处理时间为38ms,已能满足大多数实时应用25fps的要求,而且具有良好的分割质量。由于本发明提出的方法只使用了运动矢量场信息,因此它同样可适用于MPEG压缩域的运动对象分割。

Description

基于H.264压缩域运动对象实时分割方法
技术领域
本发明涉及到一种基于H.264压缩域运动对象实时分割方法,特别是与现有方法截然不同的是,免除了对压缩视频的完全解码,仅通过熵解码提取出的运动矢量用作分割所需的运动特征,因此计算量大大减少。而且它不受限于静止背景的视频序列,对于具有运动背景或者静止背景的视频序列,都能快速可靠地分割出运动对象。由于该方法只使用了运动矢量场信息,因此它同样可适用于MPEG压缩域的运动对象分割。
背景技术
运动对象分割是诸如视频索引与检索、智能视频监控、视频编辑和人脸识别等众多基于内容的多媒体应用所必需的一个前提条件。自从MPEG-4提出基于内容的视频编码,有关运动对象分割的研究大多集中在象素域,而基于压缩域的运动对象分割直至近年来才开始引起关注。在压缩域内进行运动对象分割,与象素域内的分割方法相比更适合于实际应用的需要。尤其是实际应用中的大多数视频序列已经压缩为某种格式,直接在此压缩域内进行运动对象分割,可免除对压缩视频进行完全解码;而且,在压缩域内需要处理的数据量要比象素域少很多,因此计算量大大减少;加之,从压缩视频中仅通过熵解码提取出的运动矢量和DCT系数,可直接用作分割所需的运动特征和纹理特征。因此,从压缩域分割运动对象具有快速的特点,可解决传统的象素域分割方法难于满足实时性分割的要求,适合于众多的具有实时性要求的应用场合。
目前,压缩域运动对象分割方法虽已有人提出,但基本上是针对MPEG-2压缩域的,H.264是最新的视频编码标准,相比于MPEG-2编码效率提高了一倍,目前越来越多的应用都在转向采用H.264来取代MPEG-2,但至今在H.264压缩域内进行运动对象分割的研究甚少。与MPEG压缩域相比,H.264压缩域中I帧的DCT系数不能直接用作分割的纹理特征,因为它们是在块的空间预测残差上进行变换的,而不是在原始块上进行变换。因此,在H.264域进行运动对象分割可直接使用的特征只有运动矢量信息。目前在H.264域,只有Zeng等提出了一种基于块的MRF模型从稀疏运动矢量场中分割运动对象的方法,根据各个块运动矢量的幅值赋予各个块不同类型的标记,通过最大化MRF的后验概率标记出属于运动对象的块。但是,这种方法只适用于静态背景的视频序列,而且分割的准确度不高,计算量也较大。
发明内容
本发明的目的是提供一种基于H.264压缩域运动对象实时分割方法,分割所用的唯一信息是从H.264压缩视频中提取出的基于4×4块均匀采样的运动矢量场。本方法可免除对压缩视频的完全解码,使用熵解码提取出的运动矢量作为分割所需的运动特征,因此计算量大大减少,以达到实时运动对象分割的目的。
为达到上述的目的,本发明的构思是:
如图1所示,对输入的H.264压缩视频流提取运动矢量并归一化,然后进行迭代后向投影,获得可显著增强运动信息的累积运动矢量场。再进行全局运动补偿并且按照运动相似性将累积运动矢量场分割成多个区域,然后用一个匹配矩阵表示当前帧的分割区域和前一帧运动对象在当前帧投影的相关性,基于这个匹配矩阵将运动对象分割出来。
根据上述构思,本发明的技术方案是:
一种基于H.264压缩域的运动对象实时分割方法,其特征在于对连续多帧的运动矢量场归一化并进行迭代后向投影,获得累积运动矢量场;然后对累积运动矢量场进行全局运动补偿,同时采用快速的统计区域生长算法按照运动相似性将其分割成多个区域;利用上述两方面结果,采用本发明提出的基于匹配矩阵的运动对象分割方法分割出运动对象,其中可有效地在视频序列中进行对象的跟踪与更新、对象的合并与分裂、对象的出现与消失等多种情况;其步骤是:
a.运动矢量场归一化:从H.264视频中提取出运动矢量场并进行时域和空域上的归一化;
b.累积运动矢量场:利用连续多帧的运动矢量场进行迭代后向投影来获得更加可靠的累积运动矢量场;
c.全局运动补偿:在累积运动矢量场上进行全局运动估计后进行补偿以获得各4×4块的残差;
d.区域分割:采用统计区域生长方法将累积运动矢量场分割成多个具有相似运动的区域;
e.对象分割:采用基于匹配矩阵的分割方法将运动对象分割出来。上述的运动矢量场归一化的步骤是:
(1)时域归一化:将当前帧的运动矢量除以当前帧与参考帧的间隔帧数,即时域距离;
(2)空域归一化:将凡尺寸大于4×4的各个宏块运动矢量直接赋给该宏块所覆盖的所有4×4块。
上述的累积运动矢量场的步骤是:
(1)利用当前帧之后若干帧的运动矢量场,对相邻帧的运动矢量场进行后向投影,就是通过对各投影块的运动矢量乘以不同的比例因子后相加得到当前块的投影运动矢量,比例因子的选定方法为:如果重叠区域的总面积大于当前块面积的一半,则各投影块的比例因子取为该投影块与当前块的相重叠的面积除以所有投影块与当前块重叠区域的总面积;否则,各投影块的比例因子取为其重叠面积与当前块面积之比;
(2)从后帧开始迭代累积以获得当前帧的累积运动矢量场;
上述的全局运动补偿的步骤是:
(1)采用6参数的仿射运动模型估算全局运动矢量场;
①模型参数初始化:设m=(m1,m2,m3,m4,m5,m6)是全局运动模型的参数矢量,模型参数m(0)初始化为: m ( 0 ) = 1 0 1 N Σ i = 1 N mv x i 0 1 1 N Σ j = 1 N mv y i T ;
②剔除局外点:首先计算当前帧中心坐标为(xi,yi)的第i个块在前一帧的估计中心坐标(xi′,yi′): x i ′ y i ′ = m 1 m 2 m 4 m 5 x i y i + m 3 m 6 , 则预测运动矢量((xi′-xi),(yi′-yi))和原始累积运动矢量(mvxi,mvyi)的偏差(exi,eyi)计算为: ex i = x i ′ - x i - mvx i e y i = y i ′ - y i - mv y i , 使用这个式子计算出每个4×4块的预测偏差(exi,eyi),最后计算出偏差幅度平方和(exi 2+eyi 2)的直方图,然后剔除直方图中那些偏差幅度平方和大于25%的运动矢量;
③模型参数更新:使用前面步骤中保留下来的运动矢量和Newton-Raphson方法来更新模型参数,第l步迭代中新的模型参数矢量m(l)定义如下:m(l)=m(l-1)-H-1b,这里Hessian矩阵H和梯度矢量b计算如下:
H = Σ i ∈ R x i 2 Σ i ∈ R x i y i Σ i ∈ R x i 0 0 0 Σ i ∈ R x i y i Σ i ∈ R y i 2 Σ i ∈ R y i 0 0 0 Σ i ∈ R x i Σ i ∈ R y i Σ i ∈ R 1 0 0 0 0 0 0 Σ i ∈ R x i 2 Σ i ∈ R x i y i Σ i ∈ R x i 0 0 0 Σ i ∈ R x i y i Σ i ∈ R y i 2 Σ i ∈ R y i 0 0 0 Σ i ∈ R x i Σ i ∈ R y i Σ i ∈ R 1
b = Σ i ∈ R x i e x i Σ i ∈ R y i e x i Σ i ∈ R e x i Σ i ∈ R x i e y i Σ i ∈ R y i e y i Σ i ∈ R e y i T
这里R代表保留下来的块的集合;
④结束条件:重复步骤②和③最多5次,而且以下两个条件之一如果被满足的话也提前结束迭代:(i)计算m(l)和在摄像机静止情况下的全局运动向量mstatic=[1 0 0 0 1 0]T的差值,如果对于每一个参数分量,这个差值小于0.01,就判断为属于摄像机静止的情况,结束迭代;(ii)计算m(l)和m(l-1)的差值,如果这个差值的参数分量m3和m6小于0.01,而且其它参数分量小于0.0001,则迭代结束;
⑤将得到的全局运动模型参数矢量m代入 x i ′ y i ′ = m 1 m 2 m 4 m 5 x i y i + m 3 m 6 , 求出前一帧的估计坐标(xi′,yi′),最后得到全局运动矢量场((xi′-xi),(yi′-yi));
(2)计算全局运动矢量场与累积运动矢量场中各4×4块的残差。
上述的区域分割是采用统计区域生长算法将累积运动矢量场分划成多个具有相似运动的区域,步骤如下:
(1)计算四邻域内任意相邻块组的运动差异性度量;
(2)所有相邻块组按照运动差异性度量从小到大的次序进行排序;
(3)将运动差异性度量最小的相邻块组合并,以此处开始区域生长过程,在每次区域生长时,当前两个块组分别属于相邻的两个区域,则判断这两个区域是否合并的条件是这两个区域的平均运动矢量之差是否小于阈值条件:
Δ ( R ) = SR 2 2 Q | R | ( min ( SR , | R | ) log ( 1 + | R | ) + 2 log 6 wh ) , 其中SR表示运动矢量的动态范围,|R|表示区域包含的运动矢量数目,wh表示运动矢量场的尺寸,参数Q用来控制运动矢量场的分割程度,就样就可以将运动矢量场适度地分割成若干具有相似运动的区域;
(4)计算每个分割区域在全局运动补偿后的平均残差;
(5)区分最可靠的背景区域和其它对象所在的区域,在面积大于整个运动矢量场10%的若干分割区域中选择平均残差最小的区域作为可靠的背景区域,标记为R0 t,剩下的区域作为运动对象可能存在的区域Ri t;最后对当前帧所分割的M个对象区域和1个背景区域分别标记,分割结果记为Lreg t
上述的对象分割是利用前一帧,t-1时刻,已经获得的运动对象分割结果,来判断当前帧,t时刻,各个分割区域是否与前一帧的某个对象匹配,以此构造匹配矩阵;基于匹配矩阵判断对象的跟踪与更新、对象的合并、对象的分裂、新对象的出现、旧对象的消失等情况,最终获得当前帧的若干运动对象;其步骤是:
(1)采用后向投影方法获得前一帧,t-1时刻,各个对象在当前帧t时刻的投影区域,先将前一帧的N个运动对象Oj t-1和1个背景对象O0 t-1标记出来,然后采用后向投影的方法获得前一帧各个对象在当前帧的投影区域。就是利用当前帧累积运动矢量场中任意块的坐标和其对应的累积运动矢量的差求出这个块在前一帧中的匹配位置,然后将前一帧匹配位置上的块对象投影到当前帧并逐个标记出来,记为Lprog t
(2)构造矩阵CMt,它表示分割区域与对象投影相互重叠的面积;构造矩阵CMRt,它表示每个分割区域落在各个对象投影内的比例;构造矩阵CMCt,它表示每个对象投影落在各个分割区域内的比例;根据标记图象Lreg t和Lproj t,构造3个M+1行N+1列的矩阵CMt,CMRt,CMCt。其中矩阵CMt中的任意元素CMt(i,j)取值为在Lreg t中标记为i且在Lproj t标记为j的象素数目,即分割区域Lreg t与对象投影Lproj t相互重叠的面积。而矩阵CMRt(i,j)定义为CMRt第i行的各个元素是分割区域Ri t落在各个对象投影内的比例;矩阵CMCt(i,j)定义为CMCt第j列的各个元素是对象Oj t-1的投影落在各个分割区域内的比例;
(3)构造矩阵CMMt,它表示当前帧分割区域和对象投影之间的关联程度,矩阵CMMt记录了CMRt和CMCt所反映的Lreg t和Lproj t之间的相关信息;CMMt首先置为M+1行、N+1列的零矩阵;接着对CMRt进行行扫描找到每一行最大值所在的位置,对CMMt中相应位置处的元素值加1;然后对CMCt进行列扫描找到每一列最大值所在的位置,对CMMt中相应位置处的元素值加2;生成的矩阵CMMt的纵坐标依次表示为当前帧背景区域R0 t和运动区域Ri t(i=1,2,L M),横坐标依次表示为前一帧背景对象O0 t-1和运动对象Oj t-1(j=1,2,L,N),矩阵中各元素的可能取值为0,1,2,3;CMMt中任意不为0的元素CMMt(i,j)表明了分割区域Ri t与对象Oj t-1存在一定的相关性,具体而言:
①CMMt(i,j)=1,表明分割区域Ri t在很大程度上属于前一帧对象Oj t-1
②CMMt(i,j)=2,表明前一帧对象Oj t-1在很大程度上包含在分割区域Ri t中;
③CMMt(i,j)=3,同时包含了上述两种情况,表明Ri t和Oj t-1具有极强的相关性;需要进一步比较,如果CMRt(i,j)>CMCt(i,j),则CMMt(i,j)=1;否则,CMMt(i,j)=2;最后生成的CMMt取值范围为0,1,2;
(4)基于匹配矩阵CMMt对单个对象的跟踪与更新、新对象出现、对象的合并、对象的分裂以及对象的消失五类情况进行对象分割;通过矩阵CMMt可以有效地建立起分割区域与运动对象的关联关系,它能够以一种统一的方式有效地处理以下五种情况:
①单个对象跟踪与更新(1→1);
②新对象出现(0→1);
③对象的合并(m→1);
④对象的分裂(1→m);
⑤对象的消失(1→0)。
本发明与现有技术相比较,具有如下的突出特点和优点:本发明提供的基于压缩域的实时运动对象分割方法,是基于H.264视频流,即与现有方法截然不同的是现有的压缩域视频对象分割方法主要适用于MPEG域,而本发明不仅适用于H.264压缩域,同样适用于MPEG压缩域。而且本发明不受限于静止背景的视频序列,不论对于具有运动背景或者静止背景的视频序列,都能快速可靠地分割出运动对象。此外本发明提出的匹配矩阵分割运动对象的方法,几乎能够对视频对象运动的各种情况作出实时分割,因此分割对象的效果很好,具有很强的适用性。
附图说明
图1是本发明的基于匹配矩阵的H.264压缩域运动对象实时分割方法的程序框图。
图2是图1中运动矢量场归一化和累积运动矢量场的结构框图。
图3是图1中全局运动补偿和区域分割的结构框图。
图4是图1中对象分割的结构框图。
图5是对序列Coastguard中各个典型帧(第4、37、61、208帧)运动对象分割结果的图示。
图6是对序列Mobile中各个典型帧(第4、43、109、160帧)运动对象分割结果的图示。
具体实施方式
本发明的一个实施例子结合附图详述如下:
本发明基于匹配矩阵的H.264压缩域运动对象实时分割方法是按图1所示程序框图,在CPU为3.0GHz、内存512M的PC测试平台上编程实现,图5和图6示出仿真测试结果。
参见图1,本发明基于匹配矩阵的H.264压缩域运动对象实时分割方法,通过运动矢量场的归一化和累积增强了显著的运动信息,然后对累积运动矢量场进行全局运动补偿,采用统计区域生长算法和基于匹配矩阵的运动对象分割方法来分割区域和运动对象,具有算法简单,对象分割速度快,分割效果好的特点。
其步骤是:
(1)运动矢量场归一化:从H.264视频中提取出运动矢量场并进行时域和空域上归一化;
(2)累积运动矢量场:利用连续多帧的运动矢量场进行迭代后向投影来获得更加可靠的累积运动矢量场;
(3)全局运动补偿:在累积运动矢量场上进行全局运动估计后进行补偿以获得各4×4块的残差;
(4)区域分割:采用统计区域生长方法将累积运动矢量场分割成多个具有相似运动的区域;
(5)对象分割:采用基于匹配矩阵的分割算法将运动对象分割出来。
上述步骤(1)的运动矢量场归一化的过程如下:
①时域归一化:将当前帧的运动矢量除以当前帧与参考帧的间隔帧数,即时域距离;
②空域归一化:将凡尺寸大于4×4的各个宏块运动矢量直接赋给该宏块所覆盖的所有4×4块。
上述步骤(2)的累积运动矢量场的过程如下:
①利用当前帧之后若干帧的运动矢量场,对相邻帧的运动矢量场进行后向投影;
②从后帧开始迭代累积以获得当前帧的累积运动矢量场。
上述步骤(3)的全局运动补偿的过程如下:
①采用6参数的仿射运动模型估算全局运动矢量场;
②计算出各4×4块经全局运动补偿后的残差。
上述步骤(4)的区域分割的过程如下:
①计算四邻域内任意相邻块组的运动差异性度量;
②所有相邻块组按照运动差异性度量从小到大的次序进行排序;
③将运动差异性度量最小的相邻块组合并,以此处开始区域生长过程;
④计算每个分割区域在全局运动补偿后的平均残差;
⑤区分最可靠的背景区域和其它对象所在的区域。
上述步骤(5)的对象分割的过程如下:
①采用后向投影方法获得前一帧各个对象在当前帧的投影区域;
②构造矩阵CMt,它表示分割区域与投影对象相互重叠的面积;构造矩阵CMRt,它表示每个分割区域落在各个对象投影内的比例;构造矩阵CMCt,它表示每个对象投影落在各个分割区域内的比例;
③构造矩阵CMMt,它表示当前帧分割区域和对象投影之间的关联程度;
④基于匹配矩阵CMMt对单个对象跟踪与更新、新对象出现、对象的合并、对象的分裂以及对象的消失等五类情况进行对象分割。
下面对本实施例子结合总框图(图1)的五个步骤给予进一步详细说明:
a.运动矢量场归一化:
如图2所示,将当前帧的运动矢量除以当前帧与参考帧的间隔帧数得到时域上的归一化,将当前帧中尺寸大于4×4的块的运动矢量直接赋给该块所覆盖的所有4×4块获得空域上的归一化。
b.累积运动矢量场:
如图2所示,先利用当前帧之后若干帧的运动矢量场,对相邻帧的运动矢量场进行后向投影。就是通过对各投影块的运动矢量乘以不同的比例因子后相加得到当前块的投影运动矢量,比例因子的选定方法为:如果重叠区域的总面积大于当前块面积的一半,则各投影块的比例因子取为该投影块与当前块的相重叠的面积除以所有投影块与当前块重叠区域的总面积;否则,各投影块的比例因子取为其重叠面积与当前块面积之比。然后从后帧开始迭代累积以获得当前帧的累积运动矢量场。
c.全局运动补偿:
如图3所示,采用6参数的仿射运动模型估算全局运动矢量场,利用它与累积运动矢量场之差就可获得累积运动矢量场任意块经全局运动补偿后的残差。其
步骤是:
(1)采用6参数的仿射运动模型估算全局运动矢量场:
①模型参数初始化:
设m=(m1,m2,m3,m4,m5,m6)是全局运动模型的参数矢量,模型参数m(0)初始化为: m ( 0 ) = 1 0 1 N Σ i = 1 N mv x i 0 1 1 N Σ i = 1 N mv y i T ;
②剔除局外点:
首先计算当前帧中心坐标为(xi,yi)的第i个块在前一帧的估计中心坐标(xi′,yi′): x i ′ y i ′ = m 1 m 2 m 4 m 5 x i y i + m 3 m 6 , 则预测运动矢量((xi′-xi),(yi′-yi))和原始累积运动矢量(mvxi,mvyi)的偏差(exi,eyi)计算为: ex i = x i ′ - x i - mvx i e y i = y i ′ - y i - mv y i . 使用这个式子计算出每个4×4块的预测偏差(exi,eyi),最后计算出偏差幅度的平方和(exi 2+eyi 2)的直方图,然后剔除直方图中那些偏差幅度平方和大于25%的运动矢量。
③模型参数更新:
使用前面步骤中保留下来的运动矢量和Newton-Raphson方法来更新模型参数。第l步迭代中新的模型参数矢量m(l)定义如下:m(l)=m(l-1)-H-1b,这里Hessian矩阵H和梯度矢量b计算如下:
H = Σ i ∈ R x i 2 Σ i ∈ R x i y i Σ i ∈ R x i 0 0 0 Σ i ∈ R x i y i Σ i ∈ R y i 2 Σ i ∈ R y i 0 0 0 Σ i ∈ R x i Σ i ∈ R y i Σ i ∈ R 1 0 0 0 0 0 0 Σ i ∈ R x i 2 Σ i ∈ R x i y i Σ i ∈ R x i 0 0 0 Σ i ∈ R x i y i Σ i ∈ R y i 2 Σ i ∈ R y i 0 0 0 Σ i ∈ R x i Σ i ∈ R y i Σ i ∈ R 1
b = Σ i ∈ R x i e x i Σ i ∈ R y i e x i Σ i ∈ R e x i Σ i ∈ R x i e y i Σ i ∈ R y i e y i Σ i ∈ R e y i T
这里R代表保留下来的块的集合。
④结束条件:重复步骤②和③最多5次,而且以下两个条件之一如果被满足的话也提前结束迭代:
(i)计算m(l)和在摄像机静止情况下的全局运动向量mstatic=[1 0 0 0 1 0] T的差值,如果对于每一个参数分量,这个差值小于0.01,就判断为属于摄像机静止的情况,结束迭代;
(ii)计算m(l)和m(l-1)的差值,如果这个差值的参数分量m3和m6小于0.01,而且其它参数分量小于0.0001,则迭代结束。
⑤将得到的全局运动模型参数矢量m代入 x i ′ y i ′ = m 1 m 2 m 4 m 5 x i y i + m 3 m 6 , 求出前一帧的估计坐标(xi′,yi′),最后得到全局运动矢量场((xi′-xi),(yi′-yi))。
(2)计算全局运动矢量场与累积运动矢量场中各4×4块的残差。
d.区域分割:
如图3所示,本发明采用统计区域生长算法实现对累积运动矢量场的区域分割。步骤详述如下:
(1)计算四邻域内任意相邻块组的运动差异性度量;
(2)所有相邻块组按照运动差异性度量从小到大的次序进行排序;
(3)将运动差异性度量最小的相邻块组合并,以此处开始区域生长过程。在每次区域生长时,当前两个块组分别属于相邻的两个区域,则判断这两个区域是否合并的条件是这两个区域的平均运动矢量之差是否小于阈值条件:
Δ ( R ) = SR 2 2 Q | R | ( min ( SR , | R | ) log ( 1 + | R | ) + 2 log 6 wh ) , 其中SR表示运动矢量的动态范围,|R|表示区域包含的运动矢量数目,wh表示运动矢量场的尺寸,参数Q用来控制运动矢量场的分割程度,就样就可以将运动矢量场适度地分割成若干具有相似运动的区域;
(4)计算每个分割区域在全局运动补偿后的平均残差;
(5)区分最可靠的背景区域和其它对象所在的区域。在面积大于整个运动矢量场10%的若干分割区域中选择平均残差最小的区域作为可靠的背景区域,标记为R0 t,剩下的区域作为运动对象可能存在的区域Ri t。最后对当前帧所分割的M个对象区域和1个背景区域分别标记,分割结果记为Lreg t
e.对象分割
如图4所示,先通过计算找到在相邻两帧中匹配的块,再将前一帧的运动对象投影至当前帧并标记为对象投影,然后利用当前帧对象投影和分割区域的相关性构造3个M+1行N+1列的矩阵CMt,CMRt,CMCt。再由矩阵CMRt和CMCt生成匹配矩阵CMMt,基于这个匹配矩阵对五类不同的运动对象情况作出分割。步骤详述如下:
(1)采用后向投影方法获得前一帧,t-1时刻,各个对象在当前帧t时刻的投影区域。先将前一帧的N个运动对象Oj t-1和1个背景对象O0 t-1标记出来,然后采用后向投影的方法获得前一帧各个对象在当前帧的投影区域。就是利用当前帧累积运动矢量场中任意块的坐标和其对应的累积运动矢量的差求出这个块在前一帧中的匹配位置,然后将前一帧匹配位置上的块对象投影到当前帧并逐个标记出来,记为Lproj t
(2)构造矩阵CMt,它表示分割区域与对象投影相互重叠的面积;构造矩阵CMRt,它表示每个分割区域落在各个对象投影内的比例;构造矩阵CMCt,它表示每个对象投影落在各个分割区域内的比例。根据标记图象Lreg t和Lproj t,构造3个M+1行N+1列的矩阵CMt,CMRt,CMCt。其中矩阵CMt中的任意元素CMt(i,j)取值为在Lreg t中标记为i且在Lproj t标记为j的象素数目,即分割区域Lreg t与对象投影Lproj t相互重叠的面积。而矩阵CMRt(i,j)定义为CMRt第i行的各个元素是分割区域Ri t落在各个对象投影内的比例;矩阵CMCt(i,j)定义为CMCt第j列的各个元素是对象Oj t-1的投影落在各个分割区域内的比例。
(3)构造矩阵CMMt,它表示当前帧分割区域和对象投影之间的关联程度。矩阵CMMt记录了CMRt和CMCt所反映的Lreg t和Lproj t之间的相关信息。CMMt首先置为M+1行N+1列的零矩阵;接着对CMRt进行行扫描找到每一行最大值所在的位置,对CMMt中相应位置处的元素值加1;然后对CMCt进行列扫描找到每一列最大值所在的位置,对CMMt中相应位置处的元素值加2。生成的矩阵CMMt的纵坐标依次表示为当前帧背景区域R0 t和运动区域Ri t(i=1,2,L M),横坐标依次表示为前一帧背景对象O0 t-1和运动对象Oj t-1(j=1,2,L,N),矩阵中各元素的可能取值为0,1,2,3。CMMt中任意不为0的元素CMMt(i,j)表明了分割区域Ri t与对象Oj t-1存在一定的相关性,具体而言:
①CMMt(i,j)=1,表明分割区域Ri t在很大程度上属于前一帧对象Oj t-1
②CMMt(i,j)=2,表明前一帧对象Oj t-1在很大程度上包含在分割区域Ri t中;
③CMMt(i,j)=3,同时包含了上述两种情况,表明Ri t和Oj t-1具有极强的相关性。需要进一步比较,如果CMRt(i,j)>CMCt(i,j),则CMMt(i,j)=1;否则,CMMt(i,j)=2。最后生成的CMMt取值范围为0,1,2。
(4)基于匹配矩阵CMMt对单个对象的跟踪与更新、新对象出现、对象的合并、对象的分裂以及对象的消失五类情况进行对象分割。通过矩阵CMMt可以有效地建立起分割区域与运动对象的关联关系,它能够以一种统一的方式有效地处理以下五种情况:
①单个对象跟踪与更新(1→1):如果CMMt的第i行只有一个非零元素CMMt(i,j),而且第j列也只有这一个非零元素CMMt(i,j),那么表明分割区域Ri t只与对象Oj t-1存在相关性,根据CMMt(i,j)的取值采取不同的策略:如果CMMt(i,j)=2,采取更新策略,用当前帧的分割区域来表示更新后的对象,即 O j t = R i t . 如果CMMt(i,j)=1,一般采取对象跟踪的策略,即用前一帧对象的投影来表示当前帧的对象,即 O j t = Proj ( O j t - 1 ) ; 另外,如果分割区域Ri t同时还满足阈值条件: | R i t | > T s , ER i t > αE R 0 t , 其中Ts=64,α=1.5,|Ri t|表示区域Ri t所包含的运动矢量数目,ERi t表示区域Ri t的平均残差,ER0 t表示背景的平均残差;则认为Ri t是一个可靠的运动区域,可用来表示当前帧的运动对象,即 O j t = R i t .
②新对象出现(0→1):如果CMMt的第i行只有一个非零元素且位于第1列,值为1,表明该分割区域Ri t在前一帧还是背景对象O0 t-1,并不属于已有的任何运动对象。如果Ri t同时满足上面①中的阈值条件,则可认为Ri t是一个新出现的运动对象,记为 O M + 1 t = R i t .
上述①和②两种情况下,CMMt某行的非零元素个数都为1。如果CMMt的第i行存在多个非零元素,则表明分割区域Ri t可能与多个对象存在相关性。在这种情况下,只需要将前一帧的对象投影到当前帧作为当前帧的运动对象,实现对象的跟踪,即
O j t = Proj ( O j t - 1 ) .
③对象的合并(m→1):如果CMMt的第i行上除第1列外有2个以上的元素取值为2,表明前一帧中2个以上的对象在很大程度上包含在新的分割区域Ri t中,则Ri t表示了这些对象合并后的新对象,记为 O M + 1 t = R i t . 在这种情况下,分割区域Ri t往往包含了2个或2个以上具有十分相似的运动且在空间相互邻接的对象,则它们在当前帧作为一个新的合并对象而被分割出来。
④对象的分裂(1→m):如果CMMt的第j列中有2个以上的元素取值为1,则表明前一帧对象Oj t-1在当前帧分裂成多个分割区域Rs1 t,Rs2 tL,Rsm t。即使这些区域在空间上并不邻接,在当前帧的分割中,仍然认为这些分割区域属于同一个对象,直到这些具有相同对象标记却在空间相互不邻接的多个分割区域在随后的若干帧中表现出不同的运动,则对这些分割区域赋予不同的对象标记,记为 O s i t = R s i t , 以实现真正的对象分裂。
⑤对象的消失(1→0):如果CMMt的第j列只有1个非零元素且位于第1行,值为2,表明前一帧对象Oj t-1的投影落在当前帧的背景区域R0 t,则认为Oj t-1在当前帧消失。
如上所述已经能够有效地处理在视频序列的运动对象分割过程中可能出现的5种情况。但当场景发生较大变化时,连续多帧都对所有对象采取了跟踪的策略,即都是上一帧各个对象的投影,表明当前帧各个分割区域与前一帧各个运动对象的相关性很弱,因此将按照情况②来判断是否有新对象出现,需要重新检测运动对象。
以下给出输入视频格式为352×288的CIF时的实例,采用JM8.6版本的H.264编码器对MPEG-4标准测试序列进行编码,作为测试用的H.264压缩视频。H.264编码器的配置如下:Baseline Profile,IPPP,每30帧插入1个I帧,3个参考帧,运动估计的搜索范围为[-32,32],量化参数为30,编码帧数为300帧。在实验中,我们采取每隔3帧(运动矢量累积过程中使用的帧数)计算一次累积运动矢量场的做法,总共获得了100帧累积运动矢量场来测试本文提出的运动对象分割算法的性能。先从当前帧由累积运动矢量场得到区域分割结果,然后将前一帧运动对象投影到当前帧,基于这两个结果采用基于匹配矩阵的分割方法将运动对象分割出来。
采用典型的标准测试序列Coastguard和Mobile作为输入视频进行测试,实验结果分别如图5和图6所示。两图中第1列为当前帧的原始图象,第2列为当前帧由累积运动矢量场分割所得的区域分割结果,第3列为前一帧运动对象的在当前帧的投影区域,第4列为当前帧分割出的运动对象。平均每帧的处理时间为38ms,已能满足大多数实时应用25fps的要求。考虑到本文的分割方法其实是每隔3帧进行一次运动对象分割,对于给出的原始视频序列而言,完全可以在实时解码的同时就能分割出相应的运动对象,即使要求每帧都分割出相应的运动对象,只需要对其余帧进行对象投影,其计算量也很小,仍能实时分割出运动对象。
实验1:序列Coastguard具有明显的全局运动,摄像机首先自右向左平移来跟踪画面中间的小船,然后自左向右运动来跟踪从画面左边出现的大船。图5第1行(序列第4帧)为摄像机自右向左跟踪小船的运动,图5第2行(序列第37帧)为新对象大船由左向右运动,图5第3行(序列第61帧)为两个运动对象大船和小船完全出现在摄像机的场景中,图5第4行(序列第208帧)为摄像机开始自左向右跟踪大船的运动。由图5第2列图象可以看出,对累积运动矢量场的分割大多能够比较准确地分割出两个运动对象所在的区域,而且符合全局运动模型的大部分背景区域也都包含在一个大的分割区域中,白色的区域表示了经运动补偿后最可靠的背景区域,因此本文采取的对运动矢量场的累积以及分割方法是有效的,能够利用运动矢量信息获得一个适度分割的结果。结合第3列所示的前一帧各个对象在当前帧的投影区域,利用基于匹配矩阵的运动对象分割方法,能够在整个序列中稳定可靠地分割出第4列所示的运动对象。
实验2:序列Mobile具有更复杂的全局运动,除了摄像机的平移和俯仰运动外,在序列的前半段还有明显的缩放运动。图6第1行(序列第4帧)场景中总共包括3个运动对象,小火车推动球在轨道上运动,而挂历在间歇性地上下运动,因此运动对象分割的难度更大。由图6的分割结果可以看出,本发明提出的运动对象分割算法在运动对象停止运动的情况下,能够通过对象投影分割出该运动对象,如图6第2行(序列第43帧)的球以及图6第3行(序列第109帧)的挂历。此外,图6的实验结果也表明了本文的运动对象分割算法能够很好地处理运动对象的合并与分裂。在图6第3行(序列第109帧),由于小火车已经在无缝隙地推着球运动,因此两个在空间上紧密邻接且运动完全一致的运动对象被视作发生了对象合并;在图6第4行(序列第160帧)对有了间隙的两个对象,且运动程度不再相同时,两个对象被分割成了两个区域,真正实现两个对象的分裂。

Claims (6)

1.一种基于匹配矩阵的H.264压缩域运动对象实时分割方法,其特征在于对连续多帧的运动矢量场归一化并进行迭代后向投影,获得累积运动矢量场。然后对累积运动矢量场进行全局运动补偿,同时采用快速的统计区域生长算法按照运动相似性将其分割成多个区域。利用上述两方面结果,采用本发明提出的基于匹配矩阵的运动对象分割方法分割出运动对象,其中可有效地在视频序列中进行对象的跟踪与更新、对象的合并与分裂、对象的出现与消失等多种情况;其步骤如下:
a.运动矢量场归一化:从H.264视频中提取出运动矢量场并进行时域和空域上的归一化;
b.累积运动矢量场:利用连续多帧的运动矢量场进行迭代后向投影来获得更加可靠的累积运动矢量场;
c.全局运动补偿:在累积运动矢量场上进行全局运动估计后进行补偿以获得各4×4块的残差;
d.区域分割:采用统计区域生长方法将累积运动矢量场分割成多个具有相似运动的区域;
e.对象分割:采用基于匹配矩阵的分割方法将运动对象分割出来。
2.根据权利要求1所述的基于匹配矩阵的H.264压缩域运动对象实时分割方法,其特征在于所述的运动矢量场归一化的步骤是:(1)时域归一化:将当前帧的运动矢量除以当前帧与参考帧的间隔帧数,即时域距离;(2)空域归一化:将凡尺寸大于4×4的各个宏块运动矢量直接赋给该宏块所覆盖的所有4×4块。
3.根据权利要求1所述的基于匹配矩阵的H.264压缩域运动对象实时分割方法,其特征在于所述的累积运动矢量场的步骤是:(1)利用当前帧之后若干帧的运动矢量场,对相邻帧的运动矢量场进行后向投影,就是通过对各投影块的运动矢量乘以不同的比例因子后相加得到当前块的投影运动矢量,比例因子的选定方法为:如果重叠区域的总面积大于当前块面积的一半,则各投影块的比例因子取为该投影块与当前块的相重叠的面积除以所有投影块与当前块重叠区域的总面积;否则,各投影块的比例因子取为其重叠面积与当前块面积之比;(2)然后从后帧开始迭代累积以获得当前帧的累积运动矢量场。
4.根据权利要求1所述的基于匹配矩阵的H.264压缩域运动对象实时分割方法,其特征在于全局运动补偿,是先采用仿射运动模型估算全局运动矢量场,然后计算出各4×4块经全局运动补偿后的残差。步骤如下:
(1)采用6参数的仿射运动模型估算全局运动矢量场:
①模型参数初始化:设m=(m1,m2,m3,m4,m5,m6)是全局运动模型的参数矢量,模型参数m(0)初始化为: m ( 0 ) = 1 0 1 N Σ i = 1 N mvx i 0 1 1 N Σ i = 1 N mvy i T ;
②剔除局外点:
首先计算当前帧中心坐标为(xi,yi)的第i个块在前一帧的估计中心坐标(xi′,yi′): x i ′ y i ′ = m 1 m 2 m 4 m 5 x i y i + m 3 m 6 , 则预测运动矢量((xi′-xi),(yi′-yi))和原始累积运动矢量(mvxi,mvyi)的偏差(exi,eyi)计算为: ex i = x i ′ - x i - mvx i ey i = y i ′ - y i - mvy i , 使用这个式子计算出每个4×4块的预测偏差(exi,eyi),最后计算出偏差幅度平方和(exi 2+eyi 2)的直方图,然后剔除直方图中那些偏差幅度平方和大于25%的运动矢量;
③模型参数更新
使用前面步骤中保留下来的运动矢量和Newton-Raphson方法来更新模型参数,第l步迭代中新的模型参数矢量m(l)定义如下:m(l)=m(l-1)-H-1b,这里Hessian矩阵H和梯度矢量b计算如下:
H = Σ i ∈ R x i 2 Σ i ∈ R x i y i Σ i ∈ R x i 0 0 0 Σ i ∈ R x i y i Σ i ∈ R y i 2 Σ i ∈ R y i 0 0 0 Σ i ∈ R x i Σ i ∈ R y i Σ i ∈ R 1 0 0 0 0 0 0 Σ i ∈ R x i 2 Σ i ∈ R x i y i Σ i ∈ R x i 0 0 0 Σ i ∈ R x i y i Σ i ∈ R y i 2 Σ i ∈ R y i 0 0 0 Σ i ∈ R x i Σ i ∈ R y i Σ i ∈ R 1
b = Σ i ∈ R x i e x i Σ i ∈ R y i e x i Σ i ∈ R ex i Σ i ∈ R x i e y i Σ i ∈ R y i ey i Σ i ∈ R e y i T
这里R代表保留下来的块的集合;
④结束条件:重复步骤②和③最多5次,而且以下两个条件之一如果被满足的话也提前结束迭代:(i)计算m(l)和在摄像机静止情况下的全局运动向量mstatic=[100010]T的差值,如果对于每一个参数分量,这个差值小于0.01,就判断为属于摄像机静止的情况,结束迭代;(ii)计算m(l)和m(l-1)的差值,如果这个差值的参数分量m3和m6小于0.01,而且其它参数分量小于0.0001,则迭代结束;
⑤将得到的全局运动模型参数矢量m代入 x i ′ y i ′ = m 1 m 2 m 4 m 5 x i y i + m 3 m 6 , 求出前一帧的估计坐标(xi′,yi′),最后得到全局运动矢量场((xi′-xi),(yi′-yi));
(2)计算全局运动矢量场与累积运动矢量场中各4×4块的残差。
5.根据权利要求1所述的基于匹配矩阵的H.264压缩域运动对象实时分割方法,其特征在于所述的区域分割,是采用统计区域生长算法将累积运动矢量场分割成多个具有相似运动的区域。步骤如下:
(1)计算四邻域内任意相邻块组的运动差异性度量;
(2)所有相邻块组按照运动差异性度量从小到大的次序进行排序;
(3)将运动差异性度量最小的相邻块组合并,以此处开始区域生长过程,在每次区域生长时,当前两个块组分别属于相邻的两个区域,则判断这两个区域是否合并的条件是这两个区域的平均运动矢量之差是否小于阈值条件:
Δ ( R ) = SR 2 2 Q | R | ( min ( SR , | R | ) log ( 1 + | R | ) + 2 log 6 wh ) , 其中SR表示运动矢量的动态范围,|R|表示区域包含的运动矢量数目,wh表示运动矢量场的尺寸,参数Q用来控制运动矢量场的分割程度,就样就可以将运动矢量场适度地分割成若干具有相似运动的区域;
(4)计算每个分割区域在全局运动补偿后的平均残差;
(5)区分最可靠的背景区域和其它对象所在的区域,在面积大于整个运动矢量场10%的若干分割区域中选择平均残差最小的区域作为可靠的背景区域,标记为R0 t,剩下的区域作为运动对象可能存在的区域Ri t;最后对当前帧所分割的M个对象区域和1个背景区域分别标记,分割结果记为Lreg t
6.根据权利要求1所述的基于匹配矩阵的H.264压缩域运动对象实时分割方法,其特征在于所述的对象分割,是利用前一帧,t-1时刻,已经获得的运动对象分割结果,来判断当前帧,t时刻,各个分割区域是否与前一帧的某个对象匹配,以此构造匹配矩阵;基于匹配矩阵判断对象的跟踪与更新、对象的合并、对象的分裂、新对象的出现、旧对象的消失等情况,最终获得当前帧的若干运动对象。步骤如下:
(1)采用后向投影方法获得前一帧,t-1时刻,各个对象在当前帧t时刻的投影区域,先将前一帧的N个运动对象Oj t-1和1个背景对象O0 t-1标记出来,然后采用后向投影的方法获得前一帧各个对象在当前帧的投影区域。就是利用当前帧累积运动矢量场中任意块的坐标和其对应的累积运动矢量的差求出这个块在前一帧中的匹配位置,然后将前一帧匹配位置上的块对象投影到当前帧并逐个标记出来,记为Lproj t
(2)构造矩阵CMt,它表示分割区域与对象投影相互重叠的面积;构造矩阵CMRt,它表示每个分割区域落在各个对象投影内的比例;构造矩阵CMCt,它表示每个对象投影落在各个分割区域内的比例;根据标记图象Lreg t和Lproj t,构造3个M+1行N+1列的矩阵CMt,CMRt,CMCt。其中矩阵CMt中的任意元素CMt(i,j)取值为在Lreg t中标记为i且在Lproj t标记为j的象素数目,即分割区域Lreg t与对象投影Lproj t相互重叠的面积。而矩阵CMRt(i,j)定义为CMRt第i行的各个元素是分割区域Ri t落在各个对象投影内的比例;矩阵CMCt(i,j)定义为CMCt第j列的各个元素是对象Oj t-1的投影落在各个分割区域内的比例;
(3)构造矩阵CMMt,它表示当前帧分割区域和对象投影之间的关联程度,矩阵CMMt记录了CMRt和CMCt所反映的Lreg t和Lproj t之间的相关信息;CMMt首先置为M+1行、N+1列的零矩阵;接着对CMRt进行行扫描找到每一行最大值所在的位置,对CMMt中相应位置处的元素值加1;然后对CMCt进行列扫描找到每一列最大值所在的位置,对CMMt中相应位置处的元素值加2;生成的矩阵CMMt的纵坐标依次表示为当前帧背景区域R0 t和运动区域Ri t(i=1,2,L,M),横坐标依次表示为前一帧背景对象O0 t-1和运动对象Oj t-1(j=1,2,L,N),矩阵中各元素的可能取值为0,1,2,3;CMMt中任意不为0的元素CMMt(i,j)表明了分割区域Rj t与对象Oj t-1存在一定的相关性,具体而言:
①CMMt(i,j)=1,表明分割区域Rj t在很大程度上属于前一帧对象Oj t-1
②CMMt(i,j)=2,表明前一帧对象Oj t-1在很大程度上包含在分割区域Ri t中;
③CMMt(i,j)=3,同时包含了上述两种情况,表明Ri t和Oj t-1具有极强的相关性;需要进一步比较,如果CMRt(i,j)>CMCt(i,j),则CMMt(i,j)=1;否则,CMMt(i,j)=2;最后生成的CMMt取值范围为0,1,2;
(4)基于匹配矩阵CMMt对单个对象的跟踪与更新、新对象出现、对象的合并、对象的分裂以及对象的消失五类情况进行对象分割;通过矩阵CMMt可以有效地建立起分割区域与运动对象的关联关系,它能够以一种统一的方式有效地处理以下五种情况:
①单个对象跟踪与更新(1→1);
②新对象出现(0→1);
③对象的合并(m→1);
④对象的分裂(1→m);
⑤对象的消失(1→0)。
CN 200610116363 2006-09-21 2006-09-21 基于h.264压缩域运动对象实时分割方法 Expired - Fee Related CN100486336C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200610116363 CN100486336C (zh) 2006-09-21 2006-09-21 基于h.264压缩域运动对象实时分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200610116363 CN100486336C (zh) 2006-09-21 2006-09-21 基于h.264压缩域运动对象实时分割方法

Publications (2)

Publication Number Publication Date
CN1960491A true CN1960491A (zh) 2007-05-09
CN100486336C CN100486336C (zh) 2009-05-06

Family

ID=38071950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200610116363 Expired - Fee Related CN100486336C (zh) 2006-09-21 2006-09-21 基于h.264压缩域运动对象实时分割方法

Country Status (1)

Country Link
CN (1) CN100486336C (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101237581B (zh) * 2008-02-29 2010-11-17 上海大学 基于运动特征的h.264压缩域实时视频对象分割方法
CN102123234A (zh) * 2011-03-15 2011-07-13 北京航空航天大学 无人机侦察视频分级运动补偿方法
CN101719979B (zh) * 2009-11-27 2011-08-03 北京航空航天大学 基于时域定区间记忆补偿的视频对象分割方法
CN102196259A (zh) * 2010-03-16 2011-09-21 北京中星微电子有限公司 一种适用于压缩域的运动目标检测系统及方法
CN102257817A (zh) * 2008-12-19 2011-11-23 汤姆森特许公司 基于全局运动补偿的视频编码
CN102333213A (zh) * 2011-06-15 2012-01-25 夏东 一种复杂背景下的h.264压缩域运动目标检测算法
CN101320085B (zh) * 2008-07-21 2012-07-25 哈尔滨工业大学 基于后向投影算法的超宽带穿墙点目标定位成像方法
CN102917224A (zh) * 2012-10-18 2013-02-06 北京航空航天大学 基于新型十字菱形搜索及五帧背景对齐的动背景视频对象提取
CN103198297A (zh) * 2013-03-15 2013-07-10 浙江大学 基于相关性几何特征的运动相似性评估方法
CN104125430A (zh) * 2013-04-28 2014-10-29 华为技术有限公司 视频运动目标检测方法、装置以及视频监控系统
CN104683803A (zh) * 2015-03-24 2015-06-03 江南大学 一种应用于压缩域的运动对象检测与跟踪方法
CN105931274A (zh) * 2016-05-09 2016-09-07 中国科学院信息工程研究所 一种基于运动向量轨迹的快速物体分割和追踪方法
CN106162171A (zh) * 2010-04-13 2016-11-23 Ge视频压缩有限责任公司 样本区域合并技术
CN106340031A (zh) * 2015-07-07 2017-01-18 香港生产力促进局 一种检测运动物体的方法和装置
US20170134761A1 (en) 2010-04-13 2017-05-11 Ge Video Compression, Llc Coding of a spatial sampling of a two-dimensional information signal using sub-division
CN108574846A (zh) * 2018-05-18 2018-09-25 中南民族大学 一种视频压缩域目标跟踪方法和系统
US20180324466A1 (en) 2010-04-13 2018-11-08 Ge Video Compression, Llc Inheritance in sample array multitree subdivision
CN108965869A (zh) * 2015-08-29 2018-12-07 华为技术有限公司 图像预测的方法及设备
CN109389031A (zh) * 2018-08-27 2019-02-26 浙江大丰实业股份有限公司 演出人员自动定位机构
US20190089962A1 (en) 2010-04-13 2019-03-21 Ge Video Compression, Llc Inter-plane prediction
CN112990273A (zh) * 2021-02-18 2021-06-18 中国科学院自动化研究所 面向压缩域的视频敏感人物识别方法、系统及设备

Cited By (97)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101237581B (zh) * 2008-02-29 2010-11-17 上海大学 基于运动特征的h.264压缩域实时视频对象分割方法
CN101320085B (zh) * 2008-07-21 2012-07-25 哈尔滨工业大学 基于后向投影算法的超宽带穿墙点目标定位成像方法
CN102257817B (zh) * 2008-12-19 2014-10-08 汤姆森特许公司 基于全局运动补偿的视频编码
CN102257817A (zh) * 2008-12-19 2011-11-23 汤姆森特许公司 基于全局运动补偿的视频编码
CN101719979B (zh) * 2009-11-27 2011-08-03 北京航空航天大学 基于时域定区间记忆补偿的视频对象分割方法
CN102196259A (zh) * 2010-03-16 2011-09-21 北京中星微电子有限公司 一种适用于压缩域的运动目标检测系统及方法
CN102196259B (zh) * 2010-03-16 2015-07-01 北京中星微电子有限公司 一种适用于压缩域的运动目标检测系统及方法
US20210211743A1 (en) 2010-04-13 2021-07-08 Ge Video Compression, Llc Coding of a spatial sampling of a two-dimensional information signal using sub-division
CN106303523A (zh) * 2010-04-13 2017-01-04 Ge视频压缩有限责任公司 样本区域合并技术
US12120316B2 (en) 2010-04-13 2024-10-15 Ge Video Compression, Llc Inter-plane prediction
US12010353B2 (en) 2010-04-13 2024-06-11 Ge Video Compression, Llc Inheritance in sample array multitree subdivision
US10748183B2 (en) 2010-04-13 2020-08-18 Ge Video Compression, Llc Region merging and coding parameter reuse via merging
US11983737B2 (en) 2010-04-13 2024-05-14 Ge Video Compression, Llc Region merging and coding parameter reuse via merging
US11910030B2 (en) 2010-04-13 2024-02-20 Ge Video Compression, Llc Inheritance in sample array multitree subdivision
US11910029B2 (en) 2010-04-13 2024-02-20 Ge Video Compression, Llc Coding of a spatial sampling of a two-dimensional information signal using sub-division preliminary class
US11900415B2 (en) 2010-04-13 2024-02-13 Ge Video Compression, Llc Region merging and coding parameter reuse via merging
US11856240B1 (en) 2010-04-13 2023-12-26 Ge Video Compression, Llc Coding of a spatial sampling of a two-dimensional information signal using sub-division
CN106162171A (zh) * 2010-04-13 2016-11-23 Ge视频压缩有限责任公司 样本区域合并技术
US10771822B2 (en) 2010-04-13 2020-09-08 Ge Video Compression, Llc Coding of a spatial sampling of a two-dimensional information signal using sub-division
US11810019B2 (en) 2010-04-13 2023-11-07 Ge Video Compression, Llc Region merging and coding parameter reuse via merging
US20170134761A1 (en) 2010-04-13 2017-05-11 Ge Video Compression, Llc Coding of a spatial sampling of a two-dimensional information signal using sub-division
US11785264B2 (en) 2010-04-13 2023-10-10 Ge Video Compression, Llc Multitree subdivision and inheritance of coding parameters in a coding block
US11778241B2 (en) 2010-04-13 2023-10-03 Ge Video Compression, Llc Coding of a spatial sampling of a two-dimensional information signal using sub-division
US20180324466A1 (en) 2010-04-13 2018-11-08 Ge Video Compression, Llc Inheritance in sample array multitree subdivision
US11765362B2 (en) 2010-04-13 2023-09-19 Ge Video Compression, Llc Inter-plane prediction
US11765363B2 (en) 2010-04-13 2023-09-19 Ge Video Compression, Llc Inter-plane reuse of coding parameters
US11734714B2 (en) 2010-04-13 2023-08-22 Ge Video Compression, Llc Region merging and coding parameter reuse via merging
US11736738B2 (en) 2010-04-13 2023-08-22 Ge Video Compression, Llc Coding of a spatial sampling of a two-dimensional information signal using subdivision
US20190089962A1 (en) 2010-04-13 2019-03-21 Ge Video Compression, Llc Inter-plane prediction
US10248966B2 (en) 2010-04-13 2019-04-02 Ge Video Compression, Llc Region merging and coding parameter reuse via merging
US10764608B2 (en) 2010-04-13 2020-09-01 Ge Video Compression, Llc Coding of a spatial sampling of a two-dimensional information signal using sub-division
US20190164188A1 (en) 2010-04-13 2019-05-30 Ge Video Compression, Llc Region merging and coding parameter reuse via merging
US20190174148A1 (en) 2010-04-13 2019-06-06 Ge Video Compression, Llc Inheritance in sample array multitree subdivision
US20190197579A1 (en) 2010-04-13 2019-06-27 Ge Video Compression, Llc Region merging and coding parameter reuse via merging
US10432980B2 (en) 2010-04-13 2019-10-01 Ge Video Compression, Llc Inheritance in sample array multitree subdivision
US10432979B2 (en) 2010-04-13 2019-10-01 Ge Video Compression Llc Inheritance in sample array multitree subdivision
US10432978B2 (en) 2010-04-13 2019-10-01 Ge Video Compression, Llc Inheritance in sample array multitree subdivision
US10440400B2 (en) 2010-04-13 2019-10-08 Ge Video Compression, Llc Inheritance in sample array multitree subdivision
US10448060B2 (en) 2010-04-13 2019-10-15 Ge Video Compression, Llc Multitree subdivision and inheritance of coding parameters in a coding block
US10460344B2 (en) 2010-04-13 2019-10-29 Ge Video Compression, Llc Region merging and coding parameter reuse via merging
US10621614B2 (en) 2010-04-13 2020-04-14 Ge Video Compression, Llc Region merging and coding parameter reuse via merging
US10672028B2 (en) 2010-04-13 2020-06-02 Ge Video Compression, Llc Region merging and coding parameter reuse via merging
US10681390B2 (en) 2010-04-13 2020-06-09 Ge Video Compression, Llc Coding of a spatial sampling of a two-dimensional information signal using sub-division
US10687086B2 (en) 2010-04-13 2020-06-16 Ge Video Compression, Llc Coding of a spatial sampling of a two-dimensional information signal using sub-division
US10687085B2 (en) 2010-04-13 2020-06-16 Ge Video Compression, Llc Inheritance in sample array multitree subdivision
US10694218B2 (en) 2010-04-13 2020-06-23 Ge Video Compression, Llc Inheritance in sample array multitree subdivision
US10708629B2 (en) 2010-04-13 2020-07-07 Ge Video Compression, Llc Inheritance in sample array multitree subdivision
US10708628B2 (en) 2010-04-13 2020-07-07 Ge Video Compression, Llc Coding of a spatial sampling of a two-dimensional information signal using sub-division
US10721495B2 (en) 2010-04-13 2020-07-21 Ge Video Compression, Llc Coding of a spatial sampling of a two-dimensional information signal using sub-division
US10721496B2 (en) 2010-04-13 2020-07-21 Ge Video Compression, Llc Inheritance in sample array multitree subdivision
US10719850B2 (en) 2010-04-13 2020-07-21 Ge Video Compression, Llc Region merging and coding parameter reuse via merging
US11611761B2 (en) 2010-04-13 2023-03-21 Ge Video Compression, Llc Inter-plane reuse of coding parameters
US10250913B2 (en) 2010-04-13 2019-04-02 Ge Video Compression, Llc Coding of a spatial sampling of a two-dimensional information signal using sub-division
US11553212B2 (en) 2010-04-13 2023-01-10 Ge Video Compression, Llc Inheritance in sample array multitree subdivision
CN106303523B (zh) * 2010-04-13 2020-09-11 Ge视频压缩有限责任公司 解码器及方法、编码方法
CN106162171B (zh) * 2010-04-13 2020-09-11 Ge视频压缩有限责任公司 解码器及方法、编码方法
US10803483B2 (en) 2010-04-13 2020-10-13 Ge Video Compression, Llc Region merging and coding parameter reuse via merging
US10805645B2 (en) 2010-04-13 2020-10-13 Ge Video Compression, Llc Coding of a spatial sampling of a two-dimensional information signal using sub-division
US10803485B2 (en) 2010-04-13 2020-10-13 Ge Video Compression, Llc Region merging and coding parameter reuse via merging
US10848767B2 (en) 2010-04-13 2020-11-24 Ge Video Compression, Llc Inter-plane prediction
US10856013B2 (en) 2010-04-13 2020-12-01 Ge Video Compression, Llc Coding of a spatial sampling of a two-dimensional information signal using sub-division
US10855995B2 (en) 2010-04-13 2020-12-01 Ge Video Compression, Llc Inter-plane prediction
US10855991B2 (en) 2010-04-13 2020-12-01 Ge Video Compression, Llc Inter-plane prediction
US10855990B2 (en) 2010-04-13 2020-12-01 Ge Video Compression, Llc Inter-plane prediction
US10863208B2 (en) 2010-04-13 2020-12-08 Ge Video Compression, Llc Inheritance in sample array multitree subdivision
US10873749B2 (en) 2010-04-13 2020-12-22 Ge Video Compression, Llc Inter-plane reuse of coding parameters
US10880580B2 (en) 2010-04-13 2020-12-29 Ge Video Compression, Llc Inheritance in sample array multitree subdivision
US10880581B2 (en) 2010-04-13 2020-12-29 Ge Video Compression, Llc Inheritance in sample array multitree subdivision
US10893301B2 (en) 2010-04-13 2021-01-12 Ge Video Compression, Llc Coding of a spatial sampling of a two-dimensional information signal using sub-division
US11037194B2 (en) 2010-04-13 2021-06-15 Ge Video Compression, Llc Region merging and coding parameter reuse via merging
US11546641B2 (en) 2010-04-13 2023-01-03 Ge Video Compression, Llc Inheritance in sample array multitree subdivision
US11051047B2 (en) 2010-04-13 2021-06-29 Ge Video Compression, Llc Inheritance in sample array multitree subdivision
US11546642B2 (en) 2010-04-13 2023-01-03 Ge Video Compression, Llc Coding of a spatial sampling of a two-dimensional information signal using sub-division
US11087355B2 (en) 2010-04-13 2021-08-10 Ge Video Compression, Llc Region merging and coding parameter reuse via merging
US11102518B2 (en) 2010-04-13 2021-08-24 Ge Video Compression, Llc Coding of a spatial sampling of a two-dimensional information signal using sub-division
CN102123234B (zh) * 2011-03-15 2012-09-05 北京航空航天大学 无人机侦察视频分级运动补偿方法
CN102123234A (zh) * 2011-03-15 2011-07-13 北京航空航天大学 无人机侦察视频分级运动补偿方法
CN102333213A (zh) * 2011-06-15 2012-01-25 夏东 一种复杂背景下的h.264压缩域运动目标检测算法
CN102917224B (zh) * 2012-10-18 2015-06-17 北京航空航天大学 基于新型十字菱形搜索及五帧背景对齐的动背景视频对象提取
CN102917224A (zh) * 2012-10-18 2013-02-06 北京航空航天大学 基于新型十字菱形搜索及五帧背景对齐的动背景视频对象提取
CN103198297B (zh) * 2013-03-15 2016-03-30 浙江大学 基于相关性几何特征的运动相似性评估方法
CN103198297A (zh) * 2013-03-15 2013-07-10 浙江大学 基于相关性几何特征的运动相似性评估方法
CN104125430B (zh) * 2013-04-28 2017-09-12 华为技术有限公司 视频运动目标检测方法、装置以及视频监控系统
CN104125430A (zh) * 2013-04-28 2014-10-29 华为技术有限公司 视频运动目标检测方法、装置以及视频监控系统
CN104683803A (zh) * 2015-03-24 2015-06-03 江南大学 一种应用于压缩域的运动对象检测与跟踪方法
CN106340031A (zh) * 2015-07-07 2017-01-18 香港生产力促进局 一种检测运动物体的方法和装置
US11979559B2 (en) 2015-08-29 2024-05-07 Huawei Technologies Co., Ltd. Image prediction method and device
CN108965869B (zh) * 2015-08-29 2023-09-12 华为技术有限公司 图像预测的方法及设备
CN108965869A (zh) * 2015-08-29 2018-12-07 华为技术有限公司 图像预测的方法及设备
CN105931274A (zh) * 2016-05-09 2016-09-07 中国科学院信息工程研究所 一种基于运动向量轨迹的快速物体分割和追踪方法
CN105931274B (zh) * 2016-05-09 2019-02-15 中国科学院信息工程研究所 一种基于运动向量轨迹的快速物体分割和追踪方法
CN108574846A (zh) * 2018-05-18 2018-09-25 中南民族大学 一种视频压缩域目标跟踪方法和系统
CN108574846B (zh) * 2018-05-18 2019-03-08 中南民族大学 一种视频压缩域目标跟踪方法和系统
CN109389031B (zh) * 2018-08-27 2021-12-03 浙江大丰实业股份有限公司 演出人员自动定位机构
CN109389031A (zh) * 2018-08-27 2019-02-26 浙江大丰实业股份有限公司 演出人员自动定位机构
CN112990273B (zh) * 2021-02-18 2021-12-21 中国科学院自动化研究所 面向压缩域的视频敏感人物识别方法、系统及设备
CN112990273A (zh) * 2021-02-18 2021-06-18 中国科学院自动化研究所 面向压缩域的视频敏感人物识别方法、系统及设备

Also Published As

Publication number Publication date
CN100486336C (zh) 2009-05-06

Similar Documents

Publication Publication Date Title
CN1960491A (zh) 基于h.264压缩域运动对象实时分割方法
CN1215439C (zh) 执行可缩放的分层运动估算的装置与方法
CN101048799A (zh) 通过实时视频动作分析理解视频内容
Chen et al. Moving region segmentation from compressed video using global motion estimation and Markov random fields
US6757434B2 (en) Region-of-interest tracking method and device for wavelet-based video coding
Zhong et al. AMOS: an active system for MPEG-4 video object segmentation
Liu et al. Real-time spatiotemporal segmentation of video objects in the H. 264 compressed domain
Huang et al. Visual analysis motivated rate-distortion model for image coding
CN1917642A (zh) 迭代计算全局运动参数集的方法和设备
CN1460380A (zh) 用于分割多重分辨率视频对象的方法
CN1522542A (zh) 用于运动或深度估计的方法和装置和配备这种运动估计装置的图像处理设备
CN102801972A (zh) 基于特征的运动矢量估计和传递方法
Lin et al. PEA265: Perceptual assessment of video compression artifacts
Porikli et al. Compressed domain video object segmentation
CN1627825A (zh) 用于运动图像编码的运动估计方法
CN101237581B (zh) 基于运动特征的h.264压缩域实时视频对象分割方法
CN101036390A (zh) 一种利用可变形网格进行运动估计的方法
JP5503507B2 (ja) 文字領域検出装置およびそのプログラム
Zhu et al. Edge-based video compression texture synthesis using generative adversarial network
CN1926879A (zh) 视频信号编码器、视频信号处理器、视频信号分发系统及其操作方法
EP2842325A1 (en) Macroblock partitioning and motion estimation using object analysis for video compression
CN1264255A (zh) 对移动图象进行编码的方法和装置及记录相应程序的介质
CN1165176C (zh) 基于预测方向校正/统计预判的快速亚象素运动估计方法
CN1816146A (zh) 一种视频数据压缩中的运动矢量估计方法
Zheng et al. Motion vector fields based video coding

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090506

Termination date: 20110921