CN102592287B - 基于3d视频的时空域运动分割与估计模型的凸优化方法 - Google Patents

基于3d视频的时空域运动分割与估计模型的凸优化方法 Download PDF

Info

Publication number
CN102592287B
CN102592287B CN201110457371.9A CN201110457371A CN102592287B CN 102592287 B CN102592287 B CN 102592287B CN 201110457371 A CN201110457371 A CN 201110457371A CN 102592287 B CN102592287 B CN 102592287B
Authority
CN
China
Prior art keywords
variable
time
space domain
estimation model
cut apart
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201110457371.9A
Other languages
English (en)
Other versions
CN102592287A (zh
Inventor
王诗言
于慧敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201110457371.9A priority Critical patent/CN102592287B/zh
Publication of CN102592287A publication Critical patent/CN102592287A/zh
Application granted granted Critical
Publication of CN102592287B publication Critical patent/CN102592287B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种基于3D视频的时空域运动分割与估计模型的凸优化方法,实施步骤如下:1)根据活动轮廓思想以及背景三维运动参数与二维光流的映射关系建立基于3D视频的时空域运动分割与估计模型;2)将模型转换为对应的水平集描述方程,求出对应的梯度下降方程,求出所述梯度下降方程的等价方程,求出对应于所述等价方程的能量泛函,对能量泛函进行凸松弛,得到凸优化后的时空域运动分割与估计模型;3)引入代价变量对凸优化后的时空域运动分割与估计模型进行进一步的松弛,采用多变量交替迭代算法最小化凸优化后的时空域运动分割与估计模型,迭代收敛后根据选择的门限函数得到最终的分割曲面。本发明具有对目标数量变化的适应性强、分割结果不依赖初始化轮廓、运算效率高的优点。

Description

基于3D视频的时空域运动分割与估计模型的凸优化方法
技术领域
本发明涉及基于计算机视觉的运动分析领域,特别涉及一种利用凸松弛的概念将基于3D视频的运动分割与估计模型转化为全局凸优化极值问题的方法。
背景技术
视频序列的运动分析是计算机视觉领域中的一个基本研究课题,它的应用领域包括治安监控、机器视觉、自动导航、国防兵器、数字媒体、视频编码、3D电视、虚拟现实和智能交通等领域,这些都是国内外重点发展和研究领域。
尽管从二维序列图像或视频中进行运动分割、提取场景获得三维结构和物体的运动信息,无论从理论上还是在实际中都很重要,但由于图像形成的复杂性、三维运动场与图像特征的二维运动场之间的非线性关系和缺乏深度信息不能够对二维运动场精确建模等原因,所得的解通常是在某种先验知识作为约束条件下的近似解,且所得解对数据的噪声非常敏感。随着立体视觉系统和距离传感器的发展和进入实用,三维数据能够比较容易的直接获得。由于三维数据的信息量远高于二维图像,能够准确地表达三维运动和二维运动,三维运动的估计大为简化,将三维数据用于运动分割、提取场景的三维结构和物体的运动信息估计,可以期望得到更为准确和鲁棒的解。
Osher和Sethian首先提出了依赖于时间的运动曲面的水平集描述。水平集方法避免了对拓扑结构变化的处理,计算稳定,已在图像/视频处理和计算机视觉等领域得到了广泛的应用。国内外,不少学者将水平集方法应用在运动分割和光流估算上。有文献将由摄像机运动引起的背景运动用匀速模型表示,同时实现由摄像机运动引起的二维运动场估算和分割曲面的演化,曲面的演变用水平集方法实现。我们在前面研究了基于偏微分方程组水平集方法的多运动目标分割、跟踪、背景运动补偿和运动速度估计,方法中考虑了背景各点运动速度不相同的情况,它能同时进行背景光流的估算、背景运动补偿和运动目标的分割,但不能对摄像机的三维运动进行估算。然而,水平集方法也有一定的局限性,就是它对初始化条件敏感,产生这种现象的原因正是因为能量函数的非凸性使得水平集表示存在局部最小值。目前,很多的研究者将目光放在了如何建立全局凸模型的方法上,克服了水平集方法局部最小值和速度慢的问题,成为又一个研究热点。
发明内容
本发明要解决的技术问题是提供一种对目标数量变化的适应性强、分割结果不依赖初始化轮廓、运算效率高的基于3D视频的时空域运动分割与估计模型的凸优化方法。
为解决上述技术问题,本发明采用的技术方案为:
一种基于3D视频的时空域运动分割与估计模型的凸优化方法,其实施步骤如下:
1)根据活动轮廓思想以及背景三维运动参数与二维光流的映射关系建立基于3D视频的时空域运动分割与估计模型;
2)将所述时空域运动分割与估计模型转换为对应的水平集描述方程,求出所述水平集描述方程对应的梯度下降方程,求出所述梯度下降方程的等价方程,求解对应于所述等价方程的能量泛函,对能量泛函进行凸松弛,得到凸优化后的时空域运动分割与估计模型;
3)引入代价变量对凸优化后的时空域运动分割与估计模型进行进一步的松弛,采用多变量交替迭代算法最小化所述凸优化后的时空域运动分割与估计模型,迭代收敛后根据选择的门限函数得到最终的分割曲面。
作为本发明上述技术方案的进一步改进:
所述步骤1)中建立的时空域运动分割与估计模型的函数表达式为:
E = ∫ C ds + λ ∫ C in e - ( I t + s · T + q · W ) 2 dx + λ ∫ C out α ( I t + s · T + q · W ) 2 dx ,
其中E为能量泛函,C为分割曲面,T为背景的平移变量,W为背景的旋转变量,T和W的表达分别为T=(t1,t2,t3)、W=(w1,w2,w3),It为图像的时间差分,Cin、Cout分别为时空域中曲面的内部(目标)和外部(背景)区域,ds为单位曲面,dx为单位像素点,α、λ为比例因子,s和q分别为对应于每个像素点的常数向量;s和q的函数表达式分别为:
s = fI x Z fI y Z - xI x - y I y Z , q = - fI y - y f ( xI x + yI y ) fI x + x f ( xI x + yI y ) - yI x + xI y
其中,Ix为图像的横向差分,Iy为图像的纵向差分,x为像素点在图像坐标中的x轴坐标值,y为像素点在图像坐标中的y轴坐标值,Z为像素点在空间坐标中的z轴坐标值,f为摄像机焦距。
所述步骤2)的详细步骤为:
A)将所述时空域运动分割与估计模型转换为对应的水平集描述方程,所述水平集描述方程的函数表达式为:
min φ , ( T , W ) { E LSM = ∫ Ω | ▿ φ | δ ( φ ) + λ ∫ Ω g r in ( T , W , x ) H ( φ ) + λ ∫ Ω g r out ( T , W , x ) ( 1 - H ( φ ) ) }
其中,Ω为整个时空域积分区域,
Figure BDA0000127700460000025
为内部(目标)区域的运动描述符,
Figure BDA0000127700460000031
为外部(背景)区域的运动描述符,φ为符号距离函数,
Figure BDA0000127700460000032
为符号距离函数φ的梯度的模,δ(φ)为关于符号距离函数φ的Dirac函数,H(φ)为关于符号距离函数φ的Heaviside函数,λ为比例因子;
Figure BDA0000127700460000033
Figure BDA0000127700460000034
的函数表达式为:
g r in ( T , W , x ) = e - ( I t + s · T + q · W ) 2 , g r out ( T , W , x ) = α ( I t + s · T + q · W ) 2 ,
其中,It为图像的时间差分,T为背景的平移变量,W为背景的旋转变量,α为比例因子,s和q分别为对应于每个像素点的常数向量;
B)求出所述水平集描述方程对应的梯度下降方程,所述梯度下降方程的函数表达式为:
∂ φ ∂ t = ( div ▿ φ | ▿ φ | + λ ( g r in ( T , W , x ) - g r out ( T , W , x ) ) ) δ ( φ )
其中T为背景的平移变量,W为背景的旋转变量,x为图像空间中某一个像素点x,t为时间步长,为符号距离函数φ对时间步长的偏微分,
Figure BDA0000127700460000039
为符号距离函数φ的散度,λ为比例因子,
Figure BDA00001277004600000310
为内部区域的运动描述符,
Figure BDA00001277004600000311
为外部区域的运动描述符,δ(φ)为关于符号距离函数φ的Dirac函数;
C)由于δ≥0,求出所述梯度下降方程的等价方程:
∂ φ ∂ t = div ▿ φ | ▿ φ | + λ ( g r in ( T , W , x ) - g r out ( T , W , x ) )
求解对应于所述梯度下降方程的等价方程的能量泛函:
min φ ∈ { 0,1 } { E = ∫ Ω | ▿ φ | dx + λ ∫ Ω g r in φdx + λ ∫ Ω g r out ( 1 - φ ) dx }
将φ∈{0,1}松弛到连续区间[0,1]上,并用标记符号u代替φ,得到凸优化后的时空域运动分割与估计模型,所述凸优化后的时空域运动分割与估计模型的函数表达式为:
min u ∈ [ 0,1 ] { E G = ∫ Ω | ▿ u | dx + λ ∫ Ω r ( T , W , x ) udx }
其中,EG为凸优化后的能量泛函,u为分割变量,
Figure BDA00001277004600000315
为分割变量的梯度模值,r(T,W,x)为区域运动描述符,λ为比例因子,x为图像空间中某一个像素点x;r(T,W,x)的函数表达式为 r ( T , W , x ) = g r in - g r out = e - ( I t + s · T + q · W ) 2 - α ( I t + s · T + q · W ) 2 .
所述步骤3)的详细步骤为:
a)引入一个辅助变量v∈[0,1]来松弛对分割变量的限制,将所述优化后的时空域运动分割与估计模型进一步松弛,进一步松弛后的时空域运动分割与估计模型的函数表达式为:
E G ( u , v , ( T , W ) ) = ∫ Ω ( | ▿ u | + λr ( T , W , x ) v + 1 2 ϵ | | u - v | | L 2 2 ) dx ;
b)将背景的平移变量T和旋转变量W初始化为0,将分割变量u和代价变量v初始化为任意值;
c)固定分割变量和代价变量,更新运动变量和区域运动描述符;
d)引入一个与分割变量对应的对偶变量,固定运动变量和代价变量,利用原始-对偶变量的对应关系更新分割变量;
e)固定运动变量和分割变量,更新代价变量;然后重复迭代所述步骤c)~步骤e)直至所述进一步松弛后的时空域运动分割与估计模型收敛;
f)选择门限函数σ∈(0,1),根据所述门限函数σ∈(0,1)得到最终的分割曲面C={x|u(x)=σ}。
所述步骤c)的详细步骤为:
对背景的运动参数(T,W)建立超定线性方程组θiAi=bi,其中θi=(Ti,Wi)为第i次迭代的背景运动变量,Ai是6×Ni的矩阵,bi是1×Ni的向量,其中Ni为第i次迭代时背景区域的像素点个数, A i = ( s ( 1 ) q ( 1 ) , . . . , s ( N i ) q ( N i ) ) , bi=(-It(1),...,-It(Ni)),然后采用最小二乘法求解所述超定线性方程组得到运动参数(T,W)的估计值,并根据所述估计值更新
Figure BDA0000127700460000043
Figure BDA0000127700460000044
和r(T,W,x);
所述步骤d)的详细步骤为:
引入与原始分割变量u相对应的对偶变量
Figure BDA0000127700460000045
当运动变量和代价变量固定,根据原始-对偶变量定义,u的泛函极值子问题的函数表达式为:
Figure BDA0000127700460000046
求解所述泛函极值子问题得到u的迭代公式
Figure BDA0000127700460000047
其中ui+1为u在第i+1次迭代的值,vi为v在第i次迭代的值,
Figure BDA0000127700460000048
为梯度算子,
Figure BDA0000127700460000049
Figure BDA00001277004600000410
在第i+1次迭代的值,为梯度算子,ε为常数变量;
利用半隐式梯度下降法,得到对偶变量
Figure BDA0000127700460000051
的迭代式:
Figure BDA0000127700460000052
其中,
Figure BDA0000127700460000053
v为代价变量,δt为时间步长。
所述步骤e)的详细步骤为:
当运动变量和分割变量固定时,代价变量的泛函极值子问题为:
v = arg min v ∫ Ω ( λr ( T , W , x ) v + 1 2 ϵ | | u - v | | L 2 2 ) dx
对所述极值子问题求解,得到代价变量的迭代式为:
vi+1=min{max{ui+1-ελri+1(T,W,x),0},1}
其中vi+1为v在第i+1次迭代的值,ui+1为u在第i+1次迭代的值,ε为常数变量,λ为比例因子,ri+1(T,W,x)为区域运动描述符在第i+1次迭代的值。
本发明具有下述优点:
1、本发明通过活动轮廓思想以及背景三维运动参数与二维光流的映射关系建立基于3D视频的时空域运动分割与估计模型,能够实现基于时空域的动态背景情况下的多目标跟踪,能有效的利用空间和时域信息更好施加三维运动约束,适合于处理目标数目有变化的情况。
2、本发明通过对能量泛函进行凸松弛得到凸优化后的时空域运动分割与估计模型,然后通过引入代价变量对凸优化后的时空域运动分割与估计模型进行进一步的松弛,实现对时空域运动分割与估计模型的全局凸优化,能够避免初始化轮廓对结果的影响。
3、本发明通过引入代价变量对凸优化后的时空域运动分割与估计模型进行进一步的松弛,并引入对偶变量,采用多变量交替迭代算法最小化凸优化后的时空域运动分割与估计模型,极大地提高了运算效率。
附图说明
图1为本发明实施例的基本流程示意图。
图2为本发明实施例步骤3)的基本流程示意图。
图3为本发明实施例中3D视频在时空域运动分割与估计模型收敛后对某一帧图像估计出的光流场示意图。
图4为本发明实施例中基于图3的图像帧的分割变量演化结果示意图。
图5为本发明实施例中基于图3的图像帧的最终得到的分割曲面示意图。
具体实施方式
如图1所示,本发明实施例基于3D视频的时空域运动分割与估计模型的凸优化方法的实施步骤如下:
1)根据活动轮廓思想以及背景三维运动参数与二维光流的映射关系建立基于3D视频的时空域运动分割与估计模型;
2)将时空域运动分割与估计模型转换为对应的水平集描述方程,求出水平集描述方程对应的梯度下降方程,求出梯度下降方程的等价方程,求解对应于等价方程的能量泛函,对能量泛函进行凸松弛,得到凸优化后的时空域运动分割与估计模型;
3)引入代价变量对凸优化后的时空域运动分割与估计模型进行进一步的松弛,采用多变量交替迭代算法最小化凸优化后的时空域运动分割与估计模型,迭代收敛后根据选择的门限函数得到最终的分割曲面。
本实施例中,步骤1)中建立的时空域运动分割与估计模型的函数表达式为:
E = ∫ C ds + λ ∫ C in e - ( I t + s · T + q · W ) 2 dx + λ ∫ C out α ( I t + s · T + q · W ) 2 dx ,
其中E为能量泛函,C为分割曲面,T为背景的平移变量,W为背景的旋转变量,T和W的表达分别为T=(t1,t2,t3)、W=(w1,w2,w3),It为图像的时间差分,Cin、Cout分别为时空域中曲面的内部(目标)和外部(背景)区域,ds为单位曲面,dx为单位像素点,α、λ为比例因子,s和q分别为对应于每个像素点的常数向量;s和q的函数表达式分别为:
s = fI x Z fI y Z - xI x - y I y Z , q = - fI y - y f ( xI x + yI y ) fI x + x f ( xI x + yI y ) - yI x + xI y
其中,Ix为图像的横向差分,Iy为图像的纵向差分,x为像素点在图像坐标中的x轴坐标值,y为像素点在图像坐标中的y轴坐标值,Z为像素点在空间坐标中的z轴坐标值,f为摄像机焦距。
一般来说,两相的主动轮廓模型可以表示为:
min { E AC ( C ) = ∫ C g b ( C , s ) ds + λ ∫ C in g r in ( C in , x ) dx + λ ∫ C out g r out ( C out , x ) dx } (1)
其中C代表闭合曲线(2D图像)或曲面(3D图像),Cin和Cout分别代表图像空间中C的内部和外部区域,gb:Ω→R是边缘函数(比如测地线模型中的边缘检测函数),
Figure BDA0000127700460000071
分别为自定义的内部和外部区域函数,ds、dx分别为单位长度/面积和单位像素点,λ为权重参数。
在摄像机运动的情况下建立对目标的运动分割与估计模型,首先是选择适当的参数模型对背景运动建模。假设背景为一个运动刚体,其三维运动(T,W)分别用平移变量T=(t1,t2,t3)和旋转变量W=(w1,w2,w3)表示。背景中任意一点运动产生的光流w=(u,v)满足光流约束方程
Figure BDA0000127700460000072
其中
Figure BDA0000127700460000073
代表图像梯度。根据光流场与三维运动参数的映射关系,背景区域的任意像素点满足以下三维光流约束方程:
Iop(T,W,x)=It+s·T+q·W=0    (2)
其中s和q均为3*1的常向量:
s = fI x Z fI y Z - xI x - y I y Z , q = - fI y - y f ( xI x + yI y ) fI x + x f ( xI x + yI y ) - yI x + xI y
当(T,W)正确估计时,背景区域的Iop应该趋近于0;反之,前景区域的Iop就较大,因此3D光流约束方程是一个很好的用于区别前景和背景的特征。我们可以选用以下观察模型来设计区域运动函数:
g r in ( T , W , x ) = e - I op 2 ( T , W , x ) x ∈ C in (3)
g r out ( T , W , x ) = α I op 2 ( T , W , x ) x ∈ C out
其中α是用于控制内部和外部区间竞争的变量。另外,gb=1定义为时空曲面上的惩罚项,用来平滑三维曲面。这样,我们就得到了基于3D序列的时空域运动分割与估计模型:
E = ∫ C ds + λ ∫ C in e - ( I t + s · T + q · W ) 2 dx + λ ∫ C out α ( I t + s · T + q · W ) 2 dx (4)
本实施例中,步骤2)的详细步骤为:
A)将时空域运动分割与估计模型转换为对应的水平集描述方程,水平集描述方程的函数表达式为:
min φ , ( T , W ) { E LSM = ∫ Ω | ▿ φ | δ ( φ ) + λ ∫ Ω g r in ( T , W , x ) H ( φ ) + λ ∫ Ω g r out ( T , W , x ) ( 1 - H ( φ ) ) }
其中,Ω为整个时空域积分区域,
Figure BDA00001277004600000710
为内部(目标)区域的运动描述符,
Figure BDA0000127700460000081
为外部(背景)区域的运动描述符,φ为符号距离函数,
Figure BDA0000127700460000082
为符号距离函数φ的梯度的模,δ(φ)为关于符号距离函数φ的Dirac函数,H(φ)为关于符号距离函数φ的Heaviside函数,λ为比例因子;
Figure BDA0000127700460000083
Figure BDA0000127700460000084
的函数表达式为:
g r in ( T , W , x ) = e - ( I t + s · T + q · W ) 2 , g r out ( T , W , x ) = α ( I t + s · T + q · W ) 2 ,
其中,It为图像的时间差分,T为背景的平移变量,W为背景的旋转变量,α为比例因子,s和q分别为对应于每个像素点的常数向量;
B)求出水平集描述方程对应的梯度下降方程,梯度下降方程的函数表达式为:
∂ φ ∂ t = ( div ▿ φ | ▿ φ | + λ ( g r in ( T , W , x ) - g r out ( T , W , x ) ) ) δ ( φ )
其中T为背景的平移变量,W为背景的旋转变量,x为图像空间中某一个像素点x,t为时间步长,为符号距离函数φ对时间步长的偏微分,
Figure BDA0000127700460000089
为符号距离函数φ的散度,λ为比例因子,
Figure BDA00001277004600000810
为内部区域的运动描述符,
Figure BDA00001277004600000811
为外部区域的运动描述符,δ(φ)为关于符号距离函数φ的Dirac函数;
C)由于δ≥0,求出梯度下降方程的等价方程:
∂ φ ∂ t = div ▿ φ | ▿ φ | + λ ( g r in ( T , W , x ) - g r out ( T , W , x ) )
求解对应于梯度下降方程的等价方程的能量泛函:
min φ ∈ { 0,1 } { E = ∫ Ω | ▿ φ | dx + λ ∫ Ω g r in φdx + λ ∫ Ω g r out ( 1 - φ ) dx }
将φ∈{0,1}松弛到连续区间[0,1]上,并用标记符号u代替φ,得到凸优化后的时空域运动分割与估计模型,凸优化后的时空域运动分割与估计模型的函数表达式为:
min u ∈ [ 0,1 ] { E G = ∫ Ω | ▿ u | dx + λ ∫ Ω r ( T , W , x ) udx }
其中,EG为凸优化后的能量泛函,u为分割变量,
Figure BDA00001277004600000815
为分割变量的梯度模值,r(T,W,x)为区域运动描述符,λ为比例因子,x为图像空间中某一个像素点x;r(T,W,x)的函数表达式为 r ( T , W , x ) = g r in - g r out = e - ( I t + s · T + q · W ) 2 - α ( I t + s · T + q · W ) 2 .
能量函数的最小化通常使用水平集方法进行求解,它的主要思想是用n+1维函数的零水平集隐性的表示n维曲线C:Ω→Rn,这种方法的优势是可以处理变化的拓扑结构比如多条曲线的分裂和合并,且计算稳定。然而,水平集方法也有以下不足之处:1)每次迭代后都需要重新初始化符号距离函数,计算效率低;2)因为存在局部最小值问题,所有对初始化曲线敏感。为了克服上述问题,我们将对得到的3D时空域运动分割与估计模型进行凸优化。
基于水平集方法的3D时空域运动分割与估计模型(4)的目标函数可以表示为:
min φ , ( T , W ) { E LSM = ∫ Ω | ▿ φ | δ ( φ ) + λ ∫ Ω g r in ( T , W , x ) H ( φ ) + λ ∫ Ω g r out ( T , W , x ) ( 1 - H ( φ ) ) } (5)
其中Ω为整个时空域积分区域,φ为以符号距离函数表示的水平集函数,H(φ)和δ(φ)分别为Heaviside函数和Dirac函数,
Figure BDA0000127700460000093
为前面定义的区域函数。形如式(5)的多变量优化问题通常采用子极值问题的交替优化来实现,当更新当前的后,水平集函数对应的梯度下降方程为:
∂ φ ∂ t = ( div ▿ φ | ▿ φ | + λ ( g r in ( T , W , x ) - g r out ( T , W , x ) ) ) δ ( φ ) (6)
由于δ≥0且不会影响水平集演化方向,式(6)可以改写成以下等价形式:
∂ φ ∂ t = div ▿ φ | ▿ φ | + λ ( g r in ( T , W , x ) - g r out ( T , W , x ) ) (7)
式(7)正是如下能量泛函对应的梯度下降方程
min φ ∈ { 0,1 } { E = ∫ Ω | ▿ φ | dx + λ ∫ Ω g r in φdx + λ ∫ Ω g r out ( 1 - φ ) dx } (8)
在水平集描述中φ的定义区间为{0,1},由于能量函数(8)定义在非凸集上,故其仍为非全局最优问题。将φ∈{0,1}松弛到连续区间[0,1]上,为了避免混淆,用符号u代替φ,上述问题就转化为如下全局最优模型:
min u ∈ [ 0,1 ] { E G = ∫ Ω | ▿ u | dx + λ ∫ Ω r ( T , W , x ) udx } (9)
其中 r ( T , W , x ) = g r in - g r out = e - ( I t + s · T + q · W ) 2 - α ( I t + s · T + q · W ) 2 .
如图2所示,本实施例步骤3)的详细步骤为:
a)引入一个辅助变量v∈[0,1]来松弛对分割变量的限制,将优化后的时空域运动分割与估计模型进一步松弛,进一步松弛后的时空域运动分割与估计模型的函数表达式为:
E G ( u , v , ( T , W ) ) = ∫ Ω ( | ▿ u | + λr ( T , W , x ) v + 1 2 ϵ | | u - v | | L 2 2 ) dx .
b)将背景的平移变量T和旋转变量W初始化为0,将分割变量u和代价变量v初始化为任意值。
c)固定分割变量和代价变量,更新运动变量和区域运动描述符。
d)引入一个与分割变量对应的对偶变量,固定运动变量和代价变量,利用原始-对偶变量的对应关系更新分割变量。
e)固定运动变量和分割变量,更新代价变量;然后重复迭代步骤c)~步骤e)直至进一步松弛后的时空域运动分割与估计模型收敛;本实施例中3D视频中某一帧图像在时空域运动分割与估计模型收敛后估计出的光流场如图3所示,该帧图像的分割变量演化结果图如图4所示。
f)选择门限函数σ∈(0,1),根据门限函数σ∈(0,1)以及Cin={x|u(x)>σ},得到最终的分割曲面(如图5所示)C={x|u(x)=σ}。
本实施例中,步骤c)的详细步骤为:
对背景的运动参数(T,W)建立超定线性方程组θiAi=bi,其中θi=(Ti,Wi)为第i次迭代的背景运动变量,Ai是6×Ni的矩阵,bi是1×Ni的向量,其中Ni为第i次迭代时背景区域的像素点个数, A i = ( s ( 1 ) q ( 1 ) , . . . , s ( N i ) q ( N i ) ) , bi=(-It(1),...,-It(Ni)),然后采用最小二乘法求解超定线性方程组得到运动参数(T,W)的估计值,并根据估计值更新
Figure BDA0000127700460000104
Figure BDA0000127700460000105
和r(T,W,x);
本实施例中,步骤d)的详细步骤为:
引入与原始分割变量u相对应的对偶变量
Figure BDA0000127700460000106
当运动变量和代价变量固定,根据原始-对偶变量定义,u的泛函极值子问题的函数表达式为
Figure BDA0000127700460000107
求解泛函极值子问题得到u的迭代公式
Figure BDA0000127700460000108
其中ui+1为u在第i+1次迭代的值,vi为v在第i次迭代的值,
Figure BDA0000127700460000109
为梯度算子,
Figure BDA00001277004600001010
Figure BDA00001277004600001011
在第i+1次迭代的值,
Figure BDA00001277004600001012
为梯度算子,ε为常数变量;
利用半隐式梯度下降法,得到对偶变量
Figure BDA0000127700460000111
的迭代式:
Figure BDA0000127700460000112
其中,
Figure BDA0000127700460000113
v为代价变量,δt为时间步长。
为了求解分割变量,我们引入一个变量
Figure BDA0000127700460000114
则全变分可以改写为以下形式:
Figure BDA0000127700460000115
(10)
这里u和
Figure BDA0000127700460000116
就分别被称为原始和对偶变量。当(T,W)和v固定时,u的泛函极值子问题可以写成:
Figure BDA0000127700460000117
(11)
根据对偶矢量的定义,对方程(11)求解可得:
Figure BDA0000127700460000118
(12)
将式(12)代入方程(11),得到:
Figure BDA0000127700460000119
(13)
式(13)等同于以下最小化问题:
Figure BDA00001277004600001110
(14)
根据欧拉-拉格朗日方程,可以得到x点处的最优解的必要条件:
Figure BDA00001277004600001111
(15)
这里α(x)是满足限制条件
Figure BDA00001277004600001112
的拉格朗日乘子:
Figure BDA00001277004600001113
(16)
将(16)代入(15),得到:
Figure BDA00001277004600001114
(17)
然后利用半隐式梯度下降法,最后得到对偶变量
Figure BDA00001277004600001115
的迭代式:
Figure BDA00001277004600001116
Figure BDA0000127700460000121
(19)
其中时间步长取δt=1/8。
代价变量的作用是对足够小的ε,使得u≈v。本实施例中,步骤e)的详细步骤为:
当运动变量和分割变量固定时,代价变量的泛函极值子问题为:
v = arg min v ∫ Ω ( λr ( T , W , x ) v + 1 2 ϵ | | u - v | | L 2 2 ) dx
对极值子问题求解,得到代价变量的迭代式为:
vi+1=min{max{ui+1-ελri+1(T,W,x),0},1}
其中vi+1为v在第i+1次迭代的值,ui+1为u在第i+1次迭代的值,ε为常数变量,λ为比例因子,ri+1(T,W,x)为区域运动描述符在第i+1次迭代的值。
以上所述仅为本发明的优选实施方式,本发明的保护范围并不仅限于上述实施方式,凡是属于本发明原理的技术方案均属于本发明的保护范围。对于本领域的技术人员而言,在不脱离本发明的原理的前提下进行的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (6)

1.一种基于3D视频的时空域运动分割与估计模型的凸优化方法,其特征在于其实施步骤如下: 
1)根据活动轮廓思想以及背景三维运动参数与二维光流的映射关系建立基于3D视频的时空域运动分割与估计模型; 
所述的时空域运动分割与估计模型的函数表达式为: 
Figure FDA0000401408410000011
其中E为能量泛函,C为分割曲面,T为背景的平移变量,W为背景的旋转变量,T和W的表达分别为T=(t1,t2,t3)、W=(w1,w2,w3),It为图像的时间差分,Cin、Cout分别为时空域中曲面的内部和外部区域,ds为单位曲面,dx为单位像素点,α、λ为比例因子,s和q分别为对应于每个像素点的常数向量;s和q的函数表达式分别为: 
Figure FDA0000401408410000013
其中,Ix为图像的横向差分,Iy为图像的纵向差分,x为像素点在图像坐标中的x轴坐标值,y为像素点在图像坐标中的y轴坐标值,Z为像素点在空间坐标中的z轴坐标值,f为摄像机焦距; 
2)将所述时空域运动分割与估计模型转换为对应的水平集描述方程,求出所述水平集描述方程对应的梯度下降方程,求出所述梯度下降方程的等价方程,求解对应于所述等价方程的能量泛函,对能量泛函进行凸松弛,得到凸优化后的时空域运动分割与估计模型; 
3)引入代价变量对凸优化后的时空域运动分割与估计模型进行进一步的松弛,采用多变量交替迭代算法最小化所述凸优化后的时空域运动分割与估计模型,迭代收敛后根据选择的门限函数得到最终的分割曲面。 
2.根据权利要求1所述的基于3D视频的时空域运动分割与估计模型的凸优化方法,其特征在于,所述步骤2)的详细步骤为: 
A)将所述时空域运动分割与估计模型转换为对应的水平集描述方程,所述水平集描述方程的函数表达式为: 
其中,Ω为整个时空域积分区域,
Figure FDA0000401408410000022
为内部区域的运动描述符,
Figure FDA0000401408410000023
为外部区域的运动描述符,φ为符号距离函数,|▽φ|为符号距离函数φ的梯度的模,δ(φ)为关于符号距离函数φ的Dirac函数,H(φ)为关于符号距离函数φ的Heaviside函数,λ为比例因子;
Figure FDA0000401408410000024
Figure FDA0000401408410000025
的函数表达式为: 
Figure FDA0000401408410000026
Figure FDA0000401408410000027
其中,It为图像的时间差分,T为背景的平移变量,W为背景的旋转变量,α为比例因子,s和q分别为对应于每个像素点的常数向量; 
B)求出所述水平集描述方程对应的梯度下降方程,所述梯度下降方程的函数表达式为: 
Figure FDA0000401408410000028
其中T为背景的平移变量,W为背景的旋转变量,x为图像空间中某一个像素点x,t为时间步长,
Figure FDA0000401408410000029
为符号距离函数φ对时间步长的偏微分,
Figure FDA00004014084100000210
为符号距离函数φ的散度,λ为比例因子,
Figure FDA00004014084100000211
为内部区域的运动描述符,
Figure FDA00004014084100000212
为外部区域的运动描述符,δ(φ)为关于符号距离函数φ的Dirac函数; 
C)由于δ≥0,求出所述梯度下降方程的等价方程: 
求解对应于所述梯度下降方程的等价方程的能量泛函: 
将φ∈{0,1}松弛到连续区间[0,1]上,并用标记符号u代替φ,得到凸优化后的时空域运动分割与估计模型,所述凸优化后的时空域运动分割与估计模型的函数表达式为: 
Figure FDA00004014084100000215
其中,EG为凸优化后的能量泛函,u为分割变量,|▽u|为分割变量的梯度模值,r(T,W,x)为区域运动描述符,λ为比例因子,x为图像空间中某一个像素点x;r(T,W,x)的函数表达式为
Figure FDA0000401408410000031
3.根据权利要求2所述的基于3D视频的时空域运动分割与估计模型的凸优化方法,其特征在于,所述步骤3)的详细步骤为: 
a)引入一个代价变量v∈[0,1]来松弛对分割变量的限制,将所述优化后的时空域运动分割与估计模型进一步松弛,进一步松弛后的时空域运动分割与估计模型的函数表达式为: 
Figure FDA0000401408410000032
b)将背景的平移变量T和旋转变量W初始化为0,将分割变量u和代价变量v初始化为任意值; 
c)固定分割变量和代价变量,更新运动变量和区域运动描述符,其中第i次迭代时背景的运动变量定义为θi=(Ti,Wi),Ti为第i次迭代时背景的平移变量,Wi为第i次迭代时背景的旋转变量; 
d)引入一个与分割变量对应的对偶变量,固定运动变量和代价变量,利用原始分割变量-对偶变量的对应关系更新分割变量; 
e)固定运动变量和分割变量,更新代价变量;然后重复迭代所述步骤c)~步骤e)直至所述进一步松弛后的时空域运动分割与估计模型收敛; 
f)选择门限函数σ∈(0,1),根据所述门限函数σ∈(0,1)得到最终的分割曲面C={x|u(x)=σ}。 
4.根据权利要求3所述的基于3D视频的时空域运动分割与估计模型的凸优化方法,其特征在于,所述步骤c)的详细步骤为: 
对背景的运动参数(T,W)建立超定线性方程组θiAi=bi,Ai是6×Ni的矩阵,bi是1×Ni的向量,其中Ni为第i次迭代时背景区域的像素点个数,bi=(-It(1),...,-It(Ni)),然后采用最小二乘法求解所述超定线性方程组得到运动参数(T,W)的估计值,并根据所述估计值更新
Figure FDA0000401408410000034
5.根据权利要求3所述的基于3D视频的时空域运动分割与估计模型的凸优化方法,其特征在于,所述步骤d)的详细步骤为: 
引入与原始分割变量u相对应的对偶变量
Figure FDA0000401408410000041
当运动变量和代价变量固定,根据原始-对偶变量定义,u的泛函极值子问题的函数表达式为: 
求解所述泛函极值子问题得到u的迭代公式
Figure FDA0000401408410000043
其中ui+1为u在第i+1次迭代的值,vi为v在第i次迭代的值,▽为梯度算子,
Figure FDA0000401408410000047
Figure FDA0000401408410000044
在第i次迭代的值,▽为梯度算子,ε为常数变量; 
利用半隐式梯度下降法,得到对偶变量
Figure FDA0000401408410000049
的迭代式: 
Figure FDA0000401408410000045
其中,
Figure FDA00004014084100000410
v为代价变量,δt为时间步长。 
6.根据权利要求3所述的基于3D视频的时空域运动分割与估计模型的凸优化方法,其特征在于,所述步骤e)的详细步骤为: 
当运动变量和分割变量固定时,代价变量的泛函极值子问题为: 
Figure FDA0000401408410000046
对所述极值子问题求解,得到代价变量的迭代式为: 
vi+1=min{max{ui+1-ελri+1(T,W,x),0},1} 
其中vi+1为v在第i+1次迭代的值,ui+1为u在第i+1次迭代的值,ε为常数变量,λ为比例因子,ri+1(T,W,x)为区域运动描述符在第i+1次迭代的值。 
CN201110457371.9A 2011-12-31 2011-12-31 基于3d视频的时空域运动分割与估计模型的凸优化方法 Expired - Fee Related CN102592287B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110457371.9A CN102592287B (zh) 2011-12-31 2011-12-31 基于3d视频的时空域运动分割与估计模型的凸优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110457371.9A CN102592287B (zh) 2011-12-31 2011-12-31 基于3d视频的时空域运动分割与估计模型的凸优化方法

Publications (2)

Publication Number Publication Date
CN102592287A CN102592287A (zh) 2012-07-18
CN102592287B true CN102592287B (zh) 2014-06-04

Family

ID=46480877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110457371.9A Expired - Fee Related CN102592287B (zh) 2011-12-31 2011-12-31 基于3d视频的时空域运动分割与估计模型的凸优化方法

Country Status (1)

Country Link
CN (1) CN102592287B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102800189B (zh) * 2012-07-22 2014-12-10 江南大学 一种物联网环境下智能泊车路径优化方法
CN106803260B (zh) * 2016-12-28 2019-08-09 辽宁师范大学 基于局部熵凸优化的红外船舶图像活动轮廓分割方法
EP3563344A4 (en) * 2017-02-09 2020-07-22 Google LLC AGENT NAVIGATION USING VISUAL INPUT
CN107300386B (zh) * 2017-06-05 2020-06-09 西北工业大学 一种基于仅测角导航的闭环凸优化最优交会制导方法
CN110163888B (zh) * 2019-05-30 2021-03-02 闽江学院 一种新型的运动分割模型数量检测方法
CN110740331B (zh) * 2019-08-05 2023-01-31 辽宁师范大学 基于自适应步长和Levenberg-Marquardt优化的视频弹性运动估计方法
CN111127479A (zh) * 2019-12-17 2020-05-08 昆明理工大学 一种基于曲线面积的水平集图像分割方法
CN111325727B (zh) * 2020-02-19 2023-06-16 重庆邮电大学 一种基于局部熵和水平集算法的颅内出血区域三维分割方法
CN112508925B (zh) * 2020-12-16 2023-07-04 广州大学 电子锁面板质量检测方法、系统、计算机装置和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101038671A (zh) * 2007-04-25 2007-09-19 上海大学 基于立体视觉三维手指运动轨迹跟踪方法
EP2214137A2 (en) * 2009-01-29 2010-08-04 Vestel Elektronik Sanayi ve Ticaret A.S. A method and apparatus for frame interpolation

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101038671A (zh) * 2007-04-25 2007-09-19 上海大学 基于立体视觉三维手指运动轨迹跟踪方法
EP2214137A2 (en) * 2009-01-29 2010-08-04 Vestel Elektronik Sanayi ve Ticaret A.S. A method and apparatus for frame interpolation

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A Variational Approach for Ego-motion Estimation and Segmentation Based on 3D TOF Camera;Shiyan Wang, et al.;《2011 4th International Congress on Image and Signal Processing》;20111017;第3卷;1160-1164 *
Shiyan Wang, et al..A Variational Approach for Ego-motion Estimation and Segmentation Based on 3D TOF Camera.《2011 4th International Congress on Image and Signal Processing》.2011,第3卷1160-1164.
于慧敏,等.基于水平集的多运动目标时空分割与跟踪.《中国图象图形学报》.2007,第12卷(第7期),1218-1223. *
于慧敏,等.基于水平集的多运动目标检测和分割.《浙江大学学报(工学版)》.2007,第41卷(第3期),412-417. *

Also Published As

Publication number Publication date
CN102592287A (zh) 2012-07-18

Similar Documents

Publication Publication Date Title
CN102592287B (zh) 基于3d视频的时空域运动分割与估计模型的凸优化方法
CN112902953B (zh) 一种基于slam技术的自主位姿测量方法
Weder et al. Routedfusion: Learning real-time depth map fusion
CN111045017B (zh) 一种激光和视觉融合的巡检机器人变电站地图构建方法
CN103247075B (zh) 基于变分机制的室内环境三维重建方法
WO2018129715A1 (zh) 一种同时定位与稠密三维重建方法
CN104156536B (zh) 一种盾构机刀具磨损的可视化定量标定及分析方法
CN106679634B (zh) 一种基于立体视觉的空间非合作目标位姿测量方法
CN102184540B (zh) 基于尺度空间的亚像素级立体匹配方法
CN104156957B (zh) 一种稳定高效的高分辨率立体匹配方法
CN102354396A (zh) 基于水平集函数的灰度不均匀图像分割方法
CN110009674A (zh) 基于无监督深度学习的单目图像景深实时计算方法
CN105869178A (zh) 一种基于多尺度组合特征凸优化的复杂目标动态场景无监督分割方法
CN103236082A (zh) 面向捕获静止场景的二维视频的准三维重建方法
CN101504767B (zh) 基于水平集接力的图像分割方法
Cao et al. Learning independent object motion from unlabelled stereoscopic videos
CN105957078A (zh) 一种基于图割的多视点视频分割方法
CN103702103B (zh) 基于双目相机的光栅立体印刷图像合成方法
CN108021857B (zh) 基于无人机航拍图像序列深度恢复的建筑物检测方法
CN106952292B (zh) 基于6自由度场景流聚类的3d运动目标检测方法
CN105466399A (zh) 快速半全局密集匹配方法和装置
CN106056622A (zh) 一种基于Kinect相机的多视点深度视频复原方法
Chen et al. Vip-slam: An efficient tightly-coupled rgb-d visual inertial planar slam
Wu et al. A new stereo dense matching benchmark dataset for deep learning
CN113532420A (zh) 一种融合点线特征的视觉惯性里程计方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140604