CN100394446C - 基于直线对应的动态场景多体运动分割方法 - Google Patents

基于直线对应的动态场景多体运动分割方法 Download PDF

Info

Publication number
CN100394446C
CN100394446C CNB2006100294068A CN200610029406A CN100394446C CN 100394446 C CN100394446 C CN 100394446C CN B2006100294068 A CNB2006100294068 A CN B2006100294068A CN 200610029406 A CN200610029406 A CN 200610029406A CN 100394446 C CN100394446 C CN 100394446C
Authority
CN
China
Prior art keywords
line
many bodies
motion
trifocal tensor
utilize
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2006100294068A
Other languages
English (en)
Other versions
CN1889126A (zh
Inventor
张婧
石繁槐
王建华
刘允才
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CNB2006100294068A priority Critical patent/CN100394446C/zh
Publication of CN1889126A publication Critical patent/CN1889126A/zh
Application granted granted Critical
Publication of CN100394446C publication Critical patent/CN100394446C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及一种基于直线对应的动态场景多体运动分割方法,对于给定包含多个运动物体的三幅视图,首先利用多项式嵌入技术,得到运动物体上的直线之间存在的多体三线性约束,然后利用多体三线性约束的线性方程组,计算包含多个运动物体运动特征的多体三焦点张量,并利用三视图几何中外极点,外极线相关定理求出每个单体运动对应的外极点与外极线,最后对此多体三焦点张量进行二次微分,得到表示单个运动物体运动特征的单体三焦点张量,完成多体运动分割。本发明使用三幅视图中的直线对应来估计多个刚体3D运动模型,不会产生特征点数量不够或对应点被遮挡等问题,能精确高效的完成动态场景中的多体运动分割。

Description

基于直线对应的动态场景多体运动分割方法
技术领域
本发明涉及一种基于直线对应的动态场景多体运动分割方法,可广泛应用于计算机三维视觉测量、视觉伺服等方面。属于先进制造与自动化领域。
背景技术
动态场景中的多体运动分割是计算机立体视觉中一个基本问题。在动态场景中,3D世界中的相机和多个物体都是运动的,多体运动分割的目的就是在不知具体的图像特征属于哪个运动物体的情况下,恢复运动模型。
针对这一问题,有许多解决方法。Vidal和Ma(R.Vidal and Y.Ma.“Aunified algebraic approach to 2-D and 3-D motion segmentation”.In ECCV,2004)将多个运动模型的估计看作一个单独的多体运动模型,提出了一个统一的代数方法,通过两幅视图对应,或者光流来解决2D和3D的运动分割。这个方法可以应用于计算机视觉中大多数的两视图运动模型。但是包括Vidal和Ma的方法在内的所有的方法都是使用点对应来解决3D运动分割的,当不能得到足够数量的特征点对应数据时,或由于物体的运动致使特征点被遮挡时,以上的所有方法都会遇到问题。
图像中的直线也是一个经常用于计算机视觉中的特征,并从1980年开始已经开始用于3D运动估计。直线的位置和方向比点更容易判别,并可以达到子像素级的精确度。所以,可以考虑使用直线对应来解决3D运动分割问题。Shi等(FanhuaiShi,Jianhua Wang,Jing Zhang,Yuncai Liu.“Motion Segmentation ofMultiple Translating Objects Using Line Correspondences”,In CVPR 2005)提出了一种使用直线对应和三焦点张量来分割物体的代数方法,但是只能处理平移运动,不能解决一般的3D运动。
发明内容
本发明的目的在于针对现有技术的不足,提出一种基于直线对应的动态场景多体运动分割方法,使用3幅视图中的直线对应来估计多个刚体3D运动模型,不会产生特征点数量不够或对应点被遮挡等问题,能精确高效的完成动态场景中的多体运动分割。
为实现这一目的,本发明的技术方案是:对于给定包含多个运动物体的三幅视图,首先利用多项式嵌入技术,得到运动物体上的直线之间存在的多体三线性约束,然后利用多体三线性约束的线性方程组,计算包含多个运动物体运动特征的多体三焦点张量,并利用三视图几何中外极点,外极线相关定理求出每个单体运动对应的外极点与外极线,最后对此多体三焦点张量进行二次微分,得到表示单个运动物体运动特征的单体三焦点张量,完成多体运动分割。
本发明的基于直线对应的多体运动分割方法主要包括以下几个步骤:
1、利用多项式嵌入技术,得到运动物体上直线之间存在的多体三线性约束:
对于给定包含多个运动物体的三幅视图,根据三焦点张量定理,得到被多个运动所满足的线性约束方程组。对方程组中的每一个分量进行多项式嵌入,得到多个运动物体上的直线之间存在的多体三线性约束,即由多体三焦点张量τ满足的三个线性方程。
2、利用多体三线性约束的线性方程组,计算包含多个运动物体运动特征的多体三焦点张量:
利用多体三线性约束的线性方程组中第一和第二个方程(方程组中方程排列顺序无固定要求),求解包含多体三焦点张量的一部分分量的一个矢量τ1,利用多体三线性约束的线性方程组中第一和第三个方程计算包含多体三焦点张量的另一部分分量的另一个矢量τ2。若运动物体个数等于2个,则多体三焦点张量可由τ1和τ2去掉重合部分合成得到,否则,将线-线-线对应转换为点-线-线对应,计算包含多体三焦点张量τ中剩余分量的第三个矢量 τ 3 ∈ ( n - 1 ) ( n - 2 ) 2 × M n × M n , 则多体三焦点张量由三个矢量τ1,τ2,τ3通过去掉重合部分合成得到;其中,n为运动物体个数,Mn=(n+1)(n+2)/2。
3、利用三视图几何中外极点、外极线相关定理求出每个单体运动对应的外极线与外极点:
将线线-线对应转换为点-线-线对应,利用三视图几何中外极点、外极线相关定理可以求出与第一幅视图中的所有特征点对应的第二、三视图中的外极线;利用任意两条外极线的交点来得到候选的外极点,根据每一个候选外极点在所有线对应中的支持度得到优选的外极点。最后,利用与优选的外极点对应的数据来重新估计外极点。
4、对多体三焦点张量进行二次微分,得到表示单个运动物体运动特征的单体三焦点张量,达到运动分割的目的:
利用步骤3中得到的重新估计的外极点,计算第二、三幅视图中对应于随机选择的点的外极线;利用此外极线和步骤2中计算的多体三焦点张量,得到单体三焦点张量,最后将每一组直线特征聚类到与其误差最小的一个单体三焦点张量表示的运动中,完成多体运动分割。
本发明的方法使用三幅视图中的直线对应来估计多个刚体3D运动模型,不会产生特征点数量不够或对应点被遮挡等问题,能精确高效的完成动态场景中的多体运动分割。
具体实施方式
为了更好地理解本发明的技术方案,以下结合实施例作进一步的详细描述。
1、利用多项式嵌入技术,得到运动物体上的直线之间存在的多体三线性约束:对应多个运动中任意一个运动上的一组线-线-线对应 l ↔ l ′ ↔ l ′ ′ , 存在由单体三焦点张量T满足的三线性约束:
[l]xl′l″T  =0(1)
则对于多个独立的运动,可得到被多个运动所满足的线性约束方程组:
Π i = 1 n ( [ l ] x l ′ l ′ ′ T i ) = 0 - - - ( 2 )
假设l=(l1,l2,l3),l′=(l′1,l′2,l′3),l″=(l″1,l″2,l″3),上式可表示为:
Π i = 1 n = 0 - l 3 l 2 l 3 0 l 2 - l 2 l 1 0 · l ′ · l ′ ′ · T i = 0 - - - ( 3 )
令L1=(0,-l3,l2)T,L2=(l3,0,-l2)T,L3=(-l2,l1,0)T,可得到方程组:
Π i = 1 n ( L 1 · l ′ · l ′ ′ · T i ) = 0 - - - ( 4 )
Π i = 1 n ( L 2 · l ′ · l ′ ′ · T i ) = 0 - - - ( 5 )
Π i = 1 n ( L 3 · l ′ · l ′ ′ · T i ) = 0 - - - ( 6 )
对方程组中的每一个分量L1,L2,L3,l′,l″进行多项式嵌入,将它们按选定的顺序各写为一个维数为Mn=(n+1)(n+2)/2向量,分别表示为
Figure C20061002940600063
定义一个3维的张量τ∈RM n ×M n ×M n,则得到多个运动物体上的直线之间存在的多体三线性约束,即由多体三焦点张量τ满足的三个线性方程:
L ~ 1 · l ′ ~ · l ′ ′ ~ · τ = 0 - - - ( 7 )
L ~ 2 · l ′ ~ · l ′ ′ ~ · τ = 0 - - - ( 8 )
L ~ 3 · l ′ ~ · l ′ ′ ~ · τ = 0 - - - ( 9 )
2、利用多体三线性约束的线性方程组,计算包含多个运动物体运动特征的多体三焦点张量:令 N = [ ( n + 1 ) ( n + 2 ) 2 - ( n - 1 ) - ( n - 1 ) ( n - 2 ) 2 × M n × M n ] , n=2,3,..。给定Nl≥N/2组线-线-线对应,去掉向量
Figure C200610029406000610
中对应元素同时等于0的 ( n - 1 ) + ( n - 1 ) ( n - 2 ) 2 个元素,利用多体三线性约束的线性方程组中前两个方程(7)(8),求解包含τ的一部分分量的一个矢量τ1∈RN1为矩阵A∈R2N l ×N的零矢量,此矩阵的行由 L ~ 1 ⊗ l ′ ~ ⊗ l ′ ′ ~ ∈ R N L ~ 2 ⊗ l ′ ~ ⊗ l ′ ′ ~ ∈ R N 计算得到,其中为Kronecker积);利用多体三线性约束的线性方程组中第一和第三个方程(7)(9),用与计算τ1相似的方法计算包含τ的另一部分分量的另一个矢量τ2。若运动物体个数等于2个,则多体三焦点张量 τ ⊆ τ 1 ∪ τ 2 ; 否则,任取l上一点x=(x1,x2,x3),将线-线-线对应 l ↔ l ′ ↔ l ′ ′ 转换为点-线-线对应 x ↔ l ′ ↔ l ′ ′ , 解线性方程Bτ3=-bτ得到τ3,其中B由 x 1 x 2 x 3 ⊗ l ′ ~ ⊗ l ′ ′ ~ 计算得到;b由 ( ( x 1 3 , x 1 2 x 2 , x 1 2 x 3 , x 1 x 2 2 , x 1 x 3 2 , x 2 3 , x 2 2 x 3 , x 2 x 3 2 , x 3 3 ) ⊗ l ′ ~ ⊗ l ′ ′ ~ ) · τ 计算得到。则多体三焦点张量 τ ⊆ τ 1 ∪ τ 2 ∪ τ 3 由τ1,τ2,τ3通过去掉重合部分合并得到。
3、利用三视图几何中外极点、外极线相关定理求出每个单体运动对应的外极线与外极点:对于点-线-线对应 x ↔ l ′ ↔ l ′ ′ , 利用三视图几何中外极点,外极线相关定理(Richard Hartley,Andrew Zisserman,《计算机视觉中的多视图几何》,第三篇,2002年8月第一版)可以求出与第一幅视图中的所有特征点xi对应的第二、三幅视图中的各Nl条外极线;利用任意两条外极线的交点来得到候选的外极点,计算每一个候选外极点在所有线对应中的支持度。当有n个运动时,将有n个候选外极点有着比其他候选外极点大得多的支持度。所以可根据每一个候选外极点在所有对应中的支持度,选择此队列中的前n个外极点得到优选的外极点。最后,利用与优选的外极点对应的数据来重新估计外极点。
4、对多体三焦点张量进行二次微分,得到表示单个运动物体运动特征的单体三焦点张量,达到运动分割的目的:利用步骤3中得到的在第2幅视图上的外极点(e′1,e′2,...,e′n)和在第3幅视图上的外极点(e″1,e″2,...,e″n),得到n!组外极点组合Ei={(e′1,e″i1),(e′2,e″i2),...,(e′n,e″in)},i=1,...,n!。令{xj}j=1 N x为Nx≥4个随机选择的点,在Ei中选择一个外极点组合(e′,e″),利用e′和e″来计算第2,3幅视图中对应于随机选择的点xj的外极线l′xj和l″xj;利用此外极线,对步骤2中计算得到的多体三焦点张量τ的表达式:
∂ 2 ( x ~ l ′ ~ l ′ ′ ~ τ ) ∂ l ′ ∂ l ′ ′ | ( x , l ix ′ , l jx ′ ′ ) = M x ~ xT ∈ R 3 × 3 - - - ( 10 )
进行二次微分计算单体三焦点张量T1Ei,T2Ei,...,EnEi。令{numEi=0}i=1 n!并设定阈值t。计算每一组特征数据与T1Ei,T2Ei,..,TnEi的Sampson误差δ。对每一个满足δ<t的误差,令numEi=numEi+1。选择使numEi最大的Ei作为正确的外极点组合,则T1Ei,T2Ei,...,TnEi为正确的单体三角点张量。最后利用正确的单体三焦点张量,计算每一组直线特征与三焦点张量{T}i=1 n的Sampson误差并将每一组直线特征聚类到与其误差最小的一个单体三焦点张量Ti表示的运动中,达到运动分割的目的。

Claims (1)

1.一种基于直线对应的动态场景多体运动分割方法,其特征在于包括如下具体步骤:
1)对于给定包含多个运动物体的三幅视图,根据三焦点张量定理,得到被多个运动所满足的线性约束方程组,对方程组中的每一个分量进行多项式嵌入,得到多个运动物体上的直线之间存在的多体三线性约束,即由多体三焦点张量τ满足的三个线性方程;
2)利用多体三线性约束的线性方程组中第一和第二个方程,求解包含多体三焦点张量的一部分分量的一个矢量τ1,利用多体三线性约束的线性方程组中第一和第三个方程计算包含多体三焦点张量的另一部分分量的另一个矢量τ2;若运动物体个数等于2个,则多体三焦点张量由τ1和τ2去掉重合部分合成得到,否则,将线-线-线对应转换为点-线-线对应,计算包含多体三焦点张量τ中剩余分量的第三个矢量 τ 3 ∈ ( n - 1 ) ( n - 2 ) 2 × M n × M n ,则多体三焦点张量
由三个矢量τ1,τ2,τ3通过去掉重合部分合成得到;其中,n为运动物体个数,
Mn=(n+1)(n+2)/2;
3)将线-线-线对应转换为点-线-线对应,利用三视图几何中外极点、外极线相关定理求出与第一幅视图中的所有特征点对应的第二、三视图中的外极线;
利用任意两条外极线的交点来得到候选的外极点,根据每一个候选外极点在所有外极线对应中的支持度得到优选的外极点,最后,利用与优选的外极点对应的数据来重新估计外极点;
4)利用步骤3)中得到的重新估计的外极点,计算第二、三幅视图中对应于随机选择的点的外极线;利用此外极线和步骤2)中计算的多体三焦点张量,得到单体三焦点张量,最后将每一组直线特征聚类到与其误差最小的一个单体三焦点张量表示的运动中,完成多体运动分割。
CNB2006100294068A 2006-07-27 2006-07-27 基于直线对应的动态场景多体运动分割方法 Expired - Fee Related CN100394446C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006100294068A CN100394446C (zh) 2006-07-27 2006-07-27 基于直线对应的动态场景多体运动分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006100294068A CN100394446C (zh) 2006-07-27 2006-07-27 基于直线对应的动态场景多体运动分割方法

Publications (2)

Publication Number Publication Date
CN1889126A CN1889126A (zh) 2007-01-03
CN100394446C true CN100394446C (zh) 2008-06-11

Family

ID=37578401

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006100294068A Expired - Fee Related CN100394446C (zh) 2006-07-27 2006-07-27 基于直线对应的动态场景多体运动分割方法

Country Status (1)

Country Link
CN (1) CN100394446C (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102621143B (zh) * 2012-01-21 2013-10-09 天津大学 基于多维阈值约束的双视角多气泡同名匹配方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000078572A (ja) * 1998-08-31 2000-03-14 Toshiba Corp オブジェクト符号化装置およびオブジェクト符号化装置のコマ落し制御方法およびプログラムを記録した記憶媒体
US20040197028A1 (en) * 2003-04-03 2004-10-07 Microsoft Corporation High quality anti-aliasing
CN1710614A (zh) * 2005-06-16 2005-12-21 上海交通大学 基于模型的人肢体三维运动参数估计方法
CN1766934A (zh) * 2004-10-26 2006-05-03 中国科学院计算技术研究所 一种用计算机创建三维运动的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000078572A (ja) * 1998-08-31 2000-03-14 Toshiba Corp オブジェクト符号化装置およびオブジェクト符号化装置のコマ落し制御方法およびプログラムを記録した記憶媒体
US20040197028A1 (en) * 2003-04-03 2004-10-07 Microsoft Corporation High quality anti-aliasing
CN1766934A (zh) * 2004-10-26 2006-05-03 中国科学院计算技术研究所 一种用计算机创建三维运动的方法
CN1710614A (zh) * 2005-06-16 2005-12-21 上海交通大学 基于模型的人肢体三维运动参数估计方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Motion Segmentation of Multiple Translating Objects UsingLine Correspondences",. Fanhuai Shi,et al.Computer Society Conference on Computer Vision and Pattern Recognition,. 2005
"Motion Segmentation of Multiple Translating Objects UsingLine Correspondences",. Fanhuai Shi,et al.Computer Society Conference on Computer Vision and Pattern Recognition,. 2005 *

Also Published As

Publication number Publication date
CN1889126A (zh) 2007-01-03

Similar Documents

Publication Publication Date Title
CN108520554B (zh) 一种基于orb-slam2的双目三维稠密建图方法
CN101887589B (zh) 一种基于立体视觉的实拍低纹理图像重建方法
CN101398886B (zh) 一种基于双目被动立体视觉的快速三维人脸识别方法
CN101271582B (zh) 基于多视角二维图像并结合sift算法的三维重建方法
CN108010081B (zh) 一种基于Census变换和局部图优化的RGB-D视觉里程计方法
CN103106651B (zh) 一种基于三维hough变换的获取视差平面的方法
CN103913131A (zh) 一种基于双目视觉的自由曲面法矢量测量方法
CN103292695A (zh) 一种单目立体视觉测量方法
CN102750449B (zh) 基于分步三维空间-特征域映射的点云直线特征提取方法
CN104867135A (zh) 一种基于指导图像引导的高精度立体匹配方法
CN106056622B (zh) 一种基于Kinect相机的多视点深度视频复原方法
CN102697508A (zh) 采用单目视觉的三维重建来进行步态识别的方法
CN102074020A (zh) 对视频进行多体深度恢复和分割的方法
CN103822581B (zh) 一种基于压缩感知的不规则物体体积测量方法
CN113393524B (zh) 一种结合深度学习和轮廓点云重建的目标位姿估计方法
CN108629809B (zh) 一种精确高效的立体匹配方法
CN101765019B (zh) 一种用于运动模糊和光照变化图像的立体匹配方法
CN111105451B (zh) 一种克服遮挡效应的驾驶场景双目深度估计方法
CN109470149A (zh) 一种管路位姿的测量方法及装置
CN114396877B (zh) 面向材料力学性能的智能三维位移场及应变场测量方法
CN107862735A (zh) 一种基于结构信息的rgbd三维场景重建方法
CN101739683A (zh) 基于图分割和多线索融合的单幅图深度估计方法及其系统
CN104182968A (zh) 宽基线多阵列光学探测系统模糊动目标分割方法
CN102740096A (zh) 一种基于时空结合的动态场景立体视频匹配方法
CN103927787A (zh) 一种基于矩阵恢复的提高三维重建精度的方法及其装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080611

Termination date: 20110727