CN103606189B - 一种面向非刚体三维重建的轨迹基选择方法 - Google Patents

一种面向非刚体三维重建的轨迹基选择方法 Download PDF

Info

Publication number
CN103606189B
CN103606189B CN201310581017.6A CN201310581017A CN103606189B CN 103606189 B CN103606189 B CN 103606189B CN 201310581017 A CN201310581017 A CN 201310581017A CN 103606189 B CN103606189 B CN 103606189B
Authority
CN
China
Prior art keywords
track base
matrix
track
rigid
reconstruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310581017.6A
Other languages
English (en)
Other versions
CN103606189A (zh
Inventor
汪亚明
郑俊褒
熊莹丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zongyang Liyang Small And Medium Sized Enterprise Service Center
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201310581017.6A priority Critical patent/CN103606189B/zh
Publication of CN103606189A publication Critical patent/CN103606189A/zh
Application granted granted Critical
Publication of CN103606189B publication Critical patent/CN103606189B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种面向非刚体三维重建的轨迹基选择方法,其采用预先定义的初始轨迹基重构运动非刚体的三维结构,计算初始重建结果的投影误差并分析其频谱,根据频谱选择出符合一定误差水平的轨迹基位置组合,将选择出的轨迹基位置与轨迹空间中的轨迹基分量对应起来,最终确定轨迹基的数目和组合形式。本发明的轨迹基选择方法不需要通过大量的重建实验和人为经验来得到轨迹基,从而大大减少了重建过程的计算量,并且选择出的轨迹基更加精确合理,在保证了重建精度的同时提高了算法的效率,实现了轨迹基的自动选择。

Description

一种面向非刚体三维重建的轨迹基选择方法
技术领域
本发明属于三维重建技术领域,具体涉及一种面向非刚体三维重建的轨迹基选择方法。
背景技术
非刚体的三维运动重建是指从二维图像中恢复非刚体物体的三维结构。三维结构提供的信息比二维结构更加全面和充分,因此非刚体的三维重建方法广泛用于医疗图像处理、工业生产自动化和军事监测与跟踪等各个领域。
在基于动态图像序列的非刚体三维运动重建中,非刚体的三维结构可以表示为一组轨迹基的加权线性组合。利用预先定义的轨迹基进行重建,可减少需要求解的未知数数目,从而提高了算法的稳定性。而非刚体种类繁多,运动形式也有千差万别。因此,轨迹基的选择方法成为非刚体运动重建算法中的关键。
现存的轨迹基选择方法仅仅考虑轨迹基的数目,主要有两种选择方法。一种是Akhter、Y.Sheikh、S.Khan和T.Kanade在标题为Trajectory Space:A DualRepresentation for Nonrigid Structure from Motion(IEEE Computer Society,2010)的文献中提出的方法是从1开始遍历,通过大量实验从中取一个较为理想的轨迹基数目K,然后在轨迹空间中顺序选择从1到K的轨迹基分量;这种轨迹基选择方法依靠大量的实验和人为经验,存在着以下的不足:(1)轨迹基数目若选取得太小,会使非刚体运动很多重要信息成分被忽略,无法准确地进行重建。轨迹基数目若选取得太大,待求参数会随之增加而使算法运算时间加长,同时也会使算法不适定性增加而导致重建精度降低;(2)在轨迹基数目选择正确的情况下,轨迹基组合形式选择正确与否也会对算法造成很大的影响;不合理的轨迹基组合形式会严重影响重建的精确度。
另一种是Y.Zhu、M.Cox和S.Lucey在标题为3D motion reconstruction forreal-world camera motion(In CVPR.IEEE,June2011)的文献中提出的方法,采用完全的轨迹基分量,将其全部应用到重建过程中;但这种方法的计算量大,重建效率低下。
发明内容
针对现有技术所存在的上述技术问题,本发明提供了一种面向非刚体三维重建的轨迹基选择方法,能够基于投影误差和频率特性选择出有效的轨迹基数目及其组合形式,从而提高了非刚体三维运动重建算法的效率和精度。
一种面向非刚体三维重建的轨迹基选择方法,包括如下步骤:
(1)接收关于非刚体目标的运动图像序列,通过对运动图像序列进行特征点坐标提取,构建得到非刚体目标的原始测量矩阵;
(2)对m×m维的单位矩阵进行DCT变换(离散余弦变换),得到轨迹基矩阵并选取其中前k个轨迹基;k为自然数且1≤k≤rank(W)/3,m为运动图像序列的图像帧数,rank(W)为原始测量矩阵的秩;
(3)利用所述的k个轨迹基对原始测量矩阵进行三维重建,得到非刚体目标的三维结构和旋转矩阵;
(4)根据所述的三维结构和旋转矩阵进行反投影,得到非刚体目标的反投影测量矩阵;
(5)使所述的原始测量矩阵与反投影测量矩阵进行比较,得到运动图像序列的投影误差;
(6)对所述的投影误差进行DCT变换得到投影误差的频谱,根据预设的误差水平从频谱中选取p个频率点,进而根据p个频率点从轨迹基矩阵中提取对应的p个轨迹基;p为自然数且1≤p≤rank(W)/3。
所述的原始测量矩阵为2m×n维的矩阵,其中第i行第j行以及第i+1行第j行的两个元素值分别对应为运动图像序列第i帧图像中第j个特征点的横纵坐标,i为奇数且1≤i<2m,j为自然数且1≤j≤n,n为运动图像序列每帧图像中的特征点总个数。
所述的步骤(6)中,根据预设的误差水平从频谱中选取p个频率点的具体过程如下:首先,使频谱中各频率点按幅值从大到小排序;然后,满足以下算式选取排列最前的p个频率点:
min p { Σ y = 1 p H y Σ x = 1 m H x ≥ σ }
其中:Hx和Hy分别为排序后频谱中第x个频率点和第y个频率点的幅值,σ为误差水平,x为自然数且1≤x≤m,y为自然数且1≤y≤p。
所述的轨迹基矩阵中轨迹基的个数以及投影误差频谱中频率点的个数与运动图像序列的图像帧数相同。
本发明为了用轨迹及表示时间变化的结构,可以将结构视为轨迹的一组集合T(i)=[Tx(i)T,Ty(i)T,Tz(i)T]T,其中Tx(i)=[X1i,…Xmi]、Ty(i)=[Y1i,…Ymi]、Tz(i)=[Z1i,…Zmi]分别是第i个轨迹的x,y和z的坐标。
将每一个轨迹描述为基轨迹的线性组合:
T x ( i ) Σ i = 1 k a xl ( i ) θ l T y ( i ) Σ i = 1 k a yl ( i ) θ l T z ( i ) Σ i = 1 k a zl ( i ) θ l
其中:θl是一种轨迹基矢量,且axl(i)、ayl(i)和azl(i)是对应这些基矢量的系数。
所以非刚体的随时间变化的三维结构可以表示成:
S3m×n=Θ3m×3kA3k×n
其中:Θ和A分别是轨迹基矩阵和系数矩阵。
然后根据因式分解法分解图像序列测量矩阵,采用初始的k个轨迹基分量,构建得到非刚体的三维运动结构。
本发明通过对非刚体的运动图像序列首先进行初始重建,得到初始重建结果的投影误差并对投影误差作频谱分析,然后根据投影误差的频谱和选择标准选择出符合一定误差水平的轨迹基组合,从而确定出轨迹基的数目和组合形式。这种轨迹基选择方法不需要通过大量的重建实验和人为经验来得到轨迹基,从而大大减少了重建过程的计算量,并且选择出的轨迹基更加精确合理,在保证了重建精度的同时提高了算法的效率,实现了轨迹基的自动选择。
附图说明
图1为本发明轨迹基选择方法的流程示意图。
图2(a)为采用本发明方法所选轨迹基进行人体拾起动作三维重建的正视图。
图2(b)为采用本发明方法所选轨迹基进行人体拾起动作三维重建的侧视图。
图2(c)为采用本发明方法所选轨迹基进行人体拾起动作三维重建的俯视图。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明轨迹基选择方法进行详细说明。
如图1所示,一种面向非刚体三维重建的轨迹基选择方法,包括如下步骤:
(1)接收关于非刚体目标的运动图像序列,通过对运动图像序列进行特征点坐标提取,构建得到非刚体目标的原始测量矩阵;
原始测量矩阵为2m×n维的矩阵,其中第i行第j行以及第i+1行第j行的两个元素值分别对应为运动图像序列第i帧图像中第j个特征点的横纵坐标;m为运动图像序列的图像帧数,n为运动图像序列中每帧图像的特征点总个数,i为奇数且1≤i<2m,j为自然数且1≤j≤n。
(2)对m×m维的单位矩阵进行DCT变换,得到轨迹基矩阵并选取其中前k个轨迹基;利用k个轨迹基对原始测量矩阵进行三维重建,得到非刚体目标的三维结构和旋转矩阵;具体重建过程如下:
a.预定义轨迹基。由于离散余弦变换基(DCT基)是一种通用轨迹基,本实施方式采用离散余弦变换来预定义轨迹空间。离散余弦变换如下:
y ( k , l ) = u ( k ) Σ i = 1 m u ( i , l ) cos π ( 2 i - 1 ) ( k - 1 ) 2 m , k = 1 , . . . , m
输入为一个m×m维的单位矩阵。其中:
u ( k ) = 1 m , k = 1 2 m , 2 ≤ k ≤ m
b.分解非刚体的运动结构。图像序列对应一个2m×n维的原始测量矩阵W,它包含m帧图像的n个点的坐标位置,即:
测量矩阵可以分解为W=RS,对W进行奇异值分解如下:
W = Λ ~ A ~
c.估计矫正矩阵Q。为了恢复转移结构,需要估计矫正矩阵Q使得如下等式成立:
Λ = Λ ~ Q A = Q - 1 A ~
矩阵Λ的元素如下:
其中:θ为轨迹基分量,Ri是一个2×3的正交投影矩阵。
为了矫正只需要估计Q的三列而不需要估计整个矩阵Q。定义QIII为矩阵Q的第1、第K+1st、第2K+1st列。用QIII代替Q,可以得到:
Λ ~ Q III = θ 11 R 1 . . . θ m 1 R m
特别的,用来表示矩阵的第2i-1和2i行,于是得到:
Λ ~ 2 i - 1 : 2 i Q III Q III T Λ ~ 2 i - 1 : 2 i T = θ i , 1 2 I 2 × 2 , i = 1 , · · · , m
其中:I2×2是一个2×2的单位矩阵。根据以上约束条件可以估计出QIII
d.求出非刚体的结构矩阵。计算出QIII后,就可以估计旋转矩阵得到R;然后把它与已知DCT基矩阵Θ相乘来恢复矩阵Λ2m×3k=R2m×3mΘ3m×3k;再通过方程和S3m×n=Θ3m×3kA3k×n最终得到非刚体的三维结构。
(3)根据三维结构和旋转矩阵进行反投影,得到非刚体目标的反投影测量矩阵;使原始测量矩阵与反投影测量矩阵进行比较,得到运动图像序列的投影误差;对投影误差进行DCT变换得到投影误差的频谱。
对于采用轨迹空间中的1到k个轨迹基重建的结构矩阵,结合分解得出的旋转矩阵,反投影得出反投影测量矩阵W′,即:
W′=RS
与初始测量矩阵比较得出每一帧的平均投影误差如下:
errW ( j ) = ( Σ i ( W ′ ( 2 i - 1 ) j - W ( 2 i - 1 ) j ) 2 + ( W ′ ( 2 i ) j - W ( 2 i ) j ) 2 ) / n , i = 1 , . . . , m , j = 1 , . . . , n .
然后对投影误差采用下式进行离散余弦变换,并计算出各频率点的幅值:
H i = | 1 2 errW ( 1 ) + Σ k = 2 p errW ( k ) cos [ π p ( i + 1 2 ) k ] | , p = 1 , . . . , m
(4)根据预设的误差水平σ从频谱中选取p个频率点:
首先,使频谱中各频率点按幅值从大到小排序;然后,对于投影误差的频谱,选择出幅度最大的p个频率点,即满足以下算式选取排列最前的p个频率点:
min p { Σ y = 1 p H y Σ x = 1 m H x ≥ σ }
其中:Hx和Hy分别为排序后频谱中第x个频率点和第y个频率点的幅值;
进而根据p个频率点从轨迹基矩阵中提取对应的p个轨迹基。在轨迹空间中进一步确定出最终的轨迹基,从而完成轨迹基数目与组合形式的确定;将选择出的轨迹基应用到重建过程中,能够得到较好的重建结果。
下面以人的拾起动作为例,通过实验来验证本发明方法。具体的参数选取如下:
加载人体拾起动作的图像测量矩阵W,大小为714×41的,包括了41个特征点的357帧连续图像。取初始的轨迹基个数为k=4,在轨迹空间中顺序取前k个DCT基,即位置组合为[1 2 3 4],并将其应用到初始重建中,根据步骤(2)得到旋转矩阵R和结构矩阵S。再根据步骤(3)计算得出投影误差errW,是一个1×357的矩阵,进而求出频谱幅度H。根据步骤(4),取误差水平σ为0.83,选择得出的轨迹基位置组合为[1 2 3 4 6],此时轨迹基数目为p=5。最后在轨迹空间中找到相应位置的轨迹基分量并组合起来,则确定了轨迹基的数目与组合形式,最后将其应用到重建过程中。
图2为采用选择出的轨迹基的重建结果图。表1分析了初始重建、采用前5个轨迹基、前7个轨迹基的重建性能,比较了各自的重建误差的期望水平和所用的重建时间。
表1
由以上实验数据证明,采用轨迹基自动选择方法选择的轨迹基在保证了重建精度的同时,又提升了效率,实现了轨迹基的自动选择,很好地解决了现存的问题。

Claims (3)

1.一种面向非刚体三维重建的轨迹基选择方法,包括如下步骤:
(1)接收关于非刚体目标的运动图像序列,通过对运动图像序列进行特征点坐标提取,构建得到非刚体目标的原始测量矩阵;
(2)对m×m维的单位矩阵进行DCT变换,得到轨迹基矩阵并选取其中前k个轨迹基;k为自然数且1≤k≤rank(W)/3,m为运动图像序列的图像帧数,rank(W)为原始测量矩阵的秩,W为原始测量矩阵;
(3)利用所述的k个轨迹基对原始测量矩阵进行三维重建,得到非刚体目标的三维结构和旋转矩阵;
(4)根据所述的三维结构和旋转矩阵进行反投影,得到非刚体目标的反投影测量矩阵;
(5)使所述的原始测量矩阵与反投影测量矩阵进行比较,得到运动图像序列的投影误差;
(6)对所述的投影误差进行DCT变换得到投影误差的频谱,根据预设的误差水平从频谱中选取p个频率点,具体过程为:首先,使频谱中各频率点按幅值从大到小排序;然后,满足以下算式选取排列最前的p个频率点:
min p { Σ y = 1 p H y Σ x = 1 m H x ≥ σ }
其中:Hx和Hy分别为排序后频谱中第x个频率点和第y个频率点的幅值,σ为误差水平,x为自然数且1≤x≤m,y为自然数且1≤y≤p;
进而根据p个频率点从轨迹基矩阵中提取对应的p个轨迹基;p为自然数且1≤p≤rank(W)/3。
2.根据权利要求1所述的轨迹基选择方法,其特征在于:所述的原始测量矩阵为2m×n维的矩阵,其中第i行第j列以及第i+1行第j列的两个元素值分别对应为运动图像序列第i帧图像中第j个特征点的横纵坐标,i为奇数且1≤i<2m,j为自然数且1≤j≤n,n为运动图像序列每帧图像中的特征点总个数。
3.根据权利要求1所述的轨迹基选择方法,其特征在于:所述的轨迹基矩阵中轨迹基的个数以及投影误差频谱中频率点的个数与运动图像序列的图像帧数相同。
CN201310581017.6A 2013-11-19 2013-11-19 一种面向非刚体三维重建的轨迹基选择方法 Active CN103606189B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310581017.6A CN103606189B (zh) 2013-11-19 2013-11-19 一种面向非刚体三维重建的轨迹基选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310581017.6A CN103606189B (zh) 2013-11-19 2013-11-19 一种面向非刚体三维重建的轨迹基选择方法

Publications (2)

Publication Number Publication Date
CN103606189A CN103606189A (zh) 2014-02-26
CN103606189B true CN103606189B (zh) 2016-09-07

Family

ID=50124409

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310581017.6A Active CN103606189B (zh) 2013-11-19 2013-11-19 一种面向非刚体三维重建的轨迹基选择方法

Country Status (1)

Country Link
CN (1) CN103606189B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106097328B (zh) * 2016-06-07 2019-05-14 陕西师范大学 一种基于非刚体轨迹基的图像缺失值恢复方法
CN107862737B (zh) * 2017-10-25 2019-08-13 电子科技大学 一种稳健的非刚性运动重建方法
CN110675486B (zh) * 2019-08-28 2023-03-07 电子科技大学 一种非刚性人体运动的频域重建方法
CN115115593B (zh) * 2022-06-28 2024-09-10 先临三维科技股份有限公司 一种扫描处理方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101661623A (zh) * 2009-10-21 2010-03-03 上海交通大学 基于线性规划的变形体三维跟踪方法
CN102254154A (zh) * 2011-07-05 2011-11-23 南京大学 一种基于三维模型重建的人脸身份认证方法
CN103198523A (zh) * 2013-04-26 2013-07-10 清华大学 一种基于多深度图的非刚体三维重建方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2011265430B2 (en) * 2011-12-21 2015-03-19 Canon Kabushiki Kaisha 3D reconstruction of partially unobserved trajectory
US9041718B2 (en) * 2012-03-20 2015-05-26 Disney Enterprises, Inc. System and method for generating bilinear spatiotemporal basis models

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101661623A (zh) * 2009-10-21 2010-03-03 上海交通大学 基于线性规划的变形体三维跟踪方法
CN102254154A (zh) * 2011-07-05 2011-11-23 南京大学 一种基于三维模型重建的人脸身份认证方法
CN103198523A (zh) * 2013-04-26 2013-07-10 清华大学 一种基于多深度图的非刚体三维重建方法及系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
3D Motion Reconstruction for Real-World Camera Motion;Yingying Zhu 等;《CVPR 2011》;20110625;1-8 *
Bilinear Spatiotemporal Basis Models;IJAZ AKHTER 等;《ACM Transactions on Graphics》;20120430;第31卷(第2期);17:1-17:12 *
General Trajectory Prior for Non-Rigid Reconstruction;Jack Valmadre 等;《CVPR 2012》;20120621;1394-1401 *
Trajectory Space: A Dual Representation for Nonrigid Structure from Motion;Ijaz Akhter 等;《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》;20110731;第33卷(第7期);1442-1456 *
基于图像序列的非刚体三维运动恢复;石信增 等;《计算机应用与软件》;20110915;第28卷(第9期);38-40 *

Also Published As

Publication number Publication date
CN103606189A (zh) 2014-02-26

Similar Documents

Publication Publication Date Title
CN110659727B (zh) 一种基于草图的图像生成方法
CN108038420B (zh) 一种基于深度视频的人体行为识别方法
CN103400402B (zh) 基于低秩结构稀疏的压缩感知mri图像重建方法
CN106462771A (zh) 一种3d图像的显著性检测方法
CN104221054B (zh) 人物属性推定系统及学习用数据生成装置
CN101877143B (zh) 一种二维图像组的三维场景重建方法
CN105981050B (zh) 用于从人脸图像的数据提取人脸特征的方法和系统
Tang et al. N-dimensional tensor voting and application to epipolar geometry estimation
CN103606189B (zh) 一种面向非刚体三维重建的轨迹基选择方法
CN110060286B (zh) 一种单目深度估计方法
CN104077742B (zh) 基于Gabor特征的人脸素描合成方法及系统
CN103235947B (zh) 一种手写体数字识别方法及装置
CN114419412A (zh) 一种用于点云配准的多模态特征融合方法与系统
CN108280858A (zh) 多视图重建中的一种线性全局相机运动参数估计方法
Cui et al. Deep neural network based sparse measurement matrix for image compressed sensing
CN107316005A (zh) 基于稠密轨迹核协方差描述子的行为识别方法
CN111881716A (zh) 一种基于多视角生成对抗网络的行人重识别方法
CN101515328A (zh) 一种面向鉴别的具有统计不相关性的局部保持投影方法
CN102708589B (zh) 一种基于特征聚类的三维目标多视点视图建模方法
CN109146792A (zh) 基于深度学习的芯片图像超分辨率重建方法
CN104142978B (zh) 一种基于多特征和稀疏表示的图像检索系统及方法
CN109978928A (zh) 一种基于加权投票的双目视觉立体匹配方法及其系统
Sommer et al. Kernel bundle EPDiff: evolution equations for Multi-Scale diffeomorphic image registration
Chen et al. Mmml: Multi-manifold metric learning for few-shot remote sensing image scene classification
CN100583146C (zh) 一种基于加权采样的图像特征点匹配方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190626

Address after: 510000 Tian'an Science and Technology Industrial Building, 555 Panyu Avenue North, Donghuan Street, Panyu District, Guangzhou City, Guangdong Province

Patentee after: Guangzhou Intellectual Property Service Co., Ltd.

Address before: 310018 No. 2 street, Xiasha Higher Education Park, Hangzhou, Zhejiang, 5

Patentee before: Zhejiang Sci-Tech University

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20201201

Address after: No. 144, Changjiang Road, Zongyang Town, Zongyang County, Tongling City, Anhui Province

Patentee after: Zongyang Liyang small and medium sized Enterprise Service Center

Address before: 510000 Tian'an Science and Technology Industrial Building, 555 Panyu Avenue North, Donghuan Street, Panyu District, Guangzhou City, Guangdong Province

Patentee before: Guangzhou Zhirongjie Intellectual Property Service Co.,Ltd.