CN110675486B - 一种非刚性人体运动的频域重建方法 - Google Patents

一种非刚性人体运动的频域重建方法 Download PDF

Info

Publication number
CN110675486B
CN110675486B CN201910802216.2A CN201910802216A CN110675486B CN 110675486 B CN110675486 B CN 110675486B CN 201910802216 A CN201910802216 A CN 201910802216A CN 110675486 B CN110675486 B CN 110675486B
Authority
CN
China
Prior art keywords
dimensional
motion
human body
axis
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910802216.2A
Other languages
English (en)
Other versions
CN110675486A (zh
Inventor
郑亚莉
田康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201910802216.2A priority Critical patent/CN110675486B/zh
Publication of CN110675486A publication Critical patent/CN110675486A/zh
Application granted granted Critical
Publication of CN110675486B publication Critical patent/CN110675486B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • G06F17/12Simultaneous equations, e.g. systems of linear equations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/08Indexing scheme for image data processing or generation, in general involving all processing steps from image acquisition to 3D model generation

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Geometry (AREA)
  • Operations Research (AREA)
  • Computer Graphics (AREA)
  • Image Analysis (AREA)

Abstract

该发明公开了一种非刚性人体运动的频域重建方法,该方法属于计算机视觉领域,特别是根据图像数据的三维重建。本发明从频域的角度出发,分析和重建低频的非刚性人体关节点运动和高频的相机运动,完全区别于之前的轨迹基与形状基非刚性人体运动重建方式,是一种全新的方法。从二维投影的傅里叶变换中,不仅可以估计相机绕Z轴的高频运动,以及相机绕Z轴运动并带有俯仰角的高频运动,而且可以估计出任意的低频人体动作运动,适用于一些特定三维人体运动重建场景。

Description

一种非刚性人体运动的频域重建方法
技术领域
本发明属于计算机视觉领域,特别是根据图像数据的三维重建。
背景技术
三维重建是指从已知多帧的二维投影图像,恢复出三维空间结构。非刚性的三维重建则是针对人体运动一类的非刚性目标进行重建。但是对于后者来讲,每时每刻只能捕捉三维空间结构的一个二维投影,因此非刚性三维重建成为一个病态问题,无法直接求解。现有的人体非刚性三维重建技术要么利用形状基来对人体形状进行表示,要么利用轨迹基来对人体运动在三维空间中进行表示,其目的都是通过降低模型的参数个数,利用优化的方法来找到一个可行解,适用范围有限,重建的精度也随非刚性目标的非刚性程度高低而变化。已授权专利201610154349X——一种面向图像序列的铰接关节点空间运动重构方法是通过获得相机的自校正参数以及相机CCD物理尺寸后,求解初等函数,获得铰接关节点的潜在坐标;进一步通过轨迹平滑约束,逐帧建立铰接关节点的空间运动轨迹。申请专利201711006415.X——稳定的非刚性重建方法主要考虑解决非刚性重建中预先需要设定或者调试正交离散余弦基个数的问题,提出了一种自适应的稳定重建方法。前述两种方法都是通过最优化方法在时域中来实现重建,而本发明则是采取完全不同的思路,转换到频域中来实现非刚性重建。
发明内容
本发明的目的在于提出一种新的方法重建非刚性人体运动,提供一种基于频域分析的非刚性重建方法。提出的方法将相机运动和人体运动首先经过傅里叶变换,转换到频域;通过分析相机和人体非刚性运动的频域特征,建立求解频域系数的非线性方程,获得频域系数,在进行反变换重建非刚性三维人体运动。
本发明技术方案为:一种非刚性人体运动的频域重建方法,以下内容基于Z轴朝上,X轴朝前,Y轴朝右的坐标系;该方法包括:
步骤1:设人体共有N个关节点,其中各关节点的二维投影表示为:
{xi(t)=[xi(t),yi(t)],i=1,2,...,N,t=1,2,...,F}
其中xi(t)表示第i个关节点的二维投影,xi(t),yi(t)表示二维投影的x序列和y序列,t为观测时刻,即第t帧数据,共F帧数据;对第i个点二维投影的x序列{xi(1),xi(2),...,xi(F)}做离散傅里叶变换,得到离散傅里叶变换系数的实部{Ax1,Ax2,...,AxF}和虚部{Bx1,Bx2,...,BxF};
步骤2:设定人体运动频率分量个数Np,相机运动频率分量个数Nc,假定相机运动的拟合频率分量范围为[NCl,NCh],人体运动的拟合频率分量范围为[1,Np],且Np≥NCh,构建如下方程组,其中
Figure BDA0002182649620000021
为未知量,j1=0,1,...,Np,j2=1,2,...,Nc
Figure BDA0002182649620000022
Figure BDA0002182649620000023
括号(·)的下标表示括号中矩阵的维度,其中
Figure BDA0002182649620000024
分别为待重建三维坐标X轴和Y轴的傅里叶系数,
Figure BDA0002182649620000025
为待重建相机运动的傅里叶系数,B*是辅助因子;
步骤3:求解方程组未知量,具体步骤如下:
步骤3.1:首先利用求解器工具求解(1-1),如果不考虑求解B*,则(1-1)中包含Np+NCh个方程,且有NCh-NCl+1个AR和Np+1个AX未知量,此为非线性方程组,故产生解集
Figure BDA0002182649620000026
k1=K1,对应于
Figure BDA0002182649620000027
即(1-1)的K1个根;
步骤3.2:利用求解器工具求解(1-2),同样不考虑求解B*,则(1-2)中包含Np+NCh个方程,有NCh-NCl+1个AR和Np个AY未知,此为非线性方程组,故产生解集:
Figure BDA0002182649620000031
k2=K2,对应于
Figure BDA0002182649620000032
即(1-2)的K2个根;
步骤3.3:查找方程组(1-1)解集
Figure BDA0002182649620000033
和方程组(1-2)解集
Figure BDA0002182649620000034
中欧式距离最近的两个解,假定分别为
Figure BDA0002182649620000035
Figure BDA0002182649620000036
再各自带入(1-1)和(1-2)求解
Figure BDA0002182649620000037
Figure BDA0002182649620000038
再通过对AX和AY后添0补齐至F维向量,即:
Figure BDA0002182649620000039
Figure BDA00021826496200000310
对AX进行反离散余弦变换或者反傅里叶变换,获得X(t),t=1,2,...,F,对AY进行反离散余弦变换或者反傅里叶变换,获得Y(t),t=1,2,...,F;
步骤4:令Z(t)=y(t),则根据第i个点的二维投影求解得到的第i个点的三维人体运动轨迹为Xi=[Xi(t),Yi(t),Zi(t)];其中y(t)为步骤1中的二维投影;
步骤5:i=1,2,...,N循环,依次求解人体N个关节点的三维运动,即恢复出对应于F帧的三维人体运动。
本发明从频域的角度出发,分析和重建低频的非刚性人体关节点运动和高频的相机运动,完全区别于之前的轨迹基与形状基非刚性人体运动重建方式,是一种全新的方法。从二维投影的傅里叶变换中,不仅可以估计相机绕Z轴的高频运动,以及相机绕Z轴运动并带有俯仰角的高频运动,而且可以估计出任意的低频人体动作运动,适用于一些特定三维人体运动重建场景。
附图说明
图1为本发明的频域重建方法流程图。
图2是相机围绕Z轴匀速运动在CMU三维人体运动数据集Pickup姿态重建结果图,人体上一共有41个点,其中Np=4,Nc=1,NCl=NCh=5,F=357;10个重建结果是从357帧中均匀采样显示;适应于相机匀速旋转,即旋转角随时间匀速变化的情况。
图3是相机围绕Z轴非匀速运动在CMU三维人体运动数据集Drink姿态重建结果图,人体上一共有41个点,其中Np=4,Nc=3,NCl=1,NCh=3,F=1102。10个重建结果是从1102帧中均匀采样显示;适应于相机绕Z轴随机运动的情况。
图4是相机围绕Z轴匀速运动且有俯仰角在CMU三维人体运动数据集Stretch姿态重建结果图,其中Np=4,Nc=1,NCl=NCh=5,F=370;适应于相机匀速旋转且有俯仰角度的情况,其中俯仰角设为30度。
具体实施方式
在各实施例中,首先假设相机为正交投影相机模型,绕Z轴旋转匀速运动或非匀速运动,生成2x3的相机投影矩阵。如果是匀速运动,则角速度为5°;再将CMU各人体运动的三维数据集进行投影,生成二维投影序列,作为实施例的输入,逆向求解相机运动和三维人体运动。这样可以利用假设的相机运动和原三维人体数据作为真值数据进行比较,以衡量方法计算的误差。
实施例一:
以下列出的是由第一个生成的相机运动模型对CMU三维人体运动Pickup动作投影获得的二维坐标,即第一帧(F=1)41个关节点的二维投影x坐标和y坐标实例:
Figure BDA0002182649620000042
Figure BDA0002182649620000043
其中相机围绕Z轴匀速运动,投影矩阵R由下式生成
Figure BDA0002182649620000041
实施例一中,采用F=357连续帧的关节点二维投影做为输入,逆向所对应的41个关节点的三维坐标X,做为输出。表1中展示的是在CMU多个数据集上相机绕Z轴匀速运动,提出的人体重建方法与传统的轨迹基重建方法相比较的结果。
表1相机围绕Z轴匀速运动在CMU各三维人体运动数据集上的人体重建误差与传统的轨迹基重建方法相比较的结果
Datsets 轨道基ΔE(重建误差) 本发明频域法ΔE(重建误差)
DRINK 2.50E-02 2.75E-02
PICKUP 2.37E-01 6.38E-02
YOGA 1.62E-01 9.22E-02
STRETCH 1.09E-01 4.96E-02
DANCE 2.96E-01 2.01E-01
实施例二:
以下列出的是由第一个生成的相机运动模型对CMU三维人体运动Drink动作投影获得的二维坐标,即第一帧(F=1)41个关节点的二维投影x坐标和y坐标实例:
Figure BDA0002182649620000052
Figure BDA0002182649620000053
其中所采用对应的非匀速运动的相机投影矩阵R,由下式生成
Figure BDA0002182649620000051
。实施例二中,采用F=370连续帧的关节点二维投影做为输入,逆向所对应的41个关节点的三维坐标X,做为输出。表2中展示的是在CMU多个数据集上相机绕Z轴非匀速运动,提出的人体重建方法与传统的轨迹基重建方法相比较的结果。
表2相机绕Z轴非匀速运动在CMU各三维人体运动数据集上的人体重建误差与传统的轨迹基重建方法相比较的结果
Datset 轨道基ΔE(重建误差) 本发明频域法ΔE(重建误差)
DRINK 7.11E-01 2.43E-01
PICKUP 5.40E-01 6.84E-01
YOGA 1.17E-00 4.28E-01
STRETCH 5.14E-01 4.33E-01
实施例三:
以下列出的是由第一个生成的相机运动模型对CMU三维人体运动Stretch动作投影获得的二维坐标,即第一帧(F=1)41个关节点的二维投影x坐标和y坐标实例:
结果对应图3表2的内容;
Figure BDA0002182649620000061
Figure BDA0002182649620000062
其中相机围绕Z轴匀速运动且有θY=30°度的俯仰角,投影矩阵R由下式生成
Figure BDA0002182649620000071
实施例三中,采用F=3702连续帧的关节点二维投影做为输入,逆向所对应的41个关节点的三维坐标X,做为输出。表3中展示的是在CMU多个数据集上相机绕Z轴匀速运动且有俯仰角,提出的人体重建方法与传统的轨迹基重建方法相比较的结果。
表3相机围绕Z轴匀速运动且有俯仰角在CMU三维人体运动数据集上的人体重建误差与传统的轨迹基重建方法相比较的结果
Datsets 轨道基ΔE(重建误差) 本发明频域法ΔE(重建误差)
DRINK 2.50E-02 5.34E-02
PICKUP 2.17E-01 1.03E-01
YOGA 1.79E-01 1.02E-01
STRETCH 1.34E-01 7.84E-02
DANCE 2.56E-01 1.65E-01

Claims (1)

1.一种非刚性人体运动的频域重建方法,以下内容基于Z轴朝上,X轴朝前,Y轴朝右的坐标系;该方法包括:
步骤1:设人体共有N个关节点,其中各关节点的二维投影表示为:
{xi(t)=[xi(t),yi(t)],i=1,2,...,N,t=1,2,...,F}
其中xi(t)表示第i个关节点的二维投影,xi(t),yi(t)表示二维投影的x序列和y序列,t为观测时刻,即第t帧数据,共F帧数据;对第i个点二维投影的x序列{xi(1),xi(2),...,xi(F)}做离散傅里叶变换,得到离散傅里叶变换系数的实部{Ax1,Ax2,...,AxF}和虚部{Bx1,Bx2,...,BxF};
步骤2:设定人体运动频率分量个数Np,相机运动频率分量个数Nc,假定相机运动的拟合频率分量范围为[NCl,NCh],人体运动的拟合频率分量范围为[1,Np],且Np≥NCh,构建如下方程组,其中
Figure FDA0002182649610000011
为未知量,j1=0,1,...,Np,j2=1,2,...,Nc
Figure FDA0002182649610000012
Figure FDA0002182649610000013
括号(·)的下标表示括号中矩阵的维度,其中
Figure FDA0002182649610000021
分别为待重建三维坐标X轴和Y轴的傅里叶系数,
Figure FDA0002182649610000022
为待重建相机运动的傅里叶系数,B*是辅助因子;
步骤3:求解方程组未知量,具体步骤如下:
步骤3.1:首先利用求解器工具求解(1-1),如果不考虑求解B*,则(1-1)中包含Np+NCh个方程,且有NCh-NCl+1个AR和Np+1个AX未知量,此为非线性方程组,故产生解集
Figure FDA0002182649610000023
对应于
Figure FDA0002182649610000024
即(1-1)的K1个根;
步骤3.2:利用求解器工具求解(1-2),同样不考虑求解B*,则(1-2)中包含Np+NCh个方程,有NCh-NCl+1个AR和Np个AY未知,此为非线性方程组,故产生解集:
Figure FDA0002182649610000025
对应于
Figure FDA0002182649610000026
即(1-2)的K2个根;
步骤3.3:查找方程组(1-1)解集
Figure FDA0002182649610000027
和方程组(1-2)解集
Figure FDA0002182649610000028
中欧式距离最近的两个解,假定分别为
Figure FDA0002182649610000029
Figure FDA00021826496100000210
再各自带入(1-1)和(1-2)求解
Figure FDA00021826496100000211
Figure FDA00021826496100000212
再通过对AX和AY后添0补齐至F维向量,即:
Figure FDA00021826496100000213
Figure FDA00021826496100000214
对AX进行反离散余弦变换或者反傅里叶变换,获得X(t),t=1,2,...,F,对AY进行反离散余弦变换或者反傅里叶变换,获得Y(t),t=1,2,...,F;
步骤4:令Z(t)=y(t),则根据第i个点的二维投影求解得到的第i个点的三维人体运动轨迹为Xi=[Xi(t),Yi(t),Zi(t)];其中y(t)为步骤1中的二维投影;
步骤5:i=1,2,...,N循环,依次求解人体N个关节点的三维运动,即恢复出对应于F帧的三维人体运动。
CN201910802216.2A 2019-08-28 2019-08-28 一种非刚性人体运动的频域重建方法 Active CN110675486B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910802216.2A CN110675486B (zh) 2019-08-28 2019-08-28 一种非刚性人体运动的频域重建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910802216.2A CN110675486B (zh) 2019-08-28 2019-08-28 一种非刚性人体运动的频域重建方法

Publications (2)

Publication Number Publication Date
CN110675486A CN110675486A (zh) 2020-01-10
CN110675486B true CN110675486B (zh) 2023-03-07

Family

ID=69075656

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910802216.2A Active CN110675486B (zh) 2019-08-28 2019-08-28 一种非刚性人体运动的频域重建方法

Country Status (1)

Country Link
CN (1) CN110675486B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103606189A (zh) * 2013-11-19 2014-02-26 浙江理工大学 一种面向非刚体三维重建的轨迹基选择方法
AU2016225879B2 (en) * 2011-12-21 2016-09-29 Deka Products Limited Partnership Apparatus for controlling fluid flow
CN107403449A (zh) * 2017-08-09 2017-11-28 深度创新科技(深圳)有限公司 一种基于光度立体视觉的视觉系统及其三维重建方法
CN107424162A (zh) * 2017-05-05 2017-12-01 上海联影医疗科技有限公司 一种图像分割方法及系统
CN107862737A (zh) * 2017-10-25 2018-03-30 电子科技大学 一种稳健的非刚性运动重建方法
CN207365904U (zh) * 2017-06-01 2018-05-15 深度创新科技(深圳)有限公司 三维重建装置及设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2016225879B2 (en) * 2011-12-21 2016-09-29 Deka Products Limited Partnership Apparatus for controlling fluid flow
CN103606189A (zh) * 2013-11-19 2014-02-26 浙江理工大学 一种面向非刚体三维重建的轨迹基选择方法
CN107424162A (zh) * 2017-05-05 2017-12-01 上海联影医疗科技有限公司 一种图像分割方法及系统
CN207365904U (zh) * 2017-06-01 2018-05-15 深度创新科技(深圳)有限公司 三维重建装置及设备
CN107403449A (zh) * 2017-08-09 2017-11-28 深度创新科技(深圳)有限公司 一种基于光度立体视觉的视觉系统及其三维重建方法
CN107862737A (zh) * 2017-10-25 2018-03-30 电子科技大学 一种稳健的非刚性运动重建方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Hippocampal Shape Modeling Based on a Progressive Template Surface Deformation and its Verification;Jaeil Kim等;《IEEE Transactions on Medical Imaging》;第1242 - 1261页 *
基于惯性数据的人体姿态实时三维重构关键技术研究;韩梅;《cnki优秀硕士学位论文全文库 信息科技辑》(第06期);第I138-2017页 *

Also Published As

Publication number Publication date
CN110675486A (zh) 2020-01-10

Similar Documents

Publication Publication Date Title
CN111402290B (zh) 一种基于骨骼关键点的动作还原方法以及装置
Morris et al. Singularity analysis for articulated object tracking
US6240198B1 (en) Method for figure tracking using 2-D registration
US6243106B1 (en) Method for figure tracking using 2-D registration and 3-D reconstruction
CN106446815A (zh) 一种同时定位与地图构建方法
Chhatkuli et al. Inextensible non-rigid structure-from-motion by second-order cone programming
Srinivasan Extracting structure from optical flow using the fast error search technique
Fan et al. Convex hull aided registration method (CHARM)
Zampokas et al. Real-time 3D reconstruction in minimally invasive surgery with quasi-dense matching
CN103955928B (zh) 一种确定曲面镜头畸变参数的方法、装置以及电子设备
CN110675486B (zh) 一种非刚性人体运动的频域重建方法
Miao et al. A novel marker for robust and accurate phase-based 2D motion estimation from noisy image data
CN106296741A (zh) 纳米视觉图像中细胞高速运动特征标注方法
Park et al. Procrustean regression: A flexible alignment-based framework for nonrigid structure estimation
Figueroa et al. A combined approach toward consistent reconstructions of indoor spaces based on 6D RGB-D odometry and KinectFusion
Wang et al. Structure and motion recovery based on spatial-and-temporal-weighted factorization
Yang et al. Structure from Motion on XSlit Cameras
Zheng et al. SCAPE-based human performance reconstruction
Qiu et al. Stabilization algorithm based on improved motion model for jittery video in minimally invasive surgery
Rehg et al. Singularities in articulated object tracking with 2-d and 3-d models
CN109741375B (zh) 一种裸眼3d模型光场生成方法及其装置
CN113103239B (zh) 一种机器人姿态轨迹生成方法、装置及存储介质
CN112802120B (zh) 基于非均匀分割累加表和正交消隐点的相机外参标定方法
Chidananda et al. Pixtrack: Precise 6dof object pose tracking using nerf templates and feature-metric alignment
JP5355377B2 (ja) 画像パターン照合装置および方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant