CN103578120B - 保持时序平稳与低秩结构特性的三维人体运动数据补全方法 - Google Patents

保持时序平稳与低秩结构特性的三维人体运动数据补全方法 Download PDF

Info

Publication number
CN103578120B
CN103578120B CN201310558212.7A CN201310558212A CN103578120B CN 103578120 B CN103578120 B CN 103578120B CN 201310558212 A CN201310558212 A CN 201310558212A CN 103578120 B CN103578120 B CN 103578120B
Authority
CN
China
Prior art keywords
completion
motion data
matrix
human body
human motion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310558212.7A
Other languages
English (en)
Other versions
CN103578120A (zh
Inventor
肖俊
冯银付
庄越挺
计明明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201310558212.7A priority Critical patent/CN103578120B/zh
Publication of CN103578120A publication Critical patent/CN103578120A/zh
Application granted granted Critical
Publication of CN103578120B publication Critical patent/CN103578120B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Processing Or Creating Images (AREA)

Abstract

本发明公开一种保持时序平稳与低秩结构特性的三维人体运动数据补全方法。该方法基于三维人体运动具有保持时序平稳的特性和三维人体运动数据具有的低秩结构特性,首先,将一段待补全的三维人体运动序列表示成三维运动数据矩阵形式;接着,根据该运动数据矩阵设置相应的二值掩码矩阵和平滑约束矩阵;然后,采用增广拉格朗日数乘方法优化求解一个保存时序平稳与低秩结构特性的鲁棒低秩矩阵填充数学模型;最后,依据优化结果对原三维人体运动数据进行补全,从而实现对不完整的三维人体运动数据的补全。该方法可以再不需要数据库支持下,快速地实现对单段三维人体运动序列的快速补全,与此同时,对噪声具有一定的抵抗能力。

Description

保持时序平稳与低秩结构特性的三维人体运动数据补全方法
技术领域
本发明涉及三维人体运动数据补全、低秩矩阵填充,尤其涉及一种保持时序平稳与低秩结构特性的三维人体运动数据补全方法。
背景技术
三维人体运动数据获取与生成技术能够直接应用于虚拟现实、三维角色动画制作、人机交互、人体运动仿真、体育训练分析、医疗运动康复等领域,能够为上述领域的研究与应用提供精确、真实的三维人体运动数据支持,具有重要的研究与应用价值。
然而,即使是目前商用的三维人体运动捕获设备,由于受到表演者人体肢体自遮挡、服饰的遮挡等原因,常常会出现人体部分标记点缺失的现象。为了解决这个问题,近年来各种各样的三维人体运动数据补全方法被提出。
最常用的插值法是利用线性或样条插值函数,对三维人体运动数据曲线进行插值。这种方法的特点是简单快速,适合短时间的运动缺失,对超过0.5秒以上的运动缺失无法进行准确的补全。
以卡尔曼滤波为代表的线性动态系统法,将人体姿态变迁过程用线性或非线性的动态系统进行建模,利用构建的模型对缺失的数据进行预测。
近年来,随着三维运动捕获设备的普及,各种三维数据越来越容易获得,采用数据库驱动的方法变得流行。这类方法是通过对数据库中现有的三维人体姿态进行检索和内在时刻关系挖掘,来对缺失的数据进行预测或过滤。例如,ChaiJ.X.和HodginsJ.K.提出在数据库支持的基础上,利用少量人体标记点来估计完整的人体姿态。LiuH.等人提出基于样例的三维人体运动数据去噪,并将其应用到三维人体运动数据的补全。
虽然目前采用数据库驱动的方法在三维人体运动数据补全上,性能是非常好的,但是由于这类方法无法生成数据库中没有出现过的运动类型,缺乏数据自适应学习能力,因此还是存在一定的局限性。为了克服这个问题,Lai等人将传统的三维人体运动数据处理问题转换为一种低秩矩阵填充问题,实现了在不需要数据库支持的情况下,进行三维人体运动数据的补全和去噪功能。在Lai等人的工作中,只考虑到了三维人体运动数据的低秩结构特性,同时他们的模型采用的是SVT方法进行优化求解,速度上存在一定的不足。
在已有的低秩矩阵优化问题求解方法中,除了Lai等人所使用的SVT方法,目前还有包括AcceleratedProximalGradient(APG)和AugmentedLagrangeMultiplier(ALM)等方法。在林等人的论文《TheaugmentedLagrangemultipliermethodforexactrecoveryofcorruptedlow‐rankmatrices》中,对不同的优化求解方法进行了详细的对比分析,发现ALM方法无论是在速度还是性能上都较其他方法更好。
与前面所提的方法不同,本方法不仅将三维人体运动数据所具有的低秩结构特性考虑进来,同时还将三维人体运动所具有的时序平滑性约束考虑进来,通过同时引入低秩约束与时序平稳性约束,将传统的三维人体运动数据补全问题转为优化求解一个保存时序平稳与低秩结构特性的鲁棒低秩矩阵填充数学模型。与Lai的方法不同,本方法采用增广拉格朗日数乘方法(ALM)进行优化求解,运算速度比Lai的方法要更加快,同时运算结果更加稳定鲁棒。
发明内容
本发明的目的是克服现有技术的不足,提供一种保持时序平稳与低秩结构特性的三维人体运动数据补全方法。
一种保持时序平稳与低秩结构特性的三维人体运动数据补全方法包括如下步骤:
1)从公共的三维人体运动数据集CMU人体运动数据集中选择出4段人体运动数据,包括走,跳,舞蹈和太极,或者通过动作捕获系统进行捕获人体运动数据,包括走,跑和跳,得到待补全的三维人体运动数据;
2)将待补全的三维人体运动序列表示成三维运动数据矩阵X:X=[f1,f2,...,fn]∈R3k×n,其中,fi表示第i个人体姿态所有关节点三维坐标构成的姿态特征向量fi=[xi1,yi1,zi1,...,xik,yik,zik]T,xij是第i个人体姿态中第j个关键点的x坐标值,yij是第i个人体姿态中第j个关键点的y坐标值,zij是第i个人体姿态中第j个关键点的z坐标值,k是一个人体姿态包含的关节点数,n是整段待补全人体运动序列中人体姿态的个数;
3)根据待补全的三维运动数据矩阵X中数据项是否已经观测到,设置二值掩码矩阵Ω,规则如下:
4)根据待补全的三维运动数据矩阵X的矩阵规模,生成具有相同行数的平滑约束矩阵O:
5)采用增量拉格朗日乘数法,优化求解如下一个保存时序平稳与低秩结构特性的目标函数:
其中,||·||*是矩阵的核范数,||·||1是矩阵的l1范数,是平方的Frobenius范数,Y是期望补全后的纯净的三维运动数据矩阵,E是原三维运动数据矩阵中包含的噪声,α和β是正则化系数参数;
6)根据目标函数3优化求解得到的Y,若只对X中缺失的数据项部分进行补全,则补全规则如下:
若不仅需要对X中缺失的数据项部分进行补全,同时过滤掉在X中所包含的可能噪声数据,则补全规则如下:
X ~ = Y - - - 5
其中,是最终返回的补全后的完整三维人体运动数据矩阵,从而实现对不完整三维人体运动数据的补全。
本发明与现有技术相比具有的有益效果是,该方法可以再不需要数据库支持下,快速地实现对单段三维人体运动序列的快速补全,与此同时,对噪声具有一定的抵抗能力。
附图说明
图1是本发明在随机缺失情况下,不同方法在走人体运动数据补全性能对比;
图2是本发明在随机缺失情况下,不同方法在跳人体运动数据补全性能对比;
图3是本发明在随机缺失情况下,不同方法在舞蹈人体运动数据补全性能对比;
图4是本发明在随机缺失情况下,不同方法在太极人体运动数据补全性能对比;
图5是本发明在规则缺失情况下,不同方法在走人体运动数据补全性能对比;
图6是本发明在规则缺失情况下,不同方法在跳人体运动数据补全性能对比;
图7是本发明在规则缺失情况下,不同方法在舞蹈人体运动数据补全性能对比;
图8是本发明在规则缺失情况下,不同方法在太极人体运动数据补全性能对比;
图9不同方法在采集到的走序列上的关键帧补全结果比较;
图10不同方法在采集到的跑序列上的关键帧补全结果比较;
图11不同方法在采集到的跳序列上的关键帧补全结果比较。
具体实施方式
一种保持时序平稳与低秩结构特性的三维人体运动数据补全方法包括如下步骤:
1)从公共的三维人体运动数据集CMU人体运动数据集中选择出4段人体运动数据,包括走,跳,舞蹈和太极,或者通过动作捕获系统进行捕获人体运动数据,包括走,跑和跳,得到待补全的三维人体运动数据;
2)将待补全的三维人体运动序列表示成三维运动数据矩阵X:X=[f1,f2,...,fn]∈R3k×n,其中,fi表示第i个人体姿态所有关节点三维坐标构成的姿态特征向量fi=[xi1,yi1,zi1,...,xik,yik,zik]T,xij是第i个人体姿态中第j个关键点的x坐标值,yij是第i个人体姿态中第j个关键点的y坐标值,zij是第i个人体姿态中第j个关键点的z坐标值,k是一个人体姿态包含的关节点数,n是整段待补全人体运动序列中人体姿态的个数;
3)根据待补全的三维运动数据矩阵X中数据项是否已经观测到,设置二值掩码矩阵Ω,规则如下:
4)根据待补全的三维运动数据矩阵X的矩阵规模,生成具有相同行数的平滑约束矩阵O:
5)采用增量拉格朗日乘数法,优化求解如下一个保存时序平稳与低秩结构特性的目标函数:
其中,||·||*是矩阵的核范数,||·||1是矩阵的l1范数,是平方的Frobenius范数,Y是期望补全后的纯净的三维运动数据矩阵,E是原三维运动数据矩阵中包含的噪声,α和β是正则化系数参数;
6)根据目标函数3优化求解得到的Y,若只对X中缺失的数据项部分进行补全,则补全规则如下:
若不仅需要对X中缺失的数据项部分进行补全,同时过滤掉在X中所包含的可能噪声数据,则补全规则如下:
X ~ = Y - - - 5
其中,是最终返回的补全后的完整三维人体运动数据矩阵,从而实现对不完整三维人体运动数据的补全。
实施例1
从公共的三维人体运动数据集CMU人体运动数据集中选择出4段人体运动,包括走,跳,舞蹈和太极。由于CMU数据集中的数据绝大部分是比较纯净和完整的运动序列,因此,我们模拟现实噪声情况,生成两种不同的缺失数据:
a)随机缺失数据,采用随机丢失40%数据项的方式生成;
b)规则缺失数据,规则化地丢失30%的数据,每次丢失持续60帧,包含10个不同的标记点。
将本专利所提出的方法与现有的其他三维人体运动数据补全方法:线性插值方法(Linear),样条插值方法(Spline),线性动态系统方法(Dynammo)和Lai等人所提的低秩方法(SVT),进行对比。采用根平均方差作为度量,比较不同方法的补全效果。
对于本发明方法中参数α=1,β=100,不同方法在各个运动类型上的对比结果分别显示在图1~8中。对比结果中使用均方根误差(RMSE)作为评判补全结果的方法,当均方根误差值较小时,表明补全结果更加趋于真实数据,性能更好。本发明方法不仅拥有较小的均方根误差值,同时对于所有帧数的均方根误差值的方差也比较小,这表明了本发明方法处理的结果非常稳定。
实施例2
采用魔神公司的MotionAnalysisEagle‐4数字实时捕获系统,采集包含三段包含走(walk),跑(run)和跳(jump)的人体运动序列,总计3178帧。参数设置同上一实例,不同方法的对比结果,以关键帧的形式,分别显示在图9~11。结果表明,与待补全的三维运动数据相比时,本发明方法的输出结果能够正确补全数据,并且即使在处理长时间的缺失点时,补全结果依然正确,不会出现方法失效的情况。

Claims (1)

1.一种保持时序平稳与低秩结构特性的三维人体运动数据补全方法,其特征在于包括如下步骤:
1)从公共的三维人体运动数据集CMU人体运动数据集中选择出4段人体运动数据,包括走,跳,舞蹈和太极,或者通过动作捕获系统进行捕获人体运动数据,包括走,跑和跳,得到待补全的三维人体运动数据;
2)将待补全的三维人体运动序列表示成三维运动数据矩阵X:X=[f1,f2,...,fn]∈R3k×n,其中,fi表示第i个人体姿态所有关节点三维坐标构成的姿态特征向量fi=[xi1,yi1,zi1,...,xik,yik,zik]T,xij是第i个人体姿态中第j个关键点的x坐标值,yij是第i个人体姿态中第j个关键点的y坐标值,zij是第i个人体姿态中第j个关键点的z坐标值,k是一个人体姿态包含的关节点数,n是整段待补全人体运动序列中人体姿态的个数;
3)根据待补全的三维运动数据矩阵X中数据项是否已经观测到,设置二值掩码矩阵Ω,规则如下:
4)根据待补全的三维运动数据矩阵X的矩阵规模,生成具有相同行数的平滑约束矩阵O:
5)采用增量拉格朗日乘数法,优化求解如下一个保存时序平稳与低秩结构特性的目标函数:
其中,||·||*是矩阵的核范数,||·||1是矩阵的l1范数,是平方的Frobenius范数,Y是期望补全后的纯净的三维运动数据矩阵,E是原三维运动数据矩阵中包含的噪声,α和β是正则化系数参数;
6)根据目标函数3优化求解得到的Y,若只对X中缺失的数据项部分进行补全,则补全规则如下:
若不仅需要对X中缺失的数据项部分进行补全,同时过滤掉在X中所包含的可能噪声数据,则补全规则如下:
X ~ = Y - - - 5
其中,是最终返回的补全后的完整三维人体运动数据矩阵,从而实现对不完整三维人体运动数据的补全。
CN201310558212.7A 2013-11-11 2013-11-11 保持时序平稳与低秩结构特性的三维人体运动数据补全方法 Active CN103578120B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310558212.7A CN103578120B (zh) 2013-11-11 2013-11-11 保持时序平稳与低秩结构特性的三维人体运动数据补全方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310558212.7A CN103578120B (zh) 2013-11-11 2013-11-11 保持时序平稳与低秩结构特性的三维人体运动数据补全方法

Publications (2)

Publication Number Publication Date
CN103578120A CN103578120A (zh) 2014-02-12
CN103578120B true CN103578120B (zh) 2016-03-30

Family

ID=50049840

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310558212.7A Active CN103578120B (zh) 2013-11-11 2013-11-11 保持时序平稳与低秩结构特性的三维人体运动数据补全方法

Country Status (1)

Country Link
CN (1) CN103578120B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279964B (zh) * 2015-08-07 2017-10-24 北京工业大学 一种基于低秩算法的路网交通数据的补全方法
WO2020155024A1 (zh) * 2019-01-31 2020-08-06 深圳市瑞立视多媒体科技有限公司 一种三维轨迹数据的数据缺失处理方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102024252A (zh) * 2010-12-10 2011-04-20 清华大学 基于矩阵秩最小化的恢复水下失真图像的重构方法
CN103020984A (zh) * 2012-09-25 2013-04-03 浙江大学 基于稀疏表达的三维人体运动数据补全方法
CN103136732A (zh) * 2013-02-19 2013-06-05 北京工业大学 一种基于矩阵填充的图像去噪方法
KR20130074207A (ko) * 2011-12-26 2013-07-04 한국전자통신연구원 스케줄러기반 데이터 서버간 데이터 복제 방법

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7800779B2 (en) * 2005-12-21 2010-09-21 Xerox Corporation System and method for image based control using inline sensors

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102024252A (zh) * 2010-12-10 2011-04-20 清华大学 基于矩阵秩最小化的恢复水下失真图像的重构方法
KR20130074207A (ko) * 2011-12-26 2013-07-04 한국전자통신연구원 스케줄러기반 데이터 서버간 데이터 복제 방법
CN103020984A (zh) * 2012-09-25 2013-04-03 浙江大学 基于稀疏表达的三维人体运动数据补全方法
CN103136732A (zh) * 2013-02-19 2013-06-05 北京工业大学 一种基于矩阵填充的图像去噪方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Motion Capture Data Completion and Denoising by Singular Value Thresholding;Ranch Y.Q. Lai 等;《Proceeding of Eurographics,Eurographics Association》;20111231;第1-23页 *
Robust smoothing of gridded data in one and higher dimensions with missing values;Damien Garcia;《Computational Statistics and Data Analysis》;20090930;第1167-1178页 *
The Augmented Lagrange Multiplier Method for Exact Recovery of Corrupted Low-Rank Matrices;Zhouchen Lin 等;《Mathematics-Optimization and Control》;20100926;第45-48页 *
分段式低秩逼近的运动捕获数据去噪方法;彭淑娟 等;《计算机科学》;20130930;第40卷(第9期);第307-311页 *

Also Published As

Publication number Publication date
CN103578120A (zh) 2014-02-12

Similar Documents

Publication Publication Date Title
CN109410242A (zh) 基于双流卷积神经网络的目标跟踪方法、系统、设备及介质
CN110263833A (zh) 基于编码-解码结构的图像语义分割方法
CN107564025A (zh) 一种基于深度神经网络的电力设备红外图像语义分割方法
CN107229904A (zh) 一种基于深度学习的目标检测与识别方法
CN105160310A (zh) 基于3d卷积神经网络的人体行为识别方法
CN105205453B (zh) 基于深度自编码器的人眼检测和定位方法
CN107423814A (zh) 一种采用深度卷积神经网络建立动态网络模型的方法
CN106981080A (zh) 基于红外图像和雷达数据的夜间无人车场景深度估计方法
CN110222580A (zh) 一种基于三维点云的人手三维姿态估计方法和装置
CN106203625A (zh) 一种基于多重预训练的深层神经网络训练方法
CN105740773A (zh) 基于深度学习和多尺度信息的行为识别方法
CN102682452A (zh) 基于产生式和判别式结合的人体运动跟踪方法
CN114821640B (zh) 基于多流多尺度膨胀时空图卷积网络的骨架动作识别方法
Gamez et al. iSpike: a spiking neural interface for the iCub robot
CN104899896B (zh) 一种基于子空间特征的多任务学习目标跟踪方法
CN104408760A (zh) 一种基于双目视觉的高精度虚拟装配系统算法
CN104008551A (zh) 一种基于可见光图像的柑橘黄龙病检测方法
CN107146237A (zh) 一种基于在线状态学习与估计的目标跟踪方法
CN101425139A (zh) 一种视角无关的动作识别方法
CN108875482A (zh) 物体检测方法和装置、神经网络训练方法和装置
CN103839280B (zh) 一种基于视觉信息的人体姿态跟踪方法
CN106683178A (zh) 基于图论的低秩矩阵恢复三维骨架方法
CN109345559A (zh) 基于样本扩充和深度分类网络的运动目标跟踪方法
CN103578120B (zh) 保持时序平稳与低秩结构特性的三维人体运动数据补全方法
CN104268592A (zh) 基于协同表示和判别准则的多视角联合动作词典学习方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant