CN102651072A - 一种面向三维人体运动数据的分类方法 - Google Patents

一种面向三维人体运动数据的分类方法 Download PDF

Info

Publication number
CN102651072A
CN102651072A CN2012101000809A CN201210100080A CN102651072A CN 102651072 A CN102651072 A CN 102651072A CN 2012101000809 A CN2012101000809 A CN 2012101000809A CN 201210100080 A CN201210100080 A CN 201210100080A CN 102651072 A CN102651072 A CN 102651072A
Authority
CN
China
Prior art keywords
classification
sparse expression
attitude
coefficient
human motion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012101000809A
Other languages
English (en)
Inventor
肖俊
胡文渊
庄越挺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN2012101000809A priority Critical patent/CN102651072A/zh
Publication of CN102651072A publication Critical patent/CN102651072A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种面向三维人体运动数据的分类方法。包括如下步骤:1)利用三维人体的运动数据特征,基于稀疏表达的方法,设计计算三维人体运动片段中各帧的稀疏表达系数
Figure DEST_PATH_IMAGE002
;2)基于步骤1)的稀疏表达系数,对各帧的稀疏表达系数进行重建,分析残差进行分类识别。本发明利用计算机运动数据编辑和稀疏表达的知识,实现了对于三维人体运动数据自动智能分类识别。利用稀疏表达的思路对运动数据进行分类,最终结果可以达到较高的分类正确率。

Description

一种面向三维人体运动数据的分类方法
技术领域
本发明涉及一种面向三维人体运动数据的分类方法,属于计算机运动捕获和运动数据编辑的综合领域。
背景技术
现有技术通过一些光学或者机械传感器来实时捕获人体的运动从而驱动动画角色。运动捕获技术的日益成熟和广泛使用产生了大量的三维运动数据,这些数据已被越来越广泛地应用在计算机动画、电影制作以及3D游戏中。在实际应用中,最大限度的重用已有三维人体运动数据能够有效提高动画制作效率并降低制作成本。三维人体运动数据的自动识别与分类是对其进行有效管理与重用的基础,也是该领域的难点问题之一。
2009年在会议SCA上发表的《Efficient and robust annotation ofmotion capture data》公布了一种模板匹配方法,每个人体姿态都由一组人体关节之间的相对位置关系特征的布尔值表示,从而将运动序列表示成一系列0,1矩阵的集合,新来的测试运动序列通过DTW等方法进行匹配识别。该方法的优势是将原始三维特征转化为语义上可以理解的人体关节之间的相对位置关系特征,降低了语义上相似的运动在数据表达上的差别所带来的影响。但是,模板的建立需要额外地进行计算处理,同时其匹配过程对噪声也比较敏感。
近年来,机器学习也被广泛地应用到运动数据分类中。如2006年在计算机期刊上发表的《lndexing of motion capture data for efficient and fastsimilarity search》公开了一种利用SVD提取出运动特征,并通过SVM进行分类识别的方法。另外,基于降维方法的运动识别技术也被提出,如2005年在SCA上发表的《An efficient search algorithm for motion data usingweighted pca》公布了权重PCA方法,2010年在CVPR上发表的《Sufficientdimension reduction for visual sequence classification》公布了SDR方法。总体来看,他们的主旨思想是将原始特征空间投影到特定的子空间中,进而对于子空间中的低维特征使用传统方法(如SVM,KN N等)进行分类。但是这些方法需要对所有数据进行训练,计算量大,同时正确率还需要提高。
发明内容
本发明的目的是为了克服目前运动数据编辑中对于三维人体运动片段管理和重用的复杂性和主观性,提供一种面向三维人体运动数据的分类方法。
面向三维人体运动数据的分类方法包括如下步骤:
1)利用三维人体的运动数据特征,基于稀疏表达的方法,设计计算三维人体运动片段中各帧的稀疏表达系数x0
2)基于步骤1)的稀疏表达系数,对各帧的稀疏表达系数进行重建,分析残差进行分类识别。
所述的利用三维人体的运动数据特征,基于稀疏表达的方法,设计计算三维人体运动片段中各帧的稀疏表达系数的步骤:
(a)输入标准格式的运动捕获数据,所有姿态的根节点被平移并旋转至坐标原点,同时让左肩与右肩的关节连线平行于Y轴,并将所有姿态的朝向转到Z轴正方向,得到训练数据集和测试数据集;
(b)输入测试集中任意未知类别的运动片段Y,运动片段Y由一系列时序相关的姿态帧来表示,即Y=[y1,y2,,...,ym];其中任意一个姿态y,均基于训练运动数据集定义的一个过完备字典矩阵A对姿态y进行线性表示,A包含k个类别的n′个姿态,过完备字典矩阵A是训练数据集的一个子集,即:
A = [ A 1 , A 2 , . . . , A k ] = [ f 1,1 , . . . , f 1 , n 1 ′ , f 2,1 , . . . , f 2 , n 2 ′ , . . . , f k , 1 , . . . , f k , n k ′ ]
其中,过完备字典矩阵A的选择采取均匀采样的方法,减少计算量的同时保证过完备字典矩阵A具有有效的数据代表性;
姿态y由过完备字典矩阵A中的少量数据线性组合得到:
y=Ax0                                        2
其中, x 0 = [ a 1,1 , . . . a 1 , n 1 ′ , . . . a i , 1 , . . . a i , n i ′ , . . . a k , 1 , . . . a k , n k ′ ] T ;
考虑到在实际的三维人体运动分类识别中的噪声,测试数据不可能准确得由过完备字典矩阵A稀疏地表达,所以x0最终通过优化求解以下形式求出:
x0=argmin||x||1      s.t.||Ax-y||2≤ε       3
对于运动片段Y,通过遍历求解每一帧的稀疏表达系数,获得人体运动序列Y=[y1,y2,,...,ym]所对应的稀疏表达系数集合X=[x1,x,...,xm]。
所述的基于步骤1)的稀疏表达系数计算方法,对各帧的稀疏表达系数进行重建,分析残差进行分类识别的步骤如下:
(c)获得人体运动序列Y=[y1,y2,,...,ym]所对应的稀疏表达系数集合X=[x1,x,...,xm]后,对于k个类别中的每一类,都相应设计了一个函数δi,用于从稀疏表达系数中取出对应的系数,而将其他k-1个类别对应的系数标为0,如此,重建出测试姿态y,记为接下来,遍历每一类别,计算y与yi的残差,通过求残差的最小值来获得待测试姿态y的类别标签:
Figure BDA0000150845470000031
其中δk就是定义的选择函数,用来选择跟第k个类别相关的系数;
获得运动序列Y=[y1,y2,,...,ym]中每个姿态的类别后,通过统计计算所有的类别标签来最终获得该运动序列Y的类别。
本发明利用计算机运动数据编辑和稀疏表达的知识,实现了对于三维人体运动数据自动智能分类识别。利用稀疏表达的思路对运动数据进行分类,最终结果可以达到较高的分类正确率。
附图说明
图1是面向三维人体运动数据的分类方法的流程图。
具体实施方式
面向三维人体运动数据的分类方法包括如下步骤:
1)利用三维人体的运动数据特征,基于稀疏表达的方法,设计计算三维人体运动片段中各帧的稀疏表达系数x0
2)基于步骤1)的稀疏表达系数,对各帧的稀疏表达系数进行重建,分析残差进行分类识别。
所述的利用三维人体的运动数据特征,基于稀疏表达的方法,设计计算三维人体运动片段中各帧的稀疏表达系数的步骤:
(a)输入标准格式的运动捕获数据,所有姿态的根节点被平移并旋转至坐标原点,同时让左肩与右肩的关节连线平行于Y轴,并将所有姿态的朝向转到Z轴正方向,得到训练数据集和测试数据集;
(b)输入测试集中任意未知类别的运动片段Y,运动片段Y由一系列时序相关的姿态帧来表示,即Y=[y1,y2,,...,ym];其中任意一个姿态y,均基于训练运动数据集定义的一个过完备字典矩阵A对姿态y进行线性表示,A包含k个类别的n′个姿态,过完备字典矩阵A是训练数据集的一个子集,即:
A = [ A 1 , A 2 , . . . , A k ] = [ f 1,1 , . . . , f 1 , n 1 ′ , f 2,1 , . . . , f 2 , n 2 ′ , . . . , f k , 1 , . . . , f k , n k ′ ]
其中,过完备字典矩阵A的选择采取均匀采样的方法,减少计算量的同时保证过完备字典矩阵A具有有效的数据代表性;
姿态y由过完备字典矩阵A中的少量数据线性组合得到:
y=Ax0                           2
其中, x 0 = [ a 1,1 , . . . a 1 , n 1 ′ , . . . a i , 1 , . . . a i , n i ′ , . . . a k , 1 , . . . a k , n k ′ ] T ;
考虑到在实际的三维人体运动分类识别中的噪声,测试数据不可能准确得由过完备字典矩阵A稀疏地表达,所以x0最终通过优化求解以下形式求出:
x0=argmin||x||1        s.t.||Ax-y||2≤ε          3
对于运动片段Y,通过遍历求解每一帧的稀疏表达系数,获得人体运动序列Y=[y1,y2,,...,ym]所对应的稀疏表达系数集合X=[x1,x,...,xm]。
所述的基于步骤1)的稀疏表达系数计算方法,对各帧的稀疏表达系数进行重建,分析残差进行分类识别的步骤如下:
(c)获得人体运动序列Y=[y1,y2,,...,ym]所对应的稀疏表达系数集合X=[x1,x,...,xm]后,对于k个类别中的每一类,都相应设计了一个函数δi,用于从稀疏表达系数中取出对应的系数,而将其他k-1个类别对应的系数标为0,如此,重建出测试姿态y,记为
Figure BDA0000150845470000041
接下来,遍历每一类别,计算y与yi的残差,通过求残差的最小值来获得待测试姿态y的类别标签:
Figure BDA0000150845470000042
其中δk就是定义的选择函数,用来选择跟第k个类别相关的系数;
获得运动序列Y=[y1,y2,,...,ym]中每个姿态的类别后,通过统计计算所有的类别标签来最终获得该运动序列Y的类别。
实施例
(1)输入标准格式的运动捕获数据,在本实施例中输入近红外光学捕获系统所获得的人体运动标准.bvh格式的文件,所有姿态的hip(root)节点被平移并旋转至坐标原点,同时让左肩与右肩的关节连线平行于Y轴,并将所有姿态的朝向转到Z轴正方向;训练数据集和测试数据集均通过该运算过程来获得。
输入测试集中任意未知类别的运动片段Y,其由一系列时序相关的姿态帧来表示,即Y=[y1,y2,,...,ym];其中任意一个姿态y,均可以基于训练运动数据集定义的一个过完备字典矩阵A对其进行线性表示,A包含k个类别的n′个姿态,该集合是训练运动数据集的一个子集,即:
A = [ A 1 , A 2 , . . . , A k ] = [ f 1,1 , . . . , f 1 , n 1 ′ , f 2,1 , . . . , f 2 , n 2 ′ , . . . , f k , 1 , . . . , f k , n k ′ ]
其中,过完备字典的选择采取均匀采样的方法,减少计算量的同时保证该字典具有有效的数据代表性。
姿态y可以由矩阵A中的少量数据线性组合得到:
y=Ax0                                      2
其中, x 0 = [ a 1,1 , . . . a 1 , n 1 ′ , . . . a i , 1 , . . . a i , n i ′ , . . . a k , 1 , . . . a k , n k ′ ] T .
x0是个稀疏向量(称之为稀疏表达系数),为了求出x0,需要解决L0范式最小化问题。
考虑到在实际的三维人体运动分类识别中的噪声,测试数据不可能准确得由训练基稀疏地表达,所以最终通过优化求解以下形式求出:
Figure BDA0000150845470000052
s.t.||Ax-y||2≤ε                     3
对于运动片段Y,通过遍历求解每一帧的稀疏表达系数,获得人体运动序列Y=[y1,y2,,...,ym]所对应的稀疏表达系数集合X=[x1,x,...,xm]。
(2)所述的基于步骤1)的稀疏表达系数计算方法,对各帧的稀疏表达系数进行重建,分析残差进行分类识别的步骤如下:
获得人体运动序列Y=[y1,y2,,...,ym]所对应的稀疏表达系数集合X=[x1,x,...,xm]后,对于k个类别中的每一类,都相应设计了一个函数δi,用于从稀疏表达系数中取出该类别所对应的系数,而将其他类别对应的系数标为0。如此,可以重建出测试姿态y,记为
Figure BDA0000150845470000053
接下来,遍历每一类别,都可以计算y与yi的残差,通过求残差的最小值来获得待测试姿态y的类别标签:
其中δk就是定义的选择函数,用来选择跟第k个类别相关的系数。
获得运动序列Y=[y1,y2,,...,ym]中每个姿态的类别后,通过统计计算所有的类别标签来获得该运动序列Y的类别。比较结果见表1。
表1本方法与其它五种传统分类算法的比较结果
  方法   姿态分类正确率   运动分类正确率
  我们的方法   86.74   91.16
  L2   80.43   87.87
  SVM   80.25   86.42
  KNN   79.37   87.30
  PCA   79.39   87.40
  LapRLS   82.63   90.36

Claims (3)

1.一种面向三维人体运动数据的分类方法,其特征在于包括如下步骤:
1)利用三维人体的运动数据特征,基于稀疏表达的方法,设计计算三维人体运动片段中各帧的稀疏表达系数x0
2)基于步骤1)的稀疏表达系数,对各帧的稀疏表达系数进行重建,分析残差进行分类识别。
2.根据权利要求1所述的一种面向三维人体运动数据的分类方法,其特征在于:所述的利用三维人体的运动数据特征,基于稀疏表达的方法,设计计算三维人体运动片段中各帧的稀疏表达系数的步骤:
(a)输入标准格式的运动捕获数据,所有姿态的根节点被平移并旋转至坐标原点,同时让左肩与右肩的关节连线平行于Y轴,并将所有姿态的朝向转到Z轴正方向,得到训练数据集和测试数据集;
(b)输入测试集中任意未知类别的运动片段Y,运动片段Y由一系列时序相关的姿态帧来表示,即Y=[y1,y2,,...,ym];其中任意一个姿态y,均基于训练运动数据集定义的一个过完备字典矩阵A对姿态y进行线性表示,A包含k个类别的n′个姿态,过完备字典矩阵A是训练数据集的一个子集,即:
A = [ A 1 , A 2 , . . . , A k ] = [ f 1,1 , . . . , f 1 , n 1 ′ , f 2,1 , . . . , f 2 , n 2 ′ , . . . , f k , 1 , . . . , f k , n k ′ ]
其中,过完备字典矩阵A的选择采取均匀采样的方法,减少计算量的同时保证过完备字典矩阵A具有有效的数据代表性;
姿态y由过完备字典矩阵A中的少量数据线性组合得到:
y=Ax0                                                 2
其中, x 0 = [ a 1,1 , . . . a 1 , n 1 ′ , . . . a i , 1 , . . . a i , n i ′ , . . . a k , 1 , . . . a k , n k ′ ] T ;
考虑到在实际的三维人体运动分类识别中的噪声,测试数据不可能准确得由过完备字典矩阵A稀疏地表达,所以x0最终通过优化求解以下形式求出:
x0=argmin||x||1     s.t.||Ax-y||2≤ε                  3
对于运动片段Y,通过遍历求解每一帧的稀疏表达系数,获得人体运动序列Y=[y1,y2,,...,ym]所对应的稀疏表达系数集合X=[x1,x,...,xm]。
3.根据权利要求1所述的一种面向三维人体运动数据的分类方法,其特征在于:所述的基于步骤1)的稀疏表达系数计算方法,对各帧的稀疏表达系数进行重建,分析残差进行分类识别的步骤如下:
(c)获得人体运动序列Y=[y1,y2,,...,ym]所对应的稀疏表达系数集合X=[x1,x,...,xm]后,对于k个类别中的每一类,都相应设计了一个函数δi,用于从稀疏表达系数中取出对应的系数,而将其他k-1个类别对应的系数标为0,如此,重建出测试姿态y,记为
Figure FDA0000150845460000021
,接下来,遍历每一类别,计算y与yi的残差,通过求残差的最小值来获得待测试姿态y的类别标签:
Figure FDA0000150845460000022
其中δk就是定义的选择函数,用来选择跟第k个类别相关的系数;
获得运动序列Y=[y1,y2,,...,ym]中每个姿态的类别后,通过统计计算所有的类别标签来最终获得该运动序列Y的类别。
CN2012101000809A 2012-04-06 2012-04-06 一种面向三维人体运动数据的分类方法 Pending CN102651072A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012101000809A CN102651072A (zh) 2012-04-06 2012-04-06 一种面向三维人体运动数据的分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012101000809A CN102651072A (zh) 2012-04-06 2012-04-06 一种面向三维人体运动数据的分类方法

Publications (1)

Publication Number Publication Date
CN102651072A true CN102651072A (zh) 2012-08-29

Family

ID=46693077

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012101000809A Pending CN102651072A (zh) 2012-04-06 2012-04-06 一种面向三维人体运动数据的分类方法

Country Status (1)

Country Link
CN (1) CN102651072A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103023510A (zh) * 2012-11-16 2013-04-03 浙江大学 一种基于稀疏表达的运动数据压缩方法
CN104616022A (zh) * 2015-01-13 2015-05-13 浙江科技学院 一种近红外光谱的分类方法
CN104850855A (zh) * 2015-04-27 2015-08-19 小米科技有限责任公司 计算置信度的方法和装置
CN103150752B (zh) * 2013-02-02 2015-08-26 浙江大学 一种基于关键标记点的人体姿态稀疏重建方法
WO2015165260A1 (zh) * 2014-04-29 2015-11-05 华南理工大学 一种用于人体动作识别的三轴特征融合方法
CN106447618A (zh) * 2016-05-20 2017-02-22 北京九艺同兴科技有限公司 一种基于字典学习的人体动作序列降噪方法
CN106685546A (zh) * 2016-12-29 2017-05-17 深圳天珑无线科技有限公司 一种无线人体感知的方法及服务器
CN111487659A (zh) * 2019-01-28 2020-08-04 广州市中海达测绘仪器有限公司 状态识别方法、装置、计算机设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7239718B2 (en) * 2002-12-20 2007-07-03 Electronics And Telecommunications Research Institute Apparatus and method for high-speed marker-free motion capture
CN102024152A (zh) * 2010-12-14 2011-04-20 浙江大学 一种基于稀疏表达和字典学习进行交通标志识别的方法
CN102222361A (zh) * 2010-04-06 2011-10-19 清华大学 三维模型的捕捉及重建方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7239718B2 (en) * 2002-12-20 2007-07-03 Electronics And Telecommunications Research Institute Apparatus and method for high-speed marker-free motion capture
CN102222361A (zh) * 2010-04-06 2011-10-19 清华大学 三维模型的捕捉及重建方法和系统
CN102024152A (zh) * 2010-12-14 2011-04-20 浙江大学 一种基于稀疏表达和字典学习进行交通标志识别的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
覃耀辉: "视频中的人体动作行为识别研究", 《中国优秀硕士学位论文全文数据库》, no. 07, 31 July 2011 (2011-07-31), pages 40 - 41 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103023510A (zh) * 2012-11-16 2013-04-03 浙江大学 一种基于稀疏表达的运动数据压缩方法
CN103023510B (zh) * 2012-11-16 2015-10-07 浙江大学 一种基于稀疏表达的运动数据压缩方法
CN103150752B (zh) * 2013-02-02 2015-08-26 浙江大学 一种基于关键标记点的人体姿态稀疏重建方法
WO2015165260A1 (zh) * 2014-04-29 2015-11-05 华南理工大学 一种用于人体动作识别的三轴特征融合方法
CN104616022A (zh) * 2015-01-13 2015-05-13 浙江科技学院 一种近红外光谱的分类方法
CN104616022B (zh) * 2015-01-13 2018-08-10 浙江科技学院 一种近红外光谱的分类方法
CN104850855A (zh) * 2015-04-27 2015-08-19 小米科技有限责任公司 计算置信度的方法和装置
CN104850855B (zh) * 2015-04-27 2018-06-12 小米科技有限责任公司 计算置信度的方法和装置
CN106447618A (zh) * 2016-05-20 2017-02-22 北京九艺同兴科技有限公司 一种基于字典学习的人体动作序列降噪方法
CN106447618B (zh) * 2016-05-20 2019-04-12 北京九艺同兴科技有限公司 一种基于字典学习的人体动作序列降噪方法
CN106685546A (zh) * 2016-12-29 2017-05-17 深圳天珑无线科技有限公司 一种无线人体感知的方法及服务器
CN111487659A (zh) * 2019-01-28 2020-08-04 广州市中海达测绘仪器有限公司 状态识别方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
Kottur et al. Clevr-dialog: A diagnostic dataset for multi-round reasoning in visual dialog
Gomez-Donoso et al. Lonchanet: A sliced-based cnn architecture for real-time 3d object recognition
CN102651072A (zh) 一种面向三维人体运动数据的分类方法
CN107229757B (zh) 基于深度学习和哈希编码的视频检索方法
CN105956560B (zh) 一种基于池化多尺度深度卷积特征的车型识别方法
CN103268495B (zh) 计算机系统中基于先验知识聚类的人体行为建模识别方法
Bhatia et al. Matrix product state–based quantum classifier
CN108846350A (zh) 容忍年龄变化的人脸识别方法
CN103226713B (zh) 一种多视角行为识别方法
CN104573669A (zh) 图像物体检测方法
CN105243139A (zh) 一种基于深度学习的三维模型检索方法及其检索装置
CN105809672A (zh) 一种基于超像素和结构化约束的图像多目标协同分割方法
CN107133640A (zh) 基于局部图像块描述子和费舍尔向量的图像分类方法
CN113408321B (zh) 一种轻量级图像、视频数据的实时目标检测方法及装置
CN103605952A (zh) 基于拉普拉斯正则组稀疏的人体行为识别方法
CN105631469A (zh) 一种多层稀疏编码特征的鸟类图像识别方法
CN114332473A (zh) 目标检测方法、装置、计算机设备、存储介质及程序产品
CN113269224A (zh) 一种场景图像分类方法、系统及存储介质
CN104573722A (zh) 基于三维点云的三维人脸种族分类装置和方法
CN104598898A (zh) 一种基于多任务拓扑学习的航拍图像快速识别系统及其快速识别方法
Ouadiay et al. Simultaneous object detection and localization using convolutional neural networks
CN103617417A (zh) 植物自动识别方法和系统
CN103544468A (zh) 3d人脸表情识别方法和装置
CN106033546A (zh) 基于自上而下学习的行为分类方法
CN116503379A (zh) 基于轻量化改进YOLOv5的零件识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120829