CN101477619B - 基于dtw曲线的运动数据动作分类方法 - Google Patents

基于dtw曲线的运动数据动作分类方法 Download PDF

Info

Publication number
CN101477619B
CN101477619B CN2008102411718A CN200810241171A CN101477619B CN 101477619 B CN101477619 B CN 101477619B CN 2008102411718 A CN2008102411718 A CN 2008102411718A CN 200810241171 A CN200810241171 A CN 200810241171A CN 101477619 B CN101477619 B CN 101477619B
Authority
CN
China
Prior art keywords
dtw
distance
motion
sequence
dynamic time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008102411718A
Other languages
English (en)
Other versions
CN101477619A (zh
Inventor
郝爱民
王莉莉
宋峰
赵沁平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN2008102411718A priority Critical patent/CN101477619B/zh
Publication of CN101477619A publication Critical patent/CN101477619A/zh
Application granted granted Critical
Publication of CN101477619B publication Critical patent/CN101477619B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/23Recognition of whole body movements, e.g. for sport training

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

基于DTW曲线的运动数据动作分类方法:(1)生成用于运动序列之间相似性度量的双向DTW距离和分段DTW距离;(2)根据双向DTW距离和分段DTW距离生成DTW曲线,并基于DTW曲线生成有效性加权距离
Figure D2008102411718A00011
其中WEoLC为逻辑分类有效性曲线,Ds-dtw为分段DTW距离,λ为用于分段的阈值,P和Q为两个运动序列;(3)根据步骤(2)得到有效性加权距离,采用层次聚类算法对运动序列进行动作分类。本发明该方法放宽了DTW的限制,使分类鲁棒性增强,实验结果表明,本发明的方法可以得到较好的分类结果。

Description

基于DTW曲线的运动数据动作分类方法
技术领域
本发明涉及运动数据自动分类的一种方法,主要用于动作分类。
背景技术
为了有效地利用三维运动数据(例如作为动作识别的训练数据),需将具有相同运动特征的动作片段分为一类,然后对每个类别进行标注,形成各种动作集,动作集的集合称为运动库。例如大量“走”和“跑”的动作片段经过分类和标注后形成“走”和“跑”两个动作集。目前已有的分类方法主要有:
(1)人工分类方法,即采用人工对运动数据进行分类和标注,这种方法将消耗大量的时间和精力;
(2)Souvenir提出的流形聚类方法Manifold Clustering(Souvenir R.,Pless R.Manifold Clustering[A].Proceedings of the Tenth IEEE International Conference onComputer Vision(ICCV’05)[C].Washington:IEEE Computer Society,2005:648-653),该方法根据人工指定的聚类个数,只能对简单行为的运动数据进行分类;
(3)Jenkins(Jenkins O.C.,Matari M.J.A spatio-temporal extension to Isomapnonlinear dimension reduction[A].New York:ACM Press,2004:56)等人首先手工将运动分为简单的片段,然后采用非线性降维(ST-Isomap)法对这些片段进行两次聚类,第一次聚类结果称为基本动作单元,第二次聚类得到行为单元;
(4)
Figure G2008102411718D00011
(Barbic J.,Safonova A.,Pan P.,et al.Segmenting motion capturedata into distinct behaviors[A].Proceedings of the 2004 conference on Graphicsinterface GI’04[C].School of Computer Science,University of Waterloo,Waterloo,Ontario,Canada:Canadian Human-Computer Communicatiohs Society,2004:185-194)为运动数据建立混合高斯模型GMM,采用EM算法(期望最大化算法)来估计高斯分布的参数,假设不同的动作属于不同的高斯分布,根据该假设将运动序列分割为各个动作片段;
(5)DTW方法,Berndt(Berndt D.J.,Clifford J.Using Dynamic Time Warping toFind Patterns in Time Series[A].Proceedings of AAAI Workshop on Knowledge Discoveryin Databases[C].1994:229-248)等人将语音识别中广泛使用的DTW(Dynamic time warping动态时间弯曲)用作运动分类,该方法先计算DTW距离,然后根据计算结果进行动作分类。
DTW基本原理是将两个序列局部时间弯曲,寻找这两个序列的最优对齐,从而判断这两个序列之间的相似程度。由于DTW在局部上对数据进行时间弯曲,因此相比于欧式距离,DTW距离(最优化路径的平均值)可以更好反映两个序列的逻辑相似性,如图1。但在动作分类中,直接使用DTW来评价两个序列的相似性还有如下局限性:
(1)条件严格:DTW有严格的最优路径搜索范围,这个范围有利于提高DTW运行速度,可以防止非连续(nonmonotonic)、非单调(discontinuous)和退化(degenerated)等问题的出现。但对于动作分类来说,这些条件过于严格,在逻辑判断方面表现不佳。
(2)鲁棒性差:两个序列的DTW距离为一个具体的数值,仅仅通过一个数值判断两个序列的相似性,鲁棒性较差,容易受噪声干扰。
发明内容
本发明的技术解决问题是:克服现有技术的不足,提供一种基于DTW曲线的运动数据动作分类方法,该方法放宽了DTW的限制,使分类鲁棒性增强,从而提高了运动数据动作的分类效果。
本发明的技术解决方案:基于DTW曲线的运动数据动作分类方法,步骤如下:
(1)生成用于运动序列之间相似性度量的双向DTW距离和分段DTW距离,所述的生成双向DTW距离的方法为:对于给定的两个运动序列P和Q,这两个序列的DTW距离为Ddtw(P,Q),令序列P的翻转序列为Q′,且P和Q′之间的DTW距离为Ddtw(P,Q′),则序列P和Q之间的双向DTW距离定义为:DB-dtw(P,Q)=min{Ddtw(P,Q),Ddtw(P,Q′)};生成分段DTW距离的方法为:给定两个运动序列P和Q,将这两个运动序列进行分段,并选择部分运动片段,片段之间采用双向DTW距离,则两个运动序列P和Q之间的分段DTW距离定义为覆盖所有运动片段的双向DTW距离之和平均值的最小值;
(2)根据步骤(1)中的双向DTW距离和分段DTW距离生成DTW曲线,并基于DTW曲线生成有效性加权距离 D W - dtw ( P , Q ) = ∫ 0 1 W EoLC ( λ ) · D S - dtw ( λ , P , Q ) dλ , 其中WEoLC为逻辑分类有效性曲线,Ds-dtw为分段DTW距离,λ为用于分段的阈值,P和Q为两个运动序列。
本发明与现有技术相比的优点在于:
(1)在传统动态时间弯曲算法(Dynamic time warping,DTW)距离度量的基础上,本发明给出了双向DTW和分段DTW两种距离度量方法,提高了运动序列动作自动分类的鲁棒性,更加接近人工分类的结果。
(3)DTW有严格的最优路径搜索范围,这对于动作分类来说,这些条件过于严格,在逻辑判断方面表现不佳。本发明提出的双向DTW和分段DTW则放宽了该条件限制,更有利于逻辑分类,从而提高了运动数据动作的分类效果。
(3)本发明提出了的用于动作分类的DTW曲线表示方法,给出了有效性加权距离的定义,并采用层次聚类算法(hierarchical clustering procedure)对运动数据进行分类。
实验结果表明,本发明的基于DTW曲线的动作分类方法可以得到较好的分类结果。
附图说明
图1为欧氏距离和DTW距离点的对应关系;
图2为逻辑相似性(Kovar)描述;
图3为逻辑相似性较好、DTW距离较大的动作示例;
图4为本发明的流程图;
图5为本发明的双向DTW示意图;
图6为本发明的分段DTW示意图;图6a和图6b为运动片段的两种组合。
图7为本发明的DTW曲线生成流程图;
图8为本发明的8-连通域的生成示意图;
图9为由极小相似域计算分段DTW距离;
图10为分类有效性与阈值参数关系的定性分析;
图11为DTW曲线示例;
图12为不同运动风格的boxing;
图13为不同聚类数下生成的Rand Index值(MoCap数据集);
图14为不同聚类数下生成的Rand Index值(IXMAS数据集)。
具体实施方式
如图4所示,本发明的实现方法具体如下:
1.生成用于运动序列之间相似性度量的双向DTW距离和分段DTW距离。
运动序列之间相似性度量(如图2中的前踢腿和向侧踢腿这两个运动)可以有多种方法,但这些方法所具有的逻辑相似性判断能力并不相同,用于动作分类后,与人们主观判断的差别也并不相同。为了方便描述,本发明引入了逻辑分类有效性的概念。
定义1逻辑分类有效性(Effectivity of Logic Classification,EoLC)逻辑分类有效性是距离或者相似性度量用于动作分类后,与人们主观判断(手工分类)的差别。逻辑分类有效性越大,则根据该度量对运动序列进行动作分类后越接近手工分类,也越符合人对动作的直观理解。
DTW是一种全局动态时间对齐方法,由于DTW在路径搜索的过程中需要遵循一定的约束条件,这些约束条件导致DTW逻辑分类有效性并不高。例如有些运动序列具有反向相似性,如图3(a)所示的“顺时针挥手”序列与“逆时针挥手”序列,这两个运动序列属于同一类运动,具有较大的逻辑相似性。还有些运动序列具有分段相似性,例如图3(b)所示,一个拳击序列(“左拳”-“右拳”-“左拳”)和另一个拳击序列(“右拳”-“左拳”-“右拳”),它们具有较好逻辑相似性,但两者的DTW距离却较大。
对于反向相似或者分段相似的运动序列,如果直接采用DTW度量并用于动作分类,将会产生较低的逻辑分类有效性。因此针对这个问题,本发明提出两种DTW的改进策略,提高逻辑分类有效性。
(1)双向DTW
从动作分类角度来看,运动序列的时间翻转不会影响其所属类别,例如一个运动序列P=(p1,p2,...,PN),其翻转序列P′=(pN,pN-1,...,p1),则这个运动序列P与P′应该属于同一个运动分类,他们应具有较大的逻辑相似性,逻辑距离较小,采用传统DTW,却可能得到一个较大的距离值。
本发明提出双向DTW(Bidirectional Dynamic Time Warping)距离来解决这个问题,双向DTW定义如下:
定义2双向DTW(Bidirectional Dynamic Time Warping)给定两个运动序列P=(p1,p2,...,pN)和Q=(q1,q2,...,qM),这两个序列的DTW距离为Ddtw(P,Q),令序列P的翻转序列为Q′=(qM,qM-1,...,q1),且P和Q′之间的DTW距离为Ddtw(P,Q′),则序列P和Q之间的双向DTW距离定义为:
DB-dtw(P,Q)=min{Ddtw(P,Q),Ddtw(P,Q′)}
双向DTW的实质是将对比的两个序列其中一个翻转,分别求翻转前和翻转后的DTW距离,最小值就是双向DTW距离,如图5所示,对角线两条曲线分别为正向DTW和反向DTW路径,两条路径上点的距离之和最小值为双向DTW距离。由于双向DTW允许从两个方向进行比较,因此相比于传统DTW,反向相似的两个序列具有较小的距离值,更加符合人们对动作的判断,可以提高逻辑分类有效性。
(2)分段DTW
有些逻辑相似的运动序列,由于时间次序的不同,在整体上并不具有较好数值相似性,导致DTW距离较大,例如两个拳击运动序列A(左拳击-右拳击-左拳击)和B(右拳击-左拳击-右拳击),它们都属于拳击这一类别,由于A和B动作次序不同,因此即使经过时间对齐,这两个运动序列仍然具有较大的DTW距离,其原因是DTW算法具有较强的约束条件,导致DTW只能从单调方向寻找最小值。为了进一步放宽约束条件,解决序列分段相似性问题,在双向DTW距离的基础上,提出了分段DTW方法,具体定义如下:
定义3分段DTW(Segment Dynamic Time Warping)  给定两个运动序列P=(p1,p2,...,pN)和Q=(q1,q2,...,qM),将这两个运动序列按一定规则进行分段,并选择部分运动片段,片段之间采用双向DTW距离,则运动序列P和Q之间的分段DTW距离DS-dtw(P,Q)定义为覆盖所有运动片段的双向DTW距离之和平均值的最小值。
例如两个运动序列P和Q,如图6所示,P选择三段P1、P2和P3,Q选择四段Q1、Q2、Q3和Q4。假设运动片段之间的双向DTW距离分别为DB-dtw(P1,Q2)、DB-dtw(P2,Q1)、DB-dtw(P2,Q4)、DB-dtw(P3,Q3)和DB-dtw(P3,Q4),并且假设DB-dtw(P2,Q4)>DB-dtw(P3,Q4),则可以覆盖所有运动片段的距离之和有两种方案:
(a)DS-dtw(P,Q)=(DB-dtw(P1,Q2)+DB-dtw(P2,Q1)+DB-dtw(P3,Q3)+DB-dtw(P3,Q4))/4
(b)D′S-dtw(P,Q)=(DB-dtw(P1,Q2)+DB-dtw(P2,Q1)+DB-dtw(P3,Q3)+DB-dtw(P2,Q4))/4
由于DB-dtw(P2,Q4)>DB-dtw(P3,Q4),因此序列P和Q的分段DTW距离为DS-dtw(P,Q)。
根据定义可知,分段DTW的核心问题是序列的分段和选择,在使用时可以任意设置分段和选择规则,本发明通过距离矩阵的极小相似域来选择序列中的片段。此外在算法实现时,由于需要进行距离最小的比较,算法往往包含大量的循环,假设序列P和Q之间存在有n个双向DTW距离(也即图5中n条连线),如果进行枚举比较,则需循环n!次,时间复杂度为O(nn),为了提高运算效率,可以根据分段DTW距离定义中“覆盖所有运动片段”这一条件,仅循环具有多条连线的片段,可以极大减少循环次数。
2.根据双向DTW距离和分段DTW距离生成DTW曲线(DTW-Curve)
采用双向DTW和分段DTW,可以较好的反映运动序列之间的逻辑相似性(例如反向相似和分段相似),但在分段DTW算法中需要对运动序列进行分段,不同的分段方法会产生不同的DTW值。本发明给出一种分段方法,给定一个阈值,生成一组极小相似域,根据极小相似域对序列进行分段,然后计算相应的分段DTW距离。随着阈值的变化,计算不同的分段DTW距离值,由这些分段DTW值构成的曲线称为DTW曲线(DTW-Curve)。DTW-Curve不但融合了双向DTW和分段DTW的特点,可提高序列逻辑分类有效性,而且通过一条曲线来刻画序列的相似性,抗干扰能力强,因此具有更好的鲁棒性,可以更加客观评价运动序列的关系。
生成DTW-Curve的完整流程如图7所示,两个运动序列P和Q,先经过数据对齐后,去除对动作分类无贡献的全局平移和垂直旋转;然后聚类局部帧,过滤和压缩低频运动片段和过渡运动片段,降低这些片段对动作分类的干扰;最后在不同的阈值下,计算分段DTW距离,从而构成评价这两个序列相似性的DTW曲线。
(1)数据对齐
本发明假设运动序列的动作类别与其整体平移以及绕垂直于水平面的z轴旋转无关,例如“直线走”与“旋转走”类别相同。因此在计算两个运动序列DTW-Curve之前,需要对运动序列进行预处理,从而降低平移和垂直旋转对运动分类产生的影响。
(2)局部帧聚类
动作序列中常包含一些低频过渡运动片段,人们根据动作序列中具有高频成分的运动片段进行动作分类,而忽略这些低频运动片段,例如一个10s的动作序列,前3s为“站立”状态,中间4s为“拳击”,后3s恢复到“站立”状态,即使“站立”片段持续的时间长于“拳击”片段,该运动序列常被认为“拳击”序列而非“站立”序列。
这些过渡运动片段不仅对运动分类没有贡献,甚至会影响分类结果,例如两个运动序列A(站立-拳击)与另一个运动序列B(站立-踢腿),这两个运动序列的“站立”持续的时间越长,A与B的DTW距离越小。为了减少这种干扰,本发明采用局部聚类的方法,对经过数据对齐后的运动数据进行重采样处理,过滤低频运动片段,保留对动作分类有潜在贡献的帧。
(3)DTW-Curve生成
两个运动序列经过数据对齐和局部帧聚类后形成的新序列表示为P和Q,构成距离矩阵D(P,Q),元素D(i,j)=||pi-qj||2表示序列P的第i帧与序列Q的第j帧的欧式距离。给定一个阈值参数λ∈[0,1],确定对应的阈值δ:
δ=(max(D(i,j))-min(D(i,j)))×λ+min(D(i,j))
距离矩阵D中所有大于该阈值δ的元素设置为0,其余元素设置为1。则由元素1可以形成多个8-连通域。图8给出一个8-连通域生成的示例,设置的阈值如8(a)所示,所有小于该阈值的元素形成的8-连通域如8(b)所示。
每个8-连通域内的距离值都小于等于阈值,这意味着连通域所覆盖的两个运动序列片段较为相似,这些连通域涵盖了运动序列P和Q在阈值δ下所有相似性较高的运动片段。
定义4极小相似域连通域的最小包围矩形定义为极小相似域,数学上,极小相似域是序列P和Q中的部分片段构成的距离矩阵,且距离的平均值小于周围所有同维度矩阵的距离平均值,因此极小相似域对应的两个片段具有较高的相似性。
图8(b)对应的极小相似域如图9(a)阴影矩形所示,这些极小相似域对应的序列片段即为分段DTW中序列片段。
片段之间可能相互覆盖和遮挡,根据分段DTW的定义,需要从所有序列片段中选择可以覆盖所有运动片段,而且双向DTW距离之和平均值最小的部分片段。为了达到这个目的,根据极小相似域引入定义“覆盖率”。
定义5覆盖率给定两个序列P和Q,在某个阈值参数λ下可得到若干极小相似域,这些极小相似域向两个轴投影,投影长度分别为LP和LQ,则在阈值参数λ下的覆盖率为:
Cr ( λ ) = L P | P | * L Q | Q |
其中|P|和|Q|表示两个序列的长度。
在保证覆盖率最大的情况下,选择双向DTW距离之和平均值最小的极小相似域,如图9(b)虚线圆所示,这些极小相似域的双向DTW距离之和的平均值即为运动序列P和Q在阈值参数λ下的分段DTW距离,表示为DS-dtw(λ,P,Q),其中P和Q为两个经过数据对齐和局部帧聚类的运动序列,λ为阈值参数。
λ有明确的取值范围[0,1],且具有与序列长度、距离范围无关等特点。一般情况下,阈值参数λ决定极小相似域总面积的大小,参数λ越小,面积越小。较为特殊的是,当阈值参数λ=1时,只存在一个极小相似域距离,该极小相似域就是距离矩阵D(P,Q),而且DS-dtw(1,P,Q)=DB-dtw(P,Q)。
当阈值参数λ=0,不管运动序列P和Q的关系如何,DS-dtw(0,P,Q)=0,此时,该值对动作分类没有任何意义,逻辑分类有效性为0。随着λ从0开始增加,极小相似域的数量相应增加,逻辑有效性逐渐增大;但当λ逐渐接近1时,极小相似域的数量和分段DTW的片段数开始减少,逻辑分类有效性也随之下降。如图10所示,当λ=1时,DS-dtw(1,P,Q)为序列P和Q的双向DTW距离,最接近传统DTW距离。
由于动作的逻辑分类涉及到人的理解,因此很难找到一条完全理想的EoLC曲线,本发明根据图9的推理和多次数据对比的观察,假设EoLC曲线方程为:
W EoLC ( x ) = 0 x &le; 0.3 1 &sigma; 2 &pi; e - ( x - 0.7 ) 2 / 2 &sigma; 2 0.3 < x &le; 1
其中标准偏差=0.3。
根据上述讨论,DTW曲线(DTW-Curve)的定义如下:
定义6 DTW曲线(DTW-Curve)每一个阈值参数λ都对应一个分段DTW距离,随着阈值参数λ的变化,可得到一条由DS-dtw(λ,P,Q)构成的曲线,该曲线定义为DTW曲线。
为了进一步描述DTW曲线的作用和特点,选择两组动作序列(每组两个序列),第一组的两个动作序列具有相同的动作类别“boxing”,第二组的动作序列具有不同的动作类别“walking”和“running”,当阈值参数λ取值0.4、0.5、0.6、…、1.0时,分别计算这两组序列的分段DTW距离值,生成两条DTW曲线,图11(a)为第一组序列对应的DTW曲线,图11(b)为第二组序列对应的DTW曲线。图中的虚线为传统DTW距离值,当阈值参数λ=1时,分段DTW距离值等于双向DTW距离值,与传统DTW距离值较为接近。
由于第一组的两个序列属于同一动作类别,因此它们之间的逻辑距离较小,由图11(a)可知,DTW-Curve整体低于DTW距离值,因此更好地反映了两个序列之间的相似关系;第二组序列属于不同的动作类别,因此它们之间具有较小的逻辑相似性(也即较大的距离),由图10(b)可知,DTW-Curve大部分取值高于DTW距离,因此具有更好的逻辑分类鲁棒性。这两个例子说明通过DTW-Curve来判断序列关系,比传统的DTW更加符合人们的直观判断,分类鲁棒性更强。
3.基于DTW曲线对运动数据进行动作分类
基于DTW-Curve可生成多种统计数据,这些数据都可用于动作分类,本发明仅给出有效性加权距离统计信息,并采用层次聚类算法(hierarchical clustering procedure)对运动数据进行动作分类。本发明的总体流程图如图4所示。
定义7有效性加权距离将逻辑分类有效性曲线EoLC作为权重,统计累加DTW-Curve的距离值,得到的结果称为有效性加权距离。数学上,有效性加权距离定义为:
D W - dtw ( P , Q ) = &Integral; 0 1 W EoLC ( &lambda; ) &CenterDot; D S - dtw ( &lambda; , P , Q ) d&lambda;
逻辑分类有效性曲线,分段DTW距离,λ为阈值,P和Q为两个运动序列。
由于λ在0附近逻辑分类有效性比较低,因此本发明在动作分类中仅考虑阈值参数λ在[0.4,1]区间内的DTW曲线段,而且为了提高计算速度,仅仅采用7个离散的参数值,分别为0.4、0.5、0.6、0.7、0.8、0.9和1.0,因此有效性加权DTW距离简化为:
D W - dtw ( P , Q ) = &Sigma; i = 4 10 W EoLC ( 0.1 &times; i ) &CenterDot; D S - dtw ( 0.1 &times; i , P , Q )
用于层次聚类算法的类间距离度量为:
D max ( C i , C j ) = max P &Element; C i Q &Element; C j ( D W - dtw ( P , Q ) )
当最小的Dmax(Ci,Cj)大于某个分类距离阈值,或者分类数达到给定的聚类个数时,层次聚类算法停止层次合并,该算法也称为全连接算法(compelte-linkage algorithm)。
为了验证本发明提供的方法的有效性,在两个公共运动数据集MoCap和IXMAS上进行了实验、对比和分析。并采用Rand Index对无监督分类结果进行评价,人工对运动数据进行分类C={c1,c2,...,cm},采用无监督分类算法后分类结果为Ω={w1,w2,...,wn},根据无监督聚类评价指标Rand Index,任意两个运动数据P和Q可以分为四种关系,统计这四种关系的运动数据对的个数(分别记为a、b、c和d),则可以计算Rand Index=((a+d)/(a+b+c+d))。
(1)MoCap数据集动作分类。
从MoCap数据集的4类动作数据中随机选择91个运动序列,每个动作类别平均包含23个运动序列,每个序列仅仅包含单一的动作类别,这些运动类别分别为boxing、walking、running和jumping。每个动作类别中的序列具有任意的运动风格,如图12所示的四个运动序列,它们都属于同一个动作类别boxing,但却具有不同的动作风格。
分别计算这91个运动序列的DTW距离矩阵Ddtw和有效性加权距离矩阵DW-dtw,采用层次聚类算法在不同的聚类数2到8下分别进行聚类,并根据聚类结果计算Rand Index值,如图13所示,横坐标为不同的聚类个数,纵坐标为Rand Index值。
Rand Index值越接近1,聚类算法得到分类结果与真实分类(人工分类)越吻合,因此由图13可知,基于有效性加权距离的层次聚类比基于传统DTW距离的层次聚类分类效果更好,这说明DTW-Curve更加适合动作的逻辑分类。
91个运动数据序列具有固定的a+b+c+d值(=4095)。当聚类数为4时,基于传统DTW距离的聚类算法得到的Rand Index为0.8166,其中a+d=3344。基于有效性加权距离的聚类算法得到的Rand Index为0.9639,其中a+d=3947。从以上数据可以得知,当聚类数为4时,基于有效性加权距离的聚类算法可以得到与人们主观分类非常接近的结果。
(2)IXMAS数据集动作分类。
从IXMAS数据集中选择5个动作类别,分别为kick、pick up、punch、walk和wave,每个动作类别包含36个运动序列,由于这36个序列由12个采集者每个动作重复3次得到的,因此同一类别的序列也具有不同的运动风格。
同前一实验类似,分别计算这180个运动序列的DTW距离矩阵Ddtw和有效性加权距离矩阵DW-dtw,采用层次聚类算法在不同的聚类数2到10下分别进行聚类,并根据聚类结果计算Rand Index值,如图14所示,横坐标为不同的聚类个数,纵坐标为Rand Index值。
由图14可知,基于有效性加权距离的层次聚类比基于传统DTW距离的层次聚类具有更好的分类效果,而且当聚类数等于5时,取得较大的Rand Index值0.8873,其中a+d=14295,a+b+c+d=16110。由于IXMAS库的点云数据由4个摄像机同步拍摄,相比于运动捕获数据,精度较低,因此Rand Index值整体略低。
本发明说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (2)

1.基于动态时间弯曲曲线的运动数据动作分类方法,其特征在于步骤如下:
(1)生成用于运动序列之间相似性度量的双向动态时间弯曲距离和分段动态时间弯曲距离,所述的生成双向动态时间弯曲距离的方法为:对于给定的两个运动序列P和Q,这两个序列的动态时间弯曲距离为Ddtw(P,Q),令序列P的翻转序列为Q′,且P和Q′之间的动态时间弯曲距离为Ddtw(P,Q′),则序列P和Q之间的双向动态时间弯曲距离定义为:DB-dtw(P,Q)=min{Ddtw(P,Q),Ddtw(P,Q′)};所述的生成分段动态时间弯曲距离的方法为:给定两个运动序列P和Q,将这两个运动序列根据距离矩阵D(P,Q)和阈值参数λ进行分段和选择相似性较高的运动片段,片段之间采用双向动态时间弯曲距离,则两个运动序列P和Q之间在阈值参数λ下的分段动态时间弯曲距离定义为选择运动片段的双向动态时间弯曲距离之和平均值的最小值;
所述将这两个运动序列根据距离矩阵D(P,Q)和阈值参数λ进行分段和选择相似性较高的运动片段为:两个运动序列经过数据对齐和局部帧聚类后形成的新序列表示为P和Q,构成距离矩阵D(P,Q),元素D(i,j)=||pi-qj||2表示序列P的第i帧与序列Q的第j帧的欧式距离,给定一个阈值参数λ∈[0,1],确定对应的阈值δ:
δ=(max(D(i,j))-min(D(i,j)))×λ+min(D(i,j))
距离矩阵D中所有大于该阈值δ的元素设置为0,其余元素设置为1,则由元素1可以形成多个8-连通域,每个8-连通域内的距离值都小于等于阈值,这意味着连通域所覆盖的两个运动序列片段较为相似,这些连通域涵盖了运动序列P和Q在阈值δ下所有相似性较高的运动片段;
(2)根据步骤(1)中的双向动态时间弯曲距离和分段动态时间弯曲距离生成动态时间弯曲曲线,并基于动态时间弯曲曲线生成有效性加权距离
Figure FSB00000696583900011
其中WEoLC为逻辑分类有效性曲线,Ds-dtw为分段动
态时间弯曲距离,λ为用于分段的阈值,P和Q为两个运动序列;
(3)根据步骤(2)得到有效性加权距离,采用层次聚类算法对运动序列进行动作分类。
2.根据权利要求1中所述的基于动态时间弯曲曲线的运动数据动作分类方法,其特征在于:所述步骤(2)中生成动态时间弯曲曲线的方法为:首先对运动序列进行预处理,包括数据对齐和局部帧聚类;然后在不同阈值λ下,计算分段动态时间弯曲距离,构成评价这两个运动序列相似性的动态时间弯曲曲线。
CN2008102411718A 2008-12-26 2008-12-26 基于dtw曲线的运动数据动作分类方法 Expired - Fee Related CN101477619B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008102411718A CN101477619B (zh) 2008-12-26 2008-12-26 基于dtw曲线的运动数据动作分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008102411718A CN101477619B (zh) 2008-12-26 2008-12-26 基于dtw曲线的运动数据动作分类方法

Publications (2)

Publication Number Publication Date
CN101477619A CN101477619A (zh) 2009-07-08
CN101477619B true CN101477619B (zh) 2012-05-23

Family

ID=40838328

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008102411718A Expired - Fee Related CN101477619B (zh) 2008-12-26 2008-12-26 基于dtw曲线的运动数据动作分类方法

Country Status (1)

Country Link
CN (1) CN101477619B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102122391B (zh) * 2010-12-13 2012-07-04 中国人民解放军国防科学技术大学 一种运动捕获数据自动分割方法
CN103970883B (zh) * 2014-05-20 2017-10-27 西安工业大学 基于对齐聚类分析的运动序列检索方法
CN104298964B (zh) * 2014-09-15 2017-08-11 燕山大学 一种人体行为动作快速识别方法及装置
CN106127125B (zh) * 2016-06-16 2019-04-02 山东大学 基于人体行为特征的分布式dtw人体行为识别方法
CN106777084B (zh) * 2016-12-13 2020-09-18 清华大学 针对光变曲线在线分析及异常报警的方法及系统
CN107451231A (zh) * 2017-07-24 2017-12-08 上海电力学院 基于相似性查询的示功图分类算法
US11720814B2 (en) 2017-12-29 2023-08-08 Samsung Electronics Co., Ltd. Method and system for classifying time-series data
CN111694331B (zh) * 2020-05-11 2021-11-02 杭州睿疆科技有限公司 生产工艺参数调整的系统、方法和计算机设备
CN112347869B (zh) * 2020-10-22 2023-02-14 燕山大学 一种基于特征点的白鼠探头动作定量描述方法
CN113313712B (zh) * 2021-07-30 2021-11-09 季华实验室 一种电池涂胶缺陷检测方法、装置、电子设备及存储介质
CN114330501B (zh) * 2021-12-01 2022-08-05 南京航空航天大学 一种基于动态时间规整的轨迹样式识别方法及设备
CN115100331A (zh) * 2022-06-28 2022-09-23 功夫动漫股份有限公司 一种个性化三维动漫的制作方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1705956A (zh) * 2002-10-29 2005-12-07 索尼株式会社 步态波形特征提取方法以及个人识别系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1705956A (zh) * 2002-10-29 2005-12-07 索尼株式会社 步态波形特征提取方法以及个人识别系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Eamonn J.Keogh,Michael J.Pazzani.Scaling up dynamic time warping for datamining applications.<Proceedings of the sixth ACM SIGKDD international conference on Knowledge discovery and data mining>.ACM,2000,285-289. *
刘江华 等.基于光流的动态手势识别.《计算机工程》.2002,第28卷(第4期), *

Also Published As

Publication number Publication date
CN101477619A (zh) 2009-07-08

Similar Documents

Publication Publication Date Title
CN101477619B (zh) 基于dtw曲线的运动数据动作分类方法
Zhang et al. Human action recognition using convolutional LSTM and fully-connected LSTM with different attentions
CN101763515A (zh) 一种基于计算机视觉的实时手势交互方法
CN105206041B (zh) 一种考虑时序dbscan的智能手机轨迹链簇识别方法
Chu et al. Multi-task vehicle detection with region-of-interest voting
CN102496013B (zh) 用于脱机手写汉字识别的汉字字符切分方法
CN105279966B (zh) 一种校园交通的拥堵识别方法
CN107330362A (zh) 一种基于时空注意力的视频分类方法
CN108509978A (zh) 基于cnn的多级特征融合的多类目标检测方法及模型
CN104537673B (zh) 基于多阈值和自适应模糊聚类的红外图像分割方法
CN105760888B (zh) 一种基于属性聚类的邻域粗糙集集成学习方法
CN102270308B (zh) 一种基于五官相关aam模型的面部特征定位方法
CN103020614B (zh) 基于时空兴趣点检测的人体运动识别方法
CN103605362A (zh) 基于车辆轨迹多特征的运动模式学习及异常检测方法
CN105046195A (zh) 基于非对称广义高斯模型的人体行为识别方法
CN102254183B (zh) 一种基于AdaBoost算法的人脸检测方法
CN105913296A (zh) 一种基于图的个性化推荐方法
CN101216882A (zh) 一种人脸眼角与嘴角定位与跟踪的方法及装置
CN104461000B (zh) 一种基于少量缺失信号的在线连续人体运动识别方法
CN101719220A (zh) 基于有向截尾均值距离的轨迹聚类方法
CN110222712B (zh) 一种基于深度学习的多专项目标检测算法
CN110188710B (zh) 列车驾驶员动态行为识别方法
CN107169117A (zh) 一种基于自动编码器和dtw的手绘图人体运动检索方法
CN106250909A (zh) 一种基于改进视觉词袋模型的图像分类方法
CN110446112A (zh) 基于双向LSTM-Attention的IPTV用户体验预测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120523

Termination date: 20141226

EXPY Termination of patent right or utility model