CN113591726A

CN113591726A - 一种太极拳训练动作的交叉模态评估方法

Info

Publication number: CN113591726A
Application number: CN202110884652.6A
Authority: CN
Inventors: 李巧勤; 戴志豪; 刘勇国; 朱嘉静; 张云; 杨尚明
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2021-08-03
Filing date: 2021-08-03
Publication date: 2021-11-02
Anticipated expiration: 2041-08-03
Also published as: LU501883B1; CN113591726B

Abstract

本发明公开了一种太极拳训练动作的交叉模态评估方法，对存在非线性关系的原始太极拳训练动作跨模态序列配准问题，本发明提出将视频序列与动作捕捉序列对齐的方法。对于不同长度和维度的太极拳运动序列进行去噪和重构恢复，然后进行分阶段时空配准，解决不同主体之间的运动差异，实现跨模态太极拳长序列的时空对齐，提高太极拳运动招式完成度评价准确度。

Description

一种太极拳训练动作的交叉模态评估方法

技术领域

本发明属于运动训练技术领域，具体涉及一种太极拳训练动作的交叉模态评估方法。

背景技术

太极拳是中国武术的一种形式，其中最具代表性的是简化24式，长期训练可以强身健体。交互式训练场景中需要对训练效果进行评价，而太极拳的一个显著特征是姿势之间缓慢而无缝的过渡，且不同的人和学习阶段可能会带来时间和动作上的差异性，这给基于分割的招式识别和配准方法带来了困难。每个对象的表现都有时间上的变化，从而导致捕获数据出现非线性的时间差异。由于不同的技能水平、身高、体重及步态等差异，对象和对象间配对都需要非线性转换才能进行时间对齐。线性映射可以提供合理的初始时间对齐方式，并可以在后续阶段进行完善，所以对不同长度和维度的数据进行时空对齐显得格外重要。

常用时间映射方法主要包括动态时间规整(Dynamic Time Warping,DTW)、典型时间规整(Canonical Time Warping,CTW)和广义典型时间规整(Generalized CanonicalTime Warping,GCTW)等。有研究以人体关节角度消除太极拳视频背景的干扰和不同太极拳视频中人体大小的不同影响，利用DTW算法对不同时间点的视频帧进行配准，但要求配准序列维度一致。CTW算法则将DTW和典型相关性分析(CCA)相结合，在对齐不同尺寸信号时执行特征选择和降维。GCTW算法扩展了CTW，用于处理两个以上视角的场景数据序列，使用高斯牛顿法求解配准矩阵。常用的空间对齐方法PnP(perspective-n-point)用于求解相机位姿、旋转和位置，常用于AR、相机位置跟踪等领域。

DTW要求数据有相同维度，不能用于多模态数据。此外，DTW采用动态规划来求解配准矩阵，时间复杂度是序列长度的二次方。GCTW与CTW都利用了浅层表达学习方法，基于原始图片的线性投影选取特征表达，但其非线性表达能力有限，尤其是原始数据存在非线性关系和局部几何结构时性能欠佳，且对多模态数据特征考虑不足。而常用的相机位姿估计方法PnP对于同时刻同一对象的视频记录处理能力好，但是对于不同对象和不同时间的相机位姿估计效果较差。

发明内容

针对现有技术中的上述不足，本发明提供的一种太极拳训练动作的交叉模态评估方法提高太极拳运动招式完成度评价准确度。

为了达到上述发明目的，本发明采用的技术方案为：一种太极拳训练动作的交叉模态评估方法，包括以下步骤：

S1、太极运动过程中，采集Mocap数据和视频数据；

S2、对采集的Mocap数据进行预处理，生成新的Mocap数据；

S3、对采集的视频数据进行聚类处理，生成视频数据的代表性帧；

S4、基于新的Mocap数据和视频数据的代表性帧，进行时空交错对齐，得到对齐好的太极拳Mocap标准数据序列A和运动视频序列B；

S5、基于对齐好的太极拳Mocap标准数据序列A和运动视频序列B，进行太极拳训练动作评估。

进一步地：所述步骤S2分为以下分步骤：

S21、对采集的Mocap数据进行降噪处理，生成降噪后的运动捕捉序列帧矩阵G＝[g₁，g₂，...，g_N]^T；

其中，N为运动捕捉序列帧矩阵的矩阵分量总数；

S22、通过模糊均值聚类算法将降噪后的运动捕捉序列帧矩阵G＝[g₁，g₂，...，g_N]^T分为多个不同语义的运动片段序列；

S23、通过低秩矩阵补全算法将多个不同语义的运动片段序列进行数据恢复，获得新的Mocap数据。

上述进一步方案的有益效果为：本发明首先对数据进行去噪和缺失数据重构，可以充分挖掘人体运动数据内在信息。

进一步地：所述步骤S21包括以下分步骤：

S21-1、利用有序子空间聚类算法对Mocap数据进行分割，并构造矩阵M；

其中，矩阵

表示N行N-1列的矩阵，其表达式为：

S21-2、根据矩阵M和Mocap数据的系数矩阵Z，确定矩阵ZM；

其中，系数矩阵

S21-3、对矩阵ZM构建惩罚项最小化的l_1，2范数，获得降噪后的运动捕捉序列帧矩阵G＝[g₁，g₂，...，g_N]^T；

其中，对矩阵ZM构建惩罚项最小化的l_1，2范数的目标函数为：

式中，E为噪声信号，λ₁，λ₂是惩罚系数，F为约束范数，K为采集的Mocap数据构成的矩阵。

上述进一步方案的有益效果为：本发明对太极拳运动序列去噪，提高了重构恢复后的运动数据序列的还原度，有助于太极拳运动招式的评估。

进一步地：所述步骤S22中的模糊均值聚类算法具体为：

S22-1、通过第一公式计算运动捕捉序列帧矩阵G当前的第一聚类中心c_i；

其中，第一公式具体为：

式中，u_ij∈(0，1)是第j个运动捕捉序列帧矩阵分量的隶属度函数，且其为隶属矩阵U中的元素，i＝1，2，...，V，V为聚类中心的总数；g_j为第j个运动捕捉序列帧矩阵分量，j＝1，2，...，N，N为运动捕捉序列帧矩阵分量的总数；t为加权指数，其中t＞＝1；

S22-2、基于计算的第一聚类中心c_i，计算当前价值函数，其具体为：

式中，U是隶属矩阵，d_ij＝||c_i-g_j||是第i个第一聚类中心与第j个运动捕捉序列帧矩阵分量之间的欧氏距离；

S22-3、判断当前价值函数的值是否小于设定阈值或其与上一次价值函数的值之差是否小于设定阈值；

若是，则进入步骤S22-5；

若否，则进入步骤S22-4；

S22-4、通过第二公式计算新的隶属矩阵U，并返回步骤S22-1；

其中，第二公式具体为：

S22-5、停止模糊均值聚类算法，将通过价值函数生成的多个模糊组，作为分段处理后的运动片段序列。

上述进一步方案的有益效果为：通过模糊均值聚类分段处理后的片段运动数据低秩性更好，可以通过该特性来重构恢复缺失元素。

进一步地：所述步骤S23具体为：

S23-1、对多个不同语义的运动片段序列使用低秩矩阵补全算法进行数据恢复，获得恢复后的数据；

其中，低秩矩阵补全算法的表达式具体为：

式中，H为不同语义的运动片段序列，β为调整参数，

为平滑约束项，

表示运动片段序列H在Hilbert空间中的隐式映射，rank(*)为求秩函数，O是N×N矩阵，定义如下：

S23-2、将降噪后的运动捕捉序列帧矩阵与恢复后的数据进行置换，生成新的Mocap数据；

其中，新的Mocap数据为X＝[x₁，x₂，...，x_N]^T。

上述进一步方案的有益效果为：本发明基于核学习的低秩矩阵补全模型，进行缺失运动数据重构恢复，使得重构数据接近真实运动轨迹。

进一步地：所述步骤S3具体为：对采集的视频数据进行聚类处理，生成第二聚类中心，选取距离第二聚类中心距离最短的帧作为代表性帧；其距离计算公式d(Y₁，Y₂)具体为：

d(Y₁，Y₂)＝(Y₁-Y₂)(Y₁-Y₂)^T

式中，Y₁和Y₂均为视频数据的运动描述符。

上述进一步方案的有益效果为：本发明通过对视频数据使用模糊均值聚类算法进行处理，有助于三维运动捕捉关节被投影并与视频数据的二维关节空间对齐，提高了太极拳运动招式完成度评价准确度。

进一步地：所述步骤S4包括以下分步骤：

S41、基于Mocap数据的采样时间指数和视频数据的采样时间指数，通过线性映射公式进行全局时间对齐，获得时间规整数据；

其中，线性映射公式具体为：

t_video＝a*t_mocap+b

式中，t_mocap为Mocap数据的采样时间指数，t_video为视频数据的采样时间指数；b为时间偏移，a为时间尺度；

S42、基于时间规整数据，更新当前的帧映射关系，对三维运动捕捉关节点和二维关节点使用相机投影模型进行全局空间对齐，并通过吉布斯似然函数计算相机姿态；

其中，吉布斯似然函数表达式具体为：

式中，P_q为3D点，p_q为2D点，q＝1，2，...，Q，Q为三维运动捕捉关节点或二维关节点的总数，3D点属于三维运动捕捉关节点，2D点属于二维关节点；θ为已知的内部摄像机参数，(R，c)是相机姿态，D为衡量2D点之间的距离，相机投影模型Φ(P_q|R，c，θ)将3D点P_q投影到2D点；

S43、基于新的Mocap数据和代表性帧，通过边缘栈式深度时间规整算法进行局部时间对齐，获得新的时间规整数据；

其中，边缘栈式深度时间规整算法的表达式J(θ_x，θ_y，T_x，T_y)具体为：

式中，T_x和T_y均为指定时间规整的分量矩阵，γ为正则项的惩罚因子，ω为指定时间配准矩阵正则项，v是惩罚常数，ψ(X)和ψ(Y)分别为新的Mocap数据X和代表性帧Y的投影矩阵的重构表达，f(X；θ_x)为用于训练新的Mocap数据X的神经网络最后一层的激活函数，g(Y；θ_y)为为用于训练代表性帧Y的神经网络最后一层的激活函数，θ_x和θ_y，为网络参数；

S44、基于获得新的时间规整数据，判断相机姿态(R，c)是否收敛；

若相机姿态(R，c)收敛，则进入步骤S45；

若相机姿态(R，c)不收敛，则返回步骤S42；

S45、基于收敛的相机姿态(R，c)下的对齐后的2D点与真实点的平移偏移，通过局部空间对齐计算每个2D点对真实点的额外平移偏移，计算后取误差中值，并通过该误差中值调整2D点位置，得到对齐好的太极拳Mocap标准数据序列A和运动视频序列B。

上述进一步方案的有益效果为：采用全局时间对齐和全局空间对齐的方法，充分考虑了数据形式的嵌入复杂性，有效提高了跨模态数据配准的准确率，有效提高太极拳运动序列评估结果。

进一步地：所述步骤S5包括以下分步骤：

S51、基于太极拳Mocap标准数据序列A和运动视频序列B，通过人体关节角度差异公式计算角度特征距离；

其中，人体关节角度差异公式具体为：

式中，D_Angle(A，B)为角度特征距离，B_m为运动视频序列B中的第m帧，B′_m为在太极拳Mocap标准数据序列A中与B_m帧对应的帧，

为第m帧的关节角度函数；k为Mocap标准数据序列A或运动视频序列B中帧的总数；

S52、基于太极拳Mocap标准数据序列A和运动视频序列B，通过人体关节运动速度差异公式计算速度特征距离；

其中，人体关节运动速度差异公式具体为：

式中，D_Speed(A，B)为速度特征距离；

为关节速度函数；

S53、基于角度特征距离和速度特征距离，通过距离值映射公式，分别计算对应的距离值映射得分；

其中，距离值映射得分的计算公式具体为：

S＝α(D-τ)

式中，D为速度特征距离或者角度特征距离，α和τ为给定的映射参数，S为距离值映射得分；

S54、将角度特征距离的映射值得分和速度特征距离的映射值得分之和的平均值，作为运动视频序列B的评估得分，完成太极拳训练动作的评估。

上述进一步方案的有益效果为：本发明对配准后的太极拳运动序列通过计算角度和速度距离差异进行评估，提高了评估的准确度。

本发明的有益效果为：

(1)针对运动数据缺失问题，本发明结合模糊聚类和基于核学习的低秩矩阵补全模型，进行缺失运动数据重构恢复，使得重构数据接近真实运动轨迹。

(2)本发明采用显性非线性函数来挖掘数据集中的非线性结构，提出了边缘栈式深度时间规整(Margin Stacked Deep Canonical Time Warping，MSDCTW)算法，在DCTW基础上加入了边缘自编码正则化项，以自编码约束项来增强每个序列数据低维表达的重构能力，减少信息的损失，对多模态序列进行时间对齐。

(3)对配准后的太极拳运动序列通过计算角度和速度距离差异进行评估。

附图说明

图1为本发明的方法流程图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

如图1所示，在本发明的一个实施例中，一种太极拳训练动作的交叉模态评估方法，包括以下步骤：

S1、太极运动过程中，采集Mocap数据和视频数据；

S2、对采集的Mocap数据进行预处理，生成新的Mocap数据；

S4、基于新的Mocap数据和视频数据的代表性帧，进行时空交错对齐，得到太极拳Mocap标准数据序列A和运动视频序列B；

S5、基于太极拳Mocap标准数据序列A和运动视频序列B，进行太极拳训练动作评估。

所述步骤S1中，Mocap数据由Vicon Nexus动作捕捉系统采集，Vicon Nexus动作捕捉系统由Nexus软件和12个红外相机组成，采样率为100HZ，Vicon Nexus运动捕获系统提取太极运动过程中精确的关节位置信息，提取的Mocap数据包含12个标记的人体三维关节位置，关节位置精度小于0.5mm；视频数据由独立Sony XV2100 720x480 DV相机采集，其记录速度为30FPS，记录的视频数据可以来自未知相机，如网络上下载的太极拳视频。

所述步骤S2分为以下分步骤：

其中，N为运动捕捉序列帧矩阵的矩阵分量总数；

在步骤S21中，将采集的Mocap数据表示为数据矩阵

其中P是每个样本点的维数，N表示样本点个数。利用样本自表达性质，即用样本本身重构数据，使得K＝KZ，其中

为系数矩阵，考虑Mocap数据的连续性，利用有序子空间聚类(Ordered Subspace Clustering，OSC)算法对Mocap数据进行分割，进而对其进行降噪处理，因此，上述步骤S21具体为：

其中，矩阵

表示N行N-1列的矩阵，其表达式为：

S21-2、根据矩阵M和Mocap数据的系数矩阵Z，确定矩阵ZM；

其中，系数矩阵

S21-3、对矩阵ZM构建惩罚项最小化的1_1，2范数，获得降噪后的运动捕捉序列帧矩阵G＝[g₁，g₂，...，g_N]^T；

在构造l_1，2范数时，将含有噪声的数据矩阵K用字典里的原子进行线性逼近，并用F范数进行约束，去除数据矩阵K中的噪声信号。

所述步骤S22中的模糊均值聚类算法具体为：

其中，第一公式具体为：

若是，则进入步骤S22-5；

若否，则进入步骤S22-4；

S22-4、通过第二公式计算新的隶属矩阵U，并返回步骤S22-1；

其中，第二公式具体为：

通过模糊均值聚类分段处理后的片段运动数据低秩性更好，可以通过该特性来重构恢复缺失元素

所述步骤S23具体为：

其中，低秩矩阵补全算法的表达式具体为：

式中，H为不同语义的运动片段序列，β为调整参数，

为平滑约束项，

其中，新的Mocap数据为X＝[x₁，x₂，...，x_N]^T。

本发明基于核学习的低秩矩阵补全模型，进行缺失运动数据重构恢复，使得重构数据接近真实运动轨迹。

所述步骤S3具体为：对采集的视频数据进行聚类处理，生成第二聚类中心，选取距离第二聚类中心距离最短的帧作为代表性帧；其距离计算公式d(Y₁，Y₂)具体为：

d(Y₁，Y₂)＝(Y₁-Y₂)(Y₁-Y₂)^T

式中，Y₁和Y₂均为视频数据的运动描述符。

所述步骤S4包括以下分步骤：

其中，线性映射公式具体为：

t_video＝a*t_mocap+b

其中，吉布斯似然函数表达式具体为：

若相机姿态(R，c)收敛，则进入步骤S45；

若相机姿态(R，c)不收敛，则返回步骤S42；

所述真实点属于三维运动捕捉关节点。

所述步骤S5包括以下分步骤：

其中，人体关节角度差异公式具体为：

其中，人体关节运动速度差异公式具体为：

式中，D_Speed(A，B)为速度特征距离；

为关节速度函数；

其中，距离值映射得分的计算公式具体为：

S＝α(D-τ)

本发明通过Vicon Nexus动作捕捉系统采集太极运动过程的Mocap数据，通过独立Sony XV2100 720x480 DV相机采集视频数据；采用有序子空间聚类算法对Mocap数据进行分割，生成降噪后的运动捕捉序列帧矩阵，并利用模糊均值聚类算法生成运动片段序列，将所述去噪后的运动捕捉序列帧矩阵与所述恢复后的数据进行置换，实现整体运动捕捉数据重构，生成新的Mocap数据；根据采集的视频数据，通过模糊均值聚类算法进行处理，并选取距离聚类中心距离最短的帧作为代表性帧；采用Vicon Nexus运动捕获系统提取太极运动过程中精确的三维关节数据，并使用OpenPose实现实时的2D人体姿态估计和二维关节数据检测并提取；

基于视频数据和Mocap数据的采样频率，进行全局时间对齐；将三维关节数据投影到二维关节数据进行空间对齐；基于运动数据序列和代表性帧，通过边缘栈式深度时间规整算法进行局部时间对齐，再执行全局空间对齐以重新估计摄像机姿态，通过马尔可夫链蒙特卡罗(MCMC)的摄像机姿态估计算法进行多次迭代，得到对齐的太极拳Mocap标准数据序列A和运动视频序列B；根据太极拳Mocap标准数据序列A和运动视频序列B，通过计算人体关节角度差异和人体关节运动速度差，将结果带入映射表达式，计算出结果取平均值，将最后得到的值作为评分结果，完成太极拳运动招式的评估。

本发明的有益效果为：

针对运动数据缺失问题,本发明结合模糊聚类和基于核学习的低秩矩阵补全模型，进行缺失运动数据重构恢复，使得重构数据接近真实运动轨迹。

本发明采用显性非线性函数来挖掘数据集中的非线性结构，提出了边缘栈式深度时间规整(Margin Stacked Deep Canonical Time Warping，MSDCTW)算法，在DCTW基础上加入了边缘自编码正则化项，以自编码约束项来增强每个序列数据低维表达的重构能力，减少信息的损失，对多模态序列进行时间对齐，对配准后的太极拳运动序列通过计算角度和速度距离差异进行评估。

在本发明的描述中，需要理解的是，术语“中心”、“厚度”、“上”、“下”、“水平”、“顶”、“底”、“内”、“外”、“径向”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性或隐含指明的技术特征的数量。因此，限定由“第一”、“第二”、“第三”的特征可以明示或隐含地包括一个或者更多个该特征。

Claims

1.一种太极拳训练动作的交叉模态评估方法，其特征在于，包括以下步骤：

S1、太极运动过程中，采集Mocap数据和视频数据；

S2、对采集的Mocap数据进行预处理，生成新的Mocap数据；

2.根据权利要求1所述的太极拳训练动作的交叉模态评估方法，其特征在于，所述步骤S2分为以下分步骤：

S21、对采集的Mocap数据进行降噪处理，生成降噪后的运动捕捉序列帧矩阵G＝[g₁,g₂,…,g_N]^T；

其中，N为运动捕捉序列帧矩阵的矩阵分量总数；

S22、通过模糊均值聚类算法将降噪后的运动捕捉序列帧矩阵G＝[g₁,g₂,…,g_N]^T分为多个不同语义的运动片段序列；

3.根据权利要求2所述的太极拳训练动作的交叉模态评估方法，其特征在于，所述步骤S21包括以下分步骤：

其中，矩阵

表示N行N－1列的矩阵，其表达式为：

S21-2、根据矩阵M和Mocap数据的系数矩阵Z，确定矩阵ZM；

其中，系数矩阵

S21-3、对矩阵ZM构建惩罚项最小化的l_1,2范数，获得降噪后的运动捕捉序列帧矩阵G＝[g₁,g₂,…,g_N]^T；

其中，对矩阵ZM构建惩罚项最小化的l_1,2范数的目标函数为：

式中，E为噪声信号，λ₁,λ₂是惩罚系数，F为约束范数，K为采集的Mocap数据构成的矩阵。

4.根据权利要求2所述的太极拳训练动作的交叉模态评估方法，其特征在于，所述步骤S22中的模糊均值聚类算法具体为：

其中，第一公式具体为：

式中，u_ij∈(0,1)是第j个运动捕捉序列帧矩阵分量的隶属度函数，且其为隶属矩阵U中的元素，i＝1,2,…,V，V为聚类中心的总数；g_j为第j个运动捕捉序列帧矩阵分量，j＝1,2,…,N，N为运动捕捉序列帧矩阵分量的总数；t为加权指数，其中t>＝1；

若是，则进入步骤S22-5；

若否，则进入步骤S22-4；

S22-4、通过第二公式计算新的隶属矩阵U，并返回步骤S22-1；

其中，第二公式具体为：

5.根据权利要求2所述的太极拳训练动作的交叉模态评估方法，其特征在于，所述步骤S23具体为：

其中，低秩矩阵补全算法的表达式具体为：

式中，H为不同语义的运动片段序列，β为调整参数，

为平滑约束项，

其中，新的Mocap数据为X＝[x₁,x₂,…,x_N]^T。

6.根据权利要求1所述的太极拳训练动作的交叉模态评估方法，其特征在于，所述步骤S3具体为：对采集的视频数据进行聚类处理，生成第二聚类中心，选取距离第二聚类中心距离最短的帧作为代表性帧；其距离计算公式d(Y₁,Y₂)具体为：

d(Y₁,Y₂)＝(Y₁-Y₂)(Y₁-Y₂)^T

式中，Y₁和Y₂均为视频数据的运动描述符。

7.根据权利要求1所述的太极拳训练动作的交叉模态评估方法，其特征在于，所述步骤S4包括以下分步骤：

其中，线性映射公式具体为：

t_video＝a*t_mocap+b

其中，吉布斯似然函数表达式具体为：

式中，P_q为3D点，p_q为2D点，q＝1,2,…,Q，Q为三维运动捕捉关节点或二维关节点的总数，3D点属于三维运动捕捉关节点，2D点属于二维关节点；θ为已知的内部摄像机参数，(R,c)是相机姿态，D为衡量2D点之间的距离，相机投影模型Φ(P_q|R,c,θ)将3D点P_q投影到2D点；

其中，边缘栈式深度时间规整算法的表达式J(θ_x,θ_y,T_x,T_y)具体为：

式中，T_x和T_y均为指定时间规整的分量矩阵，γ为正则项的惩罚因子，ω为指定时间配准矩阵正则项，v是惩罚常数，ψ(X)和ψ(Y)分别为新的Mocap数据X和代表性帧Y的投影矩阵的重构表达，f(X；θ_x)为用于训练新的Mocap数据X的神经网络最后一层的激活函数，g(Y；θ_y)为为用于训练代表性帧Y的神经网络最后一层的激活函数，θ_x和θ_y,为网络参数；

S44、基于获得新的时间规整数据，判断相机姿态(R,c)是否收敛；

若相机姿态(R,c)收敛，则进入步骤S45；

若相机姿态(R,c)不收敛，则返回步骤S42；

S45、基于收敛的相机姿态(R,c)下的对齐后的2D点与真实点的平移偏移，通过局部空间对齐计算每个2D点对真实点的额外平移偏移，计算后取误差中值，并通过该误差中值调整2D点位置，得到对齐好的太极拳Mocap标准数据序列A和运动视频序列B。

8.根据权利要求1所述的太极拳训练动作的交叉模态评估方法，其特征在于，所述步骤S5包括以下分步骤：

其中，人体关节角度差异公式具体为：

式中，D_Angle(A,B)为角度特征距离，B_m为运动视频序列B中的第m帧，B′_m为在太极拳Mocap标准数据序列A中与B_m帧对应的帧，

其中，人体关节运动速度差异公式具体为：

式中，D_Speed(A,B)为速度特征距离；

为关节速度函数；

其中，距离值映射得分的计算公式具体为：

S＝α(D-τ)