CN116434339B

CN116434339B - 基于骨架数据时空特征差异性和相关性的行为识别方法

Info

Publication number: CN116434339B
Application number: CN202310399333.5A
Authority: CN
Inventors: 蒋敏; 卿入心; 孔军
Original assignee: Jiangnan University
Current assignee: Jiangnan University
Priority date: 2023-04-13
Filing date: 2023-04-13
Publication date: 2023-10-27
Anticipated expiration: 2043-04-13
Also published as: CN116434339A

Abstract

本申请公开了一种基于骨架数据时空特征差异性和相关性的行为识别方法，涉及计算机视觉领域，该方法搭建的行为识别模块中包含空间图卷积模块和时间图卷积模块，空间图卷积模块包括时间特征学习单元、通道特征学习单元和时间通道上下文拓扑单元，时间特征学习单元和通道特征学习单元用于分别独立地学习时间帧维度和通道维度中关节之间的特征差异性和特征相关性，学习协同完成动作的关节之间特征的相关性，也学习因为运动发生而发生变化部分关节的特征差异性，时间通道上下文拓扑单元学习所有关节的全局上下文特征信息，获取更多具有判别性的特征，融合后可以更有效地人体行为识别。

Description

基于骨架数据时空特征差异性和相关性的行为识别方法

技术领域

本申请涉及计算机视觉领域，尤其是一种基于骨架数据时空特征差异性和相关性的行为识别方法。

背景技术

人体的骨架数据是一种自然的拓扑数据结构，能够更好地反映时空信息和人体运动特征，因此基于人体的骨架数据的行为识别近年来受到越来越多的关注和研究。

传统方法利用卷积神经网络CNNs-based的方法和基于循环神经网络RNNs-based的方法来基于骨架数据进行行为识别，识别效果较差。图卷积网络GCNs在任意图结构上都具有良好的性能，因此更多的学者将其用于基于骨架数据的行为识别，Yan等人首次提出ST-GCN，即Spatial-Temporal GCN将GCN应用于基于骨架数据的行为识别，相较于传统方法有一定的性能提升。但是由于骨架数据较为特殊，有一些没有物理连接的关节部分对行为识别有很强的影响，还有一些关节对行为识别的作用又较弱，所以即便是ST-GCN的行为识别的效果也不够理想。

发明内容

本申请人针对上述问题及技术需求，提出了一种基于骨架数据时空特征差异性和相关性的行为识别方法，本申请的技术方案如下：

一种基于骨架数据时空特征差异性和相关性的行为识别方法，该行为识别方法包括：

对多种行为动作的共N×M组样本骨架数据进行特征提取，得到每组样本骨架数据的骨架特征序列数据，每组样本骨架数据的骨架特征序列数据包括C个通道，每个通道包括所有V个关节在连续T个时间帧的关节骨骼特征数据；

将每组样本骨架数据的骨架特征序列数据作为行为识别模型的输入、样本骨架数据对应的行为动作作为行为识别模型的输出，利用所有样本骨架数据的骨架特征序列数据训练行为识别模型；

提取待识别的骨架数据的骨架特征序列数据并输入训练得到的行为识别模型，输出识别得到的行为动作；

其中，行为识别模型包括依次连接的空间图卷积模块、时间图卷积模块和分类模块，空间图卷积模块包括时间特征学习单元、通道特征学习单元和时间通道上下文拓扑单元，时间特征学习单元用于在时间帧维度学习输入的骨架特征序列数据的特征差异性和特征相关性得到特征Y^TFDCL，通道特征学习单元用于在通道维度学习输入的骨架特征序列数据的特征差异性和特征相关性得到特征Y^CFDCL，时间通道上下文拓扑单元用于动态学习输入的骨架特征序列数据的全局上下文特征得到特征Y^TCCT，空间图卷积模块输出对特征Y^TFDCL、特征Y^CFDCL和特征Y^TCCT融合后的空间特征Y；时间图卷积模块对空间特征Y提取时间特征信息后输入分类模块进行分类，输出识别得到的行为动作。

本申请的有益技术效果是：

本申请公开了一种基于骨架数据时空特征差异性和相关性的行为识别方法，该方法分别独立地学习时间帧维度和通道维度中关节之间的特征差异性和特征相关性，学习协同完成动作的关节之间特征的相关性，也学习因为运动发生而发生变化部分关节的特征差异性，且考虑到所有关节都参与了保持运动进程和身体平衡，重点加强在样本动作中具有高影响力的关节特征，并学习所有关节的全局上下文特征信息，获取更多具有判别性的特征，从而可以更有效地人体行为识别。

附图说明

图1是本申请一个实施例的行为识别方法的方法流程图。

图2是本申请一个实施例搭建的行为识别模型的网络结构图。

图3是本申请一个实施例中的空间图卷积模型的网络结构图。

图4是本申请一个实施例中的时间图卷积模块的网络结构图。

具体实施方式

下面结合附图对本申请的具体实施方式做进一步说明。

本申请公开了一种基于骨架数据时空特征差异性和相关性的行为识别方法，请参考图1所示的流程图，该行为识别方法包括如下步骤：

步骤S1，对多种行为动作的共N×M组样本骨架数据进行特征提取，得到每组样本骨架数据的骨架特征序列数据，N和M分别为参数，在常规应用中，一般以N表示样本骨架数据的批量数，M表示每个批量中包含的人体的数量。

通过姿态估算算法在人体的行为动作的视频中的各个时间帧提取关节点，即能得到一组样本骨架数据。采集各组样本骨架数据的数据形式包括深度信息、3D骨架信息、RGB帧以及红外序列。

对每组样本骨架数据提取到的骨架特征序列数据包括C个通道，每个通道包括所有V个关节在连续T个时间帧的关节骨骼特征数据，因此提取得到的每组样本骨架数据的骨架特征序列数据不同通道包含不同类型的动作特征，常见的关节骨骼特征数据一般以三维坐标系中的坐标来表示，则三个通道分别对应三维坐标系中的三个坐标轴，每个通道的关节骨骼特征数据是对应的一个坐标轴的坐标数据。

在一个实施例中，提取得到的每组样本骨架数据包括多种类型的骨架特征序列数据，包括关节特征序列数据、骨骼特征序列数据、关节运动特征序列数据和骨骼运动特征序列数据，分别介绍如下：

(1)提取样本骨架数据的任意一个通道中任意一个关节在每个时间帧上的坐标数据得到关节特征序列数据。比如任意关节i在时间帧t的三维坐标分别为(x_i,t,y_i,t,z_i,t)，三维坐标中的每个坐标数据分别对应一个通道。

(2)提取样本骨架数据的任意一个通道中任意一段骨骼在每个时间帧上的向量数据得到骨骼特征序列数据，每段骨骼的向量数据是骨骼的靠近人体骨架重心的源关节指向远离人体骨架重心的目标关节的向量。

比如任意骨骼e_i,j的源关节为关节i且在时间帧t的三维坐标为(x_i,t,y_i,t,z_i,t)，该骨骼e_i,j的目标关节为关节j且在时间帧t的三维坐标为(x_j,t,y_j,t,z_j,t)，则该骨骼e_i,j在时间帧t的向量数据为(x_j,t-x_i,t,y_j,t-y_i,t,z_j,t-z_i,t)，三维坐标中的每个坐标数据分别对应一个通道。

(3)提取样本骨架数据的任意一个通道中任意一个关节在任意一个时间帧上的坐标数据至关节在同一个通道的下一个时间帧上的坐标数据的移动向量，得到关节运动特征序列数据。

比如任意关节i在时间帧t的三维坐标分别为(x_i,t,y_i,t,z_i,t)，三维坐标中的每个坐标数据分别对应一个通道，该关节i在时间帧t+1的三维坐标为(x_i,t+1,y_i,t+1,z_i,t+1)，则该关节i在时间帧t的至时间帧t+1的移动向量为(x_i,t+1-x_i,t,y_i,t+1-y_i,t,z_i,t+1-z_i,t)，移动向量的三维坐标中的每个坐标数据分别对应一个通道。

(4)提取样本骨架数据的任意一个通道中任意一段骨骼在任意一个时间帧上的向量数据至骨骼在同一个通道的下一个时间帧上的向量数据的移动向量，得到骨骼运动特征序列数据。

比如骨骼e_i,j在时间帧t的向量数据e_i,j(t)＝(x_j,t-x_i,t,y_j,t-y_i,t,z_j,t-z_i,t)，该骨骼e_i,j在时间帧t+1的向量数据为e_i,j(t+1)＝(x_j,t+1-x_i,t+1,y_j,t+1-y_i,t+1,z_j,t+1-z_i,t+1)，则骨骼e_i,j在时间帧t的至时间帧t+1的移动向量为e_i,j(t+1)-e_i,j(t)，同样的，得到的移动向量的三维坐标中的每个坐标数据分别对应一个通道。

步骤S2，搭建行为识别模型的模型结构，步骤S2和步骤S1没有特定的执行先后关系。

搭建的行为识别模型包括依次连接的空间图卷积模块、时间图卷积模块和分类模块，在一个实施例中，行为识别模型包括依次连接的多个自适应图卷积块，最后一个自适应图卷积块的输出连接分类模块，每个自适应图卷积块中包括依次连接的空间图卷积模块和时间图卷积模块。搭建的每个空间图卷积模块包括时间特征学习单元TFDCL、通道特征学习单元CFDCL和时间通道上下文拓扑单元TCCT。

在实际实现时，每个自适应图卷积块中，空间图卷积模块后还依次连接批标准化层BN和校正激活单元Relu，并经过Dropout层连接时间图卷积模块，时间图卷积模块后还依次连接批标准化层BN以及校正激活单元Relu。为了稳定训练，每个自适应图卷积块中还添加有残差连接，也即输入到每个自适应图卷积块的数据与待输出的数据进行残差连接。依次连接的多个自适应图卷积块的通道数逐渐增大，比如在一个实例中，行为识别模型包括依次连接的10个自适应图卷积块，10个自适应图卷积块的通道数分别为64,64,64,64,128,128,128,256,256,256，在第5个自适应图卷积块和第8个自适应图卷积块的时间图卷积模块中卷积操作步长为2，减少一半的卷积操作也减少一半的特征。分类模块包括依次连接的全局平均池化层(Global Average Pooling，GAP)和Softmax分类器。

步骤S3，将每组样本骨架数据的骨架特征序列数据F作为行为识别模型的输入、样本骨架数据对应的行为动作作为行为识别模型的输出，利用所有样本骨架数据的骨架特征序列数据训练行为识别模型。

时间特征学习单元TFDCL用于在时间帧维度学习输入的骨架特征序列数据F的特征差异性和特征相关性得到特征Y^TFDCL。通道特征学习单元CFDCL用于在通道维度学习输入的骨架特征序列数据F的特征差异性和特征相关性得到特征Y^CFDCL。时间通道上下文拓扑单元TCCT用于动态学习输入的骨架特征序列数据F的全局上下文特征得到特征Y^TCCT。空间图卷积模块输出对特征Y^TFDCL、特征Y^CFDCL和特征Y^TCCT融合后的空间特征Y。然后时间图卷积模块对空间特征Y提取时间特征信息后输入分类模块进行分类，输出识别得到的行为动作。则行为识别模型对输入的每组样本骨架数据的骨架特征序列数据F处理并输出识别得到的行为动作的方法包括：

空间图卷积模块的网络结构请参考图2，介绍如下：

(1)时间特征学习单元TFDCL学习输入的骨架特征序列数据F的特征差异性和特征相关性得到特征Y^TFDCL的方法包括：

利用第一时间卷积层作用于骨架特征序列数据F的时间帧维度进行卷积变换操作得到φ₁(F)，利用第二时间卷积层作用于骨架特征序列数据F的时间帧维度进行卷积变换操作得到φ₂(F)，第一时间卷积层和第二时间卷积层实现不同的卷积变换操作。对φ₁(F)和φ₂(F)在时间帧维度进行张量加法运算操作得到所有时间帧的特征相关性得到的所有时间帧的特征相关性可以学习并增强时间帧维度上与动作完成密切相关的关节。

利用第三时间卷积层作用于骨架特征序列数据F的时间帧维度进行卷积变换操作得到φ₃(F)，利用第四时间卷积层作用于骨架特征序列数据F的时间帧维度进行卷积变换操作得到φ₄(F)，第三时间卷积层和第四时间卷积层实现不同的卷积变换操作。对φ₃(F)和φ₄(F)在时间帧维度进行张量减法运算操作，再经过激活函数tanh得到所有时间帧的特征差异性得到的所有时间帧的特征差异性可以学习并增强关节在不同时间帧中的差异性。

然后对所有时间帧的特征相关性T_corr(F)和特征差异性T_diff(F)融合得到特征Y^TFDCL。包括对所有时间帧的特征相关性T_corr(F)和特征差异性T_diff(F)在时间帧维度进行张量乘法运算操作得到然后经过激活函数softmax并与权重矩阵/>在时间帧维度进行张量乘法运算操作，得到特征/>

(2)通道特征学习单元CFDCL学习输入的骨架特征序列数据F的特征差异性和特征相关性得到特征Y^CFDCL的方法包括：

利用第一通道卷积层作用于骨架特征序列数据F的通道维度进行卷积变换操作得到ψ₁(F)，利用第二通道卷积层作用于骨架特征序列数据F的通道维度进行卷积变换操作得到ψ₂(F)，第一通道卷积层和第二通道卷积层实现不同的卷积变换操作。对ψ₁(F)和ψ₂(F)在通道维度进行张量加法运算操作得到所有通道的特征相关性通过卷积运算在不同通道中进行交互，进一步增强了关节之间的信息特征，可以通过增强参与动作完成的关节部位的特征，学习并增强关节之间特征的相关性，比如一些虽然没有物理连接，但是仍对动作完成参与度很高的关节之间的关联。

利用第三通道卷积层作用于骨架特征序列数据F的通道维度进行卷积变换操作得到ψ₃(F)，利用第四通道卷积层作用于骨架特征序列数据F的通道维度进行卷积变换操作得到ψ₄(F)，第三通道卷积层和第四通道卷积层实现不同的卷积变换操作。对ψ₃(F)和ψ₄(F)在通道维度进行张量减法运算操作，再经过激活函数tanh得到所有通道的特征差异性得到的所有时间帧的特征差异性可以学习并增强关节在不同时间帧中的差异性，特征差异性旨在学习并增强关节在不同通道中的差异。

对所有通道的特征相关性C_corr(F)和特征差异性C_diff(F)融合得到特征Y^CFDCL。包括：对所有通道的特征相关性C_corr(F)和特征差异性C_diff(F)在通道维度进行张量乘法运算操作得到经过激活函数softmax并与权重矩阵/>在通道维度进行张量乘法运算操作，得到特征/>

(3)考虑到所有关节都参与了保持运动进程和身体平衡，因此进一步使用时间通道上下文拓扑单元TCCT动态学习上下文拓扑以增强特征。时间通道上下文拓扑单元TCCT包括依次连接的第一融合卷积层、重排列层(Reshape层)和第二融合卷积层，第一融合卷积层用于对输入的骨架特征序列数据在通道维度上进行卷积，第二融合卷积层用于对第一融合卷积层输出并经过重排列后的结果在时间帧维度上进行卷积以输出特征Y^TCCT。

在空间图卷积模块中，得到特征Y^TFDCL、特征Y^CFDCL和特征Y^TCCT后，进行融合得到的空间特征Y，包括：

对特征Y^TFDCL、特征Y^CFDCL和特征Y^TCCT进行张量相加得到Y^TFDCL+Y^CFDCL+Y^TCCT后，与输入的骨架特征序列数据F和矩阵A_n进行张量相乘，得到F·A_n(Y^TFDCL+Y^CFDCL+Y^TCCT)，利用卷积单元对F·A_n(Y^TFDCL+Y^CFDCL+Y^TCCT)进行k次卷积并累加，得到融合后的空间特征矩阵/>是V×V的邻接矩阵，当关节q与人体骨架质心的平均距离等于关节p与人体骨架质心的平均距离，一般是关节p与关节q表示同一个关节时，邻接矩阵/>中的第p行第q列的元素/>当关节q与人体骨架质心的平均距离小于关节p与人体骨架质心的平均距离时，/>中的第p行第q列的元素当关节q与人体骨架质心的平均距离大于关节p与人体骨架质心的平均距离时，中的第p行第q列的元素/>矩阵Λ_n是归一化对角矩阵，且矩阵Λ_n中的任意第p行第q列的元素/>α为参数且用于防止空行，比如可以取α＝0.001。p、q为参数且p∈[1,V]，q∈[1,V]。

请参考图3，在时间图卷积模块中，多个使用不同大小卷积核的卷积层分别对输入的空间特征Y执行卷积操作后通过连接层连接，再与输入的空间特征Y进行残差连接后输出对空间特征Y提取时间特征信息后的结果。在图3中，使用到卷积核大小为3、5、9的卷积层，对空间特征Y经过1*1卷积和3*1卷积后得到第一结果，对空间特征Y经过1*1卷积和5*1卷积后得到第二结果，对空间特征Y经过1*1卷积和9*1卷积后得到第三结果，对空间特征Y经过1*1卷积得到第四结果，对第一结果、第二结果、第三结果和第四结果拼接后，与空间特征Y经过1*1卷积后的结果进行残差连接，并输出给分类模块。

在分类模块中对时间图卷积模块输出的结果进行分类，输出识别得到的行为动作。如上所述，本申请使用到的骨架特征序列数据包括四种类型，分别是关节特征序列数据、骨骼特征序列数据、关节运动特征序列数据和骨骼运动特征序列数据。则在分类模块中，对时间图卷积模块输出的结果进行全局平均池化后，利用softmax分类器分别得到关节流预测分数G_joint、骨骼流预测分数G_bone、关节运动流预测分数G_joint-motion和骨骼运动流预测分数G_bone-motion。然后加权得到融合预测分数为：

G_last＝ω_joint×G_joint+ω_bone×G_bone+ω_joint-motion×G_joi_nt-motion；

+ω_bone-motion×G_bone-motion

输出融合预测分数最高的行为动作作为识别得到的行为动作。其中，ω_joint、ω_bone、ω_joint-motion和ω_bone-motion均为加权权重。比如可以设定ω_joint和ω_bone为0.6，ω_joint-motion和ω_bone-motion为0.4。

基于行为识别模型输出的识别得到的行为动作，与样本骨架数据对应的行为动作进行比较，循环训练行为识别模型。

步骤S4，提取待识别的骨架数据的骨架特征序列数据并输入训练得到的行为识别模型，输出识别得到的行为动作。行为识别模型对输入的待识别的骨架数据的骨架特征序列数据进行处理，以输出识别得到的行为动作的方法与上述训练过程中类似，此处不再赘述。

为验证本申请的准确性和鲁棒性，本申请在公开的NTU RGB+D 60数据集和Kinetics-Skeleton 400数据集上进行了实验。NTU RGB+D 60数据集包含60种行为动作，共56880组样本骨架数据，其中有40类为日常行为动作，9类为与健康相关的动作，11类为双人相互动作。这些行为动作由40个年龄从10岁到35岁的人完成。该数据集由微软Kinect v2传感器采集得到，并且使用了三个不同角度的摄像机，采集的数据形式包括深度信息、3D骨架信息、RGB帧以及红外序列。Kinetics-Skeleton 400数据集是一个大规模，高质量的YouTube视频网址数据集，其中包含各种以人为本的行动，该数据集包含400种行为动作，每种行为动作至少有400个视频剪辑，每个剪辑持续大约10秒，并且取自不同的视频，这些种行为动作以人类为中心，涵盖广泛的类别，包括演奏乐器等人与物体的交互，以及握手等人与人的交互。

利用本申请的方法在NTU RGB+D 60数据集和Kinetics-Skeleton 400数据集上的测试结果如下，可见在NTU RGB+D 60数据集和Kinetics-Skeleton 400数据集上都有较高的准确率。

另外，本申请的骨架特征序列数据为关节骨骼特征数据，相比于单独使用关节特征数据，或者单独使用骨骼特征数据来说，准确度也会更高，在NTU RGB+D 60数据集上，对本申请的方法和常规方法的准确率比较如下：

以上所述的仅是本申请的优选实施方式，本申请不限于以上实施例。可以理解，本领域技术人员在不脱离本申请的精神和构思的前提下直接导出或联想到的其他改进和变化，均应认为包含在本申请的保护范围之内。

Claims

1.一种基于骨架数据时空特征差异性和相关性的行为识别方法，其特征在于，所述行为识别方法包括：

将每组样本骨架数据的骨架特征序列数据作为行为识别模型的输入、所述样本骨架数据对应的行为动作作为所述行为识别模型的输出，利用所有样本骨架数据的骨架特征序列数据训练所述行为识别模型；

提取待识别的骨架数据的骨架特征序列数据并输入训练得到的所述行为识别模型，输出识别得到的行为动作；

其中，所述行为识别模型包括依次连接的空间图卷积模块、时间图卷积模块和分类模块，所述空间图卷积模块包括时间特征学习单元、通道特征学习单元和时间通道上下文拓扑单元，所述时间特征学习单元用于在时间帧维度学习输入的骨架特征序列数据的特征差异性和特征相关性得到特征Y^TFDCL，所述通道特征学习单元用于在通道维度学习输入的骨架特征序列数据的特征差异性和特征相关性得到特征Y^CFDCL，所述时间通道上下文拓扑单元用于动态学习输入的骨架特征序列数据的全局上下文特征得到特征Y^TCCT，所述空间图卷积模块输出对特征Y^TFDCL、特征Y^CFDCL和特征Y^TCCT融合后的空间特征Y；所述时间图卷积模块对所述空间特征Y提取时间特征信息后输入分类模块进行分类，输出识别得到的行为动作；

所述时间特征学习单元学习输入的骨架特征序列数据F的特征差异性和特征相关性得到特征Y^TFDCL的方法包括：利用第一时间卷积层作用于骨架特征序列数据F的时间帧维度进行卷积变换操作得到φ₁(F)，利用第二时间卷积层作用于骨架特征序列数据F的时间帧维度进行卷积变换操作得到φ₂(F)，对φ₁(F)和φ₂(F)在时间帧维度进行张量加法运算操作得到所有时间帧的特征相关性利用第三时间卷积层作用于骨架特征序列数据F的时间帧维度进行卷积变换操作得到φ₃(F)，利用第四时间卷积层作用于骨架特征序列数据F的时间帧维度进行卷积变换操作得到φ₄(F)，对φ₃(F)和φ₄(F)在时间帧维度进行张量减法运算操作，再经过激活函数tanh得到所有时间帧的特征差异性对所有时间帧的特征相关性T_corr(F)和特征差异性T_diff(F)在时间帧维度进行张量乘法运算操作后，经过激活函数softmax并与权重矩阵在时间帧维度进行张量乘法运算操作，得到特征Y^TFDCL；

所述通道特征学习单元学习输入的骨架特征序列数据F的特征差异性和特征相关性得到特征Y^CFDCL的方法包括：利用第一通道卷积层作用于骨架特征序列数据F的通道维度进行卷积变换操作得到ψ₁(F)，利用第二通道卷积层作用于骨架特征序列数据F的通道维度进行卷积变换操作得到ψ₂(F)，对ψ₁(F)和ψ₂(F)在通道维度进行张量加法运算操作得到所有通道的特征相关性利用第三通道卷积层作用于骨架特征序列数据F的通道维度进行卷积变换操作得到ψ₃(F)，利用第四通道卷积层作用于骨架特征序列数据F的通道维度进行卷积变换操作得到ψ₄(F)，对ψ₃(F)和ψ₄(F)在通道维度进行张量减法运算操作，再经过激活函数tanh得到所有通道的特征差异性/>对所有通道的特征相关性C_corr(F)和特征差异性C_diff(F)在通道维度进行张量乘法运算操作后，经过激活函数softmax并与权重矩阵/>在通道维度进行张量乘法运算操作，得到特征Y^CFDCL；

所述时间通道上下文拓扑单元包括依次连接的第一融合卷积层、重排列层和第二融合卷积层，所述第一融合卷积层用于对输入的骨架特征序列数据在通道维度上进行卷积，所述第二融合卷积层用于对所述第一融合卷积层输出并经过重排列后的结果在时间帧维度上进行卷积以输出特征Y^TCCT。

2.根据权利要求1所述的行为识别方法，其特征在于，所述空间图卷积模块输出对特征Y^TFDCL、特征Y^CFDCL和特征Y^TCCT融合后得到的空间特征Y为：

其中，Y^TFDCL+Y^CFDCL+Y^TCCT是对特征Y^TFDCL、特征Y^CFDCL和特征Y^TCCT进行张量相加运算后的结果，F·A_n·(Y^TFDCL+Y^CFDCL+Y^TCCT)是对Y^TFDCL+Y^CFDCL+Y^TCCT、骨架特征序列数据F和矩阵A_n进行张量相乘运算的结果；空间特征Y通过对F·A_n·(Y^TFDCL+Y^CFDCL+Y^TCCT)进行k次卷积运算后的结果相加得到，k为参数；

矩阵是V×V的邻接矩阵，当关节q与人体骨架质心的平均距离等于关节p与人体骨架质心的平均距离，邻接矩阵/>中的第p行第q列的元素/>当关节q与人体骨架质心的平均距离小于关节p与人体骨架质心的平均距离时，/>中的第p行第q列的元素/>当关节q与人体骨架质心的平均距离大于关节p与人体骨架质心的平均距离时，/>中的第p行第q列的元素/>矩阵Λ_n是归一化对角矩阵，且矩阵Λ_n中的任意第p行第q列的元素/>α为参数，p、q为参数且p∈[1,V]，q∈[1,V]。

3.根据权利要求1所述的行为识别方法，其特征在于，所述时间图卷积模块中，多个使用不同大小卷积核的卷积层分别对输入的空间特征Y执行卷积操作后通过连接层连接，再与输入的空间特征Y进行残差连接后输出对所述空间特征Y提取时间特征信息后的结果。

4.根据权利要求1所述的行为识别方法，其特征在于，提取得到的每组样本骨架数据的骨架特征序列数据包括：

提取所述样本骨架数据的任意一个通道中任意一个关节在每个时间帧上的坐标数据得到关节特征序列数据；

提取所述样本骨架数据的任意一个通道中任意一段骨骼在每个时间帧上的向量数据得到骨骼特征序列数据，每段骨骼的向量数据是所述骨骼的靠近人体骨架重心的源关节指向远离人体骨架重心的目标关节的向量；

提取所述样本骨架数据的任意一个通道中任意一个关节在任意一个时间帧上的坐标数据至所述关节在同一个通道的下一个时间帧上的坐标数据的移动向量，得到关节运动特征序列数据；

提取所述样本骨架数据的任意一个通道中任意一段骨骼在任意一个时间帧上的向量数据至所述骨骼在同一个通道的下一个时间帧上的向量数据的移动向量，得到骨骼运动特征序列数据。

5.根据权利要求4所述的行为识别方法，其特征在于，输出识别得到的行为动作的方法包括：

对所述时间图卷积模块输出的结果进行分类，得到关节流预测分数G_joint、骨骼流预测分数G_bone、关节运动流预测分数G_joint-motion和骨骼运动流预测分数G_bone-motion；

加权得到融合预测分数输出所述融合预测分数最高的行为动作作为识别得到的行为动作；

其中，ω_joint、ω_bone、ω_joint-motion和ω_bone-motion均为加权权重。