CN113963435A - 一种基于图卷积神经网络的人体行为识别系统 - Google Patents
一种基于图卷积神经网络的人体行为识别系统 Download PDFInfo
- Publication number
- CN113963435A CN113963435A CN202111167649.9A CN202111167649A CN113963435A CN 113963435 A CN113963435 A CN 113963435A CN 202111167649 A CN202111167649 A CN 202111167649A CN 113963435 A CN113963435 A CN 113963435A
- Authority
- CN
- China
- Prior art keywords
- space
- time
- human
- skeleton
- map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 14
- 230000009471 action Effects 0.000 claims abstract description 18
- 238000000605 extraction Methods 0.000 claims abstract description 13
- 238000000034 method Methods 0.000 claims abstract description 13
- 230000003993 interaction Effects 0.000 claims abstract description 4
- 230000001360 synchronised effect Effects 0.000 claims abstract description 4
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 3
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 5
- 210000000988 bone and bone Anatomy 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于图卷积神经网络的人体行为识别系统,涉及人体行为识别技术领域;包括如下方法:步骤一:对深度传感器采集的人体关节数据构建无向时空骨骼图,作为时空图卷积的输入信号;步骤二:将构建好的骨骼图输入至时空图卷积网络进行动作特征提取,实现人体动作识别;步骤三:将门控单元循环神经网络嵌入时空图卷积中对网络进行优化,更好实现空间域特征和时间域特征同步提取;步骤四:利用3D建模软件实现虚拟环境下的人机互动;本发明利用NTU RGB+D数据集中采集到的人体骨骼动作信息,对人体骨架关节点位置的时序表示和空间协同关系构建时空骨架图网络结构,实现端到端的基于时空图卷积神经网络的人体骨架动作识别。
Description
技术领域
本发明属于人体行为识别技术领域,具体涉及一种基于图卷积神 经网络的人体行为识别系统。
背景技术
人体动作识别涵盖了计算机视觉中的许多研究主题,包括视频中 的人体检测,姿态估计与跟踪以及动作序列的分析和理解。由于人体 动作识别应用广泛,如患者监测,运动分析,智能视频监控和人机交 互等应用场景,因此是一个重要的研究领域。传统的人类动作识别主 要是基于RGB视频,但RGB视频存在计算量大、易受光照条件影响、 对背景噪声敏感等缺点。得益于人体检测算法的成熟,越来越多的研 究集中于基于骨骼的人体动作识别。人体可以被视为由枢纽关节连接 刚性骨骼而成的铰接系统,其动作主要反映在三维空间中的骨骼运动 上,且骨骼信息对尺度、光照和视角等变化具有很强的鲁棒性。与 RGB信息相比,骨骼信息具有特征明确、不易受复杂背景影响的优点。
由于骨骼信息是由若干个关节的三维坐标点表示,无法直接利用 传统的CNN进行深度特征提取,已有的CNN方法一般是将骨架数据 转换成图像,将空间和时间信息映射在图像的纹理、颜色等属性上, 再进行特征提取,但此过程会引起部分关键信息的丢失。因此,如何 直接从骨架数据上提取卷积特征成为一个亟待解决的难题。考虑到图 (Graph)在建模各种非规则结构数据方面具有先天优势,将这种先 天优势与CNN在特征学习方面的突出能力相结合,构建基于图的卷积 神经网络模型与方法以进行有效的骨架表示与高判别性的特征提取, 进而建立一般化的、鲁棒的骨架动作识别方法具有重要的研究价值。
发明内容
为解决背景技术中的问题;本发明的目的在于提供一种基于图卷 积神经网络的人体行为识别系统。
本发明的一种基于图卷积神经网络的人体行为识别系统,包括如 下方法:
步骤一:对深度传感器采集的人体关节数据构建无向时空骨骼 图,作为时空图卷积的输入信号;
步骤二:将构建好的骨骼图输入至时空图卷积网络进行动作特征 提取,实现人体动作识别;
步骤三:将门控单元循环神经网络嵌入时空图卷积中对网络进行 优化,更好实现空间域特征和时间域特征同步提取;
步骤四:利用3D建模软件实现虚拟环境下的人机互动。
与现有技术相比,本发明的有益效果为:
一、实现人体动作识别的高精度识别,进一步提高动作识别的准 确率。
二、利用NTU RGB+D数据集中采集到的人体骨骼动作信息,对人 体骨架关节点位置的时序表示和空间协同关系构建时空骨架图网络 结构,实现端到端的基于时空图卷积神经网络的人体骨架动作识别。
附图说明
为了易于说明,本发明由下述的具体实施及附图作以详细描述。
图1为本发明的结构框图;
图2为本发明中人体骨骼时空图;
图3为本发明中GRUNN结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面通过附 图中示出的具体实施例来描述本发明。但是应该理解,这些描述只是 示例性的,而并非要限制本发明的范围。本说明书附图所绘示的结构、 比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术 的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具 技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整, 在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本 发明所揭示的技术内容能涵盖的范围内。此外,在以下说明中,省略 了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
在此,还需要说明的是,为了避免因不必要的细节而模糊了本发 明,在附图中仅仅示出了与根据本发明的方案密切相关的结构和/或 处理步骤,而省略了与本发明关系不大的其他细节。
本具体实施方式采用以下技术方案:通过图卷积与GRUNN相结合 的方式,实现人体动作识别。模块实现步骤如下:
一、骨骼图构建:
如图1所示,把人体骨骼连接图表示成一个无向图时空图G(V, E),记N为骨骼关节点数,T为帧的数量。因此任何一个骨骼序列的 节点集合可以表示为V={vti|t=1,...,T,i=1,...,N},节点信号特征记 X={xti|t=1,...,T,i=1,...,N}。在ST-GCN中,节点特征采用节点空 间三维坐标值F(vti)表示。时空图G的构建分为两步:第一步,构建 空域图,把所有帧内的骨骼点按照骨骼的生理连接结构进行连接,如 图2所示;第二步,构建时域图,把相邻帧对应的骨骼点进行连接。 因此,时空图G的边包含两个子集,第一个子集是帧内骨骼点间的连 接边,记为ES={vtivtj=|(i,j)∈H},其中H为如图2所示的骨骼的空间 连接边。第二个子集则是帧间对应骨骼点在时间域上的连接边,记为 EF={vtiv(t+1)i}v,特别地,所有的边的强度均设为1。
二、利用时空图卷积进行特征提取:
构造好人体骨骼图之后,接下来需要分别对时空图进行空间域和 时间域的特征提取。GCN学习了到空间中相邻关节的局部特征。在此 基础上,需要利用时间卷积(TCN)学习时间中关节变化的局部特征。 将二者结合构成ST-GCN。在空间域上,直接对骨骼图数据用图卷积 神经网络进行特征提取。由采样函数和权重函数组成。
采样函数:在图信号上,类比地定义采样函数离中点节点vti距离 小于D的邻居节点,即,B(vti)={vtj|d(vti,vtj)≤D},其中,d(vti,vtj)表示从 节点vti到节点vti的最小路径长度。可以得到采样函数为p(vti,vtj)=vtj。 D的取值控制了感受野范围的大小,一般情况下为了简化计算D取1, 表示只采样一阶的邻居节点。因此图卷积操作定义如下:
对于输入的人体骨架图使用多个图卷积层提取高级空时特征, 最后通过softmax函数实现人体动作识别。采用图自编码器(graph auto-encoder,GAE)、图注意力网络(graph attention network,GAT) 和STGCN做对比实验,择优选择网络结构模型。
三、GRUNN:
根据加权融合方法将时空图卷积和GRUNN融合,将两个模型 Softmax分数结合起来以获得最终分数。GRUNN通过主要学习基于时 空图的时序动作信息,以获得最佳的性能融合。门控循环神经网络(GRUNN)是循环神经网络的一种变形,它通过引入门控解决了RNN容 易发生梯度爆炸和梯度消失的问题,并且能更好地学习长期的时序依 赖特征。把GRUNN引入到图序列信号处理中的一个方式是把上述择优 模型嵌入到GRUNN结构中,实现空间域特征和时间域特征同步提取。 如图3所示,GRUNN中有二个控制门,分别是重置门和更新门。把择 优模型嵌入到门控而替代原始的GRUNN中的线性变换。通过将GRUNN 进行叠加从而提出深层次的时域特征和频域特征。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例 的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其 他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例 看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求 而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和 范围内的所有变化囊括在本发明内。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非 每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅 仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实 施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解 的其他实施方式。
Claims (1)
1.一种基于图卷积神经网络的人体行为识别系统,其特征在于:包括如下方法:
步骤一:对深度传感器采集的人体关节数据构建无向时空骨骼图,作为时空图卷积的输入信号;
步骤二:将构建好的骨骼图输入至时空图卷积网络进行动作特征提取,实现人体动作识别;
步骤三:将门控单元循环神经网络嵌入时空图卷积中对网络进行优化,更好实现空间域特征和时间域特征同步提取;
步骤四:利用3D建模软件实现虚拟环境下的人机互动。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111167649.9A CN113963435A (zh) | 2021-10-07 | 2021-10-07 | 一种基于图卷积神经网络的人体行为识别系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111167649.9A CN113963435A (zh) | 2021-10-07 | 2021-10-07 | 一种基于图卷积神经网络的人体行为识别系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113963435A true CN113963435A (zh) | 2022-01-21 |
Family
ID=79463415
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111167649.9A Pending CN113963435A (zh) | 2021-10-07 | 2021-10-07 | 一种基于图卷积神经网络的人体行为识别系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113963435A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114550308A (zh) * | 2022-04-22 | 2022-05-27 | 成都信息工程大学 | 基于时空图的人体骨骼动作识别方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110827544A (zh) * | 2019-11-11 | 2020-02-21 | 重庆邮电大学 | 一种基于图卷积循环神经网络的短时交通流控制方法 |
CN111617464A (zh) * | 2020-05-28 | 2020-09-04 | 西安工业大学 | 一种动作识别的跑步机健身方法 |
CN111881731A (zh) * | 2020-05-19 | 2020-11-03 | 广东国链科技股份有限公司 | 基于人体骨架的行为识别方法、系统、装置及介质 |
CN112084934A (zh) * | 2020-09-08 | 2020-12-15 | 浙江工业大学 | 基于骨骼数据双通道深度可分离卷积的行为识别方法 |
CN112329690A (zh) * | 2020-11-16 | 2021-02-05 | 河北工业大学 | 基于时空残差网络和时序卷积网络的连续手语识别方法 |
CN112395945A (zh) * | 2020-10-19 | 2021-02-23 | 北京理工大学 | 基于骨骼关节点的图卷积行为识别方法及装置 |
CN112733656A (zh) * | 2020-12-30 | 2021-04-30 | 杭州电子科技大学 | 基于多流空间注意力图卷积sru网络的骨架动作识别方法 |
-
2021
- 2021-10-07 CN CN202111167649.9A patent/CN113963435A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110827544A (zh) * | 2019-11-11 | 2020-02-21 | 重庆邮电大学 | 一种基于图卷积循环神经网络的短时交通流控制方法 |
CN111881731A (zh) * | 2020-05-19 | 2020-11-03 | 广东国链科技股份有限公司 | 基于人体骨架的行为识别方法、系统、装置及介质 |
CN111617464A (zh) * | 2020-05-28 | 2020-09-04 | 西安工业大学 | 一种动作识别的跑步机健身方法 |
CN112084934A (zh) * | 2020-09-08 | 2020-12-15 | 浙江工业大学 | 基于骨骼数据双通道深度可分离卷积的行为识别方法 |
CN112395945A (zh) * | 2020-10-19 | 2021-02-23 | 北京理工大学 | 基于骨骼关节点的图卷积行为识别方法及装置 |
CN112329690A (zh) * | 2020-11-16 | 2021-02-05 | 河北工业大学 | 基于时空残差网络和时序卷积网络的连续手语识别方法 |
CN112733656A (zh) * | 2020-12-30 | 2021-04-30 | 杭州电子科技大学 | 基于多流空间注意力图卷积sru网络的骨架动作识别方法 |
Non-Patent Citations (2)
Title |
---|
梁强升;许心越;刘利强;: "面向数据驱动的城市轨道交通短时客流预测模型", 中国铁道科学, no. 04, 15 July 2020 (2020-07-15) * |
邓珍荣;张宝军;蒋周琴;黄文明;: "融合word2vec和注意力机制的图像描述模型", 计算机科学, no. 04, 15 April 2019 (2019-04-15) * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114550308A (zh) * | 2022-04-22 | 2022-05-27 | 成都信息工程大学 | 基于时空图的人体骨骼动作识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110322423B (zh) | 一种基于图像融合的多模态图像目标检测方法 | |
CN108830150B (zh) | 一种基于三维人体姿态估计方法及装置 | |
Zhang et al. | Deep learning-based classification and reconstruction of residential scenes from large-scale point clouds | |
CN112686928B (zh) | 一种基于多源信息融合的运动目标视觉跟踪方法 | |
Geng et al. | Using deep learning in infrared images to enable human gesture recognition for autonomous vehicles | |
Ye et al. | DPNet: Detail-preserving network for high quality monocular depth estimation | |
CN105718879A (zh) | 基于深度卷积神经网络的自由场景第一视角手指关键点检测方法 | |
CN103473801A (zh) | 一种基于单摄像头与运动捕捉数据的人脸表情编辑方法 | |
CN105160310A (zh) | 基于3d卷积神经网络的人体行为识别方法 | |
CN114943876A (zh) | 一种多级语义融合的云和云影检测方法、设备及存储介质 | |
CN107392131A (zh) | 一种基于人体骨骼节点距离的动作识别方法 | |
CN114613013A (zh) | 一种基于骨骼节点的端到端人类行为识别方法与模型 | |
CN107146237A (zh) | 一种基于在线状态学习与估计的目标跟踪方法 | |
CN116109678B (zh) | 基于上下文自注意力学习深度网络的目标跟踪方法与系统 | |
CN112036276A (zh) | 一种人工智能视频问答方法 | |
CN111353447A (zh) | 一种基于图卷积网络的人体骨架行为识别方法 | |
CN113255514B (zh) | 基于局部场景感知图卷积网络的行为识别方法 | |
CN114821764A (zh) | 一种基于kcf追踪检测的手势图像识别方法及系统 | |
CN116682140A (zh) | 基于注意力机制多模态融合的三维人体姿态估计算法 | |
CN113963435A (zh) | 一种基于图卷积神经网络的人体行为识别系统 | |
CN117854155A (zh) | 一种人体骨骼动作识别方法及系统 | |
CN116449947B (zh) | 一种基于tof相机的汽车座舱域手势识别系统及方法 | |
CN111274901B (zh) | 一种基于深度门控递归单元的手势深度图像连续检测方法 | |
CN113158756A (zh) | 基于HRNet深度学习的姿态、行为分析模块及分析方法 | |
CN115050010B (zh) | 一种针对三维物体检测器的迁移学习方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |