CN109670401B - 一种基于骨骼运动图的动作识别方法 - Google Patents
一种基于骨骼运动图的动作识别方法 Download PDFInfo
- Publication number
- CN109670401B CN109670401B CN201811360598.XA CN201811360598A CN109670401B CN 109670401 B CN109670401 B CN 109670401B CN 201811360598 A CN201811360598 A CN 201811360598A CN 109670401 B CN109670401 B CN 109670401B
- Authority
- CN
- China
- Prior art keywords
- motion
- segmented
- color
- map
- bone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/23—Recognition of whole body movements, e.g. for sport training
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
- G06F18/256—Fusion techniques of classification results, e.g. of results related to same input data of results relating to different input data, e.g. multimodal recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
Abstract
本发明涉及一种基于骨骼运动图的动作识别方法,包括:将人体骨骼序列的每一帧分别投影到笛卡尔正交系的三个平面上,生成人体骨骼序列分布图,用来获取空间信息;使用时间金字塔方法将骨骼序列分布图分割为不同分段的两层结构,用来获取运动的时间信息;对每个面的分段的骨骼序列分布图分别累积每个关节上连续帧之间的绝对差,生成分段的骨骼运动图;对分段的骨骼运动图使用四个不同的颜色表分别进行伪彩色编码,获得更多的彩色纹理信息,得到彩色分段的骨骼运动图;使用加法更新策略,将彩色分段的骨骼运动图叠加生成最终的骨骼运动图;利用深度学习进行图片分类,从而完成人类的动作检测识别任务。
Description
技术领域
本发明属于多媒体信息处理领域,涉及一种动作识别方法。
背景技术
人体动作识别在模式识别和计算机视觉中的应用非常广泛,如视频监控、手势识别、人机交互等等。人类可以通过用描述骨骼的主要关节的几个点的运动来识别动作。与基于RGB 的动作识别相比,骨骼数据包含人体关节的位置,是一种相对较高层次的运动识别特征。它对尺度和光照的变化具有较强的鲁棒性,并且对摄像机的视角、人体的旋转和运动速度都具有一定的不变性。基于骨架的动作识别可以避免视频特征提取的繁重任务,因此,单纯基于骨骼序列的人类动作识别也具有很有发展的前景。
近年来,卷积神经网络在计算机识别的领域中具有相当出色的表现。但如何有效地提取骨骼序列的空间和时间信息并适应神经网络的输入仍然是一个开放话题。
本发明提出的基于人体骨骼运动图的动作识别方法,首先采用不同的形状来表示骨骼关节,对骨骼进行可视化,有效利用空间信息。其次,对骨骼序列进行分割,并在每个分割的序列上累积每个关节上连续帧之间的绝对差,充分利用时间信息。第三,输入到神经网络之前,每个时间金字塔骨骼运动图进行伪彩色编码。将增强的不同运动模式编码到伪RGB信道。最后采用融合技术,对六个通道的分类结果进行融合,实现客观准确而高效的人体动作的识别功能。
发明内容
本发明提供一种较为准确的基于人体骨骼运动图的动作识别方法,使用时间金字塔和伪彩色编码方法,并将之与深度学习进行相连接。技术方案如下:
一种基于骨骼运动图的动作识别方法,包括下列步骤:
1)将人体骨骼序列的每一帧分别投影到笛卡尔正交系的三个平面上,使用不同形状的实体表示每个骨骼的关节点,并利用第三维度的坐标作为深度信息,生成人体骨骼序列分布图,用来获取空间信息;
2)使用时间金字塔方法将骨骼序列分布图分割为不同分段的两层结构,用来获取运动的时间信息;
3)对每个面的分段的骨骼序列分布图分别累积每个关节上连续帧之间的绝对差,生成分段的骨骼运动图;
4)对分段的骨骼运动图使用四个不同的颜色表分别进行伪彩色编码,获得更多的彩色纹理信息,得到彩色分段的骨骼运动图;
5)使用加法更新策略,将彩色分段的骨骼运动图叠加生成最终的骨骼运动图。
6)利用深度学习进行图片分类,从而完成人类的动作检测识别任务。
本发明提出的基于人体骨骼运动图的动作识别方法,首先采用不同的形状来表示骨骼关节,对骨骼进行可视化,有效利用空间信息。其次,对骨骼序列进行分割,并在每个分割的序列上累积每个关节上连续帧之间的绝对差,充分利用时间信息。第三,输入到神经网络之前,每个时间金字塔骨骼运动图进行伪彩色编码。将增强的不同运动模式编码到伪RGB信道。最后采用融合技术,对六个通道的分类结果进行融合,实现客观准确而高效的人体动作的识别功能。
附图说明
附图为整个基于骨骼序列的人类动作识别框架。
具体实施方式
1)骨骼序列到骨骼运动图片的映射
第一步,假设一个包含n帧的骨架序列S={F1,F2,...,Fn},其中表示骨骼序列的第j帧;m表示骨骼节点数;表示关节的第j帧的第i个节点的三维坐标。每一帧的骨骼数据投影到笛卡尔正交系的三个平面上,将的值作为投影的深度值,并且使用实体形状去表示每一个骨骼节点。这样的投影后,每一个骨骼序列的每一帧都能得到三张黑白的描述该动作骨骼分布的图片。具有丰富的空间信息,然而并不具备时间信息的描述。
第二步,使用时间金字塔策略对骨骼序列进行分割,一个序列可以被分割为n个片段,最常见的是n=1,2,4...。考虑到计算量和有效性,我们采用骨骼序列分割不同的值n=1,4 构造两层体系结构。
第三步,积累每个分段的骨骼序列分布图在投影平面上的连续帧之间的绝对差,得到分段的骨骼运动图,如下公式所示:
第四步,对分段的骨骼运动图使用四个不同的颜色表将灰度值映射到RGB颜色空间,分别进行伪彩色编码,得到彩色分段的骨骼运动图。其中四个颜色表的R通道和G通道的值分别为(0,0.4980),(0.4980,1)(1,0.502)和(0.5176,0),B通道的映射关系如下公式所示:
其中I表示分段的骨骼运动图的灰度值。
第五步,为了适应神经网络的输入,对四个彩色分段的骨骼运动图使用加法更新策略,合并成最终的骨骼运动图。
2)利用深度学习进行图片分类,从而完成人类的动作检测识别任务。
在这里,我们采用当今公用的深度学习框架keras,在Linux系统下,通过 NvidiaGTX TITAN X显卡进行卷积神经网络训练的加速,采用Densenet121的网络结构对获取的骨骼运动图进行训练。
第一步,对数据集进行训练集和测试集划分,将两层结构的六个骨骼运动图,分别进行六个卷积神经网络的参数训练。
第二步,采用微调模型优化网络参数。
第三步,对六个神经网络的输出得分向量,并按如下公式进行融合:
下面为本发明在SYSU-3D、MSRC-12Kinect Gesture、UTD-MHAD数据集上的实验结果说明:
在Matlab-2017a平台上进行算法的仿真实现,计算训练数据集以及测试数据集的六个骨骼运动图。在linux系统下使用keras深度学习框架对数据进行训练。最后的得分融合部分在Python3.6平台上完成。
本方法在国际公认的人类动作识别数据集中进行测试,数据集中训练集以及测试集的分配方式采用Cross Subject分配方式。测试结果如下:在包含12类动作的SYSU-12数据集上,获得了83.74%的识别准确率;在包含12类动作的MSRC-12数据集上,获得了97.675%的识别准确率;在包含27类动作的UTD-MHAD数据集上,获得了92.56%的识别精度。该实验结果对比与国际领先的基于骨骼序列的人类动作检测识别算法,均取得了高于其余算法的分类准确度。
Claims (1)
1.一种基于骨骼运动图的动作识别方法,包括下列步骤:
1)将人体骨骼序列的每一帧分别投影到笛卡尔正交系的三个平面上,使用不同形状的实体表示每个骨骼的关节点,并利用第三维度的坐标作为深度信息,生成人体骨骼序列分布图,用来获取空间信息;
2)使用时间金字塔方法将骨骼序列分布图分割为不同分段的两层结构,用来获取运动的时间信息;
3)对每个平面的分段的骨骼序列分布图分别累积每个关节上连续帧之间的绝对差,生成分段的骨骼运动图,如下公式所示:
4)对分段的骨骼运动图使用四个不同的颜色表分别进行伪彩色编码,获得更多的彩色纹理信息,得到彩色分段的骨骼运动图;
5)使用加法更新策略,将彩色分段的骨骼运动图叠加生成最终的骨骼运动图;
6)利用深度学习对步骤5)所获取的骨骼运动图进行分类,从而完成人类的动作检测识别任务。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811360598.XA CN109670401B (zh) | 2018-11-15 | 2018-11-15 | 一种基于骨骼运动图的动作识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811360598.XA CN109670401B (zh) | 2018-11-15 | 2018-11-15 | 一种基于骨骼运动图的动作识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109670401A CN109670401A (zh) | 2019-04-23 |
CN109670401B true CN109670401B (zh) | 2022-09-20 |
Family
ID=66141811
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811360598.XA Active CN109670401B (zh) | 2018-11-15 | 2018-11-15 | 一种基于骨骼运动图的动作识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109670401B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111339888B (zh) * | 2020-02-20 | 2023-11-14 | 沈阳航空航天大学 | 基于关节点运动图的双人交互行为识别方法 |
CN111695523B (zh) * | 2020-06-15 | 2023-09-26 | 浙江理工大学 | 基于骨骼时空及动态信息的双流卷积神经网络动作识别方法 |
CN111914798B (zh) * | 2020-08-17 | 2022-06-07 | 四川大学 | 基于骨骼关节点数据的人体行为识别方法 |
CN112070027B (zh) * | 2020-09-09 | 2022-08-26 | 腾讯科技(深圳)有限公司 | 网络训练、动作识别方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105844258A (zh) * | 2016-04-13 | 2016-08-10 | 中国农业大学 | 动作识别方法及装置 |
CN106529441A (zh) * | 2016-10-26 | 2017-03-22 | 江南大学 | 基于模糊边界分片的深度动作图人体行为识别方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8929600B2 (en) * | 2012-12-19 | 2015-01-06 | Microsoft Corporation | Action recognition based on depth maps |
US9886094B2 (en) * | 2014-04-28 | 2018-02-06 | Microsoft Technology Licensing, Llc | Low-latency gesture detection |
CN105608421B (zh) * | 2015-12-18 | 2019-01-18 | 中国科学院深圳先进技术研究院 | 一种人体动作的识别方法及装置 |
CN105740833B (zh) * | 2016-02-03 | 2019-03-22 | 北京工业大学 | 一种基于深度序列的人体行为识别方法 |
CN105912991B (zh) * | 2016-04-05 | 2019-06-25 | 湖南大学 | 基于3d点云与关键骨骼节点的行为识别 |
CN106228109A (zh) * | 2016-07-08 | 2016-12-14 | 天津大学 | 一种基于骨骼运动轨迹的动作识别方法 |
CN106203503B (zh) * | 2016-07-08 | 2019-04-05 | 天津大学 | 一种基于骨骼序列的动作识别方法 |
CN107301370B (zh) * | 2017-05-08 | 2020-10-16 | 上海大学 | 一种基于Kinect三维骨架模型的肢体动作识别方法 |
CN107194344B (zh) * | 2017-05-16 | 2020-06-05 | 西安电子科技大学 | 自适应骨骼中心的人体行为识别方法 |
CN107392131A (zh) * | 2017-07-14 | 2017-11-24 | 天津大学 | 一种基于人体骨骼节点距离的动作识别方法 |
CN108681700B (zh) * | 2018-05-04 | 2021-09-28 | 苏州大学 | 一种复杂行为识别方法 |
-
2018
- 2018-11-15 CN CN201811360598.XA patent/CN109670401B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105844258A (zh) * | 2016-04-13 | 2016-08-10 | 中国农业大学 | 动作识别方法及装置 |
CN106529441A (zh) * | 2016-10-26 | 2017-03-22 | 江南大学 | 基于模糊边界分片的深度动作图人体行为识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109670401A (zh) | 2019-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109670401B (zh) | 一种基于骨骼运动图的动作识别方法 | |
CN110135375B (zh) | 基于全局信息整合的多人姿态估计方法 | |
CN110147743B (zh) | 一种复杂场景下的实时在线行人分析与计数系统及方法 | |
CN111339903B (zh) | 一种多人人体姿态估计方法 | |
CN110008915B (zh) | 基于掩码-rcnn进行稠密人体姿态估计的系统及方法 | |
CN106203503B (zh) | 一种基于骨骼序列的动作识别方法 | |
CN110472604B (zh) | 一种基于视频的行人与人群行为识别方法 | |
CN106709568A (zh) | 基于深层卷积网络的rgb‑d图像的物体检测和语义分割方法 | |
CN104794737B (zh) | 一种深度信息辅助粒子滤波跟踪方法 | |
CN111950477B (zh) | 一种基于视频监督的单图像三维人脸重建方法 | |
CN107392131A (zh) | 一种基于人体骨骼节点距离的动作识别方法 | |
CN114596520A (zh) | 一种第一视角视频动作识别方法及装置 | |
CN110135277B (zh) | 一种基于卷积神经网络的人体行为识别方法 | |
CN110263605A (zh) | 基于二维人体姿态估计的行人服饰颜色识别方法及装置 | |
CN106815855A (zh) | 基于产生式和判别式结合的人体运动跟踪方法 | |
CN112818860B (zh) | 基于端到端多任务多尺度神经网络的实时三维人脸重建方法 | |
CN109657634A (zh) | 一种基于深度卷积神经网络的3d手势识别方法及系统 | |
CN116012950A (zh) | 一种基于多重心时空注意图卷积网络的骨架动作识别方法 | |
CN111531546B (zh) | 一种机器人位姿估计方法、装置、设备及存储介质 | |
CN112487926A (zh) | 一种基于时空图卷积网络的景区投喂行为识别方法 | |
CN112906520A (zh) | 一种基于姿态编码的动作识别方法及装置 | |
CN116246338B (zh) | 一种基于图卷积和Transformer复合神经网络的行为识别方法 | |
CN113255514B (zh) | 基于局部场景感知图卷积网络的行为识别方法 | |
CN111611997B (zh) | 一种基于人体动作迁移的卡通定制形象运动视频生成方法 | |
CN106446764A (zh) | 基于改进的模糊颜色聚合向量的视频目标检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |