CN107886069A - 一种多目标人体2d姿态实时检测系统及检测方法 - Google Patents

一种多目标人体2d姿态实时检测系统及检测方法 Download PDF

Info

Publication number
CN107886069A
CN107886069A CN201711102577.3A CN201711102577A CN107886069A CN 107886069 A CN107886069 A CN 107886069A CN 201711102577 A CN201711102577 A CN 201711102577A CN 107886069 A CN107886069 A CN 107886069A
Authority
CN
China
Prior art keywords
human body
artis
layer
hotspot graph
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201711102577.3A
Other languages
English (en)
Inventor
卢绍文
王金鑫
王克栋
郭章
程盟盟
李鹏琦
赵磊
刘晓丽
丁进良
柴天佑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201711102577.3A priority Critical patent/CN107886069A/zh
Publication of CN107886069A publication Critical patent/CN107886069A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种多目标人体2D姿态实时检测系统及检测方法,系统包括:图像采集模块用于获取图像数据;实时处理模块用于将图像数据输入到神经网络进行学习和预测,并根据获取的关节点位置的热点图和关节点之间的方向向量场的热点图生成人体的姿态信息;可视化显示模块用于将预测得到的人体姿态信息通过线段连接的方式呈现给用户。本发明利用深度学习的方法编码关节的位置和由关节相互连接组成的骨骼的位置和方向,实现对单幅图像准确的人体的2D姿态估计,而且对于人员聚集复杂的情况,能够准确估计场景中的多个人体姿态,方便用户对人体的姿态进一步分析处理和挖掘,从而预测人的下一步行为。

Description

一种多目标人体2D姿态实时检测系统及检测方法
技术领域
本发明涉及计算机视觉和深度学习领域,尤其涉及一种多目标人体2D姿态实时检测系统及检测方法。
背景技术
随着计算机视觉技术、深度学习技术发展,人体姿态估计仍然是日益活跃的计算机视觉的一个研究领域,并具有广阔的应用前景,如人机交互、智能监控、运动员辅助训练、视频编码等。近年来,在这些应用的驱动之下,行为分析已经成为计算机视觉、机器人领域、深度学习、机器学习、数据挖掘学等相关领域的研究热点。人体行为分析的目的在于描述、识别和理解人体动作、人与人之间以及人与环境之间的交互行为,其在智能视频监控、虚拟现实、机器人人机交互等方面具有广泛的应用背景,而进行人体的姿态估计则是进行行为分析的前提条件。
2D人体姿态是指人体关节在图像二维平面分布的一种描述,主要是在图像中检测出人体的各个关键点,包括面部,躯干和手指等的位置、方向以及尺度信息。一般使用线段或者矩形来描述人体关节在图像二维平面的投影。线段或者矩形的角度分布和大小描述了人体的姿态。
现有的2D人体姿态估计已经很大程度上聚焦于寻找人体的某个部位,从而推断出一张图像中的多个的姿态。现有的2D人体姿态估计采用一种自上而下的检测方法:先检测图像中的人体信息,获得人体的位置信息后再对人体进行姿态估计。现有的方法在多目标的场景中检测精度并不理想:首先,每张图片中可能包含未知个数的人,而且这些人的出现的位置和范围都是未知的。其次,人与人之间的交互可能带来空间上的干扰,由于人与人之间有相互接触,关节之间的相互重叠,采用先检测人体的方法在这种情况下可能漏检被遮挡的,信息不完全的人体,造成不精确的估计。第三,时间复杂度会随着图片中的人数的增加而增加,这对于系统的实时性来说是一个巨大的挑战。
发明内容
本发明实施例提供一种多目标人体2D姿态实时检测系统及方法,对于人员聚集复杂的情况,能够准确估计场景中的多个人体姿态,方便用户对人体的姿态进一步分析处理和挖掘,从而预测人的下一步行为。
本发明提供一种多目标人体2D姿态实时检测系统,包括:
图像采集模块,用于获取图像数据;
实时处理模块,用于将图像数据输入到神经网络进行学习和预测,并根据获取的关节点位置的热点图和关节点之间的方向向量场的热点图生成人体的姿态信息;
可视化显示模块,用于将预测得到的人体姿态信息通过线段连接的方式呈现给用户。
在本发明的多目标人体2D姿态实时检测系统中,所述图像采集模块为USB摄像机或者网络摄像机,用于获取图像信息并将图像信息转换成标准RGB图像。
在本发明的多目标人体2D姿态实时检测系统中,所述实时处理模块包括:
神经网络子模块,用于将图像数据输入到神经网络进行学习和预测,获取到关节点位置的热点图和关节点之间的方向向量场的热点图,方向向量场的热点图描述了两个关节点是否可以连接在一起组成人体的一部分骨骼;
关节点连接子模块,用于对神经网络输出的两种热点图进行融合,将属于同一人体的关节点连接起来,构成完整的人体姿态信息。
本发明还提供一种多目标人体2D姿态实时检测方法,包括:
步骤1:获取图像数据;
步骤2:将图像数据输入到神经网络进行学习和预测,利用神经网络提取特征,根据获取的关节点位置的热点图和关节点之间的方向向量场的热点图生成人体的姿态信息;
步骤3:将预测得到的人体姿态信息通过线段连接的方式呈现给用户。利用线段将属于某一个人的所有关节点按人体实际的连接情况连接起来,得到人体的完整姿态信息。
在本发明的多目标人体2D姿态实时检测方法中,所述步骤1具体为:
通过USB摄像机或者网络摄像机获取待处理图像信息,将获得的图像信息转换成标准RGB图像。
在本发明的多目标人体2D姿态实时检测方法中,所述步骤2包括:
步骤2.1:将历史图像数据作为神经网络的输入对神经网络模型进行训练;
步骤2.2:将要检测的图像数据输入到训练完的神经网络模型,利用神经网络提取特征,得到对于该图像预测的不同类型关节点的热点图和关节点之间的方向向量场热点图;
步骤2.3:对神经网络输出的两种热点图进行融合,将属于同一人体的关节点连接起来,构成完整的人体姿态信息。
在本发明的多目标人体2D姿态实时检测方法中,所述步骤2.1包括:
步骤2.1.1:建立卷积神经网络的初始模型,卷积神经网络包括单通道阶段和多个双通道阶段,单通道阶段包括:
第一层和第二层为卷积层:对历史图像数据进行卷积处理;
第三层为池化层:对第一层和第二层的结果进行下采样处理;
第四层和第五层为卷积层:对第三层的图像进行两层卷积处理;
第六层为池化层:对第四层和第五层的结果进行下采样处理;
第七至第十层为卷积层:对第六层的图像进行四层卷积处理;
第十一层为池化层:对第七至第十层为卷积层的结果进行下采样处理;
第十二层和第十三层为卷积层:将第十一层的图像进行两层卷积处理,得到输入图像的特征图;
步骤2.1.2:将步骤2.1.1得到的输入图像的特征图输入卷积神经网络的双通道阶段,得到不同类型关节点的热点图S和关节点之间的方向向量场热点图L,关节点的热点图S表示出一副图像中所有的关节点的位置信息,方向向量场热点图L有表示各个关节点之间的关联程度,由若干2D向量组成,2D向量的方向代表了关节连接成骨骼的方向;
步骤2.1.3:通过对于神经网络学习到的结果与真实数据之间的误差,利用反向传播算法,调整神经网络的参数,使得神经网络学习到的结果最接近标注数据的真实结果,从而得到训练好的神经网络模型。
在本发明的多目标人体2D姿态实时检测方法中,所述步骤2.3包括:
步骤2.3.1:将预测得到的关节点的热点图S和关节点之间的方向向量场热点图L转化成图论里求解最大权重K分图匹配问题,不同类型关节点的热点图S为K分图的节点,关节点之间的方向向量场热点图L代表二分图的边的权重,其中K代表不同关节类型的个数;
步骤2.3.2:利用贪心算法简化最大权重二分图匹配问题:根据人体关节的实际连接情况简化问题,将K分图的匹配问题化解成多个最大权重二分图匹配问题;
步骤2.3.3:利用匈牙利算法求解所述最大权重二分图匹配问题,把所有的关节点按照求解的结果连在一起,获得整的人体姿态信息。
本发明提供一种多目标人体2D姿态实时检测系统及检测方法,利用深度学习的方法编码关节的位置和由关节相互连接组成的骨骼的位置和方向,实现对单幅图像准确的人体的2D姿态估计,而且对于人员聚集复杂的情况,能够准确估计场景中的多个人体姿态,方便用户对人体的姿态进一步分析处理和挖掘,从而预测人的下一步行为。
附图说明
图1为本发明的一种多目标人体2D姿态实时检测系统的结构框图;
图2为本发明的一种多目标人体2D姿态实时检测方法的流程图;
图3为本发明的一种多目标人体2D姿态实时检测方法中采用的神经网络的结构图;
图4为本发明实施例提供的方法中步骤3.2中的二分图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示为本发明的多目标人体2D姿态实时检测系统的结构框图,本发明检测系统包括:图像采集模块1、实时处理模块2和可视化显示模块3。其中,图像采集模块1用于获取图像数据;实时处理模块2用于将图像数据输入到神经网络进行学习和预测,并根据获取的关节点位置的热点图和关节点之间的方向向量场的热点图生成人体的姿态信息。可视化显示模块3用于将预测得到的人体姿态信息通过线段连接的方式呈现给用户。
具体实施时,图像采集模块1为USB摄像机或者网络摄像机,用于获取人体图像信息并将图像信息转换成标准RGB图像。
实时处理模块2包括:神经网络子模块21和关节点连接子模块22。神经网络子模块21用于将图像数据输入到神经网络进行学习和预测,获取到关节点位置的热点图和关节点之间的方向向量场的热点图;方向向量场的热点图描述了两个关节点是否可以连接在一起组成人体的一部分骨骼。关节点连接子模块22用于对神经网络输出的两种热点图进行融合,将属于同一人体的关节点连接起来,构成完整的人体姿态信息。
如图2所示为本发明的一种多目标人体2D姿态实时检测方法的流程图,该检测方法包括如下步骤:
步骤1:获取图像数据;
具体实施时,通过USB摄像机或者网络摄像机获取待处理图像信息,将获得的图像信息转换成标准RGB图像。若是采用USB摄像机,可以通过OpenCV开源计算机视觉库直接获取RGB图像,若是网络摄像机则通过SDK获取到视频流后转码为RGB图像。
步骤2:将图像数据输入到神经网络进行学习和预测,利用神经网络提取特征,获取不同类型关节点的热点图S和关节点之间的方向向量场热点图L,根据关节点位置的热点图S和关节点之间的方向向量场的热点图L生成人体的姿态信息;
步骤3:将预测得到的人体姿态信息通过线段连接的方式呈现给用户。
人体姿势的特征学习是通过多层卷积神经网络从大量训练样本中学习得到的,步骤2具体包括:
步骤2.1:将历史图像数据作为神经网络的输入对神经网络模型进行训练;具体为:
步骤2.1.1:建立卷积神经网络的初始模型,卷积神经网络包括单通道阶段和多个双通道阶段,单通道阶段包括:
第一层和第二层为卷积层:对历史图像数据进行两层卷积处理;每一层采用64个3×3大小的卷积核对图像进行卷积操作,卷积步长为1,一个像素的填充;
第三层为池化层:对第一层和第二层的结果进行下采样处理;池化操作采用MaxPooling方法,滤波器尺寸为2×2,步长为2;
第四层和第五层为卷积层:对第三层的图像进行两层卷积处理;每一层采用128个3×3大小的卷积核对图像进行卷积操作,卷积步长为1,一个像素的填充;
第六层为池化层:对第四层和第五层的结果进行下采样处理;池化操作采用MaxPooling方法,滤波器尺寸为2×2,步长为2;
第七至第十层为卷积层:对第六层的图像进行四层卷积处理;每一层采用256个3×3大小的卷积核对图像进行卷积操作,卷积步长为1,一个像素的填充;
第十一层为池化层:对第七至第十层为卷积层的结果进行下采样处理;池化操作采用Max Pooling方法,滤波器尺寸为2×2,步长为2;
第十二层和第十三层为卷积层:将第十一层的图像进行两层卷积处理;每一层采用512个3×3大小的卷积核对图像进行卷积操作,卷积步长为1,一个像素的填充,最终得到用卷积神经网络学习到的输入图像的特征图F;
步骤2.1.2:将步骤2.1.1得到的输入图像的特征图F输入卷积神经网络的双通道阶段,得到不同类型关节点的热点图S和关节点之间的方向向量场热点图L,关节点的热点图S表示出一副图像中所有的关节点的位置信息,方向向量场热点图L有表示各个关节点之间的关联程度,由若干2D向量组成,2D向量的方向代表了关节连接成骨骼的方向;
在实际测试中,我们发现通过六个阶段的双通道学习,准确率达到最高,因此,在实际的应用中,我们将采用六阶段的双通道卷积神经网络,具体为:将步2.1.1得到的特征图F输入双通道卷积神经网络的第一阶段,得到第一阶段的预测的关节点的热点图S1和关节点之间的方向向量场热点图L1,得到的S1、L1和特征图F一起作为双通道卷积神经网络的第二阶段的输入,用第一阶段的结果加上原始特征图F一起进入第二阶段的神经网络可以得到更好的预测精度;得到第二阶段的预测的关节点的热点图S2和关节点之间的方向向量场热点图L2,以此类推,第t阶段的输入为t-1阶段的输出,再融合步骤2.1.1得到的特征图F,第六阶段的输出为最终得到的不同类型关节点的热点图S和关节点之间的方向向量场热点图。
通过神经网络可以得到预测的不同类型关节点的热点图S和关节点之间的方向向量场热点图L:
关节点的热点图S=(S1,S2,…,SJ)表示出一副图像中所有的关节点的位置信息,共有J种不同类型的关节,在关节点的热点图中任意位置P的值由公式1给出:
其中代表第k个人的j类型的关节热点图中位置P的值,Xj,k代表关节点的真实位置坐标,其中p代表位置P点的位置坐标,σ控制热点图辐射的范围,σ越大,以真实关节点为中心的辐射范围越大,σ越小,以真实关节点为中心的辐射范围越小。热点图就是以关节点为中心的一个辐射状的图,关节点附近的点在热点图上的值也会受到关节点的影响,离关节点越近的值越大,离关节点越远的值越小,而σ的大小代表了以真实关节点为中心的多大范围内的点会受到影响。
如果一张图片上有多个人,则对于某一类型的关节点的热点图Sj,位置P点可能有多个值,我们采用非极大值抑制的方法来保证热点图保留所有的关节点信息,如公式2所示:
关节点之间的方向向量场热点图L=(L1,L2,…,LC)表示各个关节点之间的关联程度,同时编码了骨骼的位置信息和方向信息,关节点之间的方向向量场热点图L由若干2D向量组成,2D向量的方向代表了关节连接成骨骼的方向,在关节点之间的方向向量场热点图L中任意位置P的值L* c,k(p)由公式3给出:
其中,xj2,k和xj1,k是骨骼C两端的两个关节点的位置坐标。
多阶双通道段卷积神经网络各个阶段神经网络的输入由公式4和公式5求得:
其中,St代表第t阶段关节点特征图,Lt代表第t阶段关节点之间的方向向量场热点图L,ρt和φt代表神经网络的输入与输出的映射函数。
步骤2.1.3:通过对于神经网络学习到的结果与真实数据之间的误差,利用反向传播算法,调整神经网络的参数,使得神经网络学习到的结果最接近标注数据的真实结果,从而得到训练好的神经网络模型。
具体实施时,我们通过L2损失函数P是神经网络预测值,P*是标注数据的真实真,来计算神经网络学习到的结果与真实数据之间的误差,然后利用反向传播算法,调整神经网络的参数使损失函数值减小并收敛于某一值,使得神经网络学习到的结果最接近标注数据的真实结果,从而得到神经网络模型。
获得训练完成的神经网络后,利用神经网络进行预测,具体为:
步骤2.2:在步骤2.1中我们得到了通过大量标注数据训练得到的神经网络模型,此模型用于对一张RGB图像进行分析预测,预测精度的高低影响整个系统的性能;将要检测的图像数据输入到训练完的神经网络模型,利用神经网络提取特征,得到对于该图像预测的不同类型关节点的热点图和关节点之间的方向向量场热点图;
步骤2.3:对神经网络输出的两种热点图进行融合,将属于同一人体的关节点连接起来,构成完整的人体姿态信息,具体为:
通过步骤2.2我们获得了一组多人的关节点集合其中Nj为关节类型j的数量,为关节类型j第m个关节点的位置坐标,我们需要把上述关节点按照实际情况连接起来组成一个完整的人体。
步骤2.3.1:将预测得到的关节点的热点图S和关节点之间的方向向量场热点图L转化成图论里求解最大权重K分图匹配问题,不同类型关节点的热点图S为K分图的节点,关节点之间的方向向量场热点图L代表二分图的边的权重,其中K代表不同关节类型的个数;
将预测得到的关节点的热点图S和关节点之间的方向向量场热点图L转化成图论里求解最大权重K(K代表不同关节类型的个数)分图匹配问题,不同类型热点图S为K分图的节点,二分图的边的权重由公式6计算,其中P(u)=(1-u)dj1+udj2,dj1和dj2为关节点的位置。
步骤2.3.2:利用贪心算法简化最大权重二分图匹配问题:根据人体关节的实际连接情况简化问题,比如人体的肘关节只与手腕关节和肩关节相连接,不与腿上的关节相连,将K分图的匹配问题化解成多个最大权重二分图匹配问题;简化后减少了求解时间,使系统具有更好的实时性,简化后的二分图如图4所示;
步骤2.3.3:利用匈牙利算法求解所述最大权重二分图匹配问题,把所有的关节点按照求解的结果连在一起,获得整的人体姿态信息。
本发明提供一种多目标人体2D姿态实时检测系统及方法,利用深度学习的方法编码关节的位置和由关节相互连接组成的骨骼的位置和方向,实现对单幅图像准确的人体的2D姿态估计,而且对于人员聚集复杂的情况,能够准确估计场景中的多个人体姿态,方便用户对人体的姿态进一步分析处理和挖掘,从而预测人的下一步行为。
以上所述仅为本发明的较佳实施例,并不用以限制本发明的思想,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种多目标人体2D姿态实时检测系统,其特征在于,包括:
图像采集模块,用于获取图像数据;
实时处理模块,用于将图像数据输入到神经网络进行学习和预测,并根据获取的关节点位置的热点图和关节点之间的方向向量场的热点图生成人体的姿态信息;
可视化显示模块,用于将预测得到的人体姿态信息通过线段连接的方式呈现给用户。
2.如权利要求1所述的多目标人体2D姿态实时检测系统,其特征在于,所述图像采集模块为USB摄像机或者网络摄像机,用于获取图像信息并将图像信息转换成标准RGB图像。
3.如权利要求1所述的多目标人体2D姿态实时检测系统,其特征在于,所述实时处理模块包括:
神经网络子模块,用于将图像数据输入到神经网络进行学习和预测,获取到关节点位置的热点图和关节点之间的方向向量场的热点图,方向向量场的热点图描述了两个关节点是否可以连接在一起组成人体的一部分骨骼;
关节点连接子模块,用于对神经网络输出的两种热点图进行融合,将属于同一人体的关节点连接起来,构成完整的人体姿态信息。
4.一种多目标人体2D姿态实时检测方法,其特征在于,包括:
步骤1:获取图像数据;
步骤2:将图像数据输入到神经网络进行学习和预测,利用神经网络提取特征,根据获取的关节点位置的热点图和关节点之间的方向向量场的热点图生成人体的姿态信息;
步骤3:将预测得到的人体姿态信息通过线段连接的方式呈现给用户。
5.如权利要求4所述的多目标人体2D姿态实时检测方法,其特征在于,所述步骤1具体为:
通过USB摄像机或者网络摄像机获取待处理图像信息,将获得的图像信息转换成标准RGB图像。
6.如权利要求4所述的多目标人体2D姿态实时检测方法,其特征在于,所述步骤2包括:
步骤2.1:将历史图像数据作为神经网络的输入对神经网络模型进行训练;
步骤2.2:将要检测的图像数据输入到训练完的神经网络模型,利用神经网络提取特征,得到对于该图像预测的不同类型关节点的热点图和关节点之间的方向向量场热点图;
步骤2.3:对神经网络输出的两种热点图进行融合,将属于同一人体的关节点连接起来,构成完整的人体姿态信息。
7.如权利要求6所述的多目标人体2D姿态实时检测方法,其特征在于,所述步骤2.1包括:
步骤2.1.1:建立卷积神经网络的初始模型,卷积神经网络包括单通道阶段和多个双通道阶段,单通道阶段包括:
第一层和第二层为卷积层:对历史图像数据进行卷积处理;
第三层为池化层:对第一层和第二层的结果进行下采样处理;
第四层和第五层为卷积层:对第三层的图像进行两层卷积处理;
第六层为池化层:对第四层和第五层的结果进行下采样处理;
第七至第十层为卷积层:对第六层的图像进行四层卷积处理;
第十一层为池化层:对第七至第十层为卷积层的结果进行下采样处理;
第十二层和第十三层为卷积层:将第十一层的图像进行两层卷积处理,得到输入图像的特征图;
步骤2.1.2:将步骤2.1.1得到的输入图像的特征图输入卷积神经网络的双通道阶段,得到不同类型关节点的热点图S和关节点之间的方向向量场热点图L,关节点的热点图S表示出一副图像中所有的关节点的位置信息,方向向量场热点图L有表示各个关节点之间的关联程度,由若干2D向量组成,2D向量的方向代表了关节连接成骨骼的方向;
步骤2.1.3:通过对于神经网络学习到的结果与真实数据之间的误差,利用反向传播算法,调整神经网络的参数,使得神经网络学习到的结果最接近标注数据的真实结果,从而得到训练好的神经网络模型。
8.如权利要求6所述的多目标人体2D姿态实时检测方法,其特征在于,所述步骤2.3包括:
步骤2.3.1:将预测得到的关节点的热点图S和关节点之间的方向向量场热点图L转化成图论里求解最大权重K分图匹配问题,不同类型关节点的热点图S为K分图的节点,关节点之间的方向向量场热点图L代表二分图的边的权重,其中K代表不同关节类型的个数;
步骤2.3.2:利用贪心算法简化最大权重二分图匹配问题:根据人体关节的实际连接情况简化问题,将K分图的匹配问题化解成多个最大权重二分图匹配问题;
步骤2.3.3:利用匈牙利算法求解所述最大权重二分图匹配问题,把所有的关节点按照求解的结果连在一起,获得整的人体姿态信息。
CN201711102577.3A 2017-11-10 2017-11-10 一种多目标人体2d姿态实时检测系统及检测方法 Withdrawn CN107886069A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711102577.3A CN107886069A (zh) 2017-11-10 2017-11-10 一种多目标人体2d姿态实时检测系统及检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711102577.3A CN107886069A (zh) 2017-11-10 2017-11-10 一种多目标人体2d姿态实时检测系统及检测方法

Publications (1)

Publication Number Publication Date
CN107886069A true CN107886069A (zh) 2018-04-06

Family

ID=61779835

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711102577.3A Withdrawn CN107886069A (zh) 2017-11-10 2017-11-10 一种多目标人体2d姿态实时检测系统及检测方法

Country Status (1)

Country Link
CN (1) CN107886069A (zh)

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108520251A (zh) * 2018-04-20 2018-09-11 北京市商汤科技开发有限公司 关键点检测方法及装置、电子设备和存储介质
CN108564586A (zh) * 2018-06-22 2018-09-21 高鹏 一种基于深度学习的人体曲线测量方法及系统
CN108596098A (zh) * 2018-04-24 2018-09-28 北京京东尚科信息技术有限公司 人体部件的解析方法、系统、设备和存储介质
CN108717531A (zh) * 2018-05-21 2018-10-30 西安电子科技大学 基于Faster R-CNN的人体姿态估计方法
CN108830139A (zh) * 2018-04-27 2018-11-16 北京市商汤科技开发有限公司 人体关键点的深度前后关系预测方法、装置、介质及设备
CN108960211A (zh) * 2018-08-10 2018-12-07 罗普特(厦门)科技集团有限公司 一种多目标人体姿态检测方法以及系统
CN109101919A (zh) * 2018-08-03 2018-12-28 北京字节跳动网络技术有限公司 用于生成信息的方法和装置
CN109101901A (zh) * 2018-07-23 2018-12-28 北京旷视科技有限公司 人体动作识别及其神经网络生成方法、装置和电子设备
CN109145867A (zh) * 2018-09-07 2019-01-04 北京旷视科技有限公司 人体姿态估计方法、装置、系统、电子设备、存储介质
CN109344706A (zh) * 2018-08-28 2019-02-15 杭州电子科技大学 一种可单人操作的人体特殊姿势照片的获取方法
CN109522910A (zh) * 2018-12-25 2019-03-26 浙江商汤科技开发有限公司 关键点检测方法及装置、电子设备和存储介质
CN109583341A (zh) * 2018-11-19 2019-04-05 清华大学深圳研究生院 对包含人像的图像的多人骨骼关键点检测方法及装置
CN109614882A (zh) * 2018-11-19 2019-04-12 浙江大学 一种基于人体姿态估计的暴力行为检测系统及方法
CN109657700A (zh) * 2018-11-22 2019-04-19 南京茶非氪信息科技有限公司 一种宏观区域连通道热度检测算法
CN109740522A (zh) * 2018-12-29 2019-05-10 广东工业大学 一种人员检测方法、装置、设备及介质
CN109948453A (zh) * 2019-02-25 2019-06-28 华中科技大学 一种基于卷积神经网络的多人姿态估计方法
CN110147738A (zh) * 2019-04-29 2019-08-20 中国人民解放军海军特色医学中心 一种驾驶员疲劳监测预警方法及系统
CN110188633A (zh) * 2019-05-14 2019-08-30 广州虎牙信息科技有限公司 人体体态指标预测方法、装置、电子设备及存储介质
CN110298279A (zh) * 2019-06-20 2019-10-01 暨南大学 一种肢体康复训练辅助方法及系统、介质、设备
CN110298332A (zh) * 2019-07-05 2019-10-01 海南大学 行为识别的方法、系统、计算机设备和存储介质
CN110390705A (zh) * 2018-04-16 2019-10-29 北京搜狗科技发展有限公司 一种生成虚拟形象的方法及装置
CN110472462A (zh) * 2018-05-11 2019-11-19 北京三星通信技术研究有限公司 姿态估计方法、基于姿态估计的处理方法及电子设备
CN110495889A (zh) * 2019-07-04 2019-11-26 平安科技(深圳)有限公司 体态评估方法、电子装置、计算机设备及存储介质
CN110633608A (zh) * 2019-03-21 2019-12-31 广州中科凯泽科技有限公司 一种姿态图像的人体肢体相似度评估方法
CN110647819A (zh) * 2019-08-28 2020-01-03 中国矿业大学 一种井下人员跨越皮带异常行为检测方法及装置
CN111027670A (zh) * 2019-11-04 2020-04-17 重庆特斯联智慧科技股份有限公司 特征图处理方法、装置、电子设备及存储介质
CN111274954A (zh) * 2020-01-20 2020-06-12 河北工业大学 基于改进姿态估计算法的嵌入式平台实时跌倒检测方法
CN111291692A (zh) * 2020-02-17 2020-06-16 咪咕文化科技有限公司 视频场景识别方法、装置、电子设备及存储介质
CN111738091A (zh) * 2020-05-27 2020-10-02 复旦大学 一种基于多任务深度学习的姿态估计与人体解析系统
CN112001217A (zh) * 2020-06-18 2020-11-27 天津博诺智创机器人技术有限公司 基于深度学习的多人人体姿态估计算法
CN112836652A (zh) * 2021-02-05 2021-05-25 浙江工业大学 一种基于事件相机的多阶段人体姿态估计方法
CN113362452A (zh) * 2021-06-07 2021-09-07 中南大学 一种手部姿态三维重建方法、装置及存储介质
CN113822202A (zh) * 2021-09-24 2021-12-21 河南理工大学 一种基于OpenPose和PyQt的太极拳姿态检测系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069423A (zh) * 2015-07-29 2015-11-18 北京格灵深瞳信息技术有限公司 一种人体姿态检测方法及装置
CN106650827A (zh) * 2016-12-30 2017-05-10 南京大学 基于结构指导深度学习的人体姿态估计方法和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069423A (zh) * 2015-07-29 2015-11-18 北京格灵深瞳信息技术有限公司 一种人体姿态检测方法及装置
CN106650827A (zh) * 2016-12-30 2017-05-10 南京大学 基于结构指导深度学习的人体姿态估计方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ZHE CAO ET AL: "Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields", 《ARXIV:1611.08050》 *

Cited By (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110390705B (zh) * 2018-04-16 2023-11-10 北京搜狗科技发展有限公司 一种生成虚拟形象的方法及装置
CN110390705A (zh) * 2018-04-16 2019-10-29 北京搜狗科技发展有限公司 一种生成虚拟形象的方法及装置
CN108520251A (zh) * 2018-04-20 2018-09-11 北京市商汤科技开发有限公司 关键点检测方法及装置、电子设备和存储介质
CN108596098B (zh) * 2018-04-24 2021-10-01 北京京东尚科信息技术有限公司 人体部件的解析方法、系统、设备和存储介质
CN108596098A (zh) * 2018-04-24 2018-09-28 北京京东尚科信息技术有限公司 人体部件的解析方法、系统、设备和存储介质
CN108830139A (zh) * 2018-04-27 2018-11-16 北京市商汤科技开发有限公司 人体关键点的深度前后关系预测方法、装置、介质及设备
CN110472462A (zh) * 2018-05-11 2019-11-19 北京三星通信技术研究有限公司 姿态估计方法、基于姿态估计的处理方法及电子设备
CN108717531A (zh) * 2018-05-21 2018-10-30 西安电子科技大学 基于Faster R-CNN的人体姿态估计方法
CN108717531B (zh) * 2018-05-21 2021-06-08 西安电子科技大学 基于Faster R-CNN的人体姿态估计方法
CN108564586A (zh) * 2018-06-22 2018-09-21 高鹏 一种基于深度学习的人体曲线测量方法及系统
CN109101901A (zh) * 2018-07-23 2018-12-28 北京旷视科技有限公司 人体动作识别及其神经网络生成方法、装置和电子设备
CN109101901B (zh) * 2018-07-23 2020-10-27 北京旷视科技有限公司 人体动作识别及其神经网络生成方法、装置和电子设备
CN109101919A (zh) * 2018-08-03 2018-12-28 北京字节跳动网络技术有限公司 用于生成信息的方法和装置
CN108960211A (zh) * 2018-08-10 2018-12-07 罗普特(厦门)科技集团有限公司 一种多目标人体姿态检测方法以及系统
CN109344706A (zh) * 2018-08-28 2019-02-15 杭州电子科技大学 一种可单人操作的人体特殊姿势照片的获取方法
CN109145867A (zh) * 2018-09-07 2019-01-04 北京旷视科技有限公司 人体姿态估计方法、装置、系统、电子设备、存储介质
CN109145867B (zh) * 2018-09-07 2021-08-10 北京旷视科技有限公司 人体姿态估计方法、装置、系统、电子设备、存储介质
CN109583341A (zh) * 2018-11-19 2019-04-05 清华大学深圳研究生院 对包含人像的图像的多人骨骼关键点检测方法及装置
CN109614882A (zh) * 2018-11-19 2019-04-12 浙江大学 一种基于人体姿态估计的暴力行为检测系统及方法
CN109657700B (zh) * 2018-11-22 2022-11-11 南京茶非氪信息科技有限公司 一种宏观区域连通道热度检测方法
CN109657700A (zh) * 2018-11-22 2019-04-19 南京茶非氪信息科技有限公司 一种宏观区域连通道热度检测算法
CN109522910B (zh) * 2018-12-25 2020-12-11 浙江商汤科技开发有限公司 关键点检测方法及装置、电子设备和存储介质
CN109522910A (zh) * 2018-12-25 2019-03-26 浙江商汤科技开发有限公司 关键点检测方法及装置、电子设备和存储介质
CN109740522A (zh) * 2018-12-29 2019-05-10 广东工业大学 一种人员检测方法、装置、设备及介质
CN109948453A (zh) * 2019-02-25 2019-06-28 华中科技大学 一种基于卷积神经网络的多人姿态估计方法
CN110633608A (zh) * 2019-03-21 2019-12-31 广州中科凯泽科技有限公司 一种姿态图像的人体肢体相似度评估方法
CN110147738A (zh) * 2019-04-29 2019-08-20 中国人民解放军海军特色医学中心 一种驾驶员疲劳监测预警方法及系统
CN110188633B (zh) * 2019-05-14 2023-04-07 广州虎牙信息科技有限公司 人体体态指标预测方法、装置、电子设备及存储介质
CN110188633A (zh) * 2019-05-14 2019-08-30 广州虎牙信息科技有限公司 人体体态指标预测方法、装置、电子设备及存储介质
CN110298279A (zh) * 2019-06-20 2019-10-01 暨南大学 一种肢体康复训练辅助方法及系统、介质、设备
CN110495889A (zh) * 2019-07-04 2019-11-26 平安科技(深圳)有限公司 体态评估方法、电子装置、计算机设备及存储介质
CN110298332A (zh) * 2019-07-05 2019-10-01 海南大学 行为识别的方法、系统、计算机设备和存储介质
CN110647819A (zh) * 2019-08-28 2020-01-03 中国矿业大学 一种井下人员跨越皮带异常行为检测方法及装置
CN110647819B (zh) * 2019-08-28 2022-02-01 中国矿业大学 一种井下人员跨越皮带异常行为检测方法及装置
CN111027670B (zh) * 2019-11-04 2022-07-22 重庆特斯联智慧科技股份有限公司 特征图处理方法、装置、电子设备及存储介质
CN111027670A (zh) * 2019-11-04 2020-04-17 重庆特斯联智慧科技股份有限公司 特征图处理方法、装置、电子设备及存储介质
CN111274954A (zh) * 2020-01-20 2020-06-12 河北工业大学 基于改进姿态估计算法的嵌入式平台实时跌倒检测方法
CN111291692A (zh) * 2020-02-17 2020-06-16 咪咕文化科技有限公司 视频场景识别方法、装置、电子设备及存储介质
CN111291692B (zh) * 2020-02-17 2023-10-20 咪咕文化科技有限公司 视频场景识别方法、装置、电子设备及存储介质
CN111738091A (zh) * 2020-05-27 2020-10-02 复旦大学 一种基于多任务深度学习的姿态估计与人体解析系统
CN112001217A (zh) * 2020-06-18 2020-11-27 天津博诺智创机器人技术有限公司 基于深度学习的多人人体姿态估计算法
CN112836652A (zh) * 2021-02-05 2021-05-25 浙江工业大学 一种基于事件相机的多阶段人体姿态估计方法
CN112836652B (zh) * 2021-02-05 2024-04-19 浙江工业大学 一种基于事件相机的多阶段人体姿态估计方法
CN113362452A (zh) * 2021-06-07 2021-09-07 中南大学 一种手部姿态三维重建方法、装置及存储介质
CN113822202A (zh) * 2021-09-24 2021-12-21 河南理工大学 一种基于OpenPose和PyQt的太极拳姿态检测系统

Similar Documents

Publication Publication Date Title
CN107886069A (zh) 一种多目标人体2d姿态实时检测系统及检测方法
CN110532861B (zh) 基于骨架引导多模态融合神经网络的行为识别方法
US20180186452A1 (en) Unmanned Aerial Vehicle Interactive Apparatus and Method Based on Deep Learning Posture Estimation
CN111191622A (zh) 基于热力图和偏移向量的姿态识别方法、系统及存储介质
CN103003846B (zh) 关节区域显示装置、关节区域检测装置、关节区域归属度计算装置、关节状区域归属度计算装置以及关节区域显示方法
CN110472604B (zh) 一种基于视频的行人与人群行为识别方法
CN112801015B (zh) 一种基于注意力机制的多模态人脸识别方法
Mehrizi et al. Toward marker-free 3D pose estimation in lifting: A deep multi-view solution
CN111523378B (zh) 一种基于深度学习的人体行为预测方法
CN116012950B (zh) 一种基于多重心时空注意图卷积网络的骨架动作识别方法
CN113128424B (zh) 基于注意力机制的图卷积神经网络动作识别方法
CN112329525A (zh) 一种基于时空图卷积神经网络的手势识别方法和装置
Jia et al. Two-stream temporal convolutional networks for skeleton-based human action recognition
CN113221726A (zh) 一种基于视觉与惯性信息融合的手部姿态估计方法及系统
CN112036260A (zh) 一种自然环境下多尺度子块聚合的表情识别方法及系统
An et al. Real-time monocular human depth estimation and segmentation on embedded systems
CN114724185A (zh) 一种轻量型的多人姿态跟踪方法
Yan et al. Human-object interaction recognition using multitask neural network
CN116895098A (zh) 基于深度学习和隐私保护的视频人体动作识别系统与方法
Aldahoul et al. A comparison between various human detectors and CNN-based feature extractors for human activity recognition via aerial captured video sequences
CN112199994B (zh) 一种实时检测rgb视频中的3d手与未知物体交互的方法和装置
Kiyokawa et al. Efficient collection and automatic annotation of real-world object images by taking advantage of post-diminished multiple visual markers
CN116721468A (zh) 一种基于多人姿态估计动作幅度检测的智能导播切换方法
CN115496859A (zh) 基于散乱点云交叉注意学习的三维场景运动趋势估计方法
CN115908497A (zh) 一种基于人体拓扑感知网络的三维人体姿态估计方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20180406

WW01 Invention patent application withdrawn after publication