CN105069413A - 一种基于深度卷积神经网络的人体姿势识别方法 - Google Patents

一种基于深度卷积神经网络的人体姿势识别方法 Download PDF

Info

Publication number
CN105069413A
CN105069413A CN201510444505.1A CN201510444505A CN105069413A CN 105069413 A CN105069413 A CN 105069413A CN 201510444505 A CN201510444505 A CN 201510444505A CN 105069413 A CN105069413 A CN 105069413A
Authority
CN
China
Prior art keywords
neural network
layer
image
independent
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510444505.1A
Other languages
English (en)
Other versions
CN105069413B (zh
Inventor
董乐
张宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201510444505.1A priority Critical patent/CN105069413B/zh
Publication of CN105069413A publication Critical patent/CN105069413A/zh
Application granted granted Critical
Publication of CN105069413B publication Critical patent/CN105069413B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands

Abstract

该发明公开了一种基于深度卷积神经网络的人体姿势识别方法,属于模式识别与信息处理技术领域,涉及计算机视觉方面的行为识别任务,尤其涉及基于深度卷积神经网络的人体姿势估计系统的研究与实现方案。该神经网络具有的独立输出层和独立损失函数是为人体关节定位而设计的。ILPN由一个输入层,7个隐含层,2个独立的输出层组成。其中第1~6个隐含层是卷积层,用于特征提取,第7个隐含层(fc7)是全连接层。输出层由两个独立的部分组成:fc8-x和fc8-y。其中fc8-x用于预测关节的x坐标,fc8-y用于预测关节的y坐标。在模型训练时,这两个输出都会有一个独立的softmax损失函数来指导模型的学习。从而具有训练简单迅速,计算量小,准确度高的优点。

Description

一种基于深度卷积神经网络的人体姿势识别方法
技术领域
本发明属于模式识别与信息处理技术领域,涉及计算机视觉方面的行为识别任务,尤其涉及基于深度卷积神经网络的人体姿势估计系统的研究与实现方案。
背景技术
人体姿势估计是指在图像中定位人体关节或人体各部分位置的过程。它是计算机视觉中的一个关键问题,是基于图像的行为识别的基础技术。人体姿势估计可被用于视觉监控系统,人体分割,机器人控制,体感游戏等领域。人体姿势估计的难点在于:身体关节点小,不易检测;身体自身遮挡严重,外貌变化大,面内和面外旋转(in-planeandout-planerotations)造成视觉变化大。姿势估计的主流方法都是基于图结构模型(PS,PictorialStructuresModel)的。图结构模型是一个通用物体结构表达模型。在图结构模型下,一个物体(或人)的结构被表示为一个一元项和一个二元项的和,其中,一元项表示人体单独的一个部分,二元项表示两个(或多个)部分之间的空间关系。一元项和二元项的和构成一个能量函数,最小化这个能量函数可以得到一个最优的结构表达。基于图结构的人体姿势估计方法的流程为:
1.人体每个单独部分的表示。通常的方法是在人体的特定部分提取图像特征来训练可以表示该部分的模板。在训练好模板以后,以重叠的滑动窗口(overlappingslidingwindows)去扫描图片,检测出许多可能的位置;
2.人体各个部分的空间关系的表示。人体各部分空间约束可以是多方面的,例如,各个部分同时出现的概率,在同一直线上的概率以及角度关系,距离约束等等。空间约束构成了图结构模型的二元项;
3.人体姿势推理。由于人体姿势复杂多样,人体各部分之间存在多种空间约束。如果对人体各个部分都施加约束,最终会形成一个图。这个图的点(node)表示人体的各个部分(即一元项),边(edge)表示人体各个部分的约束(即二元项)。优化这样一个问题会耗费大量时间,甚至使问题不可计算。为了高效的推理出人体姿势,通常会将各个部分之间的约束简化为两个相邻部分的空间约束,即图结构简化为树形结构。
传统方法有两个局限性。首先,人工设计的图像特征具有局限性,例如,有的特征适合表示具有清晰纹理的物体,有的特征适合表示具有清晰轮廓的物体。设计一种适合人体姿势估计的特征需要大量的经验和研究。除此之外,空间模型也具有局限性。传统的人体姿势估计方法为了计算效率,通常需要假设人体姿势构成树形结构。这种假设显然会限制其模型的表达能力,例如,在有人体存在自身遮挡的情况下,人体姿势通常并不是树形的,而是有环图。在树形结构的假设下,人体姿势估计的准确度和使用范围都被限制了。
深度学习技术的逐渐成熟,为人体姿势估计提供了新的工具。基于深度学习的方法可以分为两类:一类是利用深度卷积神经网络来学习图像特征,以代替传统的人工设计的特征;另一类是利用深度卷积神经网络的非线性映射做非线性推理,以突破树形结构的限制。但现有的基于深度学习的方法主要有以下缺陷:
1.大多数方法只是简单地将AlexNet直接应用到姿势估计中。而AlexNet最初是为图像分类任务而设计的;
2.大多数方法将人体关节定位问题阐述为回归问题,这样的阐述虽然简单,但却让深度网络的训练变得困难;
3.有的方法通过训练基于卷积神经网络的检测器(ConvolutionalPartDetector)来检测人体部分的位置。这种方法具有较好的准确度,但由于其需要使用滑窗进行检测,它的效率并不高;
为了解决这些问题,本方法为姿势估计阐述为分类问题,并设计了一个针对姿势估计的深度网络:ILPN(IndependentLossesPoseNet)来进行关节定位。在FLICdataset上的结果表明,我们的方法取得了当前最高的准确率。在Buffydataset上的跨数据集泛化能力(cross-datasetgeneralization)测试取得了具有竞争力的结果。值得一提的是,我们的模型训练和测试都是在廉价设备(Dual-CoreCPU+NVGTX750)上进行的。
发明内容
本发明的目的在于提出一种快速准确地估计出RGB图像中人体姿势的方法,由此,为基于图像的行为识别提供良好的基础。
为了克服传统姿势估计方法由于人工设计图像特征和空间模型导致姿势估计准确度上的不足,本发明研究了如何在保证姿势估计速度的前提下,获得更高的姿势准确率。本发明设计了一个名为ILPN(IndependentLossesPoseNet)的模型。该模型具有的独立输出层和独立损失函数是为人体关节定位而设计的。ILPN由一个输入层,7个隐含层,2个独立的输出层组成。其中第1~6个隐含层(conv1~conv6)是卷积层(convolutionallayer),用于特征提取,第7个隐含层(fc7)是全连接层(fully-connectedlayer)。输出层由两个独立的部分组成:fc8-x和fc8-y。其中fc8-x用于预测关节的x坐标,fc8-y用于预测关节的y坐标。在模型训练时,这两个输出都会有一个独立的softmax损失函数来指导模型的学习。
一种基于深度卷积神经网络的人体姿势识别方法,该方法包括:
步骤1:获得训练图像并对图像进行预处理:首先对训练图像进行数据扩展,再对扩展后的图像进行灰度处理;
步骤2:使用步骤1获得的训练样本训练人体姿势的神经网络;
步骤2.1:对图像依次进行卷积处理,MaxPooling处理,局部响应归一化处理,为神经网络的第一层;
步骤2.2:对步骤2.1的结果依次进行卷积处理,局部响应归一化处理,为神经网络的第二层;
步骤2.3:对步骤2.2的结果依次进行4次卷积处理,为神经网络的第四~六层;步骤2.4:将第六层以全连接的方式获得第七层;
步骤2.5:将第七层以全连接的方式获得输出层:输出层被分为两个独立的部分,每个部分都额外与一个独立的损失函数相连接,分别计算模型预测的x和y坐标的误差,即在后向传播时,两个损失函数独立计算后向传播的梯度,输出层两个独立的部分也独立计算后向传播的梯度;当这两部分的梯度都计算完成后,第七层对这两部分的梯度求和并计算自己的梯度;通过计算输出层两个独立部分的最强响应神经元,获得一个人体关节的坐标。
步骤2.6:依次使用训练图像多次重复步骤2.1~步骤2.6的方法训练神经网络,直到模型的损失收敛,即损失降到一定程度后不再降低,获得可准确定位人体关节的神经网络;
步骤2.7:通过步骤2.1~步骤2.6,对每个关节训练一个深度神经网络来获得多个不同关节的坐标,这些坐标最终构成一个完整的人体姿势;
步骤3:利用获得测试图像,利用步骤2训练得到的人体姿势估计神经网络来估计测试图像中的人体姿势;最后,通过查找步骤1中获得的坐标映射表,将统一尺度下的人体姿势映射回原图像尺度下。
进一步的,所述步骤1中对训练图像的数据扩展包括:对图像RGB通道及其标注同时进行多次中心旋转,水平平移,水平翻转以及将图像尺寸伸缩到统一大小。
本发明具有以下优点:
将关节定位问题建模为坐标分类问题,而不是回归问题。这极大地降低了模型的训练难度。因为坐标分类问题将模型的输出约束到图片坐标空间之内,而回归问题的输出是整个实数空间。同时,两个独立的输出层以及独立的损失函数在模型训练是可以避免相互干扰。模型不会因为fc8-x的错误输出而惩罚fc8-y,反之亦然。最后,因为fc8-x和fc8-y预测的是同一个关节坐标的不同维度,所以他们可以共享该关节的视觉特征,即共享conv1~conv6所提取的特征。
1.从姿势估计的准确度考虑,本发明利用深度卷积神经网络强大的学习能力学习对人体姿势估计有效的图像特征,避免了人工设计的图像特征的局限性;
2.从方法的适用范围考虑,本发明利用深度神经网络对图像特征进行非线性映射来获得人体姿势,本发明避免了人工设计空间模型的局限性;
3.从模型训练效率和系统运行效率考虑,本发明的深度卷积神经网络的输出层经过特殊设计,具有易训练,准确度高的特点。通过合理控制深度卷积神经网络的规模。使系统在运行时节省了空间和时间开销。
附图说明
图1是本发明所述的系统框架。
图2是本发明所述的深度卷积神经网络结构。
图3是本发明所提取的人体姿势特征。
具体实施方式
为解决上述问题,本发明提出的基于深度卷积神经网络的人体姿势估计系统具体实施步骤如下:
步骤一:预处理。数据增强对于深度卷积神经网络的训练有至关重要的作用。在模型训练阶段,本发明针对姿势估计问题,采用的数据增强方法是:通过旋转、平移、尺度变换等方式,对训练样本进行增强,迫使模型学习到的具有旋转、平移、尺度变换具有鲁棒性的特征。同时,这些操作也为模型训练提供了大量伪造样本。在模型运行阶段,只需要对输入图片进行缩放,使之适应深度卷积神经网络的输入层大小,并且记录缩放前后像素坐标的对应关系,保存为映射表,以备后处理使用。
步骤二:人体姿势图像特征的提取。人体姿势的特征学习是通过多层卷积神经网络从大量训练样本中学习得到的。在模型运行阶段,模型从图像中提取特征。本发明使用6个卷积层来提取图像特征。并且为了减小模型的复杂度,在第一层卷积层后使用了一个MaxPooling操作。为了提高模型的推广性,在MaxPooling和第二层卷积层后都进行了局部响应归一化操作。具体的网络结构为:
(1)输入层大小为220*220*3,即输入图片为长宽均为220个像素的RGB图像,我们将图像存储在数据库中;
(2)第一层隐含层是卷积层+MaxPooling+局部响应归一化(LocalResponseNormalization)的模式,.已有大量实验证明这是一种较好的图像特征提取模式:
0 1 1 = C o n v ( X 220 × 220 × 3 , K 10 × 10 × 3 , s = 2 , n = 96 ) (公式1)
0 2 1 = M a x P o o l ( 0 1 1 , K 4 × 4 , s = 2 ) (公式2)
0 3 1 = L R N ( 0 2 1 , α = 10 - 4 , β = 0.75 , κ = 2 , m = 5 ) (公式3)
其中,X是第一个隐含层的输入,即RGB图像;分别是第一个隐含层中卷积层的输出,MaxPooling的输出,以及局部响应归一化的输出;K是卷积核(Kernel),它由多个神经元(neuron)组成;s是卷积核在x和y方向上移动的步长;n是卷积核的个数;α,β,κ,m是LRN的参数,利用相邻m个卷积核进行归一化:
b x , y i = a x , y i ( κ + α · Σ j = max ( 0 , i - n / 2 ) min ( N - 1 , i + n / 2 ) a x , y j ) β
(3)第二层隐含层是卷积层+局部响应归一化的模式:
0 1 2 = C o n v ( 0 3 1 , K 6 × 6 × 2 , s = 2 , n = 256 ) (公式4)
0 2 2 = L R N ( 0 1 2 , α = 10 - 4 , β = 0.75 , κ = 2 , m = 5 ) (公式5)
虽然MaxPooling可以降低模型的复杂度,但是会损失像素精度。而对于姿势估计而言,关节定位的精度是主要需求之一,所以我们只在第一层隐含层使用MaxPooling。
(4)第三层隐含层:
0 3 = C o n v ( 0 2 2 , K 6 × 6 × 96 , s = 1 , n = 256 ) (公式6)
(5)第四层隐含层:
O4=Conv(O3,K5×5×256,s=1,n=384)(公式7)
(6)第五层隐含层;
O5=Conv(O4,K7×7×384,s=1,n=256)(公式8)(7)第六层是卷积层,卷积核大小为7*7,FeatureMap个数为256,步长为1。
O6=Conv(O5,K7×7×256,s=1,n=256)(公式9)
步骤三:人体姿势图像特征到人体姿势的映射。本发明通过两个全连接层实现非线性变换。映射的输入是步骤二生成的256个FeatureMap,它们以全连接的方式连接到第七层(全连接层),第七层再以全连接的方式连接到第八层(输出层)。输出层被分隔为两个独立的部分,分别表示图像的两个坐标。在训练的时候,这两个独立的部分分别设置一个softmax损失函数来指导模型的学习。具体的网络结构为:
(8)第七层是全连接层,神经元个数为1024个:
o i 7 = Σ j = 1 7 × 7 × 256 Re L U ( w j 7 · o j 6 + b j 7 )
其中,是全连接层的第j个神经元,是全连接层的第j个神经元与第六层隐含层的连接参数;ReLU是受限的线性单元(RectifiedLinearUnits),其计算公式如下:
Re L U ( z ) = z i f z > 0 0 o t h e r w i s e
ReLU的使用使神经网络的训练时间极大的缩短,并且对过拟合起到一定的抑制作用。
(9)输出层是全连接层,神经元个数为440个,输出层后连接损失层,损失层只用于训练神经网络;
损失层是两个softmaxloss,第一个softmaxloss连接到输出层的前220个神经元(fc8-x),第二个softmaxloss链接到输出层的后220个神经元(fc8-y)。fc8-x的每个神经元表示图像坐标系下一个像素的x坐标,fc8-y的每个神经元表示图像坐标系下一个像素的y坐标。通过fc8-x和fc8-y神经元的响应可以唯一确定一个图像坐标系下的一个像素点:
( x ^ i , y ^ i ) = ( arg max ( o x ) , arg max ( o y ) )
其中,是模型预测的第i个关节的坐标,ox和oy分别是fc8-x和fc8-y的输出向量,argmax()用于计算最大值所在的位置。
由于使用了两个独立的输出层和独立的损失函数,在使用后向传播算法(BackPropagation)时,第七层必须等待fc8-x和fc8-y的梯度都计算完成以后才开始计算自己后向传播的梯度。fc8-x和fc8-y第n个神经元的计算公式为:
∂ 1 o s s ( o , k ) ∂ o n = p k ( o ) - δ n k
其中,
δ n k = 1 n = k 0 n ≠ k
其中,o为fc8-x或fc8-y的输出,n为神经元编号,k为真值(groundtruth)神经元的编号,loss()是softmax函数
步骤四:在模型运行阶段,将步骤三输出的关节坐标通过步骤一记录的映射表,还原到预处理之前的图像坐标下。最终,多个关节坐标的组合构成一个完整的人体姿势。

Claims (2)

1.一种基于深度卷积神经网络的人体姿势识别方法,该方法包括:
步骤1:获得训练图像并对图像进行预处理:首先对训练图像进行数据扩展,再对扩展后的图像进行灰度处理;
步骤2:使用步骤1获得的训练样本训练人体姿势的神经网络;
步骤2.1:对图像依次进行卷积处理,MaxPooling处理,局部响应归一化处理,为神经网络的第一层;
步骤2.2:对步骤2.1的结果依次进行卷积处理,局部响应归一化处理,为神经网络的第二层;
步骤2.3:对步骤2.2的结果依次进行4次卷积处理,为神经网络的第四~六层;步骤2.4:将第六层以全连接的方式获得第七层;
步骤2.5:将第七层以全连接的方式获得输出层:输出层被分为两个独立的部分,每个部分都额外与一个独立的损失函数相连接,分别计算模型预测的x和y坐标的误差,即在后向传播时,两个损失函数独立计算后向传播的梯度,输出层两个独立的部分也独立计算后向传播的梯度;当这两部分的梯度都计算完成后,第七层对这两部分的梯度求和并计算自己的梯度;通过计算输出层两个独立部分的最强响应神经元,获得一个人体关节的坐标。
步骤2.6:依次使用训练图像多次重复步骤2.1~步骤2.6的方法训练神经网络,直到模型的损失收敛,即损失降到一定程度后不再降低,获得可准确定位人体关节的神经网络;
步骤2.7:通过步骤2.1~步骤2.6,对每个关节训练一个深度神经网络来获得多个不同关节的坐标,这些坐标最终构成一个完整的人体姿势;
步骤3:利用获得测试图像,利用步骤2训练得到的人体姿势估计神经网络来估计测试图像中的人体姿势;最后,通过查找步骤1中获得的坐标映射表,将统一尺度下的人体姿势映射回原图像尺度下。
2.如权利要求1所述的一种基于深度卷积神经网络的人体姿势识别方法,其特征在于所述步骤1中对训练图像的数据扩展包括:对图像RGB通道及其标注同时进行多次中心旋转,水平平移,水平翻转以及将图像尺寸伸缩到统一大小。
CN201510444505.1A 2015-07-27 2015-07-27 一种基于深度卷积神经网络的人体姿势识别方法 Expired - Fee Related CN105069413B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510444505.1A CN105069413B (zh) 2015-07-27 2015-07-27 一种基于深度卷积神经网络的人体姿势识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510444505.1A CN105069413B (zh) 2015-07-27 2015-07-27 一种基于深度卷积神经网络的人体姿势识别方法

Publications (2)

Publication Number Publication Date
CN105069413A true CN105069413A (zh) 2015-11-18
CN105069413B CN105069413B (zh) 2018-04-06

Family

ID=54498775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510444505.1A Expired - Fee Related CN105069413B (zh) 2015-07-27 2015-07-27 一种基于深度卷积神经网络的人体姿势识别方法

Country Status (1)

Country Link
CN (1) CN105069413B (zh)

Cited By (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105718879A (zh) * 2016-01-19 2016-06-29 华南理工大学 基于深度卷积神经网络的自由场景第一视角手指关键点检测方法
CN105787439A (zh) * 2016-02-04 2016-07-20 广州新节奏智能科技有限公司 一种基于卷积神经网络的深度图像人体关节定位方法
CN105956626A (zh) * 2016-05-12 2016-09-21 成都新舟锐视科技有限公司 基于深度学习的对车牌位置不敏感的车牌识别方法
CN106022232A (zh) * 2016-05-12 2016-10-12 成都新舟锐视科技有限公司 基于深度学习的车牌检测方法
CN106203298A (zh) * 2016-06-30 2016-12-07 北京集创北方科技股份有限公司 生物特征识别方法及装置
CN106203503A (zh) * 2016-07-08 2016-12-07 天津大学 一种基于骨骼序列的动作识别方法
CN106228109A (zh) * 2016-07-08 2016-12-14 天津大学 一种基于骨骼运动轨迹的动作识别方法
CN106295521A (zh) * 2016-07-29 2017-01-04 厦门美图之家科技有限公司 一种基于多输出卷积神经网络的性别识别方法、装置及计算设备
CN106408564A (zh) * 2016-10-10 2017-02-15 北京新皓然软件技术有限责任公司 一种基于深度学习的眼底图像处理方法、装置及系统
CN106446844A (zh) * 2016-09-29 2017-02-22 北京市商汤科技开发有限公司 姿势估计方法和装置、计算机系统
CN106485251A (zh) * 2016-10-08 2017-03-08 天津工业大学 基于深度学习的鸡蛋胚胎分类
CN106504266A (zh) * 2016-09-29 2017-03-15 北京市商汤科技开发有限公司 行走行为的预测方法和装置、数据处理装置和电子设备
CN106548194A (zh) * 2016-09-29 2017-03-29 中国科学院自动化研究所 二维图像人体关节点定位模型的构建方法及定位方法
CN106650827A (zh) * 2016-12-30 2017-05-10 南京大学 基于结构指导深度学习的人体姿态估计方法和系统
CN106874914A (zh) * 2017-01-12 2017-06-20 华南理工大学 一种基于深度卷积神经网络的工业机械臂视觉控制方法
CN107016370A (zh) * 2017-04-10 2017-08-04 电子科技大学 一种基于数据增强的部分遮挡人脸识别方法
CN107194361A (zh) * 2017-05-27 2017-09-22 成都通甲优博科技有限责任公司 二维姿势检测方法及装置
CN107229968A (zh) * 2017-05-24 2017-10-03 北京小米移动软件有限公司 梯度参数确定方法、装置及计算机可读存储介质
CN107329733A (zh) * 2016-04-29 2017-11-07 北京中科寒武纪科技有限公司 用于执行pooling运算的装置和方法
CN107481209A (zh) * 2017-08-21 2017-12-15 北京航空航天大学 一种基于卷积神经网络的图像或视频质量增强方法
WO2017215668A1 (zh) * 2016-06-16 2017-12-21 北京市商汤科技开发有限公司 姿势估计方法和装置、计算机系统
WO2018058419A1 (zh) * 2016-09-29 2018-04-05 中国科学院自动化研究所 二维图像人体关节点定位模型的构建方法及定位方法
CN107909565A (zh) * 2017-10-29 2018-04-13 天津大学 基于卷积神经网络的立体图像舒适度评价方法
CN108009594A (zh) * 2017-12-25 2018-05-08 北京航空航天大学 一种基于变分组卷积的图像识别方法
CN108096833A (zh) * 2017-12-20 2018-06-01 北京奇虎科技有限公司 基于级联神经网络的体感游戏控制方法及装置、计算设备
CN108304819A (zh) * 2018-02-12 2018-07-20 北京易真学思教育科技有限公司 姿态识别系统及方法、存储介质
CN108460413A (zh) * 2018-02-12 2018-08-28 北京市商汤科技开发有限公司 图像处理方法、神经网络的训练方法、装置以及设备
CN108491752A (zh) * 2018-01-16 2018-09-04 北京航空航天大学 一种基于手部分割卷积网络的手部姿态估计方法
CN108734104A (zh) * 2018-04-20 2018-11-02 杭州易舞科技有限公司 基于深度学习图像识别的健身动作纠错方法及系统
CN108830145A (zh) * 2018-05-04 2018-11-16 深圳技术大学(筹) 一种基于深度神经网络的人数统计方法及存储介质
CN108961366A (zh) * 2018-06-06 2018-12-07 大连大学 基于卷积自编码器和流形学习人体运动编辑方法
CN109190544A (zh) * 2018-08-27 2019-01-11 华中科技大学 一种基于序列深度图像的人体身份识别方法
CN109325469A (zh) * 2018-10-23 2019-02-12 北京工商大学 一种基于深度神经网络的人体姿态识别方法
CN109344700A (zh) * 2018-08-22 2019-02-15 浙江工商大学 一种基于深度神经网络的行人姿态属性识别方法
CN109934192A (zh) * 2019-03-20 2019-06-25 京东方科技集团股份有限公司 目标图像定位方法及装置、视线追踪设备
CN110135306A (zh) * 2019-04-30 2019-08-16 电子科技大学 基于角度损失函数的行为识别方法
CN110188732A (zh) * 2019-06-07 2019-08-30 吉林大学 一种基于卷积神经网络的静态手语识别方法
CN110364253A (zh) * 2018-04-11 2019-10-22 西门子医疗有限公司 用于辅助的患者定位的系统和方法
CN110692082A (zh) * 2017-05-31 2020-01-14 首选网络株式会社 学习装置、学习方法、学习模型、推算装置以及夹持系统
CN111539357A (zh) * 2020-04-28 2020-08-14 睿魔智能科技(深圳)有限公司 人体识别模型及其训练方法、系统、存储介质及设备
CN112489372A (zh) * 2020-12-28 2021-03-12 南京大学 一种泳池监控报警系统
CN112543936A (zh) * 2020-10-29 2021-03-23 香港应用科技研究院有限公司 用于动作识别的动作结构自注意力图卷积网络
CN112861598A (zh) * 2019-11-27 2021-05-28 上海联影智能医疗科技有限公司 用于人体模型估计的系统和方法
TWI729337B (zh) * 2018-12-19 2021-06-01 國立中山大學 基於穿戴式裝置的運動教學輔助系統
US11103748B1 (en) 2019-03-05 2021-08-31 Physmodo, Inc. System and method for human motion detection and tracking
GB2560387B (en) * 2017-03-10 2022-03-09 Standard Cognition Corp Action identification using neural networks
US11303853B2 (en) 2020-06-26 2022-04-12 Standard Cognition, Corp. Systems and methods for automated design of camera placement and cameras arrangements for autonomous checkout
WO2022088176A1 (en) * 2020-10-29 2022-05-05 Hong Kong Applied Science and Technology Research Institute Company Limited Actional-structural self-attention graph convolutional network for action recognition
US11331006B2 (en) 2019-03-05 2022-05-17 Physmodo, Inc. System and method for human motion detection and tracking
US11361468B2 (en) 2020-06-26 2022-06-14 Standard Cognition, Corp. Systems and methods for automated recalibration of sensors for autonomous checkout
US11392801B2 (en) 2018-05-29 2022-07-19 Huawei Technologies Co., Ltd. Action recognition method and apparatus
GB2603640A (en) * 2017-03-10 2022-08-10 Standard Cognition Corp Action identification using neural networks
US11478169B2 (en) 2017-10-13 2022-10-25 Huawei Technologies Co., Ltd. Action recognition and pose estimation method and apparatus
US11497962B2 (en) 2019-03-05 2022-11-15 Physmodo, Inc. System and method for human motion detection and tracking
US11551079B2 (en) 2017-03-01 2023-01-10 Standard Cognition, Corp. Generating labeled training images for use in training a computational neural network for object or action recognition
US11810317B2 (en) 2017-08-07 2023-11-07 Standard Cognition, Corp. Systems and methods to check-in shoppers in a cashier-less store

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060098865A1 (en) * 2004-11-05 2006-05-11 Ming-Hsuan Yang Human pose estimation with data driven belief propagation
CN103003845A (zh) * 2011-03-02 2013-03-27 松下电器产业株式会社 姿势估计装置、姿势估计系统、及姿势估计方法
CN103210421A (zh) * 2010-12-09 2013-07-17 松下电器产业株式会社 物体检测装置及物体检测方法
CN103221977A (zh) * 2010-12-09 2013-07-24 松下电器产业株式会社 姿势状态估计装置及姿势状态估计方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6959109B2 (en) * 2002-06-20 2005-10-25 Identix Incorporated System and method for pose-angle estimation

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060098865A1 (en) * 2004-11-05 2006-05-11 Ming-Hsuan Yang Human pose estimation with data driven belief propagation
CN103210421A (zh) * 2010-12-09 2013-07-17 松下电器产业株式会社 物体检测装置及物体检测方法
CN103221977A (zh) * 2010-12-09 2013-07-24 松下电器产业株式会社 姿势状态估计装置及姿势状态估计方法
CN103003845A (zh) * 2011-03-02 2013-03-27 松下电器产业株式会社 姿势估计装置、姿势估计系统、及姿势估计方法

Cited By (89)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105718879A (zh) * 2016-01-19 2016-06-29 华南理工大学 基于深度卷积神经网络的自由场景第一视角手指关键点检测方法
CN105787439A (zh) * 2016-02-04 2016-07-20 广州新节奏智能科技有限公司 一种基于卷积神经网络的深度图像人体关节定位方法
WO2017133009A1 (zh) * 2016-02-04 2017-08-10 广州新节奏智能科技有限公司 一种基于卷积神经网络的深度图像人体关节定位方法
CN105787439B (zh) * 2016-02-04 2019-04-05 广州新节奏智能科技股份有限公司 一种基于卷积神经网络的深度图像人体关节定位方法
CN107329733A (zh) * 2016-04-29 2017-11-07 北京中科寒武纪科技有限公司 用于执行pooling运算的装置和方法
CN107329733B (zh) * 2016-04-29 2020-10-02 中科寒武纪科技股份有限公司 用于执行pooling运算的装置和方法
CN105956626A (zh) * 2016-05-12 2016-09-21 成都新舟锐视科技有限公司 基于深度学习的对车牌位置不敏感的车牌识别方法
CN106022232A (zh) * 2016-05-12 2016-10-12 成都新舟锐视科技有限公司 基于深度学习的车牌检测方法
WO2017215668A1 (zh) * 2016-06-16 2017-12-21 北京市商汤科技开发有限公司 姿势估计方法和装置、计算机系统
US10482624B2 (en) 2016-06-16 2019-11-19 Beijing Sensetime Technology Development Co., Ltd. Posture estimation method and apparatus, and computer system
CN106203298A (zh) * 2016-06-30 2016-12-07 北京集创北方科技股份有限公司 生物特征识别方法及装置
CN106203503B (zh) * 2016-07-08 2019-04-05 天津大学 一种基于骨骼序列的动作识别方法
CN106228109A (zh) * 2016-07-08 2016-12-14 天津大学 一种基于骨骼运动轨迹的动作识别方法
CN106203503A (zh) * 2016-07-08 2016-12-07 天津大学 一种基于骨骼序列的动作识别方法
CN106295521B (zh) * 2016-07-29 2019-06-04 厦门美图之家科技有限公司 一种基于多输出卷积神经网络的性别识别方法、装置及计算设备
CN106295521A (zh) * 2016-07-29 2017-01-04 厦门美图之家科技有限公司 一种基于多输出卷积神经网络的性别识别方法、装置及计算设备
CN106548194A (zh) * 2016-09-29 2017-03-29 中国科学院自动化研究所 二维图像人体关节点定位模型的构建方法及定位方法
CN106548194B (zh) * 2016-09-29 2019-10-15 中国科学院自动化研究所 二维图像人体关节点定位模型的构建方法及定位方法
CN106446844B (zh) * 2016-09-29 2020-01-21 北京市商汤科技开发有限公司 姿势估计方法和装置、计算机系统
CN106504266A (zh) * 2016-09-29 2017-03-15 北京市商汤科技开发有限公司 行走行为的预测方法和装置、数据处理装置和电子设备
WO2018058419A1 (zh) * 2016-09-29 2018-04-05 中国科学院自动化研究所 二维图像人体关节点定位模型的构建方法及定位方法
CN106504266B (zh) * 2016-09-29 2019-06-14 北京市商汤科技开发有限公司 行走行为的预测方法和装置、数据处理装置和电子设备
CN106446844A (zh) * 2016-09-29 2017-02-22 北京市商汤科技开发有限公司 姿势估计方法和装置、计算机系统
US10817714B2 (en) 2016-09-29 2020-10-27 Beijing Sensetime Technology Development Co., Ltd Method and apparatus for predicting walking behaviors, data processing apparatus, and electronic device
CN106485251B (zh) * 2016-10-08 2019-12-24 天津工业大学 基于深度学习的鸡蛋胚胎分类
CN106485251A (zh) * 2016-10-08 2017-03-08 天津工业大学 基于深度学习的鸡蛋胚胎分类
CN106408564B (zh) * 2016-10-10 2019-04-02 北京新皓然软件技术有限责任公司 一种基于深度学习的眼底图像处理方法、装置及系统
CN106408564A (zh) * 2016-10-10 2017-02-15 北京新皓然软件技术有限责任公司 一种基于深度学习的眼底图像处理方法、装置及系统
CN106650827A (zh) * 2016-12-30 2017-05-10 南京大学 基于结构指导深度学习的人体姿态估计方法和系统
CN106874914B (zh) * 2017-01-12 2019-05-14 华南理工大学 一种基于深度卷积神经网络的工业机械臂视觉控制方法
CN106874914A (zh) * 2017-01-12 2017-06-20 华南理工大学 一种基于深度卷积神经网络的工业机械臂视觉控制方法
US11551079B2 (en) 2017-03-01 2023-01-10 Standard Cognition, Corp. Generating labeled training images for use in training a computational neural network for object or action recognition
GB2560387B (en) * 2017-03-10 2022-03-09 Standard Cognition Corp Action identification using neural networks
US11790682B2 (en) 2017-03-10 2023-10-17 Standard Cognition, Corp. Image analysis using neural networks for pose and action identification
GB2603640B (en) * 2017-03-10 2022-11-16 Standard Cognition Corp Action identification using neural networks
GB2603640A (en) * 2017-03-10 2022-08-10 Standard Cognition Corp Action identification using neural networks
CN107016370A (zh) * 2017-04-10 2017-08-04 电子科技大学 一种基于数据增强的部分遮挡人脸识别方法
CN107229968B (zh) * 2017-05-24 2021-06-29 北京小米移动软件有限公司 梯度参数确定方法、装置及计算机可读存储介质
CN107229968A (zh) * 2017-05-24 2017-10-03 北京小米移动软件有限公司 梯度参数确定方法、装置及计算机可读存储介质
CN107194361B (zh) * 2017-05-27 2021-04-02 成都通甲优博科技有限责任公司 二维姿势检测方法及装置
CN107194361A (zh) * 2017-05-27 2017-09-22 成都通甲优博科技有限责任公司 二维姿势检测方法及装置
CN110692082A (zh) * 2017-05-31 2020-01-14 首选网络株式会社 学习装置、学习方法、学习模型、推算装置以及夹持系统
US11810317B2 (en) 2017-08-07 2023-11-07 Standard Cognition, Corp. Systems and methods to check-in shoppers in a cashier-less store
CN107481209B (zh) * 2017-08-21 2020-04-21 北京航空航天大学 一种基于卷积神经网络的图像或视频质量增强方法
CN107481209A (zh) * 2017-08-21 2017-12-15 北京航空航天大学 一种基于卷积神经网络的图像或视频质量增强方法
US11478169B2 (en) 2017-10-13 2022-10-25 Huawei Technologies Co., Ltd. Action recognition and pose estimation method and apparatus
CN107909565A (zh) * 2017-10-29 2018-04-13 天津大学 基于卷积神经网络的立体图像舒适度评价方法
CN108096833A (zh) * 2017-12-20 2018-06-01 北京奇虎科技有限公司 基于级联神经网络的体感游戏控制方法及装置、计算设备
CN108009594B (zh) * 2017-12-25 2018-11-13 北京航空航天大学 一种基于变分组卷积的图像识别方法
CN108009594A (zh) * 2017-12-25 2018-05-08 北京航空航天大学 一种基于变分组卷积的图像识别方法
CN108491752A (zh) * 2018-01-16 2018-09-04 北京航空航天大学 一种基于手部分割卷积网络的手部姿态估计方法
CN108460413A (zh) * 2018-02-12 2018-08-28 北京市商汤科技开发有限公司 图像处理方法、神经网络的训练方法、装置以及设备
CN108304819A (zh) * 2018-02-12 2018-07-20 北京易真学思教育科技有限公司 姿态识别系统及方法、存储介质
CN108304819B (zh) * 2018-02-12 2021-02-02 北京世纪好未来教育科技有限公司 姿态识别系统及方法、存储介质
CN110364253B (zh) * 2018-04-11 2024-03-01 西门子医疗有限公司 用于辅助的患者定位的系统和方法
CN110364253A (zh) * 2018-04-11 2019-10-22 西门子医疗有限公司 用于辅助的患者定位的系统和方法
CN108734104A (zh) * 2018-04-20 2018-11-02 杭州易舞科技有限公司 基于深度学习图像识别的健身动作纠错方法及系统
CN108830145A (zh) * 2018-05-04 2018-11-16 深圳技术大学(筹) 一种基于深度神经网络的人数统计方法及存储介质
US11392801B2 (en) 2018-05-29 2022-07-19 Huawei Technologies Co., Ltd. Action recognition method and apparatus
US11704938B2 (en) 2018-05-29 2023-07-18 Huawei Technologies Co., Ltd. Action recognition method and apparatus
CN108961366A (zh) * 2018-06-06 2018-12-07 大连大学 基于卷积自编码器和流形学习人体运动编辑方法
CN109344700A (zh) * 2018-08-22 2019-02-15 浙江工商大学 一种基于深度神经网络的行人姿态属性识别方法
CN109190544B (zh) * 2018-08-27 2020-09-08 华中科技大学 一种基于序列深度图像的人体身份识别方法
CN109190544A (zh) * 2018-08-27 2019-01-11 华中科技大学 一种基于序列深度图像的人体身份识别方法
CN109325469B (zh) * 2018-10-23 2022-06-14 北京工商大学 一种基于深度神经网络的人体姿态识别方法
CN109325469A (zh) * 2018-10-23 2019-02-12 北京工商大学 一种基于深度神经网络的人体姿态识别方法
TWI729337B (zh) * 2018-12-19 2021-06-01 國立中山大學 基於穿戴式裝置的運動教學輔助系統
US11547324B2 (en) 2019-03-05 2023-01-10 Physmodo, Inc. System and method for human motion detection and tracking
US11826140B2 (en) 2019-03-05 2023-11-28 Physmodo, Inc. System and method for human motion detection and tracking
US11331006B2 (en) 2019-03-05 2022-05-17 Physmodo, Inc. System and method for human motion detection and tracking
US11497961B2 (en) 2019-03-05 2022-11-15 Physmodo, Inc. System and method for human motion detection and tracking
US11103748B1 (en) 2019-03-05 2021-08-31 Physmodo, Inc. System and method for human motion detection and tracking
US11771327B2 (en) 2019-03-05 2023-10-03 Physmodo, Inc. System and method for human motion detection and tracking
US11497962B2 (en) 2019-03-05 2022-11-15 Physmodo, Inc. System and method for human motion detection and tracking
CN109934192A (zh) * 2019-03-20 2019-06-25 京东方科技集团股份有限公司 目标图像定位方法及装置、视线追踪设备
CN110135306A (zh) * 2019-04-30 2019-08-16 电子科技大学 基于角度损失函数的行为识别方法
CN110135306B (zh) * 2019-04-30 2022-07-26 电子科技大学 基于角度损失函数的行为识别方法
CN110188732A (zh) * 2019-06-07 2019-08-30 吉林大学 一种基于卷积神经网络的静态手语识别方法
CN110188732B (zh) * 2019-06-07 2022-04-05 吉林大学 一种基于卷积神经网络的静态手语识别方法
CN112861598A (zh) * 2019-11-27 2021-05-28 上海联影智能医疗科技有限公司 用于人体模型估计的系统和方法
CN111539357B (zh) * 2020-04-28 2024-01-23 睿魔智能科技(深圳)有限公司 人体识别模型及其训练方法、系统、存储介质及设备
CN111539357A (zh) * 2020-04-28 2020-08-14 睿魔智能科技(深圳)有限公司 人体识别模型及其训练方法、系统、存储介质及设备
US11303853B2 (en) 2020-06-26 2022-04-12 Standard Cognition, Corp. Systems and methods for automated design of camera placement and cameras arrangements for autonomous checkout
US11818508B2 (en) 2020-06-26 2023-11-14 Standard Cognition, Corp. Systems and methods for automated design of camera placement and cameras arrangements for autonomous checkout
US11361468B2 (en) 2020-06-26 2022-06-14 Standard Cognition, Corp. Systems and methods for automated recalibration of sensors for autonomous checkout
CN112543936A (zh) * 2020-10-29 2021-03-23 香港应用科技研究院有限公司 用于动作识别的动作结构自注意力图卷积网络
CN112543936B (zh) * 2020-10-29 2021-09-28 香港应用科技研究院有限公司 用于动作识别的动作结构自注意力图卷积网络模型
WO2022088176A1 (en) * 2020-10-29 2022-05-05 Hong Kong Applied Science and Technology Research Institute Company Limited Actional-structural self-attention graph convolutional network for action recognition
CN112489372A (zh) * 2020-12-28 2021-03-12 南京大学 一种泳池监控报警系统

Also Published As

Publication number Publication date
CN105069413B (zh) 2018-04-06

Similar Documents

Publication Publication Date Title
CN105069413A (zh) 一种基于深度卷积神经网络的人体姿势识别方法
Wang et al. Mask-pose cascaded cnn for 2d hand pose estimation from single color image
Kim et al. Simultaneous gesture segmentation and recognition based on forward spotting accumulative HMMs
CN109214282B (zh) 一种基于神经网络的三维手势关键点检测方法和系统
Li et al. Deep supervision with intermediate concepts
Fang et al. Visual SLAM for robot navigation in healthcare facility
CN106055091B (zh) 一种基于深度信息和校正方式的手部姿态估计方法
Yan et al. A factorization-based approach for articulated nonrigid shape, motion and kinematic chain recovery from video
WO2017133009A1 (zh) 一种基于卷积神经网络的深度图像人体关节定位方法
WO2021120834A1 (zh) 基于生物识别的手势识别方法、装置、计算机设备及介质
CN103226708B (zh) 一种基于Kinect的多模型融合视频人手分割方法
CN104123007A (zh) 一种多维加权的3d动态手势识别方法
CN105740909A (zh) 一种基于空间变换的自然场景下文本识别方法
CN110222580A (zh) 一种基于三维点云的人手三维姿态估计方法和装置
WO2020211605A1 (zh) 一种基于最大公共子图的栅格地图融合方法
CN105536205A (zh) 一种基于单目视频人体动作感知的上肢训练系统
CN102682452A (zh) 基于产生式和判别式结合的人体运动跟踪方法
WO2018058419A1 (zh) 二维图像人体关节点定位模型的构建方法及定位方法
CN104732087A (zh) 基于gis的神经网络元胞自动机传染病传播模拟分析方法
CN104899896B (zh) 一种基于子空间特征的多任务学习目标跟踪方法
CN106599810A (zh) 一种基于栈式自编码的头部姿态估计方法
CN111027586A (zh) 一种基于新型响应图融合的目标跟踪方法
Ma et al. Location-aware box reasoning for anchor-based single-shot object detection
CN106056627A (zh) 一种基于局部鉴别性稀疏表示的鲁棒目标跟踪方法
Yu et al. Accurate and robust visual localization system in large-scale appearance-changing environments

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180406

Termination date: 20200727