CN107767419A - 一种人体骨骼关键点检测方法及装置 - Google Patents
一种人体骨骼关键点检测方法及装置 Download PDFInfo
- Publication number
- CN107767419A CN107767419A CN201711086261.XA CN201711086261A CN107767419A CN 107767419 A CN107767419 A CN 107767419A CN 201711086261 A CN201711086261 A CN 201711086261A CN 107767419 A CN107767419 A CN 107767419A
- Authority
- CN
- China
- Prior art keywords
- neural network
- map
- depth
- full convolution
- feature map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
- G06T7/75—Determining position or orientation of objects or cameras using feature-based methods involving models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20076—Probabilistic image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种人体骨骼关键点检测方法及装置,包括如下步骤:步骤一,获取单目深度图;步骤二,将所述单目深度图输入至一经训练好的全卷积深度神经网络中,以检测出其中的人体骨骼关键点位置,所述全卷积深度神经网络将网络前馈的低度抽象前期特征图和高度抽象后期特征图整合在一起,并采用上采样把小特征图放大到其他特征图,以在进行下一步卷积计算时输入既包含小特征图的全局信息又包含大特征图的特征信息,本发明通过有效地利用特征信息、结合前后期的特征信息和全局与局部信息,从而输出更加丰富的特征信息,提高骨骼关键点的定位效果。
Description
技术领域
本发明涉及一种人体骨骼关键点检测方法及装置,特别是涉及一种利用前后期特征图信息、局部与全集信息的全卷积神经网络来检测二维深度图中人体骨骼关键点位置的人体骨骼关键点检测方法及装置。
背景技术
计算机视觉研究领域中其中一个重要的任务是人体骨骼关键点检测,具体来说是使得计算机能够感知人体各个骨骼关键点的位置,为进一步的动作识别、动作异常检测、智能监控、自动驾驶等多个实用场景提供基础。
人体骨骼关键点检测任务的目标是以一张图片作为输入,输出图中人体的各个骨骼关键点在图片中的横纵坐标。输入图片往往有两种,一种是三维的RGB彩色图片,另外一种是二维的深度图。RGB图片往往由于光线明暗、衣着复杂、背景杂乱等干扰因素而增加人体骨骼关键点检测的难度。而深度摄像机能够测量人与相机之间的距离,把距离转化成深度值(每个像素的深度值是该点所处的真实空间到深度摄像机之间的距离,并通过一定计算转化而成的值),直接勾勒出人体的轮廓,具有抗光线明暗、衣着复杂、背景杂乱等干扰性,大大增强了神经网络输出的鲁棒性以及能够用简化神经网络的构建复杂度,也就能够减少计算复杂度从而加快神经网络的运行速度。因此使用深度图是一种人体骨骼关键点检测的重要数据类型。
然而,由于深度图缺乏对于人体细节的记录,深度图会存在一些深度噪声,并且人体自遮挡以及外部障碍物遮挡等困难依旧存在,因此要求稳定快速地进行基于深度图进行二维人体骨骼关键点检测依旧是一个十分具有挑战性的课题。此外,人体骨骼关键点检测任务往往需求模型既能够推断出不同骨骼关键点之间的相互联系(全局信息),又能够根据图片特征块区区域的细节特征(局部信息)来判断该区域所对应的骨骼点,因此设计出有效的模型来结合两者信息也是更好地去解决以上问题的方法。
发明内容
为克服上述现有技术存在的不足,本发明之目的在于提供一种人体骨骼关键点检测方法及装置,以通过有效地利用特征信息、结合前后期的特征信息和全局与局部信息,从而输出更加丰富的特征信息,提高骨骼关键点的定位效果。
为达上述及其它目的,本发明提出一种人体骨骼关键点检测方法,包括如下步骤:
步骤一,获取单目深度图;
步骤二,将所述单目深度图输入至一经训练好的全卷积深度神经网络中,以检测出其中的人体骨骼关键点位置,所述全卷积深度神经网络将网络前馈的低度抽象前期特征图和高度抽象后期特征图整合在一起,并采用上采样把小特征图放大到其他特征图,以在进行下一步卷积计算时输入既包含小特征图的全局信息又包含大特征图的特征信息。
进一步地,于步骤一之前,还包括如下步骤:
构建全卷积深度神经网络,并通过收集若干单目深度图作为训练样本,采用梯度下降优化算法对该全卷积深度神经网络进行训练,更新该全卷积深度神经网络的参数,获得所述经训练好的全卷积深度神经网络。
进一步地,所述构建全卷积深度神经网络,并通过收集若干单目深度图作为训练样本,采用梯度下降优化算法对该全卷积深度神经网络进行训练,更新该全卷积深度神经网络的参数的步骤包括:
构建所述全卷积深度神经网络,并随机初始化该全卷积深度神经网络中的参数;
收集若干单目深度图作为收集训练样本,并对所述单目深度图中的人进行人体骨骼关键点的标注,获得标注坐标;
生成所述标注坐标对应的目标特征图;
以所述单目深度图作为输入,以所述标注坐标生成的特征图为目标输出,使用梯度下降优化算法,利用所述训练样本进行端到端的模型训练,更新所述全卷积深度神经网络的参数,使得所述全卷积深度神经网络输出趋于目标输出。
进一步地,于所述构建所述全卷积深度神经网络,并随机初始化该全卷积深度神经网络中的参数的步骤中,所构建的全卷积深度神经网络包括多个二维卷积层、多个修正线性单元层,除最后一层获得输出的卷积层,其余每一层卷积层后接一个修正线性单元,其间加入多个池化层、上采样层,所述上采样层后接一层将高级特征和低级特征并联的特征图并联层。
进一步地,所述全卷积深度神经网络中的任意一处特征通过特征增强模块来增强特征输出,所述特征增强模块的加入形式采用并联或者串联形式。
进一步地,于所述生成所述标注坐标对应的目标特征图的步骤中,以每个人体骨骼关键点的标注坐标为中心,依次生成二维高斯分布的概率置信图。
进一步地,于所述梯度下降优化算法采用基于一阶梯度的随机优化算法用于更新所述神经网络中的参数,其目标损失函数是网络的输出特征图与目标特征图之间的欧氏距离,并以欧氏距离作为损失值对所述神经网络中各个参数求偏导,最终以偏导值来更新所述神经网络的参数。
进一步地,所述目标损失函数为:
其中,K是骨骼点数目,bk(z)是骨骼点k的神经网络的输出特征图,是骨骼点k的目标特征图,K为总共骨骼关键点的数量,z为输出特征图在二维空间上的范围中的坐标,Z为输出特征图在二维空间上的范围,所述目标损失函数以所述神经网络的输出特征图与目标特征图之间的欧氏距离作为模型训练误差信息,通过反向传播算法求卷积层中各个参数的偏导数;根据计算结果更新网络参数并重复迭代计算。
进一步地,于步骤二中,将获得的单目深度图输入到已经训练好的全卷积深度神经网络中,输出其中的人物各个骨骼点的概率置信图,根据概率置信图中的最大概率像素点的位置,得到人体骨骼点二维坐标。
为达到上述目的,本发明还提供一种人体骨骼关键点检测装置,包括:
深度图获取单元,用于获取单目深度图;
检测单元,用于将所述单目深度图输入至一经训练好的全卷积深度神经网络中,以检测出其中的人体骨骼关键点位置,所述全卷积深度神经网络将网络前馈的低度抽象前期特征图和高度抽象后期特征图整合在一起,并采用上采样把小特征图放大到其他特征图,以在进行下一步卷积计算时输入既包含小特征图的全局信息又包含大特征图的特征信息。
与现有技术相比,本发明一种人体骨骼关键点检测方法及装置通过通过构建并训练全卷积深度神经网络,以单目深度图作为该全卷积深度神经网络的输入,输出K个人体骨骼关键点的概率置信图,并以概率置信图中概率最大值所对应的像素点的坐标作为该骨骼关键点的坐标,通过一定坐标转换计算得到最终骨骼关键点的坐标,实现了利用前后期特征图信息、局部与全集信息的全卷积神经网络来检测单目深度图中二维人体骨骼关键点位置的目的,本发明,有效地利用特征信息、结合前后期的特征信息和全局与局部信息,从而输出更加丰富的特征信息,提高骨骼关键点的定位效果。
附图说明
图1为本发明一种人体骨骼关键点检测方法的步骤流程图;
图2为本发明具体实施例中全卷积深度神经网络的框架图;
图3为本发明具体实施例中全卷积深度神经网络的详细网络设置图;
图4为本发明具体实施例中全卷积神经网络任意位置加入特征增强模块的示意图;
图5为本发明具体实施例支持的15个人体骨骼关键点示意图;
图6为本发明一种人体骨骼关键点检测装置的一个实施例的系统架构图;
图7为本发明一种人体骨骼关键点检测装置的另一个实施例的系统架构图;
图8为本发明具体实施例中全卷积深度神经网络构建训练单元的细部结构图。
具体实施方式
以下通过特定的具体实例并结合附图说明本发明的实施方式,本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。本发明亦可通过其它不同的具体实例加以施行或应用,本说明书中的各项细节亦可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。
图1为本发明一种人体骨骼关键点检测方法的步骤流程图。如图1所示,本发明一种人体骨骼关键点检测方法,包括如下步骤:
步骤S1,获取单目深度图。在本发明具体实施例中,所述单目深度图可得通过深度摄像机拍摄获得,该图片的每个值表示对应像素实际物体与深度摄像机摄像头之间的距离,该值为把该距离经过一定计算得到的值,由于单目深度图的获取位为现有技术,在此不予赘述。
步骤S2,将所述单目深度图输入至一经训练好的全卷积深度神经网络中,以检测出其中的人体骨骼关键点位置,所述全卷积深度神经网络将网络前馈的低度抽象前期特征图和高度抽象后期特征图整合在一起,并采用上采样把小特征图放大到其他特征图,以在进行下一步卷积计算时输入既包含小特征图的全局信息又包含大特征图的特征信息。具体地,于步骤S2中,将获得的单目深度图输入到已经训练好的全卷积深度神经网络中,输出其中的人物各个骨骼点的概率置信图,最终根据置信图中的最大概率像素点的位置,得到骨骼点二维坐标。
可见,本发明之人体骨骼关键点以单目深度图作为全卷积深度神经网络的输入,输出K个人体骨骼关键点的概率置信图,其中K为人体骨骼关键点的数量,并以概率置信图中概率最大值所对应的像素点的坐标作为该骨骼关键点的坐标,通过一定坐标转换计算得到最终骨骼关键点的坐标。
优选地,于步骤S1之前,还包括如下步骤:
步骤S0,构建全卷积深度神经网络,并通过收集若干单目深度图作为训练样本,采用梯度下降优化算法对该全卷积深度神经网络进行训练,更新该全卷积深度神经网络的参数。
具体地,步骤S0进一步包括:
步骤S00,构建全卷积深度神经网络,并随机初始化该全卷积深度神经网络中的参数。所述神经网络的参数主要包含卷积层的卷积核权重和卷积核偏置。
如图2所示,所述全卷积神经网络包括多个二维卷积层和修正线性单元层(图中未示出)依次串联(除最后一层获得输出的卷积层),其间加入多个池化层、上采样层和特征图并联层,具体地,可于其中加入三个最大值池化层以及两个最邻近上采样层,上采样层后接一层将高级特征和低级特征并联的特征图并联层。其中,各层具体用于:
二维卷积层用于对数据进行卷积操作,从而提取数据更高级的特征;
池化层用于整合特征信息到更小的特征图中,例如整合输入某一区域中最显著的特征,并以此特征作为输出,这样使得该层具有抗噪声的能力;
上采样层用于扩散全局信息到最邻近的坐标点中;
修正线性单元层只允许非负信号的通过,这样增加了网络的非线性,增强网络的拟合数据的能力;
特征图并联层用于将输入的两个特征图并联输出,即将高级特征和低级特征并联。
步骤S01,收集若干单目深度图作为收集训练样本,并对深度图中的人进行人体骨骼关键点的标注,获得标注坐标。在本发明具体实施例中,通过深度摄像机获取一系列深度图,并且对深度图中的人进行K个人体骨骼关键点的标注,获得标注坐标;即,于步骤S01中,使用深度摄像机拍摄包含各种人体姿势的深度图,对各个二维人体骨骼关键点进行标注(可通过人工标注或其他标注方式),得到标注坐标,该标注坐标是以图片的长和宽为界限的横纵坐标,在本发明具体实施例中,在本发明中,K初步设置为15。如图5所示,这些骨骼点总计15个,包括:头部、颈部、躯干中心、左肩、左肘、左腕、左臀、右肩、右肘、右腕、左膝、左踝、右臀、右膝、右踝;
步骤S02,生成标注坐标对应的目标特征图,所述目标特征图是以标注坐标为中心所生成的二维概率置信图,即,以每个人体骨骼关键点的标注坐标为中心,依次生成二维高斯分布的概率置信图,一个标注坐标对应一张概率置信图,假如人体骨骼关键点数量为K,则生成K张概率置信图,该K张概率置信图在通道维并联,假设概率置信图长为H、宽为W,并联成大小为(K,H,W)的目标特征图;
步骤S03,采用梯度下降优化算法,端到端地利用训练样本更新卷积神经网络的参数,即以所述单目深度图作为输入,以所述标注坐标生成的特征图为目标输出,使用梯度下降优化算法,利用所述训练样本进行端到端的模型训练,更新所述全卷积深度神经网络的参数,使得所述全卷积深度神经网络输出趋于目标输出。在本发明中,梯度下降优化算法使用的是基于一阶梯度的随机优化算法(Adaptive moment estimation,Adam),用于更新神经网络中的参数。目标损失函数是网络的输出特征图与目标特征图(概率置信图)之间的欧氏距离,并以欧氏距离作为损失值对神经网络中各个参数求偏导,最终以偏导值来更新网络参数。
本发明以深度图作为网络输入,输出K个人体骨骼关键点的概率置信图,其中K为人体骨骼关键点的数量,并以概率置信图中概率最大值所对应的像素点的坐标作为该骨骼关键点的坐标,通过一定坐标转换计算的到最终骨骼关键点的坐标。
图3为本发明一具体实施例中全卷积神经网络详细网络设置图。在本发明具体实施例中,全卷积神经网络包括10个二维卷积层,3个降采样池化层、2个上采样层、2个特征图并联层。具体地,各层具体用于:
二维卷积层:二维卷积层是对输入特征进行卷积运算从而得到多个卷积所得的特征输出。假如输入特征的大小为ni×hi×wi,其中ni、hi、wi为输入通道数、输入特征图的高和宽,二维卷积核的大小为no×ni×hk×wk,其中no、ni、hk、wk分别表示输出通道数、输入通道数、卷积核的高和宽。卷积后可以获得一个大小为no×ho×wo的输出特征图。其中位于输出特征图(s,x,y)位置处的值可以表示成,
其中uk(x+i)(y+j)表示输入特征图中的第k个输入特征通道中(x+i,y+j)位置的像素值,ωskij表示卷积核的权重,bs表示卷积核的第s个输出通道的偏置。在进行卷积之前,在输入特征图边缘补零,使得输出特征图的长和宽与补零之前的输入特征图长和宽一样大。
池化层:本发明选用最大值池化层,该层操作为选定一定大小的区域作为作用区,在作用区中选取最大值作为输出值,通过一定的跨度不断选取新的作用区来进行选取最大值的操作。以ni×hi×wi的特征图作为输入,最大值池化层所选用的作用区大小为2×2,并且在长和宽方向的跨度分别为(2,2),输出特征图的大小为ni×(hi/2)×(wi/2)。
修正线性单元层:该层只把输入特征图中每个值大于0的像素点以原值作为输出特征图对应像素点的值,而输入特征图中每个值小于0的像素点以零值作为输出特征图对应像素点的值。该单元增加了网络的非线性,更好的拟合不同种类的函数,增强模型拟合数据的能力。假设表示v本层的输出,u表示本层输入,则有
v=max(0,u)
通过实验证明在深度卷积神经网络中,使用修线性单元层的非线性性质不但可以增强神经网络拟合能力和表达能力,也使得整个网络的收敛速度相比使用其他激活函数的快。
上采样层:该层采用了对图片进行放大或者缩小的方法,本发明采取对输入特征图采用最邻近插值的方法,并且使用上采样(例如对图片进行放大)的方式得到输出特征图。最邻近插值方法所得到的输出特征图中每个像素点a的值为输入特征图中一个与像素点a坐标距离最近的像素点b的值。
特征图并联层:该层的输入为两个特征图,并要求这两个特征图的长和宽一样大小,输出为两个输入在通道这一维度上的并联。输入特征图u1的大小为(n1,h,w),输入特征图u2的大小为(n2,h,w),通过这一层操作所得到的输出特征图大小为(n1+n2,h,w)。也就是不改变输入的值,输出为两个输入的并联。
具体地,本发明全卷积神经网络前馈过程为:假设原图输入大小为(Hori,Wori),每次经过一次池化层,原输入特征长和宽变为原来的α(0<α<1)倍数,不同下标的α1,α2,α3表示独立的数值。以深度图作为输入,经过一系列卷积层、修正线性单元层、池化层的计算,得到长与宽都为(α1Hori,α1Wori)的特征图,继续进行以上三种操作的组合两次,得到长与宽为(α1α2α3Hori,α1α2α3Wori)的特征图,继续进行多次卷积层、修正线性单元层的操作,并将此处的输出特征图上采样至(α1α2Hori,α1α2Wori)长宽,再经过特征图并联层获得前期的(α1α2Hori,α1α2Wori)长宽的特征图与此处上采样所得特征图的并联特征图。一次卷积后,再次上采样和并联得到前后期特征图结合的(α1Hori,α1Wori)长宽的特征输出,最后经过两层卷积层得到K个通道的特征图(关键点分布概率置信图)作为输出。需说明的是,如果在训练阶段,该前馈输出与目标输出相对比,根据两者之间的差距衡量值来优化网络,使得两者之间的差距更小。如果在识别阶段,该前馈输出即结果特征图,即可根据该结果特征图得到人体骨骼关键点位置。
优选地,如图4所示,本发明全卷积神经网络中的任意一处特征可以通过特征增强模块来增强特征输出,特征增强模块的加入形式可以为任意形式,如并联或者串联。特征增强模块来增强特征输出的例子有:在最后一层前面加一层卷积长短期记忆模块,来引入时序信息增强模型输出;或者中间特定特征图上增加记忆辅助模块,用额外的记忆信息来增强特征输出。
优选地,步骤S03中采用的梯度下降优化算法采用的是基于一阶梯度的随机优化算法(Adaptive moment estimation,Adam),以训练数据中标注坐标所生成的目标特征图作为学习目标,定义目标损失函数衡量网络输出特征图与目标特征图之间的差异,以这个差异作为误差信号并通过梯度下降更新网络参数,训练过程用的损失函数定义如下:
其中,K是骨骼点数目,bk(z)是骨骼点k的神经网络的输出特征图,是骨骼点k的目标特征图(即概率置信图),K为总共骨骼关键点的数量,z为输出特征图在二维空间上的范围中的坐标,Z为输出特征图在二维空间上的范围。公式(2)要求神经网络的输出特征图与目标特征图大小一致。该公式(2)以神经网络的输出特征图与目标特征图之间的欧氏距离作为模型训练误差信息,通过反向传播算法求卷积层中各个参数的偏导数;根据计算结果更新神经网络的参数,并重复迭代计算。
可见,本发明之人体骨骼关键点检测装置通过构建全卷积深度神经网络,使得输出保留二维的空间信息,并且在特征计算的过程中整合了前后期、全局与局部的特征信息,有效地提升人体骨骼点的检测效果。
图6为本发明一种人体骨骼关键点检测装置的系统架构图。如图6所示,本发明一种人体骨骼关键点检测装置,包括:
深度图获取单元601,用于获取单目深度图。在本发明具体实施例中,深度图获取单元601可得通过深度摄像机拍摄获取单目深度图,该图片的每个值表示对应像素实际物体与深度摄像机摄像头之间的距离,该值为把该距离经过一定计算得到的值。
检测单元602,用于将所述单目深度图输入至一经训练好的全卷积深度神经网络中,以检测出其中的人体骨骼关键点位置,所述全卷积深度神经网络将网络前馈的低度抽象前期特征图和高度抽象后期特征图整合在一起,并采用上采样把小特征图放大到其他特征图,以在进行下一步卷积计算时输入既包含小特征图的全局信息又包含大特征图的特征信息。具体地,检测单元602将获得的单目深度图输入到已经训练好的全卷积深度神经网络中,输出其中的人物各个骨骼点的概率置信图,最终根据置信图中的最大概率像素点的位置,得到骨骼点二维坐标。
优选地,如图7所示,本发明之人体骨骼关键点检测装置,还包括:
全卷积深度神经网络构建训练单元603,用于构建全卷积深度神经网络,并通过收集若干单目深度图作为训练样本,采用梯度下降优化算法对该全卷积深度神经网络进行训练,更新该全卷积深度神经网络的参数。
具体地,如图8所示,全卷积深度神经网络构建训练单元603进一步包括:
训练样本收集标注单元6031,用于收集若干单目深度图作为收集训练样本,并对深度图中的人进行人体骨骼关键点的标注,获得标注坐标。在本发明具体实施例中,通过深度摄像机获取一系列深度图,并且对深度图中的人进行K个人体骨骼关键点的标注,获得标注坐标;即,训练样本收集标注单元6031使用深度摄像机拍摄包含各种人体姿势的深度图,对各个二维人体骨骼关键点进行标注(可通过人工标注或其他标注方式),得到标注坐标,该标注坐标是以图片的长和宽为界限的横纵坐标。
目标特征图生成单元6032,用于生成标注坐标对应的目标特征图,所述目标特征图是以标注坐标为中心所生成的二维概率置信图,即,目标特征图生成单元6032以每个人体骨骼关键点的标注坐标为中心,依次生成二维高斯分布的概率置信图,一个标注坐标对应一张概率置信图,假如人体骨骼关键点数量为K,则生成K张概率置信图,该K张概率置信图在通道维并联,假设概率置信图长为H、宽为W,并联成大小为(K,H,W)的目标特征图;
神经网络构建单元6033,用于构建全卷积深度神经网络,并随机初始化该全卷积深度神经网络中的参数,所述神经网络的参数主要包含卷积层的卷积核权重和卷积核偏置;
在本发明具体实施例中,所述全卷积深度神经网络包含多种类别的层。由多个二维卷积层和修正线性单元层依次串联(除最后一层获得输出的卷积层),其间加入多个池化层、上采样层和特征图并联层,具体地,可于其中加入三个最大值池化层以及两个最邻近上采样层,上采样层后接一层将高级特征和低级特征并联的特征图并联层。
在本发明具体实施例中,人体骨骼关键点数量为K,初步设置为15。如图5所示,这些骨骼关键点总计15个,各个骨骼关键点依次为:头部、颈部、躯干中心、左肩、左肘、左腕、右肩、右肘、右腕、左臀、左膝、左踝、右臀、右膝、右踝。
参数更新单元6034,用于采用梯度下降优化算法,端到端地利用训练样本更新所述全卷积深度神经网络的参数。在本发明中,梯度下降优化算法使用的是基于一阶梯度的随机优化算法(Adaptive moment estimation,Adam),用于更新神经网络中的参数。目标损失函数是网络的输出特征图与目标特征图(概率置信图)之间的欧氏距离,并以欧氏距离作为损失值对神经网络中各个参数求偏导,最终以偏导值来更新网络参数。
在本发明具体实施例中,梯度下降优化算法采用的是基于一阶梯度的随机优化算法(Adaptive moment estimation,Adam),以训练数据中标注坐标所生成的目标特征图作为学习目标,定义目标损失函数衡量网络输出特征图与目标特征图之间的差异,以这个差异作为误差信号并通过梯度下降更新网络参数,训练过程用的损失函数定义如下:
其中,K是骨骼点数目,bk(z)是骨骼点k的神经网络的输出特征图,是骨骼点k的目标特征图(即概率置信图),K为总共骨骼关键点的数量,z为输出特征图在二维空间上的范围中的坐标,Z为输出特征图在二维空间上的范围。公式要求神经网络的输出特征图与目标特征图大小一致。该公式以神经网络的输出特征图与目标特征图之间的欧氏距离作为模型训练误差信息,通过反向传播算法求卷积层中各个参数的偏导数;根据计算结果更新神经网络的参数,直至网络收敛或者网络的损失值降到一定范围。
综上所述,本发明一种人体骨骼关键点检测方法及装置通过构建并训练全卷积深度神经网络,以单目深度图作为该全卷积深度神经网络的输入,输出K个人体骨骼关键点的概率置信图,并以概率置信图中概率最大值所对应的像素点的坐标作为该骨骼关键点的坐标,通过一定坐标转换计算得到最终骨骼关键点的坐标,实现了利用前后期特征图信息、局部与全集信息的全卷积神经网络来检测单目深度图中二维人体骨骼关键点位置的目的,本发明,有效地利用特征信息、结合前后期的特征信息和全局与局部信息,从而输出更加丰富的特征信息,提高骨骼关键点的定位效果。
与现有技术相比,本发明具有如下优点:
一、本发明使用了特征图缩小再放大,再并联前后期特征图的方法,有效地利用特征图信息来进行人体骨骼点检测,不同大小的特征图共同决定最终输出特征的信息,使得输出特征既拥有全局信息又拥有细致的局部信息,使得网络具有更强的鲁棒性。
二、本发明有效地利用前后期的特征信息,能够在神经网络结构尽可能简化的情况下保持高精度,因此该神经网络计算量少,具有实时运行的能力。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何本领域技术人员均可在不违背本发明的精神及范畴下,对上述实施例进行修饰与改变。因此,本发明的权利保护范围,应如权利要求书所列。
Claims (10)
1.一种人体骨骼关键点检测方法,包括如下步骤:
步骤一,获取单目深度图;
步骤二,将所述单目深度图输入至一经训练好的全卷积深度神经网络中,以检测出其中的人体骨骼关键点位置,所述全卷积深度神经网络将网络前馈的低度抽象前期特征图和高度抽象后期特征图整合在一起,并采用上采样把小特征图放大到其他特征图,以在进行下一步卷积计算时输入既包含小特征图的全局信息又包含大特征图的特征信息。
2.如权利要求1所述的一种人体骨骼关键点检测方法,其特征在于,于步骤一之前,还包括如下步骤:
构建全卷积深度神经网络,并通过收集若干单目深度图作为训练样本,采用梯度下降优化算法对该全卷积深度神经网络进行训练,更新该全卷积深度神经网络的参数,获得所述经训练好的全卷积深度神经网络。
3.如权利要求2所述的一种人体骨骼关键点检测方法,其特征在于,所述构建全卷积深度神经网络,并通过收集若干单目深度图作为训练样本,采用梯度下降优化算法对该全卷积深度神经网络进行训练,更新该全卷积深度神经网络的参数的步骤包括:
构建所述全卷积深度神经网络,并随机初始化该全卷积深度神经网络中的参数;
收集若干单目深度图作为收集训练样本,并对所述单目深度图中的人进行人体骨骼关键点的标注,获得标注坐标;
生成所述标注坐标对应的目标特征图;
以所述单目深度图作为输入,以所述标注坐标生成的目标特征图为目标输出,使用梯度下降优化算法,利用所述训练样本进行端到端的模型训练,更新所述全卷积深度神经网络的参数,使得所述全卷积深度神经网络输出趋于目标输出。
4.如权利要求3所述的一种人体骨骼关键点检测方法,其特征在于:于所述构建所述全卷积深度神经网络,并随机初始化该全卷积深度神经网络中的参数的步骤中,所构建的全卷积深度神经网络包括多个二维卷积层、多个修正线性单元层,除最后一层获得输出的卷积层,其余每一层卷积层后接一个修正线性单元,其间加入多个池化层、上采样层,所述上采样层后接一层将高级特征和低级特征并联的特征图并联层。
5.如权利要求4所述的一种人体骨骼关键点检测方法,其特征在于:所述全卷积深度神经网络中的任意一处特征通过特征增强模块来增强特征输出,所述特征增强模块的加入形式采用并联或者串联形式。
6.如权利要求3所述的一种人体骨骼关键点检测方法,其特征在于:于所述生成所述标注坐标对应的目标特征图的步骤中,以每个人体骨骼关键点的标注坐标为中心,依次生成二维高斯分布的概率置信图。
7.如权利要求3所述的一种人体骨骼关键点检测方法,其特征在于:于所述梯度下降优化算法采用基于一阶梯度的随机优化算法用于更新所述神经网络中的参数,其目标损失函数是网络的输出特征图与目标特征图之间的欧氏距离,并以欧氏距离作为损失值对所述神经网络中各个参数求偏导,最终以偏导值来更新所述神经网络的参数。
8.如权利要求7所述的一种人体骨骼关键点检测方法,其特征在于,所述目标损失函数为:
<mrow>
<mi>L</mi>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>k</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>K</mi>
</munderover>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>z</mi>
<mo>&Element;</mo>
<mi>Z</mi>
</mrow>
</munder>
<mo>|</mo>
<mo>|</mo>
<msup>
<mi>b</mi>
<mi>k</mi>
</msup>
<mrow>
<mo>(</mo>
<mi>z</mi>
<mo>)</mo>
</mrow>
<mo>-</mo>
<msubsup>
<mi>b</mi>
<mo>*</mo>
<mi>k</mi>
</msubsup>
<mrow>
<mo>(</mo>
<mi>z</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<msubsup>
<mo>|</mo>
<mn>2</mn>
<mn>2</mn>
</msubsup>
</mrow>
其中,K为骨骼点数目,bk(z)为骨骼点k的神经网络的输出特征图,为骨骼点k的目标特征图,K为总共骨骼关键点的数量,z为输出特征图在二维空间上的范围中的坐标,Z为输出特征图在二维空间上的范围,所述目标损失函数以所述神经网络的输出特征图与目标特征图之间的欧氏距离作为模型训练误差信息,通过反向传播算法求卷积层中各个参数的偏导数;根据计算结果更新网络参数并重复迭代计算。
9.如权利要求1所述的一种人体骨骼关键点检测方法,其特征在于,于步骤二中,将获得的单目深度图输入到已经训练好的全卷积深度神经网络中,输出其中的人物各个骨骼点的概率置信图,根据概率置信图中的最大概率像素点的位置,得到人体骨骼点二维坐标。
10.一种人体骨骼关键点检测装置,包括:
深度图获取单元,用于获取单目深度图;
检测单元,用于将所述单目深度图输入至一经训练好的全卷积深度神经网络中,以检测出其中的人体骨骼关键点位置,所述全卷积深度神经网络将网络前馈的低度抽象前期特征图和高度抽象后期特征图整合在一起,并采用上采样把小特征图放大到其他特征图,以在进行下一步卷积计算时输入既包含小特征图的全局信息又包含大特征图的特征信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711086261.XA CN107767419A (zh) | 2017-11-07 | 2017-11-07 | 一种人体骨骼关键点检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711086261.XA CN107767419A (zh) | 2017-11-07 | 2017-11-07 | 一种人体骨骼关键点检测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107767419A true CN107767419A (zh) | 2018-03-06 |
Family
ID=61273616
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711086261.XA Pending CN107767419A (zh) | 2017-11-07 | 2017-11-07 | 一种人体骨骼关键点检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107767419A (zh) |
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108319930A (zh) * | 2018-03-09 | 2018-07-24 | 百度在线网络技术(北京)有限公司 | 身份认证方法、系统、终端和计算机可读存储介质 |
CN108334863A (zh) * | 2018-03-09 | 2018-07-27 | 百度在线网络技术(北京)有限公司 | 身份认证方法、系统、终端和计算机可读存储介质 |
CN108510491A (zh) * | 2018-04-04 | 2018-09-07 | 深圳市未来媒体技术研究院 | 虚化背景下人体骨骼关键点检测结果的过滤方法 |
CN108564058A (zh) * | 2018-04-25 | 2018-09-21 | 咪咕动漫有限公司 | 一种图像处理方法、装置及计算机可读存储介质 |
CN108596865A (zh) * | 2018-03-13 | 2018-09-28 | 中山大学 | 一种用于卷积神经网络的特征图增强系统及方法 |
CN109214282A (zh) * | 2018-08-01 | 2019-01-15 | 中南民族大学 | 一种基于神经网络的三维手势关键点检测方法和系统 |
CN109255783A (zh) * | 2018-10-19 | 2019-01-22 | 上海摩象网络科技有限公司 | 一种多人图像上的人体骨骼关键点的位置排布检测方法 |
CN109359568A (zh) * | 2018-09-30 | 2019-02-19 | 南京理工大学 | 一种基于图卷积网络的人体关键点检测方法 |
CN109376571A (zh) * | 2018-08-03 | 2019-02-22 | 西安电子科技大学 | 基于变形卷积的人体姿态估计方法 |
CN109410276A (zh) * | 2018-11-01 | 2019-03-01 | 北京达佳互联信息技术有限公司 | 关键点位置确定方法、装置及电子设备 |
CN109583341A (zh) * | 2018-11-19 | 2019-04-05 | 清华大学深圳研究生院 | 对包含人像的图像的多人骨骼关键点检测方法及装置 |
CN109685797A (zh) * | 2018-12-25 | 2019-04-26 | 北京旷视科技有限公司 | 骨骼点检测方法、装置、处理设备及存储介质 |
CN109697446A (zh) * | 2018-12-04 | 2019-04-30 | 北京字节跳动网络技术有限公司 | 图像关键点提取方法、装置、可读存储介质及电子设备 |
CN109712128A (zh) * | 2018-12-24 | 2019-05-03 | 上海联影医疗科技有限公司 | 特征点检测方法、装置、计算机设备和存储介质 |
CN109784149A (zh) * | 2018-12-06 | 2019-05-21 | 北京飞搜科技有限公司 | 一种人体骨骼关键点的检测方法及系统 |
CN109902562A (zh) * | 2019-01-16 | 2019-06-18 | 重庆邮电大学 | 一种基于强化学习的驾驶员异常姿态监测方法 |
CN109961044A (zh) * | 2019-03-22 | 2019-07-02 | 浙江工业大学 | 基于形状信息和卷积神经网络的chn法兴趣区域提取方法 |
CN110084161A (zh) * | 2019-04-17 | 2019-08-02 | 中山大学 | 一种人体骨骼关键点的快速检测方法及系统 |
CN110231605A (zh) * | 2019-05-09 | 2019-09-13 | 深圳市速腾聚创科技有限公司 | 人体行为的识别方法、装置、计算机设备和存储介质 |
CN110245669A (zh) * | 2019-05-15 | 2019-09-17 | 平安科技(深圳)有限公司 | 手掌关键点的识别方法、装置、终端及可读存储介质 |
CN110263797A (zh) * | 2019-06-21 | 2019-09-20 | 北京字节跳动网络技术有限公司 | 骨架的关键点估计方法、装置、设备及可读存储介质 |
CN110310723A (zh) * | 2018-03-20 | 2019-10-08 | 青岛海信医疗设备股份有限公司 | 骨骼图像处理方法、电子设备及存储介质 |
CN110334599A (zh) * | 2019-05-31 | 2019-10-15 | 北京奇艺世纪科技有限公司 | 深度学习网络的训练方法、装置、设备和存储介质 |
CN110415171A (zh) * | 2019-07-08 | 2019-11-05 | 北京三快在线科技有限公司 | 图像处理方法、装置及存储介质、电子设备 |
CN110634133A (zh) * | 2019-09-04 | 2019-12-31 | 杭州健培科技有限公司 | 一种基于x线平片的膝关节骨科测量方法及装置 |
CN110991293A (zh) * | 2019-11-26 | 2020-04-10 | 爱菲力斯(深圳)科技有限公司 | 姿态识别方法、装置、计算机设备和存储介质 |
CN111368594A (zh) * | 2018-12-26 | 2020-07-03 | 中国电信股份有限公司 | 用于检测关键点的方法和装置 |
CN111383207A (zh) * | 2018-12-11 | 2020-07-07 | 深圳开立生物医疗科技股份有限公司 | 一种肌骨超声图像处理方法、系统、装置及可读存储介质 |
CN111444896A (zh) * | 2020-05-09 | 2020-07-24 | 北京碧拓科技有限公司 | 一种远红外热成像人体经络关键点定位方法 |
CN111881743A (zh) * | 2020-06-23 | 2020-11-03 | 安徽清新互联信息科技有限公司 | 一种基于语义分割的人脸特征点定位方法 |
CN112102223A (zh) * | 2019-06-18 | 2020-12-18 | 通用电气精准医疗有限责任公司 | 用于自动设置扫描范围的方法和系统 |
JP2021516817A (ja) * | 2018-03-23 | 2021-07-08 | センスタイム グループ リミテッド | 目標対象の運動の向きを予測するための方法、車両制御方法及び装置 |
CN113191934A (zh) * | 2021-04-15 | 2021-07-30 | 广州紫为云科技有限公司 | 一种向上层引擎提供骨骼点数据的方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105469113A (zh) * | 2015-11-19 | 2016-04-06 | 广州新节奏智能科技有限公司 | 一种二维视频流中的人体骨骼点追踪方法及系统 |
CN105787439A (zh) * | 2016-02-04 | 2016-07-20 | 广州新节奏智能科技有限公司 | 一种基于卷积神经网络的深度图像人体关节定位方法 |
CN106156714A (zh) * | 2015-04-24 | 2016-11-23 | 北京雷动云合智能技术有限公司 | 基于骨骼关节特征和表面特征融合的人体行为识别方法 |
CN106599830A (zh) * | 2016-12-09 | 2017-04-26 | 中国科学院自动化研究所 | 人脸关键点定位方法及装置 |
CN106682697A (zh) * | 2016-12-29 | 2017-05-17 | 华中科技大学 | 一种基于卷积神经网络的端到端物体检测方法 |
CN106897697A (zh) * | 2017-02-24 | 2017-06-27 | 深圳市唯特视科技有限公司 | 一种基于可视化编译器的人物和姿势检测方法 |
CN106897675A (zh) * | 2017-01-24 | 2017-06-27 | 上海交通大学 | 双目视觉深度特征与表观特征相结合的人脸活体检测方法 |
CN106910176A (zh) * | 2017-03-02 | 2017-06-30 | 中科视拓(北京)科技有限公司 | 一种基于深度学习的人脸图像去遮挡方法 |
CN107103285A (zh) * | 2017-03-24 | 2017-08-29 | 深圳市未来媒体技术研究院 | 基于卷积神经网络的人脸深度预测方法 |
-
2017
- 2017-11-07 CN CN201711086261.XA patent/CN107767419A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156714A (zh) * | 2015-04-24 | 2016-11-23 | 北京雷动云合智能技术有限公司 | 基于骨骼关节特征和表面特征融合的人体行为识别方法 |
CN105469113A (zh) * | 2015-11-19 | 2016-04-06 | 广州新节奏智能科技有限公司 | 一种二维视频流中的人体骨骼点追踪方法及系统 |
CN105787439A (zh) * | 2016-02-04 | 2016-07-20 | 广州新节奏智能科技有限公司 | 一种基于卷积神经网络的深度图像人体关节定位方法 |
CN106599830A (zh) * | 2016-12-09 | 2017-04-26 | 中国科学院自动化研究所 | 人脸关键点定位方法及装置 |
CN106682697A (zh) * | 2016-12-29 | 2017-05-17 | 华中科技大学 | 一种基于卷积神经网络的端到端物体检测方法 |
CN106897675A (zh) * | 2017-01-24 | 2017-06-27 | 上海交通大学 | 双目视觉深度特征与表观特征相结合的人脸活体检测方法 |
CN106897697A (zh) * | 2017-02-24 | 2017-06-27 | 深圳市唯特视科技有限公司 | 一种基于可视化编译器的人物和姿势检测方法 |
CN106910176A (zh) * | 2017-03-02 | 2017-06-30 | 中科视拓(北京)科技有限公司 | 一种基于深度学习的人脸图像去遮挡方法 |
CN107103285A (zh) * | 2017-03-24 | 2017-08-29 | 深圳市未来媒体技术研究院 | 基于卷积神经网络的人脸深度预测方法 |
Non-Patent Citations (1)
Title |
---|
ALEJANDRO NEWELL ET AL.: "Stacked Hourglass Networks for Human Pose Estimation", 《ARXIV》 * |
Cited By (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108319930A (zh) * | 2018-03-09 | 2018-07-24 | 百度在线网络技术(北京)有限公司 | 身份认证方法、系统、终端和计算机可读存储介质 |
CN108334863A (zh) * | 2018-03-09 | 2018-07-27 | 百度在线网络技术(北京)有限公司 | 身份认证方法、系统、终端和计算机可读存储介质 |
US10740636B2 (en) * | 2018-03-09 | 2020-08-11 | Baidu Online Nework Technology (Beijing) Co., Ltd. | Method, system and terminal for identity authentication, and computer readable storage medium |
CN108334863B (zh) * | 2018-03-09 | 2020-09-04 | 百度在线网络技术(北京)有限公司 | 身份认证方法、系统、终端和计算机可读存储介质 |
US10769423B2 (en) | 2018-03-09 | 2020-09-08 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method, system and terminal for identity authentication, and computer readable storage medium |
US20190279010A1 (en) * | 2018-03-09 | 2019-09-12 | Baidu Online Network Technology (Beijing) Co., Ltd . | Method, system and terminal for identity authentication, and computer readable storage medium |
CN108319930B (zh) * | 2018-03-09 | 2021-04-06 | 百度在线网络技术(北京)有限公司 | 身份认证方法、系统、终端和计算机可读存储介质 |
CN108596865A (zh) * | 2018-03-13 | 2018-09-28 | 中山大学 | 一种用于卷积神经网络的特征图增强系统及方法 |
CN108596865B (zh) * | 2018-03-13 | 2021-10-26 | 中山大学 | 一种用于卷积神经网络的特征图增强系统及方法 |
CN110310723A (zh) * | 2018-03-20 | 2019-10-08 | 青岛海信医疗设备股份有限公司 | 骨骼图像处理方法、电子设备及存储介质 |
US11710243B2 (en) | 2018-03-23 | 2023-07-25 | Sensetime Group Limited | Method for predicting direction of movement of target object, vehicle control method, and device |
JP7101255B2 (ja) | 2018-03-23 | 2022-07-14 | センスタイム グループ リミテッド | 目標対象の運動の向きを予測するための方法、車両制御方法及び装置 |
JP2021516817A (ja) * | 2018-03-23 | 2021-07-08 | センスタイム グループ リミテッド | 目標対象の運動の向きを予測するための方法、車両制御方法及び装置 |
CN108510491A (zh) * | 2018-04-04 | 2018-09-07 | 深圳市未来媒体技术研究院 | 虚化背景下人体骨骼关键点检测结果的过滤方法 |
CN108564058B (zh) * | 2018-04-25 | 2020-10-23 | 咪咕动漫有限公司 | 一种图像处理方法、装置及计算机可读存储介质 |
CN108564058A (zh) * | 2018-04-25 | 2018-09-21 | 咪咕动漫有限公司 | 一种图像处理方法、装置及计算机可读存储介质 |
CN109214282A (zh) * | 2018-08-01 | 2019-01-15 | 中南民族大学 | 一种基于神经网络的三维手势关键点检测方法和系统 |
CN109214282B (zh) * | 2018-08-01 | 2019-04-26 | 中南民族大学 | 一种基于神经网络的三维手势关键点检测方法和系统 |
CN109376571A (zh) * | 2018-08-03 | 2019-02-22 | 西安电子科技大学 | 基于变形卷积的人体姿态估计方法 |
CN109359568A (zh) * | 2018-09-30 | 2019-02-19 | 南京理工大学 | 一种基于图卷积网络的人体关键点检测方法 |
CN109255783A (zh) * | 2018-10-19 | 2019-01-22 | 上海摩象网络科技有限公司 | 一种多人图像上的人体骨骼关键点的位置排布检测方法 |
CN109255783B (zh) * | 2018-10-19 | 2020-09-25 | 上海摩象网络科技有限公司 | 一种多人图像上的人体骨骼关键点的位置排布检测方法 |
CN109410276B (zh) * | 2018-11-01 | 2020-10-27 | 北京达佳互联信息技术有限公司 | 关键点位置确定方法、装置及电子设备 |
CN109410276A (zh) * | 2018-11-01 | 2019-03-01 | 北京达佳互联信息技术有限公司 | 关键点位置确定方法、装置及电子设备 |
WO2020088092A1 (zh) * | 2018-11-01 | 2020-05-07 | 北京达佳互联信息技术有限公司 | 关键点位置确定方法、装置及电子设备 |
CN109583341A (zh) * | 2018-11-19 | 2019-04-05 | 清华大学深圳研究生院 | 对包含人像的图像的多人骨骼关键点检测方法及装置 |
CN109697446A (zh) * | 2018-12-04 | 2019-04-30 | 北京字节跳动网络技术有限公司 | 图像关键点提取方法、装置、可读存储介质及电子设备 |
CN109784149A (zh) * | 2018-12-06 | 2019-05-21 | 北京飞搜科技有限公司 | 一种人体骨骼关键点的检测方法及系统 |
CN111383207A (zh) * | 2018-12-11 | 2020-07-07 | 深圳开立生物医疗科技股份有限公司 | 一种肌骨超声图像处理方法、系统、装置及可读存储介质 |
CN111383207B (zh) * | 2018-12-11 | 2024-03-15 | 深圳开立生物医疗科技股份有限公司 | 一种肌骨超声图像处理方法、系统、装置及可读存储介质 |
CN109712128A (zh) * | 2018-12-24 | 2019-05-03 | 上海联影医疗科技有限公司 | 特征点检测方法、装置、计算机设备和存储介质 |
CN109685797B (zh) * | 2018-12-25 | 2021-08-10 | 北京旷视科技有限公司 | 骨骼点检测方法、装置、处理设备及存储介质 |
CN109685797A (zh) * | 2018-12-25 | 2019-04-26 | 北京旷视科技有限公司 | 骨骼点检测方法、装置、处理设备及存储介质 |
CN111368594B (zh) * | 2018-12-26 | 2023-07-18 | 中国电信股份有限公司 | 用于检测关键点的方法和装置 |
CN111368594A (zh) * | 2018-12-26 | 2020-07-03 | 中国电信股份有限公司 | 用于检测关键点的方法和装置 |
CN109902562B (zh) * | 2019-01-16 | 2022-07-01 | 重庆邮电大学 | 一种基于强化学习的驾驶员异常姿态监测方法 |
CN109902562A (zh) * | 2019-01-16 | 2019-06-18 | 重庆邮电大学 | 一种基于强化学习的驾驶员异常姿态监测方法 |
CN109961044B (zh) * | 2019-03-22 | 2021-02-02 | 浙江工业大学 | 基于形状信息和卷积神经网络的chn法兴趣区域提取方法 |
CN109961044A (zh) * | 2019-03-22 | 2019-07-02 | 浙江工业大学 | 基于形状信息和卷积神经网络的chn法兴趣区域提取方法 |
CN110084161A (zh) * | 2019-04-17 | 2019-08-02 | 中山大学 | 一种人体骨骼关键点的快速检测方法及系统 |
CN110231605A (zh) * | 2019-05-09 | 2019-09-13 | 深圳市速腾聚创科技有限公司 | 人体行为的识别方法、装置、计算机设备和存储介质 |
CN110245669A (zh) * | 2019-05-15 | 2019-09-17 | 平安科技(深圳)有限公司 | 手掌关键点的识别方法、装置、终端及可读存储介质 |
CN110245669B (zh) * | 2019-05-15 | 2024-02-02 | 平安科技(深圳)有限公司 | 手掌关键点的识别方法、装置、终端及可读存储介质 |
CN110334599A (zh) * | 2019-05-31 | 2019-10-15 | 北京奇艺世纪科技有限公司 | 深度学习网络的训练方法、装置、设备和存储介质 |
CN112102223A (zh) * | 2019-06-18 | 2020-12-18 | 通用电气精准医疗有限责任公司 | 用于自动设置扫描范围的方法和系统 |
CN112102223B (zh) * | 2019-06-18 | 2024-05-14 | 通用电气精准医疗有限责任公司 | 用于自动设置扫描范围的方法和系统 |
CN110263797A (zh) * | 2019-06-21 | 2019-09-20 | 北京字节跳动网络技术有限公司 | 骨架的关键点估计方法、装置、设备及可读存储介质 |
CN110263797B (zh) * | 2019-06-21 | 2022-07-12 | 北京字节跳动网络技术有限公司 | 骨架的关键点估计方法、装置、设备及可读存储介质 |
CN110415171B (zh) * | 2019-07-08 | 2021-06-25 | 北京三快在线科技有限公司 | 图像处理方法、装置及存储介质、电子设备 |
CN110415171A (zh) * | 2019-07-08 | 2019-11-05 | 北京三快在线科技有限公司 | 图像处理方法、装置及存储介质、电子设备 |
CN110634133A (zh) * | 2019-09-04 | 2019-12-31 | 杭州健培科技有限公司 | 一种基于x线平片的膝关节骨科测量方法及装置 |
CN110991293A (zh) * | 2019-11-26 | 2020-04-10 | 爱菲力斯(深圳)科技有限公司 | 姿态识别方法、装置、计算机设备和存储介质 |
CN111444896B (zh) * | 2020-05-09 | 2023-06-30 | 北京碧拓科技有限公司 | 一种远红外热成像人体经络关键点定位方法 |
CN111444896A (zh) * | 2020-05-09 | 2020-07-24 | 北京碧拓科技有限公司 | 一种远红外热成像人体经络关键点定位方法 |
CN111881743A (zh) * | 2020-06-23 | 2020-11-03 | 安徽清新互联信息科技有限公司 | 一种基于语义分割的人脸特征点定位方法 |
CN111881743B (zh) * | 2020-06-23 | 2024-06-07 | 安徽清新互联信息科技有限公司 | 一种基于语义分割的人脸特征点定位方法 |
CN113191934A (zh) * | 2021-04-15 | 2021-07-30 | 广州紫为云科技有限公司 | 一种向上层引擎提供骨骼点数据的方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107767419A (zh) | 一种人体骨骼关键点检测方法及装置 | |
CN110276316B (zh) | 一种基于深度学习的人体关键点检测方法 | |
CN108830150B (zh) | 一种基于三维人体姿态估计方法及装置 | |
WO2017133009A1 (zh) | 一种基于卷积神经网络的深度图像人体关节定位方法 | |
WO2020259481A1 (zh) | 定位方法及装置、电子设备、可读存储介质 | |
CN103155003B (zh) | 姿势估计装置及姿势估计方法 | |
CN107886069A (zh) | 一种多目标人体2d姿态实时检测系统及检测方法 | |
CN111311666A (zh) | 一种融合边缘特征和深度学习的单目视觉里程计方法 | |
CN111160164A (zh) | 基于人体骨架和图像融合的动作识别方法 | |
CN109255783B (zh) | 一种多人图像上的人体骨骼关键点的位置排布检测方法 | |
CN111311729A (zh) | 一种基于双向投影网络的自然场景三维人体姿态重建方法 | |
CN109993103A (zh) | 一种基于点云数据的人体行为识别方法 | |
CN111709980A (zh) | 基于深度学习的多尺度图像配准方法和装置 | |
CN109840508A (zh) | 一个基于深度网络架构自动搜索的机器人视觉控制方法,设备及存储介质 | |
CN111160111B (zh) | 一种基于深度学习的人体关键点检测方法 | |
CN112926475B (zh) | 一种人体三维关键点提取方法 | |
WO2023151237A1 (zh) | 人脸位姿估计方法、装置、电子设备及存储介质 | |
CN114036969B (zh) | 一种多视角情况下的3d人体动作识别算法 | |
CN106815855A (zh) | 基于产生式和判别式结合的人体运动跟踪方法 | |
CN111191630A (zh) | 适用于智能交互观演场景的演艺动作识别方法 | |
CN112861808B (zh) | 动态手势识别方法、装置、计算机设备及可读存储介质 | |
CN113076891B (zh) | 基于改进高分辨率网络的人体姿态预测方法及系统 | |
JP2019003565A (ja) | 画像処理装置、画像処理方法、及び画像処理プログラム | |
CN110375765A (zh) | 基于直接法的视觉里程计方法、系统及存储介质 | |
CN116030498A (zh) | 面向虚拟服装走秀的三维人体姿态估计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180306 |
|
RJ01 | Rejection of invention patent application after publication |