CN109670397A - 人体骨骼关键点的检测方法、装置、电子设备及存储介质 - Google Patents
人体骨骼关键点的检测方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN109670397A CN109670397A CN201811319932.7A CN201811319932A CN109670397A CN 109670397 A CN109670397 A CN 109670397A CN 201811319932 A CN201811319932 A CN 201811319932A CN 109670397 A CN109670397 A CN 109670397A
- Authority
- CN
- China
- Prior art keywords
- key point
- skeleton key
- image
- sampling
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Biodiversity & Conservation Biology (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
Abstract
本申请是关于一种人体骨骼关键点的检测方法、装置、电子设备及存储介质。所述人体骨骼关键点的检测方法包括:获取原始图像,其中,所述原始图像包括多个人体骨骼关键点;建立多个沙漏网络;以及在所述多个沙漏网络中,基于所述多个人体骨骼关键点的特征图对应的多个权重值,对所述多个人体骨骼关键点的所述特征图进行深层特征学习,得到所述多个人体骨骼关键点的热力图。基于Senet算法学习,在人体骨骼关键点的检测过程中引入注意机制,提高了学习到的多个人体骨骼关键点的特征图的准确度,从而提高了人体骨骼关键点的检测的准确性。
Description
技术领域
本申请属于计算机软件应用领域,尤其是人体骨骼关键点的检测方法、 装置、电子设备及存储介质。
背景技术
人体骨骼关键点对于描述人体姿态,预测人体行为至关重要。因此人体 骨骼关键点的检测是诸多计算机视觉任务的基础,例如动作分类,异常行为 检测,以及自动驾驶等等。人体骨骼关键点的检测,主要检测人体的一些关 键点,如关节、四肢、五官等,通过关键点描述人体姿态信息。由于人体具 有相当的柔性,会出现各种姿态和形状,人体任何一个部位的微小变化都会 产生一种新的姿态。同时,其关键点的可见性受穿着、姿态、视角等影响非 常大,而且还面临着遮挡、光照、雾等环境的影响。
相关技术中,人体骨骼关键点的检测方法是基于Stacked Hourglass算 法的变形或者改进,但是该算法具有处理速度较慢的问题,很难应用于嵌入 式手机设备。
发明内容
为克服相关技术中存在的问题,本申请公开一种人体骨骼关键点的检测 方法,在构建的多个沙漏网络中,基于多个人体骨骼关键点的特征图对应的 多个权重值,对多个人体骨骼关键点的特征图进行深层特征学习,得到多个 人体骨骼关键点的热力图。基于Senet算法学习,在人体骨骼关键点的检测 过程中引入注意机制,提高了学习到的多个人体骨骼关键点的特征图的准确 度,从而提高了人体骨骼关键点的检测的准确性。
根据本申请的实施例的一方面,提供一种人体骨骼关键点的检测方法, 包括:
获取原始图像,其中,所述原始图像包括多个人体骨骼关键点;
建立多个沙漏网络;以及
在所述多个沙漏网络中,基于所述多个人体骨骼关键点的特征图对应的 多个权重值,对所述多个人体骨骼关键点的所述特征图进行深层特征学习, 得到所述多个人体骨骼关键点的热力图。
可选地,所述一种人体骨骼关键点的检测方法,还包括:对所述原始图 像进行多次下采样,得到第一图像。
可选地,所述一种人体骨骼关键点的检测方法,还包括:对所述原始图 像分别进行多次最大池化采样和多次平均池化采样。
可选地,所述对所述原始图像分别进行多次最大池化采样和多次平均池 化采样,包括:
对所述原始图像分别进行最大池化采样和平均池化采样,得到第一最大 池化图像和第一平均池化图像;
对所述第一最大池化图像和所述第一平均池化图像分别进行最大池化采 样和平均池化采样,得到第二最大池化图像和第二平均池化图像;
对所述第二最大池化图像和所述第二平均池化图像分别进行最大池化采 样和平均池化采样,得到第三最大池化图像和第三平均池化图像;以及
对所述第三最大池化图像和所述第三平均池化图像分别进行最大池化采 样和平均池化采样,得到第四最大池化图像和第四平均池化图像。
可选地,所述建立多个沙漏网络,包括:
建立第一沙漏网络;
建立第二沙漏网络;
其中,所述第一沙漏网络和所述第二沙漏网络是二阶沙漏网络。
可选地,在每一个沙漏网络中,每次下采样之前,从卷积路分出一路跳 级路来保留原尺度的所述多个人体骨骼关键点的特征图;
第一次下采样之后将所述第三最大池化图像和所述第三平均池化图像插 入所述卷积路;
第二次下采样之后将所述第四最大池化图像和所述第四平均池化图像插 入所述卷积路;
每次上采样之后,将所述卷积路的所述多个人体骨骼关键点的特征图和 所述跳级路的上一尺度的所述多个人体骨骼关键点的特征图融合;
两次下采样之间包括:多个卷积模块和多个注意机制模块,;
两次上采样之间包括:卷积模块;
下采样和上采样之间包括:多个卷积模块和多个注意机制模块;以及
每条跳级路包括:多个卷积模块和多个注意机制模块。
可选地,所述注意机制模块中包括:全局池化层、多个全连接层和非线 性激活层。
可选地,所述在所述多个沙漏网络中,基于所述多个人体骨骼关键点的 特征图对应的多个权重值,对所述多个人体骨骼关键点的所述特征图进行深 层特征学习,得到所述多个人体骨骼关键点的热力图,包括:将所述第一图 像、所述第二最大池化图像和所述第二平均池化图像输入所述第一沙漏网络;
将所述第一沙漏网络输出的热力图输入所述第二沙漏网络,同时将所述 第一图像、所述第二最大池化图像和所述第二平均池化图像馈入所述第二沙 漏网络;以及
基于所述多个沙漏网络的所述卷积模块和所述注意机制模块的深层特征 学习,得到所述多个人体骨骼关键点的热力图。
可选地,所述基于所述多个沙漏网络的所述卷积模块和所述注意机制模 块的深层特征学习,得到所述多个人体骨骼关键点的热力图,包括:
在所述第一沙漏网络和所述第二沙漏网络中,通过所述卷积模块提取所 述多个人体骨骼关键点的特征图;
在所述注意机制模块里中,通过senent算法学习,得到所述多个人体 骨骼关键点的特征图对应的一组权重。
可选地,所述基于所述多个沙漏网络的所述卷积模块和所述注意机制模 块的深层特征学习,得到所述多个人体骨骼关键点的热力图,还包括:在所 述注意机制模块中,将所述多个人体骨骼关键点的特征图分为下级路网络和 上级路网络传输;
在所述上级路网络,通过所述全局池化层将所述多个人体骨骼关键点的 特征图进行降维;
在所述上级路网络,通过所述多个全连接层的Senet算法学习,将降维 后的所述多个人体骨骼关键点的特征图综合,得到一维向量;
在所述上级路网络,通过所述非线性激活层将所述一维向量归一化为特 征向量;以及
将所述下级路网络中的所述多个人体骨骼关键点的特征图与所述特征向 量融合。
根据本申请的实施例的第二方面,提供一种人体骨骼关键点的检测装置, 包括:
数据获取单元,用于获取原始图像,其中,所述原始图像包括多个人体 骨骼关键点;
网络建立单元,用于建立多个沙漏网络;
检测单元,用于在所述多个沙漏网络中,基于所述多个人体骨骼关键点 的特征图对应的多个权重值,对所述多个人体骨骼关键点的所述特征图进行 深层特征学习,得到所述多个人体骨骼关键点的热力图。
可选地,所述的人体骨骼关键点的检测装置,还包括:
下采样单元,用于对所述原始图像进行多次下采样,得到第一图像。
可选地,所述的人体骨骼关键点的检测装置,还包括:
池化单元,用于对所述原始图像分别进行多次最大池化采样和多次平均 池化采样。
根据本发明的实施例的第四方面,提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行上述的人体骨骼关键点的检测方法。
根据本发明的实施例的第五方面,提供一种非临时性计算机可读存储介 质,所述计算机可读存储介质存储有计算机指令,所述计算机指令被执行时 实现如上所述的人体骨骼关键点的检测方法。
本申请的实施例提供的技术方案可以包括以下有益效果:
1)在构建的多个沙漏网络中,基于多个人体骨骼关键点的特征图对应的 多个权重值,对多个人体骨骼关键点的特征图进行深层特征学习,得到多个 人体骨骼关键点的热力图。基于Senet算法学习,在人体骨骼关键点的检测 过程中引入注意机制,提高了学习到的多个人体骨骼关键点的特征图的准确 度,从而提高了人体骨骼关键点的检测的准确性。
2)提前对原始图像分别进行多次最大池化采样和多次平均池化采样,得 到多个最大池化图像和最大平均池化图像,在池化的过程中,会用到附近的 多个像素的信息,在提取的多个骨骼关键点的特征图中引入上下文,提高了 人体骨骼关键点的检测的准确性。在每个沙漏网络中只需取相应的多个最大 池化图像和最大平均池化图像插进去,这样进一步减小了计算量,提高了计 算速度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性 的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申 请的实施例,并与说明书一起用于解释本申请的原理。
图1是一根据示例性实施例示出的人体骨骼关键点的检测方法的流程 图;
图2是根据一示例性实施例示出的人体骨骼关键点的检测方法的流程 图;
图3a是根据一示例性实施例示出的人体骨骼关键点的检测装置的框图;
图3b是根据一示例性实施例示出的人体骨骼关键点的检测装置的框图;
图4是根据一示例性实施例示出的人体骨骼关键点的检测装置的框图;
图5是根据一示例性实施例示出的人体骨骼关键点的检测装置框图;
图6是根据一示例性实施例示出的一种执行人体骨骼关键点的检测方法 的装置的框图;
图7是根据一示例性实施例示出的一种执行人体骨骼关键点的检测方法 的装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的 描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的 要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所 有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一 些方面相一致的装置和方法的例子。
图1是根据示例性实施例示出的人体骨骼关键点的检测方法的流程图。具 体步骤包括:
S101,获取原始图像,其中,所述原始图像包括多个人体骨骼关键点。
在本步骤中,通过从视频或图像等文件中提取人体姿势画面作为RGB原 始图像,该原始图像中包括多个人体骨骼关键点,例如,关节,四肢和五官 等。通过对多个人体骨骼关键点的分析来描述人体姿势信息。
S102,建立多个沙漏网络。
在本步骤中,基于卷积神经网络算法,建立多个沙漏网络。卷积图层表 示该原始图像的纹理信息和空间信息。沙漏网络中的卷积层提取多个人体骨 骼关键点的特征图。
S103,在所述多个沙漏网络中,基于所述多个人体骨骼关键点的特征图 对应的多个权重值,对所述多个人体骨骼关键点的所述特征图进行深层特征 学习,得到所述多个人体骨骼关键点的热力图。
在本步骤中,在多个沙漏网络中,通过Senet学习的方式来引入注意机 制,自动获取到每个特征图对应的特征通道的权重值,根据特征通道的权重 值来调整所述特征图的深层特征学习。在多个沙漏网络中,基于特征通道的 权重值,对多个人体骨骼关键点的特征图逐层学习,得到多个人体骨骼关键 点的热力图。
在本申请的实施例中,在构建的多个沙漏网络中,基于多个人体骨骼关 键点的特征图对应的多个权重值,对多个人体骨骼关键点的特征图进行深层 特征学习,得到多个人体骨骼关键点的热力图。基于Senet算法学习,在人 体骨骼关键点的检测过程中引入注意机制,提高了学习到的多个人体骨骼关 键点的特征图的准确度,从而提高了人体骨骼关键点的检测的准确性。
图2是根据示例性实施例示出的人体骨骼关键点的检测方法的流程图。具 体步骤包括:
S201,获取原始图像,其中,所述原始图像包括多个人体骨骼关键点。
S202,对所述原始图像进行多次下采样,得到第一图像。
S203,对所述原始图像分别进行多次最大池化采样和多次平均池化采样。
S204,建立多个沙漏网络。
S205,将所述第一图像、所述第二最大池化图像和所述第二平均池化图 像输入所述第一沙漏网络。
S206,将所述第一沙漏网络输出的热力图输入所述第二沙漏网络,同时, 将所述第一图像、所述第二最大池化图像和所述第二平均池化图像馈入所述 第二沙漏网络。
S207,基于所述多个沙漏网络的所述卷积模块和所述注意机制模块的深 层特征学习,得到所述多个人体骨骼关键点的热力图。
本实施例是比前述实施例更加完善的人体骨骼关键点的检测方法。步骤 S201与图1的S101相同,这里就不再赘述。
步骤S202中,对原始图像进行两次下采样,得到第一图像I1。本步骤也 可以是,经过两次步长为2的卷积层,每次使得原始图像的多个人体骨骼关键 点的特征图的分辨率下降为原来的一半,即原始图像的多个人体骨骼关键点 的m×n的特征图下降为(m/2)×(n/2)。
步骤S203中,对原始图像分别进行多次最大池化采样和多次平均池化采 样。具体是,对原始图像分别进行最大池化采样和平均池化采样,得到第一 最大池化图像和第一平均池化图像;对第一最大池化图像和第一平均池化图 像分别进行最大池化采样和平均池化采样,得到第二最大池化图像和第二平 均池化图像;对第二最大池化图像和第二平均池化图像分别进行最大池化采 样和平均池化采样,得到第三最大池化图像和第三平均池化图像;以及对第 三最大池化图像和第三平均池化图像分别进行最大池化采样和平均池化采 样,得到第四最大池化图像和第四平均池化图像。一个实施例中,原始图像 的大小为3×128×128,其中3指的是RGB图像(R:是red,G是指green, B是指blue)的通道数,128×128指的是RGB图像的像素。对原始图像分别 进行一次最大池化采样和平均池化采样,得到的第一最大池化图像AM1和第 一平均池化图像AE1的大小为3×64×64。对原始图像分别进行两次最大池 化采样和平均池化采样,得到的第二最大池化图像AM2和第二平均池化图像AE2的大小为3×32×32。对原始图像分别进行三次最大池化采样和平均池 化采样,得到的第三最大池化图像AM3和第三平均池化图像AE3的大小为 3×16×16。对原始图像分别进行四次最大池化采样和平均池化采样,得到 的第四最大池化图像AM4和第四平均池化图像AE4的大小为3×8×8。
步骤S204中,建立两个沙漏网络。第一沙漏网络和第二沙漏网络的网络 结构相同。图3a是根据一示例性实施例示出的人体骨骼关键点的检测装置的 框图,具体示出第一沙漏网络或第二沙漏网络的网络结构。下面结合如图3a 所示的第一沙漏网络或第二沙漏网络的网络结构,具体说明建立沙漏网络的 步骤:建立第一沙漏网络;建立第二沙漏网络;其中,第一沙漏网络和第二 沙漏网络是二阶沙漏网络。在每一个沙漏网络中,每次下采样之前,从卷积 路分出一路跳级路来保留原尺度的多个人体骨骼关键点的特征图。第一次下采样之后将第三最大池化图像AM3和第三平均池化图像AE3插入所述卷积 路。第二次下采样之后将第四最大池化图像AM4和第四平均池化图像AE4插 入所述卷积路。每次上采样之后,将卷积路的多个人体骨骼关键点的特征图 和跳级路的上一尺度的多个人体骨骼关键点的特征图融合;两次下采样之间 包括:三个卷积模块和两个注意机制模块,并且,三个卷积模块和两个注意 机制模块间隔排列;第一个卷积模块的输入通道为M、输出通道为N,其他两个卷积模块的输入通道和输出通道都为N。两次上采样之间包括:一个卷积 模块,输入通道和输出通道都为N。下采样和上采样之间包括:四个卷积模 块和两个注意机制模块,并且,两个注意机制模块与前三个卷积模块间隔排 列,第一个卷积模块的输入通道为M、输出通道为N,其他三个卷积模块的输 入通道和输出通道都为N。每条跳级路包括:四个卷积模块和两个注意机制 模块,并且,两个注意机制模块与前三个卷积模块间隔排列,第一个卷积模 块的输入通道为M、输出通道为N,其他三个卷积模块的输入通道和输出通道 都为N。
步骤S205至S207是基于多个人体骨骼关键点的特征图对应的多个权重 值,对多个人体骨骼关键点的特征图进行深层特征学习,得到所多个人体骨 骼关键点的热力的过程。图3b是根据一示例性实施例示出的人体骨骼关键点 的检测装置的框图,具体示出第一沙漏网络和第二沙漏网络的网络结构。下 面结合图3b具体说明得到所多个人体骨骼关键点的热力的过程:
在步骤S205中,将第一图像I1、第二最大池化图像AM2和第二平均池化 图像AE2输入第一沙漏网络。在步骤S206中,将第一沙漏网络输出的热力图 O1输入第二沙漏网络,同时,将第一图像I1、第二最大池化图像AM2和第二 平均池化图像AE2馈入第二沙漏网络。第一沙漏网络的输出是多个人体骨骼 关键点对应的热力图O1,第一沙漏网络会将热力图O1和真值比较产生loss 并回传。
在步骤S207中,基于第一沙漏网络和第二沙漏网络中的卷积模块和注意 机制模块的深层特征学习,得到多个人体骨骼关键点的热力图。每个热图对 应一个人体骨骼关键点。
根据本申请的实施例,提前对原始图像分别进行多次最大池化采样和多 次平均池化采样,得到多个最大池化图像和最大平均池化图像,在池化的过 程中,会用到附近的多个像素的信息,在提取的多个骨骼关键点的特征图中 引入上下文,提高了人体骨骼关键点的检测的准确性。在每个沙漏网络中只 需取相应的多个最大池化图像和最大平均池化图像插进去,这样进一步减小 了计算量,提高了计算速度。
同时,将第一沙漏网络给出的热力图作为下一个沙漏网络的输入,使得 第二沙漏网络可以使用第一沙漏网络学习到的关节点间的相互关系,增大了 第二沙漏网络的输入,从而进一步提高了人体骨骼关键点的检测的准确性。
本发明的一个可选地实施例中,注意机制模块中包括:全局池化层、两 个全连接层和非线性激活层。图4是根据一示例性实施例示出的人体骨骼关 键点的检测装置的框,具体示出注意机制模块的结构。下面结合图4具体说 明基于第一沙漏网络和第二沙漏网络中的卷积模块和注意机制模块的深层特 征学习,得到多个人体骨骼关键点的热力图的过程:在第一沙漏网络和第二 沙漏网络中,通过卷积模块提取多个人体骨骼关键点的特征图。在注意机制 模块里中,通过senent算法学习,得到多个人体骨骼关键点的特征图对应的一组权重,即每个特征图的重要程度。然后,通过该对应的一组权重,让 网络重点关注权重大的特征。具体地,在注意机制模块中,将多个人体骨骼 关键点的特征图分为下级路网络和上级路网络传输。在上级路网络,通过全 局池化层(global pool)将多个人体骨骼关键点的特征图进行降维。全局池化 层将整个特征图求得一个数,比如global ave pool就是把整个m×n的特 征图得到1×1的数,即m×n个数求平均得到1个数。在上级路网络,通过两个全连接层(FC)的Senet算法学习,将降维后的多个人体骨骼关键点的特 征图综合,得到一维向量;神经网络中的全连接层的数目可以任意设定。全 连接层中的任意一个结点都会和前面层及后面层的每个结点相边接,即全连 接层的每一个结点都与上一层的所有结点相连,用来把前边提取到的特征综 合起来。在上级路网络,通过非线性激活层将该一维向量归一化为特征向量; 非线性激活层中通过sigmoid函数将图像进行归一化到某个区间。Sigmoid 函数常被用作神经网络的阈值函数,将变量映射到0,1之间。其中, c×h×w中c表示channel数目,h表示特征图的高,w表示特征图的宽。 在神经网络的全连接层可以直接指定channel数目。将下级路网络中的多个 人体骨骼关键点的特征图与特征向量融合。
根据本申请的实施例,在注意机制模块里中,通过senent算法学习, 得到多个人体骨骼关键点的特征图对应的一组权重,即每个特征图的重要程 度。然后,通过该对应的一组权重,让网络重点关注权重大的特征。在人体 骨骼关键点的检测过程中引入注意机制,提高了学习到的多个人体骨骼关键 点的特征图的准确度,从而提高了人体骨骼关键点的检测的准确性。
图5是根据一示例性实施例示出的人体骨骼关键点的检测装置框图。包 括:数据获取单元501、网络建立单元502、检测单元503、下采样单元504 和池化单元505。
数据获取单元501,用于获取原始图像,其中,所述原始图像中包括多个 人体骨骼关键点。
网络建立单元502,用于建立多个沙漏网络。;
检测单元503,用于在所述多个沙漏网络中,基于所述多个人体骨骼关键 点的特征图对应的多个权重值,对所述多个人体骨骼关键点的所述特征图进 行深层特征学习,得到所述多个人体骨骼关键点的热力图。
下采样单元504,用于对所述原始图像进行多次下采样,得到第一图像。
池化单元505,用于对所述原始图像分别进行多次最大池化采样和多次平 均池化采样。
在本申请的一个实施例中,数据获取单元501,用于获取原始图像,其中, 原始图像中包括多个人体骨骼关键点。网络建立单元502,用于建立多个沙漏 网络。检测单元503,用于基于多个人体骨骼关键点的特征图对应的多个权重 值,对多个人体骨骼关键点的特征图进行深层特征学习,得到多个人体骨骼 关键点的热力图。下采样单元504,用于对原始图像进行多次下采样,得到第 一图像。池化单元505,用于对原始图像分别进行多次最大池化采样和多次平 均池化采样。
根据本申请的实施例,下采样单元504将对原始图像下采样得到的分辨率 较小的第一图像,减小了计算量,提高了计算速度。
图6是根据一示例性实施例示出的一种用于上述人体骨骼关键点的检测 方法的人体骨骼关键点的检测装置1200的框图。例如,交互装置1200可以是 移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备, 医疗设备,健身设备,个人数字助理等。
参照图6,装置1200可以包括以下一个或多个组件:处理组件1202,存储 器1204,电力组件1206,多媒体组件1208,音频组件1210,输入/输出(I/O) 的接口1212,传感器组件1214,以及通信组件1216。
处理组件1202通常控制装置1200的整体操作,诸如与显示,电话呼叫, 数据通信,相机操作和记录操作相关联的操作。处理组件1202可以包括一个 或多个处理器1220来执行指令,以完成上述的方法的全部或部分步骤。此外, 处理组件1202可以包括一个或多个模块,便于处理组件1202和其他组件之间 的交互。例如,处理组件1202可以包括多媒体模块,以方便多媒体组件1208 和处理组件1202之间的交互。
存储器1204被配置为存储各种类型的数据以支持在设备1200的操作。这 些数据的示例包括用于在装置1200上操作的任何应用程序或方法的指令,联 系人数据,电话簿数据,消息,图片,视频等。存储器1204可以由任何类型 的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器 (SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储 器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件1206为装置1200的各种组件提供电力。电源组件1206可以包括 电源管理系统,一个或多个电源,及其他与为装置1200生成、管理和分配电 力相关联的组件。
多媒体组件1208包括在所述装置1200和用户之间的提供一个输出接口的 屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。 如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入 信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上 的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测 与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组 件1208包括一个前置摄像头和/或后置摄像头。当设备1200处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体 数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有 焦距和光学变焦能力。
音频组件1210被配置为输出和/或输入音频信号。例如,音频组件1210 包括一个麦克风(MIC),当装置1200处于操作模式,如呼叫模式、记录模式 和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号 可以被进一步存储在存储器1204或经由通信组件1216发送。在一些实施例中, 音频组件1210还包括一个扬声器,用于输出音频信号。
I/O接口1212为处理组件1202和外围接口模块之间提供接口,上述外围 接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按 钮、音量按钮、启用按钮和锁定按钮。
传感器组件1214包括一个或多个传感器,用于为装置1200提供各个方面 的状态评估。例如,传感器组件1214可以检测到设备1200的打开/关闭状态, 组件的相对定位,例如所述组件为装置1200的显示器和小键盘,传感器组件 1214还可以检测装置1200或装置1200一个组件的位置改变,用户与装置1200 接触的存在或不存在,装置1200方位或加速/减速和装置1200的温度变化。传 感器组件1214可以包括接近传感器,被配置用来在没有任何的物理接触时检 测附近物体的存在。传感器组件1214还可以包括光传感器,如CMOS或CCD 图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1214 还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传 感器。
通信组件1216被配置为便于装置1200和其他设备之间有线或无线方式的 通信。装置1200可以接入基于通信标准的无线网络,如WiFi,运营商网络(如 2G、3G、4G或5G),或它们的组合。在一个示例性实施例中,通信组件1216 经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一 个示例性实施例中,所述通信组件1216还包括近场通信(NFC)模块,以促进 短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会 (IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置1200可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻 辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器 或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储 介质,例如包括指令的存储器1204,上述指令可由装置1200的处理器1220执 行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、 随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图7是根据一示例性实施例示出的一种用于上述人体骨骼关键点的检测 方法的人体骨骼关键点的检测装置1400的框图。例如,装置1400可以被提供 为一服务器。参照图7,装置1400包括处理组件1322,其进一步包括一个或多 个处理器,以及由存储器1332所代表的存储器资源,用于存储可由处理组件 1322的执行的指令,例如应用程序。存储器1332中存储的应用程序可以包括 一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1322被配 置为执行指令,以执行上述信息列表显示方法方法。
装置1400还可以包括一个电源组件1326被配置为执行装置1400的电源管 理,一个有线或无线网络接口1350被配置为将装置1400连接到网络,和一个 输入输出(I/O)接口1358。装置1400可以操作基于存储在存储器1332的操作 系统,例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,FreeBSDTM 或类似。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本 申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性 变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申 请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被 视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确 结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所 附的权利要求来限制。
Claims (10)
1.一种人体骨骼关键点的检测方法,其特征在于,包括:
获取原始图像,其中,所述原始图像包括多个人体骨骼关键点;
建立多个沙漏网络;以及
在所述多个沙漏网络中,基于所述多个人体骨骼关键点的特征图对应的多个权重值,对所述多个人体骨骼关键点的所述特征图进行深层特征学习,得到所述多个人体骨骼关键点的热力图。
2.根据权利要求1所述的人体骨骼关键点的检测方法,其特征在于,还包括:对所述原始图像进行多次下采样,得到第一图像;
优选地,所述人体骨骼关键点的检测方法,还包括:对所述原始图像分别进行多次最大池化采样和多次平均池化采样;
优选地,所述对所述原始图像分别进行多次最大池化采样和多次平均池化采样,包括:
对所述原始图像分别进行最大池化采样和平均池化采样,得到第一最大池化图像和第一平均池化图像;
对所述第一最大池化图像和所述第一平均池化图像分别进行最大池化采样和平均池化采样,得到第二最大池化图像和第二平均池化图像;
对所述第二最大池化图像和所述第二平均池化图像分别进行最大池化采样和平均池化采样,得到第三最大池化图像和第三平均池化图像;以及
对所述第三最大池化图像和所述第三平均池化图像分别进行最大池化采样和平均池化采样,得到第四最大池化图像和第四平均池化图像。
3.根据权利要求2所述的人体骨骼关键点的检测方法,其特征在于,所述建立多个沙漏网络,包括:
建立第一沙漏网络;
建立第二沙漏网络;
其中,所述第一沙漏网络和所述第二沙漏网络是二阶沙漏网络;
优选地,在每一个沙漏网络中,每次下采样之前,从卷积路分出一路跳级路来保留原尺度的所述多个人体骨骼关键点的特征图;
第一次下采样之后将所述第三最大池化图像和所述第三平均池化图像插入所述卷积路;
第二次下采样之后将所述第四最大池化图像和所述第四平均池化图像插入所述卷积路;
每次上采样之后,将所述卷积路的所述多个人体骨骼关键点的特征图和所述跳级路的上一尺度的所述多个人体骨骼关键点的特征图融合;
两次下采样之间包括:多个卷积模块和多个注意机制模块,;
两次上采样之间包括:卷积模块;
下采样和上采样之间包括:多个卷积模块和多个注意机制模块;以及
每条跳级路包括:多个卷积模块和多个注意机制模块;
优选地,所述注意机制模块中包括:全局池化层、多个全连接层和非线性激活层。
4.根据权利要求3所述的人体骨骼关键点的检测方法,其特征在于,所述在所述多个沙漏网络中,基于所述多个人体骨骼关键点的特征图对应的多个权重值,对所述多个人体骨骼关键点的所述特征图进行深层特征学习,得到所述多个人体骨骼关键点的热力图,包括:将所述第一图像、所述第二最大池化图像和所述第二平均池化图像输入所述第一沙漏网络;
将所述第一沙漏网络输出的热力图输入所述第二沙漏网络,同时将所述第一图像、所述第二最大池化图像和所述第二平均池化图像馈入所述第二沙漏网络;以及
基于所述多个沙漏网络的所述卷积模块和所述注意机制模块的深层特征学习,得到所述多个人体骨骼关键点的热力图。
5.根据权利要求4所述的人体骨骼关键点的检测方法,其特征在于,所述基于所述多个沙漏网络的所述卷积模块和所述注意机制模块的深层特征学习,得到所述多个人体骨骼关键点的热力图,包括:
在所述第一沙漏网络和所述第二沙漏网络中,通过所述卷积模块提取所述多个人体骨骼关键点的特征图;
在所述注意机制模块里中,通过senent算法学习,得到所述多个人体骨骼关键点的特征图对应的一组权重。
6.根据权利要求5所述的人体骨骼关键点的检测方法,其特征在于,所述基于所述多个沙漏网络的所述卷积模块和所述注意机制模块的深层特征学习,得到所述多个人体骨骼关键点的热力图,还包括:在所述注意机制模块中,将所述多个人体骨骼关键点的特征图分为下级路网络和上级路网络传输;
在所述上级路网络,通过所述全局池化层将所述多个人体骨骼关键点的特征图进行降维;
在所述上级路网络,通过所述多个全连接层的Senet算法学习,将降维后的所述多个人体骨骼关键点的特征图综合,得到一维向量;
在所述上级路网络,通过所述非线性激活层将所述一维向量归一化为特征向量;以及
将所述下级路网络中的所述多个人体骨骼关键点的特征图与所述特征向量融合。
7.一种人体骨骼关键点的检测装置,其特征在于,包括:
数据获取单元,用于获取原始图像,其中,所述原始图像包括多个人体骨骼关键点;
网络建立单元,用于建立多个沙漏网络;
检测单元,用于在所述多个沙漏网络中,基于所述多个人体骨骼关键点的特征图对应的多个权重值,对所述多个人体骨骼关键点的所述特征图进行深层特征学习,得到所述多个人体骨骼关键点的热力图。
8.根据权利要求7所述的人体骨骼关键点的检测装置,其特征在于,还包括:
下采样单元,用于对所述原始图像进行多次下采样,得到第一图像;
优选地,所述的人体骨骼关键点的检测装置,还包括:
池化单元,用于对所述原始图像分别进行多次最大池化采样和多次平均池化采样。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行上述权利要求1-6任意一项所述的人体骨骼关键点的检测方法。
10.一种非临时性计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令被执行时实现如权利要求1至6任一项所述的人体骨骼关键点的检测方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811319932.7A CN109670397B (zh) | 2018-11-07 | 2018-11-07 | 人体骨骼关键点的检测方法、装置、电子设备及存储介质 |
PCT/CN2019/110582 WO2020093837A1 (zh) | 2018-11-07 | 2019-10-11 | 人体骨骼关键点的检测方法、装置、电子设备及存储介质 |
US17/085,214 US11373426B2 (en) | 2018-11-07 | 2020-10-30 | Method for detecting key points in skeleton, apparatus, electronic device and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811319932.7A CN109670397B (zh) | 2018-11-07 | 2018-11-07 | 人体骨骼关键点的检测方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109670397A true CN109670397A (zh) | 2019-04-23 |
CN109670397B CN109670397B (zh) | 2020-10-30 |
Family
ID=66142071
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811319932.7A Active CN109670397B (zh) | 2018-11-07 | 2018-11-07 | 人体骨骼关键点的检测方法、装置、电子设备及存储介质 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11373426B2 (zh) |
CN (1) | CN109670397B (zh) |
WO (1) | WO2020093837A1 (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110084180A (zh) * | 2019-04-24 | 2019-08-02 | 北京达佳互联信息技术有限公司 | 关键点检测方法、装置、电子设备及可读存储介质 |
CN110348335A (zh) * | 2019-06-25 | 2019-10-18 | 平安科技(深圳)有限公司 | 行为识别的方法、装置、终端设备及存储介质 |
CN110348412A (zh) * | 2019-07-16 | 2019-10-18 | 广州图普网络科技有限公司 | 一种关键点定位方法、装置、电子设备及存储介质 |
CN110532891A (zh) * | 2019-08-05 | 2019-12-03 | 北京地平线机器人技术研发有限公司 | 目标对象状态识别方法、装置、介质和设备 |
CN110738654A (zh) * | 2019-10-18 | 2020-01-31 | 中国科学技术大学 | 髋关节影像中的关键点提取及骨龄预测方法 |
CN110895809A (zh) * | 2019-10-18 | 2020-03-20 | 中国科学技术大学 | 准确提取髋关节影像中关键点的方法 |
WO2020093837A1 (zh) * | 2018-11-07 | 2020-05-14 | 北京达佳互联信息技术有限公司 | 人体骨骼关键点的检测方法、装置、电子设备及存储介质 |
CN111414823A (zh) * | 2020-03-12 | 2020-07-14 | Oppo广东移动通信有限公司 | 人体特征点的检测方法、装置、电子设备以及存储介质 |
CN111753643A (zh) * | 2020-05-09 | 2020-10-09 | 北京迈格威科技有限公司 | 人物姿态识别方法、装置、计算机设备和存储介质 |
CN111899235A (zh) * | 2020-07-21 | 2020-11-06 | 北京灵汐科技有限公司 | 图像检测方法、装置、电子设备和存储介质 |
CN112417991A (zh) * | 2020-11-02 | 2021-02-26 | 武汉大学 | 基于沙漏胶囊网络的双注意力人脸对齐方法 |
CN113192043A (zh) * | 2021-05-13 | 2021-07-30 | 杭州健培科技有限公司 | 基于多尺度拓扑图的医学关键点检测方法、装置及应用 |
CN116894844A (zh) * | 2023-07-06 | 2023-10-17 | 北京长木谷医疗科技股份有限公司 | 一种髋关节图像分割与关键点联动识别方法及装置 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021056134A1 (en) * | 2019-09-23 | 2021-04-01 | Intel Corporation | Scene retrieval for computer vision |
CN111832526B (zh) * | 2020-07-23 | 2024-06-11 | 浙江蓝卓工业互联网信息技术有限公司 | 一种行为检测方法及装置 |
US11948271B2 (en) * | 2020-12-23 | 2024-04-02 | Netflix, Inc. | Machine learning techniques for video downsampling |
CN112651333B (zh) * | 2020-12-24 | 2024-02-09 | 天翼数字生活科技有限公司 | 静默活体检测方法、装置、终端设备和存储介质 |
CN113128383A (zh) * | 2021-04-07 | 2021-07-16 | 杭州海宴科技有限公司 | 一种校园学生欺凌行为的识别方法 |
CN113033581B (zh) * | 2021-05-07 | 2024-02-23 | 刘慧烨 | 髋关节图像中骨骼解剖关键点定位方法、电子设备及介质 |
CN113420604B (zh) * | 2021-05-28 | 2023-04-18 | 沈春华 | 多人姿态估计方法、装置和电子设备 |
TWI828174B (zh) * | 2021-06-04 | 2024-01-01 | 虹映科技股份有限公司 | 動態訓練動作與靜態訓練動作的偵測方法及裝置 |
CN113569756B (zh) * | 2021-07-29 | 2023-06-09 | 西安交通大学 | 异常行为检测与定位方法、系统、终端设备及可读存储介质 |
CN113642471A (zh) * | 2021-08-16 | 2021-11-12 | 百度在线网络技术(北京)有限公司 | 一种图像识别方法、装置、电子设备和存储介质 |
CN113870215B (zh) * | 2021-09-26 | 2023-04-07 | 推想医疗科技股份有限公司 | 中线提取方法及装置 |
CN114154465B (zh) * | 2021-10-29 | 2024-07-16 | 北京搜狗科技发展有限公司 | 结构图的结构重构方法、装置、电子设备及存储介质 |
CN114155556B (zh) * | 2021-12-07 | 2024-05-07 | 中国石油大学(华东) | 一种基于加入通道混洗模块的堆叠沙漏网络的人体姿态估计方法及系统 |
CN114393575B (zh) * | 2021-12-17 | 2024-04-02 | 重庆特斯联智慧科技股份有限公司 | 基于用户姿势高效能识别的机器人控制方法和系统 |
CN114492522B (zh) * | 2022-01-24 | 2023-04-28 | 四川大学 | 基于改进堆叠沙漏神经网络的自动调制分类方法 |
CN115937793B (zh) * | 2023-03-02 | 2023-07-25 | 广东汇通信息科技股份有限公司 | 基于图像处理的学生行为异常检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197633A (zh) * | 2017-11-24 | 2018-06-22 | 百年金海科技有限公司 | 基于TensorFlow的深度学习图像分类与应用部署方法 |
US20180186452A1 (en) * | 2017-01-04 | 2018-07-05 | Beijing Deephi Technology Co., Ltd. | Unmanned Aerial Vehicle Interactive Apparatus and Method Based on Deep Learning Posture Estimation |
CN108596258A (zh) * | 2018-04-27 | 2018-09-28 | 南京邮电大学 | 一种基于卷积神经网络随机池化的图像分类方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229490B (zh) * | 2017-02-23 | 2021-01-05 | 北京市商汤科技开发有限公司 | 关键点检测方法、神经网络训练方法、装置和电子设备 |
CN108229497B (zh) * | 2017-07-28 | 2021-01-05 | 北京市商汤科技开发有限公司 | 图像处理方法、装置、存储介质、计算机程序和电子设备 |
CN108280455B (zh) * | 2018-01-19 | 2021-04-02 | 北京市商汤科技开发有限公司 | 人体关键点检测方法和装置、电子设备、程序和介质 |
CN108427927B (zh) * | 2018-03-16 | 2020-11-27 | 深圳市商汤科技有限公司 | 目标再识别方法和装置、电子设备、程序和存储介质 |
EP3547211B1 (en) * | 2018-03-30 | 2021-11-17 | Naver Corporation | Methods for training a cnn and classifying an action performed by a subject in an inputted video using said cnn |
CN108764133B (zh) * | 2018-05-25 | 2020-10-20 | 北京旷视科技有限公司 | 图像识别方法、装置及系统 |
CN109670397B (zh) * | 2018-11-07 | 2020-10-30 | 北京达佳互联信息技术有限公司 | 人体骨骼关键点的检测方法、装置、电子设备及存储介质 |
-
2018
- 2018-11-07 CN CN201811319932.7A patent/CN109670397B/zh active Active
-
2019
- 2019-10-11 WO PCT/CN2019/110582 patent/WO2020093837A1/zh active Application Filing
-
2020
- 2020-10-30 US US17/085,214 patent/US11373426B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180186452A1 (en) * | 2017-01-04 | 2018-07-05 | Beijing Deephi Technology Co., Ltd. | Unmanned Aerial Vehicle Interactive Apparatus and Method Based on Deep Learning Posture Estimation |
CN108197633A (zh) * | 2017-11-24 | 2018-06-22 | 百年金海科技有限公司 | 基于TensorFlow的深度学习图像分类与应用部署方法 |
CN108596258A (zh) * | 2018-04-27 | 2018-09-28 | 南京邮电大学 | 一种基于卷积神经网络随机池化的图像分类方法 |
Non-Patent Citations (1)
Title |
---|
王春艳: "基于深度学习的人体骨架提取方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020093837A1 (zh) * | 2018-11-07 | 2020-05-14 | 北京达佳互联信息技术有限公司 | 人体骨骼关键点的检测方法、装置、电子设备及存储介质 |
US11373426B2 (en) | 2018-11-07 | 2022-06-28 | Beijing Dajia Internet Information Technology Co., Ltd. | Method for detecting key points in skeleton, apparatus, electronic device and storage medium |
CN110084180A (zh) * | 2019-04-24 | 2019-08-02 | 北京达佳互联信息技术有限公司 | 关键点检测方法、装置、电子设备及可读存储介质 |
CN110348335B (zh) * | 2019-06-25 | 2022-07-12 | 平安科技(深圳)有限公司 | 行为识别的方法、装置、终端设备及存储介质 |
WO2020259213A1 (zh) * | 2019-06-25 | 2020-12-30 | 平安科技(深圳)有限公司 | 行为识别的方法、装置、终端设备及存储介质 |
CN110348335A (zh) * | 2019-06-25 | 2019-10-18 | 平安科技(深圳)有限公司 | 行为识别的方法、装置、终端设备及存储介质 |
CN110348412A (zh) * | 2019-07-16 | 2019-10-18 | 广州图普网络科技有限公司 | 一种关键点定位方法、装置、电子设备及存储介质 |
CN110348412B (zh) * | 2019-07-16 | 2022-03-04 | 广州图普网络科技有限公司 | 一种关键点定位方法、装置、电子设备及存储介质 |
CN110532891A (zh) * | 2019-08-05 | 2019-12-03 | 北京地平线机器人技术研发有限公司 | 目标对象状态识别方法、装置、介质和设备 |
CN110532891B (zh) * | 2019-08-05 | 2022-04-05 | 北京地平线机器人技术研发有限公司 | 目标对象状态识别方法、装置、介质和设备 |
CN110738654B (zh) * | 2019-10-18 | 2022-07-15 | 中国科学技术大学 | 髋关节影像中的关键点提取及骨龄预测方法 |
CN110895809B (zh) * | 2019-10-18 | 2022-07-15 | 中国科学技术大学 | 准确提取髋关节影像中关键点的方法 |
CN110738654A (zh) * | 2019-10-18 | 2020-01-31 | 中国科学技术大学 | 髋关节影像中的关键点提取及骨龄预测方法 |
CN110895809A (zh) * | 2019-10-18 | 2020-03-20 | 中国科学技术大学 | 准确提取髋关节影像中关键点的方法 |
CN111414823A (zh) * | 2020-03-12 | 2020-07-14 | Oppo广东移动通信有限公司 | 人体特征点的检测方法、装置、电子设备以及存储介质 |
CN111414823B (zh) * | 2020-03-12 | 2023-09-12 | Oppo广东移动通信有限公司 | 人体特征点的检测方法、装置、电子设备以及存储介质 |
CN111753643A (zh) * | 2020-05-09 | 2020-10-09 | 北京迈格威科技有限公司 | 人物姿态识别方法、装置、计算机设备和存储介质 |
CN111753643B (zh) * | 2020-05-09 | 2024-05-14 | 北京迈格威科技有限公司 | 人物姿态识别方法、装置、计算机设备和存储介质 |
CN111899235A (zh) * | 2020-07-21 | 2020-11-06 | 北京灵汐科技有限公司 | 图像检测方法、装置、电子设备和存储介质 |
CN112417991B (zh) * | 2020-11-02 | 2022-04-29 | 武汉大学 | 基于沙漏胶囊网络的双注意力人脸对齐方法 |
CN112417991A (zh) * | 2020-11-02 | 2021-02-26 | 武汉大学 | 基于沙漏胶囊网络的双注意力人脸对齐方法 |
CN113192043B (zh) * | 2021-05-13 | 2022-07-01 | 杭州健培科技有限公司 | 基于多尺度拓扑图的医学关键点检测方法、装置及应用 |
CN113192043A (zh) * | 2021-05-13 | 2021-07-30 | 杭州健培科技有限公司 | 基于多尺度拓扑图的医学关键点检测方法、装置及应用 |
CN116894844A (zh) * | 2023-07-06 | 2023-10-17 | 北京长木谷医疗科技股份有限公司 | 一种髋关节图像分割与关键点联动识别方法及装置 |
CN116894844B (zh) * | 2023-07-06 | 2024-04-02 | 北京长木谷医疗科技股份有限公司 | 一种髋关节图像分割与关键点联动识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
US20210049356A1 (en) | 2021-02-18 |
US11373426B2 (en) | 2022-06-28 |
CN109670397B (zh) | 2020-10-30 |
WO2020093837A1 (zh) | 2020-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109670397A (zh) | 人体骨骼关键点的检测方法、装置、电子设备及存储介质 | |
CN108121952B (zh) | 人脸关键点定位方法、装置、设备及存储介质 | |
CN110210571B (zh) | 图像识别方法、装置、计算机设备及计算机可读存储介质 | |
CN110807361B (zh) | 人体识别方法、装置、计算机设备及存储介质 | |
CN105809704B (zh) | 识别图像清晰度的方法及装置 | |
CN110222551B (zh) | 识别动作类别的方法、装置、电子设备及存储介质 | |
CN105631403B (zh) | 人脸识别方法及装置 | |
WO2020224479A1 (zh) | 目标的位置获取方法、装置、计算机设备及存储介质 | |
KR101906827B1 (ko) | 연속 사진 촬영 장치 및 방법 | |
CN109726659A (zh) | 人体骨骼关键点的检测方法、装置、电子设备和可读介质 | |
CN104850828B (zh) | 人物识别方法及装置 | |
CN105512685B (zh) | 物体识别方法和装置 | |
CN105608425B (zh) | 对照片进行分类存储的方法及装置 | |
CN104700353B (zh) | 图像滤镜生成方法及装置 | |
CN108712603B (zh) | 一种图像处理方法及移动终端 | |
CN109889724A (zh) | 图像虚化方法、装置、电子设备及可读存储介质 | |
CN109977847A (zh) | 图像生成方法及装置、电子设备和存储介质 | |
CN109672830A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN108288032B (zh) | 动作特征获取方法、装置及存储介质 | |
CN111984347B (zh) | 交互处理方法、装置、设备及存储介质 | |
CN112036331A (zh) | 活体检测模型的训练方法、装置、设备及存储介质 | |
CN107766820A (zh) | 图像分类方法及装置 | |
CN109410276A (zh) | 关键点位置确定方法、装置及电子设备 | |
CN108154466A (zh) | 图像处理方法及装置 | |
CN109086752A (zh) | 人脸识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20211019 Address after: 101d1-7, 1st floor, building 1, No. 6, Shangdi West Road, Haidian District, Beijing 100085 Patentee after: Beijing Dajia Internet Information Technology Co.,Ltd. Patentee after: Beijing Kwai Technology Co.,Ltd. Address before: B2201, 20 / F, building 8, yard 1, Zhongguancun East Road, Haidian District, Beijing 100084 Patentee before: Beijing Dajia Internet Information Technology Co.,Ltd. |