CN112270669B - 人体3d关键点检测方法、模型训练方法及相关装置 - Google Patents
人体3d关键点检测方法、模型训练方法及相关装置 Download PDFInfo
- Publication number
- CN112270669B CN112270669B CN202011238135.3A CN202011238135A CN112270669B CN 112270669 B CN112270669 B CN 112270669B CN 202011238135 A CN202011238135 A CN 202011238135A CN 112270669 B CN112270669 B CN 112270669B
- Authority
- CN
- China
- Prior art keywords
- human body
- coordinate
- target
- key point
- dimension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 72
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000001514 detection method Methods 0.000 title claims abstract description 41
- 238000010586 diagram Methods 0.000 claims abstract description 87
- 238000000605 extraction Methods 0.000 claims abstract description 51
- 230000015654 memory Effects 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 16
- 230000003190 augmentative effect Effects 0.000 abstract description 3
- 238000013135 deep learning Methods 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 8
- 238000013136 deep learning model Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 210000003423 ankle Anatomy 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003238 somatosensory effect Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 210000002683 foot Anatomy 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
- G06T5/92—Dynamic range modification of images or parts thereof based on global image properties
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/04—Indexing scheme for image data processing or generation, in general involving 3D image data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10012—Stereo images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Human Computer Interaction (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了人体3D关键点检测方法、模型训练方法及相关装置,涉及计算机视觉技术和增强现实技术等深度学习技术领域。具体实现方案为:获取待检测图像;所述待检测图像包括第一人体图像数据;将所述待检测图像输入至关键点提取模型,得到所述第一人体图像数据的N个人体三维3D关键点的N个第一3D热力分布图;其中,每一第一3D热力分布图表征所述第一人体图像数据的一个人体3D关键点在预设空间中的高斯分布,N为正整数;基于所述N个第一3D热力分布图,确定所述第一人体图像数据的N个人体3D关键点的坐标信息。根据本申请的技术,解决了人体3D关键点检测技术存在的误差比较大的问题,提高了人体3D关键点检测的精度。
Description
技术领域
本申请涉及图像处理技术,尤其涉及计算机视觉技术和增强现实技术领域,具体涉及一种人体3D关键点检测方法、模型训练方法及相关装置。
背景技术
随着互联网技术的发展以及人机交互应用的普及,获取人体关键点的应用价值也越来越高,比如在一些体感游戏、人体行为分析、虚拟形象阿凡达avatar驱动等领域都可能需要应用到人体关键点。
对于人体关键点的深度学习技术是指输入人体图像,通过深度学习模型的推断,输出指定的人体关键点的技术。目前,人体3D关键点的检测方式通常是基于深度学习模型识别彩色RGB图像的特征来得到人体3D关键点。
发明内容
本公开提供了一种人体3D关键点检测方法、模型训练方法及相关装置。
根据本公开的第一方面,提供了一种人体3D关键点检测方法,包括:
获取待检测图像;其中,所述待检测图像包括第一人体图像数据;
将所述待检测图像输入至关键点提取模型,得到所述第一人体图像数据的N个人体三维3D关键点的N个第一3D热力分布图;其中,每一第一3D热力分布图表征所述第一人体图像数据的一个人体3D关键点在预设空间中的高斯分布,N为正整数;
基于所述N个第一3D热力分布图,确定所述第一人体图像数据的N个人体3D关键点的坐标信息。
根据本公开的第二方面,提供了一种模型训练方法,包括:
将所述待检测图像输入至关键点提取模型,输出所述N个人体3D关键点的N个第二3D热力分布图;其中,所述第二3D热力分布图的空间尺寸大小为所述预设空间;
针对每一第二3D热力分布图,将所述第二3D热力分布图的数据进行归一化,以得到所述N个第一3D热力分布图。
根据本公开的第三方面,提供了一种人体3D关键点检测装置,包括:
第一获取模块,用于获取待检测图像;其中,所述待检测图像包括第一人体图像数据;
第一输入模块,用于将所述待检测图像输入至关键点提取模型,得到所述第一人体图像数据的N个人体三维3D关键点的N个第一3D热力分布图;其中,每一第一3D热力分布图表征所述第一人体图像数据的一个人体3D关键点在预设空间中的高斯分布,N为正整数;
第一确定模块,用于基于所述N个第一3D热力分布图,确定所述第一人体图像数据的N个人体3D关键点的坐标信息。
根据本公布的第四方面,提供了一种模型训练装置,包括:
第二获取模块,用于获取多个训练图像;其中,每个训练图像包括第二人体图像数据;
第二输入模块,用于针对所述多个训练图像中每个训练图像,将所述训练图像输入至关键点提取模型,得到所述第二人体图像数据的N个人体3D关键点的N个第三3D热力分布图;其中,每一第三3D热力分布图表征所述第二人体图像数据的一个人体3D关键点在预设空间中的高斯分布,N为正整数;
第二确定模块,用于基于所述N个第三3D热力分布图,确定所述第二人体图像数据的N个人体3D关键点的坐标信息;
第三确定模块,用于确定所述第二人体图像数据的N个人体3D关键点的坐标信息与所述第二人体图像数据对应的坐标标签信息的差异信息;
更新模块,用于基于所述差异信息更新所述关键点提取模型。
根据本公开的第五方面,提供了一种电子设备,包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器能够执行第一方面中的任一项方法,或者执行第二方面中的任一项方法。
根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行第一方面中的任一项方法,或者执行第二方面中的任一项方法。
根据本申请的技术解决了人体3D关键点检测技术存在的误差比较大的问题,提高了人体3D关键点检测的精度。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请第一实施例的人体3D关键点检测方法的流程示意图;
图2是本申请第一实施例一具体示例的人体3D关键点检测方法的流程示意图;
图3是人体3D关键点的坐标计算示意图;
图4是根据本申请第二实施例的模型训练方法的流程示意图;
图5是根据本申请第三实施例的人体3D关键点检测装置的结构示意图;
图6是根据本申请第四实施例的模型训练装置的结构示意图;
图7是用来实现本申请实施例的方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
第一实施例
如图1所示,本申请提供一种人体3D关键点检测方法,包括如下步骤:
步骤S101:获取待检测图像;其中,所述待检测图像包括第一人体图像数据。
本实施例中,人体3D关键点检测方法涉及图像处理技术,具体涉及计算机视觉技术和增强现实技术等深度学习技术领域,其可以广泛应用于直播、健身监督或指导、智能教育、人体行为分析、3D体感游戏等诸多场景。该方法可以应用于电子设备,该电子设备可以为服务器,也可以为终端,这里不做具体限定。
所述待检测图像可以为实时采集的图像,也可以为预先存储的图像,还可以为其他设备发送的图像,或者还可以为从网络上获取的图像,这里不做具体限定。
所述待检测图像包括第一人体图像数据,所述第一人体图像数据可以为人体比较完整的图像数据,比如包括人体从头到脚的完整图像数据,所述第一人体图像数据也可以为人体部分的图像数据,比如包括人体上半身的图像数据,这里不做具体限定。为了比较完整的检测出人体3D关键点,以下所述第一人体图像数据以人体比较完整的图像数据为例进行说明。
另外,所述第一人体图像数据可以为比较清晰的、没有遮挡的,且没有旋转和比例缩放等其他处理的人体图像数据,也可以为具有遮挡如人脸遮挡,或人脸模糊,或身体旋转等的人体图像数据,这里不做具体限定。
比如,可以采用手机或者电脑等设备实时采集一张包括人体图像数据的图像,并对该图像进行人体3D关键点检测,或者获取之前拍摄的且存储在设备中的一张包括人体图像数据的图像,并对该图像进行人体3D关键点检测,或者接收其他设备发送的一张包括人体图像数据的图像,并对该图像进行人体3D关键点检测,当然,也可以从网络上获取一张包括人体图像数据的图像,并对该图像进行人体3D关键点检测。
步骤S102:将所述待检测图像输入至关键点提取模型,得到所述第一人体图像数据的N个人体三维3D关键点的N个第一3D热力分布图;其中,每一第一3D热力分布图表征所述第一人体图像数据的一个人体3D关键点在预设空间中的高斯分布,N为正整数。
该步骤中,所述关键点提取模型可以为深度学习模型,可以使用深度残差(ResNet)网络作为框架,其输入可以为图像,即可以将待检测图像输入至关键点提取模型,输出可以为第一人体图像数据的N个人体3D关键点的N个3D热力分布图,每个3D热力分布图可以对应一个人体3D关键点。
3D热力分布图可以表征一个人体3D关键点在相对空间中的分布,比如,针对人体图像数据中左脚踝对应的关键点,该关键点的3D热力分布图在相对空间中处于左下角位置的分布可能性比较大,则在该位置的颜色可以相对其他位置的颜色深,而其他位置的分布可能性相对比较小,颜色相对比较浅。
又比如,针对人体图像数据中头部对应的关键点,该关键点的3D热力分布图在相对空间中处于顶部中间位置的分布可能性比较大,则在该位置的颜色相对其他位置的颜色深,而其他位置的分布可能性相对比较小,颜色相对比较浅。
所述N可以预先定义,作为关键点提取模型的参数,在硬件要求和资源允许的前提下,其可以输出任意数量的人体3D关键点的3D热力分布图,比如N为16,即输出16个人体3D关键点的3D热力分布图。
另外,N个人体3D关键点在人体图像数据的具体位置也可以预先定义,如N个人体3D关键点在人体图像数据的具体位置可以为头部、左右手踝、左右手臂、左右脚踝、左右膝盖等。
所述关键点提取模型的输出可以为归一化的3D热力分布图,也可以不为归一化的3D热力分布图,这里不做具体限定。
将所述待检测图像输入至关键点提取模型之后,可以得到N个第一3D热力分布图,第一3D热力分布图可以表征与第一3D热力分布图对应的一个人体3D关键点在预设空间中的高斯分布,即第一3D热力分布图为归一化的3D热力分布图,其可以表征一人体3D关键点在所述预设空间的分布概率。
也就是说,在关键点提取模型输出的3D热力分布图为归一化的3D热力分布图的情况下,可以直接得到第一3D热力分布图,而在关键点提取模型输出的3D热力分布图不为归一化的3D热力分布图的情况下,需要对关键点提取模型输出的3D热力分布图中的数据进行归一化,得到第一3D热力分布图。
所述预设空间也可以预先定义,其也可以作为关键点提取模型的一个参数,输出固定空间尺寸的3D热力分布图。比如,所述预设空间可以为100×100×100,则关键点提取模型输出的即为固定空间尺寸为100×100×100的3D热力分布图。
步骤S103:基于所述N个第一3D热力分布图,确定所述第一人体图像数据的N个人体3D关键点的坐标信息。
该步骤中,每个人体3D关键点均对应有一个坐标信息,所述坐标信息可以为空间坐标系的坐标,所述空间坐标系可以基于所述预设空间建立,比如,以预设空间的左下角的顶点作为原点建立空间坐标系。
针对每个第一3D热力分布图,可以确定所述第一人体图像数据的一个人体3D关键点的坐标信息,最终得到所述第一人体图像数据的N个人体3D关键点的坐标信息。
可以有多种方式基于第一3D热力分布图确定人体3D关键点的坐标信息,比如,针对每个坐标维度,可以基于第一3D热力分布图中该坐标维度对应的二维平面的数据最大值,确定人体3D关键点在该坐标维度的坐标值。
举个例子来说,预设空间为100×100×100,空间坐标系为X、Y和Z,针对X轴方向的坐标维度,其包括100个由Y轴方向的坐标维度和Z轴方向的坐标维度所确定的二维平面,每个二维平面上可以包括表征人体3D关键点在该二维平面上的分布概率的数据。
针对每个二维平面,可以获取该二维平面上最大的数据,由于该二维平面上最大的数据可以表征人体3D关键点在该二维平面上的最大分布概率,因此这个最大的数据可以作为该坐标维度的一个坐标候选值,获得该坐标维度上的100个坐标候选值。
最终,可以将这100个坐标候选值中最大的坐标候选值确定为人体3D关键点在X轴方向的坐标维度上的坐标值。相应的,人体3D关键点在其他坐标维度上的坐标值与在X轴方向的坐标维度上的坐标值的计算方式类似,这里不进行赘述。
又比如,针对每个坐标维度,可以基于第一3D热力分布图中该坐标维度对应的二维平面的数据均值,确定人体3D关键点在该坐标维度的坐标值。
与基于第一3D热力分布图中该坐标维度对应的二维平面的数据的最大值确定人体3D关键点在该坐标维度的坐标值的方式不同的是,该方式中,坐标维度上的坐标候选值的获取方式不同。具体的,还是以X轴方向的坐标维度为例,在该方式中,可以对第一3D热力分布图中该坐标维度对应的二维平面的数据进行均值计算,得到该坐标维度的一个坐标候选值。最终,可以基于获得的坐标候选值,确定N个人体3D关键点的坐标信息。
以图2为例,简单说明一下本实施例的人体3D关键点检测方法的流程,如图2所示,待检测图像输入至关键点提取模型之后,可以得到N个第一3D热力分布图,基于N个第一3D热力分布图,可以确定第一人体图像数据的N个人体3D关键点在预设空间的坐标信息。
本实施例中,通过以3D热力分布图的方式输出人体3D关键点在预设空间中的分布概率,并基于3D热力分布图确定人体3D关键点,能够避免现有的深度学习模型采用2D坐标与深度信息分别输出的方式对人体3D关键点的检测所造成的误差影响,从而可以大大提高人体3D关键点的检测精度。
并且,本实施例只需要获取一张包括人体图像数据的待检测图像,即可进行人体3D关键点的检测,因此方便部署,且成本低廉。
可选的,所述步骤S102具体包括:
将所述待检测图像输入至关键点提取模型,输出所述N个人体3D关键点的N个第二3D热力分布图;其中,所述第二3D热力分布图的空间尺寸大小为所述预设空间;
针对每一第二3D热力分布图,将所述第二3D热力分布图的数据进行归一化,以得到所述N个第一3D热力分布图。
本实施方式中,关键点提取模型输出的是未进行归一化的3D热力分布图,即第二3D热力分布图。
得到第二3D热力分布图之后,可以通过逻辑回归模型softmax函数对第二3D热力分布图中每一数据进行归一化,即可得到对应的第一3D热力分布图。当然,也可以将第二3D热力分布图中每一数据除以第二3D热力分布图中数据最大值来进行归一化,这样也是可行的。
本实施方式中,通过关键点提取模型输出第二3D热力分布图,并针对每一第二3D热力分布图,将所述第二3D热力分布图的数据进行归一化,以得到所述N个第一3D热力分布图。如此,可以简化关键点提取模型的设计,方便模型部署。
可选的,所述N个人体3D关键点包括目标人体3D关键点,所述步骤S103具体包括:
针对所述目标人体3D关键点的三个坐标维度中目标坐标维度,基于所述目标人体3D关键点对应的第一3D热力分布图中所述目标坐标维度对应的二维平面的数据进行均值计算,得到所述目标坐标维度的多个坐标候选值;其中,所述目标坐标维度对应的二维平面为所述三个坐标维度中其他两个坐标维度所确定的平面;
将所述目标坐标维度的多个坐标候选值中最大的坐标候选值确定为所述目标人体3D关键点在所述目标坐标维度的坐标值,所述目标人体3D关键点的坐标信息包括所述目标人体3D关键点在所述三个坐标维度的坐标值;
其中,所述目标人体3D关键点为所述N个人体3D关键点中任一人体3D关键点,所述目标坐标维度为所述三个坐标维度中任一坐标维度。
本实施方式中,所述三个坐标维度可以分别为上述提到的X轴方向的坐标维度、Y轴方向的坐标维度和Z轴方向的坐标维度,所述目标坐标维度可以为这三个坐标维度中任一坐标维度。
参见图3,图3是人体3D关键点的坐标计算示意图,如图3所示,针对X轴方向的坐标维度,将Y轴方向的坐标维度和Z轴方向的坐标维度所确定的每个二维平面(可以简称为YZ二维平面)中数据求均值,得到多个坐标候选值。
针对Y轴方向的坐标维度,将X轴方向的坐标维度和Z轴方向的坐标维度所确定的每个二维平面(可以简称为XZ二维平面)中数据求均值,得到多个坐标候选值。
针对Z轴方向的坐标维度,将X轴方向的坐标维度和Y轴方向的坐标维度所确定的每个二维平面(可以简称为XY二维平面)中数据求均值,得到多个坐标候选值。
将每个坐标维度的多个坐标候选值分别做softargmax计算,确定每个坐标维度的多个坐标候选值中最大的坐标候选值,以分别确定X轴方向的坐标维度、Y轴方向的坐标维度和Z轴方向的坐标维度的坐标值,这些坐标值即构成了人体3D关键点的坐标信息。
本实施方式中,针对每个坐标维度,通过基于第一3D热力分布图中该坐标维度对应的二维平面的数据均值,确定人体3D关键点在该坐标维度的坐标值,可以提高人体3D关键点的计算精度。
第二实施例
如图4所示,本申请提供一种模型训练方法,包括如下步骤:
步骤S401:获取多个训练图像;其中,每个训练图像包括第二人体图像数据;
步骤S402:针对所述多个训练图像中每个训练图像,将所述训练图像输入至关键点提取模型,得到所述第二人体图像数据的N个人体3D关键点的N个第三3D热力分布图;其中,每一第三3D热力分布图表征所述第二人体图像数据的一个人体3D关键点在预设空间中的高斯分布,N为正整数;
步骤S403:基于所述N个第三3D热力分布图,确定所述第二人体图像数据的N个人体3D关键点的坐标信息;
步骤S404:确定所述第二人体图像数据的N个人体3D关键点的坐标信息与所述第二人体图像数据对应的坐标标签信息的差异信息;
步骤S405:基于所述差异信息更新所述关键点提取模型。
本实施例描述的是关键点提取模型的训练过程,其目的是使关键点提取模型输出比较准确的3D热力分布图。
在步骤S401中,所述多个训练图像中的每个训练图像均包括第二人体图像数据,所述第二人体图像数据可以为比较清晰的、没有遮挡的,且没有旋转和比例缩放等其他处理的人体图像数据,也可以为具有遮挡如人脸遮挡,或人脸模糊,或身体旋转等的人体图像数据,这里不做具体限定。
需要说明的是,所述第二人体图像数据和所述第一人体图像数据两者是相同的概念,其均表示的是图像中人体的图像数据。只是第一人体图像数据是待检测图像中的人体图像数据,而第二人体图像数据是训练图像中的人体图像数据,且待检测图像和训练图像有可能其图像本身内容不同,因此用第一和第二进行区分。
所述步骤S402与第一实施例中的步骤S102类似,所述步骤S403与第一实施例中的步骤S103类似,对于相似的部分,本实施例不再赘述。
而不同的是,所述关键点提取模型的输入是训练图像,输出是第二人体图像数据的N个人体3D关键点的N个第三3D热力分布图,且基于每个训练图像,其所做的操作均是一样的,以下以一个训练图像为例进行说明。
在步骤S404和步骤S405中,针对每个训练图像中的第二人体图像数据,可以预先获取所述第二人体图像数据的N个人体3D关键点的坐标标签信息,该坐标标签信息可以为第二人体图像数据的N个人体3D关键点的坐标真值。
可以将基于N个第三3D热力分布图确定的坐标信息与坐标标签信息进行对比,使用回归损失函数L1 Loss的公式计算这两者之间的差异信息,如下式(1)所示。
Lossc=||Oc-Gc||1 (1)
其中,上式(1)中,Lossc表示确定的坐标信息与坐标标签信息的差异信息,Oc表示确定的坐标信息,Gc表示坐标标签信息。
将所述差异信息回传至关键点提取模型,以更新关键点提取模型中的参数,直至基于关键点提取模型输出的3D热力分布图所确定的人体图像数据的人体3D关键点的坐标信息与其坐标标签信息的差异信息达到收敛或达到最小,此时,关键点提取模型则训练完成,可以基于其进行人体3D关键点检测。
本实施例中,在训练过程中,通过关键点提取模型输出3D热力分布图,基于3D热力分布图确定人体3D关键点的坐标信息,并将坐标信息与坐标标签信息的差异信息回传至关键点提取模型,以使关键点提取模型进行参数更新。这样,以3D热力分布图的方式直接对人体3D关键点进行回归学习,使关键点提取模型输出每个人体3D关键点在预设空间中的分布概率,可以大大提高人体3D关键点的检测精度。
可选的,所述步骤S401具体包括:
获取多个目标训练图像;
对所述多个目标训练图像进行数据增强处理,得到所述多个训练图像。
本实施方式中,每个目标训练图像中均可以包括比较完整的、比较清晰的、没有遮挡的,且没有旋转和比例缩放等其他处理的人体图像数据。
为了提高关键点提取模型的换算能力,采用有限的图像数据模拟出人体3D关键点检测过程中更多可能发生的情况,提高模型的泛化能力,可以对所述多个目标训练图像进行数据增强处理,得到所述多个训练图像。
每个目标训练图像可以遵循以下准则进行数据增强处理:颜色空间、随机遮挡、旋转、混合背景和比例缩放等。
这样,一方面,可以获取更多的训练图像数据,从而可以采用有限的图像数据模拟出人体3D关键点检测过程中更多可能发生的情况;另一方面,还可以提高关键点提取模型的换算能力,提高模型的泛化能力。
第三实施例
如图5所示,本申请提供一种人体3D关键点检测装置500,包括:
第一获取模块501,用于获取待检测图像;其中,所述待检测图像包括第一人体图像数据;
第一输入模块502,用于将所述待检测图像输入至关键点提取模型,得到所述第一人体图像数据的N个人体三维3D关键点的N个第一3D热力分布图;其中,每一第一3D热力分布图表征所述第一人体图像数据的一个人体3D关键点在预设空间中的高斯分布,N为正整数;
第一确定模块503,用于基于所述N个第一3D热力分布图,确定所述第一人体图像数据的N个人体3D关键点的坐标信息。
可选的,其中,所述第一输入模块502包括:
输入单元,用于将所述待检测图像输入至关键点提取模型,输出所述N个人体3D关键点的N个第二3D热力分布图;其中,所述第二3D热力分布图的空间尺寸大小为所述预设空间;
归一化单元,用于针对每一第二3D热力分布图,将所述第二3D热力分布图的数据进行归一化,以得到所述N个第一3D热力分布图。
可选的,其中,所述N个人体3D关键点包括目标人体3D关键点,所述第一确定模块包括:
计算单元,用于针对所述目标人体3D关键点的三个坐标维度中目标坐标维度,基于所述目标人体3D关键点对应的第一3D热力分布图中所述目标坐标维度对应的二维平面的数据进行均值计算,得到所述目标坐标维度的多个坐标候选值;其中,所述目标坐标维度对应的二维平面为所述三个坐标维度中其他两个坐标维度所确定的平面;
确定单元,用于将所述目标坐标维度的多个坐标候选值中最大的坐标候选值确定为所述目标人体3D关键点在所述目标坐标维度的坐标值,所述目标人体3D关键点的坐标信息包括所述目标人体3D关键点在所述三个坐标维度的坐标值;
其中,所述目标人体3D关键点为所述N个人体3D关键点中任一人体3D关键点,所述目标坐标维度为所述三个坐标维度中任一坐标维度。
本申请提供的人体3D关键点检测装置500能够实现上述人体3D关键点检测方法实施例实现的各个过程,且能够达到相同的有益效果,为避免重复,这里不再赘述。
第四实施例
如图6所示,本申请提供一种模型训练装置600,包括:
第二获取模块601,用于获取多个训练图像;其中,每个训练图像包括第二人体图像数据;
第二输入模块602,用于针对所述多个训练图像中每个训练图像,将所述训练图像输入至关键点提取模型,得到所述第二人体图像数据的N个人体3D关键点的N个第三3D热力分布图;其中,每一第三3D热力分布图表征所述第二人体图像数据的一个人体3D关键点在预设空间中的高斯分布,N为正整数;
第二确定模块603,用于基于所述N个第三3D热力分布图,确定所述第二人体图像数据的N个人体3D关键点的坐标信息;
第三确定模块604,用于确定所述第二人体图像数据的N个人体3D关键点的坐标信息与所述第二人体图像数据对应的坐标标签信息的差异信息;
更新模块605,用于基于所述差异信息更新所述关键点提取模型。
可选的,其中,第二获取模块601包括:
获取单元,用于获取多个目标训练图像;
数据增强处理单元,用于对所述多个目标训练图像进行数据增强处理,得到所述多个训练图像。
本申请提供的模型训练装置600能够实现上述模型训练方法实施例实现的各个过程,且能够达到相同的有益效果,为避免重复,这里不再赘述。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图7所示,是根据本申请实施例的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图7所示,该电子设备包括:一个或多个处理器701、存储器702,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图7中以一个处理器701为例。
存储器702即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的人体3D关键点检测方法或模型训练方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的人体3D关键点检测方法或模型训练方法。
存储器702作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的人体3D关键点检测方法对应的程序指令/模块(例如,附图5所示的第一获取模块501、第一输入模块502和第一确定模块503),或者如本申请实施例中的模型训练方法对应的程序指令/模块(例如,附图6所示的第二获取模块601、第二输入模块602、第二确定模块603、第三确定模块604和更新模块605)。处理器701通过运行存储在存储器702中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的人体3D关键点检测方法,或者实现上述方法实施例中的模型训练方法。
存储器702可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据本申请实施例的方法的电子设备的使用所创建的数据等。此外,存储器702可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器702可选包括相对于处理器701远程设置的存储器,这些远程存储器可以通过网络连接至人体3D关键点检测方法的电子设备,或者连接至模型训练方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本申请实施例的方法的电子设备还可以包括:输入装置703和输出装置704。处理器701、存储器702、输入装置703和输出装置704可以通过总线或者其他方式连接,图7中以通过总线连接为例。
输入装置703可接收输入的数字或字符信息,以及产生与本申请实施例的方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置704可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务("Virtual Private Server",或简称"VPS")中,存在的管理难度大,业务扩展性弱的缺陷。
本实施例中,通过以3D热力分布图的方式输出人体3D关键点在预设空间中的分布概率,并基于3D热力分布图确定人体3D关键点,能够避免现有的深度学习模型采用2D坐标与深度信息分别输出的方式对人体3D关键点的检测所造成的误差影响,从而可以大大提高人体3D关键点的检测精度。因此,根据本申请实施例的技术方案,很好地解决了人体3D关键点检测技术存在的误差比较大的问题。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (11)
1.一种人体3D关键点检测方法,包括:
获取待检测图像;其中,所述待检测图像包括第一人体图像数据;
将所述待检测图像输入至关键点提取模型,得到所述第一人体图像数据的N个人体三维3D关键点的N个第一3D热力分布图;其中,每一第一3D热力分布图表征所述第一人体图像数据的一个人体3D关键点在预设空间中的高斯分布,N为正整数;
基于所述N个第一3D热力分布图,确定所述第一人体图像数据的N个人体3D关键点的坐标信息;
所述N个人体3D关键点包括目标人体3D关键点,所述基于所述N个第一3D热力分布图,确定所述第一人体图像数据的N个人体3D关键点的坐标信息包括:
针对所述目标人体3D关键点的三个坐标维度中目标坐标维度,基于所述目标人体3D关键点对应的第一3D热力分布图中所述目标坐标维度对应的二维平面的数据进行均值计算,得到所述目标坐标维度的多个坐标候选值;或者,基于所述目标人体3D关键点对应的第一3D热力分布图中所述目标坐标维度对应的二维平面的数据最大值确定为所述目标坐标维度的坐标候选值,得到所述目标坐标维度的多个坐标候选值;其中,所述目标坐标维度对应的二维平面为所述三个坐标维度中其他两个坐标维度所确定的平面;
将所述目标坐标维度的多个坐标候选值中最大的坐标候选值确定为所述目标人体3D关键点在所述目标坐标维度的坐标值,所述目标人体3D关键点的坐标信息包括所述目标人体3D关键点在所述三个坐标维度的坐标值;
其中,所述目标人体3D关键点为所述N个人体3D关键点中任一人体3D关键点,所述目标坐标维度为所述三个坐标维度中任一坐标维度。
2.根据权利要求1所述的方法,其中,所述将所述待检测图像输入至关键点提取模型,得到所述第一人体图像数据的N个人体三维3D关键点的N个第一3D热力分布图包括:
将所述待检测图像输入至关键点提取模型,输出所述N个人体3D关键点的N个第二3D热力分布图;其中,所述第二3D热力分布图的空间尺寸大小为所述预设空间;
针对每一第二3D热力分布图,将所述第二3D热力分布图的数据进行归一化,以得到所述N个第一3D热力分布图。
3.一种模型训练方法,包括:
获取多个训练图像;其中,每个训练图像包括第二人体图像数据;
针对所述多个训练图像中每个训练图像,将所述训练图像输入至关键点提取模型,得到所述第二人体图像数据的N个人体3D关键点的N个第三3D热力分布图;其中,每一第三3D热力分布图表征所述第二人体图像数据的一个人体3D关键点在预设空间中的高斯分布,N为正整数;
基于所述N个第三3D热力分布图,确定所述第二人体图像数据的N个人体3D关键点的坐标信息;
确定所述第二人体图像数据的N个人体3D关键点的坐标信息与所述第二人体图像数据对应的坐标标签信息的差异信息;
基于所述差异信息更新所述关键点提取模型;
所述N个人体3D关键点包括目标人体3D关键点,所述基于所述N个第三3D热力分布图,确定所述第二人体图像数据的N个人体3D关键点的坐标信息,包括:
针对所述目标人体3D关键点的三个坐标维度中目标坐标维度,基于所述目标人体3D关键点对应的第三3D热力分布图中所述目标坐标维度对应的二维平面的数据进行均值计算,得到所述目标坐标维度的多个坐标候选值;或者,基于所述目标人体3D关键点对应的第三3D热力分布图中所述目标坐标维度对应的二维平面的数据最大值确定为所述目标坐标维度的坐标候选值,得到所述目标坐标维度的多个坐标候选值;其中,所述目标坐标维度对应的二维平面为所述三个坐标维度中其他两个坐标维度所确定的平面;
将所述目标坐标维度的多个坐标候选值中最大的坐标候选值确定为所述目标人体3D关键点在所述目标坐标维度的坐标值,所述目标人体3D关键点的坐标信息包括所述目标人体3D关键点在所述三个坐标维度的坐标值;
其中,所述目标人体3D关键点为所述N个人体3D关键点中任一人体3D关键点,所述目标坐标维度为所述三个坐标维度中任一坐标维度。
4.根据权利要求3所述的方法,其中,所述获取多个训练图像包括:
获取多个目标训练图像;
对所述多个目标训练图像进行数据增强处理,得到所述多个训练图像。
5.一种人体3D关键点检测装置,包括:
第一获取模块,用于获取待检测图像;其中,所述待检测图像包括第一人体图像数据;
第一输入模块,用于将所述待检测图像输入至关键点提取模型,得到所述第一人体图像数据的N个人体三维3D关键点的N个第一3D热力分布图;其中,每一第一3D热力分布图表征所述第一人体图像数据的一个人体3D关键点在预设空间中的高斯分布,N为正整数;
第一确定模块,用于基于所述N个第一3D热力分布图,确定所述第一人体图像数据的N个人体3D关键点的坐标信息;
所述N个人体3D关键点包括目标人体3D关键点,所述第一确定模块包括:
计算单元,用于针对所述目标人体3D关键点的三个坐标维度中目标坐标维度,基于所述目标人体3D关键点对应的第一3D热力分布图中所述目标坐标维度对应的二维平面的数据进行均值计算,得到所述目标坐标维度的多个坐标候选值;或者,基于所述目标人体3D关键点对应的第一3D热力分布图中所述目标坐标维度对应的二维平面的数据最大值确定为所述目标坐标维度的坐标候选值,得到所述目标坐标维度的多个坐标候选值;其中,所述目标坐标维度对应的二维平面为所述三个坐标维度中其他两个坐标维度所确定的平面;
确定单元,用于将所述目标坐标维度的多个坐标候选值中最大的坐标候选值确定为所述目标人体3D关键点在所述目标坐标维度的坐标值,所述目标人体3D关键点的坐标信息包括所述目标人体3D关键点在所述三个坐标维度的坐标值;
其中,所述目标人体3D关键点为所述N个人体3D关键点中任一人体3D关键点,所述目标坐标维度为所述三个坐标维度中任一坐标维度。
6.根据权利要求5所述的装置,其中,所述第一输入模块包括:
输入单元,用于将所述待检测图像输入至关键点提取模型,输出所述N个人体3D关键点的N个第二3D热力分布图;其中,所述第二3D热力分布图的空间尺寸大小为所述预设空间;
归一化单元,用于针对每一第二3D热力分布图,将所述第二3D热力分布图的数据进行归一化,以得到所述N个第一3D热力分布图。
7.一种模型训练装置,包括:
第二获取模块,用于获取多个训练图像;其中,每个训练图像包括第二人体图像数据;
第二输入模块,用于针对所述多个训练图像中每个训练图像,将所述训练图像输入至关键点提取模型,得到所述第二人体图像数据的N个人体3D关键点的N个第三3D热力分布图;其中,每一第三3D热力分布图表征所述第二人体图像数据的一个人体3D关键点在预设空间中的高斯分布,N为正整数;
第二确定模块,用于基于所述N个第三3D热力分布图,确定所述第二人体图像数据的N个人体3D关键点的坐标信息;
第三确定模块,用于确定所述第二人体图像数据的N个人体3D关键点的坐标信息与所述第二人体图像数据对应的坐标标签信息的差异信息;
更新模块,用于基于所述差异信息更新所述关键点提取模型;
所述N个人体3D关键点包括目标人体3D关键点,所述第二确定模块,具体用于:
针对所述目标人体3D关键点的三个坐标维度中目标坐标维度,基于所述目标人体3D关键点对应的第三3D热力分布图中所述目标坐标维度对应的二维平面的数据进行均值计算,得到所述目标坐标维度的多个坐标候选值;或者,基于所述目标人体3D关键点对应的第三3D热力分布图中所述目标坐标维度对应的二维平面的数据最大值确定为所述目标坐标维度的坐标候选值,得到所述目标坐标维度的多个坐标候选值;其中,所述目标坐标维度对应的二维平面为所述三个坐标维度中其他两个坐标维度所确定的平面;
将所述目标坐标维度的多个坐标候选值中最大的坐标候选值确定为所述目标人体3D关键点在所述目标坐标维度的坐标值,所述目标人体3D关键点的坐标信息包括所述目标人体3D关键点在所述三个坐标维度的坐标值;
其中,所述目标人体3D关键点为所述N个人体3D关键点中任一人体3D关键点,所述目标坐标维度为所述三个坐标维度中任一坐标维度。
8.根据权利要求7所述的装置,其中,第二获取模块包括:
获取单元,用于获取多个目标训练图像;
数据增强处理单元,用于对所述多个目标训练图像进行数据增强处理,得到所述多个训练图像。
9.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-2中任一项所述的方法,或者执行权利要求3-4中任一项所述的方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-2中任一项所述的方法,或者执行权利要求3-4中任一项所述的方法。
11.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-2中任一项所述的方法,或者执行权利要求3-4中任一项所述的方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011238135.3A CN112270669B (zh) | 2020-11-09 | 2020-11-09 | 人体3d关键点检测方法、模型训练方法及相关装置 |
US17/352,767 US11816915B2 (en) | 2020-11-09 | 2021-06-21 | Human body three-dimensional key point detection method, model training method and related devices |
JP2021145433A JP7228650B2 (ja) | 2020-11-09 | 2021-09-07 | 人体3dキー点検出方法、モデル訓練方法及び関連装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011238135.3A CN112270669B (zh) | 2020-11-09 | 2020-11-09 | 人体3d关键点检测方法、模型训练方法及相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112270669A CN112270669A (zh) | 2021-01-26 |
CN112270669B true CN112270669B (zh) | 2024-03-01 |
Family
ID=74339771
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011238135.3A Active CN112270669B (zh) | 2020-11-09 | 2020-11-09 | 人体3d关键点检测方法、模型训练方法及相关装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11816915B2 (zh) |
JP (1) | JP7228650B2 (zh) |
CN (1) | CN112270669B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109840500B (zh) * | 2019-01-31 | 2021-07-02 | 深圳市商汤科技有限公司 | 一种三维人体姿态信息检测方法及装置 |
CN113033485B (zh) * | 2021-04-21 | 2024-07-26 | 上海容么么数字科技有限公司 | 关键点的检测方法和装置 |
CN113192043B (zh) * | 2021-05-13 | 2022-07-01 | 杭州健培科技有限公司 | 基于多尺度拓扑图的医学关键点检测方法、装置及应用 |
CN114092963B (zh) * | 2021-10-14 | 2023-09-22 | 北京百度网讯科技有限公司 | 关键点检测及模型训练方法、装置、设备和存储介质 |
CN114757822B (zh) * | 2022-06-14 | 2022-11-04 | 之江实验室 | 一种基于双目的人体三维关键点检测方法及系统 |
CN115578451B (zh) * | 2022-09-30 | 2024-01-23 | 北京百度网讯科技有限公司 | 图像处理方法、图像处理模型的训练方法和装置 |
CN116309591B (zh) * | 2023-05-19 | 2023-08-25 | 杭州健培科技有限公司 | 一种医学影像3d关键点检测方法、模型训练方法及装置 |
CN118506397A (zh) * | 2023-07-21 | 2024-08-16 | 北京优创新港科技股份有限公司 | 基于单个模型高效率识别人体位置和关键点检测方法 |
CN117523645B (zh) * | 2024-01-08 | 2024-03-22 | 深圳市宗匠科技有限公司 | 一种人脸关键点检测方法、装置、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111160375A (zh) * | 2019-12-31 | 2020-05-15 | 北京奇艺世纪科技有限公司 | 三维关键点预测及深度学习模型训练方法、装置及设备 |
WO2020134010A1 (zh) * | 2018-12-27 | 2020-07-02 | 北京字节跳动网络技术有限公司 | 对图像关键点提取模型的训练及图像关键点提取 |
CN111523468A (zh) * | 2020-04-23 | 2020-08-11 | 北京百度网讯科技有限公司 | 人体关键点识别方法和装置 |
WO2020207190A1 (zh) * | 2019-04-12 | 2020-10-15 | Oppo广东移动通信有限公司 | 一种三维信息确定方法、三维信息确定装置及终端设备 |
WO2020207281A1 (zh) * | 2019-04-12 | 2020-10-15 | 腾讯科技(深圳)有限公司 | 姿态识别模型的训练方法、图像识别方法及装置 |
CN111783948A (zh) * | 2020-06-24 | 2020-10-16 | 北京百度网讯科技有限公司 | 模型训练方法、装置、电子设备以及存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109684920B (zh) * | 2018-11-19 | 2020-12-11 | 腾讯科技(深圳)有限公司 | 物体关键点的定位方法、图像处理方法、装置及存储介质 |
US10853970B1 (en) * | 2019-03-22 | 2020-12-01 | Bartec Corporation | System for estimating a three dimensional pose of one or more persons in a scene |
CN110516643A (zh) | 2019-08-30 | 2019-11-29 | 电子科技大学 | 一种基于联合热力图的人脸3d关键点检测方法及系统 |
CN110991319B (zh) | 2019-11-29 | 2021-10-19 | 广州市百果园信息技术有限公司 | 手部关键点检测方法、手势识别方法及相关装置 |
US11315254B2 (en) * | 2020-01-17 | 2022-04-26 | Ping An Technology (Shenzhen) Co., Ltd. | Method and device for stratified image segmentation |
US11417011B2 (en) * | 2020-02-11 | 2022-08-16 | Nvidia Corporation | 3D human body pose estimation using a model trained from unlabeled multi-view data |
CN111402228B (zh) | 2020-03-13 | 2021-05-07 | 腾讯科技(深圳)有限公司 | 图像检测方法、装置和计算机可读存储介质 |
-
2020
- 2020-11-09 CN CN202011238135.3A patent/CN112270669B/zh active Active
-
2021
- 2021-06-21 US US17/352,767 patent/US11816915B2/en active Active
- 2021-09-07 JP JP2021145433A patent/JP7228650B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020134010A1 (zh) * | 2018-12-27 | 2020-07-02 | 北京字节跳动网络技术有限公司 | 对图像关键点提取模型的训练及图像关键点提取 |
WO2020207190A1 (zh) * | 2019-04-12 | 2020-10-15 | Oppo广东移动通信有限公司 | 一种三维信息确定方法、三维信息确定装置及终端设备 |
WO2020207281A1 (zh) * | 2019-04-12 | 2020-10-15 | 腾讯科技(深圳)有限公司 | 姿态识别模型的训练方法、图像识别方法及装置 |
CN111160375A (zh) * | 2019-12-31 | 2020-05-15 | 北京奇艺世纪科技有限公司 | 三维关键点预测及深度学习模型训练方法、装置及设备 |
CN111523468A (zh) * | 2020-04-23 | 2020-08-11 | 北京百度网讯科技有限公司 | 人体关键点识别方法和装置 |
CN111783948A (zh) * | 2020-06-24 | 2020-10-16 | 北京百度网讯科技有限公司 | 模型训练方法、装置、电子设备以及存储介质 |
Non-Patent Citations (2)
Title |
---|
Coarse-to-Fine Volumetric Prediction for Single-Image 3D Human Pose;Georgios Pavlakos等;《Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017》;20171231;全文 * |
基于GBDT和HOG特征的人脸关键点定位;张重生;彭国雯;于珂珂;;河南大学学报(自然科学版);20180316(第02期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
US11816915B2 (en) | 2023-11-14 |
JP7228650B2 (ja) | 2023-02-24 |
US20210312171A1 (en) | 2021-10-07 |
CN112270669A (zh) | 2021-01-26 |
JP2021192294A (ja) | 2021-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112270669B (zh) | 人体3d关键点检测方法、模型训练方法及相关装置 | |
US11615605B2 (en) | Vehicle information detection method, electronic device and storage medium | |
CN111709874B (zh) | 图像调整的方法、装置、电子设备及存储介质 | |
CN111860167B (zh) | 人脸融合模型获取及人脸融合方法、装置及存储介质 | |
CN111722245B (zh) | 定位方法、定位装置和电子设备 | |
CN112330730B (zh) | 图像处理方法、装置、设备及存储介质 | |
CN111767853B (zh) | 车道线检测方法和装置 | |
CN112652016A (zh) | 点云预测模型的生成方法、位姿估计方法及其装置 | |
CN111968203B (zh) | 动画驱动方法、装置、电子设备及存储介质 | |
CN111079079B (zh) | 数据修正方法、装置、电子设备及计算机可读存储介质 | |
KR102643425B1 (ko) | 차량의 차로변경을 탐지하는 방법과 장치, 전자 기기, 저장 장치, 노변 기기, 클라우드 제어 플랫폼 및 프로그램 제품 | |
CN111401251B (zh) | 车道线提取方法、装置、电子设备及计算机可读存储介质 | |
CN111275827B (zh) | 基于边缘的增强现实三维跟踪注册方法、装置和电子设备 | |
CN111797745B (zh) | 一种物体检测模型的训练及预测方法、装置、设备及介质 | |
CN111539347B (zh) | 用于检测目标的方法和装置 | |
CN111695519B (zh) | 关键点定位方法、装置、设备以及存储介质 | |
CN112001248B (zh) | 主动交互的方法、装置、电子设备和可读存储介质 | |
CN112241716B (zh) | 训练样本的生成方法和装置 | |
CN111462179B (zh) | 三维物体跟踪方法、装置及电子设备 | |
CN111949816B (zh) | 定位处理方法、装置、电子设备和存储介质 | |
CN111858996B (zh) | 室内定位方法、装置、电子设备及存储介质 | |
CN111311743B (zh) | 三维重建精度测试方法、测试装置和电子设备 | |
CN111832611B (zh) | 动物识别模型的训练方法、装置、设备及存储介质 | |
CN111833391B (zh) | 图像深度信息的估计方法及装置 | |
CN111695516B (zh) | 热力图的生成方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |