CN115457594A - 一种三维人体姿态估计方法、系统、存储介质和电子设备 - Google Patents

一种三维人体姿态估计方法、系统、存储介质和电子设备 Download PDF

Info

Publication number
CN115457594A
CN115457594A CN202210974354.0A CN202210974354A CN115457594A CN 115457594 A CN115457594 A CN 115457594A CN 202210974354 A CN202210974354 A CN 202210974354A CN 115457594 A CN115457594 A CN 115457594A
Authority
CN
China
Prior art keywords
camera
human body
dimensional
calibration
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210974354.0A
Other languages
English (en)
Inventor
李建伟
李金阳
张开宇
胡海晴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sport University
Original Assignee
Beijing Sport University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sport University filed Critical Beijing Sport University
Priority to CN202210974354.0A priority Critical patent/CN115457594A/zh
Publication of CN115457594A publication Critical patent/CN115457594A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/80Analysis of captured images to determine intrinsic or extrinsic camera parameters, i.e. camera calibration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/141Control of illumination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects
    • G06V20/647Three-dimensional objects by matching two-dimensional images to three-dimensional objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Length Measuring Devices By Optical Means (AREA)

Abstract

本发明涉及一种三维人体姿态估计方法、系统、存储介质和电子设备,包括:控制每台相机柱上放置的每台相机同步采集待测人体的图像数据,并利用训练后的二维姿态估计模型,得到每个图像数据对应的二维人体姿态数据;根据每台相机柱上的所有相机的相机内参、相机外参和二维人体姿态数据,得到待测人体在每台相机柱视点下的原始三维人体姿态数据;对每个原始三维人体姿态数据进行三维骨架关节长度校验,得到多个目标三维人体姿态数据,并对所有的目标三维人体姿态数据进行三维人体姿态融合,得到三维人体姿态估计结果。本发明解决了多相机低延迟同步、多相机自动化准确标定、准确人体姿态三维重建等问题,能够实现对三维人体姿态进行精准估计。

Description

一种三维人体姿态估计方法、系统、存储介质和电子设备
技术领域
本发明涉及人体姿态估计技术领域,尤其涉及一种三维人体姿态估计方法、系统、存储介质和电子设备。
背景技术
当前的三维人体姿态估计方法通常可以分为两步。第一步,生成所有视点相机中的二维人体姿态。二维人体姿态估计可分为自底向上方法和自上而下方法,一般来说,受益于人体实例信息,自上而下的方法表现出更高的平均精度。自下而上方法则是通过低级特征位置,将低级特征进行组装,但是准确快速地组装它们具有一定挑战性。该领域著名的算法OpenPose引入了部分亲和域(PAF)来帮助解析肢体上的低级关键点,从而获得高精度的实时性能。第二步,通过不同视点的坐标系变换关系,结合视点二维关键点,通过双目立体视觉原理计算三维人体关键点坐标。在这一步,需要知道不同视点之间的位姿关系和相机内参。所以,在恢复三维关键点坐标时还需提前进行相机标定,同时,标定精度会对三维关键点坐标精度产生较大影响。
然而现有技术中,存在多相机同步延迟较高、在高帧率情况下相机数据写入和处理效率低、多相机系统外参标定累积误差高、标定步骤繁琐、人体姿态估计对肢体遮挡识别的鲁棒性较低等缺陷。因此,亟需提供一种技术方案解决现有技术中存在的问题。
发明内容
为解决上述技术问题,本发明提供了一种三维人体姿态估计方法、系统、存储介质和电子设备。
本发明的一种三维人体姿态估计方法的技术方案如下:
控制每台相机柱上放置的每台相机同步采集待测人体的原始图像数据,并利用训练后的二维姿态估计模型,得到每个原始图像数据对应的二维人体姿态数据;其中,所有的相机柱呈环形布置;
根据每台相机柱上的所有相机的目标相机内参、目标相机外参和二维人体姿态数据,得到所述待测人体分别在每台相机柱视点下的原始三维人体姿态数据;
对每个原始三维人体姿态数据进行三维骨架关节长度校验,得到多个目标三维人体姿态数据,并对所有的目标三维人体姿态数据进行三维人体姿态融合,得到所述待测人体的三维人体姿态估计结果。
本发明的一种三维人体姿态估计方法的有益效果如下:
本发明的方法解决了多相机低延迟同步、多相机的自动化准确标定、准确人体姿态三维重建等问题,能够实现对三维人体姿态进行精准估计。
在上述方案的基础上,本发明的一种三维人体姿态估计方法还可以做如下改进。
进一步,获取每台相机的目标相机内参的过程为:
控制每台相机分别对设置在目标区域的中心的标定板进行多次同步采集,得到每台相机所采集的多个原始相机标定数据;其中,所述目标区域通过所有的相机柱环形布置所构成;
利用棋盘格角点检测算法,对所有的原始相机标定数据进行检测,将每个符合预设条件的原始相机标定数据确定为目标相机标定数据,并得到每个目标相机标定数据所对应的角点位置信息;
根据任一相机对应的所有的角点位置信息,对所述任一相机进行单目相机内参标定,得到所述任一相机的目标相机内参,直至得到每台相机的目标相机内参。
进一步,获取每台相机的目标相机外参的过程为:
按照预设标定条件,将所有相机分为多个标定组,并确定每个标定组的原点相机;
对每个标定组中的每对相邻相机分别进行双目外参标定,得到每台相机相对于对应标定组的原点相机的原始相机外参,并采用LM算法分别对每台相机的原始相机外参进行最小化重投影误差优化,得到每台相机的第一优化相机外参;
采用局部集束调整分别对每个标定组的每台相机的第一优化相机外参进行迭代优化,得到每台相机相对于对应标定组的组内优化相机外参;
其中,局部集束调整的过程为:采用代价函数的最小二乘优化累计误差,以对每个标定组内的第一优化相机外参进行迭代优化;
所述代价函数为:
Figure BDA0003797667930000031
h(Ti,vij)=KiTipj,vij为第i个相机像素坐标系下第j个角点的坐标,Ti为第i个相机与原点相机坐标系的变换关系,Ki为第i个相机的目标相机内参,m为对应标定组的所有相机的数量,n为对应标定组的共视角点的数量,pj为第j个角点在原点相机坐标系下的三维坐标;
将每个标定组中的所有相机的相机坐标转换为相对于对应标定组的原点相机的坐标,并确定第一标定组的原点相机为全局原点相机;
基于第一预设公式,将每台相机的组内优化相机外参转换为相对于所述全局原点相机的目标相机外参;其中,第一预设公式为:
Figure BDA0003797667930000032
为第1个标定组的第1个相机,
Figure BDA0003797667930000033
为第5个标定组的第1个相机,
Figure BDA0003797667930000034
为第k个标定组的第1个相机,
Figure BDA0003797667930000035
为第k个标定组的第i个相机,
Figure BDA0003797667930000036
表示相机C2相对于相机C1坐标系的刚体变换关系。
进一步,所述根据任一相机对应的所有的角点位置信息,对所述任一相机进行单目相机内参标定,得到所述任一相机的目标相机内参,包括:
根据张正友平面标定法和所述任一相机对应的所有的角点位置信息,对所述任一相机进行单目相机内参标定,得到所述任一相机的原始相机内参;
基于PnP算法,计算所述任一相机对应的每个目标相机标定数据中的棋盘格与相机坐标系的第一转换关系,并根据所述第一转换关系和所述任一相机的原始相机内参,得到所述任一相机的转换相机内参;
采用LM算法对所述任一相机的转换相机内参进行最小化重投影误差优化,得到所述任一相机的目标相机内参。
进一步,所述原始三维人体姿态数据包括:多个关节点三维坐标和多个关节点可见度信息;
所述根据每台相机柱上的所有相机的目标相机内参、目标相机外参和二维人体姿态数据,得到所述待测人体分别在每台相机柱视点下的原始三维人体姿态数据,包括:
根据任一相机柱上的所有相机的目标相机内参、目标相机外参和二维人体姿态数据,控制所述任一相机柱的所有相机进行三角测量,得到所述待测人体分别在所述任一相机柱视点下的多个关节点三维坐标和多个关节点可见度信息,直至得到所述待测人体分别在每台相机柱视点下的多个关节点三维坐标和多个关节点可见度信息。
进一步,所述对所有的目标三维人体姿态数据进行三维人体姿态融合,得到所述待测人体的三维人体姿态估计结果,包括:
根据融合骨架计算公式、每台相机对应的目标相机外参和所有的目标三维人体姿态数据,得到所述待测人体的每个关节点的融合骨架数据;其中,所述融合骨架计算公式为:
Figure BDA0003797667930000041
为第s个关节点的融合骨架数据,
Figure BDA0003797667930000042
为第i个视点对应的三维骨架的第s个关节坐标,
Figure BDA0003797667930000043
Figure BDA0003797667930000044
对应的权重,
Figure BDA0003797667930000051
,θi∈(0,90),
Figure BDA0003797667930000052
为关节点可见度信息,zi为深度值,θi为关节角;
根据所述待测人体的所有关节点的融合骨架数据和参数化人体模型,得到所述待测人体的三维人体姿态估计结果;其中,所述参数化人体模型为:Efused(o,β)=ωproEproshapeEshapegeoEgeo,Epro表示将每个视图上的二维投影对准到三维关节,Eshape表示对人体形态进行预处理,Egeo表示多视几何一致性对关节点进行约束,ωpro为Epro对应的第一平衡权重,ωshape为Eshape对应的第二平衡权重,ωgeo为Egeo对应的第三平衡权重,θ为控制骨骼长度,β为控制每个关节的姿态。
本发明的一种三维人体姿态估计系统的技术方案如下:
包括:处理模块、生成模块和估计模块;
所述处理模块用于:控制每台相机柱上放置的每台相机同步采集待测人体的原始图像数据,并利用训练后的二维姿态估计模型,得到每个原始图像数据对应的二维人体姿态数据;其中,所有的相机柱呈环形布置;
所述生成模块用于:根据每台相机柱上的所有相机的目标相机内参、目标相机外参和二维人体姿态数据,得到所述待测人体分别在每台相机柱视点下的原始三维人体姿态数据;
所述估计模块用于:对每个原始三维人体姿态数据进行三维骨架关节长度校验,得到多个目标三维人体姿态数据,并对所有的目标三维人体姿态数据进行三维人体姿态融合,得到所述待测人体的三维人体姿态估计结果。
本发明的一种三维人体姿态估计系统的有益效果如下:
本发明的系统解决了多相机低延迟同步、多相机的自动化准确标定、准确人体姿态三维重建等问题,能够实现对三维人体姿态进行精准估计。
在上述方案的基础上,本发明的一种三维人体姿态估计系统还可以做如下改进。
进一步,获取每台相机的目标相机内参的过程为:
控制每台相机分别对设置在目标区域的中心的标定板进行多次同步采集,得到每台相机所采集的多个原始相机标定数据;其中,所述目标区域通过所有的相机柱环形布置所构成;
利用棋盘格角点检测算法,对所有的原始相机标定数据进行检测,将每个符合预设条件的原始相机标定数据确定为目标相机标定数据,并得到每个目标相机标定数据所对应的角点位置信息;
根据任一相机对应的所有的角点位置信息,对所述任一相机进行单目相机内参标定,得到所述任一相机的目标相机内参,直至得到每台相机的目标相机内参。
本发明的一种存储介质的技术方案如下:
存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行如本发明的一种三维人体姿态估计方法的步骤。
本发明的一种电子设备的技术方案如下:
包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,使所述计算机执行如本发明的一种三维人体姿态估计方法的步骤。
附图说明
图1为本发明实施例的一种三维人体姿态估计方法的流程示意图;
图2为本发明实施例的一种三维人体姿态估计方法中的相机采集区域示意图;
图3为本发明实施例的一种三维人体姿态估计方法中的硬件系统示意图;
图4为本发明实施例的一种三维人体姿态估计方法中的相机分组标定示意图;
图5为本发明实施例的一种三维人体姿态估计系统的结构示意图。
具体实施方式
如图1所示,本发明实施例的一种三维人体姿态估计方法,包括如下步骤:
S1、控制每台相机柱上放置的每台相机同步采集待测人体的原始图像数据,并利用训练后的二维姿态估计模型,得到每个原始图像数据对应的二维人体姿态数据。
其中,如图2所示,本实施例中采用32台高帧率工业相机,每两个相机安装在一个相机柱上,每两个相机柱为一个相机阵列,每台相机阵列通过有源混合光纤数据线与服务器连接,8台服务器通过一台以太网交换器组网。分别连接一台服务器(共八台服务器(第一服务器31至第八服务器38),其中一台为主服务器,另外七台为从服务器),所有的相机柱呈环形布置,形成一个目标区域(拍摄区域)。具体地,如图3所示,整个系统配置有两台定制的同步信号发射装置(第一同步装置10和第二同步装置20),每台同步装置与16台相机通过专门的触发线缆连接,同时两台同步装置做级联,实现32台相机(第一相机101至第三十二相机132)的同步触发。整个系统采集区域由专用幕布遮盖,并配置提供多种光源的光照系统。
其中,待测人体位于目标区域的中心。原始图像数据为:相机所拍摄的待测人体的图像数据。训练后的二维姿态估计模型为:预先训练好的人体姿态估计神经网络模型,用于估计待测人体在每台相机视点下的二维人体姿态。
需要说明的是,对于二维姿态估计模型,本实施例中采用开源人体姿态估计框架OpenPose的主干神经网络结构进行优化,并使用构建的数据集进行训练。在实际使用中,使用训练后的二维姿态估计模型用于多相机人体姿态估计,相比默认的OpenPose预训练模型有更好的表现。
S2、根据每台相机柱上的所有相机的目标相机内参、目标相机外参和二维人体姿态数据,得到所述待测人体分别在每台相机柱视点下的原始三维人体姿态数据。
其中,目标相机内参为:经过多相机标定后所得到的相机内参。目标相机外参为:经过多相机标定后所得到的相机外参。原始三维人体姿态为:根据相机柱上的所有相机的相机内参、相机外参以及二维人体姿态数据所生成的三维人体姿态。
S3、对每个原始三维人体姿态数据进行三维骨架关节长度校验,得到多个目标三维人体姿态数据,并对所有的目标三维人体姿态数据进行三维人体姿态融合,得到所述待测人体的三维人体姿态估计结果。
其中,对每个原始三维人体姿态数据进行三维骨架关节长度校验的过程为:使用骨架先验长度模板针对每个视角的三维骨架关节长度进行检测,排除坐标异常的关节点,若检测到异常关节点,则将该关节点的可见度置为0。
其中,三维人体姿态估计结果为:待测人体的可视化三维人体姿态。
需要说明的是,用户可在进行姿态估计前,根据待测人体的实际情况进行相应的模板。
较优地,获取每台相机的目标相机内参的过程为:
控制每台相机分别对设置在目标区域的中心的标定板进行多次同步采集,得到每台相机所采集的多个原始相机标定数据;其中,所述目标区域通过所有的相机柱环形布置所构成。
具体地,采用平面棋盘格作为标定工具,在所有视点相机同步触发后,标定人员手持棋盘格标定板在相机阵列(目标区域)中心旋转一圈,同时,旋转过程中将标定板做小范围的上下平移、小角度的倾斜和旋转。每台相机采集的图片以“相机编号+帧编号”命名,触发器每发射一个方波信号,所有相机同步拍摄一次,帧编号同时增加。标定软件通过采集的图片帧编号相同来确保不同相机的标定数据同步。
需要说明的是,控制所有相机同步采集标定图像的次数不限,可根据用户需求进行设定。
利用棋盘格角点检测算法,对所有的原始相机标定数据进行检测,将每个符合预设条件的原始相机标定数据确定为目标相机标定数据,并得到每个目标相机标定数据所对应的角点位置信息。
其中,使用开源计算机视觉算法库OpenCV提供的棋盘格角点检测算法对所有的原始相机标定数据进行检测,其具体检测过程为现有技术,在此不过多赘述。
其中,预设条件为对应的棋盘格角点检测算法所设定的,用于筛选有效的相机标定数据。
根据任一相机对应的所有的角点位置信息,对所述任一相机进行单目相机内参标定,得到所述任一相机的目标相机内参,直至得到每台相机的目标相机内参。
具体地,根据张正友平面标定法和所述任一相机对应的所有的角点位置信息,对所述任一相机进行单目相机内参标定,得到所述任一相机的原始相机内参。
其中,采用张正友平面标定法标定内参时,假设不存在畸变。
基于PnP算法,计算所述任一相机对应的每个目标相机标定数据中的棋盘格与相机坐标系的第一转换关系,并根据所述第一转换关系和所述任一相机的原始相机内参,得到所述任一相机的转换相机内参。
其中,第一转换关系为:棋盘格与相机坐标系的刚体变换关系。
采用LM算法对所述任一相机的转换相机内参进行最小化重投影误差优化,得到所述任一相机的目标相机内参。
需要说明的是,张正有平面标定法、PnP算法以及LM算法均为现有技术,在此不过多赘述。
较优地,获取每台相机的目标相机外参的过程为:
按照预设标定条件,将所有相机分为多个标定组,并确定每个标定组的原点相机。
其中,预设标定条件为:将所有相机分为5个标定组,每个标定组8台相机,具体分组示意图如图4所示。
对每个标定组中的每对相邻相机分别进行双目外参标定,得到每台相机相对于对应标定组的原点相机的原始相机外参,并采用LM算法分别对每台相机的原始相机外参进行最小化重投影误差优化,得到每台相机的第一优化相机外参。
具体地,在每个标定组中分别对每对相邻相机进行双目外参标定,并递推得到标定组中的每台相机相对于组内的原点相机的原始相机外参。其中,双目外参标定的流程为:匹配两台相机帧编号相同的角点对、使用试位法计算去畸变后的角点坐标、使用Ransanc算法求解本质矩阵E,分解E矩阵得到初始外参、使用LM算法最小化重投影误差,优化原始相机外参,得到每台相机的第一优化相机外参。
采用局部集束调整分别对每个标定组的每台相机的第一优化相机外参进行迭代优化,得到每台相机相对于对应标定组的组内优化相机外参。
其中,局部集束调整的过程为:采用代价函数的最小二乘优化累计误差,以对每个标定组内的第一优化相机外参进行迭代优化。
所述代价函数为:
Figure BDA0003797667930000101
h(Ti,vij)=KiTipj,vij为第i个相机像素坐标系下第j个角点的坐标,Ti为第i个相机与原点相机坐标系的变换关系,Ki为第i个相机的目标相机内参,m为对应标定组的所有相机的数量,n为对应标定组的共视角点的数量,pj为第j个角点在原点相机坐标系下的三维坐标。
需要说明的是,共视角点是指:在同一时间点,不同视点识别到的相同角点。在本实施例中,共视角点的数量为一个标定组的相机中,所有存在共视角点标定帧的共视角点综合。此外,在求解时,利用Schur消元来加速计算。迭代结束后,得到每台相机相对于对应标定组的组内优化相机外参。
将每个标定组中的所有相机的相机坐标转换为相对于对应标定组的原点相机的坐标,并确定第一标定组的原点相机为全局原点相机。
其中,第一标定组的原点相机为第一相机。
基于第一预设公式,将每台相机的组内优化相机外参转换为相对于所述全局原点相机的目标相机外参。其中,第一预设公式为:
Figure BDA0003797667930000111
为第1个标定组的第1个相机,
Figure BDA0003797667930000112
为第5个标定组的第1个相机,
Figure BDA0003797667930000113
为第k个标定组的第1个相机,
Figure BDA0003797667930000114
为第k个标定组的第i个相机;T(C1,C2)表示相机C2相对于相机C1坐标系的刚体变换关系。
较优地,所述原始三维人体姿态数据包括:多个关节点三维坐标和多个关节点可见度信息。
所述根据每台相机柱上的所有相机的目标相机内参、目标相机外参和二维人体姿态数据,得到所述待测人体分别在每台相机柱视点下的原始三维人体姿态数据,包括:
根据任一相机柱上的所有相机的目标相机内参、目标相机外参和二维人体姿态数据,控制所述任一相机柱的所有相机进行三角测量,得到所述待测人体分别在所述任一相机柱视点下的多个关节点三维坐标和多个关节点可见度信息,直至得到所述待测人体分别在每台相机柱视点下的多个关节点三维坐标和多个关节点可见度信息。
其中,检测到的人体关节点的关节点可见度信息为1,未检测到的人体关节点的关节点可见度信息为0。
较优地,所述对所有的目标三维人体姿态数据进行三维人体姿态融合,得到所述待测人体的三维人体姿态估计结果,包括:
根据融合骨架计算公式、每台相机对应的目标相机外参和所有的目标三维人体姿态数据,得到所述待测人体的每个关节点的融合骨架数据;其中,所述融合骨架计算公式为:
Figure BDA0003797667930000121
为第s个关节点的融合骨架数据,
Figure BDA0003797667930000122
为第i个视点对应的三维骨架的第s个关节坐标,
Figure BDA0003797667930000123
Figure BDA0003797667930000124
对应的权重,
Figure BDA0003797667930000125
,θi∈(0,90),
Figure BDA0003797667930000126
为关节点可见度信息,zi为深度值,θi为关节角。
需要说明的是,深度值为该关节点到相机的距离,关节角为关节面与视点主光轴之间的夹角。其中,Ti为第i个相机与原点相机坐标系的变换关系;
Figure BDA0003797667930000127
i∈[1,16]。由于训练的模型包含25个人体关节点,因此s∈[1,25]。
根据所述待测人体的所有关节点的融合骨架数据和参数化人体模型,得到所述待测人体的三维人体姿态估计结果;其中,所述参数化人体模型为:Efused(θ,β)=ωproEproshapeEshapegeoEgeo,Epro表示将每个视图上的二维投影对准到三维关节,Eshape表示对人体形态进行预处理,Egeo表示多视几何一致性对关节点进行约束,ωpro为Epro对应的第一平衡权重,ωshape为Eshape对应的第二平衡权重,ωgeo为Egeo对应的第三平衡权重,θ为控制骨骼长度,β为控制每个关节的姿态。
本实施例的技术方案解决了多相机低延迟同步、多相机的自动化准确标定、准确人体姿态三维重建等问题,能够实现对三维人体姿态进行精准估计。
如图2所示,本发明实施例的一种三维人体姿态估计系统200,包括:处理模块210、生成模块220和估计模块230;
所述处理模块210用于:控制每台相机柱上放置的每台相机同步采集待测人体的原始图像数据,并利用训练后的二维姿态估计模型,得到每个原始图像数据对应的二维人体姿态数据;其中,所有的相机柱呈环形布置;
所述生成模块220用于:根据每台相机柱上的所有相机的目标相机内参、目标相机外参和二维人体姿态数据,得到所述待测人体分别在每台相机柱视点下的原始三维人体姿态数据;
所述估计模块230用于:对每个原始三维人体姿态数据进行三维骨架关节长度校验,得到多个目标三维人体姿态数据,并对所有的目标三维人体姿态数据进行三维人体姿态融合,得到所述待测人体的三维人体姿态估计结果。
较优地,获取每台相机的目标相机内参的过程为:
控制每台相机分别对设置在目标区域的中心的标定板进行多次同步采集,得到每台相机所采集的多个原始相机标定数据;其中,所述目标区域通过所有的相机柱环形布置所构成;
利用棋盘格角点检测算法,对所有的原始相机标定数据进行检测,将每个符合预设条件的原始相机标定数据确定为目标相机标定数据,并得到每个目标相机标定数据所对应的角点位置信息;
根据任一相机对应的所有的角点位置信息,对所述任一相机进行单目相机内参标定,得到所述任一相机的目标相机内参,直至得到每台相机的目标相机内参。
本实施例的技术方案解决了多相机低延迟同步、多相机的自动化准确标定、准确人体姿态三维重建等问题,能够实现对三维人体姿态进行精准估计。
上述关于本实施例的一种三维人体姿态估计系统200中的各参数和各个模块实现相应功能的步骤,可参考上文中关于一种三维人体姿态估计方法的实施例中的各参数和步骤,在此不做赘述。
本发明实施例提供的一种存储介质,包括:存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行如一种三维人体姿态估计方法的步骤,具体可参考上文中一种三维人体姿态估计方法的实施例中的各参数和步骤,在此不做赘述。
计算机存储介质例如:优盘、移动硬盘等。
本发明实施例提供的一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,使所述计算机执行如一种三维人体姿态估计方法的步骤,具体可参考上文中一种三维人体姿态估计方法的实施例中的各参数和步骤,在此不做赘述。
所属技术领域的技术人员知道,本发明可以实现为方法、系统、存储介质和电子设备。
因此,本发明可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM),只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种三维人体姿态估计方法,其特征在于,包括:
控制每台相机柱上放置的每台相机同步采集待测人体的原始图像数据,并利用训练后的二维姿态估计模型,得到每个原始图像数据对应的二维人体姿态数据;其中,所有的相机柱呈环形布置;
根据每台相机柱上的所有相机的目标相机内参、目标相机外参和二维人体姿态数据,得到所述待测人体分别在每台相机柱视点下的原始三维人体姿态数据;
对每个原始三维人体姿态数据进行三维骨架关节长度校验,得到多个目标三维人体姿态数据,并对所有的目标三维人体姿态数据进行三维人体姿态融合,得到所述待测人体的三维人体姿态估计结果。
2.根据权利要求1所述的一种三维人体姿态估计方法,其特征在于,获取每台相机的目标相机内参的过程为:
控制每台相机分别对设置在目标区域的中心的标定板进行多次同步采集,得到每台相机所采集的多个原始相机标定数据;其中,所述目标区域通过所有的相机柱环形布置所构成;
利用棋盘格角点检测算法,对所有的原始相机标定数据进行检测,将每个符合预设条件的原始相机标定数据确定为目标相机标定数据,并得到每个目标相机标定数据所对应的角点位置信息;
根据任一相机对应的所有的角点位置信息,对所述任一相机进行单目相机内参标定,得到所述任一相机的目标相机内参,直至得到每台相机的目标相机内参。
3.根据权利要求2所述的一种三维人体姿态估计方法,其特征在于,获取每台相机的目标相机外参的过程为:
按照预设标定条件,将所有相机分为多个标定组,并确定每个标定组的原点相机;
对每个标定组中的每对相邻相机分别进行双目外参标定,得到每台相机相对于对应标定组的原点相机的原始相机外参,并采用LM算法分别对每台相机的原始相机外参进行最小化重投影误差优化,得到每台相机的第一优化相机外参;
采用局部集束调整分别对每个标定组的每台相机的第一优化相机外参进行迭代优化,得到每台相机相对于对应标定组的组内优化相机外参;
其中,局部集束调整的过程为:采用代价函数的最小二乘优化累计误差,以对每个标定组内的第一优化相机外参进行迭代优化;
所述代价函数为:
Figure FDA0003797667920000021
h(Ti,vij)=KiTipj,vij为第i个相机像素坐标系下第j个角点的坐标,Ti为第i个相机与原点相机坐标系的变换关系,Ki为第i个相机的目标相机内参,m为对应标定组的所有相机的数量,n为对应标定组的共视角点的数量,pj为第j个角点在原点相机坐标系下的三维坐标;
将每个标定组中的所有相机的相机坐标转换为相对于对应标定组的原点相机的坐标,并确定第一标定组的原点相机为全局原点相机;
基于第一预设公式,将每台相机的组内优化相机外参转换为相对于所述全局原点相机的目标相机外参;其中,第一预设公式为:
Figure FDA0003797667920000022
Figure FDA0003797667920000023
为第1个标定组的第1个相机,
Figure FDA0003797667920000024
为第5个标定组的第1个相机,
Figure FDA0003797667920000025
为第k个标定组的第1个相机,
Figure FDA0003797667920000026
为第k个标定组的第i个相机;T(C1,C2)表示相机C2相对于相机C1坐标系的刚体变换关系。
4.根据权利要求3所述的一种三维人体姿态估计方法,其特征在于,所述根据任一相机对应的所有的角点位置信息,对所述任一相机进行单目相机内参标定,得到所述任一相机的目标相机内参,包括:
根据张正友平面标定法和所述任一相机对应的所有的角点位置信息,对所述任一相机进行单目相机内参标定,得到所述任一相机的原始相机内参;
基于PnP算法,计算所述任一相机对应的每个目标相机标定数据中的棋盘格与相机坐标系的第一转换关系,并根据所述第一转换关系和所述任一相机的原始相机内参,得到所述任一相机的转换相机内参;
采用LM算法对所述任一相机的转换相机内参进行最小化重投影误差优化,得到所述任一相机的目标相机内参。
5.根据权利要求1-4任一项所述的一种三维人体姿态估计方法,其特征在于,所述原始三维人体姿态数据包括:多个关节点三维坐标和多个关节点可见度信息;
所述根据每台相机柱上的所有相机的目标相机内参、目标相机外参和二维人体姿态数据,得到所述待测人体分别在每台相机柱视点下的原始三维人体姿态数据,包括:
根据任一相机柱上的所有相机的目标相机内参、目标相机外参和二维人体姿态数据,控制所述任一相机柱的所有相机进行三角测量,得到所述待测人体分别在所述任一相机柱视点下的多个关节点三维坐标和多个关节点可见度信息,直至得到所述待测人体分别在每台相机柱视点下的多个关节点三维坐标和多个关节点可见度信息。
6.根据权利要求1所述的一种三维人体姿态估计方法,其特征在于,所述对所有的目标三维人体姿态数据进行三维人体姿态融合,得到所述待测人体的三维人体姿态估计结果,包括:
根据融合骨架计算公式、每台相机对应的目标相机外参和所有的目标三维人体姿态数据,得到所述待测人体的每个关节点的融合骨架数据;其中,所述融合骨架计算公式为:
Figure FDA0003797667920000031
Figure FDA0003797667920000032
为第s个关节点的融合骨架数据,
Figure FDA0003797667920000041
为第i个视点对应的三维骨架的第s个关节坐标,
Figure FDA0003797667920000042
Figure FDA0003797667920000043
对应的权重,
Figure FDA0003797667920000044
Figure FDA0003797667920000045
为关节点可见度信息,zi为深度值,θi为关节角;
根据所述待测人体的所有关节点的融合骨架数据和参数化人体模型,得到所述待测人体的三维人体姿态估计结果;其中,所述参数化人体模型为:Efused(θ,β)=ωproEproshapeEshapegeoEgeo,Epro表示将每个视图上的二维投影对准到三维关节,Eshape表示对人体形态进行预处理,Egeo表示多视几何一致性对关节点进行约束,ωpro为Epro对应的第一平衡权重,ωshape为Eshape对应的第二平衡权重,ωgeo为Egeo对应的第三平衡权重,θ为控制骨骼长度,β为控制每个关节的姿态。
7.一种三维人体姿态估计系统,其特征在于,包括:处理模块、生成模块和估计模块;
所述处理模块用于:控制每台相机柱上放置的每台相机同步采集待测人体的原始图像数据,并利用训练后的二维姿态估计模型,得到每个原始图像数据对应的二维人体姿态数据;其中,所有的相机柱呈环形布置;
所述生成模块用于:根据每台相机柱上的所有相机的目标相机内参、目标相机外参和二维人体姿态数据,得到所述待测人体分别在每台相机柱视点下的原始三维人体姿态数据;
所述估计模块用于:对每个原始三维人体姿态数据进行三维骨架关节长度校验,得到多个目标三维人体姿态数据,并对所有的目标三维人体姿态数据进行三维人体姿态融合,得到所述待测人体的三维人体姿态估计结果。
8.根据权利要求7所述的一种三维人体姿态估计系统,其特征在于,获取每台相机的目标相机内参的过程为:
控制每台相机分别对设置在目标区域的中心的标定板进行多次同步采集,得到每台相机所采集的多个原始相机标定数据;其中,所述目标区域通过所有的相机柱环形布置所构成;
利用棋盘格角点检测算法,对所有的原始相机标定数据进行检测,将每个符合预设条件的原始相机标定数据确定为目标相机标定数据,并得到每个目标相机标定数据所对应的角点位置信息;
根据任一相机对应的所有的角点位置信息,对所述任一相机进行单目相机内参标定,得到所述任一相机的目标相机内参,直至得到每台相机的目标相机内参。
9.一种存储介质,其特征在于,所述存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行如权利要求1至6中任一项所述的一种三维人体姿态估计方法。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,使所述计算机执行如权利要求1至6中任一项所述的一种三维人体姿态估计方法。
CN202210974354.0A 2022-08-15 2022-08-15 一种三维人体姿态估计方法、系统、存储介质和电子设备 Pending CN115457594A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210974354.0A CN115457594A (zh) 2022-08-15 2022-08-15 一种三维人体姿态估计方法、系统、存储介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210974354.0A CN115457594A (zh) 2022-08-15 2022-08-15 一种三维人体姿态估计方法、系统、存储介质和电子设备

Publications (1)

Publication Number Publication Date
CN115457594A true CN115457594A (zh) 2022-12-09

Family

ID=84299126

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210974354.0A Pending CN115457594A (zh) 2022-08-15 2022-08-15 一种三维人体姿态估计方法、系统、存储介质和电子设备

Country Status (1)

Country Link
CN (1) CN115457594A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115984972A (zh) * 2023-03-20 2023-04-18 乐歌人体工学科技股份有限公司 基于运动视频驱动的人体姿态识别方法
CN116721412A (zh) * 2023-04-17 2023-09-08 之江实验室 一种自下而上的基于结构性先验的豆荚关键点检测方法和系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115984972A (zh) * 2023-03-20 2023-04-18 乐歌人体工学科技股份有限公司 基于运动视频驱动的人体姿态识别方法
CN115984972B (zh) * 2023-03-20 2023-08-11 乐歌人体工学科技股份有限公司 基于运动视频驱动的人体姿态识别方法
CN116721412A (zh) * 2023-04-17 2023-09-08 之江实验室 一种自下而上的基于结构性先验的豆荚关键点检测方法和系统
CN116721412B (zh) * 2023-04-17 2024-05-03 之江实验室 一种自下而上的基于结构性先验的豆荚关键点检测方法和系统

Similar Documents

Publication Publication Date Title
CN111354042B (zh) 机器人视觉图像的特征提取方法、装置、机器人及介质
CN110296691B (zh) 融合imu标定的双目立体视觉测量方法与系统
CN110427917B (zh) 用于检测关键点的方法和装置
CN115457594A (zh) 一种三维人体姿态估计方法、系统、存储介质和电子设备
Singh et al. Bigbird: A large-scale 3d database of object instances
US11455746B2 (en) System and methods for extrinsic calibration of cameras and diffractive optical elements
CN104537707B (zh) 像方型立体视觉在线移动实时测量系统
CN116385505A (zh) 数据处理方法、装置、系统和存储介质
CN106485207B (zh) 一种基于双目视觉图像的指尖检测方法及系统
JP2019194616A (ja) 画像に基づく位置検出方法、装置、機器及び記憶媒体
CN111429523B (zh) 一种在3d建模中远距离标定方法
JPH10124658A (ja) 神経回路網を利用したカメラの映像歪補正方法
US10186051B2 (en) Method and system for calibrating a velocimetry system
KR20140135116A (ko) Tiled Display에서 3D 영상을 보정하는 방법 및 장치
CN111445529B (zh) 一种基于多激光测距的标定设备及方法
CN111127540B (zh) 一种三维虚拟空间自动测距方法及系统
WO2020221443A1 (en) Scale-aware monocular localization and mapping
CN111768486A (zh) 基于旋转折射片的单目摄像机三维重建方法、系统
CN116958419A (zh) 一种基于波前编码的双目立体视觉三维重建系统和方法
CN114882106A (zh) 位姿确定方法和装置、设备、介质
McIlroy et al. Kinectrack: 3d pose estimation using a projected dense dot pattern
CN112258647A (zh) 地图重建方法及装置、计算机可读介质和电子设备
CN115620264B (zh) 车辆定位方法、装置、电子设备和计算机可读介质
CN109859313B (zh) 3d点云数据获取方法、装置、3d数据生成方法及系统
CN113205591B (zh) 一种三维重建训练数据的获取方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination