CN114066986B - 三维坐标的确定方法、装置、电子设备及存储介质 - Google Patents

三维坐标的确定方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114066986B
CN114066986B CN202210026388.7A CN202210026388A CN114066986B CN 114066986 B CN114066986 B CN 114066986B CN 202210026388 A CN202210026388 A CN 202210026388A CN 114066986 B CN114066986 B CN 114066986B
Authority
CN
China
Prior art keywords
joint
predicted
scale factor
dimensional coordinates
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210026388.7A
Other languages
English (en)
Other versions
CN114066986A (zh
Inventor
曾良军
陈小波
寸毛毛
孙其民
郭振民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanchang Virtual Reality Institute Co Ltd
Original Assignee
Nanchang Virtual Reality Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanchang Virtual Reality Institute Co Ltd filed Critical Nanchang Virtual Reality Institute Co Ltd
Priority to CN202210026388.7A priority Critical patent/CN114066986B/zh
Publication of CN114066986A publication Critical patent/CN114066986A/zh
Application granted granted Critical
Publication of CN114066986B publication Critical patent/CN114066986B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/75Determining position or orientation of objects or cameras using feature-based methods involving models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/80Analysis of captured images to determine intrinsic or extrinsic camera parameters, i.e. camera calibration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30244Camera pose

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本申请提供了一种三维坐标的确定方法、装置、电子设备及存储介质,包括:获取关节的关节图像;确定第一输入信息;计算关节关键点的中间三维坐标;由第一神经网络模型根据第一输入信息预测得到预测比例因子;计算关节关键点的预测三维坐标;计算关节的第一预测关节长度;计算第一预测关节长度损失;确定第二输入信息;由第二神经网络模型根据第二输入信息预测得到预测比例因子变化量;确定总计比例因子;根据总计比例因子计算得到第二预测关节长度损失判断是否达到迭代结束条件;若达到,则根据总计比例因子和关节关键点的中间三维坐标,计算关节关键点的三维坐标。本申请可实现基于关节图像及关节长度来确定关节关键点的三维坐标。

Description

三维坐标的确定方法、装置、电子设备及存储介质
技术领域
本申请涉及人工智能技术领域,更具体地,涉及一种三维坐标的确定方法、装置、电子设备及存储介质。
背景技术
随着计算机视觉技术的快速发展,深度学习技术在图像处理领域中的应用越来越广泛。在相关技术中,虽然可以通过相机等来采集到关节的关节图像,但是根据关节图像并不能确定关节在三维空间中的坐标。因此,如何通过关节的关节图像来逆向确定关节中的关节关键点在三维空间中的坐标是相关技术中亟待解决的技术问题。
发明内容
鉴于上述问题,本申请实施例提出了一种三维坐标的确定方法、装置、电子设备及存储介质,以改善上述问题。
根据本申请实施例的一个方面,提供了一种三维坐标的确定方法,包括:获取关节的关节图像;根据关节关键点在所述关节图像中的二维坐标、所述关节的实际关节长度和所述关节关键点在所述关节图像中的相对深度,确定第一输入信息;所述第一输入信息包括所述关节关键点的中间三维坐标;由所述第一神经网络模型根据所述第一输入信息进行比例因子预测,得到预测比例因子;根据所述预测比例因子和所述关节关键点的中间三维坐标,计算得到所述关节关键点的预测三维坐标;根据所述关节关键点的预测三维坐标,计算所述关节的第一预测关节长度;根据所述关节的第一预测关节长度和所述关节的实际关节长度,计算得到第一预测关节长度损失;根据所述第一预测关节长度损失和所述第一输入信息,确定第二输入信息;由第二神经网络模型根据所述第二输入信息进行比例因子变化量预测,得到预测比例因子变化量;将所述预测比例因子变化量和所述预测比例因子相加,得到总计比例因子;根据所述总计比例因子计算得到所述关节的第二预测关节长度损失;根据所述关节的第二预测关节长度损失判断是否达到迭代结束条件;若确定达到迭代结束条件,则根据所述总计比例因子和所述关节关键点的中间三维坐标,计算得到所述关节关键点的三维坐标。
根据本申请实施例的一个方面,提供了一种三维坐标的确定装置,包括:获取模块,用于获取关节的关节图像。第一输入信息确定模块,用于根据关节关键点在所述关节图像中的二维坐标、所述关节的实际关节长度和所述关节关键点在所述关节图像中的相对深度,确定第一输入信息;所述第一输入信息包括所述关节关键点的中间三维坐标。第一预测模块,由所述第一神经网络模型根据所述第一输入信息进行比例因子预测,得到预测比例因子。预测三维坐标计算模块,用于根据所述预测比例因子和所述关节关键点的中间三维坐标,计算得到所述关节关键点的预测三维坐标。第一预测关节长度计算模块,用于根据所述关节关键点的预测三维坐标,计算所述关节的第一预测关节长度。第一预测关节长度损失计算模块,用于根据所述关节的第一预测关节长度和所述关节的实际关节长度,计算得到第一预测关节长度损失。第二输入信息确定模块,用于根据所述第一预测关节长度损失和所述第一输入信息,确定第二输入信息。第二预测模块,用于由第二神经网络模型根据所述第二输入信息进行比例因子变化量预测,得到预测比例因子变化量。总计比例因子计算模块,用于将所述预测比例因子和所述预测比例因子相加,得到总计比例因子。第二预测关节长度损失计算模块,用于根据所述总计比例因子计算得到所述关节的第二预测关节长度损失。判断模块,用于根据所述关节的第二预测关节长度损失判断是否达到迭代结束条件。第一处理模块,用于若确定达到迭代结束条件,则根据所述总计比例因子和所述关节关键点的中间三维坐标,计算得到所述关节关键点的三维坐标。
在一些实施例中,该三维坐标的确定装置还包括:第二处理模块,用于若确定未达到迭代结束条件,则将所述总计比例因子作为下一轮迭代过程中的预测比例因子,并返回执行所述根据所述预测比例因子和所述关节关键点的中间三维坐标,计算得到所述关节关键点的预测三维坐标的步骤。
在一些实施例中,判断模块包括:判断单元,用于判断所述关节的第二预测关节长度损失是否小于损失阈值。迭代结束条件确定单元,用于若所述关节的第二预测关节长度损失小于损失阈值,则确定达到迭代结束条件;若所述关节的第二预测关节长度损失不小于损失阈值,则确定未达到迭代结束条件。
在一些实施例中,该三维坐标的确定装置还包括:预测相对深度计算模块,用于根据所述关节关键点的预测三维坐标,计算所述关节关键点的预测相对深度。相对深度损失计算模块,用于根据所述关节关键点的预测相对深度和所述关节关键点的相对深度,计算相对深度损失。添加模块,用于将所述相对深度损失添加到所述第二输入信息。
在一些实施例中,第一输入信息确定模块包括:中间三维坐标计算单元,用于根据所述关节关键点在所述关节图像中的二维坐标和所述关节图像所来源相机的相机内参,计算得到所述关节关键点的中间三维坐标。相对深度计算单元,用于根据所述关节图像中各像素的深度信息和所述关节关键点在所述关节图像中的深度值,计算所述关节关键点在所述关节图像中的相对深度。第一输入信息确定单元,用于将所述关节关键点的中间三维坐标、所述关节的实际关节长度和所述关节关键点在所述关节图像中的相对深度进行组合,得到所述第一输入信息。
在一些实施例中,第二输入信息确定模块包括:第二输入信息确定单元,用于将所述第一预测关节长度损失和所述第一输入信息进行组合,得到所述第二输入信息。
在一些实施例中,第二输入信息确定模块还包括:预处理单元,用于由第三神经网络对所述第一预测关节长度损失进行预处理,得到预处理后的第一预测关节长度损失。数据组合单元,用于将所述预处理后的第一预测关节长度损失与所述第一输入信息进行组合,得到所述第二输入信息。
在一些实施例中,所述关节的关节关键点包括指示所述关节的一个端部的第一关节关键点和所述关节的另一个端部的第二关节关键点。第一预测关节长度计算模块包括:欧式距离计算单元,用于根据所述第一关节关键点的预测三维坐标和所述第二关节关键点的预测三维坐标,计算所述第一关节关键点与所述第二关节关键点之间的欧式距离。第一预测关节长度确定单元,用于将所计算得到的欧式距离,作为所述关节的第一预测关节长度。
在一些实施例中,预测三维坐标计算模块包括:预测三维坐标计算单元,用于将所述预测比例因子和所述关节关键点的中间三维坐标相乘,得到所述关节关键点的预测三维坐标。
根据本申请实施例的一个方面,提供了一种电子设备,包括:处理器;存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如上所述三维坐标的确定方法。
根据本申请实施例的一个方面,提供了一种计算机可读存储介质,其上存储有计算机可读指令,当所述计算机可读指令被处理器执行时,实现如上所述三维坐标的确定方法。
根据本申请实施例的一个方面,提供了一种计算机程序产品,包括计算机指令,所述计算机指令被处理器执行时实现如上所述三维坐标的确定方法。
在本申请方案中,分两个阶段来确定比例因子,即在根据关节关键点在关节图像中的二维坐标确定第一输入信息后,先由第一神经网络来根据第一输入信息来进行比例因子预测,得到预测比例因子,然后由第二神经网络根据第二输入信息来进行比例因子变化量的迭代预测,得到预测比例因子变化量,然后,基于预测比例因子和预测比例因子变化量相加,得到总计比例因子,并基于总计比例因子来确定关节关键点的三维坐标,实现了利用关节图像及关节长度来分阶段来确定关节关键点的三维坐标。
而且,在本申请的方案中,第二输入信息包括第一预测关节长度损失,第一预测关节长度损失是基于关节的实际长度和基于预测比例因子所计算得到的第一预测关节长度来计算得到的,从而,利用关节的关节长度不变这一特点,将关节长度作为确定比例因子变化量的监督信息,从而,可以保证所确定的预测比例因子变化量的准确性,进而保证后续所确定关节关键点的三维坐标的准确性。
应当理解的是,以上的一般描述和后文细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请一实施例示出的三维坐标的确定方法的流程图。
图2是根据本申请一实施例示出的步骤102的具体步骤流程图。
图3是根据本申请一实施例示出的步骤111的具体步骤流程图。
图4是根据本申请一实施例示出的三维坐标的确定过程的示意图。
图5是根据本申请一实施例示出的三维坐标的确定装置的框图。
图6示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
图1是根据本申请一实施例示出的三维坐标的确定方法的流程图,本申请的方法可以由具备处理能力的电子设备执行,该电子设备例如服务器、云服务器等,在此不进行具体限定。如图1所示,该方法包括:
步骤101,获取关节的关节图像。
在本实施例中,该关节图像可以为灰度图像(灰阶图像),在灰度图像中,图像中每个像素可以由0(黑)到255(白)的亮度值(Intensity)表示。0-255之间表示不同的灰度级。在其他实施例中,该关节图像还可以是为RGB图像。
步骤102,根据关节关键点在关节图像中的二维坐标、关节的实际关节长度和关节关键点在关节图像中的相对深度,确定第一输入信息;第一输入信息包括关节关键点的中间三维坐标。
关节关键点是指关节上具有关节标识作用的点,其可以是关节点、骨骼点等,当然,还可以是其他由用户自定义的点。可以理解的是,对于同一关节,其上可以包括多个关节关键点,在本申请的方案中,由于涉及计算关节的关节长度,因此,本申请中的关节关键点至少包括位于关节一个端部的第一关节关键点和该关节的另一个端部的第二关节关键点,当然,在具体实施例中,还可以包括除第一关节关键点和第二关节关键点外的其他关节关键点。
例如,关节关键点可以是:手指的尖端位置的点、手指的远节指骨关节的指骨底的点、手指的指骨关节端部的点、手指与手掌的附着点的手掌指关节的点或手掌与人体前臂的附着点的腕部位置的点等。具体关节关键点数量以及位置可以根据实际需要设置,在此不进行具体限定。
在一些实施例中,可以预先针对关节设定关节关键点集合,从而,在步骤102中,在关节图像中定位该关节所对应的关节关键点集合中的关节关键点。可以理解的是,针对不同的关节,所设定的关节关键点集合中所包括的关节关键点是存在差异的。
关节关键点在关节图像中的二维坐标是指关节关键点在关节图像所在图像坐标系下的坐标。因此,在关节图像中定位到关节关键点所在的像素后,即可对应获得该关节关键点在该关节图像的二维坐标。
由于实际中,可能存在因图像不清晰等原因造成关节关键点定位错误的问题,为了保证后续确定的关节关键点的三维坐标的准确性,可以先进行异常像素点过滤,具体的,可以采用孤立森林算法(Isolation Forest)或者Local Outlier Factor(局部异常因子,LOF)算法来排除异常像素点。
关节关键点在关节图像中的相对深度是指以关节图像中一个或者多个像素点作为参考像素点,该关节关键点所在的像素相对于该参考像素点的深度值。
在一些实施例中,如图2所示,步骤102包括:
步骤210,根据关节关键点在关节图像中的二维坐标和关节图像所来源相机的相机内参,计算得到关节关键点的中间三维坐标。
相机内参包括相机的焦距和相机的光心的坐标,相机内参矩阵是根据相机的焦距和相机的光心的坐标构建的矩阵,该矩阵被称为相机内参矩阵,记为K,K为:
Figure 92282DEST_PATH_IMAGE001
其中
Figure 212684DEST_PATH_IMAGE002
是相机的焦距,
Figure 726842DEST_PATH_IMAGE003
是相机的光心的坐标。
对于世界坐标系中的一个点P,假设其在世界坐标系下的坐标为(X,Y,C),在相机的相机坐标系下,该点P的坐标为(XC,YC,ZC),基于相机,将该点进行透视投影到图像坐标系下该点P的坐标为(u,v),具体的坐标变换过程可以按如下公式描述:
Figure 122051DEST_PATH_IMAGE004
(公式1)
由上可以得到:
Figure 388954DEST_PATH_IMAGE005
(公式2)
进一步变换,得到:
Figure 680258DEST_PATH_IMAGE006
(公式3)
若点P为本申请中的关节关键点,则上述的坐标
Figure 947291DEST_PATH_IMAGE007
视为该关节关键点的中间三维坐标,
Figure 615033DEST_PATH_IMAGE008
可视为本申请中的比例因子。
具体的,为了计算关节关键点的中间三维坐标,先对关节关键点的二维坐标补一维,得到
Figure 752753DEST_PATH_IMAGE009
,然后左乘相机内参矩阵的逆矩阵,得到中间三维坐标,记为
Figure 729805DEST_PATH_IMAGE010
Figure 484134DEST_PATH_IMAGE011
(公式4)
其中
Figure 424409DEST_PATH_IMAGE012
代表相机的相机内参矩阵的逆矩阵。
步骤220,根据关节图像中各像素的深度信息和关节关键点在关节图像中的深度值,计算关节关键点在关节图像中的相对深度。
关节图像中各像素的深度信息用于指示所对应像素在关节图像中的深度值。
在一些实施例中,在面向关节进行图像采集的过程中,同时采集该关节的关节图像,和采集该关节的深度图像,该深度图像中各像素点的值即为所对应像素点的深度值。同理,为了确定关节关键点对应的深度值,在深度图像中进行关节关键点定位,从而对应获取到该关节关键点的深度值。
在此基础上,获得各像素的深度值后,选取其中的一个像素点作为参考像素点,对应计算各关节关键点在关节图像中的相对深度。其中,参考像素点可以是关节图像中深度值最小的像素点,还可以是关节图像中中位深度值的像素点,当然还可以是其他的像素点,具体可根据实际需要进行设定。
当选取关节图像中深度值最小的像素点作为参考像素点,关节关键点的相对深度可按照如下公式(5)计算得到:
Figure 416635DEST_PATH_IMAGE013
(公式5)
在一些实施例中,为了进行量纲统一,避免因关节图像中各像素点的深度值差异较大,导致所确定的相对深度值的范围较大,还可以将按照公式(5)所计算得到的相对深度除与关节图像中最大深度值与最小深度值之差相除,将相除所得到的商作为关节关键点最终的相对深度,即,按照如下公式(6)计算得到各关节关键点的相对深度:
Figure 846480DEST_PATH_IMAGE014
(公式6)
其中,在上述公式(5)和(6)中,
Figure 822526DEST_PATH_IMAGE015
为关节关键点在该关节图像中的相对深度;
Figure 97650DEST_PATH_IMAGE016
为关节关键点的深度值;
Figure 193650DEST_PATH_IMAGE017
为关节图像中的最小深度值;
Figure 997658DEST_PATH_IMAGE018
关节图像中的最大深度值。
步骤230,将关节关键点的中间三维坐标、关节的实际关节长度和关节关键点在关节图像中的相对深度进行组合,得到第一输入信息。
在一些实施例中,将关节关键点的中间三维坐标、关节的实际关节长度和关节关键点在关节图像中的相对深度进行拼接,得到第一输入信息。
请继续参阅图1,步骤103,由第一神经网络模型根据第一输入信息进行比例因子预测,得到预测比例因子。
在本申请中,将由第一神经网络针对关节关键点所预测到的比例因子称为预测比例因子。
在一些实施例中,第一神经网络模型可以由全连接网络构建,其可以包括多层全连接网络层,例如,若第一输入信息为一维的数组,可以通过全连接网络构建的第一神经网络模型来进行比例因子预测,在具体实施例中,第一神经网络模型可以是四层全连接网络层。
在另一些实施例中,第一神经网络模型还可以由卷积神经网络构建,若第一输入信息是二维的数组或更多维的数组,可以通过卷积神经网络构建的第一神经网络模型来进行比例因子预测。
在其他实施例中,可将第一神经网络模型设置为多网络结构的神经网络模型,不同的网络结构之间的参数不同,可通过对第一神经网络模型的网络结构的改变来提升第一神经网络对预测比例因子进行预测的多样性。
当然,在其他实施例中,第一神经网络模型还可以通过其他的神经网络来构建,在此不进行具体限定。
如上所描述,对于世界坐标系中的关节关键点,可以经过相机的透视变换,确定该关节关键点的中间三维坐标,进而确定该关节关键点在图像中坐标,反之,也可以根据关节关键点在图像中的坐标以及比例因子来逆向计算关节关键点的中间三维坐标,具体该过程可以描述为:
Figure 726580DEST_PATH_IMAGE019
(公式7)
其中,
Figure 274236DEST_PATH_IMAGE020
为比例因子,
Figure 241055DEST_PATH_IMAGE021
表示根据比例因子和关节关键点的二维坐标
Figure 12702DEST_PATH_IMAGE022
计算中间三维坐标的函数,
Figure 947029DEST_PATH_IMAGE023
表示根据关节关键点的三维坐标
Figure 298376DEST_PATH_IMAGE024
和相机的相机内参矩阵
Figure 854122DEST_PATH_IMAGE025
计算关节关键点的中间三维坐标的函数。
步骤104,根据预测比例因子和关节关键点的中间三维坐标,计算得到关节关键点的预测三维坐标。
关节关键点的预测三维坐标是指根据预测比例因子和关节关键点的中间三维坐标所计算得到的三维坐标。
在本实施例中,计算关节关键点的预测三维坐标具体方法为:将预测比例因子和关节关键点的中间三维坐标相乘,得到关节关键点的预测三维坐标。
具体的,按照如下公式计算得到关节关键点的预测三维坐标:
Figure 796670DEST_PATH_IMAGE026
(公式8)
其中,
Figure 969025DEST_PATH_IMAGE027
为关节关键点的预测三维坐标;
Figure 842172DEST_PATH_IMAGE028
为预测比例因子;
Figure 783584DEST_PATH_IMAGE029
为中间三维坐标。
步骤105,根据关节关键点的预测三维坐标,计算关节的第一预测关节长度。
如上所描述,关节的关节关键点包括指示关节的一个端部的第一关节关键点和关节的另一个端部的第二关节关键点;按照上述过程,对应可以确定第一关节关键点的预测三维坐标和第二关节关键点的预测三维坐标。在此基础上,可以按照如下的过程计算得到关节长度:根据第一关节关键点的预测三维坐标和第二关节关键点的预测三维坐标,计算第一关节关键点与第二关节关键点之间的欧式距离;将所计算得到的欧式距离,作为关节的第一预测关节长度。
欧式距离的计算公式如下:
Figure 897033DEST_PATH_IMAGE030
(公式9)
其中,第一关节关键点的预测三维坐标为
Figure 556685DEST_PATH_IMAGE031
;第二关节关键点的预测三维坐标为
Figure 249834DEST_PATH_IMAGE032
Figure 311331DEST_PATH_IMAGE033
为第一关节关键点与第二关节关键点之间的欧式距离。
步骤106,根据关节的第一预测关节长度和关节的实际关节长度,计算得到第一预测关节长度损失。
在一些实施例中,将关节的实际关节长度和第一预测关节长度相减得到关节长度的损失。
步骤107,根据第一预测关节长度损失和第一输入信息,确定第二输入信息。
在一些实施例中,可以将第一预测关节长度损失和第一输入信息进行组合,得到第二输入信息。
步骤108,由第二神经网络模型根据第二输入信息进行比例因子变化量预测,得到预测比例因子变化量。
在一些实施例中,第二神经网络模型可由全连接网络构建,其可以包括多层全连接网络层,在具体实施例中,第二神经网络模型可以是四层全连接网络层。
在另一些实施例中,第二神经网络模型还可以由卷积神经网络构建。当然,在其他实施例中,第二神经网络模型还可以通过其他的神经网络来构建,在此不进行具体限定。
在一些实施例中,可将第二神经网络模型设置为多网络结构的神经网络模型,不同的网络结构之间的参数不同,可通过对第二神经网络模型的网络结构的设置来丰富预测比例因子变化量的值。
步骤109,将预测比例因子变化量和预测比例因子相加,得到总计比例因子。
步骤110,根据总计比例因子计算得到关节的第二预测关节长度损失。
在一些实施例中,步骤110包括:根据总计比例因子计算关节关键点的目标三维坐标;根据目标三维坐标计算关节的第二预测关节长度;将关节的第二预测关节长度与关节的实际关节长度相减,得到关节的第二预测关节长度损失。
在一具体实施例中,根据公式(7)可由总计比例因子与关节关键点的二维坐标计算出关节关键点的目标三维坐标,在本申请中,将由总计比例因子和关节关键点的二维坐标计算得到的三维坐标称为关节关键点的目标三维坐标。
在计算得到关节关键点的目标三维坐标后,如上所描述,关节的关节关键点包括指示关节的一个端部的第一关节关键点和关节的另一个端部的第二关节关键点;按照上述过程,对应可以确定第一关节关键点的目标三维坐标和第二关节关键点的目标三维坐标。在此基础上,可以按照公式(9)计算该关节的第二预测关节长度。
将该关节的第二预测关节长度与该关节的实际关节长度相减,得到该关节的第二预测关节长度损失。
步骤111,根据关节的第二预测关节长度损失判断是否达到迭代结束条件。
在一些实施例中,如图3所示,步骤111包括:
步骤310,判断关节的第二预测关节长度是否小于损失阈值。
在步骤111中,可以按照图3所示的过程来判断是否达到迭代结束条件。
损失阈值可根据实际需要设定,在此不进行具体限定。
步骤320,若关节的第二预测关节长度小于损失阈值,则确定达到迭代结束条件。
步骤330,若关节的第二预测关节长度不小于损失阈值,则确定未达到迭代结束条件。
请继续参阅图1,步骤112,若确定达到迭代结束条件,则根据总计比例因子和关节关键点的中间三维坐标,计算得到关节关键点的三维坐标。
关节关键点的三维坐标是指关节关键点在世界坐标系下的坐标。当确定达到迭代结束条件时,可根据第二神经网络模型预测的总计比例因子和关节关键点的中间三维坐标来计算所需的关节关键点的三维坐标。
计算关节关键点的三维坐标所利用的公式具体为:
Figure 325510DEST_PATH_IMAGE034
(公式10)
其中,
Figure 941299DEST_PATH_IMAGE035
为总计比例因子。
在一些实施例中,步骤111之后,该方法还包括:若确定未达到迭代结束条件,则将总计比例因子作为下一轮迭代过程中的预测比例因子,并返回执行步骤104。
当确定未达到迭代结束条件时,需要继续利用第一神经网络模型和第二神经网络模型进行预测。在进行下一次迭代时,将上一次迭代中的总计比例因子作为步骤104中预测比例因子,并且根据替换后的预测比例因子重新执行步骤104以及后续的步骤,直至根据所重新得到的第二预测从关节长度损失确定达到迭代结束条件。上一轮预测比例因子是指相对于当前迭代轮次的上一轮迭代过程所得到的总计比例因子。
在本申请方案中,分两个阶段来确定比例因子,即在根据关节关键点在关节图像中的二维坐标确定第一输入信息后,先由第一神经网络来根据第一输入信息来进行比例因子预测,得到预测比例因子,然后由第二神经网络根据第二输入信息来进行比例因子变化量的迭代预测,得到预测比例因子变化量,然后,基于预测比例因子和预测比例因子变化量相加,得到总计比例因子,并基于总计比例因子来确定关节关键点的三维坐标,实现了利用关节图像及关节长度来分阶段来确定关节关键点的三维坐标。
而且,在本申请的方案中,第二输入信息包括第一预测关节长度损失,第一预测关节长度损失是基于关节的实际长度和基于预测比例因子所计算得到的第一预测关节长度来计算得到的,从而,利用关节的关节长度不变这一特点,将关节长度作为确定比例因子变化量的监督信息,从而,可以保证所确定预测比例因子变化量的准确性,进而保证后续所确定关节关键点的三维坐标的准确性。
进一步的,在本申请的方案中,在基于总计比例因子判断未达到迭代结束条件的情况下,重新返回执行步骤104,以重新预测比例因子变化量,而不需要重复进行比例因子的预测,相较于比例因子的预测过程,比例因子变化量的预测过程中的计算量更小,而且,迭代速率更快,因此,本方案可以提升确定关节关键点的三维坐标的速度。在实际中,对本申请的方案进行了试验,一般情况下,重复迭代三次即可达到迭代结束条件。
进一步的,本申请的方案可以应用于线上应用阶段,也可以应用于第二神经网络的训练阶段,可以理解的是,在训练阶段,若判断未达到迭代结束条件,还需要调整第二神经网络模型的参数,以通过调整参数后的第二神经网络来重新根据新的第二输入信息来进行比例因子变化量的预测,因此,本申请的方案应用范围广。
在一些实施例中,步骤104之后,该方法还包括:根据关节关键点的预测三维坐标,计算关节关键点的预测相对深度;根据关节关键点的预测相对深度和关节关键点的相对深度,计算相对深度损失;将相对深度损失添加到第二输入信息。
关节关键点的预测相对深度是指根据关节关键的预测三维坐标来计算得到的关节关键点的相对深度。关节关键点的预测相对深度可根据公式(5)或公式(6)计算得来,在计算过程中,将关节关键点的三维坐标对应的深度值替换为关节关键点的预测三维坐标对应的深度值,关节关键点的预测三维坐标中的Z轴坐标值即为对应的深度值。
将关节关键点的预测相对深度与步骤220计算出的关节关键点的相对深度相减,得到关节关键点的相对深度损失。
在本实施例中,将相对深度损失也作为第二神经网络进行比例因子变化量预测的数据基础,从而,提供了更多的数据进行比例因子变化量预测,可以提升所预测到预测比例因子变化量的准确度。
在一些实施例中,步骤107,包括:由第三神经网络对第一预测关节长度损失进行预处理,得到预处理后的第一预测关节长度损失。将预处理后的第一预测关节长度损失与第一输入信息进行组合,得到第二输入信息。
在一些实施例中,第三神经网络可以是由全连接网络构建,其可以包括多层全连接网络层。当然,在其他实施例中,第三神经网络还可以是其他神经网络,在此不进行具体限定。
图4是根据本申请一实施例示出的三维坐标的确定过程的示意图,如图4所示,关节关键点的三维坐标确认过程分为第一阶段和第二阶段两个阶段。在第一阶段,利用第一神经网络模型进行比例因子进行预测。在第二阶段,利用第二神经网络模型进行比例因子变化量预测。
第一阶段的具体过程为:获取关节图像中关节关键点的二维坐标
Figure 438139DEST_PATH_IMAGE036
,然后根据关节图像中关节关键点的二维坐标
Figure 619722DEST_PATH_IMAGE036
和关节图像所来源相机的相机内参矩阵的逆矩阵
Figure 278236DEST_PATH_IMAGE037
计算关节关键点的中间三维坐标
Figure 178059DEST_PATH_IMAGE038
;再根据各像素点在该关节图像中的深度信息和关节关键点在该关节图像中的深度值计算得到该关节关键点的相对深度值
Figure 462279DEST_PATH_IMAGE039
,将关节关键点对应关节的实际关节长度
Figure 232789DEST_PATH_IMAGE040
、该关节关键点的中间三维坐标
Figure 593363DEST_PATH_IMAGE041
以及该关节关键点的相对深度值
Figure 449323DEST_PATH_IMAGE042
拼接组合成第一输入信息
Figure 287966DEST_PATH_IMAGE043
,第一神经网络模型net1根据第一输入信息
Figure 178562DEST_PATH_IMAGE043
进行比例因子预测,预测比例因子
Figure 959305DEST_PATH_IMAGE044
第二阶段的过程具体为:根据预测比例因子
Figure 771403DEST_PATH_IMAGE044
和关节关键点的中间三维坐标
Figure 944896DEST_PATH_IMAGE045
计算关节关键点的预测三维坐标
Figure 424419DEST_PATH_IMAGE046
,然后根据关节关键点的预测三维坐标
Figure 861216DEST_PATH_IMAGE046
计算关节的第一预测关节长度
Figure 957348DEST_PATH_IMAGE047
;将该关节的实际长度
Figure 387061DEST_PATH_IMAGE048
与第一预测关节长度
Figure 721091DEST_PATH_IMAGE049
相减,得到该关节的第一预测关节长度损失
Figure 859948DEST_PATH_IMAGE050
。然后基于第一预测关节长度损失
Figure 912218DEST_PATH_IMAGE050
和第一输入信息
Figure 161933DEST_PATH_IMAGE051
确定第二输入信息
Figure 616049DEST_PATH_IMAGE052
,由第二神经网络模型net2根据第二输入信息
Figure 909495DEST_PATH_IMAGE052
进行比例因子变化量,得到预测比例因子变化量。
在一些实施例中,可以将第一预测关节长度损失
Figure 183482DEST_PATH_IMAGE053
与第一输入信息
Figure 705730DEST_PATH_IMAGE054
进行组合得到第二输入信息。
在一些实施例中,还可以进一步根据该关节关键点的预测三维坐标和各像素在该关节图像中的深度信息计算该关节关键点的预测相对深度损失
Figure 545510DEST_PATH_IMAGE055
,将第一输入信息
Figure 495012DEST_PATH_IMAGE056
、第一预测关节长度损失
Figure 505562DEST_PATH_IMAGE057
和该关节关键点的预测相对深度损失
Figure 362659DEST_PATH_IMAGE058
拼接组合成第二输入信息
Figure 525788DEST_PATH_IMAGE059
之后,将第一阶段的预测比例因子与第二阶段的预测比例因子变化量相加得到总计比例因子。然后根据总计比例因子计算该关节的第二预测关节长度损失,当该关节的第二预测关节长度损失小于损失阈值时,则结束迭代,输出最后一次迭代的总计比例因子,并将总计比例因子与该关节关键点的中间三维坐标相乘,计算出该关节关键点的三维坐标。
以下介绍本申请的装置实施例,可以用于执行本申请上述实施例中的方法。对于本申请装置实施例中未披露的细节,请参照本申请上述方法实施例。
图5是根据本申请一实施例示出的三维坐标的确定装置的框图,如图5所示,该三维坐标的确定装置500包括:第一获取模块501,用于获取关节的关节图像。第一输入信息确定模块502,用于根据关节关键点在关节图像中的二维坐标、关节的实际关节长度和关节关键点在关节图像中的相对深度,确定第一输入信息;第一输入信息包括关节关键点的中间三维坐标。第一预测模块503,由第一神经网络模型根据第一输入信息进行比例因子预测,得到预测比例因子。预测三维坐标计算模块504,用于根据预测比例因子和关节关键点的中间三维坐标,计算得到关节关键点的预测三维坐标。第一预测关节长度计算模块505,用于根据关节关键点的预测三维坐标,计算关节的第一预测关节长度。第一预测关节长度损失计算模块506,用于根据关节的第一预测关节长度和关节的实际关节长度,计算得到第一预测关节长度损失。第二输入信息确定模块507,用于根据第一预测关节长度损失和第一输入信息,确定第二输入信息。第二预测模块508,用于由第二神经网络模型根据第二输入信息进行比例因子变化量预测,得到预测比例因子变化量。总计比例因子计算模块509,用于将预测比例因子和预测比例因子相加,得到总计比例因子。第二预测关节长度损失计算模块510,用于根据总计比例因子计算得到关节的第二预测关节长度损失。判断模块511,用于根据关节的第二预测关节长度损失判断是否达到迭代结束条件。第一处理模块512,用于若确定达到迭代结束条件,则根据总计比例因子和关节关键点的中间三维坐标,计算得到关节关键点的三维坐标。
在一些实施例中,该三维坐标的确定装置500还包括:第二处理模块,用于若确定未达到迭代结束条件,则将总计比例因子作为下一轮迭代过程中的预测比例因子,并返回执行根据预测比例因子和关节关键点的中间三维坐标,计算得到关节关键点的预测三维坐标的步骤。
在一些实施例中,判断模块511包括:判断单元,用于判断关节的第二预测关节长度损失是否小于损失阈值。迭代结束条件确定单元,用于若关节的第二预测关节长度损失小于损失阈值,则确定达到迭代结束条件;若关节的第二预测关节长度损失不小于损失阈值,则确定未达到迭代结束条件。
在一些实施例中,该三维坐标的确定装置500还包括:预测相对深度计算模块,用于根据关节关键点的预测三维坐标,计算关节关键点的预测相对深度。相对深度损失计算模块,用于根据关节关键点的预测相对深度和关节关键点的相对深度,计算相对深度损失。添加模块,用于将相对深度损失添加到第二输入信息。
在一些实施例中,第一输入信息确定模块502包括:中间三维坐标计算单元,用于根据关节关键点在关节图像中的二维坐标和关节图像所来源相机的相机内参,计算得到关节关键点的中间三维坐标。相对深度计算单元,用于根据关节图像中各像素的深度信息和关节关键点在关节图像中的深度值,计算关节关键点在关节图像中的相对深度。第一输入信息确定单元,用于将关节关键点的中间三维坐标、关节的实际关节长度和关节关键点在关节图像中的相对深度进行组合,得到第一输入信息。
在一些实施例中,第二输入信息确定模块507包括:第二输入信息确定单元,用于将第一预测关节长度损失和第一输入信息进行组合,得到第二输入信息。
在一些实施例中,第二输入信息确定模块507还包括:预处理单元,用于由第三神经网络对第一预测关节长度损失进行预处理,得到预处理后的第一预测关节长度损失。数据组合单元,用于将预处理后的第一预测关节长度损失与第一输入信息进行组合,得到第二输入信息。
在一些实施例中,关节的关节关键点包括指示关节的一个端部的第一关节关键点和关节的另一个端部的第二关节关键点。第一预测关节长度计算模块505包括:欧式距离计算单元,用于根据第一关节关键点的预测三维坐标和第二关节关键点的预测三维坐标,计算第一关节关键点与第二关节关键点之间的欧式距离。第一预测关节长度确定单元,用于将所计算得到的欧式距离,作为关节的第一预测关节长度。
在一些实施例中,预测三维坐标计算模块504包括:预测三维坐标计算单元,用于将预测比例因子和关节关键点的中间三维坐标相乘,得到关节关键点的预测三维坐标。
图6示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。需要说明的是,图6示出的电子设备的计算机系统600仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括CPU601,其可以根据存储在ROM602中的程序或者从存储部分608加载到RAM603中的程序而执行各种适当的动作和处理,例如执行上述实施例中的方法。在RAM 603中,还存储有系统操作所需的各种程序和数据。CPU601、ROM602以及RAM 603通过总线604彼此相连。I/O接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN(Local Area Network,局域网)卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被CPU601执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读存储介质承载计算机可读指令,当该计算机可读存储指令被处理器执行时,实现上述任一实施例中的方法。
根据本申请的一个方面,还提供了一种电子设备,其包括:处理器;存储器,存储器上存储有计算机可读指令,计算机可读指令被处理器执行时,实现上述任一实施例中的方法。
根据本申请实施例的一个方面,提供了计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一实施例中的方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (9)

1.一种三维坐标的确定方法,其特征在于,所述方法包括:
获取关节的关节图像;
根据关节关键点在所述关节图像中的二维坐标和所述关节图像所来源相机的相机内参,计算得到所述关节关键点的中间三维坐标;
根据所述关节图像中各像素的深度信息和所述关节关键点在所述关节图像中的深度值,计算所述关节关键点在所述关节图像中的相对深度;
将所述关节关键点的中间三维坐标、所述关节的实际关节长度和所述关节关键点在所述关节图像中的相对深度进行组合,得到第一输入信息;
由第一神经网络模型根据所述第一输入信息进行比例因子预测,得到预测比例因子,所述比例因子是指所述关节关键点在所述关节图像所来源相机的相机坐标系Z轴上的坐标值;
根据所述预测比例因子和所述关节关键点的中间三维坐标,计算得到所述关节关键点的预测三维坐标;
根据所述关节关键点的预测三维坐标,计算所述关节的第一预测关节长度;
根据所述关节的第一预测关节长度和所述关节的实际关节长度,计算得到第一预测关节长度损失;
根据所述第一预测关节长度损失和所述第一输入信息,确定第二输入信息;
由第二神经网络模型根据所述第二输入信息进行比例因子变化量预测,得到预测比例因子变化量;
将所述预测比例因子变化量和所述预测比例因子相加,得到总计比例因子;
根据所述总计比例因子计算得到所述关节的第二预测关节长度损失;
根据所述关节的第二预测关节长度损失判断是否达到迭代结束条件;
若确定达到迭代结束条件,则根据所述总计比例因子和所述关节关键点的中间三维坐标,计算得到所述关节关键点的三维坐标。
2.根据权利要求1所述的方法,其特征在于,所述根据所述关节的第二预测长度损失判断是否达到迭代结束条件之后,所述方法还包括:
若确定未达到迭代结束条件,则将所述总计比例因子作为下一轮迭代过程中的预测比例因子,并返回执行所述根据所述预测比例因子和所述关节关键点的中间三维坐标,计算得到所述关节关键点的预测三维坐标的步骤。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述关节的第二预测关节长度损失判断是否达到迭代结束条件,包括:
判断所述关节的第二预测关节长度损失是否小于损失阈值;
若所述关节的第二预测关节长度损失小于损失阈值,则确定达到迭代结束条件;
若所述关节的第二预测关节长度损失不小于损失阈值,则确定未达到迭代结束条件。
4.根据权利要求1所述的方法,其特征在于,所述根据所述预测比例因子和所述关节关键点的中间三维坐标,计算得到所述关节关键点的预测三维坐标之后,所述方法还包括:
根据所述关节关键点的预测三维坐标,计算所述关节关键点的预测相对深度;
根据所述关节关键点的预测相对深度和所述关节关键点的相对深度,计算相对深度损失;
将所述相对深度损失添加到所述第二输入信息。
5.根据权利要求1所述的方法,其特征在于,所述根据所述第一预测关节长度损失和所述第一输入信息,确定第二输入信息,包括:
由第三神经网络对所述第一预测关节长度损失进行预处理,得到预处理后的第一预测关节长度损失;
将所述预处理后的第一预测关节长度损失与所述第一输入信息进行组合,得到所述第二输入信息。
6.根据权利要求1所述的方法,其特征在于,所述关节的关节关键点包括指示所述关节的一个端部的第一关节关键点和所述关节的另一个端部的第二关节关键点;
所述根据所述关节关键点的预测三维坐标,计算所述关节的第一预测关节长度,包括:
根据所述第一关节关键点的预测三维坐标和所述第二关节关键点的预测三维坐标,计算所述第一关节关键点与所述第二关节关键点之间的欧式距离;
将所计算得到的欧式距离,作为所述关节的第一预测关节长度。
7.一种三维坐标的确定装置,其特征在于,所述装置包括:
获取模块,用于获取关节的关节图像;
中间三维坐标计算单元,用于根据关节关键点在所述关节图像中的二维坐标和所述关节图像所来源相机的相机内参,计算得到所述关节关键点的中间三维坐标;
相对深度计算单元,用于根据所述关节图像中各像素的深度信息和所述关节关键点在所述关节图像中的深度值,计算所述关节关键点在所述关节图像中的相对深度;
第一输入信息确定单元,用于将所述关节关键点的中间三维坐标、所述关节的实际关节长度和所述关节关键点在所述关节图像中的相对深度进行组合,得到所述第一输入信息;
第一预测模块,由第一神经网络模型根据所述第一输入信息进行比例因子预测,得到预测比例因子,所述比例因子是指所述关节关键点在所述关节图像所来源相机的相机坐标系Z轴上的坐标值;
预测三维坐标计算模块,用于根据所述预测比例因子和所述关节关键点的中间三维坐标,计算得到所述关节关键点的预测三维坐标;
第一预测关节长度计算模块,用于根据所述关节关键点的预测三维坐标,计算所述关节的第一预测关节长度;
第一预测关节长度损失计算模块,用于根据所述关节的第一预测关节长度和所述关节的实际关节长度,计算得到第一预测关节长度损失;
第二输入信息确定模块,用于根据所述第一预测关节长度损失和所述第一输入信息,确定第二输入信息;
第二预测模块,用于由第二神经网络模型根据所述第二输入信息进行比例因子变化量预测,得到预测比例因子变化量;
总计比例因子计算模块,用于将所述预测比例因子和所述预测比例因子相加,得到总计比例因子;
第二预测关节长度损失计算模块,用于根据所述总计比例因子计算得到所述关节的第二预测关节长度损失;
判断模块,用于根据所述关节的第二预测关节长度损失判断是否达到迭代结束条件;
第一处理模块,用于若确定达到迭代结束条件,则根据所述总计比例因子和所述关节关键点的中间三维坐标,计算得到所述关节关键点的三维坐标。
8.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储器,与所述一个或多个处理器电连接;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于执行如权利要求1-6任一项所述的方法。
9.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行如权利要求1-6任一项所述的方法。
CN202210026388.7A 2022-01-11 2022-01-11 三维坐标的确定方法、装置、电子设备及存储介质 Active CN114066986B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210026388.7A CN114066986B (zh) 2022-01-11 2022-01-11 三维坐标的确定方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210026388.7A CN114066986B (zh) 2022-01-11 2022-01-11 三维坐标的确定方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN114066986A CN114066986A (zh) 2022-02-18
CN114066986B true CN114066986B (zh) 2022-04-19

Family

ID=80230973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210026388.7A Active CN114066986B (zh) 2022-01-11 2022-01-11 三维坐标的确定方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114066986B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115018918B (zh) * 2022-08-04 2022-11-04 南昌虚拟现实研究院股份有限公司 三维坐标的确定方法、装置、电子设备及存储介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111815754B (zh) * 2019-04-12 2023-05-30 Oppo广东移动通信有限公司 一种三维信息确定方法、三维信息确定装置及终端设备
WO2021002025A1 (ja) * 2019-07-04 2021-01-07 富士通株式会社 骨格認識方法、骨格認識プログラム、骨格認識システム、学習方法、学習プログラムおよび学習装置
CN111079570B (zh) * 2019-11-29 2024-01-26 北京奇艺世纪科技有限公司 一种人体关键点识别方法、装置及电子设备
CN110991319B (zh) * 2019-11-29 2021-10-19 广州市百果园信息技术有限公司 手部关键点检测方法、手势识别方法及相关装置
CN111160375B (zh) * 2019-12-31 2024-01-23 北京奇艺世纪科技有限公司 三维关键点预测及深度学习模型训练方法、装置及设备
CN111401151B (zh) * 2020-02-28 2022-09-06 中国科学技术大学 一种精确的三维手部姿态估计方法
GB202009515D0 (en) * 2020-06-22 2020-08-05 Ariel Ai Ltd 3D object model reconstruction from 2D images
CN112233222A (zh) * 2020-09-29 2021-01-15 深圳市易尚展示股份有限公司 基于神经网络关节点估计的人体参数化三维模型变形方法
CN112489102A (zh) * 2020-11-30 2021-03-12 北京百度网讯科技有限公司 三维重建方法、装置、设备以及存储介质
CN112837362A (zh) * 2021-01-28 2021-05-25 清华大学深圳国际研究生院 获取空间定位的三维人体姿态估计方法及计算机可读存储介质
CN112836618B (zh) * 2021-01-28 2023-10-20 清华大学深圳国际研究生院 一种三维人体姿态估计方法及计算机可读存储介质
CN112767489B (zh) * 2021-01-29 2024-05-14 北京达佳互联信息技术有限公司 一种三维位姿确定方法、装置、电子设备及存储介质
CN112989947B (zh) * 2021-02-08 2024-05-31 上海依图网络科技有限公司 一种人体关键点的三维坐标的估计方法及装置

Also Published As

Publication number Publication date
CN114066986A (zh) 2022-02-18

Similar Documents

Publication Publication Date Title
US20210248355A1 (en) Face key point detection method and apparatus, storage medium, and electronic device
CN109508681A (zh) 生成人体关键点检测模型的方法和装置
CN113159143B (zh) 基于跳跃连接卷积层的红外与可见光图像融合方法和装置
WO2019227716A1 (zh) 流感预测模型的生成方法、装置及计算机可读存储介质
CN111695596A (zh) 一种用于图像处理的神经网络以及相关设备
CN113065997B (zh) 一种图像处理方法、神经网络的训练方法以及相关设备
EP4318313A1 (en) Data processing method, training method for neural network model, and apparatus
CN116309983B (zh) 虚拟人物模型的训练方法、生成方法、装置和电子设备
CN110956131A (zh) 单目标追踪方法、装置及系统
CN114066986B (zh) 三维坐标的确定方法、装置、电子设备及存储介质
CN112529149A (zh) 一种数据处理方法及相关装置
JP2019175321A (ja) 画像評価装置、画像評価方法及びコンピュータプログラム
CN111539349A (zh) 姿态识别模型的训练方法及装置、姿态识别方法及其装置
CN111368668A (zh) 三维手部识别方法、装置、电子设备及存储介质
CN114550203A (zh) 关节关键点的三维坐标的确定方法及其相关设备
CN117894038A (zh) 一种图像中对象姿态生成方法和装置
CN109615620A (zh) 图像压缩度识别方法、装置、设备及计算机可读存储介质
CN113627421A (zh) 一种图像处理方法、模型的训练方法以及相关设备
CN116894911A (zh) 三维重建方法、装置、电子设备及可读存储介质
CN113610856B (zh) 训练图像分割模型和图像分割的方法和装置
CN115311430A (zh) 人体重建模型的训练方法、系统及计算机设备
CN111539420B (zh) 基于注意力感知特征的全景图像显著性预测方法及系统
CN114238106A (zh) 测试时间预测方法及装置、电子设备、存储介质
CN114254724A (zh) 一种数据处理方法、神经网络的训练方法以及相关设备
CN115018918B (zh) 三维坐标的确定方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant