CN116129465A - 一种基于概率扩散模型的渐进式头部姿态估计方法 - Google Patents
一种基于概率扩散模型的渐进式头部姿态估计方法 Download PDFInfo
- Publication number
- CN116129465A CN116129465A CN202211564642.5A CN202211564642A CN116129465A CN 116129465 A CN116129465 A CN 116129465A CN 202211564642 A CN202211564642 A CN 202211564642A CN 116129465 A CN116129465 A CN 116129465A
- Authority
- CN
- China
- Prior art keywords
- head
- diffusion model
- detection result
- probability
- probability diffusion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/165—Detection; Localisation; Normalisation using facial parts and geometric relationships
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Geometry (AREA)
- General Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于概率扩散模型的渐进式头部姿态估计方法,包括:建立头部姿态估计循环,循环包括以下步骤:根据第一概率扩散模型、第二彩色图像对人体的头部姿态进行检测,得到人体头部姿态检测结果,并作为第二头部姿态检测结果;根据第二彩色图像和第二头部姿态检测结果对第一概率扩散模型进行优化,得到第二概率扩散模型;当前循环完成,将该循环下的第二概率扩散模型作为下一循环的第一概率扩散模型输入到下一循环中。本发明解决的问题是无法获取用户完整的头部三维数据导致头部姿态估计结果准确性低的技术问题,通过提出一种渐进式头部姿态估计方法能够不断完善头部三维数据,以达到提高头部姿态估计结果准确性的技术效果。
Description
技术领域
本发明涉及数据识别技术领域,具体而言,涉及一种基于概率扩散模型的渐进式头部姿态估计方法。
背景技术
随着人们的健康意识逐渐提高,对办公桌的要求也越来越高。当下用户在使用办工桌办公时,由于坐姿不正确往往会造成颈椎病等疾病。因此,根据上述原因,逐渐发展出一类瑜伽桌,用于对用户的使用姿态进行检测、识别和记录。用户能够根据检测得到的姿态信息进行坐姿上的调整。在对人体姿态估计的数据识别和处理领域中,完整的头部三维数据对极端角度的头部姿态估计准确性有决定性的影响。
但是,现有的瑜伽桌在实际的数据处理过程中,用户头部三维数据很难预先完整获取,导致没有足够的头部三维数据用于姿态估计,最终导致对人体姿态的估算结果不准确。
发明内容
本发明解决的问题是无法获取用户完整的头部三维数据导致头部姿态估计结果准确性低的技术问题,通过提出一种基于概率扩散模型的渐进式头部姿态估计方法能够不断完善头部三维数据,以达到提高头部姿态估计结果准确性的技术效果。
为解决上述问题,本发明提供一种基于概率扩散模型的渐进式头部姿态估计方法,该方法利用概率扩散模型对人体的头部姿态进行估计,方法包括:建立头部姿态估计循环,循环包括以下步骤:步骤S100:获取第一时刻的概率扩散模型,作为第一概率扩散模型;步骤S200:获取第二时刻的人体头部的彩色图像,并作为第二彩色图像;步骤S300:根据第一概率扩散模型、第二彩色图像对人体的头部姿态进行检测,得到第二时刻下的人体头部姿态检测结果,并作为第二头部姿态检测结果;步骤S400:将第二头部姿态检测结果输入头部姿态估计算法中,得到第二时刻下的人体头部姿态估计结果,并输出;步骤S500:根据第二彩色图像和第二头部姿态检测结果对第一概率扩散模型进行优化,得到第二时刻下的概率扩散模型,作为第二概率扩散模型;当前循环完成后,将该循环下的第二概率扩散模型作为下一循环的第一概率扩散模型输入到下一循环中;第一时刻经过目标时间段得到第二时刻。
与现有技术相比,采用该技术方案所达到的技术效果:人体是不断运动的,几乎每一秒的状态都与上一秒的状态不同,因此将目标时间段优选为1s,并且在进行姿态检测重新构建头部三维数据的时候结合上一秒的概率扩散模型和当前时间获取的图像来重新构建,这样随着时间的发展,头部的三维数据会不断的完善,放入头部姿态估计算法后得到的人体的头部姿态估计结果也更加准确。整个姿态估算方法中,每个时刻不断利用上个时刻下的概率扩散模型进行检测和估算,并不断更新上个时刻得到的概率扩散模型,以利用到下个时刻中去,这样实现概率扩散模型的不断学习和完善,也使整个估算方法随着时间的递增不断学习和优化,使估算结果越来越准确。
在本发明的一个实例中,若头部姿态估计循环为初始状态,则步骤为:步骤S110:获取第一时刻下的人体头部的彩色图像,并作为第一彩色图像;步骤S120:根据原始概率扩散模型、第一彩色图像对人体的头部姿态进行检测,得到第一时刻下的人体头部姿态检测结果,并作为第一头部姿态检测结果;步骤S130:将第一头部姿态检测结果输入头部姿态估计算法中,得到第一时刻下的人体头部姿态估计结果,并输出;将原始概率扩散模型作为第一概率扩散模型,并用于第二时刻中,原始概率扩散模型为方法开始时设定的概率扩散模型;若头部姿态估计循环为非初始状态,则步骤S120为:根据第一彩色图像、上一循环得到的第二概率扩散模型对人体的头部姿态进行检测,得到第一时刻下的人体头部姿态检测结果,并作为第一头部姿态检测结果。
与现有技术相比,采用该技术方案所达到的技术效果:概率扩散模型本身具有能够从噪点中构建所需数据的作用,能够使用概率扩散模型来对头部三维数据进行完善和构建。为了时刻更新优化概率扩散模型,本方案利用当前时刻的数据去优化生成上一时刻的概率扩散模型,优化完后得到当前时刻的概率扩散模型,并继续利用当前时刻的概率扩散模型去得到未来时刻的检测结果,这样最终实现对数据渐进式的完善和更迭。在得到第二时刻下人体头部姿态检测结果后,根据结果继续优化概率扩散模型,对概率扩散模型的数据信息进行更新优化,使其得到下一个时刻下更加准确和完善的头部检测结果。
在本发明的一个实例中,方法还包括:基于概率扩散模型的渐进式头部姿态估计方法响应于停止指令后停止执行;基于概率扩散模型的渐进式头部姿态估计方法停止执行后,存储最新输出的人体姿态头部检测结果和概率扩散模型,作为存储数据。
与现有技术相比,采用该技术方案所达到的技术效果:本方案是根据时间的发展,进行渐进式学习的估算方法。当在某一时刻对方法输入停止的指令时,需要控制其对最新输出的估算结果和概率扩散模型进行存储,得到的存储数据用于下一次渐进式头部姿态估计方法的执行。
在本发明的一个实例中,步骤S500:根据第二彩色图像和第二头部姿态检测结果对第一概率扩散模型进行优化,得到第二时刻下的概率扩散模型,作为第二概率扩散模型,包括:根据第一概率扩散模型得到逆向的马尔科夫链;通过最大化似然函数与最小化KL散度构建逆向的马尔科夫链中每个环节的损失函数;提取第二彩色图像和第二头部姿态检测结果中的参数,作为优化参数;将优化参数与随机噪声输入至第一概率扩散模型中,并由梯度下降算法根据损失函数对第一概率扩散模型进行训练,得到第二概率扩散模型。
与现有技术相比,采用该技术方案所达到的技术效果:利用第二时刻下的优化参数和损失函数对第一概率扩散模型进行优化,能够更新第二时刻下的优化参数数据,使结果更加准确。
在本发明的一个实例中,根据第一概率扩散模型得到逆向的马尔科夫链,包括:将第一概率扩散模型中隐藏空间随机向量转化为模型空间关键点的过程作为第一过程;对第一过程进行建模,得到逆向的马尔科夫随机过程,并形成逆向的马尔科夫链;其中,逆向的马尔科夫链中每个环节的条件概率与转移函数根据第一概率扩散模型中的参数确定。
与现有技术相比,采用该技术方案所达到的技术效果:在根据第一概率扩散模型得到逆向的马尔科夫链的过程,具体将隐藏空间随机向量转化为模型空间关键点的过程进行建模得到逆向的马尔科夫链,在得到逆向的马尔科夫链的过程中,每个环节的条件概率与转移函数根据第一概率扩散模型中的参数确定,此时的逆向过程是在第一概率扩散模型的基础上得到的,因此有第一概率扩散模型作为优化基础,使原本被优化的模型不再使用落后的参数和数据。
在本发明的一个实例中,根据第一概率扩散模型、第二彩色图像对人体的头部姿态进行检测,得到第二时刻下的人体头部姿态检测结果,并作为第二头部姿态检测结果,包括:判断第二彩色图像是否包括人体脸部信息;若包括人体脸部信息,则对人体脸部的姿态进行检测,得到第一检测结果,并将第一检测结果作为第二头部姿态检测结果;若不包括人体脸部信息,则对人体头部的姿态进行检测,得到第二检测结果,并将第二检测结果作为第二头部姿态检测结果。
与现有技术相比,采用该技术方案所达到的技术效果:先判断是否包含有人脸信息,再进行检测,能够节省检测步骤,避免获取不必要的数据,提升检测速度和效率。
在本发明的一个实例中,若包括人体脸部信息,则对人体脸部的姿态进行检测,得到第一检测结果,并将第一检测结果作为第二头部姿态检测结果,包括:使用hopenet对人体脸部进行关键点检测,得到脸部关键点信息;根据脸部关键点信息得到第一检测结果;将第一检测结果作为第二头部姿态检测结果进行输出。
与现有技术相比,采用该技术方案所达到的技术效果:在人体头部姿态的检测中,脸部姿态的检测尤为重要。本方案中,利用hopenet,通过人脸上关键点求解二维到三维对应的问题,这种方法的准确性较高,相比较传统检测方法更加准确。
在本发明的一个实例中,若不包括人体脸部信息,则对人体头部的姿态进行检测,得到第二检测结果,并将第二检测结果作为第二头部姿态检测结果,包括:根据第二彩色图像得到人体头部的头顶法向量、人体头部的三维点数据,并将头顶法向量作为初步姿态信息;根据第一概率扩散模型对人体的头部姿态进行检测,得到人体头部的点云体素数据;根据初步姿态信息,对点云体素数据与三维点数据中的投影误差进行最小化处理,得到第二检测结果;将第二检测结果作为第二头部姿态检测结果进行输出。
与现有技术相比,采用该技术方案所达到的技术效果:当识别不到人脸时,只能对人体头部进行识别检测。检测头部姿态时,人体头部的头顶法向量是较为容易取得的信息,可以暂且将其作为初步姿态信息。得到初步姿态信息后,为了能够得到更加精细化的头部姿态信息,需要利用第一概率扩散模型对其进行不断精细化处理,得到更加准确的姿态检测结果。具体的精细化处理方法为,对点云体素数据与三维点数据中的投影误差进行最小化处理。最小化处理能够提高数据的精度,得到更加精细化的检测结果。
在本发明的一个实例中,根据第一概率扩散模型对人体的头部姿态进行检测,得到人体头部的点云体素数据,包括:结合去噪扩散模型,对点云体素数据去除高斯噪声;和/或根据基于二范数的条件似然函数对第一概率扩散模型进行训练,得到去除噪声后的点云体素数据。
与现有技术相比,采用该技术方案所达到的技术效果:在概率扩散模型对人体的头部姿态进行数据重建的过程中,为了减少其中噪点的干扰,能够选择两种方式进行去噪。其中一种利用去噪扩散模型进行去噪,另一种方式利用基于二范数的条件似然函数进行去噪。针对这俩种方式,最终能够得到一个较为精细化的点云体素数据信息,在这一过程中进一步提高对头部姿态估算结果的准确性。
附图说明
为了更清楚的说明本发明实施例的技术方案,下面将对实施例描述中待要使用的附图作简单介绍,显而易见的,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图;
图1为本发明提供的一种渐进式头部姿态估计方法的步骤示意图之一;
图2为本发明提供的一种渐进式头部姿态估计方法的步骤示意图之二;
图3为本发明提供的一种渐进式头部姿态估计方法的步骤示意图之三。
具体实施方式
为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
【实施例一】
在一个具体的实施例中,参见图1-2,提出一种基于概率扩散模型的渐进式头部姿态估计方法,该方法利用概率扩散模型对人体的头部姿态进行估计,方法包括:
建立头部姿态估计循环,循环包括以下步骤:
步骤S100:获取第一时刻的概率扩散模型,作为第一概率扩散模型;
步骤S200:获取第二时刻的人体头部的彩色图像,并作为第二彩色图像;
步骤S300:根据第一概率扩散模型、第二彩色图像对人体的头部姿态进行检测,得到第二时刻下的人体头部姿态检测结果,并作为第二头部姿态检测结果;
步骤S400:将第二头部姿态检测结果输入头部姿态估计算法中,得到第二时刻下的人体头部姿态估计结果,并输出;
步骤S500:根据第二彩色图像和第二头部姿态检测结果对第一概率扩散模型进行优化,得到第二时刻下的概率扩散模型,作为第二概率扩散模型;
当前循环完成后,将该循环下的第二概率扩散模型作为下一循环的第一概率扩散模型输入到下一循环中;
第一时刻经过目标时间段得到第二时刻。
在本实施例中,概率扩散模型又称为Diffusion Models,是基于假设条件,通过找到并掌握扩散过程的每一个步骤与当前的状态,从一个初始的各向同性的高斯噪声分布来一步一步逆推上一个的状态,经过不断的逆推得到了粒子原来的状态。概率扩散模型本身具有能够从噪点中构建所需数据的作用,因此能够使用概率扩散模型来对头部三维数据进行完善和构建。在步骤200中,除了获取彩色图像之外,还可以获取深度图像来进行检测和估算。彩色图像和深度图像为从RGBD相机中读入RGB图像及深度视频帧,深度图像又称为Depth Images,也被称为距离影像Range Images,是指将图像采集器采集到的场景中各点的距离值作为像素值的图像,它直接反映了景物可见表面的几何形状,使用深度图像可以很方便地解决3D目标描述中的许多问题。
进一步的,概率扩散模型、彩色图像和深度图像均能够作为重新构建头部三维数据的信息来源。但在获取时,为了使头部姿态估算的结果更加准确,本案构建头部三维数据,进行姿态检测的过程是一个渐进的过程,能够根据时间的发展结合之前得到的数据进行不断的完善,获得更加完整的姿态检测结果。
具体的,参见图1,第一时刻为T1、第二时刻为T2,选取第二时刻为当前时刻,第一时刻为第二时刻之前目标时间段的时刻。此时,选择目标时间段为1s,即第一时刻为第二时刻的上一秒。想要获取第二时刻的第二头部姿态检测结果,也就是当前时刻的头部姿态检测结果,为了使结果更加准确,我们需要利用上一秒所构建的概率扩散模型,也就是步骤S100中的第一概率扩散模型和最新的图像信息,也就是第二时刻的第二彩色图像和/或第二深度图像。
在本实施例中,人体是不断运动的,几乎每一秒的状态都与上一秒的状态不同,因此将目标时间段优选为1s,并且在进行姿态检测重新构建头部三维数据的时候结合上一秒的概率扩散模型和当前时间获取的图像来重新构建,这样随着时间的发展,头部的三维数据会不断的完善,放入头部姿态估计算法后得到的人体的头部姿态估计结果也更加准确。
在一个具体的实施例中,获取第一时刻下的概率扩散模型,并作为第一概率扩散模型,包括:
若头部姿态估计循环为初始状态,则步骤为:
步骤S110:获取第一时刻下的人体头部的彩色图像,并作为第一彩色图像;
步骤S120:根据原始概率扩散模型、第一彩色图像对人体的头部姿态进行检测,得到第一时刻下的人体头部姿态检测结果,并作为第一头部姿态检测结果;
步骤S130:将第一头部姿态检测结果输入头部姿态估计算法中,得到第一时刻下的人体头部姿态估计结果,并输出;
将原始概率扩散模型作为第一概率扩散模型,并用于第二时刻中,原始概率扩散模型为方法开始时设定的概率扩散模型;
若头部姿态估计循环为非初始状态,则步骤S120为:根据第一彩色图像、上一循环得到的第二概率扩散模型对人体的头部姿态进行检测,得到第一时刻下的人体头部姿态检测结果,并作为第一头部姿态检测结果。
在本实施例中,第一时刻下的概率扩散模型是根据第一时刻和第一时刻之前的数据得到的。得到第一时刻下的第一彩色图像和第一头部姿态检测结果,根据这些信息能够得到在第一时刻下的概率扩散模型,此时的概率扩散模型已经能够根据第一时刻下的信息进行学习和重建,形成相较于第一时刻之前最新的数据信息。
进一步的,在根据第一时刻下的第一彩色图像和第一头部姿态检测结果得到第一概率扩散模型时,是基于第一时刻之前的概率扩散模型进行优化的,也就是在第一时刻之前的上一秒相应的概率扩散模型。
当循环为初始循环时,第一概率扩散模型根据原始概率扩散模型得到。当循环为非初始循环时,第一概率扩散模型根据上一循环得到的第二概率扩散模型得到。因此,概率扩散模型也是随着时间的流逝不断进行学习和更迭的。而当首次使用概率扩散模型进行检测时,第一次使用的原始概率扩散模型是人为的在系统中加入的一个模型。
在本实施例中,概率扩散模型本身具有能够从噪点中构建所需数据的作用,能够使用概率扩散模型来对头部三维数据进行完善和构建。为了时刻更新优化概率扩散模型,本方案利用当前时刻的数据去优化生成上一时刻的概率扩散模型,优化完后得到当前时刻的概率扩散模型,并继续利用当前时刻的概率扩散模型去得到未来时刻的检测结果,这样最终实现对数据渐进式的完善和更迭。
在一个具体的实施例中,方法还包括:
基于概率扩散模型的渐进式头部姿态估计方法响应于停止指令后停止执行;
基于概率扩散模型的渐进式头部姿态估计方法停止执行后,存储最新输出的人体姿态头部检测结果和概率扩散模型,作为存储数据。
在本实施例中,本方案是根据时间的发展,进行渐进式学习的估算方法。当在某一时刻对方法输入停止的指令时,需要控制其对最新输出的估算结果和概率扩散模型进行存储,得到的存储数据用于下一次渐进式头部姿态估计方法的执行。
【实施例二】
在一个具体的实施例中,步骤S500:根据第二彩色图像和第二头部姿态检测结果对第一概率扩散模型进行优化,得到第二时刻下的概率扩散模型,作为第二概率扩散模型,包括:
根据第一概率扩散模型得到逆向的马尔科夫链;
通过最大化似然函数与最小化KL散度构建逆向的马尔科夫链中每个环节的损失函数;
提取第二彩色图像和第二头部姿态检测结果中的参数,作为优化参数;
将优化参数与随机噪声输入至第一概率扩散模型中,并由梯度下降算法根据损失函数对第一概率扩散模型进行训练,得到第二概率扩散模型。
在本实施例中,在对第一概率扩散模型进行优化的时候,概率扩散模型中包含有一个正向的马尔科夫链和一个逆向的马尔科夫链,首先通过第一概率扩散模型得到逆向的马尔科夫链;然后,根据构建逆向的马尔科夫链中每个环节的损失函数;最后,利用损失函数和优化参数对第一概率扩散模型进行优化,得到第二概率扩散模型。
在本实施例中,根据第一概率扩散模型得到逆向的马尔科夫链,包括:
将第一概率扩散模型中隐藏空间随机向量转化为模型空间关键点的过程作为第一过程;
对第一过程进行建模,得到逆向的马尔科夫随机过程,并形成逆向的马尔科夫链;
其中,逆向的马尔科夫链中每个环节的条件概率与转移函数根据第一概率扩散模型中的参数确定。
在本实施例中,在根据第一概率扩散模型得到逆向的马尔科夫链的过程,具体将隐藏空间随机向量转化为模型空间关键点的过程进行建模得到逆向的马尔科夫链,在得到逆向的马尔科夫链的过程中,每个环节的条件概率与转移函数根据第一概率扩散模型中的参数确定,此时的逆向过程是在第一概率扩散模型的基础上得到的,因此有第一概率扩散模型作为优化基础,使原本被优化的模型不再使用落后的参数和数据。
【实施例三】
在一个具体的实施例中,参见图3,根据第一概率扩散模型、第二彩色图像对人体的头部姿态进行检测,得到第二时刻下的人体头部姿态检测结果,并作为第二头部姿态检测结果,包括:
判断第二彩色图像是否包括人体脸部信息;
若包括人体脸部信息,则对人体脸部的姿态进行检测,得到第一检测结果,并将第一检测结果作为第二头部姿态检测结果;
若不包括人体脸部信息,则对人体头部的姿态进行检测,得到第二检测结果,并将第二检测结果作为第二头部姿态检测结果。
在本实施例中,在对整个头部进行姿态检测时,人脸是其中较为重要的一个检测方向。相比较检测整个头部,仅仅检测人脸能够节省检测步骤和数据处理过程,相对处理的数据较少,能够更加简洁的获取到估算结果。因此,在步骤中首先判断图像信息中是否包含人体脸部,若包含,则利用人体脸部信息进行检测,并作为第二头部姿态检测结果;若不包含,则才对头部信息进行检测,并将检测结果作为第二头部姿态检测结果。
在本实施例中,先判断是否包含有人脸信息,再进行检测,能够节省检测步骤,避免获取不必要的数据,提升检测速度和效率。
在一个具体的实施例中,若包括人体脸部信息,则对人体脸部的姿态进行检测,得到第一检测结果,并将第一检测结果作为第二头部姿态检测结果,包括:
使用hopenet对人体脸部进行关键点检测,得到脸部关键点信息;
根据脸部关键点信息得到第一检测结果;
将第一检测结果作为第二头部姿态检测结果进行输出。
在本实施例中,在人体头部姿态的检测中,脸部姿态的检测尤为重要。本方案中,利用hopenet,通过人脸上关键点求解二维到三维对应的问题,这种方法的准确性较高,相比较传统检测方法更加准确。
在一个具体的实施例中,若不包括人体脸部信息,则对人体头部的姿态进行检测,得到第二检测结果,并将第二检测结果作为第二头部姿态检测结果,包括:
根据第二彩色图像得到人体头部的头顶法向量、人体头部的三维点数据,并将头顶法向量作为初步姿态信息;
根据第一概率扩散模型对人体的头部姿态进行检测,得到人体头部的点云体素数据;
根据初步姿态信息,对点云体素数据与三维点数据中的投影误差进行最小化处理,得到第二检测结果;
将第二检测结果作为第二头部姿态检测结果进行输出。
在本实施例中,当识别不到人脸时,只能对人体头部进行识别检测。检测头部姿态时,人体头部的头顶法向量是较为容易取得的信息,可以暂且将其作为初步姿态信息。得到初步姿态信息后,为了能够得到更加精细化的头部姿态信息,需要利用第一概率扩散模型对其进行不断精细化处理,得到更加准确的姿态检测结果。具体的精细化处理方法为,对点云体素数据与三维点数据中的投影误差进行最小化处理。最小化处理能够提高数据的精度,得到更加精细化的检测结果。
在一个具体的实施例中,根据第一概率扩散模型对人体的头部姿态进行检测,得到人体头部的点云体素数据,包括:
结合去噪扩散模型,对点云体素数据去除高斯噪声;
和/或
根据基于二范数的条件似然函数对第一概率扩散模型进行训练,得到去除噪声后的点云体素数据。
在本实施例中,在概率扩散模型对人体的头部姿态进行数据重建的过程中,为了减少其中噪点的干扰,能够选择两种方式进行去噪。其中一种利用去噪扩散模型进行去噪,另一种方式利用基于二范数的条件似然函数进行去噪。针对这俩种方式,最终能够得到一个较为精细化的点云体素数据信息,在这一过程中进一步提高对头部姿态估算结果的准确性。
【实施例四】
在一个具体的实施例中,基于概率扩散模型的渐进式头部姿态估计方法利用渐进式头部姿态估计系统,系统包括:获取模块,获取模块用于获取概率扩散模型、彩色图像和深度图像;姿态检测模块,姿态检测模块用于对人体头部姿态进行检测,并得到头部姿态检测结果;头部姿态算法模块,头部姿态算法模块用于对人体头部姿态进行估算,得到人体的头部姿态估计结果。
在本实施例中,利用相应的模块完成本案中相应的方法步骤,使本案提出的渐进式头部姿态估计方法具有系统模块的支撑和利用。
在一个具体的实施例中,一种基于概率扩散模型的渐进式头部姿态估计方法还涉及到渐进式头部姿态估计装置,装置包括:处理器和存储器,存储器用于存储至少一个程序,当至少一个程序被处理器执行时,使得处理器实现如上述实施例中的渐进式头部姿态估计方法。
在一个具体的实施例中,还包括计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现如上述实施例的渐进式头部姿态估计方法。
【实施例五】
在本方案中,渐进式的头部姿态估计方法被使用在桌子上,具体被利用在瑜伽桌上。在用户使用桌子学习或者工作时,为了纠正用户使用时的姿势,需要采集并检测现在用户的使用姿态。因此,在采集并检测用户使用的姿态时,利用本案中提出的方法。进一步的,由于用户本身并非完全静止的物体,在用户发生活动的情况下进行头部姿态的检测是较为困难的,而在本方案中,通过多次采集并优化的方法,能够不断的完善和补全用户的头部体态数据,使估算结果更加准确,提高瑜伽桌对用户姿态的检测和纠正姿态的效果。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
Claims (9)
1.一种基于概率扩散模型的渐进式头部姿态估计方法,其特征在于,所述方法利用概率扩散模型对人体的头部姿态进行估计,所述方法包括:
建立头部姿态估计循环,所述循环包括以下步骤:
步骤S100:获取第一时刻的概率扩散模型,作为第一概率扩散模型;
步骤S200:获取第二时刻的人体头部的彩色图像,并作为第二彩色图像;
步骤S300:根据所述第一概率扩散模型、所述第二彩色图像对所述人体的头部姿态进行检测,得到所述第二时刻下的人体头部姿态检测结果,并作为第二头部姿态检测结果;
步骤S400:将所述第二头部姿态检测结果输入头部姿态估计算法中,得到所述第二时刻下的人体头部姿态估计结果,并输出;
步骤S500:根据所述第二彩色图像和所述第二头部姿态检测结果对所述第一概率扩散模型进行优化,得到所述第二时刻下的概率扩散模型,作为第二概率扩散模型;
当前循环完成后,将该循环下的所述第二概率扩散模型作为下一循环的所述第一概率扩散模型输入到所述下一循环中;
所述第一时刻经过目标时间段得到所述第二时刻。
2.根据权利要求1所述的基于概率扩散模型的渐进式头部姿态估计方法,其特征在于,
若所述头部姿态估计循环为初始状态,则步骤为:
步骤S110:获取所述第一时刻下的人体头部的彩色图像,并作为第一彩色图像;
步骤S120:根据原始概率扩散模型、所述第一彩色图像对所述人体的头部姿态进行检测,得到所述第一时刻下的人体头部姿态检测结果,并作为第一头部姿态检测结果;
步骤S130:将所述第一头部姿态检测结果输入所述头部姿态估计算法中,得到所述第一时刻下的人体头部姿态估计结果,并输出;
将所述原始概率扩散模型作为所述第一概率扩散模型,并用于所述第二时刻中,所述原始概率扩散模型为所述方法开始时设定的概率扩散模型;
若所述头部姿态估计循环为非初始状态,则所述步骤S120为:根据所述第一彩色图像、上一循环得到的所述第二概率扩散模型对所述人体的头部姿态进行检测,得到所述第一时刻下的人体头部姿态检测结果,并作为第一头部姿态检测结果。
3.根据权利要求2所述的基于概率扩散模型的渐进式头部姿态估计方法,其特征在于,所述方法还包括:
所述基于概率扩散模型的渐进式头部姿态估计方法响应于停止指令后停止执行;
所述基于概率扩散模型的渐进式头部姿态估计方法停止执行后,存储最新输出的人体姿态头部检测结果和概率扩散模型,作为存储数据。
4.根据权利要求3所述的基于概率扩散模型的渐进式头部姿态估计方法,其特征在于,所述步骤S500:根据所述第二彩色图像和所述第二头部姿态检测结果对所述第一概率扩散模型进行优化,得到所述第二时刻下的概率扩散模型,作为第二概率扩散模型,包括:
根据所述第一概率扩散模型得到逆向的马尔科夫链;
通过最大化似然函数与最小化KL散度构建所述逆向的马尔科夫链中每个环节的损失函数;
提取所述第二彩色图像和所述第二头部姿态检测结果中的参数,作为优化参数;
将所述优化参数与随机噪声输入至所述第一概率扩散模型中,并由梯度下降算法根据所述损失函数对所述第一概率扩散模型进行训练,得到所述第二概率扩散模型。
5.根据权利要求4所述的基于概率扩散模型的渐进式头部姿态估计方法,其特征在于,所述根据所述第一概率扩散模型得到逆向的马尔科夫链,包括:
将所述第一概率扩散模型中隐藏空间随机向量转化为模型空间关键点的过程作为第一过程;
对所述第一过程进行建模,得到逆向的马尔科夫随机过程,并形成逆向的马尔科夫链;
其中,所述逆向的马尔科夫链中每个环节的条件概率与转移函数根据所述第一概率扩散模型中的参数确定。
6.根据权利要求3所述的基于概率扩散模型的渐进式头部姿态估计方法,其特征在于,所述根据所述第一概率扩散模型、所述第二彩色图像对所述人体的头部姿态进行检测,得到所述第二时刻下的人体头部姿态检测结果,并作为第二头部姿态检测结果,包括:
判断所述第二彩色图像是否包括人体脸部信息;
若包括所述人体脸部信息,则对人体脸部的姿态进行检测,得到第一检测结果,并将所述第一检测结果作为所述第二头部姿态检测结果;
若不包括所述人体脸部信息,则对人体头部的姿态进行检测,得到第二检测结果,并将所述第二检测结果作为所述第二头部姿态检测结果。
7.根据权利要求6所述的基于概率扩散模型的渐进式头部姿态估计方法,其特征在于,所述若包括所述人体脸部信息,则对人体脸部的姿态进行检测,得到第一检测结果,并将所述第一检测结果作为所述第二头部姿态检测结果,包括:
使用hopenet对所述人体脸部进行关键点检测,得到脸部关键点信息;
根据所述脸部关键点信息得到所述第一检测结果;
将所述第一检测结果作为所述第二头部姿态检测结果进行输出。
8.根据权利要求6所述的基于概率扩散模型的渐进式头部姿态估计方法,其特征在于,所述若不包括所述人体脸部信息,则对人体头部的姿态进行检测,得到第二检测结果,并将所述第二检测结果作为所述第二头部姿态检测结果,包括:
根据所述第二彩色图像得到所述人体头部的头顶法向量、所述人体头部的三维点数据,并将所述头顶法向量作为初步姿态信息;
根据所述第一概率扩散模型对所述人体的头部姿态进行检测,得到所述人体头部的点云体素数据;
根据所述初步姿态信息,对所述点云体素数据与所述三维点数据中的投影误差进行最小化处理,得到所述第二检测结果;
将所述第二检测结果作为所述第二头部姿态检测结果进行输出。
9.根据权利要求8所述的基于概率扩散模型的渐进式头部姿态估计方法,其特征在于,所述根据所述第一概率扩散模型对所述人体的头部姿态进行检测,得到所述人体头部的点云体素数据,包括:
结合去噪扩散模型,对所述点云体素数据去除高斯噪声;
和/或
根据基于二范数的条件似然函数对所述第一概率扩散模型进行训练,得到去除噪声后的所述点云体素数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211564642.5A CN116129465A (zh) | 2022-12-07 | 2022-12-07 | 一种基于概率扩散模型的渐进式头部姿态估计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211564642.5A CN116129465A (zh) | 2022-12-07 | 2022-12-07 | 一种基于概率扩散模型的渐进式头部姿态估计方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116129465A true CN116129465A (zh) | 2023-05-16 |
Family
ID=86307042
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211564642.5A Pending CN116129465A (zh) | 2022-12-07 | 2022-12-07 | 一种基于概率扩散模型的渐进式头部姿态估计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116129465A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116524195A (zh) * | 2023-06-20 | 2023-08-01 | 中国科学院深圳先进技术研究院 | 语义分割方法、装置、电子设备及存储介质 |
CN116664450A (zh) * | 2023-07-26 | 2023-08-29 | 国网浙江省电力有限公司信息通信分公司 | 基于扩散模型的图像增强方法、装置、设备及存储介质 |
-
2022
- 2022-12-07 CN CN202211564642.5A patent/CN116129465A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116524195A (zh) * | 2023-06-20 | 2023-08-01 | 中国科学院深圳先进技术研究院 | 语义分割方法、装置、电子设备及存储介质 |
CN116524195B (zh) * | 2023-06-20 | 2023-12-01 | 中国科学院深圳先进技术研究院 | 语义分割方法、装置、电子设备及存储介质 |
CN116664450A (zh) * | 2023-07-26 | 2023-08-29 | 国网浙江省电力有限公司信息通信分公司 | 基于扩散模型的图像增强方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116129465A (zh) | 一种基于概率扩散模型的渐进式头部姿态估计方法 | |
CN104899563B (zh) | 一种二维人脸关键特征点定位方法及系统 | |
US20160086017A1 (en) | Face pose rectification method and apparatus | |
KR20100094560A (ko) | 얼굴 자세 추정 장치, 얼굴 자세 추정 방법 및 얼굴 자세 추정 프로그램 | |
CN109472820B (zh) | 单目rgb-d相机实时人脸重建方法及装置 | |
JP2009525543A (ja) | 二次元画像からの三次元の顔の復元 | |
CN103810708A (zh) | 一种激光散斑图像深度感知方法及装置 | |
CN111680573B (zh) | 人脸识别方法、装置、电子设备和存储介质 | |
EP3198522A1 (en) | A face pose rectification method and apparatus | |
Zhang | On local matching of free-form curves | |
CN113052907B (zh) | 一种动态环境移动机器人的定位方法 | |
US11138743B2 (en) | Method and apparatus for a synchronous motion of a human body model | |
CN112989947A (zh) | 一种人体关键点的三维坐标的估计方法及装置 | |
JP2017091377A (ja) | 姿勢推定装置、姿勢推定方法、及び姿勢推定プログラム | |
CN108597589B (zh) | 模型生成方法、目标检测方法及医学成像系统 | |
CN106406507B (zh) | 图像处理方法以及电子设备 | |
CN110514140B (zh) | 一种三维成像方法、装置、设备以及存储介质 | |
CN110826495A (zh) | 基于面部朝向的身体左右肢体一致性跟踪判别方法及系统 | |
CN113592947B (zh) | 一种半直接法的视觉里程计实现方法 | |
CN107194931A (zh) | 一种基于双目图像匹配获取目标深度信息的方法和系统 | |
CN118096890B (zh) | 一种面向出舱航天员的6d位姿实时估计方法及装置 | |
CN116934829B (zh) | 无人机目标深度估计的方法、装置、存储介质及电子设备 | |
US11954943B2 (en) | Method for generating synthetic data | |
KR101436730B1 (ko) | 능동적 외양 모델을 이용한 비학습 얼굴의 3차원 얼굴 피팅 방법 | |
US20220254052A1 (en) | Three-dimensional pose estimation method, program, recording medium and three-dimensional pose estimation device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |