CN108805012B - 基于无穷Dirichlet过程混合模型的指节识别方法 - Google Patents
基于无穷Dirichlet过程混合模型的指节识别方法 Download PDFInfo
- Publication number
- CN108805012B CN108805012B CN201810372306.8A CN201810372306A CN108805012B CN 108805012 B CN108805012 B CN 108805012B CN 201810372306 A CN201810372306 A CN 201810372306A CN 108805012 B CN108805012 B CN 108805012B
- Authority
- CN
- China
- Prior art keywords
- finger joint
- model
- mixed model
- infinite
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/107—Static hand or arm
- G06V40/113—Recognition of static hand signs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/28—Recognition of hand or arm movements, e.g. recognition of deaf sign language
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于无穷Dirichlet过程混合模型的指节识别方法,按照以下步骤进行:步骤1,在局部Markov假设的基础上,将条件随机测度的学习问题转化为随机聚类学习问题;步骤2,运用无穷Dirichlet过程混合模型描述概率密度,将聚类数量表述为随机态;步骤3,利用Gibbs采样方法,对分层概率形式的密度结构进行迭代学习;步骤4,基于Dirichlet过程混合模型的坍塌Gibbs采样算法DPMM,运用样本集进行了模型训练学习,采用固定阈值对手部图像指节进行识别。本发明细化了手部生物结构的描述,检测结果稳定可靠,计算效率高。
Description
技术领域
本发明属于智能制造技术领域,具体涉及一种基于无穷Dirichlet过程混合模型的指节识别方法。
背景技术
在智能制造系统中,开发具有高智能化程度与较强环境适应能力的检测技术,对增强制造系统柔性、提升生产效率与产品质量有重要意义。基于机器视觉的人机交互协调装配技术,将图像分析获得的人体装配姿态作为装配机器人任务规划的输入信息,通过人机协作实现高效高柔性的装配。手部图像的生物结构及其关联包含了手部装配姿态的总体信息,检测生物结构对应的图像特征是手部姿态信息推断的基础。指节位置特征对手形位姿推断准确性的提高有重要影响。
人体手部图像的生物结构及其关联包含手部装配姿态的总体信息[5],是手部姿态信息推断的基础。
手势识别的研究主要有两个方向,一是使用传感器和探测器等外设工具实现手势识别,如Lee通过使用基于腕带的轮廓特征(WBCFs)识别复杂的静态手势,需要用户在双手手腕上佩戴一对黑色腕带,以便准确分割手区域。Moschetti通过放置在食指和手腕上的两个惯性传感器识别九个手势。此类方法通过传感器进行手部位姿提取,实现较为精准的手势识别,但需要外部设备的支持,不够便捷。而另一种研究方向是直接通过摄像得到的图像进行无标记的手势识别,PeijunBao等利用深层卷积神经网络对图像中的手势进行分类,不需要任何分割或检测阶段,即可丢弃不相关的非手区域。Dehankar将精确端点识别方法(AEPI)应用于不同背景的手势图像,可准确地识别图像手势。
手部生物结构特征识别包括肤色定位、指尖指根检测、指节识别、指形定位与特征间的运动学关联等。指节位置特征对手形位姿推断准确性的提高有重要影响。
指节图像检测方法主要分为几何分析与纹理识别。目前对指节图像的研究多集中于使用指节纹进行身份识别,通过对指节纹路研究,利用指节纹或者用指节纹配合指纹来实现对不同人的识别。K.Usha[利用基于角度几何分析的特征提取方法(AGFEM)和基于Contourlet变换的特征提取方法(CTFEM)对手指背表面(FBKS)进行个人身份认证,指出FBKS远端指骨区域,即手指尖附近的手指关节区域,具有较大的识别潜力,并通过分数级融合同时提取和集成指节几何和纹理特征改进识别性能。Lin Zhang通过FKP识别算法,为基于手指背面的生物测量系统提供了一个实用的解决方案。Gao用一种自适应二进制融合规则来自适应融合重建前后的匹配距离,降低了拒绝样本的错误率。Kumar使用掌骨和近指节骨骨节之间形成的最低指关节图案进行自动化个人识别研究。图像特征往往表现出聚类性,H.Li等在解决监控应用中的自动异常检测问题中使用以无监督主成分分析(PCA)为基础的特征聚类算法实现自动选择最优数目的聚类用于场景模式建模的训练数据,Rahmani使用谱聚类方法对雷达图像进行无监督特征学习。
基于肤色模型的图像分割可初步解决手部的图像定位问题,而如指形姿态、指节位置等表征手部生物结构的重要图像特征仍需进一步识别。在手部半握及全握姿态下,对应于手部关节位置处的骨节结构,指节图像的灰度分布在手指局部位置附近呈现不规则凸包结构,可将该非确定性不规则凸包作为指节图像的一种随机隐结构。在之前的相关文章[26]中,笔者以手指关节图像为例,针对上述灰度结构模糊、特征隐含且抽取困难的一类随机图像,通过灰度分布的密度估计获得图像隐特征观测,建立图像隐特征模式的学习与估计算法框架,给出了随机图像上偏移特征的提取与分析方法。由于指节生物结构决定的图像高层数据聚类数量并不确定,因此当采用传统的K值固定的混合模型描述数据的分布时,出现模型假设与观测数据分布间存在较明显的区别。
发明内容
本发明的目的是提供一种基于无穷Dirichlet过程混合模型的指节识别方法,解决了现有技术中模型假设与观测数据分布间存在较明显的区别的问题。
本发明所采用的技术方案是,基于无穷Dirichlet过程混合模型的指节识别方法,具体按照以下步骤进行:
步骤1,在局部Markov假设的基础上,将条件随机测度的学习问题转化为随机聚类学习问题;
步骤2,运用无穷Dirichlet过程混合模型描述概率密度,将聚类数量表述为随机态;
步骤3,利用Gibbs采样方法,对分层概率形式的密度结构进行迭代学习;
步骤4,基于Dirichlet过程混合模型的坍塌Gibbs采样算法DPMM,运用样本集进行了模型训练学习,采用固定阈值对手部图像指节进行识别。
本发明的特点还在于,
步骤1中:根据图像偏移特征的提取,测试图像A对随机图像灰度分布模型的似然表示为:
其中为偏移测度的逼近形式,为不同偏移参数下、不同形式偏移集模型间的融合结构,为高层偏移集概率测度,为中层偏移集概率测度;
在密度估计fK的分层观测结果中,确定同属于水平参数c下单侧偏移集格点位置的过程相当于图像离散格点上的标记过程:
其中Z为观测格点,fK为密度估计,tX为图像位置,c为水平参数。
步骤2中:在基于格子Gibbs混合采样进行离散逼近的思路下,取先验分布为Gamma分布:α~G(a,b)
利用多伽马分布混合表示的后验条件更新形式:
(α|η,k)~πηG(a+k,b-log(η))+(1-πη)G(a+k-1.b-log(η))
其中G为Gamma分布,K为Dirichlet混合过程更新聚类的当前数量,n为观测数据量。
步骤3中:根据Dirichlet过程混合模型的N观测推断隐变量标号zi、总体聚类数量与对应参数精确的后验分布p(π,θ|x)包含了所有可能的类别标记空间Z对应的配分,利用坍塌Gibbs采样算法实现对无穷聚类混合模型的迭代学习;首先对所有观测变量采样其对应的隐变量zi,其次计算当前标记类分布所对应多项式的后验边缘π与所有聚类超参数类固定其余观测量的隐变量标记z\i,当前观测量的隐变量后验分布为:
p(zi|z\i,x,α,λ)∝p(zi|z\i,α)p(xi|z,x\i,λ)
其中p(zi|z\i,x,α,λ)为观测量的隐变量后验分布,p(zi|z\i,α)为当前观测量xi的似然,p(xi|z,x\i,λ)为观测量xi的预测似然,Z类别标记空间。
步骤1具体为:依据从非参数密度核估计的结果中抽取出的图像灰度位置数据,对图像域上从属于固定阈值偏移集的概率测度进行学习;通过对偏移集分布的学习与建模,实现灰度粒子随机模型的单侧估计。
步骤2具体为:随机超参数场上的偏移测度在局部关系下体现出观测标记分类、密度分布凝聚的特点,考虑到当偏移集水平参数较高时,偏移集的欧拉示性数越大,高水平下的偏移集在平面域上的局部覆盖越完整,亦即更有聚类趋势,随之将偏移分布特征的学习问题转化为随机聚类学习问题。
步骤3具体为:为了提高模型对目标分布的适应性,将目标分布的模型进一步修正为非参数混合模型,而不局限于有限的分布形式,以此提高模型学习的有效性与图像识别率;利用Dirichlet过程在随机概率测度上定义控制随机组份的分布,作为对参数化模型学习的有效替代,非参数方法通过在无穷维参数空间上构建随机过程,并通过该随机过程的有限统计量进行量化。
步骤4具体为:根据Dirichlet过程混合模型的观测,推断隐变量标号、总体聚类数量与对应参数;精确的后验分布包含了所有可能的类别标记空间对应的配分,利用坍塌Gibbs采样算法实现对无穷聚类混合模型的迭代学习。
本发明的有益效果是,利用指节图像的聚类特征,细化了手部生物结构的描述,检测结果稳定可靠,计算效率高。不同于传统有限混合模型中的参数寻优,采样算法在大范围的聚类模型中进行随机搜索,使模型能够快速确定较稳定的聚类模式;
Dirichlet分布对应先验结构的使用,使DPMM内参数的更新过程可以在较高层的条件分布下进行更有效的控制,收敛曲线在稳定区有较高的光滑度;
指节图像聚类自适应过程具有同数据密度聚类相似的结果特征,模型尺度对训练集有较强的适应能力,对指节图像的高层分布具有较好的建模能力;
无需操作者穿戴其他设备与仪器,即可通过机器视觉检测指关节,为描述细化手部姿态和行为识别提供了便利,减轻了穿戴设备及仪器对操作者的身体负担,消除了由此带来的操作笨拙不灵敏问题。
附图说明
图1是本发明基于无穷Dirichlet过程混合模型的指节识别方法的Dirichlet过程混合模型的坍塌Gibbs采样流程图;
图2(a)和图2(b)分别是本发明基于无穷Dirichlet过程混合模型的指节识别方法的远指节DPMM随机聚类示例1的收敛监测图和聚类数目监测图;
图3(a)和图3(b)分别是本发明基于无穷Dirichlet过程混合模型的指节识别方法的远指节DPMM随机聚类示例2的收敛监测图和聚类数目监测图;
图4(a)和图4(b)分别是本发明基于无穷Dirichlet过程混合模型的指节识别方法的中指节DPMM随机聚类示例1收敛监测图和聚类数目监测图;
图5(a)和图5(b)分别是本发明基于无穷Dirichlet过程混合模型的指节识别方法的中指节DPMM随机聚类示例2收敛监测图和聚类数目监测图;
图6(a)和图6(b)为远指节DPMM随机聚类学习结果图,图6(c)和图6(d)为中指节DPMM随机聚类学习结果图;
图7(a)和图7(b)分别是本发明基于无穷Dirichlet过程混合模型的指节识别方法的远指节组和中指节组的手指关节DPMM模型学习结果图;
图8(a)和图8(b)是远指节组和中指节组的手指关节高层数据DPMM模型固定阈值图像识别图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明基于无穷Dirichlet过程混合模型的指节识别方法,具体按照以下步骤进行:
步骤一,在局部Markov假设的基础上,将条件随机测度的学习问题转化为随机聚类学习问题;
根据图像偏移特征的提取,测试图像A对随机图像灰度分布模型的似然表示为:
其中为偏移测度的逼近形式,为不同偏移参数下、不同形式偏移集模型间的融合结构,为高层偏移集概率测度,为中层偏移集概率测度。
本发明依据从非参数密度核估计的结果中抽取出的图像灰度位置数据,对图像域上从属于固定阈值c下偏移集的概率测度进行学习。通过对偏移集分布的学习与建模,实现灰度粒子随机模型的单侧估计。为便于计算与表示,将条件随机测度表示为以下函数形式:
其中p(·)为目标分布对应的非负二维密度函数。
在密度估计fK的分层观测结果中,确定同属于水平参数c下单侧偏移集格点位置的过程相当于图像离散格点上的标记过程:
Z=V∪(Z\V) (4)
其中标记量在观测格点Z上构成了隐变量。为了通过观测值对偏移集测度的分布模型进行学习,须构建格点Z上的观测量、标记类与偏移测度间的关系。
分别在V与Z\V上,被观测到的集合V中的位置在图像上具有确定的标记类1,而在未被观测到的位置集合Z\V上标记类别不确定。在分布模型的连续性假设下,标记类别不确定的位置处应理解为未观测到,而0标记并不能直接确定对应的观测结果。标记类别即表示观测位置处是否属于水平c下的偏移集。
然而,在利用观测数据估计整体偏移测度过程中,需要进一步指明集合V与集合Z\V间元素的标记关系,才能将整个格点Z上的标记关系进行综合。可以采用“有向—无向”混合图(Mixture Graph)结构在Z上建立格点观测值之间的依赖关系,作为后续利用观测数据进行推断学习的基础。由此在格点Z上构造出带观测标记类别的隐马尔科夫模型(HMM),其中隐变量为标记类别,关联因子为偏移集上的局部依赖。由于依据密度估计抽取出的观测值具有同原始灰度图像观测值相类似的邻域结构,因此格点Z上对应的语义p(·)不仅在图像整体上形成意义,同时在局部也具有依赖关联,在对应的无向图模型上即为局部Markov假设:
p{xi∈V|xZ\i}=p{xi∈V|xΓ(i)} (5)
亦即依赖于整体分布的观测以局部关联的形式从整体中脱离出来。
据以上分析,一方面,随机超参数场f上的偏移测度在局部关系下体现出观测标记分类、密度分布凝聚的特点;另一方面,考虑到当偏移集水平参数较高时,偏移集的欧拉示性数越大,说明高水平下的偏移集在平面域上的局部覆盖越完整,亦即更有聚类趋势。因此,对p(·)的学习问题可转化为随机聚类学习问题。
步骤二,运用无穷Dirichlet过程混合模型描述概率密度,将聚类数量表述为随机态;
为了提高模型对目标分布的适应性,将目标分布p的模型进一步修正为非参数混合模型:
而不局限于有限的分布形式,以此提高模型学习的有效性与图像识别率,其中θ为超参数。特别地,Dirichlet过程在随机概率测度上定义控制随机组份的分布,作为对参数化模型学习的有效替代。非参数方法通过在无穷维参数空间Θ上构建随机过程,并通过该随机过程的有限统计量进行量化。其中Θ表示可测空间,Dirichlet过程通过Θ上的基测度H与中心参数α定义。Θ的有限配分(T1,...,Tk):
Θ上的随机概率分布G在有限配分集T上的均值服从Dirichlet分布:
(G(T1),...,G(Tk))~Dir(αH(T1),...,αH(Tk)) (8)
由此借助中心参数α与基测度H定义了以上的唯一随机过程DP(α,H)。
由于参数α在Dirichlet过程中控制随机参数集合的概率配分方式,因此作为重要的基础参数,其后验更新与准确采样对迭代学习的收敛性有着决定性作用。由于α的具体采样策略同Dirichlet过程中随机测度配分的具体生成机制有关,该过程有多种等价机制与对应的理论模型。在基于格子Gibbs混合采样进行离散逼近的思路下,取先验分布为Gamma分布:
α~G(a,b) (9)
利用多伽马分布混合表示(取混合数量为2)的后验条件更新形式:
(α|η,k)~πηG(a+k,b-log(η))+(1-πη)G(a+k-1.b-log(η)) (10)
其中G为Gamma分布,K为Dirichlet混合过程更新聚类的当前数量,n为观测数据量,
η~Beta(α+1,n) (11)
为了提高采样精度与稳定性,采用蒙特卡洛采样方法并将上述条件分布的采样均值作为最终的采样结果:
其中N与采样次数,ks可取退化值为K。
步骤三,利用Gibbs采样方法,对分层概率形式的密度结构进行迭代学习;
根据Dirichlet过程混合模型(Dirichlet Process Mixture Model,DPMM)的N观测推断隐变量标号zi、总体聚类数量与对应参数精确的后验分布p(π,θ|x)包含了所有可能的类别标记空间Z对应的配分,利用坍塌Gibbs采样算法实现对无穷聚类混合模型的迭代学习。首先对所有观测变量采样其对应的隐变量zi,其次计算当前标记类分布所对应多项式的后验边缘π与所有聚类超参数类
固定其余观测量的隐变量标记z\i,当前观测量的隐变量后验分布为:
p(zi|z\i,x,α,λ)∝p(zi|z\i,α)p(xi|z,x\i,λ) (14)
在可交换文本假设下,上式中第一项可表示为:
其中表示当前所有无穷多空标记类别中的聚类标号。类似于有限混合模型,观测量xi处的固定类模型似然为:
p(xi|zi=k,z\i,x\i,λ)=p(xi|{xj|zj=k,j≠i},λ) (16)
相似地,当前观测xi在新标记下的预测似然为:
其中H(λ)为指定的共轭先验。Dirichlet过程混合模型包含有无穷多数目的待学习参数,学习过程可以对有限混合模型的学习推理进行推广,算法流程如图1所示,具体过程如下:
①在Dirichlet超参数与条件下开始进行样本标
记的下一步重采样。
②采样观测序列{1,2,...,N}的随机排列τ(·)。
③根据上一次迭代进行初始化参数设定z=z(t-1),
④对随机排列i∈τ(1),...,τ(n):
(a)在标记类zi中移除观测数据xi,更新观测类别zi的充分统计量与
(b)若xi为当前类别中的唯一观测数据,则清空该类别标号与所有对应聚类参数。更新统计量与标记类总量K=K-1。
(c)重新标记所有非空激活类别1,...,K。
(d)对所有K类被激活的聚类,基于统计量与计算预测似然:
fk(xi)=p(xi|{xj|zj=k,j≠i},λ)
同时计算潜在标记分布:
fK+1(xi)=∫F(xi|θ)G0(θ)dθ
(e)从(K+1)维多项式分布中采样zi的新标记类:
其中为除去当前观测位置i属于标号k的观测总量。
(f)如果zi=K+1,则获得一个新聚类标记并记为K+1,通过H(φi|xi)采样(K+1)对应的新聚类参数。
(g)对所有类别标记更新充分统计量与
⑤判断是否所有类别都重采样完毕,不是则返回标记z(t)=z,返回①进行下一次重采样
⑥对所有标记类采样所有聚类参数:
⑦利用辅助变量方法采样:
步骤四,基于Dirichlet过程混合模型的坍塌Gibbs采样算法(DPMM),运用样本集进行了模型训练学习,采用固定阈值对手部图像指节进行识别。
远指节与中指节灰度图像高层密度数据DPMM的迭代学习监测示例:图2(a)和图2(b)分别是远指节DPMM随机聚类示例1的收敛监测图和聚类数目监测图;图3(a)和图3(b)分别是的远指节DPMM随机聚类示例2的收敛监测图和聚类数目监测图;图4(a)和图4(b)分别是中指节DPMM随机聚类示例1收敛监测图和聚类数目监测图;图5(a)和图5(b)分别是中指节DPMM随机聚类示例2收敛监测图和聚类数目监测图;图2(a)、图3(a)、图4(a)和图5(a)均为收敛监测,图2(b)、图3(b)、图4(b)和图5(b)均为聚类数目监测。利用上述坍塌Gibbs采样方法对指节图像高层数据分布的Dirichlet过程模型进行迭代学习,迭代初始化采用k-means算法分类结果并记录前300步似然监测值。其中正态-逆-威沙特分布中的先验参数取为κ=0.1、ν=4,混合Gamma分布中的先验超参数取为a=0.1、b=0.1,Dirichlet过程的参数初始化为α=10。为提高对矩阵参数的采样精度,对迭代更新获得的协方差矩阵进行Cholesky分解后,对其特征值、特征方向进行样本矩统计,利用矩阵的特征统计量恢复有效的矩阵采样。
从结果看,DPMM的收敛速度较快,似然曲线的平滑度高。一方面,由于聚类数目柔性化后,模型对训练数据集内结构的辨识度有了进一步提高。联系随机聚类数量的检测过程可进一步清晰化采样结果,在迭代过程的初始阶段中聚类数量骤增超过收敛数值的数倍,如图2、图3、图4和图5所示,不同于传统有限混合模型中的参数寻优,该阶段对应于采样算法在大范围的聚类模型中进行随机搜索,使模型能够快速确定较稳定的聚类模式。另一方面Dirichlet分布对应先验结构的使用,使DPMM内参数的更新过程可以在较高层的条件分布下进行更有效的控制,体现为收敛曲线在稳定区有较高的光滑度。
采用训练图像库远近指节各两组,DPMM模型学习结果示例,图6(a)和图6(b)为远指节、图6(c)和图6(d)为中指节DPMM随机聚类学习结果,为在K=3聚类初始化条件下,实现图像高偏移密度位置分布的柔性随机聚类建模,获得了内部结构更加复杂的指节图像高层分布似然模型。远指节目标学习结果明确体现出了聚类自适应过程具有同数据密度聚类相似的结果特征,模型尺度对训练集有较强的适应能力。模型似然结果所体现的聚类分布状况不仅在整体上与观测特征相一致,其内部聚类组份的特征方向也体现出了手部握姿下的部分指节骨骼特征,表明该算法对远指节图像的高层分布具有较好的建模能力。
分别在包含50幅正样本与50幅负样本的图像库上对远指节与中指节图像高层数据DPMM模型进行迭代学习,获得的模型统计似然如图7(a)和图7(b)所示。
利用图像高层数据DPMM模型的学习结果,分别在独立于训练库的远指节(1544幅)与中指节(4088幅)图像数据库进行固定阈值的识别测试,如图8(a)和图8(b)所示。可以看到远指节高层数据DPMM模型在阈值为0.1220时,曲线下面积AUC达到最大值并不再有显著增加,ROC曲线性态良好并且达到了0.9234这一较高的识别能力,说明学习结果对测试集有很强的识别能力。中指节高层数据DPMM模型在阈值为0.025时,AUC达到最高值0.8578,在FP=0.5,TP=0.8时曲线有一定的下沉表明测试图像集中的正负样本在某阈值处附近的分布具有较强的相似性,但并没有影响到算法对整个图像库的识别率。
本发明针对图像随机模型单侧偏移密度的学习问题,利用Dirichlet过程混合模型,依据从非参数密度核估计的结果中抽取出的图像灰度位置数据,对图像域上从属于固定阈值下偏移集的概率测度进行学习。通过对偏移集分布的学习与建模,实现灰度粒子随机模型的单侧估计。经过对样本集训练得到固定阈值,并以此进行了固定阈值图像识别,结果表明相应算法具有可行性。
Claims (8)
1.基于无穷Dirichlet过程混合模型的指节识别方法,其特征在于,具体按照以下步骤进行:
步骤1,在局部Markov假设的基础上,将指节图像的条件随机测度的学习问题转化为随机聚类学习问题;
步骤2,运用无穷Dirichlet过程混合模型描述概率密度,将聚类数量表述为随机态;
步骤3,利用Gibbs采样方法,对分层概率形式的密度结构进行迭代学习;
步骤4,基于Dirichlet过程混合模型的坍塌Gibbs采样算法DPMM,运用样本集进行模型训练学习,采用固定阈值对手部图像指节进行识别。
2.根据权利要求1所述的基于无穷Dirichlet过程混合模型的指节识别方法,其特征在于,所述步骤1中:
根据图像偏移特征的提取,测试图像A对随机图像灰度分布模型的似然表示为:
其中为偏移测度的逼近形式,D为不同偏移参数下、不同形式偏移集模型间的融合结构,为高层偏移集概率测度,为中层偏移集概率测度;
在密度估计fK的分层观测结果中,确定同属于水平参数c下单侧偏移集格点位置的过程相当于图像离散格点上的标记过程:
其中Z为观测格点,fK为密度估计,tX为图像位置,c为水平参数。
3.根据权利要求1所述的基于无穷Dirichlet过程混合模型的指节识别方法,其特征在于,所述步骤2中:
在基于格子Gibbs混合采样进行离散逼近的思路下,取先验分布为Gamma分布:α~G(a,b)
利用多伽马分布混合表示,取混合数量为2的后验条件更新形式:
(α|η,k)~πηG(a+k,b-log(η))+(1-πη)G(a+k-1.b-log(η))
其中,α为中心参数,G为Gamma分布,a、b为分布参数,η~Beta(α+1,n),k为多伽马分布中的参数,n为观测数据量,K为Dirichlet混合过程更新聚类的当前数量。
4.根据权利要求1所述的基于无穷Dirichlet过程混合模型的指节识别方法,其特征在于,所述步骤3中:
根据Dirichlet过程混合模型的N观测推断隐变量标号zi、总体聚类数量与对应参数精确的后验分布p(π,θ|x)包含了所有可能的类别标记空间Z对应的配分,利用坍塌Gibbs采样算法实现对无穷聚类混合模型的迭代学习;首先对所有观测变量采样其对应的隐变量zi,其次计算当前标记类分布所对应多项式的后验边缘π与所有聚类超参数类固定其余观测量的隐变量标记z\i,当前观测量的隐变量后验分布为:
p(zi|z\i,x,α,λ)∝p(zi|z\i,α)p(xi|z,x\i,λ)
其中p(zi|z\i,x,α,λ)为观测量的隐变量后验分布,p(zi|z\i,α)为当前观测量xi的似然,p(xi|z,x\i,λ)为观测量xi的预测似然,Z类别标记空间。
5.根据权利要求1所述的基于无穷Dirichlet过程混合模型的指节识别方法,其特征在于,所述步骤1具体为:依据从非参数密度核估计的结果中抽取出的图像灰度位置数据,对图像域上从属于固定阈值偏移集的概率测度进行学习;通过对偏移集分布的学习与建模,实现灰度粒子随机模型的单侧估计。
6.根据权利要求1所述的基于无穷Dirichlet过程混合模型的指节识别方法,其特征在于,所述步骤1具体为:随机超参数场上的偏移测度在局部关系下体现出观测标记分类、密度分布凝聚的特点,考虑到当偏移集水平参数较高时,偏移集的欧拉示性数越大,高水平下的偏移集在平面域上的局部覆盖越完整,亦即更有聚类趋势,随之将偏移分布特征的学习问题转化为随机聚类学习问题。
7.根据权利要求1所述的基于无穷Dirichlet过程混合模型的指节识别方法,其特征在于,所述步骤3具体为:将目标分布的模型进一步修正为非参数混合模型;利用Dirichlet过程在随机概率测度上定义控制随机组份的分布,作为对参数化模型学习的有效替代,非参数方法通过在无穷维参数空间上构建随机过程,并通过该随机过程的有限统计量进行量化。
8.根据权利要求1所述的基于无穷Dirichlet过程混合模型的指节识别方法,其特征在于,所述步骤4具体为:根据Dirichlet过程混合模型的观测,推断隐变量标号、总体聚类数量与对应参数;精确的后验分布包含了所有可能的类别标记空间对应的配分,利用坍塌Gibbs采样算法实现对无穷聚类混合模型的迭代学习。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810372306.8A CN108805012B (zh) | 2018-04-24 | 2018-04-24 | 基于无穷Dirichlet过程混合模型的指节识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810372306.8A CN108805012B (zh) | 2018-04-24 | 2018-04-24 | 基于无穷Dirichlet过程混合模型的指节识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108805012A CN108805012A (zh) | 2018-11-13 |
CN108805012B true CN108805012B (zh) | 2019-10-25 |
Family
ID=64093126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810372306.8A Expired - Fee Related CN108805012B (zh) | 2018-04-24 | 2018-04-24 | 基于无穷Dirichlet过程混合模型的指节识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108805012B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110361744B (zh) * | 2019-07-09 | 2022-11-01 | 哈尔滨工程大学 | 基于密度聚类的rbmcda水下多目标跟踪方法 |
CN113837315B (zh) * | 2021-10-11 | 2023-05-23 | 南昌航空大学 | 基于层次链接无限隐Markov模型的故障诊断方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810500A (zh) * | 2014-02-25 | 2014-05-21 | 北京工业大学 | 一种基于有监督学习概率主题模型的地点图像识别方法 |
CN103812872A (zh) * | 2014-02-28 | 2014-05-21 | 中国科学院信息工程研究所 | 一种基于混合狄利克雷过程的网络水军行为检测方法及系统 |
CN106709921A (zh) * | 2016-12-29 | 2017-05-24 | 华侨大学 | 一种基于空间Dirichlet混合模型的彩色图像分割方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103390046A (zh) * | 2013-07-20 | 2013-11-13 | 西安电子科技大学 | 潜在狄利克雷模型的多尺度字典自然场景图像分类方法 |
US10860829B2 (en) * | 2015-01-16 | 2020-12-08 | Oracle International Corporation | Data-parallel parameter estimation of the Latent Dirichlet allocation model by greedy Gibbs sampling |
CN106054189B (zh) * | 2016-07-17 | 2018-06-05 | 西安电子科技大学 | 基于dpKMMDP模型的雷达目标识别方法 |
-
2018
- 2018-04-24 CN CN201810372306.8A patent/CN108805012B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810500A (zh) * | 2014-02-25 | 2014-05-21 | 北京工业大学 | 一种基于有监督学习概率主题模型的地点图像识别方法 |
CN103812872A (zh) * | 2014-02-28 | 2014-05-21 | 中国科学院信息工程研究所 | 一种基于混合狄利克雷过程的网络水军行为检测方法及系统 |
CN106709921A (zh) * | 2016-12-29 | 2017-05-24 | 华侨大学 | 一种基于空间Dirichlet混合模型的彩色图像分割方法 |
Non-Patent Citations (3)
Title |
---|
A Dirichlet Process Mixture of Generalized Dirichlet Distributions for Proportional Data Modeling;Nizar Bouguila.etc;《 IEEE Transactions on Neural Networks》;20091204;第107-122页 * |
Log Gaussian Cox 场手部指节的图像偏移特征学习与识别;杨世强等;《农业机械学报》;20170131;第48卷(第1期);第353-360页 * |
基于Block-Gibbs抽样的无限潜Dirichlet分配模型的;齐银凤等;《遥感信息》;20150228;第26-50页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108805012A (zh) | 2018-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2680228B1 (en) | Improvements in or relating to three dimensional close interactions. | |
US11107242B2 (en) | Detecting pose using floating keypoint(s) | |
Ali et al. | Chaotic invariants for human action recognition | |
US10078796B2 (en) | Apparatus and method of hand gesture recognition based on depth image | |
CN106384093B (zh) | 一种基于降噪自动编码器和粒子滤波的人体动作识别方法 | |
Bhuyan et al. | Fingertip detection for hand pose recognition | |
CN108647654A (zh) | 基于视觉的手势视频图像识别系统和方法 | |
US20160125243A1 (en) | Human body part detection system and human body part detection method | |
Yao et al. | Real-time hand pose estimation from RGB-D sensor | |
Jensen et al. | Classification of kinematic swimming data with emphasis on resource consumption | |
CN110991268B (zh) | 一种基于深度图像的帕金森手部运动量化分析方法和系统 | |
CN109583331B (zh) | 基于深度学习的人手腕脉口位置精准定位方法 | |
CN102074034A (zh) | 多模型人体运动跟踪方法 | |
CN111460976B (zh) | 一种数据驱动的基于rgb视频的实时手部动作评估方法 | |
CN115497596B (zh) | 一种基于物联网的人体运动过程姿态纠正方法及系统 | |
CN108921011A (zh) | 一种基于隐马尔可夫模型的动态手势识别系统及方法 | |
CN108052886A (zh) | 一种小麦条锈病菌夏孢子自动统计计数方法 | |
CN111259735B (zh) | 基于多级预测特征增强卷积神经网络的单人姿态估计方法 | |
CN108805012B (zh) | 基于无穷Dirichlet过程混合模型的指节识别方法 | |
CN110717385A (zh) | 一种动态手势识别方法 | |
CN108595014A (zh) | 一种基于视觉的实时动态手势识别系统及方法 | |
CN115346272A (zh) | 基于深度图像序列的实时摔倒检测方法 | |
Ziaeefard et al. | Hierarchical human action recognition by normalized-polar histogram | |
CN114445649A (zh) | 用多尺度超像素融合检测rgb-d单幅图像阴影的方法 | |
Hossain et al. | A hybrid clustering pipeline for mining baseline local patterns in 3d point cloud |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20191025 |
|
CF01 | Termination of patent right due to non-payment of annual fee |