CN105426911A - 一种基于狄利克雷过程混合模型的tac聚类方法 - Google Patents

一种基于狄利克雷过程混合模型的tac聚类方法 Download PDF

Info

Publication number
CN105426911A
CN105426911A CN201510779512.7A CN201510779512A CN105426911A CN 105426911 A CN105426911 A CN 105426911A CN 201510779512 A CN201510779512 A CN 201510779512A CN 105426911 A CN105426911 A CN 105426911A
Authority
CN
China
Prior art keywords
tac
class
mixture model
classification
relevant information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510779512.7A
Other languages
English (en)
Other versions
CN105426911B (zh
Inventor
刘华锋
王婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201510779512.7A priority Critical patent/CN105426911B/zh
Publication of CN105426911A publication Critical patent/CN105426911A/zh
Application granted granted Critical
Publication of CN105426911B publication Critical patent/CN105426911B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种基于狄利克雷过程混合模型的TAC聚类方法,包括:初始化狄利克雷过程混合模型,迭代计算条件概率并进行抽样直至满足迭代停止条件。本发明通过使用狄利克雷过程混合模型对TAC进行聚类,有效的解决了在类数未知的情况下对TAC进行聚类的问题,且狄利克雷混合模型的复杂度可以随着我们获得的数据的数量的增加而增大,这是其他聚类算法所不具备的优点。

Description

一种基于狄利克雷过程混合模型的TAC聚类方法
技术领域
本发明属于聚类技术领域,具体涉及一种基于狄利克雷过程混合模型的TAC聚类方法。
背景技术
正电子断层成像(positronemissiontomography,PET),是一种核医学成像技术。动态PET成像通过连续数据采集,获取多帧生理状态空间分布,其能够通过重建活体组织中放射性药剂标记的生物基质的时间和空间上的分布,提供关于不同的生物或者生理过程的量化的且非侵入式的信息。在实际中,动态PET图像经常被分割成不同的感兴趣区域(regionofinterest,ROI),然后从每个区域中提取出时间活度曲线(timeactivitycurve,TAC)。TAC可以进一步被分析来估计生理学参数,如血流量、新陈代谢和受体浓度,这取决于示踪剂的特性。
基于动态PET图像只有几个ROI且每个ROI都是均匀的这一事实,我们希望能够对TAC进行聚类,即对动态PET图像进行分割。更加重要的是,我们希望能够基于特征对TAC进行聚类,使得对噪声更加鲁棒。狄利克雷过程(DirichletProcess,DP)是非参数贝叶斯方法中最具代表性的随机过程。与其他聚类方法不同,狄利克雷过程混合模型可以在不知道数据类数的情况下对数据进行聚类,且随着模型能得到的数据越来越多,其可以自适应的根据数据自身的特性对数据进行聚类并给出数据类数的信息。
在机器学习的领域,概率模型被用来建模基于观测数据的分布。传统的参数模型使用固定的且有限数目的参数,这使得当模型的复杂度(往往用参数的个数来衡量)和可利用的数据量之间不相配的时候,传统的参数模型很容易遭受过拟合或者欠拟合。因此,模型的选择,或者说有着正确复杂度的模型的选择,在参数建模中是非常重要的问题。然后,不管我们是将交叉验证还是边缘概率作为选择的基础,模型的选择都是非常困难的。贝叶斯非参数方法是参数建模和选择的一个选项,其通过使用一个有着无限复杂度的模型,欠拟合的情况会减轻,同时,使用贝叶斯方法计算和近似基于参数的完整后验减轻了过拟合的情况。狄利克雷过程混合模型是贝叶斯非参数模型中最受欢迎的模型之一,其是潜在类别模型,常用在聚类问题中。
发明内容
本发明提供了一种基于狄利克雷过程混合模型的TAC聚类方法,能够解决模型选择困难以及现有的聚类方法建模时容易出现的欠拟合和过拟合等问题。
一种基于狄利克雷过程混合模型的TAC聚类方法,包括如下步骤:
(1)初始化设定类数K,聚集参数α,类分离度相关参数ss、s0,以及逆维希特协方差先验的自由度v的值;
(2)基于步骤(1)中的初始化信息,对每条TAC所归属的类别进行初始化,建立狄利克雷过程混合模型并计算确定混合模型中每一类别的相关信息q;
(3)对于所有的TAC,依次将每条TAC从混合模型中移出并计算其属于每一类别以及新类别的条件概率;
(4)根据所述的条件概率对该TAC重新抽样选择类别,然后将其加回混合模型中并更新模型参数;
(5)根据步骤(3)和(4)遍历所有TAC并认作迭代一次,反复迭代直至类数K不再发生变化,并保存最终的结果。
所述的步骤(2)中对每条TAC所归属的类别进行初始化,计算确定混合模型中每一类别的相关信息q,具体过程如下:
2.1用z来表示所有TAC所属的类的值,zi为z中的第i个元素,zi的取值通过产生一个随机自然数得到,其取值范围为1≤zi≤K,i为自然数且1≤i≤N,N为TAC的总数;
2.2所述的相关信息q包括三个组分:q·n、q·o和q·m;对于任一类别k,初始化其相关信息q(k),即:
q·n(k)=q·o(k)=q·m(k)=0
其中:q(k)表示第k类的相关信息,q·n(k)、q·o(k)和q·m(k)对应为相关信息q(k)中的三个组分,k为类别编号且为自然数,1≤k≤K;
2.3对于任一条TAC,通过以下关系式对每一类别的相关信息q进行更新操作:
m m = Σ k = 1 M m ( k )
q·n(zi)′=q·n(zi)+1
q·o(zi)′=q·o(zi)+x(i)
q·m(zi)′=q·m(zi)+mm
其中:x(i)为第i条TAC即当前TAC,m为第i条TAC中不为0的所有元素组成的向量,m(k)为m中的第k个元素,M为该向量的维度,即当前TAC中不为0的所有元素的个数,mm即为m中所有元素的和,zi表示第i条TAC所属的类的值,其取值范围为1≤zi≤K,q·n(zi)、q·o(zi)和q·m(zi)对应为更新前第zi类的相关信息q(zi)中的三个组分,q·n(zi)′、q·o(zi)′和q·m(zi)′对应为更新后第zi类相关信息q(zi)中的三个组分,i为自然数且1≤i≤N,N为TAC的总数;
2.4根据步骤2.3遍历每条TAC,遍历更新后的结果最终作为混合模型中每一类别的相关信息qq。
所述的步骤(3)中计算每条TAC属于每一类别以及新类别的条件概率,具体过程如下:
3.1首先将当前TAC从混合模型中移出,并通过以下关系式更新混合模型中每一类别的相关信息q:
m m = Σ k = 1 M m ( k )
q·n(zi)′=q·n(zi)+1
q·o(zi)′=q·o(zi)+x(i)
q·m(zi)′=q·m(zi)+mm
其中:x(i)为第i条TAC即当前TAC,m为第i条TAC中不为0的所有元素组成的向量,m(k)为m中的第k个元素,M为该向量的维度,即当前TAC中不为0的所有元素的个数,mm即m为中所有元素的和,zi表示第i条TAC所属的类的值,其取值范围为1≤zi≤K,q·n(zi)、q·o(zi)和q·m(zi)对应为更新前第zi类相关信息q(zi)中的三个组分,q·n(zi)′、q·o(zi)′和q·m(zi)′对应为更新后第zi类相关信息q(zi)中的三个组分,i为自然数且1≤i≤N,N为TAC的总数;
3.2完成步骤3.1中的关系式计算后,若q·n(zi)′的值为0,则说明当前zi的值所对应的类中的元素数目为0,即该类中不含有任何元素,这时需要删除这个空的类,设当前zi的值为k,需要更新K、q·n、q·o、q·m及zi的值,具体更新方式为:
K′=K-1;
q·n′=删除了第k个元素的q·n
q·o′=删除了第k个元素的q·o
q·m′=删除了第k个元素的q·m
z′i=zi-1(若zi>k)
其中:K、q·n、q·o、q·m、zi对应更新前的信息,K′、q·n′、q·o′、q·m′、z′i对应更新后的信息,对于zi的更新需要遍历每一条TAC,即i为自然数且其取值从1到N,N为TAC的总数;若完成步骤3.1中的关系式计算后,若q·n(zi)′的值不为0,则无需这一步操作;
3.3然后通过以下关系式计算该TAC属于每一类别以及新类别的条件概
p1=log([q·n,α])
p 2 ( k ) = p 1 ( k ) = ( q . n ( k ) + 1 ) * d 2 * log ( π ) - d 2 * log ( ss 2 s 0 2 + 1 ) -
( v + 1 ) * Σ ( log ( d i a g ( c h o l 2 ( c h o l 1 ( c h o l ( ss 2 * I d * v ) , x ( i ) ) , x ( i ) ss 2 s 0 2 + 1 ) ) ) )
+ q . n ( k ) * d 2 * l o g ( π ) + d 2 * l o g ( ss 2 s 0 2 )
+ v * Σ ( log ( d i a g ( c h o l 2 ( c h o l ( ss 2 * I d * v ) , O d , 1 ) ) ) )
p3=exp(p2-max(p2))
p=p3/sum(p3)
其中:x(i)为第i条TAC即当前TAC,d表示TAC的维度,p为第i条TAC属于每一类的条件概率组成的向量,即其中的元素p(k)表示第i条TAC属于第k类的条件概率,其中,p中的最后一个元素表示第i条TAC属于一个新的类的条件概率,k为类别编号且为自然数,1≤k≤k+1,α为聚集参数,s0和ss为类分离度相关参数,v是逆维希特协方差先验的自由度,q·n(k)即为第k类相关信息q(k)中的其中一个组分,Od,1是行数为d列数为1的零向量,chol(A)是Cholesky分解函数,如果矩阵A是对称正定的,则Cholesky分解将矩阵A分解成一个下三角矩阵和上三角矩阵的乘积,若用R来表示上三角矩阵,则下三角矩阵为其转置,即A=R’R,如果R=chol(A)是A的Cholesky因式,那么chol1(R,X)函数得到的结果是(A-X*X’)的Cholesky因式,chol2(R,X)函数得到的结果是(A+X’*X)的Cholesky因式,chol1(R,X)和chol2(R,X)函数都只使用R的对角及上三角元素,R的下三角元素均被忽略,diag(X)函数的作用是将X的对角线上的元素取出组成一个新的向量,这里的求和符号∑是对括号内向量中的每个元素进行求和。
所述的步骤(4)中根据所述的条件概率对该TAC重新抽样选择类别,然后将其加回混合模型中并更新模型参数,具体过程如下:
4.1对步骤3.3中得到的p中的每个元素进行抽样,得到抽样结果,抽中p中第k个元素的条件概率即为p(k);
4.2若抽中的是p中最后一个元素,即第(K+1)个元素,则需构建一个新的类,具体操作方式如下:
K′=K+1;
q·n′=[q·n,0]
q·o′=[q·o,0]
q·m′=[q·m,0]
z′i=K′
其中,K、q·n、q·o、q·m对应更新前的信息,K′、q·n′、q·o′、q·m′对应更新后的信息;若抽中的不是p中最后一个元素,则无需这一步操作;
4.3然后将当前TAC加回混合模型中,这时需要再一次修改q的三个组分q·n、q·o、q·m的值,具体修改方式如下:
m m = Σ k = 1 M m ( k )
q·n(zi)′=q·n(zi)+1
q·o(zi)′=q·o(zi)+x(i)
q·m(zi)′=q·m(zi)+mm
其中:x(i)为第i条TAC即当前TAC,m为第i条TAC中不为0的所有元素组成的向量,m(k)为m中的第k个元素,M为该向量的维度,即当前TAC中不为0的所有元素的个数,mm即m为中所有元素的和,zi表示第i条TAC所属的类的值,其取值范围为1≤zi≤K,q·n(zi)、q·o(zi)和q·m(zi)对应为更新前第zi类的相关信息q(zi)中的三个组分,q·n(zi)′、q·o(zi)′和q·m(zi)′对应为更新后第zi类相关信息q(zi)中的三个组分,i为自然数且1≤i≤N,N为TAC的总数。
所述的初始化类数K的取值范围为100~100000,聚集参数α的取值范围为0.001~10000,类分离度相关参数ss和s0的取值范围均为0.01~1000,逆维希特协方差先验的自由度v的取值范围为10~10000。
本发明通过使用狄利克雷过程混合模型对TAC进行聚类,有效的解决了在类数未知的情况下进行聚类的问题,且狄利克雷混合模型的复杂度可以随着获得的数据数量的增加而增大,这是其他聚类算法所不具备的优点。
附图说明
图1为本发明TAC聚类方法的步骤流程示意图。
图2为真值对应的TAC图;其中横坐标为帧数,纵坐标为每个像素点随帧数的灰度变化。
图3(a)为真值的聚类结果示意图;其中不同灰度的位置的像素点表示不同的类,即同一种灰度的像素点所代表的TAC属于同一类。
图3(b)为聚类过程中类数随迭代次数的变化示意图。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明TAC聚类方法进行详细说明。
如图1所示,本发明基于狄利克雷过程混合模型的TAC聚类方法,包括如下步骤:
S1.初始化各项参数:需要初始化的参数有类数K,聚集参数α,类分离度相关参数ss、s0,以及逆维希特协方差先验的自由度v的值;
S2.初始化DP混合模型:对每条TAC所归属的类别进行初始化,计算确定混合模型中每一类别的相关信息q,具体过程如下:
2.1用z来表示所有TAC所属的类的值,zi为z中的第i个元素,zi的取值通过产生一个随机自然数得到,其取值范围为1≤zi≤K,i为自然数且1≤i≤N,N为TAC的总数;
2.2所述的相关信息q包括三个组分:q·n、q·o和q·m;对于任一类别k,初始化其相关信息q(k),即
q·n(k)=q·o(k)=q·m(k)=0
其中:q(k)表示第k类的相关信息,q·n(k)、q·o(k)和q·m(k)对应为相关信息q(k)中的三个组分,k为类别编号且为自然数,1≤k≤K,;
2.3对于任一条TAC,通过以下关系式对每一类别的相关信息q进行更新操作:
m m = Σ k = 1 M m ( k )
q·n(zi)′=q·n(zi)+1
q·o(zi)′=q·o(zi)+x(i)
q·m(zi)′=q·m(zi)+mm
其中:x(i)为第i条TAC即当前TAC,m为第i条TAC中不为0的所有元素组成的向量,m(k)为m中的第k个元素,M为该向量的维度,即当前TAC中不为0的所有元素的个数,mm即为m中所有元素的和,zi表示第i条TAC所属的类的值,其取值范围为1≤zi≤K,q·n(zi)、q·o(zi)和q·m(zi)对应为更新前第zi类的相关信息q(zi)中的三个组分,q·n(zi)′、q·o(zi)′和q·m(zi)′对应为更新后第zi类相关信息q(zi)中的三个组分,i为自然数且1≤i≤N,N为TAC的总数;
2.4根据步骤2.3遍历每条TAC,遍历更新后的结果最终作为混合模型中每一类别的相关信息qq。
S3.计算条件概率:计算每条TAC属于每一类别以及新类别的条件概率,具体过程如下:
3.1首先将当前TAC从混合模型中移出,并通过以下关系式更新混合模型中每一类别的相关信息q:
m m = Σ k = 1 M m ( k )
q·n(zi)′=q·n(zi)+1
q·o(zi)′=q·o(zi)+x(i)
q·m(zi)′=q·m(zi)+mm
其中:x(i)为第i条TAC即当前TAC,m为第i条TAC中不为0的所有元素组成的向量,m(k)为m中的第k个元素,M为该向量的维度,即当前TAC中不为0的所有元素的个数,mm即m为中所有元素的和,zi表示第i条TAC所属的类的值,其取值范围为1≤zi≤K,q·n(zi)、q·o(zi)和q·m(zi)对应为更新前第zi类相关信息q(zi)中的三个组分,q·n(zi)′、q·o(zi)′和q·m(zi)′对应为更新后第zi类相关信息q(zi)中的三个组分,i为自然数且1≤i≤N,N为TAC的总数;
3.2完成3.1中的关系式计算后,若q·n(zi)′的值为0,则说明当前zi的值所对应的类中的元素数目为0,即该类中不含有任何元素,这时需要删除这个空的类,设当前zi的值为k,需要更新K、q·n、q·o、q·m及zi的值,具体更新方式为:
K′=K-1;
q·n′=删除了第k个元素的q·n
q·o′=删除了第k个元素的q·o
q·m′=删除了第k个元素的q·m
z′i=zi-1(若zi>k)
其中:K、q·n、q·o、q·m、zi对应更新前的信息,K′、q·n′、q·o′、q·m′、z′i对应更新后的信息,对于zi的更新需要遍历每一条TAC,即i为自然数且其取值从1到N,N为TAC的总数;若完成3.1中的关系式计算后,若q·n(zi)′的值不为0,则无需这一步操作;
3.3然后通过以下关系式计算该TAC属于每一类别以及新类别的条件概率:
p1=log([q·n,α])
p 2 ( k ) = p 1 ( k ) = ( q . n ( k ) + 1 ) * d 2 * log ( π ) - d 2 * log ( ss 2 s 0 2 + 1 ) -
( v + 1 ) * Σ ( log ( d i a g ( c h o l 2 ( c h o l 1 ( c h o l ( ss 2 * I d * v ) , x ( i ) ) , x ( i ) ss 2 s 0 2 + 1 ) ) ) )
+ q . n ( k ) * d 2 * l o g ( π ) + d 2 * l o g ( ss 2 s 0 2 )
+ v * Σ ( log ( d i a g ( c h o l 2 ( c h o l ( ss 2 * I d * v ) , O d , 1 ) ) ) )
p3=exp(p2-max(p2))
p=p3/sum(p3)
其中:x(i)为第i条TAC即当前TAC,d表示TAC的维度,p为第i条TAC属于每一类的条件概率组成的向量,即其中的元素p(k)表示第i条TAC属于第k类的条件概率,其中,p中的最后一个元素表示第i条TAC属于一个新的类的条件概率,k为类别编号且为自然数,1≤k≤K+1,α为聚集参数,s0和ss为类分离度相关参数,v是逆维希特协方差先验的自由度,q·n(k)即为第k类相关信息q(k)中的其中一个组分,Od,1是行数为d列数为1的零向量,chol(A)是Cholesky分解函数,如果矩阵A是对称正定的,则Cholesky分解将矩阵A分解成一个下三角矩阵和上三角矩阵的乘积,若用R来表示上三角矩阵,则下三角矩阵为其转置,即A=R’R,如果R=chol(A)是A的Cholesky因式,那么chol1(R,X)函数得到的结果是(A-X*X’)的Cholesky因式,chol2(R,X)函数得到的结果是(A+X’*X)的Cholesky因式,chol1(R,X)和chol2(R,X)函数都只使用R的对角及上三角元素,R的下三角元素均被忽略,diag(X)函数的作用是将X的对角线上的元素取出组成一个新的向量,这里的求和符号∑是对括号内向量中的每个元素进行求和。
S4.抽样并更新模型:根据S3中计算得到的条件概率对该TAC重新抽样选择类别,然后将其加回混合模型中并更新模型参数,具体过程如下:
4.1对3.3中得到的p中的每个元素进行抽样,得到抽样结果,抽中p中第k个元素的条件概率即为p(k)。
4.2若抽中的是p中最后一个元素,即第(K+1)个元素,则需构建一个新的类,具体操作方式如下:
K′=K+1;
q·n′=[q·n,0]
q·o′=[q·o,0]
q·m′=[q·m,0]
z′i=K′
其中,K、q·n、q·o、q·m对应更新前的信息,K′、q·n′、q·o′、q·m′对应更新后的信息;若抽中的不是p中最后一个元素,则无需这一步操作;
4.3然后将当前TAC加回混合模型中,这时需要再一次修改q的三个组分q·n、q·o、q·m的值,具体修改方式如下:
m m = Σ k = 1 M m ( k )
q·n(zi)′=q·n(zi)+1
q·o(zi)′=q·o(zi)+x(i)
q·m(zi)′=q·m(zi)+mm
其中:x(i)为第i条TAC即当前TAC,m为第i条TAC中不为0的所有元素组成的向量,m(k)为m中的第k个元素,M为该向量的维度,即当前TAC中不为0的所有元素的个数,mm即m为中所有元素的和,zi表示第i条TAC所属的类的值,其取值范围为1≤zi≤K,q·n(zi)、q·o(zi)和q·m(zi)对应为更新前第zi类的相关信息q(zi)中的三个组分,q·n(zi)′、q·o(zi)′和q·m(zi)′对应为更新后第zi类相关信息q(zi)中的三个组分,i为自然数且1≤i≤N,N为TAC的总数。
S5.重复步骤S3和S4,直到数据的类数K不再发生变化,此时迭代停止,保存q、K、z的值。
以下我们通过对真值(groundtruth)进行聚类的实验来验证本实施方式的实用性和可靠性。真值由十八帧图像组成,每帧图像的大小均为128像素点*128像素点,每帧图像上的同一个像素点的灰度值可组成一个十八维向量,即TAC,我们可画出TAC曲线,如图2所示,横坐标为帧数,纵坐标为灰度值。程序的运行结果如图3所示,不同灰度区域的像素点属于不同的类,即相同灰度的像素点属于同一类,每个像素点对应一条TAC。本实施方式的程序能以95%以上的概率(因为程序中有随机抽样的成分在里面,故并非每次都可以得到正确的聚类结果,这是正常现象)得到正确的聚类结果。

Claims (5)

1.一种基于狄利克雷过程混合模型的TAC聚类方法,包括如下步骤:
(1)初始化设定类数K、聚集参数α、类分离度相关参数ss和s0以及逆维希特协方差先验的自由度v的值;
(2)基于步骤(1)中的初始化信息,对每条TAC所归属的类别进行初始化,建立狄利克雷过程混合模型并计算确定混合模型中每一类别的相关信息q;
(3)对于所有的TAC,依次将每条TAC从混合模型中移出并计算其属于每一类别以及新类别的条件概率;
(4)根据所述的条件概率对该TAC重新抽样选择类别,然后将其加回混合模型中并更新模型参数;
(5)根据步骤(3)和(4)遍历所有TAC并认作迭代一次,反复迭代直至类数K不再发生变化,并保存最终的结果。
2.根据权利要求1所述的基于狄利克雷过程混合模型的TAC聚类方法,其特征在于:所述的步骤(2)中对每条TAC所归属的类别进行初始化,计算确定混合模型中每一类别的相关信息q,具体过程如下:
2.1用z来表示所有TAC所属的类的值,zi为z中的第i个元素,zi的取值通过产生一个随机自然数得到,其取值范围为1≤zi≤K,i为自然数且1≤i≤N,N为TAC的总数;
2.2所述的相关信息q包括三个组分:q.n、q.o和q.m;对于任一类别k,初始化其相关信息q(k),即:
q.n(k)=q.o(k)=q.m(k)=0
其中:q(k)表示第k类的相关信息,q.n(k)、q.o(k)和q.m(k)对应为相关信息q(k)中的三个组分,k为类别编号且为自然数,1≤k≤K;
2.3对于任一条TAC,通过以下关系式对每一类别的相关信息q进行更新操作:
m m = Σ k = 1 M m ( k )
q.n(zi)′=q.n(zi)+1
q.o(zi)′=q.o(zi)+x(i)
q.m(zi)′=q.m(zi)+mm
其中:x(i)为第i条TAC即当前TAC,m为第i条TAC中不为0的所有元素组成的向量,m(k)为m中的第k个元素,M为该向量的维度,即当前TAC中不为0的所有元素的个数,mm即为m中所有元素的和,zi表示第i条TAC所属的类的值,其取值范围为1≤zi≤K,q.n(zi)、q.o(zi)和q.m(zi)对应为更新前第zi类的相关信息q(zi)中的三个组分,q.n(zi)′、q.o(zi)′和q.m(zi)′对应为更新后第zi类相关信息q(zi)中的三个组分,i为自然数且1≤i≤N,N为TAC的总数;
2.4根据步骤2.3遍历每条TAC,遍历更新后的结果最终作为混合模型中每一类别的相关信息qq。
3.根据权利要求1所述的基于狄利克雷过程混合模型的TAC聚类方法,其特征在于:所述的步骤(3)中计算每条TAC属于每一类别以及新类别的条件概率,具体过程如下:
3.1首先将当前TAC从混合模型中移出,并通过以下关系式更新混合模型中每一类别的相关信息q:
m m = Σ k = 1 M m ( k )
q.n(zi)′=q.n(zi)-1
q.o(zi)′=q.o(zi)-z(i)
q.m(zi)′=q.m(zi)-mm
其中:x(i)为第i条TAC即当前TAC,m为第i条TAC中不为0的所有元素组成的向量,m(k)为m中的第k个元素,M为该向量的维度,即当前TAC中不为0的所有元素的个数,mm即m为中所有元素的和,zi表示第i条TAC所属的类的值,其取值范围为1≤zi≤K,q.n(zi)、q.o(zi)和q.m(zi)对应为更新前第zi类相关信息q(zi)中的三个组分,q.n(zi)′、q.o(zi)′和q.m(zi)′对应为更新后第zi类相关信息q(zi)中的三个组分,i为自然数且1≤i≤N,N为TAC的总数;
3.2完成步骤3.1中的计算后,若q.n(zi)′的值为0,则说明当前zi的值所对应的类中的元素数目为0,即该类中不含有任何元素,这时需要删除这个空的类,设当前zi的值为k,需要更新K、q.n、q.o、q.m及zi的值,具体更新方式为:
K′=K-1;
q.n′=删除了第k个元素的q.n
q.o′=删除了第k个元素的q.o
q.m′=删除了第k个元素的q.m
z′i=zi-1(若zi>k)
其中:K、q.n、q.o、q.m、zi对应更新前的信息,K′、q.n′、q.o′、q.m′、z′i对应更新后的信息,对于zi的更新需要遍历每一条TAC,即i为自然数且其取值从1到N,N为TAC的总数;
若完成步骤3.1中的计算后,q.n(zi)′的值不为0,则无需进行上述操作;
3.3然后通过以下关系式计算该TAC属于每一类别以及新类别的条件概率:
p1=log([q.n,α])
p 2 ( k ) = p 1 ( k ) - ( q . n ( k ) + 1 ) * d 2 * log ( π ) - d 2 * log ( ss 2 s 0 2 + 1 ) - ( v + 1 ) * Σ ( log ( d i a g ( c h o l 2 ( c h o l 1 ( c h o l ( ss 2 * I d * v ) , x ( i ) ) , x ( i ) ss 2 s 0 2 + 1 ) ) ) ) + q . n ( k ) * d 2 * log ( π ) + d 2 * log ( ss 2 s 0 2 )
+ v * Σ ( l o g ( d i a g ( c h o l 2 ( c h o l ( ss 2 * I d * v ) , O d , 1 ) ) ) )
p3=exp(p2-max(p2))
p=p3/sum(p3)
其中:x(i)为第i条TAC即当前TAC,d表示TAC的维度,p为第i条TAC属于每一类的条件概率组成的向量,即其中的元素p(k)表示第i条TAC属于第k类的条件概率,其中,p中的最后一个元素表示第i条TAC属于一个新的类的条件概率,k为类别编号且为自然数,1≤k≤K+1,α为聚集参数,s0和ss为类分离度相关参数,v是逆维希特协方差先验的自由度,q.n(k)即为第k类相关信息q(k)中的其中一个组分,Od,1是行数为d列数为1的零向量,chol(A)是Cholesky分解函数,如果矩阵A是对称正定的,则Cholesky分解将矩阵A分解成一个下三角矩阵和上三角矩阵的乘积,若用R来表示上三角矩阵,则下三角矩阵为其转置,即A=R’R,如果R=chol(A)是A的Cholesky因式,那么chol1(R,X)函数得到的结果是(A-X*X’)的Cholesky因式,chol2(R,X)函数得到的结果是(A+X’*X)的Cholesky因式,chol1(R,X)和chol2(R,X)函数都只使用R的对角及上三角元素,R的下三角元素均被忽略,diag(X)函数的作用是将X的对角线上的元素取出组成一个新的向量,上式中的求和符号∑是对括号内向量中的每个元素进行求和。
4.根据权利要求3所述的基于狄利克雷混合模型的TAC聚类方法,其特征在于:所述的步骤(4)中根据所述的条件概率对该TAC重新抽样选择类别,然后将其加回混合模型中并更新模型参数,具体过程如下:
4.1对步骤3.3中得到的p中的每个元素进行抽样,得到抽样结果,抽中p中第k个元素的条件概率即为p(k);
4.2若抽中的是p中最后一个元素,即第(K+1)个元素,则需构建一个新的类,具体操作方式如下:
K′=K+1;
q.n′=[q.n,0]
q.o′=[q.o,0]
q.m′=[q.m,0]
z′i=K′
其中,K、q.n、q.o、q.m对应更新前的信息,K′、q.n′、q.o′、q.m′对应更新后的信息;
若抽中的不是p中最后一个元素,则无需上述操作;
4.3然后将当前TAC加回混合模型中,这时需要再一次修改q的三个组分q.n、q.o、q.m的值,具体修改方式如下:
m m = Σ k = 1 M m ( k )
q.n(zi)′=q.n(zi)+1
q.o(zi)′=q.o(zi)+x(i)
q.m(zi)′=q.m(zi)+mm
其中:x(i)为第i条TAC即当前TAC,m为第i条TAC中不为0的所有元素组成的向量,m(k)为m中的第k个元素,M为该向量的维度,即当前TAC中不为0的所有元素的个数,mm即m为中所有元素的和,zi表示第i条TAC所属的类的值,其取值范围为1≤zi≤K,q.n(zi)、q.o(zi)和q.m(zi)对应为更新前第zi类的相关信息q(zi)中的三个组分,q.n(zi)′、q.o(zi)′和q.m(zi)′对应为更新后第zi类相关信息q(zi)中的三个组分,i为自然数且1≤i≤N,N为TAC的总数。
5.根据权利要求1所述的基于狄利克雷过程混合模型的TAC聚类方法,其特征在于:所述的步骤(1)中初始化类数K的取值范围为100~100000,聚集参数α的取值范围为0.001~10000,类分离度相关参数ss和s0的取值范围均为0.01~1000,逆维希特协方差先验的自由度v的取值范围为10~10000。
CN201510779512.7A 2015-11-13 2015-11-13 一种基于狄利克雷过程混合模型的tac聚类方法 Active CN105426911B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510779512.7A CN105426911B (zh) 2015-11-13 2015-11-13 一种基于狄利克雷过程混合模型的tac聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510779512.7A CN105426911B (zh) 2015-11-13 2015-11-13 一种基于狄利克雷过程混合模型的tac聚类方法

Publications (2)

Publication Number Publication Date
CN105426911A true CN105426911A (zh) 2016-03-23
CN105426911B CN105426911B (zh) 2018-12-25

Family

ID=55505109

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510779512.7A Active CN105426911B (zh) 2015-11-13 2015-11-13 一种基于狄利克雷过程混合模型的tac聚类方法

Country Status (1)

Country Link
CN (1) CN105426911B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446339A (zh) * 2016-08-29 2017-02-22 北京化工大学 基于狄利克雷混合模型的转动机械运行状态异常检测方法
CN109801073A (zh) * 2018-12-13 2019-05-24 中国平安财产保险股份有限公司 风险用户识别方法、装置、计算机设备及存储介质
CN113095542A (zh) * 2021-03-01 2021-07-09 华中科技大学 一种基于dpmm的光伏输出功率预测误差的拟合方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060083415A1 (en) * 2004-10-15 2006-04-20 Georges El Fakhri Factor analysis in medical imaging
CN1969295A (zh) * 2004-05-10 2007-05-23 皇家飞利浦电子股份有限公司 用于间隔分析的数据处理系统
CN101582080A (zh) * 2009-06-22 2009-11-18 浙江大学 一种基于图像和文本相关性挖掘的Web图像聚类方法
CN104484346A (zh) * 2014-11-28 2015-04-01 浙江大学 一种基于混合距离依赖中餐馆过程的层次化主题建模方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1969295A (zh) * 2004-05-10 2007-05-23 皇家飞利浦电子股份有限公司 用于间隔分析的数据处理系统
US20060083415A1 (en) * 2004-10-15 2006-04-20 Georges El Fakhri Factor analysis in medical imaging
CN101582080A (zh) * 2009-06-22 2009-11-18 浙江大学 一种基于图像和文本相关性挖掘的Web图像聚类方法
CN104484346A (zh) * 2014-11-28 2015-04-01 浙江大学 一种基于混合距离依赖中餐馆过程的层次化主题建模方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MIKA NAGANAWA .ETC: ""Extraction of a Plasma Time-Activity Curve From Dynamic Brain PET Images Based on Independent Component Analysis"", 《IEEE TRANSACTIONS ON BIOMEDICAL ENGINEERING》 *
ROSTOM MABROUK .ETC: ""Dynamic Cardiac PET Imaging: Extraction of Time-Activity Curves Using ICA and a Generalized Gaussian Distribution Model"", 《IEEE TRANSACTIONS ON BIOMEDICAL ENGINEERING》 *
S.D. WOLLENWEBER.ETC: ""A Simple On-Line Arterial Time-Activity Curve Detector for [O- 151 Water PET Studies"", 《IEEE TRANSACTIONS ON NUCLEAR SCIENCE》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446339A (zh) * 2016-08-29 2017-02-22 北京化工大学 基于狄利克雷混合模型的转动机械运行状态异常检测方法
CN106446339B (zh) * 2016-08-29 2019-04-30 北京化工大学 基于狄利克雷混合模型的转动机械运行状态异常检测方法
CN109801073A (zh) * 2018-12-13 2019-05-24 中国平安财产保险股份有限公司 风险用户识别方法、装置、计算机设备及存储介质
CN113095542A (zh) * 2021-03-01 2021-07-09 华中科技大学 一种基于dpmm的光伏输出功率预测误差的拟合方法和系统
CN113095542B (zh) * 2021-03-01 2023-11-14 华中科技大学 一种基于dpmm的光伏输出功率预测误差的拟合方法和系统

Also Published As

Publication number Publication date
CN105426911B (zh) 2018-12-25

Similar Documents

Publication Publication Date Title
Tompson et al. Accelerating eulerian fluid simulation with convolutional networks
Kleiner et al. The big data bootstrap
Nowozin et al. Decision tree fields
Li et al. Fast local image inpainting based on the Allen–Cahn model
US20210366168A1 (en) Pet image reconstruction method, computer storage medium, and computer device
US9665954B2 (en) Method for reconstructing PET image using GPU parallel computing
Klodt et al. A convex framework for image segmentation with moment constraints
CN104657950B (zh) 一种基于Poisson TV的动态PET图像重建方法
CN105938628A (zh) 源自图像的生物标志的直接计算
CN109993808B (zh) 一种基于dsn的动态双示踪pet重建方法
Liang et al. An EM approach to MAP solution of segmenting tissue mixtures: a numerical analysis
CN107346556A (zh) 一种基于块字典学习和稀疏表达的pet图像重建方法
Allassonniere et al. Convergent Stochastic Expectation Maximization algorithm with efficient sampling in high dimension. Application to deformable template model estimation
Yu et al. Modeling spatial extremes via ensemble-of-trees of pairwise copulas
CN105426911A (zh) 一种基于狄利克雷过程混合模型的tac聚类方法
Jouvet et al. Ice-flow model emulator based on physics-informed deep learning
CN107146263B (zh) 一种基于张量字典约束的动态pet图像重建方法
Xiang et al. Towards bi-directional skip connections in encoder-decoder architectures and beyond
Chen et al. A machine learning based solver for pressure Poisson equations
Li et al. MPMNet: A data-driven MPM framework for dynamic fluid-solid interaction
Zhang et al. Learning to estimate and refine fluid motion with physical dynamics
Wu et al. Image segmentation via Fischer-Burmeister total variation and thresholding
Tobon-Gomez et al. Automatic construction of 3D-ASM intensity models by simulating image acquisition: Application to myocardial gated SPECT studies
Li et al. Feature pre-inpainting enhanced transformer for video inpainting
CN104077798B (zh) 一种可形变物体的高真实感动画合成方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant