CN111310787B - 一种基于堆叠编码器的脑功能网络多核模糊聚类方法 - Google Patents

一种基于堆叠编码器的脑功能网络多核模糊聚类方法 Download PDF

Info

Publication number
CN111310787B
CN111310787B CN202010041770.6A CN202010041770A CN111310787B CN 111310787 B CN111310787 B CN 111310787B CN 202010041770 A CN202010041770 A CN 202010041770A CN 111310787 B CN111310787 B CN 111310787B
Authority
CN
China
Prior art keywords
membership
matrix
kernel
layer
core
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010041770.6A
Other languages
English (en)
Other versions
CN111310787A (zh
Inventor
刘赛雄
陆虎
姚棋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu University
Original Assignee
Jiangsu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu University filed Critical Jiangsu University
Priority to CN202010041770.6A priority Critical patent/CN111310787B/zh
Publication of CN111310787A publication Critical patent/CN111310787A/zh
Application granted granted Critical
Publication of CN111310787B publication Critical patent/CN111310787B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • G06F18/2193Validation; Performance evaluation; Active pattern learning techniques based on specific statistical tests
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)

Abstract

本发明公开了一种基于堆叠编码器的脑功能网络多核模糊聚类方法,通过改进多核模糊聚类方法,使其具备降维的能力,并将其应用在脑部的静息态功能核磁共振图像预处理后功能网络上。实现如下:1.对功能网络用堆叠自编码器降维,得到中间多层隐藏层。2.把多层隐藏层作为基本特征,分别对其进行多核映射到高维特征空间。3.通过对每层隐藏层的加权的核函数,用拉格朗日定理解决加权的约束问题,直到选取最优核函数,和收敛的隶属度矩阵,从而得到聚类结果。理论和实践证明,该算法比传统的算法具有更高的聚类精度,又能一定程度解决了医学图像中脑网络数据维度高,处理难度大的问题。

Description

一种基于堆叠编码器的脑功能网络多核模糊聚类方法
技术领域
本发明所属的技术领域为医学图像处理分析领域,具体为一种基于堆叠编码器的脑功能网络多核模糊聚类方法。
背景技术
功能磁共振成像是一种神经成像技术,它通过收集关于脑组织的氧消耗的信息来识别脑激活区域,以捕获大脑内的代谢功能。另一方面,结构磁共振成像也用于检查大脑的解剖和病理学。迄今大多数专家、学者所做的工作是基于从核磁共振成像数据得到的特征,而不是组合结构磁共振成像数据的特征。而Liang等人提出的功能网络性假说更直接支持自静息状态的功能核磁共振图像研究。医学专家通过功能磁共振成像比较大脑激活模式与正常受试者来鉴别脑部异常。
基于Tzourio Mazoye等人的自动解剖标记图谱,脑部功能核磁共振图像可以分成90个区域。每两个脑区域的平均时间序列可用于计算作为脑网络连接的皮尔森相关系(Khazaee等人),从而得到脑的连接矩阵。然而,一个人得到一行向量用来训练的话,90个区域所得的连接矩阵将会达到8100维度。因为90×90的特征矩阵高度对称,除去重复的特征部分,也将达到4005(90×89/2)维。为了数据能够得到最好的表达,和减小后续分析的时间效率,需要给数据降维。
自动编码器是深度学习中一种重要的训练模型,在自然语言处理中取得较好的效果,也越来越受到研究人员的重视。自早期Hinton的自编码器后,研究者开始关注各种自编码器模型相应的堆叠编码器。堆叠编码器是深度学习领域常用的一个深度学习模型,由多个自动编码器串联堆叠构成。堆叠多层自动编码器的目的是为了逐层提取输入数据的高阶特征,在此过程中逐层降低输入数据的维度,将一个复杂的输入数据转化成了一个系列简单的高阶的特征。相比自编码器而言,更具鲁棒性和稀疏特性,能降低训练多层编码器的运行时间。
模糊均值聚类是目前使用最广泛的模糊聚类方法之一。在大多数情况下,它比相应的硬聚类算法更灵活。随后为了能更好的模拟一般星团,基于内核的聚类已经被提出,它在嵌入相应内核函数的典型高维特征空间中执行聚类。但脑网络数据高维度,少特征的特性,一般的多核模糊聚类方法的聚类效果不佳。
发明内容
本发明针对现有的公开的静息态功能核磁共振图像数据集预处理后脑网络维度太大的原因,使用传统的聚类方法如k均值,模糊聚类(FCM),谱聚类,亲和谱聚类(AASC),多核模糊聚类(MKFC)等方法,聚类难度大且聚类精度不高的问题,提出了一种堆叠编码器的脑功能网络多核模糊聚类方法,以提高聚类效果。
本发明在于使用静息态功能核磁共振图像预处理后功能网络,并且在堆叠编码器将数据降维后的多层特征融合到多核模糊聚类中,得到一个新的基于堆叠编码器的多核模糊聚类算法。该算法对脑功能网络进行聚类,该算法的每个过程包含若干个步骤,分别描述如下:
A.对功能网络用堆叠编码器降维,得到中间多层隐藏层,即降维后的多层特征。
本步骤设计的为堆叠编码器模型的编码部分,由,输入层,隐藏层,输出组成:输入层为多个人的功能网络m×n,m行向量为m人的数据,n列为特征。训练一个普通的两层的自动编码器,x为输入层。输出y1,y2,即编码完成后维度降低的数据。
B.把多层隐藏层作为基本特征,构造出核相似度矩阵。
把多层隐藏层作为基本特征,分别对其进行美式核映射到高维特征空间,其中核函数主要选取了高斯核和多项式核,构造了十个核函数,这里每层隐藏层都对应了十个核函数。
C.通过目标函数多次计算隶属度矩阵u和多层隐藏层的核权重ω,直到u收敛。
该目标式主要为最小化样本y到聚类中心v的距离,vc为第c个聚类中心。N为样本y的个数,C为种群数。为综合核函数,且/>其中l为堆叠编码器的隐藏层的总层数,s=1,2…l,h为核的个数,r=1,2…h,/>是核映射。所述隶属度u是个体隶属于种群的隶属度,ω是核权重,ωs,r中l为隐藏层的层数,s=1,2..l。h为核函数的个数,r=1...h。本发明中l=2,h=10。
其中隶属度u和ω均是通过拉格朗日定理优化的。在每一次迭代过程中:根据由拉格朗日定理求得的隶属度矩阵更新第t次迭代时的隶属度矩阵ut。其中是样本y映射到核后与聚类中心的距离,m为隶属度,设置为1.08。
D.根据最后的隶属度矩阵得到聚类结果
当‖ut-ut-1‖<0.001或迭代次数超过200次时,结束聚类。此时便可通过隶属度矩阵u求得最后的聚类结果。
本发明的有益效果:
1、本发明所提出的基于堆叠编码器的多核模糊聚类算法,它能在降低数据维度的同时,并且找到最佳的隶属度和一组核的非负组合的最优核权重,特征权重计算嵌入到聚类过程中。编码器多层隐藏层的多个内核的组合和内核权重的自动调整,使得基于堆叠编码器的多核模糊聚类算法性能更好。
2、本发明提出了一个基于堆叠编码器,能降维的多核模糊聚类算法,通过对将核磁共振成像预处理后的功能连通矩阵,使用堆堆编码器进行提取特征,并将编码器的多层隐藏层与多核模糊聚类通过新的目标函数融合在一起,使其能通过核矩阵的优化和隶属度矩阵的更新完成聚类。
3、本发明在面对脑网络数据维度高、处理时间花销大的问题有着显著的效果。本算法能在降低数据维度的同时,并且找到降维后不同维度的数据的最佳的隶属度和一组核的非负组合的最优核权重,并达到较好的聚类结果。提出的方法比传统的聚类算法具有更高的精度。
附图说明
图1为本发明基于堆叠编码器的多核模糊方法在脑功能网络数据上的聚类流程示意图。
具体实施方式
下面结合附图对本发明作进一步说明。
图1展示了使用本发明的从原始的静息态功能核磁共振图像数据预处理,到堆叠编码器训练并聚类的实施流程图。本实例在静息态功能核磁共振图像预处理后的功能网络上应用改进的堆叠编码器的多核模糊聚类模型。具体步骤如下:
(1)对功能网络用堆叠编码器降维。
本步骤设计的为堆叠编码器模型的编码部分,由输入层,隐藏层,输出组成:输入层为多个人的功能网络m×n,m行向量为m人的数据,n列为特征。训练一个的两层的堆叠编码器,保留它的权重a,其中y=ax+b,a为权重,b为偏置,x为输入层。隐藏层选取两层,其分别选取原来维度的0.6,0.7或0.8倍,选取情况与医学数据相关。输出y1,y2,即编码后降维的数据。
(2)把多层隐藏层作为基本特征,分别对其进行美式核映射到高维特征空间,构造出核相似度矩阵,包括六个高斯核核相似度矩阵和四个多项式核核相似度矩阵。其中核函数主要选取了高斯核和多项式核,构造了十个核函数,这里十个核函数为每层隐藏层对应的核函数,而核相似度矩阵Kij构建如下:
六个高斯核核相似度矩阵由Kij(yi,yj)=exp(-(yi.yj)T(yi.yi)/2t2)构成,yi,yj指代同一隐藏层中不同的神经元,其中参数t=t0*D0,D0是yi,yj之间的最大距离,t0={0.05,0.1,1,10,50,100}。
四个多项式核核相似度矩阵:其中a取{0,1},b取{2,4}。
进行具体的核映射后,将为下一步求解隶属度矩阵,聚类中心等做好铺垫。
(3)选定聚类初始化参数
选定聚类数C,聚类数根据脑部异常的种类数决定。模糊度m为u的指数,是一个常数值,设为1.08。隶属度矩阵u是每个样本隶属于集群的概率,且和为1。在迭代开始前,首先需随机初始化聚类中心和隶属度矩阵。
(4)建立基于堆叠编码器的多核模糊聚类算法的聚类目标公式,如公式(1)所示,通过最小化样本y到聚类中心v的距离,以求得聚类结果。
其中N为样本y的个数,C为种群数。为综合核函数,且其中l为叠堆编码器的隐藏层的总层数,s=1,2…l,h为核的个数,r=1,2…h,/>是核映射,且/>其中。所述隶属度u是个体隶属于种群的隶属度,ω是核权重,ωs,r中l为隐藏层的层数,s=1,2..l.h为核函数的个数,r=1...h。本发明中l=2,h=10。需满足/>且ωs,r≥0,/>r。u为隶属度矩阵,uic指代第i个数据隶属于第c个聚类中心的隶属度矩阵,m为隶属度,这里是1.08。
隶属度u和ω均是通过拉格朗日定理优化的。在每一次迭代过程中:根据拉格朗日定理分别先后求得的隶属度矩阵和核系数矩阵并且更新第t次迭代时的隶属度矩阵ut和ωs,r。其中K是本发明设置的核,/>是所求第i个样本属于第c类的隶属值,m为隶属度,t指当前迭代的次数。
(5)根据最后的隶属度矩阵得到聚类结果
在每次迭代中,当‖ut-ut-1‖<0.001或迭代次数超过200次时,结束聚类。此时便可通过隶属度矩阵u的大小对该类的隶属度值进行类别排序,便能得到聚类后的标签。
如表1所示,本发明给出了在一组标准数据集AD脑网络数据的仿真结果。
表1:公开的AD数据集脑网络上与相关对比算法的实验结果
由表1仿真结果可以得出,从聚类算法的常见三个度量标准准确度(Accuracy),F值(Fmeasure),归一化信息(NMI)的值可以看出,本发明提出的方法性能高于几种常见的传统聚类算法(K-均值聚类算法Kmeans,模糊C-均值算法FCM和多核模糊C-均值算法MKFC)。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。

Claims (3)

1.一种基于堆叠编码器的脑功能网络多核模糊聚类方法,其特征在于,对核磁共振成像预处理后的功能连通矩阵,使用堆堆编码器进行提取特征,并将编码器的多层隐藏层与多核模糊聚类通过新的目标函数融合在一起,使核磁共振成像预处理后的图像能通过核矩阵的优化和隶属度矩阵的更新完成聚类,包括如下步骤:
(1)对功能网络用堆叠编码器降维,得到中间多层隐藏层,即降维后的多层特征;
(2)把多层隐藏层作为基本特征,分别对其进行美式核映射到高维特征空间,构造出核相似度矩阵;构造核相似度矩阵的方法为:把多层隐藏层作为基本特征,分别对其进行美式核映射到高维特征空间,包括六个高斯核核相似度矩阵和四个多项式核核相似度矩阵;其中核函数选取高斯核和多项式核,构造十个核函数,每层隐藏层都对应十个核函数;
六个高斯核核相似度矩阵由Kij(yi,yj)=exp(-(yi.yj)T(yi.yi)/2t2)构成,其中参数t=t0*D0,D0是样本xi之间的最大距离,t0={0.05,0.1,1,10,50,100};yi,yj指代同一隐藏层中不同的神经元;
四个多项式核核相似度矩阵:其中a取{0,1},b取{2,4};
(3)建立基于堆叠编码器的多核模糊聚类算法的聚类目标函数,并通过目标函数多次计算隶属度矩阵u和多层隐藏层的核权重ω,直到u收敛;
目标函数设计为:
该目标函数为最小化样本y到聚类中心v的距离;其中N为样本y的个数,C为种群数,为综合核函数,且/>l为叠堆编码器的隐藏层的总层数,s=1,2…l,h为核的个数,r=1,2…h,/>是核映射,且/>其中,所述隶属度u是个体隶属于种群的隶属度,ω是核权重,ωs,r中l为隐藏层的层数,s=1,2..l.h为核函数的个数,r=1...h,l=2,h=10,需满足/>且/>
隶属度u和ω均是通过拉格朗日定理优化得到;具体优化方法为:在每一次迭代过程中:根据拉格朗日定理分别先后求得的隶属度矩阵和核系数矩阵并且更新第t次迭代时的隶属度矩阵ut和ωs,r;在每次迭代中,当‖ut-ut-1‖<0.001或迭代次数超过200次时,结束聚类;
其中K是设置的核,/>是第i个样本属于第c类的隶属值,t指当前迭代的次数;
(4)根据最后的隶属度矩阵得到大脑核磁共振图像的聚类结果。
2.根据权利要求1所述的一种基于堆叠编码器的脑功能网络多核模糊聚类方法,其特征在于,所述堆叠编码器包括:由输入层,隐藏层,输出三个部分:(1)输入层:输入层为多个人的功能网络m×n,m行向量为m人的数据,n列为特征;(2)隐藏层:隐藏层选取两层,其分别选取原来维度的0.6,0.7或0.8倍;(3)输出:输出y1,y2,即编码后不同维度的数据。
3.根据权利要求1所述的一种基于堆叠编码器的脑功能网络多核模糊聚类方法,其特征在于,根据隶属度矩阵u求得最后的聚类结果的具体方法为:通过隶属度矩阵u的大小对该类的隶属度值进行类别排序,便能得到聚类后的标签。
CN202010041770.6A 2020-01-15 2020-01-15 一种基于堆叠编码器的脑功能网络多核模糊聚类方法 Active CN111310787B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010041770.6A CN111310787B (zh) 2020-01-15 2020-01-15 一种基于堆叠编码器的脑功能网络多核模糊聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010041770.6A CN111310787B (zh) 2020-01-15 2020-01-15 一种基于堆叠编码器的脑功能网络多核模糊聚类方法

Publications (2)

Publication Number Publication Date
CN111310787A CN111310787A (zh) 2020-06-19
CN111310787B true CN111310787B (zh) 2024-03-22

Family

ID=71160216

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010041770.6A Active CN111310787B (zh) 2020-01-15 2020-01-15 一种基于堆叠编码器的脑功能网络多核模糊聚类方法

Country Status (1)

Country Link
CN (1) CN111310787B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220051102A1 (en) * 2020-08-14 2022-02-17 Tencent America LLC Method and apparatus for multi-rate neural image compression with stackable nested model structures and micro-structured weight unification
CN112270355B (zh) * 2020-10-28 2023-12-05 长沙理工大学 基于大数据技术与sae-gru的主动安全预测方法
CN113591983B (zh) * 2021-07-30 2024-03-19 金地(集团)股份有限公司 图像识别方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106780485A (zh) * 2017-01-12 2017-05-31 西安电子科技大学 基于超像素分割和特征学习的sar图像变化检测方法
CN107247969A (zh) * 2017-06-02 2017-10-13 常州工学院 基于Gauss诱导核的模糊c均值聚类算法
CN110503187A (zh) * 2019-07-26 2019-11-26 江苏大学 一种用于功能核磁共振成像数据生成的生成对抗网络模型的实现方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11074495B2 (en) * 2013-02-28 2021-07-27 Z Advanced Computing, Inc. (Zac) System and method for extremely efficient image and pattern recognition and artificial intelligence platform

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106780485A (zh) * 2017-01-12 2017-05-31 西安电子科技大学 基于超像素分割和特征学习的sar图像变化检测方法
CN107247969A (zh) * 2017-06-02 2017-10-13 常州工学院 基于Gauss诱导核的模糊c均值聚类算法
CN110503187A (zh) * 2019-07-26 2019-11-26 江苏大学 一种用于功能核磁共振成像数据生成的生成对抗网络模型的实现方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Multi-kernel fuzzy clustering based on auto-encoder for fMRI functional network;Saixiong Liu;《Expert Systems with Applications》;20201231;全文 *
基于堆叠稀疏自编码的模糊C-均值聚类算法;段宝彬;《计算机工程与应用》;20151231;全文 *

Also Published As

Publication number Publication date
CN111310787A (zh) 2020-06-19

Similar Documents

Publication Publication Date Title
CN109165566B (zh) 一种基于新型损失函数的人脸识别卷积神经网络训练方法
CN111310787B (zh) 一种基于堆叠编码器的脑功能网络多核模糊聚类方法
CN110443143B (zh) 多分支卷积神经网络融合的遥感图像场景分类方法
CN108830296B (zh) 一种改进的基于深度学习的高分遥感影像分类方法
CN110739070A (zh) 一种基于3d卷积神经网络的脑疾病诊断方法
CN109344731B (zh) 基于神经网络的轻量级的人脸识别方法
CN112488205B (zh) 基于优化kpca算法的神经网络图像分类识别方法
CN108304826A (zh) 基于卷积神经网络的人脸表情识别方法
CN110659665B (zh) 一种异维特征的模型构建方法及图像识别方法、装置
CN107480702B (zh) 面向hcc病理图像识别的特征选择与特征融合方法
CN107122712B (zh) 基于cnn和双向vlad的掌纹图像识别方法
CN111738363B (zh) 基于改进的3d cnn网络的阿尔茨海默病分类方法
CN109902714B (zh) 一种基于多图正则化深度哈希的多模态医学图像检索方法
CN111738303B (zh) 一种基于层次学习的长尾分布图像识别方法
CN112733866A (zh) 一种提高可控图像文本描述正确性的网络构建方法
WO2022127500A1 (zh) 基于多个神经网络的mri图像分割方法、装置及设备
CN112529063B (zh) 一种适用于帕金森语音数据集的深度域适应分类方法
Li et al. Dating ancient paintings of Mogao Grottoes using deeply learnt visual codes
CN109948662B (zh) 一种基于K-means和MMD的人脸图像深度聚类方法
CN109740669B (zh) 一种基于深度特征聚合的乳腺癌病理图像分类方法
CN117195027A (zh) 基于成员选择的簇加权聚类集成方法
CN110210562B (zh) 基于深度网络和稀疏Fisher矢量的图像分类方法
CN116797817A (zh) 基于自监督图卷积模型的自闭症疾病预测技术
CN116563624A (zh) 一种基于多任务学习的肺结节分类方法
CN113095295B (zh) 一种基于改进关键帧提取的跌倒检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Lu Hu

Inventor after: Liu Saixiong

Inventor after: Yao Qi

Inventor before: Liu Saixiong

Inventor before: Lu Hu

Inventor before: Yao Qi

CB03 Change of inventor or designer information