CN103336781A - 一种医学图像聚类方法 - Google Patents

一种医学图像聚类方法 Download PDF

Info

Publication number
CN103336781A
CN103336781A CN2013102097098A CN201310209709A CN103336781A CN 103336781 A CN103336781 A CN 103336781A CN 2013102097098 A CN2013102097098 A CN 2013102097098A CN 201310209709 A CN201310209709 A CN 201310209709A CN 103336781 A CN103336781 A CN 103336781A
Authority
CN
China
Prior art keywords
overbar
pixel
interval
cluster
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013102097098A
Other languages
English (en)
Other versions
CN103336781B (zh
Inventor
刘哲
宋余庆
刘毅
刘雅婧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu University
Original Assignee
Jiangsu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu University filed Critical Jiangsu University
Priority to CN201310209709.8A priority Critical patent/CN103336781B/zh
Publication of CN103336781A publication Critical patent/CN103336781A/zh
Application granted granted Critical
Publication of CN103336781B publication Critical patent/CN103336781B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及一种医学图像聚类方法,属于图像处理领域。本发明的方法基于下山算法,经图像预处理、提取图像特征、寻找密度吸引子、寻找山脚像素、分出布局图像等步骤实现。理论和实践证明,本发明妥善解决了山脊、平顶、单阈值问题,采用本发明的方法后,不仅可以高效完成医学图像的聚类,而且不丢失、不误导、不遗漏图像特征,因此可以获得高质量的医学聚类图像,满足医护人员的诊断阅读需求。

Description

一种医学图像聚类方法
技术领域
本发明涉及一种图像聚类方法,尤其是一种医学图像聚类方法,属于图像处理领域。 
背景技术
随着计算机断层扫描(Computed Tomography,CT)、核磁共振图像(Megnectic Resonance Imaging,MRI)等人体医学成像技术的迅速发展,医学图像在临床医学诊断中发挥着越来越重要的作用。 
聚类分析是数据挖掘的主要技术之一,是一种无监督的学习过程。它按照事物的某些属性,把事物聚集成类,使类内相似性尽量小,类间相似性尽量大。聚类分析已经广泛地医用在许多领域中,包括模式识别,数据分析,图像处理,以及市场研究。采用聚类分析对单幅图像中的目标物体进行分类,称为图像聚类。图像聚类是依据没有先验知识的图像内容的本身将给定的无类别标签的图像集合分为有含义的簇,从机器学习的角度来看是一种无指导的学习。 
图像聚类已成为图像识别的关键技术之一,运用聚类分析对医学图像中的物体进行分类,称为医学图像聚类。医学图像聚类的目的是得到医学图像中有意义的簇,为医学图像的分割、识别与挖掘奠定基础。常规聚类法只能适用于结构化的、小规模的、低维的数据集。 
对于医学图像聚类来说,被划分在同一个簇或者是类里的图像,不仅应该有相似的图像特征,还应该在医学领域知识上有相似的意义。准确地进行医学图像聚类,可以更好的在医务人员判断和诊断病情病因时提供科学参考,从而会大大减少因为人类本身视力分辨力不足或是医疗人员主观上临床经验不足产生的误诊率,进一步提高医学图像的利用率。对医学图像进行合理聚类还可以有效地管理庞大的图 像数据库,并随着网络技术的发展,能够和更多的同行共享这些有用的图片信息。 
现阶段,大体上的聚类算法可以分为如下几大类:(1)基于划分的方法。这种方法采用迭代重定位技术,将给定的n个对象划分为k个集合,每个集合就是一个簇,好的划分其结果一般满足同一簇的对象相互接近或相关,不同簇中的对象远离或无关。这种方法在小规模数据库中发现球状簇很管用,但是易于陷入局部最优,在发现形状复杂的簇和处理大规模的数据上有所限制。最著名的就是K-means方法和很多它的变种。(2)基于层次的方法。这种方法根据给定的数据之间的层次关系,将数据集合自底向上的凝聚或者自顶向下的分裂,形成簇。这种方法的缺陷在于一旦一个步骤完成了就不能返回,而且要求数据有层次关系。主要有AGENES算法和DLANA算法。(3)基于密度的方法。这种方法的聚类结果里,对确定簇中的每个核心数据对象,在给定的半径领域中将至少包含最少数目(MinPts)的点。这种聚类方法最大的优势是可以发现任意形状的簇。典型的基于密度的算法是DBSCAN。(4)基于模型的方法。这种方法试图将数据最佳拟合到某个数据模型上。这种方法经常基于这样的假设:数据根据潜在的混合概率分布,因此有一定的局限性。(5)基于网格的方法。基于网格的聚类方法将数据空间量化,分成数目有限的数据单元,这些单元就形成了网格结构,所有的聚类操作都在网格上进行,这种方法的主要优点是处理速度快,因为它的处理速度仅仅依赖于每一维上得单元数目,但是单元数目的不同会影响聚类结果的精度。(6)基于遗传理论的方法。其代表性的方法有模拟退火算法、粒子群算法、遗传算法和神经网络算法等等。 
归纳起来,上述现有技术未能充分考虑邻域信息、区间性质等特性,未能有效解决医学图像噪声数据偏态性及不含噪声医学图像数据 的对称性矛盾。 
发明内容
本发明的目的在于:针对上述现有技术存在的局限性,提出一种充分考虑邻域信息、区间性质等特性的医学图像聚类方法,从而有效解决医学图像噪声数据偏态性及不含噪声医学图像数据的对称性矛盾,显著提高抗噪能力,使聚类处理后的图像更接近于每个对象的客观、真实情况,为医疗诊断提供更为精准的图像依据。 
为了达到上述目的,本发明的医学图像聚类方法在计算机读入原始图像后,进行如下基本步骤: 
步骤A.根据图像各像素点与其周围邻域信息的关系获得各像素点的像素区间值,并以对应的像素区间值表示各像素点; 
其基本原理为:设一个图像的像素灰度集合为{xk,k=1,2,......N},用
Figure BDA00003264484300031
表示各个像素的区间值,则有
Figure BDA00003264484300032
其中,x k 为其邻域像素中的最小值,为其邻域像素中的最大值(邻域像素可以是4邻域,8邻域,12邻域或24邻域)。所以,图像的像素灰度区间集合可以表示为: ⊗ x k = [ x k ‾ , x k ‾ ] , k = 1,2 , . . . . . . N . 。当且仅当 x i ‾ = x j ‾ , x i ‾ = x j ‾ 时,有 ⊗ x i = ⊗ x j , 其中i,j∈k。 
步骤B.将每个像素点的像素区间值的左区间和右区间近似成上逼近和下逼近,计算出每个像素区间值的粗糙度; 
根据粗糙集原理,当某一个像素点
Figure BDA00003264484300037
Figure BDA00003264484300038
时,则说明此点与周围是一个区域,并不孤立,可以看成不是粗糙的。当
Figure BDA00003264484300039
时,可以将该点看成是粗糙的。此时可以定义其粗糙度为: 
ρ A ( x k ) = 1 - | x k ‾ | | x k ‾ | , k = 1,2 , . . . . . . N , 显然0≤ρA(xk)≤1。 
步骤C.根据步骤B求出的每个像素区间值的粗糙度绘制粗糙度分布曲线,并以所述分布曲线的波峰所对应的像素区间值作为聚类中心,以所述波峰的个数作为聚类数(C); 
步骤D.以对应的像素区间值计算各像素点(样本点)距各聚类中心的距离,将距某个聚类中心距离最近的各像素点(样本点)划分为一类,依次得到各像素区间所对应的聚类结果; 
根据Hausdorff距离求图像像素点的像素区间值距步骤C得到的聚类中心的距离。定义Hausdorff距离dH对于区间值数据的操作定义为: 
d H ⊗ ( ⊗ x , ⊗ y ) = max { | x ‾ - y ‾ | , | x ‾ - y ‾ | }
式中:
Figure BDA00003264484300042
Figure BDA00003264484300043
代表两个像素的区间值,
Figure BDA00003264484300044
Figure BDA00003264484300045
分别代表其左右区间值。 
步骤E.根据步骤D的聚类结果,分别求取各类域中像素区间值的平均值即均值向量,作为取代各类原聚类中心的新聚类中心; 
即新的聚类中心值为求各聚类域中所包含样本的均值向量,均值向量根据下式求出: 
Figure BDA00003264484300046
其中n为属于某一类的像素点个数,xi为第i个像素点的区间值,故
Figure BDA00003264484300047
表示区间xi的左区间,表示区间xi的右区间; 
步骤F.选定聚类结果,输出聚类图像。 
为了使聚类结果更加准确,步骤E和步骤F之间还具有: 
步骤E’.以下式求取目标函数J,并判断目标函数是否收敛;若判断为收敛,则进行步骤G;若判断为不收敛,则返回到步骤D: 
目标函数 J = | J 1 - J 2 | , 其中: 
J 1 = Σ C = 1 C Σ i = 1 Nc | | [ x i ‾ , x i ‾ ] - [ m c ‾ , m c ‾ ] | | 2
J 2 = Σ C = 1 C Σ i = 1 Nc | [ x i ‾ , x i ‾ ] ∩ [ m c ‾ , m c ‾ ] | | [ x i ‾ , x i ‾ ] ∪ [ m c ‾ , m c ‾ ] |
以上式中:C为聚类个数、Nc为属于C类的像素点总和、i为第i个像素点、mc是聚类中心的区间值,故m c 表示区间mc的左区间,
Figure BDA00003264484300054
表示区间mc的右区间;xi为第i个像素点的区间值,故x i 表示区间xi的左区间,表示区间xi的右区间。 
J2与区间相似度的概念相关,所述相似度用来反映两个区间的相似程度,作为目标函数的一部分,这样使聚类结果更加准确。两个区间
Figure BDA00003264484300057
的相似度定义为: 
a xy k = | [ x ‾ , x ‾ ] ∩ [ y ‾ , y ‾ ] | | [ x ‾ , x ‾ ] ∪ [ y ‾ , y ‾ ] |
其中, ⊗ x ∪ ⊗ y = [ min ( x ‾ , y ‾ ) , max ( x ‾ , y ‾ ) ]
⊗ x ∩ ⊗ y = [ x ‾ , x ‾ ] if ⊗ x → ⊗ y [ y ‾ , y ‾ ] if ⊗ y → ⊗ x [ x ‾ , y ‾ ] if x ‾ → ⊗ yand y ‾ → ⊗ x [ y ‾ , x ‾ ] if y ‾ → ⊗ xand x ‾ → ⊗ y φ otherwise
“→”表示
Figure BDA000032644843000511
Figure BDA000032644843000512
包含,其定义为:当且仅当 x ‾ ≥ y ‾ , x ‾ ≤ y ‾ 时。明显有axy k在[0,1]内。 
以上判断目标函数J是否收敛,可以根据判断|Jn+1-Jn|≤ε是否成立,如是则收敛,如否判为不收敛。ε小于等于0.01。Jn为第n次迭代时的目标函数。 
本发明的医学图像聚类方法针对一般聚类方法对初始值的选择较敏感,易陷入局部最小值等制约聚类效果的问题,基于粗糙集理论,在初值的选取上将每个像素区间为上下近似值,计算其粗糙度 并绘制曲线分布图,来选取聚类中心,充分考虑了邻域信息、区间的性质等特性,可以针对噪声较大的医学图像进行有效地聚类,其准确率更高,抗噪声能力显著增强,能够保留真实的图像信息,对医学图像的聚类具有重要现实意义和应用价值。 
附图说明
图1为本发明一个实施例的流程图。 
图2a和b分别为图1实施例的原图和聚类结果图。 
具体实施方式
下面主要结合附图和具体实施例对医学图像聚类方法作进一步的说明。 
本实施例选取脑MRI图来进行分析,选取原始含有噪声点的脑MRI图3a来说明本发明实施后的相应结果,具体步骤如下: 
A.计算机读入脑MRI图的原始图像,通过图像像素点与其周围8邻域信息的关系获得图像像素点的区间值,用区间值 
Figure BDA00003264484300061
把图像的每个像素点用表示出来。 
B.根据粗糙集原理,将每个像素点区间值的左区间x N 和右区间 
Figure BDA00003264484300063
近似成上逼近和下逼近,计算每个区间值的粗糙度ρA(xk)。 
C.根据B求出的粗糙度绘制粗糙度分布曲线,得到的波峰所对应的区间值即为初始聚类中心,个数即为聚类数C。 
本实施例得到的初始聚类数为三类,初始聚类中心分别为[13,82],[63,183],[120,146]。 
D.根据Hausdorff距离公式: d H ⊗ ( ⊗ x , ⊗ y ) = max { | x ‾ - y ‾ | , | x ‾ - y ‾ | } 计算样本点距各聚类中心的距离。 
依次计算每个像素点与聚类中心的距离,离像素中心最近的划分为一类,这样得到初始聚类图像。 
E.根据上述的聚类结果,用重新分别计算各个聚类中心新的向量值更新聚类中心。 
F.计算目标函数J,判断当目标函数时候收敛:若收敛,则选定聚类结果,输出聚类图像,聚类结束。若不收敛,则重复步骤D、E、F,知道目标函数收敛。 
目标函数J=|J1-J2|,其中J1定义为: 
J 1 = Σ C = 1 C Σ i = 1 Nc | | [ x i ‾ , x i ‾ ] - [ m c ‾ , m c ‾ ] | | 2
J2定义为: 
J 2 = Σ C = 1 C Σ i = 1 Nc | [ x i ‾ , x i ‾ ] ∩ [ m c ‾ , m c ‾ ] | | [ x i ‾ , x i ‾ ] ∪ [ m c ‾ , m c ‾ ] |
上述实验迭代10次,获取最终的聚类中心为[11,74],[34,138],[99,99],输出最终聚类结果。 
由此可见,本发明针对一般聚类方法对初始值的选择较敏感,易陷入局部最小值等制约聚类效果的问题,基于粗糙集理论,在初值的选取上将每个像素区间为上下近似值,计算其粗糙度并绘制曲线分布图,来选取聚类中心结合4邻域、8邻域等像素来计算其区间值,用以表示各个对象的属性值,可以更接近于每个对象的客观、真实情况,运用Hausdorff距离表示区间值的邻域距离。通过上述实施例证明切实可行。 

Claims (3)

1.一种医学图像聚类方法,在计算机读入原始图像后,进行如下基本步骤:
步骤A.根据图像各像素点与其周围邻域信息的关系获得各像素点的像素区间值,并以对应的像素区间值表示各像素点;
步骤B.将每个像素点的像素区间值的左区间和右区间近似成上逼近和下逼近,计算出每个像素区间值的粗糙度;
步骤C.根据步骤B求出的每个像素区间值的粗糙度绘制粗糙度分布曲线,并以所述分布曲线的波峰所对应的像素区间值作为聚类中心,以所述波峰的个数作为聚类数;
步骤D.以对应的像素区间值计算各像素点距各聚类中心的距离,将距某个聚类中心距离最近的各像素点(样本点)划分为一类,依次得到各像素区间所对应的聚类结果;
步骤E.根据步骤D的聚类结果,分别求取各类域中像素区间值的平均值即均值向量,作为取代各类原聚类中心的新聚类中心;
即新的聚类中心值为求各聚类域中所包含样本的均值向量,均值向量根据下式求出:
Figure FDA00003264484200011
式中n为属于某一类的像素点个数,xi为第i个像素点的区间值,故x i 表示区间xi的左区间,
Figure FDA00003264484200013
表示区间xi的右区间;
步骤F.选定聚类结果,输出聚类图像。
2.根据权利要求1所述的医学图像聚类方法,其特征在于:所述步骤E和步骤F之间还具有以下步骤:
以下式求取目标函数J,并判断目标函数是否收敛;若判断为收敛,则进行步骤G;若判断为不收敛,则返回到步骤D:
目标函数J=|J1-J2|,其中:
J 1 = Σ C = 1 C Σ i = 1 Nc | | [ x i ‾ , x i ‾ ] - [ m c ‾ , m c ‾ ] | | 2
J 2 = Σ C = 1 C Σ i = 1 Nc | [ x i ‾ , x i ‾ ] ∩ [ m c ‾ , m c ‾ ] | | [ x i ‾ , x i ‾ ] ∪ [ m c ‾ , m c ‾ ] |
以上式中:C为聚类个数、Nc为属于C类的像素点总和、i为第i个像素点、mc是聚类中心的区间值,故m c 表示区间mc的左区间,
Figure FDA00003264484200024
表示区间mc的右区间;xi为第i个像素点的区间值,故x i 表示区间xi的左区间,
Figure FDA00003264484200026
表示区间xi的右区间。
3.根据权利要求2所述的医学图像聚类方法,其特征在于:所述判断目标函数J是否收敛,根据判断|Jn+1-Jn|≤ε是否成立,如是则判为收敛,如否判为不收敛,其中Jn为第n次迭代时的目标函数,ε小于等于0.01。
CN201310209709.8A 2013-05-29 2013-05-29 一种医学图像聚类方法 Expired - Fee Related CN103336781B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310209709.8A CN103336781B (zh) 2013-05-29 2013-05-29 一种医学图像聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310209709.8A CN103336781B (zh) 2013-05-29 2013-05-29 一种医学图像聚类方法

Publications (2)

Publication Number Publication Date
CN103336781A true CN103336781A (zh) 2013-10-02
CN103336781B CN103336781B (zh) 2016-06-08

Family

ID=49244946

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310209709.8A Expired - Fee Related CN103336781B (zh) 2013-05-29 2013-05-29 一种医学图像聚类方法

Country Status (1)

Country Link
CN (1) CN103336781B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977952A (zh) * 2016-10-21 2018-05-01 冯原 医学图像分割方法及装置
CN109800766A (zh) * 2018-12-11 2019-05-24 湖北工业大学 一种基于凝聚层次树的快速迭代重建方法
CN110083475A (zh) * 2019-04-23 2019-08-02 新华三信息安全技术有限公司 一种异常数据的检测方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101976438A (zh) * 2010-10-27 2011-02-16 西安电子科技大学 基于空间邻域信息的fcm纹理图像分割方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101976438A (zh) * 2010-10-27 2011-02-16 西安电子科技大学 基于空间邻域信息的fcm纹理图像分割方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
余锦华等: "基于空间邻域信息的二维模糊聚类图像分割", 《光电工程》 *
姚刚等: "一种利用像素邻域信息的模糊聚类图像分割算法", 《计算机安全》 *
孟丽敏等: "基于空间邻域加权的模糊C_均值聚类及其应用研究", 《计算机应用研究》 *
梁旭东等: "基于邻域特征与聚类的图像分割方法", 《计算机工程》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977952A (zh) * 2016-10-21 2018-05-01 冯原 医学图像分割方法及装置
CN109800766A (zh) * 2018-12-11 2019-05-24 湖北工业大学 一种基于凝聚层次树的快速迭代重建方法
CN110083475A (zh) * 2019-04-23 2019-08-02 新华三信息安全技术有限公司 一种异常数据的检测方法及装置
CN110083475B (zh) * 2019-04-23 2022-10-25 新华三信息安全技术有限公司 一种异常数据的检测方法及装置

Also Published As

Publication number Publication date
CN103336781B (zh) 2016-06-08

Similar Documents

Publication Publication Date Title
Wang et al. A multi-view deep convolutional neural networks for lung nodule segmentation
Xu et al. Efficient multiple organ localization in CT image using 3D region proposal network
Liu et al. Periodicity, directionality, and randomness: Wold features for image modeling and retrieval
JP5167442B2 (ja) 画像識別装置およびプログラム
CN110163258A (zh) 一种基于语义属性注意力重分配机制的零样本学习方法及系统
CN104021255B (zh) Cad模型的多分辨率层次表示及层次匹配加权比较方法
CN101477529B (zh) 一种三维对象的检索方法和装置
CN105243139A (zh) 一种基于深度学习的三维模型检索方法及其检索装置
CN109902736A (zh) 一种基于自动编码器构建特征表示的肺结节图像分类方法
Galvanin et al. Extraction of building roof contours from LiDAR data using a Markov-random-field-based approach
CN106971197A (zh) 基于差异性与一致性约束的多视数据的子空间聚类方法
CN109492796A (zh) 一种城市空间形态自动分区方法与系统
CN101699515B (zh) 基于多精英免疫量子聚类的医学影像分割系统及分割方法
CN104751463B (zh) 一种基于草图轮廓特征的三维模型最佳视角选取方法
CN105389821A (zh) 一种基于云模型和图割相结合的医学图像分割方法
CN110349159A (zh) 基于权重能量自适应分布的三维形状分割方法及系统
Li et al. An over-segmentation-based uphill clustering method for individual trees extraction in urban street areas from MLS data
Liu et al. A novel rock-mass point cloud registration method based on feature line extraction and feature point matching
CN115496720A (zh) 基于ViT机制模型的胃肠癌病理图像分割方法及相关设备
CN114494199A (zh) 一种基于深度学习的肝脏ct肿瘤分割与分类的方法
CN115713605A (zh) 一种基于图像学习的商业类建筑群自动建模方法
CN106022359A (zh) 基于有序信息熵的模糊熵空间聚类分析方法
CN103336781A (zh) 一种医学图像聚类方法
CN102609721B (zh) 遥感影像的聚类方法
Yu Accurate recognition method of human body movement blurred image gait features using graph neural network

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160608

Termination date: 20180529

CF01 Termination of patent right due to non-payment of annual fee