CN105512670A - 基于keca特征降维和聚类的hrct周围神经分割 - Google Patents
基于keca特征降维和聚类的hrct周围神经分割 Download PDFInfo
- Publication number
- CN105512670A CN105512670A CN201510741859.2A CN201510741859A CN105512670A CN 105512670 A CN105512670 A CN 105512670A CN 201510741859 A CN201510741859 A CN 201510741859A CN 105512670 A CN105512670 A CN 105512670A
- Authority
- CN
- China
- Prior art keywords
- keca
- image
- data
- clustering
- hrct
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000009467 reduction Effects 0.000 title claims abstract description 78
- 210000000578 peripheral nerve Anatomy 0.000 title claims abstract description 25
- 238000011994 high resolution computer tomography Methods 0.000 title claims abstract 15
- 238000000034 method Methods 0.000 claims abstract description 65
- 230000011218 segmentation Effects 0.000 claims abstract description 41
- 238000009826 distribution Methods 0.000 claims abstract description 32
- 238000005070 sampling Methods 0.000 claims abstract description 23
- 238000004458 analytical method Methods 0.000 claims abstract description 19
- 238000001228 spectrum Methods 0.000 claims abstract description 6
- 238000006243 chemical reaction Methods 0.000 claims abstract description 5
- 230000002708 enhancing effect Effects 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 25
- 239000013598 vector Substances 0.000 claims description 20
- 239000011159 matrix material Substances 0.000 claims description 16
- 238000013507 mapping Methods 0.000 claims description 15
- 230000009466 transformation Effects 0.000 claims description 15
- 230000003595 spectral effect Effects 0.000 claims description 14
- 238000000354 decomposition reaction Methods 0.000 claims description 11
- 239000000203 mixture Substances 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 7
- 230000001537 neural effect Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 4
- 238000013519 translation Methods 0.000 claims description 3
- 229940088594 vitamin Drugs 0.000 claims description 3
- 229930003231 vitamin Natural products 0.000 claims description 3
- 235000013343 vitamin Nutrition 0.000 claims description 3
- 239000011782 vitamin Substances 0.000 claims description 3
- 150000003722 vitamin derivatives Chemical class 0.000 claims description 3
- 239000012141 concentrate Substances 0.000 claims 1
- 238000000605 extraction Methods 0.000 abstract description 8
- 210000005036 nerve Anatomy 0.000 abstract description 3
- 230000000694 effects Effects 0.000 abstract 1
- 238000003709 image segmentation Methods 0.000 description 9
- 210000001519 tissue Anatomy 0.000 description 9
- 238000003708 edge detection Methods 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 5
- 230000003902 lesion Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 210000004556 brain Anatomy 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 210000000944 nerve tissue Anatomy 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 206010030113 Oedema Diseases 0.000 description 1
- 210000000577 adipose tissue Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000002591 computed tomography Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013501 data transformation Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000010412 perfusion Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于KECA特征降维和聚类的HRCT周围神经分割方法,包括以下步骤:首先,利用非下采样Contourlet变换和广义高斯混合模型对神经HRCT图像进行增强;然后,基于Gabor小波对增强后的图像进行特征提取;在此基础上,采用KECA算法对图像的部分采样数据点进行降维分析,找出降维所需的相关信息;结合KECA算法的特点,利用采样外点扩展算法OSE实现整幅图像所有数据点的特征降维;最后,针对降维后不同类别数据的分布特点,利用改进的KECA谱聚类算法进行聚类分割。本发明利用KECA算法的特点和采样外点扩展算法OSE,减少了图像中的冗余信息对分割结果的影响,在没有医学先验知识和人工干预的情况下,比较准确的实现了HRCT图像的分割。
Description
技术领域
本发明涉及一种基于KECA特征降维和聚类的HRCT周围神经分割方法,广泛应用于HRCT切片图像中周围神经等组织的提取。
背景技术
图像分割就是把图像分成若干个特定的、具有独特性质的区域并提取出感兴趣目标的技术和过程。也就是根据组织与背景的先验知识,对图像中感兴趣的组织进行定位、标记,然后将组织从背景中分离出来。对图像中目标区域的识别和解释、物景分析以及图像的分块处理都具有重要的意义。
周围神经高分辨率CT图像(High-ResolutionComputedTomography,HRCT)来源于各种影像设备。尽管HRCT图像的分辨率已经达到较高的要求,但是由于周围神经具有管状结构细而长的特征、包含的切片层次较多、涵盖的颜色层次丰富并具有渐变性、且神经组织与周围脂肪组织的颜色对比度较小,周围神经没有类似于血管系统的管道空间可以借助灌注技术加以显示,需要在切面上进行染色后才能与其他组织区分,为图像的分割带来很多困难。另外,以前周围神经的分割经常是用手工绘制出各神经束的边缘,实际操作中往往需要较多的人工干预,这不仅导致现有周围神经束分割工作量大且精度不高,而且使重建出来的神经没有很好的参考价值。
目前,医学图像分割方法大致可分为以下几类:基于区域的分割方法、边缘检测方法、区域与边界技术相结合的方法、基于模糊集理论的方法、基于人工神经网络(ArtificialNeuralNetwork,ANN)的方法等。基于区域的分割算法利用图像中不同对象间特征的不连续性和同一对象内部特征的相似性来达到图像分割的目的。该方法实现简单,当不同类物体的特征相差很大时,能够有效的对图像进行分割。但是该方法往往会造成过度分割。边缘检测方法试图通过检测不同区域边缘上的像素灰度值来解决图像分割问题。按照处理顺序可分为串行边缘检测和并行边缘检测,在串行边缘检测中,当前像素是否属于欲检测的边缘取决于先前像素的检测结果;而在并行边缘检测中,一个像素是否属于检测的边缘只与当前像素及其相邻像素有关,这样可同时对图像中的所有像素进行检测,因而称为并行边缘检测。若在基于区域的框架中没有包括决策阶段对边界的措施,可能导致噪声边界和对象内部出现空洞,将基于区域信息的方法与边缘检测的方法结合起来,就构成了区域与边界技术相结合的方法,怎样结合才能充分发挥各自的优势,获得较好的分割结果是该方法研究的重点。图像分割是典型的结构不良问题,而模糊集理论具有描述不良问题的能力,所以将模糊理论引入到图像处理与分析领域,提出了基于模糊集理论的分割方法,具体包括模糊阈值分割方法、模糊聚类分割方法和模糊连接度分割方法等。基于人工神经网络ANN的方法通过模拟生物特性是人类大脑的学习过程,它由大量并行的节点构成,每个节点都能执行一些基本的计算。学习过程通过调整节点间的连接关系以及连接权值来实现。
尽管目前有很多分割方法,但是鉴于神经组织相对于其他组织的特殊性,提出一种针对神经组织的分割算法,使其能够准确分割出神经组织很有必要。
发明内容
本发明的目的是针对上述技术中存在的不足,提供一种基于KECA特征降维和聚类的HRCT周围神经分割方法,该方法克服了传统分割方法中人工干预度高、分割结果不精确等问题,能够较快速准确地分割出神经组织,满足实际临床需求。
为了达到上述目的,本发明的思路是:首先对给定的周围神经HRCT图像进行增强,对增强后的图像进行特征提取;然后利用核熵成分分析方法(KernelEntropyComponentAnalysis,KECA)对特征数据进行降维。鉴于HRCT图像尺寸较大,结合KECA降维的特点,利用采样外点扩展算法(OutofSampleExtension,OSE)实现了图像中所有数据点的特征降维,减少特征向量中的冗余信息对聚类结果的影响;针对降维后的特征数据,采用改进的KECA谱聚类算法对其进行聚类,最终达到图像分割的目的。
根据上述发明构思,本发明采用的技术方案是:
一种基于KECA特征降维和聚类的HRCT周围神经分割方法,主要包括以下几个步骤:
步骤一,利用非下采样Contourlet变换(NonsubsampledContourletTransform,NSCT)对神经HRCT图像进行分解,依据NSCT系数的分布特点,构建广义高斯混合模型(GeneralizedGaussianMixtureModel,GGMM)对系数进行非线性处理,从而达到增强图像的目的;
步骤二,利用基于Gabor小波的纹理特征提取方法对增强后的HRCT图像进行特征提取;
步骤三,利用KECA对图像中的部分采样数据点进行降维,找出降维所需的相关信息;
步骤四,结合KECA降维算法的特点,采用采样外点扩展方法(OutofSampleExtension,OSE)对图像中的全部数据点进行特征降维;
步骤五,根据降维之后不同类别数据的分布特性,利用改进的KECA谱聚类算法对降维后的特征数据进行聚类。
所述步骤一的具体步骤如下:对给定的HRCT图像进行NSCT分解,NSCT具有平移不变特性,每个变换子带的像素位置都与其在原始图像的空间位置相对应;因此,可根据图像的NSCT变换系数来逐像素地分析图像的几何信息,实验和观察分析表明:图像中的像素点主要分为三类:强边缘、弱边缘和噪声;在NSCT变换域中,为了将弱边缘和背景噪声有效的区分开来,需要对NSCT变换的系数进行分析和处理,寻找其统计规律,NSCT子带系数的分布虽具有非高斯特性,但是比较符合具有零均值的广义高斯分布,利用GGMM对其系数进行建模并分为强边缘、弱边缘和噪声,然后设计相应的非线性增强映射函数对这些系数分别进行处理,最后通过NSCT反变换实现图像的增强。
所述步骤三的具体步骤如下:KECA的目的是最大程度地利用降维特征保留输入数据的熵,Rényi二次熵由下式给出:
H(p)=-log∫p2(x)dx
其中,p(x)是原始数据集的概率密度函数,即D=x1,...,xN,xi∈Rd,i=1,2,...,N。理论上,对于所处理的数据是一无所知的,所有提到的信息理论的测量都需要概率密度的估计,要在核方法和信息理论学习之间建立联系,由于对数函数是单调函数,我们集中在量V(p)=∫p2(x)dx,这里使用Parzen窗来估计V(p),估计式表示如下:
其中,K(x,xt|σ)被称为Parzen窗,或者中心在xt、宽度参数为σ的核。
假定输入n个d维的数据集,X=(x1,x2,…,xn),经过KECA变换后为s(s<d)维,Y=(y1,y2,…,yn),可以得出其中,Λ是由核矩阵的特征值λ1,λ2,…,λn构成的对角矩阵,E是与特征值相对应的特征向量e1,e2,…,en构成的矩阵。
映射轴选择规则为:
从而得到:
其中,
所述步骤四中的采样外点扩展方法OSE具体实施如下:
KECA变换,定义如下:
式中,m代表降维的目标维数,子空间Um是由对数据的Renyi熵估计贡献最大的m个特征空间主轴张成的子空间,Φ将原始数据映射到Um子空间上,从而得到降维后的m维数据。对于一个给定的数据点来说,不必求出其在高维空间中的具体形式,将采样外点φ(x)在某个主轴ui上的投影表示为:
式中ei,t是特征向量ei的第t个分量,假定Φ*是采样外点的集合,定义内积矩阵K*=ΦTΦ*,由上式得到:
对比上述两式,求出采样外点特征降维时对熵成分贡献最大的特征向量集e1,e2,...,em和特征值集λ1,λ2,...,λm,然后得到Em和Λm;分别利用上面两式得到图像中采样点与采样外点的降维特征,从而实现对HRCT图像中全部数据的特征降维。
所述步骤五的具体步骤如下:
经过KECA降维后的数据通常会有一个明显的角度结构,即不同类别的数据或多或少分布在不同的角度方向,寻找一种能够反映这种角度特性的聚类代价函数是一个合理的选择,Cauchy-Schwarz差异能够很好的衡量核特征空间中均值向量的角度余弦值,如第i组数据的概率密度函数pi(x)和整个数据集合的概率密度函数p(x)的Cauchy-Schwarz差异用式DCS(pi,p)=-log(VCS(pi,p))描述,其中:
而KECA熵的估计为:
由上两式得到:
在上述式子中,μi是第i束聚类Ci在核特征空间的均值。Cauchy-Schwarz差异能够很好的衡量这些均值向量之间的余弦角度值,能够捕捉不同类别数据之间的角度结构,整个代价函数用下式进行定义:
其中,Ni是聚类Ci中的样本数,μi是聚类的中心。
将核熵成分分析降维之后的数据,利用基于角度值的K-means算法进行聚类,得到KECA谱聚类算法,该谱聚类算法首先需要依据初始聚类中心确定一个初始分割,然后不断的优化初始分割。初始聚类中心的选择对最终的聚类结果有较大影响,另外,该算法是建立在样本空间呈凸球面的基础上,如果样本空间非凸,该算法将会陷入局部优化。为了能够在任意形状的样本空间上进行聚类且收敛于全局最优,提出了一种基于KECA特征降维和聚类的HRCT周围神经分割方法。首先对KECA降维后的特征向量进行谱映射,然后用基于角度值的K-means算法对谱映射后的图像数据进行聚类,得到分割后的HRCT图像。
本发明与现有图像分割方法相比,具有以下明显的优势:
首先,该方法无需医学先验知识,事先无需人工干预;另外,其采用了KECA降维方法对提取出的特征向量进行降维,既避免了“维数灾难”,又使得不同类别数据点的分布呈现出一定的规律性。在此基础上采用改进的KECA谱聚类算法对降维后的数据进行聚类分析,较好地提高了图像分割的精度,可广泛应用于临床上不同组织的提取。
附图说明
图1为本发明基于KECA特征降维和聚类的HRCT周围神经分割方法的流程图。
图2为本发明非下采样的系统结构图。
图3为本发明中的核熵成分分析方法流程示意图。
图4为本发明实验的一组人脑MRI图像。
图5为本发明的实验图像,医生根据先验知识手动标注了病灶区域。
图6为本发明所提出方法的实验结果。
图7为本发明在图6基础上优化得到的实验结果。
具体实施方式
为了更好地理解本发明的技术方案,以下结合附图对本发明的具体实施方式作进一步地详细描述:
如图1所示,本发明是基于KECA特征降维和聚类的HRCT周围神经分割方法,利用NSCT及GGMM对给定的HRCT图像进行增强,对增强后的图像进行特征提取;然后利用KECA方法对提取出的特征向量进行降维分析;根据降维后不同类别数据的分布特点,采用改进的KECA谱聚类算法实现图像的分割。具体实施步骤如下:
(1)利用非下采样Contourlet变换NSCT对神经HRCT图像进行分解得到变换后系数,根据变换后系数的分布特点,建立GGMM模型并对系数进行非线性处理,从而实现图像的增强。具体如下:
如图2所示,非下采样Contourlet变换主要由两部分组成:非下采样拉普拉斯金字塔分解(NonsubsampledPyramid,NSP)和非下采样方向滤波器组滤波(NonsubsampledDirectionalFilterBank,NSDFB)。前者实现多分辨率分解,后者实现多方向分解。
非下采样变换中的NSP采用的是一组双通道的非下采样滤波器组(NonsubsampledFilterBank,NSFB),该滤波器组没有下采样和上采样操作,因此是平移不变的。为了实现多尺度分解,每一级的NSP分解需要对上一级NSP中所采用的滤波器按采样矩阵D=2I(I为二阶单位矩阵)进行上采样。这样图像经过N级NSP分解后,可得到N+1个与原图像具有相同尺寸的子带图像。
非下采样变换中的非下采样方向滤波器组NSDFB采用的也是一组二通道非下采样滤波器组,由分解滤波器和重构滤波器组成。每一层进行方向分解之后,都有一个特定矩阵对方向滤波器组中的所有滤波器进行上采样操作,作为下一层方向分解的滤波器。
NSCT具有平移不变特性,图像经过NSCT变换后,每个变换子带的像素位置都与其在原图像中的空间位置相对应。因此,可根据图像的NSCT变换系数来逐像素分析图像的几何信息。实验和观察分析表明:图像中的像素主要分为三类:强边缘、弱边缘和噪声。强边缘对应于那些在所有子带中系数幅值都很大的像素点;弱边缘对应于在同一尺度某些方向子带中系数幅值很大、而在其它方向子带中系数幅值较小的像素点;图像中的噪声则对应于那些在所有子带中系数幅值都很小的像素点。
在NSCT变换域中,为了将弱边缘和背景噪声有效的区分开来,需要对NSCT变换的系数进行分析和处理,从中寻找其统计规律。根据统计规律和特性,寻找适当的统计模型,来有效地表示各个系数的属性,并对系数进行进一步的分析和调整。
NSCT子带系数的分布虽具有非高斯特性,但是比较符合具有零均值的广义高斯分布。理论上,一个信号需要用一系列高斯分布来精确表示,然而实际图像处理应用中,一般用2~4个高斯混合分布就可以比较精确的对图像进行逼近。通过对系数的分析可知,直方图中位于中心位置附近、幅值较小的系数对应于图像中的噪声,位于中间的系数对应于图像中的弱边缘,距离中心位置较远、幅值较大的系数对应于图像中的强边缘。因此可以利用广义高斯混合模型(GeneralizedGaussianMixtureModel,GGMM)对其系数进行建模并分为大、中、小三类,分别对应强边缘、弱边缘和噪声,然后设计相应的非线性增强映射函数对这些系数分别进行处理。
一维分布情况下的高斯混合模型的概率密度如下:
且
式中,ak为加权系数,K为加权的高斯模型的个数,N(x|μk,σk)是均值为μk、方差为σk的高斯分布。
本实施例中使用一维三元广义高斯分布混合模型对系数进行建模。在模型中,每一个系数由三种分布中的一种产生。三种分布分别为:窄带高斯分布、方差处于中间值的拉普拉斯分布和方差较大的拉普拉斯分布,假定它们出现的概率分别为p1,p2,p3。使用额外的参数θ来标识分布类别,混合模型由式(2)给出:
式(2)中,窄带高斯分布和拉普拉斯分布均为零均值,且
σ1<σ2<σ3,p(θ=i)=pi,p1+p2+p3=1(3)
确定高斯混合模型之后,概率密度函数pX(x)可以写成一个零均值的高斯分布和两个拉普拉斯分布的加权和形式,如式(4)所示:
pX(x)=p1N(x|σ1)+p2L(x|σ2)+p3L(x|σ3)(4)
对于给定的一个系数,通过概率分布计算出其具体属于哪一类。广义高斯混合模型(GGMM)可将系数分为不同的三类,通过对每类系数设定不同的放大因子来实现系数的增强。这里定义增强的准则如式(5)所示:
其中,ai为放大因子,0≤a1≤1,1≤a3≤a2,ai(1≤i≤3)的取值一般根据经验设置。然后对修正后的系数进行重构,得到增强后的图像。
(2)利用基于Gabor小波的纹理特征提取方法对增强后的HRCT图像进行特征提取;
(3)利用核熵成分分析方法(KernelEntropyComponentAnalysis,KECA)对图像中的部分采样数据点进行降维,找出降维所需的相关信息;
KECA是一种新的数据转换和降维方法,它能够揭示与输入数据集Renyi熵相关的结构。相比于传统的降维方法,利用该方法降维之后,不同类别的数据点之间通常会呈现出明显的角度结构。KECA通过使用Parzen窗来估计核函数,数据转换和降维通过将输入数据集投影到能够保留最大熵成分的KPCA轴上来实现,其降维流程如附图3所示,主要包括Renyi熵、非参数密度估计、映射轴的选择等。
1)Renyi二次熵
KECA的目的是最大程度地利用降维特征保留输入数据的熵。Rényi二次熵由下式给出:
H(p)=-log∫p2(x)dx(6)
其中,p(x)是原始数据集的概率密度函数,即D=x1,...,xN,xi∈Rd,i=1,2,...,N
2)非参数密度估计
3)理论上,对于所处理的数据是一无所知的,所有提到的信息理论的测量都需要概率密度的估计,要在核方法和信息理论学习之间建立联系,由于对数函数是单调函数,我们集中在量V(p)=∫p2(x)dx,这里使用Parzen窗来估计V(p),估计式表示如下:
其中,K(x,xt|σ)被称为Parzen窗,或者中心在xt、宽度参数为σ的核。
4)映射轴的选择
假定输入n个d维的数据集,X=(x1,x2,…,xn),经过KECA变换后为s(s<d)维,Y=(y1,y2,…,yn),可以得出其中,Λ是由核矩阵的特征值λ1,λ2,…,λn构成的对角矩阵,E是与特征值相对应的特征向量e1,e2,…,en构成的矩阵。
映射轴选择规则为:
从而得到:
其中,
(4)结合KECA降维算法的特点,采用采样外点扩张方法OSE对HRCT图像中的全部数据点进行特征降维;
KECA降维方法对于高维小样本数据集非常有效,能够很好的实现数据降维,并且降维之后不同类别的数据点通常会呈现出明显的角度结构,有利于后续的聚类分割。但是,对于采集的HRCT切片图像来说,较小的图像尺寸也是512×512,特征提取后会有n=262144个特征向量,KECA中计算核矩阵的特征值和特征向量的复杂度为O(n3),因此,对全部特征向量直接进行降维是不可能实现的。本发明中针对KECA算法的特点,利用采样外点扩张算法OSE很好的解决了该问题,具体策略如下:
KECA变换,具体推导详见第三部分,可以定义如下:
式中,m代表降维的目标维数,子空间Um是由对数据的Renyi熵估计贡献最大的m个特征空间主轴张成的子空间,Φ将原始数据映射到Um子空间上,从而得到降维后的m维数据。对于一个给定的数据点来说,不必求出其在高维空间中的具体形式,将采样外点φ(x)在某个主轴ui上的投影表示为:
式中ei,t是特征向量ei的第t个分量,假定Φ*是采样外点的集合,定义内积矩阵K*=ΦTΦ*,由上式得到:
对比式(11)和(13),求出采样外点特征降维时对熵成分贡献最大的特征向量集e1,e2,…,em和特征值集λ1,λ2,…,λm,然后得到Em和Λm;分别利用式(11)和(13)可得到图像中采样点与采样外点的降维特征,从而实现对HRCT图像中全部数据的特征降维。
(5)根据降维之后不同类别数据的分布特性,利用改进的KECA谱聚类算法对降维后的特征数据进行聚类分割,具体步骤如下:
经过KECA降维后的数据通常会有一个明显的角度结构,即不同类别的数据或多或少分布在不同的角度方向,寻找一种能够反映这种角度特性的聚类代价函数是一个合理的选择,Cauchy-Schwarz差异能够很好的衡量核特征空间中均值向量的角度余弦值,如第i组数据的概率密度函数pi(x)和整个数据集合的概率密度函数p(x)的Cauchy-Schwarz差异用式DCS(pi,p)=-log(VCS(pi,p))描述,其中:
而KECA熵的估计为:
由式(14)和(15)可以得到:
在上述式子中,μi是第i束聚类Ci在核特征空间的均值。Cauchy-Schwarz差异能够很好的衡量这些均值向量之间的余弦角度值,能够捕捉不同类别数据之间的角度结构,整个代价函数用下式进行定义:
其中,Ni是聚类Ci中的样本数,μi是聚类的中心。
通过上述分析,将核熵成分分析降维之后的数据,利用基于角度值的K-means算法进行聚类,得到KECA谱聚类算法,该谱聚类算法首先需要依据初始聚类中心确定一个初始分割,然后不断的优化初始分割。初始聚类中心的选择对最终的聚类结果有较大影响,另外,该算法是建立在样本空间呈凸球面的基础上,如果样本空间非凸,该算法将会陷入局部优化。为了能够在任意形状的样本空间上进行聚类且收敛于全局最优,提出了一种基于KECA特征降维和聚类的HRCT周围神经分割方法。首先对KECA降维后的特征向量进行谱映射,然后用基于角度值的K-means算法对谱映射后的图像数据进行聚类,得到分割后的HRCT图像。
本发明的一个实验例叙述如下:
如图4所示。采用一组人脑MRI图像作为实验数据,数据格式为bmp,大小为512×512。图像中的白色以及白色中间的灰色部分均为病灶区域,该区域又可以分为水肿和肿瘤区域,从图像中可以看出该区域边界模糊,而实验的目的是将该部分分割出来。图5是医生根据先验知识手动标注的病灶区域,可以作为实验的标准truth。图6是采用本发明方法的分割结果,从视觉效果上看其基本满足了临床需求。图7是在图6基础上优化得到的结果。
为了量化实验结果,以图5中医生手动标注的图像作为标准truth,以均方误差(meansquarederror,mse)、峰值信噪比(peaksignaltonoiserate,psnr)和信息熵(entropy)作为客观衡量指标,采用6组数据进行统计平均。
表一评价指标
从上表可以看出,本发明的分割方法实验结果稳定,且在误差允许范围之内准确的分割出了病灶区域。由于缺少真正意义上的标准,而truth是医生手动描绘的,和真正的病灶区域存在一定的误差。从视觉效果上看,本实验的分割结果比较令人满意。
本发明提出一种基于KECA特征降维和聚类的HRCT周围神经分割方法,用核熵成分分析KECA降维方法对提取出的高维特征数据进行降维分析;根据降维之后不同类别数据的分布特点,采用改进的KECA谱聚类算法对数据进行聚类分析。实验结果表明:本发明算法不仅可以降低噪声对聚类结果的影响、提高分割精度,而且其不需要人机交互、具有很好的鲁棒性。
Claims (5)
1.一种基于KECA特征降维和聚类的HRCT周围神经分割方法,其特征在于,包括以下步骤:
步骤一,利用非下采样Contourlet变换,即Non-SubsampledContourletTransform,NSCT,对神经高分辨率CT图像,即High-ResolutionComputedTomography,HRCT,进行分解,依据NSCT系数的分布特点,构建广义高斯混合模型,即GeneralizedGaussianMixtureModel,GGMM,对系数进行非线性处理,从而达到增强图像的目的;
步骤二,利用基于Gabor小波的纹理特征对增强后的HRCT图像进行特征提取;
步骤三,利用核熵成分分析方法,即KernelEntropyComponentAnalysis,KECA,对图像中的部分采样数据点进行降维,找出降维所需的相关信息;
步骤四,结合KECA降维算法的特点,采用采样外点扩展算法,即OutofSampleExtension,OSE,对图像中的全部数据点进行特征降维;
步骤五,根据降维之后不同类别数据的分布特性,利用改进的KECA谱聚类算法对降维后的特征数据进行聚类分割。
2.根据权利要求1所述的基于KECA特征降维和聚类的HRCT周围神经分割方法,其特征在于,所述步骤一的具体步骤如下:对给定的HRCT图像进行NSCT分解,NSCT具有平移不变特性,每个变换子带的像素位置都对应于原图像中相同的空间位置;因此,根据图像的NSCT变换系数来逐像素分析图像的几何信息,实验和观察分析表明:图像中的像素主要分为三类:强边缘、弱边缘和噪声;在NSCT变换域中,为了将弱边缘和背景噪声有效的区分开来,需要对NSCT变换的系数进行分析和处理,寻找其统计规律,NSCT子带系数的分布虽具有非高斯特性,但是比较符合零均值广义高斯分布,利用GGMM对其系数进行建模并分为大、中、小三类,分别对应强边缘、弱边缘和噪声,然后设计相应的非线性增强映射函数对这些系数分别进行处理,最后通过NSCT反变换实现图像的增强。
3.根据权利要求1所述的基于KECA特征降维和聚类的HRCT周围神经分割方法,其特征在于,所述步骤三的具体步骤如下:KECA的目的是最大程度地利用降维特征保留输入数据的熵,Rényi二次熵由下式给出:
H(p)=-log∫p2(x)dx
其中,p(x)是原始数据集的概率密度函数,即D=x1,...,xN,xi∈Rd,i=1,2,...,N,理论上,对于所处理的数据是一无所知的,所有提到的信息理论的测量都需要概率密度的估计,要在核方法和信息理论学习之间建立联系,由于对数函数是单调函数,我们集中在量V(p)=∫p2(x)dx,这里使用Parzen窗来估计V(p),估计式表示如下:
其中,K(x,xt|σ)被称为Parzen窗,或者中心在xt、宽度参数为σ的核;
假定输入n个d维的数据集,X=(x1,x2,…,xn),经过KECA变换后为s(s<d)维,Y=(y1,y2,…,yn),可以得出其中,Λ是由核矩阵的特征值λ1,λ2,…,λn构成的对角矩阵,E是与特征值相对应的特征向量e1,e2,…,en构成的矩阵,
映射轴选择规则为:
从而得到:
其中,
4.根据权利要求1所述的基于KECA特征降维和聚类的HRCT周围神经分割方法,其特征在于,所述步骤四中的采样外点扩展算法OSE具体实施如下:
KECA变换,定义如下:
式中,m代表降维的目标维数,子空间Um是由对数据的Renyi熵估计贡献最大的m个特征空间主轴张成的子空间,Φ将原始数据映射到Um子空间上,从而得到降维后的m维数据,对于一个给定的数据点来说,不必求出其在高维空间中的具体形式,将采样外点φ(x)在某个主轴ui上的投影表示为:
式中ei,t是特征向量ei的第t个分量,假定Φ*是采样外点的集合,定义内积矩阵K*=ΦTΦ*,由上式得到:
对比上述两式,求出采样外点特征降维时对熵成分贡献最大的特征向量集e1,e2,...,em和特征值集λ1,λ2,...,λm,然后得到Em和Λm;分别利用上面两式得到图像中采样点与才采样外点的降维特征,从而实现对HRCT图像中全部数据的特征降维。
5.根据权利要求1所述的基于KECA特征降维和聚类的HRCT周围神经分割方法,其特征在于,所述步骤五的具体步骤如下:
经过KECA降维后的数据通常会有一个明显的角度结构,即不同类别的数据或多或少分布在不同的角度方向,寻找一种能够反映这种角度特性的聚类代价函数是一个合理的选择,Cauchy-Schwarz差异能够很好的衡量核特征空间中均值向量的角度余弦值,如第i组数据的概率密度函数pi(x)和整个数据集合的概率密度函数p(x)的Cauchy-Schwarz差异用式DCS(pi,p)=-log(VCS(pi,p))描述,其中:
而KECA熵的估计为:
由上两式得到:
在上述式子中,μi是第i束聚类Ci在核特征空间的均值,Cauchy-Schwarz差异能够很好的衡量这些均值向量之间的余弦角度值,能够捕捉不同类别数据之间的角度结构,整个代价函数用下式进行定义:
其中,Ni是聚类Ci中的样本数,μi是聚类的中心;
将核熵成分分析降维之后的数据,利用基于角度值的K-means算法进行聚类,得到KECA谱聚类算法,该谱聚类算法首先需要依据初始聚类中心确定一个初始分割,然后不断的优化初始分割,初始聚类中心的选择对最终的聚类结果有较大影响,另外,该算法是建立在样本空间呈凸球面的基础上,如果样本空间非凸,该算法将会陷入局部优化,为了能够在任意形状的样本空间上进行聚类且收敛于全局最优,提出了一种基于KECA特征降维和聚类的HRCT周围神经分割方法,首先对KECA降维后的特征向量进行谱映射,然后用基于角度值的K-means算法对谱映射后的图像数据进行聚类,得到分割后的HRCT图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510741859.2A CN105512670B (zh) | 2015-11-04 | 2015-11-04 | 基于keca特征降维和聚类的hrct周围神经分割 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510741859.2A CN105512670B (zh) | 2015-11-04 | 2015-11-04 | 基于keca特征降维和聚类的hrct周围神经分割 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105512670A true CN105512670A (zh) | 2016-04-20 |
CN105512670B CN105512670B (zh) | 2019-04-02 |
Family
ID=55720636
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510741859.2A Expired - Fee Related CN105512670B (zh) | 2015-11-04 | 2015-11-04 | 基于keca特征降维和聚类的hrct周围神经分割 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105512670B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108765397A (zh) * | 2018-05-22 | 2018-11-06 | 内蒙古农业大学 | 一种基于降维和特征空间构造的木材图像识别方法及装置 |
CN109489576A (zh) * | 2018-10-19 | 2019-03-19 | 杭州电子科技大学 | 一种基于初级视觉通路计算模型的轮廓检测方法 |
CN112666918A (zh) * | 2020-12-01 | 2021-04-16 | 沈阳化工大学 | 一种基于在线压缩keca自适应工业过程故障检测方法 |
CN113985733A (zh) * | 2021-10-26 | 2022-01-28 | 云南电网有限责任公司电力科学研究院 | 一种基于自适应概率学习的配电网故障辨识方法 |
CN114496209A (zh) * | 2022-02-18 | 2022-05-13 | 青岛市中心血站 | 一种献血智能决策方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7961957B2 (en) * | 2007-01-30 | 2011-06-14 | Alon Schclar | Diffusion bases methods for segmentation and clustering |
CN102622756A (zh) * | 2012-03-14 | 2012-08-01 | 西安电子科技大学 | 基于全变分谱聚类的sar图像分割方法 |
US20140056518A1 (en) * | 2012-08-22 | 2014-02-27 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and program |
CN104700089A (zh) * | 2015-03-24 | 2015-06-10 | 江南大学 | 一种基于Gabor小波和SB2DLPP的人脸识别方法 |
CN104915676A (zh) * | 2015-05-19 | 2015-09-16 | 西安电子科技大学 | 基于深层特征学习和分水岭的sar图像分类 |
-
2015
- 2015-11-04 CN CN201510741859.2A patent/CN105512670B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7961957B2 (en) * | 2007-01-30 | 2011-06-14 | Alon Schclar | Diffusion bases methods for segmentation and clustering |
CN102622756A (zh) * | 2012-03-14 | 2012-08-01 | 西安电子科技大学 | 基于全变分谱聚类的sar图像分割方法 |
US20140056518A1 (en) * | 2012-08-22 | 2014-02-27 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and program |
CN104700089A (zh) * | 2015-03-24 | 2015-06-10 | 江南大学 | 一种基于Gabor小波和SB2DLPP的人脸识别方法 |
CN104915676A (zh) * | 2015-05-19 | 2015-09-16 | 西安电子科技大学 | 基于深层特征学习和分水岭的sar图像分类 |
Non-Patent Citations (1)
Title |
---|
马秀丽等: "基于分水岭_谱聚类的SAR图像分割", 《红外与毫米波学报》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108765397A (zh) * | 2018-05-22 | 2018-11-06 | 内蒙古农业大学 | 一种基于降维和特征空间构造的木材图像识别方法及装置 |
CN109489576A (zh) * | 2018-10-19 | 2019-03-19 | 杭州电子科技大学 | 一种基于初级视觉通路计算模型的轮廓检测方法 |
CN109489576B (zh) * | 2018-10-19 | 2020-03-03 | 杭州电子科技大学 | 一种基于初级视觉通路计算模型的轮廓检测方法 |
CN112666918A (zh) * | 2020-12-01 | 2021-04-16 | 沈阳化工大学 | 一种基于在线压缩keca自适应工业过程故障检测方法 |
CN112666918B (zh) * | 2020-12-01 | 2022-06-14 | 沈阳化工大学 | 一种基于在线压缩keca自适应工业过程故障检测方法 |
CN113985733A (zh) * | 2021-10-26 | 2022-01-28 | 云南电网有限责任公司电力科学研究院 | 一种基于自适应概率学习的配电网故障辨识方法 |
CN113985733B (zh) * | 2021-10-26 | 2023-11-17 | 云南电网有限责任公司电力科学研究院 | 一种基于自适应概率学习的配电网故障辨识方法 |
CN114496209A (zh) * | 2022-02-18 | 2022-05-13 | 青岛市中心血站 | 一种献血智能决策方法及系统 |
CN114496209B (zh) * | 2022-02-18 | 2022-09-27 | 青岛市中心血站 | 一种献血智能决策方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN105512670B (zh) | 2019-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tirandaz et al. | A two-phase algorithm based on kurtosis curvelet energy and unsupervised spectral regression for segmentation of SAR images | |
Fu et al. | Hyperspectral image classification via shape-adaptive joint sparse representation | |
Vaishnavee et al. | An automated MRI brain image segmentation and tumor detection using SOM-clustering and Proximal Support Vector Machine classifier | |
Kabade et al. | Segmentation of brain tumour and its area calculation in brain MR images using K-mean clustering and fuzzy C-mean algorithm | |
CN105512670B (zh) | 基于keca特征降维和聚类的hrct周围神经分割 | |
CN107146228B (zh) | 一种基于先验知识的大脑磁共振图像超体素生成方法 | |
CN103679675B (zh) | 一种面向水质定量遥感应用的遥感影像融合方法 | |
CN106469316A (zh) | 基于超像素级信息融合的高光谱图像的分类方法及系统 | |
Zhang et al. | A supervised texton based approach for automatic segmentation and measurement of the fetal head and femur in 2D ultrasound images | |
Alipour et al. | Fast automatic medical image segmentation based on spatial kernel fuzzy c-means on level set method | |
CN112150564B (zh) | 基于深度卷积神经网络医学图像融合算法 | |
Nagaraja Kumar et al. | An intelligent multimodal medical image fusion model based on improved fast discrete curvelet transform and type-2 fuzzy entropy | |
Radhakrishnan et al. | Canny edge detection model in mri image segmentation using optimized parameter tuning method | |
Shen et al. | 3D Gabor wavelets for evaluating SPM normalization algorithm | |
Tu et al. | Spectral–spatial hyperspectral image classification via non-local means filtering feature extraction | |
Nercessian et al. | Multiresolution decomposition schemes using the parameterized logarithmic image processing model with application to image fusion | |
Fan et al. | Magnetic-resonance image segmentation based on improved variable weight multi-resolution Markov random field in undecimated complex wavelet domain | |
CN104637060A (zh) | 一种基于邻域主成分分析-拉普拉斯的图像分割方法 | |
Krishnammal et al. | Medical image segmentation using fast discrete curvelet transform and classification methods for MRI brain images | |
Song et al. | A hybrid tissue segmentation approach for brain MR images | |
CN112733769B (zh) | 基于多波段熵率超像素分割的高光谱图像分类方法 | |
Fang | An image segmentation technique using nonsubsampled contourlet transform and active contours | |
Pham et al. | A generalized EM algorithm for robust segmentation of magnetic resonance images | |
CN110751652B (zh) | 基于巴氏距离和纹理模式度量的sar图像分割方法 | |
Mahalakshmi et al. | Performance Analysis of SVM and Deep Learning with CNN for Brain Tumor Detection and Classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190402 Termination date: 20211104 |