CN105512670A

CN105512670A - 基于keca特征降维和聚类的hrct周围神经分割

Info

Publication number: CN105512670A
Application number: CN201510741859.2A
Authority: CN
Inventors: 马秀丽; 周小军; 何昌保
Original assignee: University of Shanghai for Science and Technology
Current assignee: University of Shanghai for Science and Technology
Priority date: 2015-11-04
Filing date: 2015-11-04
Publication date: 2016-04-20
Anticipated expiration: 2035-11-04
Also published as: CN105512670B

Abstract

本发明公开了一种基于KECA特征降维和聚类的HRCT周围神经分割方法，包括以下步骤：首先，利用非下采样Contourlet变换和广义高斯混合模型对神经HRCT图像进行增强；然后，基于Gabor小波对增强后的图像进行特征提取；在此基础上，采用KECA算法对图像的部分采样数据点进行降维分析，找出降维所需的相关信息；结合KECA算法的特点，利用采样外点扩展算法OSE实现整幅图像所有数据点的特征降维；最后，针对降维后不同类别数据的分布特点，利用改进的KECA谱聚类算法进行聚类分割。本发明利用KECA算法的特点和采样外点扩展算法OSE，减少了图像中的冗余信息对分割结果的影响，在没有医学先验知识和人工干预的情况下，比较准确的实现了HRCT图像的分割。

Description

基于KECA特征降维和聚类的HRCT周围神经分割

技术领域

本发明涉及一种基于KECA特征降维和聚类的HRCT周围神经分割方法，广泛应用于HRCT切片图像中周围神经等组织的提取。

背景技术

图像分割就是把图像分成若干个特定的、具有独特性质的区域并提取出感兴趣目标的技术和过程。也就是根据组织与背景的先验知识，对图像中感兴趣的组织进行定位、标记，然后将组织从背景中分离出来。对图像中目标区域的识别和解释、物景分析以及图像的分块处理都具有重要的意义。

周围神经高分辨率CT图像(High-ResolutionComputedTomography,HRCT)来源于各种影像设备。尽管HRCT图像的分辨率已经达到较高的要求，但是由于周围神经具有管状结构细而长的特征、包含的切片层次较多、涵盖的颜色层次丰富并具有渐变性、且神经组织与周围脂肪组织的颜色对比度较小，周围神经没有类似于血管系统的管道空间可以借助灌注技术加以显示，需要在切面上进行染色后才能与其他组织区分，为图像的分割带来很多困难。另外，以前周围神经的分割经常是用手工绘制出各神经束的边缘，实际操作中往往需要较多的人工干预，这不仅导致现有周围神经束分割工作量大且精度不高，而且使重建出来的神经没有很好的参考价值。

目前，医学图像分割方法大致可分为以下几类：基于区域的分割方法、边缘检测方法、区域与边界技术相结合的方法、基于模糊集理论的方法、基于人工神经网络(ArtificialNeuralNetwork,ANN)的方法等。基于区域的分割算法利用图像中不同对象间特征的不连续性和同一对象内部特征的相似性来达到图像分割的目的。该方法实现简单，当不同类物体的特征相差很大时，能够有效的对图像进行分割。但是该方法往往会造成过度分割。边缘检测方法试图通过检测不同区域边缘上的像素灰度值来解决图像分割问题。按照处理顺序可分为串行边缘检测和并行边缘检测，在串行边缘检测中，当前像素是否属于欲检测的边缘取决于先前像素的检测结果；而在并行边缘检测中，一个像素是否属于检测的边缘只与当前像素及其相邻像素有关，这样可同时对图像中的所有像素进行检测，因而称为并行边缘检测。若在基于区域的框架中没有包括决策阶段对边界的措施，可能导致噪声边界和对象内部出现空洞，将基于区域信息的方法与边缘检测的方法结合起来，就构成了区域与边界技术相结合的方法，怎样结合才能充分发挥各自的优势，获得较好的分割结果是该方法研究的重点。图像分割是典型的结构不良问题，而模糊集理论具有描述不良问题的能力，所以将模糊理论引入到图像处理与分析领域，提出了基于模糊集理论的分割方法，具体包括模糊阈值分割方法、模糊聚类分割方法和模糊连接度分割方法等。基于人工神经网络ANN的方法通过模拟生物特性是人类大脑的学习过程，它由大量并行的节点构成，每个节点都能执行一些基本的计算。学习过程通过调整节点间的连接关系以及连接权值来实现。

尽管目前有很多分割方法，但是鉴于神经组织相对于其他组织的特殊性，提出一种针对神经组织的分割算法，使其能够准确分割出神经组织很有必要。

发明内容

本发明的目的是针对上述技术中存在的不足，提供一种基于KECA特征降维和聚类的HRCT周围神经分割方法，该方法克服了传统分割方法中人工干预度高、分割结果不精确等问题，能够较快速准确地分割出神经组织，满足实际临床需求。

为了达到上述目的，本发明的思路是：首先对给定的周围神经HRCT图像进行增强，对增强后的图像进行特征提取；然后利用核熵成分分析方法(KernelEntropyComponentAnalysis,KECA)对特征数据进行降维。鉴于HRCT图像尺寸较大，结合KECA降维的特点，利用采样外点扩展算法(OutofSampleExtension,OSE)实现了图像中所有数据点的特征降维，减少特征向量中的冗余信息对聚类结果的影响；针对降维后的特征数据，采用改进的KECA谱聚类算法对其进行聚类，最终达到图像分割的目的。

根据上述发明构思，本发明采用的技术方案是：

一种基于KECA特征降维和聚类的HRCT周围神经分割方法，主要包括以下几个步骤：

步骤一，利用非下采样Contourlet变换(NonsubsampledContourletTransform,NSCT)对神经HRCT图像进行分解，依据NSCT系数的分布特点，构建广义高斯混合模型(GeneralizedGaussianMixtureModel,GGMM)对系数进行非线性处理，从而达到增强图像的目的；

步骤二，利用基于Gabor小波的纹理特征提取方法对增强后的HRCT图像进行特征提取；

步骤三，利用KECA对图像中的部分采样数据点进行降维，找出降维所需的相关信息；

步骤四，结合KECA降维算法的特点，采用采样外点扩展方法(OutofSampleExtension,OSE)对图像中的全部数据点进行特征降维；

步骤五，根据降维之后不同类别数据的分布特性，利用改进的KECA谱聚类算法对降维后的特征数据进行聚类。

所述步骤一的具体步骤如下：对给定的HRCT图像进行NSCT分解，NSCT具有平移不变特性，每个变换子带的像素位置都与其在原始图像的空间位置相对应；因此，可根据图像的NSCT变换系数来逐像素地分析图像的几何信息，实验和观察分析表明：图像中的像素点主要分为三类：强边缘、弱边缘和噪声；在NSCT变换域中，为了将弱边缘和背景噪声有效的区分开来，需要对NSCT变换的系数进行分析和处理，寻找其统计规律，NSCT子带系数的分布虽具有非高斯特性，但是比较符合具有零均值的广义高斯分布，利用GGMM对其系数进行建模并分为强边缘、弱边缘和噪声，然后设计相应的非线性增强映射函数对这些系数分别进行处理，最后通过NSCT反变换实现图像的增强。

所述步骤三的具体步骤如下：KECA的目的是最大程度地利用降维特征保留输入数据的熵，Rényi二次熵由下式给出：

H(p)＝-log∫p²(x)dx

其中，p(x)是原始数据集的概率密度函数，即D＝x₁,...,x_N，x_i∈R^d,i＝1,2,...,N。理论上，对于所处理的数据是一无所知的，所有提到的信息理论的测量都需要概率密度的估计，要在核方法和信息理论学习之间建立联系，由于对数函数是单调函数，我们集中在量V(p)＝∫p²(x)dx，这里使用Parzen窗来估计V(p)，估计式表示如下：

\hat{p} (x) = \frac{1}{N} \underset{x_{t} &Element; D}{Σ} K (x, x_{t} | σ)

其中，K(x,x_t|σ)被称为Parzen窗，或者中心在x_t、宽度参数为σ的核。

假定输入n个d维的数据集，X＝(x₁,x₂,…,x_n)，经过KECA变换后为s(s<d)维，Y＝(y₁,y₂,…,y_n)，可以得出其中，Λ是由核矩阵的特征值λ₁，λ₂，…，λ_n构成的对角矩阵，E是与特征值相对应的特征向量e₁,e₂,…,e_n构成的矩阵。

映射轴选择规则为：

从而得到：

其中，

所述步骤四中的采样外点扩展方法OSE具体实施如下：

KECA变换，定义如下：

式中，m代表降维的目标维数，子空间U_m是由对数据的Renyi熵估计贡献最大的m个特征空间主轴张成的子空间，Φ将原始数据映射到U_m子空间上，从而得到降维后的m维数据。对于一个给定的数据点来说，不必求出其在高维空间中的具体形式，将采样外点φ(x)在某个主轴u_i上的投影表示为：

式中e_i,t是特征向量e_i的第t个分量，假定Φ^*是采样外点的集合，定义内积矩阵K^*＝Φ^TΦ^*，由上式得到：

对比上述两式，求出采样外点特征降维时对熵成分贡献最大的特征向量集e₁,e₂,...,e_m和特征值集λ₁,λ₂,...,λ_m，然后得到E_m和Λ_m；分别利用上面两式得到图像中采样点与采样外点的降维特征，从而实现对HRCT图像中全部数据的特征降维。

所述步骤五的具体步骤如下：

经过KECA降维后的数据通常会有一个明显的角度结构，即不同类别的数据或多或少分布在不同的角度方向，寻找一种能够反映这种角度特性的聚类代价函数是一个合理的选择，Cauchy-Schwarz差异能够很好的衡量核特征空间中均值向量的角度余弦值，如第i组数据的概率密度函数p_i(x)和整个数据集合的概率密度函数p(x)的Cauchy-Schwarz差异用式D_CS(p_i,p)＝-log(V_CS(p_i,p))描述，其中：

而KECA熵的估计为：

由上两式得到：

在上述式子中，μ_i是第i束聚类C_i在核特征空间的均值。Cauchy-Schwarz差异能够很好的衡量这些均值向量之间的余弦角度值，能够捕捉不同类别数据之间的角度结构，整个代价函数用下式进行定义：

其中，N_i是聚类C_i中的样本数，μ_i是聚类的中心。

将核熵成分分析降维之后的数据，利用基于角度值的K-means算法进行聚类，得到KECA谱聚类算法，该谱聚类算法首先需要依据初始聚类中心确定一个初始分割，然后不断的优化初始分割。初始聚类中心的选择对最终的聚类结果有较大影响，另外，该算法是建立在样本空间呈凸球面的基础上，如果样本空间非凸，该算法将会陷入局部优化。为了能够在任意形状的样本空间上进行聚类且收敛于全局最优，提出了一种基于KECA特征降维和聚类的HRCT周围神经分割方法。首先对KECA降维后的特征向量进行谱映射，然后用基于角度值的K-means算法对谱映射后的图像数据进行聚类，得到分割后的HRCT图像。

本发明与现有图像分割方法相比，具有以下明显的优势：

首先，该方法无需医学先验知识，事先无需人工干预；另外，其采用了KECA降维方法对提取出的特征向量进行降维，既避免了“维数灾难”，又使得不同类别数据点的分布呈现出一定的规律性。在此基础上采用改进的KECA谱聚类算法对降维后的数据进行聚类分析，较好地提高了图像分割的精度，可广泛应用于临床上不同组织的提取。

附图说明

图1为本发明基于KECA特征降维和聚类的HRCT周围神经分割方法的流程图。

图2为本发明非下采样的系统结构图。

图3为本发明中的核熵成分分析方法流程示意图。

图4为本发明实验的一组人脑MRI图像。

图5为本发明的实验图像，医生根据先验知识手动标注了病灶区域。

图6为本发明所提出方法的实验结果。

图7为本发明在图6基础上优化得到的实验结果。

具体实施方式

为了更好地理解本发明的技术方案，以下结合附图对本发明的具体实施方式作进一步地详细描述：

如图1所示，本发明是基于KECA特征降维和聚类的HRCT周围神经分割方法，利用NSCT及GGMM对给定的HRCT图像进行增强，对增强后的图像进行特征提取；然后利用KECA方法对提取出的特征向量进行降维分析；根据降维后不同类别数据的分布特点，采用改进的KECA谱聚类算法实现图像的分割。具体实施步骤如下：

(1)利用非下采样Contourlet变换NSCT对神经HRCT图像进行分解得到变换后系数，根据变换后系数的分布特点，建立GGMM模型并对系数进行非线性处理，从而实现图像的增强。具体如下：

如图2所示，非下采样Contourlet变换主要由两部分组成：非下采样拉普拉斯金字塔分解(NonsubsampledPyramid,NSP)和非下采样方向滤波器组滤波(NonsubsampledDirectionalFilterBank,NSDFB)。前者实现多分辨率分解，后者实现多方向分解。

非下采样变换中的NSP采用的是一组双通道的非下采样滤波器组(NonsubsampledFilterBank,NSFB)，该滤波器组没有下采样和上采样操作，因此是平移不变的。为了实现多尺度分解，每一级的NSP分解需要对上一级NSP中所采用的滤波器按采样矩阵D＝2I(I为二阶单位矩阵)进行上采样。这样图像经过N级NSP分解后，可得到N+1个与原图像具有相同尺寸的子带图像。

非下采样变换中的非下采样方向滤波器组NSDFB采用的也是一组二通道非下采样滤波器组，由分解滤波器和重构滤波器组成。每一层进行方向分解之后，都有一个特定矩阵对方向滤波器组中的所有滤波器进行上采样操作，作为下一层方向分解的滤波器。

NSCT具有平移不变特性，图像经过NSCT变换后，每个变换子带的像素位置都与其在原图像中的空间位置相对应。因此，可根据图像的NSCT变换系数来逐像素分析图像的几何信息。实验和观察分析表明：图像中的像素主要分为三类：强边缘、弱边缘和噪声。强边缘对应于那些在所有子带中系数幅值都很大的像素点；弱边缘对应于在同一尺度某些方向子带中系数幅值很大、而在其它方向子带中系数幅值较小的像素点；图像中的噪声则对应于那些在所有子带中系数幅值都很小的像素点。

在NSCT变换域中，为了将弱边缘和背景噪声有效的区分开来，需要对NSCT变换的系数进行分析和处理，从中寻找其统计规律。根据统计规律和特性，寻找适当的统计模型，来有效地表示各个系数的属性，并对系数进行进一步的分析和调整。

NSCT子带系数的分布虽具有非高斯特性，但是比较符合具有零均值的广义高斯分布。理论上，一个信号需要用一系列高斯分布来精确表示，然而实际图像处理应用中，一般用2～4个高斯混合分布就可以比较精确的对图像进行逼近。通过对系数的分析可知，直方图中位于中心位置附近、幅值较小的系数对应于图像中的噪声，位于中间的系数对应于图像中的弱边缘，距离中心位置较远、幅值较大的系数对应于图像中的强边缘。因此可以利用广义高斯混合模型(GeneralizedGaussianMixtureModel，GGMM)对其系数进行建模并分为大、中、小三类，分别对应强边缘、弱边缘和噪声，然后设计相应的非线性增强映射函数对这些系数分别进行处理。

一维分布情况下的高斯混合模型的概率密度如下：

且

式中，a_k为加权系数，K为加权的高斯模型的个数，N(x|μ_k,σ_k)是均值为μ_k、方差为σ_k的高斯分布。

本实施例中使用一维三元广义高斯分布混合模型对系数进行建模。在模型中，每一个系数由三种分布中的一种产生。三种分布分别为：窄带高斯分布、方差处于中间值的拉普拉斯分布和方差较大的拉普拉斯分布，假定它们出现的概率分别为p₁,p₂,p₃。使用额外的参数θ来标识分布类别，混合模型由式(2)给出：

式(2)中，窄带高斯分布和拉普拉斯分布均为零均值，且

σ₁＜σ₂＜σ₃,p(θ＝i)＝p_i,p₁+p₂+p₃＝1(3)

确定高斯混合模型之后，概率密度函数p_X(x)可以写成一个零均值的高斯分布和两个拉普拉斯分布的加权和形式，如式(4)所示：

p_X(x)＝p₁N(x|σ₁)+p₂L(x|σ₂)+p₃L(x|σ₃)(4)

对于给定的一个系数，通过概率分布计算出其具体属于哪一类。广义高斯混合模型(GGMM)可将系数分为不同的三类，通过对每类系数设定不同的放大因子来实现系数的增强。这里定义增强的准则如式(5)所示：

其中，a_i为放大因子，0≤a₁≤1,1≤a₃≤a₂，a_i(1≤i≤3)的取值一般根据经验设置。然后对修正后的系数进行重构，得到增强后的图像。

(2)利用基于Gabor小波的纹理特征提取方法对增强后的HRCT图像进行特征提取；

(3)利用核熵成分分析方法(KernelEntropyComponentAnalysis，KECA)对图像中的部分采样数据点进行降维，找出降维所需的相关信息；

KECA是一种新的数据转换和降维方法，它能够揭示与输入数据集Renyi熵相关的结构。相比于传统的降维方法，利用该方法降维之后，不同类别的数据点之间通常会呈现出明显的角度结构。KECA通过使用Parzen窗来估计核函数，数据转换和降维通过将输入数据集投影到能够保留最大熵成分的KPCA轴上来实现，其降维流程如附图3所示，主要包括Renyi熵、非参数密度估计、映射轴的选择等。

1)Renyi二次熵

KECA的目的是最大程度地利用降维特征保留输入数据的熵。Rényi二次熵由下式给出：

H(p)＝-log∫p²(x)dx(6)

其中，p(x)是原始数据集的概率密度函数，即D＝x₁,...,x_N，x_i∈R^d,i＝1,2,...,N

2)非参数密度估计

3)理论上，对于所处理的数据是一无所知的，所有提到的信息理论的测量都需要概率密度的估计，要在核方法和信息理论学习之间建立联系，由于对数函数是单调函数，我们集中在量V(p)＝∫p²(x)dx，这里使用Parzen窗来估计V(p)，估计式表示如下：

4)映射轴的选择

映射轴选择规则为：

从而得到：

其中，

(4)结合KECA降维算法的特点，采用采样外点扩张方法OSE对HRCT图像中的全部数据点进行特征降维；

KECA降维方法对于高维小样本数据集非常有效，能够很好的实现数据降维，并且降维之后不同类别的数据点通常会呈现出明显的角度结构，有利于后续的聚类分割。但是，对于采集的HRCT切片图像来说，较小的图像尺寸也是512×512，特征提取后会有n＝262144个特征向量，KECA中计算核矩阵的特征值和特征向量的复杂度为O(n³)，因此，对全部特征向量直接进行降维是不可能实现的。本发明中针对KECA算法的特点，利用采样外点扩张算法OSE很好的解决了该问题，具体策略如下：

KECA变换，具体推导详见第三部分，可以定义如下：

对比式(11)和(13)，求出采样外点特征降维时对熵成分贡献最大的特征向量集e₁,e₂,…,e_m和特征值集λ₁,λ₂,…,λ_m，然后得到E_m和Λ_m；分别利用式(11)和(13)可得到图像中采样点与采样外点的降维特征，从而实现对HRCT图像中全部数据的特征降维。

(5)根据降维之后不同类别数据的分布特性，利用改进的KECA谱聚类算法对降维后的特征数据进行聚类分割，具体步骤如下：

而KECA熵的估计为：

由式(14)和(15)可以得到：

其中，N_i是聚类C_i中的样本数，μ_i是聚类的中心。

通过上述分析，将核熵成分分析降维之后的数据，利用基于角度值的K-means算法进行聚类，得到KECA谱聚类算法，该谱聚类算法首先需要依据初始聚类中心确定一个初始分割，然后不断的优化初始分割。初始聚类中心的选择对最终的聚类结果有较大影响，另外，该算法是建立在样本空间呈凸球面的基础上，如果样本空间非凸，该算法将会陷入局部优化。为了能够在任意形状的样本空间上进行聚类且收敛于全局最优，提出了一种基于KECA特征降维和聚类的HRCT周围神经分割方法。首先对KECA降维后的特征向量进行谱映射，然后用基于角度值的K-means算法对谱映射后的图像数据进行聚类，得到分割后的HRCT图像。

本发明的一个实验例叙述如下：

如图4所示。采用一组人脑MRI图像作为实验数据，数据格式为bmp，大小为512×512。图像中的白色以及白色中间的灰色部分均为病灶区域，该区域又可以分为水肿和肿瘤区域，从图像中可以看出该区域边界模糊，而实验的目的是将该部分分割出来。图5是医生根据先验知识手动标注的病灶区域，可以作为实验的标准truth。图6是采用本发明方法的分割结果，从视觉效果上看其基本满足了临床需求。图7是在图6基础上优化得到的结果。

为了量化实验结果，以图5中医生手动标注的图像作为标准truth，以均方误差(meansquarederror,mse)、峰值信噪比(peaksignaltonoiserate,psnr)和信息熵(entropy)作为客观衡量指标，采用6组数据进行统计平均。

表一评价指标

从上表可以看出，本发明的分割方法实验结果稳定，且在误差允许范围之内准确的分割出了病灶区域。由于缺少真正意义上的标准，而truth是医生手动描绘的，和真正的病灶区域存在一定的误差。从视觉效果上看，本实验的分割结果比较令人满意。

本发明提出一种基于KECA特征降维和聚类的HRCT周围神经分割方法，用核熵成分分析KECA降维方法对提取出的高维特征数据进行降维分析；根据降维之后不同类别数据的分布特点，采用改进的KECA谱聚类算法对数据进行聚类分析。实验结果表明：本发明算法不仅可以降低噪声对聚类结果的影响、提高分割精度，而且其不需要人机交互、具有很好的鲁棒性。

Claims

1.一种基于KECA特征降维和聚类的HRCT周围神经分割方法，其特征在于，包括以下步骤：

步骤一，利用非下采样Contourlet变换，即Non-SubsampledContourletTransform，NSCT，对神经高分辨率CT图像，即High-ResolutionComputedTomography，HRCT，进行分解，依据NSCT系数的分布特点，构建广义高斯混合模型，即GeneralizedGaussianMixtureModel，GGMM，对系数进行非线性处理，从而达到增强图像的目的；

步骤二，利用基于Gabor小波的纹理特征对增强后的HRCT图像进行特征提取；

步骤三，利用核熵成分分析方法，即KernelEntropyComponentAnalysis，KECA，对图像中的部分采样数据点进行降维，找出降维所需的相关信息；

步骤四，结合KECA降维算法的特点，采用采样外点扩展算法，即OutofSampleExtension，OSE，对图像中的全部数据点进行特征降维；

步骤五，根据降维之后不同类别数据的分布特性，利用改进的KECA谱聚类算法对降维后的特征数据进行聚类分割。

2.根据权利要求1所述的基于KECA特征降维和聚类的HRCT周围神经分割方法，其特征在于，所述步骤一的具体步骤如下：对给定的HRCT图像进行NSCT分解，NSCT具有平移不变特性，每个变换子带的像素位置都对应于原图像中相同的空间位置；因此，根据图像的NSCT变换系数来逐像素分析图像的几何信息，实验和观察分析表明：图像中的像素主要分为三类：强边缘、弱边缘和噪声；在NSCT变换域中，为了将弱边缘和背景噪声有效的区分开来，需要对NSCT变换的系数进行分析和处理，寻找其统计规律，NSCT子带系数的分布虽具有非高斯特性，但是比较符合零均值广义高斯分布，利用GGMM对其系数进行建模并分为大、中、小三类，分别对应强边缘、弱边缘和噪声，然后设计相应的非线性增强映射函数对这些系数分别进行处理，最后通过NSCT反变换实现图像的增强。

3.根据权利要求1所述的基于KECA特征降维和聚类的HRCT周围神经分割方法，其特征在于，所述步骤三的具体步骤如下：KECA的目的是最大程度地利用降维特征保留输入数据的熵，Rényi二次熵由下式给出：

H(p)＝-log∫p²(x)dx

其中，p(x)是原始数据集的概率密度函数，即D＝x₁,...,x_N，x_i∈R^d,i＝1,2,...,N，理论上，对于所处理的数据是一无所知的，所有提到的信息理论的测量都需要概率密度的估计，要在核方法和信息理论学习之间建立联系，由于对数函数是单调函数，我们集中在量V(p)＝∫p²(x)dx，这里使用Parzen窗来估计V(p)，估计式表示如下：

\hat{p} (x) = \frac{1}{N} \underset{x_{t} &Element; D}{Σ} K (x, x_{t} | σ)

其中，K(x,x_t|σ)被称为Parzen窗，或者中心在x_t、宽度参数为σ的核；

假定输入n个d维的数据集，X＝(x₁,x₂,…,x_n)，经过KECA变换后为s(s<d)维，Y＝(y₁,y₂,…,y_n)，可以得出其中，Λ是由核矩阵的特征值λ₁，λ₂，…，λ_n构成的对角矩阵，E是与特征值相对应的特征向量e₁,e₂,…,e_n构成的矩阵，

映射轴选择规则为：

Y = Λ_{s}^{\frac{1}{2}} E_{s}^{T} : \min_{λ_{1}, e_{1}, ... λ_{n}, e_{n}} \hat{V} (p) - {\hat{V}}_{s} (p)

Y = Λ_{s}^{\frac{1}{2}} E_{s}^{T} : \min_{λ_{1}, e_{1}, ..., λ_{n}, e_{n}} 1^{T} K 1 - 1^{T} K_{e c a} 1

从而得到：

\min_{λ_{1}, e_{1}, ..., λ_{n}, e_{n}} \frac{1}{n^{2}} 1^{T} (K - K_{e c a}) 1 = \frac{1}{n^{2}} Σ_{i = s + 1}^{n} {(\sqrt{λ_{i}} e_{i}^{T} 1)}^{2}

其中，

K_{e c a} = E_{s} Λ_{s} E_{s}^{T} .

4.根据权利要求1所述的基于KECA特征降维和聚类的HRCT周围神经分割方法，其特征在于，所述步骤四中的采样外点扩展算法OSE具体实施如下：

KECA变换，定义如下：

Φ_{e c a} = U_{m}^{T} Φ = Λ_{m}^{\frac{1}{2}} E_{m}^{T}

式中，m代表降维的目标维数，子空间U_m是由对数据的Renyi熵估计贡献最大的m个特征空间主轴张成的子空间，Φ将原始数据映射到U_m子空间上，从而得到降维后的m维数据，对于一个给定的数据点来说，不必求出其在高维空间中的具体形式，将采样外点φ(x)在某个主轴u_i上的投影表示为：

\begin{matrix} u_{i}^{T} φ (x) = < λ_{i}^{- \frac{1}{2}} Σ_{t = 1}^{N} e_{i, t} φ (x_{t}), φ (x) > \\ = λ^{- \frac{1}{2}} Σ_{t = 1}^{N} e_{i, t} K (x_{t}, x) \end{matrix}

{Φ^{*}}_{e c a} = U_{m}^{T} Φ^{*} = Λ_{m}^{- \frac{1}{2}} E_{m}^{T} Φ^{T} Φ^{*} = Λ_{m}^{- \frac{1}{2}} E_{m}^{T} K^{*}

对比上述两式，求出采样外点特征降维时对熵成分贡献最大的特征向量集e₁,e₂,...,e_m和特征值集λ₁,λ₂,...,λ_m，然后得到E_m和Λ_m；分别利用上面两式得到图像中采样点与才采样外点的降维特征，从而实现对HRCT图像中全部数据的特征降维。

5.根据权利要求1所述的基于KECA特征降维和聚类的HRCT周围神经分割方法，其特征在于，所述步骤五的具体步骤如下：

V_{C S} (p_{i}, p) = \frac{&Integral; p_{i} (x) p (x) d x}{\sqrt{&Integral; p_{i}^{2} (x) d x &Integral; p^{2} (x) d x}}

而KECA熵的估计为：

\hat{V} (p) = &Integral; {\hat{p}}^{2} (x) d x = \frac{1}{N^{2}} 1^{T} K 1 = \frac{1}{N^{2}} 1^{T} {φφ}^{T} 1 = μ^{T} μ = | | μ | |^{2}

由上两式得到：

{\overset{Λ}{V}}_{c s} (p_{i}, p_{j}) = \frac{μ_{i}^{T} μ_{j}}{| | μ_{i} | | \cdot | | μ_{i} | |} = c o s &angle; (μ_{i}, μ_{j})

在上述式子中，μ_i是第i束聚类C_i在核特征空间的均值，Cauchy-Schwarz差异能够很好的衡量这些均值向量之间的余弦角度值，能够捕捉不同类别数据之间的角度结构，整个代价函数用下式进行定义：

其中，N_i是聚类C_i中的样本数，μ_i是聚类的中心；

将核熵成分分析降维之后的数据，利用基于角度值的K-means算法进行聚类，得到KECA谱聚类算法，该谱聚类算法首先需要依据初始聚类中心确定一个初始分割，然后不断的优化初始分割，初始聚类中心的选择对最终的聚类结果有较大影响，另外，该算法是建立在样本空间呈凸球面的基础上，如果样本空间非凸，该算法将会陷入局部优化，为了能够在任意形状的样本空间上进行聚类且收敛于全局最优，提出了一种基于KECA特征降维和聚类的HRCT周围神经分割方法，首先对KECA降维后的特征向量进行谱映射，然后用基于角度值的K-means算法对谱映射后的图像数据进行聚类，得到分割后的HRCT图像。