CN111814887A

CN111814887A - 一种基于子空间学习的图像特征提取方法

Info

Publication number: CN111814887A
Application number: CN202010668896.6A
Authority: CN
Inventors: 李颖; 王建坤; 王高峰
Original assignee: Shandong Management University
Current assignee: Shandong Management University
Priority date: 2020-07-13
Filing date: 2020-07-13
Publication date: 2020-10-23

Abstract

本发明提出一种基于子空间学习的图像特征提取方法，该方法首先利用有标记的多特征图像学习投影矩阵，将多特征图像数据映射到一个公共的低维类标子空间中；然后利用投影矩阵将无标记的多特征图像数据映射到公共子空间；在此基础上，对公共子空间中的特征进行自加权运算，并对多特征进行加权融合，最后得到无标记图像在子空间中的新特征表示。本发明提出的方法解决了高维无标记图像特征提取的问题，有助于提高图像分类准确率。

Description

一种基于子空间学习的图像特征提取方法

技术领域

本发明涉及图像处理与分析技术领域，具体地说是一种基于子空间学习的图像特征提取方法。

背景技术

随着图像采集技术和计算机技术的飞速发展，图像处理与分析成为研究的热点。由于图像含有丰富的信息，其维数往往较高，对高维图像数据进行降维并提取出有效的特征是后续图像分析与应用的重要基础。特征是描述图像模式的最佳方式，特征的各个维度能够从不同的角度描述图像。特征提取的主要思想是将原始样本投影到一个低维特征空间，得到最能反应样本本质或进行样本区分的低维样本特征。随着机器学习理论在图像特征提取领域的应用不断深入，近年来，很多新的方法与思想被应用于图像特征提取领域，子空间学习方法是比较有代表性的方法之一。

子空间学习旨在将图像从原始特征空间转换到子空间，降低特征维数同时获得新的图像特征表示。常用的子空间学习方法，如典型相关分析(Canonical CorrelationAnalysis,CCA)、核典型关联分析方法(Kernel Canonical Correlation Analysis，KCCA)、独立成分分析(Independent Component Analysis,ICA)、局部线性嵌入(Locally LinearEmbedding,LLE)、偏最小二乘(Partial Least Squares,PLS)和局部保持投影(LocalityPreserving Projection,LPP)等均在图像分析和处理领域广泛应用并表现出良好的性能。然而，图像包含有丰富的信息，比如2D图像可以提取出颜色、形状、纹理和空间关系等特征；磁共振影像可以提取出大脑的皮层厚度、体积、表面积和局部回指标等特征。因此，利用子空间学习方法挖掘图像不同特征之间的潜在关联并找到图像的最佳低维表示对后续的图像处理与分析具有重要意义。

此外，在现实生活中，大量的图像数据是没有标记信息的，而少量图像可以通过人工标注的方法获得标记信息。如何利用有标记的图像更好地对无标记的图像提取特征，促进无标记图像的识别与分析，也具有重要研究意义。

发明内容

本发明为克服上述现有技术的不足，提出了一种特征提取方法，用于后续的图像分类。该方法首先利用有标记的多特征图像学习投影矩阵，将多特征图像数据映射到一个公共的低维类标子空间中，在子空间中尽可能保持多特征之间的相关性、原始的数据结构以及数据与类标之间的对应关系。然后利用投影矩阵将无标记的多特征图像数据映射到公共子空间。在此基础上，对公共子空间中的特征进行自加权运算，并对多特征进行加权融合，最后得到无标记图像在子空间中的新特征表示。本方法能够充分利用图像的多特征信息、数据的结构信息和数据的类标信息对无标记图像提取特征，显著提高了无标记图像的分类准确率。

本发明的技术方案是：

一种基于子空间学习的图像特征提取方法，该方法首先利用有标记的多特征图像学习投影矩阵，将多特征图像数据映射到一个公共的低维类标子空间中；然后利用投影矩阵将无标记的多特征图像数据映射到公共子空间；在此基础上，对公共子空间中的特征进行自加权运算，并对多特征进行加权融合，最后得到无标记图像在子空间中的新特征表示，该方法包括如下步骤：

(1)对采集的磁共振MRI图像进行预处理，提取多种形态学特征；

(2)使用有标记样本学习投影矩阵

定义

为特征矩阵A，

为特征矩阵B，其中n为有标记样本数目，d为特征维数，

为第n个样本的A特征向量，

为第n个样本的B特征向量，定义Y∈R^n×c是由0-1编码组成的类标矩阵，其中c为类别数目，为了学习两个投影矩阵U^d×c和V^d×c，目标函数定义如下：

目标函数的第一项l(U,V)是从特征空间到类标空间的线性回归项，它保证了投影后的样本与类标相对应，l(U,V)定义如下：

目标函数的第二项f(U,V)用于保持同一幅图像的A特征和B特征在子空间中尽可能靠近，f(U,V)定义如下：

目标函数的第三项g(U,V)是图正则化项，用来保持单一特征样本之间的邻域关系这一局部结构信息，关于A特征数据X_A的图正则化项，定义一个无向对称图G_A＝(V_A,W_A)，其中V_A是X_A中的样本集合，W_A表示样本之间的关系，W_A中的每个元素

定义为：

其中

定义为

的k近邻，定义a_i为U^TX_A的第i列，A特征数据的图正则化项定义如下：

其中L_A＝D_A-W_A是图拉普拉斯矩阵，D_A∈R^n×n是对角矩阵，其对角线元素为

对于B特征数据X_B，定义b_i为V^TX_B的第i列，B特征数据的图正则化项定义如下：

其中

和L_B的定义如前所述，最终，图正则化项g(U,V)表示为

目标函数的最后一项r(U,V)控制投影矩阵的尺度以避免产生过拟合：

此外，λ,α和β是三个平衡参数，基于公式(2),(3),(7)和(8)，得到最终的目标函数为

(3)无标记样本特征提取

定义

和

分别为m个无标记样本的A特征矩阵和B特征矩阵，无标记样本在子空间中的特征表示为Fea_A∈R^m×c和Fea_B∈R^m×c，计算如下：

为了使无标记样本的投影特征更具区分性，同时平衡A和B两种特征对分类的影响，对子空间中的特征进行自加权运算和加权融合，得到最终的特征，最终，无标记样本的特征为

Fea＝η*(|Fea_A|*Fea_A)+(1-η)*(|Fea_B|*Fea_B) (15)

其中η为权重参数。

特别地，步骤(1)的具体方式为：采集MRI图像数据，使用FreeSurfer软件进行预处理，提取多种形态学特征；然后，使用高斯核函数对图像进行平滑；最后，使用自动解剖标记(Automated Anatomical Labeling,AAL)模板计算每个解剖区域的多种形态学特征值。

本发明还包括一种医学图像分类装置，该装置包括数据采集部件、存储器和处理器，其中，

所述数据采集部件采集并对采集的MRI图像进行预处理，提取形态学特征；

所述存储器存储有计算机程序，所述程序被处理器执行时能够实现上述方法的步骤(2)至步骤(3)。

本发明还包括一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现上述方法的步骤。

本发明的有益效果是：利用有标记图像和子空间学习方法对无标记图像进行特征提取，充分利用了图像的多特征信息、有标记图像数据的结构信息和类标信息。该方法提取的特征显著降低了原始图像数据的维数，能更好地反映出图像的本质信息，具有较强的区分性、鲁棒性和更好的泛化能力。

附图说明

图1是本发明的基于子空间学习的图像特征提取方法示意框图；

图2是MR图像示意图。

具体实施方式

下面结合附图和实例对本发明作进一步说明。

如图1所示，以阿茨海默症(Alzheimer’s disease,AD)患者和正常受试者(normalcontrols,NC)的MRI图像作为有标记数据，以转化型轻度认知障碍(progressive mildcognitive impairment,pMCI)患者和稳定型轻度认知障碍(stable mild cognitiveimpairment,sMCI)患者的MRI图像作为无标记数据，用本发明提出的基于子空间学习的图像特征提取方法对pMCI和sMCI患者图像提取特征的具体步骤如下文所示：

(1)图像预处理

从ADNI数据库中随机选取142个AD患者，165个正常受试者，126个pMCI患者和95个sMCI患者的MRI图像(如图2所示)，使用FreeSurfer软件进行预处理，提取皮层厚度(cortical thickness,CT)和体积(volume,VOL)两种形态学特征。CT指的是每个顶点中白质和灰质表面之间的最近距离。然后，使用高斯核函数对图像进行平滑。最后，使用自动解剖标记(Automated Anatomical Labeling,AAL)模板计算每个解剖区域的平均CT和VOL。特别地，由于缺乏CT特征，排除掉12个AAL皮质下区域，使用其余78个脑区的数据。

(2)使用AD和NC数据学习投影矩阵

定义

为皮层厚度特征矩阵，

为体积特征矩阵，其中n为AD和NC受试者数目之和，d为特征维数。定义Y∈R^n×c是由0-1编码组成的类标矩阵，其中c为类别数目。为了学习两个投影矩阵U^d×c和V^d×c，目标函数定义如下：

l(U,V)是从特征空间到类标空间的线性回归项，它保证了投影后的样本与类标相对应。l(U,V)定义如下：

第二项用于保持同一幅图像的CT特征和体积特征在子空间中尽可能靠近。众所周知，同一幅图像的不同形态学特征从不同角度反映了相同的类标信息，它们在子空间中应该是一一对应并尽可能靠近的。因此，f(U,V)定义如下：

第三项g(U,V)是图正则化项，用来保持数据的局部结构信息。我们通过图正则化项来保持单一形态特征样本之间的邻域关系。这里，我们首先介绍CT特征数据的图正则化项X_CT。我们定义一个无向对称图G_CT＝(V_CT,W_CT)，其中V_CT是X_CT中的样本集合，W_CT表示样本之间的关系。W_CT中的每个元素

定义为：

其中

定义为

的k近邻。定义a_i为U^TX_CT的第i列，CT特征数据的图正则化项定义如下：

其中L_CT＝D_CT-W_CT是图拉普拉斯矩阵，D_CT∈R^n×n是对角矩阵，其对角线元素为

类似的，对于体积特征数据X_VOL，定义b_i为V^TX_VOL的第i列。体积特征数据的图正则化项定义如下：

其中

和L_VOL的定义如前所述。最终，图正则化项g(U,V)表示为

最后一项r(U,V)控制投影矩阵的尺度以避免产生过拟合：

此外，λ,α和β是三个平衡参数。基于公式(2),(3),(7)和(8)，我们得到最终的目标函数为

优化算法如下：

初始化矩阵U和V为零矩阵。我们迭代的固定一个变量更新另一个变量。首先，固定V，Q(U,V)对U求偏导，并设置为0，我们得到

求得

类似的，固定U更新V，我们求得

算法1概括了利用AD和NC数据学习投影矩阵的过程。

(3)MCI患者特征提取

定义

和

分别为m个MCI患者的皮层厚度和体积特征矩阵。MCI患者在子空间中的特征表示为Fea_CT∈R^m×c和Fea_VOL∈R^m×c，计算如下：

为了使pMCI和sMCI患者的投影特征更具区分性，同时平衡皮层厚度和体积两种形态学特征对分类的影响，我们对子空间中的特征进行自加权运算和加权融合，得到最终的特征。最终，MCI患者的生物标记为

Fea＝η*(|Fea_CT|*Fea_CT)+(1-η)*(|Fea_VOL|*Fea_VOL) (15)

其中η为权重参数。

本发明的效果可以通过实验结果进一步说明。

实验数据为从ADNI数据库中随机选取的126个pMCI患者和95个sMCI患者的图像数据。将数据集划分为训练集和测试集两部分，采用十折交叉验证的方法进行实验。本方法与经典的特征提取方法PCA和ICA进行比较，分类器采用基于线性核函数的支持向量机分类器，表1记录了实验的结果。从表1可以看到，采用本发明提出的生物特征后，算法识别的准确度、敏感性和ROC曲线下面积均得到了有效提升，说明本方法提取的特征有利于分类性能的提高。

表1传统的特征提取方法和本发明的特征提取方法分类性能比较

特征提取方法	准确率(％)	敏感性(％)	特异性(％)	ROC曲线下面积
					PCA	61.32	53.62	71.49	0.6512
ICA	61.76	74.82	44.25	0.6335
					本发明	69.37	75.39	61.23	0.6951

Claims

1.一种基于子空间学习的图像特征提取方法，该方法首先利用有标记的多特征图像学习投影矩阵，将多特征图像数据映射到一个公共的低维类标子空间中；然后利用投影矩阵将无标记的多特征图像数据映射到公共子空间；在此基础上，对公共子空间中的特征进行自加权运算，并对多特征进行加权融合，最后得到无标记图像在子空间中的新特征表示，该方法包括如下步骤：

(2)使用有标记样本学习投影矩阵

定义