CN111814887A - 一种基于子空间学习的图像特征提取方法 - Google Patents

一种基于子空间学习的图像特征提取方法 Download PDF

Info

Publication number
CN111814887A
CN111814887A CN202010668896.6A CN202010668896A CN111814887A CN 111814887 A CN111814887 A CN 111814887A CN 202010668896 A CN202010668896 A CN 202010668896A CN 111814887 A CN111814887 A CN 111814887A
Authority
CN
China
Prior art keywords
feature
image
subspace
matrix
unmarked
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010668896.6A
Other languages
English (en)
Inventor
李颖
王建坤
王高峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Management University
Original Assignee
Shandong Management University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Management University filed Critical Shandong Management University
Priority to CN202010668896.6A priority Critical patent/CN111814887A/zh
Publication of CN111814887A publication Critical patent/CN111814887A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/251Fusion techniques of input or preprocessed data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出一种基于子空间学习的图像特征提取方法,该方法首先利用有标记的多特征图像学习投影矩阵,将多特征图像数据映射到一个公共的低维类标子空间中;然后利用投影矩阵将无标记的多特征图像数据映射到公共子空间;在此基础上,对公共子空间中的特征进行自加权运算,并对多特征进行加权融合,最后得到无标记图像在子空间中的新特征表示。本发明提出的方法解决了高维无标记图像特征提取的问题,有助于提高图像分类准确率。

Description

一种基于子空间学习的图像特征提取方法
技术领域
本发明涉及图像处理与分析技术领域,具体地说是一种基于子空间学习的图像特征提取方法。
背景技术
随着图像采集技术和计算机技术的飞速发展,图像处理与分析成为研究的热点。由于图像含有丰富的信息,其维数往往较高,对高维图像数据进行降维并提取出有效的特征是后续图像分析与应用的重要基础。特征是描述图像模式的最佳方式,特征的各个维度能够从不同的角度描述图像。特征提取的主要思想是将原始样本投影到一个低维特征空间,得到最能反应样本本质或进行样本区分的低维样本特征。随着机器学习理论在图像特征提取领域的应用不断深入,近年来,很多新的方法与思想被应用于图像特征提取领域,子空间学习方法是比较有代表性的方法之一。
子空间学习旨在将图像从原始特征空间转换到子空间,降低特征维数同时获得新的图像特征表示。常用的子空间学习方法,如典型相关分析(Canonical CorrelationAnalysis,CCA)、核典型关联分析方法(Kernel Canonical Correlation Analysis,KCCA)、独立成分分析(Independent Component Analysis,ICA)、局部线性嵌入(Locally LinearEmbedding,LLE)、偏最小二乘(Partial Least Squares,PLS)和局部保持投影(LocalityPreserving Projection,LPP)等均在图像分析和处理领域广泛应用并表现出良好的性能。然而,图像包含有丰富的信息,比如2D图像可以提取出颜色、形状、纹理和空间关系等特征;磁共振影像可以提取出大脑的皮层厚度、体积、表面积和局部回指标等特征。因此,利用子空间学习方法挖掘图像不同特征之间的潜在关联并找到图像的最佳低维表示对后续的图像处理与分析具有重要意义。
此外,在现实生活中,大量的图像数据是没有标记信息的,而少量图像可以通过人工标注的方法获得标记信息。如何利用有标记的图像更好地对无标记的图像提取特征,促进无标记图像的识别与分析,也具有重要研究意义。
发明内容
本发明为克服上述现有技术的不足,提出了一种特征提取方法,用于后续的图像分类。该方法首先利用有标记的多特征图像学习投影矩阵,将多特征图像数据映射到一个公共的低维类标子空间中,在子空间中尽可能保持多特征之间的相关性、原始的数据结构以及数据与类标之间的对应关系。然后利用投影矩阵将无标记的多特征图像数据映射到公共子空间。在此基础上,对公共子空间中的特征进行自加权运算,并对多特征进行加权融合,最后得到无标记图像在子空间中的新特征表示。本方法能够充分利用图像的多特征信息、数据的结构信息和数据的类标信息对无标记图像提取特征,显著提高了无标记图像的分类准确率。
本发明的技术方案是:
一种基于子空间学习的图像特征提取方法,该方法首先利用有标记的多特征图像学习投影矩阵,将多特征图像数据映射到一个公共的低维类标子空间中;然后利用投影矩阵将无标记的多特征图像数据映射到公共子空间;在此基础上,对公共子空间中的特征进行自加权运算,并对多特征进行加权融合,最后得到无标记图像在子空间中的新特征表示,该方法包括如下步骤:
(1)对采集的磁共振MRI图像进行预处理,提取多种形态学特征;
(2)使用有标记样本学习投影矩阵
定义
Figure BDA0002581569130000021
为特征矩阵A,
Figure BDA0002581569130000022
为特征矩阵B,其中n为有标记样本数目,d为特征维数,
Figure BDA0002581569130000023
为第n个样本的A特征向量,
Figure BDA0002581569130000024
为第n个样本的B特征向量,定义Y∈Rn×c是由0-1编码组成的类标矩阵,其中c为类别数目,为了学习两个投影矩阵Ud×c和Vd×c,目标函数定义如下:
Figure BDA0002581569130000025
目标函数的第一项l(U,V)是从特征空间到类标空间的线性回归项,它保证了投影后的样本与类标相对应,l(U,V)定义如下:
Figure BDA0002581569130000026
目标函数的第二项f(U,V)用于保持同一幅图像的A特征和B特征在子空间中尽可能靠近,f(U,V)定义如下:
Figure BDA0002581569130000027
目标函数的第三项g(U,V)是图正则化项,用来保持单一特征样本之间的邻域关系这一局部结构信息,关于A特征数据XA的图正则化项,定义一个无向对称图GA=(VA,WA),其中VA是XA中的样本集合,WA表示样本之间的关系,WA中的每个元素
Figure BDA0002581569130000031
定义为:
Figure BDA0002581569130000032
其中
Figure BDA0002581569130000033
定义为
Figure BDA0002581569130000034
的k近邻,定义ai为UTXA的第i列,A特征数据的图正则化项定义如下:
Figure BDA0002581569130000035
其中LA=DA-WA是图拉普拉斯矩阵,DA∈Rn×n是对角矩阵,其对角线元素为
Figure BDA0002581569130000036
对于B特征数据XB,定义bi为VTXB的第i列,B特征数据的图正则化项定义如下:
Figure BDA0002581569130000037
其中
Figure BDA0002581569130000038
和LB的定义如前所述,最终,图正则化项g(U,V)表示为
Figure BDA0002581569130000039
目标函数的最后一项r(U,V)控制投影矩阵的尺度以避免产生过拟合:
Figure BDA00025815691300000310
此外,λ,α和β是三个平衡参数,基于公式(2),(3),(7)和(8),得到最终的目标函数为
Figure BDA0002581569130000041
(3)无标记样本特征提取
定义
Figure BDA0002581569130000042
Figure BDA0002581569130000043
分别为m个无标记样本的A特征矩阵和B特征矩阵,无标记样本在子空间中的特征表示为FeaA∈Rm×c和FeaB∈Rm×c,计算如下:
Figure BDA0002581569130000044
Figure BDA0002581569130000045
为了使无标记样本的投影特征更具区分性,同时平衡A和B两种特征对分类的影响,对子空间中的特征进行自加权运算和加权融合,得到最终的特征,最终,无标记样本的特征为
Fea=η*(|FeaA|*FeaA)+(1-η)*(|FeaB|*FeaB) (15)
其中η为权重参数。
特别地,步骤(1)的具体方式为:采集MRI图像数据,使用FreeSurfer软件进行预处理,提取多种形态学特征;然后,使用高斯核函数对图像进行平滑;最后,使用自动解剖标记(Automated Anatomical Labeling,AAL)模板计算每个解剖区域的多种形态学特征值。
本发明还包括一种医学图像分类装置,该装置包括数据采集部件、存储器和处理器,其中,
所述数据采集部件采集并对采集的MRI图像进行预处理,提取形态学特征;
所述存储器存储有计算机程序,所述程序被处理器执行时能够实现上述方法的步骤(2)至步骤(3)。
本发明还包括一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述方法的步骤。
本发明的有益效果是:利用有标记图像和子空间学习方法对无标记图像进行特征提取,充分利用了图像的多特征信息、有标记图像数据的结构信息和类标信息。该方法提取的特征显著降低了原始图像数据的维数,能更好地反映出图像的本质信息,具有较强的区分性、鲁棒性和更好的泛化能力。
附图说明
图1是本发明的基于子空间学习的图像特征提取方法示意框图;
图2是MR图像示意图。
具体实施方式
下面结合附图和实例对本发明作进一步说明。
如图1所示,以阿茨海默症(Alzheimer’s disease,AD)患者和正常受试者(normalcontrols,NC)的MRI图像作为有标记数据,以转化型轻度认知障碍(progressive mildcognitive impairment,pMCI)患者和稳定型轻度认知障碍(stable mild cognitiveimpairment,sMCI)患者的MRI图像作为无标记数据,用本发明提出的基于子空间学习的图像特征提取方法对pMCI和sMCI患者图像提取特征的具体步骤如下文所示:
(1)图像预处理
从ADNI数据库中随机选取142个AD患者,165个正常受试者,126个pMCI患者和95个sMCI患者的MRI图像(如图2所示),使用FreeSurfer软件进行预处理,提取皮层厚度(cortical thickness,CT)和体积(volume,VOL)两种形态学特征。CT指的是每个顶点中白质和灰质表面之间的最近距离。然后,使用高斯核函数对图像进行平滑。最后,使用自动解剖标记(Automated Anatomical Labeling,AAL)模板计算每个解剖区域的平均CT和VOL。特别地,由于缺乏CT特征,排除掉12个AAL皮质下区域,使用其余78个脑区的数据。
(2)使用AD和NC数据学习投影矩阵
定义
Figure BDA0002581569130000051
为皮层厚度特征矩阵,
Figure BDA0002581569130000052
为体积特征矩阵,其中n为AD和NC受试者数目之和,d为特征维数。定义Y∈Rn×c是由0-1编码组成的类标矩阵,其中c为类别数目。为了学习两个投影矩阵Ud×c和Vd×c,目标函数定义如下:
Figure BDA0002581569130000053
l(U,V)是从特征空间到类标空间的线性回归项,它保证了投影后的样本与类标相对应。l(U,V)定义如下:
Figure BDA0002581569130000061
第二项用于保持同一幅图像的CT特征和体积特征在子空间中尽可能靠近。众所周知,同一幅图像的不同形态学特征从不同角度反映了相同的类标信息,它们在子空间中应该是一一对应并尽可能靠近的。因此,f(U,V)定义如下:
Figure BDA0002581569130000062
第三项g(U,V)是图正则化项,用来保持数据的局部结构信息。我们通过图正则化项来保持单一形态特征样本之间的邻域关系。这里,我们首先介绍CT特征数据的图正则化项XCT。我们定义一个无向对称图GCT=(VCT,WCT),其中VCT是XCT中的样本集合,WCT表示样本之间的关系。WCT中的每个元素
Figure BDA0002581569130000063
定义为:
Figure BDA0002581569130000064
其中
Figure BDA0002581569130000065
定义为
Figure BDA0002581569130000066
的k近邻。定义ai为UTXCT的第i列,CT特征数据的图正则化项定义如下:
Figure BDA0002581569130000067
其中LCT=DCT-WCT是图拉普拉斯矩阵,DCT∈Rn×n是对角矩阵,其对角线元素为
Figure BDA0002581569130000068
类似的,对于体积特征数据XVOL,定义bi为VTXVOL的第i列。体积特征数据的图正则化项定义如下:
Figure BDA0002581569130000069
其中
Figure BDA0002581569130000071
和LVOL的定义如前所述。最终,图正则化项g(U,V)表示为
Figure BDA0002581569130000072
最后一项r(U,V)控制投影矩阵的尺度以避免产生过拟合:
Figure BDA0002581569130000073
此外,λ,α和β是三个平衡参数。基于公式(2),(3),(7)和(8),我们得到最终的目标函数为
Figure BDA0002581569130000074
优化算法如下:
初始化矩阵U和V为零矩阵。我们迭代的固定一个变量更新另一个变量。首先,固定V,Q(U,V)对U求偏导,并设置为0,我们得到
Figure BDA0002581569130000075
求得
Figure BDA0002581569130000076
类似的,固定U更新V,我们求得
Figure BDA0002581569130000077
算法1概括了利用AD和NC数据学习投影矩阵的过程。
Figure BDA0002581569130000078
Figure BDA0002581569130000081
(3)MCI患者特征提取
定义
Figure BDA0002581569130000082
Figure BDA0002581569130000083
分别为m个MCI患者的皮层厚度和体积特征矩阵。MCI患者在子空间中的特征表示为FeaCT∈Rm×c和FeaVOL∈Rm×c,计算如下:
Figure BDA0002581569130000084
Figure BDA0002581569130000085
为了使pMCI和sMCI患者的投影特征更具区分性,同时平衡皮层厚度和体积两种形态学特征对分类的影响,我们对子空间中的特征进行自加权运算和加权融合,得到最终的特征。最终,MCI患者的生物标记为
Fea=η*(|FeaCT|*FeaCT)+(1-η)*(|FeaVOL|*FeaVOL) (15)
其中η为权重参数。
本发明的效果可以通过实验结果进一步说明。
实验数据为从ADNI数据库中随机选取的126个pMCI患者和95个sMCI患者的图像数据。将数据集划分为训练集和测试集两部分,采用十折交叉验证的方法进行实验。本方法与经典的特征提取方法PCA和ICA进行比较,分类器采用基于线性核函数的支持向量机分类器,表1记录了实验的结果。从表1可以看到,采用本发明提出的生物特征后,算法识别的准确度、敏感性和ROC曲线下面积均得到了有效提升,说明本方法提取的特征有利于分类性能的提高。
表1传统的特征提取方法和本发明的特征提取方法分类性能比较
特征提取方法 准确率(%) 敏感性(%) 特异性(%) ROC曲线下面积
PCA 61.32 53.62 71.49 0.6512
ICA 61.76 74.82 44.25 0.6335
本发明 69.37 75.39 61.23 0.6951

Claims (4)

1.一种基于子空间学习的图像特征提取方法,该方法首先利用有标记的多特征图像学习投影矩阵,将多特征图像数据映射到一个公共的低维类标子空间中;然后利用投影矩阵将无标记的多特征图像数据映射到公共子空间;在此基础上,对公共子空间中的特征进行自加权运算,并对多特征进行加权融合,最后得到无标记图像在子空间中的新特征表示,该方法包括如下步骤:
(1)对采集的磁共振MRI图像进行预处理,提取多种形态学特征;
(2)使用有标记样本学习投影矩阵
定义
Figure FDA0002581569120000011
为特征矩阵A,
Figure FDA0002581569120000012
为特征矩阵B,其中n为有标记样本数目,d为特征维数,
Figure FDA0002581569120000013
为第n个样本的A特征向量,
Figure FDA0002581569120000014
为第n个样本的B特征向量,定义Y∈Rn×c是由0-1编码组成的类标矩阵,其中c为类别数目,为了学习两个投影矩阵Ud×c和Vd×c,目标函数定义如下:
Figure FDA0002581569120000015
目标函数第一项l(U,V)是从特征空间到类标空间的线性回归项,它保证了投影后的样本与类标相对应,l(U,V)定义如下:
Figure FDA0002581569120000016
目标函数第二项用于保持同一幅图像的A特征和B特征在子空间中尽可能靠近,f(U,V)定义如下:
Figure FDA0002581569120000017
目标函数第三项g(U,V)是图正则化项,用来保持单一特征样本之间的邻域关系这一局部结构信息,关于A特征数据XA的图正则化项,定义一个无向对称图GA=(VA,WA),其中VA是XA中的样本集合,WA表示样本之间的关系,WA中的每个元素
Figure FDA0002581569120000018
定义为:
Figure FDA0002581569120000021
其中
Figure FDA0002581569120000022
定义为
Figure FDA0002581569120000023
的k近邻,定义ai为UTXA的第i列,A特征数据的图正则化项定义如下:
Figure FDA0002581569120000024
其中LA=DA-WA是图拉普拉斯矩阵,DA∈Rn×n是对角矩阵,其对角线元素为
Figure FDA0002581569120000025
对于B特征数据XB,定义bi为VTXB的第i列,B特征数据的图正则化项定义如下:
Figure FDA0002581569120000026
其中
Figure FDA0002581569120000027
和LB的定义如前所述,最终,图正则化项g(U,V)表示为
Figure FDA0002581569120000028
目标函数最后一项r(U,V)控制投影矩阵的尺度以避免产生过拟合:
Figure FDA0002581569120000029
此外,λ,α和β是三个平衡参数,基于公式(2),(3),(7)和(8),得到最终的目标函数为
Figure FDA00025815691200000210
(3)无标记样本特征提取
定义
Figure FDA00025815691200000211
Figure FDA00025815691200000212
分别为m个无标记样本的A特征矩阵和B特征矩阵,无标记样本在子空间中的特征表示为FeaA∈Rm×c和FeaB∈Rm×c,计算如下:
Figure FDA0002581569120000031
Figure FDA0002581569120000032
为了使无标记样本的投影特征更具区分性,同时平衡A和B两种特征对分类的影响,对子空间中的特征进行自加权运算和加权融合,得到最终的特征,最终,无标记样本的特征为
Fea=η*(|FeaA|*FeaA)+(1-η)*(|FeaB|*FeaB) (15)
其中η为权重参数。
2.如权利要求1所述的基于子空间学习的图像特征提取方法,其特征在于:步骤(1)的具体方式为:采集MRI图像数据,使用FreeSurfer软件进行预处理,提取多种形态学特征;然后,使用高斯核函数对图像进行平滑;最后,使用自动解剖标记AAL模板计算每个解剖区域的多种形态学特征值。
3.一种医学图像分类装置,该装置包括数据采集部件、存储器和处理器,其中,
所述数据采集部件采集并对采集的MRI图像进行预处理,提取形态学特征;
所述存储器存储有计算机程序,所述程序被处理器执行时能够实现权利要求1所述方法的步骤(2)至步骤(3)。
4.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1所述方法的步骤。
CN202010668896.6A 2020-07-13 2020-07-13 一种基于子空间学习的图像特征提取方法 Withdrawn CN111814887A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010668896.6A CN111814887A (zh) 2020-07-13 2020-07-13 一种基于子空间学习的图像特征提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010668896.6A CN111814887A (zh) 2020-07-13 2020-07-13 一种基于子空间学习的图像特征提取方法

Publications (1)

Publication Number Publication Date
CN111814887A true CN111814887A (zh) 2020-10-23

Family

ID=72843146

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010668896.6A Withdrawn CN111814887A (zh) 2020-07-13 2020-07-13 一种基于子空间学习的图像特征提取方法

Country Status (1)

Country Link
CN (1) CN111814887A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114384870A (zh) * 2021-11-10 2022-04-22 中国矿业大学 基于核局部线性嵌入pls的复杂工业过程运行状态评价方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114384870A (zh) * 2021-11-10 2022-04-22 中国矿业大学 基于核局部线性嵌入pls的复杂工业过程运行状态评价方法

Similar Documents

Publication Publication Date Title
CN107977671B (zh) 一种基于多任务卷积神经网络的舌象分类方法
Iyatomi et al. An improved internet-based melanoma screening system with dermatologist-like tumor area extraction algorithm
EP2483863B1 (en) Method and apparatus for processing medical images
CN111448582A (zh) 用于单通道全细胞分割的系统和方法
Pan et al. Cell detection in pathology and microscopy images with multi-scale fully convolutional neural networks
Fu et al. A novel pipeline leveraging surface-based features of small subcortical structures to classify individuals with autism spectrum disorder
CN111340770B (zh) 结合全局加权lbp和纹理分析的癌症预后模型构建方法
CN108960341B (zh) 一种面向脑网络的结构化特征选择方法
CN113706487A (zh) 基于自监督特征小样本学习的多器官分割方法
CN112348059A (zh) 基于深度学习的多种染色病理图像分类方法及系统
He et al. Unsupervised boundary delineation of spinal neural foramina using a multi-feature and adaptive spectral segmentation
So et al. Deep learning for Alzheimer’s disease classification using texture features
Kurkure et al. Landmark/image-based deformable registration of gene expression data
CN111080658A (zh) 基于可形变配准和dcnn的宫颈mri图像分割方法
CN110136840B (zh) 一种基于自加权分级生物特征的医学图像分类方法、装置和计算机可读存储介质
CN112036298A (zh) 一种基于双段区块卷积神经网络的细胞检测方法
CN116579975A (zh) 一种卷积神经网络的脑龄预测方法及系统
CN115546466A (zh) 一种基于多尺度显著特征融合的弱监督图像目标定位方法
Zhang et al. Dermoscopic image retrieval based on rotation-invariance deep hashing
CN107590806B (zh) 一种基于大脑医学成像的检测方法和系统
CN112991370B (zh) 一种岩心ct裂纹识别与分割方法
CN111814887A (zh) 一种基于子空间学习的图像特征提取方法
Mishra et al. A skin cancer image detection interface tool using vlf support vector machine classification
CN111814806A (zh) 一种基于有监督图正则化的图像特征提取方法
CN117036288A (zh) 一种面向全切片病理图像的肿瘤亚型诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20201023