CN109063766B - 一种基于判别性预测稀疏分解模型的图像分类方法 - Google Patents

一种基于判别性预测稀疏分解模型的图像分类方法 Download PDF

Info

Publication number
CN109063766B
CN109063766B CN201810855020.5A CN201810855020A CN109063766B CN 109063766 B CN109063766 B CN 109063766B CN 201810855020 A CN201810855020 A CN 201810855020A CN 109063766 B CN109063766 B CN 109063766B
Authority
CN
China
Prior art keywords
sparse decomposition
model
sparse
rgb
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810855020.5A
Other languages
English (en)
Other versions
CN109063766A (zh
Inventor
汤红忠
毛丽珍
李骁
刘婷
陈天宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiangtan University
Original Assignee
Xiangtan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiangtan University filed Critical Xiangtan University
Priority to CN201810855020.5A priority Critical patent/CN109063766B/zh
Publication of CN109063766A publication Critical patent/CN109063766A/zh
Application granted granted Critical
Publication of CN109063766B publication Critical patent/CN109063766B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2136Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on sparsity criteria, e.g. with an overcomplete basis

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于判别性预测稀疏分解模型的图像分类方法,包括以下步骤:首先建立基于堆栈的判别性预测稀疏分解模型,实现组织病理图像的RGB三通道的稀疏分解特征提取;然后通过聚类获得一个字典,并以此字典为基础,结合空间金字塔匹配模型,构造多通道联合稀疏编码模型;最后,基于支持向量机进行分类。本发明建立的基于堆栈的判别性预测稀疏分解模型具有更好的特征表示能力,可以获得判别性较强的特征,取得较好的分类性能与较强的鲁棒性。

Description

一种基于判别性预测稀疏分解模型的图像分类方法
技术领域
本发明涉及一种图像分类方法,特别涉及一种基于判别性预测稀疏分解模型的图像分类方法。
背景技术
组织病理图像包含大量复杂的病理信息:丰富的空间几何结构、类型多样且形态各异的细胞等,是病理学家对病人进行诊断的重要信息。围绕组织病理图像分类研究近年来取得了较大的发展。对于苏木精和伊红(Hematoxylin and Eosin,H&E)染色的病理图像的类型诊断、特征提取是组织病理图像CAD系统的关键环节,对疾病诊断有着极其重要的作用。良好的特征提取应具有以下特点:1)特征提取难度较低,即提取此类特征运算成本不能太大,同时结合特征的分类能力权衡考虑。2)选取的特征鲁棒性较强,即此特征对图像的噪声、光照、旋转等不敏感。3)选取的特征具有较强的判别性,能够区分不同的组织病理图像。
根据不同类型的特征的组织病理图像分类方法主要分为两类:一类是基于手工特征的组织病理图像分类方法,另一类是基于稀疏表示的组织病理图像分类方法。手工特征包括纹理特征、尺度不变特征(Scale invariant feature,SIFT)、局部二值模式(Localbinary patterns,LBP)和小波特征等。Ergin等分别提取病理图像的方向梯度直方图特征、DSIFT特征与局部结构特征,并比较了上述特征在支持向量机和决策树等分类器中乳腺癌组织病理图像的分类性能。Shrivastava等结合了高阶谱特征、颜色特征及纹理特征,利用主成分分析(Principal component analysis,PCA)进行特征降维,并基于支持向量机实现组织病理图像的分类。此类特征向量维度高、冗余度大,且根据图像的先验信息而设计,仅针对特定图像集的分类问题,应用范围受到一定的限制。
近年来,稀疏表示已被成功地应用于各种计算机视觉项目中,例如图像去噪,人脸识别和组织病理图像分类等。Chang等提出一种基于预测稀疏分解的组织病理图像分类方法,如图1,首先利用预测稀疏分解模型(Predictive sparse decomposition,PSD)学习组织病理图像的稀疏分解特征,然后引入空间金字塔匹配(Spatial pyramid matching,SPM)框架对稀疏分解特征进行编码,最后采用SVM进行病理图像的分类,目标函数为:
Figure BDA0001748316790000021
其中,Y为样本矩阵,W为编码器矩阵,Z为稀疏分解特征,G为对角增益矩阵,δ(·)为sigmoid函数,第三项为稀疏表示系数的非线性预测项。
Ranzato等提出深层特征具有更强的判别性能,更加适合于图像分类任务。于是,基于预测稀疏分解模型,Cheng等进一步提出了堆栈的预测稀疏分解(Stacked PredictiveSparse Decomposition,SPSD)模型,提取组织病理图像的深层特征用于分类。SPSD由n个PSD模型级联而成,上一级PSD模型的稀疏表示系数作为下一级PSD模型的输入。图2为SPSD模型的示意图。
但是,堆栈式预测稀疏分解模型为非监督的特征提取模型,提取的特征具有较强的重构能力,但是判别性能较差。然而在图像分类任务中,特征的判别性起着关键的作用。同时,考虑到组织病理图像的颜色信息在分类中扮演重要的信息,上述算法却将其忽视了。
发明内容
为了解决上述技术问题,本发明提供一种适用范围广、鲁棒性强、判别精度高的基于判别性预测稀疏分解模型的图像分类方法。
本发明解决上述问题的技术方案是:一种基于判别性预测稀疏分解模型的图像分类方法,包括以下步骤:
步骤一:从组织病理图像中随机选择M张作为训练图像,M′张作为测试图像,得到训练样本和测试样本;
步骤二:建立基于堆栈的判别性预测稀疏分解模型;
步骤三:将训练样本作为判别性预测稀疏分解模型的输入,对判别性预测稀疏分解模型进行求解,提取出组织病理图像的RGB三通道的稀疏分解特征;
步骤四:将所有的稀疏分解特征进行聚类,得到字典DRGB,根据字典DRGB建立联合字典
Figure BDA0001748316790000032
步骤五:利用建立的联合字典
Figure BDA0001748316790000033
建立多通道联合稀疏编码模型;
步骤六:将测试样本作为多通道联合稀疏编码模型的输入,求解多通道联合稀疏编码模型,并基于支持向量机进行分类。
上述基于判别性预测稀疏分解模型的图像分类方法,所述步骤一中,训练样本的获得方法为:从训练图像Ytrain中随机提取N个彩色图像块,并将图像块进行通道分离获得RGB三通道的图像块,然后三个通道的所有图像块转化为列向量,同一个通道列向量合并,分别构造RGB通道的训练样本YR,YG和YB;用同样的方法得到测试样本。
上述基于判别性预测稀疏分解模型的图像分类方法,所述步骤二中,判别性预测稀疏分解模型为:
Figure BDA0001748316790000031
其中,Y为样本,D为过完备字典,W为编码矩阵,Z为稀疏分解特征,G为增益对角矩阵,A为线性分类矩阵,Q为类标矩阵,α,β为正则化参数,且α,β>0,L为稀疏度;δ(·)为sigmoid函数,第一项
Figure BDA0001748316790000045
为稀疏重构项,第二项
Figure BDA0001748316790000046
为稀疏分解特征预测项,第三项
Figure BDA0001748316790000047
为分类误差项;||||F表示矩阵的F范数,
Figure BDA0001748316790000048
表示矩阵F范数的平方,||||0表示矩阵的l0范数;
基于堆栈的判别性预测稀疏分解模型由n个判别性预测分解模型级联而成,即前一级判别性预测稀疏分解模型的输出作为下一级判别性预测稀疏分解模型的输入,获得最终的学习特征。
上述基于判别性预测稀疏分解模型的图像分类方法,所述步骤三中,判别性预测稀疏分解模型的求解过程为:
1)初始化D、Z、G、W和A,令迭代次数iteration=1,最大迭代次数IM;
2)固定W和G,更新D,A和Z,则判别性预测稀疏分解模型化简为:
Figure BDA0001748316790000041
其中,I∈Rh×h表示尺寸为h*h的单位矩阵,令
Figure BDA0001748316790000042
Figure BDA0001748316790000043
Ynew表示由Y、G、Q构造的新的矩阵,Dnew表示由D、I、A构造的新的矩阵,则式(2)重新定义如下:
Figure BDA0001748316790000044
由式(3)可知,式(2)中的D,A和Z的更新,可转化为式(3)中字典Dnew和Z的更新:
①固定Dnew,利用SPAMS工具箱中的OMP算法求解式(3),获得稀疏分解特征Z;
②固定Z,更新Dnew,则式(3)定义如下:
Figure BDA0001748316790000051
采用随机梯度下降算法求解式(4)获得Dnew
3)固定D、W、A和Z,更新G,则式(1)重新定义如下:
Figure BDA0001748316790000052
式(5)为最小二乘估计问题,存在解析解,求解式(5),得到增益矩阵G的解析解;
4)固定D、G、A和Z,更新W,则式(1)重新定义如下:
Figure BDA0001748316790000053
采用随机梯度下降算法求解式(6),更新编码器矩阵W;
5)终止条件判断:判断是否达到最大迭代次数IM,若是则终止迭代,否则令iteration=iteration+1,返回步骤2),继续迭代。
上述基于判别性预测稀疏分解模型的图像分类方法,所述步骤三中,提取出组织病理图像的RGB三通道的稀疏分解特征的过程为:
1)分别将RGB三个通道的训练样本YR,YG和YB作为判别性预测稀疏分解模型的输入,按照判别性预测稀疏分解模型的求解过程对判别性预测稀疏分解模型进行求解,得到各级判别性预测稀疏分解模型RGB三个通道的增益对角矩阵GR、GG和GB,编码矩阵WR、WG和WB;其中,WR=[WR1,WR2,…,WRn],WRn表示R通道第n个判别性预测稀疏分解模型的编码矩阵,GR=[GR1,GR2,…,GRn],GRn表示R通道第n个判别性预测稀疏分解模型的增益对角矩阵;
2)提取训练样本RGB三个通道的稀疏分解特征ZR,ZG,ZB,R通道的稀疏分解特征为ZR=[ZR1,ZR2,…,ZRn],其中ZRn表示R通道的第n个辨别性预测稀疏分解模型的稀疏分解特征,提取公式为:
ZRn=GRnδ(GR(n-1)(…GR1δ(WR1YR))) (7)
同理获得训练样本G、B通道的稀疏分解特征ZG和ZB
上述基于判别性预测稀疏分解模型的图像分类方法,所述步骤四具体步骤为:
首先将图像RGB三通道的稀疏分解特征zRn、zGn和zBn表示为共有分量和独有分量两个部分之和,且这两部分采用相同的字典进行稀疏表示,其模型定义如下:
Figure BDA0001748316790000061
其中,zc是三通道的共享分量,
Figure BDA0001748316790000063
Figure BDA0001748316790000064
是RGB三通道分别对应的独有分量;
其次,利用K均值算法,将RGB三通道的所有稀疏分解特征一起聚类得到字典DRGB
上述基于判别性预测稀疏分解模型的图像分类方法,所述步骤五具体步骤为:
采用DRGB编码式(8)中的共享分量与独有分量,建立多通道联合编码模型,多通道联合编码模型定义如下:
Figure BDA0001748316790000062
其中,xc为三通道共享分量的表示系数,
Figure BDA0001748316790000065
Figure BDA0001748316790000066
为RGB三个通道独有分量的表示系数;
然后,将式(9)转化为如下矩阵形式:
Figure BDA0001748316790000071
其中,
Figure BDA0001748316790000073
为联合字典,
Figure BDA0001748316790000074
为联合编码系数,z=[zRn,zGn,zBn]T为组织病理图像RGB三通道的稀疏分解特征串联而成的列向量;
最后,结合空间金字塔匹配模型,引入图像空间结构信息,构造每层图像的多通道联合稀疏编码模型,多通道联合稀疏编码模型定义如下:
Figure BDA0001748316790000072
其中,λ为常数,
Figure BDA0001748316790000075
表示
Figure BDA0001748316790000076
中第j列,J表示
Figure BDA0001748316790000077
中原子的总个数,|| ||1表示l1范数,Z=[z1,z2,…,zn]为稀疏分解特征矩阵,
Figure BDA0001748316790000078
为联合稀疏表示系数,z=[zRn,zGn,zBn]T是Z=[z1,z2,…,zn]里面的列向量,
Figure BDA0001748316790000079
Figure BDA00017483167900000710
里面的列向量。
上述基于判别性预测稀疏分解模型的图像分类方法,所述步骤六中,首先将测试样本作为多通道联合稀疏编码模型的输入,利用LARS算法求解多通道联合稀疏编码模型获得每一层图像特征的联合稀疏表示系数,然后对联合稀疏表示系数进行多尺度最大池化,得到池化特征,再将得到的池化特征,作为SVM的输入,训练分类器,最后将获得的测试样本的联合稀疏表示系数输入到SVM分类器中进行分类。
本发明的有益效果在于:本发明首先建立基于堆栈的判别性预测稀疏分解模型,实现组织病理图像的RGB三通道的稀疏分解特征提取,然后通过聚类获得一个字典,并以此字典为基础,结合空间金字塔匹配模型,构造多通道联合稀疏编码模型,最后,基于支持向量机进行分类。本发明的建立的基于堆栈的判别性预测稀疏分解模型具有更好的特征表示能力,可以获得判别性较强的特征,取得较好的分类性能与较强的鲁棒性。
附图说明
图1为现有的预测稀疏分解模型的示意图。
图2为现有的堆栈式预测稀疏分解模型的示意图。
图3为本发明的流程图。
图4为实施例中肺、脾脏、肾脏的组织病理图像,其中(a)为健康图像,(b)为炎症图像。
图5为40×放大倍数下的腺病、管状腺癌和叶状癌的组织病理图像,其中(a)为腺病的组织病理图像,(b)为管状腺癌的组织病理图像,(c)为叶状癌的组织病理图像。
图6为参数α和β对不同病理图像分类的影响示意图,其中(a)为对肺部病例图像分类的影响,(b)为对脾脏病例图像分类的影响,(c)为对肾脏病例图像分类的影响,(d)为对乳腺病例图像分类的影响。
图7为采用本发明的分类方法与其他分类方法的ROC特性曲线对比图。
具体实施方式
下面结合附图和实施例对本发明作进一步的说明。
如图3所示,一种基于判别性预测稀疏分解模型的图像分类方法,包括以下步骤:
步骤一:从组织病理图像中随机选择M张作为训练图像,M′张作为测试图像,得到训练样本和测试样本。
训练样本的获得方法为:从训练图像Ytrain中随机提取N个彩色图像块,并将图像块进行通道分离获得RGB三通道的图像块,然后三个通道的所有图像块转化为列向量,同一个通道列向量合并,分别构造RGB通道的训练样本YR,YG和YB;用同样的方法得到测试样本。
步骤二:建立基于堆栈的判别性预测稀疏分解模型。判别性预测稀疏分解模型为:
Figure BDA0001748316790000091
其中,Y为样本,D为过完备字典,W为编码矩阵,Z为稀疏分解特征,G为增益对角矩阵,A为线性分类矩阵,Q为类标矩阵,α,β为正则化参数,且α,β>0,L为稀疏度;δ(·)为sigmoid函数;第一项
Figure BDA0001748316790000092
为稀疏重构项,第二项
Figure BDA0001748316790000093
为稀疏分解特征预测项,第三项
Figure BDA0001748316790000094
为分类误差项,|| ||F表示求内部矩阵的F范数,
Figure BDA0001748316790000095
表示矩阵的F范数的平方,|| ||0表示矩阵的l0范数。通过优化式(1),可获得如下性能:1、稀疏分解特征预测项确保了测试样本的稀疏分解特征可预测,且能迅速求解;2、分类误差项确保了稀疏分解特征具有判别性。
基于堆栈的判别性预测稀疏分解模型由n个判别性预测分解模型级联而成,即前一级判别性预测稀疏分解模型的输出作为下一级判别性预测稀疏分解模型的输入,获得最终的学习特征。
本文所提出的基于堆栈的判别性预测稀疏分解模型,与传统的堆栈式预稀疏分解模型的不同之处在于:1)本发明的模型利用样本的类标信息,在目标函数中增加线性分类器,从而更好引导判别性特征学习;2)本发明对于病理图像的RGB三个通道,分别采用SDPSD模型进行特征提取。
式(1)是典型的非凸优化问题,其求解一般通过交替迭代更新的方法直至收敛,获得最优的D、Z、G、W和A。
步骤三:将训练样本作为判别性预测稀疏分解模型的输入,对判别性预测稀疏分解模型进行求解,提取出组织病理图像的RGB三通道的稀疏分解特征。
判别性预测稀疏分解模型的求解过程为:
1)初始化D、Z、G、W和A,令迭代次数iteration=1,最大迭代次数IM;
2)固定W和G,更新D,A和Z,则判别性预测稀疏分解模型化简为:
Figure BDA0001748316790000101
其中,I∈Rh×h表示尺寸为h*h的单位矩阵,令
Figure BDA0001748316790000102
Figure BDA0001748316790000103
Ynew表示由Y、G、Q构造的新的矩阵,Dnew表示由D、I、A构造的新的矩阵,则式(2)重新定义如下:
Figure BDA0001748316790000104
由式(3)可知,式(2)中的D,A和Z的更新,可转化为式(3)中字典Dnew和Z的更新;
①固定Dnew,利用SPAMS工具箱中的OMP算法求解式(3),获得稀疏分解特征Z;
②固定Z,更新Dnew,则式(3)定义如下:
Figure BDA0001748316790000105
由于本发明中字典维数较高,采用随机梯度下降算法求解式(4)获得Dnew;并且根据
Figure BDA0001748316790000106
可知字典D和线性分类矩阵A更新字典Dnew
3)固定D、W、A和Z,更新G,则式(1)重新定义如下:
Figure BDA0001748316790000111
式(5)为最小二乘估计问题,存在解析解,求解式(5),得到增益矩阵G的解析解;
4)固定D、G、A和Z,更新W,则式(1)重新定义如下:
Figure BDA0001748316790000112
采用随机梯度下降算法求解式(6),更新编码器矩阵W;
5)终止条件判断:判断是否达到最大迭代次数IM,若是则终止迭代,否则令iteration=iteration+1,返回步骤2),继续迭代。
提取出组织病理图像的RGB三通道的稀疏分解特征的过程为:
1)初始化RGB三通道的过完备字典DR、DG和DB,RGB三通道的稀疏分解特征ZR、ZG和ZB,RGB三通道的增益对角阵GR、GG和GB,RGB三通道的编码矩阵WR、WG和WB,RGB三通道的线性分类矩阵AR、AG和AB;分别将RGB三个通道的训练样本YR,YG和YB作为判别性预测稀疏分解模型的输入,按照判别性预测稀疏分解模型的求解过程对判别性预测稀疏分解模型进行求解,得到各级判别性预测稀疏分解模型RGB三个通道的增益对角矩阵GR、GG和GB,编码矩阵WR、WG和WB;其中,WR=[WR1,WR2,…,WRn],GR=[GR1,GR2,…,GRn];WRn表示R通道第n个判别性预测稀疏分解模型的编码矩阵,GR=[GR1,GR2,…,GRn],GRn表示R通道第n个判别性预测稀疏分解模型的增益对角矩阵;
2)提取训练样本RGB三个通道的稀疏分解特征ZR,ZG,ZB,R通道的稀疏分解特征为ZR=[ZR1,ZR2,…,ZRn],其中ZRn表示R通道的第n个辨别性预测稀疏分解模型的稀疏分解特征,提取公式为:
ZRn=GRnδ(GR(n-1)(…GR1δ(WR1YR))) (7)
同理获得训练样本G、B通道的稀疏分解特征ZG和ZB
步骤四:将所有的稀疏分解特征进行聚类,得到字典DRGB,根据字典DRGB建立联合字典
Figure BDA0001748316790000124
首先将图像RGB三通道的稀疏分解特征zRn、zGn和zBn表示为共有分量和独有分量两个部分之和,且这两部分采用相同的字典进行稀疏表示,其模型定义如下:
Figure BDA0001748316790000121
其中,zc是三通道的共享分量,
Figure BDA0001748316790000125
Figure BDA0001748316790000126
是RGB三通道分别对应的独有分量;
其次,利用K均值算法,将RGB三通道的所有稀疏分解特征一起聚类得到字典DRGB
步骤五:利用建立的联合字典
Figure BDA0001748316790000127
建立多通道联合稀疏编码模型。
采用DRGB编码式(8)中的共享分量与独有分量,建立多通道联合编码模型,多通道联合编码模型定义如下:
Figure BDA0001748316790000122
其中,xc为三通道共享分量的表示系数,
Figure BDA0001748316790000128
Figure BDA0001748316790000129
为RGB三个通道独有分量的表示系数;然后,将式(9)转化为如下矩阵形式:
Figure BDA0001748316790000123
其中,
Figure BDA00017483167900001210
为联合字典,
Figure BDA00017483167900001211
为联合编码系数,z=[zRn,zGn,zBn]T为组织病理图像RGB三通道的稀疏分解特征串联而成的列向量;
最后,结合空间金字塔匹配模型,将图像分为3层,并相应的划分为1、4和16个图像块,引入图像空间结构信息,构造每层图像的多通道联合稀疏编码模型,多通道联合稀疏编码模型定义如下:
Figure BDA0001748316790000131
其中,λ为常数,
Figure BDA0001748316790000132
表示
Figure BDA0001748316790000133
中第j列,J表示
Figure BDA0001748316790000134
中原子的总个数,|| ||1表示l1范数,Z=[z1,z2,…,zn]为稀疏分解特征矩阵,
Figure BDA0001748316790000135
为联合稀疏表示系数,z=[zRn,zGn,zBn]T是Z=[z1,z2,…,zn]里面的列向量,
Figure BDA0001748316790000136
Figure BDA0001748316790000137
里面的列向量。
步骤六:将测试样本作为多通道联合稀疏编码模型的输入,求解多通道联合稀疏编码模型,并基于支持向量机进行分类。
首先将测试样本作为多通道联合稀疏编码模型的输入,利用LARS算法求解多通道联合稀疏编码模型获得每一层图像特征的联合稀疏表示系数,然后对联合稀疏表示系数进行多尺度最大池化,得到池化特征,再将得到的池化特征,作为SVM的输入,训练分类器,最后将获得的测试样本的联合稀疏表示系数输入到SVM分类器中进行分类。
实施例
实验数据
(1)ADL数据集及相关实验设置
ADL数据集由宾夕法尼亚州立大学提供,共享900多张图像,包括牛的三类器官图像:肺,脾脏,肾脏。其中,每一类器官都包括健康和炎症两种类别,各占150多张。各类器官的两种医学病理组织示意图如图4所示,图4中(a)从左至右依次分别表示肺、脾脏、肾脏的健康图像,图4中(b)从左至右依次表示肺、脾脏、肾脏的炎症图像。本发明将所有图像归一化为600×600,针对肺、脾脏、肾脏的彩色图像,在相应的健康和炎症样本中分别随机选取70张图像作为训练集,剩余的图像中随机80张作为测试集。
(2)BreaKHis数据集及相关实验设置
为了验证本发明构建的模型同样适用于多分类的问题,将本文所提组织病理图像分类模型应用于BreaKHis数据集中疾病类型的诊断。该图像集中包括不同放大倍数(40×,100×,200×,400×)下82名患者的良性乳腺癌图像,共2368张,包括腺病、纤维腺癌、叶状癌和管状腺癌四个类别。40×放大倍数下的腺病、纤维腺癌和叶状癌和三种组织病理图像共计223张,其中,腺病图像为114张,叶状癌图像为109张,管状腺癌图像为149张。图5中(a)表示腺病的组织病理图像,图5中(b)表示叶状癌的组织病理图像,图5中(c)表示管状腺癌的组织病理图像。本发明选取了40×放大倍数下的腺病、管状腺癌和叶状癌三种组织病理图像作为实验样本。在腺病、管状腺癌和叶状癌的彩色图像中各随机选取40张,将每张彩色图像尺寸转化成400×400后,作为训练集。腺病,管状腺癌和叶状癌中剩余的图像中随机60张作为测试集。
实验参数设置
参数α和β的设置:参数α和β为基于堆栈的判别性预测稀疏分解模型中稀疏系数预测误差项和分类误差项正则化系数,极大地影响预测稀疏分解特征Z的判别性能。因此,图6给出了随参数α和β变化时,本发明的分类方法在不同组织病理图像的分类精度。如图6中(a)所示,肺部图像在α=1,β=1e-2时分类性能达到最优;如图6中(b)所示,脾脏图像在α=1e-2,β=1e-1时分类性能达到最优;如图6中(c)所示,肾脏图像在α=1e-1,β=1时分类性能达到最优;如图6中(d)所示,乳腺图像在α=1,β=1e-3时分类性能达到最优。
实验结果及分析
为了证明本文所提SDPSD方法的有效性,本发明对比了ScSPM方法、PSDSPM方法、PSDnSPM方法和JScSPM方法。表1、表2与表3分别给出了不同方法在肺部、脾脏和肾脏图像上的分类结果。其中,表1、表2与表3的第2行给出了不同方法下健康样本的正分率与错分率,第3行给出了不同方法下炎症样本的错分率与正分率。表中结果均为采用不同样本分别进行10次实验所取的平均值和标准差。
由表1、表2与表3可知,本发明提出的SDPSD方法对肺部、脾脏和肾脏的疾病诊断效果优于ScSPM、PSDSPM、PSDnSPM和JScSPM,其原因在于本文模型能够学习出的稀疏分解特征判别性较强,获得了较好的分类性能。根据表中分类精度的标准差可知,本文提出的SDPSD模型具有更强的鲁棒性。
表1不同方法在肺部图像的分类结果对比
Figure BDA0001748316790000151
表2不同方法在脾脏图像的分类结果对比
Figure BDA0001748316790000161
表3不同方法在肾脏图像的分类结果对比
Figure BDA0001748316790000162
上述表1、表2和表3给出了本发明方法用于二分类的情况,表4给出了本发明方法用于解决了BreaKHis数据集中的腺病、管状腺癌和叶状癌三种良性疾病的多分类问题,并与ScSPM、PSDSPM、PSDnSPM和JScSPM方法对比。由表4可知,本发明所提方法对于三种良性乳腺癌图像同样显示出了更好分类性能,且鲁棒性更强。
表4不同方法在BreaKHis数据集的分类结果对比
Figure BDA0001748316790000171
为了更直观地显示本文方法的优越性,图7给出了本文方法与其他方法的ROC曲线对比结果,图7中(a)、(b)、(c)分别为肺部、脾脏和肾脏的ROC特性曲线图,其中纵轴(Truepositive rate)表示击中率(匹配对被正确识别成匹配对的概率),横轴(False positiverate)为虚警率(非匹配对被错误识别成匹配对的概率)。从图7可知,虚警率相同的情况下,本发明提出的分类方法显示出了最佳的性能。
本发明提出了一种基于堆栈的判别性预测稀疏分解模型,并将其应用于组织病理图像的分类。该模型最大的特色在于提出了一种全新的特征学习方法:堆栈的判别性预测稀疏分解模型,该模型首先分别提取RGB三通道图像的判别性特征;然后考虑到各通道的特征即具有独特性,同时也具有共性,建立了多通道联合稀疏模型;最后结合SPM模型,针对不同层次的图像特征提出了联合稀疏表示模型,并利用稀疏表示系数进行分类。实验结果表明,本发明提出的模型具有更好的特征表示能力,可以获得判别性较强的特征,取得较好的分类性能与较强的鲁棒性。

Claims (7)

1.一种基于判别性预测稀疏分解模型的图像分类方法,包括以下步骤:
步骤一:从组织病理图像中随机选择M张作为训练图像,M′张作为测试图像,得到训练样本和测试样本;
步骤二:建立基于堆栈的判别性预测稀疏分解模型;
判别性预测稀疏分解模型为:
Figure FDA0003166966350000011
其中,Y为样本,D为过完备字典,W为编码矩阵,Z为稀疏分解特征,G为增益对角矩阵,A为线性分类矩阵,Q为类标矩阵,α,β为正则化参数,且α,β>0,L为稀疏度;δ(·)为sigmoid函数,第一项
Figure FDA0003166966350000012
为稀疏重构项,第二项
Figure FDA0003166966350000013
为稀疏分解特征预测项,第三项
Figure FDA0003166966350000014
为分类误差项;|| ||F表示矩阵的F范数,
Figure FDA0003166966350000015
表示矩阵的F范数的平方,|| ||0表示l0范数;
基于堆栈的判别性预测稀疏分解模型由n个判别性预测分解模型级联而成,即前一级判别性预测稀疏分解模型的输出作为下一级判别性预测稀疏分解模型的输入,获得最终的学习特征;
步骤三:将训练样本作为判别性预测稀疏分解模型的输入,对判别性预测稀疏分解模型进行求解,提取出组织病理图像的RGB三通道的稀疏分解特征;
步骤四:将所有的稀疏分解特征进行聚类,得到字典DRGB,根据字典DRGB建立联合字典
Figure FDA0003166966350000016
步骤五:利用建立的联合字典
Figure FDA0003166966350000017
建立多通道联合稀疏编码模型;
步骤六:将测试样本作为多通道联合稀疏编码模型的输入,求解多通道联合稀疏编码模型,并基于支持向量机进行分类。
2.根据权利要求1所述的基于判别性预测稀疏分解模型的图像分类方法,其特征在于,所述步骤一中,训练样本的获得方法为:从训练图像Ytrain中随机提取N个彩色图像块,并将图像块进行通道分离获得RGB三通道的图像块,然后三个通道的所有图像块转化为列向量,同一个通道列向量合并,分别构造RGB通道的训练样本YR,YG和YB;用同样的方法得到测试样本。
3.根据权利要求2所述的基于判别性预测稀疏分解模型的图像分类方法,其特征在于,所述步骤三中,判别性预测稀疏分解模型的求解过程为:
1)初始化D、Z、G、W和A,令迭代次数iteration=1,最大迭代次数IM;
2)固定W和G,更新D,A和Z,则判别性预测稀疏分解模型化简为:
Figure FDA0003166966350000021
其中,I∈Rh×h表示尺寸为h*h的单位矩阵,令
Figure FDA0003166966350000022
Figure FDA0003166966350000023
Ynew表示由Y、G、Q构造的新的矩阵,Dnew表示由D、I、A构造的新的矩阵,则式(2)重新定义如下:
Figure FDA0003166966350000024
由式(3)可知,式(2)中的D,A和Z的更新,可转化为式(3)中字典Dnew和Z的更新:
①固定Dnew,利用SPAMS工具箱中的OMP算法求解式(3),获得稀疏分解特征Z;
②固定Z,更新Dnew,则式(3)定义如下:
Figure FDA0003166966350000025
采用随机梯度下降算法求解式(4)获得Dnew
3)固定D、W、A和Z,更新G,则式(1)重新定义如下:
Figure FDA0003166966350000031
式(5)为最小二乘估计问题,存在解析解,求解式(5),得到增益矩阵G的解析解;
4)固定D、G、A和Z,更新W,则式(1)重新定义如下:
Figure FDA0003166966350000032
采用随机梯度下降算法求解式(6),更新编码器矩阵W;
5)终止条件判断:判断是否达到最大迭代次数IM,若是则终止迭代,否则令iteration=iteration+1,返回步骤2),继续迭代。
4.根据权利要求3所述的基于判别性预测稀疏分解模型的图像分类方法,其特征在于,所述步骤三中,提取出组织病理图像的RGB三通道的稀疏分解特征的过程为:
1)分别将RGB三个通道的训练样本YR,YG和YB作为判别性预测稀疏分解模型的输入,按照判别性预测稀疏分解模型的求解过程对判别性预测稀疏分解模型进行求解,得到各级判别性预测稀疏分解模型RGB三个通道的增益对角矩阵GR、GG和GB,编码矩阵WR、WG和WB;其中,WR=[WR1,WR2,…,WRn],WRn表示R通道第n个判别性预测稀疏分解模型的编码矩阵,GR=[GR1,GR2,…,GRn],GRn表示R通道第n个判别性预测稀疏分解模型的增益对角矩阵;
2)提取训练样本RGB三个通道的稀疏分解特征ZR,ZG,ZB,R通道的稀疏分解特征为ZR=[ZR1,ZR2,…,ZRn],其中ZRn表示R通道的第n个辨别性预测稀疏分解模型的稀疏分解特征,提取公式为:
ZRn=GRnδ(GR(n-1)(…GR1δ(WR1YR))) (7)
同理获得训练样本G、B通道的稀疏分解特征ZG和ZB
5.根据权利要求4所述的基于判别性预测稀疏分解模型的图像分类方法,其特征在于,所述步骤四具体步骤为:
首先将图像RGB三通道的稀疏分解特征zRn、zGn和zBn表示为共有分量和独有分量两个部分之和,且这两部分采用相同的字典进行稀疏表示,其模型定义如下:
Figure FDA0003166966350000041
其中,zc是三通道的共享分量,
Figure FDA0003166966350000042
Figure FDA0003166966350000043
是RGB三通道分别对应的独有分量;
其次,利用K均值算法,将RGB三通道的所有稀疏分解特征一起聚类得到字典DRGB
6.根据权利要求5所述的基于判别性预测稀疏分解模型的图像分类方法,其特征在于,所述步骤五具体步骤为:
采用DRGB编码式(8)中的共享分量与独有分量,建立多通道联合编码模型,多通道联合编码模型定义如下:
Figure FDA0003166966350000044
其中,xc为三通道共享分量的表示系数,
Figure FDA0003166966350000045
Figure FDA0003166966350000046
为RGB三个通道独有分量的表示系数;
然后,将式(9)转化为如下矩阵形式:
Figure FDA0003166966350000051
其中,
Figure FDA0003166966350000052
为联合字典,
Figure FDA0003166966350000053
为联合编码系数,z=[zRn,zGn,zBn]T为组织病理图像RGB三通道的稀疏分解特征串联而成的列向量;
最后,结合空间金字塔匹配模型,引入图像空间结构信息,构造每层图像的多通道联合稀疏编码模型,多通道联合稀疏编码模型定义如下:
Figure FDA0003166966350000054
其中,λ为常数,
Figure FDA0003166966350000055
表示
Figure FDA0003166966350000056
中第j列,J表示
Figure FDA0003166966350000057
中原子的总个数,||||1表示l1范数,Z=[z1,z2,…,zn]为稀疏分解特征矩阵,
Figure FDA0003166966350000058
为联合稀疏表示系数,z=[zRn,zGn,zBn]T是Z=[z1,z2,…,zn]里面的列向量,
Figure FDA0003166966350000059
Figure FDA00031669663500000510
里面的列向量。
7.根据权利要求6所述的基于判别性预测稀疏分解模型的图像分类方法,其特征在于,所述步骤六中,首先将测试样本作为多通道联合稀疏编码模型的输入,利用LARS算法求解多通道联合稀疏编码模型获得每一层图像特征的联合稀疏表示系数,然后对联合稀疏表示系数进行多尺度最大池化,得到池化特征,再将得到的池化特征,作为SVM的输入,训练分类器,最后将获得的测试样本的联合稀疏表示系数输入到SVM分类器中进行分类。
CN201810855020.5A 2018-07-31 2018-07-31 一种基于判别性预测稀疏分解模型的图像分类方法 Active CN109063766B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810855020.5A CN109063766B (zh) 2018-07-31 2018-07-31 一种基于判别性预测稀疏分解模型的图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810855020.5A CN109063766B (zh) 2018-07-31 2018-07-31 一种基于判别性预测稀疏分解模型的图像分类方法

Publications (2)

Publication Number Publication Date
CN109063766A CN109063766A (zh) 2018-12-21
CN109063766B true CN109063766B (zh) 2021-11-30

Family

ID=64831391

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810855020.5A Active CN109063766B (zh) 2018-07-31 2018-07-31 一种基于判别性预测稀疏分解模型的图像分类方法

Country Status (1)

Country Link
CN (1) CN109063766B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110619359B (zh) * 2019-09-06 2020-11-27 上海杏脉信息科技有限公司 一种根据人体医学影像确定肺结核分级的方法与装置
CN115050024B (zh) * 2022-06-21 2023-08-22 广州医科大学 一种可解释性的粒细胞智能实时识别方法及系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8873836B1 (en) * 2012-06-29 2014-10-28 Emc Corporation Cluster-based classification of high-resolution data
WO2015112932A1 (en) * 2014-01-25 2015-07-30 Handzel Amir Aharon Automated histological diagnosis of bacterial infection using image analysis
CN104408478B (zh) * 2014-11-14 2017-07-25 西安电子科技大学 一种基于分层稀疏判别特征学习的高光谱图像分类方法
CN106845551B (zh) * 2017-01-24 2020-08-11 湘潭大学 一种组织病理图像识别方法
CN106803105B (zh) * 2017-02-09 2020-02-21 北京工业大学 一种基于稀疏表示字典学习的图像分类方法
CN107103325B (zh) * 2017-04-20 2021-01-26 湘潭大学 一种组织病理图像分类方法
CN108052911B (zh) * 2017-12-20 2021-12-07 上海海洋大学 基于深度学习的多模态遥感影像高层特征融合分类方法

Also Published As

Publication number Publication date
CN109063766A (zh) 2018-12-21

Similar Documents

Publication Publication Date Title
CN110020682B (zh) 一种基于小样本学习的注意力机制关系对比网络模型方法
CN104268593B (zh) 一种小样本情况下多稀疏表示的人脸识别方法
CN105760821B (zh) 基于核空间的分类聚集稀疏表示的人脸识别方法
CN108509854B (zh) 一种基于投影矩阵约束结合判别字典学习的行人再识别方法
CN110097060B (zh) 一种面向树干图像的开集识别方法
CN108446589B (zh) 复杂环境下基于低秩分解和辅助字典的人脸识别方法
CN112580590A (zh) 一种基于多语义特征融合网络的指静脉识别方法
CN112765352A (zh) 基于具有自注意力机制的图卷积神经网络文本分类方法
CN106845528A (zh) 一种基于K‑means与深度学习的图像分类算法
CN108664911B (zh) 一种基于图像稀疏表示的鲁棒人脸识别方法
CN109543723B (zh) 一种鲁棒的图像聚类方法
CN106845551B (zh) 一种组织病理图像识别方法
Champ et al. A comparative study of fine-grained classification methods in the context of the LifeCLEF plant identification challenge 2015
CN109840518B (zh) 一种结合分类与域适应的视觉追踪方法
CN113505856B (zh) 一种高光谱影像无监督自适应分类方法
CN109063766B (zh) 一种基于判别性预测稀疏分解模型的图像分类方法
CN104966075A (zh) 一种基于二维判别特征的人脸识别方法与系统
CN110991554B (zh) 一种基于改进pca的深度网络图像分类方法
CN110956113B (zh) 基于二次协作表示鉴别投影的鲁棒人脸识别方法
CN111310787A (zh) 一种基于堆叠编码器的脑功能网络多核模糊聚类方法
CN113378021A (zh) 基于半监督的信息熵主成分分析降维方法
CN110852304B (zh) 基于深度学习方法的高光谱数据处理方法
CN113920210A (zh) 基于自适应图学习主成分分析方法的图像低秩重构方法
CN111611963B (zh) 一种基于近邻保持典型相关分析的人脸识别方法
CN107729945A (zh) 基于类间稀疏表示的鉴别回归、分类方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant