CN109063766B - 一种基于判别性预测稀疏分解模型的图像分类方法 - Google Patents
一种基于判别性预测稀疏分解模型的图像分类方法 Download PDFInfo
- Publication number
- CN109063766B CN109063766B CN201810855020.5A CN201810855020A CN109063766B CN 109063766 B CN109063766 B CN 109063766B CN 201810855020 A CN201810855020 A CN 201810855020A CN 109063766 B CN109063766 B CN 109063766B
- Authority
- CN
- China
- Prior art keywords
- sparse decomposition
- model
- sparse
- rgb
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000354 decomposition reaction Methods 0.000 title claims abstract description 135
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000012706 support-vector machine Methods 0.000 claims abstract description 13
- 238000000605 extraction Methods 0.000 claims abstract description 9
- 239000011159 matrix material Substances 0.000 claims description 60
- 238000012549 training Methods 0.000 claims description 28
- 238000012360 testing method Methods 0.000 claims description 21
- 239000013598 vector Substances 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 7
- 238000011176 pooling Methods 0.000 claims description 7
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims description 6
- 238000000926 separation method Methods 0.000 claims description 3
- 210000004072 lung Anatomy 0.000 description 11
- 210000003734 kidney Anatomy 0.000 description 10
- 210000000952 spleen Anatomy 0.000 description 10
- 208000009956 adenocarcinoma Diseases 0.000 description 9
- 201000007423 tubular adenocarcinoma Diseases 0.000 description 9
- 206010028980 Neoplasm Diseases 0.000 description 8
- 201000011510 cancer Diseases 0.000 description 8
- 230000001575 pathological effect Effects 0.000 description 7
- 210000001519 tissue Anatomy 0.000 description 7
- 208000026555 breast adenosis Diseases 0.000 description 6
- 230000007170 pathology Effects 0.000 description 6
- 206010061218 Inflammation Diseases 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000004054 inflammatory process Effects 0.000 description 5
- 208000008771 Lymphadenopathy Diseases 0.000 description 4
- 208000013228 adenopathy Diseases 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 201000009030 Carcinoma Diseases 0.000 description 2
- WZUVPPKBWHMQCE-UHFFFAOYSA-N Haematoxylin Chemical compound C12=CC(O)=C(O)C=C2CC2(O)C1C1=CC=C(O)C(O)=C1OC2 WZUVPPKBWHMQCE-UHFFFAOYSA-N 0.000 description 2
- 210000000481 breast Anatomy 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 1
- 208000019693 Lung disease Diseases 0.000 description 1
- 241001440127 Phyllodes Species 0.000 description 1
- 208000019229 Spleen disease Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- YQGOJNYOYNNSMM-UHFFFAOYSA-N eosin Chemical compound [Na+].OC(=O)C1=CC=CC=C1C1=C2C=C(Br)C(=O)C(Br)=C2OC2=C(Br)C(O)=C(Br)C=C21 YQGOJNYOYNNSMM-UHFFFAOYSA-N 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 208000017169 kidney disease Diseases 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 208000027140 splenic disease Diseases 0.000 description 1
- 230000003393 splenic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2136—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on sparsity criteria, e.g. with an overcomplete basis
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于判别性预测稀疏分解模型的图像分类方法,包括以下步骤:首先建立基于堆栈的判别性预测稀疏分解模型,实现组织病理图像的RGB三通道的稀疏分解特征提取;然后通过聚类获得一个字典,并以此字典为基础,结合空间金字塔匹配模型,构造多通道联合稀疏编码模型;最后,基于支持向量机进行分类。本发明建立的基于堆栈的判别性预测稀疏分解模型具有更好的特征表示能力,可以获得判别性较强的特征,取得较好的分类性能与较强的鲁棒性。
Description
技术领域
本发明涉及一种图像分类方法,特别涉及一种基于判别性预测稀疏分解模型的图像分类方法。
背景技术
组织病理图像包含大量复杂的病理信息:丰富的空间几何结构、类型多样且形态各异的细胞等,是病理学家对病人进行诊断的重要信息。围绕组织病理图像分类研究近年来取得了较大的发展。对于苏木精和伊红(Hematoxylin and Eosin,H&E)染色的病理图像的类型诊断、特征提取是组织病理图像CAD系统的关键环节,对疾病诊断有着极其重要的作用。良好的特征提取应具有以下特点:1)特征提取难度较低,即提取此类特征运算成本不能太大,同时结合特征的分类能力权衡考虑。2)选取的特征鲁棒性较强,即此特征对图像的噪声、光照、旋转等不敏感。3)选取的特征具有较强的判别性,能够区分不同的组织病理图像。
根据不同类型的特征的组织病理图像分类方法主要分为两类:一类是基于手工特征的组织病理图像分类方法,另一类是基于稀疏表示的组织病理图像分类方法。手工特征包括纹理特征、尺度不变特征(Scale invariant feature,SIFT)、局部二值模式(Localbinary patterns,LBP)和小波特征等。Ergin等分别提取病理图像的方向梯度直方图特征、DSIFT特征与局部结构特征,并比较了上述特征在支持向量机和决策树等分类器中乳腺癌组织病理图像的分类性能。Shrivastava等结合了高阶谱特征、颜色特征及纹理特征,利用主成分分析(Principal component analysis,PCA)进行特征降维,并基于支持向量机实现组织病理图像的分类。此类特征向量维度高、冗余度大,且根据图像的先验信息而设计,仅针对特定图像集的分类问题,应用范围受到一定的限制。
近年来,稀疏表示已被成功地应用于各种计算机视觉项目中,例如图像去噪,人脸识别和组织病理图像分类等。Chang等提出一种基于预测稀疏分解的组织病理图像分类方法,如图1,首先利用预测稀疏分解模型(Predictive sparse decomposition,PSD)学习组织病理图像的稀疏分解特征,然后引入空间金字塔匹配(Spatial pyramid matching,SPM)框架对稀疏分解特征进行编码,最后采用SVM进行病理图像的分类,目标函数为:其中,Y为样本矩阵,W为编码器矩阵,Z为稀疏分解特征,G为对角增益矩阵,δ(·)为sigmoid函数,第三项为稀疏表示系数的非线性预测项。
Ranzato等提出深层特征具有更强的判别性能,更加适合于图像分类任务。于是,基于预测稀疏分解模型,Cheng等进一步提出了堆栈的预测稀疏分解(Stacked PredictiveSparse Decomposition,SPSD)模型,提取组织病理图像的深层特征用于分类。SPSD由n个PSD模型级联而成,上一级PSD模型的稀疏表示系数作为下一级PSD模型的输入。图2为SPSD模型的示意图。
但是,堆栈式预测稀疏分解模型为非监督的特征提取模型,提取的特征具有较强的重构能力,但是判别性能较差。然而在图像分类任务中,特征的判别性起着关键的作用。同时,考虑到组织病理图像的颜色信息在分类中扮演重要的信息,上述算法却将其忽视了。
发明内容
为了解决上述技术问题,本发明提供一种适用范围广、鲁棒性强、判别精度高的基于判别性预测稀疏分解模型的图像分类方法。
本发明解决上述问题的技术方案是:一种基于判别性预测稀疏分解模型的图像分类方法,包括以下步骤:
步骤一:从组织病理图像中随机选择M张作为训练图像,M′张作为测试图像,得到训练样本和测试样本;
步骤二:建立基于堆栈的判别性预测稀疏分解模型;
步骤三:将训练样本作为判别性预测稀疏分解模型的输入,对判别性预测稀疏分解模型进行求解,提取出组织病理图像的RGB三通道的稀疏分解特征;
步骤六:将测试样本作为多通道联合稀疏编码模型的输入,求解多通道联合稀疏编码模型,并基于支持向量机进行分类。
上述基于判别性预测稀疏分解模型的图像分类方法,所述步骤一中,训练样本的获得方法为:从训练图像Ytrain中随机提取N个彩色图像块,并将图像块进行通道分离获得RGB三通道的图像块,然后三个通道的所有图像块转化为列向量,同一个通道列向量合并,分别构造RGB通道的训练样本YR,YG和YB;用同样的方法得到测试样本。
上述基于判别性预测稀疏分解模型的图像分类方法,所述步骤二中,判别性预测稀疏分解模型为:
其中,Y为样本,D为过完备字典,W为编码矩阵,Z为稀疏分解特征,G为增益对角矩阵,A为线性分类矩阵,Q为类标矩阵,α,β为正则化参数,且α,β>0,L为稀疏度;δ(·)为sigmoid函数,第一项为稀疏重构项,第二项为稀疏分解特征预测项,第三项为分类误差项;||||F表示矩阵的F范数,表示矩阵F范数的平方,||||0表示矩阵的l0范数;
基于堆栈的判别性预测稀疏分解模型由n个判别性预测分解模型级联而成,即前一级判别性预测稀疏分解模型的输出作为下一级判别性预测稀疏分解模型的输入,获得最终的学习特征。
上述基于判别性预测稀疏分解模型的图像分类方法,所述步骤三中,判别性预测稀疏分解模型的求解过程为:
1)初始化D、Z、G、W和A,令迭代次数iteration=1,最大迭代次数IM;
2)固定W和G,更新D,A和Z,则判别性预测稀疏分解模型化简为:
由式(3)可知,式(2)中的D,A和Z的更新,可转化为式(3)中字典Dnew和Z的更新:
①固定Dnew,利用SPAMS工具箱中的OMP算法求解式(3),获得稀疏分解特征Z;
②固定Z,更新Dnew,则式(3)定义如下:
采用随机梯度下降算法求解式(4)获得Dnew;
3)固定D、W、A和Z,更新G,则式(1)重新定义如下:
式(5)为最小二乘估计问题,存在解析解,求解式(5),得到增益矩阵G的解析解;
4)固定D、G、A和Z,更新W,则式(1)重新定义如下:
采用随机梯度下降算法求解式(6),更新编码器矩阵W;
5)终止条件判断:判断是否达到最大迭代次数IM,若是则终止迭代,否则令iteration=iteration+1,返回步骤2),继续迭代。
上述基于判别性预测稀疏分解模型的图像分类方法,所述步骤三中,提取出组织病理图像的RGB三通道的稀疏分解特征的过程为:
1)分别将RGB三个通道的训练样本YR,YG和YB作为判别性预测稀疏分解模型的输入,按照判别性预测稀疏分解模型的求解过程对判别性预测稀疏分解模型进行求解,得到各级判别性预测稀疏分解模型RGB三个通道的增益对角矩阵GR、GG和GB,编码矩阵WR、WG和WB;其中,WR=[WR1,WR2,…,WRn],WRn表示R通道第n个判别性预测稀疏分解模型的编码矩阵,GR=[GR1,GR2,…,GRn],GRn表示R通道第n个判别性预测稀疏分解模型的增益对角矩阵;
2)提取训练样本RGB三个通道的稀疏分解特征ZR,ZG,ZB,R通道的稀疏分解特征为ZR=[ZR1,ZR2,…,ZRn],其中ZRn表示R通道的第n个辨别性预测稀疏分解模型的稀疏分解特征,提取公式为:
ZRn=GRnδ(GR(n-1)(…GR1δ(WR1YR))) (7)
同理获得训练样本G、B通道的稀疏分解特征ZG和ZB。
上述基于判别性预测稀疏分解模型的图像分类方法,所述步骤四具体步骤为:
首先将图像RGB三通道的稀疏分解特征zRn、zGn和zBn表示为共有分量和独有分量两个部分之和,且这两部分采用相同的字典进行稀疏表示,其模型定义如下:
其次,利用K均值算法,将RGB三通道的所有稀疏分解特征一起聚类得到字典DRGB。
上述基于判别性预测稀疏分解模型的图像分类方法,所述步骤五具体步骤为:
采用DRGB编码式(8)中的共享分量与独有分量,建立多通道联合编码模型,多通道联合编码模型定义如下:
然后,将式(9)转化为如下矩阵形式:
最后,结合空间金字塔匹配模型,引入图像空间结构信息,构造每层图像的多通道联合稀疏编码模型,多通道联合稀疏编码模型定义如下:
其中,λ为常数,表示中第j列,J表示中原子的总个数,|| ||1表示l1范数,Z=[z1,z2,…,zn]为稀疏分解特征矩阵,为联合稀疏表示系数,z=[zRn,zGn,zBn]T是Z=[z1,z2,…,zn]里面的列向量,是里面的列向量。
上述基于判别性预测稀疏分解模型的图像分类方法,所述步骤六中,首先将测试样本作为多通道联合稀疏编码模型的输入,利用LARS算法求解多通道联合稀疏编码模型获得每一层图像特征的联合稀疏表示系数,然后对联合稀疏表示系数进行多尺度最大池化,得到池化特征,再将得到的池化特征,作为SVM的输入,训练分类器,最后将获得的测试样本的联合稀疏表示系数输入到SVM分类器中进行分类。
本发明的有益效果在于:本发明首先建立基于堆栈的判别性预测稀疏分解模型,实现组织病理图像的RGB三通道的稀疏分解特征提取,然后通过聚类获得一个字典,并以此字典为基础,结合空间金字塔匹配模型,构造多通道联合稀疏编码模型,最后,基于支持向量机进行分类。本发明的建立的基于堆栈的判别性预测稀疏分解模型具有更好的特征表示能力,可以获得判别性较强的特征,取得较好的分类性能与较强的鲁棒性。
附图说明
图1为现有的预测稀疏分解模型的示意图。
图2为现有的堆栈式预测稀疏分解模型的示意图。
图3为本发明的流程图。
图4为实施例中肺、脾脏、肾脏的组织病理图像,其中(a)为健康图像,(b)为炎症图像。
图5为40×放大倍数下的腺病、管状腺癌和叶状癌的组织病理图像,其中(a)为腺病的组织病理图像,(b)为管状腺癌的组织病理图像,(c)为叶状癌的组织病理图像。
图6为参数α和β对不同病理图像分类的影响示意图,其中(a)为对肺部病例图像分类的影响,(b)为对脾脏病例图像分类的影响,(c)为对肾脏病例图像分类的影响,(d)为对乳腺病例图像分类的影响。
图7为采用本发明的分类方法与其他分类方法的ROC特性曲线对比图。
具体实施方式
下面结合附图和实施例对本发明作进一步的说明。
如图3所示,一种基于判别性预测稀疏分解模型的图像分类方法,包括以下步骤:
步骤一:从组织病理图像中随机选择M张作为训练图像,M′张作为测试图像,得到训练样本和测试样本。
训练样本的获得方法为:从训练图像Ytrain中随机提取N个彩色图像块,并将图像块进行通道分离获得RGB三通道的图像块,然后三个通道的所有图像块转化为列向量,同一个通道列向量合并,分别构造RGB通道的训练样本YR,YG和YB;用同样的方法得到测试样本。
步骤二:建立基于堆栈的判别性预测稀疏分解模型。判别性预测稀疏分解模型为:
其中,Y为样本,D为过完备字典,W为编码矩阵,Z为稀疏分解特征,G为增益对角矩阵,A为线性分类矩阵,Q为类标矩阵,α,β为正则化参数,且α,β>0,L为稀疏度;δ(·)为sigmoid函数;第一项为稀疏重构项,第二项为稀疏分解特征预测项,第三项为分类误差项,|| ||F表示求内部矩阵的F范数,表示矩阵的F范数的平方,|| ||0表示矩阵的l0范数。通过优化式(1),可获得如下性能:1、稀疏分解特征预测项确保了测试样本的稀疏分解特征可预测,且能迅速求解;2、分类误差项确保了稀疏分解特征具有判别性。
基于堆栈的判别性预测稀疏分解模型由n个判别性预测分解模型级联而成,即前一级判别性预测稀疏分解模型的输出作为下一级判别性预测稀疏分解模型的输入,获得最终的学习特征。
本文所提出的基于堆栈的判别性预测稀疏分解模型,与传统的堆栈式预稀疏分解模型的不同之处在于:1)本发明的模型利用样本的类标信息,在目标函数中增加线性分类器,从而更好引导判别性特征学习;2)本发明对于病理图像的RGB三个通道,分别采用SDPSD模型进行特征提取。
式(1)是典型的非凸优化问题,其求解一般通过交替迭代更新的方法直至收敛,获得最优的D、Z、G、W和A。
步骤三:将训练样本作为判别性预测稀疏分解模型的输入,对判别性预测稀疏分解模型进行求解,提取出组织病理图像的RGB三通道的稀疏分解特征。
判别性预测稀疏分解模型的求解过程为:
1)初始化D、Z、G、W和A,令迭代次数iteration=1,最大迭代次数IM;
2)固定W和G,更新D,A和Z,则判别性预测稀疏分解模型化简为:
由式(3)可知,式(2)中的D,A和Z的更新,可转化为式(3)中字典Dnew和Z的更新;
①固定Dnew,利用SPAMS工具箱中的OMP算法求解式(3),获得稀疏分解特征Z;
②固定Z,更新Dnew,则式(3)定义如下:
3)固定D、W、A和Z,更新G,则式(1)重新定义如下:
式(5)为最小二乘估计问题,存在解析解,求解式(5),得到增益矩阵G的解析解;
4)固定D、G、A和Z,更新W,则式(1)重新定义如下:
采用随机梯度下降算法求解式(6),更新编码器矩阵W;
5)终止条件判断:判断是否达到最大迭代次数IM,若是则终止迭代,否则令iteration=iteration+1,返回步骤2),继续迭代。
提取出组织病理图像的RGB三通道的稀疏分解特征的过程为:
1)初始化RGB三通道的过完备字典DR、DG和DB,RGB三通道的稀疏分解特征ZR、ZG和ZB,RGB三通道的增益对角阵GR、GG和GB,RGB三通道的编码矩阵WR、WG和WB,RGB三通道的线性分类矩阵AR、AG和AB;分别将RGB三个通道的训练样本YR,YG和YB作为判别性预测稀疏分解模型的输入,按照判别性预测稀疏分解模型的求解过程对判别性预测稀疏分解模型进行求解,得到各级判别性预测稀疏分解模型RGB三个通道的增益对角矩阵GR、GG和GB,编码矩阵WR、WG和WB;其中,WR=[WR1,WR2,…,WRn],GR=[GR1,GR2,…,GRn];WRn表示R通道第n个判别性预测稀疏分解模型的编码矩阵,GR=[GR1,GR2,…,GRn],GRn表示R通道第n个判别性预测稀疏分解模型的增益对角矩阵;
2)提取训练样本RGB三个通道的稀疏分解特征ZR,ZG,ZB,R通道的稀疏分解特征为ZR=[ZR1,ZR2,…,ZRn],其中ZRn表示R通道的第n个辨别性预测稀疏分解模型的稀疏分解特征,提取公式为:
ZRn=GRnδ(GR(n-1)(…GR1δ(WR1YR))) (7)
同理获得训练样本G、B通道的稀疏分解特征ZG和ZB。
首先将图像RGB三通道的稀疏分解特征zRn、zGn和zBn表示为共有分量和独有分量两个部分之和,且这两部分采用相同的字典进行稀疏表示,其模型定义如下:
其次,利用K均值算法,将RGB三通道的所有稀疏分解特征一起聚类得到字典DRGB。
采用DRGB编码式(8)中的共享分量与独有分量,建立多通道联合编码模型,多通道联合编码模型定义如下:
最后,结合空间金字塔匹配模型,将图像分为3层,并相应的划分为1、4和16个图像块,引入图像空间结构信息,构造每层图像的多通道联合稀疏编码模型,多通道联合稀疏编码模型定义如下:
其中,λ为常数,表示中第j列,J表示中原子的总个数,|| ||1表示l1范数,Z=[z1,z2,…,zn]为稀疏分解特征矩阵,为联合稀疏表示系数,z=[zRn,zGn,zBn]T是Z=[z1,z2,…,zn]里面的列向量,是里面的列向量。
步骤六:将测试样本作为多通道联合稀疏编码模型的输入,求解多通道联合稀疏编码模型,并基于支持向量机进行分类。
首先将测试样本作为多通道联合稀疏编码模型的输入,利用LARS算法求解多通道联合稀疏编码模型获得每一层图像特征的联合稀疏表示系数,然后对联合稀疏表示系数进行多尺度最大池化,得到池化特征,再将得到的池化特征,作为SVM的输入,训练分类器,最后将获得的测试样本的联合稀疏表示系数输入到SVM分类器中进行分类。
实施例
实验数据
(1)ADL数据集及相关实验设置
ADL数据集由宾夕法尼亚州立大学提供,共享900多张图像,包括牛的三类器官图像:肺,脾脏,肾脏。其中,每一类器官都包括健康和炎症两种类别,各占150多张。各类器官的两种医学病理组织示意图如图4所示,图4中(a)从左至右依次分别表示肺、脾脏、肾脏的健康图像,图4中(b)从左至右依次表示肺、脾脏、肾脏的炎症图像。本发明将所有图像归一化为600×600,针对肺、脾脏、肾脏的彩色图像,在相应的健康和炎症样本中分别随机选取70张图像作为训练集,剩余的图像中随机80张作为测试集。
(2)BreaKHis数据集及相关实验设置
为了验证本发明构建的模型同样适用于多分类的问题,将本文所提组织病理图像分类模型应用于BreaKHis数据集中疾病类型的诊断。该图像集中包括不同放大倍数(40×,100×,200×,400×)下82名患者的良性乳腺癌图像,共2368张,包括腺病、纤维腺癌、叶状癌和管状腺癌四个类别。40×放大倍数下的腺病、纤维腺癌和叶状癌和三种组织病理图像共计223张,其中,腺病图像为114张,叶状癌图像为109张,管状腺癌图像为149张。图5中(a)表示腺病的组织病理图像,图5中(b)表示叶状癌的组织病理图像,图5中(c)表示管状腺癌的组织病理图像。本发明选取了40×放大倍数下的腺病、管状腺癌和叶状癌三种组织病理图像作为实验样本。在腺病、管状腺癌和叶状癌的彩色图像中各随机选取40张,将每张彩色图像尺寸转化成400×400后,作为训练集。腺病,管状腺癌和叶状癌中剩余的图像中随机60张作为测试集。
实验参数设置
参数α和β的设置:参数α和β为基于堆栈的判别性预测稀疏分解模型中稀疏系数预测误差项和分类误差项正则化系数,极大地影响预测稀疏分解特征Z的判别性能。因此,图6给出了随参数α和β变化时,本发明的分类方法在不同组织病理图像的分类精度。如图6中(a)所示,肺部图像在α=1,β=1e-2时分类性能达到最优;如图6中(b)所示,脾脏图像在α=1e-2,β=1e-1时分类性能达到最优;如图6中(c)所示,肾脏图像在α=1e-1,β=1时分类性能达到最优;如图6中(d)所示,乳腺图像在α=1,β=1e-3时分类性能达到最优。
实验结果及分析
为了证明本文所提SDPSD方法的有效性,本发明对比了ScSPM方法、PSDSPM方法、PSDnSPM方法和JScSPM方法。表1、表2与表3分别给出了不同方法在肺部、脾脏和肾脏图像上的分类结果。其中,表1、表2与表3的第2行给出了不同方法下健康样本的正分率与错分率,第3行给出了不同方法下炎症样本的错分率与正分率。表中结果均为采用不同样本分别进行10次实验所取的平均值和标准差。
由表1、表2与表3可知,本发明提出的SDPSD方法对肺部、脾脏和肾脏的疾病诊断效果优于ScSPM、PSDSPM、PSDnSPM和JScSPM,其原因在于本文模型能够学习出的稀疏分解特征判别性较强,获得了较好的分类性能。根据表中分类精度的标准差可知,本文提出的SDPSD模型具有更强的鲁棒性。
表1不同方法在肺部图像的分类结果对比
表2不同方法在脾脏图像的分类结果对比
表3不同方法在肾脏图像的分类结果对比
上述表1、表2和表3给出了本发明方法用于二分类的情况,表4给出了本发明方法用于解决了BreaKHis数据集中的腺病、管状腺癌和叶状癌三种良性疾病的多分类问题,并与ScSPM、PSDSPM、PSDnSPM和JScSPM方法对比。由表4可知,本发明所提方法对于三种良性乳腺癌图像同样显示出了更好分类性能,且鲁棒性更强。
表4不同方法在BreaKHis数据集的分类结果对比
为了更直观地显示本文方法的优越性,图7给出了本文方法与其他方法的ROC曲线对比结果,图7中(a)、(b)、(c)分别为肺部、脾脏和肾脏的ROC特性曲线图,其中纵轴(Truepositive rate)表示击中率(匹配对被正确识别成匹配对的概率),横轴(False positiverate)为虚警率(非匹配对被错误识别成匹配对的概率)。从图7可知,虚警率相同的情况下,本发明提出的分类方法显示出了最佳的性能。
本发明提出了一种基于堆栈的判别性预测稀疏分解模型,并将其应用于组织病理图像的分类。该模型最大的特色在于提出了一种全新的特征学习方法:堆栈的判别性预测稀疏分解模型,该模型首先分别提取RGB三通道图像的判别性特征;然后考虑到各通道的特征即具有独特性,同时也具有共性,建立了多通道联合稀疏模型;最后结合SPM模型,针对不同层次的图像特征提出了联合稀疏表示模型,并利用稀疏表示系数进行分类。实验结果表明,本发明提出的模型具有更好的特征表示能力,可以获得判别性较强的特征,取得较好的分类性能与较强的鲁棒性。
Claims (7)
1.一种基于判别性预测稀疏分解模型的图像分类方法,包括以下步骤:
步骤一:从组织病理图像中随机选择M张作为训练图像,M′张作为测试图像,得到训练样本和测试样本;
步骤二:建立基于堆栈的判别性预测稀疏分解模型;
判别性预测稀疏分解模型为:
其中,Y为样本,D为过完备字典,W为编码矩阵,Z为稀疏分解特征,G为增益对角矩阵,A为线性分类矩阵,Q为类标矩阵,α,β为正则化参数,且α,β>0,L为稀疏度;δ(·)为sigmoid函数,第一项为稀疏重构项,第二项为稀疏分解特征预测项,第三项为分类误差项;|| ||F表示矩阵的F范数,表示矩阵的F范数的平方,|| ||0表示l0范数;
基于堆栈的判别性预测稀疏分解模型由n个判别性预测分解模型级联而成,即前一级判别性预测稀疏分解模型的输出作为下一级判别性预测稀疏分解模型的输入,获得最终的学习特征;
步骤三:将训练样本作为判别性预测稀疏分解模型的输入,对判别性预测稀疏分解模型进行求解,提取出组织病理图像的RGB三通道的稀疏分解特征;
步骤六:将测试样本作为多通道联合稀疏编码模型的输入,求解多通道联合稀疏编码模型,并基于支持向量机进行分类。
2.根据权利要求1所述的基于判别性预测稀疏分解模型的图像分类方法,其特征在于,所述步骤一中,训练样本的获得方法为:从训练图像Ytrain中随机提取N个彩色图像块,并将图像块进行通道分离获得RGB三通道的图像块,然后三个通道的所有图像块转化为列向量,同一个通道列向量合并,分别构造RGB通道的训练样本YR,YG和YB;用同样的方法得到测试样本。
3.根据权利要求2所述的基于判别性预测稀疏分解模型的图像分类方法,其特征在于,所述步骤三中,判别性预测稀疏分解模型的求解过程为:
1)初始化D、Z、G、W和A,令迭代次数iteration=1,最大迭代次数IM;
2)固定W和G,更新D,A和Z,则判别性预测稀疏分解模型化简为:
由式(3)可知,式(2)中的D,A和Z的更新,可转化为式(3)中字典Dnew和Z的更新:
①固定Dnew,利用SPAMS工具箱中的OMP算法求解式(3),获得稀疏分解特征Z;
②固定Z,更新Dnew,则式(3)定义如下:
采用随机梯度下降算法求解式(4)获得Dnew;
3)固定D、W、A和Z,更新G,则式(1)重新定义如下:
式(5)为最小二乘估计问题,存在解析解,求解式(5),得到增益矩阵G的解析解;
4)固定D、G、A和Z,更新W,则式(1)重新定义如下:
采用随机梯度下降算法求解式(6),更新编码器矩阵W;
5)终止条件判断:判断是否达到最大迭代次数IM,若是则终止迭代,否则令iteration=iteration+1,返回步骤2),继续迭代。
4.根据权利要求3所述的基于判别性预测稀疏分解模型的图像分类方法,其特征在于,所述步骤三中,提取出组织病理图像的RGB三通道的稀疏分解特征的过程为:
1)分别将RGB三个通道的训练样本YR,YG和YB作为判别性预测稀疏分解模型的输入,按照判别性预测稀疏分解模型的求解过程对判别性预测稀疏分解模型进行求解,得到各级判别性预测稀疏分解模型RGB三个通道的增益对角矩阵GR、GG和GB,编码矩阵WR、WG和WB;其中,WR=[WR1,WR2,…,WRn],WRn表示R通道第n个判别性预测稀疏分解模型的编码矩阵,GR=[GR1,GR2,…,GRn],GRn表示R通道第n个判别性预测稀疏分解模型的增益对角矩阵;
2)提取训练样本RGB三个通道的稀疏分解特征ZR,ZG,ZB,R通道的稀疏分解特征为ZR=[ZR1,ZR2,…,ZRn],其中ZRn表示R通道的第n个辨别性预测稀疏分解模型的稀疏分解特征,提取公式为:
ZRn=GRnδ(GR(n-1)(…GR1δ(WR1YR))) (7)
同理获得训练样本G、B通道的稀疏分解特征ZG和ZB。
6.根据权利要求5所述的基于判别性预测稀疏分解模型的图像分类方法,其特征在于,所述步骤五具体步骤为:
采用DRGB编码式(8)中的共享分量与独有分量,建立多通道联合编码模型,多通道联合编码模型定义如下:
然后,将式(9)转化为如下矩阵形式:
最后,结合空间金字塔匹配模型,引入图像空间结构信息,构造每层图像的多通道联合稀疏编码模型,多通道联合稀疏编码模型定义如下:
7.根据权利要求6所述的基于判别性预测稀疏分解模型的图像分类方法,其特征在于,所述步骤六中,首先将测试样本作为多通道联合稀疏编码模型的输入,利用LARS算法求解多通道联合稀疏编码模型获得每一层图像特征的联合稀疏表示系数,然后对联合稀疏表示系数进行多尺度最大池化,得到池化特征,再将得到的池化特征,作为SVM的输入,训练分类器,最后将获得的测试样本的联合稀疏表示系数输入到SVM分类器中进行分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810855020.5A CN109063766B (zh) | 2018-07-31 | 2018-07-31 | 一种基于判别性预测稀疏分解模型的图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810855020.5A CN109063766B (zh) | 2018-07-31 | 2018-07-31 | 一种基于判别性预测稀疏分解模型的图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109063766A CN109063766A (zh) | 2018-12-21 |
CN109063766B true CN109063766B (zh) | 2021-11-30 |
Family
ID=64831391
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810855020.5A Active CN109063766B (zh) | 2018-07-31 | 2018-07-31 | 一种基于判别性预测稀疏分解模型的图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109063766B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110619359B (zh) * | 2019-09-06 | 2020-11-27 | 上海杏脉信息科技有限公司 | 一种根据人体医学影像确定肺结核分级的方法与装置 |
CN115050024B (zh) * | 2022-06-21 | 2023-08-22 | 广州医科大学 | 一种可解释性的粒细胞智能实时识别方法及系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8873836B1 (en) * | 2012-06-29 | 2014-10-28 | Emc Corporation | Cluster-based classification of high-resolution data |
WO2015112932A1 (en) * | 2014-01-25 | 2015-07-30 | Handzel Amir Aharon | Automated histological diagnosis of bacterial infection using image analysis |
CN104408478B (zh) * | 2014-11-14 | 2017-07-25 | 西安电子科技大学 | 一种基于分层稀疏判别特征学习的高光谱图像分类方法 |
CN106845551B (zh) * | 2017-01-24 | 2020-08-11 | 湘潭大学 | 一种组织病理图像识别方法 |
CN106803105B (zh) * | 2017-02-09 | 2020-02-21 | 北京工业大学 | 一种基于稀疏表示字典学习的图像分类方法 |
CN107103325B (zh) * | 2017-04-20 | 2021-01-26 | 湘潭大学 | 一种组织病理图像分类方法 |
CN108052911B (zh) * | 2017-12-20 | 2021-12-07 | 上海海洋大学 | 基于深度学习的多模态遥感影像高层特征融合分类方法 |
-
2018
- 2018-07-31 CN CN201810855020.5A patent/CN109063766B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109063766A (zh) | 2018-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110020682B (zh) | 一种基于小样本学习的注意力机制关系对比网络模型方法 | |
CN104268593B (zh) | 一种小样本情况下多稀疏表示的人脸识别方法 | |
CN105760821B (zh) | 基于核空间的分类聚集稀疏表示的人脸识别方法 | |
CN108509854B (zh) | 一种基于投影矩阵约束结合判别字典学习的行人再识别方法 | |
CN110097060B (zh) | 一种面向树干图像的开集识别方法 | |
CN108446589B (zh) | 复杂环境下基于低秩分解和辅助字典的人脸识别方法 | |
CN112580590A (zh) | 一种基于多语义特征融合网络的指静脉识别方法 | |
CN112765352A (zh) | 基于具有自注意力机制的图卷积神经网络文本分类方法 | |
CN106845528A (zh) | 一种基于K‑means与深度学习的图像分类算法 | |
CN108664911B (zh) | 一种基于图像稀疏表示的鲁棒人脸识别方法 | |
CN109543723B (zh) | 一种鲁棒的图像聚类方法 | |
CN106845551B (zh) | 一种组织病理图像识别方法 | |
Champ et al. | A comparative study of fine-grained classification methods in the context of the LifeCLEF plant identification challenge 2015 | |
CN109840518B (zh) | 一种结合分类与域适应的视觉追踪方法 | |
CN113505856B (zh) | 一种高光谱影像无监督自适应分类方法 | |
CN109063766B (zh) | 一种基于判别性预测稀疏分解模型的图像分类方法 | |
CN104966075A (zh) | 一种基于二维判别特征的人脸识别方法与系统 | |
CN110991554B (zh) | 一种基于改进pca的深度网络图像分类方法 | |
CN110956113B (zh) | 基于二次协作表示鉴别投影的鲁棒人脸识别方法 | |
CN111310787A (zh) | 一种基于堆叠编码器的脑功能网络多核模糊聚类方法 | |
CN113378021A (zh) | 基于半监督的信息熵主成分分析降维方法 | |
CN110852304B (zh) | 基于深度学习方法的高光谱数据处理方法 | |
CN113920210A (zh) | 基于自适应图学习主成分分析方法的图像低秩重构方法 | |
CN111611963B (zh) | 一种基于近邻保持典型相关分析的人脸识别方法 | |
CN107729945A (zh) | 基于类间稀疏表示的鉴别回归、分类方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |