CN109740669A - 一种基于深度特征聚合的乳腺癌病理图像分类方法 - Google Patents
一种基于深度特征聚合的乳腺癌病理图像分类方法 Download PDFInfo
- Publication number
- CN109740669A CN109740669A CN201811652854.2A CN201811652854A CN109740669A CN 109740669 A CN109740669 A CN 109740669A CN 201811652854 A CN201811652854 A CN 201811652854A CN 109740669 A CN109740669 A CN 109740669A
- Authority
- CN
- China
- Prior art keywords
- breast cancer
- depth characteristic
- image
- label
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Analysis (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种基于深度特征聚合的乳腺癌病理图像分类方法,属于医疗图像分类领域。该方法包括:构造乳腺癌病理图像数据集,获取原始病理图像数据和标签信息,对原始病理图像进行数据增强;借助随机梯度下降法训练深度特征提取模块,优化深度特征提取模块的参数;采用深度特征提取模块获得的深度特征来训练特征聚合模块,并计算出训练集的深度特征聚合编码;使用训练集的深度特征聚合编码训练预分类模块。在方法测试上,首先将测试集样本输入串联的深度特征提取模块、特征聚合模块和预分类模块,来获得测试集预分类标签;投票模块对测试集预分类标签进行统计,来获得预测标签。本发明提升了在乳腺癌病理图像上的分类性能。
Description
技术领域
本发明涉及医疗图像分类领域和深度学习领域,更具体地说,涉及一种基于深度特征聚合的乳腺癌病理图像分类方法。
背景技术
乳腺癌是造成全球女性死亡的第二大病症,并且其发病率呈逐年上升的趋势。在临床上,相较于核磁共振、X-ray、钼靶等图像,病理图像是最终确诊乳腺癌的金标准。当前基于病理医生的乳腺癌病理图像分类,不仅存在耗时、费力的问题,而且其诊断结果容易受到医生经验、情绪等主观人为因素的影响。基于计算机辅助的乳腺癌病理图像自动分类则不仅可以提高诊断效率,还能辅助提供更加客观、准确的诊断结果。
乳腺癌病理图像自动分类研究可分为基于传统机器学习算法和基于深度学习算法两类。在基于传统机器学习的算法中,局部二值模式、灰度共生矩阵等特征描述子结合支持向量机、随机森林等分类算法对乳腺癌病理图像进行自动分类,并取得了良好的分类精度。在基于深度学习的算法中,AlexNet、GoogLeNet等卷积神经网络被应用于乳腺癌病理图像分类领域,其分类准确率相较于传统机器学习算法获得了进一步提升。
发明内容
针对现有技术的局限,本发明的目的是提出一种基于深度特征聚合的乳腺癌病理图像分类方法,使用深度特征提取模块获得深度特征,将深度特征通过特征聚合模块转化为深度特征聚合编码,深度特征聚合编码输入到预分类网络后获得预分类标签,最后经投票模块对预分类标签进行统计得到预测标签,从而有效地进行乳腺癌病理图像分类。
本发明所提出的一种基于深度特征聚合的乳腺癌病理图像分类方法,包括以下步骤:
步骤S1:构造包含乳腺癌病理图像数据及良恶性标签的图像数据集,对原始乳腺癌病理图像数据集进行数据增强,并划分为训练集、测试集两部分,训练集用于本发明方法的模型训练,测试集用于本发明的模型测试;
步骤S2:使用训练集样本训练深度特征提取模块,包括特征前向传播和误差反向传播两个过程,并提取腺癌病理图像训练集样本的深度特征;
步骤S3:使用乳腺癌病理图像训练集样本的深度特征来训练特征聚合模块,获得聚合特征模块的码本,并计算乳腺癌病理图像训练集的深度特征聚合编码;
步骤S4:使用乳腺癌病理图像训练集的深度特征聚合编码训练预分类模块,以获得预分类标签;
步骤S5:在方法模型测试上,将乳腺癌病理图像测试集样本输入串联的深度特征提取模块、特征聚合模块和预分类模块,以获得测试集样本的预分类标签;
步骤S6:将乳腺癌病理图像测试集预分类标签输入投票模块,获得最终的预测标签。在乳腺癌病理图像测试集上,用图像级别分类准确率和患者级别分类准确率评判方法的整体性能。
其中步骤S1具体包括以下过程:
对原始乳腺癌病理图像进行数据增强,具体包括图像剪切和图像旋转操作,采用数据增强后的数据来构造乳腺癌病理图像数据集,数据集中包括图像数据和标签信息。以X=[x1,x2,...,xN]表示乳腺癌病理图像构成的数据集,其中每一张乳腺癌病理图像记作xi,{i=1,2,…N},N表示乳腺癌病理图像样本个数;Y=[y1,y2,...,yM]表示乳腺癌病理图像对应的标签。将样本集进行划分,选取一部分作为测试集Xte,一部分作为训练集Xtr。
其中步骤S2具体包括以下过程:
深度特征提取模块由VGG-VD16网络的1-15层构成,使用随机梯度下降法训练深度特征模块,提取乳腺癌病理图像的深度特征。鉴于本发明涉及的乳腺癌病理图像分类属二分类问题,将VGG-VD16网络的最后一层全连接层的维度修改为2×1,采用乳腺癌病理图像训练集基于随机梯度下降法进行网络精调训练,来优化深度特征提取模块的参数,并基于优化后的参数来提取训练集乳腺癌病理图像的深度特征hi,维度为w*h*c,其中w、h和c分别表示深度特征的宽、高和通道数。
其中步骤S3具体包括以下过程:
将深度特征模块模型获得的训练集深度特征hi输入聚合模块,获得深度特征聚合编码,具体计算公式如下:
其中,ak(hij)表示加权系数,ck表示由K-means算法得到的聚类中心,hij表示hi的第j个局部描述子。加权系数ak(hij)计算公式如下:
其中,W为比例系数,为w*h个W的平均值。比例系数W的计算公式如下:
其中,c1是距离hij最近的聚类中心,c2是距离hij第二近的聚类中心。
其中步骤S4具体包括以下过程:
使用训练集的深度特征聚合编码来训练预分类模块的分类器,发明采用支持向量机(SVM)作为分类器,以获得预分类标签。预分类模块实现了对深度特征聚合编码的分类工作,即对每一张数据增强后的乳腺癌病理图像产生一个预分类标签。
其中步骤S5具体包括以下过程:
将乳腺癌病理图像测试集样本输入串联的深度特征模块、特征聚合模块和预分类模块,依次获得测试集样本对应的深度特征、深度特征聚合编码及其相应的预分类标签。
其中步骤S6具体包括以下过程:
将乳腺癌病理图像测试集的预分类标签输入投票模块,统计对应同一张原始将乳腺癌病理图像的预分类标签个数,个数最多的预分类标签即为原始将乳腺癌病理图像的预测标签。
其中,Lpre代表预测标签,L1代表第一类标签,L2代表第二类标签,n1表示归属为第一类的预分类标签个数,n2表示归属为第二类预分类标签的个数。
本发明的有益效果是,本发明重在通过提取更有效的乳腺癌病理图像深度特征,并以新的方式将深度特征进行聚合,来获得更具判别性的深度特征聚合编码,从而提高对乳腺癌病理图像的分类准确率。
附图说明
图1是本发明所涉及的基于深度特征聚合的图像分类方法的流程示意图。
具体实施方式
下面结合图1和实施例对本发明作进一步说明,本发明采用BreakHis乳腺癌病理图像数据集作为实例数据集,该数据集包含从82例患者中采集的7909张700×460的彩色病理图像,这些病理图像使用不同的放大倍数(40×、100×、200×和400×)呈现,划分为2个类别:benign(良性)、malignant(恶性)。
参照图1流程图,本发明解决其技术问题的具体步骤如下:
步骤S1:构造并划分图像数据集
采集BreakHis乳腺癌病理图像数据集,按0.8的比例系数对病理图像长宽进行裁剪,将裁剪后的病理图像进行90度、180度和270度旋转,可将原乳腺癌病理数据集扩增16倍,获得126544张乳腺癌病理图像。为适应VGG-VD16卷积神经网络,将所有病理图像放缩为224×224。构造为乳腺癌病理图像数据集X=[x1,x2,…,x126544],数据集X的2个类别标签表示为Y=[y1,y2],分别表示良性和恶性,数据集中的每个样本均包含乳腺癌病理图像数据及标签。随后划分数据集,从82位患者中随机选取57位患者的样本作为训练集Xtr,剩余患者的样本测试集Xte,乳腺癌病理训练集用于发明方法的模型训练,测试集用于模型测试。
步骤S2:训练深度特征提取模块模型
(1)乳腺癌病理图像特征前向传播:将训练集Xtr中的乳腺癌病理图像按照不同放大倍率独立地输入深度特征模块,每张224×224的乳腺癌病理图像经过深度特征提取模块后可获得13×13×256大小的深度特征hi。
(2)误差反向传播:全连接层将深度特征映射为2×1的向量xi,即对应2个类别标签的取值,经Softmax处理为2×1的预测概率向量,计算Softmaxloss损失。网络参数初始化,设置训练的学习率为10-4,权重下降率为0.001,设置训练批次为16,训练代数为50。
此时根据该初始误差进行反向传播,更新网络参数。在迭代过程中,错误率随着训练代数增加逐渐减小。在训练过程中,网络参数微调,直至达到收敛状态,确定最优深度特征提取模块的参数。并提取训练集的乳腺癌病理图像深度特征hi。
步骤S3:训练特征聚合模块
按照不同放大倍率,使用训练集乳腺癌病理图像维度为13*13*256的深度特征hi训练特征聚合模块,获得维度为16*256的码本,并计算训练集的4096维深度特征聚合编码,即Btr。本实例将编码的聚类中心个数设置为K=16;
步骤S4:训练预分类模块
使用训练集乳腺癌病理图像4096维的深度特征聚合编码Btr训练支持向量机SVM分类器作为预分类模块,获得训练集图像的预分类标签。
步骤S5:获得测试集预分类标签
将乳腺癌病理图像测试集Xte输入串联的深度特征模块、特征聚合模块和预分类模块,依次获得测试集样本13*13*256维的深度特征、4096维的深度特征聚合编码及其相应的预分类标签。
步骤S6:获得预测标签,计算分类准确率
将乳腺癌病理图像测试集的预分类标签输入投票模块,获得原始图像预测标签。分别在图像层面和患者层面计算模型分类准确率。
根据测试集样本预测标签与真实标签是否一致,计算图像层面和患者层面的分类准确率。如下表1和表2分别是本发明的深度特征聚合编码方法在图像层面和患者层面的乳腺癌病理图像分类准确率,在BreakHis数据集4种放大倍率的子集上与基于CNN的方法比较,其结果更占优势。
表1 BreakHis数据集上图像层面的分类准确率
表2 BreakHis数据集上患者层面的分类准确率
综上所述,本发明提出的基于深度特征聚合的乳腺癌病理图像分类方法可有效提升分类精度。首先,经过乳腺癌病理图像微调后的深度特征模块优化了参数,能够提取更有效的病理图像深度特征。其次,模型通过聚合深度特征获得深度特征聚合编码,进一步提高了特征的区分能力;然后,使用统计预分类标签获得预测标签,进一步提高了模型的鲁棒性,从而在整体上提升了模型的乳腺癌病理图像分类性能。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围内。
Claims (5)
1.一种基于深度特征聚合的乳腺癌病理图像分类方法,其特征在于,该方法包括以下步骤:
步骤S1:构造包含乳腺癌病理图像数据及良恶性标签的图像数据集,对原始乳腺癌病理图像数据集进行数据增强,并划分为训练集、测试集两部分,训练集用于本发明方法的模型训练,测试集用于本发明的模型测试;
步骤S2:使用训练集样本训练深度特征提取模块,包括特征前向传播和误差反向传播两个过程,并提取乳腺癌病理图像训练集样本的深度特征;
步骤S3:使用乳腺癌病理图像训练集样本的深度特征来训练特征聚合模块,获得聚合特征模块的码本,并计算乳腺癌病理图像训练集的深度特征聚合编码;
步骤S4:使用乳腺癌病理图像训练集的深度特征聚合编码训练预分类模块,以获得预分类标签;
步骤S5:在方法模型测试上,将乳腺癌病理图像测试集样本输入串联的深度特征提取模块、特征聚合模块和预分类模块,以获得测试集样本的预分类标签;
步骤S6:将乳腺癌病理图像测试集预分类标签输入投票模块,获得最终的预测标签,在乳腺癌病理图像测试集上,用图像级别分类准确率和患者级别分类准确率评判方法的整体性能。
2.根据权利要求1所述的一种基于深度特征聚合的乳腺癌病理图像分类方法,其特征在于,所述的步骤S1中,对原始乳腺癌病理图像进行数据增强,包括图像剪切和图像旋转操作,采用数据增强后的数据来构造乳腺癌病理图像数据集,数据集中包括图像数据和标签信息,以X=[x1,x2,...,xN]表示乳腺癌病理图像构成的数据集,其中每一张乳腺癌病理图像记作xi,{i=1,2,...N},N表示乳腺癌病理图像样本个数;Y=[y1,y2,...,yM]表示乳腺癌病理图像对应的标签,将样本集进行划分,选取一部分作为测试集Xte,一部分作为训练集Xtr。
3.根据权利要求1所述的基于深度特征聚合的乳腺癌病理图像分类方法,其特征在于,所述的步骤S2中,深度特征提取模块使用VGG-VD16网络的1-15层构建,使用随机梯度下降法训练深度特征模块,提取乳腺癌病理图像的深度特征。
4.根据权利要求1所述的基于深度特征聚合的乳腺癌病理图像分类方法,其特征在于,所述的步骤S3中,计算编码部分:训练集的深度特征经由聚合模块后获得深度特征聚合编码,具体计算公式如下:
其中,ak(hij)表示加权系数,ck表示聚类中心(由训练集特征经K-means算法获得),hij表示第i个乳腺癌病理图像的第j个局部描述子,加权系数ak(hij)计算公式如下:
其中,W为比例系数,为w*h个W的平均值,其中w、h分别表示深度特征的宽和高,比例系数W的计算公式如下:
其中,c1是距离hij最近的聚类中心,c2是距离hij第二近的聚类中心。
5.根据权利要求1所述的基于深度特征聚合的乳腺癌病理图像分类方法,其特征在于,所述的步骤S6中的投票模块,对应同一张原始乳腺癌病理图像的预分类标签进行统计,计算公式如下:
其中,Lpre代表预测标签,L1代表第一类标签,L2代表第二类标签,n1表示归属为第一类的预分类标签个数,n2表示归属为第二类预分类标签的个数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811652854.2A CN109740669B (zh) | 2018-12-29 | 2018-12-29 | 一种基于深度特征聚合的乳腺癌病理图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811652854.2A CN109740669B (zh) | 2018-12-29 | 2018-12-29 | 一种基于深度特征聚合的乳腺癌病理图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109740669A true CN109740669A (zh) | 2019-05-10 |
CN109740669B CN109740669B (zh) | 2022-12-06 |
Family
ID=66362980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811652854.2A Active CN109740669B (zh) | 2018-12-29 | 2018-12-29 | 一种基于深度特征聚合的乳腺癌病理图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109740669B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110288542A (zh) * | 2019-06-18 | 2019-09-27 | 福州数据技术研究院有限公司 | 一种基于随机变换的肝部病理图像样本增强方法 |
CN110400297A (zh) * | 2019-07-22 | 2019-11-01 | 中国石油大学(华东) | 一种基于深度学习的肺癌分期预测方法 |
CN110533080A (zh) * | 2019-08-07 | 2019-12-03 | 中南民族大学 | 一种基于模糊规则集的乳腺癌细胞图像分类方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103295026A (zh) * | 2013-05-15 | 2013-09-11 | 西安电子科技大学 | 基于空间局部聚合描述向量的图像分类方法 |
US20150130921A1 (en) * | 2013-11-11 | 2015-05-14 | Sony Corporation | Image processing apparatus and image processing method |
CN108364288A (zh) * | 2018-03-01 | 2018-08-03 | 北京航空航天大学 | 用于乳腺癌病理图像的分割方法和装置 |
-
2018
- 2018-12-29 CN CN201811652854.2A patent/CN109740669B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103295026A (zh) * | 2013-05-15 | 2013-09-11 | 西安电子科技大学 | 基于空间局部聚合描述向量的图像分类方法 |
US20150130921A1 (en) * | 2013-11-11 | 2015-05-14 | Sony Corporation | Image processing apparatus and image processing method |
CN108364288A (zh) * | 2018-03-01 | 2018-08-03 | 北京航空航天大学 | 用于乳腺癌病理图像的分割方法和装置 |
Non-Patent Citations (1)
Title |
---|
YUECHAO ZHANG 等: "Classification of Benign and Malignant Pulmonary Nodules Based on Deep Learning", 《 INFORMATION SCIENCE AND CONTROL ENGINEERING》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110288542A (zh) * | 2019-06-18 | 2019-09-27 | 福州数据技术研究院有限公司 | 一种基于随机变换的肝部病理图像样本增强方法 |
CN110400297A (zh) * | 2019-07-22 | 2019-11-01 | 中国石油大学(华东) | 一种基于深度学习的肺癌分期预测方法 |
CN110533080A (zh) * | 2019-08-07 | 2019-12-03 | 中南民族大学 | 一种基于模糊规则集的乳腺癌细胞图像分类方法 |
CN110533080B (zh) * | 2019-08-07 | 2020-11-24 | 中南民族大学 | 一种基于模糊规则集的乳腺癌细胞图像分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109740669B (zh) | 2022-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sharma et al. | Enhanced watershed segmentation algorithm-based modified ResNet50 model for brain tumor detection | |
Ahmmed et al. | Classification of tumors and it stages in brain MRI using support vector machine and artificial neural network | |
Khan et al. | MultiNet: A deep neural network approach for detecting breast cancer through multi-scale feature fusion | |
CN106815481A (zh) | 一种基于影像组学的生存期预测方法及装置 | |
CN108257135A (zh) | 基于深度学习方法解读医学图像特征的辅助诊断系统 | |
CN113947607B (zh) | 一种基于深度学习的癌症病理图像生存预后模型构建方法 | |
CN107506761A (zh) | 基于显著性学习卷积神经网络的脑部图像分割方法及系统 | |
CN106683081A (zh) | 基于影像组学的脑胶质瘤分子标记物无损预测方法和预测系统 | |
CN108388917A (zh) | 一种基于改进深度学习模型的高光谱图像分类方法 | |
CN109740669A (zh) | 一种基于深度特征聚合的乳腺癌病理图像分类方法 | |
CN112270666A (zh) | 基于深度卷积神经网络的非小细胞肺癌病理切片识别方法 | |
CN103593674B (zh) | 一种颈部淋巴结超声图像特征选择方法 | |
Wakili et al. | Classification of breast cancer histopathological images using DenseNet and transfer learning | |
CN107909102A (zh) | 一种组织病理图像的分类方法 | |
CN110059656B (zh) | 基于卷积对抗生成神经网络的白细胞分类方法及系统 | |
de Sousa Costa et al. | Classification of malignant and benign lung nodules using taxonomic diversity index and phylogenetic distance | |
CN107679368A (zh) | 基于遗传算法和变精度粗糙集的pet/ct高维特征级选择方法 | |
CN111783792B (zh) | 一种提取b超图像显著纹理特征的方法及其应用 | |
Wang et al. | DBLCNN: Dependency-based lightweight convolutional neural network for multi-classification of breast histopathology images | |
CN114332572B (zh) | 基于显著图引导分层密集特征融合网络用于提取乳腺病变超声图像多尺度融合特征参数方法 | |
CN113628197A (zh) | 一种基于对比学习的弱监督全切片组织病理图像分类方法 | |
Ibraheem et al. | 3PCNNB-net: Three parallel CNN branches for breast cancer classification through histopathological images | |
CN114494196A (zh) | 基于遗传模糊树的视网膜糖尿病变深度网络检测方法 | |
CN101699515A (zh) | 基于多精英免疫量子聚类的医学影像分割系统及分割方法 | |
Kumaraswamy et al. | Invasive ductal carcinoma grade classification in histopathological images using transfer learning approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |