CN109740669B - 一种基于深度特征聚合的乳腺癌病理图像分类方法 - Google Patents

一种基于深度特征聚合的乳腺癌病理图像分类方法 Download PDF

Info

Publication number
CN109740669B
CN109740669B CN201811652854.2A CN201811652854A CN109740669B CN 109740669 B CN109740669 B CN 109740669B CN 201811652854 A CN201811652854 A CN 201811652854A CN 109740669 B CN109740669 B CN 109740669B
Authority
CN
China
Prior art keywords
breast cancer
pathological image
classification
module
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811652854.2A
Other languages
English (en)
Other versions
CN109740669A (zh
Inventor
张建新
魏湘国
张强
魏小鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University
Original Assignee
Dalian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University filed Critical Dalian University
Priority to CN201811652854.2A priority Critical patent/CN109740669B/zh
Publication of CN109740669A publication Critical patent/CN109740669A/zh
Application granted granted Critical
Publication of CN109740669B publication Critical patent/CN109740669B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于深度特征聚合的乳腺癌病理图像分类方法,属于医疗图像分类领域。该方法包括:构造乳腺癌病理图像数据集,获取原始病理图像数据和标签信息,对原始病理图像进行数据增强;借助随机梯度下降法训练深度特征提取模块,优化深度特征提取模块的参数;采用深度特征提取模块获得的深度特征来训练特征聚合模块,并计算出训练集的深度特征聚合编码;使用训练集的深度特征聚合编码训练预分类模块。在方法测试上,首先将测试集样本输入串联的深度特征提取模块、特征聚合模块和预分类模块,来获得测试集预分类标签;投票模块对测试集预分类标签进行统计,来获得预测标签。本发明提升了在乳腺癌病理图像上的分类性能。

Description

一种基于深度特征聚合的乳腺癌病理图像分类方法
技术领域
本发明涉及医疗图像分类领域和深度学习领域,更具体地说,涉及一种基于深度特征聚合的乳腺癌病理图像分类方法。
背景技术
乳腺癌是造成全球女性死亡的第二大病症,并且其发病率呈逐年上升的趋势。在临床上,相较于核磁共振、X-ray、钼靶等图像,病理图像是最终确诊乳腺癌的金标准。当前基于病理医生的乳腺癌病理图像分类,不仅存在耗时、费力的问题,而且其诊断结果容易受到医生经验、情绪等主观人为因素的影响。基于计算机辅助的乳腺癌病理图像自动分类则不仅可以提高诊断效率,还能辅助提供更加客观、准确的诊断结果。
乳腺癌病理图像自动分类研究可分为基于传统机器学习算法和基于深度学习算法两类。在基于传统机器学习的算法中,局部二值模式、灰度共生矩阵等特征描述子结合支持向量机、随机森林等分类算法对乳腺癌病理图像进行自动分类,并取得了良好的分类精度。在基于深度学习的算法中,AlexNet、GoogLeNet等卷积神经网络被应用于乳腺癌病理图像分类领域,其分类准确率相较于传统机器学习算法获得了进一步提升。
发明内容
针对现有技术的局限,本发明的目的是提出一种基于深度特征聚合的乳腺癌病理图像分类方法,使用深度特征提取模块获得深度特征,将深度特征通过特征聚合模块转化为深度特征聚合编码,深度特征聚合编码输入到预分类网络后获得预分类标签,最后经投票模块对预分类标签进行统计得到预测标签,从而有效地进行乳腺癌病理图像分类。
本发明所提出的一种基于深度特征聚合的乳腺癌病理图像分类方法,包括以下步骤:
步骤S1:构造包含乳腺癌病理图像数据及良恶性标签的图像数据集,对原始乳腺癌病理图像数据集进行数据增强,并划分为训练集、测试集两部分,训练集用于本发明方法的模型训练,测试集用于本发明的模型测试;
步骤S2:使用训练集样本训练深度特征提取模块,包括特征前向传播和误差反向传播两个过程,并提取腺癌病理图像训练集样本的深度特征;
步骤S3:使用乳腺癌病理图像训练集样本的深度特征来训练特征聚合模块,获得聚合特征模块的码本,并计算乳腺癌病理图像训练集的深度特征聚合编码;
步骤S4:使用乳腺癌病理图像训练集的深度特征聚合编码训练预分类模块,以获得预分类标签;
步骤S5:在方法模型测试上,将乳腺癌病理图像测试集样本输入串联的深度特征提取模块、特征聚合模块和预分类模块,以获得测试集样本的预分类标签;
步骤S6:将乳腺癌病理图像测试集预分类标签输入投票模块,获得最终的预测标签。在乳腺癌病理图像测试集上,用图像级别分类准确率和患者级别分类准确率评判方法的整体性能。
其中步骤S1具体包括以下过程:
对原始乳腺癌病理图像进行数据增强,具体包括图像剪切和图像旋转操作,采用数据增强后的数据来构造乳腺癌病理图像数据集,数据集中包括图像数据和标签信息。以X=[x1,x2,...,xN]表示乳腺癌病理图像构成的数据集,其中每一张乳腺癌病理图像记作xi,{i=1,2,…N},N表示乳腺癌病理图像样本个数;Y=[y1,y2,...,yM]表示乳腺癌病理图像对应的标签。将样本集进行划分,选取一部分作为测试集Xte,一部分作为训练集Xtr
其中步骤S2具体包括以下过程:
深度特征提取模块由VGG-VD16网络的1-15层构成,使用随机梯度下降法训练深度特征模块,提取乳腺癌病理图像的深度特征。鉴于本发明涉及的乳腺癌病理图像分类属二分类问题,将VGG-VD16网络的最后一层全连接层的维度修改为2×1,采用乳腺癌病理图像训练集基于随机梯度下降法进行网络精调训练,来优化深度特征提取模块的参数,并基于优化后的参数来提取训练集乳腺癌病理图像的深度特征hi,维度为w*h*c,其中w、h和c分别表示深度特征的宽、高和通道数。
其中步骤S3具体包括以下过程:
将深度特征模块模型获得的训练集深度特征hi输入聚合模块,获得深度特征聚合编码,具体计算公式如下:
Figure BDA0001928660540000041
其中,ak(hij)表示加权系数,ck表示由K-means算法得到的聚类中心,hij表示hi的第j个局部描述子。加权系数ak(hij)计算公式如下:
Figure BDA0001928660540000042
其中,W为比例系数,
Figure BDA0001928660540000043
为w*h个W的平均值。比例系数W的计算公式如下:
Figure BDA0001928660540000044
其中,c1是距离hij最近的聚类中心,c2是距离hij第二近的聚类中心。
其中步骤S4具体包括以下过程:
使用训练集的深度特征聚合编码来训练预分类模块的分类器,发明采用支持向量机(SVM)作为分类器,以获得预分类标签。预分类模块实现了对深度特征聚合编码的分类工作,即对每一张数据增强后的乳腺癌病理图像产生一个预分类标签。
其中步骤S5具体包括以下过程:
将乳腺癌病理图像测试集样本输入串联的深度特征模块、特征聚合模块和预分类模块,依次获得测试集样本对应的深度特征、深度特征聚合编码及其相应的预分类标签。
其中步骤S6具体包括以下过程:
将乳腺癌病理图像测试集的预分类标签输入投票模块,统计对应同一张原始将乳腺癌病理图像的预分类标签个数,个数最多的预分类标签即为原始将乳腺癌病理图像的预测标签。
Figure BDA0001928660540000051
其中,Lpre代表预测标签,L1代表第一类标签,L2代表第二类标签,n1表示归属为第一类的预分类标签个数,n2表示归属为第二类预分类标签的个数。
本发明的有益效果是,本发明重在通过提取更有效的乳腺癌病理图像深度特征,并以新的方式将深度特征进行聚合,来获得更具判别性的深度特征聚合编码,从而提高对乳腺癌病理图像的分类准确率。
附图说明
图1是本发明所涉及的基于深度特征聚合的图像分类方法的流程示意图。
具体实施方式
下面结合图1和实施例对本发明作进一步说明,本发明采用BreakHis乳腺癌病理图像数据集作为实例数据集,该数据集包含从82例患者中采集的7909张700×460的彩色病理图像,这些病理图像使用不同的放大倍数(40×、100×、200×和400×)呈现,划分为2个类别:benign(良性)、malignant(恶性)。
参照图1流程图,本发明解决其技术问题的具体步骤如下:
步骤S1:构造并划分图像数据集
采集BreakHis乳腺癌病理图像数据集,按0.8的比例系数对病理图像长宽进行裁剪,将裁剪后的病理图像进行90度、180度和270度旋转,可将原乳腺癌病理数据集扩增16倍,获得126544张乳腺癌病理图像。为适应VGG-VD16卷积神经网络,将所有病理图像放缩为224×224。构造为乳腺癌病理图像数据集X=[x1,x2,…,x126544],数据集X的2个类别标签表示为Y=[y1,y2],分别表示良性和恶性,数据集中的每个样本均包含乳腺癌病理图像数据及标签。随后划分数据集,从82位患者中随机选取57位患者的样本作为训练集Xtr,剩余患者的样本测试集Xte,乳腺癌病理训练集用于发明方法的模型训练,测试集用于模型测试。
步骤S2:训练深度特征提取模块模型
(1)乳腺癌病理图像特征前向传播:将训练集Xtr中的乳腺癌病理图像按照不同放大倍率独立地输入深度特征模块,每张224×224的乳腺癌病理图像经过深度特征提取模块后可获得13×13×256大小的深度特征hi
(2)误差反向传播:全连接层将深度特征映射为2×1的向量xi,即对应2个类别标签的取值,经Softmax处理为2×1的预测概率向量,计算Softmaxloss损失。网络参数初始化,设置训练的学习率为10-4,权重下降率为0.001,设置训练批次为16,训练代数为50。
此时根据该初始误差进行反向传播,更新网络参数。在迭代过程中,错误率随着训练代数增加逐渐减小。在训练过程中,网络参数微调,直至达到收敛状态,确定最优深度特征提取模块的参数。并提取训练集的乳腺癌病理图像深度特征hi
步骤S3:训练特征聚合模块
按照不同放大倍率,使用训练集乳腺癌病理图像维度为13*13*256的深度特征hi训练特征聚合模块,获得维度为16*256的码本,并计算训练集的4096维深度特征聚合编码,即Btr。本实例将编码的聚类中心个数设置为K=16;
步骤S4:训练预分类模块
使用训练集乳腺癌病理图像4096维的深度特征聚合编码Btr训练支持向量机SVM分类器作为预分类模块,获得训练集图像的预分类标签。
步骤S5:获得测试集预分类标签
将乳腺癌病理图像测试集Xte输入串联的深度特征模块、特征聚合模块和预分类模块,依次获得测试集样本13*13*256维的深度特征、4096维的深度特征聚合编码及其相应的预分类标签。
步骤S6:获得预测标签,计算分类准确率
将乳腺癌病理图像测试集的预分类标签输入投票模块,获得原始图像预测标签。分别在图像层面和患者层面计算模型分类准确率。
根据测试集样本预测标签与真实标签是否一致,计算图像层面和患者层面的分类准确率。如下表1和表2分别是本发明的深度特征聚合编码方法在图像层面和患者层面的乳腺癌病理图像分类准确率,在BreakHis数据集4种放大倍率的子集上与基于CNN的方法比较,其结果更占优势。
表1 BreakHis数据集上图像层面的分类准确率
Figure BDA0001928660540000081
表2 BreakHis数据集上患者层面的分类准确率
Figure BDA0001928660540000082
综上所述,本发明提出的基于深度特征聚合的乳腺癌病理图像分类方法可有效提升分类精度。首先,经过乳腺癌病理图像微调后的深度特征模块优化了参数,能够提取更有效的病理图像深度特征。其次,模型通过聚合深度特征获得深度特征聚合编码,进一步提高了特征的区分能力;然后,使用统计预分类标签获得预测标签,进一步提高了模型的鲁棒性,从而在整体上提升了模型的乳腺癌病理图像分类性能。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围内。

Claims (4)

1.一种基于深度特征聚合的乳腺癌病理图像分类方法,其特征在于,该方法包括以下步骤:
步骤S1:构造包含乳腺癌病理图像数据及良恶性标签的图像数据集,对原始乳腺癌病理图像数据集进行数据增强,并划分为训练集、测试集两部分,训练集用于模型训练,测试集用于模型测试;
步骤S2:使用训练集样本训练深度特征提取模块,包括特征前向传播和误差反向传播两个过程,并提取乳腺癌病理图像训练集样本的深度特征;
步骤S3:使用乳腺癌病理图像训练集样本的深度特征来训练特征聚合模块,获得特征聚合模块的码本,并计算乳腺癌病理图像训练集的深度特征聚合编码,具体计算公式如下:
Figure FDA0003887785690000011
其中,ak(hij)表示加权系数,ck表示由训练集特征经K-means算法获得的聚类中心,hij表示第i个乳腺癌病理图像的第j个局部描述子,加权系数ak(hij)计算公式如下:
Figure FDA0003887785690000012
其中,W为比例系数,
Figure FDA0003887785690000013
为w*h个W的平均值,其中w、h分别表示深度特征的宽和高,比例系数W的计算公式如下:
Figure FDA0003887785690000014
其中,c1是距离hij最近的聚类中心,c2是距离hij第二近的聚类中心;
步骤S4:使用乳腺癌病理图像训练集的深度特征聚合编码训练预分类模块,以获得预分类标签;
步骤S5:在步骤S1所述的模型测试中,将乳腺癌病理图像测试集样本输入串联的深度特征提取模块、特征聚合模块和预分类模块,以获得测试集样本的预分类标签;
步骤S6:将乳腺癌病理图像测试集预分类标签输入投票模块,获得最终的预测标签,在乳腺癌病理图像测试集上,用图像级别分类准确率和患者级别分类准确率评判方法的整体性能。
2.根据权利要求1所述的一种基于深度特征聚合的乳腺癌病理图像分类方法,其特征在于,所述的步骤S1中,对原始乳腺癌病理图像进行数据增强,包括图像剪切和图像旋转操作,采用数据增强后的数据来构造乳腺癌病理图像数据集,数据集中包括图像数据和标签信息,以X=[x1,x2,...,xN]表示乳腺癌病理图像构成的数据集,其中每一张乳腺癌病理图像记作xi,{i=1,2,...N},N表示乳腺癌病理图像样本个数;Y=[y1,y2,...,yM]表示乳腺癌病理图像对应的标签,将样本集进行划分,选取一部分作为测试集Xte,一部分作为训练集Xtr
3.根据权利要求1所述的基于深度特征聚合的乳腺癌病理图像分类方法,其特征在于,所述的步骤S2中,深度特征提取模块使用VGG-VD16网络的1-15层构建,使用随机梯度下降法训练深度特征提取模块,提取乳腺癌病理图像的深度特征。
4.根据权利要求1所述的基于深度特征聚合的乳腺癌病理图像分类方法,其特征在于,所述的步骤S6中的投票模块,对应同一张原始乳腺癌病理图像的预分类标签进行统计,计算公式如下:
Figure FDA0003887785690000031
其中,Lpre代表预测标签,L1代表第一类标签,L2代表第二类标签,n1表示归属为第一类的预分类标签个数,n2表示归属为第二类预分类标签的个数。
CN201811652854.2A 2018-12-29 2018-12-29 一种基于深度特征聚合的乳腺癌病理图像分类方法 Active CN109740669B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811652854.2A CN109740669B (zh) 2018-12-29 2018-12-29 一种基于深度特征聚合的乳腺癌病理图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811652854.2A CN109740669B (zh) 2018-12-29 2018-12-29 一种基于深度特征聚合的乳腺癌病理图像分类方法

Publications (2)

Publication Number Publication Date
CN109740669A CN109740669A (zh) 2019-05-10
CN109740669B true CN109740669B (zh) 2022-12-06

Family

ID=66362980

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811652854.2A Active CN109740669B (zh) 2018-12-29 2018-12-29 一种基于深度特征聚合的乳腺癌病理图像分类方法

Country Status (1)

Country Link
CN (1) CN109740669B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110288542A (zh) * 2019-06-18 2019-09-27 福州数据技术研究院有限公司 一种基于随机变换的肝部病理图像样本增强方法
CN110400297A (zh) * 2019-07-22 2019-11-01 中国石油大学(华东) 一种基于深度学习的肺癌分期预测方法
CN110533080B (zh) * 2019-08-07 2020-11-24 中南民族大学 一种基于模糊规则集的乳腺癌细胞图像分类方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103295026A (zh) * 2013-05-15 2013-09-11 西安电子科技大学 基于空间局部聚合描述向量的图像分类方法
CN108364288A (zh) * 2018-03-01 2018-08-03 北京航空航天大学 用于乳腺癌病理图像的分割方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6127926B2 (ja) * 2013-11-11 2017-05-17 ソニー株式会社 画像処理装置及び画像処理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103295026A (zh) * 2013-05-15 2013-09-11 西安电子科技大学 基于空间局部聚合描述向量的图像分类方法
CN108364288A (zh) * 2018-03-01 2018-08-03 北京航空航天大学 用于乳腺癌病理图像的分割方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Classification of Benign and Malignant Pulmonary Nodules Based on Deep Learning;Yuechao Zhang 等;《 Information Science and Control Engineering》;20180722;第156-160页 *

Also Published As

Publication number Publication date
CN109740669A (zh) 2019-05-10

Similar Documents

Publication Publication Date Title
CN110969626B (zh) 基于3d神经网络的人脑核磁共振影像的海马体提取方法
Soudani et al. An image-based segmentation recommender using crowdsourcing and transfer learning for skin lesion extraction
Ahmmed et al. Classification of tumors and it stages in brain MRI using support vector machine and artificial neural network
JP2022538866A (ja) 画像前処理のためのシステム及び方法
CN110534192B (zh) 一种基于深度学习的肺结节良恶性识别方法
CN112418329B (zh) 一种基于多尺度纹理特征融合宫颈oct图像分类方法及系统
Wang et al. Adaptive pruning of transfer learned deep convolutional neural network for classification of cervical pap smear images
Liu et al. Ordinal regression with neuron stick-breaking for medical diagnosis
CN112270666A (zh) 基于深度卷积神经网络的非小细胞肺癌病理切片识别方法
CN113947607B (zh) 一种基于深度学习的癌症病理图像生存预后模型构建方法
CN109740669B (zh) 一种基于深度特征聚合的乳腺癌病理图像分类方法
Zheng et al. Application of transfer learning and ensemble learning in image-level classification for breast histopathology
CN112446891B (zh) 基于U-Net网络脑胶质瘤的医学图像分割方法
CN103593674A (zh) 一种颈部淋巴结超声图像特征选择方法
CN112488992B (zh) 表皮生长因子受体突变状态判断方法、介质及电子设备
CN116012353A (zh) 一种基于图卷积神经网络的数字病理组织图像识别方法
CN113269799A (zh) 一种基于深度学习的宫颈细胞分割方法
CN113628197A (zh) 一种基于对比学习的弱监督全切片组织病理图像分类方法
CN116228759B (zh) 肾细胞癌类型的计算机辅助诊断系统及设备
CN112085742B (zh) 一种基于上下文注意力的nafld超声视频诊断方法
CN111582370B (zh) 一种基于粗糙集优化的脑转移瘤预后指标约简及分类方法
CN113707317A (zh) 一种基于混合模型的疾病危险因素重要性分析方法
Thapa et al. Deep learning for breast cancer classification: Enhanced tangent function
CN117195027A (zh) 基于成员选择的簇加权聚类集成方法
Marinos et al. Micsurv: medical image clustering for survival risk group identification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant