CN112270666A - 基于深度卷积神经网络的非小细胞肺癌病理切片识别方法 - Google Patents
基于深度卷积神经网络的非小细胞肺癌病理切片识别方法 Download PDFInfo
- Publication number
- CN112270666A CN112270666A CN202011210676.5A CN202011210676A CN112270666A CN 112270666 A CN112270666 A CN 112270666A CN 202011210676 A CN202011210676 A CN 202011210676A CN 112270666 A CN112270666 A CN 112270666A
- Authority
- CN
- China
- Prior art keywords
- neural network
- convolutional neural
- training
- small cell
- lung cancer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 45
- 208000002154 non-small cell lung carcinoma Diseases 0.000 title claims abstract description 28
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 title claims abstract description 28
- 238000000034 method Methods 0.000 title claims abstract description 25
- 230000001575 pathological effect Effects 0.000 title claims abstract description 23
- 238000012549 training Methods 0.000 claims abstract description 50
- 238000013136 deep learning model Methods 0.000 claims abstract description 8
- 201000005249 lung adenocarcinoma Diseases 0.000 claims abstract description 6
- 201000005243 lung squamous cell carcinoma Diseases 0.000 claims abstract description 6
- 208000010507 Adenocarcinoma of Lung Diseases 0.000 claims abstract description 5
- 238000012360 testing method Methods 0.000 claims description 12
- 238000011176 pooling Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 abstract description 9
- 238000013135 deep learning Methods 0.000 abstract description 8
- 238000012545 processing Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 238000002591 computed tomography Methods 0.000 description 2
- 238000002059 diagnostic imaging Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000002595 magnetic resonance imaging Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000004195 computer-aided diagnosis Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 208000030776 invasive breast carcinoma Diseases 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 208000037841 lung tumor Diseases 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformation in the plane of the image
- G06T3/40—Scaling the whole image or part thereof
- G06T3/4084—Transform-based scaling, e.g. FFT domain scaling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30061—Lung
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Medical Informatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于深度卷积神经网络的非小细胞肺癌病理切片识别方法,步骤为:从TCGA获取到的公开数据集非小细胞肺癌的病理切片;构建用于训练的深度学习模型;将训练数据集输入卷积神经网络训练,得到学习后的卷积神经网络模型;将训练数据集输入卷积神经网络训练,得到学习后的卷积神经网络模型。本发明通过利用Inception‑v3模型和CBAM注意力机制融合在一起,实现对非小型细胞肺癌的分类,通过注意力机制提高了网络精度;同时利用深度卷积神经网络Inception‑v3实验结果表明,本发明提出的基于深度学习的非小细胞肺癌病理切片识别方法可以有效的针对肺腺癌和肺鳞状细胞癌的分类,在一定程度上减轻了医生的负担,在医学图像识别领域实现了非常良好的性能。
Description
技术领域
本发明属于医学影像、图像处理和深度学习的技术领域,尤其涉及一种基于深度卷积神经网络的非小细胞肺癌病理切片识别方法。
背景技术
随着医学影像和计算机识别技术的发展,越来越多的医学检查方法可以把检查结果以数字图像的方式呈现出来。因而也产生了大量医学影像数据,如病理切片、CT(电子计算机断层扫描)、MRI(核磁共振成像)等。数字化描述微观病理学的特征是病理学的新领域。通过访问数字图像,有助于远程初级诊断工作、远程咨询和平衡医生的工作。
由于深度学习的发展,研究者已经使用大型图像数据集(例如,癌症基因组图谱或TCGA)训练了各种深度架构,并且发现了新的生物医学信息。深度学习中的图像分类方法为医学图像分析做出了重大贡献,一些研究工作应用迁移学习方法,将自然图像的识别分类方法应用的医学图像领域,最初的研究是从零开始训练网络架构,而不是使用预先训练好的网络, Menegola等人(2016)进行了实验,比较了从零开始训练和对预先训练好的网络进行微调两种情况,结果显示,在数据不充分时,使用预训练好的网络进行微调的研究方法结果更好。还有一些研究工作主要应用的是卷积神经网络(CNN),例如Angel Cruz-Roa等人应用CNN检测浸润性乳腺癌,后来逐渐发展为使用3D神经网络。综上所述,深度学习卷积神经网络是目前图像识别分类中广泛应用的技术,特别是在自然图像的分类识别效果已经超过了人类专家的准确性,因此可以把深度学习卷积神经网络应用在医学图像方面。
非小细胞肺癌(NSCLC)又分为肺腺癌和肺鳞状细胞癌,二者的诊疗方案却截然不同。传统的确诊方法都是依靠有经验的病理学家来进行确认,这在很大程度上依赖于医生的经验和知识。在医学系统使用的算法中,支持向量机(SVM)和人工神经网络(ANN)都得到了广泛的应用,在分类问题上表现出了良好的性能。Kureshi等人利用患者数据设计了一种预测模型,用于非小细胞肺癌的个性化治疗干预,利用频发模式挖掘建立晚期非小细胞肺癌患者特征与肿瘤的关系,该模型使用SVM、J48、随机森林和分类回归树(CART)四种分类器进行预测。实验结果表明,分类准确率最高为76.56%。Puet等人证明了ANN在预测NSCLC患者生存时间方面优于多元线性回归模型。近年来,深度学习技术已经取得了很大进步,临床实践中通过计算机辅助诊断技术的应用也越来越广泛,并且数字图像处理和识别技术已经日渐成熟。
发明内容
基于以上现有技术的不足,本发明所解决的技术问题在于提供一种基于深度卷积神经网络的非小细胞肺癌病理切片识别方法,将图像识别中的 Inception-v3模型和CBAM注意力机制相结合,来对非小细胞肺癌的病理切片进行分类,从而帮助医生进行辅助诊断,进一步明确肺癌类型,尽早给患者提供治疗方案。
为了解决上述技术问题,本发明通过以下技术方案来实现:
本发明提供一种基于深度卷积神经网络的非小细胞肺癌病理切片识别方法,包括以下步骤:
步骤1:从TCGA(The Cancer Genome Atlas)获取到的公开数据集非小细胞肺癌的病理切片。
步骤2:构建用于训练的深度学习模型Inception-v3+CBAM。
步骤3:将训练数据集输入卷积神经网络训练,得到学习后的卷积神经网络模型。
步骤4:将测试集输入到训练后的模型中,输出图像分类结果。
进一步的,步骤1包括如下步骤:
步骤1.1:对所有图像放大20倍后进行切分,并进行格式转换。
步骤1.2:把所有图像按照文件说明分为正常、肺腺癌和肺鳞状细胞癌三类。
步骤1.3:按比例分为训练集和测试集。
步骤1.4:把数据处理成二进制文件TFRecord形式。TFRecord是一种常用的存储二进制数据的文件格式,用Tensorflow框架把数据处理成这种形式更容易与模型匹配。
进一步的,步骤2包括如下步骤:
步骤2.1:调用深度卷积神经网络GoogleNet的Inception-v3模型,模型通过卷积、池化、激活函数,Inception模块,BN,dropout等操作。BN 操作是为了对数据进行归一化,使激活函数的作用更明显;dropout处理是为了防止过拟合,在前向传播过程中,让某个神经元的激活值以一定的概率停止工作,这样可以使模型泛化性更强。
步骤2.2:创建CBAM模块,将其加入Inception-v3模型中,CBAM 主要是一种关注图像通道之间关系和各像素点之间关系的一种注意力机制,能强化对图像的特征学习。
进一步的,步骤3包括如下步骤:
步骤3.1:将训练集分为m批(本发明的实验参数m设置为4600),并初始化卷积核权重和偏置值为0。
步骤3.2:随机选择一批未被训练的训练集输入到深度卷积神经网络中。
步骤3.3:将训练集数据与深度卷积神经网络中后续网格单元各个节点进行计算,实现网络的前向传播。
步骤3.4:计算预测结果与训练集数据样本的误差,计算方法为:
其中L代表训练数据及其真实标签与预测标签的误差,M代表样本数量,y代表训练样本的类别标签,a代表样本预测概率。
a=Wx+b
步骤3.5:采用RMSProp算法分别对卷积核权重和偏置值进行更新。
Sdw=βSdw+(1-α)dW2
Sdb=βSdb+(1-α)db2
步骤3.6:对设定的最大迭代次数进行判断,是否所有训练数据在深度学习模型中已完成最大迭代次数,若是则完成一次迭代。
步骤3.7:输出训练完成后的深度学习模型。
由上,本发明的基于深度卷积神经网络的非小细胞肺癌病理切片识别方法的有益效果为:
本发明通过利用Inception-v3模型和CBAM注意力机制融合在一起,实现对非小型细胞肺癌的分类,通过注意力机制提高了网络精度;同时利用深度卷积神经网络Inception-v3实验结果表明,本发明提出的基于深度学习的非小细胞肺癌病理切片识别方法可以有效的针对肺腺癌和肺鳞状细胞癌的分类,在一定程度上减轻了医生的负担,在医学图像识别领域实现了非常良好的性能。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下结合优选实施例,并配合附图,详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例的附图作简单地介绍。
图1为本发明的基于深度卷积神经网络的非小细胞肺癌病理切片识别方法流程图。
图2为本发明实施例中的注意力机制CBAM模型图。
图2.1为本发明实施例中的通道注意力机制模型图。
图2.2为本发明实施例中的空间注意力机制模型图。
图3为本发明实施例中的深度卷积神经网络Inception-v3中模型图。
图3.1为本发明实施例中的深度卷积神经网络Inception-v3中的 Block1,Module1。
图3.2为本发明实施例中的深度卷积神经网络Inception-v3中的 Block2,module1。
图3.3为本发明实施例中的深度卷积神经网络Inception-v3中的 Block3,module1。
图4为本发明实施例提供的训练集数据损失图。
图5为本发明实施例中数据切分后的形式图。
具体实施方式
下面结合附图详细说明本发明的具体实施方式,其作为本说明书的一部分,通过实施例来说明本发明的原理,本发明的其他方面、特征及其优点通过该详细说明将会变得一目了然。在所参照的附图中,不同的图中相同或相似的部件使用相同的附图标号来表示。
如图1至图5所示,本发明提供的基于深度卷积神经网络的非小细胞肺癌病理切片识别方法,包括以下步骤:
S1:对待识别的非小细胞肺癌的病理切片数据进行预处理,得到训练集数据和测试集数据。
步骤S1包括以下分步骤:
S1.1:由于病理切片过大,不适合网络输入,因此对所有图像放大20 倍后进行切分,切分成512*512像素的图片,并把原非小细胞肺癌切片.svs 格式转化为.jpeg格式的图片,放在名字为20倍的文件夹下。
S1.2:对格式转换后的图像做进一步处理,将其按照对应的标签分为正常类、肺腺癌、肺鳞状细胞癌三类。
S1.3:按照80%和20%的比例分为训练集和测试集。
S1.4:将对应的训练集和测试集处理成TFRecord形式的二进制文件,方便训练程序读取。例:将图5处理成TFRecord形式,
features{feature{key:"image/channels"value{int64_list{value:3}}}
feature{key:"image/class/label"value{int64_list{value:1}}}
feature{key:"image/class/text"value{bytes_list{value:"High"}}}
feature{key:"image/colorspace"value{bytes_list{value:"RGB"}}}
feature{key:"image/encoded"value{bytes_list
{value: "\377\330\377\340\000\020JFIF\000\001\001\000\000\001\000\001\000\000\37 7\333...........\177\301\023\366\351\336\347\377\331"}}}
feature{key:"image/filename"value{bytes_list{value:
"test_TCGA-55-7994-01A-01-TS1.8b666cd9-9f50-4be5-a12f-df25b84934 c3_18_7.jpeg"}}}
feature{key:"image/format"value{bytes_list{value:"JPEG"}}}
feature{key:"image/height"value{int64_list{value:512}}}
feature{key:"image/width"value{int64_list{value:512}}}}
对于深度卷积神经网络,通常需要大量的实验数据,在得到训练集和验证集后,可以通过图像增强技术来增大数据量,避免出现过拟合,从而提高实验精度。本发明实施例中可以通过图像的旋转来增加实验数据,使用如尺度变换、平移变换、缩放变换等其中任意一种或通过多种组合的方式增加数据量。
S2:构建训练网络,网络模型由深度卷积神经网络Inception-v3+CBAM 注意力块组成。
S2.1:如图2所示,先构建CBAM注意力块,CBAM由两部分组成,一部分是通道注意力模块(如图2.1),对输入的特征图进行通道上的最大池化和平局池化,即对通道进行最大池化和平局池化,将结果分别经过多层感知机(MLP),再把全局池化和平局池化的结果相加,在和输入的特征图进行内积,得到通道注意力的结果;另一部是空间注意力模块(如图2.2),通过对通道注意力模块的结果的特征图进行在空间的最大池化和平局池化,然后通过7*7卷积核对池化后的特征图进行卷积操作,得到一个通道的特征图,与通过对通道注意力模块的结果进行内积,从而完成一次CBAM 操作。
S2.2 Inception-v3模型是GoogleNet发明的模型,它最重要的部分是Iception块,打破了传统的深度卷积神经网络只能在深度上扩展的模式,通过多尺度融合的卷积核增加了网络的宽度,替代了人工选择卷积核大小,并且融入了Droupout以及BN(BatchNormalization)等技术,防止过拟合。本发明将CBAM模块分别加入到Inception-v3网络的第四层和第八层。
BN操作是指是数据标准化(归一化,规范化)。
S3将训练集数据输入深度卷积神经网络进行训练,得到学习后的卷积神经网络。
S3.1:将训练集分为m批(m设为4600),并初始化卷积核权重和偏置值为0。
ΔW(1)=0 (1)
Δb(1)=0 (2)
其中ΔW(1)表示第一层卷积层中的卷积核权重对损失函数的导数,Δb(1)表示第一层卷积层中的卷积核偏置对损失函数的导数。
S3.2:将选择的训练集数据送入深度卷积神经网络模型中。
S3.3:通过前向传播,输出预测标签值。
S3.4:计算预测标签值和真实值之间的误差。
其中L代表训练数据及真实标签与预测标签的误差,M代表样本数量, y代表训练样本的类别标签,a代表样本预测概率。
a=Wx+b
S3.5:采用RMSProp算法分别对卷积核权重和偏置值进行更新。
Sdw=βSdw+(1-α)dW2
Sdb=βSdb+(1-α)db2
RMSProp算法对权重W的梯度使用了微分平方加权平均数。其中,Wt表示t时刻即第t次迭代模型的参数,dW2表示t次迭代代价函数关于W的梯度大小,Sdw表示前t次的梯度平方的均值。β表示动力(通常设置为0.9),α表示全局初始学习率。∈是一个取值很小的数(一般为1e-8)为了避免分母为0。
S3.6:对设定的最大迭代次数进行判断,是否所有训练数据在深度卷积神经网络模型中已完成最大迭代次数,若是则完成一次迭代。如不是返回步骤S3.2.
S3.7:输出训练完成后的深度学习模型。
S4:将测试集输入到训练后的模型中,输出图像分类结果。
如图5反映了训练集的损失变化趋势,随着迭代数的增减,训练损失不断减小,最终Normal类、LUAD类、LUSC类AUC的值分别达到了 99.86%、93.93%和95.11%。
本发明实施例中,将Python语言作为开发语言,使用Tensorflow框架,将处理成TFRecord的训练数据集输送到网络模型中,迭代训练50次,进而产生50个模型参数,在将测试集分别在50个具有不同参数的模型上测试,实验结果由两部分组成,一部分预测每个小切片的概率值,另一部分是把同一张的小切片预测的概率值求平均值作为本张病理切片的预测概率值,选取50次的最优结果作为最终结果,采用auc作为实验评价指标。因为auc通常作为二分类模型的评价,针对本次实验是多分类任务,分别针对每一类做二分类,比如针对类1,把类1和其他类归结为一类做二分类,我们保持原来的超参数不变,放入我们处理的分类数据。
表格说明:
Normal:针对Normal类做二分类。把除了Normal的其他类作为一类与Normal类形成二分类。
LUAD:针对LUAD类做二分类。把除了LUAD的其他类作为一类与 LUAD类形成二分类。
LUSC:针对LUSC类做二分类。把除了LUSC的其他类作为一类与 LUSC类形成二分类。
Macro-average:每种类别下,都可以得到m个测试样本为该类别的概率(矩阵P中的列)。所以,根据概率矩阵P和标签矩阵L中对应的每一列,可以计算出各个阈值下的假正例率(FPR)和真正例率(TPR),从而绘制出一条ROC曲线。这样总共可以绘制出n条ROC曲线。最后对n条 ROC曲线取平均,即可得到最终的ROC曲线。
Micro-average:将标签矩阵L和概率矩阵P分别按行展开,转置后形成两列,这就得到了一个二分类的结果,进而绘制一条ROC曲线。
例:文件名:test_TCGA-37-3792-01A-01-BS1.bfaab472 -5877-4fa6-9758-8e68e51
da6e7_0001
第二项:标签true_label:[0.0,0.0,1.0]
第三项:预测为正类的数量/tiles
Percent_Selected:0.000000 0.158291 0.841709
第四项:每个图片在所有切片上的预测概率求和/tiles
Average_Probability:0.028992 0.206727 0.764281
第五项:一张图片被切分的数目tiles#:796.000000
平均概率AUC:用平均预测概率计算AUC
阳性切片百分比:预测为正类的数量/tiles计算AUC
[0.9965-0.9999]:此类数据代表auc的值有95%的概率落在此区间
以上所述是本发明的优选实施方式而已,当然不能以此来限定本发明之权利范围,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和变动,这些改进和变动也视为本发明的保护范围。
Claims (4)
1.基于深度卷积神经网络的非小细胞肺癌病理切片识别方法,其特征在于,包括以下步骤:
步骤1:从TCGA获取到的公开数据集非小细胞肺癌的病理切片;
步骤2:构建用于训练的深度学习模型;
步骤3:将训练数据集输入卷积神经网络训练,得到学习后的卷积神经网络模型;
步骤4:将训练数据集输入卷积神经网络训练,得到学习后的卷积神经网络模型。
2.如权利要求1所述的基于深度卷积神经网络的非小细胞肺癌病理切片识别方法,其特征在于,步骤1包括如下步骤:
步骤1.1:对所有图像放大20倍后进行切分,并进行格式转换;
步骤1.2:把所有图像按照文件说明分为正常、肺腺癌和肺鳞状细胞癌三类;
步骤1.3:按比例分为训练集和测试集;
步骤1.4:把数据处理成二进制文件TFRecord形式。
3.如权利要求1所述的基于深度卷积神经网络的非小细胞肺癌病理切片识别方法,其特征在于,步骤2包括以下步骤:
步骤2.1:调用深度卷积神经网络GoogleNet的Inception-v3模型,模型通过卷积、池化、激活函数;
步骤2.2:创建CBAM模块,将其加入Inception-v3模型中。
4.如权利要求1所述的基于深度卷积神经网络的非小细胞肺癌病理切片识别方法,其特征在于,步骤3包括以下步骤:
步骤3.1:将训练集分为m批,并初始化卷积核权重和偏置值为0;
步骤3.2:随机选择一批未被训练的训练集输入到深度卷积神经网络中;
步骤3.3:将训练集数据与深度卷积神经网络中后续网格单元各个节点进行计算,实现网络的前向传播;
步骤3.4:计算预测结果与训练集数据样本的误差;
步骤3.5:采用RMSProp算法分别对卷积核权重和偏置值进行更新;
步骤3.6:对设定的最大迭代次数进行判断,是否所有训练数据在深度学习模型中已完成最大迭代次数,若是则完成一次迭代;
步骤3.7:输出训练完成后的深度学习模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011210676.5A CN112270666A (zh) | 2020-11-03 | 2020-11-03 | 基于深度卷积神经网络的非小细胞肺癌病理切片识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011210676.5A CN112270666A (zh) | 2020-11-03 | 2020-11-03 | 基于深度卷积神经网络的非小细胞肺癌病理切片识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112270666A true CN112270666A (zh) | 2021-01-26 |
Family
ID=74344790
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011210676.5A Pending CN112270666A (zh) | 2020-11-03 | 2020-11-03 | 基于深度卷积神经网络的非小细胞肺癌病理切片识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112270666A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113012244A (zh) * | 2021-03-02 | 2021-06-22 | 浙江师范大学 | 基于Inception模块与Attention机制的鸡蛋新鲜度检测方法 |
CN113065646A (zh) * | 2021-05-14 | 2021-07-02 | 杭州迪英加科技有限公司 | 一种能够实现ki67病理图像神经网络模型泛化性能的方法 |
CN113112459A (zh) * | 2021-03-26 | 2021-07-13 | 四川大学 | 口腔鳞状细胞癌分化程度预测系统 |
CN113378984A (zh) * | 2021-07-05 | 2021-09-10 | 国药(武汉)医学实验室有限公司 | 一种医学图像分类方法、系统、终端以及存储介质 |
CN113627459A (zh) * | 2021-03-30 | 2021-11-09 | 太原理工大学 | 一种基于Inception网络的直肠癌病理切片图像分类方法及装置 |
CN114170206A (zh) * | 2021-12-13 | 2022-03-11 | 上海派影医疗科技有限公司 | 兼顾空间信息相关性的乳腺病理图像癌变性质判读方法及装置 |
CN114511523A (zh) * | 2022-01-21 | 2022-05-17 | 中山大学 | 基于自监督学习的胃癌分子亚型分类方法及装置 |
CN115345280A (zh) * | 2022-08-16 | 2022-11-15 | 东北林业大学 | 人脸识别攻击检测系统、方法、电子设备及存储介质 |
CN115496740A (zh) * | 2022-10-10 | 2022-12-20 | 湖北华鑫光电有限公司 | 基于卷积神经网络的镜片缺陷检测方法及其系统 |
CN115496744A (zh) * | 2022-10-17 | 2022-12-20 | 上海生物芯片有限公司 | 基于混合注意力的肺癌图像分割方法、装置、终端及介质 |
CN116309368A (zh) * | 2023-02-21 | 2023-06-23 | 北京透彻未来科技有限公司 | 一种基于深度迁移学习的肺癌病理诊断系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109308695A (zh) * | 2018-09-13 | 2019-02-05 | 镇江纳兰随思信息科技有限公司 | 基于改进U-net卷积神经网络模型的癌细胞识别方法 |
CN111161254A (zh) * | 2019-12-31 | 2020-05-15 | 上海体育科学研究所 | 一种骨龄预测方法 |
CN111199212A (zh) * | 2020-01-02 | 2020-05-26 | 西安工程大学 | 基于注意力模型的行人属性识别方法 |
CN111476310A (zh) * | 2020-04-16 | 2020-07-31 | 中国科学院半导体研究所 | 一种图像分类方法、装置及设备 |
CN111798464A (zh) * | 2020-06-30 | 2020-10-20 | 天津深析智能科技有限公司 | 基于深度学习的淋巴瘤病理图像智能识别方法 |
-
2020
- 2020-11-03 CN CN202011210676.5A patent/CN112270666A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109308695A (zh) * | 2018-09-13 | 2019-02-05 | 镇江纳兰随思信息科技有限公司 | 基于改进U-net卷积神经网络模型的癌细胞识别方法 |
CN111161254A (zh) * | 2019-12-31 | 2020-05-15 | 上海体育科学研究所 | 一种骨龄预测方法 |
CN111199212A (zh) * | 2020-01-02 | 2020-05-26 | 西安工程大学 | 基于注意力模型的行人属性识别方法 |
CN111476310A (zh) * | 2020-04-16 | 2020-07-31 | 中国科学院半导体研究所 | 一种图像分类方法、装置及设备 |
CN111798464A (zh) * | 2020-06-30 | 2020-10-20 | 天津深析智能科技有限公司 | 基于深度学习的淋巴瘤病理图像智能识别方法 |
Non-Patent Citations (1)
Title |
---|
许文慧 等: "基于注意力机制与迁移学习的乳腺钼靶肿块分类", 激光与光电子学进展, pages 1 - 13 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113012244A (zh) * | 2021-03-02 | 2021-06-22 | 浙江师范大学 | 基于Inception模块与Attention机制的鸡蛋新鲜度检测方法 |
CN113112459A (zh) * | 2021-03-26 | 2021-07-13 | 四川大学 | 口腔鳞状细胞癌分化程度预测系统 |
CN113627459A (zh) * | 2021-03-30 | 2021-11-09 | 太原理工大学 | 一种基于Inception网络的直肠癌病理切片图像分类方法及装置 |
CN113065646A (zh) * | 2021-05-14 | 2021-07-02 | 杭州迪英加科技有限公司 | 一种能够实现ki67病理图像神经网络模型泛化性能的方法 |
CN113378984A (zh) * | 2021-07-05 | 2021-09-10 | 国药(武汉)医学实验室有限公司 | 一种医学图像分类方法、系统、终端以及存储介质 |
CN114170206B (zh) * | 2021-12-13 | 2023-01-24 | 上海派影医疗科技有限公司 | 兼顾空间信息相关性的乳腺病理图像癌变性质判读方法及装置 |
CN114170206A (zh) * | 2021-12-13 | 2022-03-11 | 上海派影医疗科技有限公司 | 兼顾空间信息相关性的乳腺病理图像癌变性质判读方法及装置 |
CN114511523A (zh) * | 2022-01-21 | 2022-05-17 | 中山大学 | 基于自监督学习的胃癌分子亚型分类方法及装置 |
CN115345280A (zh) * | 2022-08-16 | 2022-11-15 | 东北林业大学 | 人脸识别攻击检测系统、方法、电子设备及存储介质 |
CN115496740A (zh) * | 2022-10-10 | 2022-12-20 | 湖北华鑫光电有限公司 | 基于卷积神经网络的镜片缺陷检测方法及其系统 |
CN115496744A (zh) * | 2022-10-17 | 2022-12-20 | 上海生物芯片有限公司 | 基于混合注意力的肺癌图像分割方法、装置、终端及介质 |
CN116309368A (zh) * | 2023-02-21 | 2023-06-23 | 北京透彻未来科技有限公司 | 一种基于深度迁移学习的肺癌病理诊断系统 |
CN116309368B (zh) * | 2023-02-21 | 2023-11-14 | 北京透彻未来科技有限公司 | 一种基于深度迁移学习的肺癌病理诊断系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112270666A (zh) | 基于深度卷积神经网络的非小细胞肺癌病理切片识别方法 | |
Toğaçar et al. | Detection of lung cancer on chest CT images using minimum redundancy maximum relevance feature selection method with convolutional neural networks | |
Kallenberg et al. | Unsupervised deep learning applied to breast density segmentation and mammographic risk scoring | |
CN107316294B (zh) | 一种基于改进的深度玻尔兹曼机肺结节特征提取方法 | |
Qadri et al. | CT-based automatic spine segmentation using patch-based deep learning | |
Li et al. | Automatic lumbar spinal MRI image segmentation with a multi-scale attention network | |
Mahapatra et al. | Visual saliency based active learning for prostate mri segmentation | |
Hasan et al. | Automated detection and characterization of colon cancer with deep convolutional neural networks | |
Yao et al. | Pneumonia detection using an improved algorithm based on faster r-cnn | |
CN113344864A (zh) | 一种基于深度学习的超声甲状腺结节良恶性预测方法 | |
Ibraheem et al. | 3PCNNB-net: Three parallel CNN branches for breast cancer classification through histopathological images | |
CN116884623B (zh) | 基于激光扫描成像的医疗康复预测系统 | |
Feng et al. | Supervoxel based weakly-supervised multi-level 3D CNNs for lung nodule detection and segmentation | |
Kazemi et al. | Classifying tumor brain images using parallel deep learning algorithms | |
Priya | Resnet based feature extraction with decision tree classifier for classificaton of mammogram images | |
Asadi et al. | Efficient breast cancer detection via cascade deep learning network | |
Eltoukhy et al. | Classification of multiclass histopathological breast images using residual deep learning | |
Khan | Identification of lung cancer using convolutional neural networks based classification | |
CN114581698A (zh) | 一种基于空间交叉注意力机制特征融合的目标分类方法 | |
Mammeri et al. | Early detection and diagnosis of lung cancer using YOLO v7, and transfer learning | |
Kharrat et al. | Brain tumour diagnostic segmentation based on optimal texture features and support vector machine classifier | |
CN115937590A (zh) | 一种并联融合CNN和Transformer的皮肤病图像分类方法 | |
Folorunso et al. | EfficientNets transfer learning strategies for histopathological breast cancer image analysis | |
CN113889235A (zh) | 一种三维医学影像无监督特征抽取系统 | |
CN108376567B (zh) | 一种基于标签传播算法的临床药品-药品不良反应检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |