CN109598719A - 一种基于深度学习的肺部疾病检测方法 - Google Patents

一种基于深度学习的肺部疾病检测方法 Download PDF

Info

Publication number
CN109598719A
CN109598719A CN201811490129.XA CN201811490129A CN109598719A CN 109598719 A CN109598719 A CN 109598719A CN 201811490129 A CN201811490129 A CN 201811490129A CN 109598719 A CN109598719 A CN 109598719A
Authority
CN
China
Prior art keywords
deep learning
data set
pulmonary disease
chestx
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811490129.XA
Other languages
English (en)
Inventor
林罗杰
马锦华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN201811490129.XA priority Critical patent/CN109598719A/zh
Publication of CN109598719A publication Critical patent/CN109598719A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30061Lung

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

本发明提供一种基于深度学习的肺部疾病检测方法,该方法简化了提取特征的过程,利用的网络结构具有普适性;与现有的深度学习方法相比,本发明加快了模型的训练速度,在较少迭代次数的情况下可以得到较高的准确率。

Description

一种基于深度学习的肺部疾病检测方法
技术领域
本发明涉及计算机视觉和医学图像分析相关领域,更具体地,涉及一种基于深度学习的肺部疾病检测方法。
背景技术
胸部X射线是最常用的放射学检查之一,主要用于筛选和诊断多种肺部疾病。但是在胸部X射线中检测肺部疾病是一项具有挑战性的任务,这依赖于在放射科具有丰富经验的医生。
近年来,随着计算机技术和深度学习的发展,计算机辅助诊断系统在医学图像分析领域愈发重要。作为深度学习的重要网络结构之一的卷积神经网络首先在计算机视觉领域取得突破,已经被证明是可用于许多计算机视觉任务的有力工具。医学图像分析领域和计算机视觉领域具有一定的相关性,都是基于图像进行研究。因此,计算机视觉领域中的卷积神经网络也可以用于医学图像分析领域进行相关研究。
发明内容
本发明提供一种基于深度学习的肺部疾病检测方法,该方法加快了模型的训练速度,在较少迭代次数的情况下可以得到较高的准确率。
为了达到上述技术效果,本发明的技术方案如下:
一种基于深度学习的肺部疾病检测方法,包括以下步骤:
S1:获取ChestX-ray14数据集并对数据集进行划分;
S2:对ChestX-ray14数据集进行预处理;
S3:将图像数据输入卷积神经网络提取特征;
S4:利用PyTorch训练模型和测试模型;
S5:将一张胸部X射线图像输入训练好的模型,输出该图像中肺部常见疾病的概率;
其中,ChestX-ray14是由NIH研究院提供的目前规模最大的胸部X射线图像数据集,该数据集包含14种常见的肺部疾病。
进一步地,所述步骤S1的具体过程是:
使用ChestX-ray 14数据集作为实验数据集,将ChestX-ray 14数据集划分为3个部分:第1部分占70%,作为训练集train set;第2部分占10%,作为验证集validationset;第3部分占20%,作为测试集test set,所划分的3个部分的数据集互不重叠。
进一步地,所述步骤S2的具体过程是:
S21:为了使图像的分辨率和所设计的卷积神经网络的输入层相匹配,对ChestX-ray 14数据集裁剪成331x331像素;
S22:为了增加训练数据提高模型的泛化能力,使用数据增强技术对ChestX-ray14数据集划分出的训练集和验证集进行随机水平翻转;
S23:为了加快模型的收敛速度和提高精度,对数据进行均值归一化处理。
进一步地,所述步骤S3的具体过程是:
S31:将上一步预处理后的图像输入到卷积神经网络提取特征,利用基于深度学习的NASNet网络提取特征,主要包括一个3x3的卷积层,两种Convolution Cell,分别是Normal Cell和Reduction Cell,其中Normal Cell是不改变输入特征图大小的卷积操作,Reduction Cell是将输入特征图的长宽各减少为原来一般的卷积操作;
S32:胸部X射线图像经过NASNet卷积神经网络提取特征之后转化为一个特征向量,然后连接一个全连接层和最后的一个预测层,用于检测肺部常见的疾病。
进一步地,所述步骤S4的具体过程是:
S41:将训练样本和测试样本输入网络;
S42:设置损失函数、优化函数和学习率;
S43:利用PyTorch框架进行训练,得到胸部X射线图像和肺部常见疾病之间的映射关系。
进一步地,所述步骤S5的具体过程是:
经过S1-S4步骤训练出一个基于深度学习的肺部疾病检测模型,之后可以使用该模型来检测胸部X射线图像中肺部常见的疾病,具体的操作是将一张胸部X射线图像输入到训练好的模型,然后肺部疾病检测模型输出该图像中肺部常见疾病的概率。
与现有技术相比,本发明技术方案的有益效果是:
本发明方法简化了提取特征的过程,利用的网络结构具有普适性;与现有的深度学习方法相比,本发明加快了模型的训练速度,在较少迭代次数的情况下可以得到较高的准确率。
附图说明
图1是本发明的整体流程图;
图2是本发明的网络结构图
图3是本发明和以前方法的对比结果表。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
一种基于深度学习的肺部疾病检测方法,包括以下步骤:
S1:获取ChestX-ray14数据集并对数据集进行划分;
S2:对ChestX-ray14数据集进行预处理;
S3:将图像数据输入卷积神经网络提取特征;
S4:利用PyTorch训练模型和测试模型;
S5:将一张胸部X射线图像输入训练好的模型,输出该图像中肺部常见疾病的概率;
其中,ChestX-ray14是由NIH研究院提供的目前规模最大的胸部X射线图像数据集,该数据集包含14种常见的肺部疾病。
步骤S1的具体过程是:
使用ChestX-ray 14数据集作为实验数据集,将ChestX-ray 14数据集划分为3个部分:第1部分占70%,作为训练集train set;第2部分占10%,作为验证集validationset;第3部分占20%,作为测试集test set,所划分的3个部分的数据集互不重叠。
步骤S2的具体过程是:
S21:为了使图像的分辨率和所设计的卷积神经网络的输入层相匹配,对ChestX-ray 14数据集裁剪成331x331像素;
S22:为了增加训练数据提高模型的泛化能力,使用数据增强技术对ChestX-ray14数据集划分出的训练集和验证集进行随机水平翻转;
S23:为了加快模型的收敛速度和提高精度,对数据进行均值归一化处理。
步骤S3的具体过程是:
S31:将上一步预处理后的图像输入到卷积神经网络提取特征,利用基于深度学习的NASNet网络提取特征,主要包括一个3x3的卷积层,两种Convolution Cell,分别是Normal Cell和Reduction Cell,其中Normal Cell是不改变输入特征图大小的卷积操作,Reduction Cell是将输入特征图的长宽各减少为原来一般的卷积操作;
S32:胸部X射线图像经过NASNet卷积神经网络提取特征之后转化为一个特征向量,然后连接一个全连接层和最后的一个预测层,用于检测肺部常见的疾病。
步骤S4的具体过程是:
S41:将训练样本和测试样本输入网络;
S42:设置损失函数、优化函数和学习率;
S43:利用PyTorch框架进行训练,得到胸部X射线图像和肺部常见疾病之间的映射关系:
本发明实验利用PyTorch框架来训练模型、验证模型和测试模型。首先读取图像数据导入到网络中,设置批大小(Batch Size)为16,针对训练集和验证集每轮次的训练打乱数据顺序。本发明使用的是损失函数是二进制交叉熵,定义如下:
其中o表示图像经过网络后的输出,t表示图像的真实类标,n表示一个批次的数据量,i表示一个批次中的第i张图像。用于提取图像特征的卷积神经网络使用的是在ImageNet上做了预训练的NASNet模型。因为通常使用在更大的数据集上做过预训练的模型能得到更好的效果。使用Adam优化函数,设置初始学习率为0.0001并每2轮次把学习率设置为原来的0.1倍。最后进行训练直至收敛,最终得到胸部X射线图像和肺部常见疾病之间的映射关系。
步骤S5的具体过程是:
经过S1-S4步骤训练出一个基于深度学习的肺部疾病检测模型,之后可以使用该模型来检测胸部X射线图像中肺部常见的疾病,具体的操作是将一张胸部X射线图像输入到训练好的模型,然后肺部疾病检测模型输出该图像中肺部常见疾病的概率。
实验结果
1)数据集
ChestX-ray14,包括14类肺部疾病,总共112120张正面胸部X射线图像。将ChestX-ray14数据集划分为3部分,每部分都包含14种疾病,并且所划分的3个部分的数据集互不重叠。其中第1部分占70%,作为训练集(train set);第2部分占10%,作为验证集(validation set);第3部分占20%,作为测试集(test set)。
2)评价指标
我们选择多标签多分类领域的AUC值作为评价指标。AUC表示ROC曲线下的面积,取值范围在0到1之间,值越大越好。
3)结果分析如图3所示。
从图3结果可以看出我们的发明相比之前的方法有了一定的提升。同时本发明加快了模型的训练速度,在较少迭代次数的情况下可以得到较高的准确率
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (6)

1.一种基于深度学习的肺部疾病检测方法,其特征在于,包括以下步骤:
S1:获取ChestX-ray14数据集并对数据集进行划分;
S2:对ChestX-ray14数据集进行预处理;
S3:将图像数据输入卷积神经网络提取特征;
S4:利用PyTorch训练模型和测试模型;
S5:将一张胸部X射线图像输入训练好的模型,输出该图像中肺部常见疾病的概率;
其中,ChestX-ray14是由NIH研究院提供的目前规模最大的胸部X射线图像数据集,该数据集包含14种常见的肺部疾病。
2.根据权利要求1所述的基于深度学习的肺部疾病检测方法,其特征在于,所述步骤S1的具体过程是:
使用ChestX-ray 14数据集作为实验数据集,将ChestX-ray 14数据集划分为3个部分:第1部分占70%,作为训练集train set;第2部分占10%,作为验证集validation set;第3部分占20%,作为测试集test set,所划分的3个部分的数据集互不重叠。
3.根据权利要求2所述的基于深度学习的肺部疾病检测方法,其特征在于,所述步骤S2的具体过程是:
S21:为了使图像的分辨率和所设计的卷积神经网络的输入层相匹配,对ChestX-ray14数据集裁剪成331x331像素;
S22:为了增加训练数据提高模型的泛化能力,使用数据增强技术对ChestX-ray 14数据集划分出的训练集和验证集进行随机水平翻转;
S23:为了加快模型的收敛速度和提高精度,对数据进行均值归一化处理。
4.根据权利要求3所述的基于深度学习的肺部疾病检测方法,其特征在于,所述步骤S3的具体过程是:
S31:将上一步预处理后的图像输入到卷积神经网络提取特征,利用基于深度学习的NASNet网络提取特征,主要包括一个3x3的卷积层,两种Convolution Cell,分别是NormalCell和Reduction Cell,其中Normal Cell是不改变输入特征图大小的卷积操作,Reduction Cell是将输入特征图的长宽各减少为原来一般的卷积操作;
S32:胸部X射线图像经过NASNet卷积神经网络提取特征之后转化为一个特征向量,然后连接一个全连接层和最后的一个预测层,用于检测肺部常见的疾病。
5.根据权利要求4所述的基于深度学习的肺部疾病检测方法,其特征在于,所述步骤S4的具体过程是:
S41:将训练样本和测试样本输入网络;
S42:设置损失函数、优化函数和学习率;
S43:利用PyTorch框架进行训练,得到胸部X射线图像和肺部常见疾病之间的映射关系。
6.根据权利要求5所述的基于深度学习的肺部疾病检测方法,其特征在于,所述步骤S5的具体过程是:
经过S1-S4步骤训练出一个基于深度学习的肺部疾病检测模型,之后可以使用该模型来检测胸部X射线图像中肺部常见的疾病,具体的操作是将一张胸部X射线图像输入到训练好的模型,然后肺部疾病检测模型输出该图像中肺部常见疾病的概率。
CN201811490129.XA 2018-12-06 2018-12-06 一种基于深度学习的肺部疾病检测方法 Pending CN109598719A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811490129.XA CN109598719A (zh) 2018-12-06 2018-12-06 一种基于深度学习的肺部疾病检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811490129.XA CN109598719A (zh) 2018-12-06 2018-12-06 一种基于深度学习的肺部疾病检测方法

Publications (1)

Publication Number Publication Date
CN109598719A true CN109598719A (zh) 2019-04-09

Family

ID=65961477

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811490129.XA Pending CN109598719A (zh) 2018-12-06 2018-12-06 一种基于深度学习的肺部疾病检测方法

Country Status (1)

Country Link
CN (1) CN109598719A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113052236A (zh) * 2021-03-22 2021-06-29 山西三友和智慧信息技术股份有限公司 一种基于NASNet的肺炎图像分类方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104794534A (zh) * 2015-04-16 2015-07-22 国网山东省电力公司临沂供电公司 一种基于改进深度学习模型的电网安全态势预测方法
CN106372390A (zh) * 2016-08-25 2017-02-01 姹ゅ钩 一种基于深度卷积神经网络的预防肺癌自助健康云服务系统
CN106845471A (zh) * 2017-02-20 2017-06-13 深圳市唯特视科技有限公司 一种基于生成对抗网络的视觉显著性预测方法
CN107256550A (zh) * 2017-06-06 2017-10-17 电子科技大学 一种基于高效cnn‑crf网络的视网膜图像分割方法
CN107945875A (zh) * 2017-11-17 2018-04-20 合肥工业大学 基于数据增强的肺结节检测方法及系统
CN108899087A (zh) * 2018-06-22 2018-11-27 中山仰视科技有限公司 基于深度学习的x光片智能诊断方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104794534A (zh) * 2015-04-16 2015-07-22 国网山东省电力公司临沂供电公司 一种基于改进深度学习模型的电网安全态势预测方法
CN106372390A (zh) * 2016-08-25 2017-02-01 姹ゅ钩 一种基于深度卷积神经网络的预防肺癌自助健康云服务系统
CN106845471A (zh) * 2017-02-20 2017-06-13 深圳市唯特视科技有限公司 一种基于生成对抗网络的视觉显著性预测方法
CN107256550A (zh) * 2017-06-06 2017-10-17 电子科技大学 一种基于高效cnn‑crf网络的视网膜图像分割方法
CN107945875A (zh) * 2017-11-17 2018-04-20 合肥工业大学 基于数据增强的肺结节检测方法及系统
CN108899087A (zh) * 2018-06-22 2018-11-27 中山仰视科技有限公司 基于深度学习的x光片智能诊断方法

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
BARRET ZOPH 等: "Learning transferable architectures for scalable image recognition" *
周进凡等: "基于深度学习的胸部X光影像分析系统", 《电子技术应用》 *
曹川;张红英;: "基于改进残差网络的人脸识别算法" *
沈孟如;杨萌柯;: "交通信息网和电信网的融合架构及融合信息系统的技术评价" *
蒲海波;潘勇浩;: "改进的BP算法在文字识别中的应用" *
金超;龚铖;李辉;: "语音识别中神经网络声学模型的说话人自适应研究" *
陈天华;郑司群;于峻川;: "采用改进DeepLab网络的遥感图像分割" *
黄一天等: "Pytorch框架下基于卷积神经网络实现手写数字识别", 《电子技术与软件工程》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113052236A (zh) * 2021-03-22 2021-06-29 山西三友和智慧信息技术股份有限公司 一种基于NASNet的肺炎图像分类方法

Similar Documents

Publication Publication Date Title
CN108446730B (zh) 一种基于深度学习的ct肺结节检测装置
CN110443798B (zh) 一种基于磁共振图像的自闭症检测方法、装置及系统
CN109886273B (zh) 一种cmr图像分割分类系统
Danelakis et al. Survey of automated multiple sclerosis lesion segmentation techniques on magnetic resonance imaging
Senousy et al. MCUa: Multi-level context and uncertainty aware dynamic deep ensemble for breast cancer histology image classification
Ahishali et al. Advance warning methodologies for covid-19 using chest x-ray images
CN113724880A (zh) 一种异常脑连接预测系统、方法、装置及可读存储介质
CN109064455B (zh) 一种基于bi-rads的乳腺超声图像多尺度融合的分类方法
CN111954250B (zh) 一种轻量级Wi-Fi行为感知方法和系统
Yao et al. Pneumonia Detection Using an Improved Algorithm Based on Faster R‐CNN
Roshini et al. Automatic diagnosis of diabetic retinopathy with the aid of adaptive average filtering with optimized deep convolutional neural network
CN110348494A (zh) 一种基于双通道残差神经网络的人体动作识别方法
CN106980825A (zh) 一种基于归一化像素差特征的人脸姿势分类方法
Radha Analysis of COVID-19 and pneumonia detection in chest X-ray images using deep learning
Mahin et al. Classification of COVID‐19 and Pneumonia Using Deep Transfer Learning
Sufian et al. Deep learning feature extraction for COVID19 detection algorithm using computerized tomography scan
Choudhuri et al. Multi class image classification for detection of diseases using chest x ray images
Kadhim et al. Detection of COVID-19 in X-Rays by convolutional neural networks
Ahmed et al. A deep learning based system for accurate diagnosis of brain tumors using T1-w MRI
CN114511759A (zh) 一种皮肤状态图像的类别识别和特征确定方法及系统
Shakil et al. Systematic analysis of several deep learning approaches for covid-19 detection using x-ray images
CN109598719A (zh) 一种基于深度学习的肺部疾病检测方法
Patil et al. Emphasize of Deep CNN for Chest Radiology Images in the detection of COVID
CN116363438A (zh) 一种基于多模态的儿童脑炎分类系统
CN116091446A (zh) 食管内窥镜图像的异常检测方法、系统、介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190409