CN112070755A - 基于深度学习和迁移学习结合的新冠肺炎图像识别方法 - Google Patents

基于深度学习和迁移学习结合的新冠肺炎图像识别方法 Download PDF

Info

Publication number
CN112070755A
CN112070755A CN202010962531.4A CN202010962531A CN112070755A CN 112070755 A CN112070755 A CN 112070755A CN 202010962531 A CN202010962531 A CN 202010962531A CN 112070755 A CN112070755 A CN 112070755A
Authority
CN
China
Prior art keywords
training
network
transfer learning
image
combination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010962531.4A
Other languages
English (en)
Inventor
李甫
陈泓杏
吴开腾
孔花
张莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neijiang Normal University
Original Assignee
Neijiang Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neijiang Normal University filed Critical Neijiang Normal University
Priority to CN202010962531.4A priority Critical patent/CN112070755A/zh
Publication of CN112070755A publication Critical patent/CN112070755A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30061Lung

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度学习和迁移学习结合的新冠肺炎图像识别方法,包括如下内容:步骤一、模型训练:利用深度卷积神经网络CNN作为图像特征提取器,对COVID‑CT开源数据集进行预训练,提取图像卷积特征;步骤二、将深度卷积神经网络CNN训练部分层的参数迁移至VGG19网络,通过对模型参数进行微调和重新训练。与现有技术相比,本发明的积极效果是:本发明通过对已有的预训练网络利用迁移学习进行微调与重新训练,以减小对训练数据量的需求和依赖;本发明基于VGG19网络,利用迁移学习方法进行训练,最终在未进行数据扩充的情况下在较短的时间内达到84%以上的召回率。

Description

基于深度学习和迁移学习结合的新冠肺炎图像识别方法
技术领域
本发明公开了一种基于深度学习和迁移学习结合的新冠肺炎图像识别方法。
背景技术
新型冠状病毒肺炎是因感染2019新型冠状病毒(2019-nCoV)引起的以肺部炎性病变为主的急性呼吸道感染性疾病,其传染性强,潜伏期长。目前确诊新型冠状病毒肺炎的标准是核酸检测阳性,而部分患者核酸检测结果呈假阴性,且需排查患者数量较大。对于无症状患者及大量待筛查者,影像学检查尤为重要。HRCT是2019-nCoV肺炎临床诊断的主要方法,具有方便、快捷的特点,在患者隔离、疗效评价与预防方面具有重要意义,而患者肺内病灶多,变化快,短时间内多次复查,图像多,显著增加了诊断医师的负荷。基于AI技术的辅助诊疗系统,可全自动、快速、准确地为医生提供诊疗意见,大幅减轻医疗负担,缓解隔离防控和医务人员紧缺的困难局面。
近年来人工智能(artificial intelligence,AI)技术(尤其是深度学习技术)以其强大的数据分析和特征识别能力,已在胸片质控、肺结节检出、肺癌诊断等诸多肺部疾病中崭露头角并得到临床认可。深度学习模型是人工神经网络的一次全面演进,它可以从图像中自主学习特征提取,取代了人为手工设计,提高了医疗图像诊断准确率。但是深度学习模型需要足够大量的标签数据集进行训练,可以更好地提取图片特征达到符合实际应用的识别诊断率。然而医疗图像数据一般是有限的小样本标签数据集,从零训练卷积神经网络模型很容易出现过拟合等问题,过度学习识别出训练集不相关特征导致在验证集识别准确率降低,难以泛化到实际应用场景。迁移学习不但有效避免了过拟合等问题,而且因为顶层识别特征与医疗图像目标领域相关性更强,能有效提高识别准确率,取得了良好的效果。近年来,迁移学习受到了越来越多专家、学者的关注。它突破了传统机器学习算法要求训练数据和测试数据服从相同分布的限制,能够利用数据分布不同的辅助训练集帮助目标域中的学习任务,并且能够有效解决跨领域学习的问题。
迁移学习,就是将源领域中学到的模型应用到目标领域。如何利用现有的模型在一个新的领域发挥作用,这就是迁移学习要解决的问题。它放宽了传统机器学习中的两个基本假设,目的是迁移已有的知识来解决目标领域中仅有少量有标签样本数据甚至没有的学习问题。通过迁移学习,将已经预训练好的深度学习模型应用在医学领域中,底层同样可以获取图片的边缘,纹理等基本特征而顶层通过训练医学领域的数据也可以获得更好的特征。这样既解决了医学数据量小容易过拟合的问题,提高了训练速度以及准确率,也为解决同类问题提供便捷方法,拓宽了模型的应用范围,提高了有效利用率。在CNN的训练过程中引入迁移学习的方法,可将神经网络从源领域学习到的知识迁移至目标领域。通常,源领域的知识是从一个较大的通用数据集学习到的,而目标领域的知识则基于一个相对较小并聚焦于具体识别任务的数据集。通过引入利用大量肺部CT训练得到的预训练网络作为基础,迁移后的网络继承了原网络的结构和大部分参数,只需要对原网络的最后几层进行调整,迁移后的网络就能获得对特定领域数据的识别能力。这样的方法也被称为微调(fine-tuning),微调不但可减小网络训练阶段的计算复杂度,也可减少训练网络所需的数据量。
发明内容
为了克服现有技术的上述缺点,本发明提出了一种基于深度学习和迁移学习结合的新冠肺炎图像识别方法,以较少的新型冠状病毒肺炎患者的HRCT图像为训练集,基于VGG19网络,对模型参数进行微调,达到优化网络,提高识别准确率的目的。
本发明解决其技术问题所采用的技术方案是:一种基于深度学习和迁移学习结合的新冠肺炎图像识别方法,包括如下内容:
步骤一、模型训练:
利用深度卷积神经网络CNN作为图像特征提取器,对COVID-CT开源数据集进行预训练,提取图像卷积特征;
步骤二、将深度卷积神经网络CNN训练部分层的参数迁移至VGG19网络,通过对模型参数进行微调和重新训练。
与现有技术相比,本发明的积极效果是:
本发明针对利用传统训练方法进行医学图像识别时缺乏数据的问题,提出了一种利用迁移学习训练卷积神经网络(CNN)实现新型冠状病毒肺炎CT图像识别的方法,通过对已有的预训练网络利用迁移学习进行微调与重新训练,以减小对训练数据量的需求和依赖;本发明基于VGG19网络,利用迁移学习方法进行训练,最终在未进行数据扩充的情况下在较短的时间内达到84%以上的召回率。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1为2019-nCoV阴性的CT图像;
图2为2019-nCoV阳性的CT图像;
图3为训练准确性和验证准确性示意图。
具体实施方式
一种基于深度学习和迁移学习结合的新冠肺炎图像识别方法,包括如下内容:
一、模型训练
由于利用少量样本训练大数量的参数容易造成过拟合现象,因此本发明利用深度卷积神经网络(CNN)作为图像特征提取器,在美国高校研究者构建的COVID-CT开源数据集进行预训练,提取图像卷积特征。
首先把收集到的肺部CT图像(本实施例中为195个阴性、275个阳性)分为训练集、测试集与验证集,数据分布描述如表1所示:
表1数据分割统计
Figure BDA0002681076040000041
通过这些图像的标题将CT图像分为新冠肺炎阴性、阳性两类,其中,2019-nCoV阴性的CT图像如图1所示;而2019-nCoV阳性的肺部CT表现多为双肺多发磨玻璃密度影(GGO),以双肺胸膜下分布为主,可伴空气支气管征、小叶间隔增厚和胸膜增厚,极少数或少数伴胸腔积液或淋巴结肿大,其中某一位患者的CT图像如图2所示。
对输入的CT图像,使用3x3的卷积和2x2的滤波器,提取图像卷积特征,根据特征结合图像标题训练神经网络。
二、VGG19网络
由于获得的新型冠状病毒肺炎患者的HRCT数量比较少,本发明以275个肺部CT图像呈阳性的患者的HRCT图像为训练集,将CNN神经网络训练部分层的参数迁移至VGG19网络,对模型参数进行微调,达到优化网络,提高准确率的目的。VGG19网络包含了19个隐藏层(16个卷积层和3个全连接层),其中:
Stage1:包含两个卷积层,一个池化层;
Stage2:包含两个卷积层,一个池化层;
Stage3:包含四个卷积层,一个池化层;
Stage4:包含四个卷积层,一个池化层;
Stage5:包含四个卷积层,一个池化层;
整个网络包含5个池化层,分别位于每一个Stage的后面。
具体的处理过程如下表所示:
Figure BDA0002681076040000051
Figure BDA0002681076040000061
对基本的VGG19网络修改最后的Softmax分类器,由原来的1000分类改为2分类,只考虑新冠肺炎是阴性还是阳性,不考虑其他肺部疾病。在此网络基础上,读入新的肺部CT图像判断该病人是否为新冠肺炎患者。
三、实验结果分析
本发明基于VGG19网络,利用迁移学习方法在未进行数据扩充的情况下训练,得到的测试集上的结果如表2所示:
表2模型在测试集上的结果(%)
Figure BDA0002681076040000071
最后得到训练准确性和验证准确性的图像,如图3所示。
对患者肺部CT图像进行快速地分类识别在预防传染、积极治疗方面起着非常重要的作用。临床医学表明,核酸检测结果为阴性,但是肺部CT图像显示为阳性。即核酸检测结果未必代表真实情况,CT图像具有无创、快速、能更准确地明确患者的肺部情况并且能随访评估治疗效果等优势,使得在COVID-19疫情期间临床医师能尽早对临床疑似病例进行隔离,阻止疫情的进一步扩散。
本发明基于VGG19预训练网络,利用迁移学习方法进行训练,最终在未进行数据扩充的情况下在较短的时间内达到84%以上的召回率。如果进一步对训练数据进行扩充,可以快速提高准确率,获得更精确的图像分类效果。

Claims (6)

1.一种基于深度学习和迁移学习结合的新冠肺炎图像识别方法,其特征在于:包括如下内容:
步骤一、模型训练:
利用深度卷积神经网络CNN作为图像特征提取器,对COVID-CT开源数据集进行预训练,提取图像卷积特征;
步骤二、将深度卷积神经网络CNN训练部分层的参数迁移至VGG19网络,通过对模型参数进行微调和重新训练。
2.根据权利要求1所述的基于深度学习和迁移学习结合的新冠肺炎图像识别方法,其特征在于:步骤一所述对COVID-CT开源数据集进行预训练时,将收集到的肺部CT图像分为训练集、测试集与验证集。
3.根据权利要求1所述的基于深度学习和迁移学习结合的新冠肺炎图像识别方法,其特征在于:步骤一所述模型训练时,对输入的CT图像,使用3x3的卷积和2x2的滤波器提取图像卷积特征,然后根据图像卷积特征结合CT图像的标题训练神经网络。
4.根据权利要求1所述的基于深度学习和迁移学习结合的新冠肺炎图像识别方法,其特征在于:所述VGG19网络包含19个隐藏层,分为16个卷积层和3个全连接层。
5.根据权利要求4所述的基于深度学习和迁移学习结合的新冠肺炎图像识别方法,其特征在于:所述VGG19网络的Stage1包含两个卷积层,一个池化层;Stage2包含两个卷积层,一个池化层;Stage3包含四个卷积层,一个池化层;Stage4包含四个卷积层,一个池化层;Stage5包含四个卷积层,一个池化层;整个网络包含5个池化层,分别位于每一个Stage的后面。
6.根据权利要求5所述的基于深度学习和迁移学习结合的新冠肺炎图像识别方法,其特征在于:步骤二所述对模型参数进行微调的方法为:首先对基本的VGG19网络修改最后的Softmax分类器,由原来的1000分类改为2分类。
CN202010962531.4A 2020-09-14 2020-09-14 基于深度学习和迁移学习结合的新冠肺炎图像识别方法 Pending CN112070755A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010962531.4A CN112070755A (zh) 2020-09-14 2020-09-14 基于深度学习和迁移学习结合的新冠肺炎图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010962531.4A CN112070755A (zh) 2020-09-14 2020-09-14 基于深度学习和迁移学习结合的新冠肺炎图像识别方法

Publications (1)

Publication Number Publication Date
CN112070755A true CN112070755A (zh) 2020-12-11

Family

ID=73695657

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010962531.4A Pending CN112070755A (zh) 2020-09-14 2020-09-14 基于深度学习和迁移学习结合的新冠肺炎图像识别方法

Country Status (1)

Country Link
CN (1) CN112070755A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112786189A (zh) * 2021-01-05 2021-05-11 重庆邮电大学 一种基于深度学习的新冠肺炎智能诊断系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109727227A (zh) * 2018-11-23 2019-05-07 哈尔滨工业大学(威海) 一种基于spect影像的甲状腺疾病诊断方法
CN110084803A (zh) * 2019-04-29 2019-08-02 南京星程智能科技有限公司 基于人类视觉系统的眼底图像质量评估方法
WO2019237191A1 (en) * 2018-06-11 2019-12-19 Socovar, Société En Commandite System and method for determining coronal artery tissue type based on an oct image and using trained engines
SG11202000693YA (en) * 2018-05-14 2020-02-27 Ping An Technology Shenzhen Co Ltd Method and device for generating medical report

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG11202000693YA (en) * 2018-05-14 2020-02-27 Ping An Technology Shenzhen Co Ltd Method and device for generating medical report
WO2019237191A1 (en) * 2018-06-11 2019-12-19 Socovar, Société En Commandite System and method for determining coronal artery tissue type based on an oct image and using trained engines
CN109727227A (zh) * 2018-11-23 2019-05-07 哈尔滨工业大学(威海) 一种基于spect影像的甲状腺疾病诊断方法
CN110084803A (zh) * 2019-04-29 2019-08-02 南京星程智能科技有限公司 基于人类视觉系统的眼底图像质量评估方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
I.U.KHAN, N.ASLAM: "A Deep-Learning-Based Framework for Automated Diagnosis of COVID-19 Using X-ray Images" *
高冬冬: "基于卷积神经网络的肺炎识别与研究" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112786189A (zh) * 2021-01-05 2021-05-11 重庆邮电大学 一种基于深度学习的新冠肺炎智能诊断系统
CN112786189B (zh) * 2021-01-05 2022-07-01 重庆邮电大学 一种基于深度学习的新冠肺炎智能诊断系统

Similar Documents

Publication Publication Date Title
Gu et al. Classification of bacterial and viral childhood pneumonia using deep learning in chest radiography
CN109635835A (zh) 一种基于深度学习与迁移学习的乳腺病变区域检测方法
CN106033540B (zh) 一种阴道微生态形态学自动分析方法和系统
CN109325942A (zh) 基于全卷积神经网络的眼底图像结构分割方法
CN110570432A (zh) 一种基于深度学习的ct图像肝脏肿瘤分割方法
CN110731773B (zh) 一种基于心电波形图全局与局部深度特征融合的异常心电图筛查方法
CN114359629B (zh) 一种基于深度迁移学习的肺炎x胸片分类识别方法
Uparkar et al. Vision transformer outperforms deep convolutional neural network-based model in classifying X-ray images
Alruwaili et al. COVID‐19 Diagnosis Using an Enhanced Inception‐ResNetV2 Deep Learning Model in CXR Images
CN111462082A (zh) 一种病灶图片识别装置、方法、设备及可读存储介质
Yong et al. Automatic ventricular nuclear magnetic resonance image processing with deep learning
CN112070755A (zh) 基于深度学习和迁移学习结合的新冠肺炎图像识别方法
CN110428405A (zh) 一种检测生物组织图像中肿块的方法、相应设备及介质
Tang et al. Artificial intelligence and myocardial contrast enhancement pattern
Li et al. A recognition method of urine cast based on deep learning
CN113192041A (zh) 一种基于深度学习卷积神经网络的肺部炎症识别诊断方法
Wang et al. X-ray images detection of COVID-19 based on deepwise separable DenseNet
CN114120035A (zh) 一种医学影像识别训练方法
CN112633336A (zh) 一种基于多尺度特征融合的肺结节识别分类方法
Xu et al. Urine sediment detection based on deep learning
Anand et al. Transformer-based Multiclass Classification of Cervicogram Images for Improved Cervical Cancer Detection
Iyer et al. Deep learning model for disease prediction using gastrointestinal-endoscopic images
Wang et al. A MobileNet Based Model for Tongue Shape Classification
Zhang et al. Cervical precancerous lesion detection based on deep learning of colposcopy images
Yuan et al. Chest X-ray disease diagnosis method based on YOLO model and pseudo color conversion

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201211

RJ01 Rejection of invention patent application after publication