CN112070755A

CN112070755A - 基于深度学习和迁移学习结合的新冠肺炎图像识别方法

Info

Publication number: CN112070755A
Application number: CN202010962531.4A
Authority: CN
Inventors: 李甫; 陈泓杏; 吴开腾; 孔花; 张莉
Original assignee: Neijiang Normal University
Current assignee: Neijiang Normal University
Priority date: 2020-09-14
Filing date: 2020-09-14
Publication date: 2020-12-11

Abstract

本发明公开了一种基于深度学习和迁移学习结合的新冠肺炎图像识别方法，包括如下内容：步骤一、模型训练：利用深度卷积神经网络CNN作为图像特征提取器，对COVID‑CT开源数据集进行预训练，提取图像卷积特征；步骤二、将深度卷积神经网络CNN训练部分层的参数迁移至VGG19网络，通过对模型参数进行微调和重新训练。与现有技术相比，本发明的积极效果是：本发明通过对已有的预训练网络利用迁移学习进行微调与重新训练，以减小对训练数据量的需求和依赖；本发明基于VGG19网络，利用迁移学习方法进行训练，最终在未进行数据扩充的情况下在较短的时间内达到84％以上的召回率。

Description

基于深度学习和迁移学习结合的新冠肺炎图像识别方法

技术领域

本发明公开了一种基于深度学习和迁移学习结合的新冠肺炎图像识别方法。

背景技术

新型冠状病毒肺炎是因感染2019新型冠状病毒(2019-nCoV)引起的以肺部炎性病变为主的急性呼吸道感染性疾病，其传染性强，潜伏期长。目前确诊新型冠状病毒肺炎的标准是核酸检测阳性，而部分患者核酸检测结果呈假阴性，且需排查患者数量较大。对于无症状患者及大量待筛查者，影像学检查尤为重要。HRCT是2019-nCoV肺炎临床诊断的主要方法，具有方便、快捷的特点，在患者隔离、疗效评价与预防方面具有重要意义，而患者肺内病灶多，变化快，短时间内多次复查，图像多，显著增加了诊断医师的负荷。基于AI技术的辅助诊疗系统，可全自动、快速、准确地为医生提供诊疗意见，大幅减轻医疗负担，缓解隔离防控和医务人员紧缺的困难局面。

近年来人工智能(artificial intelligence，AI)技术(尤其是深度学习技术)以其强大的数据分析和特征识别能力，已在胸片质控、肺结节检出、肺癌诊断等诸多肺部疾病中崭露头角并得到临床认可。深度学习模型是人工神经网络的一次全面演进，它可以从图像中自主学习特征提取，取代了人为手工设计，提高了医疗图像诊断准确率。但是深度学习模型需要足够大量的标签数据集进行训练，可以更好地提取图片特征达到符合实际应用的识别诊断率。然而医疗图像数据一般是有限的小样本标签数据集，从零训练卷积神经网络模型很容易出现过拟合等问题，过度学习识别出训练集不相关特征导致在验证集识别准确率降低，难以泛化到实际应用场景。迁移学习不但有效避免了过拟合等问题，而且因为顶层识别特征与医疗图像目标领域相关性更强，能有效提高识别准确率，取得了良好的效果。近年来，迁移学习受到了越来越多专家、学者的关注。它突破了传统机器学习算法要求训练数据和测试数据服从相同分布的限制，能够利用数据分布不同的辅助训练集帮助目标域中的学习任务，并且能够有效解决跨领域学习的问题。

迁移学习，就是将源领域中学到的模型应用到目标领域。如何利用现有的模型在一个新的领域发挥作用，这就是迁移学习要解决的问题。它放宽了传统机器学习中的两个基本假设，目的是迁移已有的知识来解决目标领域中仅有少量有标签样本数据甚至没有的学习问题。通过迁移学习，将已经预训练好的深度学习模型应用在医学领域中，底层同样可以获取图片的边缘，纹理等基本特征而顶层通过训练医学领域的数据也可以获得更好的特征。这样既解决了医学数据量小容易过拟合的问题，提高了训练速度以及准确率，也为解决同类问题提供便捷方法，拓宽了模型的应用范围，提高了有效利用率。在CNN的训练过程中引入迁移学习的方法，可将神经网络从源领域学习到的知识迁移至目标领域。通常，源领域的知识是从一个较大的通用数据集学习到的，而目标领域的知识则基于一个相对较小并聚焦于具体识别任务的数据集。通过引入利用大量肺部CT训练得到的预训练网络作为基础，迁移后的网络继承了原网络的结构和大部分参数，只需要对原网络的最后几层进行调整，迁移后的网络就能获得对特定领域数据的识别能力。这样的方法也被称为微调(fine-tuning)，微调不但可减小网络训练阶段的计算复杂度，也可减少训练网络所需的数据量。

发明内容

为了克服现有技术的上述缺点，本发明提出了一种基于深度学习和迁移学习结合的新冠肺炎图像识别方法，以较少的新型冠状病毒肺炎患者的HRCT图像为训练集，基于VGG19网络，对模型参数进行微调，达到优化网络，提高识别准确率的目的。

本发明解决其技术问题所采用的技术方案是：一种基于深度学习和迁移学习结合的新冠肺炎图像识别方法，包括如下内容：

步骤一、模型训练：

利用深度卷积神经网络CNN作为图像特征提取器，对COVID-CT开源数据集进行预训练，提取图像卷积特征；

步骤二、将深度卷积神经网络CNN训练部分层的参数迁移至VGG19网络，通过对模型参数进行微调和重新训练。

与现有技术相比，本发明的积极效果是：

本发明针对利用传统训练方法进行医学图像识别时缺乏数据的问题，提出了一种利用迁移学习训练卷积神经网络(CNN)实现新型冠状病毒肺炎CT图像识别的方法，通过对已有的预训练网络利用迁移学习进行微调与重新训练，以减小对训练数据量的需求和依赖；本发明基于VGG19网络，利用迁移学习方法进行训练，最终在未进行数据扩充的情况下在较短的时间内达到84％以上的召回率。

附图说明

本发明将通过例子并参照附图的方式说明，其中：

图1为2019-nCoV阴性的CT图像；

图2为2019-nCoV阳性的CT图像；

图3为训练准确性和验证准确性示意图。

具体实施方式

一种基于深度学习和迁移学习结合的新冠肺炎图像识别方法，包括如下内容：

一、模型训练

由于利用少量样本训练大数量的参数容易造成过拟合现象，因此本发明利用深度卷积神经网络(CNN)作为图像特征提取器，在美国高校研究者构建的COVID-CT开源数据集进行预训练，提取图像卷积特征。

首先把收集到的肺部CT图像(本实施例中为195个阴性、275个阳性)分为训练集、测试集与验证集，数据分布描述如表1所示：

表1数据分割统计

通过这些图像的标题将CT图像分为新冠肺炎阴性、阳性两类，其中，2019-nCoV阴性的CT图像如图1所示；而2019-nCoV阳性的肺部CT表现多为双肺多发磨玻璃密度影(GGO)，以双肺胸膜下分布为主，可伴空气支气管征、小叶间隔增厚和胸膜增厚，极少数或少数伴胸腔积液或淋巴结肿大，其中某一位患者的CT图像如图2所示。

对输入的CT图像，使用3x3的卷积和2x2的滤波器，提取图像卷积特征，根据特征结合图像标题训练神经网络。

二、VGG19网络

由于获得的新型冠状病毒肺炎患者的HRCT数量比较少，本发明以275个肺部CT图像呈阳性的患者的HRCT图像为训练集，将CNN神经网络训练部分层的参数迁移至VGG19网络，对模型参数进行微调，达到优化网络，提高准确率的目的。VGG19网络包含了19个隐藏层(16个卷积层和3个全连接层)，其中：

Stage1：包含两个卷积层，一个池化层；

Stage2：包含两个卷积层，一个池化层；

Stage3：包含四个卷积层，一个池化层；

Stage4：包含四个卷积层，一个池化层；

Stage5：包含四个卷积层，一个池化层；

整个网络包含5个池化层，分别位于每一个Stage的后面。

具体的处理过程如下表所示：

对基本的VGG19网络修改最后的Softmax分类器，由原来的1000分类改为2分类，只考虑新冠肺炎是阴性还是阳性，不考虑其他肺部疾病。在此网络基础上，读入新的肺部CT图像判断该病人是否为新冠肺炎患者。

三、实验结果分析

本发明基于VGG19网络，利用迁移学习方法在未进行数据扩充的情况下训练，得到的测试集上的结果如表2所示：

表2模型在测试集上的结果(％)

最后得到训练准确性和验证准确性的图像，如图3所示。

对患者肺部CT图像进行快速地分类识别在预防传染、积极治疗方面起着非常重要的作用。临床医学表明，核酸检测结果为阴性，但是肺部CT图像显示为阳性。即核酸检测结果未必代表真实情况，CT图像具有无创、快速、能更准确地明确患者的肺部情况并且能随访评估治疗效果等优势，使得在COVID-19疫情期间临床医师能尽早对临床疑似病例进行隔离，阻止疫情的进一步扩散。

本发明基于VGG19预训练网络，利用迁移学习方法进行训练，最终在未进行数据扩充的情况下在较短的时间内达到84％以上的召回率。如果进一步对训练数据进行扩充，可以快速提高准确率，获得更精确的图像分类效果。

Claims

1.一种基于深度学习和迁移学习结合的新冠肺炎图像识别方法，其特征在于：包括如下内容：

步骤一、模型训练：

2.根据权利要求1所述的基于深度学习和迁移学习结合的新冠肺炎图像识别方法，其特征在于：步骤一所述对COVID-CT开源数据集进行预训练时，将收集到的肺部CT图像分为训练集、测试集与验证集。

3.根据权利要求1所述的基于深度学习和迁移学习结合的新冠肺炎图像识别方法，其特征在于：步骤一所述模型训练时，对输入的CT图像，使用3x3的卷积和2x2的滤波器提取图像卷积特征，然后根据图像卷积特征结合CT图像的标题训练神经网络。

4.根据权利要求1所述的基于深度学习和迁移学习结合的新冠肺炎图像识别方法，其特征在于：所述VGG19网络包含19个隐藏层，分为16个卷积层和3个全连接层。

5.根据权利要求4所述的基于深度学习和迁移学习结合的新冠肺炎图像识别方法，其特征在于：所述VGG19网络的Stage1包含两个卷积层，一个池化层；Stage2包含两个卷积层，一个池化层；Stage3包含四个卷积层，一个池化层；Stage4包含四个卷积层，一个池化层；Stage5包含四个卷积层，一个池化层；整个网络包含5个池化层，分别位于每一个Stage的后面。

6.根据权利要求5所述的基于深度学习和迁移学习结合的新冠肺炎图像识别方法，其特征在于：步骤二所述对模型参数进行微调的方法为：首先对基本的VGG19网络修改最后的Softmax分类器，由原来的1000分类改为2分类。