CN111553890B

CN111553890B - 基于增量学习的x光正位胸片多任务检测方法

Info

Publication number: CN111553890B
Application number: CN202010321455.9A
Authority: CN
Inventors: 石华铮; 刘春利; 高欣
Original assignee: Shanghai Panoramic Cloud Medical Imaging Diagnosis Co ltd
Current assignee: Shanghai Panoramic Cloud Medical Imaging Diagnosis Co ltd
Priority date: 2020-04-22
Filing date: 2020-04-22
Publication date: 2021-01-08
Anticipated expiration: 2040-04-22
Also published as: CN111553890A

Abstract

本发明涉及一种基于增量学习的X光正位胸片多任务检测方法，首先将医学数据集分成基础组和增量组，然后采用改进的ResNet‑50网络模型对基础组进行深度表征学习，再对增量组进行小样本训练学习，最后将基础组与增量组合并调优，完成整个算法模型的训练；所述改进的ResNet‑50网络模型为ImageNet预训练的ResNet‑50网络模型。本发明的基于增量学习的X光正位胸片多任务检测方法，利用多语义任务和多标签的增量学习方法达到胸片多任务检测，用已有知识去学习识别新的疾病种类，以避免遇到新疾病时完全重新训练预测模型，同时达到提升识别新病变的诊断性能表现的目的，对医疗成像设备的发展和应用提供可行性支持。

Description

基于增量学习的X光正位胸片多任务检测方法

技术领域

本发明属于机器学习、模式识别和医学影像处理技术领域，涉及一种基于增量学习的X光正位胸片多任务检测方法。

背景技术

从20世纪70年代到90年代医学影像扫描可以载入电脑起，研究人员就已经开始了医学图像自动处理与分析系统的建立，研究基于规则的专家系统来解决特定的医学图像分析任务。到20世纪90年代末，监督学习技术的流行使得计算机辅助诊断系统开始了从人类设计规则的专家系统到计算机提取特征进行训练的转变，使用训练数据来开发系统的监督学习技术在医学图像的分析诊断也越来越流行。海量影像数据持续增长、智能诊断模型算法不断迭代更新、计算能力大幅提升以及国家政策大力支持为人工智能医学影像领域迎来了前所未有的新机遇。

临床实践中多病变辅助诊断场景更具有普遍性与重要性。虽然在目前的一些研究工作中，在胸部常见的肺不张等14种病变的诊断获得了较好的表现，但胸部病变种类繁多，远不止这14类病变，因此只训练识别14种病变的深度学习模型，对于基于人工智能的X线胸片诊断，是远远不够的。需要用己有知识去学习识别新的疾病种类，以避免遇到新疾病时完全重新训练预测模型，同时达到提升识别新病变的诊断性能表现的目的。

发明内容

本发明的目的是解决现有技术中存在的上述问题，提供一种基于增量学习的X光正位胸片多任务检测方法。针对X光胸片中人工智能自动化辅助疾病诊断问题，本发明提出基于增量学习的X光正位胸片多任务检测方法，利用多语义任务和多标签的增量学习方法达到胸片多任务检测，用已有知识去学习识别新的疾病种类，以避免遇到新疾病时完全重新训练预测模型，同时达到提升识别新病变的诊断性能表现的目的。本文研究内容具有学术意义，对医疗成像设备的发展和应用提供可行性支持。

为达到上述目的，本发明采用的技术方案如下：

基于增量学习的X光正位胸片多任务检测方法，其特征是：首先将医学数据集分成基础组和增量组，然后采用改进的ResNet-50网络模型对基础组进行深度表征学习，再对增量组进行小样本训练学习，最后将基础组与增量组合并调优，完成整个算法模型的训练，实现了医学图像的多任务检测；

所述医学数据集为ChestX-rayl4数据集，该数据集是从美国国家卫生临床中心的PACS系统中采集、整理、标注并公布了一个大规模的胸部X线数据集，包含112120张X线正位图像；所述改进的ResNet-50网络模型为ImageNet预训练的ResNet-50网络模型。

作为优选的技术方案：

如上所述的基于增量学习的X光正位胸片多任务检测方法，所述将医学数据集分成基础组和增量组，是按照数据标签进行分组的，具体为：采用数据集切分的多标签增量学习方法，将医学数据集切分成基础组和增量组；

基础组为包含8类标签的数据集，增量组为包含6类标签的数据集。

如上所述的基于增量学习的X光正位胸片多任务检测方法，所述采用改进的ResNet-50网络模型对基础组进行深度表征学习，具体为：采用改进的ResNet-50网络模型，去掉最后的1000个输出神经元的全连接层作为基础组的初始化特征提取器

构造一个多标签分类器W，W由一个包含C个输出神经元的全连接子网络构成，其中C是基础组标签病变种类的数量(C＝8)，在大数据集ChestX-rayl4上，联合训练优化

和W识别基础组中的8种病变，可以提高模型的多任务处理能力。

如上所述的基于增量学习的X光正位胸片多任务检测方法，所述对增量组进行小样本训练学习，具体为：基于深度学习技术搭建网络结构作为特征提取器，利用该特征提取器和构建的增量组的多标签分类器(增量组的多标签分类器的构建方法同上述基础组的多标签分类器)在MyX-ray14新数据集上进行小样本学习，使用在深度表征学习阶段训练好的

来提取数据集MyX-ray14的x′的卷积特征

构建一个新的多标签分类器W′，W′为一个由N个输出神经元全连接层构成的子网络，其中N是增量组标签新病变种类的数量(N＝6)，然后联合训练优化识别增量组中的6种新病变。

如上所述的基于增量学习的X光正位胸片多任务检测方法，所述将基础组与所述增量组合并调优，具体为：合并拥有8个神经元和6个神经元的两个全连接层形成一个具有14神经元输出的全连接层，构成14个标签的分类器，具备学习诊断14种胸部病变的深度模型；通过合并W的全连接权重的方式，将两个多标签分类器融合为一个多标签分类器W"；最后再结合特征提取器

与W〃构成一个可以识别C+N种病变的能力的增量模型，完成整个网络的训练。

有益效果：

针对X光胸片中人工智能自动化辅助疾病诊断问题，本发明的基于增量学习的X光正位胸片多任务检测方法，利用多语义任务和多标签的增量学习方法达到胸片多任务检测，用已有知识去学习识别新的疾病种类，以避免遇到新疾病时完全重新训练预测模型，同时达到提升识别新病变的诊断性能表现的目的；

本发明的基于增量学习的X光正位胸片多任务检测方法，对医疗成像设备的发展和应用提供可行性支持。

附图说明

图1为本发明采用的网络拓扑结构图；

图2为本发明采用的ResNet-50模型架构图；

图3为本发明采用ChestX-rayl4数据集病种分类示意图；

图4为几种X线胸片的示意图。

具体实施方式

下面结合具体实施方式，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

如图1所示，基于增量学习的X光正位胸片多任务检测方法，步骤如下：

(1)数据集拆分：采用数据集切分的多标签增量学习方法，按照数据标签将医学数据集切分成基础组和增量组，其中，基础组为包含8类标签的数据集，增量组为包含6类标签的数据集；所述医学数据集为ChestX-rayl4数据集；本发明使用的图像数据均来自于ChestX-rayl4数据集，该数据集是从美国国家卫生临床中心的PACS系统中采集、整理、标注并公布了一个大规模的胸部X线数据集，包含112120张X线正位图像。如图3所示，该数据集包含肺不张、心脏肿大、积液、浸润、肿块、结节、肺炎气胸、实变、水肿、肺气肿、纤维化、胸膜增厚和肺疵14种胸部病变；每张胸片都给出了相应的病变标签，一张胸片上常常多种病变并存，如图4和表1所示；

(2)采用改进的ResNet-50网络模型(ImageNet预训练的ResNet-50网络模型，参考文献《Deep Residual Learning for Image Recognition》，如图2所示)对基础组进行深度表征学习：采用改进的ResNet-50网络模型，去掉最后的1000个输出神经元的全连接层作为基础组的初始化特征提取器

构造一个由包含C个输出神经元的全连接子网络构成多标签分类器W，其中C是基础组标签病变种类的数量(C＝8)，在大数据集ChestX-rayl4上，联合训练优化

和W识别基础组中的8种病变；

(3)对增量组进行小样本训练学习：基于深度学习技术搭建网络结构，作为特征提取器，利用该特征提取器和构建的增量组的多标签分类器在MyX-ray14新数据集上进行小样本学习，使用在深度表征学习阶段训练好的

来提取数据集MyX-ray14的x′的卷积特征

构建一个由N个输出神经元全连接层构成的子网络，作为一个新的多标签分类器W′，其中N是增量组标签新病变种类的数量(N＝6)，然后联合训练优化识别增量组中的6种新病变；

(4)将基础组与增量组合并调优，完成整个算法模型的训练：合并拥有8个神经元和6个神经元的两个全连接层形成一个具有14神经元输出的全连接层，构成14个标签的分类器，具备学习诊断14种胸部病变的深度模型；通过合并W的全连接权重的方式，将两个多标签分类器融合为一个多标签分类器W"；最后再结合特征提取器

表1图4中四种X线胸片所对应的病变种类

Claims

1.基于增量学习的X光正位胸片多任务检测方法，其特征是：首先将医学数据集分成基础组和增量组，然后采用改进的ResNet-50网络模型对基础组进行深度表征学习，再对增量组进行小样本训练学习，最后将基础组与增量组合并调优，完成整个算法模型的训练；

所述医学数据集为ChestX-rayl4数据集，所述改进的ResNet-50网络模型为ImageNet预训练的ResNet-50网络模型；

所述将医学数据集分成基础组和增量组，是按照数据标签进行分组的，具体为：采用数据集切分的多标签增量学习方法，将医学数据集切分成基础组和增量组；基础组为包含肺不张、浸润、积液、肿块、结节、气胸、实变、胸膜增厚8类标签的数据集，增量组为包含心影增大、肺炎、肺水肿、肺气肿、纤维变性、肺疝6类标签的数据集；

所述采用改进的ResNet-50网络模型对基础组进行深度表征学习，具体为：采用改进的ResNet-50网络模型，去掉最后的1000个输出神经元的全连接层作为基础组的初始化特征提取器

，构造一个多标签分类器W，W由一个包含C个输出神经元的全连接子网络构成，其中C是基础组标签病变种类的数量；

所述对增量组进行小样本训练学习，具体为：基于深度学习技术搭建网络结构，作为特征提取器，利用该特征提取器和构建的增量组的多标签分类器在MyX-ray14新数据集上进行小样本学习，使用在深度表征学习阶段训练好的

来提取数据集MyX-ray14的

的卷积特征

，构建一个新的多标签分类器

，

为一个由N个输出神经元全连接层构成的子网络，其中N是增量组标签新病变种类的数量；

所述将基础组与所述增量组合并调优，具体为：合并拥有8个神经元和6个神经元的两个全连接层形成一个具有14神经元输出的全连接层，构成14个标签的分类器，具备学习诊断14种胸部病变的深度模型；通过合并W的全连接权重的方式，将两个多标签分类器融合为一个多标签分类器W"；最后再结合特征提取器

与W^〃构成一个可以识别C+N种病变的能力的增量模型，完成整个网络的训练。