CN113449791B

CN113449791B - 基于深度学习的肺炎图像分类方法及系统

Info

Publication number: CN113449791B
Application number: CN202110719421.XA
Authority: CN
Inventors: 成金勇; 孔令芝
Original assignee: Qilu University of Technology
Current assignee: Qilu University of Technology
Priority date: 2021-06-28
Filing date: 2021-06-28
Publication date: 2022-04-26
Anticipated expiration: 2041-06-28
Also published as: CN113449791A

Abstract

本发明公开了一种基于深度学习的肺炎图像分类方法及系统，属于医学影像分类处理领域，本发明要解决的技术问题为如何熟练运用计算机辅助诊断(CAD)技术，实现对x射线图像中患有肺炎的图像进行分类，采用的技术方案为：该方法是通过使用迁移学习作为初始化数据，对所选取的肺部x图像样本数据进行增强处理，提取样本特征之间的关联，再将提取到的样本特征映射到输出空间上进行肺部x图像的分类；具体如下：数据预处理；Lsception模型融合：通过Lsception模型对肺部x图像进行特征提取，通过提取的肺部特征完成对肺部x图像的预测分类；Lsception模型优化：通过优化器、损失函数、数据评估及超参数修改优化Lsception模型；评价预测结果。

Description

基于深度学习的肺炎图像分类方法及系统

技术领域

本发明涉及医学影像分类处理领域，具体地说是一种基于深度学习的肺炎图像分类方法及系统。

背景技术

肺炎是指肺内的细支气管、终来支气管、肺泡和肺间质的炎症，多是由于病原微生物感染、理化因素刺激、免疫功能损伤以及过敏及药物因素所引起。其中，细菌性和病毒性肺炎是最常见的肺炎，对儿童及老年人的健康威胁极大。近年来，尽管应用强力的抗生素和有效的疫苗，但是肺炎总的病死率有所上升。因此，肺炎仍是需要进行积极的治疗和预防的疾病。现如今造成5岁以下孩童最高的死亡原因之一就是肺炎，造成约140万人死亡，约占全世界5岁以下儿童的18％。在低收入国家的五大死亡原因位居榜首的就是肺炎。

肺部疾病检查手段很多，像胸透、胸片、胸部CT、磁共振成像(MRI)、肺功能、支气管镜等都是常用检查方法，是有助于诊断肺疾病的CAD方案的常见例子。尽管检测肺部疾病的方案手段有许多，但是医疗资源仍然匮乏。相比较而言，胸部X光图像(CXRAY)的精确率不能完全等同于胸部CT、MRI的诊断。但是，如今使用CXRAY仍然是最需要的放射学检查。

近两年来儿童时期患肺炎的概率增加，故如何熟练运用计算机辅助诊断 (CAD)技术，实现对x射线图像中患有肺炎的图像进行分类，帮助医生以及病人识别到医学图像中不同类型的异常，从而可以更佳准确及时的对疾病进行分析诊断是目前亟待解决的问题。

发明内容

本发明的技术任务是提供一种基于深度学习的肺炎图像分类方法及系统，来解决如何熟练运用计算机辅助诊断(CAD)技术，实现对x射线图像中患有肺炎的图像进行分类的问题。

本发明的技术任务是按以下方式实现的，一种基于深度学习的肺炎图像分类方法，该方法是通过使用迁移学习(Transfer learning)作为初始化数据，对所选取的肺部x图像样本数据进行增强处理，提取样本特征之间的关联，再将提取到的样本特征映射到输出空间上进行肺部x图像的分类；具体如下：

数据预处理：获取肺部x图像数据集，对肺部x图像数据集中的训练集进行数据预处理；

Lsception模型融合：通过Lsception模型对肺部x图像进行特征提取，通过提取的肺部特征完成对肺部x图像的预测分类；

Lsception模型优化：通过优化器、损失函数、数据评估及超参数修改优化Lsception模型；

评价预测结果：采用不同评价指标评价预测结果。

作为优选，数据预处理具体如下：

尺度变换：对肺部x图像进行尺度变换，尺度变换的缩放因子为1/255，通过尺度变换将肺部x图像的长度和宽度放大或缩小，进而改变肺部x图像的整体大小，并不是剪切图片；

旋转或反射变换：对肺部x图像进行随机旋转角度，即绕肺部x图像的中心旋转角度，旋转角度的范围内为±7度；

宽度移动：对肺部x图像在水平方向上移动±0.2％～±0.5％；

高度移动：对肺部x图像在垂直方向上移动±0.2％～±0.5％；

剪切：对肺部x图像剪切范围为±0.2％；

缩放：随机对肺部x图像进行0.45倍的放大或缩小；

水平翻转图像：将肺部x图像再次进行水平方向的翻转。

作为优选，所述Lsception模型的体系结构是由36个卷积层和一个长短记忆循环神经网络组成；将36个卷积层划分为14个模块，14个模块中除了第一个模块和最后一个模块外，其余模块都具有线性残差连接，完全是基于深度可分卷积层的卷积神经网络架构；36个卷积层总体划分为输入块、中间块和输出块；

其中，输入块用于不断下采样，减少空间维度；

中间块用于不断分析，过滤特征；

输出块用于下降参数个数。

更优地，Lsception模型融合具体如下：

预处理后的肺部x图像输入到输入块，得出四维特征数据；

输出块输出的四维特征数据输入到中间块，输出四维肺炎特征数据；

中间块输出的四维肺炎特征数据输入到输出块，获取K个肺炎特征；

将K个肺炎特征输入到长短记忆循环神经网络，经历三个阶段，分别是忘记阶段、选择记忆阶段及输出阶段，对肺炎图像的特征更加精确的识别。

更优地，预处理后的肺部x图像输入到输入块，具体如下：

(一)、传入尺寸为224*224的肺部x图像，经过两层卷积，从原始输入层中提取肺炎x图像中基础特征；具体为：通过对肺部x图像处理，将两肺纹理增粗、肺野内带可见斑片状阴影、密度不均匀、边缘模糊不清的基础特征提取出来；在输入块中，第一个数字表示过滤器大小，第二个数字表示卷积核大小 (3*3)，最后一个数字表示步幅的大小(2*2)；同时，伴随RELU激活函数，增强卷积层中提取出来特征的稀疏性，随之代表性，泛化能力也越强；

(二)、在经卷积处理时，分别学习feature channels间的关联关系与 feature单个channel内部空间上的关联关系，使用大量的1x1大小的卷积核来重视学习；随后链接两层深度可分离卷积(SepConv)，对卷积层中提取的特征图数量进行调整，最后通过池化层(Maxp)，运用2*2的步长降维提取重要特征；

(三)、通过增加过滤器数量，减少参数数量，得出四维特征数据；

输出块输出的四维特征数据输入到中间块，具体如下：

运用三层过滤层为728，卷积核个数为3*3的深度可分离卷积，每层深度可分离卷积后，都有RELU作为激活函数，重复8次的中间流，将肺炎胸片可见细支气管壁增厚、肺门周围的线性高密度、细支气管周围实变、常为双侧以及表现为斑片状肺膨胀不全、常合并支气管壁增厚和马赛克样肺灌注的进行深度特征整合，输出四维肺炎特征数据。

更优地，中间块输出的四维肺炎特征数据输入到输出块，具体如下：

(1)、将中间块下深度提取的四维特征再进行两次深度可分离卷积(过滤器个数分别为728、1024)伴随RELU激活函数，进一步下降参数个数；

(2)、将1x1 Conv输出的feature maps进行分割；

(3)、与两个高维深度可分卷积层(过滤器个数分别为1536、2048)结合，伴随RELU激活函数，获取K个肺炎特征；

将K个肺炎特征输入到长短记忆循环神经网络，经历三个阶段，分别是忘记阶段、选择记忆阶段及输出阶段，对肺炎图像的特征更加精确的识别，具体如下：

①、K个肺炎特征中输出的四维结构中，将第三维和第四维进行相乘，转换成LSTM可运行的三维结构进行读取；

②、将提取到的K个肺炎特征中一些重叠、不明确的特征的部分进行遗忘，选择去记忆现在重要信息，最终学会运用将过去记忆与现在记忆合并来提高医学诊断的真实性和有效性；

③、通过Lsception模型的肺炎图像特征提取完成后，通过四层dense全连接，前三层神经元个数通过逐层2倍递减的速度下降，同时伴随RELU激活函数，将以前的局部特征重新通过权值矩阵组装成完整的图；

④、最后一层通过选择sigmoid激活函数进行预测分类，并对其中超参数进行微调。

作为优选，所述优化器采用RMSprop(均方根)优化器，通过RMSprop优化器对参数进行自动调节，具体公式如下：

T_dv＝αT_dv+(1-α)(dv)²；

T_db＝αT_db+(1-α)(db)²；

其中，(dv)²及(db)²表示对向量的各个分量分别计算平方；T_dv与T_db展开也是一个向量，每个分量是权重dv、db对应分量值的平方的指数加权移动平均；α控制加权平均数；v表示着在横轴上的参数,其变化率很小,所以dv的值十分小,所以T_dv也小,而b在纵轴上波动很大,所以斜率在b方向上特别大，所以这些微分中,db较大,dv较小；为均衡T_dv和T_db之间变化幅度，从而更新参数值V、b，V的除数是一个较小的数,总体来说,V的变化很大，V的变化通过如下公式表示：

而b的除数是一个较大的数,b的更新就会被减缓，纵向的变化相对平缓， b的变化通过如下公式表示：

其中，γ表示超参数，用两个超参数γ是为了减缓参数下降时的摆动,并允许你使用一个更大的学习率，加快算法速率；

所述损失函数具体如下：

设数据通过Lsception模型预测后的输出概率为

真实标签值的概率为p＝[p₁,p₂,...,p_t],；其中，t表示数据总数量，以 binary_crossentropy为基础，损失函数公式如下：

其中，x²表示衡量实际值与预测值的差异程度；p表示当前真实标签值；

表示当前预测标签值；L表示损失函数；

融合皮尔逊提出的特征选择的方法，公式为：

进一步，得出损失函数公式为：

数据评估及超参数修改具体如下：

通过对数据集划分，发现患有肺炎患者的数量明显高于正常数量的患者，样本不平衡，通过计算训练集的不平衡比IR，公式如下：

其中，Max_class表示数据集中所占数量多的类别；Min_class代表数据集中所占少的类别；

根据IR的值是否大于1.5来判断训练集的平衡性；数据集的不平衡会引起分类性能的改变，为了更加合理均衡类别比，选择对权重值进行平衡，修改超参数类别权重，公式如下：

W_m＝i_sum/(i_class*i_sum_m)；

其中，W_m表示每个类的最终计算得出的权重值；i_sum表示该类数据集中所有样本量；i_class表示总样本中类别数目；i_sum_m表示在m类别所对应样本数目。

作为优选，评价预测结果具体如下：

评价指标准确率(Accuracy)的目的为检测正确分类的正例个数占总样本数之比，公式如下：

其中，TP表示标签和预测都为正常人的数量；FN表示标签为正常人，预测为患有肺炎的数量；FP表示标签为患有肺炎，预测为正常人的数量；TN表示标签和预测都为患有肺炎的数量；

精准率(Precision)反映为预测正例的样本数占正例的实例个数的比例，目的是为了衡量“查准率”，公式如下：

召回率(Recall)反映预测为正例的样本数占所有正样本个数的比例，目的是衡量“查全率”，公式如下：

为了能够评价不同算法优劣，在精准率(Precision)和召回率(Recall) 的基础上提出了F1值的概念，来对精准率(Precision)和召回率(Recall) 和Recall进行整体评价，公式如下：

其中，Precision表示精准率；Recall表示召回率。

一种基于深度学习的肺炎图像分类系统，该系统包括，

预处理模块，用于获取肺部x图像数据集，对肺部x图像数据集中的训练集进行数据预处理；

融合模块，用于通过Lsception模型对肺部x图像进行特征提取，通过提取的肺部特征完成对肺部x图像的预测分类；

优化模块，用于通过优化器、损失函数、数据评估及超参数修改优化 Lsception模型；

评价模块，用于采用不同评价指标评价预测结果。

一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，所述计算机程序可被处理器执行以实现如上述的基于深度学习的肺炎图像分类方法。

本发明的基于深度学习的肺炎图像分类方法及系统具有以下优点：

(一)本发明可以实现对肺部x射线图像中患有肺炎的患者自动分类，采用Lsception网络对数据的特征进行多次深度提取，最终选取最需要特征；在训练集样本中，传统的交叉熵损失，无法更加均衡类别间的不匹配，本发明结合了皮尔森的特征选择思想，融合两者损失函数之间相关性，优化该问题；

(二)本发明通过使用迁移学习(Transfer learning)作为初始化数据，对所选取的样本数据进行增强，可以更好提取这些特征之间的关联，最后将提取到的特征映射到输出空间上进行CXRAYs的处理与分类；

(三)迁移学习有关Xception模型结构，在原有基础上，本发明增加长短期记忆算法(LSTM)，两者融合即Lsception模型，再通过训练图像数据集对网络的batch_size、图像质量的增强等参数进行细化调整，以提高模型准确率和泛化能力。最终运用神经网络注意机制对Lsception产生的特征进行合并分析，并通过全连接层FC将特征归一化串联融合成融合特征；

(四)在运用binary_crossentropy时，可以比较误差，当其大的时候，加快权重更新速度；当小的时候，权重更新慢，但是传统的交叉熵也存在一定问题，虽然在特征可分上有显著优势，但是在向量内部之间有关类的相似性还相对匮乏；本发明可以通过卡方检验，比较两个及两个以上样本(构成比)以及两个分类变量的关联性分析，同时，可以计算出对于实际与预测频数的吻合程度或拟合优度问题；

(五)样本不平衡，导致样本不是总体样本的无偏估计，从而可能导致我模型预测能力下降，如果给少数类赋予非常高的类权重，算法很可能会偏向少数类，并且会增加多数类中的错误，本发明可以通过调节样本权重来尝试解决这个问题。

附图说明

下面结合附图对本发明进一步说明。

附图1为基于深度学习的肺炎图像分类方法的流程框图；

附图2为融合Lsception模型的示意图；

附图3为训练集中正常与患肺炎图像数量的柱形图；

附图4为沿损失变化的折线图；

附图5为准确率变化的折线图。

具体实施方式

参照说明书附图和具体实施例对本发明的基于深度学习的肺炎图像分类方法及系统作以下详细地说明。

在本发明的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接连接，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

实施例1：

如附图1所示，本发明的基于深度学习的肺炎图像分类方法，该方法是通过使用迁移学习(Transfer learning)作为初始化数据，对所选取的肺部x图像样本数据进行增强处理，提取样本特征之间的关联，再将提取到的样本特征映射到输出空间上进行肺部x图像的分类；具体如下：

S1、数据预处理：获取肺部x图像数据集，对肺部x图像数据集中的训练集进行数据预处理；

S2、Lsception模型融合：通过Lsception模型对肺部x图像进行特征提取，通过提取的肺部特征完成对肺部x图像的预测分类；

S3、Lsception模型优化：通过优化器、损失函数、数据评估及超参数修改优化Lsception模型；

S4、评价预测结果：采用不同评价指标评价预测结果。

本实施例中步骤S1的数据预处理具体如下：

S101、尺度变换：对肺部x图像进行尺度变换，尺度变换的缩放因子为1/255，通过尺度变换将肺部x图像的长度和宽度放大或缩小，进而改变肺部x图像的整体大小，并不是剪切图片；

S102、旋转或反射变换：对肺部x图像进行随机旋转角度，即绕肺部x图像的中心旋转角度，旋转角度的范围内为±7度；

S103、宽度移动：对肺部x图像在水平方向上移动±0.2％～±0.5％；

S104、高度移动：对肺部x图像在垂直方向上移动±0.2％～±0.5％；

S105、剪切：对肺部x图像剪切范围为±0.2％；

S106、缩放：随机对肺部x图像进行0.45倍的放大或缩小；

S107、水平翻转图像：将肺部x图像再次进行水平方向的翻转。

举例：

本实施例中主要用到的数据集是由Kermuny等人在2018年公开，该数据集共有5863张x射线图像(JPEG)和两个类别(正常图像/患有肺炎图像)，来源于广州市妇女儿童医疗中心1-5岁儿童患者。为了提高对于胸片准确性的分析与评估，通过对质量进行筛选，总共收集和标记5856张胸部x射线图像。综合考虑到，由于外部因素，例如：扫描位置、个人习惯以及患者有过其他疾病等影响，造成了图像拍摄的不清晰，会在研究过程中，使图像进行增强，提高可读取性，如下表：

在训练集中，针对图像进行缩放、增大变换。本实施例设置了缩放因子为 1/255，缩放的目的是把图像的长和宽放大或缩小，改变的图像的整体大小，并不是剪切图片。旋转范围代表着图像在训练期间随机旋转的角度(绕图像的中心旋转)，即7度。高度位移代表着图像在垂直方向上有0.2％程度的移动。宽度位移与高度位移同理，只是角度从垂直方向变成了水平方向0.2％幅度的变化。在以上增强图像过程中，会随机对尺寸进行0.45倍的放大或缩小，起到增强图像的作用,最后需要将图像再次进行水平方向的翻转。

针对胸部x射线图像诊断分类，虽然深度可分卷积可以带来准确率的部分提升，但是由于计算过程比较零散，现有的卷积神经网络实现它的效率都不高。为更好实现Lsception在医学图像的泛化能力，如附图2所示，本实施例中步骤S2的Lsception模型的体系结构是由36个卷积层和一个长短记忆循环神经网络组成；将36个卷积层划分为14个模块，14个模块中除了第一个模块和最后一个模块外，其余模块都具有线性残差连接，完全是基于深度可分卷积层的卷积神经网络架构；36个卷积层总体划分为输入块、中间块和输出块；其中，输入块用于不断下采样，减少空间维度；中间块用于不断分析，过滤特征；输出块用于下降参数个数。

本实施例中步骤S2上午Lsception模型融合具体如下：

S201、预处理后的肺部x图像输入到输入块，得出四维特征数据；

S202、输出块输出的四维特征数据输入到中间块，输出四维肺炎特征数据；

S203、中间块输出的四维肺炎特征数据输入到输出块，获取K个肺炎特征；

S204、将K个肺炎特征输入到长短记忆循环神经网络，经历三个阶段，分别是忘记阶段、选择记忆阶段及输出阶段，对肺炎图像的特征更加精确的识别。

本实施例中步骤S201的预处理后的肺部x图像输入到输入块，具体如下：

(三)、与步骤(二)一致，通过增加过滤器数量，减少参数数量，得出四维特征数据；

本实施例中步骤S202的输出块输出的四维特征数据输入到中间块，具体如下：

本实施例中步骤S203的中间块输出的四维肺炎特征数据输入到输出块，具体如下：

(2)、将1x1 Conv输出的feature maps进行分割；

对于不同时期肺炎特征提取的重点也不同，在提取K个特征后，信息彼此间有着复杂的关联性，若当时诊断为重症期患者，出现了双肺弥漫性病变、“白肺”；48小时病灶范围增加50％；此外，可见有肺纤维化，并且信息长度各种各样，这时，医生更应争分夺秒诊断。医疗与深度学习进一步融合，本实施例中步骤S204的将K个肺炎特征输入到长短记忆循环神经网络，经历三个阶段，分别是忘记阶段、选择记忆阶段及输出阶段，对肺炎图像的特征更加精确的识别，具体如下：

一般来说训练图像数据集对网络的batch_size越大，其确定的下降方向越准，引起训练震荡越小，但是在针对肺炎图像分类中，我们的主要目的是图像识别的精准，每次运行过程若输入过大，其消耗时间较长、内存容量较多对于参数的修正也相对缓慢。因此本实验在参数设置中选则将训练集的 batch_size设置为32，测试集设置为1，可以更好的提高模型准确率和泛化能力。

综合判断肺炎图像在Lsception模型的提取下，可以更加精确的对肺部阴影、密度及纹理等特征放大，实现诊断可靠性。

由于在相同数据集下，本实验选择RMSprop(均方根)优化器，目的是可以使数据更好的逼近或者达到最优值，加快梯度下降的算法,调整更新参数时的步伐大小,在横轴方向上变化幅度会比较小,但是相反在纵轴上变化幅度较大。横轴整体用参数V表示，纵轴用b表示。RMSprop对于梯度下降,在横轴方向运动,对于纵轴会有大幅度的波动。本实施例中步骤S3的优化器采用RMSprop (均方根)优化器，通过RMSprop优化器对参数进行自动调节，使得可有效缓解变量间的梯度差异，具体公式如下：

T_dv＝αT_dv+(1-α)(dv)²；

T_db＝αT_db+(1-α)(db)²；

本实施例中步骤S3的损失函数具体如下：

设数据通过Lsception模型预测后的输出概率为

表示当前预测标签值；L表示损失函数；

融合皮尔逊提出的特征选择的方法，公式为：

进一步，得出损失函数公式为：

本实施例中步骤S3的数据评估及超参数修改具体如下：

发明通过对数据集划分，发现患有肺炎患者的数量明显高于正常数量的患者，样本不平衡，导致样本不是总体样本的无偏估计，从而可能导致模型预测能力下降。如果给数据集中少数类(正常人)赋予非常高的类权重，算法很可能会偏向少数类，并且会增加多数类(患有肺炎的患者)中的错误。遇到这种情况，可以通过调节样本权重来尝试解决这个问题。为了可以对两者之间不平衡比重进行精确判断，如附图3所示，首先可在视觉化上明显看出训练集中的类别不均衡化，为进一步验证，通过计算训练集的不平衡比IR，公式如下：

根据IR的值是否大于1.5来判断训练集的平衡性；数据集的不平衡会引起分类性能的改变，为了更加合理均衡类别比，选择对权重值进行平衡，修改超参数类别权重，class_weights的值为“None”可以将None转变为“balanced”；公式如下：

W_m＝i_sum/(i_class*i_sum_m)；

通过上述公式分别计算了在“balanced”情况下训练集中正常人和肺炎患者的权重值，分别为W1＝1.94(N)，W2＝0.68(P)，当类权重＝“平衡”时，模型会自动分配与其各自频率成反比的类权重。有目的地增加少数阶级的权力，减少多数阶级的权力，由此类别间的不平衡性得到了优化。

本实施例中步骤S4的评价预测结果具体如下：

本发明实验采取不同评价指标来评价预测结果，采用准确率Accuracy、精准率Precision、召回率Recall和F1_score四种指标可以更加准确的评估，从而避免只通过一种评价指标存在的不公平性，具体如下：

①、评价指标准确率(Accuracy)的目的为检测正确分类的正例个数占总样本数之比，公式如下：

②、精准率(Precision)反映为预测正例的样本数占正例的实例个数的比例，目的是为了衡量“查准率”，公式如下：

③、召回率(Recall)反映预测为正例的样本数占所有正样本个数的比例，目的是衡量“查全率”，公式如下：

④、为了能够评价不同算法优劣，在精准率(Precision)和召回率(Recall) 的基础上提出了F1值的概念，来对精准率(Precision)和召回率(Recall) 和Recall进行整体评价，公式如下：

其中，Precision表示精准率；Recall表示召回率。

Accuracy与Loss又是成反比关系，Accuracy越大Loss值越小。如附图4 所示，Loss初始值训练损失大约在0.27，测试的损失约在0.13。数据在迭代5 次的过程中，下降速度急促，随后下降相对缓慢，但是整体呈现减少状态。对于Accuracy，前三次的迭代可以迅速高达90％的精度，后续整体呈现缓慢上升趋势，如附图5所示。

总体来讲，由附图4和5可知，精度随着时间的推移而增加，损失整体也在呈现下降，本发明的准确率为96％，AUC准确率为99％，精准率为95％，召回率为93％，F1分准确率为94％。与现有的技术方法相比，本发明在当前可用的数据集上取得了预期的结果，并协助医生在儿童肺炎分类任务中提供较高的可靠性。

实施例2：

本发明的基于深度学习的肺炎图像分类系统，该系统包括，

评价模块，用于采用不同评价指标评价预测结果。

实施例3：

本发明实施例还提供了一种计算机可读存储介质，其中存储有多条指令，指令由处理器加载，使处理器执行本发明任一实施例中的基于深度学习的肺炎图像分类方法。具体地，可以提供配有存储介质的系统或者装置，在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码，且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。

在这种情况下，从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能，因此程序代码和存储程序代码的存储介质构成了本发明的一部分。

用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如 CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RYM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地，可以由通信网络从服务器计算机上下载程序代码。

此外，应该清楚的是，不仅可以通过执行计算机所读出的程序代码，而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作，从而实现上述实施例中任意一项实施例的功能。

此外，可以理解的是，将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中，随后基于程序代码的指令使安装在扩展板或者扩展单元上的CPU等来执行部分和全部实际操作，从而实现上述实施例中任一实施例的功能。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种基于深度学习的肺炎图像分类方法，其特征在于，该方法是通过使用迁移学习作为初始化数据，对所选取的肺部x图像样本数据进行增强处理，提取样本特征之间的关联，再将提取到的样本特征映射到输出空间上进行肺部x图像的分类；具体如下：

Lsception模型融合：通过Lsception模型对肺部x图像进行特征提取，通过提取的肺部特征完成对肺部x图像的预测分类；具体如下：

预处理后的肺部x图像输入到输入块，得出四维特征数据；

将K个肺炎特征输入到长短记忆循环神经网络，经历三个阶段，分别是忘记阶段、选择记忆阶段及输出阶段，对肺炎图像的特征更加精确的识别；

Lsception模型的体系结构是由36个卷积层和一个长短记忆循环神经网络组成；将36个卷积层划分为14个模块，14个模块中除了第一个模块和最后一个模块外，其余模块都具有线性残差连接，完全是基于深度可分卷积层的卷积神经网络架构；36个卷积层总体划分为输入块、中间块和输出块；

其中，输入块用于不断下采样，减少空间维度；

中间块用于不断分析，过滤特征；

输出块用于下降参数个数；

其中，优化器采用RMSprop优化器，通过RMSprop优化器对参数进行自动调节，具体公式如下：

T_dv＝αT_dv+(1-α)(dv)²；

T_db＝αT_db+(1-α)(db)²；

其中，(dv)²及(db)²表示对向量的各个分量分别计算平方；T_dv与T_db展开也是一个向量，每个分量是权重dv、db对应分量值的平方的指数加权移动平均；α控制加权平均数；v表示着在横轴上的参数，为均衡T_dv和T_db之间变化幅度，从而更新参数值V、b，V的变化通过如下公式表示：

b的变化通过如下公式表示：

其中，γ表示超参数；

所述损失函数具体如下：

设数据通过Lsception模型预测后的输出概率为

真实标签值的概率为p＝[p₁,p₂,...,p_t],；其中，t表示数据总数量，以binary_crossentropy为基础，损失函数公式如下：

表示当前预测标签值；L表示损失函数；

融合皮尔逊提出的特征选择的方法，公式为：

进一步，得出损失函数公式为：

数据评估及超参数修改具体如下：

W_m＝i_sum/(i_class*i_sum_m)；

其中，W_m表示每个类的最终计算得出的权重值；i_sum表示该类数据集中所有样本量；i_class表示总样本中类别数目；i_sum_m表示在m类别所对应样本数目；

评价预测结果：采用不同评价指标评价预测结果；具体如下：

评价指标准确率的目的为检测正确分类的正例个数占总样本数之比，公式如下：

其中，Accuracy表示评价指标准确率；TP表示标签和预测都为正常人的数量；FN表示标签为正常人，预测为患有肺炎的数量；FP表示标签为患有肺炎，预测为正常人的数量；TN表示标签和预测都为患有肺炎的数量；

精准率反映为预测正例的样本数占正例的实例个数的比例，目的是为了衡量查准率，公式如下：

其中，Precision表示精准率；

召回率反映预测为正例的样本数占所有正样本个数的比例，目的是衡量查全率，公式如下：

其中，Recall表示召回率；

在精准率和召回率的基础上提出了F1值的概念，来对精准率和召回率进行整体评价，公式如下：

2.根据权利要求1所述的基于深度学习的肺炎图像分类方法，其特征在于，数据预处理具体如下：

尺度变换：对肺部x图像进行尺度变换，尺度变换的缩放因子为1/255，通过尺度变换将肺部x图像的长度和宽度放大或缩小，进而改变肺部x图像的整体大小；

宽度移动：对肺部x图像在水平方向上移动±0.2％～±0.5％；

高度移动：对肺部x图像在垂直方向上移动±0.2％～±0.5％；

剪切：对肺部x图像剪切范围为±0.2％；

缩放：随机对肺部x图像进行0.45倍的放大或缩小；

水平翻转图像：将肺部x图像再次进行水平方向的翻转。

3.根据权利要求1所述的基于深度学习的肺炎图像分类方法，其特征在于，预处理后的肺部x图像输入到输入块，具体如下：

(一)、传入尺寸为224*224的肺部x图像，经过两层卷积，从原始输入层中提取肺炎x图像中基础特征；具体为：通过对肺部x图像处理，将两肺纹理增粗、肺野内带可见斑片状阴影、密度不均匀、边缘模糊不清的基础特征提取出来；在输入块中，第一个数字表示过滤器大小，第二个数字表示卷积核大小，最后一个数字表示步幅的大小；同时，伴随RELU激活函数，增强卷积层中提取出来特征的稀疏性；

(二)、在经卷积处理时，分别学习feature channels间的关联关系与feature单个channel内部空间上的关联关系，使用大量的1x1大小的卷积核来重视学习；随后链接两层深度可分离卷积，对卷积层中提取的特征图数量进行调整，最后通过池化层，运用2*2的步长降维提取重要特征；

输出块输出的四维特征数据输入到中间块，具体如下：

4.根据权利要求1所述的基于深度学习的肺炎图像分类方法，其特征在于，中间块输出的四维肺炎特征数据输入到输出块，具体如下：

(1)、将中间块下深度提取的四维特征再进行两次深度可分离卷积伴随RELU激活函数，进一步下降参数个数；

(2)、将1x1 Conv输出的feature maps进行分割；

(3)、与两个高维深度可分卷积层结合，伴随RELU激活函数，获取K个肺炎特征；

②、将提取到的K个肺炎特征中重叠且不明确的特征部分进行遗忘，选择去记忆现在重要信息，最终学会运用将过去记忆与现在记忆合并来提高医学诊断的真实性和有效性；

5.一种基于深度学习的肺炎图像分类系统，其特征在于，该系统包括，

融合模块，用于通过Lsception模型对肺部x图像进行特征提取，通过提取的肺部特征完成对肺部x图像的预测分类；融合模块具体如下：

预处理后的肺部x图像输入到输入块，得出四维特征数据；

其中，输入块用于不断下采样，减少空间维度；

中间块用于不断分析，过滤特征；