CN113327666A

CN113327666A - 一种胸片疾病多分类网络的多标签局部至全局学习方法

Info

Publication number: CN113327666A
Application number: CN202110685083.2A
Authority: CN
Inventors: 程远志; 史操; 王烨楠; 许灿辉; 葛全序; 刘健; 袁永锋; 王进科
Original assignee: Qingdao University of Science and Technology; Weihai Municipal Hospital
Current assignee: Qingdao University of Science and Technology; Weihai Municipal Hospital
Priority date: 2021-06-21
Filing date: 2021-06-21
Publication date: 2021-08-31
Anticipated expiration: 2041-06-21
Also published as: CN113327666B

Abstract

本发明提出了一种胸片疾病多分类网络的多标签局部至全局学习方法，包括以下步骤：首先，对胸片样本进行向量化建模，获取胸片样本的多标签局部至全局表征；然后为胸片疾病多分类网络选型；对胸片数据集预处理；训练胸片疾病多分类网络，实施多标签局部到全局学习算法；然后对深度神经网络训练参数进行优化；最终，针对训练后的深度神经网络，进行胸片疾病分类及性能分析。本发明提出的多标签局部到全局学习算法，用以指导深度神经网络训练过程；同时提出多标签条件熵，用以衡量网络训练过程中的稳定性；最后给出三种优化策略指导网络学习优化过程，其网络结构简单，鲁棒性高，能够得到更好的分类效果，具有较高的实用及推广价值。

Description

一种胸片疾病多分类网络的多标签局部至全局学习方法

技术领域

本发明涉及一种深度神经网络学习方法，属于胸片疾病多分类网络训练领域，具体涉及一种胸片疾病多分类网络的多标签局部至全局学习方法。

背景技术

胸腔是人体内最容易发生疾病的地方，早期筛查和诊断是治疗的关键。当前胸部X线因成本低、操作方便等原因成为目前临床应用最广的影像学检查方法，然而，这些胸片需要放射科医师对其进行分析，就使得它是一项耗时，耗力且容易出错的任务。因此，发展自动准确的CXR图像分类算法是近年来医学图像界的高度需求。

目前，在自动学习方法中，基于深度学习的方法在公共数据集和大规模数据集上取得了最好的性能，目前也存在大量关于它的研究。比如，将CNN引入到分类任务中；引入分类和定位的框架，使用预训练模型，多标签丢失和不同池化策略进行训练，并采用CAM对病变进行定位；采用密集连接和批处理归一化来提高精度等等。但上述基于深度学习的方法在异常自动分类中仍然存在一些挑战，例如，在低对比度病变，存在多类型病变，病变大小及位置变化较大，图像不对齐或模糊等情况下无法取得满意的分类结果。另外，现存的大多数方法都专注于解决病变的变异和错位问题，针对该问题多分支方法应用的比较广泛，在基于多分支的方法中，第一个分支被用于聚焦于局部疾病特异性病变区域，第二个分支被用于分类。与上述针对病变变异和错位的方法相比，目前关于多标记的问题的研究还较少。

这些现有的技术都关注于特定深度神经网络(DNN)模型的设计。虽然分类的准确率在不断提高，但网络结构变得越来越复杂，需要的训练数据也更多，训练不可避免的变得更加困难。对于深度学习方法，如果从神经网络优化的角度考虑胸腔疾病分类问题，上述挑战明显增加了优化的复杂性。具体来说，首先是多标签问题，增加了输出标签空间的多样性，甚至使输出空间不堪负荷，导致增加了优化难度。如果通过标签幂集技术LP把多标签分类任务转换成多类别分类任务，新标签集的大小随着类别数量的增加呈指数级增长。其次，CXR图像上病变大小和位置差异大的问题增加了输入空间的多样性，这也给优化带来了重大挑战。最后，模糊导致病变边界不清晰，错位导致图像边界不规则。两者都使决策边界更难找到，并增加了优化的不可忽视的难度。

发明内容

本发明针对现有技术中训练网络复杂，训练困难等缺陷，提出一种胸片疾病多分类网络的多标签局部至全局学习方法，该方法作为一种全局数据集内的深度神经网络权重转移方法，权重从单个标签的样本类别转移至多个标签的样本类别，最终完成深度神经网络的学习过程，能够有效提高训练鲁棒性，提高分类精度。

本发明是采用以下的技术方案实现的：一种胸片疾病多分类网络的多标签局部至全局学习方法，包括以下步骤：

步骤A、对胸片样本及标签进行向量化建模，获取样本的多标签局部至全局表征；

步骤B、胸片疾病多分类网络选型；

步骤C、胸片数据集预处理，包括患者总数统计，胸片样本总数统计，胸片文件格式解析和胸片图像大小归一化操作；

步骤D、基于多标签局部到全局学习算法训练胸片疾病多分类网络；

多标签局部到全局算法定义为：对于K类多标签分类问题，多标签局部到全局学习算法表征一个网络训练过程，其在数据集上按照顺序

逐步训练深度神经网络模型M，该过程生成一个收敛的网络模型序列

其中M_K是最终的训练结果；具体包括以下步骤：

a、初始化网络参数和设置类别指示集，给定数据集

选择策略函数f，损失函数L，学习速率lr作为输入，首先随机初始化DNN模型M的权重，将类别指示集设为空；

b、根据公式

获取训练集序列

序列

中训练集的顺序决定了分类序列

从空集合中生成类别指示集Y^ind，然后在每次迭代中，从未经训练的类别集中选择一个类别并将该类别添加到类别指示集Y^ind中；

c、基于步骤b得到的训练集序列，在训练集序列

上迭代的损失函数L最小化，直到收敛；

d、根据步骤b动态的生成下一个训练集，在第k次迭代时，最新添加的类别就是作为下一个被训练的类别的第一选择：

然后将新的类别

推成

来形成一个新的类别指示集，最后利用公式

来更新训练集；

步骤E、网络训练参数优化；通过步骤D训练得到的关键参数包括类别选择策略f和簇c的数量；

步骤F、基于训练好的网络对胸片疾病进行分类。

进一步的，所述步骤A中，标签类别包括“肺不张”，“心脏病学”，“胸腔积液”，“肺浸润”，“肿块”，“结节”，“肺炎”，“气胸”，“肺实变”，“水肿”，“肺气肿”，“纤维化”，“胸膜增厚”和“疝”，对胸片样本向量化建模后，对建模结果进行特征提取，用one-hot向量形式表征不同的类别，获取样本的多标签局部至全局表征，具体的：

设有N个训练样本

分类空间

对于每个多标签的样本(x_i，Y_i)，K表示类别，x_i是输入特征，Y_i是对应的标签；

根据训练类别对

进行训练集的划分，从

中得到训练集序列

则训练集t_k有:

其中，

称为类别指示集，类别指示集是从空集合中生成的，在每次迭代中，从未经训练的类别集中选择一个类别并将其添加到

中，随着类别指示集内类别标签数目的不断增加，

得到的结果也由空集或只有一个类别不断扩大到Y_i，以此来实现训练样本标签由局部至全局的表征。

进一步的，所述步骤B中，分类网络采用ResNet-152作为骨干网络，去掉网络输出端的全连通层和分类层，并增加K个神经元的全连通层和sigmoid激活函数的分类层。

进一步的，所述步骤E中，针对类别选择策略f提出高低相似性策略，即基于多标签条件熵对相似性进行量化，并通过相似性选出类别，具体包括：

(1)给定DNN模型M，数据集

和类别序列

令

为特征向量，来表示在

中的相应类别是否被认为是稳定度量，假设i为任意正整数，若1≤i<m，则I_i＝1，否则为0；那么M在考虑类别

时对D的稳定性

用ML-CE表示为：

是样本x_n的熵向量，

是样本x_n的函数输出，

代表x_n属于第i个类别的概率，通过公式(3)对相似性进行量化；

(2)假设完成了第k次迭代，为了得到下一个类别，首先得到其余所有类别的相似序列

S_i的计算方法为：

其中，D_i是

的子集，样本的标签包含y_i，即D_i＝{(x_i,Y_i)|1≤i≤N,y_i∈Y_i}，表示类别y_i与现有训练过的类别之间的相似性，

中最小的即为要选择的类别。

进一步的，所述步骤E中，关于簇c数量大于等于2。

进一步的，所述步骤F中，在进行分类时，具体采用以下原理：

首先确定类别空间

即要进行分类的疾病的所有类别；

然后根据排列生成类别序列；同时，对胸片样本训练数据集t_k进行数据集分割，以此获得训练序列

初始化DNN模型M，在训练集t₁上对M进行训练，得到模型M₁，此时的模型M₁识别出所有包含疾病类型

的胸片；再利用类别选择策略函数f从未经训练的类别集中选择一个类别并将其添加到类别指示集中，作为训练集t₂，训练得到模型M₂，此时的模型M₂识别出所有包含疾病类型

和

的胸片；依次迭代，直到所有疾病的类别都被加进类别指示集中，得到最终训练结果模型M_K，即实现对胸片疾病的分类。

与现有技术相比，本发明的优点和积极效果在于：

本发明提出的ML-LGL方法，在DNN训练时，每个样本在训练过程中不断加入到不同标签样本的训练中，权重从单个标签的样本类别转移至多个标签的样本类别，网络权重可以在不同类别中间转移；并采用多个网络训练参数优化策略，对DNN模型进行训练，且在高低相似性策略中提出了多标签条件熵的概念，用以衡量采用ML-LGL算法训练DNN时的稳定性，鲁棒性高，能够得到更好的分类效果。

附图说明

图1为本发明实施例胸片疾病多分类网络的多标签局部至全局学习方法流程示意图；

图2为ChestX-ray14胸片数据集中的疾病分布示意图，(a)标签类别百分比；(b)疾病类别共生矩阵；(c)不同疾病样本数；

图3为本发明实施例ML-LGL方法的原理示意图；

图4为本发明实施例提出的ML-LGL方法与传统的LGL方法的比较示意图。

具体实施方式

为了能够更加清楚地理解本发明的上述目的、特征和优点，下面结合附图及实施例对本发明做进一步说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用不同于在此描述的其他方式来实施，因此，本发明并不限于下面公开的具体实施例。

如图1所示，一种胸片疾病多分类网络的多标签局部至全局学习方法，包括以下步骤：

步骤A，对胸片样本进行向量化建模，获取样本的多标签局部至全局表征；

步骤B，胸片疾病多分类网络选型；

步骤C，胸片数据集预处理，包括患者总数统计，胸片样本总数统计，胸片文件格式解析和胸片图像大小归一化操作；

步骤D，基于多标签局部到全局学习算法训练胸片疾病多分类网络；

步骤E，网络训练参数优化；

步骤F，基于训练好的网络对胸片疾病进行分类；

步骤G，胸片疾病分类性能分析。

本实施例针对深度神经网络提出的多标签局部至全局学习方法(Multi-LabelLocal toGlobal Learning，ML-LGL)，作为一种优化深度神经网络训练过程的方法，局部学习到全局学习可以显著提高深度神经网络训练的鲁棒性和分类性能。

具体的，下面对本发明方法进行详细的说明：

步骤A，对胸片样本及标签进行向量化建模，获取胸片样本的多标签局部至全局表征，具体包括：

首先将胸片样本及标签向量化，上述胸片样本从ChestX-ray14数据集中获得，每个图像都标记了14种胸廓疾病的一种或多种类型，包括“肺不张”，“心脏病学”，“胸腔积液”，“肺浸润”，“肿块”，“结节”，“肺炎”，“气胸”，“肺实变”，“水肿”，“肺气肿”，“纤维化”，“胸膜增厚”和“疝”，所有标签都是通过自然语言处理技术从相关放射学报告中得到的。

考虑k类多标签分类问题，设有N个训练样本

分类空间

对于每个多标签的样本(x_i，Y_i)，K表示类别，x_i是输入特征，Y_i是对应的标签，这是

的一个子集，即

根据训练类别来对

进行训练集的划分，从

中得到训练集序列

设

是由原类别空间Y通过排列生成的类别序列，则训练集t_k有:

其中，

称为类别指示集，k表示迭代次数，类别指示集是从空集合中生成的，在每次迭代中，从未经训练的类别集中选择一个类别并将其添加到

中，随着类别指示集内类别标签数目的不断增加，

得到的结果也由空集或只有一个类别不断扩大到Y_i，以此来实现训练样本标签由局部至全局的表征(局部到全局，即从较少的类别到较多的类别，这里的类别指示集一开始是空集，第一次迭代时，往里面加入一个类别进行训练，使网络可以识别出包含这种类别疾病的胸片，即局部；往后每次迭代都从没被训练过的类别集中选择一个加入类别指示集，随着类别越来越多，最后能实现对所有类型的疾病进行识别分类，即全局)。

本实施例用one-hot向量形式去表征不同的类别，例如，one-hot表示法用[1,0,0,0]表示“第一类病”，以此类推。那么，本发明中使用类似的向量去表征疾病类别。对胸片样本向量化建模后，对建模结果进行特征提取，对样本标签进行建模后，将胸片样本特征提取后得到的特征x_i同建模后的标签一起生成训练集。上述胸片样本向量化建模过程中涉及到的参数解释如表1所示。

表1胸片样本向量化

步骤B，胸片疾病多分类网络选型：

本发明提出的多标签局部到全局学习(ML-LGL)算法，为了在多标签胸廓疾病分类的任务中，有效训练胸片疾病多分类网络，需要对深度神经网络(Deep Neural Network，DNN)中的主干网络进行选型，我们的主要目标是验证ML-LGL的性能，这促使我们选择简单而有效的DNN模型，而不是复杂的DNN模型。例如：可选取在特征提取方面优越的DNN模型：残差网络ResNet。

本实施例中选择在特征提取方面优越的DNN模型：残差网络ResNet网络层数152，即：ResNet-152。一般而言，随着网络层数的增加，会出现分类准确率下降的现象，为了解决这个问题，残差网络ResNet被Facebook研究人员提出，使得网络层数可以不断增加，能够更好地完成特征表达，同时不丢失分类精度。

因此，本实施例选择ResNet-152作为骨干网络，去掉网络输出端的全连通层和分类层，增加K个神经元的全连通层和sigmoid激活函数的分类层。

步骤C，胸片数据集预处理：

对胸片数据集预处理包括统计患者总数，胸片样本总数，胸片文件格式解析，胸片图像大小归一化等等。如图2所示，本实施例直接使用ChestX-ray14数据集训练胸片疾病多分类网络：该数据集中包含30840个独立患者的112120张正面胸片图像，所有的图像都进行相同的预处理过程：从DICOM文件中提取，调整大小到1024*1024的分辨率，通过默认窗口宽度和在DICOM文件头部设置存储的窗口位置将图像缩放到[0,255]。

每个图像都标记了14种疾病的一种或多种类型，包括:“肺不张(Atelectasis)”，“心脏病(Cardiology)”，“胸腔积液(Effusion)”，“肺浸润(Infiltration)”，“肿块(Mass)”，“结节(Nodule)”，“肺炎(Pneumonia)”，“气胸(Pneumothorax)”，“突变(Consolidation)”，“水肿(Edema)”，“肺气肿(Emphysema)”，“纤维化(Fibrosis)”，“胸膜增厚(Pleural thickening)”和“疝(Hernia)”。该数据集中疾病分类标签通过自然语言处理技术从放射科诊断报告中提取，但数据集本身并未公开放射科诊断报告。

如图2(a)所示，类别分布并不均匀，健康样本占比58％，单标签样本和多标签样本分别占27％和15％。从图2(b)中的类别共生矩阵显而易见，一个类别可以与几乎其他所有类别共存。

步骤D，训练胸片疾病多分类网络，实施多标签局部到全局学习(ML-LGL)算法：

对于深度神经网络(Deep Neural Network，DNN)模型M，多标签局部到全局学习(Multi-Label Local to Global Learning，ML-LGL)定义为：对于K类多标签分类问题，ML-LGL将表征一个网络训练过程，其在数据集上按照顺序

其中M_K是最终的训练结果。

根据表1中的定义，具体步骤如下：

a.初始化网络参数和设置类别指示集，给定数据集

b.根据公式

获取训练集序列

序列

中训练集的顺序决定了分类序列

该分类序列可直接影响训练结果。

c.为了探索步骤b中训练集顺序的更多可能性，本实施例中并不是在开始时获得预定义的类别序列

而是在训练过程中动态地选择下一个训练类别，也就是说，从空集合中生成类别指示集Y^ind，然后在每次迭代中，从未经训练的类别集中选择一个类别并将该类别添加到类别指示集Y^ind中。

d.基于步骤b得到的训练集序列，使在训练集序列

上迭代的损失函数L最小化，直到收敛。

e.基于步骤b、c，动态的生成下一个训练集，在第k次迭代时，最新添加的类别就是作为下一个被训练的类别的第一选择：

f.然后将新的类别

推成

来形成一个新的类别指示集，最后利用公式

来更新训练集。

基于上述训练步骤，本实施例提出算法1：ML-LGL多标签局部到全局学习算法，具体如下所示：

算法1ML-LGL流程图如图3所示，左侧子图(a)获取训练序列，以及右侧子图(b)对序列进行迭代训练。与传统的LGL算法(Local to Global Learning)相比：

如图4(a)所示，在传统LGL中，每个样本在每次渐进迭代中都使用同一个类别进行训练，这意味着权重只从一个样本转移到另一个样本。与LGL算法对比，本实施例提出的ML-LGL算法，如图4(b)所示，每个样本在训练过程中不断加入到不同标签样本的训练中，如标签为“A”的样本随着网络训练的不断进行，将参与标签为“B”和“C”的样本训练中，网络权重可以在不同类别中间转移。因此，本实施例提出的ML-LGL算法比传统LGL而言，其优势在于，ML-LGL是一种全局数据集内的深度神经网络权重转移方法，权重从单个标签的样本类别转移至多个标签的样本类别，这种策略使得训练更加健壮，局部学习到全局学习可以显著提高训练的鲁棒性和性能，而ML-LGL方法使权重从单个标签的样本类别转移至多个标签的样本类别，这样可使该方法更好的应用在胸片疾病多标签分类中，另外，通过实验验证，ML-LGL方法优于其他训练方案，它可以使训练的时间缩短，并获得较高的分类准确率。

步骤E，网络训练参数优化：

ML-LGL的训练过程中中有两个关键参数，包括类别选择策略函数f和簇c的数量。f和c的不同选择会影响到ML-LGL的训练性能，因此，针对本实施例提出的ML-LGL算法，需要对深度神经网络模型的训练参数进行优化。

(一)选择策略函数f优化：

选择策略函数f是为了未经训练的类别集中选择一个类别并将其添加到类别指示集Y^ind中。公式

定义了算法ML-LGL中如何从训练集的候选类别样本中通过f选择下一个类别的样本。这个过程可能依赖于当前的模型M_k和数据集

也就是说，如果使用相似的策略，则需要根据当前的模型M_k来计算

中所有剩余样本的相似度。综上，选择策略f在上面介绍的训练过程中是至关重要的。

传统的LGL方法中测试了三种选择策略，分别为1、从剩余的集群中随机选择一个集群；2、选择与训练过的簇最不相似的簇；3、选择与训练过的集群最相似的集群。实验表明每种选择策略的性能相差不大，我们认为这主要是因为使用的数据集包含的类和样本相对较少。然而，在本实施例使用的ChestX-ray14数据集中，在对胸片疾病分类的特点，大约有2的15次方个类别和112120个样本，使得分类更加困难。因此，如何确定一个合适的选择策略，可以在ML-LGL中获得更好的表现，也显得至关重要。

在本实施例中，采用三种不同的策略来对比其效果，分别为随机策略，高低相似性策略，高低频策略。其中，随机策略由于其随机性，主要是为了与另外两种策略提供对比，以判断另外两种策略是否起到效果；高低频策略是由其他学者提出，该策略与我们的常识一致，并已经证明是有效的策略；而高低相似性策略则是由本方案提出的多标签条件熵(ML-CE)对相似性进行量化，并通过相似性选出对应类别。

如上所述，我们选择采用上述三种不同的策略来对比其效果，具体如下：

<1>随机策略

在每次迭代中(即：算法1中第4步～第8步、图3(b)中每一次训练所得M)，随机选择类别。

<2>高低相似性策略

针对类别选择策略f提出高低相似性策略，从未经训练的类别集中选取最相似的类别。当使用ML-LGL时，DNN模型从一个更稳定的状态训练，这导致一个收敛的更稳定的最终状态。这就要求我们通过某种手段来确定与不使用ML-LGL时相比，使用ML-LGL时DNN模型的稳定性是否有所不同。因此，我们提出了多标签条件熵(ML-CE)对相似性进行量化，并通过相似性选出类别，同时可通过它来度量网络的稳定性。

给定DNN模型M，数据集

和类别序列

令

为特征向量，来表示在

中的相应类别是否被认为是稳定度量，假设i为任意正整数，若1≤i<m，则I_i＝1，否则为0。那么M在考虑类别

时对D的稳定性

可以用ML-CE表示为：

是样本x_n的熵向量，

是样本x_n的函数输出，

代表x_n属于第i个类别的概率。

基于上述公式，我们可以对相似性进行量化。接下来我们可以通过量化后的相似性选出类别，假设我们已经完成了第k次迭代，为了得到下一个类别，首先得到其余所有类别的相似序列

S_i的计算方法为：

其中，D_i是

的子集，样本的标签包含y_i，即D_i＝{(x_i,Y_i)|1≤i≤N,y_i∈Y_i}。它表示类别y_i与现有训练过的类别之间的相似性。然后，

中最小的就是我们要选择的类别。实际上，这种策略使得DNN模型的训练最为稳定和顺利。

此外，ML-CE也可以作为衡量网络稳定性的指标，理由如下，由于权值w在开始时是随机初始化的，它导致函数输出O是均匀分布的，

的值几乎达到最大值。随着训练的进行，S变得越来越可预测，使得

的值变得越来越小，并且，如果M充分训练，

的值可能会趋于0。显然，ML-CE可以作为衡量网络稳定性的指标。

<3>高低频策略

我们用更多的样本以更高的优先级训练类别，样本数量越多的类别越容易被识别，因为它更常见。因此，本实施例中数量多的样本类别具有更高训练优先级。图2(c)显示了各类别样本的统计信息，本实施例中训练DNN模型的样本顺序为:“肺不张(Atelectasis)”，“心脏病(Cardiology)”，“积液(Effusion)”，“浸润(Infiltration)”，“肿块(Mass)”，“结节(Nodule)”，“肺炎(Pneumonia)”，“气胸(Pneumothorax)”，“突变(Consolidation)”，“水肿(Edema)”，“肺气肿(Emphysema)”，“纤维化(Fibrosis)”，“胸膜增厚(Pleuralthickening)”和“疝(Hernia)”。

根据实验结果显示，上述三个选择策略提供一个清晰的改进总体性能基线,对于每个类的AUC性能,高低频策略实现了改善所有14种病症的承诺,AUC值只有在“肺炎”和“疝气”上用到随机和相似性策略时才会降低。这表明ML-LGL在多标签分类任务中非常有效。

此外，我们观察到高低频策略优于其他两种策略。随机策略和相似策略的综合性能分别提高了3％(0.732～0.763)和3.8％(0.732～0.771)，高低频策略的综合性能提高了近5.5％(0.732～0.787)。

另外，我们发现，对于高低频策略而言，显著的改善来自低频类；这意味着，在我们提出的ML-LGL中，高频类别可以指导低频类别的学习。因此，高低频率策略在一定程度上揭示了胸部x射线14数据集上的疾病的本能结构。

(二)簇c的数量优化：

关于簇c数量的选择，本实施例中2≦c<5，首先，在每个迭代中逐渐添加一个类别是不现实的，因为它会消耗太多时间，特别是K较大的情况下，所以我们每次迭代添加一些类别而不是添加一个类别，我们把这些类别的添加称作“cluster(簇)”。

在本实施例中，c＝2,3,4分别进行了检验分析，检验了不同c值的影响，在这里，若c＝1，意味着每次迭代逐渐添加一个类别，如上所述，这是不现实的，会消耗过多时间。若取c为5或者5以上，则意味着每次迭代逐渐添加5或5以上个类别，若以胸片疾病为例，则是5或5以上种疾病，由图2所示，本实施例样本中健康样本占58％，单标签样本和多标签样本分别占27％和15％，我们由此可以推测人同时患多种病的概率是随着同时患病种类的增加而减少的，所以c若是取过大的数值意义不大，综上，我们在实验中分别选择c＝2、3、4来探讨不同c值所带来的影响。

使用上述高低频策略时，随着簇的数量的增加，总体性能从0.732(基线)不断提高到0.797(c＝4)。相似策略和随机策略也遵循这一模式，我们可以确认如果在每次迭代中添加一个类别，ML-LGL将获得最好的性能。在每类AUC上，“肺浸润”、“气胸”和“肺气肿”三个疾病类别在c＝3时表现最好，而“水肿”在c＝2时表现最好。此外，在除“肺实变”疾病外的大多数疾病中，每类AUC值随着簇c数目的增加呈次线性增长。

步骤F，基于训练好的网络对胸片疾病进行分类

基于上述步骤，可利用训练好的网络对胸片疾病进行分类，即：

首先基于步骤A，对胸片样本进行向量化建模，得到样本的多标签局部到全局表征，并用one-hot向量形式表征不同的类别，然后对建模结果进行特征提取，生成训练集；

其次基于步骤B对深度神经网络中的主干网络进行选型，选型标准为选择简单有效的DNN模型，用于验证ML-LGL的性能；

接着基于步骤C，对胸片数据集进行预处理，将其处理为统一的格式以便后续实验；

然后基于步骤D，训练胸片疾病多分类网络，得到一个收敛的网络模型序列，其中包含最终的训练结果；

最后基于步骤E，选择合适的类别选择策略函数f和簇c的数量，以优化训练参数；

在对胸片疾病的分类过程中，如图3，我们首先确定类别空间

即要进行分类的疾病的所有类别，然后根据排列生成类别序列；同时，对训练数据集(也就是胸片样本)通过公式1进行数据集分割，以此获得训练序列

然后初始化DNN模型M，首先在训练集t₁上对M进行训练，得到模型M₁，此时的模型M₁可以识别出所有包含疾病类型

的胸片；再利用类别选择策略函数f从未经训练的类别集中选择一个类别并将其添加到类别指示集中，作为训练集t₂，训练得到模型M₂，此时的模型M₂可以识别出所有包含疾病类型

和

的胸片；按照这样一直迭代下去，直到所有疾病的类别都被加进类别指示集中，得到最终训练结果模型M_K，即可实现对胸片疾病的分类。

这种逐步添加类别迭代训练的过程就是从局部到全局训练的过程，即，通过ML-LGL引导网络按照一定的顺序逐步从较少的类别学习到更多的类别的过程。

步骤G，胸片疾病分类性能分析。

本实施例训练好的深度网络模型对胸片疾病进行分类，并与以下三种方法进行了对比：

[1]Wang X,Peng Y,Lu L,Lu Z,Bagheri M,Summers RM.Chestx-ray8:Hospital-scale chest x-ray database and benchmarks on weakly-supervised classificationand localization of common thorax diseases.In:Proceedings of the IEEEconference on computer vision and pattern recognition.2017.p.2097–2106.

[2]Yao L,Prosky J,Poblenz E,Covington B,Lyman K.Weakly supervisedmedical diagnosis and localization from multiple resolutions.arXiv preprintarXiv:1803077032018.

[3]Wang H,Jia H,Lu L,Xia Y.Thorax-net:An attention regularized deepneural network for classification of thoracic diseases on chestradiography.IEEE journal of biomedical and health informatics 2019.

数据集采用ChestX-ray14(见本实施例“步骤C”)，疾病分类性能采用AUC值(AreaUnder Curve)，对比结果如表2所示。每一行代表一种疾病：“肺不张(Atelectasis)”，“心脏病(Cardiology)”，“积液(Effusion)”，“浸润(Infiltration)”，“肿块(Mass)”，“结节(Nodule)”，“肺炎(Pneumonia)”，“气胸(Pneumothorax)”，“突变(Consolidation)”，“水肿(Edema)”，“肺气肿(Emphysema)”，“纤维化(Fibrosis)”，“胸膜增厚(Pleuralthickening)”和“疝(Hernia)”，最后一行为“平均值(Average)”；每一列表示一种算法的AUC值，最后一列为本实施例的结果。其中每一行(即：每一种疾病)的最高AUC值都被框选。与[1]-[3]三种方法相比，本发明提出的ML-LGL方法在除了“心脏病(Cardiology)”，“突变(Consolidation)”，“疝(Hernia)”以外的11种疾病均取得了AUC最优值。即：本发明提出的ML-LGL算法在与同类算法相比，具有相当的优势，具体可体现为：

能获得更鲁棒性的训练，ML-LGL能够有效提高病理区域的定位精度，并在多标签分类任务中非常有效。ML-LGL优于其他学习方案，在ChestX-ray14数据集上获得了0.795的分类准确率。ML-LGL获得了最好的整体性能(AUC＝0.799)，与以前的最先进的技术相比具有优势。基线的训练时间约为6小时，而使用频率策略和c＝3的ML-LGL，每个簇的训练时间分别为3小时、2.6小时和2.3小时，大大缩短了训练时间。

表2本实施例分类性能(AUC值)

以上所述，仅是本发明的较佳实施例而已，并非是对本发明作其它形式的限制，任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例应用于其它领域，但是凡是未脱离本发明技术方案内容，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型，仍属于本发明技术方案的保护范围。

Claims

1.一种胸片疾病多分类网络的多标签局部至全局学习方法，其特征在于，包括以下步骤：

步骤B、胸片疾病多分类网络选型；

其中M_K是最终的训练结果；具体包括以下步骤：

a、初始化网络参数和设置类别指示集，给定数据集

b、根据公式

获取训练集序列

序列

中训练集的顺序决定了分类序列

c、基于步骤b得到的训练集序列，在训练集序列

上迭代的损失函数L最小化，直到收敛；

然后将新的类别

推成

来形成一个新的类别指示集，最后利用公式

来更新训练集；

步骤F、基于训练好的网络对胸片疾病进行分类。

2.根据权利要求1所述的胸片疾病多分类网络的多标签局部至全局学习方法，其特征在于：所述步骤A中，标签类别包括“肺不张”，“心脏病学”，“胸腔积液”，“肺浸润”，“肿块”，“结节”，“肺炎”，“气胸”，“肺实变”，“水肿”，“肺气肿”，“纤维化”，“胸膜增厚”和“疝”，对胸片样本向量化建模后，对建模结果进行特征提取，用one-hot向量形式表征不同的类别，获取样本的多标签局部至全局表征，具体的：

设有N个训练样本