CN113284136A

CN113284136A - 一种双损失函数训练的残差网络和XGBoost的医学图像分类方法

Info

Publication number: CN113284136A
Application number: CN202110690947.XA
Authority: CN
Inventors: 张小瑞; 周杰; 孙伟; 孙星明; 郑钰辉; 付章杰; 夏志华
Original assignee: Nanjing University of Information Science and Technology
Current assignee: Nanjing University of Information Science and Technology
Priority date: 2021-06-22
Filing date: 2021-06-22
Publication date: 2021-08-20

Abstract

本发明公开了一种双损失函数训练的残差网络和XGBoost的医学图像分类方法，首先，收集医学图像数据集并将其划分为训练集和测试集；其次，对医学图像数据集进行预处理，将图像大小调整为224*224并且进行归一化处理；然后，搭建Resnet50网络作为模型的特征提取层，使用ELU激活函数替换Resnet50网络中残差块中的ReLU激活函数，并采用三元组损失以及中心损失共同训练Resnet50网络；之后，将Resnet50网络的最后一个全连接层移除，使用XGBoost作为模型的分类层；最后，使用训练集训练模型，将测试集输入训练好的模型得到分类结果。本发明使得同类样本特征更加靠近，不同类样本特征更加远离，有助于提高模型的分类精度；且分类效率高，在提高模型分类精度的同时，可以防止过拟合。

Description

一种双损失函数训练的残差网络和XGBoost的医学图像分类方法

技术领域

本发明属于医学图像处理领域，涉及一种双损失函数训练的残差网络和XGBoost的医学图像分类方法。

背景技术

医学影像技术的不断发展对疾病的诊治做出了巨大的贡献，使用影像学技术诊断疾病不仅效率高，而且对于传染性强的疾病而言，可以降低医患之间交叉感染的风险。医生通过分析患者的医学影像来诊断患者所患有的疾病种类。然而，能够准确分析医学影像的经验丰富的放射科医生在每个医院都属于稀缺人才，这使得人为检测的效率很低，所以，需要发明一种能够自动分析医学影像并进行准确判断的方法。

目前自动诊断疾病的主流方法是使用AI技术，利用深度学习技术自动对医学图像进行分类。卷积神经网络是深度学习的代表算法之一，使用卷积神经网络对医学图像进行分类是当前的热门研究方向，选择一个合适的神经网络，使用医学图像作为数据训练神经网络，便可以使神经网络自动准确的分类医学影像从而达到准确诊断的目的。而使用神经网络对图像进行分类的关键在于神经网络提取到的图像的特征，本发明在选定的网络中使用三元组损失和中心损失共同训练网络，对网络中提取到的图像特征进行充分处理，最后使用XGBoost方法进行分类，进一步提高最终的分类精度。

发明内容

发明目的：本发明的目的是提供一种双损失函数训练的残差网络和XGBoost的图像分类方法，提高分类精度，提升模型的分类效果。

技术方案：本发明提供一种双损失函数训练的残差网络和XGBoost的图像分类方法，具体包括以下步骤：

(1)收集医学图像数据集，并将其划分为训练集和测试集；

(2)对医学图像数据集进行预处理，将图像大小调整为224*224并且进行归一化处理；

(3)搭建Resnet50网络作为模型特征提取层，使用ELU激活函数替换Resnet50网络中残差块中的ReLU激活函数，并采用三元组损失以及中心损失共同训练Resnet50网络；

(4)将Resnet50网络网络的最后一个全连接层移除，使用XGBoost作为模型的分类层；

(5)使用训练集训练模型，将测试集输入训练好的模型得到分类结果。

进一步地，步骤(1)所述的训练集、验证集和测试集的比为8:2。

进一步地，步骤(3)所述的采用三元组损失训练Resnet50网络过程如下：

三元组损失由一个三元组<a,p,n>构成，一次输入三张成对图像，其中，a为训练集中选取的一个训练样本，p为与训练样本同一类别的样本，称为正样本，n为与训练样本不同类别的样本，称为负样本，三元组损失L_tri的计算公式为：

L_tri＝max(d(a,p)-d(a,n)+margin,0)

其中，d(a,p)表示的是a和p之间的欧氏距离度量，d(a,n)表示的是a和n之间的欧氏距离度量，margin是a与p之间的距离和a与n之间的距离之间的间距，人为可控，偏小会难以区分相似的图像，偏大会导致网络不收敛，需要设置合理的margin值。

进一步地，步骤(3)所述的中心损失训练Resnet50网络过程如下：

其中，L_c表示中心损失，r表示样本的个数，u＝1表示第一个样本，z_u表示第u个样本提取到的特征，c_yu表示第u个样本对应类别的所有样本的平均特征；Resnet50网络的总损失L的计算公式如下：

L＝L_tri+βL_c

其中，β是中心损失的平衡权重。

进一步地，所述步骤(4)实现过程如下：

设训练集为D＝{(g_i,h_i)}，(D|＝s,g_i∈R^m,h_i∈R)，其中g_i表示第i个样本，h_i表示第i个样本的类别标签，s是训练集中样本个数,m是训练集中特征个数，R^m是由m个实数构成的实数集合，R表示实数集合，XGBoost是一个树集成模型，一共有K棵树，最小化目标函数Obj，Obj的定义如下：

其中，

是第i个样本的预测值，Ω(f_k)表示第k棵树f_k的复杂度，Ω是计算复杂度的公式符号。

有益效果：与现有技术相比，本发明的有益效果：使用ELU激活函数替换Resnet50网络中残差块中的ReLU激活函数，可以使特征提取层学习更快并且对噪声有鲁棒性；使用三元组损失来训练特征提取层，可以增强欧式空间的类内紧凑性和类间可分性，也就是可以使得同类样本特征更加靠近，不同类样本特征更加远离，有助于提高模型的分类精度；添加中心损失配合三元组损失训练特征提取层，不仅可以进一步对提取到的特征进行处理，还可以弥补三元组损失的不足从而提高模型性能；使用XGBoost作为模型的分类层来进行最终的分类，效率高，在提高模型分类精度的同时，可以防止过拟合。

附图说明

图1是本发明的流程图；

图2是修改后的残差模块图。

具体实施方式

下面结合附图对本发明作进一步详细说明。

本发明提供一种双损失函数训练的残差网络和XGBoost的图像分类方法，如图1所示，具体包括以下步骤：

步骤1：收集医学图像数据集，并将数据集划分为训练集和测试集。

收集医学图像数据集，并根据神经网络需要大量数据进行训练的特性以及结合以往的实验经验将整个医学数据集的80％划分为训练集和20％的测试集。

步骤2：为了统一标准对医学图像数据集进行预处理，将医学图像数据集中的图像大小调整为224*224并且进行归一化处理。

步骤3：搭建Resnet50网络作为模型特征提取层，使用ELU激活函数替换Resnet50网络中残差块中的ReLU激活函数，使用ELU激活函数可以使特征提取层学习更快并且对噪声有鲁棒性，修改后的残差块如图2所示，输入残差块中的特征矩阵的深度为256维度，使用64个1*1的卷积核对其进行卷积，特征矩阵的深度降维到64维度，之后通过64个3*3的卷积核进行卷积，然后使用256个1*1的卷积核进行卷积，使得特征矩阵的深度升维到256维度，最后将输入的特征矩阵与经过3次卷积处理之后的特征矩阵相加，整个残差块中使用了3次ELU激活，分别是在第一次和第二次卷积以及最后相加操作之后。

采用三元组损失以及中心损失共同训练Resnet50网络。使用三元组损失可以增强欧式空间的类内紧凑性和类间可分性，它由一个三元组<a,p,n>构成，所以，一次输入三张成对图像，(anchor)a指的是我们训练集中选取的一个CT训练样本，(positive)p是与训练样本同一类别的样本称为正样本，(negative)n是与训练样本不同类别的样本称为负样本，因此三元组损失L_tri的计算公式为：

L_tri＝max(d(a,p)-d(a,n)+margin,0)

当d(a,p)-d(a,n)+margin大于0的时候L_tri的值是d(a,p)-d(a,n)+margin而当d(a,p)-d(a,n)+margin小于0的时候L_tri的值为0。其中，d(a,p)表示的是a和p之间的欧氏距离度量，d(a,n)表示的是a和n之间的欧氏距离度量，margin是a与p之间的距离和a与n之间的距离之间的间距，人为可控，偏小会难以区分相似的图像，偏大会导致网络不收敛，需要设置合理的margin值。通过添加三元组损失训练网络可以使得在欧氏距离中，新冠图像的特征和正常图像的特征分别聚集在一起并且两个特征之间互相远离，提高了辨识度，从而提升了分类精度。添加中心损失来共同训练网络，进一步处理特征，弥补三元组损失的不足，因为三元组损失虽然考虑到了类之间的离散型，但是忽略了类内的紧凑性，会导致同一类的特征之间的距离过大，而中心损失会对特征之间的距离进行约束，会使得同类别的平均特征的距离足够的小，要求同类的特征接近它们的中心点，使得同一类的特征之间的距离缩小，这样就可以解决三元组损失的问题，中心损失的计算公式L_c如下所示：

其中，L_c表示中心损失，r表示样本的个数，u＝1表示第一个样本，z_u表示第u个样本提取到的特征，

表示第u个样本所对应类别的所有样本的平均特征；Resnet50网络的总损失L的计算公式如下：

L＝L_tri+βL_c

其中，β是中心损失的平衡权重。

步骤4：将Resnet50网络的最后一个全连接层移除，使用XGBoost作为模型的分类层。

其中，

步骤5：使用训练集训练模型，将测试集输入训练好的模型得到分类结果。

Claims

1.一种双损失函数训练的残差网络和XGBoost的医学图像分类方法，其特征在于，包括以下步骤：

(1)收集医学图像数据集，并其划分为训练集和测试集；

(4)将Resnet50网络的最后一个全连接层移除，使用XGBoost作为模型的分类层；

2.根据权利要求1所述的一种双损失函数训练的残差网络和XGBoost的医学图像分类方法，其特征在于，步骤(1)所述的训练集和测试集的比为8:2。

3.根据权利要求1所述的一种双损失函数训练的残差网络和XGBoost的医学图像分类方法，其特征在于，步骤(3)所述的采用三元组损失训练Resnet50网络过程如下：

三元组损失由一个三元组<a,p,n>构成，一次输入三张成对图像，其中，a为训练集中选取的一个训练样本，p为与训练样本同一类别的样本称为正样本，n为与训练样本不同类别的样本称为负样本，三元组损失L_tri的计算公式为为：

L_tri＝max(d(a,p)-d(a,n)+margin,0)

4.根据权利要求1所述的一种双损失函数训练的残差网络和XGBoost的医学图像分类方法，其特征在于，步骤(3)所述的采用中心损失训练Resnet50网络过程如下：

L＝L_tri+βL_c

其中，β是中心损失的平衡权重。

5.根据权利要求1所述的一种双损失函数训练的残差网络和XGBoost的医学图像分类方法，其特征在于，所述步骤(4)实现过程如下：

设训练集为D＝{(g_i,h_i)}，(|D|＝s,g_i∈R^m,h_i∈R)，其中g_i表示第i个样本，h_i表示第i个样本的类别标签，|D|表示D的模长，s是训练集中样本个数,m是训练集中特征个数，R^m是由m个实数构成的实数集合，R表示实数集合，XGBoost是一个树集成模型，一共有K棵树，最小化目标函数Obj，Obj的定义如下：

其中，

是第i个样本的预测值值，Ω(f_k)表示第k棵树f_k的复杂度，Ω是计算复杂度的公式符号。