CN113887662A

CN113887662A - 一种基于残差网络的图像分类方法、装置、设备及介质

Info

Publication number: CN113887662A
Application number: CN202111244501.0A
Authority: CN
Inventors: 许廷发; 肖予泽; 李佳男; 黄诗淇; 沈宁
Original assignee: Beijing Institute of Technology BIT; Chongqing Innovation Center of Beijing University of Technology
Current assignee: Beijing Institute of Technology BIT; Chongqing Innovation Center of Beijing University of Technology
Priority date: 2021-10-26
Filing date: 2021-10-26
Publication date: 2022-01-04

Abstract

本发明公开了一种基于残差网络的图像分类方法、装置、设备及介质，该方法包括获取根据数据特征分类的数据集，并根据所述数据特征编写卷积神经网络所需的数据接口；制作数据集标签，每一类不同数据特征的数据集对应一个数据集标签；构建训练集和测试集，将数据集分割成若干等份；构建深层残差单元，搭建卷积神经网络，建立图像分类模型；对图像分类模型设置训练参数和损失函数策略，确定分类器输出的分类结果；对图像分类模型进行网络训练和网络测试；向图像分类模型中输入待分类图像，获得分类结果。本发明通过构建图像分类模型辅助医生诊断，减轻眼科医生负担、缩短检查时间，降低疾病不同等级对应的图片筛查的时间和人力成本。

Description

一种基于残差网络的图像分类方法、装置、设备及介质

技术领域

本发明属于图像处理技术领域，尤其涉及一种基于残差网络的图像分类方法、装置、设备及介质。

背景技术

图像分类在多个领域中均有广泛的应用，深度学习算法是目前最常用的自动图像处理方法。卷积神经网络(CNN)是深度学习算法中一种以端到端的方式进行特征提取的方法，不仅在目标检测、语义分割，也在医学领域得到了广泛应用。残差网络可以有效解决随着网络深度加深带来的梯度消失的问题。

以医学领域为例，糖尿病视网膜病变(DR)是一种多发的长病程糖尿病引发的并发症，是世界工作年龄人口失明和视力残疾的最常见原因。血糖水平升高会影响到视网膜血管，血管改变的表现包括：微血管瘤、视网膜内点状或斑片状出血、硬渗出物、神经纤维梗阻(棉绒斑)、局部毛细血管无灌注，严重甚至会出现新生血管。

糖尿病黄斑水肿(DME)是一种与糖尿病视网膜病变息息相关，可能出现在糖尿病视网膜病变任何阶段的疾病。DME的主要表征为：视网膜增厚，可表现为局部的或弥漫性；黄斑附近区域有或无硬性渗出，以及囊样水肿。

由上述可知，两种疾病均可在图像上体现不同的特征。临床诊断中，DR和DME筛查主要依靠眼科医生检查彩色眼底图像。然而，专业眼科医生紧缺与偏远地区医疗环境不佳严重制约了筛查诊断的进程，人工实时分析更是难上加难。因此，有必要引入计算机辅助治疗减轻眼科医生负担、缩短检查时间，降低疾病不同等级对应的图片筛查的时间和人力成本。

发明内容

本发明的目的在于，为克服现有技术缺陷，提供了一种基于残差网络的图像分类方法、装置、设备及介质,旨在解决目前基于残差网络的图像分类过程中，无法按照需求对图像进行分级分类的技术问题。

本发明目的通过下述技术方案来实现：

为实现上述目的，本发明提供一种基于残差网络的图像分类方法，该方法包括以下步骤：

获取根据数据特征分类的数据集，并根据所述数据特征编写卷积神经网络所需的数据接口；

制作数据集标签，每一类不同数据特征的数据集对应一个数据集标签；

构建训练集和测试集，将数据集分割成若干等份；

构建深层残差单元，搭建卷积神经网络，建立图像分类模型；所述卷积神经网络输出端连接至少两个分类器；

对图像分类模型设置训练参数和损失函数策略，确定分类器输出的分类结果；

对图像分类模型进行网络训练和网络测试；

向图像分类模型中输入待分类图像，获得分类结果。

进一步的，所述图像分类模型采用留一交叉验证方法进行网络训练和网络测试。

进一步的，所述分类器为两个，分类器输出的分类结果为一个二分类结果和一个三分类结果，所述设置训练参数和损失函数策略具体包括：

选择网络优化器，初始化学习率；

设置衰减学习率策略并设置训练时期和批尺寸；

设置二分类结果损失函数为交叉熵损失函数L₁，三分类结果损失函数为交叉熵损失函数L₂；

设置二分类结果和三分类结果的激活函数和矩阵乘法，使图像分类模型输出为六分类结果。

进一步的，所述衰减学习率策略采用余弦退火函数。

进一步的，还包括对六分类结果设置损失函数策略，对六分类结果使用感知标签分布边界损失函数L_LDAM，

其中，x是输入，y是x对应的类别，f是网络模型，z_j＝f(x)_j是第j类的输出，边界

C是不平衡比率，即最频繁和最不频繁的类的样本大小之间的比率；

图像分类模型的总损失函数L＝L₁+L₂+L_LDAM。

进一步的，所述深层残差单元包括三个卷积层和两个激活函数层，每个卷积层还包含一个批归一化层，卷积层之间通过激活函数层连接；所述深层残差单元还通过短路连接将输入加到输出上，当短路连接输入输出维度不一致时，通过一个卷积层对输入升维。

进一步的，所述卷积神经网络包括前端卷积神经网络和后端卷积神经网络；

前端卷积神经网络包括一个卷积层，卷积层包括一个批归一化层，卷积层通过激活函数层与最大池化层连接，最大池化层和深层残差层连接，深层残差层与平均池化层连接；

后端卷积神经网络将前端网络输出降维，包括作为分类器的全连接层。

另一方面，本发明还提供了一种基于残差网络的图像分类装置，所述装置包括：

接口编写模块，用于获取根据数据特征分类的数据集，并根据所述数据特征编写卷积神经网络所需的数据接口；

标签制作模块，用于制作数据集标签，每一类不同数据特征的数据集对应一个数据集标签；

训练集构建模块，用于构建训练集和测试集，将数据集分割成若干等份；

模型建立模块，用于构建深层残差单元，搭建卷积神经网络，建立图像分类模型；

模型训练模块，用于对图像分类模型进行网络训练和网络测试；

分类结果输出模块，用于向图像分类模型中输入待分类图像，获得分类结果。

可选的，模型训练模块采用留一交叉验证方法进行网络训练和网络测试。

可选的，模型训练模块，用于对图像分类模型进行网络训练和网络测试，具体为：选择网络优化器，初始化学习率；

设置衰减学习率策略并设置训练时期和批尺寸；

可选的，模型训练模块设置的衰减学习率策略采用余弦退火函数。

可选的，模型训练模块还对六分类结果设置损失函数策略，对六分类结果使用感知标签分布边界损失函数L_LDAM，

图像分类模型的总损失函数L＝L₁+L₂+L_LDAM。

可选的，模型建立模块构建的深层残差单元包括三个卷积层和两个激活函数层，每个卷积层还包含一个批归一化层，卷积层之间通过激活函数层连接；所述深层残差单元还通过短路连接将输入加到输出上，当短路连接输入输出维度不一致时，通过一个卷积层对输入升维。

可选的，模型建立模块搭建的卷积神经网络包括前端卷积神经网络和后端卷积神经网络；

另一方面，本申请提供了一种计算机设备，计算机设备包括处理器和存储器，所述存储器中存储有计算机程序，所述计算机程序由所述处理器加载并执行以实现上述的任意一种基于残差网络的图像分类方法。

另一方面，本申请提供了一种计算机可读存储介质，所述存储介质中存储有计算机程序，所述计算机程序由处理器加载并执行以实现上述的任意一种基于残差网络的图像分类方法。

本发明的有益效果在于：

(1)本发明通过构建图像分类模型实现对具有某些特定特征的图像的分类，辅助医生诊断，减轻眼科医生负担、缩短检查时间，降低疾病不同等级对应的图片筛查的时间和人力成本。

(2)由于图像数据存在类别不均衡的问题，普遍在数量较少的类别，即尾类，表现较差。而这些类别有时候是不可忽视的一部分。本发明在对图像特征提取后，将输出的不同分类结果融合成一个总的预测结果。并将总的分类结果使用感知标签分布边界损失函数代替交叉熵损失函数，克服图像数据类别不均衡问题。

附图说明

图1是本发明实施例一提供的一种基于残差网络的图像分类方法的流程示意图；

图2是本发明实施例一提供的一种基于残差网络的图像分类方法中构建的图像分类模型结构示意图；

图3是本发明实施例一提供的一种基于残差网络的图像分类方法的图像分类模型中卷积块2的结构示意图；

图4是本发明实施例二提供的一种基于残差网络的图像分类装置的结构框图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。

基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

当前，糖尿病视网膜病变(DR)和糖尿病黄斑水肿(DME)的临床诊断中，主要依靠眼科医生检查彩色眼底图像。然而，专业眼科医生紧缺与偏远地区医疗环境不佳严重制约了筛查诊断的进程，人工实时分析更是难上加难。因此，有必要引入计算机辅助治疗减轻眼科医生负担、缩短检查时间，降低疾病不同等级对应的图片筛查的时间和人力成本。

为了解决这一问题，提出本发明的基于残差网络的图像分类方法的各个实施例。本发明提供的基于残差网络的图像分类方法通过构建图像分类模型进行图像分类，辅助医生诊断，减轻眼科医生负担、缩短检查时间，降低疾病不同等级对应的图片筛查的时间和人力成本。

本实施例提供了一种基于残差网络的图像分类方法，参照图1，如附图1所示为本发明提供的一种基于残差网络的图像分类方法的第一实施例的流程示意图。

本实施例中，一种基于残差网络的图像分类方法，包括以下步骤：

步骤S100，获取根据数据特征分类的数据集，并根据所述数据特征编写卷积神经网络所需的数据接口。

具体而言，在本实施例中，根据公开数据集Messidor和IDRiD的疾病分级标准与图像分辨率等数据特征，编写卷积神经网络所需的数据接口。其中，Messidor数据集是由2004年法国国防研究部资助的TECHNO-VISION研究项目建立的，囊括了三个眼科机构的1200幅彩色眼底图。该数据集将糖尿病视网膜病变程度分为4个等级(0-3)；根据黄斑中心区域附近的硬性渗出物的发生情况，将糖尿病性黄斑水肿的风险程度分为3个等级(0-2)。IDRiD(印度糖尿病视网膜病变图像数据集)数据集是2018年IEEE生物医学成像国际研讨会联合组织的“糖尿病视网膜病变：分割和分级挑战”竞赛的一部分，具有图像级标注信息的彩色眼底图共561幅。该数据集根据国际临床糖尿病视网膜病变量表，将糖尿病视网膜病变程度分为5个等级(0-4)；将糖尿病性黄斑水肿的风险程度分为3个等级(0-2)。

步骤S200，制作数据集标签，每一类不同数据特征的数据集对应一个数据集标签。

进一步地，本实施例采用的深度残差网络是全监督学习，因此在协同分级部分需要将两种疾病严重程度等级融合成统一的标签。对Messidor数据集中的糖尿病视网膜病变不同等级所对应的图像分成了两类，将糖尿病视网膜病变的0-1级重新编码为0，2-3级重新编码为1,糖尿病性黄斑水肿分级标准不变仍为0-2。

构造一个可以同时表示两种疾病不同等级所对应图像的六分类标签：0表示糖尿病视网膜0级，糖尿病性黄斑水肿0级的图像；1表示糖尿病视网膜0级，糖尿病性黄斑水肿1级的图像；2表示糖尿病视网膜0级，糖尿病性黄斑水肿2级的图像；3表示糖尿病视网膜1级，糖尿病性黄斑水肿0级的图像；4表示糖尿病视网膜1级，糖尿病性黄斑水肿1级的图像；5表示糖尿病视网膜1级，糖尿病性黄斑水肿2级的图像。

步骤S300，构建训练集和测试集，将数据集分割成若干等份，以实现在后续训练过程中使用留一交叉验证方法进行网络训练和网络测试。可选地，本实施例将数据集分割成十等份。

步骤S400，构建深层残差单元，搭建卷积神经网络，建立图像分类模型。参见图2，如附图2所示是本实施例提供的一种基于残差网络的图像分类方法中构建的图像分类模型结构示意图。

具体而言，首先构建深层残差单元，包括三个卷积层，三个批归一化层，两个激活函数层，通过短路连接将输入加到输出上，再经过一个激活函数层。其中三个卷积层卷积核尺寸分别是1*1，3*3，1*1。每个卷积层包含一个批归一化层，图中未示出。当短路连接输入输出维度不一致时，用一个1*1卷积层对输入升维，使输入输出的维度保持一致。

搭建前端卷积神经网络，网络的输入尺寸是224*224*3，接着一个卷积层，一个批归一化层，一个激活函数层和一个最大池化层；接下来是四个深层残差层，即卷积块2、卷积块3、卷积块4和卷积块5。每个残差层中的残差单元个数分别为3、4、6、3；最后为一个平均池化层。参见图3，如附图3所示是本实施例提供的一种基于残差网络的图像分类方法的图像分类模型中卷积块2的结构示意图。

其中，卷积层、最大池化层、平均池化层使用ImageNet预训练模型的参数。卷积层的卷积核尺寸是7*7，滤波器个数64，步长为2，补零为3；最大池化层卷积核尺寸为3*3，步长为2，补零为1；第一层深层残差层的输入尺寸为56*56*64，输出为56*56*256；第二层深层残差层的输出为28*28*512；第三层深层残差层的输出为14*14*1024；第四层深层残差层的输出为7*7*2048；平均池化层的卷积核尺寸为7*7。

搭建后端卷积神经网络，将前端网络输出降维；再分别输入两个分类器中，对应两种疾病，两个分类器均由一个全连接层组成，分别得到一个二分类结果和一个三分类结果。

步骤S500，对图像分类模型设置训练参数和损失函数策略，确定分类器输出的分类结果。

具体而言，设置训练参数及损失函数策略，网络优化器选择了Adam优化器，初始学习率为0.0003，采用余弦退火函数衰减学习率，设置训练时期为1000，批尺寸为40。二分类与三分类结果使用的损失函数为交叉熵损失函数，设置二分类结果损失函数为交叉熵损失函数L₁，三分类结果损失函数为交叉熵损失函数L₂。将二分类和三分类结果经过Softmax激活函数获得二分类结果和三分类结果对应的矩阵，再进行矩阵乘法，得到对应六分类标签的六分类结果。对六分类结果设置损失函数策略，本实施例对六分类结果使用的是感知标签分布边界损失函数L_LDAM，感知标签分布边界损失函数L_LDAM的表达式具体如下：

图像分类模型的总损失函数L＝L₁+L₂+L_LDAM。

使用LDAM损失函数代替交叉熵损失函数旨在解决数据分布存在的类不平衡问题。

需要说明的是，上述设置都是对网络训练来讲最优的选择，设置成其他的虽然也能够完成图像分类模型构建，但会造成网络性能下降。

步骤S600，采用留一交叉验证方法对图像分类模型进行网络训练和网络测试。使用步骤S200构建的测试集进行网络测试得到两个分类器的二分类和三分类结果即为不同程度的糖尿病视网膜病变和糖尿病性黄斑水肿的对应图像的分级分类结果。采用留一交叉验证方法可以增强图像分类模型的鲁棒性。

步骤S700，输入待分类的图像，能够获得图像分级分类的结果，用以辅助眼科医生的诊断，减轻眼科医生负担、缩短检查时间，降低疾病不同等级对应的图片筛查的时间和人力成本。

在本实施例中，基于残差网络构建图像分类模型，通过构建的图像分类模型实现对具有某些特定特征的图像的分类。同时，本实施例提供的基于残差网络的图像分类方法在对图像特征提取后，将输出的不同分类结果融合成一个总的预测结果。并将总的分类结果使用感知标签分布边界损失函数代替交叉熵损失函数，克服图像数据类别不均衡问题。

实施例2

参见图4，如附图4所示是本实施例提供的一种基于残差网络的图像分类装置的结构框图。

该装置具体包括：

接口编写模块10，用于获取根据数据特征分类的数据集，并根据所述数据特征编写卷积神经网络所需的数据接口；

标签制作模块20，用于制作数据集标签，每一类不同数据特征的数据集对应一个数据集标签；

训练集构建模块30，用于构建训练集和测试集，将数据集分割成若干等份；

模型建立模块40，用于构建深层残差单元，搭建卷积神经网络，建立图像分类模型；

模型训练模块50，用于对图像分类模型进行网络训练和网络测试；

分类结果输出模块60，用于向图像分类模型中输入待分类图像，获得分类结果。

作为一种实施方式，模型训练模块50采用留一交叉验证方法进行网络训练和网络测试。

作为一种实施方式，模型训练模块50，用于对图像分类模型进行网络训练和网络测试，具体为：选择网络优化器，初始化学习率；

设置衰减学习率策略并设置训练时期和批尺寸；

作为一种实施方式，模型训练模块50设置的衰减学习率策略采用余弦退火函数。

作为一种实施方式，模型训练模块50还对六分类结果设置损失函数策略，对六分类结果使用感知标签分布边界损失函数L_LDAM，

图像分类模型的总损失函数L＝L₁+L₂+L_LDAM。

作为一种实施方式，模型建立模块40构建的深层残差单元包括三个卷积层和两个激活函数层，每个卷积层还包含一个批归一化层，卷积层之间通过激活函数层连接；所述深层残差单元还通过短路连接将输入加到输出上，当短路连接输入输出维度不一致时，通过一个卷积层对输入升维。

作为一种实施方式，模型建立模块40搭建的卷积神经网络包括前端卷积神经网络和后端卷积神经网络；

本实施例提供的一种基于残差网络的图像分类装置，基于残差网络构建图像分类模型，通过构建的图像分类模型实现对具有某些特定特征的图像的分类。同时，本实施例提供的基于残差网络的图像分类方法在对图像特征提取后，将输出的不同分类结果融合成一个总的预测结果。并将总的分类结果使用感知标签分布边界损失函数代替交叉熵损失函数，克服图像数据类别不均衡问题。

实施例3

本优选实施例提供了一种计算机设备，该计算机设备可以实现本申请实施例所提供的基于残差网络的图像分类方法任一实施例中的步骤，因此，可以实现本申请实施例所提供的基于残差网络的图像分类方法的有益效果，详见前面的实施例，在此不再赘述。

实施例4

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。为此，本发明实施例提供一种存储介质，其中存储有多条指令，该指令能够被处理器进行加载，以执行本发明实施例所提供的基于残差网络的图像分类方法中任一实施例的步骤。

其中，该存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、磁盘或光盘等。

由于该存储介质中所存储的指令，可以执行本发明实施例所提供的任一基于残差网络的图像分类方法实施例中的步骤，因此，可以实现本发明实施例所提供的任一基于残差网络的图像分类方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于残差网络的图像分类方法，其特征在于，包括：

构建训练集和测试集，将数据集分割成若干等份；

对图像分类模型进行网络训练和网络测试；

向图像分类模型中输入待分类图像，获得分类结果。

2.如权利要求1所述的一种基于残差网络的图像分类方法，其特征在于，所述图像分类模型采用留一交叉验证方法进行网络训练和网络测试。

3.如权利要求1所述的一种基于残差网络的图像分类方法，其特征在于，所述分类器为两个，分类器输出的分类结果为一个二分类结果和一个三分类结果，所述设置训练参数和损失函数策略具体包括：

选择网络优化器，初始化学习率；

设置衰减学习率策略并设置训练时期和批尺寸；

4.如权利要求3所述的一种基于残差网络的图像分类方法，其特征在于，所述衰减学习率策略采用余弦退火函数。

5.如权利要求3所述的一种基于残差网络的图像分类方法，其特征在于，还包括对六分类结果设置损失函数策略，对六分类结果使用感知标签分布边界损失函数L_LDAM，

图像分类模型的总损失函数L＝L₁+L₂+L_LDAM。

6.如权利要求3所述的一种基于残差网络的图像分类方法，其特征在于，所述深层残差单元包括三个卷积层和两个激活函数层，每个卷积层还包含一个批归一化层，卷积层之间通过激活函数层连接；所述深层残差单元还通过短路连接将输入加到输出上，当短路连接输入输出维度不一致时，通过一个卷积层对输入升维。

7.如权利要求3所述的一种基于残差网络的图像分类方法，其特征在于，所述卷积神经网络包括前端卷积神经网络和后端卷积神经网络；

8.一种基于残差网络的图像分类装置，其特征在于，包括：

9.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有计算机程序，所述计算机程序由所述处理器加载并执行以实现如权利要求1至7任一项所述的基于残差网络的图像分类方法。

10.一种计算机可读存储介质，其特征在于，所述存储介质中存储有计算机程序，所述计算机程序由处理器加载并执行以实现如权利要求1至7任一项所述的基于残差网络的图像分类方法。