CN113887662A - 一种基于残差网络的图像分类方法、装置、设备及介质 - Google Patents

一种基于残差网络的图像分类方法、装置、设备及介质 Download PDF

Info

Publication number
CN113887662A
CN113887662A CN202111244501.0A CN202111244501A CN113887662A CN 113887662 A CN113887662 A CN 113887662A CN 202111244501 A CN202111244501 A CN 202111244501A CN 113887662 A CN113887662 A CN 113887662A
Authority
CN
China
Prior art keywords
network
image classification
layer
data set
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111244501.0A
Other languages
English (en)
Inventor
许廷发
肖予泽
李佳男
黄诗淇
沈宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Chongqing Innovation Center of Beijing University of Technology
Original Assignee
Beijing Institute of Technology BIT
Chongqing Innovation Center of Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT, Chongqing Innovation Center of Beijing University of Technology filed Critical Beijing Institute of Technology BIT
Priority to CN202111244501.0A priority Critical patent/CN113887662A/zh
Publication of CN113887662A publication Critical patent/CN113887662A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于残差网络的图像分类方法、装置、设备及介质,该方法包括获取根据数据特征分类的数据集,并根据所述数据特征编写卷积神经网络所需的数据接口;制作数据集标签,每一类不同数据特征的数据集对应一个数据集标签;构建训练集和测试集,将数据集分割成若干等份;构建深层残差单元,搭建卷积神经网络,建立图像分类模型;对图像分类模型设置训练参数和损失函数策略,确定分类器输出的分类结果;对图像分类模型进行网络训练和网络测试;向图像分类模型中输入待分类图像,获得分类结果。本发明通过构建图像分类模型辅助医生诊断,减轻眼科医生负担、缩短检查时间,降低疾病不同等级对应的图片筛查的时间和人力成本。

Description

一种基于残差网络的图像分类方法、装置、设备及介质
技术领域
本发明属于图像处理技术领域,尤其涉及一种基于残差网络的图像分类方法、装置、设备及介质。
背景技术
图像分类在多个领域中均有广泛的应用,深度学习算法是目前最常用的自动图像处理方法。卷积神经网络(CNN)是深度学习算法中一种以端到端的方式进行特征提取的方法,不仅在目标检测、语义分割,也在医学领域得到了广泛应用。残差网络可以有效解决随着网络深度加深带来的梯度消失的问题。
以医学领域为例,糖尿病视网膜病变(DR)是一种多发的长病程糖尿病引发的并发症,是世界工作年龄人口失明和视力残疾的最常见原因。血糖水平升高会影响到视网膜血管,血管改变的表现包括:微血管瘤、视网膜内点状或斑片状出血、硬渗出物、神经纤维梗阻(棉绒斑)、局部毛细血管无灌注,严重甚至会出现新生血管。
糖尿病黄斑水肿(DME)是一种与糖尿病视网膜病变息息相关,可能出现在糖尿病视网膜病变任何阶段的疾病。DME的主要表征为:视网膜增厚,可表现为局部的或弥漫性;黄斑附近区域有或无硬性渗出,以及囊样水肿。
由上述可知,两种疾病均可在图像上体现不同的特征。临床诊断中,DR和DME筛查主要依靠眼科医生检查彩色眼底图像。然而,专业眼科医生紧缺与偏远地区医疗环境不佳严重制约了筛查诊断的进程,人工实时分析更是难上加难。因此,有必要引入计算机辅助治疗减轻眼科医生负担、缩短检查时间,降低疾病不同等级对应的图片筛查的时间和人力成本。
发明内容
本发明的目的在于,为克服现有技术缺陷,提供了一种基于残差网络的图像分类方法、装置、设备及介质,旨在解决目前基于残差网络的图像分类过程中,无法按照需求对图像进行分级分类的技术问题。
本发明目的通过下述技术方案来实现:
为实现上述目的,本发明提供一种基于残差网络的图像分类方法,该方法包括以下步骤:
获取根据数据特征分类的数据集,并根据所述数据特征编写卷积神经网络所需的数据接口;
制作数据集标签,每一类不同数据特征的数据集对应一个数据集标签;
构建训练集和测试集,将数据集分割成若干等份;
构建深层残差单元,搭建卷积神经网络,建立图像分类模型;所述卷积神经网络输出端连接至少两个分类器;
对图像分类模型设置训练参数和损失函数策略,确定分类器输出的分类结果;
对图像分类模型进行网络训练和网络测试;
向图像分类模型中输入待分类图像,获得分类结果。
进一步的,所述图像分类模型采用留一交叉验证方法进行网络训练和网络测试。
进一步的,所述分类器为两个,分类器输出的分类结果为一个二分类结果和一个三分类结果,所述设置训练参数和损失函数策略具体包括:
选择网络优化器,初始化学习率;
设置衰减学习率策略并设置训练时期和批尺寸;
设置二分类结果损失函数为交叉熵损失函数L1,三分类结果损失函数为交叉熵损失函数L2
设置二分类结果和三分类结果的激活函数和矩阵乘法,使图像分类模型输出为六分类结果。
进一步的,所述衰减学习率策略采用余弦退火函数。
进一步的,还包括对六分类结果设置损失函数策略,对六分类结果使用感知标签分布边界损失函数LLDAM
Figure BDA0003320386490000031
其中,x是输入,y是x对应的类别,f是网络模型,zj=f(x)j是第j类的输出,边界
Figure BDA0003320386490000032
C是不平衡比率,即最频繁和最不频繁的类的样本大小之间的比率;
图像分类模型的总损失函数L=L1+L2+LLDAM
进一步的,所述深层残差单元包括三个卷积层和两个激活函数层,每个卷积层还包含一个批归一化层,卷积层之间通过激活函数层连接;所述深层残差单元还通过短路连接将输入加到输出上,当短路连接输入输出维度不一致时,通过一个卷积层对输入升维。
进一步的,所述卷积神经网络包括前端卷积神经网络和后端卷积神经网络;
前端卷积神经网络包括一个卷积层,卷积层包括一个批归一化层,卷积层通过激活函数层与最大池化层连接,最大池化层和深层残差层连接,深层残差层与平均池化层连接;
后端卷积神经网络将前端网络输出降维,包括作为分类器的全连接层。
另一方面,本发明还提供了一种基于残差网络的图像分类装置,所述装置包括:
接口编写模块,用于获取根据数据特征分类的数据集,并根据所述数据特征编写卷积神经网络所需的数据接口;
标签制作模块,用于制作数据集标签,每一类不同数据特征的数据集对应一个数据集标签;
训练集构建模块,用于构建训练集和测试集,将数据集分割成若干等份;
模型建立模块,用于构建深层残差单元,搭建卷积神经网络,建立图像分类模型;
模型训练模块,用于对图像分类模型进行网络训练和网络测试;
分类结果输出模块,用于向图像分类模型中输入待分类图像,获得分类结果。
可选的,模型训练模块采用留一交叉验证方法进行网络训练和网络测试。
可选的,模型训练模块,用于对图像分类模型进行网络训练和网络测试,具体为:选择网络优化器,初始化学习率;
设置衰减学习率策略并设置训练时期和批尺寸;
设置二分类结果损失函数为交叉熵损失函数L1,三分类结果损失函数为交叉熵损失函数L2
设置二分类结果和三分类结果的激活函数和矩阵乘法,使图像分类模型输出为六分类结果。
可选的,模型训练模块设置的衰减学习率策略采用余弦退火函数。
可选的,模型训练模块还对六分类结果设置损失函数策略,对六分类结果使用感知标签分布边界损失函数LLDAM
Figure BDA0003320386490000051
其中,x是输入,y是x对应的类别,f是网络模型,zj=f(x)j是第j类的输出,边界
Figure BDA0003320386490000052
C是不平衡比率,即最频繁和最不频繁的类的样本大小之间的比率;
图像分类模型的总损失函数L=L1+L2+LLDAM
可选的,模型建立模块构建的深层残差单元包括三个卷积层和两个激活函数层,每个卷积层还包含一个批归一化层,卷积层之间通过激活函数层连接;所述深层残差单元还通过短路连接将输入加到输出上,当短路连接输入输出维度不一致时,通过一个卷积层对输入升维。
可选的,模型建立模块搭建的卷积神经网络包括前端卷积神经网络和后端卷积神经网络;
前端卷积神经网络包括一个卷积层,卷积层包括一个批归一化层,卷积层通过激活函数层与最大池化层连接,最大池化层和深层残差层连接,深层残差层与平均池化层连接;
后端卷积神经网络将前端网络输出降维,包括作为分类器的全连接层。
另一方面,本申请提供了一种计算机设备,计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现上述的任意一种基于残差网络的图像分类方法。
另一方面,本申请提供了一种计算机可读存储介质,所述存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现上述的任意一种基于残差网络的图像分类方法。
本发明的有益效果在于:
(1)本发明通过构建图像分类模型实现对具有某些特定特征的图像的分类,辅助医生诊断,减轻眼科医生负担、缩短检查时间,降低疾病不同等级对应的图片筛查的时间和人力成本。
(2)由于图像数据存在类别不均衡的问题,普遍在数量较少的类别,即尾类,表现较差。而这些类别有时候是不可忽视的一部分。本发明在对图像特征提取后,将输出的不同分类结果融合成一个总的预测结果。并将总的分类结果使用感知标签分布边界损失函数代替交叉熵损失函数,克服图像数据类别不均衡问题。
附图说明
图1是本发明实施例一提供的一种基于残差网络的图像分类方法的流程示意图;
图2是本发明实施例一提供的一种基于残差网络的图像分类方法中构建的图像分类模型结构示意图;
图3是本发明实施例一提供的一种基于残差网络的图像分类方法的图像分类模型中卷积块2的结构示意图;
图4是本发明实施例二提供的一种基于残差网络的图像分类装置的结构框图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
当前,糖尿病视网膜病变(DR)和糖尿病黄斑水肿(DME)的临床诊断中,主要依靠眼科医生检查彩色眼底图像。然而,专业眼科医生紧缺与偏远地区医疗环境不佳严重制约了筛查诊断的进程,人工实时分析更是难上加难。因此,有必要引入计算机辅助治疗减轻眼科医生负担、缩短检查时间,降低疾病不同等级对应的图片筛查的时间和人力成本。
为了解决这一问题,提出本发明的基于残差网络的图像分类方法的各个实施例。本发明提供的基于残差网络的图像分类方法通过构建图像分类模型进行图像分类,辅助医生诊断,减轻眼科医生负担、缩短检查时间,降低疾病不同等级对应的图片筛查的时间和人力成本。
本实施例提供了一种基于残差网络的图像分类方法,参照图1,如附图1所示为本发明提供的一种基于残差网络的图像分类方法的第一实施例的流程示意图。
本实施例中,一种基于残差网络的图像分类方法,包括以下步骤:
步骤S100,获取根据数据特征分类的数据集,并根据所述数据特征编写卷积神经网络所需的数据接口。
具体而言,在本实施例中,根据公开数据集Messidor和IDRiD的疾病分级标准与图像分辨率等数据特征,编写卷积神经网络所需的数据接口。其中,Messidor数据集是由2004年法国国防研究部资助的TECHNO-VISION研究项目建立的,囊括了三个眼科机构的1200幅彩色眼底图。该数据集将糖尿病视网膜病变程度分为4个等级(0-3);根据黄斑中心区域附近的硬性渗出物的发生情况,将糖尿病性黄斑水肿的风险程度分为3个等级(0-2)。IDRiD(印度糖尿病视网膜病变图像数据集)数据集是2018年IEEE生物医学成像国际研讨会联合组织的“糖尿病视网膜病变:分割和分级挑战”竞赛的一部分,具有图像级标注信息的彩色眼底图共561幅。该数据集根据国际临床糖尿病视网膜病变量表,将糖尿病视网膜病变程度分为5个等级(0-4);将糖尿病性黄斑水肿的风险程度分为3个等级(0-2)。
步骤S200,制作数据集标签,每一类不同数据特征的数据集对应一个数据集标签。
进一步地,本实施例采用的深度残差网络是全监督学习,因此在协同分级部分需要将两种疾病严重程度等级融合成统一的标签。对Messidor数据集中的糖尿病视网膜病变不同等级所对应的图像分成了两类,将糖尿病视网膜病变的0-1级重新编码为0,2-3级重新编码为1,糖尿病性黄斑水肿分级标准不变仍为0-2。
构造一个可以同时表示两种疾病不同等级所对应图像的六分类标签:0表示糖尿病视网膜0级,糖尿病性黄斑水肿0级的图像;1表示糖尿病视网膜0级,糖尿病性黄斑水肿1级的图像;2表示糖尿病视网膜0级,糖尿病性黄斑水肿2级的图像;3表示糖尿病视网膜1级,糖尿病性黄斑水肿0级的图像;4表示糖尿病视网膜1级,糖尿病性黄斑水肿1级的图像;5表示糖尿病视网膜1级,糖尿病性黄斑水肿2级的图像。
步骤S300,构建训练集和测试集,将数据集分割成若干等份,以实现在后续训练过程中使用留一交叉验证方法进行网络训练和网络测试。可选地,本实施例将数据集分割成十等份。
步骤S400,构建深层残差单元,搭建卷积神经网络,建立图像分类模型。参见图2,如附图2所示是本实施例提供的一种基于残差网络的图像分类方法中构建的图像分类模型结构示意图。
具体而言,首先构建深层残差单元,包括三个卷积层,三个批归一化层,两个激活函数层,通过短路连接将输入加到输出上,再经过一个激活函数层。其中三个卷积层卷积核尺寸分别是1*1,3*3,1*1。每个卷积层包含一个批归一化层,图中未示出。当短路连接输入输出维度不一致时,用一个1*1卷积层对输入升维,使输入输出的维度保持一致。
搭建前端卷积神经网络,网络的输入尺寸是224*224*3,接着一个卷积层,一个批归一化层,一个激活函数层和一个最大池化层;接下来是四个深层残差层,即卷积块2、卷积块3、卷积块4和卷积块5。每个残差层中的残差单元个数分别为3、4、6、3;最后为一个平均池化层。参见图3,如附图3所示是本实施例提供的一种基于残差网络的图像分类方法的图像分类模型中卷积块2的结构示意图。
其中,卷积层、最大池化层、平均池化层使用ImageNet预训练模型的参数。卷积层的卷积核尺寸是7*7,滤波器个数64,步长为2,补零为3;最大池化层卷积核尺寸为3*3,步长为2,补零为1;第一层深层残差层的输入尺寸为56*56*64,输出为56*56*256;第二层深层残差层的输出为28*28*512;第三层深层残差层的输出为14*14*1024;第四层深层残差层的输出为7*7*2048;平均池化层的卷积核尺寸为7*7。
搭建后端卷积神经网络,将前端网络输出降维;再分别输入两个分类器中,对应两种疾病,两个分类器均由一个全连接层组成,分别得到一个二分类结果和一个三分类结果。
步骤S500,对图像分类模型设置训练参数和损失函数策略,确定分类器输出的分类结果。
具体而言,设置训练参数及损失函数策略,网络优化器选择了Adam优化器,初始学习率为0.0003,采用余弦退火函数衰减学习率,设置训练时期为1000,批尺寸为40。二分类与三分类结果使用的损失函数为交叉熵损失函数,设置二分类结果损失函数为交叉熵损失函数L1,三分类结果损失函数为交叉熵损失函数L2。将二分类和三分类结果经过Softmax激活函数获得二分类结果和三分类结果对应的矩阵,再进行矩阵乘法,得到对应六分类标签的六分类结果。对六分类结果设置损失函数策略,本实施例对六分类结果使用的是感知标签分布边界损失函数LLDAM,感知标签分布边界损失函数LLDAM的表达式具体如下:
Figure BDA0003320386490000111
其中,x是输入,y是x对应的类别,f是网络模型,zj=f(x)j是第j类的输出,边界
Figure BDA0003320386490000112
C是不平衡比率,即最频繁和最不频繁的类的样本大小之间的比率;
图像分类模型的总损失函数L=L1+L2+LLDAM
使用LDAM损失函数代替交叉熵损失函数旨在解决数据分布存在的类不平衡问题。
需要说明的是,上述设置都是对网络训练来讲最优的选择,设置成其他的虽然也能够完成图像分类模型构建,但会造成网络性能下降。
步骤S600,采用留一交叉验证方法对图像分类模型进行网络训练和网络测试。使用步骤S200构建的测试集进行网络测试得到两个分类器的二分类和三分类结果即为不同程度的糖尿病视网膜病变和糖尿病性黄斑水肿的对应图像的分级分类结果。采用留一交叉验证方法可以增强图像分类模型的鲁棒性。
步骤S700,输入待分类的图像,能够获得图像分级分类的结果,用以辅助眼科医生的诊断,减轻眼科医生负担、缩短检查时间,降低疾病不同等级对应的图片筛查的时间和人力成本。
在本实施例中,基于残差网络构建图像分类模型,通过构建的图像分类模型实现对具有某些特定特征的图像的分类。同时,本实施例提供的基于残差网络的图像分类方法在对图像特征提取后,将输出的不同分类结果融合成一个总的预测结果。并将总的分类结果使用感知标签分布边界损失函数代替交叉熵损失函数,克服图像数据类别不均衡问题。
实施例2
参见图4,如附图4所示是本实施例提供的一种基于残差网络的图像分类装置的结构框图。
该装置具体包括:
接口编写模块10,用于获取根据数据特征分类的数据集,并根据所述数据特征编写卷积神经网络所需的数据接口;
标签制作模块20,用于制作数据集标签,每一类不同数据特征的数据集对应一个数据集标签;
训练集构建模块30,用于构建训练集和测试集,将数据集分割成若干等份;
模型建立模块40,用于构建深层残差单元,搭建卷积神经网络,建立图像分类模型;
模型训练模块50,用于对图像分类模型进行网络训练和网络测试;
分类结果输出模块60,用于向图像分类模型中输入待分类图像,获得分类结果。
作为一种实施方式,模型训练模块50采用留一交叉验证方法进行网络训练和网络测试。
作为一种实施方式,模型训练模块50,用于对图像分类模型进行网络训练和网络测试,具体为:选择网络优化器,初始化学习率;
设置衰减学习率策略并设置训练时期和批尺寸;
设置二分类结果损失函数为交叉熵损失函数L1,三分类结果损失函数为交叉熵损失函数L2
设置二分类结果和三分类结果的激活函数和矩阵乘法,使图像分类模型输出为六分类结果。
作为一种实施方式,模型训练模块50设置的衰减学习率策略采用余弦退火函数。
作为一种实施方式,模型训练模块50还对六分类结果设置损失函数策略,对六分类结果使用感知标签分布边界损失函数LLDAM
Figure BDA0003320386490000131
其中,x是输入,y是x对应的类别,f是网络模型,zj=f(x)j是第j类的输出,边界
Figure BDA0003320386490000132
C是不平衡比率,即最频繁和最不频繁的类的样本大小之间的比率;
图像分类模型的总损失函数L=L1+L2+LLDAM
作为一种实施方式,模型建立模块40构建的深层残差单元包括三个卷积层和两个激活函数层,每个卷积层还包含一个批归一化层,卷积层之间通过激活函数层连接;所述深层残差单元还通过短路连接将输入加到输出上,当短路连接输入输出维度不一致时,通过一个卷积层对输入升维。
作为一种实施方式,模型建立模块40搭建的卷积神经网络包括前端卷积神经网络和后端卷积神经网络;
前端卷积神经网络包括一个卷积层,卷积层包括一个批归一化层,卷积层通过激活函数层与最大池化层连接,最大池化层和深层残差层连接,深层残差层与平均池化层连接;
后端卷积神经网络将前端网络输出降维,包括作为分类器的全连接层。
本实施例提供的一种基于残差网络的图像分类装置,基于残差网络构建图像分类模型,通过构建的图像分类模型实现对具有某些特定特征的图像的分类。同时,本实施例提供的基于残差网络的图像分类方法在对图像特征提取后,将输出的不同分类结果融合成一个总的预测结果。并将总的分类结果使用感知标签分布边界损失函数代替交叉熵损失函数,克服图像数据类别不均衡问题。
实施例3
本优选实施例提供了一种计算机设备,该计算机设备可以实现本申请实施例所提供的基于残差网络的图像分类方法任一实施例中的步骤,因此,可以实现本申请实施例所提供的基于残差网络的图像分类方法的有益效果,详见前面的实施例,在此不再赘述。
实施例4
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。为此,本发明实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的基于残差网络的图像分类方法中任一实施例的步骤。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本发明实施例所提供的任一基于残差网络的图像分类方法实施例中的步骤,因此,可以实现本发明实施例所提供的任一基于残差网络的图像分类方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于残差网络的图像分类方法,其特征在于,包括:
获取根据数据特征分类的数据集,并根据所述数据特征编写卷积神经网络所需的数据接口;
制作数据集标签,每一类不同数据特征的数据集对应一个数据集标签;
构建训练集和测试集,将数据集分割成若干等份;
构建深层残差单元,搭建卷积神经网络,建立图像分类模型;所述卷积神经网络输出端连接至少两个分类器;
对图像分类模型设置训练参数和损失函数策略,确定分类器输出的分类结果;
对图像分类模型进行网络训练和网络测试;
向图像分类模型中输入待分类图像,获得分类结果。
2.如权利要求1所述的一种基于残差网络的图像分类方法,其特征在于,所述图像分类模型采用留一交叉验证方法进行网络训练和网络测试。
3.如权利要求1所述的一种基于残差网络的图像分类方法,其特征在于,所述分类器为两个,分类器输出的分类结果为一个二分类结果和一个三分类结果,所述设置训练参数和损失函数策略具体包括:
选择网络优化器,初始化学习率;
设置衰减学习率策略并设置训练时期和批尺寸;
设置二分类结果损失函数为交叉熵损失函数L1,三分类结果损失函数为交叉熵损失函数L2
设置二分类结果和三分类结果的激活函数和矩阵乘法,使图像分类模型输出为六分类结果。
4.如权利要求3所述的一种基于残差网络的图像分类方法,其特征在于,所述衰减学习率策略采用余弦退火函数。
5.如权利要求3所述的一种基于残差网络的图像分类方法,其特征在于,还包括对六分类结果设置损失函数策略,对六分类结果使用感知标签分布边界损失函数LLDAM
Figure FDA0003320386480000021
其中,x是输入,y是x对应的类别,f是网络模型,zj=f(x)j是第j类的输出,边界
Figure FDA0003320386480000022
C是不平衡比率,即最频繁和最不频繁的类的样本大小之间的比率;
图像分类模型的总损失函数L=L1+L2+LLDAM
6.如权利要求3所述的一种基于残差网络的图像分类方法,其特征在于,所述深层残差单元包括三个卷积层和两个激活函数层,每个卷积层还包含一个批归一化层,卷积层之间通过激活函数层连接;所述深层残差单元还通过短路连接将输入加到输出上,当短路连接输入输出维度不一致时,通过一个卷积层对输入升维。
7.如权利要求3所述的一种基于残差网络的图像分类方法,其特征在于,所述卷积神经网络包括前端卷积神经网络和后端卷积神经网络;
前端卷积神经网络包括一个卷积层,卷积层包括一个批归一化层,卷积层通过激活函数层与最大池化层连接,最大池化层和深层残差层连接,深层残差层与平均池化层连接;
后端卷积神经网络将前端网络输出降维,包括作为分类器的全连接层。
8.一种基于残差网络的图像分类装置,其特征在于,包括:
接口编写模块,用于获取根据数据特征分类的数据集,并根据所述数据特征编写卷积神经网络所需的数据接口;
标签制作模块,用于制作数据集标签,每一类不同数据特征的数据集对应一个数据集标签;
训练集构建模块,用于构建训练集和测试集,将数据集分割成若干等份;
模型建立模块,用于构建深层残差单元,搭建卷积神经网络,建立图像分类模型;
模型训练模块,用于对图像分类模型进行网络训练和网络测试;
分类结果输出模块,用于向图像分类模型中输入待分类图像,获得分类结果。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如权利要求1至7任一项所述的基于残差网络的图像分类方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现如权利要求1至7任一项所述的基于残差网络的图像分类方法。
CN202111244501.0A 2021-10-26 2021-10-26 一种基于残差网络的图像分类方法、装置、设备及介质 Pending CN113887662A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111244501.0A CN113887662A (zh) 2021-10-26 2021-10-26 一种基于残差网络的图像分类方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111244501.0A CN113887662A (zh) 2021-10-26 2021-10-26 一种基于残差网络的图像分类方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN113887662A true CN113887662A (zh) 2022-01-04

Family

ID=79014182

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111244501.0A Pending CN113887662A (zh) 2021-10-26 2021-10-26 一种基于残差网络的图像分类方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN113887662A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116701917A (zh) * 2023-07-28 2023-09-05 电子科技大学 一种基于生理信号的开放集情感识别方法
CN116796818A (zh) * 2022-03-15 2023-09-22 生物岛实验室 模型训练方法、装置、设备、存储介质及程序产品
CN117830637A (zh) * 2024-03-04 2024-04-05 中国人民解放军火箭军工程大学 一种视觉语义分割方法、系统、电子设备及介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116796818A (zh) * 2022-03-15 2023-09-22 生物岛实验室 模型训练方法、装置、设备、存储介质及程序产品
CN116796818B (zh) * 2022-03-15 2024-05-10 生物岛实验室 模型训练方法、装置、设备、存储介质及程序产品
CN116701917A (zh) * 2023-07-28 2023-09-05 电子科技大学 一种基于生理信号的开放集情感识别方法
CN116701917B (zh) * 2023-07-28 2023-10-20 电子科技大学 一种基于生理信号的开放集情感识别方法
CN117830637A (zh) * 2024-03-04 2024-04-05 中国人民解放军火箭军工程大学 一种视觉语义分割方法、系统、电子设备及介质
CN117830637B (zh) * 2024-03-04 2024-05-28 中国人民解放军火箭军工程大学 一种视觉语义分割方法、系统、电子设备及介质

Similar Documents

Publication Publication Date Title
CN107358606B (zh) 用于识别糖尿病视网膜病变的人工神经网络装置及系统装置
Sheng et al. An overview of artificial intelligence in diabetic retinopathy and other ocular diseases
CN107423571B (zh) 基于眼底图像的糖尿病视网膜病变识别系统
WO2022166399A1 (zh) 基于双模态深度学习的眼底疾病辅助诊断方法和装置
CN113887662A (zh) 一种基于残差网络的图像分类方法、装置、设备及介质
Lv et al. Deep learning algorithm for automated detection of polycystic ovary syndrome using scleral images
CN109464120A (zh) 一种糖尿病视网膜病变筛查方法、装置及存储介质
Bao et al. Current application of digital diagnosing systems for retinopathy of prematurity
CN112869697A (zh) 同时识别糖尿病视网膜病变的分期和病变特征的判断方法
Liu Construction and verification of color fundus image retinal vessels segmentation algorithm under BP neural network
Phridviraj et al. A bi-directional Long Short-Term Memory-based Diabetic Retinopathy detection model using retinal fundus images
Zhang et al. Artificial intelligence technology for myopia challenges: a review
Triyadi et al. Deep learning in image classification using vgg-19 and residual networks for cataract detection
Guefrachi et al. Automated diabetic retinopathy screening using deep learning
CN117314935A (zh) 基于扩散模型的低质量眼底图像的增强及分割方法及系统
Mani et al. An automated hybrid decoupled convolutional network for laceration segmentation and grading of retinal diseases using optical coherence tomography (OCT) images
Rajarajeswari et al. Simulation of diabetic retinopathy utilizing convolutional neural networks
CN115170492A (zh) 一种基于ai技术的白内障患者术后视力智能预测评估系统
Akyol et al. A decision support system for early-stage diabetic retinopathy lesions
Hsu et al. A comprehensive study of age-related macular degeneration detection
Mali et al. A systematic review of detection of diabetic retinopathy using machine learning approach
Li et al. Retinal OCT image classification based on domain adaptation convolutional neural networks
Tejashwini et al. An explainable ai model for diabetic retinopathy detection
Alaeddini A Review on Machine Learning Methods in Diabetic Retinopathy Detection
CN115424084B (zh) 基于类别加权网络的眼底照片分类方法与装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination