CN111476283A - 基于迁移学习的青光眼眼底图像识别方法 - Google Patents

基于迁移学习的青光眼眼底图像识别方法 Download PDF

Info

Publication number
CN111476283A
CN111476283A CN202010243234.4A CN202010243234A CN111476283A CN 111476283 A CN111476283 A CN 111476283A CN 202010243234 A CN202010243234 A CN 202010243234A CN 111476283 A CN111476283 A CN 111476283A
Authority
CN
China
Prior art keywords
data set
glaucoma
model
training
vggnet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010243234.4A
Other languages
English (en)
Inventor
汪毅
徐志京
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Maritime University
Original Assignee
Shanghai Maritime University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Maritime University filed Critical Shanghai Maritime University
Priority to CN202010243234.4A priority Critical patent/CN111476283A/zh
Publication of CN111476283A publication Critical patent/CN111476283A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明披露一种基于迁移学习的青光眼眼底图像识别方法,包括以下步骤:1、获取青光眼数据集,并对青光眼眼底图像进行预处理;2、构建卷积神经网络R‑VGGNet;3、将预处理后的训练数据集加载到R‑VGGNet卷积神经网络模型中进行模型的迭代训练和特征提取;4、将提取到的特征输入softmax分类器,完成对青光眼的分类识别,得到最终的识别模型;5、载入测试数据集到最终的识别模型中,输出对应的分类准确率。本发明引入迁移学习思想,利用VGG16网络在ImageNet数据集上的训练所获得的权重参数,冻结前13层并释放后3层的权重,利用青光眼数据集训练全连接层和Softmax分类器,微调后进行特征提取和分类;满足深度学习要求,有效提高了青光眼眼底图像的识别率。

Description

基于迁移学习的青光眼眼底图像识别方法
技术领域
本发明涉及眼睛疾病图像识别,具体为一种基于迁移学习的青光眼眼底图像识别方法。
背景技术
青光眼是一种慢性、渐进性视觉损伤的眼科疾病,其主要病理特征为视网膜神经节细胞(Retinal Ganglion Cells,RGC)的凋亡和轴突的丧失,从而导致视力逐渐下降甚至失明,严重威胁患者的健康。由于该病具有较高的隐蔽性,患病初期不易被发现,导致患者得不到及时的治疗。数字眼底图像(DFI)是目前检测青光眼的主要工具之一,因而可以利用眼底图像对青光眼进行前期检测,以免病情的进一步恶化。但眼底图像结构性复杂,采用人工识别方法耗时费力且很难得到客观准确的医疗诊断,近年来,随着深度学习的发展,可应用到图像识别领域,因此很多学者尝试采用人工智能技术对眼底图像进行患者筛查。
2017年丁蓬莉等人提出基于紧凑的神经网络CompactNet对视网膜图像进行识别分类,但由于实验样本有限,网络在训练的过程中并没有充分提取到相关特征,因此分类准确率并不高。T.Balasubramanian等人利用方向梯度直方图(HOG)进行提取特征,并结合支持向量机(SVM)实现对青光眼的分类,但该方法预处理步骤过于繁琐,并且识别准确率并不高。U Raghavendra等人提出一种利用深度学习技术准确检测青光眼的新型计算机辅助诊断(CAD)系统,设计一个18层的卷积神经网络,经过有效训练提取特征之后进行测试分类,虽然识别率较高,但训练样本达到了几千张,在缺乏大量青光眼眼底图像的前提下,其实用价值并不高。
发明内容
为了解决现有技术的缺陷,本发明采用迁移学习策略,解决小样本学习能力不足,分类精度低的问题,提高小样本下青光眼患者的识别率。
一般来说,训练一个神经网络需要大量的样本,而目前在医学领域却缺乏大型公开已标记的数据集。在没有足够多训练样本的情况下,如果网络足够深,可能网络在训练过程中会不收敛或者训练出来的模型泛化能力差。而如果采用浅层的神经网络,网络在训练的过程中又不能够充分提取到相关特征,从而导致分类精度不高等问题。为了解决上述问题,本发明借助迁移学习思想,将VGG16网络在ImageNet数据集上预训练得到的模型迁移到青光眼眼底图像识别任务中,迁移学习相对于传统的神经网络主要的优势在于不需要大量的训练样本。
采用改进后的卷积神经网络R-VGGNet完成识别模型的训练与特征提取,减少网络训练参数,提高识别率。
现有的VGG结构采用三层连接的全连接层,这三层全连接层占了训练参数的绝大部分,对于本发明来说,识别任务仅仅只有两类,即识别健康人和青光眼患者的眼底图像,三层的全连接层相对冗余,因此,对VGG16全连接层进行了重新设计,即R-VGGNet,提出用2个全连接层替换原有的3个全连接层,其中设置第1个全连接层输出神经元个数为1024个,第2个全连接层输出神经元个数为2个,这样得到的网络相对于之前的网络,训练参数大大减少,提升了网络的训练速度,训练时间也得到缩短。
将提取ROI后的子图像作为识别模型的输入,降低了CNN网络训练和分类的信息处理量,加快识别速度。
眼底图像是诊断青光眼的重要依据,研究表明:青光眼患者具有三大特征,其中一大特征为:青光眼患者的视杯面积与视盘面积之比一般大于0.6,即杯盘比(CDR>0.6)。同时,为了缩短网络处理时间,可以将更小的初始图像作为网络的输入。基于上述两点原因,本发明将ROI(Region Of Interest)区域作为深度卷积神经网络的输入。
本发明的技术方案如下:
一种基于迁移学习的青光眼眼底图像识别方法,包括以下步骤:
S1、获取青光眼数据集,并对青光眼眼底图像进行预处理,以达到训练模型要求。
S2、构建卷积神经网络R-VGGNet;
S3、将预处理后的训练数据集加载到R-VGGNet卷积神经网络模型中进行模型的迭代训练和特征提取;
S4、将提取到的特征输入softmax分类器,完成对青光眼的分类识别,得到最终的识别模型。
S5、载入测试数据集到最终的识别模型中,输出对应的分类准确率。
所述S1中对青光眼眼底图像进行预处理包括如下步骤:
S101、删除污染严重,无使用价值的图像。由于获取的数据集中存在极少数无任何纹理信息的眼底图像,无使用价值,所以需要将其剔除;
S102、对数据集进行标注,分为健康人的眼底图像和青光眼患者的眼底图像;
S103、对获取的眼底图像进行裁剪,去除多余的图像背景。为了减小多余背景对实验产生的干扰,需要去除图像黑框部分。
S104、去除图像的噪声。由于图像采集时光照因素的影响,对于一些曝光不足的图像进行直方图均匀化,改善由光线引起的噪声问题。
S105、提取ROI。采用python的pillow库中crop操作,设定固定的裁剪区域(视盘和视杯部分),将所有图像的尺寸都裁剪为224x224,作为卷积神经网络的输入。
S106、为了进一步扩充数据集,采用数据增强手段。在原数据集的基础上采取平移(水平、竖直两个方向)、旋转(30°、60°、90°、180°)、比例缩放、翻转等方法,实现对样本的扩充。这些变换的目标是生成更多样本以创建更大的数据集,防止过度拟合。同时,本研究所采用的数据集还存在正负样本分布不均衡的情况,所以,需要对负样本进行适当扩充,从而解决样本不均衡问题。
S107、构建训练数据集和验证数据集。将数据集按照样本比例为9:1分成训练集与测试集两部分。
所述S2构建卷积神经网络R-VGGNet包括如下步骤:
S201、卷积神经网络R-VGGNet是基于VGG16卷积神经网络改进而来的,对其中起到分类器作用的全连接层进行了重新设计,用2个全连接层替换原有的3个全连接层。
设计一个完整的卷积神经网络,其最后部分往往会连接若干全连接层,这是因为全连接层能够将网络提取到的特征映射到样本的标记空间中,因此,全连接层在整个卷积神经网络中实际上起到了“分类器”的作用。该分类器设置了两个全连接层Fc1和Fc2,由于实验样本有限,为了避免过拟合现象的发生,在全连接层之后加入Dropout层,并且设置Dropout率为0.5。同时在每个全连接层之后引入线性修正单元(Relu),用来解决梯度弥散问题。
S202、设置第1个全连接层输出神经元个数为1024个,第2个全连接层输出神经元个数为2个。将VGG16原有模型中第1个全连接层输出神经元个数为4096设置成1024,同时将包含1000个节点的Softmax层用一个包含2个节点的Softmax层代替。
所述S3将预处理后的训练数据集加载到R-VGGNet卷积神经网络模型中进行模型的迭代训练和特征提取,包括如下步骤:
S301、识别网络模型R-VGGNet以VGG16网络模型作为基本网络结构。VGG16网络由3×3的卷积核和2×2的最大池化层构成,共13个卷积层和3个全连接层。相比较8层的AlexNet网络,VGG16网络最大的特点是通过3×3滤波器的组合与堆叠,提取出输入领域内更多非常细小的特征。在每组卷积层之后都连接一层最大池化层,并且每个卷积层之后紧跟(Rectified LinearUnit)Relu激活函数,其抑制特性使得神经元具有稀疏激活性,有效解决了梯度弥散问题,同时加速网络收敛。对于任意第i(0<i<16)层:
Zi=Wivi-1+bi (1)
vi=f(zi) (2)
其中,
Figure BDA0002433249090000041
为激励向量,
Figure BDA0002433249090000042
为激活向量,
Figure BDA0002433249090000043
为权值,
Figure BDA0002433249090000044
为偏置,Ni∈R为第i层的神经元个数。f(·)为激活函数Relu,其数学表达式为:
Relu(z)=max(0,z) (3)
S302、对网络模型的优化本质上就是使损失函数尽可能的小。本发明优化算法采用随机梯度下降法(Stochastic Gradient Descent,SGD)和Momentum相结合,设定动量参数为默认值0.9,迭代次数为100次,Batch_size设定为32,初始学习率设定为0.001。学习率采用指数衰减法的更新策略。指数衰减法更新学习率的表达式为:
Figure BDA0002433249090000045
式中lr为衰减后的学习率,lr0为初始学习率,dr为衰减系数,gs为当前的迭代次数,ds为衰减步长(即每迭代指定次数更新一次学习率),
Figure BDA0002433249090000046
表示向下取整。在训练过程中代价函数采用交叉熵损失函数,Softmax计算损失。为了避免过拟合现象,在损失函数中附加L2正则化项,最终的损失函数表达式为:
Figure BDA0002433249090000047
式中θ为权重,x为批次训练样本,λ为正则化项系数,p为期望的类别概率,q为模型预测的类别概率。在训练过程中,当损失函数的loss值趋于稳定时将学习率再次调小,直至达到最小值时获得最优识别模型,最终设定学习率为0.0005。
本发明与现有技术相比具有的优点或积极效果
1、利用迁移学习实现小样本青光眼眼底图像的识别。
本发明针对小样本学习能力不足、分类精度低的问题,引入迁移学习思想,利用VGG16网络在ImageNet数据集上的训练所获得的权重参数,冻结前13层并释放后3层的权重,利用青光眼数据集训练全连接层和Softmax分类器,微调后进行特征提取和分类。满足深度学习要求,有效提高了青光眼眼底图像的识别率。
2、利用改进的卷积神经网络R-VGGNet实现特征提取和分类。
在保证不影响识别率的前提下,本研究在VGG16的基础上进行了改进,对VGG16全连接层进行了重新设计,用2个全连接层替换原有的3个全连接层,这样得到的网络相对于之前的网络,训练参数大大减少,提升了网络的训练速度,训练时间也得到缩短。
3、提取ROI(视盘和视杯部分)。
针对青光眼患者的视杯面积与视盘面积之比一般大于0.6,即杯盘比大于0.6(CDR>0.6)这一特征,为了使网络能够充分提取到相关特征,减少眼底图像其他区域对识别率的干扰,本研究提取出眼底图像中视盘和视杯部分作为卷积神经网络R-VGGNet的输入,不仅提高了识别率,还加快了网络的识别速度。
附图说明
图1为本发明基于迁移学习的青光眼眼底图像识别方法的流程图。
图2为为本发明基于迁移学习的青光眼眼底图像识别方法的分类器结构图。
图3为本发明基于迁移学习的青光眼眼底图像识别方法的R-VGGNet卷积神经网络架构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本本发明基于迁移学习的青光眼眼底图像识别方法的青光眼患者识别系统如图1所示。该识别系统由三个部分组成:数据集预处理模块、基于迁移学习策略的模型训练与特征提取部分、自动识别分类部分。在对青光眼眼底图像进行识别分类时,需要对原数据集进行一系列的预处理操作,然后将预处理后的图像输入到网络模型中进行迁移训练与特征提取,最后将提取到的特征输入Softmax分类器进行分类,实现青光眼的识别。
S1、获取青光眼数据集,并对青光眼眼底图像进行预处理,以达到训练模型要求。
S2、构建卷积神经网络R-VGGNet;
S3、将预处理后的训练数据集加载到R-VGGNet卷积神经网络模型中进行模型的迭代训练和特征提取;
S4、将提取到的特征输入softmax分类器,完成对青光眼的分类识别,得到最终的识别模型。
S5、载入测试数据集到最终的识别模型中,输出对应的分类准确率。
所述S1中对青光眼眼底图像进行预处理包括如下步骤:
S101、删除污染严重,无使用价值的图像。由于获取的数据集中存在极少数无任何纹理信息的眼底图像,无使用价值,所以需要将其剔除;
S102、对数据集进行标注,分为健康人的眼底图像和青光眼患者的眼底图像;
S103、对获取的眼底图像进行裁剪,去除多余的图像背景。为了减小多余背景对实验产生的干扰,需要去除图像黑框部分。
S104、去除图像的噪声。由于图像采集时光照因素的影响,对于一些曝光不足的图像进行直方图均匀化,改善由光线引起的噪声问题。
S105、提取ROI。采用python的pillow库中crop操作,设定固定的裁剪区域(视盘和视杯部分),将所有图像的尺寸都裁剪为224x224,作为卷积神经网络的输入。
S106、为了进一步扩充数据集,采用数据增强手段。在原数据集的基础上采取平移(水平、竖直两个方向)、旋转(30°、60°、90°、180°)、比例缩放、翻转等方法,实现对样本的扩充。这些变换的目标是生成更多样本以创建更大的数据集,防止过度拟合。同时,本研究所采用的数据集还存在正负样本分布不均衡的情况,所以,需要对负样本进行适当扩充,从而解决样本不均衡问题。
S107、构建训练数据集和验证数据集。将数据集按照样本比例为9:1分成训练集与测试集两部分。
所述S2构建卷积神经网络R-VGGNet包括如下步骤:
S201、卷积神经网络R-VGGNet是基于VGG16卷积神经网络改进而来的,对其中起到分类器作用的全连接层进行了重新设计,用2个全连接层替换原有的3个全连接层。
设计一个完整的卷积神经网络,其最后部分往往会连接若干全连接层,这是因为全连接层能够将网络提取到的特征映射到样本的标记空间中,因此,全连接层在整个卷积神经网络中实际上起到了“分类器”的作用。该分类器设置了两个全连接层Fc1和Fc2,由于实验样本有限,为了避免过拟合现象的发生,在全连接层之后加入Dropout层,并且设置Dropout率为0.5。同时在每个全连接层之后引入线性修正单元(Relu),用来解决梯度弥散问题。
S202、设置第1个全连接层输出神经元个数为1024个,第2个全连接层输出神经元个数为2个。将VGG16原有模型中第1个全连接层输出神经元个数为4096设置成1024,同时将包含1000个节点的Softmax层用一个包含2个节点的Softmax层代替,分类器结构图如图2所示。
所述S3将预处理后的训练数据集加载到R-VGGNet卷积神经网络模型中进行模型的迭代训练和特征提取,包括如下步骤:
S301、识别网络模型R-VGGNet以VGG16网络模型作为基本网络结构,其网络架构图如图3所示。VGG16网络由3×3的卷积核和2×2的最大池化层构成,共13个卷积层和3个全连接层。相比较8层的AlexNet网络,VGG16网络最大的特点是通过3×3滤波器的组合与堆叠,提取出输入领域内更多非常细小的特征。在每组卷积层之后都连接一层最大池化层,并且每个卷积层之后紧跟(Rectified LinearUnit)Relu激活函数,其抑制特性使得神经元具有稀疏激活性,有效解决了梯度弥散问题,同时加速网络收敛。对于任意第i(0<i<16)层:
Zi=Wivi-1+bi (1)
vi=f(zi) (2)
其中,
Figure BDA0002433249090000071
为激励向量,
Figure BDA0002433249090000072
为激活向量,
Figure BDA0002433249090000073
为权值,
Figure BDA0002433249090000074
为偏置,Ni∈R为第i层的神经元个数。f(·)为激活函数Relu,其数学表达式为:
Relu(z)=max(0,z) (3)
S302、对网络模型的优化本质上就是使损失函数尽可能的小。本发明优化算法采用随机梯度下降法(Stochastic Gradient Descent,SGD)和Momentum相结合,设定动量参数为默认值0.9,迭代次数为100次,Batch_size设定为32,初始学习率设定为0.001。学习率采用指数衰减法的更新策略。指数衰减法更新学习率的表达式为:
Figure BDA0002433249090000081
式中lr为衰减后的学习率,lr0为初始学习率,dr为衰减系数,gs为当前的迭代次数,ds为衰减步长(即每迭代指定次数更新一次学习率),
Figure BDA0002433249090000082
表示向下取整。在训练过程中代价函数采用交叉熵损失函数,Softmax计算损失。为了避免过拟合现象,在损失函数中附加L2正则化项,最终的损失函数表达式为:
Figure BDA0002433249090000083
式中θ为权重,x为批次训练样本,λ为正则化项系数,p为期望的类别概率,q为模型预测的类别概率。在训练过程中,当损失函数的loss值趋于稳定时将学习率再次调小,直至达到最小值时获得最优识别模型,最终设定学习率为0.0005。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.一种基于迁移学习的青光眼眼底图像识别方法,其特征在于,包括如下步骤:
步骤S1、获取青光眼数据集,并对青光眼眼底图像进行预处理,以达到训练模型要求;
步骤S2、构建卷积神经网络R-VGGNet;
步骤S3、将预处理后的训练数据集加载到R-VGGNet卷积神经网络模型中进行模型的迭代训练和特征提取;
步骤S4、将提取到的特征输入softmax分类器,完成对青光眼的分类识别,得到最终的识别模型;
步骤S5、载入测试数据集到最终的识别模型中,输出对应的分类准确率。
所述步骤S1中对青光眼眼底图像进行预处理包括如下步骤:
步骤S101、删除污染严重以及无使用价值的图像;
步骤S102、对数据集进行标注,分为健康人的眼底图像和青光眼患者的眼底图像;
步骤S103、对获取的眼底图像进行裁剪,去除多余的图像背景;
步骤S104、对于一些曝光不足的图像进行直方图均匀化,去除图像的噪声;
步骤S105、提取ROI:采用python的pillow库中crop操作,设定固定的裁剪区域,即视盘和视杯部分,将所有图像的尺寸都裁剪为224x224,作为卷积神经网络的输入;
步骤S106、采用数据增强手段:在原数据集的基础上采取水平、竖直两个方向平移、旋转、比例缩放、以及翻转,实现对样本的扩充;其中旋转的度数分别为:30°、60°、90°、180°;
步骤S107、构建训练数据集和验证数据集:将数据集按照样本比例为9:1分成训练集与测试集两部分;
所述步骤S2构建卷积神经网络R-VGGNet包括如下步骤:
步骤S201、分类器设置两个全连接层Fc1和Fc2,同时在全连接层之后加入Dropout层,并且设置Dropout率为0.5;同时在每个全连接层之后引入线性修正单元,用来解决梯度弥散问题;
步骤S202、设置第1个全连接层输出神经元个数为1024个,第2个全连接层输出神经元个数为2个;将VGG16原有模型中第1个全连接层输出神经元个数为4096设置成1024,同时将包含1000个节点的Softmax层用一个包含2个节点的Softmax层代替;
所述步骤S3将预处理后的训练数据集加载到R-VGGNet卷积神经网络模型中进行模型的迭代训练和特征提取,包括如下步骤:
步骤S301、识别网络模型R-VGGNet以VGG16网络模型作为基本网络结构;VGG16网络由3×3的卷积核和2×2的最大池化层构成,共13个卷积层和3个全连接层;在每组卷积层之后都连接一层最大池化层,并且每个卷积层之后紧跟Relu激活函数,其抑制特性使得神经元具有稀疏激活性,有效解决了梯度弥散问题,同时加速网络收敛;对于任意第i层,0<i<16:
Zi=Wivi-1+bi (1);
vi=f(zi) (2);
其中,
Figure FDA0002433249080000021
为激励向量,
Figure FDA0002433249080000022
为激活向量,
Figure FDA0002433249080000023
为权值,
Figure FDA0002433249080000024
为偏置,Ni∈R为第i层的神经元个数;f(·)为激活函数Relu,其数学表达式为:
Relu(z)=max(0,z) (3);
步骤S302、优化网络模型,使损失函数尽可能的小:采用随机梯度下降法和Momentum相结合,设定动量参数为默认值0.9,迭代次数为100次,Batch_size设定为32,初始学习率设定为0.001。学习率采用指数衰减法的更新策略;指数衰减法更新学习率的表达式为:
Figure FDA0002433249080000027
式中lr为衰减后的学习率,lr0为初始学习率,dr为衰减系数,gs为当前的迭代次数,ds为衰减步长,即每迭代指定次数更新一次学习率;
Figure FDA0002433249080000025
表示向下取整;在训练过程中代价函数采用交叉熵损失函数Softmax计算损失;为了避免过拟合现象,在损失函数中附加L2正则化项,最终的损失函数表达式为:
Figure FDA0002433249080000026
式中θ为权重,x为批次训练样本,λ为正则化项系数,p为期望的类别概率,q为模型预测的类别概率;在训练过程中,当损失函数的loss值趋于稳定时将学习率再次调小,直至达到最小值时获得最优识别模型,最终设定学习率为0.0005。
CN202010243234.4A 2020-03-31 2020-03-31 基于迁移学习的青光眼眼底图像识别方法 Pending CN111476283A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010243234.4A CN111476283A (zh) 2020-03-31 2020-03-31 基于迁移学习的青光眼眼底图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010243234.4A CN111476283A (zh) 2020-03-31 2020-03-31 基于迁移学习的青光眼眼底图像识别方法

Publications (1)

Publication Number Publication Date
CN111476283A true CN111476283A (zh) 2020-07-31

Family

ID=71750353

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010243234.4A Pending CN111476283A (zh) 2020-03-31 2020-03-31 基于迁移学习的青光眼眼底图像识别方法

Country Status (1)

Country Link
CN (1) CN111476283A (zh)

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111950630A (zh) * 2020-08-12 2020-11-17 深圳市烨嘉为技术有限公司 基于两阶段迁移学习的小样本工业产品缺陷分类方法
CN112036461A (zh) * 2020-08-24 2020-12-04 湖北师范大学 手写数字图像识别方法、装置、设备及计算机存储介质
CN112132782A (zh) * 2020-08-21 2020-12-25 广东省人民医院 一种基于深度神经网络对dme分型进行处理的方法和终端
CN112200797A (zh) * 2020-10-28 2021-01-08 佛山市南海区广工大数控装备协同创新研究院 一种基于pcb噪声标注数据的有效训练方法
CN112308034A (zh) * 2020-11-25 2021-02-02 中国科学院深圳先进技术研究院 一种性别分类的方法、设备、终端及计算机存储介质
CN112419303A (zh) * 2020-12-09 2021-02-26 上海联影医疗科技股份有限公司 神经网络训练方法、系统、可读存储介质和设备
CN112434588A (zh) * 2020-11-18 2021-03-02 青岛慧拓智能机器有限公司 一种端到端驾驶员高速道路换道意图的推理方法
CN112529835A (zh) * 2020-10-22 2021-03-19 浙江大学 一种基于源相机识别的图像拼接篡改检测与定位方法
CN112651948A (zh) * 2020-12-30 2021-04-13 重庆科技学院 一种基于机器视觉的青蒿素萃取智能跟踪与识别方法
CN112750109A (zh) * 2021-01-14 2021-05-04 金陵科技学院 一种基于形态学和深度学习的制药设备安全监测模型
CN112966759A (zh) * 2021-03-15 2021-06-15 中国科学院长春光学精密机械与物理研究所 一种基于深度学习的眼底图像识别分类方法
CN113076873A (zh) * 2021-04-01 2021-07-06 重庆邮电大学 一种基于多阶段训练的农作物病害长尾图像识别方法
CN113160233A (zh) * 2021-04-02 2021-07-23 易普森智慧健康科技(深圳)有限公司 利用稀疏标注数据集训练实例分割神经网络模型的方法
CN113361654A (zh) * 2021-07-12 2021-09-07 广州天鹏计算机科技有限公司 一种基于机器学习的图像识别方法和系统
CN113592027A (zh) * 2021-08-16 2021-11-02 南京工程学院 一种基于迁移学习的医疗图像分类方法
CN113706524A (zh) * 2021-09-17 2021-11-26 上海交通大学 基于持续学习方法改进的卷积神经网络翻拍图像检测系统
CN114092740A (zh) * 2021-11-11 2022-02-25 成都云芯医联科技有限公司 一种ai辅助下的免疫侧流传感的解析方法
CN114119557A (zh) * 2021-11-29 2022-03-01 哈尔滨工业大学 一种基于卷积神经网络的光学元件快速暗场检测方法
CN114693961A (zh) * 2020-12-11 2022-07-01 北京航空航天大学 眼底照片分类方法、眼底图像处理方法和系统
CN114723674A (zh) * 2022-03-16 2022-07-08 南昌大学 一种基于可解耦训练和推理的青光眼辅助筛查系统
CN114782355A (zh) * 2022-04-18 2022-07-22 华南理工大学 基于改进vgg16网络的胃癌数字病理切片检测方法
CN114781483A (zh) * 2022-03-18 2022-07-22 华南理工大学 一种基于卷积神经网络的草菇生长状态识别方法
CN114818803A (zh) * 2022-04-25 2022-07-29 上海韶脑传感技术有限公司 基于神经元优化的单侧肢体患者运动想象脑电建模方法
CN114840900A (zh) * 2022-05-18 2022-08-02 滁州学院 一种基于i-GBDT技术的衍生式BIM构件自动生成方法
CN114913592A (zh) * 2022-05-18 2022-08-16 重庆邮电大学 一种基于卷积神经网络的眼底图像分类方法
CN115302963A (zh) * 2022-10-12 2022-11-08 深圳市彩昇印刷机械有限公司 一种基于机器视觉的条形码印刷控制方法、系统及介质
CN115496954A (zh) * 2022-11-03 2022-12-20 中国医学科学院阜外医院 眼底图像分类模型构建方法、设备及介质
CN117576573A (zh) * 2024-01-16 2024-02-20 广州航海学院 基于改进vgg16模型的建筑氛围评价方法、系统、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108665447A (zh) * 2018-04-20 2018-10-16 浙江大学 一种基于眼底照相深度学习的青光眼图像检测方法
CN109508650A (zh) * 2018-10-23 2019-03-22 浙江农林大学 一种基于迁移学习的树种识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108665447A (zh) * 2018-04-20 2018-10-16 浙江大学 一种基于眼底照相深度学习的青光眼图像检测方法
CN109508650A (zh) * 2018-10-23 2019-03-22 浙江农林大学 一种基于迁移学习的树种识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐志京等: "青光眼眼底图像的迁移学习分类方法", 《计算机工程与应用》, pages 1 - 10 *

Cited By (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111950630A (zh) * 2020-08-12 2020-11-17 深圳市烨嘉为技术有限公司 基于两阶段迁移学习的小样本工业产品缺陷分类方法
CN111950630B (zh) * 2020-08-12 2022-08-02 深圳市烨嘉为技术有限公司 基于两阶段迁移学习的小样本工业产品缺陷分类方法
CN112132782A (zh) * 2020-08-21 2020-12-25 广东省人民医院 一种基于深度神经网络对dme分型进行处理的方法和终端
CN112132782B (zh) * 2020-08-21 2023-09-05 广东省人民医院 一种基于深度神经网络对dme分型进行处理的方法和终端
CN112036461A (zh) * 2020-08-24 2020-12-04 湖北师范大学 手写数字图像识别方法、装置、设备及计算机存储介质
CN112036461B (zh) * 2020-08-24 2023-06-02 湖北师范大学 手写数字图像识别方法、装置、设备及计算机存储介质
CN112529835A (zh) * 2020-10-22 2021-03-19 浙江大学 一种基于源相机识别的图像拼接篡改检测与定位方法
CN112200797A (zh) * 2020-10-28 2021-01-08 佛山市南海区广工大数控装备协同创新研究院 一种基于pcb噪声标注数据的有效训练方法
CN112200797B (zh) * 2020-10-28 2024-04-05 佛山市南海区广工大数控装备协同创新研究院 一种基于pcb噪声标注数据的有效训练方法
CN112434588A (zh) * 2020-11-18 2021-03-02 青岛慧拓智能机器有限公司 一种端到端驾驶员高速道路换道意图的推理方法
CN112308034A (zh) * 2020-11-25 2021-02-02 中国科学院深圳先进技术研究院 一种性别分类的方法、设备、终端及计算机存储介质
CN112419303B (zh) * 2020-12-09 2023-08-15 上海联影医疗科技股份有限公司 神经网络训练方法、系统、可读存储介质和设备
CN112419303A (zh) * 2020-12-09 2021-02-26 上海联影医疗科技股份有限公司 神经网络训练方法、系统、可读存储介质和设备
CN114693961B (zh) * 2020-12-11 2024-05-14 北京航空航天大学 眼底照片分类方法、眼底图像处理方法和系统
CN114693961A (zh) * 2020-12-11 2022-07-01 北京航空航天大学 眼底照片分类方法、眼底图像处理方法和系统
CN112651948A (zh) * 2020-12-30 2021-04-13 重庆科技学院 一种基于机器视觉的青蒿素萃取智能跟踪与识别方法
CN112750109A (zh) * 2021-01-14 2021-05-04 金陵科技学院 一种基于形态学和深度学习的制药设备安全监测模型
CN112750109B (zh) * 2021-01-14 2023-06-30 金陵科技学院 一种基于形态学和深度学习的制药设备安全监测方法
CN112966759A (zh) * 2021-03-15 2021-06-15 中国科学院长春光学精密机械与物理研究所 一种基于深度学习的眼底图像识别分类方法
CN112966759B (zh) * 2021-03-15 2022-05-10 中国科学院长春光学精密机械与物理研究所 一种基于深度学习的眼底图像识别分类方法
CN113076873B (zh) * 2021-04-01 2022-02-22 重庆邮电大学 一种基于多阶段训练的农作物病害长尾图像识别方法
CN113076873A (zh) * 2021-04-01 2021-07-06 重庆邮电大学 一种基于多阶段训练的农作物病害长尾图像识别方法
CN113160233A (zh) * 2021-04-02 2021-07-23 易普森智慧健康科技(深圳)有限公司 利用稀疏标注数据集训练实例分割神经网络模型的方法
CN113361654A (zh) * 2021-07-12 2021-09-07 广州天鹏计算机科技有限公司 一种基于机器学习的图像识别方法和系统
CN113592027A (zh) * 2021-08-16 2021-11-02 南京工程学院 一种基于迁移学习的医疗图像分类方法
CN113706524A (zh) * 2021-09-17 2021-11-26 上海交通大学 基于持续学习方法改进的卷积神经网络翻拍图像检测系统
CN113706524B (zh) * 2021-09-17 2023-11-14 上海交通大学 基于持续学习方法改进的卷积神经网络翻拍图像检测系统
CN114092740A (zh) * 2021-11-11 2022-02-25 成都云芯医联科技有限公司 一种ai辅助下的免疫侧流传感的解析方法
CN114119557B (zh) * 2021-11-29 2024-04-26 哈尔滨工业大学 一种基于卷积神经网络的光学元件快速暗场检测方法
CN114119557A (zh) * 2021-11-29 2022-03-01 哈尔滨工业大学 一种基于卷积神经网络的光学元件快速暗场检测方法
CN114723674A (zh) * 2022-03-16 2022-07-08 南昌大学 一种基于可解耦训练和推理的青光眼辅助筛查系统
CN114781483B (zh) * 2022-03-18 2024-05-28 华南理工大学 一种基于卷积神经网络的草菇生长状态识别方法
CN114781483A (zh) * 2022-03-18 2022-07-22 华南理工大学 一种基于卷积神经网络的草菇生长状态识别方法
CN114782355A (zh) * 2022-04-18 2022-07-22 华南理工大学 基于改进vgg16网络的胃癌数字病理切片检测方法
CN114782355B (zh) * 2022-04-18 2024-05-14 华南理工大学 基于改进vgg16网络的胃癌数字病理切片检测方法
CN114818803A (zh) * 2022-04-25 2022-07-29 上海韶脑传感技术有限公司 基于神经元优化的单侧肢体患者运动想象脑电建模方法
CN114840900A (zh) * 2022-05-18 2022-08-02 滁州学院 一种基于i-GBDT技术的衍生式BIM构件自动生成方法
CN114913592A (zh) * 2022-05-18 2022-08-16 重庆邮电大学 一种基于卷积神经网络的眼底图像分类方法
CN115302963A (zh) * 2022-10-12 2022-11-08 深圳市彩昇印刷机械有限公司 一种基于机器视觉的条形码印刷控制方法、系统及介质
CN115302963B (zh) * 2022-10-12 2022-12-27 深圳市彩昇印刷机械有限公司 一种基于机器视觉的条形码印刷控制方法、系统及介质
CN115496954A (zh) * 2022-11-03 2022-12-20 中国医学科学院阜外医院 眼底图像分类模型构建方法、设备及介质
CN117576573A (zh) * 2024-01-16 2024-02-20 广州航海学院 基于改进vgg16模型的建筑氛围评价方法、系统、设备及介质
CN117576573B (zh) * 2024-01-16 2024-05-17 广州航海学院 基于改进vgg16模型的建筑氛围评价方法、系统、设备及介质

Similar Documents

Publication Publication Date Title
CN111476283A (zh) 基于迁移学习的青光眼眼底图像识别方法
CN111259982B (zh) 一种基于注意力机制的早产儿视网膜图像分类方法和装置
CN112132817B (zh) 一种混合注意力机制的眼底图像视网膜血管分割方法
CN108648191B (zh) 基于贝叶斯宽度残差神经网络的害虫图像识别方法
CN106485251B (zh) 基于深度学习的鸡蛋胚胎分类
CN109272048B (zh) 一种基于深度卷积神经网络的模式识别方法
CN112488234B (zh) 一种基于注意力池化的端到端组织病理图像分类方法
CN109635862B (zh) 早产儿视网膜病plus病变分类方法
CN110236483B (zh) 一种基于深度残差网络的糖尿病性视网膜病变检测的方法
CN114998210B (zh) 一种基于深度学习目标检测的早产儿视网膜病变检测系统
CN107871316B (zh) 基于深度神经网络的x光片手骨兴趣区域自动提取方法
CN111612856B (zh) 用于彩色眼底图像的视网膜新生血管检测方法及成像方法
Chen et al. Detection of diabetic retinopathy using deep neural network
CN114038037B (zh) 基于可分离残差注意力网络的表情标签修正和识别方法
CN112150476A (zh) 基于时空判别性特征学习的冠状动脉序列血管分割方法
CN114881962A (zh) 一种基于改进U-Net网络的视网膜图像血管分割方法
CN112633257A (zh) 基于改良卷积神经网络的马铃薯病害识别方法
CN112348059A (zh) 基于深度学习的多种染色病理图像分类方法及系统
CN113012163A (zh) 一种基于多尺度注意力网络的视网膜血管分割方法、设备及存储介质
CN114648806A (zh) 一种多机制自适应的眼底图像分割方法
Yang et al. Classification of diabetic retinopathy severity based on GCA attention mechanism
CN114998651A (zh) 基于迁移学习的皮肤病变图像分类识别方法、系统及介质
CN112749675A (zh) 一种基于卷积神经网络的马铃薯病害识别方法
Swastika et al. The effect of regularization on deep learning methods for detection of malaria infection
Dong et al. Supervised learning-based retinal vascular segmentation by m-unet full convolutional neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200731

WD01 Invention patent application deemed withdrawn after publication