CN111476283A - 基于迁移学习的青光眼眼底图像识别方法 - Google Patents
基于迁移学习的青光眼眼底图像识别方法 Download PDFInfo
- Publication number
- CN111476283A CN111476283A CN202010243234.4A CN202010243234A CN111476283A CN 111476283 A CN111476283 A CN 111476283A CN 202010243234 A CN202010243234 A CN 202010243234A CN 111476283 A CN111476283 A CN 111476283A
- Authority
- CN
- China
- Prior art keywords
- data set
- glaucoma
- model
- training
- vggnet
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 208000010412 Glaucoma Diseases 0.000 title claims abstract description 49
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000013526 transfer learning Methods 0.000 title claims abstract description 15
- 238000012549 training Methods 0.000 claims abstract description 52
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 32
- 238000000605 extraction Methods 0.000 claims abstract description 14
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 238000012360 testing method Methods 0.000 claims abstract description 8
- 230000006870 function Effects 0.000 claims description 22
- 210000004205 output neuron Anatomy 0.000 claims description 12
- 230000004913 activation Effects 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 7
- 239000006185 dispersion Substances 0.000 claims description 6
- 230000005284 excitation Effects 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 6
- 210000002569 neuron Anatomy 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 3
- 238000000265 homogenisation Methods 0.000 claims description 3
- 230000005764 inhibitory process Effects 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 238000013519 translation Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims 1
- 230000007306 turnover Effects 0.000 claims 1
- 238000013135 deep learning Methods 0.000 abstract description 4
- 239000000284 extract Substances 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000004195 computer-aided diagnosis Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 210000003994 retinal ganglion cell Anatomy 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 201000004569 Blindness Diseases 0.000 description 1
- 208000022873 Ocular disease Diseases 0.000 description 1
- 206010047571 Visual impairment Diseases 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 210000003050 axon Anatomy 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 208000030533 eye disease Diseases 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000004256 retinal image Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 208000029257 vision disease Diseases 0.000 description 1
- 230000009978 visual deterioration Effects 0.000 description 1
- 230000004393 visual impairment Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明披露一种基于迁移学习的青光眼眼底图像识别方法,包括以下步骤:1、获取青光眼数据集,并对青光眼眼底图像进行预处理;2、构建卷积神经网络R‑VGGNet;3、将预处理后的训练数据集加载到R‑VGGNet卷积神经网络模型中进行模型的迭代训练和特征提取;4、将提取到的特征输入softmax分类器,完成对青光眼的分类识别,得到最终的识别模型;5、载入测试数据集到最终的识别模型中,输出对应的分类准确率。本发明引入迁移学习思想,利用VGG16网络在ImageNet数据集上的训练所获得的权重参数,冻结前13层并释放后3层的权重,利用青光眼数据集训练全连接层和Softmax分类器,微调后进行特征提取和分类;满足深度学习要求,有效提高了青光眼眼底图像的识别率。
Description
技术领域
本发明涉及眼睛疾病图像识别,具体为一种基于迁移学习的青光眼眼底图像识别方法。
背景技术
青光眼是一种慢性、渐进性视觉损伤的眼科疾病,其主要病理特征为视网膜神经节细胞(Retinal Ganglion Cells,RGC)的凋亡和轴突的丧失,从而导致视力逐渐下降甚至失明,严重威胁患者的健康。由于该病具有较高的隐蔽性,患病初期不易被发现,导致患者得不到及时的治疗。数字眼底图像(DFI)是目前检测青光眼的主要工具之一,因而可以利用眼底图像对青光眼进行前期检测,以免病情的进一步恶化。但眼底图像结构性复杂,采用人工识别方法耗时费力且很难得到客观准确的医疗诊断,近年来,随着深度学习的发展,可应用到图像识别领域,因此很多学者尝试采用人工智能技术对眼底图像进行患者筛查。
2017年丁蓬莉等人提出基于紧凑的神经网络CompactNet对视网膜图像进行识别分类,但由于实验样本有限,网络在训练的过程中并没有充分提取到相关特征,因此分类准确率并不高。T.Balasubramanian等人利用方向梯度直方图(HOG)进行提取特征,并结合支持向量机(SVM)实现对青光眼的分类,但该方法预处理步骤过于繁琐,并且识别准确率并不高。U Raghavendra等人提出一种利用深度学习技术准确检测青光眼的新型计算机辅助诊断(CAD)系统,设计一个18层的卷积神经网络,经过有效训练提取特征之后进行测试分类,虽然识别率较高,但训练样本达到了几千张,在缺乏大量青光眼眼底图像的前提下,其实用价值并不高。
发明内容
为了解决现有技术的缺陷,本发明采用迁移学习策略,解决小样本学习能力不足,分类精度低的问题,提高小样本下青光眼患者的识别率。
一般来说,训练一个神经网络需要大量的样本,而目前在医学领域却缺乏大型公开已标记的数据集。在没有足够多训练样本的情况下,如果网络足够深,可能网络在训练过程中会不收敛或者训练出来的模型泛化能力差。而如果采用浅层的神经网络,网络在训练的过程中又不能够充分提取到相关特征,从而导致分类精度不高等问题。为了解决上述问题,本发明借助迁移学习思想,将VGG16网络在ImageNet数据集上预训练得到的模型迁移到青光眼眼底图像识别任务中,迁移学习相对于传统的神经网络主要的优势在于不需要大量的训练样本。
采用改进后的卷积神经网络R-VGGNet完成识别模型的训练与特征提取,减少网络训练参数,提高识别率。
现有的VGG结构采用三层连接的全连接层,这三层全连接层占了训练参数的绝大部分,对于本发明来说,识别任务仅仅只有两类,即识别健康人和青光眼患者的眼底图像,三层的全连接层相对冗余,因此,对VGG16全连接层进行了重新设计,即R-VGGNet,提出用2个全连接层替换原有的3个全连接层,其中设置第1个全连接层输出神经元个数为1024个,第2个全连接层输出神经元个数为2个,这样得到的网络相对于之前的网络,训练参数大大减少,提升了网络的训练速度,训练时间也得到缩短。
将提取ROI后的子图像作为识别模型的输入,降低了CNN网络训练和分类的信息处理量,加快识别速度。
眼底图像是诊断青光眼的重要依据,研究表明:青光眼患者具有三大特征,其中一大特征为:青光眼患者的视杯面积与视盘面积之比一般大于0.6,即杯盘比(CDR>0.6)。同时,为了缩短网络处理时间,可以将更小的初始图像作为网络的输入。基于上述两点原因,本发明将ROI(Region Of Interest)区域作为深度卷积神经网络的输入。
本发明的技术方案如下:
一种基于迁移学习的青光眼眼底图像识别方法,包括以下步骤:
S1、获取青光眼数据集,并对青光眼眼底图像进行预处理,以达到训练模型要求。
S2、构建卷积神经网络R-VGGNet;
S3、将预处理后的训练数据集加载到R-VGGNet卷积神经网络模型中进行模型的迭代训练和特征提取;
S4、将提取到的特征输入softmax分类器,完成对青光眼的分类识别,得到最终的识别模型。
S5、载入测试数据集到最终的识别模型中,输出对应的分类准确率。
所述S1中对青光眼眼底图像进行预处理包括如下步骤:
S101、删除污染严重,无使用价值的图像。由于获取的数据集中存在极少数无任何纹理信息的眼底图像,无使用价值,所以需要将其剔除;
S102、对数据集进行标注,分为健康人的眼底图像和青光眼患者的眼底图像;
S103、对获取的眼底图像进行裁剪,去除多余的图像背景。为了减小多余背景对实验产生的干扰,需要去除图像黑框部分。
S104、去除图像的噪声。由于图像采集时光照因素的影响,对于一些曝光不足的图像进行直方图均匀化,改善由光线引起的噪声问题。
S105、提取ROI。采用python的pillow库中crop操作,设定固定的裁剪区域(视盘和视杯部分),将所有图像的尺寸都裁剪为224x224,作为卷积神经网络的输入。
S106、为了进一步扩充数据集,采用数据增强手段。在原数据集的基础上采取平移(水平、竖直两个方向)、旋转(30°、60°、90°、180°)、比例缩放、翻转等方法,实现对样本的扩充。这些变换的目标是生成更多样本以创建更大的数据集,防止过度拟合。同时,本研究所采用的数据集还存在正负样本分布不均衡的情况,所以,需要对负样本进行适当扩充,从而解决样本不均衡问题。
S107、构建训练数据集和验证数据集。将数据集按照样本比例为9:1分成训练集与测试集两部分。
所述S2构建卷积神经网络R-VGGNet包括如下步骤:
S201、卷积神经网络R-VGGNet是基于VGG16卷积神经网络改进而来的,对其中起到分类器作用的全连接层进行了重新设计,用2个全连接层替换原有的3个全连接层。
设计一个完整的卷积神经网络,其最后部分往往会连接若干全连接层,这是因为全连接层能够将网络提取到的特征映射到样本的标记空间中,因此,全连接层在整个卷积神经网络中实际上起到了“分类器”的作用。该分类器设置了两个全连接层Fc1和Fc2,由于实验样本有限,为了避免过拟合现象的发生,在全连接层之后加入Dropout层,并且设置Dropout率为0.5。同时在每个全连接层之后引入线性修正单元(Relu),用来解决梯度弥散问题。
S202、设置第1个全连接层输出神经元个数为1024个,第2个全连接层输出神经元个数为2个。将VGG16原有模型中第1个全连接层输出神经元个数为4096设置成1024,同时将包含1000个节点的Softmax层用一个包含2个节点的Softmax层代替。
所述S3将预处理后的训练数据集加载到R-VGGNet卷积神经网络模型中进行模型的迭代训练和特征提取,包括如下步骤:
S301、识别网络模型R-VGGNet以VGG16网络模型作为基本网络结构。VGG16网络由3×3的卷积核和2×2的最大池化层构成,共13个卷积层和3个全连接层。相比较8层的AlexNet网络,VGG16网络最大的特点是通过3×3滤波器的组合与堆叠,提取出输入领域内更多非常细小的特征。在每组卷积层之后都连接一层最大池化层,并且每个卷积层之后紧跟(Rectified LinearUnit)Relu激活函数,其抑制特性使得神经元具有稀疏激活性,有效解决了梯度弥散问题,同时加速网络收敛。对于任意第i(0<i<16)层:
Zi=Wivi-1+bi (1)
vi=f(zi) (2)
Relu(z)=max(0,z) (3)
S302、对网络模型的优化本质上就是使损失函数尽可能的小。本发明优化算法采用随机梯度下降法(Stochastic Gradient Descent,SGD)和Momentum相结合,设定动量参数为默认值0.9,迭代次数为100次,Batch_size设定为32,初始学习率设定为0.001。学习率采用指数衰减法的更新策略。指数衰减法更新学习率的表达式为:
式中lr为衰减后的学习率,lr0为初始学习率,dr为衰减系数,gs为当前的迭代次数,ds为衰减步长(即每迭代指定次数更新一次学习率),表示向下取整。在训练过程中代价函数采用交叉熵损失函数,Softmax计算损失。为了避免过拟合现象,在损失函数中附加L2正则化项,最终的损失函数表达式为:
式中θ为权重,x为批次训练样本,λ为正则化项系数,p为期望的类别概率,q为模型预测的类别概率。在训练过程中,当损失函数的loss值趋于稳定时将学习率再次调小,直至达到最小值时获得最优识别模型,最终设定学习率为0.0005。
本发明与现有技术相比具有的优点或积极效果
1、利用迁移学习实现小样本青光眼眼底图像的识别。
本发明针对小样本学习能力不足、分类精度低的问题,引入迁移学习思想,利用VGG16网络在ImageNet数据集上的训练所获得的权重参数,冻结前13层并释放后3层的权重,利用青光眼数据集训练全连接层和Softmax分类器,微调后进行特征提取和分类。满足深度学习要求,有效提高了青光眼眼底图像的识别率。
2、利用改进的卷积神经网络R-VGGNet实现特征提取和分类。
在保证不影响识别率的前提下,本研究在VGG16的基础上进行了改进,对VGG16全连接层进行了重新设计,用2个全连接层替换原有的3个全连接层,这样得到的网络相对于之前的网络,训练参数大大减少,提升了网络的训练速度,训练时间也得到缩短。
3、提取ROI(视盘和视杯部分)。
针对青光眼患者的视杯面积与视盘面积之比一般大于0.6,即杯盘比大于0.6(CDR>0.6)这一特征,为了使网络能够充分提取到相关特征,减少眼底图像其他区域对识别率的干扰,本研究提取出眼底图像中视盘和视杯部分作为卷积神经网络R-VGGNet的输入,不仅提高了识别率,还加快了网络的识别速度。
附图说明
图1为本发明基于迁移学习的青光眼眼底图像识别方法的流程图。
图2为为本发明基于迁移学习的青光眼眼底图像识别方法的分类器结构图。
图3为本发明基于迁移学习的青光眼眼底图像识别方法的R-VGGNet卷积神经网络架构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本本发明基于迁移学习的青光眼眼底图像识别方法的青光眼患者识别系统如图1所示。该识别系统由三个部分组成:数据集预处理模块、基于迁移学习策略的模型训练与特征提取部分、自动识别分类部分。在对青光眼眼底图像进行识别分类时,需要对原数据集进行一系列的预处理操作,然后将预处理后的图像输入到网络模型中进行迁移训练与特征提取,最后将提取到的特征输入Softmax分类器进行分类,实现青光眼的识别。
S1、获取青光眼数据集,并对青光眼眼底图像进行预处理,以达到训练模型要求。
S2、构建卷积神经网络R-VGGNet;
S3、将预处理后的训练数据集加载到R-VGGNet卷积神经网络模型中进行模型的迭代训练和特征提取;
S4、将提取到的特征输入softmax分类器,完成对青光眼的分类识别,得到最终的识别模型。
S5、载入测试数据集到最终的识别模型中,输出对应的分类准确率。
所述S1中对青光眼眼底图像进行预处理包括如下步骤:
S101、删除污染严重,无使用价值的图像。由于获取的数据集中存在极少数无任何纹理信息的眼底图像,无使用价值,所以需要将其剔除;
S102、对数据集进行标注,分为健康人的眼底图像和青光眼患者的眼底图像;
S103、对获取的眼底图像进行裁剪,去除多余的图像背景。为了减小多余背景对实验产生的干扰,需要去除图像黑框部分。
S104、去除图像的噪声。由于图像采集时光照因素的影响,对于一些曝光不足的图像进行直方图均匀化,改善由光线引起的噪声问题。
S105、提取ROI。采用python的pillow库中crop操作,设定固定的裁剪区域(视盘和视杯部分),将所有图像的尺寸都裁剪为224x224,作为卷积神经网络的输入。
S106、为了进一步扩充数据集,采用数据增强手段。在原数据集的基础上采取平移(水平、竖直两个方向)、旋转(30°、60°、90°、180°)、比例缩放、翻转等方法,实现对样本的扩充。这些变换的目标是生成更多样本以创建更大的数据集,防止过度拟合。同时,本研究所采用的数据集还存在正负样本分布不均衡的情况,所以,需要对负样本进行适当扩充,从而解决样本不均衡问题。
S107、构建训练数据集和验证数据集。将数据集按照样本比例为9:1分成训练集与测试集两部分。
所述S2构建卷积神经网络R-VGGNet包括如下步骤:
S201、卷积神经网络R-VGGNet是基于VGG16卷积神经网络改进而来的,对其中起到分类器作用的全连接层进行了重新设计,用2个全连接层替换原有的3个全连接层。
设计一个完整的卷积神经网络,其最后部分往往会连接若干全连接层,这是因为全连接层能够将网络提取到的特征映射到样本的标记空间中,因此,全连接层在整个卷积神经网络中实际上起到了“分类器”的作用。该分类器设置了两个全连接层Fc1和Fc2,由于实验样本有限,为了避免过拟合现象的发生,在全连接层之后加入Dropout层,并且设置Dropout率为0.5。同时在每个全连接层之后引入线性修正单元(Relu),用来解决梯度弥散问题。
S202、设置第1个全连接层输出神经元个数为1024个,第2个全连接层输出神经元个数为2个。将VGG16原有模型中第1个全连接层输出神经元个数为4096设置成1024,同时将包含1000个节点的Softmax层用一个包含2个节点的Softmax层代替,分类器结构图如图2所示。
所述S3将预处理后的训练数据集加载到R-VGGNet卷积神经网络模型中进行模型的迭代训练和特征提取,包括如下步骤:
S301、识别网络模型R-VGGNet以VGG16网络模型作为基本网络结构,其网络架构图如图3所示。VGG16网络由3×3的卷积核和2×2的最大池化层构成,共13个卷积层和3个全连接层。相比较8层的AlexNet网络,VGG16网络最大的特点是通过3×3滤波器的组合与堆叠,提取出输入领域内更多非常细小的特征。在每组卷积层之后都连接一层最大池化层,并且每个卷积层之后紧跟(Rectified LinearUnit)Relu激活函数,其抑制特性使得神经元具有稀疏激活性,有效解决了梯度弥散问题,同时加速网络收敛。对于任意第i(0<i<16)层:
Zi=Wivi-1+bi (1)
vi=f(zi) (2)
Relu(z)=max(0,z) (3)
S302、对网络模型的优化本质上就是使损失函数尽可能的小。本发明优化算法采用随机梯度下降法(Stochastic Gradient Descent,SGD)和Momentum相结合,设定动量参数为默认值0.9,迭代次数为100次,Batch_size设定为32,初始学习率设定为0.001。学习率采用指数衰减法的更新策略。指数衰减法更新学习率的表达式为:
式中lr为衰减后的学习率,lr0为初始学习率,dr为衰减系数,gs为当前的迭代次数,ds为衰减步长(即每迭代指定次数更新一次学习率),表示向下取整。在训练过程中代价函数采用交叉熵损失函数,Softmax计算损失。为了避免过拟合现象,在损失函数中附加L2正则化项,最终的损失函数表达式为:
式中θ为权重,x为批次训练样本,λ为正则化项系数,p为期望的类别概率,q为模型预测的类别概率。在训练过程中,当损失函数的loss值趋于稳定时将学习率再次调小,直至达到最小值时获得最优识别模型,最终设定学习率为0.0005。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (1)
1.一种基于迁移学习的青光眼眼底图像识别方法,其特征在于,包括如下步骤:
步骤S1、获取青光眼数据集,并对青光眼眼底图像进行预处理,以达到训练模型要求;
步骤S2、构建卷积神经网络R-VGGNet;
步骤S3、将预处理后的训练数据集加载到R-VGGNet卷积神经网络模型中进行模型的迭代训练和特征提取;
步骤S4、将提取到的特征输入softmax分类器,完成对青光眼的分类识别,得到最终的识别模型;
步骤S5、载入测试数据集到最终的识别模型中,输出对应的分类准确率。
所述步骤S1中对青光眼眼底图像进行预处理包括如下步骤:
步骤S101、删除污染严重以及无使用价值的图像;
步骤S102、对数据集进行标注,分为健康人的眼底图像和青光眼患者的眼底图像;
步骤S103、对获取的眼底图像进行裁剪,去除多余的图像背景;
步骤S104、对于一些曝光不足的图像进行直方图均匀化,去除图像的噪声;
步骤S105、提取ROI:采用python的pillow库中crop操作,设定固定的裁剪区域,即视盘和视杯部分,将所有图像的尺寸都裁剪为224x224,作为卷积神经网络的输入;
步骤S106、采用数据增强手段:在原数据集的基础上采取水平、竖直两个方向平移、旋转、比例缩放、以及翻转,实现对样本的扩充;其中旋转的度数分别为:30°、60°、90°、180°;
步骤S107、构建训练数据集和验证数据集:将数据集按照样本比例为9:1分成训练集与测试集两部分;
所述步骤S2构建卷积神经网络R-VGGNet包括如下步骤:
步骤S201、分类器设置两个全连接层Fc1和Fc2,同时在全连接层之后加入Dropout层,并且设置Dropout率为0.5;同时在每个全连接层之后引入线性修正单元,用来解决梯度弥散问题;
步骤S202、设置第1个全连接层输出神经元个数为1024个,第2个全连接层输出神经元个数为2个;将VGG16原有模型中第1个全连接层输出神经元个数为4096设置成1024,同时将包含1000个节点的Softmax层用一个包含2个节点的Softmax层代替;
所述步骤S3将预处理后的训练数据集加载到R-VGGNet卷积神经网络模型中进行模型的迭代训练和特征提取,包括如下步骤:
步骤S301、识别网络模型R-VGGNet以VGG16网络模型作为基本网络结构;VGG16网络由3×3的卷积核和2×2的最大池化层构成,共13个卷积层和3个全连接层;在每组卷积层之后都连接一层最大池化层,并且每个卷积层之后紧跟Relu激活函数,其抑制特性使得神经元具有稀疏激活性,有效解决了梯度弥散问题,同时加速网络收敛;对于任意第i层,0<i<16:
Zi=Wivi-1+bi (1);
vi=f(zi) (2);
Relu(z)=max(0,z) (3);
步骤S302、优化网络模型,使损失函数尽可能的小:采用随机梯度下降法和Momentum相结合,设定动量参数为默认值0.9,迭代次数为100次,Batch_size设定为32,初始学习率设定为0.001。学习率采用指数衰减法的更新策略;指数衰减法更新学习率的表达式为:
式中lr为衰减后的学习率,lr0为初始学习率,dr为衰减系数,gs为当前的迭代次数,ds为衰减步长,即每迭代指定次数更新一次学习率;表示向下取整;在训练过程中代价函数采用交叉熵损失函数Softmax计算损失;为了避免过拟合现象,在损失函数中附加L2正则化项,最终的损失函数表达式为:
式中θ为权重,x为批次训练样本,λ为正则化项系数,p为期望的类别概率,q为模型预测的类别概率;在训练过程中,当损失函数的loss值趋于稳定时将学习率再次调小,直至达到最小值时获得最优识别模型,最终设定学习率为0.0005。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010243234.4A CN111476283A (zh) | 2020-03-31 | 2020-03-31 | 基于迁移学习的青光眼眼底图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010243234.4A CN111476283A (zh) | 2020-03-31 | 2020-03-31 | 基于迁移学习的青光眼眼底图像识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111476283A true CN111476283A (zh) | 2020-07-31 |
Family
ID=71750353
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010243234.4A Pending CN111476283A (zh) | 2020-03-31 | 2020-03-31 | 基于迁移学习的青光眼眼底图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111476283A (zh) |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111950630A (zh) * | 2020-08-12 | 2020-11-17 | 深圳市烨嘉为技术有限公司 | 基于两阶段迁移学习的小样本工业产品缺陷分类方法 |
CN112036461A (zh) * | 2020-08-24 | 2020-12-04 | 湖北师范大学 | 手写数字图像识别方法、装置、设备及计算机存储介质 |
CN112132782A (zh) * | 2020-08-21 | 2020-12-25 | 广东省人民医院 | 一种基于深度神经网络对dme分型进行处理的方法和终端 |
CN112200797A (zh) * | 2020-10-28 | 2021-01-08 | 佛山市南海区广工大数控装备协同创新研究院 | 一种基于pcb噪声标注数据的有效训练方法 |
CN112308034A (zh) * | 2020-11-25 | 2021-02-02 | 中国科学院深圳先进技术研究院 | 一种性别分类的方法、设备、终端及计算机存储介质 |
CN112419303A (zh) * | 2020-12-09 | 2021-02-26 | 上海联影医疗科技股份有限公司 | 神经网络训练方法、系统、可读存储介质和设备 |
CN112434588A (zh) * | 2020-11-18 | 2021-03-02 | 青岛慧拓智能机器有限公司 | 一种端到端驾驶员高速道路换道意图的推理方法 |
CN112529835A (zh) * | 2020-10-22 | 2021-03-19 | 浙江大学 | 一种基于源相机识别的图像拼接篡改检测与定位方法 |
CN112651948A (zh) * | 2020-12-30 | 2021-04-13 | 重庆科技学院 | 一种基于机器视觉的青蒿素萃取智能跟踪与识别方法 |
CN112750109A (zh) * | 2021-01-14 | 2021-05-04 | 金陵科技学院 | 一种基于形态学和深度学习的制药设备安全监测模型 |
CN112966759A (zh) * | 2021-03-15 | 2021-06-15 | 中国科学院长春光学精密机械与物理研究所 | 一种基于深度学习的眼底图像识别分类方法 |
CN113076873A (zh) * | 2021-04-01 | 2021-07-06 | 重庆邮电大学 | 一种基于多阶段训练的农作物病害长尾图像识别方法 |
CN113160233A (zh) * | 2021-04-02 | 2021-07-23 | 易普森智慧健康科技(深圳)有限公司 | 利用稀疏标注数据集训练实例分割神经网络模型的方法 |
CN113361654A (zh) * | 2021-07-12 | 2021-09-07 | 广州天鹏计算机科技有限公司 | 一种基于机器学习的图像识别方法和系统 |
CN113592027A (zh) * | 2021-08-16 | 2021-11-02 | 南京工程学院 | 一种基于迁移学习的医疗图像分类方法 |
CN113706524A (zh) * | 2021-09-17 | 2021-11-26 | 上海交通大学 | 基于持续学习方法改进的卷积神经网络翻拍图像检测系统 |
CN114092740A (zh) * | 2021-11-11 | 2022-02-25 | 成都云芯医联科技有限公司 | 一种ai辅助下的免疫侧流传感的解析方法 |
CN114119557A (zh) * | 2021-11-29 | 2022-03-01 | 哈尔滨工业大学 | 一种基于卷积神经网络的光学元件快速暗场检测方法 |
CN114693961A (zh) * | 2020-12-11 | 2022-07-01 | 北京航空航天大学 | 眼底照片分类方法、眼底图像处理方法和系统 |
CN114723674A (zh) * | 2022-03-16 | 2022-07-08 | 南昌大学 | 一种基于可解耦训练和推理的青光眼辅助筛查系统 |
CN114782355A (zh) * | 2022-04-18 | 2022-07-22 | 华南理工大学 | 基于改进vgg16网络的胃癌数字病理切片检测方法 |
CN114781483A (zh) * | 2022-03-18 | 2022-07-22 | 华南理工大学 | 一种基于卷积神经网络的草菇生长状态识别方法 |
CN114818803A (zh) * | 2022-04-25 | 2022-07-29 | 上海韶脑传感技术有限公司 | 基于神经元优化的单侧肢体患者运动想象脑电建模方法 |
CN114840900A (zh) * | 2022-05-18 | 2022-08-02 | 滁州学院 | 一种基于i-GBDT技术的衍生式BIM构件自动生成方法 |
CN114913592A (zh) * | 2022-05-18 | 2022-08-16 | 重庆邮电大学 | 一种基于卷积神经网络的眼底图像分类方法 |
CN115302963A (zh) * | 2022-10-12 | 2022-11-08 | 深圳市彩昇印刷机械有限公司 | 一种基于机器视觉的条形码印刷控制方法、系统及介质 |
CN115496954A (zh) * | 2022-11-03 | 2022-12-20 | 中国医学科学院阜外医院 | 眼底图像分类模型构建方法、设备及介质 |
CN117576573A (zh) * | 2024-01-16 | 2024-02-20 | 广州航海学院 | 基于改进vgg16模型的建筑氛围评价方法、系统、设备及介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108665447A (zh) * | 2018-04-20 | 2018-10-16 | 浙江大学 | 一种基于眼底照相深度学习的青光眼图像检测方法 |
CN109508650A (zh) * | 2018-10-23 | 2019-03-22 | 浙江农林大学 | 一种基于迁移学习的树种识别方法 |
-
2020
- 2020-03-31 CN CN202010243234.4A patent/CN111476283A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108665447A (zh) * | 2018-04-20 | 2018-10-16 | 浙江大学 | 一种基于眼底照相深度学习的青光眼图像检测方法 |
CN109508650A (zh) * | 2018-10-23 | 2019-03-22 | 浙江农林大学 | 一种基于迁移学习的树种识别方法 |
Non-Patent Citations (1)
Title |
---|
徐志京等: "青光眼眼底图像的迁移学习分类方法", 《计算机工程与应用》, pages 1 - 10 * |
Cited By (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111950630A (zh) * | 2020-08-12 | 2020-11-17 | 深圳市烨嘉为技术有限公司 | 基于两阶段迁移学习的小样本工业产品缺陷分类方法 |
CN111950630B (zh) * | 2020-08-12 | 2022-08-02 | 深圳市烨嘉为技术有限公司 | 基于两阶段迁移学习的小样本工业产品缺陷分类方法 |
CN112132782A (zh) * | 2020-08-21 | 2020-12-25 | 广东省人民医院 | 一种基于深度神经网络对dme分型进行处理的方法和终端 |
CN112132782B (zh) * | 2020-08-21 | 2023-09-05 | 广东省人民医院 | 一种基于深度神经网络对dme分型进行处理的方法和终端 |
CN112036461A (zh) * | 2020-08-24 | 2020-12-04 | 湖北师范大学 | 手写数字图像识别方法、装置、设备及计算机存储介质 |
CN112036461B (zh) * | 2020-08-24 | 2023-06-02 | 湖北师范大学 | 手写数字图像识别方法、装置、设备及计算机存储介质 |
CN112529835A (zh) * | 2020-10-22 | 2021-03-19 | 浙江大学 | 一种基于源相机识别的图像拼接篡改检测与定位方法 |
CN112200797A (zh) * | 2020-10-28 | 2021-01-08 | 佛山市南海区广工大数控装备协同创新研究院 | 一种基于pcb噪声标注数据的有效训练方法 |
CN112200797B (zh) * | 2020-10-28 | 2024-04-05 | 佛山市南海区广工大数控装备协同创新研究院 | 一种基于pcb噪声标注数据的有效训练方法 |
CN112434588A (zh) * | 2020-11-18 | 2021-03-02 | 青岛慧拓智能机器有限公司 | 一种端到端驾驶员高速道路换道意图的推理方法 |
CN112308034A (zh) * | 2020-11-25 | 2021-02-02 | 中国科学院深圳先进技术研究院 | 一种性别分类的方法、设备、终端及计算机存储介质 |
CN112419303B (zh) * | 2020-12-09 | 2023-08-15 | 上海联影医疗科技股份有限公司 | 神经网络训练方法、系统、可读存储介质和设备 |
CN112419303A (zh) * | 2020-12-09 | 2021-02-26 | 上海联影医疗科技股份有限公司 | 神经网络训练方法、系统、可读存储介质和设备 |
CN114693961B (zh) * | 2020-12-11 | 2024-05-14 | 北京航空航天大学 | 眼底照片分类方法、眼底图像处理方法和系统 |
CN114693961A (zh) * | 2020-12-11 | 2022-07-01 | 北京航空航天大学 | 眼底照片分类方法、眼底图像处理方法和系统 |
CN112651948A (zh) * | 2020-12-30 | 2021-04-13 | 重庆科技学院 | 一种基于机器视觉的青蒿素萃取智能跟踪与识别方法 |
CN112750109A (zh) * | 2021-01-14 | 2021-05-04 | 金陵科技学院 | 一种基于形态学和深度学习的制药设备安全监测模型 |
CN112750109B (zh) * | 2021-01-14 | 2023-06-30 | 金陵科技学院 | 一种基于形态学和深度学习的制药设备安全监测方法 |
CN112966759A (zh) * | 2021-03-15 | 2021-06-15 | 中国科学院长春光学精密机械与物理研究所 | 一种基于深度学习的眼底图像识别分类方法 |
CN112966759B (zh) * | 2021-03-15 | 2022-05-10 | 中国科学院长春光学精密机械与物理研究所 | 一种基于深度学习的眼底图像识别分类方法 |
CN113076873B (zh) * | 2021-04-01 | 2022-02-22 | 重庆邮电大学 | 一种基于多阶段训练的农作物病害长尾图像识别方法 |
CN113076873A (zh) * | 2021-04-01 | 2021-07-06 | 重庆邮电大学 | 一种基于多阶段训练的农作物病害长尾图像识别方法 |
CN113160233A (zh) * | 2021-04-02 | 2021-07-23 | 易普森智慧健康科技(深圳)有限公司 | 利用稀疏标注数据集训练实例分割神经网络模型的方法 |
CN113361654A (zh) * | 2021-07-12 | 2021-09-07 | 广州天鹏计算机科技有限公司 | 一种基于机器学习的图像识别方法和系统 |
CN113592027A (zh) * | 2021-08-16 | 2021-11-02 | 南京工程学院 | 一种基于迁移学习的医疗图像分类方法 |
CN113706524A (zh) * | 2021-09-17 | 2021-11-26 | 上海交通大学 | 基于持续学习方法改进的卷积神经网络翻拍图像检测系统 |
CN113706524B (zh) * | 2021-09-17 | 2023-11-14 | 上海交通大学 | 基于持续学习方法改进的卷积神经网络翻拍图像检测系统 |
CN114092740A (zh) * | 2021-11-11 | 2022-02-25 | 成都云芯医联科技有限公司 | 一种ai辅助下的免疫侧流传感的解析方法 |
CN114119557B (zh) * | 2021-11-29 | 2024-04-26 | 哈尔滨工业大学 | 一种基于卷积神经网络的光学元件快速暗场检测方法 |
CN114119557A (zh) * | 2021-11-29 | 2022-03-01 | 哈尔滨工业大学 | 一种基于卷积神经网络的光学元件快速暗场检测方法 |
CN114723674A (zh) * | 2022-03-16 | 2022-07-08 | 南昌大学 | 一种基于可解耦训练和推理的青光眼辅助筛查系统 |
CN114781483B (zh) * | 2022-03-18 | 2024-05-28 | 华南理工大学 | 一种基于卷积神经网络的草菇生长状态识别方法 |
CN114781483A (zh) * | 2022-03-18 | 2022-07-22 | 华南理工大学 | 一种基于卷积神经网络的草菇生长状态识别方法 |
CN114782355A (zh) * | 2022-04-18 | 2022-07-22 | 华南理工大学 | 基于改进vgg16网络的胃癌数字病理切片检测方法 |
CN114782355B (zh) * | 2022-04-18 | 2024-05-14 | 华南理工大学 | 基于改进vgg16网络的胃癌数字病理切片检测方法 |
CN114818803A (zh) * | 2022-04-25 | 2022-07-29 | 上海韶脑传感技术有限公司 | 基于神经元优化的单侧肢体患者运动想象脑电建模方法 |
CN114840900A (zh) * | 2022-05-18 | 2022-08-02 | 滁州学院 | 一种基于i-GBDT技术的衍生式BIM构件自动生成方法 |
CN114913592A (zh) * | 2022-05-18 | 2022-08-16 | 重庆邮电大学 | 一种基于卷积神经网络的眼底图像分类方法 |
CN115302963A (zh) * | 2022-10-12 | 2022-11-08 | 深圳市彩昇印刷机械有限公司 | 一种基于机器视觉的条形码印刷控制方法、系统及介质 |
CN115302963B (zh) * | 2022-10-12 | 2022-12-27 | 深圳市彩昇印刷机械有限公司 | 一种基于机器视觉的条形码印刷控制方法、系统及介质 |
CN115496954A (zh) * | 2022-11-03 | 2022-12-20 | 中国医学科学院阜外医院 | 眼底图像分类模型构建方法、设备及介质 |
CN117576573A (zh) * | 2024-01-16 | 2024-02-20 | 广州航海学院 | 基于改进vgg16模型的建筑氛围评价方法、系统、设备及介质 |
CN117576573B (zh) * | 2024-01-16 | 2024-05-17 | 广州航海学院 | 基于改进vgg16模型的建筑氛围评价方法、系统、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111476283A (zh) | 基于迁移学习的青光眼眼底图像识别方法 | |
CN111259982B (zh) | 一种基于注意力机制的早产儿视网膜图像分类方法和装置 | |
CN112132817B (zh) | 一种混合注意力机制的眼底图像视网膜血管分割方法 | |
CN108648191B (zh) | 基于贝叶斯宽度残差神经网络的害虫图像识别方法 | |
CN106485251B (zh) | 基于深度学习的鸡蛋胚胎分类 | |
CN109272048B (zh) | 一种基于深度卷积神经网络的模式识别方法 | |
CN112488234B (zh) | 一种基于注意力池化的端到端组织病理图像分类方法 | |
CN109635862B (zh) | 早产儿视网膜病plus病变分类方法 | |
CN110236483B (zh) | 一种基于深度残差网络的糖尿病性视网膜病变检测的方法 | |
CN114998210B (zh) | 一种基于深度学习目标检测的早产儿视网膜病变检测系统 | |
CN107871316B (zh) | 基于深度神经网络的x光片手骨兴趣区域自动提取方法 | |
CN111612856B (zh) | 用于彩色眼底图像的视网膜新生血管检测方法及成像方法 | |
Chen et al. | Detection of diabetic retinopathy using deep neural network | |
CN114038037B (zh) | 基于可分离残差注意力网络的表情标签修正和识别方法 | |
CN112150476A (zh) | 基于时空判别性特征学习的冠状动脉序列血管分割方法 | |
CN114881962A (zh) | 一种基于改进U-Net网络的视网膜图像血管分割方法 | |
CN112633257A (zh) | 基于改良卷积神经网络的马铃薯病害识别方法 | |
CN112348059A (zh) | 基于深度学习的多种染色病理图像分类方法及系统 | |
CN113012163A (zh) | 一种基于多尺度注意力网络的视网膜血管分割方法、设备及存储介质 | |
CN114648806A (zh) | 一种多机制自适应的眼底图像分割方法 | |
Yang et al. | Classification of diabetic retinopathy severity based on GCA attention mechanism | |
CN114998651A (zh) | 基于迁移学习的皮肤病变图像分类识别方法、系统及介质 | |
CN112749675A (zh) | 一种基于卷积神经网络的马铃薯病害识别方法 | |
Swastika et al. | The effect of regularization on deep learning methods for detection of malaria infection | |
Dong et al. | Supervised learning-based retinal vascular segmentation by m-unet full convolutional neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200731 |
|
WD01 | Invention patent application deemed withdrawn after publication |