CN111340133A - 一种基于深度卷积神经网络的图像分类处理方法 - Google Patents

一种基于深度卷积神经网络的图像分类处理方法 Download PDF

Info

Publication number
CN111340133A
CN111340133A CN202010162337.8A CN202010162337A CN111340133A CN 111340133 A CN111340133 A CN 111340133A CN 202010162337 A CN202010162337 A CN 202010162337A CN 111340133 A CN111340133 A CN 111340133A
Authority
CN
China
Prior art keywords
neural network
convolutional neural
classification
model
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010162337.8A
Other languages
English (en)
Inventor
武军成
张攀
肖建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Changhong Electric Co Ltd
Original Assignee
Sichuan Changhong Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Changhong Electric Co Ltd filed Critical Sichuan Changhong Electric Co Ltd
Priority to CN202010162337.8A priority Critical patent/CN111340133A/zh
Publication of CN111340133A publication Critical patent/CN111340133A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images
    • G06V2201/032Recognition of patterns in medical or anatomical images of protuberances, polyps nodules, etc.

Abstract

本发明公开了一种基于深度卷积神经网络的图像分类处理方法,包括:建立VGG16卷积神经网络分类模型;将已有的MIAS医学图像数据库中的图像处理成适用于VGG16卷积神经网络分类模型的图像,将图像分成训练集和测试集;对已有的VGG16卷积神经网络进行迁移学习,即前面的层不动,对softmax层进行改动;将训练集输入修改后的VGG16卷积神经网络进行分类训练,得到训练后的VGG模型;将测试集输入训练后的VGG模型,输出图像预测结果。本发明保留较大局部范围内的特征相关性,因此可以使图像分割的关键特征更加明显,病变区域能够清晰高效地被发现;其次基于VGG模型的计算量要小于其他模型。

Description

一种基于深度卷积神经网络的图像分类处理方法
技术领域
本发明涉及图像处理技术领域,具体的说,是一种基于深度卷积神经网络的图像分类处理方法。
背景技术
传统医学图像处理方法是采用稀疏表征图像,通过大规模地训练支持向量机的进行图像分类,而此方法的主要缺陷在于稀疏编码和分类模型是在不同目标函数的监督下公开训练得到的,即得到的医学图像中分割出一些可能存在癌变的待定区域,然后提取这些待定区域的结构、纹理特征作为立足点来训练分类器,然后将数据进行分类。由于上述缺陷,因此分割可能存在的待定区域时由于边界模糊,造成待定区域的选取出现偏差错误;再加上医学图像通常对比度较低,组织特征的可变性、不同组织之间或者组织和病灶之间边界的模糊性以及微细结构(如血管、神经等)分布的复杂性,因此,传统的图像处理方法无法做到准确的识别出医学图像的癌变区域的问题。
发明内容
本发明的目的在于提供一种基于深度卷积神经网络的图像分类处理方法,用于解决现有技术中无法做到准确的识别出医学图像的癌变区域的问题。
本发明通过下述技术方案解决上述问题:
一种基于深度卷积神经网络的图像分类处理方法,包括:
步骤S1:基于MATLAB环境建立VGG16卷积神经网络分类模型,VGG16卷积神经网络分类模型具有用于从数据库获取数据集的调用接口;VGG16深度卷积神经网络它探索了卷积神经网络的深度与其性能之间的关系,通过反复堆叠3×3的小型卷积核和2×2的最大池化层,成功地构筑了16到19层深的卷积神经网络。相比之前的网络结构,VGGNet的出错率有了很大程度上的降低。VGGNet的结构非常简洁,整个网络都使用了同样大小的卷积核尺寸(如3×3)和最大池化尺寸(如2×2);
步骤S2:将已有的MIAS医学图像数据库中的图像处理成适用于VGG16卷积神经网络分类模型的图像,将图像分成训练集和测试集;
步骤S3:对已有的VGG16卷积神经网络进行迁移学习,即前面的层不动,对softmax层进行改动,改为基于医学病变特征的特征提取并进行三分类;
步骤S4:按照训练最优比例,给模型足够多的训练集,并将训练集输入修改后的VGG16卷积神经网络进行分类训练,得到训练后的VGG模型,其中训练过程为:
将图像依次经过卷积神经网格的卷积层、全连接层、池化层和预测层,卷积过程及基于一个固定的矩阵,在另外一个矩阵不断一格一格扫过去得到的数值的和;从卷积层输出的特征图会进入到池化层来进行特征选择和信息过滤;全连接即对于第n-1层和第n层而言,第n-1层的任意一个节点都和第n层所有节点有连接,即第n层的每个节点在进行计算的时候,激活函数的输入是n-1层所有节点的加权;池化层功能是用相邻区域的特征图统计量来代替特征图中单个点的结果;
步骤S5:将测试集输入训练后的VGG模型,输出图像预测结果。
(a)输入一张224×224×3的图像,经过大小为64个卷积核的两次卷积操作后,采用一次池化操作;
(b)又经过两次大小为128个卷积核的卷积操作之后,采用一次池化操作;
(c)然后经过大小为256个卷积核的三次卷积操作后,进行一次池化操作;
(d)然后经过大小为512个卷积核的三次卷积操作后,进行一次池化操作;
(e)最后进行三次全连接操作,然后输出预测结果;
7)多次输入尺寸大小符合的图像,重复第a至第e步的操作,输出图像预测结果。
相比同类的图像分类深度学习模型,VGG模型具有更小的卷积核,它可以最大程度的保留较大局部范围内的特征相关性,因此可以使图像分割的关键特征更加明显,病变区域能够清晰高效地被发现;其次,也是由于小卷积核的这个优势,VGG模型的计算量要小于其他模型,而不同卷积核大小的特征图和卷积参数差别并不大。
本发明与现有技术相比,具有以下优点及有益效果:
本发明保留较大局部范围内的特征相关性,因此可以使图像分割的关键特征更加明显,病变区域能够清晰高效地被发现;其次基于VGG模型的计算量要小于其他模型。
附图说明
图1为VGG16的结构示意图。
具体实施方式
下面结合实施例对本发明作进一步地详细说明,但本发明的实施方式不限于此。
实施例1:
结合附图1所示,一种基于深度卷积神经网络的图像分类处理方法,包括:
1.基于MATLAB环境建立一个VGG16卷积神经网络分类模型;
2.构建数据库:从MIAS医学图像数据库获取数据集,获取到的数据集中包括了a张医学图像,其中产生了癌症病变特征,产生癌症病变特征的医学图像一共b张,未产生癌症病变特征的正常医学图像c张,该数据库中包括了产生癌症病变的医学图像中产生了病变的具体位置的信息;
3.对上述数据库中的图像预处理,要求输入卷积神经网络的图像的尺寸必须保证大小一致,这里我们得到的图像的尺寸改为224×224×3的图像;
4.将这些图像按照设定比例q来划分为训练集和测试集;
5.打开MATLAB软件并在MATLAB软件中运行图像分类程序,使用keras中的内置函数将图像加载到内存中;
6.在完成了数据的读取任务后,进行搭建网络,这里使用Keras中的Sequential搭建一个简单的CNN结构;
7.在网络搭建完成后,需要将数据传给网络进行训练,对于上述的a×q(a张图像,比例为q,即a乘以q)张图像,进行VGG16模型训练:
(1)输入224×224×3的图像,经64个3×3的卷积核作两次卷积+ReLU,卷积后的尺寸变为224×224×64;
(2)作ma×pooling(最大化池化),池化单元尺寸为2×2(效果为图像尺寸减半),池化后的尺寸变为112×112×64;
(3)经128个3×3的卷积核作两次卷积+ReLU,尺寸变为112×112×128;
(4)作2×2的ma×pooling池化,尺寸变为56×56×128;
(5)经256个3×3的卷积核作三次卷积+ReLU,尺寸变为56×56×256;
(6)作2×2的ma×pooling池化,尺寸变为28×28×256;
(7)经512个3×3的卷积核作三次卷积+ReLU,尺寸变为28×28×512;
(8)作2×2的ma×pooling池化,尺寸变为14×14×512;
(9)经512个3×3的卷积核作三次卷积+ReLU,尺寸变为14×14×512;
(10)作2×2的ma×pooling池化,尺寸变为7×7×512;
(11)与两层1×1×4096,一层1×1×0.8a进行全连接+ReLU(共三层);
(12)对已有的成熟网络ImageNet进行迁移学习,即前面的层不动,看作是冻结的,对softmax层进行改动,改为基于病变特征的特征提取,进行三分类;
(13)通过softmax输出0.8a个预测结果;
8.输入上述所有测试集当中的图像,重复第1至第5步的操作,直到所设计的模型符合预期的置信率e,一个VGG16模型训练完成;
9.将做好的训练集和测试集的文件夹进行命名并放在指定的位置进行存放;
10.在训练完成后,对测试集输入模型,得到预测结果(判断为病变的概率),即可检测出医学图像的癌变现象。
所述VGG16模型训练中卷积过程其实就是基于一个固定的矩阵,在另外一个矩阵不断一格一格扫过去的到的数值的和。
所述VGG16模型训练中池化层功能是用相邻区域的特征图统计量来代替特征图中单个点的结果。
所述VGG16模型训练中Vgg16模型结构所使用的卷积核比较小,大多为三行三列的矩阵,即3×3的卷积核。而若想要表示左右上下和中心这些位置,最小单元就是三行三列的矩阵了。前面几层是卷积层和池化层的组合堆叠,后面几层是全连接层,最后是预测(softmax)层。通过这种使用多个较小卷积核的卷积层代替一个卷积核较大的卷积层的方式,一方面可以减少参数,另一方面相当于是进行了更多次的非线性映射操作,这样可以有效的增加网络的拟合能力和表达能力。
所述卷积层是卷积核在工作时,会按照特定的规律代入输入特征,在区域内对输入特征做矩阵元素乘法求和并叠加偏差量:
(i,j)∈{0,1,…L_l}L_(l+1)=(L_l+2p-f)/S_0+1
其中,为卷积核大小、为卷积步长、为填充层数。卷积核大小、步长和填充是卷积神经网络的超参数,他们三者共同决定了卷积层输出特征图的尺寸;
卷积步长:卷积核相邻两次扫过特征图时位置的距离,步长为某一常数值a时会在下一次扫描跳过a-1个像素,所以当卷积步长为1时,卷积核会逐个通过特征图的每一个元素;
卷积核大小:卷积层内部包含多个卷积核,组成卷积核的每个元素都对应一个权重系数和一个偏差量,类似于一个神经元。卷积层内每个神经元都与前一层中接近的多个神经元相连,卷积核的大小决定了区域的大小。
尽管这里参照本发明的解释性实施例对本发明进行了描述,上述实施例仅为本发明较佳的实施方式,本发明的实施方式并不受上述实施例的限制,应该理解,本领域技术人员可以设计出很多其他的修改和实施方式,这些修改和实施方式将落在本申请公开的原则范围和精神之内。

Claims (1)

1.一种基于深度卷积神经网络的图像分类处理方法,其特征在于,包括:
步骤S1:基于MATLAB环境建立VGG16卷积神经网络分类模型,VGG16卷积神经网络分类模型具有用于从数据库获取数据集的调用接口;
步骤S2:将已有的MIAS医学图像数据库中的图像处理成适用于VGG16卷积神经网络分类模型的图像,将图像分成训练集和测试集;
步骤S3:对已有的VGG16卷积神经网络进行迁移学习,即前面的层不动,对softmax层进行改动,改为基于医学病变特征的特征提取并进行三分类;
步骤S4:按照训练最优比例,将训练集输入修改后的VGG16卷积神经网络进行分类训练,得到训练后的VGG模型;
步骤S5:将测试集输入训练后的VGG模型,输出图像预测结果。
CN202010162337.8A 2020-03-10 2020-03-10 一种基于深度卷积神经网络的图像分类处理方法 Pending CN111340133A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010162337.8A CN111340133A (zh) 2020-03-10 2020-03-10 一种基于深度卷积神经网络的图像分类处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010162337.8A CN111340133A (zh) 2020-03-10 2020-03-10 一种基于深度卷积神经网络的图像分类处理方法

Publications (1)

Publication Number Publication Date
CN111340133A true CN111340133A (zh) 2020-06-26

Family

ID=71186584

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010162337.8A Pending CN111340133A (zh) 2020-03-10 2020-03-10 一种基于深度卷积神经网络的图像分类处理方法

Country Status (1)

Country Link
CN (1) CN111340133A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111832466A (zh) * 2020-07-08 2020-10-27 上海东普信息科技有限公司 基于vgg网络的暴力分拣识别方法、装置、设备及存储介质
CN111998936A (zh) * 2020-08-25 2020-11-27 四川长虹电器股份有限公司 一种基于迁移学习的设备异音检测方法及系统
CN113792666A (zh) * 2021-09-16 2021-12-14 哈尔滨工业大学(深圳) 一种基于扫描电镜图像的混凝土分类方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021936A (zh) * 2017-11-28 2018-05-11 天津大学 一种基于卷积神经网络vgg16的乳腺肿瘤分类算法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021936A (zh) * 2017-11-28 2018-05-11 天津大学 一种基于卷积神经网络vgg16的乳腺肿瘤分类算法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
徐志京 等: ""青光眼眼底图像的迁移学习分类方法"", 《网络首发:HTTP://KNS.CNKI.NET/KCMS/DETAIL/11.2127.TP.20191207.1328.012.HTML》 *
魏鑫磊: ""基于深度学习的乳腺图像分类研究"", 《中国硕士学位论文全文数据库 医药卫生科技辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111832466A (zh) * 2020-07-08 2020-10-27 上海东普信息科技有限公司 基于vgg网络的暴力分拣识别方法、装置、设备及存储介质
CN111998936A (zh) * 2020-08-25 2020-11-27 四川长虹电器股份有限公司 一种基于迁移学习的设备异音检测方法及系统
CN113792666A (zh) * 2021-09-16 2021-12-14 哈尔滨工业大学(深圳) 一种基于扫描电镜图像的混凝土分类方法及系统

Similar Documents

Publication Publication Date Title
CN106940816B (zh) 基于3d全卷积神经网络的ct图像肺结节检测系统
CN107154043B (zh) 一种基于3dcnn的肺结节假阳性样本抑制方法
CN105528638B (zh) 灰色关联分析法确定卷积神经网络隐层特征图个数的方法
CN109711426B (zh) 一种基于gan和迁移学习的病理图片分类装置及方法
CN111340133A (zh) 一种基于深度卷积神经网络的图像分类处理方法
CN106228185A (zh) 一种基于神经网络的通用图像分类识别系统及方法
CN112733659B (zh) 一种基于自步学习双流多尺度密集连接网络的高光谱图像分类方法
CN109543727B (zh) 一种基于竞争重构学习的半监督异常检测方法
CN108830326A (zh) 一种mri图像的自动分割方法及装置
CN110287777B (zh) 一种自然场景下的金丝猴躯体分割算法
CN110533683B (zh) 一种融合传统特征与深度特征的影像组学分析方法
Surya et al. Cassava leaf disease detection using convolutional neural networks
CN111611972B (zh) 基于多视图多任务集成学习的作物叶片种类识别方法
CN107423815A (zh) 一种基于计算机的低质量分类图像数据清洗方法
CN111984817A (zh) 一种基于自注意力机制加权的细粒度图像检索方法
CN113344077A (zh) 一种基于卷积胶囊网络结构的抗噪茄科病害识别方法
Ibrahim et al. Improving Date Fruit Classification Using CycleGAN-Generated Dataset.
CN111325134A (zh) 一种基于跨层连接卷积神经网络的遥感影像变化检测方法
CN106709869A (zh) 一种深度皮尔逊嵌入的维数约简方法
CN112232433B (zh) 一种基于双通路网络的肺结节良恶性分类方法
CN107798331A (zh) 离变焦图像序列特征提取方法和装置
Ma et al. Sprouting potato recognition based on deep neural network GoogLeNet
Lwin et al. Image Classification for Rice Leaf Disease Using AlexNet Model
CN114581470B (zh) 一种基于植物群落行为的图像边缘检测方法
CN110993121A (zh) 一种基于双协同线性流形的药物关联预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200626