CN111340133A

CN111340133A - 一种基于深度卷积神经网络的图像分类处理方法

Info

Publication number: CN111340133A
Application number: CN202010162337.8A
Authority: CN
Inventors: 武军成; 张攀; 肖建
Original assignee: Sichuan Changhong Electric Co Ltd
Current assignee: Sichuan Changhong Electric Co Ltd
Priority date: 2020-03-10
Filing date: 2020-03-10
Publication date: 2020-06-26

Abstract

本发明公开了一种基于深度卷积神经网络的图像分类处理方法，包括：建立VGG16卷积神经网络分类模型；将已有的MIAS医学图像数据库中的图像处理成适用于VGG16卷积神经网络分类模型的图像，将图像分成训练集和测试集；对已有的VGG16卷积神经网络进行迁移学习，即前面的层不动，对softmax层进行改动；将训练集输入修改后的VGG16卷积神经网络进行分类训练，得到训练后的VGG模型；将测试集输入训练后的VGG模型，输出图像预测结果。本发明保留较大局部范围内的特征相关性，因此可以使图像分割的关键特征更加明显，病变区域能够清晰高效地被发现；其次基于VGG模型的计算量要小于其他模型。

Description

一种基于深度卷积神经网络的图像分类处理方法

技术领域

本发明涉及图像处理技术领域，具体的说，是一种基于深度卷积神经网络的图像分类处理方法。

背景技术

传统医学图像处理方法是采用稀疏表征图像，通过大规模地训练支持向量机的进行图像分类，而此方法的主要缺陷在于稀疏编码和分类模型是在不同目标函数的监督下公开训练得到的，即得到的医学图像中分割出一些可能存在癌变的待定区域，然后提取这些待定区域的结构、纹理特征作为立足点来训练分类器，然后将数据进行分类。由于上述缺陷，因此分割可能存在的待定区域时由于边界模糊，造成待定区域的选取出现偏差错误；再加上医学图像通常对比度较低，组织特征的可变性、不同组织之间或者组织和病灶之间边界的模糊性以及微细结构(如血管、神经等)分布的复杂性，因此，传统的图像处理方法无法做到准确的识别出医学图像的癌变区域的问题。

发明内容

本发明的目的在于提供一种基于深度卷积神经网络的图像分类处理方法，用于解决现有技术中无法做到准确的识别出医学图像的癌变区域的问题。

本发明通过下述技术方案解决上述问题：

一种基于深度卷积神经网络的图像分类处理方法，包括：

步骤S1：基于MATLAB环境建立VGG16卷积神经网络分类模型，VGG16卷积神经网络分类模型具有用于从数据库获取数据集的调用接口；VGG16深度卷积神经网络它探索了卷积神经网络的深度与其性能之间的关系，通过反复堆叠3×3的小型卷积核和2×2的最大池化层，成功地构筑了16到19层深的卷积神经网络。相比之前的网络结构，VGGNet的出错率有了很大程度上的降低。VGGNet的结构非常简洁，整个网络都使用了同样大小的卷积核尺寸(如3×3)和最大池化尺寸(如2×2)；

步骤S2：将已有的MIAS医学图像数据库中的图像处理成适用于VGG16卷积神经网络分类模型的图像，将图像分成训练集和测试集；

步骤S3：对已有的VGG16卷积神经网络进行迁移学习，即前面的层不动，对softmax层进行改动，改为基于医学病变特征的特征提取并进行三分类；

步骤S4：按照训练最优比例，给模型足够多的训练集，并将训练集输入修改后的VGG16卷积神经网络进行分类训练，得到训练后的VGG模型，其中训练过程为：

将图像依次经过卷积神经网格的卷积层、全连接层、池化层和预测层，卷积过程及基于一个固定的矩阵，在另外一个矩阵不断一格一格扫过去得到的数值的和；从卷积层输出的特征图会进入到池化层来进行特征选择和信息过滤；全连接即对于第n-1层和第n层而言，第n-1层的任意一个节点都和第n层所有节点有连接，即第n层的每个节点在进行计算的时候，激活函数的输入是n-1层所有节点的加权；池化层功能是用相邻区域的特征图统计量来代替特征图中单个点的结果；

步骤S5：将测试集输入训练后的VGG模型，输出图像预测结果。

(a)输入一张224×224×3的图像，经过大小为64个卷积核的两次卷积操作后，采用一次池化操作；

(b)又经过两次大小为128个卷积核的卷积操作之后，采用一次池化操作；

(c)然后经过大小为256个卷积核的三次卷积操作后，进行一次池化操作；

(d)然后经过大小为512个卷积核的三次卷积操作后，进行一次池化操作；

(e)最后进行三次全连接操作，然后输出预测结果；

7)多次输入尺寸大小符合的图像，重复第a至第e步的操作，输出图像预测结果。

相比同类的图像分类深度学习模型，VGG模型具有更小的卷积核，它可以最大程度的保留较大局部范围内的特征相关性，因此可以使图像分割的关键特征更加明显，病变区域能够清晰高效地被发现；其次，也是由于小卷积核的这个优势，VGG模型的计算量要小于其他模型，而不同卷积核大小的特征图和卷积参数差别并不大。

本发明与现有技术相比，具有以下优点及有益效果：

本发明保留较大局部范围内的特征相关性，因此可以使图像分割的关键特征更加明显，病变区域能够清晰高效地被发现；其次基于VGG模型的计算量要小于其他模型。

附图说明

图1为VGG16的结构示意图。

具体实施方式

下面结合实施例对本发明作进一步地详细说明，但本发明的实施方式不限于此。

实施例1：

结合附图1所示，一种基于深度卷积神经网络的图像分类处理方法，包括：

1.基于MATLAB环境建立一个VGG16卷积神经网络分类模型；

2.构建数据库：从MIAS医学图像数据库获取数据集，获取到的数据集中包括了a张医学图像，其中产生了癌症病变特征，产生癌症病变特征的医学图像一共b张，未产生癌症病变特征的正常医学图像c张，该数据库中包括了产生癌症病变的医学图像中产生了病变的具体位置的信息；

3.对上述数据库中的图像预处理，要求输入卷积神经网络的图像的尺寸必须保证大小一致，这里我们得到的图像的尺寸改为224×224×3的图像；

4.将这些图像按照设定比例q来划分为训练集和测试集；

5.打开MATLAB软件并在MATLAB软件中运行图像分类程序，使用keras中的内置函数将图像加载到内存中；

6.在完成了数据的读取任务后，进行搭建网络，这里使用Keras中的Sequential搭建一个简单的CNN结构；

7.在网络搭建完成后，需要将数据传给网络进行训练，对于上述的a×q(a张图像，比例为q，即a乘以q)张图像，进行VGG16模型训练：

(1)输入224×224×3的图像，经64个3×3的卷积核作两次卷积+ReLU，卷积后的尺寸变为224×224×64；

(2)作ma×pooling(最大化池化)，池化单元尺寸为2×2(效果为图像尺寸减半)，池化后的尺寸变为112×112×64；

(3)经128个3×3的卷积核作两次卷积+ReLU，尺寸变为112×112×128；

(4)作2×2的ma×pooling池化，尺寸变为56×56×128；

(5)经256个3×3的卷积核作三次卷积+ReLU，尺寸变为56×56×256；

(6)作2×2的ma×pooling池化，尺寸变为28×28×256；

(7)经512个3×3的卷积核作三次卷积+ReLU，尺寸变为28×28×512；

(8)作2×2的ma×pooling池化，尺寸变为14×14×512；

(9)经512个3×3的卷积核作三次卷积+ReLU，尺寸变为14×14×512；

(10)作2×2的ma×pooling池化，尺寸变为7×7×512；

(11)与两层1×1×4096，一层1×1×0.8a进行全连接+ReLU(共三层)；

(12)对已有的成熟网络ImageNet进行迁移学习，即前面的层不动，看作是冻结的，对softmax层进行改动，改为基于病变特征的特征提取，进行三分类；

(13)通过softmax输出0.8a个预测结果；

8.输入上述所有测试集当中的图像，重复第1至第5步的操作，直到所设计的模型符合预期的置信率e，一个VGG16模型训练完成；

9.将做好的训练集和测试集的文件夹进行命名并放在指定的位置进行存放；

10.在训练完成后，对测试集输入模型，得到预测结果(判断为病变的概率)，即可检测出医学图像的癌变现象。

所述VGG16模型训练中卷积过程其实就是基于一个固定的矩阵，在另外一个矩阵不断一格一格扫过去的到的数值的和。

所述VGG16模型训练中池化层功能是用相邻区域的特征图统计量来代替特征图中单个点的结果。

所述VGG16模型训练中Vgg16模型结构所使用的卷积核比较小，大多为三行三列的矩阵，即3×3的卷积核。而若想要表示左右上下和中心这些位置，最小单元就是三行三列的矩阵了。前面几层是卷积层和池化层的组合堆叠，后面几层是全连接层，最后是预测(softmax)层。通过这种使用多个较小卷积核的卷积层代替一个卷积核较大的卷积层的方式，一方面可以减少参数，另一方面相当于是进行了更多次的非线性映射操作，这样可以有效的增加网络的拟合能力和表达能力。

所述卷积层是卷积核在工作时，会按照特定的规律代入输入特征，在区域内对输入特征做矩阵元素乘法求和并叠加偏差量：

(i,j)∈{0,1,…L_l}L_(l+1)＝(L_l+2p-f)/S_0+1

其中，为卷积核大小、为卷积步长、为填充层数。卷积核大小、步长和填充是卷积神经网络的超参数，他们三者共同决定了卷积层输出特征图的尺寸；

卷积步长：卷积核相邻两次扫过特征图时位置的距离，步长为某一常数值a时会在下一次扫描跳过a-1个像素，所以当卷积步长为1时，卷积核会逐个通过特征图的每一个元素；

卷积核大小：卷积层内部包含多个卷积核，组成卷积核的每个元素都对应一个权重系数和一个偏差量，类似于一个神经元。卷积层内每个神经元都与前一层中接近的多个神经元相连，卷积核的大小决定了区域的大小。

尽管这里参照本发明的解释性实施例对本发明进行了描述，上述实施例仅为本发明较佳的实施方式，本发明的实施方式并不受上述实施例的限制，应该理解，本领域技术人员可以设计出很多其他的修改和实施方式，这些修改和实施方式将落在本申请公开的原则范围和精神之内。

Claims

1.一种基于深度卷积神经网络的图像分类处理方法，其特征在于，包括：

步骤S1：基于MATLAB环境建立VGG16卷积神经网络分类模型，VGG16卷积神经网络分类模型具有用于从数据库获取数据集的调用接口；

步骤S4：按照训练最优比例，将训练集输入修改后的VGG16卷积神经网络进行分类训练，得到训练后的VGG模型；