CN112329857A

CN112329857A - 一种基于改进残差网络的图像分类方法

Info

Publication number: CN112329857A
Application number: CN202011231956.4A
Authority: CN
Inventors: 潘晓光; 张海轩; 焦璐璐; 张雅娜; 宋晓晨
Original assignee: Shanxi Sanyouhe Smart Information Technology Co Ltd
Current assignee: Shanxi Sanyouhe Smart Information Technology Co Ltd
Priority date: 2020-11-06
Filing date: 2020-11-06
Publication date: 2021-02-05

Abstract

本发明属于图像分类技术领域，具体涉及一种基于改进残差网络的图像分类方法，包括以下步骤：S1、获取公共数据集,完成模型训练所需数据集的构建；S2、对数据集统一尺度大小，同时进行归一化，数据划分,去噪等图像增强方法,并进行随机裁剪、随机擦除用于数据扩充,提高模型识别准确率；S3、使用层次分割模块和注意力机制用于改进残差网络模型用于提高模型识别性能,加快运行时间；S4、当模型的损失函数不再下降,评价指标达到最优且趋于稳定之后，保存模型。该方法解决了现有的网络模型对图像识别效果不佳，运行时间长的问题，通过使用层次分割模块和注意力机制改进ResNet50模型用于图像识别促进网络学习更强的特征，提高模型识别准确率和资源利用率。

Description

一种基于改进残差网络的图像分类方法

技术领域

本发明属于图像分类技术领域，具体涉及一种基于改进残差网络的图像分类方法。

背景技术

图像分类，顾名思义，就是为输入图像打上固定类别的标签。这是计算机视觉领域的核心问题之一，尽管听起来很简单，但图像分类有大量不同的实际应用。图像分类是人工智能领域的基本研究主题之一。

在图像识别中，模型的运算速度和计算机资源消耗越来越受到关注，但由于目前大多数卷积神经网络通过设计更深和更宽的网络模型来提高识别准确率，导致超参数增加，体系结构越来越复杂，使得模型运行所需时间极长且识别效果不佳。

目前，现有技术基于深度学习的大多数网络模型对图像识别效果不佳，而识别准确率较高的模型需更多的计算机资源，且运行时间更长。现有的ResNet50深度学习模型通过使用残差网络增加网络层数，导致计算复杂度提高，训练周期增长。

因此，有必要对上述问题做出改进。

发明内容

为了克服现有技术中存在的不足，本发明提供一种基于改进残差网络的图像分类方法，该方法可以解决现有的网络模型对图像识别效果不佳，运行时间更长，且现有的ResNet50深度学习模型计算复杂度高，训练周期长的问题。

本发明采用的技术方案为：

一种基于改进残差网络的图像分类方法，包括以下步骤：

S1、数据下载：获取公共数据集，完成模型训练所需数据集的构建；

S2、数据预处理：对获取到的数据集统一尺度大小，同时进行图像增强、数据扩充，提高模型识别准确率；

S3、识别模型：使用层次分割模块和注意力机制用于改进残差网络模型，进行模型识别性能的提高，加快运行时间；

S4、模型保存：当模型的损失函数不再下降、评价指标达到最优且趋于稳定之后，保存模型。

所述步骤S2中，所述图像增强的具体方法有归一化、数据划分和图像去噪，所述数据扩充的方法有随机裁剪、随机擦除。

所述归一化的具体方法为：对数据进行0均值归一化

μ为原始数据的均值，σ为原始数据的标准差；所述数据划分的具体步骤为：使用5折交叉验证，将数据集随机划分为5组，同时随机选取其中1组作为测试集，剩余的4组作为训练集，重复进行5次，将 5次实验结果获得的评价指标取平均值作为模型识别性能指标；所述图像去噪的具体方法为：使用高斯低通滤波对图像进行去噪处理。

所述数据扩充的具体步骤为：将获取的图像数据集裁剪为不同尺度大小的图片或者在原图中随机选择一个矩形区域，将该区域的像素替换为随机值，获得不同程度遮挡的图片，实现数据集的扩充。

所述步骤S3中包括模型构建，具体步骤为：融合层次分割模块和注意力机制模块的 ResNet50模型，其中ResNet50模型使用残差连接实现网络深度的增加，同时解决梯度消失的问题，其具体公式为F(x)＝H(x)-x，其中H(x)为残差网络的输出，F(x)为经过卷积操作的输出。

所述层次分割模块将ResNet50模型中的一部分卷积操作进行替换，将一个普通的特征图分为s组，每组为w个通道，其中只有第一组过滤器可以直接连接到下一层，而第二组特征图经过卷积操作后，将特征图按通道维度分为两组，其中一组直接连接到下一层，而另一组在通道维度上连接到下一组输入特征图，将该过程重复多次，直到处理完其余的输入特征图，最后，将每组直接输出的特征图进行特征融合，实现特征的重建过程。

所述注意力机制模块具体运行流程为：通过提取不同通道特征对关键信息的重要程度，优化特征分类效果，高层特征的通道图视为对不同语义特征的响应，并且相互联系，通道注意力挖掘通道图之间的依赖关系，获得每个特征通道的重要程度，并依照重要程度有选择性的去关注权重值大的信息，提高判别性语义的特征表示，从而提高模型对图像的识别能力，其中所需要用到的关系式

其中A^l和F^l分别代表第l层注意力映射和第l层特征映射，GAP为全局平均池化操作。

所述步骤S4中还包括对图像识别模型的性能评价，评价方程为：

其中TP为:正样本被正确识别为数量；TN为:负样本被正确识别为数量；FP为:负样本被错误识别为正样本；FN为:正样本被错误识别为负样本。

本发明与现有技术相比所具有的有益效果为：

本发明通过使用层次分割模块和注意力机制改进ResNet50模型用于图像识别，在不增加参数量和计算量的前提下，促进网络学习更强的特征，保持良好的性能和运算速度，而注意力的提出用于衡量特征的重要程度，帮助模型获得更关键和重要的信息，使模型做出更加准确的判断，提高模型识别准确率和资源利用率。同时本文模型的提出可用于多种类型的图像识别。

附图说明

图1为本发明的流程示意图；

图2为本发明的运行逻辑框架示意图。

具体实施方式

下面对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1、图2所示，一种基于改进残差网络的图像分类方法，通过使用ImageNet-1K数据集用于图像识别，该数据集包含1000个类别的图像。对获得的各类图像按一定规则缩放为一定尺寸，之后对数据进行预处理。将预处理的数据集输入到构建好的图像识别模型中，进行多次训练用于提高模型准确率，通过损失函数和评价指标获得最优的识别模型，完成模型的构建。包括以下步骤：

S1、数据下载：获取公共数据集，完成模型训练所需数据集的构建；为了验证模型识别性能，使用公共数据集ImageNet-1K用于图像识别评估，该数据集包含128万张训练图像和来自1000个类的5万张图像用于验证，同时所使用的公共数据集已进行图像标注，所包含的图像被标注划分分为1000个类别。

S2、数据预处理：由于获取的图像尺寸大小不一，对获取到的数据集统一尺度大小，同时进行图像增强、数据扩充，提高模型识别准确率；

所述归一化的具体方法为：对数据进行0均值归一化

μ为原始数据的均值，σ为原始数据的标准差；所述数据划分的具体步骤为：为了提升模型识别准确度使用5折交叉验证，将数据集随机划分为5组，同时随机选取其中1组作为测试集，剩余的4组作为训练集，重复进行5次，将5次实验结果获得的评价指标取平均值作为模型识别性能指标；所述图像去噪的具体方法为：使用高斯低通滤波对图像进行去噪处理，

δ为标准差。

所述数据扩充的具体步骤为：将获取的图像数据集裁剪为不同尺度大小的图片或者在原图中随机选择一个矩形区域，将该区域的像素替换为随机值，获得不同程度遮挡的图片，实现数据集的扩充，用于实现数据集的扩充，防止过拟合，提高模型鲁棒性，提高模型识别准确率。

上述模块、单元或组件的划分仅仅是一种逻辑功能的划分，在实际实现时可以有其他的划分方式，例如多个模块和/或单元可以结合或集成于另一个系统中。作为分离部件说明的模块、单元、组件在物理上可以是分开的，也可以是不分开的。作为单元显示的部件可以是物理单元，也可以不是物理单元，即可以位于一个具体地方，也可以分布到网格单元中。因此可以根据实际需要选择其中的部分或全部的单元来实现实施例的方案。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质，包括但不限于磁盘存储器、CD-ROM、光学存储器等，上实施的计算机程序产品的形式。

上面仅对本发明的较佳实施例作了详细说明，但是本发明并不限于上述实施例，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下作出各种变化，各种变化均应包含在本发明的保护范围之内。

Claims

1.一种基于改进残差网络的图像分类方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种基于改进残差网络的图像分类方法，其特征在于：所述步骤S2中，所述图像增强的具体方法有归一化、数据划分和图像去噪，所述数据扩充的方法有随机裁剪、随机擦除。

3.根据权利要求2所述的一种基于改进残差网络的图像分类方法，其特征在于：所述归一化的具体方法为：对数据进行0均值归一化

μ为原始数据的均值，σ为原始数据的标准差；所述数据划分的具体步骤为：使用5折交叉验证，将数据集随机划分为5组，同时随机选取其中1组作为测试集，剩余的4组作为训练集，重复进行5次，将5次实验结果获得的评价指标取平均值作为模型识别性能指标；所述图像去噪的具体方法为：使用高斯低通滤波对图像进行去噪处理。

4.根据权利要求2所述的一种基于改进残差网络的图像分类方法，其特征在于：所述数据扩充的具体步骤为：将获取的图像数据集裁剪为不同尺度大小的图片或者在原图中随机选择一个矩形区域，将该区域的像素替换为随机值，获得不同程度遮挡的图片，实现数据集的扩充。

5.根据权利要求1所述的一种基于改进残差网络的图像分类方法，其特征在于：所述步骤S3中包括模型构建，具体步骤为：融合层次分割模块和注意力机制模块的ResNet50模型，其中ResNet50模型使用残差连接实现网络深度的增加，其具体公式为F(x)＝H(x)-x，其中H(x)为残差网络的输出，F(x)为经过卷积操作的输出。

6.根据权利要求5所述的一种基于改进残差网络的图像分类方法，其特征在于：所述层次分割模块将ResNet50模型中的一部分卷积操作进行替换，将一个普通的特征图分为s组，每组为w个通道，其中只有第一组过滤器可以直接连接到下一层，而第二组特征图经过卷积操作后，将特征图按通道维度分为两组，其中一组直接连接到下一层，而另一组在通道维度上连接到下一组输入特征图，将该过程重复多次，直到处理完其余的输入特征图，最后，将每组直接输出的特征图进行特征融合，实现特征的重建过程。

7.根据权利要求5所述的一种基于改进残差网络的图像分类方法，其特征在于：所述注意力机制模块具体运行流程为：通过提取不同通道特征对关键信息的重要程度，优化特征分类效果，高层特征的通道图视为对不同语义特征的响应，并且相互联系，通道注意力挖掘通道图之间的依赖关系，获得每个特征通道的重要程度，并依照重要程度有选择性的去关注权重值大的信息，提高判别性语义的特征表示，从而提高模型对图像的识别能力，其中所需要用到的关系式

8.根据权利要求1所述的一种基于改进残差网络的图像分类方法，其特征在于：所述步骤S4中还包括对图像识别模型的性能评价，评价方程为：