CN114139611A

CN114139611A - 基于MobileNet v2模型的垃圾图像分类方法及装置

Info

Publication number: CN114139611A
Application number: CN202111350678.9A
Authority: CN
Inventors: 张澈; 杨继明; 曹利蒲; 曹智名; 王军; 田长风
Original assignee: Beijing Huaneng Xinrui Control Technology Co Ltd
Current assignee: Beijing Huaneng Xinrui Control Technology Co Ltd
Priority date: 2021-11-15
Filing date: 2021-11-15
Publication date: 2022-03-04

Abstract

本公开提供一种基于MobileNet v2模型的垃圾图像分类方法及装置。包括：采集若干训练图片得到数据集并预处理；将预处理后的数据集划分为训练集和测试集；改进MobileNet v2模型：在MobileNet v2模型中加入通道注意力机制和空间注意力机制，得到Bottlenet_A模块；设置相关参数；将训练集输入到改进后的MobileNet v2模型中进行正向传播计算损失，并通过损失函数来进行反向传播更新改进后的MobileNet v2模型中的各种参数，直到损失函数收敛；使用训练好的MobileNet v2模型对新的垃圾图像进行分类。对生活垃圾的图像分类更加准确，提高工作效率。

Description

基于MobileNet v2模型的垃圾图像分类方法及装置

技术领域

本公开属于垃圾分类技术领域，具体涉及一种基于MobileNetv2模型的垃圾图像分类方法及装置。

背景技术

近年来，随着生活水平的提高和城市化的发展，生活垃圾数量急剧增加，全球许多城市面临“垃圾围城”危机。垃圾分类被认为是在现有环境下解决垃圾困境、提高资源利用率的主要措施。改进版MobileNet v2模型对生活垃圾图像分类的工作原理是先通过自己在生活中收集场景丰富的垃圾图片，将图片经过预处理，然后再将其放入到改进后的MobileNet v2模型中，得到分类结果；由于数据集来源于网络和现实生活照片，包括单物体、多个同类物体、复杂背景等多个场景，涉及光照、运动模糊、物体变形等多种干扰情况，另外拍摄距离的不同也会导致在不同图像中的相同目标存在巨大的尺寸差异，相比于一般图像，可能分类效果的精度不太高以及物品种类易识别错误。

发明内容

本公开旨在至少解决现有技术中存在的技术问题之一，提供一种基于MobileNetv2模型的垃圾图像分类方法及装置。

本公开的一方面，提供一种基于MobileNet v2模型的垃圾图像分类方法，所述方法包括：

采集若干训练图片得到数据集，并对所述数据集进行预处理；

将预处理后的数据集划分为训练集和测试集；

改进MobileNet v2模型：在MobileNet v2模型中加入通道注意力机制和空间注意力机制，得到Bottlenet_A模块；

设置相关参数：加载预训练权重，选择模型的优化器，设置权重衰减系数、学习率和batch_size，调整每一个阶段的宽度因子和输出通道数；

将所述训练集输入到所述改进后的MobileNet v2模型中进行正向传播计算损失，并通过损失函数来进行反向传播更新所述改进后的MobileNet v2模型中的各种参数，直到损失函数收敛，得到训练好的MobileNet v2模型；

使用所述训练好的MobileNet v2模型对新的垃圾图像进行分类。

在一些实施方式中，所述在MobileNet v2模型中加入通道注意力机制和空间注意力机制，得到Bottlenet_A模块，包括：

先通过1×1的PW卷积调整通道数，得到的特征层再经过3×3的DW卷积进行下采样同时可降低参数量，接着再经过1×1的PW卷积再次调整通道数，然后嵌入通道和空间注意力模块CBAM得到新的特征层，得到所述Bottlenet_A模块。

在一些实施方式中，所述改进MobileNet v2模型，还包括：

在MobileNet v2模型的基础块中加入多特征的融合，得到Bottlenet_I模块。

在一些实施方式中，所述在MobileNet v2模型的基础块中加入多特征的融合，得到Bottlenet_I模块，包括：

将原有的两个反向残差模块和一个1×1的PW卷积块按照Inception思想分成三个分枝进行特征提取，然后经过concat操作进行多特征的融合，增加了对尺度的适应性，同时加宽了宽度，提升了网络的性能，得到所述Bottlenet_I模块。

在一些实施方式中，所述改进MobileNet v2模型，还包括：

在MobileNet v2模型的每个阶段的模块间引入残差结构。

在一些实施方式中，在所述MobileNet v2模型包括Bottlenet_A模块和Bottlenet_I模块时，所述在MobileNet v2模型的每个阶段的模块间引入残差结构，包括：

在所述Bottlenet_A模块和所述Bottlenet_I模块之间引入所述残差结构。

在一些实施方式中，模型的优化器选择Adam，设置权重衰减系数为0.0005，学习率为0.001，batch_size为16。

本公开的另一方面，提供一种基于MobileNet v2模型的垃圾图像分类装置，所述装置包括：

采集模块，用于采集若干训练图片得到数据集，并对所述数据集进行预处理；

划分模块，用于将预处理后的数据集划分为训练集和测试集；

改进模块，用于改进MobileNet v2模型：在MobileNet v2模型中加入通道注意力机制和空间注意力机制，得到Bottlenet_A模块；

设置模块，用于设置相关参数：加载预训练权重，选择模型的优化器，设置权重衰减系数、学习率和batch_size，调整每一个阶段的宽度因子和输出通道数；

训练模块，用于将所述训练集输入到所述改进后的MobileNet v2模型中进行正向传播计算损失，并通过损失函数来进行反向传播更新所述改进后的MobileNet v2模型中的各种参数，直到损失函数收敛，得到训练好的MobileNet v2模型；

分类模块，用于使用所述训练好的MobileNet v2模型对新的垃圾图像进行分类。

本公开的另一方面，提供一种电子设备，包括：

一个或多个处理器；

存储单元，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，能使得所述一个或多个处理器实现根据前文记载的所述的方法。

本公开的另一方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时能实现根据前文记载的所述的方法。

本公开的基于MobileNet v2模型的垃圾图像分类方法及装置，对原有的MobileNet v2模型进行改进，在MobileNet v2加入了通道注意力机制和空间注意力机制等，训练得到的MobileNet v2模型对生活垃圾的图像分类更加准确，可以用于平时的垃圾自动分类，避免了劳动资源的浪费，提高了工作效率。

附图说明

图1为本公开一实施例的基于MobileNet v2模型的垃圾图像分类方法的流程图；

图2为本公开另一实施例的带有注意力机制的Bottlenet_A模块示意图；

图3为本公开另一实施例的多尺度特征融合的Bottlenet_I模块示意图；

图4为本公开另一实施例的最终改进的MobileNet v2模型示意图；

图5为本公开另一实施例的基于MobileNet v2模型的垃圾图像分类装置的结构示意图。

具体实施方式

为使本领域技术人员更好地理解本公开的技术方案，下面结合附图和具体实施方式对本公开作进一步详细描述。

本实施例的一方面，如图1所示，涉及一种基于MobileNet v2模型的垃圾图像分类方法S100，所述方法S100包括：

S110、采集若干训练图片得到数据集，并对所述数据集进行预处理。

具体地，在本步骤中，可以采集若干生活垃圾的图片，并在训练前进行预处理，将数据集的数据转换成的格式为大小为32×32的图片。

S120、将预处理后的数据集划分为训练集和测试集。

具体地，在本步骤中，例如，在步骤S110中的数据集中，可以采集得到大约4256张生活垃圾的图片，可以对数据集的4256张图片按照9：1的比例划分训练集和测试集，训练集3830张，测试集426张。

S130、改进MobileNet v2模型。

具体地，在本步骤中，对MobileNet v2模型作出以下三种改进：

改进一：在MobileNet v2模型中加入通道注意力机制和空间注意力机制，得到Bottlenet_A模块。

具体地为，先通过1×1的PW卷积调整通道数，得到的特征层再经过3×3的DW卷积进行下采样同时可降低参数量，接着再经过1×1的PW卷积再次调整通道数，然后嵌入通道和空间注意力模块CBAM得到新的特征层，得到所述Bottlenet_A模块，如图2所示。

改进二、在MobileNet v2模型的基础块中加入多特征的融合，得到Bottlenet_I模块。

具体地为，将原有的两个反向残差模块和一个1×1的PW卷积块按照Inception思想分成三个分枝进行特征提取，然后经过concat操作进行多特征的融合，增加了对尺度的适应性，同时加宽了宽度，提升了网络的性能，得到所述Bottlenet_I模块，如图3所示。

改进三、在MobileNet v2模型的每个阶段的模块间引入残差结构。

具体地为，在所述Bottlenet_A模块和所述Bottlenet_I模块之间引入所述残差结构，最终得到的改进后的MobileNet v2模型如图4所示。

S140、设置相关参数：加载预训练权重，选择模型的优化器，设置权重衰减系数、学习率和batch_size，调整每一个阶段的宽度因子和输出通道数。

具体地，在步骤中，模型的优化器选择Adam，设置权重衰减系数为0.0005，学习率为0.001，batch_size为16。

S150、将所述训练集输入到所述改进后的MobileNet v2模型中进行正向传播计算损失，并通过损失函数来进行反向传播更新所述改进后的MobileNet v2模型中的各种参数，直到损失函数收敛，得到训练好的MobileNet v2模型。

S160、使用所述训练好的MobileNet v2模型对新的垃圾图像进行分类。

具体地，在本步骤中，使用训练好的MobileNet v2模型对新的垃圾图像进行分类，对生活垃圾分类模型进行评估，将不同层的特征联系分析并引入感受野模块，增强模型的提取能力，提升检测精度，增强模型的泛化能力。

本公开的基于MobileNet v2模型的垃圾图像分类方法，对原有的MobileNet v2模型进行改进，在MobileNet v2加入了通道注意力机制和空间注意力机制等，训练得到的MobileNet v2模型对生活垃圾的图像分类更加准确，可以用于平时的垃圾自动分类，避免了劳动资源的浪费，提高了工作效率。

本公开的另一方面，如图5所示，提供一种基于MobileNet v2模型的垃圾图像分类装置100，该装置100可以适用于前文记载的方法。所述装置100包括：

采集模块110，用于采集若干训练图片得到数据集，并对所述数据集进行预处理；

划分模块120，用于将预处理后的数据集划分为训练集和测试集；

改进模块130，用于改进MobileNet v2模型：在MobileNet v2模型中加入通道注意力机制和空间注意力机制，得到Bottlenet_A模块；

设置模块140，用于设置相关参数：加载预训练权重，选择模型的优化器，设置权重衰减系数、学习率和batch_size，调整每一个阶段的宽度因子和输出通道数；

训练模块150，用于将所述训练集输入到所述改进后的MobileNet v2模型中进行正向传播计算损失，并通过损失函数来进行反向传播更新所述改进后的MobileNet v2模型中的各种参数，直到损失函数收敛，得到训练好的MobileNet v2模型；

分类模块160，用于使用所述训练好的MobileNet v2模型对新的垃圾图像进行分类。

本公开的基于MobileNet v2模型的垃圾图像分类装置，对原有的MobileNet v2模型进行改进，在MobileNet v2加入了通道注意力机制和空间注意力机制等，训练得到的MobileNet v2模型对生活垃圾的图像分类更加准确，可以用于平时的垃圾自动分类，避免了劳动资源的浪费，提高了工作效率。

本公开的另一方面，提供一种电子设备，包括：

一个或多个处理器；

其中，计算机可读介质可以是本公开的装置、设备、系统中所包含的，也可以是单独存在。

其中，计算机可读存储介质可是任何包含或存储程序的有形介质，其可以是电、磁、光、电磁、红外线、半导体的系统、装置、设备，更具体的例子包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、光纤、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件，或它们任意合适的组合。

其中，计算机可读存储介质也可包括在基带中或作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码，其具体的例子包括但不限于电磁信号、光信号，或它们任意合适的组合。

可以理解的是，以上实施方式仅仅是为了说明本公开的原理而采用的示例性实施方式，然而本公开并不局限于此。对于本领域内的普通技术人员而言，在不脱离本公开的精神和实质的情况下，可以做出各种变型和改进，这些变型和改进也视为本公开的保护范围。

Claims

1.一种基于MobileNet v2模型的垃圾图像分类方法，其特征在于，所述方法包括：

将预处理后的数据集划分为训练集和测试集；

使用所述训练好的MobileNet v2模型对新的垃圾图像进行分类。

2.根据权利要求1所述的方法，其特征在于，所述在MobileNet v2模型中加入通道注意力机制和空间注意力机制，得到Bottlenet_A模块，包括：

3.根据权利要求1所述的方法，其特征在于，所述改进MobileNet v2模型，还包括：

4.根据权利要求3所述的方法，其特征在于，所述在MobileNet v2模型的基础块中加入多特征的融合，得到Bottlenet_I模块，包括：

5.根据权利要求1至4任一项所述的方法，其特征在于，所述改进MobileNet v2模型，还包括：

在MobileNet v2模型的每个阶段的模块间引入残差结构。

6.根据权利要求5所述的方法，其特征在于，在所述MobileNet v2模型包括Bottlenet_A模块和Bottlenet_I模块时，所述在MobileNet v2模型的每个阶段的模块间引入残差结构，包括：

7.根据权利要求1至4任一项所述的方法，其特征在于，模型的优化器选择Adam，设置权重衰减系数为0.0005，学习率为0.001，batch_size为16。

8.一种基于MobileNet v2模型的垃圾图像分类装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储单元，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，能使得所述一个或多个处理器实现根据权利要求1至7任一项所述的方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时能实现根据权利要求1至7任一项所述的方法。