CN114139611A - 基于MobileNet v2模型的垃圾图像分类方法及装置 - Google Patents
基于MobileNet v2模型的垃圾图像分类方法及装置 Download PDFInfo
- Publication number
- CN114139611A CN114139611A CN202111350678.9A CN202111350678A CN114139611A CN 114139611 A CN114139611 A CN 114139611A CN 202111350678 A CN202111350678 A CN 202111350678A CN 114139611 A CN114139611 A CN 114139611A
- Authority
- CN
- China
- Prior art keywords
- model
- mobilenet
- module
- bottlenet
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供一种基于MobileNet v2模型的垃圾图像分类方法及装置。包括:采集若干训练图片得到数据集并预处理;将预处理后的数据集划分为训练集和测试集;改进MobileNet v2模型:在MobileNet v2模型中加入通道注意力机制和空间注意力机制,得到Bottlenet_A模块;设置相关参数;将训练集输入到改进后的MobileNet v2模型中进行正向传播计算损失,并通过损失函数来进行反向传播更新改进后的MobileNet v2模型中的各种参数,直到损失函数收敛;使用训练好的MobileNet v2模型对新的垃圾图像进行分类。对生活垃圾的图像分类更加准确,提高工作效率。
Description
技术领域
本公开属于垃圾分类技术领域,具体涉及一种基于MobileNetv2模型的垃圾图像分类方法及装置。
背景技术
近年来,随着生活水平的提高和城市化的发展,生活垃圾数量急剧增加,全球许多城市面临“垃圾围城”危机。垃圾分类被认为是在现有环境下解决垃圾困境、提高资源利用率的主要措施。改进版MobileNet v2模型对生活垃圾图像分类的工作原理是先通过自己在生活中收集场景丰富的垃圾图片,将图片经过预处理,然后再将其放入到改进后的MobileNet v2模型中,得到分类结果;由于数据集来源于网络和现实生活照片,包括单物体、多个同类物体、复杂背景等多个场景,涉及光照、运动模糊、物体变形等多种干扰情况,另外拍摄距离的不同也会导致在不同图像中的相同目标存在巨大的尺寸差异,相比于一般图像,可能分类效果的精度不太高以及物品种类易识别错误。
发明内容
本公开旨在至少解决现有技术中存在的技术问题之一,提供一种基于MobileNetv2模型的垃圾图像分类方法及装置。
本公开的一方面,提供一种基于MobileNet v2模型的垃圾图像分类方法,所述方法包括:
采集若干训练图片得到数据集,并对所述数据集进行预处理;
将预处理后的数据集划分为训练集和测试集;
改进MobileNet v2模型:在MobileNet v2模型中加入通道注意力机制和空间注意力机制,得到Bottlenet_A模块;
设置相关参数:加载预训练权重,选择模型的优化器,设置权重衰减系数、学习率和batch_size,调整每一个阶段的宽度因子和输出通道数;
将所述训练集输入到所述改进后的MobileNet v2模型中进行正向传播计算损失,并通过损失函数来进行反向传播更新所述改进后的MobileNet v2模型中的各种参数,直到损失函数收敛,得到训练好的MobileNet v2模型;
使用所述训练好的MobileNet v2模型对新的垃圾图像进行分类。
在一些实施方式中,所述在MobileNet v2模型中加入通道注意力机制和空间注意力机制,得到Bottlenet_A模块,包括:
先通过1×1的PW卷积调整通道数,得到的特征层再经过3×3的DW卷积进行下采样同时可降低参数量,接着再经过1×1的PW卷积再次调整通道数,然后嵌入通道和空间注意力模块CBAM得到新的特征层,得到所述Bottlenet_A模块。
在一些实施方式中,所述改进MobileNet v2模型,还包括:
在MobileNet v2模型的基础块中加入多特征的融合,得到Bottlenet_I模块。
在一些实施方式中,所述在MobileNet v2模型的基础块中加入多特征的融合,得到Bottlenet_I模块,包括:
将原有的两个反向残差模块和一个1×1的PW卷积块按照Inception思想分成三个分枝进行特征提取,然后经过concat操作进行多特征的融合,增加了对尺度的适应性,同时加宽了宽度,提升了网络的性能,得到所述Bottlenet_I模块。
在一些实施方式中,所述改进MobileNet v2模型,还包括:
在MobileNet v2模型的每个阶段的模块间引入残差结构。
在一些实施方式中,在所述MobileNet v2模型包括Bottlenet_A模块和Bottlenet_I模块时,所述在MobileNet v2模型的每个阶段的模块间引入残差结构,包括:
在所述Bottlenet_A模块和所述Bottlenet_I模块之间引入所述残差结构。
在一些实施方式中,模型的优化器选择Adam,设置权重衰减系数为0.0005,学习率为0.001,batch_size为16。
本公开的另一方面,提供一种基于MobileNet v2模型的垃圾图像分类装置,所述装置包括:
采集模块,用于采集若干训练图片得到数据集,并对所述数据集进行预处理;
划分模块,用于将预处理后的数据集划分为训练集和测试集;
改进模块,用于改进MobileNet v2模型:在MobileNet v2模型中加入通道注意力机制和空间注意力机制,得到Bottlenet_A模块;
设置模块,用于设置相关参数:加载预训练权重,选择模型的优化器,设置权重衰减系数、学习率和batch_size,调整每一个阶段的宽度因子和输出通道数;
训练模块,用于将所述训练集输入到所述改进后的MobileNet v2模型中进行正向传播计算损失,并通过损失函数来进行反向传播更新所述改进后的MobileNet v2模型中的各种参数,直到损失函数收敛,得到训练好的MobileNet v2模型;
分类模块,用于使用所述训练好的MobileNet v2模型对新的垃圾图像进行分类。
本公开的另一方面,提供一种电子设备,包括:
一个或多个处理器;
存储单元,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,能使得所述一个或多个处理器实现根据前文记载的所述的方法。
本公开的另一方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时能实现根据前文记载的所述的方法。
本公开的基于MobileNet v2模型的垃圾图像分类方法及装置,对原有的MobileNet v2模型进行改进,在MobileNet v2加入了通道注意力机制和空间注意力机制等,训练得到的MobileNet v2模型对生活垃圾的图像分类更加准确,可以用于平时的垃圾自动分类,避免了劳动资源的浪费,提高了工作效率。
附图说明
图1为本公开一实施例的基于MobileNet v2模型的垃圾图像分类方法的流程图;
图2为本公开另一实施例的带有注意力机制的Bottlenet_A模块示意图;
图3为本公开另一实施例的多尺度特征融合的Bottlenet_I模块示意图;
图4为本公开另一实施例的最终改进的MobileNet v2模型示意图;
图5为本公开另一实施例的基于MobileNet v2模型的垃圾图像分类装置的结构示意图。
具体实施方式
为使本领域技术人员更好地理解本公开的技术方案,下面结合附图和具体实施方式对本公开作进一步详细描述。
本实施例的一方面,如图1所示,涉及一种基于MobileNet v2模型的垃圾图像分类方法S100,所述方法S100包括:
S110、采集若干训练图片得到数据集,并对所述数据集进行预处理。
具体地,在本步骤中,可以采集若干生活垃圾的图片,并在训练前进行预处理,将数据集的数据转换成的格式为大小为32×32的图片。
S120、将预处理后的数据集划分为训练集和测试集。
具体地,在本步骤中,例如,在步骤S110中的数据集中,可以采集得到大约4256张生活垃圾的图片,可以对数据集的4256张图片按照9:1的比例划分训练集和测试集,训练集3830张,测试集426张。
S130、改进MobileNet v2模型。
具体地,在本步骤中,对MobileNet v2模型作出以下三种改进:
改进一:在MobileNet v2模型中加入通道注意力机制和空间注意力机制,得到Bottlenet_A模块。
具体地为,先通过1×1的PW卷积调整通道数,得到的特征层再经过3×3的DW卷积进行下采样同时可降低参数量,接着再经过1×1的PW卷积再次调整通道数,然后嵌入通道和空间注意力模块CBAM得到新的特征层,得到所述Bottlenet_A模块,如图2所示。
改进二、在MobileNet v2模型的基础块中加入多特征的融合,得到Bottlenet_I模块。
具体地为,将原有的两个反向残差模块和一个1×1的PW卷积块按照Inception思想分成三个分枝进行特征提取,然后经过concat操作进行多特征的融合,增加了对尺度的适应性,同时加宽了宽度,提升了网络的性能,得到所述Bottlenet_I模块,如图3所示。
改进三、在MobileNet v2模型的每个阶段的模块间引入残差结构。
具体地为,在所述Bottlenet_A模块和所述Bottlenet_I模块之间引入所述残差结构,最终得到的改进后的MobileNet v2模型如图4所示。
S140、设置相关参数:加载预训练权重,选择模型的优化器,设置权重衰减系数、学习率和batch_size,调整每一个阶段的宽度因子和输出通道数。
具体地,在步骤中,模型的优化器选择Adam,设置权重衰减系数为0.0005,学习率为0.001,batch_size为16。
S150、将所述训练集输入到所述改进后的MobileNet v2模型中进行正向传播计算损失,并通过损失函数来进行反向传播更新所述改进后的MobileNet v2模型中的各种参数,直到损失函数收敛,得到训练好的MobileNet v2模型。
S160、使用所述训练好的MobileNet v2模型对新的垃圾图像进行分类。
具体地,在本步骤中,使用训练好的MobileNet v2模型对新的垃圾图像进行分类,对生活垃圾分类模型进行评估,将不同层的特征联系分析并引入感受野模块,增强模型的提取能力,提升检测精度,增强模型的泛化能力。
本公开的基于MobileNet v2模型的垃圾图像分类方法,对原有的MobileNet v2模型进行改进,在MobileNet v2加入了通道注意力机制和空间注意力机制等,训练得到的MobileNet v2模型对生活垃圾的图像分类更加准确,可以用于平时的垃圾自动分类,避免了劳动资源的浪费,提高了工作效率。
本公开的另一方面,如图5所示,提供一种基于MobileNet v2模型的垃圾图像分类装置100,该装置100可以适用于前文记载的方法。所述装置100包括:
采集模块110,用于采集若干训练图片得到数据集,并对所述数据集进行预处理;
划分模块120,用于将预处理后的数据集划分为训练集和测试集;
改进模块130,用于改进MobileNet v2模型:在MobileNet v2模型中加入通道注意力机制和空间注意力机制,得到Bottlenet_A模块;
设置模块140,用于设置相关参数:加载预训练权重,选择模型的优化器,设置权重衰减系数、学习率和batch_size,调整每一个阶段的宽度因子和输出通道数;
训练模块150,用于将所述训练集输入到所述改进后的MobileNet v2模型中进行正向传播计算损失,并通过损失函数来进行反向传播更新所述改进后的MobileNet v2模型中的各种参数,直到损失函数收敛,得到训练好的MobileNet v2模型;
分类模块160,用于使用所述训练好的MobileNet v2模型对新的垃圾图像进行分类。
本公开的基于MobileNet v2模型的垃圾图像分类装置,对原有的MobileNet v2模型进行改进,在MobileNet v2加入了通道注意力机制和空间注意力机制等,训练得到的MobileNet v2模型对生活垃圾的图像分类更加准确,可以用于平时的垃圾自动分类,避免了劳动资源的浪费,提高了工作效率。
本公开的另一方面,提供一种电子设备,包括:
一个或多个处理器;
存储单元,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,能使得所述一个或多个处理器实现根据前文记载的所述的方法。
本公开的另一方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时能实现根据前文记载的所述的方法。
其中,计算机可读介质可以是本公开的装置、设备、系统中所包含的,也可以是单独存在。
其中,计算机可读存储介质可是任何包含或存储程序的有形介质,其可以是电、磁、光、电磁、红外线、半导体的系统、装置、设备,更具体的例子包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、光纤、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件,或它们任意合适的组合。
其中,计算机可读存储介质也可包括在基带中或作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码,其具体的例子包括但不限于电磁信号、光信号,或它们任意合适的组合。
可以理解的是,以上实施方式仅仅是为了说明本公开的原理而采用的示例性实施方式,然而本公开并不局限于此。对于本领域内的普通技术人员而言,在不脱离本公开的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本公开的保护范围。
Claims (10)
1.一种基于MobileNet v2模型的垃圾图像分类方法,其特征在于,所述方法包括:
采集若干训练图片得到数据集,并对所述数据集进行预处理;
将预处理后的数据集划分为训练集和测试集;
改进MobileNet v2模型:在MobileNet v2模型中加入通道注意力机制和空间注意力机制,得到Bottlenet_A模块;
设置相关参数:加载预训练权重,选择模型的优化器,设置权重衰减系数、学习率和batch_size,调整每一个阶段的宽度因子和输出通道数;
将所述训练集输入到所述改进后的MobileNet v2模型中进行正向传播计算损失,并通过损失函数来进行反向传播更新所述改进后的MobileNet v2模型中的各种参数,直到损失函数收敛,得到训练好的MobileNet v2模型;
使用所述训练好的MobileNet v2模型对新的垃圾图像进行分类。
2.根据权利要求1所述的方法,其特征在于,所述在MobileNet v2模型中加入通道注意力机制和空间注意力机制,得到Bottlenet_A模块,包括:
先通过1×1的PW卷积调整通道数,得到的特征层再经过3×3的DW卷积进行下采样同时可降低参数量,接着再经过1×1的PW卷积再次调整通道数,然后嵌入通道和空间注意力模块CBAM得到新的特征层,得到所述Bottlenet_A模块。
3.根据权利要求1所述的方法,其特征在于,所述改进MobileNet v2模型,还包括:
在MobileNet v2模型的基础块中加入多特征的融合,得到Bottlenet_I模块。
4.根据权利要求3所述的方法,其特征在于,所述在MobileNet v2模型的基础块中加入多特征的融合,得到Bottlenet_I模块,包括:
将原有的两个反向残差模块和一个1×1的PW卷积块按照Inception思想分成三个分枝进行特征提取,然后经过concat操作进行多特征的融合,增加了对尺度的适应性,同时加宽了宽度,提升了网络的性能,得到所述Bottlenet_I模块。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述改进MobileNet v2模型,还包括:
在MobileNet v2模型的每个阶段的模块间引入残差结构。
6.根据权利要求5所述的方法,其特征在于,在所述MobileNet v2模型包括Bottlenet_A模块和Bottlenet_I模块时,所述在MobileNet v2模型的每个阶段的模块间引入残差结构,包括:
在所述Bottlenet_A模块和所述Bottlenet_I模块之间引入所述残差结构。
7.根据权利要求1至4任一项所述的方法,其特征在于,模型的优化器选择Adam,设置权重衰减系数为0.0005,学习率为0.001,batch_size为16。
8.一种基于MobileNet v2模型的垃圾图像分类装置,其特征在于,所述装置包括:
采集模块,用于采集若干训练图片得到数据集,并对所述数据集进行预处理;
划分模块,用于将预处理后的数据集划分为训练集和测试集;
改进模块,用于改进MobileNet v2模型:在MobileNet v2模型中加入通道注意力机制和空间注意力机制,得到Bottlenet_A模块;
设置模块,用于设置相关参数:加载预训练权重,选择模型的优化器,设置权重衰减系数、学习率和batch_size,调整每一个阶段的宽度因子和输出通道数;
训练模块,用于将所述训练集输入到所述改进后的MobileNet v2模型中进行正向传播计算损失,并通过损失函数来进行反向传播更新所述改进后的MobileNet v2模型中的各种参数,直到损失函数收敛,得到训练好的MobileNet v2模型;
分类模块,用于使用所述训练好的MobileNet v2模型对新的垃圾图像进行分类。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储单元,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,能使得所述一个或多个处理器实现根据权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时能实现根据权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111350678.9A CN114139611A (zh) | 2021-11-15 | 2021-11-15 | 基于MobileNet v2模型的垃圾图像分类方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111350678.9A CN114139611A (zh) | 2021-11-15 | 2021-11-15 | 基于MobileNet v2模型的垃圾图像分类方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114139611A true CN114139611A (zh) | 2022-03-04 |
Family
ID=80393211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111350678.9A Pending CN114139611A (zh) | 2021-11-15 | 2021-11-15 | 基于MobileNet v2模型的垃圾图像分类方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114139611A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114782931A (zh) * | 2022-04-22 | 2022-07-22 | 电子科技大学 | 改进MobileNetv2网络的驾驶行为分类方法 |
CN116055174A (zh) * | 2023-01-10 | 2023-05-02 | 吉林大学 | 一种基于改进MobileNetV2的车联网入侵检测方法 |
-
2021
- 2021-11-15 CN CN202111350678.9A patent/CN114139611A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114782931A (zh) * | 2022-04-22 | 2022-07-22 | 电子科技大学 | 改进MobileNetv2网络的驾驶行为分类方法 |
CN114782931B (zh) * | 2022-04-22 | 2023-09-29 | 电子科技大学 | 改进MobileNetv2网络的驾驶行为分类方法 |
CN116055174A (zh) * | 2023-01-10 | 2023-05-02 | 吉林大学 | 一种基于改进MobileNetV2的车联网入侵检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240161474A1 (en) | Neural Network Inference Acceleration Method, Target Detection Method, Device, and Storage Medium | |
CN114139611A (zh) | 基于MobileNet v2模型的垃圾图像分类方法及装置 | |
CN110008853B (zh) | 行人检测网络及模型训练方法、检测方法、介质、设备 | |
CN113076992A (zh) | 一种生活垃圾检测方法及装置 | |
CN113569672A (zh) | 轻量级目标检测与故障识别方法、装置及系统 | |
CN116452950A (zh) | 一种基于改进YOLOv5模型的多目标垃圾检测方法 | |
CN111753870B (zh) | 目标检测模型的训练方法、装置和存储介质 | |
CN116823793A (zh) | 设备缺陷检测方法、装置、电子设备和可读存储介质 | |
CN113657423A (zh) | 适用于小体积零件与堆叠零件的目标检测方法及其应用 | |
CN116758407A (zh) | 一种基于CenterNet的水下小目标检测方法及装置 | |
CN117292313A (zh) | 一种基于改进YOLOv7模型的小目标漂浮垃圾检测方法 | |
CN111680575A (zh) | 一种人类上皮细胞染色分类装置、设备及存储介质 | |
CN116757971B (zh) | 一种基于周围光的图像自动调整方法 | |
CN113128362A (zh) | 一种基于yolov3的无人机视角下小目标快速检测方法 | |
CN117036392A (zh) | 图像检测方法及相关装置 | |
CN115661542A (zh) | 一种基于特征关系迁移的小样本目标检测方法 | |
CN113128479A (zh) | 一种学习噪声区域信息的人脸检测方法及装置 | |
CN118486412B (zh) | 一种多模型联合的元表面设计方法、系统及介质 | |
CN112949730B (zh) | 少样本的目标检测方法、装置、存储介质及设备 | |
CN118229717B (zh) | 一种似圆轮廓图像分割方法、系统和介质 | |
CN117197592B (zh) | 一种目标检测模型训练方法、装置、电子设备及介质 | |
CN118429643A (zh) | 一种基于Deeplabv3+改进的轻量化高效语义分割算法 | |
CN118628940A (zh) | 基于多尺度融合及动态感知的无人机目标检测方法及系统 | |
CN118365864A (zh) | 一种轻量化的低照度目标检测方法 | |
CN118135369A (zh) | 一种基于改进yolov7模型的目标检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |