CN112364944B - 一种基于深度学习的生活垃圾分类方法 - Google Patents

一种基于深度学习的生活垃圾分类方法 Download PDF

Info

Publication number
CN112364944B
CN112364944B CN202011502665.4A CN202011502665A CN112364944B CN 112364944 B CN112364944 B CN 112364944B CN 202011502665 A CN202011502665 A CN 202011502665A CN 112364944 B CN112364944 B CN 112364944B
Authority
CN
China
Prior art keywords
data set
classification
network
resnet18
household garbage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011502665.4A
Other languages
English (en)
Other versions
CN112364944A (zh
Inventor
林志贤
郑佑顺
郭太良
周雄图
张永爱
林珊玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Mindu Innovation Laboratory
Original Assignee
Fuzhou University
Mindu Innovation Laboratory
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University, Mindu Innovation Laboratory filed Critical Fuzhou University
Priority to CN202011502665.4A priority Critical patent/CN112364944B/zh
Publication of CN112364944A publication Critical patent/CN112364944A/zh
Application granted granted Critical
Publication of CN112364944B publication Critical patent/CN112364944B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02WCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO WASTEWATER TREATMENT OR WASTE MANAGEMENT
    • Y02W30/00Technologies for solid waste management
    • Y02W30/10Waste collection, transportation, transfer or storage, e.g. segregated refuse collecting, electric or hybrid propulsion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于深度学习的生活垃圾分类方法。包括:建立生活垃圾数据集,采用数据增强方法扩充数据集;建立神经网络分类模型,使用幻象模块替换ResNet18残差单元的普通卷积,得到G‑ResNet18网络;将扩充后的数据集经过预处理操作后输入到G‑ResNet18网络进行分类训练;将待分类的生活垃圾图片经过预处理操作后输入到训练后的G‑ResNet18模型,输出分类结果;实验结果表明:G‑ResNet18网络在本实验数据集上的识别精度达到91.6%,识别精度提高了1%,网络的参数量减少了46%。本发明能在不降低网络识别精度的同时大大减少网络的参数量,可以应用于垃圾的智能分类。

Description

一种基于深度学习的生活垃圾分类方法
技术领域
本发明涉及深度学习图像分类算法应用研究领域,特别是一种基于深度学习的生活垃圾分类方法。
背景技术
根据中国城乡建设统计年鉴统计,我国城市生活垃圾的产生量由1979年的0.25亿吨增至2018年的2.28亿吨。随着人民生活水平的提高,垃圾产生量仍在上升。有效回收生活垃圾成为急需解决的问题,这对于可持续发展具有重大的意义。垃圾分类是回收的前提。目前,我国垃圾分类主要以人工分拣为主,存在劳动强度大,效率低等缺点。实现垃圾分拣的智能化与自动化具有重要的意义。垃圾图片分类算法有助于实现垃圾分拣的智能化与自动化。
近年来,越来越多的专家学者对垃圾分类算法进行了研究与实践。吴建等人使用传统的计算机视觉方法,手动提取特征,识别实验室废物垃圾。黄惠玲等人提出基于HSV的阈值分割算法和K均值聚类算法识别建筑垃圾图像。黄兴华等人提出基于纹理特征融合的道路垃圾图像识别算法。向伟等人提出改进的CaffeNet网络识别水面垃圾。但是缺乏针对生活垃圾图片分类算法的研究。目前,我国各城市全面推行垃圾分类制度,基本建立相应的法律法规和标准体系,将生活垃圾细分,大致可分为可回收垃圾、有害垃圾、厨余垃圾和其他垃圾四大类。针对我国垃圾分类现状,收集制作了小型生活垃圾数据集,选取经典网络ResNet18作为基础网络,使用GhostNet的幻象模块代替残差学习单元中的普通卷积,减少网络的参数量,提出基于幻象残差结构的垃圾图片分类算法。
发明内容
有鉴于此,本发明的目的是提出一种基于深度学习的生活垃圾分类方法,能在不降低网络识别精度的同时大大减少网络的参数量,可以应用于垃圾的智能分类。
本发明采用以下方案实现:一种基于深度学习的生活垃圾分类方法,包括以下步骤:
步骤S1:建立生活垃圾数据集,采用数据增强方法扩充训练数据集;
步骤S2:建立神经网络分类模型,将步骤S1扩充后的训练数据集经过预处理操作后输入到网络中进行分类训练,得到训练后的神经网络分类模型;
步骤S3: 将待分类的生活垃圾图片经过预处理操作后输入到步骤S2训练后的神经网络分类模型,输出分类结果。
进一步地,所述步骤S1的具体内容为:
采集不同大小、角度、光照下的常见生活垃圾图片作为数据集,将数据集打乱后按4:1随机划分为训练集和测试集。并采用随机水平翻转、随机垂直翻转、随机缩放、随机旋转、逆时针方向裁剪、水平偏移和竖直偏移的数据增强方法扩充训练数据。
进一步地,所述步骤S2具体包括以下步骤:
所述步骤S2具体包括以下步骤:
步骤S21:采用ResNet18作为基础网络,使用幻象模块Ghost Module替换ResNet18残差单元的普通卷积,得到幻象残差学习单元;通过顺序堆叠幻象残差学习单元得到G-ResNet18网络。
步骤S22:将步骤S1扩充后的训练数据集中的每张图像的大小统一缩放为(224 ,224)的大小,并将图像的每一个像素值乘以1/255,使每一个数值都处于0~1之间,获得预处理后的图像数据集;
步骤S23:将步骤S22预处理后得到图像数据集输入到步骤S21得到的G-ResNet18网络中进行分类训练,得到训练后的G-ResNet18模型即训练后的神经网络分类模型。
进一步地,所述步骤S3的具体内容为:
将待分类的生活垃圾图片缩放为(224 ,224)的大小后输入到训练后得到的神经网络分类模型中,输出分类结果。
与现有技术相比,本发明有以下有益效果:
本发明能在不降低网络识别精度的同时大大减少网络的参数量,可以应用于垃圾的智能分类。
附图说明
图1为本发明实施例的方法流程图。
图2为本发明实施例的幻象模块结构图。
图3为本发明实施例的幻象残差学习单元结构图。
图4为本发明实施例的幻象残差学习单元结构图。
图5为本发明实施例的G-ResNet18网络结构图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
如图1所示,本实施例提供了一种基于深度学习的生活垃圾分类方法,包括以下步骤:
步骤S1:建立生活垃圾数据集,采用数据增强方法扩充训练数据集;
步骤S2:建立神经网络分类模型,将步骤S1扩充后的训练数据集经过预处理操作后输入到网络中进行分类训练,得到训练后的神经网络分类模型;
步骤S3: 将待分类的生活垃圾图片经过预处理操作后输入到步骤S2训练后的神经网络分类模型,输出分类结果。
在本实施例中,所述步骤S1的具体内容为:
采集不同大小、角度、光照下的常见生活垃圾图片作为数据集,将数据集打乱后按4:1随机划分为训练集和测试集。并采用随机水平翻转、随机垂直翻转、随机缩放、随机旋转、逆时针方向裁剪、水平偏移和竖直偏移的数据增强方法扩充训练数据。本实验采集部分常见的生活垃圾图片构成数据集,类别和图片数量分别为废纸:579、易拉罐:568、茶叶渣:476、香蕉皮:421、烟蒂:478、口罩:502、一次性纸杯:506、纽扣电池:586。共8类,4116张图片;
在本实施例中,所述步骤S2具体包括以下步骤:
步骤S21:采用ResNet18作为基础网络,使用幻象模块Ghost Module(说明书附图2)替换ResNet18残差单元的普通卷积,得到幻象残差学习单元。当步长为1时,幻象残差学习单元如说明书附图3所示,当步长为2时,幻象残差学习单元如说明书附图4所示。通过顺序堆叠幻象残差学习单元得到G-ResNet18网络(说明书附图5);ResNet18网络的参数量为11186624, G-ResNet18网络的参数量为6063424,参数量减少了46%。幻象模块替换普通卷积:幻象模块如说明书附图2所示,相比于普通卷积,幻象模块分三步走。首先采用卷积核个数减半的普通卷积操作生成真实特征层,然后将真实特征层做深度卷积(卷积核大小取3x3,步长取1)进行线性变换获得幻象特征层,再将真实特征层与幻象特征层拼接到一起组成完整的特征层。若普通卷积的卷积核个数为n,步长为stride,卷积核大小为kernel,则幻象模块的普通卷积部分卷积核个数为n/2,步长为stride, 卷积核大小为kernel。说明书附图3:输入特征图经过幻象模块、BatchNormalization层、ReLu激活函数、幻象模块后得到的特征图与原始输入特征图做相加操作后再经过BatchNormalization层、ReLu激活函数得到输出特征图。说明书附图4:输入特征图经过幻象模块、BatchNormalization层、ReLu激活函数、幻象模块后得到的特征图与原始输入特征图经过普通卷积(卷积核大小取1x1,步长同幻象模块的普通卷积步长,卷积核数量为幻象模块的普通卷积核数量的两倍)后得到的特征图做相加操作后再经过BatchNormalization层、ReLu激活函数得到输出特征图。说明书附图5:第1层为输入,第2层为普通卷积,第3层为最大池化,第4-11层为幻象模块,第12层为全局平均池化,第13层为全连接层加softmax分类器。
步骤S22:将步骤S1扩充后的训练数据集中的每张图像的大小统一缩放为(224 ,224)的大小,并将图像的每一个像素值乘以1/255,使每一个数值都处于0~1之间,获得预处理后的图像数据集;
步骤S23:将步骤S22预处理后得到图像数据集输入到步骤S21得到的G-ResNet18网络中进行分类训练,得到训练后的G-ResNet18模型即训练后的神经网络分类模型。G-ResNet18网络在本实验数据集上的测试识别精度达到91.6%,相比ResNet18网络在本实验数据集上的测试识别提高了1%。
在本实施例中,所述步骤S3的具体内容为:
将待分类的生活垃圾图片缩放为(224 ,224)的大小后输入到训练后得到的神经网络分类模型中,输出分类结果。
较佳的,本实施例提出一种基于深度学习的生活垃圾分类方法,能在不降低网络识别精度的同时大大减少网络的参数量,可以应用于垃圾的智能分类。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (3)

1.一种基于深度学习的生活垃圾分类方法,其特征在于:包括以下几个步骤:
步骤S1:建立生活垃圾数据集,采用数据增强方法扩充训练数据集;
步骤S2:建立神经网络分类模型,将步骤S1扩充后的训练数据集经过预处理操作后输入到网络中进行分类训练,得到训练后的神经网络分类模型;
步骤S3:将待分类的生活垃圾图片经过预处理操作后输入到步骤S2训练后的神经网络分类模型,输出分类结果;
所述步骤S2的具体包括以下步骤:
步骤S21:采用ResNet18作为基础网络,使用幻象模块Ghost Module替换ResNet18残差单元的普通卷积,得到幻象残差学习单元;通过顺序堆叠幻象残差学习单元得到G-ResNet18网络;
步骤S22:将步骤S1扩充后的训练数据集中的每张图像的大小统一缩放为(224,224)的大小,并将图像的每一个像素值乘以1/255,使每一个数值都处于0~1之间,获得预处理后的图像数据集;
步骤S23:将步骤S22预处理后得到图像数据集输入到步骤S21得到的G-ResNet18网络中进行分类训练,得到训练后的G-ResNet18模型即训练后的神经网络分类模型。
2.根据权利要求1所述的一种基于深度学习的生活垃圾分类方法,其特征在于:所述步骤S1的具体内容为:
采集不同大小、角度、光照下的常见生活垃圾图片作为数据集,将数据集打乱后按4:1随机划分为训练集和测试集;采用随机水平翻转、随机垂直翻转、随机缩放、随机旋转、逆时针方向裁剪、水平偏移和竖直偏移的数据增强方法扩充训练数据。
3.根据权利要求1所述的一种基于深度学习的生活垃圾分类方法,其特征在于:所述步骤S3的具体内容为:将待分类的生活垃圾图片缩放为(224,224)的大小后输入到训练后得到的神经网络分类模型中,输出分类结果。
CN202011502665.4A 2020-12-18 2020-12-18 一种基于深度学习的生活垃圾分类方法 Active CN112364944B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011502665.4A CN112364944B (zh) 2020-12-18 2020-12-18 一种基于深度学习的生活垃圾分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011502665.4A CN112364944B (zh) 2020-12-18 2020-12-18 一种基于深度学习的生活垃圾分类方法

Publications (2)

Publication Number Publication Date
CN112364944A CN112364944A (zh) 2021-02-12
CN112364944B true CN112364944B (zh) 2022-07-05

Family

ID=74534578

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011502665.4A Active CN112364944B (zh) 2020-12-18 2020-12-18 一种基于深度学习的生活垃圾分类方法

Country Status (1)

Country Link
CN (1) CN112364944B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113052254B (zh) * 2021-04-06 2022-10-04 安徽理工大学 多重注意力幽灵残差融合分类模型及其分类方法
CN113723217A (zh) * 2021-08-09 2021-11-30 南京邮电大学 一种基于yolo改进的物体智能检测方法及系统
CN114821264B (zh) * 2022-03-28 2023-02-17 慧之安信息技术股份有限公司 一种基于神经网络的算法效率提升方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019000929A1 (zh) * 2017-06-30 2019-01-03 京东方科技集团股份有限公司 垃圾分类回收方法、垃圾分类设备以及垃圾分类回收系统
CN111144496A (zh) * 2019-12-27 2020-05-12 齐齐哈尔大学 一种基于混合卷积神经网络的垃圾分类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019000929A1 (zh) * 2017-06-30 2019-01-03 京东方科技集团股份有限公司 垃圾分类回收方法、垃圾分类设备以及垃圾分类回收系统
CN111144496A (zh) * 2019-12-27 2020-05-12 齐齐哈尔大学 一种基于混合卷积神经网络的垃圾分类方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Attention-guided Network for Ghost-free High Dynamic Range Imaging;Yan, QS (Yan, Qingsen) et.al.;《IEEE Conference on Computer Vision and Pattern Recognition》;20200708;全文 *
基于残差结构和幻象模块的垃圾图片分类算法;郑佑顺 等;《信息技术与网络安全》;20210130;第40卷(第1期);全文 *
基于深度卷积神经网络的塑料垃圾分类研究;吴晓玲等;《塑料科技》;20200425(第04期);全文 *

Also Published As

Publication number Publication date
CN112364944A (zh) 2021-02-12

Similar Documents

Publication Publication Date Title
CN112364944B (zh) 一种基于深度学习的生活垃圾分类方法
CN109190752A (zh) 基于深度学习的全局特征和局部特征的图像语义分割方法
CN111860171B (zh) 一种大规模遥感图像中不规则形状目标的检测方法及系统
CN110598800A (zh) 一种基于人工智能的垃圾分类识别方法
CN110119662A (zh) 一种基于深度学习的垃圾种类识别系统
CN109509187B (zh) 一种针对大分辨率布匹图像中的小瑕疵的高效检验算法
CN104766097B (zh) 基于bp神经网络和支持向量机的铝板表面缺陷分类方法
CN111046821B (zh) 一种视频行为识别方法、系统及电子设备
CN109615604B (zh) 基于图像重构卷积神经网络的零件外观瑕疵检测方法
CN107808358A (zh) 图像水印自动检测方法
CN109544522A (zh) 一种钢板表面缺陷检测方法及系统
CN110263215A (zh) 一种视频情感定位方法及系统
CN111339935B (zh) 一种基于可解释cnn图像分类模型的光学遥感图片分类方法
CN116310785B (zh) 基于YOLO v4的无人机影像路面病害检测方法
CN107093175B (zh) 一种动力电池焊接质量检测方法
CN114022736A (zh) 一种垃圾检测方法以及装置
CN111415338A (zh) 目标检测模型的构建方法及系统
CN112001901A (zh) 基于卷积神经网络的苹果缺陷检测方法及系统
CN101655911B (zh) 基于免疫抗体网络的模式识别方法
Meng et al. X-DenseNet: deep learning for garbage classification based on visual images
CN111414926A (zh) 一种智能垃圾分类方法、装置、存储介质和机器人
CN109446964A (zh) 基于端到端单级多尺度检测器的面部检测分析方法及装置
Aishwarya et al. A waste management technique to detect and separate non-biodegradable waste using machine learning and YOLO algorithm
Hanbal et al. Classifying wastes using random forests, gaussian naïve bayes, support vector machine and multilayer perceptron
CN109033971A (zh) 一种基于残差网络思想的高效行人重识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant