CN114049522A - 一种基于深度学习的垃圾分类系统 - Google Patents

一种基于深度学习的垃圾分类系统 Download PDF

Info

Publication number
CN114049522A
CN114049522A CN202111418342.1A CN202111418342A CN114049522A CN 114049522 A CN114049522 A CN 114049522A CN 202111418342 A CN202111418342 A CN 202111418342A CN 114049522 A CN114049522 A CN 114049522A
Authority
CN
China
Prior art keywords
layer
control panel
garbage classification
group control
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111418342.1A
Other languages
English (en)
Inventor
刘玉柱
单慧琳
王兴涛
张银胜
刘先锋
刘小庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi University
Original Assignee
Wuxi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi University filed Critical Wuxi University
Priority to CN202111418342.1A priority Critical patent/CN114049522A/zh
Publication of CN114049522A publication Critical patent/CN114049522A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Abstract

本发明涉及一种基于深度学习的垃圾分类系统,属于人工智能领域。该系统包括树莓派控制板、摄像头、PC端显示器和远程服务器,所述摄像头将采集到的垃圾图像信息传输给树莓派控制板,所述树莓派控制板通过X2go和远程服务器之间建立远程连接,所述树莓派控制板与显示器连接,所述树莓派控制板和远程服务器内设置有训练好的卷积神经网络。本发明设计的垃圾分类系统具有较高的识别准确度,通过大量的数据进行训练,并改进网络模型,极大的提高了垃圾分类识别的可靠性。

Description

一种基于深度学习的垃圾分类系统
技术领域
本发明涉及一种基于深度学习的垃圾分类系统,属于人工智能领域。
背景技术
随着经济发展和人的生活水平提高,垃圾产生量迅速增长。世行报告预测:全球垃圾量2030年将达到25.9亿吨,2050年将达到34亿吨,所以垃圾分类任务十分艰巨。传统垃圾分类方法主要有筛分、重力分选、磁力分选、光点分选及风力分选等,人工分选是这些方法里不可或缺的环节,主要依靠人工提取图像特征进行分类,其过程复杂、成本高、分类效率低,无法满足当前的垃圾分类需求。因此,人工分选垃圾存在劳动强度大、分选效率低和监督任务重等问题,急需自动化、智能化的分类方法取代传统垃圾分类方法。
2020年,董子源等在《基于卷积神经网络的垃圾图像分类算法》提出一种注意力机制模型,该模型通过完成全局和局部的特征提取与特征融合机制等手段来建立垃圾图像分类模型GCNet,此模型能够获得更为完善有效的特征信息,并能有效利用特征以解决梯度消失的问题。同年,Song等人在论文《Optimization of CNN-based Garbage ClassificationModel》中提出基于Inceptionv4和ResNet的垃圾自动分类网络DSCR,该网络创建了一个IR-Block,使得模型在多尺度上获得更多的特征,解决了由于使用缩减模块而导致模型过于敏感的问题。2020年,陈希等人在专利《一种目标垃圾分类方法及智能垃圾桶》中,利用摄像模块获取目标图像;然后进行图像分割和聚类来识别分类垃圾,其采用的图像识别的方法不及深度学习效果好。
发明内容
为了解决当前垃圾分类中的人工成本高、分类效率低等问题,本发明提出了一种基于深度学习的垃圾分类系统。该装置采用云服务器+树莓派的双核心方案,将卷积神经网络移植到树莓派+服务器中,树莓派将收集回来的垃圾物的图片进行分析处理并上传到服务器,通过深度学习对垃圾图片进行识别分类。
本发明为解决其技术问题采用如下技术方案:
一种基于深度学习的垃圾分类系统,包括树莓派控制板、摄像头、PC端显示器和远程服务器,所述摄像头将采集到的垃圾图像信息传输给树莓派控制板,所述树莓派控制板通过X2go和远程服务器之间建立远程连接,所述树莓派控制板与显示器连接,所述树莓派控制板和远程服务器内设置有训练好的卷积神经网络。
所述卷积神经网络采用CNN轻量级神经网络模型,激活函数采用ReLU函数。
所述卷积神经网络包括输入层、卷积层、池化层、全连接层和输出层。
所述卷积层提取特征图像和激活函数的关系如(1)式所示:
Figure BDA0003376472280000021
其中f(·)代表激活函数,
Figure BDA0003376472280000022
表示第l卷积层中的第j个特征图,
Figure BDA0003376472280000023
表示第(l-1)层的第j个特征图像,
Figure BDA0003376472280000024
代表卷积核,Mj是输入图的集合,卷积计算用*表示,
Figure BDA0003376472280000025
表示偏置项。
本发明的有益效果如下:
本发明设计的垃圾分类系统具有较高的识别准确度,通过大量的数据进行训练,并改进网络模型,极大的提高了垃圾分类识别的可靠性。具备广泛的市场推广价值和竞争能力,为当下垃圾分类的社会难点提供智能高效的解决方案。
附图说明
图1是树莓派+服务器双核心主体方案框图。
图2是树莓派搭建流程图。
图3是树莓派与PC端的连接示意图。
图4是垃圾分类识别模块设计流程图。
图5是卷积神经网络模型。
具体实施方式
下面结合附图对本发明创造做进一步详细说明。
(1)树莓派部分
由于树莓派的计算力不足以负载卷积神经网络的运行,于是本系统采用云服务器+树莓派的双核心方案,云服务器方便、快捷、安全,适合在线存储数据。摄像头将采集到的垃圾图像信息传输给树莓派,远程服务器运行深度学习的主程序,树莓派通过X2go和服务器之间建立远程连接(如图1所示),访问服务器的数据,远程访问可以操作服务器,导入图片,进行图像识别等。
树莓派的搭建流程图如图2所示,树莓派与PC端的连接示意图如图3所示。
打开VNC(虚拟网络计算)远程桌面,配置系统参数。然后搭建服务器平台,再配置软件环境。
(2)垃圾分类模块
垃圾分类识别模块设计流程图如图4所示。
1)数据集
由于嵌入式设备树莓派并不是一个高性能的设备,性能有限,而卷积神经网络在训练的时候需要消耗特别多的内存和资源,为了可以稳定高效地将神经网络移植到树莓派+服务器的系统中,需要先在计算机上搭建和训练卷积神经网络,在计算机上实现此次实验的目的,通过不断的实验,逐步提高此模型的识别准确率,在识别率到达预期设想后,便可以进行向树莓派+服务器系统的移植,最后需要在树莓派与服务器上进行多次的测试和调参优化,使得卷积神经网络在新系统上具有一定的稳定性。
2)数据集预处理
在数据集里的图片数据被输入到卷积神经网络前,这些图片数据需要进行一些预处理,包括对图片进行归一化,对训练数据进行数据增强等,例如:旋转、裁剪、尺度缩放、水平、垂直方向的随机移动等,通过这些操作生成训练图片,增强了数据的多样性,让模型能够对不同角度,不同光照的图片具有一定的鲁棒性。
3)卷积神经网络的搭建
如图5所示(Input表示输入,Output表示输出),卷积神经网络的核心构造分别是输入层、卷积层、池化层、全连接层和输出层,每一层的神经元只连接到前一层。卷积神经网络在图像分类、图像检索、目标检测等领域的成功应用得益于其自动提取图像特征、自动更新、共享权值,从而不断优化优化网络。
卷积神经网络采用CNN轻量级神经网络模型,激活函数采用ReLU函数。图像的维度是192×256,输入进卷积神经网络,图像先通过32个3×3的卷积核得到32×192×256的特征图,然后通过2×2的池化层得到96×128×32的特征图,接着通过32个3×3的卷积核得到96×128×32的特征图,然后通过2×2的池化层得到48×64×32的特征图,再通过64×3×3的卷积核得到一个48×64×64的特征图,然后通过2×2的池化层得到24×32×64的特征图,最后输入到全连接层......通过多层的共同作用提取出图像特征,并减少原始图像带来的参数。最后再利用梯度下降法和牛顿法训练神经网络,优化参数。卷积神经网络通过多个卷积池化层,全连接层,以及Softmax输出层实现对生活中常见的5种垃圾的分类处理。
a卷积层
卷积层即特征提取层,卷积层里包含的卷积核是神经网络训练的核心。每一个不同的卷积核都能提取不同的输入数据特征,卷积核的数量越多,卷积层所能提取到的特征也越多。特征图像和激活函数的关系如(1)式所示:
Figure BDA0003376472280000041
其中f(·)代表激活函数,
Figure BDA0003376472280000042
表示第l卷积层中的第j个特征图,
Figure BDA0003376472280000043
表示第(l-1)层的第j个特征图像,
Figure BDA0003376472280000044
代表卷积核,Mj是输入图的集合,卷积计算用*表示,
Figure BDA0003376472280000045
表示偏置项。
b池化层
池化层一般在卷积层之后,可以看成一个过滤器,它可以实现采样的功能,经过卷积层输出后的特征图可以被传递至池化层进行特征选择和信息过滤,池化层着重提取具有某种倾向的特征。
c Dropout层
Dropout层在每次训练的时候,为了提高网络的泛化能力,会随机让一半的特征检测器停止工作,可以有效地使测试时的错误个数减少。
d全连接层
在全连接层前面的卷积层是实现特质值的优化提取,池化层和激活函数的作用是把提取后的特征值映射到隐层的特征空间,把学过的“分布特征表示法”映射到样本标记空间的任务则是由全连接层来实现,这样可以大大减少特征位置对分类带来的影响。
全连接层中的每一层都是由许多神经元组成的平铺结构,在CNN(卷积神经网络)中,每个全连接层都被转换成1×1卷积核,前一层的卷积层的全连接层通常作用于卷积核,其卷积核的大小是W×H,可以看作是全局卷积。W和H是执行卷积操作后的卷积结果的高度和宽度。
全连接层的操作核心就是矩阵向量乘积:y=Wx
总体联系实际上就是数量加权和。
用卷积检验激活函数向量的输出进行反积,其结果是神经元在全连接层后的输出,这个输出本质上就是一个值,从特征空间的线性变换到特征空间之间的一个值。根据连接层的神经元数量n来与卷积的大小相乘,从而可以得到函数的输出。
e Softmax分类器
Softmax的公式如(2)所示:
Figure BDA0003376472280000053
其中:xi表示原始数据中的一个数据,exp(xi)表示e的xi次方,e为自然对数的底数。
Softmax层后面一层作为预测分类的输出节点,每一个节点都代表一个分类,任何一个节点的激励函数都是:
Figure BDA0003376472280000051
其中:i为结点的下标次序,n为输出结点的个数,即分类的类别个数,而zi=ωi+bi,为第i个结点的输出值。同时最后一层具有这样的特性:
Figure BDA0003376472280000052
可见,输出的最终结果的和等于1。可以从物理意义上理解这样的激励函数:通过Softmax分类器进行分类后输出的值都是小于等于1的,可以有效解决多分类问题的输出。
为了验证该系统在垃圾图像识别分类中的表现,从谷歌和百度爬取垃圾图片构建数据集,包含可回收物、厨余垃圾、有害垃圾、其它垃圾等四种类型的垃圾图片,共6000张图片。取其中80%为训练集,20%为测试集。即训练集有4800张图片,测试集有1200张图片。设计了对比实验,将本专利提出的方法和其他垃圾图像识别方法进行对比,使用多种评价手段对本方法的识别效果进行验证。

Claims (4)

1.一种基于深度学习的垃圾分类系统,其特征在于,包括树莓派控制板、摄像头、PC端显示器和远程服务器,所述摄像头将采集到的垃圾图像信息传输给树莓派控制板,所述树莓派控制板通过X2go跟远程服务器之间建立远程连接,所述树莓派控制板与显示器连接,所述树莓派控制板和远程服务器内设置有训练好的卷积神经网络。
2.根据权利要求1所述的一种基于深度学习的垃圾分类系统,其特征在于,所述卷积神经网络采用CNN轻量级神经网络模型,激活函数采用ReLU函数。
3.根据权利要求2所述的一种基于深度学习的垃圾分类系统,其特征在于,所述卷积神经网络包括输入层、卷积层、池化层、全连接层和输出层。
4.根据权利要求3所述的一种基于深度学习的垃圾分类系统,其特征在于,所述卷积层提取特征图像和激活函数的关系如(1)式所示:
Figure FDA0003376472270000011
其中f(·)代表激活函数,
Figure FDA0003376472270000012
表示第l卷积层中的第j个特征图,
Figure FDA0003376472270000013
表示第(l-1)层的第j个特征图像,
Figure FDA0003376472270000014
代表卷积核,Mj是输入图的集合,卷积计算用*表示,
Figure FDA0003376472270000015
表示偏置项。
CN202111418342.1A 2021-11-26 2021-11-26 一种基于深度学习的垃圾分类系统 Pending CN114049522A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111418342.1A CN114049522A (zh) 2021-11-26 2021-11-26 一种基于深度学习的垃圾分类系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111418342.1A CN114049522A (zh) 2021-11-26 2021-11-26 一种基于深度学习的垃圾分类系统

Publications (1)

Publication Number Publication Date
CN114049522A true CN114049522A (zh) 2022-02-15

Family

ID=80211222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111418342.1A Pending CN114049522A (zh) 2021-11-26 2021-11-26 一种基于深度学习的垃圾分类系统

Country Status (1)

Country Link
CN (1) CN114049522A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115424399A (zh) * 2022-09-02 2022-12-02 复旦大学 分布式光纤井盖开关监测系统和方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115424399A (zh) * 2022-09-02 2022-12-02 复旦大学 分布式光纤井盖开关监测系统和方法

Similar Documents

Publication Publication Date Title
WO2020244261A1 (zh) 高分辨率遥感图像的场景识别系统及模型生成方法
CN107122375B (zh) 基于图像特征的图像主体的识别方法
CN104239897B (zh) 一种基于自编码器词袋的视觉特征表示方法
CN106682697A (zh) 一种基于卷积神经网络的端到端物体检测方法
CN109993100B (zh) 基于深层特征聚类的人脸表情识别的实现方法
CN108038846A (zh) 基于多层卷积神经网络的输电线路设备图像缺陷检测方法及系统
CN107945153A (zh) 一种基于深度学习的路面裂缝检测方法
CN104573669A (zh) 图像物体检测方法
CN112685504B (zh) 一种面向生产过程的分布式迁移图学习方法
CN110321862B (zh) 一种基于紧致三元损失的行人再识别方法
CN111292195A (zh) 风险账户的识别方法及装置
CN109918497A (zh) 一种基于改进textCNN模型的文本分类方法、装置及存储介质
CN111488917A (zh) 一种基于增量学习的垃圾图像细粒度分类方法
CN111428558A (zh) 一种基于改进YOLOv3方法的车辆检测方法
CN110020712A (zh) 一种基于聚类的优化粒子群bp网络预测方法和系统
Feng et al. Bag of visual words model with deep spatial features for geographical scene classification
CN112819063B (zh) 一种基于改进的Focal损失函数的图像识别方法
Hatim et al. Addressing challenges and demands of intelligent seasonal rainfall forecasting using artificial intelligence approach
CN114330541A (zh) 道路交通事故风险预测深度学习算法
Wang et al. Fine-grained grape leaf diseases recognition method based on improved lightweight attention network
CN114049522A (zh) 一种基于深度学习的垃圾分类系统
CN114373099A (zh) 一种基于稀疏图卷积的三维点云分类方法
Chen et al. Mapping urban form and land use with deep learning techniques: a case study of Dongguan City, China
Hou et al. Application of YOLO V2 in construction vehicle detection
Zhang et al. Deep convolutional neural network for fog detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination