CN110689085B

CN110689085B - 基于深度跨连接网络及损失函数设计的垃圾分类方法

Info

Publication number: CN110689085B
Application number: CN201910944595.9A
Authority: CN
Inventors: 曾明; 吴雨璇; 马金玉; 李祺; 王湘晖
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2019-09-30
Filing date: 2019-09-30
Publication date: 2023-04-18
Anticipated expiration: 2039-09-30
Also published as: CN110689085A

Abstract

本发明涉及一种基于深度跨连接网络及损失函数设计的垃圾分类方法，首先用深度跨连接网络DenseNet在公布的数据集上预训练提高网络的特征提取能力，然后在采集的垃圾图像数据集上对网络部分参数微调，实现前期网络在公布的数据集上学习到的特征提取能力迁移到垃圾图像数据集上，同时训练网络的垃圾分类能力，在这部分训练中引入新的损失函数。

Description

基于深度跨连接网络及损失函数设计的垃圾分类方法

技术领域

本发明属于生活垃圾分类和深度学习应用领域。一种利用深度卷积神经网络检测垃圾回收性质的方法。

背景技术

改革开放以来，随着经济的持续高速发展与城市化的迅速扩大，中国在超过美国后成为世界头号生活垃圾生产国。由此带来的生活垃圾任意堆放、大量侵占土地、环境污染严重、资源大量浪费等问题，己成为影响环境保护和可持续发展的重要因素。鉴于该问题的严重性国家已将垃圾分类上升至国家战略高度，考虑到我国国民分类投放意识不强且在短时间内不可能明显改善的现状，自动化实现生活垃圾分类是非常有必要的。

传统的垃圾分类方法有筛分、重选、风选、浮选、磁选、电选、静电分选、电磁分选及光选。这些方法借助垃圾本身的性质进行分选，但是每种方法分类的材质单一，比如浮选用来分选废旧塑料、电磁分选用于废旧电池等，而且所用到的设备大多工艺复杂、价格昂贵。

近些年深度学习技术在图像分类、目标检测、语义分割等许多领域取得了优异的效果，特别是卷积神经网络(CNN)在图像任务上的突出表现。在ILSVRC(ImageNetLarge-ScaleVisualRecognition Challenge)的促进下，AlexNet、ZFNet、VGGNet、GoogLeNet、ResNet、DenseNet等经典网络模型被提出，这些网络强大的特征提取能力大幅度提高了图像分类的准确率。目前基于深度学习的方法也被用于垃圾分类中，但这些方法中所用到的网络层数较浅，提取图像高维特征的能力有限，同时在训练网络中使用单一的损失函数难以获得更优的模型。本专利基于深度跨连接网络及损失函数设计实现了对生活垃圾的精分类。

发明内容

针对现有基于浅层CNN垃圾分类方法存在的问题，本发明提出一种基于深度跨连接网络及损失函数设计的垃圾精分类方法，本发明旨在通过深度跨连接网络DenseNet提取更深层次的特征，通过跨连接方式有效克服深度网络的梯度消失问题，新的损失函数设计进一步提升了垃圾分类准确率。技术方案如下：

一种基于深度跨连接网络及损失函数设计的垃圾分类方法，首先用深度跨连接网络DenseNet在公布的数据集上预训练提高网络的特征提取能力，然后在采集的垃圾图像数据集上对网络部分参数微调，实现前期网络在公布的数据集上学习到的特征提取能力迁移到垃圾图像数据集上，同时训练网络的垃圾分类能力，在这部分训练中引入新的损失函数，包括步骤如下：

第一步，构建带有材质标签的垃圾图像数据集：对采集的垃圾图片进行人工标注，类别分为k类；

第二步，基于深度跨连接网络及损失函数设计来训练模型，方法如下：

1)搭建深度跨连接网络DenseNet，初始化网络模型参数，利用公布的数据集训练全部网络参数，直到网络的特征提取能力达到最优；

2)对1)中训练好的网络,替换最后的全连接分类器，分类数设定为垃圾图像数据集的k类；固定低层网络参数，只允许训练高层的网络参数，设经过改进的深度跨连接网络DenseNet为网络A；

3)对图片数据进行预处理：读取n个图片数据和对应的标签，将每个图片的RGB像素值进行归一化处理，输入到网络A中；

4)3)中得到预处理后的图片数据通过网络A前向传播后得到维度为(n，k)的概率矩阵，每一行代表该图片属于k个类别的概率；

5)根据公式(1)-(4)计算交叉熵损失函数Loss，通过反向传播计算损失对每个参数的导数，进而参数更新：

其中

是交叉熵损失函数，y是标签，

是网络输出；

其中

是回收概率，p_R是可回收概率，p_U是不可回收概率；

y_r誸c＝(y_R，y_U)＝(∑_i∈Ry_i，∑_i∈Uy_i) (3)其中y_r誸c是回收标签，y_R是可回收标签，y_U是不可回收标签；

其中

是材质交叉熵损失函数，

是材质概率，y_mat是材质标签，

是回收交叉熵损失函数，α是权重因子，用来分配两个交叉熵损失的重要性；

6)重复1-5步骤，直到网络A在测试集上的性能不再提高为止；

第三步，垃圾识别：给一张垃圾图片，输入到训练好的网络A当中，得到该垃圾图片关于k类材质的概率，最大概率值对应材质类别的回收性质就是该网络预测的回收性质。

优选地，步骤3)在进行归一化处理后，还通过随机裁剪、随机上下左右翻转、随机亮度、随机饱和度操作对图片做数据增强，并将图片大小resize到(224，224)输入到网络A中。

步骤5)中，优化器选择带动量的SGD，动量参数设置为0.9，初始学习率为0.01，每训练10epochs下降为原来的0.1，权重衰减设置为0.00004。

本发明同时提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求1-3任意一项所述的方法步骤。

本发明主要优点及特色体现在如下几个方面：

1)本发明利用深度跨连接网络来提取更深层次的特征实现了对生活垃圾的精分类，相对于传统的垃圾分类方法，能够对全部生活垃圾分类，降低了成本。和其他基于浅层CNN网络的垃圾分类方法相比，深度跨连接网络能够提取高维特征，新的损失函数设计更进一步实现准确率的提升。

2)本发明在数据集大小不充足的情况下，通过迁移学习达到较高的分类准确率，同时提高了网络的泛化能力。

附图说明

图1本发明所用的垃圾图像数据集样例图片

图2深度跨连接网络中的1个模块

表1深度跨连接网络的配置说明

具体实施方式

下面对本专利的基于深度跨连接网络及损失函数设计的垃圾精分类方法的具体实施方案做出详细说明：

本发明训练网络所使用的垃圾图像数据集是自行采集的，将校园内的垃圾放置在采集箱内使用摄像头进行拍摄，所述的采集箱顶板安放有摄像头，同时配备有补光装置，对采集的垃圾图片进行人工标注，最终数据集大小为10624张，其中的垃圾来源于校园、生活小区中垃圾桶，类别分为k类，分别是餐厨垃圾、可回收塑料、不可回收塑料、可回收纸类、不可回收纸类、金属、电子产品、玻璃、纺织品、危险有害物品等。

本发明提出的深度跨连接网络能够提取更深层次的特征，同时防止梯度消失，图2是深度跨连接网络中的1个模块，表1是深度跨连接网络的配置说明。

表1

训练过程中，将数据集按照8：2比例分成训练集和测试集，网络模型通过在训练集上学习后，在测试集上验证学习的效果。为了防止网络训练发生过拟合，通过数据增强增加了训练样本，提高网络的泛化性能，数据增强的手段包含随机裁剪、随机上下左右翻转、随机亮度、随机饱和度。

训练时通过迁移学习提高网络的泛化能力，模型中的参数使用ImageNet训练好的预训练模型初始化，固定低层的网络参数，训练高层的网络参数。

一种基于深度跨连接网络及损失函数设计的垃圾精分类方法的具体实施步骤如下：

1)根据表1搭建深度跨连接网络DenseNet，初始化网络模型参数，在数据集ImageNet训练全部网络参数，直到网络的特征提取能力达到最优。

2)对1)中的网络替换最后的全连接分类器，分类数由ImageNet的1000类变成垃圾图像数据集的k类。固定低层网络参数，只允许训练高层的网络参数。

3)随机读取n个图片数据和对应的标签，将图片RGB像素值归一化到(-1，1)范围内，通过随机裁剪、随机上下左右翻转、随机亮度、随机饱和度等操作对图片做数据增强，最后将图片大小resize到(224，224)输入到网络中。

4)经过预处理后的数据通过网络前向传播后得到维度为(n，k)的概率矩阵，每一行代表该图片属于k个类别的概率。

5)公式4)计算本发明设计的交叉熵损失函数，通过反向传播计算损失对每个参数的导数，进而参数更新。其中优化器选择带动量的SGD，动量参数设置为0.9，初始学习率为0.01，每训练10epochs下降为原来的0.1，权重衰减设置为0.00004。

6)重复1-5步骤，直到网络在测试集上的性能不再提高为止。

本发明的方法在测试集中取得了97.2％的准确率，其中新的损失函数设计对准确率提高了0.7％，说明本方法是一个非常有效的垃圾分类方法，具有很高的应用价值。

Claims

1.一种基于深度跨连接网络及损失函数设计的垃圾分类方法，包括下列步骤：

首先用深度跨连接网络DenseNet在公布的数据集上预训练提高网络的特征提取能力，然后在采集的垃圾图像数据集上对网络部分参数微调，实现前期网络在公布的数据集上学习到的特征提取能力迁移到垃圾图像数据集上，同时训练网络的垃圾分类能力，在这部分训练中引入新的损失函数；步骤如下：

其中是交叉熵损失函数，y是标签，是网络输出；

其中是回收概率，p_R是可回收概率，p_U是不可回收概率；

y_rec＝(y_R，y_U)＝(∑_i∈Ry_i，∑_i∈Uy_i) (3)

其中y_rec是回收标签，y_R是可回收标签，y_U是不可回收标签；

其中是材质交叉熵损失函数，是材质概率，y_mat是材质标签，是回收交叉熵损失函数，α是权重因子，用来分配两个交叉熵损失的重要性；

6)重复1-5步骤，直到网络A在测试集上的性能不再提高为止；

2.根据权利要求1所述的方法，其特征在于，步骤3)在进行归一化处理后，还通过随机裁剪、随机上下左右翻转、随机亮度、随机饱和度操作对图片做数据增强，并将图片大小resize到(224，224)输入到网络A中。

3.根据权利要求1所述的方法，其特征在于，步骤5)中，优化器选择带动量的SGD，动量参数设置为0.9，初始学习率为0.01，每训练10epochs下降为原来的0.1，权重衰减设置为0.00004。

4.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求1-3任意一项所述的方法步骤。