CN114187470A

CN114187470A - 垃圾分类模型的训练方法、垃圾分类方法及装置

Info

Publication number: CN114187470A
Application number: CN202111358578.0A
Authority: CN
Inventors: 袁野; 万里红; 张赛; 张伟; 陈子昂
Original assignee: Zhongyuan Power Intelligent Robot Co ltd
Current assignee: Zhongyuan Power Intelligent Robot Co ltd
Priority date: 2021-11-12
Filing date: 2021-11-12
Publication date: 2022-03-15
Anticipated expiration: 2041-11-12
Also published as: CN114187470B

Abstract

本申请公开了一种垃圾分类模型的训练方法、垃圾分类方法及装置，通过对预先标注好的垃圾图像样本集进行重采样，得到均衡样本集；基于所述垃圾图像样本集和所述均衡样本集，训练预设的初始平滑感知模型，直至所述初始平滑感知模型达到第一预设收敛条件，得到目标平滑感知模型；基于所述垃圾图像样本集，对预设的第一垃圾分类模型进行迭代训练，得到第一损失值，并利用所述目标平滑感知模型，对所述第一损失值进行平滑处理，得到第二损失值；最后根据所述第二损失值，更新所述第一垃圾分类模型的模型参数，直至所述第一垃圾分类模型达到第二预设收敛条件，得到目标垃圾分类模型，提高模型的分类结果的准确度。

Description

垃圾分类模型的训练方法、垃圾分类方法及装置

技术领域

本申请涉及机器人技术领域，尤其涉及一种垃圾分类模型的训练方法、垃圾分类方法及装置。

背景技术

垃圾分类是智能保洁机器人的核心功能，通过深度卷积神经网络对采集图片中的垃圾类别进行推理，并根据推理结果使用机械臂等设备来清理不同类别的垃圾，其中深度卷积神经网络的推理能力直接决定智能保洁机器人的垃圾分类性能。

垃圾分类模型的训练集通常包含数十万甚至上百万个训练样本，需要若干标注人员对训练样本中的垃圾类别进行标注。由于某些垃圾的类别易混淆，并且标注人员的认知存在差异，使得有一定比例的样本类别被错误标注，存在大量的标签噪声，从而导致深度卷积神经网络对存在噪音的数据集过拟合，进而大大降低模型在干净测试数据上的准确性。

发明内容

本申请提供了一种垃圾分类模型的训练方法、垃圾分类方法及装置，以解决现有垃圾分类模型存在分类结果准确度低的技术问题。

为了解决上述技术问题，本申请实施例提供了一种垃圾分类模型的训练方法，包括：

对预先标注好的垃圾图像样本集进行重采样，得到均衡样本集；

基于所述垃圾图像样本集和所述均衡样本集，训练预设的初始平滑感知模型，直至所述初始平滑感知模型达到第一预设收敛条件，得到目标平滑感知模型；

基于所述垃圾图像样本集，对预设的第一垃圾分类模型进行迭代训练，得到第一损失值；

利用所述目标平滑感知模型，对所述第一损失值进行平滑处理，得到第二损失值；

根据所述第二损失值，更新所述第一垃圾分类模型的模型参数，直至所述第一垃圾分类模型达到第二预设收敛条件，得到目标垃圾分类模型。

本实施例通过对预先标注好的垃圾图像样本集进行重采样，得到均衡样本集，以提高正负样本的精确率和召回率；基于所述垃圾图像样本集和所述均衡样本集，训练预设的初始平滑感知模型，直至所述初始平滑感知模型达到第一预设收敛条件，得到目标平滑感知模型，以使目标平滑感知模型学习到相应的平滑系数；基于所述垃圾图像样本集，对预设的第一垃圾分类模型进行迭代训练，得到第一损失值，并利用所述目标平滑感知模型，对所述第一损失值进行平滑处理，得到第二损失值，以通过平滑处理解决标签噪声容易导致模型过拟合的问题，提高模型准确度；最后根据所述第二损失值，更新所述第一垃圾分类模型的模型参数，直至所述第一垃圾分类模型达到第二预设收敛条件，得到目标垃圾分类模型，从而能够从训练数据中自动学习训练样本平滑感知网络的超参数，克服人为选择的弊端，提高模型的分类结果的准确度。

在一实施例中，所述基于所述垃圾图像样本和所述均衡样本集，训练预设的初始平滑感知模型，直至所述初始平滑感知模型达到第一预设收敛条件，得到目标平滑感知模型，包括：

基于所述垃圾图像样本集，对预设的第二垃圾分类模型进行训练，得到第三损失值，所述第二垃圾分类模型与所述第一垃圾分类模型的模型结构相同；

利用所述初始平滑感知模型，对所述第三损失值进行平滑处理，得到第四损失值；

根据所述第四损失值，更新所述第二垃圾分类模型的模型参数，得到第二目标垃圾分类模型；

基于所述均衡样本集，对所述第二垃圾分类模型进行训练，得到第五损失值；

根据所述第五损失值，更新所述初始平滑感知模型的模型参数，直至所述初始平滑感知模型达到所述第一预设收敛条件，得到目标平滑感知模型。

本实施例通过复制一个与第一垃圾分类模型结构相同的第二垃圾分类模型，以模拟第一垃圾分类模型的分类训练过程，并配合初始平滑感知模型进行训练，使目标平滑感知模型学习到平滑系数，以避免人为经验因素，使得模型处理过程更加客观。

在一实施例中，所述基于所述垃圾图像样本集，对预设的第一垃圾分类模型进行迭代训练，得到第一损失值，包括：

利用所述第一垃圾分类模型，对所述垃圾图像样本集中的每个垃圾图像样本进行垃圾分类识别，得到每个所述垃圾图像样本的垃圾分类结果；

基于第一损失函数，根据所述垃圾分类结果，计算所述第一损失值，所述第一损失函数为：

其中，N表示所述垃圾图像样本的总量，Loss_i表示第i个垃圾图像样本的损失函数，

表示第i个垃圾图像样本属于第j个类别时的符号函数，

表示第i个垃圾图像样本属于第j个类别时的概率。

本实施例采用交叉熵作为损失函数，对于最后一层权重的梯度不再跟激活函数的导数相关，只跟输出值和真实值的差值成正比，此时收敛较快，使得整个权重矩阵的更新加快。

在一实施例中，所述利用所述第一垃圾分类模型，对所述垃圾图像样本集中的每个垃圾图像样本进行垃圾分类识别，得到每个所述垃圾图像样本的垃圾分类结果，包括：

利用所述第一垃圾分类模型，确定所述垃圾图像样本的属于各个类别时的置信度分数；

对所述置信度分数进行归一化处理，得到所述垃圾图像样本的属于各个类别时的概率。

本实施例通过对置信度分数进行归一化处理，以实现垃圾分类模型的多分类任务。

在一实施例中，所述利用所述目标平滑感知模型，对所述第一损失值进行平滑处理，得到第二损失值，包括：

利用所述目标平滑感知模型，确定所述第一损失值对应的平滑系数；

基于第二损失函数，根据所述平滑系数，计算所述第二损失值，所述第二损失函数为：

其中，N表示所述垃圾图像样本集中垃圾图像样本的总量，Loss_i表示第i个垃圾图像样本的损失函数，

表示第i个垃圾图像样本属于第j个类别时的符号函数，

表示第i个垃圾图像样本属于第j个类别时的概率，ε_j表示第j个类别的平滑系数。

本实施例通过加入平滑系数，以对第一损失值进行平滑处理，区分于传统损失值采用经验调参，平滑处理能够使损失值的调整过程更加客观，从而提高模型的分类性能。

第二方面，本申请实施例提供一种垃圾分类方法，包括：

获取垃圾图像；

基于目标垃圾分类模型，对所述垃圾图像进行分类识别，得到初始分类数据，所述目标垃圾分类模型基于第一方面所述的训练方法训练得到；

对所述初始分类数据进行平滑处理和全连接，得到目标分类结果。

第三方面，本申请实施例提供一种垃圾分类模型的训练装置，包括：

采样模块，用于对预先标注好的垃圾图像样本集进行重采样，得到均衡样本集；

第一训练模块，用于基于所述垃圾图像样本集和所述均衡样本集，训练预设的初始平滑感知模型，直至所述初始平滑感知模型达到第一预设收敛条件，得到目标平滑感知模型；

第二训练模块，用于基于所述垃圾图像样本集，对预设的第一垃圾分类模型进行迭代训练，得到第一损失值；

第一平滑模块，用于利用所述目标平滑感知模型，对所述第一损失值进行平滑处理，得到第二损失值；

更新模块，用于根据所述第二损失值，更新所述第一垃圾分类模型的模型参数，直至所述第一垃圾分类模型达到第二预设收敛条件，得到目标垃圾分类模型。

第四方面，本申请实施例提供一种垃圾分类装置，包括：

获取模块，用于获取垃圾图像；

识别模块，用于基于目标垃圾分类模型，对所述垃圾图像进行分类识别，得到初始分类数据，所述目标垃圾分类模型基于第一方面所述的训练方法训练得到；

第二平滑模块，用于对所述初始分类数据进行平滑处理，得到目标分类结果。

第五方面，本申请实施例提供一种计算机设备，包括处理器和存储器，所述存储器用于存储计算机程序，所述计算机程序被所述处理器执行时实现第一方面所述的垃圾分类模型的训练方法，或第二方面所述的垃圾分类方法。

第六方面，本申请实施例提供一种计算机可读存储介质，其存储有计算机程序，所述计算机程序被处理器执行时实现第一方面所述的垃圾分类模型的训练方法，或第二方面所述的垃圾分类方法。

需要说明的是，上述第二方面至第六方面的有益效果请参见上述第一方面的相关描述，在此不再赘述。

附图说明

图1为本申请实施例提供的垃圾分类系统的结构示意图；

图2为本申请实施例提供的垃圾分类模型的训练方法的流程示意图；

图3为本申请实施例提供的垃圾分类方法的流程示意图；

图4为本申请实施例提供的垃圾分类模型的训练装置的结构示意图；

图5为本申请实施例提供的垃圾分类装置的结构示意图；

图6为本申请实施例提供的计算机设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

如相关技术记载，垃圾分类模型的训练集通常包含数十万甚至上百万个训练样本，需要若干标注人员对训练样本中的垃圾类别进行标注。由于某些垃圾的类别易混淆，并且标注人员的认知存在差异，使得有一定比例的样本类别被错误标注，存在大量的标签噪声，从而导致深度卷积神经网络对存在噪音的数据集过拟合，进而大大降低模型在干净测试数据上的准确性。

当前解决标签噪声导致的模型过拟合、性能下降的方法主要包括：

1.设计具有鲁棒性的损失函数：通过改编损失函数使得模型在带噪音标签的数据集上训练后的性能与在不带噪声标签的数据集上训练后的性能相当，比如GeneralizedCross Entropy，Symmetric Cross Entropy等，但是这些改编的损失函数只适用于简单的情形，即任务比较简单，数据量比较少的应用场景。

2.设计具有鲁棒性的网络架构：在深度卷积神经网络中包含用于估计标签噪声转移概率的专用架构，比如生成式对抗网络，但这类方法往往难以训练而且效果提升不明显。

3.权重衰减、剪枝、批归一化等正则化手段：这类方法运用起来非常方便，只需要对训练进行小幅的修改即可，面对少量噪声数据时效果不错，但是面对稍多噪声时，效果不佳。

4.调整损失值：在更新参数前调整所有训练样本对损失值的影响，可以通过估计标签转移矩阵来调整损失值，也可以对不同的样本赋予不同的权重，也可以通对样本的类别进行调整，从而来影响最终的损失值，但目前的损失值调整往往取决于调参经验。

5.样本选择：直接对样本进行选择，丢弃掉疑似噪声的样本。这类方法虽然不会引入标注错误的样本，但不可避免地会丢弃一些标注正确的样本。

为此，本申请实施例提供一种垃圾分类模型的训练方法、垃圾分类方法及装置，通过对预先标注好的垃圾图像样本集进行重采样，得到均衡样本集，以提高正负样本的精确率和召回率；基于所述垃圾图像样本集和所述均衡样本集，训练预设的初始平滑感知模型，直至所述初始平滑感知模型达到第一预设收敛条件，得到目标平滑感知模型，以使目标平滑感知模型学习到相应的平滑系数；基于所述垃圾图像样本集，对预设的第一垃圾分类模型进行迭代训练，得到第一损失值，并利用所述目标平滑感知模型，对所述第一损失值进行平滑处理，得到第二损失值，以通过平滑处理解决标签噪声容易导致模型过拟合的问题，提高模型准确度；最后根据所述第二损失值，更新所述第一垃圾分类模型的模型参数，直至所述第一垃圾分类模型达到第二预设收敛条件，得到目标垃圾分类模型，从而能够从训练数据中自动学习训练样本平滑感知网络的超参数，克服人为选择的弊端，提高模型的分类结果的准确度。

参照图1，图1示出了本申请实施例提供的垃圾分类系统的结构示意图。该垃圾分类系统包括摄像机模块、边缘计算模块、垃圾清理模块、中央控制模块、定位导航模块、运动控制模块和通信模块。

摄像机模块：用于完成路面垃圾图像拍摄并且向边缘计算模块传输数据，其既能够接受中央控制模块的指令，也可以向中央控制模块反馈工作状态。

边缘计算模块：用于基于接收到的图像数据利用深度学习模型进行推理，向中央控制模块输出推理结果。示例性地，边缘计算模块选型为：NVIDIA嵌入式Linux高性能计算机AGX Xavier(8核NVIDIA Carmel ARMv8.2 64位CPU，由8个流多处理器组成的512核Volta架构的GPU)。

垃圾清理模块：用于接收中央控制模块的指令，操作相应的垃圾清理工作，移动至指定位置，完成垃圾清理，能够向中央控制模块反馈工作状态。该模块主要包括机械臂、吸尘器等清洁工具。

中央控制模块：负责协调其余各模块的工作。

定位导航模块：内置机器人运行路线数据，实时感知环境，为中央控制模块做出避障、运动等决策提供数据；既能够接受中央控制模块的指令，也可以向中央控制模块反馈工作状态。该模块主要包括激光雷达、SLAM等传感器设备。

运动控制模块：根据中央控制模块的指令，完成机器人的运动，能够向中央控制模块反馈工作状态。该模块主要由轮足式运动底盘组成。

通信模块：作为机器人与外界通信的接口，能够与中央控制模块双向通信，能够接受外界指令，也能够向外界反馈消息。该模块包括无线传输、5G电路等。

此外，该垃圾分类系统还包括电源等支撑模块，在此不再赘述。

参照图2，图2为本申请实施例提供的一种垃圾分类模型的训练方法的流程示意图。本申请实施例的垃圾分类模型的训练方法可应用于计算机设备，计算机设备包括但不限于智能手机、平板电脑、笔记本电脑和智能机器人，优选为智能机器人，该机器人集成有上述垃圾分类系统。如图2所示，垃圾分类模型的训练方法包括步骤S201至S205，详述如下：

步骤S201，对预先标注好的垃圾图像样本集进行重采样，得到均衡样本集。

在本步骤中，垃圾图像样本集为人工标注的样本集，其存在标签噪声，属于非均衡样本集。由于垃圾图像样本集即使存在标签噪声，但是相对于正样本而言，负样本的数量也相对较少，这样会导致用于训练的样本集的样本分布于测试时期望的样本分布不一致，或者训练阶段对不同样本类别的权重与测试阶段不一致。所以本实施例通过对垃圾图像样本集进行重采样，使得样本集中的样本变得均衡。

可选地，重采样方式可以是随机采样、基于SMOTE算法的重采样、基于InformedUndersampling的重采样和基于聚类的重采样等。

步骤S202，基于所述垃圾图像样本集和所述均衡样本集，训练预设的初始平滑感知模型，直至所述初始平滑感知模型达到第一预设收敛条件，得到目标平滑感知模型。

在本步骤中，初始平滑感知模型是基于感知机(MLP)为基础模型构建得到的平滑感知模型，其用于学习样本标签的平滑系数，以后续在第一垃圾分类模型进行训练时，对第一垃圾分类模型的损失函数进行平滑处理，起到抑制模型过拟合的作用。

可选地，通过垃圾图像样本集和均衡样本集，对第一垃圾分类模型进行训练，并采用垃圾分类模型的损失函数更新初始平滑感知模型的模型参数，直至模型收敛。

步骤S203，基于所述垃圾图像样本集，对预设的第一垃圾分类模型进行迭代训练，得到第一损失值。

在本步骤中，第一垃圾分类模型为基于深度神经网络为基础模型构建得到垃圾分类模型，其用于对图像中的垃圾进行分类。可以理解的是，迭代训练为对一个模型进行训练，更新该模型的模型参数，并将模型参数更新后的模型作为新模型继续训练的过程，其中每次训练均得到一个第一损失值，每次得到的第一损失值经过平滑处理后用于更新本次训练模型的模型参数。

示例性地，将垃圾图像样本集输入到第一垃圾分类模型进行处理，输出垃圾分类预测值，计算该垃圾分类预测值与标注数据中的实际分类值之间的第一损失值，对第一损失值进行平滑处理后，得到第二损失值，根据第二损失值，更新第一垃圾分类模型的模型参数，将更新后的第一垃圾分类模型继续对垃圾图像样本集进行训练，直至第一垃圾分类模型收敛。

步骤S204，利用所述目标平滑感知模型，对所述第一损失值进行平滑处理，得到第二损失值。

在本步骤中，平滑处理为采用目标平滑感知模型的平滑系数对损失值进行处理的过程，相比于当前平滑系数需要凭借人为经验设定，本实施例通过感知机学习样本标签噪声特征，以学习到样本标签的平滑系数，从而减少真实样本标签在计算损失值时的权重，有效抑制模型过拟合。

可选地，将第一垃圾分类模型输出的垃圾分类预测值输入到基于平滑系数构建的损失函数进行处理，得到第二损失值。

步骤S205，根据所述第二损失值，更新所述第一垃圾分类模型的模型参数，直至所述第一垃圾分类模型达到第二预设收敛条件，得到目标垃圾分类模型。

在本步骤中，预设收敛条件为表示模型训练完成的条件，例如损失函数得到的损失值(期望误差)小于预设损失阈值，则表示收敛，或者网络迭代次数达到预设次数。可以通俗理解为，损失值越小表示该模型提取到的特征向量越准确。示例性地，当该第二损失值大于或等于预设损失阈值时，调整第一垃圾分类模型中的模型参数，并返回执行步骤S103和步骤S104；当第二损失值小于预设损失阈值时，表示第一垃圾分类模型训练完成，得到训练好的目标垃圾分类模型。

在一实施例中，在图1所示实施例的基础上，上述步骤S202，包括：

在本实施例中，第二垃圾分类模型与第一垃圾分类模型的模型结构完全相同，可以简单理解，通过对第一垃圾分类模型进行复制操作，得到第二垃圾分类模型。通过第二垃圾分类模型学习非均衡样本集和均衡样本集的样本特征差异，并更新初始平滑感知模型的模型参数，使初始平滑感知模型学习到样本标签的平滑系数。

可选地，第一预设收敛条件可以为第二垃圾分类模型和初始平滑感知模型的损失值均小于预设损失阈值，或者两者之和小于预设阈值，又或者迭代次数达到预设次数。

在一实施例中，在图1所示实施例的基础上，上述步骤S203，包括：

表示第i个垃圾图像样本属于第j个类别时的符号函数，

表示第i个垃圾图像样本属于第j个类别时的概率，K为总类别数。

在本实施例中，第一损失函数为交叉熵损失值。

可选地，所述利用所述第一垃圾分类模型，对所述垃圾图像样本集中的每个垃圾图像样本进行垃圾分类识别，得到每个所述垃圾图像样本的垃圾分类结果，包括：

在本实施例中，在多分类任务中，深度神经网络会输出一个当前数据对应于各个类别的置信度分数，将这些分数通过softmax进行归一化处理，最终会得到当前数据属于每个类别的概率。例如，第i个样本属于第j类的概率计算如下：

其中，

表示第i个样本属于第j类的置信度分数，

表示第i个样本属于第j类的概率，K表示总类别数。

表示第i个垃圾图像样本属于第j个类别时的符号函数，

表示第i个垃圾图像样本属于第j个类别时的概率，ε_j表示第j个类别的平滑系数，K为总类别数。

在本实施例中，由于垃圾图像样本集存在严重的标签噪声，第一损失函数采用交叉熵损失值更新模型参数容易导致模型过拟合，所以为了解决标签噪声造成的模型过拟合问题，采用标签平滑策略。通过加入平滑系数，减少真实样本标签在计算损失函数时的权重，以抑制过拟合。

参照图3，图3为本申请实施例提供的一种垃圾分类方法的流程示意图。本申请实施例的垃圾分类模型的训练方法可应用于计算机设备，该计算机设备优选为智能机器人，该机器人集成有上述垃圾分类系统。如图3所示，垃圾分类方法包括步骤S301至S303，详述如下：

步骤S301，获取垃圾图像；

在本步骤中，示例性地，对于应用于智能机器人上的垃圾分类方法，智能机器人按照预设路线进行移动，在移动过程中，可以通过上述垃圾分类系统中的摄像机模块采集地面的垃圾图像，并将采集到的垃圾图像发送至边缘计算模块进行推理。

步骤S302，基于目标垃圾分类模型，对所述垃圾图像进行分类识别，得到初始分类数据，所述目标垃圾分类模型基于图2实施例所示的训练方法训练得到。

在本步骤中，将垃圾图像输入到目标垃圾分类模型，通过边缘计算模块采用卷积、池化和采样等操作对垃圾图像进行分类识别，输出初始分类数据。

步骤S303，对所述初始分类数据进行平滑处理和全连接，得到目标分类结果。

在本步骤中，通过目标平滑感知模型，对初始分类数据进行平滑处理，降低噪声影响，再通过对平滑处理后的初始分类数据进行全连接，得到目标分类结果。

为了执行上述方法实施例对应的垃圾分类模型的训练方法，以实现相应的功能和技术效果。参见图4，图4示出了本申请实施例提供的一种垃圾分类模型的训练装置的结构框图。为了便于说明，仅示出了与本实施例相关的部分，本申请实施例提供的垃圾分类模型的训练装置，包括：

采样模块401，用于对预先标注好的垃圾图像样本集进行重采样，得到均衡样本集；

第一训练模块402，用于基于所述垃圾图像样本集和所述均衡样本集，训练预设的初始平滑感知模型，直至所述初始平滑感知模型达到第一预设收敛条件，得到目标平滑感知模型；

第二训练模块403，用于基于所述垃圾图像样本集，对预设的第一垃圾分类模型进行迭代训练，得到第一损失值；

第一平滑模块404，用于利用所述目标平滑感知模型，对所述第一损失值进行平滑处理，得到第二损失值；

更新模块405，用于根据所述第二损失值，更新所述第一垃圾分类模型的模型参数，直至所述第一垃圾分类模型达到第二预设收敛条件，得到目标垃圾分类模型。

在一实施例中，所述第一训练模块402，包括：

第一训练单元，用于基于所述垃圾图像样本集，对预设的第二垃圾分类模型进行训练，得到第三损失值，所述第二垃圾分类模型与所述第一垃圾分类模型的模型结构相同；

处理单元，用于利用所述初始平滑感知模型，对所述第三损失值进行平滑处理，得到第四损失值；

第一更新单元，用于根据所述第四损失值，更新所述第二垃圾分类模型的模型参数，得到第二目标垃圾分类模型；

第二训练单元，用于基于所述均衡样本集，对所述第二垃圾分类模型进行训练，得到第五损失值；

第二更新单元，用于根据所述第五损失值，更新所述初始平滑感知模型的模型参数，直至所述初始平滑感知模型达到所述第一预设收敛条件，得到目标平滑感知模型。

在一实施例中，所述第二训练模块403，包括：

识别单元，用于利用所述第一垃圾分类模型，对所述垃圾图像样本集中的每个垃圾图像样本进行垃圾分类识别，得到每个所述垃圾图像样本的垃圾分类结果；

第一计算单元，用于基于第一损失函数，根据所述垃圾分类结果，计算所述第一损失值，所述第一损失函数为：

表示第i个垃圾图像样本属于第j个类别时的符号函数，

表示第i个垃圾图像样本属于第j个类别时的概率。

在一实施例中，所述识别单元，包括：

确定子单元，用于利用所述第一垃圾分类模型，确定所述垃圾图像样本的属于各个类别时的置信度分数；

处理子单元，用于对所述置信度分数进行归一化处理，得到所述垃圾图像样本的属于各个类别时的概率。

在一实施例中，所述第一平滑模块404，包括：

确定单元，用于利用所述目标平滑感知模型，确定所述第一损失值对应的平滑系数；

第二计算单元，用于基于第二损失函数，根据所述平滑系数，计算所述第二损失值，所述第二损失函数为：

表示第i个垃圾图像样本属于第j个类别时的符号函数，

上述的垃圾分类模型的训练装置可实施上述方法实施例的垃圾分类模型的训练方法。上述方法实施例中的可选项也适用于本实施例，这里不再详述。本申请实施例的其余内容可参照上述方法实施例的内容，在本实施例中，不再进行赘述。

为了执行上述方法实施例对应的垃圾分类方法，以实现相应的功能和技术效果。参见图5，图5示出了本申请实施例提供的一种垃圾分类装置的结构框图。为了便于说明，仅示出了与本实施例相关的部分，本申请实施例提供的垃圾分类装置，包括：

获取模块501，用于获取垃圾图像；

识别模块502，用于基于目标垃圾分类模型，对所述垃圾图像进行分类识别，得到初始分类数据，所述目标垃圾分类模型基于图2实施例所示的训练方法训练得到；

第二平滑模块503，用于对所述初始分类数据进行平滑处理，得到目标分类结果。

上述的垃圾分类装置可实施上述方法实施例的垃圾分类方法。上述方法实施例中的可选项也适用于本实施例，这里不再详述。本申请实施例的其余内容可参照上述方法实施例的内容，在本实施例中，不再进行赘述。

图6为本申请一实施例提供的计算机设备的结构示意图。如图6所示，该实施例的计算机设备6包括：至少一个处理器60(图6中仅示出一个)处理器、存储器61以及存储在所述存储器61中并可在所述至少一个处理器60上运行的计算机程序62，所述处理器60执行所述计算机程序62时实现上述任意方法实施例中的步骤。

所述计算机设备6可以是智能手机、平板电脑、桌上型计算机和智能机器人等计算设备。该计算机设备可包括但不仅限于处理器60、存储器61。本领域技术人员可以理解，图6仅仅是计算机设备6的举例，并不构成对计算机设备6的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如还可以包括输入输出设备、网络接入设备等。

所称处理器60可以是中央处理单元(Central Processing Unit，CPU)，该处理器60还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field－Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器61在一些实施例中可以是所述计算机设备6的内部存储单元，例如计算机设备6的硬盘或内存。所述存储器61在另一些实施例中也可以是所述计算机设备6的外部存储设备，例如所述计算机设备6上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。进一步地，所述存储器61还可以既包括所述计算机设备6的内部存储单元也包括外部存储设备。所述存储器61用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等，例如所述计算机程序的程序代码等。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。

另外，本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述任意方法实施例中的步骤。

本申请实施例提供了一种计算机程序产品，当计算机程序产品在计算机设备上运行时，使得计算机设备执行时实现上述各个方法实施例中的步骤。

在本申请所提供的几个实施例中，可以理解的是，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意的是，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read－Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述的具体实施例，对本申请的目的、技术方案和有益效果进行了进一步的详细说明，应当理解，以上所述仅为本申请的具体实施例而已，并不用于限定本申请的保护范围。特别指出，对于本领域技术人员来说，凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种垃圾分类模型的训练方法，其特征在于，包括：

2.如权利要求1所述的垃圾分类模型的训练方法，其特征在于，所述基于所述垃圾图像样本集和所述均衡样本集，训练预设的初始平滑感知模型，直至所述初始平滑感知模型达到第一预设收敛条件，得到目标平滑感知模型，包括：

3.如权利要求1所述的垃圾分类模型的训练方法，其特征在于，所述基于所述垃圾图像样本集，对预设的第一垃圾分类模型进行迭代训练，得到第一损失值，包括：

表示第i个垃圾图像样本属于第j个类别时的符号函数，

4.如权利要求3所述的垃圾分类模型的训练方法，其特征在于，所述利用所述第一垃圾分类模型，对所述垃圾图像样本集中的每个垃圾图像样本进行垃圾分类识别，得到每个所述垃圾图像样本的垃圾分类结果，包括：

5.如权利要求1所述的垃圾分类模型的训练方法，其特征在于，所述利用所述目标平滑感知模型，对所述第一损失值进行平滑处理，得到第二损失值，包括：

表示第i个垃圾图像样本属于第j个类别时的符号函数，

6.一种垃圾分类方法，其特征在于，包括：

获取垃圾图像；

基于目标垃圾分类模型，对所述垃圾图像进行分类识别，得到初始分类数据，所述目标垃圾分类模型基于权利要求1至5任一项所述的训练方法训练得到；

7.一种垃圾分类模型的训练装置，其特征在于，包括：

8.一种垃圾分类装置，其特征在于，包括：

获取模块，用于获取垃圾图像；

识别模块，用于基于目标垃圾分类模型，对所述垃圾图像进行分类识别，得到初始分类数据，所述目标垃圾分类模型基于权利要求1至5任一项所述的训练方法训练得到；

9.一种计算机设备，其特征在于，包括处理器和存储器，所述存储器用于存储计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至5任一项所述的垃圾分类模型的训练方法，或权利要求6所述的垃圾分类方法。

10.一种计算机可读存储介质，其特征在于，其存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的垃圾分类模型的训练方法，或权利要求6所述的垃圾分类方法。