CN113989567A - 垃圾图片分类方法及装置 - Google Patents

垃圾图片分类方法及装置 Download PDF

Info

Publication number
CN113989567A
CN113989567A CN202111276606.4A CN202111276606A CN113989567A CN 113989567 A CN113989567 A CN 113989567A CN 202111276606 A CN202111276606 A CN 202111276606A CN 113989567 A CN113989567 A CN 113989567A
Authority
CN
China
Prior art keywords
picture
pictures
layer
garbage
classification model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111276606.4A
Other languages
English (en)
Inventor
徐晓健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202111276606.4A priority Critical patent/CN113989567A/zh
Publication of CN113989567A publication Critical patent/CN113989567A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种垃圾图片分类方法及装置,涉及人工智能技术领域,该方法包括:获取多张已知类别的垃圾图片,分为训练集与测试集;从训练集每一类别的垃圾图片中选取分类基底图片,剩余的垃圾图片作为待分类目标图片,将每一分类基底图片与每一待分类目标图片构成图片组后进行正负样本标记,将各样本输入图片分类模型,经过特征提取和相似度计算,输出图片组中垃圾图片的相似度,确定待分类目标图片的类别;根据正负样本对应的相似度结果,采用损失函数计算图片分类模型的损失值,根据损失值更新图片分类模型参数,得到优化的图片分类模型;利用通过测试的图片分类模型对垃圾图片进行分类,增强人们参与垃圾分类的积极性、提高垃圾分类的准确率。

Description

垃圾图片分类方法及装置
技术领域
本发明涉及人工智能技术领域,尤其涉及一种垃圾图片分类方法及装置。
背景技术
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
各大城市已经开始实行垃圾分类政策,目前对于垃圾分类只能依靠个人知识和经验进行,对参与者的相关知识储备具有一定的要求。但是由于垃圾种类繁多、各地对于垃圾的具体分类标准不一、个人知识时间精力有限等因素影响,目前人们参与垃圾分类的积极性较低,而且垃圾分类的准确率不高。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供一种垃圾图片分类方法,用以对垃圾图片进行自动分类,增强人们参与垃圾分类的积极性、提高垃圾分类的准确率,该方法包括:
获取多张已知类别的垃圾图片,分为训练集与测试集;
从训练集每一类别的垃圾图片中选取一张垃圾图片作为分类基底图片,剩余的垃圾图片作为待分类目标图片,依次将每一分类基底图片与每一待分类目标图片构成图片组;
将包含相同类别垃圾图片的图片组标记为正样本,包含不同类别垃圾图片的图片组标记为负样本,分别将各样本输入图片分类模型,经过特征提取和相似度计算,输出图片组中两张垃圾图片的相似度,将与待分类目标图片相似度最高的分类基底图片的类别,确定为待分类目标图片的类别,所述图片分类模型为神经网络模型;
根据正样本对应的相似度结果和负样本对应的相似度结果,采用损失函数计算图片分类模型的损失值,根据损失值更新图片分类模型参数,在图片分类模型的损失值不小于预设阈值时,利用更新的图片分类模型继续输出正样本对应的相似度结果和负样本对应的相似度结果,直到计算出图片分类模型的损失值小于预设阈值,得到优化的图片分类模型;
根据测试集对优化的图片分类模型进行测试,利用通过测试的图片分类模型对垃圾图片进行分类。
本发明实施例还提供一种垃圾图片分类装置,用以对垃圾图片进行自动分类,增强人们参与垃圾分类的积极性、提高垃圾分类的准确率,该装置包括:
获取模块,用于获取多张已知类别的垃圾图片,分为训练集与测试集;
图片组构成模块,用于从训练集每一类别的垃圾图片中选取一张垃圾图片作为分类基底图片,剩余的垃圾图片作为待分类目标图片,依次将每一分类基底图片与每一待分类目标图片构成图片组;
类别确定模块,用于将包含相同类别垃圾图片的图片组标记为正样本,包含不同类别垃圾图片的图片组标记为负样本,分别将各样本输入图片分类模型,经过特征提取和相似度计算,输出图片组中两张垃圾图片的相似度,将与待分类目标图片相似度最高的分类基底图片的类别,确定为待分类目标图片的类别,所述图片分类模型为神经网络模型;
模型优化模块,用于根据正样本对应的相似度结果和负样本对应的相似度结果,采用损失函数计算图片分类模型的损失值,根据损失值更新图片分类模型参数,在图片分类模型的损失值不小于预设阈值时,利用更新的图片分类模型继续输出正样本对应的相似度结果和负样本对应的相似度结果,直到计算出图片分类模型的损失值小于预设阈值,得到优化的图片分类模型;
测试与分类模块,用于根据测试集对优化的图片分类模型进行测试,利用通过测试的图片分类模型对垃圾图片进行分类。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述垃圾图片分类方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述垃圾图片分类方法的计算机程序。
与现有技术仍通过人工进行垃圾分类的方法相比,本发明实施例中,获取多张已知类别的垃圾图片,分为训练集与测试集;从训练集每一类别的垃圾图片中选取一张垃圾图片作为分类基底图片,剩余的垃圾图片作为待分类目标图片,依次将每一分类基底图片与每一待分类目标图片构成图片组;将包含相同类别垃圾图片的图片组标记为正样本,包含不同类别垃圾图片的图片组标记为负样本,分别将各样本输入图片分类模型,经过特征提取和相似度计算,输出图片组中两张垃圾图片的相似度,将与待分类目标图片相似度最高的分类基底图片的类别,确定为待分类目标图片的类别,所述图片分类模型为神经网络模型;根据正样本对应的相似度结果和负样本对应的相似度结果,采用损失函数计算图片分类模型的损失值,根据损失值更新图片分类模型参数,在图片分类模型的损失值不小于预设阈值时,利用更新的图片分类模型继续输出正样本对应的相似度结果和负样本对应的相似度结果,直到计算出图片分类模型的损失值小于预设阈值,得到优化的图片分类模型;根据测试集对优化的图片分类模型进行测试,利用通过测试的图片分类模型对垃圾图片进行分类,可以对垃圾图片进行自动分类,增强人们参与垃圾分类的积极性、提高垃圾分类的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中垃圾图片分类方法的处理流程图;
图2为本发明实施例中垃圾图片构成图片组进行标记的一具体实施例;
图3为本发明实施例中一图片分类神经网络模型的示意图;
图4为本发明实施例中确定待分类目标图片类别的一具体实例示意图;
图5为本发明实施例中垃圾图片分类装置的结构示意图;
图6为本发明一实施例的计算机设备结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
图1为本发明实施例中垃圾图片分类方法的处理流程图。如图1所示,本发明实施例中垃圾图片分类方法可以包括:
步骤101、获取多张已知类别的垃圾图片,分为训练集与测试集;
步骤102、从训练集每一类别的垃圾图片中选取一张垃圾图片作为分类基底图片,剩余的垃圾图片作为待分类目标图片,依次将每一分类基底图片与每一待分类目标图片构成图片组;
步骤103、将包含相同类别垃圾图片的图片组标记为正样本,包含不同类别垃圾图片的图片组标记为负样本,分别将各样本输入图片分类模型,经过特征提取和相似度计算,输出图片组中两张垃圾图片的相似度,将与待分类目标图片相似度最高的分类基底图片的类别,确定为待分类目标图片的类别,所述图片分类模型为神经网络模型;
步骤104、根据正样本对应的相似度结果和负样本对应的相似度结果,采用损失函数计算图片分类模型的损失值,根据损失值更新图片分类模型参数,在图片分类模型的损失值不小于预设阈值时,利用更新的图片分类模型继续输出正样本对应的相似度结果和负样本对应的相似度结果,直到计算出图片分类模型的损失值小于预设阈值,得到优化的图片分类模型;
步骤105、根据测试集对优化的图片分类模型进行测试,利用通过测试的图片分类模型对垃圾图片进行分类。
具体实施时,首先可以获取多张不同类别的垃圾图片,然后判断垃圾图片是否完整、是否清晰、是否存在其他干扰物,将存在上述问题的垃圾图片删除后,可以将垃圾图片分为训练集与测试集。
在一个实施例中,所述垃圾图片类别可以包括以下一项或多项:可回收垃圾图片、厨余垃圾图片、有害垃圾图片、其他垃圾图片。
在一个实施例中,获取多张已知类别的垃圾图片,分为训练集与测试集,可以包括:获取多张不同角度、光照度下的多张已知类别的垃圾图片,进行数据增强,得到训练集和测试集的数据。
由于可以获取到的符合条件的垃圾图片数量有限,而模型训练需要大量的样本数据,可以通过对不同角度、光照度下的多张已知类别的垃圾图片,进行数据增强,扩大训练集和测试集的样本数据,具体实施时,可以对获取到的符合条件的垃圾图片进行几何变换和/或颜色变换,几何变换例如可以包括对垃圾图片进行翻转,旋转,裁剪,变形,缩放等各类操作;颜色变换例如可以包括对垃圾图片进行噪声、模糊、颜色变换、擦除、填充等各类操作。
对获取到的符合条件的垃圾图片进行数据增强,得到训练集和测试集的数据之后,从训练集每一类别的垃圾图片中选取一张垃圾图片作为分类基底图片,剩余的垃圾图片作为待分类目标图片,依次将每一分类基底图片与每一待分类目标图片构成图片组,将包含相同类别垃圾图片的图片组标记为正样本,包含不同类别垃圾图片的图片组标记为负样本。
图2为本发明实施例中垃圾图片构成图片组进行标记的一具体实施例,如图2所示,已知待分类目标图片有:图片1、图片2、图片3、...图片n,待分类目标图片的已知类别有:class-a、class-b、class-c、...class-i,以将class-a的分类基底图片分别与待分类目标图片构成图片组进行标记为例进行说明。如图2所示,将class-a的分类基底图片与每一待分类目标图片构成图片组,并将图片组中待分类目标图片的类别为class-a的图片组标记为正样本,比如标记为“1”,将图片组中待分类目标图片的类别不是class-a的图片组标记为负样本,比如标记为“0”。
对图片组进行标记之后,可以分别将各样本输入图片分类模型,经过特征提取和相似度计算,输出图片组中两张垃圾图片的相似度,将与待分类目标图片相似度最高的分类基底图片的类别,确定为待分类目标图片的类别。
在一个实施例中,所述图片分类模型可以由11层的神经网络构建,其中:第一层、第三层、第四层、第六层、第七层和第八层为卷积层;第二层、第五层为批归一化层;第九层、第十层为全连接层;第十一层为输出层;在第二层批归一化层与第三层卷积层之间进行第一次特征提取操作,用于提取并放大图片特征提取目标区域,减少噪声干扰;在第三层卷积层与第四层卷积层之间进行第二次特征提取操作,用于继续提取并放大图片特征提取目标区域,减少噪声干扰,确保后续分类准确率。
图3为本发明实施例中一图片分类神经网络模型的示意图,如图3所示,构建图片分类模型时可以按照如下步骤:
(1)输入图片经卷积层1进行处理得到卷积输出,输出数据维度为196×196,卷积核尺寸3×3,步长为1;
(2)第二层为BN层与池化层的结合层,对卷积层1的输出进行均值池化,对池化输出做批归一化操作,输出数据维度为49×49,池化步长为2;
(3)对归一化输出进行第一次特征提取操作,放大图片特征提取区域,减少噪声干扰;
(4)利用卷积层2对第一次特征提取的输出进行卷积操作,输出数据维度为47×47,卷积核尺寸为2×2,卷积步长为1;
(5)对卷积层2的输出进行第二次特征提取操作,继续放大图片特征提取区域,减少噪声干扰;
(6)利用卷积层3对第二次特征提取的输出进行卷积操作,输出数据维度为45×45,卷积核尺寸为2×2,卷积步长为1;
(7)第五层为BN层与池化层的结合层,对卷积层3的输出进行均值池化,对池化输出做批归一化操作,输出数据维度为11×11,池化步长为2;
(8)利用卷积层4对池化层的输出进行卷积操作,输出数据维度为9×9,卷积核尺寸为3×3,卷积步长为1;
(9)利用卷积层5对卷积层4的输出进行卷积操作,输出数据维度为7×7,卷积核尺寸为3×3,卷积步长为1;
(10)利用卷积层6对卷积层5的输出进行卷积操作,输出数据维度为5×5,卷积核尺寸为3×3,卷积步长为1;
(11)利用全连接层1对卷积层6的输出进行处理,全连接层1的神经元数为64;
(12)利用全连接层2对全连接层1的输出进行处理,全连接层2的神经元数为32,将全连接层2的结果输入到softmax层进行处理得到最终的输出;
(13)输出层的数据维度为4×1。
具体实施时,以对卷积层2的输出进行第二次特征提取操作为例进行说明,假设卷积层2输出为y2,其维度为[N,H,W,C],y2将被输入到特征选择模块进行特征区域提取,提取结果为一个维度为[N,2,3]维度的矩阵θ2,利用θ2对y2进行特征区域提取即可得到处理后的特征y′2,对y2的具体处理过程可以为:
1)通过一个7×7尺度卷积核conv1对y2进行一次常规卷积,该操作将初步对输入y2进行特征提取;
2)分别对conv1卷积后的输出进行一次信息提取,采用2×2尺度滑动窗口,分别提取卷积输出中的最大值和平均值,分别对2个输出进行非线性处理后,得到2个输出结果;
3)对2个输出结果按照通道维度进行拼接和非线性处理,得到进行非线性特征提取后的特征;
4)利用一个5×5尺度卷积核conv2对步骤3输出进行一次常规卷积,该操作将对特征在更高维进行特征提取,增加每个数据的感受野,提升特征中高维特征的丰富度;
5)分别对conv2卷积后的输出进行一次信息提取,采用2×2尺度滑动窗口,分别提取卷积输出中的最大值和平均值,分别对2个输出进行非线性处理后,得到2个输出结果;
6)对2个输出结果按照通道维度进行拼接和非线性处理,得到进行非线性特征提取后的特征;
7)将步骤6结果输入到一个32个神经元的全连接层进行处理;
8)将步骤7结果输入到一个包含6个神经元的输出层,得到用于评价y2特征重要性的输出结果,其维度为[N,2,3];
9)最终,将该结果与y2相乘,提取出y2中最重要的特征区域;
10)对步骤9提取出的特征进行最邻近采样,将其维度提升到与y2相同,得到最终的输出结果。通过对特征进行上述操作,可以从特征图中提取出最重要的信息,进而增强了模型本身的特征提取和数据处理能力,提升了最终的性能。
在一个实施例中,分别将各样本输入图片分类模型,经过特征提取和相似度计算,输出图片组中两张垃圾图片的相似度,可以包括:分别将各样本输入图片分类模型,对图片组进行特征提取,得到图片组中两张垃圾图片对应的特征向量;计算两张垃圾图片对应的特征向量间的距离;根据距离计算结果,确定两张垃圾图片的相似度。
在一个实施例中,根据距离计算结果,确定两张垃圾图片的相似度,可以包括:根据距离计算结果,确定两张垃圾图片为同种类别图片的概率;根据两张垃圾图片为同种类别图片的概率,确定两张垃圾图片的相似度。
图4为本发明实施例中确定待分类目标图片类别的一具体实例示意图,如图4所示,具体实施时,可以预先设置在待分类目标图片与分类基底图片对应的特征向量间距离小于等于时k时,则可以确定两张图片属于同一个类别;仍以上述内容为例,将由class-a的分类基底图片和图片1构成的图片组输入到图片分类模型中,经过特征提取操作后可以分别得到两张垃圾图片对应的特征向量:
Figure BDA0003329610110000081
Figure BDA0003329610110000082
将2个特征向量输入到全连接层中,计算两张垃圾图片对应的特征向量间的距离为
Figure BDA0003329610110000083
计算k与两张垃圾图片对应的特征向量间的距h之间的比值,可以得到该图片组中的图片1与class-a的分类基底图片为同种类别图片的概率,即h越小,该图片组中图片1与class-a的分类基底图片为同种类别图片的概率越大,图片1与class-a的分类基底图片的相似度越高,若图片1经过与所有分类基底图片,即class-a、class-b、class-c、...class-i对应的分类基底图片,构成图片组输入图片分类模型后,得出图片1与class-a的分类基底图片的相似度最高,则可以确定图片1的类别为class-a。
在确定待分类目标图片的类别之后,根据正样本对应的相似度结果和负样本对应的相似度结果,可以采用损失函数计算图片分类模型的损失值,并根据损失值更新图片分类模型参数,在图片分类模型的损失值不小于预设阈值时,利用更新的图片分类模型继续输出正样本对应的相似度结果和负样本对应的相似度结果,直到计算出图片分类模型的损失值小于预设阈值,得到优化的图片分类模型。
在一个实施例中,所述损失函数可以为交叉熵损失函数。交叉熵损失函数(CrossEntropy Loss),交叉熵是信息论中的一个重要概念,主要用于度量两个概率分布间的差异性。交叉熵可在神经网络(机器学习)中作为损失函数,p表示真实标记的分布,q则为训练后的模型的预测标记分布,交叉熵损失函数可以衡量p与q的相似性。交叉熵作为损失函数还有一个好处是使用sigmoid函数在梯度下降时能避免均方误差损失函数学习速率降低的问题,因为学习速率可以被输出的误差所控制。
具体实施时,假设损失值为z,损失值的预设阈值为z1,利用损失函数得到优化的图片分类模型的步骤可以包括:
(1)采用损失函数计算各样本与各样本对应的相似度结果之间的损失值z;
(2)根据计算到的损失值z更新图片分类模型参数;
(3)比较计算到的损失值z与预设阈值z1的大小,若z大于z1,继续重复步骤(1)和步骤(2);若z小于等于z1,则停止更新图片分类模型参数,得到优化的图片分类模型。
在一个实施例中,经过上述训练过程得到优化的图片分类模型之后,还可以根据测试集对训练好的图片分类模型进行测试,利用通过测试的图片分类模型对外币图片进行分类。
本发明实施例中还提供了一种垃圾图片分类装置,如下面的实施例所述。由于该装置解决问题的原理与外币图片分类处理方法相似,因此该装置的实施可以参见垃圾图片分类方法的实施,重复之处不再赘述。
图5为本发明实施例中垃圾图片分类装置的结构示意图。如图5所示,本发明实施例中垃圾图片分类装置具体可以包括:
获取模块501,用于获取多张已知类别的垃圾图片,分为训练集与测试集;
图片组构成模块502,用于从训练集每一类别的垃圾图片中选取一张垃圾图片作为分类基底图片,剩余的垃圾图片作为待分类目标图片,依次将每一分类基底图片与每一待分类目标图片构成图片组;
类别确定模块503,用于将包含相同类别垃圾图片的图片组标记为正样本,包含不同类别垃圾图片的图片组标记为负样本,分别将各样本输入图片分类模型,经过特征提取和相似度计算,输出图片组中两张垃圾图片的相似度,将与待分类目标图片相似度最高的分类基底图片的类别,确定为待分类目标图片的类别,所述图片分类模型为神经网络模型;
模型优化模块504,用于根据正样本对应的相似度结果和负样本对应的相似度结果,采用损失函数计算图片分类模型的损失值,根据损失值更新图片分类模型参数,在图片分类模型的损失值不小于预设阈值时,利用更新的图片分类模型继续输出正样本对应的相似度结果和负样本对应的相似度结果,直到计算出图片分类模型的损失值小于预设阈值,得到优化的图片分类模型;
测试与分类模块505,用于根据测试集对优化的图片分类模型进行测试,利用通过测试的图片分类模型对垃圾图片进行分类。
在一个实施例中,所述垃圾图片类别包括以下一项或多项:
可回收垃圾图片、厨余垃圾图片、有害垃圾图片、其他垃圾图片。
在一个实施例中,所述图片分类模型由11层的神经网络构建,其中:第一层、第三层、第四层、第六层、第七层和第八层为卷积层;第二层、第五层为批归一化层;第九层、第十层为全连接层;第十一层为输出层;在第二层批归一化层与第三层卷积层之间进行第一次特征提取操作,用于提取并放大图片特征提取目标区域,减少噪声干扰;在第三层卷积层与第四层卷积层之间进行第二次特征提取操作,用于继续提取并放大图片特征提取目标区域,减少噪声干扰,确保后续分类准确率。
在一个实施例中,获取模块501具体用于:
获取多张不同角度、光照度下的多张已知类别的垃圾图片,进行数据增强,得到训练集和测试集的数据。
在一个实施例中,类别确定模块503具体用于:
分别将各样本输入图片分类模型,对图片组进行特征提取,得到图片组中两张垃圾图片对应的特征向量;
计算两张垃圾图片对应的特征向量间的距离;
根据距离计算结果,确定两张垃圾图片的相似度。
在一个实施例中,类别确定模块503具体用于:
根据距离计算结果,确定两张垃圾图片为同种类别图片的概率;
根据两张垃圾图片为同种类别图片的概率,确定两张垃圾图片的相似度。
在一个实施例中,所述损失函数为交叉熵损失函数。
基于前述发明构思,如图6所示,本发明还提出了一种计算机设备600,包括存储器610、处理器620及存储在存储器610上并可在处理器620上运行的计算机程序630,所述处理器620执行所述计算机程序630时实现前述垃圾图片分类方法。
基于前述发明构思,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述垃圾图片分类方法的计算机程序。
综上所述,与现有技术仍通过人工进行垃圾分类的方法相比,本发明实施例中,获取多张已知类别的垃圾图片,分为训练集与测试集;从训练集每一类别的垃圾图片中选取一张垃圾图片作为分类基底图片,剩余的垃圾图片作为待分类目标图片,依次将每一分类基底图片与每一待分类目标图片构成图片组;将包含相同类别垃圾图片的图片组标记为正样本,包含不同类别垃圾图片的图片组标记为负样本,分别将各样本输入图片分类模型,经过特征提取和相似度计算,输出图片组中两张垃圾图片的相似度,将与待分类目标图片相似度最高的分类基底图片的类别,确定为待分类目标图片的类别,所述图片分类模型为神经网络模型;根据正样本对应的相似度结果和负样本对应的相似度结果,采用损失函数计算图片分类模型的损失值,根据损失值更新图片分类模型参数,在图片分类模型的损失值不小于预设阈值时,利用更新的图片分类模型继续输出正样本对应的相似度结果和负样本对应的相似度结果,直到计算出图片分类模型的损失值小于预设阈值,得到优化的图片分类模型;根据测试集对优化的图片分类模型进行测试,利用通过测试的图片分类模型对垃圾图片进行分类,可以对垃圾图片进行自动分类,增强人们参与垃圾分类的积极性、提高垃圾分类的准确率。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (16)

1.一种垃圾图片分类方法,其特征在于,包括:
获取多张已知类别的垃圾图片,分为训练集与测试集;
从训练集每一类别的垃圾图片中选取一张垃圾图片作为分类基底图片,剩余的垃圾图片作为待分类目标图片,依次将每一分类基底图片与每一待分类目标图片构成图片组;
将包含相同类别垃圾图片的图片组标记为正样本,包含不同类别垃圾图片的图片组标记为负样本,分别将各样本输入图片分类模型,经过特征提取和相似度计算,输出图片组中两张垃圾图片的相似度,将与待分类目标图片相似度最高的分类基底图片的类别,确定为待分类目标图片的类别,所述图片分类模型为神经网络模型;
根据正样本对应的相似度结果和负样本对应的相似度结果,采用损失函数计算图片分类模型的损失值,根据损失值更新图片分类模型参数,在图片分类模型的损失值不小于预设阈值时,利用更新的图片分类模型继续输出正样本对应的相似度结果和负样本对应的相似度结果,直到计算出图片分类模型的损失值小于预设阈值,得到优化的图片分类模型;
根据测试集对优化的图片分类模型进行测试,利用通过测试的图片分类模型对垃圾图片进行分类。
2.如权利要求1所述的方法,其特征在于,所述垃圾图片类别包括以下一项或多项:
可回收垃圾图片、厨余垃圾图片、有害垃圾图片、其他垃圾图片。
3.如权利要求1所述的方法,其特征在于,所述图片分类模型由11层的神经网络构建,其中:第一层、第三层、第四层、第六层、第七层和第八层为卷积层;第二层、第五层为批归一化层;第九层、第十层为全连接层;第十一层为输出层;在第二层批归一化层与第三层卷积层之间进行第一次特征提取操作,用于提取并放大图片特征提取目标区域,减少噪声干扰;在第三层卷积层与第四层卷积层之间进行第二次特征提取操作,用于继续提取并放大图片特征提取目标区域,减少噪声干扰,确保后续分类准确率。
4.如权利要求1所述的方法,其特征在于,获取多张已知类别的垃圾图片,分为训练集与测试集,包括:
获取多张不同角度、光照度下的多张已知类别的垃圾图片,进行数据增强,得到训练集和测试集的数据。
5.如权利要求1所述的方法,其特征在于,分别将各样本输入图片分类模型,经过特征提取和相似度计算,输出图片组中两张垃圾图片的相似度,包括:
分别将各样本输入图片分类模型,对图片组进行特征提取,得到图片组中两张垃圾图片对应的特征向量;
计算两张垃圾图片对应的特征向量间的距离;
根据距离计算结果,确定两张垃圾图片的相似度。
6.如权利要求5所述的方法,其特征在于,根据距离计算结果,确定两张垃圾图片的相似度,包括:
根据距离计算结果,确定两张垃圾图片为同种类别图片的概率;
根据两张垃圾图片为同种类别图片的概率,确定两张垃圾图片的相似度。
7.如权利要求1所述的方法,其特征在于,所述损失函数为交叉熵损失函数。
8.一种垃圾图片分类装置,其特征在于,包括:
获取模块,用于获取多张已知类别的垃圾图片,分为训练集与测试集;
图片组构成模块,用于从训练集每一类别的垃圾图片中选取一张垃圾图片作为分类基底图片,剩余的垃圾图片作为待分类目标图片,依次将每一分类基底图片与每一待分类目标图片构成图片组;
类别确定模块,用于将包含相同类别垃圾图片的图片组标记为正样本,包含不同类别垃圾图片的图片组标记为负样本,分别将各样本输入图片分类模型,经过特征提取和相似度计算,输出图片组中两张垃圾图片的相似度,将与待分类目标图片相似度最高的分类基底图片的类别,确定为待分类目标图片的类别,所述图片分类模型为神经网络模型;
模型优化模块,用于根据正样本对应的相似度结果和负样本对应的相似度结果,采用损失函数计算图片分类模型的损失值,根据损失值更新图片分类模型参数,在图片分类模型的损失值不小于预设阈值时,利用更新的图片分类模型继续输出正样本对应的相似度结果和负样本对应的相似度结果,直到计算出图片分类模型的损失值小于预设阈值,得到优化的图片分类模型;
测试与分类模块,用于根据测试集对优化的图片分类模型进行测试,利用通过测试的图片分类模型对垃圾图片进行分类。
9.如权利要求8所述的装置,其特征在于,所述垃圾图片类别包括以下一项或多项:
可回收垃圾图片、厨余垃圾图片、有害垃圾图片、其他垃圾图片。
10.如权利要求8所述的装置,其特征在于,所述图片分类模型由11层的神经网络构建,其中:第一层、第三层、第四层、第六层、第七层和第八层为卷积层;第二层、第五层为批归一化层;第九层、第十层为全连接层;第十一层为输出层;在第二层批归一化层与第三层卷积层之间进行第一次特征提取操作,用于提取并放大图片特征提取目标区域,减少噪声干扰;在第三层卷积层与第四层卷积层之间进行第二次特征提取操作,用于继续提取并放大图片特征提取目标区域,减少噪声干扰,确保后续分类准确率。
11.如权利要求8所述的装置,其特征在于,获取模块具体用于:
获取多张不同角度、光照度下的多张已知类别的垃圾图片,进行数据增强,得到训练集和测试集的数据。
12.如权利要求8所述的装置,其特征在于,类别确定模块具体用于:
分别将各样本输入图片分类模型,对图片组进行特征提取,得到图片组中两张垃圾图片对应的特征向量;
计算两张垃圾图片对应的特征向量间的距离;
根据距离计算结果,确定两张垃圾图片的相似度。
13.如权利要求12所述的装置,其特征在于,类别确定模块具体用于:
根据距离计算结果,确定两张垃圾图片为同种类别图片的概率;
根据两张垃圾图片为同种类别图片的概率,确定两张垃圾图片的相似度。
14.如权利要求8所述的装置,其特征在于,所述损失函数为交叉熵损失函数。
15.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一所述方法。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至7任一所述方法的计算机程序。
CN202111276606.4A 2021-10-29 2021-10-29 垃圾图片分类方法及装置 Pending CN113989567A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111276606.4A CN113989567A (zh) 2021-10-29 2021-10-29 垃圾图片分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111276606.4A CN113989567A (zh) 2021-10-29 2021-10-29 垃圾图片分类方法及装置

Publications (1)

Publication Number Publication Date
CN113989567A true CN113989567A (zh) 2022-01-28

Family

ID=79744827

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111276606.4A Pending CN113989567A (zh) 2021-10-29 2021-10-29 垃圾图片分类方法及装置

Country Status (1)

Country Link
CN (1) CN113989567A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115082736A (zh) * 2022-06-23 2022-09-20 平安普惠企业管理有限公司 垃圾识别分类方法、装置、电子设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115082736A (zh) * 2022-06-23 2022-09-20 平安普惠企业管理有限公司 垃圾识别分类方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN111126386B (zh) 场景文本识别中基于对抗学习的序列领域适应方法
CN109190442B (zh) 一种基于深度级联卷积神经网络的快速人脸检测方法
US20190228268A1 (en) Method and system for cell image segmentation using multi-stage convolutional neural networks
CN109272500B (zh) 基于自适应卷积神经网络的织物分类方法
CN110322445B (zh) 基于最大化预测和标签间相关性损失函数的语义分割方法
CN108765506A (zh) 基于逐层网络二值化的压缩方法
CN112233129B (zh) 基于深度学习的并行多尺度注意力机制语义分割方法及装置
CN106340016A (zh) 一种基于细胞显微镜图像的dna定量分析方法
CN112101364B (zh) 基于参数重要性增量学习的语义分割方法
CN113269224B (zh) 一种场景图像分类方法、系统及存储介质
CN116503676B (zh) 一种基于知识蒸馏小样本增量学习的图片分类方法及系统
CN116953006A (zh) 一种铸造材料扫描电镜图像缺陷识别与量化方法
CN112528845A (zh) 一种基于深度学习的物理电路图识别方法及其应用
CN114445356A (zh) 基于多分辨率的全视野病理切片图像肿瘤快速定位方法
CN112883931A (zh) 基于长短期记忆网络的实时真假运动判断方法
CN110163206B (zh) 车牌识别方法、系统、存储介质和装置
CN111310820A (zh) 基于交叉验证深度cnn特征集成的地基气象云图分类方法
CN114882278A (zh) 一种基于注意力机制和迁移学习的轮胎花纹分类方法和装置
CN114581789A (zh) 一种高光谱图像分类方法及系统
CN113989567A (zh) 垃圾图片分类方法及装置
CN112070116B (zh) 一种基于支持向量机的艺术画作自动分类系统及方法
CN112270404A (zh) 一种基于ResNet64网络的紧固件产品鼓包缺陷的检测结构及其方法
CN116597275A (zh) 一种基于数据增强的高速移动目标识别方法
CN111444816A (zh) 一种基于Faster RCNN的多尺度密集行人检测方法
CN116129189A (zh) 一种植物病害识别方法、设备、存储介质及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination