CN111860660A - 基于改进高斯网络的小样本学习垃圾分类方法 - Google Patents

基于改进高斯网络的小样本学习垃圾分类方法 Download PDF

Info

Publication number
CN111860660A
CN111860660A CN202010722838.7A CN202010722838A CN111860660A CN 111860660 A CN111860660 A CN 111860660A CN 202010722838 A CN202010722838 A CN 202010722838A CN 111860660 A CN111860660 A CN 111860660A
Authority
CN
China
Prior art keywords
network
sets
encoder
gaussian
small sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010722838.7A
Other languages
English (en)
Inventor
张海涛
陈真
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Liaoning Technical University
Original Assignee
Liaoning Technical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Liaoning Technical University filed Critical Liaoning Technical University
Priority to CN202010722838.7A priority Critical patent/CN111860660A/zh
Publication of CN111860660A publication Critical patent/CN111860660A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于改进高斯网络的小样本学习垃圾分类方法,包括:将收集到的数据集拆分为80%的支持集和20%的测试集,然后分别输入到高斯原型网络中通过编码器转换为矢量;计算编码器中的协方差矩阵以及父类集合的边缘权重;根据线性欧几里德距离计算嵌入空间中类别和方向相关的距离度量并且测量支持集与测试集之间的相似性,并且进行汇总;根据特定的损失函数计算方式得到损失,并且反向传播更新网络参数。本发明的方法相对于其它方法都有显著的提高,分类准确率最多提高20%左右,训练消耗时间有明显的区分,对于多噪声,分布广泛的数据集有很好的适用性,提出并建立了垃圾数据集可供读者下载使用。

Description

基于改进高斯网络的小样本学习垃圾分类方法
技术领域
本发明属于垃圾分类的技术领域,尤其涉及一种基于改进高斯网络的小样本学习垃圾分类方法。
背景技术
我们能够从一个或几个示例中来学习认识新的对象,从手写字符识别和电机控制到高级概念的广泛活动,都已经证实了这一点。将人类的这种行为复制到机器中去是小样本学习的最初动机。尽管现代深度学习方法通过非常深的神经网络实现了前所未有的性能,但这种技术仍然需要大量的数据进行训练,通常是数以百万计。而最近提出的小样本学习方法解决了深度学习与人类学习在计算机视觉和强化学习等领域之间的样本效率差距。其中简单高效的如原型网络通过学习一个度量空间,计算和每个类别的原型表达的距离来进行分类。但对于两个或多个样本的相似度,用距离较近来度量区分度不是非常明显。以及将深度神经网络特征的度量学习和外部存储的记忆增强网络相结合的匹配网络,该模型使用加权平均的方法去做小样本分类,速度快,需要训练量小,但当原有数据分别差异过大时会出现分类问题。
小样本学习分类是一项任务,在训练过程中必须调整分类器以适应训练中未见的新类。这样就会面临着过度配置问题,而数据增强和正则化技术可以减轻这种有限数据体系中的过度配置,但它们无法根本解决这一问题。
发明内容
基于以上现有技术的不足,本发明所解决的技术问题在于提供一种基于改进高斯网络的小样本学习垃圾分类方法,分类准确率高,提出并建立了垃圾数据集可供读者下载使用。
为了解决上述技术问题,本发明提供一种基于改进高斯网络的小样本学习垃圾分类方法,包括以下步骤:
步骤1:将收集到的数据集拆分为80%的支持集和20%的测试集,然后分别输入到高斯原型网络中通过编码器转换为矢量;
步骤2:计算编码器中的协方差矩阵以及父类集合的边缘权重;
步骤3:根据线性欧几里德距离计算嵌入空间中类别和方向相关的距离度量并且测量支持集与测试集之间的相似性,并且进行汇总;
步骤4:根据特定的损失函数计算方式得到损失,并且反向传播更新网络参数。
进一步的,所述步骤1中的编码器为能够将图像X转换为矢量
Figure BDA0002600625880000021
的函数:
Figure BDA0002600625880000022
其中的H是图像的高度,W是图像的宽度,C是图像的通道数,D是向量空间的嵌入维数。
由上,本发明针对于垃圾分类问题,提出了基于小样本学习的高斯原型网络,对生活中经常出现的四大类,几十小类做分类任务,分类效果较为理想。本发明有以下优点:
1)提出引入注意力机制的高斯原型网络。
2)对于多噪声,分布广泛的数据集有很好的适用性。
3)提出并建立了垃圾数据集可供读者下载使用。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下结合优选实施例,并配合附图,详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例的附图作简单地介绍。
图1为本发明的基于改进高斯网络的小样本学习垃圾分类方法的流程图。
图2为本发明与Prototypical network,Matching networks以及GaussianPrototypical分类准确率比较图,其中(a)代表1-样本,(b)代表5-样本。
具体实施方式
下面结合附图详细说明本发明的具体实施方式,其作为本说明书的一部分,通过实施例来说明本发明的原理,本发明的其他方面、特征及其优点通过该详细说明将会变得一目了然。在所参照的附图中,不同的图中相同或相似的部件使用相同的附图标号来表示。
本发明提出一种将弱监督机制的原型传播网络中的注意力机制加入到高斯原型网络的新型网络模型,更改后的模型通过把图像嵌入到向量中,并且可以评估数据集的质量情况。随后将这种质量情况与嵌入的图像向量一起,就可以用来预测样本周围的一个收敛的区域,样本的特征是由高斯协方差矩阵来决定,与此同时,它能够将一类的原型传播到数据集中的另一种上,以便在传播过程中定义K近邻分类器。本发明称之为引入注意力机制的高斯原型网络,这种模型可以在不同的少量任务中实现高精度。训练任务是通过子图采样生成的,并且训练目标是通过在子图上累积逐级分类损失来获得的。生成的原型图可以不断地重复使用和更新,以用于新的任务和类。
针对于小样本学习下的垃圾分类任务,本发明学习分类的基本流程分为:1)将收集到的数据集拆分为80%的支持集和20%的测试集,然后分别输入到高斯原型网络中通过编码器转换为矢量;2)计算编码器中的协方差矩阵以及父类集合的边缘权重;3)根据线性欧几里德距离计算嵌入空间中类别和方向相关的距离度量并且测量支持集与测试集之间的相似性,并且进行汇总;4)根据特定的损失函数计算方式得到损失,并且反向传播更新网络参数。
传统的原型网络相比较于高斯原型网络的编码器的结构没有什么不同之处,关键是针对于编码器的使用方式、如果去构建空间的度量以及编码器的输出内容的解释。由于将编码器的一部分输出作为构建有关支持集的协方差矩阵,模型的预测能力以及单个数据点的质量问题就可以被清晰的反映出来。此时的编码器是一种能够将图像X转换为矢量
Figure BDA0002600625880000041
的函数:
Figure BDA0002600625880000042
其中的H是图像的高度,W是图像的宽度,C是图像的通道数,D是向量空间的嵌入维数。
对于高斯原型网络来说,编码器的输出则是嵌入矢量
Figure BDA0002600625880000043
和协方差矩阵Σ∈RD*D的相关分量的串联。此时:
Figure BDA0002600625880000044
此时的DS为协方差矩阵的预测成分的维数,为了能够使的网络能够表达出关于支持集数据点的方向相关的置信度,选择DS=D的情况,即此时的协方差估计的维数与嵌入空间的维数是相等的,此时每一个图像都会生成
Figure BDA0002600625880000051
用来表示嵌入矢量周围的置信区间的大小。此时协方差矩阵的表示形式选择为:
Figure BDA0002600625880000052
其中
Figure BDA0002600625880000053
是从原始编码器输出的
Figure BDA0002600625880000054
计算得到的。
在高斯原型网络中,原型(即类的质心)被定义为:
Figure BDA0002600625880000055
此时的
Figure BDA0002600625880000056
为类x的嵌入矢量,
Figure BDA0002600625880000057
为对角线,○表示为分量形式乘法,除法也为分量形式。
在引入注意力机制的高斯原型网络中,原型传播在每个子类Zi上定义,也就说每一个总的垃圾分类Ri情况下包含着许多小的子分类Zi,如在可回收垃圾中包括废塑料、金属等;在有害垃圾中包括废电池、废药品等;在湿垃圾中包括瓜果皮核、蛋壳等。在给定类别Z∈Ri的相关训练数据Xr,类别Z的原型将初始化为样本Z∈Xr的平均值f(x),即
Figure BDA0002600625880000058
针对于数据集S中Zi所代表的某一子类的父类Ri来说,将通过一种边权重
Figure BDA0002600625880000059
Figure BDA00026006258800000510
传播到Z类,用来测量Z类和R类之间的相似性,并对这种传播过程做出一个汇总的工作,即:
Figure BDA00026006258800000511
其中的边缘权重
Figure BDA00026006258800000512
是可学习的相似性度量,通过点积注意来定义,即:
Figure BDA00026006258800000513
其中的g(·)和h(·)是适用于具有参数θa的原型,传播后的原型网络将是具有权重的
Figure BDA00026006258800000514
Figure BDA00026006258800000515
的加权平均值,α,β∈[0,1/2]即:
Figure BDA00026006258800000516
引入注意力机制后的高斯原型网络训练过程在下面的算法给出,主要包括为两个阶段:编码器计算阶段,该阶段主要是将输入的图片信息转换为矢量信息,并把协方差矩阵和嵌入矢量作为输出信息;原型传播阶段,主要是将每个类的原型与它父类的原型中的信息合并,并且将使用反向合并传播使用合并后的原型的分类错误,用来在每一阶段中更新父类原型网络,同时更新参数信息。
表1引入注意力机制后的高斯原型网络伪代码
Figure BDA0002600625880000061
本发明实验选在处理器i9-8700k、16GB内存、NVIDIA GeForce GTX1080Ti 8GB显卡、windows操作系统上,通过PyTorch深度学习框架实现。学习与预测任务选择小样本学习任务的传统,都是采用N-(way)K(shot)的小样本学习任务,意思为:提供N种没有训练过的新类、每种类有K个标注样本,然后根据这样的样本集来进行对测试图片是否属于这N类中的某个类的预测任务。本发明选择的类别数不管是在训练时还是在测试时都是相同的数目,即在5-way,5-shot的分类任务上,也就是说支持集的组成为5类,每类有5个样本。
由于目前没有相关正规数据集作为训练参考,故本发明实验所用数据集为本人采集,主要分为:可回收物、厨余垃圾、有害垃圾、其他垃圾四大类,其中可回收物包含:主要包括废纸、塑料、玻璃、金属和布料五大类;厨余垃圾包含:剩菜剩饭、骨头、菜根菜叶、果皮等食品类废物;有害垃圾包含:电池、灯管、灯泡、过期药品、过期化妆品等;其他垃圾包含:烟头、砖瓦陶瓷、一次性餐具等。共计垃圾种类32类,最终用于模型训练分类的图片大小为768x1024,共计19000张图像;每种测试样本类图片数量控制在600张左右。
在预训练阶段:编码器模型运用4层CNN卷积层,每层使用64个大小为3×3的卷积核。本发明采用的模型是Adam优化器,初始的学习率为10-3。每隔2000个分段为一代,每30代后学习效率减半。在训练时使用Nc=40类对模型进行了训练,并且采用Nct=20类中进行测试任务,针对于训练过程中最优秀的训练模型,在最后进行了Nct=5和Nct=10的分类测试任务来最终测试本发明模型是否具有先进性。与此同时还采用了其它两种小样本学习网络结构与引入注意力机制的高斯原型网络进行对比分析。
从表2中可以看出,本发明训练过程中最优秀的模型相比较于其他三种在分类的准确率上有显著的提升,在20-类别下分别取得了80.59%和93.34%的准确率,实验说明本发明方法在小样本垃圾分类中展现了良好的性能,表明了算法的有效性和可行性。
表2 20-way下模型分类准确率对比
Figure BDA0002600625880000081
表3为5-样本和10-样本的测试场景中,本发明模型与Prototypical network,Matching networks以及Gaussian Prototypical的分类准确率比较,可以明显得出,当训练集过少时,虽然学习到的特征也会相应的减少,但本发明方法相比较于其他三种在精确度方面仍然有所提升,最高分类准确率达到了87.87%和81.32%,充分验证了本发明方法的可行性。
表3:5-way和10-way下模型分类准确率对比
Figure BDA0002600625880000082
本发明模型与其他三种在1-样本和5-样本的分类准确比较如图2(a)、(b)所示:
本发明针对垃圾分类中分类标准复杂难以具体区分、实现效率低、耗费时间久等问题,在自主建立以常见的四大类几十种小类垃圾数据集基础上,提出一种改进度量学习的小样本学习方法来解决垃圾分类。该方法首先将输入图片转换为矢量信息,将计算好的协方差矩阵和嵌入的矢量信息作为输出内容,然后,将每个类的原型与其父类中的原型信息合并,并且将使用反向合并更新父类网络,最后,将两次原型网络在定义的数值下取均值,形成最终的分类网络模型。模型的分类准确率最高达到了93.2%左右。实验对比了未经改进的高斯原型网络、原型网络方法、匹配网络方法,通过对模型的分类准确率,训练消耗时间,模型的拟合效果以及学习效率的对比,可以得出,本发明的方法相对于前几种都有显著的提高,分类准确率最多提高20%左右,训练消耗时间有明显的区分。由此验证了本发明模型对于垃圾分类的合理性和有效性。
以上所述是本发明的优选实施方式而已,当然不能以此来限定本发明之权利范围,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和变动,这些改进和变动也视为本发明的保护范围。

Claims (2)

1.基于改进高斯网络的小样本学习垃圾分类方法,其特征在于,包括以下步骤:
步骤1:将收集到的数据集拆分为80%的支持集和20%的测试集,然后分别输入到高斯原型网络中通过编码器转换为矢量;
步骤2:计算编码器中的协方差矩阵以及父类集合的边缘权重;
步骤3:根据线性欧几里德距离计算嵌入空间中类别和方向相关的距离度量并且测量支持集与测试集之间的相似性,并且进行汇总;
步骤4:根据特定的损失函数计算方式得到损失,并且反向传播更新网络参数。
2.如权利要求1所述的基于改进高斯网络的小样本学习垃圾分类方法,其特征在于,所述步骤1中的编码器为能够将图像X转换为矢量
Figure FDA0002600625870000011
的函数:
Encoder(P):
Figure FDA0002600625870000012
其中的H是图像的高度,W是图像的宽度,C是图像的通道数,D是向量空间的嵌入维数。
CN202010722838.7A 2020-07-24 2020-07-24 基于改进高斯网络的小样本学习垃圾分类方法 Pending CN111860660A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010722838.7A CN111860660A (zh) 2020-07-24 2020-07-24 基于改进高斯网络的小样本学习垃圾分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010722838.7A CN111860660A (zh) 2020-07-24 2020-07-24 基于改进高斯网络的小样本学习垃圾分类方法

Publications (1)

Publication Number Publication Date
CN111860660A true CN111860660A (zh) 2020-10-30

Family

ID=72950199

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010722838.7A Pending CN111860660A (zh) 2020-07-24 2020-07-24 基于改进高斯网络的小样本学习垃圾分类方法

Country Status (1)

Country Link
CN (1) CN111860660A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112989932A (zh) * 2021-02-05 2021-06-18 北京林业大学 基于改进原型网络的少样本森林火灾烟雾识别方法及装置
CN115929495A (zh) * 2022-11-30 2023-04-07 昆明理工大学 基于马尔可夫变迁场和改进高斯原型网络的发动机气门故障诊断方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109961089A (zh) * 2019-02-26 2019-07-02 中山大学 基于度量学习和元学习的小样本和零样本图像分类方法
CN110689085A (zh) * 2019-09-30 2020-01-14 天津大学 基于深度跨连接网络及损失函数设计的垃圾分类方法
CN110766044A (zh) * 2019-09-11 2020-02-07 浙江大学 一种基于高斯过程先验指导的神经网络训练方法
US20200097771A1 (en) * 2018-09-25 2020-03-26 Nec Laboratories America, Inc. Deep group disentangled embedding and network weight generation for visual inspection
CN111243045A (zh) * 2020-01-10 2020-06-05 杭州电子科技大学 一种基于高斯混合模型先验变分自编码器的图像生成方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200097771A1 (en) * 2018-09-25 2020-03-26 Nec Laboratories America, Inc. Deep group disentangled embedding and network weight generation for visual inspection
CN109961089A (zh) * 2019-02-26 2019-07-02 中山大学 基于度量学习和元学习的小样本和零样本图像分类方法
CN110766044A (zh) * 2019-09-11 2020-02-07 浙江大学 一种基于高斯过程先验指导的神经网络训练方法
CN110689085A (zh) * 2019-09-30 2020-01-14 天津大学 基于深度跨连接网络及损失函数设计的垃圾分类方法
CN111243045A (zh) * 2020-01-10 2020-06-05 杭州电子科技大学 一种基于高斯混合模型先验变分自编码器的图像生成方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
STANISLAV FORT: "Gaussian Prototypical Networks for Few-Shot Learning on Omniglot", ARXIV, pages 1 - 14 *
杨晓杰: "基于度量学习的少样本图像分类研究", 中国优秀硕士学位论文全文数据库信息科技辑, no. 7 *
郑岩: "基于深度特征度量的小样本学习方法研究", 中国优秀硕士学位论文全文数据库信息科技辑, no. 4 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112989932A (zh) * 2021-02-05 2021-06-18 北京林业大学 基于改进原型网络的少样本森林火灾烟雾识别方法及装置
CN115929495A (zh) * 2022-11-30 2023-04-07 昆明理工大学 基于马尔可夫变迁场和改进高斯原型网络的发动机气门故障诊断方法
CN115929495B (zh) * 2022-11-30 2024-05-14 昆明理工大学 基于马尔可夫变迁场和改进高斯原型网络的发动机气门故障诊断方法

Similar Documents

Publication Publication Date Title
He et al. Gesture recognition based on an improved local sparse representation classification algorithm
CN108829818B (zh) 一种文本分类方法
CN109086658B (zh) 一种基于生成对抗网络的传感器数据生成方法与系统
CN109376242B (zh) 基于循环神经网络变体和卷积神经网络的文本分类方法
CN107832663B (zh) 一种基于量子理论的多模态情感分析方法
CN105760888B (zh) 一种基于属性聚类的邻域粗糙集集成学习方法
CN108132968A (zh) 网络文本与图像中关联语义基元的弱监督学习方法
CN111444342B (zh) 一种基于多重弱监督集成的短文本分类方法
CN111325264A (zh) 一种基于熵的多标签数据分类方法
CN111860660A (zh) 基于改进高斯网络的小样本学习垃圾分类方法
CN114255371A (zh) 一种基于组件监督网络的小样本图像分类方法
CN112883931A (zh) 基于长短期记忆网络的实时真假运动判断方法
CN113705238A (zh) 基于bert和方面特征定位模型的方面级情感分析方法及模型
CN117237733A (zh) 一种结合自监督和弱监督学习的乳腺癌全切片图像分类方法
Brinkmeyer et al. Few-shot forecasting of time-series with heterogeneous channels
CN112861626B (zh) 基于小样本学习的细粒度表情分类方法
EP4285281A1 (en) Annotation-efficient image anomaly detection
CN110378384B (zh) 一种结合特权信息和排序支持向量机的图像分类方法
CN116342906A (zh) 一种跨域小样本图像识别方法及系统
Jittawiriyanukoon Proposed algorithm for image classification using regression-based pre-processing and recognition models
Selvi et al. Topic categorization of Tamil news articles
CN112541081B (zh) 一种基于领域自适应的可迁移谣言检测方法
CN114241380A (zh) 一种基于类别标签和属性注释的多任务属性场景识别方法
Jeon et al. Neural Variational Dropout Processes.
Dash et al. Non-correlated character recognition using artificial neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination