CN113361635A - 基于表示预测的小样本类增量学习方法 - Google Patents

基于表示预测的小样本类增量学习方法 Download PDF

Info

Publication number
CN113361635A
CN113361635A CN202110738115.0A CN202110738115A CN113361635A CN 113361635 A CN113361635 A CN 113361635A CN 202110738115 A CN202110738115 A CN 202110738115A CN 113361635 A CN113361635 A CN 113361635A
Authority
CN
China
Prior art keywords
class
center
sample
base
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110738115.0A
Other languages
English (en)
Inventor
姚光乐
祝钧桃
王洪辉
周文龙
彭鹏
李军
刘瑛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Univeristy of Technology
Original Assignee
Chengdu Univeristy of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Univeristy of Technology filed Critical Chengdu Univeristy of Technology
Priority to CN202110738115.0A priority Critical patent/CN113361635A/zh
Publication of CN113361635A publication Critical patent/CN113361635A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了基于表示预测的小样本类增量学习方法,涉及图像识别分类技术领域,包括以下步骤:S1,通过特征提取器f加softmax分类器结构完成对基类数据Dbase的基本任务训练,通过基本任务训练得到基类数据的特征;S2,当基础任务训练完成后,去除softmax分类器,将特征提取器f输出的特征输入NCM分类器,并计算每类的类中心;S3,通过特征提取器f来获取新类DN中样本的输出,通过得到的样本输出与步骤S2中得到的所有基类的类中心比较相似性,根据相似程度来预测该样本的特征,将输出的相似值归一化后作为对应的类中心ub的权重;通过此种设计达到类别不断增加的情况下,对所有已学习的类别进行分类的目的。

Description

基于表示预测的小样本类增量学习方法
技术领域
本发明涉及机器学习技术领域,具体为基于表示预测的小样本类增量学习方法。
背景技术
随着信息技术的发展,数据急剧增长,对数据处理的需求也大大增减。在机器学习中,数据的识别分类主要是针对数据中特定特征进行提取,通过特定特征表征数据的信息,然后根据提取到的特定特征进行数据的识别分类。机器学习可以用于诸多领域,并且机器学习可以在各种复杂的条件下快速准确的提取物体的特征,具有广泛的应用前景,现有的机器学习分类方法中,可以对固定的数据进行识别分类,但是当出现新的少量样本时,系统是无法识别的。
对于类增量学习,以往的方法主要采用两种数据分类框架来构建。第一种是由一个特征提取器和一个softmax分类器组成,使用交叉熵损失训练。另一种由一个特征提取的嵌入网络和一个最近类均值(NCM)分类器组成,其中只有嵌入网络可学习。使用可训练的softmax分类器能更好的保证识别效果,同时使用的交叉熵损失相比嵌入网络的度量损失训练速度更快,而类均值(NCM)分类器在较长的任务序列中进行类增量学习具有优势。
所以本方案采用上述两种方案相结合的方式,同时兼顾识别效果与训练速度以及类增量学习中的优势。
发明内容
本发明的目的在于克服现有技术的不足,提供基于表示预测的小样本类增量学习方法。
本发明的目的是通过以下技术方案来实现的:
基于表示预测的小样本类增量学习方法,包括以下步骤:
S1,通过特征提取器f加softmax分类器结构完成对基类数据Dbase的训练,通过训练得到基类数据Dbase的特征,执行步骤S2;
S2,当训练完成后,去除softmax分类器,将特征提取器f输出的特征输入NCM分类器,并计算基类数据Dbase中每类的类中心,执行步骤S3;
S3,通过特征提取器f来获取新类DN中样本的输出,通过得到的样本输出与步骤S2中得到的类中心比较相似性,根据相似程度来预测该样本的特征,将输出的相似度归一化后作为对应的类中心ub的权重,执行步骤S4;
S4,计算新类DN中类C的所有样本的预测特征,并取平均值作为类C的基于相似的预测中心,再计算类C中所有样本直接通过特征提取器f提取的特征的平均值,最后得到类C的类中心,并将类C的类中心加入到步骤S2中得到的类中心中,完成对已学习的类C的分类。
进一步的,所述步骤S2中,类中心计算公式为:
Figure BDA0003142267000000021
其中,ub表示基类数据Dbase中类b的类中心,nb表示类b的样本数,f(xi)表示提取的样本的特征。
进一步的,所述步骤S3中,保持特征提取器f的参数在计算过程中始终固定。
进一步的,所述步骤S3中,样本的特征计算公式为:
Figure BDA0003142267000000022
其中
Figure BDA0003142267000000023
表示新类DN中的样本,
Figure BDA0003142267000000024
表示样本
Figure BDA0003142267000000025
在特征提取器f中的输出,c表示DN中的某一类别,i表示类别c的第i个样本,
Figure BDA0003142267000000026
的输出结果为
Figure BDA0003142267000000027
与类中心ub的相似度,Nb表示基类的类别数。
进一步的,所述步骤S4中,基于类c所有样本的预测特征,并取平均值作为类c的基于相似的预测中心的计算公式为:
Figure BDA0003142267000000028
其中,
Figure BDA0003142267000000029
表示类c的基于相似的预测中心,n表示每一类的样本数。
进一步的,所述步骤S4中,类c所有样本直接通过特征提取器f提取的特征的平均值计算的计算C类的类中心的计算公式为:
Figure BDA00031422670000000210
其中,
Figure BDA00031422670000000211
表示类c所有样本直接通过特征提取器f提取的特征的平均值得到的C类的类中心。
进一步的,所述步骤S4中,类C的类中心计算公式为:
Figure BDA0003142267000000031
其中,uc表示类C的类中心。
进一步的,还包括类增量学习系统,所述类增量学习系统包括特征提取器f、softmax分类器以及NCM分类器,所述类增量学习系统用于实现权利要求1-7中任意一项所述的基于表示预测的小样本类增量学习方法。
本发明的有益效果是:
1、本发明的一个创新点在于,通过将特征提取器、softmax分类器以及最近类均值(NCM)分类器进行组合使用,既保留了单独使用特征提取器搭配softmax分类器对图像识别在准确率和训练速度上的优点,同时保留了单独使用特征提取器搭配最近类均值(NCM)分类器时在在较长的任务序列中进行类增量学习时的优势。
2、在上述基础上,通过基础任务训练得到性能较好的特征提取器,同时在小样本类增量学习时,计算小样本的预测特征,并取平均值作为类c的基于相似的预测中心,再通过计算f提取的特征的平均值类中心,得到小样本类中心,完成对新出现的小样本的学习识别分类。
附图说明
图1为本发明的小样本类增量学习方法的流程图;
图2为本发明的小样本类增量学习方法的框架图。
具体实施方式
下面结合本发明的附图1~2,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施。
在本发明的描述中,需要理解的是,术语“逆时针”、“顺时针”“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
基于表示预测的小样本类增量学习方法,包括以下步骤:
S1,通过特征提取器f加softmax分类器结构完成对基类数据Dbase的训练,通过训练得到基类数据Dbase的特征,执行步骤S2;
S2,当训练完成后,去除softmax分类器,将特征提取器f输出的特征输入NCM分类器,并计算基类数据Dbase中每类的类中心,执行步骤S3;
S3,通过特征提取器f来获取新类DN中样本的输出,通过得到的样本输出与步骤S2中得到的类中心比较相似性,根据相似程度来预测该样本的特征,将输出的相似度归一化后作为对应的类中心ub的权重,执行步骤S4;
S4,计算新类DN中类C的所有样本的预测特征,并取平均值作为类C的基于相似的预测中心,再计算类C中所有样本直接通过特征提取器f提取的特征的平均值,最后得到类C的类中心,并将类C的类中心加入到步骤S2中得到的类中心中,完成对已学习的类C的分类。
本方案的工作原理简述:
在本发明中,基础任务训练:使用基类数据Dbase训练特征提取器f,训练后计算每一个基类的类中心,ub表示第b个基类的中心。同时保持f的参数固定(使得下一阶段提取的特征在同一特征空间),在新任务训练时,由于新任务样本数量过少,直接训练容易发生过拟合,因此,我们先利用f来获取DN中样本的输出,这时获取的输出不直接作为该样本的特征,而是用来与上一阶段的所有基类的类中心比较相似性,根据相似程度来预测该样本的特征:
Figure BDA0003142267000000041
其中
Figure BDA0003142267000000042
表示DN中的样本,
Figure BDA0003142267000000043
表示样本
Figure BDA0003142267000000044
在f中的输出,c表示DN中的某一类别,i表示类别c的第i个样本,S(·,·)表示采用一个相似度量比较
Figure BDA0003142267000000045
与类中心ub的相似度,将输出的相似值归一化后作为对应的类中心ub的权重。计算类c所有样本的预测特征,并取平均作为类c的基于相似的预测中心:
Figure BDA0003142267000000046
n表示每一类的样本数。再计算类c所有样本直接通过f提取的特征的平均:
Figure BDA0003142267000000051
最后得到类c的中心
Figure BDA0003142267000000052
并加入到原本的类中心中。
MiniImageNet:MiniImageNet数据集是Image Net-1k数据集的子集。共100个类,每类包含500张训练图像和100张测试图像,图像为大小为84×84的RGB格式。
CIFAR-100:CIFAR100数据集包含60,000张RGB图像,100个类,每个类有500个训练图像和100个测试图像,每幅图像的大小为32×32。
对于CIFAR100和Mini Image Net数据集,分别选择60个类和40个类作为基础类Dbase和新类DN,并采用5way,5shot设置,总共有9个学习过程(即1个基础学习,8个类增量学习)
对于所有数据集,每个类增量学习的训练集都是通过从原始数据集中随机抽取5个类,每个类随机抽取5个训练样本来构造的,测试集不变。
使用Resnet-18模型作为特征提取器f。基类训练时的Batch Size大小为128,初始学习率为0.1。在第30个epoch后(包括30),每10个epoch后将学习率手动降低10倍,并在第50个epoch完成后停止训练。
进一步的,所述步骤S2中,类中心计算公式为:
Figure BDA0003142267000000053
其中,ub表示基类数据Dbase中类b的类中心,nb表示类b的样本数,f(xi)表示提取的样本的特征。
进一步的,所述步骤S3中,保持特征提取器f的参数在计算过程中始终固定。
进一步的,所述步骤S3中,样本的特征计算公式为:
Figure BDA0003142267000000054
其中
Figure BDA0003142267000000055
表示新类DN中的样本,
Figure BDA0003142267000000056
表示样本
Figure BDA0003142267000000057
在特征提取器f中的输出,c表示DN中的某一类别,i表示类别c的第i个样本,
Figure BDA0003142267000000058
的输出结果为
Figure BDA0003142267000000059
与类中心ub的相似度,Nb表示基类的类别数。
进一步的,所述步骤S4中,基于类c所有样本的预测特征,并取平均值作为类c的基于相似的预测中心的计算公式为:
Figure BDA0003142267000000061
其中,
Figure BDA0003142267000000062
表示类c的基于相似的预测中心,n表示每一类的样本数。
进一步的,所述步骤S4中,类c所有样本直接通过特征提取器f提取的特征的平均值计算的计算C类的类中心的计算公式为:
Figure BDA0003142267000000063
其中,
Figure BDA0003142267000000064
表示类c所有样本直接通过特征提取器f提取的特征的平均值得到的C类的类中心。
进一步的,所述步骤S4中,类C的类中心计算公式为:
Figure BDA0003142267000000065
其中,uc表示类C的类中心。
进一步的,还包括类增量学习系统,所述类增量学习系统包括特征提取器f、softmax分类器以及NCM分类器,所述类增量学习系统用于实现权利要求1-7中任意一项所述的基于表示预测的小样本类增量学习方法。
以上所述仅是本发明的优选实施方式,应当理解所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (8)

1.基于表示预测的小样本类增量学习方法,其特征在于,包括以下步骤:
S1,通过特征提取器f加softmax分类器结构完成对基类数据Dbase的训练,通过训练得到基类数据Dbase的特征,执行步骤S2;
S2,当训练完成后,去除softmax分类器,将特征提取器f输出的特征输入NCM分类器,并计算基类数据Dbase中每类的类中心,执行步骤S3;
S3,通过特征提取器f来获取新类DN中样本的输出,通过得到的样本输出与步骤S2中得到的类中心比较相似性,根据相似程度来预测该样本的特征,将输出的相似度归一化后作为对应的类中心ub的权重,执行步骤S4;
S4,计算新类DN中类C的所有样本的预测特征,并取平均值作为类C的基于相似的预测中心,再计算类C中所有样本直接通过特征提取器f提取的特征的平均值,最后得到类C的类中心,并将类C的类中心加入到步骤S2中得到的类中心中,完成对已学习的类C的分类。
2.根据权利要求1所述的基于表示预测的小样本类增量学习方法,其特征在于,所述步骤S2中,类中心计算公式为:
Figure FDA0003142266990000011
其中,ub表示基类数据Dbase中类b的类中心,nb表示类b的样本数,f(xi)表示提取的样本的特征。
3.根据权利要求1所述的基于表示预测的小样本类增量学习方法,其特征在于,所述步骤S3中,保持特征提取器f的参数在计算过程中始终固定。
4.根据权利要求1所述的基于表示预测的小样本类增量学习方法,其特征在于,所述步骤S3中,样本的特征计算公式为:
Figure FDA0003142266990000012
其中
Figure FDA0003142266990000013
表示新类DN中的样本,
Figure FDA0003142266990000014
表示样本
Figure FDA0003142266990000015
在特征提取器f中的输出,c表示DN中的某一类别,i表示类别c的第i个样本,
Figure FDA0003142266990000016
的输出结果为
Figure FDA0003142266990000017
与类中心ub的相似度,Nb表示基类的类别数。
5.根据权利要求1所述的基于表示预测的小样本类增量学习方法,其特征在于,所述步骤S4中,基于类c所有样本的预测特征,并取平均值作为类c的基于相似的预测中心的计算公式为:
Figure FDA0003142266990000021
其中,
Figure FDA0003142266990000022
表示类c的基于相似的预测中心,n表示每一类的样本数。
6.根据权利要求1所述的基于表示预测的小样本类增量学习方法,其特征在于,所述步骤S4中,类c所有样本直接通过特征提取器f提取的特征的平均值计算的计算C类的类中心的计算公式为:
Figure FDA0003142266990000023
其中,
Figure FDA0003142266990000024
表示类c所有样本直接通过特征提取器f提取的特征的平均值得到的C类的类中心。
7.根据权利要求1所述的基于表示预测的小样本类增量学习方法,其特征在于,所述步骤S4中,类C的类中心计算公式为:
Figure FDA0003142266990000025
其中,uc表示类C的类中心。
8.根据权利要求1所述的基于表示预测的小样本类增量学习方法,其特征在于,还包括类增量学习系统,所述类增量学习系统包括特征提取器f、softmax分类器以及NCM分类器,所述类增量学习系统用于实现权利要求1-7中任意一项所述的基于表示预测的小样本类增量学习方法。
CN202110738115.0A 2021-06-30 2021-06-30 基于表示预测的小样本类增量学习方法 Pending CN113361635A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110738115.0A CN113361635A (zh) 2021-06-30 2021-06-30 基于表示预测的小样本类增量学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110738115.0A CN113361635A (zh) 2021-06-30 2021-06-30 基于表示预测的小样本类增量学习方法

Publications (1)

Publication Number Publication Date
CN113361635A true CN113361635A (zh) 2021-09-07

Family

ID=77537485

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110738115.0A Pending CN113361635A (zh) 2021-06-30 2021-06-30 基于表示预测的小样本类增量学习方法

Country Status (1)

Country Link
CN (1) CN113361635A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116306875A (zh) * 2023-05-18 2023-06-23 成都理工大学 基于空间预学习与拟合的排水管网样本增量学习方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116306875A (zh) * 2023-05-18 2023-06-23 成都理工大学 基于空间预学习与拟合的排水管网样本增量学习方法

Similar Documents

Publication Publication Date Title
CN109522956B (zh) 一种低秩判别特征子空间学习方法
CN111340123A (zh) 一种基于深度卷积神经网络的图像分数标签预测方法
CN109325507B (zh) 结合超像素显著性特征与hog特征图像分类方法和系统
CN110082821B (zh) 一种无标签框微地震信号检测方法及装置
CN106372624B (zh) 人脸识别方法及系统
CN110322445B (zh) 基于最大化预测和标签间相关性损失函数的语义分割方法
CN101004791A (zh) 一种基于二维偏最小二乘法的面部表情识别方法
CN112784929B (zh) 一种基于双元组扩充的小样本图像分类方法及装置
JP6897749B2 (ja) 学習方法、学習システム、および学習プログラム
CN109993221B (zh) 一种图像分类方法及装置
CN111126482A (zh) 一种基于多分类器级联模型的遥感影像自动分类方法
CN108520215B (zh) 基于多尺度联合特征编码器的单样本人脸识别方法
CN111401374A (zh) 基于多任务的模型训练方法、字符识别方法及装置
CN112116950B (zh) 基于深度度量学习的蛋白质折叠识别方法
CN112883931A (zh) 基于长短期记忆网络的实时真假运动判断方法
CN110222755B (zh) 基于特征融合的深度学习场景识别方法
CN115272225A (zh) 一种基于对抗学习网络的带钢表面缺陷检测方法及系统
CN112395901A (zh) 一种改进型复杂环境下人脸检测定位识别方法
CN113361635A (zh) 基于表示预测的小样本类增量学习方法
CN111127407B (zh) 一种基于傅里叶变换的风格迁移伪造图像检测装置及方法
CN110570450B (zh) 一种基于级联的上下文感知框架的目标跟踪方法
CN111126173A (zh) 一种高精度人脸检测方法
CN112257787B (zh) 基于生成式双重条件对抗网络结构的图像半监督分类方法
CN113780334A (zh) 基于两阶段混合特征选择的高维数据分类方法
CN112084867A (zh) 一种基于人体骨架点距离的行人定位跟踪方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210907