CN114782752A - 基于自训练的小样本图像集成分类方法及装置 - Google Patents

基于自训练的小样本图像集成分类方法及装置 Download PDF

Info

Publication number
CN114782752A
CN114782752A CN202210487571.7A CN202210487571A CN114782752A CN 114782752 A CN114782752 A CN 114782752A CN 202210487571 A CN202210487571 A CN 202210487571A CN 114782752 A CN114782752 A CN 114782752A
Authority
CN
China
Prior art keywords
classifier
training
self
support set
base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210487571.7A
Other languages
English (en)
Other versions
CN114782752B (zh
Inventor
李晓旭
郭晓伟
刘俊
金志宇
汤卓和
曾俊瑀
李睿凡
马占宇
陶剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lanzhou University of Technology
Original Assignee
Lanzhou University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lanzhou University of Technology filed Critical Lanzhou University of Technology
Priority to CN202210487571.7A priority Critical patent/CN114782752B/zh
Publication of CN114782752A publication Critical patent/CN114782752A/zh
Application granted granted Critical
Publication of CN114782752B publication Critical patent/CN114782752B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Abstract

本发明公开了一种基于自训练的小样本图像集成分类方法及装置,通过迁移基类数据的卷积特征提取,使用查询样本进行基分类器的自训练,不断地将伪标签集加到支持集扩充支持集,并运用到下一次基分类器自训练中,提高了基分类器自训练结果的可靠性。自训练过程中产生的基分类器,不断通过模型平均得到集成分类器,经过多次迭代自训练和分类器集成过程,得到最终的集成分类器,通过构建损失函数,使得基分类器在查询样本上有确定的、不同的预测,实现了基分类器的不同,解决现有小样本分类方法中,基于特征迁移和查询样本自训练的小样本图像集成分类中基学习器的多样性问题,对于提升图像的分类效果非常显著,具有很高的使用价值。

Description

基于自训练的小样本图像集成分类方法及装置
技术领域
本发明涉及图像分类技术领域,尤其涉及一种基于自训练的小样本图像集成分类方法及装置。
背景技术
近年来,随着计算机技术的发展,人们浏览的信息日益丰富,每天都有大量图片被上传到网络,由于数量巨大,人工已经无法对此进行分类。在很多大样本图像分类任务上,机器的识别性能已经超越人类。然而,当样本量比较少时,机器的识别水平仍与人类存在较大差距。因此,研究高效可靠的图片分类算法有很迫切的社会需求。
小样本分类(Few-shot Classification)属于小样本学习(Few-shot Learning)范畴,往往包含类别空间不相交的两类数据,即基类数据和新类数据。小样本分类旨在利用基类数据学习的知识和新类数据的少量标记样本(支持样本)来学习分类规则,准确预测新类任务中未标记样本(查询样本)的类别。
小样本图像分类是当前计算机视觉、人工智能领域中亟待解决的研究问题。现有的、较为成功的大样本图像分类方法严重依赖样本的数量,而现实世界中事物的样本量是服从长尾分布的,即大量事物的样本量都是严重不足的,例如在军事、医疗、工业,天文等领域,样本采集需要消耗大量的人力、物力、时间和经济成本,很难采集大规模的图像样本。因此,开展小样本图像分类的研究对图像分类技术的广泛应用具有重要价值。另外,小样本图像分类的研究目标就是通过少量图像样本的学习,使得机器获得与人类水平相当的识别能力。因此,开展小样本图像分类的研究对响应我国的人工智能发展规划以及突破人工智能的理论瓶颈具有重要意义。
目前小样本图像分类的研究中,特征迁移旨在通过引入源数据特征来帮助完成目标数据特征域的机器学习任务。一个机器学习任务中,可能由于目标特征域缺少足够的标签而导致学习的效果很差。通过挖掘源数据与目标数据的交叉特征结构,或者借助中间数据进行“桥接”,可以帮助我们在目标数据特征上进行的机器学习任务实现不同特征空间之间的知识迁移。例如,我们在进行图片数据分类时缺少足够带有标记的训练数据,就可以借助已经标注好的文本数据,以及具有交叉特征的中间数据来协助提高在图片数据上的学习效果。然而,基于特征迁移的基于自训练的小样本图像集成分类中存在基学习器的多样性问题。因此,本发明主要通过迁移基类数据的卷积特征提取,并基于查询样本进行自训练,通过构建损失函数,使得基分类器在查询样本上有确定的、不同的预测,实现基分类器的不同。
发明内容
本发明针对上述技术问题,提出一种基于自训练的小样本图像集成分类方法及装置,使用查询样本进行基分类器的自训练,不断地将伪标签集加到支持集扩充支持集。自训练过程中产生的基分类器,不断通过模型平均得到集成分类器,经过多次迭代自训练和分类器集成过程,得到最终的集成分类器,旨在解决现有小样本分类方法中,基于特征迁移的基于自训练的小样本图像集成分类中基学习器的多样性问题。
为了实现上述目的,本发明提供如下技术方案:
一方面,本发明提供了一种基于自训练的小样本图像集成分类方法,包括以下步骤:
S1、对数据进行预处理,其中数据包括训练集和测试集;
S2、构建基于自训练的小样本图像集成分类的模型:使用Baseline++ 网络结构构建基分类器,使用查询样本进行基分类器的自训练,不断地将伪标签集加到支持集扩充支持集,自训练过程中产生的基分类器,不断通过模型平均得到集成分类器,经过多次迭代自训练和分类器集成过程,得到最终的集成分类器;
S3、使用测试集数据对基于自训练的小样本图像集成分类的模型进行训练,优化模型参数;
S4、通过新类数据上所有任务中查询集标签的预测值和真实值,评估模型的最终性能。
进一步地,步骤S1的预处理方法为:
S11,将数据
Figure BDA0003629803490000031
分为训练集
Figure BDA0003629803490000032
Figure BDA0003629803490000033
和测试集
Figure BDA0003629803490000034
两部分,且这两部分的类别空间互斥,将Dtrain作为基类数据用于训练模型,Dtest作为新类数据用于测评模型性能;
S12,对于C-way K-shot分类任务,从Dtrain中随机选出C个类别,每个类别中随机选出M个样本,其中K个样本作为支持样本Si,其余M-K 个样本作为查询样本Qi,Si和Qi构成一个任务Ti;同样地,对于Dtest有任务
Figure BDA0003629803490000035
进一步地,步骤S2中,使用Baseline++网络结构,对支持集进行训练得到m个基分类器,在此阶段,建立特征提取模块、关系网络模块和基分类器模块;其中,特征提取模块基于卷积特征提取支持集的特征,关系网络模块基于特征提取模块输出的支持集特征和表示每个类的学习权重向量之间的余弦距离进行预测,上述两个模块在此阶段共享一个,基分类器模块由前两个模块参与构建;对于每次任务抽取三个数据集:有标签的支持集
Figure BDA0003629803490000036
无标签的支持集
Figure BDA0003629803490000037
和查询集
Figure BDA0003629803490000038
步骤包括:
S21,在支持集上,训练得到基分类器0,同时将基分类器0赋给集成分类器0;
S22,使用基分类器0对查询集样本进行预测,得到预测较为准确的样本伪标签预测集1,将其加入支持集进行训练得到基分类器1;
S23,将集成分类器0和基分类器1通过模型平均进行集成,得到集成分类器1;
S24,上述过程迭代多次,得到最终的集成分类器。
进一步地,每次更新得到当前层次的分类器,集成分类器和伪标签预测集,其中,分类器由有标签的支持集S和无标签的支持集U更新,具体公式为:
Figure BDA0003629803490000041
该公式为最大似然估计公式的变形,其中,
Figure BDA0003629803490000042
为分类器,当k=0时,
Figure BDA0003629803490000043
由支持集直接训练得到,
Figure BDA0003629803490000044
为特征提取模块,fψ为关系网络模块,C为任务个数,Ac为当前无标签支持集到所有支持集之间的距离总和求平均。
进一步地,特征提取模块采用如下公式:
Figure BDA0003629803490000045
该公式为最大似然估计公式的变形,特征提取时,在基分类器下对每个查询样本进行特征提取,它们的和进行最大似然估计处理,得到的是特征提取模块需要的结果。
进一步地,关系网络模块采用如下公式:
Figure BDA0003629803490000046
该公式为最大似然估计公式的变形,fψ(·)为关系网络函数,用于获取两个参数之间的距离,在
Figure BDA0003629803490000047
中,第一个参数
Figure BDA0003629803490000048
为提取的有标签支持集特征,第二个参数表示当前无标签支持集到所有支持集之间的距离总和求平均,将所有样本的数据进行最大似然估计处理,得到的是关系网络模块需要的结果。
进一步地,步骤S3具体包括:
S31,对于每一个任务再次抽取三个数据集:有标签的支持集
Figure BDA0003629803490000049
无标签的支持集
Figure BDA00036298034900000410
和查询集
Figure BDA00036298034900000411
S32,通过有标签支持集S和无标签支持集U进一步微调训练过的分类器,更新公式如下:
Figure BDA0003629803490000051
其中,
Figure BDA0003629803490000052
表示整个支持集,即包括有标签支持集和无标签支持集两部分,
Figure BDA0003629803490000053
为度量在支持集下当前分类器和上一个集成分类器两个参数的概率分布之间的差异;
S33,集成分类器参数更新如下:
γk=ω1θk2γk-1 (5)
其中,γk-1为集成分类器k-1的参数,θk为基分类器k的参数,ω1和ω2为集成分类器k-1和基分类器k的权重,当k=0时,γ0=θ0
S34,查询集的标签标签更新如下:
Figure BDA0003629803490000054
其中,
Figure BDA0003629803490000055
为查询集的标签,
Figure BDA0003629803490000056
为第m个集成分类器的参数,
Figure BDA0003629803490000057
为提取特征,xj为查询样数据的数据,其中xj属于有理数集。
进一步地,步骤S4中,通过新类数据上所有任务中查询集标签的预测值和真实值,评估集成分类方法的最终性能。
另一方面,本发明还提供了一种基于自训练的小样本图像集成分类装置,用以实现上述的任一项方法,包括以下模块:
预训练模块:使用基类数据上预训练得到特征提取模块;
自训练模块:用于构建基分类器,并使用查询样本进行基分类器的自训练,不断地将伪标签集加到支持集扩充支持集;
集成分类模块:用于自训练过程中产生的基分类器,不断通过模型平均得到集成分类器。
与现有技术相比,本发明的有益效果为:
本发明建立了一种基于自训练的小样本图像集成分类方法及装置,通过迁移基类数据的卷积特征提取,使用查询样本进行基分类器的自训练,不断地将伪标签集加到支持集扩充支持集,并运用到下一次基分类器自训练中,提高了基分类器自训练结果的可靠性。自训练过程中产生的基分类器,不断通过模型平均得到集成分类器,经过多次迭代自训练和分类器集成过程,得到最终的集成分类器,通过构建损失函数,使得基分类器在查询样本上有确定的、不同的预测,实现了基分类器的不同,解决现有小样本分类方法中,基于特征迁移和查询样本自训练的小样本图像集成分类中基学习器的多样性问题,对于提升图像的分类效果非常显著,具有很高的使用价值。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于自训练的小样本图像集成分类方法的流程图。
图2为本发明实施例提供的基于查询样本自训练和模型平均的基于自训练的小样本图像集成分类的模型结构图。
图3为本发明实施例提供的Baseline++网络结构图。
图4为本发明实施例提供的基于自训练的小样本图像集成分类装置功能模块示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据本文公开的一个方面,本发明拟使用查询样本进行基分类器的自训练,不断地将伪标签集加到支持集扩充支持集,自训练过程中产生基分类器,不断通过模型平均得到集成分类器。如图1所示,本发明提供了一种基于自训练的小样本图像集成分类方法,包括以下步骤:
S1、对数据进行预处理,其中数据包括训练集和测试集;
具体地,步骤S1的预处理方法为:
S11,将数据
Figure BDA0003629803490000071
分为训练集
Figure BDA0003629803490000072
Figure BDA0003629803490000073
和测试集
Figure BDA0003629803490000074
两部分,且这两部分的类别空间互斥,将Dtrain作为基类数据用于训练模型,Dtest作为新类数据用于测评模型性能;
S12,对于C-way K-shot分类任务,从Dtrain中随机选出C个类别,每个类别中随机选出M个样本,其中K个样本作为支持样本Si,其余M-K 个样本作为查询样本Qi,Si和Qi构成一个任务Ti;同样地,对于Dtest有任务
Figure BDA0003629803490000075
S2、使用Baseline++网络结构构建基分类器,引入基于查询样本自训练进行联合训练的方法,构建基于查询样本自训练和模型平均的基于自训练的小样本图像集成分类的模型。如图2所示。
具体地,基分类器主要采用Baseline++网络结构进行构建,也可以使用其他的网络结构进行构建,例如采用baseline网络结构来构建基分类器。如图3所示,其中关于特征提取网络模块,使用基类数据上预训练得到的特征提取模块;对于新类数据上的分类任务,抽取三个数据集:有标签的支持集
Figure BDA0003629803490000076
无标签的支持集
Figure BDA0003629803490000077
和查询集
Figure BDA0003629803490000078
Figure BDA0003629803490000079
如图2所示优化基分类器和集成分类器。具体地,步骤S2中,使用 Baseline++网络结构,对支持集进行训练得到m个基分类器,在此阶段,建立特征提取模块、关系网络模块和基分类器模块;其中,特征提取模块基于卷积特征提取支持集的特征,关系网络模块基于特征提取模块输出的支持集特征和表示每个类的学习权重向量之间的余弦距离进行预测,上述两个模块在此阶段共享一个,基分类器模块由前两个模块参与构建;对于每次任务抽取三个数据集:有标签的支持集
Figure BDA00036298034900000710
无标签的支持集
Figure BDA00036298034900000711
和查询集
Figure BDA00036298034900000712
步骤具体包括:
S21,在支持集上,训练得到基分类器0,同时将基分类器0赋给集成分类器0;
S22,使用基分类器0对查询集样本进行预测,得到预测较为准确的样本伪标签预测集1,将其加入支持集进行训练得到基分类器1;
S23,将集成分类器0和基分类器1通过模型平均进行集成,得到集成分类器1;
S24,上述过程迭代多次,得到最终的集成分类器。
S25,该模型结构类似于迭代模型,每次更新得到当前层次的分类器,集成分类器和伪标签预测集,其中,分类器由有标签的支持集S和无标签的支持集U更新,具体公式为:
Figure BDA0003629803490000081
该公式为最大似然估计公式的变形,其中,
Figure BDA0003629803490000082
为分类器,当k=0时,
Figure BDA0003629803490000083
由支持集直接训练得到,
Figure BDA0003629803490000084
为特征提取模块,fψ为关系网络模块,C为任务个数,Ac为当前无标签支持集到所有支持集之间的距离总和求平均。
S26,特征提取模块采用如下公式:
Figure BDA0003629803490000085
该公式为最大似然估计公式的变形,特征提取时,在基分类器下对每个查询样本进行特征提取,它们的和进行最大似然估计处理,得到的是特征提取模块需要的结果。
S27,关系网络模块采用如下公式:
Figure BDA0003629803490000086
该公式为最大似然估计公式的变形,fψ(·)为关系网络函数,用于获取两个参数之间的距离,在
Figure BDA0003629803490000087
中,第一个参数
Figure BDA0003629803490000088
为提取的有标签支持集特征,第二个参数表示当前无标签支持集到所有支持集之间的距离总和求平均,将所有样本的数据进行最大似然估计处理,得到的是关系网络模块需要的结果。
S28,将S26的公式(2)和S27的公式(3),经过最大似然估计处理,得到的结果就是S25的公式(1)。
S3、使用测试集数据对基于自训练的小样本图像集成分类的模型进行训练,优化模型参数;
具体地,使用的数据是测试集Dtest。其中,步骤S3具体包括:
S31,对于每一个任务再次抽取三个数据集:有标签的支持集
Figure BDA0003629803490000091
无标签的支持集
Figure BDA0003629803490000092
和查询集
Figure BDA0003629803490000093
S32,通过有标签支持集S和无标签支持集U进一步微调训练过的分类器,更新公式如下:
Figure BDA0003629803490000094
该公式基于S25中的公式(1),通过S3中的S和U进一步微调训练过的分类器,在此基础上进一步考虑各分布之间的交叉熵,即KL散度这一因素,得到此处公式(4)。
其中,
Figure BDA0003629803490000095
表示整个支持集,即包括有标签支持集和无标签支持集两部分,
Figure BDA0003629803490000096
为度量在支持集下当前分类器和上一个集成分类器两个参数的概率分布之间的差异;
S33,集成分类器参数更新如下:
γk=ω1θk2γk-1 (5)
其中,γk-1为集成分类器k-1的参数,θk为基分类器k的参数,ω1和ω2为集成分类器k-1和基分类器k的权重,当k=0时,γ0=θ0
S34,查询集的标签更新如下:
Figure BDA0003629803490000097
其中,
Figure BDA0003629803490000101
为查询集的标签,
Figure BDA0003629803490000102
为第m个集成分类器的参数,
Figure BDA0003629803490000103
为提取特征,xj为查询样数据的数据,其中xj属于有理数集。
S4、通过新类数据上所有任务中查询集标签的预测值和真实值,评估模型的最终性能。
另一方面,本发明还提供了一种基于自训练的小样本图像集成分类装置,用以实现上述的任一项方法,如图4所示,包括以下模块:
预训练模块:使用基类数据上预训练得到特征提取模块;
自训练模块:用于构建基分类器,并使用查询样本进行基分类器的自训练,不断地将伪标签集加到支持集扩充支持集;
集成分类模块:用于自训练过程中产生的基分类器,不断通过模型平均得到集成分类器。
经过自训练模块多次迭代自训练和集成分类模块分类器集成过程,得到最终的集成分类器。
从上述技术方案可以了解到,本发明的基于查询样本自训练和模型平均的基于自训练的小样本图像集成分类装置具有以下有益效果:
融合了查询样本自训练和模型平均的小样本集成分类装置,拟迁移基类数据的卷积特征提取,并基于查询样本自训练,通过构建损失函数,使得基分类器在查询样本上有确定的、不同的预测,实现了基分类器的不同,解决了现有的小样本分类方法中,基于特征迁移和查询样本自训练的小样本图像集成分类中,基学习器的多样性问题,对于提升图像的分类效果非常显著,具有很高的使用价值。
以上结合附图对所提出的基于自训练的小样本图像集成分类方法及模型的具体实施方式进行了阐述。通过以上实施方式的描述,所属领域的技术人员可以清楚的了解该方法以及装置的实施。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其他设备固有相关。各种通用系统也可以与基于在此的启示一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本文公开的也不针对任何特定的编程语言。但是应当了解,可以利用各种编程语言实现在此描述的本文公开的内容,并且上面对特定语言所做的描述是为了披露本文公开的最佳实施方式。
类似的,应当理解,为了使本文尽量精简并且帮助理解各个公开方面中的一个或多个,在上面对本文公开的示例性实施例的描述中,本文公开的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下示意图:即要求所保护的本文公开的要求比在每个权利要求中所明确记载的特征具有更多的特征。更确切地说,如下面的权利要求书所反映的那样,公开方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本公开的单独实施例子。
以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特殊进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

Claims (9)

1.一种基于自训练的小样本图像集成分类方法,其特征在于,包括以下步骤:
S1、对数据进行预处理,其中数据包括训练集和测试集;
S2、构建基于自训练的小样本图像集成分类的模型:使用Baseline++网络结构构建基分类器,使用查询样本进行基分类器的自训练,不断地将伪标签集加到支持集扩充支持集,自训练过程中产生的基分类器,不断通过模型平均得到集成分类器,经过多次迭代自训练和分类器集成过程,得到最终的集成分类器;
S3、使用测试集数据对基于自训练的小样本图像集成分类的模型进行训练,优化模型参数;
S4、通过新类数据上所有任务中查询集标签的预测值和真实值,评估模型的最终性能。
2.根据权利要求1所述的基于自训练的小样本图像集成分类方法,其特征在于,步骤S1的预处理方法为:
S11,将数据
Figure FDA0003629803480000011
分为训练集
Figure FDA0003629803480000012
Figure FDA0003629803480000013
和测试集
Figure FDA0003629803480000014
两部分,且这两部分的类别空间互斥,将Dtrain作为基类数据用于训练模型,Dtest作为新类数据用于测评模型性能;
S12,对于C-way K-shot分类任务,从Dtrain中随机选出C个类别,每个类别中随机选出M个样本,其中K个样本作为支持样本Si,其余M-K个样本作为查询样本Qi,Si和Qi构成一个任务Ti;同样地,对于Dtest有任务
Figure FDA0003629803480000015
3.根据权利要求1所述的基于自训练的小样本图像集成分类方法,其特征在于,步骤S2中,使用Baseline++网络结构,对支持集进行训练得到m个基分类器,在此阶段,建立特征提取模块、关系网络模块和基分类器模块;其中,特征提取模块基于卷积特征提取支持集的特征,关系网络模块基于特征提取模块输出的支持集特征和表示每个类的学习权重向量之间的余弦距离进行预测,上述两个模块在此阶段共享一个,基分类器模块由前两个模块参与构建;对于每次任务抽取三个数据集:有标签的支持集
Figure FDA0003629803480000021
无标签的支持集
Figure FDA0003629803480000022
和查询集
Figure FDA0003629803480000023
步骤包括:
S21,在支持集上,训练得到基分类器0,同时将基分类器0赋给集成分类器0;
S22,使用基分类器0对查询集样本进行预测,得到预测较为准确的样本伪标签预测集1,将其加入支持集进行训练得到基分类器1;
S23,将集成分类器0和基分类器1通过模型平均进行集成,得到集成分类器1;
S24,上述过程迭代多次,得到最终的集成分类器。
4.根据权利要求3所述的基于自训练的小样本图像集成分类方法,其特征在于,每次更新得到当前层次的分类器、集成分类器和伪标签预测集,其中,分类器由有标签的支持集S和无标签的支持集U更新,具体公式为:
Figure FDA0003629803480000024
该公式为最大似然估计公式的变形,其中,
Figure FDA0003629803480000025
为分类器,当k=0时,
Figure FDA0003629803480000026
由支持集直接训练得到,
Figure FDA0003629803480000027
为特征提取模块,fψ为关系网络模块,C为任务个数,Ac为当前无标签支持集到所有支持集之间的距离总和求平均。
5.根据权利要求4所述的基于自训练的小样本图像集成分类方法,其特征在于,特征提取模块采用如下公式:
Figure FDA0003629803480000028
该公式为最大似然估计公式的变形,特征提取时,在基分类器下对每个查询样本进行特征提取,它们的和进行最大似然估计处理,得到的是特征提取模块需要的结果。
6.根据权利要求5所述的基于自训练的小样本图像集成分类方法,其特征在于,关系网络模块采用如下公式:
Figure FDA0003629803480000029
该公式为最大似然估计公式的变形,fψ(·)为关系网络函数,用于获取两个参数之间的距离,在
Figure FDA0003629803480000031
中,第一个参数
Figure FDA0003629803480000032
为提取的有标签支持集特征,第二个参数表示当前无标签支持集到所有支持集之间的距离总和求平均,将所有样本的数据进行最大似然估计处理,得到的是关系网络模块需要的结果。
7.根据权利要求1所述的基于自训练的小样本图像集成分类方法,其特征在于,步骤S3具体包括:
S31,对于每一个任务再次抽取三个数据集:有标签的支持集
Figure FDA0003629803480000033
无标签的支持集
Figure FDA0003629803480000034
和查询集
Figure FDA0003629803480000035
S32,通过有标签支持集S和无标签支持集U进一步微调训练过的分类,更新公式如下:
Figure FDA0003629803480000036
其中,
Figure FDA0003629803480000037
表示整个支持集,即包括有标签支持集和无标签支持集两部分,
Figure FDA0003629803480000038
为度量在支持集下当前分类器和上一个集成分类器两个参数的概率分布之间的差异;
S33,集成分类器参数更新如下:
γk=ω1θk2γk-1 (5)
其中,γk-1为集成分类器k-1的参数,θk为基分类器k的参数,ω1和ω2为集成分类器k-1和基分类器k的权重,当k=0时,γ0=θ0
S34:查询集的标签标签更新如下:
Figure FDA0003629803480000039
其中,
Figure FDA00036298034800000310
为查询集的标签,
Figure FDA00036298034800000311
为第m个集成分类器的参数,
Figure FDA00036298034800000312
为提取特征,xj为查询样数据的数据,其中xj属于有理数集。
8.根据权利要求1所述的基于自训练的小样本图像集成分类方法,其特征在于,在步骤S4中,通过新类数据上所有任务中查询集标签的预测值和真实值,评估集成分类方法的最终性能。
9.一种基于自训练的小样本图像集成分类装置,其特征在于,用以实现权利要求1-8所述的任一项方法,包括以下模块:
预训练模块:使用基类数据上预训练得到特征提取模块;
自训练模块:用于构建基分类器,并使用查询样本进行基分类器的自训练,不断地将伪标签集加到支持集扩充支持集;
集成分类模块:用于自训练过程中产生的基分类器,不断通过模型平均得到集成分类器。
CN202210487571.7A 2022-05-06 2022-05-06 基于自训练的小样本图像集成分类方法及装置 Active CN114782752B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210487571.7A CN114782752B (zh) 2022-05-06 2022-05-06 基于自训练的小样本图像集成分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210487571.7A CN114782752B (zh) 2022-05-06 2022-05-06 基于自训练的小样本图像集成分类方法及装置

Publications (2)

Publication Number Publication Date
CN114782752A true CN114782752A (zh) 2022-07-22
CN114782752B CN114782752B (zh) 2023-09-05

Family

ID=82434445

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210487571.7A Active CN114782752B (zh) 2022-05-06 2022-05-06 基于自训练的小样本图像集成分类方法及装置

Country Status (1)

Country Link
CN (1) CN114782752B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116168257A (zh) * 2023-04-23 2023-05-26 安徽大学 基于样本生成的小样本图像分类方法、设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108154156A (zh) * 2017-11-30 2018-06-12 兰州理工大学 基于神经主题模型的图像集成分类方法及装置
CN113076437A (zh) * 2021-04-13 2021-07-06 华南理工大学 一种基于标签重分配的小样本图像分类方法及系统
CN113222011A (zh) * 2021-05-10 2021-08-06 西北工业大学 一种基于原型校正的小样本遥感图像分类方法
CN113378942A (zh) * 2021-06-16 2021-09-10 中国石油大学(华东) 基于多头特征协作的小样本图像分类方法
CN113378941A (zh) * 2021-06-16 2021-09-10 中国石油大学(华东) 多决策融合的小样本图像分类方法
CN113408606A (zh) * 2021-06-16 2021-09-17 中国石油大学(华东) 基于图协同训练的半监督小样本图像分类方法
CN113706487A (zh) * 2021-08-17 2021-11-26 西安电子科技大学 基于自监督特征小样本学习的多器官分割方法
CN114299362A (zh) * 2021-12-27 2022-04-08 南京邮电大学 一种基于k-means聚类的小样本图像分类方法
CN114329124A (zh) * 2021-12-16 2022-04-12 南京理工大学 基于梯度重优化的半监督小样本分类方法
CN114387473A (zh) * 2022-01-12 2022-04-22 南通大学 一种基于基类样本特征合成的小样本图像分类方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108154156A (zh) * 2017-11-30 2018-06-12 兰州理工大学 基于神经主题模型的图像集成分类方法及装置
CN113076437A (zh) * 2021-04-13 2021-07-06 华南理工大学 一种基于标签重分配的小样本图像分类方法及系统
CN113222011A (zh) * 2021-05-10 2021-08-06 西北工业大学 一种基于原型校正的小样本遥感图像分类方法
CN113378942A (zh) * 2021-06-16 2021-09-10 中国石油大学(华东) 基于多头特征协作的小样本图像分类方法
CN113378941A (zh) * 2021-06-16 2021-09-10 中国石油大学(华东) 多决策融合的小样本图像分类方法
CN113408606A (zh) * 2021-06-16 2021-09-17 中国石油大学(华东) 基于图协同训练的半监督小样本图像分类方法
CN113706487A (zh) * 2021-08-17 2021-11-26 西安电子科技大学 基于自监督特征小样本学习的多器官分割方法
CN114329124A (zh) * 2021-12-16 2022-04-12 南京理工大学 基于梯度重优化的半监督小样本分类方法
CN114299362A (zh) * 2021-12-27 2022-04-08 南京邮电大学 一种基于k-means聚类的小样本图像分类方法
CN114387473A (zh) * 2022-01-12 2022-04-22 南通大学 一种基于基类样本特征合成的小样本图像分类方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
WEI-YU CHEN ET AL.: "A CLOSER LOOK AT FEW-SHOT CLASSIFICATION", 《ARXIV》, pages 1 - 17 *
叶萌: "基于集成策略的半监督小样本学习方法研究", 《中国优秀硕士学位论文全文数据库》, no. 2, pages 6 - 22 *
马勇: "基于深度度量学习的小样本图像分类", 《中国优秀硕士学位论文全文数据库》, no. 12, pages 27 - 41 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116168257A (zh) * 2023-04-23 2023-05-26 安徽大学 基于样本生成的小样本图像分类方法、设备及存储介质

Also Published As

Publication number Publication date
CN114782752B (zh) 2023-09-05

Similar Documents

Publication Publication Date Title
CN111814854B (zh) 一种无监督域适应的目标重识别方法
CN114241282B (zh) 一种基于知识蒸馏的边缘设备场景识别方法及装置
CN112819065B (zh) 基于多重聚类信息的无监督行人难样本挖掘方法和系统
CN111582409A (zh) 图像标签分类网络的训练方法、图像标签分类方法及设备
CN112132014B (zh) 基于非督导金字塔相似性学习的目标重识别方法及系统
CN114912612A (zh) 鸟类识别方法、装置、计算机设备及存储介质
CN112364791B (zh) 一种基于生成对抗网络的行人重识别方法和系统
CN110751027B (zh) 一种基于深度多示例学习的行人重识别方法
An et al. Weather classification using convolutional neural networks
CN113011568A (zh) 一种模型的训练方法、数据处理方法及设备
CN113821668A (zh) 数据分类识别方法、装置、设备及可读存储介质
CN110457992A (zh) 基于贝叶斯优化技术的行人重识别方法、装置和系统
CN112183464A (zh) 基于深度神经网络和图卷积网络的视频行人识别方法
CN114298122A (zh) 数据分类方法、装置、设备、存储介质及计算机程序产品
CN115393666A (zh) 图像分类中基于原型补全的小样本扩充方法及系统
CN114782752B (zh) 基于自训练的小样本图像集成分类方法及装置
CN114579794A (zh) 特征一致性建议的多尺度融合地标图像检索方法及系统
CN113762331A (zh) 关系型自蒸馏方法、装置和系统及存储介质
CN107273478B (zh) 一种基于Group Lasso的半监督哈希图像搜索方法
CN113822134A (zh) 一种基于视频的实例跟踪方法、装置、设备及存储介质
Palle et al. Automated image and video object detection based on hybrid heuristic-based U-net segmentation and faster region-convolutional neural network-enabled learning
CN112529057A (zh) 一种基于图卷积网络的图相似性计算方法及装置
CN113516118B (zh) 一种图像与文本联合嵌入的多模态文化资源加工方法
CN113076963B (zh) 一种图像识别方法、装置和计算机可读存储介质
CN111091198B (zh) 一种数据处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant