CN114821204B - 一种基于元学习嵌入半监督学习图像分类方法与系统 - Google Patents

一种基于元学习嵌入半监督学习图像分类方法与系统 Download PDF

Info

Publication number
CN114821204B
CN114821204B CN202210754352.0A CN202210754352A CN114821204B CN 114821204 B CN114821204 B CN 114821204B CN 202210754352 A CN202210754352 A CN 202210754352A CN 114821204 B CN114821204 B CN 114821204B
Authority
CN
China
Prior art keywords
data
network
learning
classification
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210754352.0A
Other languages
English (en)
Other versions
CN114821204A (zh
Inventor
袭肖明
孟令钊
聂秀山
尹义龙
张光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Jianzhu University
Original Assignee
Shandong Jianzhu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Jianzhu University filed Critical Shandong Jianzhu University
Priority to CN202210754352.0A priority Critical patent/CN114821204B/zh
Publication of CN114821204A publication Critical patent/CN114821204A/zh
Application granted granted Critical
Publication of CN114821204B publication Critical patent/CN114821204B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本公开提供了一种基于元学习嵌入半监督学习图像分类方法与系统,属于图像分类系统技术领域,采用提出的面向重要性区域加噪的样本生成方法,将该类样本引入到训练过程中,使模型学习到更加鲁棒的特征;另一方面,构建一种融合元学习和半监督学习的知识自适应挖掘的半监督学习网络,在半监督学习框架下,引入元学习器来对每个样本的知识进行自适应学习,并将获得的有效知识应用到网络的训练过程中,进一步提升模型的鲁棒性。

Description

一种基于元学习嵌入半监督学习图像分类方法与系统
技术领域
本公开涉及图像分类系统技术领域,具体涉及一种基于元学习嵌入半监督学习图像分类方法与系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
传统的图像分类方法大致可以分为基于手工设计特征加传统浅层分类模型的方法和基于深度学习的方法,对于传统的基于手工设计特征的方法,由于特征的表述能力有限,导致分类效果难以令人满意,相比较传统的手工设计特征的方法,深度神经网络具有强大的特征学习能力,目前已经成为图像分类的主流方法。
然而,在图像分类任务中,学到的知识的作用是不同的,例如,有些特征对噪声更为鲁棒,这类知识在分类模型的学习
中需要发挥更大的作用,另外,在某些任务中,例如医学图像分析,数据的标记获取成本往往较高,难以获取到足够的标记数据,然而,可以获得大量的低成本未标记噪音数据。半监督学习可以有效获取标记数据和未标记数据,但是现有的半监督学习模型并未考虑到对样本进行个性化的知识学习,限制了模型性能的提升
发明内容
本公开为了解决在图像分类任务中噪音样本限制模型性能提升的问题,提出了一种基于元学习嵌入半监督学习图像分类方法与系统,引入面向重要性区域的加噪方法的样本生成方法,将该样本引入到训练过程中,使得模型学习到更加鲁棒的特征。
根据一些实施例,本公开采用如下技术方案:
一种基于元学习嵌入半监督学习图像分类方法,包括:
采集不同类型的原始图像数据样本,构建数据集并进行预处理;
构建训练样本集,将原始图像数据样本进行重要特征区域加噪,获得重要的特征区域信息;
将加噪后训练样本集中的样本输入到分类网络模型中,输出每个样本的权重;
构建损失函数,更新标记数据并输入分类网络模型中进行迭代,计算交叉熵损失以及均方差损失并计算网络总损失;
更新网络参数,进行迭代达到收件条件,获得最小损失的半监督网络模型,并利用测试集进行测试,输出图像类别。
一种基于元学习嵌入半监督学习图像分类系统,包括:
数据采集处理模块,用于采集不同类型的原始图像数据样本,构建数据集并进行预处理;构建训练样本集,将原始图像数据样本进行重要特征区域加噪,获得重要的特征区域信息;
训练与样本自适应加权模块,用于将加噪后训练样本集中的样本输入到分类网络模型中,输出每个样本的权重;
损失计算模块,用于构建损失函数,更新标记数据并输入分类网络模型中进行迭代,计算交叉熵损失以及均方差损失并计算网络总损失;
分类模块,用于进行迭代达到收件条件,获得最小损失的半监督网络模型,并利用测试集进行测试,输出图像类别。
有益效果
与现有技术相比,本公开的有益效果为:
本公开提出一种基于元学习嵌入半监督学习图像分类方法,可以对每个样本的知识进行自适应学习,能够有效增强网络对鲁棒特征的学习能力。
一方面,采用提出的面向重要性区域加噪的样本生成样本方法,将该类样本引入到训练过程中,使模型学习到更加鲁棒的特征。
另一方面,构建了一种融合元学习和半监督学习的知识自适应挖掘的半监督学习网络,在半监督学习框架下,引入元学习器来对每个样本的知识进行自适应学习,并将获得的有效知识应用到网络的训练过程中,进一步提升模型的鲁棒性。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。
图1为本公开图像分类算法实现图像分类的网络学习流程示意图;
图2为本公开图像分类系统模型框架示意图。
具体实施方式:
下面结合附图与实施例对本公开作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例1
本公开提供一种基于元学习嵌入半监督学习的图像分类方法,如图1所示:一种基于元学习嵌入半监督学习的图像分类算法实现图像分类的网络学习过程,包括以下步骤:
步骤1:采集不同类型的原始图像数据样本,构建数据集并进行预处理;
步骤2:构建训练样本集,将原始图像数据样本进行重要特征区域加噪,获得重要的特征区域信息;
步骤3:将加噪后训练样本集中的样本输入到分类网络模型中,输出每个样本的权重;
步骤4:构建损失函数,更新标记数据并输入分类网络模型中进行迭代,计算交叉熵损失以及均方差损失并计算网络总损失;
步骤5:更新网络参数,进行迭代达到收件条件,获得最小损失的半监督网络模型,并利用测试集进行测试,输出图像类别。
在步骤1中,对数据进行预处理;
采集不同类别的原始图像数据样本,由于原始数据样本在数据收集过程中图像尺寸可能存在不一致的问题,不利于深度网络模型的学习,因此需要将原始数据样本集的图像尺寸变换为统一大小。将每种类型的原始图像样本按照一定的比例进行分配划分,具体采用按样本类别等比例划分方式,比例为7:2:1,组合成训练集、验证集以及测试集。
在步骤2中,对数据样本重要特征区域加噪;
利用预训练好的图像分类模型(VGG、resnet32、resnet50等)获得原始数据样本集中每幅图像的类激活映射(CAM-Class Activation Mapping),根据CAM获得数据样本重要的特征区域信息。采用已有技术Grad-CAM方法获取样本的重要特征区域,越重要的特征区域其值越高。重要特征区域信息是网络预测的重要区域,为了促使模型学到的特征更加鲁棒,将CAM作为图像加噪的概率图,对图像按照获得的加噪概率图进行不同程度的加噪,即图像按照10%的设定比例进行随机区域加噪,根据上述类激活映射,可以获得网络预测的重要特征区域,越重要的特征区域其比例值越大,越重要的区域,加噪的概率越大,迫使模型学习出对噪声鲁棒的特征。主要的加噪方法有随机噪声、椒盐噪声、高斯噪声等。加噪的方式为随机选取一块区域,判断该区域中包含重要特征区域的比例,超过70%的阈值,则对该区域进行10%比例的加噪,否则继续寻找满足该条件的区域。
在步骤3中,数据输入模型进行训练;
数据样本经过重要特征区域加噪方法处理后,将训练样本集中的标记数据和未标记数据输入到学生分类网络中;教师网络输入未标记数据。在数据集划分标记数据和未标记数据,标记数据指有标签数据,即通过先验知识已标注样本的所属类型;未标记数据指无标签数据。首先将标记样本和未标记样本输入到学生分类网络的主干网络resnet50中,经过多次卷积操作后,进行数据样本的关键特征信息提取,获取对应的特征图。为之后获取样本权重以及计算损失函数的输入信息做准备工作。
进行样本自适应加权;
在学生网络中嵌入元学习挖掘器,用于有效知识自适应挖掘,该元学习挖掘器由一个三层的全连接神经网络构成,该全连接神经网络网络的输入是学生网络的主干网络经多次卷积操作获得的特征图,最终输出是每个样本的初始化权重。在学生分类网络模型中嵌入元学习挖掘器,所述元学习挖掘器由一个三层的全连接神经网络构成,将获取的特征图输入至所述全连接神经网络中,输出每个数据样本的初始化权重。
教师网络的输入是原始未标记图像的加噪图像。教师网络在进行参数更新时通过梯度下降更新学生网络的权重后,教师网络的权重被更新为学生网络权重的指数滑动平均值,教师网络主要用于指引学生网络更好的学习。
生成伪标签数据;
利用已经训练好的教师分类网络对未标记数据进行预测,并与学生网络的预测结果进行MSE损失计算,同时教师网络的参数根据学生网络更新后的参数进行指数滑动平均方式更新进行预测,设定类别的概率T,若是所述标记数据分类某一类别的概率大于阈值T,则对其进行标记,生成伪标签数据,并重新加入到标记数据中,进行新一轮的训练,将所述伪标签数据与原始数据一并再作为输入,进行网络模型的训练。
对于未标记数据,未标记数据输入学生网络中,使用学生网络进行标签预测,并经过SoftMax分类器处理后得到分为某类的概率;如果该未标记数据分到某类的概率大于阈值T,则对其进行标记,并加入到标记数据中。在新一轮的训练过程中,将伪标签数据与原始数据一并作为输入,进行网络模型训练。
步骤4中,计算交叉熵损失
将在学生网络分类模型获得的标记数据特征图,经过平均池化层、全连接层和softmax分类器处理后,获得标记数据的预测类别。将预测类别与真实类别进行交叉熵损失计算,所述真实类别为样本标签:
是有标记数据目标损失函数,表示学生网络;表示有标记样本数据集,是主干网络的网络参数。
教师网络和学生网络分别将未标记数据输入到网络中,经过卷积获得其特征图,将在学生分类网络与教师分类网络模型获得的未标记数据特征图,获得的特征图经过池化层、全连接层和Softmax分类器得到对应的预测结果,将学生网络和教师网络的预测类别做均方差损失计算:
表示学生网络和教师网络对未标记数据预测结果的目标损失函数,表示教师网络,是学生网络的网络参数,表示教师网络的网络参数。
将交叉熵损失与均方差损失相加,然后与样本自适应加权的输出结果数据样本的权重进行融合计算得到网络模型的总损失:
表示元学习器输出的样本权重,是本网络模型的总损失。
更新网络参数,通过随机梯度下降法更新学生网络的主干网络参数,再基于更新后主干网络的参数优化元学习挖掘器,对于主干网络和元学习挖掘器进行交替优化。在更新完学生网络参数后,利用学生网络的参数通过指数滑动平均(EMA)方式进行教师网络参数更新。
该更新方法为Mean Teacher框架中已有更新教师网络参数的方法:
θTea=αθTea−1+(1−α)θStu
将交叉熵损失和均方差损失加权和做为总损失,重复进行前向传播和反向传播过程,直到达到收敛条件,保存其最小损失值时的网络模型作为最终的训练结果。
输入待测试图像数据到已训练好的网络模型中进行预测,最终网络模型输出计算的最大值所对应的类别做为最终的预测结果。
实施例2
本公开提供一种基于元学习嵌入半监督学习图像分类系统,包括:
数据采集处理模块,用于采集不同类型的原始图像数据样本,构建数据集并进行预处理;构建训练样本集,将原始图像数据样本进行重要特征区域加噪,获得重要的特征区域信息;
训练与样本自适应加权模块,用于将加噪后训练样本集中的样本输入到分类网络模型中,输出每个样本的权重;
损失计算模块,用于构建损失函数,更新标记数据并输入分类网络模型中进行迭代,计算交叉熵损失以及均方差损失并计算网络总损失;
分类模块,用于进行迭代达到收件条件,获得最小损失的半监督网络模型,并利用测试集进行测试,输出图像类别。
上述的系统连接用户端,用户可以进行分类输入操作,实现分类系统的交互。
如图2所示,本公开的实现包括两大部分,用户端以及分类系统,输入待测试的图像集,在分类系统中完成分类判别,获得分类结果并和用户端进行交互。
其中特征向量提取部分包括:构建训练样本集,将原始图像数据样本进行重要特征区域加噪,获得重要的特征区域信息;
将加噪后训练样本集中的样本输入到分类网络模型中,输出每个样本的权重;
构建损失函数,更新标记数据并输入分类网络模型中进行迭代,计算交叉熵损失以及均方差损失并计算网络总损失;
更新网络参数,进行迭代达到收件条件,获得最小损失的半监督网络模型,并利用测试集进行测试,输出图像类别。
本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。

Claims (7)

1.一种基于元学习嵌入半监督学习图像分类方法,其特征在于,训练步骤包括:
采集不同类型的原始图像数据样本,构建数据集并进行预处理;
构建训练样本集,将原始图像数据样本进行重要特征区域加噪,获得重要的特征区域信息;利用训练好的图像分类模型,获取原始数据样本集中每个图像的CAM,根据CAM获得数据样本重要的特征区域信息,将CAM作为图像加噪的概率图,对图像数据按照获得的加噪概率图进行不同程度的加噪;数据样本在进行重要特征加噪处理之后,将训练样本集中标记数据和未标记数据输入到学生分类网络模型和教师分类网络模型中,首先将标记样本输入到学生分类网络模型的主干网络resnet50中,进行多次卷积操作,提取数据样本的关键特征信息,获取对应的特征图;
将加噪后训练样本集中的样本输入到分类网络模型中,输出每个样本的权重;对数据样本进行自适应加权处理,具体的:在学生分类网络模型中嵌入元学习挖掘器,所述元学习挖掘器由一个三层的全连接神经网络构成,将获取的特征图输入至所述全连接神经网络中,输出每个数据样本的初始化权重;
构建损失函数,更新标记数据并输入分类网络模型中进行迭代,计算交叉熵损失以及均方差损失并计算网络总损失;
将在学生网络分类模型获得的标记数据特征图,经过平均池化层、全连接层和softmax分类器处理后,获得标记数据的预测类别;将预测类别与真实类别进行交叉熵损失计算,所述真实类别为样本标签;
教师网络和学生网络分别将未标记数据输入到网络中,经过卷积获得其特征图,将在学生分类网络与教师分类网络模型获得的未标记数据特征图,获得的特征图经过池化层、全连接层和Softmax分类器得到对应的预测结果,将学生网络和教师网络的预测类别做均方差损失计算;
将交叉熵损失与均方差损失相加,然后与样本自适应加权的输出结果数据样本的权重进行融合计算得到网络模型的总损失;
更新网络参数,进行迭代达到收件条件,获得最小损失的半监督网络模型,并利用测试集进行测试,输出图像类别;通过随机梯度下降法更新学生网络的主干网络参数,再基于更新后主干网络的参数优化元学习挖掘器,对于主干网络和元学习挖掘器进行交替优化。
2.如权利要求1所述的一种基于元学习嵌入半监督学习图像分类方法,其特征在于,数据预处理具体为:将原始图像数据样本中的每个图像的尺寸变换为统一大小,将每种类型的原始图像样本按照比例进行分配划分,组合成训练集、验证集和测试集。
3.如权利要求1所述的一种基于元学习嵌入半监督学习图像分类方法,其特征在于,对于未标记数据,利用已经训练好的教师分类网络进行预测,设定类别的概率T,若是所述标记数据分类某一类别的概率大于阈值T,则对其进行标记,生成伪标签数据,并重新加入到标记数据中,进行新一轮的训练,将所述伪标签数据与原始数据一并再作为输入,进行网络模型的训练。
4.如权利要求1所述的一种基于元学习嵌入半监督学习图像分类方法,其特征在于,对于所述获得的标记数据特征图,进行平均池化层、全连接层和softmax分类器处理,获得标记数据的预测类别,将所述预测类别与真实类别进行交叉熵损失计算:
是有标记数据目标损失函数,表示学生网络;是学生网络的网络参数,表示有标记样本数据集,是主干网络的网络参数。
5.如权利要求3所述的一种基于元学习嵌入半监督学习图像分类方法,其特征在于,将在教师分类网络模型获得未标记数据特征图,经过处理分别获得对应的预测类别,将学生分类网络和教师分类网络的预测类别做均方差损失计算:
表示学生网络和教师网络对未标记数据预测结果的目标损失函数,表示学生网络,表示教师网络,是学生网络的网络参数,表示教师网络的网络参数。
6.如权利要求5所述的一种基于元学习嵌入半监督学习图像分类方法,其特征在于,计算网络模型损失:
将交叉熵损失与均方差损失相加,然后与所述输出结果数据样本的权重进行融合计算得到网络模型的总损失:
表示元学习器输出的样本权重,是本网络模型的总损失。
7.一种基于元学习嵌入半监督学习图像分类系统,其特征在于,包括:
数据采集处理模块,用于采集不同类型的原始图像数据样本,构建数据集并进行预处理;构建训练样本集,将原始图像数据样本进行重要特征区域加噪,获得重要的特征区域信息;利用训练好的图像分类模型,获取原始数据样本集中每个图像的CAM,根据CAM获得数据样本重要的特征区域信息,将CAM作为图像加噪的概率图,对图像数据按照获得的加噪概率图进行不同程度的加噪;数据样本在进行重要特征加噪处理之后,将训练样本集中标记数据和未标记数据输入到学生分类网络模型和教师分类网络模型中,首先将标记样本输入到学生分类网络模型的主干网络resnet50中,进行多次卷积操作,提取数据样本的关键特征信息,获取对应的特征图;
训练与样本自适应加权模块,用于将加噪后训练样本集中的样本输入到分类网络模型中,输出每个样本的权重;对数据样本进行自适应加权处理,具体的:在学生分类网络模型中嵌入元学习挖掘器,所述元学习挖掘器由一个三层的全连接神经网络构成,将获取的特征图输入至所述全连接神经网络中,输出每个数据样本的初始化权重;
损失计算模块,用于构建损失函数,更新标记数据并输入分类网络模型中进行迭代,计算交叉熵损失以及均方差损失并计算网络总损失;
将在学生网络分类模型获得的标记数据特征图,经过平均池化层、全连接层和softmax分类器处理后,获得标记数据的预测类别;将预测类别与真实类别进行交叉熵损失计算,所述真实类别为样本标签;
教师网络和学生网络分别将未标记数据输入到网络中,经过卷积获得其特征图,将在学生分类网络与教师分类网络模型获得的未标记数据特征图,获得的特征图经过池化层、全连接层和Softmax分类器得到对应的预测结果,将学生网络和教师网络的预测类别做均方差损失计算;
将交叉熵损失与均方差损失相加,然后与样本自适应加权的输出结果数据样本的权重进行融合计算得到网络模型的总损失;
分类模块,用于进行迭代达到收件条件,获得最小损失的半监督网络模型,并利用测试集进行测试,输出图像类别;通过随机梯度下降法更新学生网络的主干网络参数,再基于更新后主干网络的参数优化元学习挖掘器,对于主干网络和元学习挖掘器进行交替优化。
CN202210754352.0A 2022-06-30 2022-06-30 一种基于元学习嵌入半监督学习图像分类方法与系统 Active CN114821204B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210754352.0A CN114821204B (zh) 2022-06-30 2022-06-30 一种基于元学习嵌入半监督学习图像分类方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210754352.0A CN114821204B (zh) 2022-06-30 2022-06-30 一种基于元学习嵌入半监督学习图像分类方法与系统

Publications (2)

Publication Number Publication Date
CN114821204A CN114821204A (zh) 2022-07-29
CN114821204B true CN114821204B (zh) 2023-04-07

Family

ID=82523408

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210754352.0A Active CN114821204B (zh) 2022-06-30 2022-06-30 一种基于元学习嵌入半监督学习图像分类方法与系统

Country Status (1)

Country Link
CN (1) CN114821204B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115311605B (zh) * 2022-09-29 2023-01-03 山东大学 基于近邻一致性和对比学习的半监督视频分类方法及系统
CN116385809A (zh) * 2023-06-05 2023-07-04 山东第一医科大学附属省立医院(山东省立医院) 一种基于半监督学习的mri脑肿瘤分类方法及系统
CN117611932B (zh) * 2024-01-24 2024-04-26 山东建筑大学 基于双重伪标签细化和样本重加权的图像分类方法及系统
CN117636072B (zh) * 2024-01-24 2024-04-26 山东建筑大学 基于难度感知数据增强与标签矫正的图像分类方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113077388A (zh) * 2021-04-25 2021-07-06 中国人民解放军国防科技大学 一种数据增广的深度半监督超限学习图像分类方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111259979B (zh) * 2020-02-10 2022-11-18 大连理工大学 一种基于标签自适应策略的深度半监督图像聚类方法
CN113033603B (zh) * 2021-02-05 2022-11-15 浙江大学 一种基于元学习的弱监督图像多标签分类方法
CN114565797A (zh) * 2022-03-04 2022-05-31 上海商汤智能科技有限公司 一种用于分类的神经网络的训练、图像分类方法以及装置
CN114612732A (zh) * 2022-05-11 2022-06-10 成都数之联科技股份有限公司 样本数据增强方法及系统及装置及介质及目标分类方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113077388A (zh) * 2021-04-25 2021-07-06 中国人民解放军国防科技大学 一种数据增广的深度半监督超限学习图像分类方法及系统

Also Published As

Publication number Publication date
CN114821204A (zh) 2022-07-29

Similar Documents

Publication Publication Date Title
CN114821204B (zh) 一种基于元学习嵌入半监督学习图像分类方法与系统
CN110633745B (zh) 一种基于人工智能的图像分类训练方法、装置及存储介质
CN109902018B (zh) 一种智能驾驶系统测试案例的获取方法
CN111753881B (zh) 一种基于概念敏感性量化识别对抗攻击的防御方法
CN112699786B (zh) 一种基于空间增强模块的视频行为识别方法及系统
CN107945210B (zh) 基于深度学习和环境自适应的目标跟踪方法
CN107516102B (zh) 图像数据分类与建立分类模型方法、装置及系统
US11934536B2 (en) Dynamic network risk predicting method based on a graph neural network
CN112465057B (zh) 一种基于深度卷积神经网络的目标检测识别方法
CN116206185A (zh) 一种基于改进YOLOv7的轻量级小目标检测方法
CN111242948A (zh) 图像处理、模型训练方法、装置、设备和存储介质
CN115643115B (zh) 基于大数据的工控网络安全态势预测方法及系统
CN111008570B (zh) 一种基于压缩-激励伪三维网络的视频理解方法
CN110751072A (zh) 基于知识嵌入图卷积网络的双人交互识别方法
CN114821174B (zh) 一种基于内容感知的输电线路航拍图像数据清洗方法
CN115188022A (zh) 一种基于一致性半监督深度学习的人体行为识别方法
CN113487506A (zh) 基于注意力去噪的对抗样本防御方法、装置和系统
CN113837062A (zh) 一种分类方法、装置、存储介质及电子设备
CN112396126A (zh) 一种基于检测主干与局部特征优化的目标检测方法及系统
CN114618167A (zh) 反作弊检测模型构建方法以及反作弊检测方法
CN114065867B (zh) 一种数据分类方法、系统及电子设备
CN117475236B (zh) 用于矿产资源勘探的数据处理系统及其方法
CN113688944B (zh) 一种基于元学习的图像识别方法
CN113762382B (zh) 模型的训练及场景识别方法、装置、设备及介质
CN116645727B (zh) 一种基于Openpose模型算法的行为捕捉识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant