CN112232416A - 一种基于伪标签加权的半监督学习方法 - Google Patents

一种基于伪标签加权的半监督学习方法 Download PDF

Info

Publication number
CN112232416A
CN112232416A CN202011109339.7A CN202011109339A CN112232416A CN 112232416 A CN112232416 A CN 112232416A CN 202011109339 A CN202011109339 A CN 202011109339A CN 112232416 A CN112232416 A CN 112232416A
Authority
CN
China
Prior art keywords
label
pseudo
training
sample
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011109339.7A
Other languages
English (en)
Other versions
CN112232416B (zh
Inventor
程战战
李铎
吴飞
浦世亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202011109339.7A priority Critical patent/CN112232416B/zh
Publication of CN112232416A publication Critical patent/CN112232416A/zh
Application granted granted Critical
Publication of CN112232416B publication Critical patent/CN112232416B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供一种基于伪标签加权的半监督学习方法,所述方法包括:获取待训练的有标签和无标签样本,得到有标签和无标签训练集;在有标签训练集上进行模型训练,得到有标签训练模型;基于有标签训练模型对无标签训练集进行预测,得到无标签训练集的伪标签;输入伪标签至标签适配模块,得到加权后的伪标签;基于深度神经网络对获取的有标签训练集和伪标签训练集进行训练,得到半监督学习后的机器学习模型。本发明能够对含有无标签的数据场景进行半监督训练,在不对无标签数据进行标注情况下,进一步提高模型的场景适应能力,有效解决典型的开集误报问题、类别间误报问题和漏报问题,从而得到更高的模型性能。

Description

一种基于伪标签加权的半监督学习方法
技术领域
本发明涉及半监督领域,尤其涉及一种基于伪标签加权的半监督学习方法。
背景技术
在半监督学习算法中,为了让模型能够从无标签数据的样本分布p(x)中获取知识,需要借助无标签数据的后验分布p(y|x)来推断其类别。针对样本分布,在半监督学习研究中通常存在以下三个重要假设。1.平滑假设,如果两个数据点x1,x2相似,那么它们相应输出y1,y2也应当类似。2.聚类假设,无论是有标注还是未标注数据,它们都是服从一定的数据分布的。3.流形假设,该假设认为由于数据内部特征的限制,数据大多都存在维度冗余的情况,因而能够被嵌入到某个低维空间中,同时保持数据内部的局部空间结构。基于上述三个假设,能够从不同方面开展半监督算法的研究,利用无标签数据帮助实现样本区分。由于半监督学习解决的主要问题是如何有效利用未标注数据,提升在有标注数据上模型训练的效果。不论使用了什么样的方案,都绕不开的话题是如何给未标注数据打标签以及如何防止在利用这些伪标签时的过拟合现象。已有的方法大多是基于数据扩增、模型预测结果一致性、损失正则等方式,虽然能够起到一定的半监督学习效果,但是并没有从根本上解决伪标签质量的问题。伪标签质量的好坏直接决定了半监督算法学习出的模型性能,而这些已有方法都完全忽略了这个问题。本申请提出的基于伪标签加权方法,首先能够利用置信度信息筛选高质量的伪标签用于训练,同时能够有效利用中低置信度的含有噪声的伪标签,保证数据的充分利用。我们的方法能够有效地解决半监督学习中典型的开集误报问题、类别间误报问题和漏报问题。
发明内容
本发明的目的是克服现有技术的不足,提供一种基于伪标签加权的半监督学习方法。
本发明具体采用的技术方案如下:
一种基于伪标签加权的半监督学习方法,其包括如下步骤:
S1、获取待训练的有标签和无标签样本,得到有标签训练集和无标签训练集;具体包括S101~S104:
S101、获取用于半监督训练的有标签样本集合,表示为有标签训练集X={X1,X2,…,XN},其中N为有标签训练集中样本数目,X1,X2,…,XN分别为第1,2,…,N个有标签样本;
S102、获取有标签训练集X中每条样本对应的可训练标签Y={Y1,Y2,…,YN},,Y1,Y2,…,YN分别为X1,X2,…,XN对应的可训练标签;
S103、获取用于半监督训练的无标签样本集合,表示为无标签训练集U={U1,U2,…,UM},其中M为无标签训练集中样本数目,U1,U2,…,UM分别为第1,2,…,M个无标签样本;
S104、对于样本特征提取器而言,每个用来训练的样本被表示为二元组(Xi,Yi),i∈{1,…,N};
S2、在有标签训练集上进行模型训练,得到有标签训练模型,记作第一模型;具体包括S201~S203:
S201、使用深度神经网络将每条样本Xi映射到标签空间,深度神经网络最后一层输出的为预测标签值;
S202、构建一个目标函数,使得深度神经网络预测的标签值与对应图像的真值标签值一致,对训练样本定义的损失函数为:
Figure BDA0002728066810000021
其中,P(Yi|(Xi,θ))是第i个训练样本在给定(Xi,θ)时求解其真值标签Yi时的期望,θ为深度神经网络中所有可学习的参数;
S203、根据损失函数
Figure BDA0002728066810000022
对深度神经网络进行反向回馈以得到深度神经网络的各层的参数θ,根据学习得到的深度神经网络的参数,提取样本在深度神经网络中各个层次的特征表达;将此时的深度神经网络记为第一模型;
S3、基于有标签训练的第一模型对无标签训练集进行预测,得到无标签训练集的伪标签,记作第一伪标签;伴随第一伪标签,第一模型同时生成描述该伪标签可信程度的“置信度”;
S4、将获取的第一伪标签输入至标签适配模块,得到加权后的伪标签,记作第二伪标签;具体包括S401~S403:
S401、输入第一伪标签至设定的标签适配模块,标签适配模块对输入的第一伪标签进行权值调整,输出加权后的伪标签,记作第二伪标签;
S402、对于样本特征提取器而言,每个用来训练的无标签样本被表示为二元组(Ui,Zi),i∈{1,…,M},Zi是第i个无标签样本Ui对应的可训练伪标签;
S403、在标签适配模块中通过确定置信度阈值进行伪标签筛选;伪标签筛选基于多个模型预测的置信度或者基于单个模型预测的置信度;当采用基于多个模型预测的置信度时,有多个模型共同预测一个伪标签的置信度,最终是否使用该伪标签或排除依据多模型投票,如果预测的置信度高于置信度阈值的模型数目多于预测的置信度低于置信度阈值的模型数目,当前伪标签归为继续使用的伪标签;否则当前伪标签将被筛除不用;当采用基于单个模型预测的置信度时,是否使用该伪标签或排除依据的是单个置信度阈值;
S5、基于获取的有标签训练集和第二伪标签对第一模型进行训练,得到半监督训练后的机器学习模型,记作第二模型;具体包括S501~S505:
S501、将有标签样本集X或无标签训练集U合并,得到混合训练样本集S={S1,S2,…,SM+N},其中M+N为混合样本集合中样本数目,Si为混合样本集合中第i个样本;
S502、构造混合训练样本集S中每条样本对应的可训练标签Y′={Y′1,Y′2,…,Y′M+N},当Si对应于有标签训练集样本时,其对应的标签为真值标签,当Si对应于无标签训练集样本时,其对应的标签为第二伪标签;
S503、对于样本特征提取器而言,每个用来训练的样本被表示为二元组(Si,Yi′),i∈{1,…,M′+N′},Yi′是样本Si对应的可训练标签,M′和N′分别为对有标签训练集和无标签训练集中样本的采样数目;
S504、使用第一模型将每条混合训练样本集中的样本映射到标签空间,即最后一层输出的为预测标签值;
S505、构建一个目标函数,使得神经网络预测的标签值与对应图像的真值或伪标签值一致,对训练样本定义的损失函数为:
Figure BDA0002728066810000031
其中,P(Yi′|(Si,θ′)是第i个训练样本在给定(Si,θ′)时求解其真值标签Yi′时的期望,θ′为深度神经网络中所有可学习参数;
S506、根据损失函数
Figure BDA0002728066810000032
对第一模型进行反向回馈以得到深度神经网络的各层的参数θ′,将此时的深度神经网络记为第二模型;根据学习得到的深度神经网络的参数,提取样本在第二模型中各个层次的特征表达。
作为优选,所述的步骤S2中,P(Yi|(Xi,θ))的表现形式与训练任务场景相关:
当进行分类任务时,期望函数P(Yi|(Xi,θ))定义为交叉熵损失,其公式为:
P(Yi|(Xi,θ))=-YilogYi ^
其中,Yi是标签真值,Yi ^是归一化后的预测概率值;
当进行回归任务时,期望函数P(Yi|(Xi,θ))为均方差损失,其公式为:
P(Yi|(Ii,θ))=-||Yi-Yi ^||2
其中:||·||2为二范数。
作为优选,所述的步骤S5中,P(Yi′|(Si,θ′)的表现形式与训练任务场景相关:
当进行分类任务时,期望函数P(Yi′|(Si,θ′)定义为交叉熵损失,其公式为:
P(Yi′|(Si,θ′)=-Yi′logYi′^
其中,Yi′是标签真值,Yi′^是归一化后的预测概率值;
当进行回归任务时,期望函数P(Yi′|(Si,θ′)为均方差损失,其公式为:
P(Yi′|(Si,θ′)=-||Yi′-Yi′^||2
其中:||·||2为二范数。
作为优选,所述的步骤S5中,当M′为0时,表示只基于无标签训练集和进行半监督训练,适应于端侧训练场景;当M′不为0时,表示同时基于有标签和无标签样本数据进行半监督训练,适应于中心端的训练场景。
作为优选,所述的步骤S3中,所述伪标签的“置信度”由第一模型与其他模型组合预测产生;该“置信度”的学习对象是样本的分类准确度,或者是一个样本的回归准确度,或是样本的分类准确度和回归准确度的组合,或者是目标检测任务中IOU的大小,或是其他能够描述当前样本属于正样本的可能性的统计量;对于无标注训练样本(Ui,Zi),i∈{1,…,M},其置信度记为ci
作为优选,所述的步骤S4中,标签适配模块对输入的伪标签进行权值设定,输出加权后的伪标签,设计的加权策略为:
当进行分类任务时,期望函数P′(Yi|(Xi,θ))为:
P′(Yi|(Xi,θ))=f(ci)P(Yi|(Xi,θ))=-f(ci)YilogYi^
其中,f(·)是非线性映射函数,用于把无标注训练样本的置信度ci映射成损失权重f(·);Yi是标签真值,Yi^是归一化后的预测概率值;
当进行回归任务时,期望函数P′(Yi|(Xi,θ))为均方差损失,公式为:
P′(Yi|(Xi,θ))=f(ci)P(Yi|(Ii,θ))=-f(ci)||Yi-Yi^||2
其中:||·||2为二范数。
作为优选,所述的步骤S4中,所述置信度阈值的根据不同类别的数据分布情况来确定,对于类别k,其伪标签置信度的阈值为:
Figure BDA0002728066810000051
其中,k表示第k个类别,Sk(t)表示大于阈值t的类别k的样本数量,γ为超参数,T是超参数,Sk(T)表示置信度超过T的伪标签样本的总数量。
作为优选,所述的半监督学习方法适用于图像分类、图像识别、目标检测、图像分割、语音识别、序列学习以及其他相关任务的多种应用;根据算法任务中的损失函数类别,根据所述的步骤S3和步骤S4中的损失加权方法进行半监督学习;对于复杂的任务,需相应地把步骤S3和步骤S4的损失加权方式结合使用。
本发明与背景技术相比,具有的有益的效果是:本发明与背景技术相比,具有的有益的效果是:本发明针对通用场景的半监督学习问题提出了一种基于伪标签加权的半监督学习方法。相对于已有方法,本方案的优势在于能够自适应生成高质量的伪标签,同时有效利用中低质量的伪标签,使训练出的模型性能更高、避免自监督过拟合的情况,有效解决典型的开集误报问题、类别间误报问题和漏报问题,从而得到更高的模型性能。该方法从实际应用角度出发,仅仅对伪标签进行优化即可使用无标签数据进行半监督训练,同时可选有标签数据同步训练,能够同时适应端侧场景(无标签数据训练)和中心侧场景(有标签数据+无标签数据训练)。基于本发明,在应用场景中部署时,半监督算法能够支持设备中模型的自我升级。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本发明实施例提供的一种基于伪标签加权的半监督学习方法流程图。
图2是本发明实施例提供的一种基于伪标签加权的半监督学习方法的标签适配模块算法流程图。
图3是本发明实施例提供的一种基于伪标签加权的半监督学习方法的伪标签加权的半监督学习方法动态阈值计算过程示意图
图4是本发明实施例提供的一种基于伪标签加权的半监督学习方法的损失加权映射曲线图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了解决现有技术中存在的问题,本发明实施例提供了一种基于伪标签加权的半监督学习方法,如图1所示,包括如下步骤:
S1、获取待训练的有标签和无标签样本,得到有标签训练集和无标签训练集。
S2、在有标签训练集上进行模型训练,得到有标签训练模型,记作第一模型。
S3、基于有标签训练的第一模型对无标签训练集进行预测,得到无标签训练集的伪标签,记作第一伪标签;伴随第一伪标签,第一模型同时生成描述该伪标签可信程度的“置信度”。
S4、将获取的第一伪标签输入至标签适配模块,得到加权后的伪标签,记作第二伪标签。
S5、基于获取的有标签训练集和第二伪标签对第一模型进行训练,得到半监督训练后的机器学习模型,记作第二模型。
上述S1~S5步骤为本发明方法的核心步骤,下面基于上述核心步骤对其在本实施例中的具体实现方式进行进一步详细描述。
在上述发明实施例中,首先通过构建图像训练样本及对应的训练标签,因此S1的具体子步骤包括S101~S104:
S101、获取用于半监督训练的有标签样本集合,表示为有标签训练集X={X1,X2,…,XN},其中N为有标签训练集中样本数目,X1,X2,…,XN分别为第1,2,…,N个有标签样本。
S102、获取有标签训练集X中每条样本对应的可训练标签Y={Y1,Y2,…,YN},,Y1,Y2,…,YN分别为X1,X2,…,XN对应的可训练标签。
S103、获取用于半监督训练的无标签样本集合,表示为无标签训练集U={U1,U2,…,UM},其中M为无标签训练集中样本数目,U1,U2,…,UM分别为第1,2,…,M个无标签样本。
S104、对于样本特征提取器而言,每个用来训练的样本被表示为二元组(Xi,Yi),i∈{1,…,N}。
另外,S2的具体子步骤包括S201~S203:
S201、使用深度神经网络将每条样本Xi映射到标签空间,深度神经网络最后一层输出的为预测标签值。
S202、构建一个目标函数,使得深度神经网络预测的标签值与对应图像的真值标签值一致,对训练样本定义的损失函数为:
Figure BDA0002728066810000071
其中,P(Yi|(Xi,θ))是第i个训练样本在给定(Xi,θ)时求解其真值标签Yi时的期望,θ为深度神经网络中所有可学习的参数。
而且P(Yi|(Xi,θ))的表现形式与训练任务场景相关:
当进行分类任务时,期望函数P(Yi|(Xi,θ))定义为交叉熵损失,其公式为:
P(Yi|(Xi,θ))=-YilogYi^
其中,Yi是标签真值,Yi^是归一化后的预测概率值;
当进行回归任务时,期望函数P(Yi|(Xi,θ))为均方差损失,其公式为:
P(Yi|(Ii,θ))=-||Yi-Yi^||2
其中:||·||2为二范数。
S203、根据损失函数
Figure BDA0002728066810000081
对深度神经网络进行反向回馈以得到深度神经网络的各层的参数θ,根据学习得到的深度神经网络的参数,提取样本在深度神经网络中各个层次的特征表达;将此时的深度神经网络记为第一模型。
另外,在步骤S3中,伪标签的“置信度”由第一模型与其他模型组合预测产生。该“置信度”的学习对象是样本的分类准确度,或者是一个样本的回归准确度,或是样本的分类准确度和回归准确度的组合,或者是目标检测任务中IOU的大小,或是其他能够描述当前样本属于正样本的可能性的统计量;对于无标注训练样本(Ui,Zi),i∈{1,…,M},其置信度记为ci
另外,S4的具体子步骤包括S401~S403:
S401、输入第一伪标签至设定的标签适配模块,标签适配模块对输入的第一伪标签进行权值调整,输出加权后的伪标签,记作第二伪标签。
此处对第一伪标签进行权值调整时设计的加权策略根据任务形式不同而不同,分别为:
当进行分类任务时,期望函数P′(Yi|(Xi,θ))为:
P′(Yi|(Xi,θ))=f(ci)P(Yi|(Xi,θ))=-f(ci)YilogYi^
其中,f(·)是非线性映射函数,用于把无标注训练样本的置信度ci映射成损失权重f(·);对于正样本,该映射函数把高置信度伪标签的权重比例提升,把中低置信度伪标签的权重比例降低;对于负样本,该映射函数把低置信度伪标签的权重比例提升,把中低置信度伪标签的权重比例降低。这样能够实现更信任置信度接近0和1的伪标签,对于中间置信度的伪标签持怀疑态度进行学习。Yi是标签真值,Yi^是归一化后的预测概率值;
当进行回归任务时,期望函数P′(Yi|(Xi,θ))为均方差损失,公式为:
P′(Yi|(Xi,θ))=f(ci)P(Yi|(Ii,θ))=-f(ci)||Yi-Yi^||2
其中:||·||2为二范数。
S402、对于样本特征提取器而言,每个用来训练的无标签样本被表示为二元组(Ui,Zi),i∈{1,…,M},Zi是第i个无标签样本Ui对应的可训练伪标签。
S403、在标签适配模块中通过确定置信度阈值进行伪标签筛选;伪标签筛选基于多个模型预测的置信度或者基于单个模型预测的置信度;当采用基于多个模型预测的置信度时,有多个模型共同预测一个伪标签的置信度,最终是否使用该伪标签或排除依据多模型投票,如果预测的置信度高于置信度阈值的模型数目多于预测的置信度低于置信度阈值的模型数目,当前伪标签归为继续使用的伪标签;否则当前伪标签将被筛除不用;当采用基于单个模型预测的置信度时,是否使用该伪标签或排除依据的是单个置信度阈值。
其中置信度阈值的根据不同类别的数据分布情况来确定,对于类别k,其伪标签置信度的阈值为:
Figure BDA0002728066810000091
其中,k表示第k个类别,Sk(t)表示大于阈值t的类别k的样本数量,γ为超参数,T是超参数,Sk(T)表示置信度超过T的伪标签样本的总数量。
另外,S5的具体子步骤包括S501~S505:
S501、将有标签样本集X或无标签训练集U合并,得到混合训练样本集S={S1,S2,…,SM+N},其中M+N为混合样本集合中样本数目,Si为混合样本集合中第i个样本。
S502、构造混合训练样本集S中每条样本对应的可训练标签Y′={Y′1,Y′2,…,Y′M+N},当Si对应于有标签训练集样本时,其对应的标签为真值标签,当Si对应于无标签训练集样本时,其对应的标签为第二伪标签。
S503、对于样本特征提取器而言,每个用来训练的样本被表示为二元组(Si,Yi′),i∈{1,…,M′+N′},Yi′是样本Si对应的可训练标签,M′和N′分别为对有标签训练集和无标签训练集中样本的采样数目。
此处,当M′为0时,表示只基于无标签训练集和进行半监督训练,适应于端侧训练场景(如摄像头);当M′不为0时,表示同时基于有标签和无标签样本数据进行半监督训练,适应于中心端的训练场景(如服务器)。
S504、使用第一模型将每条混合训练样本集中的样本映射到标签空间,即最后一层输出的为预测标签值。
S505、构建一个目标函数,使得神经网络预测的标签值与对应图像的真值或伪标签值一致,对训练样本定义的损失函数为:
Figure BDA0002728066810000092
其中,P(Yi′|(Si,θ′)是第i个训练样本在给定(Si,θ′)时求解其真值标签Yi′时的期望,θ′为深度神经网络中所有可学习参数。
同样的,P(Yi′|(Si,θ′)的表现形式与训练任务场景相关:
当进行分类任务时,期望函数P(Yi′|(Si,θ′)定义为交叉熵损失,其公式为:
P(Yi′|(Si,θ))=-Yi′logYi′^
其中,Yi′是标签真值,Yi′^是归一化后的预测概率值;
当进行回归任务时,期望函数P(Yi′|(Si,θ′)为均方差损失,其公式为:
P(Yi′|(Si,θ′)=-||Yi′-Yi′^||2
其中:||·||2为二范数。
S506、根据损失函数
Figure BDA0002728066810000101
对第一模型进行反向回馈以得到深度神经网络的各层的参数θ′,将此时的深度神经网络记为第二模型;根据学习得到的深度神经网络的参数,提取样本在第二模型中各个层次的特征表达。
本发明提供的半监督学习方法适用于图像分类、图像识别、目标检测、图像分割、语音识别、序列学习以及其他相关任务的多种应用。根据算法任务中的损失函数类别,根据所述的步骤S3和步骤S4中的损失加权方法进行半监督学习;对于复杂的任务,需相应地把步骤S3和步骤S4的损失加权方式结合使用。
由此,本发明能够对含有无标签的数据场景进行半监督训练,在不对无标签数据进行标注情况下,进一步提高模型的场景适应能力。为了进一步说明本发明的技术效果,下面基于一个具体案例来展示上述基于伪标签加权的半监督学习方法在具体任务上的实现效果。
实施例
本实施例中,为了验证本发明的效果,方法实现步骤与前述步骤相同,即步骤S1~S5,在此不再进行赘述。模型训练的整体流程如图1所示。下面就部分实施过程和实施结果进行展示如前述S1~S5所示,以证明该方法在半监督目标检测效果:
1).获取公开目标检测数据集MSCOCO(https://cocodataset.org/)
2).在有标注数据集上分别训练教师和学生网络。
3).在未标注集上使用教师网络预测伪标签。如果是单模型,直接使用单模型预测结果作为伪标签;如果教师由多模型组成,则按照图示2的方式,进行投票来选择伪标签。把生成的伪标签存储在一个临时文件中,以便后续训练使用。
4).基于伪标签的置信度分布情况,确定动态阈值
Figure BDA0002728066810000102
计算过程如以下公式:
Figure BDA0002728066810000111
其中,k表示第k个类别,Sk(t)表示大于阈值t的类别k的样本数量,γ为超参数,T是超参数,Sk(T)表示置信度超过T的伪标签样本的总数量。
5).基于伪标签置信度,进行非线性映射,计算每个伪标签对于损失函数的贡献权值。当进行分类任务时,期望函数P′(Yi|(Xi,θ))为:
P′(Yi|(Xi,θ))=f(ci)P(Yi|(Xi,θ))=-f(ci)YilogYi^
其中,f(·)是非线性映射函数,把置信度ci映射成损失权重f(·)。Yi是标签真值,Yi^是归一化后的预测概率值。对于正样本,该映射函数把高置信度伪标签的权重比例提升,把中低置信度伪标签的权重比例降低;对于负样本,该映射函数把低置信度伪标签的权重比例提升,把中低置信度伪标签的权重比例降低。这样能够实现更信任置信度接近0和1的伪标签,对于中间置信度的伪标签持怀疑态度进行学习。Yi是标签真值,Yi^是归一化后的预测概率值。一种非线性映射的示例为图示4,横坐标是置信度,纵坐标是映射后的损失权重。
当进行回归任务时,期望函数P′(Yi|(Xi,θ))为均方差损失,其公式为:
P′(Yi|(Xi,θ))=f(ci)P(Yi|(Ii,θ))=-f(ci)||Yi-Yi^||2
6).在有标注数据集和未标注数据集上对学生网络进行半监督训练,其中未标注数据集由标签适配后的伪标签提供监督信号,并且进行损失加权。训练前后的伪标签预测、损失加权等流程,如图示3所示。
本实施例的最终结果表明,本发明能够自适应生成高质量的伪标签,同时有效利用中低质量的伪标签,使训练出的模型性能更高、避免自监督过拟合的情况,有效解决典型的开集误报问题、类别间误报问题和漏报问题,从而得到更高的模型性能。
以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。

Claims (8)

1.一种基于伪标签加权的半监督学习方法,其特征在于包括如下步骤:
S1、获取待训练的有标签和无标签样本,得到有标签训练集和无标签训练集;具体包括S101~S104:
S101、获取用于半监督训练的有标签样本集合,表示为有标签训练集X={X1,X2,…,XN},其中N为有标签训练集中样本数目,X1,X2,…,XN分别为第1,2,…,N个有标签样本;
S102、获取有标签训练集X中每条样本对应的可训练标签Y={Y1,Y2,…,YN},,Y1,Y2,…,YN分别为X1,X2,…,XN对应的可训练标签;
S103、获取用于半监督训练的无标签样本集合,表示为无标签训练集U={U1,U2,…,UM},其中M为无标签训练集中样本数目,U1,U2,…,UM分别为第1,2,…,M个无标签样本;
S104、对于样本特征提取器而言,每个用来训练的样本被表示为二元组(Xi,Yi),i∈{1,…,N};
S2、在有标签训练集上进行模型训练,得到有标签训练模型,记作第一模型;具体包括S201~S203:
S201、使用深度神经网络将每条样本Xi映射到标签空间,深度神经网络最后一层输出的为预测标签值;
S202、构建一个目标函数,使得深度神经网络预测的标签值与对应图像的真值标签值一致,对训练样本定义的损失函数为:
Figure FDA0002728066800000011
其中,P(Yi|(Xi,θ))是第i个训练样本在给定(Xi,θ)时求解其真值标签Yi时的期望,θ为深度神经网络中所有可学习的参数;
S203、根据损失函数
Figure FDA0002728066800000012
对深度神经网络进行反向回馈以得到深度神经网络的各层的参数θ,根据学习得到的深度神经网络的参数,提取样本在深度神经网络中各个层次的特征表达;将此时的深度神经网络记为第一模型;
S3、基于有标签训练的第一模型对无标签训练集进行预测,得到无标签训练集的伪标签,记作第一伪标签;伴随第一伪标签,第一模型同时生成描述该伪标签可信程度的“置信度”;
S4、将获取的第一伪标签输入至标签适配模块,得到加权后的伪标签,记作第二伪标签;具体包括S401~S403:
S401、输入第一伪标签至设定的标签适配模块,标签适配模块对输入的第一伪标签进行权值调整,输出加权后的伪标签,记作第二伪标签;
S402、对于样本特征提取器而言,每个用来训练的无标签样本被表示为二元组(Ui,Zi),i∈{1,…,M},Zi是第i个无标签样本Ui对应的可训练伪标签;
S403、在标签适配模块中通过确定置信度阈值进行伪标签筛选;伪标签筛选基于多个模型预测的置信度或者基于单个模型预测的置信度;当采用基于多个模型预测的置信度时,有多个模型共同预测一个伪标签的置信度,最终是否使用该伪标签或排除依据多模型投票,如果预测的置信度高于置信度阈值的模型数目多于预测的置信度低于置信度阈值的模型数目,当前伪标签归为继续使用的伪标签;否则当前伪标签将被筛除不用;当采用基于单个模型预测的置信度时,是否使用该伪标签或排除依据的是单个置信度阈值;S5、基于获取的有标签训练集和第二伪标签对第一模型进行训练,得到半监督训练后的机器学习模型,记作第二模型;具体包括S501~S505:
S501、将有标签样本集X或无标签训练集U合并,得到混合训练样本集S={S1,S2,…,SM+N},其中M+N为混合样本集合中样本数目,Si为混合样本集合中第i个样本;
S502、构造混合训练样本集S中每条样本对应的可训练标签Y′={Y′1,Y′2,…,Y′M+N},当Si对应于有标签训练集样本时,其对应的标签为真值标签,当Si对应于无标签训练集样本时,其对应的标签为第二伪标签;
S503、对于样本特征提取器而言,每个用来训练的样本被表示为二元组(Si,Yi′),i∈{1,…,M′+N′},Yi′是样本Si对应的可训练标签,M′和N′分别为对有标签训练集和无标签训练集中样本的采样数目;
S504、使用第一模型将每条混合训练样本集中的样本映射到标签空间,即最后一层输出的为预测标签值;
S505、构建一个目标函数,使得神经网络预测的标签值与对应图像的真值或伪标签值一致,对训练样本定义的损失函数为:
Figure FDA0002728066800000021
其中,P(Yi′|(Si,θ′)是第i个训练样本在给定(Si,θ′)时求解其真值标签Yi′时的期望,θ′为深度神经网络中所有可学习参数;
S506、根据损失函数
Figure FDA0002728066800000031
对第一模型进行反向回馈以得到深度神经网络的各层的参数θ′,将此时的深度神经网络记为第二模型;根据学习得到的深度神经网络的参数,提取样本在第二模型中各个层次的特征表达。
2.如权利要求1所述的一种基于伪标签加权的半监督学习方法,其特征在于,所述的步骤S2中,P(Yi|(Xi,θ))的表现形式与训练任务场景相关:
当进行分类任务时,期望函数P(Yi|(Xi,θ))定义为交叉熵损失,其公式为:
P(Yi|(Xi,θ))=-YilogYi^
其中,Yi是标签真值,Yi^是归一化后的预测概率值;
当进行回归任务时,期望函数P(Yi|(Xi,θ))为均方差损失,其公式为:
P(Yi|(Ii,θ))=-||Yi-Yi^||2
其中:||·||2为二范数。
3.如权利要求1所述的一种基于伪标签加权的半监督学习方法,其特征在于,所述的步骤S5中,P(Yi′|(Si,θ′)的表现形式与训练任务场景相关:
当进行分类任务时,期望函数P(Yi′|(Si,θ′)定义为交叉熵损失,其公式为:
P(Yi′|(Si,θ′)=-Yi′logYi′^
其中,Yi′是标签真值,Yi′^是归一化后的预测概率值;
当进行回归任务时,期望函数P(Yi′|(Si,θ′)为均方差损失,其公式为:
P(Yi′|(Si,θ′)=-||Yi′-Yi′^||2
其中:||·||2为二范数。
4.如权利要求1所述的一种基于伪标签加权的半监督学习方法,其特征在于,所述的步骤S5中,当M′为0时,表示只基于无标签训练集和进行半监督训练,适应于端侧训练场景;当M′不为0时,表示同时基于有标签和无标签样本数据进行半监督训练,适应于中心端的训练场景。
5.如权利要求1所述的一种基于伪标签加权的半监督学习方法,其特征在于,所述的步骤S3中,所述伪标签的“置信度”由第一模型与其他模型组合预测产生;该“置信度”的学习对象是样本的分类准确度,或者是一个样本的回归准确度,或是样本的分类准确度和回归准确度的组合,或者是目标检测任务中IOU的大小,或是其他能够描述当前样本属于正样本的可能性的统计量;对于无标注训练样本(Ui,Zi),i∈{1,…,M},其置信度记为ci
6.如权利要求1所述的一种基于伪标签加权的半监督学习方法,其特征在于,所述的步骤S4中,标签适配模块对输入的伪标签进行权值设定,输出加权后的伪标签,设计的加权策略为:
当进行分类任务时,期望函数P′(Yi|(Xi,θ))为:
P′(Yi|(Xi,θ))=f(ci)P(Yi|(Xi,θ))=-f(ci)YilogYi^
其中,f(·)是非线性映射函数,用于把无标注训练样本的置信度ci映射成损失权重f(·);Yi是标签真值,Yi^是归一化后的预测概率值;
当进行回归任务时,期望函数P′(Yi|(Xi,θ))为均方差损失,公式为:
P′(Yi|(Xi,θ))=f(ci)P(Yi|(Ii,θ))=-f(ci)||Yi-Yi^||2
其中:||·||2为二范数。
7.如权利要求1所述的一种基于伪标签加权的半监督学习方法,其特征在于,所述的步骤S4中,所述置信度阈值的根据不同类别的数据分布情况来确定,对于类别k,其伪标签置信度的阈值为:
Figure FDA0002728066800000041
其中,k表示第k个类别,Sk(t)表示大于阈值t的类别k的样本数量,γ为超参数,T是超参数,Sk(T)表示置信度超过T的伪标签样本的总数量。
8.如权利要求1所述的一种基于伪标签加权的半监督学习方法,其特征在于,所述的半监督学习方法适用于图像分类、图像识别、目标检测、图像分割、语音识别、序列学习以及其他相关任务的多种应用;根据算法任务中的损失函数类别,根据所述的步骤S3和步骤S4中的损失加权方法进行半监督学习;对于复杂的任务,需相应地把步骤S3和步骤S4的损失加权方式结合使用。
CN202011109339.7A 2020-10-16 2020-10-16 一种基于伪标签加权的半监督学习方法 Active CN112232416B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011109339.7A CN112232416B (zh) 2020-10-16 2020-10-16 一种基于伪标签加权的半监督学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011109339.7A CN112232416B (zh) 2020-10-16 2020-10-16 一种基于伪标签加权的半监督学习方法

Publications (2)

Publication Number Publication Date
CN112232416A true CN112232416A (zh) 2021-01-15
CN112232416B CN112232416B (zh) 2021-09-14

Family

ID=74118448

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011109339.7A Active CN112232416B (zh) 2020-10-16 2020-10-16 一种基于伪标签加权的半监督学习方法

Country Status (1)

Country Link
CN (1) CN112232416B (zh)

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112766423A (zh) * 2021-03-15 2021-05-07 平安科技(深圳)有限公司 人脸识别模型的训练方法、装置、计算机设备及存储介质
CN112819099A (zh) * 2021-02-26 2021-05-18 网易(杭州)网络有限公司 网络模型的训练方法、数据处理方法、装置、介质及设备
CN113033679A (zh) * 2021-03-31 2021-06-25 清华大学深圳国际研究生院 一种用于监控视频车辆检测的半监督带噪声学习方法
CN113095162A (zh) * 2021-03-24 2021-07-09 杭州电子科技大学 一种基于半监督深度学习的频谱感知方法
CN113113140A (zh) * 2021-04-02 2021-07-13 中山大学 基于自监督dnn的糖尿病预警方法、系统、设备及存储介质
CN113139594A (zh) * 2021-04-19 2021-07-20 北京理工大学 一种机载图像无人机目标自适应检测方法
CN113326826A (zh) * 2021-08-03 2021-08-31 新石器慧通(北京)科技有限公司 网络模型的训练方法、装置、电子设备及存储介质
CN113378563A (zh) * 2021-02-05 2021-09-10 中国司法大数据研究院有限公司 一种基于遗传变异、半监督和强化学习的案件特征提取方法及装置
CN113536920A (zh) * 2021-06-11 2021-10-22 复旦大学 一种半监督三维点云目标检测方法
CN113554627A (zh) * 2021-07-27 2021-10-26 广西师范大学 一种基于计算机视觉半监督伪标签学习的小麦头检测方法
CN113673622A (zh) * 2021-08-31 2021-11-19 三一专用汽车有限责任公司 激光点云数据标注方法、装置、设备及产品
CN113688665A (zh) * 2021-07-08 2021-11-23 华中科技大学 一种基于半监督迭代学习的遥感影像目标检测方法及系统
CN113705716A (zh) * 2021-09-03 2021-11-26 北京百度网讯科技有限公司 图像识别模型训练方法、设备、云控平台及自动驾驶车辆
CN113781404A (zh) * 2021-08-19 2021-12-10 浙江大学 基于自监督预训练的道路病害检测方法和系统
CN113837394A (zh) * 2021-09-03 2021-12-24 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 多特征视图数据标签预测方法、系统与可读存储介质
CN113869333A (zh) * 2021-11-29 2021-12-31 山东力聚机器人科技股份有限公司 基于半监督关系度量网络的图像识别方法及装置
CN114092798A (zh) * 2021-10-26 2022-02-25 北京工业大学 一种基于半监督学习策略的火灾实例分割方法
CN114154578A (zh) * 2021-12-02 2022-03-08 内蒙古工业大学 面向非平衡数据基于半监督分布式训练的任务识别方法
CN114359956A (zh) * 2021-12-09 2022-04-15 华南理工大学 一种基于图像转换的半监督行人检测方法
CN114881129A (zh) * 2022-04-25 2022-08-09 北京百度网讯科技有限公司 一种模型训练方法、装置、电子设备及存储介质
CN114969321A (zh) * 2022-03-14 2022-08-30 北京工业大学 基于多权重自训练的环境类投诉举报文本分类方法
CN114972725A (zh) * 2021-12-30 2022-08-30 华为技术有限公司 模型训练方法、可读介质和电子设备
CN115272777A (zh) * 2022-09-26 2022-11-01 山东大学 面向输电场景的半监督图像解析方法
CN115292728A (zh) * 2022-07-15 2022-11-04 浙江大学 一种基于生成对抗网络的图像数据隐私保护方法
CN115482418A (zh) * 2022-10-09 2022-12-16 宁波大学 基于伪负标签的半监督模型训练方法、系统及应用
CN115496955A (zh) * 2022-11-18 2022-12-20 之江实验室 图像分类模型训练方法、图像分类方法、设备和介质
CN115512696A (zh) * 2022-09-20 2022-12-23 中国第一汽车股份有限公司 模拟训练方法及车辆
CN115984653A (zh) * 2023-02-14 2023-04-18 中南大学 一种动态智能货柜商品识别模型的构建方法
CN116051985A (zh) * 2022-12-20 2023-05-02 中国科学院空天信息创新研究院 一种基于多模型互馈学习的半监督遥感目标检测方法
WO2023077821A1 (zh) * 2021-11-07 2023-05-11 西北工业大学 基于多清晰度集成自训练的小样本低质量图像目标检测方法
WO2023202596A1 (zh) * 2022-04-19 2023-10-26 华为技术有限公司 一种半监督模型训练方法、系统及相关设备
CN117197472A (zh) * 2023-11-07 2023-12-08 四川农业大学 基于鼻出血内窥镜影像的高效师生半监督分割方法及装置
CN115018066B (zh) * 2022-05-23 2024-04-09 北京计算机技术及应用研究所 一种边端模式下的深度神经网络本地化训练方法
CN117932073A (zh) * 2024-03-21 2024-04-26 智慧眼科技股份有限公司 一种基于提示工程的弱监督文本分类方法及系统
CN115482418B (zh) * 2022-10-09 2024-06-07 北京呈创科技股份有限公司 基于伪负标签的半监督模型训练方法、系统及应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108764281A (zh) * 2018-04-18 2018-11-06 华南理工大学 一种基于半监督自步学习跨任务深度网络的图像分类方法
US20190065939A1 (en) * 2017-08-30 2019-02-28 International Business Machines Corporation Bayesian network based hybrid machine learning
CN110309302A (zh) * 2019-05-17 2019-10-08 江苏大学 一种结合svm和半监督聚类的不平衡文本分类方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190065939A1 (en) * 2017-08-30 2019-02-28 International Business Machines Corporation Bayesian network based hybrid machine learning
CN108764281A (zh) * 2018-04-18 2018-11-06 华南理工大学 一种基于半监督自步学习跨任务深度网络的图像分类方法
CN110309302A (zh) * 2019-05-17 2019-10-08 江苏大学 一种结合svm和半监督聚类的不平衡文本分类方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
尹玉 等: ""伪标签置信选择的半监督集成学习视频语义检测"", 《计算机应用》 *

Cited By (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113378563B (zh) * 2021-02-05 2022-05-17 中国司法大数据研究院有限公司 一种基于遗传变异和半监督的案件特征提取方法及装置
CN113378563A (zh) * 2021-02-05 2021-09-10 中国司法大数据研究院有限公司 一种基于遗传变异、半监督和强化学习的案件特征提取方法及装置
CN112819099B (zh) * 2021-02-26 2023-12-22 杭州网易智企科技有限公司 网络模型的训练方法、数据处理方法、装置、介质及设备
CN112819099A (zh) * 2021-02-26 2021-05-18 网易(杭州)网络有限公司 网络模型的训练方法、数据处理方法、装置、介质及设备
CN112766423B (zh) * 2021-03-15 2023-12-19 平安科技(深圳)有限公司 人脸识别模型的训练方法、装置、计算机设备及存储介质
CN112766423A (zh) * 2021-03-15 2021-05-07 平安科技(深圳)有限公司 人脸识别模型的训练方法、装置、计算机设备及存储介质
CN113095162A (zh) * 2021-03-24 2021-07-09 杭州电子科技大学 一种基于半监督深度学习的频谱感知方法
CN113033679A (zh) * 2021-03-31 2021-06-25 清华大学深圳国际研究生院 一种用于监控视频车辆检测的半监督带噪声学习方法
CN113033679B (zh) * 2021-03-31 2022-05-31 清华大学深圳国际研究生院 一种用于监控视频车辆检测的半监督带噪声学习方法
CN113113140A (zh) * 2021-04-02 2021-07-13 中山大学 基于自监督dnn的糖尿病预警方法、系统、设备及存储介质
CN113139594A (zh) * 2021-04-19 2021-07-20 北京理工大学 一种机载图像无人机目标自适应检测方法
CN113536920A (zh) * 2021-06-11 2021-10-22 复旦大学 一种半监督三维点云目标检测方法
CN113688665B (zh) * 2021-07-08 2024-02-20 华中科技大学 一种基于半监督迭代学习的遥感影像目标检测方法及系统
CN113688665A (zh) * 2021-07-08 2021-11-23 华中科技大学 一种基于半监督迭代学习的遥感影像目标检测方法及系统
CN113554627A (zh) * 2021-07-27 2021-10-26 广西师范大学 一种基于计算机视觉半监督伪标签学习的小麦头检测方法
CN113554627B (zh) * 2021-07-27 2022-04-29 广西师范大学 一种基于计算机视觉半监督伪标签学习的小麦头检测方法
CN113326826A (zh) * 2021-08-03 2021-08-31 新石器慧通(北京)科技有限公司 网络模型的训练方法、装置、电子设备及存储介质
CN113781404A (zh) * 2021-08-19 2021-12-10 浙江大学 基于自监督预训练的道路病害检测方法和系统
CN113781404B (zh) * 2021-08-19 2023-12-01 浙江大学 基于自监督预训练的道路病害检测方法和系统
CN113673622A (zh) * 2021-08-31 2021-11-19 三一专用汽车有限责任公司 激光点云数据标注方法、装置、设备及产品
CN113705716B (zh) * 2021-09-03 2023-10-10 北京百度网讯科技有限公司 图像识别模型训练方法、设备、云控平台及自动驾驶车辆
CN113837394A (zh) * 2021-09-03 2021-12-24 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 多特征视图数据标签预测方法、系统与可读存储介质
CN113705716A (zh) * 2021-09-03 2021-11-26 北京百度网讯科技有限公司 图像识别模型训练方法、设备、云控平台及自动驾驶车辆
CN114092798A (zh) * 2021-10-26 2022-02-25 北京工业大学 一种基于半监督学习策略的火灾实例分割方法
WO2023077821A1 (zh) * 2021-11-07 2023-05-11 西北工业大学 基于多清晰度集成自训练的小样本低质量图像目标检测方法
CN113869333A (zh) * 2021-11-29 2021-12-31 山东力聚机器人科技股份有限公司 基于半监督关系度量网络的图像识别方法及装置
CN114154578A (zh) * 2021-12-02 2022-03-08 内蒙古工业大学 面向非平衡数据基于半监督分布式训练的任务识别方法
CN114154578B (zh) * 2021-12-02 2023-10-31 内蒙古工业大学 面向非平衡数据基于半监督分布式训练的任务识别方法
CN114359956B (zh) * 2021-12-09 2024-05-10 华南理工大学 一种基于图像转换的半监督行人检测方法
CN114359956A (zh) * 2021-12-09 2022-04-15 华南理工大学 一种基于图像转换的半监督行人检测方法
CN114972725A (zh) * 2021-12-30 2022-08-30 华为技术有限公司 模型训练方法、可读介质和电子设备
CN114972725B (zh) * 2021-12-30 2023-05-23 华为技术有限公司 模型训练方法、可读介质和电子设备
CN114969321B (zh) * 2022-03-14 2024-03-22 北京工业大学 基于多权重自训练的环境类投诉举报文本分类方法
CN114969321A (zh) * 2022-03-14 2022-08-30 北京工业大学 基于多权重自训练的环境类投诉举报文本分类方法
WO2023202596A1 (zh) * 2022-04-19 2023-10-26 华为技术有限公司 一种半监督模型训练方法、系统及相关设备
CN114881129A (zh) * 2022-04-25 2022-08-09 北京百度网讯科技有限公司 一种模型训练方法、装置、电子设备及存储介质
CN115018066B (zh) * 2022-05-23 2024-04-09 北京计算机技术及应用研究所 一种边端模式下的深度神经网络本地化训练方法
CN115292728A (zh) * 2022-07-15 2022-11-04 浙江大学 一种基于生成对抗网络的图像数据隐私保护方法
CN115292728B (zh) * 2022-07-15 2023-08-04 浙江大学 一种基于生成对抗网络的图像数据隐私保护方法
CN115512696A (zh) * 2022-09-20 2022-12-23 中国第一汽车股份有限公司 模拟训练方法及车辆
CN115272777B (zh) * 2022-09-26 2022-12-23 山东大学 面向输电场景的半监督图像解析方法
CN115272777A (zh) * 2022-09-26 2022-11-01 山东大学 面向输电场景的半监督图像解析方法
CN115482418A (zh) * 2022-10-09 2022-12-16 宁波大学 基于伪负标签的半监督模型训练方法、系统及应用
CN115482418B (zh) * 2022-10-09 2024-06-07 北京呈创科技股份有限公司 基于伪负标签的半监督模型训练方法、系统及应用
CN115496955B (zh) * 2022-11-18 2023-03-24 之江实验室 图像分类模型训练方法、图像分类方法、设备和介质
CN115496955A (zh) * 2022-11-18 2022-12-20 之江实验室 图像分类模型训练方法、图像分类方法、设备和介质
CN116051985A (zh) * 2022-12-20 2023-05-02 中国科学院空天信息创新研究院 一种基于多模型互馈学习的半监督遥感目标检测方法
CN116051985B (zh) * 2022-12-20 2023-06-23 中国科学院空天信息创新研究院 一种基于多模型互馈学习的半监督遥感目标检测方法
CN115984653A (zh) * 2023-02-14 2023-04-18 中南大学 一种动态智能货柜商品识别模型的构建方法
CN115984653B (zh) * 2023-02-14 2023-08-01 中南大学 一种动态智能货柜商品识别模型的构建方法
CN117197472A (zh) * 2023-11-07 2023-12-08 四川农业大学 基于鼻出血内窥镜影像的高效师生半监督分割方法及装置
CN117197472B (zh) * 2023-11-07 2024-03-08 四川农业大学 基于鼻出血内窥镜影像的高效师生半监督分割方法及装置
CN117932073A (zh) * 2024-03-21 2024-04-26 智慧眼科技股份有限公司 一种基于提示工程的弱监督文本分类方法及系统
CN117932073B (zh) * 2024-03-21 2024-05-28 智慧眼科技股份有限公司 一种基于提示工程的弱监督文本分类方法及系统

Also Published As

Publication number Publication date
CN112232416B (zh) 2021-09-14

Similar Documents

Publication Publication Date Title
CN112232416B (zh) 一种基于伪标签加权的半监督学习方法
CN109949317B (zh) 基于逐步对抗学习的半监督图像实例分割方法
CN114241282B (zh) 一种基于知识蒸馏的边缘设备场景识别方法及装置
CN108960073B (zh) 面向生物医学文献的跨模态图像模式识别方法
CN107133569B (zh) 基于泛化多标记学习的监控视频多粒度标注方法
EP3767536A1 (en) Latent code for unsupervised domain adaptation
CN110580496A (zh) 一种基于熵最小化的深度迁移学习系统及方法
CN111783841B (zh) 基于迁移学习和模型融合的垃圾分类方法、系统及介质
JP7310351B2 (ja) 情報処理方法及び情報処理装置
CN109919302B (zh) 一种用于图像的神经网络的训练方法及装置
CN111104831B (zh) 一种视觉追踪方法、装置、计算机设备以及介质
CN114863091A (zh) 一种基于伪标签的目标检测训练方法
CN111239137B (zh) 基于迁移学习与自适应深度卷积神经网络的谷物质量检测方法
Zhang et al. Fine-grained vehicle recognition using lightweight convolutional neural network with combined learning strategy
CN111126155A (zh) 一种基于语义约束生成对抗网络的行人再识别方法
CN112750128B (zh) 图像语义分割方法、装置、终端及可读存储介质
CN115829983B (zh) 一种基于知识蒸馏的高速工业场景视觉质量检测方法
CN111797935A (zh) 基于群体智能的半监督深度网络图片分类方法
CN115797642A (zh) 基于一致性正则化与半监督领域自适应图像语义分割算法
CN116681961A (zh) 基于半监督方法和噪声处理的弱监督目标检测方法
US20230401829A1 (en) Training machine learning models based on unlabeled data
CN115861239A (zh) 一种基于元学习的小样本工业零件表面缺陷检测方法
CN115965078A (zh) 分类预测模型训练方法、分类预测方法、设备及存储介质
CN115797701A (zh) 目标分类方法、装置、电子设备及存储介质
CN115661539A (zh) 一种嵌入不确定性信息的少样本图像识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant