CN112232416A

CN112232416A - 一种基于伪标签加权的半监督学习方法

Info

Publication number: CN112232416A
Application number: CN202011109339.7A
Authority: CN
Inventors: 程战战; 李铎; 吴飞; 浦世亮
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2020-10-16
Filing date: 2020-10-16
Publication date: 2021-01-15
Anticipated expiration: 2040-10-16
Also published as: CN112232416B

Abstract

本申请提供一种基于伪标签加权的半监督学习方法，所述方法包括：获取待训练的有标签和无标签样本，得到有标签和无标签训练集；在有标签训练集上进行模型训练，得到有标签训练模型；基于有标签训练模型对无标签训练集进行预测，得到无标签训练集的伪标签；输入伪标签至标签适配模块，得到加权后的伪标签；基于深度神经网络对获取的有标签训练集和伪标签训练集进行训练，得到半监督学习后的机器学习模型。本发明能够对含有无标签的数据场景进行半监督训练，在不对无标签数据进行标注情况下，进一步提高模型的场景适应能力，有效解决典型的开集误报问题、类别间误报问题和漏报问题，从而得到更高的模型性能。

Description

一种基于伪标签加权的半监督学习方法

技术领域

本发明涉及半监督领域，尤其涉及一种基于伪标签加权的半监督学习方法。

背景技术

在半监督学习算法中，为了让模型能够从无标签数据的样本分布p(x)中获取知识，需要借助无标签数据的后验分布p(y|x)来推断其类别。针对样本分布，在半监督学习研究中通常存在以下三个重要假设。1.平滑假设，如果两个数据点x1,x2相似，那么它们相应输出y1,y2也应当类似。2.聚类假设，无论是有标注还是未标注数据，它们都是服从一定的数据分布的。3.流形假设，该假设认为由于数据内部特征的限制，数据大多都存在维度冗余的情况，因而能够被嵌入到某个低维空间中，同时保持数据内部的局部空间结构。基于上述三个假设，能够从不同方面开展半监督算法的研究，利用无标签数据帮助实现样本区分。由于半监督学习解决的主要问题是如何有效利用未标注数据，提升在有标注数据上模型训练的效果。不论使用了什么样的方案，都绕不开的话题是如何给未标注数据打标签以及如何防止在利用这些伪标签时的过拟合现象。已有的方法大多是基于数据扩增、模型预测结果一致性、损失正则等方式，虽然能够起到一定的半监督学习效果，但是并没有从根本上解决伪标签质量的问题。伪标签质量的好坏直接决定了半监督算法学习出的模型性能，而这些已有方法都完全忽略了这个问题。本申请提出的基于伪标签加权方法，首先能够利用置信度信息筛选高质量的伪标签用于训练，同时能够有效利用中低置信度的含有噪声的伪标签，保证数据的充分利用。我们的方法能够有效地解决半监督学习中典型的开集误报问题、类别间误报问题和漏报问题。

发明内容

本发明的目的是克服现有技术的不足，提供一种基于伪标签加权的半监督学习方法。

本发明具体采用的技术方案如下：

一种基于伪标签加权的半监督学习方法，其包括如下步骤：

S1、获取待训练的有标签和无标签样本，得到有标签训练集和无标签训练集；具体包括S101～S104：

S101、获取用于半监督训练的有标签样本集合，表示为有标签训练集X＝{X₁，X₂，…，X_N}，其中N为有标签训练集中样本数目，X₁，X₂，…，X_N分别为第1，2，…，N个有标签样本；

S102、获取有标签训练集X中每条样本对应的可训练标签Y＝{Y₁，Y₂，…，Y_N}，，Y₁，Y₂，…，Y_N分别为X₁，X₂，…，X_N对应的可训练标签；

S103、获取用于半监督训练的无标签样本集合，表示为无标签训练集U＝{U₁，U₂，…，U_M}，其中M为无标签训练集中样本数目，U₁，U₂，…，U_M分别为第1，2，…，M个无标签样本；

S104、对于样本特征提取器而言，每个用来训练的样本被表示为二元组(X_i，Y_i)，i∈{1，…，N}；

S2、在有标签训练集上进行模型训练，得到有标签训练模型，记作第一模型；具体包括S201～S203：

S201、使用深度神经网络将每条样本X_i映射到标签空间，深度神经网络最后一层输出的为预测标签值；

S202、构建一个目标函数，使得深度神经网络预测的标签值与对应图像的真值标签值一致，对训练样本定义的损失函数为：

其中，P(Y_i|(X_i，θ))是第i个训练样本在给定(X_i，θ)时求解其真值标签Y_i时的期望，θ为深度神经网络中所有可学习的参数；

S203、根据损失函数

对深度神经网络进行反向回馈以得到深度神经网络的各层的参数θ，根据学习得到的深度神经网络的参数，提取样本在深度神经网络中各个层次的特征表达；将此时的深度神经网络记为第一模型；

S3、基于有标签训练的第一模型对无标签训练集进行预测，得到无标签训练集的伪标签，记作第一伪标签；伴随第一伪标签，第一模型同时生成描述该伪标签可信程度的“置信度”；

S4、将获取的第一伪标签输入至标签适配模块，得到加权后的伪标签，记作第二伪标签；具体包括S401～S403：

S401、输入第一伪标签至设定的标签适配模块，标签适配模块对输入的第一伪标签进行权值调整，输出加权后的伪标签，记作第二伪标签；

S402、对于样本特征提取器而言，每个用来训练的无标签样本被表示为二元组(U_i，Z_i)，i∈{1，…，M}，Z_i是第i个无标签样本U_i对应的可训练伪标签；

S403、在标签适配模块中通过确定置信度阈值进行伪标签筛选；伪标签筛选基于多个模型预测的置信度或者基于单个模型预测的置信度；当采用基于多个模型预测的置信度时，有多个模型共同预测一个伪标签的置信度，最终是否使用该伪标签或排除依据多模型投票，如果预测的置信度高于置信度阈值的模型数目多于预测的置信度低于置信度阈值的模型数目，当前伪标签归为继续使用的伪标签；否则当前伪标签将被筛除不用；当采用基于单个模型预测的置信度时，是否使用该伪标签或排除依据的是单个置信度阈值；

S5、基于获取的有标签训练集和第二伪标签对第一模型进行训练，得到半监督训练后的机器学习模型，记作第二模型；具体包括S501～S505：

S501、将有标签样本集X或无标签训练集U合并，得到混合训练样本集S＝{S₁，S₂，…，S_M+N}，其中M+N为混合样本集合中样本数目，S_i为混合样本集合中第i个样本；

S502、构造混合训练样本集S中每条样本对应的可训练标签Y′＝{Y′₁，Y′₂，…，Y′_M+N}，当S_i对应于有标签训练集样本时，其对应的标签为真值标签，当S_i对应于无标签训练集样本时，其对应的标签为第二伪标签；

S503、对于样本特征提取器而言，每个用来训练的样本被表示为二元组(S_i，Y_i′)，i∈{1，…，M′+N′}，Y_i′是样本S_i对应的可训练标签，M′和N′分别为对有标签训练集和无标签训练集中样本的采样数目；

S504、使用第一模型将每条混合训练样本集中的样本映射到标签空间，即最后一层输出的为预测标签值；

S505、构建一个目标函数，使得神经网络预测的标签值与对应图像的真值或伪标签值一致，对训练样本定义的损失函数为：

其中，P(Y_i′|(S_i，θ′)是第i个训练样本在给定(S_i，θ′)时求解其真值标签Y_i′时的期望，θ′为深度神经网络中所有可学习参数；

S506、根据损失函数

对第一模型进行反向回馈以得到深度神经网络的各层的参数θ′，将此时的深度神经网络记为第二模型；根据学习得到的深度神经网络的参数，提取样本在第二模型中各个层次的特征表达。

作为优选，所述的步骤S2中，P(Y_i|(X_i，θ))的表现形式与训练任务场景相关：

当进行分类任务时，期望函数P(Y_i|(X_i，θ))定义为交叉熵损失，其公式为：

P(Y_i|(X_i，θ))＝-Y_ilogY_i ^{^}

其中，Y_i是标签真值，Y_i ^{^}是归一化后的预测概率值；

当进行回归任务时，期望函数P(Y_i|(X_i，θ))为均方差损失，其公式为：

P(Y_i|(I_i，θ))＝-||Y_i-Y_i ^{^}||₂

其中：||·||₂为二范数。

作为优选，所述的步骤S5中，P(Y_i′|(S_i，θ′)的表现形式与训练任务场景相关：

当进行分类任务时，期望函数P(Y_i′|(S_i，θ′)定义为交叉熵损失，其公式为：

P(Y_i′|(S_i，θ′)＝-Y_i′logY_i′^

其中，Y_i′是标签真值，Y_i′^是归一化后的预测概率值；

当进行回归任务时，期望函数P(Y_i′|(S_i，θ′)为均方差损失，其公式为：

P(Y_i′|(S_i，θ′)＝-||Y_i′-Y_i′^||₂

其中：||·||₂为二范数。

作为优选，所述的步骤S5中，当M′为0时，表示只基于无标签训练集和进行半监督训练，适应于端侧训练场景；当M′不为0时，表示同时基于有标签和无标签样本数据进行半监督训练，适应于中心端的训练场景。

作为优选，所述的步骤S3中，所述伪标签的“置信度”由第一模型与其他模型组合预测产生；该“置信度”的学习对象是样本的分类准确度，或者是一个样本的回归准确度，或是样本的分类准确度和回归准确度的组合，或者是目标检测任务中IOU的大小，或是其他能够描述当前样本属于正样本的可能性的统计量；对于无标注训练样本(U_i，Z_i)，i∈{1，…，M}，其置信度记为c_i。

作为优选，所述的步骤S4中，标签适配模块对输入的伪标签进行权值设定，输出加权后的伪标签，设计的加权策略为：

当进行分类任务时，期望函数P′(Y_i|(X_i，θ))为：

P′(Y_i|(X_i，θ))＝f(c_i)P(Y_i|(X_i，θ))＝-f(c_i)Y_ilogY_i^

其中，f(·)是非线性映射函数，用于把无标注训练样本的置信度c_i映射成损失权重f(·)；Y_i是标签真值，Y_i^是归一化后的预测概率值；

当进行回归任务时，期望函数P′(Y_i|(X_i，θ))为均方差损失，公式为：

P′(Y_i|(X_i，θ))＝f(c_i)P(Y_i|(I_i，θ))＝-f(c_i)||Y_i-Y_i^||₂。

其中：||·||₂为二范数。

作为优选，所述的步骤S4中，所述置信度阈值的根据不同类别的数据分布情况来确定，对于类别k，其伪标签置信度的阈值为：

其中，k表示第k个类别，S_k(t)表示大于阈值t的类别k的样本数量，γ为超参数，T是超参数，S_k(T)表示置信度超过T的伪标签样本的总数量。

作为优选，所述的半监督学习方法适用于图像分类、图像识别、目标检测、图像分割、语音识别、序列学习以及其他相关任务的多种应用；根据算法任务中的损失函数类别，根据所述的步骤S3和步骤S4中的损失加权方法进行半监督学习；对于复杂的任务，需相应地把步骤S3和步骤S4的损失加权方式结合使用。

本发明与背景技术相比，具有的有益的效果是：本发明与背景技术相比，具有的有益的效果是：本发明针对通用场景的半监督学习问题提出了一种基于伪标签加权的半监督学习方法。相对于已有方法，本方案的优势在于能够自适应生成高质量的伪标签，同时有效利用中低质量的伪标签，使训练出的模型性能更高、避免自监督过拟合的情况，有效解决典型的开集误报问题、类别间误报问题和漏报问题，从而得到更高的模型性能。该方法从实际应用角度出发，仅仅对伪标签进行优化即可使用无标签数据进行半监督训练，同时可选有标签数据同步训练，能够同时适应端侧场景(无标签数据训练)和中心侧场景(有标签数据+无标签数据训练)。基于本发明，在应用场景中部署时，半监督算法能够支持设备中模型的自我升级。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。

图1是本发明实施例提供的一种基于伪标签加权的半监督学习方法流程图。

图2是本发明实施例提供的一种基于伪标签加权的半监督学习方法的标签适配模块算法流程图。

图3是本发明实施例提供的一种基于伪标签加权的半监督学习方法的伪标签加权的半监督学习方法动态阈值计算过程示意图

图4是本发明实施例提供的一种基于伪标签加权的半监督学习方法的损失加权映射曲线图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为了解决现有技术中存在的问题，本发明实施例提供了一种基于伪标签加权的半监督学习方法，如图1所示，包括如下步骤：

S1、获取待训练的有标签和无标签样本，得到有标签训练集和无标签训练集。

S2、在有标签训练集上进行模型训练，得到有标签训练模型，记作第一模型。

S3、基于有标签训练的第一模型对无标签训练集进行预测，得到无标签训练集的伪标签，记作第一伪标签；伴随第一伪标签，第一模型同时生成描述该伪标签可信程度的“置信度”。

S4、将获取的第一伪标签输入至标签适配模块，得到加权后的伪标签，记作第二伪标签。

S5、基于获取的有标签训练集和第二伪标签对第一模型进行训练，得到半监督训练后的机器学习模型，记作第二模型。

上述S1～S5步骤为本发明方法的核心步骤，下面基于上述核心步骤对其在本实施例中的具体实现方式进行进一步详细描述。

在上述发明实施例中，首先通过构建图像训练样本及对应的训练标签，因此S1的具体子步骤包括S101～S104：

S101、获取用于半监督训练的有标签样本集合，表示为有标签训练集X＝{X₁，X₂，…，X_N}，其中N为有标签训练集中样本数目，X₁，X₂，…，X_N分别为第1，2，…，N个有标签样本。

S102、获取有标签训练集X中每条样本对应的可训练标签Y＝{Y₁，Y₂，…，Y_N}，，Y₁，Y₂，…，Y_N分别为X₁，X₂，…，X_N对应的可训练标签。

S103、获取用于半监督训练的无标签样本集合，表示为无标签训练集U＝{U₁，U₂，…，U_M}，其中M为无标签训练集中样本数目，U₁，U₂，…，U_M分别为第1，2，…，M个无标签样本。

S104、对于样本特征提取器而言，每个用来训练的样本被表示为二元组(X_i，Y_i)，i∈{1，…，N}。

另外，S2的具体子步骤包括S201～S203：

S201、使用深度神经网络将每条样本X_i映射到标签空间，深度神经网络最后一层输出的为预测标签值。

其中，P(Y_i|(X_i，θ))是第i个训练样本在给定(X_i，θ)时求解其真值标签Y_i时的期望，θ为深度神经网络中所有可学习的参数。

而且P(Y_i|(X_i，θ))的表现形式与训练任务场景相关：

P(Y_i|(X_i，θ))＝-Y_ilogY_i^

其中，Y_i是标签真值，Y_i^是归一化后的预测概率值；

P(Y_i|(I_i，θ))＝-||Y_i-Y_i^||₂

其中：||·||₂为二范数。

S203、根据损失函数

对深度神经网络进行反向回馈以得到深度神经网络的各层的参数θ，根据学习得到的深度神经网络的参数，提取样本在深度神经网络中各个层次的特征表达；将此时的深度神经网络记为第一模型。

另外，在步骤S3中，伪标签的“置信度”由第一模型与其他模型组合预测产生。该“置信度”的学习对象是样本的分类准确度，或者是一个样本的回归准确度，或是样本的分类准确度和回归准确度的组合，或者是目标检测任务中IOU的大小，或是其他能够描述当前样本属于正样本的可能性的统计量；对于无标注训练样本(U_i，Z_i)，i∈{1，…，M}，其置信度记为c_i。

另外，S4的具体子步骤包括S401～S403：

S401、输入第一伪标签至设定的标签适配模块，标签适配模块对输入的第一伪标签进行权值调整，输出加权后的伪标签，记作第二伪标签。

此处对第一伪标签进行权值调整时设计的加权策略根据任务形式不同而不同，分别为：

当进行分类任务时，期望函数P′(Y_i|(X_i，θ))为：

P′(Y_i|(X_i，θ))＝f(c_i)P(Y_i|(X_i，θ))＝-f(c_i)Y_ilogY_i^

其中，f(·)是非线性映射函数，用于把无标注训练样本的置信度c_i映射成损失权重f(·)；对于正样本，该映射函数把高置信度伪标签的权重比例提升，把中低置信度伪标签的权重比例降低；对于负样本，该映射函数把低置信度伪标签的权重比例提升，把中低置信度伪标签的权重比例降低。这样能够实现更信任置信度接近0和1的伪标签，对于中间置信度的伪标签持怀疑态度进行学习。Y_i是标签真值，Y_i^是归一化后的预测概率值；

P′(Y_i|(X_i，θ))＝f(c_i)P(Y_i|(I_i，θ))＝-f(c_i)||Y_i-Y_i^||₂。

其中：||·||₂为二范数。

S402、对于样本特征提取器而言，每个用来训练的无标签样本被表示为二元组(U_i，Z_i)，i∈{1，…，M}，Z_i是第i个无标签样本U_i对应的可训练伪标签。

S403、在标签适配模块中通过确定置信度阈值进行伪标签筛选；伪标签筛选基于多个模型预测的置信度或者基于单个模型预测的置信度；当采用基于多个模型预测的置信度时，有多个模型共同预测一个伪标签的置信度，最终是否使用该伪标签或排除依据多模型投票，如果预测的置信度高于置信度阈值的模型数目多于预测的置信度低于置信度阈值的模型数目，当前伪标签归为继续使用的伪标签；否则当前伪标签将被筛除不用；当采用基于单个模型预测的置信度时，是否使用该伪标签或排除依据的是单个置信度阈值。

其中置信度阈值的根据不同类别的数据分布情况来确定，对于类别k，其伪标签置信度的阈值为：

另外，S5的具体子步骤包括S501～S505：

S501、将有标签样本集X或无标签训练集U合并，得到混合训练样本集S＝{S₁，S₂，…，S_M+N}，其中M+N为混合样本集合中样本数目，S_i为混合样本集合中第i个样本。

S502、构造混合训练样本集S中每条样本对应的可训练标签Y′＝{Y′₁，Y′₂，…，Y′_M+N}，当S_i对应于有标签训练集样本时，其对应的标签为真值标签，当S_i对应于无标签训练集样本时，其对应的标签为第二伪标签。

S503、对于样本特征提取器而言，每个用来训练的样本被表示为二元组(S_i，Y_i′)，i∈{1，…，M′+N′}，Y_i′是样本S_i对应的可训练标签，M′和N′分别为对有标签训练集和无标签训练集中样本的采样数目。

此处，当M′为0时，表示只基于无标签训练集和进行半监督训练，适应于端侧训练场景(如摄像头)；当M′不为0时，表示同时基于有标签和无标签样本数据进行半监督训练，适应于中心端的训练场景(如服务器)。

S504、使用第一模型将每条混合训练样本集中的样本映射到标签空间，即最后一层输出的为预测标签值。

其中，P(Y_i′|(S_i，θ′)是第i个训练样本在给定(S_i，θ′)时求解其真值标签Y_i′时的期望，θ′为深度神经网络中所有可学习参数。

同样的，P(Y_i′|(S_i，θ′)的表现形式与训练任务场景相关：

P(Y_i′|(S_i，θ))＝-Y_i′logY_i′^

其中，Y_i′是标签真值，Y_i′^是归一化后的预测概率值；

P(Y_i′|(S_i，θ′)＝-||Y_i′-Y_i′^||₂

其中：||·||₂为二范数。

S506、根据损失函数

本发明提供的半监督学习方法适用于图像分类、图像识别、目标检测、图像分割、语音识别、序列学习以及其他相关任务的多种应用。根据算法任务中的损失函数类别，根据所述的步骤S3和步骤S4中的损失加权方法进行半监督学习；对于复杂的任务，需相应地把步骤S3和步骤S4的损失加权方式结合使用。

由此，本发明能够对含有无标签的数据场景进行半监督训练，在不对无标签数据进行标注情况下，进一步提高模型的场景适应能力。为了进一步说明本发明的技术效果，下面基于一个具体案例来展示上述基于伪标签加权的半监督学习方法在具体任务上的实现效果。

实施例

本实施例中，为了验证本发明的效果，方法实现步骤与前述步骤相同，即步骤S1～S5，在此不再进行赘述。模型训练的整体流程如图1所示。下面就部分实施过程和实施结果进行展示如前述S1～S5所示，以证明该方法在半监督目标检测效果：

1).获取公开目标检测数据集MSCOCO(https：//cocodataset.org/)

2).在有标注数据集上分别训练教师和学生网络。

3).在未标注集上使用教师网络预测伪标签。如果是单模型，直接使用单模型预测结果作为伪标签；如果教师由多模型组成，则按照图示2的方式，进行投票来选择伪标签。把生成的伪标签存储在一个临时文件中，以便后续训练使用。

4).基于伪标签的置信度分布情况，确定动态阈值

计算过程如以下公式：

5).基于伪标签置信度，进行非线性映射，计算每个伪标签对于损失函数的贡献权值。当进行分类任务时，期望函数P′(Y_i|(X_i，θ))为：

P′(Yi|(X_i，θ))＝f(_ci)P(Yi|(X_i，θ))＝-f(_ci)Yilo_gYi^

其中，f(·)是非线性映射函数，把置信度c_i映射成损失权重f(·)。Yi是标签真值，Yi^是归一化后的预测概率值。对于正样本，该映射函数把高置信度伪标签的权重比例提升，把中低置信度伪标签的权重比例降低；对于负样本，该映射函数把低置信度伪标签的权重比例提升，把中低置信度伪标签的权重比例降低。这样能够实现更信任置信度接近0和1的伪标签，对于中间置信度的伪标签持怀疑态度进行学习。Yi是标签真值，Yi^是归一化后的预测概率值。一种非线性映射的示例为图示4，横坐标是置信度，纵坐标是映射后的损失权重。

当进行回归任务时，期望函数P′(Yi|(X_i，θ))为均方差损失，其公式为：

P′(Yi|(X_i，θ))＝f(_ci)P(Yi|(I_i，θ))＝-f(_ci)||Yi-Yi^||2

6).在有标注数据集和未标注数据集上对学生网络进行半监督训练，其中未标注数据集由标签适配后的伪标签提供监督信号，并且进行损失加权。训练前后的伪标签预测、损失加权等流程，如图示3所示。

本实施例的最终结果表明，本发明能够自适应生成高质量的伪标签，同时有效利用中低质量的伪标签，使训练出的模型性能更高、避免自监督过拟合的情况，有效解决典型的开集误报问题、类别间误报问题和漏报问题，从而得到更高的模型性能。

以上所述仅为本申请的较佳实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本申请的保护范围内。

Claims

1.一种基于伪标签加权的半监督学习方法，其特征在于包括如下步骤：

S203、根据损失函数

S403、在标签适配模块中通过确定置信度阈值进行伪标签筛选；伪标签筛选基于多个模型预测的置信度或者基于单个模型预测的置信度；当采用基于多个模型预测的置信度时，有多个模型共同预测一个伪标签的置信度，最终是否使用该伪标签或排除依据多模型投票，如果预测的置信度高于置信度阈值的模型数目多于预测的置信度低于置信度阈值的模型数目，当前伪标签归为继续使用的伪标签；否则当前伪标签将被筛除不用；当采用基于单个模型预测的置信度时，是否使用该伪标签或排除依据的是单个置信度阈值；S5、基于获取的有标签训练集和第二伪标签对第一模型进行训练，得到半监督训练后的机器学习模型，记作第二模型；具体包括S501～S505：

S506、根据损失函数

2.如权利要求1所述的一种基于伪标签加权的半监督学习方法，其特征在于，所述的步骤S2中，P(Y_i|(X_i，θ))的表现形式与训练任务场景相关：

P(Y_i|(X_i，θ))＝-Y_ilogY_i^

其中，Y_i是标签真值，Y_i^是归一化后的预测概率值；

P(Y_i|(I_i，θ))＝-||Y_i-Y_i^||₂

其中：||·||₂为二范数。

3.如权利要求1所述的一种基于伪标签加权的半监督学习方法，其特征在于，所述的步骤S5中，P(Y_i′|(S_i，θ′)的表现形式与训练任务场景相关：

P(Y_i′|(S_i，θ′)＝-Y_i′logY_i′^

其中，Y_i′是标签真值，Y_i′^是归一化后的预测概率值；

P(Y_i′|(S_i，θ′)＝-||Y_i′-Y_i′^||₂

其中：||·||₂为二范数。

4.如权利要求1所述的一种基于伪标签加权的半监督学习方法，其特征在于，所述的步骤S5中，当M′为0时，表示只基于无标签训练集和进行半监督训练，适应于端侧训练场景；当M′不为0时，表示同时基于有标签和无标签样本数据进行半监督训练，适应于中心端的训练场景。

5.如权利要求1所述的一种基于伪标签加权的半监督学习方法，其特征在于，所述的步骤S3中，所述伪标签的“置信度”由第一模型与其他模型组合预测产生；该“置信度”的学习对象是样本的分类准确度，或者是一个样本的回归准确度，或是样本的分类准确度和回归准确度的组合，或者是目标检测任务中IOU的大小，或是其他能够描述当前样本属于正样本的可能性的统计量；对于无标注训练样本(U_i，Z_i)，i∈{1，…，M}，其置信度记为c_i。

6.如权利要求1所述的一种基于伪标签加权的半监督学习方法，其特征在于，所述的步骤S4中，标签适配模块对输入的伪标签进行权值设定，输出加权后的伪标签，设计的加权策略为：

当进行分类任务时，期望函数P′(Y_i|(X_i，θ))为：

P′(Y_i|(X_i，θ))＝f(c_i)P(Y_i|(X_i，θ))＝-f(c_i)Y_ilogY_i^

P′(Y_i|(X_i，θ))＝f(c_i)P(Y_i|(I_i，θ))＝-f(c_i)||Y_i-Y_i^||₂。

其中：||·||₂为二范数。

7.如权利要求1所述的一种基于伪标签加权的半监督学习方法，其特征在于，所述的步骤S4中，所述置信度阈值的根据不同类别的数据分布情况来确定，对于类别k，其伪标签置信度的阈值为：

其中，k表示第k个类别，S_k(t)表示大于阈值t的类别k的样本数量，γ为超参数，T是超参数，Sk(T)表示置信度超过T的伪标签样本的总数量。

8.如权利要求1所述的一种基于伪标签加权的半监督学习方法，其特征在于，所述的半监督学习方法适用于图像分类、图像识别、目标检测、图像分割、语音识别、序列学习以及其他相关任务的多种应用；根据算法任务中的损失函数类别，根据所述的步骤S3和步骤S4中的损失加权方法进行半监督学习；对于复杂的任务，需相应地把步骤S3和步骤S4的损失加权方式结合使用。