CN110298415A

CN110298415A - 一种半监督学习的训练方法、系统和计算机可读存储介质

Info

Publication number: CN110298415A
Application number: CN201910766533.3A
Authority: CN
Inventors: 别晓辉; 徐盼盼; 别伟成; 单书畅
Original assignee: Sirui (hangzhou) Information Technology Co Ltd
Current assignee: Sirui (hangzhou) Information Technology Co Ltd
Priority date: 2019-08-20
Filing date: 2019-08-20
Publication date: 2019-10-01
Anticipated expiration: 2039-08-20
Also published as: CN110298415B

Abstract

本发明提供一种半监督学习的训练方法、系统和计算机可读存储介质，所述方法包括：对历史标注样本进行聚类，计算得到聚类中心；接收新的标注样本和未标注样本；根据模型计算标注样本的预测标签，结合预测标签与实际标签求得第一损失函数；对比分析未标注样本和聚类中心的历史标注样本的一致性，并计算得到第二损失函数；结合第一损失函数和第二损失函数，并采用预设的半监督学习算法优化模型的参数。本发明只要标注少量的样本，极大降低了标注过程的成本；利用少量的标注样本，来引导大量的未标注样本进行特征训练，充分发挥了未标注样本的作用，可以进一步辅助模型的训练，提高模型的预测能力。

Description

一种半监督学习的训练方法、系统和计算机可读存储介质

技术领域

本发明涉及深度学习技术领域，尤其涉及一种半监督学习的训练方法、系统和计算机可读存储介质。

背景技术

近年来，深度学习呈现井喷式的发展，在图像、语音、文字等多个领域的技术上，取得了全面的突破。以深度学习为主要技术的AI公司如雨后春笋般迅速崛起和发展，并带来许多典型的AI应用场景，如人脸检测、图像识别、语音识别、文字识别、智能监控、场景识别等。这些AI技术已经渗透到人们工作和生活的方方面面，比如手机上的人脸解锁、支付宝的“刷脸”支付、手机拍照时的美颜效果、人脸检测等。这些成功的背后，除了硬件的不断的革新，深度学习算法的不断突破外，更为重要的是日益增大的数据规模。

在这些深度学习技术中，应用最为广泛的还是监督学习，即训练过程中所有的数据都是有标注的。在监督学习中，收集大量标注数据对于提高深度学习模型的识别或者检测准确率非常重要。但是，在实际应用中，图像的标注是一件非常费时费力的事，特别是在工业生产领域，要想使识别精度达到生产要求，收集各类样本需要投入大量的人力物力，而且经常还受到产能的限制，使收集工作几乎难以实现。在此背景之下，一种半监督学习技术应运而生，它旨在通过少量的标注样本和大量的未标注数据来提供高度模型的性能。这也是本专利研究的主要内容。

到目前为止，关于半监督学习的研究工作越来越多，而且也越来越成熟。其中，一类较为常见的思路或方法，是通过增加一些规则约束项来惩罚同样的数据在不同扰动下的一致性，或者强化数据之间的相关性。这类方法可以缓解因少量标注数据而产生的过拟合现象，并能生成一个更稳定、更鲁棒的映射模型。他们甚至在一些公开的数据集上，已经取得了不亚于监督学习的成绩。然而，这些方法在设计约束的时候，将所有样本进行平等对待，忽略了标注数据和非标注数据之间的本质区别，即相比于非标注数据，标注数据具有更多的有效信息。

当前的半监督学习可大致分为三类：1）基于图模型的半监督学习，2）基于扰动的半监督学习，3）基于生成模型的半监督学习。

1）基于图模型的半监督学习

基于图模型的学习方法定义了一种相似性图。图中的顶点表示输入样本，边表示样本之间的相似性。基于样本之间的相似性，将有标签的样本在整个图上进行不断的传播，从而完成对未标注样本进行标签预测。其中，这种相似性通常是用高斯核函数来进行计算的。简而言之，在训练时，这类方法除了需要优化一个带标签数据的监督学习损失函数外，还需要增加一个基于图的正则化约束。目前，一些人提出一种标签扩散的半监督学习方法：首先度量了有标签数据与其邻域之间的相似性，然后基于这种相似性将标签传递到未标注的数据上。另一些人提出了一种子图划分的方法，即先在子图上进行标签的扩散，然后全局优化子图之间的信息。这些方法都是通过动态的构图相似图来辅助进行监督学习的任务，但这些方法没有考虑到不同扰动下模型的鲁棒性和平滑性，因此通过训练获得到的模型在性能上要远远低于最新的半监督学习方法。

2）基于扰动的半监督学习

当对输入样本进行不同的扰动时，通过深度模型得到预测值应该是一致的。基于这种假设，很多扰动的半监督学习方法陆续被提出来。比如，Rasmus等人约束在噪声干扰下，同一个样本其对应的预测标签应该保持一致。Laine等人提出了II 模型和TemporalEnsembling模型。II模型在对输入进行不同扰动和dropout条件下，对样本进行两次预测，并约束它们的预测值应该是一致的。进而，Temporal Ensembling模型通过对训练样本进行指数移动的均值（Exponential Moving Average，简称EMA）预测，来提升预测值得鲁棒性。Tarvainen等人提出使用EMA来均值化模型的权重，从而可以进一步提升模型的性能。这是因为相比于直接进行模型预测，均值化操作可以平滑一些不稳定的噪声，产生更为准确的模型。与II 模型类似，Miyato等人也是约束样本对扰动的鲁棒性，但是不同的是使用了对抗扰动。Luo等人在对扰动的鲁棒性基础上，约束了相似样本之间应该保持平滑的过渡。这些方法虽然在一些公开的数据集上，可以取得令人惊艳的结果，但是他们将标注样本和非标注样本等同对待。

3）基于生成模型的半监督学习

生成模型很早就已经应用到半监督学习中。它采用一个概率模型，, 其中是一个可识别的混合模型，比如高斯概率混合模型。早期的基于生成模型的半监督学习方法主要通过估计条件概率分布或者联合分布，来生成样样本x。最近，以VAE（Variational Auto-encoder）为代表的深度生成模型越来越流行。它们将变分方法应用到深度学习中，通过生成对抗网络（Generative Adversarial Networks，简称GAN）。GAN生成的样本可以被认为是一种数据增强。举例而言，生成的“假”样本往往分布在低密度区域，从而可以引导分类器去更好地定位它们的边界，进而提升了分类器的鲁棒性。基于生成模型的半监督学习方法虽然可以提升模型的性能，获得一些不错的结果。但是这类方法要大量的时间来对进行对抗模拟和优化，而且往往很难收敛。

发明内容

为了解决上述至少一个技术问题，本发明提出了一种半监督学习的训练方法、系统和计算机可读存储介质。

为了实现上述目的，本发明第一方面提出了一种半监督学习的训练方法，所述方法包括：

对历史标注样本进行聚类，计算得到聚类中心；

接收新的标注样本和未标注样本；

根据模型计算标注样本的预测标签，结合预测标签与实际标签求得第一损失函数；

对比分析未标注样本和聚类中心的历史标注样本的一致性，并计算得到第二损失函数；

结合第一损失函数和第二损失函数，并采用预设的半监督学习算法优化模型的参数。

本方案中，对比分析未标注样本和聚类中心的历史标注样本的一致性，并计算得到第二损失函数，具体包括：

选定未标注样本和聚类中心的历史标注样本中的对应特征进行比对分析，并基于二者特征的偏差来计算得到第二损失函数。

本方案中，在采用预设的半监督学习算法优化模型的参数之后，所述方法还包括：

判断新的标注样本和未标注样本是否遍历一遍；

若否，则重新进入步骤“接收新的标注样本和未标注样本”以进行下一次迭代；若是，则进入步骤“对历史标注样本进行聚类，计算得到聚类中心” 以进行下一次迭代。

本方案中，所述聚类中心的计算方式如下：

其中，表示标记样本属于第k类的概率；分类函数由特征抽取器和最终的线性分类器构成，计算公式为。

本方案中，所述第二损失函数的计算公式为：

其中，为未标注样本的集合，K为聚类中心的集合，其是由模型在上一次迭代时计算而来，为截断函数，以防止最小值低于0；

当权重趋向于1时，上述计算公式的第一项占据主导地位，引导样本的特征靠近聚类中心；反之，上述计算公式的第二项占据主导地位，强迫样本的特征远离聚类中心。

本方案中，预设的半监督学习算法为指数移动平均加权算法。

本方案中，所述半监督学习为Mean Teacher，其包括“student”模型和“teacher”模型，所述“teacher”模型是通过对一系列的“student”模型进行加权而来的，所述“student”模型的训练与监督学习训练方式相一致。

本发明第二方面还提出一种半监督学习的训练系统，所述半监督学习的训练系统包括：存储器及处理器，所述存储器中包括一种半监督学习的训练方法程序，所述半监督学习的训练方法程序被所述处理器执行时实现如下步骤：

对历史标注样本进行聚类，计算得到聚类中心；

接收新的标注样本和未标注样本；

本方案中，在采用预设的半监督学习算法优化模型的参数之后，还包括：

判断新的标注样本和未标注样本是否遍历一遍；

本发明第三方面还提出一种计算机可读存储介质，所述计算机可读存储介质中包括一种半监督学习的训练方法程序，所述半监督学习的训练方法程序被处理器执行时，实现如上述的一种半监督学习的训练方法的步骤。

本发明只要标注少量的样本，极大降低了标注过程的成本；利用少量的标注样本，来引导大量的未标注样本进行特征训练，充分发挥了未标注样本的作用，可以进一步辅助模型的训练，提高模型的预测能力。同时，本发明也能达到不亚于监督学习的精度，可直接应用到实际的工业检测中。

本发明的附加方面和优点将在下面的描述部分中给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

图1示出了本发明一种半监督学习的训练方法的流程图；

图2示出了本发明半监督学习方法Mean Teacher的流程框图；

图3示出了本发明一种特征引导的构造示意图；

图4示出了本发明一种半监督学习的训练系统的框图；

图5示出了本发明一实施例的半监督学习的训练方法的流程图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的其他方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

图1示出了本发明一种半监督学习的训练方法的流程图。

如图1所示，本发明第一方面提出一种半监督学习的训练方法，所述方法包括：

S102，对历史标注样本进行聚类，计算得到聚类中心；

S104，接收新的标注样本和未标注样本；

S106，根据模型计算标注样本的预测标签，结合预测标签与实际标签求得第一损失函数；

S108，对比分析未标注样本和聚类中心的历史标注样本的一致性，并计算得到第二损失函数；

S110，结合第一损失函数和第二损失函数，并采用预设的半监督学习算法优化模型的参数。

需要说明的是，本发明的技术方案可以在PC、手机、PAD等终端设备中进行操作。

需要说明的是，第一损失函数是基于标准的监督学习分类任务形成的，第二损失函数是基于半监督学习项形成的；优选的，预设的半监督学习算法可以为指数移动平均加权算法（EMA算法），但不限于此。

需要说明的，在仅有少量的标注样本时，如何最大化地利用标注样本来引导未标注样本进行特征学习，从而可极大地提高模型的泛化能力。本发明主要是基于如下假设：未标注样本的潜在结构与标注样本的潜在结构是相似的，即这两种类型的样本数据分布是类似的。在此基础上，本发明使用从标注样本中学到的特征来引导未标注样本进行特征学习，从而可以很好地利用大量的未标注数据。

可以理解，使用少量的标注样本来引导大量的未标注样本进行特征学习，使其与标注样本具有相似的内在特征结构，其实相当于对扩充了标注样本的数据量，有助于提高模型的泛化能力。所述的引导是在特征空间进行操作，能够挖掘数据潜在的结构信息，避免无用信息的干扰。

可以理解，本发明使用标注样本来引导大量的未标注样本进行特征训练，充分发挥易于获取的大量未标注样本的作用。

进一步的，对比分析未标注样本和聚类中心的历史标注样本的一致性，并计算得到第二损失函数，具体包括：

进一步的，在采用预设的半监督学习算法优化模型的参数之后，所述方法还包括：

判断新的标注样本和未标注样本是否遍历一遍；

如图2所示，本发明在基于装配的半监督学习方法（比如Mean Teacher）的基础上，引入了一种新的引导约束，从而引导未标注样本进行特征学习。

半监督学习方法Mean Teacher主要有两个模型构成，“student”模型和“teacher”模型。“student”模型的训练跟监督学习训练方式是一致的。“teacher”模型是通过对一系列的“student”模型进行加权而来的。在这里，Mean Teacher方法使用的是指数移动平均加权（Exponential Moving Average, 简称EMA）。相比于直接使用最终更新的参数模型，对迭代过程中每次得到的参数模型进行加权，往往能够产生更为正确的结果。

根据本发明的实施例，所述聚类中心的计算方式如下：

进一步的，为了有效地使用标注数据来引导未标注数据进行特征学习，首先构造了一个相似性图，如图3所示，用来描述标注数据和未标注数据之间的相似性关系。图的顶点表示标注数据和未标注数据的特征，图的边表示特征点之间的相似性，如图3(a) 所示。为了进一步提高引导的效果，对标注数据在特征空间进行聚类，并以每个聚类作为引导的代表点，如图 3(c) 所示。

根据本发明的实施例，第二损失函数的计算公式为：

可以理解，上述参数为“student”模型的权重，上述参数为“teacher”模型的权重。

可以理解，通过第二损失函数可以形成对未标注样本数据的正则化约束，来引导未标注样本数据进行特征学习，从而有利于进一步提升模型的分类精度。具体而言，对于每个相似图（如图3所示），正则约束项的目的为：1）引导未标注的特征尽可能靠近与其相似的聚类的中心；2）强迫未标注样本的特征远离与其不相似的聚类中心。

本发明的半监督学习的训练方法充分发挥标注数据对未标注数据的引导作用，从而使得大量的未标注数据可以学到一些更有意义的特征，进而辅助整个模型进行训练。相比之前的半监督学习方法，本发明使标注数据学到特征具有很强的指导性，因此赋予其更大的权重，以引导未标注数据进行特征训练。

图4示出了本发明一种半监督学习的训练系统的框图。

如图4所示，本发明第二方面还提出一种半监督学习的训练系统4，所述半监督学习的训练系统4包括：存储器41及处理器42，所述存储器41中包括一种半监督学习的训练方法程序，所述半监督学习的训练方法程序被所述处理器42执行时实现如下步骤：

对历史标注样本进行聚类，计算得到聚类中心；

接收新的标注样本和未标注样本；

需要说明的是，本发明的系统可以在PC、手机、PAD等终端设备中进行操作。

需要说明的是，所述处理器可以是中央处理单元（Central Processing Unit，CPU），还可以是其他通用处理器、数字信号处理（Digital Signal Processor，DSP）、专用集成电路（Application Specific Integrated Circuit，ASIC）、现成可编程门阵列（Field-Programmable Gate Array，FPGA）或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

判断新的标注样本和未标注样本是否遍历一遍；

根据本发明的实施例，本发明在基于装配的半监督学习方法（比如Mean Teacher）的基础上，引入了一种新的引导约束，从而引导未标注样本进行特征学习。

根据本发明的实施例，所述聚类中心的计算方式如下：

根据本发明的实施例，第二损失函数的计算公式为：

本发明的半监督学习的训练系统充分发挥标注数据对未标注数据的引导作用，从而使得大量的未标注数据可以学到一些更有意义的特征，进而辅助整个模型进行训练。相比之前的半监督学习方法，本发明使标注数据学到特征具有很强的指导性，因此赋予其更大的权重，以引导未标注数据进行特征训练。

为了进一步解释本发明的技术方案，下面以一实施例进行具体说明。

如图5所示，在本实施例中，半监督学习的训练流程具体包括如下步骤：

对历史标注样本进行聚类，计算得到聚类中心；

输入新的标注样本X_L和未标注样本X_U；

预测标注样本，与标签求得loss，记为第一损失函数L_S；

对未标注样本和聚类中心的历史标注样本计算一致性loss，记为第二损失函数L_C；

结合L_S和L_C，并使用指数移动平均加权算法（EMA算法），优化更新“teacher”模型参数；

判断样本数据是否遍历一遍；

若是，则进入上述第一步以进行下一次迭代；若否，则进入上述第二步以进行下一次迭代。

本发明提出的半监督学习的训练方法、系统和计算机可读存储介质，能够最大化发挥标注样本的指导性，从而引导未标注样本进行有效的特征学习；未标注样本的特征训练反哺于监督学习网络，从而进一步提升模型的性能和泛化能力。

在工业检测中，监督学习需要大量的标注数据，但获取足够的标注数据成本较高且难以实现；而本发明只需少量的标注数据，就能引导未标注样本进行特征训练，获得较高的精度，极大地降低了获取标注数据的负担。即使使用少量的标注数据，本发明也能达到不亚于监督学习的精度，使其可以真正的应用到实际工业生产和检测中来。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元；既可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本发明各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机、服务器、或者网络设备等）执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种半监督学习的训练方法，其特征在于，所述方法包括：

对历史标注样本进行聚类，计算得到聚类中心；

接收新的标注样本和未标注样本；

2.根据权利要求1所述的一种半监督学习的训练方法，其特征在于，对比分析未标注样本和聚类中心的历史标注样本的一致性，并计算得到第二损失函数，具体包括：

3.根据权利要求1所述的一种半监督学习的训练方法，其特征在于，在采用预设的半监督学习算法优化模型的参数之后，所述方法还包括：

判断新的标注样本和未标注样本是否遍历一遍；

4.根据权利要求3所述的一种半监督学习的训练方法，其特征在于，所述聚类中心的计算方式如下：

5.根据权利要求4所述的一种半监督学习的训练方法，其特征在于，所述第二损失函数的计算公式为：

6.根据权利要求1所述的一种半监督学习的训练方法，其特征在于，预设的半监督学习算法为指数移动平均加权算法。

7.根据权利要求1所述的一种半监督学习的训练方法，其特征在于，所述半监督学习为Mean Teacher，其包括“student”模型和“teacher”模型，所述“teacher”模型是通过对一系列的“student”模型进行加权而来的，所述“student”模型的训练与监督学习训练方式相一致。

8.一种半监督学习的训练系统，其特征在于，所述半监督学习的训练系统包括：存储器及处理器，所述存储器中包括一种半监督学习的训练方法程序，所述半监督学习的训练方法程序被所述处理器执行时实现如下步骤：

对历史标注样本进行聚类，计算得到聚类中心；

接收新的标注样本和未标注样本；

9.根据权利要求8所述的一种半监督学习的训练系统，其特征在于，在采用预设的半监督学习算法优化模型的参数之后，还包括：

判断新的标注样本和未标注样本是否遍历一遍；

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中包括一种半监督学习的训练方法程序，所述半监督学习的训练方法程序被处理器执行时，实现如权利要求1至7中任一项所述的一种半监督学习的训练方法的步骤。