CN109886342A

CN109886342A - 基于机器学习的模型训练方法和装置

Info

Publication number: CN109886342A
Application number: CN201910141312.7A
Authority: CN
Inventors: 别晓辉; 徐盼盼; 别伟成; 单书畅
Original assignee: Sirui (hangzhou) Information Technology Co Ltd
Current assignee: Sirui (hangzhou) Information Technology Co Ltd
Priority date: 2019-02-26
Filing date: 2019-02-26
Publication date: 2019-06-14

Abstract

本发明公开了一种基于机器学习的模型训练方法和装置。其中，该方法包括：从产品样本中获取标注数据和无标注数据；根据标注数据得到第一损失函数；根据无标注数据得到第二损失函数；根据第一损失函数和第二损失函数对产品样本进行迭代训练，得到训练模型，其中，训练模型用于对产品的质量进行检测。本发明解决了工业检测中需要标注样本数据量大，标注数据成本高的技术问题。

Description

基于机器学习的模型训练方法和装置

技术领域

本发明涉及工业质检领域，具体而言，涉及一种基于机器学习的模型训练方法和装置。

背景技术

随着计算机技术的快速发展，深度学习成为了机器学习领域的热点。其中，机器学习在语音识别、图像识别等领域得到了广泛的推广。

当前深度学习广泛基于监督学习，需要大量的标注数据对模型进行训练，然而在实际的生产中，例如，工业质检领域，需要收集足够的标注样本，收集大量的标注样本不仅费时费力，而且还可能由于产能等多重因素的限制使得标注样本的收集比较困难。另一方面，在实际的生产中，大量存在没有标注的数据，例如在工业领域，工厂车间里每天有源源不断的工业产品在产出。另外，这些没有标注的数据也具有一定的价值，但现有的深度学习技术无法对没有标注的数据进行利用。

同时，图像识别在实际应用中通常具有尺度伸缩的需求，仍以工业质检为例，不同的客户对产品的品质要求不同，例如，面向低端市场的通常对产品的质量要求较低，而面向高端市场的通常对产品的质量要求较高，不同的客户需求反应在技术上则需要图像识别的结果具有伸缩可控性。

由上述内容可知，图像识别技术应用在工业检测场景存在标注样本数据量大，标注数据成本高的问题，还存在不同需求的检测场景中，检测尺度难以自由伸缩的问题。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种基于机器学习的模型训练方法和装置，以至少解决工业检测中需要标注样本数据量大，标注数据成本高的技术问题。

根据本发明实施例的一个方面，提供了一种基于机器学习的模型训练方法，包括：从产品样本中获取标注数据和无标注数据；根据标注数据得到第一损失函数；根据无标注数据得到第二损失函数；根据第一损失函数和第二损失函数对产品样本进行迭代训练，得到训练模型，其中，训练模型用于对产品的质量进行检测。

根据本发明实施例的另一方面，还提供了一种基于机器学习的模型训练装置，包括：第获取模块，用于从产品样本中获取标注数据和无标注数据；第一处理模块，用于根据标注数据得到第一损失函数；第二处理模块，用于根据无标注数据得到第二损失函数；训练模块，用于根据第一损失函数和第二损失函数对产品样本进行迭代训练，得到训练模型，其中，训练模型用于对产品的质量进行检测。

根据本发明实施例的另一方面，还提供了一种存储介质，该存储介质包括存储的程序，其中，在程序运行时控制存储介质所在设备执行基于机器学习的模型训练方法。

根据本发明实施例的另一方面，还提供了一种处理器，该处理器用于运行程序，其中，程序运行时执行基于机器学习的模型训练方法。

在本发明实施例中，采用无标注数据进行机器学习的模型训练的方式，在从产品样本中获取标注数据和无标注数据之后，通过标注数据得到第一损失函数，并根据无标注数据得到第二损失函数，根据第一损失函数和第二损失函数对产品样本进行迭代训练，从而得到用于对产品的质量进行检测的训练模型。

在上述过程中，由于无标注数据参与到了机器学习的模型的训练过程中，使得得到的训练模型的预测精度得到了提升。另外，由于采用了无标注数据对训练模型的训练，从而减少了标注数据的数据量，降低了标注数据的成本，减轻了获取标注数据的负担。

由此可见，本申请所提供的方案达到了降低标注数据的成本的目的，从而实现了工业检测中样本标注的成本的技术效果，进而解决了工业检测中需要标注样本数据量大，标注数据成本高的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的一种基于机器学习的模型训练方法流程图；

图2是根据本发明实施例的一种可选的深度学习分类网络的示意图；

图3是根据现有技术的一种监督学习的训练流程示意图；

图4是根据本发明实施例的一种可选的基于机器学习的模型训练方法流程图；以及

图5是根据本发明实施例的一种基于机器学习的模型训练装置结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例1

根据本发明实施例，提供了一种基于机器学习的模型训练方法实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本发明实施例的基于机器学习的模型训练方法流程图，如图1所示，该方法包括如下步骤：

步骤S102，从产品样本中获取标注数据和无标注数据。

需要说明的是，上述标注数据可以为通过人工进行标注的数据，而无标注数据为未进行过标注的数据。可选的，产品样本中包括标注数据和无标注数据，标注数据的数据量小于无标注数据的数据量。

步骤S104，根据标注数据得到第一损失函数。

步骤S106，根据无标注数据得到第二损失函数。

需要说明的是，为了对训练模型进行训练，需要计算损失函数来描述网络对分类的精度，其中，损失函数越小，得到的模型的分类越精确，模型越可靠。可选的，上述第一损失函数为基于监督学习所得到的损失函数，第二损失函数为基于无监督学习所得到的损失函数。

步骤S108，根据第一损失函数和第二损失函数对产品样本进行迭代训练，得到训练模型，其中，训练模型用于对产品的质量进行检测。

可选的，在得到第一损失函数和第二损失函数之后，可计算整个产品样本所对应的总损失函数，并基于总损失函数对产品样本进行迭代训练，使得总损失函数最小时，所得到的训练模型为最优的训练模型，基于该训练模型对产品进行质量检测时，得到的检测结果更加精确。

基于上述步骤S102至步骤S108所限定的方案，可以获知，采用无标注数据进行机器学习的模型训练的方式，在从产品样本中获取标注数据和无标注数据之后，通过标注数据得到第一损失函数，并根据无标注数据得到第二损失函数，根据第一损失函数和第二损失函数对产品样本进行迭代训练，从而得到用于对产品的质量进行检测的训练模型。

容易注意到的是，由于无标注数据参与到了机器学习的模型的训练过程中，使得得到的训练模型的预测精度得到了提升。另外，由于采用了无标注数据对训练模型的训练，从而减少了标注数据的数据量，降低了标注数据的成本，减轻了获取标注数据的负担。

可选的，如图2示出了深度学习分类网络的示意图。其中，x_i,1、x_i,2、x_i,3为样本数据，y₁、y₂、y₃分别为样本数据输出该标签所对应的概率。另外，图2中前后两层可通过卷积完成数据的向前传播，具体公式如下：

最后再通过softmax分类器输出网络预测为每个标签的概率：

可选的，图3示出了一种现有的监督学习的训练流程示意图。具体的，在输入样本数据x之后，通过人工标注的方式得到样本数据x对应标签y。然后随机为训练模型填充参数，得到样本数据x对应的预测样本y′。然后根据标签y和预测样本y′计算得到损失函数，并确定梯度下降的方向，通过不断地迭代更新参数和反向传播，从而降低损失函数的数值，对模型中的参数进行优化，得到最终的训练模型。

由上述内容可知，现有的监督学习模型仅对标注数据进行训练，忽略了无标注数据，导致训练模型的预测精度不高。另外，现有的监督学习模型主要采用标注数据进行模型训练，需要标注数据的数据量比较大，而对大量的数据进行标注，增加了模型训练的成本。

对此，本申请所提供了将标注数据与无标注数据相结合对模型进行训练的方式，其中，基于无标注数据得到损失函数的方法可以包括两种，即静态先验方式和动态调整方式。

可选的，在生产一批样本或产品时，可根据经验确定生产数据的模型分布，即通过静态先验方式来达到充分利用未标注数据计算第二损失函数。具体的，首先获取无标注数据对应的先验分布概率以及无标注数据的样本个数，然后确定每个无标注数据的样本的输出概率，最后根据先验分布概率、样本个数以及输出概率确定第二损失函数。其中，上述过程可转换为如下公式：

在上式中，L^unsupervise为第二损失函数。n表示一个批次(batch size)输出的样本个数；p_k(x)表示第k个样本输出的概率；p_model(x)表示先验的输入概率分布。

需要说明的是，在实际应用中，参数n的值需大于预设阈值，因为如果参数n的值过小，则表明无标注数据的数据量较小，从而无法反映整个未标注数据的分布p_model(x)。通常，参数n的取值为192～256中的任意一个。另外，采用静态先验方式对模型进行训练可以大幅度提升模型的泛化能力。

此外，还需要说明的是，通过对先验分布p_model(x)进行调整，可以使得图像识别预测输出伸缩可控，能够适应不同客户的需求。此外，静态先验方式可以大幅度提高模型的泛化能力，但静态先验方式依赖于静态先验。如果当前的生产的环境、机器出现故障时，静态先验方式中的先验经验与实际生成情况不符，如果继续采用静态先验方式则会降低模型的预测准确度。对此，可以采用动态调整方式来自适应根据实际情况进行动态调整。

具体的，首先基于动态预测模型对无标注数据进行处理，得到第一标签，然后根据第一标签确定第二损失函数。具体公式如下：

在上式中，y_k,i与人工标注的y′_k,i不同，y_k,i是通过动态预测得到的。具体的，首先获取预设数量的标注数据，然后基于动态预测模型以及标注数据对无标注数据进行预测处理，得到第一标签。具体公式如下：

由上式可知，y_k,i是由带有少量标注数据的监督学习对未标注数据进行预测，然后通过对预测的概率值进行四舍五入得到的。

可选的，根据标注数据得到第一损失函数的方法可以采用现有技术中的计算方法。具体的，首先获取标注数据对应的第二标签以及标注数据对应的预测标签，然后根据第二标签以及预测标签得到第一损失函数。具体公式如下：

在上式中，L^supervise为第一损失函数，y′_k,i为预测标签。

需要说明的是，由于制造技术的发展，实际生产中出现缺陷的样本远远小于“过关”的样本。而监督学习则需要大量的“过关”以及缺陷的样本，从而才能训练出具有较强泛化能力的模型。但实际应用中，不易收集大量缺陷样本，对此，本申请采用少量的缺陷以及“过关”的样本，以及大量的未标注的样本，进行模型的训练，从而降低了数据收集的难度。

进一步地，在通过上述过程得到第一损失函数和第二损失函数之后，可根据第一损失函数和第二损失函数对产品样本进行迭代训练。具体的，首先获取第一损失函数对应的第一权重值和第二损失函数对应的第二权重值，然后根据第一权重值以及第二权重值对第一损失函数和第二损失函数进行权重求和，得到第三损失函数，最后根据第三损失函数对产品样本进行迭代训练，得到训练模型。

其中，第三损失函数满足下式：

L＝λ₁L^supervise+λ₂*L^unsupervise

在上式中，L为第三损失函数，λ₁为第一权重值，λ₂为第二权重值，可选的，λ₁可以为1。

在得到了第三损失函数之后，可进一步根据第三损失函数对产品样本进行迭代训练，得到训练模型。具体的，首先检测第三损失函数对应的函数值，在函数值小于预设函数值的情况下，确定函数值对应的模型为训练模型；在函数值大于等于预设函数值的情况下，对第一损失函数和第二损失函数进行更新，并基于更新后的第一损失函数和更新后的第二损失函数对产品样本进行迭代训练，直至函数值小于预设函数值。

可选的，图4示出了本申请所提供的基于机器学习的模型训练方法流程图。由图4可知，本申请采用了有监督学习方式和无监督学习方式对模型进行训练。首先，通过输入标注数据x和对应的标签y，输入无标注数据u以及先验分布p，然后通过对标注数据x预测，得到第一预测样本y′，根据标签y和第一预测样本y′计算得到第一损失函数。通过对无标注数据u，得到第二预测样本y″，根据第二预测样本y″和先验分布p计算得到第二损失函数。然后对第一损失函数和第二损失函数进行加权求和，得到第三损失函数。最后，根据第三损失函数确定梯度下降的方向，并更新参数，反向传播，直至得到符合条件的第三损失函数，此时，第三损失函数所对应的模型为最优的训练模型。

由上述内容可知，通过把先验分布模型引入深度学习的训练过程，利用该分布模型来近似的模拟无标签数据的分布，进而以此为依据构造模型训练的损失函数来指导训练过程，从而使得无标签数据能够很好的参与机器学习模型的训练过程，提升模型的预测精度，同时输入的分布模型也可以作为调节模型预测的尺度的参数，从而能够应对不同的需求场景。

实施例2

根据本发明实施例，还提供了一种基于机器学习的模型训练装置实施例，其中，图5是根据本发明实施例的基于机器学习的模型训练装置结构示意图，如图5所示，该装置包括：获取模块501、第一处理模块503、第二处理模块505以及训练模块507。

其中，获取模块501，用于从产品样本中获取标注数据和无标注数据；第一处理模块503，用于根据标注数据得到第一损失函数；第二处理模块505，用于根据无标注数据得到第二损失函数；训练模块507，用于根据第一损失函数和第二损失函数对产品样本进行迭代训练，得到训练模型，其中，训练模型用于对产品的质量进行检测。

此处需要说明的是，上述获取模块501、第一处理模块503、第二处理模块505以及训练模块507对应于上述实施例的步骤S102至步骤S108，四个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例所公开的内容。

在一种可选的方案中，第二处理模块包括：第一获取模块、第二获取模块、第一确定模块以及第二确定模块。其中，第一获取模块，用于获取无标注数据对应的先验分布概率；第二获取模块，用于获取无标注数据的样本个数；第一确定模块，用于确定每个无标注数据的样本的输出概率；第二确定模块，用于根据先验分布概率、样本个数以及输出概率确定第二损失函数。

在一种可选的方案中，第二处理模块包括：第三处理模块以及第三确定模块。其中，第三处理模块，用于基于动态预测模型对无标注数据进行处理，得到第一标签；第三确定模块，用于根据第一标签确定第二损失函数。

在一种可选的方案中，第三处理模块包括：第三获取模块以及第四处理模块。其中，第三获取模块，用于获取预设数量的标注数据；第四处理模块，用于基于动态预测模型以及标注数据对无标注数据进行预测处理，得到第一标签。

在一种可选的方案中，第一处理模块包括：第四获取模块以及第五处理模块。其中，第四获取模块，用于获取标注数据对应的第二标签以及标注数据对应的预测标签；第五处理模块，用于根据第二标签以及预测标签得到第一损失函数。

在一种可选的方案中，训练模块包括：第五获取模块、第六获取模块、第六处理模块以及第七处理模块。其中，第五获取模块，用于获取第一损失函数对应的第一权重值；第六获取模块，用于获取第二损失函数对应的第二权重值；第六处理模块，用于根据第一权重值以及第二权重值对第一损失函数和第二损失函数进行权重求和，得到第三损失函数；第七处理模块，用于根据第三损失函数对产品样本进行迭代训练，得到训练模型。

在一种可选的方案中，第七处理模块包括：检测模块、第四确定模块以及更新模块。其中，检测模块，用于检测第三损失函数对应的函数值；第四确定模块，用于在函数值小于预设函数值的情况下，确定函数值对应的模型为训练模型；更新模块，用于在函数值大于等于预设函数值的情况下，对第一损失函数和第二损失函数进行更新，并基于更新后的第一损失函数和更新后的第二损失函数对产品样本进行迭代训练，直至函数值小于预设函数值。

实施例3

根据本发明实施例的另一方面，还提供了一种存储介质，该存储介质包括存储的程序，其中，在程序运行时控制存储介质所在设备执行上述实施例1中的基于机器学习的模型训练方法。

实施例4

根据本发明实施例的另一方面，还提供了一种处理器，该处理器用于运行程序，其中，程序运行时执行上述实施例1中的基于机器学习的模型训练方法。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于机器学习的模型训练方法，其特征在于，包括：

从产品样本中获取标注数据和无标注数据；

根据所述标注数据得到第一损失函数；

根据所述无标注数据得到第二损失函数；

根据所述第一损失函数和所述第二损失函数对所述产品样本进行迭代训练，得到训练模型，其中，所述训练模型用于对产品的质量进行检测。

2.根据权利要求1所述的方法，其特征在于，根据所述无标注数据得到第二损失函数，包括：

获取所述无标注数据对应的先验分布概率；

获取所述无标注数据的样本个数；

确定每个所述无标注数据的样本的输出概率；

根据所述先验分布概率、所述样本个数以及所述输出概率确定所述第二损失函数。

3.根据权利要求1所述的方法，其特征在于，根据所述无标注数据得到第二损失函数，包括：

基于动态预测模型对所述无标注数据进行处理，得到第一标签；

根据所述第一标签确定所述第二损失函数。

4.根据权利要求3所述的方法，其特征在于，基于动态预测模型对所述无标注数据进行处理，得到第一标签，包括：

获取预设数量的标注数据；

基于所述动态预测模型以及所述标注数据对所述无标注数据进行预测处理，得到所述第一标签。

5.根据权利要求1所述的方法，其特征在于，根据所述标注数据得到第一损失函数，包括：

获取所述标注数据对应的第二标签以及所述标注数据对应的预测标签；

根据所述第二标签以及所述预测标签得到所述第一损失函数。

6.根据权利要求1所述的方法，其特征在于，根据所述第一损失函数和所述第二损失函数对所述产品样本进行迭代训练，包括：

获取所述第一损失函数对应的第一权重值；

获取所述第二损失函数对应的第二权重值；

根据所述第一权重值以及所述第二权重值对所述第一损失函数和所述第二损失函数进行权重求和，得到第三损失函数；

根据所述第三损失函数对所述产品样本进行迭代训练，得到所述训练模型。

7.根据权利要求6所述的方法，其特征在于，根据所述第三损失函数对所述产品样本进行迭代训练，得到所述训练模型，包括：

检测所述第三损失函数对应的函数值；

在所述函数值小于预设函数值的情况下，确定所述函数值对应的模型为所述训练模型；

在所述函数值大于等于所述预设函数值的情况下，对所述第一损失函数和所述第二损失函数进行更新，并基于更新后的第一损失函数和更新后的第二损失函数对所述产品样本进行迭代训练，直至所述函数值小于所述预设函数值。

8.一种基于机器学习的模型训练装置，其特征在于，包括：

获取模块，用于从产品样本中获取标注数据和无标注数据；

第一处理模块，用于根据所述标注数据得到第一损失函数；

第二处理模块，用于根据所述无标注数据得到第二损失函数；

训练模块，用于根据所述第一损失函数和所述第二损失函数对所述产品样本进行迭代训练，得到训练模型，其中，所述训练模型用于对产品的质量进行检测。

9.一种存储介质，其特征在于，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行权利要求1至7中任意一项所述的基于机器学习的模型训练方法。

10.一种处理器，其特征在于，所述处理器用于运行程序，其中，所述程序运行时执行权利要求1至7中任意一项所述的基于机器学习的模型训练方法。