CN109886342A - 基于机器学习的模型训练方法和装置 - Google Patents

基于机器学习的模型训练方法和装置 Download PDF

Info

Publication number
CN109886342A
CN109886342A CN201910141312.7A CN201910141312A CN109886342A CN 109886342 A CN109886342 A CN 109886342A CN 201910141312 A CN201910141312 A CN 201910141312A CN 109886342 A CN109886342 A CN 109886342A
Authority
CN
China
Prior art keywords
loss function
labeled data
training
model
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910141312.7A
Other languages
English (en)
Inventor
别晓辉
徐盼盼
别伟成
单书畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sirui (hangzhou) Information Technology Co Ltd
Original Assignee
Sirui (hangzhou) Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sirui (hangzhou) Information Technology Co Ltd filed Critical Sirui (hangzhou) Information Technology Co Ltd
Priority to CN201910141312.7A priority Critical patent/CN109886342A/zh
Publication of CN109886342A publication Critical patent/CN109886342A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于机器学习的模型训练方法和装置。其中,该方法包括:从产品样本中获取标注数据和无标注数据;根据标注数据得到第一损失函数;根据无标注数据得到第二损失函数;根据第一损失函数和第二损失函数对产品样本进行迭代训练,得到训练模型,其中,训练模型用于对产品的质量进行检测。本发明解决了工业检测中需要标注样本数据量大,标注数据成本高的技术问题。

Description

基于机器学习的模型训练方法和装置
技术领域
本发明涉及工业质检领域,具体而言,涉及一种基于机器学习的模型训练方法和装置。
背景技术
随着计算机技术的快速发展,深度学习成为了机器学习领域的热点。其中,机器学习在语音识别、图像识别等领域得到了广泛的推广。
当前深度学习广泛基于监督学习,需要大量的标注数据对模型进行训练,然而在实际的生产中,例如,工业质检领域,需要收集足够的标注样本,收集大量的标注样本不仅费时费力,而且还可能由于产能等多重因素的限制使得标注样本的收集比较困难。另一方面,在实际的生产中,大量存在没有标注的数据,例如在工业领域,工厂车间里每天有源源不断的工业产品在产出。另外,这些没有标注的数据也具有一定的价值,但现有的深度学习技术无法对没有标注的数据进行利用。
同时,图像识别在实际应用中通常具有尺度伸缩的需求,仍以工业质检为例,不同的客户对产品的品质要求不同,例如,面向低端市场的通常对产品的质量要求较低,而面向高端市场的通常对产品的质量要求较高,不同的客户需求反应在技术上则需要图像识别的结果具有伸缩可控性。
由上述内容可知,图像识别技术应用在工业检测场景存在标注样本数据量大,标注数据成本高的问题,还存在不同需求的检测场景中,检测尺度难以自由伸缩的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种基于机器学习的模型训练方法和装置,以至少解决工业检测中需要标注样本数据量大,标注数据成本高的技术问题。
根据本发明实施例的一个方面,提供了一种基于机器学习的模型训练方法,包括:从产品样本中获取标注数据和无标注数据;根据标注数据得到第一损失函数;根据无标注数据得到第二损失函数;根据第一损失函数和第二损失函数对产品样本进行迭代训练,得到训练模型,其中,训练模型用于对产品的质量进行检测。
根据本发明实施例的另一方面,还提供了一种基于机器学习的模型训练装置,包括:第获取模块,用于从产品样本中获取标注数据和无标注数据;第一处理模块,用于根据标注数据得到第一损失函数;第二处理模块,用于根据无标注数据得到第二损失函数;训练模块,用于根据第一损失函数和第二损失函数对产品样本进行迭代训练,得到训练模型,其中,训练模型用于对产品的质量进行检测。
根据本发明实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行基于机器学习的模型训练方法。
根据本发明实施例的另一方面,还提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行基于机器学习的模型训练方法。
在本发明实施例中,采用无标注数据进行机器学习的模型训练的方式,在从产品样本中获取标注数据和无标注数据之后,通过标注数据得到第一损失函数,并根据无标注数据得到第二损失函数,根据第一损失函数和第二损失函数对产品样本进行迭代训练,从而得到用于对产品的质量进行检测的训练模型。
在上述过程中,由于无标注数据参与到了机器学习的模型的训练过程中,使得得到的训练模型的预测精度得到了提升。另外,由于采用了无标注数据对训练模型的训练,从而减少了标注数据的数据量,降低了标注数据的成本,减轻了获取标注数据的负担。
由此可见,本申请所提供的方案达到了降低标注数据的成本的目的,从而实现了工业检测中样本标注的成本的技术效果,进而解决了工业检测中需要标注样本数据量大,标注数据成本高的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种基于机器学习的模型训练方法流程图;
图2是根据本发明实施例的一种可选的深度学习分类网络的示意图;
图3是根据现有技术的一种监督学习的训练流程示意图;
图4是根据本发明实施例的一种可选的基于机器学习的模型训练方法流程图;以及
图5是根据本发明实施例的一种基于机器学习的模型训练装置结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,提供了一种基于机器学习的模型训练方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的基于机器学习的模型训练方法流程图,如图1所示,该方法包括如下步骤:
步骤S102,从产品样本中获取标注数据和无标注数据。
需要说明的是,上述标注数据可以为通过人工进行标注的数据,而无标注数据为未进行过标注的数据。可选的,产品样本中包括标注数据和无标注数据,标注数据的数据量小于无标注数据的数据量。
步骤S104,根据标注数据得到第一损失函数。
步骤S106,根据无标注数据得到第二损失函数。
需要说明的是,为了对训练模型进行训练,需要计算损失函数来描述网络对分类的精度,其中,损失函数越小,得到的模型的分类越精确,模型越可靠。可选的,上述第一损失函数为基于监督学习所得到的损失函数,第二损失函数为基于无监督学习所得到的损失函数。
步骤S108,根据第一损失函数和第二损失函数对产品样本进行迭代训练,得到训练模型,其中,训练模型用于对产品的质量进行检测。
可选的,在得到第一损失函数和第二损失函数之后,可计算整个产品样本所对应的总损失函数,并基于总损失函数对产品样本进行迭代训练,使得总损失函数最小时,所得到的训练模型为最优的训练模型,基于该训练模型对产品进行质量检测时,得到的检测结果更加精确。
基于上述步骤S102至步骤S108所限定的方案,可以获知,采用无标注数据进行机器学习的模型训练的方式,在从产品样本中获取标注数据和无标注数据之后,通过标注数据得到第一损失函数,并根据无标注数据得到第二损失函数,根据第一损失函数和第二损失函数对产品样本进行迭代训练,从而得到用于对产品的质量进行检测的训练模型。
容易注意到的是,由于无标注数据参与到了机器学习的模型的训练过程中,使得得到的训练模型的预测精度得到了提升。另外,由于采用了无标注数据对训练模型的训练,从而减少了标注数据的数据量,降低了标注数据的成本,减轻了获取标注数据的负担。
由此可见,本申请所提供的方案达到了降低标注数据的成本的目的,从而实现了工业检测中样本标注的成本的技术效果,进而解决了工业检测中需要标注样本数据量大,标注数据成本高的技术问题。
可选的,如图2示出了深度学习分类网络的示意图。其中,xi,1、xi,2、xi,3为样本数据,y1、y2、y3分别为样本数据输出该标签所对应的概率。另外,图2中前后两层可通过卷积完成数据的向前传播,具体公式如下:
最后再通过softmax分类器输出网络预测为每个标签的概率:
可选的,图3示出了一种现有的监督学习的训练流程示意图。具体的,在输入样本数据x之后,通过人工标注的方式得到样本数据x对应标签y。然后随机为训练模型填充参数,得到样本数据x对应的预测样本y′。然后根据标签y和预测样本y′计算得到损失函数,并确定梯度下降的方向,通过不断地迭代更新参数和反向传播,从而降低损失函数的数值,对模型中的参数进行优化,得到最终的训练模型。
由上述内容可知,现有的监督学习模型仅对标注数据进行训练,忽略了无标注数据,导致训练模型的预测精度不高。另外,现有的监督学习模型主要采用标注数据进行模型训练,需要标注数据的数据量比较大,而对大量的数据进行标注,增加了模型训练的成本。
对此,本申请所提供了将标注数据与无标注数据相结合对模型进行训练的方式,其中,基于无标注数据得到损失函数的方法可以包括两种,即静态先验方式和动态调整方式。
可选的,在生产一批样本或产品时,可根据经验确定生产数据的模型分布,即通过静态先验方式来达到充分利用未标注数据计算第二损失函数。具体的,首先获取无标注数据对应的先验分布概率以及无标注数据的样本个数,然后确定每个无标注数据的样本的输出概率,最后根据先验分布概率、样本个数以及输出概率确定第二损失函数。其中,上述过程可转换为如下公式:
在上式中,Lunsupervise为第二损失函数。n表示一个批次(batch size)输出的样本个数;pk(x)表示第k个样本输出的概率;pmodel(x)表示先验的输入概率分布。
需要说明的是,在实际应用中,参数n的值需大于预设阈值,因为如果参数n的值过小,则表明无标注数据的数据量较小,从而无法反映整个未标注数据的分布pmodel(x)。通常,参数n的取值为192~256中的任意一个。另外,采用静态先验方式对模型进行训练可以大幅度提升模型的泛化能力。
此外,还需要说明的是,通过对先验分布pmodel(x)进行调整,可以使得图像识别预测输出伸缩可控,能够适应不同客户的需求。此外,静态先验方式可以大幅度提高模型的泛化能力,但静态先验方式依赖于静态先验。如果当前的生产的环境、机器出现故障时,静态先验方式中的先验经验与实际生成情况不符,如果继续采用静态先验方式则会降低模型的预测准确度。对此,可以采用动态调整方式来自适应根据实际情况进行动态调整。
具体的,首先基于动态预测模型对无标注数据进行处理,得到第一标签,然后根据第一标签确定第二损失函数。具体公式如下:
在上式中,yk,i与人工标注的y′k,i不同,yk,i是通过动态预测得到的。具体的,首先获取预设数量的标注数据,然后基于动态预测模型以及标注数据对无标注数据进行预测处理,得到第一标签。具体公式如下:
由上式可知,yk,i是由带有少量标注数据的监督学习对未标注数据进行预测,然后通过对预测的概率值进行四舍五入得到的。
可选的,根据标注数据得到第一损失函数的方法可以采用现有技术中的计算方法。具体的,首先获取标注数据对应的第二标签以及标注数据对应的预测标签,然后根据第二标签以及预测标签得到第一损失函数。具体公式如下:
在上式中,Lsupervise为第一损失函数,y′k,i为预测标签。
需要说明的是,由于制造技术的发展,实际生产中出现缺陷的样本远远小于“过关”的样本。而监督学习则需要大量的“过关”以及缺陷的样本,从而才能训练出具有较强泛化能力的模型。但实际应用中,不易收集大量缺陷样本,对此,本申请采用少量的缺陷以及“过关”的样本,以及大量的未标注的样本,进行模型的训练,从而降低了数据收集的难度。
进一步地,在通过上述过程得到第一损失函数和第二损失函数之后,可根据第一损失函数和第二损失函数对产品样本进行迭代训练。具体的,首先获取第一损失函数对应的第一权重值和第二损失函数对应的第二权重值,然后根据第一权重值以及第二权重值对第一损失函数和第二损失函数进行权重求和,得到第三损失函数,最后根据第三损失函数对产品样本进行迭代训练,得到训练模型。
其中,第三损失函数满足下式:
L=λ1Lsupervise2*Lunsupervise
在上式中,L为第三损失函数,λ1为第一权重值,λ2为第二权重值,可选的,λ1可以为1。
在得到了第三损失函数之后,可进一步根据第三损失函数对产品样本进行迭代训练,得到训练模型。具体的,首先检测第三损失函数对应的函数值,在函数值小于预设函数值的情况下,确定函数值对应的模型为训练模型;在函数值大于等于预设函数值的情况下,对第一损失函数和第二损失函数进行更新,并基于更新后的第一损失函数和更新后的第二损失函数对产品样本进行迭代训练,直至函数值小于预设函数值。
可选的,图4示出了本申请所提供的基于机器学习的模型训练方法流程图。由图4可知,本申请采用了有监督学习方式和无监督学习方式对模型进行训练。首先,通过输入标注数据x和对应的标签y,输入无标注数据u以及先验分布p,然后通过对标注数据x预测,得到第一预测样本y′,根据标签y和第一预测样本y′计算得到第一损失函数。通过对无标注数据u,得到第二预测样本y″,根据第二预测样本y″和先验分布p计算得到第二损失函数。然后对第一损失函数和第二损失函数进行加权求和,得到第三损失函数。最后,根据第三损失函数确定梯度下降的方向,并更新参数,反向传播,直至得到符合条件的第三损失函数,此时,第三损失函数所对应的模型为最优的训练模型。
由上述内容可知,通过把先验分布模型引入深度学习的训练过程,利用该分布模型来近似的模拟无标签数据的分布,进而以此为依据构造模型训练的损失函数来指导训练过程,从而使得无标签数据能够很好的参与机器学习模型的训练过程,提升模型的预测精度,同时输入的分布模型也可以作为调节模型预测的尺度的参数,从而能够应对不同的需求场景。
实施例2
根据本发明实施例,还提供了一种基于机器学习的模型训练装置实施例,其中,图5是根据本发明实施例的基于机器学习的模型训练装置结构示意图,如图5所示,该装置包括:获取模块501、第一处理模块503、第二处理模块505以及训练模块507。
其中,获取模块501,用于从产品样本中获取标注数据和无标注数据;第一处理模块503,用于根据标注数据得到第一损失函数;第二处理模块505,用于根据无标注数据得到第二损失函数;训练模块507,用于根据第一损失函数和第二损失函数对产品样本进行迭代训练,得到训练模型,其中,训练模型用于对产品的质量进行检测。
此处需要说明的是,上述获取模块501、第一处理模块503、第二处理模块505以及训练模块507对应于上述实施例的步骤S102至步骤S108,四个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例所公开的内容。
在一种可选的方案中,第二处理模块包括:第一获取模块、第二获取模块、第一确定模块以及第二确定模块。其中,第一获取模块,用于获取无标注数据对应的先验分布概率;第二获取模块,用于获取无标注数据的样本个数;第一确定模块,用于确定每个无标注数据的样本的输出概率;第二确定模块,用于根据先验分布概率、样本个数以及输出概率确定第二损失函数。
在一种可选的方案中,第二处理模块包括:第三处理模块以及第三确定模块。其中,第三处理模块,用于基于动态预测模型对无标注数据进行处理,得到第一标签;第三确定模块,用于根据第一标签确定第二损失函数。
在一种可选的方案中,第三处理模块包括:第三获取模块以及第四处理模块。其中,第三获取模块,用于获取预设数量的标注数据;第四处理模块,用于基于动态预测模型以及标注数据对无标注数据进行预测处理,得到第一标签。
在一种可选的方案中,第一处理模块包括:第四获取模块以及第五处理模块。其中,第四获取模块,用于获取标注数据对应的第二标签以及标注数据对应的预测标签;第五处理模块,用于根据第二标签以及预测标签得到第一损失函数。
在一种可选的方案中,训练模块包括:第五获取模块、第六获取模块、第六处理模块以及第七处理模块。其中,第五获取模块,用于获取第一损失函数对应的第一权重值;第六获取模块,用于获取第二损失函数对应的第二权重值;第六处理模块,用于根据第一权重值以及第二权重值对第一损失函数和第二损失函数进行权重求和,得到第三损失函数;第七处理模块,用于根据第三损失函数对产品样本进行迭代训练,得到训练模型。
在一种可选的方案中,第七处理模块包括:检测模块、第四确定模块以及更新模块。其中,检测模块,用于检测第三损失函数对应的函数值;第四确定模块,用于在函数值小于预设函数值的情况下,确定函数值对应的模型为训练模型;更新模块,用于在函数值大于等于预设函数值的情况下,对第一损失函数和第二损失函数进行更新,并基于更新后的第一损失函数和更新后的第二损失函数对产品样本进行迭代训练,直至函数值小于预设函数值。
实施例3
根据本发明实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述实施例1中的基于机器学习的模型训练方法。
实施例4
根据本发明实施例的另一方面,还提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行上述实施例1中的基于机器学习的模型训练方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种基于机器学习的模型训练方法,其特征在于,包括:
从产品样本中获取标注数据和无标注数据;
根据所述标注数据得到第一损失函数;
根据所述无标注数据得到第二损失函数;
根据所述第一损失函数和所述第二损失函数对所述产品样本进行迭代训练,得到训练模型,其中,所述训练模型用于对产品的质量进行检测。
2.根据权利要求1所述的方法,其特征在于,根据所述无标注数据得到第二损失函数,包括:
获取所述无标注数据对应的先验分布概率;
获取所述无标注数据的样本个数;
确定每个所述无标注数据的样本的输出概率;
根据所述先验分布概率、所述样本个数以及所述输出概率确定所述第二损失函数。
3.根据权利要求1所述的方法,其特征在于,根据所述无标注数据得到第二损失函数,包括:
基于动态预测模型对所述无标注数据进行处理,得到第一标签;
根据所述第一标签确定所述第二损失函数。
4.根据权利要求3所述的方法,其特征在于,基于动态预测模型对所述无标注数据进行处理,得到第一标签,包括:
获取预设数量的标注数据;
基于所述动态预测模型以及所述标注数据对所述无标注数据进行预测处理,得到所述第一标签。
5.根据权利要求1所述的方法,其特征在于,根据所述标注数据得到第一损失函数,包括:
获取所述标注数据对应的第二标签以及所述标注数据对应的预测标签;
根据所述第二标签以及所述预测标签得到所述第一损失函数。
6.根据权利要求1所述的方法,其特征在于,根据所述第一损失函数和所述第二损失函数对所述产品样本进行迭代训练,包括:
获取所述第一损失函数对应的第一权重值;
获取所述第二损失函数对应的第二权重值;
根据所述第一权重值以及所述第二权重值对所述第一损失函数和所述第二损失函数进行权重求和,得到第三损失函数;
根据所述第三损失函数对所述产品样本进行迭代训练,得到所述训练模型。
7.根据权利要求6所述的方法,其特征在于,根据所述第三损失函数对所述产品样本进行迭代训练,得到所述训练模型,包括:
检测所述第三损失函数对应的函数值;
在所述函数值小于预设函数值的情况下,确定所述函数值对应的模型为所述训练模型;
在所述函数值大于等于所述预设函数值的情况下,对所述第一损失函数和所述第二损失函数进行更新,并基于更新后的第一损失函数和更新后的第二损失函数对所述产品样本进行迭代训练,直至所述函数值小于所述预设函数值。
8.一种基于机器学习的模型训练装置,其特征在于,包括:
获取模块,用于从产品样本中获取标注数据和无标注数据;
第一处理模块,用于根据所述标注数据得到第一损失函数;
第二处理模块,用于根据所述无标注数据得到第二损失函数;
训练模块,用于根据所述第一损失函数和所述第二损失函数对所述产品样本进行迭代训练,得到训练模型,其中,所述训练模型用于对产品的质量进行检测。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至7中任意一项所述的基于机器学习的模型训练方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的基于机器学习的模型训练方法。
CN201910141312.7A 2019-02-26 2019-02-26 基于机器学习的模型训练方法和装置 Pending CN109886342A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910141312.7A CN109886342A (zh) 2019-02-26 2019-02-26 基于机器学习的模型训练方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910141312.7A CN109886342A (zh) 2019-02-26 2019-02-26 基于机器学习的模型训练方法和装置

Publications (1)

Publication Number Publication Date
CN109886342A true CN109886342A (zh) 2019-06-14

Family

ID=66929439

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910141312.7A Pending CN109886342A (zh) 2019-02-26 2019-02-26 基于机器学习的模型训练方法和装置

Country Status (1)

Country Link
CN (1) CN109886342A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111259446A (zh) * 2020-01-16 2020-06-09 深圳前海微众银行股份有限公司 基于联邦迁移学习的参数处理方法、设备及存储介质
CN112541463A (zh) * 2020-12-21 2021-03-23 上海眼控科技股份有限公司 模型训练方法、外观分割方法、设备及存储介质
CN112614562A (zh) * 2020-12-23 2021-04-06 联仁健康医疗大数据科技股份有限公司 基于电子病历的模型训练方法、装置、设备及存储介质
WO2021168798A1 (zh) * 2020-02-28 2021-09-02 华为技术有限公司 一种量子玻尔兹曼机的训练方法及混合计算机
CN113761181A (zh) * 2020-06-15 2021-12-07 北京京东振世信息技术有限公司 一种文本分类方法和装置
CN113962737A (zh) * 2021-10-26 2022-01-21 北京沃东天骏信息技术有限公司 目标识别模型训练方法和装置、目标识别方法和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7020593B2 (en) * 2002-12-04 2006-03-28 International Business Machines Corporation Method for ensemble predictive modeling by multiplicative adjustment of class probability: APM (adjusted probability model)
CN106201871A (zh) * 2016-06-30 2016-12-07 重庆大学 基于代价敏感半监督的软件缺陷预测方法
CN108009589A (zh) * 2017-12-12 2018-05-08 腾讯科技(深圳)有限公司 样本数据处理方法、装置和计算机可读存储介质
CN108664999A (zh) * 2018-05-03 2018-10-16 北京图森未来科技有限公司 一种分类模型的训练方法及其装置、计算机服务器
CN108805196A (zh) * 2018-06-05 2018-11-13 西安交通大学 用于图像识别的自动增量学习方法
CN109035169A (zh) * 2018-07-19 2018-12-18 西安交通大学 一种无监督/半监督ct图像重建深度网络训练方法
US20180373832A1 (en) * 2017-06-27 2018-12-27 Grail, Inc. Detecting cross-contamination in sequencing data

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7020593B2 (en) * 2002-12-04 2006-03-28 International Business Machines Corporation Method for ensemble predictive modeling by multiplicative adjustment of class probability: APM (adjusted probability model)
CN106201871A (zh) * 2016-06-30 2016-12-07 重庆大学 基于代价敏感半监督的软件缺陷预测方法
US20180373832A1 (en) * 2017-06-27 2018-12-27 Grail, Inc. Detecting cross-contamination in sequencing data
CN108009589A (zh) * 2017-12-12 2018-05-08 腾讯科技(深圳)有限公司 样本数据处理方法、装置和计算机可读存储介质
CN108664999A (zh) * 2018-05-03 2018-10-16 北京图森未来科技有限公司 一种分类模型的训练方法及其装置、计算机服务器
CN108805196A (zh) * 2018-06-05 2018-11-13 西安交通大学 用于图像识别的自动增量学习方法
CN109035169A (zh) * 2018-07-19 2018-12-18 西安交通大学 一种无监督/半监督ct图像重建深度网络训练方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
DONG-HYUN LEE,: "Pseudo-Label : The Simple and E cient Semi-Supervised Learning Method for Deep Neural Networks", 《RESEARCHGATE》 *
李晓康,: "不同先验信息下成功概率的Bayes估计", 《陕西理工学院学报(自然科学版)》 *
欧仁•查尼阿克,: "《统计语言学习》", 31 August 2016, 世界图书出版公司北京公司 *
焦李成 等,: "《雷达图像解译技术》", 31 December 2017, 国防工业出版社 *
秦高峰,: "基于机器学习的多光谱遥感影像分类及城市扩展研究", 《中国优秀硕士学位论文全文数据库 基础科学辑》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111259446A (zh) * 2020-01-16 2020-06-09 深圳前海微众银行股份有限公司 基于联邦迁移学习的参数处理方法、设备及存储介质
CN111259446B (zh) * 2020-01-16 2023-08-22 深圳前海微众银行股份有限公司 基于联邦迁移学习的参数处理方法、设备及存储介质
WO2021168798A1 (zh) * 2020-02-28 2021-09-02 华为技术有限公司 一种量子玻尔兹曼机的训练方法及混合计算机
CN113761181A (zh) * 2020-06-15 2021-12-07 北京京东振世信息技术有限公司 一种文本分类方法和装置
CN112541463A (zh) * 2020-12-21 2021-03-23 上海眼控科技股份有限公司 模型训练方法、外观分割方法、设备及存储介质
CN112614562A (zh) * 2020-12-23 2021-04-06 联仁健康医疗大数据科技股份有限公司 基于电子病历的模型训练方法、装置、设备及存储介质
CN112614562B (zh) * 2020-12-23 2024-05-31 联仁健康医疗大数据科技股份有限公司 基于电子病历的模型训练方法、装置、设备及存储介质
CN113962737A (zh) * 2021-10-26 2022-01-21 北京沃东天骏信息技术有限公司 目标识别模型训练方法和装置、目标识别方法和装置

Similar Documents

Publication Publication Date Title
CN109886342A (zh) 基于机器学习的模型训练方法和装置
CN107169956B (zh) 基于卷积神经网络的色织物疵点检测方法
CN107506799B (zh) 一种基于深度神经网络的开集类别发掘与扩展方法与装置
CN108334936B (zh) 基于迁移卷积神经网络的故障预测方法
CN107657249A (zh) 多尺度特征行人重识别的方法、装置、存储介质及处理器
CN104834748B (zh) 一种利用基于深度语义排序哈希编码的图像检索方法
CN108021947B (zh) 一种基于视觉的分层极限学习机目标识别方法
CN108416394A (zh) 基于卷积神经网络的多目标检测模型构建方法
CN107392919B (zh) 基于自适应遗传算法的灰度阈值获取方法、图像分割方法
CN109002755B (zh) 基于人脸图像的年龄估计模型构建方法及估计方法
CN108596327B (zh) 一种基于深度学习的地震速度谱人工智能拾取方法
CN110473592B (zh) 一种多视角人类协同致死基因预测方法
CN113408423B (zh) 适用于tx2嵌入式平台的水产品目标实时检测方法
CN108090472B (zh) 基于多通道一致性特征的行人重识别方法及其系统
CN109034119A (zh) 一种基于优化的全卷积神经网络的人脸检测方法
CN107992938B (zh) 基于正反卷积神经网络的时空大数据预测方法和系统
CN104992223A (zh) 基于深度学习的密集人数估计方法
CN110059616A (zh) 基于融合损失函数的行人重识别模型优化方法
CN106203628B (zh) 一种增强深度学习算法鲁棒性的优化方法和系统
CN115100574A (zh) 基于融合图卷积网络与Transformer网络的动作识别方法及系统
CN110765960B (zh) 一种自适应多任务深度学习的行人再识别方法
CN110569780A (zh) 一种基于深度迁移学习的高精度人脸识别方法
CN104851183A (zh) 纸币面向识别方法及装置
CN116052218B (zh) 一种行人重识别方法
CN110298394A (zh) 一种图像识别方法和相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190614

RJ01 Rejection of invention patent application after publication