CN112819078A - 一种识别模型的迭代方法和装置 - Google Patents
一种识别模型的迭代方法和装置 Download PDFInfo
- Publication number
- CN112819078A CN112819078A CN202110158715.XA CN202110158715A CN112819078A CN 112819078 A CN112819078 A CN 112819078A CN 202110158715 A CN202110158715 A CN 202110158715A CN 112819078 A CN112819078 A CN 112819078A
- Authority
- CN
- China
- Prior art keywords
- model
- training
- recognition
- training sample
- recognition model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000012549 training Methods 0.000 claims abstract description 251
- 230000015654 memory Effects 0.000 claims description 19
- 238000012360 testing method Methods 0.000 claims description 14
- 238000002372 labelling Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 4
- 230000001502 supplementing effect Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000002708 enhancing effect Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种识别模型的迭代方法和装置,其中,该方法包括:获取第一训练样本,其中,第一训练样本包括具有对应关系的第一识别模型识别错误的数据和标注信息,第一识别模型用于执行数据识别任务;使用第一训练样本训练第一识别模型对应的初始模型,得到第二识别模型;将第一训练样本添加到第二训练样本中,得到第三训练样本,其中,第二训练样本是用于训练第一识别模型对应的初始模型的样本;使用第三训练样本训练第二识别模型,得到第三识别模型,其中,第三识别模型用于继续执行数据识别任务。本申请解决了对识别模型进行迭代后得到的模型识别准确率较低的技术问题。
Description
技术领域
本申请涉及计算机领域,尤其涉及一种识别模型的迭代方法和装置。
背景技术
深度学习的模型常常通过识别图片的形式识别物体,这种识别模型的准确率不是100%,在识别过程中有时会出现识别错误的情况。这些识别错误的图片被收集起来,做为模型迭代时训练模型的数据。在深度学习识别模型实际使用中会发现这些被错误的识别的图片对模型优化有更高的价值。但错误图片的分布是不均匀的,并且随着模型的迭代,数据分布一直在变。如果只是简单的把错误图片加入到原图片集中重训模型,并不能很好的优化模型。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请提供了一种识别模型的迭代方法和装置,以至少解决相关技术中对识别模型进行迭代后得到的模型识别准确率较低的技术问题。
根据本申请实施例的一个方面,提供了一种识别模型的迭代方法,包括:
获取第一训练样本,其中,所述第一训练样本包括具有对应关系的第一识别模型识别错误的数据和标注信息,所述第一识别模型用于执行数据识别任务;
使用所述第一训练样本训练所述第一识别模型对应的初始模型,得到第二识别模型;
将所述第一训练样本添加到第二训练样本中,得到第三训练样本,其中,所述第二训练样本是用于训练所述第一识别模型对应的初始模型的样本;
使用所述第三训练样本训练所述第二识别模型,得到第三识别模型,其中,所述第三识别模型用于继续执行数据识别任务。
可选地,使用所述第一训练样本训练所述第一识别模型对应的初始模型,得到第二识别模型包括:
使用所述第一训练样本分别按照多个学习算法中的每个学习算法训练所述初始模型,得到多个第四识别模型,其中,所述多个学习算法与所述多个第四识别模型一一对应;
确定所述多个第四识别模型中每个第四识别模型的损失值;
将损失值最低的第四识别模型确定为所述第二识别模型。
可选地,使用所述第一训练样本分别按照多个学习算法中的每个学习算法训练所述初始模型,得到多个第四识别模型包括:
将所述第一训练样本划分为支持集和询问集;
使用所述支持集分别按照所述多个学习算法中的每个学习算法训练所述初始模型,得到多个第五识别模型,其中,所述多个学习算法与所述多个第五识别模型一一对应;
使用所述询问集分别对所述多个第五识别模型中的每个第五识别模型进行测试,得到所述多个第四识别模型。
可选地,使用所述支持集分别按照所述多个学习算法中的每个学习算法训练所述初始模型包括:使用所述支持集分别按照所述每个学习算法控制所述初始模型执行多个训练任务,得到所述每个学习算法对应的多个第一子模型,其中,所述多个第一子模型与所述多个训练任务一一对应;
使用所述询问集分别对所述多个第五识别模型中的每个第五识别模型进行测试包括:使用所述询问集分别对所述多个第一子模型中的每个子模型进行测试,得到多个第二子模型。
可选地,确定所述多个第四识别模型中每个第四识别模型的损失值包括:
确定所述多个第二子模型中每个第二子模型的子损失值,得到多个子损失值;
将所述多个子损失值的加权和确定为每个第四识别模型的损失值。
可选地,获取第一训练样本包括:
记录所述第一识别模型识别错误的数据,并对所述第一识别模型识别错误的数据进行标注得到所述标注信息;
存储具有对应关系的第一识别模型识别错误的数据和标注信息,得到错误样本库;
从所述错误样本库中提取所述第一训练样本。
可选地,从所述错误样本库中提取所述第一训练样本包括:
检测所述错误样本库中包括的样本数量是否大于或者等于目标数量;
在所述样本数量大于或者等于所述目标数量的情况下,从所述错误样本库中提取所述目标数量的错误样本作为所述第一训练样本;
在所述样本数量小于所述目标数量的情况下,提取所述错误样本库中全部的错误样本;将所述第二训练样本中的部分样本补充到所述全部的错误样本中,得到所述目标数量的所述第一训练样本。
根据本申请实施例的另一方面,还提供了一种识别模型的迭代装置,包括:
获取模块,用于获取第一训练样本,其中,所述第一训练样本包括具有对应关系的第一识别模型识别错误的数据和标注信息,所述第一识别模型用于执行数据识别任务;
第一训练模块,用于使用所述第一训练样本训练所述第一识别模型对应的初始模型,得到第二识别模型;
添加模块,用于将所述第一训练样本添加到第二训练样本中,得到第三训练样本,其中,所述第二训练样本是用于训练所述第一识别模型对应的初始模型的样本;
第二训练模块,用于使用所述第三训练样本训练所述第二识别模型,得到第三识别模型,其中,所述第三识别模型用于继续执行数据识别任务。
根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的方法。
根据本申请实施例的另一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器通过计算机程序执行上述的方法。
在本申请实施例中,采用获取第一训练样本,其中,第一训练样本包括具有对应关系的第一识别模型识别错误的数据和标注信息,第一识别模型用于执行数据识别任务;使用第一训练样本训练第一识别模型对应的初始模型,得到第二识别模型;将第一训练样本添加到第二训练样本中,得到第三训练样本,其中,第二训练样本是用于训练第一识别模型对应的初始模型的样本;使用第三训练样本训练第二识别模型,得到第三识别模型,其中,第三识别模型用于继续执行数据识别任务的方式,首先使用第一识别模型识别错误的第一训练样本训练第一识别模型对应的初始模型得到第二识别模型,再将第一训练样本添加到用于训练第一识别模型对应的初始模型的第二训练样本中得到第三训练样本,使用第三训练样本训练第二识别模型得到用于继续执行数据识别任务的第三识别模型,用错误数据迭代模型前,让模型学习如何更好的利用被错误识别的数据,达到增强错误数据权重的目的,从而得到更好的迭代模型,显著提高模型的准确率,从而实现了提高对识别模型进行迭代后得到的模型的识别准确率的技术效果,进而解决了对识别模型进行迭代后得到的模型识别准确率较低的技术问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例的识别模型的迭代方法的硬件环境的示意图;
图2是根据本申请实施例的一种可选的识别模型的迭代方法的流程图;
图3是根据本申请可选实施例的一种图片识别模型的迭代过程的示意图;
图4是根据本申请可选实施例的一种模型训练过程的示意图一;
图5是根据本申请可选实施例的一种模型训练过程的示意图二;
图6是根据本申请实施例的一种可选的识别模型的迭代装置的示意图;
图7是根据本申请实施例的一种电子装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例的一方面,提供了一种识别模型的迭代的方法实施例。
可选地,在本实施例中,上述识别模型的迭代方法可以应用于如图1所示的由终端101和服务器103所构成的硬件环境中。如图1所示,服务器103通过网络与终端101进行连接,可用于为终端或终端上安装的客户端提供服务(如游戏服务、应用服务等),可在服务器上或独立于服务器设置数据库,用于为服务器103提供数据存储服务,上述网络包括但不限于:广域网、城域网或局域网,终端101并不限定于PC、手机、平板电脑等。本申请实施例的识别模型的迭代方法可以由服务器103来执行,也可以由终端101来执行,还可以是由服务器103和终端101共同执行。其中,终端101执行本申请实施例的识别模型的迭代方法也可以是由安装在其上的客户端来执行。
图2是根据本申请实施例的一种可选的识别模型的迭代方法的流程图,如图2所示,该方法可以包括以下步骤:
步骤S202,获取第一训练样本,其中,所述第一训练样本包括具有对应关系的第一识别模型识别错误的数据和标注信息,所述第一识别模型用于执行数据识别任务;
步骤S204,使用所述第一训练样本训练所述第一识别模型对应的初始模型,得到第二识别模型;
步骤S206,将所述第一训练样本添加到第二训练样本中,得到第三训练样本,其中,所述第二训练样本是用于训练所述第一识别模型对应的初始模型的样本;
步骤S208,使用所述第三训练样本训练所述第二识别模型,得到第三识别模型,其中,所述第三识别模型用于继续执行数据识别任务。
通过上述步骤S202至步骤S208,首先使用第一识别模型识别错误的第一训练样本训练第一识别模型对应的初始模型得到第二识别模型,再将第一训练样本添加到用于训练第一识别模型对应的初始模型的第二训练样本中得到第三训练样本,使用第三训练样本训练第二识别模型得到用于继续执行数据识别任务的第三识别模型,用错误数据迭代模型前,让模型学习如何更好的利用被错误识别的数据,达到增强错误数据权重的目的,从而得到更好的迭代模型,显著提高模型的准确率,从而实现了提高对识别模型进行迭代后得到的模型的识别准确率的技术效果,进而解决了对识别模型进行迭代后得到的模型识别准确率较低的技术问题。
在步骤S202提供的技术方案中,第一识别模型用于执行数据识别任务,识别的数据可以但不限于包括:图片数据,视频数据,文本数据等等。
可选地,在本实施例中,第一训练样本包括具有对应关系的第一识别模型识别错误的数据和标注信息,该标注信息可以但不限于是手动添加的。
作为一种可选的实施例,可以但不限于通过以下方式获取第一训练样本:
S11,记录所述第一识别模型识别错误的数据,并对所述第一识别模型识别错误的数据进行标注得到所述标注信息;
S12,存储具有对应关系的第一识别模型识别错误的数据和标注信息,得到错误样本库;
S13,从所述错误样本库中提取所述第一训练样本。
可选地,在本实施例中,将第一识别模型识别错误的数据记录下来并对其进行标注,存储这些携带有标注信息的识别错误的数据,从而构建出错误样本库,在需要对第一识别模型进行迭代时,从错误样本库中提取数据作为第一训练样本。
作为一种可选的实施例,可以但不限于通过以下方式从错误样本库中提取第一训练样本:
S21,检测所述错误样本库中包括的样本数量是否大于或者等于目标数量;
S22,在所述样本数量大于或者等于所述目标数量的情况下,从所述错误样本库中提取所述目标数量的错误样本作为所述第一训练样本;
S23,在所述样本数量小于所述目标数量的情况下,提取所述错误样本库中全部的错误样本;将所述第二训练样本中的部分样本补充到所述全部的错误样本中,得到所述目标数量的所述第一训练样本。
可选地,在本实施例中,从错误样本库中提取的第一训练样本可以但不限于是一定规模的训练样本,如果错误样本库中包括的样本数量满足该规格,则直接从中提取该规格的错误样本作为第一训练样本,如果错误样本库中包括的样本数量不足该规格,则提取错误样本库中全部的错误样本,再使用第二训练样本中的部分样本将其补齐。
可选地,在本实施例中,在错误样本库中可以但不限于是按照错误样本的类型存储错误样本的。检测错误样本库中包括的样本数量是否大于或者等于目标数量可以但不限于是检测错误样本库中包括的每种类别的错误样本的样本数量是否大于或者等于目标数量,也就是说,提取的第一训练样本可以但不限于包括目标数量的每种类别的错误样本。
可选地,在本实施例中,目标数量可以但不限于是预先设置的数量,比如:10个,15个,20个等等。
在步骤S204提供的技术方案中,第一训练样本是第一识别模型识别错误的数据,使用第一训练样本训练初始模型,能够使得到的第二识别模型学习到如何更好的利用之前识别错误的数据,从而使得之前识别错误的数据在模型训练的过程中发挥更好的作用。
作为一种可选的实施例,使用所述第一训练样本训练所述第一识别模型对应的初始模型,得到第二识别模型包括:
S31,使用所述第一训练样本分别按照多个学习算法中的每个学习算法训练所述初始模型,得到多个第四识别模型,其中,所述多个学习算法与所述多个第四识别模型一一对应;
S32,确定所述多个第四识别模型中每个第四识别模型的损失值;
S33,将损失值最低的第四识别模型确定为所述第二识别模型。
可选地,在本实施例中,使用第一训练样本训练第一识别模型对应的初始模型得到第二识别模型的过程可以但不限于是机器自行选择学习算法和初始化参数的过程。
可选地,在本实施例中,多个学习算法构成模型训练过程的learning algorithmset(学习算法集合),使用该集合中的每个学习算法训练初始模型,得到每个学习算法对应的第四识别模型,通过确定第四识别模型的损失值来确定第二识别模型,从而确定出模型迭代过程中使用的学习算法和初始化参数。
可选地,在本实施例中,设置一个learning algorithm set。通过该learningalgorithm set由机器自行初始化参数,选择更新方法,选择神经网络结构。
作为一种可选的实施例,使用所述第一训练样本分别按照多个学习算法中的每个学习算法训练所述初始模型,得到多个第四识别模型包括:
S41,将所述第一训练样本划分为支持集和询问集;
S42,使用所述支持集分别按照所述多个学习算法中的每个学习算法训练所述初始模型,得到多个第五识别模型,其中,所述多个学习算法与所述多个第五识别模型一一对应;
S43,使用所述询问集分别对所述多个第五识别模型中的每个第五识别模型进行测试,得到所述多个第四识别模型。
可选地,在本实施例中,支持集(support set)可以但不限于是用于训练模型的样本集合,询问集(query set)可以但不限于是用于测试模型的样本集合。通过对初始模型进行训练和测试来得到每个第四识别模型。
作为一种可选的实施例,使用所述支持集分别按照所述多个学习算法中的每个学习算法训练所述初始模型包括:
S51,使用所述支持集分别按照所述每个学习算法控制所述初始模型执行多个训练任务,得到所述每个学习算法对应的多个第一子模型,其中,所述多个第一子模型与所述多个训练任务一一对应;
使用所述询问集分别对所述多个第五识别模型中的每个第五识别模型进行测试包括:
S52,使用所述询问集分别对所述多个第一子模型中的每个子模型进行测试,得到多个第二子模型。
可选地,在本实施例中,初始模型的训练和测试过程可以是多任务的。
作为一种可选的实施例,确定所述多个第四识别模型中每个第四识别模型的损失值包括:
S61,确定所述多个第二子模型中每个第二子模型的子损失值,得到多个子损失值;
S62,将所述多个子损失值的加权和确定为每个第四识别模型的损失值。
可选地,在本实施例中,每个第四识别模型的损失值可以但不限于是各个第二子模型的子损失值的加权和。
可选地,在本实施例中,各个子损失值的权重可以但不限于是根据各个训练任务的重要性确定的。比如:如果各个训练任务同等重要,那么每个子损失值的权重可以为1。
比如:learning algorithm set中的一个learning algorithm F。首先用F进行猫狗分类器的学习,之后得到了一个f1,对f1的训练数据进行测评,得到f1的loss functionl1。之后再用F进行苹果橘子分类器的学习,得到一个f2,对f2的训练数据进行测评,得到f2的loss function l2。用F完成n个task,之后对每一个task求一个损失值l。然后把所有的l都加在一起,得到learning algorithm F对应的损失值L,使用L来作为评估F的指标。
在步骤S206提供的技术方案中,将第一识别模型识别错误的第一训练样本添加到原始训练数据第二训练样本中,得到用于模型迭代的第三训练样本。
在步骤S208提供的技术方案中,使用包括识别错误的第一训练样本的第三训练样本训练使用识别错误的第一训练样本训练出的第二识别模型,使得模型的迭代过程能够更好的利用识别错误的数据迭代模型,识别错误的数据在迭代过程中发挥更大的作用,使得最终得到的第三识别模型的识别准确度更高。
本申请还提供了一种可选实施例,该可选实施例提供了一种图片识别模型的迭代过程,图3是根据本申请可选实施例的一种图片识别模型的迭代过程的示意图,如图3所示,收集模型识别错误的图片,构成一个新的数据集,记为β集(相当于上述第一训练样本),将原始用来训练最初模型的数据集,记为α集(相当于上述第二训练样本)。从新数据集(β集)中挑选一些图片(如每个类别10张图片),如果新数据集中某类别的图片不足10张,可以从原始数据集(α集)该类别图片中随机挑选,补齐数据。用这些挑选出的数据构成元学习方法中的支持集(support set)和询问集(query set),记为γ集。用上述得到的数据集(γ集)为样本,采用元学习的方式训练原始模型,从而实现模型的微调,得到模型二。图4是根据本申请可选实施例的一种模型训练过程的示意图一,如图4所示,网络结构使用模型一的参数初始化得到θ1,使用γ集中的支持集将θ1更新为θ2,使用γ集中的询问集将θ2更新为θ3,从而得到模型二。
将β集混入到原始数据集(α集)中,得到包含所有标记样本的扩增数据集。用该扩增数据集做样本,以模型二参数当预训练值,训练模型,得到最终优化后的模型三。图5是根据本申请可选实施例的一种模型训练过程的示意图二,如图5所示,网络结构使用模型二的参数初始化得到θ3,使用包括所有样本的扩增数据集将θ3更新为θ4,从而得到模型三。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台电子设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
根据本申请实施例的另一个方面,还提供了一种用于实施上述识别模型的迭代方法的识别模型的迭代装置。图6是根据本申请实施例的一种可选的识别模型的迭代装置的示意图,如图6所示,该装置可以包括:
获取模块62,用于获取第一训练样本,其中,所述第一训练样本包括具有对应关系的第一识别模型识别错误的数据和标注信息,所述第一识别模型用于执行数据识别任务;
第一训练模块64,用于使用所述第一训练样本训练所述第一识别模型对应的初始模型,得到第二识别模型;
添加模块66,用于将所述第一训练样本添加到第二训练样本中,得到第三训练样本,其中,所述第二训练样本是用于训练所述第一识别模型对应的初始模型的样本;
第二训练模块68,用于使用所述第三训练样本训练所述第二识别模型,得到第三识别模型,其中,所述第三识别模型用于继续执行数据识别任务。
需要说明的是,该实施例中的获取模块62可以用于执行本申请实施例中的步骤S202,该实施例中的第一训练模块64可以用于执行本申请实施例中的步骤S204,该实施例中的添加模块66可以用于执行本申请实施例中的步骤S206,该实施例中的第二训练模块68可以用于执行本申请实施例中的步骤S208。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
通过上述模块,首先使用第一识别模型识别错误的第一训练样本训练第一识别模型对应的初始模型得到第二识别模型,再将第一训练样本添加到用于训练第一识别模型对应的初始模型的第二训练样本中得到第三训练样本,使用第三训练样本训练第二识别模型得到用于继续执行数据识别任务的第三识别模型,用错误数据迭代模型前,让模型学习如何更好的利用被错误识别的数据,达到增强错误数据权重的目的,从而得到更好的迭代模型,显著提高模型的准确率,从而实现了提高对识别模型进行迭代后得到的模型的识别准确率的技术效果,进而解决了对识别模型进行迭代后得到的模型识别准确率较低的技术问题。
作为一种可选的实施例,所述第一训练模块包括:
训练单元,用于使用所述第一训练样本分别按照多个学习算法中的每个学习算法训练所述初始模型,得到多个第四识别模型,其中,所述多个学习算法与所述多个第四识别模型一一对应;
第一确定单元,用于确定所述多个第四识别模型中每个第四识别模型的损失值;
第二确定单元,用于将损失值最低的第四识别模型确定为所述第二识别模型。
作为一种可选的实施例,所述训练单元用于:
将所述第一训练样本划分为支持集和询问集;
使用所述支持集分别按照所述多个学习算法中的每个学习算法训练所述初始模型,得到多个第五识别模型,其中,所述多个学习算法与所述多个第五识别模型一一对应;
使用所述询问集分别对所述多个第五识别模型中的每个第五识别模型进行测试,得到所述多个第四识别模型。
作为一种可选的实施例,所述训练单元用于:
使用所述支持集分别按照所述每个学习算法控制所述初始模型执行多个训练任务,得到所述每个学习算法对应的多个第一子模型,其中,所述多个第一子模型与所述多个训练任务一一对应;
使用所述询问集分别对所述多个第一子模型中的每个子模型进行测试,得到多个第二子模型。
作为一种可选的实施例,所述第一确定单元用于:
确定所述多个第二子模型中每个第二子模型的子损失值,得到多个子损失值;
将所述多个子损失值的加权和确定为每个第四识别模型的损失值。
作为一种可选的实施例,所述获取模块包括:
记录单元,用于记录所述第一识别模型识别错误的数据,并对所述第一识别模型识别错误的数据进行标注得到所述标注信息;
存储单元,用于存储具有对应关系的第一识别模型识别错误的数据和标注信息,得到错误样本库;
提取单元,用于从所述错误样本库中提取所述第一训练样本。
作为一种可选的实施例,所述提取单元用于:
检测所述错误样本库中包括的样本数量是否大于或者等于目标数量;
在所述样本数量大于或者等于所述目标数量的情况下,从所述错误样本库中提取所述目标数量的错误样本作为所述第一训练样本;
在所述样本数量小于所述目标数量的情况下,提取所述错误样本库中全部的错误样本;将所述第二训练样本中的部分样本补充到所述全部的错误样本中,得到所述目标数量的所述第一训练样本。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现,其中,硬件环境包括网络环境。
根据本申请实施例的另一个方面,还提供了一种用于实施上述识别模型的迭代方法的电子装置。
图7是根据本申请实施例的一种电子装置的结构框图,如图7所示,该电子装置可以包括:一个或多个(图中仅示出一个)处理器701、存储器703、以及传输装置705,如图7所示,该电子装置还可以包括输入输出设备707。
其中,存储器703可用于存储软件程序以及模块,如本申请实施例中的识别模型的迭代方法和装置对应的程序指令/模块,处理器701通过运行存储在存储器703内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的识别模型的迭代方法。存储器703可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器703可进一步包括相对于处理器701远程设置的存储器,这些远程存储器可以通过网络连接至电子装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置705用于经由一个网络接收或者发送数据,还可以用于处理器与存储器之间的数据传输。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置705包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置705为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器703用于存储应用程序。
处理器701可以通过传输装置705调用存储器703存储的应用程序,以执行下述步骤:
获取第一训练样本,其中,所述第一训练样本包括具有对应关系的第一识别模型识别错误的数据和标注信息,所述第一识别模型用于执行数据识别任务;
使用所述第一训练样本训练所述第一识别模型对应的初始模型,得到第二识别模型;
将所述第一训练样本添加到第二训练样本中,得到第三训练样本,其中,所述第二训练样本是用于训练所述第一识别模型对应的初始模型的样本;
使用所述第三训练样本训练所述第二识别模型,得到第三识别模型,其中,所述第三识别模型用于继续执行数据识别任务。
采用本申请实施例,提供了一种识别模型的迭代的方案。首先使用第一识别模型识别错误的第一训练样本训练第一识别模型对应的初始模型得到第二识别模型,再将第一训练样本添加到用于训练第一识别模型对应的初始模型的第二训练样本中得到第三训练样本,使用第三训练样本训练第二识别模型得到用于继续执行数据识别任务的第三识别模型,用错误数据迭代模型前,让模型学习如何更好的利用被错误识别的数据,达到增强错误数据权重的目的,从而得到更好的迭代模型,显著提高模型的准确率,从而实现了提高对识别模型进行迭代后得到的模型的识别准确率的技术效果,进而解决了对识别模型进行迭代后得到的模型识别准确率较低的技术问题。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本领域普通技术人员可以理解,图7所示的结构仅为示意,电子装置可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等电子设备。图7其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图7中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图7所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令电子设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
本申请的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行识别模型的迭代方法的程序代码。
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
获取第一训练样本,其中,所述第一训练样本包括具有对应关系的第一识别模型识别错误的数据和标注信息,所述第一识别模型用于执行数据识别任务;
使用所述第一训练样本训练所述第一识别模型对应的初始模型,得到第二识别模型;
将所述第一训练样本添加到第二训练样本中,得到第三训练样本,其中,所述第二训练样本是用于训练所述第一识别模型对应的初始模型的样本;
使用所述第三训练样本训练所述第二识别模型,得到第三识别模型,其中,所述第三识别模型用于继续执行数据识别任务。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种识别模型的迭代方法,其特征在于,包括:
获取第一训练样本,其中,所述第一训练样本包括具有对应关系的第一识别模型识别错误的数据和标注信息,所述第一识别模型用于执行数据识别任务;
使用所述第一训练样本训练所述第一识别模型对应的初始模型,得到第二识别模型;
将所述第一训练样本添加到第二训练样本中,得到第三训练样本,其中,所述第二训练样本是用于训练所述第一识别模型对应的初始模型的样本;
使用所述第三训练样本训练所述第二识别模型,得到第三识别模型,其中,所述第三识别模型用于继续执行数据识别任务。
2.根据权利要求1所述的方法,其特征在于,使用所述第一训练样本训练所述第一识别模型对应的初始模型,得到第二识别模型包括:
使用所述第一训练样本分别按照多个学习算法中的每个学习算法训练所述初始模型,得到多个第四识别模型,其中,所述多个学习算法与所述多个第四识别模型一一对应;
确定所述多个第四识别模型中每个第四识别模型的损失值;
将损失值最低的第四识别模型确定为所述第二识别模型。
3.根据权利要求2所述的方法,其特征在于,使用所述第一训练样本分别按照多个学习算法中的每个学习算法训练所述初始模型,得到多个第四识别模型包括:
将所述第一训练样本划分为支持集和询问集;
使用所述支持集分别按照所述多个学习算法中的每个学习算法训练所述初始模型,得到多个第五识别模型,其中,所述多个学习算法与所述多个第五识别模型一一对应;
使用所述询问集分别对所述多个第五识别模型中的每个第五识别模型进行测试,得到所述多个第四识别模型。
4.根据权利要求3所述的方法,其特征在于,
使用所述支持集分别按照所述多个学习算法中的每个学习算法训练所述初始模型包括:使用所述支持集分别按照所述每个学习算法控制所述初始模型执行多个训练任务,得到所述每个学习算法对应的多个第一子模型,其中,所述多个第一子模型与所述多个训练任务一一对应;
使用所述询问集分别对所述多个第五识别模型中的每个第五识别模型进行测试包括:使用所述询问集分别对所述多个第一子模型中的每个子模型进行测试,得到多个第二子模型。
5.根据权利要求4所述的方法,其特征在于,确定所述多个第四识别模型中每个第四识别模型的损失值包括:
确定所述多个第二子模型中每个第二子模型的子损失值,得到多个子损失值;
将所述多个子损失值的加权和确定为每个第四识别模型的损失值。
6.根据权利要求1所述的方法,其特征在于,获取第一训练样本包括:
记录所述第一识别模型识别错误的数据,并对所述第一识别模型识别错误的数据进行标注得到所述标注信息;
存储具有对应关系的第一识别模型识别错误的数据和标注信息,得到错误样本库;
从所述错误样本库中提取所述第一训练样本。
7.根据权利要求6所述的方法,其特征在于,从所述错误样本库中提取所述第一训练样本包括:
检测所述错误样本库中包括的样本数量是否大于或者等于目标数量;
在所述样本数量大于或者等于所述目标数量的情况下,从所述错误样本库中提取所述目标数量的错误样本作为所述第一训练样本;
在所述样本数量小于所述目标数量的情况下,提取所述错误样本库中全部的错误样本;将所述第二训练样本中的部分样本补充到所述全部的错误样本中,得到所述目标数量的所述第一训练样本。
8.一种识别模型的迭代装置,其特征在于,包括:
获取模块,用于获取第一训练样本,其中,所述第一训练样本包括具有对应关系的第一识别模型识别错误的数据和标注信息,所述第一识别模型用于执行数据识别任务;
第一训练模块,用于使用所述第一训练样本训练所述第一识别模型对应的初始模型,得到第二识别模型;
添加模块,用于将所述第一训练样本添加到第二训练样本中,得到第三训练样本,其中,所述第二训练样本是用于训练所述第一识别模型对应的初始模型的样本;
第二训练模块,用于使用所述第三训练样本训练所述第二识别模型,得到第三识别模型,其中,所述第三识别模型用于继续执行数据识别任务。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至7任一项中所述的方法。
10.一种电子装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器通过所述计算机程序执行上述权利要求1至7任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110158715.XA CN112819078B (zh) | 2021-02-04 | 2021-02-04 | 一种图片识别模型的迭代方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110158715.XA CN112819078B (zh) | 2021-02-04 | 2021-02-04 | 一种图片识别模型的迭代方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112819078A true CN112819078A (zh) | 2021-05-18 |
CN112819078B CN112819078B (zh) | 2023-12-15 |
Family
ID=75861492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110158715.XA Active CN112819078B (zh) | 2021-02-04 | 2021-02-04 | 一种图片识别模型的迭代方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112819078B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108960314A (zh) * | 2018-06-26 | 2018-12-07 | 北京旷视科技有限公司 | 基于难样本的训练方法、装置及电子设备 |
CN109902678A (zh) * | 2019-02-12 | 2019-06-18 | 北京奇艺世纪科技有限公司 | 模型训练方法、文字识别方法、装置、电子设备及计算机可读介质 |
WO2019237657A1 (zh) * | 2018-06-15 | 2019-12-19 | 北京字节跳动网络技术有限公司 | 用于生成模型的方法和装置 |
WO2019242222A1 (zh) * | 2018-06-21 | 2019-12-26 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
WO2020087974A1 (zh) * | 2018-10-30 | 2020-05-07 | 北京字节跳动网络技术有限公司 | 生成模型的方法和装置 |
US20200151613A1 (en) * | 2018-11-09 | 2020-05-14 | Lunit Inc. | Method and apparatus for machine learning |
KR20200054121A (ko) * | 2019-11-29 | 2020-05-19 | 주식회사 루닛 | 기계 학습 방법 및 장치 |
CN111612021A (zh) * | 2019-02-22 | 2020-09-01 | 中国移动通信有限公司研究院 | 一种错误样本识别方法、装置及终端 |
-
2021
- 2021-02-04 CN CN202110158715.XA patent/CN112819078B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019237657A1 (zh) * | 2018-06-15 | 2019-12-19 | 北京字节跳动网络技术有限公司 | 用于生成模型的方法和装置 |
WO2019242222A1 (zh) * | 2018-06-21 | 2019-12-26 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
CN108960314A (zh) * | 2018-06-26 | 2018-12-07 | 北京旷视科技有限公司 | 基于难样本的训练方法、装置及电子设备 |
WO2020087974A1 (zh) * | 2018-10-30 | 2020-05-07 | 北京字节跳动网络技术有限公司 | 生成模型的方法和装置 |
US20200151613A1 (en) * | 2018-11-09 | 2020-05-14 | Lunit Inc. | Method and apparatus for machine learning |
CN109902678A (zh) * | 2019-02-12 | 2019-06-18 | 北京奇艺世纪科技有限公司 | 模型训练方法、文字识别方法、装置、电子设备及计算机可读介质 |
CN111612021A (zh) * | 2019-02-22 | 2020-09-01 | 中国移动通信有限公司研究院 | 一种错误样本识别方法、装置及终端 |
KR20200054121A (ko) * | 2019-11-29 | 2020-05-19 | 주식회사 루닛 | 기계 학습 방법 및 장치 |
Non-Patent Citations (2)
Title |
---|
BAZINGA伟伟: "目标检测技巧:误识别数据喂入", 《 HTTPS://ZHUANLAN.ZHIHU.COM/P/116854985》, pages 1 - 3 * |
BIGSUPERZX: "python+opencv3.4.0 实现HOG+SVM行人检测", 《HTTPS://BLOG.CSDN.NET/QQ_33662995/ARTICLE/DETAILS/79356939》, pages 1 - 6 * |
Also Published As
Publication number | Publication date |
---|---|
CN112819078B (zh) | 2023-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111062495B (zh) | 机器学习方法及相关装置 | |
CN110362677B (zh) | 文本数据类别的识别方法及装置、存储介质、计算机设备 | |
CN105023165A (zh) | 社交网络平台中投放任务的控制方法、装置及系统 | |
CN108416003A (zh) | 一种图片分类方法和装置、终端、存储介质 | |
CN110457677B (zh) | 实体关系识别方法及装置、存储介质、计算机设备 | |
CN108334895B (zh) | 目标数据的分类方法、装置、存储介质及电子装置 | |
CN108108743A (zh) | 异常用户识别方法和用于识别异常用户的装置 | |
CN106611015A (zh) | 标签的处理方法及装置 | |
CN113378049A (zh) | 信息推荐模型的训练方法、装置、电子设备及存储介质 | |
CN111199244A (zh) | 一种数据的分类方法、装置、存储介质及电子装置 | |
CN111090807A (zh) | 一种基于知识图谱的用户识别方法及装置 | |
CN111914159A (zh) | 一种信息推荐方法及终端 | |
CN108319888A (zh) | 视频类型的识别方法及装置、计算机终端 | |
CN110610169A (zh) | 图片标注方法和装置、存储介质及电子装置 | |
CN113051486A (zh) | 基于交友场景的推荐模型的训练方法、装置、电子设备和计算机可读存储介质 | |
CN114419363A (zh) | 基于无标注样本数据的目标分类模型训练方法及装置 | |
CN114626380A (zh) | 实体识别的方法和装置、电子设备和存储介质 | |
CN115100739B (zh) | 人机行为检测方法、系统、终端设备及存储介质 | |
CN111126626A (zh) | 一种训练方法、装置、服务器、平台及存储介质 | |
CN113657087B (zh) | 信息的匹配方法及装置 | |
CN111506755A (zh) | 图片集的分类方法和装置 | |
CN112819078A (zh) | 一种识别模型的迭代方法和装置 | |
CN111813942B (zh) | 实体分类方法和装置 | |
CN112017634B (zh) | 数据的处理方法、装置、设备以及存储介质 | |
CN111126503A (zh) | 一种训练样本的生成方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |