CN113221875B

CN113221875B - 基于主动学习的目标检测模型训练方法

Info

Publication number: CN113221875B
Application number: CN202110769915.9A
Authority: CN
Inventors: 陈映; 曹松; 任必为; 郑翔; 宋君; 陶海
Original assignee: Beijing Vion Intelligent Technology Co ltd
Current assignee: Beijing Vion Intelligent Technology Co ltd
Priority date: 2021-07-08
Filing date: 2021-07-08
Publication date: 2021-09-21
Anticipated expiration: 2041-07-08
Also published as: CN113221875A

Abstract

本发明提供了一种基于主动学习的目标检测模型训练方法，包括：由专家标定输入数据集向模型训练数据集输入标记有专家标签的样本图像，和/或由无标定输入数据集向模型训练数据集输入无目标对象框选的样本图像；当模型训练数据集的样本图像数量值小于或等于数据上限值时，继续训练初始模型，当样本图像数量值大于数据上限值时，选取筛除图像后训练初始模型，在筛除图像中选取无专家标签的输入待标定困难样本数据集；对其中的筛除图像进行目标对象框选筛查及专家标签标记后输入专家标定输入数据集，重复上述方案，生成目标检测模型。本发明解决了现有技术中的为了提升目标检测模型泛化能力而导致训练数据集的数据量累积造成模型训练效率低下的问题。

Description

基于主动学习的目标检测模型训练方法

技术领域

本发明涉及图像处理技术领域，具体而言，涉及一种基于主动学习的目标检测模型训练方法。

背景技术

目标检测是一种基于目标几何和统计特征的图像理解算法，目标检测是将目标对象的定位和识别合二为一，例如：基于计算机视觉算法，检测出图像中不同类别的目标对象，即以矩形框标注出目标的位置，并识别出目标对象的类别。

为了能够使目标检测模型适合应用于不同的环境场景，提升目标检测模型的泛化能力，在对目标检测模型训练的过程中通常不断地优化调整模型参数，达到模型精修的目的；这就需要向用于目标检测模型训练的模型训练数据集内阶段性地输入来自于不同环境场景的样本图像，而模型训练数据集的数据量不断累积会导致模型训练难度提升、训练耗时严重，不利于目标检测模型的优化训练。因此，如何提供一种能够提升目标检测模型的泛化能力，同时兼顾提高了模型训练效率的目标检测模型训练方法便成了现有技术中亟待解决的问题。

发明内容

本发明的主要目的在于提供一种基于主动学习的目标检测模型训练方法，以解决现有技术中的目标检测模型训练过程中，为了提升模型泛化能力而导致训练数据集的数据量累积造成模型训练效率低下的问题。

为了实现上述目的，本发明提供了一种基于主动学习的目标检测模型训练方法，包括：步骤S1，构造模型训练数据集(Ⅰ)、专家标定输入数据集(Ⅱ)和无标定输入数据集(Ⅲ)，构造模型训练数据集(Ⅰ)用于训练初始模型，通过第一输送通道由专家标定输入数据集(Ⅱ)向模型训练数据集(Ⅰ)输入标记有专家标签的样本图像，和/或通过第二输送通道由无标定输入数据集(Ⅲ)向模型训练数据集(Ⅰ)输入无目标对象框选的样本图像；步骤S2，获取模型训练数据集(Ⅰ)中样本图像数量值，并与模型训练数据集(Ⅰ)预先设定的数据上限值比较，当其中的样本图像数量值小于或等于数据上限值时，利用模型训练数据集(Ⅰ)继续训练初始模型，当其中的样本图像数量值大于数据上限值时，执行下述步骤S3；步骤S3，根据选取条件在模型训练数据集(Ⅰ)中选取超出其数据上限值部分的数量的样本图像定义为筛除图像，将筛除图像取出模型训练数据集(Ⅰ)后利用模型训练数据集(Ⅰ)训练初始模型，并在筛除图像中选取至少一部分无专家标签的筛除图像归类输入待标定困难样本数据集(Ⅳ)；步骤S4，对归类输入待标定困难样本数据集(Ⅳ)中的筛除图像逐一进行目标对象框选筛查及专家标签标记后作为样本图像输入专家标定输入数据集(Ⅱ)，重复步骤S1至步骤S4，直至对初始模型完成预设训练轮数的训练和/或达到预设要求后生成目标检测模型。

进一步地，步骤S3包括：步骤S31，根据初始模型对模型训练数据集(Ⅰ)中的至少一部分样本图像进行损失值的计算，并将至少一部分样本图像按照各自对应的损失值降序排列，以构造损失值图像序列；步骤S32，由损失值图像序列的损失值高端开始遍历损失值图像序列并顺次选取n₁个无专家标签的样本图像作为用于输入待标定困难样本数据集(Ⅳ)的困难数据样本，由损失值图像序列的损失值低端开始遍历损失值图像序列并顺次选取n₂个样本图像作为简单数据样本，其中，困难数据样本的数量n₁和简单数据样本n₂之和等于筛除图像的数量X。

进一步地，步骤S3还包括：步骤S33，对简单数据样本中的样本图像逐一判定，当其中的样本图像标记有专家标签时，归类输入专家标定简单数据集(Ⅴ)，当其中的样本图像无专家标签时，归类输入常规简单数据集(Ⅵ)。

进一步地，在步骤S32中，困难数据样本的用于输入待标定困难样本数据集(Ⅳ)n₁个无专家标签的样本图像的损失值高于第一预设筛选范围值，第一预设筛选范围值大于等于1.2且小于等于1.6；在步骤S33中，简单数据样本中的归类输入专家标定简单数据集(Ⅴ)的样本图像的损失值低于第二预设筛选范围值，第二预设筛选范围值大于等于0.3且小于等于0.5。

进一步地，困难数据样本的数量n₁和简单数据样本n₂满足：1/9≦n₁/n₂≦1/5。

进一步地，在步骤S31中，根据初始模型对模型训练数据集(Ⅰ)中的去除掉来自专家标定输入数据集(Ⅱ)的输入部分和/或去除掉来自无标定输入数据集(Ⅲ)的输入部分后的剩余部分的样本图像进行损失值的计算，并将剩余部分的样本图像按照各自对应的损失值降序排列，以构造损失值图像序列。

进一步地，在步骤S4中，目标对象框选筛查及专家标签标记包括：当筛除图像中框选了正确的目标对象时，对筛除图像标记专家标签；当筛除图像中未框选正确的目标对象时，对筛除图像的框选修订后标记专家标签。

进一步地，标记专家标签为在筛除图像的文件格式命名中添加识别字符，以表示其中框选正确的目标对象。

进一步地，数据上限值大于等于10万且小于等于100万；预设训练轮数大于等于100万且小于等于900万；预设要求为当初始模型的召回率和精度值均大于等于0.9且小于等于1。

进一步地，专家标定输入数据集(Ⅱ)中的样本图像来源还包括新输入的且标记了专家标签的样本图像；无标定输入数据集(Ⅲ)中的样本图像来源为新输入的无专家标签的样本图像。

应用本发明的技术方案，通过主动学习这种半监督学习方式，不仅允许专家标定输入数据集(Ⅱ)向模型训练数据集(Ⅰ)输入标记有专家标签的样本图像和/或无标定输入数据集(Ⅲ)向模型训练数据集(Ⅰ)输入无目标对象框选的样本图像，以满足模型训练数据集(Ⅰ)内样本图像的多样性，有利于训练好的目标检测模型适用于不同的环境场景，而且能够同时实现对模型训练数据集(Ⅰ)中样本图像数量的精准化自动调控，确保目标检测模型训的训练稳定性；当模型训练数据集(Ⅰ)中的样本数量超过数据上限值时，超出的部分作为筛除图像，且可能存在错误标注信息的无专家标签的筛除图像被归类输入待标定困难样本数据集(Ⅳ)，进一步接受认为更正，即对待标定困难样本数据集(Ⅳ)中的筛除图像进行目标对象框选筛查及专家标签标记后作为样本图像输入专家标定输入数据集(Ⅱ)，以循环使用，这个过程避免了模型训练数据集(Ⅰ)中样本图像的数量累计过大，确保了训练目标检测模型过程的高效性和稳定性。

附图说明

构成本申请的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1示出了根据本发明的一种可选实施例的基于主动学习的目标检测模型训练方法的流程图；

图2示出了根据本发明的一种可选实施例的基于主动学习的目标检测模型训练方法中对数据集处理的流程示意图。

其中，上述附图包括以下附图标记：

Ⅰ、模型训练数据集；Ⅱ、专家标定输入数据集；Ⅲ、无标定输入数据集；Ⅳ、待标定困难样本数据集；Ⅴ、专家标定简单数据集；Ⅵ、常规简单数据集。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例。此外，术语“包括”、“和”、“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为了解决现有技术中的目标检测模型训练过程中，为了提升模型泛化能力而导致训练数据集的数据量累积造成模型训练效率低下的问题，本发明提供了一种基于主动学习的目标检测模型训练方法。

图1是根据本发明实施例的基于主动学习的目标检测模型训练方法的流程图。如图1所示，该方法包括步骤如下：

步骤S1，构造模型训练数据集(Ⅰ)、专家标定输入数据集(Ⅱ)和无标定输入数据集(Ⅲ)，构造模型训练数据集(Ⅰ)用于训练初始模型，通过第一输送通道由专家标定输入数据集(Ⅱ)向模型训练数据集(Ⅰ)输入标记有专家标签的样本图像，和/或通过第二输送通道由无标定输入数据集(Ⅲ)向模型训练数据集(Ⅰ)输入无目标对象框选的样本图像；

步骤S2，获取模型训练数据集(Ⅰ)中样本图像数量值，并与模型训练数据集(Ⅰ)预先设定的数据上限值比较，当其中的样本图像数量值小于或等于数据上限值时，利用模型训练数据集(Ⅰ)继续训练初始模型，当其中的样本图像数量值大于数据上限值时，执行下述步骤S3；

步骤S3，根据选取条件在模型训练数据集(Ⅰ)中选取超出其数据上限值部分的数量的样本图像定义为筛除图像，将筛除图像取出模型训练数据集(Ⅰ)后利用模型训练数据集(Ⅰ)训练初始模型，并在筛除图像中选取至少一部分无专家标签的筛除图像归类输入待标定困难样本数据集(Ⅳ)；

步骤S4，对归类输入待标定困难样本数据集(Ⅳ)中的筛除图像逐一进行目标对象框选筛查及专家标签标记后作为样本图像输入专家标定输入数据集(Ⅱ)，重复步骤S1至步骤S4，直至对初始模型完成预设训练轮数的训练和/或达到预设要求后生成目标检测模型。

应用上述的技术方案，如图2所示，通过主动学习这种半监督学习方式，不仅允许专家标定输入数据集(Ⅱ)向模型训练数据集(Ⅰ)输入标记有专家标签的样本图像和/或无标定输入数据集(Ⅲ)向模型训练数据集(Ⅰ)输入无目标对象框选的样本图像，以满足模型训练数据集(Ⅰ)内样本图像的多样性，有利于训练好的目标检测模型适用于不同的环境场景，而且能够同时实现对模型训练数据集(Ⅰ)中样本图像数量的精准化自动调控，确保目标检测模型训的训练稳定性；当模型训练数据集(Ⅰ)中的样本数量超过数据上限值时，超出的部分作为筛除图像，且可能存在错误标注信息的无专家标签的筛除图像被归类输入待标定困难样本数据集(Ⅳ)，进一步接受认为更正，即对待标定困难样本数据集(Ⅳ)中的筛除图像进行目标对象框选筛查及专家标签标记后作为样本图像输入专家标定输入数据集(Ⅱ)，以循环使用，这个过程避免了模型训练数据集(Ⅰ)中样本图像的数量累计过大，确保了训练目标检测模型过程的高效性和稳定性。

需要说明的是，在不同的环境场景获取的样本图像形成的模型训练数据集(Ⅰ)的数据是海量的，为了达到训练得到的目标检测模型的精确性，这个数据的量级能够达到百万级、千万级甚至亿级，这些数据初始都是未标注的数据，很多经典的分类算法并不能直接使用。而这样庞大的数据采用人工标注的代价是巨大的，本申请的技术方案利用主动学习的模型对样本图像进行自动标注，大大地提升了对海量的样本图像的标注效率，提高了目标检测模型的训练效率；同时不需要人工的过多干预，只是对待标定困难样本数据集(Ⅳ)中的筛除图像进行目标对象框选筛查及专家标签标记，以确保模型训练数据集(Ⅰ)的样本图像的数据可靠性。

在本发明中，步骤S3包括：步骤S31，根据初始模型对模型训练数据集(Ⅰ)中的至少一部分样本图像进行损失值的计算，并将至少一部分样本图像按照各自对应的损失值降序排列，以构造损失值图像序列；步骤S32，由损失值图像序列的损失值高端开始遍历损失值图像序列并顺次选取n₁个无专家标签的样本图像作为用于输入待标定困难样本数据集(Ⅳ)的困难数据样本，由损失值图像序列的损失值低端开始遍历损失值图像序列并顺次选取n₂个样本图像作为简单数据样本，其中，困难数据样本的数量n₁和简单数据样本n₂之和等于筛除图像的数量X。

这样，通过设置在模型训练数据集(Ⅰ)中选取作为筛除图像的样本图像的特定的选取条件，进一步实现了对筛除图像的分类，即将一部分筛除图像选取为损失值较高且无专家标签的样本图像，这部分作为困难数据样本输入待标定困难样本数据集(Ⅳ)，另一部分筛除图像选取为损失值较低的样本图像，这部分作为简单数据样本用于后续的继续精细分类。

进一步地，步骤S3还包括：步骤S33，对简单数据样本中的样本图像逐一判定，当其中的样本图像标记有专家标签时，归类输入专家标定简单数据集(Ⅴ)，当其中的样本图像无专家标签时，归类输入常规简单数据集(Ⅵ)。这样，实现对简单数据样本进一步分类，以便于归类进入相对应的数据集，方便后续的获取使用；同时还能控制进入待标定困难样本数据集(Ⅳ)的筛除图像的数量，避免因待标定困难样本数据集(Ⅳ)进入过多筛除图像而导致最终回归进入模型训练数据集(Ⅰ)的样本图像的数量过多，有利于对目标检测模型的精细化训练。

可选地，困难数据样本的数量n₁和简单数据样本n₂满足：1/9≦n₁/n₂≦1/5。这种比例范围能够以合理地限度减少作为筛除图像的原始位于模型训练数据集(Ⅰ)中的样本图像，有利于在下一轮次目标检测模型的训练中，模型训练数据集(Ⅰ)允许进入更多来自不同环境场景的新输入样本图像，使得目标检测模型能够记忆识别更多类样本图像，有利于提升训练好的目标检测模型的泛化能力。

可选地，在步骤S32中，困难数据样本的用于输入待标定困难样本数据集(Ⅳ)n₁个无专家标签的样本图像的损失值高于第一预设筛选范围值，第一预设筛选范围值大于等于1.2且小于等于1.6；当然，当损失值满足高于第一预设筛选范围值的无专家标签的样本图像的数量无法达到n₁时，可以仅选取满足高于第一预设筛选范围值的无专家标签的样本图像的部分，即实际获取的困难数据样本的样本图像的数量可以小于n₁，当然也可以不考虑第一预设筛选范围值的限制，直至取得既定n₁数量的无专家标签的样本图像作为困难数据样本为止；这样做是为了控制困难样本数据集(Ⅳ)中的样本精度，减小人工工作量；此外，当数量为X的筛除图像中的无专家标签的样本图像的数量少于n₁时，那么仅满足选取无专家标签的样本图像作为困难数据样本这一条件。

同样地，为了控制专家标定简单数据集(Ⅴ)的样本精度，在步骤S33中，简单数据样本中的归类输入专家标定简单数据集(Ⅴ)的样本图像的损失值低于第二预设筛选范围值，第二预设筛选范围值大于等于0.3且小于等于0.5，其根据样本图像中的检测目标不同而变化。优选地，第二预设筛选范围值为0.4。

需要说明的是，在步骤S31中，根据初始模型对模型训练数据集(Ⅰ)中的去除掉来自专家标定输入数据集(Ⅱ)的输入部分和/或去除掉来自无标定输入数据集(Ⅲ)的输入部分后的剩余部分的样本图像进行损失值的计算，并将剩余部分的样本图像按照各自对应的损失值降序排列，以构造损失值图像序列。这样是为了避免构造损失值图像序列中含有自专家标定输入数据集(Ⅱ)的输入部分和/或去除掉来自无标定输入数据集(Ⅲ)的输入部分的样本图像而继续被选取为筛除图像而造成数据集间的数据的无效循环。

还需要补充的是，如图2所示，无标定输入数据集(Ⅲ)和专家标定输入数据集(Ⅱ)均可以接受来自外界的新输入样本图像，即专家标定输入数据集(Ⅱ)中的样本图像来源还包括新输入的且标记了专家标签的样本图像；无标定输入数据集(Ⅲ)中的样本图像来源为新输入的无专家标签的样本图像。当无标定输入数据集(Ⅲ)混入新输入样本图像时刻直接混入，而当专家标定输入数据集(Ⅱ)混入新输入样本图像之前，需要采用人工方式或计算机标注方式对这部分新输入样本图像进行专家标定后输入专家标定输入数据集(Ⅱ)。当然，这也就取决于人工干预整个过程的时间行，当人工需要干预时间较长时采用后种方式达到向模型训练数据集(Ⅰ)中添加新输入样本图像的目的，而当人工不需要干预过多时，则采用前种方式将新输入样本图像直接输入无标定输入数据集(Ⅲ)。

在步骤S4中，目标对象框选筛查及专家标签标记包括：当筛除图像中框选了正确的目标对象时，对筛除图像标记专家标签；当筛除图像中未框选正确的目标对象时，对筛除图像的框选修订后标记专家标签。这样，能够确保输入专家标定输入数据集(Ⅱ)的样本图像必然存在目标框选和专家标签，确保专家标定输入数据集(Ⅱ)的合理性。

从便捷操作性的方面考虑，可选地，标记专家标签为在筛除图像的文件格式命名中添加识别字符，以表示其中框选正确的目标对象。

优选地，标记专家标签为在筛除图像的文件格式命名中添加英文识别字符“expert”或“professor”以具备显著性。

在本发明中，考虑到尽量避免训练目标检测模型对图形处理器的负担过重，将模型训练数据集(Ⅰ)的数据上限值大于等于10万且小于等于100万；当作为样本图像的数据量足够丰富时，对目标检测模型的预设训练轮数可以设定为大于等于100万且小于等于900万；同样，为了确保对目标检测模型的训练精确性，步骤S4中的预设要求可以为当初始模型的召回率和精度值均大于等于0.9且小于等于1。此外，还需要保证目标检测模型训练过程中总的迭代次数等于数据量乘以实际训练轮数。当召回率或精度值不满足预设要求时，需要使用专家标定简单数据集(Ⅴ)重新对初始模型进行训练。

需要补充说明的是，本申请还包括一种目标检测模型的验证方法，即使用检测模型验证集对通过上述方法训练好的目标检测模型进行验证，该检测模型验证集包含的样本图像不能为空，用于检测训练后的目标检测模型是否发生偏离。

本发明的目标检测模型以十分小的学习率进行训练，通常为1/10000到1/1000之间。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在上述计算机可读取的存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在存储介质中，包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的客户端，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于主动学习的目标检测模型训练方法，其特征在于，包括：

步骤S1，构造模型训练数据集(Ⅰ)、专家标定输入数据集(Ⅱ)和无标定输入数据集(Ⅲ)，所述构造模型训练数据集(Ⅰ)用于训练初始模型，通过第一输送通道由所述专家标定输入数据集(Ⅱ)向所述模型训练数据集(Ⅰ)输入标记有专家标签的样本图像，和/或通过第二输送通道由所述无标定输入数据集(Ⅲ)向所述模型训练数据集(Ⅰ)输入无目标对象框选的样本图像；

步骤S2，获取所述模型训练数据集(Ⅰ)中样本图像数量值，并与所述模型训练数据集(Ⅰ)预先设定的数据上限值比较，当其中的样本图像数量值小于或等于所述数据上限值时，利用所述模型训练数据集(Ⅰ)继续训练所述初始模型，当其中的样本图像数量值大于数据上限值时，执行下述步骤S3；

步骤S3，根据选取条件在所述模型训练数据集(Ⅰ)中选取超出其数据上限值部分的数量的样本图像定义为筛除图像，将所述筛除图像取出所述模型训练数据集(Ⅰ)后利用所述模型训练数据集(Ⅰ)训练所述初始模型，并在所述筛除图像中选取至少一部分无专家标签的所述筛除图像归类输入待标定困难样本数据集(Ⅳ)；所述选取条件为：步骤S31，根据所述初始模型对所述模型训练数据集(Ⅰ)中的至少一部分样本图像进行损失值的计算，并将所述至少一部分样本图像按照各自对应的所述损失值降序排列，以构造损失值图像序列；步骤S32，由所述损失值图像序列的损失值高端开始遍历所述损失值图像序列并顺次选取n₁个无专家标签的样本图像作为用于输入所述待标定困难样本数据集(Ⅳ)的困难数据样本，由所述损失值图像序列的损失值低端开始遍历所述损失值图像序列并顺次选取n₂个样本图像作为简单数据样本，其中，所述困难数据样本的数量n₁和所述简单数据样本n₂之和等于所述筛除图像的数量X；

步骤S4，对归类输入所述待标定困难样本数据集(Ⅳ)中的所述筛除图像逐一进行目标对象框选筛查及专家标签标记后作为样本图像输入所述专家标定输入数据集(Ⅱ)，重复所述步骤S1至所述步骤S4，直至对所述初始模型完成预设训练轮数的训练和/或达到预设要求后生成目标检测模型。

2.根据权利要求1所述的目标检测模型训练方法，其特征在于，所述步骤S3还包括：

步骤S33，对所述简单数据样本中的样本图像逐一判定，当其中的样本图像标记有专家标签时，归类输入专家标定简单数据集(Ⅴ)，当其中的样本图像无专家标签时，归类输入常规简单数据集(Ⅵ)。

3.根据权利要求2所述的目标检测模型训练方法，其特征在于，

在所述步骤S32中，所述困难数据样本的用于输入所述待标定困难样本数据集(Ⅳ)n₁个无专家标签的样本图像的损失值高于第一预设筛选范围值，所述第一预设筛选范围值大于等于1.2且小于等于1.6；

在所述步骤S33中，所述简单数据样本中的归类输入专家标定简单数据集(Ⅴ)的样本图像的损失值低于第二预设筛选范围值，所述第二预设筛选范围值大于等于0.3且小于等于0.5。

4.根据权利要求1所述的目标检测模型训练方法，其特征在于，所述困难数据样本的数量n₁和所述简单数据样本n₂满足：1/9≦n₁/n₂≦1/5。

5.根据权利要求1所述的目标检测模型训练方法，其特征在于，在所述步骤S31中，根据所述初始模型对所述模型训练数据集(Ⅰ)中的去除掉来自所述专家标定输入数据集(Ⅱ)的输入部分和/或去除掉来自所述无标定输入数据集(Ⅲ)的输入部分后的剩余部分的样本图像进行损失值的计算，并将所述剩余部分的样本图像按照各自对应的所述损失值降序排列，以构造所述损失值图像序列。

6.根据权利要求1所述的目标检测模型训练方法，其特征在于，在所述步骤S4中，所述目标对象框选筛查及专家标签标记包括：

当所述筛除图像中框选了正确的目标对象时，对所述筛除图像标记所述专家标签；

当所述筛除图像中未框选正确的目标对象时，对所述筛除图像的框选修订后标记所述专家标签。

7.根据权利要求6所述的目标检测模型训练方法，其特征在于，标记所述专家标签为在所述筛除图像的文件格式命名中添加识别字符，以表示其中框选正确的目标对象。

8.根据权利要求1所述的目标检测模型训练方法，其特征在于，

所述数据上限值大于等于10万且小于等于100万；

所述预设训练轮数大于等于100万且小于等于900万；

所述预设要求为当所述初始模型的召回率和精度值均大于等于0.9且小于等于1。

9.根据权利要求1所述的目标检测模型训练方法，其特征在于，所述专家标定输入数据集(Ⅱ)中的样本图像来源还包括新输入的且标记了所述专家标签的样本图像；所述无标定输入数据集(Ⅲ)中的样本图像来源为新输入的无专家标签的样本图像。