CN112434809B

CN112434809B - 基于主动学习的模型训练方法、装置及服务器

Info

Publication number: CN112434809B
Application number: CN202110104893.4A
Authority: CN
Inventors: 李源; 徐光耀; 刘少平; 蹇宜洋
Original assignee: Zhongke Zhiyun Technology Co ltd; Chengdu Dianze Intelligent Technology Co ltd
Current assignee: Zhongke Zhiyun Technology Co ltd; Chengdu Dianze Intelligent Technology Co ltd
Priority date: 2021-01-26
Filing date: 2021-01-26
Publication date: 2021-04-06
Anticipated expiration: 2041-01-26
Also published as: CN112434809A

Abstract

本申请实施例提供一种基于主动学习的模型训练方法、装置及服务器，能够自动调取启动的训练任务所指示的每个应用场景的训练样本，无需开发人员手动导出数据进行模型训练，通过调度与每个应用场景预先匹配的初始深度学习网络模型对训练样本进行样本标注后，再调度主动学习服务对已标注的训练样本进行主动筛选，无需开发人员参与标注，进而有效降低样本标注数量，之后可按照用户的校准指令对主动筛选样本进行校准后，灵活调度与每个应用场景关联的训练服务基于校准主动筛选样本进行模型训练，并发布到对应的每个应用场景对应的软件应用程序中，进而可以灵活对接不同应用场景的训练服务，并且实现训练过程的自动化标注、训练和业务更新。

Description

基于主动学习的模型训练方法、装置及服务器

技术领域

本申请涉及深度学习技术领域，具体而言，涉及一种基于主动学习的模型训练方法、装置及服务器。

背景技术

相关技术中，大部分人工智能技术都是机器学习中监督学习技术的相关应用，监督学习模型的开发过程需要使用样本数据进行模型训练，然后将训练后的监督学习模型封装成应用程序的模块部署到应用的场景中。当应用场景所采集的样本数据和训练时所采用的样本数据具有一定差别的情况下，监督学习模型将无法满足应用的需求，需要重新进行样本数据采集和再次训练，这将导致应用的成本上升，应用上线延期，并且重新采集样本再次训练的效率低下，还需要具有专业知识的算法工程师参与。应用场景由于业务变化，条件变化等也会导致监督学习模型的精度无法满足应用需求。

本申请发明人研究发现，对于基于监督学习的深度学习模型在训练数据与应用场景现场数据存在细微差别都可能导致模型无法满足应用的要求，在现有技术条件下只有采用从现场应用系统中导出数据并重新训练模型的方式改进原有模型适应现场环境的能力，这种方式操作复杂，自动化程度低，需要专业开发人员参与，样本标注工作大，往往还需更新现场应用系统才能使用重新训练的模型，导致研发效率低下，甚至影响业务的交付和上线。

发明内容

基于现有设计的不足，本申请提供一种基于主动学习的模型训练方法、装置及服务器，能够自动调取启动的训练任务所指示的每个应用场景的训练样本，无需开发人员手动导出数据进行模型训练，通过调度与每个应用场景预先匹配的初始深度学习网络模型对该应用场景的训练样本集的训练样本进行样本标注后，再调度主动学习服务对已标注的训练样本进行主动筛选，无需开发人员参与标注，进而有效降低样本标注数量，之后可按照用户对主动筛选样本的校准指令对主动筛选样本进行校准后，灵活调度与每个应用场景关联的训练服务基于每个应用场景的校准主动筛选样本进行模型训练，并发布到对应的每个应用场景对应的软件应用程序中，进而可以灵活对接不同应用场景的训练服务，并且实现训练过程的自动化标注、训练和业务更新。

根据本申请的第一方面，提供一种基于主动学习的模型训练方法，应用于服务器，所述方法包括：

在检测到训练任务启动后，调取所述训练任务所指示的每个应用场景的训练样本；

调度与每个应用场景预先匹配的初始深度学习网络模型对该应用场景的训练样本集的训练样本进行样本标注；

调度主动学习服务对已标注的训练样本进行主动筛选，获得每个应用场景的主动筛选样本，并根据用户对所述主动筛选样本的校准指令对所述主动筛选样本进行校准，获得校准主动筛选样本；

调度与每个应用场景关联的训练服务基于每个应用场景的校准主动筛选样本对每个应用场景预先匹配的初始深度学习网络模型进行训练，在训练过程满足训练终止条件时，获得每个应用场景的目标深度学习网络模型；

调度发布服务将每个应用场景的初始深度学习网络模型替换为所述目标深度学习网络模型后，发布到对应的每个应用场景对应的软件应用程序中。

在第一方面的一种可能的实施方式中，所述调度与每个应用场景预先匹配的深度学习网络模型对该应用场景的训练样本集的训练样本进行样本标注的步骤，包括：

调度与每个应用场景预先匹配的初始深度学习网络模型对该应用场景的训练样本集的训练样本进行分类，获得所述训练样本在每个标注标签下的置信度；

基于所述训练样本在每个标注标签下的置信度对所述训练样本进行样本标注。

在第一方面的一种可能的实施方式中，所述调度主动学习服务对已标注的训练样本进行主动筛选，获得每个应用场景的主动筛选样本的步骤，包括：

调度主动学习服务中的查询函数获取所述已标注的训练样本的信息熵；

基于所述已标注的训练样本的信息熵对已标注的训练样本进行主动筛选，获得每个应用场景的主动筛选样本。

在第一方面的一种可能的实施方式中，所述调度与每个应用场景关联的训练服务基于每个应用场景的校准主动筛选样本对每个应用场景预先匹配的深度学习网络模型进行训练，在训练过程满足训练终止条件时，获得每个应用场景的目标深度学习网络模型的步骤，包括：

调度与每个应用场景关联的训练服务，按照对应的训练策略将每个应用场景的校准主动筛选样本输入到每个应用场景预先匹配的初始深度学习网络模型中，获得所述校准主动筛选样本的预测标签；

根据所述校准主动筛选样本的预测标签和标注标签之间的损失函数值，调整所述初始深度学习网络模型的模型参数后，继续对所述深度学习网络模型进行训练，直到所述初始深度学习网络模型的预测精度满足预设预测精度条件后，获得每个应用场景的目标深度学习网络模型。

在第一方面的一种可能的实施方式中，所述方法还包括：

基于所述每个应用场景的目标深度学习网络模型对所述每个应用场景的待分类样本进行分类，获得所述每个应用场景的待分类样本的分类预测标签；

基于所述每个应用场景的待分类样本的分类预测标签和所述待分类样本的区域统计信息，生成所述每个应用场景的业务推送信息。

在第一方面的一种可能的实施方式中，所述基于所述每个应用场景的待分类样本的分类预测标签和所述待分类样本的区域统计信息，生成所述每个应用场景的业务推送信息的步骤，包括：

获取当前区域统计信息，所述当前区域统计信息包括进入当前区域的第一监控对象轨迹以及所述当前区域的监控对象工作状态，所述当前区域用于指示监控对象当前所处的监控区域位置，所述监控对象工作状态反映监控对象在所述当前区域的监控对象状态；

基于针对目标区域的监控对象跟踪进程，获取目标区域统计信息，所述目标区域统计信息包括所述目标区域的监控对象工作状态以及进入过所述目标区域的历史监控对象轨迹，所述监控对象跟踪进程用于指示监控对象由所述当前区域跟踪至所述目标区域；

对所述第一监控对象轨迹以及所述历史监控对象轨迹进行轨迹融合处理，得到符合监控对象画像特征且符合监控对象工作状态条件的监控对象融合轨迹，所述监控对象融合轨迹覆盖所述目标区域；

基于所述监控对象融合轨迹，更新所述目标区域对应的监控对象工作状态后，生成对应的业务推送信息。

在第一方面的一种可能的实施方式中，所述对所述第一监控对象轨迹以及所述历史监控对象轨迹进行轨迹融合处理，得到符合监控对象画像特征且符合监控对象工作状态条件的监控对象融合轨迹，包括：

按照基础融合策略，对所述第一监控对象轨迹以及所述历史监控对象轨迹进行轨迹融合处理，得到基础监控对象融合轨迹；

若所述基础监控对象融合轨迹符合所述监控对象画像特征，则使用所述基础监控对象融合轨迹作为所述监控对象融合轨迹；

若所述基础监控对象融合轨迹不符合所述监控对象画像特征，则确定所述当前区域与所述目标区域之间的区域归属关系；

在所述当前区域与所述目标区域之间存在所述区域归属关系的情况下，在所述目标区域之前的监控对象区域中进行广度优先遍历处理，得到符合所述监控对象画像特征的监控对象融合区域，所述当前区域之后的监控对象区域不会改变所述当前区域的监控对象工作状态；

基于所述监控对象融合区域生成所述监控对象融合轨迹；

在所述当前区域与所述目标区域之间不存在所述区域归属关系的情况下，基于导致所述基础监控对象融合轨迹不符合所述监控对象画像特征的目标监控对象工作状态，更改所述基础监控对象融合轨迹中涉及所述目标监控对象工作状态改变的监控对象区域，得到符合所述监控对象画像特征的所述监控对象融合轨迹；其中，所述目标监控对象工作状态改变用于满足所述监控对象画像特征，所述监控对象融合轨迹中除所述目标监控对象工作状态外的其他监控对象工作状态符合所述状态要求。

在第一方面的一种可能的实施方式中，所述在所述目标区域之前的监控对象区域中进行广度优先遍历处理之前，还包括：

获取目标决策区域之后的已追踪监控对象区域，所述目标决策区域是指导致所述基础监控对象融合轨迹不符合所述监控对象画像特征以及涉及所述目标监控对象工作状态判断的监控对象区域；

所述在所述目标区域之前的监控对象区域中进行广度优先遍历处理，得到符合所述监控对象画像特征的监控对象融合区域，包括：

除去所述目标决策区域的扩展区域中在所述历史轨迹上的监控对象区域，得到剩余已追踪监控对象区域；

在所述剩余区域中进行所述广度优先遍历处理，得到符合所述监控对象画像特征的监控对象融合区域；

其中，在广度优先遍历处理过程中，检测所述广度优先遍历处理的遍历迭代统计数；

在所述遍历迭代统计数未达到遍历迭代统计数阈值的情况下，对所述当前遍历区域进行区域判断处理，所述当前遍历区域是指当前遍历节点所述广度优先遍历处理进入的监控对象区域，所述广度优先遍历处理的起始区域为所述目标决策区域的目标扩展区域；

在所述当前遍历区域未通过所述区域判断处理的情况下，将所述当前遍历区域的下一扩展区域作为所述当前遍历区域，以及累加所述遍历迭代统计数，执行所述检测所述广度优先遍历处理的遍历迭代统计数的步骤；

在所述当前遍历区域通过所述区域判断处理的情况下，对所述当前遍历区域进行监控对象业务检测处理；

若所述当前遍历区域通过所述监控对象业务检测处理，则将所述当前遍历区域确定为所述监控对象融合区域；

若所述当前遍历区域未通过所述监控对象业务检测处理，则将所述当前遍历区域的下一扩展区域作为所述当前遍历区域，以及累加所述遍历迭代统计数，执行所述检测所述广度优先遍历处理的遍历迭代统计数的步骤；

在所述遍历迭代统计数达到遍历迭代统计数阈值的情况下，检测所述当前遍历区域的所有扩展区域是否均不在进入所述目标区域的所述历史监控对象轨迹上；

若所述当前遍历区域的所有扩展区域均不在所述历史监控对象轨迹上，则删除所述当前遍历区域所在的遍历分支；

若所述当前遍历区域的扩展区域中包含在所述历史监控对象轨迹上的目标扩展区域，则对所述目标扩展区域进行所述监控对象业务检测处理；

若所述目标扩展区域通过所述监控对象业务检测处理，则将所述目标扩展区域作为所述监控对象融合区域；

若所述目标扩展区域未通过所述监控对象业务检测处理，则删除所述当前遍历区域所在的遍历分支。

在第一方面的一种可能的实施方式中，所述对所述当前遍历区域进行区域判断处理，包括：

检测所述当前遍历区域是否为所述目标区域，或者是否在所述历史监控对象轨迹上；

若是，则确定所述当前遍历区域通过所述区域判断处理，否则确定所述当前遍历区域未通过所述区域判断处理；

所述对所述当前遍历区域进行监控对象业务检测处理，包括：

将所述第一监控对象轨迹与在所述历史监控对象轨迹上的所述当前遍历区域之后的历史轨迹进行轨迹融合处理，生成临时融合轨迹；

若所述临时融合轨迹符合所述监控对象画像特征，则确定所述当前遍历区域通过所述监控对象业务检测处理，否则确定所述当前遍历区域未通过所述监控对象业务检测处理。

在第一方面的一种可能的实施方式中，所述基于所述监控对象融合区域生成所述监控对象融合轨迹，包括：

将所述第一监控对象轨迹与在所述历史监控对象轨迹上的所述监控对象融合区域之后的历史轨迹进行轨迹融合处理，生成所述监控对象融合轨迹；

或者，将符合所述监控对象画像特征的临时融合轨迹作为所述监控对象融合轨迹。

在第一方面的一种可能的实施方式中，所述基于导致所述基础监控对象融合轨迹不符合所述监控对象画像特征的目标监控对象工作状态，更改所述基础监控对象融合轨迹中涉及所述目标监控对象工作状态改变的监控对象区域，得到符合所述监控对象画像特征的所述监控对象融合轨迹，包括：

标记所述目标监控对象工作状态，获取所述第一监控对象轨迹与所述历史监控对象轨迹之间所有的重合区域；

对所述第一监控对象轨迹中每两个相邻的重合区域之间的轨迹区间进行业务服务更新检测处理，所述业务服务更新检测处理用于检查所述轨迹区间上的监控对象区域是否涉及对被标记的所述目标监控对象工作状态的业务服务更新操作；

若目标轨迹区间内不存在涉及对所述目标监控对象工作状态进行业务服务更新操作的监控对象区域，则在所述目标轨迹区间内使用所述第一监控对象轨迹在所述目标轨迹区间对应的相邻重合区域之间形成的轨迹；

若所述目标轨迹区间内存在涉及对所述目标监控对象工作状态进行业务服务更新操作的监控对象区域，则在所述目标轨迹区间内使用所述历史监控对象轨迹在所述目标轨迹区间对应的相邻重合区域之间形成的轨迹，得到调整后的第一监控对象轨迹；

将所述调整后的第一监控对象轨迹与所述最后一个重合区域后的历史监控对象轨迹进行融合，得到更新融合轨迹；

若所述更新融合轨迹符合所述监控对象画像特征，则确定所述更新融合轨迹为所述监控对象融合轨迹，并停止对下一轨迹区间进行所述业务服务更新检测处理；

若所述更新融合轨迹符合所述监控对象画像特征，则对下一轨迹区间进行所述业务服务更新检测处理。

根据本申请的第二方面，提供一种基于主动学习的模型训练装置，应用于服务器，所述装置包括：

调取模块，用于在检测到训练任务启动后，调取所述训练任务所指示的每个应用场景的训练样本；

第一调度模块，用于调度与每个应用场景预先匹配的初始深度学习网络模型对该应用场景的训练样本集的训练样本进行样本标注；

第二调度模块，用于调度主动学习服务对已标注的训练样本进行主动筛选，获得每个应用场景的主动筛选样本，并根据用户对所述主动筛选样本的校准指令对所述主动筛选样本进行校准，获得校准主动筛选样本；

第三调度模块，用于调度与每个应用场景关联的训练服务基于每个应用场景的校准主动筛选样本对每个应用场景预先匹配的初始深度学习网络模型进行训练，在训练过程满足训练终止条件时，获得每个应用场景的目标深度学习网络模型；

第四调度模块，用于调度发布服务将每个应用场景的初始深度学习网络模型替换为所述目标深度学习网络模型后，发布到对应的每个应用场景对应的软件应用程序中。

根据本申请的第三方面，提供一种服务器，包括机器可读存储介质和处理器，所述机器可读存储介质中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行第一方面或者第一方面任意一种可能的实施方式所述的基于主动学习的模型训练方法。

基于上述任一方面，本申请能够自动调取启动的训练任务所指示的每个应用场景的训练样本，无需开发人员手动导出数据进行模型训练，通过调度与每个应用场景预先匹配的初始深度学习网络模型对该应用场景的训练样本集的训练样本进行样本标注后，再调度主动学习服务对已标注的训练样本进行主动筛选，无需开发人员参与标注，进而有效降低样本标注数量，之后可按照用户对主动筛选样本的校准指令对主动筛选样本进行校准后，灵活调度与每个应用场景关联的训练服务基于每个应用场景的校准主动筛选样本进行模型训练，并发布到对应的每个应用场景对应的软件应用程序中，进而可以灵活对接不同应用场景的训练服务，并且实现训练过程的自动化标注、训练和业务更新。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例所提供的基于主动学习的模型训练系统的场景示意图；

图2示出了本申请实施例所提供的基于主动学习的模型训练方法的流程示意图之一；

图3示出了本申请实施例所提供的基于主动学习的模型训练方法的流程示意图之二；

图4示出了图3中所示的步骤S170的子步骤流程示意图；

图5示出了本申请实施例所提供的基于主动学习的模型训练装置的功能模块示意图；

图6示出了本申请实施例所提供的用于实现上述的基于主动学习的模型训练方法的服务器的结构示意框图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，应当理解，本申请中附图仅起到说明和描述的目的，并不用于限定本申请的保护范围。另外，应当理解，示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请实施例的一些实施例实现的操作。

应该理解，流程图的操作可以不按顺序实现，没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外，本领域技术人员在本申请内容的指引下，可以向流程图添加一个或多个其它操作，也可以从流程图中移除一个或多个操作。

参照图1所示，图1示出了本申请实施例提供的基于主动学习的模型训练系统10的场景示意图。例如，基于主动学习的模型训练系统10可以包括服务器100以及与服务器100通信连接的多个样本采集设备200和计算机终端300，样本采集设备200可以用于对所监控区域进行红外热成像跟踪，从而将热成像视频流传输给服务器100进行视频流处理。

本实施例中，服务器100用于为样本采集设备200和计算机终端300提供后台服务。例如，服务器100可以是上述应用程序的后台服务器。服务器100可以是一台服务器，也可以是由多台服务器组成的服务器集群，或者是一个云计算服务中心，可以提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务。可选地，服务器100同时为多个样本采集设备200中的应用程序提供后台服务。

本申请实施例提供的基于主动学习的模型训练方法，各步骤的执行主体可以是服务器100，也可以是样本采集设备200(如样本采集设备200中运行的应用程序的客户端)和计算机终端300，还可以是由样本采集设备200、和计算机终端300和服务器100交互配合执行。

可以理解，图1所示的基于主动学习的模型训练系统10仅为一种可行的示例，在其它可行的实施例中，该基于主动学习的模型训练系统10也可以仅包括图1所示组成部分的其中一部分或者还可以包括其它的组成部分。

图2示出了本申请实施例提供的基于主动学习的模型训练方法的流程示意图，该基于主动学习的模型训练方法可以由图1中所示的基于主动学习的模型训练系统10执行，具体而言可以是由服务器100执行，或者也可以是由其它具有任意计算处理能力的其它装置执行，应当理解，在其它实施例中，本实施例的基于主动学习的模型训练方法其中部分步骤的顺序可以根据实际需要相互交换，或者其中的部分步骤也可以省略或删除。该基于主动学习的模型训练方法的详细步骤介绍如下。

步骤S110，在检测到训练任务启动后，调取训练任务所指示的每个应用场景的训练样本。

本实施例中，开发人员可以灵活配置训练任务，如训练任务的应用场景、训练任务的启动时间、训练任务的结束时间、训练任务的迭代次数等，但不限于此。例如，在检测到训练任务启动后，可以自动调取训练任务所指示的每个应用场景的训练样本，而无需开发人员手动导出数据，进而提高了训练自动化程度，减少开发人员的操作流程。

本实施例中，调取训练任务所指示的每个应用场景的训练样本可以是：

（1）调度样本采集设备200按规则采集现场应用场景的训练样本。例如，可以预先设定相对应的抽帧规则，抽帧规则可根据不同需求进行设置，根据不同应用场景选用具体的样本采集设备200以及抽帧规则进行样本采集。如规则名称（每天中午12点到18点采集）、规则类型（周期性每天采集）、抽帧开始时间、抽帧结束时间、抽帧间隔、抽帧间隔类型等，但不限于此。又例如，还可以进一步设定相对应的视频源参数，例如视频源名称（某工地某场景人形检测）、视频源类型（摄像头）。

（2）开发人员通过开放的业务接口上传自定义样本。

（3）通过应用系统接口自动上报现场样本的识别结果。

步骤S120，调度与每个应用场景预先匹配的初始深度学习网络模型对该应用场景的训练样本集的训练样本进行样本标注。

本实施例中，初始深度学习网络模型可以采用但不限于卷积神经网络、深度信任网络模型和堆栈自编码网络模型等，但不限于此。这些初始深度学习网络模型可以基于初始训练集进行初始训练获得，例如可以采用Yolo v4算法在COCO数据集选取3000张包含人形的图片训练的模型作为基础的初始深度学习网络模型。

在此基础上，可以调度与每个应用场景预先匹配的初始深度学习网络模型对该应用场景的训练样本集的训练样本进行分类，获得所述训练样本在每个标注标签下的置信度，然后基于所述训练样本在每个标注标签下的置信度对所述训练样本进行样本标注。例如，可以将最大置信度所对应标注标签作为训练样本的目标标注标签。

步骤S130，调度主动学习服务对已标注的训练样本进行主动筛选，获得每个应用场景的主动筛选样本，并根据用户对主动筛选样本的校准指令对主动筛选样本进行校准，获得校准主动筛选样本。

在某些情况下，通常没有类标签的数据相当丰富而有类标签的数据相当稀少，并且人工对数据进行标记的成本又相当高昂。在这种情况下，可以调度主动学习服务主动地提出要对哪些数据进行标注，之后根据用户对主动筛选样本的校准指令对主动筛选样本进行校准，获得校准主动筛选样本，再将这些校准主动筛选样本加入到训练样本集中对算法进行训练，由此完成主动学习的过程。

例如，在一种可能的实施方式中，可以调度主动学习服务中的查询函数获取已标注的训练样本的信息熵，基于已标注的训练样本的信息熵对已标注的训练样本进行主动筛选，获得每个应用场景的主动筛选样本。在主动学习服务中，可以通过对已标注的训练样本进行一次预测，根据预测结果将已标注的训练样本分成两类，一类是不确定性大，也就是信息熵大的样本，另一类是不确定性小但是信息熵也小的样本。然后针对信息熵大的样本再次训练。

步骤S140，调度与每个应用场景关联的训练服务基于每个应用场景的校准主动筛选样本对每个应用场景预先匹配的初始深度学习网络模型进行训练，在训练过程满足训练终止条件时，获得每个应用场景的目标深度学习网络模型。

例如，在一种可能的实施方式中，可以调度与每个应用场景关联的训练服务，按照对应的训练策略将每个应用场景的校准主动筛选样本输入到每个应用场景预先匹配的初始深度学习网络模型中，获得校准主动筛选样本的预测标签。在此基础上，可以根据校准主动筛选样本的预测标签和标注标签之间的损失函数值，调整初始深度学习网络模型的模型参数后，继续对深度学习网络模型进行训练，直到初始深度学习网络模型的预测精度满足预设预测精度条件后，获得每个应用场景的目标深度学习网络模型。

步骤S150，调度发布服务将每个应用场景的初始深度学习网络模型替换为目标深度学习网络模型后，发布到对应的每个应用场景对应的软件应用程序中。

基于上述步骤，本实施例能够自动调取启动的训练任务所指示的每个应用场景的训练样本，无需开发人员手动导出数据进行模型训练，通过调度与每个应用场景预先匹配的初始深度学习网络模型对该应用场景的训练样本集的训练样本进行样本标注后，再调度主动学习服务对已标注的训练样本进行主动筛选，无需开发人员参与标注，进而有效降低样本标注数量，之后可按照用户对主动筛选样本的校准指令对主动筛选样本进行校准后，灵活调度与每个应用场景关联的训练服务基于每个应用场景的校准主动筛选样本对进行模型训练，并发布到对应的每个应用场景对应的软件应用程序中，进而可以灵活对接不同应用场景的训练服务，并且实现训练过程的自动化标注、训练和业务更新。

作为一种示例，以应用场景1为工地人形检测模型主动学习为例，在工地施工现场，需要用人形检测模型对摄像头获取的监控画面进行分析，检测出画面内人形的位置并用矩形框框出，但人形检测模型并不一定适用于所有的监控场景，所以需要在实际使用中对人形检测进行训练更新。

例如，首先可以采集样本。以摄像头采集为例，抽帧规则可根据不同需求进行设置，根据不同场景选用具体的摄像头流以及抽帧规则进行样本采集。然后，通过样本标注服务使用与现场匹配的初始工地人形检测模型对采集的样本进行标注，例如通过初始工地人形检测模型标注出某个样本中的2个人形框。

在此基础上，可调度主动学习服务对已标注的样本进行主动筛选，例如经过主动学习筛选N张样本中的M（M小于N）张困难样本。接下来，建立标注校准任务，开发人员对主动筛选出样本进行人工校准。例如，主动学习服务挑选出的困难样本中出现了一个错误标注框，此时就需要开发人员手动将错误标注框删除。同样，若出现少标，或标注不准的情况，开发人员手动都可以手动校准，例如，如果一个框未标正确，且少标一个框，即可以人工修正。同时，人工新添加的标注框可以采用另外颜色进行区分。

接下来，可以将校准后的样本整合成训练样本集，调度工地人形检测模型相对应的训练服务进行训练，在校准完成后，选择开始训练即可开始训练任务，在整个训练过程中可以判断检验精度是否达标，训练完成后精度未满足要求，则需要进一步的训练。当精度满足要求后，才可选择发布，将已经训练好的目标工地人形检测模型替换掉之前的初始工地人形检测模型。

作为另一种示例，以应用场景2为工地闸机安全帽佩戴为例，在工地闸机通道出，需要对员工头像进行拍摄，并判断员工是否佩戴安全帽。各个闸机通道光线不同，安全帽佩戴识别模型的适应性也不同，所以需要在实际使用中对安全帽佩戴识别模型进行训练更新。

例如，首先可以采集样本。以现场人员上传自定义图片为例，可以选择上传样本即可完成上传，图片文件或压缩文件的方式均可。

然后，通过样本标注服务使用与现场匹配的初始安全帽佩戴识别模型对采集的样本进行标注，人形检测属于检测模型，即在一张图内框选并标注出目标的位置，而安全帽分类属于图像分类，即对一张图像进行判断属于哪种类别。例如一张正确佩戴安全帽的图像样本如果被分为佩戴安全帽，那么则标注正确。

接着，可以调度主动学习服务对已标注的样本进行主动筛选，开发人员对筛选出来的样本进行人工校准。例如，假设主动学习所筛选出来的困难样本标注出错，将佩戴安全帽的人员判断为未带安全帽，那么则可能需要现场人工校准应该修改图片标签。

接下来，可以将校准后的样本整合成训练样本集，调度安全帽佩戴识别模型相对应的训练服务进行训练，在校准完成后，选择开始训练即可开始训练任务，在整个训练过程中可以判断检验精度是否达标，训练完成后精度未满足要求，则需要进一步的训练。当精度满足要求后，才可选择发布，将已经训练好的目标安全帽佩戴识别模型替换掉之前的初始安全帽佩戴识别模型。

在一种可能的实施方式中，在以上描述的基础上，请结合参阅图3，本申请实施例所提供的方法还可以包括以下步骤S160和步骤S170，具体描述如下。

步骤S160，基于每个应用场景的目标深度学习网络模型对每个应用场景的待分类样本进行分类，获得每个应用场景的待分类样本的分类预测标签。

本实施例中，训练获得每个应用场景的目标深度学习网络模型后，即可具备针对每个应用场景的待分类样本的分类预测能力，因此可以对每个应用场景的待分类样本进行分类，获得每个应用场景的待分类样本的分类预测标签。例如，假设目标深度学习网络模型为人形检测模型，那么可以对每个应用场景的待分类样本进行分类，获得每个应用场景的待分类样本的人形框。又例如，假设目标深度学习网络模型为安全帽佩戴检测模型，那么可以对每个应用场景的待分类样本进行分类，获得每个应用场景的待分类样本的安全帽佩戴标签（佩戴安全帽或者未佩戴安全帽）。

步骤S170，基于每个应用场景的待分类样本的分类预测标签和待分类样本的区域统计信息，生成每个应用场景的业务推送信息。

本实施例中，在确定每个应用场景的待分类样本的分类预测标签，考虑到实际应用场景多为现场工地服务场景，因此需要结合每个应用场景的待分类样本的分类预测标签进一步进行业务推送提示。

例如，在一种可能的实施方式中，请结合参阅图4，步骤S170可以通过以下示例性的子步骤实现，详细描述如下。

子步骤S171，获取当前区域统计信息。

本实施例中，当前区域统计信息可以包括进入当前区域的第一监控对象轨迹以及当前区域的监控对象工作状态，当前区域用于指示监控对象当前所处的监控区域位置，监控对象工作状态反映监控对象在当前区域的监控对象状态。监控对象工作状态可以依据应用场景的待分类样本的分类预测标签进行确定，如监控对象所在区域的工作状态和自身的工作状态等。

子步骤S172，基于针对目标区域的监控对象跟踪进程，获取目标区域统计信息。

本实施例中，目标区域统计信息例如可以包括目标区域的监控对象工作状态以及进入过目标区域的历史监控对象轨迹，监控对象跟踪进程用于指示监控对象由当前区域跟踪至目标区域。

子步骤S173，对第一监控对象轨迹以及历史监控对象轨迹进行轨迹融合处理，得到符合监控对象画像特征且符合监控对象工作状态条件的监控对象融合轨迹，监控对象融合轨迹覆盖目标区域。

子步骤S174，基于监控对象融合轨迹，更新目标区域对应的监控对象工作状态后，生成对应的业务推送信息。

基于上述子步骤，通过基于进入当前监控对象区域的最新轨迹以及最新的监控对象参数，在保证同时满足监控对象画像特征以及监控对象状态要求两方面限制的前提下，对当前轨迹与历史轨迹进行轨迹融合，得到符合监控对象画像特征且符合监控对象状态要求的监控对象融合轨迹，保证了穿越操作后的新轨迹不会因为决策区域存在而导致融合轨迹不通的问题，并且融合出的轨迹满足最大程度的参数改变，有效保留最新的监控对象状态。

在一种可能的实施方式中，对于子步骤S173，可以按照基础融合策略，对第一监控对象轨迹以及历史监控对象轨迹进行轨迹融合处理，得到基础监控对象融合轨迹。

在一种示例中，若基础监控对象融合轨迹符合监控对象画像特征，则使用基础监控对象融合轨迹作为监控对象融合轨迹。

在另一种示例中，若基础监控对象融合轨迹不符合监控对象画像特征，则确定当前区域与目标区域之间的区域归属关系。

由此，在当前区域与目标区域之间存在区域归属关系的情况下，在目标区域之前的监控对象区域中进行广度优先遍历处理，得到符合监控对象画像特征的监控对象融合区域。其中，值得说明的是，当前区域之后的监控对象区域不会改变当前区域的监控对象工作状态。从而可以基于监控对象融合区域生成监控对象融合轨迹。

此外，在当前区域与目标区域之间不存在区域归属关系的情况下，可以基于导致基础监控对象融合轨迹不符合监控对象画像特征的目标监控对象工作状态，更改基础监控对象融合轨迹中涉及目标监控对象工作状态改变的监控对象区域，得到符合监控对象画像特征的监控对象融合轨迹。

其中，值得说明的是，目标监控对象工作状态改变用于满足监控对象画像特征，监控对象融合轨迹中除目标监控对象工作状态外的其他监控对象工作状态符合状态要求。

在一种可能的实施方式中，在目标区域之前的监控对象区域中进行广度优先遍历处理之前，还可以具体获取目标决策区域之后的已追踪监控对象区域，目标决策区域是指导致基础监控对象融合轨迹不符合监控对象画像特征以及涉及目标监控对象工作状态判断的监控对象区域。

这样，在目标区域之前的监控对象区域中进行广度优先遍历处理，得到符合监控对象画像特征的监控对象融合区域的过程中，可以除去目标决策区域的扩展区域中在历史轨迹上的监控对象区域，得到剩余已追踪监控对象区域，在剩余区域中进行广度优先遍历处理，得到符合监控对象画像特征的监控对象融合区域。

其中，在一种可能的实施方式中，可以在广度优先遍历处理过程中，检测广度优先遍历处理的遍历迭代统计数，在遍历迭代统计数未达到遍历迭代统计数阈值的情况下，对当前遍历区域进行区域判断处理。

值得说明的是，当前遍历区域是指当前遍历节点广度优先遍历处理进入的监控对象区域，广度优先遍历处理的起始区域为目标决策区域的目标扩展区域。

在当前遍历区域未通过区域判断处理的情况下，将当前遍历区域的下一扩展区域作为当前遍历区域，以及累加遍历迭代统计数，执行检测广度优先遍历处理的遍历迭代统计数的步骤。

再例如，在当前遍历区域通过区域判断处理的情况下，对当前遍历区域进行监控对象业务检测处理，若当前遍历区域通过监控对象业务检测处理，则将当前遍历区域确定为监控对象融合区域，若当前遍历区域未通过监控对象业务检测处理，则将当前遍历区域的下一扩展区域作为当前遍历区域，以及累加遍历迭代统计数，执行检测广度优先遍历处理的遍历迭代统计数的步骤。

在另一种情况下，在遍历迭代统计数达到遍历迭代统计数阈值的情况下，检测当前遍历区域的所有扩展区域是否均不在进入目标区域的历史监控对象轨迹上，若当前遍历区域的所有扩展区域均不在历史监控对象轨迹上，则删除当前遍历区域所在的遍历分支。若当前遍历区域的扩展区域中包含在历史监控对象轨迹上的目标扩展区域，则对目标扩展区域进行监控对象业务检测处理。若目标扩展区域通过监控对象业务检测处理，则将目标扩展区域作为监控对象融合区域。若目标扩展区域未通过监控对象业务检测处理，则删除当前遍历区域所在的遍历分支。

在一种可能的实施方式中，在对当前遍历区域进行区域判断处理的过程中，可以检测当前遍历区域是否为目标区域，或者是否在历史监控对象轨迹上，若是，则确定当前遍历区域通过区域判断处理，否则确定当前遍历区域未通过区域判断处理。

在对当前遍历区域进行监控对象业务检测处理的过程中，可以将第一监控对象轨迹与在历史监控对象轨迹上的当前遍历区域之后的历史轨迹进行轨迹融合处理，生成临时融合轨迹。若临时融合轨迹符合监控对象画像特征，则确定当前遍历区域通过监控对象业务检测处理，否则确定当前遍历区域未通过监控对象业务检测处理。

在一种可能的实施方式中，在基于监控对象融合区域生成监控对象融合轨迹的过程中，可以将第一监控对象轨迹与在历史监控对象轨迹上的监控对象融合区域之后的历史轨迹进行轨迹融合处理，生成监控对象融合轨迹。或者，将符合监控对象画像特征的临时融合轨迹作为监控对象融合轨迹。

在一种可能的实施方式中，在基于导致基础监控对象融合轨迹不符合监控对象画像特征的目标监控对象工作状态，更改基础监控对象融合轨迹中涉及目标监控对象工作状态改变的监控对象区域，得到符合监控对象画像特征的监控对象融合轨迹的过程中，可以标记目标监控对象工作状态，获取第一监控对象轨迹与历史监控对象轨迹之间所有的重合区域，对第一监控对象轨迹中每两个相邻的重合区域之间的轨迹区间进行业务服务更新检测处理，业务服务更新检测处理用于检查轨迹区间上的监控对象区域是否涉及对被标记的目标监控对象工作状态的业务服务更新操作。

例如，若目标轨迹区间内不存在涉及对目标监控对象工作状态进行业务服务更新操作的监控对象区域，则在目标轨迹区间内使用第一监控对象轨迹在目标轨迹区间对应的相邻重合区域之间形成的轨迹。

又例如，若目标轨迹区间内存在涉及对目标监控对象工作状态进行业务服务更新操作的监控对象区域，则在目标轨迹区间内使用历史监控对象轨迹在目标轨迹区间对应的相邻重合区域之间形成的轨迹，得到调整后的第一监控对象轨迹。

这样，可以将调整后的第一监控对象轨迹与最后一个重合区域后的历史监控对象轨迹进行融合，得到更新融合轨迹。若更新融合轨迹符合监控对象画像特征，则确定更新融合轨迹为监控对象融合轨迹，并停止对下一轨迹区间进行业务服务更新检测处理。若更新融合轨迹符合监控对象画像特征，则对下一轨迹区间进行业务服务更新检测处理。

基于同一发明构思，请参阅图5，示出了本申请实施例提供的基于主动学习的模型训练装置110的功能模块示意图，本实施例可以根据上述方法实施例对基于主动学习的模型训练装置110进行功能模块的划分。例如，可以对应各个功能划分各个功能模块，也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。需要说明的是，本申请实施例中对模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。比如，在采用对应各个功能划分各个功能模块的情况下，图5示出的基于主动学习的模型训练装置110只是一种装置示意图。其中，基于主动学习的模型训练装置110可以包括调取模块111，、第一调度模块112、第二调度模块113、第三调度模块114以及第四调度模块115，下面分别对该基于主动学习的模型训练装置110的各个功能模块的功能进行详细阐述。

调取模块111，用于在检测到训练任务启动后，调取所述训练任务所指示的每个应用场景的训练样本。可以理解，该调取模块111，可以用于执行上述步骤S110，关于该调取模块111，的详细实施方式可以参照上述对步骤S110有关的内容。

第一调度模块112，用于调度与每个应用场景预先匹配的初始深度学习网络模型对该应用场景的训练样本集的训练样本进行样本标注。可以理解，该第一调度模块112可以用于执行上述步骤S120，关于该第一调度模块112的详细实施方式可以参照上述对步骤S120有关的内容。

第二调度模块113，用于调度主动学习服务对已标注的训练样本进行主动筛选，获得每个应用场景的主动筛选样本，并根据用户对所述主动筛选样本的校准指令对所述主动筛选样本进行校准，获得校准主动筛选样本。可以理解，该第二调度模块113可以用于执行上述步骤S130，关于该第二调度模块113的详细实施方式可以参照上述对步骤S130有关的内容。

第三调度模块114，用于调度与每个应用场景关联的训练服务基于每个应用场景的校准主动筛选样本对每个应用场景预先匹配的初始深度学习网络模型进行训练，在训练过程满足训练终止条件时，获得每个应用场景的目标深度学习网络模型。可以理解，该第三调度模块114可以用于执行上述步骤S140，关于该第三调度模块114的详细实施方式可以参照上述对步骤S140有关的内容。

第四调度模块115，用于调度发布服务将每个应用场景的初始深度学习网络模型替换为所述目标深度学习网络模型后，发布到对应的每个应用场景对应的软件应用程序中。可以理解，该第四调度模块115可以用于执行上述步骤S150，关于该第四调度模块115的详细实施方式可以参照上述对步骤S150有关的内容。

基于同一发明构思，请参阅图6，示出了本申请实施例提供的用于执行上述基于主动学习的模型训练方法的服务器100的结构示意框图，该服务器100可以包括基于主动学习的模型训练装置110、机器可读存储介质120和处理器130。

在一种可能的实施方式中，机器可读存储介质120与处理器130均位于服务器100中且二者分离设置。然而，应当理解的是，机器可读存储介质120也可以是独立于服务器100之外，且可以由处理器130通过总线接口来访问。可替换地，机器可读存储介质120也可以集成到处理器130中，例如，可以是高速缓存和/或通用寄存器。

处理器130是该服务器100的控制中心，利用各种接口和线路连接整个服务器100的各个部分，通过运行或执行存储在机器可读存储介质120内的软件程序和/或模块，以及调用存储在机器可读存储介质120内的数据，执行该服务器100的各种功能和处理数据，从而对服务器100进行整体监控。可选地，处理器130可包括一个或多个处理核心。例如，处理器130可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、监控对象界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器中。

其中，处理器130可以是一个通用的中央处理器(Central Processing Unit，CPU)，微处理器，特定应用集成电路(Application-Specific Integrated Circuit，ASIC)，或一个或多个用于控制上述方法实施例提供的基于主动学习的模型训练方法的程序执行的集成电路。

机器可读存储介质120可以是ROM或可存储静态信息和指令的其它类型的静态存储设备，RAM或者可存储信息和指令的其它类型的动态存储设备，也可以是电可擦可编程只读存储器、只读光盘或其它光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其它磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其它介质，但不限于此。机器可读存储介质120可以是独立存在，通过通信总线与处理器130相连接。机器可读存储介质120也可以和处理器集成在一起。其中，机器可读存储介质120用于存储执行本申请方案的机器可执行指令，例如可以存储基于主动学习的模型训练装置110中各个软件功能模块（如图5中所示的调取模块111，、第一调度模块112、第二调度模块113、第三调度模块114以及第四调度模块115）的机器可执行指令。处理器130用于执行机器可读存储介质120中存储的机器可执行指令，以实现前述方法实施例提供的基于主动学习的模型训练方法。

由于本申请实施例提供的服务器100是上述服务器100执行的方法实施例的另一种实现形式，且服务器100可用于执行上述方法实施例提供的基于主动学习的模型训练方法，因此其所能获得的技术效果可参考上述方法实施例，在此不再赘述。

进一步地，本申请实施例还提供一种包含计算机可执行指令的可读存储介质，计算机可执行指令在被执行时可以用于实现上述方法实施例提供的基于主动学习的模型训练方法。

当然，本申请实施例所提供的一种包含计算机可执行指令的存储介质，其计算机可执行指令不限于如上的方法操作，还可以执行本申请任意实施例所提供的基于主动学习的模型训练方法中的相关操作。

本申请实施例是参照根据本申请实施例的方法、设备和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其它可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其它可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

以上所描述的实施例仅仅是本申请的一部分实施例，而不是全部的实施例。通常在附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，在附图中提供的本申请的实施例的详细描述并非旨在边界本申请的保护范围，而仅仅是表示本申请的选定实施例。此外，基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下可获得的所有其它实施例，都应属于本申请保护的范围。

Claims

1.一种基于主动学习的模型训练方法，其特征在于，应用于服务器，所述方法包括：

调度发布服务将每个应用场景的初始深度学习网络模型替换为所述目标深度学习网络模型后，发布到对应的每个应用场景对应的软件应用程序中；

所述方法还包括：

基于所述每个应用场景的待分类样本的分类预测标签和所述待分类样本的区域统计信息，生成所述每个应用场景的业务推送信息；

其中，所述基于所述每个应用场景的待分类样本的分类预测标签和所述待分类样本的区域统计信息，生成所述每个应用场景的业务推送信息的步骤，包括：

基于所述监控对象融合轨迹，更新所述目标区域对应的监控对象工作状态后，生成对应的业务推送信息；

其中，所述对所述第一监控对象轨迹以及所述历史监控对象轨迹进行轨迹融合处理，得到符合监控对象画像特征且符合监控对象工作状态条件的监控对象融合轨迹，包括：

基于所述监控对象融合区域生成所述监控对象融合轨迹；

在所述当前区域与所述目标区域之间不存在所述区域归属关系的情况下，基于导致所述基础监控对象融合轨迹不符合所述监控对象画像特征的目标监控对象工作状态，更改所述基础监控对象融合轨迹中涉及所述目标监控对象工作状态改变的监控对象区域，得到符合所述监控对象画像特征的所述监控对象融合轨迹；其中，所述目标监控对象工作状态改变用于满足所述监控对象画像特征，所述监控对象融合轨迹中除所述目标监控对象工作状态外的其他监控对象工作状态符合状态要求；

其中，所述在所述目标区域之前的监控对象区域中进行广度优先遍历处理之前，还包括：

除去所述目标决策区域的扩展区域中在历史轨迹上的监控对象区域，得到剩余已追踪监控对象区域；

在剩余区域中进行所述广度优先遍历处理，得到符合所述监控对象画像特征的监控对象融合区域；

在所述遍历迭代统计数未达到遍历迭代统计数阈值的情况下，对当前遍历区域进行区域判断处理，所述当前遍历区域是指当前遍历节点所述广度优先遍历处理进入的监控对象区域，所述广度优先遍历处理的起始区域为所述目标决策区域的目标扩展区域；

2.根据权利要求1所述的基于主动学习的模型训练方法，其特征在于，所述调度与每个应用场景预先匹配的深度学习网络模型对该应用场景的训练样本集的训练样本进行样本标注的步骤，包括：

3.根据权利要求1所述的基于主动学习的模型训练方法，其特征在于，所述调度主动学习服务对已标注的训练样本进行主动筛选，获得每个应用场景的主动筛选样本的步骤，包括：

4.根据权利要求1所述的基于主动学习的模型训练方法，其特征在于，所述调度与每个应用场景关联的训练服务基于每个应用场景的校准主动筛选样本对每个应用场景预先匹配的深度学习网络模型进行训练，在训练过程满足训练终止条件时，获得每个应用场景的目标深度学习网络模型的步骤，包括：

5.一种基于主动学习的模型训练装置，其特征在于，应用于服务器，所述装置包括：

第四调度模块，用于调度发布服务将每个应用场景的初始深度学习网络模型替换为所述目标深度学习网络模型后，发布到对应的每个应用场景对应的软件应用程序中；

其中：

所述服务器基于所述每个应用场景的目标深度学习网络模型对所述每个应用场景的待分类样本进行分类，获得所述每个应用场景的待分类样本的分类预测标签；

其中，所述基于所述每个应用场景的待分类样本的分类预测标签和所述待分类样本的区域统计信息，生成所述每个应用场景的业务推送信息的实现方式，包括：

基于所述监控对象融合区域生成所述监控对象融合轨迹；

其中，所述在所述目标区域之前的监控对象区域中进行广度优先遍历处理之前，还获取目标决策区域之后的已追踪监控对象区域，所述目标决策区域是指导致所述基础监控对象融合轨迹不符合所述监控对象画像特征以及涉及所述目标监控对象工作状态判断的监控对象区域；

在所述当前遍历区域未通过所述区域判断处理的情况下，将所述当前遍历区域的下一扩展区域作为所述当前遍历区域，以及累加所述遍历迭代统计数，执行所述检测所述广度优先遍历处理的遍历迭代统计数的操作；

若所述当前遍历区域未通过所述监控对象业务检测处理，则将所述当前遍历区域的下一扩展区域作为所述当前遍历区域，以及累加所述遍历迭代统计数，执行所述检测所述广度优先遍历处理的遍历迭代统计数的操作；

6.一种服务器，其特征在于，包括机器可读存储介质和处理器，所述机器可读存储介质中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行权利要求1-4中任意一项所述的基于主动学习的模型训练方法。