CN118094211A

CN118094211A - 一种模型训练方法、系统及相关设备

Info

Publication number: CN118094211A
Application number: CN202211499489.2A
Authority: CN
Inventors: 闫军; 沙一鸣
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2022-11-28
Filing date: 2022-11-28
Publication date: 2024-05-28

Abstract

本申请提供了一种模型训练方法、系统及相关设备，该方法包括以下步骤：服务端向采集端发送任务信息，任务信息包括现场作业人员执行任务时所需的任务单、检查单、问题单中的一种或者多种，接收采集端发送的算料，其中，算料是现场作业人员通过采集端根据任务信息在作业现场采集的算料，算料包括视频、音频、图像、文字中的一种或者多种，根据算料生成样本集，使用样本集对模型进行训练，获得训练好的业务模型，这样采集的算料是整个现场作业流程中采集的算料，使用该算料生成的样本集的样本质量较高，不会出现局限性的问题，而且不需要额外派现场工作人员临时去采集算料，节约人力成本。

Description

一种模型训练方法、系统及相关设备

技术领域

本申请涉及人工智能(artificial intelligence,AI)领域，尤其涉及一种模型训练方法、系统及相关设备。

背景技术

随着AI技术的不断进步，工业巡检、任务管理、质量检测、零件计数等现场作业管理领域逐渐向着无人、少人的趋势发展，通过使用业务模型来替代人工处理现场作业任务，不仅可以降低人力成本，而且可以提高工作效率。

通常情况下，现场作业管理系统在训练模型时之前，需要现场工作人员临时去现场采集算料，然后根据算料确定用于训练模型的样本集。但是临时采集的算料具有一定的局限性，样本质量不高。比如故障检测模型所需的样本包括故障样本和非故障样本，现场工作人员采集算料时，零件可能没有发生故障，此时所采集的算料没有故障样本，导致样本质量低，模型训练效果差，而且需要额外派现场工作人员专门采集算料，人力成本高。

发明内容

本申请提供了一种模型训练方法、系统及相关设备，该方法可以解决现场作业系统在训练模型时需要额外派现场工作人员专门采集算料，人力成本高并且样本质量低的问题。

第一方面，提供了一种模型训练方法，该方法包括以下步骤：服务端向采集端发送任务信息，任务信息包括现场作业人员执行任务时所需的任务单、检查单、问题单中的一种或者多种，接收采集端发送的算料，其中，算料是现场作业人员通过采集端根据任务信息在作业现场采集的算料，算料包括视频、音频、图像、文字中的一种或者多种，根据算料生成样本集，使用样本集对模型进行训练，获得训练好的业务模型。

实施第一方面描述的方法，服务端向采集端发送任务信息，该任务信息包括现场作业人员执行任务时所需的任务单、检查单、问题单中的一种或者多种，接着服务端接收采集端发送的算料，其中，该算料是现场作业人员通过采集端，根据任务信息在作业现场采集的算料，最后服务端根据算料生成样本集，使用样本集对模型进行训练，获得业务模型。这样采集的算料是整个现场作业流程中采集的算料，使用该算料生成的样本集的样本质量较高，不会出现局限性的问题，而且不需要额外派现场工作人员临时去采集算料，节约人力成本。

在一可能的实现方式中，采集端包括现场工作人员持有的终端设备，还包括作业现场布置的传感器，传感器包括摄像头、相机、布控球、智能安全帽、记录仪、麦克风阵列中的一种或者多种。

可选地，采集端是现场作业人员所持有的终端设备时，该终端设备可包括但不限于计算机、智能手机、掌上处理设备、平板电脑、移动笔记本、增强现实(augmentedreality,AR)设备、虚拟现实(virtual reality,VR)设备、一体化掌机、穿戴设备、车载设备、智能会议设备、智能广告设备、智能家电等等，此处不作具体限定。

可选地，采集端是作业现场布置的传感器时，该传感器可以包括图像传感器，具体可以是摄像头、相机、布控球、智能安全帽、记录仪等，还可以包括声音传感器，比如麦克风阵列，还可以包括其他能够感受规定的被测量(物理量、化学量、状态量以及机械量)，并按一定规律转换成可用输出信号的多种信息获取传感器，比如，激光传感器、光敏传感器、气敏传感器、雷达传感器、化学传感器、压敏传感器、温敏传感器、流体传感器、加速度传感器、陀螺仪传感器、地磁传感器、红外线传感器等等。应理解，上述提及的传感器用于示例性说明，并不能构成具体限定。

可选地，采集端所采集的算料可包括但不限于上述传感器在作业现场采集的视频、图像、音频等，这里的传感器可包括但不限于摄像头、布控球、智能安全帽、记录仪、麦克风等等，所采集的算料可以是静态类作业对象的视频或者图像，也可以是移动类作业对象的视频、图像或者音频等，还可以是通过对视频进行截帧的方式获得的图像，还可以是使用相机以一定频率对作业对象进行图像采集获得的图像，这里不作具体限定。这里的图视频可以是对作业对象采集的视频、图像，还可以是现场作业人员的视频、图像等，还可以是作业现场存在的一些机器、设备、警告图片、标语等等，这里不一一举例说明。举例来说，这里的视频可以是智能安全帽记录的现场作业人员的作业视频，也可以是记录仪所采集的作业视频，还可以是布控球采集视频，应理解，上述举例用于说明，本申请不作具体限定。

可选地，采集端所采集的算料可包括但不限于任务单算料、问题单算料和检查单算料中的一种或者多种，其中，任务单算料/问题单算料/检查单算料可以是现场作业人员接收到任务单/问题单/检查单之后，并按照任务单/问题单/检查单执行任务/处理问题/检查作业对象过程中所采集的视频、图像、音频等，还可包括作业人员手动输入的反馈结果，本申请不作具体限定。

简单来说，当采集端是作业现场布置的传感器时，所采集的算料可以是传感器所采集的视频、图像、音频等，比如固定位置的布控球对作业对象采集的视频和图像，现场作业人员佩戴的智能安全帽所采集的第一人称视角的视频和图像，应理解，上述举例用于说明，本申请不作具体限定。需要说明的，用户可以根据业务需求对作业现场布置的传感器进行设置，比如设置采集频率、保存周期、移动侦测、自动截帧保存图片等等，一些部署有AI告警模型的传感器，可以保存命中AI告警规则的图片，本申请不作具体限定。

当采集端是现场作业人员持有的终端设备时，所采集的算料可以包括现场作业人员根据任务单/问题单/检查单所采集的视频、图像、音频等等，还可以包括作业人员输入的反馈结果，比如问题单中显示了器件A丢失一颗螺丝，作业人员可以将丢失的螺丝补全后，通过终端设备将器件A修理后的照片上传至服务端，并输入反馈结果已补全螺丝，上述举例用于说明，本申请不作具体限定。

上述实现方式，通过任务单、检查单和问题单采集算料，可以使得现场作业过程中，现场作业人员在处理作业流程的同时采集了算料并上传至服务端，这样采集的算料不仅符合现场作业的特点，不再具有局限性，样本质量得以提高，而且不需要临时派专门的人员去采集算料，减少了人力成本。比如现在作业人员处理问题单时，拍摄有作业对象故障和非故障情况下的图片，使得故障检测模型训练时，使用根据问题单采集的算料作为样本集进行训练，可以确保样本质量，提高模型的训练效果。

在一可能的实现方式中，根据算料信息和算料的属性将算料归集至现场作业算料库，其中，算料信息是采集端采集算料时生成的，算料信息包括采集时间、采集地点、采集对象、任务场景、作业对象、作业地点、作业日期、检查项目、检查日期、审核结论中的一种或者多种，算料的属性包括场景、时间、对象、地点、标签中的一种或者多种，根据现场作业算料库确定样本集。

可选地，算料的属性可以是采集端采集算料时记录的，也可以是服务端接收到算料之后，根据算料和算料信息确定的，本申请不作具体限定，举例来说，算料的时间属性可以是采集端采集算料时记录的，算料的标签属性可以是现场作业人员记录的，也可以是服务端接收到算料后，运营人员根据业务需求为其记录的标签，本申请不作具体限定。

举例来说，采集端采集的算料可包括任务单算料、检查单算料、问题单算料、安监告警、视频设备等，其中，任务单算料、检查单算料、问题单算料可以是现场作业人员持有的终端设备所采集的算料，安监告警和视频设备可以是作业现场的布控球、摄像头等等，其中，任务单算料可包括作业场景、作业对象、作业地点、作业日期以及现场作业人员按照任务单执行任务时所拍摄的图像和视频等，检查单算料可包括关键检查点、检查项目、检查日期、审核结论以及现场作业人员按照检查单检查作业对象时所拍摄的图像和视频等，问题单算料可包括问题大类、问题小类、辨识对象、问题日期、问题地点以及现场作业人员按照问题单解决问题时所拍摄的图像和视频等，安监告警可包括出现告警时的场景名称、告警描述、告警日期以及告警时作业对象的图片和视频等，视频设备可包括设备名称、采集地点、采集时间以及采集到的图片和视频等。算料属性可包括场景、时间、对象、地点和标签，按照算料属性归集至现场作业算料库之后，场景可包括任务单的任务场景、检查单的关键检查点、问题单的问题大类、安监告警的场景名称、视频设备的设备名称等等，本申请不作具体限定。

可选地，将算料按照算料属性进行归集，后续模型训练时，现场作业系统可以根据现场作业算料库，从中选择模型所需的样本进行标注和训练。举例来说，在训练设备故障模型时，可以将场景、对象下的信息，以及对应的视频图片作为输入样本，标签作为输出样本，获得多组输入样本和输出样本后，使用其组成的训练集对模型进行训练，获得训练好的设备故障模型，训练集不仅包括通过问题单采集的数据，还包括安监告警采集的数据、检查单采集的数据等等，数据来源更加多维和广泛，从而提高模型训练效果。应理解，上述举例用于说明，本申请不作具体限定。

上述实现方式，通过采集端采集算料，服务端对算料进行归集的方式，不仅使得现场作业过程中可以自动沉淀算料数据，不需要额外布置专门用于采集算料的现场工作人员，降低整体成本，而且相对于非现场工作人员采集算料的方式，能够获得更加符合采集要求的、明确指向现场作业环境和作业对象的算料，提高样本质量。

在一可能的实现方式中，该方法还包括：接收采集端发送的待推理数据，将待推理数据输入业务模型获得推理结果，根据推理结果确定推理结果中的负例信息，负例信息包括误检结果和漏检结果，获取负例信息的修正信息，根据负例信息和负例信息的修正信息，对业务模型进行增量学习。

可选地，本申请使用的模型在训练时，可以通过神经网络结构搜索算法(neuralarchitecture search,NAS)确定模型结构，然后使用算料生成的样本集对模型进行训练，获得业务模型，从而进一步提升模型训练效率，降低运营人员的学习成本。

可选地，静态类作业对象可以通过图片采集的方式调用AI模型推理计算，在输入图像中标注目标物体的检测框和标签。移动类作业对象可以通过采集视频，对视频按一定频率截帧的方式，对截帧后的图片调用AI模型进行推理计算，命中业务规则的图片输出告警，并在图片中标注目标物体的位置和标签。如果作业对象的移动速度较快，可以将模型下发至服务端进行端侧识别，从而避免训练端延迟过大，无法满足多秒多帧推理效果的问题，提高用户的使用体验。固定位置或者环境类作业对象可通过固定的传感器，比如布控球接入移动视频流，对视频流按照一定频率截帧，调用AI模型推理计算，对命中业务规则的图片输出告警，并在图片中标注目标物体的位置和标签。

具体实现中，业务模型可以存储于训练端中，模型推理阶段下，服务端可以将待推理数据发送给训练端进行业务推理，并获得训练端反馈的推理结果；或者，由训练端300将业务模型发送给服务端使用，模型推理阶段下，将待推理数据输入业务模型，获得推理结果，本申请不作具体限定。

可选地，负例信息可包括漏检结果和误检结果，其中，漏检结果包括标签缺失、目标缺失等，比如检测对象的目标检测框缺失，误检结果包括标签错误、标签不准确等等，比如检测对象的目标检测框位置不准确。负例信息还可包括其他需要纠正的检测结果，本申请不作具体限定。

具体实现中，负例可以是根据推理结果和真实结果之间的差距确定的，比如作业对象拥有3个螺丝，但是检测结果只有2个螺丝，那么本次推理结果可以是负例，或者，推理结果为出现告警，现场工作人员去现场检修后发现并没有出现问题，那么本次推理结果也可以是负例或者，应理解，上述举例用于说明，本申请不作具体限定。

可选地，对于漏检结果可以通过人工标注的方式，新增目标物体的检测框和标签，以此提升模型的召回率。对于误检结果，可以通过人工标注的方式，调整目标物体的检测框和标签，以此提模型的精确率。

可选地，负例信息还可以包括规则错误的推理结果，这里的规则错误指的是审核规则错误，比如审核规则为，五个仪表中2个以上的数字超过阈值是需要红灯报警，但是实际应用过程中发现只要1个仪表中的数字超过阈值就需要红灯报警，那么这里的审核规则是错误的，需要修正。应理解，上述举例用于说明，本申请不作具体限定。需要说明的，规则错误的推理结果可以反馈给运营人员进行调整，获得修正信息。

可选地，负例信息可以直接显示给用户进行重新标注，或者，存储于数据库中，用户可以自行选择时间进行统一标注，本申请不作具体限定。

可选地，可以根据负例信息生成新的任务信息，新的任务信息可包括检查单、任务单或者问题单中的一种或者多种，并将新的任务信息下发给采集端，持有采集端的现场作业人员可以根据新的检查单、任务单或者问题单，在作业现场环境下对负例信息进行重新标注，获得负例信息的修正信息，采集端将负例信息和修正信息反馈给服务端200，基于负例信息进行增量学习，进一步提升模型的预测效果。

需要说明的，重新标注负例所生成的修正信息可以是人工标注生成的，也可以是机器标注生成的，本申请不作具体限定。人工标注时，可以是运营人员标注也可以是现场作业人员标注，机器标注时可以通过新的AI模型对负例进行重新标注，这里不一一举例说明。

上述实现方式，通过负例反馈机制，使得生产应用中可以实时反馈负例，重新标注算料，自动优化模型，负例反馈即使，模型优化更加精准，提高模型的预测效率和训练效率，提高用户的使用体验。

在一可能的实现方式中，在第一阶段的情况下，以弱提醒交互的方式将推理结果显示给用户，其中，弱提醒交互包括显示浮动标记，浮动标签包括标签名称和/或目标检测框，在第二阶段的情况下，以强提醒交互的方式将推理结果显示给用户，其中，强提醒交互包括弹窗警告、显示故障位置、告警故障问题中的一种或者多种。

应理解，弱提醒交互还可包括其他对用户打扰程度低的交互方式，比如右下角弹小窗显示、文字变色等不影响用户的方式，这里不一一举例说明。

具体实现中，在第一阶段，作业人员可以在任务执行、问题处理、视频安监等现场作业活动中采集图片，调用模型推理服务，以弱提醒标注方式，进行目标物体自动标注。作业人员根据推理结果，对其中的负例进行重新标注获得修正信息，用以供模型进行增量学习，使得模型可以根据现场作业情况进行不断优化。

可选地，业务模型在应用推理阶段时，可以在第二阶段以强提醒交互的方式，将推理结果显示给用户，这里的强提醒交互包括弹窗警告，这里的弹窗警告可以包括推理结果，比如告警XX设备在XX位置出现XX问题，或者XX部件发生故障。应理解，上述举例用于说明，强提醒交互还可以包括其他能够准确显示推理结果的交互方式，比如语音警报，红灯警报等等，这里不一一举例说明。

可选地，第一阶段和第二阶段是根据预设时间点确定的，其中，第一阶段的发生时间在于预设时间点，第二阶段的发生时间晚于预设时间点，比如业务模型在应用推理阶段的前30天处于第一阶段，30天之后处于第二阶段。

可选地，第一阶段和第二阶段是根据业务模型的预测效果确定的，其中，业务模型在第一阶段下的预测效果低于预设阈值，业务模型在第二阶段下的预测效果不低于预设阈值。比如模型召回率高于第一阈值时，模型进入第二阶段，否则，模型一直处于第一阶段。应理解，上述举例用于说明，本申请不作具体限定。

具体实现中，在第二阶段，作业人员在任务执行、问题处理、视频安监等现场作业活动中配置AI采集、审核、告警规则，并生成审核结论、问题单等待办流程，然后根据待办流程反馈AI采集、审核、告警的推理结果，作业人员根据推理结果，对其中的负例进行重新标注，获得修正信息，用以供模型进行增量学习，使得模型可以根据现场作业情况进行不断优化。

可选地，在第一阶段和第二阶段人工标注负例生成修正信息后，重新标注的负例可以是增量算料，在增量算料超过设定阈值时，提示用户是否进行模型优化，用户确认后可以使用增量算料对模型进行增量学习。在第一阶段和第二阶段机器标注负例生成修正信息后，在增量算料超过设定阈值时，可以自动触发模型优化任务。

可选地，在模型优化过程中，可向用户提供部分超参数的调节入口，以满足不同作业现场的场景个性化需求，比如不同特征作业对象设置不同的重叠度(intersection overunion,IoU)阈值，以提升用户的使用体验。

上述实现方式，通过第一阶段弱交互提醒方式，使得模型效果较差时不会对用户产生较大的干扰，提升用的使用体验，同时，通过第一阶段反馈的负例不断优化模型，提升模型优化任务的迭代效率和负例的质量，提升了模型的自学习能力和泛化能力，使得第二阶段上线使用的模型性能和预测效果均得以提升，能够很好地嵌入业务流程，提高用户的使用体验。

第二方面，提供了一种服务端，服务端包括：任务下发单元，用于向采集端发送任务信息，任务信息包括现场作业人员执行任务时所需的任务单、检查单、问题单中的一种或者多种；算料收集单元，用于接收采集端发送的算料，其中，算料是现场作业人员通过采集端根据任务信息在作业现场采集的算料，算料包括视频、音频、图像、文字中的一种或者多种；模型训练单元，用于根据算料生成样本集，使用样本集对模型进行训练，获得训练好的业务模型。

实施第二方面描述的服务端，服务端向采集端发送任务信息，该任务信息包括现场作业人员执行任务时所需的任务单、检查单、问题单中的一种或者多种，接着服务端接收采集端发送的算料，其中，该算料是现场作业人员通过采集端，根据任务信息在作业现场采集的算料，最后服务端根据算料生成样本集，使用样本集对模型进行训练，获得业务模型。这样采集的算料是整个现场作业流程中采集的算料，使用该算料生成的样本集的样本质量较高，不会出现局限性的问题，而且不需要额外派现场工作人员临时去采集算料，节约人力成本。

在一可能的实现方式中，服务端还包括模型推理单元和负例反馈单元，其中，模型推理单元，用于接收采集端发送的待推理数据，将待推理数据输入业务模型获得推理结果；负例反馈单元，用于根据推理结果确定推理结果中的负例信息，负例信息包括误检结果和漏检结果；负例反馈单元，还用于获取负例信息的修正信息，根据负例信息和负例信息的修正信息，对业务模型进行增量学习。

在一可能的实现方式中，算料收集单元，用于根据算料信息和算料的属性将算料归集至现场作业算料库，其中，算料信息是采集端采集算料时生成的，算料信息包括采集时间、采集地点、采集对象、任务场景、作业对象、作业地点、作业日期、检查项目、检查日期、审核结论中的一种或者多种，算料的属性包括场景、时间、对象、地点、标签中的一种或者多种；算料收集单元，用于根据现场作业算料库确定样本集。

在一可能的实现方式中，负例反馈单元，用于：在第一阶段的情况下，以弱提醒交互的方式将推理结果显示给用户，其中，弱提醒交互包括显示浮动标记，浮动标签包括标签名称和/或目标检测框；在第二阶段的情况下，以强提醒交互的方式将推理结果显示给用户，其中，强提醒交互包括弹窗警告、显示故障位置、告警故障问题中的一种或者多种。

在一可能的实现方式中，第一阶段和第二阶段是根据预设时间点确定的，其中，第一阶段的发生时间在于预设时间点，第二阶段的发生时间晚于预设时间点；或者，第一阶段和第二阶段是根据业务模型的预测效果确定的，其中，业务模型在第一阶段下的预测效果低于预设阈值，业务模型在第二阶段下的预测效果不低于预设阈值。

第三方面，提供了一种模型训练系统，该系统包括采集端和服务端，其中，服务端，用于向采集端发送任务信息，任务信息包括现场作业人员执行任务时所需的任务单、检查单、问题单中的一种或者多种；采集端用于根据任务信息在作业现场采集算料，算料包括视频、音频、图像、文字中的一种或者多种；采集端用于向服务端发送算料；服务端，用于根据算料生成样本集，使用样本集对模型进行训练，获得训练好的业务模型。

在一可能的实现方式中，采集单，用于获取待推理数据；服务端，用于接收采集端发送的待推理数据，将待推理数据输入业务模型获得推理结果；服务端，用于根据推理结果确定推理结果中的负例信息，负例信息包括误检结果和漏检结果；服务端，用于获取负例信息的修正信息，根据负例信息和负例信息的修正信息，对业务模型进行增量学习。

在一可能的实现方式中，服务端，用于在第一阶段的情况下，以弱提醒交互的方式将推理结果显示给用户，其中，弱提醒交互包括显示浮动标记，浮动标签包括标签名称和/或目标检测框；服务端，用于在第二阶段的情况下，以强提醒交互的方式将推理结果显示给用户，其中，强提醒交互包括弹窗警告、显示故障位置、告警故障问题中的一种或者多种。

在一可能的实现方式中，所述采集端包括现场工作人员持有的终端设备，还包括所述作业现场布置的传感器，所述传感器包括摄像头、相机、布控球、智能安全帽、记录仪、麦克风阵列中的一种或者多种。

第四方面，提供了一种计算设备，该计算设备包括处理器和存储器，存储器存储有代码，处理器包括用于执行第一方面或第一方面任一种可能实现方式所描述的方法。

第五方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述各方面所述的方法。

本申请在上述各方面提供的实现方式的基础上，还可以进行进一步组合以提供更多实现方式。

附图说明

图1是本申请提供的模型训练系统的架构示意图；

图2是本申请提供的一种应用场景下的算料示例图；

图3是本申请提供的模型训练方法在一应用场景下的步骤流程示意图；

图4是本申请提供的一种模型训练方法的步骤流程示意图；

图5是本申请提供的服务端获取算料的步骤流程示意图；

图6是本申请提供的模型推理方法的步骤流程示意图；

图7是本申请提供的模型训练方法训练好的业务模型在模型推理阶段的阶段示意图；

图8是本申请提供的一种计算设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

首先，对本申请涉及应用场景进行说明。

通常情况下，在现场作业管理系统所使用的AI模型从开发到部署，需要开发人员从定义业务问题开始，经过数据采集和标注、数据存储和管理、数据分析、算法设计、模型设计、超参调节、模型训练、模型裁剪压缩、算力芯片适配、性能评估和迭代、模型部署、应用开发等步骤后，才能实现AI模型的应用，整个步骤流程需要开发人员全程参与，人力成本高，且开发人员的人工效率有限，开发周期较长。

举例来说，在数据采集阶段，需要开发人员指派现场工作人员去作业现场采集算料，然后根据算料确定用于训练模型的样本集。但是临时采集的算料具有一定的局限性，样本质量不高。比如故障检测模型所需的样本包括故障样本和非故障样本，现场工作人员采集算料时，零件可能没有发生故障，此时所采集的算料没有故障样本，导致样本质量低，模型训练效果差。应理解，上述举例用于说明，现场作业管理领域的AI模型的项目交付过程还存在很多问题，比如算法与实际应用场景不匹配，精度不够的问题、性能评估和迭代的过程较长，需要开发人员频繁指派工作人员去作业现场采集新的算料，人力成本高，训练效率低，影响工期且持续优化能力弱的问题等等，这里不一一举例说明。

综上可知，当前现场作业管理领域的AI模型交付过程需要大量开发人员的参与，存在人力成本高、样本质量差、开发周期长、持续优化能力弱等问题，导致模型训练效果差。

本申请提供了一种模型训练系统，服务端向采集端发送任务信息，该任务信息包括现场作业人员执行任务时所需的任务单、检查单、问题单中的一种或者多种，接着服务端接收采集端发送的算料，其中，该算料是现场作业人员通过采集端，根据任务信息在作业现场采集的算料，最后服务端根据算料生成样本集，使用样本集对模型进行训练，获得业务模型。这样采集的算料是整个现场作业流程中采集的算料，使用该算料生成的样本集的样本质量较高，不会出现局限性的问题，而且不需要额外派现场工作人员临时去采集算料，节约人力成本。

图1是本申请提供的模型训练系统的架构示意图。如图1所示，该模型训练系统1000可包括采集端100、服务端200以及训练端300。其中，采集端100、服务端200以及训练端300之间存在通信连接，具体可以是有线连接也可以是无线连接，本申请不作具体限定。并且，采集端100、服务端200以及训练端300的数量可以是一个或者多个，本申请不作具体限定。

采集端100可以是现场作业人员所持有的终端设备，比如图1中的采集端1，该终端设备可包括但不限于计算机、智能手机、掌上处理设备、平板电脑、移动笔记本、增强现实(augmented reality,AR)设备、虚拟现实(virtual reality,VR)设备、一体化掌机、穿戴设备、车载设备、智能会议设备、智能广告设备、智能家电等等，此处不作具体限定。

具体实现中，采集端100可配置有用于采集算料的传感器，比如图1中的采集端2，可以是摄像头，这样现场作业人员可以使用终端设备采集算料，然后通过终端设备将算料发送给服务端200。或者，采集端100也可以不配置采集算料的传感器，但是与能够采集算料的传感器建立通信连接，传感器采集算料后，可通过终端设备将其上传至服务端200，本申请不作具体限定。

可选地，采集端100还可以是传感器，传感器可以包括图像传感器，具体可以是摄像头、相机、布控球、智能安全帽、记录仪等，还可以包括声音传感器，比如麦克风阵列，还可以包括其他能够感受规定的被测量(物理量、化学量、状态量以及机械量)，并按一定规律转换成可用输出信号的多种信息获取传感器，比如，激光传感器、光敏传感器、气敏传感器、雷达传感器、化学传感器、压敏传感器、温敏传感器、流体传感器、加速度传感器、陀螺仪传感器、地磁传感器、红外线传感器等等。应理解，上述提及的传感器用于示例性说明，并不能构成具体限定。

服务端200以及训练端300可以是计算设备或者多个计算设备组成的计算机集群，比如裸金属服务器(bare metal server,BMS)、虚拟机、容器、边缘计算设备等。其中，该计算设备可包括但不限于物理服务器、虚拟机、容器、芯片等，其中，物理服务器可包括但不限于ARM服务器、X86服务器等；虚拟机指的是网络功能虚拟化(network functionsvirtualization,NFV)技术实现的、通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统；容器指的是一组受到资源限制，彼此间相互隔离的进程，此处不作具体限定。具体实现中，服务端200可以与现场作业系统的运营人员进行交互。

可选地，服务端200和训练端300可以部署于不同的计算设备上，比如服务端200部署于计算设备1，训练端300部署于计算设备2；或者，服务端200和训练端300部署于同一个计算设备，比如同一个物理服务器上的两台虚拟机，本申请不作具体限定。在一些实施例中，服务端200和训练端300可以是同一个云数据中心内的两个服务器，或者两个虚拟机，或者两个容器，本申请不作具体限定。

可选地，服务端200和训练端300也可以部署于公有云中，用户可通过公有云的控制台(console)或者API购买相关服务，获得远程控制服务端200和训练端300的权限，通过远程控制服务端200和训练端300实现其相应的功能，本申请不作具体限定，这里的用户可以是现场作业系统的运营人员。

可选地，也可以服务端200部署于用户所持有的计算设备，训练端300部署于公有云中，用户通过console或者API购买训练模型的相关服务，获得远程控制训练端300的权限，以实现训练模型的相关功能，本申请不作具体限定。

可选地，也可以服务端200和训练端300均部署于用户所持有的一个或者多个计算设备上，比如以企业私有化部署的方式，将服务端200和训练端300部署于用户所在企业内部的服务器上，本申请不作具体限定。

进一步地，采集端100、服务端200以及训练端300可以划分为多个单元模块，示例性地，如图1所示，采集端100可包括采集单元111和输入单元112，服务端200可包括任务下发单元210、算料收集单元220、模型训练单元230、模型推理单元240以及负例反馈单元250，训练端300包括多个模型310。应理解，图1中的划分方式用于举例说明，采集端100、服务端200以及训练端300还可以包括更多或者更少的单元模块，本申请不作具体限定。

服务端200的任务下发单元210用于向采集端100发送任务信息，其中，任务信息可包括任务单、检查单和问题单中的一种或者多种。其中，任务单可包括需要现场工作人员执行的至少一个任务，该任务可包括任务时间、任务地点、任务内容等，比如任务单包括在时段X巡检地点A和地点B，更换C设备等等。检查单可包括需要现场工作人员检查的至少一个作业对象，比如检查单包括检查设备D是否故障、检查设备E是否出现漏检等等。问题单可包括需要现场工作人员处理的至少一个问题项目，比如问题单包括修理设备F、更换设备G的零件等等，应理解，上述举例用于说明，本申请不作具体限定。

采集端100中的采集单元111用于采集算料。可选地，采集端100还可以包括输入单元112，输入单元112用于供现场作业人员输入算料。举例来说，当采集端100是现场作业人员持有的终端设备时，此时采集端100可以是图1中的采集端1，当采集端100是传感器时，此时采集端100可以是图1中的采集端2。

具体实现中，采集单元111所采集的算料可包括但不限于上述传感器在作业现场采集的视频、图像、音频等，这里的传感器可包括但不限于摄像头、布控球、智能安全帽、记录仪、麦克风等等，所采集的算料可以是静态类作业对象的视频或者图像，也可以是移动类作业对象的视频、图像或者音频等，还可以是通过对视频进行截帧的方式获得的图像，还可以是使用相机以一定频率对作业对象进行图像采集获得的图像，这里不作具体限定。这里的图视频可以是对作业对象采集的视频、图像，还可以是现场作业人员的视频、图像等，还可以是作业现场存在的一些机器、设备、警告图片、标语等等，这里不一一举例说明。举例来说，这里的视频可以是智能安全帽记录的现场作业人员的作业视频，也可以是记录仪所采集的作业视频，还可以是布控球采集视频，应理解，上述举例用于说明，本申请不作具体限定。

输入单元112所输入的算料可包括但不限于任务单算料、问题单算料和检查单算料中的一种或者多种，其中，任务单算料/问题单算料/检查单算料可以是现场作业人员接收到任务单/问题单/检查单之后，并按照任务单/问题单/检查单执行任务/处理问题/检查作业对象过程中所采集的视频、图像、音频等，还可包括作业人员手动输入的反馈结果，本申请不作具体限定。

简单来说，当采集端100是作业现场布置的传感器时，采集单元111所采集的算料可以是传感器所采集的视频、图像、音频等，比如固定位置的布控球对作业对象采集的视频和图像，现场作业人员佩戴的智能安全帽所采集的第一人称视角的视频和图像，应理解，上述举例用于说明，本申请不作具体限定。需要说明的，用户可以根据业务需求对作业现场布置的传感器进行设置，比如设置采集频率、保存周期、移动侦测、自动截帧保存图片等等，一些部署有AI告警模型的传感器，可以保存命中AI告警规则的图片，本申请不作具体限定。

当采集端100是现场作业人员持有的终端设备时，采集单元111所采集的算料可以包括现场作业人员根据任务单/问题单/检查单所采集的视频、图像、音频等等，还可以包括作业人员输入的反馈结果，比如问题单中显示了器件A丢失一颗螺丝，作业人员可以将丢失的螺丝补全后，通过终端设备将器件A修理后的照片上传至服务端200，并输入反馈结果已补全螺丝，上述举例用于说明，本申请不作具体限定。

可以理解的，通过任务单、检查单和问题单采集算料，可以使得现场作业过程中，现场作业人员在处理作业流程的同时采集了算料并上传至服务端200，这样采集的算料不仅符合现场作业的特点，不再具有局限性，样本质量得以提高，而且不需要临时派专门的人员去采集算料，减少了人力成本。比如现在作业人员处理问题单时，拍摄有作业对象故障和非故障情况下的图片，使得故障检测模型训练时，使用根据问题单采集的算料作为样本集进行训练，可以确保样本质量，提高模型的训练效果。

算料收集单元220用于接收采集端100发送的算料，其中，算料的描述可参考前述内容，这里不重复赘述。

可选地，采集端100所采集的算料还可包括算料信息，这里的算料信息可包括但不限于算料的采集时间、采集地点、采集对象、任务场景、作业对象、作业地点、作业日期、检查项目、检查日期、审核结论等一些用于描述算料的算料信息，具体可根据采集端100以及服务端200的处理能力决定算料信息的详细程度，本申请不作具体限定。

可选地，算料收集单元220可以将采集端100所采集的算料，根据算料信息，按照算料的属性将算料归集至现场作业算料库。这里算料的属性可包括但不限于场景、时间、对象、地点、标签等等，本申请不作具体限定。其中，算料的属性可以是采集端100采集算料时记录的，也可以是服务端200接收到算料之后，根据算料和算料信息确定的，本申请不作具体限定，举例来说，算料的时间属性可以是采集端100采集算料时记录的，算料的标签属性可以是现场作业人员记录的，也可以是服务端200接收到算料后，运营人员根据业务需求为其记录的标签，本申请不作具体限定。

示例性地，如图2所示，图2是本申请提供的一种应用场景下的算料示例图，如图2所示，该算料400可包括任务单算料、检查单算料、问题单算料、安监告警、视频设备等，其中，任务单算料、检查单算料、问题单算料可以是现场作业人员持有的终端设备所采集的算料，安监告警和视频设备可以是作业现场的布控球、摄像头等等，其中，任务单算料可包括作业场景、作业对象、作业地点、作业日期以及现场作业人员按照任务单执行任务时所拍摄的图像和视频等，检查单算料可包括关键检查点、检查项目、检查日期、审核结论以及现场作业人员按照检查单检查作业对象时所拍摄的图像和视频等，问题单算料可包括问题大类、问题小类、辨识对象、问题日期、问题地点以及现场作业人员按照问题单解决问题时所拍摄的图像和视频等，安监告警可包括出现告警时的场景名称、告警描述、告警日期以及告警时作业对象的图片和视频等，视频设备可包括设备名称、采集地点、采集时间以及采集到的图片和视频等，应理解，图2用于举例说明，算料400还可以包括更多或者更少的内容，这里不一一举例说明。

在图2所示的场景中，算料属性可包括场景、时间、对象、地点和标签，算料400按照算料属性归集至现场作业算料库500之后可以如图2所示，其中，场景可包括任务单的任务场景、检查单的关键检查点、问题单的问题大类、安监告警的场景名称、视频设备的设备名称等等，本申请不作具体限定，对象、时间、地点、标签可以参考图2的描述，这里不一一展开赘述。

可选地，将算料按照算料属性进行归集，后续模型训练时，现场作业系统可以根据现场作业算料库500，从中选择模型所需的样本进行标注和训练。举例来说，在训练设备故障模型时，可以将场景、对象下的信息，以及对应的视频图片作为输入样本，标签作为输出样本，获得多组输入样本和输出样本后，使用其组成的训练集对模型进行训练，获得训练好的设备故障模型，训练集不仅包括通过问题单采集的数据，还包括安监告警采集的数据、检查单采集的数据等等，数据来源更加多维和广泛，从而提高模型训练效果。应理解，上述举例用于说明，本申请不作具体限定。

可以理解的，通过采集端100采集算料，服务端200对算料进行归集的方式，不仅使得现场作业过程中可以自动沉淀算料数据，不需要额外布置专门用于采集算料的现场工作人员，降低整体成本，而且相对于非现场工作人员采集算料的方式，能够获得更加符合采集要求的、明确指向现场作业环境和作业对象的算料，提高样本质量。

模型训练单元230用于根据算料生成训练集，使用训练集对模型进行训练，获得业务模型。应理解，现场作业系统训练的模型数量可以是一个或者多个，那么相应的训练集数量也可以是一个或者多个。具体实现中，模型训练单元230可以将训练集发送给训练端300进行模型训练。

模型推理单元240用于通过模型训练单元230业务模型进行业务推理，将业务数据输入业务模型，获得推理结果。举例来说，业务模型为检测模型，模型推理单元240可以将采集到的图像输入检测模型，输出的推理结果可以是标注有目标物体位置和标签的图像，应理解，上述举例用于说明，本申请不作具体限定。

可选地，静态类作业对象可以通过图片采集的方式调用AI模型推理计算，在输入图像中标注目标物体的检测框和标签。移动类作业对象可以通过采集视频，对视频按一定频率截帧的方式，对截帧后的图片调用AI模型进行推理计算，命中业务规则的图片输出告警，并在图片中标注目标物体的位置和标签。如果作业对象的移动速度较快，可以将模型下发至服务端200进行端侧识别，从而避免训练端300延迟过大，无法满足多秒多帧推理效果的问题，提高用户的使用体验。固定位置或者环境类作业对象可通过固定的传感器，比如布控球接入移动视频流，对视频流按照一定频率截帧，调用AI模型推理计算，对命中业务规则的图片输出告警，并在图片中标注目标物体的位置和标签。

负例反馈单元250用于根据推理结果获得负例信息，向用户显示负例信息，接收用户对负例信息的修正信息，将负例信息和修正信息反馈给模型训练单元230，使得模型训练单元230可以基于负例信息进行增量学习，进一步提升模型的预测效果。

具体实现中，业务模型可以存储于训练端300中，模型推理阶段下，服务端200可以将待推理数据发送给训练端300进行业务推理，并获得训练端300反馈的推理结果；或者，由训练端300将业务模型发送给服务端200使用，模型推理阶段下，将待推理数据输入业务模型，获得推理结果，本申请不作具体限定。

可选地，可以根据负例信息生成新的任务信息，新的任务信息可包括检查单、任务单或者问题单中的一种或者多种，并将新的任务信息下发给采集端100，持有采集端100的现场作业人员可以根据新的检查单、任务单或者问题单，在作业现场环境下对负例信息进行重新标注，获得负例信息的修正信息，采集端100将负例信息和修正信息反馈给服务端200的模型训练单元230，使得模型训练单元230可以基于负例信息进行增量学习，进一步提升模型的预测效果。

举例来说，如图3所示，图3是本申请提供的模型训练方法在一应用场景下的步骤流程示意图，假设模型为目标检测模型，检测目标为螺丝，现场工作人员在填写检查单时，可以拍摄作业对象的视频和图像，输入检查单，通过采集端100将检查单反馈给服务端200，服务端200可以将检查单输入模型，获得推理结果，在图3所示的应用场景中，推理结果的检测框漏检了一个螺丝，但是该作业对象在此处本应拥有3个螺丝，所以该推理结果可能是出现漏检，也可能是出现误检，还可能是推理结果是正确的，确实丢失了1颗螺丝，需要对作业对象进行检修，该应用场景中，推理结果可以作为负例信息反馈给运营人员，运营人员查看图片确认为漏检，人工标注后获得修正信息，那么负例信息和修正信息可以存储于样本集中，该样本集可以用于对模型进行增量学习，从而提升模型的预测效果。

应理解，图3用于举例说明，本申请不作具体限定。在图3所示的应用场景中，模型的输入数据是现场工作人员所持有的采集端反馈的检查单，在其他应用场景中，若模型的输入数据是传感器采集的视频图像，模型为告警模型，若推理结果显示出现告警，那么运营人员查看出现告警的视频图像是否符合告警规则，若是则表示推理结果无误，若否则表示本次推理出现误检，运营人员可进行人工标注后获得修正信息，那么负例信息和修正信息可以存储于样本集中，该样本集可以用于对模型进行增量学习，从而提升模型的预测效果。上述举例用于说明，本申请不作具体限定。

应理解，通过负例反馈机制，使得生产应用中可以实时反馈负例，重新标注算料，自动优化模型，负例反馈即使，模型优化更加精准，提高模型的预测效率和训练效率，提高用户的使用体验。

在一实施例中，业务模型在应用推理阶段时，可以在第一阶段以弱提醒交互的方式，将推理结果显示给用户，这里的弱提醒交互包括显示浮动标记，这里的浮动标记可包括标签名称、目标检测框等，用户可以通过触摸、键鼠等方式移动、拉伸、缩小、删除浮动标记，用户可以对推理结果错误的负例进行修改，具体可参考前述关于负例标注获得修正信息的描述，这里不重复赘述。

其中，第一阶段的发生时间早于第二阶段的发生时间，可选地，可以选择固定时间来区分第一阶段和第二阶段，比如业务模型在应用推理阶段的前30天处于第一阶段，30天之后处于第二阶段。可选地，也可以根据模型的预测效果和性能来区分第一阶段和第二阶段，比如模型召回率高于第一阈值时，模型进入第二阶段，否则，模型一直处于第一阶段。应理解，上述举例用于说明，本申请不作具体限定。

应理解，通过第一阶段弱交互提醒方式，使得模型效果较差时不会对用户产生较大的干扰，提升用的使用体验，同时，通过第一阶段反馈的负例不断优化模型，提升模型优化任务的迭代效率和负例的质量，提升了模型的自学习能力和泛化能力，使得第二阶段上线使用的模型性能和预测效果均得以提升，能够很好地嵌入业务流程，提高用户的使用体验。

综上可知，本申请提供的模型训练系统，服务端向采集端发送任务信息，该任务信息包括现场作业人员执行任务时所需的任务单、检查单、问题单中的一种或者多种，接着服务端接收采集端发送的算料，其中，该算料是现场作业人员通过采集端，根据任务信息在作业现场采集的算料，最后服务端根据算料生成样本集，使用样本集对模型进行训练，获得业务模型。这样采集的算料是整个现场作业流程中采集的算料，使用该算料生成的样本集的样本质量较高，不会出现局限性的问题，而且不需要额外派现场工作人员临时去采集算料，节约人力成本。

图4是本申请提供的一种模型训练方法的步骤流程示意图，该方法可应用于如图1所示的模型训练系统中，如图4所示，该方法可包括以下步骤：

S410：服务端向采集端发送任务信息。其中，服务端和采集端的描述可参考图1实施例中的描述，这里不重复赘述。

可选地，任务信息可包括任务单、检查单和问题单中的一种或者多种。其中，任务单可包括需要现场工作人员执行的至少一个任务，该任务可包括任务时间、任务地点、任务内容等，比如任务单包括在时段X巡检地点A和地点B，更换C设备等等。检查单可包括需要现场工作人员检查的至少一个作业对象，比如检查单包括检查设备D是否故障、检查设备E是否出现漏检等等。问题单可包括需要现场工作人员处理的至少一个问题项目，比如问题单包括修理设备F、更换设备G的零件等等，应理解，上述举例用于说明，本申请不作具体限定。

S420：采集端根据任务信息在作业现场采集算料。

具体实现中，当采集端是作业现场布置的传感器时，采集端所采集的算料可以是传感器所采集的视频、图像、音频等，比如固定位置的布控球对作业对象采集的视频和图像，现场作业人员佩戴的智能安全帽所采集的第一人称视角的视频和图像，应理解，上述举例用于说明，本申请不作具体限定。需要说明的，用户可以根据业务需求对作业现场布置的传感器进行设置，比如设置采集频率、保存周期、移动侦测、自动截帧保存图片等等，一些部署有AI告警模型的传感器，可以保存命中AI告警规则的图片，本申请不作具体限定。

当采集端是现场作业人员持有的终端设备时，采集端所采集的算料可以包括现场作业人员根据任务单/问题单/检查单所采集的视频、图像、音频等等，还可以包括作业人员输入的反馈结果，比如问题单中显示了器件A丢失一颗螺丝，作业人员可以将丢失的螺丝补全后，通过终端设备将器件A修理后的照片上传至服务端，并输入反馈结果已补全螺丝，上述举例用于说明，本申请不作具体限定。

可以理解的，通过任务单、检查单和问题单采集算料，可以使得现场作业过程中，现场作业人员在处理作业流程的同时采集了算料并上传至服务端，这样采集的算料不仅符合现场作业的特点，不再具有局限性，样本质量得以提高，而且不需要临时派专门的人员去采集算料，减少了人力成本。比如现在作业人员处理问题单时，拍摄有作业对象故障和非故障情况下的图片，使得故障检测模型训练时，使用根据问题单采集的算料作为样本集进行训练，可以确保样本质量，提高模型的训练效果。

S430：采集端向服务端发送算料。这里发送的算料不仅包括现场作业人员持有的采集端所采集的算料，还包括作业现场布置的多个传感器所采集的算料，比如布控球对作业对象采集的视频，智能安全帽采集的现场作业人员的工作视频等等，本申请不作具体限定。

可选地，现场作业人员持有的采集端反馈的算料包括检查单算料、任务单算料和问题单算料，作业现场布置的多个传感器所采集的算料包括视频图像算料和AI告警算料，其中，视频图像算料指的是作业现场布置的传感器采集的原始图像、视频、音频等，AI告警算料指的是作业现场布置的传感器部署有算法模型时，该算法模型推理结果生成的算料，比如记录仪所采集的原始视频可以是视频图像算料，若该记录仪部署检测现场作业人员是否佩戴安全帽的功能模块，那么记录仪生成的告警数据即为AI告警算料，应理解，上述举例用于说明，本申请不作具体限定。

举例来说，如图5所示，图5是本申请提供的服务端获取算料的步骤流程示意图，其中，采集端1是现场作业人员持有的终端设备，采集端2是部署于作业现场的传感器，比如固定于某个位置的摄像头，如图5所示，服务端获取算料的步骤流程可以如下：

步骤1：运营人员通过服务端，根据作业流程下发任务单和检查单至现场作业人员持有的采集端1上。

步骤2：现场作业人员根据采集端1执行任务，采集任务单算料和检查单算料。

举例来说，检查单显示需要作业人员去地点A检查器件B，此时线程作业人员可以使用采集端全程拍摄检查器件B的视频图像，然后将其上传至检查单，并输入相应的检查结果，比如器件A发生故障，或者，器件A未发生故障，获得检查单算料。应理解，上述举例用于说明，本申请不作具体限定。

步骤3：运营人员通过服务端下发问题单至现场作业人员持有的采集端1上。

应理解，问题单包括多个问题项目，每个问题项目可以是运营人员通过其他采集端采集的视频、图像确定的，比如通过布控球发现某个设备倾倒；也可以是其他现场工作人员在执行任务单或者检查单时上传的问题，比如某个现场作业人员在处理检查单时，检修的设备发生了故障，该现场作业人员可以将故障问题上报至服务端，运营人员接受到该故障问题后，下发任务单至能够处理该故障问题的现场作业人员所持有的采集端。上述举例用于说明，本申请不作具体限定。

步骤4：现场作业人员根据采集端1接收的问题单处理问题，采集问题单算料。

步骤5：采集端2采集视频图像算料。

其中，视频图像算料指的是作业现场布置的传感器采集的原始图像、视频、音频等。比如部署于固定位置的摄像头所采集的视频图像，记录仪采集的工作视频等，本申请不作具体限定。

步骤6：采集端2采集AI告警算料。

其中，AI告警算料指的是作业现场布置的传感器部署有算法模型时，该算法模型推理结果生成的算料，比如记录仪所采集的原始视频可以是视频图像算料，若该记录仪部署检测现场作业人员是否佩戴安全帽的功能模块，那么记录仪生成的告警数据即为AI告警算料，应理解，上述举例用于说明，本申请不作具体限定。

步骤7：采集端1和采集端2向服务端发送算料。

需要说明的，步骤1～步骤4与步骤5～步骤6可以是同时进行的也可以是先后进行的，本申请不作具体限定。

应理解，图5用于举例说明，采集端还可以采集更多种类型的算料，具体可根据实际的业务场景决定，本申请不作具体限定。

S440：服务端将算料归集至现场作业算料库。

可选地，采集端所采集的算料还可包括算料信息，这里的算料信息可包括但不限于算料的采集时间、采集地点、采集对象、任务场景、作业对象、作业地点、作业日期、检查项目、检查日期、审核结论等一些用于描述算料的算料信息，具体可根据采集端及服务端的处理能力决定算料信息的详细程度，本申请不作具体限定。

可选地，服务端可以将采集端所采集的算料，根据算料信息，按照算料的属性将算料归集至现场作业算料库。这里算料的属性可包括但不限于场景、时间、对象、地点、标签等等，本申请不作具体限定。其中，算料的属性可以是采集端采集算料时记录的，也可以是服务端接收到算料之后，根据算料和算料信息确定的，本申请不作具体限定，举例来说，算料的时间属性可以是采集端采集算料时记录的，算料的标签属性可以是采集端是现场作业人员记录的，也可以是服务端接收到算料后，根据业务需求为其记录的标签，本申请不作具体限定。具体可参考图2实施例所描述的例子，这里不再重复赘述。

可以理解的，通过采集端采集算料，服务端对算料进行归集的方式，不仅使得现场作业过程中可以自动沉淀算料数据，不需要额外布置专门用于采集算料的现场工作人员，降低整体成本，而且相对于非现场工作人员采集算料的方式，能够获得更加符合采集要求的、明确指向现场作业环境和作业对象的算料，提高样本质量。

S450：服务端根据现场作业算料库和业务需求确定样本集。应理解，现场作业系统训练的模型数量可以是一个或者多个，那么相应的训练集数量也可以是一个或者多个。

可选地，模型训练时，根据现场作业算料库，从中选择模型所需的样本进行标注和训练。举例来说，在训练设备故障模型时，可以将场景、对象下的信息，以及对应的视频图片作为输入样本，标签作为输出样本，获得多组输入样本和输出样本后，使用其组成的训练集对模型进行训练，获得训练好的设备故障模型，训练集不仅包括通过问题单采集的数据，还包括安监告警采集的数据、检查单采集的数据等等，数据来源更加多维和广泛，从而提高模型训练效果。应理解，上述举例用于说明，本申请不作具体限定。

S460：服务端使用样本集训练模型，获得训练好的业务模型。

可选地，本申请使用的模型在训练时，可以通过神经网络结构搜索算法(neuralarchitecture search,NAS)确定模型结构，然后使用算料生成的样本集对模型进行训练，获得业务模型，从而进一步提升模型训练效率，降低运营人员的学习成本。当然，运营人员也可以自己确定模型结构，使用样本集对模型进行训练，本申请不作具体限定。

具体实现中，服务端可以在本地使用样本集对模型进行训练，也可以通过远程调用训练端的方式，由训练端使用样本集对模型进行训练，比如通过购买公有云的云服务，获得远程调用训练端的权限，将样本集发送至训练端，使得训练端通过NAS确定模型结构后，使用该样本集训练模型，获得训练好的业务模型，应理解，上述举例用于说明，本申请不作具体限定。

下面结合图6，对上述图4所示的模型训练方法训练好的业务模型，在应用推理阶段下的推理过程进行解释说明，图6是本申请提供的模型推理方法的步骤流程示意图，如图6所示，该方法可包括以下步骤：

S510：采集端向服务端发送待推理数据。

其中，待推理数据可以是现场作业人员持有的采集端所采集的图像、视频、任务单、检查单、问题单中的一种或者多种，也可以是作业现场布置的传感器所采集的数据，具体可根据训练好的业务模型的输入数据来确定，本申请不作具体限定。举例来说，业务模型为检测模型，采集端可以将采集到的图像发送给服务端进行检测，应理解，上述举例用于说明，本申请不作具体限定。

S520：将待推理数据输入推理模型，获得推理结果。

具体实现中，业务模型可以存储于训练端中，模型推理阶段下，服务端可以将待推理数据发送给训练端进行业务推理，并获得训练端反馈的推理结果；或者，由训练端将业务模型发送给服务端使用，模型推理阶段下，将待推理数据输入业务模型，获得推理结果，本申请不作具体限定。

S530：根据推理结果确定负例信息。

应理解，步骤S530的未描述的内容可参考前述图3实施例，这里不再重复赘述。

S540：获取负例信息的修正信息。

S550：使用负例信息和修正信息对模型进行增量学习。

举例来说，图7是本申请提供的模型训练方法训练好的业务模型在模型推理阶段的阶段示意图，如图7所示，本申请提供的模型训练方法训练出的业务模型在模型推理时，可以分为第一阶段和第二阶段，其中，第一阶段下采集端采集待推理数据发送给服务端，服务端通过将待推理数据输入业务模型之后获得推理结果，通过弱提醒交互的方式显示给用户，若推理结果为负例，那么获取修正信息，并将推理结果和修正信息存储于增量样本集中，若推理结果不是负例，则将其直接存储至增量样本集，当增量样本集中的样本数量达到预设阈值时，可以对业务模型进行增量学习。其中，弱提醒交互的方式可以是将推理结果以不干扰用户的方式显示给用户，比如图7所示的显示目标检测框。

第二阶段下采集端采集待推理数据发送给服务端，服务端通过将待推理数据输入业务模型之后获得推理结果，通过强提醒交互的方式显示给用户，若推理结果为负例，那么获取修正信息，并将推理结果和修正信息存储于增量样本集中，若推理结果不是负例，则将其直接存储至增量样本集，当增量样本集中的样本数量达到预设阈值时，可以对业务模型进行增量学习。其中，强提醒交互的方式可以是显示告警信息，比如图7所示的，显示02号螺丝缺失的告警信息。应理解，图7用于举例说明，本申请不作具体限定。

图8是本申请提供的一种计算设备的结构示意图，该计算设备800可以是图1至图7实施例中的采集端100或者服务端200，该计算设备可以是物理服务器、虚拟机或服务器集群，也可以是可设置于物理服务器或虚拟机的芯片(系统)或其他部件或组件，本申请对此不做限定。

进一步地，计算设备800包括处理器801、存储器802和通信接口803，其中，处理器801、存储器802和通信接口803通过总线805进行通信，也可以通过无线传输等其他手段实现通信。

处理器801可以由至少一个通用处理器构成，例如CPU、NPU或者CPU和硬件芯片的组合。上述硬件芯片可以是专用集成电路(Application-Specific Integrated Circuit，ASIC)、可编程逻辑器件(Programmable Logic Device，PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(Complex Programmable Logic Device，CPLD)、现场可编程逻辑门阵列(Field-Programmable Gate Array，FPGA)、通用阵列逻辑(Generic Array Logic，GAL)或其任意组合。处理器801执行各种类型的数字存储指令，例如存储在存储器802中的软件或者固件程序，它能使计算设备800提供较宽的多种服务。

在具体的实现中，作为一种实施例，处理器801可以包括一个或多个CPU，例如图8中所示的CPU0和CPU1。

在具体实现中，作为一种实施例，计算设备800也可以包括多个处理器，例如图8中所示的处理器801和处理器804。这些处理器中的每一个可以是一个单核处理器(single-CPU)，也可以是一个多核处理器(multi-CPU)。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。

存储器802用于存储程序代码，并由处理器801来控制执行。程序代码中可以包括一个或多个软件模块。

在计算设备800是采集端时，上述一个或多个软件模块可以是图1实施例中的采集单元和输入单元，其中采集单元用于采集算料和待推理数据，输入单元用于获取用户输入的算料。上述具体实现方式可以参考图1～图7实施例中的描述，此处不再赘述。

在计算设备800是服务端时，上述一个或多个软件模块可以是图1实施例中的任务下发单元、算料收集单元、模型训练单元、模型推理单元和负例反馈单元，其中，任务下发单元用于向采集端下发任务信息，算料收集单元用于接收采集端反馈的算料，根据算料确定模型训练使用的样本集，模型训练单元用于使用样本集对模型进行训练获得业务模型，模型推理单元用于将采集端采集的待推理数据输入业务模型，获得推理结果，负例反馈单元用于根据推理结果确定负例，获得负例的修正信息，上述具体实现方式可以参考图1～图7方法实施例，此处不再赘述。

存储器802可以包括只读存储器和随机存取存储器，并向处理器801提供指令和数据。存储器802还可以包括非易失性随机存取存储器。例如，存储器802还可以存储设备类型的信息。

存储器802可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(read-only memory，ROM)、可编程只读存储器(programmable ROM，PROM)、可擦除可编程只读存储器(erasable PROM，EPROM)、电可擦除可编程只读存储器(electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(static RAM，SRAM)、动态随机存取存储器(DRAM)、同步动态随机存取存储器(synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(double data date SDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM，DR RAM)。还可以是硬盘(hard disk)、U盘(universal serial bus，USB)、闪存(flash)、SD卡(secure digitalmemory Card,SD card)、记忆棒等等，硬盘可以是硬盘驱动器(hard disk drive,HDD)、固态硬盘(solid state disk,SSD)、机械硬盘(mechanical hard disk,HDD)等，本申请不作具体限定。

通信接口803可以为有线接口(例如以太网接口)，可以为内部接口(例如高速串行计算机扩展总线(Peripheral Component Interconnect express,PCIe)总线接口)、有线接口(例如以太网接口)或无线接口(例如蜂窝网络接口或使用无线局域网接口)，用于与其他服务器或模块进行通信，具体实现中，通信接口803可用于接收报文，以供处理器801或处理器804对该报文进行处理。

总线805可以是快捷外围部件互联标准(Peripheral Component InterconnectExpress，PCIe)总线，或扩展工业标准结构(extended industry standard architecture，EISA)总线、统一总线(unified bus，Ubus或UB)、计算机快速链接(compute express link，CXL)、缓存一致互联协议(cache coherent interconnect for accelerators，CCIX)等。总线805可以分为地址总线、数据总线、控制总线等。

需要说明的，图8仅仅是本申请实施例的一种可能的实现方式，实际应用中，计算设备800还可以包括更多或更少的部件，这里不作限制。关于本申请实施例中未示出或未描述的内容，可参见前述图1-图7实施例中的相关阐述，这里不再赘述。

应理解，图8所示的计算设备800还可以是至少一个物理服务器构成的计算机集群，具体可参考图1至图7实施例关于服务端的具体形态描述，为了避免重复，此处不再赘述。

本申请实施例提供一种计算机可读存储介质，包括：该计算机可读存储介质中存储有计算机指令；当该计算机指令在计算机上运行时，使得该计算机执行上述方法实施例所述的模型训练方法。

本申请实施例提供了一种包含指令的计算机程序产品，包括计算机程序或指令，当该计算机程序或指令在计算机上运行时，使得该计算机执行上述方法实施例所述的模型训练方法。

上述实施例，可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时，上述实施例可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括至少一个计算机指令。在计算机上加载或执行计算机程序指令时，全部或部分地产生按照本发明实施例的流程或功能。计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digitalsubscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含至少一个可用介质集合的服务器、数据中心等数据存储节点。可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如，高密度数字视频光盘(digital videodisc,DVD)、或者半导体介质。半导体介质可以是SSD。

以上，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修复或替换，这些修复或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种模型训练方法，其特征在于，所述方法包括：

服务端向采集端发送任务信息，所述任务信息包括现场作业人员执行任务时所需的任务单、检查单、问题单中的一种或者多种；

接收所述采集端发送的算料，其中，所述算料是所述现场作业人员通过所述采集端根据所述任务信息在作业现场采集的算料，所述算料包括视频、音频、图像、文字中的一种或者多种；

根据所述算料生成样本集，使用所述样本集对模型进行训练，获得训练好的业务模型。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

接收采集端发送的待推理数据，将所述待推理数据输入所述业务模型获得推理结果；

确定所述推理结果中的负例信息，所述负例信息包括误检结果和漏检结果；

获取所述负例信息的修正信息，根据所述负例信息和所述负例信息的修正信息，对所述业务模型进行增量学习。

3.根据权利要求1或2所述的方法，其特征在于，所述根据所述算料生成样本集包括：

根据算料信息和所述算料的属性将所述算料归集至现场作业算料库，其中，所述算料信息是所述采集端采集所述算料时生成的，所述算料信息包括采集时间、采集地点、采集对象、任务场景、作业对象、作业地点、作业日期、检查项目、检查日期、审核结论中的一种或者多种，所述算料的属性包括场景、时间、对象、地点、标签中的一种或者多种；

根据所述现场作业算料库确定所述样本集。

4.根据权利要求2或3所述的方法，其特在于，所述方法还包括：

在第一阶段的情况下，以弱提醒交互的方式将所述推理结果显示给用户，其中，所述弱提醒交互包括显示浮动标记，所述浮动标签包括标签名称和/或目标检测框；

在第二阶段的情况下，以强提醒交互的方式将所述推理结果显示给用户，其中，所述强提醒交互包括弹窗警告、显示故障位置、告警故障问题中的一种或者多种。

5.根据权利要求4所述的方法，其特征在于，所述第一阶段和所述第二阶段是根据预设时间点确定的，其中，第一阶段的发生时间在于所述预设时间点，第二阶段的发生时间晚于所述预设时间点；或者，

所述第一阶段和所述第二阶段是根据所述业务模型的预测效果确定的，其中，所述业务模型在所述第一阶段下的预测效果低于预设阈值，所述业务模型在所述第二阶段下的预测效果不低于所述预设阈值。

6.根据权利要求1至5任一权利要求所述的方法，其特征在于，所述采集端包括现场工作人员持有的终端设备，还包括所述作业现场布置的传感器，所述传感器包括摄像头、相机、布控球、智能安全帽、记录仪、麦克风阵列中的一种或者多种。

7.一种服务端，其特征在于，所述服务端包括：

任务下发单元，用于向采集端发送任务信息，所述任务信息包括现场作业人员执行任务时所需的任务单、检查单、问题单中的一种或者多种；

算料收集单元，用于接收所述采集端发送的算料，其中，所述算料是所述现场作业人员通过所述采集端根据所述任务信息在作业现场采集的算料，所述算料包括视频、音频、图像、文字中的一种或者多种；

模型训练单元，用于根据所述算料生成样本集，使用所述样本集对模型进行训练，获得训练好的业务模型。

8.根据权利要求7所述的服务端，其特征在于，所述服务端还包括模型推理单元和负例反馈单元，其中，

所述模型推理单元，用于接收采集端发送的待推理数据，将所述待推理数据输入所述业务模型获得推理结果；

所述负例反馈单元，用于确定所述推理结果中的负例信息，所述负例信息包括误检结果和漏检结果；

所述负例反馈单元，还用于获取所述负例信息的修正信息，根据所述负例信息和所述负例信息的修正信息，对所述业务模型进行增量学习。

9.根据权利要求7或8所述的服务端，其特征在于，

所述算料收集单元，用于根据算料信息和所述算料的属性将所述算料归集至现场作业算料库，其中，所述算料信息是所述采集端采集所述算料时生成的，所述算料信息包括采集时间、采集地点、采集对象、任务场景、作业对象、作业地点、作业日期、检查项目、检查日期、审核结论中的一种或者多种，所述算料的属性包括场景、时间、对象、地点、标签中的一种或者多种；

所述算料收集单元，用于根据所述现场作业算料库确定所述样本集。

10.根据权利要求8或9所述的服务端，其特在于，所述负例反馈单元，用于：

11.根据权利要求10所述的服务端，其特征在于，所述第一阶段和所述第二阶段是根据预设时间点确定的，其中，第一阶段的发生时间在于所述预设时间点，第二阶段的发生时间晚于所述预设时间点；或者，

12.根据权利要求7至11任一权利要求所述的服务端，其特征在于，所述采集端包括现场工作人员持有的终端设备，还包括所述作业现场布置的传感器，所述传感器包括摄像头、相机、布控球、智能安全帽、记录仪、麦克风阵列中的一种或者多种。

13.一种模型训练系统，其特征在于，所述系统包括采集端和服务端，其中，

所述服务端，用于向采集端发送任务信息，所述任务信息包括现场作业人员执行任务时所需的任务单、检查单、问题单中的一种或者多种；

所述采集端用于根据所述任务信息在作业现场采集算料，所述算料包括视频、音频、图像、文字中的一种或者多种；

所述采集端用于向所述服务端发送所述算料；

所述服务端，用于根据所述算料生成样本集，使用所述样本集对模型进行训练，获得训练好的业务模型。

14.根据权利要求13所述的系统，其特征在于，

所述采集端，用于获取待推理数据；

所述服务端，用于接收所述采集端发送的待推理数据，将所述待推理数据输入所述业务模型获得推理结果；

所述服务端，用于确定所述推理结果中的负例信息，所述负例信息包括误检结果和漏检结果；

所述服务端，用于获取所述负例信息的修正信息，根据所述负例信息和所述负例信息的修正信息，对所述业务模型进行增量学习。

15.根据权利要求14所述的系统，其特在于，

所述服务端，用于在第一阶段的情况下，以弱提醒交互的方式将所述推理结果显示给用户，其中，所述弱提醒交互包括显示浮动标记，所述浮动标签包括标签名称和/或目标检测框；

所述服务端，用于在第二阶段的情况下，以强提醒交互的方式将所述推理结果显示给用户，其中，所述强提醒交互包括弹窗警告、显示故障位置、告警故障问题中的一种或者多种。

16.根据权利要求13至15任一权利要求所述的系统，其特征在于，所述采集端包括现场工作人员持有的终端设备，还包括所述作业现场布置的传感器，所述传感器包括摄像头、相机、布控球、智能安全帽、记录仪、麦克风阵列中的一种或者多种。

17.一种计算设备，其特征在于，包括处理器和存储器，所述存储器用于存储代码，所述处理器用于执行所述代码实现如权利要求1至6任一权利要求所述的方法。

18.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有指令，所述指令被计算机运行时实现如权利要求1至6任一权利要求所述的方法。