CN115376130A

CN115376130A - 电力施工现场识别模型的生成方法、装置、设备及介质

Info

Publication number: CN115376130A
Application number: CN202211005713.8A
Authority: CN
Inventors: 吴荣华; 张龙浩; 胡晖; 梁波涛; 骆志敏
Original assignee: Guangdong Power Grid Co Ltd; Huizhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Current assignee: Guangdong Power Grid Co Ltd; Huizhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date: 2022-08-22
Filing date: 2022-08-22
Publication date: 2022-11-22

Abstract

本发明实施例公开了电力施工现场识别模型的生成方法、装置、设备及介质，包括：获取电力施工现场对应的多个图像样本数据，并对各图像样本数据中包括的目标进行标注，得到每个图像样本数据对应的目标标注结果；将各图像样本数据输入至YOLOV5算法模型中，通过YOLOV5算法模型，对各图像样本数据中包括的至少一个目标进行识别，得到每个图像样本数据对应的目标识别结果；根据各图像样本数据对应的目标标注结果，与目标识别结果之间的差异，对YOLOV5算法模型进行迭代训练，得到电力施工现场识别模型。本发明实施例的技术方案可以解决人工巡检的方式浪费大量的人力、物力和效率低下的问题，为工地的智能化、自动化建设提供基础。

Description

电力施工现场识别模型的生成方法、装置、设备及介质

技术领域

本发明实施例涉及电力系统自动化技术领域，尤其涉及电力施工现场识别模型的生成方法、装置、设备及介质。

背景技术

近年来，在电网高速发展的背景下，电力施工工程众多，电力设施遍布广阔，为工程进度与安全巡检带来挑战。

目前，对电力施工现场的进度与安全巡检工作主要依靠人工巡检、人工核实的方式进行。

但是，依靠人工巡检、人工核实对电力施工现场的进度与安全监测的方式会浪费大量的人力和物力，同时巡检效率相对低下，并且自动化程度不足，不具有实时性，预警效果较差。

发明内容

本发明实施例提供了电力施工现场识别模型的生成方法、装置、设备及介质，相对于人工对电力施工现场巡检的方式节省了人力、物力资源，为智慧工地的建设提供基础。

第一方面，本发明实施例提供了一种电力施工现场识别模型的生成方法，包括：

获取电力施工现场对应的多个图像样本数据，并对各图像样本数据中包括的至少一个目标进行标注，得到每个图像样本数据对应的目标标注结果；

将各图像样本数据输入至YOLOV5算法模型中，通过YOLOV5算法模型，对各图像样本数据中包括的至少一个目标进行识别，得到每个图像样本数据对应的目标识别结果；

根据各图像样本数据对应的目标标注结果，与目标识别结果之间的差异，对YOLOV5算法模型进行迭代训练，得到电力施工现场识别模型。

进一步的，目标包括：施工阶段信息，以及安全帽佩戴信息；

对各图像样本数据中包括的至少一个目标进行标注，得到每个图像样本数据对应的目标标注结果，包括：

对各图像样本数据中包括的施工阶段信息以及安全帽佩戴信息进行标注，得到每个图像样本数据对应的目标标注结果。

进一步的，对各图像样本数据中包括的施工阶段信息以及安全帽佩戴信息进行标注，得到每个图像样本数据对应的目标标注结果，包括：

对各图像样本数据中包括的施工阶段信息以及安全帽佩戴信息进行标注，得到每个目标对应的矩形框；

将每个目标对应的矩形框的位置信息以及类别信息，作为目标标注结果。

进一步的，将各图像样本数据输入至YOLOV5算法模型中，通过YOLOV5算法模型，对各图像样本数据中包括的至少一个目标进行识别，得到每个图像样本数据对应的目标识别结果，包括：

将各图像样本数据按照预设尺寸进行缩放处理，并将处理后的多个图像样本数据分成多个批次；

将每个批次中包括的多个图像样本数据批量输入至YOLOV5算法模型中；

使用YOLOV5模型对各图像样本数据的张量进行前向计算，得到每个图像样本数据中目标对应的预测矩形框；

将每个目标对应的预测矩形框的位置信息以及类别信息，作为目标识别结果。

进一步的，根据各图像样本数据对应的目标标注结果，与目标识别结果之间的差异，对YOLOV5算法模型进行迭代训练，得到电力施工现场识别模型，包括：

在多个批次中依次获取一个批次作为当前批次；

确定当前批次中各图像样本数据对应的目标标注结果，与目标识别结果之间的损失值；

计算损失值对YOLOV5算法模型中各权重矩阵和偏置参数的梯度，并对所述梯度进行更新；

返回执行在多个批次中依次获取一个批次作为当前批次的操作，直至完成对全部批次的处理过程，并将处理过程作为模型单次训练过程；

返回执行多个模型单次训练过程，直至YOLOV5算法模型收敛，或者模型单次训练过程的次数满足预设阈值为止；将YOLOV5算法模型作为电力施工现场识别模型。

进一步的，在将各图像样本数据按照预设尺寸进行缩放处理之前，还包括：

在每个图像样本数据包括的全部像素点中，依次获取一个像素点作为当前像素点；

获取当前像素点周围预设范围内的全部像素值，并将全部像素值进行排序；

在排序后的全部像素值中获取中间像素值，并将中间像素值作为当前像素点的像素值；

返回执行在每个图像样本数据包括的全部像素点中，依次获取一个像素点作为当前像素点的操作，直至完成对全部像素点的处理。

进一步的，在对YOLOV5算法模型进行迭代训练，得到电力施工现场识别模型之后，还包括：

获取电力施工现场对应的待测图像数据，通过电力施工现场识别模型对待测图像数据中包括的目标进行识别。

第二方面，本发明实施例提供了一种电力施工现场识别模型的生成装置，包括：

样本数据获取模块，用于获取电力施工现场对应的多个图像样本数据，并对各图像样本数据中包括的至少一个目标进行标注，得到每个图像样本数据对应的目标标注结果；

目标识别模块，用于将各图像样本数据输入至YOLOV5算法模型中，通过YOLOV5算法模型，对各图像样本数据中包括的至少一个目标进行识别，得到每个图像样本数据对应的目标识别结果；

模型生成模块，用于根据各图像样本数据对应的目标标注结果，与目标识别结果之间的差异，对YOLOV5算法模型进行迭代训练，得到电力施工现场识别模型。

第三方面，本发明实施例提供了一种电子设备，包括：

至少一个处理器；以及

与至少一个处理器通信连接的存储器；其中，

存储器存储有可被至少一个处理器执行的计算机程序，计算机程序被至少一个处理器执行，以使至少一个处理器能够执行本发明任意实施例提供的电力施工现场识别模型的生成方法。

第四方面，本发明实施例提供了一种计算机可读存储介质，其特征在于，计算机可读存储介质存储有计算机指令，计算机指令用于使处理器执行时实现本发明任意实施例提供的电力施工现场识别模型的生成方法。

本发明实施例通过获取电力施工现场对应的多个图像样本数据，并对各图像样本数据中包括的至少一个目标进行标注，得到每个图像样本数据对应的目标标注结果；将各图像样本数据输入至YOLOV5算法模型中，通过YOLOV5算法模型，对各图像样本数据中包括的至少一个目标进行识别，得到每个图像样本数据对应的目标识别结果；根据各图像样本数据对应的目标标注结果，与目标识别结果之间的差异，对YOLOV5算法模型进行迭代训练，得到电力施工现场识别模型的技术手段，可以实现自动化、智能化的监测电力施工现场的视频、图像数据，从而有效地解决了人工巡检方式浪费大量人力、物力、以及效率较低的问题，为工地的智能化、自动化建设提供基础。

应当理解，本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征，也不用于限制本发明实施例的范围。本发明实施例的其它特征将通过以下的说明书而变得容易理解。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例一提供的一种电力施工现场识别模型的生成方法的流程图；

图2是根据本发明实施例二提供的一种电力施工现场识别模型的生成方法的流程图；

图3是根据本发明实施例三提供的一种电力施工现场识别模型的生成装置的结构示意图；

图4是根据本发明实施例四提供的一种电子设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明实施例方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例一

图1为本发明实施例一提供的电力施工现场识别模型的生成方法的流程图，本实施例可用于电力施工现场状况的监测，如施工进度、安全隐患等，该方法可以由电力施工现场识别模型的生成装置来执行，该电力施工现场识别模型的生成装置可以采用硬件和/或软件的形式实现，该装置可配置在电子设备中，例如配置在笔记本、台式电脑中等。

如图1所示，本实施例一提供的一种电力施工现场识别模型的生成方法，具体包括如下步骤：

步骤101、获取电力施工现场对应的多个图像样本数据，并对各图像样本数据中包括的至少一个目标进行标注，得到每个图像样本数据对应的目标标注结果。

在本实施例中，可以采集电力施工现场中不同状况下对应的图像，作为图像样本数据，然后对图像样本数据中的各个目标进行标注，得到目标标注结果。其中，电力施工现场可以是电力输送工程施工现场、变电站建设施工现场等。

具体的，可以使用无人机等图像采集设备对电力施工现场的图像进行采集。对不同状况对应的图像样本数据中至少一个目标进行标注，标注结果可以为目标在整个图像中的像素位置坐标和所属类别等。在对图像样本数据标注之前还可以对图像样本数据进行预处理，所述预处理可以为图像滤波、直方图均衡化或仿射变换等，本实施例对此并不进行限制。

步骤102、将各图像样本数据输入至YOLOV5算法模型中，通过YOLOV5算法模型，对各图像样本数据中包括的至少一个目标进行识别，得到每个图像样本数据对应的目标识别结果；

具体的，将步骤101中完成目标标注的图像样本数据，输入YOLOV5算法模型中，YOLOV5可以对上述各图像样本数据中的至少一个目标进行识别，得到每个图像样本数据对应的目标识别结果。

其中，YOLOV5是一种基于卷积神经网络(CNN)的一阶段(one-stage)通用目标检测算法，它将目标检测识别任务当成一个回归问题来处理，能够快速检测识别图像中的目标，它包含用于图像特征提取的骨干网络(Backbone)、用于特征融合的瓶颈网络(Neck)以及能够进行多尺度预测的检测头(Prediction)。YOLOV5包含四种不同网络结构的模型，分别为YOLOV5s、YOLOV5m、YOLOV5l、YOLOV5x，可以根据实际情况需要选择合适的模型。目标识别结果为YOLOV5算法模型图像样本数据中识别出来的目标信息，该目标信息与步骤101中标注的目标信息的属性、类别相同。

步骤103、根据各图像样本数据对应的目标标注结果，与目标识别结果之间的差异，对YOLOV5算法模型进行迭代训练，得到电力施工现场识别模型。

具体的，根据各图像样本数据对应的目标标注结果，与每次目标识别结果之间的差异，对YOLOV5算法模型的参数进行修正更新使模型的目标识别结果不断趋向目标标注结果。经过多次迭代训练，使模型更加拟合，损失越来越低，最后得到预设效果的电力施工现场识别模型。

本发明实施例的方案通过获取电力施工现场对应的多个图像样本数据，并对各图像样本数据中包括的至少一个目标进行标注，得到每个图像样本数据对应的目标标注结果；将各图像样本数据输入至YOLOV5算法模型中，通过YOLOV5算法模型，对各图像样本数据中包括的至少一个目标进行识别，得到每个图像样本数据对应的目标识别结果；根据各图像样本数据对应的目标标注结果，与目标识别结果之间的差异，对YOLOV5算法模型进行迭代训练，得到电力施工现场识别模型的技术手段，相比于现有技术中依靠人工巡检、人工核实的方式而言，可以实现智能化地识别电力施工现场的各种状况，有效地解决了人工巡检的方式浪费大量的人力、物力、和效率低下的问题，为工地的智能化、自动化建设提供基础。

实施例二

图2是根据本发明实施例二提供的一种电力施工现场识别模型的生成方法的流程图。本发明实施例的技术方案是在上述任一实施例技术方案的基础上进行的进一步细化。本发明实施例的技术方案可以与上述任一实施例中的各个可选实施方式进行结合，包括如下步骤：

步骤201、获取电力施工现场对应的多个图像样本数据，并对各所述图像样本数据中包括的至少一个目标进行标注，得到每个图像样本数据对应的目标标注结果。

在本实施例的一个实施方式中，所述目标包括：施工阶段信息，以及安全帽佩戴信息；对各所述图像样本数据中包括的至少一个目标进行标注，得到每个图像样本数据对应的目标标注结果，包括：对各所述图像样本数据中包括的施工阶段信息以及安全帽佩戴信息进行标注，得到每个图像样本数据对应的目标标注结果。

在一个具体的实施例中，获取到多个图像样本数据后，可以依据人为方式对各图像样本数据中的施工阶段信息以及安全帽佩戴信息进行识别，然后对识别到的施工阶段信息以及安全帽佩戴信息进行标注，得到每个图像样本数据对应的目标标注结果。

具体的，所述施工阶段信息可以包括基础挖坑、浇筑、组塔、放线和附件安装等，所述安全帽佩戴信息可以包括施工人员已佩戴安全帽，以及施工人员未佩戴安全帽等。

这样设置的好处在于：可以实现对施工现场中人员安全情况，以及施工阶段信息进行有效监测，从而能够及时获取危险预警，并对施工阶段信息进行更好地记录。

在一个具体的实施例中，对各所述图像样本数据中包括的施工阶段信息以及安全帽佩戴信息进行标注，得到每个图像样本数据对应的目标标注结果，包括：对各所述图像样本数据中包括的施工阶段信息以及安全帽佩戴信息进行标注，得到每个目标对应的矩形框；将每个目标对应的矩形框的位置信息以及类别信息，作为目标标注结果。

在本实施例中，对图像样本数据中包括的施工阶段信息以及安全帽佩戴信息可以使用矩形框来标注。具体的，可以使用矩形框的左上角像素坐标和右下角像素坐标，来表示矩形框的位置信息，即所标注目标的位置信息，然后再标注矩形框的类别信息，即所述目标的类别信息。

在一个具体的实施方式中，所述矩形框的左上角像素坐标可以表示为(x1,y1)，右下角像素坐标可以表示为(x2,y2)，可以以列表的形式存储上述坐标。矩形框的类别信息可以用label表示，可以以字符串的形式存储矩形框的类别信息。

在一个具体的实施例中，可以使用Labelme软件工具对目标进行标注，所述Labelme软件是一个开源图像标注工具，为用户提供了可操作的界面，用户通过所述界面可以对目标进行矩形、多边形、圆形、线段等多种方式的标注，生成的标注文件可以以Json格式储存。

在本实施例中，通过矩形框的左上角像素坐标和右下角像素坐标，可以快速确定矩形框在图像样本数据中的位置信息，由此可以快速确定目标在图像样本数据中的位置。

步骤202、将各所述图像样本数据按照预设尺寸进行缩放处理，并将处理后的多个图像样本数据分成多个批次。

在一个具体的实施例中，可以将各图像样本数据缩放至k×k的大小，其中k为图像的长度和高度，k×k为预设尺寸。示例性的，k可以设置为640，具体数值可以根据实际情况进行预设，本实施例对此并不进行限制。

在将各所述图像样本数据按照预设尺寸进行缩放处理后，可以将所有图像样本数据分为多个批次，每个批次中可以包括batch张图像。示例性的，batch可以设置为16，具体数值可以根据实际情况进行预设，本实施例对此并不进行限制。

在本实施例中，通过对图像样本数据缩放至统一尺寸，可以对图像样本数据的大小进行归一化处理，由此避免由于图像样本数据大小不同导致算法模型无法训练；其次，通过将图像样本数据分成多批次，能够减小算法模型的训练计算量，降低模型的训练压力，使模型更容易收敛。

在本实施例的一个实施方式中，在将各所述图像样本数据按照预设尺寸进行缩放处理之前，还包括：在每个图像样本数据包括的全部像素点中，依次获取一个像素点作为当前像素点；获取当前像素点周围预设范围内的全部像素值，并将所述全部像素值进行排序；在排序后的全部像素值中获取中间像素值，并将所述中间像素值作为当前像素点的像素值；返回执行在每个图像样本数据包括的全部像素点中，依次获取一个像素点作为当前像素点的操作，直至完成对全部像素点的处理。

在本实施例中，通过将各像素点周围预设范围内的，全部像素值中的中间像素值作为所述像素点的像素值，可以实现对图像样本数据进行滤波平滑处理从而有效消除图像样本数据中的噪音。具体的，所述预设范围可以由预设的滤波器进行确定，如滤波器大小可以设置为5×5，具体数值可以根据实际情况进行预设，本实施例对此并不进行限制。

步骤203、将每个批次中包括的多个图像样本数据批量输入至YOLOV5算法模型中。

在本实施方式中，可以按批次将多个图像样本数据输入YOLOV5进行训练，每个批次可以包含batch张图像样本数据。

其中，YOLOV5算法模型默认使用txt格式的标注文件，若使用Labelme生成的Json格式的标注文件，需要对该Json文件进行转化。具体的，可以将文件从形如{label,x1,y1,x2,y2}的形式转化成形如{label,x,y,w,h}的形式，具体的转化公式如下：

x＝x1

y＝y1

w＝x2–x1

h＝y2–y1

其中，x、y分别与步骤201中的x1、y1对应，表示标注的矩形框的左上角像素坐标，w、h表示所述矩形框的宽度和高度。

步骤204、使用所述YOLOV5算法模型对各图像样本数据的张量进行前向计算，得到每个图像样本数据中目标对应的预测矩形框。

在此步骤中，YOLOV5算法模型获取到各图像样本数据的张量后，可以使用Backbone层进行图像样本特征提取，然后使用Neck层进行图像样本特征融合，最后使用Prediction层来预测每个图像样本数据中目标对应的预测矩形框的位置、大小以及所包含目标的类别，从而完成前向传播计算。

其中，张量是一种数据存储容器，它可以为数组、矩阵、多维数组。在本实施方式中，图像样本数据的张量可以表示为，该图像样本数据对应的三维像素值矩阵。

步骤205、将每个目标对应的预测矩形框的位置信息以及类别信息，作为目标识别结果。

步骤206、在多个批次中依次获取一个批次作为当前批次。

具体的，依次获取步骤202中分成的多个批次中的一个批次作为当前批次。其中当前批次是输入YOLOV5算法模型中的一批图样样本数据。

步骤207、确定当前批次中各所述图像样本数据对应的目标标注结果，与目标识别结果之间的损失值。

在此步骤中，可以将对图像样本数据中的目标标注结果，与目标识别结果进行对比，也是将每个目标对应的矩形框的位置信息以及类别信息，与对应的预测矩形框的位置信息以及类别信息进行对比，根据对比结果计算出两者之间的损失值。

具体的，所述损失值包括置信度损失、分类损失和边界框损失等。置信度为预测矩形框中存在目标的概率；分类损失为目标识别结果中类别信息与目标标注结果中类别信息的差异值；边界框损失是预测矩形框与矩形框之间的位置、大小差异值。

其中，置信度损失和分类损失使用BCELoss损失函数进行计算，边界框损失使用GIoU损失函数进行计算。

步骤208、计算所述损失值对YOLOV5算法模型中各权重矩阵和偏置参数的梯度，并对所述梯度进行更新。

在此步骤中，可以计算上述损失值对YOLOV5算法模型中各个权重矩阵和偏置参数的梯度，并通过梯度下降算法对其进行更新，以完成反向传播，由此完成模型的一次训练。

步骤209、判断是否完成对全部批次的处理过程，若是，执行步骤210，若否，返回执行步骤206中在所述多个批次中依次获取一个批次作为当前批次的操作。

步骤210、将所述处理过程作为模型单次训练过程，并判断YOLOV5算法模型是否收敛，或者所述模型单次训练过程的次数是否满足预设阈值，若是，执行步骤211，若否，返回执行步骤206中在所述多个批次中依次获取一个批次作为当前批次的操作。

在此步骤中，如果YOLOV5算法模型没有收敛，或者所述模型单次训练过程的次数没有满足预设阈值时，则返回执行步骤206，以执行多个模型单次训练过程，直至所述YOLOV5算法模型收敛，或者所述模型单次训练过程的次数满足预设阈值为止。

示例性的，损失小于10^-5可以表示模型收敛，单次训练过程的次数预设阈值可以为2000，具体数值可以根据实际情况进行预设，本实施例对此并不进行限制。

步骤211、将完成训练的YOLOV5算法模型作为所述电力施工现场识别模型。

步骤212、获取电力施工现场对应的待测图像数据，通过所述电力施工现场识别模型对所述待测图像数据中包括的目标进行识别。

示例性的，可以将训练完成的电力施工现场识别模型部署在相应的软和/或硬件系统中，用于实时检测识别无人机等视频图像采集设备采集的图像数据中包括的目标。

本发明实施例，通过对各图像样本数据中包括的施工阶段信息以及安全帽佩戴信息进行标注，得到每个图像样本数据对应的目标标注结果，将各图像样本数据按照预设尺寸进行缩放处理，并将处理后的多个图像样本数据分成多个批次，将每个批次中包括的多个图像样本数据批量输入至YOLOV5算法模型中，使用YOLOV5算法模型对各图像样本数据的张量进行前向计算，得到每个图像样本数据中目标对应的预测矩形框，将每个目标对应的预测矩形框的位置信息以及类别信息作为目标识别结果，在多个批次中依次获取一个批次作为当前批次，确定当前批次中各图像样本数据对应的目标标注结果，与目标识别结果之间的损失值，计算损失值对YOLOV5算法模型中各权重矩阵和偏置参数的梯度，并对梯度进行更新，经过多次迭代训练得到电力施工现场识别模型，通过电力施工现场识别模型对待测图像数据中包括的目标进行识别的技术手段，能够对电力施工现场的施工状况和安全状况进行自动化、智能化的实时检测，从而实现施工进度的精准检测和安全隐患的及时预警。相对于人工巡检电力施工现场的方式，本发明实施例的方案，有效地解决了浪费大量人力、物力、以及效率较低的问题，为施工现场管理的决策提供科学依据，为工地的智能化、自动化建设提供基础。

本发明实施例的技术方案中，所涉及的视频数据的获取，存储和应用等，均符合相关法律法规的规定，且不违背公序良俗。

实施例三

图3是根据本发明实施例三提供的种电力施工现场识别模型的生成装置的结构示意图。该装置包括：样本数据获取模块301，目标识别模块302和模型生成模块303，其中：

样本数据获取模块301，用于获取电力施工现场对应的多个图像样本数据，并对各图像样本数据中包括的至少一个目标进行标注，得到每个图像样本数据对应的目标标注结果；

目标识别模块302，用于将各图像样本数据输入至YOLOV5算法模型中，通过YOLOV5算法模型，对各图像样本数据中包括的至少一个目标进行识别，得到每个图像样本数据对应的目标识别结果；

模型生成模块303，用于根据各图像样本数据对应的目标标注结果，与目标识别结果之间的差异，对YOLOV5算法模型进行迭代训练，得到电力施工现场识别模型。

在上述实施例的基础上，所述目标包括：施工阶段信息，以及安全帽佩戴信息。

样本数据获取模块301包括：

目标标注单元，用于对各所述图像样本数据中包括的施工阶段信息以及安全帽佩戴信息进行标注，得到每个图像样本数据对应的目标标注结果；

矩形框生成单元，用于对各所述图像样本数据中包括的施工阶段信息以及安全帽佩戴信息进行标注，得到每个目标对应的矩形框；

标注结果确定单元，用于将每个目标对应的矩形框的位置信息以及类别信息，作为目标标注结果。

目标识别模块302，包括：

图像样本数据分批单元，用于将各图像样本数据按照预设尺寸进行缩放处理，并将处理后的多个图像样本数据分成多个批次；

图像样本输入单元，用于将每个批次中包括的多个图像样本数据批量输入至YOLOV5算法模型中；

目标预测单元，用于使用YOLOV5算法模型对各图像样本数据的张量进行前向计算，得到每个图像样本数据中目标对应的预测矩形框；

识别结果确定单元，用于将每个目标对应的预测矩形框的位置信息以及类别信息，作为目标识别结果；

像素点获取单元，用于在每个图像样本数据包括的全部像素点中，依次获取一个像素点作为当前像素点；

像素值排序单元，用于获取当前像素点周围预设范围内的全部像素值，并将所述全部像素值进行排序；

像素值确定单元，用于在排序后的全部像素值中获取中间像素值，并将所述中间像素值作为当前像素点的像素值；

全部像素点处理单元，用于返回执行在每个图像样本数据包括的全部像素点中，依次获取一个像素点作为当前像素点的操作，直至完成对全部像素点的处理。

模型生成模块303，包括：

当前批次获取单元，用于在所述多个批次中依次获取一个批次作为当前批次；

损失值确定单元，用于确定当前批次中各所述图像样本数据对应的目标标注结果，与目标识别结果之间的损失值；

梯度更新单元，用于计算所述损失值对YOLOV5算法模型中各权重矩阵和偏置参数的梯度，并对所述梯度进行更新；

全部批次执行单元，用于返回执行在所述多个批次中依次获取一个批次作为当前批次的操作，直至完成对全部批次的处理过程，并将所述处理过程作为模型单次训练过程；

单次训练循环单元，用于返回执行多个模型单次训练过程，直至所述YOLOV5算法模型收敛，或者所述模型单次训练过程的次数满足预设阈值为止；

电力施工现场识别模型确定单元，用于将所述YOLOV5算法模型作为所述电力施工现场识别模型。

可选的，该装置，还包括：

待测目标识别模块，获取电力施工现场对应的待测图像数据，通过电力施工现场识别模型对待测图像数据中包括的目标进行识别。

上述装置可执行本发明前述所有实施例所提供的方法，具备执行上述方法相应的功能模块和有益效果。未在本发明实施例中详尽描述的技术细节，可参见本发明前述所有实施例所提供的方法。

实施例四

图4为本发明实施例提供的一种电子设备的结构示意图。该设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本发明实施例的实现。

如图4所示，电子设备10包括至少一个处理器11，以及与至少一个处理器11通信连接的存储器，如只读存储器(ROM)12、随机访问存储器(RAM)13等，其中，存储器存储有可被至少一个处理器执行的计算机程序，处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序，来执行各种适当的动作和处理。在RAM 13中，还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。

电子设备10中的多个部件连接至I/O接口15，包括：输入单元16，例如键盘、鼠标等；输出单元17，例如各种类型的显示器、扬声器等；存储单元18，例如磁盘、光盘等；以及通信单元19，例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理，例如电力施工现场识别模型的生成方法。

在一些实施例中，电力施工现场识别模型的生成方法可被实现为计算机程序，其被有形地包含于计算机可读存储介质，例如存储单元18。在一些实施例中，计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时，可以执行上文描述的电力施工现场识别模型的生成方法的一个或多个步骤。备选地，在其他实施例中，处理器11可以通过其他任何适当的方式(例如，借助于固件)而被配置为电力施工现场识别模型的生成方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本发明实施例的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器，使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本发明实施例的上下文中，计算机可读存储介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。备选地，计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在电子设备上实施此处描述的系统和技术，该电子设备具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、区块链网络和互联网。

计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务中，存在的管理难度大，业务扩展性弱的缺陷。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发明实施例中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本发明实施例的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本发明实施例保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本发明实施例的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

Claims

1.一种电力施工现场识别模型的生成方法，其特征在于，包括：

获取电力施工现场对应的多个图像样本数据，并对各所述图像样本数据中包括的至少一个目标进行标注，得到每个图像样本数据对应的目标标注结果；

将各所述图像样本数据输入至YOLOV5算法模型中，通过所述YOLOV5算法模型，对各所述图像样本数据中包括的至少一个目标进行识别，得到每个图像样本数据对应的目标识别结果；

根据各所述图像样本数据对应的目标标注结果，与目标识别结果之间的差异，对所述YOLOV5算法模型进行迭代训练，得到电力施工现场识别模型。

2.根据权利要求1所述的方法，其特征在于，所述目标包括：施工阶段信息，以及安全帽佩戴信息；

对各所述图像样本数据中包括的至少一个目标进行标注，得到每个图像样本数据对应的目标标注结果，包括：

对各所述图像样本数据中包括的施工阶段信息以及安全帽佩戴信息进行标注，得到每个图像样本数据对应的目标标注结果。

3.根据权利要求2所述的方法，其特征在于，对各所述图像样本数据中包括的施工阶段信息以及安全帽佩戴信息进行标注，得到每个图像样本数据对应的目标标注结果，包括：

对各所述图像样本数据中包括的施工阶段信息以及安全帽佩戴信息进行标注，得到每个目标对应的矩形框；

4.根据权利要求2所述的方法，其特征在于，将各所述图像样本数据输入至YOLOV5算法模型中，通过所述YOLOV5算法模型，对各所述图像样本数据中包括的至少一个目标进行识别，得到每个图像样本数据对应的目标识别结果，包括：

将各所述图像样本数据按照预设尺寸进行缩放处理，并将处理后的多个图像样本数据分成多个批次；

使用所述YOLOV5算法模型对各图像样本数据的张量进行前向计算，得到每个图像样本数据中目标对应的预测矩形框；

5.根据权利要求4所述的方法，其特征在于，根据各所述图像样本数据对应的目标标注结果，与目标识别结果之间的差异，对所述YOLOV5算法模型进行迭代训练，得到电力施工现场识别模型，包括：

在所述多个批次中依次获取一个批次作为当前批次；

确定当前批次中各所述图像样本数据对应的目标标注结果，与目标识别结果之间的损失值；

计算所述损失值对YOLOV5算法模型中各权重矩阵和偏置参数的梯度，并对所述梯度进行更新；

返回执行在所述多个批次中依次获取一个批次作为当前批次的操作，直至完成对全部批次的处理过程，并将所述处理过程作为模型单次训练过程；

返回执行多个模型单次训练过程，直至所述YOLOV5算法模型收敛，或者所述模型单次训练过程的次数满足预设阈值为止；

将所述YOLOV5算法模型作为所述电力施工现场识别模型。

6.根据权利要求4所述的方法，其特征在于，在将各所述图像样本数据按照预设尺寸进行缩放处理之前，还包括：

获取当前像素点周围预设范围内的全部像素值，并将所述全部像素值进行排序；

在排序后的全部像素值中获取中间像素值，并将所述中间像素值作为当前像素点的像素值；

7.根据权利要求2所述的方法，其特征在于，在对所述YOLOV5算法模型进行迭代训练，得到电力施工现场识别模型之后，还包括：

获取电力施工现场对应的待测图像数据，通过所述电力施工现场识别模型对所述待测图像数据中包括的目标进行识别。

8.一种电力施工现场识别模型的生成装置，其特征在于，包括：

样本数据获取模块，用于获取电力施工现场对应的多个图像样本数据，并对各所述图像样本数据中包括的至少一个目标进行标注，得到每个图像样本数据对应的目标标注结果；

目标识别模块，用于将各所述图像样本数据输入至YOLOV5算法模型中，通过所述YOLOV5算法模型，对各所述图像样本数据中包括的至少一个目标进行识别，得到每个图像样本数据对应的目标识别结果；

模型生成模块，用于根据各所述图像样本数据对应的目标标注结果，与目标识别结果之间的差异，对所述YOLOV5算法模型进行迭代训练，得到电力施工现场识别模型。

9.一种电子设备，其特征在于，所述电子设备包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的电力施工现场识别模型的生成方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的电力施工现场识别模型的生成方法。