CN115690542A

CN115690542A - 一种基于改进yolov5的航拍绝缘子定向识别方法

Info

Publication number: CN115690542A
Application number: CN202211369709.XA
Authority: CN
Inventors: 赵博; 马宏忠; 刘英挺; 狄磊; 李春亮; 胡庆钊; 张驯; 张琴; 陈丽; 张潇; 张学军
Original assignee: STATE GRID GASU ELECTRIC POWER RESEARCH INSTITUTE; State Grid Gansu Electric Power Co Ltd; Lanzhou Jiaotong University
Current assignee: STATE GRID GASU ELECTRIC POWER RESEARCH INSTITUTE; State Grid Gansu Electric Power Co Ltd; Lanzhou Jiaotong University
Priority date: 2022-11-03
Filing date: 2022-11-03
Publication date: 2023-02-03

Abstract

一种基于改进yolov5的航拍绝缘子定向识别方法，包括以下步骤：获取训练所用的绝缘子图片集，利用带角度参数的定向框对所获图片集进行标注，生成深度学习模型所需的数据集，并对数据集进行划分得到训练集和测试集；基于yolov5网络构建绝缘子定向识别模型，该绝缘子定向识别模型括图像输入模块，特征提取BackBone模块，特征融合Neck模块及预测head模块；使用训练集对绝缘子识别模型进行训练，训练完成后使用划分好的测试集对绝缘子识别模型的性能进行评估，计算平均精度AP指标。本发明解决了yolov5网络无法进行定向目标识别，在复杂背景下学习干扰信息使先验知识含有背景噪声而导致定位不精确的问题。与现有方法比，本方法识别速度快、精度高，可应用于绝缘子视频流检测。

Description

一种基于改进yolov5的航拍绝缘子定向识别方法

技术领域

本发明属于计算机视觉图像识别技术领域，具体涉及一种基于改进yolov5的航拍绝缘子定向识别方法。

背景技术

绝缘子是输配电网络中的重要组成部分，它是一种安装在不同电位导体之间，或者导体与地电位构件之间的器件。能够耐受住电压与机械应力的作用，是一种特殊的绝缘控件，能够在架空输配电线路上起到重要的作用。绝缘子的受损通常会导致整条线路的使用异常和寿命缩短，因此对于绝缘子的检测就显得尤为重要。由于绝缘子普遍应用于架空输配电线路上，人工检测难度较大，一般借助于无人机等航拍设备进行拍摄并对图像进行分析。在拍摄图片过程中对于绝缘子精准且快速的识别是一项有难度的任务，现有的深度学习方法对于目标识别主要分为基于锚框的算法例如：Fast R-cnn，Yolo系列网络和非基于锚框的算法例如：Mask R-cnn等，其中主流算法仍然是基于水平锚框的算法。然而航拍图片多为俯视角度进行拍摄，每张照片中通常包含多个绝缘子，加上绝缘子本身的外观形状特点是长宽比比较大。在利用传统的基于水平锚框的识别模型进行识别时，会将大量的背景信息标注为绝缘子导致其学习到非目标信息，最终使识别精度下降，并且所识别到的绝缘子在图片中同样包含一定量的背景信息既定位不够准确。专利202111431311 .X，一种基于旋转框识别网络的绝缘子检测定位方法通过在训练阶段添加识别框的角度信息来旋转识别绝缘子，一定程度上改善了水平框识别受背景信息干扰的问题。但该方法没有考虑识别的速度效能，在识别精度上没有进行适应性的改进，无法利用视频流检测绝缘子，很难在真实应用场景中得到推广。

发明内容

解决的技术问题：针对前述技术问题，本发明公开了一种基于改进yolov5的航拍绝缘子定向识别方法，实现了用定向框识别绝缘子、缩小了绝缘子的识别范围、提高了绝缘子的识别精度、识别速度性能出色。并且可推广至在视频流中识别绝缘子，以及应用在电力系统边云协同架构的嵌入式设备中。

本发明所采用的技术方案为：

一种基于改进Yolov5的航拍绝缘子定向识别方法，包括以下步骤：

S1,获取训练所用的绝缘子图片集，利用带角度参数的定向框对所获图片集进行标注，生成深度学习模型所需的数据集，并对数据集进行划分得到训练集和测试集；

S2,基于yolov5网络构建绝缘子定向识别模型，该绝缘子定向识别模型括图像输入模块，特征提取BackBone模块既yolov5的主干网络，特征融合Neck模块既yolov5的颈部，以及预测head模块既yolov5的头部；

所述图像输入模块对批量绝缘子图片进行旋转、亮度变化、随机裁剪、随机拼接操作，增强模型鲁棒性；

所述特征提取BackBone模块对经过图像输入模块处理的绝缘子图片进行卷积特征提取，生成不同尺度的特征图；

所述特征融合Neck模块对特征提取BackBone模块处理的不同尺度的特征图进行上下采样，使输出具有完备的特征信息的特征图；

所述预测head模块在特征融合Neck模块处理的特征图上对绝缘子进行拟合与识别；

S3,使用训练集对绝缘子识别模型进行训练，训练完成后使用划分好的测试集对绝缘子识别模型的性能进行评估，计算平均精度AP指标。

进一步的：

S1中使用roLabelImg数据标注工具对获取到的航拍绝缘子图片进行标注，生成标签数据，再对该标签数据进行转换生成dota格式的数据既矩形中心点坐标（x，y）和矩形的长、宽以及矩形与x轴的夹角角度参数信息。

对于添加的角度参数在做反向传播的梯度下降时利用长边定义法与CLS策略，既定义定向框的角度时选取较长边与水平方向所夹角为定向框的角度，CLS则是将角度的回归问题转化为分类问题，添加长边定义法所定义的180个角度参数做分类问题。

S2中所述图像输入模块首先使用到了yolo系列传统的Mosaic数据增强方法既对于训练数据进行随机的缩放、随机的剪裁、随机的排布的方式进行拼接；其次利用自适应的锚框计算方法对于要检测的物体预先计算近似的锚框大小；最后使用到自适应图片放缩操作将不同分辨率的图片调整至相同分辨率。

S2中所述特征提取BackBone模块，该模块在yolo系列常用的CSPDarknet基础上增加了Focus既切片操作来增加所提取到特征的通道数；在Focus操作之后的BackBone阶段yolov5首先利用CSP卷积模块将初始特征图由第三级级特征图提取为第二级特征图，再利用CSP卷积模块和CBAM轻量化注意力机制模块将第二级特征图提取为第一级特征图；CBAM轻量化注意力机制模块将经卷积得到的特征图首先由通道注意力机制模块CAM ，ChannelAttention Module，既先经过基于宽和高的全局最大池化和全局平均池化，再分别经过三层的全连接感知机将其输出在像素尺度进行加和后由sigmoid函数进行激活；将输出的特征图与初始特征图在像素尺度做乘法得到CAM模块的输出；将CAM模块的输出作为SAM，Spatial Attention Module的输入，首先做基于通道尺度的全局最大池化和全局平均池化，将所得结果在通道尺度进行张量拼接；再经过通道尺度的卷积操作降维到单通道特征图，最后将所得特征图与SAM的输入做乘法得到具备丰富空间信息的特征图。

S2中所述特征融合Neck模块采用SPP模块与FPN+PAN模块进行上采样与下采样，具体的：由SPP模块将三级特征图进行最大池化过后的张量拼接得到特征信息更加完备的特征图，通过FPN进行上采样将上级特征图的更丰富的视野信息融合到下一级特征图，通过PAN模块下采样将更加精确的定位信息融合到上级特征图；融合后将得到不同大小不同级别的特征图。

S2中所述预测head模块是将经过特征融合Neck模块得到的三级特征图借鉴SSD的思想，既大特征图拟合小目标、小特征图拟合大目标的策略针对不同大小的目标进行识别；具体的，针对第一级特征图设置的预选框大小为[(116,90),(156,98),(373,326)],针对第二级特征图设置的预选框大小为[(30,61),(62,45),(59,119)],针对第三级特征图设置的预选框大小为[(10,13),(16,30),(33,23)]。

S3中计算AP指标来评估模型性能的具体操作步骤为：保存训练生成的权重文件，在测试模型中利用该权重文件去识别绝缘子，与标注的真实信息进行比对，生成对应的CSV文件；从该CSV文件中提取AP信息。

S3中训练所用定向识别的损失函数为：

该式中

为总体损失函数，

为分类损失，

为矩形框位置损失，

为置信度损失，

为矩形框角度损失；其中分类损失、置信度损失与矩形框角度损失利用BCEWithlogitsloss函数计算得到，矩形框位置损失则由CIOU_Loss函数计算得到。

本发明的有益效果：

第一，本发明继承了yolov5具备的单阶段网络识别速度快等优点，符合输配电网络对于实时性的高要求。此外，轻量化的网络结构对于硬件性能的要求较低，可以部署在例如无人机等嵌入式设备上，实用性较为出色。

第二，本发明可以应用到视频识别领域。经过实践其速度可以达到22FPS，满足视频识别的速度要求，且得到了实践检验。

第三，本发明在原有yolov5网络的基础上增加了轻量化注意力机制模块CBAM，该模块的引入使得网络特征提取能力得到显著提升，并且没有增加检测的时间开销。使改进后的模型实用性再次提升。

第四，本发明利用CLS方法和长边定义法解决了在对角度参数做回归时的边界问题。继而可以使用带有角度的定向框对绝缘子图片集进行标注，避免了因水平框标注时将大量背景信息标注为绝缘子而导致模型学习到与模型训练无关背景信息的问题。损失函数在原有yolov5的损失函数基础上增添使用BCEWithlogitsloss函数计算得到的矩形框角度损失量。

附图说明

图1为本发明的流程图；

图2为本发明中标注带角度参数数据集工具（RoLabelImg）的效果示意图；

图3为本发明中所用到的改进后的yolov5网络模型结构示意图；

图4为本发明添加注意力机制前后模型收敛程度对比图；

图5为本发明添加注意力机制前后map指标对比图；

图6为本发明中所用到的CBAM轻量化注意力机制模块结构示意图；

图7为本发明中所用到的长边定义法示意图；

图8为本发明中各级特征图所对应参数示意图；

图9为本发明中训练模型经验证的AP指标及PR曲线；

图10为本发明训练中得到的各项参数示意图；

图11为本发明中用训练得到的模型对航拍绝缘子图片进行识别的示意图；

图12为本发明中用训练得到的模型对航拍绝缘子视频进行识别的截取示意图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。显然，所描述的实施例是本发明的一部分实施例，而不是全部实施例。基于本发明中的实施例，本领域普通技术人员在无创造性劳动的前提下所获得的所有其他实施例，都应属于本发明的保护范围。

参见图1，一种基于改进yolov5的航拍绝缘子定向识别方法，包括以下步骤：

S1,获取训练所用的绝缘子图片集，利用带角度参数的定向框对所获图片集进行标注，生成深度学习模型所需的数据集，并对数据集进行划分得到训练集和测试集。

进一步的：S1中使用roLabelImg数据标注工具对获取到的航拍绝缘子图片进行标注，生成标签数据，再对该标签数据进行转换生成dota格式的数据既矩形中心点坐标（x，y）和矩形的长、宽以及矩形与x轴的夹角角度参数信息。

对于添加的角度参数在做反向传播的梯度下降时利用长边定义法与CLS策略，既定义定向框的角度时选取较长边与水平方向所夹角为定向框的角度，CLS则是将角度的回归问题转化为分类问题，添加长边定义法所定义的180个角度参数做分类问题。有效的规避了角度回归时的边界振荡问题。用该策略可以有效使角度信息参与到模型训练的过程当中，解决了角度信息难以通过回归问题进行训练的问题。

S2,基于yolov5网络构建绝缘子定向识别模型。该绝缘子识别模型主要包括图像输入模块，特征提取BackBone模块既yolov5的主干网络，特征融合Neck模块既yolov5的“颈部”，以及预测head模块既yolov5的“头部”。图像输入模块首先使用到了yolo系列传统的Mosaic数据增强方法既对于训练数据进行随机的缩放、随机的剪裁、随机的排布的方式进行拼接；其次利用自适应的锚框计算方法对于要检测的物体预先计算近似的锚框大小，以达到加快训练和检测时间的目的；最后使用到自适应图片放缩操作将不同分辨率的图片调整至相同分辨率，同样对yolov5的推理能力进行了提升。

在特征提取BackBone模块，该模块在yolo系列常用的CSPDarknet基础上增加了Focus既切片操作来增加所提取到特征的通道数。CSPDarknet是从yolov4开始使用的yolo系列常用特征提取网络，其是在yolov4之前的特征提取网络Darknet基础上增加了CSP既Cross Stage Partial结构，该结构借鉴残差连接的思想用来减少计算量和增强梯度表示。该CSPDarknet网络主要包括CBL模块和CSP模块，CBL模块由卷积层、批量归一化BN层、Leakyrelu激活函数构成。CSP模块借鉴了Resnet思想通过残差连接的方式让多个CBL模块连接在一起，有效的加深了网络结构。然后通过张量拼接再进行批量归一化和Leaky relu函数激活。

剩余的BackBone阶段yolov5首先利用CSP卷积模块将初始特征图由第三级级特征图提取为第二级特征图，再利用CSP卷积模块和CBAM轻量化注意力机制模块将第二级特征图提取为第一级特征图，CBAM轻量化注意力机制模块通过对所提取特征的通道维度与空间维度进行进一步的特征提取使最终所得特征图含有丰富的空间信息而没有增大时间开销。

图6为本发明中所用到的CBAM轻量化注意力机制模块结构示意图，该CBAM轻量化注意力机制模块包括CAM模块和SAM模块。CAM（Channel Attention Module）模块为通道注意力机制模块，SAM（Spatial Attention Module）模块为空间注意力机制模块。经卷积得到的特征图首先由通道注意力机制模块CAM既先经过基于宽和高的全局最大池化和全局平均池化，再分别经过三层的全连接感知机将其输出在像素尺度进行加和后由sigmoid函数进行激活，使特征图具备通道特征信息。将输出的特征图与初始特征图在像素尺度做乘法得到CAM模块的输出。将CAM模块的输出作为空间注意力机制模块SAM的输入，首先做基于通道尺度的全局最大池化和全局平均池化，将所得结果在通道尺度进行张量拼接。再经过通道尺度的卷积操作降维到单通道特征图，最后将所得特征图与SAM的输入做乘法得到具备丰富空间信息的特征图。

在特征融合Neck模块采用SPP模块与FPN+PAN模块进行上采样与下采样，具体的：

由SPP模块将三级特征图进行不同尺度的最大池化，转化为相同尺寸，再与输入后第二次进行特征提取后的特征图进行张量拼接，融合形成丰富且具备多级特征信息的特征图。在最大池化过程中具体的kernel size为{1*1，5*5，9*9，13*13}。

所述FPN结构既上采样过程通过插值法将第一级特征图尺寸放大到第二级特征图的大小，再与其进行张量拼接。同样的方法将第二级特征图与第三级特征图进行拼接，以达到将上级特征图的强语义信息向下传递的目的。通过FPN进行上采样将上级特征图的更丰富的“视野”信息融合到下一级特征图。

所述PAN结构与FPN思想相似，是将第三级特征图经过卷积操作将尺寸转化到与第二级特征图一致后进行张量拼接。同样的方法将第二级特征图与第一级特征图进行拼接，以达到将下级特征图的强定位信息向上传递的目的。通过PAN模块下采样将更加精确的定位信息融合到上级特征图。将融合后得到的不同大小不同级别的特征图送去预测head模块。

所述预测head模块是将经过特征融合Neck模块得到的三级特征图借鉴SSD的思想，既大特征图拟合小目标、小特征图拟合大目标的策略针对不同大小的目标进行识别；具体的，针对第一级特征图设置的预选框大小为[(116,90),(156,98),(373,326)],针对第二级特征图设置的预选框大小为[(30,61),(62,45),(59,119)],针对第三级特征图设置的预选框大小为[(10,13),(16,30),(33,23)]。

S3,使用训练集对绝缘子识别模型进行训练，训练完成后使用划分好的测试集对绝缘子识别模型的性能进行评估，计算平均精度AP指标。其中计算AP指标来评估模型性能的具体操作步骤为：保存训练生成的权重文件，在测试模型中利用该权重文件去识别绝缘子，与标注的真实信息进行比对，生成对应的CSV文件。从该CSV文件中提取AP信息。

下面将通过具体实现方法及效果进一步说明本发明。

一种基于改进yolov5的航拍绝缘子定向识别方法，具体如下：

步骤一，获取绝缘子图片集，对绝缘子图片进行标注，生成用于深度学习模型所需的数据集。

示例性地，绝缘子图片中的绝缘子是该识别模型所要识别的唯一目标，应当理解，大小不一的绝缘子说明识别模型需要有多尺度的识别能力，本发明方法可以推广应用到更多与绝缘子有类似外形特征的航拍图片的设备识别任务中。图2为其中一种手动标注带角度参数数据集工具（RoLabelImg）效果示意图。图中显示两个大小不同且均不是水平放置的绝缘子标注框。含有绝缘子的定向标注框的位置信息、大小信息、角度信息为本发明关注的标注信息。图2中的其他字符是标注工具的自带参数，与本实施例的技术方案无关。

在开源数据集上获取更多的航拍绝缘子数据集，利用标注工具RoLabelImg进行标记，标记为Insulators类。利用RoLabelImg标注的数据集是VOC格式yolov5网络无法直接使用，所以需要转化为dota形式的txt格式文件。将转化成txt格式的数据集再根据训练集：测试集：验证集为7：2：1的比例划分。

步骤二，构建绝缘子定向识别模型

本实施例的绝缘子识别模型基于yolov5网络实现，为了更加符合本实施例所面临的应用场景，本实施例对于原始的yolov5网络模型进行了改进。图3为本实施例所用到的改进后的yolov5网络模型结构示意图。

具体的，本实施例从以下几个方面对原始yolov5模型进行了改进：

第一：为了将标注框的角度信息引入yolov5网络，本发明借鉴了CLS思想既将回归问题变成一个分类问题，再结合长边定义法既将定向框较长边与水平方向的夹角定义为定向框的角度。图7为长边定义法示意图。将标签维度由原始yolov5网络所用的（

，

，

）既标注框左上角与右下角的坐标信息，改为（X,Y,W，H,θ）既标注框中心点的坐标信息与长宽信息以及角度信息。原始yolov5网络的数据加载部分涉及到的数据增强技术含有大量的归一化与反归一化操作，因此本发明改进的yolov5网络模型要求输入的图片必须padding为Width=Height的格式，以避免长边定义法中长边与短边与图片的长宽没有严格的对应关系而导致定位信息混乱。

参见图3，在特征提取BackBone模块在主要包括CSPDarknet网络的基本结构上增加了CBAM轻量化注意力机制模块而特征融合Neck模块本发明保留了yolov5原有的结构：

由图像输入模块进行过数据增强的数据首先经过Focus模块执行切片拼接操作，由原本的608*608*3的特征图变为304*304*12的特征图，后再经过一次卷积变为304*304*32的特征图，既在基本保留原有图片特征的情况下增添特征的通道数，扩充特征的空间信息。之后经过特征提取BackBone模块由CBL卷积模块和CSP卷积模块对输入进行特征提取：首先经过两次CBL模块与CSP1_X的组合卷积得到第二级特征图，尺寸为38*38。再经过一次CBL模块与CSP1_X的组合卷积和CBAM注意力机制模块得到第一级特征图，尺寸为19*19。图4为本发明添加注意力机制前后模型收敛程度对比图、图5为本发明添加注意力机制前后map指标对比图。模型在引入CBAM注意力机制后在收敛方面较未添加注意力机制有显著提升，而在map指标方面也有近4个百分点的提升，由此可见CBAM注意力机制的引入使本发明的改进效果得到了很大的提升。特征提取模块结束后由Neck模块进行以SPP模块和上下采样为主要手段的特征融合。具体的：首先由SPP模块进行三级特征图与原始特征图尺寸相适应的Maxpooling操作，继而进行张量拼接合成具有多尺度特征信息的特征图。将该特征图经过CSP2_X卷积模块与CBL卷积模块的组合得到的特征图，再进行上采样操作与第一级特征图进行张量拼接，将该步操作得到的特征图再进行CSP2_X与CBL模块的组合卷积，上采样后与第二级特征图进行张量拼接。最后经过一个CSP2_X模块与conv模块得到尺寸为76*76最终的第三级特征图。同理，最终尺寸为38*38的第二级特征图是由Neck模块中第二次上采样前的特征图与最终第三级特征图张量拼接后，经过CSP2_X与conv模块卷积得到的。最终尺寸为19*19的第一级特征图则是由Neck模块第一次上采样前的特征图与最终第二级特征图张量拼接后，经过CSP2_X与conv模块卷积得到的。至此特征提取BackBone模块与特征融合Neck模块完成了所有工作。

第二：在预测Head模块主要改进是添加了标注框的角度信息。具体的：为Detect构造函数添加了180个角度分类通道。参见图8以每级特征图的各个像素为中心点构造三个大小不同的锚框，所以每一级特征图上的像素点对应的参数为3*(4+1+1+180），3为锚框数、4为锚框大小与位置信息参数、两个1分别为类别参数与置信度参数、180为角度分类参数。

第三：在损失函数做出适应性改进。原始yolov5网络的损失函数为：

在引入角度分类参数后损失函数也添加角度的分类损失，得到定向目标识别的损失函数为：

该式中

为总体损失函数，

为分类损失，

为矩形框位置损失，

为置信度损失，

为矩形框角度损失。其中分类损失、置信度损失与矩形框角度损失利用BCEWithlogitsloss函数计算得到，矩形框位置损失则由CIOU_Loss函数计算得到。CIOU_Loss相较于GIOU_Loss考虑了锚框的长宽比，更符合绝缘子长宽比例大的特点。

式中

为sigmoid函数，

式中

既候选框与真实框的交并比，

是用于权衡v的参数，

是衡量长宽比一致性的参数，

是A，B两个中心点间的欧式距离，c是A框和B框的最小包围矩形对角线的欧式距离。

是真实框的宽，

是真实框的高，W为预选框的宽，H为预选框的高。

第四：参数调整，网络的不同超参数组合会使本发明改进的yolov5定向识别绝缘子的性能起到不同的效果。因此本发明在对改进的yolov5模型进行不同超参数组合的调整，直至对网络的评估性能达到最优，超参数组合如表1所示。

Table

超参数	超参数所选值
		迭代轮数	500
学习率	0.0032
		批量大小	4

对于在该超参数组合下训练得到的模型，将其训练过程中保存在CSV文件中的预测准确率Precision与召回率Recall取出绘制PR曲线并计算AP指标。

其中TP代表真正例,FP代表假正例,FN代表假反例，AP指标的计算可以通过计算PR曲线下面积得到。参照图9，本实施例中训练得到的模型AP指标为0.95。参照图10，各项训练指标均在500次的迭代过后趋于收敛，且各项指标均达到了良好水平。参照图11，利用本发明实施例所训练模型可以对航拍绝缘子图片进行定向、快速的识别，且识别精度高。参照图12，本发明实施例所训练模型对航拍绝缘子视频也可以进行定向识别，且效果良好。

第五：时间性能比较，本发明基本保留了原始yolov5网络的快速识别性能，针对平均单张图片的识别速度进行对比。对比如表2所示，本发明既表中定向YOLOv5+CBAM注意力机制平均单张时间仅比原始YOLOv5网络增加0.006秒，与其他主流识别网络代表Faster R-cnn网络相比更是有明显速度优势，说明了本文方法的识别速度性能优秀。

Table

识别模型	平均单张识别所用时间
		Faster R-cnn	0.37s
YOLOv5	0.045s
		定向YOLOv5	0.047s
本发明	0.051s

Claims

1.一种基于改进Yolov5的航拍绝缘子定向识别方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于改进yolov5的航拍绝缘子定向识别方法，其特征在于，S1中使用roLabelImg数据标注工具对获取到的航拍绝缘子图片进行标注，生成标签数据，再对该标签数据进行转换生成dota格式的数据既矩形中心点坐标（x，y）和矩形的长、宽以及矩形与x轴的夹角角度参数信息。

3.根据权利要求2所述的一种基于改进yolov5的航拍绝缘子定向识别方法，其特征在于，对于添加的角度参数在做反向传播的梯度下降时利用长边定义法与CLS策略，既定义定向框的角度时选取较长边与水平方向所夹角为定向框的角度，CLS则是将角度的回归问题转化为分类问题，添加长边定义法所定义的180个角度参数做分类问题。

4.根据权利要求1所述的一种基于改进yolov5的航拍绝缘子定向识别方法，其特征在于，S2中所述图像输入模块首先使用到了yolo系列传统的Mosaic数据增强方法既对于训练数据进行随机的缩放、随机的剪裁、随机的排布的方式进行拼接；其次利用自适应的锚框计算方法对于要检测的物体预先计算近似的锚框大小；最后使用到自适应图片放缩操作将不同分辨率的图片调整至相同分辨率。

5.根据权利要求1所述的一种基于改进yolov5的航拍绝缘子定向识别方法，其特征在于，S2中所述特征提取BackBone模块，该模块在yolo系列常用的CSPDarknet基础上增加了Focus既切片操作来增加所提取到特征的通道数；在Focus操作之后的BackBone阶段yolov5首先利用CSP卷积模块将初始特征图由第三级级特征图提取为第二级特征图，再利用CSP卷积模块和CBAM轻量化注意力机制模块将第二级特征图提取为第一级特征图；CBAM轻量化注意力机制模块将经卷积得到的特征图首先由通道注意力机制模块CAM ，ChannelAttention Module，既先经过基于宽和高的全局最大池化和全局平均池化，再分别经过三层的全连接感知机将其输出在像素尺度进行加和后由sigmoid函数进行激活；将输出的特征图与初始特征图在像素尺度做乘法得到CAM模块的输出；将CAM模块的输出作为SAM，Spatial Attention Module的输入，首先做基于通道尺度的全局最大池化和全局平均池化，将所得结果在通道尺度进行张量拼接；再经过通道尺度的卷积操作降维到单通道特征图，最后将所得特征图与SAM的输入做乘法得到具备丰富空间信息的特征图。

6.根据权利要求1所述的一种基于改进yolov5的航拍绝缘子定向识别方法，其特征在于，S2中所述特征融合Neck模块采用SPP模块与FPN+PAN模块进行上采样与下采样，具体的：由SPP模块将三级特征图进行最大池化过后的张量拼接得到特征信息更加完备的特征图，通过FPN进行上采样将上级特征图的更丰富的视野信息融合到下一级特征图，通过PAN模块下采样将更加精确的定位信息融合到上级特征图；融合后将得到不同大小不同级别的特征图。

7.根据权利要求1所述的一种基于改进yolov5的航拍绝缘子定向识别方法，其特征在于，S2中所述预测head模块是将经过特征融合Neck模块得到的三级特征图借鉴SSD的思想，既大特征图拟合小目标、小特征图拟合大目标的策略针对不同大小的目标进行识别；具体的，针对第一级特征图设置的预选框大小为[(116,90),(156,98),(373,326)],针对第二级特征图设置的预选框大小为[(30,61),(62,45),(59,119)],针对第三级特征图设置的预选框大小为[(10,13),(16,30),(33,23)]。

8.根据权利要求1中所述的一种基于改进yolov5的航拍绝缘子定向识别方法，其特征在于，S3中计算AP指标来评估模型性能的具体操作步骤为：保存训练生成的权重文件，在测试模型中利用该权重文件去识别绝缘子，与标注的真实信息进行比对，生成对应的CSV文件；从该CSV文件中提取AP信息。

9.根据权利要求8中所提到的一种基于改进yolov5的航拍绝缘子定向识别方法，其特征在于，S3中训练所用定向识别的损失函数为：

该式中

为总体损失函数，

为分类损失，

为矩形框位置损失，

为置信度损失，