CN114842208A

CN114842208A - 一种基于深度学习的电网危害鸟种目标检测方法

Info

Publication number: CN114842208A
Application number: CN202210638361.3A
Authority: CN
Inventors: 邱志斌; 周志彪; 李俊轩; 童志鹏; 张润; 朱轩
Original assignee: Nanchang University
Current assignee: Nanchang University
Priority date: 2022-06-08
Filing date: 2022-06-08
Publication date: 2022-08-02
Anticipated expiration: 2042-06-08
Also published as: CN114842208B

Abstract

本发明公开了一种基于深度学习的电网危害鸟种目标检测方法，首先利用Avibase世界鸟类数据库与收集的输电线路巡检图像，构建威胁电网安全的相关鸟种图像数据集，并基于改进的DnCNN去噪网络模型对鸟种图像数据集进行预处理，对预处理后的图像进行标签制作，获得图像中鸟种的真实边界框位置和框内类别信息；然后采用聚类算法对真实边界框的高和宽进行聚类分析，得到最优先验框，并将鸟种图像数据集划分为训练集、验证集与测试集；构建并训练改进的YOLOv4鸟种目标检测模型；最后利用训练后的改进YOLOv4鸟种目标检测模型对测试集图像进行检测。本发明可为电网涉鸟故障差异化防治提供参考。

Description

一种基于深度学习的电网危害鸟种目标检测方法

技术领域

本发明属于输电线路监测图像数据处理技术领域，具体涉及一种基于深度学习的电网危害鸟种目标检测方法。

背景技术

随着国家对环保的重视和治理投入的增加，绿化状况的改善和提升给人类和动植物的生存、繁衍创造了有利条件，而鸟类就是最大受益者之一。因此，随着电网的不断延伸，架空输电线路遍布山野、河流、村庄和城镇各种复杂地理环境，鸟类在架空线路旁活动的机会日益增多，导致鸟类活动而引起的输电线路故障次数明显上升。电网的安全运行是人类安全和稳定用电的前提，精准且有效的防鸟成为迫切需要。不同鸟类导致的输电线路故障往往不同，而电网巡检人员由于缺乏识鸟工具难以实现电网涉鸟故障的差异化防治。如何快速辅助电网巡检人员定位并识别危害鸟种，对于开展电网涉鸟故障的差异化防治具有重要意义。

由于输电线路涉鸟故障具有瞬时性和突发性的特点，需要在最短的时间内检测出目标鸟种的位置和种类，必须缩短检测的时间，才能够及时得到反馈进行相应的操作，有效避免意外事故发生。随着深度学习的发展，许多研究学者开展了鸟类图像识别的研究，但大部分鸟类图像研究仅仅停留在生态学领域，关注输电线路涉鸟故障相关鸟种研究较少。因此，威胁输电线路安全的相关鸟种目标检测的研究对于电网的安全运行是非常必要的。

发明内容

鉴于此，本发明的目的在于提供一种基于深度学习的电网危害鸟种目标检测方法，用于准确识别出危害电网安全的危害鸟种，为涉鸟故障的差异化防治提供参考。

为实现上述目的，本发明提供如下技术方案：一种基于深度学习的电网危害鸟种目标检测方法，包括如下步骤：

S1、构建威胁电网安全的相关鸟种图像数据集与基于改进的DnCNN去噪网络模型预处理方法：利用Avibase世界鸟类数据库与收集的输电线路巡检图像，建立包含N种鸟类的图像数据集；搭建包含12层的改进DnCNN去噪网络模型对鸟种图像数据集进行预处理，将预处理后的鸟种图像数据集按一定比例划分为训练集、验证集和测试集；并对预处理后的鸟种图像进行标注，获得真实目标边界框位置和框内类别信息，再通过K-means算法将真实目标边界框的高和宽作为参数进行聚类，得到最优先验框；

S2、构建改进的YOLOv4鸟种目标检测模型：利用改进的GhostNet替换YOLOv4中的CSPDarkNet53特征提取网，并利用深度可分离卷积DSC替换YOLOv4中SPP+PANet的3×3普通卷积块，且将PANet中的连续五次普通卷积块替换为三次深度可分离卷积DSC，形成新的金字塔池化网络SPP-DSC+PANet-DSC；在改进的GhostNet中选取的特征信息输入SPP-DSC+PANet-DSC之前引入CBAM注意力机制，并将YOLO_head预测网络中的3×3普通卷积块替换为深度可分离卷积DSC；

S3、训练改进的YOLOv4鸟种目标检测模型：通过对输入的训练集鸟种图像增加灰条进行Resize操作，并将在MS COCO图像数据集上训练获得的预训练权重，进行包括冻结和非冻结两个阶段的迁移学习，在冻结阶段中，冻结具有权重参数的层，使用较大学习率对非冻结层进行参数调整，在非冻结阶段，较小学习率微调网络所有层的参数；采用Mosaic数据增强方式，每次随机选取四幅鸟种图像进行翻转、缩放、色域变换的操作，再将操作后的图像按照上下左右四个方向进行拼凑成一幅鸟种图像加入训练集进行随机增强，Mosaic数据增强设置在训练结束前的N个epoch；学习率调整采用线性上升和模拟cos函数下降的余弦退火衰减策略；

S4、采用改进的YOLOv4鸟种目标检测模型对鸟种图像进行检测：将测试集鸟种图像输入至改进的YOLOv4鸟种目标检测模型中进行检测，并采用非极大值抑制筛选冗余预测边界框，获得最终保留的边界框，实现鸟种目标的检测。

进一步地，步骤S1中，所述搭建包含12层的改进DnCNN去噪网络模型，第1层由普通卷积Conv和激活函数Mish组成，其中采用64个3×3的卷积核进行特征提取，步长为1，并且在第1层和最后1层添加一个残差连接形成残差块；第2～11层由普通卷积Conv、BN层、激活函数Mish组成，其中采用64个3×3的卷积核进行特征提取，步长为1，并且在第2层和第11层、第3层和第10层、第4层和第9层、第5层和第8层、第6层和第7层分别添加一个残差连接形成5个残差块；最后1层由普通卷积Conv组成，其中32个3×3的卷积核进行还原输出，步长为1；训练过程中，采用采用动量随机梯度下降SGDM算法对改进的DnCNN去噪网络模型参数进行优化；

针对于一幅R、G、B三通道的鸟种彩色图像，将训练后的去噪网络模型分别对三个颜色通道进行单独去噪，再将单独去噪后的三幅单通道图像进行合并，生成去噪后的RGB鸟类图像。

进一步地，步骤S1中，所述将预处理后的鸟种图像按一定比例划分为训练集、验证集和测试集：训练集与验证集的比例为9:1，训练验证集(训练集+验证集)与测试集的比例为9:1。采用K-means算法将真实边界框的高h＝y_max-y_min和宽w＝x_max-x_min作为参数进行聚类分析，最终K-means聚类算法得到(67,107)；(78,192)；(104,134)；(122,206)；(147,269)；(158,153)；(190,209)；(205,303)；(268,246)9个最优先验框。

进一步地，步骤S2中，所述改进的YOLOv4鸟种目标检测模型结构由三部分组成，第一部分为特征提取网络GhostNet-Focus，第二部分为空间金字塔池化网络SPP-DSC+PANet-DSC，第三部分是预测网络YOLO_head；

首先，搭建由1个CBR层和16个G-bneck层(G-bneck-1～G-bneck-16)组成的轻量级卷积神经网络GhostNet，在GhostNet网络中的CBR层前加入Focus层，获得新的主干特征提取网络GhostNet-Focus；其中CBR层由普通卷积Conv、BN层、激活函数ReLU组成，G-bneck包含步长为1和步长为2的两个类别，当G-bneck步长为1时，G-bneck层依次包括GhostNetModule、BN层、激活函数ReLU、GhostNet Module、BN层，且G-bneck输入和输出之间加入残差学习策略，当G-bneck步长为2时，G-bneck层依次包括GhostNet Module、BN层、激活函数ReLU、2×2的深度可分离卷积DSC、BN层、GhostNet Module、BN层，在残差部分依次添加2×2的深度可分离卷积DSC和1×1普通卷积Conv，当G-bneck-i中i的值为2、4、6和12时步长为2，反则步长为1，GhostNetModule由1×1普通卷积Conv和深度可分离卷积DSC组成，深度可分离卷积DSC由3×3深度卷积与1×1逐点卷积组成；

然后，选取GhostNet-Focus中的G-bneck-5、G-bneck-11、G-bneck-16三个不同特征层的特征信息作为SPP-DSC+PANet-DSC的输入，进行最大池化操作和由深到浅与由浅到深的特征融合，最终输出F1、F2和F3三个融合特征；三个融合特征经过深度可分离卷积DSC与普通卷积Conv之后分别对应YOLO_head预测网络中13×13×45、26×26×45、52×52×45三种不同尺寸的预测结果，实现对大、中、小鸟种目标的检测。

进一步地，步骤S3中，所述的训练改进的YOLOv4鸟种目标检测模型：冻结和非冻结阶段各进行50轮，共100轮，在冻结阶段的batchsize和学习率分别为16、1×10^-3，在非冻结阶段的batchsize和学习率分别为8、1×10^-4；余弦退火学习率衰减中设置最大学习率learning_rate_base为1×10^-3、最小学习率learning_rate_min为1×10^-6和预热学习率warmup_rate为1×10^-5。

进一步地，步骤S4中，所述非极大值抑制筛选冗余预测边界框：设定置信度分数阈值score_threshold，剔除置信度分数小于score_threshold的预测框；将保留下的预测框集合P按照置信度分数由大到小排列，并将第一个预测框作为抑制预测框纳入保留框集合K中；计算预测框集合P中剩下的预测框与抑制预测框的并交比IOU，删除IOU大于给定阈值nms_iou的预测框，直到集合P中预测框数量为0，最终得到保留框集合K，实现鸟种类别和定位检测。非极大值抑制筛选冗余预测边界框的置信度分数阈值score_threshold设置为0.5，给定阈值nms_iou设置为0.3，最终获得保留框集合K显示在预测结果中，实现鸟种类别和定位检测。

与现有技术相比，本发明有益效果：

本发明构建威胁电网安全的相关鸟种数据集，基于改进的DnCNN去噪网络模型对鸟种图像数据集进行预处理，搭建改进的YOLOv4鸟种目标检测模型结合多种训练技巧对测试集图像进行检测，能够精准定位和识别威胁电网安全的相关鸟种。本发明提出的技术方案具有较好的准确度和检测速度，且模型体积较轻能够有利于实际的部署，可为电网涉鸟故障的差异化防治提供参考，有助于电网巡检人员准确识别鸟类，预防输电线路涉鸟故障。

附图说明

图1为本发明的方法流程图；

图2为本发明的方法实施流程图；

图3为本发明构建的改进YOLOv4的鸟种目标检测模型。

具体实施方式

下面结合实施例对本发明做进一步的描述，有必要在此指出的是以下实施例只是用于对本发明进行进一步的说明，不能理解为对本发明保护范围的限制，该领域的技术熟练人员根据上述发明内容所做出的一些非本质的改进和调整，仍属于本发明保护范围。

一种基于深度学习的电网危害鸟种目标检测方法，其流程图如图1和图2所示，包括以下步骤：

本实施例中，从Avibase世界鸟类数据库与收集的输电线路巡检图像中选取了黑鹳、东方白鹳、大鸨、白鹭、戴胜、池鹭、红隼、黑领椋鸟、丝光椋鸟、八哥10种鸟类作为研究对象，构建威胁电网安全的相关鸟种图像数据集，其中每种鸟种图像数量为300幅，共计3000幅图像样本。搭建包含12层的改进DnCNN去噪网络模型，第1层由普通卷积Conv和激活函数Mish组成，其中采用64个3×3的卷积核进行特征提取，步长为1，并且在第1层和最后1层添加一个残差连接形成残差块；第2～11层由普通卷积Conv、BN层、激活函数Mish组成，其中采用64个3×3的卷积核进行特征提取，步长为1，并且在第2层和第11层、第3层和第10层、第4层和第9层、第5层和第8层、第6层和第7层分别添加一个残差连接形成5个残差块；最后1层由普通卷积Conv组成，其中32个3×3的卷积核进行还原输出，步长为1；训练过程中，采用采用动量随机梯度下降SGDM算法对改进的DnCNN去噪网络模型参数进行优化；针对于一幅R、G、B三通道的鸟种彩色图像，将训练后的去噪网络模型分别对三个颜色通道进行单独去噪，再将单独去噪后的三幅单通道图像进行合并，生成去噪后的RGB鸟类图像；

将预处理后的图像按一定比例划分为训练集、验证集和测试集：训练集与验证集的比例为9:1，训练验证集(训练集+验证集)与测试集Test Set的比例为9:1。因此，训练集包含2430个样本，验证集包含270个样本，测试集包含300个样本。使用标注工具Labelimg对预处理后图像进行标注，获得真实边界框的左下顶点坐标(x_min，y_min)、右上顶点坐标(x_max，y_max)和框内目标所属类别，生成.xml文件；采用K-means算法对真实边界框的高h＝y_max-y_min和宽w＝x_max-x_min作聚类分析，在聚类选择中随机选取9个初始先验框尺寸作为聚类中心，判定第i个真实边界框与第j个初始先验框的距离d_ij＝1-IOUt_inr_iu_tit_ah_l达到最小值时，其中IOUt_inr_iu_tit_ah_l是真实边界框和初始先验框的交并比，则第i个真实边界框属于j个初始先验框；所有真实边界框归类完成后，利用取h和w均值更新各个先验框的尺寸，再次进行归类迭代直至先验框的尺寸不再变化，得到(67,107)；(78,192)；(104,134)；(122,206)；(147,269)；(158,153)；(190,209)；(205,303)；(268,246)9个最优先验框。

S2、构建改进的YOLOv4鸟种目标检测模型：利用改进的GhostNet替换YOLOv4中的CSPDarkNet53特征提取网络，并利用深度可分离卷积DSC替换YOLOv4中SPP+PANet的3×3普通卷积块，且将PANet中的连续五次普通卷积块替换为三次深度可分离卷积DSC，形成新的金字塔池化网络SPP-DSC+PANet-DSC；在改进的GhostNet中选取的特征信息输入SPP-DSC+PANet-DSC之前引入CBAM注意力机制，并将YOLO_head预测网络中的3×3普通卷积块替换为深度可分离卷积DSC；

本实施例构建的改进的YOLOv4鸟种目标检测模型如图3所示，改进的YOLOv4鸟种目标检测模型结构由三部分组成，第一部分为特征提取网络GhostNet-Focus，第二部分为空间金字塔池化网络SPP-DSC+PANet-DSC，第三部分是预测网络YOLO_head；

然后，选取GhostNet-Focus中的G-bneck-5、G-bneck-11、G-bneck-16三个不同特征层的特征信息作为SPP-DSC+PANet-DSC的输入，进行最大池化操作和由深到浅与由浅到深的特征融合，最终输出F1、F2和F3三个融合特征；三个融合特征经过深度可分离卷积DSC与普通卷积Conv层之后分别对应YOLO_head预测网络中13×13×45、26×26×45、52×52×45三种不同尺寸的预测结果，实现对大、中、小鸟种目标的检测。

本实施例中，改进的YOLOv4鸟种目标检测模型训练：步骤S3中，所述的训练改进的YOLOv4鸟种目标检测模型：冻结和非冻结阶段各进行50轮，共100轮，在冻结阶段的batchsize和学习率分别为16、1×10^-3，在非冻结阶段的batchsize和学习率分别为8、1×10^-4；余弦退火学习率衰减中设置最大学习率learning_rate_base为1×10^-3、最小学习率learning_rate_min为1×10^-6和预热学习率warmup_rate为1×10^-5。

S4、改进的YOLOv4鸟种目标检测模型对鸟种图像进行检测：将测试集鸟种图像输入至改进的YOLOv4鸟种目标检测模型中进行检测，并采用非极大值抑制筛选冗余预测边界框，获得最终保留的边界框，实现鸟种目标的检测。

本实施例中，设定置信度分数阈值score_threshold，剔除置信度分数小于score_threshold的预测框；将保留下的预测框集合P按照置信度分数由大到小排列，并将第一个预测框作为抑制预测框纳入保留框集合K中；计算预测框集合P中剩下的预测框与抑制预测框的并交比IOU，删除IOU大于给定阈值nms_iou的预测框，直到集合P中预测框数量为0，最终得到保留框集合K，实现鸟种类别和定位检测。非极大值抑制筛选冗余预测边界框的置信度分数阈值score_threshold设置为0.5，给定阈值nms_iou设置为0.3，最终获得保留框集合K显示在预测结果中，实现鸟种类别和定位检测。利用威胁电网安全的相关鸟种测试集对模型进行测试并与原始YOLOv4进行对比，检测结果如表1所示。

表1 模型对比结果模型

根据表1数据可知，本发明提出改进的YOLOv4鸟种目标检测模型在威胁电网安全的相关鸟种检测的mAP和FPS分别为97.55％、43。相比于YOLOv4精确度下降0.25％，但是检测速度约为YOLOv4的2.52倍；并且改进YOLOv4的参数量和训练出的权重大小缩小约为YOLOv4的0.15倍，在保证精度的同时提升了检测速度，更有利于实际模型的部署，有助于电网巡检人员准确识别鸟类。

以上所述仅表达了本发明的优选实施方式，并非是对本发明作其它形式的限制，任何熟悉本专业的技术人员可能利用上述揭示的内容加以更改或改型为等同变化的等效实施例。但是，凡是未脱离本发明技术方案内容，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型，仍属于本发明技术方案的保护范围。

Claims

1.一种基于深度学习的电网危害鸟种目标检测方法，其特征在于，包括如下步骤：

S3、训练改进的YOLOv4鸟种目标检测模型：通过对输入的训练集鸟种图像增加灰条进行Resize操作，并将在MS COCO图像数据集上训练获得的预训练权重，进行包括冻结和非冻结两个阶段的迁移学习，在冻结阶段中，冻结具有权重参数的层，对非冻结层进行参数调整，在非冻结阶段，微调网络所有层的参数；采用Mosaic数据增强方式，每次随机选取四幅鸟种图像进行翻转、缩放、色域变换的操作，再将操作后的图像按照上下左右四个方向进行拼凑成一幅鸟种图像加入训练集进行随机增强，Mosaic数据增强设置在训练结束前的N个epoch；学习率调整采用线性上升和模拟cos函数下降的余弦退火衰减策略；

2.根据权利要求1所述的一种基于深度学习的电网危害鸟种目标检测方法，其特征在于，步骤S1中，所述搭建包含12层的改进DnCNN去噪网络模型，第1层由普通卷积Conv和激活函数Mish组成，其中采用64个3×3的卷积核进行特征提取，步长为1，并且在第1层和最后1层添加一个残差连接形成残差块；第2～11层由普通卷积Conv、BN层、激活函数Mish组成，其中采用64个3×3的卷积核进行特征提取，步长为1，并且在第2层和第11层、第3层和第10层、第4层和第9层、第5层和第8层、第6层和第7层分别添加一个残差连接形成5个残差块；最后1层由普通卷积Conv组成，其中32个3×3的卷积核进行还原输出，步长为1；在训练过程中，采用动量随机梯度下降SGDM算法对改进的DnCNN去噪网络模型参数进行优化；

3.根据权利要求1所述的一种基于深度学习的电网危害鸟种目标检测方法，其特征在于，步骤S1中，使用标注工具Labelimg对预处理后图像进行标注，获得真实边界框的左下顶点坐标(x_min，y_min)、右上顶点坐标(x_max，y_max)和框内目标所属类别，生成.xml文件；采用K-means算法对真实边界框的高h＝y_max-y_min和宽w＝x_max-x_min作聚类分析，在聚类选择中随机选取9个初始先验框尺寸作为聚类中心，判定第i个真实边界框与第j个初始先验框的距离

达到最小值时，则第i个真实边界框属于j个初始先验框，其中

是真实边界框和初始先验框的交并比；所有真实边界框归类完成后，利用取h和w均值更新各个先验框的尺寸，再次进行归类迭代直至先验框的尺寸不再变化，最终得到9个最优先验框。

4.根据权利要求1所述的一种基于深度学习的电网危害鸟种目标检测方法，其特征在于，步骤S2中，所述改进的YOLOv4鸟种目标检测模型结构由三部分组成，第一部分为特征提取网络GhostNet-Focus，第二部分为空间金字塔池化网络SPP-DSC+PANet-DSC，第三部分是预测网络YOLO_head；

搭建由1个CBR层和16个G-bneck层即G-bneck-1～G-bneck-16组成的轻量级卷积神经网络GhostNet，在GhostNet网络中的CBR层前加入Focus层，获得新的主干特征提取网络GhostNet-Focus；其中CBR层由普通卷积Conv、BN层、激活函数ReLU组成，G-bneck包含步长为1和步长为2的两个类别，当G-bneck步长为1时，G-bneck层依次包括GhostNet Module、BN层、激活函数ReLU、GhostNet Module、BN层，且G-bneck输入和输出之间加入残差学习策略，当G-bneck步长为2时，G-bneck层依次包括GhostNet Module、BN层、激活函数ReLU、2×2的深度可分离卷积DSC、BN层、GhostNet Module、BN层，在残差部分依次添加2×2的深度可分离卷积DSC和1×1普通卷积Conv，当G-bneck-i中i的值为2、4、6和12时步长为2，反之则步长为1，GhostNet Module由1×1普通卷积Conv和深度可分离卷积DSC组成，深度可分离卷积DSC由3×3深度卷积与1×1逐点卷积组成；

选取GhostNet-Focus中的G-bneck-5、G-bneck-11、G-bneck-16三个不同特征层的特征信息作为SPP-DSC+PANet-DSC的输入，进行最大池化操作和由深到浅与由浅到深的特征融合，最终输出F₁、F₂和F₃三个融合特征；三个融合特征经过深度可分离卷积DSC与普通卷积Conv之后分别对应YOLO_head预测网络中13×13×45、26×26×45、52×52×45三种不同尺寸的预测结果，实现对大、中、小鸟种目标的检测。

5.根据权利要求1所述的一种基于深度学习的电网危害鸟种目标检测方法，其特征在于，步骤S3中，所述的训练改进的YOLOv4鸟种目标检测模型：冻结和非冻结阶段各进行50轮，共100轮，在冻结阶段的batchsize和学习率分别为16、1×10^-3，在非冻结阶段的batchsize和学习率分别为8、1×10^-4；余弦退火学习率衰减中设置最大学习率learning_rate_base为1×10^-3、最小学习率learning_rate_min为1×10^-6和预热学习率warmup_rate为1×10^-5。