CN113724233B

CN113724233B - 基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法

Info

Publication number: CN113724233B
Application number: CN202111025606.7A
Authority: CN
Inventors: 倪修峰; 程汪刘; 童旸; 鲍文霞; 倪杰; 高志国; 李磊; 孙涛
Original assignee: Anhui Nanrui Jiyuan Power Grid Technology Co ltd; Anhui University; Tongling Power Supply Co of State Grid Anhui Electric Power Co Ltd
Current assignee: Anhui Nanrui Jiyuan Power Grid Technology Co ltd; Anhui University; Tongling Power Supply Co of State Grid Anhui Electric Power Co Ltd
Priority date: 2021-09-02
Filing date: 2021-09-02
Publication date: 2022-10-11
Anticipated expiration: 2041-09-02
Also published as: CN113724233A

Abstract

本发明涉及基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法，与现有技术相比解决了变电设备外观缺陷检测识别率低的缺陷。本发明包括以下步骤：变电设备外观缺陷图像的获取；变电设备外观缺陷图像的再生成；变电设备外观缺陷检测模型的构建；变电设备外观缺陷检测模型的训练；待检测变电设备图像的获取；待检测变电设备图像缺陷问题的检测。本发明提高了变电设备外观图像缺陷检测的速度和准确率。

Description

基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法

技术领域

本发明涉及变电设备技术领域，具体来说是基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法。

背景技术

当前变电巡视模式滞后于大数据、云计算、物联网、移动互联、人工智能、三维BIM等一系列新技术的快速发展。变电设备运维、检修日常工作多采用人工就地操作、手动抄录、现场频繁往返等形式，变电站建设的各类在线监测、辅助监控、巡检机器人等业务系统数据相对独立，综合应用程序不高。而随着深度学习飞速发展及其在分类识别方面的优异性能，使其在电力智能巡检领域得到广泛应用。

但是样本的稀缺仍是将深度学习引入变电设备智能巡检中的一大障碍，针对特定场景，收集到大量带有标注的可用样本非常困难；同时，变电站所处的环境非常复杂，变电所设备缺陷中含有许多非刚性缺陷，如设备部件表面油污、地面油污、金属腐蚀等。在不同的场景中，属于同一类的缺陷在外观和形状上有很大的差异。

因此，针对缺陷设备图像数据集样本较少、变电站图像背景复杂以及电力设备缺陷外观差异大等难点问题，如何准确检测出变电设备外观缺陷已经成为急需解决的技术问题。

发明内容

本发明的目的是为了解决现有技术中变电设备外观缺陷检测识别率低的缺陷，提供一种基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法来解决上述问题。

为了实现上述目的，本发明的技术方案如下：

一种基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法，包括以下步骤：

11)变电设备外观缺陷图像的获取：获取已有的变电设备外观缺陷图像并进行预处理；

12)变电设备外观缺陷图像的再生成：利用图像转换GAN模型对已有的变电设备外观缺陷图像进行样本再生成，用于数据扩增；

13)变电设备外观缺陷检测模型的构建：基于融合并联型注意力技术构建变电设备外观缺陷检测模型；

14)变电设备外观缺陷检测模型的训练：利用小样本多阶段迁移技术对变电设备外观缺陷检测模型进行训练；

15)待检测变电设备图像的获取：获取待检测变电设备图像，并进行预处理；

16)待检测变电设备图像缺陷问题的检测：将预处理后的待检测变电设备图像输入训练后的变电设备外观缺陷检测模型，得到待检测变电设备图像的缺陷问题。

所述变电设备外观缺陷图像的获取包括以下步骤：

21)变电设备外观缺陷图像的获取：从监控视频图像中筛选出外观具有缺陷的变电设备图像，缺陷主要包括设备外观存在裂纹、锈蚀、油污；

22)变电设备外观正常图像的获取：从监控视频图像中筛选出外观正常的变电设备图像，正常变电设备是指设备外观无明显缺陷；

23)变电设备外观图像的预处理：对所采集到的缺陷图像和正常图像进行包括裁剪为预定大小图像、添加高斯噪声、旋转、翻转的预处理操作；

24)变电设备外观图像的分类：对所预处理后的图像按照有无缺陷分类并组合成变电设备外观缺陷图像数据集D和变电设备外观正常图像数据集N。

所述变电设备外观缺陷图像的再生成包括以下步骤：

31)变电设备外观缺陷图像再生成模型的构建：使用Pytorch深度学习框架搭建CycleGAN模型，并在CycleGAN网络的基础上添加两个注意力模块AD和AN，其中AD为N转换为D时使用的注意力模块，AN为D转换为N时使用的注意力模块；

32)数据输入：将变电设备外观缺陷图像数据集D和变电设备外观正常图像N输入变电设备外观缺陷图像再生成模型进行训练；

33)变电设备外观缺陷图像再生成模型的训练：迭代训练变电设备外观缺陷图像再生成模型并保存其参数；

34)通过已训练好的变电设备外观缺陷图像再生成模型来生成变电设备外观缺陷图像，并将增强的变电设备外观缺陷图像与原来的D结合在一起，组成新的变电设备外观缺陷图像数据集D。

所述变电设备外观缺陷检测模型的构建包括以下步骤：

41)构建变电设备外观缺陷检测模型的第一层为缺陷特征提取模块：设定缺陷特征提取模块中骨干网络CSPDarknet53结合了CSPNet和Darknet53，利用残差网络来进行深层特征的提取；变电设备外观缺陷图像经过CSPDarknet53提取特征后，得到缺陷特征张量；

42)构建变电设备外观缺陷检测模型的第二层为多尺度特征融合模块：设定多尺度特征融合模块首先搭建SPP模块，池化大小分别为：1×1，5×5，9×9，13×13；然后搭建PANet特征金字塔模块，并在每个Concat组件之后加入PCBAM注意力模块，提升模型对局部鉴别性特征的提取；深层和浅层的缺陷特征张量经过多尺度特征融合模块后，得到两者融合后的多尺度语义特征；

43)构建变电设备外观缺陷检测模型的第三层为缺陷预测模块：设定缺陷预测模块中搭建三个输出大小分别为13×13、26×26和52×52的预测分支；同时采用Focal Loss函数改进模型中置信度损失的交叉熵函数，Focal Loss函数表达式如下所示：

式中：p为激活函数Sigmoid的输出值；γ≥0，为聚焦参数，取γ＝2；为调节因子；0≤α≤1，为类别权重因子，取α＝0.25；γ和α为固定值，不参与训练；y为标签值。

所述变电设备外观缺陷检测模型的训练包括以下步骤：

51)数据标注：将新的变电设备外观缺陷图像数据集D中的图像归一化到416×416，并使用Labelimg软件标注，包括：类别、中心点横坐标、中心点纵坐标、目标宽度和目标长度；

52)数据划分：将已有的电力设备图像数据集作为源域，将新的变电设备外观缺陷图像数据集D作为目标域，源域与目标域的类别互不交叉；

53)预训练：从源域中选择K个类别构建任务，从选择的每个类别中，随机选择多个样本作为支持样本进行训练，得到预训练模型；

54)设置训练的超参数：初始学习率为0.001，每个训练批次设置为64，训练的总迭代轮数设置为120epoch，优化算法为SGD；

55)加载预训练模型：将步骤52)中训练好的模型参数进行迁移；

56)变电设备外观缺陷检测模型训练：

将标注好的变电设备外观缺陷图像数据集D(B：64，C：3，H：416，W：416)输入至变电设备外观缺陷检测模型的第一层缺陷特征提取模块，得到缺陷特征张量(C：1024，H：13，W：13)；然后再经过多尺度特征融合模块得到三个不同大小的特征张量，分别为(C：256，H：52，W：52)，(C：512，H：26，W：26)，(C：1024，H：13，W：13)；最后经过预测模块输出三个不同的预测数据，包括：类别、置信度、预测框坐标；

57)通过损失函数对张量数据相对于Groundtruth进行计算，并经过反向传播求取梯度，进行权重更新；

58)通过循环步骤56)和步骤57)，直至损失函数降低至较小值，即训练完成，保存训练好的变电设备外观缺陷检测模型参数。

所述变电设备外观缺陷图像再生成模型的训练包括以下步骤：

61)设置训练超参数：初始学习率为0.001，每个训练批次设置为16，训练的总迭代轮数设置为140epoch，优化算法为SGD；

62)数据输入：从正常变电设备图像数据集N中进行随机抽取m个正常数据样本X＝{x₁,x₂,,,x_m}，从变电设备外观缺陷图像数据集D中进行随机抽取m个正常数据样本Y＝{y₁,y₂,,,y_m}；

63)迭代训练：最小化判别损失以及循环一致性损失更新模型参数，损失函数为：

L_total＝L_GAN(F,D_Y,X,Y)+L_GAN(G,D_X,X,Y)+λL_cyc(F,G,X,Y)

其中L_total为总损失，L_GAN为X到Y或Y到X的生成判别损失，L_cyc为循环一致性损失；

64)通过循环步骤62)和步骤63)，形成博弈学习模式，最终当判别器无法判断输入样本的来源时，训练达到稳定状态，得到一个最优的生成器参数。

有益效果

本发明的基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法，与现有技术相比提高了变电设备外观图像缺陷检测的速度和准确率。其优点主要体现在以下几点：

(1)本发明以变电设备的裂纹、锈蚀、油污、模糊等典型外观缺陷为研究对象，针对缺陷设备图像数据集样本较少、变电站图像背景复杂等问题，实现变电设备外观图像缺陷检测。

(2)本发明采用CycleGAN模型将正常变电设备外观图像生成为相应的缺陷图像，实现变电设备外观缺陷图像的再生成，以应对数据集样本较少的问题。同时考虑到变电站图像背景复杂的问题，在CycleGAN模型中加入注意力机制，以侧重于对变电设备的转换而忽略背景的影响。

(3)本发明在YOLOv4的多尺度特征融合模块中加入PCBAM模块，有助于模型更加聚焦变电设备关键缺陷特征而非复杂背景特征，以解决变电设备外观缺陷图像背景复杂、缺陷差异较大的问题。

(4)本发明采用Focal Loss函数改进模型中置信度损失的交叉熵函数，有助于模型均衡学习到所有类别的信息，解决变电设备图像正负样本分布不平衡问题。

(5)本文明采用多阶段的小样本迁移学习方式训练变电设备外观图像缺陷检测模型，有助于模型中特征提取模块的卷积层能够充分训练，使模型获得具有泛化性的训练结果。

附图说明

图1为本发明的方法顺序图；

图2为本发明所涉及基于注意力机制的对抗生成网络结构图；

图3为本发明所涉及小样本迁移学习过程图。

图4a、图4b和图4c为利用本发明所述方法检测出的变电设备外观缺陷图。

具体实施方式

为使对本发明的结构特征及所达成的功效有更进一步的了解与认识，用以较佳的实施例及附图配合详细的说明，说明如下：

如图1所示，本发明所述的一种基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法，包括以下步骤：

第一步，变电设备外观缺陷图像的获取：获取已有的变电设备外观缺陷图像并进行预处理。

(1)变电设备外观缺陷图像的获取：从监控视频图像中筛选出外观具有缺陷的变电设备图像，缺陷主要包括设备外观存在裂纹、锈蚀、油污；

(2)变电设备外观正常图像的获取：从监控视频图像中筛选出外观正常的变电设备图像，正常变电设备图像是指设备外观无明显缺陷；

(3)变电设备外观图像的预处理：对所采集到的缺陷图像和正常图像进行包括裁剪为预定大小图像、添加高斯噪声、旋转、翻转的预处理操作；

(4)变电设备外观图像的分类：对所预处理后的图像按照有无缺陷分类并组合成变电设备外观缺陷图像数据集D和变电设备外观正常图像数据集N。在实验室环节中，可以将图像集分为用于训练图像转换CycleGAN模型的训练集和用于测试CycleGAN模型的测试集，划分比例为6：4。

第二步，变电设备外观缺陷图像的再生成：利用图像转换GAN模型对已有的变电设备外观缺陷图像进行样本再生成，用于数据扩增。

由于变电站图像背景复杂、变电设备缺陷区域小，在生成图像时，有可能会把跟变电站设备类似的图像一并进行转换，造成转换出来的缺陷图像质量差，因此在CycleGAN网络的基础上引入注意力机制，将变电设备从图像背景中分离出来再送入网络训练，这样网络就可以侧重于对变电设备的转换而忽略背景的影响。

如图2所示，在CycleGAN网络的基础上添加两个注意力网络AD和AN。AD为N转换为D时使用的注意力模块，AN为D转换为N时使用的注意力模块。网络的工作流程为，首先N会通过一个注意力网络AD得到掩膜N_a，这个注意力层会把前景凸显出来，背景则忽略掉，这样把N和掩膜N_a按位相乘这样就可以得到前景图，然后通过生成器F_N→D得到转换之后的前景图，之后再和掩膜N_a进行按位相乘的操作去除生成图像的背景。把N和1-N_a按位相乘就可以得到背景图，最后把转换之后的前景图和背景图相加就可以得到最终的输出N′，计算公式如下：

N′＝N_a⊙F_N→D(N⊙N_a)+(1-N_a)⊙N。

所述变电设备外观缺陷图像的再生成具体步骤如下：

(1)变电设备外观缺陷图像再生成模型的构建：使用Pytorch深度学习框架搭建CycleGAN模型，并在CycleGAN网络的基础上添加两个注意力模块AD和AN，其中AD为N转换为D时使用的注意力模块，AN为D转换为N时使用的注意力模块。

(2)数据输入：将变电设备外观缺陷图像数据集D和变电设备外观正常图像N输入变电设备外观缺陷图像再生成模型进行训练。

(3)变电设备外观缺陷图像再生成模型的训练：迭代训练变电设备外观缺陷图像再生成模型并保存其参数。

A1)设置训练超参数：初始学习率为0.001，每个训练批次设置为16，训练的总迭代轮数设置为140epoch，优化算法为SGD；

A2)数据输入：从正常变电设备图像数据集N中进行随机抽取m个正常数据样本X＝{x₁,x₂,,,x_m}，从变电设备外观缺陷图像数据集D中进行随机抽取m个正常数据样本Y＝{y₁,y₂,,,y_m}；

A3)迭代训练：最小化判别损失以及循环一致性损失更新模型参数，损失函数为：

L_total＝L_GAN(F,D_Y,X,Y)+L_GAN(G,D_X,X,Y)+λL_cyc(F,G,X,Y)

A4)通过循环步骤A2)和步骤A3)，形成博弈学习模式，最终当判别器无法判断输入样本的来源时，训练达到稳定状态，得到一个最优的生成器参数。

(4)通过已训练好的变电设备外观缺陷图像再生成模型来生成变电设备外观缺陷图像，并将增强的变电设备外观缺陷图像与原来的D结合在一起，组成新的变电设备外观缺陷图像数据集D。

第三步，变电设备外观缺陷检测模型的构建：基于融合并联型注意力技术构建变电设备外观缺陷检测模型。

由于变电设备外观缺陷图像的背景复杂、缺陷区域大小不同以及缺陷样本之间存在不平衡，因此，本发明在YOLOv4基础上提出了变电设备外观缺陷检测模型(PCBAM-YOLO)。YOLOv4隶属于One-stage目标检测算法，基于直接回归候选框的相对位置实现物体的定位与分类，具有较优的检测精度和速度，其主要包括特征提取模块、多尺度特征融合模块和预测模块3部分。在特征提取模块中，采用新的骨干网络CSPDarknet53，其结合了CSPNet和Darknet53，利用残差网络来进行深层特征的提取。在多尺度特征融合模块中，SPP作为附加模块以增大感受野，并借鉴PANet的思想，充分利用特征融合，得到表征能力更强的缺陷特征张量。在多尺度预测模块中，继续沿用YOLOv3的预测模块，通过对13×13、26×26和52×52三个特征图中目标进行独立预测，3个尺度特征图分别用来检测大中小3种尺度目标，有效地增强了不同尺度的变电设备缺陷目标的检测效果。

为使模型更加聚焦变电设备关键缺陷特征而非复杂背景特征，本发明在YOLOv4的基础上加入基于CBAM改进的并联型注意力模块PCBAM，其公式为：

M_c(F)＝σ(MLP(AvgPool(F))+MLP(MaxPool(F)))

M_s(F)＝σ(Conv([AvgPool(F′)；MaxPool(F′)]))

首先将原始特征图F同时输入空间注意力模块和通道注意力模块，分别得到空间权重M_s(F)和通道权重M_c(F)。其次，将M_s(F)和M_c(F)分别与输入特征图做点乘得到空间注意力特征图F_s和通道注意力特征图F_c。然后，对原始输入特征F应用3*3卷积以增加感受野、增强特征表征能力，得到特征图F_i。最后，将F_s和F_c相加生成的混合注意力特征图与原始输入特征的卷积结果F_i相加得到最终的特征图F_o。与传统CBAM相比，一方面PCBAM避免了先经过通道注意力模块再经过空间注意力模块后M_c(F)对M_s(F)可能存在的部分权重系数干扰；另一方面PCBAM对原始输入特征进行卷积并直接加权于最终的特征图，在保证丰富的语义信息不丢失的同时增强了输出特征图的表征能力。

同时，损失函数作为深度神经网络对误检样本评判的依据,在很大程度上影响神经网络模型收敛的效果。由于数据集中简单易分的样本与复杂难分的样本之间存在不均衡现象，大量的某一类样本不仅会导致算法难以学习到其他类别样本的信息，还会影响损失函数的梯度更新方向，本发明在检测模型中引入Focal Loss函数设计交叉熵函数，使得模型在训练时更加专注于难分类样本，从而提高变电设备图像缺陷自动定位和识别的精度。

变电设备外观缺陷检测模型的构建具体步骤如下：

(1)构建变电设备外观缺陷检测模型的第一层为缺陷特征提取模块：骨干网络CSPDarknet53结合了CSPNet和Darknet53，利用残差网络来进行深层特征的提取；变电设备外观缺陷图像经过CSPDarknet53提取特征后，得到缺陷特征张量。

(2)构建变电设备外观缺陷检测模型的第二层为多尺度特征融合模块：首先搭建SPP模块，池化大小分别为：1×1，5×5，9×9，13×13；然后搭建PANet特征金字塔模块，并在每个Concat组件之后加入PCBAM注意力模块，提升模型对局部鉴别性特征的提取；深层和浅层的缺陷特征张量经过多尺度特征融合模块后，得到两者融合后的多尺度语义特征。

(3)构建变电设备外观缺陷检测模型的第三层为缺陷预测模块：搭建三个输出大小分别为13×13、26×26和52×52的预测分支；同时采用Focal Loss函数改进模型中置信度损失的交叉熵函数Focal Loss函数表达式如下所示：

第四步，变电设备外观缺陷检测模型的训练：利用小样本多阶段迁移技术对变电设备外观缺陷检测模型进行训练。

在变电设备外观缺陷检测任务中，传统的基于深度学习的检测方法中的模型训练过程中因为样本数据稀缺而出现过拟合的现象，同时模型迭代收敛困难，这些问题不仅影响了检测模型的性能，也影响了缺陷检测的效率。因此，本发明基于元学习的思想，研究同领域、相近领域或不同领域的特征知识迁移学习方法，利用已经存在的相关任务域中带有标记的数据学习源任务，将其获得的知识应用于变电站设备外观缺陷图像数据的目标域，解决目标域的缺陷检测任务；同时融合数据生成和多阶段小样本迁移学习的训练方法，缓解数据量不足引起的问题，提高训练效率且防止过拟合，从而实现变电站设备缺陷图像的自动、快速定位和识别。如图3所示，在实验室测试环节时，采用小样本迁移学习的方法训练模型，其在训练阶段只要一个或多个已标记的相近领域的训练样本，而无需大量的人力、物力去筛选并且给数据给予样本标签，并将学习到的特征知识迁移到缺陷检测模型中，利用生成的缺陷数据集进行微调，最后测试变电设备外观图像缺陷检测模型的性能。小样本迁移学习的目标旨在充分的使用过去的经验让学习系统能够学习新的任务。

变电设备外观缺陷检测模型的训练具体步骤如下：

(1)数据标注：将新的变电设备外观缺陷图像数据集D中的图像归一化到416×416，并使用Labelimg软件标注，包括：类别、中心点横坐标、中心点纵坐标、目标宽度和目标长度；

(2)数据划分：将已有的电力设备图像数据集作为源域，将新的变电设备外观缺陷图像数据集D作为目标域，源域与目标域的类别互不交叉；

(3)预训练：从源域中选择K个类别构建任务，从选择的每个类别中，随机选择多个样本作为支持样本进行训练，得到预训练模型；

(4)设置训练的超参数：初始学习率为0.001，每个训练批次设置为64，训练的总迭代轮数设置为120epoch，优化算法为SGD；

(5)加载预训练模型：将步骤(2)中训练好的模型参数进行迁移；

(6)变电设备外观缺陷检测模型训练：

(7)通过损失函数对张量数据相对于Groundtruth进行计算，并经过反向传播求取梯度，进行权重更新；

(8)通过循环步骤(6)和步骤(7)，直至损失函数降低至较小值，即训练完成，保存训练好的变电设备外观缺陷检测模型参数。

第五步，待检测变电设备图像的获取，获取待检测变电设备图像，并进行预处理。

第六步，待检测变电设备图像缺陷问题的检测：将预处理后的待检测变电设备图像输入训练后的变电设备外观缺陷检测模型，得到待检测变电设备图像的缺陷问题。

在实验室测试环节时，从待检测变电设备图像数据集中随机抽取3幅图像输入模型进行检测，然后可视化检测结果如图4a、图4b和图4c所示，可见检测结果图中变电设备的锈蚀或油污均已被准确检测出。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是本发明的原理，在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。

Claims

1.一种基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法，其特征在于，包括以下步骤：

12)变电设备外观缺陷图像的再生成：利用图像转换GAN模型对已有的变电设备外观缺陷图像进行样本再生成；

16)待检测变电设备图像缺陷问题的检测：将预处理后的待检测变电设备图像输入训练后的变电设备外观缺陷检测模型，得到待检测变电设备图像的缺陷问题；

所述变电设备外观缺陷检测模型的训练包括以下步骤：

56)变电设备外观缺陷检测模型训练：

58)通过循环步骤56)和步骤57)，直至损失函数降低至较小值，即训练完成，保存训练好的变电设备外观缺陷检测模型参数；

所述变电设备外观缺陷图像的再生成包括以下步骤：

34)通过已训练好的变电设备外观缺陷图像再生成模型来生成变电设备外观缺陷图像，并将增强的变电设备外观缺陷图像与原来的D结合在一起，组成新的变电设备外观缺陷图像数据集D；

62)数据输入：从正常变电设备图像数据集N中进行随机抽取m个正常数据样本X＝{x₁,x₂……x_m}，从变电设备外观缺陷图像数据集D中进行随机抽取m个正常数据样本Y＝{y₁,y₂……y_m}；

L_total＝L_GAN(F,D_Y,X,Y)+L_GAN(G，D_X，X，Y)+λL_cyc(F，G，X，Y)

2.根据权利要求1所述的基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法，其特征在于，所述变电设备外观缺陷图像的获取包括以下步骤：

3.根据权利要求1所述的基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法，其特征在于，所述变电设备外观缺陷检测模型的构建包括以下步骤：