CN114841972A

CN114841972A - 基于显著性图和语义嵌入特征金字塔的输电线路缺陷识别方法

Info

Publication number: CN114841972A
Application number: CN202210506022.XA
Authority: CN
Inventors: 杨强; 徐昊; 苏超; 曹园; 蒋迪; 邱恺頔
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2022-05-09
Filing date: 2022-05-09
Publication date: 2022-08-02
Anticipated expiration: 2042-05-09
Also published as: US20230360390A1; CN114841972B

Abstract

本发明公开了一种基于显著性图和语义嵌入特征金字塔的输电线路缺陷识别方法，包括以下步骤。步骤1：对数据集进行数据清理和划分；步骤2：通过EL‑ESRGAN超分辨率增广算法，对输电线路小目标进行超分辨率图像生成；步骤3：通过构建嵌套U型网络，对数据集进行图像显著性检测；步骤4：通过Gridmask和随机擦除(Cut Out)算法，对数据集进行基于显著性图的数据增广，生成分类数据集；步骤5：通过深度语义嵌入的特征金字塔分类网络，利用ResNet34分类算法对的正常集和缺陷集进行图片分类。本发明将图像显著性检测和数据增广结合，通过深度语义嵌入的特征金字塔分类网络作为ResNet34分类的补充，用于无人机输电线路巡检图像中故障识别，具有较强的系统鲁棒性。

Description

基于显著性图和语义嵌入特征金字塔的输电线路缺陷识别方法

技术领域

本发明涉及输电线路巡检图像处理，尤其是涉及一种基于显著性图和语义嵌入特征金字塔的输电线路缺陷识别方法。

背景技术

输电线路缺陷的识别在工业实践中经济性较好、识别速率较快的常用方法是依靠图像分类模型对输电线路进行目标检测后的输出图像进行分类，以区分部件是否存在故障。但是在实践中，大部分输电线路目标图像都是无缺陷图像，不能用于训练缺陷识别和分析的监督学习模型，这种有缺陷和无缺陷样本不平衡被称为长尾效应。为了解决此问题，可以在数据级别进行增广，采用重采样的方式为样本不足的类别生成新样本，这种方式将导致少数样本的过度采样从而导致模型过拟合，直接降低特征提取的模型性能。

本发明针对输电线路缺陷识别问题，提出了一种基于显著性图和语义嵌入特征金字塔的输电线路缺陷识别方法。其创新性以及技术贡献主要体现在以下的几个方面：

(1)引入超分辨率对抗生成网络对输电线路小尺寸目标进行数据增广与语义信息扩充，解决了输电线路小尺寸目标边界不清、语义信息不足的问题；

(2)引入显著性图对图像的显著性进行标注，同时引导对非显著特征进行擦除，以最大限度的保留缺陷特征并得到更多的缺陷数据增广，解决随机擦除算法对缺陷图片中显著特征擦除，导致分类模型难以学习到缺陷特征问题；

(3)与现存的缺陷识别模型相比，本发明构建基于深度语义嵌入的增强特征金字塔分类网络，对输电线路目标物的正常数据集和缺陷数据集进行分类训练，更加贴合实际缺陷识别工作对实时性和准确性的需求。

实验结果表明，本发明提出的模型的精确度高、鲁棒性强、缺陷查全率高，能较好的解决输电线路缺陷识别问题。

发明内容

本发明的目的在于提供一种基于显著性图和语义嵌入特征金字塔的输电线路缺陷识别方法。通过EL-ESRGAN超分辨率增广算法，对输电线路小目标进行超分辨率图像生成；通过构建嵌套U型网络，对缺陷数据集进行基于显著性图的图像显著性检测，并引导Gridmask和随机擦除(Cut Out)算法，对缺陷数据集进行基于显著性图的数据增广；通过构建深度语义嵌入的特征金字塔分类网络，在ResNet34分类算法的基础上对输电线路目标图像进行缺陷识别。

本发明公开了一种基于显著性图和语义嵌入特征金字塔的输电线路缺陷识别方法，包括以下步骤：

1)将输电线路目标图像作为数据集，根据输电线路是否有缺陷标记为正常集合和缺陷集合；根据目标图像的尺寸大小，按照给定阈值划分小目标集合和非小目标集合；

2)针对小目标集合，经过EL-ERSGAN超分辨率增广算法进行图像超分辨率拓展；将非小目标集合和经过图像超分辨率拓展后的小目标集合组合后，压缩成同一尺寸，并划分训练集和测试集；

3)通过嵌套显著性检测网络U²-Net生成训练集图像的显著性图，通过形态学膨胀算法保证目标关键区域的完整性，在显著性分数低于阈值部分随机生成擦除区域，并填充随机像素形成数据增广后的图像集合；

4)将数据增广后的图像及其标签输入到深度语义嵌入的特征金字塔分类网络进行训练，获得训练好的分类器；

5)实时获取输电线路巡检的目标图像数据，并作为训练好的分类器的输入，输出识别结果。

作为本发明的可选实施方案，步骤2)所述的经过EL-ERSGAN超分辨率增广算法进行图像超分辨率拓展，具体包括：

2.1)对EL-ERSGAN超分辨率增广模型的生成器和鉴别器的损失函数进行定义，其公式如下：

式中，

表示生成器的GAN损失函数，

表示鉴别器的GAN损失函数，D_Ra(x_r,x_f)代表鉴别图像比虚假图像更真实的概率，D_Ra(x_f,x_r)表示鉴别图像比真实图像更虚假的概率，

代表对处理批次中所有虚假数据进行的平均操作，x_i代表输入GAN网络的低分辨率图像，x_f表示GAN网络生成的判定为虚假的鉴别图像，x_r表示GAN网络生成的判定为真实的鉴别图像；

2.2)使用输电线路非小目标集合训练超分辨率增广模型EL-ERSGAN的生成器得到一个二阶退化模型，并使用L1损失函数、感知损失函数和

所表示的GAN损失函数共同构建EL-ERSGAN的整体损失函数，训练得到EL-ERSGAN模型；

2.3)使用训练后的EL-ERSGAN模型对输电线路小目标集合进行超分辨率图像增广。

作为本发明的可选实施方案，所述步骤3)具体为：

3.1)以残差块网络结构为基础，构建U型残差块网络；

3.2)通过堆叠3.1)中所述U型残差块网络，构建11阶段组成的嵌套显著性检测网络U²-Net；

3.3)使用嵌套显著性检测网络U²-Net生成输电线路目标图像的显著分数，通过形态学膨胀的确保算法保证目标关键区域的完整性，生成图像掩膜区域；

3.4)随机选择GridMask和随机擦除算法在图像掩膜区域进行随机擦除，并填充随机像素。

作为本发明的可选实施方案，所述步骤4)采用的深度语义嵌入的特征金字塔分类网络，包括：

ResNet特征提取模块，其输入为输电线路目标图像，输出为该图像不同尺度的特征；

特征增强金字塔模块，其输入为ResNet特征提取模块生成的不同尺度的特征，输出为相邻尺度的融合特征；

深层语义嵌入模块(DSE)，其输入为特征增强金字塔模块生成的融合特征，输出为具有丰富语义信息的低分辨率特征和具有丰富位置信息的高分辨率特征；

深度特征融合模块(DFF)，其输入为深层语义嵌入模块生成的低分辨率特征与高分辨率特征，输出为高分辨率和低分辨率特征经过卷积、池化操作后的特征向量；

图像分类网络(OC)，其输入为深度特征融合模块生成的高分辨率特征和低分辨率特征的特征向量，输出为输电线路巡检目标是否存在故障的分类结果。

作为本发明的可选实施方案，所述步骤1)使用的数据集为输电线路绝缘子自爆数据集。

根据本发明的一个具体实施方案，以步骤2)中构建的输电线路绝缘子图像训练集训练得到深度语义嵌入的特征金字塔分类网络，用步骤2)中构建的输电线路绝缘子图像测试集测试分类网络，并以网络分类准确率和F2-Score作为分类效果评估指标。

在本发明的一个实施例中，所述步骤5)具体为：

(a)获得输电线路巡检图像中的绝缘子图像；

(b)将裁剪图像输入深度语义嵌入的特征金字塔分类网络；

(c)深度语义嵌入的特征金字塔分类网络输出绝缘子是否存在缺陷。

与现有技术相比，本发明所具有的有益效果有：

(1)本发明采用EL-ESRGAN超分辨率增广算法，克服了现有技术中小目标信息缺失、正负样本分类不平衡、缺陷目标数量不足的问题，从而增强了输电线路小目标数据集的图像清晰度和实例的可解释性，同时对复杂极端背景下的小目标数据增广提供了训练方案。

(2)本发明采用基于嵌套U型网络的图像显著性检测引导自适应缺陷数据增强的方法，克服了传统数据增广方法中可能导致的分类特征掩盖问题，节约了大量像素级别语义分割的标注工作量，从而实现对输电线路目标物中感兴趣区域的提取和对背景目标的随机遮挡。

(3)本发明采用基于深度语义嵌入的增强特征金字塔分类网络，克服了常规目标分类网络中全局图像级特征和局部目标级特征融合不佳，无法对高空间复杂度图像、类内形态学差异变化较大的输电线路缺陷目标进行识别的问题，从而有效提升了对输电线路缺陷识别能力和感知鲁棒性，为输电线路智能缺陷识别提供可行的实施路径。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的方法流程图；

图2为EL-ESRGAN中生成器G的主体结构图；

图3为EL-ESRGAN中生成器G的密集连接的残差密集块(RRDB)结构图；

图4为EL-ESRGAN中带谱归一化的U-Net结构鉴别器D结构图；

图5为EL-ESRGAN对输电线路绝缘子图像的放大效果对比；

图6为嵌套U型网络中基本块U型残差块网络(RSU)结构图；

图7为嵌套U型网络U²-Net结构图；

图8为基于深度语义嵌入的增强特征金字塔分类网络结构图；

图9为基于深度语义嵌入的增强特征金字塔分类网络的增强特征金字塔(EFPN)结构图；

图10为基于深度语义嵌入的增强特征金字塔分类网络的深层语义嵌入模块(DSE)结构图；

图11为基于深度语义嵌入的增强特征金字塔分类网络的消缺实验中网络模型的精确率对比。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

请参阅图1所示，针对输电线路缺陷识别数据增广和图像分类问题，本发明提供了一种输电线路小尺寸缺陷识别方法，其包括以下步骤：

在步骤2)中，EL-ESRGAN中生成器G的主体结构图参阅图2所示，使用密集连接的残差密集块(RRDB)作为网络基本块，其结构参阅图3所示。EL-ESRGAN中鉴别器D使用带谱归一化的U-Net结构，其结构参阅图4所示。带有跳过连接的U-Net网络设计，能生成精确的梯度反馈，输出每个像素的真实值，并可以向生成器提供详细的像素反馈。但是，U-Net网络结构和复杂的退化过程也极大的增加了训练的不稳定性。因此引入谱归一化来稳定训练动态，同时也有助于缓解GAN训练带来的超锐度和伪影，并在局部细节增强和伪影抑制之间实现良好的平衡。

参阅图5所示，对比原图和对抗生成图像，步骤2)中构建的EL-ERSGAN超分辨率增广算法能对不同类别的低分辨路输电线路目标进行有效的像素扩充与语义信息增广。

在步骤3)中，使用嵌套U型网络U²-Net结构生成图像的显著性分数，其结构参阅图7所示，该结构由11个阶段组成U型结构，每个阶段都配置一个U型残差块网络(RSU)。其中U型残差块网络(RSU)负责提取特征层内的多尺度特征，而大的U型结构负责聚合特征层间的多级特征。

U型残差块网络(RSU)的结构参阅图6所示，其中L是编码器层数(默认为7)，C_in和C_out分别是输入特征图和输出特征图的通道数，M表示隐藏层的通道数。在输入卷积层，将输入特征图转换为通道数为C_out的中间特征图，用于局部特征提取。将中间特征图输入U型对称编码解码器，学习提取和编码多尺度上下文信息，通过下采样的特征图提取多尺度特征，通过逐步的上采样、张量相加和卷积操作生成高分辨率的特征图，在一定程度的上减轻了大尺度直接上采样引起的细节损失，并通过张量相加的方式实现局部特征和多尺度特征的残差连接。

图7中编码器En1—En4分别使用U型残差块网络RSU-7、RSU-6、RSU-5和RSU-4四个不同高度的U型残差块网络(RSU)来对高分辨率特征图进行信息捕获。编码器En5和En6由于特征图分辨率较低，继续下采样将导致上下文信息丢失，因此将U型残差块网络(RSU)中的池化和上采样操作替换成扩张卷积操作以保持所有特征图和输入特征图分辨率一致,其结构命名为RSU-4F。每个解码器De阶段以上一阶段的上采样特征图和来自对称编码器的特征图，进行张量拼接后作为解码器的输入。每层解码器通过一个卷积核大小为3×3的卷积层和一个Sigmoid函数分离出中间层，在将中间层通过上采样扩展到输入图像大小，将6个中间层通过张量拼接后再通过一个卷积核大小为3×3的卷积层和一个Sigmoid函数，以生成最终的显著性图。

步骤3)使用嵌套U型网络U²-Net的显著性图引导图像增广，其算法的实现包含以下步骤：

a)算法的输入为目标图像img和由嵌套U型网络生成的显著性灰度图grayscale；

b)计算grayscale中的灰度值中值θ，和灰度图中像素(i,j)的显著性值grayscale_ij，通过公式binary＝{grayscale_ij≥θ}i∈width,j∈height计算其是否为识别目标；

c)对识别目标进行两次形态学膨胀计算

其中B为拓展保护区域的大小为5×5的结构元素，

为形态学膨胀计算符号；

d)随机选择GridMask和随机擦除算法，当掩膜集合非空：若选择GridMask算法，随机选择GridMask的网格编号d和网格中的信息保留比例r_g，同时生成掩膜集合；若选择随机擦除算法，随机选择随机擦除的擦除区域比例s和擦除区域的纵横比r_c，同时生成掩膜集合；

e)擦除原始图像中掩膜集合的像素信息，并填充随机像素，得到数据增广后的图像img。

步骤4)中基于深度语义嵌入的增强特征金字塔分类网络参阅图8所示。其中，以ResNet34作为残差网络，用于图像特征采集与传递；特征增强金字塔模块(EFPN)参阅图9所示，用于生成多层次多尺度的初始特征图；深层语义嵌入模块(DSE)参阅图10所示，用于生成具有丰富语义和高空间分辨率特征；深度特征融合模块(DFF)，用于分别处理高分辨率和低分辨率特征；图像分类网络(OC)，用于对输电线路巡检目标进行缺陷分类。

深度特征融合模块(DFF)中，高层特征图特征处理通过两个残差块和一个旁路连接组成，残差块的配置如表1所示，每层卷积后连接一个批归一化层和一个非线性变换的ReLU激活层。

表1

低层特征图特征处理结构与高层特征图特征处理类似，但使用空洞卷积残差块代替原有残差块，空洞卷积残差块配置如表2所示，每层卷积后连接一个批归一化层和一个非线性变换的ReLU激活层。

表2

以ResNet34作为基准，对本发明中各模块进行消缺实验，实验结果参阅图11所示，在整体分类准确率方面，本发明提出的网络结构比基准网络ResNet34高3.44％，并在缺陷集准确率上提升了14.33％，对缺陷集的分类提升效果显著。同时通过对比消缺实验，可以发现本发明提出的EFPN+DSE+DFF三模块组合方式，比其他模型在分类任务上表现更优异。三个模块中，增强特征金字塔模块(EFPN)的对模型准确率提升的效果最突出，通过加强各级特征图的语义，为目标分类和特征融合提供足够充分的信息。

在输电线路缺陷识别的工作中，需要在保证精确率的前提下提高召回率，以尽可能的发现故障，以减少对输电安全可能造成的隐患。因此引入F-Score作为衡量精确率和召回率的评估指标，定义为：

本发明中各模型的精确率、召回率与F-Score如表3所示：

表3

为尽量对输电线路缺陷进行查全，避免停电隐患，以召回率更高、更趋向于要求尽量查全所有隐患的F2-Score为评估指标，本发明提出的深度语义嵌入的增强特征金字塔分类网络能较好的查找到更多的隐患。

本发明中步骤2)和步骤3)的数据增广消缺实验结果如表4所示：

表4

由表4可知，数据增广手段对缺陷集的准确率提升更加有效，原因是数据增广手段将更多的背景因素与识别目标进行解耦，对分类准确率本来较低的缺陷集提升效果更明显。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。本发明不局限于上述可选的实施方式，任何人在本发明的启示下都可得出其他各种形式的产品。上述具体实施方式不应理解成对本发明的保护范围的限制，本发明的保护范围应当以权利要求书中界定的为准，并且说明书可以用于解释权利要求书。

以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节，也不限制该发明仅为所述的具体实施方式。显然，根据本说明书的内容，可作很多的修改和变化。本说明书选取并具体描述这些实施例，是为了更好地解释本发明的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims

1.一种基于显著性图和语义嵌入特征金字塔的输电线路缺陷识别方法，其特征在于包括以下步骤：

2.根据权利要求1所述的一种基于显著性图和语义嵌入特征金字塔的输电线路缺陷识别方法，其特征在于，步骤2)所述的经过EL-ERSGAN超分辨率增广算法进行图像超分辨率拓展，具体包括：

式中，

表示生成器的GAN损失函数，

3.根据权利要求1所述的一种基于显著性图和语义嵌入特征金字塔的输电线路缺陷识别方法，其特征在于，所述步骤3)具体为：

3.1)以残差块网络结构为基础，构建U型残差块网络；

4.根据权利要求1所述的一种基于显著性图和语义嵌入特征金字塔的输电线路缺陷识别方法，其特征在于，所述步骤4)采用的深度语义嵌入的特征金字塔分类网络，包括：

5.根据权利要求1所述的一种基于显著性图和语义嵌入特征金字塔的输电线路缺陷识别方法，其特征在于，所述步骤1)使用的数据集为输电线路绝缘子自爆数据集。