CN116385364A

CN116385364A - 一种基于视差辅助语义分割的多级导地线缺陷识别方法

Info

Publication number: CN116385364A
Application number: CN202310202176.4A
Authority: CN
Inventors: 周学明; 姚尧; 简旭; 冯志强; 张璐; 全江涛; 刘睿; 付剑津; 黄俊杰; 刘阳; 阚毅
Original assignee: Electric Power Research Institute of State Grid Hubei Electric Power Co Ltd; Yichang Power Supply Co of State Grid Hubei Electric Power Co Ltd
Current assignee: Electric Power Research Institute of State Grid Hubei Electric Power Co Ltd; Yichang Power Supply Co of State Grid Hubei Electric Power Co Ltd
Priority date: 2023-03-06
Filing date: 2023-03-06
Publication date: 2023-07-04

Abstract

本发明公开了一种基于视差辅助语义分割的多级导地线缺陷识别方法，包括：采用无人机巡检采集的导地线缺陷图像，利用稠密逆搜索(DIS)光流法将无人机采集的前后连续两幅图像的视差划分出前景与背景区域，以减小导地线缺陷图中复杂背景对于缺陷目标检测的影响，再利用针对导地线特征设计的图像语义分割网络模型从前景区域中分割出导地线区域，通过分块检测避免不必要的特征图计算，同时避免图像的下采样淹没导地线细节特征,将正负样本限定在导地线区域内，针对导地线区域设计并训练导地线目标检测识别网络模型，使导地线目标检测识别网络模型专门学习缺陷导地线与正常导地线的区域，滤除复杂背景的影响，实现对细小缺陷区域的检测识别。

Description

一种基于视差辅助语义分割的多级导地线缺陷识别方法

技术领域

本发明属于自动化电力巡线领域与图像处理领域，具体涉及一种基于视差辅助语义分割的多级导地线缺陷识别方法。

背景技术

无人机电力巡线已逐渐取代人工电力巡线成为了主流的巡检方法，在深度学习技术出现以前，无人机拍摄的电力巡线图像主要由人工检查进行缺陷识别，少量的特征容易描述的电力缺陷，如导地线专项巡检图像中的导地线缺陷，已利用传统边缘分割算法与直线检测算法在一定程度上实现了自动缺陷检测。但由于传统算法的场景适应性较差，受到复杂环境、光线与角度等因素的影响，识别准确率较低，难以满足实际需求。在深度学习方法被引入目标检测后，很多研究开始利用深度神经网络模型来进行导地线的检测，准确率比基于传统算法的缺陷检测方法有非常大的提升。但目前基于深度学习的导地线检测方法，多使用单阶段目标检测模型或双阶段目标检测模型直接进行导地线缺陷的检测，某一些细小缺陷(比如分辨率为5000*4000的图像上缺陷目标像素面积小于100*100，即占整个图像低于0.05％)难以识别出来，而且易产生误检，从而导致在检测精度上出现了瓶颈。

经过对现有技术的文献检索发现，图像缺陷检测的研究大多集中在基于目标检测技术来定位目标缺陷。在中国专利“一种基于深度学习语义分割的缺陷检测方法”(申请号：CN201910673139.5)中，赵青等人提出了一种基于深度学习语义分割的缺陷检测方法。该方法直接用语义分割网络得到缺陷的分类，在检测识别效果上与单阶段检测相当。在中国专利“基于语义分割和目标检测的绝缘子缺陷检测方法”(申请号：CN202111480007.4)中，王胜利等人提出一种基于语义分割和目标检测模型的缺陷检测方法。该方法采用了语义分割网络与目标检测网络的两阶段检测方法，但由于导地线缺陷图像存在不同的特点，该算法难以直接适用于导地线图像的缺陷检测。

发明内容

有鉴于此，本发明提供一种基于视差辅助语义分割的多级导地线缺陷识别方法，可实现对细小缺陷区域的检测识别。

本发明的目的是通过以下技术方案予以实现，一种基于视差辅助语义分割的多级导地线缺陷识别方法，包括以下步骤：

一种基于视差辅助语义分割的多级导地线缺陷识别方法，包括以下步骤：

对电力巡线导地线图像进行像素级标注，构建导地线语义分割数据集；

对电力巡线导地线缺陷图像进行矩形框标注，构建导地线缺陷检测数据集；

对连续两帧导地线图像求取光流矢量，利用光流矢量判别出图像中距相机较近的前景区域和距相机较远的背景区域；

利用导地线语义分割数据集训练语义分割网络模型；

利用语义分割网络模型从导地线巡线图像的前景区域中分割出导地线区域；

利用导地线缺陷检测数据集训练导地线缺陷检测模型；

利用导地线缺陷检测识别网络模型从导地线区域中检测出缺陷区域。

进一步的，所述对连续两帧导地线图像求取光流矢量，利用光流矢量判别出图像中距相机较近的前景区域和距相机较远的背景区域，采用稠密逆搜索图像视差区分前背景算法进行，所述稠密逆搜索图像视差区分前背景算法的具体步骤包括：

对导地线图像建立图像高斯金字塔，自上向下计算每一层的光流矢量；

对每层图像金字塔进行分块，分块大小和块间重叠率由图像分辨率来确定，根据无人机拍摄图像时的GPS位置对每个分块赋向量初值，由GPS定位计算位移向量作为顶层金字塔的初始值，下一层的金字塔则代入上层金字塔的计算结果；

使用LK反向搜索算法来对每个分块的平移向量进行计算，得到稀疏网格上的光流场；

在稀疏网格上的光流场中使用稠密化算法来计算稠密光流场；

如果当前金字塔非最底层，则把光流计算结果乘以2，并降采样到低层相同分辨率后，再传递给该层金字塔作为初值，并转入金字塔分块流程，否则直接输出结果；

求取每个像素光流矢量的梯度，求全图的梯度均值，并将梯度小于该均值的像素标记为背景区域，其余区域作为前景区域。

进一步的，所述利用语义分割网络模型从导地线巡线图像的前景区域中分割出导地线区域，采用前景区域导地线语义分割算法进行，所述前景区域导地线语义分割算法以YOLACT模型为基线语义分割网络模型，在网络结构上，设计多尺度池化与多级训练的语义分割网络模型，改善全卷积神经网络在获取语义信息的同时消弱类别可区分性特征而导致的分割不完整问题；在输入层，采用较小尺度的输入，对原始图像进行下采样，使导地线图像中的线状目标特征得以保存；在上采样时，采用转置卷积相结合双线性插值的方式，通过转置卷积获得目标属性的稀疏特征图，同时通过双线性插值获得密集特征图，得到更深的语义特征，使得导地线的像素分割结果更精细。

进一步的，所述利用导地线缺陷检测识别网络模型，从导地线区域中再检测出缺陷区域，采用导地线区域缺陷目标检测算法进行，所述导地线区域缺陷目标检测算法选用级联区域卷积神经网络作为基线网络模型，输入层负样本的选取过程中，将负样本约束在导地线区域；特征提取部分，加入空间金字塔池化模块，对高层特征进行多尺度池化以增加导地线轮廓的学习能力，利用底层网络来学习导地线更精细的纹理特征；特征融合部分，加入多尺度特征融合模块，所述多尺度特征融合模块由特征图融合模块与去混叠模块组成，特征图融合模块对网络中不同层的多尺度特征图进行融合，再采用去冗余信息模块对融合后的特征图进行卷积操作；在模型损失函数上，引入聚焦损失函数来进行损失的计算，通过为交叉熵损失函数增加系数来改变其曲线的形状，同时在计算损失函数时，对于样本较多的缺陷加入惩罚项，该惩罚项的值通过交叉验证的方法来进行确定。

进一步的，所述聚焦损失函数计算公式如下：

y取1和-1代表前景和背景，p取值0～1，表示预测为前景的概率。

进一步的，所述地线缺陷检测识别网络模型训练完成后，在导地线区域内进行缺陷的检测时将图像进行分块，分块大小与网络层大小一致，且分块应涵盖所有导地线语义分割结果区域，分块间有5％-15％的重叠区域。

本发明的有益效果在于：

本发明提出一种电力巡线图像导地线缺陷识别方法，相比于当前采用深度学习技术的电力巡线缺陷检测识别方法，本方法利用DIS光流法将无人机采集的前后连续两幅图像的视差划分出前景与背景区域，利用图像语义分割网络模型从前景区域中分割出导地线区域，针对导地线区域训练导地线目标检测识别网络模型，使导地线目标检测识别网络模型专门学习缺陷导地线与正常导地线的区域，滤除复杂背景的影响，实现对细小缺陷区域的检测识别。

附图说明

通过阅读下文优选的具体实施方式中的详细描述，本发明各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。说明书附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。显而易见地，下面描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图；而且在整个附图中，用相同的附图标记表示相同的部件。

在附图中：

图1为本发明实施例前景区域导地线语义分割过程示意图；

图2为本发明实施例空间金字塔池化模块示意图；

图3为本发明实施例导地线语义分割的结果图；

图4为本发明实施例导地线缺陷的检测识别结果图；

图5为本发明实施例一种基于视差辅助语义分割的多级导地线缺陷识别方法的流程图。

具体实施方式

下面将参照附图1至图5更详细地描述本发明的具体实施例。虽然附图中显示了本发明的具体实施例，然而应当理解，可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本发明，并且能够将本发明的范围完整的传达给本领域的技术人员。

需要说明的是，在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可以理解，技术人员可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名词的差异来作为区分组件的方式，而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”或“包括”为一开放式用语，故应解释成“包含但不限定于”。说明书后续描述为实施本发明的较佳实施方式，然所述描述乃以说明书的一般原则为目的，并非用以限定本发明的范围。本发明的保护范围当视所附权利要求所界定者为准。

为便于对本发明实施例的理解，下面将结合附图以具体实施例为例做进一步的解释说明，且各个附图并不构成对本发明实施例的限定。

如图5所示，本发明实施例一种基于视差辅助语义分割的多级导地线缺陷识别方法，包括以下步骤：

1)对电力巡线导地线图像进行像素级标注，构建导地线语义分割数据集；

2)对电力巡线导地线缺陷图像进行矩形框标注，构建导地线缺陷检测数据集；

3)对连续两帧导地线图像求取光流矢量，利用光流矢量判别出图像中距相机较近的前景区域和距相机较远的背景区域；

4)利用导地线语义分割数据集训练语义分割网络模型；

5)利用语义分割网络模型从导地线巡线图像的前景区域中分割出导地线区域，作为导地线缺陷检测模型的输入；

6)利用导地线缺陷检测数据集训练导地线缺陷检测模型；

7)利用导地线缺陷检测模型从导地线区域中检测出缺陷区域。

本发明实施例一种基于视差辅助语义分割的多级导地线缺陷识别方法中，包括稠密逆搜索图像视差区分前背景算法、前景区域导地线语义分割算法和导地线区域缺陷目标检测算法三大模块，下面分别进行说明。

所述稠密逆搜索图像视差区分前背景算法通过对无人机采集的前后连续两幅导地线图像求取光流失量，划分出前景与背景区域。具体包括：

为了实时性和计算速度考虑，对该算法做了优化，保留反向LK(Lukas-Kanade)搜索和稠密化两步骤，相关计算公式为：

其中x表示图像位置中心，I_t代表参考图像，T代表参考图像中给定的模板补丁，u是我们想要得到的扭曲向量，最小化扭曲向量即最小化模板和查询位置之间的子窗口上的差异的平方和。

具体的算法流程包括：

使用LK(Lukas-Kanade)反向搜索算法来对每个分块的平移向量进行计算，得到稀疏网格上的光流场；

如果当前金字塔非最底层，则把光流计算结果乘以2，并降采样到低层相同分辨率后，再传递给该层金字塔作为初值，并转入金字塔分块流程，否则直接输出结果。

求取每个像素光流矢量的梯度，求全图的梯度均值，并将梯度小于该梯度均值的像素标记为背景区域，其余区域作为前景区域。对于连续拍摄的待检测图像求取前景区域，并选用5*5的矩形形态学结构元素对前景区域进行形态学闭运算，得到导地线待分割区域。

所述前景区域导地线语义分割算法流程如图1所示，以YOLACT模型为基线语义分割网络模型，在网络结构上，设计了多尺度池化与多级训练的语义分割网络模型，改善全卷积神经网络在获取语义信息的同时消弱类别可区分性特征而导致的分割不完整问题；在输入层，采用较小尺度的输入，对原始图像进行下采样，使导地线图像中的线状目标特征得以保存；在上采样时，采用转置卷积相结合双线性插值的方式，通过转置卷积获得目标属性的稀疏特征图，同时通过双线性插值获得密集特征图，得到更深的语义特征，使得导地线的像素分割结果更精细，导地线语义分割结果如图3所示。

所述导地线区域缺陷目标检测算法选用Cascade-RCNN(级联区域卷积神经网络)作为基线网络模型，其特征在于，输入层负样本的选取过程中，将负样本约束在导地线区域，由于原始图像分辨率过大，随机区域选择负样本会导致网络学习难度过大，约束负样本在导地线区域内，检测模型可直接学习有缺陷导地线和无缺陷导地线之间的差异，提升检测的准确率；特征提取部分，加入空间金字塔池化模块如图2所示，对高层特征进行多尺度池化以增加导地线轮廓的学习能力，利用底层网络来学习导地线更精细的纹理特征。特征融合部分，加入多尺度特征融合模块，由特征图融合模块与去混叠模块组成，特征图融合模块对网络中不同层的多尺度特征图进行融合，再采用去冗余信息模块对融合后的特征图进行卷积操作；在模型损失函数上，引入Focal Loss(聚焦损失)函数来进行损失的计算，通过为交叉熵损失函数增加系数来改变其曲线的形状，同时在计算损失函数时，对于样本较多的缺陷加入惩罚项，该惩罚项的值可以通过交叉验证的方法来进行确定，Focal Loss计算公式如下：

导地线缺陷检测模型训练完成后，即可将其用于待检测的导地线缺陷样本图像，在导地线区域内进行缺陷的检测识别，在进行检测时，将图像进行分块，分块大小与网络层大小一致，且分块应涵盖所有导地线语义分割结果区域，分块间有5％-15％的重叠区域。导地线缺陷的检测识别结果如图4所示。

本实施例中训练流程如下：

选用PyTorch开源框架，测试环境为NVIDIA A100 GPU，操作系统为linux，CUDA10.1版本，编译语言为Python3.7。实验采用无人机采集的导地线数据1000张，带缺陷图像500张，并对全部图像进行像素级标注和矩形框标注。按9：1划分训练集和测试集。先利用光流矢量判别图像中的前景区域和背景区域，将前景区域送入语义分割网络模型中训练得到导地线区域图层，将导地线区域图送入目标检测网络进行训练，并使用精确度(precision)和召回率(recall)来衡量检测模型的结果。优化器采用Adam，学习率采用余弦退火的方式，初始学习率为0.0001，采用最后一轮的模型参数作为最终模型。

本发明将导地线语义分割限定在前景区域，降低语义分割的虚警。对于导地线语义分割的结果进行了分块检测处理，一方面避免了图像输入检测网络时下采样淹没了导地线的细节特征，另一方面后续检测也可以采用较小的网络层输入，提升了对于细微缺陷的检测能力。此外，为了迫使后续检测识别网络模型只学习正常导地线与缺陷导地线之前的差别，在后续检测模型的训练阶段，采用了区域约束的方法，负样本不在全图随机选取，而是在分割出的非缺陷导地线区域随机选取，以进一步提高缺陷的识别准确率

尽管以上结合附图对本发明的实施方案进行了描述，但本发明并不局限于上述的具体实施方案和应用领域，上述的具体实施方案仅仅是示意性的、指导性的，而不是限制性的。本领域的普通技术人员在本说明书的启示下和在不脱离本发明权利要求所保护的范围的情况下，还可以做出很多种的形式，这些均属于本发明保护之列。

Claims

1.一种基于视差辅助语义分割的多级导地线缺陷识别方法，其特征在于，包括以下步骤：

利用导地线语义分割数据集训练语义分割网络模型；

利用导地线缺陷检测数据集训练导地线缺陷检测模型；

2.根据权利要求1所述的方法，其特征在于，所述对连续两帧导地线图像求取光流矢量，利用光流矢量判别出图像中距相机较近的前景区域和距相机较远的背景区域，采用稠密逆搜索图像视差区分前背景算法进行，所述稠密逆搜索图像视差区分前背景算法的具体步骤包括：

3.根据权利要求1所述的方法，其特征在于，所述利用语义分割网络模型从导地线巡线图像的前景区域中分割出导地线区域，采用前景区域导地线语义分割算法进行，所述前景区域导地线语义分割算法以YOLACT模型为基线语义分割网络模型，在网络结构上，设计多尺度池化与多级训练的语义分割网络模型，改善全卷积神经网络在获取语义信息的同时消弱类别可区分性特征而导致的分割不完整问题；在输入层，采用较小尺度的输入，对原始图像进行下采样，使导地线图像中的线状目标特征得以保存；在上采样时，采用转置卷积相结合双线性插值的方式，通过转置卷积获得目标属性的稀疏特征图，同时通过双线性插值获得密集特征图，得到更深的语义特征，使得导地线的像素分割结果更精细。

4.根据权利要求1所述的方法，其特征在于，所述利用导地线缺陷检测识别网络模型，从导地线区域中再检测出缺陷区域，采用导地线区域缺陷目标检测算法进行，所述导地线区域缺陷目标检测算法选用级联区域卷积神经网络作为基线网络模型，输入层负样本的选取过程中，将负样本约束在导地线区域；特征提取部分，加入空间金字塔池化模块，对高层特征进行多尺度池化以增加导地线轮廓的学习能力，利用底层网络来学习导地线更精细的纹理特征；特征融合部分，加入多尺度特征融合模块，所述多尺度特征融合模块由特征图融合模块与去混叠模块组成，特征图融合模块对网络中不同层的多尺度特征图进行融合，再采用去冗余信息模块对融合后的特征图进行卷积操作；在模型损失函数上，引入聚焦损失函数来进行损失的计算，通过为交叉熵损失函数增加系数来改变其曲线的形状，同时在计算损失函数时，对于样本较多的缺陷加入惩罚项，该惩罚项的值通过交叉验证的方法来进行确定。

5.根据权利要求4所述的方法，其特征在于，所述聚焦损失函数计算公式如下：

6.根据权利要求1所述的方法，其特征在于，所述地线缺陷检测识别网络模型训练完成后，在导地线区域内进行缺陷的检测时将图像进行分块，分块大小与网络层大小一致，且分块应涵盖所有导地线语义分割结果区域，分块间有5％-15％的重叠区域。