CN116188359A

CN116188359A - 基于邻域信息交互注意力的任意角度航拍绝缘子检测方法

Info

Publication number: CN116188359A
Application number: CN202211380952.1A
Authority: CN
Inventors: 李冰锋; 阮皓皓; 张家欣; 杨艺; 段鑫鑫
Original assignee: Henan University of Technology
Current assignee: Henan University of Technology
Priority date: 2022-11-05
Filing date: 2022-11-05
Publication date: 2023-05-30

Abstract

本发明公开了基于邻域信息交互注意力的任意角度航拍绝缘子检测方法，具体包括：建立绝缘子训练数据集和绝缘子测试数据集；构建绝缘子检测网络模型，包括特征提取模块、解码器模块以及检测头模块，在特征提取模块中引入邻域信息交互注意力机制，在检测头模块中引入角度检测头分支；根据绝缘子训练数据集，对绝缘子检测网络模型进行训练，得到训练后的绝缘子检测网络模型；根据绝缘子测试数据集，通过训练后的绝缘子检测网络模型，获取绝缘子检测结果；本发明通过引入邻域信息交互注意力机制和角度检测头分支，能有效减少航拍图像中背景信息对检测结果的影响，从而更精准地得到绝缘子的位置信息，提高检测效率和精度。

Description

基于邻域信息交互注意力的任意角度航拍绝缘子检测方法

技术领域

本发明涉及绝缘子检测领域，特别是涉及到一种基于邻域信息交互注意力的任意角度航拍绝缘子检测方法。

背景技术

作为电力能源输送的重要载体，架空输电线路一般由塔杆和塔杆基础、导线、绝缘子以及接地装置等部分构成。而在整个线路结构中，绝缘子是十分重要的部件，对绝缘子的精准检测和维护是十分重要的工作。但是由于架空输电线路的搭建一般多分布于野外地形复杂地区，且绝缘子体积在整体结构中属于较小体积，利用人工巡检不仅低效，而且还存在成本高、难度大的问题。

伴随着无人机技术及人工智能等相关技术的发展，基于无人机航拍图像的绝缘子检测方法逐渐被研究出来，而绝缘子检测则多依赖于绝缘子检测。因此，研究基于航拍图像的绝缘子检测方法具有重要的现实意义。

目前基于深度学习的目标检测方法已逐渐成为主流。传统机器视觉方法采用卷积神经网络提取特征，再结合图像分割和边缘检测算法，实现对绝缘子的分类检测。近年来，人们将深度学习中R-CNN(region-based convolutional neural-network)系列、YOLO(YouOnly Look Once)系列等目标检测方法应用于绝缘子检测，均取得较好的检测效果。但这几类引入锚框算法的缺点在于：正负样本不均衡，算法中锚框数量巨大，而目标数量相对较少。并且还会引入更多的超参数，增加计算成本。

基于此，相关研究人员利用中心点网络(CenterNet)算法，对输电线路绝缘子进行检测，因为该算法无需设定锚框，也不需要进行非极大值抑制(Non-Maximum Suppression)操作，且模型结构简单，运行效率高，所以检测结果可以得到较高的精度。虽然中心点网络(CenterNet)算法使得检测效果有所提升，但该算法的矩形检测框的角度固定，其检测结果会引入大量的背景信息，这将为后续的检测任务的增加难度。

发明内容

针对现有技术中关于航拍图像中，绝缘子具有大长宽比、背景复杂多变、检测难度较大的问题，本发明提出了基于邻域信息交互注意力的任意角度航拍绝缘子检测方法，采用旋转框对倾斜的绝缘子进行检测，以提取有效特征信息，并通过在浅层网络融入邻域信息交互的注意力机制，提高倾斜绝缘子的检测精度。

本发明的目的可以通过以下技术方案来实现：

基于邻域信息交互注意力的任意角度航拍绝缘子检测方法，所述检测方法具体包括以下步骤：

S1：从无人机航拍的输电线路图像中，选取绝缘子图像，建立绝缘子图像数据集，所述绝缘子图像数据集至少包括绝缘子训练数据集和绝缘子测试数据集；

S2：构建绝缘子检测网络模型，所述绝缘子检测网络模型包括特征提取模块、解码器模块以及检测头模块，所述特征提取模块包括第一预处理模块、第二瓶颈模块、第三瓶颈模块、第四瓶颈模块以及第五瓶颈模块，在所述第二瓶颈模块和第三瓶颈模块之间引入邻域信息交互注意力机制模块，所述特征提取模块用于实现对输入图像的特征提取，获取图像的语义特征；

所述解码器模块通过三次反卷积操作进行上采样，获取高分辨率特征图；

所述检测头模块包括中心点检测头分支，中心点偏置检测头分支，检测框高、宽检测头分支以及角度检测头分支，在所述检测头模块中引入角度检测头分支，用于预测目标绝缘子的空间倾斜角度；

S3：根据所述绝缘子训练数据集，对S2中的绝缘子检测网络模型进行训练，得到训练后的绝缘子检测网络模型；

S4：根据所述绝缘子测试数据集，将其输入训练后的绝缘子检测网络模型，获取绝缘子检测结果。

进一步的，所述绝缘子训练数据集和绝缘子测试数据集的制作步骤包括：

S21：对不同无人机平台航拍的绝缘子原始图像进行尺寸归一化处理；

S22：对尺寸归一化处理后的绝缘子图像中的绝缘子本体进行标注，采用LabelImg标注工具对所述绝缘子本体进行标注，其标注内容包括标注框类别及位置信息，所述标注框类别信息包括绝缘子本体信息和背景信息，所述标注框位置信息包括标注框中心点的横、纵坐标、标注框长度和宽度，将标注内容保存在xml格式的文件中。

S23：将S22中标注后的绝缘子图像数据集按比例划分为绝缘子训练数据集和绝缘子测试数据集。

进一步的，所述特征提取模块采用卷积神经网络中的残差网络(Resnet50)；

所述第一预处理模块将大小为512×512的输入图像通过一层卷积核大小为7×7，步长为2，填充为3的卷积层，输出大小为256×256的特征图，然后通过归一化和Relu函数激活之后，将大小为256×256特征图，输入步长为2的池化层，输出大小为128×128的特征图；

所述第二瓶颈模块包括3个卷积块，所述第三瓶颈模块包括4个卷积块，所述第四瓶颈模块包括6个卷积块，所述第五瓶颈模块包括3个卷积块，其中每个卷积块均由卷积核大小分别为1×1、3×3、1×1的三层卷积层构成；

经过所述第二瓶颈模块、第三瓶颈模块、第四瓶颈模块以及第五瓶颈模块处理后，所述特征提取模块输出大小为16×16的特征图。

进一步的，引入所述邻域信息交互注意力机制模块的具体步骤包括：

S41：将所述第一预处理模块输出大小128×128的特征图作为所述邻域信息交互注意力机制模块的输入特征图，分别沿着高度、宽度方向进行全局平均池化，所述具体步骤包括：

S411：将输入特征图表示为X∈R^C×H×W，其中，C，H，W分别代表其在通道，高度，宽度三个维度上的取值，将输入特征图X∈R^C×H×W沿着宽度维度进行1维全局平均池化，则宽度索引为w的第i通道的输出可如式(1)所示：

式(1)中，Z(i，w)表示宽度索引为w的第i通道的输出，x(i，j，w)表示通道，高度，宽度索引分别为i，j，w时的X的值；

S412：将输入特征图X∈R^C×H×W，沿着高度维度进行1维全局平均池化，则高度索引为h的第i通道的输出可如式(2)所示：

式(2)中，Z(i，h)表示高度索引为h的第i通道的输出，x(i，h，k)表示通道，高度，宽度索引分别为i，h，k时的X的值；

S413：将S411和S412中的Z(i，w)和Z(i，h)分别沿着各自维度构建矩阵算子Z^w和Z^h，如式(3)所示：

式(3)中，Z^w和Z^h表示能描述空间特征信息的矩阵算子，0≤i≤C，0≤w≤W，0≤h≤H；

S42：对S4l中的输出Z^w和Z^h分别沿着高度，宽度维度进行卷积操作，然后再分别进行批归一化(Batch Normalization)操作，具体步骤包括：

S421：将所述矩阵算子Z^w∈R^C×W和Z^h∈R^C×H分别进行一维卷积运算，运算过程如式(4)所示：

式(4)中，函数f_conv表示一维卷积运算，其中卷积核大小为5×5，步长为1，填充为2，

和/>

分别表示对Z^w和Z^h进行一维卷积运算的输出；

S422：将S421得到的一维卷积运算后的矩阵

和/>

进行批归一化运算，运算过程如式(5)所示：

式(5)中，函数f_norm表示批归一化运算，

和/>

分别表示对

和/>

进行批归一化运算的输出；

S423：对S41中的输出Z^w和Z^h分别进行转置和一维卷积运算，运算过程如式(6)所示：

式(6)中，函数f_T，conv表示先进行转置运算后再进行一维卷积运算，其中卷积核大小为3×3，步长为1，填充为1，

和/>

表示先进行转置运算后再进行一维卷积运算的输出；

S424：将S423得到的

和/>

先进行批归一化运算，再进行转置运算，运算过程如式(7)所示：

式(7)中，函数f_norm，T表示先进行批归一化运算后再进行转置运算，

和/>

表示先进行批归一化运算后再进行转置运算的输出；

S43：对S42得到的输出进行融合计算和激活计算，然后对计算结果进行拓展(Unsqueeze)运算，其具体步骤包括：

S431：将S422中的输出

和S424中的输出

进行如式(8)所示融合和激活运算：

式(8)中，函数f_sig表示的是sigmoid函数，其表达式如式(9)所示：

表示沿宽度维度激活运算的输出，/>

表示沿高度维度激活运算的输出；

S432：对S431中激活运算后的输出

和/>

分别沿宽度维度和高度维度进行拓展运算，其运算过程如式(10)所示：

式(10)中，函数f_unsq表示的是拓展运算，

表示对/>

进行宽度维度拓展后的输出，/>

表示对/>

进行高度维度拓展后的输出；

S44：对S432中得到的

进行维度次序调整，然后将/>

与调整后的/>

进行矩阵点乘运算，再将得到的结果与输入特征图X∈R^C×H×W进行矩阵点乘运算，并将矩阵点乘后的输出作为第二瓶颈模块的输入，具体步骤如下：

S441：将

的宽度和高度维度进行交换，得到/>

S442：对S441中得到的

和S432中得到的/>

进行矩阵点乘运算，其运算过程如式(11)所示：/>

式(11)中，Y∈R^C×H×W为权重矩阵，表示领域信息交互注意力机制模块的输出，

表示矩阵点乘运算；

S443：将S442得到的Y∈R^C×H×W与S411中的X∈R^C×H×W，进行矩阵点乘运算，其运算过程如式(12)所示：

式(12)中，Z∈R^C×H×W表示对输入特征图X中每个元素施加Y所对应的权重后的输出矩阵。

进一步的，在所述解码器模块中获取高分辨率特征图的具体步骤包括：

S51：将从特征提取模块输出的16×16的特征图，进行一次反卷积得到大小为32×32的特征图，其中反卷积核大小为4×4，步长为2，填充为1；

S52：对S51中32×32的特征图，进行一次反卷积得到大小为64×64的特征图，其中反卷积核大小为4×4，步长为2，填充为1；

S53：对S52中64×64的特征图，进行一次反卷积得到大小为128×128的特征图，其中反卷积核大小为4×4，步长为2，填充为1。

进一步的，所述中心点检测头分支利用热力图对目标绝缘子的中心点位置进行预测，得到中心点预测值的高斯分布

所述中心点偏置检测头分支用于对中心点位置进行误差补偿，提高定位准确度，通过中心点偏置检测头分支可得到中心点偏置的预测值

所述检测框高、宽检测头分支用于计算检测框的高、宽，通过检测框高、宽检测头分支可得到检测框的高、宽预测值

所述角度检测头分支用于预测目标绝缘子的空间倾斜角度，通过角度检测头分支可得到倾斜角度的预测值

结合所述中心点检测头分支，中心点偏置检测头分支，检测框高、宽检测头分支以及角度检测头分支的预测输出结果，得到绝缘子目标的预测框。

进一步的，引入所述角度检测头分支的具体步骤包括：

S71：将所述解码器模块输出的128×128特征图作为角度检测头分支的输入，通过一个卷积核大小为3×3，步长为1，填充为1的卷积层进行卷积，其结果表示为

S72：将S71中卷积结果通过Relu激活函数，其计算过程如式(13)所示：

x^relu＝f^relu(x^conv3) (13)

式(13)中，x^relu为通过Relu函数激活后的输出，f^relu函数为Relu函数，其表达式如式(14)所示：

S73：将S72中的输出x^relu，通过一个1×1的卷积核进行卷积，所得输出结果即为所述角度检测头分支的输出-角度预测值

进一步的，得到所述训练后的绝缘子检测网络模型的具体步骤包括：

S81：将所述绝缘子训练数据集中的图像及对应的标注内容所包含的信息送入绝缘子检测网络模型；

S82：获取所述检测头模块中各个检测头分支的损失函数，其具体过程如下：

S821：所述绝缘子检测网络模型的损失函数包含4个部分，如式(15)所示：

L_net＝L_key+λ_sizeL_size+λ_offsetL_offset+λ_angL_ang (15)

式(15)中，L_key表示中心点损失函数，L_size表示检测框高、宽损失函数，L_offset表示中心点偏置损失函数，L_ang表示角度损失函数；

S822：中心点损失函数计算过程如式(16)所示：

式(16)中，

表示中心点预测值高斯分布，Y_i∈[0，1]表示中心点实际值高斯分布由训练数据集中的对应数据提供，N表示中心点的个数，α和β是超参数；

S823：中心点偏置损失函数的计算过程如式(17)所示：

式(17)中，

表示中心点偏置的预测值，O_i表示中心点偏置的真实值-由训练数据集中的对应数据提供；

S824：检测框高、宽损失函数的计算过程如式(18)所示：

式(18)中，

表示检测框的高、宽预测值，S_i表示检测框的高、宽实际值由训练数据集中的对应数据提供；

S825：角度损失函数的计算过程如式(19)所示：

式(19)中，

表示倾斜角度的预测值，θ_i表示倾斜角度的真实值-由训练数据集中的对应数据提供；

S83：根据绝缘子检测网络模型损失函数L_net，基于梯度下降方法，如式(20)所示，对所述绝缘子检测网络模型中的训练参数进行迭代更新：

式(20)中，

表示网络模型更新前的所有训练参数，w_τ表示更新后的所有训练参数，η表示相应的学习率，在下一轮迭代更新时，将上一轮得到的w_τ赋值给/>

S84：选择迭代更新运算的轮数，并对迭代更新后的最后一轮参数进行保存。

进一步的，加载S84所保存的最后一轮的训练参数，将所述测试数据集输入所述绝缘子检测网络模型中，获取绝缘子检测结果。

根据绝缘子检测结果以及图像中标注的真实绝缘子的分布情况，采用平均精确率(AP，Average Precision)指标，对本发明所述的方法进行效果评估，具体如下：

S91：将真实的绝缘子标识框，记为真实框。

S92：为得到平均精确率AP，需要计算真实框和检测框的交并比(IOU，Intersection over Union)。当检测框和真实框的交并比大于设定阈值时，记为一次真正的正样本(TP，True Positive)，当检测框和真实框的交并比小于设定阈值时，记为一次错误的正样本(FP，False Positive)，若绝缘子没有被检测到，记为一次错误的负样本(FN，False Negative)。

S93：采用TP+FP的值表示所有检测框的数目，采用TP+FN的值表示真实框的数目，根据如下公式分别计算出所有检测框的平均精确率AP中的相关指标：精确率(Precision)和召回率(Recall)。

在得到召回率和准确率后，以召回率为横坐标，以准确率为纵坐标绘制曲线，计算该曲线包围的坐标系的面积，面积值即为AP值。AP值越高，表示检测精度越好。

与现有的技术相比，本发明有益的效果为：

(1)通过在现有的绝缘子检测算法的基础上，引入了一种邻域信息交互注意力结构，提出了基于邻域交互注意力的任意角度航拍绝缘子检测网络模型，该模型能有效减少航拍图像中背景信息对检测结果的影响；

(2)加入角度预测网络结构，可以得到任意倾斜角度的目标边界框，从而可以更精准地得到绝缘子的位置信息，从而提高检测效率和精度。

附图说明

图1为本发明流程图；

图2为绝缘子检测网络模型结构图；

图3为邻域信息交互注意力机制结构图；

图4为检测头模块中角度检测头分支结构图；

图5为不同算法模型平均准确率对比图；

图6为训练过程损失函数收敛情况对比图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

如图1所示，基于邻域信息交互注意力的任意角度航拍绝缘子检测方法，所述检测方法具体包括以下步骤：

所述绝缘子训练数据集和绝缘子测试数据集的制作步骤包括：

所述特征提取模块采用卷积神经网络中的残差网络(Resnet50)；

如图3所示，引入所述邻域信息交互注意力机制模块的具体步骤包括：

S42：对S41中的输出Z^w和Z^h分别沿着高度，宽度维度进行卷积操作，然后再分别进行批归一化(Batch Normalization)操作，具体步骤包括：

和/>

分别表示对Z^w和Z^h进行一维卷积运算的输出；

S422：将S421得到的一维卷积运算后的矩阵

和/>

进行批归一化运算，运算过程如式(5)所示：

式(5)中，函数f_norm表示批归一化运算，

和/>

分别表示对

和/>

进行批归一化运算的输出；/>

和/>

表示先进行转置运算后再进行一维卷积运算的输出；

S424：将S423得到的

和/>

和/>

表示先进行批归一化运算后再进行转置运算的输出；

S431：将S422中的输出

和S424中的输出

进行如式(8)所示融合和激活运算：

表示沿宽度维度激活运算的输出，/>

表示沿高度维度激活运算的输出；

S432：对S431中激活运算后的输出

和/>

式(10)中，函数f_unsq表示的是拓展运算，

表示对/>

进行宽度维度拓展后的输出，/>

表示对/>

进行高度维度拓展后的输出；/>

S44：对S432中得到的

进行维度次序调整，然后将/>

与调整后的/>

S441：将

的宽度和高度维度进行交换，得到/>

S442：对S441中得到的

和S432中得到的/>

进行矩阵点乘运算，其运算过程如式(11)所示：

表示矩阵点乘运算；

在所述解码器模块中获取高分辨率特征图的具体步骤包括：

所述中心点检测头分支利用热力图对目标绝缘子的中心点位置进行预测，得到中心点预测值的高斯分布

结合所述中心点检测头分支，中心点偏置检测头分支，检测框高、宽检测头分支以及角度检测头分支的预测输出结果，得到绝缘子目标的预测框。如图4所示，引入所述角度检测头分支的具体步骤包括：

优选的，C₁＝256，H₁＝W₁＝128；/>

x^relu＝f^relu(x^conv3) (13)

得到所述训练后的绝缘子检测网络模型的具体步骤包括：

L_net＝L_key+λ_sizeL_size+λ_offsetL_offset+λ_angL_ang (15)

优选的，λ_size＝λ_ang＝0.1，λ_offseet＝1；

S822：中心点损失函数计算过程如式(16)所示：

式(16)中，

表示中心点预测值高斯分布，Y_i∈[0，1]表示中心点实际值高斯分布由训练数据集中的对应数据提供，N表示中心点的个数，α和β是超参数；优选的，α＝2，β＝4；

S823：中心点偏置损失函数的计算过程如式(17)所示：

式(17)中，

S824：检测框高、宽损失函数的计算过程如式(18)所示：

式(18)中，

S825：角度损失函数的计算过程如式(19)所示：

式(19)中，

式(20)中，

优选的，本发明共进行了100轮的迭代更新运算。

加载S84所保存的最后一轮的训练参数，将所述测试数据集输入所述绝缘子检测网络模型中，获取绝缘子检测结果。

S91：将真实的绝缘子标识框，记为真实框。

在得到召回率和准确率后，以召

回率为横坐标，以准确率为纵坐标绘制曲线，计算该曲线包围的坐标系的面积，面积值即为AP值。AP值越高，表示检测精度越好。

如图5所示，为验证本发明的有效性，将本发明的网络模型与带有通道注意力的网络模型(ResNet50+SE-Net)以及带有空间和通道融合注意力的网络模型(ResNet50+CBAM、ResNet50+CA-Net)进行了比较。在实验参数设置一致的情况下，本发明增加的参数量可忽略不计，而检测精度最高，达到了93.8％。这依赖于本发明的邻域信息交互注意力机制可以有效的捕捉到绝缘子的空间位置信息，可以准确定位到绝缘子所在的目标区域，还可以建模通道特征的依赖关系，这有助于网络对无用信息的抑制。

如图6所示，本发明方法与中心点网络方法训练时的损失函数收敛情况对比，可以得出本发明提出的基于邻域交互注意力的任意角度航拍绝缘子检测方法能快速收敛，进一步反应了本发明方法的有效性。