CN112036403A

CN112036403A - 基于注意力机制的输电塔螺栓销子缺失的智能检测方法

Info

Publication number: CN112036403A
Application number: CN202010894523.0A
Authority: CN
Inventors: 李帷韬; 管会敏; 彭思遥; 邓雅丽; 吴刚
Original assignee: Hefei University of Technology
Current assignee: Hefei University of Technology
Priority date: 2020-08-31
Filing date: 2020-08-31
Publication date: 2020-12-04
Anticipated expiration: 2040-08-31
Also published as: CN112036403B

Abstract

本发明公开了一种基于注意力机制的输电塔螺栓销子缺失的智能检测方法，其步骤包括：1、对输电塔销子图像集进行预处理；2、构建基于注意力机制的perturb神经网络模型；3、利用步骤2的模型，构建多层次识别网络；4、使用Sugeno模糊积分对多层次网络输出进行特征融合，并输出检测结果。本发明能解决销子缺失检测费时费力，或检测不准的问题，提高检测实时性，并完成复杂背景下微小销子的缺失状态的精确检测，从而满足准确化快速化的实际需求。

Description

基于注意力机制的输电塔螺栓销子缺失的智能检测方法

技术领域

本发明涉及高压输电线路巡线技术，图像识别技术，模糊积分领域，具体涉及一种基于深度学习的多特征融合的输电塔销子缺损检测方法。

背景技术

我国承载着13亿人口的用电需求，随着我国综合国力的迅速发展，人们的生活水平和生活质量不断地提高，而随之带来的是用电设备的迅速增加、用电需求的不断地增加。无论是工业用电还是生活用电，输电塔架是高压送电线路的最常用的支撑物，国内外大多采用热轧等边角钢，由螺栓连接而成的空间钢结构。随着钢铁工业的快速发展和钢结构设计标准的不断完善，工程设计中也不断涌现许多新的塔型，比如为了减少线路走廊宽度的紧凑型输电塔、跨越大江大河的大跨越输电塔、线路走在城郊附近而与城市环境相协调的输电钢管塔等。

输电塔线体系中的输电塔结构多采用空间钢结构，作为架空输电线路中的重要部件，螺栓被大量用于铁塔各个部位的连接，承受着较大的机械张力，是电塔结构的重要节点。部分核心节点采用插销螺栓固定，由于插销螺栓具有可靠性高，施工简便等优点，被广泛应用于输电塔建筑钢结构之中，成为钢结构安装连接的重要手段之一，但是由于安装时不规范，雨雪风霜侵蚀等原因，销子存在缺失和损坏脱落的可能性，威胁输电塔稳定。由于许多输电塔位置偏僻，难以到达，同时数量众多，使用人力检查耗时耗力。

随着信息化和网络化技术的快速发展，利用无人机或直升机沿输电线路拍摄视频图像，继而由人从背景复杂的影像中分析标注销子存在状态的现代人工巡检方式，开始逐渐替代传统人工巡检方式，已成为输电线路巡检技术发展的方向。但是拍摄产生的大量图像或视频需要相关人员一一观察并分析有无销子缺失的情况。在分析过程中也会被图像的背景以及清晰度所影响，从而导致分析的结果不一定可信。

近几年来人工智能和海量图像数据相结合的技术应用也越来越广泛，这使得对图像中的目标物体进行识别和定位的手段获得了极大的丰富。螺栓销子体积微小，属于微小目标检测，这方面一向是神经网络识别的薄弱之处，一方面微小目标检测特征不明显，难以训练收敛，另一方面销子体积较小，无法使用太深的网络以免丢失特征，使得单层所需参数数量庞大，计算缓慢。目前很多现行的算法都是通过对得到的图像进行降噪处理、对螺栓某一特征，比如六边形螺母，圆形末端进行识别从而定位，再通过各种方式识别，这样能够减少一定人工的参与提高巡线的效率。但是这些方法也存在很多的弊端，针对性强，对图片质量和角度要求极高，难以实现，并且准确率不高，实用价值较低。

发明内容

本发明是为了解决上述现有技术存在的不足之处，提出一种基于注意力机制的输电塔螺栓销子缺失检测方法，以期能解决销子缺失检测费时费力，或检测不准的问题，提高检测实时性，并完成复杂背景下微小销子的缺失状态的精确检测，从而满足准确化快速化的实际需求。

本发明为解决技术问题采用如下技术方案：

本发明一种基于注意力机制的输电塔螺栓销子缺失的智能检测方法的特点是按如下步骤进行：

步骤1、对输电塔销子图像集进行预处理，得到预处理后的销子图像集；

步骤2、使用生成对抗网络GANs对所述预处理后的销子图像集进行扩充处理，得到扩充后的销子图像集；

步骤3、将所述扩充后的销子图像集进行分类，分为有销子图像集N1和销子缺失图像集N2；

步骤4、将所述有销子图像集N1分为有销子图像训练集和有销子图像测试集；将所述销子缺失图像集N2分为销子缺失图像训练集和销子缺失图像测试集；

将所述有销子图像训练集和销子缺失图像训练集合并为第一级训练集合T1；

将所述有销子图像测试集和销子缺失图像测试集合并合并为测试集合T2；

步骤5、构建基于注意力机制的perturb神经网络模型：

步骤5.1、构建特征提取网络f，用于网络特征提取；

步骤5.1.1、基于Resnet18卷积神经网络的结构设计所述特征提取网络f，所述特征提取网络f由一个直连块d、四个跳连块D以及全连接层fc级联组成，且各部分之间有一个池化层P，所述直连块d依次包含扰动层、卷积层、bn层和激活层，任意一个跳连块D由两个直连块级联构成，并采用局部跳层方式连接；

所述特征提取网络f的输入层为所述直连块d的输入层；所述直连块d的输出层与第1个池化层P₁连接，所述第一池化层P₁与第1个跳连块D₁的输入层连接，并采用跳层连接结构，即：所述第一池化层P₁一方面与第1个跳连块D₁的输入层连接，并经过所述第1个跳连块D₁中的两个直连块，与第2个池化层P₂连接，另一方面跳过第1个跳连块D₁直接与第2个池化层P₂连接；

同理，第i个池化层P_i一方面与第i个跳连块D_i的输入层连接，并经过第i个跳连块D_i中的两个直连块，与第i+1个池化层P_i+1连接，另一方面跳过i个跳连块D_i直接与第i+1个池化层P_i+1连接；i＝2，3，4；

第5个池化层P₅与全连接层fc相连；

步骤5.1.2、从所述第一级训练集合T1中选取输入图像x，输入所述直连块d的扰动层，从而根据所述输入图像x的尺寸和通道，定义噪声图集，再使用uniform()函数对噪声图集进行随机初始化，并获得初始噪声图集N，N包含t列，每列有n个噪声图，其中第j列噪声图记为N^j，且

表示第j列第n个噪声图；j∈[1,t]；

步骤5.1.3、在所述直连块d的扰动层将输入图像x依次与第j列的m个噪声图Nⁱ叠加，生成m个扰动图后再通过所述直连块d的卷积层进行线性组合，然后经过所述直连块d的激活层中的relu函数激活后得到第j列噪声图所提取出的特征图，从而由所述直连块d对t列的噪声图进行处理后，得到所述直连块d提取出的特征图，并输入第一池化层P₁后，得到输入特征图

表示输入图像x经过第t列噪声图得到的特征图；

步骤5.1.4、将所述输入特征图X¹作为第1个跳连块D₁的输入，并按照步骤5.1.2和步骤5.1.3的过程进行处理，从而依次经过所述特征提取网络f输出最终的特征图F并输入所述全连接层fc中，获得属于两种分类的权值，从而完成特征提取；

步骤5.2、创建位置检测网络g，得出输入图像x中目标最可能存在区域的位置坐标；

步骤5.2.1、位置检测网络g的结构为双层全连接层：

步骤5.2.2、将所述特征图F输入所述双层全连接层，并使用Tanh函数激活，从而输出位置信息(t_x,t_y,t_l)；

步骤5.2.3、利用式(1)得到输入图像x中的最可能的目标位置的左上角坐标(t_x(left),t_y(left))和右下角坐标(t_x(right),t_y(right))：

步骤5.2.4、利用式(2)可得到坐标连续函数M(·)：

M(·)＝[h(x-t_x(left))-h(x-t_x(right))]·[h(y-t_y(left))-h(y-t_y(right))] (2)

式(2)中，h()表示逻辑回归函数；

步骤5.2.5、利用式(3)得到裁剪后的输入图像

式(4)中，

表示裁剪操作；

步骤5.3、构建基于注意力调节机制的perturb神经网络模型，使用特征提取网络f以及位置检测网络g对输入图像x进行注意力聚焦；

步骤5.3.1、设定输入图像x的注意力聚焦共执行A次，定义当前执行次数为a，并初始化a＝1；定义并初始化为第a次输入图像x_a＝x；

步骤5.3.2、将第a次输入图像x_a输入特征提取网络f中，得到第a级特征图F_a，所述第a级特征图F_a经过所述位置检测网络g，得到目标可能存在的位置特征

并根据位置特征

由式(1)、式(2)、式(3)得到第a个裁剪后的输入图像

后，再将第a个裁剪后的输入图像

放大到输入图像x_a的尺寸，从而得到第a+1次输入图像x_a+1；

步骤5.3.3、判断a+1＝A是否成立，若成立，则表示第a+1次输入图像x_a+1是最终识别的图像M，否则，将a+1赋值给a，x_a＝x_a+1后，返回步骤步骤5.3.2；

步骤5.3.4、将最终识别的图像M输入所述特征提取网络f中，并得到最终的特征图

后并输入所述全连接层fc中，得到的结果再经过SCNs分类器中获得输入图像x的分类结果z，并作为perturb神经网络模型的输出结果；

步骤6、构建多层次识别网络：

步骤6.1、所述第一级训练集合T1中将剩余所有图像，依次作为输入图像并赋值给x，重复步骤5.1.2-步骤5.3.4，从而训练出第一级模型mo₁，并得到所述第一级训练集合T1中所有图像最终的特征图及分类结果；

由所述第一级训练集合T1中所有图像最终的特征图构成的特征图集

并根据分类结果的不同，将特征图集

映射为特征空间向量

代表特征空间向量

中属于有销子类别的特征图向量，

代表特征空间向量

中属于销子缺失类别的特征图向量；

步骤6.2、建立最终的特征图

的评测指标；

步骤6.2.1由测试集合T2测试得到所述perturb神经网络模型的认知精度为β，定义类别s_x∈{1,2}，s_x＝1代表有销子，s_x＝2代表销子缺失；

步骤6.2.2、从所述第一级训练集合T1中任意选取一张图像作为输入图像x′并输入第一级模型mo₁中，得到输入图像x′的最终的特征图及分类结果z′；

步骤6.2.3、利用式(4)构建输入图像x′的特征误差矩阵

式(4)中，

表示代表特征空间向量

中属于分类结果为z′的特征图向量，z′∈s_x，n为特征空间里向量

的长度；l为与特征图向量

长度相同的参数矩阵；

步骤6.2.3、利用式(5)得到所述输入图像x′的可接受度A_x′：

式(5)中，m^β是与perturb神经网络模型有关的常数；

步骤6.3、判断所述可接受度A_x′大于所设定的阈值是否成立，若成立，则表示所述输入图像x′适用于认知精度β的第一级模型mo₁，并返回步骤6.2.2，否则，将输入图像x′放入第二级训练集T3中；直到第一级训练集合T1中所有图像都测试完成，并得到最终的第二级训练集T3；

步骤6.4、将最终的第二级训练集T3赋值给第一级训练集T1，重复步骤6.1-步骤6.4，得到第二级销子检测模型mo₂和最终的第三级训练集T4；

同理，将最终的第i级训练集赋值给第i-1级训练集，重复步骤6.1-步骤6.4，得到第i级销子检测模型mo_i和第i+1级训练集，当直到i＝M时，表示M级销子检测模型训练完成，并执行步骤7；

步骤7、将测试集合T2作为待识别目标集合，从测试集合T2中选取一个图像

作为待识别目标，利用M级销子检测模型分别对待识别目标

进行检测，在每一级销子检测模型检测的同时，利用霍夫梯度圆检测方法对待识别目标

进行检测，从而将每一级销子检测模型的检测结果与霍夫梯度圆检测方法的检测结果合并为当前级检测的最终结果；进而得到M级检测的最终结果，记为{Y₁,Y₂,…,Y_i,…,Y_M}，Y_i表示第i级销子检测模型的检测结果与霍夫梯度圆检测方法的检测结果合并后的第i级检测的最终结果；i∈[1,M]；

步骤8、构建基于Sugeno模糊积分的多模型特征融合判别；

步骤8.1、利用式(6)计算参数λ：

式(6)中，g_i表示第i级销子检测模型对于类别s_x的重要性；

步骤8.2、利用式(7)计算待识别目标集合T2对第i级销子检测模型模糊密度g_λ(T2_i)：

g_λ(T2_i)＝g_i+g_λ(T2_i-1)+λ×g_ig_λ(T2_i-1) (7)

式(7)中，g_λ(T2_i-1)表示第i-1级销子检测模型的模糊密度；当i＝1时，令g_λ(T2_i-1)＝g₁；

步骤8.3、利用式(8)得到待识别目标

属于类别s_x概率

并从所对应的两个类别的概率中选取最大值所对应的类别作为待识别目标

的最终类别；

式(8)中，

表示第i级检测的最终结果Y_i里属于类别s_x的概率，∨代表取两者最大值，∧代表取两者最小值。

与已有技术相比，本发明的有益效果体现在：

1、本发明相比销子的常规特征检测方法以及人工观察方法，通过降低模型运算量，使用注意力聚焦和多级模型特征融合判别方法，解决了销子缺失检测费时费力，或检测不准的问题，提高了检测精度，加快了检测速度，并且具有较强的鲁棒性，能够在复杂背景下识别销子状态，满足了准确化快速化的实际需求。

2、本发明使用随机生成的大量噪声图代替常规神经网络所需要训练的滤波器，利用其线性组合作为提取出的特征，大大减小了所需计算量，克服了常规方法识别速度较慢的缺点，具有很好的实时性，降低了销子状态检测工作的后期工作量，提高了工作效率。

3、本发明利用注意力机制的多尺度检测方式，在输入图像基础上，利用注意力聚焦最可能的位置，并切下继续聚焦，经过多次操作，将微小的销子放到足够大，大大缩小输入图像的冗余部分，强化显示销子特征，提高了销子状态检测的准确率，加强了实用性；

4、本发明利用梯度检测的方式对注意力机制聚焦的区域进行二次检测，对销子及销子周边的常见特征，例如螺母的六边形、圆形末端、销子缺失形成的空洞进行检测，并将检测结果作为子分类器特征的一部分进行模糊积分，在聚焦不准时减小特征图的权重，防止误识别，提高了工作效率。

5、本发明使用可区分性测度指标对训练样本进行分组，销子由于插在螺栓上，并且体积微小，受到光照和角度影响形态差异较大，单一特征不足以完全区分，所以本发明使用分组的训练样本训练出多级模型进行检测，第一级模型训练完成后，将识别效果不佳的图片拿出制作成新的数据集，用于训练第二级模型，同理获得更高级模型，每级模型配合梯度检测方式组合生成分类器特征，进行模糊积分，获得最终检测结果，从而提高了销子状态检测的精度，加强实用性。

附图说明

图1为本发明中特征检测网络结构图；

图2为本发明中位置检测网络结构图；

图3为本发明整体运行结构图；

图3a为本发明第一级模型运行结构图；

图4为本发明单个模型识别过程中最有可能区域的变化图；

图5a为本发明提取的特征图；

图5b为本发明梯度圆检测结果图。

具体实施方式

本实施例中，一种基于注意力机制的输电塔螺栓销子缺失检测方法是按如下步骤进行：

步骤1、对输电塔销子图像集进行预处理，得到预处理后的销子图像集，本实施例中，先使用随机裁剪将图像转变为正方形，再将图像统一使用双线性插值重置为448*448大小，再进行去抖防噪处理，最后为了便于收敛，将图像统一归一化；

步骤2、使用生成对抗网络GANs对所述预处理后的销子图像集进行扩充处理，得到扩充后的销子图像集，生成的样本不一定存在销子或符合预期，需要对样本进行人工筛选，筛选后的样本集与原始样本集混合形成有效样本集，本实例中原始样本100幅，选择出来的生成样本500幅；

步骤3、将所述扩充后的销子图像集进行分类，为了模拟无人机拍摄插销的各种角度偏移，将有效样本集中每个样本每次顺时针旋转30°，总共扩充为原来的12倍。分为有销子图像集N1和销子缺失图像集N2；

步骤4、得益于注意力机制的尺度缩小设置，训练图像将不必进行人工标注，是一种无监督学习。将所述有销子图像集N1分为有销子图像训练集和有销子图像测试集；将所述销子缺失图像集N2分为销子缺失图像训练集和销子缺失图像测试集；

本实施例中T1包含图像5760张，T2包含1440张。

步骤5、构建基于注意力机制的perturb神经网络模型，在本实施例中，基于注意力机制的网络需要进行多种尺度的训练，本发明在perturb神经网络基础上引入注意力机制，以全局图像为感受野的同时，获得不同尺度的训练结果。

如图3a的模型1所示：训练时每一部分输入图像首先进入特征提取网络Perturbnetwork，获得提取出的特征图，再输入位置检测网络Atn network，进行位置拟合，根据检测结果和标签进行损失传递，之后根据位置拟合网络输出利用式(1)、式(2)、式(3)获得裁剪坐标，在输入图像上按坐标裁剪出目标区域图像，进入下一级训练，反复两次，获得最后一级识别结果。

步骤5.1、构建特征提取网络f，用于网络特征提取，其网络结构如图1所示；

第5个池化层P₅与全连接层fc相连；

在本实例中，输入图像x的尺寸为448*448，通道为16，特征提取网络结构图如图1所示，除第一层外共四个跳连块，各个块的噪声图数量为(64，64)、(64，128)、(128，256)、(256，512)，第一层设定噪声图数量m为64，所有卷积层卷积核大小都为1，实际上并没有卷积操作；除第一层外，所有层步长皆为2；

表示第j列第n个噪声图；j∈[1,t]；

表示输入图像x经过第t列噪声图得到的特征图；

步骤5.2.1、位置检测网络g的结构为双层全连接层，如图1所示，每层节点1024个，输入是512*14*14的特征图，输出为三个位置相关值：

步骤5.2.2、将所述特征图F输入所述双层全连接层，并使用Tanh函数激活，从而输出位置信息(t_x,t_y,t_l)，其中，(t_x,t_y)设定为最可能区域的中心坐标，t_l设定为最可能区域边长的一半；

步骤5.2.4、利用式(2)可得到坐标连续函数M(·)：

M(·)＝[h(x-t_x(left))-h(x-t_x(right))]·[h(y-t_y(left))-h(y-t_y(right))] (2)

式(2)中，h()表示逻辑回归函数；

步骤5.2.5、利用式(3)得到裁剪后的输入图像

式(4)中，

表示裁剪操作；

步骤5.3.1、设定输入图像x的注意力聚焦共执行A次，定义当前执行次数为a，并初始化a＝1；定义并初始化为第a次输入图像x_a＝x，在本实例中，网络的注意力聚焦一共执行三次，图裁剪两次；

并根据位置特征

由式(1)、式(2)、式(3)得到第a个裁剪后的输入图像

后，再将第a个裁剪后的输入图像

放大到输入图像x_a的尺寸，从而得到第a+1次输入图像x_a+1，在本实例中，每次注意力聚焦裁剪下来的图像尺寸为224*224，即缩小为原来的一半；

后并输入所述全连接层fc中，得到的结果再经过SCNs分类器中获得输入图像x的分类结果z，并作为perturb神经网络模型的输出结果，得到两次裁剪的的图像M后，对图像M进行检测，并将图像M检测的结果作为输入图像x的识别结果；

步骤6、构建多层次识别网络：

并根据分类结果的不同，将特征图集

映射为特征空间向量

代表特征空间向量

中属于有销子类别的特征图向量，

代表特征空间向量

中属于销子缺失类别的特征图向量；

步骤6.2、建立最终的特征图

的评测指标，销子存在状态由于角度、亮度或者遮挡等问题可能发生很大变化，扰动模型藉由噪声图叠加方式作为提取到的特征，本身训练较为困难，单一模型不易提取到有效特征，需要建立多模型特征融合判别，使模型效果提高，为此需要为特征空间及其分类准则提供量化依据，在特征空间建模的信息论与销子存在认知结果评测的认知论之间构建等价的熵形式测度关系；

步骤6.2.2、从所述第一级训练集合T1中任意选取一张图像作为输入图像x′并输入第一级模型mo₁中，得到输入图像x′的像最终的特征图及分类结果z′；

步骤6.2.3、利用式(4)构建输入图像x′的特征误差矩阵

式(4)中，

表示代表特征空间向量

的长度；l为与特征图向量

长度相同的参数矩阵；

步骤6.2.3、利用式(5)得到所述输入图像x′的可接受度A_x′：

式(5)中，m^β是与perturb神经网络模型有关的常数；

本实施例中，当计算得出的A_x'>0.74时。可以视为此图像对于本级网络适用，若小于则视为不适用，需要进入下一级数据集继续训练，如图3所示；

同理，将最终的第i级训练集赋值给第i-1级训练集，重复步骤6.1-步骤6.4，得到第i级销子检测模型mo_i和第i+1级训练集，当直到i＝M时，表示M级销子检测模型训练完成，并执行步骤7，在本实例中，M＝3，一共训练三个模型参与检测；

作为待识别目标，利用M级销子检测模型分别对待识别目标

在本施例中，模型结构如图3所示，每个模型的输出都由神经网络全连接层的输出节点权值和梯度圆检测结果共同构成，三个模型输出通过模糊积分得到最终输出结果，梯度圆检测结果和模型提取的特征图如图5b和图5a所示。

步骤8、构建基于Sugeno模糊积分的多模型特征融合判别；

步骤8.1、利用式(6)计算参数λ：

式(6)中，g_i表示第i级销子检测模型对于类别s_x的重要性；

g_λ(T2_i)＝g_i+g_λ(T2_i-1)+λ×g_ig_λ(T2_i-1) (7)

式(7)中，g_λ(T2_i-1)表示第i-1级销子检测模型的模糊密度；当i＝1时，令g_λ(T2_i-1)＝g₁；在本实施例中，使用的模糊积分各参数如表1：

表1

类别	g<sub>1</sub>	g<sub>2</sub>	g<sub>3</sub>	λ
					值	0.3450	0.3349	0.3249	-0.0149

步骤8.3、利用式(8)得到待识别目标

属于类别s_x概率

的最终类别；

式(8)中，