CN112036403A - 基于注意力机制的输电塔螺栓销子缺失的智能检测方法 - Google Patents
基于注意力机制的输电塔螺栓销子缺失的智能检测方法 Download PDFInfo
- Publication number
- CN112036403A CN112036403A CN202010894523.0A CN202010894523A CN112036403A CN 112036403 A CN112036403 A CN 112036403A CN 202010894523 A CN202010894523 A CN 202010894523A CN 112036403 A CN112036403 A CN 112036403A
- Authority
- CN
- China
- Prior art keywords
- pin
- image
- layer
- detection
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于注意力机制的输电塔螺栓销子缺失的智能检测方法,其步骤包括:1、对输电塔销子图像集进行预处理;2、构建基于注意力机制的perturb神经网络模型;3、利用步骤2的模型,构建多层次识别网络;4、使用Sugeno模糊积分对多层次网络输出进行特征融合,并输出检测结果。本发明能解决销子缺失检测费时费力,或检测不准的问题,提高检测实时性,并完成复杂背景下微小销子的缺失状态的精确检测,从而满足准确化快速化的实际需求。
Description
技术领域
本发明涉及高压输电线路巡线技术,图像识别技术,模糊积分领域,具体涉及一种基于深度学习的多特征融合的输电塔销子缺损检测方法。
背景技术
我国承载着13亿人口的用电需求,随着我国综合国力的迅速发展,人们的生活水平和生活质量不断地提高,而随之带来的是用电设备的迅速增加、用电需求的不断地增加。无论是工业用电还是生活用电,输电塔架是高压送电线路的最常用的支撑物,国内外大多采用热轧等边角钢,由螺栓连接而成的空间钢结构。随着钢铁工业的快速发展和钢结构设计标准的不断完善,工程设计中也不断涌现许多新的塔型,比如为了减少线路走廊宽度的紧凑型输电塔、跨越大江大河的大跨越输电塔、线路走在城郊附近而与城市环境相协调的输电钢管塔等。
输电塔线体系中的输电塔结构多采用空间钢结构,作为架空输电线路中的重要部件,螺栓被大量用于铁塔各个部位的连接,承受着较大的机械张力,是电塔结构的重要节点。部分核心节点采用插销螺栓固定,由于插销螺栓具有可靠性高,施工简便等优点,被广泛应用于输电塔建筑钢结构之中,成为钢结构安装连接的重要手段之一,但是由于安装时不规范,雨雪风霜侵蚀等原因,销子存在缺失和损坏脱落的可能性,威胁输电塔稳定。由于许多输电塔位置偏僻,难以到达,同时数量众多,使用人力检查耗时耗力。
随着信息化和网络化技术的快速发展,利用无人机或直升机沿输电线路拍摄视频图像,继而由人从背景复杂的影像中分析标注销子存在状态的现代人工巡检方式,开始逐渐替代传统人工巡检方式,已成为输电线路巡检技术发展的方向。但是拍摄产生的大量图像或视频需要相关人员一一观察并分析有无销子缺失的情况。在分析过程中也会被图像的背景以及清晰度所影响,从而导致分析的结果不一定可信。
近几年来人工智能和海量图像数据相结合的技术应用也越来越广泛,这使得对图像中的目标物体进行识别和定位的手段获得了极大的丰富。螺栓销子体积微小,属于微小目标检测,这方面一向是神经网络识别的薄弱之处,一方面微小目标检测特征不明显,难以训练收敛,另一方面销子体积较小,无法使用太深的网络以免丢失特征,使得单层所需参数数量庞大,计算缓慢。目前很多现行的算法都是通过对得到的图像进行降噪处理、对螺栓某一特征,比如六边形螺母,圆形末端进行识别从而定位,再通过各种方式识别,这样能够减少一定人工的参与提高巡线的效率。但是这些方法也存在很多的弊端,针对性强,对图片质量和角度要求极高,难以实现,并且准确率不高,实用价值较低。
发明内容
本发明是为了解决上述现有技术存在的不足之处,提出一种基于注意力机制的输电塔螺栓销子缺失检测方法,以期能解决销子缺失检测费时费力,或检测不准的问题,提高检测实时性,并完成复杂背景下微小销子的缺失状态的精确检测,从而满足准确化快速化的实际需求。
本发明为解决技术问题采用如下技术方案:
本发明一种基于注意力机制的输电塔螺栓销子缺失的智能检测方法的特点是按如下步骤进行:
步骤1、对输电塔销子图像集进行预处理,得到预处理后的销子图像集;
步骤2、使用生成对抗网络GANs对所述预处理后的销子图像集进行扩充处理,得到扩充后的销子图像集;
步骤3、将所述扩充后的销子图像集进行分类,分为有销子图像集N1和销子缺失图像集N2;
步骤4、将所述有销子图像集N1分为有销子图像训练集和有销子图像测试集;将所述销子缺失图像集N2分为销子缺失图像训练集和销子缺失图像测试集;
将所述有销子图像训练集和销子缺失图像训练集合并为第一级训练集合T1;
将所述有销子图像测试集和销子缺失图像测试集合并合并为测试集合T2;
步骤5、构建基于注意力机制的perturb神经网络模型:
步骤5.1、构建特征提取网络f,用于网络特征提取;
步骤5.1.1、基于Resnet18卷积神经网络的结构设计所述特征提取网络f,所述特征提取网络f由一个直连块d、四个跳连块D以及全连接层fc级联组成,且各部分之间有一个池化层P,所述直连块d依次包含扰动层、卷积层、bn层和激活层,任意一个跳连块D由两个直连块级联构成,并采用局部跳层方式连接;
所述特征提取网络f的输入层为所述直连块d的输入层;所述直连块d的输出层与第1个池化层P1连接,所述第一池化层P1与第1个跳连块D1的输入层连接,并采用跳层连接结构,即:所述第一池化层P1一方面与第1个跳连块D1的输入层连接,并经过所述第1个跳连块D1中的两个直连块,与第2个池化层P2连接,另一方面跳过第1个跳连块D1直接与第2个池化层P2连接;
同理,第i个池化层Pi一方面与第i个跳连块Di的输入层连接,并经过第i个跳连块Di中的两个直连块,与第i+1个池化层Pi+1连接,另一方面跳过i个跳连块Di直接与第i+1个池化层Pi+1连接;i=2,3,4;
第5个池化层P5与全连接层fc相连;
步骤5.1.2、从所述第一级训练集合T1中选取输入图像x,输入所述直连块d的扰动层,从而根据所述输入图像x的尺寸和通道,定义噪声图集,再使用uniform()函数对噪声图集进行随机初始化,并获得初始噪声图集N,N包含t列,每列有n个噪声图,其中第j列噪声图记为Nj,且 表示第j列第n个噪声图;j∈[1,t];
步骤5.1.3、在所述直连块d的扰动层将输入图像x依次与第j列的m个噪声图Ni叠加,生成m个扰动图后再通过所述直连块d的卷积层进行线性组合,然后经过所述直连块d的激活层中的relu函数激活后得到第j列噪声图所提取出的特征图,从而由所述直连块d对t列的噪声图进行处理后,得到所述直连块d提取出的特征图,并输入第一池化层P1后,得到输入特征图 表示输入图像x经过第t列噪声图得到的特征图;
步骤5.1.4、将所述输入特征图X1作为第1个跳连块D1的输入,并按照步骤5.1.2和步骤5.1.3的过程进行处理,从而依次经过所述特征提取网络f输出最终的特征图F并输入所述全连接层fc中,获得属于两种分类的权值,从而完成特征提取;
步骤5.2、创建位置检测网络g,得出输入图像x中目标最可能存在区域的位置坐标;
步骤5.2.1、位置检测网络g的结构为双层全连接层:
步骤5.2.2、将所述特征图F输入所述双层全连接层,并使用Tanh函数激活,从而输出位置信息(tx,ty,tl);
步骤5.2.3、利用式(1)得到输入图像x中的最可能的目标位置的左上角坐标(tx(left),ty(left))和右下角坐标(tx(right),ty(right)):
步骤5.2.4、利用式(2)可得到坐标连续函数M(·):
M(·)=[h(x-tx(left))-h(x-tx(right))]·[h(y-ty(left))-h(y-ty(right))] (2)
式(2)中,h()表示逻辑回归函数;
步骤5.3、构建基于注意力调节机制的perturb神经网络模型,使用特征提取网络f以及位置检测网络g对输入图像x进行注意力聚焦;
步骤5.3.1、设定输入图像x的注意力聚焦共执行A次,定义当前执行次数为a,并初始化a=1;定义并初始化为第a次输入图像xa=x;
步骤5.3.2、将第a次输入图像xa输入特征提取网络f中,得到第a级特征图Fa,所述第a级特征图Fa经过所述位置检测网络g,得到目标可能存在的位置特征并根据位置特征由式(1)、式(2)、式(3)得到第a个裁剪后的输入图像后,再将第a个裁剪后的输入图像放大到输入图像xa的尺寸,从而得到第a+1次输入图像xa+1;
步骤5.3.3、判断a+1=A是否成立,若成立,则表示第a+1次输入图像xa+1是最终识别的图像M,否则,将a+1赋值给a,xa=xa+1后,返回步骤步骤5.3.2;
步骤5.3.4、将最终识别的图像M输入所述特征提取网络f中,并得到最终的特征图后并输入所述全连接层fc中,得到的结果再经过SCNs分类器中获得输入图像x的分类结果z,并作为perturb神经网络模型的输出结果;
步骤6、构建多层次识别网络:
步骤6.1、所述第一级训练集合T1中将剩余所有图像,依次作为输入图像并赋值给x,重复步骤5.1.2-步骤5.3.4,从而训练出第一级模型mo1,并得到所述第一级训练集合T1中所有图像最终的特征图及分类结果;
由所述第一级训练集合T1中所有图像最终的特征图构成的特征图集并根据分类结果的不同,将特征图集映射为特征空间向量 代表特征空间向量中属于有销子类别的特征图向量,代表特征空间向量中属于销子缺失类别的特征图向量;
步骤6.2.1由测试集合T2测试得到所述perturb神经网络模型的认知精度为β,定义类别sx∈{1,2},sx=1代表有销子,sx=2代表销子缺失;
步骤6.2.2、从所述第一级训练集合T1中任意选取一张图像作为输入图像x′并输入第一级模型mo1中,得到输入图像x′的最终的特征图及分类结果z′;
步骤6.2.3、利用式(5)得到所述输入图像x′的可接受度Ax′:
式(5)中,mβ是与perturb神经网络模型有关的常数;
步骤6.3、判断所述可接受度Ax′大于所设定的阈值是否成立,若成立,则表示所述输入图像x′适用于认知精度β的第一级模型mo1,并返回步骤6.2.2,否则,将输入图像x′放入第二级训练集T3中;直到第一级训练集合T1中所有图像都测试完成,并得到最终的第二级训练集T3;
步骤6.4、将最终的第二级训练集T3赋值给第一级训练集T1,重复步骤6.1-步骤6.4,得到第二级销子检测模型mo2和最终的第三级训练集T4;
同理,将最终的第i级训练集赋值给第i-1级训练集,重复步骤6.1-步骤6.4,得到第i级销子检测模型moi和第i+1级训练集,当直到i=M时,表示M级销子检测模型训练完成,并执行步骤7;
步骤7、将测试集合T2作为待识别目标集合,从测试集合T2中选取一个图像作为待识别目标,利用M级销子检测模型分别对待识别目标进行检测,在每一级销子检测模型检测的同时,利用霍夫梯度圆检测方法对待识别目标进行检测,从而将每一级销子检测模型的检测结果与霍夫梯度圆检测方法的检测结果合并为当前级检测的最终结果;进而得到M级检测的最终结果,记为{Y1,Y2,…,Yi,…,YM},Yi表示第i级销子检测模型的检测结果与霍夫梯度圆检测方法的检测结果合并后的第i级检测的最终结果;i∈[1,M];
步骤8、构建基于Sugeno模糊积分的多模型特征融合判别;
步骤8.1、利用式(6)计算参数λ:
式(6)中,gi表示第i级销子检测模型对于类别sx的重要性;
步骤8.2、利用式(7)计算待识别目标集合T2对第i级销子检测模型模糊密度gλ(T2i):
gλ(T2i)=gi+gλ(T2i-1)+λ×gigλ(T2i-1) (7)
式(7)中,gλ(T2i-1)表示第i-1级销子检测模型的模糊密度;当i=1时,令gλ(T2i-1)=g1;
与已有技术相比,本发明的有益效果体现在:
1、本发明相比销子的常规特征检测方法以及人工观察方法,通过降低模型运算量,使用注意力聚焦和多级模型特征融合判别方法,解决了销子缺失检测费时费力,或检测不准的问题,提高了检测精度,加快了检测速度,并且具有较强的鲁棒性,能够在复杂背景下识别销子状态,满足了准确化快速化的实际需求。
2、本发明使用随机生成的大量噪声图代替常规神经网络所需要训练的滤波器,利用其线性组合作为提取出的特征,大大减小了所需计算量,克服了常规方法识别速度较慢的缺点,具有很好的实时性,降低了销子状态检测工作的后期工作量,提高了工作效率。
3、本发明利用注意力机制的多尺度检测方式,在输入图像基础上,利用注意力聚焦最可能的位置,并切下继续聚焦,经过多次操作,将微小的销子放到足够大,大大缩小输入图像的冗余部分,强化显示销子特征,提高了销子状态检测的准确率,加强了实用性;
4、本发明利用梯度检测的方式对注意力机制聚焦的区域进行二次检测,对销子及销子周边的常见特征,例如螺母的六边形、圆形末端、销子缺失形成的空洞进行检测,并将检测结果作为子分类器特征的一部分进行模糊积分,在聚焦不准时减小特征图的权重,防止误识别,提高了工作效率。
5、本发明使用可区分性测度指标对训练样本进行分组,销子由于插在螺栓上,并且体积微小,受到光照和角度影响形态差异较大,单一特征不足以完全区分,所以本发明使用分组的训练样本训练出多级模型进行检测,第一级模型训练完成后,将识别效果不佳的图片拿出制作成新的数据集,用于训练第二级模型,同理获得更高级模型,每级模型配合梯度检测方式组合生成分类器特征,进行模糊积分,获得最终检测结果,从而提高了销子状态检测的精度,加强实用性。
附图说明
图1为本发明中特征检测网络结构图;
图2为本发明中位置检测网络结构图;
图3为本发明整体运行结构图;
图3a为本发明第一级模型运行结构图;
图4为本发明单个模型识别过程中最有可能区域的变化图;
图5a为本发明提取的特征图;
图5b为本发明梯度圆检测结果图。
具体实施方式
本实施例中,一种基于注意力机制的输电塔螺栓销子缺失检测方法是按如下步骤进行:
步骤1、对输电塔销子图像集进行预处理,得到预处理后的销子图像集,本实施例中,先使用随机裁剪将图像转变为正方形,再将图像统一使用双线性插值重置为448*448大小,再进行去抖防噪处理,最后为了便于收敛,将图像统一归一化;
步骤2、使用生成对抗网络GANs对所述预处理后的销子图像集进行扩充处理,得到扩充后的销子图像集,生成的样本不一定存在销子或符合预期,需要对样本进行人工筛选,筛选后的样本集与原始样本集混合形成有效样本集,本实例中原始样本100幅,选择出来的生成样本500幅;
步骤3、将所述扩充后的销子图像集进行分类,为了模拟无人机拍摄插销的各种角度偏移,将有效样本集中每个样本每次顺时针旋转30°,总共扩充为原来的12倍。分为有销子图像集N1和销子缺失图像集N2;
步骤4、得益于注意力机制的尺度缩小设置,训练图像将不必进行人工标注,是一种无监督学习。将所述有销子图像集N1分为有销子图像训练集和有销子图像测试集;将所述销子缺失图像集N2分为销子缺失图像训练集和销子缺失图像测试集;
将所述有销子图像训练集和销子缺失图像训练集合并为第一级训练集合T1;
将所述有销子图像测试集和销子缺失图像测试集合并合并为测试集合T2;
本实施例中T1包含图像5760张,T2包含1440张。
步骤5、构建基于注意力机制的perturb神经网络模型,在本实施例中,基于注意力机制的网络需要进行多种尺度的训练,本发明在perturb神经网络基础上引入注意力机制,以全局图像为感受野的同时,获得不同尺度的训练结果。
如图3a的模型1所示:训练时每一部分输入图像首先进入特征提取网络Perturbnetwork,获得提取出的特征图,再输入位置检测网络Atn network,进行位置拟合,根据检测结果和标签进行损失传递,之后根据位置拟合网络输出利用式(1)、式(2)、式(3)获得裁剪坐标,在输入图像上按坐标裁剪出目标区域图像,进入下一级训练,反复两次,获得最后一级识别结果。
步骤5.1、构建特征提取网络f,用于网络特征提取,其网络结构如图1所示;
步骤5.1.1、基于Resnet18卷积神经网络的结构设计所述特征提取网络f,所述特征提取网络f由一个直连块d、四个跳连块D以及全连接层fc级联组成,且各部分之间有一个池化层P,所述直连块d依次包含扰动层、卷积层、bn层和激活层,任意一个跳连块D由两个直连块级联构成,并采用局部跳层方式连接;
所述特征提取网络f的输入层为所述直连块d的输入层;所述直连块d的输出层与第1个池化层P1连接,所述第一池化层P1与第1个跳连块D1的输入层连接,并采用跳层连接结构,即:所述第一池化层P1一方面与第1个跳连块D1的输入层连接,并经过所述第1个跳连块D1中的两个直连块,与第2个池化层P2连接,另一方面跳过第1个跳连块D1直接与第2个池化层P2连接;
同理,第i个池化层Pi一方面与第i个跳连块Di的输入层连接,并经过第i个跳连块Di中的两个直连块,与第i+1个池化层Pi+1连接,另一方面跳过i个跳连块Di直接与第i+1个池化层Pi+1连接;i=2,3,4;
第5个池化层P5与全连接层fc相连;
在本实例中,输入图像x的尺寸为448*448,通道为16,特征提取网络结构图如图1所示,除第一层外共四个跳连块,各个块的噪声图数量为(64,64)、(64,128)、(128,256)、(256,512),第一层设定噪声图数量m为64,所有卷积层卷积核大小都为1,实际上并没有卷积操作;除第一层外,所有层步长皆为2;
步骤5.1.2、从所述第一级训练集合T1中选取输入图像x,输入所述直连块d的扰动层,从而根据所述输入图像x的尺寸和通道,定义噪声图集,再使用uniform()函数对噪声图集进行随机初始化,并获得初始噪声图集N,N包含t列,每列有n个噪声图,其中第j列噪声图记为Nj,且 表示第j列第n个噪声图;j∈[1,t];
步骤5.1.3、在所述直连块d的扰动层将输入图像x依次与第j列的m个噪声图Ni叠加,生成m个扰动图后再通过所述直连块d的卷积层进行线性组合,然后经过所述直连块d的激活层中的relu函数激活后得到第j列噪声图所提取出的特征图,从而由所述直连块d对t列的噪声图进行处理后,得到所述直连块d提取出的特征图,并输入第一池化层P1后,得到输入特征图 表示输入图像x经过第t列噪声图得到的特征图;
步骤5.1.4、将所述输入特征图X1作为第1个跳连块D1的输入,并按照步骤5.1.2和步骤5.1.3的过程进行处理,从而依次经过所述特征提取网络f输出最终的特征图F并输入所述全连接层fc中,获得属于两种分类的权值,从而完成特征提取;
步骤5.2、创建位置检测网络g,得出输入图像x中目标最可能存在区域的位置坐标;
步骤5.2.1、位置检测网络g的结构为双层全连接层,如图1所示,每层节点1024个,输入是512*14*14的特征图,输出为三个位置相关值:
步骤5.2.2、将所述特征图F输入所述双层全连接层,并使用Tanh函数激活,从而输出位置信息(tx,ty,tl),其中,(tx,ty)设定为最可能区域的中心坐标,tl设定为最可能区域边长的一半;
步骤5.2.3、利用式(1)得到输入图像x中的最可能的目标位置的左上角坐标(tx(left),ty(left))和右下角坐标(tx(right),ty(right)):
步骤5.2.4、利用式(2)可得到坐标连续函数M(·):
M(·)=[h(x-tx(left))-h(x-tx(right))]·[h(y-ty(left))-h(y-ty(right))] (2)
式(2)中,h()表示逻辑回归函数;
步骤5.3、构建基于注意力调节机制的perturb神经网络模型,使用特征提取网络f以及位置检测网络g对输入图像x进行注意力聚焦;
步骤5.3.1、设定输入图像x的注意力聚焦共执行A次,定义当前执行次数为a,并初始化a=1;定义并初始化为第a次输入图像xa=x,在本实例中,网络的注意力聚焦一共执行三次,图裁剪两次;
步骤5.3.2、将第a次输入图像xa输入特征提取网络f中,得到第a级特征图Fa,所述第a级特征图Fa经过所述位置检测网络g,得到目标可能存在的位置特征并根据位置特征由式(1)、式(2)、式(3)得到第a个裁剪后的输入图像后,再将第a个裁剪后的输入图像放大到输入图像xa的尺寸,从而得到第a+1次输入图像xa+1,在本实例中,每次注意力聚焦裁剪下来的图像尺寸为224*224,即缩小为原来的一半;
步骤5.3.3、判断a+1=A是否成立,若成立,则表示第a+1次输入图像xa+1是最终识别的图像M,否则,将a+1赋值给a,xa=xa+1后,返回步骤步骤5.3.2;
步骤5.3.4、将最终识别的图像M输入所述特征提取网络f中,并得到最终的特征图后并输入所述全连接层fc中,得到的结果再经过SCNs分类器中获得输入图像x的分类结果z,并作为perturb神经网络模型的输出结果,得到两次裁剪的的图像M后,对图像M进行检测,并将图像M检测的结果作为输入图像x的识别结果;
步骤6、构建多层次识别网络:
步骤6.1、所述第一级训练集合T1中将剩余所有图像,依次作为输入图像并赋值给x,重复步骤5.1.2-步骤5.3.4,从而训练出第一级模型mo1,并得到所述第一级训练集合T1中所有图像最终的特征图及分类结果;
由所述第一级训练集合T1中所有图像最终的特征图构成的特征图集并根据分类结果的不同,将特征图集映射为特征空间向量 代表特征空间向量中属于有销子类别的特征图向量,代表特征空间向量中属于销子缺失类别的特征图向量;
步骤6.2、建立最终的特征图的评测指标,销子存在状态由于角度、亮度或者遮挡等问题可能发生很大变化,扰动模型藉由噪声图叠加方式作为提取到的特征,本身训练较为困难,单一模型不易提取到有效特征,需要建立多模型特征融合判别,使模型效果提高,为此需要为特征空间及其分类准则提供量化依据,在特征空间建模的信息论与销子存在认知结果评测的认知论之间构建等价的熵形式测度关系;
步骤6.2.1由测试集合T2测试得到所述perturb神经网络模型的认知精度为β,定义类别sx∈{1,2},sx=1代表有销子,sx=2代表销子缺失;
步骤6.2.2、从所述第一级训练集合T1中任意选取一张图像作为输入图像x′并输入第一级模型mo1中,得到输入图像x′的像最终的特征图及分类结果z′;
步骤6.2.3、利用式(5)得到所述输入图像x′的可接受度Ax′:
式(5)中,mβ是与perturb神经网络模型有关的常数;
步骤6.3、判断所述可接受度Ax′大于所设定的阈值是否成立,若成立,则表示所述输入图像x′适用于认知精度β的第一级模型mo1,并返回步骤6.2.2,否则,将输入图像x′放入第二级训练集T3中;直到第一级训练集合T1中所有图像都测试完成,并得到最终的第二级训练集T3;
本实施例中,当计算得出的Ax'>0.74时。可以视为此图像对于本级网络适用,若小于则视为不适用,需要进入下一级数据集继续训练,如图3所示;
步骤6.4、将最终的第二级训练集T3赋值给第一级训练集T1,重复步骤6.1-步骤6.4,得到第二级销子检测模型mo2和最终的第三级训练集T4;
同理,将最终的第i级训练集赋值给第i-1级训练集,重复步骤6.1-步骤6.4,得到第i级销子检测模型moi和第i+1级训练集,当直到i=M时,表示M级销子检测模型训练完成,并执行步骤7,在本实例中,M=3,一共训练三个模型参与检测;
步骤7、将测试集合T2作为待识别目标集合,从测试集合T2中选取一个图像作为待识别目标,利用M级销子检测模型分别对待识别目标进行检测,在每一级销子检测模型检测的同时,利用霍夫梯度圆检测方法对待识别目标进行检测,从而将每一级销子检测模型的检测结果与霍夫梯度圆检测方法的检测结果合并为当前级检测的最终结果;进而得到M级检测的最终结果,记为{Y1,Y2,…,Yi,…,YM},Yi表示第i级销子检测模型的检测结果与霍夫梯度圆检测方法的检测结果合并后的第i级检测的最终结果;i∈[1,M];
在本施例中,模型结构如图3所示,每个模型的输出都由神经网络全连接层的输出节点权值和梯度圆检测结果共同构成,三个模型输出通过模糊积分得到最终输出结果,梯度圆检测结果和模型提取的特征图如图5b和图5a所示。
步骤8、构建基于Sugeno模糊积分的多模型特征融合判别;
步骤8.1、利用式(6)计算参数λ:
式(6)中,gi表示第i级销子检测模型对于类别sx的重要性;
步骤8.2、利用式(7)计算待识别目标集合T2对第i级销子检测模型模糊密度gλ(T2i):
gλ(T2i)=gi+gλ(T2i-1)+λ×gigλ(T2i-1) (7)
式(7)中,gλ(T2i-1)表示第i-1级销子检测模型的模糊密度;当i=1时,令gλ(T2i-1)=g1;在本实施例中,使用的模糊积分各参数如表1:
表1
类别 | g<sub>1</sub> | g<sub>2</sub> | g<sub>3</sub> | λ |
值 | 0.3450 | 0.3349 | 0.3249 | -0.0149 |
Claims (1)
1.一种基于注意力机制的输电塔螺栓销子缺失的智能检测方法,其特征是按如下步骤进行:
步骤1、对输电塔销子图像集进行预处理,得到预处理后的销子图像集;
步骤2、使用生成对抗网络GANs对所述预处理后的销子图像集进行扩充处理,得到扩充后的销子图像集;
步骤3、将所述扩充后的销子图像集进行分类,分为有销子图像集N1和销子缺失图像集N2;
步骤4、将所述有销子图像集N1分为有销子图像训练集和有销子图像测试集;将所述销子缺失图像集N2分为销子缺失图像训练集和销子缺失图像测试集;
将所述有销子图像训练集和销子缺失图像训练集合并为第一级训练集合T1;
将所述有销子图像测试集和销子缺失图像测试集合并合并为测试集合T2;
步骤5、构建基于注意力机制的perturb神经网络模型:
步骤5.1、构建特征提取网络f,用于网络特征提取;
步骤5.1.1、基于Resnet18卷积神经网络的结构设计所述特征提取网络f,所述特征提取网络f由一个直连块d、四个跳连块D以及全连接层fc级联组成,且各部分之间有一个池化层P,所述直连块d依次包含扰动层、卷积层、bn层和激活层,任意一个跳连块D由两个直连块级联构成,并采用局部跳层方式连接;
所述特征提取网络f的输入层为所述直连块d的输入层;所述直连块d的输出层与第1个池化层P1连接,所述第一池化层P1与第1个跳连块D1的输入层连接,并采用跳层连接结构,即:所述第一池化层P1一方面与第1个跳连块D1的输入层连接,并经过所述第1个跳连块D1中的两个直连块,与第2个池化层P2连接,另一方面跳过第1个跳连块D1直接与第2个池化层P2连接;
同理,第i个池化层Pi一方面与第i个跳连块Di的输入层连接,并经过第i个跳连块Di中的两个直连块,与第i+1个池化层Pi+1连接,另一方面跳过i个跳连块Di直接与第i+1个池化层Pi+1连接;i=2,3,4;
第5个池化层P5与全连接层fc相连;
步骤5.1.2、从所述第一级训练集合T1中选取输入图像x,输入所述直连块d的扰动层,从而根据所述输入图像x的尺寸和通道,定义噪声图集,再使用uniform()函数对噪声图集进行随机初始化,并获得初始噪声图集N,N包含t列,每列有n个噪声图,其中第j列噪声图记为Nj,且 表示第j列第n个噪声图;j∈[1,t];
步骤5.1.3、在所述直连块d的扰动层将输入图像x依次与第j列的m个噪声图Ni叠加,生成m个扰动图后再通过所述直连块d的卷积层进行线性组合,然后经过所述直连块d的激活层中的relu函数激活后得到第j列噪声图所提取出的特征图,从而由所述直连块d对t列的噪声图进行处理后,得到所述直连块d提取出的特征图,并输入第一池化层P1后,得到输入特征图 表示输入图像x经过第t列噪声图得到的特征图;
步骤5.1.4、将所述输入特征图X1作为第1个跳连块D1的输入,并按照步骤5.1.2和步骤5.1.3的过程进行处理,从而依次经过所述特征提取网络f输出最终的特征图F并输入所述全连接层fc中,获得属于两种分类的权值,从而完成特征提取;
步骤5.2、创建位置检测网络g,得出输入图像x中目标最可能存在区域的位置坐标;
步骤5.2.1、位置检测网络g的结构为双层全连接层:
步骤5.2.2、将所述特征图F输入所述双层全连接层,并使用Tanh函数激活,从而输出位置信息(tx,ty,tl);
步骤5.2.3、利用式(1)得到输入图像x中的最可能的目标位置的左上角坐标(tx(left),ty(left))和右下角坐标(tx(right),ty(right)):
步骤5.2.4、利用式(2)可得到坐标连续函数M(·):
M(·)=[h(x-tx(left))-h(x-tx(right))]·[h(y-ty(left))-h(y-ty(right))] (2)
式(2)中,h()表示逻辑回归函数;
步骤5.3、构建基于注意力调节机制的perturb神经网络模型,使用特征提取网络f以及位置检测网络g对输入图像x进行注意力聚焦;
步骤5.3.1、设定输入图像x的注意力聚焦共执行A次,定义当前执行次数为a,并初始化a=1;定义并初始化为第a次输入图像xa=x;
步骤5.3.2、将第a次输入图像xa输入特征提取网络f中,得到第a级特征图Fa,所述第a级特征图Fa经过所述位置检测网络g,得到目标可能存在的位置特征并根据位置特征由式(1)、式(2)、式(3)得到第a个裁剪后的输入图像后,再将第a个裁剪后的输入图像放大到输入图像xa的尺寸,从而得到第a+1次输入图像xa+1;
步骤5.3.3、判断a+1=A是否成立,若成立,则表示第a+1次输入图像xa+1是最终识别的图像M,否则,将a+1赋值给a,xa=xa+1后,返回步骤步骤5.3.2;
步骤5.3.4、将最终识别的图像M输入所述特征提取网络f中,并得到最终的特征图后并输入所述全连接层fc中,得到的结果再经过SCNs分类器中获得输入图像x的分类结果z,并作为perturb神经网络模型的输出结果;
步骤6、构建多层次识别网络:
步骤6.1、所述第一级训练集合T1中将剩余所有图像,依次作为输入图像并赋值给x,重复步骤5.1.2-步骤5.3.4,从而训练出第一级模型mo1,并得到所述第一级训练集合T1中所有图像最终的特征图及分类结果;
由所述第一级训练集合T1中所有图像最终的特征图构成的特征图集并根据分类结果的不同,将特征图集映射为特征空间向量 代表特征空间向量中属于有销子类别的特征图向量,代表特征空间向量中属于销子缺失类别的特征图向量;
步骤6.2.1由测试集合T2测试得到所述perturb神经网络模型的认知精度为β,定义类别sx∈{1,2},sx=1代表有销子,sx=2代表销子缺失;
步骤6.2.2、从所述第一级训练集合T1中任意选取一张图像作为输入图像x′并输入第一级模型mo1中,得到输入图像x′的最终的特征图及分类结果z′;
步骤6.2.3、利用式(5)得到所述输入图像x′的可接受度Ax′:
式(5)中,mβ是与perturb神经网络模型有关的常数;
步骤6.3、判断所述可接受度Ax′大于所设定的阈值是否成立,若成立,则表示所述输入图像x′适用于认知精度β的第一级模型mo1,并返回步骤6.2.2,否则,将输入图像x′放入第二级训练集T3中;直到第一级训练集合T1中所有图像都测试完成,并得到最终的第二级训练集T3;
步骤6.4、将最终的第二级训练集T3赋值给第一级训练集T1,重复步骤6.1-步骤6.4,得到第二级销子检测模型mo2和最终的第三级训练集T4;
同理,将最终的第i级训练集赋值给第i-1级训练集,重复步骤6.1-步骤6.4,得到第i级销子检测模型moi和第i+1级训练集,当直到i=M时,表示M级销子检测模型训练完成,并执行步骤7;
步骤7、将测试集合T2作为待识别目标集合,从测试集合T2中选取一个图像作为待识别目标,利用M级销子检测模型分别对待识别目标进行检测,在每一级销子检测模型检测的同时,利用霍夫梯度圆检测方法对待识别目标进行检测,从而将每一级销子检测模型的检测结果与霍夫梯度圆检测方法的检测结果合并为当前级检测的最终结果;进而得到M级检测的最终结果,记为{Y1,Y2,…,Yi,…,YM},Yi表示第i级销子检测模型的检测结果与霍夫梯度圆检测方法的检测结果合并后的第i级检测的最终结果;i∈[1,M];
步骤8、构建基于Sugeno模糊积分的多模型特征融合判别;
步骤8.1、利用式(6)计算参数λ:
式(6)中,gi表示第i级销子检测模型对于类别sx的重要性;
步骤8.2、利用式(7)计算待识别目标集合T2对第i级销子检测模型模糊密度gλ(T2i):
gλ(T2i)=gi+gλ(T2i-1)+λ×gigλ(T2i-1) (7)
式(7)中,gλ(T2i-1)表示第i-1级销子检测模型的模糊密度;当i=1时,令gλ(T2i-1)=g1;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010894523.0A CN112036403B (zh) | 2020-08-31 | 2020-08-31 | 基于注意力机制的输电塔螺栓销子缺失的智能检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010894523.0A CN112036403B (zh) | 2020-08-31 | 2020-08-31 | 基于注意力机制的输电塔螺栓销子缺失的智能检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112036403A true CN112036403A (zh) | 2020-12-04 |
CN112036403B CN112036403B (zh) | 2022-08-19 |
Family
ID=73587541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010894523.0A Active CN112036403B (zh) | 2020-08-31 | 2020-08-31 | 基于注意力机制的输电塔螺栓销子缺失的智能检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112036403B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112561530A (zh) * | 2020-12-25 | 2021-03-26 | 民生科技有限责任公司 | 一种基于多模型融合的交易流水处理方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018195644A (ja) * | 2017-05-15 | 2018-12-06 | 東京エレクトロン株式会社 | 基板搬出方法 |
CN110321616A (zh) * | 2019-06-26 | 2019-10-11 | 国网辽宁省电力有限公司葫芦岛供电公司 | 基于小波变换和注意力模型的三跨杆塔故障诊断方法 |
CN110569762A (zh) * | 2019-08-27 | 2019-12-13 | 许昌许继软件技术有限公司 | 一种基于多级神经网络的销钉脱落检测方法及装置 |
CN110827251A (zh) * | 2019-10-30 | 2020-02-21 | 江苏方天电力技术有限公司 | 一种基于航拍图像的输电线路锁紧销缺陷检测方法 |
-
2020
- 2020-08-31 CN CN202010894523.0A patent/CN112036403B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018195644A (ja) * | 2017-05-15 | 2018-12-06 | 東京エレクトロン株式会社 | 基板搬出方法 |
CN110321616A (zh) * | 2019-06-26 | 2019-10-11 | 国网辽宁省电力有限公司葫芦岛供电公司 | 基于小波变换和注意力模型的三跨杆塔故障诊断方法 |
CN110569762A (zh) * | 2019-08-27 | 2019-12-13 | 许昌许继软件技术有限公司 | 一种基于多级神经网络的销钉脱落检测方法及装置 |
CN110827251A (zh) * | 2019-10-30 | 2020-02-21 | 江苏方天电力技术有限公司 | 一种基于航拍图像的输电线路锁紧销缺陷检测方法 |
Non-Patent Citations (2)
Title |
---|
XIANZHE CHENG ET AL.: "Detection Method Based on Automatic Visual Shape Clustering for Pin-Missing Defect in Transmission Lines", 《IEEE TRANSACTIONS ON INSTRUMENTATION AND MEASUREMENT》 * |
张迪: "基于YOLO V3的输电线路故障检测方法", 《自动化技术与应用》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112561530A (zh) * | 2020-12-25 | 2021-03-26 | 民生科技有限责任公司 | 一种基于多模型融合的交易流水处理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112036403B (zh) | 2022-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109272500B (zh) | 基于自适应卷积神经网络的织物分类方法 | |
CN110222701B (zh) | 一种桥梁病害自动识别方法 | |
Jiang et al. | A machine vision-based realtime anomaly detection method for industrial products using deep learning | |
CN106980858A (zh) | 一种语言文本检测与定位系统及应用该系统的语言文本检测与定位方法 | |
CN111985499B (zh) | 一种基于计算机视觉的高精度桥梁表观病害识别方法 | |
CN110647830B (zh) | 基于卷积神经网络和高斯混合模型的轴承故障诊断方法 | |
CN110703057A (zh) | 基于数据增强和神经网络的电力设备局部放电诊断方法 | |
CN112762362A (zh) | 基于卷积神经网络的水下管道泄漏声发射检测方法 | |
CN111860106B (zh) | 一种无监督的桥梁裂缝识别方法 | |
CN111161224A (zh) | 基于深度学习的铸件内部缺陷分级评估系统及方法 | |
CN114581764B (zh) | 基于深度学习算法的地下结构裂纹病害判别方法 | |
CN115673596B (zh) | 一种基于Actor-Critic强化学习模型的焊接异常实时诊断方法 | |
CN114429152A (zh) | 基于动态指数对抗性自适应的滚动轴承故障诊断方法 | |
CN114169374A (zh) | 一种斜拉桥斜拉索损伤识别方法及电子设备 | |
CN112036403B (zh) | 基于注意力机制的输电塔螺栓销子缺失的智能检测方法 | |
CN117541534A (zh) | 一种基于无人机和CNN-BiLSTM模型的输电线路巡检方法 | |
CN115587290A (zh) | 基于变分自编码生成对抗网络的航空发动机故障诊断方法 | |
CN114139639B (zh) | 一种基于自步邻域保持嵌入的故障分类方法 | |
CN116012310A (zh) | 基于线性残差注意力的跨海大桥桥墩表面裂缝检测方法 | |
CN111047476A (zh) | 基于rbf神经网络的大坝结构安全监控精确预测方法及系统 | |
CN114462717A (zh) | 一种基于改进gan与lstm的小样本气体浓度预测方法 | |
CN104504265A (zh) | 一种在役桥梁监测信息安全评估的方法 | |
CN115082713B (zh) | 引入空间对比信息的目标检测框提取方法、系统及设备 | |
CN115311611A (zh) | 一种用于装配式建筑预制构件生产的钢筋计数方法 | |
CN113724233B (zh) | 基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |