CN113724233B - 基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法 - Google Patents
基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法 Download PDFInfo
- Publication number
- CN113724233B CN113724233B CN202111025606.7A CN202111025606A CN113724233B CN 113724233 B CN113724233 B CN 113724233B CN 202111025606 A CN202111025606 A CN 202111025606A CN 113724233 B CN113724233 B CN 113724233B
- Authority
- CN
- China
- Prior art keywords
- power transformation
- transformation equipment
- image
- appearance
- defect
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000007547 defect Effects 0.000 title claims abstract description 208
- 238000001514 detection method Methods 0.000 title claims abstract description 66
- 230000004927 fusion Effects 0.000 title claims abstract description 29
- 238000005516 engineering process Methods 0.000 title claims abstract description 18
- 238000013526 transfer learning Methods 0.000 title claims abstract description 16
- 230000009466 transformation Effects 0.000 claims abstract description 167
- 238000012549 training Methods 0.000 claims abstract description 72
- 238000000034 method Methods 0.000 claims abstract description 18
- 230000006870 function Effects 0.000 claims description 25
- 230000008929 regeneration Effects 0.000 claims description 18
- 238000011069 regeneration method Methods 0.000 claims description 18
- 238000000605 extraction Methods 0.000 claims description 14
- 238000007781 pre-processing Methods 0.000 claims description 12
- 238000010276 construction Methods 0.000 claims description 8
- 238000012544 monitoring process Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000013135 deep learning Methods 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 238000013479 data entry Methods 0.000 claims description 5
- JEIPFZHSYJVQDO-UHFFFAOYSA-N iron(III) oxide Inorganic materials O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 claims description 4
- 238000013508 migration Methods 0.000 claims description 4
- 230000005012 migration Effects 0.000 claims description 4
- 238000013256 Gubra-Amylin NASH model Methods 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 230000001105 regulatory effect Effects 0.000 claims description 3
- 238000000638 solvent extraction Methods 0.000 claims description 2
- 230000001172 regenerating effect Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 230000007797 corrosion Effects 0.000 description 2
- 238000005260 corrosion Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003472 neutralizing effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明涉及基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法,与现有技术相比解决了变电设备外观缺陷检测识别率低的缺陷。本发明包括以下步骤:变电设备外观缺陷图像的获取;变电设备外观缺陷图像的再生成;变电设备外观缺陷检测模型的构建;变电设备外观缺陷检测模型的训练;待检测变电设备图像的获取;待检测变电设备图像缺陷问题的检测。本发明提高了变电设备外观图像缺陷检测的速度和准确率。
Description
技术领域
本发明涉及变电设备技术领域,具体来说是基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法。
背景技术
当前变电巡视模式滞后于大数据、云计算、物联网、移动互联、人工智能、三维BIM等一系列新技术的快速发展。变电设备运维、检修日常工作多采用人工就地操作、手动抄录、现场频繁往返等形式,变电站建设的各类在线监测、辅助监控、巡检机器人等业务系统数据相对独立,综合应用程序不高。而随着深度学习飞速发展及其在分类识别方面的优异性能,使其在电力智能巡检领域得到广泛应用。
但是样本的稀缺仍是将深度学习引入变电设备智能巡检中的一大障碍,针对特定场景,收集到大量带有标注的可用样本非常困难;同时,变电站所处的环境非常复杂,变电所设备缺陷中含有许多非刚性缺陷,如设备部件表面油污、地面油污、金属腐蚀等。在不同的场景中,属于同一类的缺陷在外观和形状上有很大的差异。
因此,针对缺陷设备图像数据集样本较少、变电站图像背景复杂以及电力设备缺陷外观差异大等难点问题,如何准确检测出变电设备外观缺陷已经成为急需解决的技术问题。
发明内容
本发明的目的是为了解决现有技术中变电设备外观缺陷检测识别率低的缺陷,提供一种基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法来解决上述问题。
为了实现上述目的,本发明的技术方案如下:
一种基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法,包括以下步骤:
11)变电设备外观缺陷图像的获取:获取已有的变电设备外观缺陷图像并进行预处理;
12)变电设备外观缺陷图像的再生成:利用图像转换GAN模型对已有的变电设备外观缺陷图像进行样本再生成,用于数据扩增;
13)变电设备外观缺陷检测模型的构建:基于融合并联型注意力技术构建变电设备外观缺陷检测模型;
14)变电设备外观缺陷检测模型的训练:利用小样本多阶段迁移技术对变电设备外观缺陷检测模型进行训练;
15)待检测变电设备图像的获取:获取待检测变电设备图像,并进行预处理;
16)待检测变电设备图像缺陷问题的检测:将预处理后的待检测变电设备图像输入训练后的变电设备外观缺陷检测模型,得到待检测变电设备图像的缺陷问题。
所述变电设备外观缺陷图像的获取包括以下步骤:
21)变电设备外观缺陷图像的获取:从监控视频图像中筛选出外观具有缺陷的变电设备图像,缺陷主要包括设备外观存在裂纹、锈蚀、油污;
22)变电设备外观正常图像的获取:从监控视频图像中筛选出外观正常的变电设备图像,正常变电设备是指设备外观无明显缺陷;
23)变电设备外观图像的预处理:对所采集到的缺陷图像和正常图像进行包括裁剪为预定大小图像、添加高斯噪声、旋转、翻转的预处理操作;
24)变电设备外观图像的分类:对所预处理后的图像按照有无缺陷分类并组合成变电设备外观缺陷图像数据集D和变电设备外观正常图像数据集N。
所述变电设备外观缺陷图像的再生成包括以下步骤:
31)变电设备外观缺陷图像再生成模型的构建:使用Pytorch深度学习框架搭建CycleGAN模型,并在CycleGAN网络的基础上添加两个注意力模块AD和AN,其中AD为N转换为D时使用的注意力模块,AN为D转换为N时使用的注意力模块;
32)数据输入:将变电设备外观缺陷图像数据集D和变电设备外观正常图像N输入变电设备外观缺陷图像再生成模型进行训练;
33)变电设备外观缺陷图像再生成模型的训练:迭代训练变电设备外观缺陷图像再生成模型并保存其参数;
34)通过已训练好的变电设备外观缺陷图像再生成模型来生成变电设备外观缺陷图像,并将增强的变电设备外观缺陷图像与原来的D结合在一起,组成新的变电设备外观缺陷图像数据集D。
所述变电设备外观缺陷检测模型的构建包括以下步骤:
41)构建变电设备外观缺陷检测模型的第一层为缺陷特征提取模块:设定缺陷特征提取模块中骨干网络CSPDarknet53结合了CSPNet和Darknet53,利用残差网络来进行深层特征的提取;变电设备外观缺陷图像经过CSPDarknet53提取特征后,得到缺陷特征张量;
42)构建变电设备外观缺陷检测模型的第二层为多尺度特征融合模块:设定多尺度特征融合模块首先搭建SPP模块,池化大小分别为:1×1,5×5,9×9,13×13;然后搭建PANet特征金字塔模块,并在每个Concat组件之后加入PCBAM注意力模块,提升模型对局部鉴别性特征的提取;深层和浅层的缺陷特征张量经过多尺度特征融合模块后,得到两者融合后的多尺度语义特征;
43)构建变电设备外观缺陷检测模型的第三层为缺陷预测模块:设定缺陷预测模块中搭建三个输出大小分别为13×13、26×26和52×52的预测分支;同时采用Focal Loss函数改进模型中置信度损失的交叉熵函数,Focal Loss函数表达式如下所示:
式中:p为激活函数Sigmoid的输出值;γ≥0,为聚焦参数,取γ=2;为调节因子;0≤α≤1,为类别权重因子,取α=0.25;γ和α为固定值,不参与训练;y为标签值。
所述变电设备外观缺陷检测模型的训练包括以下步骤:
51)数据标注:将新的变电设备外观缺陷图像数据集D中的图像归一化到416×416,并使用Labelimg软件标注,包括:类别、中心点横坐标、中心点纵坐标、目标宽度和目标长度;
52)数据划分:将已有的电力设备图像数据集作为源域,将新的变电设备外观缺陷图像数据集D作为目标域,源域与目标域的类别互不交叉;
53)预训练:从源域中选择K个类别构建任务,从选择的每个类别中,随机选择多个样本作为支持样本进行训练,得到预训练模型;
54)设置训练的超参数:初始学习率为0.001,每个训练批次设置为64,训练的总迭代轮数设置为120epoch,优化算法为SGD;
55)加载预训练模型:将步骤52)中训练好的模型参数进行迁移;
56)变电设备外观缺陷检测模型训练:
将标注好的变电设备外观缺陷图像数据集D(B:64,C:3,H:416,W:416)输入至变电设备外观缺陷检测模型的第一层缺陷特征提取模块,得到缺陷特征张量(C:1024,H:13,W:13);然后再经过多尺度特征融合模块得到三个不同大小的特征张量,分别为(C:256,H:52,W:52),(C:512,H:26,W:26),(C:1024,H:13,W:13);最后经过预测模块输出三个不同的预测数据,包括:类别、置信度、预测框坐标;
57)通过损失函数对张量数据相对于Groundtruth进行计算,并经过反向传播求取梯度,进行权重更新;
58)通过循环步骤56)和步骤57),直至损失函数降低至较小值,即训练完成,保存训练好的变电设备外观缺陷检测模型参数。
所述变电设备外观缺陷图像再生成模型的训练包括以下步骤:
61)设置训练超参数:初始学习率为0.001,每个训练批次设置为16,训练的总迭代轮数设置为140epoch,优化算法为SGD;
62)数据输入:从正常变电设备图像数据集N中进行随机抽取m个正常数据样本X={x1,x2,,,xm},从变电设备外观缺陷图像数据集D中进行随机抽取m个正常数据样本Y={y1,y2,,,ym};
63)迭代训练:最小化判别损失以及循环一致性损失更新模型参数,损失函数为:
Ltotal=LGAN(F,DY,X,Y)+LGAN(G,DX,X,Y)+λLcyc(F,G,X,Y)
其中Ltotal为总损失,LGAN为X到Y或Y到X的生成判别损失,Lcyc为循环一致性损失;
64)通过循环步骤62)和步骤63),形成博弈学习模式,最终当判别器无法判断输入样本的来源时,训练达到稳定状态,得到一个最优的生成器参数。
有益效果
本发明的基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法,与现有技术相比提高了变电设备外观图像缺陷检测的速度和准确率。其优点主要体现在以下几点:
(1)本发明以变电设备的裂纹、锈蚀、油污、模糊等典型外观缺陷为研究对象,针对缺陷设备图像数据集样本较少、变电站图像背景复杂等问题,实现变电设备外观图像缺陷检测。
(2)本发明采用CycleGAN模型将正常变电设备外观图像生成为相应的缺陷图像,实现变电设备外观缺陷图像的再生成,以应对数据集样本较少的问题。同时考虑到变电站图像背景复杂的问题,在CycleGAN模型中加入注意力机制,以侧重于对变电设备的转换而忽略背景的影响。
(3)本发明在YOLOv4的多尺度特征融合模块中加入PCBAM模块,有助于模型更加聚焦变电设备关键缺陷特征而非复杂背景特征,以解决变电设备外观缺陷图像背景复杂、缺陷差异较大的问题。
(4)本发明采用Focal Loss函数改进模型中置信度损失的交叉熵函数,有助于模型均衡学习到所有类别的信息,解决变电设备图像正负样本分布不平衡问题。
(5)本文明采用多阶段的小样本迁移学习方式训练变电设备外观图像缺陷检测模型,有助于模型中特征提取模块的卷积层能够充分训练,使模型获得具有泛化性的训练结果。
附图说明
图1为本发明的方法顺序图;
图2为本发明所涉及基于注意力机制的对抗生成网络结构图;
图3为本发明所涉及小样本迁移学习过程图。
图4a、图4b和图4c为利用本发明所述方法检测出的变电设备外观缺陷图。
具体实施方式
为使对本发明的结构特征及所达成的功效有更进一步的了解与认识,用以较佳的实施例及附图配合详细的说明,说明如下:
如图1所示,本发明所述的一种基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法,包括以下步骤:
第一步,变电设备外观缺陷图像的获取:获取已有的变电设备外观缺陷图像并进行预处理。
(1)变电设备外观缺陷图像的获取:从监控视频图像中筛选出外观具有缺陷的变电设备图像,缺陷主要包括设备外观存在裂纹、锈蚀、油污;
(2)变电设备外观正常图像的获取:从监控视频图像中筛选出外观正常的变电设备图像,正常变电设备图像是指设备外观无明显缺陷;
(3)变电设备外观图像的预处理:对所采集到的缺陷图像和正常图像进行包括裁剪为预定大小图像、添加高斯噪声、旋转、翻转的预处理操作;
(4)变电设备外观图像的分类:对所预处理后的图像按照有无缺陷分类并组合成变电设备外观缺陷图像数据集D和变电设备外观正常图像数据集N。在实验室环节中,可以将图像集分为用于训练图像转换CycleGAN模型的训练集和用于测试CycleGAN模型的测试集,划分比例为6:4。
第二步,变电设备外观缺陷图像的再生成:利用图像转换GAN模型对已有的变电设备外观缺陷图像进行样本再生成,用于数据扩增。
由于变电站图像背景复杂、变电设备缺陷区域小,在生成图像时,有可能会把跟变电站设备类似的图像一并进行转换,造成转换出来的缺陷图像质量差,因此在CycleGAN网络的基础上引入注意力机制,将变电设备从图像背景中分离出来再送入网络训练,这样网络就可以侧重于对变电设备的转换而忽略背景的影响。
如图2所示,在CycleGAN网络的基础上添加两个注意力网络AD和AN。AD为N转换为D时使用的注意力模块,AN为D转换为N时使用的注意力模块。网络的工作流程为,首先N会通过一个注意力网络AD得到掩膜Na,这个注意力层会把前景凸显出来,背景则忽略掉,这样把N和掩膜Na按位相乘这样就可以得到前景图,然后通过生成器FN→D得到转换之后的前景图,之后再和掩膜Na进行按位相乘的操作去除生成图像的背景。把N和1-Na按位相乘就可以得到背景图,最后把转换之后的前景图和背景图相加就可以得到最终的输出N′,计算公式如下:
N′=Na⊙FN→D(N⊙Na)+(1-Na)⊙N。
所述变电设备外观缺陷图像的再生成具体步骤如下:
(1)变电设备外观缺陷图像再生成模型的构建:使用Pytorch深度学习框架搭建CycleGAN模型,并在CycleGAN网络的基础上添加两个注意力模块AD和AN,其中AD为N转换为D时使用的注意力模块,AN为D转换为N时使用的注意力模块。
(2)数据输入:将变电设备外观缺陷图像数据集D和变电设备外观正常图像N输入变电设备外观缺陷图像再生成模型进行训练。
(3)变电设备外观缺陷图像再生成模型的训练:迭代训练变电设备外观缺陷图像再生成模型并保存其参数。
A1)设置训练超参数:初始学习率为0.001,每个训练批次设置为16,训练的总迭代轮数设置为140epoch,优化算法为SGD;
A2)数据输入:从正常变电设备图像数据集N中进行随机抽取m个正常数据样本X={x1,x2,,,xm},从变电设备外观缺陷图像数据集D中进行随机抽取m个正常数据样本Y={y1,y2,,,ym};
A3)迭代训练:最小化判别损失以及循环一致性损失更新模型参数,损失函数为:
Ltotal=LGAN(F,DY,X,Y)+LGAN(G,DX,X,Y)+λLcyc(F,G,X,Y)
其中Ltotal为总损失,LGAN为X到Y或Y到X的生成判别损失,Lcyc为循环一致性损失;
A4)通过循环步骤A2)和步骤A3),形成博弈学习模式,最终当判别器无法判断输入样本的来源时,训练达到稳定状态,得到一个最优的生成器参数。
(4)通过已训练好的变电设备外观缺陷图像再生成模型来生成变电设备外观缺陷图像,并将增强的变电设备外观缺陷图像与原来的D结合在一起,组成新的变电设备外观缺陷图像数据集D。
第三步,变电设备外观缺陷检测模型的构建:基于融合并联型注意力技术构建变电设备外观缺陷检测模型。
由于变电设备外观缺陷图像的背景复杂、缺陷区域大小不同以及缺陷样本之间存在不平衡,因此,本发明在YOLOv4基础上提出了变电设备外观缺陷检测模型(PCBAM-YOLO)。YOLOv4隶属于One-stage目标检测算法,基于直接回归候选框的相对位置实现物体的定位与分类,具有较优的检测精度和速度,其主要包括特征提取模块、多尺度特征融合模块和预测模块3部分。在特征提取模块中,采用新的骨干网络CSPDarknet53,其结合了CSPNet和Darknet53,利用残差网络来进行深层特征的提取。在多尺度特征融合模块中,SPP作为附加模块以增大感受野,并借鉴PANet的思想,充分利用特征融合,得到表征能力更强的缺陷特征张量。在多尺度预测模块中,继续沿用YOLOv3的预测模块,通过对13×13、26×26和52×52三个特征图中目标进行独立预测,3个尺度特征图分别用来检测大中小3种尺度目标,有效地增强了不同尺度的变电设备缺陷目标的检测效果。
为使模型更加聚焦变电设备关键缺陷特征而非复杂背景特征,本发明在YOLOv4的基础上加入基于CBAM改进的并联型注意力模块PCBAM,其公式为:
Mc(F)=σ(MLP(AvgPool(F))+MLP(MaxPool(F)))
Ms(F)=σ(Conv([AvgPool(F′);MaxPool(F′)]))
首先将原始特征图F同时输入空间注意力模块和通道注意力模块,分别得到空间权重Ms(F)和通道权重Mc(F)。其次,将Ms(F)和Mc(F)分别与输入特征图做点乘得到空间注意力特征图Fs和通道注意力特征图Fc。然后,对原始输入特征F应用3*3卷积以增加感受野、增强特征表征能力,得到特征图Fi。最后,将Fs和Fc相加生成的混合注意力特征图与原始输入特征的卷积结果Fi相加得到最终的特征图Fo。与传统CBAM相比,一方面PCBAM避免了先经过通道注意力模块再经过空间注意力模块后Mc(F)对Ms(F)可能存在的部分权重系数干扰;另一方面PCBAM对原始输入特征进行卷积并直接加权于最终的特征图,在保证丰富的语义信息不丢失的同时增强了输出特征图的表征能力。
同时,损失函数作为深度神经网络对误检样本评判的依据,在很大程度上影响神经网络模型收敛的效果。由于数据集中简单易分的样本与复杂难分的样本之间存在不均衡现象,大量的某一类样本不仅会导致算法难以学习到其他类别样本的信息,还会影响损失函数的梯度更新方向,本发明在检测模型中引入Focal Loss函数设计交叉熵函数,使得模型在训练时更加专注于难分类样本,从而提高变电设备图像缺陷自动定位和识别的精度。
变电设备外观缺陷检测模型的构建具体步骤如下:
(1)构建变电设备外观缺陷检测模型的第一层为缺陷特征提取模块:骨干网络CSPDarknet53结合了CSPNet和Darknet53,利用残差网络来进行深层特征的提取;变电设备外观缺陷图像经过CSPDarknet53提取特征后,得到缺陷特征张量。
(2)构建变电设备外观缺陷检测模型的第二层为多尺度特征融合模块:首先搭建SPP模块,池化大小分别为:1×1,5×5,9×9,13×13;然后搭建PANet特征金字塔模块,并在每个Concat组件之后加入PCBAM注意力模块,提升模型对局部鉴别性特征的提取;深层和浅层的缺陷特征张量经过多尺度特征融合模块后,得到两者融合后的多尺度语义特征。
(3)构建变电设备外观缺陷检测模型的第三层为缺陷预测模块:搭建三个输出大小分别为13×13、26×26和52×52的预测分支;同时采用Focal Loss函数改进模型中置信度损失的交叉熵函数Focal Loss函数表达式如下所示:
式中:p为激活函数Sigmoid的输出值;γ≥0,为聚焦参数,取γ=2;为调节因子;0≤α≤1,为类别权重因子,取α=0.25;γ和α为固定值,不参与训练;y为标签值。
第四步,变电设备外观缺陷检测模型的训练:利用小样本多阶段迁移技术对变电设备外观缺陷检测模型进行训练。
在变电设备外观缺陷检测任务中,传统的基于深度学习的检测方法中的模型训练过程中因为样本数据稀缺而出现过拟合的现象,同时模型迭代收敛困难,这些问题不仅影响了检测模型的性能,也影响了缺陷检测的效率。因此,本发明基于元学习的思想,研究同领域、相近领域或不同领域的特征知识迁移学习方法,利用已经存在的相关任务域中带有标记的数据学习源任务,将其获得的知识应用于变电站设备外观缺陷图像数据的目标域,解决目标域的缺陷检测任务;同时融合数据生成和多阶段小样本迁移学习的训练方法,缓解数据量不足引起的问题,提高训练效率且防止过拟合,从而实现变电站设备缺陷图像的自动、快速定位和识别。如图3所示,在实验室测试环节时,采用小样本迁移学习的方法训练模型,其在训练阶段只要一个或多个已标记的相近领域的训练样本,而无需大量的人力、物力去筛选并且给数据给予样本标签,并将学习到的特征知识迁移到缺陷检测模型中,利用生成的缺陷数据集进行微调,最后测试变电设备外观图像缺陷检测模型的性能。小样本迁移学习的目标旨在充分的使用过去的经验让学习系统能够学习新的任务。
变电设备外观缺陷检测模型的训练具体步骤如下:
(1)数据标注:将新的变电设备外观缺陷图像数据集D中的图像归一化到416×416,并使用Labelimg软件标注,包括:类别、中心点横坐标、中心点纵坐标、目标宽度和目标长度;
(2)数据划分:将已有的电力设备图像数据集作为源域,将新的变电设备外观缺陷图像数据集D作为目标域,源域与目标域的类别互不交叉;
(3)预训练:从源域中选择K个类别构建任务,从选择的每个类别中,随机选择多个样本作为支持样本进行训练,得到预训练模型;
(4)设置训练的超参数:初始学习率为0.001,每个训练批次设置为64,训练的总迭代轮数设置为120epoch,优化算法为SGD;
(5)加载预训练模型:将步骤(2)中训练好的模型参数进行迁移;
(6)变电设备外观缺陷检测模型训练:
将标注好的变电设备外观缺陷图像数据集D(B:64,C:3,H:416,W:416)输入至变电设备外观缺陷检测模型的第一层缺陷特征提取模块,得到缺陷特征张量(C:1024,H:13,W:13);然后再经过多尺度特征融合模块得到三个不同大小的特征张量,分别为(C:256,H:52,W:52),(C:512,H:26,W:26),(C:1024,H:13,W:13);最后经过预测模块输出三个不同的预测数据,包括:类别、置信度、预测框坐标;
(7)通过损失函数对张量数据相对于Groundtruth进行计算,并经过反向传播求取梯度,进行权重更新;
(8)通过循环步骤(6)和步骤(7),直至损失函数降低至较小值,即训练完成,保存训练好的变电设备外观缺陷检测模型参数。
第五步,待检测变电设备图像的获取,获取待检测变电设备图像,并进行预处理。
第六步,待检测变电设备图像缺陷问题的检测:将预处理后的待检测变电设备图像输入训练后的变电设备外观缺陷检测模型,得到待检测变电设备图像的缺陷问题。
在实验室测试环节时,从待检测变电设备图像数据集中随机抽取3幅图像输入模型进行检测,然后可视化检测结果如图4a、图4b和图4c所示,可见检测结果图中变电设备的锈蚀或油污均已被准确检测出。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。
Claims (3)
1.一种基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法,其特征在于,包括以下步骤:
11)变电设备外观缺陷图像的获取:获取已有的变电设备外观缺陷图像并进行预处理;
12)变电设备外观缺陷图像的再生成:利用图像转换GAN模型对已有的变电设备外观缺陷图像进行样本再生成;
13)变电设备外观缺陷检测模型的构建:基于融合并联型注意力技术构建变电设备外观缺陷检测模型;
14)变电设备外观缺陷检测模型的训练:利用小样本多阶段迁移技术对变电设备外观缺陷检测模型进行训练;
15)待检测变电设备图像的获取:获取待检测变电设备图像,并进行预处理;
16)待检测变电设备图像缺陷问题的检测:将预处理后的待检测变电设备图像输入训练后的变电设备外观缺陷检测模型,得到待检测变电设备图像的缺陷问题;
所述变电设备外观缺陷检测模型的训练包括以下步骤:
51)数据标注:将新的变电设备外观缺陷图像数据集D中的图像归一化到416×416,并使用Labelimg软件标注,包括:类别、中心点横坐标、中心点纵坐标、目标宽度和目标长度;
52)数据划分:将已有的电力设备图像数据集作为源域,将新的变电设备外观缺陷图像数据集D作为目标域,源域与目标域的类别互不交叉;
53)预训练:从源域中选择K个类别构建任务,从选择的每个类别中,随机选择多个样本作为支持样本进行训练,得到预训练模型;
54)设置训练的超参数:初始学习率为0.001,每个训练批次设置为64,训练的总迭代轮数设置为120epoch,优化算法为SGD;
55)加载预训练模型:将步骤52)中训练好的模型参数进行迁移;
56)变电设备外观缺陷检测模型训练:
将标注好的变电设备外观缺陷图像数据集D(B:64,C:3,H:416,W:416)输入至变电设备外观缺陷检测模型的第一层缺陷特征提取模块,得到缺陷特征张量(C:1024,H:13,W:13);然后再经过多尺度特征融合模块得到三个不同大小的特征张量,分别为(C:256,H:52,W:52),(C:512,H:26,W:26),(C:1024,H:13,W:13);最后经过预测模块输出三个不同的预测数据,包括:类别、置信度、预测框坐标;
57)通过损失函数对张量数据相对于Groundtruth进行计算,并经过反向传播求取梯度,进行权重更新;
58)通过循环步骤56)和步骤57),直至损失函数降低至较小值,即训练完成,保存训练好的变电设备外观缺陷检测模型参数;
所述变电设备外观缺陷图像的再生成包括以下步骤:
31)变电设备外观缺陷图像再生成模型的构建:使用Pytorch深度学习框架搭建CycleGAN模型,并在CycleGAN网络的基础上添加两个注意力模块AD和AN,其中AD为N转换为D时使用的注意力模块,AN为D转换为N时使用的注意力模块;
32)数据输入:将变电设备外观缺陷图像数据集D和变电设备外观正常图像N输入变电设备外观缺陷图像再生成模型进行训练;
33)变电设备外观缺陷图像再生成模型的训练:迭代训练变电设备外观缺陷图像再生成模型并保存其参数;
34)通过已训练好的变电设备外观缺陷图像再生成模型来生成变电设备外观缺陷图像,并将增强的变电设备外观缺陷图像与原来的D结合在一起,组成新的变电设备外观缺陷图像数据集D;
所述变电设备外观缺陷图像再生成模型的训练包括以下步骤:
61)设置训练超参数:初始学习率为0.001,每个训练批次设置为16,训练的总迭代轮数设置为140epoch,优化算法为SGD;
62)数据输入:从正常变电设备图像数据集N中进行随机抽取m个正常数据样本X={x1,x2……xm},从变电设备外观缺陷图像数据集D中进行随机抽取m个正常数据样本Y={y1,y2……ym};
63)迭代训练:最小化判别损失以及循环一致性损失更新模型参数,损失函数为:
Ltotal=LGAN(F,DY,X,Y)+LGAN(G,DX,X,Y)+λLcyc(F,G,X,Y)
其中Ltotal为总损失,LGAN为X到Y或Y到X的生成判别损失,Lcyc为循环一致性损失;
64)通过循环步骤62)和步骤63),形成博弈学习模式,最终当判别器无法判断输入样本的来源时,训练达到稳定状态,得到一个最优的生成器参数。
2.根据权利要求1所述的基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法,其特征在于,所述变电设备外观缺陷图像的获取包括以下步骤:
21)变电设备外观缺陷图像的获取:从监控视频图像中筛选出外观具有缺陷的变电设备图像,缺陷主要包括设备外观存在裂纹、锈蚀、油污;
22)变电设备外观正常图像的获取:从监控视频图像中筛选出外观正常的变电设备图像,正常变电设备是指设备外观无明显缺陷;
23)变电设备外观图像的预处理:对所采集到的缺陷图像和正常图像进行包括裁剪为预定大小图像、添加高斯噪声、旋转、翻转的预处理操作;
24)变电设备外观图像的分类:对所预处理后的图像按照有无缺陷分类并组合成变电设备外观缺陷图像数据集D和变电设备外观正常图像数据集N。
3.根据权利要求1所述的基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法,其特征在于,所述变电设备外观缺陷检测模型的构建包括以下步骤:
41)构建变电设备外观缺陷检测模型的第一层为缺陷特征提取模块:设定缺陷特征提取模块中骨干网络CSPDarknet53结合了CSPNet和Darknet53,利用残差网络来进行深层特征的提取;变电设备外观缺陷图像经过CSPDarknet53提取特征后,得到缺陷特征张量;
42)构建变电设备外观缺陷检测模型的第二层为多尺度特征融合模块:设定多尺度特征融合模块首先搭建SPP模块,池化大小分别为:1×1,5×5,9×9,13×13;然后搭建PANet特征金字塔模块,并在每个Concat组件之后加入PCBAM注意力模块,提升模型对局部鉴别性特征的提取;深层和浅层的缺陷特征张量经过多尺度特征融合模块后,得到两者融合后的多尺度语义特征;
43)构建变电设备外观缺陷检测模型的第三层为缺陷预测模块:设定缺陷预测模块中搭建三个输出大小分别为13×13、26×26和52×52的预测分支;同时采用Focal Loss函数改进模型中置信度损失的交叉熵函数,Focal Loss函数表达式如下所示:
式中:p为激活函数Sigmoid的输出值;γ≥0,为聚焦参数,取γ=2;为调节因子;0≤α≤1,为类别权重因子,取α=0.25;γ和α为固定值,不参与训练;y为标签值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111025606.7A CN113724233B (zh) | 2021-09-02 | 2021-09-02 | 基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111025606.7A CN113724233B (zh) | 2021-09-02 | 2021-09-02 | 基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113724233A CN113724233A (zh) | 2021-11-30 |
CN113724233B true CN113724233B (zh) | 2022-10-11 |
Family
ID=78680940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111025606.7A Active CN113724233B (zh) | 2021-09-02 | 2021-09-02 | 基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113724233B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114998222A (zh) * | 2022-05-13 | 2022-09-02 | 宁波大学 | 汽车差速器壳体表面检测方法、电子设备及介质 |
CN117541555A (zh) * | 2023-11-16 | 2024-02-09 | 广州市公路实业发展有限公司 | 一种道路路面病害检测方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110930470A (zh) * | 2019-11-18 | 2020-03-27 | 佛山市南海区广工大数控装备协同创新研究院 | 一种基于深度学习的布匹缺陷图像生成方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110415215B (zh) * | 2019-06-27 | 2023-03-24 | 同济大学 | 基于图神经网络的智能检测方法 |
CN111401384B (zh) * | 2020-03-12 | 2021-02-02 | 安徽南瑞继远电网技术有限公司 | 一种变电设备缺陷图像匹配方法 |
CN112749734B (zh) * | 2020-12-29 | 2024-01-05 | 北京环境特性研究所 | 一种基于可迁移注意力机制的领域自适应的目标检测方法 |
CN112906769A (zh) * | 2021-02-04 | 2021-06-04 | 国网河南省电力公司电力科学研究院 | 一种基于CycleGAN的输变电设备图像缺陷样本增广方法 |
CN112967243B (zh) * | 2021-02-26 | 2023-01-13 | 清华大学深圳国际研究生院 | 一种基于yolo的深度学习芯片封装裂纹缺陷检测方法 |
-
2021
- 2021-09-02 CN CN202111025606.7A patent/CN113724233B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110930470A (zh) * | 2019-11-18 | 2020-03-27 | 佛山市南海区广工大数控装备协同创新研究院 | 一种基于深度学习的布匹缺陷图像生成方法 |
Non-Patent Citations (1)
Title |
---|
基于卷积神经网络的主变压器外观缺陷检测方法;位一鸣等;《浙江电力》;20190509(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113724233A (zh) | 2021-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111444939B (zh) | 电力领域开放场景下基于弱监督协同学习的小尺度设备部件检测方法 | |
CN113724233B (zh) | 基于融合数据生成和迁移学习技术的变电设备外观图像缺陷检测方法 | |
CN110969166A (zh) | 一种巡检场景下小目标识别方法和系统 | |
CN109919934A (zh) | 一种基于多源域深度迁移学习的液晶面板缺陷检测方法 | |
CN115862073B (zh) | 一种基于机器视觉的变电站危害鸟种目标检测和识别方法 | |
CN115131747A (zh) | 基于知识蒸馏的输电通道工程车辆目标检测方法及系统 | |
Zhao et al. | Research on detection method for the leakage of underwater pipeline by YOLOv3 | |
CN117516937A (zh) | 基于多模态特征融合增强的滚动轴承未知故障检测方法 | |
CN116681885A (zh) | 输变电设备红外图像目标识别方法及系统 | |
CN115272777A (zh) | 面向输电场景的半监督图像解析方法 | |
CN114708518A (zh) | 基于半监督学习与先验知识嵌入策略的螺栓缺陷检测方法 | |
Zhou et al. | SWDet: Anchor-based object detector for solid waste detection in aerial images | |
Li et al. | Steel Surface Defect Detection Method Based on Improved YOLOX | |
CN115272252A (zh) | 一种基于改进yolox的碳纤维缺陷的检测方法、装置及系统 | |
CN115272278A (zh) | 一种用于遥感图像变化检测的变化检测模型的构建方法 | |
CN118294455A (zh) | 钕铁硼电镀毛坯的智能检测系统及方法 | |
CN117593243A (zh) | 可靠伪标签引导的压缩机外观自适应检测方法 | |
CN117152642A (zh) | 基于无人机的生态环境监管系统及其方法 | |
Zhang et al. | Using improved YOLOX for underwater object recognition | |
Wu et al. | Detection of defects on aluminum profile surface based on improved YOLO | |
CN115861239A (zh) | 一种基于元学习的小样本工业零件表面缺陷检测方法 | |
CN115019243A (zh) | 基于改进YOLOv3的监控漂浮物轻量化目标检测方法及系统 | |
Fang | SSD-based Lightweight Recyclable Garbage Target Detection Algorithm | |
Yin | A lightweight and high-precision traffic sign identification method | |
Cai et al. | IFE-net: improved feature enhancement network for weak feature target recognition in autonomous underwater vehicles |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |