CN115205292B - 一种配电线路树障检测方法 - Google Patents

一种配电线路树障检测方法 Download PDF

Info

Publication number
CN115205292B
CN115205292B CN202211118947.3A CN202211118947A CN115205292B CN 115205292 B CN115205292 B CN 115205292B CN 202211118947 A CN202211118947 A CN 202211118947A CN 115205292 B CN115205292 B CN 115205292B
Authority
CN
China
Prior art keywords
feature map
module
representing
layer
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211118947.3A
Other languages
English (en)
Other versions
CN115205292A (zh
Inventor
张志勇
赵裕成
王子磊
刘海峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Zhongke Leinao Intelligent Technology Co ltd
Original Assignee
Hefei Zhongke Leinao Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Zhongke Leinao Intelligent Technology Co ltd filed Critical Hefei Zhongke Leinao Intelligent Technology Co ltd
Priority to CN202211118947.3A priority Critical patent/CN115205292B/zh
Publication of CN115205292A publication Critical patent/CN115205292A/zh
Application granted granted Critical
Publication of CN115205292B publication Critical patent/CN115205292B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/14Vascular patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Molecular Biology (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Vascular Medicine (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种配电线路树障检测方法,属于电力设备检测技术领域。本发明通过改进损失函数,在树障位置回归和背景前景分类损失上引入对标签的偶然不确定性进行估计,降低噪声标签对整体网络训练的影响,从而提升整体检测性能;改进yolov5网络结构,引入上下文注意力机制,提取上下文注意力信息,可以将树木和电线两个完全不同的物体通过全局注意力信息紧密联系起来成一个整体,加速训练过程中模型收敛提升整体检测性能;改进GC模块的Softmax为Sigmoid,改进后的GC模块,提取的注意力信息更能代表树障目标的特性,提升整体的检测性能。

Description

一种配电线路树障检测方法
技术领域
本发明涉及电力设备检测领域,具体涉及一种配电线路树障检测方法。
背景技术
由于配电线路分布十分广泛,地理环境十分复杂,配电线缆长期暴露在野外。而在这些地形复杂的区域往往存在树竹生长茂盛的情况,一旦配电线缆与树竹发生接触,可能会造成线路短路,破坏供电线路,甚至会造成森林火灾等严重事故。因此,配电线路巡视检测是否存在树障威胁十分重要。
传统的人工巡检方式是通过地面交通工具或徒步行走,利用仪器或肉眼来巡查线路附近树木的威胁进而进行砍伐,减少配电线路因为树木造成的安全隐患。然而,很多长距离配电线路分布在地形陡峭、自然环境恶劣的崇山峻岭、广袤森林之间,这导致了传统的人工巡线劳动强度大、工作条件艰苦、效率低、复寻周期长等一系列问题。
随着无人机技术的发展,配电线路巡视逐渐由原来的人工巡检替换成无人机巡检,大大的提高了巡检效率,但是无人机巡检在每条配电线路上会拍摄大量的图片,而真实存在树障的图片是极少量的,同时对于树障图片的判定也会存在很多歧义。因此需要耗费大量人力去对拍摄的图片进行人工识别,极大的降低了效率。
现有技术对配网线路树障的检测方法,基本都是采用大量数据图片对深度学习网络进行训练,以达到检测效果。但在实际的训练过程中,所采用的树障训练数据都是通过人工标注方式获得,而每个标注人员对树障的理解很难做到一致,这就会导致在数据标注时产生很多漏标、误标情况,这种情况就会导致在模型训练时对模型性能产生很大的负面影响,导致检测性能下降。为此,提出一种配电线路树障检测方法。
发明内容
本发明所要解决的技术问题在于:如何解决因人工数据标注的偶然不确定性导致的性能下降问题,提供了一种配电线路树障检测方法。
本发明是通过以下技术方案解决上述技术问题的,本发明包括以下步骤:
步骤1:数据预处理
针对配电线路树障目标制作数据集,采用人工标注方式以矩形框标注,生成标签,对经过标注后的数据进行归一化处理,然后再对数据进行增强处理;
步骤2:改进深度学习网络
对原始yolov5网络进行改进,在原始yolov5网络的C3模块中引入GC模块,并将GC模块的激活函数从Softmax函数更改为Sigmoid函数,得到改进后的yolov5网络;
步骤3:网络训练
构建损失函数,并进行改进后的yolov5网络训练,训练完成后,保存训练好的模型;
步骤4:树障检测
输入待测试的缺陷图片至模型,经过NMS处理后可检测出树障在缺陷图片中的位置。
更进一步地,在所述步骤1中,在所述步骤1中,标签格式表示为(x,y,w,h),其中x、y为矩形框的中心点坐标,w、h分别为矩形框的宽、高。
更进一步地,在所述步骤2中,所述C3模块包括三个3*3卷积层、一个GC模块;通过两个3*3卷积层进行特征提取,然后经过原始yolov5网络中特征提取层提取后的特征和经过两个3*3卷积后的特征相加,再经过一个3*3卷积层和一个GC模块进行特征提取。
更进一步地,在所述步骤2中,所述GC模块包括三个1*1卷积层、一个激活层、一个LayerNorm层、一个ReLU层;首先,输入特征图经过一个1*1卷积层进行降维,得到降维后的第一特征图,然后将降维后的第一特征图再通过激活层计算第一特征图中每个特征点在第一特征图中的概率分布,将得到的概率分布与输入特征进行相乘,得到每个特征点的注意力特征图,其次,将得到的注意力特征图经过一个1*1卷积层进行通道降维,得到降维后的第二特征图,然后将第二特征图经过一个LayerNorm层和一个ReLU层对其进行激活,得到第三特征图,最后,将第三特征图再经过一个1*1卷积层进行升维,得到第四特征图,然后将第四特征图与输入特征图进行相加得到最终的输出特征图,其中输入特征图指的是C3模块经过最后一个3*3卷积层处理后的特征图。
更进一步地,在所述步骤2中,所述GC模块的计算公式如下:
Figure 418789DEST_PATH_IMAGE001
其中,
Figure 867088DEST_PATH_IMAGE002
表示的是GC模块的输出特征图,
Figure 177984DEST_PATH_IMAGE003
表示输入特征图,
Figure 104351DEST_PATH_IMAGE004
表示输入特征图上的特征点,N p 表示输入特征图的总的特征点数量,
Figure 449882DEST_PATH_IMAGE005
表示1*1卷积过程,LN表示归一化处理;ReLu表示修正线性单元,
Figure 803503DEST_PATH_IMAGE006
表示经过sigmoid函数后得到的概率分布与每个特征点的乘积即获得的每个点的注意力值。
更进一步地,归一化处理的计算公式如下:
Figure 601695DEST_PATH_IMAGE007
其中,
Figure 331753DEST_PATH_IMAGE008
表示归一化处理后的输出,
Figure 531790DEST_PATH_IMAGE009
表示GC模块计算公式中的
Figure 56313DEST_PATH_IMAGE010
Figure 341801DEST_PATH_IMAGE011
表示
Figure 609971DEST_PATH_IMAGE009
的期望,
Figure 664514DEST_PATH_IMAGE012
表示
Figure 625517DEST_PATH_IMAGE009
的方差,
Figure 398301DEST_PATH_IMAGE013
表示精度值,
Figure 407845DEST_PATH_IMAGE014
Figure 382142DEST_PATH_IMAGE015
表示可学习的参数,
Figure 451729DEST_PATH_IMAGE014
Figure 711809DEST_PATH_IMAGE015
通过网络自适应的学习获取。
更进一步地,在所述步骤3中,在损失函数中引入矫正因子
Figure 321782DEST_PATH_IMAGE016
,损失函数基于候选框回归损失、前景背景分类损失计算,表达式如下:
Figure 350918DEST_PATH_IMAGE017
其中,
Figure 653724DEST_PATH_IMAGE018
表示候选框回归损失的偶然不确定性,
Figure 135521DEST_PATH_IMAGE019
表示前景背景分类损失的偶然不确定性,L表示网络训练的总损失,N表示网络训练的样本数,CIOU表示候选框回归损失函数,Bi表示预测的回归框坐标,Bi gt表示标签框坐标;yi表示样本的标签类别,yi *表示预测的类别。
更进一步地,候选框回归损失表示如下:
Figure 549184DEST_PATH_IMAGE020
其中,
Figure 432827DEST_PATH_IMAGE021
表示模型预测的坐标,
Figure 172113DEST_PATH_IMAGE022
表示标签坐标,
Figure 141206DEST_PATH_IMAGE023
表示预测框和真实框的中心点的欧氏距离,
Figure 92981DEST_PATH_IMAGE024
代表能够同时包含预测框和真实框的最小闭包区域的对角线距离,
Figure 96709DEST_PATH_IMAGE025
分别表示预测框的宽、高,
Figure 741317DEST_PATH_IMAGE026
分别表示标签框的宽、高,
Figure 197706DEST_PATH_IMAGE027
描述模型在数据
Figure 953173DEST_PATH_IMAGE028
上的偶然不确定性,即数据
Figure 542898DEST_PATH_IMAGE029
所自带的方差,IoU表示预测框和标签框的重合度计算值,v和α表示CIOU中引入的两个超参数,L BOX 表示引入偶然不确定性后的候选框回归损失。
更进一步地,前景背景分类损失表示如下:
Figure 358408DEST_PATH_IMAGE030
其中,
Figure 302093DEST_PATH_IMAGE031
表示为二分类的交叉熵损失函数,
Figure 861250DEST_PATH_IMAGE032
为标签类别,
Figure 573991DEST_PATH_IMAGE033
为预测的类别;
Figure 294823DEST_PATH_IMAGE034
描述模型在数据
Figure 725804DEST_PATH_IMAGE035
上的偶然不确定性,即数据
Figure 26335DEST_PATH_IMAGE029
所自带的方差。
本发明相比现有技术具有以下优点:该配电线路树障检测方法,通过改进损失函数,在树障位置回归和背景前景分类损失上引入对标签的偶然不确定性进行估计,降低噪声标签对整体网络训练的影响,从而提升整体检测性能;改进yolov5网络结构,引入上下文注意力机制,提取上下文注意力信息,可以将树木和电线两个完全不同的物体通过全局注意力信息紧密联系起来成一个整体,加速训练过程中模型收敛提升整体检测性能;改进GC模块的Softmax为Sigmoid,改进后的GC模块,提取的注意力信息更能代表树障目标的特性,提升整体的检测性能。
附图说明
图1是本发明实施例中配电线路树障检测方法的流程示意图;
图2是本发明实施例中改进后的yolov5网络的结构示意图;
图3是本发明实施例中改进后的C3模块结构示意图;
图4是本发明实施例中改进后的GC模块结构示意图。
具体实施方式
下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图1所示,本实施例提供一种技术方案:一种配电线路树障检测方法,包括以下步骤:
步骤一:针对配电线路树障目标制作数据集,采用人工标注方式以矩形框标注,生成标签,标签格式为矩形的中心点坐标和宽、高(x,y,w,h),对经过标注后的数据进行归一化处理,然后再对数据进行数据增强。数据归一化采用标注框的坐标除以图像的宽高值的方式,数据增强方式采用水平翻转,左右翻转,色调变化,旋转增强的方式。
步骤二:将经过步骤一预处理后的图像输入到深度学习网络(yolov5网络)的输入层,如图2所示,经过多层的特征提取网络层以及C3模块,最终得到检测层的输出结果。
在本步骤中,所使用的深度学习网络的C3模块结构与以往不同,如图3所示,其主要构成是两个3*3卷积层进行特征提取,然后将经过特征提取层提取后的特征和经过两个3*3卷积后的特征相加,再经过一个3*3卷积层和一个GC模块进行特征提取。
需要说明的是,GC模块的主要作用是既可以捕获上下文的依赖关系,同时也能获取通道间的依赖关系。经过GC模块的特征图可以获取每个特征点与整体特征图的响应关系。更有利于网络的学习和收敛。
相比较于原始的C3模块,本步骤采用的C3模块增加了一个GC模块提取全局上下文注意力。GC模块的主要作用是既可以捕获上下文的依赖关系,同时也能获取通道间的依赖关系。经过GC模块的特征图可以获取每个特征点与整体特征图的响应关系。根据树障目标的特点,本发明认为树障目标对全局上下文信息的依耐性更强,主要原因是,树障目标整体由树和电线组成,C3模块中引入GC模块,可以将树木和电线两个完全不同的物体通过全局注意力信息紧密联系起来成一个整体,更有利于网络的学习和收敛,加速训练过程中模型收敛提升整体检测性能。
同时本发明中引入的GC模块相较于现有技术也有所改变。如图4所示,本方案将原始GC模块的激活函数从Softmax函数改进成Sigmoid函数,做这样的改进的主要原因是,Softmax函数获取的概率分布是一个将输出值转换为范围在[0,1]且和为1的概率分布,而Sigmoid函数获取的概率分布是一个将输出值转换为范围在[0,1]的概率分布,在树障检测中,提取GC注意力过程中,认为树障特征图的各个特征点的响应并不是和为1的概率分布,因为树障目标理论上应该是具有多处响应相同或者相似的情况,将GC模块的激活函数由Softmax改进成Sigmoid有利于网络提取更精确的注意力信息。
如图4所示,GC模块主要由输入特征图进行降维得到降维后的特征图1,然后将降维后的特征图1再通过激活层计算特征图1中每个特征点在特征图1中的概率分布,将得到的概率分布与输入特征进行相乘,得到每个特征点的注意力特征图,然后再经过一个1*1卷积层进行通道降维,得到降维后的特征图2,然后将特征图2经过一个LayerNorm层(归一化层)和一个ReLU层(修正线性单元)对特征图进行激活,得到特征图3,特征图3再经过一个1*1卷积层进行升维,得到特征图4,最后特征图4与输入特征图进行相加得到最终的输出特征图。其中输入特征图指的是C3模块经过最后一个3*3卷积层后的特征图。
其中,GC模块的计算公式如下:
Figure 859162DEST_PATH_IMAGE001
其中,
Figure 750895DEST_PATH_IMAGE036
表示的是GC模块的输出特征图,
Figure 934751DEST_PATH_IMAGE037
表示输入特征图,
Figure 835711DEST_PATH_IMAGE038
表示输入特征图上的特征点,N p 表示输入特征图的总的特征点数量,
Figure 460728DEST_PATH_IMAGE039
表示1*1卷积过程,LN表示归一化处理,其计算公式为:
Figure 54520DEST_PATH_IMAGE007
其中,
Figure 194514DEST_PATH_IMAGE008
表示LayerNorm(归一化)处理后的输出,
Figure 102427DEST_PATH_IMAGE009
表示GC模块计算公式中的
Figure 909846DEST_PATH_IMAGE040
Figure 408961DEST_PATH_IMAGE011
表示
Figure 239514DEST_PATH_IMAGE009
的期望,
Figure 482276DEST_PATH_IMAGE012
表示
Figure 147131DEST_PATH_IMAGE009
的方差,
Figure 82726DEST_PATH_IMAGE013
表示精度值,
Figure 462892DEST_PATH_IMAGE041
Figure 447029DEST_PATH_IMAGE015
表示可学习的参数,
Figure 963461DEST_PATH_IMAGE041
Figure 132274DEST_PATH_IMAGE015
通过网络自适应的学习获取。
ReLU表示的是修正线性单元,用于对特征图进行激活,保证网络非线性能力。
Figure 734156DEST_PATH_IMAGE006
表示经过sigmoid函数后得到的概率分布与每个特征点的乘积即获得的每个点的注意力值。
经过多层的特征提取层以及C3模块处理后,再经过检测层输出,计算损失函数,然后再进行反向传播过程更新网络参数。
步骤三:构建损失函数,并进行网络训练,具体说明如下:
yolov5网络的损失函数分成3部分,分别是候选框回归损失,前景背景分类损失,以及多类别分类损失,本发明主要公开一种配电线路树障检测方法,其目标检测种类仅有树障一类目标,因此,损失函数只包含候选框回归损失和前景背景分类损失。考虑到树障目标的独特性,即在图像中标注时,标注框的大小很难控制,同时在图像中难以判断树障目标是否存在,因此在标注过程中存在很大的偶然不确定性。针对这种现象本发明提出一种针对这种标注不确定性的损失函数的计算方式。
具体如下:
候选框回归损失:
Figure 318722DEST_PATH_IMAGE020
其中,
Figure 892922DEST_PATH_IMAGE021
表示模型预测的坐标,
Figure 232637DEST_PATH_IMAGE022
表示标签坐标,
Figure 56236DEST_PATH_IMAGE023
表示预测框和真实框的中心点的欧氏距离,
Figure 444492DEST_PATH_IMAGE024
代表能够同时包含预测框和真实框的最小闭包区域的对角线距离,
Figure 669937DEST_PATH_IMAGE025
分别表示预测框的宽、高,
Figure 177623DEST_PATH_IMAGE026
分别表示标签框的宽、高,
Figure 754098DEST_PATH_IMAGE027
描述模型在数据
Figure 946045DEST_PATH_IMAGE028
上的偶然不确定性,即数据
Figure 25997DEST_PATH_IMAGE029
所自带的方差,IoU表示预测框和标签框的重合度计算值,v和α表示CIOU中引入的两个超参数,L BOX 表示引入偶然不确定性后的候选框回归损失。
关于这个新构建的损失函数可以解释为,假设所构建的树障数据集是一个带有噪声的数据集,
Figure 769831DEST_PATH_IMAGE042
是计算回归框的损失,模型训练的目的是为了最小化
Figure 99181DEST_PATH_IMAGE043
,假如此时的网络已经在带噪声的数据集上收敛地很好,但是始终有一个很小的误差,而这个很小的误差认为是由于数据噪声产生的。因此此时用
Figure 829239DEST_PATH_IMAGE043
除以
Figure 966960DEST_PATH_IMAGE027
将噪声消除,后面的
Figure 757061DEST_PATH_IMAGE044
正则项是为了防止网络倾向于把所有的
Figure 45479DEST_PATH_IMAGE045
预测成无穷大来最小化损失函数。
前景背景分类损失:
Figure 313649DEST_PATH_IMAGE030
其中,
Figure 633772DEST_PATH_IMAGE031
表示为二分类的交叉熵损失函数,
Figure 798037DEST_PATH_IMAGE032
为标签类别,
Figure 305242DEST_PATH_IMAGE033
为预测的类别;
Figure 642682DEST_PATH_IMAGE034
描述模型在数据
Figure 817311DEST_PATH_IMAGE035
上的偶然不确定性,即数据
Figure 886899DEST_PATH_IMAGE029
所自带的方差。
假设本发明所构建的树障数据集是一个带有噪声的数据集,
Figure 146979DEST_PATH_IMAGE046
是计算分类的损失,模型训练的目的是为了最小化分类的损失,假如此时的网络已经在带噪声的数据集上收敛的很好,但是始终有一个很小的误差,而这个很小的误差我们认为是由于数据噪声产生的。因此此时用
Figure 22531DEST_PATH_IMAGE047
除以
Figure 254929DEST_PATH_IMAGE048
将噪声消除,后面的
Figure 292155DEST_PATH_IMAGE049
正则项是为了防止网络倾向于把所有的
Figure 305111DEST_PATH_IMAGE050
预测成无穷大来最小化损失函数;候选框损失的偶然不确定性参数以及前景背景损失的偶然不确定性参数可以通过网络自适应的学习这两个参数,同时在实际训练中,将不让网络直接输出
Figure 718774DEST_PATH_IMAGE051
,因为如果是
Figure 805679DEST_PATH_IMAGE052
为0,损失函数会直接出现nan(nan是无穷大的意思,计算机计算除法时,如果分母为0,输出结果就是nan),导致后续无法训练。所以在训练时,让网络输出
Figure 279386DEST_PATH_IMAGE053
,来防止0的出现。
因此联合候选框回归损失和分类损失可得:
Figure 514058DEST_PATH_IMAGE017
其中,
Figure 465833DEST_PATH_IMAGE018
表示候选框回归损失的偶然不确定性,
Figure 672824DEST_PATH_IMAGE019
表示前景背景分类损失的偶然不确定性,L表示网络训练的总损失,N表示网络训练的样本数,CIOU表示候选框回归损失函数,
Figure 317432DEST_PATH_IMAGE054
表示预测的回归框坐标,
Figure 773821DEST_PATH_IMAGE055
表示标签框坐标;
Figure 732550DEST_PATH_IMAGE056
表示样本的标签类别,
Figure 587855DEST_PATH_IMAGE057
表示预测的类别。
步骤四:训练完成后,保存训练好的模型,输入待测试的缺陷图片,经过NMS(非极大值抑制)处理后可检测出树障在缺陷图片中的位置。
综上所述,上述实施例的配电线路树障检测方法,通过改进损失函数,在树障位置回归和背景前景分类损失上引入对标签的偶然不确定性进行估计,降低噪声标签对整体网络训练的影响,从而提升整体检测性能;改进yolov5网络结构,引入上下文注意力机制,提取上下文注意力信息,可以将树木和电线两个完全不同的物体通过全局注意力信息紧密联系起来成一个整体,加速训练过程中模型收敛提升整体检测性能;改进GC模块的Softmax为Sigmoid,改进后的GC模块,提取的注意力信息更能代表树障目标的特性,提升整体的检测性能。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (2)

1.一种配电线路树障检测方法,其特征在于,包括以下步骤:
步骤1:数据预处理
针对配电线路树障目标制作数据集,采用人工标注方式以矩形框标注,生成标签,对经过标注后的数据进行归一化处理,然后再对数据进行增强处理;
步骤2:改进深度学习网络
对原始yolov5网络进行改进,在原始yolov5网络的C3模块中引入GC模块,并将GC模块的激活函数从Softmax函数更改为Sigmoid函数,得到改进后的yolov5网络;
步骤3:网络训练
构建损失函数,并进行改进后的yolov5网络训练,训练完成后,保存训练好的模型;
步骤4:树障检测
输入待测试的缺陷图片至模型,经过NMS处理后可检测出树障在缺陷图片中的位置;
在所述步骤2中,所述C3模块包括三个3*3卷积层、一个GC模块;通过两个3*3卷积层进行特征提取,然后将经过原始yolov5网络中特征提取层提取后的特征和经过两个3*3卷积层后的特征相加,再经过一个3*3卷积层和一个GC模块进行特征提取;
在所述步骤2中,所述GC模块包括三个1*1卷积层、一个激活层、一个LayerNorm层、一个ReLU层;首先,输入特征图经过一个1*1卷积层进行降维,得到降维后的第一特征图,然后将降维后的第一特征图再通过激活层计算第一特征图中每个特征点在第一特征图中的概率分布,将得到的概率分布与输入特征进行相乘,得到每个特征点的注意力特征图,其次,将得到的注意力特征图经过一个1*1卷积层进行通道降维,得到降维后的第二特征图,然后将第二特征图经过一个LayerNorm层和一个ReLU层对其进行激活,得到第三特征图,最后,将第三特征图再经过一个1*1卷积层进行升维,得到第四特征图,然后将第四特征图与输入特征图进行相加得到最终的输出特征图,其中输入特征图指的是C3模块经过最后一个3*3卷积层处理后的特征图,其中LayerNorm层为归一化层,ReLU层为修正线性单元;
在所述步骤2中,所述GC模块的计算公式如下:
Figure DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE004
表示的是GC模块的输出特征图,
Figure DEST_PATH_IMAGE006
表示输入特征图,
Figure DEST_PATH_IMAGE008
表示输入特征图上的特征点,N p 表示输入特征图的总的特征点数量,
Figure DEST_PATH_IMAGE010
表示1*1卷积过程,LN表示归一化处理;ReLu表示修正线性单元,
Figure DEST_PATH_IMAGE012
表示经过sigmoid函数后得到的概率分布与每个特征点的乘积即获得的每个点的注意力值;
归一化处理的计算公式如下:
Figure DEST_PATH_IMAGE014
其中,
Figure DEST_PATH_IMAGE016
表示归一化处理后的输出,
Figure DEST_PATH_IMAGE018
表示GC模块计算公式中的
Figure DEST_PATH_IMAGE020
Figure DEST_PATH_IMAGE022
表示
Figure 619970DEST_PATH_IMAGE018
的期望,
Figure DEST_PATH_IMAGE024
表示
Figure 73954DEST_PATH_IMAGE018
的方差,
Figure DEST_PATH_IMAGE026
表示精度值,
Figure DEST_PATH_IMAGE028
Figure DEST_PATH_IMAGE030
表示可学习的参数,
Figure 910672DEST_PATH_IMAGE028
Figure 110709DEST_PATH_IMAGE030
通过网络自适应的学习获取;
在所述步骤3中,在损失函数中引入矫正因子
Figure DEST_PATH_IMAGE032
,损失函数基于候选框回归损失、前景背景分类损失计算,表达式如下:
Figure DEST_PATH_IMAGE034
其中,
Figure DEST_PATH_IMAGE036
表示候选框回归损失的偶然不确定性,
Figure DEST_PATH_IMAGE038
表示前景背景分类损失的偶然不确定性,L表示网络训练的总损失,N表示网络训练的样本数,CIOU表示候选框回归损失函数,Bi表示预测的回归框坐标,Bi gt表示标签框坐标;yi表示样本的标签类别,yi *表示预测的类别;
候选框回归损失表示如下:
Figure DEST_PATH_IMAGE040
其中,
Figure DEST_PATH_IMAGE042
表示模型预测的坐标,
Figure DEST_PATH_IMAGE044
表示标签坐标,
Figure DEST_PATH_IMAGE046
表示预测框和真实框的中心点的欧氏距离,
Figure DEST_PATH_IMAGE048
代表能够同时包含预测框和真实框的最小闭包区域的对角线距离,
Figure DEST_PATH_IMAGE050
分别表示预测框的宽、高,
Figure DEST_PATH_IMAGE052
分别表示标签框的宽、高,
Figure DEST_PATH_IMAGE054
描述模型在数据
Figure DEST_PATH_IMAGE056
上的偶然不确定性,即数据
Figure DEST_PATH_IMAGE057
所自带的方差,IoU表示预测框和标签框的重合度计算值,v和α表示CIOU中引入的超参数,L BOX 表示引入偶然不确定性后的候选框回归损失;
前景背景分类损失表示如下:
Figure DEST_PATH_IMAGE059
其中,
Figure DEST_PATH_IMAGE061
表示为二分类的交叉熵损失函数,
Figure DEST_PATH_IMAGE063
为标签类别,
Figure DEST_PATH_IMAGE065
为预测的类别;
Figure DEST_PATH_IMAGE067
描述模型在数据
Figure DEST_PATH_IMAGE068
上的偶然不确定性,即数据
Figure 464592DEST_PATH_IMAGE057
所自带的方差。
2.根据权利要求1所述的一种配电线路树障检测方法,其特征在于:在所述步骤1中,标签格式表示为(x,y,w,h),其中x、y为矩形框的中心点坐标,w、h分别为矩形框的宽、高。
CN202211118947.3A 2022-09-15 2022-09-15 一种配电线路树障检测方法 Active CN115205292B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211118947.3A CN115205292B (zh) 2022-09-15 2022-09-15 一种配电线路树障检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211118947.3A CN115205292B (zh) 2022-09-15 2022-09-15 一种配电线路树障检测方法

Publications (2)

Publication Number Publication Date
CN115205292A CN115205292A (zh) 2022-10-18
CN115205292B true CN115205292B (zh) 2022-11-25

Family

ID=83573590

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211118947.3A Active CN115205292B (zh) 2022-09-15 2022-09-15 一种配电线路树障检测方法

Country Status (1)

Country Link
CN (1) CN115205292B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113095404A (zh) * 2021-04-13 2021-07-09 西安电子科技大学 基于前后背景分卷积神经网络的x光违禁物品检测方法
CN114119610A (zh) * 2022-01-25 2022-03-01 合肥中科类脑智能技术有限公司 基于旋转目标检测的缺陷检测方法
CN114399799A (zh) * 2021-11-22 2022-04-26 电子科技大学 一种基于YOLOv5网络的口罩佩戴检测方法
CN114445299A (zh) * 2022-01-28 2022-05-06 南京邮电大学 一种基于注意力分配机制的双残差去噪方法
CN114463718A (zh) * 2022-01-05 2022-05-10 西安电子科技大学 一种改进损失函数的YOLOv4目标检测算法
WO2022112594A2 (en) * 2020-11-30 2022-06-02 Dolby International Ab Robust intrusive perceptual audio quality assessment based on convolutional neural networks
CN114863361A (zh) * 2022-04-22 2022-08-05 三峡大学 基于USRNet和YOLOv3的配电线路鸟巢检测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3087558B1 (fr) * 2018-10-19 2021-08-06 Idemia Identity & Security France Procede d'extraction de caracteristiques d'une empreinte digitale representee par une image d'entree
CN112949673B (zh) * 2019-12-11 2023-04-07 四川大学 一种基于全局注意力的特征融合目标检测与识别方法
US11403527B2 (en) * 2020-10-09 2022-08-02 Sas Institute Inc. Neural network training system
CN114202672A (zh) * 2021-12-09 2022-03-18 南京理工大学 一种基于注意力机制的小目标检测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022112594A2 (en) * 2020-11-30 2022-06-02 Dolby International Ab Robust intrusive perceptual audio quality assessment based on convolutional neural networks
CN113095404A (zh) * 2021-04-13 2021-07-09 西安电子科技大学 基于前后背景分卷积神经网络的x光违禁物品检测方法
CN114399799A (zh) * 2021-11-22 2022-04-26 电子科技大学 一种基于YOLOv5网络的口罩佩戴检测方法
CN114463718A (zh) * 2022-01-05 2022-05-10 西安电子科技大学 一种改进损失函数的YOLOv4目标检测算法
CN114119610A (zh) * 2022-01-25 2022-03-01 合肥中科类脑智能技术有限公司 基于旋转目标检测的缺陷检测方法
CN114445299A (zh) * 2022-01-28 2022-05-06 南京邮电大学 一种基于注意力分配机制的双残差去噪方法
CN114863361A (zh) * 2022-04-22 2022-08-05 三峡大学 基于USRNet和YOLOv3的配电线路鸟巢检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈旭 ; 彭冬亮 ; 谷雨.基于改进YOLOv5s的无人机图像实时目标检测.《光电工程》.2022, *

Also Published As

Publication number Publication date
CN115205292A (zh) 2022-10-18

Similar Documents

Publication Publication Date Title
CN113850242B (zh) 一种基于深度学习算法的仓储异常目标检测方法及系统
CN114022432B (zh) 基于改进的yolov5的绝缘子缺陷检测方法
CN114627360A (zh) 基于级联检测模型的变电站设备缺陷识别方法
CN111553869B (zh) 一种空基视角下的生成对抗网络图像补全方法
CN113160062B (zh) 一种红外图像目标检测方法、装置、设备及存储介质
CN111553403B (zh) 基于伪3d卷积神经网络的烟雾检测方法及系统
CN112837315A (zh) 一种基于深度学习的输电线路绝缘子缺陷检测方法
CN114255403A (zh) 基于深度学习的光学遥感图像数据处理方法及系统
Fang et al. Geometric-spectral reconstruction learning for multi-source open-set classification with hyperspectral and LiDAR data
CN110717863A (zh) 一种基于生成对抗网络的单图像去雪方法
CN116843636A (zh) 基于改进YOLOv7算法的雾天场景下绝缘子缺陷检测方法
CN116385958A (zh) 一种用于电网巡检和监控的边缘智能检测方法
CN115239710A (zh) 基于注意力反馈和双空间金字塔的绝缘子缺陷检测方法
CN111062950A (zh) 一种用于多类别森林场景图像分割的方法、存储介质和设备
CN115965862A (zh) 基于掩码网络融合图像特征的sar舰船目标检测方法
CN116543346A (zh) 一种基于深度学习的输电线路视频山火检测方法
CN118038153A (zh) 配电架空线路的防外破识别方法、装置、设备和介质
CN115205292B (zh) 一种配电线路树障检测方法
CN116994161A (zh) 一种基于改进YOLOv5的绝缘子缺陷检测方法
CN115424026A (zh) 一种基于知识嵌入的端到端雾天图像多目标检测模型
Gupta et al. Post disaster mapping with semantic change detection in satellite imagery
CN113723833A (zh) 造林实绩质量评价方法、系统、终端设备及存储介质
CN112380985A (zh) 变电站入侵异物实时检测方法
CN111553272A (zh) 基于深度学习的高分辨率卫星光学遥感影像建筑物变化检测方法
CN115272814B (zh) 一种远距离空间自适应多尺度的小目标检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant