CN114387489A - 电力设备识别方法、装置和终端设备 - Google Patents

电力设备识别方法、装置和终端设备 Download PDF

Info

Publication number
CN114387489A
CN114387489A CN202210044214.3A CN202210044214A CN114387489A CN 114387489 A CN114387489 A CN 114387489A CN 202210044214 A CN202210044214 A CN 202210044214A CN 114387489 A CN114387489 A CN 114387489A
Authority
CN
China
Prior art keywords
power equipment
image
feature
identification
electric power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210044214.3A
Other languages
English (en)
Inventor
韩璟琳
贺春光
冯喜春
胡平
赵辉
陈志永
李铁良
苑鲁峰
何鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Hebei Electric Power Co Ltd
Beijing China Power Information Technology Co Ltd
Economic and Technological Research Institute of State Grid Hebei Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Hebei Electric Power Co Ltd
Beijing China Power Information Technology Co Ltd
Economic and Technological Research Institute of State Grid Hebei Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Hebei Electric Power Co Ltd, Beijing China Power Information Technology Co Ltd, Economic and Technological Research Institute of State Grid Hebei Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202210044214.3A priority Critical patent/CN114387489A/zh
Publication of CN114387489A publication Critical patent/CN114387489A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Abstract

本申请适用于图像识别技术领域,公开了一种电力设备识别方法、装置和终端设备。上述电力设备识别方法包括:采集电力设备图像,对电力设备图像进行预处理,建立电力设备图像数据集;基于电力设备图像数据集,训练得到电力设备识别模型;将待识别电力设备图片输入电力设备识别模型,获得电力设备的识别结果。电力设备图像数据集经预处理,解决了因电力能源设备的尺寸差距较大带来的运算速度缓慢问题,根据电力设备图像数据集建立的电力设备识别模型,在特征提取、特征融合和特征匹配三方面对模型进行了改进,在提升模型运算效率的同时,提高了电力设备的识别精度。

Description

电力设备识别方法、装置和终端设备
技术领域
本申请属于图像识别技术领域,尤其涉及一种电力设备识别方法、装置和终端设备。
背景技术
近些年来,深度学习卷积神经网络应用在图像特征信息提取领域,取得了显著的成果。然而现有的大多数图像识别神经网络算法,都不能很好地解决不同尺度图像特征信息提取的问题,为解决多尺度图像识别问题,引入了特征金字塔方法,包括SSD、STDN等方法,将大尺度图像特征融入到小尺度物体识别中,提高识别准确率。
目前大多数物体识别方法采用枚举锚框的方法来进行特征提取,Faster RCNN采用人工选择锚框,Yolo采用统计学方法设定锚框,但存在无法适应多尺度图像识别的情况,由此提出了Meta Anchor方法,利用权重预测获得动态锚框函数。为了覆盖不同形状物体,通常设定多个不同纵横比的锚框,这些方法本质上都是自上而下的特征金字塔特征融合方法。但是,特征金字塔方法实现大尺度物体特征融入小尺度物体识别中,提高了小尺度物体识别精确度的同时忽略了大尺度物体的识别,造成大尺度物体识别精度远小于小尺寸目标物体的问题。
发明内容
有鉴于此,本申请实施例提供了一种电力设备识别方法、装置和终端设备,以提升电力设备的识别精度。
本申请是通过如下技术方案实现的:
第一方面,本申请实施例提供了一种电力设备识别方法,其特征在于,包括:采集电力设备图像,对所述电力设备图像进行预处理,建立电力设备图像数据集;基于所述电力设备图像数据集,训练得到电力设备识别模型;将待识别电力设备图片输入所述电力设备识别模型,获得电力设备的识别结果。
本申请实施例中,通过对电力设备图像数据集进行预处理,解决了因电力能源设备的尺寸差距较大带来的运算速度缓慢问题。根据经预处理后的电力设备图像数据集建立的电力设备识别模型,在特征提取、特征融合和特征匹配三方面进行了适于电力设备识别的改进,增强原始特征信息流,有助于大尺度目标的识别,训练出的电力设备识别模型,可以在保持较高性能的同时将训练速度提高约30%,在提升电力设备识别模型运算效率的同时,也提高了对电力设备的识别精度。
基于第一方面,在一些实施例中,所述采集电力设备图像,对所述电力设备图像进行预处理,建立电力设备图像数据集,包括:采集电力设备图像,将所述电力设备图像进行分割,截取电力设备存在的主要图像区域;对所述主要图像区域内的电力设备进行标注,得到包含标注信息的电力设备图像数据集。
基于第一方面,在一些实施例中,所述基于所述电力设备图像数据集,训练得到电力设备识别模型,包括:通过主干网络对所述电力设备图像数据集中的电力设备图像进行特征提取,得到第一图像特征;通过多尺度特征双融合模块将所述第一图像特征中不同尺度的特征进行双向融合,得到第二图像特征;以最小化损失函数为目标,对所述第二图像特征进行匹配识别,获取输出最优匹配结果时的最优模型参数,根据所述最优模型参数确定电力设备识别模型。
基于第一方面,在一些实施例中,所述主干网络为包含自注意力机制和Dropout机制的Darknet-53网络,所述Darknet-53网络的激活函数为Mish函数。
基于第一方面,在一些实施例中,所述主干网络采用深度可分离卷积算法,所述深度可分离卷积算法,包括:将多维卷积核分解为一个列向量和一个行向量,通过1*1卷积核进行卷积,将通道进行不同权重融合。
基于第一方面,在一些实施例中,所述通过多尺度特征双融合模块将所述第一图像特征中不同尺度的特征进行双向融合,得到第二图像特征,包括:将所述第一图像特征输入多尺度特征双融合模块,分别提取不同尺度和不同分辨率下的特征图;将不同分辨率下的特征图进行融合,将不同尺度的特征图进行双向融合,生成第二图像特征。
基于第一方面,在一些实施例中,所述损失函数为RIOU函数,所述以最小化损失函数为目标,对所述第二图像特征进行匹配识别,包括:根据目标电力设备的目标尺寸,通过RIOU函数对所述第二图像特征中不同尺度的特征图与所述目标电力设备类型进行分别匹配和识别。
第二方面,本申请实施例提供了一种装置,包括:数据采集模块,用于采集电力设备图像,对所述电力设备图像进行预处理,建立电力设备图像数据集;训练模块,用于基于所述电力设备图像数据集,训练得到电力设备识别模型;识别模块,用于将待识别电力设备图片输入所述电力设备识别模型,获得电力设备的识别结果。
第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面中任一项所述的电力设备识别方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面任一项所述的电力设备识别方法的步骤。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的电力设备识别方法的流程示意图;
图2是本申请实施例提供的Mish函数运算图像;
图3是本申请实施例提供的电力设备识别效果图;
图4是本申请实施例提供的电力设备识别装置的结构示意图;
图5是本申请实施例提供的终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
以下,对本申请涉及的术语进行解释。
图像识别:利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术,是应用深度学习算法的一种实践应用。
特征金字塔:是用于检测不同尺度的对象的识别系统中的基本组件。
特征提取:使用计算机提取图像中属于特征性的信息的方法及过程。
激活函数:在神经网络的各个节点中运行的函数,通过使用激活函数,引入非线性函数,将神经元的输入映射到输出端,有利于对复杂模型的理解。
语义特征:图像的语义分为视觉层、对象层和概念层,视觉层即通常所理解的底层,即颜色、纹理和形状等,这些特征都被称为底层特征语义;对象层即中间层,通常包含了属性特征等,就是某一对象在某一时刻的状态;概念层是高层,是图像表达出的最接近人类理解的东西。
自注意力机制:模仿了生物的观察行为,通过仿真观察行为的内部过程,根据所定目标,特别注重关注部分细节,而不是基于全局分析,从而减少对外部信息的依赖程度,更好的得到数据或特征的内部相关性。注意力机制主要有两类:输入和输出元素之间的关系称为General Attention、输入元素内部的关系称为自注意力(Self-Attention)。
卷积神经网络:卷积神经网络(CNN)是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一。卷积神经网络具有表征学习能力,能够按其阶层结构对输入信息进行平移不变分类,因此也被称为“平移不变人工神经网络。
Anchor:CNN网络生成的特征图像上当前滑窗的中心在原像素空间的映射点就称为Anchor,根据预定义的Anchor,以特征图像上的一点为中心就可以在原图上生成9种不同形状不同大小的边框。
在图像识别方面,传统遮挡物识别方法大多采用人工巡检的方式,通过人去观察采集物体信息,这样的操作不仅消耗大量物力财力,效率低下,而且对于一些特殊场景的巡检常常难以通过人工的方式实现。通过深度学习算法识别物体的现有技术中,目前大多数方法只关注物体的相关特征,例如类别、形状、颜色等,而对于其他的相关信息,像密度、背景、光照等信息并不关注,因此在遮挡物物体识别上难以取得理想结果。采用特征金字塔方法实现大尺度物体特征融入小尺度物体识别中,提高了小尺度物体识别精确度的同时忽略了大尺度物体的识别,造成大尺度物体识别精度远小于小尺寸目标物体的问题。
在特征提取方面,传统的特征提取采用ReLU函数作为激活函数,依据ReLU函数的特性,当计算梯度时若输入的数值是小于等于零,那么激活函数的输出是为零的,会导致大量权重和偏差无法得到更新,产生神经元死亡问题。
特征提取过程中所采用的卷积方法,得到多个特征图通道,其权重相等,无法表示不同通道对最终特征图提取的影响,会在一定程度上影响最终特征图的特征提取效果,不利于特征匹配的识别效果。对于特征提取的对象——图像而言,每一幅图像都有着自身特点,包含可以直观感受的特点,例如颜色、亮度、纹理等,也包含需要一定处理操作后才可得到的特点,例如灰度直方图等。传统的特征提取许多只考虑直观特征,对于潜在特征的提取程度不够,使得信息量利用率低。现有的特征提取过程中常采用锚框方法进行,为了应对多尺度物体,覆盖不同形状物体,通常设定多个不同纵横比的锚框,由此会导致参数急剧增加,提高计算量,严重拖慢了模型训练速度和收敛速度。
在特征匹配识别方面,使用的损失函数方面,传统YOLOv3算法,其损失函数采用MSE函数,对识别目标的尺度大小敏感,导致模型的识别效果较差。针对以上缺点,总的来说现有技术中在特征提取、特征融合和损失函数上都存在影响最终的电力设备识别效果的问题。
为解决传统模型在目标识别过程中对大尺度识别效果差,识别尺寸敏感及特征图生成与选择等问题,本发明提供了一种电力设备识别方法。如图1所示,该电力设备识别方法可以包括步骤101至步骤103。
步骤101:采集电力设备图像,对电力设备图像进行预处理,建立电力设备图像数据集。
在一些实施例中,步骤101可以包括步骤1011至步骤1012。
步骤1011:采集电力设备图像,将电力设备图像进行分割,截取电力设备存在的主要图像区域。
将图像进行分割,把主要电力设备所存在的区域截取出来,有利于后续的识别。
步骤1012:对主要图像区域内的电力设备进行标注,得到包含标注信息的电力设备图像数据集。
建立电力设备数据集,对每张所需识别电力设备进行人工标注。标注的同时进行图像的预处理,使标注尽可能的准确,有利于后续的识别工作。
采用labelimg软件人工进行标注工作,标注的种类包括电线杆Telegraph poles,变压器transformer,绝缘子Insulator,横担CrossArm,线夹WireClip等。将标注所生成的xml文件进行单独存储,其中包含了图像所需的标注信息。
标注完成后,根据电力设备的尺寸大小将其进行分类,具体分为两类,一类是电线杆、变压器和横担,另一类为线夹和绝缘子。进而在两个类别中选取聚类中心点,计算每个样本距离聚类中心点的聚类,选取距离最远的为新的聚类中心点,重复上述步骤,直到聚类中心点的数量达到五个。
具体的,根据目标数据集中目标电力设备的尺寸大小,进行以下操作:
①预处理分类,根据识别目标的不同尺寸,按照一定的标注,在进行聚类前对其进行人工分类。
②从分类后的数据中随机选取聚类中心,计算尺寸相近数据集中其他数据与聚类中心的距离。
③根据所计算距离值大小选取新一个聚类中心。
④不断重复以上②③步骤,直到聚类中心的数量达到N。
⑤计算每个样本到N个聚类中心的距离,并将其分到距离最短的类中。
⑥根据分类的结果重新计算聚类中心,及所有样本的质心。
⑦重复⑤⑥步骤,直到聚类中心的位置趋于稳定停止。
通过上述操作能够使得聚类速度提高,得到的数据集对于模型的训练速度更快,并且可以有效的缓解YOLOv3网络对不同尺度目标物体敏感的问题,提高电力能源设备的识别精度。对于数据集而言,电力设备的数量及种类是硬性指标,预处理过程可以一定程度上减少将来模型训练的资源浪费。
步骤102:基于电力设备图像数据集,训练得到电力设备识别模型。
电力设备识别模型主要有三个模块,分别为特征提取模块、多尺度特征双融合模块和特征匹配模块。特征提取模块基于添加通道域自注意力机制的残差网络对整体电力设备图像进行多个尺度的全局特征提取,通过与1*1卷积核进行卷积,实现不同权重通道融合的效果。多尺度特征双融合模块引入特征金字塔机制,将特征提取模块得到的不同尺度的特征映射作为输入,采用特征金字塔语义信息双向融合的方法,生成多尺度特征互补语义信息,实现对特征映射的细化。特征匹配模块,不同于传统的先选择融合再识别的方法,模型直接在各尺度匹配的同时进行预测,通过改进的损失函数,得出最优匹配结果,根据得出最优匹配结果时的最优模型参数,确定最终的电力设备识别模型。
在一些实施例中,步骤102可以包括步骤1021至步骤1023。
步骤1021:通过主干网络对电力设备图像数据集中的电力设备图像进行特征提取,得到第一图像特征。
将电力设备图像数据集中的图像输入到Darknet-53网络中,特征提取所用的网络除了Darknet-53之外,还有许多种类型网络,例如AlexNet、VGG等,相比较其他网络,Darknet-53是ResNet网络的变体,由残差块构成,相比于传统YOLOv3网络架构,采用Darknet-53作为主干网络,用学习残差代替直接学习一个完整的输出,有着更易优化的特点。
主干网络Darknet-53中添加了通道域自注意力机制,将通道域中的信息考虑在内,对特征图的不同通道添加一个权重,依据权重的大小表示该通道信号与所需关键信息的相关程度,权重越大,表示各个通道与关键信息的相关程度相关程度越高。在训练加入通道自注意力机制主干网络时,对所添加权重的通道采用类似Dropout的操作,每次训练时,跳过部分通道,使其暂时性失去作用,有利于简化运算过程。激活函数采用Mish函数,其函数图像如图2所示,Mish函数形式较为简单,在避免梯度消失问题的同时,有着较好的平滑性和泛化能力,可以使模型具有更加准确的识别率,Mish激活函数的主要表达式如下:
f(x)=x×tanh(log(1+ex)) (1)
在进行特征的卷积时,给每个通道信息赋予一定的权重,降低低效通道信息的影响,增强高效通道信息的作用。通过转换模块聚集特征的全局响应,保留不同阶段不同下采样倍数的特征图,得到多尺度全局特征。采用深度可分离卷积算法,主要操作步骤如下:分别提取3*3*3卷积核的RGB通道;将不同通道对应的二维卷积核与图像的对应RGB通道分别进行卷积操作;将卷积后的RGB通道结合,并与1*1*1的卷积核进行卷积。
卷积的过程中,以3*1的列向量和1*3的行向量代替主干网络中的3*3卷积核,将参数由9个简化为6个,提高了卷积的速度,得到的效果与直接和333卷积核卷积的结果是一样的,有效降低了计算复杂度。
步骤1022:通过多尺度特征双融合模块将第一图像特征中不同尺度的特征进行双向融合,得到第二图像特征。
在一些实施例中,步骤1022可以包括步骤10221至步骤10222。
步骤10221:将第一图像特征输入多尺度特征双融合模块,分别提取不同尺度和不同分辨率下的特征图。
将第一图像特征输入多尺度特征双融合模块,多尺度特征双融合模块为特征金字塔机制,将浅层信息和深层信息双向融合,生成互补语义信息,实现语义信息与纹理信息结合,达到对特征映射的细化,最终得到包含多分辨率特征图的第二图像特征。
将神经网络所提取的图像特征按照超分辨率的方法,通过不同的抽样因子实现尺度的归一化,并记录分辨率大小的关系。不同尺寸的特征图根据金字塔结构从下到上分辨率越来越小,分别表示为P1-P5,其中Pi层的特征图分辨率表示为Wi*Wi。
步骤10222:将不同分辨率下的特征图进行融合,将不同尺度的特征图进行双向融合,生成第二图像特征。
将小尺度特征和大尺度特征相融合,生成互补语义信息,完善特征映射,提高大尺度电力设备的识别效果,同时由于不同分辨率特征图对不同尺度目标物体的识别效果是不同的,例如尺度大的物体更加适合采用分辨率小的特征图,因此在不同分辨率特征图的双向融合时,不采用简单的相加融合,而是针对不同尺度电力设备的识别,给不同分辨率的特征图赋予不同的权重,进而完成特征图的优化融合,更加有利于不同尺度目标电力设备识别效果的提高。
具体的,将相邻不同分辨率特征图之间进行融合,高分辨率通过下采样的方式,低分辨率采用双线性插值的方式来调整分辨率大小进行融合。融合后进一步通过下采样和双线性插值的方式调整到原特征图的P1-P5大小,使得得到的不同尺寸的特征图在保留尽可能多的信息的同时,能够最大可能的适合不同尺寸电力能源设备的识别。结果表明,不同尺寸的目标物体其适合的特征图分辨率是不同的,小尺寸电力能源设备更适合高分辨率的特征图,大尺寸电力能源设备更适合低分辨率的特征图。指定相应的分配策略,通过以下公式将输入图像中宽度为w高度为h的电力能源设备目标物体区域分配到相应的不同分辨率层Pi:
Figure BDA0003471486540000111
图像的默认输入尺寸为256*256,i0默认为5,即若目标物体的尺寸w、h中的最大值达到了256,则采用P5层分辨率下的特征图。若选中区域的宽度、高度均为默认输入图像尺寸的一半128*128,则刚好得到i等于4,即向下走一层,采用P4分辨率下的特征图。
步骤1023:以最小化损失函数为目标,对第二图像特征进行匹配识别,获取输出最优匹配结果时的最优模型参数,根据最优模型参数确定电力设备识别模型。
一般的识别任务中,特征融合最常用的方式是直接融合,通过池化等方式,依据特征间通道数一致的特点完成融合。本发明的特征匹配模块采用不融合直接识别的方法,能够更有效的发现不同尺度的物体其最适合的识别分辨率。
将各个尺度的特征图进行全局平均池化,池化卷积核为2*2,将所得到的特征图输入YOLOv3中,YOLOv3模型中,通常最终用于匹配预测与标签时采用MSE函数作为损失函数,但是由于MSE函数对目标的尺度非常敏感,会导致结果精度差等问题。本发明中采用RIOU损失函数取代MSE函数,与MSE函数相比,改进后的损失函数具有尺度不变性,同时在矩形框没有重叠的区域依然可以计算损失函数值,结局了MSE函数对识别物体的尺寸敏感,导致识别精度差等问题,函数性能更加优异,RIOU函数的表达式如下:
Figure BDA0003471486540000112
计算损失函数的值,比较其数值大小,选取最终使用的特征图,该选取结果即为上述公式(2)的特征图选取结果。
综上,通过电力设备图像数据集进行模型训练,根据得出最优匹配结果时的模型参数,确定电力设备识别模型的参数设置为:
学习率learning_rate=0.001
训练轮数epochs=50
每次训练样本数量batch_size=64
通道自注意机制通道权重:
对识别效果所起作用效果前50%的通道赋予权重w1=0.7
对识别效果所起作用效果后50%的通道赋予权重w2=0.3
通道自注意力机制训练时Dropout失效率dropout_death=0.5
步骤103:将待识别电力设备图片输入电力设备识别模型,获得电力设备的识别结果。
本发明针对现有电力设备图像识别技术中存在的问题,提出了一种改进的基于图像分类网络的电力设备识别方法,使用改进的深度学习算法提升了模型的检测精度。图3示出了该电力设备识别模型的识别效果,经前后对比实验,结果表明识别精度比现有技术提升了22%。
参见图4,本申请实施例中的电力设备识别装置可以包括:数据采集模块410、训练模块420、识别模块430。
数据采集模块410,用于采集电力设备图像,对电力设备图像进行预处理,建立电力设备图像数据集。
训练模块420,用于基于电力设备图像数据集,训练得到电力设备识别模型。
识别模块430,用于将待识别电力设备图片输入电力设备识别模型,获得电力设备的识别结果。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种终端设备,参见图5,该终端设500可以包括:至少一个处理器510、存储器520以及存储在所述存储器520中并可在所述至少一个处理器510上运行的计算机程序,所述处理器510执行所述计算机程序时实现上述任意各个方法实施例中的步骤,例如图1所示实施例中的步骤101至步骤103。或者,处理器510执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能,例如图4所示模块410至430的功能。
示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器520中,并由处理器510执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序段,该程序段用于描述计算机程序在终端设备500中的执行过程。
本领域技术人员可以理解,图5仅仅是终端设备的示例,并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如输入输出设备、网络接入设备、总线等。
处理器510可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器520可以是终端设备的内部存储单元,也可以是终端设备的外部存储设备,例如插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。所述存储器520用于存储所述计算机程序以及终端设备所需的其他程序和数据。所述存储器520还可以用于暂时地存储已经输出或者将要输出的数据。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(E电力设备识别tended Industry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
本申请实施例提供的电力设备识别方法可以应用于计算机、可穿戴设备、车载设备、平板电脑、笔记本电脑、上网本、个人数字助理(personal digital assistant,PDA)、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、手机等终端设备上,本申请实施例对终端设备的具体类型不作任何限制。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述电力设备识别方法各个实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述电力设备识别方法各个实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种电力设备识别方法,其特征在于,包括:
采集电力设备图像,对所述电力设备图像进行预处理,建立电力设备图像数据集;
基于所述电力设备图像数据集,训练得到电力设备识别模型;
将待识别电力设备图片输入所述电力设备识别模型,获得电力设备的识别结果。
2.如权利要求1所述的电力设备识别方法,其特征在于,所述采集电力设备图像,对所述电力设备图像进行预处理,建立电力设备图像数据集,包括:
采集电力设备图像,将所述电力设备图像进行分割,截取电力设备存在的主要图像区域;
对所述主要图像区域内的电力设备进行标注,得到包含标注信息的电力设备图像数据集。
3.如权利要求1所述的电力设备识别方法,其特征在于,所述基于所述电力设备图像数据集,训练得到电力设备识别模型,包括:
通过主干网络对所述电力设备图像数据集中的电力设备图像进行特征提取,得到第一图像特征;
通过多尺度特征双融合模块将所述第一图像特征中不同尺度的特征进行双向融合,得到第二图像特征;
以最小化损失函数为目标,对所述第二图像特征进行匹配识别,获取输出最优匹配结果时的最优模型参数,根据所述最优模型参数确定电力设备识别模型。
4.如权利要求3所述的电力设备识别方法,其特征在于,所述主干网络为包含自注意力机制和Dropout机制的Darknet-53网络,所述Darknet-53网络的激活函数为Mish函数。
5.如权利要求4所述的电力设备识别方法,其特征在于,所述主干网络采用深度可分离卷积算法,所述深度可分离卷积算法,包括:
将多维卷积核分解为一个列向量和一个行向量,通过1*1卷积核进行卷积,将通道进行不同权重融合。
6.如权利要求3所述的电力设备识别方法,其特征在于,所述通过多尺度特征双融合模块将所述第一图像特征中不同尺度的特征进行双向融合,得到第二图像特征,包括:
将所述第一图像特征输入多尺度特征双融合模块,分别提取不同尺度和不同分辨率下的特征图;
将不同分辨率下的特征图进行融合,将不同尺度的特征图进行双向融合,生成第二图像特征。
7.如权利要求3所述的电力设备识别方法,其特征在于,所述损失函数为RIOU函数,所述以最小化损失函数为目标,对所述第二图像特征进行匹配识别,包括:
根据目标电力设备的目标尺寸,通过RIOU函数对所述第二图像特征中不同尺度的特征图与所述目标电力设备类型进行分别匹配和识别。
8.一种电力设备识别装置,其特征在于,包括:
数据采集模块,用于采集电力设备图像,对所述电力设备图像进行预处理,建立电力设备图像数据集;
训练模块,用于基于所述电力设备图像数据集,训练得到电力设备识别模型;
识别模块,用于将待识别电力设备图片输入所述电力设备识别模型,获得电力设备的识别结果。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述电力设备识别方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述电力设备识别方法的步骤。
CN202210044214.3A 2022-01-14 2022-01-14 电力设备识别方法、装置和终端设备 Pending CN114387489A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210044214.3A CN114387489A (zh) 2022-01-14 2022-01-14 电力设备识别方法、装置和终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210044214.3A CN114387489A (zh) 2022-01-14 2022-01-14 电力设备识别方法、装置和终端设备

Publications (1)

Publication Number Publication Date
CN114387489A true CN114387489A (zh) 2022-04-22

Family

ID=81201644

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210044214.3A Pending CN114387489A (zh) 2022-01-14 2022-01-14 电力设备识别方法、装置和终端设备

Country Status (1)

Country Link
CN (1) CN114387489A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114863354A (zh) * 2022-05-06 2022-08-05 广西柳工机械股份有限公司 一种工业物料的识别方法、装置、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114863354A (zh) * 2022-05-06 2022-08-05 广西柳工机械股份有限公司 一种工业物料的识别方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
JP7026826B2 (ja) 画像処理方法、電子機器および記憶媒体
TW202014984A (zh) 一種圖像處理方法、電子設備及存儲介質
CN111612008A (zh) 基于卷积网络的图像分割方法
Shen et al. Deep cross residual network for HEp-2 cell staining pattern classification
Dong Optimal Visual Representation Engineering and Learning for Computer Vision
Wang et al. Multiscale deep alternative neural network for large-scale video classification
CN111191654A (zh) 道路数据生成方法、装置、电子设备及存储介质
Jiang et al. Contour-aware network for semantic segmentation via adaptive depth
CN112257665A (zh) 图像内容的识别方法、图像识别模型的训练方法及介质
Ning et al. Occluded person re-identification with deep learning: a survey and perspectives
Zhang et al. Residual attentive feature learning network for salient object detection
Zhao et al. Double attention for multi-label image classification
Liao et al. Multi-scale saliency features fusion model for person re-identification
CN114387489A (zh) 电力设备识别方法、装置和终端设备
CN111582057A (zh) 一种基于局部感受野的人脸验证方法
CN116469172A (zh) 一种多时间尺度下的骨骼行为识别视频帧提取方法及系统
CN113221824B (zh) 基于个体模型生成的人体姿态识别方法
Pei et al. FGO-Net: Feature and Gaussian Optimization Network for visual saliency prediction
CN114863132A (zh) 图像空域信息的建模与捕捉方法、系统、设备及存储介质
CN117036658A (zh) 一种图像处理方法及相关设备
CN113192085A (zh) 三维器官图像分割方法、装置及计算机设备
CN113763313A (zh) 文本图像的质量检测方法、装置、介质及电子设备
Li et al. Global attention network for collaborative saliency detection
Zhang et al. Attentive feature integration network for detecting salient objects in images
CN111209948A (zh) 图像处理方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination