CN114693963A - 基于电力数据特征提取的识别模型训练、识别方法及装置 - Google Patents
基于电力数据特征提取的识别模型训练、识别方法及装置 Download PDFInfo
- Publication number
- CN114693963A CN114693963A CN202111529014.9A CN202111529014A CN114693963A CN 114693963 A CN114693963 A CN 114693963A CN 202111529014 A CN202111529014 A CN 202111529014A CN 114693963 A CN114693963 A CN 114693963A
- Authority
- CN
- China
- Prior art keywords
- model
- yolov5
- optimized
- module
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
Abstract
本发明提供了一种基于电力数据特征提取的识别模型训练、识别方法及装置,其中,基于电力数据特征提取的识别模型训练方法包括:获取训练数据集;将训练数据集输入优化YOLOv5模型中,对优化YOLOv5模型进行训练得到图像识别模型,优化YOLOv5模型使用YOLOv5模型作为基础模型,YOLOv5模型中包括卷积模块和C3模块,C3模块中包括Bottleneck子模块,将卷积模块和Bottleneck子模块中的k×k(k>1)卷积替换为反向深度可分离卷积,并在C3模块中的Bottleneck子模块后加入坐标注意力子模块,形成优化YOLOv5模型。将卷积替换为反向深度可分离卷积,显著降低了模型的计算量,并且,在C3模块中的Bottleneck子模块之后加入坐标注意力子模块,增强了空间融合后的特征图的位置敏感性,通过增加少量的计算量获得精度的显著提高。
Description
技术领域
本发明涉及图像识别技术领域,具体涉及一种基于电力数据特征提取的识别模型训练、识别方法及装置。
背景技术
目前在电力行业中,一直存在利用嵌入式设备在边缘侧智能计算和实时反馈的需求。但在一些场景中,过大的计算量仍然严重影响智能边缘设备的实用性。以输电巡检无人机航拍图像为例,要求模型在保持高识别精度的同时还要使用较少的计算资源,使得推理模型只能部署在带有较强算力支持的服务器或者台式机上。为了节省人力和时间,目前很多电力场景下都需要使用嵌入式设备进行边缘侧实时分析和智能反馈,比如无人机自动巡检。一些具有较高精度的检测模型通常需要大量的计算资源,受嵌入式设备资源的限制,目前的方案是在现场拍摄之后将图片带回,然后在带有GPU显卡的电脑或者服务器上进行推理,检测出缺陷后派相应维修人员根据检出的缺陷进行修理。这样一次检修,需要安排工作人员两次去现场,并且拍摄图片时间和修复时间存在一定的时间间隔,不利于缺陷的及时修理。虽然使用轻量级的模型能够减小计算量,但是使用轻量级的模型是以损失精度为代价来减小计算量的,因此,使用轻量级模型对图片进行处理,得到的结果精确度较差。
发明内容
因此,本发明要解决的技术问题在于克服现有技术中使用轻量级模型对图片进行处理,得到的结果精确度较差缺陷,从而提供一种基于电力数据特征提取的识别模型训练、识别方法及装置。
本发明第一方面提供了一种基于电力数据特征提取的识别模型训练方法,包括:获取训练数据集;将训练数据集输入优化YOLOv5模型中,对优化YOLOv5模型进行训练得到图像识别模型,优化YOLOv5模型使用YOLOv5模型作为基础模型,YOLOv5模型中包括卷积模块和C3模块,C3模块中包括Bottleneck子模块,将卷积模块和Bottleneck子模块中的k×k(k>1)卷积替换为反向深度可分离卷积,并在C3模块中的Bottleneck子模块后加入坐标注意力子模块,形成优化YOLOv5模型。
可选地,在本发明提供的基于电力数据特征提取的识别模型训练方法中,反向深度可分离卷积将卷积模块和Bottleneck子模块中的三维卷积核分解为逐点卷积和二维深度卷积;逐点卷积用于对输入特征图在通道位置上进行融合,并将经过通道融合的特征图输入到二维深度卷积;二维深度卷积用于对经过通道融合的特征图在空间位置上进行融合,并输出经过空间融合的特征图。
可选地,在本发明提供的基于电力数据特征提取的识别模型训练方法中,注意力子模块用于对经过空间融合的特征图在空间位置上对X方向和Y方向的特征进行局部融合。
可选地,在本发明提供的基于电力数据特征提取的识别模型训练方法中,将训练数据集输入优化YOLOv5模型中,对优化YOLOv5模型进行训练得到图像识别模型,包括:将训练数据集输入优化YOLOv5模型中对优化YOLOv5模型进行训练,得到当前优化YOLOv5模型;迭代一个epoch后,将m值加1,将验证数据集输入当前优化YOLOv5模型中,根据当前优化YOLOv5模型的输出结果计算当前优化YOLOv5模型的识别精度;若当前优化YOLOv5模型的识别精度高于预存最高精度,保留当前优化YOLOv5模型,以当前优化YOLOv5模型的识别精度代替预存最高精度;若当前优化YOLOv5模型的当前损失函数大于或等于预存损失函数,将n值加1;若m值大于或等于第一预设值,或,n值大于或等于第二预设值,将当前优化YOLOv5模型确定为图像识别模型。
可选地,在本发明提供的基于电力数据特征提取的识别模型训练方法中,若当前优化YOLOv5模型的识别精度小于或等于预存最高精度,执行若当前优化YOLOv5模型的当前损失函数大于或等于预存损失函数,将n值加1的步骤。
可选地,在本发明提供的基于电力数据特征提取的识别模型训练方法中,若m值小于第一预设值,且,n值小于第二预设值,返回将训练数据集输入优化YOLOv5模型中对优化YOLOv5模型进行训练,得到当前优化YOLOv5模型的步骤。
本发明第二方面提供了一种基于电力数据特征提取的识别方法,包括:获取待识别图像;将待识别图像输入图像识别模型,生成识别结果,图像识别模型通过如本发明第一方面提供的基于电力数据特征提取的识别模型训练方法训练得到。
本发明第三方面提供了一种基于电力数据特征提取的识别模型训练装置,包括:训练数据获取模块,用于获取训练数据集;模型训练模块,用于将训练数据集输入优化YOLOv5模型中,对优化YOLOv5模型进行训练得到图像识别模型,优化YOLOv5模型使用YOLOv5模型作为基础模型,YOLOv5模型中包括卷积模块和C3模块,C3模块中包括Bottleneck子模块,将卷积模块和Bottleneck子模块中的k×k(k>1)卷积替换为反向深度可分离卷积,并在C3模块中的Bottleneck子模块后加入坐标注意力子模块,形成优化YOLOv5模型。
本发明第四方面提供了一种基于电力数据特征提取的识别装置,包括:待识别图像获取模块,用于获取待识别图像;图像识别模块,用于将待识别图像输入图像识别模型,生成识别结果,图像识别模型通过如本发明第一方面提供的基于电力数据特征提取的识别模型训练方法训练得到。
本发明第五方面提供了一种计算机设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,从而执行如本发明第一方面提供的基于电力数据特征提取的识别模型训练方法,或,如本发明第二方面提供的基于电力数据特征提取的识别方法。
本发明技术方案,具有如下优点:
本发明提供的基于电力数据特征提取的识别模型训练、识别方法及装置,所使用的优化YOLOv5模型以YOLOv5模型作为基础模型,将YOLOv5模型中卷积模块和C3模块中的Bottleneck子模块的k×k(k>1)卷积替换为反向深度可分离卷积,显著降低了模型的计算量,在加入坐标注意力子模块后,将特征提取过程中被忽略的位置信息标记于卷积通道,并通过方向与特征信息在空间维度中加强模型的定位能力,通过引入坐标注意力子模块在增加不到1%的计算量的同时显著提升了图像识别模型的识别效果,提高了识别精度,又由于坐标注意力子模块放置在C3模块中的Bottleneck子模块之后,反向深度可分离卷积中的二维深度卷积对特征图中的特征在邻域内做空间融合,坐标注意力子模块对特征图在空间位置上对X方向和Y方向的特征进行了局部融合,在C3模块中反向深度可分离卷积之后引入坐标注意力子模块增强了空间融合后的特征图的位置敏感性,通过增加少量的计算量获得精度的显著提高。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中基于电力数据特征提取的识别模型训练方法的一个具体示例的流程图(一);
图2为本发明实施例中YOLOv5模型结构示意图;
图3为本发明实施例中YOLOv5模型中C3模块的结构示意图;
图4为本发明实施例中通过三维卷积核对输入图像的处理过程示意图;
图5为本发明实施例中通过反向深度可分离卷积对输入图像的处理过程示意图;
图6为本发明实施例中将YOLOv5模型中卷积模块k×k(k>1)卷积替换为反向深度可分离卷积后得到的卷积模块Re-dsc的结构示意图;
图7为本发明实施例中将YOLOv5模型的C3模块的Bottlenek子模块中的k×k(k>1)卷积替换为反向深度可分离卷积后,Bottleneck子模块的结构示意图;
图8为本发明实施例中坐标注意力子模块的结构示意图;
图9为本发明实施例中在C3模块中加入坐标注意力子模块coordatt后,C3模块的结构示意图;
图10为本发明实施例中的优化YOLOv5模型的结构示意图;
图11为本发明实施例中基于电力数据特征提取的识别模型训练方法的一个具体示例的流程图(二);
图12为本发明实施例中基于电力数据特征提取的识别方法的一个具体示例的流程图;
图13为本发明实施例中基于电力数据特征提取的识别模型训练装置的一个具体示例的原理框图;
图14为本发明实施例中基于电力数据特征提取的识别装置的一个具体示例的原理框图;
图15为本发明实施例中计算机设备的一个具体示例的原理框图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
本发明实施例提供了一种基于电力数据特征提取的识别模型训练方法,如图1所示,包括:
步骤S11:获取训练数据集。
在一可选实施实施例中,训练数据集中包括多个训练图像,训练图像根据实际需求进行确定,示例性地,若训练得到的图像识别模型用于识别输电线路的缺陷,则训练图像可以为包括绝缘子爆裂图像、鸟巢图像、防震锤损坏图像等21个类别的图像。并且,为了便于对初始模型进行训练,对各训练图像中的输电线路缺陷进行标注,示例性地,可以采用开源的标注软件Labelme对输电线路缺陷进行标注,标注包括21个类。
步骤S12:将训练数据集输入优化YOLOv5模型中,对优化YOLOv5模型进行训练得到图像识别模型,优化YOLOv5模型使用YOLOv5模型作为基础模型,YOLOv5模型中包括卷积模块和C3模块,C3模块中包括Bottleneck子模块,将卷积模块和Bottleneck子模块中的k×k(k>1)卷积替换为反向深度可分离卷积,并在C3模块中的Bottleneck子模块后加入坐标注意力子模块,形成优化YOLOv5模型。
在本发明实施例中,YOLOv5模型中包括多种卷积,通过各卷积运算实现特征提取,若训练得到的图像识别模型用于识别电力系统存在的缺陷,则YOLOv5模型中的各卷积运算用于提取电力数据特征。
YOLOv5模型中包括多种卷积,本发明实施例中只对k×k(k>1)卷积替换为反向深度可分离卷积。
在一可选实施例中,优化YOLOv5模型使用如图2所示的YOLOv5模型作为基础模型,在如图2所示的YOLOv5模型中,Conv为卷积模块,C3为C3模块,C3模块的结构如图3所示,C3模块中包括Bottlenek子模块和多个Conv子模块,本发明实施例中不会对所有的Conv进行替换,只将执行k×k(k>1)卷积的Conv进行替换,也不会对C3模块中Conv子模块进行替换,只会对Bottlenek子模块中的k×k(k>1)卷积进行替换。在常规的YOLOv5模型中,卷积模块和Bottleneck子模块中均采用三维卷积核,通过三维卷积核对输入图像的处理过程如图4所示。
在如图2所示的YOLOv5模型中,在不同的卷积模块中,卷积运算不同,并且,在Bottleneck子模块中,具有多种不同类型的卷积运算,在本发明实施例中,只将k×k(k>1)卷积替换为反向深度可分离卷积,示例性地,将YOLOv5模型中的6×6、3×3卷积替换为反向深度可分离卷积。
反向深度可分离卷积将YOLOv5中的k×k卷积从空间和通道维度进行解耦,分解为修改通道个数的逐点卷积和二维空间的深度卷积,将三维输入特征变成独立的通道维度和二维平面特征,替换后的反向深度可分离卷积如图5所示。
在一可选实施例中,将图2所示的YOLOv5模型的卷积模块Conv中的k×k(k>1)卷积替换为反向深度可分离卷积后形成卷积模块Re-dsc,卷积模块Re-dsc的结构如图6所示,将图2所示的YOLOv5模型的Bottlenek子模块中的k×k(k>1)卷积替换为反向深度可分离卷积后,替换后的Bottlenek子模块的结构如图7所示。
将k×k(k>1)卷积替换为反向深度可分离卷积后,先通过逐点卷积将输入通道的线性组合来构建新特征,然后,将特征图使用Concat操作串联起来进行深度卷积,深度卷积过程中为每个通道分配一个卷积核,将卷积后的特征图维度作为输入特征图。深度卷积完成后的特征图通道数量与输入特征图的通道数相同,无法扩展特征图。
由于深度卷积是对输入层的每个通道独立进行卷积运算,没有有效的利用不同通道在相同空间位置上的特征信息。因此需要使用逐点卷积来将这些特征图在通道上进行组合生成新的特征图。本发明实施例中通过使用深度卷积和逐点卷积互换的深度可分离卷积替代YOLOv5中的普通卷积,将普通的具有k×k×in_channel×out_channel(k=3或者k=6)的卷积核分解成两部分,第一部分是1×1×in_channel×out_channel的逐点卷积来对特征图在通道位置上进行融合,第二部分是k×k×in_channel的深度卷积来对特征图在空间位置上进行融合。
通过反向深度可分离卷积替换普通卷积有效降低了YOLOv5的乘加操作计算量和参数量,并且,相较于将普通卷积分解为先进行深度卷积,再进行逐点卷积的深度可分离卷积,本发明实施例中将普通卷积分解深度卷积和逐点卷积互换的反向深度可分离卷积,进一步降低了计算量。
在本发明实施例提供的基于电力数据特征提取的识别模型训练方法中,为了兼顾模型的计算资源使用量和精度,在将YOLOv5模型中的卷积替换为反向深度可分离卷积后,还增加了如图8所示的坐标注意力子模块,坐标注意力子模块是一种简单而高效的模块,通过嵌入位置信息到通道注意力使模型获取更大区域的信息而避免引入大的开销,使得模型能够在增加少量的计算量的同时显著提高模型的精度。
坐标注意力子模块分解通道注意为两个并行的一维特征编码来高效地整合空间坐标信息到生成的注意力图中。具体地,坐标注意力子模块先利用两个一维全局池化操作将沿垂直和水平方向的输入特征图分别聚合为两个单独的含特定方向信息的特征图;然后将这两个具有特定方向信息的特征图分别编码为两个注意力图,每个注意力图都沿一个空间方向捕获输入特征图的远距离依存关系,由此位置信息被保存在所生成的注意力图中;最后通过乘法将两个注意力图都应用于输入特征图,以强调注意区域的表示。
如图8所示,坐标注意力子模块分别对水平方向和垂直方向进行平均池化得到两个一维向量,然后在空间维度上串联起来(进行Concat操作)并使用1×1卷积来压缩通道,再通过批归一化(使用BatchNorm操作)和非线性激活(使用Non-linear操作)来编码垂直方向和水平方向的空间信息,接下来将得到的特征图分离(使用Split操作),各自通过1×1卷积来得到和输入特征图一样的通道数并进行Sigmoid激活,最后再扩展并通过乘法应用到输入特征图中。坐标注意力子模块中使用轻量化的1×1卷积进行操作,将特征提取过程中被忽略的位置信息标记于卷积通道,并通过方向与特征信息在空间维度中加强模型的定位能力。在两个独立维度上,坐标注意力子模块沿着不同维度分别进行注意力图推断,并在与特征图的提取基础上进行自适应优化。
使用坐标注意力子模块得到的注意力图具有对特征图的方向和位置信息敏感的特性。
在一可选实施例中,将坐标注意力子模块放置在C3模块中的Bottleneck子模块后,引入坐标注意力之后的C3模块的结构如图9所示,在图9所示的实施例中,coordatt为坐标注意力子模块,Bottlenek为将三维卷积替换为反向深度可分离卷积的Bottleneck子模块,即,在对特征图像进行反向深度可分离卷积后,将特征图输入到坐标注意力子模块中,由坐标注意力子模块在经过通道融合和空间融合的特征图中融入位置信息。
在本发明实施例中,将坐标注意力子模块引入到YOLOv5中C3模块中反向深度可分离卷积之后,反向深度可分离卷积中的二维深度卷积对特征图中的特征在邻域内做空间融合,坐标注意力子模块对特征图在空间位置上对X方向和Y方向的特征进行了局部融合,由此可见,在C3模块中反向深度可分离卷积之后引入坐标注意力子模块,增强了空间融合后的特征图的位置敏感性。
在一可选实施例中,将如图2所示的YOLOv5模型中的卷积模块和所述Bottleneck子模块中的k×k(k>1)卷积替换为反向深度可分离卷积,并在C3模块中的Bottleneck子模块后加入坐标注意力子模块后形成的优化YOLOv5模型如图10所示。
在一可选实施例中,为了验证将坐标注意力子模块放置在C3模块中的Bottleneck子模块后具有更好的性能,本发明实施例提供了将坐标注意力子模块放置在YOLOv5模型中不同位置时的试验结果:
表1
在上表1中,yolov5s表示原始的yolov5s模型,yolov5s-dsc表示使用深度可分离卷积的结果,yolov5s-dscrev表示使用反向深度可分离卷积的结果,yolov5s-dscrev-coordattConv表示在yolov5s-dscrev的基础上将坐标注意力子模块放置在如图7所示的Bottleneck的中的SiLU层和add层之间,yolov5s-dscrev-corrdattSPPF表示在yolov5s-dscrev的基础上将坐标注意力子模块放置在如图2所示的SPPF中,yolov5s-dscrev-corrdattC3_位置1表示在yolov5s-dscrev的基础上将坐标注意力子模块放置在图3所示的concat层和conv层之间,yolov5s-dscrev-corrdattC3_位置2表示在yolov5s-dscrev的基础上将坐标注意力子模块放置在图9所示的coordatt位置。
本发明实施例提供的基于电力数据特征提取的识别模型训练方法中所使用的优化YOLOv5模型。轻量化的YOLOv51参数数目降低了63.86%左右,乘加操作减少了61.25%左右,mAP只降低了约0.64%。轻量化的YOLOv5m参数数目降低了60.02%左右,乘加操作减少了56.06%左右,mAP只降低了约0.64%。轻量化的YOLOv5s参数数目降低了54.28%左右,乘加操作减少了47.11%左右,mAP只降低了约0.65%。
由上述试验结果可知,将坐标注意力子模块放置在C3模块中的Bottleneck子模块后具有更优的性能。
本发明实施例提供的基于电力数据特征提取的识别模型训练方法,将训练数据集输入到优化YOLOv5模型中,对优化YOLOv5模型进行训练得到图像识别模型,优化YOLOv5模型以YOLOv5模型作为基础模型,将YOLOv5模型中卷积模块和C3模块中的Bottleneck子模块的卷积替换为反向深度可分离卷积,显著降低了模型的计算量,在加入坐标注意力子模块后,将特征提取过程中被忽略的位置信息标记于卷积通道,并通过方向与特征信息在空间维度中加强模型的定位能力,通过引入坐标注意力子模块在增加不到1%的计算量的同时显著提升了图像识别模型的识别效果,提高了识别精度,又由于坐标注意力子模块放置在C3模块中的Bottleneck子模块之后,反向深度可分离卷积中的二维深度卷积对特征图中的特征在邻域内做空间融合,坐标注意力子模块对特征图在空间位置上对X方向和Y方向的特征进行了局部融合,在C3模块中反向深度可分离卷积之后引入坐标注意力子模块增强了空间融合后的特征图的位置敏感性,通过增加少量的计算量获得精度的显著提高。
在一可选实施例中,如图11所示,在本发明实施提供的基于电力数据特征提取的识别模型训练方法中,通过训练数据集对优化YOLOv5模型进行训练的过程具体包括:
步骤S121:将训练数据集输入优化YOLOv5模型中对优化YOLOv5模型进行训练,得到当前优化YOLOv5模型。
步骤S122:迭代一个epoch后,将m值加1,将验证数据集输入当前优化YOLOv5模型中,根据当前优化YOLOv5模型的输出结果计算当前优化YOLOv5模型的识别精度。
在一可选实施例中,可以将训练过程中的中批大小设置为64,交并比的损失阈值大小设置为0.5,设置初始学习率为0.01。
步骤S123:判断当前优化YOLOv5模型的识别精度是否高于预存最高精度。若判定当前优化YOLOv5模型的识别精度高于预存最高精度,执行步骤S124;若判定当前优化YOLOv5模型的识别精度小于或等于预存最高精度,直接执行步骤S125。在本发明实施例中,预存最高精度为之前多次迭代过程中得到的最高精度
步骤S124:保留当前优化YOLOv5模型,以当前优化YOLOv5模型的识别精度代替预存最高精度。
步骤S125:判断当前优化YOLOv5模型的当前损失函数是否小于预存损失函数。若当前优化YOLOv5模型的当前损失函数大于或等于预存损失函数,执行步骤S126;若当前优化YOLOv5模型的当前损失函数小于预存损失函数,将n设置为1并以当前损失函数替代所属预存损失函数,随后执行步骤S127。在本发明实施例中,若当前损失函数小于预存损失函数,则将预存损失函数更新为当前损失函数,若当前损失函数大于预存损失函数,不对损失函数进行更新。
步骤S126:将n值加1。
步骤S127:判断m值是否大于或等于第一预设值,以及n值是否大于或等于第二预设值。
若m值大于或等于第一预设值,或,n值大于或等于第二预设值,将当前优化YOLOv5模型确定为图像识别模型。
若m值小于第一预设值,且,n值小于第二预设值,返回上述步骤S121。
在本发明实施例中,m值表示迭代的epoch数,n表示损失函数持续不下降的epoch数,当迭代的epoch数大于或等于第一预设值,或,损失函数持续不低于同一预存损失函数的epoch数大于或等于第二预设值时,停止训练,将当前优化YOLOv5模型确定为图像识别模型。
在一可选实施例中,第一预设值和第二预设值可根据实际需求进行设定,示例性地,第一预设值可以设置为1000,第二预设值可以设置为100,即,在迭代1000个epoch,或,持续100epoch损失函数不下降时,停止训练,将当前优化YOLOv5模型确定为图像识别模型。
本发明实施例提供了一种基于电力数据特征提取的识别方法,如图12所示,包括:
步骤S21:获取待识别图像。
在一可选实施例中,待识别图像可以为输电线路的图像。
步骤S22:将待识别图像输入图像识别模型,生成识别结果,图像识别模型通过如上述任一实施例中提供的基于电力数据特征提取的识别模型训练方法训练得到。
在一可选实施例中,将输电线路的图像输入到图像识别模型中,生成的识别结果包括图像中的输电线路存在的缺陷。
本发明实施例提供了一种基于电力数据特征提取的识别模型训练装置,如图13所示,包括:
训练数据获取模块11,用于获取训练数据集,详细内容参见上述方法实施例中的描述,在此不再赘述。
模型训练模块12,用于将训练数据集输入优化YOLOv5模型中,对优化YOLOv5模型进行训练得到图像识别模型,优化YOLOv5模型使用YOLOv5模型作为基础模型,YOLOv5模型中包括卷积模块和C3模块,C3模块中包括Bottleneck子模块,将卷积模块和Bottleneck子模块中的卷积替换为反向深度可分离卷积,并在C3模块中的Bottleneck子模块后加入坐标注意力子模块,形成优化YOLOv5模型,详细内容参见上述方法实施例中的描述,在此不再赘述。
本发明实施例提供了一种基于电力数据特征提取的识别装置,如图14所示,包括:
待识别图像获取模块21,用于获取待识别图像,详细内容参见上述方法实施例中的描述,在此不再赘述。
图像识别模块22,用于将待识别图像输入图像识别模型,生成识别结果,图像识别模型通过如上述任一实施例中提供的的基于电力数据特征提取的识别模型训练方法训练得到,详细内容参见上述方法实施例中的描述,在此不再赘述。
本发明实施例提供了一种计算机设备,如图15所示,该计算机设备主要包括一个或多个处理器31以及存储器32,图15中以一个处理器31为例。
该计算机设备还可以包括:输入装置33和输出装置34。
处理器31、存储器32、输入装置33和输出装置34可以通过总线或者其他方式连接,图15中以通过总线连接为例。
处理器31可以为中央处理器(Central Processing Unit,CPU)。处理器31还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。存储器32可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据基于电力数据特征提取的识别模型训练装置,或,基于电力数据特征提取的识别装置的使用所创建的数据等。此外,存储器32可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器32可选包括相对于处理器31远程设置的存储器,这些远程存储器可以通过网络连接至基于电力数据特征提取的识别模型训练装置,或,基于电力数据特征提取的识别装置。输入装置33可接收用户输入的计算请求(或其他数字或字符信息),以及产生与基于电力数据特征提取的识别模型训练装置,或,基于电力数据特征提取的识别装置有关的键信号输入。输出装置34可包括显示屏等显示设备,用以输出计算结果。
本发明实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储计算机指令,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的基于电力数据特征提取的识别模型训练方法,或,基于电力数据特征提取的识别方法。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(HardDisk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;存储介质还可以包括上述种类的存储器的组合。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (10)
1.一种基于电力数据特征提取的识别模型训练方法,其特征在于,包括:
获取训练数据集;
将所述训练数据集输入优化YOLOv5模型中,对所述优化YOLOv5模型进行训练得到图像识别模型,所述优化YOLOv5模型使用YOLOv5模型作为基础模型,所述YOLOv5模型中包括卷积模块和C3模块,所述C3模块中包括Bottleneck子模块,将所述卷积模块和所述Bottleneck子模块中的k×k(k>1)卷积替换为反向深度可分离卷积,并在C3模块中的Bottleneck子模块后加入坐标注意力子模块,形成所述优化YOLOv5模型。
2.根据权利要求1所述的基于电力数据特征提取的识别模型训练方法,其特征在于,
所述反向深度可分离卷积将所述卷积模块和所述Bottleneck子模块中的三维卷积核分解为逐点卷积和二维深度卷积;
所述逐点卷积用于对输入特征图在通道位置上进行融合,并将经过通道融合的特征图输入到二维深度卷积;
所述二维深度卷积用于对经过通道融合的特征图在空间位置上进行融合,并输出经过空间融合的特征图。
3.根据权利要求2所述的基于电力数据特征提取的识别模型训练方法,其特征在于,
所述注意力子模块用于对经过空间融合的特征图在空间位置上对X方向和Y方向的特征进行局部融合。
4.根据权利要求1所述的基于电力数据特征提取的识别模型训练方法,其特征在于,将所述训练数据集输入优化YOLOv5模型中,对所述优化YOLOv5模型进行训练得到图像识别模型,包括:
将所述训练数据集输入优化YOLOv5模型中对所述优化YOLOv5模型进行训练,得到当前优化YOLOv5模型;
迭代一个epoch后,将m值加1,将验证数据集输入所述当前优化YOLOv5模型中,根据所述当前优化YOLOv5模型的输出结果计算所述当前优化YOLOv5模型的识别精度;
若所述当前优化YOLOv5模型的识别精度高于预存最高精度,保留所述当前优化YOLOv5模型,以所述当前优化YOLOv5模型的识别精度代替所述预存最高精度;
若所述当前优化YOLOv5模型的当前损失函数大于或等于预存损失函数,将n值加1;
若m值大于或等于第一预设值,或,n值大于或等于第二预设值,将所述当前优化YOLOv5模型确定为所述图像识别模型。
5.根据权利要求4所述的基于电力数据特征提取的识别模型训练方法,其特征在于,
若所述当前优化YOLOv5模型的识别精度小于或等于所述预存最高精度,执行若所述当前优化YOLOv5模型的当前损失函数大于或等于预存损失函数,将n值加1的步骤。
6.根据权利要求4或5所述的基于电力数据特征提取的识别模型训练方法,其特征在于,
若m值小于所述第一预设值,且,n值小于所述第二预设值,返回将所述训练数据集输入优化YOLOv5模型中对所述优化YOLOv5模型进行训练,得到当前优化YOLOv5模型的步骤。
7.一种基于电力数据特征提取的识别方法,其特征在于,包括:
获取待识别图像;
将所述待识别图像输入图像识别模型,生成识别结果,所述图像识别模型通过如权利要求1-6中任一项所述的基于电力数据特征提取的识别模型训练方法训练得到。
8.一种基于电力数据特征提取的识别模型训练装置,其特征在于,包括:
训练数据获取模块,用于获取训练数据集;
模型训练模块,用于将所述训练数据集输入优化YOLOv5模型中,对所述优化YOLOv5模型进行训练得到图像识别模型,所述优化YOLOv5模型使用YOLOv5模型作为基础模型,所述YOLOv5模型中包括卷积模块和C3模块,所述C3模块中包括Bottleneck子模块,将所述卷积模块和所述Bottleneck子模块中的k×k(k>1)卷积替换为反向深度可分离卷积,并在C3模块中的Bottleneck子模块后加入坐标注意力子模块,形成所述优化YOLOv5模型。
9.一种基于电力数据特征提取的识别装置,其特征在于,包括:
待识别图像获取模块,用于获取待识别图像;
图像识别模块,用于将所述待识别图像输入图像识别模型,生成识别结果,所述图像识别模型通过如权利要求1-6中任一项所述的基于电力数据特征提取的识别模型训练方法训练得到。
10.一种计算机设备,其特征在于,包括:
至少一个处理器:以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,从而执行如权利要求1-6中任一项所述的基于电力数据特征提取的识别模型训练方法,或,如权利要求7所述的基于电力数据特征提取的识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111529014.9A CN114693963A (zh) | 2021-12-15 | 2021-12-15 | 基于电力数据特征提取的识别模型训练、识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111529014.9A CN114693963A (zh) | 2021-12-15 | 2021-12-15 | 基于电力数据特征提取的识别模型训练、识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114693963A true CN114693963A (zh) | 2022-07-01 |
Family
ID=82135732
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111529014.9A Pending CN114693963A (zh) | 2021-12-15 | 2021-12-15 | 基于电力数据特征提取的识别模型训练、识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114693963A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115565051A (zh) * | 2022-11-15 | 2023-01-03 | 浙江芯昇电子技术有限公司 | 轻量级人脸属性识别模型训练方法、识别方法及设备 |
CN116468730A (zh) * | 2023-06-20 | 2023-07-21 | 齐鲁工业大学(山东省科学院) | 基于YOLOv5算法的航拍绝缘子图像缺陷检测方法 |
-
2021
- 2021-12-15 CN CN202111529014.9A patent/CN114693963A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115565051A (zh) * | 2022-11-15 | 2023-01-03 | 浙江芯昇电子技术有限公司 | 轻量级人脸属性识别模型训练方法、识别方法及设备 |
CN115565051B (zh) * | 2022-11-15 | 2023-04-18 | 浙江芯昇电子技术有限公司 | 轻量级人脸属性识别模型训练方法、识别方法及设备 |
CN116468730A (zh) * | 2023-06-20 | 2023-07-21 | 齐鲁工业大学(山东省科学院) | 基于YOLOv5算法的航拍绝缘子图像缺陷检测方法 |
CN116468730B (zh) * | 2023-06-20 | 2023-09-05 | 齐鲁工业大学(山东省科学院) | 基于YOLOv5算法的航拍绝缘子图像缺陷检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3637317A1 (en) | Method and apparatus for generating vehicle damage information | |
CN107944450B (zh) | 一种车牌识别方法及装置 | |
US11481862B2 (en) | System and method for real-time, simultaneous object detection and semantic segmentation | |
US20200357196A1 (en) | Method and apparatus for vehicle damage assessment, electronic device, and computer storage medium | |
CN110674788A (zh) | 车辆定损方法和装置 | |
CN114693963A (zh) | 基于电力数据特征提取的识别模型训练、识别方法及装置 | |
CN115880536B (zh) | 数据处理方法、训练方法、目标对象检测方法及装置 | |
CN112132216B (zh) | 车型识别方法、装置、电子设备及存储介质 | |
CN113657409A (zh) | 车辆损失检测方法、装置、电子设备及存储介质 | |
CN115131797A (zh) | 一种基于特征增强金字塔网络的场景文本检测方法 | |
CN114820679A (zh) | 图像标注方法、装置、电子设备和存储介质 | |
CN111160312A (zh) | 目标识别方法、装置和电子设备 | |
CN114612741A (zh) | 缺陷识别模型的训练方法、装置、电子设备及存储介质 | |
CN116246287B (zh) | 目标对象识别方法、训练方法、装置以及存储介质 | |
EP4083938A2 (en) | Method and apparatus for image annotation, electronic device and storage medium | |
CN114429631B (zh) | 三维对象检测方法、装置、设备以及存储介质 | |
CN112633089B (zh) | 一种视频行人重识别方法、智能终端及存储介质 | |
CN115115793A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN113239994A (zh) | 基于YOLOv4-tiny算法的电网缺陷检测方法、装置、存储介质及电子设备 | |
CN112686882A (zh) | 用于已架设在管道支撑架上的管道的稳定情况的检测方法 | |
US20220335737A1 (en) | Method and apparatus for image annotation, and storage medium | |
CN111652226B (zh) | 基于图片的目标识别方法、装置及可读存储介质 | |
CN117710755B (zh) | 一种基于深度学习的车辆属性识别系统及方法 | |
CN116563840B (zh) | 基于弱监督跨模态对比学习的场景文本检测与识别方法 | |
CN114639037B (zh) | 确定高速服务区的车辆饱和的方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |