CN117079092A - 带电作业引线剥离区域识别方法、装置、设备及存储介质 - Google Patents

带电作业引线剥离区域识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN117079092A
CN117079092A CN202311099606.0A CN202311099606A CN117079092A CN 117079092 A CN117079092 A CN 117079092A CN 202311099606 A CN202311099606 A CN 202311099606A CN 117079092 A CN117079092 A CN 117079092A
Authority
CN
China
Prior art keywords
image
lead
model
yolov7
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311099606.0A
Other languages
English (en)
Inventor
熊永华
张正发
虞安军
魏龙生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences
Original Assignee
China University of Geosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences filed Critical China University of Geosciences
Priority to CN202311099606.0A priority Critical patent/CN117079092A/zh
Publication of CN117079092A publication Critical patent/CN117079092A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明针对高空高压作业环境以及强光或弱光的复杂光照情况提出一种新的综合性引线剥离区域识别方法,以实现高效、准确、鲁棒性强的引线剥离区域识别。通过引入全局直方图均衡化和全变分去噪等预处理技术,能够有效克服复杂光照条件和噪声干扰对识别结果的影响,提高算法的稳定性和可靠性。同时,本发明还引入Ghost模块和形状损失函数对YOLOv7模型进行改进,进一步优化识别算法,使其能够适应不同地区和场景下引线的多样性。通过对引线剥离区域的精准识别,本发明旨在提高带电作业的安全性和效率,减少人工识别选择剥离区域的工作量,为智能化配网和带电作业提供更加可靠的技术支持。

Description

带电作业引线剥离区域识别方法、装置、设备及存储介质
技术领域
本发明涉及引线剥离区识别技术领域,特别涉及一种带电作业引线剥离区域识别方法、装置、设备及存储介质。
背景技术
在配网带电作业中,引线剥离区域识别是一项关键的任务。在电力配网过程中,电力引线是将电能从变电站传输到各个用户的关键组成部分。而在带电作业中,需要进行引线剥离,即将引线与其他部件分离,进行维护、检修或更换工作。引线剥离区域的准确定位和识别对于带电作业的安全与高效至关重要。在国内,随着智能设备在电力系统中的不断应用,配电系统中使用的带电作业机器人受到了广泛的关注,并通过国家电网公司与多所高校的合作取得了一系列成果。然而,由于输电线路的布置多样,工作环境不是固定的,视觉传感器在室外条件下会受到光线的影响,因此配电系统中使用的带电工作机器人的自动操作仍然存在许多不同的挑战。
在配电系统的带电作业中,带电线剥离和其他接线作业约占总工作量的41.7%。其中最重要的任务之一是将剥去绝缘皮的排水线路头部与同样剥去绝缘皮的主输电线路区域重叠,并用线夹固定在一起。因此,利用视觉传感器来识别和定位剥离区域,从而指导工作机器人的操作是非常重要的。
综上所述,在配网带电作业中,引线剥离区域识别是一项关键的任务。在电力配网过程中,电力引线是将电能从变电站传输到各个用户的关键组成部分。引线剥离区域的准确定位和识别对于带电作业的安全与高效至关重要。
对于传统的复杂光照环境引线剥离区域识别方法,首先,对采集到的引线图像进行去噪处理,这是非常重要的一步,因为高空高压作业环境中引线图像往往会受到椒盐噪声的影响,影响图像质量。选择中值滤波法来去除这些噪声,同时保持图像的边缘信息,从而为后续的处理提供更清晰的图像。接下来,使用Canny边缘检测算法对图像进行边缘提取。Canny算法是一种常用的边缘检测方法,它能够提取引线的精确边界,并将引线与背景分离。然后,由于高空高压作业环境中的光照条件复杂,采用自适应阈值分割方法来将图像转换为二值化图像。这种方法能够根据图像局部区域的灰度特征自动选择合适的阈值,适应不同光照条件下的图像处理。在得到二值化的引线图像后,将进一步进行特征提取。考虑到引线的形状和纹理特征对于识别非常重要。形状特征包括引线的周长、面积等信息,这些特征能够帮助准确地定位引线的位置。而纹理特征可以使用局部二值模式(LBP)、灰度共生矩阵(GLCM)等方法进行提取,这些特征能够反映引线的纹理信息,帮助识别不同类型的引线。最后,将形状特征和纹理特征进行融合,并利用机器学习算法(如支持向量机、随机森林等)进行引线剥离区域的识别。通过训练大量的引线图像数据,可以建立一个有效的引线剥离区域识别模型,能够在高空高压作业环境下准确识别引线的位置,帮助工作人员快速找到引线,并确保带电作业的安全和高效进行。
然而,在现有的带电作业中,引线剥离区域识别技术存在多方面的挑战和缺点。高空高压作业环境下,引线剥离区域识别面临着复杂的光照条件和环境限制。高空高压作业环境通常存在强光或弱光情况,这会导致引线图像的亮度和对比度变化较大,增加了识别算法的难度。其次,图像中可能存在各种类型的噪声,如高斯噪声或椒盐噪声,这些噪声会干扰识别算法的表现。此外,引线的形状多样性使得传统算法难以适应不同地区、不同场景下的引线。同时,引线的位置和角度可能出现变化,需要算法具备一定的鲁棒性。最后,传统的引线剥离区域识别方法往往使用简单的特征提取和分类器,对于光照不均匀和引线形状复杂的情况表现不佳。这些不足导致了识别算法在高空高压作业环境下的准确率和稳定性都受到了限制,容易出现误识别或漏识别的情况,无法满足实际应用需求。一些传统算法可能需要大量的计算,导致处理速度较慢,不适用于实时应用。
发明内容
为了解决克服复杂光照条件和噪声干扰对识别结果的影响这一技术问题。本发明针对高空高压作业环境以及强光或弱光的复杂光照情况提出一种新的综合性引线剥离区域识别方法、装置、设备及存储介质,以实现高效、准确、鲁棒性强的引线剥离区域识别。通过引入全局直方图均衡化和全变分去噪等预处理技术,能够有效克服复杂光照条件和噪声干扰对识别结果的影响,提高算法的稳定性和可靠性。同时,还引入Ghost模块和形状损失函数对YOLOv7模型进行改进,进一步优化识别算法,使其能够适应不同地区和场景下引线的多样性。通过对引线剥离区域的精准识别,本发明旨在提高带电作业的安全性和效率,减少人工识别选择剥离区域的工作量,为智能化配网和带电作业提供更加可靠的技术支持。
根据本发明的第一方面,本发明提供了一种带电作业引线剥离区域识别方法,包括以下步骤:
采集彩色引线图像;
采用全局直方图均衡化和全变分去噪方法对彩色引线图像进行预处理,得到去噪后的彩色引线图像;
将YOLOv7作为基础模型,并结合Ghost模块和形状损失得到改进后的YOLOv7模型;
将去噪后的彩色引线图像与原始彩色引线图像输入改进后的YOLOv7模型中,通过Ghost模块进行特征融合,得到特征融合后的图像;
通过特征融合后的图像和引线剥离区域的真实标签图像计算损失函数,并根据损失函数优化网络参数,得到优化后的YOLOv7目标检测模型;
通过优化后的YOLOv7目标检测模型对特征融合后的图像进行目标检测,得到引线剥离区域的识别结果。
进一步地,所述采用全局直方图均衡化和全变分去噪方法对彩色引线图像进行预处理,得到去噪后的彩色引线图像的步骤,包括:
将彩色引线图像转换为YCrCb色彩空间,并提取亮度通道Y;
对亮度通道Y进行全局直方图均衡化,合并通道输出均衡化处理后的彩色图像。
进一步地,所述采用全局直方图均衡化和全变分去噪方法对彩色引线图像进行预处理,得到去噪后的彩色引线图像的步骤,还包括:
将均衡化处理后的彩色图像转换为灰度图像;
使用全变分去噪方法对灰度图像进行去噪处理,得到去噪后的彩色引线图像。
进一步地,所述Ghost模块是一种轻量级的特征提取模块,用于在YOLOv7模型中通过增加通道之间的交互来增强特征表示能力。
所述Ghost模块包括Ghost Shuffle和Ghost Bottleneck;
所述Ghost Shuffle首先将输入的特征图分成两个子特征图,然后通过通道交换来增强特征之间的交互;所述Ghost Bottleneck通过堆叠多个Ghost Shuffle块来构建Ghost模块,增模型的深度和非线性表达能力。
进一步地,结Ghost模块对YOLOv7模型进行改进的实现过程如下:
将YOLOv7模型的CBS结构中的Conv卷积替换为Ghost模块。
进一步地,结合形状损失对YOLOv7模型进行改进,得到的损失函数表达式如下;
L2=L1+Lshape
其中,L1为YOLOv7模型的原始损失,Lshape为形状损失。
进一步地,所述形状损失去采用IoU形状相似性指标来计算模型预测的轮廓与真实轮廓的匹配程度。
根据本发明的第二方面,本发明提供了一种带电作业引线剥离区域识别装置,包括以下模块:
采集模块,用于采集彩色引线图像;
预处理模块,用于采用全局直方图均衡化和全变分去噪方法对彩色引线图像进行预处理,得到去噪后的彩色引线图像;
改进模块,用于将YOLOv7作为基础模型,并结合Ghost模块和形状损失得到改进后的YOLOv7模型;
融合模块,用于将去噪后的彩色引线图像与原始彩色引线图像输入改进后的YOLOv7模型中,通过Ghost模块进行特征融合,得到特征融合后的图像;
优化模块,用于通过特征融合后的图像和引线剥离区域的真实标签图像计算损失函数,并根据损失函数优化网络参数,得到优化后的YOLOv7目标检测模型;
识别模块,用于通过优化后的YOLOv7目标检测模型对特征融合后的图像进行目标检测,得到引线剥离区域的识别结果。
根据本发明的第三方面,本发明提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的带电作业引线剥离区域识别方法的步骤。
根据本发明的第四方面,本发明提供了一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现所述的带电作业引线剥离区域识别方法的步骤。
本发明提供的技术方案具有以下有益效果:
1、本发明通过YOLOv7模型引入了Feature Pyramid Network(FPN)和PANet,实现了多尺度特征融合,使得模型能够充分利用不同层级的特征信息,提高对不同大小引线剥离区域的检测能力。通过多尺度特征融合,模型可以更好地适应复杂作业场景中引线剥离区域的多样性和光照变化。
2、本发明采用全局直方图均衡化和全变分去噪作为图像预处理的方法,能够有效地提升图像质量和去除噪声干扰。全局直方图均衡化增强图像的对比度和亮度分布,全变分去噪降低图像中的噪声。这些预处理步骤使得引线剥离区域更易于被模型准确识别,提高了模型的鲁棒性。
3、本发明引入Ghost模块和形状损失函数,其中Ghost模块增加了特征之间的交互,形状损失函数约束了模型学习引线剥离区域的形状特征。这些技术使得模型更具有对引线剥离区域的感知能力,从而提高了引线剥离区域的识别精度和稳定性。通过引入这些关键技术,本发明在复杂形状的引线剥离区域识别上具有明显的优势。
4、本发明以YOLOv7为基础模型,具有较快的推理速度和较高的目标检测准确性。同时,引入Ghost模块和形状损失函数进行改进,能够提升模型的特征表达能力和形状识别能力,进一步提高了引线剥离区域的识别精度。这种平衡性使得本方案在实际应用中具有更好的性能。
故本发明方案相较于传统方法在多尺度特征融合、图像预处理和特征表达能力上有明显的优势。通过引入Ghost模块和形状损失函数,使得模型在复杂形状和光照变化的引线剥离区域识别上更为准确和稳定。此外,本发明在保持模型效率的同时提高了引线剥离区域识别的准确性,使得该技术方案在实际应用中更加可靠和实用。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明实施例中一种带电作业引线剥离区域识别方法的总体流程图;
图2是本发明实施例中全局直方图均衡化流程图;
图3是本发明实施例中全变分去噪方法流程图;
图4是本发明实施例中改进后的YOLOv7模型引线剥离区域检测流程图;
图5是本发明实施例中引线剥离区域原图识别结果;
图6是本发明实施例中引线全局直方图均衡化后识别结果;
图7是本发明实施例中引线全局直方图均衡化及全变分去噪后识别结果;
图8是本发明实施例中一种带电作业引线剥离区域识别装置的结构示意图;
图9是本发明实施例中一种电子设备的结构示意图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
请参考图1,本发明实施例中提供了一种带电作业引线剥离区域识别方法,其主要包括以下步骤:
S1:采集彩色引线图像;
S2:采用全局直方图均衡化和全变分去噪方法对彩色引线图像进行预处理,得到去噪后的彩色引线图像;
S3:将YOLOv7作为基础模型,并结合Ghost模块和形状损失得到改进后的YOLOv7模型;
S4:将去噪后的彩色引线图像与原始彩色引线图像输入改进后的YOLOv7模型中,通过Ghost模块进行特征融合,得到特征融合后的图像;
S5:通过特征融合后的图像和引线剥离区域的真实标签图像计算损失函数,并根据损失函数优化网络参数,得到优化后的YOLOv7目标检测模型;
S6:通过优化后的YOLOv7目标检测模型对特征融合后的图像进行目标检测,得到引线剥离区域的识别结果。
基于但不限于上述方法,步骤S1的具体实现过程如下:
数据采集:使用手机在不同光照环境下拍摄引线剥离区域识别彩色图像,采集的图像具有真实性和多样性,确保数据集能够充分覆盖实际带电作业场景中的引线剥离区域。
数据标注:使用Labelimg工具进行手动标注,标注具有准确性和可靠性。采用多人标注并且验证,以确保标注结果的一致性和可信度。
基于但不限于上述方法,步骤S2的具体实现过程如下:
在带电作业中,引线剥离区域图像可能受到复杂的光照条件影响,导致图像的对比度不足,细节不清晰,甚至出现部分区域过亮或过暗的情况。为了在后续的引线剥离区域识别过程中获得更好的效果,引入全局直方图均衡化作为预处理步骤。
全局直方图均衡化是一种增强图像对比度和亮度的方法,其基本思想是通过重新分配图像像素的灰度值,将图像的直方图均匀分布在整个灰度范围内。这样做的结果是增强了图像的对比度,使得原本较暗的区域变得更明亮,原本较亮的区域变得更暗,从而提高了图像中特征和细节的可见性。
在带电作业引线剥离区域图像的预处理中,将彩色图像进行通道分离,并对其亮度通道进行全局直方图均衡化。这一步骤能够有效地增强图像的对比度和亮度,使得引线剥离区域在图像中更加显著和清晰。例如,在复杂光照环境下,图像可能出现部分区域过暗,经过全局直方图均衡化后,这些过暗的区域将变得更明亮,更容易被识别和定位。
通过全局直方图均衡化,能够使引线剥离区域图像在后续处理中更加容易提取特征和进行目标识别。这对于提高带电作业引线剥离区域的自动化识别和定位效果非常重要,能够帮助作业人员更准确地判断引线剥离区域的位置和状态,提高作业的安全性和效率。同时,全局直方图均衡化是一种简单有效的图像预处理方法,可以很方便地与其他处理方法结合使用,进一步提高引线剥离区域图像的质量和可用性。
全局直方图均衡化的过程如图2所示,包括以下步骤:
输入彩色引线图像,简称RGB图像;
将彩色引线图像转换为YCrCb色彩空间,并进行通道分离,提取亮度通道Y;
对亮度通道Y进行全局直方图均衡化,合并通道后,将YCrCb色彩空间转换成彩色引线图像,输出均衡化处理后的彩色图像。
全变分去噪是一种常用的图像去噪方法,它可以在带电作业引线剥离区域图像的预处理中有效地去除噪声,提升图像质量,从而为后续的引线剥离区域识别和定位提供更好的输入。
在带电作业中,由于工作环境复杂,引线剥离区域图像往往会受到各种噪声的影响,例如高斯噪声、椒盐噪声等。这些噪声会导致图像细节模糊,影响引线剥离区域的边缘和轮廓,从而影响后续的识别和定位准确性。全变分去噪通过最小化图像的梯度变化来实现去噪,其基本思想是让图像中相邻像素的灰度值尽量相似。在全变分去噪中,可以将彩色图像转换为灰度图像,并应用全变分去噪方法来去除噪声。该方法能够保留图像的边缘信息,同时有效地去除噪声,使得引线剥离区域图像在后续处理中更加清晰和易于识别,完成去噪处理后再将灰度图像转化为彩色图像。
全变分去噪方法的优势在于可以在去噪的同时保留图像的边缘和细节信息,避免了传统去噪方法可能造成的图像模糊问题。这对于引线剥离区域的识别非常重要,因为引线剥离区域往往是带电作业中最重要的目标之一,其准确定位对于作业的安全和稳定至关重要。
全变分去噪方法的具体流程如图3所示,包括:
输入衡化处理后的彩色图像;
定义多通道能量函数;
将均衡化处理后的彩色图像转换为灰度图像;
使用全变分去噪方法最小化能量函数实现对灰度图像进行去噪处理,得到去噪后的彩色引线图像。
通过全局直方图均衡化和全变分去噪方法两种技术结合起来,可以在保持图像特征的同时去除图像中的噪声和增强图像的对比度。在图像数据增强过程中,首先对图像进行全局直方图均衡化,然后再应用全变分去噪方法对图像进行去噪处理。这样,就能够得到更加清晰、具有更强辨识度的图像,为后续的图像识别和分析任务提供更好的输入数据。基于全局直方图均衡化和全变分去噪的图像数据增强方法能够有效地提升图像质量和增强图像特征,对于引线剥离区域识别等带电作业图像处理任务具有重要意义。
需要说明的是,在图像预处理部分有以下几种方法可以替代上述实施例中的全局直方图均衡化和全变分去噪方法,分别是局部直方图均衡化或自适应直方图均衡化,双边滤波或非局部均值去噪。
局部直方图均衡化:与全局直方图均衡化不同,局部直方图均衡化是将图像划分为多个小块,然后对每个小块进行直方图均衡化。这样的处理能够更好地保留图像中的细节特征,适用于局部光照变化明显的场景。
自适应直方图均衡化:自适应直方图均衡化是一种根据图像的局部像素灰度值动态调整直方图的方法。它可以根据图像的局部亮度分布自适应地增强图像的对比度,减少过度增强的现象。
双边滤波:双边滤波是一种图像平滑滤波方法,能够在保持图像边缘信息的同时减少噪声。它根据像素之间的灰度值和空间距离来计算权重,从而实现对图像的平滑处理。
非局部均值去噪:非局部均值去噪是一种图像去噪方法,它通过计算像素之间的相似度来进行噪声抑制。这样的方法能够保持图像的细节特征,减少去噪过程中的信息损失。
这些方法都可以用于图像预处理环节,根据实际场景的需求选择合适的方法来增强图像质量和减少噪声。根据不同的引线剥离区域识别任务和图像特点,采用适当的预处理方法能够进一步提高模型的识别精度和性能。
基于但不限于上述方法,步骤S3的具体实现过程如下:
Ghost模块和形状损失函数是用于改进YOLOv7目标检测模型在带电作业引线剥离区域识别任务中的关键技术。下面对它们进行详细描述:
Ghost模块:
Ghost模块是一种轻量级的特征提取模块,用于在YOLOv7模型中增强特征表示能力。在带电作业引线剥离区域识别任务中,图像往往包含复杂的光照情况和细节信息,需要强大的特征提取能力来准确识别引线剥离区域。Ghost模块通过增加通道之间的交互来增强特征的表达能力,从而提高模型的识别性能。
其结构由两个关键组成部分构成:
Ghost Shuffle:该部分首先将输入特征图分成两个子特征图,然后通过通道交换来增强特征之间的交互。
Ghost Bottleneck:该部分通过堆叠多个Ghost Shuffle块来构建Ghost模块,增加了模型的深度和非线性表达能力。
形状损失函数:
形状损失函数是一种特定于带电作业引线剥离区域的损失函数,用于评估模型在识别引线剥离区域时的准确性。在带电作业中,引线剥离区域的形状往往是非常重要的特征,可以用于准确定位和分类引线剥离区域。因此,引入形状损失函数可以有效地约束模型学习引线剥离区域的形状特征。
形状损失函数的设计考虑到引线剥离区域的轮廓和形状特征,可以通过以下步骤来实现:
首先,从训练数据中提取引线剥离区域的轮廓信息,可以使用图像处理技术和边缘检测算法来实现。
接下来,在模型的输出中引入形状损失函数,用于衡量模型输出与真实引线剥离区域轮廓的相似性。
形状损失函数可以采用IoU(Intersection over Union)等形状相似性指标来计算模型预测的轮廓与真实轮廓的匹配程度。
YOLOv7:
YOLOv7是一种流行的目标检测模型,它是YOLO(You Only Look Once)系列模型的最新版本。YOLOv7结合了YOLOv5和YOLOv4的特点,并进行了一系列改进,提高了目标检测的准确性和速度。在带电作业引线剥离区域图像识别任务中,YOLOv7被用作基础模型,并结合Ghost模块和形状损失函数进行改进。
YOLOv7的主要特点和结构如下:
One-Stage Detection:YOLOv7采用单阶段的目标检测方式,将目标检测问题转化为一个回归问题。与传统的两阶段目标检测方法相比,YOLOv7能够在保持较高准确性的同时实现更快的推理速度。
Feature Pyramid Network(FPN):YOLOv7引入了FPN来处理不同尺度的特征信息。FPN通过在不同层级的特征图之间建立连接,实现了多尺度特征融合,从而提高模型对不同大小目标的检测能力。
CSPDarknet53 Backbone:YOLOv7采用CSPDarknet53作为主干网络,CSPDarknet53是对Darknet53的改进版本,通过引入Cross-Stage Partial connections来减少参数量,提高模型的效率和性能。
PANet:YOLOv7引入了PANet来进一步提升特征融合的效果。PANet在FPN的基础上加入了横向和纵向的特征融合,增强了不同尺度特征的表达能力。
Ghost模块和形状损失函数:作为改进,在YOLOv7中引入了Ghost模块和形状损失函数来增强模型的特征表达能力和形状识别能力。Ghost模块增加了特征之间的交互,形状损失函数约束了模型学习引线剥离区域的形状特征,从而提高了引线剥离区域的识别精度。
NMS(Non-Maximum Suppression):YOLOv7采用NMS来抑制多余的边界框,保留最具代表性的目标检测结果。这有助于提高模型的定位准确性和检测稳定性。
通过引入Ghost模块和形状损失函数,可以改进YOLOv7模型在带电作业引线剥离区域图像识别任务中的性能。Ghost模块可以增强模型的特征表达能力,从而提高引线剥离区域的检测精度。而形状损失函数则可以约束模型学习引线剥离区域的形状特征,从而增强模型对引线剥离区域的形状识别能力。这两个技术的结合将有助于提高带电作业引线剥离区域识别的准确性和稳定性,提升作业安全性和效率。
通过在YOLOv7模型引入形状损失函数,最终得到的损失函数表达式如下;
L2=L1+Lshape
其中,L1为YOLOv7模型的原始损失,Lshape为形状损失。
需要说明的是,在步骤S3中,YOLOv7模型可以用Faster R-CNN、SSD等替换、Ghost模块可以用Inception模块、ResNet模块等替换、形状损失函数可以用交叉熵损失、平滑L1损失等替换。
Faster R-CNN和SSD:Faster R-CNN和SSD是两种目标检测算法,它们能够实现快速高效的目标检测和定位。这些方法在引线剥离区域识别中具有一定的可行性,特别是在快速实时识别的场景下表现较好。
Inception模块和ResNet模块:Inception模块和ResNet模块是两种常用的特征提取模块,它们能够提高模型的特征表达能力和感受野,有助于增强引线剥离区域的特征表达。这些模块在改进目标检测模型种具有一定的可行性,能够帮助模型更好地识别引线剥离区域的特征。
交叉熵损失和平滑L1损失:交叉熵损失和平滑L1损失是两种常用的目标检测损失函数,分别用于分类和定位。这些损失函数在改进目标检测模型中有一定的可行性,能够帮助模型更好地进行分类和定位,提高检测准确性。
综上所述,Faster R-CNN、SSD、Inception模块、ResNet模块、交叉熵损失和平滑L1损失等方法在引线剥离区域识别中都具有一定的可行性。根据实际应用场景和数据集的特点,可以灵活选择合适的方法组合和调整,以优化模型的识别性能和效果。不同方法之间也可以相互配合和结合,以实现更准确、高效的引线剥离区域识别。
基于但不限于上述方法,步骤S4-S6的具体实现流程如图4所示,首先确定检测目标,即引线剥离区域,然后构建Ghost模块并定义形状损失函数,接着进行数据准备,定义综合损失函数(即原损失函数结合形状损失函数),接着,通过训练数据对改进后的YOLOv7模型进行训练,并进行评估调优,直至得到优化后的YOLOv7目标检测模型,通过优化后的YOLOv7目标检测模型对特征融合后的图像进行目标检测,得到引线剥离区域的识别结果。
本实施例中,引线剥离区域原图识别结果如图5所示,引线全局直方图均衡化后识别结果如图6所示,引线全局直方图均衡化及全变分去噪后识别结果如图7所示,根据图5-7可知,本实施例中,引线全局直方图均衡化及全变分去噪后的识别结果具有更高的识别精度。
下面对本发明提供的一种带电作业引线剥离区域识别装置进行描述,下文描述的带电作业引线剥离区域识别装置与上文描述的带电作业引线剥离区域识别方法可相互对应参照。
如图8所示,一种带电作业引线剥离区域识别装置,包括以下模块:
采集模块810,用于采集彩色引线图像;
预处理模块820,用于采用全局直方图均衡化和全变分去噪方法对彩色引线图像进行预处理,得到去噪后的彩色引线图像;
改进模块830,用于将YOLOv7作为基础模型,并结合Ghost模块和形状损失得到改进后的YOLOv7模型;
融合模块840,用于将去噪后的彩色引线图像与原始彩色引线图像输入改进后的YOLOv7模型中,通过Ghost模块进行特征融合,得到特征融合后的图像;
优化模块850,用于通过特征融合后的图像和引线剥离区域的真实标签图像计算损失函数,并根据损失函数优化网络参数,得到优化后的YOLOv7目标检测模型;
识别模块860,用于通过优化后的YOLOv7目标检测模型对特征融合后的图像进行目标检测,得到引线剥离区域的识别结果。
如图9所示,示例了一种电子设备的实体结构示意图,该电子设备可以包括:处理器(processor)910、通信接口(Communications Interface)920、存储器(memory)930和通信总线940,其中,处理器910、通信接口920、存储器930通过通信总线940完成相互间的通信。处理器910可以调用存储器930中的逻辑指令,以执行上述带电作业引线剥离区域识别方法的步骤,具体包括:采集彩色引线图像;采用全局直方图均衡化和全变分去噪方法对彩色引线图像进行预处理,得到去噪后的彩色引线图像;将YOLOv7作为基础模型,并结合Ghost模块和形状损失得到改进后的YOLOv7模型;将去噪后的彩色引线图像与原始彩色引线图像输入改进后的YOLOv7模型中,通过Ghost模块进行特征融合,得到特征融合后的图像;通过特征融合后的图像和引线剥离区域的真实标签图像计算损失函数,并根据损失函数优化网络参数,得到优化后的YOLOv7目标检测模型;通过优化后的YOLOv7目标检测模型对特征融合后的图像进行目标检测,得到引线剥离区域的识别结果。
此外,上述的存储器930中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
又一方面,本发明实施例还提供了一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述带电作业引线剥离区域识别方法的步骤,具体包括:采集彩色引线图像;采用全局直方图均衡化和全变分去噪方法对彩色引线图像进行预处理,得到去噪后的彩色引线图像;将YOLOv7作为基础模型,并结合Ghost模块和形状损失得到改进后的YOLOv7模型;将去噪后的彩色引线图像与原始彩色引线图像输入改进后的YOLOv7模型中,通过Ghost模块进行特征融合,得到特征融合后的图像;通过特征融合后的图像和引线剥离区域的真实标签图像计算损失函数,并根据损失函数优化网络参数,得到优化后的YOLOv7目标检测模型;通过优化后的YOLOv7目标检测模型对特征融合后的图像进行目标检测,得到引线剥离区域的识别结果。
本发明实施了一种带电作业引线剥离区域识别方法、装置、设备及存储介质,相较于传统方案在带电作业引线剥离区域识别上具有多个显著不同之处和优点:
首先,在特征融合方面,本方案引入了Feature Pyramid Network(FPN)和PANet来进行多尺度特征融合。传统方法通常采用固定尺度的特征提取方法,难以适应不同大小引线剥离区域的检测需求。而通过融合不同层级的特征信息,本方案能够有效提高对不同大小引线剥离区域的检测能力,增强了模型的自适应性。
其次,在预处理阶段,本方案应用全局直方图均衡化技术,通过调整图像像素的亮度和对比度分布,增强了引线剥离区域的边缘和细节信息,有助于改善图像质量。传统方法在这一步骤通常采用简单的灰度拉伸等方法,难以充分挖掘图像的信息。
另外,本方案还采用全变分去噪方法进行图像的去噪处理。全变分去噪方法能够有效降低图像中的噪声,并保留图像的边缘和细节特征,从而提高了模型对复杂光照环境下引线剥离区域的识别精度。而传统的简单滤波器或阈值分割方法难以很好地处理高空高压作业环境中存在的噪声问题。
此外,本方案使用YOLOv7作为基础模型,YOLOv7具有较快的推理速度和较高的目标检测准确性。通过与Ghost模块和形状损失函数相结合,能够实现高效且准确的引线剥离区域识别。引入Ghost模块和形状损失函数,以增强模型的特征表达能力和形状识别能力。Ghost模块能够增加特征之间的交互,提升了特征的复杂性和丰富性。形状损失函数约束了模型学习引线剥离区域的形状特征,进一步提高了引线剥离区域的识别精度和稳定性。传统方法通常缺乏这种形状约束,容易导致对复杂形状的引线剥离区域识别不准确。
综合来看,本发明方案相较于传统方法具有更强的自适应性、鲁棒性和准确性,能够适应高空高压作业环境下的复杂光照情况和引线剥离区域的多样性。通过采用全局直方图均衡化和全变分去噪等预处理方法,能够提高图像质量和降低噪声干扰,从而提高了引线剥离区域的识别精度。引入Ghost模块和形状损失函数进一步增强了模型的特征表达能力和形状识别能力,使得引线剥离区域的识别更加准确和稳定。综合来说,本方案在带电作业引线剥离区域识别中具有明显的优势和改进效果,有望在实际应用中取得更好的识别效果和性能。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。词语第一、第二、以及第三等的使用不表示任何顺序,可将这些词语解释为标识。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种带电作业引线剥离区域识别方法,其特征在于,包括以下步骤:
采集彩色引线图像;
采用全局直方图均衡化和全变分去噪方法对彩色引线图像进行预处理,得到去噪后的彩色引线图像;
将YOLOv7作为基础模型,并结合Ghost模块和形状损失得到改进后的YOLOv7模型;
将去噪后的彩色引线图像与原始彩色引线图像输入改进后的YOLOv7模型中,通过Ghost模块进行特征融合,得到特征融合后的图像;
通过特征融合后的图像和引线剥离区域的真实标签图像计算损失函数,并根据损失函数优化网络参数,得到优化后的YOLOv7目标检测模型;
通过优化后的YOLOv7目标检测模型对特征融合后的图像进行目标检测,得到引线剥离区域的识别结果。
2.根据权利要求1所述的带电作业引线剥离区域识别方法,其特征在于,所述采用全局直方图均衡化和全变分去噪方法对彩色引线图像进行预处理,得到去噪后的彩色引线图像的步骤,包括:
将彩色引线图像转换为YCrCb色彩空间,并提取亮度通道Y;
对亮度通道Y进行全局直方图均衡化,合并通道输出均衡化处理后的彩色图像。
3.根据权利要求2所述的带电作业引线剥离区域识别方法,其特征在于,所述采用全局直方图均衡化和全变分去噪方法对彩色引线图像进行预处理,得到去噪后的彩色引线图像的步骤,还包括:
将均衡化处理后的彩色图像转换为灰度图像;
使用全变分去噪方法对灰度图像进行去噪处理,得到去噪后的彩色引线图像。
4.根据权利要求1所述的带电作业引线剥离区域识别方法,其特征在于,所述Ghost模块是一种轻量级的特征提取模块,用于在YOLOv7模型中通过增加通道之间的交互来增强特征表示能力;
所述Ghost模块包括Ghost Shuffle和Ghost Bottleneck;
所述Ghost Shuffle首先将输入的特征图分成两个子特征图,然后通过通道交换来增强特征之间的交互;所述Ghost Bottleneck通过堆叠多个Ghost Shuffle块来构建Ghost模块,增模型的深度和非线性表达能力。
5.根据权利要求1所述的带电作业引线剥离区域识别方法,其特征在于,结Ghost模块对YOLOv7模型进行改进的实现过程如下:
将YOLOv7模型的CBS结构中的Conv卷积替换为Ghost模块。
6.根据权利要求1所述的带电作业引线剥离区域识别方法,其特征在于,结合形状损失对YOLOv7模型进行改进,得到的损失函数表达式如下;
L2=L1+Lshape
其中,L1为YOLOv7模型的原始损失,Lshape为形状损失。
7.根据权利要求1所述的带电作业引线剥离区域识别方法,其特征在于,所述形状损失采用IoU形状相似性指标来计算模型预测的轮廓与真实轮廓的匹配程度。
8.一种带电作业引线剥离区域识别装置,其特征在于,包括以下模块:
采集模块,用于采集彩色引线图像;
预处理模块,用于采用全局直方图均衡化和全变分去噪方法对彩色引线图像进行预处理,得到去噪后的彩色引线图像;
改进模块,用于将YOLOv7作为基础模型,并结合Ghost模块和形状损失得到改进后的YOLOv7模型;
融合模块,用于将去噪后的彩色引线图像与原始彩色引线图像输入改进后的YOLOv7模型中,通过Ghost模块进行特征融合,得到特征融合后的图像;
优化模块,用于通过特征融合后的图像和引线剥离区域的真实标签图像计算损失函数,并根据损失函数优化网络参数,得到优化后的YOLOv7目标检测模型;
识别模块,用于通过优化后的YOLOv7目标检测模型对特征融合后的图像进行目标检测,得到引线剥离区域的识别结果。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的带电作业引线剥离区域识别方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任一项所述的带电作业引线剥离区域识别方法的步骤。
CN202311099606.0A 2023-08-28 2023-08-28 带电作业引线剥离区域识别方法、装置、设备及存储介质 Pending CN117079092A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311099606.0A CN117079092A (zh) 2023-08-28 2023-08-28 带电作业引线剥离区域识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311099606.0A CN117079092A (zh) 2023-08-28 2023-08-28 带电作业引线剥离区域识别方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN117079092A true CN117079092A (zh) 2023-11-17

Family

ID=88702085

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311099606.0A Pending CN117079092A (zh) 2023-08-28 2023-08-28 带电作业引线剥离区域识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117079092A (zh)

Similar Documents

Publication Publication Date Title
CN114937055B (zh) 基于人工智能的图像自适应分割方法与系统
CN112614062B (zh) 菌落计数方法、装置及计算机存储介质
CN104463195A (zh) 基于模板匹配的印刷体数字识别方法
CN111915704A (zh) 一种基于深度学习的苹果分级识别方法
CN105389581B (zh) 一种胚芽米胚芽完整度智能识别系统及其识别方法
CN109934221B (zh) 基于注意力机制的电力设备自动分析识别监控方法及系统
CN110599507B (zh) 一种番茄识别定位方法及系统
CN114519808A (zh) 图像融合方法、装置及设备、存储介质
CN111695373B (zh) 斑马线的定位方法、系统、介质及设备
CN113435407B (zh) 一种输电系统的小目标识别方法及装置
CN104700417A (zh) 木材节子瑕疵的计算机图像自动识别方法
CN108154496B (zh) 一种适用于电力作业机器人的电力设备外观变化识别方法
CN109781737A (zh) 一种软管表面缺陷的检测方法及其检测系统
CN113515655A (zh) 一种基于图像分类的故障识别方法及装置
CN111126162A (zh) 一种识别图像中炎症细胞的方法、装置及存储介质
CN107886493B (zh) 一种输电线路的导线分股缺陷检测方法
CN115272838A (zh) 基于信息融合技术的海洋浮游生物自动识别方法及系统
CN116843581B (zh) 一种多场景图的图像增强方法、系统、设备和存储介质
CN108877030B (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN107729863B (zh) 人体指静脉识别方法
CN111402200B (zh) 基于共生双流卷积网络和数字图像的油炸食品检测系统
CN113537037A (zh) 路面病害识别方法、系统、电子设备及存储介质
CN108154116A (zh) 一种图像识别方法及系统
Kaur et al. 2-D geometric shape recognition using canny edge detection technique
CN117079092A (zh) 带电作业引线剥离区域识别方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination