CN111161255A - 基于机器视觉的电力仪表自动检测方法 - Google Patents
基于机器视觉的电力仪表自动检测方法 Download PDFInfo
- Publication number
- CN111161255A CN111161255A CN201911417036.9A CN201911417036A CN111161255A CN 111161255 A CN111161255 A CN 111161255A CN 201911417036 A CN201911417036 A CN 201911417036A CN 111161255 A CN111161255 A CN 111161255A
- Authority
- CN
- China
- Prior art keywords
- image
- operator
- machine vision
- detection method
- automatic detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于机器视觉的电力仪表自动检测方法,对SSD算法进行改进,采用高斯模糊算子和浮雕算子计算变换图像,通过改进SSD算法的基础特征提取层,抽取RGB图像和变换图像的深度融合特征,增强特征的显著性和稳健性,最终基于改进的SSD算法检测电力仪表,提高复杂环境下电力仪表的检测准确率。
Description
技术领域
本发明属于电气设备智能检测领域,尤其涉及一种基于机器视觉的电力仪表自动检测方法。
背景技术
电力仪表自动读数是采用图像处理与识别技术判读被测表指针位置及读数,可以显著提高电力仪表测量的自动化程度。为了实现基于计算机机器视觉的电力仪表自动读数,首先需要定位图像中电力仪表的位置,这可以将电力仪表看作一种目标,采用目标检测方法来实现。
传统的目标检测方法主要包括显著性检测、模板匹配、小波变换、图像描述子等。机器视觉显著性检测方法是通过算法模拟人的视觉特点,提取图像中的显著区域(即人类感兴趣的区域),但该方法一般不适用于检测特定的目标。模板匹配是在图像中搜索与模板中特定目标像素的区域的过程,该方法简单有效,易于实现,但受尺度、光照以及目标表观的影响较大,当噪声过高时,容易发生模板误匹配。小波变换方法是空间和频率的局部变换,能有效地从信号中提取信息,在低信噪比条件下仍能有效检测出弱小目标。但小波变换计算量大,复杂度高,其工程应用性较低。SIFT、SURF等图像描述子在目标检测领域应用也比较多,与模板匹配相比,图像描述子往往具有尺度不变性等特性,抗干扰能力较强,但对于非刚性目标的检测效果不理想,而且受成像质量影响较大。
随着深度学习技术的发展,基于深度学习的目标检测方法越来越多,大幅提升了目标检测的性能。基于深度学习的目标检测算法主要分为two-stage方法和one-stage方法,前者主要思路是先通过启发式方法或者卷积神经网络产生一系列稀疏的候选框,然后对这些候选框进行分类与回归,典型算法有R-CNN(Region-based Convolutional NeuralNetworks)、Fast-CNN、Faster-CNN等,优点是准确度高;后者主要思路是均匀地在图片的不同位置进行密集抽样,抽样时可以采用不同尺度和长宽比,然后利用CNN提取特征后直接进行分类与回归,整个过程只需要一步,所以其优势是速度快,但是均匀的密集采样的一个重要缺点是训练比较困难,这主要是因为正样本与负样本(背景)极其不均衡,导致模型准确度稍低,常见典型算法有YOLO(You Only Look Once)、SSD(Single ShotMultiBoxDetector)等。
其中,SSD方法的主要特色包括:一是提取不同尺度的特征图用作检测,大尺度特征图可以用来检测小物体,而小尺度特征图用来检测大物体;二是采用了不同尺度和长宽比的先验框。这样SSD方法不仅速度优于YOLO,而且能有效检测小目标,降低目标漏检的概率,定位精度也高于YOLO,是近些年非常流行的目标检测算法。因此,研究基于SSD算法的目标检测来优化电力仪表自动检测是亟需解决的问题。
发明内容
发明目的:针对以上问题,本发明提出一种基于机器视觉的电力仪表自动检测方法,以SSD方法为基础,结合电力仪表的图像特性改进SSD算法,提高电力仪表检测准确率。
技术方案:为实现本发明的目的,本发明所采用的技术方案是:一种基于机器视觉的电力仪表自动检测方法,包括步骤:
(1)对于摄像头采集到的每一帧3通道RGB图像进行图像缩放;
(2)采用高斯模糊算子和浮雕算子计算RGB图像每一通道图像的变换图像,得到尺寸不变的3通道变换图像;
(3)采用改进的SSD算法进行基础特征提取,将前置VGG网络扩展成两个独立的特征提取网络,两个网络的输入层分别是RGB图像和变换图像,对两个网络独立提取特征FRGB和FC,然后在两个特征提取网络之后增加一个特征融合层,对独立提取的特征进行融合,得到深度融合特征;
(4)采用SSD算法进行扩展特征提取;
(5)抽取若干不同特征映射图,针对每一个点构造不同尺度大小的包围盒,对这些包围盒进行检测和分类,检测符合条件的包围盒;
(6)对检测到的包围盒进行非极大值抑制,抑制掉重叠或不正确的包围盒,得到目标检测结果。
进一步地,所述步骤1中,采用双线性插值法进行图像缩放。
进一步地,所述步骤2具体包括:
(2.1)构建高斯模糊算子:
对图像中的任意像素点p,其坐标为(x,y),对应的像素值为f(x,y),则经过高斯模糊算子之后的像素值为:
f′(x,y)=0.059[f(x-1,y-1)+f(x+1,y-1)+f(x-1,y+1)+f(x+1,y+1)]
+0.097[f(x,y-1)+f(x,y+1)+f(x-1,y)+f(x+1,y)]+0.159f(x,y)
(2.2)构建浮雕算子:
像素点p,对应的像素值为f’(x,y),则经过浮雕算子之后的像素值为:
f″(x,y)=[f′(x+1,y+1)+f′(x+1,y)+f′(x,y+1)]
-[f′(x-1,y-1)+f′(x-1,y)+f′(x,y-1)]
进一步地,所述步骤3中,采用加权平均的融合策略,公式如下:
F=αFRGB+(1-α)FC
其中,α为加权系数。
进一步地,所述步骤4中,提取的扩展特征与提取的基本特征的特征维数相同。
有益效果:本发明采用高斯模糊算子和浮雕算子计算变换图像,通过改进SSD算法的基础特征提取层,抽取RGB图像和变换图像的深度融合特征,增强特征的显著性和稳健性,最终基于改进的SSD算法检测电力仪表,提高复杂环境下电力仪表的检测准确率。
附图说明
图1是本发明方法的流程图;
图2是VGG网络结构框图;
图3是SSD算法的网络架构图。
具体实施方式
下面结合附图和实施例对本发明的技术方案作进一步的说明。
如图1所示,本发明所述的基于机器视觉的电力仪表自动检测方法,包括步骤:
(1)对于摄像头采集到的每一帧3通道的RGB图像,采用双线性插值方法进行图像缩放,将图像尺寸缩放到300×300;
SSD算法是目前非常流行的目标检测算法,本发明采用SSD算法检测电力仪表目标。SSD算法的输入图像尺寸是300×300的3通道RGB图像。因此,摄像机采集的图像需要先进行缩放处理,将尺度缩放到300×300。本发明采用双线性插值法进行图像缩放。
(2)采用高斯模糊算子和浮雕算子计算RGB图像每一个通道子图像ImgR、ImgG和ImgB的变换图像ImgRC、ImgGC和ImgBC,组合成一幅尺寸仍为300×300的3通道变换图像;
摄像机采集的图像时RGB格式的,RGB图像能够呈现出于人类视觉相似的感知,色彩和纹理丰富,便于提取目标的差异性特征。但是,RGB图像是光强和波长的表达,对光照等环境因素比较敏感。巡检机器人在采集仪器仪表图像时,由于巡检机器人拍摄角度以及光照环境等因素影响,仪表在图像中呈现出的颜色和亮度都有较大变化,因此仅仅基于RGB图像提取的特征受光照等环境因素的影响较大,从而影响电力仪表的自动检测。
因此,本发明对输入图像进行变换,采用高斯模糊算子降低噪声的干扰,采用浮雕算子提升边界的显著度,同时滤除平缓的背景信息,进而增强电力仪表边缘信息的显著度,为提取更具鉴别力的特征奠定基础。
本发明将RGB图像看作R、G、B三个通道上的三幅灰度图像,分别记为ImgR、ImgG、ImgB。对任意一个通道图像,本发明通过高斯模糊算子和浮雕算子计算三幅变换图像,分别记为ImgRC、ImgGC、ImgBC。下面以ImgR为例,阐述如何通过高斯模糊算子和浮雕算子计算变换图像ImgRC。
高斯函数可以表示为:
其中,σ为方差,(x,y)表示像素点的坐标。
本发明基于高斯函数来构造高斯模糊算子,对于图像中的任意像素点p,以该像素点为中心的8邻域像素点可以构成一个3×3的矩阵,记为:
这里,中心像素点的坐标为(0,0),其余像素点的坐标为相对于中心像素点的坐标。以各像素点的相对坐标来构建高斯模糊算子,为:
为计算简洁,取σ=1,于是有:
也即,对于图像中的任意像素点p,假定其坐标为(x,y),对应的像素值为f(x,y),那么经过高斯模糊算子之后的像素值为:
可见,高斯模糊算子滤波过程中,距离中心像素点越近,其贡献越大。
执行完高斯模糊滤波之后,再采用浮雕算子提升边界的显著度,同时滤除平缓的背景信息。浮雕算子表示为:
也即,对于图像中的任意像素点p,假定其坐标为(x,y),对应的像素值为f’(x,y),那么经过浮雕算子之后的像素值为:
需要说明的是:图像变换时,图像上下左右四个边上的像素点因为没有完整的8个相邻像素点,故变换时这些像素点的像素值置为零。
类似地,由ImgG和ImgB计算变换图像ImgGC和ImgBC。这样,由RGB图像中3个通道的图像ImgR、ImgG和ImgB可以计算出三幅变换图像ImgRC、ImgGC和ImgBC,这三幅图像也可以看作是一幅3通道的变换图像。
(3)将SSD算法前置的VGG网络扩展成两个独立的特征提取网络,第一个网络的输入层是一幅300×300的3通道RGB图像,第二个网络的输入层是一幅300×300的3通道变换图像,两个网络独立提取特征FRGB和FC,然后在两个特征提取网络之后增加一个特征融合层,对FRGB和FC进行加权平均,得到深度融合特征,增强特征的显著性和稳健性;
通常,SSD算法输入层是一幅300×300的3通道RGB图像,考虑到RGB图像对光照等环境因素比较敏感,本发明采用融合高斯模糊算子和浮雕算法的图像变换方法得到一幅3通道的变换图像。这样,RGB图像可以呈现丰富的色彩和纹理,变换图像可以凸显目标轮廓。本发明将两类图像同时送入SSD算法的输入层,以便提取显著性和稳健性更强的深度融合特征,进而提高电力仪表检测的准确率。为此,本发明对SSD算法的特征提取部分进行改进,主要思路是改进SSD算法前置的VGG网络,增加特征融合层。
SSD算法前置的VGG网络结构如图2所示,共包括4个阶段的特征提取环节,含10个卷积层和3个池化层。其中,卷积层的核尺寸都为3×3,池化层的核尺寸都为2×2,阶段1至阶段4的通道数分别为64、128、256和512。
在本发明中,将SSD算法前置的VGG网络扩展成两个独立的特征提取网络,第一个网络的输入层是一幅300×300的3通道RGB图像,第二个网络的输入层是一幅300×300的3通道变换图像。两个网络独立提取特征,特征分别记为FRGB和FC,这两组特征都可以看作是一幅38×38的512通道的特征映射图像。
本发明在两个特征提取网络之后增加一个特征融合层,对FRGB和FC进行融合处理,抽取显著和稳健的特征。具体是采用加权平均的融合策略,公式如下:
(8)
F=αFRGB+(1-α)FC
考虑到电力仪表的纹理信息比轮廓信息更显著,本发明在融合时对FRGB施加更大权重,经过大量实验分析,本发明赋予α=0.7。融合后得到的深度融合特征的映射图尺寸不变,仍为38×38的512通道的特征映射图像。
与传统SSD算法前置VGG网络提取的特征FRGB相比,本发明提取的深度融合特征从两类不同属性的图像中获取互补属性的特征,增强了特征的显著性,扩展不同目标特征的差异性。同时,引入的特征FC对光照等环境因素的鲁棒性更强,进而特征的稳健性得以提升。
(4)采用SSD算法的扩展特征提取层抽取扩展特征;
SSD算法采用前置的VGG网络提取基本特征,然后采用如图3所示的卷积层和池化层提取扩展特征。本发明提取的深度卷积特征与SSD算法前置VGG网络提取的基本特征的特征维数是相同的,后续扩展特征的提取网络与SSD算法一致。
(5)采用SSD算法的包围盒检测步骤,抽取6个卷积层输出的特征映射图,对特征映射图上面的每一个点构造6个不同尺度大小的默认包围盒,接着对这些包围盒分别进行检测和分类,检测符合条件的包围盒;
SSD算法的网络架构如图3所示,对于输入一幅一幅300×300的3通道图像,先采用前置的VGG网络提取基础特征,然后抽取6个卷积层(Conv4_3、Conv7、Conv8_2、Conv9_2、Conv10_2和Conv11_2)输出的特征映射图,对特征映射图上面的每一个点构造6个不同尺度大小的默认包围盒,接着对这些包围盒分别进行检测和分类,检测符合条件的包围盒。
(6)采用SSD算法的非极大值抑制步骤,通过将不同特征映射图检测到的包围盒进行非极大值抑制操作,抑制掉一部分重叠或者不正确的包围盒,得到最终的目标检测结果。
Claims (5)
1.一种基于机器视觉的电力仪表自动检测方法,其特征在于,包括步骤:
(1)对于摄像头采集到的每一帧3通道RGB图像进行图像缩放;
(2)采用高斯模糊算子和浮雕算子计算RGB图像每一通道图像的变换图像,得到尺寸不变的3通道变换图像;
(3)采用改进的SSD算法进行基础特征提取,将前置VGG网络扩展成两个独立的特征提取网络,两个网络的输入层分别是RGB图像和变换图像,对两个网络独立提取特征FRGB和FC,然后在两个特征提取网络之后增加一个特征融合层,对独立提取的特征进行融合,得到深度融合特征;
(4)采用SSD算法进行扩展特征提取;
(5)抽取若干不同特征映射图,针对每一个点构造不同尺度大小的包围盒,对这些包围盒进行检测和分类,检测符合条件的包围盒;
(6)对检测到的包围盒进行非极大值抑制,抑制掉重叠或不正确的包围盒,得到目标检测结果。
2.根据权利要求1所述的基于机器视觉的电力仪表自动检测方法,其特征在于,所述步骤1中,采用双线性插值法进行图像缩放。
4.根据权利要求1所述的基于机器视觉的电力仪表自动检测方法,其特征在于,所述步骤3中,采用加权平均的融合策略,公式如下:
F=αFRGB+(1-α)FC
其中,α为加权系数。
5.根据权利要求1所述的基于机器视觉的电力仪表自动检测方法,其特征在于,所述步骤4中,提取的扩展特征与提取的基本特征的特征维数相同。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911417036.9A CN111161255A (zh) | 2019-12-31 | 2019-12-31 | 基于机器视觉的电力仪表自动检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911417036.9A CN111161255A (zh) | 2019-12-31 | 2019-12-31 | 基于机器视觉的电力仪表自动检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111161255A true CN111161255A (zh) | 2020-05-15 |
Family
ID=70560244
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911417036.9A Pending CN111161255A (zh) | 2019-12-31 | 2019-12-31 | 基于机器视觉的电力仪表自动检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111161255A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107341517A (zh) * | 2017-07-07 | 2017-11-10 | 哈尔滨工业大学 | 一种基于深度学习层级间特征融合的多尺度小物体检测方法 |
CN108121985A (zh) * | 2017-11-21 | 2018-06-05 | 武汉中元华电科技股份有限公司 | 一种基于机器视觉的双指针仪表读数方法 |
CN108597204A (zh) * | 2018-05-22 | 2018-09-28 | 广州市暨联牧科信息科技有限公司 | 一种智能抄表系统及其实现方法 |
CN109583324A (zh) * | 2018-11-12 | 2019-04-05 | 武汉大学 | 一种基于单点多盒检测器的指针仪表读数自动识别方法 |
CN109948469A (zh) * | 2019-03-01 | 2019-06-28 | 吉林大学 | 基于深度学习的巡检机器人仪表自动检测识别方法 |
CN110288518A (zh) * | 2019-06-28 | 2019-09-27 | 北京三快在线科技有限公司 | 图像处理方法、装置、终端及存储介质 |
CN110378225A (zh) * | 2019-06-14 | 2019-10-25 | 南京泛函智能技术研究院有限公司 | 指针式仪表自动读数的识别方法及识别装置 |
-
2019
- 2019-12-31 CN CN201911417036.9A patent/CN111161255A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107341517A (zh) * | 2017-07-07 | 2017-11-10 | 哈尔滨工业大学 | 一种基于深度学习层级间特征融合的多尺度小物体检测方法 |
CN108121985A (zh) * | 2017-11-21 | 2018-06-05 | 武汉中元华电科技股份有限公司 | 一种基于机器视觉的双指针仪表读数方法 |
CN108597204A (zh) * | 2018-05-22 | 2018-09-28 | 广州市暨联牧科信息科技有限公司 | 一种智能抄表系统及其实现方法 |
CN109583324A (zh) * | 2018-11-12 | 2019-04-05 | 武汉大学 | 一种基于单点多盒检测器的指针仪表读数自动识别方法 |
CN109948469A (zh) * | 2019-03-01 | 2019-06-28 | 吉林大学 | 基于深度学习的巡检机器人仪表自动检测识别方法 |
CN110378225A (zh) * | 2019-06-14 | 2019-10-25 | 南京泛函智能技术研究院有限公司 | 指针式仪表自动读数的识别方法及识别装置 |
CN110288518A (zh) * | 2019-06-28 | 2019-09-27 | 北京三快在线科技有限公司 | 图像处理方法、装置、终端及存储介质 |
Non-Patent Citations (3)
Title |
---|
冯家文等: "基于多源融合FCN的图像分割", 《计算机应用研究》 * |
孙蔚等: "改进的Sobel算子彩色图像边缘检测", 《电子技术应用》 * |
赵庆北等: "基于深度学习的MSSD目标检测方法", 《企业科技与发展》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109344701B (zh) | 一种基于Kinect的动态手势识别方法 | |
CN109903331B (zh) | 一种基于rgb-d相机的卷积神经网络目标检测方法 | |
CN108062525B (zh) | 一种基于手部区域预测的深度学习手部检测方法 | |
CN109583483B (zh) | 一种基于卷积神经网络的目标检测方法和系统 | |
CN113065558A (zh) | 一种结合注意力机制的轻量级小目标检测方法 | |
CN111161317A (zh) | 一种基于多重网络的单目标跟踪方法 | |
CN108446694B (zh) | 一种目标检测方法及装置 | |
KR20160143494A (ko) | 현저성 정보 취득 장치 및 현저성 정보 취득 방법 | |
CN110569782A (zh) | 一种基于深度学习目标检测方法 | |
CN110399840B (zh) | 一种快速的草坪语义分割及边界检测方法 | |
Shahab et al. | How salient is scene text? | |
CN111797841B (zh) | 一种基于深度残差网络的视觉显著性检测方法 | |
CN112364865B (zh) | 一种复杂场景中运动小目标的检测方法 | |
CN112561899A (zh) | 电力巡检图像识别方法 | |
CN116681636B (zh) | 基于卷积神经网络的轻量化红外与可见光图像融合方法 | |
CN111414954A (zh) | 一种岩石图像检索方法及其系统 | |
CN113409355A (zh) | 一种基于fpga的运动目标识别系统及方法 | |
CN113159043A (zh) | 基于语义信息的特征点匹配方法及系统 | |
CN116664892A (zh) | 基于交叉注意与可形变卷积的多时相遥感图像配准方法 | |
CN106529441A (zh) | 基于模糊边界分片的深度动作图人体行为识别方法 | |
CN110349176B (zh) | 基于三重卷积网络和感知干扰学习的目标跟踪方法和系统 | |
CN111739073A (zh) | 高效快速的手持装置的影像配准优化方法 | |
CN113763274B (zh) | 一种联合局部相位锐度定向描述的多源图像匹配方法 | |
CN111028263A (zh) | 一种基于光流颜色聚类的运动物体分割方法及其系统 | |
CN112801141B (zh) | 基于模板匹配和孪生神经网络优化的异源图像匹配方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200515 |
|
RJ01 | Rejection of invention patent application after publication |