CN110232376B - 一种利用投影回归的齿轮式数字仪表识别方法 - Google Patents

一种利用投影回归的齿轮式数字仪表识别方法 Download PDF

Info

Publication number
CN110232376B
CN110232376B CN201910501230.9A CN201910501230A CN110232376B CN 110232376 B CN110232376 B CN 110232376B CN 201910501230 A CN201910501230 A CN 201910501230A CN 110232376 B CN110232376 B CN 110232376B
Authority
CN
China
Prior art keywords
digital
projection
neural network
artificial neural
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910501230.9A
Other languages
English (en)
Other versions
CN110232376A (zh
Inventor
吕青松
唐云丰
高云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201910501230.9A priority Critical patent/CN110232376B/zh
Publication of CN110232376A publication Critical patent/CN110232376A/zh
Application granted granted Critical
Publication of CN110232376B publication Critical patent/CN110232376B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K9/00Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
    • G06K9/20Image acquisition
    • G06K9/2054Selective acquisition/locating/processing of specific regions, e.g. highlighted text, fiducial marks, predetermined fields, document type identification
    • G06K9/2063Selective acquisition/locating/processing of specific regions, e.g. highlighted text, fiducial marks, predetermined fields, document type identification based on a marking or identifier characterising the document or the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computer systems based on biological models
    • G06N3/02Computer systems based on biological models using neural network models
    • G06N3/04Architectures, e.g. interconnection topology
    • G06N3/0454Architectures, e.g. interconnection topology using a combination of multiple neural nets
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/001Image restoration
    • G06T5/003Deblurring; Sharpening

Abstract

本发明涉及电力仪表中的图像处理技术领域,为一种利用投影回归的齿轮式数字仪表识别方法。包括对数字区域边缘提取并进行图像锐化;对数字区域进行多角度投影得到多角度投影特征;利用人工神经网络根据预先的数字图片数据集训练权重矩阵,得到回归器函数;对实际图片边缘提取并锐化后,提取多角度投影特征放入回归器函数,即得到数字识别结果;本方法解决了多个数字同时出现的问题,把数字识别问题转换到回归位置问题,从而精确识别数字。

Description

一种利用投影回归的齿轮式数字仪表识别方法
技术领域
本发明涉及电力仪表中的图像处理技术领域,涉及一种将识别分类问题转换到回归位置问题,从而得到连续性读数的齿轮式数字仪表识别方法,具体为一种利用投影回归的齿轮式数字仪表识别方法。
背景技术
变电站的数字仪表众多,随着仪表使用时间加长和观测员或机器人拍摄图像极易存在一个区域多个数字显示情况,导致无法判断数字;而目前所存在的方法大都是对数字提取特征直接分类,但此类方法因为分类原理上的局限性,无法得到精确的仪表读数,极易造成误判。因此需要发明一种可以精确判读多个数字同时在一个区域显示的方法。
传统方法三线法,八线法,水滴法的对数字结构分析分类,特征提取不够,
导致无法很好识别数字,且现有的方法大都不能解决模棱两可的状态;在现有的分类算法中又由于没有考虑到齿轮式仪表的数字转动特殊性,识别依据不够,识别结果可信度低。
在戴静等人提出的《一种基于交点特征的印刷体数字识别方法》中其主要步骤分为两步:第一步对二值化后的数字图像进行扫描矩阵存储得到左零右一的交点等关键点,第二步放入RBF前馈神经网络得到识别结果;该方法并不能解决数字模棱两可的问题,无法给出准确的识别结果;
中国专利CN2018102101062中利用数字图像直方图和数字封闭特征用数字框与数字的面积比特征、几何关系特征以及数字和数字框的高宽比作为特征量筛选出经二值化处理的图像中的方框与对应的数字区域;但此方法特征量不够,无法解决多个数字状态下精确判读问题;
从以上分析可以看出,大多数方法数字结构特征量不够,没有充分利用结构信息,特征种类繁多,计算复杂,不易获取;且大多采用分类算法,传统的分类方法难以解决数字模棱两可状态,无法给出可信识别结果。
发明内容
基于现有技术存在的问题,本发明提出了一种利用投影回归的齿轮式数字仪表识别方法,包括回归器函数训练阶段和正式识别阶段;
所述回归器函数训练阶段包括:
步骤一:对齿轮式数字仪表的数字区域图像进行预处理,包括对其进行边缘提取以及锐化处理;
步骤二:对锐化后图像以旋转增量α进行360°方向投影,得到至少360个投影特征;
步骤三:利用BP人工神经网络对数字区域图像集进行训练,训练出权重矩阵,得到回归器函数;
所述正式识别阶段包括:
步骤一:按照回归器函数训练阶段对待测的数字仪表图片进行相同的预处理以及投影;
步骤二:将各个待测的数字仪表图片的投影特征放入训练好的回归器函数中,从而获得待测数字仪表的数字识别结果。
进一步的,所述边缘提取以及锐化处理包括采用canny算子进行锐化,当然也可以是其他算子进行锐化,本发明不再枚举,当采用canny算子进行锐化时,具体包括:
其中,g(i,j)表示数字区域图像在(i,j)位置处的像素值;dx(i,j)表示数字区域图像(i,j)在x方向的梯度值;dy(i,j)表示数字区域图像(i,j)在y方向的梯度值。
进一步的,所述对锐化后的图像以增量α进行360°方向投影,得到至少360个投影特征包括以图像的最大尺寸为底,以任意初始底进行投影,若该角度方向存在像素则对应特征向量位置为1,反之为0,即得到初始底的投影特征向量;以0.1~1°为旋转增量,得出每个旋转角度增量下对应的投影特征向量。
进一步的,所述利用BP人工神经网络对数字区域图像集进行训练,训练出权重矩阵,得到回归器函数包括通过数字区域数据集训练使得BP人工神经网络内部的损失函数的误差值最小,从而得到权重矩阵w,进而得到回归器函数yi=xi.*w;
其中,yi表示第i个数字标签;xi表示第i个数字特征向量矩阵;n表示数字标签的个数;Ek表示BP人工神经网络中第k层的误差值;表示反向运算中BP人工神经网络第k层的实际值;表示BP人工神经网络中第k层的预测值;l表示BP人工神经网络的层数。
本发明的有益效果:
1、本方法利用Canny算子锐化,极大保留了数字边缘信息,为后续投影特征提供了保障;
2、本发明通过简单的投影特征获取了大量的数字结构特征,极高利用了数字结构信息;
3、本发明通过对数字识别问题,转换到由投影特征向量回归到对应位置问题,对任意数字状态给出精确读数,可信度极高;
附图说明
图1为本发明采用的方法流程图;
图2为本发明采用的数字仪表边缘提取锐化图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
本发明提出了一种利用投影回归的齿轮式数字仪表识别方法,包括回归器训练阶段和正式识别阶段;如图1所示,具体包括以下步骤:
其中,所述回归器函数训练阶段包括:
(1)对数字区域进行边缘提取,并锐化图像如图2所示;
(2)对锐化后图像进行360°方向投影,以旋转增量1°进行旋转投影,从而刚好获得360个投影特征;
(3)利用BP人工神经网络对数字区域图像集进行训练,训练出权重矩阵,得到回归器函数;
(4)对实际数字图片即待测的数字仪表图片进行边缘提取,锐化图像;
(5)对锐化后图像进行360°方向投影,得到360个投影特征;
(6)将投影特征放入回归器函数,得到数字识别结果。
所述边缘提取以及锐化处理包括采用canny算子进行锐化,具体包括:
其中,g(i,j)表示数字区域图像在(i,j)位置处的像素值;dx(i,j)表示数字区域图像(i,j)在x方向的梯度值;dy(i,j)表示数字区域图像(i,j)在y方向的梯度值。
其中,x方向梯度矩阵可以表示为y方向梯度矩阵可以表示为
对锐化后的图像以增量α进行360°方向投影,得到至少360个投影特征包括以图像的最大尺寸为底,以任意初始底进行投影,若该角度方向存在像素则对应特征向量位置为1,反之为0,即得到初始底的投影特征向量;以0.1~1°为旋转增量,得出每个旋转角度增量下对应的投影特征向量。
本实施例中旋转增量为1°,以图像最大尺寸为底,以6×6为例,若初始底为0°呈水平方向,向上投影,若该角度方向存在像素则对应特征向量位置为1,反之为0,即得到0°对应的投影特征向量[0 1 1 1 1 0];以1°为增量,旋转一次,得1°的投影特征向量[1 1 1 11 0];依次旋转,最终获得360个投影特征向量;
利用BP人工神经网络对数字区域图像集进行训练,训练出权重矩阵,得到回归器函数包括通过数字区域数据集训练使得BP人工神经网络内部的损失函数的误差值最小,从而得到权重矩阵w,进而得到回归器函数yi=xi.*w。
所述BP人工神经网络表示为
其中,yi表示第i个数字标签;xi表示第i个数字特征向量矩阵;n表示数字标签的个数;Ek表示BP人工神经网络中第k层的误差值;表示反向运算中BP人工神经网络第k层实际值;表示BP人工神经网络中第k层预测值;l表示BP人工神经网络的层数。
将待测的数字仪表图片的投影特征放入训练好的回归器函数中,得到数字识别结果,可具体包括:
对实际数字图像边缘提取并锐化,提取出360个方向投影特征得到xi
例如:xi特征向量矩阵大小为[360,6],表示有6个底,每个底中对应有360个特征。
将投影特征向量矩阵放入回归器函数xi.*w=yi,即计算而得的数字标签则为识别结果。其中,回归后的结果即对应齿轮式数字仪表相应的环上。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
以上所举实施例,对本发明的目的、技术方案和优点进行了进一步的详细说明,所应理解的是,以上所举实施例仅为本发明的优选实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内对本发明所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种利用投影回归的齿轮式数字仪表识别方法,包括回归器函数训练阶段和正式识别阶段;其特征在于,
所述回归器函数训练阶段包括:
步骤一:对齿轮式数字仪表的数字区域图像进行预处理,包括对其进行边缘提取以及锐化处理;
步骤二:对锐化后图像以旋转增量α进行360°方向投影,得到至少360个投影特征;
以锐化后图像的最大尺寸为底,以任意初始底进行投影,若该角度方向存在像素则对应特征向量位置为1,反之为0,即得到初始底的投影特征向量;得出每个旋转角度增量下对应的投影特征向量;
步骤三:利用BP人工神经网络对数字区域图像集进行训练,训练出权重矩阵,得到回归器函数;
所述正式识别阶段包括:
步骤一:按照回归器函数训练阶段对待测的数字仪表图片进行相同的预处理以及投影;
步骤二:将各个待测的数字仪表图片的投影特征放入训练好的回归器函数中,回归到齿轮式数字仪表的对应环上,从而获得待测数字仪表的数字识别结果。
2.根据权利要求1所述的一种利用投影回归的齿轮式数字仪表识别方法,其特征在于,所述边缘提取以及锐化处理包括采用canny算子进行锐化,具体包括:
其中,g(i,j)表示数字区域图像在(i,j)位置处的像素值;dx(i,j)表示数字区域图像(i,j)在x方向的梯度值;dy(i,j)表示数字区域图像(i,j)在y方向的梯度值。
3.根据权利要求1所述的一种利用投影回归的齿轮式数字仪表识别方法,其特征在于,以0.1~1°为旋转增量,得出每个旋转角度增量下对应的投影特征向量。
4.根据权利要求1所述的一种利用投影回归的齿轮式数字仪表识别方法,其特征在于,所述利用BP人工神经网络对数字区域图像集进行训练,训练出权重矩阵,得到回归器函数包括通过数字区域数据集训练BP人工神经网络内部的损失函数的误差值最小,从而得到权重矩阵w,进而得到回归器函数yi=xi.*w;
其中,.*表示正对相乘;yi表示第i个数字标签;xi表示第i个数字特征向量矩阵;Ek表示BP人工神经网络中第k层的误差值;表示反向运算中BP人工神经网络第k层的实际值;表示BP人工神经网络中第k层的预测值;l表示BP人工神经网络的层数。
CN201910501230.9A 2019-06-11 2019-06-11 一种利用投影回归的齿轮式数字仪表识别方法 Active CN110232376B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910501230.9A CN110232376B (zh) 2019-06-11 2019-06-11 一种利用投影回归的齿轮式数字仪表识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910501230.9A CN110232376B (zh) 2019-06-11 2019-06-11 一种利用投影回归的齿轮式数字仪表识别方法

Publications (2)

Publication Number Publication Date
CN110232376A CN110232376A (zh) 2019-09-13
CN110232376B true CN110232376B (zh) 2021-04-20

Family

ID=67858800

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910501230.9A Active CN110232376B (zh) 2019-06-11 2019-06-11 一种利用投影回归的齿轮式数字仪表识别方法

Country Status (1)

Country Link
CN (1) CN110232376B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104678963A (zh) * 2015-02-03 2015-06-03 葛武 一种基于计算机视觉的采集仪表设备信息的系统及方法
CN106778754A (zh) * 2016-11-22 2017-05-31 南京理工大学 一种鲁棒的工业电表数字识别方法
CN107590498A (zh) * 2017-09-27 2018-01-16 哈尔滨工业大学 一种基于字符分割级联二分类器的自适应汽车仪表检测方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2760250B2 (ja) * 1993-02-03 1998-05-28 株式会社デンソー ピンホール検査装置
JP3510468B2 (ja) * 1998-02-06 2004-03-29 日産自動車株式会社 表面欠陥の検査装置
CN103984930B (zh) * 2014-05-21 2019-07-05 南京航空航天大学 基于视觉的数字仪表识别系统及其识别方法
CN104268539B (zh) * 2014-10-17 2017-10-31 中国科学技术大学 一种高性能的人脸识别方法及系统
CN105809179B (zh) * 2014-12-31 2019-10-25 中国科学院深圳先进技术研究院 一种指针式仪表的读数识别方法及装置
CN106845514B (zh) * 2016-12-06 2020-06-16 深圳增强现实技术有限公司 一种基于深度学习的指针式表盘的读数判断方法和装置
CN106909941A (zh) * 2017-02-27 2017-06-30 广东工业大学 基于机器视觉的多表字符识别系统及方法
CN108537222A (zh) * 2018-04-13 2018-09-14 湖南阳光电力科技有限公司 一种用于电力仪表的图像识别方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104678963A (zh) * 2015-02-03 2015-06-03 葛武 一种基于计算机视觉的采集仪表设备信息的系统及方法
CN106778754A (zh) * 2016-11-22 2017-05-31 南京理工大学 一种鲁棒的工业电表数字识别方法
CN107590498A (zh) * 2017-09-27 2018-01-16 哈尔滨工业大学 一种基于字符分割级联二分类器的自适应汽车仪表检测方法

Also Published As

Publication number Publication date
CN110232376A (zh) 2019-09-13

Similar Documents

Publication Publication Date Title
Chen et al. Vehicle detection in high-resolution aerial images via sparse representation and superpixels
Yuan et al. Bag-of-words and object-based classification for cloud extraction from satellite imagery
Lucchi et al. A fully automated approach to segmentation of irregularly shaped cellular structures in EM images
CN106156778A (zh) 用于识别三维机器视觉系统的视野中的已知对象的装置和方法
CN110443143B (zh) 多分支卷积神经网络融合的遥感图像场景分类方法
CN109376591B (zh) 深度学习特征与视觉特征联合训练的船只目标检测方法
CN108564085B (zh) 一种自动读取指针式仪表读数的方法
CN107622280B (zh) 基于场景分类的模块化处方式图像显著性检测方法
Al-Azzawi et al. AutoCryoPicker: an unsupervised learning approach for fully automated single particle picking in Cryo-EM images
CN107103320B (zh) 嵌入式医疗数据图像识别及集成方法
CN106548195A (zh) 一种基于改进型hog‑ulbp特征算子的目标检测方法
Zuo et al. A robust approach to reading recognition of pointer meters based on improved mask-RCNN
CN110659637A (zh) 一种结合深度神经网络和sift特征的电能表示数与标签自动识别方法
Singh et al. Vidaq: A framework for monitoring human machine interfaces
CN110232376B (zh) 一种利用投影回归的齿轮式数字仪表识别方法
Sun et al. Contextual models for automatic building extraction in high resolution remote sensing image using object-based boosting method
CN108154107B (zh) 一种确定遥感图像归属的场景类别的方法
EP3137895A1 (en) Method and apparatus for processing block to be processed of urine sediment image
Lam A fast approach for detecting human faces in a complex background
Hu et al. Median filtering forensics based on discriminative multi-scale sparse coding
Fu et al. Patchy aurora image segmentation based on ALBP and block threshold
Gao et al. Sea ice change detection in SAR images based on collaborative representation
Wang et al. Learning to count objects with few exemplar annotations
US20210174131A1 (en) Computer Vision System for Industrial Equipment Gauge Digitization and Alarms
Li et al. Robust traffic sign detection using fuzzy shape recognizer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant