CN104899587A - 一种基于机器学习的数字式表计识别方法 - Google Patents

一种基于机器学习的数字式表计识别方法 Download PDF

Info

Publication number
CN104899587A
CN104899587A CN201510342718.3A CN201510342718A CN104899587A CN 104899587 A CN104899587 A CN 104899587A CN 201510342718 A CN201510342718 A CN 201510342718A CN 104899587 A CN104899587 A CN 104899587A
Authority
CN
China
Prior art keywords
image
meter
machine learning
training
digital meter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510342718.3A
Other languages
English (en)
Inventor
张蕾
章毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN201510342718.3A priority Critical patent/CN104899587A/zh
Publication of CN104899587A publication Critical patent/CN104899587A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于机器学习的数字式表计识别方法,属于电表设备技术领域。为了解决传统的人工抄表方式,工作量大,效率低,不安全,不利于数据统计和查询的问题。本发明提供一种基于机器学习的数字式表计识别方法,主要包括以下内容:首先对表计图像预处理得到有效区域,进而对有效区域进行图像分割,获得单个数字的图像。使用支持向量机模型对单个数字样本进行训练,用训练后的支持向量机模型为待识别的数字进行识别,从而完成数字表计的智能读数。本发明提供的基于机器学习的数字式表计识别方法,可以在复杂环境下对数字式表计进行快速、可靠、精确地远程智能读数,可在变电站中进行广泛的运用。

Description

一种基于机器学习的数字式表计识别方法
技术领域
本发明属于电表设备技术领域,特别涉及一种基于机器学习的数字式表计识别方法。
背景技术
变电站是输电和配电的集合点,是电力系统的重要组成部分。变电站需要记录各表计的读数并监测其相关状态以保障电变站的正常运作和电力数据的收集、统计。变电站中各种表计数目繁多,传统人工抄表方式下,工作量大,效率低,不安全,不利于数据统计和查询,同时也无法实时对变电站中基础电力设施进行监控,造成了一定的安全隐患。
随着电子信息技术高速发展,各行各业都在走向数字化和智能化的今天,利用现代化设备和识别算法,针对复杂的实际工业环境,实现自然场景下表计的智能读数并记录,以高效安全的方式代替落后的传统抄表方式有着非常重要的意义。
实时监控变电站中基础电力设施,在第一时间发现并解决供电故障,以保证民用和工业的稳定供电十分重要。但是,现有的表计智能识别系统也大多基于ARM嵌入式系统,硬件成本高,通用性低,可移植性较差。
发明内容
为了解决上述问题,本发明提供一种可在复杂环境下对数字式表计进行快速、可靠、精确地远程智能读数的智能识别方法,采用如下技术方案:
一种基于机器学习的数字式表计识别方法,其特征在于,包括以下步骤:
(1)对数字式表计的图像进行预处理,得到有效区域;
(2)对有效区域进行图像分割,获得单个数字的图像;
(3)使用支持向量机模型对单个数字样本进行训练;
(4)用训练后的支持向量机模型为待识别的数字进行识别,得到数字表计的智能读数。
进一步地,步骤(4)中所述的为待识别的数字进行识别包括以下内容:
a1.标定图像有效识别区域;
a2.对有效区域进行分割,将图像分割为统一大小的独立数字图像;
a3.将分割后的各图像进行矩阵重组;
a4.用训练后的支持向量机模型依次进行预测;
a5.计算即得到识别结果。
本发明产生的有益效果如下:
传统的人工抄表方式,工作量大,效率低,不安全,不利于数据统计和查询,同时也无法实时对变电站中基础电力设施进行监控,造成了一定的安全隐患。而本发明提供的基于机器学习的数字式表计识别方法,可以复杂环境下对机械式电表进行快速、可靠、精确地远程智能读数,可在变电站中进行广泛的运用。
附图说明
图1为训练过程流程示意图;
图2为预测过程流程示意图。
具体实施方式
下面参照附图对本发明的实施方式进行详细说明,但不限制本发明的保护范围。
实施例1
一种基于机器学习的数字式表计识别方法,主要采用如下方法:
基于变电站的实际情况,对表计图像预处理,用支持向量机对样本图像进行训练,并用于判断待识别的表计图像中的数字。对数字表计的识别主要分为训练,预测两个部分;训练数据集生成SVM模型,图1所示为训练过程流程示意图。
用训练好的SVM模型对数字表计图像进行预测(即识别),并给出预测结果,图2所示为识别过程流程示意图:
实施例2
一种基于机器学习的数字式表计识别方法(基于SVM分类器),包括以下步骤:
(1)对数字式表计的图像进行预处理,得到有效区域;
对数字表计图像进行标定,用配置工具获得图像中特定点的坐标值并存入xml配置文件,在程序中读入xml配置文件,获得有效区域。
(2)对有效区域进行图像分割,获得单个数字的图像;
对有效区域进行分割,读入特定点的坐标值,将有效区域分割为统一大小50*61的三个独立数字图像,并对这些图像文件进行分类整理,分别存入标签为0-9的文件夹,作为训练样本。
(3)使用支持向量机模型对单个数字样本进行训练;
批量读取用于训练的数据图像及其标签,对图像做平滑降噪处理。访问图像数据,获得矩阵,遍历图像的每个像素点,对矩阵值做归一化处理。将处理后的数据存为一个3050维的行向量,作为训练数据。关键代码如下表所示:
设置训练参数,包括SVM的类型,迭代终止准则,核函数类型,以及核函数的参数等。SVM的类型参数有如下几种:C_SVC是C类支持向量分类机,n类分组(n≥2),允许用异常值惩罚因子C进行不完全分类,本文训练采用的为C类支持向量机;EPS_SVR是∈类支持向量回归机。训练集中的特征向量和拟合出来的超平面的距离需要小于p,异常值惩罚因子C被采用;NU_SVC v类支持向量分类机,n类似然不完全分类的分类器,参数为v取代C。参数term_crit是SVM的迭代训练过程的中止条件,解决部分受约束二次最优问题。引入核函数用于减少(2.13)式中因点积运算而产生的巨大的计算量和开销。结果表明,训练元组中需点积运算的非线性映射函数完全等价于将核函数K(Xi,Xj)应用于原输入数据的效果。即:
所以,每次训练时都可用K(Xi,Xj)代替点积运算可供使用的核函数有h次多项式核函数,高级径向基函数核函数(RBF)和S型核函数等。其中较为常用的是RBF核函数,引入核函数的好处是可以将训练样本映射到更有利于可线性分割的样本集,即增加样本向量的维度,核函数的参数有惩罚因子c和γ。几种常用的核函数如1.2式到1.5式所示:
线性核函数: K ( X i , X j ) = X i T X j - - - ( 1.2 )
多项式核函数: K ( X i , X j ) = ( γX i T X j + r ) d , γ > 0 - - - ( 1.3 )
RBF核函数: K ( X i , X j ) = exp ( - γ | | X i - X j | | 2 ) , γ > 0 - - - ( 1.4 )
Sigmoid核函数: K ( X i , X j ) = tanh ( γX i T X j + r ) - - - ( 1.5 )
a5.将训练好的SVM模型保存为xml文件。
(4)用训练后的支持向量机模型为待识别的数字进行识别,得到数字表计的智能读数。
在已经训练并生成SVM模型的基础上,对数字表计读数的预测步骤如下:
a1.对数字表计图像进行标定,用配置工具获得图像中特定点的坐标值,此过程作为图片配置工作,将配置结果存入xml文件。
a2.读入待识别表计图像和xml配置文件,根据配置信息对图像进行分割,分割为统一大小50*61的三个独立数字图像。
a3.依次将三个待识别图像作为测试数据输入,用SVM模型对其进行预测,获得三个响应值,并计算得到最终预测结果。如1.6式所示:
result=ResponsetestF*100+ResponsetestS*10+ResponsetestT   (1.6)
其中,ResponsetestF,ResponsetestS和ResponsetestT分别是用SVM模型预测第一,二,三个数字获得的响应值,result是最后计算得到的结果,即表计识别结果。
实施例3
数字表计识别结果与分析如下:
随机选取40个数字表计图像,分割后获得120个训练样本,对这120个样本进行训练,获得支持向量机模型,并保存训练数据。用其余40个表计图像作测试样本,测试结果如下表所示:
核函数 识别准确率(40组数据)
高级径向基函数核函数RBF 85%
Sigmoid核函数 15%
线性核函数Linear 60%
由上表可看出,RBF核函数较适合做支持向量机训练所用核函数。通过对终止条件,迭代次数及核函数参数的实验,最终确定了最合适的参数,即在保证了识别准确率的前提下,训练时间最短的参数组。
无法准确识别的图像大都是由于强烈光照或过于扭曲的拍摄角度获取到的质量较差的图像。实验发现,当加入一些同等低质量的图像做样本集训练后,此类质量较差的图像也可以被正确识别。即对于失败案例的解决方法有两种:一是不在强光照等恶劣环境下采集图像;二是可以在恶劣环境中采集适当图像加入样本集参与训练,这样训练生成的支持向量机模型可对此类低质量图片准确识别。

Claims (2)

1.一种基于机器学习的数字式表计识别方法,其特征在于,包括以下步骤:
(1)对数字式表计的图像进行预处理,得到有效区域;
(2)对有效区域进行图像分割,获得单个数字的图像;
(3)使用支持向量机模型对单个数字样本进行训练;
(4)用训练后的支持向量机模型为待识别的数字进行识别,得到数字表计的智能读数。
2.根据权利要求1所述的基于机器学习的数字式表计识别方法,其特征在于,步骤(4)中所述的为待识别的数字进行识别包括以下内容:
a1.标定图像有效识别区域;
a2.对有效区域进行分割,将图像分割为统一大小的独立数字图像;
a3.将分割后的各图像进行矩阵重组;
a4.用训练后的支持向量机模型依次进行预测;
a5.计算即得到识别结果。
CN201510342718.3A 2015-06-19 2015-06-19 一种基于机器学习的数字式表计识别方法 Pending CN104899587A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510342718.3A CN104899587A (zh) 2015-06-19 2015-06-19 一种基于机器学习的数字式表计识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510342718.3A CN104899587A (zh) 2015-06-19 2015-06-19 一种基于机器学习的数字式表计识别方法

Publications (1)

Publication Number Publication Date
CN104899587A true CN104899587A (zh) 2015-09-09

Family

ID=54032241

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510342718.3A Pending CN104899587A (zh) 2015-06-19 2015-06-19 一种基于机器学习的数字式表计识别方法

Country Status (1)

Country Link
CN (1) CN104899587A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105825204A (zh) * 2016-04-08 2016-08-03 国家电网公司 一种智能相机夜间识别电力设备表计的方法
CN106169080A (zh) * 2016-07-04 2016-11-30 重庆大学 一种基于图像的燃气指数自动识别方法
WO2017071064A1 (zh) * 2015-10-30 2017-05-04 小米科技有限责任公司 区域提取方法、模型训练方法及装置
CN108597204A (zh) * 2018-05-22 2018-09-28 广州市暨联牧科信息科技有限公司 一种智能抄表系统及其实现方法
CN110021158A (zh) * 2019-04-18 2019-07-16 南京工程学院 一种基于深度学习的摄像抄表系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050129316A1 (en) * 2003-07-15 2005-06-16 Stmicroelectronics S.R.L. Method for classifying a digital image
CN101000652A (zh) * 2006-12-31 2007-07-18 沈阳工业大学 流量计费表数字远传图像自动识别方法及数字远传抄表系统
CN102254159A (zh) * 2011-07-07 2011-11-23 清华大学深圳研究生院 一种数显仪表判读方法
CN102799861A (zh) * 2012-06-29 2012-11-28 上海大学 一种利用颜色快速识别仪表读数的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050129316A1 (en) * 2003-07-15 2005-06-16 Stmicroelectronics S.R.L. Method for classifying a digital image
CN101000652A (zh) * 2006-12-31 2007-07-18 沈阳工业大学 流量计费表数字远传图像自动识别方法及数字远传抄表系统
CN102254159A (zh) * 2011-07-07 2011-11-23 清华大学深圳研究生院 一种数显仪表判读方法
CN102799861A (zh) * 2012-06-29 2012-11-28 上海大学 一种利用颜色快速识别仪表读数的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李辉: ""基于机器视觉的仪表数字识别研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017071064A1 (zh) * 2015-10-30 2017-05-04 小米科技有限责任公司 区域提取方法、模型训练方法及装置
CN105825204A (zh) * 2016-04-08 2016-08-03 国家电网公司 一种智能相机夜间识别电力设备表计的方法
CN106169080A (zh) * 2016-07-04 2016-11-30 重庆大学 一种基于图像的燃气指数自动识别方法
CN106169080B (zh) * 2016-07-04 2019-04-19 重庆大学 一种基于图像的燃气指数自动识别方法
CN108597204A (zh) * 2018-05-22 2018-09-28 广州市暨联牧科信息科技有限公司 一种智能抄表系统及其实现方法
CN110021158A (zh) * 2019-04-18 2019-07-16 南京工程学院 一种基于深度学习的摄像抄表系统及方法

Similar Documents

Publication Publication Date Title
CN110147456B (zh) 一种图像分类方法、装置、可读存储介质及终端设备
EP3432197B1 (en) Method and device for identifying characters of claim settlement bill, server and storage medium
CN107330471B (zh) 反馈内容的问题定位方法和装置、计算机设备、存储介质
CN104899587A (zh) 一种基于机器学习的数字式表计识别方法
Sun et al. Robust co-training
US11640551B2 (en) Method and apparatus for recommending sample data
US11995543B2 (en) Wafer processing method and apparatus, storage medium and electronic device
CN105468742A (zh) 恶意订单识别方法及装置
CN110764993A (zh) 自动化测试方法及终端设备
CN107016132B (zh) 一种在线题库质量改善方法、系统及终端设备
Li et al. Accurate screw detection method based on faster R-CNN and rotation edge similarity for automatic screw disassembly
CN110517130A (zh) 一种智能记账方法及其系统
CN111652232A (zh) 票据识别方法及装置、电子设备和计算机可读存储介质
CN111126481A (zh) 一种神经网络模型的训练方法及装置
CN104933428A (zh) 一种基于张量描述的人脸识别方法及装置
CN104616029A (zh) 数据分类方法及装置
CN110019790A (zh) 文本识别、文本监控、数据对象识别、数据处理方法
CN112419268A (zh) 一种输电线路图像缺陷检测方法、装置、设备及介质
CN109492859A (zh) 基于神经网络模型的员工分类方法及装置、设备、介质
CN112559687A (zh) 问题识别及查询方法、装置、电子设备及存储介质
CN112364145A (zh) 一种工单处理方法、装置、电子设备及存储介质
CN113591900A (zh) 一种高需求响应潜力用户的识别方法、装置及终端设备
CN112580684A (zh) 基于半监督学习的目标检测方法、装置及存储介质
Rao et al. A first look: Towards explainable textvqa models via visual and textual explanations
CN110796039B (zh) 一种面部瑕疵检测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150909

RJ01 Rejection of invention patent application after publication