CN104899587A

CN104899587A - 一种基于机器学习的数字式表计识别方法

Info

Publication number: CN104899587A
Application number: CN201510342718.3A
Authority: CN
Inventors: 张蕾; 章毅
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2015-06-19
Filing date: 2015-06-19
Publication date: 2015-09-09

Abstract

本发明提供一种基于机器学习的数字式表计识别方法，属于电表设备技术领域。为了解决传统的人工抄表方式，工作量大，效率低，不安全，不利于数据统计和查询的问题。本发明提供一种基于机器学习的数字式表计识别方法，主要包括以下内容：首先对表计图像预处理得到有效区域，进而对有效区域进行图像分割，获得单个数字的图像。使用支持向量机模型对单个数字样本进行训练，用训练后的支持向量机模型为待识别的数字进行识别，从而完成数字表计的智能读数。本发明提供的基于机器学习的数字式表计识别方法，可以在复杂环境下对数字式表计进行快速、可靠、精确地远程智能读数，可在变电站中进行广泛的运用。

Description

一种基于机器学习的数字式表计识别方法

技术领域

本发明属于电表设备技术领域，特别涉及一种基于机器学习的数字式表计识别方法。

背景技术

变电站是输电和配电的集合点，是电力系统的重要组成部分。变电站需要记录各表计的读数并监测其相关状态以保障电变站的正常运作和电力数据的收集、统计。变电站中各种表计数目繁多，传统人工抄表方式下，工作量大，效率低，不安全，不利于数据统计和查询，同时也无法实时对变电站中基础电力设施进行监控，造成了一定的安全隐患。

随着电子信息技术高速发展，各行各业都在走向数字化和智能化的今天，利用现代化设备和识别算法，针对复杂的实际工业环境，实现自然场景下表计的智能读数并记录，以高效安全的方式代替落后的传统抄表方式有着非常重要的意义。

实时监控变电站中基础电力设施，在第一时间发现并解决供电故障，以保证民用和工业的稳定供电十分重要。但是，现有的表计智能识别系统也大多基于ARM嵌入式系统，硬件成本高，通用性低，可移植性较差。

发明内容

为了解决上述问题，本发明提供一种可在复杂环境下对数字式表计进行快速、可靠、精确地远程智能读数的智能识别方法，采用如下技术方案：

一种基于机器学习的数字式表计识别方法，其特征在于，包括以下步骤：

(1)对数字式表计的图像进行预处理，得到有效区域；

(2)对有效区域进行图像分割，获得单个数字的图像；

(3)使用支持向量机模型对单个数字样本进行训练；

(4)用训练后的支持向量机模型为待识别的数字进行识别，得到数字表计的智能读数。

进一步地，步骤(4)中所述的为待识别的数字进行识别包括以下内容：

a1.标定图像有效识别区域；

a2.对有效区域进行分割，将图像分割为统一大小的独立数字图像；

a3.将分割后的各图像进行矩阵重组；

a4.用训练后的支持向量机模型依次进行预测；

a5.计算即得到识别结果。

本发明产生的有益效果如下：

传统的人工抄表方式，工作量大，效率低，不安全，不利于数据统计和查询，同时也无法实时对变电站中基础电力设施进行监控，造成了一定的安全隐患。而本发明提供的基于机器学习的数字式表计识别方法，可以复杂环境下对机械式电表进行快速、可靠、精确地远程智能读数，可在变电站中进行广泛的运用。

附图说明

图1为训练过程流程示意图；

图2为预测过程流程示意图。

具体实施方式

下面参照附图对本发明的实施方式进行详细说明，但不限制本发明的保护范围。

实施例1

一种基于机器学习的数字式表计识别方法，主要采用如下方法：

基于变电站的实际情况，对表计图像预处理，用支持向量机对样本图像进行训练，并用于判断待识别的表计图像中的数字。对数字表计的识别主要分为训练，预测两个部分；训练数据集生成SVM模型，图1所示为训练过程流程示意图。

用训练好的SVM模型对数字表计图像进行预测(即识别)，并给出预测结果，图2所示为识别过程流程示意图：

实施例2

一种基于机器学习的数字式表计识别方法(基于SVM分类器)，包括以下步骤：

(1)对数字式表计的图像进行预处理，得到有效区域；

对数字表计图像进行标定，用配置工具获得图像中特定点的坐标值并存入xml配置文件，在程序中读入xml配置文件，获得有效区域。

(2)对有效区域进行图像分割，获得单个数字的图像；

对有效区域进行分割，读入特定点的坐标值，将有效区域分割为统一大小50*61的三个独立数字图像，并对这些图像文件进行分类整理，分别存入标签为0-9的文件夹，作为训练样本。

(3)使用支持向量机模型对单个数字样本进行训练；

批量读取用于训练的数据图像及其标签，对图像做平滑降噪处理。访问图像数据，获得矩阵，遍历图像的每个像素点，对矩阵值做归一化处理。将处理后的数据存为一个3050维的行向量，作为训练数据。关键代码如下表所示：

设置训练参数，包括SVM的类型，迭代终止准则，核函数类型，以及核函数的参数等。SVM的类型参数有如下几种：C_SVC是C类支持向量分类机，n类分组(n≥2)，允许用异常值惩罚因子C进行不完全分类，本文训练采用的为C类支持向量机；EPS_SVR是∈类支持向量回归机。训练集中的特征向量和拟合出来的超平面的距离需要小于p，异常值惩罚因子C被采用；NU_SVC v类支持向量分类机，n类似然不完全分类的分类器，参数为v取代C。参数term_crit是SVM的迭代训练过程的中止条件，解决部分受约束二次最优问题。引入核函数用于减少(2.13)式中因点积运算而产生的巨大的计算量和开销。结果表明，训练元组中需点积运算的非线性映射函数完全等价于将核函数K(X_i，X_j)应用于原输入数据的效果。即：

所以，每次训练时都可用K(X_i，X_j)代替点积运算可供使用的核函数有h次多项式核函数，高级径向基函数核函数(RBF)和S型核函数等。其中较为常用的是RBF核函数，引入核函数的好处是可以将训练样本映射到更有利于可线性分割的样本集，即增加样本向量的维度，核函数的参数有惩罚因子c和γ。几种常用的核函数如1.2式到1.5式所示：

线性核函数：

K (X_{i}, X_{j}) = X_{i}^{T} X_{j} - - - (1.2)

多项式核函数：

K (X_{i}, X_{j}) = {({γX}_{i}^{T} X_{j} + r)}^{d}, γ > 0 - - - (1.3)

RBF核函数：

K (X_{i}, X_{j}) = \exp (- γ | | X_{i} - X_{j} | |^{2}), γ > 0 - - - (1.4)

Sigmoid核函数：

K (X_{i}, X_{j}) = \tanh ({γX}_{i}^{T} X_{j} + r) - - - (1.5)

a5.将训练好的SVM模型保存为xml文件。

在已经训练并生成SVM模型的基础上，对数字表计读数的预测步骤如下：

a1.对数字表计图像进行标定，用配置工具获得图像中特定点的坐标值，此过程作为图片配置工作，将配置结果存入xml文件。

a2.读入待识别表计图像和xml配置文件，根据配置信息对图像进行分割，分割为统一大小50*61的三个独立数字图像。

a3.依次将三个待识别图像作为测试数据输入，用SVM模型对其进行预测，获得三个响应值，并计算得到最终预测结果。如1.6式所示：

result＝Response_testF*100+Response_testS*10+Response_testT (1.6)

其中，Response_testF，Response_testS和Response_testT分别是用SVM模型预测第一，二，三个数字获得的响应值，result是最后计算得到的结果，即表计识别结果。

实施例3

数字表计识别结果与分析如下：

随机选取40个数字表计图像，分割后获得120个训练样本，对这120个样本进行训练，获得支持向量机模型，并保存训练数据。用其余40个表计图像作测试样本，测试结果如下表所示：

核函数	识别准确率(40组数据)
		高级径向基函数核函数RBF	85％
Sigmoid核函数	15％
		线性核函数Linear	60％

由上表可看出，RBF核函数较适合做支持向量机训练所用核函数。通过对终止条件，迭代次数及核函数参数的实验，最终确定了最合适的参数，即在保证了识别准确率的前提下，训练时间最短的参数组。

无法准确识别的图像大都是由于强烈光照或过于扭曲的拍摄角度获取到的质量较差的图像。实验发现，当加入一些同等低质量的图像做样本集训练后，此类质量较差的图像也可以被正确识别。即对于失败案例的解决方法有两种：一是不在强光照等恶劣环境下采集图像；二是可以在恶劣环境中采集适当图像加入样本集参与训练，这样训练生成的支持向量机模型可对此类低质量图片准确识别。

Claims

1.一种基于机器学习的数字式表计识别方法，其特征在于，包括以下步骤：

(1)对数字式表计的图像进行预处理，得到有效区域；

(2)对有效区域进行图像分割，获得单个数字的图像；

(3)使用支持向量机模型对单个数字样本进行训练；

2.根据权利要求1所述的基于机器学习的数字式表计识别方法，其特征在于，步骤(4)中所述的为待识别的数字进行识别包括以下内容：

a1.标定图像有效识别区域；

a3.将分割后的各图像进行矩阵重组；

a4.用训练后的支持向量机模型依次进行预测；

a5.计算即得到识别结果。