CN105844205B

CN105844205B - 基于图像处理的字符信息识别方法

Info

Publication number: CN105844205B
Application number: CN201510020184.2A
Authority: CN
Inventors: 费基恒
Original assignee: SUNTRONT TECHNOLOGY Co Ltd
Current assignee: SUNTRONT TECHNOLOGY Co Ltd
Priority date: 2015-01-15
Filing date: 2015-01-15
Publication date: 2019-05-31
Anticipated expiration: 2035-01-15
Also published as: US10311322B2; CN105844205A; US20170308768A1; WO2016112669A1

Abstract

本发明涉及一种基于图像处理的字符信息识别方法，包括：首先采集图像，得到目标字符图像；然后对于一个目标字符图像，将其顺次与字模库中的字模图像进行比对，寻找目标字符图像的字符与一字模图像的字模的最大重合面积，当重合面积满足设定条件时，判定待识别目标字符为对应字模图像的字符。本发明在设计字模时，不仅包括允许重合区，还包括禁止重合区。通过设置禁止重合区，能够更加准确的进行直接字模匹配比对，而且识别速度也较快。

Description

基于图像处理的字符信息识别方法

技术领域

本发明属于图像识别领域，特别是一种基于图像处理的字符信息识别方法，即识别表头中的字符信息，本文所指字符包括数字、字母、符号等类型的字符。

背景技术

随着摄像装置的普及，图像识别技术也不断拓展其应用领域。

比如：远程自动抄表技术，通过摄像装置获取表盘图像，通过图像处理，识别出表盘上的信息。表计可以是字轮形式的水表、电表，也可以是指针式的压力表等。

再如：车牌识别技术，通过对监控画面处理，识别车牌信息。

图像识别的一般步骤包括灰度处理、二值化处理、选定识别区域、分割出各个字符、对各个字符进行识别，还包括对易混淆的字符进行二次判别。

其中关键在于字符的识别，字符识别一般包括两种方式：

一，神经网络算法。通过选择大量的样本字符，对样本进行训练以得到网络权重系数。

二，设定字模。字模是对二值化图像进行识别时，与目标图像进行比对的标准图。将字模图像与目标图像进行比对，判断目标图像与字模图像的接近程度，实现对目标图像的识别。

神经网络算法为了取得高的字符识别率，需要对各个字符样本的数量、质量进行评估，通过不断收集识别有误的样本数据，再重新训练以不断提高字符识别率。

设定字模的方式较为简单，不需要复杂算法，但是识别效果较差。

发明内容

本发明的目的是提供一种基于图像处理的字符信息识别方法，用以解决采用字模识别效果差的问题。

为实现上述目的，本发明的方案包括：

一种基于图像处理的字符信息识别方法，步骤如下：

1)采集图像，经过图像预处理，得到目标字符图像；目标字符图像由背景和背景上的待识别目标字符构成；

2)对于一个目标字符图像，将其顺次与字模库中的字模图像进行比对，寻找目标字符图像的字符与一字模图像的字模的最大重合面积，当重合面积满足设定条件时，判定待识别目标字符为对应字模图像的字符；

规定范围内的若干个字模图像构成字模库；字模图像为标准的、二值化的字符图像，由背景和背景上设定位置的字模构成；各字模图像的字模均包括允许重合区，至少一个字模图像的字模还包括禁止重合区；允许重合区为设定的标准字符；禁止重合区是允许重合区以外的、用于与其他字模区别的关键区域块。

所述步骤2)中，对于一个目标字符图像，将其顺次与字模库中的字模图像进行比对时，同步计算该目标字符图像与参与比对的每个字模图像的重合率；判断重合率的大小，当重合率的大小达到设定条件时，待识别目标字符为对应字模图像的字符。

步骤2)中：将一个目标字符图像分别与字模库中的所有字模图像进行比对；将该目标字符图像与一个字模图像进行比对时，直接将目标字符图像与该字模图像重叠，同步计算得出该目标字符图像与该字模图像的重合率；依次得到该目标字符图像与所有字模图像的对应重合率，查找到最大重合率时，判定待识别目标字符即为对应字模图像的字符。

步骤2)中：将一个目标字符图像分别与字模库中的若干字模图像进行比对；将该目标字符图像与一个字模图像进行比对时，直接将目标字符图像与该字模图像重叠，同步计算得出该目标字符图像与该字模图像的重合率，并与设定值进行比较；若该目标字符图像与其中一个字模图像的重合率超过设定值时，则停止比较，判定待识别目标字符为该字模图像的字符。

步骤2)中：将一个目标字符图像分别与字模库中的所有字模图像进行比对；将该目标字符图像与一个字模图像进行比对时，将该字模图像置于一个区域内，该区域范围大于字模图像尺寸；用目标字符图像在所述区域中扫描，扫描的范围保证目标字符图像覆盖字模图像所在部分，同步计算每次扫描的重合率，然后以各次计算的重合率中的最大值为该目标字符与该字模图像的重合率；依次得到该目标字符图像与所有字模图像的对应重合率，查找到其中的最大重合率时，判定待识别目标字符即为对应字模图像的字符。

步骤2)中：将一个目标字符图像分别与字模库中的所有字模图像进行比对；将该目标字符图像与一个字模图像进行比对时，将该目标字符图像置于一个区域内，该区域范围大于字模图像尺寸；用该字模图像在所述区域中扫描，扫描的范围保证字模图像覆盖目标字符图像所在部分，同步计算每次扫描的重合率，然后以各次计算的重合率中的最大值为该目标字符与该字模图像的重合率；依次得到该目标字符图像与所有字模图像的对应重合率，查找到其中的最大重合率时，判定待识别目标字符即为对应字模图像的字符。

将一个目标字符图像分别与字模库中的若干字模图像进行比对；将该目标字符图像与一个字模图像进行比对时，将该字模图像置于一个区域内，该区域范围大于字模图像尺寸；用目标字符图像在所述区域中扫描，扫描的范围保证目标字符图像覆盖字模图像所在部分，同步计算得出该目标字符图像与该字模图像的重合率，并与设定值进行比较；若该目标字符图像与其中一个字模图像的重合率超过设定值时，则停止比较，判定待识别目标字符为该字模图像的字符。

将一个目标字符图像分别与字模库中的若干字模图像进行比对；将该目标字符图像与一个字模图像进行比对时，将该目标字符图像置于一个区域内，该区域范围大于字模图像尺寸；用该字模图像在所述区域中扫描，扫描的范围保证字模图像覆盖目标字符图像所在部分，同步计算得出该目标字符图像与该字模图像的重合率，并与设定值进行比较；若该目标字符图像与其中一个字模图像的重合率超过设定值时，则停止比较，判定待识别目标字符为该字模图像的字符。

重合率计算公式为：k(a’+b’)/(a+b)；字模图像中允许重合区像素数为a，禁止重合区像素数为b；比对过程中目标字符图像与允许重合区重合的像素数为a’，目标字符图像与禁止重合区不重合的像素数为b’，k为系数。

所述图像预处理包括：图像分割、二值化处理、均值滤波、形态学滤波、边沿切割的步骤。

一个字符的字模图像生成的方法包括：首先拍摄该字符图像，进行图像处理，得到字符的二值化图像；然后将二值化图像镂空生成边界，在边界以内的中间部位绘制设定宽度的线条形成允许重合区；接着在边界以外添加禁止重合区；最后将边界去除，得到字模图像。

本发明在设计字模时，不仅包括允许重合区，还包括禁止重合区。通过设置禁止重合区，使字模更具有区分性，能够更加准确的进行直接字模匹配比对，而且识别速度也较快。

在定义重合率计算规则时，考虑允许重合区重合的像素数越多，重合率越大，禁止重合区不重合的像素数越多，重合率越大。通过相应的计算公式能够直接、迅速的进行字模比对的匹配运算。

重合率的大小达到设定条件的字模图像对应的字符即为待识别的目标字符；其涉及的具体方式包括：直接将目标字符图像与字模图像重叠，找重合率最大值，或者判断重合率大于设定值；还可以通过扫描的方式比对，找重合率最大值，或者判断重合率大于设定值；采用扫描方式，能够减小因目标字符不居中而造成的误差，保障结果准确率。

在生成字模时，可以依据真实图像，进行“细化”处理，能够使识别更加准确可靠。

附图说明

图1是本发明实施例所采用的识别设备；

图2是本发明实施例的字轮区域设置示意图；

图3是本发明实施例的预处理过程示意图；

图4是本发明实施例“0”-“9”的字模；

图5是本发明实施例“2”的字模生成过程图；

图6是本发明实施例3、实施例4的扫描方式的示意图；

图7是另一种扫描方式示意图。

具体实施方式

下面以机械字轮式大水表的数字识别为例，结合附图对本发明做进一步详细的说明。

具体的，可以采用如图1所示的设备，摄像模块安装在机械字轮式大水表上，可以通过装置自带的摄像头进行字轮拍摄，通过防水电缆，将图像传输到电脑或者GPRS模块，电脑通过USB接口与摄像模块连接，用于有线模式。GPRS模块用于无线远传的工作模式。

设备可以通过GPRS通信方式向指定网站上传原始图像、二值化图像或数字识别结果。上传过程可由网站通过指令发起，也可由装置通过定时主动上传。原始图像和二值化图像可以采用分帧传输的方式，将图像数据分为若干帧，每帧不超过1350个字节，并带有独立的校验机制，可以保证图像传输的可靠性。

具体设备可以根据情况购买或设计，设备硬件、通信规则等与本发明方案无关，故在此不再赘述。

实施例1

水表字轮数字识别，包括预处理过程和各数字识别过程。

一，预处理

预处理过程主要负责进行二值化处理、选定识别区域、分割字轮的各个数字等。预处理过程的目的是得到每个数字的清晰的二值化图像——即目标字符图像，即目标字符图像由背景和背景中的待识别目标字符(本实施例中即为目标数字)构成。目标字符图像尺寸应当与字模图像尺寸相同，以保障比对时能够充分重合。

如图2所示为对拍摄图像进行字轮区域选取。图3所示为对字轮按位数分割成若干个包含一位数字的小图像后，经过均值滤波、二值化处理、形态学滤波和边沿切割等步骤，得到光滑清晰的二值化图像。

作为其他实施方式，预处理过程也采用其他的技术手段，由于其所涉及的技术手段属于现有技术，在此不再赘述。

二，每个数字的识别包括字模图像的生成，以及目标字符图像与字模图像的比对识别。

字模图像生成

本实施例采用的字模图像如图4所示，字模图像为标准的、二值化的字符图像，由背景和背景中的字模构成。可以看出，一般每个数字的字模包括允许重合区和禁止重合区，无效区为背景。

作为其他实施方式，有些数字，如“8”的字模也可以不设置禁止重合区。

允许重合区是标准字符，即与数字本身的形状吻合、包含在数字本身轮廓范围中的区域。

禁止重合区是字模图像中，允许重合区以外的设定区域块。在设计禁止重合区时，要考虑到所有字模的形状，保证这些区域块是能够与其他字模区别的关键区域块。区域块数量是一个或一个以上。区域块的形状可以是任意形状，但是为了方便计算、操作，一般将其设计为矩形。

无效区是允许重合区和禁止重合区以外的所有区域。

字模图像的生成可以采用多种形式，比如在现有的字模基础上增加禁止重合区。或者如下所述的方式，这种方式设计的字模依据真实图像，而且进行了“细化”处理，能够使识别更加准确可靠，具体的：

如图5所示为“2”的字模生成过程。首先拍摄水表字轮图像，取得清晰地数字区域的图片，进行图像处理，得到该字形的二值化图像；然后将二值化图像镂空生成边界；在镂空的图像边界中的中间部位绘制有一定粗细的线条形成允许重合区，即为该字形的“细化”图像；接着添加禁止重合区；第四步将边界去掉，即得到字模图像。

从0到9的十个数字均可以按以上步骤生成字模图像，从而构成0到9的十个数字的字模库。生成的字模图像进行存储，待比对识别时进行调用。

比对识别

将目标字符图像，即一个字轮上第一个数字分别与0到9的字模图像进行比对，寻找目标字符图像的字符与一字模图像的字模的最大重合面积，当重合面积满足设定条件时，判定待识别目标字符为对应字模图像的字符。

重合面积的大小可以使用不同的物理量进行表达。特别的，本实施例采用重合率来表征重合面积的大小，那么重合率最大的字模图像对应数字即为目标字符，即字轮上的第一个数字。关于重合率的计算，规则是允许重合区重合的像素数越多，重合率越大，禁止重合区不重合的像素数越多，重合率越大。

重合率的具体计算方法如下：设字模图像中允许重合区像素数为a，禁止重合区像素数为b；比对过程中目标字符图像与允许重合区重合的像素数为a’，目标字符图像与禁止重合区不重合的像素数为b’，则重合率为：

100％*(a’+b’)/(a+b)。

具体采用的公式还可以是100％*k(a’+b’)/(a+b)。可以通过调整系数k使得k(a’+b’)/(a+b)在理想的最大情况下能够达到1，从而进一步提供识别精度。

重合率的具体公式还可以是100％*(a’/a+b’/b)，或者100％*(a’+b’)/某定值，或者为a’、b’设定权重值等等。

比对过程中：

在进行一次比对时，涉及一个目标字符图像和字模库中的全部字模图像。将该目标字符图像与字模库中的所有字模图像一一进行比对，计算每个字模图像参与比对时得到的重合率。

然后便能得到该目标字符图像与所有字模图像的对应重合率，查找到其中的最大重合率时，判定待识别目标字符即为对应字模图像的字符。

在进行一个目标字符图像与一个字模图像在比对识别时，直接将目标字符图像与该字模图像重叠，计算出的重合率就是该目标字符图像与该字模图像的重合率。

三，将字轮上第一个数字识别完成后，再重复上述比对识别过程，逐次完成字轮上所有数字的识别。

实施例2

本实施例与实施例1的区别在于，比对识别的方式不同：在进行一次比对时，涉及一个目标字符图像和若干个字模图像，即在识别过程中可能不会涉及字模库中的所有字模图像。

将该目标字符图像与参与比对的字模图像顺次进行比对、计算时，若发现某个字模图像参与比对时的重合率较大，大于一个设定值，那么就可以直接确定该字模图像对应字符为目标字符，不用再与其他字模图像进行比对。

具体来说：

将该目标字符图像与一个字模图像进行比对时，直接将目标字符图像与该字模图像重叠，同步计算得出该目标字符图像与该字模图像的重合率，并与设定值进行比较。

若该目标字符图像与某一个字模图像的重合率超过设定值时，则停止比较，判定待识别目标字符为该字模图像的字符。

设定值可以根据重合率的具体公式进行设定。

实施例3

本实施例与实施例1相比，区别也在于对比识别方式，在逐个比对时，并不将目标字符图像和字模图像直接重叠，而是采用扫描的方式：如图6所示，先将字模图像置于一个较大的区域。然后将目标字符图像放入该区域的左上角，按从左往右从上往下的顺序移位，每次移动一个像素，每移位一次就比对一次重合率。移位完毕后取最大重合率保存，作为该字模图像对应的重合率。

具体来说：

将一个目标字符图像分别与字模库中的所有字模图像进行比对。

将该目标字符图像与一个字模图像进行比对时，将该字模图像置于一个区域内，该区域范围大于字模图像尺寸；用目标字符图像在所述区域中扫描，扫描的范围至少包括从初始位置到字模图像所在位置，同步计算每次扫描的重合率，然后以各次计算的重合率中的最大值为该目标字符与该字模图像的重合率。

依次得到该目标字符图像与所有字模图像的对应重合率，查找到其中的最大重合率时，判定待识别目标字符即为对应字模图像的字符。

扫描方式是用目标字符图像(如图6中小方块)在整个大区域(如图6中大方块)中扫描，获得若干次扫描中的重合率最大值。扫描可以扫描完整个区域为止，也可以是仅扫描一定的范围，至少应从初始位置扫描到字模所在位置，保证目标字符图像覆盖字模图像所在部分，如从左上角扫描到区域的中央部分为止。扫描方式包括先横行再竖向的方式，也可以说斜线方式等等。

采用扫描方式的原因是：由于安装、拍摄的原因，目标字符可能会偏离目标字符图像的中心位置，如果采用直接重叠的方式，则重叠误差较大，造出最终对比结果不准确。通过扫描方式，能够减小误差，保障结果准确率。

另外，采用扫描方式，也可以是将目标字符图像置于一个大区域内，用字模图像在该大区域内进行扫描，如图7所示。由于目标字符图像的区域固定，相对于上述用目标字符图像进行扫描的方式，能够减少运算量，降低算法复杂度。

实施例4

本实施例与实施例3、实施例2相似，采用扫描方式，并且比对可能并不涉及字模库中的所有字模图像。具体来说：

将一个目标字符图像分别与字模库中的若干字模图像进行比对。

将该目标字符图像与一个字模图像进行比对时，将该字模图像置于一个区域内，该区域范围大于字模图像尺寸；用目标字符图像在所述区域中扫描，扫描的范围至少包括从初始位置到字模图像所在位置，保证目标字符图像覆盖字模图像所在部分，同步计算得出该目标字符图像与该字模图像的重合率，并与设定值进行比较。

如实施例3所述，扫描方式也可以是将目标字符图像置于一个大区域内，用字模图像在该大区域内进行扫描。

以上给出了几种具体的实施方式，但本发明不局限于所描述的实施方式。本发明的基本思路在于上述基本方案，即：

首先经过图像预处理，得到目标字符图像，目标字符图像包括待识别的目标字符。

然后将目标字符图像分别与设定的字模图像进行比对，寻找目标字符图像的字符与一字模图像的字模的最大重合面积，当重合面积满足设定条件时，判定待识别目标字符为对应字模图像的字符。在字模设计时的禁止重合区设计是非常关键的，应通盘考虑所有字模的形状，保证禁止重合区的区域块是能够与其他字模区别的关键区域块。

识别的字符包括数字、字母、符号等等。识别的领域也不限于识别水表，还可以是电、气、热等表的字轮读数识别，而且还应扩展到车牌等所有需进行数字、字母、符合等字符识别的领域。

对本领域普通技术人员而言，根据本发明的教导，设计出各种变形的模型、公式、参数并不需要花费创造性劳动。在不脱离本发明的原理和精神的情况下对实施方式进行的变化、修改、替换和变型仍落入本发明的保护范围内。

Claims

1.一种基于图像处理的字符信息识别方法，其特征在于，步骤如下：

2.根据权利要求1所述的基于图像处理的字符信息识别方法，其特征在于，所述步骤2)中，对于一个目标字符图像，将其顺次与字模库中的字模图像进行比对时，同步计算该目标字符图像与参与比对的每个字模图像的重合率；判断重合率的大小，当重合率的大小达到设定条件时，待识别目标字符为对应字模图像的字符。

3.根据权利要求2所述的基于图像处理的字符信息识别方法，其特征在于，步骤2)中：将一个目标字符图像分别与字模库中的所有字模图像进行比对；

将该目标字符图像与一个字模图像进行比对时，直接将目标字符图像与该字模图像重叠，同步计算得出该目标字符图像与该字模图像的重合率；

依次得到该目标字符图像与所有字模图像的对应重合率，查找到最大重合率时，判定待识别目标字符即为对应字模图像的字符。

4.根据权利要求2所述的基于图像处理的字符信息识别方法，其特征在于，步骤2)中：将一个目标字符图像分别与字模库中的若干字模图像进行比对；

将该目标字符图像与一个字模图像进行比对时，直接将目标字符图像与该字模图像重叠，同步计算得出该目标字符图像与该字模图像的重合率，并与设定值进行比较；

若该目标字符图像与其中一个字模图像的重合率超过设定值时，则停止比较，判定待识别目标字符为该字模图像的字符。

5.根据权利要求2所述的基于图像处理的字符信息识别方法，其特征在于，步骤2)中：将一个目标字符图像分别与字模库中的所有字模图像进行比对；

将该目标字符图像与一个字模图像进行比对时，将该字模图像置于一个区域内，该区域范围大于字模图像尺寸；用目标字符图像在所述区域中扫描，扫描的范围保证目标字符图像覆盖字模图像所在部分，同步计算每次扫描的重合率，然后以各次计算的重合率中的最大值为该目标字符与该字模图像的重合率；

6.根据权利要求2所述的基于图像处理的字符信息识别方法，其特征在于，步骤2)中：将一个目标字符图像分别与字模库中的所有字模图像进行比对；

将该目标字符图像与一个字模图像进行比对时，将该目标字符图像置于一个区域内，该区域范围大于字模图像尺寸；用该字模图像在所述区域中扫描，扫描的范围保证字模图像覆盖目标字符图像所在部分，同步计算每次扫描的重合率，然后以各次计算的重合率中的最大值为该目标字符与该字模图像的重合率；

7.根据权利要求2所述的基于图像处理的字符信息识别方法，其特征在于，将一个目标字符图像分别与字模库中的若干字模图像进行比对；

将该目标字符图像与一个字模图像进行比对时，将该字模图像置于一个区域内，该区域范围大于字模图像尺寸；用目标字符图像在所述区域中扫描，扫描的范围保证目标字符图像覆盖字模图像所在部分，同步计算得出该目标字符图像与该字模图像的重合率，并与设定值进行比较；

8.根据权利要求2所述的基于图像处理的字符信息识别方法，其特征在于，将一个目标字符图像分别与字模库中的若干字模图像进行比对；

将该目标字符图像与一个字模图像进行比对时，将该目标字符图像置于一个区域内，该区域范围大于字模图像尺寸；用该字模图像在所述区域中扫描，扫描的范围保证字模图像覆盖目标字符图像所在部分，同步计算得出该目标字符图像与该字模图像的重合率，并与设定值进行比较；

9.根据权利要求2-8中任一项所述的基于图像处理的字符信息识别方法，其特征在于，重合率计算公式为：k(a’+b’)/(a+b)；字模图像中允许重合区像素数为a，禁止重合区像素数为b；比对过程中目标字符图像与允许重合区重合的像素数为a’，目标字符图像与禁止重合区不重合的像素数为b’，k为系数。

10.根据权利要求1-8中任一项所述的基于图像处理的字符信息识别方法，其特征在于，所述图像预处理包括：图像分割、二值化处理、均值滤波、形态学滤波、边沿切割的步骤。

11.根据权利要求1-8中任一项所述的基于图像处理的字符信息识别方法，其特征在于，一个字符的字模图像生成的方法包括：首先拍摄该字符图像，进行图像处理，得到字符的二值化图像；然后将二值化图像镂空生成边界，在边界以内的中间部位绘制设定宽度的线条形成允许重合区；接着在边界以外添加禁止重合区；最后将边界去除，得到字模图像。