CN104463195A

CN104463195A - 基于模板匹配的印刷体数字识别方法

Info

Publication number: CN104463195A
Application number: CN201410624087.XA
Authority: CN
Inventors: 宫义山; 王鹏
Original assignee: Shenyang University of Technology
Current assignee: Shenyang University of Technology
Priority date: 2014-11-08
Filing date: 2014-11-08
Publication date: 2015-03-25
Anticipated expiration: 2034-11-08
Also published as: CN104463195B

Abstract

本发明提供一种基于模板匹配的印刷体数字识别方法，该方法包括待识别图像输入部分、模板匹配识别部分、识别结果输出部分，其很好的挺高了印刷体数字识别的识别率和系统的抗干扰性。通过对模板匹配方法的研究和实现，为数字识别提供了新的解决途径和思路，非常有使用价值和改进的价值。

Description

基于模板匹配的印刷体数字识别方法

技术领域：本发明提供一种基于模板匹配的印刷体数字识别方法，基于模板匹配的印刷体数字识别算法属于字符识别领域。

背景技术：印刷体数字识别一直是模式识别领域的研究热点。随着当今社会信息化的快速发展,我们正被数字化时代围绕着，数字正朝着替代我们对话和文字语言表达、记忆的方向进展。手机号码、驾驶证号码、身份证号码和体检表中一系列表达出身份、能力、对象和健康质量的数字信息表示都需要用计算机解读的阿拉伯数字：1、2、3、4、5、6、7、8、9、0的组合来表达。因此针对这类问题的处理系统设计的关键之一就是设计出高可靠性和高识别率的数字识别方法。然而，没有哪个数字识别方法能够达到完美的识别效果。因此，对印刷体数字的识别研究仍然是有重大意义的。

左右轮廓特征的印刷体数字识别算法，是模板特征匹配的一个典型应用。它的的主要思路是，把单个数字水平分为六部分，可以均匀分为六分，也可以不均匀分，可以根据字符字体的特点进行相应的调整。在特征提取过程中，不再是扫描每一行的连续黑色像素点的个数，作为该行的左(右)轮廓特征。而是对靠近上下边缘和中间的位置采样密度大些。取样的位置选择斐波那契数列进行取样。斐波那契数列为1，1，2，3，5，8，若选择5个数字，则选择1，2，3，5，8位置处进行取样，既在第一部分和第六部分靠近上下边缘处，第三部分和第四部分靠近中间处开始的1/8，2/8，3/8，5/8，8/8的位置取样。利用公式得到所需的左侧边缘的特征，共20个。对于数字的右边缘来说，因为右轮廓的边缘很大程度上和左边缘一致，所以在右边缘抽样时只在第三和第四部分取样，采样方式采用和左边缘一样的不均匀采样，这样会得到10个特征，不过为了提高对“2”和“7”间的对比，对字符的第六部分进行采样，采样方式如前，只是只采样4个特征，为1/8，2/8，3/8，5/8四个位置。这样对图像的左右边缘特征提取后为一个34维的特征向量。最后通过提取算法得到的为34维的特征向量，使用欧几里德距离来比较特征向量之间的相似度。计算待识别数字的特征向量与标准库中各个数字的标准模板特征向量的欧氏距离，选择距离最小的模板字符作为识别结果。由于特征向量维数太大导致识别时间较长。

基于数字结构特征的印刷体数字识别算法，多特征抽取和模板特征匹配的方法来实现印刷体数字的快速识别。通过提取算法得到的为10维的特征向量，使用欧几里德距离来比较特征向量之间的相似度。计算待识别数字的特征向量与标准库中各个数字的标准模板特征向量的欧氏距离，选择距离最小的模板字符作为识别结果。虽然降低的特征向量维数，但该算法的识别率还是没有达到某些高识别率的要求。

发明内容：

发明目的：本发明提供一种基于模板匹配的印刷体数字识别方法，其目的是解决以往的方式所存在的缺点。

技术方案：本发明是通过以下技术方案来实现的：

一种基于模板匹配的印刷体数字识别方法，其特征在于：该方法包括待识别图像输入部分、模板匹配识别部分、识别结果输出部分，具体步骤如下：

待识别图像输入部分，包括以下步骤：

步骤1、通过外部设备照相机采集待识别数字的图像，本步骤中相机像素必须达到300万像素以上，使采集的图像达到最低识别要求，将采集好的图像输入系统；

步骤2、将输入的待识别图像进行前期预处理，首先将图像通过中值滤波法去除噪声，其次将彩色图像进行灰度化处理，再次对灰度化的图像进行二值化处理，然后对二值化的图像进行噪声粘连区域修复再采用自适应阈值分割对数字图像分割，最后将分割好的数字图像归一化处理，将处理好的图像输入模板匹配识别部分；

模板匹配识别部分，该部分的识别基于模板匹配的印刷体数字识别方法，包括以下步骤：

步骤1、将与待识别字体相同的标准数字模板图像导入程序数据库中，模板图像为白色背景，黑色数字，故数字区像素值为0，背景区像素值为1；

步骤2、将待识别图像输入部分生成的二值化图像与模板图像对应像素位叠加，其中待识别的二值化图像为黑色背景，白色数字，数字区像素值为1，背景区像素值为0；

步骤3、对叠加后的图像中各像素点的像素值进行统计，分析统计出的数据，并识别出待识别的印刷体数字；

识别结果输出部分，将识别结果通过计算机显示器显示出来或通过打印机输出结果，也可根据该系统应用的领域将该领域数据融入系统中，得出该数字所关联的全部相关信息。

(一)图像预处理过程：

(1)图像采集：数字图像既可以通过联机的摄像设备采集，也可以通过已经保存的图像进行识别，本文采集的图像是利用相机拍摄的发票电子照片，印刷体数字识别的形态稳定且结构简单，所以识别过程所需要的信息量相对其他识别较少，利用相机拍摄取得的数字图像已经可以取得满足识别的要求；

(2)图像去噪处理：中值滤波器用像素的相邻区域的像素的灰度中值代替该像素的灰度值，是最常见的统计滤波器，自适应中值滤波器则可以对比较大的概率的噪声进行处理，还可以在平滑非冲激噪声的同时保存细节，该步骤中采用3*3模板的自适应中值滤波器；

(3)图像灰度化：相机采集的图片为24位真彩图，需要转化为灰度图，用g标示灰度化后的灰度值，R,G,B表示真彩图中的红、绿、蓝分量，g＝0.299R+0.587G+0.114B；

(4)图像二值化：字符图像二值化一般是将256色的灰度图转化为只有黑白两色的二值图，高步骤中，由于转化后的图像目标为白色，背景为黑色，所以要在图像二值化之前对图像进行反运算，图像二值化是数字识别系统中非常重要的一步，其效果的好坏直接影响到数字的边缘分布，好的二值化算法能够有效区分前景和背景，得到真实的字符边缘，也就可以得到准确的数字特征；

(5)图像分割预处理：针对图像中连通面积低于阈值的，判定为噪声粘连区域，最后，对噪声粘连区域进行反色处理，从而消除分割过程中的噪声粘连区域和去噪环节无法去除的杂点，从而进行正常的数字分割；

(6)图像分割：利用投影法将数字水平分开后，就成功地找到了每个数字的左右边界；然后对切分好的每位数字再进行水平投影：即计算每位数字的每一行中属于数码的象素数目，这样可以找出每个数字的高度值；

(7)图像归一化：数字大小归一化是指对不同大小的数字作几何变换，使之成为同一大小尺寸；数字大小归一化要求保持数字的拓扑结构不能改变，最大限度地降低数字的失真，以便提高识别准确率；令f(x,y)为原图像，g(x′,y′)为归一化后的图像，归一化后的图像与原图像的坐标之间的映射关系为：

x＝ηx′

y＝εy′

其中：

η＝width/width′

ε＝height/height′

width，width′分别表示原图像和归一化后图像的宽度，同时，height和height′分别表示原图像和归一化后图像的高度。归一化后(x′,y′)点的灰度值为：

g(x′,y′)＝f(x,y)

输出点可能会被映射到原图像的浮点数的位置，这就需要使用插值算法来计算该点的像素值；插值算法为双线性插值法；

双线性插值中，设原图像点(x,y)周围四个像素点分别为(i,j)，(i,j+1)，(i+1,j)，(i+1,j+1)，双线性插值通过以下公式来计算：

u＝(1-λ)f(i,j)+λf(i,j+1)

v＝(1-λ)f(i+1,j)+

λf(i+1,j+1)

g(x′,y′)＝(1-μ)u+μv

其中λ＝|x-i|，μ＝|y-j|；

(二)、模板匹配部分：

(1)将与待识别字体相同的模板图像导入程序数据库中，本申请对发票编号进行识别所以先将发票编号字体的数字模板导入数据库中；

(2)将待识别的图像与模板库中图像进行像素点叠加，因为数字6与数字5、8、9有很大的相似度，所以本文用数字6举例来说明本方法；

(3)匹配结果统计

首先由于图像经过二值化处理之后，图像变成了一个只有0,1组成的二维矩阵，待识别数字经二值化之后也成为一个二维矩阵，将图像分为数字区和背景区，待识别数字的数字区是由1组成的，背景区是由0组成的；而模板正是相反，其数字区是由0组成的，背景区是由1组成的；经过待识别数字与模板进行加法运算，生成一个由0,1,2组成的二维矩阵；理论上如果两个图像完全匹配，值为1的位与对应0的位相加则必定生成一个只有1组成的二维矩阵；但如果不匹配则会出现0和2这两种结果；所以只需统计匹配之后图像中像素值为0和2所占整体图像的比例便可识别出结果；

(三)、匹配结果输出模块：

将识别结果通过计算机显示器显示出来或通过打印机输出结果或根据该系统应用的领域将该领域数据融入系统中，得出该数字的全部相关信息。

优点及效果：本发明涉及一种基于模板匹配的印刷体数字识别方法，其很好的挺高了印刷体数字识别的识别率和系统的抗干扰性。

传统模板匹配法是实现离散输入模式分类的有效途径之一，其实质是通过度量输入模式与模板之间的相似性，取相似性最大的作为输入模式所属类别。此方法是由字符的直观形象抽取特征，用相关匹配原理确定的匹配函数进行判断，也就是将输入字符与标准模板字符在一个分类器中进行匹配。但传统模板匹配方法的缺点是抗干扰能力差，导致准确性差。本文提出了一种基于模板匹配的准确、高效的数字识别算法。所提方法虽然在时间上有很好的工作效率，且该算法抗干扰性强识别率很高,图像识别准确率可达99％，获得了满意的效果。总的来说，通过对模板匹配方法的研究和实现，为数字识别提供了新的解决途径和思路，非常有使用价值和改进的价值。

附图说明：

图1为本发明一种实例的系统整体结构框图

图2为本发明一种实例的标准数字模板图

图3为本发明一种实例的待识别数字与标准数字模板匹配的效果图

图4为本发明一种实例的待识别数字6与标准数字模板匹配的结果统计图。

具体实施方式：下面结合附图对本发明做进一步的说明：

本发明提供一种基于模板匹配的印刷体数字识别方法，该方法包括待识别图像输入部分、模板匹配识别部分、识别结果输出部分，具体步骤如下：

待识别图像输入部分，包括以下步骤：

实施例

各模块功能如下：

1.发票图像输入预处理模块：

图像输入预处理部分包括图像采集、图像去噪处理、图像灰度化、图像二值化、图像数字分割预处理、数字分割、数字图像归一化。

图像预处理过程说明：

(1)图像采集：数字图像既可以通过联机的摄像设备采集，也可以通过已经保存的图像进行识别。本文采集的图像是利用相机拍摄的发票电子照片。从原理上说，分辨率越高，则保存的数字信息越多，数字的识别率也就越高，但是相应的计算量也就越大，时间越慢。印刷体数字识别的形态稳定且结构简单，所以识别过程所需要的信息量相对其他识别较少，利用相机拍摄取得的数字图像已经可以取得满足识别的要求。

(2)图像去噪处理：中值滤波器用像素的相邻区域的像素的灰度中值代替该像素的灰度值，是最常见的统计滤波器。自适应中值滤波器则可以对比较大的概率的噪声进行处理，还可以在平滑非冲激噪声的同时保存细节。在本文中，采用3*3模板的自适应中值滤波器。

(3)图像灰度化：相机采集的图片为24位真彩图，需要转化为灰度图。用g标示灰度化后的灰度值，R,G,B表示真彩图中的红、绿、蓝分量，g＝0.299R+0.587G+0.114B。

(4)图像二值化：字符图像二值化一般是将256色的灰度图转化为只有黑白两色的二值图，在本文中，由于转化后的图像目标为白色，背景为黑色，所以要在图像二值化之前对图像进行反运算。图像二值化是数字识别系统中非常重要的一步，其效果的好坏直接影响到数字的边缘分布，好的二值化算法能够有效区分前景和背景，得到真实的字符边缘，也就可以得到准确的数字特征。

(5)图像分割预处理：针对图像中连通面积低于阈值的，判定为噪声粘连区域。最后，对噪声粘连区域进行反色处理，从而消除分割过程中的噪声粘连区域和去噪环节无法去除的杂点，从而进行正常的数字分割。

(6)图像分割：利用投影法将数字水平分开后，就成功地找到了每个数字的左右边界。然后对切分好的每位数字再进行水平投影：即计算每位数字的每一行中属于数码的象素数目，这样可以找出每个数字的高度值。

(7)图像归一化：数字大小归一化是指对不同大小的数字作几何变换，使之成为同一大小尺寸。数字大小归一化要求保持数字的拓扑结构不能改变，最大限度地降低数字的失真，以便提高识别准确率。令f(x,y)为原图像，g(x′,y′)为归一化后的图像，归一化后的图像与原图像的坐标之间的映射关系为：

x＝ηx′

y＝εy′

其中：

η＝width/width′

ε＝height/height′

g(x′,y′)＝f(x,y)

输出点可能会被映射到原图像的浮点数的位置，这就需要使用插值算法来计算该点的像素值。插值算法包括最邻近插值法、双线性插值法、高阶插值法等。

双线性插值的效果好于最邻近插值，但是计算要复杂，运算时间也长些。设原图像点(x,y)周围四个像素点分别为(i,j)，(i,j+1)，(i+1,j)，(i+1,j+1)，双线性插值通过以下公式来计算：

u＝(1-λ)f(i,j)+λf(i,j+1)

v＝(1-λ)f(i+1,j)+

λf(i+1,j+1)

g(x′,y′)＝(1-μ)u+μv

其中λ＝|x-i|，μ＝|y-j|。

2.模板匹配模块：

(1)如图2所示，将与待识别字体相同的模板图像导入程序数据库中，本文针对发票编号进行识别所以先将发票编号字体的数字模板导入数据库中。

(2)如图3所示将待识别的图像与模板库中图像进行像素点叠加，因为数字6与数字5、8、9有很大的相似度，所以本文用数字6举例来说明本方法。

(3)匹配结果统计

首先由于图像经过二值化处理之后，图像变成了一个只有0,1组成的二维矩阵，待识别数字经二值化之后也成为一个二维矩阵，将图像分为数字区和背景区，待识别数字的数字区是由1组成的，背景区是由0组成的。而模板正是相反，其数字区是由0组成的，背景区是由1组成的。经过待识别数字与模板进行加法运算，生成一个由0,1,2组成的二维矩阵。理论上如果两个图像完全匹配，值为1的位与对应0的位相加则必定生成一个只有1组成的二维矩阵。但如果不匹配则会出现0和2这两种结果。所以只需统计匹配之后图像中像素值为0和2所占整体图像的比例便可识别出结果。匹配结果如图4所示。

3.匹配结果输出模块：

将识别结果通过计算机显示器显示出来或通过打印机输出结果，也可根据该系统应用的领域将该领域数据融入系统中，得出该数字的全部相关信息。

实验结果分析

评价一个数字识别系统的指标，主要依据正确识别率和运行时间。本文把数字正确识别率和运行时间，作为评价标准，与基于左右轮廓特征的印刷体数字识别方法和基于数字结构特征的印刷体数字识别算法进行对比。在程序运行设备、运行软件版本、识别对象以及图像预处理和数字分割环节完全一致的情况下，比较三种种识别算法的正确识别率和运行时间，从而对识别算法进行客观公正的评价。

实验选取的图片来自全国统一启用印有12位发票代码和8位发票号码的普通发票图片作为识别对象。由于该系统只进行印刷体数字的识别，所以对发票图片进行了截图处理。通过截图工具，截取了12位发票代码和8位的发票号码的图片，并统一转换成png格式的图片文件。

通过测试12张12位数字的发票代码图片，和12张8位数字的发票号码图片，总计240个数字，对基于左右轮廓特征的印刷体数字识别算法、基于数字结构特征的印刷体数字识别算法和本文提出的基于模板匹配印刷体数字识别算法的实验结果进行了对比。对比结果如表。

Claims

1.一种基于模板匹配的印刷体数字识别方法，其特征在于：该方法包括待识别图像输入部分、模板匹配识别部分、识别结果输出部分，具体步骤如下：

待识别图像输入部分，包括以下步骤：

2.根据权利要求1所述的基于模板匹配的印刷体数字识别方法，其特征在于：

(一)图像预处理过程：

x＝ηx′

y＝εy′

其中：

η＝width/width′

ε＝height/height′

g(x′,y′)＝f(x,y)

u＝(1-λ)f(i,j)+λf(i,j+1)

v＝(1-λ)f(i+1,j)+

λf(i+1,j+1)

g(x′,y′)＝(1-μ)u+μv

其中λ＝|x-i|，μ＝|y-j|；

(二)、模板匹配部分：

(3)匹配结果统计

(三)、匹配结果输出模块：