CN104463195A - 基于模板匹配的印刷体数字识别方法 - Google Patents

基于模板匹配的印刷体数字识别方法 Download PDF

Info

Publication number
CN104463195A
CN104463195A CN201410624087.XA CN201410624087A CN104463195A CN 104463195 A CN104463195 A CN 104463195A CN 201410624087 A CN201410624087 A CN 201410624087A CN 104463195 A CN104463195 A CN 104463195A
Authority
CN
China
Prior art keywords
image
digital
numeral
template
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410624087.XA
Other languages
English (en)
Other versions
CN104463195B (zh
Inventor
宫义山
王鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang University of Technology
Original Assignee
Shenyang University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang University of Technology filed Critical Shenyang University of Technology
Priority to CN201410624087.XA priority Critical patent/CN104463195B/zh
Publication of CN104463195A publication Critical patent/CN104463195A/zh
Application granted granted Critical
Publication of CN104463195B publication Critical patent/CN104463195B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

本发明提供一种基于模板匹配的印刷体数字识别方法,该方法包括待识别图像输入部分、模板匹配识别部分、识别结果输出部分,其很好的挺高了印刷体数字识别的识别率和系统的抗干扰性。通过对模板匹配方法的研究和实现,为数字识别提供了新的解决途径和思路,非常有使用价值和改进的价值。

Description

基于模板匹配的印刷体数字识别方法
技术领域:本发明提供一种基于模板匹配的印刷体数字识别方法,基于模板匹配的印刷体数字识别算法属于字符识别领域。
背景技术:印刷体数字识别一直是模式识别领域的研究热点。随着当今社会信息化的快速发展,我们正被数字化时代围绕着,数字正朝着替代我们对话和文字语言表达、记忆的方向进展。手机号码、驾驶证号码、身份证号码和体检表中一系列表达出身份、能力、对象和健康质量的数字信息表示都需要用计算机解读的阿拉伯数字:1、2、3、4、5、6、7、8、9、0的组合来表达。因此针对这类问题的处理系统设计的关键之一就是设计出高可靠性和高识别率的数字识别方法。然而,没有哪个数字识别方法能够达到完美的识别效果。因此,对印刷体数字的识别研究仍然是有重大意义的。
左右轮廓特征的印刷体数字识别算法,是模板特征匹配的一个典型应用。它的的主要思路是,把单个数字水平分为六部分,可以均匀分为六分,也可以不均匀分,可以根据字符字体的特点进行相应的调整。在特征提取过程中,不再是扫描每一行的连续黑色像素点的个数,作为该行的左(右)轮廓特征。而是对靠近上下边缘和中间的位置采样密度大些。取样的位置选择斐波那契数列进行取样。斐波那契数列为1,1,2,3,5,8,若选择5个数字,则选择1,2,3,5,8位置处进行取样,既在第一部分和第六部分靠近上下边缘处,第三部分和第四部分靠近中间处开始的1/8,2/8,3/8,5/8,8/8的位置取样。利用公式得到所需的左侧边缘的特征,共20个。对于数字的右边缘来说,因为右轮廓的边缘很大程度上和左边缘一致,所以在右边缘抽样时只在第三和第四部分取样,采样方式采用和左边缘一样的不均匀采样,这样会得到10个特征,不过为了提高对“2”和“7”间的对比,对字符的第六部分进行采样,采样方式如前,只是只采样4个特征,为1/8,2/8,3/8,5/8四个位置。这样对图像的左右边缘特征提取后为一个34维的特征向量。最后通过提取算法得到的为34维的特征向量,使用欧几里德距离来比较特征向量之间的相似度。计算待识别数字的特征向量与标准库中各个数字的标准模板特征向量的欧氏距离,选择距离最小的模板字符作为识别结果。由于特征向量维数太大导致识别时间较长。
基于数字结构特征的印刷体数字识别算法,多特征抽取和模板特征匹配的方法来实现印刷体数字的快速识别。通过提取算法得到的为10维的特征向量,使用欧几里德距离来比较特征向量之间的相似度。计算待识别数字的特征向量与标准库中各个数字的标准模板特征向量的欧氏距离,选择距离最小的模板字符作为识别结果。虽然降低的特征向量维数,但该算法的识别率还是没有达到某些高识别率的要求。
发明内容:
发明目的:本发明提供一种基于模板匹配的印刷体数字识别方法,其目的是解决以往的方式所存在的缺点。
技术方案:本发明是通过以下技术方案来实现的:
一种基于模板匹配的印刷体数字识别方法,其特征在于:该方法包括待识别图像输入部分、模板匹配识别部分、识别结果输出部分,具体步骤如下:
待识别图像输入部分,包括以下步骤:
步骤1、通过外部设备照相机采集待识别数字的图像,本步骤中相机像素必须达到300万像素以上,使采集的图像达到最低识别要求,将采集好的图像输入系统;
步骤2、将输入的待识别图像进行前期预处理,首先将图像通过中值滤波法去除噪声,其次将彩色图像进行灰度化处理,再次对灰度化的图像进行二值化处理,然后对二值化的图像进行噪声粘连区域修复再采用自适应阈值分割对数字图像分割,最后将分割好的数字图像归一化处理,将处理好的图像输入模板匹配识别部分;
模板匹配识别部分,该部分的识别基于模板匹配的印刷体数字识别方法,包括以下步骤:
步骤1、将与待识别字体相同的标准数字模板图像导入程序数据库中,模板图像为白色背景,黑色数字,故数字区像素值为0,背景区像素值为1;
步骤2、将待识别图像输入部分生成的二值化图像与模板图像对应像素位叠加,其中待识别的二值化图像为黑色背景,白色数字,数字区像素值为1,背景区像素值为0;
步骤3、对叠加后的图像中各像素点的像素值进行统计,分析统计出的数据,并识别出待识别的印刷体数字;
识别结果输出部分,将识别结果通过计算机显示器显示出来或通过打印机输出结果,也可根据该系统应用的领域将该领域数据融入系统中,得出该数字所关联的全部相关信息。
(一)图像预处理过程:
(1)图像采集:数字图像既可以通过联机的摄像设备采集,也可以通过已经保存的图像进行识别,本文采集的图像是利用相机拍摄的发票电子照片,印刷体数字识别的形态稳定且结构简单,所以识别过程所需要的信息量相对其他识别较少,利用相机拍摄取得的数字图像已经可以取得满足识别的要求;
(2)图像去噪处理:中值滤波器用像素的相邻区域的像素的灰度中值代替该像素的灰度值,是最常见的统计滤波器,自适应中值滤波器则可以对比较大的概率的噪声进行处理,还可以在平滑非冲激噪声的同时保存细节,该步骤中采用3*3模板的自适应中值滤波器;
(3)图像灰度化:相机采集的图片为24位真彩图,需要转化为灰度图,用g标示灰度化后的灰度值,R,G,B表示真彩图中的红、绿、蓝分量,g=0.299R+0.587G+0.114B;
(4)图像二值化:字符图像二值化一般是将256色的灰度图转化为只有黑白两色的二值图,高步骤中,由于转化后的图像目标为白色,背景为黑色,所以要在图像二值化之前对图像进行反运算,图像二值化是数字识别系统中非常重要的一步,其效果的好坏直接影响到数字的边缘分布,好的二值化算法能够有效区分前景和背景,得到真实的字符边缘,也就可以得到准确的数字特征;
(5)图像分割预处理:针对图像中连通面积低于阈值的,判定为噪声粘连区域,最后,对噪声粘连区域进行反色处理,从而消除分割过程中的噪声粘连区域和去噪环节无法去除的杂点,从而进行正常的数字分割;
(6)图像分割:利用投影法将数字水平分开后,就成功地找到了每个数字的左右边界;然后对切分好的每位数字再进行水平投影:即计算每位数字的每一行中属于数码的象素数目,这样可以找出每个数字的高度值;
(7)图像归一化:数字大小归一化是指对不同大小的数字作几何变换,使之成为同一大小尺寸;数字大小归一化要求保持数字的拓扑结构不能改变,最大限度地降低数字的失真,以便提高识别准确率;令f(x,y)为原图像,g(x′,y′)为归一化后的图像,归一化后的图像与原图像的坐标之间的映射关系为:
x=ηx′
y=εy′
其中:
η=width/width′
ε=height/height′
width,width′分别表示原图像和归一化后图像的宽度,同时,height和height′分别表示原图像和归一化后图像的高度。归一化后(x′,y′)点的灰度值为:
g(x′,y′)=f(x,y)
输出点可能会被映射到原图像的浮点数的位置,这就需要使用插值算法来计算该点的像素值;插值算法为双线性插值法;
双线性插值中,设原图像点(x,y)周围四个像素点分别为(i,j),(i,j+1),(i+1,j),(i+1,j+1),双线性插值通过以下公式来计算:
u=(1-λ)f(i,j)+λf(i,j+1)
v=(1-λ)f(i+1,j)+
λf(i+1,j+1)
g(x′,y′)=(1-μ)u+μv
其中λ=|x-i|,μ=|y-j|;
(二)、模板匹配部分:
(1)将与待识别字体相同的模板图像导入程序数据库中,本申请对发票编号进行识别所以先将发票编号字体的数字模板导入数据库中;
(2)将待识别的图像与模板库中图像进行像素点叠加,因为数字6与数字5、8、9有很大的相似度,所以本文用数字6举例来说明本方法;
(3)匹配结果统计
首先由于图像经过二值化处理之后,图像变成了一个只有0,1组成的二维矩阵,待识别数字经二值化之后也成为一个二维矩阵,将图像分为数字区和背景区,待识别数字的数字区是由1组成的,背景区是由0组成的;而模板正是相反,其数字区是由0组成的,背景区是由1组成的;经过待识别数字与模板进行加法运算,生成一个由0,1,2组成的二维矩阵;理论上如果两个图像完全匹配,值为1的位与对应0的位相加则必定生成一个只有1组成的二维矩阵;但如果不匹配则会出现0和2这两种结果;所以只需统计匹配之后图像中像素值为0和2所占整体图像的比例便可识别出结果;
(三)、匹配结果输出模块:
将识别结果通过计算机显示器显示出来或通过打印机输出结果或根据该系统应用的领域将该领域数据融入系统中,得出该数字的全部相关信息。
优点及效果:本发明涉及一种基于模板匹配的印刷体数字识别方法,其很好的挺高了印刷体数字识别的识别率和系统的抗干扰性。
传统模板匹配法是实现离散输入模式分类的有效途径之一,其实质是通过度量输入模式与模板之间的相似性,取相似性最大的作为输入模式所属类别。此方法是由字符的直观形象抽取特征,用相关匹配原理确定的匹配函数进行判断,也就是将输入字符与标准模板字符在一个分类器中进行匹配。但传统模板匹配方法的缺点是抗干扰能力差,导致准确性差。本文提出了一种基于模板匹配的准确、高效的数字识别算法。所提方法虽然在时间上有很好的工作效率,且该算法抗干扰性强识别率很高,图像识别准确率可达99%,获得了满意的效果。总的来说,通过对模板匹配方法的研究和实现,为数字识别提供了新的解决途径和思路,非常有使用价值和改进的价值。
附图说明:
图1为本发明一种实例的系统整体结构框图
图2为本发明一种实例的标准数字模板图
图3为本发明一种实例的待识别数字与标准数字模板匹配的效果图
图4为本发明一种实例的待识别数字6与标准数字模板匹配的结果统计图。
具体实施方式:下面结合附图对本发明做进一步的说明:
本发明提供一种基于模板匹配的印刷体数字识别方法,该方法包括待识别图像输入部分、模板匹配识别部分、识别结果输出部分,具体步骤如下:
待识别图像输入部分,包括以下步骤:
步骤1、通过外部设备照相机采集待识别数字的图像,本步骤中相机像素必须达到300万像素以上,使采集的图像达到最低识别要求,将采集好的图像输入系统;
步骤2、将输入的待识别图像进行前期预处理,首先将图像通过中值滤波法去除噪声,其次将彩色图像进行灰度化处理,再次对灰度化的图像进行二值化处理,然后对二值化的图像进行噪声粘连区域修复再采用自适应阈值分割对数字图像分割,最后将分割好的数字图像归一化处理,将处理好的图像输入模板匹配识别部分;
模板匹配识别部分,该部分的识别基于模板匹配的印刷体数字识别方法,包括以下步骤:
步骤1、将与待识别字体相同的标准数字模板图像导入程序数据库中,模板图像为白色背景,黑色数字,故数字区像素值为0,背景区像素值为1;
步骤2、将待识别图像输入部分生成的二值化图像与模板图像对应像素位叠加,其中待识别的二值化图像为黑色背景,白色数字,数字区像素值为1,背景区像素值为0;
步骤3、对叠加后的图像中各像素点的像素值进行统计,分析统计出的数据,并识别出待识别的印刷体数字;
识别结果输出部分,将识别结果通过计算机显示器显示出来或通过打印机输出结果,也可根据该系统应用的领域将该领域数据融入系统中,得出该数字所关联的全部相关信息。
实施例
各模块功能如下:
1.发票图像输入预处理模块:
图像输入预处理部分包括图像采集、图像去噪处理、图像灰度化、图像二值化、图像数字分割预处理、数字分割、数字图像归一化。
图像预处理过程说明:
(1)图像采集:数字图像既可以通过联机的摄像设备采集,也可以通过已经保存的图像进行识别。本文采集的图像是利用相机拍摄的发票电子照片。从原理上说,分辨率越高,则保存的数字信息越多,数字的识别率也就越高,但是相应的计算量也就越大,时间越慢。印刷体数字识别的形态稳定且结构简单,所以识别过程所需要的信息量相对其他识别较少,利用相机拍摄取得的数字图像已经可以取得满足识别的要求。
(2)图像去噪处理:中值滤波器用像素的相邻区域的像素的灰度中值代替该像素的灰度值,是最常见的统计滤波器。自适应中值滤波器则可以对比较大的概率的噪声进行处理,还可以在平滑非冲激噪声的同时保存细节。在本文中,采用3*3模板的自适应中值滤波器。
(3)图像灰度化:相机采集的图片为24位真彩图,需要转化为灰度图。用g标示灰度化后的灰度值,R,G,B表示真彩图中的红、绿、蓝分量,g=0.299R+0.587G+0.114B。
(4)图像二值化:字符图像二值化一般是将256色的灰度图转化为只有黑白两色的二值图,在本文中,由于转化后的图像目标为白色,背景为黑色,所以要在图像二值化之前对图像进行反运算。图像二值化是数字识别系统中非常重要的一步,其效果的好坏直接影响到数字的边缘分布,好的二值化算法能够有效区分前景和背景,得到真实的字符边缘,也就可以得到准确的数字特征。
(5)图像分割预处理:针对图像中连通面积低于阈值的,判定为噪声粘连区域。最后,对噪声粘连区域进行反色处理,从而消除分割过程中的噪声粘连区域和去噪环节无法去除的杂点,从而进行正常的数字分割。
(6)图像分割:利用投影法将数字水平分开后,就成功地找到了每个数字的左右边界。然后对切分好的每位数字再进行水平投影:即计算每位数字的每一行中属于数码的象素数目,这样可以找出每个数字的高度值。
(7)图像归一化:数字大小归一化是指对不同大小的数字作几何变换,使之成为同一大小尺寸。数字大小归一化要求保持数字的拓扑结构不能改变,最大限度地降低数字的失真,以便提高识别准确率。令f(x,y)为原图像,g(x′,y′)为归一化后的图像,归一化后的图像与原图像的坐标之间的映射关系为:
x=ηx′
y=εy′
其中:
η=width/width′
ε=height/height′
width,width′分别表示原图像和归一化后图像的宽度,同时,height和height′分别表示原图像和归一化后图像的高度。归一化后(x′,y′)点的灰度值为:
g(x′,y′)=f(x,y)
输出点可能会被映射到原图像的浮点数的位置,这就需要使用插值算法来计算该点的像素值。插值算法包括最邻近插值法、双线性插值法、高阶插值法等。
双线性插值的效果好于最邻近插值,但是计算要复杂,运算时间也长些。设原图像点(x,y)周围四个像素点分别为(i,j),(i,j+1),(i+1,j),(i+1,j+1),双线性插值通过以下公式来计算:
u=(1-λ)f(i,j)+λf(i,j+1)
v=(1-λ)f(i+1,j)+
λf(i+1,j+1)
g(x′,y′)=(1-μ)u+μv
其中λ=|x-i|,μ=|y-j|。
2.模板匹配模块:
(1)如图2所示,将与待识别字体相同的模板图像导入程序数据库中,本文针对发票编号进行识别所以先将发票编号字体的数字模板导入数据库中。
(2)如图3所示将待识别的图像与模板库中图像进行像素点叠加,因为数字6与数字5、8、9有很大的相似度,所以本文用数字6举例来说明本方法。
(3)匹配结果统计
首先由于图像经过二值化处理之后,图像变成了一个只有0,1组成的二维矩阵,待识别数字经二值化之后也成为一个二维矩阵,将图像分为数字区和背景区,待识别数字的数字区是由1组成的,背景区是由0组成的。而模板正是相反,其数字区是由0组成的,背景区是由1组成的。经过待识别数字与模板进行加法运算,生成一个由0,1,2组成的二维矩阵。理论上如果两个图像完全匹配,值为1的位与对应0的位相加则必定生成一个只有1组成的二维矩阵。但如果不匹配则会出现0和2这两种结果。所以只需统计匹配之后图像中像素值为0和2所占整体图像的比例便可识别出结果。匹配结果如图4所示。
3.匹配结果输出模块:
将识别结果通过计算机显示器显示出来或通过打印机输出结果,也可根据该系统应用的领域将该领域数据融入系统中,得出该数字的全部相关信息。
实验结果分析
评价一个数字识别系统的指标,主要依据正确识别率和运行时间。本文把数字正确识别率和运行时间,作为评价标准,与基于左右轮廓特征的印刷体数字识别方法和基于数字结构特征的印刷体数字识别算法进行对比。在程序运行设备、运行软件版本、识别对象以及图像预处理和数字分割环节完全一致的情况下,比较三种种识别算法的正确识别率和运行时间,从而对识别算法进行客观公正的评价。
实验选取的图片来自全国统一启用印有12位发票代码和8位发票号码的普通发票图片作为识别对象。由于该系统只进行印刷体数字的识别,所以对发票图片进行了截图处理。通过截图工具,截取了12位发票代码和8位的发票号码的图片,并统一转换成png格式的图片文件。
通过测试12张12位数字的发票代码图片,和12张8位数字的发票号码图片,总计240个数字,对基于左右轮廓特征的印刷体数字识别算法、基于数字结构特征的印刷体数字识别算法和本文提出的基于模板匹配印刷体数字识别算法的实验结果进行了对比。对比结果如表。

Claims (2)

1.一种基于模板匹配的印刷体数字识别方法,其特征在于:该方法包括待识别图像输入部分、模板匹配识别部分、识别结果输出部分,具体步骤如下:
待识别图像输入部分,包括以下步骤:
步骤1、通过外部设备照相机采集待识别数字的图像,本步骤中相机像素必须达到300万像素以上,使采集的图像达到最低识别要求,将采集好的图像输入系统;
步骤2、将输入的待识别图像进行前期预处理,首先将图像通过中值滤波法去除噪声,其次将彩色图像进行灰度化处理,再次对灰度化的图像进行二值化处理,然后对二值化的图像进行噪声粘连区域修复再采用自适应阈值分割对数字图像分割,最后将分割好的数字图像归一化处理,将处理好的图像输入模板匹配识别部分;
模板匹配识别部分,该部分的识别基于模板匹配的印刷体数字识别方法,包括以下步骤:
步骤1、将与待识别字体相同的标准数字模板图像导入程序数据库中,模板图像为白色背景,黑色数字,故数字区像素值为0,背景区像素值为1;
步骤2、将待识别图像输入部分生成的二值化图像与模板图像对应像素位叠加,其中待识别的二值化图像为黑色背景,白色数字,数字区像素值为1,背景区像素值为0;
步骤3、对叠加后的图像中各像素点的像素值进行统计,分析统计出的数据,并识别出待识别的印刷体数字;
识别结果输出部分,将识别结果通过计算机显示器显示出来或通过打印机输出结果,也可根据该系统应用的领域将该领域数据融入系统中,得出该数字所关联的全部相关信息。
2.根据权利要求1所述的基于模板匹配的印刷体数字识别方法,其特征在于:
(一)图像预处理过程:
(1)图像采集:数字图像既可以通过联机的摄像设备采集,也可以通过已经保存的图像进行识别,本文采集的图像是利用相机拍摄的发票电子照片,印刷体数字识别的形态稳定且结构简单,所以识别过程所需要的信息量相对其他识别较少,利用相机拍摄取得的数字图像已经可以取得满足识别的要求;
(2)图像去噪处理:中值滤波器用像素的相邻区域的像素的灰度中值代替该像素的灰度值,是最常见的统计滤波器,自适应中值滤波器则可以对比较大的概率的噪声进行处理,还可以在平滑非冲激噪声的同时保存细节,该步骤中采用3*3模板的自适应中值滤波器;
(3)图像灰度化:相机采集的图片为24位真彩图,需要转化为灰度图,用g标示灰度化后的灰度值,R,G,B表示真彩图中的红、绿、蓝分量,g=0.299R+0.587G+0.114B;
(4)图像二值化:字符图像二值化一般是将256色的灰度图转化为只有黑白两色的二值图,高步骤中,由于转化后的图像目标为白色,背景为黑色,所以要在图像二值化之前对图像进行反运算,图像二值化是数字识别系统中非常重要的一步,其效果的好坏直接影响到数字的边缘分布,好的二值化算法能够有效区分前景和背景,得到真实的字符边缘,也就可以得到准确的数字特征;
(5)图像分割预处理:针对图像中连通面积低于阈值的,判定为噪声粘连区域,最后,对噪声粘连区域进行反色处理,从而消除分割过程中的噪声粘连区域和去噪环节无法去除的杂点,从而进行正常的数字分割;
(6)图像分割:利用投影法将数字水平分开后,就成功地找到了每个数字的左右边界;然后对切分好的每位数字再进行水平投影:即计算每位数字的每一行中属于数码的象素数目,这样可以找出每个数字的高度值;
(7)图像归一化:数字大小归一化是指对不同大小的数字作几何变换,使之成为同一大小尺寸;数字大小归一化要求保持数字的拓扑结构不能改变,最大限度地降低数字的失真,以便提高识别准确率;令f(x,y)为原图像,g(x′,y′)为归一化后的图像,归一化后的图像与原图像的坐标之间的映射关系为:
x=ηx′
y=εy′
其中:
η=width/width′
ε=height/height′
width,width′分别表示原图像和归一化后图像的宽度,同时,height和height′分别表示原图像和归一化后图像的高度。归一化后(x′,y′)点的灰度值为:
g(x′,y′)=f(x,y)
输出点可能会被映射到原图像的浮点数的位置,这就需要使用插值算法来计算该点的像素值;插值算法为双线性插值法;
双线性插值中,设原图像点(x,y)周围四个像素点分别为(i,j),(i,j+1),(i+1,j),(i+1,j+1),双线性插值通过以下公式来计算:
u=(1-λ)f(i,j)+λf(i,j+1)
v=(1-λ)f(i+1,j)+
λf(i+1,j+1)
g(x′,y′)=(1-μ)u+μv
其中λ=|x-i|,μ=|y-j|;
(二)、模板匹配部分:
(1)将与待识别字体相同的模板图像导入程序数据库中,本申请对发票编号进行识别所以先将发票编号字体的数字模板导入数据库中;
(2)将待识别的图像与模板库中图像进行像素点叠加,因为数字6与数字5、8、9有很大的相似度,所以本文用数字6举例来说明本方法;
(3)匹配结果统计
首先由于图像经过二值化处理之后,图像变成了一个只有0,1组成的二维矩阵,待识别数字经二值化之后也成为一个二维矩阵,将图像分为数字区和背景区,待识别数字的数字区是由1组成的,背景区是由0组成的;而模板正是相反,其数字区是由0组成的,背景区是由1组成的;经过待识别数字与模板进行加法运算,生成一个由0,1,2组成的二维矩阵;理论上如果两个图像完全匹配,值为1的位与对应0的位相加则必定生成一个只有1组成的二维矩阵;但如果不匹配则会出现0和2这两种结果;所以只需统计匹配之后图像中像素值为0和2所占整体图像的比例便可识别出结果;
(三)、匹配结果输出模块:
将识别结果通过计算机显示器显示出来或通过打印机输出结果或根据该系统应用的领域将该领域数据融入系统中,得出该数字的全部相关信息。
CN201410624087.XA 2014-11-08 2014-11-08 基于模板匹配的印刷体数字识别方法 Expired - Fee Related CN104463195B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410624087.XA CN104463195B (zh) 2014-11-08 2014-11-08 基于模板匹配的印刷体数字识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410624087.XA CN104463195B (zh) 2014-11-08 2014-11-08 基于模板匹配的印刷体数字识别方法

Publications (2)

Publication Number Publication Date
CN104463195A true CN104463195A (zh) 2015-03-25
CN104463195B CN104463195B (zh) 2018-08-07

Family

ID=52909209

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410624087.XA Expired - Fee Related CN104463195B (zh) 2014-11-08 2014-11-08 基于模板匹配的印刷体数字识别方法

Country Status (1)

Country Link
CN (1) CN104463195B (zh)

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104700092A (zh) * 2015-03-26 2015-06-10 南京理工大学 一种基于模板和特征匹配相结合的小字符数字识别方法
CN105654087A (zh) * 2015-12-30 2016-06-08 李宇 一种基于彩色模板的脱机手写字符提取方法
CN105701489A (zh) * 2016-01-14 2016-06-22 云南大学 一种新型的数字提取和识别的方法及系统
CN106250902A (zh) * 2016-07-29 2016-12-21 武汉大学 基于图像特征模板匹配的电力系统开关状态检测方法
CN106250901A (zh) * 2016-03-14 2016-12-21 上海创和亿电子科技发展有限公司 一种基于图像特征信息的数字识别方法
CN106570501A (zh) * 2016-10-26 2017-04-19 成都君晟科技有限公司 一种仪表面板字符自动识别方法
CN106682667A (zh) * 2016-12-29 2017-05-17 成都数联铭品科技有限公司 非常见字体的图像文字ocr识别系统
CN107358232A (zh) * 2017-06-28 2017-11-17 中山大学新华学院 基于插件的发票识别方法、及识别与管理系统
CN107766862A (zh) * 2017-10-19 2018-03-06 成都博智维讯信息技术股份有限公司 商品价格标签数字识别方法
CN108345882A (zh) * 2018-02-11 2018-07-31 北京百度网讯科技有限公司 用于图像识别的方法、装置、设备和计算机可读存储介质
CN108416355A (zh) * 2018-03-09 2018-08-17 浙江大学 一种基于机器视觉的工业现场生产数据的采集方法
CN108734168A (zh) * 2018-05-18 2018-11-02 天津科技大学 一种手写数字的识别方法
CN109035266A (zh) * 2017-06-08 2018-12-18 吴海霞 一种利用普通摄像完成身份证便携扫描的算法
CN109145879A (zh) * 2018-09-30 2019-01-04 金蝶软件(中国)有限公司 一种打印字体识别的方法、设备及存储介质
CN109271986A (zh) * 2018-07-02 2019-01-25 国家海洋局东海标准计量中心(国家海洋计量站上海分站) 一种基于Second-Confirm的数字识别方法
CN109344836A (zh) * 2018-09-30 2019-02-15 金蝶软件(中国)有限公司 一种文字识别方法和设备
CN109389000A (zh) * 2018-10-18 2019-02-26 龙马智芯(珠海横琴)科技有限公司 一种条形码识别方法及应用该方法的计算机
CN109389152A (zh) * 2018-08-30 2019-02-26 广东工业大学 一种输电线路垂坠物的精细化识别方法
CN109446997A (zh) * 2018-10-31 2019-03-08 国网山东省电力公司淄博供电公司 文档编号自动识别方法
CN109460701A (zh) * 2018-09-10 2019-03-12 昆明理工大学 一种基于纵横直方图的字体识别方法
CN109543056A (zh) * 2018-11-08 2019-03-29 博众精工科技股份有限公司 一种具有旋转、缩放不变性的灰度模板匹配算法
CN109948653A (zh) * 2019-02-15 2019-06-28 广东智媒云图科技股份有限公司 一种图像相似度判断方法、电子设备及存储介质
CN109961553A (zh) * 2017-12-26 2019-07-02 航天信息股份有限公司 发票号码识别方法、装置及税务自助终端系统
CN110533026A (zh) * 2019-07-18 2019-12-03 西安电子科技大学 基于计算机视觉的电竞图像数字与图标信息获取方法
CN110855889A (zh) * 2019-11-21 2020-02-28 重庆金山医疗技术研究院有限公司 图像处理方法、装置、图像处理设备及存储介质
CN112164032A (zh) * 2020-09-14 2021-01-01 浙江华睿科技有限公司 一种点胶方法、装置、电子设备及存储介质
CN112308062A (zh) * 2020-11-23 2021-02-02 浙江卡易智慧医疗科技有限公司 一种复杂背景图像中的医疗影像访问号识别方法
CN112883970A (zh) * 2021-03-02 2021-06-01 湖南金烽信息科技有限公司 一种基于神经网络模型的数字识别方法
CN113657404A (zh) * 2021-10-19 2021-11-16 中央民族大学 一种东巴象形文字的图像处理方法
CN114131629A (zh) * 2021-12-10 2022-03-04 北京东方计量测试研究所 地面检测机器人
CN114821134A (zh) * 2022-06-30 2022-07-29 山东蓝彩天下教育科技有限公司 一种基于模板匹配的出版物印刷体数字识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101000653A (zh) * 2006-12-31 2007-07-18 沈阳工业大学 纸币号码自动识别方法及自动识别记录系统
US20110268317A1 (en) * 2000-11-06 2011-11-03 Evryx Technologies, Inc. Data Capture and Identification System and Process
CN103116751A (zh) * 2013-01-24 2013-05-22 河海大学 一种车牌字符自动识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110268317A1 (en) * 2000-11-06 2011-11-03 Evryx Technologies, Inc. Data Capture and Identification System and Process
CN101000653A (zh) * 2006-12-31 2007-07-18 沈阳工业大学 纸币号码自动识别方法及自动识别记录系统
CN103116751A (zh) * 2013-01-24 2013-05-22 河海大学 一种车牌字符自动识别方法

Cited By (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104700092B (zh) * 2015-03-26 2018-01-23 南京理工大学 一种基于模板和特征匹配相结合的小字符数字识别方法
CN104700092A (zh) * 2015-03-26 2015-06-10 南京理工大学 一种基于模板和特征匹配相结合的小字符数字识别方法
CN105654087A (zh) * 2015-12-30 2016-06-08 李宇 一种基于彩色模板的脱机手写字符提取方法
CN105654087B (zh) * 2015-12-30 2019-03-12 李宇 一种基于彩色模板的脱机手写字符提取方法
CN105701489A (zh) * 2016-01-14 2016-06-22 云南大学 一种新型的数字提取和识别的方法及系统
CN105701489B (zh) * 2016-01-14 2020-03-17 云南大学 一种新型的数字提取和识别的方法及系统
CN106250901A (zh) * 2016-03-14 2016-12-21 上海创和亿电子科技发展有限公司 一种基于图像特征信息的数字识别方法
CN106250902A (zh) * 2016-07-29 2016-12-21 武汉大学 基于图像特征模板匹配的电力系统开关状态检测方法
CN106570501A (zh) * 2016-10-26 2017-04-19 成都君晟科技有限公司 一种仪表面板字符自动识别方法
CN106682667A (zh) * 2016-12-29 2017-05-17 成都数联铭品科技有限公司 非常见字体的图像文字ocr识别系统
CN109035266A (zh) * 2017-06-08 2018-12-18 吴海霞 一种利用普通摄像完成身份证便携扫描的算法
CN107358232A (zh) * 2017-06-28 2017-11-17 中山大学新华学院 基于插件的发票识别方法、及识别与管理系统
CN107766862A (zh) * 2017-10-19 2018-03-06 成都博智维讯信息技术股份有限公司 商品价格标签数字识别方法
CN109961553A (zh) * 2017-12-26 2019-07-02 航天信息股份有限公司 发票号码识别方法、装置及税务自助终端系统
CN108345882A (zh) * 2018-02-11 2018-07-31 北京百度网讯科技有限公司 用于图像识别的方法、装置、设备和计算机可读存储介质
CN108345882B (zh) * 2018-02-11 2021-04-27 北京百度网讯科技有限公司 用于图像识别的方法、装置、设备和计算机可读存储介质
CN108416355A (zh) * 2018-03-09 2018-08-17 浙江大学 一种基于机器视觉的工业现场生产数据的采集方法
CN108734168A (zh) * 2018-05-18 2018-11-02 天津科技大学 一种手写数字的识别方法
CN109271986B (zh) * 2018-07-02 2021-11-26 国家海洋局东海标准计量中心(国家海洋计量站上海分站) 一种基于Second-Confirm的数字识别方法
CN109271986A (zh) * 2018-07-02 2019-01-25 国家海洋局东海标准计量中心(国家海洋计量站上海分站) 一种基于Second-Confirm的数字识别方法
CN109389152A (zh) * 2018-08-30 2019-02-26 广东工业大学 一种输电线路垂坠物的精细化识别方法
CN109460701A (zh) * 2018-09-10 2019-03-12 昆明理工大学 一种基于纵横直方图的字体识别方法
CN109460701B (zh) * 2018-09-10 2020-09-25 昆明理工大学 一种基于纵横直方图的字体识别方法
CN109145879B (zh) * 2018-09-30 2021-01-12 金蝶软件(中国)有限公司 一种打印字体识别的方法、设备及存储介质
CN109344836A (zh) * 2018-09-30 2019-02-15 金蝶软件(中国)有限公司 一种文字识别方法和设备
CN109344836B (zh) * 2018-09-30 2021-05-14 金蝶软件(中国)有限公司 一种文字识别方法和设备
CN109145879A (zh) * 2018-09-30 2019-01-04 金蝶软件(中国)有限公司 一种打印字体识别的方法、设备及存储介质
CN109389000A (zh) * 2018-10-18 2019-02-26 龙马智芯(珠海横琴)科技有限公司 一种条形码识别方法及应用该方法的计算机
CN109446997A (zh) * 2018-10-31 2019-03-08 国网山东省电力公司淄博供电公司 文档编号自动识别方法
CN109543056A (zh) * 2018-11-08 2019-03-29 博众精工科技股份有限公司 一种具有旋转、缩放不变性的灰度模板匹配算法
CN109948653A (zh) * 2019-02-15 2019-06-28 广东智媒云图科技股份有限公司 一种图像相似度判断方法、电子设备及存储介质
CN109948653B (zh) * 2019-02-15 2023-08-25 广东智媒云图科技股份有限公司 一种图像相似度判断方法、电子设备及存储介质
CN110533026A (zh) * 2019-07-18 2019-12-03 西安电子科技大学 基于计算机视觉的电竞图像数字与图标信息获取方法
CN110855889A (zh) * 2019-11-21 2020-02-28 重庆金山医疗技术研究院有限公司 图像处理方法、装置、图像处理设备及存储介质
CN110855889B (zh) * 2019-11-21 2021-04-13 重庆金山医疗技术研究院有限公司 图像处理方法、装置、图像处理设备及存储介质
CN112164032A (zh) * 2020-09-14 2021-01-01 浙江华睿科技有限公司 一种点胶方法、装置、电子设备及存储介质
CN112164032B (zh) * 2020-09-14 2023-12-29 浙江华睿科技股份有限公司 一种点胶方法、装置、电子设备及存储介质
CN112308062A (zh) * 2020-11-23 2021-02-02 浙江卡易智慧医疗科技有限公司 一种复杂背景图像中的医疗影像访问号识别方法
CN112308062B (zh) * 2020-11-23 2022-08-23 浙江卡易智慧医疗科技有限公司 一种复杂背景图像中的医疗影像访问号识别方法
CN112883970A (zh) * 2021-03-02 2021-06-01 湖南金烽信息科技有限公司 一种基于神经网络模型的数字识别方法
CN113657404B (zh) * 2021-10-19 2022-02-22 中央民族大学 一种东巴象形文字的图像处理方法
CN113657404A (zh) * 2021-10-19 2021-11-16 中央民族大学 一种东巴象形文字的图像处理方法
CN114131629A (zh) * 2021-12-10 2022-03-04 北京东方计量测试研究所 地面检测机器人
CN114131629B (zh) * 2021-12-10 2024-02-06 北京东方计量测试研究所 地面检测机器人
CN114821134A (zh) * 2022-06-30 2022-07-29 山东蓝彩天下教育科技有限公司 一种基于模板匹配的出版物印刷体数字识别方法
CN114821134B (zh) * 2022-06-30 2022-09-02 山东蓝彩天下教育科技有限公司 一种基于模板匹配的出版物印刷体数字识别方法

Also Published As

Publication number Publication date
CN104463195B (zh) 2018-08-07

Similar Documents

Publication Publication Date Title
CN104463195A (zh) 基于模板匹配的印刷体数字识别方法
Shen et al. Improving OCR performance with background image elimination
CN104408449B (zh) 智能移动终端场景文字处理方法
CN103824091B (zh) 一种用于智能交通系统的车牌识别方法
CN105678612A (zh) 移动端原始凭证电子化智能填单系统及方法
CN104361336A (zh) 一种水下视频图像的文字识别方法
CN112991536A (zh) 一种专题地图地理面要素自动提取和矢量化方法
Durga Devi et al. Digital acquisition and character extraction from stone inscription images using modified fuzzy entropy-based adaptive thresholding
CN108877030B (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN112508000B (zh) 一种用于ocr图像识别模型训练数据生成的方法及设备
CN107729863B (zh) 人体指静脉识别方法
Paul Image pre-processing on NumtaDB for Bengali handwritten digit recognition
CN113221696A (zh) 一种图像识别方法、系统、设备及存储介质
Dhandra et al. Kannada handwritten vowels recognition based on normalized chain code and wavelet filters
CN110807747A (zh) 一种基于前景蒙版的文档图像降噪方法
Dey et al. Colored rubber stamp removal from document images
Saranya et al. An approach towards ear feature extraction for human identification
Liu et al. A prototype system of courtesy amount recognition for Chinese Bank checks
Machhale et al. Implementation of number recognition using adaptive template matching and feature extraction method
CN110276260B (zh) 一种基于深度摄像头的商品检测方法
Subramani et al. A novel binarization method for degraded tamil palm leaf images
CN112861843A (zh) 基于特征图像识别的选择框解析方法及装置
Jayanthi et al. Novel method for manuscript and inscription text extraction
CN113450355A (zh) 一种基于多膜态ct图像和3dcnn网络提取图像特征的方法
CN106096144A (zh) 一种基于前脸造型的汽车品牌基因分析方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180807

Termination date: 20191108