CN108830275A - 点阵字符、点阵数字的识别方法及装置 - Google Patents
点阵字符、点阵数字的识别方法及装置 Download PDFInfo
- Publication number
- CN108830275A CN108830275A CN201810426134.8A CN201810426134A CN108830275A CN 108830275 A CN108830275 A CN 108830275A CN 201810426134 A CN201810426134 A CN 201810426134A CN 108830275 A CN108830275 A CN 108830275A
- Authority
- CN
- China
- Prior art keywords
- image
- character
- picture
- row
- column
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
本发明涉及点阵字符、点阵数字的识别方法及装置,属于计算机视觉技术领域。所述点阵字符的识别方法包括:提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像;根据所述行图像和列图像得到目标图像中各个字符对应的字符图像;将各个所述字符图像与预设的字符模板图像进行比对,根据比对结果识别所述目标图像中的各个字符。上述技术方案,解决了不能准确识别点阵字符的问题,实现了对点阵字符的准确识别,从而完善了字符自动识别系统的短板,能实现自动化处理并释放人力。
Description
技术领域
本发明计算机视觉技术领域,特别是涉及点阵字符以及点阵数字的识别方法、装置、计算机设备和存储介质。
背景技术
随着经济的迅猛发展,商品交易日益频繁,发票等纸质材料使用日益频繁,人们需要根据这些材料中的信息进行相应的业务处理。如果对这些凭证的处理如果全部交由人力完成,不仅是对于人力的巨大损耗,也让处理者甚感繁琐。电子信息的使用虽日益频繁,但纸质材料的地位依然不可撼动。因此,若能开发出字符自动识别系统,则可大大释放人力,可将人力投入到更有价值的领域。近年,计算机视觉技术突飞猛进,字符识别所使用的最具代表性的技术,是光学字符识别技术(OCR,optical character recognition)。在实现本发明过程中,发明人发现现有技术中至少存在如下问题:OCR技术在识别印刷规范、字体清晰、没有干扰、倾斜或者变形的字符时,识别效果显著。但是OCR技术对字符的精度、清晰度等要求较高,无法较好地识别有间断的点阵字符。而这种点阵字符却很常见,并且其携带的信息在某些场景(如发票识别系统)中是必要的。因此,需要找到新的方法来对点阵字符进行识别,从而完善字符自动识别系统的短板,真正实现自动化处理、释放人力的目的。
发明内容
基于此,本发明提供了点阵字符以及点阵数字的识别方法、装置、计算机设备和存储介质,能自动实现对点阵字符的准确识别。
本发明实施例的内容如下:
一种点阵字符的识别方法,包括以下步骤:提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像;根据所述行图像和列图像得到目标图像中各个字符对应的字符图像;将各个所述字符图像与预设的字符模板图像进行比对,根据比对结果识别所述目标图像中的各个字符。
在其中一个实施例中,所述提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像的步骤,包括:提取目标图像中有连续颜色像素点的行,得到行图像;提取所述行图像中有连续颜色像素点的列,得到列图像。
在其中一个实施例中,所述提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像的步骤,包括:获取目标图像中某一行所有像素点对应的颜色参数,判断各个颜色参数是否满足预设的颜色条件;若所述行中存在颜色参数满足预设的颜色条件的连续像素点,从所述目标图像中提取所述行;将提取出的多个行组合为行图像;获取所述行图像中某一列所有像素点对应的颜色参数,判断各个颜色参数是否满足预设的颜色条件;若所述列中存在颜色参数满足预设的颜色条件的连续像素点,从所述行图像中提取所述列;将提取出的多个列组合为列图像。
在其中一个实施例中,所述将各个所述字符图像与预设的字符模板图像进行比对,根据比对结果识别所述目标图像中的各个字符的步骤,包括:对字符图像进行去噪处理,去除字符图像中的不连续颜色像素点;对去噪后的字符图像以及预设的字符模板图像进行分辨率统一处理;确定统一分辨率后的各字符图像与预设的字符模板图像的第一相似度;若所述第一相似度满足预设的相似度条件,将对应字符图像的字符含义确定为所述预设的字符模板图像对应的字符含义。
相应的,本发明实施例提供一种点阵字符的识别装置,包括:图像提取模块,用于提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像;字符图像获取模块,用于根据所述行图像和列图像得到目标图像中各个字符对应的字符图像;以及,字符识别模块,用于将所述各个字符图像与预设的字符模板图像进行比对,根据比对结果识别所述目标图像中的各个字符。
上述点阵字符的识别方法及装置,根据目标图像中的各个像素点的颜色状态,从中提取各个字符对应的字符图像,将提取的字符图像与预设的字符模板图像进行比对,进而识别各个字符图像。通过模板匹配的方式,能够精确地从图片中提取到相对比较完整的字符图像,进而实现字符的准确识别。
一种点阵数字的识别方法,包括以下步骤:提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像;根据所述行图像和列图像得到目标图像中各个字符对应的字符图像;从各个字符图像中确定与标识图像相匹配的第一字符图像;获取所述第一字符图像附近特定范围内的第二字符图像,所述第二字符图像为数字图像;将所述数字图像与预设的数字模板图像进行比对,根据比对结果识别目标图像特定范围内的数字。
在其中一个实施例中,所述将所述数字图像与预设的数字模板图像进行比对,根据比对结果识别目标图像特定范围内的数字的步骤,包括:对数字图像与预设的数字模板图像进行分辨率统一处理;确定统一分辨率后的各数字图像与预设的数字模板图像的第二相似度;若所述第二相似度满足预设的相似度条件,将对应数字图像的含义确定为所述预设的数字模板图像对应的数字含义。
在其中一个实施例中,所述若所述第二相似度满足预设的相似度条件,将对应数字图像的含义确定为所述预设的数字模板图像对应的数字含义的步骤,包括:若数字图像与一个以上的数字模板图像的第二相似度满足预设的相似度条件;将数字图像和满足条件的数字模板图像分别拆分为多个比对区域;分别确定所述数字图像的比对区域与各个数字模板图像对应比对区域的第三相似度;若所述第三相似度满足预设的相似度条件,将对应数字图像的含义确定为所述预设的数字模板图像对应的数字含义。
在其中一个实施例中,所述从各个字符图像中确定与标识图像相匹配的匹配字符图像的步骤之前,还包括:对字符图像进行去噪处理,去除字符图像中的不连续颜色像素点。
相应的,本发明实施例提供一种点阵数字的识别装置,包括:字符图像提取模块,用于提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像;根据所述行图像和列图像得到目标图像中各个字符对应的字符图像;图像匹配模块,用于从各个字符图像中确定与标识图像相匹配的第一字符图像;数字图像获取模块,用于获取所述第一字符图像附近特定范围内的第二字符图像,所述第二字符图像为数字图像;以及,数字识别模块,用于将所述数字图像与预设的数字模板图像进行比对,根据比对结果识别目标图像特定范围内的数字。
上述点阵数字的识别方法及装置,从目标图像中提取字符图像,并从字符图像中确定具有特定功能的匹配字符图像,进而根据预设的范围情况确定数字图像,将数字图像与数字模板图像进行比对,进而确定数字图像的含义。能在确定匹配字符图像后准确地锁定数字图像,实现点阵数字的准确识别。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像;根据所述行图像和列图像得到目标图像中各个字符对应的字符图像;将各个所述字符图像与预设的字符模板图像进行比对,根据比对结果识别所述目标图像中的各个字符。
上述计算机设备,根据以像素点为单位的行或列,从目标图像中提取字符图像,能够精确地从图片中提取到相对比较完整的字符图像,通过模板匹配的方式,可以准确地实现字符的识别。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像;根据所述行图像和列图像得到目标图像中各个字符对应的字符图像;将各个所述字符图像与预设的字符模板图像进行比对,根据比对结果识别所述目标图像中的各个字符。
上述计算机可读存储介质,根据以像素点为单位的行或列,从目标图像中提取字符图像,能够精确地从图片中提取到相对比较完整的字符图像,通过模板匹配的方式,可以准确地实现字符的识别。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像;根据所述行图像和列图像得到目标图像中各个字符对应的字符图像;从各个字符图像中确定与标识图像相匹配的第一字符图像;获取所述第一字符图像附近特定范围内的第二字符图像,所述第二字符图像为数字图像;将所述数字图像与预设的数字模板图像进行比对,根据比对结果识别目标图像特定范围内的数字。
上述计算机设备,能在确定匹配字符图像后准确地锁定数字图像,实现点阵数字的准确识别。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像;根据所述行图像和列图像得到目标图像中各个字符对应的字符图像;从各个字符图像中确定与标识图像相匹配的第一字符图像;获取所述第一字符图像附近特定范围内的第二字符图像,所述第二字符图像为数字图像;将所述数字图像与预设的数字模板图像进行比对,根据比对结果识别目标图像特定范围内的数字。
上述计算机可读存储介质,能在确定匹配字符图像后准确地锁定数字图像,实现点阵数字的准确识别。
附图说明
图1为一个实施例中连续字符的示意图;
图2为一个实施例中非连续字符的示意图;
图3为一个实施例中点阵字符的识别方法和点阵数字的识别方法的应用环境图;
图4为一个实施例中点阵字符的识别方法的流程示意图;
图5为一个实施例中行图像的示意图;
图6为一个实施例中字符图像的示意图;
图7为另一个实施例中点阵字符的识别方法的流程示意图;
图8为一个实施例中对发票图像进行颜色处理的图像;
图9为另一个实施例中对发票图像进行颜色处理的图像;
图10为一个实施例中点阵数字的识别方法的流程示意图;
图11为一个实施例中数字模板图像的示意图;
图12为一个实施例中对数字图像和数字模板图像进行分辨率统一处理前后的示意图;
图13为一个实施例中对字符图像去噪的示意流程图;
图14为另一个实施例中点阵数字的识别方法的流程示意图;
图15为一个实施例中点阵字符的识别装置的结构框图;
图16为一个实施例中点阵字符的识别装置的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。本发明实施例以发票为例进行描述,应当理解,本发明实施例的字符识别方法以及数字识别方法与可以应用于其他点阵字符/数字的识别场景中。
OCR技术是一种利用电子设备扫描纸面上的字符,通过检测字符的色彩暗亮模式确定字符形状,并用字符识别方法将形状翻译成文字的模式识别技术。OCR技术是票据识别系统中最常用,也是目前最稳定、准确率最高的技术。此技术的研究始于上世纪60年代,本世纪90年代开始应用于银行票据的识别研究中。
发票是在经营活动中收款方提供给付款方的书面证明,是财务收支行为的法定凭证,也是会计核算的原始依据。发票作为商品交易的法定记账凭证,其管理工作一直以来都由传统的人力完成。而随着经济的迅猛发展,商品交易日益频繁,发票的处理如果全部交由人力完成,不仅是对于人力的巨大损耗,也让处理者甚感繁琐。电子发票的使用虽日益频繁,但纸质发票的地位依然不可撼动。因此,若能开发出发票自动处理系统,实现对纸质发票的自动识别,则可大大释放人力,可将人力投入到更有价值的领域。发票处理中最为关键的是发票代码、发票号码以及发票金额。
现有的发票识别技术中,大多通过切割信息区对关键信息进行定位,然后进行预处理,在经过倾斜矫正、滤波去噪等处理后,使用OCR技术进行识别,所识别的内容,大多是有固定规范、位置容易找到的发票号码和发票代码。OCR技术在识别图1这种印刷规范、字体清晰、没有干扰、倾斜或者变形的字符时,识别效果显著,对常见的黑体或者宋体等常见字体有着较好的识别效果,而发票中的发票代码和发票号码,一般也是这种字体。但图2这种点阵打印的文字,在发票中很常见,并且其携带的信息是发票识别系统中是必须要的,这些点阵文字精度往往不高,且字符不连贯,因此,OCR技术对这种点阵字符的识别效果较差。因此,需要找到新的方法来对点阵字符进行识别,从而完善发票处理系统的短板,真正实现自动化发票处理、释放人力的目的。
本申请提供的点阵字符的识别方法和点阵数字的识别方法,可以应用于如图3所示的计算机设备中。该计算机设备可以是服务器,其内部结构图可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库可以用于存储字符图像、字符模板图像、数字图像、数字模板图像等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种异常登录的识别方法或监督学习模型的建立方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,如图4所示,提供了一种点阵字符的识别方法,包括以下步骤:
S401、提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像。
本步骤根据某一行或某一列的像素点颜色情况,从目标图像中分别提取行图像和列图像。
其中,目标图像为包含有点阵字符的图像,可以是通过拍摄或扫描的方式获得的发票、支票、小票、快递单等的图像,也可以是电子发票等电子图像。还可以指对上述图像进行预处理(倾斜矫正、灰度化、提取RGB中某一通道对应的图像等处理)后得到的图像。
颜色像素点可以指RGB值、灰度值等颜色参数比图像背景颜色参数更高或更低的像素点。本实施例对两者的颜色参数的相差程度不做限制,能将两者相区分即可。颜色像素点还可以为RGB值、灰度值等满足预设的颜色条件的像素点。本实施例对预设的颜色条件不做限制。
其中,行指的是以一个或一个以上像素点为高的行,判断某一行中是否有连续颜色像素点;即判断该行中是否存在有颜色的像素点,且这些像素点中的全部或部分是相连续的。列指的是以一个或一个以上各像素点为宽的列,判断某一列中是否有连续颜色像素点,即判断该列中是否存在有颜色的像素点,且这些像素点中的全部或部分是相连续的。若找到有连续颜色像素点的行或列,则将其提取出来,组合为行图像或列图像。
S402、根据所述行图像和列图像得到目标图像中各个字符对应的字符图像。
可选地,字符可以为各种文字、符号、数字等。本实施例对目标对象中的字符的形式不做限制。
通过连续颜色像素点的方法提取的行图像和列图像中可能还存在不包括字符图像的区域,这些区域可能会对字符识别造成影响。因此,本步骤根据行图像和列图像的整合得到字符图像,得到的字符图像中除了字符对应的图像中不含(或含有较少)字符以外的区域,能减少无关因素的影响,提高字符识别的准确率。
S403、将各个所述字符图像与预设的字符模板图像进行比对,根据比对结果识别所述目标图像中的各个字符。
可选地,字符模板图像为根据某些规则得到的标准字符对应的图像,将字符图像与这些模板进行比对,则可以较为直观地确定字符图像的含义。本发明实施例对字符模板图像对应的字体、大小、分辨率等不做限制。
本步骤在锁定字符图像后,将字符图像与模板图像进行比对,如果找到相匹配的模板图像,则可以将模板图像对应的含义确定为字符图像的含义,实现对字符的识别。
本实施例,根据以像素点为单位的行或列,得到行图像和列图像,进而从目标图像中提取字符图像,能够精确地从目标图像中提取到相对比较完整的字符图像,并且通过模板匹配实现有目标的字符识别,准确地实现字符的识别,突破前人的无目标限制。
在一个实施例中,所述提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像的步骤,包括:提取目标图像中有连续颜色像素点的行,得到行图像;提取所述行图像中有连续颜色像素点的列,得到列图像。
本实施例从目标图像中提取行图像以及列图像,行图像和列图像的每一行以像素点为单位,而点阵字符多是以一个或多个像素点为点进行打印的,通过这样的方式能够准确地定位字符图像各个像素所在的行和列,进而可以准确地识别出字符图像。
在一个实施例中,所述提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像的步骤,包括:获取目标图像中某一行所有像素点对应的颜色参数,判断各个颜色参数是否满足预设的颜色条件;若所述行中存在颜色参数满足预设的颜色条件的连续像素点,从所述目标图像中提取所述行;将提取出的多个行组合为行图像;获取所述行图像中某一列所有像素点对应的颜色参数,判断各个颜色参数是否满足预设的颜色条件;若所述列中存在颜色参数满足预设的颜色条件的连续像素点,从所述行图像中提取所述列;将提取出的多个列组合为列图像。
可选地,在行图像的基础上得到的列图像即为字符图像。
可选地,本实施例判断颜色参数是否满足预设的颜色条件的具体实现过程可以为:计算目标图像每一行(以一个像素点为高)所有像素点的灰度值最小值,如果该行的灰度值最小值>200,则认为该行为白色;如果该灰度值最小值<200,则认为该行中存在颜色像素点,找出这些颜色像素点,判断这些颜色像素点中是否存在连续的像素点,若是,取出该行。将取出的各个行按目标图像的位置关系组成图像,得到行图像,行图像如图5所示。计算行图像每一列(以一个像素点为高)所有像素点的灰度值最小值,如果该列的灰度值最小值>200,则认为该列为白色;如果该灰度值最小值<200,则认为该列中存在颜色像素点,,找出这些颜色像素点,判断这些颜色像素点中是否存在连续的像素点,若是,取出该列。将取出的各个列按目标图像的位置关系组成图像,得到字符图像,字符图像如图6所示。如图6所示,图6包括“员”“额”“费”“收”和“金”对应的字符图像,这些字符图像中仅包括各个字符,包含有极少不相关的像素。
本实施例,根据像素点的颜色参数从目标图像中提取行图像,再根据同样的方法从行图像中提取字符图像,通过类似于投影的方法来实现图像分割,不仅实现了字符行的分割,也能够单独对字符进行提取。
在一个实施例中,所述将各个所述字符图像与预设的字符模板图像进行比对,根据比对结果识别所述目标图像中的各个字符的步骤,包括:对字符图像进行去噪处理,去除字符图像中的不连续颜色像素点;对去噪后的字符图像以及预设的字符模板图像进行分辨率统一处理;确定统一分辨率后的各字符图像与预设的字符模板图像的第一相似度;若所述第一相似度满足预设的相似度条件,将对应字符图像的字符含义确定为所述预设的字符模板图像对应的字符含义。
可选地,去噪处理可以是中值滤波、均值滤波等去噪方法。
具体地,中值滤波是由科学家Turky提出的一种去除噪声的有效方法,属于空间域处理的非线性处理方法(相对于线性处理方法)。中值滤波算法作为一种被广泛应用的算法,可以十分有效地对图像进行平滑处理。通过试验可以看出邻域图像的中间值决定其输出像素的灰度值。由于中值滤波算法的自身特性,中值滤波对极限像素值相比于平均值较为不敏感,有利于消除图像中孤立的噪声点,使采集的数字图像较为清晰,提取的有效信息可以尽可能的接近原始图像。因此,本实施例的去噪方式为中值滤波。
本实施例对统一后的字符图像与所述预设的字符模板图像的分辨率不做限制。
本实施例的投影分割方法可以很好地突破分辨率的限制,而模板匹配可以在不同模式的发票中准确识别字符的含义。此外,对目标图像的去噪处理,可以去除无关因素的影响,能显著提高字符识别率。
在一个实施例中,图7为点阵字符的识别方法的具体流程示意图,如图7所示,点阵字符的识别方法包括以下步骤:
S701、提取目标图像中有连续颜色像素点的行,得到行图像。
S702、提取所述行图像中有连续颜色像素点的列,得到列图像。
S703、根据所述行图像和列图像得到目标图像中各个字符对应的字符图像。
S704、对字符图像进行去噪处理,去除字符图像中的不连续颜色像素点。
S705、对去噪后的字符图像以及预设的字符模板图像进行分辨率统一处理。
S706、确定统一分辨率后的各字符图像与预设的字符模板图像的第一相似度。
S707、若所述第一相似度满足预设的相似度条件,将对应字符图像的字符含义确定为所述预设的字符模板图像对应的字符含义。
本实施例,根据以像素点为单位的行或列,确定行图像,并从行图像中提取列图像,得到字符图像,这样的字符提取方法能够精确地具体到每个字符,有效去除其他无关因素的影响。此外,通过模板匹配的方式,可以准确地知道字符对应的含义。
为了更好地理解上述方法,以下详细阐述一个本发明点阵字符的识别方法的应用实例,本应用实例中目标图像以发票图像为例,详细说明如下:
1)去除发票图像不必要的部分,如去除发票的上半部分,保留图像的下半部分(文字部分),并对图像进行倾斜矫正。本实施例提取发票的红色层R(彩色图像的图层分为红色层R,绿色层G,蓝色层B),得到的R如图8所示。
2)对发票图像进行预处理:对R进行灰度化,通过设定阀值,去除图片中的鲜红色,保留暗红色和黑色。通过中值滤波对图像去噪,可以去除印章,减少无关信息的干扰,预处理后得到的发票图像如图9所示。
3)计算发票图像每一行(以一个像素点为高)所有像素点的灰度值最小值,如果该行的灰度值最小值>200,则认为该行为白色(不存在颜色像素点);如果该灰度值最小值<200,则认为该行存在颜色像素点,找出该行中的所有颜色像素点。判断这些颜色像素点中是否存在连续的像素点,若是,取出该行。将取出的各个行按目标图像的位置关系组成图像,得到行图像,行图像如图5所示。
4)计算行图像每一列(以一个像素点为高)所有像素点的灰度值最小值,如果该列的最小值>200,则认为该列为白色(不存在颜色像素点);如果该最小值<200,则认为该列中存在颜色像素点,找出这些颜色像素点,判断这些颜色像素点中是否存在连续的像素点,若是,取出该列。将取出的各个列按目标图像的位置关系组成图像,得到字符图像,字符图像如图6所示。
5)若字符模板图像的分辨率为45*40,将各个字符图像的分辨率规范为45*40的规格(opencv中的resize函数)。计算统一分辨率后中所有字符图像与某一模板(如“额”字的黑体模板)的相似度,相似度高于90%的字符则是“额”字。若没有高于90%的字符图像,则计算各个字符图像与另一模板(如“额”字的宋体模板)的相似度,相似度高于90%的字符则是“额”字。若存在多个相似度高于90%的字符图像,则取其中最高的字符图像,认为该字符图像为“额”字。根据上述方法对所有字符图像进行识别。
在一个实施例中,如图10所示,提供了一种点阵数字的识别方法,包括以下步骤:
S101、提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像;根据所述行图像和列图像得到目标图像中各个字符对应的字符图像。
可选地,本步骤提取字符图像的方法可以与上述字符识别方法的实施例所述的方法一致,也可以不一致。
可选地,可以是从目标图像中提取行图像,从目标图像中提取列图像,对行图像和列图像进行整合,得到字符图像。也可以是从目标图像中提取行图像,在行图像的基础上提取列图像,得到字符图像。
S102、从各个字符图像中确定与标识图像相匹配的第一字符图像。
可选地,标识图像可以是具有某种标识功能的字符对应的图像。如要识别发票中的金额数目,则将“额”的模板图像作为标识图像,从字符图像中确定哪个字符图像为“额”字对应的图像,可以更好地根据“额”字对应的字符图像定位出金额数目对应的字符图像。
S103、获取所述第一字符图像附近特定范围内的第二字符图像,所述第二字符图像为数字图像。
可选地,所述特定范围可以是指匹配字符图像的左侧、右侧、上侧和/或下侧的范围,还可以是匹配字符图像内。本发明实施例对特定范围距离匹配字符图像的距离不做限制。
具体地,所述特定范围指的是匹配字符图像右侧某一位置。
可选地,数字图像可以是发票上的某一具体金额等数据对应的图像,也可以是其他形式的数字对应的图像。
本步骤根据匹配字符图像来确定待分析数字对应的数字图像,能准确找到关键信息的位置。
S104、将所述数字图像与预设的数字模板图像进行比对,根据比对结果识别目标图像特定范围内的数字。
本步骤将数字图像与数字模板图像进行比对,确定数字图像对应的含义。
可选地,数字模板图像为根据某些规则得到的标准数字对应的图像,将数字图像与这些模板进行比对,则可以较为直观地确定数字图像的含义。本发明实施例对数字模板图像对应的字体、大小、分辨率等不做限制。
本实施例在点阵数字的识别上做出了突破,从目标图像中提取字符图像,并从字符图像中确定匹配字符图像,在确定匹配字符图像后准确地锁定数字图像,,将数字图像与数字模板图像进行比对,通过模式匹配的方式,能够比较精确地从图片中提取到相对比较完整的数字,通过模板匹配的方式实现点阵数字的准确识别。
在一个实施例中,所述将所述数字图像与预设的数字模板图像进行比对,根据比对结果识别目标图像特定范围内的数字的步骤,包括:对数字图像与预设的数字模板图像进行分辨率统一处理;确定统一分辨率后的各数字图像与预设的数字模板图像的第二相似度;若所述第二相似度满足预设的相似度条件,将对应数字图像的含义确定为所述预设的数字模板图像对应的数字含义。
可选地,1/2/3/4/5/6/7/8/9/0对应的预设的数字模板图像可以如图11所示。当然,预设的数字模板图像可以为其他字体、大小,也可以为其他分辨率。
可选地,本实施例适用于模式不固定、分辨率不固定的发票等材料。从不同目标图像中提取的数字图像的分辨率可能不固定。因此,在将各数字图像与预设的数字模板图像进行比对之前,需要先对数字图像和预设的数字模板图像进行分辨率调整,使两者的分辨率一致。
可选地,统一分辨率的具体过程可以为:假设每一个模板的分辨率都为44*25,识别数字图像前把数字图像以及数字模板图像的分辨率都规范为20*15。数字图像和数字模板图像统一分辨率前后的对比图如图12所示,其中左一为规范前的数字图像,左二为规范后的数字图像,左三为规范后的数字模板图像,右一为规范前的数字模板图像。之后将数字图像和数字模板图像进行一一对比,计算出数字图像与每一个模板的相似度,取相似度最高的模板(或相似度满足其他条件的模板)为识别结果。
本实施例,对点阵数字的分割后,将数字图像与数字模板图像都缩放为相同的分辨率后进行比较,计算相似度,提高了数字识别的准确率。通过类似于投影的模板匹配方法确定数字图像的含义,能准确地对数字图像的含义进行表示。
在一个实施例中,所述若所述第二相似度满足预设的相似度条件,将对应数字图像的含义确定为所述预设的数字模板图像对应的数字含义的步骤,包括:若数字图像与一个以上的数字模板图像的第二相似度满足预设的相似度条件;将数字图像和满足条件的数字模板图像分别拆分为多个比对区域;分别确定所述数字图像的比对区域与各个数字模板图像对应比对区域的第三相似度;若所述第三相似度满足预设的相似度条件,将对应数字图像的含义确定为所述预设的数字模板图像对应的数字含义。
可选地,对数字图像的拆分可以为将数字图像拆分为多行或多列,也可以按照结构将数字图像平均分为4份或9份等,也可以为其他的拆分方法。确定数字图像的比对区域与数字模板图像的比对区域的第三相似度可以是计算所有比对区域的相似度;也可以是计算部分比对区域的相似度。判断第三相似度是否满足预设的相似度条件的过程可以是判断其中一个比对区域对应的相似度,也可以是比对部分或者全部比对区域的相似度。
可选地,进一步确定数字图像的含义的具体过程可以为:以数字0和8为例,数字图像0与数字模板图像0、8的相似度很接近,很容易出现识别错误,需要另外写入规则来提高识别率,如取出有针对性的行或者列来比较。如果只是单纯地比较图片的黑色比例,模板0与模板8的黑色比例实际上比较接近。因此,将数字模板图像0与8都从左往右平均分成5列,计算出0中间一列的黑色比例为37%,而8中间一列的黑色比例为56%,接着计算数字图像中间一列的黑色比例,接近0则判定为0,接近8则判定为8。
本实施例,在数字图像与多个数字模板图像相似度都较高时,通过进一步比对的方式确定数字图像具体的含义,能准确地对数字图像进行识别。
在一个实施例中,所述从各个字符图像中确定与标识图像相匹配的匹配字符图像的步骤之前,还包括:对字符图像进行去噪处理,去除字符图像中的不连续颜色像素点。
对字符图像进行去噪的过程可以如图13所示,通过逐步地去噪处理可以将字符图像中不连续的颜色像素点去除,进而得到不含(或含有极少)噪声点的字符图像。
可选地,将数字图像与数字模板图像进行比对之前,也可以进行相应地去噪处理。
本实施例在对字符图像进行比对处理之前,对字符图像进行去噪处理,能有效减少无关信息的干扰。
在一个实施例中,如图14所示,提供了一种点阵数字的识别方法,包括以下步骤:
S141、提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像;根据所述行图像和列图像得到目标图像中各个字符对应的字符图像。
S142、对字符图像进行去噪处理,去除字符图像中的不连续颜色像素点。
S143、从各个字符图像中确定与标识图像相匹配的第一字符图像。
S144、获取所述第一字符图像附近特定范围内的第二字符图像,所述第二字符图像为数字图像。
S145、对数字图像与预设的数字模板图像进行分辨率统一处理。
S146、确定统一分辨率后的各数字图像与预设的数字模板图像的第二相似度。
S147、若所述第二相似度满足预设的相似度条件,将对应数字图像的含义确定为所述预设的数字模板图像对应的数字含义。
本实施例在点阵数字的识别上做出了突破,从目标图像中提取字符图像,并从字符图像中确定匹配字符图像,在确定匹配字符图像后准确地锁定数字图像,,将数字图像与数字模板图像进行比对,通过模式匹配的方式,能够比较精确地从图片中提取到相对比较完整的数字,通过模板匹配的方式实现点阵数字的准确识别。
前述点阵字符的识别方法的实施例也适用于点阵字符的识别方法,在此不再赘述。此外,本发明实施例对相似度条件不做限制,对不同图像间的相似度进行比对的相似度条件可以不同,也可以相同。
需要说明的是,对于前述的各方法实施例,为了简便描述,将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。
基于与上述实施例中的点阵字符的识别方法相同的思想,本发明还提供点阵字符的识别装置,该装置可用于执行上述点阵字符的识别方法。为了便于说明,点阵字符的识别装置实施例的结构示意图中,仅仅示出了与本发明实施例相关的部分,本领域技术人员可以理解,图示结构并不构成对装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图15所述,点阵字符的识别装置包括图像提取模块151、字符图像获取模块152和字符识别模块153,详细说明如下:
图像提取模块151,用于提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像。
字符图像获取模块152,用于根据所述行图像和列图像得到目标图像中各个字符对应的字符图像。
以及,字符识别模块153,用于将各个所述字符图像与预设的字符模板图像进行比对,根据比对结果识别所述目标图像中的各个字符。
在一个实施例中,所述图像提取模块151,包括:第一行图像提取子模块,用于提取目标图像中有连续颜色像素点的行,得到行图像;以及第一列图像提取子模块,用于提取所述行图像中有连续颜色像素点的列,得到列图像。
在一个实施例中,所述图像提取模块151,包括:第二行图像提取子模块,用于获取目标图像中某一行所有像素点对应的颜色参数,判断各个颜色参数是否满足预设的颜色条件;若所述行中存在颜色参数满足预设的颜色条件的连续像素点,从所述目标图像中提取所述行;将提取出的多个行组合为行图像;以及,第二列图像提取子模块,用于获取所述行图像中某一列所有像素点对应的颜色参数,判断各个颜色参数是否满足预设的颜色条件;若所述列中存在颜色参数满足预设的颜色条件的连续像素点,从所述行图像中提取所述列;将提取出的多个列组合为列图像。
在一个实施例中,所述字符识别模块153,包括:像素点去除子模块,对字符图像进行去噪处理,去除字符图像中的不连续颜色像素点;第一分辨率统一子模块,用于对去噪后的字符图像以及预设的字符模板图像进行分辨率统一处理;第一相似度确定子模块,用于确定统一分辨率后的各字符图像与预设的字符模板图像的第一相似度;以及,字符识别子模块,用于若所述第一相似度满足预设的相似度条件,将对应字符图像的字符含义确定为所述预设的字符模板图像对应的字符含义。
如图16所述,点阵数字的识别装置包括字符图像提取模块161、图像匹配模块162、数字图像获取模块163和数字识别模块164,详细说明如下:
字符图像提取模块161,用于提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像;根据所述行图像和列图像得到目标图像中各个字符对应的字符图像。
图像匹配模块162,用于从各个字符图像中确定与标识图像相匹配的第一字符图像。
数字图像获取模块163,用于获取所述第一字符图像附近特定范围内的第二字符图像,所述第二字符图像为数字图像。
以及,数字识别模块163,用于将所述数字图像与预设的数字模板图像进行比对,根据比对结果识别目标图像特定范围内的数字。
在一个实施例中,所述数字识别模块164,包括:第二分辨率统一子模块,用于对数字图像与预设的数字模板图像进行分辨率统一处理;第二相似度确定子模块,用于确定统一分辨率后的各数字图像与预设的数字模板图像的第二相似度;以及,数字识别子模块,用于若所述第二相似度满足预设的相似度条件,将对应数字图像的含义确定为所述预设的数字模板图像对应的数字含义。
在一个实施例中,所述数字识别子模块,包括:图像拆分单元,用于若数字图像与一个以上的数字模板图像的第二相似度满足预设的相似度条件;将数字图像和满足条件的数字模板图像分别拆分为多个比对区域;相似度确定单元,用于分别确定所述数字图像的比对区域与各个数字模板图像对应比对区域的第三相似度;以及,数字识别单元,用于若所述第三相似度满足预设的相似度条件,将对应数字图像的含义确定为所述预设的数字模板图像对应的数字含义。
在一个实施例中,所述点阵数字的识别装置,还包括像素点去除模块,用于对字符图像进行去噪处理,去除字符图像中的不连续颜色像素点。
需要说明的是,本发明的点阵字符的识别装置与本发明的点阵字符的识别方法一一对应,在上述点阵字符的识别方法的实施例阐述的技术特征及其有益效果均适用于点阵字符的识别装置的实施例中,具体内容可参见本发明方法实施例中的叙述,此处不再赘述,特此声明。
此外,上述示例的点阵字符的识别装置的实施方式中,各程序模块的逻辑划分仅是举例说明,实际应用中可以根据需要,例如出于相应硬件的配置要求或者软件的实现的便利考虑,将上述功能分配由不同的程序模块完成,即将所述点阵字符的识别装置的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分功能。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像;根据所述行图像和列图像得到目标图像中各个字符对应的字符图像;将各个所述字符图像与预设的字符模板图像进行比对,根据比对结果识别所述目标图像中的各个字符。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:所述提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像的步骤,包括:提取目标图像中有连续颜色像素点的行,得到行图像;提取所述行图像中有连续颜色像素点的列,得到列图像。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:所述提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像的步骤,包括:获取目标图像中某一行所有像素点对应的颜色参数,判断各个颜色参数是否满足预设的颜色条件;若所述行中存在颜色参数满足预设的颜色条件的连续像素点,从所述目标图像中提取所述行;将提取出的多个行组合为行图像;获取所述行图像中某一列所有像素点对应的颜色参数,判断各个颜色参数是否满足预设的颜色条件;若所述列中存在颜色参数满足预设的颜色条件的连续像素点,从所述行图像中提取所述列;将提取出的多个列组合为列图像。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:所述将各个所述字符图像与预设的字符模板图像进行比对,根据比对结果识别所述目标图像中的各个字符的步骤,包括:对字符图像进行去噪处理,去除字符图像中的不连续颜色像素点;对去噪后的字符图像以及预设的字符模板图像进行分辨率统一处理;确定统一分辨率后的各字符图像与预设的字符模板图像的第一相似度;若所述第一相似度满足预设的相似度条件,将对应字符图像的字符含义确定为所述预设的字符模板图像对应的字符含义。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像;根据所述行图像和列图像得到目标图像中各个字符对应的字符图像;将各个所述字符图像与预设的字符模板图像进行比对,根据比对结果识别所述目标图像中的各个字符。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:所述提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像的步骤,包括:提取目标图像中有连续颜色像素点的行,得到行图像;提取所述行图像中有连续颜色像素点的列,得到列图像。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:所述提取目标图像中有连续颜色像素点的行和列,分别得到对应的行图像和列图像的步骤,包括:所述提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像的步骤,包括:获取目标图像中某一行所有像素点对应的颜色参数,判断各个颜色参数是否满足预设的颜色条件;若所述行中存在颜色参数满足预设的颜色条件的连续像素点,从所述目标图像中提取所述行;将提取出的多个行组合为行图像;获取所述行图像中某一列所有像素点对应的颜色参数,判断各个颜色参数是否满足预设的颜色条件;若所述列中存在颜色参数满足预设的颜色条件的连续像素点,从所述行图像中提取所述列;将提取出的多个列组合为列图像。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:所述将所述各个字符图像与预设的字符模板图像进行比对,根据比对结果识别各个字符图像的步骤,包括:所述将各个所述字符图像与预设的字符模板图像进行比对,根据比对结果识别所述目标图像中的各个字符的步骤,包括:对字符图像进行去噪处理,去除字符图像中的不连续颜色像素点;对去噪后的字符图像以及预设的字符模板图像进行分辨率统一处理;确定统一分辨率后的各字符图像与预设的字符模板图像的第一相似度;若所述第一相似度满足预设的相似度条件,将对应字符图像的字符含义确定为所述预设的字符模板图像对应的字符含义。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像;根据所述行图像和列图像得到目标图像中各个字符对应的字符图像;从各个字符图像中确定与标识图像相匹配的第一字符图像;获取所述第一字符图像附近特定范围内的第二字符图像,所述第二字符图像为数字图像;将所述数字图像与预设的数字模板图像进行比对,根据比对结果识别目标图像特定范围内的数字。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:所述将所述数字图像与预设的数字模板图像进行比对,根据比对结果识别目标图像特定范围内的数字的步骤,包括:对数字图像与预设的数字模板图像进行分辨率统一处理;确定统一分辨率后的各数字图像与预设的数字模板图像的第二相似度;若所述第二相似度满足预设的相似度条件,将对应数字图像的含义确定为所述预设的数字模板图像对应的数字含义。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:所述若所述第二相似度满足预设的相似度条件,将对应数字图像的含义确定为所述预设的数字模板图像对应的数字含义的步骤,包括:若数字图像与一个以上的数字模板图像的第二相似度满足预设的相似度条件;将数字图像和满足条件的数字模板图像分别拆分为多个比对区域;分别确定所述数字图像的比对区域与各个数字模板图像对应比对区域的第三相似度;若所述第三相似度满足预设的相似度条件,将对应数字图像的含义确定为所述预设的数字模板图像对应的数字含义。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:所述从各个字符图像中确定与标识图像相匹配的匹配字符图像的步骤之前,还包括:对字符图像进行去噪处理,去除字符图像中的不连续颜色像素点。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像;根据所述行图像和列图像得到目标图像中各个字符对应的字符图像;从各个字符图像中确定与标识图像相匹配的第一字符图像;获取所述第一字符图像附近特定范围内的第二字符图像,所述第二字符图像为数字图像;将所述数字图像与预设的数字模板图像进行比对,根据比对结果识别目标图像特定范围内的数字。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:所述将所述数字图像与预设的数字模板图像进行比对,根据比对结果确定目标图像的数字识别结果的步骤,包括:所述将所述数字图像与预设的数字模板图像进行比对,根据比对结果识别目标图像特定范围内的数字的步骤,包括:对数字图像与预设的数字模板图像进行分辨率统一处理;确定统一分辨率后的各数字图像与预设的数字模板图像的第二相似度;若所述第二相似度满足预设的相似度条件,将对应数字图像的含义确定为所述预设的数字模板图像对应的数字含义。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:所述若所述第二相似度满足预设的相似度条件,将对应数字图像的含义确定为所述预设的数字模板图像对应的数字含义的步骤,包括:若数字图像与一个以上的数字模板图像的第二相似度满足预设的相似度条件;将数字图像和满足条件的数字模板图像分别拆分为多个比对区域;分别确定所述数字图像的比对区域与各个数字模板图像对应比对区域的第三相似度;若所述第三相似度满足预设的相似度条件,将对应数字图像的含义确定为所述预设的数字模板图像对应的数字含义。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:所述从各个字符图像中确定与标识图像相匹配的匹配字符图像的步骤之前,还包括:对字符图像进行去噪处理,去除字符图像中的不连续颜色像素点。
本领域普通技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,作为独立的产品销售或使用。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本发明实施例的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或(模块)单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,不能理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (12)
1.一种点阵字符的识别方法,其特征在于,包括以下步骤:
提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像;
根据所述行图像和列图像得到目标图像中各个字符对应的字符图像;
将各个所述字符图像与预设的字符模板图像进行比对,根据比对结果识别所述目标图像中的各个字符。
2.根据权利要求1所述的点阵字符的识别方法,其特征在于,所述提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像的步骤,包括:
提取目标图像中有连续颜色像素点的行,得到行图像;
提取所述行图像中有连续颜色像素点的列,得到列图像。
3.根据权利要求1所述的点阵字符的识别方法,其特征在于,所述提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像的步骤,包括:
获取目标图像中某一行所有像素点对应的颜色参数,判断各个颜色参数是否满足预设的颜色条件;若所述行中存在颜色参数满足预设的颜色条件的连续像素点,从所述目标图像中提取所述行;将提取出的多个行组合为行图像;
获取所述行图像中某一列所有像素点对应的颜色参数,判断各个颜色参数是否满足预设的颜色条件;若所述列中存在颜色参数满足预设的颜色条件的连续像素点,从所述行图像中提取所述列;将提取出的多个列组合为列图像。
4.根据权利要求1至3任一所述的点阵字符的识别方法,其特征在于,所述将各个所述字符图像与预设的字符模板图像进行比对,根据比对结果识别所述目标图像中的各个字符的步骤,包括:
对字符图像进行去噪处理,去除字符图像中的不连续颜色像素点;
对去噪后的字符图像以及预设的字符模板图像进行分辨率统一处理;
确定统一分辨率后的各字符图像与预设的字符模板图像的第一相似度;
若所述第一相似度满足预设的相似度条件,将对应字符图像的字符含义确定为所述预设的字符模板图像对应的字符含义。
5.一种点阵数字的识别方法,其特征在于,包括以下步骤:
提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像;根据所述行图像和列图像得到目标图像中各个字符对应的字符图像;
从各个字符图像中确定与标识图像相匹配的第一字符图像;
获取所述第一字符图像附近特定范围内的第二字符图像,所述第二字符图像为数字图像;
将所述数字图像与预设的数字模板图像进行比对,根据比对结果识别目标图像特定范围内的数字。
6.根据权利要求5所述的点阵数字的识别方法,其特征在于,所述将所述数字图像与预设的数字模板图像进行比对,根据比对结果识别目标图像特定范围内的数字的步骤,包括:
对数字图像与预设的数字模板图像进行分辨率统一处理;
确定统一分辨率后的各数字图像与预设的数字模板图像的第二相似度;
若所述第二相似度满足预设的相似度条件,将对应数字图像的含义确定为所述预设的数字模板图像对应的数字含义。
7.根据权利要求5所述的点阵数字的识别方法,其特征在于,所述若所述第二相似度满足预设的相似度条件,将对应数字图像的含义确定为所述预设的数字模板图像对应的数字含义的步骤,包括:
若数字图像与一个以上的数字模板图像的第二相似度满足预设的相似度条件;将数字图像和满足条件的数字模板图像分别拆分为多个比对区域;
分别确定所述数字图像的比对区域与各个数字模板图像对应比对区域的第三相似度;
若所述第三相似度满足预设的相似度条件,将对应数字图像的含义确定为所述预设的数字模板图像对应的数字含义。
8.根据权利要求5至7任一所述的点阵数字的识别方法,其特征在于,所述从各个字符图像中确定与标识图像相匹配的匹配字符图像的步骤之前,还包括:
对字符图像进行去噪处理,去除字符图像中的不连续颜色像素点。
9.一种点阵字符的识别装置,其特征在于,包括:
图像提取模块,用于提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像;
字符图像获取模块,用于根据所述行图像和列图像得到目标图像中各个字符对应的字符图像;
以及,字符识别模块,用于将所述各个字符图像与预设的字符模板图像进行比对,根据比对结果识别所述目标图像中的各个字符。
10.一种点阵数字的识别装置,其特征在于,包括:
字符图像提取模块,用于提取目标图像中有连续颜色像素点的行和列,得到对应的行图像和列图像;根据所述行图像和列图像得到目标图像中各个字符对应的字符图像;
图像匹配模块,用于从各个字符图像中确定与标识图像相匹配的第一字符图像;
数字图像获取模块,用于获取所述第一字符图像附近特定范围内的第二字符图像,所述第二字符图像为数字图像;
以及,数字识别模块,用于将所述数字图像与预设的数字模板图像进行比对,根据比对结果识别目标图像特定范围内的数字。
11.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8任一项所述的方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810426134.8A CN108830275B (zh) | 2018-05-07 | 2018-05-07 | 点阵字符、点阵数字的识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810426134.8A CN108830275B (zh) | 2018-05-07 | 2018-05-07 | 点阵字符、点阵数字的识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108830275A true CN108830275A (zh) | 2018-11-16 |
CN108830275B CN108830275B (zh) | 2021-06-29 |
Family
ID=64147610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810426134.8A Active CN108830275B (zh) | 2018-05-07 | 2018-05-07 | 点阵字符、点阵数字的识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108830275B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109816743A (zh) * | 2018-12-19 | 2019-05-28 | 华为技术有限公司 | 生成标识图案的方法和终端设备 |
CN110525069A (zh) * | 2019-08-21 | 2019-12-03 | 珠海思格特智能系统有限公司 | 一种用于智能印章机的ocr对比系统及其方法 |
CN110896475A (zh) * | 2018-12-29 | 2020-03-20 | 研祥智能科技股份有限公司 | 显示终端通道切换检测方法和装置 |
CN111783765A (zh) * | 2020-07-10 | 2020-10-16 | 上海淇毓信息科技有限公司 | 一种识别图像字符的方法、装置和电子设备 |
CN112101368A (zh) * | 2020-09-22 | 2020-12-18 | 北京百度网讯科技有限公司 | 一种字符图像处理方法、装置、设备和介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104268538A (zh) * | 2014-10-13 | 2015-01-07 | 江南大学 | 一种易拉罐点阵喷码字符在线视觉检测方法 |
CN104881665A (zh) * | 2015-04-29 | 2015-09-02 | 华中科技大学 | 一种芯片字符识别与校验方法及装置 |
CN106127205A (zh) * | 2016-06-22 | 2016-11-16 | 山东鲁能智能技术有限公司 | 一种适用于室内轨道机器人的数字仪表图像的识别方法 |
CN107346427A (zh) * | 2017-06-23 | 2017-11-14 | 浙江大华技术股份有限公司 | 一种身份证号码识别方法及装置 |
-
2018
- 2018-05-07 CN CN201810426134.8A patent/CN108830275B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104268538A (zh) * | 2014-10-13 | 2015-01-07 | 江南大学 | 一种易拉罐点阵喷码字符在线视觉检测方法 |
CN104881665A (zh) * | 2015-04-29 | 2015-09-02 | 华中科技大学 | 一种芯片字符识别与校验方法及装置 |
CN106127205A (zh) * | 2016-06-22 | 2016-11-16 | 山东鲁能智能技术有限公司 | 一种适用于室内轨道机器人的数字仪表图像的识别方法 |
CN107346427A (zh) * | 2017-06-23 | 2017-11-14 | 浙江大华技术股份有限公司 | 一种身份证号码识别方法及装置 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109816743A (zh) * | 2018-12-19 | 2019-05-28 | 华为技术有限公司 | 生成标识图案的方法和终端设备 |
US11995747B2 (en) | 2018-12-19 | 2024-05-28 | Huawei Technologies Co., Ltd. | Method for generating identification pattern and terminal device |
CN110896475A (zh) * | 2018-12-29 | 2020-03-20 | 研祥智能科技股份有限公司 | 显示终端通道切换检测方法和装置 |
CN110896475B (zh) * | 2018-12-29 | 2021-08-03 | 研祥智能科技股份有限公司 | 显示终端通道切换检测方法和装置 |
CN110525069A (zh) * | 2019-08-21 | 2019-12-03 | 珠海思格特智能系统有限公司 | 一种用于智能印章机的ocr对比系统及其方法 |
CN111783765A (zh) * | 2020-07-10 | 2020-10-16 | 上海淇毓信息科技有限公司 | 一种识别图像字符的方法、装置和电子设备 |
CN111783765B (zh) * | 2020-07-10 | 2024-03-22 | 上海淇毓信息科技有限公司 | 一种识别图像字符的方法、装置和电子设备 |
CN112101368A (zh) * | 2020-09-22 | 2020-12-18 | 北京百度网讯科技有限公司 | 一种字符图像处理方法、装置、设备和介质 |
CN112101368B (zh) * | 2020-09-22 | 2023-08-18 | 北京百度网讯科技有限公司 | 一种字符图像处理方法、装置、设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108830275B (zh) | 2021-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108830275A (zh) | 点阵字符、点阵数字的识别方法及装置 | |
CN112381775B (zh) | 一种图像篡改检测方法、终端设备及存储介质 | |
CN110084135B (zh) | 人脸识别方法、装置、计算机设备及存储介质 | |
CN104899586B (zh) | 对图像中包含的文字内容进行识别方法及装置 | |
Ortega-Delcampo et al. | Border control morphing attack detection with a convolutional neural network de-morphing approach | |
US11023708B2 (en) | Within document face verification | |
US7376272B2 (en) | Method for image segmentation to identify regions with constant foreground color | |
CN104751142B (zh) | 一种基于笔划特征的自然场景文本检测方法 | |
CN106529380A (zh) | 图像的识别方法及装置 | |
Wang et al. | An effective method for plate number recognition | |
CN107944452A (zh) | 一种圆形印章文字识别方法 | |
CN103034848B (zh) | 一种表单类型的识别方法 | |
CN106991423A (zh) | 识别规格图片中是否包含水印的方法及装置 | |
CN108596197A (zh) | 一种印章匹配方法及装置 | |
CN110378351B (zh) | 印章鉴别方法及装置 | |
EP4012608A1 (en) | Method and system for document classification and text information extraction | |
Subramanian et al. | Character-stroke detection for text-localization and extraction | |
CN113569863B (zh) | 一种单据稽查的方法、系统、电子设备及存储介质 | |
US10867170B2 (en) | System and method of identifying an image containing an identification document | |
CN111259891A (zh) | 一种自然场景下身份证识别方法、装置、设备和介质 | |
CN113033562A (zh) | 一种图像处理方法、装置、设备及存储介质 | |
Jwaid et al. | Study and analysis of copy-move & splicing image forgery detection techniques | |
CN111259894B (zh) | 一种证件信息鉴别方法、装置及计算机设备 | |
US11995907B2 (en) | Distributed computer system for document authentication | |
Lafuente-Arroyo et al. | Traffic sign classification invariant to rotations using support vector machines |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |