CN108073927A - 一种字符识别方法及装置 - Google Patents
一种字符识别方法及装置 Download PDFInfo
- Publication number
- CN108073927A CN108073927A CN201611026221.1A CN201611026221A CN108073927A CN 108073927 A CN108073927 A CN 108073927A CN 201611026221 A CN201611026221 A CN 201611026221A CN 108073927 A CN108073927 A CN 108073927A
- Authority
- CN
- China
- Prior art keywords
- character
- region
- connected region
- interior connected
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
本发明属于图像识别技术领域,提供字符识别方法及装置,旨在解决现有的字符识别方法对于具有封闭区域特征的字符识别而言,均相对复杂、识别耗时过长且识别率低下的问题。整个过程利用某些字符具有封闭区域这一特征,即不同的具有封闭区域特征的字符,其内连通区域的数量和内连通区域的像素点个数不同,将计算得到封闭区域特征字符的内连通区域的数量和内连通区域的像素点个数,分别与预设值和预设范围进行比较,最终识别出字符。本发明技术方案简单,字符识别耗时短、速度快,且可字符的识别率,如此,在冠字号识别中,可加快验钞速度,提高赢得市场的可能性。
Description
技术领域
本发明属于图像识别技术领域,尤其涉及一种字符识别方法及装置。
背景技术
字符识别属于电子图像处理、模式识别的基本问题与重要研究方向之一,在各领域的应用越来越广泛,例如在验钞模块中,就涉及到对纸钞或塑质钞票的冠字号识别。
字符识别的方法相对比较成熟,例如基于模板匹配、基于字符结构和基于神经网络的识别方法等。对于具体的应用领域而言,字符识别的方法更多,例如纸钞或塑质钞票的冠字号识别方法有链码,最近邻法等。
发明人发现对于具有封闭区域特征的字符识别而言,现有的字符识别方法均相对复杂、识别耗时过长且识别率低下。
发明内容
一种字符识别方法及装置,旨在解决现有的字符识别方法对于具有封闭区域特征的字符识别而言,均相对复杂、识别耗时过长且识别率低下的问题。
本发明实施例的第一方面,提供一种字符识别方法,所述方法包括:
将预设字符区域的图像进行二值化,得到对应的二值图像;
计算所述二值图像中单个字符的内连通区域的数量;
若所述内连通区域的数量至少为一个,则计算所述内连通区域的像素点个数;
根据所述内连通区域的数量和所述像素点个数,识别出所述字符。
本发明实施例的另一方面,提供一种字符识别装置,所述装置包括:
二值化模块,用于将预设字符区域的图像进行二值化,得到对应的二值图像;
连通区域数量计算模块,用于计算所述二值图像中单个字符的内连通区域的数量;
像素点个数计算模块,用于若所述内连通区域的数量至少为一个,则计算所述内连通区域的像素点个数;
识别模块,用于根据所述内连通区域的数量和所述像素点个数,识别出所述字符。
本发明实施例与现有技术相比存在的有益效果是:提供一种字符识别方法,将预设字符区域的图像进行二值化,得到对应的二值图像;计算所述二值图像中单个字符的内连通区域的数量;若所述内连通区域的数量至少为一个,则计算所述内连通区域的像素点个数;根据所述内连通区域的数量和所述像素点个数,识别出所述字符。整个过程利用某些字符具有封闭区域这一特征,即不同的具有封闭区域特征的字符,其内连通区域的数量和内连通区域的像素点个数不同,将计算得到封闭区域特征字符的内连通区域的数量和内连通区域的像素点个数,分别与预设值和预设范围进行比较,最终识别出字符。本发明技术方案简单,字符识别耗时短、速度快,且可字符的识别率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的字符识别方法实现流程图;
图2是本发明一实施例提供的具有内连通区域特征的字符目标点和背景的示意图;
图3是本发明另一实施例提供的字符识别装置结构示意图;
图4是本发明另一实施例提供的字符识别装置结构示意图;
图5是本发明另一实施例提供的字符识别装置结构示意图;
图6是本发明另一实施例提供的字符识别装置结构示意图;
图7是本发明另一实施例提供的字符识别装置结构示意图;
图8是本发明另一实施例提供的字符识别装置结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。
以下描述中,为了说明而不是为了限定,给出了诸多技术特征的说明示意图,以便透切理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的装置以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
本发明实施例中字符是指计算机中使用的字母、数字、符号和各个国家或地区使用的文字,尤其是指字母。
为了有效解决现有的字符识别方法对于具有封闭区域特征的字符识别而言,均相对复杂、识别耗时过长且识别率低下的问题。本发明实施例提供的字符识别方法包括:将预设字符区域的图像进行二值化,得到对应的二值图像;计算所述二值图像中单个字符的内连通区域的数量;若所述内连通区域的数量至少为一个,则计算所述内连通区域的像素点个数;根据所述内连通区域的数量和所述像素点个数,识别出所述字符。以下分别进行详细说明。
图1示出了本发明实施例一提供的字符识别方法实现流程图,其执行主体可以是字符识别装置,例如,字符识别装置的应用程序。为了便于说明,图1仅示出了与本实施例相关的部分,其过程主要包括步骤S101至S104,详述如下:
S101,将预设字符区域的图像进行二值化,得到对应的二值图像。
需要说明的是,二值图像为栅格图像,图像中背景和目标点分别用亮度值0和255表示,或用255或0表示,目标点即构成字符的形状的栅格。图2示出了本发明一实施例提供的具有内连通区域特征的字符目标点和背景的示意图,如图2中示出的字符“A”、字符“B”、字符“O”和字符“Q”均用亮度值255表示目标点,亮度值0表示背景点的示例。
可选的是,本发明实施例中,将预设字符区域的图像进行二值化,得到对应的二值图像可由如下步骤S1011、步骤S1012和步骤S1013实现:
S1011,从源图像中截取得到预设字符区域的图像。
可选的是,预设字符区域为钞票冠字号码区域或印刷体文件的字符区域,所述预设字符区域的图像的分辨率大于预设分辨率。
需要说明的是,源图像可以是获取到的钞票图像或某种印刷体文件的图像,相应地,预设字符区域的图像可以为钞票冠字号码区域或印刷体文件的字符区域。
进一步需要说明的是,源图像的分辨率大于预设分辨率,例如大于150dpi(dotsper inch,每英寸所打印的点数),则从源图像中截取得到预设字符区域的图像的分辨率也会大于150dpi,分辨率越高,表示图像背景和目标点的栅格数量越大,计算像素点个数就精确,易于准确地通过计算背景和/或目标点的像素个数将不同的字符区别开来。例如图2中当预设字符区域的图像的分辨率为150dpi时,图2中字符“A”目标点的个数为151,而图2中字符“B”目标点的个数为191,字符“A”的目标点个数比字符“B”的目标点个数只少40个,但是若图2中预设字符区域的图像的分辨率为300dpi,则图2中字符“A”目标点的个数为604,而图2中字符“B”目标点的个数为764,字符“A”的目标点个数比字符“B”的目标点个数就会少160个,若图2中预设字符区域的图像的分辨率为75dpi,则字符“A”的目标点个数比字符“B”的目标点个数只会大约少10,如此看来,分辨率大于预设分辨率是通过计算像素点个数分辨不同字符的前提,而且,能更加准确地通过计算像素点个数区别不同的字符。
S1012,对预设字符区域的图像进行二值化,得到对应的二值图像。
需要说明的是,对预设字符区域的图像进行二值化,得到对应的二值图像,为本领域公知常识,在此不再赘述。
S1013,从二值图像中分割出单个字符的区域。
需要说明的是,分割出单个字符的区域是对字符背景和目标点个数计算所必要的,若是多个字符在一起,则给字符识别造成困难,相应的识别方法也会比较复杂。
需要说明的是,从二值图像中分割出单个字符的区域为本领域公知常识,在此不再赘述。
进一步需要说明的是,步骤S1012和S1013也可以采用先分割出单个字符区域,再对单个字符区域进行二值化的方法,但是相对而言,先对单个字符区域进行二值化,再分割出单个字符区域,效率更高。
需要说明的是,从二值图像中分割出单个字符的区域,为本领域公知常识,在此不再赘述。例如图2中为分割出的单个字符“A”的区域,图2中为分割出的单个字符“B”的区域、图2中为分割出的单个字符“O”的区域、图2中为分割出的单个字符“Q”的区域。
S102,计算所述二值图像中单个字符的内连通区域的数量。
需要说明的是,单个字符的内连通区域即单个字符的封闭区域,如图2中单个字符“A”的内连通区域为1个,图2中单个字符“B”的内连通区域为2个、图2中单个字符“O”的内连通区域为1个、图2中单个字符“Q”的内连通区域为1个。
需要说明的是,计算单个字符内连通区域数量为本领域公知常识,在此不再赘述。
进一步需要说明的是,某些字符的字体不同,其内连通区域会有变化,例如印刷体字母“Q”的字体为Adobe Myungjo Std M时,字母“Q”的内连通区域为2个。本发明以单个字符“Q”的内连通区域为1个进行说明,内连通区域为2个时,情况类似。
S103,若内连通区域的数量至少为一个,则计算内连通区域的像素点个数。
需要说明的是,若单个字符的内连通区域的数量为0个,则说明当前识别的字符不具有封闭区域特征,此类字符不在本发明识别范围内。
需要说明的是,计算内连通区域的像素点个数为本领域公知常识,在此不再赘述。
进一步需要说明的是,单个字符的内连通区域的像素点个数为字符封闭区域的背景的像素点个数,例如图2中字符“A”的内连通区域的像素点个数为37,图2中字符“B”上边内连通区域的像素点个数为49,下边内连通区域的像素点个数为74(所述上边和下边是根据观察者读书时的一般观察视角而确定的)、图2中字符“O”的内连通区域的像素点个数为154,图2中字符“Q”的内连通区域的像素点个数为118。
进一步需要说明的是,若内连通区域的数量至少为一个,也可以计算单个字符目标点的像素个数,例如如图2中字符“A”的目标点像素个数为151,如图2中字符“B”的目标点像素个数为191,如图2中字符“O”的目标点像素个数为163,如图2中字符“Q”的目标点像素个数为172。或者同时计算内连通区域的像素点个数和字符目标点的像素个数。如此,从不同的角度刻画字符的特征、尤其是同时计算内连通区域的像素点个数和字符目标点的像素个数,可进一步提高字符的识别率。
S104,根据内连通区域的数量和像素点个数,识别出字符。
可选的是,本发明实施例中,根据内连通区域的数量和像素点个数,识别出字符可由如下步骤S1041和步骤S1042实现:
S1041,将内连通区域的数量与预设值进行比较,将像素点个数与预设范围进行比较,分别得到比较结果。
例如将图2中单个字符“A”的内连通区域的数量与预设值1进行比较,图2中单个字符“B”的内连通区域的数量与预设值2进行比较,图2中单个字符“O”的内连通区域的数量与预设值1进行比较、图2中单个字符“Q”的内连通区域的数量与预设值1进行比较,比较结果为大于、等于或小于相应的预设值。
例如,将图2中字符“A”的内连通区域的像素点个数与预设范围[35,40]进行比较,图2中字符“B”上边内连通区域的像素点个数与预设范围[46,52]进行比较,下边内连通区域的像素点个数与预设范围[70,78]进行比较,(所述上边和下边是根据观察者读书时的一般观察视角而确定的),图2中字符“O”的内连通区域的像素点个数与预设范围[150,158]进行比较,图2中字符“Q”的内连通区域的像素点个数与预设范围[114,122]进行比较。比较结果为内连通区域的像素点个数是否落入相应的预设范围内。或者将图2中字符“A”的目标点像素个数与预设范围[149,155]进行比较,图2中字符“B”的目标点像素个数与预设范围[187,195]进行比较,图2中字符“O”的目标点像素个数与预设范围[159,167]进行比较,图2中字符“Q”的目标点像素个数与预设范围[168,176]进行比较。比较结果为内连通区域的像素点个数是否落入相应的预设范围内。或者将上述二者同时进行比较,得到比较结果。
S1042,根据比较结果,识别出字符。
需要说明的是,若当图2中单个字符“A”的比较结果,即内连通区域的数量等于预设值1且内连通区域的像素点个数落入预设范围[35,40]内时,则识别当前字符为“A”,若当图2中单个字符“B”的比较结果,即内连通区域的数量等于预设值2且上边内连通区域的像素点个数落入预设范围[46,52]内时且下边内连通区域的像素点个数落入预设范围[70,78]内时,或者内连通区域的数量等于预设值2且所有内连通区域的像素点个数落入预设范围[119,127]时,则识别当前字符为“B”,若当图2中单个字符“O”的比较结果,即内连通区域的数量等于预设值1且内连通区域的像素点个数落入预设范围[150,158]内时,则识别当前字符为“O”,若当图2中单个字符“Q”的比较结果,即内连通区域的数量等于预设值1且内连通区域的像素点个数落入预设范围[114,122]内时,则识别当前字符为“Q”。或者若当图2中单个字符“A”的比较结果,即内连通区域的数量等于预设值1且目标点像素个数落入预设范围[149,155]内时,则识别当前字符为“A”,若当图2中单个字符“B”的比较结果,即内连通区域的数量等于预设值2且目标点像素个数落入预设范围[187,195]内时,则识别当前字符为“B”,若当图2中单个字符“O”的比较结果,即内连通区域的数量等于预设值1且目标点像素个数落入预设范围[159,167]内时,则识别当前字符为“O”,若当图2中单个字符“Q”的比较结果,即内连通区域的数量等于预设值1且目标点像素个数落入预设范围[168,176]内时,则识别当前字符为“Q”。或者上述二者比较结果同时成立时候,识别出相应字符,如此可进一步提高字符的识别率。
可选的是,在将内连通区域的数量与预设值进行比较,将背景像素点个数与预设范围进行比较,分别得到比较结果之前,包括:将获取到的具有封闭区域特征字符的内连通区域的个数设为预设值,将获取到的具有封闭区域特征字符的内连通区域的像素点数量范围设为预设范围。
需要说明的是,所述获取到的具有封闭区域特征字符的内连通区域的个数可以是不同分辨率下图像中单个字符的内连通区域的个数多次求取的平均值,如此,可保证预设值的准确性,进而提高字符识别率。
需要说明的是,所述获取到的具有封闭区域特征字符的内连通区域的像素点数量范围可以是不同分辨率下图像中单个字符的内连通区域的像素点数量范围多次求取的平均范围,如此,可保证预设范围的准确性,进而提高字符识别率。
本发明实施例提供的字符识别方法,将预设字符区域的图像进行二值化,得到对应的二值图像;计算所述二值图像中单个字符的内连通区域的数量;若所述内连通区域的数量至少为一个,则计算所述内连通区域的像素点个数;根据所述内连通区域的数量和所述像素点个数,识别出所述字符。整个过程利用某些字符具有封闭区域这一特征,即不同的具有封闭区域特征的字符,其内连通区域的数量和内连通区域的像素点个数不同,将计算得到封闭区域特征字符的内连通区域的数量和内连通区域的像素点个数,分别与预设值和预设范围进行比较,最终识别出字符。本发明技术方案简单,字符识别耗时短、速度快,且可字符的识别率,如此,在冠字号识别中,可加快验钞速度,提高赢得市场的可能性。
图3示出了本发明另一实施例提供的字符识别装置结构示意图。为了便于说明,图3仅示出了与本发明实施例相关的部分。图3示例的字符识别装置包括二值化模块201、连通区域数量计算模块202、像素点个数计算模块203和识别模块204,其中:
二值化模块201,用于将预设字符区域的图像进行二值化,得到对应的二值图像。
本发明实例中与本发明一实施例中部分内容相同,故借用一实施例中图2进行描述。
需要说明的是,二值图像为栅格图像,图像中背景和目标点分别用亮度值0和255表示,或用255或0表示,目标点即构成字符的形状的栅格。图2示出了本发明一实施例提供的具有内连通区域特征的字符目标点和背景的示意图,如图2中2示出的字符“A”、2示出的字符“B”、2示出的字符“O”和2示出的字符“Q”均用亮度值255表示目标点,亮度值0表示背景点的示例。
连通区域数量计算模块202,用于计算二值图像中单个字符的内连通区域的数量。
本发明实例中与本发明一实施例中部分内容相同,故借用一实施例中图2进行描述。
需要说明的是,单个字符的内连通区域即单个字符的封闭区域,如图2中单个字符“A”的内连通区域为1个,图2中单个字符“B”的内连通区域为2个、图2中单个字符“O”的内连通区域为1个、图2中单个字符“Q”的内连通区域为1个。
需要说明的是,连通区域数量计算模块202计算单个字符内连通区域数量为本领域公知常识,在此不再赘述。
进一步需要说明的是,某些字符的字体不同,其内连通区域会有变化,例如印刷体字母“Q”的字体为Adobe Myungjo Std M时,字母“Q”的内连通区域为2个。本发明以单个字符“Q”的内连通区域为1个进行说明,内连通区域为2个时,情况类似。
像素点个数计算模块203,用于若内连通区域的数量至少为一个,则计算内连通区域的像素点个数。
需要说明的是,若单个字符的内连通区域的数量为0个,则说明当前识别的字符不具有封闭区域特征,此类字符不在本发明识别范围内。
需要说明的是,像素点个数计算模块203计算内连通区域的像素点个数为本领域公知常识,在此不再赘述。
本发明实例中与本发明一实施例中部分内容相同,故借用一实施例中图2进行描述。
进一步需要说明的是,像素点个数计算模块203计算计算得到的单个字符的内连通区域的像素点个数为字符封闭区域的背景的像素点个数,例如图2中字符“A”的内连通区域的像素点个数为37,图2中字符“B”上边内连通区域的像素点个数为49,下边内连通区域的像素点个数为74(所述上边和下边是根据观察者读书时的一般观察视角而确定的),图2中字符“O”的内连通区域的像素点个数为154,图2中字符“Q”的内连通区域的像素点个数为118。
进一步需要说明的是,若连通区域数量计算模块202计算计算得到的单个字符的内连通区域的数量至少为一个,像素点个数计算模块203也可以计算单个字符目标点的像素个数,例如如图2中字符“A”的目标点像素个数为151,如图2中字符“B”的目标点像素个数为191,如图2中字符“O”的目标点像素个数为163,如图2中字符“Q”的目标点像素个数为172。或者同时计算内连通区域的像素点个数和字符目标点的像素个数。如此,从不同的角度刻画字符的特征,尤其是同时计算内连通区域的像素点个数和字符目标点的像素个数,可进一步提高字符的识别率。
识别模块204,用于根据内连通区域的数量和像素点个数,识别出字符。
需要说明的是,以上图3示出的本发明另一实施例提供的字符识别装置的实施方式中,为描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中可以根据需要,例如相应硬件的配置要求或者软件的实现的便利考虑,而将上述功能分配由不同的功能模块完成,即将字符识别装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。而且,实际应用中,本实施例中的相应的功能模块可以是由相应的硬件实现,也可以由相应的硬件执行相应的软件完成,例如,识别模块,可以是具有识别字符功能的硬件,例如识别器,也可以是能够执行相应计算机程序从而完成识别功能的一般处理器或者其他硬件设备,而且本实施例中的相应功能模块可以进行相应变化位于不同于本实施例的一个或多个实施例装置中,也可位于同一实施例中不同功能模块之前或之后(指功能模块的连接关系)。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。(本说明书提供的各个实施例都可应用上述描述原则)。
图3示出的识别模块204可以包括比较单元301和识别单元302,如图4中示出了本发明另一实施例提供的字符识别装置结构示意图。其中:
比较单元301,用于将内连通区域的数量与预设值进行比较,将像素点个数与预设范围进行比较,分别得到比较结果。
本发明实例中与本发明一实施例中部分内容相同,故借用一实施例中图2进行描述。
例如比较单元301将图2中单个字符“A”的内连通区域的数量与预设值1进行比较,图2中单个字符“B”的内连通区域的数量与预设值2进行比较,图2中单个字符“O”的内连通区域的数量与预设值1进行比较、图2中单个字符“Q”的内连通区域的数量与预设值1进行比较,比较结果为大于、等于或小于相应的预设值。
例如比较单元301将图2中字符“A”的内连通区域的像素点个数与预设范围[35,40]进行比较,图2中字符“B”上边内连通区域的像素点个数与预设范围[46,52]进行比较,下边内连通区域的像素点个数与预设范围[70,78]进行比较,(所述上边和下边是根据观察者读书时的一般观察视角而确定的),图2中字符“O”的内连通区域的像素点个数与预设范围[150,158]进行比较,图2中字符“Q”的内连通区域的像素点个数与预设范围[114,122]进行比较。比较结果为内连通区域的像素点个数是否落入相应的预设范围内。或者将图2中字符“A”的目标点像素个数与预设范围[149,155]进行比较,图2中字符“B”的目标点像素个数与预设范围[187,195]进行比较,图2中字符“O”的目标点像素个数与预设范围[159,167]进行比较,图2中字符“Q”的目标点像素个数与预设范围[168,176]进行比较,比较结果为内连通区域的像素点个数是否落入相应的预设范围内。或者比较单元301将上述二者同时进行比较,得到比较结果。
识别单元302,用于根据比较结果,识别出字符。
本发明实例中与本发明一实施例中部分内容相同,故借用一实施例中图2进行描述。
需要说明的是,若比较单元301得到的图2中单个字符“A”的比较结果,即内连通区域的数量等于预设值1且内连通区域的像素点个数落入预设范围[35,40]内时,则识别单元302识别当前字符为“A”,若比较单元301得到的图2中单个字符“B”的比较结果,即内连通区域的数量等于预设值2且上边内连通区域的像素点个数落入预设范围[46,52]内时且下边内连通区域的像素点个数落入预设范围[70,78]内时,或者内连通区域的数量等于预设值2且所有内连通区域的像素点个数落入预设范围[119,127]时,则识别单元302识别当前字符为“B”,若比较单元301得到的图2中单个字符“O”的比较结果,即内连通区域的数量等于预设值1且内连通区域的像素点个数落入预设范围[150,158]内时,则识别单元302识别当前字符为“O”,若比较单元301得到的图2中单个字符“Q”的比较结果,即内连通区域的数量等于预设值1且内连通区域的像素点个数落入预设范围[114,122]内时,则识别单元302识别当前字符为“Q”。或者若比较单元301得到的图2中单个字符“A”的比较结果,即内连通区域的数量等于预设值1且目标点像素个数落入预设范围[149,155]内时,则识别单元302识别当前字符为“A”,若比较单元301得到的图2中单个字符“B”的比较结果,即内连通区域的数量等于预设值2且目标点像素个数落入预设范围[187,195]内时,则识别单元302识别当前字符为“B”,若比较单元301得到的图2中单个字符“O”的比较结果,即内连通区域的数量等于预设值1且目标点像素个数落入预设范围[159,167]内时,则识别单元302识别当前字符为“O”,若比较单元301得到的图2中单个字符“Q”的比较结果,即内连通区域的数量等于预设值1且目标点像素个数落入预设范围[168,176]内时,则识别单元302识别当前字符为“Q”。或者若比较单元301得到的上述二者比较结果同时成立时候,识别单元302识别出相应字符,如此可进一步提高字符的识别率。
图4示出的字符识别装置还可以包括预设值获取模块401和预设范围获取模块402,如图5中示出了本发明另一实施例提供的字符识别装置结构示意图。其中:
预设值获取模块401,用于将获取到的具有封闭区域特征字符的内连通区域的个数设为预设值。
需要说明的是,预设值获取模块401获取到的具有封闭区域特征字符的内连通区域的个数可以是不同分辨率下图像中单个字符的内连通区域的个数多次求取的平均值,如此,可保证预设值的准确性,进而提高字符识别率。
预设范围获取模块402,用于将获取到的具有封闭区域特征字符的内连通区域的像素点数量范围设为预设范围。
需要说明的是,预设范围获取模块402获取到的具有封闭区域特征字符的内连通区域的像素点数量范围可以是不同分辨率下图像中单个字符的内连通区域的像素点数量范围多次求取的平均范围,如此,可保证预设范围的准确性,进而提高字符识别率。
需要说明的是,预设值获取模块401只要在逻辑上保证在比较模块301进行比较之前运算结束即可,图5中并不对预设值获取模块401与其他模块的连接模块进行限定,例如预设值获取模块401可以连接在二值化模块201前面或后面,如上说明也适用于预设范围获取模块402。
图3或图4或图5示出的二值化模块201可以包括截取单元501、二值化单元502和分割单元503,如图6中示出了本发明另一实施例提供的字符识别装置结构示意图,如图7中示出了本发明另一实施例提供的字符识别装置结构示意图,如图8中示出了本发明另一实施例提供的字符识别装置结构示意图。其中:
截取单元501,用于从源图像中截取得到预设字符区域的图像。
可选的是,截取单元501截取到的预设字符区域为钞票冠字号码区域或印刷体文件的字符区域,截取单元501截取到的预设字符区域的图像的分辨率大于预设分辨率。
需要说明的是,源图像可以是获取到的钞票图像或某种印刷体文件的图像,相应地,截取单元501截取到的预设字符区域的图像可以为钞票冠字号码区域或印刷体文件的字符区域。
进一步需要说明的是,源图像的分辨率大于预设分辨率,例如大于150dpi(dotsper inch,每英寸所打印的点数),则截取单元501从源图像中截取得到预设字符区域的图像的分辨率也会大于150dpi,分辨率越高,表示图像背景和目标点的栅格数量越大,计算像素点个数就精确,易于准确地通过计算背景和/或目标点的像素个数将不同的字符区别开来。
本发明实例中与本发明一实施例中部分内容相同,故借用一实施例中图2进行描述。
例如图2中当预设字符区域的图像的分辨率为150dpi时,图2中字符“A”目标点的个数为151,而图2中字符“B”目标点的个数为191,字符“A”的目标点个数比字符“B”的目标点个数只少40个,但是若图2中预设字符区域的图像的分辨率为300dpi,则图2中字符“A”目标点的个数为604,而图2中字符“B”目标点的个数为764,字符“A”的目标点个数比字符“B”的目标点个数就会少160个,若图2中预设字符区域的图像的分辨率为75dpi,则字符“A”的目标点个数比字符“B”的目标点个数只会大约少10,如此看来,分辨率大于预设分辨率是通过计算像素点个数分辨不同字符的前提,而且,能更加准确地通过计算像素点个数区别不同的字符。
二值化单元502,用于对预设字符区域的图像进行二值化,得到对应的二值图像。
需要说明的是,二值化单元502对预设字符区域的图像进行二值化,得到对应的二值图像,为本领域公知常识,在此不再赘述。
分割单元503,用于从二值图像中分割出单个字符的区域。
需要说明的是,分割单元503分割出单个字符的区域是对字符背景和目标点个数计算所必要的,若是多个字符在一起,则给字符识别造成困难,相应的识别方法也会比较复杂。
需要说明的是,分割单元503从二值图像中分割出单个字符的区域为本领域公知常识,在此不再赘述。
进一步需要说明的是,二值化单元502和分割单元503也可以采用先分割出单个字符区域,再对单个字符区域进行二值化的方法,但是相对而言,先对单个字符区域进行二值化,再分割出单个字符区域,效率更高。
需要说明的是,分割单元503从二值图像中分割出单个字符的区域,为本领域公知常识,在此不再赘述。例如图2中为分割单元503分割出的单个字符“A”的区域,图2中为分割单元503分割出的单个字符“B”的区域、图2中为分割单元503分割出的单个字符“O”的区域、图2中为分割单元503分割出的单个字符“Q”的区域。
需要说明的是,上述装置实施例中各模块/单元之间的信息交互、执行过程等内容及实施例整体内容,由于与本发明方法实施例基于同一构思,其带来的技术效果与本发明方法实施例相同,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
本领域普通技术人员还可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以在存储于一计算机可读取存储介质中,所述的存储介质,包括ROM/RAM、磁盘、光盘等。
以上内容是结合具体的优选实施方式对本发明原理及实施方式所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明,只是用于帮助理解本发明的方法及其核心思想;同时,对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下做出若干等同替代或明显变型,而且性能或用途相同,都应当视为属于本发明由所提交的权利要求书确定的专利保护范围。
Claims (10)
1.一种字符识别方法,其特征在于,所述方法包括:
将预设字符区域的图像进行二值化,得到对应的二值图像;
计算所述二值图像中单个字符的内连通区域的数量;
若所述内连通区域的数量至少为一个,则计算所述内连通区域的像素点个数;
根据所述内连通区域的数量和所述像素点个数,识别出所述字符。
2.如权利要求1所述的方法,其特征在于,所述根据所述内连通区域的数量和所述像素点个数,识别出所述字符,包括:
将所述内连通区域的数量与预设值进行比较,将所述像素点个数与预设范围进行比较,分别得到比较结果;
根据所述比较结果,识别出所述字符。
3.如权利要求2所述的方法,其特征在于,所述在将所述内连通区域的数量与预设值进行比较,将所述背景像素点个数与预设范围进行比较,分别得到比较结果之前,包括:
将获取到的具有封闭区域特征字符的内连通区域的个数设为所述预设值;
将获取到的所述具有封闭区域特征字符的内连通区域的像素点数量范围设为所述预设范围。
4.如权利要求1至3中任意一项所述的方法,其特征在于,所述将预设字符区域的图像进行二值化,得到二值图像,包括:
从源图像中截取得到所述预设字符区域的图像;
对所述预设字符区域的图像进行二值化,得到对应的二值图像;
从所述二值图像中分割出所述单个字符的区域。
5.如权利要求4所述的方法,其特征在于,所述预设字符区域为钞票冠字号码区域或印刷体文件的字符区域,所述预设字符区域的图像的分辨率大于预设分辨率。
6.一种字符识别装置,其特征在于,所述装置包括:
二值化模块,用于将预设字符区域的图像进行二值化,得到对应的二值图像;
连通区域数量计算模块,用于计算所述二值图像中单个字符的内连通区域的数量;
像素点个数计算模块,用于若所述内连通区域的数量至少为一个,则计算所述内连通区域的像素点个数;
识别模块,用于根据所述内连通区域的数量和所述像素点个数,识别出所述字符。
7.如权利要求6所述的装置,其特征在于,所述识别模块包括:
比较单元,用于将所述内连通区域的数量与预设值进行比较,将所述像素点个数与预设范围进行比较,分别得到比较结果;
识别单元,用于根据所述比较结果,识别出所述字符。
8.如权利要求7所述的装置,其特征在于,所述装置还包括:
预设值获取模块,用于将获取到的具有封闭区域特征字符的内连通区域的个数设为所述预设值;
预设范围获取模块,用于将获取到的所述具有封闭区域特征字符的内连通区域的像素点数量范围设为所述预设范围。
9.如权利要求6至8中任意一项所述的装置,其特征在于,所述二值化模块包括:
截取单元,用于从源图像中截取得到所述预设字符区域的图像;
二值化单元,用于对所述预设字符区域的图像进行二值化,得到对应的二值图像;
分割单元,用于从所述二值图像中分割出所述单个字符的区域。
10.如权利要求9所述的装置,其特征在于,所述预设字符区域为钞票冠字号码区域或印刷体文件的字符区域,所述预设字符区域的图像的分辨率大于预设分辨率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611026221.1A CN108073927B (zh) | 2016-11-18 | 2016-11-18 | 一种字符识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611026221.1A CN108073927B (zh) | 2016-11-18 | 2016-11-18 | 一种字符识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108073927A true CN108073927A (zh) | 2018-05-25 |
CN108073927B CN108073927B (zh) | 2020-05-15 |
Family
ID=62160842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611026221.1A Expired - Fee Related CN108073927B (zh) | 2016-11-18 | 2016-11-18 | 一种字符识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108073927B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060290950A1 (en) * | 2005-06-23 | 2006-12-28 | Microsoft Corporation | Image superresolution through edge extraction and contrast enhancement |
CN102509383A (zh) * | 2011-11-28 | 2012-06-20 | 哈尔滨工业大学深圳研究生院 | 一种基于特征检测及模板匹配的混合号码识别方法 |
US20140037181A1 (en) * | 2012-07-31 | 2014-02-06 | Lg Cns Co., Ltd. | Character recognition method, character recognition apparatus and financial apparatus |
CN104200209A (zh) * | 2014-08-29 | 2014-12-10 | 南京烽火星空通信发展有限公司 | 一种图像文字检测方法 |
CN104318257A (zh) * | 2014-08-20 | 2015-01-28 | 深圳大学 | 纸币识别方法与系统 |
JP2015041369A (ja) * | 2013-08-23 | 2015-03-02 | グローリー株式会社 | 紙葉類管理システム及び紙葉類管理方法 |
CN104463124A (zh) * | 2014-12-11 | 2015-03-25 | 天津普达软件技术有限公司 | 一种奶盒喷打字符识别的方法 |
CN104835242A (zh) * | 2015-04-17 | 2015-08-12 | 深圳怡化电脑股份有限公司 | 一种纸币图像处理方法 |
CN105095890A (zh) * | 2014-04-25 | 2015-11-25 | 广州市动景计算机科技有限公司 | 图像中字符分割方法及装置 |
CN105283884A (zh) * | 2013-03-13 | 2016-01-27 | 柯法克斯公司 | 对移动设备捕获的数字图像中的对象进行分类 |
US20160034783A1 (en) * | 2014-07-29 | 2016-02-04 | Alibaba Group Holding Limited | Detecting specified image identifiers on objects |
WO2016119410A1 (zh) * | 2015-01-26 | 2016-08-04 | 广州广电运通金融电子股份有限公司 | 钞票裂缝检测方法及装置 |
-
2016
- 2016-11-18 CN CN201611026221.1A patent/CN108073927B/zh not_active Expired - Fee Related
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060290950A1 (en) * | 2005-06-23 | 2006-12-28 | Microsoft Corporation | Image superresolution through edge extraction and contrast enhancement |
CN102509383A (zh) * | 2011-11-28 | 2012-06-20 | 哈尔滨工业大学深圳研究生院 | 一种基于特征检测及模板匹配的混合号码识别方法 |
US20140037181A1 (en) * | 2012-07-31 | 2014-02-06 | Lg Cns Co., Ltd. | Character recognition method, character recognition apparatus and financial apparatus |
CN105283884A (zh) * | 2013-03-13 | 2016-01-27 | 柯法克斯公司 | 对移动设备捕获的数字图像中的对象进行分类 |
JP2015041369A (ja) * | 2013-08-23 | 2015-03-02 | グローリー株式会社 | 紙葉類管理システム及び紙葉類管理方法 |
CN105095890A (zh) * | 2014-04-25 | 2015-11-25 | 广州市动景计算机科技有限公司 | 图像中字符分割方法及装置 |
US20160034783A1 (en) * | 2014-07-29 | 2016-02-04 | Alibaba Group Holding Limited | Detecting specified image identifiers on objects |
CN104318257A (zh) * | 2014-08-20 | 2015-01-28 | 深圳大学 | 纸币识别方法与系统 |
CN104200209A (zh) * | 2014-08-29 | 2014-12-10 | 南京烽火星空通信发展有限公司 | 一种图像文字检测方法 |
CN104463124A (zh) * | 2014-12-11 | 2015-03-25 | 天津普达软件技术有限公司 | 一种奶盒喷打字符识别的方法 |
WO2016119410A1 (zh) * | 2015-01-26 | 2016-08-04 | 广州广电运通金融电子股份有限公司 | 钞票裂缝检测方法及装置 |
CN104835242A (zh) * | 2015-04-17 | 2015-08-12 | 深圳怡化电脑股份有限公司 | 一种纸币图像处理方法 |
Non-Patent Citations (4)
Title |
---|
H.HASSANPOUR等: "Feature extraction for paper currency recognition", 《2007 9TH INTERNATIONAL SYMPOSIUM ON SIGNAL PROCESSING AND ITS APPLICATIONS》 * |
刘承香 等: "纸币号码识别技术研究", 《激光与红外》 * |
孟庆远 等: "基于字符连通域特征的车牌汉字字符识别技术", 《测试技术学报》 * |
苑玮琦 等: "基于结构特征的纸币号码识别方法", 《计算机工程与应用》 * |
Also Published As
Publication number | Publication date |
---|---|
CN108073927B (zh) | 2020-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mohammad et al. | Optical character recognition implementation using pattern matching | |
CN109886928B (zh) | 一种目标细胞标记方法、装置、存储介质及终端设备 | |
CN104809464A (zh) | 一种指纹信息处理方法 | |
CN109871845B (zh) | 证件图像提取方法及终端设备 | |
CN107832767A (zh) | 集装箱箱号识别方法、装置及电子设备 | |
CN108345641A (zh) | 一种爬取网站数据的方法、存储介质和服务器 | |
CN110490141B (zh) | 一种填涂信息的识别方法、装置、终端及存储介质 | |
CN112528998B (zh) | 证件图像处理方法、装置、电子设备及可读存储介质 | |
CN112541443B (zh) | 发票信息抽取方法、装置、计算机设备及存储介质 | |
CN104867225A (zh) | 一种纸币的面向识别方法及装置 | |
CN110503100A (zh) | 一种医疗单据识别方法、装置、计算机装置及计算机可读存储介质 | |
CN110046622B (zh) | 一种有目标的攻击样本生成方法、装置、设备及存储介质 | |
CN108509988B (zh) | 一种试卷分数自动统计方法、装置、电子设备及存储介质 | |
CN110070115A (zh) | 一种单像素攻击样本生成方法、装置、设备及存储介质 | |
CN110263616A (zh) | 一种文字识别方法、装置、电子设备及存储介质 | |
CN117423126B (zh) | 一种基于数据分析的票据图文识别方法及系统 | |
CN113283431B (zh) | 一种答题卡选项区域识别方法及系统 | |
WO2021147866A1 (zh) | Ecg信号的获取方法及装置、存储介质、电子装置 | |
CN105404868A (zh) | 一种基于交互平台的复杂背景中文本的快速检测方法 | |
CN103605811A (zh) | 一种纹理图像的检索方法和装置 | |
CN108171229B (zh) | 一种空心粘连验证码的识别方法及系统 | |
CN110378351A (zh) | 印章鉴别方法及装置 | |
CN110287911A (zh) | 一种发票的内容识别方法、装置、设备及存储介质 | |
CN102360505A (zh) | 一种图形验证码生成方法 | |
CN114241463A (zh) | 签名验证方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200515 Termination date: 20211118 |
|
CF01 | Termination of patent right due to non-payment of annual fee |