CN1221927A - 字符识别装置及其方法和计算机能读取的记录媒体 - Google Patents
字符识别装置及其方法和计算机能读取的记录媒体 Download PDFInfo
- Publication number
- CN1221927A CN1221927A CN98125436A CN98125436A CN1221927A CN 1221927 A CN1221927 A CN 1221927A CN 98125436 A CN98125436 A CN 98125436A CN 98125436 A CN98125436 A CN 98125436A CN 1221927 A CN1221927 A CN 1221927A
- Authority
- CN
- China
- Prior art keywords
- character
- similarity
- group
- mentioned
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Character Discrimination (AREA)
Abstract
字符图象输入部输入标准化了的2值化识别对象字符图象。图象区分割部将字符图象的存在区分割成16份。特征量取出部在每个被分割的区中取出特征量。图象区分类部将各区分成两群。识别部对第一群和第二群分别计算识别对象字符图象的特征量和识别字典中的标准特征量的街区距离,将第一群和第二群各自的街区距离乘以规定的系数后进行合计,将最近的标准字符作为识别结果。
Description
本发明涉及输入的从识别对象的字符图象识别字符的字符识别装置及其方法。
为了提高字符识别的精度,有特开昭61-125688号公报中记载的字符识别装置。该装置将标准化的标准字符图象分割成纵横分别四等分的16个区域,有登录了每个区域的标准特征量和字符码的识别字典。该标准特征量是用来沿横/左上/纵/右上这样四个方向,对表示字符要素部分的黑象素部分的排列图形进行分类,并求出区域中包含的字符要素部分的四个图形各自的数目。因此,在识别字典中对每个字符码记载了各区域的四元标准特征量,登录了“4×16”共64元的标准特征量。
在该装置中,输入识别对象的字符图象,作为字符要素部分为“黑”、背景部分为“白”的双值图象将其标准化为“16×16”象素的区域后,纵横分别被分割成每四个象素的16个区域,从各区域取出与识别字典同样的特征量。
其次,作为识别对象的字符图象和识别字典中登录的用字符码表示的字符之间的相似度,计算标准特征量(64元)和取出的特征量(同样为64元)的街区距离。所计算的街区距离小者相似度高,所以作为用具有街区距离为最小的标准特征量的字符码表示的字符,来识别被输入的字符图象。
通过这样分割区域,能区别并识别出“土”和“士”,而在例如不进行分割而将“横/左上/纵/右”的四个图形的数作为标准特征量时,就不能正确地识别“土”和“士”。
可是,在这样的现有的字符识别装置中,将字符图象作为2值图象输入时,即使将若干个区域进行细分,另外再将特征要素从四个图形分成八个图形,以便提高特征量的精度,以及提高相似度计算的精度,即使这样也不能正确地识别字符。
给出具体例来说明。
图1和图2都是标准化了的字符“電”的2值字符图象。图1所示的字符图象“電”101能通过扫描正确地读入,然而图2所示的字符图象“電”201在通过扫描读入时,字符呈被破坏的状态。如果用现有的字符识别装置识别这两个字符图象“電”101、201,则字符图象“電”101能被正确地识别出来,可是字符图象“電”201却被误认为字符“t”。
本发明的目的在于提供一种即使作为识别对象的字符图象被破坏时,也能正确地识别字符的提高了识别精度的字符识别装置。
采用以下结构能达到本发明的目的。即,将识别对象字符图象作为字符码识别的字符识别装置包括:将字符的标准图象分割成N(N≥2)个部分图象区,并将各部分图象区中包含的部分字符图象的标准特征按字符单元与字符码一起预先登录的识别字典;将识别对象字符图象分割成N个部分图象区的图象区分割装置;取出由上述图象区分割装置分割成的部分图象区中包含的部分字符图象的特征的特征取出装置;将由上述图象区分割装置分割成的部分图象区分类为多个群的部分图象区分类装置;对每个群计算上述识别对象字符图象的部分字符图象的特征和上述识别字典对应的标准特征的素相似度,对各群的素相似度进行规定的加权,计算识别对象字符图象和上述识别字典中的字符的相似度的相似度计算装置;以及将上述相似度最高的字符作为识别字符,并选出该字符码的识别字符选出装置。
利用这样的结构,由于将对各群的字符识别的贡献相应的权重附加在各群的素相似度上,计算全体的相似度,所以能获得即使在识别对象字符图象被破坏的情况下也能提高字符识别的精度的字符识别装置。
这里,上述部分图象区分类装置可以包括将上述部分图象区分类为识别对象字符图象的周边部分的第一群和中央部分的第二群的周边·中央分类部,上述相似度计算装置可以包括分别计算上述第一群和第二群的上述部分字符图象的特征和上述识别字典中对应的标准特征的街区距离、欧几里德距离或马哈赖诺毕斯距离即素相似度的素相似度计算部;以及使对上述第一群的相似度的贡献比对第二群的相似度的贡献大而将第一群和第二群的素相似度分别乘以规定的系数进行合计的相似度合计部。
利用这样的结构,由于一般使识别对象字符图象上受到破坏的字符图象的中央部分的素相似度的贡献小,通过计算相似度,能提高字符识别的精度。
这里,由上述相似度合计部所乘的系数,对于第一群的素相似度来说为1.0,对于第二群的素相似度来说为0.5,上述识别字符选出装置能选出相似度最小的值的字符作为相似度最大的字符。
利用这样的结构,使对识别对象字符图象的中央部分的相似度的贡献为周边部分的一半,能飞跃地提高字符识别率。
这里,上述部分图象区分类装置可以包括将上述部分图象区分类为识别对象字符图象的周边部分的第一群和中央部分的第二群的周边·中央分类部,上述相似度计算装置可以包括计算上述第一群的上述部分字符图象的特征和上述识别字典中对应的标准特征的街区距离、欧几里德距离或马哈赖诺毕斯距离即素相似度,并从上述识别字典选出素相似度的高位的字符群作为候选字符的候选字符选出部;对由上述候选字符选出部选出的候选字符计算第二群的素相似度的第二群素相似度计算部;以及使对上述第一群的相似度的贡献比对第二群的相似度的贡献大而将第一群和第二群的素相似度分别乘以规定的系数进行合计的相似度合计部。
利用这样的结构,由于一般从能充分地表现识别对象字符图象的形状特征的周边部分的特征选出候选字符,只对被选出的候选字符计算全体的相似度,所以能提高识别精度,同时能谋求处理速度的高速化。
这里,字符识别装置还可以包括将形状类似的字符的标准图象群分割成N(N≥2)个部分图象区,并将各部分图象区中包含的部分字符图象的字符群标准特征与类似字符单元的字符码群一起预先登录的字符群分类字典,上述部分图象区分类装置可以包括将上述部分图象区分类为识别对象字符图象的周边部分的第一群和中央部分的第二群的周边·中央分类部,字符识别装置还可以包括计算上述被分成第一群的识别对象字符图象的部分字符图象的特征和被登录在上述字符群分类字典中的对应的字符群标准特征的相似度,并选出相似度大的字符群的字符码的字符群选出装置,上述相似度计算装置只在由上述字符群选出装置选出的与字符码对应的上述识别字典中登录的标准特征之间计算与识别对象的部分字符图象的特征的相似度,上述相似度计算装置可以包括分别计算上述第一群和第二群的上述部分字符图象的特征和上述识别字典中对应的标准特征的街区距离、欧几里德距离或马哈赖诺毕斯距离即素相似度的素相似度计算部;以及使对上述第一群的相似度的贡献比对第二群的相似度的贡献大而将第一群和第二群的素相似度分别乘以规定的系数进行合计的相似度合计部。
利用这样的结构,由于用充分地表现识别对象字符图象的特征的部分的特征,选出形状类似的类似字符单元的字符群,对所选出的字符群进行提高了精度的相似度的计算,所以能提高识别精度,同时还能谋求处理速度的高速化。
这里,上述部分图象区分类装置可以包括对各部分图象区计算部分字符图象在上述部分图象区中占有的比率的部分字符图象比率计算部;以及判断上述部分字符图象的比率是小于阈值还是在阈值以上、将上述部分图象区分类为正常部分的第一群和破坏部分的第二群的正常·破坏部分判断部。
利用这样的结构,由于对每个个别的识别对象字符图象的各部分图象区判断是正常部分还是破坏部分,并分类为第一群和第二群,将规定的权重附加在第一群和第二群的部分图象区的素相似度上,所以相似度的可靠性高,而且字符识别的精度提高。
这里,上述相似度计算装置可以包括分别计算上述第一群和第二群的上述部分字符图象的特征和上述识别字典中对应的标准特征的街区距离、欧几里德距离或马哈赖诺毕斯距离即素相似度的素相似度计算部;以及使对上述第一群的相似度的贡献比对第二群的相似度的贡献大而将第一群和第二群的素相似度分别乘以规定的系数进行合计的相似度合计部。
利用这样的结构,由于使对部分图象区的破坏部分的相似度的贡献小,所以能谋求提高识别精度。
这里,上述相似度计算装置可以包括计算上述第一群的上述部分字符图象的特征和上述识别字典中对应的标准特征的街区距离、欧几里德距离或马哈赖诺毕斯距离即素相似度,从上述识别字典中选出素相似度的高位的字符群作为候选字符的候选字符选出部;对由上述候选字符选出部选出的候选字符计算第二群的素相似度的第二群素相似度计算部;以及使对上述第一群的相似度的贡献比对第二群的相似度的贡献大而将第一群和第二群的素相似度分别乘以规定的系数进行合计的相似度合计部。
利用这样的结构,由于只根据被断定为正常部分的部分图象区的第一群的相似度选出候选字符,对所选出的候选字符计算相似度,所以能谋求处理速度的高速化和识别精度的提高。
这里,字符识别装置还可以包括将形状类似的字符的标准图象群分割成N(N≥2)个部分图象区,并将各部分图象区中包含的部分字符图象的字符群标准特征与类似字符单元的字符码群一起预先登录的字符群分类字典;以及计算上述被分成第一群的识别对象字符图象的部分字符图象的特征和被登录在上述字符群分类字典中的对应的字符群标准特征的相似度,并选出相似度大的字符群的字符码的字符群选出装置,上述类似度计算装置只在与被上述字符群选出装置选出的字符码对应的上述识别字典中登录的标准特征之间,计算与识别对象的部分字符图象的特征的相似度,上述相似度计算装置可以包括分别计算上述第一群和第二群的上述部分字符图象的特征和上述识别字典中对应的标准特征的街区距离、欧几里德距离或马哈赖诺毕斯距离即素相似度的素相似度计算部;以及使对上述第一群的相似度的贡献比对第二群的相似度的贡献大而将第一群和第二群的素相似度分别乘以规定的系数进行合计的相似度合计部。
利用这样的结构,由于能根据被断定为正常部分的部分图象区的特征,缩小包含识别对象字符图象的字符的字符群,所以能谋求相似度计算的高速化。
这里,上述阈值能设定为75%。
利用这样的结构,能适当地进行正常部分和破坏部分的第一群和第二群的分类,能提高字符识别的精度。
另外,能通过以下的结构达到本发明的目的。即,将识别对象字符图象作为字符码识别的字符识别方法包括:将识别对象字符图象分割成N(N≥2)个部分图象区的图象区分割步骤;取出上述部分图象区中包含的部分字符图象的特征的特征取出步骤;将上述部分图象区分类为多个群的部分图象区分类步骤;对每个群计算上述识别对象字符图象的部分字符图象的特征与将字符的标准图象分割成N个部分图象区并将各部分图象区中包含的部分字符图象的标准特征按字符单元与字符码一起预先登录的识别字典中对应的标准特征的素相似度,将规定的权重加在各群的素相似度上,计算识别对象字符图象和上述识别字典中的字符的相似度的相似度计算步骤;以及将上述相似度最高的字符作为识别字符,并选出该字符码的识别字符选出步骤。
利用这样的结构,由于将对各群的字符识别的贡献相应的权重附加在各群的素相似度上,计算全体的相似度,所以能获得即使在识别对象字符图象被破坏的情况下也能提高字符识别的精度的字符识别方法。
另外,能通过以下的结构达到本发明的目的。即,一种计算机能读取的记录媒体,它能记录具有以下步骤的程序:将字符的标准图象分割成N(N≥2)个部分图象区,记录将各部分图象区中包含的部分字符图象的标准特征按字符单元与字符码一起预先登录的识别字典,将识别对象字符图象分割成N个部分图象区的图象区分割步骤;取出在上述图象区分割步骤中分割的部分图象区中包含的部分字符图象的特征的特征取出步骤;将在上述图象区分割步骤中分割的部分图象区分类为多个群的部分图象区分类步骤;对每个群计算上述识别对象字符图象的部分字符图象的特征和上述识别字典中对应的标准特征的素相似度,将规定的权重加在各群的素相似度上,计算识别对象字符图象和上述识别字典中的字符的相似度的相似度计算步骤;以及将上述相似度最高的字符作为识别字符,并选出该字符码的识别字符选出步骤。
利用这样的结构,通过将该记录媒体安装在现有的字符识别装置中读入程序,能作为即使在识别对象字符图象被破坏的情况下也能提高识别精度的字符识别装置使用。
从以下所做的说明,连同说明本发明的具体实施例的附图,将使本发明的这些和其它目的、优点和特征变得更加明显。其附图是:
图1是表示图象输入部中输入的识别对象字符图象之一例的图。
图2是表示图象输入部中输入的识别对象字符图象的另一例的图。
图3是本发明的字符识别装置的实施例1的结构图。
图4(a)是表示上述实施例的识别字典中的数字“1”的登录内容之一例的图。
图4(b)是表示以上述(a)的登录内容为依据的标准字符图象“1”的图。
图5是说明取出标准特征量用的特征要素的图。
图6(a)是表示上述实施例的识别字典中的字母“i”的登录内容之一例的图。
图6(b)是表示以上述(a)的登录内容为依据的标准字符图象“i”的图。
图7(a)是表示上述实施例的识别字典中的字母“t”的登录内容之一例的图。
图7(b)是表示以上述(a)的登录内容为依据的标准字符图象“t”的图。
图8(a)是表示上述实施例的识别字典中的汉字“雲”的登录内容之一例的图。
图8(b)是表示以上述(a)的登录内容为依据的标准字符图象“雲”的图。
图9(a)是表示上述实施例的识别字典中的汉字“雷”的登录内容之一例的图。
图9(b)是表示以上述(a)的登录内容为依据的标准字符图象“雷”的图。
图10(a)是表示上述实施例的识别字典中的汉字“宅”的登录内容之一例的图。
图10(b)是表示以上述(a)的登录内容为依据的标准字符图象“宅”的图。
图11(a)是表示上述实施例的识别字典中的汉字“電”的登录内容之一例的图。
图11(b)是表示以上述(a)的登录内容为依据的标准字符图象“電”的图。
图12(a)是表示上述实施例的识别字典中的汉字“竜”的登录内容之一例的图。
图12(b)是表示以上述(a)的登录内容为依据的标准字符图象“竜”的图。
图13是表示用上述实施例的图象区分割部对图1所示的识别对象字符图象“電”101进行区域分割后的状态的图。
图14是表示用上述实施例的特征量取出部取出的识别对象字符图象“電”101的特征量的图。
图15是表示用上述实施例的特征量取出部取出的图2所示的识别对象字符图象“電”201的特征量的图。
图16是表示用上述实施例的图象区分类部将由图象区分割部所分割的区域分类为周边部分的第一群和中央部分的第二群的状态的图。
图17(a)是表示由上述实施例的识别部计算的识别对象字符图象“電”101的合计街区距离近的字符的图。
图17(b)是表示由上述实施例的识别部计算的识别对象字符图象“電”201的合计街区距离近的字符的图。
图17(c)是表示将由现有的字符识别装置获得的识别对象字符图象“電”101、201的街区距离近的字符作为参考例的图。
图18是说明上述实施例的工作的流程图。
图19是本发明的字符识别装置的实施例2的结构图。
图20(a)是表示由上述实施例的候选字符识别部利用识别对象字符图象“電”101、201的第一群的特征量选出街区距离近的候选字符的图。
图20(b)是表示由上述实施例的识别部利用候选字符的识别结果选出识别对象字符图象“電”101、201的图。
图21是说明上述实施例的工作的流程图。
图22是本发明的字符识别装置的实施例3的结构图。
图23是表示上述实施例的大分类字典的登录内容之一例的图。
图24(a)是说明由上述实施例的大分类部利用识别对象字符图象“電”101、201的第一群的特征量选择类似字符单元的图。
图24(b)是表示由上述实施例的识别部选出识别对象字符图象“電”101、201字符的图。
图25是说明上述实施例的工作的流程图。
图26是本发明的字符识别装置的实施例4的结构图。
图27是说明由上述实施例的破坏程度算出部将识别对象字符图象“電”101、201分类为正常部分的第一群和破坏部分的第二群的图。
图28是表示由上述实施例的识别部选出识别对象字符图象“電”101、201字符的图。
图29是本发明的字符识别装置的实施例5的结构图。
图30(a)是表示由上述实施例的候选字符识别部利用识别对象字符图象“電”101、201的正常部分的第一群的特征量选出候选字符的图。
图30(b)是表示由上述实施例的识别部利用候选字符的识别结果选出识别对象字符图象“電”101、201字符的图。
图31是本发明的字符识别装置的实施例6的结构图。
图32(a)是表示由上述实施例的大分类部利用识别对象字符图象“电”101、201的正常部分的第一群的特征量选出类似字符单元的图。
图32(b)是表示由上述实施例的识别部选出识别对象字符图象“電”101、201字符的图。
以下,用附图说明本发明的字符识别装置的实施例。
(实施例1)
图3是本发明的字符识别装置的实施例1的结构图。
该字符识别装置备有:识别字典301;字符图象输入部302;图象区分割部303;特征量取出部304;图象区分类部305;识别部306;以及识别结果输出部307。
识别字典301对每个字符预先登录字符码和表示字符的标准字符图象的特征的标准特征量。
图4(a)是表示识别字典301中的登录内容之一例的图。登录内容401包含数字“1”的字符码402和标准特征量403。成为该标准特征量403的取出对象的数字“1”的标准的字符图象示于图4(b)。
字符图象404在纵横分别为16象素的标准的区域中,用“黑”象素表示字符要素部分,用“白”象素表示背景部分。
为了取出该字符图象404的标准特征量403,将字符图象404分割成N个区域(这里N=16)。图中如虚线所示,纵横分别等分成各“4”象素的“16”个区域。
标准特征量403是将图5所示的字符图象404的“黑”象素和“白”象素的边界点处的“黑”象素排列的图形作为特征要素,对每个被分割为与该图形一致的数的区域计数的量。特征要素“横”501用“黑”象素的横向排列的图形502、503表示。象素上带的“*”表示将字符要素部分和背景部分边界点作为目标象素。特征要素“左上”504用“黑”象素的左上方向排列的图形505、506表示。这里“◎”表示既可以是“黑”象素,也可以是“白”象素。特征要素“纵”507用“黑”象素的纵向排列的图形508、509表示。特征要素“右上”510用“黑”象素的右上方向排列的图形511、512表示。
如果在图4(b)中的区域405中计数特征要素501、504、507、510出现的数,则“横”501将“黑”象素406作为目标象素排列的图形502出现一次,将“黑”象素407作为目标象素排列的图形503出现一次,故特征要素“横”501的标准特征量为“2”。另外,如果将区域405的“白”象素408作为目标象素,则“左上”的排列图形505出现一次。因此,特征要素“左上”504的标准特征量为“1”。由于特征要素“纵”507的排列图形508、509在区域405中不出现,所以标准特征量为“0”。另外,将区域405的“白”象素409、410分别作为目标象素,排列的图形511出现两次。因此,特征要素“右上”510的标准特征量为“2”。用图4(a)中的标准特征量403的<横1><纵1>特定的(与区域405对应的)标准特征量为“2、1、0、2”。
同样,在区域411中,将“黑”象素412、413、414、415作为目标象素排列的图形502出现4次。因此特征要素“横”501的标准特征量为“4”。用图4(a)中的标准特征量403的<横1><纵2>特定的(与区域411对应的)标准特征量为“4、0、0、0”。另外,区域411的上侧416作为“白”象素计数标准特征量。
在剩余的14个区域中,也同样地计数标准特征量。
这样,标准特征量403是对被分割的“16”个区域根据“黑”象素的排列图形计数了四种特征要素“横”501、“左上”504、“纵”507、“右上”509的出现数的量,对于字符码402来说为“4×16”共64元的量。
与识别字典301的登录内容的另一例对应的标准的字符图象分别示于图6~图12。
图6(a)表示字母“i”的登录内容601,图6(b)表示其字符图象602。登录内容601与图4所示的数字“1”相同,由将字符码603和字符图象602的区域分割成“16”个获得的标准特征量604构成。
同样,图7表示字母“t”的登录内容和标准的字符图象,图8表示汉字“雲”的登录内容和标准的字符图象,图9表示汉字“雷”的登录内容和标准的字符图象,图10表示汉字“宅”的登录内容和标准的字符图象,图11表示汉字“電”的登录内容和标准的字符图象,图12表示汉字“竜”的登录内容和标准的字符图象。
字符图象输入部302有扫描器等,输入将字符要素部分作为“黑”象素、将背景部分作为“白”象素的2值图象,将识别对象的字符图象标准化为“16×16”象素。识别对象的字符图象与现有技术的说明中使用的图1、图2所示的字符图象“電”101、“電”201相同。
图象区分割部303将由字符图象输入部302输入的字符图象分割成N个区(这里N=16),即分割成纵横分别四等分的16个区域。图13表示将图1所示的字符图象101分割成16个区域的字符图象。
特征量取出部304将图5所示的特征要素即“黑”象素的排列图形“横”502、503、“左上”505、506、“纵”508、509、“右上”511、512与其目标象素(图中带符号“*”)一起存储。在由图象区分割部303分割的各区域中依次(例如按<横1><纵1>、<横1><纵2>、<横1><纵3>、…、<横4><纵3>、<横4><纵4>的顺序)将边界点上带符号“*”的象素作为目标象素,如果是与存储的“黑”象素的排列图形一致的图形,便将各自的特征量加“1”。
特征量取出部304通过这样的处理后,在16个区域中的每个区域取出4元的特征量,对于字符图象取出64元的特征量。存储所取出的特征量。
图14表示从图1所示的字符图象“電”101取出的64元的特征量。同样从图2所示的字符图象“電”201取出图15所示的64元的特征量。
图象区分类部305将由图象区分割部303分割的N个各区(N=16)分类为多个群。这里分类为第一群和第二群共两群。
图16表示字符图象101、102的各区被分类为周边部分的第一群1601和中央部分(带斜线的部分)的第二群1602的状态。
因此,在第一群1601中,分类成由图象区分割部303分割的<横1><纵1>~<纵4>、<横2><纵1>、<横2><纵4>、<横3><纵1>、<横3><纵4>、<横4><纵1>~<纵4>共12个区。在第二群1602中同样被分类为<横2><纵2>、<横2><纵3>、<横3><纵2>、<横3><纵3>共4个区。
如果各图象区的分类结束,图象区分类部305便将分类成第一群和第二群的各图象区通知给识别部306。
识别部306如果从图象区分类部305收到被分类为第一群和第二群的各图象区的通知,便对各群读出存储在特征量取出部304中的特征量,对于识别字典301中登录的全部字符码计算与对应于每个字符码的标准特征量的街区距离。
识别部306如果从图象区分类部305收到图16所示的第一群1601和第二群1602的通知,便用式(1)计算有关第一群1601的街区距离d1,用式(2)计算有关第二群1602的街区距离d2。
式中,Foi是特征量取出部304中存储的被分类为第一群的第i个特征量,Fsi是识别字典301中登录的对应的第i个标准特征量。
式中,Foj是特征量取出部304中存储的被分类为第二群的第j个特征量,Fsj是识别字典301中登录的对应的第j个标准特征量。
其次,识别部306将计算出来的字符的街区距离d1乘以α、将街区距离d2乘以β后相加,计算各字符的合计城市街区距离d。对识别字典301中存储的全部字符计算合计街区距离,合计街区距离d为最小的字符看做与识别对象的字符图象的1号相似度最大,将该字符的字符码通知识别结果输出部307。
现设α=1.0,β=0.5,计算图1所示的字符图象“電”101的合计街区距离d,其结果如图17(a)所示。因此,字符“電”的合计街区距离d为“14”,是最小的,所以字符码“4545”(参照图11)被通知给识别结果输出部307。
计算图2所示的字符图象“電”201的合计街区距离d,其结果如图17(b)所示。因此,同样字符码“4545”被通知给识别结果输出部307。即使是图2所示的被破坏的字符图象“電”201,用本装置也能正确地进行字符识别。
另外,如果表示用上述的现有的装置计算的字符图象“電”101和“電”201的街区距离,则如图17(c)所示。因此,可知对字符图象“電”201不能正确地识别。
识别结果输出部307有CRT等显示器,能显示与由识别部306通知的字符码对应的标准的字符图象。
其次,用图18所示的流程说明本实施例的工作情况。
字符图象输入部302将识别对象的字符图象作为标准化了的2值字符图象输入(S1802)。
图象区分割部303将字符图象的存在区域分割成N个区(S1804)。
特征量取出部304对被分割的每个区,从字符图象取出相当于特征要素个数的元的特征量(S1806)。
图象区分类部305将被分割的各区分类为字符图象的周边部分即第一群和中央部分即第二群(S1808)。
识别部306判断由特征量取出部304取出的各特征量是否属于周边部分的第一群(S1810)。当断定为属于周边部分时,计算识别字典301中登录的字符与标准特征量的街区距离d1,乘以系数1.0(S1812),转移到S1816。当断定为不属于周边部分时,由于是中央部分,所以计算识别字典301中登录的字符与标准特征量的街区距离d2,乘以系数0.5(S1814)。
其次,识别部306将在S1812中获得的周边部分的街区距离d1和在S1814中获得的中央部分的街区距离d2乘以0.5倍后的值相加,计算合计街区距离d,存储使用的标准特征量的字符码和合计街区距离d(S1816)。反复进行从S1810至S1816的工作,直至与识别字典301中登录的全部字符对照结束为止(S1818)。选出合计街区距离d最小的字符码作为识别对象的字符图象的字符,并通知识别结果输出部307(S1820)。
识别结果输出部307存储字符码,显示与字符码对应的标准字符图象,将处理结束。
另外,在本实施例中,不仅将第一群1601和第二群1602分类为字符图象的周边部分和中央部分,而且作为其它的分类方法,也可以在字符图象的左侧部分和右侧部分进行分类,着眼于字符结构要素的“偏”,在上侧部分和下侧部分进行分类,着眼于字符结构要素的“旁”,提高字符识别的精度。
(实施例2)
图19是本发明的字符识别装置的实施例2的结构图。该字符识别装置备有:识别字典301;字符图象输入部302;图象区分割部303;特征量取出部304;图象区分类部305;候选字符识别部1901;识别部1902;以及识别结果输出部307。另外,与上述实施例1的字符识别装置相同的构成部分标以相同的符号,其说明从略,只说明本实施例固有的构成部分。
候选字符识别部1901在由图象区分类部305将区域分类为第一群的周边部分和第二群的中央部分后,用式(1)计算第一群的周边部分的特征量和识别字典301中登录的字符与对应的标准特征量的街区距离d1。
图20(a)表示字符图象“電”101和“電”201的街区距离d1近的字符、即字符图象的周边部分的相似度高的字符。另外,在候选字符识别部1901中存储着字符码,以代替实际的字符“電”、“雷”、“雲”、…等。
如果对识别字典301中登录的全部字符进行与识别对象的字符图象的街区距离d1的计算结束,候选字符识别部1901便将街区距离d1小的例如高位的3个字符的字符码和街区距离d1通知识别部1902。
识别部1902的结构大致与上述实施例的识别部306相同,但由于在候选字符识别部1901中已进行,所以不进行街区距离d1的计算。另外,关于街区距离d2的计算也只对从候选字符识别部1901通知的字符码的字符用式(2)进行计算。将所计算的街区距离d2乘以0.5倍后与街区距离d1相加,将加得的合计街区距离d中的最小者作为识别的字符,通知识别结果输出部307。
图20(b)表示字符图象“電”101和字符图象“電”201的合计街区距离d。其结果,字符图象“電”101、201都能正确地被识别为字符“電”。
在本实施例中,利用候选字符识别部1901能缩小识别对象的字符图象的中央部分的特征量和标准特征量的街区距离d2的计算对象(从识别字典301中的全部字符缩小到例如3个字符),所以处理速度变快了。
其次,用图21中的流程说明本实施例的工作情况。另外,从S2102至S2106与实施例1的从S1802至S1806相同,所以其说明从略。在S2108中,图象区分类部305将各区域分类为第一群的周边部分和第二群的中央部分,将该分类结果通知候选字符识别部1901和识别部1902。
候选字符识别部1901用式(1)计算所通知的周边部分区域的特征量和与识别字典301中登录的字符对应的标准特征量的街区距离d1(S2110)。对识别字典301中登录的全部字符反复进行S2110的处理(S2112),选出街区距离d1小(近)的3个字符,将它们的字符码通知识别部1902(S2114)。
识别部1902用式(2)计算被分类为识别对象的字符图象的第二群的中央部分区域的特征量和从候选字符识别部1901通知的字符码的中央部区域的标准特征量的街区距离d2,并乘以系数0.5(S2116)。将从候选字符识别部1901通知的街区距离d1乘以系数1.0后的值和街区距离d2乘以系数0.5后的值相加,求出合计街区距离d(S2118)。反复进行S2116、S2118的处理,直至所通知的3个字符与标准特征量的街区距离d的计算结束为止(S2120)。识别部1902选出合计街区距离d最小的字符作为识别结果,将字符码通知识别结果输出部307(S2122),将处理结束。
(实施例3)
图22是本发明的字符识别装置的实施例3的结构图。该字符识别装置备有:识别字典301;字符图象输入部302;图象区分割部303;特征量取出部304;图象区分类部305;大分类字典2201;大分类部2202;识别部2203;以及识别结果输出部307。另外,与上述实施例1相同的构成部分标以相同的符号,其说明从略,只说明本实施例固有的构成部分。
大分类字典2201按照标准的字符形状所类似的类似字符单元将字符分群,登录类似字符单元的群标准特征量和属于类似字符单元的字符的字符码群。
图23是表示大分类字典2201的内容之一例的图。图中举例示出了类似字符单元“D1”、“D2”、“D3”。数字“1”和字母“i”、“t”被群化为类似字符单元“D1”,登录该字符码群(图中用实际的字符“1”、“i”、“t”表示,代替字符码)2301和群标准特征量2302。
汉字“雲”、“電”、“雷”被群化为类似字符单元“D2”,登录该字符码群2303和群标准特征量2304。汉字“宅”、“電”、“竜”被群化为类似字符单元“D3”,登录该字符码群2305和群标准特征量2306。
按照该类似字符单元进行的群化是对识别字典301的标准特征进行群分析,按规定的类似字符单元将字符分类成群。另外,在田中丰·胁本和昌著的“多变量统计解析法”、现代数学社出版的第230~244页中记载了有关群分析。
这里,允许按类似字符单元进行字符的重复登录。群标准特征量能用以成为群化基础的字符的标准特征量的简单平均值给出。
当然,类似字符单元的群化除了上述的方法以外,也可以将例如汉字的“偏”或“旁”相同的字群化为类似字符单元。
大分类部2202用式(1)计算由图象区分类部305分类为第一群的区域的识别对象的字符图象的特征量和与大分类字典2201中的对应的群标准特征量的街区距离d1。另外,这时的Fsi是群标准特征量。对大分类字典2201中登录的全部类似字符单元计算街区距离d1,选择街区距离d1最近(相似度高的)类似字符单元,将其字符码群通知识别部2203。
图24(a)是表示大分类部2202中的识别对象的字符图象“電”101、201的街区距离d1的计算结果的图。按照相似度高的顺序示出了类似字符单元。
按字符图象“電”101选择类似字符单元“D2”的“雲”、“電”、“雷”2303,按字符图象“電”201选择类似字符单元“D3”的“宅”、“電”、“竜”2305,并将它们的字符码通知给识别部2203。
识别部2203如果从大分类部2202收到字符码群的通知,便用式(1)计算识别对象的字符图象的第一群的周边部分的特征量和识别字典301中登录的与所通知的字符码对应的标准特征量的街区距离d1。同样用式(2)计算第二群的中央部分的特征量和对应的标准特征量的街区距离d2,并将街区距离d2乘以系数0.5。计算将街区距离d1和乘以系数0.5后的街区距离d2合计后的合计街区距离d,与字符码一起存储起来。对所通知的字符码群进行了该处理后,将合计街区距离d最小的字符码通知给识别结果输出部307。
图24(b)是表示识别部2203中的识别对象的字符图象“電”101、201的合计街区距离d的计算结果的图。字符图象“電”101、201都被识别为相似度最高的字符“電”。
在本实施例中,在识别对象的字符图象的图象区中根据更明确地反映字符形状的特征的图象区的特征量,选择被群化了的类似字符单元,缩小识别字符的候选范围,然后,根据与实施例1同样分类的图象区,对街区距离乘以不同的系数,计算相似度。因此,能大幅度地缩短与识别字典301对照的所需要的时间。
其次,用图25中的流程说明本实施例的工作情况。直至S2506与实施例1的S1806相同,其说明从略。
图象区分类部305对各区进行周边部分的第一群和中央部分的第二群的分类,将所分类的区域通知大分类部2202和识别部2203(S2508)。
大分类部2202计算识别对象的字符图象的周边部分的特征量和与大分类字典2201对应的类似字符单元的群标准特征量的街区距离d1(S2510)。反复进行S2510,直至与大分类字典2201中登录的全部类似字符单元对照为止(S2512)。
其次,大分类部2202选出街区距离d1最近的即相似度高的类似字符单元,将该类似字符单元中包含的字符的字符码群通知识别部2203(S2514)。
如果从大分类部2202通知了各字符码,识别部2203便判断识别对象的字符图象的特征量是否属于区域的周边部分(S2516),当属于周边部时,参照识别字典301,用式(1)计算特征量与所通知的字符码所对应的标准特征量的街区距离d1,将街区距离d1乘以系数1.0(S2518)。当不属于周边部的特征量时,参照识别字典301,用式(2)计算特征量与所通知的字符码所对应的标准特征量的街区距离d2,将街区距离d2乘以系数0.5(S2520)。其次求出将在S2518和S2520中获得的值合计后的合计街区距离d,与字符码一起存储起来(S2522)。反复进行从S2516至S2522的工作,进行所通知的字符码与识别字典301的对照(S2524),选出合计街区距离d最近的(相似度高的)字符码(S2526),将处理结束。
另外,在本实施例中,大分类字典2201不仅对全部图象区登录属于类似字符单元的字符群的群标准特征量,而且也可以与字符码群一起登录被分类为第一群的周边部分区域的群标准特征。
(实施例4)
图26是本发明的字符识别装置的实施例4的结构图。该字符识别装置备有:识别字典301;字符图象输入部302;图象区分割部303;特征量取出部304;破坏程度计算部2601;识别部2602;以及识别结果输出部307。与上述实施例1相同的构成部分标以相同的符号,其说明从略,只说明本实施例固有的构成部分。
破坏程度计算部2601对由图象区分割部303分割的16个区域的各区,计算字符要素部分在区域中占有的比例。具体地说,计数区域中包含的“黑”象素的个数,用区域的全部象素数“16”除该个数,并乘以“100”。将该比例小于阈值的区域看做正常部分,分类为第一群,将阈值以上的区域看做破坏部分,分类为第二群。这里,将阈值设定为“75%”。
图27表示图1、图2中的字符图象“電”101、201的由破坏程度计算部2601分类的第一群的正常部分2701和第二群的破坏部分2702。根据该图,可知在字符图象“電”201中所存在的破坏部分比字符图象“電”101中的多。
破坏程度计算部2601将分类为第一群和第二群中的各区通知给识别部2602。
如果从破坏程度计算部2601通知了第一群和第二群的区域,识别部2602便计算第一群区域的识别对象的字符图象的特征量和识别字典301中对应的标准特征量的街区距离d1,乘以系数α,并计算第二群区域的同样的特征量和识别字典301中对应的标准特征量的街区距离d2,乘以系数β。将所获得的各值相加,求出合计街区距离d。存储所求得的合计街区距离d和对应于标准特征量的字符码,对识别字典301中登录的全部字符进行该处理。
在识别对象的字符图象“電”101中由于第一群区域是13个区,所以可以用式(3)计算街区距离d1。 由于第二群区域是3个区,所以可以用式(4)计算街区距离d2。
在识别对象的字符图象“電”201中由于第一群区域是8个区,第二群区域是8个区,所以在式(3)中i变为i=1-i=32,在式(4)中j变为j=1~j=32。另外,Foi、Fsi、Foj、Fsj、i、j与实施例1的说明相同。
这里,假设α=1.0,β=0.5,如果求得字符图象“電”101、201的合计街区距离d,则识别对象的字符图象“電”101、201的合计街区距离d都为最小、即相似度最高,选择字符“電”作为识别结果,通知识别结果输出部307。
其次,说明本实施例的工作情况。
另外,本实施例的工作仅S1808~S1814(参照图18)与实施例1不同,所以只说明该部分。
在S1808中,图象区分类部305分类出预先设定的周边部分的第一群和中央部分的第二群,但在本实施例中,计算在每个由图象区分割部303分割的区域中相当于字符要素部分的“黑”象素在区域中所占的比例,如果该值小于阈值,就作为正常部分分类为第一群,如果在阈值以上,就作为破坏部分分类为第二群。
在S1810中识别部306判断识别对象的字符图象的特征量是否属于周边部分的第一群,但在本实施例中,识别部2602判断是否属于正常部分的第一群。当属于正常部分的第一群时,转移到S1812,当属于破坏部分的第二群时,转移到S1814。识别部2602在S1812、S1814中将周边部分作为正常部分,将中央部分作为破坏部分,计算街区距离d1、d2,分别对d1、d2乘以系数1.0、0.5。
这样,在本实施例中,由于将对应于从字符图象输入部302输入的识别对象的字符图象分割的区域分类为第一群和第二群,所以通过分类为预先设定的各群,也能提高识别精度。
(实施例5)
图29是本发明的字符识别装置的实施例5的结构图。该字符识别装置备有:识别字典301;字符图象输入部302;图象区分割部303;特征量取出部304;破坏程度计算部2601;候选字符识别部2901;识别部2902;以及识别结果输出部307。另外,与上述实施例1及实施例4相同的构成部分标以相同的符号,其说明从略。另外,本实施例的候选字符识别部2901和识别部2902与上述实施例2的候选字符识别部1901和识别部1902的结构大致相同,但由于图象区分类部305和破坏程度计算部2601的不同,所以有些不同。
破坏程度计算部2601判断识别对象的字符图象的各区域的字符要素部分的比例是否小于阈值、例如是否小于75%,将小于阈值的区域作为第一群的正常部分,通知候选字符识别部2901,将阈值以上的区域作为第二群的破坏部分,通知识别部2902。候选字符识别部2901从特征量取出部304读出从破坏程度计算部2601通知的被分类为第一群的正常部分的特征量,计算与识别字典301中登录的对应的标准特征量的街区距离d1。
现在,识别对象的字符图象“電”101、201的各区如图27所示,被分类为第一群和第二群时,用式(3)计算第一群的正常部分的特征量和识别字典301中的对应的标准特征量的街区距离d1。如果对识别字典301中的全部字符求得街区距离d1,则变为图30(a)所示。将街区距离d1近的即相似度高的高位3个字符的字符码和街区距离d1作为一组,通知识别部2902。
识别部2902用式(4)计算被分类为第二群的特征量和识别字典301中登录的与通知的字符码对应的标准特征量的街区距离d2。
识别部2902将街区距离d1乘以系数α后的值和计算的街区距离d2乘以系数β后的值相加,求出合计街区距离d。当α=1.0、β=0.5时,识别对象的字符图象“電”101、201的合计街区距离d如图30(b)所示。其结果,将相似度最大的字符“電”的字符码通知识别结果输出部307。
本实施例的工作只与实施例2的工作情况有少许不同,所以参照图21简单地说明不同的部分。
在S2108中破坏程度计算部2601将区域分类为正常部分的第一群和破坏部分的第二群。在S2110中候选字符识别部2901用第一群的特征量求街区距离d1。因此,在S2114中将与识别字典301中的标准特征量的街区距离d2的计算对象缩小为3个字符。
(实施例6)
图31是本发明的字符识别装置的实施例6的结构图。该字符识别装置备有:识别字典301;字符图象输入部302;图象区分割部303;特征量取出部304;破坏程度计算部2601;大分类字典2201;大分类部3101;识别部3102;以及识别结果输出部307。
与实施例1、实施例3及实施例4相同的构成部分标以相同的符号,其说明从略。
大分类部3101计算从破坏程度计算部2601通知的被分类为第一群的区域的特征量和大分类字典2201中登录的对应的群标准特征量的街区距离d1。对大分类字典2201中登录的全部类似字符单元求出街区距离d1,选择最类似的类似字符单元,将类似字符单元中包含的字符的字符码通知识别部3102。
现在,如图27所示,在区域被分类为第一群的正常部分2701和第二群的破坏部分2702的情况下,大分类部3101与实施例4相同,用式(3)等计算街区距离d1。这时,Fsi是大分类字典2201中的群标准特征量。
图32(a)分别示出识别对象的字符图象“電”101、201的街区距离d1。最类似的类似字符单元在“電”101的情况下为“D2”,在“電”201的情况下为“D3”。
如果从大分类部3101通知了字符码群,且当识别对象的字符图象的特征量是被分类为第一群的特征量时,识别部3102用式(3)等计算识别字典301中通知的字符码与对应的标准特征量的街区距离d1。当识别对象的字符图象的特征量是被分类为第二群的特征量时,用式(4)等计算该特征量和识别字典301中的对应的标准特征量的街区距离d2。将所获得的街区距离d1、d2分别乘以系数α、β,求出合计街区距离d。只对所通知的字符码群的字符进行该处理。将合计街区距离d最小的字符的字符码通知识别结果输出部307。
将系数α、β分别设定为1.0、0.5时的识别对象的字符图象“電”101、201的合计街区距离示于图32(b)。识别结果都是字符“電”。
通过这样计算与大分类字典2201中的群标准特征量的街区距离d1,能缩小用识别字典301求合计街区距离d的处理对象,能谋求提高识别精度和缩短识别处理所需要的时间。
其次,用实施例3的流程(图25)简单地说明本实施例的工作情况。
转移到S2508,破坏程度计算部2601将由图象区分割部303分割的各区域分类为正常部分的第一群和破坏部分的第二群。在S2510中,大分类部3101计算识别对象的字符图象的第一群的特征量和大分类字典2201中的群标准特征量的街区距离d1。
在S2516中识别部3102判断特征量是否属于第一群的正常部分,以下进行与实施例3同样的处理。
另外,在上述实施例1~6中,使识别字典301中登录的标准的标准化了的字符图象为16×16象素,当然其它尺寸也可以,在此情况下,使由字符图象输入部302输入的识别对象的字符图象为同一尺寸即可。
另外,将标准的字符图象的区域分割成纵横各4象素的16等分,当然也可以按纵横各不相同的象素进行分割,分割成“p×q”。在此情况下,由图象区分割部303将识别对象的字符图象也同样分割成“p×q”即可。
另外,图象区分割部303将标准化了的识别对象的字符图象分割成了各个区,而不用字符图象输入部302将字符图象标准化,图象区分割部按照重心或等间距将输入的识别对象的字符图象分割成“p×q”的区,特征量取出部计数每个区中特征要素的个数,用各区域的面积或长度等区域尺寸将特征要素的个数标准化后作为特征量即可。在此情况下,将用同样的方法取出的标准字符图象的标准特征量登录在识别字典中。
另外,在上述实施例中,将区域分类为第一群和第二群的二群,将表示相似度的街区距离乘以两种系数,将权重加到相似度上,然而作为其它实施例,也可以分类为3群以上,分别将它们的街区距离乘以不同的系数,更能提高字符识别的精度。
另外,在上述实施例中,在求相似度时使用了街区距离,但不受此限,也可以使用欧几里德距离或马哈赖诺毕斯距离。
另外,在上述实施例1~6中,将其结构分别示于图3、图19、图22、图26、图29、图31中,然而作为本发明的其它实施例,也可以将能发挥各图所示的结构要素的功能的程序记录在计算机能读取的记录媒体上,装入没有这样的功能的字符识别装置中读入程序,就能发挥与本发明同样的效果。
虽然对本发明已参照附图、并结合实施例进行了说明,但应注意到对于本技术领域的技术人员来说,各种变形和改进将是显而易见的。
因此,只要这些变形和改进不超出本发明的范围,它们都应包括在本发明的构成中。
Claims (20)
1.一种将识别对象字符图象作为字符码进行识别的字符识别装置,其特征在于包括:
·识别字典,
它将字符的标准图象分割成N(N≥2)个部分图象区,并将各部分图象区中包含的部分字符图象的标准特征按字符单元与字符码一起预先登录;
·图象区分割装置,
它将识别对象字符图象分割成N个部分图象区;
·特征取出装置,
它取出由上述图象区分割装置分割成的部分图象区中包含的部分字符图象的特征;
·部分图象区分类装置,
它将由上述图象区分割装置分割成的部分图象区分类为多个群;
·相似度计算装置,
它对每个群计算上述识别对象字符图象的部分字符图象的特征和上述识别字典对应的标准特征的素相似度,对各群的素相似度进行规定的加权,计算识别对象字符图象和上述识别字典中的字符的相似度;以及
·识别字符选出装置,
它将上述相似度最高的字符作为识别字符,并选出其字符码。
2.根据权利要求1所述的字符识别装置,其特征在于:
上述部分图象区分类装置包括
·周边·中央分类部,
它将上述部分图象区分类为识别对象字符图象的周边部分的第一群和中央部分的第二群,
上述相似度计算装置包括
·素相似度计算部,
它分别计算上述第一群和第二群的素相似度,素相似度是上述部分字符图象的特征和上述识别字典中对应的标准特征的街区距离、欧几里德距离或马哈赖诺毕斯距离;以及
·相似度合计部,
它将第一群和第二群的素相似度分别乘以规定的系数后进行合计,以便对上述第一群的相似度的贡献比对第二群的相似度的贡献大。
3.根据权利要求2所述的字符识别装置,其特征在于:
由上述相似度合计部所乘的系数,对于第一群的素相似度来说为1.0,对于第二群的素相似度来说为0.5,
上述识别字符选出装置能选出相似度最小的值的字符作为相似度最大的字符。
4.根据权利要求1所述的字符识别装置,其特征在于:
上述部分图象区分类装置包括
·周边·中央分类部,
它将上述部分图象区分类为识别对象字符图象的周边部分的第一群和中央部分的第二群,
上述相似度计算装置包括
·候选字符选出部,
它计算上述第一群的素相似度,从上述识别字典选出素相似度的高位的字符群作为候选字符,这里素相似度是上述部分字符图象的特征和上述识别字典中对应的标准特征的街区距离、欧几里德距离或马哈赖诺毕斯距离;
·第二群素相似度计算部,
它对由上述候选字符选出部选出的候选字符计算第二群的素相似度;以及
·相似度合计部,
它将第一群和第二群的素相似度分别乘以规定的系数后进行合计,以便对上述第一群的相似度的贡献比对第二群的相似度的贡献大。
5.根据权利要求4所述的字符识别装置,其特征在于:
由上述相似度合计部所乘的系数,对于第一群的素相似度来说为1.0,对于第二群的素相似度来说为0.5,
上述识别字符选出装置能选出相似度最小的值的字符作为相似度最大的字符。
6.根据权利要求1所述的字符识别装置,其特征在于还包括:
·字符群分类字典,
它将形状类似的字符的标准图象群分割成N(N≥2)个部分图象区,并将各部分图象区中包含的部分字符图象的字符群标准特征与类似字符单元的字符码群一起预先登录,
上述部分图象区分类装置包括
·周边·中央分类部,
它将上述部分图象区分类为识别对象字符图象的周边部分的第一群和中央部分的第二群,
字符识别装置还包括
·字符群选出装置,
它计算上述被分成第一群的识别对象字符图象的部分字符图象的特征和被登录在上述字符群分类字典中的对应的字符群标准特征的相似度,并选出相似度大的字符群的字符码,
上述相似度计算装置只在由上述字符群选出装置选出的与字符码对应的上述识别字典中登录的标准特征之间计算与识别对象的部分字符图象的特征的相似度,
上述相似度计算装置包括
·素相似度计算部,
它分别计算上述第一群和第二群的素相似度,素相似度是上述部分字符图象的特征和上述识别字典中对应的标准特征的街区距离、欧几里德距离或马哈赖诺毕斯距离;以及
·相似度合计部,
它将第一群和第二群的素相似度分别乘以规定的系数后进行合计,以便对上述第一群的相似度的贡献比对第二群的相似度的贡献大。
7.根据权利要求6所述的字符识别装置,其特征在于:
由上述相似度合计部所乘的系数,对于第一群的素相似度来说为1.0,对于第二群的素相似度来说为0.5,
上述识别字符选出装置能选出相似度最小的值的字符作为相似度最大的字符。
8.根据权利要求1所述的字符识别装置,其特征在于:
上述部分图象区分类装置包括
·部分字符图象比率计算部,
它对各部分图象区计算部分字符图象在上述部分图象区中占有的比率;以及
·正常·破坏部分判断部,
它判断上述部分字符图象的比率是小于阈值还是在阈值以上、将上述部分图象区分类为正常部分的第一群和破坏部分的第二群。
9.根据权利要求8所述的字符识别装置,其特征在于:
上述相似度计算装置包括
·素相似度计算部,
它分别计算上述第一群和第二群的素相似度,素相似度是上述部分字符图象的特征和上述识别字典中对应的标准特征的街区距离、欧几里德距离或马哈赖诺毕斯距离;以及
·相似度合计部,
它将第一群和第二群的素相似度分别乘以规定的系数后进行合计,以便对上述第一群的相似度的贡献比对第二群的相似度的贡献大。
10.根据权利要求9所述的字符识别装置,其特征在于:
由上述相似度合计部所乘的系数,对于第一群的素相似度来说为1.0,对于第二群的素相似度来说为0.5,
上述识别字符选出装置能选出相似度最小的值的字符作为相似度最大的字符。
11.根据权利要求8所述的字符识别装置,其特征在于:
上述相似度计算装置包括
·候选字符选出部,
它计算上述第一群的素相似度,从上述识别字典中选出素相似度的高位的字符群作为候选字符,这里素相似度是上述部分字符图象的特征和上述识别字典中对应的标准特征的街区距离、欧几里德距离或马哈赖诺毕斯距离;
·第二群素相似度计算部,
它对由上述候选字符选出部选出的候选字符计算第二群的素相似度;以及
·相似度合计部,
它将第一群和第二群的素相似度分别乘以规定的系数后进行合计,以便对上述第一群的相似度的贡献比对第二群的相似度的贡献大。
12.根据权利要求11所述的字符识别装置,其特征在于:
由上述相似度合计部所乘的系数,对于第一群的素相似度来说为1.0,对于第二群的素相似度来说为0.5,
上述识别字符选出装置能选出相似度最小的值的字符作为相似度最大的字符。
13.根据权利要求8所述的字符识别装置,其特征在于还包括:
·字符群分类字典,
它将形状类似的字符的标准图象群分割成N(N≥2)个部分图象区,并将各部分图象区中包含的部分字符图象的字符群标准特征与类似字符单元的字符码群一起预先登录;
·字符群选出装置,
它计算上述被分成第一群的识别对象字符图象的部分字符图象的特征和被登录在上述字符群分类字典中的对应的字符群标准特征的相似度,并选出相似度大的字符群的字符码,
上述相似度计算装置只在与对应于由上述字符群选出装置选出的字符码的并登录在上述识别字典中的标准特征之间,计算与识别对象的部分字符图象的特征的相似度;
上述相似度计算装置包括
·素相似度计算部,
它分别计算上述第一群和第二群的素相似度,素相似度是上述部分字符图象的特征和上述识别字典中对应的标准特征的街区距离、欧几里德距离或马哈赖诺毕斯距离;
·相似度合计部,
它将第一群和第二群的素相似度分别乘以规定的系数后进行合计,以便对上述第一群的相似度的贡献比对第二群的相似度的贡献大。
14.根据权利要求13所述的字符识别装置,其特征在于:
由上述相似度合计部所乘的系数,对于第一群的素相似度来说为1.0,对于第二群的素相似度来说为0.5,
上述识别字符选出装置能选出相似度最小的值的字符作为相似度最大的字符。
15.根据权利要求8所述的字符识别装置,其特征在于:
上述阈值为75%。
16.一种将识别对象字符图象作为字符码进行识别的字符识别方法,其特征在于包括以下步骤:
·图象区分割步骤,
将识别对象字符图象分割成N(N≥2)个部分图象区;
·特征取出步骤,
取出上述部分图象区中包含的部分字符图象的特征;
·部分图象区分类步骤,
将上述部分图象区分类为多个群;
·相似度计算步骤,
对每个群计算上述识别对象字符图象的部分字符图象的特征、与将字符的标准图象分割成N个部分图象区并将各部分图象区中包含的部分字符图象的标准特征按字符单元与字符码一起预先登录的识别字典中对应的标准特征的素相似度,将规定的权重加在各群的素相似度上,计算识别对象字符图象与上述识别字典中的字符的相似度;以及
·识别字符选出步骤,
将上述相似度最高的字符作为识别字符,并选出其字符码。
17.根据权利要求16所述的字符识别方法,其特征在于:
上述部分图象区分类步骤包括以下子步骤:
·周边·中央分类子步骤,
将上述部分图象区分类为识别对象字符图象的周边部分的第一群和中央部分的第二群,
上述相似度计算步骤包括以下子步骤:
·素相似度计算子步骤,
分别计算上述第一群和第二群的素相似度,素相似度是上述部分字符图象的特征和上述识别字典中对应的标准特征的街区距离、欧几里德距离或马哈赖诺毕斯距离;
·相似度合计子步骤,
将第一群和第二群的素相似度分别乘以规定的系数后进行合计,以便对上述第一群的相似度的贡献比对第二群的相似度的贡献大。
18.根据权利要求16所述的字符识别方法,其特征在于:
上述部分图象区分类步骤包括以下子步骤:
·部分字符图象比率计算子步骤,
对各部分图象区计算部分字符图象在上述部分图象区中占有的比率;
·正常·破坏部分判断子步骤,
判断上述部分字符图象的比率是小于阈值还是在阈值以上、将上述部分图象区分类为正常部分的第一群和破坏部分的第二群。
19.一种计算机能读取的记录媒体,将字符的标准图象分割成N(N≥2)个部分图象区,记录将各部分图象区中包含的部分字符图象的标准特征按字符单元与字符码一起预先登录的识别字典,能记录具有以下步骤的程序:
·图象区分割步骤,
将识别对象字符图象分割成N个部分图象区;
·特征取出步骤,
取出在上述图象区分割步骤中分割的部分图象区中包含的部分字符图象的特征;
·部分图象区分类步骤,
将在上述图象区分割步骤中分割的部分图象区分类为多个群;
·相似度计算步骤,
对每个群计算上述识别对象字符图象的部分字符图象的特征和上述识别字典中对应的标准特征的素相似度,将规定的权重加在各群的素相似度上,计算识别对象字符图象和上述识别字典中的字符的相似度;
·识别字符选出步骤,
将上述相似度最高的字符作为识别字符,并选出其字符码。
20.根据权利要求19所述的计算机可读取的记录媒体,其特征在于:
上述部分图象区分类步骤包括以下子步骤:
·部分字符图象比率计算子步骤,
对各部分图象区计算部分字符图象在上述部分图象区中占有的比率;
·正常·破坏部分判断子步骤,
判断上述部分字符图象的比率是小于阈值还是在阈值以上、将上述部分图象区分类为正常部分的第一群和破坏部分的第二群。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP35046097 | 1997-12-19 | ||
JP350460/97 | 1997-12-19 | ||
JP350460/1997 | 1997-12-19 | ||
JP336918/1998 | 1998-11-27 | ||
JP336918/98 | 1998-11-27 | ||
JP10336918A JPH11238099A (ja) | 1997-12-19 | 1998-11-27 | 文字認識装置及びその方法並びに文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1221927A true CN1221927A (zh) | 1999-07-07 |
CN1153168C CN1153168C (zh) | 2004-06-09 |
Family
ID=26575617
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB981254365A Expired - Lifetime CN1153168C (zh) | 1997-12-19 | 1998-12-18 | 字符识别装置及其方法 |
Country Status (4)
Country | Link |
---|---|
JP (1) | JPH11238099A (zh) |
KR (1) | KR100498683B1 (zh) |
CN (1) | CN1153168C (zh) |
TW (1) | TW406246B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100351849C (zh) * | 2004-08-25 | 2007-11-28 | 富士施乐株式会社 | 字符识别装置和字符识别方法 |
CN100535931C (zh) * | 2006-09-06 | 2009-09-02 | 中国科学院自动化研究所 | 一种多分辨率退化字符自适应识别系统及方法 |
CN101944174B (zh) * | 2009-07-08 | 2012-06-27 | 西安电子科技大学 | 车牌字符的识别方法 |
CN101419673B (zh) * | 2004-04-12 | 2012-10-24 | 富士施乐株式会社 | 图像词典生成装置及方法 |
CN109753967A (zh) * | 2018-12-29 | 2019-05-14 | 北京师范大学 | 一种图片文字识别方法 |
CN109871847A (zh) * | 2019-03-13 | 2019-06-11 | 厦门商集网络科技有限责任公司 | 一种ocr识别方法及终端 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100655916B1 (ko) * | 2004-07-19 | 2006-12-08 | 한국과학기술원 | 방대한 데이터의 디지털화를 위한 문서영상처리 및검증시스템 및 그 방법 |
US7844114B2 (en) * | 2005-12-12 | 2010-11-30 | Microsoft Corporation | Logical structure layout identification and classification for offline character recognition |
JP4872930B2 (ja) * | 2008-01-21 | 2012-02-08 | 株式会社デンソー | 文字認識装置、そのような装置を備えた燃料ポンプモジュールの組み付け装置及び文字認識方法 |
JP2010286353A (ja) * | 2009-06-11 | 2010-12-24 | Ricoh Elemex Corp | 画像検査装置、画像検査方法およびプログラム |
JP6327963B2 (ja) * | 2014-06-09 | 2018-05-23 | 株式会社日立情報通信エンジニアリング | 文字認識装置及び文字認識方法 |
CN108564079B (zh) * | 2018-05-08 | 2022-07-19 | 东华大学 | 一种便携式字符识别装置及方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05108882A (ja) * | 1991-10-17 | 1993-04-30 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JP3623992B2 (ja) * | 1994-10-28 | 2005-02-23 | キヤノン株式会社 | 文字認識装置及び方法 |
JPH09102014A (ja) * | 1995-10-05 | 1997-04-15 | Ricoh Co Ltd | 文字認識方法 |
KR100214680B1 (ko) * | 1997-01-15 | 1999-08-02 | 이종수 | 문자 인식방법 |
-
1998
- 1998-11-27 JP JP10336918A patent/JPH11238099A/ja not_active Withdrawn
- 1998-12-17 TW TW087121078A patent/TW406246B/zh not_active IP Right Cessation
- 1998-12-18 CN CNB981254365A patent/CN1153168C/zh not_active Expired - Lifetime
- 1998-12-18 KR KR10-1998-0056074A patent/KR100498683B1/ko not_active IP Right Cessation
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101419673B (zh) * | 2004-04-12 | 2012-10-24 | 富士施乐株式会社 | 图像词典生成装置及方法 |
CN100351849C (zh) * | 2004-08-25 | 2007-11-28 | 富士施乐株式会社 | 字符识别装置和字符识别方法 |
CN100535931C (zh) * | 2006-09-06 | 2009-09-02 | 中国科学院自动化研究所 | 一种多分辨率退化字符自适应识别系统及方法 |
CN101944174B (zh) * | 2009-07-08 | 2012-06-27 | 西安电子科技大学 | 车牌字符的识别方法 |
CN109753967A (zh) * | 2018-12-29 | 2019-05-14 | 北京师范大学 | 一种图片文字识别方法 |
CN109871847A (zh) * | 2019-03-13 | 2019-06-11 | 厦门商集网络科技有限责任公司 | 一种ocr识别方法及终端 |
CN109871847B (zh) * | 2019-03-13 | 2022-09-30 | 厦门商集网络科技有限责任公司 | 一种ocr识别方法及终端 |
Also Published As
Publication number | Publication date |
---|---|
KR100498683B1 (ko) | 2005-09-09 |
TW406246B (en) | 2000-09-21 |
JPH11238099A (ja) | 1999-08-31 |
KR19990063196A (ko) | 1999-07-26 |
CN1153168C (zh) | 2004-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1153168C (zh) | 字符识别装置及其方法 | |
CN1140878C (zh) | 字符识别方法,修正方法及字符识别装置 | |
CN1184796C (zh) | 图象处理方法和设备以及图象处理系统 | |
CN1320485C (zh) | 图像检索装置和图像检索装置的关键词赋予方法 | |
CN1574269A (zh) | 不合格检测方法和不合格检测装置 | |
CN1599913A (zh) | 虹膜识别系统和方法以及具有其程序的存储介质 | |
CN1220434A (zh) | 字符串提取设备和模式提取设备 | |
CN1311394C (zh) | 用于二进制化图像的设备和方法 | |
CN1415103A (zh) | 多分辨率标签定位器 | |
CN1585455A (zh) | 禁止复制防拷贝文档的方法、程序、装置及存储介质 | |
CN1684492A (zh) | 图像词典作成装置、编码装置、图像词典作成方法 | |
CN1658227A (zh) | 检测视频文本的方法和装置 | |
CN101069190A (zh) | 具有混合型单色和彩色图像传感器阵列的数字图像获取光学阅读器 | |
CN101059814A (zh) | 图像处理设备与图像处理方法 | |
CN1945559A (zh) | 导入网屏编码的印刷介质多媒体系统实现方法 | |
CN1197244A (zh) | 利用统计检验的数据隐藏方法和数据提取方法 | |
CN1162795A (zh) | 模式识别设备与方法 | |
CN1735907A (zh) | 图像分析 | |
CN101030257A (zh) | 基于汉字特征的文档图像分割方法 | |
CN1969314A (zh) | 图像处理设备和方法、存储介质及其程序 | |
CN1551017A (zh) | 图像检索装置、方法、程序及存储有该程序的存储介质 | |
CN1525733A (zh) | 图像数据中具有不同特征的区域之间的边界检测方法 | |
CN101067844A (zh) | 二维条形码、信息处理设备、信息处理方法和程序 | |
CN1913573A (zh) | 用于图像检索的图像处理设备及其控制方法 | |
CN1882026A (zh) | 信息埋入网屏编码的生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term |
Granted publication date: 20040609 |
|
CX01 | Expiry of patent term |