CN1269069C - 字符识别装置及方法 - Google Patents
字符识别装置及方法 Download PDFInfo
- Publication number
- CN1269069C CN1269069C CNB031474187A CN03147418A CN1269069C CN 1269069 C CN1269069 C CN 1269069C CN B031474187 A CNB031474187 A CN B031474187A CN 03147418 A CN03147418 A CN 03147418A CN 1269069 C CN1269069 C CN 1269069C
- Authority
- CN
- China
- Prior art keywords
- character
- mentioned
- recognition
- recognition device
- identification range
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
- G06V30/2445—Alphabet recognition, e.g. Latin, Kanji or Katakana
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Discrimination (AREA)
Abstract
本发明用于提高对包含多种语言的文章图像的字符识别精度。根据使用第一识别单元进行识别的结果,设定再识别范围,通过第二识别单元再度进行字符识别。当进行再识别的结果是:得到了高于由第一识别单元所进行的识别的类似度时,对该再识别范围,用由第二识别单元所产生的识别结果来置换由第一识别单元所产生的识别结果。
Description
技术领域
本发明涉及光学地读取原稿并识别字符的字符识别,特别是,涉及能够实现包含英语单词的日本语文章等包含多种语言的文章图像的字符识别的字符识别技术。
背景技术
在光学字符识别装置(OCR装置)中,通过浓度投影(histogram)来进行字符行的剪切(字符行的提取),进而进行一个字符单位的字符块剪切(字符图像的提取)。在剪切字符块时,在字符行方向上取得浓度投影,并根据浓度投影的变化来分离字符行。接着,对于各个字符行,通过取得垂直于字符行的方向上的浓度投影,来提取出各个字符块。而且,对于一个字符被分离成多个字符块的情况,根据标准的字符尺寸和字符间距的估计值以及与行垂直的方向上的浓度投影值等信息,组合这些字符块,以生成作为一个字符单位的字符图像的最终字符块。如果这样的字符剪切、字符块生成被正确执行,就能实现高精度的字符识别。
但是,在第一语言中包含第二语言的文章中,就存在不能进行正确的字符块生成的情况。例如,在包含英语单词的日语文章中,特别是在英语单词成比例地出现在日语文章中,由于英语单词部分的字符宽度和字符间距是不均匀的,并且与标准字符间距的估计值存在较大的差异,因此,存在错误地进行字符块的提取,从而识别精度降低的情况。
对于混杂了英语单词的日语文章,为了得到较高的识别精度,例如,提出了日本专利公开公报特开平5-101220号、特开平9-167206号、特开平6-301822号中记载的方法。
(1)特开平5-101220号(称为现有技术1)
把小于估计字符尺寸的字符作为半角候选字符,在半角候选字符连续存在并且半角候选字符串的前或后存在预定长度以上的空白空间的情况下,把其作为英语单词候选。通过把相邻的一对半角候选字符的尺寸与阈值进行比较,在英语单词候选中包含被判断为不是英文字符的半角候选字符的情况下,从英语单词候选中排除该字符。最终被判断为英语单词候选的半角候选字符作为半角英文字符,从文章图像中被图像剪切,另一方面,被判断为不是英语单词候选的半角候选字符与相邻的半角候选字符再次组合,并剪切掉组合后的字符。
(2)特开平9-167206号(称为现有技术2)
一旦进行了整个文章图像的字符识别,从识别结果中提取出字母数字字符串,对于每个字母数字字符串判定间距格式,根据该间距格式来使用均衡间距用空格检测处理或者固定间距用空格检测处理,从而高精度地检测间隔。
(3)特开平6-301822号(称为现有技术3)
根据空白字符、标点符号、括弧等分隔符的位置,决定作为单词的字符串的对照范围,并执行与单词词典进行对照的后处理。
但是,在现有技术1中,字符块提取处理是根据相邻的一对半角候选字符的尺寸,通过判断是否是英语单词候选来确定剪切位置,例如,在均衡间距的英语单词等的一部分字符间存在接触的情况下,不能分离出英语单词候选的各个字符,从而不能正确地识别英语单词候选。此外,还不能进行再次识别。
现有技术2判断被识别为字母数字字符的部分是否均衡。在错误进行字符识别处理的情况下,对于未被识别为字母数字字符的部分,不进行是否为均衡的判断。而且,还不能进行再次识别。
在现有技术3中,由于使用分隔符来提取单词,因此,在未能识别出分隔符的情况下,不能进行单词对照。
发明内容
根据本发明的一个方面,提供一种字符识别装置,包括:适用于对以第一语言书写的字符图像进行字符识别的第一识别装置;适用于对以第二语言书写的字符图像进行字符识别的第二识别装置;以及再识别范围设定装置,用于针对使用上述第一识别装置对文章图像中包含的多个字符图像进行字符识别的结果,根据由上述第一识别装置识别为上述第二语言的字符图像和对与被识别为上述第二语言的该字符图像相邻的一个字符图像进行识别的识别结果,来设定使用上述第二识别装置进行再识别的再识别范围。
在上述方案中,上述识别结果选择装置在上述第二识别装置对上述再识别范围内的字符的识别结果中的类似度平均值小于或等于预定值时,选择上述第一识别装置的识别结果,当上述类似度平均值大于预定值时,选择上述第二识别装置的识别结果。
在上述方案中,上述识别结果选择装置比较上述第一识别装置对再识别范围内的字符的识别结果中的类似度平均值和上述第二识别装置对该字符的识别结果中的类似度平均值,当由上述第一识别装置所产生的类似度平均值大于或等于由上述第二识别装置所产生的类似度平均值时,选择由上述第一识别装置所产生的识别结果,当由上述第二识别装置所产生的类似度平均值大于由上述第一识别装置所产生的类似度平均值时,选择由上述第二识别装置所产生的识别结果。
在上述方案中,字符识别装置进一步包括:接收装置,用于通过网络从外部装置接收上述文章图像;发送装置,用于将使用上述第一识别装置、上述第二识别装置和上述再识别范围设定装置进行字符识别的结果发送给上述外部装置。
根据本发明的另一个方面,提供一种字符识别方法,包括以下步骤:使用适用于对以第一语言书写的字符图像进行字符识别的第一识别过程,对文章图像中包含的多个字符图像进行字符识别;根据在上述第一识别过程中被识别为第二语言的字符图像和对与上述被识别为第二语言的该字符图像相邻的字符图像进行识别的识别结果,设定使用适用于对以上述第二语言书写的字符图像进行字符识别的第二识别过程来进行再识别的再识别范围;以及使用上述第二识别过程对所设定的上述再识别范围再次进行字符识别。
根据本发明的另一个方面,提供一种用于字符识别的可编程计算机,包括:一个存储器,具有至少一个用于存储计算机可执行程序代码的区域;一个处理器,用于执行存储在所述存储器中的程序代码,其中,所述处理器包括:用于使用适用于对以笫一语言书写的字符图像进行字符识别的第一识别过程,对文章图像中包含的多个字符图像进行字符识别的装置;用于根据由上述第一识别装置识别为第二语言的字符图像和对与被识别为上述第二语言的该字符图像相邻的字符图像进行识别的识别结果,设定使用适用于对以上述第二语言书写的字符图像进行字符识别的第二识别过程来进行再识别的再识别范围的装置;以及用于使用上述第二识别过程对所设定的上述再识别范围再次进行字符识别的装置。
本发明的这些和其他的目的、优点及特征将通过结合附图对本发明的实施例的描述而得到进一步说明。
附图说明
在此被引为说明书一部分的说明书附图与说明书相结合,对本发明的实施例进行说明以进一步解释本发明主旨。
图1是表示本发明的一个实施例中的字符识别装置的方框图;
图2是表示本发明的一个实施例中的字符识别方法的流程图;
图3是表示图2的步骤S203中的处理的流程图;
图4是表示本发明的第二实施例中的字符识别方法的流程图;
图5是表示图4的步骤S406中的处理例子的流程图;
图6是表示图4的步骤S409中的处理例子的流程图;
图7是表示替换图5、图6的处理的例子的流程图;
图8是存储由图1的字符识别装置所执行的各种数据处理程序的存储媒体的存储器分配图的例子;
图9是表示由多个设备执行本发明所涉及的字符识别方法的字符识别系统的构成例子的方框图。
具体实施方式
下面参照附图来对本发明的最佳实施例进行详细说明。
[字符识别装置]
图1是表示依据本发明一个实施例的光学字符识别装置(OCR装置)等字符识别装置的方框图。
字符识别装置包括磁盘等外部存储装置104和图形扫描仪108,从外部存储装置104读入原稿图像数据或者直接通过图形扫描仪108读取原稿。字符识别装置包括用于整体控制的CPU 101,CPU 101的控制程序存储在ROM 102中。从图形扫描仪108输入的图像被保持在RAM 103中,通过ROM 102内的控制程序来执行用于字符识别的处理。用于字符识别的识别词典与控制程序一起存储在ROM102中,或者,对于每种需要的字符类型,从外部存储装置104读入到RAM 103中。
当控制程序对应于多种语言例如日语、英语时,可以充当适合于各种语言的第一识别单元、第二识别单元。
根据需要,在字符识别之前,执行去除噪声等的预处理。
在图1中,105是显示器,106是键盘,107是鼠标器等指示设备。而且,109是网络接口,用于与未图示的远程装置进行通信,能够发送接收程序、识别词典、数据等。
下面说明在字符识别装置中所执行的字符识别方法。
[字符识别方法]
图2、图3是表示图1所示的字符识别装置执行的字符识别方法的第一实施例的流程图。
在第一实施例中,执行由适合于日语识别的第一字符识别单元所进行的字符识别,对于识别结果中类似度低的字符等,执行由适合于英语识别的第二字符识别单元所进行的再识别。
图2的流程图表示第一实施例的整体流程。
步骤S201:首先,输入由图形扫描仪108读取的图像或者存储在外部存储装置104中的图像,前进到步骤S202。
步骤S202:由日语用第一识别单元对所输入的图像进行字符识别。在此进行的字符块提取使用适合于提取日语字符的字符提取方法。在进行字符识别时,如在现有技术中所述的那样,通过在行方向上取投影、提取行、对各个行在与行垂直的方向上取投影,提取出字符块,使用所提取出的字符块,估计字符宽度和字符间距。对于一个字符分离成多个块的情况,使用估计的字符宽度和字符间距进行组合以形成一个字符。然后,对每个字符进行特征提取,与预先准备的各字符类型的参照数据进行比较,把类似度最好的字符类型作为该字符的识别结果。在由第一识别单元所进行的日语用字符识别中,通过假定字符间距的变动较少并且字符的纵横比大致为正方形,来提取字符块。虽然在第一识别单元中,能够识别在日语中常用的标准字体的字母,但是,不能对应的字体也很多。在对图像中所有字符的字符识别结束后,前进到步骤S203。
步骤S203:对于步骤S202的识别结果,提取出各行中包含类似度低的字符的图像区域作为再识别范围。对于再识别范围提取处理的内容将在后面描述。再识别范围是一行以内的图像区域或者涉及多行的图像区域。
步骤S204:在步骤S203中,判断是否提取出一个以上再识别范围,如果是,则前进到步骤S205。否则,就此结束处理。
步骤S205:对于再识别范围,通过英语用第二识别单元进行字符识别。当再识别范围涉及多行时,与第一识别单元同样地提取行,然后提取字符块,并以字符单位为单位地检查类似度。当再识别范围是一行内的图像区域时,从该图像区域提取字符块,以字符单位为单位地分析类似度。在此进行的字符块提取使用适合于提取英文字符的字符提取方法。
在英语单词中,存在字符与字符接触和重叠(字距紧缩)的情况。因此,与第一识别单元不同,在英语用第二识别单元中,在像素的投影缩小的地方等进行字符分离。这样,就可以分离不能用第一识别单元分离的字符。而且,第二识别单元在准备识别词典时可以适应于比第一识别单元更多的英语字体,从而提高识别精度。
步骤S206:当在步骤S205中进行再识别的结果得到了比第一识别单元高的类似度时,在该再识别范围中,用第二识别单元的识别结果来置换第一识别单元的识别结果。由此,英文字符被高精度地识别。
依据第一实施例,在包含英语单词的日语文章中,日语字符和英字符都能得到较高的识别精度。而且,进行再识别的第二识别单元能够与第一识别单元独立地动作,从而可以容易地将识别单元替换为适合于除日语和英语之外的其他语言的识别单元。这样,通过第一、第二识别单元能够适用于多种语言组合。
下面使用图3的流程图来更详细地说明步骤S203的再识别范围设定。
步骤S301:设定阈值T1、T2,并前进到步骤S302。阈值T1用于判断是否把再识别范围从由第一识别单元提取出的字符块扩展到包含其前后字符的区域。阈值T2用于判断是否在所设定的再识别范围中进行由第二识别单元进行的识别。
步骤S302:进行步骤S303以后的处理的结束判断。对于由图2的步骤S202所提取出的全部字符,当步骤S303以后的处理结束时,就此结束处理。当尚未结束时,前进到步骤S303。
步骤S303:通过日语用第一识别单元,判断是否检出字母或者字母与数字的组合(以下把它们称为字母数字)。当在日语文章中不包含英语单词时,所有字符被识别为日语字符,当包含英语单词时,检出字母数字。
步骤S304:判断在步骤S303中是否检出了字母数字,当没有检出时,返回步骤S302,并判断是否存在尚未检查的识别结果。当字母数字被检出时,移到步骤S205。在步骤S305~S308中设定再识别范围。
步骤S305:对把再识别范围向后扩展的条件进行判定。在初始状态下,再识别范围是由第一识别单元所检出的字母数字的范围,但是,当满足一定条件时,在步骤S306中把再识别范围扩展到后面的字符。所谓把再识别范围扩展到后面的条件是:再识别范围的后续字符是字母数字,或者,再识别范围后续字符的识别结果类似度小于阈值T1。当任一个条件被满足时,前进到步骤S306。当再识别范围的后续字符任一个条件都不满足时,或者,当不存在后续字符时,移到步骤S307。而且,当再识别范围到达一行的结尾时,后续字符是下一行的开头字符。通过把再识别范围扩展到下一行,可使再识别范围涉及多行。
步骤S306:将再识别范围的后续字符包含到再识别范围中,从而扩展再识别范围。然后,再次返回步骤S305。
步骤S307:在初始状态的再识别范围或者在步骤S306中扩展到后面的再识别范围内,判定将该再识别范围向前扩展的条件。把再识别范围向前扩展的条件是:在再识别范围之前存在的字符是字母数字,或者,对再识别范围前的字符的识别结果的类似度小于阈值T1。当任一个条件被满足时,移到步骤S308。当再识别范围前的字符任一个条件都不满足时,或者,当不存在前边的字符时,移到步骤S309。当再识别范围到达一行的开头时,前边的字符是前一行的结尾字符。通过把再识别范围扩展到前一行,也可使再识别范围涉及多行。
步骤S308:将再识别范围前的字符包含到再识别范围中,从而扩展再识别范围。然后,再次返回步骤S307。
步骤S309:对于在步骤S305~S308中所设定的再识别范围内的字符,判定是否存在类似度为T2以下的字符。如果存在类似度为T2下的字符,则判定第一识别单元的识别结果的可靠性存在问题,并移到步骤S311。当不存在类似度为T2下的字符时,判定再识别范围的字符是字母数字并且是类似度比较高的字符。这意味着对再识别范围内的字符的识别结果是可信赖的,因此移到步骤S310。例如,存在用日语用字符识别对以固定间距书写的字母数字进行高精度的识别,并且其类似度大于T2的情况。另一方面,在以可变间距书写时,类似度为T2以下,且容易误识别。
步骤S310:把在步骤S309中被判断为字符识别结果的类似度大于T2的再识别范围从执行再识别的再识别范围中去除,并返回步骤S302。由此,即使是英语单词,由于在误识别可能性较低的范围内不执行再识别处理,可以省略不需要的处理,从而能够提高整体处理速度。
步骤S311:将在步骤S309中被判断为存在字符识别结果的类似度为T2下的再识别范围确定为执行再识别的再识别范围,返回步骤S302。
根据上述第一实施例,能够自动地提取出误识别可能性较高的英语单词范围作为再识别范围,从而能够提高识别精度。
阈值T1、T2可以使用通过进行实验等而预先设定的值,也可以随字符类型等不同而设定为不同的值。例如,可以随平假名、片假名、汉字、字母数字等作为识别结果的字符类型而选定不同的阈值。
在上述第一实施例中说明了包含英语单词的日语文章的例子,但是,在包含英语、拉丁语和其他字符排列不同的单词的其他语言的文章,例如中文文章、韩文文章、其他语种文章中,也能起到同样的效果。
图4、图5是表示图1所示的字符识别装置所执行的字符识别方法的第二实施例的流程图。
在第二实施例中,对于由第一字符识别单元所产生的识别结果,执行由第二识别单元进行的再识别处理,而且,对于由第二识别单元所产生的识别结果,执行由第三识别单元进行的再识别处理。
图4的流程图表示第二实施例的总体流程。
步骤S401:与第一实施例的步骤S201相同,输入图像。
步骤S402:与第一实施例的步骤S202相同,用第一识别单元来对所输入的图像进行字符识别。
步骤S403:与第一实施例的步骤S203相同,设定再识别范围。
步骤S404:与第一实施例的步骤S204相同,判断是否提取出一个以上的再识别范围。当提取出再识别范围时,移到步骤S405,当尚未提取出时,就此结束处理。
步骤S405:由第二识别单元对于再识别范围进行字符识别,以字符单位为单位来分析类似度。根据需要,执行行提取、字符块提取。
步骤S406:判定是否采用由第二识别单元所产生的字符识别结果。判定方法将在后面描述。当判断为采用由第二识别单元所产生的字符识别结果时,移到步骤S407,当判断为不采用由第二识别单元所产生的字符识别结果时,移到步骤S408。
步骤S407:在由第一识别单元所产生的字符识别结果中,用由第二识别单元所产生的再识别结果来替换再识别范围。
步骤S408:由第三识别单元对再识别范围进行字符识别,移到步骤S409。
步骤S409:判定是否采用由第三识别单元所产生的字符识别结果。判定方法与步骤S406的判定方法相同,其详细内容将在后面描述。当判定采用由第三识别单元所产生的字符识别结果时,移到步骤S410,当判定不采用由第三识别单元所产生的字符识别结果时,就此结束处理。
步骤S410:在由第一识别单元所产生的字符识别结果中,用由第三识别单元所产生的再识别的识别结果来替换再识别范围。
图5是表示步骤S406中的判定方法的流程图。
步骤S501:求出再识别范围中的识别结果的类似度的平均值。
步骤S502:把平均值与预定的阈值T3进行比较,当为阈值T3以下时,移到步骤S503,当大于阈值T3时,移到步骤S504。
步骤S503:不采用由第二识别单元所产生的再识别的识别结果,而采用由第一识别单元所产生的识别结果。
步骤S504:利用由第二识别单元所产生的再识别的识别结果替换由第一识别单元所产生的识别结果。
图6是表示步骤S409中的判定方法的流程图。
步骤S601:与图5的步骤S501相同,求出类似度的平均值。
步骤S602:把平均值与预定的阈值T4进行比较,当为阈值T4以下时,移到步骤S603,当大于阈值T4时,移到步骤S604。
步骤S603:不采用由第三识别单元所产生的再识别的识别结果,而采用由第一识别单元所产生的识别结果。
步骤S604:利用由第三识别单元所产生的再识别的识别结果替换由第一识别单元所产生的再识别的识别结果。
而且,图5、图6的处理中的阈值T3、T4可以相同,也可以根据经验公式和实验结果等,设定为不同的值。
图7是表示图5所示的判定方法的另一个形式的流程图。
步骤S701:求出由第一识别单元所产生的识别结果的类似度平均值M1。
步骤S702:求出由第二识别单元所产生的识别结果的类似度平均值M2。
步骤S703:比较平均值M1、M2,当平均值M1为M2以上时,移到步骤S704,当平均值M2大于M1时,移到步骤S705。
步骤S704:不采用由第二识别单元所产生的再识别的识别结果,而采用由第一识别单元所产生的识别结果。
步骤S705:以由第二识别单元所产生的再识别的识别结果替换由第一识别单元所产生的再识别的识别结果。
而且,图7的判定方法也适用于由第一识别单元所进行的识别处理和由第三识别单元所进行的识别处理之间的比较、选择。
在上述第二实施例中,由于根据类似度的平均值来判定识别结果的可靠性,所以可以实现全面的识别精度评价。而且,由于依次使用多个识别单元进行字符识别,并比较它们的结果,因此,能够适用于多种语言和字符类型,同时,也能够从多个识别结果中选择最佳的识别结果。
[程序]
图1所示的字符识别装置中的控制程序包含用于执行字符识别方法的第一实施例和/或第二实施例的程序。用于执行第一实施例的程序包含执行步骤S201~S206、步骤S301~S311的处理的模块。用于执行第二实施例的程序包含执行步骤S401~S410、步骤S501~S504、步骤S601~S604、步骤S701~S705的处理的模块。
[存储媒体]
本发明所涉及的字符识别方法可以由除图1的字符识别装置之外的装置,例如通用计算机,来实施,在此情况下,也可以把由存储媒体等所提供的控制程序设置在通用计算机的外部存储装置中,通过操作人员等的指示,由CPU等来执行。
图8是表示存储有用于执行字符识别方法的第一和第二实施例的程序的存储媒体的存储器分配图。
在图8中,在地址A0至A1中存储目录信息,在从A1之后的地址到地址A2的区域中存储用于执行第一实施例中图2所示的流程的程序,在从A2之后的地址到地址A3的区域中存储用于执行第一实施例中图3所示的流程的程序,在从A3之后的地址到地址A4的区域中存储用于执行第二实施例中图4所示的流程的程序,在从A4之后的地址到地址A5的区域中存储用于执行第二实施例中的图5所示的流程的程序,在从A5之后地址到地址A6的区域中存储用于执行第二实施例中的图6的流程的程序,在从A6之后的地址到地址A7的区域中存储用于执行图7所示的流程的程序。
虽然没有特别图示,从属于各种程序的数据可以作为目录信息来管理,而且,也可以在目录信息内存储用于把各种程序安装到计算机中的程序等。
[字符识别系统]
图9是表示通过多个设备来执行本发明所涉及的字符识别方法的字符识别系统的一个实施例的方框图。
在该实施例中,在因特网服务提供商中,包含用于字符识别的识别词典的程序被存储在服务器SV1中。因特网服务提供商通过通信装置而连接在因特网上,通过从因特网访问服务器SV1,多个用户能够利用字符识别程序。
用户操作个人计算机PC1,把用扫描仪SC1读取的原稿图像发送给服务器SV1。在服务器中,把原稿图像作为输入图像,执行上述第一实施例或第二实施例的字符识别处理,并将其识别结果发回个人计算机PC1。
识别词典并不一定与字符识别程序一起存在于同一个计算机上,也可以通过通信装置等来进行参照。例如,可以把字符识别程序设置在服务器SV1中,而把识别词典作为另一个服务设置在另一个服务器SV2中。在此情况下,字符识别程序的持有者、识别词典的持有者可以分别在内部持有程序、词典这样的知识产权,从而防止非法复制等。
根据本发明,能够提高以多种语言记载的文章图像的字符识别精度。
虽然本发明的优选实施例已经进行了表示和说明,但是,应当知道,本领域的技术人员可以在不背离本发明的精神的条件下进行变化和变型,本发明的范围由权利要求书限定。
Claims (11)
1.一种字符识别装置,包括:
适用于对以第一语言书写的字符图像进行字符识别的第一识别装置;
适用于对以第二语言书写的字符图像进行字符识别的第二识别装置;以及
再识别范围设定装置,用于针对使用上述第一识别装置对文章图像中包含的多个字符图像进行字符识别的结果,根据由上述第一识别装置识别为上述第二语言的字符图像和对与被识别为上述第二语言的该字符图像相邻的一个字符图像进行识别的识别结果,来设定使用上述第二识别装置进行再识别的再识别范围。
2.根据权利要求1所述的字符识别装置,其特征在于,上述再识别范围设定装置在与上述再识别范围相邻的字符是上述第二语言时,把上述再识别范围扩展到上述相邻字符的范围。
3.根据权利要求1所述的字符识别装置,其特征在于,上述再识别范围设定装置在上述第一识别装置对与上述再识别范围相邻的字符的识别结果的类似度小于第一预定值时,把上述再识别范围扩展到上述相邻字符的范围。
4.根据权利要求1所述的字符识别装置,其特征在于,上述再识别范围设定装置在上述第一识别装置对各再识别范围内的字符的识别结果的类似度小于或等于第二预定值时,仍将该再识别范围确定为进行再识别的范围,当上述类似度大于该第二预定值时,把该再识别范围从进行再识别的范围中排除。
5.根据权利要求1所述的字符识别装置,其特征在于,进一步包括识别结果选择装置,用于择一地选择由上述第一识别装置所产生的识别结果和由上述第二识别装置所产生的识别结果。
6.根据权利要求5所述的字符识别装置,其特征在于,上述识别结果选择装置在上述第二识别装置对上述再识别范围内的字符的识别结果中的字符类似度小于或等于预定值时,选择上述第一识别装置的识别结果,当上述类似度大于预定值时,选择上述第二识别装置的识别结果。
7.根据权利要求5所述的字符识别装置,其特征在于,上述识别结果选择装置在上述第二识别装置对上述再识别范围内的字符的识别结果中的类似度平均值小于或等于预定值时,选择上述第一识别装置的识别结果,当上述类似度平均值大于预定值时,选择上述第二识别装置的识别结果。
8.根据权利要求5所述的字符识别装置,其特征在于,上述识别结果选择装置比较上述第一识别装置对再识别范围内的字符的识别结果中的类似度平均值和上述第二识别装置对该字符的识别结果中的类似度平均值,当由上述第一识别装置所产生的类似度平均值大于或等于由上述第二识别装置所产生的类似度平均值时,选择由上述第一识别装置所产生的识别结果,当由上述第二识别装置所产生的类似度平均值大于由上述第一识别装置所产生的类似度平均值时,选择由上述第二识别装置所产生的识别结果。
9.根据权利要求1所述的字符识别装置,其特征在于,进一步包括:
接收装置,用于通过网络从外部装置接收上述文章图像;
发送装置,用于将使用上述第一识别装置、上述第二识别装置和上述再识别范围设定装置进行字符识别的结果发送给上述外部装置。
10.一种字符识别方法,包括以下步骤:
使用适用于对以第一语言书写的字符图像进行字符识别的第一识别过程,对文章图像中包含的多个字符图像进行字符识别;
根据在上述第一识别过程中被识别为第二语言的字符图像和对与上述被识别为第二语言的该字符图像相邻的字符图像进行识别的识别结果,设定使用适用于对以上述第二语言书写的字符图像进行字符识别的第二识别过程来进行再识别的再识别范围;以及
使用上述第二识别过程对所设定的上述再识别范围再次进行字符识别。
11.一种用于字符识别的可编程计算机,包括:
一个存储器,具有至少一个用于存储计算机可执行程序代码的区域;
一个处理器,用于执行存储在所述存储器中的程序代码,
其中,所述处理器包括:
用于使用适用于对以第一语言书写的字符图像进行字符识别的第一识别过程,对文章图像中包含的多个字符图像进行字符识别的装置;
用于根据由上述第一识别装置识别为第二语言的字符图像和对与被识别为上述第二语言的该字符图像相邻的字符图像进行识别的识别结果,设定使用适用于对以上述第二语言书写的字符图像进行字符识别的第二识别过程来进行再识别的再识别范围的装置;以及
用于使用上述第二识别过程对所设定的上述再识别范围再次进行字符识别的装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP199505/2002 | 2002-07-09 | ||
JP2002199505A JP3919617B2 (ja) | 2002-07-09 | 2002-07-09 | 文字認識装置および文字認識方法、プログラムおよび記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1472695A CN1472695A (zh) | 2004-02-04 |
CN1269069C true CN1269069C (zh) | 2006-08-09 |
Family
ID=30112466
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB031474187A Expired - Fee Related CN1269069C (zh) | 2002-07-09 | 2003-07-09 | 字符识别装置及方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7162086B2 (zh) |
JP (1) | JP3919617B2 (zh) |
KR (1) | KR100578188B1 (zh) |
CN (1) | CN1269069C (zh) |
TW (1) | TWI231920B (zh) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100357957C (zh) * | 2004-08-10 | 2007-12-26 | 富士通株式会社 | 用于识别图像中的字符的字符识别装置和字符识别方法 |
JP4759963B2 (ja) * | 2004-09-22 | 2011-08-31 | 沖電気工業株式会社 | 複数の認識辞書を利用した文字認識装置 |
US7548849B2 (en) * | 2005-04-29 | 2009-06-16 | Research In Motion Limited | Method for generating text that meets specified characteristics in a handheld electronic device and a handheld electronic device incorporating the same |
WO2007080642A1 (ja) * | 2006-01-13 | 2007-07-19 | Fujitsu Limited | 帳票処理プログラムおよび帳票処理装置 |
JP2007219867A (ja) * | 2006-02-17 | 2007-08-30 | Hitachi Ltd | 文字列読取り方法 |
CN101256631B (zh) * | 2007-02-26 | 2011-06-01 | 富士通株式会社 | 一种字符识别的方法、装置 |
JP4906685B2 (ja) * | 2007-11-14 | 2012-03-28 | キヤノン株式会社 | 撮像装置、その制御方法及びプログラム |
JP5258313B2 (ja) * | 2008-01-31 | 2013-08-07 | キヤノン株式会社 | 画像処理システム、画像処理方法、及びプログラム |
JP5116608B2 (ja) * | 2008-08-20 | 2013-01-09 | キヤノン株式会社 | 情報処理装置、制御方法、及びプログラム |
KR101220709B1 (ko) * | 2010-02-03 | 2013-01-10 | 삼성전자주식회사 | 한글 및 한자가 혼용된 문서에 대한 전자 사전 검색 장치 및 방법 |
JP5672003B2 (ja) * | 2010-12-28 | 2015-02-18 | 富士通株式会社 | 文字認識処理装置及びプログラム |
CN103310209A (zh) * | 2012-03-09 | 2013-09-18 | 富士通株式会社 | 识别图像中的字符串的方法和装置 |
WO2014146718A1 (de) * | 2013-03-22 | 2014-09-25 | Deutsche Post Ag | Identifikation von packstücken |
CN104462068B (zh) * | 2013-09-12 | 2017-11-07 | 北大方正集团有限公司 | 字符转换系统和字符转换方法 |
JP6545013B2 (ja) | 2015-06-17 | 2019-07-17 | キヤノン株式会社 | 画像形成方法、画像形成装置、および画像形成プログラム |
JP6655331B2 (ja) * | 2015-09-24 | 2020-02-26 | Dynabook株式会社 | 電子機器及び方法 |
KR20180094875A (ko) * | 2015-12-18 | 2018-08-24 | 소니 주식회사 | 정보 처리 장치, 정보 처리 방법, 및 프로그램 |
JP6523988B2 (ja) * | 2016-02-18 | 2019-06-05 | 株式会社東芝 | 文字認識装置、文字認識方法、およびプログラム |
CN105809170B (zh) * | 2016-03-04 | 2019-04-26 | 东软集团股份有限公司 | 字符识别方法和装置 |
US11003911B2 (en) * | 2017-02-28 | 2021-05-11 | Nec Corporation | Inspection assistance device, inspection assistance method, and recording medium |
GB2571530B (en) * | 2018-02-28 | 2020-09-23 | Canon Europa Nv | An image processing method and an image processing system |
JP2019159374A (ja) * | 2018-03-07 | 2019-09-19 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
JP7274322B2 (ja) * | 2019-03-25 | 2023-05-16 | 東芝テック株式会社 | プログラム及び文字認識方法 |
JP7317612B2 (ja) | 2019-07-18 | 2023-07-31 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
CN110928216B (zh) * | 2019-11-14 | 2020-12-15 | 深圳云天励飞技术有限公司 | 人工智能装置 |
CN113313114B (zh) * | 2021-06-11 | 2023-06-30 | 北京百度网讯科技有限公司 | 证件信息获取方法、装置、设备以及存储介质 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05101220A (ja) | 1991-10-08 | 1993-04-23 | Sumitomo Electric Ind Ltd | 文字認識装置 |
JPH06119497A (ja) * | 1992-10-01 | 1994-04-28 | Matsushita Electric Ind Co Ltd | 文字認識方法 |
JPH06150061A (ja) * | 1992-11-04 | 1994-05-31 | Sharp Corp | 文書認識装置 |
JPH06301822A (ja) | 1993-04-15 | 1994-10-28 | Nec Corp | 文字認識後処理方式 |
US5377280A (en) * | 1993-04-19 | 1994-12-27 | Xerox Corporation | Method and apparatus for automatic language determination of European script documents |
JPH07239913A (ja) | 1994-02-28 | 1995-09-12 | Toshiba Corp | 文字認識装置 |
JPH08167005A (ja) * | 1994-12-15 | 1996-06-25 | Ricoh Co Ltd | 文字認識装置 |
JPH09114931A (ja) * | 1995-10-18 | 1997-05-02 | Canon Inc | 文字認識装置及びその方法 |
US6137905A (en) | 1995-08-31 | 2000-10-24 | Canon Kabushiki Kaisha | System for discriminating document orientation |
JP3537570B2 (ja) | 1995-12-18 | 2004-06-14 | 株式会社リコー | 日英混在文書のスペース検出方法、ピッチ書式判定方法及び定ピッチ英数文字列のスペース検出方法 |
US6094484A (en) * | 1996-10-16 | 2000-07-25 | Convey Corporation | Isomorphic pattern recognition |
US6047251A (en) * | 1997-09-15 | 2000-04-04 | Caere Corporation | Automatic language identification system for multilingual optical character recognition |
-
2002
- 2002-07-09 JP JP2002199505A patent/JP3919617B2/ja not_active Expired - Fee Related
-
2003
- 2003-07-07 TW TW092118512A patent/TWI231920B/zh not_active IP Right Cessation
- 2003-07-09 CN CNB031474187A patent/CN1269069C/zh not_active Expired - Fee Related
- 2003-07-09 US US10/615,304 patent/US7162086B2/en active Active
- 2003-07-09 KR KR1020030046276A patent/KR100578188B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
KR20040005671A (ko) | 2004-01-16 |
US20040008889A1 (en) | 2004-01-15 |
CN1472695A (zh) | 2004-02-04 |
JP3919617B2 (ja) | 2007-05-30 |
JP2004046315A (ja) | 2004-02-12 |
KR100578188B1 (ko) | 2006-05-11 |
US7162086B2 (en) | 2007-01-09 |
TW200407796A (en) | 2004-05-16 |
TWI231920B (en) | 2005-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1269069C (zh) | 字符识别装置及方法 | |
US9189694B2 (en) | Image processing device and image processing method | |
US7813554B2 (en) | Method and apparatus of extracting text from document image with complex background, computer program and storage medium thereof | |
CN1122243C (zh) | 用于多种语言光字符识别的自动语言识别系统 | |
CN1145872C (zh) | 手写汉字自动分割和识别方法以及使用该方法的系统 | |
JP5176730B2 (ja) | 電子書類を検索するシステム及び検索方法 | |
CN1258894A (zh) | 用于识别字符的装置和方法 | |
US20150095769A1 (en) | Layout Analysis Method And System | |
JP4553241B2 (ja) | 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体 | |
CN1752991A (zh) | 文字识别装置、文字识别方法及文字识别程序 | |
EP2166488A2 (en) | Handwritten word spotter using synthesized typed queries | |
CN1801139A (zh) | 句子显示方法和信息处理系统 | |
CN1655147A (zh) | 用于搜索数字墨水查询的设备和方法 | |
CN1149737A (zh) | 信息处理方法和装置及存储实施该方法程序的存储介质 | |
CN1141666C (zh) | 利用标准笔划识别输入字符的在线字符识别系统 | |
JP2010217996A (ja) | 文字認識装置、文字認識プログラム、および文字認識方法 | |
CN1955981A (zh) | 字符识别装置、字符识别方法、以及字符数据 | |
US8837818B2 (en) | Document image processing apparatus, document image processing method, and computer-readable recording medium having recorded document image processing program | |
CN1292377C (zh) | 便携终端的字符识别中的处理对象选择方法及便携终端 | |
JP2008129793A (ja) | 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体 | |
CN1896997A (zh) | 字符串检索装置及使计算机执行字符串检索方法的程序 | |
JP6247103B2 (ja) | 帳票項目認識方法、帳票項目認識装置及び帳票項目認識プログラム | |
US20010043742A1 (en) | Communication document detector | |
JP2021149439A (ja) | 情報処理装置及び情報処理プログラム | |
CN1955979A (zh) | 文章标题及关联信息的自动抽取装置、抽取方法及抽取程序 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20060809 Termination date: 20200709 |
|
CF01 | Termination of patent right due to non-payment of annual fee |