CN111476073B - 信息处理装置、记录媒体及信息处理方法 - Google Patents
信息处理装置、记录媒体及信息处理方法 Download PDFInfo
- Publication number
- CN111476073B CN111476073B CN201910831163.7A CN201910831163A CN111476073B CN 111476073 B CN111476073 B CN 111476073B CN 201910831163 A CN201910831163 A CN 201910831163A CN 111476073 B CN111476073 B CN 111476073B
- Authority
- CN
- China
- Prior art keywords
- character recognition
- recognition result
- unit
- input image
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 43
- 238000003672 processing method Methods 0.000 title claims abstract description 6
- 238000001514 detection method Methods 0.000 claims abstract description 46
- 238000012217 deletion Methods 0.000 claims abstract description 31
- 230000037430 deletion Effects 0.000 claims abstract description 31
- 238000012545 processing Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 6
- 238000000034 method Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/155—Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
一种信息处理装置、记录媒体及信息处理方法。信息处理装置包括:字符识别单元,通过对输入图像进行字符识别而输出字符识别结果;接收单元,接收对所述输入图像的基于人的字符识别结果的输入;检测单元,从所述输入图像中检测删除线;对照单元,用于进行所述字符识别单元输出的字符识别结果与所述接收单元接收到的所述基于人的字符识别结果的对照;及控制单元,进行如下控制:当所述检测单元检测到所述删除线的情况下,使所述对照单元进行所述对照,并根据所述对照结果求出最终的字符识别结果。
Description
技术领域
本发明涉及一种信息处理装置、记录媒体及信息处理方法。
背景技术
有一种数据输入系统,其将被手写记入或打印在纸质表单上的字符串进行数字数据化。数据输入系统采用人读取表单中的内容进行键输入的方式、由使用了光学字符识别(OCR)技术的字符识别器对表单中的图像进行字符识别处理的方式或它们的组合,将表单中的字符串进行数字化。
在专利文献1中公开的信息处理装置的分类单元将字符识别对象分类为3个种类中的任一种,在由所述分类单元分类为第1种类的情况下,提取单元提取所述字符识别对象的字符识别结果,在由所述分类单元分类为第2种类的情况下,第1控制单元以提取所述字符识别对象的字符识别结果并手动输入该字符识别对象的方式进行控制,在由所述分类单元分类为第3种类的情况下,第2控制单元以复数人手动输入所述字符识别对象的方式进行控制。并且,在专利文献1中记载有:字符识别模块输出字符识别结果的准确度(即,确信该字符识别结果正确的程度),根据该准确度的值将字符识别对象分类为第1种类~第3种类,进而,在该准确度属于最高范围的情况下,将基于字符识别模块的字符识别结果作为最终结果来提取。
并且,有时用户在被手写记入或打印的字符串上划出删除线。被划上删除线的字符串是用户命令删除的字符串,在字符识别处理中,假设即使能够识别出该字符串,也希望舍弃该识别结果。然而,根据构成字符串的字符或在其上划出的删除线的形态,有时字符识别模块能够识别该字符串,而且该字符识别结果的准确度还会成为高值。在这种情况下,尽管存在删除线,但是有可能采用该准确度高的字符识别结果作为最终结果。
由此,与字符识别分开进行删除线的检测处理,并舍弃与检测到删除线的部分对应的字符识别结果。
例如在专利文献2中公开的系统中,基于分数的舍弃判定部根据由字符图案识别部得到的识别结果的可靠性的值进行识别结果的舍弃判定。字符/框线接触数量检测部从字符记入栏内的图像中取出1个字符量的非字符框图像,并测定与非字符框图像接触的字符框线的数量。在与非字符框图像接触的字符框线数超出规定的阈值的情况下,格线接触舍弃判定部舍弃与字符框线对应的字符的识别结果。舍弃处理整合部根据基于分数的舍弃判定部的结果和格线接触舍弃判定部的结果这两者,进行最终输出的字符识别结果的舍弃判定。
专利文献1:日本特开2016-212812号公报
专利文献2:日本特开2012-185713号公报
在删除线的自动检测中,有时如输入图像中所包含的扫描噪声等非删除线被检测为删除线。若设为从输入图像中检测到删除线时舍弃字符识别单元的字符识别结果,则即使在字符识别单元求出正确的字符识别结果的情况下,若输入图像中的噪声被检测为删除线,则该字符识别结果不会被利用。
发明内容
本发明提供一种结构,其在输入图像中所包含的噪声等非删除线被检测为删除线的情况下,若该字符识别单元对输入图像的字符识别结果正确,则提高利用字符识别结果的概率。
方案1所涉及的发明为信息处理装置,其包括:字符识别单元,通过对输入图像进行字符识别而输出字符识别结果;接收单元,接收对所述输入图像的基于人的字符识别结果的输入;检测单元,从所述输入图像中检测删除线;对照单元,用于进行所述字符识别单元输出的字符识别结果与所述接收单元接收到的所述基于人的字符识别结果的对照;及控制单元,进行如下控制:当所述检测单元检测到所述删除线的情况下,使所述对照单元进行所述对照,并根据所述对照结果求出最终的字符识别结果。
方案2所涉及的发明在方案1所述的信息处理装置中,所述字符识别单元还输出所述字符识别结果的准确度,并且所述控制单元在所述字符识别单元输出的所述准确度小于阈值的情况下,或者在所述检测单元检测到所述删除线的情况下进行所述控制,在所述准确度为所述阈值以上且所述检测单元未检测到所述删除线的情况下不进行所述控制,而将所述字符识别单元的所述字符识别结果设为最终的字符识别结果。
方案3所涉及的发明在方案1所述的信息处理装置中,所述字符识别单元还输出所述字符识别结果的准确度,并且所述控制单元在所述检测单元未检测到所述删除线的情况下,采用所述字符识别单元输出的所述准确度作为判定用准确度,当所述检测单元检测到所述删除线的情况下,将所述字符识别单元输出的所述准确度变更为阈值以下的值,并采用该变更后的准确度作为所述判定用准确度,并且在所述判定用准确度为所述阈值以下的情况下进行所述控制,在所述判定用准确度大于所述阈值的情况下不进行所述控制,而将所述字符识别单元的所述字符识别结果设为最终的字符识别结果。
方案4所涉及的发明为记录媒体,其记录有用于使计算机作为如下单元而发挥功能的程序:字符识别单元,通过对输入图像进行字符识别而输出字符识别结果;接收单元,接收对所述输入图像的基于人的字符识别结果的输入;检测单元,从所述输入图像中检测删除线;对照单元,用于进行所述字符识别单元输出的字符识别结果与所述接收单元接收到的所述基于人的字符识别结果的对照;及控制单元,进行如下控制:当所述检测单元检测到所述删除线的情况下,使所述对照单元进行所述对照,并根据所述对照结果求出最终的字符识别结果。
方案5所涉及的发明为信息处理方法,其包括如下步骤:字符识别步骤,通过对输入图像进行字符识别而输出字符识别结果;接收步骤,接收对所述输入图像的基于人的字符识别结果的输入;检测步骤,从所述输入图像中检测删除线;对照步骤,用于进行在所述字符识别步骤中输出的字符识别结果与在所述接收步骤中接收到的所述基于人的字符识别结果的对照;及控制步骤,进行如下控制:当在所述检测步骤中检测到所述删除线的情况下,在所述对照步骤中进行所述对照,并根据所述对照结果求出最终的字符识别结果。
发明效果
根据本发明的第1、2、4或5方案,在输入图像中所包含的噪声等非删除线被检测为删除线的情况下,若字符识别单元对该输入图像的字符识别结果正确,则能够提高利用该字符识别结果的概率。
根据本发明的第3方案,在判定用准确度大于阈值的情况下,将字符识别单元的识别结果设为最终的字符识别结果,并且在判定用准确度为阈值以下的情况下,根据对照单元的对照结果求出最终的字符识别结果,利用该结构,若字符识别单元的字符识别结果是正确的,则能够提高利用该字符识别结果的概率。
附图说明
根据以下附图,对本发明的实施方式进行详细叙述。
图1是例示出实施方式的装置结构的主要部分的图;
图2是例示出删除线的各种图案的图;
图3是用于对删除线检测方法的一例进行说明的图;
图4是例示出对照部的对照结果不匹配的情况下的用于处理的结构的图;
图5是例示出对照部的对照结果不匹配的情况下的用于处理的另一结构的图;
图6是例示出另一例的装置结构的主要部的图。
具体实施方式
图1中示出本发明所涉及的信息处理装置的一实施方式的结构例。
在该信息处理装置中被输入包含字符串图像的输入图像。输入图像例如是通过扫描器扫描表单等纸面而得到的图像。或者从通过扫描纸面而得到的图像中切出包含识别对象的字符串的区域(例如特定的记入栏)的图像,并作为输入图像而输入到信息处理装置。输入图像中所包含的字符串可以是由手写字符构成的字符串,也可以是活字的字符串,也可以是手写字符与活字混合的字符串。字符串是由1个以上的字符构成的列。并且,在成为识别对象的字符中,可以包含各种字母或假名等表音字符、汉字等表意字符、商标标志等各种标志等。
字符识别器12对该输入图像进行字符识别,求出该输入图像中所包含的字符串的识别结果R并输出。所输出的识别结果R是构成该字符串的各字符的字符代码的列。字符识别器12是“字符识别单元”的一例。
并且,字符识别器12输出关于该识别结果R的字符识别的准确度P。准确度P是表示由字符识别器12求出的识别结果R正确地表示该输入图像中所包含的字符串的正确度的程度。准确度P越高,识别结果R的文字代码正确的(即,正确地表示输入图像中的字符串)概率越高。字符识别器12输出的识别结果R和准确度P被输入到识别控制部52。
删除线检测部50从该输入图像中检测删除线。删除线检测部50是“检测单元”的一例。
删除线是为了删除字符串而通过手写或应用程序在该字符串上划出的1条或复数条线。删除线中有各种图案。例如在图2的(a)中例示的是由大致直线状的两条线构成的删除线102a,该两条线遍及这些字符串的整个横宽区域延伸,以删除输入图像100内的手写字符串“ABC”。并且,也有如下情况:如图2的(b)所示,划出“之”字状的手写删除线102b,如图2的(c)所示,对字符串“ABC”的每个字符单独划出删除线102c。删除线检测部50可以是能够检测这些所有图案的检测部,也可以是能够检测其中一部分的检测部。另外,如图2的(a)或图2的(c)的例子,在与字符串重叠的删除线的密度小且删除线不易干扰字符识别的情况下,有时基于字符识别器12的该字符串的识别结果R的准确度P会成为高值。
作为从图像中检测删除线的方法,以往提出有各种方法。删除线检测部50可以使用这些现有方法。并且,删除线检测部50可以使用从现在开始开发出来的删除线检测方法。
并且,如图3所示,在通过读取字符记入在记入框115中的表单而得到的输入图像为对象的情况下,若删除线检测部50检测到与2个以上的单位框110重叠的连续的线量104(可以是直线或曲线),则可以将该线量判定为删除线,所述记入框115是通过排列1个以上1个字符单位的单位框110而构成。图3所示的记入框115是相邻的单位框110彼此接触的(即,共有一边)“梯形框”形式的记入框,在记入框115中的相邻的单位框110彼此之间空有间隔的情况下,也能够应用相同的删除线检测方法。
另外,在输入图像中有时会包含由对表单等纸面进行了扫描的扫描器引起的读取噪声、纸面的折痕或线状污垢等作为图像。有时删除线检测部50检测到这种噪声、折痕及污垢等图像作为删除线。
删除线检测部50对识别控制部52输出表示是否从输入图像中检测到删除线的信息,即,输入图像中的删除线的有无的信息。
识别控制部52根据从字符识别器12输入的识别结果R及准确度P和从删除线检测部50输入的删除线的有无的信息,进行用于求出关于输入图像的最终的字符识别结果的控制。识别控制部52是“控制单元”的一例。以下,对识别控制部52执行的控制进行说明。
以往,存在一种信息处理装置,其在字符识别器对输入图像的识别结果R的准确度P高于某一阈值T1的情况下,将该识别结果R作为该信息处理装置的最终的字符识别结果而输出。这种信息处理装置在准确度P为阈值T1以下的情况下,接收人对相同的输入图像的字符识别结果的输入,并将所接收到的输入与该识别结果R进行对照。在该对照中,在判定为这两者匹配(即一致)的情况下,该识别结果R作为信息处理装置的最终的字符识别结果而输出。另一方面,在该对照中判定为这两者不匹配的情况下,该现有的信息处理装置从其他人接收该输入图像的字符识别结果的输入,并考虑到该输入而求出最终的字符识别结果。作为一例,将第一个人的字符识别结果和此次重新输入的其他人的字符识别结果进行对照,若这两者一致,则将该字符识别结果设为最终的字符识别结果。
相对于此,即使字符识别器12对输入图像的识别结果R的准确度P高于该阈值T1,本实施方式的识别控制部52也不会就此将该识别结果R设为信息处理装置的最终的字符识别结果。取而代之,识别控制部52还参考对该输入图像的来自删除线检测部50的信息,在准确度P高于该阈值T1、且在该输入图像中没有删除线的情况下,将该识别结果R作为信息处理装置的最终的字符识别结果而输出。
另一方面,在删除线检测部50从该输入图像中检测到删除线的情况下,即使字符识别器12的识别结果R的准确度P高于阈值T1,识别控制部52也将该识别结果R输入到对照部16。对照部16将所输入的识别结果R与输入到键输入部14的基于人(图示例中名字为“A”的人)的关于该输入图像的字符识别结果进行对照。对照部16是“对照单元”的一例。另外,键输入部14是接收来自用户(人)的键输入的软件模块,是“接收单元”的一例。A的终端例如经由互联网而与图1所示的信息处理装置连接即可。该情况下,显示输入图像或接收该输入图像的识别结果的输入的结构,例如以网络服务的形式从键输入部14提供于该终端。A对显示于终端的输入图像进行识别,并从终端的键盘输入该输入图像表示的字符串。键输入部14从该终端接收A输入的字符串数据,并传递给对照部16。
以往,存在如下方法:在从输入图像中检测到删除线的情况下,舍弃字符识别器对该输入图像的识别结果。本实施方式与所述现有方法不同,在检测到删除线的情况下,也不舍弃字符识别器12的识别结果R,而是通过将该识别结果R与人的字符识别结果进行对照而再利用。
并且,在字符识别器12的识别结果R的准确度P为阈值T1以下的情况下,识别控制部52与上述现有方式同样地利用对照部16将字符识别器12的识别结果R与基于人的字符识别结果进行对照。
如此,在本实施方式中,除准确度P为阈值T1以下的情况以外,在检测到删除线的情况下,也进行字符识别器12的识别结果R与人的字符识别结果的对照。
在字符识别器12的识别结果R与输入到键输入部14的人的字符识别结果匹配(即一致)的情况下,对照部16将该识别结果R作为信息处理装置的最终的字符识别结果而输出。另一方面,在基于对照部16的对照结果不匹配(即不一致)的情况下,从除A以外的其他人接收该输入图像的字符识别结果的输入,并利用所接收到的输入来求出信息处理装置的最终的字符识别结果。关于针对对照结果不匹配的情况的处理,以下,参考图4及图5对具体的例子进行说明。
如以上说明,根据图1所示的信息处理装置,在删除线检测部50从输入图像中检测到删除线的情况下,对照字符识别器12的识别结果R与人的字符识别结果。即使在删除线检测部50将输入图像中所包含的读取噪声或纸面的折痕、污垢等图像误检测为删除线的情况下,多数情况下,人眼观察就能知道该图像不是删除线。在这种情况下,人将输入图像中的字符串识别为不存在删除线的字符串,并将识别结果输入到键输入部14。从而,即使在输入图像中的非删除线的图像被误检测为删除线的情况下,在字符识别器12的识别结果R正确的情况下判定为该识别结果R在对照部16中与人的字符识别结果匹配,并作为最终的识别结果而输出。
另一方面,在删除线检测部50检测到的删除线是真正的删除线的情况下,A对该删除线进行识别,并对键输入部14进行表示存在删除线的规定的输入(例如以空白状态进行确定等输入)。该输入值是与字符识别器12的识别结果R不同的值,因此对照部16中的对照结果一定不匹配。从而,在输入图像中存在真正的删除线的情况下,字符识别器12的识别结果R不会作为最终的字符识别结果而输出。
在检测到删除线时舍弃字符识别器的识别结果R的现有方式中,在检测到删除线的情况下,只能取决于基于人的字符识别结果。该情况下,可以考虑采用来自键输入部14的A的输入来直接作为信息处理装置的最终的字符识别结果。然而,人们往往有失误,因此多数情况下判断若仅凭一个人的识别结果,则可靠性不充分。由此,为了提高可靠性,还可以考虑将两人以上的人的字符识别结果进行对照,并根据该对照结果求出最终的字符识别结果。然而,使两人以上的人工作成本就会提高。
相对于此,在本实施方式中,在检测到删除线的情况下,将字符识别器12的识别结果R与作为人的A的字符识别结果进行对照,在两者匹配的情况下,采用识别结果R作为最终的识别结果。关于该情况下的最终的识别结果,由于2个独立的识别结果匹配,因此比A单独的字符识别结果可靠性更高。并且,进行对照的结果,在字符识别器12的识别结果R与A的字符识别结果匹配的情况下,不需要第2个人的输入,因此与检测到删除线则必须对照2人以上的输入的方式相比,所需成本降低。
接着,参考图4对对照部16中的对照结果不匹配的情况下的用于处理的结构的一例进行说明。在图4中,对与图1所示的要件相同的要件标注相同的符号,并省略重复说明。
图4所示的信息处理装置具有图1所示的信息处理装置的要件组,而且还具有键输入部22、第2对照部24及键输入部26。
键输入部22从不同于A的人即B接收输入图像的字符识别结果的输入。第2对照部24将从对照部16输入的A的输入和从键输入部22输入的B的输入进行对照。键输入部26将不同于A和B的C接收输入图像的字符识别结果的输入。
在图4的例子中,在字符识别器12的识别结果R与A的字符识别结果的对照结果不匹配的情况下,对照部16将A的字符识别结果输入到第2对照部24。并且,该情况下,键输入部22将输入图像提供于B的终端,与其相应地将B所输入的字符识别结果输入到第2对照部24。第2对照部24进行A的字符识别结果与B的字符识别结果的对照,在这两者匹配的情况下,将该匹配的字符识别结果作为信息处理装置的最终的字符识别结果而输出。并且,在对照结果不匹配的情况下,第2对照部24启动键输入部26。键输入部26将输入图像提供于C的终端,并接收与其对应的来自C的字符识别结果的输入,采用该字符识别结果作为最终的字符识别结果。作为C,例如采用过去输入的字符识别结果的准确率高于A或B的人,由此在一定程度上确保最终的字符识别结果的精确度。
接着,参考图5对对照部16中的对照结果不匹配的情况下的用于处理的结构的另一例进行说明。在图5中示出在信息处理装置的结构中承担基于对照部16的对照处理以后的处理的部分。
在图5的例子中,当对照部16的对照结果不匹配的情况下,对照部16将此次的识别对象的输入图像、对该输入图像的A的输入数据及准确度P传递给分配处理部18,并请求分配处理。
在准确度P大于预先设定的阈值T2(其中,T2<T1)的情况下,分配处理部18将该输入图像传递给键输入部28。键输入部28将该输入图像提供于预先登录的D的终端,相对于此,接收D输入的字符识别结果,并将该字符识别结果作为对该输入图像的最终的识别结果而输出。在此,D是不同于A的人即可。
并且,在准确度P为阈值T2以下的情况下,分配处理部18将输入图像传递给键输入部22,并且将A的输入数据传递给第2对照部24。键输入部22将该输入图像提供于预先登录的B的终端,相对于此,接收B输入的字符识别结果,并将该字符识别结果传递给第2对照部24。第2对照部24将A的字符识别结果与B的字符识别结果进行对照,若该两个结果匹配,则将该匹配的字符识别结果作为对该输入图像的最终的字符识别结果而输出。另一方面,在第2对照部24的对照中两者不匹配的情况下,键输入部26将该输入图像提供于不同于A及B这两者的C的终端,相对于此,接收C输入的字符识别结果,并将该字符识别结果作为最终的识别结果而输出。
接着,参考图6例示出本实施方式的信息处理装置的另一结构。在图6中,对与图1的结构中的要件相同的要件标注同一符号,并省略重复说明。
图6的结构是将图1的结构中的识别控制部52替换为准确度调整部54和分配处理部13的结构。
准确度调整部54接收来自字符识别器12的对输入图像的识别结果R和准确度P、及来自删除线检测部50的表示从该输入图像中是否检测到删除线的信息。在从输入图像中检测到删除线的情况下,准确度调整部54将从字符识别器12接收的准确度P调整为小于阈值T1的值之后输出到分配处理部13。另一方面,在从输入图像中未检测到删除线的情况下,准确度调整部54将从字符识别器12接收的准确度P不进行变更而直接输出到分配处理部13。将准确度调整部54输出的准确度的值表示为准确度P′。准确度调整部54输出的准确度P′是“判定用准确度”的一例。
分配处理部13根据从准确度调整部54输入的准确度P′而控制之后的处理路径。更详细而言,在准确度P′大于阈值T1的情况下,分配处理部13将字符识别器12的识别结果R作为信息处理装置的最终的字符识别结果而输出。另一方面,在准确度P′为阈值T1以下的情况下,将识别结果R和准确度P′输入到对照部16。对照部16进行的处理与图1的实施方式的情况相同。并且,当对照部16的对照结果不匹配的情况下,作为处理结构,可以采用图4或图5中例示的结构。
若从图6的结构中去除删除线检测部50和准确度调整部54,并将字符识别器12的输出直接输入到分配处理部13,则在该“具体实施方式”栏中成为与上述现有的信息处理装置相同的结构。
在图6的例子中,对该现有结构的各要件的功能不进行变更,而追加删除线检测部50及准确度调整部54,由此实现与图1的例子相同的功能。
以上例示出的实施方式的信息处理装置作为一例而能够构成为硬件的逻辑电路。并且,作为另一例,实施方式的信息处理装置可以通过使内置的计算机执行表示这些系统或装置内的各功能模块的功能的程序来实现。在此,计算机例如具有作为硬件的CPU等处理器、随机存取存储器(RAM)及随机访问存储器(ROM)等存储器(一次存储)、控制HDD(硬盘驱动器)的HDD控制器、各种I/O(输入输出)接口、控制用于与局域网等网络连接的网络接口等例如经由总线而连接的电路结构。并且,对于该总线,例如经由I/O接口而可以连接用于对CD、DVD等便携式磁盘记录媒体的读取及/或写入的磁盘驱动器、用于对闪存等各种标准的便携式非易失性记录媒体的读取及/或写入的存储器读写器等。记载有以上所例示出的各功能模块的处理内容的程序经由CD、DVD等记录媒体、或者经由网络等通信单元而保存于硬盘驱动器等固定存储装置并安装于计算机。存储于固定存储装置的程序读出到RAM,并通过CPU等处理器而被执行,由此实现以上例示出的功能模块组。并且,实施方式的信息处理装置可由以软件与硬件的组合构成。
上述本发明的实施方式是以例示及说明为目的而提供的。另外,本发明的实施方式并不全面详尽地包括本发明,并且并不将本发明限定于所公开的方式。很显然,对本发明所属的领域中的技术人员而言,各种变形及变更是自知之明的。本实施方式是为了最容易理解地说明本发明的原理及其应用而选择并说明的。由此,本技术领域中的其他技术人员能够通过对假定为各种实施方式的特定使用最优化的各种变形例来理解本发明。本发明的范围由以上的权利要求书及其等同物来定义。
符号说明
12-字符识别器,13、18-分配处理部,14、22、26、28-键输入部,16-对照部,24-第2对照部,50-删除线检测部,52-识别控制部,54-准确度调整部。
Claims (5)
1.一种信息处理装置,其包括:
字符识别单元,通过对输入图像进行字符识别而输出字符识别结果;
接收单元,接收对所述输入图像的基于人的字符识别结果的输入;
检测单元,从所述输入图像中检测删除线;
对照单元,用于进行所述字符识别单元输出的字符识别结果与所述接收单元接收到的所述基于人的字符识别结果的对照;及
控制单元,进行如下控制:当所述检测单元检测到所述删除线的情况下,使所述对照单元进行所述对照,并根据所述对照结果求出最终的字符识别结果。
2.根据权利要求1所述的信息处理装置,其中,
所述字符识别单元还输出所述字符识别结果的准确度,并且
所述控制单元在所述字符识别单元输出的所述准确度小于阈值的情况下,或者在所述检测单元检测到所述删除线的情况下进行所述控制,在所述准确度为所述阈值以上且所述检测单元未检测到所述删除线的情况下不进行所述控制,而将所述字符识别单元的所述字符识别结果设为最终的字符识别结果。
3.根据权利要求1所述的信息处理装置,其中,
所述字符识别单元还输出所述字符识别结果的准确度,并且
所述控制单元在所述检测单元未检测到所述删除线的情况下,采用所述字符识别单元输出的所述准确度作为判定用准确度,当所述检测单元检测到所述删除线的情况下,将所述字符识别单元输出的所述准确度变更为阈值以下的值,并采用该变更后的准确度作为所述判定用准确度,并且在所述判定用准确度为所述阈值以下的情况下进行所述控制,在所述判定用准确度大于所述阈值的情况下不进行所述控制,而将所述字符识别单元的所述字符识别结果设为最终的字符识别结果。
4.一种记录媒体,其记录有用于使计算机作为如下单元而发挥功能的程序:
字符识别单元,通过对输入图像进行字符识别而输出字符识别结果;
接收单元,接收对所述输入图像的基于人的字符识别结果的输入;
检测单元,从所述输入图像中检测删除线;
对照单元,用于进行所述字符识别单元输出的字符识别结果与所述接收单元接收到的所述基于人的字符识别结果的对照;及
控制单元,进行如下控制:当所述检测单元检测到所述删除线的情况下,使所述对照单元进行所述对照,并根据所述对照结果求出最终的字符识别结果。
5.一种信息处理方法,其包括如下步骤:
字符识别步骤,通过对输入图像进行字符识别而输出字符识别结果;
接收步骤,接收对所述输入图像的基于人的字符识别结果的输入;
检测步骤,从所述输入图像中检测删除线;
对照步骤,用于进行在所述字符识别步骤中输出的字符识别结果与在所述接收步骤中接收到的所述基于人的字符识别结果的对照;及
控制步骤,进行如下控制:当在所述检测步骤中检测到所述删除线的情况下,在所述对照步骤中进行所述对照,并根据所述对照结果求出最终的字符识别结果。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019010051A JP7326753B2 (ja) | 2019-01-24 | 2019-01-24 | 情報処理装置及びプログラム |
JP2019-010051 | 2019-01-24 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111476073A CN111476073A (zh) | 2020-07-31 |
CN111476073B true CN111476073B (zh) | 2023-07-18 |
Family
ID=71732483
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910831163.7A Active CN111476073B (zh) | 2019-01-24 | 2019-09-04 | 信息处理装置、记录媒体及信息处理方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11100356B2 (zh) |
JP (1) | JP7326753B2 (zh) |
CN (1) | CN111476073B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023248449A1 (ja) * | 2022-06-23 | 2023-12-28 | 株式会社東芝 | 文字認識装置、文字認識方法、及びプログラム |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09190498A (ja) * | 1996-01-09 | 1997-07-22 | Fujitsu Ltd | 文字認識装置及び文字認識方法 |
JP2000196790A (ja) * | 1998-12-25 | 2000-07-14 | Matsushita Electric Ind Co Ltd | ファクシミリ装置 |
CN101515323A (zh) * | 2008-02-19 | 2009-08-26 | 富士通株式会社 | 字符识别装置和字符识别方法 |
CN101859379A (zh) * | 2009-04-13 | 2010-10-13 | 日立软件工程株式会社 | 下划线删除装置 |
JP2011237993A (ja) * | 2010-05-10 | 2011-11-24 | Fuji Xerox Co Ltd | 情報入力装置及び情報入力プログラム |
JP2012064057A (ja) * | 2010-09-16 | 2012-03-29 | Toshiba Corp | 文字認識装置、区分装置、区分制御装置、及び文字認識方法 |
JP2016212812A (ja) * | 2015-05-14 | 2016-12-15 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
CN107533652A (zh) * | 2015-05-11 | 2018-01-02 | 株式会社东芝 | 识别装置、识别方法及程序 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000082110A (ja) | 1998-07-02 | 2000-03-21 | Ricoh Co Ltd | 罫線消去装置および文字画像抽出装置および罫線消去方法および文字画像抽出方法および記録媒体 |
US6295387B1 (en) * | 1999-05-27 | 2001-09-25 | Lockheed Martin Corporation | Method and apparatus for determination of verified data |
RU2251736C2 (ru) * | 2002-12-17 | 2005-05-10 | "Аби Софтвер Лтд." | Способ идентификации зачеркнутых символов при распознавании рукописного текста |
JP2007280266A (ja) | 2006-04-11 | 2007-10-25 | Konica Minolta Business Technologies Inc | 画像処理装置、原稿訂正方法および原稿訂正プログラム |
JP5640645B2 (ja) | 2010-10-26 | 2014-12-17 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP5677139B2 (ja) | 2011-03-07 | 2015-02-25 | 三菱電機株式会社 | 帳票文字認識装置 |
JP5647919B2 (ja) * | 2011-03-07 | 2015-01-07 | 株式会社Nttドコモ | 文字認識装置、文字認識方法、文字認識システム、および文字認識プログラム |
JP6886100B2 (ja) | 2015-11-20 | 2021-06-16 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、その処理方法及びプログラム |
US10095946B2 (en) * | 2016-07-07 | 2018-10-09 | Lockheed Martin Corporation | Systems and methods for strike through detection |
-
2019
- 2019-01-24 JP JP2019010051A patent/JP7326753B2/ja active Active
- 2019-07-23 US US16/518,994 patent/US11100356B2/en active Active
- 2019-09-04 CN CN201910831163.7A patent/CN111476073B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09190498A (ja) * | 1996-01-09 | 1997-07-22 | Fujitsu Ltd | 文字認識装置及び文字認識方法 |
JP2000196790A (ja) * | 1998-12-25 | 2000-07-14 | Matsushita Electric Ind Co Ltd | ファクシミリ装置 |
CN101515323A (zh) * | 2008-02-19 | 2009-08-26 | 富士通株式会社 | 字符识别装置和字符识别方法 |
CN101859379A (zh) * | 2009-04-13 | 2010-10-13 | 日立软件工程株式会社 | 下划线删除装置 |
JP2011237993A (ja) * | 2010-05-10 | 2011-11-24 | Fuji Xerox Co Ltd | 情報入力装置及び情報入力プログラム |
JP2012064057A (ja) * | 2010-09-16 | 2012-03-29 | Toshiba Corp | 文字認識装置、区分装置、区分制御装置、及び文字認識方法 |
CN107533652A (zh) * | 2015-05-11 | 2018-01-02 | 株式会社东芝 | 识别装置、识别方法及程序 |
JP2016212812A (ja) * | 2015-05-14 | 2016-12-15 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
Non-Patent Citations (1)
Title |
---|
一种通用的去除文字图像中干扰线的算法;程治国,刘允才;上海交通大学学报(第08期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111476073A (zh) | 2020-07-31 |
JP7326753B2 (ja) | 2023-08-16 |
US11100356B2 (en) | 2021-08-24 |
JP2020119289A (ja) | 2020-08-06 |
US20200242390A1 (en) | 2020-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7650035B2 (en) | Optical character recognition based on shape clustering and multiple optical character recognition processes | |
US7697758B2 (en) | Shape clustering and cluster-level manual identification in post optical character recognition processing | |
US8175394B2 (en) | Shape clustering in post optical character recognition processing | |
US8340425B2 (en) | Optical character recognition with two-pass zoning | |
US7162086B2 (en) | Character recognition apparatus and method | |
US20020114515A1 (en) | Character string recognition apparatus, character string recognizing method, and storage medium therefor | |
CN111476073B (zh) | 信息处理装置、记录媒体及信息处理方法 | |
WO2008031063A1 (en) | Shape clustering in post optical character recognition processing | |
JP5630689B2 (ja) | 文字認識方法及び文字認識装置 | |
JP5041775B2 (ja) | 文字切出方法及び文字認識装置 | |
US10997452B2 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
Baird | Global-to-local layout analysis | |
Kumar et al. | Line based robust script identification for indianlanguages | |
CN110598683B (zh) | 信息处理装置、信息处理方法 | |
JP3159087B2 (ja) | 文書照合装置および方法 | |
Agrawal et al. | Generalization of hindi OCR using adaptive segmentation and font files | |
KR102627591B1 (ko) | 문서로부터 정보를 추출하기 위한 장치의 동작 방법 및 그 장치 | |
JP3428504B2 (ja) | 文字認識装置 | |
Ishidera et al. | Top-down likelihood word image generation model for holistic word recognition | |
JP2924356B2 (ja) | 光学文字読取装置 | |
JP4304920B2 (ja) | 文字列認識装置とそのプログラム | |
JPH056464A (ja) | 文字列認識方法及びその装置 | |
JP2002074262A (ja) | 認識文字修正方法 | |
JPH09326012A (ja) | 文字認識装置および文字認識方法 | |
Raza | Algorithms for the recognition of poor quality documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
CB02 | Change of applicant information |
Address after: No. 3, chiban 9, Dingmu 7, Tokyo port, Japan Applicant after: Fuji film business innovation Co.,Ltd. Address before: No. 3, chiban 9, Dingmu 7, Tokyo port, Japan Applicant before: Fuji Xerox Co.,Ltd. |
|
CB02 | Change of applicant information | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |