CN105608453A - 字符识别系统及字符识别方法 - Google Patents

字符识别系统及字符识别方法 Download PDF

Info

Publication number
CN105608453A
CN105608453A CN201510785494.3A CN201510785494A CN105608453A CN 105608453 A CN105608453 A CN 105608453A CN 201510785494 A CN201510785494 A CN 201510785494A CN 105608453 A CN105608453 A CN 105608453A
Authority
CN
China
Prior art keywords
character
result
data
character string
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510785494.3A
Other languages
English (en)
Other versions
CN105608453B (zh
Inventor
横井博树
中岛和树
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information and Telecommunication Engineering Ltd
Original Assignee
Hitachi Information and Telecommunication Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Information and Telecommunication Engineering Ltd filed Critical Hitachi Information and Telecommunication Engineering Ltd
Publication of CN105608453A publication Critical patent/CN105608453A/zh
Application granted granted Critical
Publication of CN105608453B publication Critical patent/CN105608453B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/196Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
    • G06V30/1983Syntactic or structural pattern recognition, e.g. symbolic string recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Discrimination (AREA)

Abstract

本发明提供即使在包括字符种类不同的复式记录的票据时也能提高精度和效率并能减轻用户的作业负担的字符识别系统及字符识别方法。字符识别系统包括:票据输入部,获得票据的图像数据;字符识别部,根据票据的图像数据,对作为两个字段的两个字符串的第一字段的第一字符串和第二字段的第二字符串进行字符识别,获得识别结果字符数据;转换部,根据识别结果字符数据,当第一字符串的字符种类与第二字符串的字符种类不同时,将一个字符串转换成与另一个字符串字符种类匹配,获得转换结果字符数据;比较部,根据转换结果字符数据,比较第一字符串和第二字符串,判断一致或不一致,获得比较结果数据;及输出部,向用户输出包括比较结果数据的输出数据。

Description

字符识别系统及字符识别方法
技术领域
本发明涉及利用OCR(OpticalCharacterReader:光符阅读器)的字符识别技术。
背景技术
利用了OCR的字符识别系统从账单、支票等票据读取图像,识别记在票据栏中的字符,获得其字符数据。用户通过画面查看该字符数据,进行票据填入内容的确认,数据的修改或确定等作业。
作为利用了OCR的字符识别系统相关的在先技术的例子,例如可列举日本特开2002-92545号公报(专利文献1)。专利文献1中公开了对填在票据两栏中的两个金额的字符进行字符识别的内容。
在先技术文献
专利文献
专利文献1:日本特开2002-92545号公报
发明内容
发明要解决的技术问题
有时会在票据中的两栏或者两处填入具有对应关系的两个字符串作为复式记录。对于金额等重要的信息,有时出于确保正确性、防止窜改等目的进行复式记录。复式记录有时还被称为复填。有些票据中同时设有用于复式记录的两个栏。例如,在账单中,往金额的填入栏填入金额的字符串,往复填栏中填入与填入栏的金额相同金额的字符串。
现有的字符识别系统在对票据的复式记录的两个字符串只是分别进行字符识别来获得数据时,未对两个字符串的对应关系进行判断。这时,用户获得错误的金额等字符串的可能性、没有注意到两个字符串不一致的可能性高。
专利文献1中公开的技术是适用于在票据的两栏中以相同种类的字符、例如阿拉伯数字填入了相同金额的情况的技术。
但是,也存在在票据的复式记录的两栏或者两处以不同种类的字符填入或印刷相同金额的情况。例如,在填入栏以阿拉伯数字填入金额,在复填栏中以汉字数字填入相同的金额。如果是没有复填栏的票据,有时也会在接近填入栏的地方填入金额。
在上述情况下,由于两个金额的字符种类不同,因此,现有的字符识别系统无法进行简单比较以及对应关系的判断等。用户需要看两个金额的字符识别结果,对两个金额进行比较来判断及确认是否有金额的误填、窜改等可能性。用户需要对每个票据进行这样的作业,消耗劳力和时间。
尤其是,当两个金额的字符种类不同时,与字符种类相同时相比,用户更加难以一眼就能进行金额的比较、判断。并且,当介入有用户的票据确认等作业时,进行多个票据的处理的字符识别系统需要暂停处理。为此,为了处理多个票据需要消耗较长时间,用户的作业负担增大。
如上所述,关于包括复式记录的票据的字符识别,现有的字符识别系统从精度、效率的观点来看具有改善的余地。
本发明的目的在于,针对字符识别系统,提供一种即使在包括字符种类不同的复式记录的票据时,也能提高精度和效率,减轻用户的作业负担的技术。
用于解决技术问题的方案
本发明中的代表性的实施方式是一种字符识别系统以及字符识别方法,其特征在于具有以下所示的构成。
一实施方式的字符识别系统包括:票据(帳票)输入部,输入票据,并获得该票据的图像数据;字符识别部,根据所述票据的所述图像数据,对作为两个字段的两个字符串的第一字段的第一字符串和第二字段的第二字符串进行字符识别,获得识别结果字符数据;转换部,根据所述识别结果字符数据,在所述第一字符串的字符种类与所述第二字符串的字符种类不同时,对一个字符串进行转换,使所述一个字符串的字符种类与另一个字符串的字符种类匹配,从而获得转换结果字符数据;比较部,根据所述转换结果字符数据,比较所述第一字符串和所述第二字符串,并判断一致或不一致,从而获得比较结果数据;以及输出部,向用户输出包括所述比较结果数据的输出数据。
发明效果
根据本发明中的代表性的实施方式,关于字符识别系统,即使是在包括字符种类不同的复式记录(二重エントリ)的票据的情况下,也能提高精度和效率,减轻用户的作业负担。
附图说明
图1是示出本发明的实施方式一的字符识别系统的构成的图。
图2的(a)~(c)是示出实施方式一中的票据的具体例子的图。
图3是示出实施方式一中的处理及作业的简要流程的图。
图4是示出实施方式一中的误读减少模式时的处理流程的图。
图5是示出实施方式一中的读取指定时的画面例子的图。
图6的(a)~(d)是示出实施方式一中的目标位置的读取例子的图。
图7的(a)~(c)是示出实施方式一中的位置偏移校正处理的例子的图。
图8的(a)~(c)是示出实施方式一中的位数比较处理的例子的图。
图9的(a)和(b)是示出实施方式一中的字符串转换处理的例子的图。
图10的(a)和(b)是示出实施方式一中的用于字符串转换处理的转换表的例子的图。
图11是示出实施方式一中的第一转换时的转换处理流程的图。
图12是示出实施方式一中的第二转换时的转换处理流程的图。
图13的(a)~(c)是示出实施方式一中的字符串比较处理的例子的图。
图14的(a)~(c)是示出实施方式一中的窜改可能性判断处理的例子的图。
图15的(a)~(d)是示出实施方式一中的结果画面的输出例子的图。
图16的(a)和(b)是示出实施方式一中的结果画面的输出例子的图。
图17是示出实施方式一中的不可读减少模式时的处理流程的图。
图18是示出实施方式一中的第一转换时的包括转换处理及比较处理的流程的图。
图19是示出实施方式一中的第二转换时的包括转换处理及比较处理的流程的图。
图20是示出实施方式一中的作为有不可读时的处理的、第一转换时的例子的图。
图21的(a)和(b)是示出实施方式一中的有不可读时的处理表的例子的图。
图22是示出本发明的实施方式二的字符识别系统的构成的图。
具体实施方式
下面,基于附图详细说明本发明的实施方式。需要注意的是,在用于说明实施方式的所有图中,对相同部位原则上标注相同的标记,并省略其重复说明。
(实施方式一)
利用图1~图21对本发明的实施方式一的字符识别系统以及字符识别方法进行说明。实施方式一的字符识别系统是利用OCR进行票据的字符识别处理的系统。实施方式一的字符识别方法是包括在实施方式一的字符识别系统上基于用户的操作由计算机来执行的处理步骤的方法。
对于填入票据两处作为复式记录的两个金额等字符串,实施方式一的字符识别系统提供即使在这些字符的种类不同时也自动进行字符种类的转换、比较以及判断等高级功能。字符识别系统比较两个字符串,判断一致及不一致、误填、窜改等的可能性,根据其结果,向用户输出包括告警等的结果画面,并保存输出数据。由此,帮助用户完成票据确认、修改等作业。
[字符识别系统]
图1示出了实施方式一的字符识别系统的构成。实施方式一的字符识别系统通过OCR装置1和PC2的连接而构成。实施方式一的字符识别系统在PC2中进行有关票据5的OCR处理的主处理。换言之,实施方式一的字符识别系统是软件OCR方式的系统。OCR装置1是进行票据5的OCR处理中的、到获得票据5的图像数据为止的处理的装置。PC2是通过软件处理来进行OCR处理的装置。换言之,OCR处理是获得票据5的数据化,字符串数据的处理。
用户利用实施方式一的字符识别系统操作OCR装置1以及PC2。用户进行票据5的记载内容的确认、数据的修改、确定等作业作为与票据5的OCR处理有关的作业。
票据5是用于指定的业务中的指定形式的票据,例如是账单、支票。未图示的填单人在票据5的栏内手写填入金额等字符。或者,利用写入器(writer)等设备在票据5的栏内打印金额等字符。用户接收提交的票据5。
为了进行作业,用户将一张以上的票据5安放并输入OCR装置1。用户操作PC2,进行与作业相关的设定、指示输入。PC2按照指示输入,向OCR装置1发送命令。OCR装置1按照来自PC2的命令,开始票据5的OCR处理。
OCR装置1包括票据输入部11。票据输入部11由未图示的扫描仪等硬件以及软件构成。OCR装置1通过票据输入部11读取并扫描票据5,获得票据5的图像数据21。OCR装置1向未图示的堆叠器排出读取完毕的票据5并进行储存。
OCR装置1和PC2通过规定的通信接口连接。OCR装置1包括未图示的通信接口装置。OCR装置1将通过票据输入部11获得的图像数据21经由通信接口装置的通信处理传输给PC2。
PC2具有控制装置201、存储装置202、输入装置203、显示装置204、印刷装置205以及通信接口装置206。控制装置201由CPU、ROM、RAM等构成。存储装置202包括存储器、磁盘等。输入装置203包括键盘、鼠标等。通信接口装置206进行与OCR装置1之间的通信接口所对应的通信处理。
输入装置203、显示装置204等也可以连接于PC2的外部。PC2还可以连接有其它的输入输出装置。PC2也可以通过通信接口装置206连接于LAN等通信网。PC2也可以将OCR处理所涉及的数据保存在连接于LAN等的服务器或存储设备中。
控制装置201通过加载存储在存储装置202中的程序20并执行软件处理,从而实现字符识别部12等各处理部。程序20是使PC2执行特有的OCR处理的程序。控制装置201具有字符识别部12、转换部13、比较部14、输出部15以及用户界面部16。
存储装置202存储图像数据21、识别结果字符数据22、转换结果字符数据23、比较结果数据24以及输出数据25等作为OCR处理所涉及的各数据。
PC2通过通信接口装置206接收从OCR装置1传输的票据5的图像数据21,并存储在存储装置202内。
字符识别部12输入票据5的图像数据21,对图像数据21进行字符识别处理,并输出作为其处理结果的识别结果字符数据22。字符识别部12将识别结果字符数据22存储在存储装置202中。
PC2具有进行后面说明的位置偏移校正处理、位数比较处理的功能。PC2基于识别结果字符数据22,进行位置偏移校正处理、位数比较处理。
转换部13输入存储装置202的识别结果字符数据22,对识别结果字符数据22进行指定的转换处理,并输出作为其处理结果的转换结果字符数据23。转换部13将转换结果字符数据23存储在存储装置202中。
比较部14输入存储装置202的转换结果字符数据23,对转换结果字符数据23进行指定的比较处理,并输出作为其处理结果的比较结果数据24。比较部14将比较结果数据24存储在存储装置202。比较部14进行后面说明的判断处理。该判断处理包括判断窜改等的可能性的处理。
输出部15输入存储装置202的比较结果数据24,作为指定的输出处理,构成包括比较结果数据24的输出数据25,并将输出数据25保存在存储装置202中。并且,输出部15利用用户界面部16以及显示装置204,向用户显示对应于输出数据25的OCR处理的结果画面。并且,输出部15还可以基于输出数据25将OCR处理结果借助印刷装置205进行印刷输出。
用户界面部16进行向用户提供作为字符识别系统以及OCR的作业相关的用户界面的画面的处理。画面包括字符识别系统的设定或作业的指示输入的画面、OCR处理的结果画面等。用户界面部16基于输出数据25构成基于Web页面等的画面数据,并基于画面数据使显示装置204显示结果画面。
实施方式一的字符识别系统也可以依次连续处理多个票据5。这时,OCR装置1依次读取并扫描所放置的多个票据5,获得每个票据5的图像数据21。OCR装置1将扫描完毕的票据5排出至堆叠器进行储存。PC2对多个票据5各自的图像数据依次进行OCR处理,获得每个票据5的比较结果数据24等。
PC2在某个票据5的处理结果是判断为该票据5的记载内容正常时,例如在复式记录的两个金额一致时,针对该票据5不输出告警,而保存该票据5相关的输出数据25。这时,PC2不停止多个票据5的连续处理地继续进行处理。
对于判断为正常的票据5,用户也可以直接确定该票据5的识别结果字符数据22等数据为正确的数据。并且,用户也可以在之后取出储存在OCR装置1的堆叠器中的票据5来确认内容。
PC2在某个票据5的处理结果是判断为票据5的记载内容异常时,例如在复式记录的两个金额不一致时,针对该票据5,随即输出包括告警的结果画面。这时,PC2暂时停止多个票据5的连续处理。当发出告警时,用户在PC2的结果画面中查看告警内容、识别结果字符数据22等,并对该票据5进行确认、修改等应对作业。并且,用户也可以取出储存在OCR装置1的堆叠器中的该票据5进行确认。用户在结束关于该票据5的应对作业之后,通过在画面进行指示输入,从而重新开始多个票据5的连续处理。
作为实施方式一的变形例,OCR装置1也可以根据来自PC2的命令,将判断为正常的票据5分开排出到正常用第一堆叠器中进行储存,将判断为异常的票据5分开排出到异常用第二堆叠器中进行储存。
作为实施方式一的变形例,PC2也可以在多个票据5的连续处理中,当判断为某个票据5为异常时,将包括告警的输出数据25保存在存储装置202中,而不是即刻输出包括该告警的结果画面。用户之后操作PC2从存储装置202读出包括该告警的输出数据25,并在画面上显示。用户可以对输出有告警的一张以上的票据5集中进行确认等作业。
[票据的例子]
图2的(a)示出了日本的账单例作为票据的第一例子,特别示出了票据中的金额的填入栏51以及复填栏52。该填入栏51以及复填栏52是为了金额的复式记录而设置的。填入栏51在“项目”及“合计”各行中以阿拉伯数字填入有金额。复填栏52在“项目”及“合计”各行中以汉字数字填入有金额。复填栏52的金额是以不同字符种类填入的与填入栏51的金额相同的金额。数字栏61相当于填入栏51中的“合计”行的栏。数字栏61中以阿拉伯数字填入有合计金额。大写(大字)栏62相当于复填栏52中的“合计”行的栏。大写栏62中以汉字数字填入有合计金额。
需要注意的是,也有没有复填栏52的形式的票据。这时,作为复式记录的方式,例如在填入栏51的上下左右等任意接近位置以汉字数字填入金额。
数字栏61中例如填入有金额更加详细地说,该金额中使用了“0”~“9”等阿拉伯数字和“,”(逗号)、(日元符号)、“-”(连字符)等符号字符。“,”是为了表示位数而使用的。等字符是为了表示金额的开头而使用的。下面,将该符号字符也称为开头符号。“-”等字符是为了表示金额的末尾而使用的。下面,将该符号字符也称为末尾符号。需要注意的是,有时也不使用开头符号、末尾符号。
大写栏62中例如填入有金额“金壱千弐百陸拾伍円(金壹仟贰佰陆拾伍日元)”。和“金壱千弐百陸拾伍円”表示相同的金额1265日元。更加详细地说,该金额中使用了“壱(壹)”、“弐(贰)”、……、“玖(玖)”等汉字数字、“千(千)”等表示位数的汉字、“金(金)”等开头符号、“円(日元)”等末尾符号。“円”还是货币符号。
如上述例子所示,为了金额的明确化、防止窜改等,使用汉字数字和阿拉伯数字进行复式记录,并使用了开头符号、末尾符号。“壱”等“大写”是用于防止窜改等,其代替“一”等简单的汉字数字和“1”等简单的阿拉伯数字。根据票据、业务的不同,开头符号、末尾符号除了上述的之外还使用“整”、“※”等特定的符号字符。
图2的(b)示出了中国的账单例作为票据5的第二例子,特别示出了票据中的金额的填入栏71以及复填栏72。同样,该填入栏71以及复填栏72是为了金额的复式记录而设置的。填入栏71中以阿拉伯数字填入有金额。复填栏72中以汉字数字填入有金额。复填栏72的金额是以不同字符种类填入的与填入栏71的金额相同的金额。填入栏71中的小写栏81内以阿拉伯数字填入有合计金额。复填栏72中的大写栏82内以汉字数字填入有合计金额。需要注意的是,中文的数词的表达方式中有“小写”、“大写”。中文的“大写”相当于日语的“大字(大写)”。
“元”是金额的末尾符号,也是货币符号。“整”是辅助单位,当阿拉伯数字的“.”(句号)以下的数字是“00”时,使用“整”。其它辅助单位还有“角”、“分”。
小写栏81中例如填入有金额详细地说,该金额中使用了“0”~“9”等阿拉伯数字和“.”等符号。
大写栏82中例如填入有如下金额。
壹仟贰佰陆拾伍元整
和上述金额表示相同金额。详细地说,该金额中使用了下面这样的汉字数字。
零、壹、贰、叁、肆、伍、陆、柒、捌、玖、……
并且,详细地说,该金额中使用了“仟”等表示位数的汉字以及指定的开头符号、末尾符号。作为开头符号,使用了组合○和×而构成的符号、作为末尾符号,使用了“整”、“.00”。
图2的(c)的表格中示出了作为使用字符的数字的例子。第一行示出了阿拉伯数字。第二行和第三行示出了日本的汉字数字的例子。第四行示出了中国的汉字数字的例子。例如,“零”、“壹”~“玖”分别是对应于“0”,“1”~“9”的字符。在图2的(a)的日本的票据中,作为“大写”,使用了第一行的“壱(壹)”、“弐(贰)”等,但并不限定于此,有时还使用其它汉字数字。PC2保持在票据中使用的字符的数据。
[处理及作业的概要]
图3示出了实施方式一的字符识别系统以及字符识别方法中的处理以及作业的概要。S1等表示步骤。下面,依次说明图3的步骤S1~S5。
(S1)用户操作PC2,边看由用户界面部16提供的画面,边进行设定、指示输入。用户进行票据5中的对应于复式记录的两个目标位置的读取指定。目标位置是规定的栏、任意区域等的字段(フィールド)。并且,用户指定利用后面说明的扩展功能。并且,用户指定“误读减少模式”或者“不可读减少模式”作为后面说明的读取模式。用户在进行上述指定之后,输入OCR处理的执行指示。
需要注意的是,扩展功能对应于实施方式一的字符识别系统提供的高级功能。即、扩展功能对应于对票据的复式记录自动地进行转换、比较、判断以及结果输出等的功能。
(S2)PC2按照S1的指示输入,执行OCR处理的控制。PC2向OCR装置1发送命令。OCR装置1按照命令,执行图1的票据输入部11的处理,获得票据的图像数据21,并转发给PC2。PC2通过字符识别部12基于票据的图像数据21进行读取该票据的区域中的、在S1中指定的字段的字符识别处理,从而获得识别结果字符数据22。
(S3)当用户指定了扩展功能以及读取模式时,PC2进行对应于该指定的处理。PC2首先在S3中进行转换处理。
转换部13基于S2的识别结果字符数据22,针对票据的两个字段的字符串,转换一个字段的字符串的字符种类,使其与另一个字段的字符串的字符种类匹配,获得转换结果字符数据23。
(S4)PC2接着在S4中进行比较处理。比较部14基于转换结果字符数据23,比较一个字段的转换后的字符串和另一个字段的未转换的字符串,判断一致及不一致。并且,比较部14在进行比较时判断窜改等的可能性。作为处理的结果,比较部14获得比较结果数据24。
(S5)PC2接着在S5中进行输出处理。输出部15基于比较结果数据24,构成包括比较结果数据24的输出数据25。输出部15利用输出数据25,向用户显示OCR处理的结果画面。输出部15保存输出数据25。用户查看结果画面,进行票据记载内容的判断或确认、数据的修改、确定等作业。对每个票据同样地进行S1~S5的处理。在S1的画面中也可以指定多个票据的连续处理。
[读取模式]
实施方式一的字符识别系统有“误读减少模式”和“不可读减少模式”作为读取模式。读取模式是有关OCR处理的控制用模式。
“误读减少模式”是减少字符识别中的误读的模式。误读是指根据票据的图像识别字符后转换为错误的字符。在进行票据的作业时,用户在优先考虑减少误读,希望尽量消除误读时,利用误读减少模式。
在误读减少模式中,实施方式一的字符识别系统在字符识别处理中,当拿不准而不大好确定应根据图像转换为哪个字符时,为了避免误读的结果,不进行积极的转换,而是给出不可读的结果。由此,字符识别系统输出包括特定的告警等的结果画面,建议用户进行判断。不可读是指不能根据票据的图像识别字符而转换为一个字符。对于不可读的结果的字符,用户自己进行确认、判断。由此,减少对误读的字符的确定。
“不可读减少模式”是减少字符识别中的不可读的模式。在进行票据的作业时,用户在优先考虑减少不可读,希望尽量消除不可读时,利用不可读减少模式。
在不可读减少模式中,实施方式一的字符识别系统在字符识别处理中应用特有的处理,为了避免不可读的结果,进行基于积极的推测的字符转换。由此,对于在现有的字符识别处理时成为不可读的结果的字符也进行字符转换以解决不可读,并输出包括解决了不可读的字符的结果画面。
下面,首先采用图4~图16说明“误读减少模式”的情况。
[误读减少模式时的处理流程]
图4示出了PC2中的误读减少模式时的处理流程。下面,举例说明图4的步骤S101~S111的处理。
(S101)用户在PC2的画面中指定票据的两个目标位置的字段的读取、扩展功能以及“误读减少模式”等,并输入执行指示。两个字段例如是图2的(a)的填入栏51的区域91和复填栏52的区域92。
(S102)OCR装置1通过票据输入部11获得票据的图像数据21。PC2通过字符识别部12读取票据的包括两个字段的区域,获得包括两个字符串的数据的识别结果字符数据22。
(S103)PC2确认S102的识别结果字符数据22中的两个字符串中有没有不可读。当有不可读时(S103-否),作出意思为有不可读的确认结果,进入S111。这时,在S111中,显示意思为有不可读的结果画面,结束处理。当无不可读时(S103-是),进入S104。
(S104、S105)在S104中,PC2基于图像数据21以及识别结果字符数据22,对两个字符串进行位置偏移校正处理。位置偏移校正处理是应对在作为目标位置的填入栏51、复填栏52的区域内,将金额等字符串填入或者印刷于偏移位置时的处理。
当票据的区域的指定字段内存在目标字符串时,PC2将S104的处理结果设为“无空白”。当指定字段内没有目标字符串时,PC2搜索目标字段的周围。当搜索的结果是发现了字符串时,PC2将S104的处理结果设为“无空白”,并将该字符串包括在识别结果字符数据22中,在之后的处理中作为处理对象。当搜索的结果是未发现字符串时,该字段内为空白,因此,PC2将S104的结果设为“有空白”。
当S104的处理结果为“有空白”时(S105-否),PC2设定意思为“有空白”的结果,并进入S111。这时,在S111中,显示意思为“有空白”的结果画面,结束处理。当“无空白”时(S105-是),则进入S106。
(S106、S107)在S106中,PC2对两个目标位置的字段的字符串进行位数比较处理。在该处理中,对于两个字符串,PC2根据字符的种类判断各自的位数,比较两者的位数,并判断位数的一致/不一致。
在S107中,当S106的处理结果是位数不一致时(S107-否),PC2作出意思为位数不一致的判断结果,并进入S111。这时,在S111中,显示意思为位数不一致的结果画面,结束处理。当位数一致时(S107-是),则进入S108。
(S108)PC2通过转换部13对两个目标位置的字段的字符串进行字符的种类相关的转换处理。需要注意的是,也将字符的种类称为“字符种类”。在本例子中,如图2的(a)所示,有数字栏61的阿拉伯数字的字符串和大写栏62的汉字数字的字符串。由于两个字符串的字符种类不同,因此,转换部13进行字符种类的转换处理。
更加详细地说,字符种类的转换处理可以例举以下三种方式。说明中将它们称为第一转换、第二转换、第三转换。第一转换是转换汉字数字的字符串,使汉字数字与阿拉伯数字匹配。第二转换是转换阿拉伯数字的字符串,使阿拉伯数字与汉字数字匹配。第三转换是进行第一转换和第二转换两者。用户可以在PC2的画面中指定利用第一转换等中的哪个转换。
(S109)PC2通过比较部14对转换结果字符数据23中的成为相同字符种类的两个字符串进行比较处理,判断一致/不一致等。
(S110)并且,PC2通过比较部14对转换结果字符数据23中的两个字符串进行判断窜改等的可能性的处理。比较部14输出S109及S110的处理结果作为比较结果数据24。
(S111)PC2通过输出部15构成对应于S102~S110的处理结果的输出数据25,并加以保存。输出部15向用户显示基于输出数据25的结果画面。用户在结果画面中确认票据的数据内容。用户特别对复式记录的两个金额确认一致/不一致、告警的内容。
[读取指定的画面例]
图5示出了对应于图4的S101的读取指定时的画面例。对应于两个目标位置,在该画面中有右侧示出的“第一字段”栏和左侧示出的“第二字段”栏。例如为了读取图2的(a)的票据的数字栏61及大写栏62的金额,用户在该画面中指定两个区域91、92、字符种类。本例中,对于“第一字段”栏,数字栏61的区域91被设为目标位置。对于“第二字段”栏,大写栏62的区域92被设为目标位置。
在“第一字段”栏和“第二字段”栏中,分别有作为项目的“字符类型”、“字符种类”、“字符数”、“读取位置(坐标)”、“扩展功能”、“读取模式”。各项目既可以是文本输入形式,也可以是从列表框的选项中选择的形式等。
“字符类型”项目用于指定字段的字符串的字符类型。字符类型有全角、半角等。在本例中,“第一字段”指定为“半角”,“第二字段”指定为“全角”。“字符种类”项目用于指定字段的字符串的字符种类。字符种类有汉字数字、阿拉伯数字等。在本例中,“第一字段”指定为“阿拉伯数字”,“第二字段”指定为“汉字数字”。“字符数”项目用于指定字段的字符串的最大字符数。本例中,“第一字段”指定为“10”,“第二字段”指定为“18”。
“读取位置(坐标)”项目用坐标指定读取对象字段的位置。例如为了指定限定矩形区域的两点坐标,该项目包括“水平开始(スタート)”、“水平结束(エンド)”、“垂直开始”、“垂直结束”四个项目。本例中,在“第一字段”的情况下,目标区域91的左上点的坐标是(1000,500),右下点的坐标是(1400,550)。
在图2的(a)的例子中,以虚线框示出的区域91、92示出了被指定读取的字段的例子。需要注意的是,该区域91、92是去除了数字栏61及大写栏62中的一部分所得的区域的例子。一部分是指记载“(大字数字)”、“(数字)”的位置。但是,并不限定于此,可以指定票据内的任意区域作为字段。如图2的(b)的例子所示,与小写栏81、大写栏82相同的区域也可以指定作为字段。并且,这时,PC2也可以将包括在字段中的“(小写)”等指定的字符排除在对象外来进行处理。
“扩展功能”项目可以在利用扩展功能时进行指定。本例中,示出了选择“金额(不转换)”作为“第一字段”的“扩展功能”项目的值的情况。该值是指定第一字段是复式记录的金额的填入栏、以及在不对该填入栏的字符串的字符种类进行转换的情况下与第二字段的字符串进行比较等的值。并且,示出了选择“金额(转换)”作为“第二字段”的“扩展功能”项目的值的情况。该值是指定第二字段是复式记录的金额的复填栏、以及对复填栏的字符串的字符种类进行转换后与第一字段的字符串进行比较等的值。
“读取模式”项目可以从误读减少模式和不可读减少模式中选择指定读取模式。在本例中,“第一字段”及“第二字段”均指定为误读减少模式。
用户在上述画面中指定了两个字段的各项目的值之后,通过OK按钮进行设定。PC2根据该设定信息,进行OCR处理。PC2根据“字符种类”项目和“扩展功能”项目中的指定,进行字符种类的转换以及比较等处理。上述“字符种类”及“扩展功能”项目的设定例是对应于第一转换的设定例。需要注意的是,在第二转换时,“第一字段”的“扩展功能”项目被指定为“金额(转换)”,“第二字段”的“扩展功能”项目被指定为“金额(不转换)”。在第三转换时,双方的“扩展功能”项目被指定为“金额(转换)”。
并且,当“第一字段”及“第二字段”的字符串的“字符种类”项目的值相同、且双方的“扩展功能”项目被指定为“金额(不转换)”时,由于无需转换字符种类,因此,PC2不进行转换即比较双方的金额。当“扩展功能”项目中没有任何指定时,PC2不进行两个字符串的转换、比较,而是分别进行字符识别。
需要注意的是,作为变形例,还可以是“字符类型”和“字符种类”合并为一个项目的构成。
[字符识别的例子]
图6示出了图2的(a)的票据例子及图4的S102所对应的票据的两个目标位置的字段的字符识别的例子。字符识别部12读取指定字段内的字符串。
图6的(a)示出了第一字段及第二字段的字符识别结果中均无不可读的情况。右侧示出了第一字段的阿拉伯数字的字符串的数据。该字符串的数据是与填在图2的(a)的数字栏61内的字符串相同的正确的字符串开头符号是末尾符号是“-”。左侧示出了第二字段的汉字数字的字符串的数据。该字符串的数据是与填在图2的(a)的大写栏62内的字符串相同的正确的字符串“金壱千弐百陸拾伍円”。开头符号是“金”,末尾符号是“円”。
图6的(b)示出了第一字段的字符串的字符识别结果中有不可读的情况。在第一字段的阿拉伯数字中,字符“5”为不可读。图6的(c)示出了第二字段的字符串的字符识别结果中有不可读的情况。以符号“?”表示不可读的地方。在第二字段的汉字数字中,字符“弐”为不可读。图6的(d)示出了第一字段和第二字段双方的字符串的字符识别结果中均有不可读的情况。第二字段的汉字数字的字符“弐”和第一字段的阿拉伯数字的字符“5”为不可读。
当字符识别的结果是如图6(b)~(d)所示那样地两个字段中的一方或双方中有不可读的字符时,PC2将结果设为意思为有不可读的结果,并向用户显示包括对应的告警的结果画面。
[位置偏移校正处理]
图7示出了图4的S104所对应的位置偏移校正处理的例子。当与指定字段对应的图像为空白时,字符有可能被填入或者印刷在偏移的位置上。于是,作为位置偏移校正处理,PC2搜索指定字段的外侧,当发现了字符串时,进行校正,使该字符串包括在字符识别的结果中。
图7的(a)与图2的(a)的票据例子相对应,如701所示,金额的汉字数字被印刷于相对于大写栏62的区域向上侧偏移的位置,由此,大写栏62变成了空白。需要注意的是,在此大写栏62是第二字段。
图7的(b)示出了向大写栏62的区域的上下左右扩大范围来搜索字符串作为图7的(a)时的位置偏移校正处理的例子。702表示搜索的范围。HX表示向水平方向扩大的宽度的设定值。HY表示向垂直方向扩大的宽度的设定值。
PC2在702的范围内,以预定的字符符号为目标的同时搜索字符串。作为该目标字符符号,可列举上述的“金”等开头符号、“円”等末尾符号。可以任意设定上述范围的设定值。当即使扩大了范围也没有发现字符串时,PC2将结果设为意思为“有空白”的结果,并向用户显示包括对应的告警的结果画面。
图7的(c)示出了进行位置偏移校正处理等时使用的特定的符号字符的表703。该表703中对应于日本和中国以一览形式登记有开头符号、末尾符号、其它符号。需要注意的是,在这里,末尾符号包括“円”、“元”等货币符号。
[位数比较处理]
图8示出了对应于图4的S106的位数比较处理的例子。
图8的(a)示出了对应于图2的(a)的第一字段的阿拉伯数字的字符识别结果的字符串的数据和第二字段的汉字数字的字符识别结果的字符串的数据。PC2基于两个字符串中的开头符号、末尾符号、位数汉字、逗号等字符符号判断各自的位数,并对两者进行比较。PC2通过查看第一字段的字符串中的、位于开头符号与末尾符号“-”之间的阿拉伯数字及逗号部分、即“1,265”,从而得知阿拉伯数字的位数是4。并且,PC2通过查看第二字段的字符串中的、位于开头符号“金”与末尾符号“円”之间的位数汉字等,从而得知汉字数字的位数是4。位数汉字是“千”、“百”、“拾”等。本例中,两个字段的字符串的位数一致。
图8的(b)示出了用于位数比较处理的表。表801中针对日本和中国分别存储有每个位数汉字的位数。例如,位数汉字是“千”时,位数是4,位数汉字是“拾万”时,位数是8。
图8的(c)示出了为中国时的位数比较处理的例子。PC2参照第一字段的阿拉伯数字的字符串中的最后部分、即句号后的数字。句号后的数字例如是“00”。并且,PC2参照第二字段的汉字数字的字符串中的最后部分、即末尾符号。这里,末尾符号有汉字“元”以及“元”之后的汉字“整”。PC2参照图8的(b)的表802。
表802是用于图8的(c)的为中国时的位数比较处理的表。在该表802中,第一行的“末尾汉字”和第二行的“句号后的数字”相关联。例如,末尾汉字“整”与句号后的数字“00”对应。同样,末尾汉字“角”与句号后的数字“10”~“90”对应。末尾汉字“分”与句号后的数字“01”~“09”对应。
当上述位数比较处理的结果是两个字符串的位数不一致时,PC2将结果设为意思为位数不一致的结果,并向用户显示包括对应的告警的结果画面。需要注意的是,用户可以在设定画面中设定是否执行位置偏移校正处理、位数比较处理。
[转换处理例(1)]
图9的(a)示出了与图4的S108的第一转换时对应的字符种类的转换处理的例子。转换部13根据图10的转换表对作为比较对象的两个字段的字符串进行字符种类的转换处理。在进行第一转换时,第一字段的阿拉伯数字并不是转换的对象,第二字段的汉字数字是转换的对象。转换部13转换第二字段的字符串,使作为第二字段的字符串的字符种类的汉字数字与作为第一字段的字符串的字符种类的阿拉伯数字匹配。
图10示出了用于字符种类的转换处理的转换表的构成例。
图10的(a)示出了为日本时的转换表151的一部分。该转换表151中设定有第一列的“汉字数字”、第二列的“阿拉伯数字”以及第三列的“位数”的关联信息。根据该转换表151,例如,“零円”转换为“0”,“壱円”转换为“1”,“壱拾”转换为“10”。
同样,图10的(b)示出了为中国时的转换表152的一部分。该转换表152中还设定有“元”之后的“整”等字符、句号之后的数字以及位数的关联信息。根据该转换表152,例如,按以下进行转换。
“壹元”→“1”
“壹仟”→“1,000”
“整”→“00”
“壹分”→“01”
“壹角”→“10”
根据图10的(a)的转换表151,图9的(a)的第二字段的字符串中的“壱千(壹仟)”转换为“1,000”、“弐百(贰佰)”转换为“200”、“陸拾(陆拾)”转换为“60”、“伍円(伍日元)”转换为“5”。转换部13将各字符的转换后的数字相加。即、转换后的字符串的阿拉伯数字是1,000+200+60+5=1,265。
需要注意的是,第一转换和第二转换均可使用图10的转换表。进行第一转换时,转换表中第一列作为转换前的字符、第二列作为转换后的字符来进行参照。在进行第二转换时,转换表中的第二列作为转换前的字符、第一列作为转换后的字符来进行参照。
[转换处理例(2)]
图9的(b)示出了与图4的S108的第二转换时所对应的字符种类的转换处理的例子。转换部13根据图10的转换表对作为比较对象的两个字段的字符串进行字符种类的转换处理。在进行第二转换时,第一字段的阿拉伯数字是转换对象,第二字段的汉字数字并不是转换对象。转换部13转换第一字段的字符串,使作为第一字段的字符串的字符种类的阿拉伯数字与作为第二字段的字符串的字符种类的汉字数字匹配。
转换部13在进行第二转换时,利用图10的(a)的转换表151,将阿拉伯数字的每一个数字转换为汉字数字。根据图10的(a)的转换表151,图9的(b)的第一字段的字符串中的“1”转换为“壱千(壹仟)”、“2”转换为“弐百(贰佰)”、“6”转换为“陸拾(陆拾)”、“5”转换为“伍(伍)”。转换部13比较转换各数字后的每一个汉字与第二字段的字符串中的对应位置的未转换汉字,判断一致/不一致。当各转换后的字符全部一致时,综合性的比较结果为一致,当转换后的字符中有一个不一致时,综合性的比较结果是不一致。转换部13连接各转换后的字符而形成一个字符串。作为转换后的字符串的汉字数字是“壱千”+“弐百”+“陸拾”+“伍”=“壱千弐百陸拾伍”。
[转换以及比较处理(1)]
图11示出了与图4的S108的第一转换时相对应的、包括转换处理以及比较处理的流程。转换部13将第二字段的字符串的汉字数字转换为阿拉伯数字。比较部14对作为第二字段的转换后的字符串的阿拉伯数字和作为第一字段的未转换的字符串的阿拉伯数字进行整体比较,并判断一致/不一致。下面,说明图11的步骤S201~S209的处理。
(S201)转换部13从第二字段的字符串的开始字符起依次搜索到结束字符,查找“数字汉字”以及“位数汉字”的字符。在图9的(a)的例子中,从左端开始依次检测字符,开始字符是开头符号“金”,结束字符是末尾符号“円”。并且,“数字汉字”指“壱”等,“位数汉字”指“千”等。
(S202)转换部13利用图10的(a)的转换表151将在S201中获得的数字汉字以及位数汉字的字符转换为阿拉伯数字。需要注意的是,在为中国的情况下,利用图10的(b)的转换表152进行相同的处理。
(S203)转换部13将S202的转换结果的阿拉伯数字相加。
(S204)转换部13重复S201~S203的处理,直到第二字段的字符串中的对象字符的位数变成0为止。当位数为0时(S205-是),进入S205。位数为0指的是到达末尾符号“円”等的情况。
(S205)转换部13进行对到S204为止的第二字段的转换结果数字和第一字段的阿拉伯数字进行整体比较并判断一致/不一致等的比较处理,将其结果保存作为比较结果数据24。
(S206)转换部13在对象是日本的票据时(S206-否),结束处理,在对象是中国的票据时(S206-是),则进入S207。
(S207、S208)转换部13在中国票据中的第二字段的字符串中查找“元”之后的字符,同样地,转换为阿拉伯数字并相加。转换部13利用图10的(b)的转换表152将数字汉字、“角”等位数汉字转换为阿拉伯数字,并将作为转换结果的阿拉伯数字相加。转换部13重复相同的处理,直到到达字符串的最后字符(S208-否),到达最后字符(S208-是)时进入S209。
(S209)转换部13针对S207、S208的处理结果、即“元”之后的字符串的转换结果的阿拉伯数字,进行与第一字段的字符串的句号之后的阿拉伯数字的比较处理,并将其结果反映在比较结果数据24中进行保存。
[转换以及比较处理(2)]
图12示出了与图4的S108的第二转换时相对应的、包括转换处理及比较处理的流程。转换部13将第一字段的字符串的阿拉伯数字转换为汉字数字。比较部14进行作为第一字段的转换后的字符串的汉字数字与作为第二字段的未转换的字符串的汉字数字的比较处理,比较各位的每个字符,并判断一致/不一致。下面,说明图12的步骤S301~S311的处理。
(S301)转换部13从第一字段的字符串的开始字符起依次搜索到结束字符,关注(着目)各个字符中的[数字]。转换部13对其关注的每一个[数字]计算([位数]-n)。[位数]表示第一字段的字符串的位数。转换部13通过上述的位数比较处理获得[位数]。n表示重复处理的次数,最开始是n=0。在图9的(b)的例子中,转换部13从左端开始依次地,首先获得开头符号之后的数字“1”。字符串“1265”的[位数]是4。n=0。因此,([位数]-n)=(4-0)=4。
(S302)转换部13基于S301的[数字]以及([位数]-n)的计算值,利用图10的(a)的转换表151,将数字转换为汉字数字。转换部13基于([位数]-n)的计算值,参照转换表151的“位数”列的值。例如,计算值=4时,对应“位数”列的值为4的第四行。在该第四行的信息中,[数字]=“1”,因此,可以得知对应的阿拉伯数字是“1000”、汉字数字是“壱千”。因此,转换部13将关注的[数字]=“1”转换为汉字数字“壱千”。
(S303~S305)在S303中,转换部13将为S302的第一字段的转换结果的汉字数字的部分字符与第二字段的汉字数字中的对应位置的部分字符进行比较。当比较的结果为一致时(S304-是),转换部13进入S305,当不一致时(S304-否),则判断以字符串为单位的比较结果为不一致,进入S311。在S305中,由于重复n次,因此,转换部13在n上加1,其结果,当关注的[数字]的位数达到0时(S305-是),进入S306,位数不是0时(S305-否),返回S301重复相同的处理。
需要注意的是,在接下来n=1时,在S301中,([位数]-n)=(4-1)=3。由于该值=3,因此,参照转换表151的“位数”列的值为3的第三行。在第三行中,由于[数字]=“2”,因此,可以得知对应的阿拉伯数字是“200”、汉字数字是“弐百”。
(S306)转换部13在对象是中国时(S306-是),进行S307~S310的处理,在对象是日本时(S306-否),进入S311。
(S307)转换部13查找中国票据的字符串中的句号之后的数字。同样地,转换部13按照图10的(b)的转换表152将句号之后的数字转换为汉字数字。
(S308~S310)转换部13将S307的转换结果的汉字数字的部分字符与第二字段的汉字数字的部分字符进行比较,判断一致/不一致。当比较的结果为一致时(S309-是),转换部13进入S310,当不一致时(S309-否),判断以字符串为单位的比较结果为不一致,进入S311。在S310中,当是字符串的最后字符时(S310-是),进入S311,不是最后字符时(S310-否),返回S307重复相同的处理。
(S311)转换部13保存与两个字符串的一致或者不一致的结果所对应的比较结果数据24,结束处理。
[比较处理例]
图13示出了与图4的S109相对应的字符串的比较处理的例子。
图13的(a)示出了与图11对应的第一转换时的比较处理和与图12对应的第二转换时的比较处理的概要。需要注意的是,下面的说明中与第一转换相对应,将第二字段的转换后的字符串的阿拉伯数字与第一字段的未转换的字符串的阿拉伯数字的比较称为第一比较。与第二转换相对应,将第一字段的转换后的字符串的汉字数字与第二字段的未转换的字符串的汉字数字的比较称为第二比较。
图13的(b)示出了不一致的情况作为第一比较的例子。第二字段的转换后的字符串的阿拉伯数字与第一字段的未转换的字符串的阿拉伯数字不一致。第二字段的转换后的字符串的阿拉伯数字是正确的数字“1,265”。第一字段的未转换的字符串的阿拉伯数字是不正确的数字“7,265”。即、“1”和“7”的部分不一致。导致不正确的数字的原因可列举误填、窜改、字符识别中的误读等。误填时,填单人将“1”误填为“7”。窜改时,窜改人将已填入的“1”有意地加工为能够读成“7”。误读时,PC2在进行字符识别处理时,根据图像将“1”推测为“7”进行了字符转换。
图13的(c)示出了不一致的例子作为第二比较的例子。第一字段的转换后的字符串的汉字数字与第二字段的未转换的字符串的汉字数字不一致。第一字段的转换后的字符串的汉字数字是正确的“壱千弐百陸拾伍”。第二字段的未转换的字符串的汉字数字是不正确的“七千弐百陸拾伍”。即、“壱千”与“七千”的部分不一致。同样地,导致不正确的汉字数字的原因可列举误填、窜改、字符识别中的误读等。
需要注意的是,当指定了第三转换时,进行第一转换及第一比较和第二转换及第二比较两者。PC2向用户输出两者的结果。用户可以在画面上看到两者的结果来进行判断、确认。这时,由于是双重检查,所以能够进一步提高精度。
[窜改可能性判断处理]
图14示出了与图4的S110相对应的比较部14的窜改可能性判断处理的例子。
图14的(a)示出了进行第一转换及第一比较时的窜改可能性判断处理的例子。当如图13所示的两个字符串的比较处理的结果是不一致时,比较部14判断窜改等的可能性。比较部14参照图14的(b)的窜改可能性判断用的判断表140,判断窜改等的可能性。
本例中,第二字段的字符串是正确的汉字数字,第一转换的结果的字符串是正确的阿拉伯数字“1,265”。并且,对于第一字段的字符串的阿拉伯数字,在字符识别结果的字符串中变成不正确的阿拉伯数字“7,265”。因此,对两者的字符串的第一比较的结果是不一致。
图14的(b)示出了窜改可能性判断用的判断表140。在该判断表140中,设有“汉字数字(日本)”、“汉字数字(中国)”、“阿拉伯数字”、“窜改候选阿拉伯数字”各列。该表的各行中设定有可能有窜改等的可能性的组合或者可能性高的组合。“汉字数字(日本)”列中以一览形式存储有为日本时的汉字数字的字符。同样地,“汉字数字(中国)”列中以一览形式存储有为中国时的汉字数字的字符。“阿拉伯数字”列中存储有与“汉字数字”的值对应的阿拉伯数字的字符。在“窜改候选阿拉伯数字”列中,针对该行的汉字数字与阿拉伯数字的组,存储有被考虑为窜改等的候选的阿拉伯数字。
例如,第一行中,针对“壱”和“1”的组,“4”、“7”、“9”被设定为窜改候选阿拉伯数字。这是鉴于例如窜改人将“1”窜改为其它数字时,改成“4”、“7”、“9”的可能性较高,因此设定了“4”、“7”、“9”。
图14的(c)示出了实际的窜改的例子。从左侧开始示出了将“1”改为“4”的例子、将“1”改为“7”的例子、将“2”改为“3”的例子。这样,存在通过加线条或删线条来窜改数字的可能性。并且,除了有意的窜改之外,还存在包括尘土的附着等在内地误加了线条或误删了线条的可能。而且,当填入的是难以辨认的模糊不清的形状的字符时,在字符识别结果中出现误读、不可读的可能性高。
当图14的(a)的第一比较的结果是不一致时,比较部14掌握不一致的部分“1”和“7”、以及“1”的转换前的字符“壱”。然后,比较部14基于“壱”、“1”和“7”的组合,对判断表140进行参照,当有符合该组合的行时将其检出。本例中,第一行的“窜改候选阿拉伯数字”的值中有“7”,因此,第一行符合该组合。因此,比较部14对图14的(a)的比较结果判断为窜改可能性高。相反,当判断表140中没有符合的行时,比较部14对比较结果判断为窜改可能性低。
[结果画面的输出例]
图15和图16示出了与图4的S111相对应的、输出部15的结果画面的输出例。利用图2的(a)的票据例子进行说明。输出部15对应图4的有不可读等的各判断结果,输出显示内容不同的结果画面。
图15的(a)示出了两个字段的字符串的比较结果为一致时的输出例。进行第一转换及第一比较的结果,双方的字符串一致。输出部15在画面上直接显示两个字段的字符识别结果的字符串,并显示作为比较结果信息的“金额一致。”等消息。并且,输出部15也可以在画面上显示第二字段的字符种类转换后的字符串。在画面上例如显示“转换后的金额:1,265”等信息。
当得到上述一致的结果时,输出部15判断为正常,不输出告警。并且,输出部15在画面上以黑白、蓝色等不显著的颜色显示字段及其金额的字符串等信息。并且,这时,输出部15也可以只保存对应的输出数据25,而不显示画面。
并且,输出部15在画面内设置OK按钮、修改按钮。用户在画面上查看并确认了与某票据相关的OCR处理的结果时,可以通过OK按钮来结束。并且,用户在画面上查看结果并进行数据的修改等作业时,可以通过修改按钮来过渡到与该票据的数据相关的修改用画面。
图15的(b)示出了在两个字段的字符串中的一方或双方中,字符识别的结果是有不可读时的输出例。本例中,第一字段的阿拉伯数字中有不可读。输出部15在画面中显示字符识别结果的字符串时,例如以符号“?”表示不可读的地方。
在该结果的情况下,输出部15输出第一告警。第一告警是低级告警,相当于引起用户注意。作为第一告警,输出部15在画面上显示“有不可读的地方“?”。”等消息。并且,作为第一告警,输出部15在画面中以黄色等显示包括不可读的字段或者两个字段。由此,与图15的(a)这样的无告警时相比,更加引人注目。
图15的(c)示出了在两个字段的字符串中的一方或双方中存在空白时的输出例。本例中,第二字段是空白。当进行字符识别及位置偏移校正处理的结果是有空白时,输出部15在该画面中将字段的数据显示为空白。
在该结果的情况下,输出部15例如输出第一告警。输出部15在画面上显示“有空白。”等消息。并且,输出部15在画面上以黄色等显示包括空白的字段或者两个字段。
图15的(d)示出了两个字段的字符串中位数不一致时的输出例。本例中,第一字段的阿拉伯数字是“265”,其位数是3。第二字段的汉字数字的位数是4。因此,双方的位数不一致。
在该结果的情况下,输出部15例如输出第一告警。输出部15在画面上显示“位数不一致。”等消息。输出部15在画面上以黄色等显示两个字段。输出部15也可以在画面上显示转换后的字符串的金额、各字符串的位数。
图16的(a)示出了两个字段的字符串的比较结果为不一致、且窜改可能性判断处理的结果是判断为窜改可能性低时的输出例。本例中,第一字段的字符串是正确的阿拉伯数字“1,265”,第二字段的字符串是错误的汉字数字“壱千陸百陸拾伍”。并且,转换后的金额是“1,665”,双方的金额不一致。不一致的部分的组合是“陸”、“6”、“2”。在图14的窜改可能性判断处理中,判断表140中没有符合“陸”、“6”、“2”的组合的行,因此,判断为窜改可能性低。
在该结果的情况下,输出部15例如输出第一告警。输出部15在画面上显示作为比较结果信息的“金额不一致。”等消息、以及转换后的字符串的金额等。输出部15在画面上以黄色等显示两个字段。并且,输出部15也可以用不同颜色或标记等突出显示字段的字符串中的不一致的地方的字符,以使容易得知。
图16的(b)示出了两个字段的字符串的比较结果为不一致、且窜改可能性判断处理的结果是判断为窜改可能性高时的输出例。本例中,第一字段的字符串是错误的阿拉伯数字“7,265”,第二字段的字符串是正确的汉字数字“壱千弐百陸拾伍”。并且,转换后的金额是“1,265”,双方的金额不一致。不一致的部分的组合是“壱”、“1”、“7”。在图14的窜改可能性判断处理中,判断表140中有符合“壱”、“1”、“7”的组合的行,因此,判断为窜改可能性高。
在该结果的情况下,输出部15输出第二告警。第二告警是比第一告警更强级别的告警,相当于对用户的警告。作为第二告警,输出部15在画面上以红色等显眼的颜色显示两个字段。并且,输出部15在画面上显示作为比较结果信息的“金额不一致。”、“有窜改的可能性。”等消息、以及转换后的字符串的金额等。用户根据第二告警,可以考虑窜改可能性来进行确认、判断。
并且,输出部15也可以在画面上显示两个字段的字符串的金额的金额差。例如,比较部14计算金额差。第一字段的金额是“7265”、第二字段的金额是“1265”时,金额差是7265-1265=6000。输出部15在画面上显示“金额差=6000”这样的信息。
进而,比较部14将上述金额差与阈值进行比较,当金额差大到在阈值以上时,也可以输出上述第二告警、或者输出比第二告警更强级别的告警。用户可以考虑金额差来进行确认、判断。
如上所述,PC2推测比较结果为不一致的原因,并向用户输出包括与比较结果、原因推测相应的告警的结果画面,帮助用户进行判断。对于日本、中国的票据中的复式记录的两个金额等字符串,用户可以在结果画面上查看并确认字符识别结果的字符串数据、比较或判断的结果以及告警内容。因此,用户可以简单地确认、判断,从而高效地进行作业。需要注意的是,在实施方式一中,关于告警,大致区分为第一告警和第二告警两种,但是,可以并不限定于此。
[不可读减少模式时]
接着,利用图17~图21说明“不可读减少模式”的情况。不可读减少模式时的处理与误读减少模式时的处理的主要区别在于以下所举出的。
当对两个字段的字符串的第一字符识别的结果中有不可读时,PC2进行与有不可读时相对应的特有的处理。该特有的处理包括第二字符识别的处理、包括窜改可能性判断的比较处理。需要注意的是,在说明中将字符识别部12的字符识别处理分为两个阶段的处理,作为第一字符识别、第二字符识别。第一字符识别的处理与现有的处理相同,暂时给出包括有无不可读的结果。第二字符识别的处理是新的处理,对第一字符识别的结果中的不可读的字符进行用于解决不可读的字符转换。
[不可读减少模式时的处理流程]
图17示出了PC2中的不可读减少模式时的处理流程。下面,举例说明图17的步骤S401~S409的处理。
(S401)用户在PC2的画面中指定票据的复式记录的两个目标位置的字段的读取、扩展功能以及“不可读减少模式”等,并输入执行指示。
(S402~S404)S402~S404的处理与图4的S102、S104、S106的处理基本相同。在S402中,通过由字符识别部12进行的第一字符识别的处理,获得识别结果字符数据22。这时,作为字符识别结果,有时会发生“不可读”的情况。在“不可读减少模式”中,即使在字符识别结果中有“不可读”的字符时,PC2也不会结束处理,而是进行接下来的S403之后的处理。在S403中进行位置偏移校正处理,在S404中进行位数比较处理。
(S405)在S405中,PC2确认有无不可读。当无不可读时(S405-是),进入S406,当有不可读时(S405-否),进入S407。
(S406)比较部14对一个字段的字符串和另一个字段的字符串进行与无不可读时对应的转换及比较处理。该转换及比较处理与图4的S108、S109相同。
(S407)比较部14对一个字段的字符串和另一个字段的字符串进行与有不可读时对应的转换及比较处理。在转换处理中,转换部13根据图10的转换表,对S402的字符识别结果的字符串中的除了“不可读”以外的字符进行字符种类的转换。
(S408)在S406或者S407之后,比较部14对转换结果字符数据23中的两个字符串进行判断窜改等的可能性的处理。比较部14输出处理结果作为比较结果数据24。
(S409)输出部15基于比较结果数据24构成输出数据25,并保存输出数据25,向用户显示结果画面。
[转换及比较处理(3)]
图18示出了与图17的S407及第一转换时所对应的、包括转换处理及比较处理的流程。下面,说明图18的步骤S501~S508的处理。
(S501)转换部13从作为转换对象的第二字段的字符串的开始字符起依次搜索,查找数字汉字以及位数汉字的字符。
(S502)在对目标字符串的字符识别结果中无不可读时(S502-是),进入S503,有不可读时(S502-否),进入S504。
(S503)转换部13与图4的S108同样地进行与无不可读时相对应的字符种类的转换处理。在第一转换时,利用图10的转换表,将汉字数字转换为阿拉伯数字。
(S504、S505)转换部13进行与有不可读时对应的处理。将在后面描述该处理。当作为该处理的结果,对于不可读的字符,可通过第二字符识别进行字符转换且进行了该字符转换时(S505-是),进入S506,如果是不能进行字符转换且未进行该字符转换时(S505-否),则结束处理。
(S506)在S503或者S505之后,转换部13将转换结果的阿拉伯数字相加。
(S507)转换部13重复S501~S506的处理,直到第二字段的字符串中的目标字符是最后字符为止。当目标字符是最后字符(S507-是)时,进入S508。需要注意的是,对象是中国票据的情况下,对于“元”之后的字符,进行同样的处理,直到最后字符为止。
(S508)转换部13对到S507为止的第二字段的转换结果的数字与第一字段的阿拉伯数字进行比较,判断一致/不一致,并保存其结果作为比较结果数据24。
[转换及比较处理(4)]
图19示出了与图17的S407以及第二转换时对应的、包括转换处理及比较处理的流程。下面,说明图19的步骤S601~S609的处理。
(S601)转换部13与图12的S301同样地从作为转换对象的第一字段的字符串的开始字符起依次搜索,对关注的每个[数字]计算([位数]-n)。
(S602)对于目标字符串,当字符识别结果是无不可读时(S602-是),进入S603,有不可读时(S602-否),进入S604。
(S603)转换部13与图4的S108同样地进行与无不可读时对应的字符种类的转换处理。在第二转换时,利用图10的转换表,将阿拉伯数字转换为汉字数字。
(S604,S605)转换部13进行与有不可读时对应的处理。当作为该处理的结果,对于不可读的字符,可进行解决不可读的字符转换且进行了该字符转换时(S605-是),进入S606,如果不可进行解决不可读的字符转换且未进行该字符转换时(S605-否),进入S609。需要注意的是,转换部13也可以在不可进行字符转换时进入S608,对不可读的字符之后的字符重复相同的处理。
(S606~S608)在S603或者S605之后,转换部13对第一字段的转换结果的汉字数字的部分字符与第二字段的汉字数字的对应位置的部分字符进行比较。当比较结果为一致时(S607-是),进入S608,不一致时(S607-否),判断以字符串为单位的比较结果为不一致,进入S609。在S608中,由于重复了n次,因此,转换部13在n上加1,其结果,当关注的数字是最后字符时(S608-是),进入S609,不是最后字符时(S608-是),返回S601重复相同的处理。需要注意的是,在对象是中国的票据时,对于句号之后的数字,同样地进行处理,直到为最后字符。
(S609)转换部13保存与字符串的一致/不一致的结果相对应的比较结果数据24,并结束处理。
[有不可读时的处理]
利用图20及图21说明与图17的S407对应的有不可读时的处理。PC2利用字符识别部12及比较部14等进行该处理。该处理是在第一字符识别中有不可读时将第一字符识别的候选字符包括在比较对象中来判断窜改等的可能性,同时尽量对不可读的字符进行字符转换来解决不可读的处理。
图20示出了作为有不可读时的处理的进行第一转换时的例子。填入第一字段的阿拉伯数字是“1,265”。填入第二字段的汉字数字是“金壱千弐百陸拾伍円”。对第一字段的阿拉伯数字进行第一字符识别的结果是有不可读。字符串“1,265”中的字符“1”是不可读的例子。字符串“1,265”中的其它字符不存在误读及不可读。对第二字段的汉字数字进行第一字符识别的结果是不存在误读及不可读。通过第一转换,第二字段的汉字数字被转换为阿拉伯数字。第一转换后的字符串的阿拉伯数字是“1,265”。
当阿拉伯数字中有不可读时,PC2针对该不可读的字符,比较规定的组合的值,为了解决不可读,尝试通过第二字符识别进行字符转换。规定的组合包括:(1)第二字段的汉字数字的第一字符识别的结果的字符;以及(2)第一字段的阿拉伯数字的第一字符识别中的候选字符。当阿拉伯数字中有不可读时,PC2参照图21的有不可读时的处理表210以及图14的窜改可能性判断用的判断表140,基于上述组合的值的比较,进行第二字符识别。
作为第一字符识别中的候选字符的例子,设定第一候选字符是X、第二候选字符是Y、等等。在第一字符识别的处理中,无法确定是这些候选字符中的哪个字符而不能进行字符转换,结果变成不可读。
图21示出了在有不可读时的处理中使用的表的构成例。作为有不可读时的处理表210,图21的(a)示出了与日本的票据时以及第一转换时相对应的一部分。该处理表210示出了与图20的例子、即所填入的阿拉伯数字“1”不可读时相对应的部分。
处理表210中设有“填入阿拉伯数字”、“识别结果汉字数字”、“字符识别的第一候选”、“字符识别的第二候选”、“字符转换、输出”各列。“填入阿拉伯数字”是填在图20的第一字段的阿拉伯数字,特别示出了“1”的情况。“识别结果汉字数字”是图20的第二字段的汉字数字的第一字符识别结果的汉字数字,特别示出了“壱”的情况。“字符识别的第一候选”以及“字符识别的第二候选”对应于图20的第一字符识别的候选字符中的第一候选字符X以及第二候选字符Y。“字符转换、输出”表示作为第二字符识别中的字符转换结果的字符或者告警等输出的值。
PC2参照处理表210中的“识别结果汉字数字”、“字符识别的第一候选”、“字符识别的第二候选”这三列的值的组合,进行关于第二字符识别的判断。PC2根据图20所示的比较对象的组合的值,参照处理表210的符合该组合的行,采用“字符转换、输出”列的值。在图20的组合的例子中是{壱、X、Y}。由于“识别结果汉字数字”是“壱”,因此,PC2参照图21的处理表210。PC2参照处理表210中的、与第一候选字符X以及第二候选字符Y的组合对应的行。
处理表210中的“第一候选”及“第二候选”的列中设定有“1”这样的设想正确填入的字符、“窜改候选”的字符、“其它”字符的组合。
处理表210的第一行及第二行的“第一候选”列的值是“1”。例如,当字符X是“1”、字符Y是“窜改候选”时,第一行符合。因此,PC2采用第一行的“字符转换、输出”列的值、即“第一候选(1)”。“第一候选(1)”指的是“第一候选”列的字符X、即“1”。即、PC2将不可读的字符字符转换为“1”来解决不可读。
“窜改候选”是指在图14的判断表140中设定在“窜改候选阿拉伯数字”列中的值。根据判断表140,例如,关于汉字数字“壱”和阿拉伯数字“1”,“窜改候选”的字符是{4,7,9}。处理表210的第一行的“第二候选”列的“窜改候选”是指第二候选字符Y是这些字符{4,7,9}中任一个的情况。当组合是{壱,1,4}等时,不可读的字符被字符转换为“1”。
例如,字符X是“1”、字符Y是“其它”时,第二行符合。因此,PC2采用第二行的“字符转换、输出”列的值、即“第一候选(1)”。“其它”是指除了“1”本身以及“窜改候选”以外的字符。例如,关于汉字数字“壱”和阿拉伯数字“1”,“0”~“9”中的除了“1”和{4,7,9}以外的字符是{0,2,3,5,6,8}。当组合是{壱,1,2}等时,不可读的字符被字符转换为“1”。
处理表210的第三行~第五行的“第一候选”列的值是“窜改候选”。例如,当字符X是“窜改候选”的字符、字符Y是“1”时,第三行符合,从而采用“第二候选(1)”。“第二候选(1)”是指“第二候选”列的字符Y、即“1”。并且,当字符X和字符Y是“窜改候选”的字符时,第四行符合,从而采用“强告警”。“强告警”是指输出与窜改等的可能性高的判断相对应的强级别的告警。“强告警”可以与上述的第二告警相同。例如,当组合是{壱,4,7}等时,PC2推测“1”被进行了向“4”、“7”的窜改等的可能性高,从而输出该“强告警”。并且,当字符X是“窜改候选”的字符、字符Y是“其它”字符时,第五行符合,从而采用“强告警”。
处理表210的第六行~第八行的“第一候选”列的值是“其它”。例如,当字符X是“其它”字符、字符Y是“1”时,第六行符合,从而采用“第二候选(1)”。并且,当字符X是“其它”字符、字符Y是“窜改候选”的字符时,第七行符合,从而采用“弱告警”。“弱告警”是指输出与窜改等的可能性低的判断相对应的比“强告警”级别弱的告警。“弱告警”可以与上述的第一告警相同。例如,当组合是{壱,2,4}等时,PC2推测“1”有向“4”等窜改等的可能性,从而输出该“弱告警”。并且,当字符X和字符Y均为“其它”字符时,第八行符合,从而采用“弱告警”。
当组合符合第一行、第二行、第三行或者第六行时,不可读的字符通过第二字符识别进行字符转换,结果解决了不可读。当组合符合第四行、第五行、第七行或者第八行时,结果输出特定的告警。
并且,当汉字数字中有不可读时,PC2对于该不可读的字符,比较规定的组合的值,尝试进行用于解决不可读的第二字符转换。规定的组合包括:(1)第一字段的阿拉伯数字的第一字符识别结果的字符;以及(2)第二字段的汉字数字的第一字符识别中的候选字符。当汉字数字中有不可读时,PC2参照图21的(b)的表120B以及图14的判断表140,基于上述组合的值的比较进行第二字符转换。
图21的(b)示出了有不可读时的处理表210B。该处理表210B示出了与日本的票据时以及第二转换时相对应的一部分。该处理表210B示出了与所填入的汉字数字“壱”存在不可读时相对应的部分。
在表210B中设有“填入汉字数字”、“识别结果阿拉伯数字”、“字符识别的第一候选”、“字符识别的第二候选”、“字符转换、输出”各列。“填入汉字数字”是填在第二字段的汉字数字,特别示出了“壱”的情况。“识别结果阿拉伯数字”是第一字段的阿拉伯数字的第一字符识别结果的阿拉伯数字,特别示出了“1”的情况。“字符识别的第一候选”以及“字符识别的第二候选”示出了第一字符识别中的候选字符。
PC2参照处理表210B中的“识别结果阿拉伯数字”、“字符识别的第一候选”、“字符识别的第二候选”这三列的值的组合,进行关于第二字符识别的判断。PC2根据比较对象的组合{1,X,Y}的值,参照处理表210B中的符合该组合的行,采用“字符转换、输出”列的值。
处理表210B的第一行的“字符识别的第一候选”列的值是“壱”,“字符识别的第二候选”列的值是“壱之外”。当字符X是“壱”、字符Y是“壱”之外的字符时,符合第一行,从而采用“字符转换、输出”列的值、即“第一候选(壱)”。“第一候选(壱)”指的是“第一候选”列的字符X、即“壱”。即、PC2将不可读的字符字符转换为“壱”来解决不可读。
处理表210B的第二行的“第一候选”列的值是“壱之外”,“第二候选”列的值是“壱”。当字符X是“壱”之外的字符、字符Y是“壱”时,符合第二行,从而采用“第二候选(壱)”。“第二候选(壱)”是指“第二候选”列的字符Y、即“壱”。
处理表210B的第三行的“第一候选”以及“第二候选”列的值均为“壱之外”。当字符X和字符Y是“壱”之外的字符时,符合第三行,从而采用“弱告警”。
同样地,对于“1”之外的阿拉伯数字以及“壱”之外的汉字数字,也准备有处理表210、处理表210B的信息。对于“1”之外的阿拉伯数字以及“壱”之外的汉字数字,PC2也利用处理表210、处理表210B来同样地进行有不可读时的处理。在中国的票据时,使用基于与日本不同的使用字符的处理表210、处理表210B来同样地进行有不可读时的处理。
如上述例子中所述,在不可读减少模式中,不管在第一转换时还是在第二转换时均能减少不可读。并且,用户容易判断窜改等的可能性。
[效果等]
如上述的说明,根据实施方式一的字符识别系统以及字符识别方法,即使在包括字符种类不同的复式记录的票据的情况下,也能够提高精度和效率,减轻用户的作业负担。用户能够容易地进行票据记载内容的确认、数据的修改和确定等作业。
包括专利文献1在内的现有的字符识别系统不具有自动地比较及判断复式记录的不同字符种类的两个金额这样的高级功能。相反,实施方式一的字符识别系统提供在复式记录的两个金额的字符种类不同时自动转换字符种类并进行比较及判断等的高级功能。因此,减轻用户对两个字符串的比较等工作,看一眼即可进行判断。
实施方式一的字符识别系统自动地进行包括复式记录的金额比较、窜改等的可能性的判断在内的检查,并输出与判断结果相应的告警。因此,用户容易识别及检测出金额的不一致、窜改等的可能性。
实施方式一的字符识别系统具有误读减少模式、不可读减少模式,可以提高有关票据的OCR处理、即获得票据数据的处理的精度。用户可以获得高可靠性的票据数据。
实施方式一的字符识别系统即使在多个票据的OCR处理时也对每个票据进行自动检查并保存输出数据,根据需要输出结果画面。由此,能够提高多个票据的OCR处理及用户作业的效率。
(实施方式二)
利用图22说明本发明的实施方式二的字符识别系统以及字符识别方法。实施方式二的字符识别方法是包括在实施方式二的字符识别系统上由计算机基于用户的操作所执行的处理步骤的方法。
图22示出了实施方式二的字符识别系统的构成。实施方式二的字符识别系统通过OCR装置3和PC4的连接而构成。在实施方式二的字符识别系统中,由OCR装置3而不是由PC4进行有关票据5的OCR处理的主处理。换言之,实施方式二的字符识别系统是硬件OCR方式的系统。OCR装置3是进行票据5的OCR处理中的、从获得票据5的图像数据41的处理起到输出比较结果数据44的处理为止的处理的装置。PC4是通过软件处理来进行OCR处理中的、向用户输出包括比较结果数据44的输出数据45的输出处理等的装置。
用户对OCR装置3和PC4进行操作。为了进行作业,用户将票据5安放并输入OCR装置3。用户在PC4上进行有关作业的设定、指示输入。PC4按照指示输入,向OCR装置3发送命令。OCR装置3按照来自PC4的命令,开始票据5的OCR处理。
OCR装置3除了具有未图示的扫描仪、堆叠器之外,还具有控制装置301、存储装置302以及通信接口装置303。
控制装置301由CPU、ROM、RAM等构成。存储装置302包括存储器、磁盘等。通信接口装置303进行与PC4之间的通信接口所对应的通信处理。
控制装置301通过加载存储在存储装置302中的程序30并执行软件处理,从而实现票据输入部31等各处理部。程序30是用于使OCR装置3执行特有的OCR处理的程序。需要注意的是,该程序处理也可以安装在硬件电路上。控制部301具有票据输入部31、字符识别部32、转换部33以及比较部34。
存储装置302中存储图像数据41、识别结果字符数据42、转换结果字符数据43以及比较结果数据44等作为OCR处理相关的各数据。
OCR装置3通过票据输入部31读取并扫描票据5,从而获得票据5的图像数据41,并存储在存储装置302中。
字符识别部32输入存储装置302的票据5的图像数据41,对图像数据41进行字符识别处理,并将作为其结果的识别结果字符数据42存储在存储装置302中。
转换部33输入存储装置302的识别结果字符数据42,对识别结果字符数据42进行规定的转换处理,并将作为其结果的转换结果字符数据43存储在存储装置302中。
比较部34输入存储装置302的转换结果字符数据43,对转换结果字符数据43进行规定的比较处理,并将作为其结果的比较结果数据44存储在存储装置302中。
OCR装置3通过通信接口装置303的通信处理向PC4转发OCR处理的结果、即比较结果数据44、识别结果字符数据42。
PC4具有未图示的控制装置、存储装置、通信接口装置、输入装置、显示装置等一般性组成成分。PC4具有在这些组成成分的基础上构成的输出部35以及用户界面部36。PC4接收由OCR装置1转发的比较结果数据44、识别字符结果数据42,并存储在内部的存储装置中。
输出部35输入存储装置的比较结果数据44,作为规定的输出处理,构成包括比较结果数据44的输出数据45,并将输出数据45保存在存储装置中。并且,输出部35利用用户界面部36以及显示装置,向用户显示输出数据45所对应的OCR处理的结果画面。
用户界面部36进行向用户提供作为与字符识别系统以及OCR的作业相关的用户界面的画面的处理。用户界面部36基于输出数据45,构成基于Web页面等的画面数据,并基于画面数据使显示装置显示结果画面。
根据实施方式二的字符识别系统以及字符识别方法,也能够获得与实施方式一相同的效果。
以上,基于实施方式具体说明了本发明,但是,本发明并不限定于上述实施方式,在不脱离其宗旨的范围内可以进行各种变更。
工业上的可利用性
本发明可以用于进行票据的OCR处理的业务。
附图标记说明
1OCR装置2PC
5票据11票据输入部
12字符识别部13转换部
14比较部15输出部
16用户界面部20程序
21图像数据22识别结果字符数据
23转换结果字符数据24比较结果数据
25输出数据101控制装置
102存储装置103输入装置
104显示装置105印刷装置
106通信接口装置。

Claims (14)

1.一种字符识别系统,包括:
票据输入部,输入票据,并获得该票据的图像数据;
字符识别部,根据所述票据的所述图像数据,对作为两个字段的两个字符串的第一字段的第一字符串和第二字段的第二字符串进行字符识别,获得识别结果字符数据;
转换部,根据所述识别结果字符数据,在所述第一字符串的字符种类与所述第二字符串的字符种类不同时,对一个字符串进行转换,使所述一个字符串的字符种类与另一个字符串的字符种类匹配,从而获得转换结果字符数据;
比较部,根据所述转换结果字符数据,比较所述第一字符串和所述第二字符串,并判断一致或不一致,从而获得比较结果数据;以及
输出部,向用户输出包括所述比较结果数据的输出数据。
2.根据权利要求1所述的字符识别系统,其中,
所述票据在所述第一字符串中包括阿拉伯数字的金额,在所述第二字符串中包括汉字数字的金额,
所述字符识别系统具有转换表,在所述转换表中设定有与所述字符种类不同的所述两个字符串相关的每个字符的对应关系,所述转换部使用所述转换表转换所述第二字符串,使所述第二字符串的汉字数字与所述第一字符串的阿拉伯数字匹配。
3.根据权利要求1所述的字符识别系统,其中,
所述票据在所述第一字符串中包括阿拉伯数字的金额,在所述第二字符串中包括汉字数字的金额,
所述字符识别系统具有转换表,在所述转换表中设定有与所述字符种类不同的所述两个字符串相关的每个字符的对应关系,
所述转换部使用所述转换表转换所述第一字符串,使所述第一字符串的阿拉伯数字与所述第二字符串的汉字数字匹配。
4.根据权利要求1所述的字符识别系统,其中,
所述字符识别系统具有判断表,在所述判断表中设定有所述第一字符串的字符、所述第二字符串的字符以及对于所述第一字符串的字符的窜改候选字符的组合,
所述比较部针对判断为所述不一致的所述第一字符串的字符和所述第二字符串的字符,根据是否符合所述判断表的所述组合来判断包括对于所述第一字符串的字符的窜改的可能性,并输出判断结果。
5.根据权利要求1所述的字符识别系统,其中,
所述字符识别系统若基于所述识别结果字符数据,在所述字段的区域内未发现所述字符串,则在扩展到该区域外侧的范围内搜索所述字符串,当未发现所述字符串时,将结果设为有空白,当发现了所述字符串时,将该字符串包括在所述识别结果字符数据中,并将结果设为无空白而输出该结果。
6.根据权利要求1所述的字符识别系统,其中,
所述字符识别系统基于所述识别结果字符数据,判断所述第一字符串的位数和所述第二字符串的位数,并比较所述第一字符串的位数与所述第二字符串的位数,判断该位数的一致或不一致而输出该判断的结果。
7.根据权利要求1所述的字符识别系统,其中,
所述字符识别系统具有用户界面部,所述用户界面部向所述用户输出基于所述用户的操作的指示输入的画面、和基于所述输出数据的结果画面,
所述指示输入的画面包括用于指定所述两个字段、所述两个字符串各自的字符种类、和作为所述转换的对象的字符串的项目。
8.根据权利要求1所述的字符识别系统,其中,
所述字符识别系统具有用户界面部,所述用户界面部向所述用户输出基于所述用户的操作的指示输入的画面、和基于所述输出数据的结果画面,
所述结果画面包括所述第一字符串的所述字符识别的结果的数据、所述第二字符串的所述字符识别的结果的数据或者所述第二字符串的所述转换的结果的数据、所述一致或不一致的判断结果、和所述不一致时的告警。
9.根据权利要求4所述的字符识别系统,其中,
所述字符识别系统具有用户界面部,所述用户界面部向所述用户输出基于所述用户的操作的指示输入的画面、和基于所述输出数据的结果画面,
所述结果画面包括所述第一字符串的所述字符识别的结果的数据、所述第二字符串的所述字符识别的结果的数据或者所述第二字符串的所述转换的结果的数据、所述一致或不一致的判断结果、在所述不一致时的包括对所述第一字符串的字符的窜改的可能性的判断结果、和包括所述窜改的可能性的告警。
10.根据权利要求1所述的字符识别系统,其中,
所述字符识别系统具有用户界面部,所述用户界面部向所述用户输出基于所述用户的操作的指示输入的画面、和基于所述输出数据的结果画面,
所述指示输入的画面包括用于指定误读减少模式的项目,
在指定了所述误读减少模式的情况下,当所述第一字符串的所述字符识别的结果和所述第二字符串的所述字符识别的结果中的至少一方中有不可读的字符时,所述字符识别系统将结果设为意思为存在该不可读的结果,并向所述结果画面输出包括该不可读的字符的位置和意思为存在该不可读的告警的信息。
11.根据权利要求1所述的字符识别系统,其中,
所述字符识别系统具有用户界面部,所述用户界面部向所述用户输出基于所述用户的操作的指示输入的画面、和基于所述输出数据的结果画面,
所述字符识别系统计算所述第一字符串的所述字符识别的结果的数据中的第一金额与所述第二字符串的所述转换的结果的数据中的第二金额的金额差,并向所述结果画面输出包括所述金额差、和存在所述金额差时或者所述金额差在阈值以上时的告警的信息。
12.根据权利要求1所述的字符识别系统,其中,
所述字符识别系统具有用户界面部,所述用户界面部向所述用户输出基于所述用户的操作的指示输入的画面、和基于所述输出数据的结果画面,
所述指示输入的画面包括用于指定不可读减少模式的项目,
所述字符识别系统具有处理表,在所述处理表中设定有包括所述第一字符串的第一字符识别的候选字符、所述第二字符串的第一字符识别的结果的字符、和作为第二字符识别的结果输出的字符或告警的对应关系的信息,
在指定了所述不可读减少模式的情况下,当所述第一字符串的所述第一字符识别的结果和所述第二字符串的所述第一字符识别的结果中的至少一方中有不可读的字符时,作为存在该不可读时的处理,所述字符识别系统根据所述第一字符串的所述第一字符识别的候选字符和所述第二字符串的所述第一字符识别的结果的字符的组合,参照所述处理表来确定所述第二字符识别的结果输出,
当确定了作为所述第二字符识别的结果输出的字符时,所述字符识别系统将所述不可读的字符字符转换为该字符来解决该不可读,
所述结果画面包括所述第二字符识别的结果输出。
13.根据权利要求12所述的字符识别系统,其中,
所述处理表包括作为所述第一字符串的所述第一字符识别的候选字符的第一候选字符及第二候选字符,并且,在所述处理表中,设定有设想正确填入的字符、窜改候选字符、和其它字符的组合作为该候选字符,
所述比较部根据所述第一字符串的所述第一字符识别的候选字符中的所述第一候选字符及所述第二候选字符与所述第二字符串的所述第一字符识别的结果的字符的组合,参照所述处理表来确定所述第二字符识别的结果输出,作为所述结果输出,在所述第一候选字符或者所述第二候选字符是所述设想正确填入的字符时,输出该字符,在所述第一候选字符是所述窜改候选字符时,输出所述告警。
14.一种字符识别方法,包括:
票据输入步骤,输入票据,并获得该票据的图像数据;
字符识别步骤,根据所述票据的所述图像数据,对作为两个字段的两个字符串的第一字段的第一字符串以及第二字段的第二字符串进行字符识别,获得识别结果字符数据;
转换步骤,根据所述识别结果字符数据,当所述第一字符串的字符种类与所述第二字符串的字符种类不同时,对一个字符串进行转换,使所述一个字符串的字符种类与另一个字符串的字符种类匹配,从而获得转换结果字符数据;
比较步骤,根据所述转换结果字符数据,比较所述第一字符串和所述第二字符串,判断一致或者不一致,从而获得比较结果数据;以及
输出步骤,向用户输出包括所述比较结果数据的输出数据。
CN201510785494.3A 2014-11-17 2015-11-16 字符识别系统及字符识别方法 Active CN105608453B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014-232521 2014-11-17
JP2014232521A JP6472218B2 (ja) 2014-11-17 2014-11-17 文字認識システム及び文字認識方法

Publications (2)

Publication Number Publication Date
CN105608453A true CN105608453A (zh) 2016-05-25
CN105608453B CN105608453B (zh) 2019-05-03

Family

ID=55988379

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510785494.3A Active CN105608453B (zh) 2014-11-17 2015-11-16 字符识别系统及字符识别方法

Country Status (2)

Country Link
JP (1) JP6472218B2 (zh)
CN (1) CN105608453B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107507334A (zh) * 2017-08-31 2017-12-22 深圳怡化电脑股份有限公司 一种纸币面额识别方法、装置、设备及存储介质
CN107622263A (zh) * 2017-02-20 2018-01-23 平安科技(深圳)有限公司 单据图像的字符识别方法和装置
WO2019056491A1 (zh) * 2017-09-21 2019-03-28 平安科技(深圳)有限公司 一种 ocr 识别的处理方法、存储介质和服务器
CN110378784A (zh) * 2019-07-24 2019-10-25 中国工商银行股份有限公司 金额输入方法及装置
CN111126400A (zh) * 2018-10-31 2020-05-08 上海迈弦网络科技有限公司 一种基于ocr识别结果的大小写金额相互演算推测方法
CN111639646A (zh) * 2020-05-18 2020-09-08 山东大学 一种基于深度学习的试卷手写英文字符识别方法及系统
CN113435993A (zh) * 2021-08-27 2021-09-24 聆笙(北京)科技有限公司 一种收据数据识别系统及其方法
CN113743902A (zh) * 2021-09-08 2021-12-03 未鲲(上海)科技服务有限公司 基于人工智能的信息审核方法、装置、终端设备及介质
CN114155361A (zh) * 2021-12-11 2022-03-08 浙江正泰中自控制工程有限公司 一种摄像直读表抄表方法及系统
CN114629707A (zh) * 2022-03-16 2022-06-14 深信服科技股份有限公司 一种乱码检测方法、装置及电子设备和存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019125099A (ja) * 2018-01-15 2019-07-25 富士通フロンテック株式会社 帳票認識プログラム、帳票認識方法、及び帳票認識装置
JP7006382B2 (ja) * 2018-03-06 2022-01-24 オムロン株式会社 偽造判定装置、偽造判定方法、及び偽造判定プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6721451B1 (en) * 2000-05-31 2004-04-13 Kabushiki Kaisha Toshiba Apparatus and method for reading a document image
CN101833661A (zh) * 2009-03-13 2010-09-15 欧姆龙株式会社 字符识别装置、字符识别程序及字符识别方法
CN102982328A (zh) * 2011-08-03 2013-03-20 夏普株式会社 字符识别装置和字符识别方法
CN103824373A (zh) * 2014-01-27 2014-05-28 辰通智能设备(深圳)有限公司 一种票据图像金额分类方法及系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5668880A (en) * 1979-11-10 1981-06-09 Fujitsu Ltd Character reader
JPH0374785A (ja) * 1989-08-15 1991-03-29 Oki Electric Ind Co Ltd 光学式文字又は図形読取り装置を用いた数字表示方法
JP2001076093A (ja) * 1999-09-03 2001-03-23 Oki Software Kk 為替集中処理システム
JP2005266923A (ja) * 2004-03-16 2005-09-29 Oki Electric Ind Co Ltd 手書き数字認識方法
JP5517410B2 (ja) * 2008-01-18 2014-06-11 三菱重工業株式会社 ナンバープレート認識装置、ナンバープレート認識方法、ナンバープレート認識プログラム
JP2009200794A (ja) * 2008-02-21 2009-09-03 Fuji Xerox Co Ltd 文書の改竄検出プログラム及び改竄検出装置
JP5876784B2 (ja) * 2012-07-26 2016-03-02 富士通フロンテック株式会社 照合装置、照合方法および照合プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6721451B1 (en) * 2000-05-31 2004-04-13 Kabushiki Kaisha Toshiba Apparatus and method for reading a document image
CN101833661A (zh) * 2009-03-13 2010-09-15 欧姆龙株式会社 字符识别装置、字符识别程序及字符识别方法
CN102982328A (zh) * 2011-08-03 2013-03-20 夏普株式会社 字符识别装置和字符识别方法
CN103824373A (zh) * 2014-01-27 2014-05-28 辰通智能设备(深圳)有限公司 一种票据图像金额分类方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘明辉: "票据中手写体大小写金额识别的研究", 《万方数据知识服务平台》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107622263A (zh) * 2017-02-20 2018-01-23 平安科技(深圳)有限公司 单据图像的字符识别方法和装置
CN107622263B (zh) * 2017-02-20 2018-08-21 平安科技(深圳)有限公司 单据图像的字符识别方法和装置
CN107507334A (zh) * 2017-08-31 2017-12-22 深圳怡化电脑股份有限公司 一种纸币面额识别方法、装置、设备及存储介质
WO2019056491A1 (zh) * 2017-09-21 2019-03-28 平安科技(深圳)有限公司 一种 ocr 识别的处理方法、存储介质和服务器
CN111126400A (zh) * 2018-10-31 2020-05-08 上海迈弦网络科技有限公司 一种基于ocr识别结果的大小写金额相互演算推测方法
CN110378784A (zh) * 2019-07-24 2019-10-25 中国工商银行股份有限公司 金额输入方法及装置
CN111639646A (zh) * 2020-05-18 2020-09-08 山东大学 一种基于深度学习的试卷手写英文字符识别方法及系统
CN111639646B (zh) * 2020-05-18 2021-04-13 山东大学 一种基于深度学习的试卷手写英文字符识别方法及系统
CN113435993A (zh) * 2021-08-27 2021-09-24 聆笙(北京)科技有限公司 一种收据数据识别系统及其方法
CN113743902A (zh) * 2021-09-08 2021-12-03 未鲲(上海)科技服务有限公司 基于人工智能的信息审核方法、装置、终端设备及介质
CN114155361A (zh) * 2021-12-11 2022-03-08 浙江正泰中自控制工程有限公司 一种摄像直读表抄表方法及系统
CN114629707A (zh) * 2022-03-16 2022-06-14 深信服科技股份有限公司 一种乱码检测方法、装置及电子设备和存储介质
CN114629707B (zh) * 2022-03-16 2024-05-24 深信服科技股份有限公司 一种乱码检测方法、装置及电子设备和存储介质

Also Published As

Publication number Publication date
JP6472218B2 (ja) 2019-02-20
CN105608453B (zh) 2019-05-03
JP2016095753A (ja) 2016-05-26

Similar Documents

Publication Publication Date Title
CN105608453A (zh) 字符识别系统及字符识别方法
Everingham et al. The pascal visual object classes challenge: A retrospective
US8891862B1 (en) Note recognition and management using color classification
CN111753767A (zh) 一种作业自动批改的方法、装置、电子设备和存储介质
CN105260751B (zh) 一种文字识别方法及其系统
CN108717543B (zh) 一种发票识别方法及装置、计算机存储介质
CN111489487A (zh) 票据识别方法、装置、设备和存储介质
CN113011144B (zh) 表单信息的获取方法、装置和服务器
CN109800320A (zh) 一种图像处理方法、设备及计算机可读存储介质
CN110162599A (zh) 招聘面试方法、装置及计算机可读存储介质
US20190139280A1 (en) Augmented reality environment for tabular data in an image feed
US11816923B2 (en) Face image candidate determination apparatus for authentication, face image candidate determination method for authentication, program, and recording medium
CN107016022A (zh) 教学难点大数据分析系统
CN109189970A (zh) 图片相似度比对方法和装置
CN113033271A (zh) 利用人工智能模块学习脸部辨识的处理方法
CN107644105A (zh) 一种搜题方法及装置
CN110363190A (zh) 一种文字识别方法、装置及设备
US20150169510A1 (en) Method and system of extracting structured data from a document
CN117746467A (zh) 一种模态增强和补偿的跨模态行人重识别方法
CN106169065A (zh) 一种信息处理方法及电子设备
CN108133209B (zh) 一种文本识别中的目标区域搜索方法及其装置
CN104978577A (zh) 信息处理方法、装置及电子设备
CN115457458A (zh) 一种非接触式智能盘点系统和方法
Dunlap et al. Describing differences in image sets with natural language
CN107944866A (zh) 交易记录排重方法及计算机可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant