具体实施方式
下面用附图详细说明本发明的实施形式。
图1是示明本发明的票据处理系统一实施形式的系统结构图。此实施形式的系统包括:读取处理对象票据上记载的字符或符号、条形码、印迹等图像的图像读取装置1;由个人计算机等计算机构成的窗口终端2;备有票据等图像读取功能的自动处理装置3;以通信线路11连接此窗口终端2和自动处理装置3的中心装置4。
中心装置4包括:根据由窗口终端2或自动处理装置3接收的票据读取图像数据,对票据种类和其记载内容进行识别的识别服务器5;备有金融机关的操作员使用的多个数据输入端6-1~6-n、代码数据库7与图像数据库8的电子文件生成装置9;用于根据上述数据输入端6-1~6-n与电子文件生成装置9对识别服务器5的消息对到运行存取的操作服务器10。
识别服务器5配备有:从窗口终端2或自动处理装置3经通信电路11接收票据的读取图像数据的消息接收部51;将所接收的消息顺次积存,同时存储识别结果的消息队列缓冲器52;根据此消息队列缓冲器内存储的票据读取图像数据,识别票据的种类与记载内容的票据识别处理部53;与操作服务器10的电路连接,将消息队列缓冲器52内存储的识别结果经由操作服务器传送到数据输入端的电路连接部54。
图像读取装置1构成为从斜上方光学地扫描置于票据台上的票据110,而把读取的图像数据(彩色图像数据)输入到窗口终端2。
窗口终端2如图2A所示,包括附属于此窗口终端的键盘21、鼠标(指点装置)22、显示装置23、输入控制部24、消息数据编辑处理部25、消息收发部26。
输入控制部24进行图像读取装置1的输入控制,包括用于高速传送票据的读取图像数据的SCSI驱动器241、图像扫描器的标准接口TWAIN驱动器243、进行读取图像失真修正的失真修正部242。失真修正部242,当在从斜上方读取票据图像时,由于所读取的图像如图2B所示发生失真而成梯形,故用来将其校正成矩形245。此输入控制部24将由TWAIN规格确定的数据形式读取的图像数据输入消息编辑处理部25。
消息数据编辑处理部25将票据的读取图像数据编辑成预定形式的图像数据,再相对于此编辑结果附加上消息处理控制头251,组合成一个发送消息。在消息处理控制头251中包含有表示发送地址、发送源、图像数据的形式(单色/彩色、2值/多值、压缩形式)或属性的信息。
另一方面,识别服务器5内的票据识别处理部53,如图3所示,包括输入控制部531、文字符票据识别部532、票据识别宏533、印鉴检索处理部534、辞典文件535、票据格式定义信息文件536、印鉴数据库537。此外,印鉴数据库537可以直接附属于识别服务器5,也可以置于操作服务器10管理之下。
票据识别宏533是根据输入控制部531输入的读取图像数据,识别票据种类,进而进行所记载的字符或条形码等的识别,印迹的检索核对处理部分,由有选择地调出字符票据识别部532的各处理部、实施票据种类的识别、字符识别、印迹核对的宏程序构成。这些宏程序可相对于“附ID票据”、“单式票据”、“复式票据”等票据的每一种设定。所谓“附ID票据”是本行制定那一类票据,印刷有票据的识别字符(数字)的那种票据。所谓“单式票据”是指支票或期票、电话公司或电力公司等制定的一张传票形式的票据;所谓“复式票据”则是指取多张组成形式的票据。每一种这类票据的宏程序,以在消息队列缓冲器52中存储的来自窗口终端2的消息为契机,按预定顺序起动,有选择地调出字符票据识别部532的各处理部,进行操作员用于确认的必要部分的图像分离处理,将票据种类与识别字符的信息、指定区域的分离图像的数据由票据单元编辑,存储于消息队列缓冲器52中。存储于消息队列缓冲器52中的识别结果与指定区域的分离图像数据,根据数据输入端6-1~6-n的要求或是定期地,通过操作服务器10传送给数据输入端6-1~6-n。
字符票据识别部532包括字符识别处理部5321、票据识别处理部5322、条形码识别处理部5323、单词核对处理部5324、印鉴核对处理部5325、图像处理部5326与线段检测处理部5327。此各个处理部由根据前述票据识别宏533的各宏程序有选择地起动的程序构成。
字符识别处理部5321是识别处理对象票据上所记识别对象的字符(金额与票据ID等的字母数字、姓名等的字符)的部分,在识别存在有识别对象的字符的这类票据时,由进行这种识别的票据种类中票据识别宏533的宏程序起动,识别票据识别宏533所指示区域的字符。识别对象的字符为手写的字符、印刷字符、OCR字符、MICR字符。
票据识别处理部5322是通过对识别票据的读取图像数据与用于识别票据格式定义信息文件536中所登录的票据种类的匹配处理,来识别处理对象票据种类的部分,与以上所述相同,由票据识别宏533起动。
这里,票据的种类虽然大致分为附ID票据、条形码票据、OCR票据等,但例如即使是同一附ID票据,会因ID号码而致格式不同。
在本实施形式中:
(1)将票据种类识别用的定义信息指定的区域图像分离,识别是附ID票据或是条形码票据等的种类;
(2)在附ID票据的情形,识别其ID号码,再识别与此ID号码相对应的下位属性;
(3)分离出由此下位属性的格式定义信息指定区域的图像,进行字符识别,进行与此识别结果相对应的处理。
本发明于同类票据中将格式由ID号码进一步区分或分类时,将这种区分或分类称为下位属性。
至于匹配处理,在识别条形码或手印/印刷于支票上的MICR字符时,指的是根据图像(条码图案图像、MICR字符图案图像)进行的图案匹配处理;而在识别印刷有多位的数字序列组成的代码信息的票据时,则指1个字符单位或1个字符串单位相互间的匹配处理。
条形码识别处理部5323是识别处理对象的票据上所记识别对象条形码的部分,在识别存在有识别对象条形码的这种票据时,由票据识别宏533的宏程序起动。
单词核对处理部5324是识别处理对象票据上所记识别对象的单词(例如银行名、公司名、住址、姓名等)的部分,而印鉴核对处理部5325是把处理对象票据上所印识别对象的印迹与印鉴数据库537中所登录的印迹进行核对的部分,而在识别存在有识别对象的印迹这类票据时,图像处理部5326则是处理对象的票据上为了让操作员进行确认或为了余留于处理履历的记录上,对必要的印迹等图像进行分离处理的部分,当识别存在有分离对象的图像这种票据时,分别由票据识别宏533的宏程序起动。
线段检测处理部5327是检测票据上记载的表或划线等线段特征的部分,在识别包含有表或划线等线段这类票据时,由进行这种识别的票据种类中票据识别宏533的宏程序起动,将检测出的线段的特征与票据格式定义信息文件536中预登录的票据格式信息核对,判定其相应于何种格式的票据。
辞典文件535存储有单词核对处理部5324进行单词核对的单词词典。
票据格式定义信息文件536是把用于识别多种票据的类别2其下位属性的图像分离区域的信息,以及用于各种票据中字符和印迹等的识别对象区域或用于通过操作员确认的分离区域等的信息,进行预登录的文件,对处理票据种类识别用的定义信息和各种类中下位属性的格式定义信息进行登录。登录的内容以后于票据种类识别处理中说明。
下面说明本实施形式的票据处理系统所处理的票据代表例与识别结果的显示例。
图4示明本行制定的格式的票据(以下称为制定的票据)的例子以及识别结果的显示例子,制定的票据400如图4(a)所示,上面印有该制定的票据的ID(图例中为“001”)和用于识别处理种类或处理形式的检验框(图例中,“01普通存款户头支出”、“02活期存款支出”的检验框“”)402、403。在这种制定的票据400中,如果从普通存款户头取出,则由顾客于402的检验框中记入记号“V”。在其下栏记入取出金额“¥30,000”和户头号码“1401257”的手写字符,再在“姓名”栏中记入顾客姓名“村田××”的手写字符,盖上利用者的印鉴。在图4(a)的制定的票据400中实际上还有“商店编号”的手写记入栏,由于会使图面复杂,本例中略去。
在读取这种制定的票据400时,图4(b)中所示的识别结果显示于数据输入端6-1~6-n的确认画面410上。在此确认画面410中显示有手写字符的商店编号“123”的分离图像411及其字符识别结果412(图4(a)中省略)、手写字符的户头号码“1401257”的分离图像413及其字符识别结果414、手写字符的取出金额“30000”的分离图像415及其字符识别结果416、姓名的手写字符“村田××”的分离图像417及其识别结果418、盖印于制定的票据400上的印迹419的分离图像和在印鉴数据库537中登录的印迹420。
图5例示支票和识别结果,支票500中如图5(a)所示,于所定位置处印有法定的支票固有的MICR字符(磁性印刷字符)501,因而可以通过与MICR字形图像的字形匹配处理,于所定的位置处识别预定字体的MICR字符501。在识别正规形式的支票时,进行必要部分的识别和图像的分离处理,显示出图5(b)所示的确识图像510。
图5(b)所示的确认画面510中显示有:成为支付地银行的“商店编号”印刷字符“123”的分离图像511(图5(a)中省略)及其字符识别结果512、由检验书写者(checkwriter)记入的取出金额“¥30,000”的分离图像515及其字符识别结果516、取款人姓名的手写字符“村田××”的分离图像517及其识别结果518、盖在支票500上的取款人的印迹519的分离图像与在印鉴数据库537中登录的印迹520、支票500的整体缩小图像521。之所以分离出缩小图像521,是为了在发生误处理时或顾客有询问时有必要作为证据保留。
图6例示印有条形码的市县民众税的交纳用票据和识别结果的显示,在图6例示的市县民众税交纳用票据中,如图6(a)所示,于其地方自治体确定的位置处,有以条形码印刷形式的自治体各与交纳户头号码等。下面称这种票据为条形码票据600,在本发明中,分离出由条形码票据识别用定义信息所确定的区域的图像,通过图像匹配处理识别该区域中是否记载有条形码。如果检测出条形码的记载区域,则作为条形码票据识别,根据此条形码的内容(编码结果),识别交纳地的金融机关的商店编号等。然后进行姓名、金额等必要部分的图像分离,将识别结果显示于图6(b)所示的确认画面610中。在图6(b)所示的确认画面610中,显示有:成为交纳地的银行“商店编号”的识别结果611、由印刷或手写的字符记入的取出金额“¥30,000”的分离图像612与该字符的识别结果613、交纳者姓名的印刷或手写的字符“村田××”的分离图像614与其识别结果615。
图7例示电力公司等的符号代码以多位数字码所记的交费用票据及识别结果的显示,电力公司“××电力”的交费用票据700中,如图7(a)所示,在该电力公司等确定的位置处存在有以多位数字码701印刷形式的电力公司固有的符号代码等。下面将这种形式的票据定义为MT票据,本发明中对于这种MT票据700分离出用于识别MT票据的定义信息所确定的区域图像,通过字符识别处理识别该区域中是否记载有多位的数字码。在检测出多位数字码701的记载区域时,即作为MT票据识别,根据其数字码的内容识别交纳地的电力公司等的符号代码等。然后进行必要部分的图像分离与字符识别,将识别结果显示于图7(b)所示的确认图像上。图7(b)所示的确认画面710中显示有“成为交纳地的银行“商店编号”的识别结果711、由印刷或手写字符记入的交易金额“¥30,000”的分离图像712及其字符识别结果713、交纳者姓名的手写字符“村田××”的分离图像714及其识别结果715。此外,MT票据也称为邮政转帐MT业务所用的票据。邮政转帐MT业务是把邮政转帐中通常的存入内容(预先由用户记载于MT业务专用存入单中的OCR字符数据)的通知,代替以图像输出的存入处理票据的邮递,记录于磁带或软盘中而转交给用户的服务。
图8例示地方自治体等符号代码由多位数字代码记载的纳税用票据及其识别结果的显示例,在自治体“东京都”的所得税交纳用票据800中,如图8(a)所示,在该自治体确定的位置处,存在有以多位的OCR字符801印刷形式的自治体固有的符号代码等。下面将这种形式的票据定义为OCR票据800,对这种OCR票据800进行与图7中票据700相同的处理。这就是说,对于图8的OCR票据800,分离出由OCR票据识别用的定义信息所确定的位置的图像,通过字符识别处理识别此分离图像中是否记载有多位的OCR字符。如果检测出有多位的OCR字符801的记载,则作为OCR票据识别,根据此数字代码内容(数字的识别结果),识别交纳地自治体的符号代码等。然后进行必要部分的图像分离与字符识别。将识别结果显示于用8(b)所示的确认画面810上。图8(b)所示的确认图像810中显示有成为交纳地的银行“商店编号”的识别结果811、由印刷或手写字符记入的交易金额“¥30,000”的分离图像812及其字符识别结果813、交纳者姓名的印刷或手写的字符“村田××”的分离图像814及其识别结果815。
图9是示明窗口终端2中图像数据编辑处理部25的图像读取、编辑处理的流程图。首先起动窗口终端2,显示出图10所示的初始图像1000(步骤901)。这里把处理对象票据110置于图像读取装置10的票据台上,通过鼠标22的点击操作,操作图像1000的图像输入开始钮1001,输入图像输入指令。或由键盘21输入图像开始输入开始指令。
窗口终端2的图像数据编辑处理部25在识别图像输入开始指令输入时(步骤902),即通过输入控制部24相对于图像读取装置1发送读取开始信号。由此开始图像读取装置1的票据图像的读取操作。图像读取装置1将读取的票据图像数据通过输入控制部24传送给图像数据编辑处理部25。图像数据编辑处理部25将传送来的票据图像数据存储于存储器252中(步骤903)。然后,编辑图像处理控制头(ICH)(步骤904)。
图像处理控制头是表示发送地址(发送目的地网络地址)、发送源(发送源网络地址)、图像数据的形式(单色/彩色、2值/多值、压缩形式等)或属性的信息。
随后读出存储于存储器251中的票据图像数据(彩色图像数据),变换为单色多值图像(IDU系值)后,将此单色多值图像作为传送消息的一部分编辑(步骤905)。再在变换为单色2值图像(IDU2值)后,将此单色2值图像作为传送消息的一部分编辑(步骤906)。然后将上述图像处理控制头、单色多值图像(IDU多值)、单色2值图像(IDU2值)编辑成图2(c)所示的一个传送消息,通过消息收发部26与通信线路11发送给识别服务器(步骤907)。
另外,单色2值图像主要用于识别服务器5的识别,单色多值图像主要于识别服务器5这一方操作员的印鉴核对。具体地说,对于窗口终端2处理的票据记载的印鉴部分用单色多值图像作数据变换,而对于此外的记载则以单色2值图像作数据变换,将各单色多值图像与单色2值图像的数据从窗口终端一侧发送给包含有识别服务器和数据输入端等的中心装置一侧。这样,与把所有的数据作为单色多值图像发送的情形相比,减少了发送量,同时在中心装置一方能有效地便于操作员核对印鉴。
窗口终端2对一张张的票据重复上述操作,将从处理对象的票据读取的图像数据传送给识别服务器5。
与此相对应,识别服务器5将图像处理控制头、单色多值图像(IDV多值)、单色2值图像(IDU2值)组成的传送消息,由消息接收部51接收之后,即把所接收的消息存储于消息队列缓冲器52的接收区中(步骤1101)。票据识别处理部53在由消息接收部51接收到存储了新的接收消息的通知后,便从消息队列缓冲器52的接收区域读出此接收的消息,通过分析图像处理控制头(ICH),确认图像数据的形式(步骤1102)、进而取出单色多值图像数据与单色2值图像数据(步骤1103、1104)。
再用单色多值图像进行票据内的字符识别与指定区域的票据图像的分离(步骤1105)。此外,利用单值2值图像分离指定区域的票据图像,识别分离区域的字符,将此识别结果与前述单色多值图像的分离图像数据组成一组,作为不同于票据的内容存储于消息队列缓冲器52的发送区域中(步骤1106)。至于图像的分离处理与识别处理将用图12详细说明。
然后判断接收到某个数据输入端的传送要求否(步骤1107),当接收到时即判断消息队列缓冲器52的发送区域中是否存在应传送的现场图像与识别结果的数据(步骤1108),当存在时则把这种数据传送给传送要求源的数据输入端(步骤1109)。此时显然要附加上传送要求源的目的地址发送。但是,当不存在应传送的数据时,即返送回无数据的应答(步骤1110)。
再有,在此是根据数据输入端的传送要求将字符识别结果与单色多值图像的分离图像数据要求传送至传送要求源的,但也可在操作服务器10内设置消息队列缓冲器,在识别处理结束之后,自动向操作服务器10内的消息队列缓冲器传送,而从操作服务器10传送给数据输入端。
图12是示明图11的步骤1105的细节,即票据识别处理部53的图像分离与字符识别处理的细节的流程图。
票据识别处理部53的票据识别宏533当从消息接收部51接收到新消息的接收通知后(步骤1201),便通过输入控制部531从消息队列缓冲器52读出此消息。
然后从该读出的消息中析出单色多值图像数据和单色2值数据,分离单色多值数据内指定区域的图像数据,还分离单色二值数据由指定区域的数据,识别其中的字符。
在此是按预定的顺序来识别处理对象票据的种类。例如按制定的票据(图4)、条形码票据(图6)、MT票据(图7)、MICR票据支票/期票(图5)、自治体的OCR票据(图8)、上述票据以外的票据其格式在票据格式定义信息文件7中预登录的顺序,进行识别处理。
这就是说,票据识别宏533按照识别制定的票据的宏程序、识别条形码的宏程序、识别MT票据的宏程序、识别支票/期票的宏程序、识别自治体的OCR票据的宏程序、识别格式票据的宏程序的顺序起动。
之所以将制定的票据设定于最优先的顺序位置是由于预测制定的帐票的输入量最多,但这种顺序是可以通过改变票据识别宏533中各种票据对应的宏程序的起动顺序来变更。此外,当处理对象的票据种类增加时,只需相应地增加该票据用的宏程序而不必变动字符票据识别部532的结构。
首先起动附ID票据即制定的票据的票据识别宏533的宏程序,起动字符票据识别部532的字符识别处理部5321和票据识别处理部5322、单词核对处理部5324、印鉴核对处理部5325、图像处理部5326,识别票据种类是否是制定的票据,若判明是印有票据ID的制定的票据时(步骤1202),则在分离出由此制定的票据对应的票据格式定义信息预定区域的图像后,进行字符识别(户头号码与顾客姓名、交易金额等),再行分离由印迹等票据格式定义信息预定区域的图像(步骤1203),并将其结果(识别字符与分离图像以及票据种类的信息)存储于消息队列缓冲器52的发送区域中。
当判明不是制定的票据时,随即起动条形码票据对应的票据识别宏533的宏程序,而起动字符票据识别部532的字符识别处理部5321和票据识别处理部5322、条形码识别处理部5323、单词核对处理部5324、印鉴核对处理部5325、图像处理部5326,来识别是否是印有条形码的条形码票据(步骤1204),若判明是印有条形码的条形码票据,在分离出由此条形码票据对应的票据格式定义信息预定的区域的图像后,进行字符识别(顾客姓名、交易金额),再分离由票据格式定义信息预定区域的图像(手写的字符或印刷字符等)(步骤1205),将此结果(识别字符与分离图像以及票据种类的信息)存储于消息队列缓冲器52的发送区中。
当判明不是条形码票据时,即起动MT票据对应的票据识别宏533的宏程序,而起动字符票据识别部532的字符识别处理部5321和票据识别处理部5322、单词核对处理部5324、印鉴核对处理部5325、图像处理部5326,由数字代码序列识别是否为MT票据(步骤1206),当判明是MT票据时,在分离出由此MT票据对应的票据格式定义信息预定的区域的图像后,进行字符识别(顾客姓名、交易金额等),再分离由票据格式定义信息预定的区域的图像(手写的字符和印刷字符等)(步骤1207),将其结果(识别的字符与分离图像以及票据种类的信息)存储于消息队列缓冲器52的存储区域中。
但当判明不是MT票据时,即通过是否存在MICR字符来识别是否是支票、期票或汇票(步骤1208),当判明是期票、汇票或支票时,分离出由此期票、汇票或支票上印刷的MICR字符对应的票据格式定义信息预定区域的图像后,进行字符识别(支付地的银行店号与顾客姓名、交易金额等),再分离由印迹等票据格式定义信息预定区域的图像,进而制成期票、汇票或支票的整体缩小图像(步骤1209),将其结果(识别的字符、分离的图像以及票据种类的信息、缩小图像)存储于消息队列缓冲器52的发送区域中。
若是判明不是期票、汇票或支票时,即起动用于进行地方税交纳等的OCR票据对应的票据识别宏533的宏程序,而起动字符票据识别部532的字符识别处理部5321和票据识别处理部5322、单词核对处理部5324、印迹核对处理部5325、图像处理部5326,通过多位OCR字符的字符识别处理,识别是否是OCR票据(步骤1210),当判别是OCR票据时,进行由此OCR票据上印刷的OCR字符对应的票据格式字义信息所预定的图像分离,进行此分离出的图像的字符识别(顾客姓名、交易金额等),再行分离由票据格式定义信息预定的区域的图像(手写字符与印刷字符等)(步骤1211),将其结果(识别的字符与分离的图像以及票据种类的信息)存储于消息队列缓冲器52的发送区域中。
但对于不相当于上述任一种票据的情形,便将表明这种情形的特征位附加于单色多值图像数据和单色2值图像数据上,存储于消息队列缓冲器口的发送区域中,用于由数据输入端的操作员经目视识别来确定票据内容。
图14详细示明识别处理对象的票据是否是图4例示的制定的票据400的程序,首先将图4中制定的票据的ID401和检验框402、403的印刷区域的图像,据图3的票据格式定义信息文件536中存储的票据种类识别用定义信息1403,由图像处理部5326分离。然后在此分离的图像中,利用制定的票据的ID401和检验框402、403的字符以及以“V”符号标记的“D”符号是否存在进行调查。这就是说,制定的票据400中票据ID401与检验框402、403或“普通存款支出”等的字符,由于是印刷在制定的票据400的指定位置处,表示票据ID401与检验框402、403或“普通存款支出”等字符的印刷区的坐标数据,可作为制定的票据对应的票据种类识别用的定义信息1403存储于票据格式定义信息文件536内。
在此:
(1)在从处理对象的票据读取的图像数据之中分离出以上述坐标数据表示的坐标区域的图像,进行此分离图像的字符识别,调查ID401与检验框402、403的“”符号或“普通存款支出”等字符与以“V”符号标记的“口”符号是否存在(步骤1401、1402),存在时,处理对象的票据为制定的票据400是由图3的票据识别处理部5323识别(步骤1404),转移到对此制定的票据400内应识别区域的字符和图像等数据(现场数据)进行识别处理(步骤1405)。在此阶段,例如图4中的制定的票据400时,则判明票据ID是“001”,交易种类或交易形式是“普通存款支出”。这就是说,分清了处理对象的票据是制定的票据,而其下位属性是票据ID=“001”。所谓现场数据是在数据输入端6-1~6-n用于操作员目视确认所需区域与字符识别所必要的图像数据。
(2)在现场数据的识别处理1405中,首先取得票据ID与“001”的制定的票据400相对应的票据格式定义信息1406,然后由图像处理部5326分离由此票据格式定义信息1406指定的区域的图像,应用字符识别处理部5321识别此分离区域中记载的字符与符号等。
在此阶段,例如是图4中的制定的票据400时,可求得商店编号411、户头号码414、交易金额415、顾客姓名417的识别结果。同时应用图像处理部5326,求得商店编号411、户头号码414、交易金额415、顾客姓名417、印迹419等区域的分离图像。这时,若求得了户头编号414与顾客姓名417的识别结果,则印鉴核对处理部5325根据此制定的票据400的票据识别宏程序的指示,通过印鉴检索处理部534,由识别结果的户头号码413与顾客姓名418,从印鉴数据库537取得特定顾客的登录印迹420的图像数据,与制定的票据400分离的印迹419作图像匹配处理,算出其是否相同或其类似度。此外,上述印鉴核对处理也可于数据输入端6-1~6-n进行。
(3)当数据输入端6-1~6-n处的操作员用于确认而必要的现场图像数据分离出时,若是字符识别结束,即实行“形式检查处理(A)”1407。此“形式检查处理(A)”1407虽不构成判别票据种类的本发明的主要部分,但可以进行所识别的现场数据相否间有无矛盾-有无漏记等形式上的检查,在发现有漏记等形式上的缺陷时,即将表明这种情形的特征位附加到识别结果中。
(4)以上求得的指定区域的分离图像数据和识别结果的数据按现场顺序编辑,存储于消息队列缓冲器52的发送区域中。
这里,操作员用于目视确认的分离图像数据是从单色多值图像数据分离出,而字符识别区域的图像数据是从单色2值图像分离出,但用于操作员目视确认的图像数据从单色多值图像数据分离出的理由是由于能够清晰地判别细的线段与点以及记载内容的深浅颜色。这时,若不是去分离单色多值图像数据虽也可以将彩色图像原样地分离出,但单色单值图像数据情形的数据量少,从通信时间或用量方面考虑是有利的,因而最好是根据单色多值图像数据进行分离。
本实施形式的票据识别处理部53对于图5的期票、图6的条形码票据、图7的MT票据、图8的OCR票据都是相同的,将用于操作员目视确认的指定区域的图像数据依照票据格式定义信息从单色2值图像数据分离出,进行此分离出的图像数据中所含字符的识别。然后将此分离出的图像数据与识别结果由票据单元编辑,存储于消息队列存储器52中。
图13是流程图,示明在数据输入端6-1~6-n,使识别服务器5的识别结果为操作员确认,将此确认的识别结果由电子文件编排装置9进行编排处理。
图13中,数据输入端6-n在处于等待操作员的处理要求指令输入的状态时,当操作员输入处理要求指令时(步骤1301),即将未处理的分离图像数据与识别结果传送要求发送给识别服务器5(步骤1302)。
与此相反,当未处理的分离图像数据与识别结果留于消息队列缓冲器52内时,则将此未处理的分离图像数据与识别结果的数据返回到要求数据输入端6-n。
接收了未处理的分离图像数据与识别结果数据的数据输入端6-n,将接收到的分离图像数据(单色多值图像数据)与识别结果数据并列地显示于显示画面上,等待操作员的确认应答(步骤1304)。例如图4所示,将字符识别对象区域的图像及其识别结果并列显示,等待操作员的确认应答。
对于要进行操作员识别结果的修正输入操作时,根据修正输入修正识别结果(步骤1305、1306)。但在不进行修正输入而有确认应答时,识别结果便作为正确的结果,并将此识别结果作为最终的代码信息(CDU;代码数据单元)编辑(步骤1307)。
其次,在根据单色多值图像数据显示的指定区域的分离图像中,分离出由操作员指定区域的单色多值图像数据,编辑到IDU多值文件内。在未由操作员指定的情形,所显示区域的所有的单色多值图像数据编辑到IDU多值文件内。
再有,预设定的重要事项的部分的单色多值图像数据也编辑于IDU多值文件内。
这里的单色多值图像数据是由票据格式定义信息文件536设定的指定区域分离的图像,但将此分离图像中的一部分通过操作员进一步选择的理由是为了在目视确认后将不需要的内容尽可能地删除,而能节约电子文件编排时的存储器容量。
随后同样分离出由操作员指定区域的单色2值图像数据,编辑于IDU 2值文件内(步骤1309)。
最后将编辑成的识别结果的代码数据(CDU)1313、单色多值图像数据(IDU多值)1312、单色2值图像数据(IDU2值)1311作为一个记录数据,传送给电子文件编排装置9,电子编排到代码数据库7中(步骤1310)。
这样,通过进行电子文件编排,对于误处理时或顾客有询问时,可以立即进行检索进行确认。
作为图像读取装置是取将票据置于票据台上读取图像的结构为例,但本发明并不局限于此,显然也可采用传真装置等那种将票据插入的形式等各种读取形式的图像读取装置。
作为票据记载内容的识别虽然是在识别服务器内进行,但也可如图15所示采用将票据识别处理53设于数据输入端的结构。图15中,除去了识别服务器,在操作服务器10内设置消息队列缓冲器52,与图1相同的部分或相当的部分以相同的符号表示。
如上所述,根据本实施形式,作为图像来读取记载于处理对象票据上的内容,将此读取的图像数据传送给识别服务器,在此识别服务器内,分离出预定区域的单色多值图像与字符识别对象区域的单色2值图像的数据,并且进行字符识别,发送给用于由操作员进行确认的数据输入端,接收了操作员的确认或修正操作后进行电子编排,进而取能提供对应于票据内容的业务处理工作的结构,由此,在有必要显示供操作员确认的图像的金融机关内票据处理的业务中,可以将传送给识别服务器的数据量减少到必要的最小限度,节约通信费用。
此外,在窗口终端仅仅进行处理对象票据的读取操作而与字符识别处理时间无关,得以逐一地处理作为处理对象的票据而能提高窗口业务的效率。特别当即使将窗口终端设于金融机关以外的小店铺时,由于票据内容的最终确认是由中央装置的操作员进行,即使小店铺的管理者未受过专门训练也能对应地解决,从而有助于改进金融机关业务处理的效率。
如上所述,根据本发明,易于短时间内进行多种票据类别的识别。此外,在有必要显示供操作员确认的图像的金属机关内票据处理的业务中,可以将传送给识别服务器的数据量减至必要的最小限度,除能节约通信用费外,还有助于改进金融机关的业务处理效率。