具体实施方式
以下据附图详述本发明的实施形式。
图1是示明适合采用本发明的帐票处理方法的系统的一种实施形式的系统结构图。这一实施形式的系统具有图像读出装置,用来读出处理对象的帐票所记载的字符和符号、条形码,顾客所固有的识别信息(例如印迹等)。
顾客所固有的识别信息是顾客个人所固有的识别信息,例如是印鉴的印迹、标志、指纹、声纹、眼睛网膜的图像等。在本实施例中,作为顾客所固有的识别信息的一例现在相对采用顾客印迹的情形加以说明,当然这里所申请的发明中并不限定于此,而可以是上述任何一种识别信息。这就是说,以下所述的本实施例的结构要素即顾客识别信息数据库9乃是存储着顾客固有识别信息的数据库,而在此则为印鉴的数据库。此外,顾客识别信息检索处理部25是用来检索顾客识别信息数据库9内的数据的,在此即进行数据库9内印鉴检索的印鉴检索处理部。再有,顾客识别信息核对处理部225是用来核对处理对象的帐票上记录或记述的识别对象的顾客识别信息和顾客识别信息数据库9中所编目的顾客识别信息,而在此即印鉴核对处理部225。
上述系统包括由个人计算机等计算机构成的窗口终端2、附属于此窗口终端的键盘3、鼠标(指示装置)4、显示设备5、词典文件6、帐票格式定义信息文件7、图像定义文件8以及印鉴数据库9。此外,印鉴数据库9虽可直接附属于窗口终端2,但考虑到保密关系,最好由离开窗口终端的中央计算机管理,从窗口终端经通信线路来检索编目印鉴的印迹图像。
图像读出装置1构成为从斜上方对帐票台上的帐票10作光学扫描,而将读出的图像数据输入窗口终端2的输入控制部21。
窗口终端2具有输入控制部21、帐票字符认识部22、帐票识别的宏23、显示控制部24以及印鉴检索处理部25。输入控制部21用对图像读出装置1的输入进行控制,如图2所示,包括用于高速传送读取的图像数据的SCSI驱动器211、图像扫描器的标准接口TWAIN驱动器213、进行读取的图像畸变补正的畸变补正部212。畸变补正部212是在从斜上方读出帐票图像时,此读出的图像如图2B所示成为台形214,为此而用来将它补正成矩形215的。此输入控制部21将由TWAIN标准规定的格式读出的图像数据输入帐票识别宏23。
帐票识别宏23是根据输入控制部21输入的读出图像数据识别帐票种类,再进行所记载的字符和条形码等的识别与印迹的检索核对处理的部分,由有选择的调用帐票字符识别部22的各处理部,实施帐票种类的识别、字符识别、印迹核对的宏程序构成。这些宏程序能对“带识别符号(ID)的帐票”、“单张帐票”、“多张帐票”等的各种帐票进行设定。“带ID的帐票”属自行制定的一类帐票,是印刷有帐票识别符号字符(数字)的帐票。“单张帐票”是支票和期票、电话公司和电力公司等制定的1张传票形式的帐票、“多张帐票”是取多张结构形式的帐票。这些帐票种类各个的宏程序是以键盘3或鼠标4的图像读出开始指令的输入为契机,按预定的顺序起动,有选择地调用帐票字符识别部22的各处理部,对用于帐票种类的识别、字符识别、操作员的确认,进行必要部分的图像切出处理,将识别的字符、切出的图像和帐票种类的信息传送给后续的业务处理程序(未图示)或业务处理终端(未图示)。这种后续的业务处理程序或业务处理终端,例如在金融机构中根据帐票上所记载的交易种类和交易形式等,与主计算机一起或是单独地进行支付和进款等处理。
帐票字符识别部22包括字符识别处理部221、帐票识别处理部222、条形码识别处理部223、字符核对处理部224、印鉴核对处理部225、图像处理部226和线段探测处理部227。此各个处理部是由根据前述帐票识别宏23的宏程序中选择起动的程序构成。
字符识别处理部221是识别记载于处理对象的帐票上的作为识别对象的字符(金额和帐票ID等的英文数字、姓名等的字符)的部分,在识别存在有识别对象的字符的这类帐票时,根据进行这种识别的帐票种类中帐票识别宏23的宏程序起动,识别帐票识别宏23所指示区域的字符。所谓识别对象的字符是手写的字符、印刷字符、OCR(光学字符识别)字符以及MICR(磁性墨水字符识别)字符。
帐票识别处理部222是通过帐票的读出图像数据和用于识别帐票格式定义信息文件7中所编目的帐票种类的匹配处理,来识别处理对象的帐票种类的部分,它是根据识别各种帐票的帐票识别宏23的各个宏程序起动的。
这里的帐票种类大致分为带ID的帐票、条形码帐票、OCR帐票等,但例如即使是同一类带ID的帐票,因ID编号不同,格式也各异。
(1)切出由帐票种类识别用的定义信息指定的区域的图像,识别是带ID的帐票还是条形码帐票等的类别;
(2)若是带ID的帐票时,识别其ID编号,识别对应于此ID编号的次级属性;
(3)切出根据此次级属性的格式定义信息指定的区域图像的信息,进行字符识别而进行对应于此识别结果的处理。
本发明对于相同帐票种类中使格式根据ID编号再作区分或分类时,把这种区分或分类称为下级属性。
匹配处理,在识别条形码和印刷在票据/支票上的MICR字符时,是指根据图像(条形码图像、MICR字符图像)进行的图像匹配处理;而在识别印刷有多行数字列组成的代码信息的帐票时,则是指1字符单位或字符列单位相互间的匹配处理。
条形码识别处理部223是用来识别记载于处理对象的帐票上的识别对象图形码的部分,在识别存在有识别对象条形码的这种帐票时,根据进行这种识别的帐票种类的帐票识别宏23的宏程序起动。
字符核对处理部224是识别记载于处理对象帐票上的识别对象的字符(例如银行名称、公司名称、住处、姓名等)的部分,在识别存在有识别对象字符的这种帐票时,根据进行这种识别的帐票种类中的帐票识别宏23的宏程序起动。
印鉴核对处理部225是用来核对印在处理对象帐票上的识别对象印迹和在印鉴数据库9中所编目的印迹的部分,在识别存在有认识对象印迹的这种帐票时,根据进行这种识别的帐票种类中的帐票识别宏23的宏程序起动。
图像处理部226是在处理对象的帐票上,把为了能由操作者进行确认或为了在处理履历上留下记录而必需有的印迹等图像进行切出处理的部分,在识别存在有切出对象图像的这种帐票时,根据进行这种识别的帐票种类的帐票识别宏23的宏程序起动。
线段探测处理部227是用来探测帐票上所记载的表或划线等线段特征的部分,在对包含有表和划线等线段的这种帐票进行识别时,根据进行这种识别的帐票种类中的帐票识别宏23的宏程序起动,将探测出的线段特征和预先在帐票格式定义信息文件7编目的帐票设计信息进行核对,判定其相应于哪种设计的帐票。
辞典文件6存储有用于字符核对处理部224进行字符核对的辞典。
帐票格式定义信息文件7用于对许多种帐票的类别、识别其次级属性用的图像切出区域的信息、各种帐票中的字符和印迹等识别对象区域等的信息进行预先编目,对所处理的帐票种类识别用的定义信息和各种类中次级属性的格式定义信息进行编目。有关编目的内容以后在帐票类别的识别处理中描述。
图像定义文件8是用来在读出的帐票内容显示于显示设备5中时,把显示确认图像的形式和操作导向图像等显示用的图像定义信息予以编目。
现有首先说明本实施形式的帐票处理系统所处理的典型例子以及识别结果的显示例子。
图3A与3B是自行制定格式的帐票(以下称作制定帐票)例及识别结果的显示例。如图3A所示,在制定帐票300上印制有此制定帐票的ID(图例中为“001”)和用于识别处理类别或处理形式的检验框(图例中,“01普通存款户头支出”、“02活期存款支出”的检验框“□”)302、303。当从普通存款户头取出此制定帐票300时,由顾客于302的检验框中记入符号“√”。在其下栏由手写入取出金额“¥30000”和户头编号“14011257”,进而在“姓名”栏内手写入顾客的姓名“村田××”。此外,图3A的制定帐票300中是存在有“支店编号”的手写记入栏的,但这会使图面复杂,省略了图示。
在读出这种制定帐票300时,将图3(B)所示的识别结果显示于显示设备5的确认画面310上。在此确认图面310上显示有手写字符的支店编号“123”的切出图像311及其字符识别结果312、手写字符的户头编号“1401257”的切出图像313及其字符识别结果314、手写字符的取出金额“30000”的切出图像315及其字符识别结果316、姓名的手写字符“村田××”的切出图像317及其识别结果318、盖印于制定帐票300上的印迹319的切出图像和在印鉴数据库9中编目的印迹320。
图4A与4B例示期票与其识别结果。如图4A所示,在期票400中由于在规定位置处印有法定的期票固有的MICR字符(磁性印刷字符)401,故在此规定位置处通过与MICR字符图像的图像匹配处理来识别是否印刷有此预定字型图像的MICR字符401。在识别正规形式的期票时,进行必要部分的识别与图像的切出而显示出图4B所示的确认画面410。此外,在图4A的期票400中虽然存在有支付地银行的“支店编号”的印刷字符,但由于会使图面复杂,省略了图示。
在图4B所示的确认画面410中显示有:支付地银行的“支店编号”的印刷字符“123”的切出图像411及其字符识别结果412、支票填写机记入的取出金额“¥30000”的切出图像415及其字符识别结果416、开票人姓名的手写字符“村田××”的切出图像417及其识别结果418、期票400中盖印的开票人的印迹419的切出图像和在印鉴数据库9中编目的印迹402、以及期票400的整体的缩小图像421。之所以切出缩小图像421,是由于有必要在发生误处理时或顾客有查询时留作证明。
图5A与5B例示印有条形码的市民交税用的帐票及其识别结果。在图5A、5B例示的市民交税用的帐票中,如图5A所示,相应的地方自治体或自治机构在这种帐票上的预定位置以条形码印有自治体名和交纳户头编号等。下面将这种帐票定义为条形码帐票500,在本发明中,切出条形码帐票识别用的定义信息所确定的区域的图像,而由图像匹配处理来识别在此区域中记载的是否是此条形码。当探测到载有此条形码的区域,即可识别条形码帐票,根据条形码的内容(译码结果),识别交纳对象的金融机构的支店编号等等。然后切出姓名、金额等必要部分的图像,进行字符识别,将识别结果显示于图5B所示的确认画面510。在图5B所示的确认画面510显示出交纳对象银行的“支店编号”的识别结果511、由印刷或手写的字符记入的取出金额“¥30000”的取出图像512及其字符识别结果513、交纳者姓名的印刷或手写的字符“村田××”的切出图像514及其识别结果515。
图6A与6B例示电力公司等的符号代码以多行数字码记载的交费用帐票及其识别结果的显示例,电力公司“××电力”的交费用帐票600之中,如图6A所示,有在此电力公司等所明确的预定位置上,由多行数值码601印刷的电力公司固有的符号代码的形式。下面将这种形成的帐票定义为MT帐票,在本发明中,对于这种MT帐票600,是通过切出由用于识别MT帐票的定义信息所确定的区域的图像,经字符识别处理来识别在此区域中是否记载有多行数字码。
要是探测出多行数字码601的记载区域,则可识别它是MT帐票,根据此数字码的内容识别交纳对象的电力公司等的符号代码等。然后切出必要部分的图像,进行字符识别,将识别结果显示于图6B所示的确认画面610上。图6B的确认画面610上显示有交费对象银行“支店编号”的识别结果611、由印刷或手写字符所记的取出金额“¥30000”的切出图像612及其字符识别结果613、交费者姓名的手写字符“村田××”的切出图像614及其识别结果615。此外,MT帐票也称作为邮局转帐MT业务用的帐票。所谓邮局转帐MT业务,是把邮局转帐通常的缴纳内容(用户在MT业务专用缴纳书中预先记载的OCR字符数据)的通知,不由图像输出缴纳处理票经邮局寄送,而是记录于磁带或软盘上转给用户的一种业务。
图7A、7B例示地方自治体或自治机构等符号代码的多位数值码记载的纳税用帐票及其识别结果的显示例,自治体“东京都”的所得税交纳用帐票700如图7(A)所示,有在此自治体明确的预定位置上,由多位OCR字符701所印刷的自治体固有的符号代码等的形式。下面将这种形式的帐票定义为OCR帐票700,对于这种OCR帐票也进行与图6A、6B的帐票600同样的处理。也就是,相对于图7A和7B的OCR帐票700,切出由OCR帐票识别用的定义信息所确定的位置的图像,在此切出图像之中由字符识别处理来识别是否记载有多行的OCR字符。要是探测出记载有多行的OCR字符701时,则作为OCR帐票识别,根据此数字码的内容(数值的识别结果),识别交纳对象的自治体的符号代码等。这样,进行必要部分的图像切出和字符识别而把识别结果显示于图7B所示的确认画面710上。在图7B所示的确认画面710上显示有交纳对象银行的“支店编号”的识别结果711、由印刷或手写字符记入的取出金额“¥30000”的切出图像712和其字符识别结果713、交纳者姓名的印刷或手写字符“村田××”的切出图像714和其识别结果715。
图8是流程图,示明在由图像读出装置1读出上述各种格式的帐票时,识别是哪一种帐票,进而由ID编号来识别其次级属性,以识别记载内容的程序。
在此,为了能按照预定的顺序来识别处理对象的帐票是多种帐票中的哪一种。设定了识别程序,依据此识别程序进行帐票种类的识别。在各帐票的识别处理中,根据图像读出装置1读出的帐票的读出图像,切出由帐票格式定义信息文件7中预编目的帐票种类识别用的定义信息所指定的区域的图像,对此切出的图像进行识别(字符识别或条形码等的图像构型的识别等),识别帐票种类,当识别了相应的某个种类后就不进行后续的其他识别程序,切出由此相应种类的帐票格式定义信息中在识别对象内设定的区域的图像,进行对次级属性的识别,再转移到对所记载内容的识别处理。
下面对此作详细说明。首先起动此系统,显示出图9所示的初始画面900(步骤801)。将处理对象的帐票置于图像读出装置1的帐票台上,由鼠标4的“点按”声的操作来操作初始画面900的图像输入开始钮901,从键盘3输入图像输入开始指令。
窗口终端的帐票识别宏23当识别到图像输入开始指令的输入时(步骤802),通过输入控制部21相对图像读出装置1发送读出开始信号。由此即开始图像读出装置1的帐票图像的读出操作。图像读出装置1将读出的帐票图像数据通过输入控制部21传送给帐票识别宏23。帐票识别宏23宏根据传送来的读出图像数据,按预定顺序识别处理对象的帐票。在此,按照下述顺序:制定帐票(图3A、3B)、条形码帐票(图5A、5B)、MT帐票(图6A、6B)、MICR帐票即支票/票据(图4A、4B)、自治体的OCR帐票(图7)、上述以外的帐票其设计已预先在帐票格式定义信息文件7中编目的帐票(称作设计帐票),进行识别处理。
具体地说,帐票识别宏23按照下述顺序起动:识别制定帐票的宏程序、识别条形码帐票的宏程序、识别支票/票据的宏程序、识别自治体的OCR帐票的宏程序、识别设计帐票的宏程序。
之所以将制定帐票设定于最优先的顺序位置是由于预测制定帐票的输入量最多,但是这种顺序可以通过改变帐票认识宏23中各种帐票类别对应的宏程序的起动顺序而变更。此外,当处理对象帐票的种类增加时,只需追加这种帐票用的宏程序即可,不必改变帐票字符认识部22的结构。
首先起动对应于带ID的帐票即制定帐票的帐票认识宏23的宏程序,起始帐票字符识别部22的字符识别处理部221和帐票识别处理部222、单词核对处理部224、印鉴核对处理部225和图像处理部226,识别帐票种类是否是制定帐票(步骤803),要是判明帐票ID是印刷的制定帐票,在通过与此帐票ID的制定帐票相对应的帐票格式定义信息切出预定区域的图像后,进行字符识别(户头编号和顾客姓名、取出金额等的实际数据),进而根据印迹等帐票格式定义信息,切出预定区域的图像(步骤804),将其结果(识别的字符和切出的图像以及帐票种类的信息)传送给后续的业务处理部。
当判明不是制定帐票时,随后即起动对应于条形码帐票的帐票识别宏23的宏程序,起动帐票字符认识部22的字符识别处理部221和帐票识别处理部222、条形码识别处理部223、字符核对处理部224、印鉴核对处理部225以及图像处理部226,识别是否是条形码帐票(步骤805),要是判明是印刷有条形码的条形码帐票时,在根据对应于此条形码帐票的帐票格式定义信息切出预定区域的图像后,进行此切出图像的字符识别(顾客姓名,取出金额等),进而切出由帐票格式定义信息预定区域的图像(手写的字符或印刷字符等)(步骤806),将此结果(识别的字符和切出的图像与帐票种类的信息)传送给后续的业务处理部817。
当判明不是条形码帐票时即起动对应于MT帐票的帐票识别宏23的宏程序,起动帐票字符识别部22的字符识别处理部221和帐票识别处理部222、字符核对处理部224、印鉴核对处理部225以及图像处理部226,由数字码序列识别是否是MT帐票(步骤807),要是判明是MT帐票时,则在根据与此MT帐票对应的帐票格式定义信息切出预定区域的图像后,进行字符识别(顾客姓名、取出金额等的实际数据),进而切出由帐票格式定义信息预定区域的图像(手写的字符和印刷字符等实际数据)(步骤808),然后将这些结果(识别字符与切出图像以及帐票种类的信息)传送给后续的业务处理部817。
当判明不是MT帐票时,即通过是否存在MICR字符来识别是否是支票或是票据(期票、汇票)(步骤809),要是判明是这种票据或支票,即在切出由与这种票据或支票上所印MICR字符相对应的帐票格式定义信息预定区域的图像后,即进行字符识别(支付地银行的分店编号和顾客姓名、取出金额等实际数据),再切出由印迹等帐票格式定义信息预定区域的图像,进而制成票据或支票的总体缩小图像(步骤810),而后将此结果(识别字符和切出图像以及帐票种类与缩小图像)传送给后续的业务处理部817。
但是当判明不是票据或支票时,即起动对应于进行地方税交纳等的OCR帐票的帐票识别宏23的宏程序,起动帐票字符识别部22的字符识别处理部221和帐票识别处理部222、字符核对处理部224、印鉴核对处理部225与图像处理部226,通过多位的OCR字符的字符识别处理来识别是否是OCR帐票(步骤811),要是判明是OCR帐票,即切出由与此OCR帐票上印刷的OCR字符相对应的帐票格式定义信息所预定的区域的图像,对此切出的图像进行字符识别(顾客姓名、取出金额等),再切出由帐票格式定义信息预定区域的图像(手写的字符和印刷字符等)(步骤812),将这种结果(识别的字符和切出的图像以及帐票种类的信息)传送给后续的业务处理部817。
对于与上述任一种情形都不对应的帐票,将此情形显示于显示设备5的画面上,输入应否进行上述以外种类帐票的识别处理的指令(步骤813),要是输入实行这种意向的指令,则例如图10所示,为了判别预先通过设计在帐票格式定义信息文件中是否有预先编目的设计帐票1000,可起动对应于设计帐票的帐票识别宏23的宏程序,起动帐票字符识别部22的字符识别处理部221和帐票识别处理部222、字符核对处理部224、印鉴核对处理部225、图像处理部226和线段探测处理部227来识别是否有设计帐票1000(步骤814),切出由与此设计帐票1000所对应的帐票格式定义信息预定区域的图像,进行此切出图像的字符识别(顾客姓名、取出金额等实际数据),再切出由帐票格式定义信息预定区域的图像(手写字符或印刷字符等)(步骤815),将此结果(识别的字符和切出的图像以及帐票种类的信息)传送给后续的业务处理部817。
在判明与任一种帐票都不对应时,即作为识别对象外的帐票拒绝受理(步骤816)。
图11详示识别处理对象的帐票是否是图3例示制定帐票300的处理程序,首先根据帐票种类识别用定义信息1103切出图3的制定帐票的ID 301和检验框302、303的印刷区域的图像。然后在此切出图像中仔细观察是否存在有制定帐票的ID 301和检验框302、303的字符以及“√”符号标明的“□”符号。这就是说,在制定帐票300中的帐票ID 301和检验框302、303和“普通存款支出”等的字符,由于印刷在制定帐票300的指定位置上,故可将示明帐票ID 301和检验箱302、303以及“普通存款支出”等字符的印刷区域的坐标数据,作为制定帐票对应的帐票种类识别用的定义信息1103在帐票格式定义信息文件7内编目。
于是:
(1)在由处理对象的帐票读出的图像数据之中切出由前述坐标数据表示的坐标区域的图像,对所切出的图像进行字符识别,考察ID 301和检验框302、303的“□”符号和“普通存款支出”等字符与“√”符号标记的“□”符号是否存在(步骤1101,1102),当存在时,处理对象的帐票可识别为制定帐票300(步骤1104),而变换为在此制定帐票300内对应识别区域的字符和图像等数据(工作数据)进行识别处理(步骤1105)。在此阶段,若是图3中的制定帐票300的例子,帐票ID为“001”,则可判明取出的类别或取出形式是“普通存款支出”。也就是,可知处理对象的帐票为制定帐票而且次级属性是帐票ID=“001”。所谓工作数据即进行后续业务处理中成为必要部分的数据。
(2)在工作数据的识别处理1105中,首先在取得帐票ID对应于“001”的制定帐票300的帐票格式定义信息1106后,切出此帐票格式定义信息1106所指定的区域的图像,用字符识别处理部221去识别此切出区域中所记载的字符、符号等。
在此阶段,若为图3的制定帐票300的例子,可以求得办事员312、户头编号314、取出金额315、顾客姓名318的识别结果(步骤1108)。同时用图像处理部226求得印迹319的切出结果。这时如果求得了户头编号314和顾客姓名318,印鉴核对处理部225即可根据相应制定帐票300的帐票识别宏程序的指令,通过印鉴检索处理部25,由户头编号314和顾客姓名318从印鉴数据库9取得特定顾客的编目印迹320的图像数据,与制定帐票300切出的印迹319作图像匹配处理,算出其是否同一或算出其相似度而显示于显示设备5的画面上。
(3)当工作数据的识别结束后,即执行“形式检验处理(A)”1107,此“形式检验处理A”1107虽不构成判别帐票种类的本发明的主要部分,但可以进行识别的工作数据相互间有无矛盾或有无漏记等形式上的检验,若是发现漏记等形式上的缺陷,则显示于显示设备5的画面上。
(4)由步骤1104求得的帐票ID、检验框的内容存储于业务处理部817的制定帐票/事务对应表(TBL)8171中。具体地说,业务处理部817在接收到步骤1104取得的帐票ID、检验框的内容后,即于制定帐票/事务对应表(TBL)8171中存储与此帐票ID(图3的例中为“001”)和检验框的内容(图3的例中为“普通存款支出”)相对应的“业务、形式、科目”的事务码“00·11·11”(步骤8172),确定事务码(步骤8174)。进而制定与此事务码“00·11·11”对应的工作数据表(TBL)8173,相对于此工作数据表8173,把从处理对象的制定帐票300读出的工作数据支出金额”30000”、户头编号“140257”附以相关的工作号予以存储。之所以存储相关的工作号是为了便于进行和确认画面的确认项目相关联。
当确定了支出和收入等事务码后,可以采用确定的事务项目“普通存款支出”的事务票引,从画面数据文件8检索“普通存款支出”的确认画面数据,显示出图4B所示的确认画面,在此画面410中的指定位置处显示出存储于工作数据表8173中的支出金额和户头编号等的识别字符。同时相关地显示出成为识别字符根据的顾客姓名等手写字符的切出图像。此外,存储于工作数据表8173中的识别字符的数据则提供给“形式检验B”8175的处理。“形式检验B”8175的处理例如是进行对应于事务内容的形式上的检验处理。
图12详示识别处理对象的帐票是否是图5例示的条形码帐票500的处理程序。首先在图5的条形码帐票500的条形码501的印刷区域中,应用条形码帐票识别用的帐票识别定义信息1203来考察是否存在条形码。这就是说,条形码帐票500中的条形码501由于条形码帐票本身是企业或自治体所制定的,条形码的印刷位置是不同的。于是,对企业或自治体制定的各个条形码帐票,把表明其印刷区域的坐标数据作为各条形码帐票对应的帐票种类识别用定义信息1203予以编目。
为此:
(1)在由处理对象的帐票读出的图像数据之中切出前述坐标数据所表示的坐标区域的图像,探测在此区域中是否存在条形码。要是检查出条形码,则识别其为条形码帐票(步骤1204)。
(2)然后进行条形码区域中所记载的条形码数据的识别处理(步骤1205),从条形码的开始位置“1”取得所记载的企业代码和条形码表现的事务形式或事务科目的代码(步骤1205)。这样即取得与此企业代码相对应的条形码帐票500的帐票格式定义信息1206,根据此帐票格式定义信息1206,在对应于此企业代码的格式的条形码帐票中条形码表现的户头编号开始位置,取得要求金额开始位置的信息,取得从这种开始位置开头多行的户头编号、要求金额的信息。再根据帐票格式定义信息1206,在与此企业代码相对应的条形码帐票500内切出应识别区域的字符和图像等,转移到识别工作数据的处理。
在此阶段中,若为图5中条形码帐票500的例,则判明要求金额“30000”、户头编号“××”。
(3)当条形码数据的识别结束后,即进行“形式检验处理A”1207。此“形式检验处理A”1207虽不构成判别帐票种类的本发明的主要部分,但进行识别的条形码数据和记载内容相互之间有无矛盾、有无漏记等形式上的检验,若是发现有漏记等形式上的缺陷时,则于显示设备5的画面上显示。
(4)将这样求得的企业代码“01234”、事务形式或事务科目代码“00·11·11”存储于业务处理部817的条形码帐票/事务对应表(TBL)8175中。此外,户头编号和要求金额等则与条形码的开始位置和表示位数的信息共同存储于与上述事务码“00·11·11”相对应的条形码数据表(TBL)8176中。
当确定了事务码后,业务处理部817应用对应于已确定的事务码“00·11·11”的公共费用事务索引,从画面数据文件8检索图5的“市民纳税”的确认画面数据,显示于图5B所示的确认画面510上,在此画面510中的指定位置处显示存储于条形码数据表8176中的户头编号和要求金额等识别字符。同时相关地显示出成为识别字符根据的手写字符的切出图像。存储于条形码数据表8176中的条形码数据,提供给“形式检验B”8177处理。“形式检验B”8177的处理例如是进行对应于事务内容的形式上的检验处理。
在条形码的探测时也可以作如下的探测。这就是说,条形码具有下述特征:
(a)纵向上的黑道以一定的长度均匀地存在;
(b)横向上每单位长度上的黑白变化点多(频率高)。利用这一事实,从读出的图像内探测出条形码的记载区域。
作为这种情形的探测方法,具体地按顺序进行下述的处理,逐渐缩小候补范围。
(1)相对于输入图像实施观察黑点连续性的行变换处理;
(2)为了避免和划线等的线段混同,从输入图像中删去纵向上的长行、短行;
(3)搜索横向上每单位长度的黑白变化数比某个阈值多的地点;
(4)对满足上述(2)与(3)的区域进行标号,进行线段的统一处理,探测出条形码区域的外接矩形。
由条形码识别处理部223实行上述处理,识别条形码帐票。
按以上处理就不必要由坐标数据指明条形码的存在区域,而可以节约帐票格式定义文件所必需的存储容量。
图13详示处理对象的帐票是否是图6例示的MT帐票的识别处理程序,首先在图6的MT帐票600的MT帐票代码(数字码)601的印刷区域中,应用MT帐票用的帐票种类识别用定义信息1303来考察是否存在由多位数字列组成的MT帐票代码。这就是说,MT帐票600中的MT帐票代码601由于MT帐票本身是邮政部门制定的,它的位置是相同的。因此,表示这种印刷区域的坐标数据便作为是各MT帐票对应的帐票种类识别用定义信息1303而编目。
为此:
(1)在从处理对象的帐票读出的图像数据中切出由前述坐标数据表示的坐标区域的图像,在此切出的图像中探测是否存在由多位数字列组成的MT帐票代码,当存在MT帐票代码时即作为MT帐票识别。
(2)其次,进行从MT帐票代码区域的开始位置“1”开始的预定位数(图13的例中是“8位”)的“户头编目”,和从开始位置“9”开始的预定位数(图13的例中是“8位”)的“要求金额”的识别处理(步骤1305)。所识别的“户头编号”和“要求金额”的数据存在于业务处理部817的MT代码数据表8180中。这样,取得对应于“户头编号”的MT帐票600的帐票格式定义信息1306,根据此帐票格式定义信息1306求得对应于此“户头编号”的企业名称“××电力”和事务形式的代码“00·11·11”的记载位置(或记载区域)的位置,切出此信息表明的位置或区域中所记载的图像之后,进行字符识别,求出企业名称“××电力”和业务形式的代码“00·11·11”。至此使户头编号“01234”同企业名称“××电力”和事务形式“00·11·11”相关联,存储于MT帐票/事务对应表8181中。
进而制成与事务形式的代码“00·11·11”相对应的MT代码数据表8182,相对于此MT代码数据表8182存入根据由帐票格式定义信息1306指定的位置或区域所识别的其他数据,同时存入数据名、开始位置以及行数的信息。
(3)在完成了MT帐票数据的识别之后,执行“形式检验处理A”1307。此“形式检验处理A1307”虽不构成判别帐票种类的本发明的主要部分,但可对于所识别的帐票数据和记载内容相互之间有无矛盾,有无漏记等进行形式上的检验,若是发现有漏记等形式上的缺陷,即于显示设备5的画面上显示。
(4)将如上获得的事务码和MT帐票数据传送给业务处理部817。业务处理部817应用与确定了的事务码相对应的公共费用事务索引,从画面定义文件8检索图6A的“××电力公司”的费用交纳确认画面610,将存储于MT帐票数据表8182中的数据显示于此画面610中的指定位置。再将存储于MT帐票数据表8182中的MT帐票数据提供给“形式检验B”8183处理。“形式检验B”8183的处理例如是进行对应于事务内容的形式上的检验的处理。
此外,检测MT帐票代码时也可以按以下所述进行检测。
(1)根据输入图像进行帐票边缘的探测,求得读出图像内帐票4个角的坐标,检验帐票的尺寸。
(2)帐票内的MT帐票代码的印刷位置和字符数是按(日本)邮政部门规定的私制标准规定的,距离帐票上端和左端的尺寸和字符数编目在帐票格式定义信息1303中,因此,根据此数据切出MT帐票的印刷区域,再将此区域内的字符按1个字符单位切出,按1个字符单位识别而检出了所记载的指定字符数时,即可识别为MT帐票。
由字符识别处理部221进行上述的处理,识别MT帐票。
图14详示识别处理对象的帐票是否是图4例示的期票400的程序,首先根据期票用的帐票种类识别用定义信息1403,考察图6的期票400的MICR字符401的印刷区中是否存在多行数字列组成的MICR字符401,进而考察期票的尺寸是否是合适的尺寸。这就是说,期票400中的MICR字符401的印刷位置是按银行统一规格指定在相同的位置;另外,此种帐票的尺寸也是统一的。为此,对表明这种MICR字符401的印刷区的坐标数据作为期票对应的帐票种类识别用定义信息予以编目。
于是:
(1)在从处理对象的帐票读出的图像数据中切出由上述坐标数据表示的坐标区域的图像,在此切出的图像中检测由多位数字列组成的MICR字符401的存在性。
在检测这种MICR字符401时,
(1)根据输入图像进行期票的边缘检测,求得读出图像内的期票的4个角的坐标,根据此坐标数据计算期票400的尺寸,核对其是否适当。
(2)期票400内的MICR字符的印字位置由于是按银行统一规格指定的,可将此印刷区域的坐标作为帐票格式定义信息1403定义,在切出由此帐票格式定义信息1403所指定的区域的图像后,将此切出区域内的MICR字符按1个字符单位顺次切出,以1个字符单位进行作为MICR字符的字符识别,当记载有指定的字符数时,即可识别为适合的期票。即使是支票,也可同样地识别。这时,由于支票和期票的尺寸不同,要把各自对应的尺寸信息和表明MICR字符区域的坐标数据预先编目。
由字符识别处理部221进行上述处理,识别期票(步骤1404)。
(2)其次,对从MICR字符的开始位置“1”开始的预定位数(例如“4位”)的“期票类别”和从开始位置“5”开始的预定位数(例如“4位”)的“期票交易所编号”;从开始位置“10”开始的预定位数(例如“4行”)的“银行编号”;从开始位置“15”开始的预定位数(例如“3位”)的“支店编号”,进行识别处理(步骤1405)。所识别的“票据类别”、“票据交易所编号”、“银行编号”、“支店编号”等数据存储于业务处理部817的MICR数据表819中。然后取得对应于“票据类别”的期票400的帐票格式定义信息1406,根据这一帐票格式定义信息1406,切出记载有此“票据类别”中应确认的事项的区域的图像,对“银行编号”、“支店编号”等进行字符识别。再用此识别结果进行格式的“形式检测A”1407。此“形式检验A”1407虽不构成判别帐票种类的本发明的主要部分,但能对于所识别的票据、支票数据和记载内容相互之间有无矛盾、有无漏记等进行形式上的检验,若是发现有记漏等形式上的缺陷,则于显示设备5的画面上显示。
再对由“票据类别”的帐票格式定义信息所指定区域的图像,例如记载有事务形式的代码“11·22·33”的区域的图像进行切出,作字符识别后存储于票据与支票/事务对应表8191中。然后制成与此事务形式的代码“11·22·33”相对应的票据与支票数据表8192,将从由此帐票格式定义信息1406指定的工作区域识别的字符和图像等数据的数据名和数据存储于此表8192中。
(3)将如上求得的票据与支票数据传送给业务处理部817。业务处理部817用对应于所确定的事务码的活期存款事务索引,从画面数据文件8检索图4A的期票确认画面数据,显示于图4(B)所示的确认画面410上,在此画面410中的指定位置上显示出识别的字符和印迹以及此票据整体的缩小图像。存储于票据与支票数据表8192中的票据与支票数据提供给“形式检验B”8193处理。“形式检验B”8193的处理例如是对对应于事务内容的形式上的检验进行处理。
再者,对于图10中例示的设计帐票,可将(1)此帐票内的线段信息(线段在帐票内的始点与终点坐标、线段类别等),(2)标题(“支出传票”等)的字符外的特征,作为图像数据形式的帐票格式定义信息预先在帐票格式定义信息文件7中编目,从帐票格式定义信息文件7输入识别对象的图像数据形式的帐票格式定义信息,对此帐票格式定义信息和帐票内的线段坐标与标题部分的读出图像的线段和字符外的特征进行匹配处理,把相似度最高的设计种类作为所识别的帐票种类。
此外,帐票尺寸的检验虽然是相对于票据/支票说明其实施例,但对其他种类的帐票也可同样实施。
对于所读出的信息,虽然只显示预设定的部分,但也可显示全部,而把重要部分通过颜色或改变亮度来显示。至少图像读出装置是把帐票置于帐票台上来读出图像的这种结构作为例子来说明的,但本发明并不局限于此,显然也可采用传真设备等那种将帐票插入的形式等各种阅读形式的图像读出装置。
由以上所述可知,根据本实施形式的帐票处理方法,设定了识别程序按预定顺序来识别处理对象的帐票是属于多种帐票之中的哪一种,在按照此识别顺序进行帐票种类识别之后,再识别其次级属性,对此识别结果切出由固有的格式定义信息所定义的区域的图像,再转移到根据此切出图像来进行帐票内容识别的识别处理,因此易于用短的时间来进行多种帐票的票种识别。
此外,对操作者来说,只需把处理对象的帐票置于图像读出装置的帐票台上,识别帐票种类,把其中在确认时的必要部分显示于显示设备上,因而大大简化了帐票处理的作业,显著地改进了作业效率。还由于缩短了时间,加速了处理帐票的金融机构等窗口业务,而能改进对顾客的服务,通过将这种系统设置于处理多种帐票的金融机构、零售店等的受理窗口,就能由这种系统读出的信息来高效地促进进行后续业务处理的设备或系统的工作。
如上所述,根据本发明易在短时间内进行多种帐票的种类识别。此外,即使对于具有次级属性的帐票,也能参考其固有的格式的信息于短时间内识别其所记载的内容。