JP4412525B2 - Form recognition device and form recognition method - Google Patents

Form recognition device and form recognition method Download PDF

Info

Publication number
JP4412525B2
JP4412525B2 JP2001366611A JP2001366611A JP4412525B2 JP 4412525 B2 JP4412525 B2 JP 4412525B2 JP 2001366611 A JP2001366611 A JP 2001366611A JP 2001366611 A JP2001366611 A JP 2001366611A JP 4412525 B2 JP4412525 B2 JP 4412525B2
Authority
JP
Japan
Prior art keywords
information
data
determined
read
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2001366611A
Other languages
Japanese (ja)
Other versions
JP2003168075A (en
Inventor
浩一 金元
一範 山本
裕 勝又
勝利 小原
真一 江口
眞紀 矢吹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Ltd
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Fujitsu Frontech Ltd filed Critical Fujitsu Ltd
Priority to JP2001366611A priority Critical patent/JP4412525B2/en
Publication of JP2003168075A publication Critical patent/JP2003168075A/en
Application granted granted Critical
Publication of JP4412525B2 publication Critical patent/JP4412525B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、複数帳票を判別してデータを読み取る帳票認識装置および帳票認識方法に関するものである。
【0002】
【従来の技術】
従来、金融機関などの事務において、国庫金や税金などの帳票を受け取り、当該帳票に記載されているデータをオペレータが画面上から手入力していた。また、受け取った帳票を国庫金と指定して当該指定した帳票のフォーマットをもとにスキャナで読取該当する位置からデータのイメージを読み取って認識し、入力するようにしていた。
【0003】
【発明が解決しようとする課題】
従来は、受け付けた帳票についてオペレータが国庫金などを判別して指定し該当フォーマットに従い該当位置からイメージを読み取って認識してデータにし、当該データを入力するようにしていたため、受け付けた帳票がいずれの種類の帳票かをオペレータがいちいち判別して指定するという手間が必要となってしまう問題があった。
【0004】
本発明は、これらの問題を解決するために、入力された帳票のサイズ、帳票ID,罫線情報、長大文字列、ユニーク情報などを抽出・照合して帳票の種類を確定し、文字情報を抽出して入力・集計し、複数種類の帳票から確実かつ迅速に帳票の種別を自動判定してデータを読み取って入力・集計することを目的としている。
【0005】
【課題を解決するための手段】
図1を参照して課題を解決するための手段を説明する。
【0006】
図1において、処理装置1は、プログラムに従い各種処理を実行するものであって、ここでは、認識手段3、集計手段5などから構成されるものである。
【0007】
認識手段3は、帳票からサイズを読み取ったり、読みとったサイズをもとに該当する帳票候補を判定したり、帳票候補のIDを抽出したり、帳票候補のユニーク情報を抽出したりなどし、帳票を確定するものである。
【0008】
集計手段5は、帳票から読み取ったデータを集計するものである。
次に、動作を説明する。
【0009】
処理装置1を構成する認識手段3が読み取った帳票サイズをもとに帳票候補を判定し、帳票候補のIDを抽出して帳票を判定し、判定された帳票の情報をもとにデータを抽出して認識するようにしている。
【0010】
また、認識手段3が読み取った帳票サイズをもとに帳票候補を判定し、帳票候補の罫線を抽出して帳票を判定し、判定された帳票の情報をもとにデータを抽出して認識するようにしている。
【0011】
また、認識手段3が読み取った帳票サイズをもとに帳票候補を判定し、判定された帳票候補について長大文字列を抽出して帳票を判定し、判定された帳票の情報をもとにデータを抽出して認識するようにしている。
【0012】
これらの際に、帳票候補中からユニーク情報を抽出して帳票を判定するようにしている。
【0013】
また、集計手段5が確定された種類の帳票の情報をもとに帳票毎にデータを抽出し、日付毎、支店毎、収納先毎に金額を集計するようにしている。
【0014】
従って、入力された帳票のサイズ、帳票ID,罫線情報、長大文字列、ユニーク情報などを抽出・照合して帳票の種類を確定し、文字情報を抽出して入力・集計することにより、複数種類の帳票から確実かつ迅速に帳票の種別を自動判定してデータを読み取って入力・集計することが可能となる。
【0015】
【発明の実施の形態】
次に、図1から図10を用いて本発明の実施の形態および動作を順次詳細に説明する。
【0016】
図1は、本発明のシステム構成図を示す。
図1において、処理装置1は、プログラムに従い各種処理を実行するものであって、ここでは、入力手段2、認識手段3、照合手段4、集計手段5などから構成されるものである。
【0017】
入力手段2は、スキャナ11から読み取った帳票のイメージ(画像)を取り込むものである。
【0018】
認識手段3は、取り込んだ帳票のイメージをもとに帳票のサイズを測定したり、読み取ったサイズをもとに該当する帳票候補を判定したり、帳票候補のIDを抽出したり、帳票候補のユニーク情報を抽出したりなどし、帳票を確定するものである(図2、図3を用いて後述する)。
【0019】
照合手段4は、DB6から9の該当するものと照合するものである(図2、図3を用いて後述する)。
【0020】
集計手段5は、帳票から読み取ったデータを集計するものである(図2、図3を用いて後述する)。
【0021】
帳票サイズDB6は、帳票のサイズを登録したDB(データベース)である(図4を用いて後述する)。
【0022】
国庫金帳票DB7は、国庫金帳票に関する各種情報を登録したものである(図8を用いて後述す)。
【0023】
税公金OCR帳票DB8は、税公金帳票に関する各種情報を登録したものである(図8を用いて後述する)。
【0024】
税公金非OCR帳票DB9は、税公金非OCR帳票に関する各種情報を登録したものである(図10を用いて後述する)。
【0025】
表示装置10は、各種情報を表示するものである。
スキャナ/OCR11は、各種帳票を読み取ってイメージ(画像)にしたり、帳票のマークされている位置の情報を認識したりなどするものである。
【0026】
出力装置12は、各種出力装置であって、印刷装置などである。
次に、図2および図3のフローチャートの順番に従い、図1の構成の動作を詳細に説明する。
【0027】
図2および図3は、本発明の動作説明フローチャートを示す。
図2において、S1は、帳票を入力する。これは、図1の入力手段2がスキャナ11を制御し、帳票のイメージ(画像)を読み取られせて取り込む。
【0028】
S2は、雑音除去、傾き補正する。これは、S1でスキャナ11によって読み取った帳票のイメージについて、雑音を除去した後、当該帳票のイメージが傾いていたときは傾きを自動補正し、水平、垂直方向に当該帳票の外枠がなるようにする。
【0029】
S3は、帳票サイズを算出する。これは、S2で雑音除去、傾き補正後のイメージから横方向の幅Wおよび縦方向の長さ(高さ)Hを算出する。
【0030】
S4は、変数NC=0と初期設定する。これは、帳票の種類についてサイズをもとに判定する回数を計数する変数NCに初期値0を設定する。ここでは、帳票の種類として、国庫金帳票、税公金OCR帳票、税公金非OCR帳票の3種類について以下サイズを判別する。
【0031】
S5は、国庫金の帳票サイズか判別する。これは、S3で算出した帳票のサイズ(W、H)が国庫金サイズ(図4の帳票サイズDB6参照)の範囲内に入っているか判別する。YESの場合には、S6に進む。NOの場合には、国庫金の帳票サイズの範囲内でないと判明したので、S10に進む。
【0032】
S6は、帳票IDの抽出/認識/照合を行う。これは、S5のYESで国庫金帳票サイズ範囲内であって、国庫金帳票候補と判明したので、まず、帳票イメージ中の帳票IDの位置から抽出して文字認識し、図8の国庫金DB7に登録されている帳票IDと照合する。
【0033】
S7は、OKか判別する。YESの場合には帳票IDが国庫金帳票のIDと一致したので、図3の(2)以降の処理に進み、国庫金帳票データの読み取り、集計などを行う。一方、S7のNOの場合には、帳票IDが国庫金帳票でないと判明したので、S8でNC=NC+1し、S9でNC<3か判別し、YESのときにS10に進み,NOのときは図3の(1)でリジェクト表示し、終了する。
【0034】
以上のS1からS5YES,S6からS9によって、帳票サイズが国庫金帳票サイズの範囲内、かつ帳票IDが国庫金帳票IDと一致したときに、国庫金帳票と自動判定することが可能となる。そして、図3の(2)以降に進み、国庫金帳票中のデータを読み取り、集計することが可能となる。
【0035】
S10は、税公金OCRの帳票サイズか判別する。これは、S3で算出した帳票のサイズ(W、H)が税公金OCR帳票のサイズ(図4の帳票サイズDB6参照)の範囲内に入っているか判別する。YESの場合には、S11に進む。NOの場合には、税公金OCRの帳票サイズの範囲内でないと判明したので、S15に進む。
【0036】
S11は、帳票IDの抽出/認識/照合を行う。これは、S10のYESで税公金OCRの帳票サイズ範囲内であって、税公金OCR帳票候補と判明したので、まず、帳票イメージ中の帳票IDの位置から抽出して文字認識し、図9の税公金OCR帳票DB8に登録されている帳票IDと照合する。
【0037】
S12は、OKか判別する。YESの場合には帳票IDが税公金OCR帳票のIDと一致したので、図3の(2)以降の処理に進み、税公金OCR帳票データの読み取り、集計などを行う。一方、S12のNOの場合には、帳票IDが税公金OCR帳票でないと判明したので、S13でNC=NC+1し、S14でNC<3か判別し、YESのときにS15に進み,NOのときは図3の(1)でリジェクト表示し、終了する。
【0038】
以上のS1からS5NO,S10からS14によって、帳票サイズが税公金OCR帳票サイズの範囲内、かつ帳票IDが税公金OCR帳票IDと一致したときに、税公金OCR帳票と自動判定することが可能となる。そして、図3の(2)以降に進み、税公金OCR帳票中のデータを読み取り、集計することが可能となる。
【0039】
S15は、罫線情報の抽出/認識/照合を行う。これは、帳票イメージから罫線情報の抽出・認識し、例えば図10の税公金非OCR帳票DB9と照合する。
【0040】
S16は、OKか判別する。YESの場合には罫線情報が税公金非OCR帳票DB9の情報と一致したので、図3の(2)以降の処理に進み、税公金非OCR帳票データの読み取り、集計などを行う。一方、S16のNOの場合には、罫線情報が税公金非OCR帳票でないと判明したので、S17でNC=NC+1し、S18でNC<3か判別し、YESのときにS5に戻り,NOのときは図3の(1)でリジェクト表示し、終了する。
【0041】
以上のS1からS5NO,S10NO,S15からS18によって、罫線情報が税公金非OCR帳票の罫線情報と一致したときに、税公金非OCR帳票と自動判定することが可能となる。そして、図3の(2)以降に進み、税公金非OCR帳票中のデータを読み取り、集計することが可能となる。
【0042】
図3において、S21は、候補帳票を選出する。これは、既述した図2のS2のYESのときに国庫金帳票、S12のYESのときに税公金OCR帳票、S16のYESのときに税公金非OCR帳票と判明したので当該それぞれの帳票と選定し、S22以降の処理をそれぞれの帳票DBを参照して行う。
【0043】
S22は、ユニーク情報の抽出/照合を行う。これは、帳票イメージから、後述する図8の国庫金帳票DB8,図9の税公金OCR帳票DB9,あるいは図10の税公金非OCR帳票DB10をもとに各帳票の所定位置からユニーク情報をそれぞれ抽出して認識し、照合を行う。
【0044】
S23は、文字抽出/認識を行う。これは、その他の文字情報を抽出して認識する。
【0045】
S24は、帳票ID毎に、日付毎に、支店毎に、収納先毎に、金額の集計をそれぞれ行う。
【0046】
以上のS21からS25によって、自動判定された帳票(国庫金帳票、税公金OCR帳票、税公金非OCR帳票)に応じてそれぞれのDB(国庫金帳票DB7、税公金OCR帳票DB8,税公金非OCR帳票DB9)をもとに読み取った帳票イメージ中からユニーク情報、各種データをそれぞれ抽出して認識し、集計することが可能となる。
【0047】
図4は、本発明の帳票サイズDB例を示す。ここでは、既述した3種類の帳票について図示の下記のようにそのサイズ(W,H)を登録したものである。
【0048】
サイズ(幅/高) 国庫金帳票 税公金OCR帳票 税公金非OCR帳票
W 19cm±2cm 13cm±1cm 8cm±1cm
H 10cm±1cm 11cm±1cm 18cm±2cm
以上のように、帳票の種類毎にそのサイズ(W,H)をそれぞれ登録し、既述した図2のS5.S10でいずれの帳票のサイズ範囲内であるかを判別することが可能となる。
【0049】
図5は、本発明の帳票例(国庫金帳票)を示す。国庫金帳票では、図示のようなサイズであって、図示の位置にそれぞれ図示のデータが記入、マークされるようになっている。
【0050】
図8は、本発明の国庫金帳票DB例を示す。これは、図5の国庫金帳票からデータを読み取るための情報を登録したものであって、帳票ID,ユニーク情報、文字認識情報がそれぞれ下段に示すように登録し、既述した帳票ID(図2のS6)、ユニーク情報(図3のS22)、文字情報(図3のS24)でそれぞれ認識するときに使用するものである。例えば国庫金帳票の帳票IDの位置(左上、右下座標)から帳票イメージを抽出し、属性(例えば数字5桁)の帳票IDを認識する。そして、認識した帳票IDに対応して、ユニーク情報の欄に登録されている位置(左上、右下座標)から特徴で指定されたここでは、文字と記号(国庫金とその周りを矩形、楕円の記号で囲んだもの)抽出したり、更に、文字情報認識の欄に登録されている位置(左上、右下座標)から属性(数字12桁、手書き)に対応する文字を認識する。同様に、他のユニーク情報、文字認識情報の欄に登録されている内容に従い認識する。
【0051】
以上の図5の国庫金帳票のイメージについて図8の国庫金帳票DB7をもとに、帳票ID,ユニーク情報、文字情報を順次それぞれ自動認識することが可能となる。
【0052】
図6は、本発明の帳票例(税公金OCR帳票)を示す。税公金OCR帳票では、図示のようなサイズであって、図示の位置にそれぞれ図示のデータが記入、マークされるようになっている。
【0053】
図9は、本発明の税公金OCR帳票DB例を示す。これは、図6の税公金OCR帳票からデータを読み取るための情報を登録したものであって、帳票ID,ユニーク情報、文字認識情報がそれぞれ下段に示すように登録し、既述した帳票ID(図2のS11)、ユニーク情報(図3のS22)、文字情報(図3のS24)でそれぞれ認識するときに使用するものであって、国庫金帳票DBの場合と同様であるので、説明を省略する。
【0054】
以上の図6の税公金OCR帳票のイメージについて図9の税公金OCR帳票DB8をもとに、帳票ID,ユニーク情報、文字情報を順次それぞれ自動認識することが可能となる。
【0055】
図7は、本発明の帳票例(税公金非OCR帳票)を示す。税公金非OCR帳票では、図示のようなサイズであって、図示の位置にそれぞれ図示のデータが記入されるようになっている。
【0056】
図10は、本発明の税公金非OCR帳票DB例を示す。これは、図7の税公金非OCR帳票からデータを読み取るための情報を登録したものであって、帳票種類,罫線情報、ユニーク情報、文字認識情報がそれぞれ下段に示すように登録し、既述した罫線情報(図2のS15)、ユニーク情報(図3のS22)、文字情報(図3のS24)でそれぞれ認識するときに使用するものである。税公金非OCR帳票の場合には、既述したように、ここでは、罫線情報をもとにいずれの種類の税公金非OCR帳票であるかを判定し、罫線情報は、本数、位置(左上、右下の座標)からなり、例えば図示の上段の欄(○○県xx市市民税)には、罫線の本数20本、位置(左上、右下の座標)が(kxs111、kys111)から(kxe111,kye111)と合計20本分の罫線の開始点と終了点がそれぞれ登録されている。これら罫線情報をもとにいずれの種類の帳票かを判定する。そして、判定した帳票のユニーク情報、文字認識情報をもとにそれぞれユニーク情報、文字情報を自動認識する。
【0057】
以上の図7の税公金非OCR帳票のイメージについて図10の税公金非OCR帳票DB9の罫線情報をもとに帳票種類、ユニーク情報、文字情報を順次それぞれ自動認識することが可能となる。
【0058】
(付記1)
複数帳票を判別してデータを読み取る帳票認識装置において、
帳票のサイズを読み取る手段と、
上記読み取った帳票サイズをもとに、帳票候補を判定する手段と、
上記判定された帳票候補について、当該帳票候補のIDを抽出して帳票を判定する手段と、
上記判定された帳票の情報をもとにデータを抽出して認識する手段と
を備えたことを特徴とする帳票認識装置。
【0059】
(付記2)
複数帳票を判別してデータを読み取る帳票認識装置において、
帳票のサイズを読み取る手段と、
上記読み取った帳票サイズをもとに、帳票候補を判定する手段と、
上記判定された帳票候補について、当該帳票候補の罫線を抽出して帳票を判定する手段と、
上記判定された帳票の情報をもとにデータを抽出して認識する手段と
を備えたことを特徴とする帳票認識装置。
【0060】
(付記3)
複数帳票を判別してデータを読み取る帳票認識装置において、
帳票のサイズを読み取る手段と、
上記読み取った帳票サイズをもとに、帳票候補を判定する手段と、
上記判定された帳票候補について、当該帳票候補の長大文字列を抽出して帳票を判定する手段と、
上記判定された帳票の情報をもとにデータを抽出して認識する手段と
を備えたことを特徴とする帳票認識装置。
【0061】
(付記4)
上記帳票候補中からユニーク情報を抽出して帳票を判定する手段を有することを特徴とする付記1から付記3のいずれかに記載の帳票認識装置。
【0062】
(付記5)
複数帳票を判別してデータを読み取る帳票認識方法において、
帳票のサイズを読み取るステップと、
上記読み取った帳票サイズをもとに、帳票候補を判定するステップと、
上記判定された帳票候補について、当該帳票候補のIDを抽出して帳票を判定するステップと、
上記判定された帳票の情報をもとにデータを抽出して認識するステップと
を有する帳票認識方法。
【0063】
(付記6)
複数帳票を判別してデータを読み取る帳票認識方法において、
帳票のサイズを読み取るステップと、
上記読み取った帳票サイズをもとに、帳票候補を判定するステップと、
上記判定された帳票候補について、当該帳票候補の罫線を抽出して帳票を判定するステップと、
上記判定された帳票の情報をもとにデータを抽出して認識するステップと
を有する帳票認識方法。
【0064】
(付記7)
複数帳票を判別してデータを読み取る帳票認識方法において、
帳票のサイズを読み取るステップと、
上記読み取った帳票サイズをもとに、帳票候補を判定するステップと、
上記判定された帳票候補について、当該帳票候補の長大文字列を抽出して帳票を判定するステップと、
上記判定された帳票の情報をもとにデータを抽出して認識するステップと
を有する帳票認識方法。
【0065】
【発明の効果】
以上説明したように、本発明によれば、入力された帳票のサイズ、帳票ID,罫線情報、長大文字列、ユニーク情報などを抽出・照合して帳票の種類を確定し、文字情報を抽出して入力・集計する構成を採用しているため、複数種類の帳票から確実かつ迅速に帳票の種別を自動判定してデータを読み取って入力・集計することが可能となる。
【図面の簡単な説明】
【図1】本発明のシステム構成図である。
【図2】本発明の動作説明フローチャート(その1)である。
【図3】本発明の動作説明フローチャート(その2)である。
【図4】本発明の帳票サイズDB例である。
【図5】本発明の帳票例(国庫金帳票)である。
【図6】本発明の帳票例(税公金OCR帳票)である。
【図7】本発明の帳票例(税公金非OCR帳票)である。
【図8】本発明の国庫金帳票DB例である。
【図9】本発明の税公金OCR帳票DB例である。
【図10】本発明の税公金非OCR帳票DB例)である。
【符号の説明】
1:処理装置
2:入力手段
3:認識手段
4:照合手段
5:集計手段
6:帳票サイズDB
7:国庫金帳票DB
8:税公金OCR帳票DB
9:税公金非OCR帳票DB
10:表示装置
11:スキャナ/OCR
12:出力装置
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a form recognition apparatus and a form recognition method for discriminating a plurality of forms and reading data.
[0002]
[Prior art]
Conventionally, in office work such as a financial institution, a form such as national treasury money or tax is received, and an operator manually inputs data described in the form from the screen. In addition, the received form is designated as national treasury, and the image of the data is read and recognized from the corresponding position read by the scanner based on the format of the designated form, and is input.
[0003]
[Problems to be solved by the invention]
Conventionally, the operator has identified and specified the national treasury etc. for the accepted form, read the image from the relevant position according to the relevant format, recognized it as data, and entered the data. There is a problem that the operator needs to identify and specify each type of form.
[0004]
In order to solve these problems, the present invention extracts and collates the input form size, form ID, ruled line information, long capital letters, unique information, etc., determines the form type, and extracts character information. It is intended to input and tabulate, automatically and reliably determine the type of form from a plurality of types of forms, read the data, and input and tabulate.
[0005]
[Means for Solving the Problems]
Means for solving the problem will be described with reference to FIG.
[0006]
In FIG. 1, the processing device 1 executes various processes according to a program, and here is constituted by a recognition unit 3, a totaling unit 5, and the like.
[0007]
The recognition means 3 reads the size from the form, determines the corresponding form candidate based on the read size, extracts the form candidate ID, extracts the unique information of the form candidate, etc. Is determined.
[0008]
The tabulating means 5 tabulates data read from the form.
Next, the operation will be described.
[0009]
The form candidate is determined based on the form size read by the recognition unit 3 constituting the processing apparatus 1, the form candidate ID is extracted to determine the form, and the data is extracted based on the determined form information. To recognize it.
[0010]
In addition, a candidate for a form is determined based on the form size read by the recognition unit 3, a rule line of the form candidate is extracted to determine a form, and data is extracted and recognized based on the information on the determined form. I am doing so.
[0011]
Further, a candidate for a form is determined based on the form size read by the recognition means 3, a long upper case string is extracted for the determined form candidate, a form is determined, and data is obtained based on the information on the determined form. It is extracted and recognized.
[0012]
In these cases, the unique information is extracted from the form candidates and the form is determined.
[0013]
Further, data is extracted for each form on the basis of information on the type of form determined by the totaling means 5, and the amount is totaled for each date, each branch, and each storage location.
[0014]
Therefore, by extracting and collating the size of the input form, form ID, ruled line information, long capital letters, unique information, etc., the type of form is fixed, character information is extracted, entered, and totaled. The type of the form can be automatically and reliably determined from the form, and the data can be read and input / aggregated.
[0015]
DETAILED DESCRIPTION OF THE INVENTION
Next, embodiments and operations of the present invention will be described in detail sequentially with reference to FIGS.
[0016]
FIG. 1 shows a system configuration diagram of the present invention.
In FIG. 1, a processing device 1 executes various processes according to a program, and here includes an input means 2, a recognition means 3, a collation means 4, a totaling means 5, and the like.
[0017]
The input unit 2 captures an image (image) of the form read from the scanner 11.
[0018]
The recognizing means 3 measures the size of the form based on the captured form image, determines the corresponding form candidate based on the read size, extracts the form candidate ID, The form is determined by extracting unique information or the like (described later with reference to FIGS. 2 and 3).
[0019]
The collation means 4 collates with the corresponding ones in the DBs 6 to 9 (which will be described later with reference to FIGS. 2 and 3).
[0020]
The totaling unit 5 totals data read from the form (described later with reference to FIGS. 2 and 3).
[0021]
The form size DB 6 is a DB (database) in which the form sizes are registered (described later with reference to FIG. 4).
[0022]
The national treasury form DB 7 registers various information related to the national treasury form (described later with reference to FIG. 8).
[0023]
The tax public money OCR form DB 8 registers various information related to the tax public money form (which will be described later with reference to FIG. 8).
[0024]
The tax public money non-OCR form DB 9 is registered with various information related to the tax public money non-OCR form (to be described later with reference to FIG. 10).
[0025]
The display device 10 displays various information.
The scanner / OCR 11 reads various forms into images (images), recognizes information on positions where the forms are marked, and the like.
[0026]
The output device 12 is a variety of output devices, such as a printing device.
Next, the operation of the configuration of FIG. 1 will be described in detail according to the order of the flowcharts of FIGS.
[0027]
2 and 3 are flowcharts for explaining the operation of the present invention.
In FIG. 2, S1 inputs a form. This is because the input means 2 in FIG. 1 controls the scanner 11 to read and capture an image (image) of the form.
[0028]
In S2, noise removal and inclination correction are performed. This is because, after removing the noise from the image of the form read by the scanner 11 in S1, if the image of the form is inclined, the inclination is automatically corrected so that the outer frame of the form is formed in the horizontal and vertical directions. To.
[0029]
In S3, a form size is calculated. In S2, a horizontal width W and a vertical length (height) H are calculated from the image after noise removal and inclination correction in S2.
[0030]
In S4, the variable NC = 0 is initialized. This sets an initial value of 0 to a variable NC that counts the number of times a form type is determined based on its size. Here, as the types of forms, the following sizes are determined for three types of national treasury forms, tax public money OCR forms, and tax public money non-OCR forms.
[0031]
In S5, it is determined whether the form size of the national treasury money. This determines whether the size (W, H) of the form calculated in S3 is within the range of the national treasury size (see form size DB6 in FIG. 4). If YES, the process proceeds to S6. In the case of NO, since it has been found that it is not within the range of the national treasury form size, the process proceeds to S10.
[0032]
In step S6, the form ID is extracted / recognized / verified. This is within the national treasury bill size range in S5 YES, and since it has been found as a national treasury bill candidate, first, it is extracted from the position of the form ID in the form image and character recognition is performed, and the national treasury DB 7 in FIG. To the form ID registered in.
[0033]
In S7, it is determined whether it is OK. In the case of YES, since the form ID matches the ID of the national treasury form, the process proceeds to the processing after (2) in FIG. 3 to read and count the national treasury form data. On the other hand, in the case of NO in S7, it is determined that the form ID is not a national treasury form. Therefore, NC = NC + 1 is determined in S8, and NC <3 is determined in S9. If YES, the process proceeds to S10. The display is rejected at (1) in FIG.
[0034]
With the above S1 to S5 YES and S6 to S9, when the form size is within the range of the national treasury form size and the form ID matches the national treasury form form ID, it can be automatically determined as the national treasury form. Then, after (2) in FIG. 3, it is possible to read and aggregate data in the national treasury bill.
[0035]
In S10, it is determined whether or not the form size of the tax public money OCR. This is to determine whether the size (W, H) of the form calculated in S3 is within the range of the size of the public tax OCR form (see form size DB 6 in FIG. 4). If YES, the process proceeds to S11. In the case of NO, since it has been found that it is not within the range of the form size of the tax public money OCR, the process proceeds to S15.
[0036]
In step S11, the form ID is extracted / recognized / verified. This is within the form size range of the tax public money OCR in S10 YES, and since it has been determined as a tax public money OCR form candidate, first, it is extracted from the position of the form ID in the form image and character recognition is performed. It collates with the form ID registered in the tax public money OCR form DB8.
[0037]
In S12, it is determined whether it is OK. In the case of YES, since the form ID matches the ID of the tax public money OCR form, the process proceeds to the processing after (2) in FIG. 3, and the tax public money OCR form data is read and aggregated. On the other hand, in the case of NO in S12, since it is determined that the form ID is not a tax public money OCR form, NC = NC + 1 is determined in S13, and NC <3 is determined in S14. If YES, the process proceeds to S15, and if NO Is rejected and displayed in (1) of FIG.
[0038]
By the above S1 to S5NO and S10 to S14, when the form size is within the range of the tax public money OCR form size and the form ID matches the tax public money OCR form ID, it can be automatically determined as the tax public money OCR form. Become. Then, after (2) in FIG. 3, the data in the tax public money OCR form can be read and aggregated.
[0039]
In S15, ruled line information is extracted / recognized / checked. For this, ruled line information is extracted and recognized from the form image, and collated with, for example, the tax public non-OCR form DB 9 of FIG.
[0040]
In S16, it is determined whether it is OK. In the case of YES, the ruled line information coincides with the information in the tax public money non-OCR form DB 9, so the process proceeds to the processing after (2) in FIG. 3, and the tax public money non-OCR form data is read and aggregated. On the other hand, in the case of NO in S16, it is determined that the ruled line information is not a tax public money non-OCR form, so NC = NC + 1 is determined in S17 and NC <3 is determined in S18. At this time, the display is rejected at (1) in FIG.
[0041]
By the above S1 to S5NO, S10NO, and S15 to S18, when the ruled line information matches the ruled line information of the tax public money non-OCR form, it can be automatically determined as the tax public money non-OCR form. Then, after (2) in FIG. 3, it is possible to read and aggregate data in the tax public money non-OCR form.
[0042]
In FIG. 3, S21 selects a candidate form. This has been found to be a national treasury form when S2 in FIG. 2 is YES, a tax public money OCR form when S12 is YES, and a tax public money non-OCR form when S16 is YES. Selection is performed, and the processing after S22 is performed with reference to each form DB.
[0043]
In step S22, unique information is extracted / verified. This is based on the form image based on the national treasury form DB 8 shown in FIG. 8, the tax public money OCR form DB 9 shown in FIG. 9, or the tax public non-OCR form DB 10 shown in FIG. Extract, recognize and collate.
[0044]
In step S23, character extraction / recognition is performed. This is recognized by extracting other character information.
[0045]
In S24, the amount is summed for each form ID, for each date, for each branch, and for each storage destination.
[0046]
According to the automatically determined forms (national treasury form, tax public money OCR form, tax public money non-OCR form) according to S21 to S25 above, the respective DBs (national treasury form DB7, tax public money OCR form DB8, tax public money non-OCR) It is possible to extract and recognize unique information and various data from the form image read based on the form DB 9), and totalize them.
[0047]
FIG. 4 shows a form size DB example of the present invention. Here, the sizes (W, H) of the three types of forms described above are registered as shown below.
[0048]
Size (width / height) National treasury form Tax public money OCR form Tax public money non-OCR form W 19cm ± 2cm 13cm ± 1cm 8cm ± 1cm
H 10cm ± 1cm 11cm ± 1cm 18cm ± 2cm
As described above, the size (W, H) is registered for each type of form, and S5. In S10, it is possible to determine which form size range is within.
[0049]
FIG. 5 shows an example of a form (national treasury form) according to the present invention. The national treasury bill has a size as shown in the figure, and the data shown in the figure is entered and marked at the position shown in the figure.
[0050]
FIG. 8 shows an example of the national treasury form DB of the present invention. This is information in which data for reading data from the national treasury form in FIG. 5 is registered. The form ID, unique information, and character recognition information are registered as shown in the lower row, and the form ID (see FIG. 2 (S6), unique information (S22 in FIG. 3), and character information (S24 in FIG. 3). For example, a form image is extracted from the position (upper left and lower right coordinates) of the form ID of the national treasury form, and the form ID of the attribute (for example, 5 digits) is recognized. Then, in correspondence with the recognized form ID, the characters and symbols (national treasury money and its surroundings are rectangles and ellipses) specified by features from the positions (upper left and lower right coordinates) registered in the unique information column. The character corresponding to the attribute (12 digits, handwritten) is recognized from the position (upper left, lower right coordinates) registered in the character information recognition column. Similarly, it is recognized according to the contents registered in the other unique information and character recognition information fields.
[0051]
With respect to the image of the national treasury form of FIG. 5 described above, it is possible to automatically recognize the form ID, unique information, and character information sequentially in accordance with the national treasury form DB 7 of FIG.
[0052]
FIG. 6 shows an example of a form (tax public money OCR form) of the present invention. The tax public money OCR form has a size as shown in the figure, and the data shown in the figure is entered and marked at the position shown in the figure.
[0053]
FIG. 9 shows an example of the tax public money OCR form DB of the present invention. This is information in which data for reading data from the tax public money OCR form in FIG. 6 is registered. The form ID, unique information, and character recognition information are registered as shown below, and the form ID ( It is used when recognizing with S11 in FIG. 2), unique information (S22 in FIG. 3), and character information (S24 in FIG. 3), and is the same as in the case of the national treasury form DB. Omitted.
[0054]
With respect to the image of the tax public money OCR form shown in FIG. 6, the form ID, the unique information, and the character information can be automatically and sequentially recognized based on the tax public money OCR form DB 8 shown in FIG.
[0055]
FIG. 7 shows an example of a form of the present invention (tax public non-OCR form). The tax public money non-OCR form has a size as shown in the figure, and the data shown in the figure is entered at the position shown in the figure.
[0056]
FIG. 10 shows an example of the tax public money non-OCR form DB of the present invention. This is the information for reading data from the non-OCR form of tax public money shown in FIG. 7. The form type, ruled line information, unique information, and character recognition information are registered as shown in the lower row. The ruled line information (S15 in FIG. 2), unique information (S22 in FIG. 3), and character information (S24 in FIG. 3) are used for recognition. In the case of a tax public money non-OCR form, as described above, the type of tax public money non-OCR form is determined based on the ruled line information. The ruled line information includes the number, position (upper left) For example, in the upper column of the figure (xx city municipal tax), the number of ruled lines is 20 and the positions (upper left and lower right coordinates) are from (kxs111, kys111) ( kxe111, kye111) and a total of 20 ruled line start points and end points are registered. Based on the ruled line information, it is determined which type of form. Then, the unique information and character information are automatically recognized based on the determined unique information and character recognition information, respectively.
[0057]
With respect to the image of the tax public money non-OCR form shown in FIG. 7, the form type, unique information, and character information can be automatically recognized sequentially in accordance with the ruled line information of the tax public money non-OCR form DB 9 shown in FIG.
[0058]
(Appendix 1)
In a form recognition device that distinguishes multiple forms and reads data,
Means to read the size of the form,
A means for determining a form candidate based on the read form size;
With respect to the determined form candidate, means for extracting the form candidate ID and determining the form;
A form recognition apparatus comprising means for extracting and recognizing data based on the determined form information.
[0059]
(Appendix 2)
In a form recognition device that distinguishes multiple forms and reads data,
Means to read the size of the form,
A means for determining a form candidate based on the read form size;
With respect to the determined form candidate, means for extracting a ruled line of the form candidate and determining the form;
A form recognition apparatus comprising means for extracting and recognizing data based on the determined form information.
[0060]
(Appendix 3)
In a form recognition device that distinguishes multiple forms and reads data,
Means to read the size of the form,
A means for determining a form candidate based on the read form size;
With respect to the determined form candidate, means for extracting a long capital string of the form candidate and determining the form;
A form recognition apparatus comprising means for extracting and recognizing data based on the determined form information.
[0061]
(Appendix 4)
The form recognition apparatus according to any one of Supplementary Note 1 to Supplementary Note 3, further comprising means for extracting unique information from the candidate forms and determining the form.
[0062]
(Appendix 5)
In a form recognition method that distinguishes multiple forms and reads data,
Reading the size of the form,
Determining a form candidate based on the read form size;
For the determined form candidate, extracting the form candidate ID and determining the form;
A form recognition method comprising: extracting and recognizing data based on the determined form information.
[0063]
(Appendix 6)
In a form recognition method that distinguishes multiple forms and reads data,
Reading the size of the form,
Determining a form candidate based on the read form size;
For the determined form candidate, extracting a ruled line of the form candidate and determining the form;
A form recognition method comprising: extracting and recognizing data based on the determined form information.
[0064]
(Appendix 7)
In a form recognition method that distinguishes multiple forms and reads data,
Reading the size of the form,
Determining a form candidate based on the read form size;
For the determined form candidate, extracting a long upper case string of the form candidate and determining the form;
A form recognition method comprising: extracting and recognizing data based on the determined form information.
[0065]
【The invention's effect】
As described above, according to the present invention, the type of the form, the form ID, the ruled line information, the long capital string, the unique information, etc. are extracted and collated to determine the type of the form, and the character information is extracted. Therefore, it is possible to automatically and reliably determine the type of form from a plurality of types of forms, read the data, and input / aggregate.
[Brief description of the drawings]
FIG. 1 is a system configuration diagram of the present invention.
FIG. 2 is a flowchart (part 1) illustrating the operation of the present invention.
FIG. 3 is a flowchart (part 2) illustrating the operation of the present invention.
FIG. 4 is an example of a form size DB according to the present invention.
FIG. 5 is a form example (national treasury form) according to the present invention.
FIG. 6 is a form example (tax public money OCR form) of the present invention.
FIG. 7 is an example of a form of the present invention (tax public money non-OCR form).
FIG. 8 is an example of a national treasury form DB of the present invention.
FIG. 9 is an example of a tax public money OCR form DB of the present invention.
FIG. 10 is a tax public money non-OCR form DB example of the present invention).
[Explanation of symbols]
1: processing device 2: input means 3: recognition means 4: collation means 5: aggregation means 6: form size DB
7: National treasury book DB
8: Tax public money OCR form DB
9: Tax public money non-OCR form DB
10: Display device 11: Scanner / OCR
12: Output device

Claims (3)

サイズが異なる複数帳票を判別してデータを読み取る帳票認識装置において、
データ読取対象となる全ての帳票について当該帳票の縦および横のサイズでグループ分けして当該グループに付与した種別と、当該種別に対応づけて帳票の縦および横のサイズを登録する帳票サイズテーブルと、
帳票からデータを読み取るための帳票イメージ中から読み取る帳票ID、罫線、長大文字列、ユニーク情報を含む1つ以上の情報の中からどの情報のデータを抽出するかを、前記種別に対応づけて登録する帳票テーブルと、
帳票の縦および横のサイズを読み取る手段と、
上記読み取った帳票の縦および横のサイズをもとに、上記帳票サイズテーブルを参照して一致する帳票の上記種別を判定する手段と、
上記判定された帳票の上記種別に対応する上記帳票テーブルを参照し、当該帳票テーブルに登録されている帳票イメージ中から読み取る帳票ID、罫線、長大文字列、ユニーク情報を含む1つ以上の情報をもとに、当該帳票から読み取った画像イメージ中から帳票ID、罫線、長大文字列、ユニーク情報のいずれか1つ以上を認識する手段と、
上記認識結果をもとに、上記判定された種別中のいずれの帳票であるかを一致するまで繰り返し判定する手段と、
上記判定された帳票の上記帳票情報をもとにデータを抽出して認識する手段と
を備えたことを特徴とする帳票認識装置。
In a form recognition device that distinguishes multiple forms with different sizes and reads data,
A group size table for registering the vertical and horizontal sizes of all forms that are subject to data reading, grouped according to the vertical and horizontal sizes of the forms, and assigned to the groups; ,
Register which information data is to be extracted from one or more pieces of information including form ID, ruled line, long capital string, and unique information read from the form image for reading data from the form. Form table to be
Means for reading the vertical and horizontal sizes of the form;
Based on the vertical and horizontal size of the document read above, means for determining the type of a form matching with reference to the document size table,
Referring to the form table corresponding to the type of the determined the form, the form ID read from in document image that is registered with the form table, borders, long uppercase column, one or more information including unique information Based on the image image read from the form, means for recognizing one or more of the form ID, ruled line, long upper case string, unique information,
Based on the recognition result, means for repeatedly determining until it matches which form in the determined type,
A form recognition apparatus comprising means for extracting and recognizing data based on the form information of the determined form.
上記帳票サイズテーブルの帳票の縦および横のサイズとして、縦および横のサイズに対応づけて容認し得る範囲をそれぞれ登録したことを特徴とする請求項1記載の帳票認識装置。  2. The form recognition apparatus according to claim 1, wherein the acceptable ranges are registered in correspondence with the vertical and horizontal sizes as the vertical and horizontal sizes of the form in the form size table. サイズが異なる複数帳票を判別してデータを読み取る帳票認識方法において、
データ読取対象となる全ての帳票について当該帳票の縦および横のサイズでグループ分けして当該グループに付与した種別と、当該種別に対応づけて帳票の縦および横のサイズを登録する帳票サイズテーブルと、
帳票からデータを読み取るための帳票イメージ中から読み取る帳票ID、罫線、長大文字列、ユニーク情報を含む1つ以上の情報の中からどの情報のデータを抽出するかを、前記種別に対応づけて登録する帳票テーブルとを設け、
帳票の縦および横のサイズを読み取るステップと、
上記読み取った帳票の縦および横のサイズをもとに、上記帳票サイズテーブルを参照して一致する帳票の上記種別を判定するステップと、
上記判定された帳票の上記種別に対応する上記帳票テーブルを参照し、当該帳票テーブルに登録されている帳票イメージ中から読み取る帳票ID、罫線、長大文字列、ユニーク情報を含む1つ以上の情報をもとに、当該帳票から読み取った画像イメージ中から帳票ID、罫線、長大文字列、ユニーク情報のいずれか1つ以上を認識するステップと、
上記認識結果をもとに、上記判定された種別中のいずれの帳票であるかを一致するまで繰り返し判定するステップと、
上記判定された帳票の上記帳票情報をもとにデータを抽出して認識するステップと
を有する帳票認識方法。
In the form recognition method that distinguishes multiple forms with different sizes and reads the data,
A group size table for registering the vertical and horizontal sizes of all forms that are subject to data reading, grouped according to the vertical and horizontal sizes of the forms, and assigned to the groups; ,
Register which information data is to be extracted from one or more pieces of information including form ID, ruled line, long capital string, and unique information read from the form image for reading data from the form. And a form table to be
Reading the vertical and horizontal size of the form,
Based on the vertical and horizontal size of the document read above, determining the type of a form matching with reference to the document size table,
Referring to the form table corresponding to the type of the determined the form, the form ID read from in document image that is registered with the form table, borders, long uppercase column, one or more information including unique information Originally, recognizing at least one of a form ID, a ruled line, a long capital string, and unique information from an image read from the form;
Based on the recognition result, repeatedly determining until it matches which form in the determined type,
A form recognition method comprising: extracting and recognizing data based on the form information of the determined form.
JP2001366611A 2001-11-30 2001-11-30 Form recognition device and form recognition method Expired - Lifetime JP4412525B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001366611A JP4412525B2 (en) 2001-11-30 2001-11-30 Form recognition device and form recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001366611A JP4412525B2 (en) 2001-11-30 2001-11-30 Form recognition device and form recognition method

Publications (2)

Publication Number Publication Date
JP2003168075A JP2003168075A (en) 2003-06-13
JP4412525B2 true JP4412525B2 (en) 2010-02-10

Family

ID=19176483

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001366611A Expired - Lifetime JP4412525B2 (en) 2001-11-30 2001-11-30 Form recognition device and form recognition method

Country Status (1)

Country Link
JP (1) JP4412525B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4977368B2 (en) 2005-12-28 2012-07-18 富士通株式会社 Medium processing apparatus, medium processing method, medium processing system, and computer-readable recording medium recording medium processing program
JP5110793B2 (en) * 2005-12-28 2012-12-26 日立コンピュータ機器株式会社 Form identification device
JP4788780B2 (en) * 2009-01-29 2011-10-05 大日本印刷株式会社 Information processing system, program and electronic pen form
JP5607386B2 (en) * 2010-02-26 2014-10-15 ローレルバンクマシン株式会社 Transaction processing system

Also Published As

Publication number Publication date
JP2003168075A (en) 2003-06-13

Similar Documents

Publication Publication Date Title
EP0344742B1 (en) Courtesy amount read and transaction balancing system
CN109658584B (en) Bill information identification method and device
US7106904B2 (en) Form identification method
JP6527410B2 (en) Character recognition device, character recognition method, and program
JP3602596B2 (en) Document filing apparatus and method
US6963665B1 (en) Method and apparatus for determining form sheet type
JP3491636B2 (en) Form processing method and system
JP3001065B2 (en) How to create a program
JP2008020506A (en) Image processor and image processing program
JP4412525B2 (en) Form recognition device and form recognition method
JP4655824B2 (en) Image recognition apparatus, image recognition method, and image recognition program
US20060194187A1 (en) Material processing apparatus, material processing method, and program product
JP3573945B2 (en) Format recognition device and character reading device
JP4853313B2 (en) Character recognition device
JP4894195B2 (en) Teaching material processing apparatus, teaching material processing method, and teaching material processing program
JP3090070B2 (en) Form identification method and device
JP2006234996A (en) Device, method, and program for processing educational material
JP3000349B2 (en) Key input editing method and editing device
WO2023021636A1 (en) Data processing device, data processing method, and program
JP3520872B2 (en) Form processing method and system
JP4701918B2 (en) Teaching material processing apparatus, teaching material processing method, and teaching material processing program
JP2003263607A (en) Slip processing method and system
JP4188344B2 (en) Fingerprint verification apparatus, method and program
JP4863057B2 (en) Image processing apparatus, image processing program, and image processing method
JP2003115028A (en) Method for automatically generating document identification dictionary and document processing system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080417

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080520

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080618

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080728

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20080815

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091002

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121127

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4412525

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121127

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131127

Year of fee payment: 4

EXPY Cancellation because of completion of term