JP3392530B2 - Ocr定義体作成装置 - Google Patents
Ocr定義体作成装置Info
- Publication number
- JP3392530B2 JP3392530B2 JP18723494A JP18723494A JP3392530B2 JP 3392530 B2 JP3392530 B2 JP 3392530B2 JP 18723494 A JP18723494 A JP 18723494A JP 18723494 A JP18723494 A JP 18723494A JP 3392530 B2 JP3392530 B2 JP 3392530B2
- Authority
- JP
- Japan
- Prior art keywords
- definition
- ocr
- same format
- data
- field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
- Document Processing Apparatus (AREA)
Description
ように、読み取り項目の多い帳票類のOCR定義体を作
成するのに好適なOCR定義体作成装置に関する。
ader)を使用して帳票類(以下、単に帳票と記す)から
データを読み取る処理では、帳票の種類毎に読み取り位
置を定義したOCR定義体を予め作成しておき、そのO
CR定義体をOCRにダウンロードして、帳票の読み取
りを行っている。
置(例えば、パソコン)において、OCR定義体を作成
するユーティリティプログラムを使用して作成している
が、近年、OCRを使用した処理が多くなり、帳票の種
類も増え、定義体作成作業が大変負担になってきてい
る。
の多い帳票は、読み取り位置を定義する項目が大変多
い。そこで、定義体作成者の負担を軽減させるため、特
に、連記式帳票のOCR定義体作成の簡易化の要求がで
てきている。
従来のOCR定義体作成装置説明図である。以下、図2
3、図24に基づいて従来例を説明する。
等)を記入した帳票をOCRで読み取ることにより、デ
ータの入力を行うことが行われていた。この場合、帳票
としては、単一項目を有する帳票、或いは同一フォーマ
ットの項目が、繰り返し多数記載されている連記式帳票
等が使用されていた。
の例としては、図23に示したような総合振込依頼書が
ある。この総合振込依頼書は、複数の人に同時に現金の
振込を行う際に使用する帳票であり、銀行名、預金種
目、口座番号、振込区分、金額、お受取人名等の項目
が、同一フォーマットで繰り返し多数記載されている。
項(数字、或いは文字)を記載した後、前記連記式帳票
をOCR(光学式文字読取装置)で読み取り、データの
入力を行う。
項目データを読み取る場合、OCRでは、読み取り対象
となる帳票毎に、読み取り位置を定義したOCR定義体
をメモリに格納しておき、このOCR定義体を参照しな
がら帳票の各項目データを読み取っている。
ば、図24に示したように、OCR3とは別に、OCR
定義体作成装置(例えば、パソコン)1を設けておき、
このOCR定義体作成装置1を使用してOCR定義体を
作成する。この場合、OCR3にはメモリ4を設けてお
き、OCR定義体作成装置1には磁気ディスク装置2を
接続しておく。
OCR定義体を作成し、作成したOCR定義体を、磁気
ディスク装置2内のOCR定義体ファイルに格納してお
く。このOCR定義体は、OCR3で読み取りを行う帳
票毎に作成し、前記OCR定義体ファイルに格納してお
く。
格納したOCR定義体は、OCR定義体作成装置1を介
してOCR3へ転送し、OCR3のメモリ4にダウンロ
ードする。そして、OCR3で帳票の読み取りを行う場
合は、OCR3がメモリ4に格納されているOCR定義
体を参照しながら帳票の読み取りを行う。
を作成する場合、OCR定義体作成装置のユーティリテ
ィプログラムを使用して作成するが、個々のフィールド
毎に、読み取り位置を定義させる方法で作成していた。
置に、OCR定義体作成用の画面を表示させ、この表示
画面により、個々のフィールド毎にデータ入力を行って
読み取り位置を定義させていた。
のにおいては、次のような課題があった。 (1) :OCR定義体を作成する場合、個々のフィールド
毎に、データ入力を行ってOCR定義体を作成してい
た。従って、OCRでの読み取り項目が多い場合、デー
タ入力作業に手間がかかり、かつOCR定義体の作成時
間が長くなる。
での読み取り項目が多く、かつ同一フォーマットの繰り
返しフィールドが多数ある場合でも、個々のフィールド
毎にデータ入力を行う必要があった。従って、作業効率
が悪く、面倒な入力作業が必要であり、OCR定義体作
成者の作業負担が大きかった。
し、OCR定義体を作成する際、連記式帳票のように、
読み取り項目が多く、かつ同一フォーマットが連続して
多数ある場合のデータ入力作業を軽減し、OCR定義体
作成作業を容易にすることを目的とする。
図であり、図1中、図23、図24と同じものは、同一
符号で示してある。また、6は入力データ取込部、7は
定義体データ作成部、8は同一フォーマットデータ計算
部、9はRAMを示す。
ように構成した。 (1) : OCRで帳票類の読み取りを行うためのOCR定
義体を作成するOCR定義体作成装置1において、入力
された文字項目読み取り位置の定義情報、イメージ読み
取り位置の定義情報、及び同一フォーマットの定義情報
を取り込み、同一フォーマットが複数有る場合には、文
字項目読み取り位置の定義情報、及びイメージ読み取り
位置の定義情報として、複数の同一フォーマットの内、
先頭フォーマットの定義情報のみを取り込み、同一フォ
ーマットの定義情報として、文字読み取りフィールド
群、及びイメージ読み取りフィールド群に対し、それぞ
れ、同一フォーマット間の距離、及び帳票類上の同一フ
ォーマットの個数を取り込む入力データ取込部6と、入
力データ取込部6が取り込んだ各定義情報を基に、OC
R定義体を作成する定義体データ作成部7と、同一フォ
ーマットが複数有る場合、前記定義体データ作成部7か
らの計算依頼により、前記同一フォーマットの定義情報
を用いて、連続した同一フォーマット位置の定義情報を
計算する同一フォーマットデータ計算部8と、作成済み
のOCR定義体を格納するOCR定義体ファイルを備え
たことを特徴とする。
義体を作成する際、同一フォーマットが複数有るか否か
を判定し、同一フォーマットが複数有る場合は、同一フ
ォーマットデータ計算部8に対して同一フォーマットの
定義情報の計算依頼を行う機能を備え、同一フォーマッ
トデータ計算部8は、前記計算依頼により、同一フォー
マットの定義情報を用いて、文字読み取り位置、及びイ
メージ読み取り位置の定義情報を計算し、OCR定義体
の編集を行う機能を備えている。
いて説明する。OCR定義体を作成する場合、先ず、O
CR定義体作成装置1に対し、文字項目読み取り位置の
定義情報、イメージ読み取り位置の定義情報、及び同一
フォーマットの定義情報を入力する。この入力データ
は、入力データ取込部6が取り込む。
トが複数有れば、文字項目読み取り位置の定義情報、及
びイメージ読み取り位置の定義情報として、複数の同一
フォーマットの内、先頭フォーマットの定義情報のみを
入力させ、同一フォーマットの定義情報として、文字読
み取りフィールド群、及びイメージ読み取りフィールド
群に対し、それぞれ、同一フォーマット間の距離、及び
帳票上の同一フォーマットの個数を入力させる。
と、定義体データ作成部7は、入力データ取込部6が取
り込んだデータを、RAM9の中間テーブルに出力す
る。その後、定義体データ作成部7は、RAM9内の中
間テーブルのデータを用いてOCR定義体を作成する。
ーブルのデータを基に、同一フォーマットの定義情報が
あるか否かを判定する。その結果、同一フォーマットが
あれば、同一フォーマットデータ計算部8へデータを渡
し、計算依頼を行う。
ータ計算部8では、同一フォーマットの定義情報を用い
て、同一フォーマットの内、2番目以降のフォーマット
について、文字読み取り項目位置、及びイメージ読み取
り位置の定義情報を計算し、OCR定義体の編集を行
う。前記処理が終了すると、作成済みのデータをOCR
定義体テーブルとしてOCR定義体ファイルに格納す
る。
マットが複数有る場合、同一フォーマットの先頭フォー
マットの位置情報と、同一フォーマットの定義情報を入
力するだけで、連続する同一フォーマットの読み取り位
置の定義情報を自動的に計算し、OCR定義体の編集を
行うことができる。
目が多く、かつ同一フォーマットが連続して多数ある場
合のデータ入力作業を軽減し、OCR定義体作成作業を
容易にすることができる。
する。図2〜図22は、本発明の実施例を示した図であ
り、図2〜図22中、図1、図23、図24と同じもの
は、同一符号で示してある。また、10は定義体データ
格納処理部、11は表示装置、12はキーボードを示
す。
図2参照 図2は実施例の装置構成図である。以下、図2に基づい
てOCR定義体作装置を説明する。以下に説明する実施
例では、図2に示したOCR定義体作成装置を使用して
連記式帳票のOCR定義体を作成する例について説明す
るが、前記OCR定義体作成装置は、例えば、パソコン
等で実現する。
は、入力データ取込部6、定義体データ作成部7、同一
フォーマットデータ計算部8、RAM9、定義体データ
格納処理部10、表示装置11、キーボード12、磁気
ディスク装置2等が設けてある。前記各部の機能等は次
の通りである。
力を行うものである。例えば、OCR定義体を作成する
場合は、文字項目読み取り位置の情報、イメージ読み取
り位置の情報、同一フォーマット情報等を入力する。
行うものである。例えば、OCR定義体を作成する場合
は、文字読み取りフィールド定義画面、イメージ読み取
りフィールド定義画面、同一フォーマット定義画面等を
表示する。
ードから入力した文字項目読み取り位置の情報、イメー
ジ読み取り位置の情報、同一フォーマット情報等のデー
タの取り込みを行うものである。
タ取込部6が取り込んだデータを基にOCR定義体を作
成するものである。 (5) :同一フォーマットデータ計算部8は、帳票上に同
一フォーマットが複数存在する場合に、同一フォーマッ
トの計算処理を行うものである。
る際、定義体データ作成部7、及び同一フォーマットデ
ータ計算部8がワーク用として使用するものである。例
えば、OCR定義体を作成する際に使用する中間テーブ
ル(後述する)、及び最終読み取り定義テーブル(中間
テーブルを編集したものであり、OCR定義体作成作業
中に使用するもの)を格納するために使用する。
記定義体データ作成部7が作成したOCR定義体(最終
のOCR定義体)を、磁気ディスク装置2内のOCR定
義体用ファイルへ格納する処理を行うものである。
R定義体用ファイルに、前記OCR定義体(最終のOC
R定義体)を格納するものである。 §2:連記式帳票の説明・・・図3参照 図3は連記式帳票の説明図である。以下、図3に基づい
て本実施例の連記式帳票例を説明する。
は、例えば、図3に示したようなものがある。この連記
式帳票は銀行等の金融機関で使用する帳票であり、口座
番号、金額、お受取人名からなる同一フォーマットのフ
ィールドが複数(この例では3か所)存在する。また、
最後のフィールドには、口座番号と、ご依頼人名のフィ
ールドが存在する。
項(数字、文字)を記入した後、OCRで読み取りを行
う。この場合、前記各フィールドの項目には、それぞれ
文字読み取りフィールドのフィールド名と、イメージ読
み取りフィールドのフィールド名を定義する。
等のデータは図示の通りである。この例では、連記式帳
票の左上角部をP点とし、このP点をX、Y座標軸の原
点としている。そして、連記式帳票の外側に図示した数
字は、前記P点からのX方向、及びY方向の距離を示し
ている。
向の距離は8であり、Y軸方向の距離は10である。ま
た、最初の金額の項目までのX方向の距離は25であ
る。更に、最初のお受取人名の項目までのY方向の距離
は15である。なお、連記式帳票の内部に示した数字の
内、数字2はY軸方向の読み取り領域サイズ、数字12
は同一フォーマット間の距離を示している。
説明・・・図4参照 図4はフィールド名の説明図である。以下、図4に基づ
いて、図3に示した連記式帳票のフィールド名について
説明する。
フィールド名を図示のように定義する。この場合、フィ
ールド名は、文字読み取りフィールドのフィールド名
と、イメージ読み取りフィールドのフィールド名の2種
類を定義する。
2、F3が同一フォーマットのフィールドであり、フィ
ールドF4は前記フィールドとは異なったフォーマット
のフィールドである。
は、口座番号の文字読み取りフィールドのフィールド名
がANK001で、そのイメージ読み取りフィールドの
フィールド名がIMG001である。また、金額の文字
読み取りフィールドのフィールド名がANK002で、
そのイメージ読み取りフィールドのフィールド名がIM
G002である。更に、お受取人名の文字読み取りフィ
ールドのフィールド名がANK003で、そのイメージ
読み取りフィールドのフィールド名がIMG003であ
る。
取りフィールドのフィールド名がANK101で、その
イメージ読み取りフィールドのフィールド名がIMG1
01である。また、金額の文字読み取りフィールドのフ
ィールド名がANK102で、そのイメージ読み取りフ
ィールドのフィールド名がIMG102である。更に、
お受取人名の文字読み取りフィールドのフィールド名が
ANK103で、そのイメージ読み取りフィールドのフ
ィールド名がIMG103である。
取りフィールドのフィールド名がANK201で、その
イメージ読み取りフィールドのフィールド名がIMG2
01である。また、金額の文字読み取りフィールドのフ
ィールド名がANK202で、そのイメージ読み取りフ
ィールドのフィールド名がIMG202である。更に、
お受取人名の文字読み取りフィールドのフィールド名が
ANK203で、そのイメージ読み取りフィールドのフ
ィールド名がIMG203である。
取りフィールドのフィールド名がANK004で、その
イメージ読み取りフィールドのフィールド名がIMG0
04である。また、ご依頼人名の文字読み取りフィール
ドのフィールド名がANK005で、そのイメージ読み
取りフィールドのフィールド名がIMG005である。
た連記式帳票のOCR定義体を作成する場合の処理概要
は次の通りである。
義体作成装置1の表示装置11に、文字読み取りフィー
ルド定義画面、イメージ読み取りフィールド定義画面、
同一フォーマット定義画面を順次表示させ、この画面に
従って、キーボード12からデータを入力することによ
り作成する。
み取り位置の入力、:イメージ読み取り位置の入力、
:同一フォーマットの情報入力、:文字読み取りフ
ィールドの情報を中間テーブルに出力(中間テーブル作
成)、:同一フォーマットが有る場合の計算処理、
:最終のOCR定義体テーブル作成の順序で行う。
み取りフィールドの情報を設定しなければならないが、
同一フォーマットが連続する時(同一フォーマットが複
数有る場合)は、先頭の情報のみを入力する。
同一フォーマットのフィールド群を定義させるため、同
一フォーマットの文字読み取りフィールドと、イメージ
読み取りフィールドのフィールド名を入力させ、同一フ
ォーマット間の距離、及び同一フォーマットの個数を入
力させる。
入力データ取込部6に取り込む。そして、定義体データ
作成部7は、前記入力データ取込部6で取り込んだデー
タを基に、OCR定義体テーブルの作成を行う。
み取り位置の情報から、文字読み取りフィールド情報を
テーブル化(RAM9内の中間テーブルを作成)する。
次に、同一フォーマットの情報があるか否かを入力情報
から判定する。
一フォーマットデータ計算部8へデータを渡し、同一フ
ォーマットデータ計算部8が計算を行い、同一フォーマ
ットの読み取り開始位置、読み取り終了位置、読み取り
桁数、読み取り文字枠、読み取りカテゴリをテーブルの
形式に編集する(RAM9内の最終読み取り定義テーブ
ルの編集)。
部7に処理が移る。その後、定義体データ作成部7で
は、前記の処理と同様にして、イメージ読み取りフィー
ルドのテーブル化(RAM9内の中間テーブルを作成)
を行う。
ォーマットの情報が有るか否かを判定し、同一フォーマ
ットが複数有る場合は、同一フォーマットデータ計算部
8で同一フォーマットの計算を行い、テーブルの形式に
データを編集する(RAM9内の最終読み取り定義テー
ブルの編集)。
処理部10では、前記編集したデータをOCR定義体テ
ーブルとして、磁気ディスク装置2内のOCR定義体フ
ァイルに格納する。
説明・・・図5〜図9参照 図5は実施例の処理フローチャート(その1)、図6は
実施例の処理フローチャート(その2)、図7は実施例
の処理フローチャート(その3)、図8は実施例の処理
フローチャート(その4)、図9は実施例の処理フロー
チャート(その5)である。以下、図5〜図9に基づい
て実施例のOCR定義体作成処理を説明する。なお、S
1〜S28は各処理ステップを示す。
した表示装置11に、文字読み取りフィールド定義画
面、イメージ読み取りフィールド定義画面、同一フォー
マット定義画面を順次表示させ、この画面に従って、キ
ーボード12からデータを入力することにより作成す
る。
で、文字項目読み取り位置の入力を行う(S1)。この
場合、複数フィールドの次の情報を入力させる。すなわ
ち、入力情報としては、フィールド名、読み取り開始位
置(X座標、Y座標)、読み取り終了位置(X座標、Y
座標)、読み取り桁数、読み取り文字枠(文字枠サイ
ズ)、読み取りカテゴリ(英字、数字等の辞書を選択す
る情報)である。なお、これらの情報の入力は、同一フ
ォーマットが複数ある場合は、同一フォーマットの先頭
のフォーマットの情報のみを入力させる。
義画面で、イメージ読み取り位置の入力を行う(S
2)。この場合、複数フィールドの次の情報を入力させ
る。前記入力情報としては、フィールド名、読み取り開
始位置(X座標、Y座標)、読み取り領域の大きさ(X
方向サイズ、Y方向サイズ)である。なお、同一フォー
マットがある場合は、同一フォーマットの先頭のフォー
マットの情報のみを入力させる。
定義画面で、同一フォーマットの文字読み取りフィール
ドのフィールド名を入力させ(S3)、同一フォーマッ
トのイメージ読み取りフィールドのフィールド名を入力
させる(S4)。その後、同一フォーマットのフォーマ
ット間の距離を入力させ(S5)、同一フォーマットの
個数を入力させる(S6)。前記のようにして入力され
た情報(データ)は、入力データ取込部6が取り込む。
では、入力データ取込部6が取り込んだ情報を基に、文
字読み取りフィールドの情報を、RAM9の中間テーブ
ルに出力(RAM9内に中間テーブルを作成)する(S
7)。この場合、前記中間テーブルには、文字読み取り
フィールド定義テーブル、同一フォーマット定義テーブ
ル(文字読み取り用)、イメージ読み取り用定義テーブ
ル、同一フォーマット定義テーブル(イメージ読み取り
用)がある。
は、前記中間テーブルを参照し、同一フォーマット定義
テーブル(文字読み取り用)の帳票上の同一フォーマッ
トの個数が0か否かを判定する(S8)。
らば、定義体データ作成部7がS17の処理(後述す
る)を行うが、前記個数が0でなければ、定義体データ
作成部7は、同一フォーマットデータ計算部8へ計算依
頼を出し、該同一フォーマットデータ計算部8が、S9
〜S16の処理により、同一フォーマットの計算を行っ
て、中間テーブルのデータ編集を行う。この編集によ
り、RAM9内に最終読み取り定義テーブルを作成す
る。
は、変数IをI=1に初期設定する(S9)。そして、
同一フォーマット定義テーブル(文字読み取り用)の変
数Iが、「I>同一フォーマットの個数」の条件を満た
しているか否かを判定する(S10)。
数」の条件を満たしている場合には、定義体データ作成
部7が、S17の処理(後述する)を行うが、前記条件
を満たしていない場合は、同一フォーマットデータ計算
部8は、別の変数JをJ=1に初期設定する(S1
1)。
用)の変数Jについて、「J>同一フォーマットに属す
るフィールドの個数」の条件を満たしているか否かを判
定する(S12)。その結果、前記条件を満たしていれ
ば、前記変数Iをインクリメント(I=I+1)し(S
16)、前記S10から処理を行う。
るフィールドの個数」の条件を満たしていない場合に
は、同一フォーマット定義テーブル(文字読み取り用)
のJ番目のフィールドの読み取り開始位置のY座標に、
フォーマット間の距離×(I−1)を足す。また、読み
取り終了位置のY座標に、フォーマット間の距離×(I
−1)を足す(S13)。
ータ計算部8は、読み取り開始位置(X座標、Y座
標)、読み取り終了位置(X座標、Y座標)、読み取り
桁数、読み取り文字枠、読み取りカテゴリを、RAM9
内の最終読み取り定義テーブルのL番目にセットする
(S14)。この場合、L=(I−1)×(同一フォー
マットに属するフィールドの個数)+Jである。
=J+1)し(S15)、前記S12の処理へ戻って処
理を行う。一方、前記S8の処理で、同一フォーマット
の個数が0と判定した場合、及び前記S10の処理で、
変数Iが、「I>同一フォーマット個数」の条件を満た
していると判定した場合には、定義体データ作成部7
が、中間テーブルの同一フォーマット以外のフィールド
情報を、RAM9内の最終読み取り定義テーブルにセッ
トする(S17)。
読み取り開始位置(X座標、Y座標)、読み取り終了位
置(X座標、Y座標)、読み取り桁数、読み取り文字
枠、読み取りカテゴリである。
成部7は、中間テーブルを参照し、同一フォーマット定
義テーブル(イメージ読み取り用)の帳票上の同一フォ
ーマットの個数が0か否かを判定する(S18)。
(イメージ読み取り用)の帳票上の同一フォーマットの
個数が0の場合には、S27の処理(後述する)を行う
が、前記個数が0でない場合は、定義体データ作成部7
は、同一フォーマットデータ計算部8へ計算依頼を出
し、該同一フォーマットデータ計算部8が、S19〜S
26の処理により、同一フォーマットの計算を行って、
中間テーブルのデータ編集を行う。この編集により、R
AM9内に最終読み取り定義テーブルを作成する。
は、変数IをI=1に初期設定する(S19)。そし
て、同一フォーマット定義テーブル(イメージ読み取り
用)の変数Iが、「I>同一フォーマットの個数」の条
件を満たしているか否かを判定する(S20)。
は、S27の処理(後述する)を行うが、前記条件を満
たしていない場合は、変数JをJ=1に初期設定する
(S21)。
は、同一フォーマット定義テーブル(イメージ読み取り
用)の変数Jが、「J>同一フォーマットに属するフィ
ールドの個数」の条件を満たしているか否かを判定する
(S22)。
は、変数Iをインクリメント(I=I+1)し(S2
6)、S22の処理へ戻る。しかし、前記S22の処理
で、「J>同一フォーマットに属するフィールドの個
数」の条件を満たしていない場合には、同一フォーマッ
ト定義テーブル(イメージ読み取り用)のJ番目のフィ
ールドの読み取り開始位置のY座標に、フォーマット間
の距離×(I−1)を足す。また、読み取り終了位置の
Y座標にフォーマット間の距離×(I−1)を足す(S
23)。
ータ計算部8は、読み取り開始位置(X座標、Y座
標)、読み取り領域サイズ(X方向、Y方向)をRAM
9内の最終読み取り定義テーブルにセットする(S2
4)。そして、変数Jをインクリメント(J=J+1)
し(S25)、前記S22の処理へ戻る。
ットの個数が0の場合、及び前記S20の処理で、同一
フォーマット定義テーブル(イメージ読み取り用)の変
数Iが、「I>同一フォーマットの個数」の条件を満た
している場合には、定義体データ作成部7は、中間テー
ブルの同一フォーマット以外のフィールド情報を、RA
M9内の最終読み取り定義テーブルにセットする(S2
7)。この場合のフィールド情報としては、読み取り開
始位置(X座標、Y座標)、読み取り領域サイズ(X方
向、Y方向)である。
ータ作成部7は、RAM9内の最終読み取り定義テーブ
ルのデータを定義体データ格納処理部10へ渡す。そし
て、前記定義体データ格納処理部10が、前記最終読み
取り定義テーブルのデータを磁気ディスク装置のOCR
定義体ファイルに格納する(S28)。以上の処理によ
り、磁気ディスク装置2のOCR定義体ファイルにOC
R定義体を格納する。
図10、図11、図12参照図10はOCR定義体の定
義例(その1)、図11はOCR定義体の定義例(その
2)、図12はOCR定義体の定義例(その3)であ
る。以下、図10〜図12に基づいて、OCR定義体の
定義例について説明する。
・図10参照 図3に示した連記式帳票を対象としてOCR定義体を定
義する場合、先ず、文字読み取りフィールドの定義を行
う。この場合、図2に示した表示装置の画面に、図10
に示した文字読み取りフィールド定義画面を表示し、こ
の画面で、図3に示した連記式帳票の各フィールドに対
して、次のようにデータ入力を行う。
名、読み取り開始位置(X座標、Y座標)、読み取り終
了位置(X座標、Y座標)、桁数、カテゴリ、文字枠サ
イズである。
マットの口座番号)では、読み取り開始位置のX座標=
8、読み取り開始位置のY座標=10、読み取り終了位
置のX座標=20、読み取り終了位置のY座標=10、
桁数=5、カテゴリの項目には数字、文字枠サイズの項
目には文字枠1の各データを入力する。
マットの金額)では、読み取り開始位置のX座標=2
5、読み取り開始位置のY座標=10、読み取り終了位
置のX座標=45、読み取り終了位置のY座標=10、
桁数=7、カテゴリの項目には数字、文字枠サイズの項
目には文字枠1の各データを入力する。
マットのお受取人名)では、読み取り開始位置のX座標
=8、読み取り開始位置のY座標=15、読み取り終了
位置のX座標=45、読み取り終了位置のY座標=1
5、桁数=13、カテゴリの項目にはカナ、文字枠サイ
ズの項目には文字枠1の各データを入力する。
では、読み取り開始位置のX座標=8、読み取り開始位
置のY座標=45、読み取り終了位置のX座標=20、
読み取り終了位置のY座標=45、桁数=5、カテゴリ
の項目には数字、文字枠サイズの項目には文字枠1の各
データを入力する。
名)では、読み取り開始位置のX座標=8、読み取り開
始位置のY座標=50、読み取り終了位置のX座標=4
5、読み取り終了位置のY座標=50、桁数=13、カ
テゴリの項目にはカナ、文字枠サイズの項目には文字枠
1の各データを入力する。
・・・図11参照 前記文字読み取りフィールドの定義を行った後、前記表
示装置の画面に、図11に示したイメージ読み取りフィ
ールド定義画面を表示し、この画面で、図3、図4に示
した連記式帳票の各フィールドに対して、次のようにデ
ータ入力を行う。
名、読み取り開始位置(X座標、Y座標)、読み取り領
域サイズ(X方向、Y方向)である。フィールド名がI
MG001(同一フォーマットの口座番号)では、読み
取り開始位置のX座標=8、読み取り開始位置のY座標
=10、読み取り領域サイズのX方向=12、読み取り
領域サイズのY方向=2を入力する。
マットの金額)では、読み取り開始位置のX座標=2
5、読み取り開始位置のY座標=10、読み取り領域サ
イズのX方向=20、読み取り領域サイズのY方向=2
を入力する。
マットのお受取人名)では、読み取り開始位置のX座標
=8、読み取り開始位置のY座標=15、読み取り領域
サイズのX方向=37、読み取り領域サイズのY方向=
2を入力する。
では、読み取り開始位置のX座標=8、読み取り開始位
置のY座標=45、読み取り領域サイズのX方向=1
2、読み取り領域サイズのY方向=2を入力する。
名)では、読み取り開始位置のX座標=8、読み取り開
始位置のY座標=50、読み取り領域サイズのX方向=
37、読み取り領域サイズのY方向=2を入力する。
2参照 前記イメージ読み取りフィールドの定義を行った後、前
記表示装置の画面に、図12に示した同一フォーマット
定義画面を表示し、この画面で、同一フォーマットの定
義情報の入力を行う。
ルド群について、同一フォーマットの定義情報の入力を
行う。同一フォーマット情報としては、図4に示したよ
うに、フィールドF1、F2、F3が同一フォーマット
であるから、最初のフォーマットであるフィールドF1
のデータを入力する。また、同一フォーマット間の距
離、及び帳票上の同一フォーマットの個数を入力する。
はANK001、ANK002、ANK003であり、
同一フォーマット間の距離=12、帳票上の同一フォー
マットの個数=3を入力する。
いて、同一フォーマットの定義情報の入力を行う。この
場合にも、同一フォーマット情報としては、図4に示し
たように、フィールドF1、F2、F3が同一フォーマ
ットであるから、最初のフォーマットであるフィールド
F1のデータを入力する。また、同一フォーマット間の
距離、及び帳票上の同一フォーマットの個数を入力す
る。
はIMG001、IMG002、IMG003であり、
同一フォーマット間の距離=12、帳票上の同一フォー
マットの個数=3を入力する。
図16参照 図13は中間テーブル(その1)、図14は中間テーブ
ル(その2)、図15は中間テーブル(その3)、図1
6は中間テーブル(その4)である。以下、図13〜図
16に基づいて、中間テーブルについて説明する。
ルド定義画面で入力したデータ、イメージ読み取りフィ
ールド定義画面で入力したデータ、及び同一フォーマッ
ト定義画面で入力したデータを、入力データ取込部6が
取り込んだ後、定義体データ作成部7がRAM9内の中
間テーブルに出力したものである。
ールド定義テーブル、同一フォーマット定義テーブル
(文字読み取り用)、イメージ読み取り用フィールドの
テーブル、及び同一フォーマット定義テーブル(イメー
ジ読み取り用)がある。
図17〜図22参照 図17はOCR定義体テーブル(その1)、図18はO
CR定義体テーブル(その2)、図19はOCR定義体
テーブル(その3)、図20はOCR定義体テーブル
(その4)、図21はOCR定義体テーブル(その
5)、図22はOCR定義体テーブル(その6)であ
る。
ルのデータを基に、定義体データ作成部7が作成し、か
つ、同一フォーマットデータ計算部8が計算して編集し
たRAM9内の最終読み取り定義テーブルのデータを、
定義体データ格納処理部10が、磁気ディスク装置2内
のOCR定義体テーブルに格納したものである。
取りフィールド定義テーブル、及びイメージ読み取りフ
ィールドのテーブルがある。そして、同一フォーマット
の項目についても編集されており、全てのフィールド項
目に対してOCR定義体データが作成されている。
ーブルでは、フィールド総数=11であり、フィールド
名がANK001、ANK002、ANK003、AN
K101、ANK102、ANK103、ANK20
1、ANK202、ANK203、ANK004、AN
K005について、データが作成されている。
ブルでは、フィールド総数=11であり、フィールド名
が、IMG001、IMG002、IMG003、IM
G101、IMG102、IMG103、IMG20
1、IMG202、IMG203、IMG004、IM
G005について、データが作成されている。
は、前記OCR定義体テーブルのデータを、OCRのメ
モリへダウンロードして使用する。 (他の実施例)以上実施例について説明したが、本発明
は次のようにしても実施可能である。
帳票に限らず、同一フォーマットが無い帳票についても
前記実施例と同様に実施可能である。 (2) :最終的に作成されたOCR定義体を格納するOC
R定義体ファイルは、例えば、フロッピィディスク、磁
気テープ、半導体メモリ、光磁気ディスク等、他の記憶
媒体を使用することも可能である。
のような効果がある。 (1) :連続して同一フォーマットが複数有る場合、同一
フォーマットの先頭フォーマットの位置情報と、同一フ
ォーマットの定義情報を入力するだけで、連続する同一
フォーマットの読み取り位置の定義情報を自動的に計算
し、OCR定義体の編集を行うことができる。
有る場合のOCR定義体の定義情報の入力作業が簡易化
でき、OCR定義体の作成が容易になる効果がある。 (2) :特に、連記式帳票のように、OCRでの読み取り
項目が多く、かつ同一フォーマットの繰り返しフィール
ドが多数ある場合は、従来のように、個々のフィールド
毎にデータ入力を行う必要がなくなる。
効率が良く、面倒な入力作業が不必要であり、OCR定
義体作成者の作業負担が小さくなる効果がある。なお、
前記効果の外、各請求項の構成によれば、次のような効
果がある。
タ取込部が取り込んだ文字項目読み取り位置の定義情
報、イメージ読み取り位置の定義情報、及び同一フォー
マットの定義情報を基に、定義体データ作成部がOCR
定義体を自動的に作成する。
ば、同一フォーマットデータ計算部が同一フォーマット
の定義情報を用いて、連続した同一フォーマット位置の
定義情報を自動的に計算する。
でも、同一フォーマットが無い帳票でも、そのOCR定
義体を自動的に作成することができる効果がある。 (4) :請求項1の構成によれば、入力データ取込部は、
同一フォーマットが複数有る場合、文字項目読み取り位
置の定義情報、及びイメージ読み取り位置の定義情報と
して、複数の同一フォーマットの内、先頭フォーマット
の定義情報のみを取り込み、同一フォーマットの定義情
報として、文字読み取りフィールド群、及びイメージ読
み取りフィールド群に対し、それぞれ、同一フォーマッ
ト間の距離、及び帳票類上の同一フォーマットの個数を
取り込む機能を有する。
のデータ入力作業が軽減できる効果がある。 (5) :請求項2の構成によれば、定義体データ作成部は
OCR定義体を作成する際同一フォーマットが複数有る
か否かを判定し、同一フォーマットが複数有る場合は、
同一フォーマットデータ計算部に対して同一フォーマッ
トの定義情報の計算依頼を行う機能を有し、同一フォー
マットデータ計算部は前記計算依頼により、同一フォー
マットの定義情報を用いて文字読み取り位置、及びイメ
ージ読み取り位置の定義情報を計算し、OCR定義体の
編集を行う機能を有する。
でも、同一フォーマットデータ計算部が同一フォーマッ
トの位置情報等を計算し、OCR定義体の編集を行うの
で、連続する同一フォーマットが複数有る場合のOCR
定義体作成作業が効率良く行える効果がある。
る。
る。
る。
る。
る。
1)である。
2)である。
3)である。
る。
る。
る。
る。
1)である。
2)である。
3)である。
4)である。
5)である。
6)である。
Claims (2)
- 【請求項1】 OCRで帳票類の読み取りを行うための
OCR定義体を作成するOCR定義体作成装置におい
て、 入力された文字項目読み取り位置の定義情報、イメージ
読み取り位置の定義情報、及び同一フォーマットの定義
情報を取り込み、同一フォーマットが複数有る場合には、文字項目読み取
り位置の定義情報、及びイメージ読み取り位置の定義情
報として、複数の同一フォーマットの内、先頭フォーマ
ットの定義情報のみを取り込み、 同一フォーマットの定義情報として、文字読み取りフィ
ールド群、及びイメージ読み取りフィールド群に対し、
それぞれ、同一フォーマット間の距離、及び帳票類上の
同一フォーマットの個数を取り込む 入力データ取込部
と、 前記入力データ取込部が取り込んだ各定義情報を基に、
OCR定義体を作成する定義体データ作成部と、 同一フォーマットが複数有る場合、前記定義体データ作
成部からの計算依頼により、前記同一フォーマットの定
義情報を用いて、連続した同一フォーマット位置の定義
情報を計算する同一フォーマットデータ計算部と、 作成済みのOCR定義体を格納するOCR定義体ファイ
ルを備えたことを特徴とするOCR定義体作成装置。 - 【請求項2】 前記定義体データ作成部は、 OCR定義体を作成する際、同一フォーマットが複数有
るか否かを判定し、同一フォーマットが複数有る場合
は、同一フォーマットデータ計算部に対して同一フォー
マットの定義情報の計算依頼を行う機能を有し、 前記同一フォーマットデータ計算部は、前記計算依頼に
より、前記同一フォーマットの定義情報を用いて、文字
読み取り位置、及びイメージ読み取り位置の定義情報を
計算し、OCR定義体の編集を行う機能を有する ことを
特徴とした請求項1記載のOCR定義体作成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP18723494A JP3392530B2 (ja) | 1994-08-09 | 1994-08-09 | Ocr定義体作成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP18723494A JP3392530B2 (ja) | 1994-08-09 | 1994-08-09 | Ocr定義体作成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0855184A JPH0855184A (ja) | 1996-02-27 |
JP3392530B2 true JP3392530B2 (ja) | 2003-03-31 |
Family
ID=16202410
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP18723494A Expired - Fee Related JP3392530B2 (ja) | 1994-08-09 | 1994-08-09 | Ocr定義体作成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3392530B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021047688A (ja) * | 2019-09-19 | 2021-03-25 | 株式会社日立情報通信エンジニアリング | 帳票認識方法およびプログラム |
-
1994
- 1994-08-09 JP JP18723494A patent/JP3392530B2/ja not_active Expired - Fee Related
Non-Patent Citations (1)
Title |
---|
ACOSソフトウェア ACOS−4/MVPXE 日本語情報処理サービスプロクラム説明書 DKA71−6,日本,日本電気,1989年4月,6版,pp.305−335,特にpp.323−324の「繰り返し」項目 |
Also Published As
Publication number | Publication date |
---|---|
JPH0855184A (ja) | 1996-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9165391B2 (en) | Receipts scanner and financial organizer | |
CN102081522B (zh) | 不管应用程序类型如何,跨应用程序一致地呈现和处理与文档相关联的图表的系统和方法 | |
US20050182709A1 (en) | Automated financial scenario modeling and analysis tool having an intelligent graphical user interface | |
EP0857334B1 (en) | Corporate disclosure and repository system | |
JPH0776958B2 (ja) | 文書整形装置 | |
US20050080789A1 (en) | Multimedia information collection control apparatus and method | |
US20240160616A1 (en) | Text-based machine learning extraction of table data from a read-only document | |
US20210224924A1 (en) | Receipts scanner and financial organizer | |
JP3392530B2 (ja) | Ocr定義体作成装置 | |
JPS61107468A (ja) | 文書編集方式 | |
JP2718836B2 (ja) | データベースシステム | |
JP2824256B2 (ja) | 文字表示システム | |
JPS59103131A (ja) | 一覧表作成機能をもつカ−ド・イメ−ジ処理デ−タ処理装置 | |
CN100593791C (zh) | 数据媒体处理装置及数据媒体处理方法 | |
ZA200106401B (en) | Automated financial scenario modeling and analysis tool having an intelligent graphical user interface. | |
JPH0128981B2 (ja) | ||
JPH0322080A (ja) | 帳票作成装置 | |
JP2831866B2 (ja) | 表計算ソフトウェア連携処理装置 | |
JP2788556B2 (ja) | イメージ情報検索装置 | |
JP2002149671A (ja) | 情報処理装置および情報処理方法ならびに記録媒体 | |
CN115862019A (zh) | 文本处理方法和装置 | |
JPS6019275A (ja) | 画像検索装置 | |
JPH05233204A (ja) | 画面項目の入力スキップ方法 | |
CN117972202A (zh) | 基于调查问卷预置题库实现精准用户画像的方法及系统 | |
JP2998209B2 (ja) | 情報処理装置及び情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20030107 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080124 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090124 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100124 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110124 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110124 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120124 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |