JPH03296883A - 帳票認識装置の帳票認識方法 - Google Patents

帳票認識装置の帳票認識方法

Info

Publication number
JPH03296883A
JPH03296883A JP2099608A JP9960890A JPH03296883A JP H03296883 A JPH03296883 A JP H03296883A JP 2099608 A JP2099608 A JP 2099608A JP 9960890 A JP9960890 A JP 9960890A JP H03296883 A JPH03296883 A JP H03296883A
Authority
JP
Japan
Prior art keywords
character
field
image information
characters
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2099608A
Other languages
English (en)
Inventor
Toshiyuki Yoshida
敏之 吉田
Yukio Sakamoto
幸夫 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Group Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP2099608A priority Critical patent/JPH03296883A/ja
Publication of JPH03296883A publication Critical patent/JPH03296883A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、銀行振込み用紙や、保険申込用紙などの帳票
の内容を認識し、計算機に通知する帳票認識装置の帳票
認識方法に係り、特に、複数種類の帳票の認識を効率良
く行なうのに好適な帳票認識装置の帳票認識方法に関す
るものである。
〔従来の技術〕
帳票認識装置とは、0CR(Optical  Cha
racter  Reader :光学式文字読取り装
置)の一つであり、特に、一定の規約に基づく文字記入
領域とレイアウトを持つ帳票上の文字を、光学的な手段
で読み取り、かつ、その帳票に対する処理内容を認識す
る装置である。すなわち、用紙媒体である帳票上に記入
、あるいは、印刷された文字を自動認識し、さらに、認
識した文字に対する処理を認識し、計算機へ通知する機
能を果たすものである。
帳票認識装置の実際の用途としては、郵便番号の読み取
りや、税金納付票、電気、ガス料金払込票、そして、銀
行振込み用紙や、保険申込用紙などの内容の読み取りに
利用されている。
文字の認識方法としては、文字の黒領域部分、もしくは
、白領域部分の構成に基づく特徴量を抽出し、文字の幾
何学的な特徴を利用して、読み込んだ文字を識別する方
法がある。これは、OCRなどの印刷文字や、書き方を
制限した手書き文字などの、ある程度規格化された文字
の認識に適した文字認識方法である。
また、画像から、文字としての対象パターンの特徴を抽
出するための方法としては、例えば、次のような方法が
とられている。
まず、画像の濃淡から2値化の方法で画素を得て、そし
て、2値化の方法で得た画素の連結から線を抽出し、さ
らに、これらの線の曲がり具合や、線と線との接触、お
よび、交わり具合などの幾何学的特徴を抽出する方法が
ある。
以上、OCRに関しては、電子情報通信学会編「電子情
報通信ハンドブック」(オーム社、1988年発行)の
pp、1677〜1678と、pp。
2687〜2688に記載されている。
また、文字を構成する画素を得る方法に関しては、例え
ば、鳥脇著「画像処理のためのディジタル画像処理[1
1] J (昭晃堂、1988年発行)のpp、45〜
47に記載されている。
さらに、画像から画素を得て、画素の連結から線を抽出
し、さらに、これらの線の幾何学的特徴を抽出し、文字
を認識する方法に関しては、安居院猛・中嶋正之著「コ
ンピュータ画像処理」 (産報出版)のpp、55〜8
8に記載されている。
さて、この帳票認識装置で取扱う帳票、すなわち、企業
の業務の中で使用される帳票には、非常に多くの種類が
ある。
例えば、帳票の構造に関して言えば、文字が、予め、印
刷されている領域や、申請者が文字を記入すべき領域、
すなわち、文字記入領域(以下、これらの領域をフィー
ルドと記載)の位置や大きさは、′帳票の種類毎に相違
している。
また、各フィールドへの文字の記入方法に関して言えば
、文字を記入すべき範囲が、−文字単位に枠で区切られ
る場合と、そのような制約が全くない場合、あるいは、
記入される文字が、印刷される場合と手書きされる場合
などがある。
さらに、記入される文字の種別に関しては、英数字、片
仮名、平仮名を含む漢字など、多くの種類がある。
また、帳票認識装置が、帳票の各フィールドに対して行
なう処理には、文字認識以外の処理もある。例えば、幾
つかの数字フィールドの認識結果の合計値を、ある一つ
のフィールドに記入することを指示する処理や、フィー
ルドの漢字認識結果を学習させて、単語として辞書ファ
イルに登録することを指示する処理など、処理の内容を
認識し、計算機に通知するものである。
以上に述べたような帳票の多様性に対して、従来の技術
においては、フィールドの位置や、大きさを固定して、
認識すべき文字は、印刷文字か、手書き文字かの一方の
みに規定し、かつ、文字種も、英数字、片仮名、平仮名
、漢字のいずれか一つに制限し、さらに、各フィールド
に対する処理の内容も予め規定して、装置やシステムを
構成していた。
〔発明が解決しようとする課題〕
従来の帳票認識装置における帳票の認識方法では、読み
取り対象となる帳票の多様性に対しては、フィールドの
レイアウトや、認識すべき文字の記入方法や文字種、さ
らに、各フィールドに対する処理の内容も予め指定し、
一つに制限されるようにして、装置やシステムが構成さ
れていた。
このため、種類が異なる複数種類の帳票を、同一装置で
認識出来ないという問題があった。
本発明の目的は、これら従来技術の課題を解決し、帳票
のレイアウトや文字の記入方法、および、各フィールド
に対する処理の内容に関する規約・規則のデータを用い
て、イメージ情報の読み出しと帳票認識を行ない、複数
種類の帳票の認識を可能とする帳票認識装置の帳票認識
方法を提供することである。
〔課題を解決するための手段〕
上記目的を達成するため、本発明の帳票認識装置の帳票
認識方法は、任意の位置と個数のフィールドを有する帳
票上のそれぞれのフィールドの配置構成を表すデータを
格納する帳票レイアウトデータ格納部と、この帳票レイ
アウトデータ格納部に格納されたフィールドのそれぞれ
に対応して、このフィールドに記入する任意に規定した
文字の種類と記入方法に関する規約を表すデータと、こ
のフィールドに記入する文字に対する任意に規定した処
理方法に関する規約を表すデータとを格納するフィール
ド属性データ格納部、そして、画素の集合として記憶し
たイメージ情報をフィールド単位で記憶する第1のバッ
ファメモリと、文字単位で記憶する第2のバッファメモ
リとを有し、帳票レイアウトデータ格納部に格納したデ
ータを参照して、任意の位置と個数のフィールドを有す
る帳票の電子的走査により読み取り記憶したイメージ情
報を、フィールド単位に読み出すステップと、このフィ
ールド単位に読み出したイメージ情報を、第2のイメー
ジ情報として、第1のバッファメモリに記憶するステッ
プと、さらに、フィールド属性データ格納部の文字の記
入方法に関する規約を表すデータを参照して、この第1
のバッファメモリに記憶した第2のイメージ情報を文字
単位に分解して読み出すステップと、この文字単位に読
み出したイメージ情報を、第3のイメージ情報として、
第2のバッファメモリに記憶するステップと、フィール
ド属性データ格納部の文字の種類に関する規約を表わす
データを参照して、第2のバッファメモリに記憶した第
3のイメージ情報から文字を認識するステップと、そし
て、フィールド属性データ格納部の文字に対する処理方
法に関する規約を表すデータを参照して、認識した文字
に対する処理方法を認識するステップとを含むことを特
徴とする。
[作用〕 本発明において、帳票認識装置は、帳票の認識を行なう
ため、まず、銀行振込み用紙や、保険申込用紙などの異
なる種類の帳票に対応して、それぞれの帳票の各フィー
ルドのレイアウトや、文字の記入方法、および、フィー
ルドの処理内容に関する規約・規則をデータとして登録
しておく。
そして、帳票に記入されている文字を、以下の動作を行
ない認識する。
まず、認識すべき帳票のレイアウトに関するデータを参
照して、各フィールドに分割し、対応するイメージ情報
を読み出す。
次に、このイメージ情報から、フィールド属性データ格
納部の文字の記入方法に関する規約、例えば、手書きか
印刷か、または、枠ありか枠なしかなどに関するデータ
を参照して、−文字単位にイメージ情報を読み出す。さ
らに、フィールド属性データ格納部の文字種に関する規
約、例えば、英数字か、漢字、片仮名かなどに関するデ
ータを参照して、文字認識アルゴリズムを選択し、文字
を認識する。
また、各フィールドの文字に対する処理の内容に関して
は、フィールド属性データ格納部の文字に対する処理方
法に関する規約を表すデータを参照して、認識した文字
に対する処理方法を認識する。
このようにして、銀行振込み用紙や、保険申込用紙など
の異なる種類の帳票に対応して、帳票の文字の認識と処
理方法の認識を効率良く行ない、帳票を認識する。
〔実施例〕
以下、本発明の実施例を、図面により詳細に説明する。
第1図は、本発明を施した帳票認識システムの一実施例
を示すブロック図である。
この帳票認識システムは、特に、異なる種類の帳票に記
入した文字を認識して、この認識した文字に対し、正解
文字となる複数個の候補文字を計算機に送出するもので
ある。
システム全体の制御を行なう計算機1と、本発明を施し
た帳票認識装置2からなり、さらに、帳票認識装置2は
、帳票を電気信号のイメージ情報として読み込む帳票読
み取り部20と、このイメージ情報を記憶する画像メモ
リ21、フィールド位置とフィールドサイズデータを格
納する帳票レイアウトデータ格納部23、この帳票レイ
アウトデータ格納部を参照して、画像メモリ21に記憶
したイメージ情報を、フィールド毎に分解して読み出す
メモリ読み出し制御部22、メモリ読み出し制御部22
で読み出したフィールド単位のイメージ情報を格納する
第1のバッファメモリ25、フィールド内の文字の種別
に関するデータや記入方法、および、フィールド内の文
字の処理内容に関するデータなどのフィールド属性デー
タを記憶するフィールド属性データ格納部24、このフ
ィールド属性データ格納部24内の文字記入方法データ
などを参照して、第1のバッファメモリ25からイメー
ジ情報を読み出す文字切り出し部26、この文字切り出
し部26で読み出したイメージ情報を記憶する第2のバ
ッファメモリ27、さらに、フィールド属性データ格納
部24内の文字種別データ、および、フィールドの処理
内容に関するデータなどを参照し、第2のバッファメモ
リ27からのイメージ情報を文字として認識して、さら
に、候補文字の文字コード(通常、−文字に対して複数
個)を計算機1に送出する文字認識部28から構成され
ている。
このような構成により、本発明を施した帳票認識装置2
は、帳票のレイアウトや、文字の種別、および、文字の
記入方法や、文字の処理内容などに関する規約・規則を
データとして登録し、このデータを参照しながら、フィ
ールド単位のイメージ情報の切り出し、文字単位のイメ
ージ情報の切り出し、そして、文字の認識と処理内容の
認識等を効率良く行ない、種類の異なる帳票に記入され
た文字を自動的に認識して、複数個の認識候補文字の文
字コードを計算機1に送出する。
尚、本実施例における帳票認識装置2は、認識した文字
の候補文字の抽出に関する処理を行なうものであるが、
帳票レイアウトデータ格納部23とフィールド属性デー
タ格納部24内のデータを変更することにより、さらに
、広範な帳票の認識が可能となる。例えば、銀行振込み
用紙や保険申込用紙など、各フィールドに対して異なる
処理を必要とする帳票を認識することも可能である。
以下、帳票認識装置2の処理内容を、さらに、詳しく説
明する。
第2図は、第1図における帳票認識装置の本発明に係る
処理動作の一実施例を示すフローチャートである。
まず、第1図の計算機1を介して、読み取りの対象とな
る帳票に対応するフィールドの位置とサイズを、帳票レ
イアウトデータとして第1図の帳票レイアウトデータ格
納部23に登録する(ステップ201)。また、文字記
入方法データや、文字種別データ、および、処理内容デ
ータなどの各フィールドの属性データを、第1図のフィ
ールド属性データ格納部24に登録する(ステップ20
2)。この動作を、予め、取扱う全ての種類の帳票内の
全てのフィールドに対して行なう(ステップ203)。
さて、第1図の帳票読み取り部20により、枚の帳票を
読み込み(ステップ204)、そのイメージ情報を第1
図の画像メモリ21に送り、記憶する(ステップ2o5
)。
そして、第1図のメモリ読み出し制御部22により、第
1図の帳票レイアウトデータ格納部23に記憶されてい
る帳票レイアウトデータを参照して(ステップ2o6)
、このフィールドに対応するイメージ情報を探索する(
ステップ207)。あれば、当該するイメージ情報を第
1図の画像メモリ21から読み出しくステップ208)
、なければ、次のフィールドのイメージ情報を探索する
。読み出したイメージ情報を、第1図の第1のバッファ
メモリ25に書き込む(ステップ209)。
次に、第1図の文字切り出し部26により、第1図のフ
ィールド属性データ格納部24の文字記入方法データな
どを参照しくステップ210)、第1図の第1のバッフ
ァメモリ25から、さらに、フィールド内を文字単位に
分解してイメージ情報を読み出しくステップ211)、
第1図の第2のバッファメモリ27に書き込み記憶する
(ステップ212)。
そじて、第1図の文字認識部28により、第1図のフィ
ールド属性データ格納部24の文字種別データを参照し
て(ステップ213)、例えば、英数字認識処理や片仮
名認識処理、または、漢字認識処理により、第1図の第
2のバッファメモリ27に記憶された文字単位のイメー
ジ情報から、文字を認識する(ステップ214)。
さらに、第1図の文字認識部28により、第1図のフィ
ールド属性データ格納部24の処理内容データを参照し
くステップ215)、認識した文字に対応する複数個の
認識候補文字を抽出しくステップ216)、その複数個
の認識候補文字の文字コードを第1図の計算機1に送出
する(ステップ217)。
第1図の第1のバッファメモリ25に格納した一つのフ
ィールド内の全文字に対する文字認識が終了するまでス
テップ211〜217を繰返す(ステップ218)。終
了すれば、ステップ206に戻り、さらに、次の、フィ
ールドに対する認識処理を繰り返す(ステップ219)
このようにして、全てのフィールド、すなわち、一つの
帳票に対する全ての文字の認識処理が完了すれば、処理
を終了する。
このように、本実施例では、帳票の設計規約をデータ化
して、帳票レイアウトデータ格納部23、および、フィ
ールド属性データ格納部24に格納する。そして、その
データを参照して、フィールド毎のイメージ情報を読み
取り、さらに、そのフィールド内のイメージ情報を、文
字単位に分解して読み取る。そして、この文字単位に分
解したイメージ情報から、文字、および、その処理方法
を認識する。このことにより、本実施例の帳票認識装置
は、帳票の変更に容易に対応でき、複数種類の帳票の認
識処理を行なうことができる。
次に、本発明を施した第1図の帳票認識装置2に関して
、さらに、詳しく説明する。
第3図は、第1図における帳票レイアウトデータ格納部
の記憶構成の一実施例を示す説明図である。
第3図(a)は、帳票レイアウトデータ格納部の各情報
の記憶構成を示し、第3図(b)は、実際の帳票上のフ
ィールドのレイアウトを示している。
帳票レイアウトデータ格納部31は、読み書き可能なメ
モリからなり、帳票30上のそれぞれのフィールドの番
号を示すフィールド番号欄311と、それぞれのフィー
ルドの番号に対応して、このフィールドの位置座標を示
すフィールド位置座標欄312と、フィールドの大きさ
を示すフィールドサイズ欄313から構成され、それぞ
れの値が記憶されている。
例えば、フィールド番号欄311のフィールド番号ri
J3111のフィールドに対しては、フィールドの位置
として、フィールド位置座標欄312にフィールド位置
座標rXiJ3121、rYiJ3122が、また、フ
ィールドのサイズとして、フィールドサイズ欄313に
フィールドサイズrsXiJ3131、rsYiJ31
32が、記憶されている。
これらの情報は、第1図において、計算機1から入力さ
れる。そして、メモリ読み出し制御部22により、イメ
ージ情報の読み出し時に参照される。
尚、フィールド位置座標槽312の位置情報(Xi、Y
i)や、フィールドサイズ欄313のサイズ情報(SX
i、5Yi)は、画素を単位とした相対的な数でも良い
し、絶対的な長さを表わす数でも構わない。
第4図は、第1図におけるフィールド属性データ格納部
の記憶構成の一実施例を示す説明図である。
第4図(a)は、フィールド属性データ格納部の各情報
の記憶構成を示し、第4図(b)は、実際の帳票のフィ
ールド上の各文字記入枠のレイアウトを示している。
第4図(a)において、フィールド属性データ41は、
フィールドの番号を示すフィールド番号欄411、枠あ
りゃ、枠なしなどのフィールドの種別を示すフィールド
種別欄412、印刷や、手書きなどの記入方法を示す記
入方法槽413、漢字や、英数字などの文字の種類を示
す文字種槽414、文字の文字記入枠の位置を示す枠位
置の初期値欄415、文字記入枠の行数を示す行数槽4
16、行当りの文字記入枠の数を示す行当り枠数槽41
7、文字記入枠のサイズを示す枠のサイズ欄418、枠
のX軸、y軸方向のピッチを示す枠のピッチ欄419、
そして、フィールドに対する処理内容を示す処理内容欄
420から構成されている。
このように、第4図(a)に示すように、各フィールド
番号に対応して、それぞれのフィールドの種別、文字の
記入方法、文字種、文字記入枠、そして、文字の処理内
容などに関するデータを格納しておく。
例えば、第4図(b)に示されたフィールド番号riJ
のフィールド3111は、第4図(a)のフィールド番
号欄411のフィールドriJ410の各欄に示される
すなわち、フィールドの種別は、フィールド種別欄41
2において、−文字単位に文字記入枠が規定されている
場合には「0」、文字記入枠が規定されていない場合に
は「1」が書き込まれる。
文字の記入方法は、記入方法槽413において、対応す
るフィールドに手書き文字が記入される場合にはrQJ
 、印刷文字が記入される場合には「1」が書き込まれ
る。
文字種は、文字種槽414において、英数字の場合には
「O」、片仮名の場合にはrlJが、漢字(平仮名を含
むものとする)の場合には「2」が書き込まれる。
そして、枠位置の初期値(rxi」、ryi」)と、行
数(rGiJ)、行当りの枠の数(rFiJ)、枠のサ
イズ(rfxiJ、rfyiJ)、枠のX軸方向のピッ
チ(rPxiJ)、枠のY軸方向のピッチ(rPyiJ
)は、フィールド種別欄412において、文字の種別が
「O」、すなわち、文字の記入枠が規定されている場合
のみ有効となる。
また、処理内容欄420には、認識した文字の候補文字
の抽出処理を示す「o」が書き込まれている。
尚、枠位置の初期値欄415における枠位置の初期値は
、フィールド内での相対座標で与えられ、枠位置の初期
値、枠のサイズ、枠のX軸、並びに、Y軸方向のピッチ
の単位は、画素単位、あるいは、絶対的な長さの単位の
いずれでも良い。
また、本実施例では、文字の種類、記入方法、および、
処理内容に関する規約、すなわち、文字種槽414や記
入方法槽413、および、処理内容欄420などを、全
てフィールド属性データ41に格納した構成としたが、
それぞれ、分けた構成としても良い。
以下、このフィールド属性データ41に基づく第1図の
文字認識部28の処理動作を説明する。
第5図は、第1図における文字認識部の本発明に係る処
理動作の一実施例を示すフローチャートである。
第1図における第2のバッファメモリ27に記憶された
文字単位のイメージ情報から、文字を認識して、複数個
の候補文字を第1図における計算機1へ送出するもので
ある。
第1図における第2のバッファメモリ27に記憶された
文字単位のイメージ情報を読み出しくステップ501)
、当該する第4図のフィールド属性データ41の文字種
欄414を参照して(ステップ502)、文字の種類を
判定する(ステップ503)。
例えば、文字種がrQJの場合には(ステップ504)
、第2のバッファメモリ27に記憶された文字単位のイ
メージ情報を、英数字認識処理する(ステップ505)
。そして、第4図のフィールド属性データ41の処理内
容欄420を参照して候補文字を抽出しくステップ50
6)、それらの文字コードを、第1図における計算機1
へ送出する(ステップ507)。
ステップ503の文字種の判定で、文字種がrlJの場
合には(ステップ508)、片仮名認識処理しくステッ
プ509)、また、文字種が「2」の場合には(ステッ
プ510)、漢字認識処理を行ない(ステップ511)
、それぞれの候補文字を抽出しくステップ506)、そ
の文字コードを、第1図における計算機1へ送出して(
ステップ507)、処理ダ終了する。
尚、ステップ505の英数字認識処理と、ステップ50
9の片仮名認識処理、および、ステップ511の漢字認
識処理は、第4図の記入方法欄413における記入方法
が「O」(手書き文字)であるか、または、「1」(印
刷文字)であるかに応じて、文字の認識方法を選択して
、認識処理を行なう。
以下、第3図と第4図の格納情報を用いて、第1図の帳
票認識装置2の文字認識における本発明に係る処理動作
を、各部の動作に基づき、さらに、詳しく説明する。
まず、計算機lを介して、読み取る帳票のフィールドに
、通し番号(iとする)を対応させて、フィールドの位
置(Xi、Yi)と、フィールドサイズ(SXi、5Y
i)を、帳票レイアウトデータ格納部23に書き込み、
さらに、フィールドの属性データをフィールド属性デー
タ格納部24に書き込む。
この動作を、予め、取扱う全ての種類の帳票内の全ての
フィールドに対して行なう。
さて、帳票読み取り部20は、−枚の帳票を読み込み、
そのイメージ情報を画像メモリ21に送り、記憶させる
そして、メモリ読み出し制御部22は、帳票レイアウト
データ格納部23を参照して、第3図の帳票レイアウト
データ31として記憶されているフィールド位H(rX
iJ3121、rYiJ3122)と、フィールドサイ
ズ(rsXiJ  3131、rsYi」3132)で
示されるイメージ情報を、画像メモリ21から読み出し
、第1のバッファメモリ25に書き込む。
次に、文字切り出し部26は、フィールド属性データ格
納部24に記憶されている第4図に示したフィールド属
性データ41を参照して、フィールド種別欄412が「
0」の場合には、文字記入枠を有するフィールド、また
、「1」の場合には、文字記入枠がないフィールドと判
定して、以下の動作を行なう。
文字記入枠を有するフィールドと判定した場合は、さら
に、第4図において示す枠位置の初期値欄415(xi
、yi)、行数種416(Gi)、行当りの枠の数種4
17(Fi)、枠のサイズ欄418(fxi、fyi)
、枠のピッチ欄419のX軸方向ピッチ(pxi)、枠
のX軸方向ピッチ(pyl)を参照して、第1のバッフ
ァメモリ25がら、文字記入枠単位に、イメージ情報を
読み出し、第2のバッファメモリ27に書き込み記憶さ
せる。
一方、文字記入枠がないフィールドと判定した場合には
、従来例で説明した方法、すなわち、文字を構成する画
素の連結成分を求める方法により、第1のバッファメモ
リ25がら、文字単位にイメージ情報を切り出し、第2
のバッファメモリ27に書き込む。
次に、文字認識部28は、第5図において説明した処理
動作を行ない、文字認識、および、候補文字の抽出を行
なう。
すなわち、文字認識部28は、フィールド属性データ格
納部24に記憶されている第4図のフィールド属性デー
タ41の文字の記入方法槽413と文字種414を参照
して、第2のバッファメモリ27に記憶された文字単位
のイメージ情報を、例えば、文字種が「0」の場合には
、英数字認識処理を、文字種が「1」の場合には、片仮
名認識処理を、また、文字種が「2」の場合には、漢字
認識処理を行なう。この時、文字の記入方法槽413が
「O」(手書き文字)、または、「l」 (印刷文字)
かに応じて、文字の認識処理方法を選択する。さらに、
文字認識部28は、フィールド属性データ格納部24に
記憶されている第4図のフィールド属性データ41の処
理内容欄420を参照して、候補文字を抽出し、これら
候補文字の文字コード(通常、−文字に対して複数個)
を計算機1に送る。
以上の動作を、第3図の帳票レイアウトデータ31に示
されている全てのフィールドに対して行ない、−枚の帳
票の認識が完了する。
以上、第1図〜第5図を用いて説明したように、本実施
例においては、帳票レイアウトデータ格納部と、フィー
ルド属性データ格納部に、帳票の構造や話人文字などの
規約に関するデータを記憶させ、このデータを利用して
、読み出し制御部と文字切り出し部におけるイメージ情
報の読み出し、および、文字認識部における認識情報の
選択を制御しているので、帳票の種類の変更に容易に対
応できる構成になっている。従って、種類が異なる帳票
を、同一装置で認識できる。
尚、本実施例における帳票認識装置は、文字認識に伴う
候補文字の抽出に関する処理を行なうものであるが、フ
ィールド属性データ格納部内に格納する各データにより
、さらに、広範な帳票の認識が可能となる。例えば、銀
行振込み用紙や保険申込用紙など、各フィールドに対し
て異なる処理を必要とする帳票を認識することも可能と
なる。
〔発明の効果] 本発明によれば、帳票認識装置は、帳票の設計規約をデ
ータとして登録して、そのデータを参照することにより
、異なる種類の帳票の文字を、効率良く認識することが
できる。
【図面の簡単な説明】
図面は本発明の実施例を示し、第1図は本発明を施した
帳票認識システムの一実施例を示すブロック図、第2図
は第1図における帳票認識装置の本発明に係る処理動作
の一実施例を示すフローチャート、第3図は第1図にお
ける帳票レイアウトデータ格納部の構成の一実施例を示
す説明図、第4図は第1図におけるフィールド属性デー
タ格納部の記憶構成の一実施例を示す説明図、第5図は
第1図における文字認識処理部の本発明に係る処理動作
の一実施例を示すフローチャートである。 1・計算機、2:幅票認識装置、20:帳票読み取り部
、21:画像メモリ、22:メモリ読み出し制御部、2
3:II票レイアウトデータ格納部。 24:フィールド属性データ格納部、25・第1のバッ
ファメモリ、26:文字切り出し部、27:第2のバッ
ファメモリ、28:文字認識部、30゜帳票、31:帳
票レイアウトデータ、4トフィールド属性データ、31
1:フィールド番号欄。 312:フィールド位置座標欄、313:フイルドサイ
ズ欄、411:フィールド番号欄、412:フィールド
種別欄、4]3:記入方法欄、414:文字種欄、41
5・枠位置の初期値槽、416:行数欄、417:行当
り枠数種、418・枠のサイズ欄、419:粋のピッチ
欄、420処理内容欄、3111:フィールド番号「l
」。 3121〜3122:フィールド位置座標「Xl」〜r
yiJ、3131〜3132:フィールドサイズrSX
iJ〜rSYjJ。 第 2 図(その2) 第 3 図(そのl) 1 第 図(その2) b1 122 Y軸

Claims (1)

    【特許請求の範囲】
  1. (1)予め規定した位置と個数の文字記入領域を有する
    第1の帳票を電子的に走査して、該文字記入領域内に記
    入された文字を、画素の集合である第1のイメージ情報
    として読み取り、記憶し、さらに、上記文字記入領域内
    への文字の種類と記入方法を予め規定した規約に基づき
    、上記記憶した第1のイメージ情報から文字を認識し、
    そして、上記文字記入領域の文字に対する処理方法を予
    め規定した規約に基づき、上記認識した文字の処理方法
    を認識することにより、上記第1の帳票を認識する帳票
    認識装置の帳票認識方法において、任意の位置と個数の
    文字記入領域を有する第2の帳票上のそれぞれの文字記
    入領域の配置構成を表すデータを格納する帳票レイアウ
    トデータ格納手段と、該帳票レイアウトデータ格納手段
    に格納された上記文字記入領域のそれぞれに対応して、
    該文字記入領域に記入する任意に規定した文字の種類と
    記入方法に関する規約を表すデータと、該文字記入領域
    に記入する文字に対する任意に規定した処理方法に関す
    る規約を表すデータとを格納する文字記入領域属性デー
    タ格納手段、そして、画素の集合として記憶したイメー
    ジ情報を文字記入領域単位で記憶する第1のバッファメ
    モリと、文字単位で記憶する第2のバッファメモリとを
    有し、上記帳票レイアウトデータ格納手段に格納したデ
    ータを参照して、上記第2の帳票の電子的走査により読
    み取り記憶したイメージ情報を文字記入領域単位に読み
    出すステップと、該文字記入領域単位に読み出したイメ
    ージ情報を、第2のイメージ情報として、上記第1のバ
    ッファメモリに記憶するステップと、さらに、上記文字
    記入領域属性データ格納手段の文字の記入方法に関する
    規約を表すデータを参照して、該第1のバッファメモリ
    に記憶した第2のイメージ情報を文字単位に分解して読
    み出すステップと、該文字単位に読み出したイメージ情
    報を、第3のイメージ情報として、上記第2のバッファ
    メモリに記憶するステップと、上記文字記入領域属性デ
    ータ格納手段の文字の種類に関する規約を表わすデータ
    を参照して、該第2のバッファメモリに記憶した第3の
    イメージ情報から文字を認識するステップと、そして、
    上記文字記入領域属性データ格納手段の文字に対する処
    理方法に関する規約を表すデータを参照して、該認識し
    た文字に対する処理方法を認識するステップとを含むこ
    とを特徴とする帳票認識装置の帳票認識方法。
JP2099608A 1990-04-16 1990-04-16 帳票認識装置の帳票認識方法 Pending JPH03296883A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2099608A JPH03296883A (ja) 1990-04-16 1990-04-16 帳票認識装置の帳票認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2099608A JPH03296883A (ja) 1990-04-16 1990-04-16 帳票認識装置の帳票認識方法

Publications (1)

Publication Number Publication Date
JPH03296883A true JPH03296883A (ja) 1991-12-27

Family

ID=14251811

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2099608A Pending JPH03296883A (ja) 1990-04-16 1990-04-16 帳票認識装置の帳票認識方法

Country Status (1)

Country Link
JP (1) JPH03296883A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8805074B2 (en) 2010-09-27 2014-08-12 Sharp Laboratories Of America, Inc. Methods and systems for automatic extraction and retrieval of auxiliary document content

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8805074B2 (en) 2010-09-27 2014-08-12 Sharp Laboratories Of America, Inc. Methods and systems for automatic extraction and retrieval of auxiliary document content

Similar Documents

Publication Publication Date Title
US5208869A (en) Character and pattern recognition machine and method
US5504822A (en) Character recognition system
US5664027A (en) Methods and apparatus for inferring orientation of lines of text
Fujisawa et al. Segmentation methods for character recognition: from segmentation to document structure analysis
US7437001B2 (en) Method and device for recognition of a handwritten pattern
US4685142A (en) Method and device for handwritten letter recognition
JP3452774B2 (ja) 文字認識方法
EP0546343B1 (en) Diagram recognizing system
JP2713622B2 (ja) 表形式文書読取装置
CN112508011A (zh) 一种基于神经网络的ocr识别方法及设备
US6549662B1 (en) Method of recognizing characters
JPH0581473A (ja) プログラムの作成方法
US7133556B1 (en) Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition
RU2707320C1 (ru) Способ распознавания символа на банкноте и сопроцессор для вычислительной системы устройства для обработки банкнот
JPH03296883A (ja) 帳票認識装置の帳票認識方法
WO1988002157A1 (en) Character and pattern recognition machine and method
JPH09319824A (ja) 帳票認識方法
JPH10302025A (ja) 手書き文字認識装置およびそのプログラム記録媒体
CN112183538B (zh) 一种满文识别方法及系统
CN113435331B (zh) 图像文字识别方法、系统、电子设备及存储介质
Nagane et al. Segmentation of characters from degraded Brahmi script images
Sarnacki et al. Character Recognition Based on Skeleton Analysis
JPS62290984A (ja) パタ−ン情報入力用紙、及び、該用紙を用いたパタ−ン情報認識方法
Chaudhuri et al. An approach for processing mathematical expressions in printed document
KR100234028B1 (ko) 문자인식 시스템의 문자영역 구분방법