JPH09274634A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH09274634A
JPH09274634A JP10632996A JP10632996A JPH09274634A JP H09274634 A JPH09274634 A JP H09274634A JP 10632996 A JP10632996 A JP 10632996A JP 10632996 A JP10632996 A JP 10632996A JP H09274634 A JPH09274634 A JP H09274634A
Authority
JP
Japan
Prior art keywords
item
storage unit
content
contents
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10632996A
Other languages
English (en)
Inventor
Koji Kasai
幸治 笠井
Kiyoshi Atsumi
季代史 渥美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP10632996A priority Critical patent/JPH09274634A/ja
Publication of JPH09274634A publication Critical patent/JPH09274634A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

(57)【要約】 【課題】 文字認識装置が読み取ることができるとして
定型されている帳票ではない、様々な形式の帳票に記入
されている文字、図形、記号等を読み取る。 【解決手段】 検索部3が、読込部1が読み込んだ帳票
の画像データについて、第一の記憶部2に記憶されてい
るメイン・テーブルと第一の情報とに基づき、読み取る
べき項目を検索し、認識部4が、第一の記憶部2に記憶
されている第二の情報に基づき、項目の内容を認識し、
その認識された項目の内容を第二の記憶部5に格納し、
出力部6が、その格納された項目の内容を印刷したり、
表示したりする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、帳票等に印刷また
は記入されている文字や記号等を認識する文字認識装置
に関し、特に、形式が規格化あるいは標準化されていな
い様々な種類の帳票に印刷または記入された文字や記号
等を認識する文字認識装置に関する。
【0002】
【従来の技術】従来から、銀行等の金融機関では、入金
や振込みを窓口で手続きしようとする利用者は、備え付
けの帳票に、入金年月日、入金の口座番号、入金額、あ
るいは、振込指定日、振込先の口座番号、振込額等の項
目の内容を記入する。これら帳票に記入すべき項目は、
手続きの内容により相違する。従って、利用者によって
帳票に記入された内容を認識する文字認識装置が、それ
らの内容を迅速かつ正確に認識できるようにするべく、
予め、帳票の形式を文字認識装置に登録している。より
具体的には、入金用帳票、振込用帳票等の種類毎に、帳
票に番号を付与し、その番号の付与された帳票に対しど
のような処理をすべきかという情報を、予め、文字認識
装置に登録しておく。文字認識装置では、帳票に記入さ
れた内容を認識する前に、帳票に印刷されたそれらの番
号から帳票の種類を割り出し、登録されている処理に関
する情報を参照することにより、帳票に記入された内容
を認識するのに必要な情報である、どのような項目の内
容を認識すべきか、どのような位置に記入されるか、ど
の程度の大きさで記入されるか等を知ることができる。
これにより、文字認識装置は、帳票に記入された文字や
記号等を迅速かつ正確に認識することが可能となる。
【0003】
【発明が解決しようとする課題】しかしながら、金融機
関の利用者の中には、金融機関に備え付けられた帳票を
使用せず、自己の会社や事務所の中で扱い易いような帳
票を独自に作成し、その帳票を用いて金融機関と取引き
をしようとする者がいる。これら独自な帳票について
は、記入されている内容を認識するのに必要な情報が登
録されていない。従って、文字認識装置は、それらの帳
票に記入されている内容を認識することができない。そ
こで、それらの帳票に記入されている内容については、
金融機関の係員が、目視によってその内容を確認した後
に、備え付けの帳票であれば文字認識装置から認識され
た内容を受信するはずであるコンピュータに対し、その
確認した内容を手作業により入力する必要がある。一般
に、これら独自の帳票を用いる利用者は、社員数の多い
企業や学生数の多い学校等であるため、このような手作
業による入力は、金融機関の係員に、単に多くの時間を
費やさせてしまうだけでなく、記入された内容の誤認や
確認した内容の誤入力を少なからず生じさせてしまうと
いう問題があった。
【0004】
【課題を解決するための手段】
〈構成〉本発明は、以上の問題点を解決するために、次
の構成を採用する。本発明に係る文字認識装置は、帳票
に記入されている内容を画像データとして読み込む読込
部と、帳票から読み取るべき項目が列挙されたメイン・
テーブル、並びに、それらの項目を検索するために必要
な第一の情報と項目の内容を認識するために必要な第二
の情報とが列挙されたサブ・テーブルを記憶する第一の
記憶部と、画像データの中から、メイン・テーブルに列
挙された読み取るべき項目、並びに、サブ・テーブルに
列挙された第一の情報とに基づいて、読み取るべき項目
の位置を検索する検索部と、検索された項目と、サブ・
テーブルに列挙された第二の情報とに基づいて、項目の
内容を認識する認識部と、認識された項目の内容を記憶
する第二の記憶部と、記憶された項目の内容を出力する
出力部とからなることを特徴とする。
【0005】〈構成の内容〉以下、構成の内容について
説明する。読込部とは、帳票に予め印刷されている文
字、図形、記号、または、帳票に手書きで記入された文
字、図形、記号を、白画素と黒画素とからなる画像デー
タとして読み込む、例えば、CCD(Charge Coupled D
evice )等の固体撮像素子等からなる光電変換装置等を
いう。第一の記憶部とは、帳票から読み取るべき項目が
予め設定されているメイン・テーブル、帳票の画像デー
タから項目を検索するのに必要な情報(例えば、検索の
開始位置や項目名の一覧)、帳票の画像データから項目
の内容を認識するのに必要な情報(例えば、項目の属性
や項目内容の記載位置)を記憶する、例えば、HD(Ha
rd Disc )やCD−ROM(Compact Disc - Read Only
Memory )をいう。検索部とは、帳票の画像データか
ら、第一の記憶部に記憶されている情報に基づいて項目
を検索する、CPU(Central Processing Unit )、D
SP(Digital Signal Processor)等からなる回路をい
う。認識部とは、帳票の画像データから、検出された項
目の位置等に基づいて、項目の記載内容を認識する、C
PU、DSP等からなる回路をいう。第二の記憶部と
は、検索された項目の位置や認識された項目の記載内容
を格納する、RAM(Ramdom Access Memory)等からな
る回路をいう。出力部とは、第二の記憶部に格納された
項目の位置や項目の記載内容を出力する、例えば、ディ
スプレイやプリンタ等をいう。
【0006】〈作用、効果〉本発明の文字認識装置で
は、読込部が、帳票に印刷あるいは記入されている内容
を画像データとして読込み、検索部が、その画像データ
において、第一の記憶部に予め記憶されている、項目を
検索するのに必要な情報に基づいて、読み取るべき項目
を検索し、さらに、認識部が、その第一の記憶部に予め
記憶されている、項目の内容を認識するのに必要な情報
に基づいて、項目の内容を認識し、それらの検索の結果
や認識の結果が第2の記憶部に格納され、最後に、出力
部が、認識された項目の内容を出力する。従って、本発
明によれば、各帳票について、第一の記憶部に記憶され
ている情報に基き、読み取るべき項目を検索し、かつ、
その項目に記載されている内容を認識するので、形式が
統一されていない様々なタイプの帳票に印刷あるいは記
入されている内容を読み取ることができる。従って、従
来とは異なり、予め帳票の形式に関する情報、例えば、
帳票の大きさ、項目の正確な位置等を予め文字認識装置
に記憶させておく必要はなく、単に読み取るべき項目を
記憶させておくだけで足りるので、様々なタイプの帳票
の読み取りに適用することが可能となる。
【0007】また、第一の記憶部に、検索を開始する位
置を予め記憶させておくことにより、帳票上における位
置が概ね定まっている項目については、項目の位置を迅
速に検出することが可能となる。さらに、第一の記憶部
に、各項目に対し複数の項目の名称を予め記憶させてお
くことより、項目を検索したにも拘わらず、該当する項
目が検出されないという事態が生じることを低減するこ
とが可能となる。そして、第二の記憶部が、検索された
項目の位置を記憶し、認識部が、第二の記憶部に記憶さ
れた項目の位置と第二の情報とに基づいて、項目の内容
を認識することにより、同じ形式である多量の帳票を読
み取る場合に、項目を検索する処理を削除することが可
能となるので、全体の処理時間を短縮することが可能と
なる。同様に、第二の記憶部が、認識された項目内容の
位置を記憶し、認識部が、第二の記憶部に記憶された項
目内容の位置に基づいて、項目内容を認識することによ
っても、同じ形式である多量の帳票を読み取る場合に、
全体の処理時間を短縮することができることとなる。
【0008】
【発明の実施の形態】
〈文字認識装置の構成〉本発明の文字認識装置につい
て、実施の形態に沿って説明する。図1は、本発明の具
体例の文字認識装置のブロック図である。この文字認識
装置は、読込部1、第一の記憶部2、検索部3、認識部
4、第二の記憶部5、出力部6から構成されている。読
込部1は、帳票に記入されている文字や記号等を黒画素
と白画素とからなる2値画像データとして読み込む。第
一の記憶部2は、検索部3が、読み込まれた帳票の画像
データの中から、項目を検索するのに必要である、メイ
ン・テーブルm、サブ・テーブルs、プログラムpを記
憶している。検索部3は、それらのメイン・テーブル
m、サブ・テーブルs、プログラムpに基づいて、帳票
の画像データの中から、項目を検索する。認識部4は、
検索された項目とサブ・テーブルsとに基づいて、読み
取るべき項目の内容を認識する。第二の記憶部5は、検
索部3が検索した項目の位置と、認識部4が認識した項
目の内容を記憶する。そして、出力部6は、その記憶さ
れた項目の内容を図示しないプリンタ装置へ出力した
り、図示しないディスプレイ装置に表示したりする。
【0009】〈第一の記憶部〉次に、第一の記憶部2に
記憶されているメイン・テーブルm、サブ・テーブル
s、プログラムpについて説明する。図2は、メイン・
テーブルmの内訳を示す図であり、図3は、サブ・テー
ブルsの内訳を示す図であり、図4は、プログラムpの
内容、即ち、この文字認識装置の動作フローチャートを
示す図である。以下、それらの図に沿って説明する。
【0010】メイン・テーブルmには、帳票の中から読
み取るべき複数の項目が設定されている。項目として
は、『金融機関名』、『支店名』、『振込指定日』、
『振込金額』等がある。サブ・テーブルsには、メイン
・テーブルmに設定された項目を検索するのに必要な第
1の情報と検索された項目の内容を認識するのに必要な
第2の情報とが設定される。検索に必要な第1の情報と
しては、「検索の開始位置」、「項目名の一覧」があ
り、認識に必要な第2の情報としては、「項目内容の記
載位置」、「項目の属性」等がある。
【0011】ここで、「検索の開始位置」とは、帳票に
おいて項目を検索する際に、帳票のどの場所から検索を
開始するかを指定する情報である。〈左上〉、〈左
下〉、〈右上〉、〈右下〉の4つの中から指定されるこ
とになる。「項目名の一覧」とは、帳票の中から検索す
べき項目に関連する複数の項目名である。例えば、検索
すべき項目『金融機関』について、「項目名の一覧」を
構成する項目名は、〈金融機関〉、〈金融機関名〉、
〈銀行〉、〈銀行名〉等である。
【0012】「項目内容の記載位置」とは、検索された
項目の位置に対する、認識すべき項目内容の位置であ
る。例えば、〈右側〉、〈左側〉、〈下側〉、〈上側〉
等である。「項目の属性」とは、認識すべき項目内容の
文字の性質を示す情報である。例えば、〈漢字〉、〈数
字〉、〈アルファベット〉、〈ひらがな〉等である。
【0013】さらに、プログラムpとしては、後述する
ように、(1)読込部1が、帳票を読み込み、(2)検
索部3が、検索すべき項目と検索に必要な第一の情報と
に基づき、その項目を検索し、(3)認識部4が、その
検索された項目と項目の内容を認識するのに必要な第二
の情報とに基づき、項目の内容を認識し、(4)第二の
記憶部が、その認識された項目の内容を記憶し、(5)
出力部6が、その記憶された内容を出力するような命令
が記憶されている。
【0014】〈文字認識装置の動作〉次に、図4に示す
プログラムに基づき、図5に示す振込依頼書を処理する
場合における文字読取装置の動作について説明する。 ステップS10: 読取部1は、振込依頼書に印刷され
ている文字、図形、記号等、並びに、手書きで記入され
ている文字、図形、記号等を黒画素と白画素となる2値
画像データとして読み込む。 ステップS11: 検索部3は、第一の記憶部2に記憶
されているメイン・テーブルから、検索すべき最初の項
目として『金融機関』があることを知得する。
【0015】ステップS12: 検索部3は、第一の記
憶部2に記憶されている『金融機関』のサブ・テーブル
を参照することにより、「検索の開始位置」として〈左
上〉が設定されており、「項目名の一覧」の第1番めの
項目名に〈金融機関名〉が設定されていることを知得す
る。 ステップS13: 検索部3は、サブ・テーブルから知
得した〈左上〉、〈金融機関名〉の情報に基づいて、先
に画像データとして読み込んだ帳票上において、帳票の
〈左上〉に位置する画像データの部分から帳票の右下に
位置する画像データの部分へと、〈金融機関名〉という
文字を検索する。なお、文字を検索する際には、画像デ
ータを一定の大きさの枠ごとに切り出し、その枠の中に
ある黒画素と白画素との分布状況を、予め用意してある
辞書内の文字パターンと比較する。これにより、画素の
分布状況が、ある文字パターンに近似すれば、その枠内
の画像データをその文字、より正確にはテキスト文字に
置き換えることになる。
【0016】ステップS14: 帳票の画像データ上
で、第1番めの項目名〈金融機関名〉が検出された場合
には、検索部3は、「項目名の検出位置」として、その
項目名が検出された位置を、帳票の〈左上〉を原点とす
るX座標とY座標とで表す。そして、検索部3は、検索
が完了した旨を認識部4へ通知する。 ステップS15: 検索が完了した旨の通知を受けて、
認識部4は、再び項目『金融機関』のサブ・テーブルを
参照することにより、「項目内容の記載位置」として
〈右側〉が設定されており、「項目の属性」として〈漢
字・ひらがな〉が設定されていることを知得する。 ステップS16: 認識部4は、その項目名の検出位
置、項目内容の記載位置〈右側〉、項目の属性〈漢字・
ひらがな〉という3つの情報から、項目の内容を認識す
る。これにより、項目『金融機関』について「項目の記
載内容」として、〈山田銀行〉を取得できることにな
る。 ステップS17:認識部4は、この項目の記載内容〈山
田銀行〉を第二の記憶部5に格納する。なお、必要な場
合には、認識された「項目の記載内容」だけでなく、そ
の「項目の記載内容」を認識する元になった画像データ
をも第2の記憶部5に格納する。
【0017】ステップS18: 帳票の画像データ上
で、第1番めの項目名〈金融機関名〉が検出されない場
合には、検索部3は、ステップS12へ戻り、「項目名
の一覧」を参照することにより、第2番目の項目名とし
て〈金融機関〉を知得する。そして、ステップS13以
下の動作と同様な動作を繰り返すことになる。なお、
「項目名の一覧」に列挙された全ての項目名について検
索しても、帳票の画像データ上に同一な項目名を検出で
きないときには、認識部4は、読み取るべき項目『金融
機関』に関し有効な項目を検出できなかった旨を認識部
4に通知し、この通知を受けて、認識部4は、第2の記
憶部5の「項目の記載内容」覧に、有効な項目が検出で
きなかった旨を格納する。
【0018】ステップS19: 検索部3は、読み取る
べき項目『金融機関名』についての処理が終了すると、
メイン・テーブルにおいて、次の読み取るべき項目『支
店名』を知得する。そして、その項目『支店名』につい
ても、同様な動作を実行する。以下、同様にして、メイ
ン・テーブルに列挙されている読み取るべき項目『振込
指定日』、『振込金額』等を次々に検索することにな
る。そして、全ての項目について、「項目名の検出位
置」と「項目の記載内容」とが第2の記憶部5に格納す
る。これにより、図6に示すように、第2の記憶部5に
は、振込依頼書に関する、項目名の検出位置と項目の内
容とが格納されることになる。 ステップS20: 最後に、出力部6は、その「項目の
記載内容」を図示しないディスプレイ部で表示したり、
図示しない印刷部で印刷したりする。なお、必要に応じ
て、「項目の記載内容」を認識する元になった画像デー
タも併せて表示したり、印刷したりする。
【0019】なお、上記の具体例では、帳票毎に項目の
位置を検出し、その検出された「項目の位置」と、予め
設定されている「項目の記載内容の位置」とに基づい
て、「項目の記載内容」を認識している。従って、一の
帳票の形式と、その帳票の後に続く帳票の形式とが異な
っており、さらに、その後に続く帳票の形式も前二者の
帳票の形式とは異なるというように、様々な形式の帳票
を次々に読み取る場合であっても、各帳票に記載されて
いる内容を正確に読み取ることができる。
【0020】しかし、同じ形式である多量の帳票を連続
して読み取る場合には、各帳票を読み取る度に、位置が
同じである「項目の位置」を検索するのでは、無駄な重
複した処理を実行することになってしまう。そこで、こ
のような場合には、一枚めの帳票のみについて、項目の
位置を検索し、その項目の位置を記憶しておくようにす
る。または、その項目の位置と、あらかじめ設定されて
いる「項目の記載内容の位置」とから、「項目の記載内
容の絶対的な位置」を求め、この「項目の記載内容の絶
対的な位置」を記憶しておくようにする。これにより、
次に続く帳票については、項目の位置を検索することな
く、その記憶されている「項目の位置」と「項目の記載
内容の位置」とに基づき、または、「項目の記載内容の
絶対的な位置」だけに基づいて、「項目の記載内容」を
認識することが可能となる。その結果、項目の位置を何
度も検索するという重複する処理を避けることができる
ので、全ての帳票を読み取る時間短縮することが可能と
なる。
【図面の簡単な説明】
【図1】本発明の文字認識装置のブロック図である。
【図2】メイン・テーブルの内訳を示す図である。
【図3】サブ・テーブルの内訳を示す図である。
【図4】本発明の文字認識装置の動作フローチャートで
ある。
【図5】帳票を示す図である。
【図6】第2の記憶部に格納される内容を示す図であ
る。
【符号の説明】
1 読込部 2 第1の記憶部 3 検索部 4 認識部 5 第2の記憶部 6 出力部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 帳票に記入されている内容を画像データ
    として読み込む読込部と、 帳票から読み取るべき項目が列挙されたメイン・テーブ
    ル、並びに、それらの項目を検索するために必要な第一
    の情報と項目の内容を認識するために必要な第二の情報
    とが列挙されたサブ・テーブルを記憶する第一の記憶部
    と、 画像データの中から、メイン・テーブルに列挙された読
    み取るべき項目、並びに、サブ・テーブルに列挙された
    第一の情報とに基づいて、読み取るべき項目の位置を検
    索する検索部と、 検索された項目と、サブ・テーブルに列挙された第二の
    情報とに基づいて、項目の内容を認識する認識部と、 認識された項目の内容を記憶する第二の記憶部と、 記憶された項目の内容を出力する出力部とからなること
    を特徴とする文字認識装置。
  2. 【請求項2】 第一の記憶部が、第一の情報として、検
    索を開始する位置を指示する情報を記憶することを特徴
    とする請求項1記載の文字認識装置。
  3. 【請求項3】 第一の記憶部が、第一の情報として、一
    の項目について複数の項目名を記憶することを特徴とす
    る請求項1記載の文字認識装置。
  4. 【請求項4】 第二の記憶部が、検索された項目の位置
    を記憶し、認識部が、第二の記憶部に記憶された項目の
    位置と第二の情報とに基づいて、項目の内容を認識する
    ことを特徴とする請求項1記載の文字認識装置。
  5. 【請求項5】 第二の記憶部が、認識された項目の内容
    の位置を記憶し、認識部が、第二の記憶部に記憶された
    項目の内容の位置に基づいて、項目の内容を認識するこ
    とを特徴とする請求項1記載の文字認識装置。
JP10632996A 1996-04-03 1996-04-03 文字認識装置 Pending JPH09274634A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10632996A JPH09274634A (ja) 1996-04-03 1996-04-03 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10632996A JPH09274634A (ja) 1996-04-03 1996-04-03 文字認識装置

Publications (1)

Publication Number Publication Date
JPH09274634A true JPH09274634A (ja) 1997-10-21

Family

ID=14430872

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10632996A Pending JPH09274634A (ja) 1996-04-03 1996-04-03 文字認識装置

Country Status (1)

Country Link
JP (1) JPH09274634A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2136316A2 (en) 2008-06-20 2009-12-23 Fujitsu Frontech Limited Form recognition apparatus, method, database generation apparatus, method, and storage medium

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2136316A2 (en) 2008-06-20 2009-12-23 Fujitsu Frontech Limited Form recognition apparatus, method, database generation apparatus, method, and storage medium
US8891871B2 (en) 2008-06-20 2014-11-18 Fujitsu Frontech Limited Form recognition apparatus, method, database generation apparatus, method, and storage medium

Similar Documents

Publication Publication Date Title
US20160344860A1 (en) Document and image processing
JP4461769B2 (ja) 文書検索・閲覧手法及び文書検索・閲覧装置
JPH04321183A (ja) ファイリング装置の文書登録方法
JPH09274634A (ja) 文字認識装置
JP2020017149A (ja) 情報処理装置及び情報処理方法
JPH0126088B2 (ja)
US20030069895A1 (en) Visual indexing of displayable digital documents
JPH0516069B2 (ja)
CN101242465A (zh) 成像装置和用于控制该成像装置的方法
JPH09330363A (ja) 帳票読取装置
JPH0384681A (ja) 名刺情報の入力処理方法
JP2016062307A (ja) 情報表示装置、情報表示プログラムおよび情報表示方法
JP2806340B2 (ja) 帳票管理装置
JPH0511351B2 (ja)
JPH10154157A (ja) 電子ファイリングシステム
JP2560357Y2 (ja) 画像データ記憶装置
JPH06282630A (ja) ビデオidフォトシステム
JPH10111899A (ja) 帳票識別装置及び帳票処理システム
Kesh et al. Text Recognition and Medicine Identification by Visually Impaired People
JP2933178B2 (ja) 光学文字読取り装置における文字認識方法
JP2723159B2 (ja) イメ−ジ・キャラクタ変換法
JPH0384655A (ja) 電子手帳
JPS5983187A (ja) 漢字学習機
JPH08147329A (ja) 読み取りイメージ処理装置
JP2564828B2 (ja) Ocr文字印刷システム