JPH11259597A - フォーマット認識装置及び文字読み取り装置 - Google Patents

フォーマット認識装置及び文字読み取り装置

Info

Publication number
JPH11259597A
JPH11259597A JP10061806A JP6180698A JPH11259597A JP H11259597 A JPH11259597 A JP H11259597A JP 10061806 A JP10061806 A JP 10061806A JP 6180698 A JP6180698 A JP 6180698A JP H11259597 A JPH11259597 A JP H11259597A
Authority
JP
Japan
Prior art keywords
format
format recognition
pattern
character
recognition system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10061806A
Other languages
English (en)
Other versions
JP3573945B2 (ja
Inventor
Mikio Hasegawa
幹夫 長谷川
Hirohisa Goto
裕久 後藤
Kazuhiro Ishikawa
和弘 石川
Hiroo Saito
洋夫 齊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP06180698A priority Critical patent/JP3573945B2/ja
Publication of JPH11259597A publication Critical patent/JPH11259597A/ja
Application granted granted Critical
Publication of JP3573945B2 publication Critical patent/JP3573945B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 帳票種別番号のない帳票であってもそのフォ
ーマットを認識する。 【解決手段】 フォーマットが異なる複数の帳票それぞ
れの全体からそれぞれ抽出したパタンのデータを保持し
ている辞書51を備える。フォーマットが異なる複数の
帳票毎の特徴的な一部分からそれぞれ抽出したパタンの
データを予め保持している辞書53を備える。認識対象
の帳票全体のパタンを抽出し、そのパタンのデータを辞
書51中のパタンのデータと照合しこの帳票のフォーマ
ットを認識する第1のフォーマット認識系55を備え
る。この認識系55が1以上の候補帳票を示した場合に
動作する第2のフォーマット認識系57を備える。この
認識系57は、認識対象の帳票から、前記複数の候補帳
票毎の特徴的な一部分に相当するパタンを抽出する。さ
らに、このパタンのデータそれぞれを辞書53中のパタ
ンのデータと照合して、認識対象の帳票のフォーマット
を認識する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、帳票のフォーマ
ットの種別を認識するフォーマット認識装置と、帳票フ
ォーマットの種別を認識しその認識結果に応じた文字読
取りを行う文字読取り装置とに関する。
【0002】
【従来の技術】帳票には、文字記入領域の数、形状、大
きさおよび位置等(以下、フォーマットという。)が異
なる多種類の帳票がある。帳票から文字を読み取る場
合、この帳票がいかなるフォーマットの帳票かを認識し
て、そのフォーマットに合わせて文字を読み取る方が好
ましい。そうした方が、文字の読み取りを正確かつ高速
に行えるからである。
【0003】帳票のフォーマットを認識するための従来
技術の一例として、例えば文献1(「文字認識概論」、
橋本 新一郎 編著、オーム社、昭和57年3月20
日、p.203〜206)に開示された技術がある。
【0004】この文献1に開示された技術では、図16
に示したように、帳票11の一部分に、帳票種別番号1
3(図では、0123)を印刷している。一方、文字読
み取り装置は、帳票から文字を読み取るために必要な読
み取り制御データを、多種類の帳票毎に、予め記憶して
いる。ここで、読み取り制御データとは、帳票の文字記
入領域それぞれの位置情報や、帳票に書かれている文字
種や字体に関する情報等である。
【0005】そして、文字読み取り装置は、帳票に印刷
されている帳票種別番号を読み取るために文字認識をす
る。さらに、該認識した番号により、該帳票に対応する
読み取り制御データを読み出す。そして、文字読み取り
装置は、この制御データに基づいて、帳票のイメージデ
ータから、文字の読み取りすなわち文字認識を行う。
【0006】
【発明が解決しようとする課題】しかしながら、帳票の
中には帳票識別番号が印刷されていないものもある。例
えば、振り込み依頼書などのような私製の帳票や、市販
の一般伝票である。すると、このような帳票の場合、従
来の文字読み取り装置では、読み取り制御データを利用
することができないという問題点がある。
【0007】従って、帳票種別番号が印刷されていない
帳票でもそのフォーマットを認識できるフォーマット認
識装置の実現が望まれる。
【0008】また、帳票種別番号が印刷されていない帳
票でもそのフォーマットを認識でき、かつ、このフォー
マット認識結果を利用して帳票から文字を読み取ること
ができる文字読み取り装置が望まれる。
【0009】
【発明を解決するための手段】(1)そこで、この出願
のフォーマット認識装置の第1の発明によれば、帳票の
フォーマットを認識する装置において、第1のフォーマ
ット認識系と第2のフォーマット認識系とを具える。た
だし、第1のフォーマット認識系は、認識対象の帳票の
全体の特徴を抽出し、この特徴を既存の帳票の全体の特
徴データと照合して、認識対象の帳票のフォーマットを
認識する系である。また、第2のフォーマット認識系
は、認識対象の帳票の一部の特徴を抽出し、この特徴を
既存の帳票の一部(以下、「特徴的な一部分」ともい
う。)の特徴データと照合して、認識対象の帳票のフォ
ーマットを認識する系である。
【0010】このフォーマット認識装置の第1の発明に
よれば、帳票の全体(第2のフォーマット認識系が動作
する場合は帳票の全体および帳票の一部)を、パタンマ
ッチングに用いる。そして、認識対象の帳票のフォーマ
ットが、既存のいずれの帳票のフォーマットに該当する
かを、パタンマッチング手法により判断する。そのた
め、帳票種別番号が印刷されていない帳票であっても、
その帳票のフォーマットを認識することができる。
【0011】また、このフォーマット認識装置の第1の
発明の場合、第2のフォーマット認識系を具えているの
で、以下の様な独特の作用が得られる。
【0012】既存の各種の帳票の中には、例えば、一部
分のみが異なるような帳票が在る。例えば図1(A)に
示した帳票15と、図1(B)に示した帳票17との関
係のように、罫線L1が在るか無いかという点を除いて
罫線の配置が同じで、かつ、それぞれが異なる特徴的な
図形(図の例では、帳票15は五角形の図形、帳票17
は星型の図形)を有した帳票が在る。また、図2(A)
に示した帳票21と、図2(B)に示した帳票23との
関係のように、罫線L1の位置のみが異なりそれ以外の
罫線の配置が同一であるような帳票が在る。この種の帳
票を識別する場合で、例えば、この帳票(認識対象の帳
票)に汚れがあったり、折れ目があったり、また、罫線
がかすれていたりした場合等は、この帳票全体から抽出
されるパタンは、例えば、帳票15と帳票17との中間
のような罫線パタン、帳票21と帳票23との中間のよ
うな罫線パタンになり易い。すると、この罫線パタンを
第1のフォーマット認識系のみを用いて照合した場合、
帳票15(21)のフォーマットであるという第1の認
識結果および帳票17(23)のフォーマットであると
いう第2の認識結果(もちろん3以上の結果があっても
良い。)が、それぞれ、第1のフォーマット認識系に予
め設定されている判断基準を満足してしまって、認識結
果とされてしまうことがある。すなわち、複数の認識結
果が出力される場合がある。しかも、真の認識結果でな
い方の結果が、第1位のフォーマット認識結果となって
しまうことがある。
【0013】すると、このフォーマット認識結果を用い
て、例えば文字読み取りのための読み取り制御データを
読み出した場合、適正な読み取り制御データでない場合
も生じる。そして、そのような場合は、文字読み取りを
所望の通りに行えない。
【0014】この様なとき、この出願のフォーマット認
識装置の第1の発明では、第2のフォーマット認識系を
用いて帳票の特徴的な一部分に着目した第2のフォーマ
ット識別が行えるので、正確なフォーマット認識が行え
る。
【0015】なお、このフォーマット認識装置の第1の
発明を実施するに当たり、第2のフォーマット認識系
は、第1のフォーマット認識系が所定個数以上の候補を
出力した場合に動作する認識系とするのが好ましい。た
だし、ここでいう所定個数とは1または2以上の任意の
数である。
【0016】こうすれば、第1のフォーマット認識系の
結果をさらに補完できると考えられる。また、第1のフ
ォーマット認識系で1つも候補が得られない場合は、第
2のフォーマット認識系を動作させることなく、その旨
を例えばオペレータに通報する等した方が、認識処理を
効率的に実行できると考えられるからである。
【0017】または、前記第2のフォーマット認識を、
第1のフォーマット認識系が所定個数未満の候補を出力
した場合は、認識対称の帳票の一部の特徴と、既存の帳
票の全ての帳票毎の一部の特徴データとの照合をして、
認識対象の帳票のフォーマットを認識し、第1のフォー
マット認識系が所定個数以上の候補を出力した場合は、
該出力された帳票毎の一部の特徴データと認識対称の帳
票の一部の特徴との照合をして、認識対象の帳票のフォ
ーマットを認識する認識系としても良い。こうした場合
は、第1のフォーマット認識系が候補を挙げた場合、挙
げない場合それぞれで、第2のフォーマット認識系によ
る効果的なフォーマット認識が行える。なお、このよう
にする場合は、第2のフォーマット認識系による照合等
を行う前に、候補としての既存の全ての帳票それぞれの
第1のフォーマット認識結果として、第1のフォーマッ
ト認識系での閾値(候補を選択する閾値)以上の所定値
を強制的に設定するのが良い。なぜなら、後に詳細は説
明するが、第2のフォーマット認識系での候補帳票の並
べ替えのための初期設定を確保するためである。
【0018】また、このフォーマット認識装置の第1の
発明を実施するに当たり、第1および第2のフォーマッ
ト認識系でそれぞれ用いる特徴データを、辞書に予め用
意しておくのが好適である。こうすれば、例えば、迅速
な処理が可能となるからである。そこで、この発明を実
施にするに当たり、帳票の全体の特徴データを保持して
いる第1の辞書と、既存の帳票の一部の特徴を保持して
いる第2の辞書とをフォーマット認識装置に設けて置く
のが好ましい。
【0019】また、このフォーマット認識装置の第1の
発明を実施するに当たり、第2のフォーマット認識系
は、既存の帳票上の、特徴データを得た領域(すなわち
特徴的な一部分)の位置情報を予め保持していて、か
つ、認識対象の帳票の、該位置情報で特定される一部か
ら、特徴を抽出する認識系であるのが好ましい。こうす
ると、認識対象の帳票の、既存の帳票の特徴的な一部分
に対応する領域を、容易に特定できる。もちろん、既存
の帳票を複数用意する場合(典型的にはこのような場合
がほとんど)、各既存の帳票毎の、特徴データを得た領
域の位置情報を第2のフォーマット認識系はそれぞれ保
持するのが良い。また、1つの帳票上に特徴的な一部分
を複数箇所設定する場合は、これら複数箇所それぞれの
位置情報を保持するのが良い。なお、このような位置情
報は辞書(例えば上述の第2の辞書)に保持しておくの
が好ましい。
【0020】また、帳票の特徴的な一部分をどのような
ものとするかは、任意である。しかし、この帳票の特徴
的な一部分を、帳票の所定箇所(具体的には1箇所また
は複数箇所)に存在する特徴的な1又は複数の図形(例
えば、ロゴ、任意のマーク、文字じパタン等。図1参
照)とするのが良い。帳票には例えば会社のロゴ等が記
載されていることが多い。このような特徴的な図形に着
目すると、帳票の種別区分けがし易いと考えられるから
である。
【0021】または、帳票の特徴的な一部分を、罫線を
有する帳票の場合の、特徴的な罫線が存在する1又は複
数箇所(例えば、図2(A)、(B)中の罫線L1が存
在する箇所)とするのが好ましい。帳票は罫線を含むこ
とが多い。しかも、各帳票はそれぞれ特徴的な罫線部分
を含むことが多い。この特徴的な罫線部分に着目する
と、帳票の種別区分けがし易いと考えられるからであ
る。
【0022】または、帳票の特徴的な一部分を、帳票の
所定箇所(具体的には1箇所または複数箇所)に存在す
る特徴的な1又は複数の文字(例えば図11(A)、
(B)中の「○電気」や「△△電気」)とするのが好ま
しい。帳票に記されている会社名等は、帳票の種別区分
けがし易いと考えられるからである。
【0023】なお、帳票の特徴的な一部分を帳票上の文
字とする場合は、第2のフォーマット認識系を以下のよ
うな認識系とするのが好ましい。
【0024】すなわち、既存の帳票の特徴データとして
前記特徴的な文字の文字名を予め保持している構成とす
る。然も、この第2のフォーマット認識系は、認識対象
の帳票の、既存の帳票の特徴的な文字が書かれていた領
域に対応する領域から、文字を切り出す(もちろん、こ
の領域に文字が存在しない場合もある。)。そして、こ
の切り出した文字を文字認識して文字名を得る。そし
て、既存の帳票の特徴データとして予め保持してある文
字名と照合して、フォーマットを認識する構成とする。
【0025】また、場合によっては、従来技術で説明し
た帳票種別番号を、帳票の特徴的な一部分として用いて
も良い。ただし、この場合は、この帳票種別番号を文字
認識するのではなくパタンマッチング用の特徴的なパタ
ンとして扱って、本発明を適用する。
【0026】また、帳票の特徴的な一部分を1つの帳票
上に複数箇所すなわち2箇所以上設定する場合があって
も良い。こうすると、照合箇所が増えるので、その分、
フォーマット認識精度が向上する。
【0027】また、このフォーマット認識装置の第1の
発明を実施するに当たり、第1のフォーマット認識系が
抽出する特徴および第1のフォーマット認識系が照合に
用いる特徴データは、両者が同じ方式で帳票全体から抽
出されれば、特に限定されない。しかし、第1のフォー
マット認識系を、帳票全体の罫線パタンを抽出する認識
系とするのが良い。かつ、既存の帳票の特徴データとし
て既存の帳票の全体の罫線パタンによる特徴データを用
いる認識系とするのが良い。なぜなら、一般に、帳票は
罫線を含む。さらに、罫線は帳票の構造を特徴づける顕
著なパラメータである。従って、罫線パタンに着目して
第1段階のフォーマット認識を行うと、かなりの精度で
帳票のフォーマットを認識できるからである。
【0028】なお、帳票の罫線パタンに着目して帳票の
フォーマットを認識しようとする装置は、この出願人に
係る特開平9−259221号に開示されている。
【0029】また、このフォーマット認識装置の第1の
発明を実施するに当たり、第1のフォーマット認識系が
出力する候補帳票および第2のフォーマット認識系が出
力する候補帳票の一方又は双方を表示する表示部と、該
表示部に表示された帳票から1若しくは複数の帳票を選
択するための指示、又は、該当なしという指示を入力す
る入力部とをさらに具えた構成とするのが好適である。
【0030】この様な表示部および入力部を具えた構成
とすると、フォーマット認識装置が自動的に認識したフ
ォーマットの正否をオペレータは確認することができ
る。そのため、より精度良く帳票フォーマットを認識で
きる。
【0031】また、このフォーマット認識装置の第1の
発明を実施するに当たり、照合のためのデータを特徴マ
トリクスとするのが良い。特徴マトリクスを用いると、
パタンの特徴を良好に表せ、しかも、効果的な照合(パ
タンマッチング)を行えるからである。なお、特徴マト
リクスをどのような方法で作成するかは特に限定されな
い。ただし、請求項17〜19で主張するような特徴マ
トリクスの作成方法は、この発明の目的から好ましい。
【0032】また、このフォーマット認識装置の第1の
発明では、帳票の全体の特徴の抽出の仕方が互いに異な
る2以上のフォーマット認識系により第1のフォーマッ
ト認識系を構成する場合があっても良い。また、帳票の
一部の特徴の抽出の仕方が互いに異なる2以上のフォー
マット認識系により第2のフォーマット認識系を構成す
る場合があっても良い。この第2のフォーマット認識系
を複数の認識系で構成する1つの例として、例えば、帳
票の一部分に存在する特徴的な図形に着目したフォーマ
ット認識系、帳票の一部の罫線に着目したフォーマット
認識系および帳票上の特徴的な文字に着目したフォーマ
ット認識系のうちの少なくとも2つの認識系で構成する
例を挙げることができる。
【0033】(2)また、この出願のフォーマット認識
装置の第2の発明(請求項23に記載の発明)によれ
ば、帳票のフォーマットを認識する装置において、認識
対象の帳票の一部の特徴を抽出し、該特徴を既存の帳票
の一部(特徴的な一部分)の特徴データと照合して、前
記認識対象の帳票のフォーマットを認識するフォーマッ
ト認識系を具えたことを特徴とする。
【0034】このフォーマット認識装置の第2の発明に
よれば、帳票の一部を、パタンマッチングに用いる。そ
して、認識対象の帳票のフォーマットが、既存のいずれ
の帳票のフォーマットに該当するかを、パターンマッチ
ング手法により判断する。そのため、帳票種別番号が印
刷されていない帳票であっても、その帳票のフォーマッ
トを認識することができる。然も、帳票の特徴的な一部
分のみに着目するので、フォーマット認識処理の高速化
が図れる。
【0035】なお、このフォーマット認識装置の第2の
発明を実施するに当たり、そのフォーマット認識系の構
成を、フォーマット認識装置の第1の発明の第2のフォ
ーマット認識系について上記のごとく説明した好適な構
成例と同様な構成とするのが好ましい。
【0036】また、この第2の発明の場合も、帳票の一
部の特徴の抽出の仕方が互いに異なる2以上のフォーマ
ット認識系によりフォーマット認識系を構成する場合が
あっても良い。
【0037】(3)また、この出願の文字読み取り装置
の第1の発明によれば、上述の第1の発明のフォーマッ
ト認識装置と、前記既存の帳票ごとの該帳票から文字を
読み取るために必要な読み取り制御データを保持してい
て、前記フォーマット認識装置の認識結果によって1又
は複数の制御データを出力する読み取り制御データメモ
リと、該読み取り制御データメモリから出力される読み
取り制御データに基づいて前記認識対象の帳票から文字
を認識する文字認識装置とを具えることを特徴とする。
【0038】この文字読み取り装置によれば、認識対象
の帳票に適切な制御データに基づいて、文字認識が行え
る。そのため、精度良くかつ効率良く文字認識が行え
る。
【0039】なお、この文字読み取り装置の第1の発明
を実施するに当たり、前記フォーマット認識装置の第2
のフォーマット認識系が、帳票の一部の文字に着目して
フォーマット認識をする認識系である場合、文字切り出
しや文字認識で使用される構成成分を、第2のフォーマ
ット認識系および文字認識系で兼用する構成とするのが
好適である。
【0040】すなわち、認識対象の帳票の画像データか
ら文字パタンを切り出すための文字切り出し部、該切り
出した文字を格納する文字パタンメモリ、文字認識辞
書、および、切り出した文字パタンを前記文字認識辞書
中のデータと照合して文字を認識する文字認識部とし
て、第2のフォーマット認識系および文字認識系で兼用
される、文字切り出し部、文字パタンメモリ、文字認識
辞書および文字認識部を具える構成とするのが好適であ
る。こうすると、こうしない場合に比べ、文字読み取り
装置のハードウエア規模およびソフトウエア規模を削減
できる等の効果が得られる。
【0041】(4)また、この出願の文字読み取り装置
の第2の発明によれば、上述の第2の発明のフォーマッ
ト認識装置と、前記既存の帳票ごとの該帳票から文字を
読み取るために必要な読み取り制御データを保持してい
て、前記フォーマット認識装置の認識結果によって1又
は複数の制御データを出力する読み取り制御データメモ
リと、該読み取り制御データメモリから出力される読み
取り制御データに基づいて前記認識対象の帳票から文字
を認識する文字認識装置とを具えることを特徴とする。
【0042】この文字読み取り装置によれば、認識対象
の帳票に適切な制御データに基づいて、文字認識が行え
る。そのため、精度良くかつ効率良く文字認識が行え
る。
【0043】
【発明の実施の形態】以下、図面を参照してこの発明の
フォーマット認識装置および文字読み取り装置の実施の
形態について説明する。なお、説明に用いる各図はこの
発明を理解することが出来る程度に各構成成分を概略的
に示してあるにすぎない。また、各図において同様な構
成成分については同一の番号を付して示し、その重複す
る説明を省略することもある。
【0044】1.フォーマット認識装置および文字読み
取り装置の第1の発明 1−1.第1の発明の概略説明 はじめに、第1の発明の概略について説明する。帳票に
は多種類の帳票がある。帳票のいくつかの例を、図1、
図2、図11を参照して説明する。
【0045】図1(A)および(B)は、フォーマット
が少しずつ異なる帳票群の第1の例として既存の帳票1
5,17を示した図である。図1(C)はフォーマット
が未知である認識対象の帳票19の例を示した図であ
る。いずれの帳票も帳票種別番号が印刷されていない例
である。認識対象の帳票19のフォーマットは帳票15
のフォーマットであると認識されれば、正解となる例で
ある。
【0046】帳票15と帳票17とは、罫線L1が在る
か無いかという点と、帳票の右上隅に互いに異なる特徴
的な図形が印刷されている点とを除いて同じフォーマッ
トとなっている。
【0047】また、図2(A)および(B)は、フォー
マットが少しずつ異なる帳票群の第2の例として既存の
帳票21,23を示した図である。図2(C)はフォー
マットが未知である認識対象の帳票25の例を示した図
である。いずれの帳票も帳票種別番号が印刷されていな
い例である。認識対象の帳票25のフォーマットは帳票
21のフォーマットであると認識されれば、正解となる
例である。
【0048】帳票21と帳票23とは、罫線L1の位置
が異なる点を除いて同じフォーマットとなっている。
【0049】また、図11(A)および(B)は、フォ
ーマットが少しずつ異なる帳票群の第3の例として既存
の帳票31,33を示した図である。図11(C)はフ
ォーマットが未知である認識対象の帳票35の例を示し
た図である。いずれの帳票も帳票種別番号が印刷されて
いない例である。認識対象の帳票35のフォーマットは
帳票31のフォーマットであると認識されれば、正解と
なる例である。
【0050】帳票31と帳票33とは、罫線L1が在る
か無いかという点と、帳票の右上隅に互いに異なる特徴
的な文字が印刷されている点とを除いて同じフォーマッ
トとなっている。すなわち、帳票31は、その左上隅に
罫線L1があり、かつ、帳票の右上隅に「○電気」とい
う特徴的な文字が印刷されている。帳票33は、罫線L
1がなく、かつ、その右上隅に「△△電気」という特徴
的な文字が印刷されている。
【0051】図1(A)〜図2(C)、図11(A)〜
(C)のいずれの帳票も、紙面aに、所定事項が記載さ
れる領域を区分する罫線が印刷された帳票である。そし
て、使用された帳票(図1(C)、図2(C)、図11
(C))には、書き込まれた文字の属性を表す文字(図
では01、02)と、所定事項を伝達するための文字
(図では、ABC、あいう、DEF、かきくけこ、アイ
ウエオカキクケコ)とが記載されている。
【0052】ここで、図1(A)〜図1(C)に示した
帳票15、17、19では、五角形または星形の図形を
含む所定領域Tが、帳票毎の特徴的な一部分(個別フォ
ーマット認識領域ともいう)といえる。なお、この帳票
15、19の場合、罫線L1も特徴的な一部分といえる
が、ここでは五角形の図形の部分を特徴的な一部分と考
える。
【0053】また、図2(A)〜図2(C)に示した帳
票21、23、25では、罫線の1本である罫線L1が
帳票の右上隅にあるか左上隅にあるかという点が特徴と
いえるので、この罫線L1を含む領域Tが、帳票毎の特
徴的な一部分(個別フォーマット認識領域)といえる。
【0054】また、図11(A)〜(C)に示した帳票
31,33,35では、○電気又は△△電気を含む所定
領域Tが、帳票毎の特徴的な一部分(個別フォーマット
認識領域)といえる。なお、この帳票31〜35の場
合、罫線L1も特徴的な部分といえるが、ここでは○電
気又は△△電気の部分を特徴的な部分と考える。
【0055】もちろん、この特徴的な図形、特徴的な罫
線、または特徴的な文字とは、上記の例に限られず、任
意の特徴的な図形(例えば矩形、円形、楕円形など)、
任意の特徴的な罫線または任意の特徴的な文字とでき
る。また、領域Tは1つの帳票に複数箇所の場合でも良
い。
【0056】ところで、図1(C)に示した認識対象の
帳票19は、帳票種別番号が印刷されていないが、この
帳票19の罫線パタンは、図1(A)に示した帳票15
と同じである。また、図2(C)に示した認識対象の帳
票25は、帳票種別番号が印刷されていないが、この帳
票25の罫線パタンは、図2(A)に示した帳票21と
同じである。また、図11(C)に示した認識対象の帳
票35は、帳票種別番号が印刷されていないが、この帳
票35の罫線パタンは、図11(A)に示した帳票31
と同じである。そのため、帳票の全体から抽出したパタ
ンを予め辞書中に用意したパタンと比較する方法、例え
ば、この出願の出願人に係る特開平9−259221号
公報に開示されている、帳票全体から抽出した罫線パタ
ンを予め用意した辞書と照合する方法により、帳票19
は帳票15と同じフォーマットの帳票であると認識で
き、帳票25は帳票21と同じフォーマットの帳票であ
ると認識でき、帳票35は帳票31と同じフォーマット
の帳票であると認識できる。
【0057】しかし、帳票19(帳票25、帳票35)
に、汚れがあったり、折り目があったり、また、罫線が
かすれていたりした場合等は、この帳票全体から抽出さ
れるパタンは、例えば、帳票15と帳票17との中間の
ような罫線パタン(帳票21(帳票31)と帳票23
(帳票33)との中間のような罫線パタン)になり易
い。すると、両者の識別はしずらくなる。
【0058】そこで、この出願の第1の発明では、帳票
全体のパタンを第1の辞書中の複数の帳票毎のパタンと
照合して認識対象の帳票のフォーマットを認識する第1
のステップと、複数の帳票毎の特徴的な一部分に対応す
るパタンを、認識対象の帳票からそれぞれ抽出して該パ
タンを第2の辞書中のパタンと照合して認識対象の帳票
のフォーマットを認識する第2のステップとを実施する
フォーマット認識装置と、該認識装置を含む文字読み取
り装置とを提案している。以下、説明する。
【0059】1−2.第1の実施の形態の装置40の構
成説明 先ず、図1を用いて説明した帳票群のフォーマットを認
識し、そして文字読み取りをするために好適な文字読み
取り装置の実施の形態(第1の実施の形態)について説
明する。
【0060】図3は、第1の実施の形態の文字読み取り
装置40の構成を概略的に示す機能ブロック図である。
この文字読み取り装置40は、第1の実施の形態のフォ
ーマット認識装置50と、読み取り制御データメモリ6
0と、文字認識系70と、制御部80と、表示部91
と、入力部93とを具えている。
【0061】また、この文字読み取り装置40には、帳
票(図示せず)を光学的に読み取る手段としての例えば
スキャナ95と、該スキャナ95が読んだ帳票のイメー
ジデータを格納する帳票イメージメモリ97とを、接続
してある。以下、各構成成分50〜93について詳細に
説明する。
【0062】フォーマット認識装置50は、第1の辞書
51と、第2の辞書53と、第1のフォーマット認識系
55と、第2のフォーマット認識系57と、制御部80
(文字読み取り装置40の制御部でもある)とで構成し
てある。
【0063】第1の辞書51(以下、フォーマット認識
辞書51ともいう)は、フォーマットが異なる既存の複
数の帳票それぞれの全体からそれぞれ抽出したパタンの
データを特徴データとして予め保持している。
【0064】フォーマットが異なる既存の複数の帳票
は、予め用意した任意の帳票とする。例えば、図1
(A)に示した帳票15、図1(B)に示した帳票17
を含む各種の帳票とすることが出来る。
【0065】また、この第1の辞書51は、パタンのデ
ータとして、各既存の帳票それぞれの全体からそれぞれ
抽出した罫線パタンのデータを保持している。さらに、
この第1の辞書51は、各帳票の種別を示す情報も保持
している。
【0066】第1の辞書51に保持される罫線パタンの
データは、読み取り装置40の仕様に応じた任意好適な
形態のものとできる。この実施の形態では、罫線パタン
を複数の領域に分割して得られる各領域の特徴で表され
る、特徴マトリクスとしてある。各分割領域の特徴をい
かなるものとするかも、任意である。例えば、罫線パタ
ンを予め複数の異なる方向に走査して方向パタンを抽出
し、そして、この罫線パタンをM×Nの複数領域に分割
して、各分割領域の方向パタン数を各領域の特徴とする
方法(例えば特開昭57−23185)が挙げられる。
【0067】第2の辞書53(以下、個別フォーマット
認識辞書53ともいう)は、フォーマットが異なる既存
の複数の帳票毎の特徴的な一部分からそれぞれ抽出した
パタンのデータを特徴データとして予め保持している。
図1の例でいえば、帳票15については五角形のパタン
のデータ、帳票17については星型のパタンのデータを
保持している。
【0068】これらパタンのデータは任意好適な形態で
第2の辞書53に格納できる。この実施の形態の場合
は、第2の辞書53に格納するパタンのデータとして、
帳票上に特徴的な一部分をいくつ設定したかという個数
(なお図1(A)、(B)の場合はそれぞれ1)、特徴
的な一部分の位置情報、大きさ、帳票の種別を示す情報
(これらを以下、個別フォーマット認識情報とい
う。)、およびパタンの特徴マトリクスを保持してい
る。
【0069】第1のフォーマット認識系55(以下、単
にフォーマット認識系ともいう)は、認識対象の帳票の
イメージデータから該帳票全体の特徴を抽出し、該抽出
した特徴を前記第1の辞書中の特徴データと照合して、
前記認識対象の帳票のフォーマットを認識する。具体的
には、この場合は、認識対象の帳票から抽出したパタン
の特徴マトリクスと、第1の辞書51中の特徴マトリク
スとを照合して、認識対象の帳票のフォーマットを認識
する。
【0070】なお、この実施の形態の第1のフォーマッ
ト認識系55は、認識対象の帳票全体のパタンとして、
罫線パタンを抽出する。そのため、この実施の形態の第
1のフォーマット認識系55は、認識対象の帳票から帳
票全体の罫線パタンを抽出する罫線抽出部55aと、抽
出された罫線パタンを格納する罫線パタンメモリ55b
と、抽出した罫線パタンを第1の辞書51と照合して認
識対象の帳票のフォーマットがいかなるものかを認識す
るフォーマット認識部55cとで構成してある。このよ
うな第1のフォーマット認識系55の詳細は、後の動作
説明にて説明する。このような第1のフォーマット認識
系55は、例えば、この出願に係る特開平9−2592
21号に開示されているフォーマット認識系により構成
できる。
【0071】第2のフォーマット認識系57(以下、個
別フォーマット認識系57ともいう)は、第1のフォー
マット認識系55が認識結果として所定個数以上(例え
ばここでは1以上の例を考える)の候補帳票(以下、候
補帳票を種別とかフォーマット候補ともいう)を示した
場合に動作する。そして、認識対象の帳票の一部の特徴
を抽出する。この実施の形態では、第1のフォーマット
認識系が挙げた前記1以上の候補帳票毎の前記特徴的な
一部分に相当するパタンの特徴を抽出し、該抽出した特
徴を前記第2の辞書中の特徴データと照合して、前記認
識対象の帳票のフォーマットを認識する。
【0072】この実施の形態の第2のフォーマット認識
系57は、認識対象の帳票のイメージデータから既存の
帳票の特徴的な一部分に対応するパタンを切り出す切り
出し部57a(以下、部分パタン切り出し部57aとい
う)と、該切り出した部分パタンを格納するメモリ57
b(以下、個別フォーマット認識パタンメモリ57bと
もいう)と、該切り出したパタンのデータを第2の辞書
53中のパタンのデータと照合して、認識対象の帳票の
フォーマットがいかなるフォーマットかを認識する認識
部57c(以下、個別フォーマット認識部57cとい
う)とで構成してある。
【0073】図4は、この第2のフォーマット認識系5
7の、特に個別フォーマット認識部57cの具体的な構
成例を説明する機能ブロック図である。もちろん、1例
であり他の構成でも良い。
【0074】この図4の場合の個別フォーマット認識部
57cは、線幅算出部101と、枠検出部103と、サ
ブパタン抽出部105と、特徴マトリクス作成部107
と、照合部109とで構成してある。各構成成分101
〜107の詳細は、後の動作説明の項で説明するが、簡
単にいえば次の通りである。
【0075】線幅算出部101は、認識対象の帳票から
部分パタン切り出し部57aが切り出したパタンの、す
なわち個別フォーマット認識パタンメモリ57bに格納
してあるパタンの、線幅を算出する。
【0076】枠検出部103は、認識対象の帳票から部
分パタン切り出し部57aが切り出したパタンに外接す
る枠(図形枠)を、検出する。
【0077】サブパタン抽出部105は、認識対象の帳
票から部分パタン切り出し部57aが切り出したパタン
を、複数の方向に走査して、各走査方向毎にサブパタン
を抽出する。この場合のサブパタン抽出部105は、水
平方向サブパタン(HSP)を抽出するHSP抽出部1
05aと、垂直方向サブパタン(VSP)を抽出するV
SP抽出部105bと、左斜めサブパタン(LSP)を
抽出するLSP抽出部105cと、右斜めサブパタン
(RSP)を抽出するRSP抽出部105dと、各サブ
パタンを格納するためのHSPメモリ105e、VSP
メモリ105f、LSPメモリ105gおよびRSPメ
モリ105hとで構成してある。
【0078】特徴マトリクス作成部107は、水平、垂
直、左斜めおよび右斜めの各走査方向毎に、サブパタン
から特徴を抽出し、各サブパタンの特徴から特徴マトリ
クスを作成する。
【0079】照合部109は、特徴マトリクス作成部1
07が作成した特徴マトリクスと、個別フォーマット認
識辞書53に格納してある各標準帳票の特徴マトリクス
とを用いて照合を行い、その結果に基づいて認識対象の
帳票と照合に用いた各標準帳票との確信度、距離を出力
する。
【0080】読み取り制御データメモリ60は、前記複
数の帳票ごとの、該帳票から文字を読み取るために必要
な読み取り制御データをそれぞれ格納している。読み取
り制御データとして、例えば、文字パタンの切出しに関
わるデータと、文字パタンの認識に関わるデータとを記
憶させる。
【0081】文字パタンの切出しに関わるデータとして
は、例えば帳票の紙面a上に存在する文字行の位置、帳
票紙面a上に存在するフィールドの位置及び個数、帳票
紙面a上に存在する文字のピッチ及び個数を挙げること
ができる。また、文字パタンの認識に関わるデータとし
ては、例えば帳票紙面a上に記載される文字の字種及び
字体を挙げることができる。もちろんこれらに限られな
い。
【0082】この読み取り制御データメモリ60は、フ
ォーマット認識装置40から出力される認識結果に応じ
た1又は複数のフォーマットについての読み取り制御デ
ータを、出力する。この出力された読み取り制御データ
は、この例の場合は、制御部80を介して文字認識系7
0に入力される。
【0083】文字認識系70は、読み取り制御データメ
モリ60から出力される読み取り制御データに基づいて
認識対象の帳票から文字を認識する。この文字認識系7
0は、任意好適な構成とすることができる。この実施の
形態では、文字認識系70を、文字切り出し部70a
と、文字パタンメモリ70bと、文字認識辞書70c
と、文字認識部70dとで構成してある。
【0084】文字切り出し部70aは、帳票イメージデ
ータから文字パタンを切り出す。文字パタンメモリ70
bは、文字切り出し部70aが切り出した文字パタンを
格納する。文字認識辞書70cは、文字の辞書データを
保持している。文字認識部70dは、切り出された文字
パタンから特徴を抽出し、この特徴を文字認識辞書70
c中のデータと照合して、該照合結果に基づいて文字パ
タンを認識する。
【0085】このような文字認識系は、例えば、この出
願に係る特開平9−259221号に開示されている文
字認識系により構成できる(詳細は後の動作説明にて説
明する)。
【0086】制御部80は、第1のフォーマット認識系
55の各構成成分55a〜55cと、第2のフォーマッ
ト認識系57の各構成成分57a〜57cと、読み取り
制御データメモリ60と、文字認識系70の各構成成分
70a〜70dと、表示部91と、入力部93と、スキ
ャナ95と、帳票イメージメモリ97とをそれぞれ制御
する。
【0087】表示部91は、文字読み取り装置40とオ
ペレータとの情報授受のための表示をする。この表示部
91はCRT等、任意好適な表示装置で構成できる。こ
の表示部91は、第1のフォーマット認識系55が出力
する候補帳票および第2のフォーマット認識系57が出
力する候補帳票の一方又は双方を表示する表示部として
も利用される。なお、複数の候補帳票(フォーマット候
補)は、一覧の状態で表示しても良いし、一部ずつ分け
て表示しても良い。
【0088】入力部93は、オペレータからの種々の指
示を、文字読み取り装置に入力する。この入力部93
は、キーボード、マウス等任意好適な装置で構成でき
る。この入力部93は、第2のフォーマット認識系57
が表示部91に複数のフォーマット候補を表示した際
は、該表示部91に表示された複数の帳票から1若しく
は複数の帳票を選択するための指示、又は、該当なしと
いう指示を入力する入力部としても利用される。
【0089】1−3.第1の実施の形態の装置40の動
作説明 (全体的な動作の概略説明)先ず、文字読み取り装置4
0の動作であって、全体的な動作について説明する。図
5はこの実施の形態の文字読み取り装置40の全体的な
動作の流れを示す図である。
【0090】まずスキャナ95により、認識対象の帳票
19のイメージデータを得る。そのため、スキャナ95
は、帳票19の紙面aを光学的に走査して、量子化され
た電気信号例えば白黒2値の電気信号から成る帳票イメ
ージデータを生成し、このデータを帳票イメージメモリ
97に格納する。ここでは線描画素を黒ビットで、背景
画素を白ビットで表す。なお、線描画素とは、帳票19
の紙面a内に在る線を表す画素のことであり、具体的に
はこの場合は黒ビットが所定数連なる部分のことであ
る。また背景画素は帳票19の紙面aの地の部分(線の
背景となる部分)を表す画素である。スキャナ95にセ
ットした帳票19を押さえる押え面は帳票19の紙面a
の地と同様に背景画素に変換される色例えば白色となっ
ており、従ってここでは押え面も白ビットで表わされ
る。
【0091】なお、帳票を押さえる押え面を帳票19の
紙面a内に在る線と同様に黒画素に変換される色例えば
黒色としても良い。
【0092】帳票イメージメモリ97に帳票イメージデ
ータが格納されると、制御部80は第1のフォーマット
認識系55の罫線抽出部55aを起動する(図5の開
始)。
【0093】起動された罫線抽出部55aは、帳票イメ
ージメモリ97に格納されている帳票イメージデータを
走査して、罫線パタンを抽出し(詳細は後述する)、抽
出した罫線パタンを罫線パタンメモリ55bに格納する
(図5のS1)。
【0094】罫線抽出部55aが罫線パタンの抽出を終
了すると、制御部80はフォーマット認識部55cを起
動する。
【0095】起動されたフォーマット認識部55cは、
罫線パタンメモリ55bに格納されている罫線パタン
を、フォーマット認識辞書51に格納されている帳票フ
ォーマットの辞書データと照合する(図5のS2)。該
照合の結果、所定個数以上(ここでは例えば1以上)の
候補帳票帳票があった場合は(図5のS3)、ステップ
S4以降の処理(詳細は後述する)をする。候補帳票が
1つも無かった場合は、その旨を、制御部80に出力す
る(S21)。この場合制御部80は、例えばリジェク
ト処理をする。
【0096】一方、第1のフォーマット認識系55での
認識において、1以上の候補帳票が出力された場合は、
制御部80は第2のフォーマット認識系57を起動す
る。そして、後に説明するように、帳票の一部に着目し
た照合をして認識対象の帳票のフォーマットを認識す
る。
【0097】ただし、第1のフォーマット認識系55で
の認識において1以上の候補帳票が示された場合であっ
ても、これら候補それぞれに対応した個別フォーマット
認識情報が個別フォーマット認識辞書53にない場合
は、第1のフォーマット認識系55で得た認識結果を制
御部80に出力する。なお、個別フォーマット認識辞書
53に格納するデータとして、フォーマット認識辞書5
1に格納してある標準帳票のデータを少なくとも格納し
ておけば、上記複数の帳票種別に対応した個別フォーマ
ット認識情報が個別フォーマット認識辞書53から得ら
れるので好ましい。
【0098】第1のフォーマット認識系55が挙げた候
補帳票の全部又は一部それぞれに対応した個別フォーマ
ット認識情報が個別フォーマット認識辞書53にあった
場合は、制御部80は、認識対象の帳票のイメージデー
タから各帳票毎の特徴的な一部分に対応する部分を切り
出すための位置情報を、個別フォーマット認識辞書53
からそれぞれ得る(図5のS5)。すなわち、認識対象
の帳票19に対して、例えば図1(A)の帳票15およ
び図1(B)の帳票17がフォーマット候補となってい
る場合であれば、帳票15、17各々の特徴的な一部分
Tに対応する部分を認識対象の帳票19のイメージデー
タから切り出すための位置情報を、個別フォーマット認
識辞書53から制御部80は得る。そしてこれを部分パ
タン切り出し部57aに入力する。
【0099】部分パタン切り出し部57aは、上記の位
置情報に基づいて、帳票イメージメモリ97から、パタ
ンを切出して、それを個別フォーマット認識パタンメモ
リ57bに格納する(図5のS6)。
【0100】部分パタン切り出し部57aがパタン切出
しを終了すると、制御部80は、個別フォーマット認識
部57cを起動する。起動された個別フォーマット認識
部57cは、個別フォーマット認識パタンメモリ57b
に格納されているパタンから特徴を抽出し、この特徴と
個別フォーマット認識辞書53に格納されている個別フ
ォーマット認識辞書の特徴データと照合する(図5のS
7)。1つの帳票中に特徴的な一部分Tを複数箇所定め
た場合は、その個数分、ステップS5から処理を繰り返
し、照合結果を得る(図5のS8)。
【0101】個別フォーマット識別を行なう種別毎に、
すなわち、複数のフォーマット候補毎に、上記処理(S
4〜S8)を繰り返す。
【0102】次に、制御部80は、個別フォーマット認
識系の照合結果に基づいて類似度の高い種別と判断する
順番に照合結果を入れ替えて(図5のS10)、その中
から一又は複数の種別を選択し、選択した種別を認識結
果とする。
【0103】制御部80が帳票フォーマットの認識結果
として一つの種別のみを入力する場合には、当該認識結
果に対応した読み取り制御データを読み取り制御データ
メモリ60から読み出し、読み出した読取り制御データ
を文字認識系70へ出力する(図5のS11)。
【0104】制御部80が帳票フォーマットの認識結果
として複数の種別を入力する場合には、これら認識結果
を確認するための情報を表示部91に表示できる構成と
するのが良い。そして、この情報を判断基準として、オ
ペレータが上記の複数の帳票の中から所望の帳票を選択
する指示又は該当なしの指示をできるように入力部93
を構成するのが良い。
【0105】例えば、制御部80は、帳票フォーマット
の認識結果に基づいて候補帳票を表示部91に表示させ
る。オペレータは、この表示を見て正しいと判断できる
認識結果を選択し、選択した認識結果を指示する信号
を、入力部93を介して、制御部80に入力する。
【0106】制御部80はオペレータが選択した認識結
果に対応する読取り制御データを読み取り制御データメ
モリ60から読み出し、これを文字認識系70へ出力す
る(図5のS11)。
【0107】この場合の読み取り制御データは、上述し
た様に、文字パタン切り出しのための制御データと、文
字パタンを認識するための制御データである。そのた
め、詳細には、制御部80は、文字パタンの切出しのた
めの制御データを文字切出し部70aへ、また文字パタ
ンの認識のための制御データを文字認識部70dへ出力
する。
【0108】次に制御部80は文字切出し部70a及び
文字認識部70dを起動する。すると文字切出し部70
aは、帳票イメージデータから、1文字単位に、文字パ
タンを切出し、切出した文字パタンを文字パタンメモリ
70bに格納する(図5のS12)。文字認識部70d
は、切出された文字パタンから特徴を抽出し、該特徴と
文字認識辞書70cの辞書データと照合し(図5のS1
3)、この照合結果に基づいて文字パタンを認識し、そ
の認識結果を制御部80へ出力する(図5のS14)。
【0109】制御部80は、1文字単位に、文字パタン
の認識結果を入力し、そして認識対象の帳票19の紙面
a上のすべての文字について認識を終了したか否かを判
定する(図5のS15)。
【0110】認識対象の帳票19上のすべての文字につ
いて認識を終了していなければ、文字切出し部70a及
び文字認識部70dは、制御部80の動作制御に従って
S11〜S14の処理を繰り返す。また帳票19の紙面
a上のすべての文字について認識を終了したならば、帳
票1枚分の文字読取りを終了し、帳票1枚につき得た文
字認識結果を後段の装置へ出力する(図5の終了)。
【0111】次に、各部の詳細な動作について説明す
る。
【0112】(罫線パタンの抽出動作)先ず、罫線抽出
部55aが行なう罫線パタンの抽出につき説明する。罫
線抽出部55aは、帳票イメージメモリ97内を帳票1
9全面にわたり走査し、帳票フォーマットを表す罫線パ
タンとして水平罫線パタンと垂直罫線パタンとを抽出す
る。
【0113】水平罫線パタンを抽出するときは、帳票イ
メージデータを水平走査し、水平走査線上で水平罫線閾
値TH(Lh)以上の長さLhだけ連続する帳票イメー
ジデータの線描画素を、水平罫線パタンの線描画素とし
て抽出する。連続する長さLhが水平罫線閾値TH(L
h)未満となる帳票イメージデータの線描画素(水平走
査線上で連続せずに孤立して存在する1個の線描画素を
含む)は、水平罫線パタンの背景画素として抽出する。
帳票イメージデータの背景画素もまた、水平罫線パタン
の背景画素として抽出する。水平罫線パタンはこのよう
にして帳票イメージデータから抽出した線描画素及び背
景画素から成るパタンである。
【0114】同様に垂直罫線パタンを抽出するときは、
帳票イメージデータを垂直走査し、垂直走査線上で垂直
罫線閾値TH(Lv)以上の長さLvだけ連続する帳票
イメージデータの線描画素を、垂直罫線パタンの線描画
素として抽出する。連続する長さLvが垂直罫線閾値T
H(Lv)未満となる帳票イメージデータの線描画素
(垂直走査線上で連続せずに孤立して存在する1個の線
描画素を含む)は、垂直罫線パタンの背景画素として抽
出する。帳票イメージデータの背景画素もまた、垂直罫
線パタンの背景画素として抽出する。垂直罫線パタンは
このようにして帳票イメージデータから抽出した線描画
素及び背景画素から成るパタンである。
【0115】なお、抽出した罫線パタンを罫線パタンメ
モリ55bに格納する場合、抽出した水平罫線パタン及
び垂直罫線パタンに共通の格納領域(以下、罫線共通格
納領域)を罫線パタンメモリ55bに設け、水平罫線パ
タン及び垂直罫線パタンを重ね合わせて罫線共通格納領
域に格納しても良い。また、抽出した水平罫線パタン及
び垂直罫線パタンの各パタン毎に個別の格納領域(以
下、罫線個別格納領域)を罫線パタンメモリ55bに設
け、水平罫線パタン及び垂直罫線パタンをそれぞれ別々
の罫線個別格納領域に格納するようにしても良い。
【0116】罫線共通格納領域に格納する場合には、罫
線共通格納領域全面に背景画素を格納し(罫線共通格納
領域の初期化)、然る後、抽出した水平罫線パタンの線
描画素を共通格納領域に格納すると共に抽出した垂直罫
線パタンの線描画素を共通格納領域に格納する。
【0117】また罫線個別格納領域に格納する場合に
は、水平罫線パタンに対し設けた罫線個別格納領域全面
に背景画素を格納し(罫線個別格納領域の初期化)、然
る後、水平罫線パタンに対し設けた罫線個別格納領域
に、抽出した水平罫線パタンの線描画素を格納する。ま
た垂直罫線パタンに対し設けた罫線個別領域全面に背景
画素を格納し(罫線個別格納領域の初期化)、然る後、
垂直罫線パタンに対し設けた罫線個別格納領域に、抽出
した垂直罫線パタンの線描画素を格納する。
【0118】図6はこの実施形態の罫線抽出部の動作の
説明に供する図であって、罫線パタンの線描画素を抽出
する動作に着目した動作の流れの具体的な一例を示す。
ここでは、抽出した水平罫線パタンと垂直罫線パタンと
を別々の格納領域に格納する場合について説明する。
【0119】この場合、帳票イメージメモリ97の帳票
イメージデータ格納領域上と罫線パタンメモリ55bの
罫線共通格納領域上とには、相対応させたx−y座標系
を設定してあり(例えば、水平方向をx軸方向及び垂直
方向をy軸方向とする。)、この座標系で表される画素
位置の格納領域から画素データを読み出し、或はまた、
この座標系で表される画素位置の格納領域へ画素データ
を書き込むことができるようになっているものとする。
【0120】制御部80により起動された罫線抽出部5
5aは、罫線パタンメモリ55bの罫線共通格納領域全
面にわたって背景画素ここでは白ビットを格納する(罫
線共通格納領域の初期化)。
【0121】然る後、罫線抽出部55aは走査方向を水
平方向として水平罫線パタンを抽出する処理を開始する
(図6開始)。この場合、閾値THとして水平罫線閾値
TH(Lh)を用い、また連続の長さLとして水平走査
線上で連続する線描画素の長さLhを求めることとな
る。
【0122】次に罫線抽出部55aは、連続の長さLを
零に初期化し(図6のS1)、然る後、帳票イメージメ
モリ97に格納されている帳票イメージデータを水平走
査し、帳票イメージデータの画素データを読み出す(図
6のS2)。画素データは1画素分のデータを表す。
【0123】次に罫線抽出部55aは、読み出した帳票
イメージデータの画素データが、線描画素ここでは黒ビ
ットであるか否かを判定する(図6のS3)。
【0124】S3で画素データが線描画素であるとの判
定結果を得た場合は、連続の長さLを求めると共に水平
罫線パタンに関する線描画素の候補位置(以下、水平罫
線候補位置)として当該画素データの画素位置を記憶し
(図6のS4)、然る後、帳票イメージデータにつき現
走査線1ラインの走査を終了したか否かを判定する(図
6のS5)。ここでは、S3で画素データが線描画素で
あるとの判定結果を得た場合に連続の長さLを1カウン
トアップすることによって従って連続する線描画素の個
数を計数することによって、連続の長さLを求める。
【0125】S5で現走査線1ラインの走査を終了して
いないとの判定結果を得た場合は、現走査線上の次の画
素データを読み出すべくS2に戻る。
【0126】S5の判定で現走査線1ラインの走査を終
了したとの判定結果を得た場合は、連続の長さLを閾値
THと比較する(図6のS6)。ここでは水平罫線パタ
ンを抽出する場合であるので求めた連続の長さLは水平
走査線上における連続の長さLhであり、そして閾値T
Hには水平罫線閾値TH(Lh)を用いることとなる。
【0127】S6で連続の長さLは閾値TH以上である
との判定結果を得た場合、罫線抽出部55aは長さLの
連続する線描画素を、罫線パタンメモリ55bに格納す
る(図6のS7)。ここでは記憶していた水平罫線候補
位置の罫線共通格納領域に線描画素を格納することとな
る。S7の次に、連続の長さLを初期化すると共に記憶
していた水平罫線候補位置を消去し(図6のS8)、然
る後、帳票19全面にわたって帳票イメージデータの走
査を終了したか否かを判定する(図6のS9)。またS
6で連続の長さLは閾値TH未満であるとの判定結果を
得た場合は、S7を行なわずにS8〜S9を行なう。
【0128】S9で帳票19全面にわたって帳票イメー
ジデータの走査を終了していないとの判定結果を得た場
合は、現走査線の次の走査線上に在る画素データを読み
出すべくS2に戻る。またS9で帳票全面にわたって帳
票イメージデータの走査を終了したとの判定結果を得た
場合は、当該帳票19から水平罫線パタンを抽出する処
理を終了する(終了)。
【0129】また、S3の判定で読み出した画素データ
は線描画素でないとの判定結果を得た場合、即ち、1ラ
インの端まで黒画素であった場合は、連続の長さLを閾
値THと比較する(図6のS10)。
【0130】S10で連続の長さLは閾値TH以上であ
るとの判定結果を得た場合、罫線抽出部55aは長さL
の連続する線描画素を、罫線パタンメモリ55bに格納
する(図6のS11)。次に、連続の長さLを零に初期
化すると共に記憶していた水平罫線候補位置を消去し
(図6のS12)、然る後、現走査線一ラインの走査を
終了したか否かを判定する(図6のS13)。現走査線
一ラインの走査を終了していなければ、現走査線上の次
の画素データを読み出すべくS2に戻る。、現走査線一
ラインの走査を終了したならば、S9を行なう。またS
10で連続の長さLは閾値TH未満であるとの判定結果
を得た場合は、S11を行なわずにS12〜S13を行
なう。
【0131】次に、罫線抽出部55aは走査方向を今度
は垂直方向として、垂直罫線パタンを抽出する処理を開
始する(開始)。この場合、閾値THとして垂直罫線閾
値TH(Lv)を用い、また連続の長さLとして垂直走
査線上で連続する線描画素の長さLvを求めることとな
る。それ以外の基本的な動作は、上記の水平罫線パタン
の抽出動作と同じであるので、その説明を省略する。
【0132】以上のようにして、図1(C)に示す帳票
19について水平及び垂直罫線パタンの線描画素を抽出
し、これらパタンの線描画素をそれぞれ別々の罫線個別
格納領域に格納した例を、図7に示す。
【0133】図7(A)中、110は水平罫線パタンに
対して設けた罫線個別格納領域、111は罫線個別格納
領域110において帳票紙面aに対応する領域、112
は水平罫線パタンを示す。また図7(B)中、113は
垂直罫線パタンに対して設けた罫線個別格納領域、11
4は罫線個別格納領域113において帳票紙面aに対応
する領域、115は垂直罫線パタンを示す。罫線個別格
納領域110、113内であって紙面対応領域111,
114の外の領域は、帳票19をスキャナ95にセット
したとき帳票19を押えた押え面を表わす色の画素ここ
では背景画素となる。
【0134】なお、抽出した水平罫線パタンおよび垂直
罫線パタンを共通の格納領域に格納する場合は、これら
罫線パタンを重ねた状態に格納領域に格納すれば良いの
で、ここではその説明を省略する。
【0135】(第1のフォーマット認識系での認識動
作)次に、第1のフォーマット認識系55の動作につい
て説明する。第1のフォーマット認識系55での帳票フ
ォーマットの認識に当っては、罫線抽出部55aは、帳
票フォーマット未知の帳票イメージデータを走査して、
上述のごとく罫線パタンを抽出する。そして、この抽出
された罫線パタンから、フォーマット認識部55cは、
例えば、上述した様な特開昭57−23185号に開示
の方法で特徴を抽出し、この抽出特徴を、帳票標準フォ
ーマットの各種別毎に、フォーマット認識辞書51に保
持してある特徴と照合する。
【0136】そして、フォーマット認識部55cは、こ
の照合において、一定の条件( 以下個別認識条件) を満
たした時にその種別のフォーマットを、認識対象の帳票
のフォーマット候補とする。
【0137】この個別認識条件は、任意好適な条件とで
きる。例えば、フォーマット認識部55cは帳票フォー
マットの種別を類似度の高い順に出力し、またそれぞれ
の種別毎に距離と確信度を出力する。ここで、距離、類
似度および確信度とは次のものである。フォーマット認
識辞書51に保持してある帳票標準フォーマットの特徴
と、認識対象の帳票のイメージデータから抽出した特徴
とを照合した結果が距離である。距離の大小が類似度で
あり、距離が小さいほど類似度が高い。また確信度は距
離を正規化して表わした数値であり、確信度が大きいほ
ど類似度が高い。
【0138】そして、これに限られないが、例えば、上
記の確信度が高い順から指定数分を、フォーマット候補
として選択するという第1の条件、また、上記の確信度
がある一定の値以上のものをフォーマット候補として選
択するという第2の条件、または、確信度の高い順に隣
接する種別の距離差を求め距離差がある一定の値以下ま
での候補をフォーマット候補として選択するという第3
の条件の少なくとも1つの条件を満たすものをフォーマ
ット候補としてを選択する。通常はこれらの基準を組み
合わせてフォーマット候補を選択する。
【0139】上記の条件を組み合わせてフォーマット候
補を選択する具体例について、以下、後に掲載した表を
参照して説明する。
【0140】表1は、フォーマット認識部55cが出力
した帳票標準フォーマット、確信度、距離を示した表で
ある。確信度の高い順にならべた表である。ここで個別
認識条件として確信度の高い順に所定個数分を選択す
る。ここでは確信度が上位6位までをフォーマット候補
として選択する例を考える。そのため、帳票標準フォー
マットA〜Fが、フォーマット候補として選択されてい
る。これら選択された候補を、以下、有効候補という。
【0141】次に、表2は、表1の個別認識条件にさら
に、帳票標準フォーマットの種別の確信度がある一定の
値以上のものを選択した例を示している。ここでは確信
度が90以上という条件を加えた例を示している。その
ため、帳票標準フォーマットA〜Eが選択される。
【0142】次に、表3は、表2の個別認識条件にさら
に、隣接する帳票標準フォーマットの種別の距離差を求
め、この距離差がある一定の値以下の候補を選択した例
を示している。ここでは距離差が30以下という条件を
加えた例を示している。そのため、帳票標準フォーマッ
トA〜Dが選択される。
【0143】(第2のフォーマット認識系での認識動
作)第1のフォーマット認識系55が、認識対象の帳票
に対して所定個数以上(ここでは例えば1以上)のフォ
ーマット候補を示した場合、第2のフォーマット認識系
57によるフォーマット認識動作が以下のように行われ
る。
【0144】既に説明した様に、第2の辞書である個別
フォーマット認識辞書53は、標準帳票毎の特徴的な一
部分のパタンデータを、予め保持している。
【0145】個別フォーマット辞書53に保持させるデ
ータの作成に当っては、既存の帳票を複数枚用意し、各
帳票毎に個別フォーマット認識に用いる領域T(図1等
参照)を設定し、帳票イメージデータから個別フォーマ
ット認識領域Tとした図形を切り出し、切り出した図形
を走査して特徴を抽出する。この特徴と、領域Tの位
置、大きさ、形状等を定義した情報を合わせて、帳票標
準フォーマットの各種別毎に個別に相対応付け、辞書デ
ータとして個別フォーマット認識辞書53に記憶させ
る。
【0146】なお、この個別フォーマット認識領域T
は、帳票上に複数設定しても良い。その場合は、帳票標
準フォーマットの種別に対応した個別フォーマット認識
辞書53に、複数の領域の特徴と位置、大きさ、形状等
を定義した情報を記憶させる。
【0147】個別フォーマット認識に当っては、第1の
フォーマット認識系55のフォーマット認識部55cが
出力した有効候補内の最終候補(例えば表3に示した候
補)から先頭候補に向かって順番に個別フォーマット認
識を、以下のように行う。
【0148】個別フォーマット認識系57の部分パタン
切り出し部57aは、個別フォーマット認識辞書53か
ら上記有効候補である帳票標準フォーマット種別に対応
した予め保存されている個別フォーマット認識領域Tに
関する情報を読み出す。個別フォーマット認識領域Tを
複数設定した場合は、これら領域に予め順位付けしてお
き、その順番で個別フォーマット認識を行うのが良い。
個別フォーマット認識の領域が設定されていない種別が
もしあった場合は、そのまま有効候補に残しておく。
【0149】部分パタン切り出し部57aは、帳票イメ
ージメモリ97から、上記の個別フォーマット認識領域
Tに当たる部分のイメージを切り出し、個別フォーマッ
ト認識パタンメモリ57bに格納する。個別フォーマッ
ト認識部57cは、個別フォーマット認識パタンメモリ
57bを走査して、該パタンから特徴部分のパタンを切
り出し、そして、切り出したイメージの特徴を抽出す
る。
【0150】この個別フォーマット認識部57cの動作
の詳細について、図4を参照して説明する。
【0151】フォーマット認識部57cの線幅算出部1
01は、個別フォーマット認識パタンメモリ57bに格
納してあるパタンについて、線幅Wを求める。ここでは
線幅算出部101は、個別フォーマット認識パタンメモ
リ57bに格納された図形パタンを、2×2窓を用いて
走査し、2×2窓のすべての点が線描画素となる状態の
回数Qと図形パタン中の線描画素総個数Aとを計数す
る。そして図形パタンの線幅wとしてw=A/(A−
Q)を求める。
【0152】枠検出部103は切り出された図形パタン
の線部分に外接する枠( 図形枠) を検出する。ここでは
図形枠の水平方向における左辺及び右辺の位置をXL及
びXR、垂直方向における上辺及び下辺の位置YU及び
YDとするとき、図形枠の左上頂点位置(XL,Y
U)、左下頂点位置(XL,YD)、右上頂点位置(X
R,YU)、右下頂点位置(XL、YD)となり、各位
置XL,XR,YU,YDを次のように検出する。
【0153】左辺位置XLの検出に当っては、垂直走査
線を左から右へ線順次に移動させて、各垂直走査線毎
に、捜査線上における線描画素の有無を判定し、線描画
素有りと最初に判定された垂直走査線の副走査線位置を
左辺位置XLとして検出する。また右辺位置XRの検出
に当っては、垂直走査線を右から左へ線順次に移動させ
て、各垂直走査線毎に、捜査線上における線描画素の有
無を判定し、線描画素有りと最初に判定された垂直走査
線の副走査線位置を右辺位置XRとして検出する。また
上辺位置YUの検出に当っては、水平走査線を上から下
へ線順次に移動させて、各水平走査線毎に、走査線上に
おける線描画素の有無を判定し、線描画素有りと最初に
判定された水平走査線の副走査線位置を上辺位置YUと
して検出する。また下辺位置YDの検出に当っては、水
平走査線を下から上へ線順次に移動させて、各水平走査
線毎に、走査線上における線描画素の有無を判定し、線
描画素有りと最初に判定された水平走査線の副走査線位
置を下辺位置YDとして検出する。
【0154】次に、HSP抽出部105aは、個別フォ
ーマット認識パタンメモリ57bに保持されている図形
パタンを水平方向に走査して、該パタンから水平サブパ
タンを抽出し、抽出した水平サブパタンをHSPメモリ
105eに格納する。
【0155】なお、図形パタンの線描画素のうち、水平
方向の走査線上で連続する長さLが図形閾値TH1以上
となる線描画素を水平サブパタンの線描画素として抽出
する。また図形パタンの線描画素のうち、水平方向の走
査線上で連続する長さLが図形閾値TH1未満となる線
描画素( 線描画素1個の場合を含む) と、図形パタンの
背景画素とをそれぞれ、水平サブパタンの線描画素とし
て抽出する。水平サブパタンの線描画素は、水平方向の
線に対応するものである。
【0156】また、VSP抽出部105bは、個別フォ
ーマット認識パタンメモリ57bに保持されている図形
パタンを垂直方向に走査して、 該パタンから垂直サブ
パタンを抽出し、抽出した垂直サブパタンをVSPメモ
リ105fに格納する。
【0157】なお、図形パタンの線描画素のうち、垂直
方向の走査線上で連続する長さLが図形閾値TH2以上
となる線描画素を、垂直サブパタンの線描画素として抽
出する。また図形パタンの線描画素のうち、垂直方向の
走査線上で連続する長さが図形閾値TH2未満となる線
描画素( 線描画素1個の場合を含む) と、図形パタンの
背景画素とをそれぞれ、垂直サブパタンの線描画素とし
て抽出する。垂直サブパタンの線描画素は、垂直方向の
線に対応するものである。
【0158】また、LSP抽出部105cは、個別フォ
ーマット認識パタンメモリ57bに保持されている図形
パタンを左斜め45度方向に走査して、該パタンから左
斜めサブパタンを抽出し、抽出した左斜めサブパタンを
LSPメモリ105gに格納する。
【0159】なお、図形パタンの線描画素のうち、左斜
め方向の走査線上で連続する長さLが図形閾値TH3以
上となる線描画素を、左斜めサブパタンの線描画素とし
て抽出する。また図形パタンの線描画素のうち、左斜め
方向の走査線上で連続する長さが図形閾値TH3未満と
なる線描画素( 線描画素1個の場合を含む) と、図形パ
タンの背景画素とをそれぞれ、左斜めサブパタンの線描
画素として抽出する。左斜めサブパタンの線描画素は、
左斜め45度方向の線に対応するものである。
【0160】また、RSP抽出部105dは切り出され
た図形パタンを右斜め45度方向に走査して、該パタン
から右斜めサブパタンを抽出し、抽出した右斜めサブパ
タンをRSPメモ105hに格納する。
【0161】なお、図形パタンの線描画素のうち、右斜
め方向の走査線上で連続する長さLが図形閾値TH4以
上となる線描画素を、右斜めサブパタンの線描画素とし
て抽出する。また図形パタンの線描画素のうち、右斜め
方向の走査線上で連続する長さが図形閾値TH4未満と
なる線描画素( 線描画素1個の場合を含む) と、図形パ
タンの背景画素とを、それぞれ右斜めサブパタンの線描
画素として抽出する。右斜めサブパタンの線描画素は、
右斜め45度方向の線に対応するものである。
【0162】図形閾値TH1〜TH4を任意好適に設定
することによって、図形パタンから水平、垂直、左斜
め、右斜めの各サブパタンを抽出できる。ここでは、上
記線幅wを基にしてTH1=N1・w、TH2=N2・
w、TH3=N3・w、TH4=N4・wというよう
に、図形閾値TH1〜TH4をそれぞれ設置している。
なお、N1〜N4は任意に設定される値である。これに
限られないが、例えば、N1=N2=N3=N4=2と
することができる。
【0163】図8に、図1(C)に示した認識対象の帳
票19の個別フォーマット認識領域Tから、垂直、水
平、右斜めおよび左斜めの各サブパタンVSP、HS
P、RSPおよびLSPを抽出した場合の例を示してあ
る。
【0164】次に、特徴マトリクス作成部107は、各
走査方向毎にサブパタンから特徴を抽出し、各サブパタ
ンの特徴から切り出された文字パタンの特徴マトリクス
を作成する。
【0165】この特徴マトリクス作成部107は、水平
サブパタンの図形枠に対応する領域をN×M個の領域に
分割し、各領域毎に特徴量lijを求め、こららN×M個
の特徴量lijからなるN×M次元の特徴マトリクスを作
成する。
【0166】特徴量lijは第i行第j列目の領域におい
て求めた特徴量を表わす。例えば、第i行第j列目の領
域における線描画素の総個数Bijと図形パタンについて
求めた線幅wとを用いて、lij=Bij/wを求める。同
様にして、垂直、左斜め、右斜めの各サブパタンについ
て、それぞれN×M次元の特徴マトリクスを作成する。
【0167】次に特徴マトリクス作成部107は、水
平、垂直、左斜め及び右斜めの各サブパタンについて作
成した特徴マトリクスから、図形枠の水平方向における
長さをΔX及び垂直方向における長さをΔY、特徴量l
ijを正規化して得た特徴量をL ijを求める。この特徴量
ijは、水平サブパタンについてはLij=lij/ΔX、
垂直サブパタンについてはLij=lij/ΔY、左斜めサ
ブパタンについてはLij=lij/(ΔX2 +ΔY2
1/2 となる。
【0168】次に、特徴マトリクス作成部107は、水
平、垂直、左斜め及び右斜めの各サブパタン毎に正規化
した特徴マトリクスを得ると、これら正規化した特徴マ
トリクスから成るN×M×4次元の特徴マトリクスfA
を作成し、特徴マトリクスfA を照合部109へ出力す
る。
【0169】照合部109は、切り出された図形パタン
の特徴マトリクスと個別フォーマット辞書53の特徴マ
トリクスとを用いて照合を行い、該照合結果に基づいて
切り出された図形と比較した特徴マトリクスの種別との
確信度、距離を出力する。
【0170】出力された確信度、または距離が、ある所
定の条件を満たすならば、この帳票標準フォーマット種
別は有効候補として選択しておく。
【0171】ここである所定の条件とは任意好適な条件
とできる。例えば、上記の距離がある値以下ならば有効
候補であり、そうでなければ有効候補外とする方法があ
る。
【0172】個別認識条件を満たす帳票標準フォーマッ
ト種別の全てに、個別フォーマット認識辞書53に保存
されている領域について特徴を抽出する。そして、辞書
データに予め保存してある特徴情報と照合して距離、確
信度を算出し、これらが所定の条件を満たすならば、こ
の種別を有効候補として選択し、所定の条件を満たさな
ければ有効候補から除外する。この有効候補の選択例を
表4を用いて説明する。
【0173】表4には、第1のフォーマット認識系55
で最終候補となった種別A〜Dに対して第2のフォーマ
ット認識を行う例を示している。
【0174】すなわち、表4は、個別フォーマット認識
部57cが、認識対象の帳票から、候補種別A,B,
C,Dに対応した個別フォーマット認識の領域について
特徴を取得し(詳細は後述する)、該抽出した特徴と辞
書53に予め保持した特徴とを照合した結果を距離で表
わした表である。ここで所定の条件として距離が30以
下という条件を設定すると、表5に示したように、種別
A,Cは有効候補外となる。
【0175】個別フォーマット認識領域Tを複数設定し
た場合で、そのうちの第1の領域の個別フォーマット認
識を行った結果、有効候補が複数存在するならば、第
2、第3の個別フォーマット認識の領域についても上記
で述べた特徴の抽出と辞書データの照合を行い、所定の
条件に満たない種別を有効候補外とする。また、有効候
補が一つになったならば、以降の処理を行わない。
【0176】すべての個別フォーマット認識領域につい
て処理終了後、有効候補が複数存在する場合には、各領
域における距離や確信度の結果によって所定の条件で候
補の入れ替えを行う。
【0177】この候補入れ替えの例を後に掲載した表6
〜表8を参照して説明する。先ず、第1の例を、表6お
よび表7を参照して説明する。
【0178】この第1の例は、候補帳票中に、個別フォ
ーマット認識領域Tとして、第1及び第2の領域を設定
してある場合の候補入れ替え例を示してある。そして、
第1のフォーマット認識系での認識結果では、種別Bが
第1位の候補帳票、種別Dが第2位の候補帳票というよ
うになっている(表6参照)。しかし、第2のフォーマ
ット認識系での、認識対象の帳票と種別B、Dそれぞれ
の第1及び第2の個別フォーマット認識領域との照合結
果として、種別Bでは第1の個別フォーマット認識領域
についてのみ閾値以上の認識結果が得られている。種別
Dでは、第1および第2の個別フォーマット認識領域そ
れぞれについて、閾値以上の認識結果が得られている。
すなわち、種別Dの方が、種別Bより第2の辞書に対す
るマッチング個数が多い。このような場合、この発明で
は、候補帳票の入れ替えが表7のようになされる。すな
わち、種別Dが第1位の候補帳票になり、種別Bが第2
位の候補帳票になるというように、候補帳票の順位の入
れ替えを行う。
【0179】また、候補入れ替えの第2の例として、次
のようにしても良い。すなわち、候補帳票中に個別フォ
ーマット認識領域として複数の領域を設置した場合に、
この複数の領域に優先順位を付けておく。そして、優先
順位が上位の個別フォーマット認識領域についての照合
で、距離または確信度などが最も小さかった種別を、第
1位の候補帳票になるよう入れ替えをする。例えば、表
6、表8の例では、第1の個別フォーマット認識領域の
照合結果を優先するような順位付けをしている。そのた
め、この例の場合は、種別B、種別Dの有効候補の順番
となる(たまたま、表6と同じ結果となっている)。
【0180】以上の処理を行った後、有効候補となって
いる一又は複数の標準帳票フォーマットを個別フォーマ
ット認識系57の結果として制御部80に出力する。こ
こで、個別フォーマット認識系57の認識結果が1つで
ある場合、制御部80はこの認識結果に応じた読み取り
制御データを読み取り制御データメモリ60から得て、
これを文字認識系70に送る。また、個別フォーマット
認識系57の認識結果が複数であった場合は、制御部8
0は、それぞれの認識結果に対応する読み取り制御デー
タを読み取り制御データメモリ60から得て、これを文
字認識系70に送っても良いし、または、表示部91に
これら認識結果に対応する帳票を表示して、これらの中
から正確な帳票をオペレータによって選択させても良
い。後者の場合は、制御部80は、オペレータが選択し
た帳票についての読み取り制御データを、読み取り制御
データメモリ60から得て、これを文字認識系70に送
る。
【0181】文字認識系70は、送られてきた文字読み
取りデータに基づいて、認識対象の帳票から文字パタン
を切り出す等の文字認識のための一連の処理を行う。
【0182】(文字認識動作)文字認識処理は、フォー
マット認識装置50のフォーマット認識の結果得られる
読み取り制御データに基づいて行われる。
【0183】すなわち、読み取り制御データ中の、文字
パタンの切り出しに関わるデータに基づいて、認識対象
の帳票のイメージデータから、文字パタンを切り出す。
また、読み取り制御データ中の、文字パタンの認識に関
わるデータ(例えば字体など)を利用して、認識用辞書
の指定などをする。
【0184】次に、切り出した文字パタンからその特徴
を抽出する。抽出した文字パタンの特徴と、文字認識辞
書70cに予め格納してある特徴とを照合する。例え
ば、切り出した文字パタンの特徴と文字認識辞書70c
に格納してある特徴との間の距離を認識の「確からし
さ」として用いて照合を行う。そして、文字認識辞書7
0c中に格納してある文字名の中から、上記の認識の確
からしさに基づいて、一又は複数の文字名を選択し、選
択した文字名を文字パタンの認識結果として出力する。
【0185】1−4.第2の実施の形態の装置の構成説
明 上述の第1の実施の形態の文字読み取り装置40は、帳
票の特徴的な一部分が特徴的な図形である場合に特に好
適な装置であった。もちろん、第1の実施の形態の文字
読み取り装置40は、帳票の特徴的な一部分が罫線の特
徴的な一部分である場合にも対応できる。しかし、帳票
の特徴的な一部分が、罫線の特徴的な一部分である場
合、例えば図2(A)〜(C)に示したような各帳票の
ように罫線L1の位置が、帳票の特徴的な一部分である
場合は、図9に示したように、個別フォーマット認識部
57cのサブパタン抽出部105の構成を第1の実施の
形態より簡易にしても良い。すなわち、第1の実施の形
態で設けていた、LSP抽出部105c、RSP抽出部
105d、LSPメモリ105gおよびRSPメモリ1
05hを省略し、サブパタン抽出部105を、HSP抽
出部105aと、VSP抽出部105bと、HSPメモ
リ105eと、VSPメモリ105fとで構成する。
【0186】罫線の特徴的な一部分は、水平罫線また
は、垂直罫線または、垂直及び水平罫線の組み合わせで
あることは明らかなので、HSPおよびVSPに関係す
るパタン抽出およびパタン記憶ができれば、サブパタン
抽出が可能だからである。
【0187】なお、この第2の実施の形態の文字読み取
り装置では、サブパタン抽出部の構成を変更したことに
伴い、例えば第2の辞書に格納するデータを変更し、さ
らに、特徴マトリクス作成部や照合部の構成を変更す
る。それ以外の構成は、例えば、第1の実施の形態の文
字読み取り装置40と同様な構成とすれば良い。
【0188】1−5.第2の実施の形態の装置の動作説
明 この第2の実施の形態の装置の、第1の実施の形態の装
置に対する動作上の相違点は、第2のフォーマット認識
系57でのサブパタン抽出部の動作と、サブパタン抽出
部が抽出するサブパタンの種類が減ったことに伴う特徴
マトリクス作成部や照合部の処理である。すなわち、サ
ブパタン抽出部はVSPおよびHSPのみを抽出する。
また、特徴マトリクス作成部や照合部は、認識対象の帳
票から水平および垂直それぞれの走査方向について特徴
を作成し、この特徴と、辞書に格納した特徴とを照合す
る。
【0189】図10は、図2(C)に示した認識対象の
帳票25の特徴的な一部分Tと、この部分Tから抽出さ
れる垂直サブパタン(VSP)および水平サブパタン
(HSP)とを示した図である。
【0190】この第2の実施の形態の文字読み取り装置
では、第2のフォーマット認識系57での上記の動作以
外の動作は、第1の実施の形態と同様に行われるので、
その説明を省略する。
【0191】1−6.第3の実施の形態の装置の構成説
明 上述の第1の実施の形態の文字読み取り装置40は、帳
票の特徴的な一部分が特徴的な図形である場合に特に好
適な装置であった。しかし、図11を参照して既に説明
したように、帳票の特徴的な一部分が文字である場合も
あり得る。
【0192】すなわち、図11(A)および(B)に示
した帳票31と帳票33とは、罫線L1が在るか無いか
という点と、帳票の右上隅に互いに異なる特徴的な文字
が印刷されている点とを除いて同じフォーマットとなっ
ている。すなわち、帳票31は、その左上隅に罫線L1
があり、かつ、帳票の右上隅に「○電気」という特徴的
な文字が印刷されている。帳票33は、罫線L1がな
く、かつ、その右上隅に「△△電気」という特徴的な文
字が印刷されている。一方、図11(C)に示した認識
対象の帳票35は、帳票種別番号が印刷されていない
が、帳票の罫線パタンは、図11(A)に示した帳票3
1と同じである。そのため、帳票の全体から抽出したパ
タンを予め辞書中に用意したパタンと比較する方法、例
えば、この出願の出願人に係る特開平9−259221
号公報に開示されている、帳票全体から抽出した罫線パ
タンを予め用意した辞書と照合する方法により、帳票3
5は帳票31と同じフォーマットの帳票であると認識で
きる。
【0193】しかし、帳票35に、汚れがあったり、折
り目があったり、また、罫線がかすれていたりした場合
等は、この帳票全体から抽出されるパタンは、例えば、
帳票31と帳票33との中間のような罫線パタンになり
易い。すると、両者の認識はしづらくなる。
【0194】そこで、この第3の実施の形態では、第1
のフォーマット認識系55が所定個数以上(例えば1以
上)の候補帳票を出力した場合は、第2のフォーマット
認識として、帳票の一部の文字に着目したフォーマット
認識をする。以下、詳細に説明する。
【0195】図12はこの第3の実施の形態で用いて好
適な文字読み取り装置140の構成を示したブロック図
である。
【0196】なお、この実施の形態の文字読み取り装置
140の、第1の実施の形態の文字読み取り装置40と
の相違点は、第2の辞書153の構成と、第2のフォー
マット認識系157の構成である。それ以外は、第1の
実施の形態と同様としてある。そこで、以下の説明で
は、相違点のみを説明する。
【0197】先ず、第2の辞書153(個別フォーマッ
ト認識辞書153ともいう)は、フォーマットが異なる
既存の複数の帳票毎の、所定の一部分(個別フォーマッ
ト認識領域T)に印刷されている1又は複数の特徴的な
文字の文字名を、予め保持している。ただし、この実施
の形態の場合は、上記の1又は複数の特徴的な文字の文
字名の他に、帳票毎の、個別フォーマット認識領域Tの
設定数、その位置、特徴的な文字の文字種を表した情報
など(これを、「個別フォーマット認識情報」ともい
う)も、第2の辞書153は予め保持している。
【0198】この様な個別フォーマット認識辞書153
を作成するには、既存の帳票を複数枚用意する。例えば
図11(A)、(B)に示した帳票31,33を含む複
数枚の帳票を用意する。そして、各帳票毎に個別フォー
マット識別領域Tを設定し、設定した領域の数、位置、
特徴的な文字の文字種、文字数等などと共に、この1又
は複数の特徴的な文字の文字名を、辞書データとして、
個別フォーマット認識辞書153に予め保持させる。
【0199】また、第2のフォーマット認識系157
は、第1のフォーマット認識系55が1以上の候補帳票
(以下、候補帳票を種別とかフォーマット候補ともい
う)を示した場合に動作する。そして、認識対象の帳票
の、前記1以上の候補帳票毎の前記特徴的な一部分Tに
当たる領域から文字を切り出し、該切り出した文字を文
字認識して文字名を得る。そして、該得られた文字名を
前記第2の辞書中の文字名と照合して、前記認識対象の
帳票のフォーマットを認識する。
【0200】この実施の形態の第2のフォーマット認識
系157は、文字切り出し部157aと、文字パタンメ
モリ157bと、文字認識辞書157cと、文字認識部
157dと、個別フォーマット認識部157eとで構成
してある。
【0201】文字切り出し部157aは、第1のフォー
マット認識系55が候補として候補帳票毎の、個別フォ
ーマット認識領域Tの位置データを、第2の辞書153
から得て、このデータに基づいて、帳票イメージメモリ
97からパタンを切り出す。さらに、周知の方法で、文
字毎のパタンを切り出す。
【0202】文字パタンメモリ157bは、文字切り出
し部157aが切り出した文字毎のパタンを格納する。
【0203】文字認識辞書157cは、各種の文字の特
徴(標準特徴)と文字名とを予め保持している。
【0204】文字の特徴をどのようなデータとして保持
するかは、任意である。しかし、この実施の形態の文字
認識辞書は、文字パタンを複数領域に分割し該分割領域
の特徴で表される特徴マトリクスの形で、文字の特徴を
保持している。
【0205】文字認識部157dは、文字パタンから特
徴を抽出し、該抽出した特徴を文字認識辞書と照合して
文字を認識し、その文字名を個別フォーマット認識部1
57eに出力する。
【0206】この文字認識部157dの構成は任意好適
なものとできる。例えば、特開平9−259221号公
報に開示の文字認識部で構成することが出来る。もちろ
ん、1例でありこれに限られない。
【0207】図13は、この文字認部157dの具体的
な構成例を説明する機能ブロック図である。
【0208】この図13の場合の文字認識部157d
は、線幅算出部201と、枠検出部203と、サブパタ
ン抽出部205と、特徴マトリクス作成部207と、照
合部209とで構成してある。これらの詳細は後の動作
説明の項で説明するが、間単に説明すれば次の通りであ
る。
【0209】線幅算出部201は、文字切り出し部15
7aが切り出したパタンの線幅を算出する。
【0210】枠検出部203は、文字切り出し部157
aが切り出したパタンに外接する枠(文字枠)を検出す
る。
【0211】サブパタン抽出部205は、文字パタン切
り出し部157aが切り出したパタンを複数の方向に走
査して、各走査方向毎にサブパタンを抽出する。この場
合のサブパタン抽出部205は、水平方向サブパタン
(HSP)を抽出するHSP抽出部205aと、垂直方
向サブパタン(VSP)を抽出するVSP抽出部205
bと、左斜めサブパタン(LSP)を抽出するLSP抽
出部205cと、右斜めサブパタン(RSP)を抽出す
るRSP抽出部205dと、対応するサブパタンを格納
するHSPメモリ205e、VSPメモリ205f、L
SPメモリ205gおよびRSPメモリ205hとで構
成してある。
【0212】特徴マトリクス作成部207は、水平、垂
直、左斜めおよび右斜めの各走査方向毎に、サブパタン
から特徴を抽出し、各サブパタンの特徴から特徴マトリ
クスを作成する。
【0213】照合部209は、特徴マトリクス作成部2
07が作成した特徴マトリクスと、文字認識辞書157
cに格納してある各文字の特徴マトリクスとを用いて照
合を行い、その結果に基づいて文字名を出力する。
【0214】なお、文字切り出し部157a、文字パタ
ンメモリ157b、文字認識辞書157cおよび文字認
識部157dを、文字認識系70の、文字切り出し部7
0a、文字パタンメモリ70b、文字認識辞書70cお
よび文字認識部70dで兼用するのが好ましい。こうす
れば、文字読み取り装置140のハードウェア規模及び
ソフトウェア規模を削減できるという利点が得られる。
【0215】個別フォーマット認識部157eは、文字
認識部157dでの文字認識結果と、個別フォーマット
認識辞書153に予め格納してあるデータとを照合し
て、認識対象の帳票の1又は複数のフォーマット候補を
認識結果として出力する。
【0216】1−7.第3の実施の形態の装置140の
動作説明 次に、文字読み取り装置140の動作について説明す
る。図14は、文字読み取り装置140の全体的な動作
の流れを示す図である。
【0217】なお、第1のフォーマット認識系55によ
る処理と、文字認識系70による処理は、第1の実施の
形態の装置40の場合と同様であるので、以下の説明で
は、第2のフォーマット認識系157の動作について主
に説明する。
【0218】第1の実施の形態の文字読み取り装置40
の場合と同様に、認識対象の帳票(例えば図11(C)
に示した帳票35)から得たイメージデータから罫線パ
タンを抽出し(図14のS1)、この罫線パタンのデー
タを第1の辞書51内のパタンのデータと照合する(図
14のS2)。
【0219】次に、所定個数以上(ここでは例えば1以
上の例を考える)の候補帳票が在るか否かが判定される
(図14のS3)。候補帳票が1つも無かった場合、そ
の旨が、制御部80に通知される(図14のS21)。
候補帳票が1以上あった場合は、制御部80は第2のフ
ォーマット認識系157を起動する。ただし、第1のフ
ォーマット認識系55での認識において1以上の候補帳
票が示された場合であっても、これら種別それぞれに対
応した個別フォーマット認識情報が個別フォーマット認
識辞書153にない場合は、第1のフォーマット認識系
55で得た認識結果を制御部80に出力する。
【0220】第1のフォーマット認識系55が出力した
候補帳票の全部又は一部それぞれに対応した個別フォー
マット認識情報が個別フォーマット認識辞書153にあ
った場合は(図14のS4)、制御部80は、認識対象
の帳票のイメージデータから、各種別毎の所定の一部分
に対応する部分を切り出すための位置情報を、個別フォ
ーマット認識辞書153からそれぞれ得る(図14のS
5)。すなわち、例えば、認識対象の帳票35に対し
て、例えば図11(A)の帳票31および図11(B)
の帳票33がフォーマット候補となっている場合であれ
ば、帳票31、33各々の特徴的な一部分Tに対応する
部分を、認識対象の帳票35のイメージデータから切り
出すための位置情報を、個別フォーマット認識辞書15
3から制御部80は得る。そしてこれを文字切り出し部
157aに入力する。
【0221】文字切り出し部157aは、上記の位置情
報に基づいて、帳票イメージメモリ97から、パタンを
切出して、それを文字パタンメモリ157bに格納する
(図14のS6)。
【0222】文字切り出し部157aがパタン切出しを
終了すると、制御部80は、文字認識部157dを起動
する。起動された文字認識部157dは、文字パタンメ
モリ157bに格納されているパタンから特徴を抽出
し、この特徴と、文字認識辞書157cに格納されてい
る標準パタンの特徴データとを照合し、認識結果として
の文字名を出力する(図5のS7)。
【0223】この文字認識部157dでの特徴抽出、照
合および文字認識の各処理は、第1の発明の実施の形態
で図4を用いて説明した個別フォーマット認識部57c
での各処理と同様に行える。したがって、以下では簡単
に説明する。
【0224】先ず、線幅算出部201は、文字パタンメ
モリ157b格納された文字パタンから、第1発明での
線幅算出部101の場合と同様に、線幅wとしてw=A
/(A−Q)を求める。
【0225】枠検出部203は切り出された文字パタン
の線部分に外接する枠( 文字枠) を、第1の発明での枠
検出部103の場合と同様に、検出する。
【0226】サブパタン抽出部205は、切り出された
文字パタンを、ここでは水平、垂直、右斜め、左斜めの
各方向に走査して、各走査方向毎にサブパタンを抽出す
る。各サブパタンの抽出処理は、第1の発明でのサブパ
タン抽出部105での処理と同様に行われる。
【0227】特徴マトリクス作成部207は、第1の発
明での特徴マトリクス107と同様に、各走査方向毎の
サブパタンから特徴を抽出し、各サブパタンの特徴か
ら、切り出された文字パタンの特徴マトリクスを作成す
る。すなわち、特徴マトリクス作成部207は、水平サ
ブパタンの文字枠に対応する領域をN×M個の領域に分
割し、各領域毎に特徴量lijを求め、こららN×M個の
特徴量lijからなるN×M次元の特徴マトリクスを作成
する。
【0228】照合部209は、第1の発明での照合部1
07と同様に、切り出された文字パタンの特徴マトリク
スと文字認識辞書157c中のデータの特徴マトリクス
とを用いて照合を行う。そして、切り出された文字と比
較した特徴マトリクスの文字名と確信度、距離を出力す
る。
【0229】1つの候補帳票中に特徴的な一部分Tを複
数箇所定めた場合は、その個数分、ステップS5から処
理を繰り返し、認識結果を出力する(図5のS8)。
【0230】個別フォーマット識別を行なう種別毎に、
すなわち、複数のフォーマット候補毎に、上記処理(S
4〜S8)を繰り返す。
【0231】文字認識部157dが各フォーマット候補
毎の認識結果を出力し終えたら、制御部80は、個別フ
ォーマット認識部157eを起動する。
【0232】起動された個別フォーマット認識部157
eは、文字認識部157dからの各フォーマット候補ご
との文字名を個別フォーマット認識辞書153内のデー
タと照合して、認識対象の帳票のフォーマットを認識す
る(図14のS10)。この際、、類似度の高いフォー
マット候補(種別)と判断する順に、認識結果を入れ換
えて、1又は複数のフォーマット候補を選択する。
【0233】制御部80が帳票フォーマットの認識結果
として一つの種別のみを入力する場合には、制御部80
は、当該認識結果に対応した読取り制御データを読み取
り制御データメモリ60から読み出し、読み出した読み
取り制御データを文字認識系70へ出力する(図14の
S11)。
【0234】制御部80が帳票フォーマットの認識結果
として複数の種別を入力する場合には、これら認識結果
を確認するための情報を表示部91に表示できる構成と
するのが良い。そして、この情報を判断基準として、オ
ペレータが上記の複数の帳票の中から所望の帳票を選択
する指示又は該当なしの指示をできるように入力部93
を構成するのが良い。
【0235】例えば、制御部80は、帳票フォーマット
の認識結果に基づいて候補帳票を表示部91に表示させ
る。オペレータは、この表示を見て正しいと判断できる
認識結果を選択し、選択した認識結果を指示する信号
を、入力部93を介して、制御部80に入力する。
【0236】制御部80は、オペレータが選択した認識
結果に対応する読み取り制御データを読み取り制御デー
タメモリ60から読み出し、読み出した読み取り制御デ
ータを文字認識系70へ出力する(図14のS11)。
【0237】この場合の読み取り制御データは、上述し
た様に、文字パタン切り出しのための制御データと、文
字パタンを認識するための制御データである。制御部8
0は、文字パタンの切出しのための制御データを文字切
出し部70aへ、また文字パタンの認識のための制御デ
ータを文字認識部70dへ出力する。
【0238】その後は、第1の実施の形態にて説明した
と同様に文字認識系70は認識対象の帳票上の文字を認
識する。
【0239】なお、これまでの説明では、第2のフォー
マット認識系は、第1のフォーマット認識系が所定個数
以上の候補を出力した場合に動作し、かつ、第1のフォ
ーマット認識系が候補を所定個数未満しか出力しなかっ
た場合(0も含む)は、制御部に処理を委ねる(図5や
図14のステップS3,S21参照)認識系であった。
しかし、第2のフォーマット認識系を、第1のフォーマ
ット認識系が所定個数未満の候補を出力した場合は、認
識対称の帳票の一部の特徴と、既存の帳票の全ての帳票
毎の一部の特徴データとの照合をして、認識対象の帳票
のフォーマットを認識し、第1のフォーマット認識系が
所定個数以上の候補を出力した場合は、該出力された帳
票毎の一部の特徴データと認識対称の帳票の一部の特徴
との照合をして、認識対象の帳票のフォーマットを認識
する認識系としても良い。
【0240】こうすると、第1のフォーマット認識系が
候補を挙げた場合、挙げない場合それぞれで、第2のフ
ォーマット認識系による効果的なフォーマット認識が行
えるからである。
【0241】このような構成とする場合の動作例を、図
15を参照して説明する。なお、この図15は、図5中
のステップS21の処理を今回の態様に合わせて変更し
た図である。
【0242】第1のフォーマット認識系55が所定個数
以上の候補を出力した場合は、図5を参照して説明した
と同様にステップS4〜S9の処理をする(図15)。
一方、第1のフォーマット認識系55が所定個数未満
(例えば1未満)の候補を出力した場合は、第2のフォ
ーマット認識系57は、第2の辞書53中の既存の帳票
全てを候補とする(図15のステップS31)。そし
て、認識対象の帳票について、各既存の帳票の特徴的な
一部分に着目した照合等、すなわち第2のフォーマット
認識系による処理をそれぞれ行う。ただし、第2のフォ
ーマット認識系57による照合等を行う前に、第2の辞
書53中の既存の全ての帳票それぞれの第1のフォーマ
ット認識結果として、第1のフォーマット認識系での閾
値(候補を選択する閾値)以上の所定値を制御部80は
強制的に設定する(図15のステップS3)。こうする
理由は、上述した候補帳票の並べ替えのための初期設定
を確保するためである。その後は、第2のフォーマット
認識系57によるフォーマット認識を行って、既存の帳
票の中から認識対象の帳票のフォーマット候補としての
1又は複数の候補帳票を決める。こうして決められた候
補帳票を、好ましくは表示部91に表示し、オペレータ
が入力部93を用いて最終的な補帳帳票を決めるように
するのが良い。
【0243】また、図14を用いて説明した特徴的な文
字に着目する態様の場合でも、第1のフォーマット認識
系が所定個数未満の候補を出力した場合に、第2のフォ
ーマット認識系が第2の辞書中の既存の全ての帳票を候
補として、認識対象の帳票のフォーマット認識をするよ
うに、第2のフォーマット認識系を構成することができ
る。その場合は、図14中のステップS21の処理の代
わりに、図15のステップS31の処理が行われるよう
に、第2のフォーマット認識系157(図12)の構成
を変更すれば良い。
【0244】2.フォーマット認識装置および文字読み
取り装置の第2の発明 上述した第1の発明では、帳票全体のパタンを第1の辞
書中の既存の帳票毎のパタンと照合して認識対象の帳票
のフォーマットを認識する第1のステップと、認識対象
の帳票の、前記候補帳票毎の特徴的な一部分に対応する
領域から特徴を抽出して該特著を第2の辞書中の既存の
帳票の特徴データと照合して認識対象の帳票のフォーマ
ットを認識する第2のステップとを実施する装置を主張
していた。
【0245】しかし、場合によっては、帳票の一部分に
在る帳票の特徴部分のみに着目して、帳票のフォーマッ
トを識別しても良い。この第2の発明はその例である。
【0246】そこで、この第2の発明のフォーマット認
識装置は、認識対象の帳票の一部の特徴を抽出し、該特
徴を既存の帳票の一部の特徴データと照合して、前記認
識対象の帳票のフォーマットを認識するフォーマット認
識系を具える。
【0247】より具体的には、フォーマットが異なる既
存の複数の帳票毎の特徴的な一部分からそれぞれ抽出し
たパタンのデータを、予め保持している辞書と、認識対
象の帳票のイメージデータから、前記既存の帳票毎の特
徴的な一部分に相当する部分のパタンをそれぞれ抽出す
るパタン抽出部と、該パタン抽出部が抽出したパタンの
データを前記辞書中のデータと照合して、前記認識対象
の帳票のフォーマットを認識するフォーマット認識系を
具える。
【0248】また、この第2の発明の文字読み取り装置
は、上記の第2の発明のフォーマット認識装置と、読み
取り制御データメモリと、文字認識系とを備える。
【0249】ただし、読み取り制御データメモリは、複
数の帳票ごとの該帳票から文字を読み取るために必要な
読み取り制御データを保持していて、フォーマット認識
装置の認識結果によって1又は複数の読み取り制御デー
タを出力するメモリである。また、文字認識系は、読み
取り制御データメモリから出力される読み取り制御デー
タに基づいて認識対象の帳票から文字を認識するもので
ある。
【0250】なお、帳票の特徴的な一部分とは、例え
ば、帳票の所定の一部分に印刷された図形(文字パタン
の場合も含む)、または、罫線の特徴的な一部分、また
は、これら図形及び罫線の特徴的な一部分双方とでき
る。
【0251】この第2の発明のフォーマット認識装置お
よび文字読み取り装置の実施の形態としては、例えば、
第1の発明の実施の形態で説明した文字読み取り装置4
0の構成から、第1の辞書51および第1のフォーマッ
ト認識系55をそれぞれ除去し、そして、第2のフォー
マット認識系57の構成を以下に説明するような構成と
する形態がある。
【0252】すなわち、第2のフォーマット認識系57
を、認識対象の帳票のフォーマットを認識する際に起動
する系とする。そして、第2のフォーマット認識系57
の部分パタン切り出し部57aは、認識対象の帳票のイ
メージデータから、既存の帳票の特徴的な一部分に相当
する部分のパタンを切り出す構成とする。なお、既存の
帳票が複数である場合は、認識対象の帳票のイメージデ
ータから、これら複数の既存の帳票毎の特徴的な一部分
に相当部分をそれぞれ切り出す。認識対象の帳票のイメ
ージデータから、既存の帳票の特徴的な一部分に相当す
るパタンを切り出すための位置情報は、辞書に予め保持
しておくのが良い。また、個別フォーマット認識部57
cは、上記切り出したパタンから特徴を抽出し、この特
徴を、個別フォーマット認識辞書53内の特徴と照合し
て、認識対象の帳票の1又は複数のフォーマットを選択
する構成とする。
【0253】このような構成とすれば、認識対象の帳票
に対して、帳票の特徴的な一部分に着目したフォーマッ
ト認識処理と、この認識結果に基づいた文字読み取り処
理とが行える。
【0254】
【表1】
【0255】
【表2】
【0256】
【表3】
【0257】
【発明の効果】上述した説明から明らかなように、この
出願の第1の発明のフォーマット認識装置によれば、帳
票全体から抽出した特徴を既存の帳票の特徴と照合して
帳票のフォーマットを認識でき、また、帳票の一部の特
徴を既存の帳票の一部の特徴と照合して帳票のフォーマ
ットを認識できる。
【0258】また、この出願の第2の発明のフォーマッ
ト認識装置によれば、帳票の一部の特徴を既存の帳票の
一部の特徴と照合して帳票のフォーマットを認識する。
【0259】したがって、これら第1および第2の発明
のフォーマット認識装置によれば、パタンマッチングの
みで帳票のフォーマットを認識できる。そのため、帳票
種別番号のない帳票であっても、そのフォーマットを、
文字切り出しの処理を含むことなく、認識することがで
きる。
【0260】また、文字読み取り装置の各発明では、上
記のフォーマット認識装置と、このフォーマット認識装
置の認識結果に応じた読み取り制御データを出力する読
み取り制御データメモリと、この読み取り制御データに
基づいて文字を認識する文字認識系とを具える。そのた
め、フォーマット認識装置で認識されたフォーマットに
基づいて認識対象の文字を認識することができる。
【図面の簡単な説明】
【図1】第1の発明で用いる帳票の第1の例である。
【図2】第1の発明で用いる帳票の第2の例である。
【図3】第1の発明の第1の実施の形態の文字読み取り
装置の説明図である。
【図4】第1の発明の第1の実施の形態の個別フォーマ
ット認識部の一構成例を説明する図である。
【図5】第1の発明の文字読み取り装置の動作説明図で
ある。
【図6】罫線抽出部の動作例を説明する図である。
【図7】罫線パタンの抽出例を説明する図である。
【図8】個別フォーマット認識での特徴抽出の説明図で
ある。
【図9】第1の発明の第2の実施の形態の個別フォーマ
ット認識部の一構成例を説明する図である。
【図10】第1発明の第2の実施の形態の説明図であ
り、抽出される特徴の説明図である。
【図11】第1の発明で用いる帳票の第3の例である。
【図12】第1の発明の第3の実施の形態の説明図であ
り、第3の実施の形態の文字読み取り装置の説明図であ
る。
【図13】第1の発明の第3の実施の形態の文字読み取
り装置の特に文字認識部の説明図である。
【図14】第1の発明の第3の実施の形態の文字読み取
り装置の動作説明図である。
【図15】第1の発明の文字読み取り装置のさらに別の
実施の形態の説明図である。
【図16】従来技術および課題の説明図である。
【符号の説明】
15,17,21,23,31,33:帳票(既存の帳
票) 19,25,35:認識対象の帳票 T:帳票毎の特徴的な一部分(個別フォーマット認識領
域) L1:罫線(罫線の特徴的な部分) a:紙面 40、140:文字読み取り装置 50、150:フォーマット認識装置 51:第1の辞書 53,153:第2の辞書 55:第1のフォーマット認識系 57,157:第2のフォーマット認識系 60:読み取り制御データメモリ 70:文字認識系 80:制御部 91:表示部 93:入力部 95:スキャナ 97:帳票イメージメモリ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 齊藤 洋夫 東京都港区虎ノ門1丁目7番12号 沖電気 工業株式会社内

Claims (35)

    【特許請求の範囲】
  1. 【請求項1】 帳票のフォーマットを認識する装置にお
    いて、 認識対象の帳票の全体の特徴を抽出し、該特徴を既存の
    帳票の全体の特徴データと照合して、前記認識対象の帳
    票のフォーマットを認識する第1のフォーマット認識系
    と、 前記認識対象の帳票の一部の特徴を抽出し、該特徴を既
    存の帳票の一部の特徴データと照合して、前記認識対象
    の帳票のフォーマットを認識する第2のフォーマット認
    識系とを具えたことを特徴とするフォーマット認識装
    置。
  2. 【請求項2】 請求項1に記載のフォーマット認識装置
    において、 前記既存の帳票の全体の特徴データを保持している第1
    の辞書と、 前記既存の帳票の一部の特徴を保持している第2の辞書
    とを具えたことを特徴とするフォーマット認識装置。
  3. 【請求項3】 請求項1に記載のフォーマット認識装置
    において、 前記第1のフォーマット認識系は、 前記認識対象の帳票から罫線パタンについての特徴を抽
    出し、かつ、前記既存の帳票の全体の特徴データとして
    該帳票の罫線パタンについての特徴データを用いる認識
    系であることを特徴とするフォーマット認識装置。
  4. 【請求項4】 請求項1に記載のフォーマット認識装置
    において、 第2のフォーマット認識系は、 前記認識対象の帳票から所定個数以上の部分パタンにつ
    いての特徴を抽出し、かつ、前記既存の帳票の一部の特
    徴データとして該帳票の所定個数以上の部分パタンにつ
    いての特徴データを用いる認識系であることを特徴とす
    るフォーマット認識装置。
  5. 【請求項5】 請求項1に記載のフォーマット認識装置
    において、 前記第2のフォーマツト認識系は、前記第1のフォーマ
    ット認識系が所定個数以上の候補を出力した場合に動作
    する認識系であることを特徴とするフォーマット認識装
    置。
  6. 【請求項6】 請求項1に記載のフォーマット認識装置
    において、 前記第2のフォーマット認識系は、 前記第1のフォーマット認識系が所定個数未満の候補を
    出力した場合は、前記認識対称の帳票の一部の特徴と、
    前記既存の帳票の全ての帳票毎の一部の特徴データとの
    照合をして、前記認識対象の帳票のフォーマットを認識
    し、 前記第1のフォーマット認識系が所定個数以上の候補を
    出力した場合は、該出力された帳票毎の一部の特徴デー
    タと前記認識対称の帳票の一部の特徴との照合をして、
    前記認識対象の帳票のフォーマットを認識する認識系で
    あることを特徴とするフォーマット認識装置。
  7. 【請求項7】 請求項1に記載のフォーマット認識装置
    において、 前記帳票の一部が、1帳票中に複数設定されていること
    を特徴とするフォーマット認識装置。
  8. 【請求項8】 請求項1に記載のフォーマット認識装置
    において、 前記第1のフォーマット認識系は、 前記認識対象の帳票の画像データを縦方向および横方向
    に走査して罫線パタンを抽出し、該抽出した罫線パタン
    について特徴を抽出し、該抽出した特徴を辞書中の特徴
    データと照合してフォーマットを認識する系であること
    を特徴とするフォーマット認識装置。
  9. 【請求項9】 請求項1に記載のフォーマット認識装置
    において、 前記帳票の一部を、帳票中の一部の図形(文字パタンの
    場合も含む)とし、 前記第2のフォーマット認識系は、前記認識対象の帳票
    の画像データから該一部の図形パタンを抽出し、該抽出
    した図形パタンについて特徴を抽出し、該特徴を辞書中
    の特徴データと照合してフォーマットを認識する系であ
    ることを特徴とするフォーマット認識装置。
  10. 【請求項10】 請求項1に記載のフォーマット認識装
    置において、 前記帳票の一部を、帳票中の一部の罫線とし、 前記第2のフォーマット認識系は、前記認識対象の帳票
    の画像データから該一部の罫線パタンを抽出し、該抽出
    した罫線パタンについて特徴を抽出し、該特徴を辞書中
    の特徴データと照合してフォーマットを認識する系であ
    ることを特徴とするフォーマット認識装置。
  11. 【請求項11】 請求項1に記載のフォーマット認識装
    置において、 前記帳票の一部を、帳票中の文字とし、 前記第2のフォーマット認識系は、前記認識対象の帳票
    の画像データから前記文字のパタンを切り出して文字認
    識をして文字名を得、該文字名を既存の帳票毎の特徴デ
    ータとして予め定めた文字名と照合して、フォーマット
    を認識する系であることを特徴とするフォーマット認識
    装置。
  12. 【請求項12】 請求項1に記載のフォーマット認識装
    置において、 前記第2のフォーマット認識系は、その照合結果によっ
    て認識候補順位を入れ換える認識系であることを特徴と
    するフォーマット認識装置。
  13. 【請求項13】 請求項1に記載のフォーマット認識装
    置において、 前記第2のフォーマット認識系は、 前記照合の結果、前記既存の帳票のうち前記認識対象の
    帳票に対する距離が小さい帳票ほど又は確信度が大きい
    帳票ほど上位の候補とし、ただし、 1帳票中に前記帳票の一部として複数箇所を設定した候
    補帳票との照合をした場合は、該照合結果としての距離
    が閾値以下または確信度が閾値以上となる箇所が多い候
    補帳票ほど上位の候補に入れ換え、又は、前記複数箇所
    に予め優先順位を付けておき優先度の高い箇所について
    の認識結果が良好な候補帳票ほど上位の候補に入れ換え
    る認識系であることを特徴とするフォーマット認識装
    置。
  14. 【請求項14】 請求項1に記載のフォーマット認識装
    置において、 前記第2のフォーマット認識系は、前記既存の帳票上
    の、前記一部の特徴データを得た領域の位置情報を予め
    保持していて、前記認識対象の帳票の、該位置情報で特
    定される一部から、特徴を抽出する認識系であることを
    特徴とするフォーマット認識装置。
  15. 【請求項15】 請求項14に記載のフォーマット認識
    装置において、 前記位置情報は、請求項2に記載の第2の辞書中に保持
    してあることを特徴とするフォーマット認識装置。
  16. 【請求項16】 請求項1に記載のフォーマット認識装
    置において、 前記第1のフォーマット認識系は、 前記照合結果が上位N位までの帳票を候補帳票とする第
    1の条件(Nは1以上の任意の整数)、 照合結果としての確信度がある値以上または距離がある
    値以下の帳票を候補帳票とする第2の条件、および、 照合結果が第M位の帳票が候補帳票であるとき、該第M
    位の帳票の照合結果としての距離又は確信度と第M+1
    位の帳票の距離又は確信度との差分がある値以下であっ
    た場合、該M+1位までの帳票を候補帳票とする第3の
    条件(Mは1以上の任意の整数)の1又は2以上の条件
    を組み合わせた条件により、候補帳票を決める認識系で
    あることを特徴とするフォーマット認識装置。
  17. 【請求項17】 請求項9に記載のフォーマット認識装
    置において、 前記第2のフォーマット認識系は、 前記抽出した図形パタンをM×Nに分割し、該分割した
    各領域の水平、垂直、左斜めおよび右斜め方向それぞれ
    で図形と判断される閾値以上の線描画素を、水平方向サ
    ブパタン、垂直方向サブパタン、左斜め方向サブパタン
    および右斜め方向サブパタンとしてそれぞれ抽出し、こ
    れら各方向サブパタンについて特徴マトリクスを作成
    し、 該特徴マトリクスを辞書中の特徴マトリクスと照合して
    フォーマットを認識する系であることを特徴とするフォ
    ーマット認識装置(ただし、M,Nは正の整数であり、
    互いは同じでも、異なっても良い。)。
  18. 【請求項18】 請求項10に記載のフォーマット認識
    装置において、 前記第2のフォーマット認識系は、 前記抽出した罫線パタンをM×Nに分割し、該分割した
    各領域の水平および垂直方向それぞれで罫線と判断され
    る閾値以上の線描画素を、水平方向サブパタンおよび垂
    直方向サブパタンとしてそれぞれ抽出し、これら各方向
    サブパタンについて特徴マトリクスを作成し、 該特徴マトリクスを辞書中の特徴マトリクススと照合し
    てフォーマットを認識する系であることを特徴とするフ
    ォーマット認識装置(ただし、M,Nは正の整数であ
    り、互いは同じでも、異なっても良い。)。
  19. 【請求項19】 請求項11に記載のフォーマット認識
    装置において、 前記第2のフォーマット認識系は、 前記切り出した文字パタンをM×Nに分割し、該分割し
    た各領域から水平、垂直、左斜めおよび右斜め方向サブ
    パタンをそれぞれ抽出し、これら各方向サブパタンにつ
    いて特徴マトリクスを作成し、 該特徴マトリクスを辞書中の特徴マトリクススと照合し
    て前記文字名を得、 該文字名を辞書と照合してフォーマットを認識する系で
    あることを特徴とするフォーマット認識装置(ただし、
    M,Nは正の整数であり、互いは同じでも、異なっても
    良い。)。
  20. 【請求項20】 請求項1に記載のフォーマット認識装
    置において、 前記第1のフォーマット認識系が出力する候補帳票、お
    よび、前記第2のフォーマット認識系が出力する候補帳
    票の一方または双方を表示する表示部と、 該表示部に表示された帳票から1または複数の帳票を選
    択するための指示、または、該当なしという指示を入力
    する入力部とを具えたことを特徴とするフォーマット認
    識装置。
  21. 【請求項21】 請求項1〜20のいずれか1項に記載
    のフォーマット認識装置と、 既存の帳票ごとの該帳票から文字を読み取るために必要
    な読み取り制御データを保持していて、前記フォーマッ
    ト認識装置の認識結果によって1又は複数の読み取り制
    御データを出力する読み取り制御データメモリと、 該読み取り制御データメモリから出力される読み取り制
    御データに基づいて前記認識対象の帳票から文字を認識
    する文字認識系とを具えたことを特徴とする文字読み取
    り装置。
  22. 【請求項22】 請求項21に記載の文字読み取り装置
    において、 前記フォーマット認識装置の第2のフォーマット認識系
    が、帳票の一部の文字に着目してフォーマット認識をす
    る認識系である場合、 認識対象の帳票の画像データから文字パタンを切り出す
    ための文字切り出し部、 該切り出した文字を格納する文字パタンメモリ、 文字認識辞書、および、 切り出した文字パタンを前記文字認識辞書中のデータと
    照合して文字を認識する文字認識部であつて、 前記の第2のフォーマット認識系および前記文字認識系
    で兼用される、文字切り出し部、文字パタンメモリ、文
    字認識辞書および文字認識部を具えることを特徴とする
    文字読み取り装置。
  23. 【請求項23】 帳票のフォーマットを認識する装置に
    おいて、 認識対象の帳票の一部の特徴を抽出し、該特徴を既存の
    帳票の一部の特徴データと照合して、前記認識対象の帳
    票のフォーマットを認識するフォーマット認識系を具え
    たことを特徴とするフォーマット認識装置。
  24. 【請求項24】 請求項23に記載のフォーマット認識
    装置において、 前記フォーマット認識系は、 前記認識対象の帳票から該帳票の1以上の部分パタンに
    ついての特徴を抽出し、かつ、前記既存の帳票の一部の
    特徴データとして該帳票の1以上の部分パタンについて
    の特徴データを用いる認識系であることを特徴とするフ
    ォーマット認識装置。
  25. 【請求項25】 請求項23に記載のフォーマット認識
    装置において、 前記帳票の一部が、1帳票中に2カ所以上設定される場
    合があることを特徴とするフォーマット認識装置。
  26. 【請求項26】 請求項23に記載のフォーマット認識
    装置において、 前記帳票の一部を、帳票中の一部の図形(文字パタンの
    場合も含む)とし、 前記フォーマット認識系は、前記認識対象の帳票の画像
    データから該一部の図形パタンを抽出し、該抽出した図
    形パタンについて特徴を抽出し、該特徴を辞書中の特徴
    データと照合してフォーマットを認識する系であること
    を特徴とするフォーマット認識装置。
  27. 【請求項27】 請求項23に記載のフォーマット認識
    装置において、 前記帳票の一部を、帳票中の一部の罫線とし、 前記フォーマット認識系は、前記認識対象の帳票の画像
    データから該一部の罫線パタンを抽出し、該抽出した罫
    線パタンについて特徴を抽出し、該特徴を辞書中の特徴
    データと照合してフォーマットを認識する系であること
    を特徴とするフォーマット認識装置。
  28. 【請求項28】 請求項23に記載のフォーマット認識
    装置において、 前記フォーマット認識系は、その照合結果によって認識
    候補順位を入れ換える認識系であることを特徴とするフ
    ォーマット認識装置。
  29. 【請求項29】 請求項23に記載のフォーマット認識
    装置において、 前記フォーマット認識系は、 前記照合の結果、前記既存の帳票のうち前記認識対象の
    帳票に対する距離が小さい帳票ほど又は確信度が大きい
    帳票ほど上位の候補とし、ただし、 1帳票中に前記帳票の一部として複数箇所を設定した候
    補帳票との照合をした場合は、該照合結果としての距離
    が閾値以下または確信度が閾値以上となる箇所が多い候
    補帳票ほど上位の候補に入れ換え、又は、前記複数箇所
    に予め優先順位を付けておき優先度の高い箇所について
    の認識結果が良好な候補帳票ほど上位の候補に入れ換え
    る認識系であることを特徴とするフォーマット認識装
    置。
  30. 【請求項30】 請求項23に記載のフォーマット認識
    装置において、 前記フォーマット認識系は、前記既存の帳票上の、前記
    一部の特徴データを得た領域の位置情報を予め保持して
    いて、前記認識対象の帳票の、該位置情報で特定される
    一部から、特徴を抽出する認識系であることを特徴とす
    るフォーマット認識装置。
  31. 【請求項31】 請求項30に記載のフォーマット認識
    装置において、 前記位置情報と前記特徴データとを保持している辞書を
    具えることを特徴とするフォーマット認識装置。
  32. 【請求項32】 請求項26に記載のフォーマット認識
    装置において、 前記フォーマット認識系は、 前記抽出した図形パタンをM×Nに分割し、該分割した
    各領域の水平、垂直、左斜めおよび右斜め方向それぞれ
    で図形と判断される閾値以上の線描画素(画素つなが
    り)を、水平方向サブパタン、垂直方向サブパタン、左
    斜め方向サブパタンおよび右斜め方向サブパタンとして
    それぞれ抽出し、これら各方向サブパタンについて特徴
    マトリクスを作成し、 該特徴マトリクスを辞書中の特徴マトリクスと照合して
    フォーマットを認識する系であることを特徴とするフォ
    ーマット認識装置(ただし、M,Nは正の整数であり、
    互いは同じでも、異なっても良い。)。
  33. 【請求項33】 請求項27に記載のフォーマット認識
    装置において、 前記フォーマット認識系は、 前記抽出した罫線パタンをM×Nに分割し、該分割した
    各領域の水平および垂直方向それぞれで罫線と判断され
    る閾値以上の線描画素(画素のつながり)を、水平方向
    サブパタンおよび垂直方向サブパタンとしてそれぞれ抽
    出し、これら各方向サブパタンについて特徴マトリクス
    を作成し、 該特徴マトリクスを辞書中の特徴マトリクススと照合し
    てフォーマットを認識する系であることを特徴とするフ
    ォーマット認識装置(ただし、M,Nは正の整数であ
    り、互いは同じでも、異なっても良い。)。
  34. 【請求項34】 請求項23に記載のフォーマット認識
    装置において、 前記フォーマット認識系が出力する候補帳票を表示する
    表示部と、 該表示部に表示された帳票から1または複数の帳票を選
    択するための指示、または、該当なしという指示を入力
    する入力部とを具えたことを特徴とするフォーマット認
    識装置。
  35. 【請求項35】 請求項23〜34のいずれか1項に記
    載のフォーマット認識装置と、 既存の帳票ごとの該帳票から文字を読み取るために必要
    な読み取り制御データを保持していて、前記フォーマッ
    ト認識装置の認識結果によって1又は複数の読み取り制
    御データを出力する読み取り制御データメモリと、 該読み取り制御データメモリから出力される読み取り制
    御データに基づいて前記認識対象の帳票から文字を認識
    する文字認識系とを具えたことを特徴とする文字読み取
    り装置。
JP06180698A 1998-03-12 1998-03-12 フォーマット認識装置及び文字読み取り装置 Expired - Lifetime JP3573945B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06180698A JP3573945B2 (ja) 1998-03-12 1998-03-12 フォーマット認識装置及び文字読み取り装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06180698A JP3573945B2 (ja) 1998-03-12 1998-03-12 フォーマット認識装置及び文字読み取り装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2004015293A Division JP3923474B2 (ja) 2004-01-23 2004-01-23 文字読み取り装置

Publications (2)

Publication Number Publication Date
JPH11259597A true JPH11259597A (ja) 1999-09-24
JP3573945B2 JP3573945B2 (ja) 2004-10-06

Family

ID=13181714

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06180698A Expired - Lifetime JP3573945B2 (ja) 1998-03-12 1998-03-12 フォーマット認識装置及び文字読み取り装置

Country Status (1)

Country Link
JP (1) JP3573945B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165339A (ja) * 2006-12-27 2008-07-17 Mitsubishi Electric Information Systems Corp 帳票識別装置及び帳票識別プログラム
JP2008250425A (ja) * 2007-03-29 2008-10-16 Oki Electric Ind Co Ltd 帳票処理装置
JP2009025856A (ja) * 2007-07-17 2009-02-05 Hitachi Computer Peripherals Co Ltd 帳票識別プログラム及び帳票識別装置
JP2009258815A (ja) * 2008-04-14 2009-11-05 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
US8589416B2 (en) 2010-01-20 2013-11-19 Fuji Xerox Co., Ltd. System and method of performing data processing on similar forms
JP2020016969A (ja) * 2018-07-24 2020-01-30 富士通フロンテック株式会社 プログラム及び帳票分類装置
JP2021167990A (ja) * 2020-04-08 2021-10-21 Arithmer株式会社 レイアウト解析装置、その解析プログラムおよびその解析方法
US11288786B2 (en) 2019-03-20 2022-03-29 Pfu Limited Information processing device, method and medium

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165339A (ja) * 2006-12-27 2008-07-17 Mitsubishi Electric Information Systems Corp 帳票識別装置及び帳票識別プログラム
JP2008250425A (ja) * 2007-03-29 2008-10-16 Oki Electric Ind Co Ltd 帳票処理装置
JP2009025856A (ja) * 2007-07-17 2009-02-05 Hitachi Computer Peripherals Co Ltd 帳票識別プログラム及び帳票識別装置
JP2009258815A (ja) * 2008-04-14 2009-11-05 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
US8391607B2 (en) 2008-04-14 2013-03-05 Fuji Xerox Co., Ltd. Image processor and computer readable medium
US8589416B2 (en) 2010-01-20 2013-11-19 Fuji Xerox Co., Ltd. System and method of performing data processing on similar forms
JP2020016969A (ja) * 2018-07-24 2020-01-30 富士通フロンテック株式会社 プログラム及び帳票分類装置
US11288786B2 (en) 2019-03-20 2022-03-29 Pfu Limited Information processing device, method and medium
JP2021167990A (ja) * 2020-04-08 2021-10-21 Arithmer株式会社 レイアウト解析装置、その解析プログラムおよびその解析方法

Also Published As

Publication number Publication date
JP3573945B2 (ja) 2004-10-06

Similar Documents

Publication Publication Date Title
JP3088019B2 (ja) 媒体処理装置及び媒体処理方法
US5721940A (en) Form identification and processing system using hierarchical form profiles
US6006240A (en) Cell identification in table analysis
US7519226B2 (en) Form search apparatus and method
US6038351A (en) Apparatus and method for multi-entity, mixed document environment document identification and processing
JPH08293001A (ja) 画像処理装置及び光学的文字認識装置及びそれらの方法
JP2002312385A (ja) 文書自動分割装置
US20050123199A1 (en) Method for optical recognition of a multi-language set of letters with diacritics
US5561720A (en) Method for extracting individual characters from raster images of a read-in handwritten or typed character sequence having a free pitch
JP3573945B2 (ja) フォーマット認識装置及び文字読み取り装置
JP3923474B2 (ja) 文字読み取り装置
JP4543675B2 (ja) 文字・図形の認識方法
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP4347675B2 (ja) 帳票ocrプログラム、方法及び装置
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JP3159087B2 (ja) 文書照合装置および方法
JP2001126010A (ja) 帳票処理装置、帳票定義作成方法、領域抽出方法及び記憶媒体
JP4864574B2 (ja) 帳票処理装置
JP3091278B2 (ja) 文書認識方式
JP4221960B2 (ja) 帳票識別装置及びその識別方法
JP3276554B2 (ja) フォーマット認識装置及び文字読取り装置
JP4318311B2 (ja) 帳票並びに帳票処理装置および帳票処理プログラム
JP2537973B2 (ja) 文字認識装置
JP2963474B2 (ja) 類似文字識別方法
JP3428504B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040629

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040630

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080709

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090709

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100709

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110709

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120709

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130709

Year of fee payment: 9

EXPY Cancellation because of completion of term