JPH10154204A - パターン認識装置及びパターン認識方法 - Google Patents

パターン認識装置及びパターン認識方法

Info

Publication number
JPH10154204A
JPH10154204A JP9261291A JP26129197A JPH10154204A JP H10154204 A JPH10154204 A JP H10154204A JP 9261291 A JP9261291 A JP 9261291A JP 26129197 A JP26129197 A JP 26129197A JP H10154204 A JPH10154204 A JP H10154204A
Authority
JP
Japan
Prior art keywords
character
recognition
pattern
frame
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9261291A
Other languages
English (en)
Other versions
JP4176175B2 (ja
Inventor
Satoshi Naoi
聡 直井
Misako Suwa
美佐子 諏訪
Yoshinobu Hotsuta
悦伸 堀田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP26129197A priority Critical patent/JP4176175B2/ja
Publication of JPH10154204A publication Critical patent/JPH10154204A/ja
Application granted granted Critical
Publication of JP4176175B2 publication Critical patent/JP4176175B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 文字の書かれている環境に応じた適切な認識
処理を精度良く行う。 【解決手段】 環境認識手段1は、第1の状態〜第Nの
状態を入力画像から抽出し、第1〜第Nのパターン認識
手段2、4、6の中から、第1の状態〜第Nの状態に対
応するものを呼び出して認識処理を実行させる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はパターン認識装置及
びパターン認識方法に係わり、特に手書き用文字認識装
置のみならず、印刷文字認識装置や図面認識装置におけ
る文字、図形及び記号の認識を入力画像の様々な状態に
応じて正確に行うようにするものである。
【0002】
【従来の技術】OCR(Optical Character Reader) 等
の手書き文字認識装置は、会計帳票などに書かれている
文字を自動的に読み取って、文字を自動入力することに
より、会計帳票などから人手で文字を見つけ出し、文字
をキー入力するような手間を省くようにしていた。
【0003】図79は、従来の手書き文字認識装置の構
成を示すブロック図である。図79において、帳票/文
書311をスキャナで読み込み、その帳票/文書311
の多値画像を得る。
【0004】次に、前処理部312において、その多値
画像の2値化、雑音除去、帳票/文書311の傾き補正
を行う。次に、文字切り出し部313において、予め定
義されている罫線情報や文字の位置情報を用いることに
より、文字を1文字づつ切り出す。
【0005】次に、文字認識部314において、それぞ
れの文字ごとに文字認識を行い、文字コードを出力す
る。ここで、この文字認識は、文字切り出し部313に
より切り出された未知の文字パターンの特徴のそれぞれ
に対し、認識辞書315に予め登録されている個々の文
字カテゴリの特徴と1つずつ照合することにより行われ
る。
【0006】例えば、2次元の文字パターンを文字の特
徴を表す特徴空間上の特徴ベクトルに変換し、未知の文
字パターンと認識辞書315に予め登録されている文字
カテゴリとの類似度として、特徴空間上の特徴ベクトル
間の距離を算出する。そして、未知の文字パターンの特
徴ベクトルと認識辞書315に予め登録されている文字
カテゴリの特徴ベクトルとの間の距離が最も近いもの
を、未知の文字パターンに対応する文字カテゴリとして
認識する。
【0007】ここで、消し線、雑音、模様などの非文字
を文字と誤って認識し、文字の文字コードが非文字に対
して出力されることを防止するため、2つの特徴ベクト
ル間の距離に対してしきい値を設定しておく。そして、
2つの特徴ベクトル間の距離がこのしきい値以上の場
合、未知の文字パターンが認識辞書315に予め登録さ
れている文字カテゴリのどれに対応しているのかかわか
らないとするか、非文字であると判断してリジェクトコ
ードを出力するようにしていた。
【0008】また、認識辞書315として、高品質文
字、かすれ文字、つぶれ文字のそれぞれの文字カテゴリ
の特徴を登録したものを用意しておき、高品質文字に対
しては、高品質文字についての認識辞書315を使用
し、かすれ文字に対しては、かすれ文字についての認識
辞書315を使用し、つぶれ文字に対しては、つぶれ文
字についての認識辞書315を使用することにより、帳
票/文書311の文字の品質の違いに対応できるように
していた。
【0009】
【発明が解決しようとする課題】しかしながら、従来の
手書き文字認識装置は、文字がかすれている場合であっ
ても、文字がつぶれている場合であっても、文字が高品
質文字であっても、切り出した1文字に対して、同一の
認識辞書315を用いて画一的に処理を行っていた。
【0010】このため、認識辞書315に登録してある
かすれ文字についての情報が、高品質文字の認識処理を
行う際に悪影響を及ぼし、かすれ文字が認識辞書315
に登録してあるために、高品質文字が読めなくなってし
まうという問題があった。
【0011】また、かすれやつぶれだけでなく、文字が
罫線に接触しているなどの文字が書かれている環境は様
々なものがあり、画一的な認識辞書315で様々な環境
に対応しようとした場合、互いに相互作用を及ぼし合
い、認識処理の精度の大幅な改善は望めないという問題
があった。
【0012】そこで、本発明の目的は、文字の書かれて
いる環境に応じた適切な認識処理を精度よく行うことが
可能なパターン認識装置及びパターン認識方法を提供す
ることである。
【0013】
【課題を解決するための手段】上述した課題を解決する
ために、本発明によれば、処理対象の状態を入力画像か
ら抽出し、その状態に適した認識処理を処理対象ごとに
選択することにより、パターン認識を行うようにしてい
る。
【0014】このことにより、様々な状態を有する入力
画像に対し、それぞれの状態に適したパターン認識処理
を行うことができ、認識処理を精度よく行うことが可能
となる。
【0015】また、本発明の一態様によれば、処理対象
の状態を入力画像から抽出し、第1の状態を有する処理
対象に対しては、第1の状態専用のパターン認識処理を
行い、第2の状態を有する処理対象に対しては、第2の
状態専用のパターン認識処理を行うようにしている。
【0016】このことにより、第1の状態を有する処理
対象の認識処理と第2の状態を有する処理対象の認識処
理とが互いに相互作用を及ぼすことがなくなり、認識処
理を精度よく行うことが可能となる。
【0017】また、本発明の一態様によれば、様々な状
態を有する入力画像に対し、認識辞書を使い分けるよう
にしている。このことにより、例えば、かすれ文字やつ
ぶれ文字や高品質文字が入力画像の中に混在している場
合においても、かすれ文字に対してはかすれ文字に適し
た認識辞書を使用し、つぶれ文字に対してはつぶれ文字
に適した認識辞書を使用し、高品質文字に対しては高品
質文字に適した認識辞書を使用して認識処理を行うこと
ができ、認識処理を精度よく行うことが可能となる。
【0018】また、本発明の一態様によれば、様々な状
態を有する入力画像に対し、識別関数を使い分けるよう
にしている。このことにより、例えば、1文字枠に書か
れている文字についてはシティブロック距離を用いて文
字認識を行い、フリーピッチ枠に書かれている文字に対
しては判別関数を用いて文字の切り出し信頼度を考慮し
ながら文字認識を行うことができ、認識処理を精度よく
行うことが可能となる。
【0019】また、本発明の一態様によれば、様々な状
態を有する入力画像に対し、知識を使い分けるようにし
ている。このことにより、例えば、未知文字の変形が大
きくて、認識辞書に格納されている文字カテゴリとの対
応関係が取れない場合、文字セグメントに文字を分割す
ることにより、未知文字と文字カテゴリとの対応関係を
とるようにしたり、文字列から文字を切り出す場合、学
習パターンに基づいて生成した判別関数を用いて切り出
し信頼度を算出したり、枠接触文字についての文字認識
を行う場合、学習パターンにより得られた信頼度を用い
て、枠接触文字についての認識信頼度を評価したりする
ことができ、認識処理を精度よく行うことが可能とな
る。
【0020】また、本発明の一態様によれば、同一の処
理対象に対して複数の認識処理が呼ばれた場合、認識処
理による信頼度が所定の値以上となるまで、優先順位に
従って認識処理を行わせるようにしている。
【0021】このことにより、認識処理の信頼度を上げ
ることができ、認識処理の精度を向上させることができ
る。また、本発明の一態様によれば、入力画像から非文
字を抽出し、この非文字についての認識処理を文字につ
いての認識処理と別々に行うようにしている。
【0022】このことにより、文字が非文字とみなされ
たり、非文字が文字とみなされたりして認識処理が行わ
れることが減少し、認識処理を精度よく行うことが可能
となる。
【0023】
【発明の実施の形態】以下、本発明の一実施例によるパ
ターン認識装置について図面を参照しながら説明する。
【0024】図1は、本発明の一実施例によるパターン
認識装置の機能的な構成を示すブロック図である。図1
において、環境認識手段1は、第1〜第Nの状態を入力
画像から抽出する。ここで、入力画像から抽出される状
態とは、例えば、1文字枠やフリーピッチ枠や表などの
いずれの形式で文字が書かれているかの状態、文字と枠
との接触状態、文字のかすれ状態、文字のつぶれ状態、
文字が消し線で消されている状態などである。
【0025】第1のパターン認識手段2は、第1の状態
を有する処理対象についてのパターン認識処理を専用に
行い、第2のパターン認識手段4は、第2の状態を有す
る処理対象についてのパターン認識処理を専用に行い、
第Nのパターン認識手段6は、第Nの状態を有する処理
対象についてのパターン認識処理を専用に行う。
【0026】ここで、第1〜第Nのパターン認識手段
2、4、6は、それぞれの認識結果についての信頼度を
算出する信頼度算出手段3、5、7を備え、第1〜第N
のパターン認識手段2、4、6による認識結果について
の信頼度を算出する。
【0027】そして、環境認識手段1は、第1〜第Nの
パターン認識手段2、4、6の中から、第1〜第Nの状
態に対応するものを呼び出して認識処理を実行させる。
例えば、環境認識手段1が、入力画像から第1の状態を
抽出した場合、その第1の状態の処理対象に対して、第
1のパターン認識手段2によるパターン認識処理を呼び
出し、入力画像から第2の状態を抽出した場合、その第
2の状態の処理対象に対して、第2のパターン認識手段
4によるパターン認識処理を呼び出し、入力画像から第
Nの状態を抽出した場合、その第Nの状態の処理対象に
対して、第Nのパターン認識手段6によるパターン認識
処理を呼び出す。
【0028】また、環境認識手段1が、同一の処理対象
に対して、例えば、第1の状態及び第2の状態を抽出し
た場合、第1のパターン認識手段2によるパターン認識
処理及び第2のパターン認識手段4によるパターン認識
処理を、その同一の処理対象に対して呼び出す。
【0029】例えば、第1の状態が一文字枠に文字が書
かれている状態であるとし、第2の状態がフリーピッチ
枠に文字列が書かれている状態であるとし、第3の状態
が文字と枠とが接触している状態であるとし、第4の状
態が文字のかすれ状態であるとし、第5の状態が文字の
つぶれ状態であるとし、第6の状態が文字が消し線で訂
正された状態であるとすると、第1のパターン認識手段
2は一文字枠に書かれている文字についての認識処理を
行い、第2のパターン認識手段4はフリーピッチ枠に書
かれている文字列についての認識処理を行い、第3のパ
ターン認識手段は枠接触文字についての認識処理を行
い、第4のパターン認識手段はかすれ文字についての認
識処理を行い、第5のパターン認識手段はつぶれ文字に
ついての認識処理を行い、第6のパターン認識手段は訂
正文字についての認識処理を行う。
【0030】そして、環境認識手段1が、入力画像から
一文字枠を抽出した場合、その一文字枠に書かれている
文字に対し、第1のパターン認識手段2により認識処理
を実行させ、環境認識手段1が、入力画像からフリーピ
ッチ枠を抽出した場合、そのフリーピッチ枠に書かれて
いる文字に対し、第2のパターン認識手段4により認識
処理を実行させ、環境認識手段1が、入力画像から枠接
触文字を抽出した場合、その枠接触文字に対し、第3の
パターン認識手段により認識処理を実行させ、環境認識
手段1が、入力画像からかすれ文字を抽出した場合、そ
のかすれ文字に対し、第4のパターン認識手段により認
識処理を実行させ、環境認識手段1が、入力画像からつ
ぶれ文字を抽出した場合、そのつぶれ文字に対し、第5
のパターン認識手段により認識処理を実行させ、環境認
識手段1が、入力画像から訂正文字の候補を抽出した場
合、その訂正文字の候補に対し、第6のパターン認識手
段により認識処理を実行させる。
【0031】また、例えば、環境認識手段1が、入力画
像からフリーピッチ枠に接触している枠接触文字を抽出
した場合、そのフリーピッチ枠に接触している枠接触文
字に対し、パターン認識手段2及びパターン認識手段3
により認識処理を実行させ、入力画像からフリーピッチ
枠に接触している消し線付きの枠接触文字を抽出した場
合、そのフリーピッチ枠に接触している消し線付きの枠
接触文字に対し、第2のパターン認識手段4、第3のパ
ターン認識手段及び第6のパターン認識手段により認識
処理を実行させる。
【0032】ここで、同一の処理対象についての複数の
状態が入力画像から抽出され、それに対応して複数のパ
ターン認識手段2、4、6が呼び出された場合、複数の
パターン認識手段2、4、6をどの順序で呼び出すかを
格納した処理順序テーブルに基づいて、複数のパターン
認識手段2、4、6による認識処理の順序を決定する。
そして、パターン認識手段2、4、6による認識処理に
より、所定のしきい値以上の信頼度が信頼度算出手段
3、5、7により得られるまで、複数のパターン認識手
段2、4、6による認識処理を呼び出し順序に従って順
次に実行する。
【0033】例えば、環境認識手段1が、入力画像から
フリーピッチ枠に接触している枠接触文字を抽出した場
合、そのフリーピッチ枠に接触している枠接触文字に対
し、パターン認識手段3による認識処理を実行してから
パターン認識手段2による認識処理を実行し、入力画像
からフリーピッチ枠に接触している消し線付きの枠接触
文字を抽出した場合、そのフリーピッチ枠に接触してい
る消し線付きの枠接触文字に対し、第3のパターン認識
手段による認識処理を実行してから第6のパターン認識
手段による認識処理を実行し、さらに、第2のパターン
認識手段4による認識処理を実行させる。
【0034】図2は、図1の環境認識手段1の一実施例
の構成を示すブロック図である。図2において、状態抽
出手段1aは、第1〜第Nの状態を入力画像から抽出す
る。
【0035】認識処理制御手段1bは、状態抽出手段1
aにより抽出された第1〜第Nの状態に対応させて、図
1の第1〜第Nのパターン認識手段2、4、6の中のい
ずれか1つ又は複数を呼び出して認識処理を行わせる。
【0036】処理順序テーブル1fは、第1〜第Nのパ
ターン認識手段2、4、6の中から複数の認識手段が呼
び出された際に、これらの第1〜第Nのパターン認識手
段2、4、6をどのような順序で実行するかを示す処理
順序を格納する。
【0037】処理順序制御ルール格納手段1dは、状態
抽出手段1aにより抽出された第1〜第Nの状態に基づ
いて、第1〜第Nのパターン認識手段2、4、6の中か
らどの認識手段を呼び出すかを示す呼び出し手順を格納
する。
【0038】中間処理結果テーブル作成手段1cは、処
理順序制御ルール格納手段1dに格納されている呼び出
し手順及び処理順序テーブル1fに格納されている処理
順序に基づいて、第1〜第Nのパターン認識手段2、
4、6の実行順序を示す中間処理結果テーブルを作成す
る。
【0039】処理実行ルール格納手段1eは、中間処理
結果テーブルに記入された認識処理の実行結果に基づい
て、次の処理の実行を指示する手順を格納する。図3
は、本発明の一実施例によるパターン認識装置の具体的
な構成を示すブロック図である。
【0040】図3において、環境認識系11は、入力画
像の状態を抽出し、この抽出された状態に基づいて、文
字認識部12の基本文字認識部17、文字列認識部1
5、接触文字認識部13、かすれ文字認識部19、つぶ
れ文字認識部21又は非文字認識部25の消し線認識部
26及び雑音認識部28のいずれか1つ又は複数を呼び
出す。ここで、入力画像の状態を抽出するために、入力
画像のレイアウト解析、品質解析及び訂正解析を行う。
【0041】文字認識部12は、入力画像の状態ごとに
文字認識処理を行うもので、文字についての文字認識を
行う基本文字認識部17、文字列についての文字認識B
及び文字切り出しBを行う文字列認識部15、枠に接触
した文字についての文字認識A及び文字切り出しAを行
う接触文字認識部13、かすれ文字についての文字認識
C及び文字切り出しCを行うかすれ文字認識部19、つ
ぶれ文字についての文字認識D及び文字切り出しDを行
うつぶれ文字認識部21及びくせ字についての文字認識
E及び文字切り出しEを行うくせ字認識部23を備えて
いる。
【0042】また、基本文字認識部17、文字列認識部
15、接触文字認識部13、かすれ文字認識部19、つ
ぶれ文字認識部21及びくせ字認識部23はそれぞれ、
文字認識の手法についての知識を格納した知識テーブル
14、16、18、20、22、24を備えている。知
識テーブル14には、例えば、枠接触状態と認識の信頼
度に関する知識や重複の部分パターン法に関する知識が
格納され、知識テーブル16には、例えば、切り出しの
信頼度に関する知識や切り出しと認識の融合法に関する
知識が格納され、知識テーブル18には、例えば、詳細
識別法に関する知識が格納されている。
【0043】非文字認識部25は、入力画像の状態ごと
に非文字認識処理を行うもので、消し線についての非文
字認識F及び非文字切り出しFを行う消し線認識部2
6、雑音についての非文字認識G及び非文字切り出しG
を行う雑音認識部28を備えている。
【0044】また、消し線認識部26及び雑音認識部2
8はそれぞれ、非文字認識の手法についての知識を格納
した知識テーブル27、29を備えている。図4は、環
境認識系11の全体的な処理の一例を示すフローチャー
トである。
【0045】図4において、まず、ステップS1に示す
ように、入力画像の前処理を行う。この入力画像の前処
理は、ファクシミリやスキャナなどにより2値化された
入力画像に対しラベリングを行い、入力画像とラベル画
像とを格納するものである。なお、入力画像とラベル画
像とは、これ以降の処理でいつでもアクセスできるよう
にしておく。
【0046】図5は、図4の入力画像の前処理を示すフ
ローチャートである。図5において、ステップS11に
示すように、2値化された入力画像に対しラベリングを
行うことにより、連結パターンを抽出してラベル付けを
行い、抽出したラベル画像と入力画像とを格納する。こ
の際、ラベル付けされた連結パターンを外接矩形の加減
算で圧縮表現することにより、メモリ容量を削減する。
このラベル付けされた連結パターンの圧縮表現によれ
ば、例えば、400dpiの高解像度のスキャナで入力
したA4サイズ(約3000×4000)の文書/帳票
に対し、、数百キロバイト以内で表すことができる。
【0047】次に、図4のステップS2に示すように、
レイアウト解析を行う。このレイアウト解析は、ラベル
付けされた連結パターンのサイズや配置状態などに基づ
いて、テキスト認識、罫線抽出、枠抽出、枠の種類及び
表の判別、枠接触文字の有無の判断及び図認識を行う。
【0048】図6は、図4のレイアウト解析を示すフロ
ーチャートである。図6において、まず、ステップS2
1に示すように、テキスト認識を行う。このテキスト認
識は、ラベル付けされた連結パターンのサイズを解析
し、連結パターンのサイズが比較的小さいものを抽出
し、これを文字の候補とみなす。そして、隣接する文字
の候補を統合することにより、テキストを抽出する。
【0049】次に、ステップS22に示すように、罫線
抽出を行う。この罫線抽出は、ステップS21でテキス
トと認識されなかった連結パターンを対象として、縦又
は横方向のヒストグラム値が大きいものについての探索
を行うことにより、罫線を抽出する。
【0050】次に、ステップS23に示すように、枠抽
出を行う。この枠抽出は、ステップS22で抽出された
罫線から4辺に相当する罫線を見つけて枠を抽出する。
次に、ステップS24に示すように、枠の種類/表判別
を行う。この枠の種類/表判別は、ステップS23で抽
出された枠に対し、その枠の種類を判別して枠の種類の
属性を付与する。枠の種類の属性としては、一文字枠、
ブロック枠、フリーピッチ枠、表などがある。
【0051】次に、ステップS25に示すように、枠接
触文字の有無の判断を行う。この枠接触文字の有無の判
断は、枠内を枠線に沿って探索した際に、交差するパタ
ーンがあるかどうかを検出し、交差するパターンがある
場合は、文字が枠に接触しているものと判断する。ここ
で、交差するパターンが存在していても、注目している
枠の隣の枠から、文字がはみ出している場合があるの
で、交差するパターンが隣の枠からはみ出しているもの
については、注目している枠に対し、接触文字でないと
する。
【0052】次に、ステップS26に示すように、図認
識を行う。この図認識は、テキストや枠や表などの属性
が付与されなかったサイズが比較的大きな連結パターン
に対して、図の属性を付与する。
【0053】次に、図4のステップS3に示すように、
品質解析を行う。この品質解析は、入力画像にかすれや
つぶれがあるかどうかを検出するもので、大局的品質解
析と局所的品質解析とがある。
【0054】この品質解析では、所定の領域について、
(面積、縦/横の長さがそれぞれ所定のしきい値以下の
連結領域の数)/(前記所定の領域の全ての連結領域の
数)の値が、所定値よりも大きい時にかすれと判断す
る。
【0055】また、罫線抽出の際にかすれた罫線を部分
的に統合した情報を用いることにより、所定の領域につ
いて、(かすれた罫線を補完した際の補完された部分の
長さの合計)/(各罫線の長さの合計)の値が、所定値
よりも大きい時にかすれと判断する。
【0056】さらに、所定の領域について、(黒画素密
度が所定のしきい値より大きい連結領域の数)/(前記
所定の領域の全ての連結領域の数)の値が、所定値より
も大きい時につぶれと判断する。
【0057】図7は、図4の品質解析を示すフローチャ
ートである。図7において、まず、ステップS31に示
すように、大局的品質解析を行う。この大局的品質解析
は、文書/帳票全体に対して品質解析を行うもので、入
力画像を2値化する際のしきい値が適切であったかどう
か、ファクシミリで送られてきた文書/帳票に対してノ
イズが全体にのったため品質が不正常になっていないか
どうか、かすれやつぶれが発生していないかを解析す
る。
【0058】次に、ステップS32に示すように、局所
的品質解析を行う。この局所的品質解析は、レイアウト
解析により一文字枠やテキストやフリーピッチ枠や表な
どの属性が付与された領域ごとに かすれやつぶれが発
生していないかを調べたり、ノイズが発生していないか
を調べたりして品質解析を行うものである。
【0059】次に、図4のステップS4に示すように、
訂正解析を行う。この訂正解析は、入力画像から消し線
を抽出して、消し線で訂正された文字については、文字
の認識処理を省略できるようにするものである。
【0060】図8は、図4の訂正解析を示すフローチャ
ートである。図8において、まず、ステップS41に示
すように、訂正特徴抽出を行う。この訂正特徴抽出は、
訂正文字に有効な特徴を抽出するもので、訂正文字に
は、つぶれた文字、2重線で消した文字、斜線で消した
文字及びばつで消した文字の大きく分けて4種類あり、
各訂正文字の特徴を黒画素線密度、線密度、オイラー
数、ヒストグラム値などを算出して抽出する。
【0061】次に、ステップS42に示すように、訂正
文字候補抽出を行う。この訂正文字候補抽出は、訂正文
字の特徴を表す特徴空間で、訂正文字と訂正されていな
い通常文字との分布の違いから訂正文字の候補を抽出す
る。
【0062】次に、図4のステップS5に示すように、
文字認識/非文字認識の制御を行う。この文字認識/非
文字認識の制御は、図4のステップS2〜S4で抽出さ
れた入力画像の状態に基づいて、文字認識部12の基本
文字認識部17、文字列認識部15、接触文字認識部1
3、かすれ文字認識部19、つぶれ文字認識部21又は
非文字認識部25の消し線認識部26及び雑音認識部2
8のいずれを呼び出すかを決定するもので、中間処理結
果テーブルの読み込み/処理順序制御ルールの実行、終
了判定や処理実行ルールによる処理の実行を行う。
【0063】ここで、処理順序制御ルールは、環境認識
系11が抽出した状態に基づいて、文字認識部12の基
本文字認識部17、文字列認識部15、接触文字認識部
13、かすれ文字認識部19、つぶれ文字認識部21又
は非文字認識部25の消し線認識部26及び雑音認識部
28のいずれを呼び出すかの手順を示すものである。
【0064】また、処理実行ルールは、処理順序制御ル
ールにより呼ばれた認識処理の結果に基づいて、次にど
のような処理を行うのかの手順を示すものである。ま
た、中間処理結果テーブルは、レイアウト解析により一
文字枠やテキストやフリーピッチ枠や表などの属性が付
与された領域ごとに、図4のステップS2〜S4で抽出
された入力画像の状態を記入するとともに、入力処理順
序制御ルールにより呼ばれた処理を処理順序テーブルに
格納されている処理順序で記入するものである。
【0065】例えば、環境認識系11が、文字を抽出し
た場合、この文字に対しては、基本文字認識部17を呼
び出して認識処理を実行し、環境認識系11が、図6の
ステップS21でテキストを抽出した場合、このテキス
トに対しては、文字列認識部15を呼び出して認識処理
を実行し、環境認識系11が、図6のステップS25で
枠接触文字を抽出した場合、この枠接触文字に対して
は、接触文字認識部13を呼び出して認識処理を実行
し、環境認識系11が、図7のステップS32で、(面
積、縦/横の長さがそれぞれ所定のしきい値以下の連結
領域の数)/(前記所定の領域の全ての連結領域の数)
の値が所定値よりも大きいと判断した場合、この領域の
文字に対しては、かすれ文字認識部19を呼び出して認
識処理を実行し、環境認識系11が、図7のステップS
32で、(黒画素密度が所定のしきい値より大きい連結
領域の数)/(前記所定の領域の全ての連結領域の数)
の値が所定値よりも大きいと判断した場合、この領域の
文字に対しては、つぶれ文字認識部21を呼び出して認
識処理を実行し、環境認識系11が、図8のステップS
42で、訂正文字候補を抽出した場合、この訂正文字候
補に対しては、消し線認識部26を呼び出して認識処理
を実行し、環境認識系11が、図7のステップS32で
雑音を検出した場合、この雑音に対しては、雑音認識部
28を呼び出して認識処理を実行する。
【0066】図9は、図4の文字認識/非文字認識の制
御を示すフローチャートである。図9において、まず、
ステップ51に示すように、中間処理結果テーブルの読
み込み/処理順序制御ルールの実行を行う。
【0067】次に、ステップ52に示すように、終了判
定を行う。この終了判定は、処理順序制御ルールに基づ
いて、中間処理結果テーブルの全ての処理が完了して中
間処理結果テーブルの全ての処理指示欄に終了が記入さ
れた場合、終了と判定する。終了判定で未終了と判定さ
れた場合、ステップ53に進んで、処理実行ルールによ
る処理を実行してステップ51に戻り、ステップ52の
終了判定で終了と判定されるまで以上の処理を繰り返
す。
【0068】図10は、本発明の一実施例によるパター
ン認識装置のシステム構成を示すブロック図である。図
10において、画像格納部41は帳票画像を格納し、処
理条件格納部42は帳票のレイアウト構造や読み取り文
字情報、例えば、枠の位置、種類、サイズ、文字種、文
字数などの定義体を格納し、ラベル画像格納部43はラ
ベル付けされたラベル画像を圧縮表現により格納する。
【0069】環境認識系30はレイアウト解析部31及
び訂正解析部32を備え、環境認識系38はくせ字解析
部39及び終了判定処理部40を備え、文字認識系/非
文字認識系33は基本文字認識部34、黒枠接触文字認
識部35、フリーピッチ文字列認識部36及び消し線認
識部37を備えている。
【0070】レイアウト解析部31は、ラベル画像格納
部43に格納されているラベル画像について、処理条件
格納部42に格納されている定義体を参照しながら、罫
線抽出、枠抽出及び黒枠接触文字抽出を行う。ここで、
枠の位置やサイズなどのフォーマット情報及び傾きに関
する情報を予め帳票データとして格納しておき、この帳
票データに基づいて、罫線抽出や枠抽出を行う方法は、
例えば、特開昭62−21288号公報や特開平3−1
26186号公報に記載されている。
【0071】なお、例えば、特開平6−309498号
公報や特開平7−28937号公報に記載されているよ
うに、枠の位置やサイズなどのフォーマット情報の入力
を必要とせずに、罫線抽出や枠抽出を行うようにしても
よい。
【0072】訂正解析部32は消し線候補の抽出を行
い、くせ字解析部39は個人筆記特性によるくせ字の解
析を行い、終了判定処理部40は文字認識の終了判定を
行い、終了判定で終了と判定された場合、文字認識結果
の出力を行う。
【0073】基本文字認識部34は、1文字ごとに切り
出された文字の認識を行い、黒枠接触文字認識部35
は、黒枠接触文字から枠を除去し、その枠を除去するこ
とによりかすれた文字の補完を行ってから文字の認識を
行い、フリーピッチ文字列認識部36は、文字列から文
字を切り出す際の切り出し信頼度を考慮しながら文字列
についての文字認識を行い、消し線認識部37は、訂正
文字の黒画素線密度、線密度、オイラー数、ヒストグラ
ムなどに基づいて、消し線の認識を行う。
【0074】中間処理結果テーブル44は、環境認識系
30、38により抽出された状態に基づいて、文字認識
系/非文字認識系33のいずれの処理を実行するかを示
す処理順序やその処理結果を格納する。
【0075】図11は、図1〜3のパターン認識装置が
適用される文字認識システムの具体的な構成を示すブロ
ック図である。図11において、51は全体的な処理を
行う中央演算処理ユニット(CPU)、52はCPU5
1で実行されるプログラムを格納するプログラムメモ
リ、53は画像データをビットマップ形式で格納する画
像メモリ、54は画像処理に使用するワークメモリ、5
5は画像を光学的に読み取るスキャナ、56はスキャナ
55により読み取られた情報を一時的に格納するメモ
リ、57は各文字画像の特徴を格納した辞書ファイル、
58は認識結果を表示するディスプレイ、59は認識結
果を印刷するプリンタ、60はディスプレイ58及びプ
リンタ59の入出力インターフェイス、61はCPU5
1、プログラムメモリ52、画像メモリ53、ワークメ
モリ54、メモリ56、辞書ファイル57、入出力イン
ターフェイス60及びドライバ64を接続しているバ
ス、62は通信ネットワーク63を介してデータやプロ
グラムの送受信を行う通信インターフェイス、64はド
ライバ、65はハードディスク、66はICメモリカー
ド、67は磁気テープ、68はフロッピーディスク、6
9はCD−ROMやDVD−ROMなどの光ディスクで
ある。
【0076】この文字認識システムは、スキャナ55に
より読み取った画像データをメモリ56に一時的に格納
し、その画像データをビットマップ形式で画像メモリ5
3に展開する。そして、画像メモリ53からワークメモ
リ54にコピーされた2値画像データに対してパターン
抽出処理を行う。その結果に基づいて、スキャナ55に
より読み取った画像データから文字画像の切り出しを行
い、切り出された文字画像の特徴と辞書ファイル57に
格納された特徴データとの比較を行い、文字の認識を行
う。その後、その認識結果を、ディスプレイ58又はプ
リンタ59に出力する。
【0077】この文字認識システムにおいて、図1〜3
のパターン抽出装置は、プログラムメモリ52に格納さ
れたプログラムに従って処理を行うCPU51の機能と
して実現される。ここで、パターン抽出処理を行うプロ
グラムは、プログラムメモリ52のROMに予め格納し
ておくことが可能である。また、パターン抽出処理を行
うプログラムを、ハードディスク65、ICメモリカー
ド66、磁気テープ67、フロッピーディスク68また
は光ディスク69などの記憶媒体からプログラムメモリ
52のRAMにロードした後、このプログラムをCPU
51で実行させるようにしてもよい。
【0078】さらに、パターン抽出処理を行うプログラ
ムを、通信インターフェイス62を介して通信ネットワ
ーク63から取り出すこともできる。通信インターフェ
イス62と接続される通信ネットワーク63として、例
えば、LAN(LocalArea Networ
k)、WAN(Wide Area Networ
k)、インターネット、アナログ電話網、デジタル電話
網(ISDN:Integral Service D
igital Network)、PHS(パーソナル
ハンディシステム)や衛星通信などの無線通信網などを
用いることが可能である。
【0079】以下、図3の環境認識系11、文字認識部
12及び非文字認識部25の構成をより具体的に説明す
る。図12は、図5のステップS11のラベリング処理
を説明する図である。
【0080】図12において、“0”と“1”とからな
る2値画像がラベリング処理部70に入力されると、ラ
ベリング処理部70は、連結した画素で構成される連結
パターンを入力された2値画像から抽出し、各連結パタ
ーンごとにラベルを付したラベル画像を生成して、ラベ
ル画像格納部71に格納する。例えば、“0”と“1”
とからなる2値画像72が入力された場合、各連結パタ
ーンごとにラベル“1”、“2”、“3”を付してラベ
ル画像73を生成する。
【0081】ここで、例えば、255個の連結パターン
が1画像内に存在する場合、255個のラベルが必要と
なるため、1画素当たり8ビットを必要とし、ラベル画
像格納部71に必要な記憶容量は、1画像全体の画素数
の8倍となり、ラベル画像を格納するために多くの記憶
容量が必要となる。
【0082】図13は、図12のラベル画像73を圧縮
表現することにより、ラベル画像格納部71に必要な記
憶容量を削減する方法を説明する図である。図13にお
いて、例えば、図13(a)の連結パターンA1 及び連
結パターンA2 のそれぞれに対し、図13(b)に示す
ように、ラベル“1”及びラベル“2”が付され、図1
3(c)に示すように、連結パターンA1 に外接する外
接矩形B1 及び連結パターンA2 に外接する外接矩形B
2 が生成されている。外接矩形B1 及び外接矩形B
2 は、図13(d)に示すように、その外接矩形B1
び外接矩形B2 の左上頂点の座標(x1 、y1 )及び右
下頂点の座標(x2 、y2)によって特定することがで
きる。
【0083】そして、連結パターンA1 に外接する外接
矩形B1 と連結パターンA2 に外接する外接矩形B2
が重なっているかどうかを判定し、連結パターンA1
外接する外接矩形B1 と連結パターンA2 に外接する外
接矩形B2 とが重なっていない場合、それぞれの外接矩
形B1 及び外接矩形B2 の左上頂点の座標(x1
1 )及び右下頂点の座標(x2 、y2 )を記憶する。
【0084】一方、連結パターンA1 に外接する外接矩
形B1 と連結パターンA2 に外接する外接矩形B2 とが
重なっている場合、他の外接矩形と重ならないようによ
り小さな矩形領域に外接矩形B1 及び外接矩形B2 を細
分化し、細分化された矩形領域が元の外接矩形B1 及び
外接矩形B2 のどちらに属するかを判定し、連結パター
ンA1 及び連結パターンA2 を、細分化された矩形領域
の和や差などの演算で表現する。
【0085】例えば、図13(c)において、連結パタ
ーンA1 は、連結パターンA1 に属する最大の矩形領域
(1−1)及び矩形領域(1−1)に含まれる矩形領域
(1−2)を用いて、 A1 =(1−1)−(1−2) のように矩形領域(1−1)と矩形領域(1−2)との
差で表現することができる。
【0086】また、連結パターンA2 は、連結パターン
2 に属する最大の矩形領域(2−1)、矩形領域(2
−1)に含まれる矩形領域(2−2)及び矩形領域(2
−2)に含まれる矩形領域(2−3)を用いて、 A2 =(2−1)−(2−2)+(2−3) のように矩形領域(2−1)と矩形領域(2−2)との
差及び矩形領域(2−3)との和で表現することができ
る。
【0087】このように、連結パターンを連結する画素
の外接矩形で表現することにより、連結パターンを表現
する情報量を減らして、ラベル画像を格納するために必
要な記憶容量を削減することができる。
【0088】なお、このラベル画像の圧縮表現の方法に
ついては、例えば、特開平8−55219号公報に記載
されている。図14は、図6のステップS21のテキス
ト認識処理の一実施例を示すフローチャートである。
【0089】図14において、まず、ステップS61に
示すように、スキャナで文書を読み込み、読み込んだ文
書の画像データをメモリに格納する。次に、ステップS
62に示すように、ステップS61で読み込んだ画像デ
ータのうち、横方向の特定の区間の短冊状の部分領域だ
けに注目し、その注目した部分領域の中でラベリングを
行い、黒連結画素の外接矩形を求める。
【0090】例えば、処理対象として複数の文書A、
B、Cがあり、図15(a)の文書Aの文字列81の領
域が、図15(d)に示すように、区間Aの範囲内にあ
り、図15(b)の文書Bの文字列82の領域が、図1
5(d)に示すように、区間Aの範囲内にあり、図15
(c)の文書Cの文字列83の領域が、図15(d)に
示すように、区間Bの範囲内にある場合、この区間A,
Bの部分領域にのみ着目し、この部分領域の短冊状の中
でのみラベリング処理を行って、黒連結画素の外接矩形
を求める。
【0091】次に、ステップS63に示すように、ステ
ップS62で求めた外接矩形の高さと、予め求めておい
た矩形の高さylenとの差がしきい値thy以内で、
かつステップS62で求めた外接矩形の幅と、予め求め
ておいた矩形の幅xlenとの差がしきい値thx以内
であるような外接矩形だけを抽出する。そして、その外
接矩形が存在しているy方向(縦方向)の座標を求め、
メモリに記憶する。
【0092】次に、ステップS64に示すように、ステ
ップS63で求めたy方向の座標を中心として、ステッ
プS62で抽出した矩形を含む左右方向の長さが画像幅
に等しい横長部分領域に注目する。
【0093】次に、ステップS65に示すように、ステ
ップS64で求めた横長部分領域に対してラベリングを
行うことにより、黒連結画素の外接矩形を求める。次
に、ステップS66に示すように、ステップS65で求
めた外接矩形の高さと、予め求めておいた矩形の高さy
lenとの差がしきい値thy以内で、かつステップS
65で求めた外接矩形の幅と、予め求めておいた矩形の
幅xlenとの差がしきい値thx以内であるような外
接矩形だけを抽出し、メモリに記憶する。
【0094】次に、ステップS67に示すように、ステ
ップS66で抽出した矩形を対象にx座標でソートし、
抽出した矩形の中心線の間隔からピッチを計算し、この
計算により求めたピッチと予め求めておいたピッチpi
tchとの差がしきい値thpitch以内の矩形が横
方向に所定の数th個以上並んでいるものをテキストと
して出力する。
【0095】なお、このテキスト抽出方法については、
例えば、特開平8−171609号公報に記載されてい
る。次に、図6のステップS22の罫線抽出処理の一実
施例についてより具体的に説明する。
【0096】この罫線抽出処理は、ラベリングにより得
られた連結パターンを横方向及び縦方向に複数に分割
し、横方向及び縦方向に分割したそれぞれの範囲内で連
結パターンの隣接投影値を算出し、ある一定の長さの線
分又は直線の一部を矩形近似により検出することにより
罫線を抽出するものである。
【0097】ここで、隣接投影とは、注目行又は注目列
の投影値に周囲の行又は列の投影値を足し合わせたもの
である。また、注目行又は注目列の投影値は、その行又
は列に存在する黒画素の総和をとったものである。
【0098】図16は、この隣接投影処理を説明する図
である。図16において、i行の投影値をp(i)とす
ると、隣接投影値P(i)は、(1)式により算出する
ことができる。
【0099】 P(i)=p(i−j)+・・・+p(i)+・・・+p(i+j)(1) なお、図16に示す例は、(1)式においてj=1とお
いたものである。図17は、部分パターンの投影値の例
を示す図である。
【0100】図17において、縦方向の長さがLY 、横
方向の長さがLX の矩形84の水平方向jの投影値Ph
(i)をHP(i)、矩形84の垂直方向iの投影値P
v(j)をVP(j)とすると、HP(1)=HP
(n)=m、HP(2)〜HP(n−1)=2、VP
(1)=VP(m)=n、VP(2)〜VP(m−1)
=2である。
【0101】このように、矩形84を構成する直線が存
在している部分は、その投影値が大きくなるので、この
投影値を算出することにより、罫線を構成している直線
を抽出することができる。
【0102】例えば、隣接投影値と縦横それぞれの分割
長との比が所定の閾値以上である部分パターンを検出す
ることにより、罫線を構成している直線の候補を抽出す
ることができる。
【0103】図18は、罫線抽出処理を示すフローチャ
ートである。図18において、まず、ステップ601に
示すように、隣接投影値と縦横それぞれの分割長との比
が所定のしきい値以上であるかどうかを判定する。そし
て、隣接投影値と縦横それぞれの分割長との比が所定の
しきい値以上でないと判断された場合、ステップS60
2に進み、罫線を構成している線分が存在しないものと
みなす。
【0104】一方、ステップS601で隣接投影値と縦
横それぞれの分割長との比が所定のしきい値以上である
と判断された場合、ステップS603に進み、罫線を構
成している線分が存在するものとみなす。
【0105】次に、ステップS604において、ステッ
プS603で線分とみなされたパターンが、その上下に
存在する線分と接しているかどうかを判断する。そし
て、上記パターンが上下に存在する線分と接していない
と判断された場合、ステップS605に進み、そのパタ
ーンを矩形線分とする。
【0106】一方、ステップS604において、ステッ
プS603で線分とみなされたパターンがその上下に存
在する線分と接していると判断された場合、ステップS
606に進み、上記パターンとその上下に存在する線分
とを統合する。そして、ステップS607で、ステップ
S606で統合した線分を矩形線分として検出する。例
えば、図19(a)に示すような3つの矩形線分85を
統合し、図19(b)に示す1つの矩形線分86を得
る。この後、ステップS605又はステップS607で
求めた矩形線分を対象として探索を行うことにより、罫
線を抽出する。
【0107】なお、この罫線抽出処理については、例え
ば、特開平6−309498号公報に記載されている。
図20は、図6のステップS22の罫線抽出処理におい
て、かすれ罫線の補完を行いながら、探索を行う方法を
説明する図である。
【0108】このかすれ罫線の補完方法は、直線を構成
するパターンの探索を行う際、探索の進行方向にパター
ンのない空白領域が存在しても、一定の画素数以下の空
白領域に対してはパターンがあるとみなして探索を行う
ようにするものである。
【0109】例えば、図20に示すように、直線91に
対して、この直線91を構成する画素92の検索を行う
場合、一定の画素数以下の空白領域93に対しては画素
92があるとみなして探索を行う。
【0110】図21は、罫線抽出処理におけるかすれ罫
線の補完方法を示すフローチャートである。図21にお
いて、まず、ステップS71に示すように、所定の矩形
範囲内のパターンのうち、最も細い部分のX座標を算出
する。
【0111】次に、ステップS72に示すように、ステ
ップS71で算出したX座標におけるパターンの中心点
を算出する。そして、ステップS73に示すように、ス
テップS72で算出したパターンの中心点を探索の開始
点とする。ここで、探索の開始点をパターンの最も細い
部分とするのは、最も細い部分は文字である可能性が低
いため、枠となる直線の探索をより確実に行うことがで
きるからである。
【0112】次に、ステップS74で直線の探索方向を
右に設定する。次に、ステップS75に示すように、空
白領域の長さをカウントする変数Kの初期値を0に設定
する。
【0113】次に、ステップS76に示すように、ステ
ップS73で求めた開始点をパターンの探索の現在地と
設定する。次に、ステップS77に示すように、ステッ
プS76で設定した探索の現在地が、ステップS71で
注目した矩形範囲の内部であるかどうかの判定を行い、
探索の現在地が、ステップS71で注目した矩形範囲の
内部でない場合、ステップS86に進む。
【0114】一方、ステップS77で探索の現在地が、
ステップS71で注目した矩形範囲の内部であると判定
された場合、ステップS78に進み、探索の現在地から
みて探索方向隣にパターンがあるかどうか判定する。こ
こで、探索の現在地からみて探索方向隣にパターンがあ
るとは、図22に示すように、パターン101からみて
右方向隣の位置にパターン102が存在していることを
意味している。そして、探索の現在地からみて探索方向
隣にパターン102があると判定された場合、ステップ
S81に進み、探索方向隣にあるパターン102を探索
の現在地とする。
【0115】一方、ステップS78で探索の現在地から
みて探索方向隣にパターンがないと判定された場合、ス
テップS79に進み、探索の現在地からみて探索方向斜
め隣にパターンがあるかどうか判定する。
【0116】ここで、探索の現在地からみて探索方向斜
め隣にパターンがあるとは、図22に示すように、パタ
ーン103からみて右方向斜め隣の位置にパターン10
4a又はパターン104bが存在していることを意味し
ている。そして、探索の現在地からみて探索方向斜め隣
にパターン104a、104bがあると判定された場
合、ステップS83に進み、探索方向斜め隣にあるパタ
ーン104a、104bを探索の現在地とする。なお、
探索方向斜め隣にあるパターン104a、104bが2
つある場合はパターン104a、104bのどちらか一
方を探索の現在地とする。一方、ステップS79で探索
の現在地からみて探索方向斜め隣にパターン104a、
104bがないと判定された場合、ステップS80に進
み、空白領域の長さをカウントする変数Kがしきい値以
下であるかどうかを判定する。そして、空白領域の長さ
をカウントする変数Kがしきい値以下である場合、ステ
ップS84に進み、探索の現在地からみて探索方向隣に
ありパターンを構成しない画素を現在地とする。例え
ば、図20において、一定の画素数以下の空白領域93
に対してはパターンがあるとみなして探索を行う。
【0117】次に、ステップS85に示すように、空白
領域の長さをカウントする変数Kの値を1ドットだけ増
やし、ステップS77に戻る。一方、ステップS80で
空白領域の長さをカウントする変数Kがしきい値以下で
ないと判定された場合、ステップS86に進み、探索方
向は右に設定されているかどうかを判定する。そして、
探索方向は右に設定されていない場合、処理を終了す
る。
【0118】ステップS86で探索方向は右に設定され
ている場合、ステップS87に進み、探索方向を左に設
定する。そして、探索方向を右に設定して行った処理と
同様に、ステップS75〜ステップS85の処理を繰り
返す。
【0119】ここで、探索方向を左に設定して処理を行
う場合、探索の現在地からみて探索方向隣にパターンが
あるとは、図22に示すように、パターン105からみ
て左方向隣の位置にパターン106が存在していること
を意味している。また、探索の現在地からみて探索方向
斜め隣にパターンがあるとは、図22に示すように、パ
ターン107からみて左方向斜め隣の位置にパターン1
08a又はパターン108bが存在していることを意味
している。
【0120】なお、このかすれ罫線の補完方法について
は、例えば、特願平8−107568号の明細書及び図
面に記載されている。次に、図6のステップS23の枠
抽出処理について説明する。
【0121】図23は、一文字枠抽出処理の一実施例を
示すフローチャートである。図23において、まず、ス
テップS91に示すように、図18の処理により矩形線
分として検出されたパターンに対し探索を行う。この
際、図21のフローチャートに示すように、所定の長さ
の空白領域に対しては、パターンが存在するものとみな
して探索を行い、かすれを補完する。
【0122】次に、ステップS92に示すように、ステ
ップS91で探索を行った結果、パターンが所定の長さ
で途切れているかどうかを判断し、パターンが所定の長
さで途切れていない場合、図24のブロック枠抽出処理
に進む。一方、パターンが所定の長さで途切れている場
合、ステップS93に進み、探索された線分を統合して
直線を検出する。
【0123】次に、ステップS94に示すように、ステ
ップS93で検出した直線のうち、4方を囲んでいる直
線を抽出する。次に、ステップS95に示すように、4
方を直線で囲まれた部分の大きさが、同一画像内の一文
字枠の大きさの所定範囲内であるかどうかを判断し、4
方を直線で囲まれた部分の大きさが、同一画像内の一文
字枠の大きさの所定範囲内であるか場合、ステップS9
6に進んで、4方を直線で囲まれた部分を一文字枠であ
るとみなし、4方を直線で囲まれた部分の大きさが、同
一画像内の一文字枠の大きさの所定範囲内でない場合、
ステップS97に進んで、4方を直線で囲まれた部分を
一文字枠でないとみなす。
【0124】図24は、ブロック枠抽出処理の一実施例
を示すフローチャートである。図24において、まず、
ステップS101に示すように、探索により検出された
横直線が所定値以上の長さを有するかどうかを判断し、
探索により検出された横直線の長さが所定値より小さい
場合、ステップS102に進んで、その横直線を横枠で
ないとみなす。一方、探索により検出された横直線の長
さが所定値以上の場合、ステップS102に進み、探索
により検出された横直線を横枠であるとみなす。
【0125】次に、ステップS104に示すように、ス
テップS103で抽出された横枠から、互いに隣接する
2本の横枠を取り出す。次に、ステップS105に示す
ように、ステップS104で取り出した2本の横枠の間
に挟まれた範囲を1行のブロック枠とみなす。
【0126】次に、ステップS106に示すように、図
18の処理により検出された矩形線分のうち、縦方向の
矩形線分を抽出して縦線を検出する。次に、ステップS
107に示すように、ステップS106で検出した縦線
の探索を行い、ステップS108において、縦線がステ
ップS104で取り出した上下の横枠に達したかどうか
を判断する。そして、縦線が上下の横枠に達しない場
合、ステップS109に進み、その縦線を縦枠の候補か
ら除外する。一方、縦線が上下の横枠に達した場合、ス
テップS110に進み、その縦線を縦枠の候補とする。
【0127】次に、ステップS111に示すように、処
理の対象が規則的な表形式のブロック枠であるか、不規
則な表形式のブロック枠であるかを判断する。そして、
処理の対象が規則的な表形式のブロック枠である場合、
ステップS112に進み、ステップS110で縦枠の候
補とみなされた縦線同士の間隔を算出するとともに、算
出された縦線同士の間隔とその出現頻度との関係を示す
ヒストグラムを算出する。
【0128】次に、ステップS113に示すように、互
いの隣接する2本の横枠の間に挟まれた範囲内の縦線の
うち、他の縦線と異なる間隔を形成する縦線を縦枠の候
補から除外し、残った縦線を縦枠として処理を終了す
る。
【0129】一方、ステップS111で処理の対象が不
規則的な表形式のブロック枠であると判断された場合、
ステップS110で縦枠の候補とされたものを全て縦枠
として処理を終了する。
【0130】次に、図6のステップS24の枠種類/表
判別処理について説明する。図25は、図6のステップ
S23の枠抽出処理により抽出された枠や表の一例を示
す図である。
【0131】図25において、図25(a)は一文字
枠、図25(b)はフリーピッチ枠、図25(c)はブ
ロック枠、図25(d)は規則的な表、図25(e)は
不規則な表を示している。そして、一文字枠には一文字
枠の属性を付与し、フリーピッチ枠にはフリーピッチ枠
の属性を付与し、ブロック枠にはブロック枠の属性を付
与し、表には表の属性を付与する。
【0132】なお、枠抽出処理及び枠種類/表判別処理
については、例えば、特開平7−28937号公報に記
載されている。次に、図6のステップS25の枠接触有
無の判断処理について説明する。ここでは、元の入力画
像をOR処理により縮小率1/nで縮小してから、枠接
触有無の判断処理を行う例について述べる。ここで、画
像の各画素に対応して座標が設定され、画像の横方向に
X座標、画像の縦方向にY座標を設定し、X座標は右向
きに増加し、Y座標は下向きに増加するものとしてい
る。
【0133】図26は、入力画像の縮小処理の一実施例
を示すフローチャートである。図26において、まず、
ステップS121に示すように、原画像を入力する。次
に、ステップS122に示すように、原画像の左上から
横n画素×縦n画素の範囲(左上座標(1,1)、右下
座標(X,Y))を設定する。
【0134】次に、ステップS123に示すように、原
画像の設定された範囲内に黒画素があるかどうかを判断
し、原画像の設定された範囲内に黒画素がある場合、ス
テップS124に進み、縮小画像の座標(X/n,Y/
n)の画素を黒画素とし、原画像の設定された範囲内に
黒画素がない場合、ステップS125に進み、縮小画像
の座標(X/n,Y/n)の画素を白画素とする。
【0135】次に、ステップS126に示すように、原
画像の右下まで処理が終了したかどうかを判断し、原画
像の右下まで処理が終了していない場合、ステップS1
27に進み、原画像の右端に達したかどうかを判断す
る。
【0136】そして、原画像の右端に達していない場
合、処理した範囲の右隣に横n画素×縦n画素の範囲
(左上座標(x,y)、右下座標(X,Y))を設定
し、原画像の右端に達した場合、処理した範囲の下側
で、かつ、原画像の左端から横n画素×縦n画素の範囲
(左上座標(x,y)、右下座標(X,Y))を設定し
て、ステップS123に戻り、原画像の全ての範囲内に
ついて縮小処理が終了するまで以上の処理を繰り返す。
【0137】次に、入力画像の縮小処理により縮小され
た圧縮画像データにおける枠線の内側を枠に沿って探索
することにより、文字が枠に接触しているかどうかの判
定を行い、文字の接触している辺に関して、矩形領域を
所定の距離だけ外側に拡大し、この拡大した矩形領域の
座標を原画像データにおける座標に変換する。
【0138】例えば、図27(a)に示すように、圧縮
画像データの枠線の範囲110が抽出され、この枠線に
より囲まれた矩形領域内に「4」の文字112が存在
し、この「4」の文字112が下側の枠線111に接触
しているものとする。
【0139】次に、図27(b)に示すように、枠線の
内側に沿って真っ直ぐに探索を行い、探索の途中でパタ
ーンと交差した場合、枠線の近辺に文字が存在し、この
文字は枠線に接触している可能性が高いとみなして、こ
の枠線により囲まれた矩形領域内に存在する「4」の文
字112は枠と接触しているものとする。この例の場
合、「4」の文字112は下側の枠111と接触してい
るものとされる。
【0140】次に、枠線111の内側に沿って探索を行
い、文字112が枠線111に接触しているとみなされ
た結果、図27(c)に示すように、文字112が接触
している枠線111から外側の方向へ枠線により囲まれ
た矩形領域を拡大し、この拡大した矩形領域113を文
字112が存在する文字領域とする。なお、文字が枠線
に接触していないとみなされた場合は、枠の内部をその
まま文字領域とする。
【0141】次に、圧縮画像データにおける文字領域か
ら原画像データにおける文字領域を求めるため、図27
(c)の矩形領域113の座標を原画像データにおける
座標に変換する。このことにより、図27(d)に示す
ように、原画像データにおける矩形領域116を求める
ことができる。
【0142】次に、原画像データの矩形領域116にお
ける枠線114についての投影処理を行い、枠線114
の枠座標を原画像データから算出する。この際、枠線1
14を所定の長さの短冊状の矩形によって表現する。そ
して、図27(e)に示すように、この矩形領域116
に存在するパターンを文字補完処理に送り、原画像デー
タから算出した枠線114の枠座標に基づいて、枠線1
14に接触している文字115の補完処理を行う。
【0143】図28は、枠接触有無の判断処理の一実施
例を示すフローチャートである。図28において、ま
ず、ステップS131に示すように、圧縮画像データに
よる矩形表現を、例えば、図26の処理により行う。
【0144】次に、ステップS132に示すように、縦
横4本の直線に囲まれた矩形部分を抽出する。次に、ス
テップS133に示すように、直線の内側を示す矩形の
左上及び右下を示す座標をそれぞれ算出する。
【0145】次に、ステップS134に示すように、枠
の内側を示す矩形の4辺(上側横枠、下側横枠、右側縦
枠、左側縦枠)に沿って圧縮画像の探索を行う。次に、
ステップS135に示すように、探索の途中で画像パタ
ーンと交差した場合、探索を行っていた辺に文字が接触
しているものとする。
【0146】次に、ステップS136に示すように、枠
の内側を示す矩形の座標値を原画像上の座標値に変換す
ることにより、圧縮画像データにおける矩形領域から原
画像データにおける矩形領域を算出する。
【0147】次に、ステップS137に示すように、ス
テップS136で算出された矩形領域を原画像データに
おける文字領域とする。次に、ステップS138に示す
ように、ステップS135の処理により文字が枠に接触
していたかどうかを判断し、文字が枠に接触している場
合、ステップS139〜S143の接触文字範囲獲得処
理を行う。
【0148】接触文字範囲獲得処理では、まず、ステッ
プS139において、文字の接触している辺から外側方
向に文字領域を拡大し、ステップS137で算出された
文字領域位置より一定の距離だけ外側の位置を文字領域
の端とする。
【0149】次に、ステップS140に示すように、ス
テップS139で算出された文字領域に含まれる枠線の
位置座標を原画像上の座標値に変換することにより、圧
縮画像データにおける枠線の位置座標から原画像データ
における枠線の位置座標を算出する。
【0150】次に、ステップS141に示すように、ス
テップS140で算出された原画像データにおける枠線
の位置座標に基づいて獲得した原画像データの枠線領域
について、横枠は横方向、縦枠は縦方向に投影処理を行
う。
【0151】次に、ステップS142に示すように、投
影値が一定値以上の領域を原画像上の枠座標とする。次
に、ステップS143に示すように、算出した原画像上
の文字領域を示す座標値と文字領域内の枠線の位置を示
す座標値とを文字補完処理へ渡す。
【0152】次に、ステップS144に示すように、算
出した原画像上の文字領域を示す座標値を文字領域とす
る。なお、枠接触有無の判断処理については、例えば、
特願平8−107568号の明細書及び図面に記載され
ている。
【0153】次に、図8のステップS41の訂正特徴抽
出処理及びステップS42の訂正文字候補抽出処理につ
いて説明する。図29は、訂正文字の一実施例を示す図
である。
【0154】図29において、訂正文字は、文字を消し
線で消したものであり、訂正文字の形態として、図29
(a)に示すように、文字を“×”印により消したも
の、図29(b)に示すように、文字を横二重線により
により消したもの、図29(c)に示すように、文字を
斜め線により消したもの、図29(d)に示すように、
文字を波線により消したもの、図29(e)に示すよう
に、文字を真っ黒に塗りつぶすことにより消したものな
ど様々なものがある。
【0155】このような訂正文字に対し、訂正文字に特
有な特徴を抽出する。この訂正文字に特有な特徴とし
て、「所定方向の線密度」、「オイラー数」、「黒画素
密度」などがある。
【0156】「所定方向の線密度」は、矩形内の画像を
所定の一定方向に沿って走査した際に、白画素から黒画
素(又は黒画素から白画素)に変化する回数を計数した
値である。また、所定方向は、消し線として想定された
線分の方向と垂直方向に設定する。
【0157】例えば、図30(a)は、「6」の文字に
ついて、縦方向の最大線密度を計数した例を示すもの
で、この場合の縦方向の最大線密度は3となっている。
訂正文字の「所定方向の線密度」は、通常文字の「所定
方向の線密度」に比べて大きくなる傾向があり、この
「所定方向の線密度」を算出することにより、訂正文字
の候補を抽出することができる。
【0158】「オイラー数」Eは、画像中での互いに連
結している連結成分の個数Cから、その画像が有する穴
の個数Hを引いた値である。例えば、図30(b)は、
互いに連結している連結成分が画像中に2つだけ存在
し、その画像中に穴が1つだけ存在する例を示すもの
で、この例の場合のオイラー数Eは、E=C−H=2−
1=1となる。
【0159】訂正文字の「オイラー数」は絶対値が大き
な負の値となる傾向があり、通常文字の「オイラー数」
は絶対値が小さな値(2〜−1)となる傾向がある。し
たがって、この「オイラー数」を算出することにより、
訂正文字の候補を抽出することができる。
【0160】「黒画素密度」Dは、注目する画像自体の
面積(黒画素数)Bと注目する画像の外接矩形の面積S
との比である。例えば、図30(c)は、「4」の文字
について黒画素密度Dを算出した場合の例を示すもの
で、「4」の文字に外接している外接矩形の面積をS、
「4」の文字の面積をBとすると、D=B/Sとなる。
【0161】訂正文字の「黒画素密度」は、通常文字の
「黒画素密度」に比べて大きくなる傾向があり、この
「黒画素密度」を算出することにより、訂正文字の候補
を抽出することができる。
【0162】次に、図3の基本文字認識部17について
具体的に説明する。図31は、基本文字認識部17の構
成の一実施例を示すブロック図である。図31におい
て、特徴抽出部121は、入力された未知の文字パター
ンから文字の特徴を抽出し、この抽出した特徴を特徴ベ
クトルにより表す。一方、基本辞書122には、各文字
カテゴリの特徴ベクトルが格納されている。
【0163】そして、照合部123は、特徴抽出部12
1により抽出した未知の文字パターンの特徴ベクトル
を、基本辞書122に格納されている各文字カテゴリの
特徴ベクトルと照合し、特徴空間上での特徴ベクトル間
の距離Dij(iは未知文字の特徴ベクトル、jは基本辞
書122のカテゴリの特徴ベクトル)を算出する。その
結果、特徴ベクトル間の距離Dijを最小とするカテゴリ
jを未知文字iとして認識する。
【0164】ここで、特徴空間上での特徴ベクトル間の
距離Dijは、例えば、ユークリッド距離Σ(i−
j)2 、シティブロック距離Σ|i−j|、又は判別関
数などの識別関数を用いて算出することができる。
【0165】なお、第1位のカテゴリとの距離を
ij1 、第2位のカテゴリとの距離をDij 2 とすると、
第1位のカテゴリj1、第2位のカテゴリj2、カテゴ
リ間の距離(Dij2 −Dij1 )及び信頼度に関するテー
ブル1を予め作成しておく。また、第1位のカテゴリと
の距離をDij1 、第1位のカテゴリj1及び信頼度に関
するテーブル2も予め作成しておく。そして、テーブル
1とテーブル2とからそれぞれ得られる信頼度の小さい
方を中間処理結果テーブルに格納する。
【0166】図32は、特徴ベクトルの算出例を示す図
である。この例は、図32(a)の縦5×横4の合計2
0個の枡目に「2」の文字が書かれており、黒く塗りつ
ぶされた枡目を“1”、白抜きの枡目を“0”として、
枡目の左上から右下の順に枡目を見ていき、その時現れ
る“1”又は“0”の数値を順に並べたものを、特徴ベ
クトルとしたものである。
【0167】例えば、図32(b)の場合の特徴ベクト
ルvectorAは、vectorA=(1、1、1、
1、0、0、0、1、1、1、1、1、1、0、0、
0、1、1、1、1、)となり、図32(c)の場合の
特徴ベクトルvectorBは、vectorB=
(0、1、1、1、0、0、0、1、1、1、1、1、
1、0、0、0、1、1、1、1、)となり、図32
(d)の場合の特徴ベクトルvectorCは、vec
torC=(1、1、1、1、0、0、0、1、0、
1、1、0、1、0、0、0、1、1、1、1、)とな
る。
【0168】図33は、シティブロック距離d(i,
j)により特徴ベクトル間の距離Dijを算出する例を示
す図である。ここで、シティブロック距離d(i,j)
は、特徴ベクトルの次元数をN、特徴ベクトルの番号を
iとすると、i番目の特徴ベクトルxi は、xi =(x
i1,xi2,xi3,・・・xiN)と表され、j番目の特徴
ベクトルxj は、xj =(x j1,xj2,xj3,・・・x
jN)と表される。そして、i番目の特徴ベクトルxi
j番目の特徴ベクトルxj とのシティブロック距離d
(i,j)は、 d(i,j)=|xi −xj | ・・・(2) と定義される。
【0169】例えば、図33において、基本辞書122
には、「1」、「2」、「3」、「4」の文字カテゴリ
の特徴ベクトルが登録されているものとする。ここで、
「1」の文字カテゴリの特徴ベクトルvector1
は、vector1=(0、1、1、0、0、1、1、
0、0、1、1、0、0、1、1、0、0、1、1、
0、)、「2」の文字カテゴリの特徴ベクトルvect
or2は、vector2=(1、1、1、1、0、
0、0、1、1、1、1、1、1、0、0、0、1、
1、1、1、)、「3」の文字カテゴリの特徴ベクトル
vector3は、vector3=(1、1、1、
1、0、0、0、1、1、1、1、1、0、0、0、
1、1、1、1、1、)、「4」の文字カテゴリの特徴
ベクトルvector4は、vector4=(1、
0、1、0、1、0、1、0、1、1、1、1、0、
0、1、0、0、0、1、0、)とする。
【0170】そして、特徴ベクトルvectorが、v
ector=(0、1、1、1、0、0、0、1、1、
1、1、1、1、0、0、0、1、1、1、1、)であ
る未知文字が入力された場合、この特徴ベクトルvec
torと、基本辞書122に登録されている「1」の文
字カテゴリの特徴ベクトルvector1、「2」の文
字カテゴリの特徴ベクトルvector2、「3」の文
字カテゴリの特徴ベクトルvector3、「4」の文
字カテゴリの特徴ベクトルvector4のそれぞれと
の間のシティブロック距離d(i,j)を(2)式によ
り算出する。
【0171】すなわち、未知文字の特徴ベクトルvec
torと「1」の文字カテゴリの特徴ベクトルvect
or1との間のシティブロック距離d(i,j)は、d
(i,j)=|vector−vector1|=|0
−0|+|1−1|+|1−1|+|1−0|+|0−
0|+|0−1|+|0−1|+|1−0|+|1−0
|+|1−1|+|1−1|+|1−0|+|1−0|
+|0−1|+|0−1|+|0−0|+|1−0|+
|1−1|+|1−1|+|1−0|=11となる。
【0172】同様に、未知文字の特徴ベクトルvect
orと「2」の文字カテゴリの特徴ベクトルvecto
r2との間のシティブロック距離d(i,j)は、d
(i,j)=|vector−vector2|=1、
未知文字の特徴ベクトルvectorと「3」の文字カ
テゴリの特徴ベクトルvector3との間のシティブ
ロック距離d(i,j)は、d(i,j)=|vect
or−vector3|=3、未知文字の特徴ベクトル
vectorと「4」の文字カテゴリの特徴ベクトルv
ector4との間のシティブロック距離d(i,j)
は、d(i,j)=|vector−vector4|
=11となる。
【0173】ここで、未知文字の特徴ベクトルvect
orと、「1」の文字カテゴリの特徴ベクトルvect
or1、「2」の文字カテゴリの特徴ベクトルvect
or2、「3」の文字カテゴリの特徴ベクトルvect
or3、「4」の文字カテゴリの特徴ベクトルvect
or4のそれぞれとの間のシティブロック距離d(i,
j)のうち、未知文字の特徴ベクトルvectorと
「2」の文字カテゴリの特徴ベクトルvector2と
の間のシティブロック距離d(i,j)が最小となって
いる。
【0174】従って、特徴ベクトルvectorが、v
ector=(0、1、1、1、0、0、0、1、1、
1、1、1、1、0、0、0、1、1、1、1、)であ
る未知文字は、「2」の文字カテゴリに属すると判定さ
れる。
【0175】次に、図3の基本文字認識部17の知識テ
ーブル18に格納されている詳細識別法について説明す
る。この詳細識別法は、各文字カテゴリの局所的な部分
パターンを文字セグメントとして取り出し、未知文字の
文字セグメントの位置や角度変化量とセグメント辞書に
予め格納してある文字セグメントの位置や角度変化量と
を比較することにより、未知文字と文字カテゴリとの対
応を取りながら文字を認識する。
【0176】図34は、文字セグメントの抽出方法を説
明する図である。図34(a)は、「2」の文字につい
ての2値画像パターンを示しており、斜線部分が黒画素
で表された文字部分を示している。
【0177】図34(b)は、図34(a)の2値画像
パターンから抽出された輪郭線を示しており、点線部分
は元の2値画像パターンを示している。図34(c)
は、図34(b)の輪郭線を文字セグメントS1、S2
と端点部分T1、2とに分割した状態を示している。こ
の端点部分T1、2は、図34(a)の「2」の文字の
書き始め及び書き終わりに対応するものである。
【0178】図35は、端点の検出方法を説明する図で
ある。図35において、端点は輪郭線の傾きが急激に変
化する場所として検出され、具体的には、一定間隔だけ
離れた3点A、B、Cを輪郭線S上にとり、その3点
A、B、Cを結んだ真ん中の点Aを頂点としてなす角θ
が所定値以下となる輪郭線上の領域を、端点として検出
する。
【0179】文字の輪郭線を端点で分割することによ
り、文字セグメントを2値画像パターンから抽出する
と、例えば、文字セグメント上に代表点X、Y、Zを一
定の距離ごとにとる。そして、連続する代表点X、Y、
Zのなす角度を求め、各代表点X、Y、Zでの特徴量と
して、文字セグメント上の最初の代表点から各代表点ま
での角度変化量の累積値を求める。
【0180】図36は、角度変化の検出方法を説明する
図である。図36において、任意の間隔だけ離れた代表
点X、Y、Zを輪郭線S上にとり、代表点Xから代表点
Yに引いたベクトルXYと、代表点Yから代表点Zに引
いたベクトルYZとを作り、ベクトルXYとベクトルY
Zとのなす角θ2 が代表点Yでの角度変化となる。
【0181】角度変化の初期値である輪郭線S上の代表
点Xでの角度変化は、文字の重心Gから代表点Xに引い
たベクトルGXとベクトルXYとのなす角θ1 を代表点
Xでの角度変化とする。
【0182】各代表点X、Y、Zでの特徴量は、角度変
化の初期値を有する代表点Xから各代表点Y、Zまでの
角度変化を累積した値で表し、例えば、代表点Yでの特
徴量は、θ1 +θ2 の値となる。
【0183】未知文字の文字セグメント上の代表点での
角度変化量の累積値を求めた後、この未知文字の文字セ
グメントについての代表点とセグメント辞書に格納して
ある文字セグメントの代表点との対応をとる。すなわ
ち、未知文字の文字セグメントについての代表点の角度
変化量の累積値と、セグメント辞書に格納してある文字
セグメントの代表点の角度変化量の累積値との距離を算
出し、この距離が最も小さくなるセグメント辞書の文字
セグメントの代表点を未知文字の文字セグメントの代表
点に対応させる。
【0184】図37(a)は、未知文字の文字セグメン
トの代表点とセグメント辞書の文字セグメントの代表点
との対応関係を示す図である。図37(a)において、
代表点a1 〜a8 は、未知文字の文字セグメント上の代
表点を表し、代表点b1 〜b8 は、セグメント辞書に格
納されている文字セグメント上の代表点を表している。
そして、未知文字の文字セグメントについての代表点a
1 〜a8 はそれぞれ、セグメント辞書に格納されている
文字セグメントの代表点b1 〜b8 に対応している。
【0185】未知文字の文字セグメントの代表点とセグ
メント辞書の文字セグメントの代表点との対応関係を求
めた後、セグメント辞書に格納されている文字セグメン
ト上の基準点に対応する未知文字の文字セグメントにつ
いての代表点を検査点とする。
【0186】図37(b)は、基準点と検査点との対応
関係を示す図である。図37(b)において、セグメン
ト辞書に格納されている文字セグメントの基準点d1
2 はそれぞれ、未知文字の文字セグメントの検査点c
1 、c2 に対応している。
【0187】基準点と検査点との対応関係を求めた後、
未知文字の文字セグメントの検査点c1 、c2 について
の検査情報を算出する。この検査情報は、例えば、1つ
の検査点に対しては、その検査点が文字画像全体の中で
どの位置に存在しているかという個々の検査点の絶対位
置情報や、2つの検査点に対しては、それらの検査点間
の距離や方向などの相対位置情報や、2つの以上の検査
点に対しては、それらの検査点間の角度変化や直線性な
どの情報からなっている。
【0188】そして、検査点についての検査情報を算出
した結果、所定の判定条件を満たす場合、判定条件を満
たしたセグメント辞書に格納されている文字セグメント
の文字カテゴリを未知文字の認識結果として出力する。
【0189】例えば、判定条件として、図37(b)の
文字セグメント上の検査点c1 から文字セグメントに沿
って検査点c2 までの角度変化を検査情報とした場合、
この角度変化が60度以上である文字セグメントの文字
画像が、その文字セグメントに対応して格納されている
セグメント辞書の「2」の文字カテゴリに属するとした
場合、図37(b)の文字セグメント上の検査点c1
ら文字セグメントに沿って検査点c2 までの角度変化を
算出することにより、図34(a)の文字パターンが
「2」の文字カテゴリに属すると認識できる。
【0190】図38は、詳細識別法による文字認識処理
を示すフローチャートである。図38において、まず、
ステップS150に示すように、文字認識の対象となる
帳票などをスキャナで走査し、読み込んだ文字画像を白
黒2値の画像に2値化する。
【0191】次に、ステップS151に示すように、ス
テップS150で得られた2値画像データから文字セグ
メントを抽出する。次に、ステップS152に示すよう
に、セグメント辞書に格納されている複数の文字セグメ
ントから、未知文字の文字セグメントとの対応関係が付
けられていない文字セグメントを取り出す。
【0192】次に、ステップS153に示すように、セ
グメント辞書から取り出した文字セグメントと未知文字
の文字セグメントとの対応関係を付ける。次に、ステッ
プS154に示すように、未知文字の文字セグメント上
にとった代表点の中から検査点を決定し、この検査点に
ついての検査情報を算出する。
【0193】次に、ステップS155に示すように、ス
テップS154で算出した検査情報に基づいて、セグメ
ント辞書から取り出した文字セグメントと未知文字の文
字セグメントとを比較し、セグメント辞書から取り出し
た文字セグメントの検査情報と未知文字の文字セグメン
トの検査情報とが一致するかどうかを判定することによ
り、未知文字に対する文字候補の決定処理を行う、次
に、ステップS156に示すように、未知文字に対する
文字候補の決定処理で、文字候補が決定した場合、ステ
ップS153で取り出した文字セグメントに対応する文
字カテゴリを認識結果として出力する。一方、文字候補
が決定しない場合、ステップS157に進み、未知文字
の文字セグメントとの対応関係が付けられていない未処
理の文字セグメントがセグメント辞書にあるかどうかを
判断し、未処理の文字セグメントがセグメント辞書にあ
る場合、ステップS152に戻って、以上の処理を繰り
返す。
【0194】一方、未知文字の文字セグメントとの対応
関係が付けられていない未処理の文字セグメントがセグ
メント辞書にない場合、入力された未知文字は認識不能
であると判断して、認識不能という認識結果を出力す
る。
【0195】なお、詳細識別法については、例えば、特
開平6−309501号公報に記載されている。次に、
図3の接触文字認識部13の一実施例について説明す
る。
【0196】図39は、接触文字認識部13の文字補完
処理を説明する図である。この文字補完処理では、枠接
触文字の2値画像から枠だけを抽出してこの枠を除去す
る。この際、枠接触文字の枠に接触している文字線分の
枠接触部分がかすれてしまい、文字線分が複数の部分に
途切れてしまうので、途切れた文字線分について、各ラ
ベルが付与された文字線分間の距離や方向性等の幾何学
的構造を評価して、それを補完する。
【0197】例えば、図39(a)に示すように、
「3」を表している文字パターン131と枠132とが
接触したために連結している2値画像にラベル“1”が
付されている。そして、図39(a)の2値画像から枠
132を抽出し、この枠132を除去することにより、
図39(b)に示すように、「3」を表している文字パ
ターン131が3個に分割されて、ラベル“1”、ラベ
ル“2”及びラベル“3”が付与された3個の文字線分
が生成される。
【0198】このラベル“1”、ラベル“2”及びラベ
ル“3”が付与された3個の文字線分について、各ラベ
ルが付与された文字線分間の距離や方向性等の幾何学的
構造を評価して、それを補完する。これにより、ラベル
“1”、ラベル“2”及びラベル“3”が付与された3
個の文字線分が連結されて、図39(c)に示すよう
に、ラベル“1”が付された「3」を表している文字補
完パターン132が生成される。
【0199】この文字補完処理により復元された文字
は、認識文字の候補として認識処理が行われる。この認
識処理では、文字カテゴリ辞書に登録されている標準パ
ターンと照合して、相違度が最も小さい文字カテゴリの
コードを出力する。
【0200】図40は、接触文字認識部13の再補完処
理を説明する図である。この再補完処理では、枠に平行
な文字線分が枠に接触し、枠を除去したために枠に平行
な文字線分が消滅した場合に、この文字線分を補完する
もので、予め、枠接触文字をラベリングによる連結性を
用いて抽出しておき、文字補完処理により補完された文
字補完パターンと枠接触文字の連結性が一致することを
検出することにより、枠に平行な文字線分を補完する。
【0201】例えば、図40(a)に示すように、
「7」を表している文字パターン141と枠142とが
接触したために連結している2値画像にラベル“1”が
付されている。そして、図40(a)の2値画像から枠
142を抽出し、この枠142を除去することにより、
図40(b)に示すように、「7」を表している文字パ
ターン141が3個に分割されて、ラベル“1”、ラベ
ル“2”及びラベル“3”が付与された3個の文字線分
が生成される。
【0202】このラベル“1”、ラベル“2”及びラベ
ル“3”が付与された3個の文字線分について、各ラベ
ルが付与された文字線分間の距離や方向性等の幾何学的
構造を評価して、それを補完する。これにより、ラベル
“1”及びラベル“2”が付与された2個の文字線分が
連結されて、図40(c)に示すように、ラベル“1”
及びラベル“2”が付与された2個の文字線分からなる
文字補完パターン142が生成される。
【0203】この場合、文字補完処理で補完されるの
は、図40(b)のラベル”1”が付与されていた部分
とラベル”2”が付与されていた部分との間のみで、図
40(b)のラベル”1”が付与されていた部分とラベ
ル”3”が付与されていた部分については、補完するこ
とができない。この図40(b)のラベル”1”が付与
されていた部分とラベル”3”が付与されていた部分の
補完は、再補完処理により行う。
【0204】この再補完処理は、予め、枠接触文字をラ
ベリングによる連結性を用いて抽出しておき、図40
(c)のパターンと枠接触文字の連結性が一致すること
を検出することにより、枠に平行な文字線分を補完す
る。すなわち、図40(c)のラベル”1”が付与され
たパターンとラベル”2”が付与されたパターンとは、
図40(a)に示すように、枠を除去する前は互いに連
結していたので、図40(c)のラベル”1”が付与さ
れたパターンとラベル”2”が付与されたパターンと
を、枠に平行な線分を用いて互いに連結する。
【0205】これにより、図40(c)のラベル”1”
とラベル”2”の2つの文字線分に分かれていた「7」
の2値画像が補完され、図40(d)に示すように、ラ
ベル“1”が付された「7」を表している再補完パター
ン143が生成される。
【0206】この再補完処理により復元された文字は、
認識文字の候補として認識処理が行われる。この認識処
理では、文字カテゴリ辞書に登録されている標準パター
ンと照合して、相違度が最も小さい文字カテゴリのコー
ドを出力する。
【0207】すなわち、図40に示す例では、図40
(c)に示す文字補完パターン142は、「リ」の文字
カテゴリに属すものと認識される。また、図40(d)
に示す再補完パターン143は、「7」の文字カテゴリ
に属すものと認識される。そして、「リ」よりも「7」
のほうが相違度が小さいと判断されて、最終的に「7」
と認識され、その文字コードが出力される。
【0208】次に、図3の接触文字認識部13が知識テ
ーブル14を参照しながら認識処理を行う場合について
説明する。図41は、誤読文字対を学習し、知識テーブ
ル14に登録しておくことにより、枠接触文字を認識す
る例を説明する図である。
【0209】この例の場合、図41(a)に示すよう
に、「2」を表している文字パターン151と枠152
とが接触したために連結している2値画像にラベル
“1”が付されている。そして、図41(a)の2値画
像から枠152を抽出し、この枠152を除去すること
により、図41(b)に示すように、「2」を表す文字
151がラベル“1”とラベル“2”の2つの部分パタ
ーンに分離される。
【0210】次に、図41(c)に示すように、文字補
完処理により、図41(b)のラベル“1”とラベル
“2”の2つの部分パターンが連結され、文字補完パタ
ーン153が生成される。
【0211】この場合、「2」を表している文字パター
ン151の下線部分が枠152に接触し、その接触部分
がほぼ完全に枠152に重なっている。このため、再補
完処理を用いても、「2」を表している文字パターン1
51の下線部分を補完することができず、「2」の文字
を、誤って「7」と認識してしまう可能性が高くなる。
【0212】このように、枠接触文字の一部が枠からは
み出すことなく、枠に完全に重なっているため、他の文
字と誤って認識してしまう場合、誤読文字対を学習して
登録しておくことにより、枠接触文字が正しく認識され
るようにする。
【0213】以下、誤読文字対を学習して登録しておく
ことにより、枠接触文字を認識する方法について説明す
る。図42は、図3の接触文字認識部13において、誤
読文字対を学習する構成を示すブロック図である。
【0214】枠接触文字の自動生成部161は、入力さ
れた枠に未接触の学習文字を枠に重ね合わせて、枠接触
文字を生成する。ここで、枠に対する学習文字の変動の
方法により、同一の学習文字に対して複数の枠接触文字
が生成される。図42では、「2」を表している学習文
字168が枠接触文字の自動生成部161に入力され、
文字「2」の下辺と下枠とが重なった枠接触文字169
を生成した例を示している。枠接触文字の自動生成部1
61により生成された情報は、知識テーブル167に登
録される。
【0215】学習文字に枠を重ね合わせる際の変動の種
類は、例えば、「文字枠に対する文字の変動」と「文字
枠の変動」の2種類があり、「文字枠に対する文字の変
動」には、例えば、「位置ずれ」、「サイズ変動」及び
「傾き変動」などがあり、「文字枠の変動」には、例え
ば、「傾き変動」、「枠幅変動」、「サイズ変動」及び
「枠の凹凸」などがある。
【0216】また、これらの変動についての変動量を表
すパラメータとして以下のパラメータがある。なお、垂
直方向にx軸を、水平方向にy軸を設定するものとす
る。 1.文字枠に対する文字の変動 位置ずれ:dx、dy、 ここで、dx(図43で黒丸で示した位置)、dy(図
43で ×で示した位置)は、それぞれ、文字の重心と
文字枠の重心の位置の差のx方向、y方向の大きさを表
す。
【0217】サイズ変動:dsx、dsy、 ここで、dsx,dsyは、それぞれ、文字のx方向、
y方向の大きさを表す。
【0218】傾き変動:dα、 ここで、dαは、垂線に対する文字の傾き角度を表す。 2.文字枠の変動 傾き変動:fα、 ここで、垂線に対する文字枠の傾き角度を表す。
【0219】枠幅変動:w、 ここで、wは、文字枠の幅を表す。 サイズ変動:fsx、fsy、 ここで、fsx,fsyは、それぞれ、文字のx方向、
y方向の大きさを表す。
【0220】枠の凹凸:fδ、 ここで、fδは、例えば、ファクシミリなどに印刷され
た文字枠の品質劣化等を考慮した文字枠の凹凸を制御す
るパラメータである。例えば、文字枠の周囲長をLとす
ると、fδは、このサイズLの配列fδ〔L]として表
現され、この配列の各要素fδ〔i](i=1、2、
3,・・・)は、乱数発生により決定される−β〜+β
の範囲内の整数値をとる。
【0221】これらの変動の種類及び変動量に基づい
て、学習文字に対して操作F(dx,dy,dsx,d
sy,dα,w,fsx,fsy,fα、fδ)を施す
ことにより、枠接触文字を生成する。
【0222】図43は、「7」を表す学習文字171に
対して枠172を合成することにより、枠接触文字を生
成する例を示す図である。図43(a)に示すように、
「7」を表す学習文字171に対して変換操作F(d
x,dy,dsx,dsy,dα,w,fsx,fs
y,fα、fδ)を施すことにより、図43(b)に示
すように、枠172に接触する「7]の枠接触文字を生
成する。
【0223】すなわち、学習文字171及び枠172に
対して変換操作F(dx,dy,dsx,dsy,d
α,w,fsx,fsy,fα、fδ)を施し、学習文
字171と枠172とを重ね合わせることにより、枠接
触文字を生成する。この場合、例えば、枠172の方の
重心の位置を固定しながら変換操作F(dx,dy,d
sx,dsy,dα,w,fsx,fsy,fα、f
δ)を実行する。
【0224】図44は、x方向のサイズ変動fsx及び
y方向のサイズ変動fsyを固定し、枠の大きさを固定
した場合について、「3」の学習文字に対して生成した
各種枠接触文字の例を示す図である。
【0225】図44(a)は、変動の種類が“位置ず
れ”の場合の例であり、変動量がdx=0、dy>0の
場合である。この場合、「3」の文字が枠の下にはみ出
すことになる(下位置変動)。
【0226】図44(b)は、変動の種類が“サイズ変
動”の場合の例であり、変動量がdsx=fsx,ds
y=fsyの場合である。この場合、「3」の文字が枠
の上下、左右に接触することになり、「3」の外接矩形
が枠に等しくなる。
【0227】図44(c)は、変動の種類が“文字の傾
き変動”の例であり、変動量がdα=10度の場合であ
る。図44(d)は、変動の種類が“文字枠の傾き変
動”の例であり、変動量がfα=−10度の場合であ
る。
【0228】図44(e)は、変動の種類が“枠幅変
動”の例であり、変動量がw=5の場合である。図44
(f)は、変動の種類が、“枠の凹凸”の例であり、変
動量fδ〔L]の各要素fδ〔i]を制御した場合であ
る。
【0229】次に、図42の枠除去部162は、枠接触
文字の自動生成部161により生成された枠接触文字か
ら枠のみを抽出し、この枠を除去して得られたかすれ文
字についての画像データを、文字補完部163に出力す
る。
【0230】文字補完部163は、枠除去部162によ
って枠が除去された文字の画像データを、ラベルが付与
された文字線分間の距離や方向性等の幾何学的構造を評
価して補完する。図42は、枠接触文字の自動生成部1
61により生成された枠接触文字169から枠を除去し
た後、文字補完部163により補完を行って文字補完パ
ターン170を生成した例を示している。
【0231】再補完部164は、文字補完部163によ
って補完しきれなかった領域について、予め、枠接触文
字をラベリングによる連結性を用いて抽出しておき、文
字補完部163により補完されたパターンと枠接触文字
の連結性が一致することを検出することにより、枠に平
行な文字線分を補完する。
【0232】文字補完部163によって補完された文字
補完パターンと再補完部164によって補完された再補
完パターンとは、基本文字認識部165に入力される。
基本文字認識部165は、文字補完部163によって補
完された文字補完パターンと再補完部164によって補
完された再補完パターンについて、文字認識を実行す
る。そして、各学習文字についての認識結果を枠接触状
態と認識の知識獲得部166に出力する。
【0233】枠接触状態と認識の知識獲得部166は、
基本文字認識部165から出力される認識結果を予め与
えられている正解データと比較して、全サンプルデータ
に対する認識率を得る。そして、この認識率を信頼度と
して、また、誤読文字(誤って認識した文字)と正解の
文字との組み合わせを誤読文字対として、知識テーブル
167に登録する。なお、上記誤読文字対は、例えば、
文字コードにより登録される。また、枠接触状態と認識
の知識獲得部166は、枠と文字の接触状態の特徴を示
すパラメータを抽出して、これも知識テーブル167に
登録する。
【0234】このようにして、知識テーブル167に
は、各文字カテゴリについて、枠と文字の様々な接触状
態におけるその文字に対する認識率が、その誤読文字対
とともに登録される。
【0235】図45は、学習により生成された知識テー
ブル167の一例を示す図である。図45において、知
識テーブル167には、例えば、誤読文字対(2、7)
及び信頼度77%が、“下位置ずれ変動”の変動量dy
=5、W=5等と共に登録され、変動量が、dy=5、
W=5の“下位置ずれ”の「2」の枠接触文字の場合、
基本文字認識部165は、23%の確率で、「2」を誤
って「7」と認識してしまうことが示される。すなわ
ち、この場合、基本文字認識部165が「7」と認識し
たとしても、その信頼度は77%であり、実際の文字が
「2」である可能性が22%ある旨が知識テーブル16
7を参照することにより判断できる。
【0236】同様にして、他の誤読され易い文字対につ
いても、“変動量”、“枠の線幅”、“誤読文字対”及
び信頼度が、枠接触状態と認識の知識獲得部166によ
って知識テーブル167に登録される。
【0237】なお、誤読文字対(L1、L2)は、実際
は、文字「L1」が文字「L2」に誤って認識されてし
まう場合を示すものである。また、上記文字「L1」、
「L2」には、例えば、該当する文字「L1」、「L
2」の文字コードが登録される。
【0238】知識テーブル167には、図45に示す変
動量dy=5,W=5の“下位置ずれ変動”以外にも、
図46に示すように“文字枠に対する文字の傾き変動”
(この場合、左枠接触)などの図43に示す各種変動に
ついて、各文字カテゴリ毎に登録される。
【0239】すなわち、例えば、図46に示すように、
“下位置ずれ”変動については、例えば、dx=「−
3」〜「+3」、dy=5、w=5、dsy=1、dα
=「−10」〜「+10」、fα=「−10」〜「+1
0」が登録される。このように、同じ”下位置ずれ”変
動であっても、知識テーブル167に登録される変動量
は、x方向の位置ずれdx、y方向の位置ずれdyのみ
でなく、その他の変動量が登録される場合がある。ま
た、“左枠接触の文字枠に対する文字の傾き変動”につ
いては、例えば、dx=「−3」〜「+3」、dy=
「−3」〜「+3」、w=5,dsy=1,dα=「−
20」〜「+20」、fα=「−10」〜「+10」が
登録される。
【0240】また、信頼度が予め定められた所定のしき
い値(例えば、90%)以下の誤読文字対(L1,L
2)について、信頼度がその所定のしきい値以上となる
ような文字認識方法を学習し、学習した文字認識方法を
知識テーブル167に登録する。
【0241】例えば、図45に示すように、dy=5,
w=5の”下位置ずれ”の状態の「2」の枠接触文字の
文字認識の信頼度は77%であり、「7」と誤って認識
される確率が高いので、文字補完部163により補完さ
れた文字補完パターンまたは再補完部164により補完
された再補完パターンを、例えば、領域強調の手法によ
り再認識すれば認識率が向上することを学習して知識テ
ーブル167に登録しておく。
【0242】この(2、7)の誤読文字対の場合におけ
る領域強調の手法を図47を参照しながら説明する。ま
ず、図47(a)に示すように、文字補完部163によ
り補完された文字補完パターンまたは再補完部164に
より補完された再補完パターンの外接矩形180を、縦
の行がm個、横の列がn個のm×n個の分割領域に分割
する。そして、図47(b)にハッチングで示すよう
に、外接矩形180の上半分のm/2×n個の領域を特
に強調して、文字認識を再度行う。
【0243】すなわち、このm/2×n個の領域の特徴
パラメータを抽出して、文字補完部163により補完さ
れた文字補完パターンまたは再補完部164により補完
された再補完パターンが「2」または「7」のいずれで
あるかを調べる。この領域強調の手法により、認識度が
95%まで向上する。図45の知識テーブル167に
は、誤読文字対が(2、7)の行に、再認識方法として
「領域強調」を、再認識領域として「m/2×n」を、
さらに再認識信頼度として「95%」を登録する。
【0244】この領域強調の手法は、図48(a)に示
すような枠接触文字の場合にも有効である。図48
(a)は、「2」を表している文字パターンの下部が文
字枠182に接触している例である。
【0245】この場合、文字補完部163により、図4
8(b)に示すような「7」に類似する文字補完パター
ン183が得られる。この文字補完パターン183に対
して図48(c)に示す外接矩形184を算出する。そ
して、この外接矩形184を、図47に示すように、m
×n個の領域に分割した後、上半分のm/2×n個の部
分領域185を特に強調して文字認識すれば、文字補完
パターン183が「2」と認識される確率が高い、すな
わち、正解率(信頼度)が高くなることを学習し、枠接
触による誤読文字対(2、7)に対する再認識方法とし
て、上記領域強調の手法を知識テーブル167に登録す
る。
【0246】図49は、領域強調による文字パターンの
再認識方法を示すフローチャートである。図49におい
て、まず、ステップS601に示すように、知識テーブ
ル167から信頼度の低い誤読文字対のデータを取り出
す。そして、この誤読文字対の左側に登録されている文
字について、2値の学習データとしての文字パターン
と、文字補完部163により補完された文字補完パター
ンまたは再補完部164により補完された再補完パター
ンとを入力する。
【0247】この文字補完パターンまたは再補完パター
ンは、知識テーブル167に登録されている変動量パラ
メータによって規定されるパターンであり、同一カテゴ
リであっても複数の形状のパターンを取りうる。
【0248】次に、ステップS602に示すように、ス
テップS601で入力された学習データとしての文字パ
ターンと、文字補完部163により補完された文字補完
パターンまたは再補完部164により補完された再補完
パターンとを、m×nの領域に分割する。
【0249】そして、ステップS603に示すように、
このm×nの領域内のX×Yの部分パターンについて文
字認識を実行する。そして、この場合の認識率zを求め
る。上記X×Yの部分パターンは、再認識領域である。
このとき、X,Yは、それぞれ、m×nの領域のX方
向、Y方向の長さを表す変数であり、X≦m,Y≦nで
ある。また、上記認識率zは、上記X×Yの部分パター
ンを用いて文字認識を行った際の、正解となる確率であ
る。
【0250】すなわち、学習データとしての文字パター
ンの部分パターンの文字認識結果を正解とみなす。そし
て、文字補完部163により補完された文字補完パター
ンまたは再補完部164により補完された再補完パター
ンについての複数の部分パターンに対する文字認識結果
を、学習データとしての文字パターンの部分パターンの
文字認識結果と比較していくことにより、文字補完部1
63により補完された文字補完パターンまたは再補完部
164により補完された再補完パターンについての部分
パターンの認識率zを求める。
【0251】続いて、ステップS604に示すように、
認識率zが最大認識率maxよりも大きいか否かを判別
する。この最大認識率maxは、X×Yの部分パターン
を変化させていった場合における認識率zの最大値を記
憶する変数であり、最初はある初期値(例えば、
「0」)が設定される。
【0252】そして、認識率zが最大認識率maxより
も大きければ、ステップS605に進んで、この認識率
zを最大認識率maxに代入し、続いて、ステップS6
06に進んで、長さX,Yを変更可能か否か調べる。一
方、ステップS604で、認識率zが最大認識率max
以下であれば、直ちに、このステップS606に移行す
る。
【0253】この長さX,Yの変更操作は、例えば、長
さX,Yの大きさの変更である。また、X×Yの部分パ
ターンのm×nの領域内での位置変更操作を含んでいて
もよい。
【0254】ステップS606で、長さX,Yを変更可
能であると判別すると、ステップS603に戻り、長さ
X,Yの変更操作を行い、新たなX×Yの部分パターン
を決定し、この部分パターンに対して文字認識を行う。
【0255】以上述べたステップS603〜S606の
処理を、上記ステップS506で長さX,Yを変更でき
ないと判別するまで繰り返す。そして、ステップS60
6で長さX,Yを変更できないと判別すると、最大識別
率maxとその最大識別率maxが得られたX×Yの部
分パターンを、それぞれ、再認識信頼度、再認識領域と
して知識テーブル167に登録する。また、再認識方法
として「領域強調」を知識テーブル167に登録する。
【0256】なお、図49のフローチャートは、「領域
強調」の手法を用いて再文字認識の方法を学習する例で
あるが、「領域強調」の手法以外についても、再文字認
識の方法を学習するようにしてもよい。
【0257】図50は、学習により得られた知識テーブ
ル167を用いて枠接触文字の文字認識を行う構成を示
すブロック図である。図50において、枠接触状態の検
出部191は、入力された未知の枠接触文字について、
枠と文字との接触状態を検出する。ここでは、図50
(a)の下枠が「2」の下辺と部分的に重なっている枠
接触文字パターン201と、図50(b)の下枠が
「2」の下辺と完全に重なっている枠接触文字パターン
203とが入力された例について示している。そして、
枠接触状態の検出部191は、枠接触文字パターン20
1及び枠接触文字パターン203を検出する。
【0258】枠除去部192は、枠接触状態の検出部1
91により検出された枠接触文字パターンから枠を除去
する。文字補完部193は、枠除去部192により枠が
除去された文字パターンについて、ラベルが付与された
文字線分間の距離や方向性等の幾何学的構造を評価して
補完する。
【0259】再補完部194は、文字補完部193によ
って補完しきれなかった領域について、予め、枠接触文
字をラベリングによる連結性を用いて抽出しておき、文
字補完部163により補完されたパターンと枠接触文字
の連結性が一致することを検出することにより、枠に平
行な文字線分を補完する。ここで、再補完パターン20
2は、図50(a)の枠接触文字パターン201に対
し、再補完部194の再補完処理により補完されたパタ
ーンを示し、再補完パターン204は、図50(b)の
枠接触文字パターン203に対し、再補完部194の再
補完処理により補完することができなかったパターンを
示している。
【0260】基本文字認識部195は、文字補完部19
3によって補完された文字補完パターンと再補完部19
4によって補完された再補完パターンとのそれぞれに対
し、文字認識を実行する。この結果、例えば、図50
(a)の再補完パターン202に対しては、「2」の文
字コードが出力され、図50(b)の再補完パターン2
04に対しては、「7」の文字コードが出力される。そ
して、その認識結果により得られた文字コードを、枠接
触状態と認識の知識参照部196に出力する。
【0261】枠接触状態と認識の知識参照部196は、
文字補完部193によって補完された文字補完パターン
又は再補完部194によって補完された再補完パターン
の外接矩形の位置情報及び図50(a)の枠接触文字パ
ターン201又は図50(b)の枠接触文字パターン2
03から抽出された文字枠の位置情報や幅情報などを基
に、変動の種類を求める。
【0262】すなわち、図43に示されているような”
位置ずれ”、”サイズ変動”、”傾き変動”などの文字
枠に対する文字の変動、または、”傾き変動”、枠幅変
化”、”枠の凹凸”などの文字枠の変動を求める。さら
に、求めた各変動の種類について、変動量dx,dy,
dsx,dsy,dα、w,fsx,fsy,fα、f
δを算出する。
【0263】次に、算出した変動種類情報及び変動量情
報と、基本文字認識部195から入力される文字コード
とをキー項目として、知識テーブル167を検索し、こ
のキー項目に一致する変動種類情報、変動量情報及び誤
読文字対を有する行が知識テーブル167に登録されて
いるか否か調べる。
【0264】そして、キー項目に一致する行が存在した
場合には、この行に登録されている信頼度が所定のしき
い値以上であるか否かを判別し、そのしきい値未満であ
れば、文字補完部193によって補完された文字補完パ
ターン又は再補完部194によって補完された再補完パ
ターンを再文字認識部197に出力し、その行に登録さ
れている再認識方法に従って、文字認識を再度行う。
【0265】すなわち、文字補完部193によって補完
された文字補完パターン又は再補完部194によって補
完された再補完パターン、あるいは未知文字の2値画像
データを用いて、基本文字認識部195による手法とは
別の手法で未知画像データに含まれる枠接触文字の再認
識を実行する。そして、再認識により得られた文字コー
ドを出力する。
【0266】例えば、基本文字認識部195が、再補完
部194によって補完された再補完パターン204の認
識結果として、「7」の文字コードを出力した場合、枠
接触状態と認識の知識参照部196は、再補完パターン
204の外接矩形の位置情報と枠接触文字パターン20
3から抽出した文字枠の位置情報及び幅情報とを基に、
変動の種類及び変動量を求める。この結果、変動の種類
として“下位置ずれ”が算出され、この“下位置ずれ”
の変動量として「dy=5」が算出され、文字枠の幅と
して「w=5」が算出される。
【0267】そして、枠接触状態と認識の知識参照部1
96は、変動の種類として“下位置ずれ”、“下位置ず
れ”の変動量として「dy=5」、文字枠の幅として
「w=5」、及び基本文字認識部195から入力された
文字コード「7」をキー項目として、図45の知識テー
ブル167を検索する。この検索の結果、これらのキー
項目に対応する行には誤読文字対(2、7)が登録さ
れ、基本文字認識部195で認識された文字コード
「7」の信頼度は77%であり、23%の確率で「2」
を「7」と読み間違えていることを知る。
【0268】この場合、これらのキー項目に対応する行
に登録されている信頼度は所定のしきい値よりも低いの
で、再文字認識部197は、基本文字認識部195によ
る手法とは別の手法で未知画像データに含まれる枠接触
文字パターン203の再認識を実行する。この際、再文
字認識部197は、知識テーブル167のキー項目に対
応する行を参照し、再認識方法を特定する。
【0269】すなわち、再文字認識部197は、再認識
方法として、「領域強調」を行うことを教えられるとと
もに、「領域強調」を行う場合の再認識領域として、再
補完パターン204の上半分のm/2×nの部分領域2
05だけを強調して再認識することを教えられる。ま
た、この場合の再認識信頼度が95%であることも教え
られる。
【0270】再文字認識部197は、知識テーブル16
7に登録されている再認識方法に従って、再補完パター
ン204の上半分の部分領域205のみについての再認
識を行う。そして、再補完パターン204の部分領域2
05は、文字コード「2」に対応する文字パターン20
6の部分領域207に95%の確率で一致し、文字コー
ド「7」に対応する文字パターン208の部分領域20
9に5%の確率で一致することを知り、未知の枠接触文
字パターン203の枠に接触した文字の認識結果とし
て、文字コード「2」を出力する。
【0271】図51は、枠接触状態と認識の知識参照部
196の動作を示すフローチャートである。図51にお
いて、まず、ステップS171に示すように、未知の枠
接触文字パターンから抽出した枠と、枠接触文字パター
ンから分離した文字パターンとに基づいて、文字の枠に
対する変動量を算出し、この変動量をキー項目として知
識テーブル167を探索する。そして、この算出された
変動量に一致する変動量を登録している行が知識テーブ
ル167に存在するか否かを調べる。
【0272】これにより、例えば、下位置ずれ変動とな
っている「2」の文字について、その変動量としてdx
=5,w=5が算出されると、図45に示す知識テーブ
ル167の最上位の行が検出される。
【0273】そして、変動量が一致する行が存在する場
合、ステップS172に進み、基本文字認識部195か
ら入力される文字コード(文字認識コード)を誤読文字
対に含んでいる行が、変動量が一致する行の中に存在す
るか否かを調べる。
【0274】これにより、例えば、下位置ずれ変動とな
っている「2」の文字の場合、図45に示す知識テーブ
ル167の最上位の行が検出される。そして、ステップ
S173に示すように、基本文字認識部195から入力
される文字コードを誤読文字対に含んでいる行が、変動
量が一致する行の中に存在する場合、知識テーブル16
7の該当する行に登録されている再認識信頼度と基本文
字認識部195により算出された信頼度とを比較し、知
識テーブル167の該当する行に登録されている再認識
信頼度が基本文字認識部195により算出された信頼度
よりも大きいか否か判別する。
【0275】これにより、例えば、下位置ずれ変動とな
っている「2」の文字の場合、図45に示す知識テーブ
ル167の最上位の行に登録されている再認識信頼度及
び基本文字認識部195により算出された信頼度が、そ
れぞれ、「95%」及び「77%」であり、知識テーブ
ル167の該当する行に登録されている再認識信頼度が
基本文字認識部195により算出された信頼度よりも大
きいと判別される。
【0276】知識テーブル167の該当する行に登録さ
れている再認識信頼度が基本文字認識部195により算
出された信頼度よりも大きい場合、ステップS174に
進み、知識テーブル167の該当する行に登録されてい
る再認識信頼度が予め定められたしきい値th1よりも
大きいか否かを判別し、しきい値th1よりも大きけ
ば、ステップS175に進み、知識テーブル167のス
テップS172で検出した行に登録されている「再認識
方法」及び「再認識領域」を参照する。
【0277】次に、ステップS176に示すように、文
字補完部193によって補完された文字補完パターン又
は再補完部194によって補完された再補完パターンか
ら、知識テーブル167で示される「再認識領域」を切
り出し、この切り出した領域について、知識テーブル1
67で示される「再認識方法」により文字認識を実行す
る。そして、その文字認識により得られた文字コードを
出力する。
【0278】これにより、例えば、しきい値th1が
「95%」よりも小さい場合、基本文字認識部195に
より入力される下位置ずれ変動となっている「2」の文
字の補完パターンについて、上半分の「m/2×n」の
領域を用いた「領域強調」手法により、文字認識が再度
実行され、最終的に「2」の文字コードが出力される。
【0279】なお、枠接触文字の認識方法については、
例えば、特願平7−205564号の明細書及び図面に
記載されている。次に、図3の文字列認識部15の一実
施例について説明する。
【0280】この文字列認識部15は、図4のステップ
S2のレイアウト解析により抽出された文字列に対し、
この文字列から文字を一文字ずつ切り出す際に用いる特
性値としてのパラメータについて、文字の統合判定を行
うの際の閾値をヒューリスティクに決定するのではな
く、統計的に妥当な値を設定するようにしたものであ
る。
【0281】具体的には、各パラメータ毎に、パラメー
タ値とそのパラメータ値に対する文字の統合の成功又は
失敗に関する統計データをとる。そして、各パラメータ
を個別に評価するのではなく、全てのパラメータを多次
元空間上の1点として捉え、多変量解析の手法を用い
て、統合が成功した場合と統合が失敗した場合との2群
を分離する判別面を上記多次元空間内で求めるようにす
る。
【0282】すなわち、パターンの特徴を示すP個の特
性値からなるサンプルデータを、切り出し成功を示す第
1の群と切り出し失敗を示す第2の群とに分類し、第1
の群と第2の群との判別面をP次元空間において生成す
るものである。
【0283】この判別面は、例えば、判別分析法により
求めることができる。すなわち、判別面を線形な判別関
数により構成する場合、その判別関数の係数ベクトル
は、 Σ-1(μ1 −μ2 ) ・・・(3) で与えられる。
【0284】ここで、 Σ :第1の群及び第2の群の母分散共分散行列、 μ1 :第1の群の母平均ベクトル、 μ2 :第2の群の母平均ベクトル、 である。
【0285】(3)式の係数ベクトルを有する判別関数
は、前記第1の群と前記第2の群の各重心から等距離と
なるように構成される。なお、この判別関数の係数ベク
トルは、第1の群と第2の群との間の群間変動の群内変
動に対する比を最大にするという基準に基づいて、算出
することもできる。
【0286】また、文字列から文字を切り出す処理は、
パターンの外接矩形の位置、サイズ、並びなどからパタ
ーン同士を統合していく統計的処理と、文字列中の濁
点、分離文字などを処理するためにパターン形状に着目
する非統計的処理に分けて実行する。
【0287】統計的処理では、パターンの外接矩形の位
置、縦横比、平均文字サイズに対するサイズ比、隣接す
るパターン同士の距離、統合したときのサイズ、パター
ン同士の重なり幅、文字列の粗密度などを切り出しパラ
メータとして用いる。
【0288】例えば、図52に示すように、 1)外接矩形211の右枠と外接矩形212の左枠との
距離a、 2)外接矩形211の左枠と外接矩形212の右枠との
距離b、 3)外接矩形211の右枠と外接矩形212の左枠との
距離aと外接矩形211の左枠と外接矩形212の右枠
との距離bとの比c、 4)外接矩形211の左枠と外接矩形212の右枠との
距離bと外接矩形平均幅MXとの比d、 5)外接矩形213の下枠と外接矩形213の下枠の中
点から外接矩形214の下枠の中点とを結ぶ直線とのな
す角度e、 6)外接矩形213の下枠と外接矩形213の右下の頂
点から外接矩形214の左下の頂点とを結ぶ直線とのな
す角度f、 7)外接矩形215と外接矩形216とが重なっている
場合、外接矩形215の右枠と外接矩形216の左枠と
の距離pと外接矩形215の左枠と外接矩形216の右
枠との距離qとの比g、を切り出しパラメータとして用
いる。
【0289】すなわち、 c=a/b ・・・(4) d=b/MX ・・・(5) g=p/q ・・・(6) である。
【0290】次に、統計的処理を図53のフローチャー
トを参照しながら説明する。まず、ステップS181に
示すように、連結パターンの外接矩形を取り出す。次
に、ステップS182に示すように、ステップS181
で取り出した外接矩形の右隣に他の外接矩形があるかど
うか調べる。そして、ステップS181で取り出した外
接矩形の右隣に他の外接矩形がない場合、ステップS1
81で取り出した外接矩形を統計的処理の対象から除外
する。
【0291】一方、ステップS182において、ステッ
プS181で取り出した外接矩形の右隣に他の外接矩形
があると判断された場合、ステップS184に進む。ま
た、ステップS183に示すように、文字列の外接矩形
の平均文字サイズを算出する。ここで、文字列の外接矩
形の平均文字サイズを算出する場合、1文字ごとの切り
出しがまだ行われていないので、厳密には、正確な平均
文字サイズを算出することができない。
【0292】そこで、例えば、連結パターンの外接矩形
を仮統合することにより、暫定的に平均文字サイズを算
出する。仮統合の方法として、近接する連結パターンを
統合した際の縦横比Pが、例えば、 N(=0.8)<P<M(=1.2) を満たす場合、仮統合を行う。そして、仮統合を行った
後の平均文字サイズを算出する。なお、文字列の外接矩
形の平均文字サイズは、外接矩形のサイズ別の頻度ヒス
トグラムを生成して求めるようにしてもよい。
【0293】次に、ステップS184に示すように、図
52のパラメータa〜gを算出する。非統計的処理で
は、文字列中の濁点や分離文字などを対象にしており、
分離文字処理と濁点処理とに分ける。
【0294】分離文字に対する処理では、パターンの傾
き、線密度、隣接するパターン同士を統合したときのサ
イズ、パターン同士の距離を切り出しパラメータとして
用いる。
【0295】例えば、図54に示すように、 8)外接矩形221の右枠と外接矩形222の左枠との
距離aと外接矩形221の左枠と外接矩形222の右枠
との距離bとの比p、 9)外接矩形221の左枠と外接矩形222の右枠との
距離bと外接矩形平均幅MXとの比q、 10)外接矩形21の面積cと外接矩形22の面積dと
の積と外接矩形平均幅MXと外接矩形平均高さMYとの
積の平方との比r、を切り出しパラメータとして用い
る。
【0296】すなわち、 p=a/b ・・・(7) q=b/MX ・・・(8) r=(c×d)/(MX×MY)2 ・・・(9) である。
【0297】次に、分離文字処理を図55のフローチャ
ートを参照しながら説明する。この分離文字処理は、例
えば、“ハ”又は“ル”などのように2つ以上の連結パ
ターンから構成される分離文字を検出するものである。
【0298】まず、ステップS191に示すように、連
結パターンのうち、右上がりとなっているパターンがあ
るかどうか判断する。そして、右上がりとなっているパ
ターンがない場合、分離文字処理の対象から除外する。
【0299】一方、ステップS191において、右上が
りとなっているパターンであると判断された場合、ステ
ップS192に進み、右上がりとなっているパターンの
右隣に隣接し、且つ右下がりとなっているパターン、す
なわち、例えば、“ハ”に対応するパターン、又は、右
上がりとなっているパターンの右隣に隣接し、且つ直角
方向に探索した場合のパターンと交差する回数(直角線
密度)が2となるパターン、すなわち、例えば、“ル”
に対応するパターンがあるかどうか判断する。そして、
これらの“ハ”又は“ル”などのような形状のパターン
でなければ、分離文字処理の対象から除外する。
【0300】一方、ステップS192において、“ハ”
又は“ル”などのような形状のパターンであると判断し
た場合、ステップS194に進む。また、上記ステップ
S191、S192とは別に、ステップS193で、文
字列の外接矩形の平均文字サイズを算出する。
【0301】上記ステップS192とS193が終了し
た後、ステップS194で、図54に示されたパラメー
タp〜rの値を算出する。また、濁点処理では、濁点候
補パターンに着目し、例えば、そのパターンとその隣接
パターンを統合したときのサイズ、両パターン間の距
離、及びそれらと平均文字サイズとの比を、切り出しパ
ラメータとして用いる。
【0302】すなわち、図56に示すように、 11)外接矩形231の右枠と外接矩形232の左枠と
の距離aと外接矩形231の左枠と外接矩形232の右
枠との距離bとの比p、 12)外接矩形231の左枠と外接矩形232の右枠と
の距離bと外接矩形平均幅MXとの比q、 13)外接矩形231の面積cと外接矩形232の面積
dとの積と外接矩形平均幅MXと外接矩形平均高さMY
との積の平方との比rを、切り出しパラメータとして用
いる。
【0303】すなわち、パラメータp〜rは、(7)〜
(9)式と同様に表すことができる。次に、濁点処理を
図57のフローチャートを参照しながら、説明する。
【0304】まず、ステップS201で、濁点候補とな
るパターンを抽出する。すなわち、例えば、連結パター
ン抽出手段1により抽出された連結パターンが2つ隣接
して存在する場合で、且つそれらを統合した時のサイズ
と文字列の外接矩形の平均文字サイズとの比が所定のし
きい値以下、例えば、1/4以下である場合、濁点候補
となるパターンとして抽出する。
【0305】次に、ステップS202に示すように、濁
点候補となるパターンの左隣に隣接する外接矩形がある
かどうかを調べる。そして、濁点候補となるパターンの
左隣に隣接する外接矩形がない場合、濁点候補となるパ
ターンを濁点処理の対象から除外する。
【0306】一方、ステップS202において、濁点候
補となるパターンの左隣に隣接する外接矩形があると判
断された場合、ステップS204に進む。また、上記ス
テップS201、S202とは別に、ステップS203
で、文字列の外接矩形の平均文字サイズを算出する。そ
して、上記ステップS202、S203の処理が終了し
た後、ステップS204で、図56に示されたパラメー
タp〜rの値を算出する。
【0307】次に、学習データを用いて、未知の手書き
文字列に対する文字の切り出しの信頼度を算出するため
の判別面を設定し、パラメータ数がnの場合、切り出し
が成功した群と切り出しが失敗した群との2群をn次元
の空間上に生成する。
【0308】図58は、切り出しの成否データの算出方
法を示すフローチャートである。図58において、ま
ず、ステップS211で、事前に集めた学習データに対
して、着目する外接矩形とそれに隣接する外接矩形とを
統合して1文字になるかどうかを目視により判断する。
そして、着目する外接矩形とそれに隣接する外接矩形と
を統合して1文字になる場合、ステップS212に進
み、着目する外接矩形とそれに隣接する外接矩形とを統
合して1文字にならない場合、ステップS213に進
む。
【0309】ステップS212では、着目する外接矩形
とそれに隣接する外接矩形とを統合して1文字になる統
合成功の場合について、その着目する外接矩形とそれに
隣接する外接矩形におけるパラメータの値を記録する。
ここで、着目する外接矩形とそれに隣接する外接矩形に
おけるパラメータは、統計的処理の場合、図48のパラ
メータa〜gを用いることができ、非統計的処理の場
合、図54、56のパラメータp〜rを用いることがで
きる。
【0310】また、ステップS213では、着目する外
接矩形とそれに隣接する外接矩形とを統合して1文字に
ならない統合失敗の場合について、その着目する外接矩
形とそれに隣接する外接矩形におけるパラメータの値を
記録する。
【0311】次に、未知の文字列について、統計的処理
における切り出しパラメータと非統計的処理における切
り出しパラメータの値を算出し、このパラメータの値に
よって定まる多次元空間上の点に対し、学習データによ
り得られている判別面からの距離を求め、これを切り出
しの信頼度として定量化する。
【0312】例えば、特徴量パラメータ数が3の場合、
図59に示すように、切り出し成功と切り出し失敗との
2群を判別する判別面をH、判別面Hの単位法線ベクト
ルをnとし、あるパラメータの値がpのベクトル値をと
るとき、そのパラメータの値に対応する3次元空間内の
点pの判別面からの距離hは、 h=OP・n ・・・(10) と表される。ここで、OPは、3次元空間内の原点Oか
ら3次元空間内の点pに向けたベクトルである。
【0313】そして、判別面Hからの距離hが正をとる
か負をとるかで、パラメータの値がどちらの群、すなわ
ち、切り出しが成功した方の群または切り出しが失敗し
た方の群のいづれの群に属するか、また、パラメータの
値が判別面Hからどの程度離れているかが分かる。
【0314】次に、図60に示すように、多次元空間内
の学習データの全パラメータに対して、判別面Hからの
距離hに基づいて、切り出し成功のヒストグラム分布2
41と切り出し失敗のヒストグラム分布242をとる。
一般的に、このヒストグラム分布241、242は正規
分布になるので、ヒストグラム分布241、242を正
規分布で近似する。これらの正規分布は、通常、部分的
に重なる領域が生ずる。
【0315】本実施例では、この重なる領域に位置する
切り出しパラメータを有する隣接パターンについての切
り出しの信頼度に加え、文字認識の信頼度を加味してそ
れらを統合するか否かを判定する。
【0316】図61は、切り出し信頼度の算出法の一例
を示すフローチャートである。図61において、まず、
ステップS221に示すように、複数のパラメータの値
によって定まる多次元空間上の点に対する判別面Hから
の距離hを、前記(10)式により算出する。
【0317】次に、ステップS222に示すように、学
習データにより得られた複数のパラメータの値のヒスト
グラム分布を正規分布で近似する。すなわち、例えば、
図62に示すように、切り出し成功のヒストグラム分布
を正規分布251で近似し、切り出し失敗のヒストグラ
ム分布を正規分布252で近似する。
【0318】次に、ステップS223で、2群の重なり
領域を算出する。例えば、図62に示すように、切り出
し成功の正規分布251と切り出し失敗の正規分布25
2とが重なる領域を2群の重なり領域254として算出
する。また、このとき、切り出し成功の正規分布251
の内、上記2群の重なり領域254以外の領域253を
切り出し成功領域と設定する。さらに、切り出し失敗の
正規分布252の内、上記2群の重なり領域254以外
の領域255を切り出し失敗領域と設定する。
【0319】次に、ステップS224に示すように、未
知文字についての入力パラメータの値のヒストグラム分
布上での位置を判定する。次に、ステップS225に示
すように、未知文字についての入力パラメータの値のヒ
ストグラム分布上での位置を判定した結果、未知文字に
ついての入力パラメータの値が2群の重なり領域254
に含まれる場合、ステップS226に進む。そして、2
群の重なり領域254での未知文字についての入力パラ
メータの値の位置に基づいて、切り出し信頼度を算出す
る。
【0320】一方、ステップS225において、未知文
字についての入力パラメータの値が2群の重なり領域2
54に含まれないと判断された場合、ステップS226
に進み、未知文字についての入力パラメータの値が切り
出し成功領域253に含まれるかどうかを判断する。
【0321】そして、未知文字についての入力パラメー
タの値が切り出し成功領域253に含まれると判断され
た場合、ステップS228に進み、切り出し信頼度を
“1”とし、未知文字についての入力パラメータの値が
切り出し成功領域253に含まれないと判断された場
合、ステップS229に進み、切り出し信頼度を“0”
とする。
【0322】例えば、図62において、未知文字につい
ての入力パラメータの値に対する判別面からの距離を算
出した結果、未知文字についての入力パラメータの値の
判別面からの距離が重なり領域254に含まれる場合、
未知文字についての入力パラメータの値の判別面からの
距離に基づいて、切り出し信頼度を算出する。また、未
知文字についての入力パラメータの値の判別面からの距
離が切り出し成功領域253に含まれる場合、その切り
出し信頼度を“1”とする。また、未知文字についての
入力パラメータの値の判別面からの距離が切り出し失敗
領域255に含まれる場合、その切り出し信頼度を
“0”に設定する。
【0323】図63は、2群の重なり領域算出方法の一
例を示すフローチャートである。図63において、ま
ず、ステップS231に示すように、学習データから得
られた切り出し成功のヒストグラム分布と切り出し失敗
のヒストグラム分布のそれぞれについて、ヒストグラム
261の平均値mと分散値vとを算出する。
【0324】次に、ステップS232で、切り出し成功
のヒストグラム分布と切り出し失敗のヒストグラム分布
について、正規分布曲線262とヒストグラム261と
の2乗誤差の総和dを算出する。
【0325】次に、ステップS233で、適合度Tを下
記の(11)式により算出する。 T=d/S ・・・(11) ここで、Sは正規分布曲線262の面積である。
【0326】次に、ステップS234で、正規分布曲線
262の中心から端までの距離Lを下記の(12)式に
より算出する。 L=k×(1+T)×v1/2 ・・・(12) ここで、kは比例定数である。また、v1/2 は、標準偏
差に等しい。
【0327】次に、ステップS235で、正規分布曲線
263の右端267から正規分布曲線264の左端26
6までの間の領域を、2群の重なり領域265として設
定する。
【0328】次に、切り出し文字の候補に対し、図61
の処理により求めた切り出し信頼度に基づいて認識処理
を行うかどうかを決定する。この場合、例えば、切り出
し信頼度が高い切り出し文字の候補に対しては認識処理
を行わず、切り出し信頼度が低い切り出し文字の候補に
対してのみ認識処理を行うようにする。
【0329】ここで、複数の切り出し文字の候補に対し
て、それらに対する認識の信頼度だけでなく、切り出し
の信頼度も考慮して切り出し文字を決定する。このこと
により、部分的に見ると文字のように見えるが、文字列
全体から見ると間違っているような候補文字を、切り出
し文字から除外することができる。例えば、各隣接パタ
ーンまたは切り出し確定部の切り出し信頼度をαi 、認
識信頼度をβi 、重み係数をjとすると、全体の信頼度
Rは、 R=Σ(j・αi +βi ) ・・・(13) と表せる。
【0330】そして、複数の切り出し文字の候補の中か
ら全体の信頼度Rが最も大きいものを、最終的な切り出
し文字として選択する。図64は、“グンマ”という文
字列から文字を1文字ずつ切り出す場合を示す図であ
る。ここで、“グンマ”という文字列の切り出しを行う
のに先立ち、学習データを用いて、統計的処理と非統計
的処理とに対する判別面とヒストグラム値の正規分布曲
線を、それぞれ、個別に求める。
【0331】ここで、統計的処理では、文字列の切り出
しの成功又は失敗を判定するためのパラメータとして、
図52のパラメータc、e、fを用い、学習データによ
り得られた判別面の式は、 0.84x0+0.43x1+0.33x2−145.25=0・・(14) であるものとする。
【0332】また、図63に示す学習データの切り出し
成功を示すヒストグラム分布の平均値mは128.94
2、標準偏差は34.77となり、適合度Tは(11)
式より0.12となる。また、比例定数kを2とする
と、分布中心から端までの距離Lは(12)式より7
7.8となる。
【0333】また、図63に示す学習データの切り出し
失敗を示すヒストグラム分布の平均値mは71.12
9、標準偏差は36.26となり、適合度Tは(11)
式より0.35となる。また、比例定数kを2とする
と、分布中心から端までの距離Lは(10)式より9
2.2となる。
【0334】図64において、まず、ステップS241
に示すように、イメージ入力により未知文字についての
入力パターンを読み込む。次に、ステップS242で、
ラベリングにより連結パターンを抽出し、抽出された各
連結パターンに対して図64に示すようにラベル番号
〜を付す。
【0335】次に、ステップS245に示すように、ス
テップS243の統計的処理及びステップS244の非
統計的処理に基づいて、切り出し信頼度の定量化を行
う。ステップS243の統計的処理では、互いに隣接す
る連結パターンを統合した場合の切り出し信頼度を、パ
ラメータc、e、fの値を有する3次元空間上の点に対
する判別面からの距離hに基づいて算出する。この切り
出し信頼度αは、例えば、 α=(h−w1 )/(w2 −w1 )×100 ・・・(15) で表すことができる。
【0336】ここで、 w1 :2群の重なり領域の左端の位置 w2 :2群の重なり領域の右端の位置 である。
【0337】例えば、ラベル番号のパターンとラベル
番号のパターンとを統合した場合の切り出し信頼度は
80、ラベル番号のパターンとラベル番号のパター
ンとを統合した場合の切り出し信頼度は12、ラベル番
号のパターンとラベル番号のパターンとを統合した
場合の切り出し信頼度は28、ラベル番号のパターン
とラベル番号のパターンとを統合した場合の切り出し
信頼度は92、ラベル番号のパターンとラベル番号
のパターンとを統合した場合の切り出し信頼度は5とな
る。
【0338】また、ステップS244の非統計的処理で
は、濁点候補を有するパターン“グ”についての切り出
し信頼度を、図56のパラメータp〜rの値を有する3
次元空間上の点に対する判別面からの距離hに基づいて
算出する。
【0339】例えば、ラベル番号のパターンと、ラベ
ル番号のパターン及びラベル番号のパターンからな
る切り出し確定部271の濁点パターンとを統合した場
合の切り出し信頼度は85となる。
【0340】このステップS244の非統計的処理にお
ける切り出し信頼度の算出方法を図65に示す。まず、
ステップS251で、濁点候補となるパターン272を
抽出する。例えば、連結パターンが2つ隣接して存在す
る場合で、且つ、それらを統合した時のサイズと文字列
の外接矩形の平均文字サイズとの比が所定のしきい値以
下である場合、濁点候補となるパターンとする。
【0341】次に、ステップS252で、濁点候補とな
るパターン272の左隣に隣接する外接矩形281があ
るかどうかを調べ、この場合、濁点候補となるパターン
272の左隣に隣接する外接矩形281があると判断さ
れた結果、ステップS253に進み、図56のパラメー
タp〜rの値を算出する。
【0342】図65の例では、 p=a/b=0.1 ・・・(16) q=b/MX=1.3 ・・・(17) r=(c×d)/(MX×MY)2 =0.3 ・・・(18) となる。
【0343】ここで、 a:外接矩形281の右枠と外接矩形272の左枠との
距離 b:外接矩形281の左枠と外接矩形272の右枠との
距離 c:外接矩形281の面積 d:外接矩形272の面積 MX:外接矩形平均幅 MY:外接矩形平均高さ である 次に、ステップS254に示すように、パラメータp〜
rの値を有する3次元空間上の点に対する判別面293
からの距離を算出する。
【0344】このパラメータp〜rの値を有する3次元
空間上の点に対する判別面293からの距離を算出する
ために、学習パターンに基づいて判別面293を算出し
ておく。この判別面293は、例えば、学習パターンの
文字列の切り出しの成功を示すヒストグラム分布292
及び失敗を示すヒストグラム分布291に基づいて、
(3)式により求めることができ、濁点抽出のパラメー
タp〜rを用いた場合の判別面293の式は、例えば、 0.17x0+0.75x1+0.64x2+30.4=0・・(19) で表され、3次元空間内の平面の方程式となる。
【0345】従って、判別面293からの距離hは、
(16)〜(18)の値を(19)式に代入して、 h=0.17×0.1−0.75×1.3+0.64×0.3+30.4 =29.6 ・・・(20) となる。
【0346】また、学習データの切り出し成功を示すヒ
ストグラム分布292の平均値mは38、標準偏差は2
5となり、適合度Tは(11)式より0.2となり、学
習データの切り出し失敗を示すヒストグラム分布291
の平均値mは−34、標準偏差は28となり、適合度T
は(11)式より0.3となる。
【0347】また、学習データの切り出し成功を示すヒ
ストグラム分布292の左端w1 は、比例定数kを2と
すると、(12)式より、 w1 =38−2×(1+0.2)×25=−22 ・・・(21) となる。
【0348】また、学習データの切り出し失敗を示すヒ
ストグラム分布291の右端w2 は、比例定数kを2と
すると、(12)式より、 w2 =−34+2×(1+0.3)×28=38.8 ・・・(22) となる。
【0349】従って、2群の重なり領域294は、判別
面からの距離が−22〜38.8の間の領域となる。次
に、ステップS255で、切り出し信頼度αを求める。
この切り出し信頼度αは、(20)〜(22)の値を
(15)式に代入して、 α=(29.6−(−22))/(38.8−(−22))×100 =85 ・・・(23) となる。
【0350】これにより、ラベル番号とラベル番号
とが統合されて切り出し確定部271となる。次に、図
64のステップS246で、統計的処理と非統計的処理
の信頼度を合成する。このとき、切り出し確定部があれ
ば、それを優先する。従って、切り出し確定部271の
信頼度が優先して合成される。
【0351】この結果、ラベル番号のパターンと切り
出し確定部271のパターンとを統合した場合の切り出
し信頼度は85、切り出し確定部271のパターンとラ
ベル番号のパターンとを統合した場合の切り出し信頼
度は30、ラベル番号のパターンとラベル番号のパ
ターンとを統合した場合の切り出し信頼度は92、ラベ
ル番号のパターンとラベル番号のパターンとを統合
した場合の切り出し信頼度は5となる。
【0352】そして、例えば、切り出し信頼度が所定の
しきい値(例えば、90)より大きいか又は、切り出し
信頼度が所定のしきい値(例えば、70)より大きく且
つ、その隣の切り出しパターンの切り出し信頼度との比
が所定の値(例えば、5)より大きい場合、パターンの
統合を行う。
【0353】また、切り出し信頼度が所定のしきい値
(例えば、8)より小さい場合、パターンの統合を行わ
ない。例えば、ラベル番号のパターンと切り出し確定
部271のパターンとを統合した場合の切り出し信頼度
は85で、その隣のラベル番号のパターンに対する切
り出し信頼度の比は、85/30=2.8であるので、
ラベル番号のパターンと切り出し確定部271のパタ
ーンとを統合しない。また、切り出し確定部271のパ
ターンとラベル番号のパターンとを統合した場合の切
り出し信頼度は30であり、切り出し確定部271のパ
ターンとラベル番号のパターンとを統合しない。
【0354】また、ラベル番号のパターンとラベル番
号のパターンとを統合した場合の切り出し信頼度は9
2であるので、ラベル番号のパターンとラベル番号
のパターンとを統合する。また、ラベル番号のパター
ンとラベル番号のパターンとを統合した場合の切り出
し信頼度は5であり、ラベル番号のパターンとラベル
番号のパターンとを統合しない。
【0355】これにより、ラベル番号のパターンとラ
ベル番号のパターンとを統合した切り出し確定部27
3に対応する外接矩形275、ラベル番号のパターン
に対応する外接矩形276が生成される。
【0356】また、新たに生成された切り出し確定部2
73のパターンと切り出し確定部271のパターンとを
統合した場合の切り出し信頼度を求める。この切り出し
信頼度は、図64の例では、60となる。
【0357】次に、ステップS247に示すように、切
り出し信頼度によるパターンの統合が終了した時点で、
切り出し候補1及び切り出し候補2を抽出する。そし
て、切り出し候補1及び切り出し候補2のそれぞれの文
字に対して認識処理を行い、切り出し候補1及び切り出
し候補2における文字内の切り出し信頼度αと認識信頼
度βとをそれぞれの文字について求め、切り出し信頼度
αと認識信頼度βとの総和をとったものを全体の信頼度
Rとする。
【0358】例えば、切り出し候補1として、外接矩形
275、276、278を切り出した場合、外接矩形2
78内のパターンに対して文字認識を行った場合の認識
信頼度βは80となり、外接矩形275内のパターンに
対して文字認識を行った場合の認識信頼度βは90とな
り、外接矩形276内のパターンに対して文字認識を行
った場合の認識信頼度βは85となる。
【0359】また、ラベル番号のパターンと切り出し
確定部271のパターンとを統合した場合の切り出し信
頼度αは85であるので、全体の信頼度Rは、重み係数
jを1とすると、(13)式により、345となる。
【0360】また、切り出し候補2として、外接矩形2
76、281、282を切り出した場合、外接矩形28
1内のパターンに対して文字認識を行った場合の認識信
頼度βは83となり、外接矩形282内のパターンに対
して文字認識を行った場合の認識信頼度βは55とな
り、外接矩形276内のパターンに対して文字認識を行
った場合の認識信頼度βは85となる。
【0361】また、切り出し確定部271のパターンと
切り出し確定部273のパターンとを統合した場合の切
り出し信頼度αは60であり、全体の信頼度Rは283
となる。
【0362】次に、ステップS248で、切り出し候補
1又は切り出し候補2のうち、全体の信頼度Rが大きい
方の切り出し候補1を切り出し成功の文字候補として選
択する。この結果、“グンマ”という文字列から、
“グ”、“ン”、“マ”の各文字を1文字ずつ正しく切
り出すことができる。
【0363】なお、文字列からの切り出し信頼度を考慮
しながら文字の認識処理を行う方法については、例え
ば、特願平7−234982号の明細書及び図面に記載
されている。
【0364】次に、図3のかすれ文字認識部19の動作
について具体的に説明する。図66は、かすれ文字認識
部19の構成の一実施例を示すブロック図である。図6
6において、特徴抽出部301は、かすれ文字パターン
から文字の特徴を抽出し、この抽出した特徴を特徴ベク
トルにより表す。一方、かすれ辞書302には、かすれ
文字についての各カテゴリの特徴ベクトルが格納されて
いる。そして、照合部303は、特徴抽出部301によ
り抽出した文字パターンの特徴ベクトルを、かすれ辞書
302に格納されている各カテゴリの特徴ベクトルと照
合し、特徴空間上での特徴ベクトル間の距離Dij(iは
未知文字の特徴ベクトル、jはかすれ辞書302のカテ
ゴリの特徴ベクトル)を算出する。その結果、特徴ベク
トル間の距離Dijを最小とするカテゴリjを未知文字i
として認識する。
【0365】ここで、特徴空間上での特徴ベクトル間の
距離Dijは、例えば、ユークリッド距離Σ(i−
j)2 、シティブロック距離Σ|i−j|、又は判別関
数などの識別関数を用いて算出する。
【0366】なお、第1位のカテゴリとの距離を
ij1 、第2位のカテゴリとの距離をDij 2 とすると、
第1位のカテゴリj1、第2位のカテゴリj2、カテゴ
リ間の距離(Dij2 −Dij1 )及び信頼度に関するテー
ブル1を予め作成しておく。また、第1位のカテゴリと
の距離をDij1 、第1位のカテゴリj1及び信頼度に関
するテーブル2も予め作成しておく。そして、テーブル
1とテーブル2とからそれぞれ得られる信頼度の小さい
方を中間処理結果テーブルに格納する。
【0367】図3のつぶれ文字認識部21は、かすれ文
字認識部19のかすれ辞書302の代わりに、つぶれ文
字についての各カテゴリの特徴ベクトルを格納したつぶ
れ辞書を用いることを除いて、かすれ文字認識部19と
同様の構成とすることができる。
【0368】次に、図3の消し線認識部26の一実施例
について説明する。この消し線認識部26は、図4のス
テップS4の訂正解析により抽出された訂正文字の候補
に対し、例えば、横方向の画素数の和をとったヒストグ
ラムを作成し、このヒストグラム値が所定の値を越えた
領域に横消し線が存在するものとして、この領域に存在
している横線を除去する。
【0369】次に、この横線を除去することによりかす
れた部分を補完し、この補完後のパターンについて辞書
照合を行うことにより、文字認識を行う。この結果、文
字と認識されたものについては、訂正文字の候補を消し
線付き文字とみなし、リジェクトされたものについて
は、訂正文字の候補を通常文字とみなす。
【0370】例えば、図67において、訂正文字の候補
として、横二重線により訂正された状態の「5」が入力
され、この横二重線を除去して補完したパターンが
「5」のカテゴリとして認識された結果、入力されたパ
ターンは訂正文字とみなされる。また、訂正文字の候補
として、「5」が入力され、この「5」の横線を除去し
たパターンがリジェクトされた結果、入力されたパター
ンは訂正文字でないとみなされる。
【0371】次に、図3のくせ字解析部23の一実施例
について説明する。このくせ字解析部23は、同一のカ
テゴリに属すると認識された手書き文字を所定のクラス
タ数にクラスタリングし、異なるカテゴリに属するクラ
スタ間の距離の小さいものについては、要素数が少ない
方のクラスタの文字カテゴリを要素数が多い方のクラス
タの文字カテゴリに修正することにより、別のカテゴリ
に属するものと誤って認識された手書き文字を正読化す
る。
【0372】図68は、「4」の文字カテゴリに属する
と判定された手書き文字の特徴ベクトルによるクラスタ
リング処理を示す図である。図68には、認識辞書に格
納されている「4」の文字カテゴリの特徴ベクトルとの
距離が近いため、「4」の認識結果カテゴリに属すると
判定された手書き文字が示されている。ここで、この認
識処理では、「2」と手書きされた文字が「4」の認識
結果カテゴリに属すると誤って認識されている。
【0373】そして、1回目のクラスタリング処理で
は、「4」の文字カテゴリに属すると判定された手書き
文字をそれぞれ1つのクラスタとみなし、2回目のクラ
スタリング処理では、クラスタとみなされた手書き文字
の間での特徴ベクトルの距離を算出し、特徴ベクトルの
距離が最も近いものを1つのクラスタに統合する。この
結果、図68の例では、クラスタ数が11から1つだけ
減少して10になっている。
【0374】3回目以降のクラスタリング処理において
も、クラスタ間での特徴ベクトルの距離を算出し、特徴
ベクトルの距離が最も近いものを統合することにより、
クラスタ数を減少させ、11回目のクラスタリング処理
でクラスタ数は1となる。
【0375】ここで、クラスタ同士を統合する場合、要
素数が1のクラスタ、すなわち、特徴ベクトル同士の距
離の比較には、例えば、シティブロック距離を用いる。
要素数が複数のクラスタ同士の場合、例えば、重心法を
用いる。この重心法は、要素数がM個のクラスタのi番
目(i=1、2、3、・・・、M)の要素の特徴ベクト
ルxi をxi =(xi1、xi2、xi3、・・・、xiN)と
表した時、そのクラスタを代表する代表ベクトルx
m を、そのクラスタの要素の特徴ベクトルxi の平均で
表し、
【0376】
【数1】
【0377】とする。そして、代表ベクトルxm 同士に
ついてのシティブロック距離を算出することにより、要
素数が複数のクラスタ同士の距離の比較を行うものであ
る。
【0378】なお、クラスタ数が1になるまでクラスタ
リング処理を続けると、「4」の文字カテゴリに属する
と誤って認識された「2」の手書き文字も、「4」の文
字カテゴリに属すると正しく認識された「4」の手書き
文字と同一のクラスタに属するようになるので、クラス
タリング処理を途中で打ち切るクラスタリング打ち切り
条件を設定する。
【0379】このクラスタリング打ち切り条件として
は、例えば、(1)最終クラスタ数が所定の数(例え
ば、3)になった時、(2)クラスタ統合時のクラスタ
間距離が所定のしきい値以上になった時、(3)クラス
タ統合時のクラスタ間距離の増加率が所定のしきい値以
上になった時、のいずれかの条件を用いることができ
る。
【0380】図69は、クラスタリング処理を示すフロ
ーチャートである。図69において、まず、ステップS
261に示すように、ある文字カテゴリに属すると認識
された手書き文字の特徴ベクトルだけを抽出し、抽出さ
れたそれぞれの手書き文字の特徴ベクトルを1つのクラ
スタとみなす。
【0381】次に、ステップS262に示すように、ク
ラスタリング処理を途中で打ち切るクラスタリング打ち
切り条件を設定する。次に、ステップS263に示すよ
うに、ある文字カテゴリについての全てのクラスタの中
で、最も距離の近い2つのクラスタを選択する。
【0382】次に、ステップS264に示すように、ス
テップS262で設定したクラスタリング打ち切り条件
を満たしているかどうかを判断し、クラスタリング打ち
切り条件を満たしていない場合、ステップ265に進ん
で、ステップS263で選択した2つのクラスタ同士を
統合し、ステップS263に戻り、クラスタを統合する
処理を繰り返す。
【0383】そして、クラスタを統合する処理を繰り返
した結果、ステップS264でクラスタリング打ち切り
条件を満たすと判断された場合、ステップ266に進ん
で、全ての文字カテゴリに対してクラスタリング処理を
行ったかどうかを判断し、全ての文字カテゴリに対して
クラスタリング処理を行っていない場合、ステップ26
1に戻り、クラスタリング処理を行っていない文字カテ
ゴリについてのクラスタリング処理を行う。
【0384】一方、ステップ266で全ての文字カテゴ
リに対してクラスタリング処理を行ったと判断された場
合、ステップ267に進んで、クラスタリング結果をメ
モリに格納する。
【0385】次に、クラスタリング処理により得られた
クラスタリング結果に基づいて、別のカテゴリに属する
ものと誤って認識された手書き文字を正読化する。図7
0は、「2」と手書きされた文字が「4」の文字カテゴ
リに属すると誤って認識された認識結果を、正しい文字
カテゴリ「2」に正読化する処理を示す図である。
【0386】図70には、「2」の認識結果カテゴリに
属すると判定された手書き文字及び「4」の認識結果カ
テゴリに属すると判定された手書き文字が示されてい
る。ここで、「3」と手書きされた文字が「2」の認識
結果カテゴリに属すると誤って認識され、「2」と手書
きされた文字が「4」の認識結果カテゴリに属すると誤
って認識され、「4」と手書きされた文字がいずれの認
識結果カテゴリにも属さないとしてリジェクトされてい
る。
【0387】次に、クラスタリング打ち切り条件を、同
一カテゴリ内における最終クラスタ数が3になった時に
設定して、クラスタリング処理を行うことにより、
「2」の認識結果カテゴリについてはクラスタa、b、
cが生成され、「4」の認識結果カテゴリについてはク
ラスタd、e、fが生成され、リジェクトされた3つの
「4」の手書き文字についてはそれぞれクラスタg、
h、iが生成されている。
【0388】次に、「2」の認識結果カテゴリに属する
クラスタa、b、cと「4」の認識結果カテゴリに属す
るクラスタd、e、fとの中から、文字数の少ないクラ
スタa、dを誤読候補クラスタとして抽出する。
【0389】次に、誤読候補クラスタaとそれ以外のク
ラスタb、c、d、e、fのそれぞれとの距離及び誤読
候補クラスタdとそれ以外のクラスタa、b、c、e、
fのそれぞれとの距離を算出する。そして、誤読候補ク
ラスタaと最も距離が近いクラスタとしてクラスタbを
抽出し、誤読候補クラスタaとクラスタbとの間の距離
が所定の値以下であるかどうかを判定し、誤読候補クラ
スタaとクラスタbとの間の距離は所定の値以下でない
ので、誤読候補クラスタaはリジェクト化される。
【0390】この結果、「2」の認識結果カテゴリに属
すると誤って認識された「3」と手書きされた文字が、
「2」の認識結果カテゴリから除外される。また、誤読
候補クラスタdと最も距離が近いクラスタとしてクラス
タbを抽出し、誤読候補クラスタdとクラスタbとの間
の距離が所定の値以下であるかどうかを判定し、誤読候
補クラスタdとクラスタbとの間の距離は所定の値以下
なので、誤読候補クラスタdはクラスタbと統合されク
ラスタjが生成されるとともに、クラスタjは、要素数
が多い方のクラスタbの属していた「2」の認識結果カ
テゴリに属すると判定されて、「4」と誤読されたため
に誤読候補クラスタdに属するとされた「2」の手書き
文字が正読化される。
【0391】さらに、いずれの認識結果カテゴリにも属
さないとしてリジェクトされたクラスタg、h、iとそ
れ以外のクラスタa〜fとの距離を算出する。そして、
クラスタgと最も距離が近いクラスタとしてクラスタe
を抽出し、クラスタgとクラスタeとの間の距離が所定
の値以下であるかどうかを判定し、クラスタgとクラス
タeとの間の距離は所定の値以下なので、クラスタgは
クラスタeと統合される。
【0392】また、クラスタhと最も距離が近いクラス
タとしてクラスタeを抽出し、クラスタhとクラスタe
との間の距離が所定の値以下であるかどうかを判定し、
クラスタhとクラスタeとの間の距離は所定の値以下な
ので、クラスタhはクラスタeと統合される。クラスタ
g及びクラスタhがクラスタeに統合された結果、クラ
スタkが生成されるとともに、クラスタkは、要素数が
多い方のクラスタeの属していた「4」の認識結果カテ
ゴリに属すると判定されて、認識不能としてリジェクト
された「4」の手書き文字が正読化される。
【0393】また、クラスタiと最も距離が近いクラス
タとしてクラスタeを抽出し、クラスタiとクラスタe
との間の距離が所定の値以下であるかどうかを判定し、
クラスタiとクラスタeとの間の距離は所定の値以下で
ないので、クラスタiはクラスタeと統合しないように
する。
【0394】図71は、文字カテゴリ認識結果修正処理
を示すフローチャートである。図71において、まず、
ステップS271に示すように、図69のクラスタリン
グ処理により得られたクラスタリング結果についてのデ
ータをメモリから読み出す。
【0395】次に、ステップS272に示すように、図
69のクラスタリング処理により得られた全てのカテゴ
リの全てのクラスタについて、各クラスタ間での距離を
算出し、各クラスタ間の距離を比較する。
【0396】次に、ステップS273に示すように、ク
ラスタ間の距離がしきい値以下のクラスタが存在するか
どうかを判断し、クラスタ間の距離がしきい値以下のク
ラスタが存在する場合、ステップS274に進んで、そ
れらのクラスタ同士を統合し、クラスタ間の距離がしき
い値以下のクラスタが存在しない場合、それらのクラス
タをリジェクトする。
【0397】ここで、クラスタ統合時のクラスタ間の距
離のしきい値として、例えば、2つのクラスタのうち、
要素数が多い方のクラスタ内のベクトル間距離の定数倍
を用いる。すなわち、要素数がM個のクラスタAと要素
数がN(M>N)個のクラスタBとを統合する場合、ク
ラスタAの代表ベクトルをxam、クラスタBの代表ベ
クトルをxbm、クラスタA内の特徴ベクトルをxai
(i=1、2、・・・、M)とすると、クラスタA内の
ベクトル間距離dt hは、
【0398】
【数2】
【0399】で表される。従って、クラスタ同士を統合
する条件は、例えば、1.5に定数を設定すると、 |xam−xbm|<1.5dt h となる。
【0400】次に、ステップS275に示すように、ス
テップS274で統合された全てのクラスタについて、
クラスタ内の文字カテゴリの判定を行う。次に、ステッ
プS276に示すように、統合されたクラスタ同士の文
字カテゴリが異なるかどうかを判断し、クラスタ同士の
文字カテゴリが異なる場合、ステップS277に進み、
要素数が少ない方のクラスタの文字カテゴリを要素数が
多い方のクラスタの文字カテゴリに修正してから、ステ
ップS278に進む。一方、クラスタ同士の文字カテゴ
リが一致する場合、ステップS277をスキップしてス
テップS278に進む。
【0401】次に、ステップS278に示すように、ク
ラスタ内の文字について、その文字カテゴリを出力す
る。次に、本発明の一実施例によるパターン認識装置の
動作について、図72の帳票を処理する場合を例にとっ
て、より具体的に説明する。
【0402】図72は、本発明の一実施例によるパター
ン認識装置に入力される帳票の例を示す図である。図7
2の帳票には、枠番号1のフリーピッチ枠、枠番号2、
3、4の一文字枠、枠番号5のブロック枠、枠番号6の
不規則な表が設けられている。また、枠番号1のフリー
ピッチ枠には、枠に接触した状態で且つ横二重線により
訂正されている「5」、枠に接触した状態の「3」、
「2」、枠に接触した状態で且つかすれた状態の
「7」、くせ字の「4」、「6」、枠からはみ出した状
態で且つくせ字の「4」が記入されている。
【0403】枠番号2の一文字枠には「5」が記入さ
れ、枠番号3の一文字枠には「3」が記入され、枠番号
4の一文字枠には枠からはみ出した状態で且つ横二重線
により訂正されている「8」が記入されている。枠番号
5のブロック枠のうち、枠番号5−1の枠には横二重線
により訂正されているくせ字の「6」が記入され、枠番
号5−2の枠には枠に接触した状態で「2」が記入さ
れ、枠番号5−3の枠にはくせ字の「4」が記入されて
いる。
【0404】枠番号6の不規則な表のうち、枠番号6−
1−1の枠には、枠からはみ出した状態の「3」、
「2」、「1」が記入され、枠番号6−1−2の枠に
は、「6」、「3」、「8」が記入され、枠番号6−1
−3の枠、枠番号6−1−4−1の枠、枠番号6−1−
4−2の枠、枠番号6−1−4−3の枠、枠番号6−2
−1の枠、枠番号6−2−2の枠及び枠番号6−2−3
の枠はそれぞれ空欄となっており、枠番号6の不規則な
表全体が×印により訂正されている。
【0405】次に、図3の環境認識系11は、図72の
帳票に対し、図5〜図8の処理を行うことにより、入力
画像の状態を図72の帳票から抽出する。例えば、図6
のレイアウト解析により、図72の帳票から、枠番号1
のフリーピッチ枠、枠番号2、3、4の一文字枠、枠番
号5のブロック枠及び枠番号6の不規則な表を抽出する
とともに、枠番号1のフリーピッチ枠からは、8つのパ
ターンが文字の候補として抽出され、枠番号2、3、4
の一文字枠からは、それぞれ1つのパターンが文字の候
補として抽出され、枠番号5のブロック枠からは、3つ
のパターンが文字の候補として抽出され、 枠番号6−
1−1の枠からは、3つのパターンが文字の候補として
抽出され、枠番号6−1−2の枠からは、3つのパター
ンが文字の候補として抽出され、枠番号6−1−3の
枠、枠番号6−1−4−1の枠、枠番号6−1−4−2
の枠、枠番号6−1−4−3の枠、枠番号6−2−1の
枠、枠番号6−2−2の枠及び枠番号6−2−3の枠か
らは、文字の候補は抽出されない。
【0406】ここで、図72の帳票から文字列を抽出す
るには、例えば、図14及び図15に示したテキスト抽
出方法を使用し、図72の帳票から罫線を抽出するに
は、例えば、図16〜図22に示した罫線抽出方法を使
用し、図72の帳票から枠や表を抽出するには、例え
ば、図23及び図24に示した枠抽出方法を使用する。
【0407】さらに、枠番号1のフリーピッチ枠から抽
出された第1番目のパターン、第2番目のパターン、第
5番目のパターン、第8番目のパターンは、枠接触文字
の候補とされる。また、枠番号4の一文字枠から抽出さ
れたパターン、枠番号5−2の枠から抽出されたパター
ン、枠番号6−1−1の枠から抽出された第1番目のパ
ターンも、枠接触文字の候補とされる。
【0408】ここで、図72の帳票から枠接触文字の候
補を抽出するには、例えば、図27及び図28に示した
枠接触文字抽出方法を使用する。また、図7の品質解析
により、図72の帳票から、かすれ状態やつぶれ状態や
高品質文字などを検出する。この例では、画像の品質は
正常で、かすれ状態やつぶれ状態や高品質文字などは検
出されない。
【0409】また、図8の訂正解析により、図72の帳
票から訂正文字候補を抽出する。この例では、枠番号1
のフリーピッチ枠から抽出された第1番目のパターン、
枠番号2、4の一文字枠から抽出されたパターン、枠番
号5−1の枠から抽出されたパターン及び枠番号6の不
規則な表から抽出されたパターンは、訂正文字候補とさ
れる。
【0410】ここで、図72の帳票から訂正文字の候補
を抽出するには、例えば、図30に示した特徴量抽出方
法を使用する。次に、環境認識系11は、入力画像から
抽出した文字の候補ごとに、図5〜図8の処理により帳
票から抽出した状態を記入した中間処理結果テーブルを
作成する。
【0411】図73は、図5〜図8の処理により帳票か
ら抽出した状態を記入した中間処理結果テーブルを示す
図である。図73において、枠番号1の欄には、「枠種
類」として「フリーピッチ」、「文字数」として「8」
が記入され、枠番号1の第1番目のパターンの欄には、
「枠接触有無」として「有」、「消し線」として「有
2」、「品質」として「正常」が記入され、枠番号1の
第2番目のパターンの欄には、「枠接触有無」として
「有」、「消し線」として「無」、「品質」として「正
常」が記入され、枠番号1の第8番目のパターンの欄に
は、「枠接触有無」として「有」、「消し線」として
「無」、「品質」として「正常」が記入されている。
【0412】ここで、「消し線」の欄の「有1」は複数
文字に対して消し線候補が存在していることを示し、
「消し線」の欄の「有2」は一文字に対して消し線候補
が存在していることを示している。
【0413】枠番号2の欄には、「枠種類」として「一
文字」、「枠接触有無」として「無」、「消し線」とし
て「有2」、「品質」として「正常」、「文字数」とし
て「1」が記入され、 枠番号3の欄には、「枠種類」
として「一文字」、「枠接触有無」として「無」、「消
し線」として「無」、「品質」として「正常」、「文字
数」として「1」が記入され、枠番号4の欄には、「枠
種類」として「一文字」、「枠接触有無」として
「有」、「消し線」として「有2」、「品質」として
「正常」、「文字数」として「1」が記入されている。
【0414】枠番号5の欄には、「枠種類」として「は
しご」、「文字数」として「3」が記入され、枠番号5
−1の欄には、「枠接触有無」として「無」、「消し
線」として「有2」、「品質」として「正常」、「文字
数」として「1」が記入され、枠番号5−2の欄には、
「枠接触有無」として「有」、「消し線」として
「無」、「品質」として「正常」、「文字数」として
「1」が記入され、枠番号5−3の欄には、「枠接触有
無」として「無」、「消し線」として「無」、「品質」
として「正常」、「文字数」として「1」が記入されて
いる。
【0415】枠番号6の欄には、「枠種類」として
「表」が記入され、枠番号6−1−1の欄には、「枠種
類」として「フリーピッチ」、「枠接触有無」として
「有」、「消し線」として「有1」、「品質」として
「正常」が記入され、枠番号6−2−2の欄には、「枠
種類」として「フリーピッチ」、「枠接触有無」として
「無」、「消し線」として「有1」、「品質」として
「正常」が記入されている。
【0416】次に、環境認識系11は、図5〜図8の処
理により帳票から抽出した状態に基づいて、図9の処理
を行う。すなわち、図73の中間処理結果テーブルに記
入された入力画像の状態に基づいて、図3の文字認識部
12の基本文字認識部17、文字列認識部15、接触文
字認識部13、かすれ文字認識部19、つぶれ文字認識
部21、又は非文字認識部25の消し線認識部26及び
雑音認識部28のいずれの処理を呼び出すかを処理順序
制御ルールを参照しながら決定し、決定した処理を図7
3の中間処理結果テーブルの「処理呼出し」の欄に記入
する。そして、図73の中間処理結果テーブルの「処理
呼出し」の欄に記入された処理をどのような順序で実行
するかを、処理順序テーブルを参照しながら決定し、決
定した順序を図73の中間処理結果テーブルの「処理順
序」の欄に記入する。
【0417】処理順序制御ルールの例としては、(A
1)もし、ある処理対象に対し、中間処理結果テーブル
の状態を示す欄が「有」で、その状態に対応する処理が
実行されていないならば、その状態に対応する処理を中
間処理結果テーブルの「処理呼出し」の欄に記入する、
(A2)もし、ある処理対象に対し、中間処理結果テー
ブルの状態を示す全ての欄が「無」、または「正常」
で、基本文字認識部17の処理が実行されていないなら
ば、中間処理結果テーブルの「処理呼出し」の欄に「基
本」と記入する、(A3)もし、ある処理対象に対し、
中間処理結果テーブルに記入された状態に対応する処理
が複数個存在しているならば、複数個の処理の順序を決
定している処理順序テーブルをアクセスして「処理呼出
し」の欄の順序を並び替える、(A4)もし、ある処理
対象に対し、中間処理結果テーブルに記入された状態に
対応する処理が終了したならば、終了した処理を中間処
理結果テーブルの「処理完了」の欄に記入するととも
に、次に行うべき指示や処理の中断や終了を示す指示を
中間処理結果テーブルの「処理指示」の欄に記入し、そ
れらの情報に基づいて、中間処理結果テーブルの「処理
呼出し」の欄の順序を並び替える、などがある。
【0418】図74は、処理順序テーブルの一例を示す
図である。図74において、処理順序テーブルには、例
えば、(B1)ある処理対象に対し、中間処理結果テー
ブルの「処理呼出し」の欄に1つの処理しか記入されて
いない場合は、中間処理結果テーブルの「処理順序」の
欄にその処理を記入する、(B2)ある処理対象に対
し、中間処理結果テーブルの「処理呼出し」の欄に「黒
枠/フリーピッチ」と記入された場合は、中間処理結果
テーブルの「処理順序」の欄に「黒枠→フリーピッチ」
と記入する、(B3)ある処理対象に対し、中間処理結
果テーブルの「処理呼出し」の欄に「消し線(有2)/
黒枠」と記入された場合は、「黒枠→一文字消し線」と
記入する、(B4)ある処理対象に対し、中間処理結果
テーブルの「処理呼出し」の欄に「黒枠/フリーピッチ
/消し線(有2)」と記入された場合は、中間処理結果
テーブルの「処理順序」の欄に「黒枠→一文字消し線→
フリーピッチ」と記入する、(B5)ある処理対象に対
し、中間処理結果テーブルの「処理呼出し」の欄に「黒
枠/フリーピッチ/消し線(有1)」と記入された場合
は、中間処理結果テーブルの「処理順序」の欄に複数文
字の「消し線→黒枠→フリーピッチ」と記入する、(B
6)ある処理対象に対し、中間処理結果テーブルの「処
理呼出し」の欄に「フリーピッチ/消し線(有1)」と
記入された場合は、中間処理結果テーブルの「処理順
序」の欄に「複数文字の消し線→フリーピッチ」と記入
する、(B7)ある処理対象に対し、中間処理結果テー
ブルの「処理呼出し」の欄に「処理A、B、C」と記入
され、中間処理結果テーブルの「処理順序」の欄に「処
理B→処理A→処理C」と記入されている場合で、中間
処理結果テーブルの「処理完了」の欄に「処理B」と記
入された場合、中間処理結果テーブルの「処理順序」の
欄を「処理A→処理C」に更新する、(B8)ある処理
対象に対し、中間処理結果テーブルの「処理呼出し」の
欄に「処理A、B、C」と記入され、中間処理結果テー
ブルの「処理順序」の欄に「処理B→処理A→処理C」
と記入されている場合で、中間処理結果テーブルの「処
理完了」の欄に「処理B」と記入され、中間処理結果テ
ーブルの「処理指示」の欄に「処理Cにスキップ」と記
入された場合、中間処理結果テーブルの「処理順序」の
欄を「処理C」に更新する、(B9)ある処理対象に対
し、中間処理結果テーブルの「処理呼出し」の欄に「処
理A、B、C」と記入され、中間処理結果テーブルの
「処理順序」の欄に「処理B→処理A→処理C」と記入
されている場合で、中間処理結果テーブルの「処理完
了」の欄に「処理B」と記入され、中間処理結果テーブ
ルの「処理指示」の欄に「処理Cと処理Aとの順序逆
転」と記入された場合、中間処理結果テーブルの「処理
順序」の欄を「処理C→処理A」に更新する、(B1
0)ある処理対象に対し、中間処理結果テーブルの「処
理呼出し」の欄に「処理B、A」と記入され、中間処理
結果テーブルの「処理完了」の欄に「処理A」と記入さ
れ、中間処理結果テーブルの「処理指示」の欄に「終
了」と記入された場合、中間処理結果テーブルの「処理
順序」の欄を「終了」とする、などの手順が格納されて
いる。
【0419】図75は、図73の中間処理結果テーブル
に記入された入力画像の状態に基づいて呼び出す処理を
「処理呼出し」の欄に記入するとともに、「処理呼出
し」の欄に記入された処理を実行する順序を「処理順
序」の欄に記入した例を示す図である。
【0420】図75において、枠番号1の欄には、「枠
種類」として「フリーピッチ」が記入され、枠番号1の
第1番目のパターンの欄には、「枠接触有無」として
「有」、「消し線」として「有2」が記入されているの
で、処理順序制御ルールの(A1)に従って「処理呼び
出し」の欄に「黒枠/フリーピッチ/消し線(有2)」
と記入するとともに、処理順序制御ルールの(A3)に
従って処理順序テーブルの(B4)を参照し、「処理順
序」の欄に「黒枠→一文字消し線→フリーピッチ」と記
入する。
【0421】枠番号1の第2番目のパターンの欄には、
「枠接触有無」として「有」、「消し線」として
「無」、「品質」として「正常」が記入されているの
で、処理順序制御ルールの(A1)に従って「処理呼び
出し」の欄に「黒枠/フリーピッチ」と記入するととも
に、処理順序制御ルールの(A3)に従って処理順序テ
ーブルの(B2)を参照し、「処理順序」の欄に「黒枠
→フリーピッチ」と記入する。
【0422】枠番号1の第8番目のパターンの欄には、
「枠接触有無」として「有」、「消し線」として
「無」、「品質」として「正常」が記入されているの
で、処理順序制御ルールの(A1)に従って「処理呼び
出し」の欄に「黒枠/フリーピッチ」と記入するととも
に、処理順序制御ルールの(A3)に従って処理順序テ
ーブルの(B2)を参照し、「処理順序」の欄に「黒枠
→フリーピッチ」と記入する。
【0423】枠番号2の欄には、「枠種類」として「一
文字」、「枠接触有無」として「無」、「消し線」とし
て「有2」、「品質」として「正常」が記入されている
ので、処理順序制御ルールの(A1)に従って「処理呼
び出し」の欄に「消し線(有2)」と記入するととも
に、処理順序制御ルールの(A1)に従って「処理順
序」の欄に「一文字消し線」と記入する。
【0424】枠番号3の欄には、「枠種類」として「一
文字」、「枠接触有無」として「無」、「消し線」とし
て「無」、「品質」として「正常」が記入されているの
で、処理順序制御ルールの(A2)に従って「処理呼び
出し」の欄に「基本」と記入するとともに、処理順序制
御ルールの(A1)に従って「処理順序」の欄に「基
本」と記入する。
【0425】枠番号4の欄には、「枠種類」として「一
文字」、「枠接触有無」として「有」、「消し線」とし
て「有2」、「品質」として「正常」が記入されている
ので、処理順序制御ルールの(A1)に従って「処理呼
び出し」の欄に「黒枠/消し線(有2)」と記入すると
ともに、処理順序制御ルールの(A3)に従って処理順
序テーブルの(B3)を参照し、「処理順序」の欄に
「黒枠→一文字消し線」と記入する。
【0426】枠番号5の欄には、「枠種類」として「は
しご」が記入され、枠番号5−1の欄には、「枠接触有
無」として「無」、「消し線」として「有2」、「品
質」として「正常」が記入されているので、処理順序制
御ルールの(A1)に従って「処理呼び出し」の欄に
「消し線(有2)」と記入するとともに、処理順序制御
ルールの(A1)に従って「処理順序」の欄に「一文字
消し線」と記入する。
【0427】枠番号5−2の欄には、「枠接触有無」と
して「有」、「消し線」として「無」、「品質」として
「正常」が記入されているので、処理順序制御ルールの
(A1)に従って「処理呼び出し」の欄に「黒枠」と記
入するとともに、処理順序制御ルールの(A1)に従っ
て「処理順序」の欄に「黒枠」と記入する。
【0428】枠番号5−3の欄には、「枠接触有無」と
して「無」、「消し線」として「無」、「品質」として
「正常」が記入されているので、処理順序制御ルールの
(A2)に従って「処理呼び出し」の欄に「基本」と記
入するとともに、処理順序制御ルールの(A1)に従っ
て「処理順序」の欄に「基本」と記入する。
【0429】枠番号6の欄には、「枠種類」として
「表」が記入され、枠番号6−1−1の欄には、「枠種
類」として「フリーピッチ」、「枠接触有無」として
「有」、「消し線」として「有1」、「品質」として
「正常」が記入されているので、処理順序制御ルールの
(A1)に従って「処理呼び出し」の欄に「黒枠/フリ
ーピッチ/消し線(有1)」と記入するとともに、処理
順序制御ルールの(A3)に従って処理順序テーブルの
(B5)を参照し、「処理順序」の欄に「複数文字の消
し線→黒枠→フリーピッチ」と記入する。
【0430】枠番号6−2−2の欄には、「枠種類」と
して「フリーピッチ」、「枠接触有無」として「無」、
「消し線」として「有1」、「品質」として「正常」が
記入されているので、処理順序制御ルールの(A1)に
従って「処理呼び出し」の欄に「フリーピッチ/消し線
(有1)」と記入するとともに、処理順序制御ルールの
(A3)に従って処理順序テーブルの(B6)を参照
し、「処理順序」の欄に複数文字の「複数文字の消し線
→フリーピッチ」と記入する。
【0431】次に、「処理呼出し」の欄及び「処理順
序」の欄が記入された図75の中間処理結果テーブルに
基づいて、処理実行ルールを参照しながら最初の認識処
理を実行する。そして、処理が完了した認識処理を中間
処理結果テーブルの「処理完了」の欄に記入するととも
に、その時の認識処理で得られた信頼度を中間処理結果
テーブルの「信頼度」の欄に記入する。
【0432】また、中間処理結果テーブルの「処理順
序」の欄を、図74の処理順序テーブルの(B7)〜
(B9)に従って更新するとともに、処理実行ルールに
よって指示される次の処理がある場合は、中間処理結果
テーブルの「処理指示」の欄にその処理を記入する。
【0433】処理実行ルールとしては、例えば、(C
1)もし、ある処理対象に対し、中間処理結果テーブル
の「処理順序」の欄に記入されている処理が存在するな
らば、優先順位の最も高い処理を実行する。そして、実
行した処理が終了したならば、中間処理結果テーブルの
「処理完了」の欄に終了した処理を記入し、中間処理結
果テーブルの「処理順序」の欄からその処理を削除す
る。また、次に実行する処理を指示する場合は、中間処
理結果テーブルの「処理指示」の欄にその処理を記入す
る、(C2)もし、ある処理を実行した結果、あるパタ
ーンが非文字ではなく、文字であると判断され、その文
字コードが所定の値以上の信頼度で算出されたならば、
「個人筆記特性」による文字認識処理を呼び出すことを
中間処理結果テーブルの「処理指示」の欄に記入する、
(C3)もし、ある処理を実行した結果、あるパターン
が消し線であると判断され、その消し線が所定の値以上
の信頼度で算出されたならば、中間処理結果テーブルの
「処理指示」の欄に「終了」と記入し、中間処理結果テ
ーブルの「処理順序」の欄に記入されているそれ以降の
処理を打ち切って、処理を終了させる、(C4)もし、
中間処理結果テーブルの「処理順序」の欄の最初に「フ
リーピッチ」と記入され、同じ枠番号の他の処理対象に
ついての「フリーピッチ」より前の処理が未処理である
ならば、同じ枠番号の全て処理対象の「処理順序」の欄
の最初に「フリーピッチ」と記入された後、同じ枠番号
の全て処理対象の「フリーピッチ」の処理を同時に実行
する、(C5)もし、中間処理結果テーブルの「処理順
序」の欄に記入された全ての処理が終了し、全ての処理
対象について、中間処理結果テーブルの「処理指示」の
欄に「終了」と記入されるか、又は「個人筆記特性」と
記入されたならば、「処理指示」の欄に「個人筆記特
性」と記入されている処理対象に対して、「個人筆記特
性」による文字認識処理を呼び出してその処理を実行
し、「個人筆記特性」による文字認識処理が終了したな
らば、中間処理結果テーブルの「処理指示」の欄に「終
了」と記入する、(C6)もし、全ての処理対象につい
て、中間処理結果テーブルの「処理指示」の欄に終了と
記入されたならば、全ての処理を終了して認識結果を出
力する、などがある。
【0434】図76は、図75の中間処理結果テーブル
に基づいて、処理実行ルールを参照しながら認識処理を
実行し、その時の認識処理で得られた信頼度を中間処理
結果テーブルの「信頼度」の欄に記入し、処理実行ルー
ルに基づいて中間処理結果テーブルの「処理順序」の欄
を更新するとともに、中間処理結果テーブルの「処理指
示」の欄に記入を行った例を示す図である。
【0435】まず、図75の中間処理結果テーブルの枠
番号1の第1番目のパターンの「処理順序」の欄におい
て、最初に「黒枠」と指示されているので、処理実行ル
ールの(C1)に従って、図72の枠番号1のフリーピ
ッチ枠から抽出された第1番目のパターンに対し、「黒
枠」に対応する図3の接触文字認識部13の処理を実行
する。
【0436】この接触文字認識部13では、例えば、図
39及び図40に示したように、枠を除去したパターン
に対して文字補完や再補完を行うことにより、枠接触文
字についての文字認識を行う。また、文字補完や再補完
を用いても十分な信頼度が得られないパターンについて
は、知識テーブル14を参照し、図42〜図51に示し
た学習文字に対する再文字認識を行うことにより、枠接
触文字についての文字認識を行う。
【0437】接触文字認識部13の文字認識処理によ
り、図72の枠番号1のフリーピッチ枠から抽出された
第1番目のパターンの認識信頼度が20%と算出された
結果、図72の枠番号1のフリーピッチ枠から抽出され
た第1番目のパターンは文字でないとみなされ、中間処
理結果テーブルの「文字コード」の欄に「リジェクト」
と記入されるとともに、中間処理結果テーブルの「信頼
度」の欄に「20%」と記入される。
【0438】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠」と記入され、中間処理結果テーブル
の「処理順序」の欄が「一文字消し線→フリーピッチ」
に更新される。
【0439】次に、図75の中間処理結果テーブルの枠
番号1の第2番目のパターンの「処理順序」の欄におい
て、最初に「黒枠」と指示されているので、処理実行ル
ールの(C1)に従って、図72の枠番号1のフリーピ
ッチ枠から抽出された第2番目のパターンに対し、「黒
枠」に対応する図3の接触文字認識部13の処理を実行
し、枠接触文字についての文字認識を行う。
【0440】接触文字認識部13の文字認識処理によ
り、図72の枠番号1のフリーピッチ枠から抽出された
第2番目のパターンは、認識信頼度が60%の確率で文
字カテゴリ「3」であると認識され、中間処理結果テー
ブルの「文字コード」の欄に「3」と記入されるととも
に、中間処理結果テーブルの「信頼度」の欄に「60
%」と記入される。
【0441】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠」と記入され、中間処理結果テーブル
の「処理順序」の欄が「フリーピッチ」に更新される。
次に、図75の中間処理結果テーブルの枠番号1の第8
番目のパターンの「処理順序」の欄において、最初に
「黒枠」と指示されているので、処理実行ルールの(C
1)に従って、図72の枠番号1のフリーピッチ枠から
抽出された第8番目のパターンに対し、「黒枠」に対応
する図3の接触文字認識部13の処理を実行し、枠接触
文字についての文字認識を行う。
【0442】接触文字認識部13の文字認識処理によ
り、図72の枠番号1のフリーピッチ枠から抽出された
第8番目のパターンは、認識信頼度が95%の確率で文
字カテゴリ「4」であると認識され、中間処理結果テー
ブルの「文字コード」の欄に「4」と記入されるととも
に、中間処理結果テーブルの「信頼度」の欄に「95
%」と記入される。
【0443】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠」と記入され、中間処理結果テーブル
の「処理順序」の欄が「フリーピッチ」に更新される。
次に、図75の中間処理結果テーブルの枠番号2の「処
理順序」の欄において、「一文字消し線」と指示されて
いるので、処理実行ルールの(C1)に従って、図72
の枠番号2の一文字枠から抽出されたパターンに対し、
「一文字消し線」に対応する図3の消し線認識部26の
処理を実行する。
【0444】この消し線認識部26では、例えば、図6
7に示したように、訂正文字の候補として抽出されたパ
ターンから所定値以上のヒストグラム値を有する横線を
除去し、この横線を除去したパターンが、文字と認識さ
れた場合は、除去した横線を消し線とみなすことによ
り、訂正文字の候補として抽出されたパターンを訂正文
字と認識し、所定値以上のヒストグラム値を有する横線
を除去したパターンが、リジェクトされた場合は、除去
した横線を消し線を文字に一部とみなして消し線でない
とすることにより、訂正文字の候補として抽出されたパ
ターンを通常文字と認識する。
【0445】消し線認識部26の消し線認識処理によ
り、図72の枠番号2の一文字枠から抽出されたパター
ンの認識信頼度が10%と算出された結果、図72の枠
番号2の一文字枠から抽出されたパターンは訂正文字で
ないとみなされ、中間処理結果テーブルの「信頼度」の
欄に「10%」と記入されるとともに、中間処理結果テ
ーブルの「処理指示」の欄に「基本」と記入される。
【0446】また、中間処理結果テーブルの「処理完
了」の欄に「消し線」と記入され、中間処理結果テーブ
ルの「処理順序」の欄に「基本」と記入される。次に、
図75の中間処理結果テーブルの枠番号3の「処理順
序」の欄において、「基本」と指示されているので、処
理実行ルールの(C1)に従って、図72の枠番号3の
一文字枠から抽出されたパターンに対し、「基本」に対
応する図3の基本文字認識部17の処理を実行する。
【0447】この基本文字認識部17では、例えば、図
31に示したように、入力された未知文字の特徴を抽出
し、この未知文字の特徴を特徴ベクトルにより表し、基
本辞書に予め格納されている各カテゴリの特徴ベクトル
と照合することにより、特徴空間上での特徴ベクトル間
の距離を算出し、特徴ベクトル間の距離を最小とする文
字カテゴリを未知文字として認識する。
【0448】また、基本文字認識部17は、未知文字の
輪郭の凹凸の個数を算出することにより、未知文字の変
形度を算出する。そして、未知文字の変形度が大きく
て、認識率が低下する場合は、知識テーブル18を参照
し、図34〜図38に示した詳細識別法を用いて文字認
識を実行する。
【0449】基本文字認識部17の文字認識処理によ
り、図72の枠番号3の一文字枠から抽出されたパター
ンは、認識信頼度が95%の確率で文字カテゴリ「3」
である1認識され、中間処理結果テーブルの「文字コー
ド」の欄に「3」と記入されるとともに、中間処理結果
テーブルの「信頼度」の欄に「95%」と記入される。
【0450】また、中間処理結果テーブルの「処理完
了」の欄に「基本」と記入され、中間処理結果テーブル
の「処理順序」の欄は空欄となる。次に、図75の中間
処理結果テーブルの枠番号4の「処理順序」の欄におい
て、最初に「黒枠」と指示されているので、処理実行ル
ールの(C1)に従って、図72の枠番号4の一文字枠
から抽出されたパターンに対し、「黒枠」に対応する図
3の接触文字認識部13の処理を実行し、枠接触文字に
ついての文字認識を行う。
【0451】接触文字認識部13の文字認識処理によ
り、図72の枠番号4の一文字枠から抽出されたパター
ンの認識信頼度が15%と算出された結果、図72の枠
番号4の一文字枠から抽出されたパターンは文字でない
とみなされ、中間処理結果テーブルの「文字コード」の
欄に「リジェクト」と記入されるとともに、中間処理結
果テーブルの「信頼度」の欄に「15%」と記入され
る。
【0452】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠」と記入され、中間処理結果テーブル
の「処理順序」の欄が「一文字消し線」に更新される。
次に、図75の中間処理結果テーブルの枠番号5−1の
「処理順序」の欄において、「一文字消し線」と指示さ
れているので、処理実行ルールの(C1)に従って、図
72の枠番号5−1の枠から抽出されたパターンに対
し、「一文字消し線」に対応する図3の消し線認識部2
6の処理を実行し、訂正文字の候補として抽出されたパ
ターンの認識処理を行う。
【0453】消し線認識部26の消し線認識処理によ
り、図72の枠番号5−1の枠から抽出されたパターン
の認識信頼度が95%と算出された結果、図72の枠番
号5−1の枠から抽出されたパターンは訂正文字とみな
され、中間処理結果テーブルの「信頼度」の欄に「95
%」と記入されるとともに、中間処理結果テーブルの
「処理完了」の欄に「消し線」と記入される。
【0454】また、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入されるとともに、中間処理結
果テーブルの「処理順序」の欄は空欄となる。次に、図
75の中間処理結果テーブルの枠番号5−2の「処理順
序」の欄において、「黒枠」と指示されているので、処
理実行ルールの(C1)に従って、図72の枠番号5−
2の枠から抽出されたパターンに対し、「黒枠」に対応
する図3の接触文字認識部13の処理を実行し、枠接触
文字についての文字認識を行う。
【0455】ここで、図72の枠番号5−2の枠から抽
出されたパターンは、下線部分が枠と接触し、図39の
文字補完や図40の再補完による処理では十分な信頼度
が得られないので、図50(b)に示したように、図4
5の知識テーブル167を参照することにより、誤読文
字対(2、7)を獲得し、図47に示した領域強調の手
法により、再文字認識を行う。
【0456】接触文字認識部13の文字認識処理によ
り、図72の枠番号5−2の枠から抽出されたパターン
は、認識信頼度が95%の確率で文字カテゴリ「2」で
あると認識され、中間処理結果テーブルの「文字コー
ド」の欄に「2」と記入されるとともに、中間処理結果
テーブルの「信頼度」の欄に「95%」と記入される。
【0457】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠」と記入され、中間処理結果テーブル
の「処理順序」の欄は空欄となる。次に、図75の中間
処理結果テーブルの枠番号5−3の「処理順序」の欄に
おいて、「基本」と指示されているので、処理実行ルー
ルの(C1)に従って、図72の枠番号5−3の枠から
抽出されたパターンに対し、「基本」に対応する図3の
基本文字認識部17の処理を実行し、基本文字について
の文字認識処理を行う。
【0458】基本文字認識部17の文字認識処理によ
り、図72の枠番号5−3の枠から抽出されたパターン
は、認識信頼度が90%の確率で文字カテゴリ「6」で
あると認識され、中間処理結果テーブルの「文字コー
ド」の欄に「6」と記入されるとともに、中間処理結果
テーブルの「信頼度」の欄に「90%」と記入される。
【0459】また、中間処理結果テーブルの「処理完
了」の欄に「基本」と記入され、中間処理結果テーブル
の「処理順序」の欄は空欄となる。次に、図75の中間
処理結果テーブルの枠番号6−1−1の「処理順序」の
欄において、最初に「複数文字の消し線」と指示されて
いるので、処理実行ルールの(C1)に従って、「複数
文字の消し線」に対応する図3の消し線認識部26の処
理を実行し、消し線の認識処理を行う。
【0460】消し線認識部26の消し線認識処理によ
り、枠番号6の表から消し線が抽出され、その消し線の
認識信頼度が98%と算出された結果、図72の枠番号
6−1−1の枠から抽出されたパターンは訂正文字とみ
なされ、中間処理結果テーブルの「文字コード」の欄に
「消し線」と記入されるとともに、中間処理結果テーブ
ルの「信頼度」の欄に「98%」と記入され、中間処理
結果テーブルの「処理完了」の欄に「消し線」と記入さ
れる。
【0461】また、処理実行ルールの(C3)に従っ
て、中間処理結果テーブルの「処理指示」の欄に「終
了」と記入されるとともに、中間処理結果テーブルの
「処理順序」の欄は空欄となる。
【0462】次に、図75の中間処理結果テーブルの枠
番号6−2−2の「処理順序」の欄において、最初に
「複数文字の消し線」と指示されているので、処理実行
ルールの(C1)に従って、「複数文字の消し線」に対
応する図3の消し線認識部26の処理を実行し、消し線
の認識処理を行う。
【0463】消し線認識部26の消し線認識処理によ
り、枠番号6の表から消し線が抽出され、その消し線の
認識信頼度が98%と算出された結果、図72の枠番号
6−2−2の枠から抽出されたパターンは訂正文字とみ
なされ、中間処理結果テーブルの「文字コード」の欄に
「消し線」と記入されるとともに、中間処理結果テーブ
ルの「信頼度」の欄に「98%」と記入され、中間処理
結果テーブルの「処理完了」の欄に「消し線」と記入さ
れる。
【0464】また、処理実行ルールの(C3)に従っ
て、中間処理結果テーブルの「処理指示」の欄に「終
了」と記入されるとともに、中間処理結果テーブルの
「処理順序」の欄は空欄となる。
【0465】以上に処理により、図76の中間処理結果
テーブルが生成される。ここで、図76の中間処理結果
テーブルの「処理順序」の欄には、次に呼び出す処理が
記入されているので、処理実行ルール(C1)に従って
処理を続行する。
【0466】図77は、図76の中間処理結果テーブル
に基づいて認識処理を続行し、その際に得られた結果を
示す図である。まず、図76の中間処理結果テーブルの
枠番号1の第1番目のパターンの「処理順序」の欄にお
いて、最初に「一文字消し線」と指示されているので、
処理実行ルールの(C1)に従って、図72の枠番号1
のフリーピッチ枠から抽出された第1番目のパターンに
対し、「一文字消し線」に対応する図3の消し線認識部
26の処理を実行し、訂正文字についての認識処理を行
う。
【0467】消し線認識部26の認識処理により、図7
2の枠番号1のフリーピッチ枠から抽出された第1番目
のパターンの認識信頼度が96%と算出された結果、図
72の枠番号1のフリーピッチ枠から抽出された第1番
目のパターンは訂正文字とみなされ、中間処理結果テー
ブルの「文字コード」の欄に「消し線」と記入されると
ともに、中間処理結果テーブルの「信頼度」の欄に「9
6%」と記入され、中間処理結果テーブルの「処理完
了」の欄に「黒枠/消し線」と記入される。
【0468】また、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入されるとともに、中間処理結
果テーブルの「処理順序」の欄は空欄となる。次に、図
75の中間処理結果テーブルの枠番号1の第2番目のパ
ターンの「処理順序」の欄において、「フリーピッチ」
と指示されているので、処理実行ルールの(C4)に従
って、図72の枠番号1のフリーピッチ枠から抽出され
た第2番目のパターンに対し、同じ枠番号1の他の全て
のパターンの「処理順序」の欄が「フリーピッチ」とな
るまで待機し、枠番号1の全てのパターンの「処理順
序」の欄が「フリーピッチ」となった時に、枠番号1の
フリーピッチ枠から抽出された全てのパターンを対象と
して、「フリーピッチ」に対応する図3の文字列認識部
15の処理を実行し、文字の切り出し信頼度を考慮しな
がら文字認識を行う。
【0469】次に、図75の中間処理結果テーブルの枠
番号1の第8番目のパターンの「処理順序」の欄におい
て、「フリーピッチ」と指示されているので、処理実行
ルールの(C4)に従って、図72の枠番号1のフリー
ピッチ枠から抽出された第8番目のパターンに対し、同
じ枠番号1の他の全てのパターンの「処理順序」の欄が
「フリーピッチ」となるまで待機し、枠番号1の全ての
パターンの「処理順序」の欄が「フリーピッチ」となっ
た時に、枠番号1のフリーピッチ枠から抽出された全て
のパターンを対象として、「フリーピッチ」に対応する
図3の文字列認識部15の処理を実行し、文字の切り出
し信頼度を考慮しながら認識処理を行う。
【0470】そして、枠番号1の全てのパターンの「処
理順序」の欄が「フリーピッチ」となった場合、図72
の枠番号1のフリーピッチ枠から抽出された全てのパタ
ーンを対象として、文字列認識部15の文字認識処理を
行う。
【0471】ここで、図72の枠番号1のフリーピッチ
枠から抽出された第1番目のパターンについては、図7
7の中間処理結果テーブルの枠番号1の第1番目のパタ
ーンの「処理指示」の欄が「終了」となっているので、
図72の枠番号1のフリーピッチ枠から抽出された第1
番目のパターンを文字列認識部15の処理対象から除外
し、図72の枠番号1のフリーピッチ枠から抽出された
第2番目のパターンから第8番目のパターンについて、
文字列認識部15の認識処理を実行する。
【0472】この文字列認識部15では、例えば、図5
2〜図65に示したように、文字を切り出した際の信頼
度を判別面からの距離に基づいて算出し、(文字切り出
しの信頼度)と(文字認識の信頼度)との積が最大とな
るものを、切り出し文字とする。
【0473】文字列認識部15の認識処理により、図7
2の枠番号1のフリーピッチ枠から抽出された第2番目
のパターンは、認識信頼度が95%の確率で文字カテゴ
リ「3」であると認識され、中間処理結果テーブルの
「文字コード」の欄に「3」と記入されるとともに、中
間処理結果テーブルの「信頼度」の欄に「95%」と記
入される。
【0474】また、処理実行ルールの(C1)に従っ
て、中間処理結果テーブルの「処理完了」の欄に「黒枠
/フリーピッチ」と記入され、中間処理結果テーブルの
「処理順序」の欄が空欄となり、処理実行ルールの(C
4)に従って、中間処理結果テーブルの「処理指示」の
欄に「個人筆記特性」と記入される。
【0475】図72の枠番号1のフリーピッチ枠から抽
出された第8番目のパターンは、認識信頼度が98%の
確率で文字カテゴリ「4」であると認識され、中間処理
結果テーブルの「文字コード」の欄に「4」と記入され
るとともに、中間処理結果テーブルの「信頼度」の欄に
「98%」と記入される。
【0476】また、処理実行ルールの(C1)に従っ
て、中間処理結果テーブルの「処理完了」の欄に「黒枠
/フリーピッチ」と記入され、中間処理結果テーブルの
「処理順序」の欄が空欄となり、処理実行ルールの(C
4)に従って、中間処理結果テーブルの「処理指示」の
欄に「個人筆記特性」と記入される。
【0477】また、図72の枠番号1のフリーピッチ枠
から抽出された第3番目のパターンは、文字カテゴリ
「2」であると認識され、図72の枠番号1のフリーピ
ッチ枠から抽出された第4番目のパターンと図72の枠
番号1のフリーピッチ枠から抽出された第5番目のパタ
ーンとは、文字列認識部15の認識処理により1つの文
字に統合され、文字カテゴリ「7」であると認識され、
図72の枠番号1のフリーピッチ枠から抽出された第6
番目のパターンは、文字カテゴリ「4」であると認識さ
れ、図72の枠番号1のフリーピッチ枠から抽出された
第7番目のパターンは、文字カテゴリ「6」であると認
識される。
【0478】この結果、図77の中間処理結果テーブル
の「文字数」の欄は「7」に変更される。次に、図76
の中間処理結果テーブルの枠番号2の「処理順序」の欄
において、「基本」と指示されているので、処理実行ル
ールの(C1)に従って、図72の枠番号2の一文字枠
から抽出されたパターンに対し、「基本」に対応する図
3の基本文字認識部17の処理を実行し、基本文字につ
いての文字認識処理を行う。
【0479】基本文字認識部17の文字認識処理によ
り、図72の枠番号2の一文字枠から抽出されたパター
ンは、認識信頼度が97%の確率で文字カテゴリ「5」
であると認識され、中間処理結果テーブルの「文字コー
ド」の欄に「5」と記入されるとともに、中間処理結果
テーブルの「信頼度」の欄に「97%」と記入される。
【0480】また、中間処理結果テーブルの「処理呼び
出し」の欄に「消し線(有2)/基本」と記入され、中
間処理結果テーブルの「処理完了」の欄に「消し線/基
本」と記入され、中間処理結果テーブルの「処理順序」
の欄は空欄となり、処理実行ルールの(C4)に従っ
て、中間処理結果テーブルの「処理指示」の欄に「個人
筆記特性」と記入される。
【0481】次に、図76の中間処理結果テーブルの枠
番号3の「処理順序」の欄は空欄となっているので、処
理実行ルールの(C4)に従って、中間処理結果テーブ
ルの「処理指示」の欄に「個人筆記特性」と記入され
る。
【0482】次に、図76の中間処理結果テーブルの枠
番号4の「処理順序」の欄において、「一文字消し線」
と指示されているので、処理実行ルールの(C1)に従
って、図72の枠番号4の一文字枠から抽出されたパタ
ーンに対し、「一文字消し線」に対応する図3の消し線
認識部26の処理を実行し、訂正文字の候補として抽出
されたパターンの認識処理を行う。
【0483】消し線認識部26の消し線認識処理によ
り、図72の枠番号4の一文字枠から抽出されたパター
ンの認識信頼度が95%と算出された結果、図72の枠
番号4の一文字枠から抽出されたパターンは訂正文字と
みなされ、中間処理結果テーブルの「信頼度」の欄に
「95%」と記入されるとともに、中間処理結果テーブ
ルの「処理完了」の欄に「黒枠/消し線」と記入され
る。
【0484】また、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入されるとともに、中間処理結
果テーブルの「処理順序」の欄は空欄となる。次に、図
76の中間処理結果テーブルの枠番号5−1の「処理指
示」の欄に「終了」と記入されているので、図72の枠
番号5−1の枠から抽出されたパターンについては、処
理を行わない。
【0485】次に、図76の中間処理結果テーブルの枠
番号5−2の「処理順序」の欄は空欄となっているの
で、処理実行ルールの(C4)に従って、中間処理結果
テーブルの「処理指示」の欄に「個人筆記特性」と記入
される。
【0486】次に、図76の中間処理結果テーブルの枠
番号5−3の「処理順序」の欄は空欄となっているの
で、処理実行ルールの(C4)に従って、中間処理結果
テーブルの「処理指示」の欄に「個人筆記特性」と記入
される。
【0487】次に、図76の中間処理結果テーブルの枠
番号6−1−1の「処理指示」の欄に「終了」と記入さ
れているので、図72の枠番号6−1−1の枠から抽出
されたパターンについては、処理を行わない。
【0488】次に、図76の中間処理結果テーブルの枠
番号6−2−2の「処理指示」の欄に「終了」と記入さ
れているので、図72の枠番号6−1−1の枠から抽出
されたパターンについては、処理を行わない。
【0489】以上に処理により、図77の中間処理結果
テーブルが生成される。ここで、図77の中間処理結果
テーブルの「処理指示」の欄には、「個人筆記特性」と
記入されているものがあるので、処理実行ルール(C
5)に従って処理を続行する。
【0490】図78は、図77の中間処理結果テーブル
に基づいて認識処理を続行し、その際に得られた結果を
示す図である。まず、図76の中間処理結果テーブルの
枠番号1の第1番目のパターンの「処理指示」の欄に
「終了」と記入されているので、図72の枠番号1のフ
リーピッチ枠から抽出された第1番目のパターンについ
ては、処理を行わない。
【0491】次に、図75の中間処理結果テーブルの枠
番号1の第2番目のパターンの「処理指示」の欄に「個
人筆記特性」と記入されているので、処理実行ルールの
(C5)に従って、図72の枠番号1のフリーピッチ枠
から抽出された第2番目のパターンに対し、「個人筆記
特性」に対応する図3のくせ字解析部23の処理を実行
する。
【0492】このくせ字解析部23は、例えば、図68
〜図71に示したように、同一筆者が書いた手書き文字
を各カテゴリごとにクラスタリングし、クラスタリング
により得られた手書き文字の第1のクラスタと距離が近
く、且つ他のカテゴリに属する第2のクラスタで要素数
が少ないものを第1のクラスタに統合することにより、
第2のクラスタに属する手書き文字のカテゴリを第1の
クラスタのカテゴリに修正する。
【0493】くせ字解析部23の解析処理により、図7
2の枠番号1のフリーピッチ枠から抽出された第2のパ
ターンは、認識信頼度が97%の確率で文字カテゴリ
「3」であると認識され、中間処理結果テーブルの「文
字コード」の欄に「3」と記入されるとともに、中間処
理結果テーブルの「信頼度」の欄に「97%」と記入さ
れる。
【0494】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠/フリーピッチ/個人筆記特性」と記
入されるとともに、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入される。
【0495】次に、図75の中間処理結果テーブルの枠
番号1の第8番目のパターンの「処理指示」の欄に「個
人筆記特性」と記入されているので、処理実行ルールの
(C5)に従って、図72の枠番号1のフリーピッチ枠
から抽出された第8番目のパターンに対し、「個人筆記
特性」に対応する図3のくせ字解析部23の処理を実行
する。
【0496】くせ字解析部23の解析処理により、図7
2の枠番号1のフリーピッチ枠から抽出された第8番目
のパターンは、認識信頼度が98%の確率で文字カテゴ
リ「4」であると認識され、中間処理結果テーブルの
「文字コード」の欄に「4」と記入されるとともに、中
間処理結果テーブルの「信頼度」の欄に「98%」と記
入される。
【0497】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠/フリーピッチ/個人筆記特性」と記
入されるとともに、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入される。
【0498】次に、図76の中間処理結果テーブルの枠
番号2の「処理指示」の欄に「個人筆記特性」と記入さ
れているので、処理実行ルールの(C5)に従って、図
72の枠番号2の一文字枠から抽出されたパターンに対
し、「個人筆記特性」に対応する図3のくせ字解析部2
3の処理を実行する。
【0499】くせ字解析部23の解析処理により、図7
2の枠番号2の一文字枠から抽出されたパターンは、認
識信頼度が97%の確率で文字カテゴリ「5」であると
認識され、中間処理結果テーブルの「文字コード」の欄
に「5」と記入されるとともに、中間処理結果テーブル
の「信頼度」の欄に「97%」と記入される。
【0500】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠/フリーピッチ/個人筆記特性」と記
入されるとともに、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入される。
【0501】次に、図76の中間処理結果テーブルの枠
番号3の「処理指示」の欄に「個人筆記特性」と記入さ
れているので、処理実行ルールの(C5)に従って、図
72の枠番号3の一文字枠から抽出されたパターンに対
し、「個人筆記特性」に対応する図3のくせ字解析部2
3の処理を実行する。
【0502】くせ字解析部23の解析処理により、図7
2の枠番号3の一文字枠から抽出されたパターンは、認
識信頼度が97%の確率で文字カテゴリ「3」であると
認識され、中間処理結果テーブルの「文字コード」の欄
に「3」と記入されるとともに、中間処理結果テーブル
の「信頼度」の欄に「97%」と記入される。
【0503】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠/フリーピッチ/個人筆記特性」と記
入されるとともに、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入される。
【0504】次に、図76の中間処理結果テーブルの枠
番号4の「処理指示」の欄に「終了」と記入されている
ので、図72の枠番号4の一文字枠から抽出されたパタ
ーンについては、処理を行わない。
【0505】次に、図76の中間処理結果テーブルの枠
番号5−1の「処理指示」の欄に「終了」と記入されて
いるので、図72の枠番号5−1の枠から抽出されたパ
ターンについては、処理を行わない。
【0506】次に、図76の中間処理結果テーブルの枠
番号5−2の「処理指示」の欄に「個人筆記特性」と記
入されているので、処理実行ルールの(C5)に従っ
て、図72の枠番号5−2の枠から抽出されたパターン
に対し、「個人筆記特性」に対応する図3のくせ字解析
部23の処理を実行する。
【0507】くせ字解析部23の解析処理により、図7
2の枠番号5−2の枠から抽出されたパターンは、認識
信頼度が97%の確率で文字カテゴリ「2」であると認
識され、中間処理結果テーブルの「文字コード」の欄に
「2」と記入されるとともに、中間処理結果テーブルの
「信頼度」の欄に「97%」と記入される。
【0508】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠/フリーピッチ/個人筆記特性」と記
入されるとともに、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入される。
【0509】次に、図76の中間処理結果テーブルの枠
番号5−3の「処理指示」の欄に「個人筆記特性」と記
入されているので、処理実行ルールの(C5)に従っ
て、図72の枠番号5−3の枠から抽出されたパターン
に対し、「個人筆記特性」に対応する図3のくせ字解析
部23の処理を実行する。
【0510】くせ字解析部23の解析処理により、図7
2の枠番号5−3の枠から抽出されたパターンは、認識
信頼度が96%の確率で文字カテゴリ「4」であると認
識され、中間処理結果テーブルの「文字コード」の欄が
「4」に変更されるとともに、中間処理結果テーブルの
「信頼度」の欄に「96%」と記入される。
【0511】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠/フリーピッチ/個人筆記特性」と記
入されるとともに、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入される。
【0512】次に、図76の中間処理結果テーブルの枠
番号6−1−1の「処理指示」の欄に「終了」と記入さ
れているので、図72の枠番号6−1−1の枠から抽出
されたパターンについては、処理を行わない。
【0513】次に、図76の中間処理結果テーブルの枠
番号6−2−2の「処理指示」の欄に「終了」と記入さ
れているので、図72の枠番号6−1−1の枠から抽出
されたパターンについては、処理を行わない。
【0514】以上に処理により、図78の中間処理結果
テーブルが生成される。ここで、図78の中間処理結果
テーブルの「処理指示」の欄は、全ての処理対象に対し
て「終了」と記入されているので、処理実行ルール(C
6)に従って、全ての処理を終了する。
【0515】以上説明したように、本発明の実施例によ
れば、文字認識部12及び非文字認識部25では、環境
認識系11で認識された入力画像の状態を処理するため
に適合した認識処理を行う。
【0516】例えば、環境認識系11が罫線に接触した
文字を抽出した場合、罫線に接触した文字についての認
識処理を専用に行う接触文字認識部13を使用し、環境
認識系11がフリーピッチ文字列を抽出した場合、フリ
ーピッチ文字列についての認識処理を専用に行う文字列
認識部15を使用し、環境認識系11がかすれ文字を抽
出した場合、かすれ文字についての認識処理を専用に行
うかすれ文字認識部19を使用し、環境認識系11がつ
ぶれ文字を抽出した場合、つぶれ文字についての認識処
理を専用に行うつぶれ文字認識部21を使用し、環境認
識系11が非文字を抽出した場合、非文字についての認
識処理を専用に非文字認識部25を使用する。
【0517】また、文字認識部19又は非文字認識部2
5の認識結果についての信頼度を算出し、信頼度が低い
文字や非文字については、環境認識系11、文字認識部
19及び非文字認識部25の間で相互にフィードバック
を行うようにして他の処理をやり直すようにし、信頼度
が高くなるか、又は実行できる処理がなくなった場合に
全体の処理を終了する。
【0518】このように、本発明の実施例によれば、文
字が書かれている環境に応じて、文字を認識する際に使
用する特徴及び識別法をアダプティブに変化させて認識
処理を実行することができるので、文書や帳票の様々な
環境に対応した高精度な文字認識が可能となる。
【0519】また、文字コードのみを認識結果として出
力するだけでなく、環境認識系11による環境認識結果
を文字認識結果と同時に出力することができるととも
に、環境認識結果と文字認識結果とが相互に一致した時
に文字認識結果を出力することが可能となり、文字認識
結果に対する確認機能及び信頼性を向上させることがで
きる。
【0520】さらに、非文字認識部25を専用に設け、
非文字認識を文字認識と独立して行うことができるの
で、文字認識及び非文字認識の信頼性を向上させること
ができる。
【0521】さらにまた、各文字が書かれている環境に
応じた独立な認識処理を行うことができるので、各認識
処理における辞書や知識を増加させることにより、認識
信頼度を向上させることができる。
【0522】
【発明の効果】以上説明したように、本発明によれば、
処理対象の状態を入力画像から抽出し、その状態に適し
た認識処理を処理対象ごとに選択することにより、様々
な状態を有する入力画像に対し、それぞれの状態に適し
たパターン認識処理を行うことができ、認識処理を精度
よく行うことが可能となる。また、処理対象の評価が、
その状態を抽出する時と、その処理対象についての認識
処理を行う時の両方で行われるので、認識処理の精度を
より一層向上させることができる。
【0523】また、本発明の一態様によれば、処理対象
の状態を入力画像から抽出し、第1の状態を有する処理
対象に対しては、第1の状態専用のパターン認識処理を
行い、第2の状態を有する処理対象に対しては、第2の
状態専用のパターン認識処理を行うことにより、第1の
状態を有する処理対象の認識処理と第2の状態を有する
処理対象の認識処理とが互いに相互作用を及ぼすことが
なくなり、認識処理を精度よく行うことが可能となる。
【0524】また、本発明の一態様によれば、様々な状
態を有する入力画像に対し、認識辞書を使い分けること
により、それぞれの状態に対して最適な認識辞書を使用
することができ、認識処理の精度を向上させることが可
能となる。
【0525】また、本発明の一態様によれば、様々な状
態を有する入力画像に対し、識別関数を使い分けること
により、それぞれの状態に対して最適な識別関数を使用
しながら認識処理を行うことができ、認識処理の精度を
向上させることが可能となる。
【0526】また、本発明の一態様によれば、様々な状
態を有する入力画像に対し、知識を使い分けることによ
り、それぞれの状態に対して最適な知識を使用しながら
認識処理を行うことができ、認識処理の精度を向上させ
ることが可能となる。
【0527】また、本発明の一態様によれば、認識処理
による信頼度が所定の値以上となるまで、同一の処理対
象に対して複数の認識処理を行うようにすることによ
り、認識処理の信頼度を上げることができ、認識処理の
精度を向上させることができる。
【0528】また、本発明の一態様によれば、非文字に
ついての認識処理と文字についての認識処理とを別々に
行うようにすることにより、文字を非文字とみなした
り、非文字を文字とみなしたりして認識処理が行われる
ことが減少し、認識処理を精度よく行うことが可能とな
る。
【図面の簡単な説明】
【図1】本発明の一実施例によるパターン認識装置の機
能的な構成を示すブロック図である。
【図2】図1の環境認識手段のより具体的な構成の一実
施例を示すブロック図である。
【図3】図1のパターン認識装置のより具体的な構成の
一実施例を示すブロック図である。
【図4】図3の環境認識系の全体的な動作の一実施例を
示すフローチャートである。
【図5】図4の前処理部の動作の一実施例を示すフロー
チャートである。
【図6】図4のレイアウト解析部の動作の一実施例を示
すフローチャートである。
【図7】図4の品質解析部の動作の一実施例を示すフロ
ーチャートである。
【図8】図4の訂正解析部の動作の一実施例を示すフロ
ーチャートである。
【図9】図4の文字認識/非文字認識への制御部の動作
の一実施例を示すフローチャートである。
【図10】本発明の一実施例によるパターン認識装置の
システム構成を示すブロック図である。
【図11】本発明の一実施例によるパターン認識装置の
より具体的なシステム構成を示すブロック図である。
【図12】本発明の一実施例によるパターン認識装置の
ラベリング処理の一例を示す図である。
【図13】本発明の一実施例によるパターン認識装置の
ラベリング処理の圧縮表現を示す図である。
【図14】本発明の一実施例によるパターン認識装置の
テキスト抽出処理の一例を示す図である。
【図15】本発明の一実施例によるパターン認識装置の
テキスト抽出処理における部分領域の一例を示す図であ
る。
【図16】本発明の一実施例によるパターン認識装置の
罫線抽出処理における隣接投影法を説明する図である。
【図17】本発明の一実施例によるパターン認識装置の
罫線抽出処理におけるパターンの投影結果を示す図であ
る。
【図18】本発明の一実施例によるパターン認識装置の
罫線抽出処理を示すフローチャートである。
【図19】本発明の一実施例によるパターン認識装置の
罫線抽出処理を示す図である。
【図20】本発明の一実施例によるパターン認識装置の
罫線抽出処理におけるかすれ罫線の補完方法を説明する
図である。
【図21】本発明の一実施例によるパターン認識装置の
かすれ罫線の補完方法を示すフローチャートである。
【図22】本発明の一実施例によるパターン認識装置の
かすれ罫線の補完の際の探索方向を示す図である。
【図23】本発明の一実施例によるパターン認識装置の
一文字枠抽出処理を示すフローチャートである。
【図24】本発明の一実施例によるパターン認識装置の
ブロック枠抽出処理を示すフローチャートである。
【図25】本発明の一実施例によるパターン認識装置の
枠及び表の種類を示す図である。
【図26】本発明の一実施例によるパターン認識装置の
画像縮小処理を示すフローチャートである。
【図27】本発明の一実施例によるパターン認識装置の
枠接触有無判断処理を説明する図である。
【図28】本発明の一実施例によるパターン認識装置の
枠接触有無判断処理を示すフローチャートである。
【図29】本発明の一実施例によるパターン認識装置の
消し線の種類を示す図である。
【図30】本発明の一実施例によるパターン認識装置の
訂正文字の特徴量の算出方法を説明する図である。
【図31】図3の基本文字認識部の構成例を示すブロッ
ク図である。
【図32】図3の基本文字認識部における特徴ベクトル
の算出方法の一例を示す図である。
【図33】図3の基本文字認識部における特徴ベクトル
間の距離の算出方法の一例を示す図である。
【図34】図3の基本文字認識部における詳細識別法の
文字セグメントの抽出方法を説明する図である。
【図35】図3の基本文字認識部における詳細識別法の
端点の検出方法を説明する図である。
【図36】図3の基本文字認識部における詳細識別法の
角度変化の検出方法を説明する図である。
【図37】図3の基本文字認識部における詳細識別法の
文字セグメントの対応関係を説明する図である。
【図38】図3の基本文字認識部における詳細識別法の
処理を示すフローチャートである。
【図39】図3の接触文字認識部における文字補完の方
法を示す図である。
【図40】図3の接触文字認識部における再補完の方法
を示す図である。
【図41】図3の接触文字認識部における補完誤読文字
の例を示す図である。
【図42】図3の接触文字認識部における文字の学習方
法の一例を示すブロック図である。
【図43】図3の接触文字認識部における枠接触文字の
生成方法を説明する図である。
【図44】図3の接触文字認識部における枠接触文字の
生成例を示す図である。
【図45】図3の接触文字認識部における知識テーブル
の一例を示す図である。
【図46】図3の接触文字認識部における知識テーブル
に登録される変動種類及び変動量の一例を示す図であ
る。
【図47】図3の接触文字認識部の領域強調による再認
識領域の一例を示す図である。
【図48】図3の接触文字認識部の領域強調による再認
識方法を説明する図である。
【図49】図3の接触文字認識部の領域強調による再認
識処理を示すフローチャートである。
【図50】図3の接触文字認識部における文字の再認識
方法の一例を示すブロック図である。
【図51】図3の接触文字認識部における文字の再認識
処理を示すフローチャートである。
【図52】図3の文字列認識部の統計的処理によるパラ
メータの図形的意味を説明する図である。
【図53】図3の文字列認識部の統計的処理を示すフロ
ーチャートである。
【図54】図3の文字列認識部の分離文字処理によるパ
ラメータの図形的意味を説明する図である。
【図55】図3の文字列認識部の分離文字処理を示すフ
ローチャートである。
【図56】図3の文字列認識部の濁点処理によるパラメ
ータの図形的意味を説明する図である。
【図57】図3の文字列認識部の濁点処理を示すフロー
チャートである。
【図58】図3の文字列認識部の文字切り出し成否デー
タの算出処理を示すフローチャートである。
【図59】図3の文字列認識部の文字切り出し信頼度の
定量化方法を示す図である。
【図60】図3の文字列認識部の度数分布の生成方法を
示す図である。
【図61】図3の文字列認識部の文字切り出し信頼度の
算出方法を示すフローチャートである。
【図62】図3の文字列認識部における文字の切り出し
成功及び切り出し失敗のヒストグラム分布の一例を示す
図である。
【図63】図3の文字列認識部における文字の切り出し
成功及び切り出し失敗の2群の重なり領域算出法を示す
図である。
【図64】図3の文字列認識部における文字の切り出し
処理の流れを示す図である。
【図65】図3の文字列認識部の非統計的処理における
文字の切り出し処理の流れを示す図である。
【図66】図3のかすれ文字認識部の構成例を示すブロ
ック図である。
【図67】図3の消し線認識部の処理の一例を示す図で
ある。
【図68】図3のくせ字解析部によるクラスタリング処
理の流れを示す図である。
【図69】図3のくせ字解析部によるクラスタリング処
理を示すフローチャートである。
【図70】図3のくせ字解析部による文字カテゴリ判定
結果修正処理の流れを示す図である。
【図71】図3のくせ字解析部による文字カテゴリ判定
結果修正処理を示すフローチャートである。
【図72】本発明の一実施例によるパターン認識装置の
処理対象となる帳票の例を示す図である。
【図73】本発明の一実施例によるパターン認識装置の
中間処理結果テーブルの一例を示す図である。
【図74】本発明の一実施例によるパターン認識装置の
処理順序テーブルの一例を示す図である。
【図75】本発明の一実施例によるパターン認識装置の
中間処理結果テーブルの一例を示す図である。
【図76】本発明の一実施例によるパターン認識装置の
中間処理結果テーブルの一例を示す図である。
【図77】本発明の一実施例によるパターン認識装置の
中間処理結果テーブルの一例を示す図である。
【図78】本発明の一実施例によるパターン認識装置の
中間処理結果テーブルの一例を示す図である。
【図79】従来のパターン認識装置の構成を示すブロッ
ク図である。
【符号の説明】
1 環境認識手段 2 第1のパターン認識手段 4 第2のパターン認識手段 6 第Nのパターン認識手段 3、5、7 信頼度算出手段 1a 状態抽出手段 1b 認識処理制御手段 1c 中間処理結果テーブル作成手段 1d 処理順序制御ルール格納手段 1e 処理実行ルール格納手段 1f 処理順序テーブル 11 環境認識系 12 文字認識部 13 接触文字認識部 15 文字列認識部 17 基本文字認識部 19 かすれ文字認識部 21 つぶれ文字認識部 23 くせ字解析部 25 非文字認識部 26 消し線認識部 28 雑音認識部 14、16、18、20、22、24、27、29 知
識テーブル 30 環境認識系 31 レイアウト解析部 32 訂正解析部 33 文字認識系/非文字認識系 34 基本文字認識部 35 黒枠接触文字認識部 36 フリーピッチ文字列認識部 37 消し線認識部 38 環境認識系 39 くせ字解析部 40 終了判定処理部 41 画像格納部 42 処理条件格納部 43 ラベル画像格納部 44 中間処理結果テーブル 50 プログラムメモリ 51 中央演算処理ユニット 52 画像メモリ 53 ワークメモリ 54 バス 55 インターフェイス回路 56 ディスプレイ 57 プリンタ 58 メモリ 59 スキャナ 60 辞書ファイル

Claims (39)

    【特許請求の範囲】
  1. 【請求項1】 入力画像のレイアウトを解析するレイア
    ウト解析手段と、 前記入力画像の品質を分析する品質分析手段と、 前記入力画像の訂正状態を解析する訂正解析手段と、 前記入力画像の処理対象の状態ごとにパターン認識処理
    を行うパターン認識手段と、 前記レイアウト、前記品質又は前記訂正状態に基づいて
    前記入力画像の処理対象の状態を抽出し、処理対象の状
    態ごとに前記パターン認識処理のいずれか1つ又は複数
    を選択して認識処理を行わせる環境認識手段とを備える
    ことを特徴とするパターン認識装置。
  2. 【請求項2】 前記処理対象の状態ごとにパターンの切
    り出しを行うパターン切り出し手段をさらに備えること
    を特徴とする請求項1に記載のパターン認識装置。
  3. 【請求項3】 前記環境認識手段は、前記処理対象の状
    態についての判断結果に基づいて、前記パターン認識手
    段による状態ごとの認識処理を前記処理対象ごとに記入
    した中間処理結果テーブルを作成する中間処理結果テー
    ブル作成手段を備えることを特徴とする請求項1に記載
    のパターン認識装置。
  4. 【請求項4】 前記環境認識手段は、同一の処理対象に
    対して複数の認識処理が呼ばれた場合、前記認識処理に
    よる信頼度が所定の値以上となるまで、優先順位に従っ
    て認識処理を行わせることを特徴とする請求項1に記載
    のパターン認識装置。
  5. 【請求項5】 前記パターン認識手段は、文字の品質ご
    とに設けられた認識辞書を備え、前記品質分析手段によ
    り分析された品質に基づいて、前記認識辞書を使い分け
    て文字の認識処理を行うことを特徴とする請求項1に記
    載のパターン認識装置。
  6. 【請求項6】 前記認識辞書は、標準辞書、かすれ文字
    用の辞書、つぶれ文字用の辞書、白抜き文字用の辞書、
    又は背景がテクスチャの文字用の辞書のうちの少なくと
    も1つからなることを特徴とする請求項5に記載のパタ
    ーン認識装置。
  7. 【請求項7】 前記パターン認識手段は、前記処理対象
    の状態に基づいて、知識を使い分けながら認識処理を行
    うことを特徴とする請求項1に記載のパターン認識装
    置。
  8. 【請求項8】 前記パターン認識手段は、前記処理対象
    の状態に基づいて、識別関数を使い分けながら認識処理
    を行うことを特徴とする請求項1に記載のパターン認識
    装置。
  9. 【請求項9】 前記環境認識手段は、前記パターン認識
    手段による状態ごとの認識処理を文書又は帳票のペ−ジ
    単位で複数実行させることを特徴とする請求項1に記載
    のパターン認識装置。
  10. 【請求項10】 前記品質分析手段は、所定の領域につ
    いて、(面積、縦/横の長さがそれぞれ所定のしきい値
    以下の連結領域の数)/(前記所定の領域の全ての連結
    領域の数)の値が、所定値よりも大きい時にかすれと判
    断することを特徴とする請求項1に記載のパターン認識
    装置。
  11. 【請求項11】 前記品質分析手段は、所定の領域につ
    いて、(かすれた罫線を補完した際の補完された部分の
    長さの合計)/(各罫線の長さの合計)の値が、所定値
    よりも大きい時にかすれと判断することを特徴とする請
    求項1に記載のパターン認識装置。
  12. 【請求項12】 前記品質分析手段は、所定の領域につ
    いて、(黒画素密度が所定のしきい値より大きい連結領
    域の数)/(前記所定の領域の全ての連結領域の数)の
    値が、所定値よりも大きい時につぶれと判断することを
    特徴とする請求項1に記載のパターン認識装置。
  13. 【請求項13】 処理対象の状態を入力画像から抽出す
    る状態抽出手段と、 前記処理対象の状態ごとにパターン認識処理を行うパタ
    ーン認識手段と、 前記状態抽出手段により抽出された前記処理対象の状態
    ごとに、前記パターン認識処理のいずれか1つ又は複数
    を呼び出して認識処理を行わせる認識処理制御手段とを
    備えることを特徴とするパターン認識装置。
  14. 【請求項14】 前記状態抽出手段は、 入力画像から所定の範囲の大きさを有する連結パターン
    を文字の候補として抽出する文字抽出手段と、 前記文字の候補のうち、隣接して存在するものを文字列
    の候補として抽出する文字列抽出手段と、 前記入力画像から罫線を抽出する罫線抽出手段と、 前記罫線で4方を囲むパターンを枠として抽出する枠抽
    出手段と、 前記枠と接触している文字を抽出する接触文字抽出手段
    と、 前記入力画像のかすれ状態を分析するかすれ分析手段
    と、 前記入力画像のつぶれ状態を分析するつぶれ分析手段
    と、 前記入力画像の訂正状態を抽出する訂正特徴抽出手段と
    を備えることを特徴とする請求項13に記載のパターン
    認識装置。
  15. 【請求項15】 前記枠抽出手段は、 前記罫線の連結状態及び枠の大きさに基づいて、一文字
    枠、ブロック枠、フリーピッチ枠、規則的な表、又は不
    規則な表のうちのいずれか1つの属性を前記枠に付与す
    る属性付与手段を備えることを特徴とする請求項14に
    記載のパターン認識装置。
  16. 【請求項16】 前記接触文字抽出手段は、 前記枠抽出手段により抽出された枠の内側を枠に沿って
    走査する走査手段と、 前記走査により交差するパターンが存在するかどうかを
    検出する交差検出手段と、 前記交差検出手段により交差するパターンが検出された
    場合、前記パターンを走査した枠についての枠接触文字
    であると判断する判断手段と、 前記パターンが走査した枠の外側から内側にはみだした
    ものであるかどうかを検出するはみだし検出手段と、 枠の外側から内側にはみだしているパターンを、走査し
    た枠についての枠接触文字から除外する除外手段とを備
    えることを特徴とする請求項14に記載のパターン認識
    装置。
  17. 【請求項17】 前記訂正特徴抽出手段は、 矩形内の画像を所定の一定方向に沿って走査した際の、
    白画素から黒画素又は黒画素から白画素に変化する回数
    を計数することにより、所定方向の線密度を算出する線
    密度算出手段と、 画像中での互いに連結している連結成分の個数から、そ
    の画像が有する穴の個数を減算することにより、オイラ
    ー数を算出するオイラー数算出手段と、 注目する画像自体の面積と注目する画像の外接矩形の面
    積との比を計算することにより、黒画素密度を算出する
    黒画素密度算出手段と、 前記線密度が所定の値以上の場合、前記矩形内の画像を
    訂正文字の候補とする線密度判定手段と、 前記オイラー数の絶対値が所定の値以上で、且つ負の値
    となる場合、前記画像を訂正文字の候補とするオイラー
    数判定手段と、 前記黒画素密度が所定の値以上の場合、前記画像を訂正
    文字の候補とする黒画素密度判定手段とを備えることを
    特徴とする請求項14に記載のパターン認識装置。
  18. 【請求項18】 前記パターン認識手段は、 文字についてのパターン認識を行う文字認識手段と、 文字列についてのパターン認識を行う文字列認識手段
    と、 枠に接触した文字についてのパターン認識を行う接触文
    字認識手段と、 かすれ文字についてのパターン認識を行うかすれ文字認
    識手段と、 つぶれ文字についてのパターン認識を行うつぶれ文字認
    識手段と、 訂正文字についてのパターン認識を行う訂正文字認識手
    段と、 くせ字についてのパターン認識を行うくせ字認識手段と
    を備えることを特徴とする請求項14に記載のパターン
    認識装置。
  19. 【請求項19】 前記文字認識手段は、 入力された未知文字の特徴を特徴ベクトルとして抽出す
    る特徴抽出部と、 文字カテゴリの特徴を特徴ベクトルとして予め格納して
    いる基本辞書と、 前記未知文字の特徴ベクトルと前記文字カテゴリの特徴
    ベクトルとの間の距離を算出し、前記特徴ベクトル間の
    距離を最小とする文字カテゴリを前記未知文字として認
    識する照合部とを備えることを特徴とする請求項18に
    記載のパターン認識装置。
  20. 【請求項20】 前記文字認識手段は、 未知文字の輪郭の凹凸の個数を算出することにより、前
    記未知文字の変形度を算出する変形度算出手段と、 文字カテゴリの特徴を特徴ベクトルとして予め格納して
    いるセグメント辞書と、 文字の輪郭を端点で分割し、文字セグメントを生成する
    文字セグメント生成部と、 前記変形度が所定値以上の場合、前記文字セグメントの
    角度変化の累積値が互いに最も近くなるように、未知文
    字の文字セグメントと前記文字カテゴリの文字セグメン
    トとの対応関係を生成する対応関係生成部と、 前記対応関係に基づいて、前記未知文字の特徴ベクトル
    と前記文字カテゴリの特徴ベクトルとの間の距離を算出
    し、前記特徴ベクトル間の距離を最小とする文字カテゴ
    リを前記未知文字として認識する照合部とを備えること
    を特徴とする請求項18に記載のパターン認識装置。
  21. 【請求項21】 前記文字列認識手段は、 パターンの特徴を示すP個の特性値により表されるサン
    プルデータを、切り出し成功を示す第1の群と切り出し
    失敗を示す第2の群とに分類し、前記第1の群と前記第
    2の群の各重心から等距離となるように構成された判別
    面をP次元空間内に生成する判別面生成手段と、 前記P次元空間内において、入力データについてのP個
    の特性値の位置が、前記判別面からどのくらい離れてい
    るかを示す距離を求め、前記距離に基づいて、前記入力
    データの切り出し信頼度を算出する切り出し信頼度算出
    手段と、 前記入力データの切り出し信頼度と切り出された入力デ
    ータの認識信頼度とに基づいて、入力データの切り出し
    位置を決定する切り出し決定手段とを備えることを特徴
    とする請求項18に記載のパターン認識装置。
  22. 【請求項22】 前記接触文字認識手段は、 枠接触文字から枠を除去する枠除去手段と、 枠を除去することにより分離した線分の方向に基づい
    て、前記枠を除去することによりかすれた文字を補完す
    る文字補完手段と、 枠を除去することにより分離したパターンのうち、前記
    枠接触文字の状態の時に互いに連結していたパターンの
    間を連結することにより、前記枠に重なっていた線分を
    補完する再補完手段と、 文字と枠とを所定の条件で接触させた学習パターンを生
    成する学習パターン生成手段と、 前記学習パターンの認識信頼度を前記所定の条件ととも
    に格納し、前記認識信頼度が所定の値以下の場合、前記
    学習パターンについての再文字認識方法を格納している
    知識テーブルと、 前記文字補完手段により補完されたパターン又は前記再
    補完手段により補完されたパターンが、前記所定の条件
    を満たす場合、知識テーブルに格納された再文字認識方
    法により再文字認識を行う再文字認識手段とを備えるこ
    とを特徴とする請求項18に記載のパターン認識装置。
  23. 【請求項23】 前記かすれ文字認識手段は、 入力された未知文字の特徴を特徴ベクトルとして抽出す
    る特徴抽出部と、 かすれ文字についての文字カテゴリの特徴を特徴ベクト
    ルとして予め格納しているかすれ辞書と、 前記未知文字の特徴ベクトルと前記文字カテゴリの特徴
    ベクトルとの間の距離を算出し、前記特徴ベクトル間の
    距離を最小とする文字カテゴリを前記未知文字として認
    識する照合部とを備えることを特徴とする請求項18に
    記載のパターン認識装置。
  24. 【請求項24】 前記つぶれ文字認識手段は、 入力された未知文字の特徴を特徴ベクトルとして抽出す
    る特徴抽出部と、 つぶれ文字についての文字カテゴリの特徴を特徴ベクト
    ルとして予め格納しているつぶれ辞書と、 前記未知文字の特徴ベクトルと前記文字カテゴリの特徴
    ベクトルとの間の距離を算出し、前記特徴ベクトル間の
    距離を最小とする文字カテゴリを前記未知文字として認
    識する照合部とを備えることを特徴とする請求項18に
    記載のパターン認識装置。
  25. 【請求項25】 前記訂正文字認識手段は、 訂正文字の候補として抽出されたパターンの所定方向の
    ヒストグラム値を算出するヒストグラム値算出手段と、 前記ヒストグラム値が所定値以上の線分を除去する線分
    除去手段と、 前記線分を除去することにより、前記パターンのかすれ
    た部分を補完して補完パターンを生成する補完手段と、 前記補完パターンについての文字認識を行う文字認識手
    段と、 前記補完パターンが文字と認識された場合は、前記線分
    除去手段により除去した線分を消し線とみなし、前記補
    完パターンがリジェクトされた場合は、前記線分除去手
    段により除去した線分を文字の一部とみなす消し線認識
    手段とを備えることを特徴とする請求項18に記載のパ
    ターン認識装置。
  26. 【請求項26】 前記くせ字認識手段は、 同一筆者が書いた手書き文字を各カテゴリごとにクラス
    タリングすることにより、前記手書き文字を要素とする
    複数のクラスタを各カテゴリ内に生成するクラスタリン
    グ手段と、 前記クラスタリング手段により生成されたクラスタか
    ら、要素数が所定値以下のクラスタを抽出するクラスタ
    抽出手段と、 前記クラスタ抽出手段により抽出された第1のクラスタ
    と、他のカテゴリに属する第2のクラスタとのクラスタ
    間距離を算出するクラスタ間距離算出手段と、 前記第1のクラスタと第2のクラスタとの間の距離が所
    定値以下の場合、第1のクラスタと第2のクラスタとを
    統合し、前記第1のクラスタに属する手書き文字のカテ
    ゴリを前記第2のクラスタのカテゴリに修正するカテゴ
    リ修正手段とを備えることを特徴とする請求項18に記
    載のパターン認識装置。
  27. 【請求項27】 前記認識処理制御手段は、 前記文字抽出手段が文字の候補を抽出した場合、前記文
    字認識手段を呼び出し、前記文字列抽出手段が文字列の
    候補を抽出した場合、前記文字列認識手段を呼び出し、
    前記接触文字抽出手段が枠と接触している文字を抽出し
    た場合、前記接触文字認識手段を呼び出し、前記かすれ
    分析手段が前記入力画像のかすれ状態を抽出した場合、
    前記かすれ文字認識手段を呼び出し、前記つぶれ分析手
    段が前記入力画像のつぶれ状態を抽出した場合、前記つ
    ぶれ文字認識手段を呼び出し、前記訂正特徴抽出が前記
    入力画像の訂正状態を抽出した場合、前記訂正文字認識
    手段を呼び出すことを特徴とする請求項18に記載のパ
    ターン認識装置。
  28. 【請求項28】 前記認識処理制御手段は、前記文字認
    識手段による文字としての信頼度が所定の値以上の場
    合、前記くせ字認識手段を呼び出すことを特徴とする請
    求項18に記載のパターン認識装置。
  29. 【請求項29】 前記認識処理制御手段は、 処理対象の状態の入力画像からの抽出結果に基づいて、
    前記パターン認識手段による認識処理のいずれを呼び出
    すかを示す呼び出し手順を格納している処理順序制御ル
    ール格納手段と、 同一の処理対象に対する複数の認識処理が前記パターン
    認識手段から呼び出された際の呼び出し順序を格納した
    処理順序テーブルと、 前記呼び出し手順及び前記呼び出し順序に基づいて、前
    記パターン認識手段による認識処理の実行順序を前記処
    理対象ごとに示した中間処理結果テーブルを作成する中
    間処理結果テーブル作成手段と、 前記中間処理結果テーブルに記入された認識処理の実行
    結果に基づいて、次の処理の実行を指示する手順を格納
    している処理実行ルール格納手段とを備えることを特徴
    とする請求項13に記載のパターン認識装置。
  30. 【請求項30】 入力画像から文字を抽出する文字抽出
    手段と、 入力画像から非文字を抽出する非文字抽出手段と、 文字についての認識処理を行う文字認識手段と、 非文字についての認識処理を行う非文字認識手段と、 前記文字抽出手段が文字を抽出した場合、前記文字認識
    手段により認識処理を行わせ、前記非文字抽出手段が非
    文字を抽出した場合、前記非文字認識手段により認識処
    理を行わせる環境認識手段とを備えることを特徴とする
    パターン認識装置。
  31. 【請求項31】 前記環境認識手段は、 前記文字抽出手段が文字を抽出した場合、前記文字認識
    手段による認識結果についての確からしさを示す信頼度
    を算出し、前記文字認識手段による認識結果の信頼度が
    所定の値より小さい場合、前記文字抽出手段が抽出した
    文字を非文字とみなして前記非文字認識手段により認識
    処理を行わせることを特徴とする請求項30に記載のパ
    ターン認識装置。
  32. 【請求項32】 前記環境認識手段は、 前記非文字抽出手段が非文字を抽出した場合、前記非文
    字認識手段による認識結果についての確からしさを示す
    信頼度を算出し、前記非文字認識手段による認識結果の
    信頼度が所定の値より小さい場合、前記非文字抽出手段
    が抽出した非文字を文字とみなして前記文字認識手段に
    より認識処理を行わせることを特徴とする請求項30に
    記載のパターン認識装置。
  33. 【請求項33】 入力画像から所定の特徴量を抽出する
    環境認識手段と、 前記環境認識手段により抽出された特徴量に基づいて、
    パターン認識処理を変更して実行可能なパターン認識手
    段とを備えることを特徴とするパターン認識装置。
  34. 【請求項34】 第1の状態を有する処理対象について
    のパターン認識処理を行う第1のパターン認識手段と、 第2の状態を有する処理対象についてのパターン認識処
    理を行う第2のパターン認識手段と、 前記処理対象についての状態を入力画像から抽出し、前
    記第1の状態を有する処理対象については、前記第1の
    パターン認識手段による認識処理を行わせ、前記第2の
    状態を有する処理対象については、前記第2のパターン
    認識手段による認識処理を行わせる環境認識手段とを備
    えることを特徴とするパターン認識装置。
  35. 【請求項35】 前記環境認識手段は、 前記第1の状態と前記第2の状態とを同一の処理対象か
    ら抽出した場合、その処理対象については、前記第1の
    パターン認識手段による認識処理と前記第2のパターン
    認識手段による認識処理とを行わせることを特徴とする
    請求項34に記載のパターン認識装置。
  36. 【請求項36】 前記環境認識手段は、前記第1のパタ
    ーン認識手段による認識結果及び前記第2のパターン認
    識手段による認識結果についての確からしさを示す信頼
    度を算出し、前記信頼度が所定の値以上の場合、その認
    識結果を最終結果として出力することを特徴とする請求
    項34に記載のパターン認識装置。
  37. 【請求項37】 処理対象の状態を入力画像から抽出
    し、その状態に適した認識処理を前記処理対象ごとに選
    択することにより、パターン認識を行うことを特徴とす
    るパターン認識方法。
  38. 【請求項38】 処理対象についての状態を入力画像か
    ら抽出するステップと、 第1の状態を有する処理対象に対し、前記第1の状態専
    用のパターン認識処理を行うステップと、 第2の状態を有する処理対象に対し、前記第2の状態専
    用のパターン認識処理を行うステップとを備えることを
    特徴とするパターン認識方法。
  39. 【請求項39】 処理対象についての状態を入力画像か
    ら抽出する機能と、 第1の状態を有する処理対象に対し、第1の状態専用の
    パターン認識処理を行う機能と、 第2の状態を有する処理対象に対し、前記第2の状態専
    用のパターン認識処理を行う機能とをコンピュータに実
    行させるプログラムを格納したコンピュータ読み取り可
    能な記憶媒体。
JP26129197A 1996-09-27 1997-09-26 パターン認識装置 Expired - Fee Related JP4176175B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26129197A JP4176175B2 (ja) 1996-09-27 1997-09-26 パターン認識装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP8-255217 1996-09-27
JP25521796 1996-09-27
JP26129197A JP4176175B2 (ja) 1996-09-27 1997-09-26 パターン認識装置

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP2006298257A Division JP2007058882A (ja) 1996-09-27 2006-11-01 パターン認識装置
JP2006298258A Division JP2007026470A (ja) 1996-09-27 2006-11-01 パターン認識装置

Publications (2)

Publication Number Publication Date
JPH10154204A true JPH10154204A (ja) 1998-06-09
JP4176175B2 JP4176175B2 (ja) 2008-11-05

Family

ID=26542087

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26129197A Expired - Fee Related JP4176175B2 (ja) 1996-09-27 1997-09-26 パターン認識装置

Country Status (1)

Country Link
JP (1) JP4176175B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002074269A (ja) * 2000-08-28 2002-03-15 Nippon Digital Kenkyusho:Kk 文字認識方法
US6643401B1 (en) 1998-12-16 2003-11-04 Fujitsu Limited Apparatus and method for recognizing character
JP2009069951A (ja) * 2007-09-11 2009-04-02 Hitachi Computer Peripherals Co Ltd 文字認識装置及び文字認識装置における文字認識方法
JP2009259291A (ja) * 2000-11-01 2009-11-05 Fujitsu Ltd 文字認識方法,プログラム及び記録媒体
JP2011018311A (ja) * 2009-07-07 2011-01-27 Sharp Corp 画像検索装置、画像検索プログラムおよび記録媒体
JP2018112839A (ja) * 2017-01-10 2018-07-19 富士通株式会社 画像処理プログラム、画像認識プログラム、画像処理装置、画像認識装置、画像認識方法、及び画像処理方法
US11568276B1 (en) 2021-08-25 2023-01-31 International Business Machines Corporation Adaptive document understanding

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6643401B1 (en) 1998-12-16 2003-11-04 Fujitsu Limited Apparatus and method for recognizing character
JP2002074269A (ja) * 2000-08-28 2002-03-15 Nippon Digital Kenkyusho:Kk 文字認識方法
JP4580520B2 (ja) * 2000-08-28 2010-11-17 株式会社日本デジタル研究所 文字認識方法および文字認識装置
JP2009259291A (ja) * 2000-11-01 2009-11-05 Fujitsu Ltd 文字認識方法,プログラム及び記録媒体
JP2009069951A (ja) * 2007-09-11 2009-04-02 Hitachi Computer Peripherals Co Ltd 文字認識装置及び文字認識装置における文字認識方法
JP2011018311A (ja) * 2009-07-07 2011-01-27 Sharp Corp 画像検索装置、画像検索プログラムおよび記録媒体
JP2018112839A (ja) * 2017-01-10 2018-07-19 富士通株式会社 画像処理プログラム、画像認識プログラム、画像処理装置、画像認識装置、画像認識方法、及び画像処理方法
WO2018131451A1 (ja) * 2017-01-10 2018-07-19 富士通株式会社 画像処理プログラム、画像認識プログラム、画像処理装置、画像認識装置、画像認識方法、及び画像処理方法
US10915799B2 (en) 2017-01-10 2021-02-09 Fujitsu Limited Image processing apparatus and image recognition apparatus
US11568276B1 (en) 2021-08-25 2023-01-31 International Business Machines Corporation Adaptive document understanding

Also Published As

Publication number Publication date
JP4176175B2 (ja) 2008-11-05

Similar Documents

Publication Publication Date Title
KR100248917B1 (ko) 패턴인식장치및방법
US6917706B2 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US8442319B2 (en) System and method for classifying connected groups of foreground pixels in scanned document images according to the type of marking
US6970601B1 (en) Form search apparatus and method
CN113158808B (zh) 中文古籍字符识别、组段与版面重建方法、介质和设备
Lacerda et al. Segmentation of connected handwritten digits using Self-Organizing Maps
JP2007058882A (ja) パターン認識装置
JPH08305796A (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
JP3411472B2 (ja) パターン抽出装置
JPH08167000A (ja) 文字認識装置および方法
CN109389050A (zh) 一种流程图连接关系识别方法
CN115311666A (zh) 图文识别方法、装置、计算机设备及存储介质
JP4176175B2 (ja) パターン認識装置
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP2007026470A (ja) パターン認識装置
JP4117648B2 (ja) 帳票、帳票処理方法、帳票処理プログラム、帳票処理プログラムを記録した記録媒体及び帳票処理装置
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
JP2002312719A (ja) 文字切り出し装置及び文字切り出し方法並びに文字切り出し用プログラム
Sahle Segmentation of Real Life Amharic Documents for Improving Recognition
JP2000207491A (ja) 文字列読取方法及び装置
Bobier et al. Evaluation of binarization algorithms
JPH1040334A (ja) パターン抽出装置及びパターン領域の切り出し方法
JP2001060249A (ja) 帳票識別用文字列照合方式
JPH02125393A (ja) 辞書および文字認識方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060831

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061101

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070207

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070302

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20070323

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080820

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110829

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120829

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120829

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130829

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees