JPH10154204A

JPH10154204A - パターン認識装置及びパターン認識方法

Info

Publication number: JPH10154204A
Application number: JP9261291A
Authority: JP
Inventors: Satoshi Naoi; 聡直井; Misako Suwa; 美佐子諏訪; Yoshinobu Hotsuta; 悦伸堀田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1996-09-27
Filing date: 1997-09-26
Publication date: 1998-06-09
Anticipated expiration: 2017-09-26
Also published as: JP4176175B2

Abstract

(57)【要約】【課題】文字の書かれている環境に応じた適切な認識
処理を精度良く行う。【解決手段】環境認識手段１は、第１の状態〜第Ｎの
状態を入力画像から抽出し、第１〜第Ｎのパターン認識
手段２、４、６の中から、第１の状態〜第Ｎの状態に対
応するものを呼び出して認識処理を実行させる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明はパターン認識装置及
びパターン認識方法に係わり、特に手書き用文字認識装
置のみならず、印刷文字認識装置や図面認識装置におけ
る文字、図形及び記号の認識を入力画像の様々な状態に
応じて正確に行うようにするものである。

【０００２】

【従来の技術】ＯＣＲ（Optical Character Reader) 等
の手書き文字認識装置は、会計帳票などに書かれている
文字を自動的に読み取って、文字を自動入力することに
より、会計帳票などから人手で文字を見つけ出し、文字
をキー入力するような手間を省くようにしていた。

【０００３】図７９は、従来の手書き文字認識装置の構
成を示すブロック図である。図７９において、帳票／文
書３１１をスキャナで読み込み、その帳票／文書３１１
の多値画像を得る。

【０００４】次に、前処理部３１２において、その多値
画像の２値化、雑音除去、帳票／文書３１１の傾き補正
を行う。次に、文字切り出し部３１３において、予め定
義されている罫線情報や文字の位置情報を用いることに
より、文字を１文字づつ切り出す。

【０００５】次に、文字認識部３１４において、それぞ
れの文字ごとに文字認識を行い、文字コードを出力す
る。ここで、この文字認識は、文字切り出し部３１３に
より切り出された未知の文字パターンの特徴のそれぞれ
に対し、認識辞書３１５に予め登録されている個々の文
字カテゴリの特徴と１つずつ照合することにより行われ
る。

【０００６】例えば、２次元の文字パターンを文字の特
徴を表す特徴空間上の特徴ベクトルに変換し、未知の文
字パターンと認識辞書３１５に予め登録されている文字
カテゴリとの類似度として、特徴空間上の特徴ベクトル
間の距離を算出する。そして、未知の文字パターンの特
徴ベクトルと認識辞書３１５に予め登録されている文字
カテゴリの特徴ベクトルとの間の距離が最も近いもの
を、未知の文字パターンに対応する文字カテゴリとして
認識する。

【０００７】ここで、消し線、雑音、模様などの非文字
を文字と誤って認識し、文字の文字コードが非文字に対
して出力されることを防止するため、２つの特徴ベクト
ル間の距離に対してしきい値を設定しておく。そして、
２つの特徴ベクトル間の距離がこのしきい値以上の場
合、未知の文字パターンが認識辞書３１５に予め登録さ
れている文字カテゴリのどれに対応しているのかかわか
らないとするか、非文字であると判断してリジェクトコ
ードを出力するようにしていた。

【０００８】また、認識辞書３１５として、高品質文
字、かすれ文字、つぶれ文字のそれぞれの文字カテゴリ
の特徴を登録したものを用意しておき、高品質文字に対
しては、高品質文字についての認識辞書３１５を使用
し、かすれ文字に対しては、かすれ文字についての認識
辞書３１５を使用し、つぶれ文字に対しては、つぶれ文
字についての認識辞書３１５を使用することにより、帳
票／文書３１１の文字の品質の違いに対応できるように
していた。

【０００９】

【発明が解決しようとする課題】しかしながら、従来の
手書き文字認識装置は、文字がかすれている場合であっ
ても、文字がつぶれている場合であっても、文字が高品
質文字であっても、切り出した１文字に対して、同一の
認識辞書３１５を用いて画一的に処理を行っていた。

【００１０】このため、認識辞書３１５に登録してある
かすれ文字についての情報が、高品質文字の認識処理を
行う際に悪影響を及ぼし、かすれ文字が認識辞書３１５
に登録してあるために、高品質文字が読めなくなってし
まうという問題があった。

【００１１】また、かすれやつぶれだけでなく、文字が
罫線に接触しているなどの文字が書かれている環境は様
々なものがあり、画一的な認識辞書３１５で様々な環境
に対応しようとした場合、互いに相互作用を及ぼし合
い、認識処理の精度の大幅な改善は望めないという問題
があった。

【００１２】そこで、本発明の目的は、文字の書かれて
いる環境に応じた適切な認識処理を精度よく行うことが
可能なパターン認識装置及びパターン認識方法を提供す
ることである。

【００１３】

【課題を解決するための手段】上述した課題を解決する
ために、本発明によれば、処理対象の状態を入力画像か
ら抽出し、その状態に適した認識処理を処理対象ごとに
選択することにより、パターン認識を行うようにしてい
る。

【００１４】このことにより、様々な状態を有する入力
画像に対し、それぞれの状態に適したパターン認識処理
を行うことができ、認識処理を精度よく行うことが可能
となる。

【００１５】また、本発明の一態様によれば、処理対象
の状態を入力画像から抽出し、第１の状態を有する処理
対象に対しては、第１の状態専用のパターン認識処理を
行い、第２の状態を有する処理対象に対しては、第２の
状態専用のパターン認識処理を行うようにしている。

【００１６】このことにより、第１の状態を有する処理
対象の認識処理と第２の状態を有する処理対象の認識処
理とが互いに相互作用を及ぼすことがなくなり、認識処
理を精度よく行うことが可能となる。

【００１７】また、本発明の一態様によれば、様々な状
態を有する入力画像に対し、認識辞書を使い分けるよう
にしている。このことにより、例えば、かすれ文字やつ
ぶれ文字や高品質文字が入力画像の中に混在している場
合においても、かすれ文字に対してはかすれ文字に適し
た認識辞書を使用し、つぶれ文字に対してはつぶれ文字
に適した認識辞書を使用し、高品質文字に対しては高品
質文字に適した認識辞書を使用して認識処理を行うこと
ができ、認識処理を精度よく行うことが可能となる。

【００１８】また、本発明の一態様によれば、様々な状
態を有する入力画像に対し、識別関数を使い分けるよう
にしている。このことにより、例えば、１文字枠に書か
れている文字についてはシティブロック距離を用いて文
字認識を行い、フリーピッチ枠に書かれている文字に対
しては判別関数を用いて文字の切り出し信頼度を考慮し
ながら文字認識を行うことができ、認識処理を精度よく
行うことが可能となる。

【００１９】また、本発明の一態様によれば、様々な状
態を有する入力画像に対し、知識を使い分けるようにし
ている。このことにより、例えば、未知文字の変形が大
きくて、認識辞書に格納されている文字カテゴリとの対
応関係が取れない場合、文字セグメントに文字を分割す
ることにより、未知文字と文字カテゴリとの対応関係を
とるようにしたり、文字列から文字を切り出す場合、学
習パターンに基づいて生成した判別関数を用いて切り出
し信頼度を算出したり、枠接触文字についての文字認識
を行う場合、学習パターンにより得られた信頼度を用い
て、枠接触文字についての認識信頼度を評価したりする
ことができ、認識処理を精度よく行うことが可能とな
る。

【００２０】また、本発明の一態様によれば、同一の処
理対象に対して複数の認識処理が呼ばれた場合、認識処
理による信頼度が所定の値以上となるまで、優先順位に
従って認識処理を行わせるようにしている。

【００２１】このことにより、認識処理の信頼度を上げ
ることができ、認識処理の精度を向上させることができ
る。また、本発明の一態様によれば、入力画像から非文
字を抽出し、この非文字についての認識処理を文字につ
いての認識処理と別々に行うようにしている。

【００２２】このことにより、文字が非文字とみなされ
たり、非文字が文字とみなされたりして認識処理が行わ
れることが減少し、認識処理を精度よく行うことが可能
となる。

【００２３】

【発明の実施の形態】以下、本発明の一実施例によるパ
ターン認識装置について図面を参照しながら説明する。

【００２４】図１は、本発明の一実施例によるパターン
認識装置の機能的な構成を示すブロック図である。図１
において、環境認識手段１は、第１〜第Ｎの状態を入力
画像から抽出する。ここで、入力画像から抽出される状
態とは、例えば、１文字枠やフリーピッチ枠や表などの
いずれの形式で文字が書かれているかの状態、文字と枠
との接触状態、文字のかすれ状態、文字のつぶれ状態、
文字が消し線で消されている状態などである。

【００２５】第１のパターン認識手段２は、第１の状態
を有する処理対象についてのパターン認識処理を専用に
行い、第２のパターン認識手段４は、第２の状態を有す
る処理対象についてのパターン認識処理を専用に行い、
第Ｎのパターン認識手段６は、第Ｎの状態を有する処理
対象についてのパターン認識処理を専用に行う。

【００２６】ここで、第１〜第Ｎのパターン認識手段
２、４、６は、それぞれの認識結果についての信頼度を
算出する信頼度算出手段３、５、７を備え、第１〜第Ｎ
のパターン認識手段２、４、６による認識結果について
の信頼度を算出する。

【００２７】そして、環境認識手段１は、第１〜第Ｎの
パターン認識手段２、４、６の中から、第１〜第Ｎの状
態に対応するものを呼び出して認識処理を実行させる。
例えば、環境認識手段１が、入力画像から第１の状態を
抽出した場合、その第１の状態の処理対象に対して、第
１のパターン認識手段２によるパターン認識処理を呼び
出し、入力画像から第２の状態を抽出した場合、その第
２の状態の処理対象に対して、第２のパターン認識手段
４によるパターン認識処理を呼び出し、入力画像から第
Ｎの状態を抽出した場合、その第Ｎの状態の処理対象に
対して、第Ｎのパターン認識手段６によるパターン認識
処理を呼び出す。

【００２８】また、環境認識手段１が、同一の処理対象
に対して、例えば、第１の状態及び第２の状態を抽出し
た場合、第１のパターン認識手段２によるパターン認識
処理及び第２のパターン認識手段４によるパターン認識
処理を、その同一の処理対象に対して呼び出す。

【００２９】例えば、第１の状態が一文字枠に文字が書
かれている状態であるとし、第２の状態がフリーピッチ
枠に文字列が書かれている状態であるとし、第３の状態
が文字と枠とが接触している状態であるとし、第４の状
態が文字のかすれ状態であるとし、第５の状態が文字の
つぶれ状態であるとし、第６の状態が文字が消し線で訂
正された状態であるとすると、第１のパターン認識手段
２は一文字枠に書かれている文字についての認識処理を
行い、第２のパターン認識手段４はフリーピッチ枠に書
かれている文字列についての認識処理を行い、第３のパ
ターン認識手段は枠接触文字についての認識処理を行
い、第４のパターン認識手段はかすれ文字についての認
識処理を行い、第５のパターン認識手段はつぶれ文字に
ついての認識処理を行い、第６のパターン認識手段は訂
正文字についての認識処理を行う。

【００３０】そして、環境認識手段１が、入力画像から
一文字枠を抽出した場合、その一文字枠に書かれている
文字に対し、第１のパターン認識手段２により認識処理
を実行させ、環境認識手段１が、入力画像からフリーピ
ッチ枠を抽出した場合、そのフリーピッチ枠に書かれて
いる文字に対し、第２のパターン認識手段４により認識
処理を実行させ、環境認識手段１が、入力画像から枠接
触文字を抽出した場合、その枠接触文字に対し、第３の
パターン認識手段により認識処理を実行させ、環境認識
手段１が、入力画像からかすれ文字を抽出した場合、そ
のかすれ文字に対し、第４のパターン認識手段により認
識処理を実行させ、環境認識手段１が、入力画像からつ
ぶれ文字を抽出した場合、そのつぶれ文字に対し、第５
のパターン認識手段により認識処理を実行させ、環境認
識手段１が、入力画像から訂正文字の候補を抽出した場
合、その訂正文字の候補に対し、第６のパターン認識手
段により認識処理を実行させる。

【００３１】また、例えば、環境認識手段１が、入力画
像からフリーピッチ枠に接触している枠接触文字を抽出
した場合、そのフリーピッチ枠に接触している枠接触文
字に対し、パターン認識手段２及びパターン認識手段３
により認識処理を実行させ、入力画像からフリーピッチ
枠に接触している消し線付きの枠接触文字を抽出した場
合、そのフリーピッチ枠に接触している消し線付きの枠
接触文字に対し、第２のパターン認識手段４、第３のパ
ターン認識手段及び第６のパターン認識手段により認識
処理を実行させる。

【００３２】ここで、同一の処理対象についての複数の
状態が入力画像から抽出され、それに対応して複数のパ
ターン認識手段２、４、６が呼び出された場合、複数の
パターン認識手段２、４、６をどの順序で呼び出すかを
格納した処理順序テーブルに基づいて、複数のパターン
認識手段２、４、６による認識処理の順序を決定する。
そして、パターン認識手段２、４、６による認識処理に
より、所定のしきい値以上の信頼度が信頼度算出手段
３、５、７により得られるまで、複数のパターン認識手
段２、４、６による認識処理を呼び出し順序に従って順
次に実行する。

【００３３】例えば、環境認識手段１が、入力画像から
フリーピッチ枠に接触している枠接触文字を抽出した場
合、そのフリーピッチ枠に接触している枠接触文字に対
し、パターン認識手段３による認識処理を実行してから
パターン認識手段２による認識処理を実行し、入力画像
からフリーピッチ枠に接触している消し線付きの枠接触
文字を抽出した場合、そのフリーピッチ枠に接触してい
る消し線付きの枠接触文字に対し、第３のパターン認識
手段による認識処理を実行してから第６のパターン認識
手段による認識処理を実行し、さらに、第２のパターン
認識手段４による認識処理を実行させる。

【００３４】図２は、図１の環境認識手段１の一実施例
の構成を示すブロック図である。図２において、状態抽
出手段１ａは、第１〜第Ｎの状態を入力画像から抽出す
る。

【００３５】認識処理制御手段１ｂは、状態抽出手段１
ａにより抽出された第１〜第Ｎの状態に対応させて、図
１の第１〜第Ｎのパターン認識手段２、４、６の中のい
ずれか１つ又は複数を呼び出して認識処理を行わせる。

【００３６】処理順序テーブル１ｆは、第１〜第Ｎのパ
ターン認識手段２、４、６の中から複数の認識手段が呼
び出された際に、これらの第１〜第Ｎのパターン認識手
段２、４、６をどのような順序で実行するかを示す処理
順序を格納する。

【００３７】処理順序制御ルール格納手段１ｄは、状態
抽出手段１ａにより抽出された第１〜第Ｎの状態に基づ
いて、第１〜第Ｎのパターン認識手段２、４、６の中か
らどの認識手段を呼び出すかを示す呼び出し手順を格納
する。

【００３８】中間処理結果テーブル作成手段１ｃは、処
理順序制御ルール格納手段１ｄに格納されている呼び出
し手順及び処理順序テーブル１ｆに格納されている処理
順序に基づいて、第１〜第Ｎのパターン認識手段２、
４、６の実行順序を示す中間処理結果テーブルを作成す
る。

【００３９】処理実行ルール格納手段１ｅは、中間処理
結果テーブルに記入された認識処理の実行結果に基づい
て、次の処理の実行を指示する手順を格納する。図３
は、本発明の一実施例によるパターン認識装置の具体的
な構成を示すブロック図である。

【００４０】図３において、環境認識系１１は、入力画
像の状態を抽出し、この抽出された状態に基づいて、文
字認識部１２の基本文字認識部１７、文字列認識部１
５、接触文字認識部１３、かすれ文字認識部１９、つぶ
れ文字認識部２１又は非文字認識部２５の消し線認識部
２６及び雑音認識部２８のいずれか１つ又は複数を呼び
出す。ここで、入力画像の状態を抽出するために、入力
画像のレイアウト解析、品質解析及び訂正解析を行う。

【００４１】文字認識部１２は、入力画像の状態ごとに
文字認識処理を行うもので、文字についての文字認識を
行う基本文字認識部１７、文字列についての文字認識Ｂ
及び文字切り出しＢを行う文字列認識部１５、枠に接触
した文字についての文字認識Ａ及び文字切り出しＡを行
う接触文字認識部１３、かすれ文字についての文字認識
Ｃ及び文字切り出しＣを行うかすれ文字認識部１９、つ
ぶれ文字についての文字認識Ｄ及び文字切り出しＤを行
うつぶれ文字認識部２１及びくせ字についての文字認識
Ｅ及び文字切り出しＥを行うくせ字認識部２３を備えて
いる。

【００４２】また、基本文字認識部１７、文字列認識部
１５、接触文字認識部１３、かすれ文字認識部１９、つ
ぶれ文字認識部２１及びくせ字認識部２３はそれぞれ、
文字認識の手法についての知識を格納した知識テーブル
１４、１６、１８、２０、２２、２４を備えている。知
識テーブル１４には、例えば、枠接触状態と認識の信頼
度に関する知識や重複の部分パターン法に関する知識が
格納され、知識テーブル１６には、例えば、切り出しの
信頼度に関する知識や切り出しと認識の融合法に関する
知識が格納され、知識テーブル１８には、例えば、詳細
識別法に関する知識が格納されている。

【００４３】非文字認識部２５は、入力画像の状態ごと
に非文字認識処理を行うもので、消し線についての非文
字認識Ｆ及び非文字切り出しＦを行う消し線認識部２
６、雑音についての非文字認識Ｇ及び非文字切り出しＧ
を行う雑音認識部２８を備えている。

【００４４】また、消し線認識部２６及び雑音認識部２
８はそれぞれ、非文字認識の手法についての知識を格納
した知識テーブル２７、２９を備えている。図４は、環
境認識系１１の全体的な処理の一例を示すフローチャー
トである。

【００４５】図４において、まず、ステップＳ１に示す
ように、入力画像の前処理を行う。この入力画像の前処
理は、ファクシミリやスキャナなどにより２値化された
入力画像に対しラベリングを行い、入力画像とラベル画
像とを格納するものである。なお、入力画像とラベル画
像とは、これ以降の処理でいつでもアクセスできるよう
にしておく。

【００４６】図５は、図４の入力画像の前処理を示すフ
ローチャートである。図５において、ステップＳ１１に
示すように、２値化された入力画像に対しラベリングを
行うことにより、連結パターンを抽出してラベル付けを
行い、抽出したラベル画像と入力画像とを格納する。こ
の際、ラベル付けされた連結パターンを外接矩形の加減
算で圧縮表現することにより、メモリ容量を削減する。
このラベル付けされた連結パターンの圧縮表現によれ
ば、例えば、４００ｄｐｉの高解像度のスキャナで入力
したＡ４サイズ（約３０００×４０００）の文書／帳票
に対し、、数百キロバイト以内で表すことができる。

【００４７】次に、図４のステップＳ２に示すように、
レイアウト解析を行う。このレイアウト解析は、ラベル
付けされた連結パターンのサイズや配置状態などに基づ
いて、テキスト認識、罫線抽出、枠抽出、枠の種類及び
表の判別、枠接触文字の有無の判断及び図認識を行う。

【００４８】図６は、図４のレイアウト解析を示すフロ
ーチャートである。図６において、まず、ステップＳ２
１に示すように、テキスト認識を行う。このテキスト認
識は、ラベル付けされた連結パターンのサイズを解析
し、連結パターンのサイズが比較的小さいものを抽出
し、これを文字の候補とみなす。そして、隣接する文字
の候補を統合することにより、テキストを抽出する。

【００４９】次に、ステップＳ２２に示すように、罫線
抽出を行う。この罫線抽出は、ステップＳ２１でテキス
トと認識されなかった連結パターンを対象として、縦又
は横方向のヒストグラム値が大きいものについての探索
を行うことにより、罫線を抽出する。

【００５０】次に、ステップＳ２３に示すように、枠抽
出を行う。この枠抽出は、ステップＳ２２で抽出された
罫線から４辺に相当する罫線を見つけて枠を抽出する。
次に、ステップＳ２４に示すように、枠の種類／表判別
を行う。この枠の種類／表判別は、ステップＳ２３で抽
出された枠に対し、その枠の種類を判別して枠の種類の
属性を付与する。枠の種類の属性としては、一文字枠、
ブロック枠、フリーピッチ枠、表などがある。

【００５１】次に、ステップＳ２５に示すように、枠接
触文字の有無の判断を行う。この枠接触文字の有無の判
断は、枠内を枠線に沿って探索した際に、交差するパタ
ーンがあるかどうかを検出し、交差するパターンがある
場合は、文字が枠に接触しているものと判断する。ここ
で、交差するパターンが存在していても、注目している
枠の隣の枠から、文字がはみ出している場合があるの
で、交差するパターンが隣の枠からはみ出しているもの
については、注目している枠に対し、接触文字でないと
する。

【００５２】次に、ステップＳ２６に示すように、図認
識を行う。この図認識は、テキストや枠や表などの属性
が付与されなかったサイズが比較的大きな連結パターン
に対して、図の属性を付与する。

【００５３】次に、図４のステップＳ３に示すように、
品質解析を行う。この品質解析は、入力画像にかすれや
つぶれがあるかどうかを検出するもので、大局的品質解
析と局所的品質解析とがある。

【００５４】この品質解析では、所定の領域について、
（面積、縦／横の長さがそれぞれ所定のしきい値以下の
連結領域の数）／（前記所定の領域の全ての連結領域の
数）の値が、所定値よりも大きい時にかすれと判断す
る。

【００５５】また、罫線抽出の際にかすれた罫線を部分
的に統合した情報を用いることにより、所定の領域につ
いて、（かすれた罫線を補完した際の補完された部分の
長さの合計）／（各罫線の長さの合計）の値が、所定値
よりも大きい時にかすれと判断する。

【００５６】さらに、所定の領域について、（黒画素密
度が所定のしきい値より大きい連結領域の数）／（前記
所定の領域の全ての連結領域の数）の値が、所定値より
も大きい時につぶれと判断する。

【００５７】図７は、図４の品質解析を示すフローチャ
ートである。図７において、まず、ステップＳ３１に示
すように、大局的品質解析を行う。この大局的品質解析
は、文書／帳票全体に対して品質解析を行うもので、入
力画像を２値化する際のしきい値が適切であったかどう
か、ファクシミリで送られてきた文書／帳票に対してノ
イズが全体にのったため品質が不正常になっていないか
どうか、かすれやつぶれが発生していないかを解析す
る。

【００５８】次に、ステップＳ３２に示すように、局所
的品質解析を行う。この局所的品質解析は、レイアウト
解析により一文字枠やテキストやフリーピッチ枠や表な
どの属性が付与された領域ごとにかすれやつぶれが発
生していないかを調べたり、ノイズが発生していないか
を調べたりして品質解析を行うものである。

【００５９】次に、図４のステップＳ４に示すように、
訂正解析を行う。この訂正解析は、入力画像から消し線
を抽出して、消し線で訂正された文字については、文字
の認識処理を省略できるようにするものである。

【００６０】図８は、図４の訂正解析を示すフローチャ
ートである。図８において、まず、ステップＳ４１に示
すように、訂正特徴抽出を行う。この訂正特徴抽出は、
訂正文字に有効な特徴を抽出するもので、訂正文字に
は、つぶれた文字、２重線で消した文字、斜線で消した
文字及びばつで消した文字の大きく分けて４種類あり、
各訂正文字の特徴を黒画素線密度、線密度、オイラー
数、ヒストグラム値などを算出して抽出する。

【００６１】次に、ステップＳ４２に示すように、訂正
文字候補抽出を行う。この訂正文字候補抽出は、訂正文
字の特徴を表す特徴空間で、訂正文字と訂正されていな
い通常文字との分布の違いから訂正文字の候補を抽出す
る。

【００６２】次に、図４のステップＳ５に示すように、
文字認識／非文字認識の制御を行う。この文字認識／非
文字認識の制御は、図４のステップＳ２〜Ｓ４で抽出さ
れた入力画像の状態に基づいて、文字認識部１２の基本
文字認識部１７、文字列認識部１５、接触文字認識部１
３、かすれ文字認識部１９、つぶれ文字認識部２１又は
非文字認識部２５の消し線認識部２６及び雑音認識部２
８のいずれを呼び出すかを決定するもので、中間処理結
果テーブルの読み込み／処理順序制御ルールの実行、終
了判定や処理実行ルールによる処理の実行を行う。

【００６３】ここで、処理順序制御ルールは、環境認識
系１１が抽出した状態に基づいて、文字認識部１２の基
本文字認識部１７、文字列認識部１５、接触文字認識部
１３、かすれ文字認識部１９、つぶれ文字認識部２１又
は非文字認識部２５の消し線認識部２６及び雑音認識部
２８のいずれを呼び出すかの手順を示すものである。

【００６４】また、処理実行ルールは、処理順序制御ル
ールにより呼ばれた認識処理の結果に基づいて、次にど
のような処理を行うのかの手順を示すものである。ま
た、中間処理結果テーブルは、レイアウト解析により一
文字枠やテキストやフリーピッチ枠や表などの属性が付
与された領域ごとに、図４のステップＳ２〜Ｓ４で抽出
された入力画像の状態を記入するとともに、入力処理順
序制御ルールにより呼ばれた処理を処理順序テーブルに
格納されている処理順序で記入するものである。

【００６５】例えば、環境認識系１１が、文字を抽出し
た場合、この文字に対しては、基本文字認識部１７を呼
び出して認識処理を実行し、環境認識系１１が、図６の
ステップＳ２１でテキストを抽出した場合、このテキス
トに対しては、文字列認識部１５を呼び出して認識処理
を実行し、環境認識系１１が、図６のステップＳ２５で
枠接触文字を抽出した場合、この枠接触文字に対して
は、接触文字認識部１３を呼び出して認識処理を実行
し、環境認識系１１が、図７のステップＳ３２で、（面
積、縦／横の長さがそれぞれ所定のしきい値以下の連結
領域の数）／（前記所定の領域の全ての連結領域の数）
の値が所定値よりも大きいと判断した場合、この領域の
文字に対しては、かすれ文字認識部１９を呼び出して認
識処理を実行し、環境認識系１１が、図７のステップＳ
３２で、（黒画素密度が所定のしきい値より大きい連結
領域の数）／（前記所定の領域の全ての連結領域の数）
の値が所定値よりも大きいと判断した場合、この領域の
文字に対しては、つぶれ文字認識部２１を呼び出して認
識処理を実行し、環境認識系１１が、図８のステップＳ
４２で、訂正文字候補を抽出した場合、この訂正文字候
補に対しては、消し線認識部２６を呼び出して認識処理
を実行し、環境認識系１１が、図７のステップＳ３２で
雑音を検出した場合、この雑音に対しては、雑音認識部
２８を呼び出して認識処理を実行する。

【００６６】図９は、図４の文字認識／非文字認識の制
御を示すフローチャートである。図９において、まず、
ステップ５１に示すように、中間処理結果テーブルの読
み込み／処理順序制御ルールの実行を行う。

【００６７】次に、ステップ５２に示すように、終了判
定を行う。この終了判定は、処理順序制御ルールに基づ
いて、中間処理結果テーブルの全ての処理が完了して中
間処理結果テーブルの全ての処理指示欄に終了が記入さ
れた場合、終了と判定する。終了判定で未終了と判定さ
れた場合、ステップ５３に進んで、処理実行ルールによ
る処理を実行してステップ５１に戻り、ステップ５２の
終了判定で終了と判定されるまで以上の処理を繰り返
す。

【００６８】図１０は、本発明の一実施例によるパター
ン認識装置のシステム構成を示すブロック図である。図
１０において、画像格納部４１は帳票画像を格納し、処
理条件格納部４２は帳票のレイアウト構造や読み取り文
字情報、例えば、枠の位置、種類、サイズ、文字種、文
字数などの定義体を格納し、ラベル画像格納部４３はラ
ベル付けされたラベル画像を圧縮表現により格納する。

【００６９】環境認識系３０はレイアウト解析部３１及
び訂正解析部３２を備え、環境認識系３８はくせ字解析
部３９及び終了判定処理部４０を備え、文字認識系／非
文字認識系３３は基本文字認識部３４、黒枠接触文字認
識部３５、フリーピッチ文字列認識部３６及び消し線認
識部３７を備えている。

【００７０】レイアウト解析部３１は、ラベル画像格納
部４３に格納されているラベル画像について、処理条件
格納部４２に格納されている定義体を参照しながら、罫
線抽出、枠抽出及び黒枠接触文字抽出を行う。ここで、
枠の位置やサイズなどのフォーマット情報及び傾きに関
する情報を予め帳票データとして格納しておき、この帳
票データに基づいて、罫線抽出や枠抽出を行う方法は、
例えば、特開昭６２−２１２８８号公報や特開平３−１
２６１８６号公報に記載されている。

【００７１】なお、例えば、特開平６−３０９４９８号
公報や特開平７−２８９３７号公報に記載されているよ
うに、枠の位置やサイズなどのフォーマット情報の入力
を必要とせずに、罫線抽出や枠抽出を行うようにしても
よい。

【００７２】訂正解析部３２は消し線候補の抽出を行
い、くせ字解析部３９は個人筆記特性によるくせ字の解
析を行い、終了判定処理部４０は文字認識の終了判定を
行い、終了判定で終了と判定された場合、文字認識結果
の出力を行う。

【００７３】基本文字認識部３４は、１文字ごとに切り
出された文字の認識を行い、黒枠接触文字認識部３５
は、黒枠接触文字から枠を除去し、その枠を除去するこ
とによりかすれた文字の補完を行ってから文字の認識を
行い、フリーピッチ文字列認識部３６は、文字列から文
字を切り出す際の切り出し信頼度を考慮しながら文字列
についての文字認識を行い、消し線認識部３７は、訂正
文字の黒画素線密度、線密度、オイラー数、ヒストグラ
ムなどに基づいて、消し線の認識を行う。

【００７４】中間処理結果テーブル４４は、環境認識系
３０、３８により抽出された状態に基づいて、文字認識
系／非文字認識系３３のいずれの処理を実行するかを示
す処理順序やその処理結果を格納する。

【００７５】図１１は、図１〜３のパターン認識装置が
適用される文字認識システムの具体的な構成を示すブロ
ック図である。図１１において、５１は全体的な処理を
行う中央演算処理ユニット（ＣＰＵ）、５２はＣＰＵ５
１で実行されるプログラムを格納するプログラムメモ
リ、５３は画像データをビットマップ形式で格納する画
像メモリ、５４は画像処理に使用するワークメモリ、５
５は画像を光学的に読み取るスキャナ、５６はスキャナ
５５により読み取られた情報を一時的に格納するメモ
リ、５７は各文字画像の特徴を格納した辞書ファイル、
５８は認識結果を表示するディスプレイ、５９は認識結
果を印刷するプリンタ、６０はディスプレイ５８及びプ
リンタ５９の入出力インターフェイス、６１はＣＰＵ５
１、プログラムメモリ５２、画像メモリ５３、ワークメ
モリ５４、メモリ５６、辞書ファイル５７、入出力イン
ターフェイス６０及びドライバ６４を接続しているバ
ス、６２は通信ネットワーク６３を介してデータやプロ
グラムの送受信を行う通信インターフェイス、６４はド
ライバ、６５はハードディスク、６６はＩＣメモリカー
ド、６７は磁気テープ、６８はフロッピーディスク、６
９はＣＤ−ＲＯＭやＤＶＤ−ＲＯＭなどの光ディスクで
ある。

【００７６】この文字認識システムは、スキャナ５５に
より読み取った画像データをメモリ５６に一時的に格納
し、その画像データをビットマップ形式で画像メモリ５
３に展開する。そして、画像メモリ５３からワークメモ
リ５４にコピーされた２値画像データに対してパターン
抽出処理を行う。その結果に基づいて、スキャナ５５に
より読み取った画像データから文字画像の切り出しを行
い、切り出された文字画像の特徴と辞書ファイル５７に
格納された特徴データとの比較を行い、文字の認識を行
う。その後、その認識結果を、ディスプレイ５８又はプ
リンタ５９に出力する。

【００７７】この文字認識システムにおいて、図１〜３
のパターン抽出装置は、プログラムメモリ５２に格納さ
れたプログラムに従って処理を行うＣＰＵ５１の機能と
して実現される。ここで、パターン抽出処理を行うプロ
グラムは、プログラムメモリ５２のＲＯＭに予め格納し
ておくことが可能である。また、パターン抽出処理を行
うプログラムを、ハードディスク６５、ＩＣメモリカー
ド６６、磁気テープ６７、フロッピーディスク６８また
は光ディスク６９などの記憶媒体からプログラムメモリ
５２のＲＡＭにロードした後、このプログラムをＣＰＵ
５１で実行させるようにしてもよい。

【００７８】さらに、パターン抽出処理を行うプログラ
ムを、通信インターフェイス６２を介して通信ネットワ
ーク６３から取り出すこともできる。通信インターフェ
イス６２と接続される通信ネットワーク６３として、例
えば、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒ
ｋ）、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒ
ｋ）、インターネット、アナログ電話網、デジタル電話
網（ＩＳＤＮ：ＩｎｔｅｇｒａｌＳｅｒｖｉｃｅＤ
ｉｇｉｔａｌＮｅｔｗｏｒｋ）、ＰＨＳ（パーソナル
ハンディシステム）や衛星通信などの無線通信網などを
用いることが可能である。

【００７９】以下、図３の環境認識系１１、文字認識部
１２及び非文字認識部２５の構成をより具体的に説明す
る。図１２は、図５のステップＳ１１のラベリング処理
を説明する図である。

【００８０】図１２において、“０”と“１”とからな
る２値画像がラベリング処理部７０に入力されると、ラ
ベリング処理部７０は、連結した画素で構成される連結
パターンを入力された２値画像から抽出し、各連結パタ
ーンごとにラベルを付したラベル画像を生成して、ラベ
ル画像格納部７１に格納する。例えば、“０”と“１”
とからなる２値画像７２が入力された場合、各連結パタ
ーンごとにラベル“１”、“２”、“３”を付してラベ
ル画像７３を生成する。

【００８１】ここで、例えば、２５５個の連結パターン
が１画像内に存在する場合、２５５個のラベルが必要と
なるため、１画素当たり８ビットを必要とし、ラベル画
像格納部７１に必要な記憶容量は、１画像全体の画素数
の８倍となり、ラベル画像を格納するために多くの記憶
容量が必要となる。

【００８２】図１３は、図１２のラベル画像７３を圧縮
表現することにより、ラベル画像格納部７１に必要な記
憶容量を削減する方法を説明する図である。図１３にお
いて、例えば、図１３（ａ）の連結パターンＡ₁及び連
結パターンＡ₂のそれぞれに対し、図１３（ｂ）に示す
ように、ラベル“１”及びラベル“２”が付され、図１
３（ｃ）に示すように、連結パターンＡ₁に外接する外
接矩形Ｂ₁及び連結パターンＡ₂に外接する外接矩形Ｂ
₂が生成されている。外接矩形Ｂ₁及び外接矩形Ｂ
₂は、図１３（ｄ）に示すように、その外接矩形Ｂ₁及
び外接矩形Ｂ₂の左上頂点の座標（ｘ₁、ｙ₁）及び右
下頂点の座標（ｘ₂、ｙ₂）によって特定することがで
きる。

【００８３】そして、連結パターンＡ₁に外接する外接
矩形Ｂ₁と連結パターンＡ₂に外接する外接矩形Ｂ₂と
が重なっているかどうかを判定し、連結パターンＡ₁に
外接する外接矩形Ｂ₁と連結パターンＡ₂に外接する外
接矩形Ｂ₂とが重なっていない場合、それぞれの外接矩
形Ｂ₁及び外接矩形Ｂ₂の左上頂点の座標（ｘ₁、
ｙ ₁）及び右下頂点の座標（ｘ₂、ｙ₂）を記憶する。

【００８４】一方、連結パターンＡ₁に外接する外接矩
形Ｂ₁と連結パターンＡ₂に外接する外接矩形Ｂ₂とが
重なっている場合、他の外接矩形と重ならないようによ
り小さな矩形領域に外接矩形Ｂ₁及び外接矩形Ｂ₂を細
分化し、細分化された矩形領域が元の外接矩形Ｂ₁及び
外接矩形Ｂ₂のどちらに属するかを判定し、連結パター
ンＡ₁及び連結パターンＡ₂を、細分化された矩形領域
の和や差などの演算で表現する。

【００８５】例えば、図１３（ｃ）において、連結パタ
ーンＡ₁は、連結パターンＡ₁に属する最大の矩形領域
（１−１）及び矩形領域（１−１）に含まれる矩形領域
（１−２）を用いて、Ａ₁＝（１−１）−（１−２）のように矩形領域（１−１）と矩形領域（１−２）との
差で表現することができる。

【００８６】また、連結パターンＡ₂は、連結パターン
Ａ₂に属する最大の矩形領域（２−１）、矩形領域（２
−１）に含まれる矩形領域（２−２）及び矩形領域（２
−２）に含まれる矩形領域（２−３）を用いて、Ａ₂＝（２−１）−（２−２）＋（２−３）のように矩形領域（２−１）と矩形領域（２−２）との
差及び矩形領域（２−３）との和で表現することができ
る。

【００８７】このように、連結パターンを連結する画素
の外接矩形で表現することにより、連結パターンを表現
する情報量を減らして、ラベル画像を格納するために必
要な記憶容量を削減することができる。

【００８８】なお、このラベル画像の圧縮表現の方法に
ついては、例えば、特開平８−５５２１９号公報に記載
されている。図１４は、図６のステップＳ２１のテキス
ト認識処理の一実施例を示すフローチャートである。

【００８９】図１４において、まず、ステップＳ６１に
示すように、スキャナで文書を読み込み、読み込んだ文
書の画像データをメモリに格納する。次に、ステップＳ
６２に示すように、ステップＳ６１で読み込んだ画像デ
ータのうち、横方向の特定の区間の短冊状の部分領域だ
けに注目し、その注目した部分領域の中でラベリングを
行い、黒連結画素の外接矩形を求める。

【００９０】例えば、処理対象として複数の文書Ａ、
Ｂ、Ｃがあり、図１５（ａ）の文書Ａの文字列８１の領
域が、図１５（ｄ）に示すように、区間Ａの範囲内にあ
り、図１５（ｂ）の文書Ｂの文字列８２の領域が、図１
５（ｄ）に示すように、区間Ａの範囲内にあり、図１５
（ｃ）の文書Ｃの文字列８３の領域が、図１５（ｄ）に
示すように、区間Ｂの範囲内にある場合、この区間Ａ，
Ｂの部分領域にのみ着目し、この部分領域の短冊状の中
でのみラベリング処理を行って、黒連結画素の外接矩形
を求める。

【００９１】次に、ステップＳ６３に示すように、ステ
ップＳ６２で求めた外接矩形の高さと、予め求めておい
た矩形の高さｙｌｅｎとの差がしきい値ｔｈｙ以内で、
かつステップＳ６２で求めた外接矩形の幅と、予め求め
ておいた矩形の幅ｘｌｅｎとの差がしきい値ｔｈｘ以内
であるような外接矩形だけを抽出する。そして、その外
接矩形が存在しているｙ方向（縦方向）の座標を求め、
メモリに記憶する。

【００９２】次に、ステップＳ６４に示すように、ステ
ップＳ６３で求めたｙ方向の座標を中心として、ステッ
プＳ６２で抽出した矩形を含む左右方向の長さが画像幅
に等しい横長部分領域に注目する。

【００９３】次に、ステップＳ６５に示すように、ステ
ップＳ６４で求めた横長部分領域に対してラベリングを
行うことにより、黒連結画素の外接矩形を求める。次
に、ステップＳ６６に示すように、ステップＳ６５で求
めた外接矩形の高さと、予め求めておいた矩形の高さｙ
ｌｅｎとの差がしきい値ｔｈｙ以内で、かつステップＳ
６５で求めた外接矩形の幅と、予め求めておいた矩形の
幅ｘｌｅｎとの差がしきい値ｔｈｘ以内であるような外
接矩形だけを抽出し、メモリに記憶する。

【００９４】次に、ステップＳ６７に示すように、ステ
ップＳ６６で抽出した矩形を対象にｘ座標でソートし、
抽出した矩形の中心線の間隔からピッチを計算し、この
計算により求めたピッチと予め求めておいたピッチｐｉ
ｔｃｈとの差がしきい値ｔｈｐｉｔｃｈ以内の矩形が横
方向に所定の数ｔｈ個以上並んでいるものをテキストと
して出力する。

【００９５】なお、このテキスト抽出方法については、
例えば、特開平８−１７１６０９号公報に記載されてい
る。次に、図６のステップＳ２２の罫線抽出処理の一実
施例についてより具体的に説明する。

【００９６】この罫線抽出処理は、ラベリングにより得
られた連結パターンを横方向及び縦方向に複数に分割
し、横方向及び縦方向に分割したそれぞれの範囲内で連
結パターンの隣接投影値を算出し、ある一定の長さの線
分又は直線の一部を矩形近似により検出することにより
罫線を抽出するものである。

【００９７】ここで、隣接投影とは、注目行又は注目列
の投影値に周囲の行又は列の投影値を足し合わせたもの
である。また、注目行又は注目列の投影値は、その行又
は列に存在する黒画素の総和をとったものである。

【００９８】図１６は、この隣接投影処理を説明する図
である。図１６において、ｉ行の投影値をｐ（ｉ）とす
ると、隣接投影値Ｐ（ｉ）は、（１）式により算出する
ことができる。

【００９９】Ｐ（ｉ）＝ｐ（ｉ−ｊ）＋・・・＋ｐ（ｉ）＋・・・＋ｐ（ｉ＋ｊ）（１）なお、図１６に示す例は、（１）式においてｊ＝１とお
いたものである。図１７は、部分パターンの投影値の例
を示す図である。

【０１００】図１７において、縦方向の長さがＬ_Y、横
方向の長さがＬ_Xの矩形８４の水平方向ｊの投影値Ｐｈ
（ｉ）をＨＰ（ｉ）、矩形８４の垂直方向ｉの投影値Ｐ
ｖ（ｊ）をＶＰ（ｊ）とすると、ＨＰ（１）＝ＨＰ
（ｎ）＝ｍ、ＨＰ（２）〜ＨＰ（ｎ−１）＝２、ＶＰ
（１）＝ＶＰ（ｍ）＝ｎ、ＶＰ（２）〜ＶＰ（ｍ−１）
＝２である。

【０１０１】このように、矩形８４を構成する直線が存
在している部分は、その投影値が大きくなるので、この
投影値を算出することにより、罫線を構成している直線
を抽出することができる。

【０１０２】例えば、隣接投影値と縦横それぞれの分割
長との比が所定の閾値以上である部分パターンを検出す
ることにより、罫線を構成している直線の候補を抽出す
ることができる。

【０１０３】図１８は、罫線抽出処理を示すフローチャ
ートである。図１８において、まず、ステップ６０１に
示すように、隣接投影値と縦横それぞれの分割長との比
が所定のしきい値以上であるかどうかを判定する。そし
て、隣接投影値と縦横それぞれの分割長との比が所定の
しきい値以上でないと判断された場合、ステップＳ６０
２に進み、罫線を構成している線分が存在しないものと
みなす。

【０１０４】一方、ステップＳ６０１で隣接投影値と縦
横それぞれの分割長との比が所定のしきい値以上である
と判断された場合、ステップＳ６０３に進み、罫線を構
成している線分が存在するものとみなす。

【０１０５】次に、ステップＳ６０４において、ステッ
プＳ６０３で線分とみなされたパターンが、その上下に
存在する線分と接しているかどうかを判断する。そし
て、上記パターンが上下に存在する線分と接していない
と判断された場合、ステップＳ６０５に進み、そのパタ
ーンを矩形線分とする。

【０１０６】一方、ステップＳ６０４において、ステッ
プＳ６０３で線分とみなされたパターンがその上下に存
在する線分と接していると判断された場合、ステップＳ
６０６に進み、上記パターンとその上下に存在する線分
とを統合する。そして、ステップＳ６０７で、ステップ
Ｓ６０６で統合した線分を矩形線分として検出する。例
えば、図１９（ａ）に示すような３つの矩形線分８５を
統合し、図１９（ｂ）に示す１つの矩形線分８６を得
る。この後、ステップＳ６０５又はステップＳ６０７で
求めた矩形線分を対象として探索を行うことにより、罫
線を抽出する。

【０１０７】なお、この罫線抽出処理については、例え
ば、特開平６−３０９４９８号公報に記載されている。
図２０は、図６のステップＳ２２の罫線抽出処理におい
て、かすれ罫線の補完を行いながら、探索を行う方法を
説明する図である。

【０１０８】このかすれ罫線の補完方法は、直線を構成
するパターンの探索を行う際、探索の進行方向にパター
ンのない空白領域が存在しても、一定の画素数以下の空
白領域に対してはパターンがあるとみなして探索を行う
ようにするものである。

【０１０９】例えば、図２０に示すように、直線９１に
対して、この直線９１を構成する画素９２の検索を行う
場合、一定の画素数以下の空白領域９３に対しては画素
９２があるとみなして探索を行う。

【０１１０】図２１は、罫線抽出処理におけるかすれ罫
線の補完方法を示すフローチャートである。図２１にお
いて、まず、ステップＳ７１に示すように、所定の矩形
範囲内のパターンのうち、最も細い部分のＸ座標を算出
する。

【０１１１】次に、ステップＳ７２に示すように、ステ
ップＳ７１で算出したＸ座標におけるパターンの中心点
を算出する。そして、ステップＳ７３に示すように、ス
テップＳ７２で算出したパターンの中心点を探索の開始
点とする。ここで、探索の開始点をパターンの最も細い
部分とするのは、最も細い部分は文字である可能性が低
いため、枠となる直線の探索をより確実に行うことがで
きるからである。

【０１１２】次に、ステップＳ７４で直線の探索方向を
右に設定する。次に、ステップＳ７５に示すように、空
白領域の長さをカウントする変数Ｋの初期値を０に設定
する。

【０１１３】次に、ステップＳ７６に示すように、ステ
ップＳ７３で求めた開始点をパターンの探索の現在地と
設定する。次に、ステップＳ７７に示すように、ステッ
プＳ７６で設定した探索の現在地が、ステップＳ７１で
注目した矩形範囲の内部であるかどうかの判定を行い、
探索の現在地が、ステップＳ７１で注目した矩形範囲の
内部でない場合、ステップＳ８６に進む。

【０１１４】一方、ステップＳ７７で探索の現在地が、
ステップＳ７１で注目した矩形範囲の内部であると判定
された場合、ステップＳ７８に進み、探索の現在地から
みて探索方向隣にパターンがあるかどうか判定する。こ
こで、探索の現在地からみて探索方向隣にパターンがあ
るとは、図２２に示すように、パターン１０１からみて
右方向隣の位置にパターン１０２が存在していることを
意味している。そして、探索の現在地からみて探索方向
隣にパターン１０２があると判定された場合、ステップ
Ｓ８１に進み、探索方向隣にあるパターン１０２を探索
の現在地とする。

【０１１５】一方、ステップＳ７８で探索の現在地から
みて探索方向隣にパターンがないと判定された場合、ス
テップＳ７９に進み、探索の現在地からみて探索方向斜
め隣にパターンがあるかどうか判定する。

【０１１６】ここで、探索の現在地からみて探索方向斜
め隣にパターンがあるとは、図２２に示すように、パタ
ーン１０３からみて右方向斜め隣の位置にパターン１０
４ａ又はパターン１０４ｂが存在していることを意味し
ている。そして、探索の現在地からみて探索方向斜め隣
にパターン１０４ａ、１０４ｂがあると判定された場
合、ステップＳ８３に進み、探索方向斜め隣にあるパタ
ーン１０４ａ、１０４ｂを探索の現在地とする。なお、
探索方向斜め隣にあるパターン１０４ａ、１０４ｂが２
つある場合はパターン１０４ａ、１０４ｂのどちらか一
方を探索の現在地とする。一方、ステップＳ７９で探索
の現在地からみて探索方向斜め隣にパターン１０４ａ、
１０４ｂがないと判定された場合、ステップＳ８０に進
み、空白領域の長さをカウントする変数Ｋがしきい値以
下であるかどうかを判定する。そして、空白領域の長さ
をカウントする変数Ｋがしきい値以下である場合、ステ
ップＳ８４に進み、探索の現在地からみて探索方向隣に
ありパターンを構成しない画素を現在地とする。例え
ば、図２０において、一定の画素数以下の空白領域９３
に対してはパターンがあるとみなして探索を行う。

【０１１７】次に、ステップＳ８５に示すように、空白
領域の長さをカウントする変数Ｋの値を１ドットだけ増
やし、ステップＳ７７に戻る。一方、ステップＳ８０で
空白領域の長さをカウントする変数Ｋがしきい値以下で
ないと判定された場合、ステップＳ８６に進み、探索方
向は右に設定されているかどうかを判定する。そして、
探索方向は右に設定されていない場合、処理を終了す
る。

【０１１８】ステップＳ８６で探索方向は右に設定され
ている場合、ステップＳ８７に進み、探索方向を左に設
定する。そして、探索方向を右に設定して行った処理と
同様に、ステップＳ７５〜ステップＳ８５の処理を繰り
返す。

【０１１９】ここで、探索方向を左に設定して処理を行
う場合、探索の現在地からみて探索方向隣にパターンが
あるとは、図２２に示すように、パターン１０５からみ
て左方向隣の位置にパターン１０６が存在していること
を意味している。また、探索の現在地からみて探索方向
斜め隣にパターンがあるとは、図２２に示すように、パ
ターン１０７からみて左方向斜め隣の位置にパターン１
０８ａ又はパターン１０８ｂが存在していることを意味
している。

【０１２０】なお、このかすれ罫線の補完方法について
は、例えば、特願平８−１０７５６８号の明細書及び図
面に記載されている。次に、図６のステップＳ２３の枠
抽出処理について説明する。

【０１２１】図２３は、一文字枠抽出処理の一実施例を
示すフローチャートである。図２３において、まず、ス
テップＳ９１に示すように、図１８の処理により矩形線
分として検出されたパターンに対し探索を行う。この
際、図２１のフローチャートに示すように、所定の長さ
の空白領域に対しては、パターンが存在するものとみな
して探索を行い、かすれを補完する。

【０１２２】次に、ステップＳ９２に示すように、ステ
ップＳ９１で探索を行った結果、パターンが所定の長さ
で途切れているかどうかを判断し、パターンが所定の長
さで途切れていない場合、図２４のブロック枠抽出処理
に進む。一方、パターンが所定の長さで途切れている場
合、ステップＳ９３に進み、探索された線分を統合して
直線を検出する。

【０１２３】次に、ステップＳ９４に示すように、ステ
ップＳ９３で検出した直線のうち、４方を囲んでいる直
線を抽出する。次に、ステップＳ９５に示すように、４
方を直線で囲まれた部分の大きさが、同一画像内の一文
字枠の大きさの所定範囲内であるかどうかを判断し、４
方を直線で囲まれた部分の大きさが、同一画像内の一文
字枠の大きさの所定範囲内であるか場合、ステップＳ９
６に進んで、４方を直線で囲まれた部分を一文字枠であ
るとみなし、４方を直線で囲まれた部分の大きさが、同
一画像内の一文字枠の大きさの所定範囲内でない場合、
ステップＳ９７に進んで、４方を直線で囲まれた部分を
一文字枠でないとみなす。

【０１２４】図２４は、ブロック枠抽出処理の一実施例
を示すフローチャートである。図２４において、まず、
ステップＳ１０１に示すように、探索により検出された
横直線が所定値以上の長さを有するかどうかを判断し、
探索により検出された横直線の長さが所定値より小さい
場合、ステップＳ１０２に進んで、その横直線を横枠で
ないとみなす。一方、探索により検出された横直線の長
さが所定値以上の場合、ステップＳ１０２に進み、探索
により検出された横直線を横枠であるとみなす。

【０１２５】次に、ステップＳ１０４に示すように、ス
テップＳ１０３で抽出された横枠から、互いに隣接する
２本の横枠を取り出す。次に、ステップＳ１０５に示す
ように、ステップＳ１０４で取り出した２本の横枠の間
に挟まれた範囲を１行のブロック枠とみなす。

【０１２６】次に、ステップＳ１０６に示すように、図
１８の処理により検出された矩形線分のうち、縦方向の
矩形線分を抽出して縦線を検出する。次に、ステップＳ
１０７に示すように、ステップＳ１０６で検出した縦線
の探索を行い、ステップＳ１０８において、縦線がステ
ップＳ１０４で取り出した上下の横枠に達したかどうか
を判断する。そして、縦線が上下の横枠に達しない場
合、ステップＳ１０９に進み、その縦線を縦枠の候補か
ら除外する。一方、縦線が上下の横枠に達した場合、ス
テップＳ１１０に進み、その縦線を縦枠の候補とする。

【０１２７】次に、ステップＳ１１１に示すように、処
理の対象が規則的な表形式のブロック枠であるか、不規
則な表形式のブロック枠であるかを判断する。そして、
処理の対象が規則的な表形式のブロック枠である場合、
ステップＳ１１２に進み、ステップＳ１１０で縦枠の候
補とみなされた縦線同士の間隔を算出するとともに、算
出された縦線同士の間隔とその出現頻度との関係を示す
ヒストグラムを算出する。

【０１２８】次に、ステップＳ１１３に示すように、互
いの隣接する２本の横枠の間に挟まれた範囲内の縦線の
うち、他の縦線と異なる間隔を形成する縦線を縦枠の候
補から除外し、残った縦線を縦枠として処理を終了す
る。

【０１２９】一方、ステップＳ１１１で処理の対象が不
規則的な表形式のブロック枠であると判断された場合、
ステップＳ１１０で縦枠の候補とされたものを全て縦枠
として処理を終了する。

【０１３０】次に、図６のステップＳ２４の枠種類／表
判別処理について説明する。図２５は、図６のステップ
Ｓ２３の枠抽出処理により抽出された枠や表の一例を示
す図である。

【０１３１】図２５において、図２５（ａ）は一文字
枠、図２５（ｂ）はフリーピッチ枠、図２５（ｃ）はブ
ロック枠、図２５（ｄ）は規則的な表、図２５（ｅ）は
不規則な表を示している。そして、一文字枠には一文字
枠の属性を付与し、フリーピッチ枠にはフリーピッチ枠
の属性を付与し、ブロック枠にはブロック枠の属性を付
与し、表には表の属性を付与する。

【０１３２】なお、枠抽出処理及び枠種類／表判別処理
については、例えば、特開平７−２８９３７号公報に記
載されている。次に、図６のステップＳ２５の枠接触有
無の判断処理について説明する。ここでは、元の入力画
像をＯＲ処理により縮小率１／ｎで縮小してから、枠接
触有無の判断処理を行う例について述べる。ここで、画
像の各画素に対応して座標が設定され、画像の横方向に
Ｘ座標、画像の縦方向にＹ座標を設定し、Ｘ座標は右向
きに増加し、Ｙ座標は下向きに増加するものとしてい
る。

【０１３３】図２６は、入力画像の縮小処理の一実施例
を示すフローチャートである。図２６において、まず、
ステップＳ１２１に示すように、原画像を入力する。次
に、ステップＳ１２２に示すように、原画像の左上から
横ｎ画素×縦ｎ画素の範囲（左上座標（１，１）、右下
座標（Ｘ，Ｙ））を設定する。

【０１３４】次に、ステップＳ１２３に示すように、原
画像の設定された範囲内に黒画素があるかどうかを判断
し、原画像の設定された範囲内に黒画素がある場合、ス
テップＳ１２４に進み、縮小画像の座標（Ｘ／ｎ，Ｙ／
ｎ）の画素を黒画素とし、原画像の設定された範囲内に
黒画素がない場合、ステップＳ１２５に進み、縮小画像
の座標（Ｘ／ｎ，Ｙ／ｎ）の画素を白画素とする。

【０１３５】次に、ステップＳ１２６に示すように、原
画像の右下まで処理が終了したかどうかを判断し、原画
像の右下まで処理が終了していない場合、ステップＳ１
２７に進み、原画像の右端に達したかどうかを判断す
る。

【０１３６】そして、原画像の右端に達していない場
合、処理した範囲の右隣に横ｎ画素×縦ｎ画素の範囲
（左上座標（ｘ，ｙ）、右下座標（Ｘ，Ｙ））を設定
し、原画像の右端に達した場合、処理した範囲の下側
で、かつ、原画像の左端から横ｎ画素×縦ｎ画素の範囲
（左上座標（ｘ，ｙ）、右下座標（Ｘ，Ｙ））を設定し
て、ステップＳ１２３に戻り、原画像の全ての範囲内に
ついて縮小処理が終了するまで以上の処理を繰り返す。

【０１３７】次に、入力画像の縮小処理により縮小され
た圧縮画像データにおける枠線の内側を枠に沿って探索
することにより、文字が枠に接触しているかどうかの判
定を行い、文字の接触している辺に関して、矩形領域を
所定の距離だけ外側に拡大し、この拡大した矩形領域の
座標を原画像データにおける座標に変換する。

【０１３８】例えば、図２７（ａ）に示すように、圧縮
画像データの枠線の範囲１１０が抽出され、この枠線に
より囲まれた矩形領域内に「４」の文字１１２が存在
し、この「４」の文字１１２が下側の枠線１１１に接触
しているものとする。

【０１３９】次に、図２７（ｂ）に示すように、枠線の
内側に沿って真っ直ぐに探索を行い、探索の途中でパタ
ーンと交差した場合、枠線の近辺に文字が存在し、この
文字は枠線に接触している可能性が高いとみなして、こ
の枠線により囲まれた矩形領域内に存在する「４」の文
字１１２は枠と接触しているものとする。この例の場
合、「４」の文字１１２は下側の枠１１１と接触してい
るものとされる。

【０１４０】次に、枠線１１１の内側に沿って探索を行
い、文字１１２が枠線１１１に接触しているとみなされ
た結果、図２７（ｃ）に示すように、文字１１２が接触
している枠線１１１から外側の方向へ枠線により囲まれ
た矩形領域を拡大し、この拡大した矩形領域１１３を文
字１１２が存在する文字領域とする。なお、文字が枠線
に接触していないとみなされた場合は、枠の内部をその
まま文字領域とする。

【０１４１】次に、圧縮画像データにおける文字領域か
ら原画像データにおける文字領域を求めるため、図２７
（ｃ）の矩形領域１１３の座標を原画像データにおける
座標に変換する。このことにより、図２７（ｄ）に示す
ように、原画像データにおける矩形領域１１６を求める
ことができる。

【０１４２】次に、原画像データの矩形領域１１６にお
ける枠線１１４についての投影処理を行い、枠線１１４
の枠座標を原画像データから算出する。この際、枠線１
１４を所定の長さの短冊状の矩形によって表現する。そ
して、図２７（ｅ）に示すように、この矩形領域１１６
に存在するパターンを文字補完処理に送り、原画像デー
タから算出した枠線１１４の枠座標に基づいて、枠線１
１４に接触している文字１１５の補完処理を行う。

【０１４３】図２８は、枠接触有無の判断処理の一実施
例を示すフローチャートである。図２８において、ま
ず、ステップＳ１３１に示すように、圧縮画像データに
よる矩形表現を、例えば、図２６の処理により行う。

【０１４４】次に、ステップＳ１３２に示すように、縦
横４本の直線に囲まれた矩形部分を抽出する。次に、ス
テップＳ１３３に示すように、直線の内側を示す矩形の
左上及び右下を示す座標をそれぞれ算出する。

【０１４５】次に、ステップＳ１３４に示すように、枠
の内側を示す矩形の４辺（上側横枠、下側横枠、右側縦
枠、左側縦枠）に沿って圧縮画像の探索を行う。次に、
ステップＳ１３５に示すように、探索の途中で画像パタ
ーンと交差した場合、探索を行っていた辺に文字が接触
しているものとする。

【０１４６】次に、ステップＳ１３６に示すように、枠
の内側を示す矩形の座標値を原画像上の座標値に変換す
ることにより、圧縮画像データにおける矩形領域から原
画像データにおける矩形領域を算出する。

【０１４７】次に、ステップＳ１３７に示すように、ス
テップＳ１３６で算出された矩形領域を原画像データに
おける文字領域とする。次に、ステップＳ１３８に示す
ように、ステップＳ１３５の処理により文字が枠に接触
していたかどうかを判断し、文字が枠に接触している場
合、ステップＳ１３９〜Ｓ１４３の接触文字範囲獲得処
理を行う。

【０１４８】接触文字範囲獲得処理では、まず、ステッ
プＳ１３９において、文字の接触している辺から外側方
向に文字領域を拡大し、ステップＳ１３７で算出された
文字領域位置より一定の距離だけ外側の位置を文字領域
の端とする。

【０１４９】次に、ステップＳ１４０に示すように、ス
テップＳ１３９で算出された文字領域に含まれる枠線の
位置座標を原画像上の座標値に変換することにより、圧
縮画像データにおける枠線の位置座標から原画像データ
における枠線の位置座標を算出する。

【０１５０】次に、ステップＳ１４１に示すように、ス
テップＳ１４０で算出された原画像データにおける枠線
の位置座標に基づいて獲得した原画像データの枠線領域
について、横枠は横方向、縦枠は縦方向に投影処理を行
う。

【０１５１】次に、ステップＳ１４２に示すように、投
影値が一定値以上の領域を原画像上の枠座標とする。次
に、ステップＳ１４３に示すように、算出した原画像上
の文字領域を示す座標値と文字領域内の枠線の位置を示
す座標値とを文字補完処理へ渡す。

【０１５２】次に、ステップＳ１４４に示すように、算
出した原画像上の文字領域を示す座標値を文字領域とす
る。なお、枠接触有無の判断処理については、例えば、
特願平８−１０７５６８号の明細書及び図面に記載され
ている。

【０１５３】次に、図８のステップＳ４１の訂正特徴抽
出処理及びステップＳ４２の訂正文字候補抽出処理につ
いて説明する。図２９は、訂正文字の一実施例を示す図
である。

【０１５４】図２９において、訂正文字は、文字を消し
線で消したものであり、訂正文字の形態として、図２９
（ａ）に示すように、文字を“×”印により消したも
の、図２９（ｂ）に示すように、文字を横二重線により
により消したもの、図２９（ｃ）に示すように、文字を
斜め線により消したもの、図２９（ｄ）に示すように、
文字を波線により消したもの、図２９（ｅ）に示すよう
に、文字を真っ黒に塗りつぶすことにより消したものな
ど様々なものがある。

【０１５５】このような訂正文字に対し、訂正文字に特
有な特徴を抽出する。この訂正文字に特有な特徴とし
て、「所定方向の線密度」、「オイラー数」、「黒画素
密度」などがある。

【０１５６】「所定方向の線密度」は、矩形内の画像を
所定の一定方向に沿って走査した際に、白画素から黒画
素（又は黒画素から白画素）に変化する回数を計数した
値である。また、所定方向は、消し線として想定された
線分の方向と垂直方向に設定する。

【０１５７】例えば、図３０（ａ）は、「６」の文字に
ついて、縦方向の最大線密度を計数した例を示すもの
で、この場合の縦方向の最大線密度は３となっている。
訂正文字の「所定方向の線密度」は、通常文字の「所定
方向の線密度」に比べて大きくなる傾向があり、この
「所定方向の線密度」を算出することにより、訂正文字
の候補を抽出することができる。

【０１５８】「オイラー数」Ｅは、画像中での互いに連
結している連結成分の個数Ｃから、その画像が有する穴
の個数Ｈを引いた値である。例えば、図３０（ｂ）は、
互いに連結している連結成分が画像中に２つだけ存在
し、その画像中に穴が１つだけ存在する例を示すもの
で、この例の場合のオイラー数Ｅは、Ｅ＝Ｃ−Ｈ＝２−
１＝１となる。

【０１５９】訂正文字の「オイラー数」は絶対値が大き
な負の値となる傾向があり、通常文字の「オイラー数」
は絶対値が小さな値（２〜−１）となる傾向がある。し
たがって、この「オイラー数」を算出することにより、
訂正文字の候補を抽出することができる。

【０１６０】「黒画素密度」Ｄは、注目する画像自体の
面積（黒画素数）Ｂと注目する画像の外接矩形の面積Ｓ
との比である。例えば、図３０（ｃ）は、「４」の文字
について黒画素密度Ｄを算出した場合の例を示すもの
で、「４」の文字に外接している外接矩形の面積をＳ、
「４」の文字の面積をＢとすると、Ｄ＝Ｂ／Ｓとなる。

【０１６１】訂正文字の「黒画素密度」は、通常文字の
「黒画素密度」に比べて大きくなる傾向があり、この
「黒画素密度」を算出することにより、訂正文字の候補
を抽出することができる。

【０１６２】次に、図３の基本文字認識部１７について
具体的に説明する。図３１は、基本文字認識部１７の構
成の一実施例を示すブロック図である。図３１におい
て、特徴抽出部１２１は、入力された未知の文字パター
ンから文字の特徴を抽出し、この抽出した特徴を特徴ベ
クトルにより表す。一方、基本辞書１２２には、各文字
カテゴリの特徴ベクトルが格納されている。

【０１６３】そして、照合部１２３は、特徴抽出部１２
１により抽出した未知の文字パターンの特徴ベクトル
を、基本辞書１２２に格納されている各文字カテゴリの
特徴ベクトルと照合し、特徴空間上での特徴ベクトル間
の距離Ｄ_ij（ｉは未知文字の特徴ベクトル、ｊは基本辞
書１２２のカテゴリの特徴ベクトル）を算出する。その
結果、特徴ベクトル間の距離Ｄ_ijを最小とするカテゴリ
ｊを未知文字ｉとして認識する。

【０１６４】ここで、特徴空間上での特徴ベクトル間の
距離Ｄ_ijは、例えば、ユークリッド距離Σ（ｉ−
ｊ）²、シティブロック距離Σ｜ｉ−ｊ｜、又は判別関
数などの識別関数を用いて算出することができる。

【０１６５】なお、第１位のカテゴリとの距離を
Ｄ_ij1、第２位のカテゴリとの距離をＤ_ij ₂とすると、
第１位のカテゴリｊ１、第２位のカテゴリｊ２、カテゴ
リ間の距離（Ｄ_ij2−Ｄ_ij1）及び信頼度に関するテー
ブル１を予め作成しておく。また、第１位のカテゴリと
の距離をＤ_ij1、第１位のカテゴリｊ１及び信頼度に関
するテーブル２も予め作成しておく。そして、テーブル
１とテーブル２とからそれぞれ得られる信頼度の小さい
方を中間処理結果テーブルに格納する。

【０１６６】図３２は、特徴ベクトルの算出例を示す図
である。この例は、図３２（ａ）の縦５×横４の合計２
０個の枡目に「２」の文字が書かれており、黒く塗りつ
ぶされた枡目を“１”、白抜きの枡目を“０”として、
枡目の左上から右下の順に枡目を見ていき、その時現れ
る“１”又は“０”の数値を順に並べたものを、特徴ベ
クトルとしたものである。

【０１６７】例えば、図３２（ｂ）の場合の特徴ベクト
ルｖｅｃｔｏｒＡは、ｖｅｃｔｏｒＡ＝（１、１、１、
１、０、０、０、１、１、１、１、１、１、０、０、
０、１、１、１、１、）となり、図３２（ｃ）の場合の
特徴ベクトルｖｅｃｔｏｒＢは、ｖｅｃｔｏｒＢ＝
（０、１、１、１、０、０、０、１、１、１、１、１、
１、０、０、０、１、１、１、１、）となり、図３２
（ｄ）の場合の特徴ベクトルｖｅｃｔｏｒＣは、ｖｅｃ
ｔｏｒＣ＝（１、１、１、１、０、０、０、１、０、
１、１、０、１、０、０、０、１、１、１、１、）とな
る。

【０１６８】図３３は、シティブロック距離ｄ（ｉ，
ｊ）により特徴ベクトル間の距離Ｄ_ijを算出する例を示
す図である。ここで、シティブロック距離ｄ（ｉ，ｊ）
は、特徴ベクトルの次元数をＮ、特徴ベクトルの番号を
ｉとすると、ｉ番目の特徴ベクトルｘ_iは、ｘ_i＝（ｘ
_i1，ｘ_i2，ｘ_i3，・・・ｘ_iN）と表され、ｊ番目の特徴
ベクトルｘ_jは、ｘ_j＝（ｘ _j1，ｘ_j2，ｘ_j3，・・・ｘ
_jN）と表される。そして、ｉ番目の特徴ベクトルｘ_iと
ｊ番目の特徴ベクトルｘ_jとのシティブロック距離ｄ
（ｉ，ｊ）は、ｄ（ｉ，ｊ）＝｜ｘ_i−ｘ_j｜・・・（２）と定義される。

【０１６９】例えば、図３３において、基本辞書１２２
には、「１」、「２」、「３」、「４」の文字カテゴリ
の特徴ベクトルが登録されているものとする。ここで、
「１」の文字カテゴリの特徴ベクトルｖｅｃｔｏｒ１
は、ｖｅｃｔｏｒ１＝（０、１、１、０、０、１、１、
０、０、１、１、０、０、１、１、０、０、１、１、
０、）、「２」の文字カテゴリの特徴ベクトルｖｅｃｔ
ｏｒ２は、ｖｅｃｔｏｒ２＝（１、１、１、１、０、
０、０、１、１、１、１、１、１、０、０、０、１、
１、１、１、）、「３」の文字カテゴリの特徴ベクトル
ｖｅｃｔｏｒ３は、ｖｅｃｔｏｒ３＝（１、１、１、
１、０、０、０、１、１、１、１、１、０、０、０、
１、１、１、１、１、）、「４」の文字カテゴリの特徴
ベクトルｖｅｃｔｏｒ４は、ｖｅｃｔｏｒ４＝（１、
０、１、０、１、０、１、０、１、１、１、１、０、
０、１、０、０、０、１、０、）とする。

【０１７０】そして、特徴ベクトルｖｅｃｔｏｒが、ｖ
ｅｃｔｏｒ＝（０、１、１、１、０、０、０、１、１、
１、１、１、１、０、０、０、１、１、１、１、）であ
る未知文字が入力された場合、この特徴ベクトルｖｅｃ
ｔｏｒと、基本辞書１２２に登録されている「１」の文
字カテゴリの特徴ベクトルｖｅｃｔｏｒ１、「２」の文
字カテゴリの特徴ベクトルｖｅｃｔｏｒ２、「３」の文
字カテゴリの特徴ベクトルｖｅｃｔｏｒ３、「４」の文
字カテゴリの特徴ベクトルｖｅｃｔｏｒ４のそれぞれと
の間のシティブロック距離ｄ（ｉ，ｊ）を（２）式によ
り算出する。

【０１７１】すなわち、未知文字の特徴ベクトルｖｅｃ
ｔｏｒと「１」の文字カテゴリの特徴ベクトルｖｅｃｔ
ｏｒ１との間のシティブロック距離ｄ（ｉ，ｊ）は、ｄ
（ｉ，ｊ）＝｜ｖｅｃｔｏｒ−ｖｅｃｔｏｒ１｜＝｜０
−０｜＋｜１−１｜＋｜１−１｜＋｜１−０｜＋｜０−
０｜＋｜０−１｜＋｜０−１｜＋｜１−０｜＋｜１−０
｜＋｜１−１｜＋｜１−１｜＋｜１−０｜＋｜１−０｜
＋｜０−１｜＋｜０−１｜＋｜０−０｜＋｜１−０｜＋
｜１−１｜＋｜１−１｜＋｜１−０｜＝１１となる。

【０１７２】同様に、未知文字の特徴ベクトルｖｅｃｔ
ｏｒと「２」の文字カテゴリの特徴ベクトルｖｅｃｔｏ
ｒ２との間のシティブロック距離ｄ（ｉ，ｊ）は、ｄ
（ｉ，ｊ）＝｜ｖｅｃｔｏｒ−ｖｅｃｔｏｒ２｜＝１、
未知文字の特徴ベクトルｖｅｃｔｏｒと「３」の文字カ
テゴリの特徴ベクトルｖｅｃｔｏｒ３との間のシティブ
ロック距離ｄ（ｉ，ｊ）は、ｄ（ｉ，ｊ）＝｜ｖｅｃｔ
ｏｒ−ｖｅｃｔｏｒ３｜＝３、未知文字の特徴ベクトル
ｖｅｃｔｏｒと「４」の文字カテゴリの特徴ベクトルｖ
ｅｃｔｏｒ４との間のシティブロック距離ｄ（ｉ，ｊ）
は、ｄ（ｉ，ｊ）＝｜ｖｅｃｔｏｒ−ｖｅｃｔｏｒ４｜
＝１１となる。

【０１７３】ここで、未知文字の特徴ベクトルｖｅｃｔ
ｏｒと、「１」の文字カテゴリの特徴ベクトルｖｅｃｔ
ｏｒ１、「２」の文字カテゴリの特徴ベクトルｖｅｃｔ
ｏｒ２、「３」の文字カテゴリの特徴ベクトルｖｅｃｔ
ｏｒ３、「４」の文字カテゴリの特徴ベクトルｖｅｃｔ
ｏｒ４のそれぞれとの間のシティブロック距離ｄ（ｉ，
ｊ）のうち、未知文字の特徴ベクトルｖｅｃｔｏｒと
「２」の文字カテゴリの特徴ベクトルｖｅｃｔｏｒ２と
の間のシティブロック距離ｄ（ｉ，ｊ）が最小となって
いる。

【０１７４】従って、特徴ベクトルｖｅｃｔｏｒが、ｖ
ｅｃｔｏｒ＝（０、１、１、１、０、０、０、１、１、
１、１、１、１、０、０、０、１、１、１、１、）であ
る未知文字は、「２」の文字カテゴリに属すると判定さ
れる。

【０１７５】次に、図３の基本文字認識部１７の知識テ
ーブル１８に格納されている詳細識別法について説明す
る。この詳細識別法は、各文字カテゴリの局所的な部分
パターンを文字セグメントとして取り出し、未知文字の
文字セグメントの位置や角度変化量とセグメント辞書に
予め格納してある文字セグメントの位置や角度変化量と
を比較することにより、未知文字と文字カテゴリとの対
応を取りながら文字を認識する。

【０１７６】図３４は、文字セグメントの抽出方法を説
明する図である。図３４（ａ）は、「２」の文字につい
ての２値画像パターンを示しており、斜線部分が黒画素
で表された文字部分を示している。

【０１７７】図３４（ｂ）は、図３４（ａ）の２値画像
パターンから抽出された輪郭線を示しており、点線部分
は元の２値画像パターンを示している。図３４（ｃ）
は、図３４（ｂ）の輪郭線を文字セグメントＳ１、Ｓ２
と端点部分Ｔ１、２とに分割した状態を示している。こ
の端点部分Ｔ１、２は、図３４（ａ）の「２」の文字の
書き始め及び書き終わりに対応するものである。

【０１７８】図３５は、端点の検出方法を説明する図で
ある。図３５において、端点は輪郭線の傾きが急激に変
化する場所として検出され、具体的には、一定間隔だけ
離れた３点Ａ、Ｂ、Ｃを輪郭線Ｓ上にとり、その３点
Ａ、Ｂ、Ｃを結んだ真ん中の点Ａを頂点としてなす角θ
が所定値以下となる輪郭線上の領域を、端点として検出
する。

【０１７９】文字の輪郭線を端点で分割することによ
り、文字セグメントを２値画像パターンから抽出する
と、例えば、文字セグメント上に代表点Ｘ、Ｙ、Ｚを一
定の距離ごとにとる。そして、連続する代表点Ｘ、Ｙ、
Ｚのなす角度を求め、各代表点Ｘ、Ｙ、Ｚでの特徴量と
して、文字セグメント上の最初の代表点から各代表点ま
での角度変化量の累積値を求める。

【０１８０】図３６は、角度変化の検出方法を説明する
図である。図３６において、任意の間隔だけ離れた代表
点Ｘ、Ｙ、Ｚを輪郭線Ｓ上にとり、代表点Ｘから代表点
Ｙに引いたベクトルＸＹと、代表点Ｙから代表点Ｚに引
いたベクトルＹＺとを作り、ベクトルＸＹとベクトルＹ
Ｚとのなす角θ₂が代表点Ｙでの角度変化となる。

【０１８１】角度変化の初期値である輪郭線Ｓ上の代表
点Ｘでの角度変化は、文字の重心Ｇから代表点Ｘに引い
たベクトルＧＸとベクトルＸＹとのなす角θ₁を代表点
Ｘでの角度変化とする。

【０１８２】各代表点Ｘ、Ｙ、Ｚでの特徴量は、角度変
化の初期値を有する代表点Ｘから各代表点Ｙ、Ｚまでの
角度変化を累積した値で表し、例えば、代表点Ｙでの特
徴量は、θ₁＋θ₂の値となる。

【０１８３】未知文字の文字セグメント上の代表点での
角度変化量の累積値を求めた後、この未知文字の文字セ
グメントについての代表点とセグメント辞書に格納して
ある文字セグメントの代表点との対応をとる。すなわ
ち、未知文字の文字セグメントについての代表点の角度
変化量の累積値と、セグメント辞書に格納してある文字
セグメントの代表点の角度変化量の累積値との距離を算
出し、この距離が最も小さくなるセグメント辞書の文字
セグメントの代表点を未知文字の文字セグメントの代表
点に対応させる。

【０１８４】図３７（ａ）は、未知文字の文字セグメン
トの代表点とセグメント辞書の文字セグメントの代表点
との対応関係を示す図である。図３７（ａ）において、
代表点ａ₁〜ａ₈は、未知文字の文字セグメント上の代
表点を表し、代表点ｂ₁〜ｂ₈は、セグメント辞書に格
納されている文字セグメント上の代表点を表している。
そして、未知文字の文字セグメントについての代表点ａ
₁〜ａ₈はそれぞれ、セグメント辞書に格納されている
文字セグメントの代表点ｂ₁〜ｂ₈に対応している。

【０１８５】未知文字の文字セグメントの代表点とセグ
メント辞書の文字セグメントの代表点との対応関係を求
めた後、セグメント辞書に格納されている文字セグメン
ト上の基準点に対応する未知文字の文字セグメントにつ
いての代表点を検査点とする。

【０１８６】図３７（ｂ）は、基準点と検査点との対応
関係を示す図である。図３７（ｂ）において、セグメン
ト辞書に格納されている文字セグメントの基準点ｄ₁、
ｄ₂はそれぞれ、未知文字の文字セグメントの検査点ｃ
₁、ｃ₂に対応している。

【０１８７】基準点と検査点との対応関係を求めた後、
未知文字の文字セグメントの検査点ｃ₁、ｃ₂について
の検査情報を算出する。この検査情報は、例えば、１つ
の検査点に対しては、その検査点が文字画像全体の中で
どの位置に存在しているかという個々の検査点の絶対位
置情報や、２つの検査点に対しては、それらの検査点間
の距離や方向などの相対位置情報や、２つの以上の検査
点に対しては、それらの検査点間の角度変化や直線性な
どの情報からなっている。

【０１８８】そして、検査点についての検査情報を算出
した結果、所定の判定条件を満たす場合、判定条件を満
たしたセグメント辞書に格納されている文字セグメント
の文字カテゴリを未知文字の認識結果として出力する。

【０１８９】例えば、判定条件として、図３７（ｂ）の
文字セグメント上の検査点ｃ₁から文字セグメントに沿
って検査点ｃ₂までの角度変化を検査情報とした場合、
この角度変化が６０度以上である文字セグメントの文字
画像が、その文字セグメントに対応して格納されている
セグメント辞書の「２」の文字カテゴリに属するとした
場合、図３７（ｂ）の文字セグメント上の検査点ｃ₁か
ら文字セグメントに沿って検査点ｃ₂までの角度変化を
算出することにより、図３４（ａ）の文字パターンが
「２」の文字カテゴリに属すると認識できる。

【０１９０】図３８は、詳細識別法による文字認識処理
を示すフローチャートである。図３８において、まず、
ステップＳ１５０に示すように、文字認識の対象となる
帳票などをスキャナで走査し、読み込んだ文字画像を白
黒２値の画像に２値化する。

【０１９１】次に、ステップＳ１５１に示すように、ス
テップＳ１５０で得られた２値画像データから文字セグ
メントを抽出する。次に、ステップＳ１５２に示すよう
に、セグメント辞書に格納されている複数の文字セグメ
ントから、未知文字の文字セグメントとの対応関係が付
けられていない文字セグメントを取り出す。

【０１９２】次に、ステップＳ１５３に示すように、セ
グメント辞書から取り出した文字セグメントと未知文字
の文字セグメントとの対応関係を付ける。次に、ステッ
プＳ１５４に示すように、未知文字の文字セグメント上
にとった代表点の中から検査点を決定し、この検査点に
ついての検査情報を算出する。

【０１９３】次に、ステップＳ１５５に示すように、ス
テップＳ１５４で算出した検査情報に基づいて、セグメ
ント辞書から取り出した文字セグメントと未知文字の文
字セグメントとを比較し、セグメント辞書から取り出し
た文字セグメントの検査情報と未知文字の文字セグメン
トの検査情報とが一致するかどうかを判定することによ
り、未知文字に対する文字候補の決定処理を行う、次
に、ステップＳ１５６に示すように、未知文字に対する
文字候補の決定処理で、文字候補が決定した場合、ステ
ップＳ１５３で取り出した文字セグメントに対応する文
字カテゴリを認識結果として出力する。一方、文字候補
が決定しない場合、ステップＳ１５７に進み、未知文字
の文字セグメントとの対応関係が付けられていない未処
理の文字セグメントがセグメント辞書にあるかどうかを
判断し、未処理の文字セグメントがセグメント辞書にあ
る場合、ステップＳ１５２に戻って、以上の処理を繰り
返す。

【０１９４】一方、未知文字の文字セグメントとの対応
関係が付けられていない未処理の文字セグメントがセグ
メント辞書にない場合、入力された未知文字は認識不能
であると判断して、認識不能という認識結果を出力す
る。

【０１９５】なお、詳細識別法については、例えば、特
開平６−３０９５０１号公報に記載されている。次に、
図３の接触文字認識部１３の一実施例について説明す
る。

【０１９６】図３９は、接触文字認識部１３の文字補完
処理を説明する図である。この文字補完処理では、枠接
触文字の２値画像から枠だけを抽出してこの枠を除去す
る。この際、枠接触文字の枠に接触している文字線分の
枠接触部分がかすれてしまい、文字線分が複数の部分に
途切れてしまうので、途切れた文字線分について、各ラ
ベルが付与された文字線分間の距離や方向性等の幾何学
的構造を評価して、それを補完する。

【０１９７】例えば、図３９（ａ）に示すように、
「３」を表している文字パターン１３１と枠１３２とが
接触したために連結している２値画像にラベル“１”が
付されている。そして、図３９（ａ）の２値画像から枠
１３２を抽出し、この枠１３２を除去することにより、
図３９（ｂ）に示すように、「３」を表している文字パ
ターン１３１が３個に分割されて、ラベル“１”、ラベ
ル“２”及びラベル“３”が付与された３個の文字線分
が生成される。

【０１９８】このラベル“１”、ラベル“２”及びラベ
ル“３”が付与された３個の文字線分について、各ラベ
ルが付与された文字線分間の距離や方向性等の幾何学的
構造を評価して、それを補完する。これにより、ラベル
“１”、ラベル“２”及びラベル“３”が付与された３
個の文字線分が連結されて、図３９（ｃ）に示すよう
に、ラベル“１”が付された「３」を表している文字補
完パターン１３２が生成される。

【０１９９】この文字補完処理により復元された文字
は、認識文字の候補として認識処理が行われる。この認
識処理では、文字カテゴリ辞書に登録されている標準パ
ターンと照合して、相違度が最も小さい文字カテゴリの
コードを出力する。

【０２００】図４０は、接触文字認識部１３の再補完処
理を説明する図である。この再補完処理では、枠に平行
な文字線分が枠に接触し、枠を除去したために枠に平行
な文字線分が消滅した場合に、この文字線分を補完する
もので、予め、枠接触文字をラベリングによる連結性を
用いて抽出しておき、文字補完処理により補完された文
字補完パターンと枠接触文字の連結性が一致することを
検出することにより、枠に平行な文字線分を補完する。

【０２０１】例えば、図４０（ａ）に示すように、
「７」を表している文字パターン１４１と枠１４２とが
接触したために連結している２値画像にラベル“１”が
付されている。そして、図４０（ａ）の２値画像から枠
１４２を抽出し、この枠１４２を除去することにより、
図４０（ｂ）に示すように、「７」を表している文字パ
ターン１４１が３個に分割されて、ラベル“１”、ラベ
ル“２”及びラベル“３”が付与された３個の文字線分
が生成される。

【０２０２】このラベル“１”、ラベル“２”及びラベ
ル“３”が付与された３個の文字線分について、各ラベ
ルが付与された文字線分間の距離や方向性等の幾何学的
構造を評価して、それを補完する。これにより、ラベル
“１”及びラベル“２”が付与された２個の文字線分が
連結されて、図４０（ｃ）に示すように、ラベル“１”
及びラベル“２”が付与された２個の文字線分からなる
文字補完パターン１４２が生成される。

【０２０３】この場合、文字補完処理で補完されるの
は、図４０（ｂ）のラベル”１”が付与されていた部分
とラベル”２”が付与されていた部分との間のみで、図
４０（ｂ）のラベル”１”が付与されていた部分とラベ
ル”３”が付与されていた部分については、補完するこ
とができない。この図４０（ｂ）のラベル”１”が付与
されていた部分とラベル”３”が付与されていた部分の
補完は、再補完処理により行う。

【０２０４】この再補完処理は、予め、枠接触文字をラ
ベリングによる連結性を用いて抽出しておき、図４０
（ｃ）のパターンと枠接触文字の連結性が一致すること
を検出することにより、枠に平行な文字線分を補完す
る。すなわち、図４０（ｃ）のラベル”１”が付与され
たパターンとラベル”２”が付与されたパターンとは、
図４０（ａ）に示すように、枠を除去する前は互いに連
結していたので、図４０（ｃ）のラベル”１”が付与さ
れたパターンとラベル”２”が付与されたパターンと
を、枠に平行な線分を用いて互いに連結する。

【０２０５】これにより、図４０（ｃ）のラベル”１”
とラベル”２”の２つの文字線分に分かれていた「７」
の２値画像が補完され、図４０（ｄ）に示すように、ラ
ベル“１”が付された「７」を表している再補完パター
ン１４３が生成される。

【０２０６】この再補完処理により復元された文字は、
認識文字の候補として認識処理が行われる。この認識処
理では、文字カテゴリ辞書に登録されている標準パター
ンと照合して、相違度が最も小さい文字カテゴリのコー
ドを出力する。

【０２０７】すなわち、図４０に示す例では、図４０
（ｃ）に示す文字補完パターン１４２は、「リ」の文字
カテゴリに属すものと認識される。また、図４０（ｄ）
に示す再補完パターン１４３は、「７」の文字カテゴリ
に属すものと認識される。そして、「リ」よりも「７」
のほうが相違度が小さいと判断されて、最終的に「７」
と認識され、その文字コードが出力される。

【０２０８】次に、図３の接触文字認識部１３が知識テ
ーブル１４を参照しながら認識処理を行う場合について
説明する。図４１は、誤読文字対を学習し、知識テーブ
ル１４に登録しておくことにより、枠接触文字を認識す
る例を説明する図である。

【０２０９】この例の場合、図４１（ａ）に示すよう
に、「２」を表している文字パターン１５１と枠１５２
とが接触したために連結している２値画像にラベル
“１”が付されている。そして、図４１（ａ）の２値画
像から枠１５２を抽出し、この枠１５２を除去すること
により、図４１（ｂ）に示すように、「２」を表す文字
１５１がラベル“１”とラベル“２”の２つの部分パタ
ーンに分離される。

【０２１０】次に、図４１（ｃ）に示すように、文字補
完処理により、図４１（ｂ）のラベル“１”とラベル
“２”の２つの部分パターンが連結され、文字補完パタ
ーン１５３が生成される。

【０２１１】この場合、「２」を表している文字パター
ン１５１の下線部分が枠１５２に接触し、その接触部分
がほぼ完全に枠１５２に重なっている。このため、再補
完処理を用いても、「２」を表している文字パターン１
５１の下線部分を補完することができず、「２」の文字
を、誤って「７」と認識してしまう可能性が高くなる。

【０２１２】このように、枠接触文字の一部が枠からは
み出すことなく、枠に完全に重なっているため、他の文
字と誤って認識してしまう場合、誤読文字対を学習して
登録しておくことにより、枠接触文字が正しく認識され
るようにする。

【０２１３】以下、誤読文字対を学習して登録しておく
ことにより、枠接触文字を認識する方法について説明す
る。図４２は、図３の接触文字認識部１３において、誤
読文字対を学習する構成を示すブロック図である。

【０２１４】枠接触文字の自動生成部１６１は、入力さ
れた枠に未接触の学習文字を枠に重ね合わせて、枠接触
文字を生成する。ここで、枠に対する学習文字の変動の
方法により、同一の学習文字に対して複数の枠接触文字
が生成される。図４２では、「２」を表している学習文
字１６８が枠接触文字の自動生成部１６１に入力され、
文字「２」の下辺と下枠とが重なった枠接触文字１６９
を生成した例を示している。枠接触文字の自動生成部１
６１により生成された情報は、知識テーブル１６７に登
録される。

【０２１５】学習文字に枠を重ね合わせる際の変動の種
類は、例えば、「文字枠に対する文字の変動」と「文字
枠の変動」の２種類があり、「文字枠に対する文字の変
動」には、例えば、「位置ずれ」、「サイズ変動」及び
「傾き変動」などがあり、「文字枠の変動」には、例え
ば、「傾き変動」、「枠幅変動」、「サイズ変動」及び
「枠の凹凸」などがある。

【０２１６】また、これらの変動についての変動量を表
すパラメータとして以下のパラメータがある。なお、垂
直方向にｘ軸を、水平方向にｙ軸を設定するものとす
る。１．文字枠に対する文字の変動位置ずれ：ｄｘ、ｄｙ、ここで、ｄｘ（図４３で黒丸で示した位置）、ｄｙ（図
４３で ×で示した位置）は、それぞれ、文字の重心と
文字枠の重心の位置の差のｘ方向、ｙ方向の大きさを表
す。

【０２１７】サイズ変動：ｄｓｘ、ｄｓｙ、ここで、ｄｓｘ，ｄｓｙは、それぞれ、文字のｘ方向、
ｙ方向の大きさを表す。

【０２１８】傾き変動：ｄα、ここで、ｄαは、垂線に対する文字の傾き角度を表す。２．文字枠の変動傾き変動：ｆα、ここで、垂線に対する文字枠の傾き角度を表す。

【０２１９】枠幅変動：ｗ、ここで、ｗは、文字枠の幅を表す。サイズ変動：ｆｓｘ、ｆｓｙ、ここで、ｆｓｘ，ｆｓｙは、それぞれ、文字のｘ方向、
ｙ方向の大きさを表す。

【０２２０】枠の凹凸：ｆδ、ここで、ｆδは、例えば、ファクシミリなどに印刷され
た文字枠の品質劣化等を考慮した文字枠の凹凸を制御す
るパラメータである。例えば、文字枠の周囲長をＬとす
ると、ｆδは、このサイズＬの配列ｆδ〔Ｌ］として表
現され、この配列の各要素ｆδ〔ｉ］（ｉ＝１、２、
３，・・・）は、乱数発生により決定される−β〜＋β
の範囲内の整数値をとる。

【０２２１】これらの変動の種類及び変動量に基づい
て、学習文字に対して操作Ｆ（ｄｘ，ｄｙ，ｄｓｘ，ｄ
ｓｙ，ｄα，ｗ，ｆｓｘ，ｆｓｙ，ｆα、ｆδ）を施す
ことにより、枠接触文字を生成する。

【０２２２】図４３は、「７」を表す学習文字１７１に
対して枠１７２を合成することにより、枠接触文字を生
成する例を示す図である。図４３（ａ）に示すように、
「７」を表す学習文字１７１に対して変換操作Ｆ（ｄ
ｘ，ｄｙ，ｄｓｘ，ｄｓｙ，ｄα，ｗ，ｆｓｘ，ｆｓ
ｙ，ｆα、ｆδ）を施すことにより、図４３（ｂ）に示
すように、枠１７２に接触する「７］の枠接触文字を生
成する。

【０２２３】すなわち、学習文字１７１及び枠１７２に
対して変換操作Ｆ（ｄｘ，ｄｙ，ｄｓｘ，ｄｓｙ，ｄ
α，ｗ，ｆｓｘ，ｆｓｙ，ｆα、ｆδ）を施し、学習文
字１７１と枠１７２とを重ね合わせることにより、枠接
触文字を生成する。この場合、例えば、枠１７２の方の
重心の位置を固定しながら変換操作Ｆ（ｄｘ，ｄｙ，ｄ
ｓｘ，ｄｓｙ，ｄα，ｗ，ｆｓｘ，ｆｓｙ，ｆα、ｆ
δ）を実行する。

【０２２４】図４４は、ｘ方向のサイズ変動ｆｓｘ及び
ｙ方向のサイズ変動ｆｓｙを固定し、枠の大きさを固定
した場合について、「３」の学習文字に対して生成した
各種枠接触文字の例を示す図である。

【０２２５】図４４（ａ）は、変動の種類が“位置ず
れ”の場合の例であり、変動量がｄｘ＝０、ｄｙ＞０の
場合である。この場合、「３」の文字が枠の下にはみ出
すことになる（下位置変動）。

【０２２６】図４４（ｂ）は、変動の種類が“サイズ変
動”の場合の例であり、変動量がｄｓｘ＝ｆｓｘ，ｄｓ
ｙ＝ｆｓｙの場合である。この場合、「３」の文字が枠
の上下、左右に接触することになり、「３」の外接矩形
が枠に等しくなる。

【０２２７】図４４（ｃ）は、変動の種類が“文字の傾
き変動”の例であり、変動量がｄα＝１０度の場合であ
る。図４４（ｄ）は、変動の種類が“文字枠の傾き変
動”の例であり、変動量がｆα＝−１０度の場合であ
る。

【０２２８】図４４（ｅ）は、変動の種類が“枠幅変
動”の例であり、変動量がｗ＝５の場合である。図４４
（ｆ）は、変動の種類が、“枠の凹凸”の例であり、変
動量ｆδ〔Ｌ］の各要素ｆδ〔ｉ］を制御した場合であ
る。

【０２２９】次に、図４２の枠除去部１６２は、枠接触
文字の自動生成部１６１により生成された枠接触文字か
ら枠のみを抽出し、この枠を除去して得られたかすれ文
字についての画像データを、文字補完部１６３に出力す
る。

【０２３０】文字補完部１６３は、枠除去部１６２によ
って枠が除去された文字の画像データを、ラベルが付与
された文字線分間の距離や方向性等の幾何学的構造を評
価して補完する。図４２は、枠接触文字の自動生成部１
６１により生成された枠接触文字１６９から枠を除去し
た後、文字補完部１６３により補完を行って文字補完パ
ターン１７０を生成した例を示している。

【０２３１】再補完部１６４は、文字補完部１６３によ
って補完しきれなかった領域について、予め、枠接触文
字をラベリングによる連結性を用いて抽出しておき、文
字補完部１６３により補完されたパターンと枠接触文字
の連結性が一致することを検出することにより、枠に平
行な文字線分を補完する。

【０２３２】文字補完部１６３によって補完された文字
補完パターンと再補完部１６４によって補完された再補
完パターンとは、基本文字認識部１６５に入力される。
基本文字認識部１６５は、文字補完部１６３によって補
完された文字補完パターンと再補完部１６４によって補
完された再補完パターンについて、文字認識を実行す
る。そして、各学習文字についての認識結果を枠接触状
態と認識の知識獲得部１６６に出力する。

【０２３３】枠接触状態と認識の知識獲得部１６６は、
基本文字認識部１６５から出力される認識結果を予め与
えられている正解データと比較して、全サンプルデータ
に対する認識率を得る。そして、この認識率を信頼度と
して、また、誤読文字（誤って認識した文字）と正解の
文字との組み合わせを誤読文字対として、知識テーブル
１６７に登録する。なお、上記誤読文字対は、例えば、
文字コードにより登録される。また、枠接触状態と認識
の知識獲得部１６６は、枠と文字の接触状態の特徴を示
すパラメータを抽出して、これも知識テーブル１６７に
登録する。

【０２３４】このようにして、知識テーブル１６７に
は、各文字カテゴリについて、枠と文字の様々な接触状
態におけるその文字に対する認識率が、その誤読文字対
とともに登録される。

【０２３５】図４５は、学習により生成された知識テー
ブル１６７の一例を示す図である。図４５において、知
識テーブル１６７には、例えば、誤読文字対（２、７）
及び信頼度７７％が、“下位置ずれ変動”の変動量ｄｙ
＝５、Ｗ＝５等と共に登録され、変動量が、ｄｙ＝５、
Ｗ＝５の“下位置ずれ”の「２」の枠接触文字の場合、
基本文字認識部１６５は、２３％の確率で、「２」を誤
って「７」と認識してしまうことが示される。すなわ
ち、この場合、基本文字認識部１６５が「７」と認識し
たとしても、その信頼度は７７％であり、実際の文字が
「２」である可能性が２２％ある旨が知識テーブル１６
７を参照することにより判断できる。

【０２３６】同様にして、他の誤読され易い文字対につ
いても、“変動量”、“枠の線幅”、“誤読文字対”及
び信頼度が、枠接触状態と認識の知識獲得部１６６によ
って知識テーブル１６７に登録される。

【０２３７】なお、誤読文字対（Ｌ１、Ｌ２）は、実際
は、文字「Ｌ１」が文字「Ｌ２」に誤って認識されてし
まう場合を示すものである。また、上記文字「Ｌ１」、
「Ｌ２」には、例えば、該当する文字「Ｌ１」、「Ｌ
２」の文字コードが登録される。

【０２３８】知識テーブル１６７には、図４５に示す変
動量ｄｙ＝５，Ｗ＝５の“下位置ずれ変動”以外にも、
図４６に示すように“文字枠に対する文字の傾き変動”
（この場合、左枠接触）などの図４３に示す各種変動に
ついて、各文字カテゴリ毎に登録される。

【０２３９】すなわち、例えば、図４６に示すように、
“下位置ずれ”変動については、例えば、ｄｘ＝「−
３」〜「＋３」、ｄｙ＝５、ｗ＝５、ｄｓｙ＝１、ｄα
＝「−１０」〜「＋１０」、ｆα＝「−１０」〜「＋１
０」が登録される。このように、同じ”下位置ずれ”変
動であっても、知識テーブル１６７に登録される変動量
は、ｘ方向の位置ずれｄｘ、ｙ方向の位置ずれｄｙのみ
でなく、その他の変動量が登録される場合がある。ま
た、“左枠接触の文字枠に対する文字の傾き変動”につ
いては、例えば、ｄｘ＝「−３」〜「＋３」、ｄｙ＝
「−３」〜「＋３」、ｗ＝５，ｄｓｙ＝１，ｄα＝「−
２０」〜「＋２０」、ｆα＝「−１０」〜「＋１０」が
登録される。

【０２４０】また、信頼度が予め定められた所定のしき
い値（例えば、９０％）以下の誤読文字対（Ｌ１，Ｌ
２）について、信頼度がその所定のしきい値以上となる
ような文字認識方法を学習し、学習した文字認識方法を
知識テーブル１６７に登録する。

【０２４１】例えば、図４５に示すように、ｄｙ＝５，
ｗ＝５の”下位置ずれ”の状態の「２」の枠接触文字の
文字認識の信頼度は７７％であり、「７」と誤って認識
される確率が高いので、文字補完部１６３により補完さ
れた文字補完パターンまたは再補完部１６４により補完
された再補完パターンを、例えば、領域強調の手法によ
り再認識すれば認識率が向上することを学習して知識テ
ーブル１６７に登録しておく。

【０２４２】この（２、７）の誤読文字対の場合におけ
る領域強調の手法を図４７を参照しながら説明する。ま
ず、図４７（ａ）に示すように、文字補完部１６３によ
り補完された文字補完パターンまたは再補完部１６４に
より補完された再補完パターンの外接矩形１８０を、縦
の行がｍ個、横の列がｎ個のｍ×ｎ個の分割領域に分割
する。そして、図４７（ｂ）にハッチングで示すよう
に、外接矩形１８０の上半分のｍ／２×ｎ個の領域を特
に強調して、文字認識を再度行う。

【０２４３】すなわち、このｍ／２×ｎ個の領域の特徴
パラメータを抽出して、文字補完部１６３により補完さ
れた文字補完パターンまたは再補完部１６４により補完
された再補完パターンが「２」または「７」のいずれで
あるかを調べる。この領域強調の手法により、認識度が
９５％まで向上する。図４５の知識テーブル１６７に
は、誤読文字対が（２、７）の行に、再認識方法として
「領域強調」を、再認識領域として「ｍ／２×ｎ」を、
さらに再認識信頼度として「９５％」を登録する。

【０２４４】この領域強調の手法は、図４８（ａ）に示
すような枠接触文字の場合にも有効である。図４８
（ａ）は、「２」を表している文字パターンの下部が文
字枠１８２に接触している例である。

【０２４５】この場合、文字補完部１６３により、図４
８（ｂ）に示すような「７」に類似する文字補完パター
ン１８３が得られる。この文字補完パターン１８３に対
して図４８（ｃ）に示す外接矩形１８４を算出する。そ
して、この外接矩形１８４を、図４７に示すように、ｍ
×ｎ個の領域に分割した後、上半分のｍ／２×ｎ個の部
分領域１８５を特に強調して文字認識すれば、文字補完
パターン１８３が「２」と認識される確率が高い、すな
わち、正解率（信頼度）が高くなることを学習し、枠接
触による誤読文字対（２、７）に対する再認識方法とし
て、上記領域強調の手法を知識テーブル１６７に登録す
る。

【０２４６】図４９は、領域強調による文字パターンの
再認識方法を示すフローチャートである。図４９におい
て、まず、ステップＳ６０１に示すように、知識テーブ
ル１６７から信頼度の低い誤読文字対のデータを取り出
す。そして、この誤読文字対の左側に登録されている文
字について、２値の学習データとしての文字パターン
と、文字補完部１６３により補完された文字補完パター
ンまたは再補完部１６４により補完された再補完パター
ンとを入力する。

【０２４７】この文字補完パターンまたは再補完パター
ンは、知識テーブル１６７に登録されている変動量パラ
メータによって規定されるパターンであり、同一カテゴ
リであっても複数の形状のパターンを取りうる。

【０２４８】次に、ステップＳ６０２に示すように、ス
テップＳ６０１で入力された学習データとしての文字パ
ターンと、文字補完部１６３により補完された文字補完
パターンまたは再補完部１６４により補完された再補完
パターンとを、ｍ×ｎの領域に分割する。

【０２４９】そして、ステップＳ６０３に示すように、
このｍ×ｎの領域内のＸ×Ｙの部分パターンについて文
字認識を実行する。そして、この場合の認識率ｚを求め
る。上記Ｘ×Ｙの部分パターンは、再認識領域である。
このとき、Ｘ，Ｙは、それぞれ、ｍ×ｎの領域のＸ方
向、Ｙ方向の長さを表す変数であり、Ｘ≦ｍ，Ｙ≦ｎで
ある。また、上記認識率ｚは、上記Ｘ×Ｙの部分パター
ンを用いて文字認識を行った際の、正解となる確率であ
る。

【０２５０】すなわち、学習データとしての文字パター
ンの部分パターンの文字認識結果を正解とみなす。そし
て、文字補完部１６３により補完された文字補完パター
ンまたは再補完部１６４により補完された再補完パター
ンについての複数の部分パターンに対する文字認識結果
を、学習データとしての文字パターンの部分パターンの
文字認識結果と比較していくことにより、文字補完部１
６３により補完された文字補完パターンまたは再補完部
１６４により補完された再補完パターンについての部分
パターンの認識率ｚを求める。

【０２５１】続いて、ステップＳ６０４に示すように、
認識率ｚが最大認識率ｍａｘよりも大きいか否かを判別
する。この最大認識率ｍａｘは、Ｘ×Ｙの部分パターン
を変化させていった場合における認識率ｚの最大値を記
憶する変数であり、最初はある初期値（例えば、
「０」）が設定される。

【０２５２】そして、認識率ｚが最大認識率ｍａｘより
も大きければ、ステップＳ６０５に進んで、この認識率
ｚを最大認識率ｍａｘに代入し、続いて、ステップＳ６
０６に進んで、長さＸ，Ｙを変更可能か否か調べる。一
方、ステップＳ６０４で、認識率ｚが最大認識率ｍａｘ
以下であれば、直ちに、このステップＳ６０６に移行す
る。

【０２５３】この長さＸ，Ｙの変更操作は、例えば、長
さＸ，Ｙの大きさの変更である。また、Ｘ×Ｙの部分パ
ターンのｍ×ｎの領域内での位置変更操作を含んでいて
もよい。

【０２５４】ステップＳ６０６で、長さＸ，Ｙを変更可
能であると判別すると、ステップＳ６０３に戻り、長さ
Ｘ，Ｙの変更操作を行い、新たなＸ×Ｙの部分パターン
を決定し、この部分パターンに対して文字認識を行う。

【０２５５】以上述べたステップＳ６０３〜Ｓ６０６の
処理を、上記ステップＳ５０６で長さＸ，Ｙを変更でき
ないと判別するまで繰り返す。そして、ステップＳ６０
６で長さＸ，Ｙを変更できないと判別すると、最大識別
率ｍａｘとその最大識別率ｍａｘが得られたＸ×Ｙの部
分パターンを、それぞれ、再認識信頼度、再認識領域と
して知識テーブル１６７に登録する。また、再認識方法
として「領域強調」を知識テーブル１６７に登録する。

【０２５６】なお、図４９のフローチャートは、「領域
強調」の手法を用いて再文字認識の方法を学習する例で
あるが、「領域強調」の手法以外についても、再文字認
識の方法を学習するようにしてもよい。

【０２５７】図５０は、学習により得られた知識テーブ
ル１６７を用いて枠接触文字の文字認識を行う構成を示
すブロック図である。図５０において、枠接触状態の検
出部１９１は、入力された未知の枠接触文字について、
枠と文字との接触状態を検出する。ここでは、図５０
（ａ）の下枠が「２」の下辺と部分的に重なっている枠
接触文字パターン２０１と、図５０（ｂ）の下枠が
「２」の下辺と完全に重なっている枠接触文字パターン
２０３とが入力された例について示している。そして、
枠接触状態の検出部１９１は、枠接触文字パターン２０
１及び枠接触文字パターン２０３を検出する。

【０２５８】枠除去部１９２は、枠接触状態の検出部１
９１により検出された枠接触文字パターンから枠を除去
する。文字補完部１９３は、枠除去部１９２により枠が
除去された文字パターンについて、ラベルが付与された
文字線分間の距離や方向性等の幾何学的構造を評価して
補完する。

【０２５９】再補完部１９４は、文字補完部１９３によ
って補完しきれなかった領域について、予め、枠接触文
字をラベリングによる連結性を用いて抽出しておき、文
字補完部１６３により補完されたパターンと枠接触文字
の連結性が一致することを検出することにより、枠に平
行な文字線分を補完する。ここで、再補完パターン２０
２は、図５０（ａ）の枠接触文字パターン２０１に対
し、再補完部１９４の再補完処理により補完されたパタ
ーンを示し、再補完パターン２０４は、図５０（ｂ）の
枠接触文字パターン２０３に対し、再補完部１９４の再
補完処理により補完することができなかったパターンを
示している。

【０２６０】基本文字認識部１９５は、文字補完部１９
３によって補完された文字補完パターンと再補完部１９
４によって補完された再補完パターンとのそれぞれに対
し、文字認識を実行する。この結果、例えば、図５０
（ａ）の再補完パターン２０２に対しては、「２」の文
字コードが出力され、図５０（ｂ）の再補完パターン２
０４に対しては、「７」の文字コードが出力される。そ
して、その認識結果により得られた文字コードを、枠接
触状態と認識の知識参照部１９６に出力する。

【０２６１】枠接触状態と認識の知識参照部１９６は、
文字補完部１９３によって補完された文字補完パターン
又は再補完部１９４によって補完された再補完パターン
の外接矩形の位置情報及び図５０（ａ）の枠接触文字パ
ターン２０１又は図５０（ｂ）の枠接触文字パターン２
０３から抽出された文字枠の位置情報や幅情報などを基
に、変動の種類を求める。

【０２６２】すなわち、図４３に示されているような”
位置ずれ”、”サイズ変動”、”傾き変動”などの文字
枠に対する文字の変動、または、”傾き変動”、枠幅変
化”、”枠の凹凸”などの文字枠の変動を求める。さら
に、求めた各変動の種類について、変動量ｄｘ，ｄｙ，
ｄｓｘ，ｄｓｙ，ｄα、ｗ，ｆｓｘ，ｆｓｙ，ｆα、ｆ
δを算出する。

【０２６３】次に、算出した変動種類情報及び変動量情
報と、基本文字認識部１９５から入力される文字コード
とをキー項目として、知識テーブル１６７を検索し、こ
のキー項目に一致する変動種類情報、変動量情報及び誤
読文字対を有する行が知識テーブル１６７に登録されて
いるか否か調べる。

【０２６４】そして、キー項目に一致する行が存在した
場合には、この行に登録されている信頼度が所定のしき
い値以上であるか否かを判別し、そのしきい値未満であ
れば、文字補完部１９３によって補完された文字補完パ
ターン又は再補完部１９４によって補完された再補完パ
ターンを再文字認識部１９７に出力し、その行に登録さ
れている再認識方法に従って、文字認識を再度行う。

【０２６５】すなわち、文字補完部１９３によって補完
された文字補完パターン又は再補完部１９４によって補
完された再補完パターン、あるいは未知文字の２値画像
データを用いて、基本文字認識部１９５による手法とは
別の手法で未知画像データに含まれる枠接触文字の再認
識を実行する。そして、再認識により得られた文字コー
ドを出力する。

【０２６６】例えば、基本文字認識部１９５が、再補完
部１９４によって補完された再補完パターン２０４の認
識結果として、「７」の文字コードを出力した場合、枠
接触状態と認識の知識参照部１９６は、再補完パターン
２０４の外接矩形の位置情報と枠接触文字パターン２０
３から抽出した文字枠の位置情報及び幅情報とを基に、
変動の種類及び変動量を求める。この結果、変動の種類
として“下位置ずれ”が算出され、この“下位置ずれ”
の変動量として「ｄｙ＝５」が算出され、文字枠の幅と
して「ｗ＝５」が算出される。

【０２６７】そして、枠接触状態と認識の知識参照部１
９６は、変動の種類として“下位置ずれ”、“下位置ず
れ”の変動量として「ｄｙ＝５」、文字枠の幅として
「ｗ＝５」、及び基本文字認識部１９５から入力された
文字コード「７」をキー項目として、図４５の知識テー
ブル１６７を検索する。この検索の結果、これらのキー
項目に対応する行には誤読文字対（２、７）が登録さ
れ、基本文字認識部１９５で認識された文字コード
「７」の信頼度は７７％であり、２３％の確率で「２」
を「７」と読み間違えていることを知る。

【０２６８】この場合、これらのキー項目に対応する行
に登録されている信頼度は所定のしきい値よりも低いの
で、再文字認識部１９７は、基本文字認識部１９５によ
る手法とは別の手法で未知画像データに含まれる枠接触
文字パターン２０３の再認識を実行する。この際、再文
字認識部１９７は、知識テーブル１６７のキー項目に対
応する行を参照し、再認識方法を特定する。

【０２６９】すなわち、再文字認識部１９７は、再認識
方法として、「領域強調」を行うことを教えられるとと
もに、「領域強調」を行う場合の再認識領域として、再
補完パターン２０４の上半分のｍ／２×ｎの部分領域２
０５だけを強調して再認識することを教えられる。ま
た、この場合の再認識信頼度が９５％であることも教え
られる。

【０２７０】再文字認識部１９７は、知識テーブル１６
７に登録されている再認識方法に従って、再補完パター
ン２０４の上半分の部分領域２０５のみについての再認
識を行う。そして、再補完パターン２０４の部分領域２
０５は、文字コード「２」に対応する文字パターン２０
６の部分領域２０７に９５％の確率で一致し、文字コー
ド「７」に対応する文字パターン２０８の部分領域２０
９に５％の確率で一致することを知り、未知の枠接触文
字パターン２０３の枠に接触した文字の認識結果とし
て、文字コード「２」を出力する。

【０２７１】図５１は、枠接触状態と認識の知識参照部
１９６の動作を示すフローチャートである。図５１にお
いて、まず、ステップＳ１７１に示すように、未知の枠
接触文字パターンから抽出した枠と、枠接触文字パター
ンから分離した文字パターンとに基づいて、文字の枠に
対する変動量を算出し、この変動量をキー項目として知
識テーブル１６７を探索する。そして、この算出された
変動量に一致する変動量を登録している行が知識テーブ
ル１６７に存在するか否かを調べる。

【０２７２】これにより、例えば、下位置ずれ変動とな
っている「２」の文字について、その変動量としてｄｘ
＝５，ｗ＝５が算出されると、図４５に示す知識テーブ
ル１６７の最上位の行が検出される。

【０２７３】そして、変動量が一致する行が存在する場
合、ステップＳ１７２に進み、基本文字認識部１９５か
ら入力される文字コード（文字認識コード）を誤読文字
対に含んでいる行が、変動量が一致する行の中に存在す
るか否かを調べる。

【０２７４】これにより、例えば、下位置ずれ変動とな
っている「２」の文字の場合、図４５に示す知識テーブ
ル１６７の最上位の行が検出される。そして、ステップ
Ｓ１７３に示すように、基本文字認識部１９５から入力
される文字コードを誤読文字対に含んでいる行が、変動
量が一致する行の中に存在する場合、知識テーブル１６
７の該当する行に登録されている再認識信頼度と基本文
字認識部１９５により算出された信頼度とを比較し、知
識テーブル１６７の該当する行に登録されている再認識
信頼度が基本文字認識部１９５により算出された信頼度
よりも大きいか否か判別する。

【０２７５】これにより、例えば、下位置ずれ変動とな
っている「２」の文字の場合、図４５に示す知識テーブ
ル１６７の最上位の行に登録されている再認識信頼度及
び基本文字認識部１９５により算出された信頼度が、そ
れぞれ、「９５％」及び「７７％」であり、知識テーブ
ル１６７の該当する行に登録されている再認識信頼度が
基本文字認識部１９５により算出された信頼度よりも大
きいと判別される。

【０２７６】知識テーブル１６７の該当する行に登録さ
れている再認識信頼度が基本文字認識部１９５により算
出された信頼度よりも大きい場合、ステップＳ１７４に
進み、知識テーブル１６７の該当する行に登録されてい
る再認識信頼度が予め定められたしきい値ｔｈ１よりも
大きいか否かを判別し、しきい値ｔｈ１よりも大きけ
ば、ステップＳ１７５に進み、知識テーブル１６７のス
テップＳ１７２で検出した行に登録されている「再認識
方法」及び「再認識領域」を参照する。

【０２７７】次に、ステップＳ１７６に示すように、文
字補完部１９３によって補完された文字補完パターン又
は再補完部１９４によって補完された再補完パターンか
ら、知識テーブル１６７で示される「再認識領域」を切
り出し、この切り出した領域について、知識テーブル１
６７で示される「再認識方法」により文字認識を実行す
る。そして、その文字認識により得られた文字コードを
出力する。

【０２７８】これにより、例えば、しきい値ｔｈ１が
「９５％」よりも小さい場合、基本文字認識部１９５に
より入力される下位置ずれ変動となっている「２」の文
字の補完パターンについて、上半分の「ｍ／２×ｎ」の
領域を用いた「領域強調」手法により、文字認識が再度
実行され、最終的に「２」の文字コードが出力される。

【０２７９】なお、枠接触文字の認識方法については、
例えば、特願平７−２０５５６４号の明細書及び図面に
記載されている。次に、図３の文字列認識部１５の一実
施例について説明する。

【０２８０】この文字列認識部１５は、図４のステップ
Ｓ２のレイアウト解析により抽出された文字列に対し、
この文字列から文字を一文字ずつ切り出す際に用いる特
性値としてのパラメータについて、文字の統合判定を行
うの際の閾値をヒューリスティクに決定するのではな
く、統計的に妥当な値を設定するようにしたものであ
る。

【０２８１】具体的には、各パラメータ毎に、パラメー
タ値とそのパラメータ値に対する文字の統合の成功又は
失敗に関する統計データをとる。そして、各パラメータ
を個別に評価するのではなく、全てのパラメータを多次
元空間上の１点として捉え、多変量解析の手法を用い
て、統合が成功した場合と統合が失敗した場合との２群
を分離する判別面を上記多次元空間内で求めるようにす
る。

【０２８２】すなわち、パターンの特徴を示すＰ個の特
性値からなるサンプルデータを、切り出し成功を示す第
１の群と切り出し失敗を示す第２の群とに分類し、第１
の群と第２の群との判別面をＰ次元空間において生成す
るものである。

【０２８３】この判別面は、例えば、判別分析法により
求めることができる。すなわち、判別面を線形な判別関
数により構成する場合、その判別関数の係数ベクトル
は、 Σ^-1（μ₁−μ₂）・・・（３）で与えられる。

【０２８４】ここで、 Σ ：第１の群及び第２の群の母分散共分散行列、 μ₁：第１の群の母平均ベクトル、 μ₂：第２の群の母平均ベクトル、である。

【０２８５】（３）式の係数ベクトルを有する判別関数
は、前記第１の群と前記第２の群の各重心から等距離と
なるように構成される。なお、この判別関数の係数ベク
トルは、第１の群と第２の群との間の群間変動の群内変
動に対する比を最大にするという基準に基づいて、算出
することもできる。

【０２８６】また、文字列から文字を切り出す処理は、
パターンの外接矩形の位置、サイズ、並びなどからパタ
ーン同士を統合していく統計的処理と、文字列中の濁
点、分離文字などを処理するためにパターン形状に着目
する非統計的処理に分けて実行する。

【０２８７】統計的処理では、パターンの外接矩形の位
置、縦横比、平均文字サイズに対するサイズ比、隣接す
るパターン同士の距離、統合したときのサイズ、パター
ン同士の重なり幅、文字列の粗密度などを切り出しパラ
メータとして用いる。

【０２８８】例えば、図５２に示すように、１）外接矩形２１１の右枠と外接矩形２１２の左枠との
距離ａ、２）外接矩形２１１の左枠と外接矩形２１２の右枠との
距離ｂ、３）外接矩形２１１の右枠と外接矩形２１２の左枠との
距離ａと外接矩形２１１の左枠と外接矩形２１２の右枠
との距離ｂとの比ｃ、４）外接矩形２１１の左枠と外接矩形２１２の右枠との
距離ｂと外接矩形平均幅ＭＸとの比ｄ、５）外接矩形２１３の下枠と外接矩形２１３の下枠の中
点から外接矩形２１４の下枠の中点とを結ぶ直線とのな
す角度ｅ、６）外接矩形２１３の下枠と外接矩形２１３の右下の頂
点から外接矩形２１４の左下の頂点とを結ぶ直線とのな
す角度ｆ、７）外接矩形２１５と外接矩形２１６とが重なっている
場合、外接矩形２１５の右枠と外接矩形２１６の左枠と
の距離ｐと外接矩形２１５の左枠と外接矩形２１６の右
枠との距離ｑとの比ｇ、を切り出しパラメータとして用
いる。

【０２８９】すなわち、ｃ＝ａ／ｂ・・・（４）ｄ＝ｂ／ＭＸ・・・（５）ｇ＝ｐ／ｑ・・・（６）である。

【０２９０】次に、統計的処理を図５３のフローチャー
トを参照しながら説明する。まず、ステップＳ１８１に
示すように、連結パターンの外接矩形を取り出す。次
に、ステップＳ１８２に示すように、ステップＳ１８１
で取り出した外接矩形の右隣に他の外接矩形があるかど
うか調べる。そして、ステップＳ１８１で取り出した外
接矩形の右隣に他の外接矩形がない場合、ステップＳ１
８１で取り出した外接矩形を統計的処理の対象から除外
する。

【０２９１】一方、ステップＳ１８２において、ステッ
プＳ１８１で取り出した外接矩形の右隣に他の外接矩形
があると判断された場合、ステップＳ１８４に進む。ま
た、ステップＳ１８３に示すように、文字列の外接矩形
の平均文字サイズを算出する。ここで、文字列の外接矩
形の平均文字サイズを算出する場合、１文字ごとの切り
出しがまだ行われていないので、厳密には、正確な平均
文字サイズを算出することができない。

【０２９２】そこで、例えば、連結パターンの外接矩形
を仮統合することにより、暫定的に平均文字サイズを算
出する。仮統合の方法として、近接する連結パターンを
統合した際の縦横比Ｐが、例えば、Ｎ（＝０．８）＜Ｐ＜Ｍ（＝１．２）を満たす場合、仮統合を行う。そして、仮統合を行った
後の平均文字サイズを算出する。なお、文字列の外接矩
形の平均文字サイズは、外接矩形のサイズ別の頻度ヒス
トグラムを生成して求めるようにしてもよい。

【０２９３】次に、ステップＳ１８４に示すように、図
５２のパラメータａ〜ｇを算出する。非統計的処理で
は、文字列中の濁点や分離文字などを対象にしており、
分離文字処理と濁点処理とに分ける。

【０２９４】分離文字に対する処理では、パターンの傾
き、線密度、隣接するパターン同士を統合したときのサ
イズ、パターン同士の距離を切り出しパラメータとして
用いる。

【０２９５】例えば、図５４に示すように、８）外接矩形２２１の右枠と外接矩形２２２の左枠との
距離ａと外接矩形２２１の左枠と外接矩形２２２の右枠
との距離ｂとの比ｐ、９）外接矩形２２１の左枠と外接矩形２２２の右枠との
距離ｂと外接矩形平均幅ＭＸとの比ｑ、１０）外接矩形２１の面積ｃと外接矩形２２の面積ｄと
の積と外接矩形平均幅ＭＸと外接矩形平均高さＭＹとの
積の平方との比ｒ、を切り出しパラメータとして用い
る。

【０２９６】すなわち、ｐ＝ａ／ｂ・・・（７）ｑ＝ｂ／ＭＸ・・・（８）ｒ＝（ｃ×ｄ）／（ＭＸ×ＭＹ）² ・・・（９）である。

【０２９７】次に、分離文字処理を図５５のフローチャ
ートを参照しながら説明する。この分離文字処理は、例
えば、“ハ”又は“ル”などのように２つ以上の連結パ
ターンから構成される分離文字を検出するものである。

【０２９８】まず、ステップＳ１９１に示すように、連
結パターンのうち、右上がりとなっているパターンがあ
るかどうか判断する。そして、右上がりとなっているパ
ターンがない場合、分離文字処理の対象から除外する。

【０２９９】一方、ステップＳ１９１において、右上が
りとなっているパターンであると判断された場合、ステ
ップＳ１９２に進み、右上がりとなっているパターンの
右隣に隣接し、且つ右下がりとなっているパターン、す
なわち、例えば、“ハ”に対応するパターン、又は、右
上がりとなっているパターンの右隣に隣接し、且つ直角
方向に探索した場合のパターンと交差する回数（直角線
密度）が２となるパターン、すなわち、例えば、“ル”
に対応するパターンがあるかどうか判断する。そして、
これらの“ハ”又は“ル”などのような形状のパターン
でなければ、分離文字処理の対象から除外する。

【０３００】一方、ステップＳ１９２において、“ハ”
又は“ル”などのような形状のパターンであると判断し
た場合、ステップＳ１９４に進む。また、上記ステップ
Ｓ１９１、Ｓ１９２とは別に、ステップＳ１９３で、文
字列の外接矩形の平均文字サイズを算出する。

【０３０１】上記ステップＳ１９２とＳ１９３が終了し
た後、ステップＳ１９４で、図５４に示されたパラメー
タｐ〜ｒの値を算出する。また、濁点処理では、濁点候
補パターンに着目し、例えば、そのパターンとその隣接
パターンを統合したときのサイズ、両パターン間の距
離、及びそれらと平均文字サイズとの比を、切り出しパ
ラメータとして用いる。

【０３０２】すなわち、図５６に示すように、１１）外接矩形２３１の右枠と外接矩形２３２の左枠と
の距離ａと外接矩形２３１の左枠と外接矩形２３２の右
枠との距離ｂとの比ｐ、１２）外接矩形２３１の左枠と外接矩形２３２の右枠と
の距離ｂと外接矩形平均幅ＭＸとの比ｑ、１３）外接矩形２３１の面積ｃと外接矩形２３２の面積
ｄとの積と外接矩形平均幅ＭＸと外接矩形平均高さＭＹ
との積の平方との比ｒを、切り出しパラメータとして用
いる。

【０３０３】すなわち、パラメータｐ〜ｒは、（７）〜
（９）式と同様に表すことができる。次に、濁点処理を
図５７のフローチャートを参照しながら、説明する。

【０３０４】まず、ステップＳ２０１で、濁点候補とな
るパターンを抽出する。すなわち、例えば、連結パター
ン抽出手段１により抽出された連結パターンが２つ隣接
して存在する場合で、且つそれらを統合した時のサイズ
と文字列の外接矩形の平均文字サイズとの比が所定のし
きい値以下、例えば、１／４以下である場合、濁点候補
となるパターンとして抽出する。

【０３０５】次に、ステップＳ２０２に示すように、濁
点候補となるパターンの左隣に隣接する外接矩形がある
かどうかを調べる。そして、濁点候補となるパターンの
左隣に隣接する外接矩形がない場合、濁点候補となるパ
ターンを濁点処理の対象から除外する。

【０３０６】一方、ステップＳ２０２において、濁点候
補となるパターンの左隣に隣接する外接矩形があると判
断された場合、ステップＳ２０４に進む。また、上記ス
テップＳ２０１、Ｓ２０２とは別に、ステップＳ２０３
で、文字列の外接矩形の平均文字サイズを算出する。そ
して、上記ステップＳ２０２、Ｓ２０３の処理が終了し
た後、ステップＳ２０４で、図５６に示されたパラメー
タｐ〜ｒの値を算出する。

【０３０７】次に、学習データを用いて、未知の手書き
文字列に対する文字の切り出しの信頼度を算出するため
の判別面を設定し、パラメータ数がｎの場合、切り出し
が成功した群と切り出しが失敗した群との２群をｎ次元
の空間上に生成する。

【０３０８】図５８は、切り出しの成否データの算出方
法を示すフローチャートである。図５８において、ま
ず、ステップＳ２１１で、事前に集めた学習データに対
して、着目する外接矩形とそれに隣接する外接矩形とを
統合して１文字になるかどうかを目視により判断する。
そして、着目する外接矩形とそれに隣接する外接矩形と
を統合して１文字になる場合、ステップＳ２１２に進
み、着目する外接矩形とそれに隣接する外接矩形とを統
合して１文字にならない場合、ステップＳ２１３に進
む。

【０３０９】ステップＳ２１２では、着目する外接矩形
とそれに隣接する外接矩形とを統合して１文字になる統
合成功の場合について、その着目する外接矩形とそれに
隣接する外接矩形におけるパラメータの値を記録する。
ここで、着目する外接矩形とそれに隣接する外接矩形に
おけるパラメータは、統計的処理の場合、図４８のパラ
メータａ〜ｇを用いることができ、非統計的処理の場
合、図５４、５６のパラメータｐ〜ｒを用いることがで
きる。

【０３１０】また、ステップＳ２１３では、着目する外
接矩形とそれに隣接する外接矩形とを統合して１文字に
ならない統合失敗の場合について、その着目する外接矩
形とそれに隣接する外接矩形におけるパラメータの値を
記録する。

【０３１１】次に、未知の文字列について、統計的処理
における切り出しパラメータと非統計的処理における切
り出しパラメータの値を算出し、このパラメータの値に
よって定まる多次元空間上の点に対し、学習データによ
り得られている判別面からの距離を求め、これを切り出
しの信頼度として定量化する。

【０３１２】例えば、特徴量パラメータ数が３の場合、
図５９に示すように、切り出し成功と切り出し失敗との
２群を判別する判別面をＨ、判別面Ｈの単位法線ベクト
ルをｎとし、あるパラメータの値がｐのベクトル値をと
るとき、そのパラメータの値に対応する３次元空間内の
点ｐの判別面からの距離ｈは、ｈ＝ＯＰ・ｎ・・・（１０）と表される。ここで、ＯＰは、３次元空間内の原点Ｏか
ら３次元空間内の点ｐに向けたベクトルである。

【０３１３】そして、判別面Ｈからの距離ｈが正をとる
か負をとるかで、パラメータの値がどちらの群、すなわ
ち、切り出しが成功した方の群または切り出しが失敗し
た方の群のいづれの群に属するか、また、パラメータの
値が判別面Ｈからどの程度離れているかが分かる。

【０３１４】次に、図６０に示すように、多次元空間内
の学習データの全パラメータに対して、判別面Ｈからの
距離ｈに基づいて、切り出し成功のヒストグラム分布２
４１と切り出し失敗のヒストグラム分布２４２をとる。
一般的に、このヒストグラム分布２４１、２４２は正規
分布になるので、ヒストグラム分布２４１、２４２を正
規分布で近似する。これらの正規分布は、通常、部分的
に重なる領域が生ずる。

【０３１５】本実施例では、この重なる領域に位置する
切り出しパラメータを有する隣接パターンについての切
り出しの信頼度に加え、文字認識の信頼度を加味してそ
れらを統合するか否かを判定する。

【０３１６】図６１は、切り出し信頼度の算出法の一例
を示すフローチャートである。図６１において、まず、
ステップＳ２２１に示すように、複数のパラメータの値
によって定まる多次元空間上の点に対する判別面Ｈから
の距離ｈを、前記（１０）式により算出する。

【０３１７】次に、ステップＳ２２２に示すように、学
習データにより得られた複数のパラメータの値のヒスト
グラム分布を正規分布で近似する。すなわち、例えば、
図６２に示すように、切り出し成功のヒストグラム分布
を正規分布２５１で近似し、切り出し失敗のヒストグラ
ム分布を正規分布２５２で近似する。

【０３１８】次に、ステップＳ２２３で、２群の重なり
領域を算出する。例えば、図６２に示すように、切り出
し成功の正規分布２５１と切り出し失敗の正規分布２５
２とが重なる領域を２群の重なり領域２５４として算出
する。また、このとき、切り出し成功の正規分布２５１
の内、上記２群の重なり領域２５４以外の領域２５３を
切り出し成功領域と設定する。さらに、切り出し失敗の
正規分布２５２の内、上記２群の重なり領域２５４以外
の領域２５５を切り出し失敗領域と設定する。

【０３１９】次に、ステップＳ２２４に示すように、未
知文字についての入力パラメータの値のヒストグラム分
布上での位置を判定する。次に、ステップＳ２２５に示
すように、未知文字についての入力パラメータの値のヒ
ストグラム分布上での位置を判定した結果、未知文字に
ついての入力パラメータの値が２群の重なり領域２５４
に含まれる場合、ステップＳ２２６に進む。そして、２
群の重なり領域２５４での未知文字についての入力パラ
メータの値の位置に基づいて、切り出し信頼度を算出す
る。

【０３２０】一方、ステップＳ２２５において、未知文
字についての入力パラメータの値が２群の重なり領域２
５４に含まれないと判断された場合、ステップＳ２２６
に進み、未知文字についての入力パラメータの値が切り
出し成功領域２５３に含まれるかどうかを判断する。

【０３２１】そして、未知文字についての入力パラメー
タの値が切り出し成功領域２５３に含まれると判断され
た場合、ステップＳ２２８に進み、切り出し信頼度を
“１”とし、未知文字についての入力パラメータの値が
切り出し成功領域２５３に含まれないと判断された場
合、ステップＳ２２９に進み、切り出し信頼度を“０”
とする。

【０３２２】例えば、図６２において、未知文字につい
ての入力パラメータの値に対する判別面からの距離を算
出した結果、未知文字についての入力パラメータの値の
判別面からの距離が重なり領域２５４に含まれる場合、
未知文字についての入力パラメータの値の判別面からの
距離に基づいて、切り出し信頼度を算出する。また、未
知文字についての入力パラメータの値の判別面からの距
離が切り出し成功領域２５３に含まれる場合、その切り
出し信頼度を“１”とする。また、未知文字についての
入力パラメータの値の判別面からの距離が切り出し失敗
領域２５５に含まれる場合、その切り出し信頼度を
“０”に設定する。

【０３２３】図６３は、２群の重なり領域算出方法の一
例を示すフローチャートである。図６３において、ま
ず、ステップＳ２３１に示すように、学習データから得
られた切り出し成功のヒストグラム分布と切り出し失敗
のヒストグラム分布のそれぞれについて、ヒストグラム
２６１の平均値ｍと分散値ｖとを算出する。

【０３２４】次に、ステップＳ２３２で、切り出し成功
のヒストグラム分布と切り出し失敗のヒストグラム分布
について、正規分布曲線２６２とヒストグラム２６１と
の２乗誤差の総和ｄを算出する。

【０３２５】次に、ステップＳ２３３で、適合度Ｔを下
記の（１１）式により算出する。Ｔ＝ｄ／Ｓ・・・（１１）ここで、Ｓは正規分布曲線２６２の面積である。

【０３２６】次に、ステップＳ２３４で、正規分布曲線
２６２の中心から端までの距離Ｌを下記の（１２）式に
より算出する。Ｌ＝ｋ×（１＋Ｔ）×ｖ^1/2 ・・・（１２）ここで、ｋは比例定数である。また、ｖ^1/2は、標準偏
差に等しい。

【０３２７】次に、ステップＳ２３５で、正規分布曲線
２６３の右端２６７から正規分布曲線２６４の左端２６
６までの間の領域を、２群の重なり領域２６５として設
定する。

【０３２８】次に、切り出し文字の候補に対し、図６１
の処理により求めた切り出し信頼度に基づいて認識処理
を行うかどうかを決定する。この場合、例えば、切り出
し信頼度が高い切り出し文字の候補に対しては認識処理
を行わず、切り出し信頼度が低い切り出し文字の候補に
対してのみ認識処理を行うようにする。

【０３２９】ここで、複数の切り出し文字の候補に対し
て、それらに対する認識の信頼度だけでなく、切り出し
の信頼度も考慮して切り出し文字を決定する。このこと
により、部分的に見ると文字のように見えるが、文字列
全体から見ると間違っているような候補文字を、切り出
し文字から除外することができる。例えば、各隣接パタ
ーンまたは切り出し確定部の切り出し信頼度をα_i、認
識信頼度をβ_i、重み係数をｊとすると、全体の信頼度
Ｒは、Ｒ＝Σ（ｊ・α_i＋β_i）・・・（１３）と表せる。

【０３３０】そして、複数の切り出し文字の候補の中か
ら全体の信頼度Ｒが最も大きいものを、最終的な切り出
し文字として選択する。図６４は、“グンマ”という文
字列から文字を１文字ずつ切り出す場合を示す図であ
る。ここで、“グンマ”という文字列の切り出しを行う
のに先立ち、学習データを用いて、統計的処理と非統計
的処理とに対する判別面とヒストグラム値の正規分布曲
線を、それぞれ、個別に求める。

【０３３１】ここで、統計的処理では、文字列の切り出
しの成功又は失敗を判定するためのパラメータとして、
図５２のパラメータｃ、ｅ、ｆを用い、学習データによ
り得られた判別面の式は、０．８４ｘ０＋０．４３ｘ１＋０．３３ｘ２−１４５．２５＝０・・（１４）であるものとする。

【０３３２】また、図６３に示す学習データの切り出し
成功を示すヒストグラム分布の平均値ｍは１２８．９４
２、標準偏差は３４．７７となり、適合度Ｔは（１１）
式より０．１２となる。また、比例定数ｋを２とする
と、分布中心から端までの距離Ｌは（１２）式より７
７．８となる。

【０３３３】また、図６３に示す学習データの切り出し
失敗を示すヒストグラム分布の平均値ｍは７１．１２
９、標準偏差は３６．２６となり、適合度Ｔは（１１）
式より０．３５となる。また、比例定数ｋを２とする
と、分布中心から端までの距離Ｌは（１０）式より９
２．２となる。

【０３３４】図６４において、まず、ステップＳ２４１
に示すように、イメージ入力により未知文字についての
入力パターンを読み込む。次に、ステップＳ２４２で、
ラベリングにより連結パターンを抽出し、抽出された各
連結パターンに対して図６４に示すようにラベル番号
〜を付す。

【０３３５】次に、ステップＳ２４５に示すように、ス
テップＳ２４３の統計的処理及びステップＳ２４４の非
統計的処理に基づいて、切り出し信頼度の定量化を行
う。ステップＳ２４３の統計的処理では、互いに隣接す
る連結パターンを統合した場合の切り出し信頼度を、パ
ラメータｃ、ｅ、ｆの値を有する３次元空間上の点に対
する判別面からの距離ｈに基づいて算出する。この切り
出し信頼度αは、例えば、 α＝（ｈ−ｗ₁）／（ｗ₂−ｗ₁）×１００・・・（１５）で表すことができる。

【０３３６】ここで、ｗ₁：２群の重なり領域の左端の位置ｗ₂：２群の重なり領域の右端の位置である。

【０３３７】例えば、ラベル番号のパターンとラベル
番号のパターンとを統合した場合の切り出し信頼度は
８０、ラベル番号のパターンとラベル番号のパター
ンとを統合した場合の切り出し信頼度は１２、ラベル番
号のパターンとラベル番号のパターンとを統合した
場合の切り出し信頼度は２８、ラベル番号のパターン
とラベル番号のパターンとを統合した場合の切り出し
信頼度は９２、ラベル番号のパターンとラベル番号
のパターンとを統合した場合の切り出し信頼度は５とな
る。

【０３３８】また、ステップＳ２４４の非統計的処理で
は、濁点候補を有するパターン“グ”についての切り出
し信頼度を、図５６のパラメータｐ〜ｒの値を有する３
次元空間上の点に対する判別面からの距離ｈに基づいて
算出する。

【０３３９】例えば、ラベル番号のパターンと、ラベ
ル番号のパターン及びラベル番号のパターンからな
る切り出し確定部２７１の濁点パターンとを統合した場
合の切り出し信頼度は８５となる。

【０３４０】このステップＳ２４４の非統計的処理にお
ける切り出し信頼度の算出方法を図６５に示す。まず、
ステップＳ２５１で、濁点候補となるパターン２７２を
抽出する。例えば、連結パターンが２つ隣接して存在す
る場合で、且つ、それらを統合した時のサイズと文字列
の外接矩形の平均文字サイズとの比が所定のしきい値以
下である場合、濁点候補となるパターンとする。

【０３４１】次に、ステップＳ２５２で、濁点候補とな
るパターン２７２の左隣に隣接する外接矩形２８１があ
るかどうかを調べ、この場合、濁点候補となるパターン
２７２の左隣に隣接する外接矩形２８１があると判断さ
れた結果、ステップＳ２５３に進み、図５６のパラメー
タｐ〜ｒの値を算出する。

【０３４２】図６５の例では、ｐ＝ａ／ｂ＝０．１・・・（１６）ｑ＝ｂ／ＭＸ＝１．３・・・（１７）ｒ＝（ｃ×ｄ）／（ＭＸ×ＭＹ）²＝０．３・・・（１８）となる。

【０３４３】ここで、ａ：外接矩形２８１の右枠と外接矩形２７２の左枠との
距離ｂ：外接矩形２８１の左枠と外接矩形２７２の右枠との
距離ｃ：外接矩形２８１の面積ｄ：外接矩形２７２の面積ＭＸ：外接矩形平均幅ＭＹ：外接矩形平均高さである次に、ステップＳ２５４に示すように、パラメータｐ〜
ｒの値を有する３次元空間上の点に対する判別面２９３
からの距離を算出する。

【０３４４】このパラメータｐ〜ｒの値を有する３次元
空間上の点に対する判別面２９３からの距離を算出する
ために、学習パターンに基づいて判別面２９３を算出し
ておく。この判別面２９３は、例えば、学習パターンの
文字列の切り出しの成功を示すヒストグラム分布２９２
及び失敗を示すヒストグラム分布２９１に基づいて、
（３）式により求めることができ、濁点抽出のパラメー
タｐ〜ｒを用いた場合の判別面２９３の式は、例えば、０．１７ｘ０＋０．７５ｘ１＋０．６４ｘ２＋３０．４＝０・・（１９）で表され、３次元空間内の平面の方程式となる。

【０３４５】従って、判別面２９３からの距離ｈは、
（１６）〜（１８）の値を（１９）式に代入して、ｈ＝０．１７×０．１−０．７５×１．３＋０．６４×０．３＋３０．４＝２９．６・・・（２０）となる。

【０３４６】また、学習データの切り出し成功を示すヒ
ストグラム分布２９２の平均値ｍは３８、標準偏差は２
５となり、適合度Ｔは（１１）式より０．２となり、学
習データの切り出し失敗を示すヒストグラム分布２９１
の平均値ｍは−３４、標準偏差は２８となり、適合度Ｔ
は（１１）式より０．３となる。

【０３４７】また、学習データの切り出し成功を示すヒ
ストグラム分布２９２の左端ｗ₁は、比例定数ｋを２と
すると、（１２）式より、ｗ₁＝３８−２×（１＋０．２）×２５＝−２２・・・（２１）となる。

【０３４８】また、学習データの切り出し失敗を示すヒ
ストグラム分布２９１の右端ｗ₂は、比例定数ｋを２と
すると、（１２）式より、ｗ₂＝−３４＋２×（１＋０．３）×２８＝３８．８・・・（２２）となる。

【０３４９】従って、２群の重なり領域２９４は、判別
面からの距離が−２２〜３８．８の間の領域となる。次
に、ステップＳ２５５で、切り出し信頼度αを求める。
この切り出し信頼度αは、（２０）〜（２２）の値を
（１５）式に代入して、 α＝（２９．６−（−２２））／（３８．８−（−２２））×１００＝８５・・・（２３）となる。

【０３５０】これにより、ラベル番号とラベル番号
とが統合されて切り出し確定部２７１となる。次に、図
６４のステップＳ２４６で、統計的処理と非統計的処理
の信頼度を合成する。このとき、切り出し確定部があれ
ば、それを優先する。従って、切り出し確定部２７１の
信頼度が優先して合成される。

【０３５１】この結果、ラベル番号のパターンと切り
出し確定部２７１のパターンとを統合した場合の切り出
し信頼度は８５、切り出し確定部２７１のパターンとラ
ベル番号のパターンとを統合した場合の切り出し信頼
度は３０、ラベル番号のパターンとラベル番号のパ
ターンとを統合した場合の切り出し信頼度は９２、ラベ
ル番号のパターンとラベル番号のパターンとを統合
した場合の切り出し信頼度は５となる。

【０３５２】そして、例えば、切り出し信頼度が所定の
しきい値（例えば、９０）より大きいか又は、切り出し
信頼度が所定のしきい値（例えば、７０）より大きく且
つ、その隣の切り出しパターンの切り出し信頼度との比
が所定の値（例えば、５）より大きい場合、パターンの
統合を行う。

【０３５３】また、切り出し信頼度が所定のしきい値
（例えば、８）より小さい場合、パターンの統合を行わ
ない。例えば、ラベル番号のパターンと切り出し確定
部２７１のパターンとを統合した場合の切り出し信頼度
は８５で、その隣のラベル番号のパターンに対する切
り出し信頼度の比は、８５／３０＝２．８であるので、
ラベル番号のパターンと切り出し確定部２７１のパタ
ーンとを統合しない。また、切り出し確定部２７１のパ
ターンとラベル番号のパターンとを統合した場合の切
り出し信頼度は３０であり、切り出し確定部２７１のパ
ターンとラベル番号のパターンとを統合しない。

【０３５４】また、ラベル番号のパターンとラベル番
号のパターンとを統合した場合の切り出し信頼度は９
２であるので、ラベル番号のパターンとラベル番号
のパターンとを統合する。また、ラベル番号のパター
ンとラベル番号のパターンとを統合した場合の切り出
し信頼度は５であり、ラベル番号のパターンとラベル
番号のパターンとを統合しない。

【０３５５】これにより、ラベル番号のパターンとラ
ベル番号のパターンとを統合した切り出し確定部２７
３に対応する外接矩形２７５、ラベル番号のパターン
に対応する外接矩形２７６が生成される。

【０３５６】また、新たに生成された切り出し確定部２
７３のパターンと切り出し確定部２７１のパターンとを
統合した場合の切り出し信頼度を求める。この切り出し
信頼度は、図６４の例では、６０となる。

【０３５７】次に、ステップＳ２４７に示すように、切
り出し信頼度によるパターンの統合が終了した時点で、
切り出し候補１及び切り出し候補２を抽出する。そし
て、切り出し候補１及び切り出し候補２のそれぞれの文
字に対して認識処理を行い、切り出し候補１及び切り出
し候補２における文字内の切り出し信頼度αと認識信頼
度βとをそれぞれの文字について求め、切り出し信頼度
αと認識信頼度βとの総和をとったものを全体の信頼度
Ｒとする。

【０３５８】例えば、切り出し候補１として、外接矩形
２７５、２７６、２７８を切り出した場合、外接矩形２
７８内のパターンに対して文字認識を行った場合の認識
信頼度βは８０となり、外接矩形２７５内のパターンに
対して文字認識を行った場合の認識信頼度βは９０とな
り、外接矩形２７６内のパターンに対して文字認識を行
った場合の認識信頼度βは８５となる。

【０３５９】また、ラベル番号のパターンと切り出し
確定部２７１のパターンとを統合した場合の切り出し信
頼度αは８５であるので、全体の信頼度Ｒは、重み係数
ｊを１とすると、（１３）式により、３４５となる。

【０３６０】また、切り出し候補２として、外接矩形２
７６、２８１、２８２を切り出した場合、外接矩形２８
１内のパターンに対して文字認識を行った場合の認識信
頼度βは８３となり、外接矩形２８２内のパターンに対
して文字認識を行った場合の認識信頼度βは５５とな
り、外接矩形２７６内のパターンに対して文字認識を行
った場合の認識信頼度βは８５となる。

【０３６１】また、切り出し確定部２７１のパターンと
切り出し確定部２７３のパターンとを統合した場合の切
り出し信頼度αは６０であり、全体の信頼度Ｒは２８３
となる。

【０３６２】次に、ステップＳ２４８で、切り出し候補
１又は切り出し候補２のうち、全体の信頼度Ｒが大きい
方の切り出し候補１を切り出し成功の文字候補として選
択する。この結果、“グンマ”という文字列から、
“グ”、“ン”、“マ”の各文字を１文字ずつ正しく切
り出すことができる。

【０３６３】なお、文字列からの切り出し信頼度を考慮
しながら文字の認識処理を行う方法については、例え
ば、特願平７−２３４９８２号の明細書及び図面に記載
されている。

【０３６４】次に、図３のかすれ文字認識部１９の動作
について具体的に説明する。図６６は、かすれ文字認識
部１９の構成の一実施例を示すブロック図である。図６
６において、特徴抽出部３０１は、かすれ文字パターン
から文字の特徴を抽出し、この抽出した特徴を特徴ベク
トルにより表す。一方、かすれ辞書３０２には、かすれ
文字についての各カテゴリの特徴ベクトルが格納されて
いる。そして、照合部３０３は、特徴抽出部３０１によ
り抽出した文字パターンの特徴ベクトルを、かすれ辞書
３０２に格納されている各カテゴリの特徴ベクトルと照
合し、特徴空間上での特徴ベクトル間の距離Ｄ_ij（ｉは
未知文字の特徴ベクトル、ｊはかすれ辞書３０２のカテ
ゴリの特徴ベクトル）を算出する。その結果、特徴ベク
トル間の距離Ｄ_ijを最小とするカテゴリｊを未知文字ｉ
として認識する。

【０３６５】ここで、特徴空間上での特徴ベクトル間の
距離Ｄ_ijは、例えば、ユークリッド距離Σ（ｉ−
ｊ）²、シティブロック距離Σ｜ｉ−ｊ｜、又は判別関
数などの識別関数を用いて算出する。

【０３６６】なお、第１位のカテゴリとの距離を
Ｄ_ij1、第２位のカテゴリとの距離をＤ_ij ₂とすると、
第１位のカテゴリｊ１、第２位のカテゴリｊ２、カテゴ
リ間の距離（Ｄ_ij2−Ｄ_ij1）及び信頼度に関するテー
ブル１を予め作成しておく。また、第１位のカテゴリと
の距離をＤ_ij1、第１位のカテゴリｊ１及び信頼度に関
するテーブル２も予め作成しておく。そして、テーブル
１とテーブル２とからそれぞれ得られる信頼度の小さい
方を中間処理結果テーブルに格納する。

【０３６７】図３のつぶれ文字認識部２１は、かすれ文
字認識部１９のかすれ辞書３０２の代わりに、つぶれ文
字についての各カテゴリの特徴ベクトルを格納したつぶ
れ辞書を用いることを除いて、かすれ文字認識部１９と
同様の構成とすることができる。

【０３６８】次に、図３の消し線認識部２６の一実施例
について説明する。この消し線認識部２６は、図４のス
テップＳ４の訂正解析により抽出された訂正文字の候補
に対し、例えば、横方向の画素数の和をとったヒストグ
ラムを作成し、このヒストグラム値が所定の値を越えた
領域に横消し線が存在するものとして、この領域に存在
している横線を除去する。

【０３６９】次に、この横線を除去することによりかす
れた部分を補完し、この補完後のパターンについて辞書
照合を行うことにより、文字認識を行う。この結果、文
字と認識されたものについては、訂正文字の候補を消し
線付き文字とみなし、リジェクトされたものについて
は、訂正文字の候補を通常文字とみなす。

【０３７０】例えば、図６７において、訂正文字の候補
として、横二重線により訂正された状態の「５」が入力
され、この横二重線を除去して補完したパターンが
「５」のカテゴリとして認識された結果、入力されたパ
ターンは訂正文字とみなされる。また、訂正文字の候補
として、「５」が入力され、この「５」の横線を除去し
たパターンがリジェクトされた結果、入力されたパター
ンは訂正文字でないとみなされる。

【０３７１】次に、図３のくせ字解析部２３の一実施例
について説明する。このくせ字解析部２３は、同一のカ
テゴリに属すると認識された手書き文字を所定のクラス
タ数にクラスタリングし、異なるカテゴリに属するクラ
スタ間の距離の小さいものについては、要素数が少ない
方のクラスタの文字カテゴリを要素数が多い方のクラス
タの文字カテゴリに修正することにより、別のカテゴリ
に属するものと誤って認識された手書き文字を正読化す
る。

【０３７２】図６８は、「４」の文字カテゴリに属する
と判定された手書き文字の特徴ベクトルによるクラスタ
リング処理を示す図である。図６８には、認識辞書に格
納されている「４」の文字カテゴリの特徴ベクトルとの
距離が近いため、「４」の認識結果カテゴリに属すると
判定された手書き文字が示されている。ここで、この認
識処理では、「２」と手書きされた文字が「４」の認識
結果カテゴリに属すると誤って認識されている。

【０３７３】そして、１回目のクラスタリング処理で
は、「４」の文字カテゴリに属すると判定された手書き
文字をそれぞれ１つのクラスタとみなし、２回目のクラ
スタリング処理では、クラスタとみなされた手書き文字
の間での特徴ベクトルの距離を算出し、特徴ベクトルの
距離が最も近いものを１つのクラスタに統合する。この
結果、図６８の例では、クラスタ数が１１から１つだけ
減少して１０になっている。

【０３７４】３回目以降のクラスタリング処理において
も、クラスタ間での特徴ベクトルの距離を算出し、特徴
ベクトルの距離が最も近いものを統合することにより、
クラスタ数を減少させ、１１回目のクラスタリング処理
でクラスタ数は１となる。

【０３７５】ここで、クラスタ同士を統合する場合、要
素数が１のクラスタ、すなわち、特徴ベクトル同士の距
離の比較には、例えば、シティブロック距離を用いる。
要素数が複数のクラスタ同士の場合、例えば、重心法を
用いる。この重心法は、要素数がＭ個のクラスタのｉ番
目（ｉ＝１、２、３、・・・、Ｍ）の要素の特徴ベクト
ルｘ_iをｘ_i＝（ｘ_i1、ｘ_i2、ｘ_i3、・・・、ｘ_iN）と
表した時、そのクラスタを代表する代表ベクトルｘ
_mを、そのクラスタの要素の特徴ベクトルｘ_iの平均で
表し、

【０３７６】

【数１】

【０３７７】とする。そして、代表ベクトルｘ_m同士に
ついてのシティブロック距離を算出することにより、要
素数が複数のクラスタ同士の距離の比較を行うものであ
る。

【０３７８】なお、クラスタ数が１になるまでクラスタ
リング処理を続けると、「４」の文字カテゴリに属する
と誤って認識された「２」の手書き文字も、「４」の文
字カテゴリに属すると正しく認識された「４」の手書き
文字と同一のクラスタに属するようになるので、クラス
タリング処理を途中で打ち切るクラスタリング打ち切り
条件を設定する。

【０３７９】このクラスタリング打ち切り条件として
は、例えば、（１）最終クラスタ数が所定の数（例え
ば、３）になった時、（２）クラスタ統合時のクラスタ
間距離が所定のしきい値以上になった時、（３）クラス
タ統合時のクラスタ間距離の増加率が所定のしきい値以
上になった時、のいずれかの条件を用いることができ
る。

【０３８０】図６９は、クラスタリング処理を示すフロ
ーチャートである。図６９において、まず、ステップＳ
２６１に示すように、ある文字カテゴリに属すると認識
された手書き文字の特徴ベクトルだけを抽出し、抽出さ
れたそれぞれの手書き文字の特徴ベクトルを１つのクラ
スタとみなす。

【０３８１】次に、ステップＳ２６２に示すように、ク
ラスタリング処理を途中で打ち切るクラスタリング打ち
切り条件を設定する。次に、ステップＳ２６３に示すよ
うに、ある文字カテゴリについての全てのクラスタの中
で、最も距離の近い２つのクラスタを選択する。

【０３８２】次に、ステップＳ２６４に示すように、ス
テップＳ２６２で設定したクラスタリング打ち切り条件
を満たしているかどうかを判断し、クラスタリング打ち
切り条件を満たしていない場合、ステップ２６５に進ん
で、ステップＳ２６３で選択した２つのクラスタ同士を
統合し、ステップＳ２６３に戻り、クラスタを統合する
処理を繰り返す。

【０３８３】そして、クラスタを統合する処理を繰り返
した結果、ステップＳ２６４でクラスタリング打ち切り
条件を満たすと判断された場合、ステップ２６６に進ん
で、全ての文字カテゴリに対してクラスタリング処理を
行ったかどうかを判断し、全ての文字カテゴリに対して
クラスタリング処理を行っていない場合、ステップ２６
１に戻り、クラスタリング処理を行っていない文字カテ
ゴリについてのクラスタリング処理を行う。

【０３８４】一方、ステップ２６６で全ての文字カテゴ
リに対してクラスタリング処理を行ったと判断された場
合、ステップ２６７に進んで、クラスタリング結果をメ
モリに格納する。

【０３８５】次に、クラスタリング処理により得られた
クラスタリング結果に基づいて、別のカテゴリに属する
ものと誤って認識された手書き文字を正読化する。図７
０は、「２」と手書きされた文字が「４」の文字カテゴ
リに属すると誤って認識された認識結果を、正しい文字
カテゴリ「２」に正読化する処理を示す図である。

【０３８６】図７０には、「２」の認識結果カテゴリに
属すると判定された手書き文字及び「４」の認識結果カ
テゴリに属すると判定された手書き文字が示されてい
る。ここで、「３」と手書きされた文字が「２」の認識
結果カテゴリに属すると誤って認識され、「２」と手書
きされた文字が「４」の認識結果カテゴリに属すると誤
って認識され、「４」と手書きされた文字がいずれの認
識結果カテゴリにも属さないとしてリジェクトされてい
る。

【０３８７】次に、クラスタリング打ち切り条件を、同
一カテゴリ内における最終クラスタ数が３になった時に
設定して、クラスタリング処理を行うことにより、
「２」の認識結果カテゴリについてはクラスタａ、ｂ、
ｃが生成され、「４」の認識結果カテゴリについてはク
ラスタｄ、ｅ、ｆが生成され、リジェクトされた３つの
「４」の手書き文字についてはそれぞれクラスタｇ、
ｈ、ｉが生成されている。

【０３８８】次に、「２」の認識結果カテゴリに属する
クラスタａ、ｂ、ｃと「４」の認識結果カテゴリに属す
るクラスタｄ、ｅ、ｆとの中から、文字数の少ないクラ
スタａ、ｄを誤読候補クラスタとして抽出する。

【０３８９】次に、誤読候補クラスタａとそれ以外のク
ラスタｂ、ｃ、ｄ、ｅ、ｆのそれぞれとの距離及び誤読
候補クラスタｄとそれ以外のクラスタａ、ｂ、ｃ、ｅ、
ｆのそれぞれとの距離を算出する。そして、誤読候補ク
ラスタａと最も距離が近いクラスタとしてクラスタｂを
抽出し、誤読候補クラスタａとクラスタｂとの間の距離
が所定の値以下であるかどうかを判定し、誤読候補クラ
スタａとクラスタｂとの間の距離は所定の値以下でない
ので、誤読候補クラスタａはリジェクト化される。

【０３９０】この結果、「２」の認識結果カテゴリに属
すると誤って認識された「３」と手書きされた文字が、
「２」の認識結果カテゴリから除外される。また、誤読
候補クラスタｄと最も距離が近いクラスタとしてクラス
タｂを抽出し、誤読候補クラスタｄとクラスタｂとの間
の距離が所定の値以下であるかどうかを判定し、誤読候
補クラスタｄとクラスタｂとの間の距離は所定の値以下
なので、誤読候補クラスタｄはクラスタｂと統合されク
ラスタｊが生成されるとともに、クラスタｊは、要素数
が多い方のクラスタｂの属していた「２」の認識結果カ
テゴリに属すると判定されて、「４」と誤読されたため
に誤読候補クラスタｄに属するとされた「２」の手書き
文字が正読化される。

【０３９１】さらに、いずれの認識結果カテゴリにも属
さないとしてリジェクトされたクラスタｇ、ｈ、ｉとそ
れ以外のクラスタａ〜ｆとの距離を算出する。そして、
クラスタｇと最も距離が近いクラスタとしてクラスタｅ
を抽出し、クラスタｇとクラスタｅとの間の距離が所定
の値以下であるかどうかを判定し、クラスタｇとクラス
タｅとの間の距離は所定の値以下なので、クラスタｇは
クラスタｅと統合される。

【０３９２】また、クラスタｈと最も距離が近いクラス
タとしてクラスタｅを抽出し、クラスタｈとクラスタｅ
との間の距離が所定の値以下であるかどうかを判定し、
クラスタｈとクラスタｅとの間の距離は所定の値以下な
ので、クラスタｈはクラスタｅと統合される。クラスタ
ｇ及びクラスタｈがクラスタｅに統合された結果、クラ
スタｋが生成されるとともに、クラスタｋは、要素数が
多い方のクラスタｅの属していた「４」の認識結果カテ
ゴリに属すると判定されて、認識不能としてリジェクト
された「４」の手書き文字が正読化される。

【０３９３】また、クラスタｉと最も距離が近いクラス
タとしてクラスタｅを抽出し、クラスタｉとクラスタｅ
との間の距離が所定の値以下であるかどうかを判定し、
クラスタｉとクラスタｅとの間の距離は所定の値以下で
ないので、クラスタｉはクラスタｅと統合しないように
する。

【０３９４】図７１は、文字カテゴリ認識結果修正処理
を示すフローチャートである。図７１において、まず、
ステップＳ２７１に示すように、図６９のクラスタリン
グ処理により得られたクラスタリング結果についてのデ
ータをメモリから読み出す。

【０３９５】次に、ステップＳ２７２に示すように、図
６９のクラスタリング処理により得られた全てのカテゴ
リの全てのクラスタについて、各クラスタ間での距離を
算出し、各クラスタ間の距離を比較する。

【０３９６】次に、ステップＳ２７３に示すように、ク
ラスタ間の距離がしきい値以下のクラスタが存在するか
どうかを判断し、クラスタ間の距離がしきい値以下のク
ラスタが存在する場合、ステップＳ２７４に進んで、そ
れらのクラスタ同士を統合し、クラスタ間の距離がしき
い値以下のクラスタが存在しない場合、それらのクラス
タをリジェクトする。

【０３９７】ここで、クラスタ統合時のクラスタ間の距
離のしきい値として、例えば、２つのクラスタのうち、
要素数が多い方のクラスタ内のベクトル間距離の定数倍
を用いる。すなわち、要素数がＭ個のクラスタＡと要素
数がＮ（Ｍ＞Ｎ）個のクラスタＢとを統合する場合、ク
ラスタＡの代表ベクトルをｘａｍ、クラスタＢの代表ベ
クトルをｘｂｍ、クラスタＡ内の特徴ベクトルをｘａｉ
（ｉ＝１、２、・・・、Ｍ）とすると、クラスタＡ内の
ベクトル間距離ｄ_tｈは、

【０３９８】

【数２】

【０３９９】で表される。従って、クラスタ同士を統合
する条件は、例えば、１．５に定数を設定すると、｜ｘａｍ−ｘｂｍ｜＜１．５ｄ_tｈとなる。

【０４００】次に、ステップＳ２７５に示すように、ス
テップＳ２７４で統合された全てのクラスタについて、
クラスタ内の文字カテゴリの判定を行う。次に、ステッ
プＳ２７６に示すように、統合されたクラスタ同士の文
字カテゴリが異なるかどうかを判断し、クラスタ同士の
文字カテゴリが異なる場合、ステップＳ２７７に進み、
要素数が少ない方のクラスタの文字カテゴリを要素数が
多い方のクラスタの文字カテゴリに修正してから、ステ
ップＳ２７８に進む。一方、クラスタ同士の文字カテゴ
リが一致する場合、ステップＳ２７７をスキップしてス
テップＳ２７８に進む。

【０４０１】次に、ステップＳ２７８に示すように、ク
ラスタ内の文字について、その文字カテゴリを出力す
る。次に、本発明の一実施例によるパターン認識装置の
動作について、図７２の帳票を処理する場合を例にとっ
て、より具体的に説明する。

【０４０２】図７２は、本発明の一実施例によるパター
ン認識装置に入力される帳票の例を示す図である。図７
２の帳票には、枠番号１のフリーピッチ枠、枠番号２、
３、４の一文字枠、枠番号５のブロック枠、枠番号６の
不規則な表が設けられている。また、枠番号１のフリー
ピッチ枠には、枠に接触した状態で且つ横二重線により
訂正されている「５」、枠に接触した状態の「３」、
「２」、枠に接触した状態で且つかすれた状態の
「７」、くせ字の「４」、「６」、枠からはみ出した状
態で且つくせ字の「４」が記入されている。

【０４０３】枠番号２の一文字枠には「５」が記入さ
れ、枠番号３の一文字枠には「３」が記入され、枠番号
４の一文字枠には枠からはみ出した状態で且つ横二重線
により訂正されている「８」が記入されている。枠番号
５のブロック枠のうち、枠番号５−１の枠には横二重線
により訂正されているくせ字の「６」が記入され、枠番
号５−２の枠には枠に接触した状態で「２」が記入さ
れ、枠番号５−３の枠にはくせ字の「４」が記入されて
いる。

【０４０４】枠番号６の不規則な表のうち、枠番号６−
１−１の枠には、枠からはみ出した状態の「３」、
「２」、「１」が記入され、枠番号６−１−２の枠に
は、「６」、「３」、「８」が記入され、枠番号６−１
−３の枠、枠番号６−１−４−１の枠、枠番号６−１−
４−２の枠、枠番号６−１−４−３の枠、枠番号６−２
−１の枠、枠番号６−２−２の枠及び枠番号６−２−３
の枠はそれぞれ空欄となっており、枠番号６の不規則な
表全体が×印により訂正されている。

【０４０５】次に、図３の環境認識系１１は、図７２の
帳票に対し、図５〜図８の処理を行うことにより、入力
画像の状態を図７２の帳票から抽出する。例えば、図６
のレイアウト解析により、図７２の帳票から、枠番号１
のフリーピッチ枠、枠番号２、３、４の一文字枠、枠番
号５のブロック枠及び枠番号６の不規則な表を抽出する
とともに、枠番号１のフリーピッチ枠からは、８つのパ
ターンが文字の候補として抽出され、枠番号２、３、４
の一文字枠からは、それぞれ１つのパターンが文字の候
補として抽出され、枠番号５のブロック枠からは、３つ
のパターンが文字の候補として抽出され、枠番号６−
１−１の枠からは、３つのパターンが文字の候補として
抽出され、枠番号６−１−２の枠からは、３つのパター
ンが文字の候補として抽出され、枠番号６−１−３の
枠、枠番号６−１−４−１の枠、枠番号６−１−４−２
の枠、枠番号６−１−４−３の枠、枠番号６−２−１の
枠、枠番号６−２−２の枠及び枠番号６−２−３の枠か
らは、文字の候補は抽出されない。

【０４０６】ここで、図７２の帳票から文字列を抽出す
るには、例えば、図１４及び図１５に示したテキスト抽
出方法を使用し、図７２の帳票から罫線を抽出するに
は、例えば、図１６〜図２２に示した罫線抽出方法を使
用し、図７２の帳票から枠や表を抽出するには、例え
ば、図２３及び図２４に示した枠抽出方法を使用する。

【０４０７】さらに、枠番号１のフリーピッチ枠から抽
出された第１番目のパターン、第２番目のパターン、第
５番目のパターン、第８番目のパターンは、枠接触文字
の候補とされる。また、枠番号４の一文字枠から抽出さ
れたパターン、枠番号５−２の枠から抽出されたパター
ン、枠番号６−１−１の枠から抽出された第１番目のパ
ターンも、枠接触文字の候補とされる。

【０４０８】ここで、図７２の帳票から枠接触文字の候
補を抽出するには、例えば、図２７及び図２８に示した
枠接触文字抽出方法を使用する。また、図７の品質解析
により、図７２の帳票から、かすれ状態やつぶれ状態や
高品質文字などを検出する。この例では、画像の品質は
正常で、かすれ状態やつぶれ状態や高品質文字などは検
出されない。

【０４０９】また、図８の訂正解析により、図７２の帳
票から訂正文字候補を抽出する。この例では、枠番号１
のフリーピッチ枠から抽出された第１番目のパターン、
枠番号２、４の一文字枠から抽出されたパターン、枠番
号５−１の枠から抽出されたパターン及び枠番号６の不
規則な表から抽出されたパターンは、訂正文字候補とさ
れる。

【０４１０】ここで、図７２の帳票から訂正文字の候補
を抽出するには、例えば、図３０に示した特徴量抽出方
法を使用する。次に、環境認識系１１は、入力画像から
抽出した文字の候補ごとに、図５〜図８の処理により帳
票から抽出した状態を記入した中間処理結果テーブルを
作成する。

【０４１１】図７３は、図５〜図８の処理により帳票か
ら抽出した状態を記入した中間処理結果テーブルを示す
図である。図７３において、枠番号１の欄には、「枠種
類」として「フリーピッチ」、「文字数」として「８」
が記入され、枠番号１の第１番目のパターンの欄には、
「枠接触有無」として「有」、「消し線」として「有
２」、「品質」として「正常」が記入され、枠番号１の
第２番目のパターンの欄には、「枠接触有無」として
「有」、「消し線」として「無」、「品質」として「正
常」が記入され、枠番号１の第８番目のパターンの欄に
は、「枠接触有無」として「有」、「消し線」として
「無」、「品質」として「正常」が記入されている。

【０４１２】ここで、「消し線」の欄の「有１」は複数
文字に対して消し線候補が存在していることを示し、
「消し線」の欄の「有２」は一文字に対して消し線候補
が存在していることを示している。

【０４１３】枠番号２の欄には、「枠種類」として「一
文字」、「枠接触有無」として「無」、「消し線」とし
て「有２」、「品質」として「正常」、「文字数」とし
て「１」が記入され、枠番号３の欄には、「枠種類」
として「一文字」、「枠接触有無」として「無」、「消
し線」として「無」、「品質」として「正常」、「文字
数」として「１」が記入され、枠番号４の欄には、「枠
種類」として「一文字」、「枠接触有無」として
「有」、「消し線」として「有２」、「品質」として
「正常」、「文字数」として「１」が記入されている。

【０４１４】枠番号５の欄には、「枠種類」として「は
しご」、「文字数」として「３」が記入され、枠番号５
−１の欄には、「枠接触有無」として「無」、「消し
線」として「有２」、「品質」として「正常」、「文字
数」として「１」が記入され、枠番号５−２の欄には、
「枠接触有無」として「有」、「消し線」として
「無」、「品質」として「正常」、「文字数」として
「１」が記入され、枠番号５−３の欄には、「枠接触有
無」として「無」、「消し線」として「無」、「品質」
として「正常」、「文字数」として「１」が記入されて
いる。

【０４１５】枠番号６の欄には、「枠種類」として
「表」が記入され、枠番号６−１−１の欄には、「枠種
類」として「フリーピッチ」、「枠接触有無」として
「有」、「消し線」として「有１」、「品質」として
「正常」が記入され、枠番号６−２−２の欄には、「枠
種類」として「フリーピッチ」、「枠接触有無」として
「無」、「消し線」として「有１」、「品質」として
「正常」が記入されている。

【０４１６】次に、環境認識系１１は、図５〜図８の処
理により帳票から抽出した状態に基づいて、図９の処理
を行う。すなわち、図７３の中間処理結果テーブルに記
入された入力画像の状態に基づいて、図３の文字認識部
１２の基本文字認識部１７、文字列認識部１５、接触文
字認識部１３、かすれ文字認識部１９、つぶれ文字認識
部２１、又は非文字認識部２５の消し線認識部２６及び
雑音認識部２８のいずれの処理を呼び出すかを処理順序
制御ルールを参照しながら決定し、決定した処理を図７
３の中間処理結果テーブルの「処理呼出し」の欄に記入
する。そして、図７３の中間処理結果テーブルの「処理
呼出し」の欄に記入された処理をどのような順序で実行
するかを、処理順序テーブルを参照しながら決定し、決
定した順序を図７３の中間処理結果テーブルの「処理順
序」の欄に記入する。

【０４１７】処理順序制御ルールの例としては、（Ａ
１）もし、ある処理対象に対し、中間処理結果テーブル
の状態を示す欄が「有」で、その状態に対応する処理が
実行されていないならば、その状態に対応する処理を中
間処理結果テーブルの「処理呼出し」の欄に記入する、
（Ａ２）もし、ある処理対象に対し、中間処理結果テー
ブルの状態を示す全ての欄が「無」、または「正常」
で、基本文字認識部１７の処理が実行されていないなら
ば、中間処理結果テーブルの「処理呼出し」の欄に「基
本」と記入する、（Ａ３）もし、ある処理対象に対し、
中間処理結果テーブルに記入された状態に対応する処理
が複数個存在しているならば、複数個の処理の順序を決
定している処理順序テーブルをアクセスして「処理呼出
し」の欄の順序を並び替える、（Ａ４）もし、ある処理
対象に対し、中間処理結果テーブルに記入された状態に
対応する処理が終了したならば、終了した処理を中間処
理結果テーブルの「処理完了」の欄に記入するととも
に、次に行うべき指示や処理の中断や終了を示す指示を
中間処理結果テーブルの「処理指示」の欄に記入し、そ
れらの情報に基づいて、中間処理結果テーブルの「処理
呼出し」の欄の順序を並び替える、などがある。

【０４１８】図７４は、処理順序テーブルの一例を示す
図である。図７４において、処理順序テーブルには、例
えば、（Ｂ１）ある処理対象に対し、中間処理結果テー
ブルの「処理呼出し」の欄に１つの処理しか記入されて
いない場合は、中間処理結果テーブルの「処理順序」の
欄にその処理を記入する、（Ｂ２）ある処理対象に対
し、中間処理結果テーブルの「処理呼出し」の欄に「黒
枠／フリーピッチ」と記入された場合は、中間処理結果
テーブルの「処理順序」の欄に「黒枠→フリーピッチ」
と記入する、（Ｂ３）ある処理対象に対し、中間処理結
果テーブルの「処理呼出し」の欄に「消し線（有２）／
黒枠」と記入された場合は、「黒枠→一文字消し線」と
記入する、（Ｂ４）ある処理対象に対し、中間処理結果
テーブルの「処理呼出し」の欄に「黒枠／フリーピッチ
／消し線（有２）」と記入された場合は、中間処理結果
テーブルの「処理順序」の欄に「黒枠→一文字消し線→
フリーピッチ」と記入する、（Ｂ５）ある処理対象に対
し、中間処理結果テーブルの「処理呼出し」の欄に「黒
枠／フリーピッチ／消し線（有１）」と記入された場合
は、中間処理結果テーブルの「処理順序」の欄に複数文
字の「消し線→黒枠→フリーピッチ」と記入する、（Ｂ
６）ある処理対象に対し、中間処理結果テーブルの「処
理呼出し」の欄に「フリーピッチ／消し線（有１）」と
記入された場合は、中間処理結果テーブルの「処理順
序」の欄に「複数文字の消し線→フリーピッチ」と記入
する、（Ｂ７）ある処理対象に対し、中間処理結果テー
ブルの「処理呼出し」の欄に「処理Ａ、Ｂ、Ｃ」と記入
され、中間処理結果テーブルの「処理順序」の欄に「処
理Ｂ→処理Ａ→処理Ｃ」と記入されている場合で、中間
処理結果テーブルの「処理完了」の欄に「処理Ｂ」と記
入された場合、中間処理結果テーブルの「処理順序」の
欄を「処理Ａ→処理Ｃ」に更新する、（Ｂ８）ある処理
対象に対し、中間処理結果テーブルの「処理呼出し」の
欄に「処理Ａ、Ｂ、Ｃ」と記入され、中間処理結果テー
ブルの「処理順序」の欄に「処理Ｂ→処理Ａ→処理Ｃ」
と記入されている場合で、中間処理結果テーブルの「処
理完了」の欄に「処理Ｂ」と記入され、中間処理結果テ
ーブルの「処理指示」の欄に「処理Ｃにスキップ」と記
入された場合、中間処理結果テーブルの「処理順序」の
欄を「処理Ｃ」に更新する、（Ｂ９）ある処理対象に対
し、中間処理結果テーブルの「処理呼出し」の欄に「処
理Ａ、Ｂ、Ｃ」と記入され、中間処理結果テーブルの
「処理順序」の欄に「処理Ｂ→処理Ａ→処理Ｃ」と記入
されている場合で、中間処理結果テーブルの「処理完
了」の欄に「処理Ｂ」と記入され、中間処理結果テーブ
ルの「処理指示」の欄に「処理Ｃと処理Ａとの順序逆
転」と記入された場合、中間処理結果テーブルの「処理
順序」の欄を「処理Ｃ→処理Ａ」に更新する、（Ｂ１
０）ある処理対象に対し、中間処理結果テーブルの「処
理呼出し」の欄に「処理Ｂ、Ａ」と記入され、中間処理
結果テーブルの「処理完了」の欄に「処理Ａ」と記入さ
れ、中間処理結果テーブルの「処理指示」の欄に「終
了」と記入された場合、中間処理結果テーブルの「処理
順序」の欄を「終了」とする、などの手順が格納されて
いる。

【０４１９】図７５は、図７３の中間処理結果テーブル
に記入された入力画像の状態に基づいて呼び出す処理を
「処理呼出し」の欄に記入するとともに、「処理呼出
し」の欄に記入された処理を実行する順序を「処理順
序」の欄に記入した例を示す図である。

【０４２０】図７５において、枠番号１の欄には、「枠
種類」として「フリーピッチ」が記入され、枠番号１の
第１番目のパターンの欄には、「枠接触有無」として
「有」、「消し線」として「有２」が記入されているの
で、処理順序制御ルールの（Ａ１）に従って「処理呼び
出し」の欄に「黒枠／フリーピッチ／消し線（有２）」
と記入するとともに、処理順序制御ルールの（Ａ３）に
従って処理順序テーブルの（Ｂ４）を参照し、「処理順
序」の欄に「黒枠→一文字消し線→フリーピッチ」と記
入する。

【０４２１】枠番号１の第２番目のパターンの欄には、
「枠接触有無」として「有」、「消し線」として
「無」、「品質」として「正常」が記入されているの
で、処理順序制御ルールの（Ａ１）に従って「処理呼び
出し」の欄に「黒枠／フリーピッチ」と記入するととも
に、処理順序制御ルールの（Ａ３）に従って処理順序テ
ーブルの（Ｂ２）を参照し、「処理順序」の欄に「黒枠
→フリーピッチ」と記入する。

【０４２２】枠番号１の第８番目のパターンの欄には、
「枠接触有無」として「有」、「消し線」として
「無」、「品質」として「正常」が記入されているの
で、処理順序制御ルールの（Ａ１）に従って「処理呼び
出し」の欄に「黒枠／フリーピッチ」と記入するととも
に、処理順序制御ルールの（Ａ３）に従って処理順序テ
ーブルの（Ｂ２）を参照し、「処理順序」の欄に「黒枠
→フリーピッチ」と記入する。

【０４２３】枠番号２の欄には、「枠種類」として「一
文字」、「枠接触有無」として「無」、「消し線」とし
て「有２」、「品質」として「正常」が記入されている
ので、処理順序制御ルールの（Ａ１）に従って「処理呼
び出し」の欄に「消し線（有２）」と記入するととも
に、処理順序制御ルールの（Ａ１）に従って「処理順
序」の欄に「一文字消し線」と記入する。

【０４２４】枠番号３の欄には、「枠種類」として「一
文字」、「枠接触有無」として「無」、「消し線」とし
て「無」、「品質」として「正常」が記入されているの
で、処理順序制御ルールの（Ａ２）に従って「処理呼び
出し」の欄に「基本」と記入するとともに、処理順序制
御ルールの（Ａ１）に従って「処理順序」の欄に「基
本」と記入する。

【０４２５】枠番号４の欄には、「枠種類」として「一
文字」、「枠接触有無」として「有」、「消し線」とし
て「有２」、「品質」として「正常」が記入されている
ので、処理順序制御ルールの（Ａ１）に従って「処理呼
び出し」の欄に「黒枠／消し線（有２）」と記入すると
ともに、処理順序制御ルールの（Ａ３）に従って処理順
序テーブルの（Ｂ３）を参照し、「処理順序」の欄に
「黒枠→一文字消し線」と記入する。

【０４２６】枠番号５の欄には、「枠種類」として「は
しご」が記入され、枠番号５−１の欄には、「枠接触有
無」として「無」、「消し線」として「有２」、「品
質」として「正常」が記入されているので、処理順序制
御ルールの（Ａ１）に従って「処理呼び出し」の欄に
「消し線（有２）」と記入するとともに、処理順序制御
ルールの（Ａ１）に従って「処理順序」の欄に「一文字
消し線」と記入する。

【０４２７】枠番号５−２の欄には、「枠接触有無」と
して「有」、「消し線」として「無」、「品質」として
「正常」が記入されているので、処理順序制御ルールの
（Ａ１）に従って「処理呼び出し」の欄に「黒枠」と記
入するとともに、処理順序制御ルールの（Ａ１）に従っ
て「処理順序」の欄に「黒枠」と記入する。

【０４２８】枠番号５−３の欄には、「枠接触有無」と
して「無」、「消し線」として「無」、「品質」として
「正常」が記入されているので、処理順序制御ルールの
（Ａ２）に従って「処理呼び出し」の欄に「基本」と記
入するとともに、処理順序制御ルールの（Ａ１）に従っ
て「処理順序」の欄に「基本」と記入する。

【０４２９】枠番号６の欄には、「枠種類」として
「表」が記入され、枠番号６−１−１の欄には、「枠種
類」として「フリーピッチ」、「枠接触有無」として
「有」、「消し線」として「有１」、「品質」として
「正常」が記入されているので、処理順序制御ルールの
（Ａ１）に従って「処理呼び出し」の欄に「黒枠／フリ
ーピッチ／消し線（有１）」と記入するとともに、処理
順序制御ルールの（Ａ３）に従って処理順序テーブルの
（Ｂ５）を参照し、「処理順序」の欄に「複数文字の消
し線→黒枠→フリーピッチ」と記入する。

【０４３０】枠番号６−２−２の欄には、「枠種類」と
して「フリーピッチ」、「枠接触有無」として「無」、
「消し線」として「有１」、「品質」として「正常」が
記入されているので、処理順序制御ルールの（Ａ１）に
従って「処理呼び出し」の欄に「フリーピッチ／消し線
（有１）」と記入するとともに、処理順序制御ルールの
（Ａ３）に従って処理順序テーブルの（Ｂ６）を参照
し、「処理順序」の欄に複数文字の「複数文字の消し線
→フリーピッチ」と記入する。

【０４３１】次に、「処理呼出し」の欄及び「処理順
序」の欄が記入された図７５の中間処理結果テーブルに
基づいて、処理実行ルールを参照しながら最初の認識処
理を実行する。そして、処理が完了した認識処理を中間
処理結果テーブルの「処理完了」の欄に記入するととも
に、その時の認識処理で得られた信頼度を中間処理結果
テーブルの「信頼度」の欄に記入する。

【０４３２】また、中間処理結果テーブルの「処理順
序」の欄を、図７４の処理順序テーブルの（Ｂ７）〜
（Ｂ９）に従って更新するとともに、処理実行ルールに
よって指示される次の処理がある場合は、中間処理結果
テーブルの「処理指示」の欄にその処理を記入する。

【０４３３】処理実行ルールとしては、例えば、（Ｃ
１）もし、ある処理対象に対し、中間処理結果テーブル
の「処理順序」の欄に記入されている処理が存在するな
らば、優先順位の最も高い処理を実行する。そして、実
行した処理が終了したならば、中間処理結果テーブルの
「処理完了」の欄に終了した処理を記入し、中間処理結
果テーブルの「処理順序」の欄からその処理を削除す
る。また、次に実行する処理を指示する場合は、中間処
理結果テーブルの「処理指示」の欄にその処理を記入す
る、（Ｃ２）もし、ある処理を実行した結果、あるパタ
ーンが非文字ではなく、文字であると判断され、その文
字コードが所定の値以上の信頼度で算出されたならば、
「個人筆記特性」による文字認識処理を呼び出すことを
中間処理結果テーブルの「処理指示」の欄に記入する、
（Ｃ３）もし、ある処理を実行した結果、あるパターン
が消し線であると判断され、その消し線が所定の値以上
の信頼度で算出されたならば、中間処理結果テーブルの
「処理指示」の欄に「終了」と記入し、中間処理結果テ
ーブルの「処理順序」の欄に記入されているそれ以降の
処理を打ち切って、処理を終了させる、（Ｃ４）もし、
中間処理結果テーブルの「処理順序」の欄の最初に「フ
リーピッチ」と記入され、同じ枠番号の他の処理対象に
ついての「フリーピッチ」より前の処理が未処理である
ならば、同じ枠番号の全て処理対象の「処理順序」の欄
の最初に「フリーピッチ」と記入された後、同じ枠番号
の全て処理対象の「フリーピッチ」の処理を同時に実行
する、（Ｃ５）もし、中間処理結果テーブルの「処理順
序」の欄に記入された全ての処理が終了し、全ての処理
対象について、中間処理結果テーブルの「処理指示」の
欄に「終了」と記入されるか、又は「個人筆記特性」と
記入されたならば、「処理指示」の欄に「個人筆記特
性」と記入されている処理対象に対して、「個人筆記特
性」による文字認識処理を呼び出してその処理を実行
し、「個人筆記特性」による文字認識処理が終了したな
らば、中間処理結果テーブルの「処理指示」の欄に「終
了」と記入する、（Ｃ６）もし、全ての処理対象につい
て、中間処理結果テーブルの「処理指示」の欄に終了と
記入されたならば、全ての処理を終了して認識結果を出
力する、などがある。

【０４３４】図７６は、図７５の中間処理結果テーブル
に基づいて、処理実行ルールを参照しながら認識処理を
実行し、その時の認識処理で得られた信頼度を中間処理
結果テーブルの「信頼度」の欄に記入し、処理実行ルー
ルに基づいて中間処理結果テーブルの「処理順序」の欄
を更新するとともに、中間処理結果テーブルの「処理指
示」の欄に記入を行った例を示す図である。

【０４３５】まず、図７５の中間処理結果テーブルの枠
番号１の第１番目のパターンの「処理順序」の欄におい
て、最初に「黒枠」と指示されているので、処理実行ル
ールの（Ｃ１）に従って、図７２の枠番号１のフリーピ
ッチ枠から抽出された第１番目のパターンに対し、「黒
枠」に対応する図３の接触文字認識部１３の処理を実行
する。

【０４３６】この接触文字認識部１３では、例えば、図
３９及び図４０に示したように、枠を除去したパターン
に対して文字補完や再補完を行うことにより、枠接触文
字についての文字認識を行う。また、文字補完や再補完
を用いても十分な信頼度が得られないパターンについて
は、知識テーブル１４を参照し、図４２〜図５１に示し
た学習文字に対する再文字認識を行うことにより、枠接
触文字についての文字認識を行う。

【０４３７】接触文字認識部１３の文字認識処理によ
り、図７２の枠番号１のフリーピッチ枠から抽出された
第１番目のパターンの認識信頼度が２０％と算出された
結果、図７２の枠番号１のフリーピッチ枠から抽出され
た第１番目のパターンは文字でないとみなされ、中間処
理結果テーブルの「文字コード」の欄に「リジェクト」
と記入されるとともに、中間処理結果テーブルの「信頼
度」の欄に「２０％」と記入される。

【０４３８】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠」と記入され、中間処理結果テーブル
の「処理順序」の欄が「一文字消し線→フリーピッチ」
に更新される。

【０４３９】次に、図７５の中間処理結果テーブルの枠
番号１の第２番目のパターンの「処理順序」の欄におい
て、最初に「黒枠」と指示されているので、処理実行ル
ールの（Ｃ１）に従って、図７２の枠番号１のフリーピ
ッチ枠から抽出された第２番目のパターンに対し、「黒
枠」に対応する図３の接触文字認識部１３の処理を実行
し、枠接触文字についての文字認識を行う。

【０４４０】接触文字認識部１３の文字認識処理によ
り、図７２の枠番号１のフリーピッチ枠から抽出された
第２番目のパターンは、認識信頼度が６０％の確率で文
字カテゴリ「３」であると認識され、中間処理結果テー
ブルの「文字コード」の欄に「３」と記入されるととも
に、中間処理結果テーブルの「信頼度」の欄に「６０
％」と記入される。

【０４４１】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠」と記入され、中間処理結果テーブル
の「処理順序」の欄が「フリーピッチ」に更新される。
次に、図７５の中間処理結果テーブルの枠番号１の第８
番目のパターンの「処理順序」の欄において、最初に
「黒枠」と指示されているので、処理実行ルールの（Ｃ
１）に従って、図７２の枠番号１のフリーピッチ枠から
抽出された第８番目のパターンに対し、「黒枠」に対応
する図３の接触文字認識部１３の処理を実行し、枠接触
文字についての文字認識を行う。

【０４４２】接触文字認識部１３の文字認識処理によ
り、図７２の枠番号１のフリーピッチ枠から抽出された
第８番目のパターンは、認識信頼度が９５％の確率で文
字カテゴリ「４」であると認識され、中間処理結果テー
ブルの「文字コード」の欄に「４」と記入されるととも
に、中間処理結果テーブルの「信頼度」の欄に「９５
％」と記入される。

【０４４３】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠」と記入され、中間処理結果テーブル
の「処理順序」の欄が「フリーピッチ」に更新される。
次に、図７５の中間処理結果テーブルの枠番号２の「処
理順序」の欄において、「一文字消し線」と指示されて
いるので、処理実行ルールの（Ｃ１）に従って、図７２
の枠番号２の一文字枠から抽出されたパターンに対し、
「一文字消し線」に対応する図３の消し線認識部２６の
処理を実行する。

【０４４４】この消し線認識部２６では、例えば、図６
７に示したように、訂正文字の候補として抽出されたパ
ターンから所定値以上のヒストグラム値を有する横線を
除去し、この横線を除去したパターンが、文字と認識さ
れた場合は、除去した横線を消し線とみなすことによ
り、訂正文字の候補として抽出されたパターンを訂正文
字と認識し、所定値以上のヒストグラム値を有する横線
を除去したパターンが、リジェクトされた場合は、除去
した横線を消し線を文字に一部とみなして消し線でない
とすることにより、訂正文字の候補として抽出されたパ
ターンを通常文字と認識する。

【０４４５】消し線認識部２６の消し線認識処理によ
り、図７２の枠番号２の一文字枠から抽出されたパター
ンの認識信頼度が１０％と算出された結果、図７２の枠
番号２の一文字枠から抽出されたパターンは訂正文字で
ないとみなされ、中間処理結果テーブルの「信頼度」の
欄に「１０％」と記入されるとともに、中間処理結果テ
ーブルの「処理指示」の欄に「基本」と記入される。

【０４４６】また、中間処理結果テーブルの「処理完
了」の欄に「消し線」と記入され、中間処理結果テーブ
ルの「処理順序」の欄に「基本」と記入される。次に、
図７５の中間処理結果テーブルの枠番号３の「処理順
序」の欄において、「基本」と指示されているので、処
理実行ルールの（Ｃ１）に従って、図７２の枠番号３の
一文字枠から抽出されたパターンに対し、「基本」に対
応する図３の基本文字認識部１７の処理を実行する。

【０４４７】この基本文字認識部１７では、例えば、図
３１に示したように、入力された未知文字の特徴を抽出
し、この未知文字の特徴を特徴ベクトルにより表し、基
本辞書に予め格納されている各カテゴリの特徴ベクトル
と照合することにより、特徴空間上での特徴ベクトル間
の距離を算出し、特徴ベクトル間の距離を最小とする文
字カテゴリを未知文字として認識する。

【０４４８】また、基本文字認識部１７は、未知文字の
輪郭の凹凸の個数を算出することにより、未知文字の変
形度を算出する。そして、未知文字の変形度が大きく
て、認識率が低下する場合は、知識テーブル１８を参照
し、図３４〜図３８に示した詳細識別法を用いて文字認
識を実行する。

【０４４９】基本文字認識部１７の文字認識処理によ
り、図７２の枠番号３の一文字枠から抽出されたパター
ンは、認識信頼度が９５％の確率で文字カテゴリ「３」
である１認識され、中間処理結果テーブルの「文字コー
ド」の欄に「３」と記入されるとともに、中間処理結果
テーブルの「信頼度」の欄に「９５％」と記入される。

【０４５０】また、中間処理結果テーブルの「処理完
了」の欄に「基本」と記入され、中間処理結果テーブル
の「処理順序」の欄は空欄となる。次に、図７５の中間
処理結果テーブルの枠番号４の「処理順序」の欄におい
て、最初に「黒枠」と指示されているので、処理実行ル
ールの（Ｃ１）に従って、図７２の枠番号４の一文字枠
から抽出されたパターンに対し、「黒枠」に対応する図
３の接触文字認識部１３の処理を実行し、枠接触文字に
ついての文字認識を行う。

【０４５１】接触文字認識部１３の文字認識処理によ
り、図７２の枠番号４の一文字枠から抽出されたパター
ンの認識信頼度が１５％と算出された結果、図７２の枠
番号４の一文字枠から抽出されたパターンは文字でない
とみなされ、中間処理結果テーブルの「文字コード」の
欄に「リジェクト」と記入されるとともに、中間処理結
果テーブルの「信頼度」の欄に「１５％」と記入され
る。

【０４５２】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠」と記入され、中間処理結果テーブル
の「処理順序」の欄が「一文字消し線」に更新される。
次に、図７５の中間処理結果テーブルの枠番号５−１の
「処理順序」の欄において、「一文字消し線」と指示さ
れているので、処理実行ルールの（Ｃ１）に従って、図
７２の枠番号５−１の枠から抽出されたパターンに対
し、「一文字消し線」に対応する図３の消し線認識部２
６の処理を実行し、訂正文字の候補として抽出されたパ
ターンの認識処理を行う。

【０４５３】消し線認識部２６の消し線認識処理によ
り、図７２の枠番号５−１の枠から抽出されたパターン
の認識信頼度が９５％と算出された結果、図７２の枠番
号５−１の枠から抽出されたパターンは訂正文字とみな
され、中間処理結果テーブルの「信頼度」の欄に「９５
％」と記入されるとともに、中間処理結果テーブルの
「処理完了」の欄に「消し線」と記入される。

【０４５４】また、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入されるとともに、中間処理結
果テーブルの「処理順序」の欄は空欄となる。次に、図
７５の中間処理結果テーブルの枠番号５−２の「処理順
序」の欄において、「黒枠」と指示されているので、処
理実行ルールの（Ｃ１）に従って、図７２の枠番号５−
２の枠から抽出されたパターンに対し、「黒枠」に対応
する図３の接触文字認識部１３の処理を実行し、枠接触
文字についての文字認識を行う。

【０４５５】ここで、図７２の枠番号５−２の枠から抽
出されたパターンは、下線部分が枠と接触し、図３９の
文字補完や図４０の再補完による処理では十分な信頼度
が得られないので、図５０（ｂ）に示したように、図４
５の知識テーブル１６７を参照することにより、誤読文
字対（２、７）を獲得し、図４７に示した領域強調の手
法により、再文字認識を行う。

【０４５６】接触文字認識部１３の文字認識処理によ
り、図７２の枠番号５−２の枠から抽出されたパターン
は、認識信頼度が９５％の確率で文字カテゴリ「２」で
あると認識され、中間処理結果テーブルの「文字コー
ド」の欄に「２」と記入されるとともに、中間処理結果
テーブルの「信頼度」の欄に「９５％」と記入される。

【０４５７】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠」と記入され、中間処理結果テーブル
の「処理順序」の欄は空欄となる。次に、図７５の中間
処理結果テーブルの枠番号５−３の「処理順序」の欄に
おいて、「基本」と指示されているので、処理実行ルー
ルの（Ｃ１）に従って、図７２の枠番号５−３の枠から
抽出されたパターンに対し、「基本」に対応する図３の
基本文字認識部１７の処理を実行し、基本文字について
の文字認識処理を行う。

【０４５８】基本文字認識部１７の文字認識処理によ
り、図７２の枠番号５−３の枠から抽出されたパターン
は、認識信頼度が９０％の確率で文字カテゴリ「６」で
あると認識され、中間処理結果テーブルの「文字コー
ド」の欄に「６」と記入されるとともに、中間処理結果
テーブルの「信頼度」の欄に「９０％」と記入される。

【０４５９】また、中間処理結果テーブルの「処理完
了」の欄に「基本」と記入され、中間処理結果テーブル
の「処理順序」の欄は空欄となる。次に、図７５の中間
処理結果テーブルの枠番号６−１−１の「処理順序」の
欄において、最初に「複数文字の消し線」と指示されて
いるので、処理実行ルールの（Ｃ１）に従って、「複数
文字の消し線」に対応する図３の消し線認識部２６の処
理を実行し、消し線の認識処理を行う。

【０４６０】消し線認識部２６の消し線認識処理によ
り、枠番号６の表から消し線が抽出され、その消し線の
認識信頼度が９８％と算出された結果、図７２の枠番号
６−１−１の枠から抽出されたパターンは訂正文字とみ
なされ、中間処理結果テーブルの「文字コード」の欄に
「消し線」と記入されるとともに、中間処理結果テーブ
ルの「信頼度」の欄に「９８％」と記入され、中間処理
結果テーブルの「処理完了」の欄に「消し線」と記入さ
れる。

【０４６１】また、処理実行ルールの（Ｃ３）に従っ
て、中間処理結果テーブルの「処理指示」の欄に「終
了」と記入されるとともに、中間処理結果テーブルの
「処理順序」の欄は空欄となる。

【０４６２】次に、図７５の中間処理結果テーブルの枠
番号６−２−２の「処理順序」の欄において、最初に
「複数文字の消し線」と指示されているので、処理実行
ルールの（Ｃ１）に従って、「複数文字の消し線」に対
応する図３の消し線認識部２６の処理を実行し、消し線
の認識処理を行う。

【０４６３】消し線認識部２６の消し線認識処理によ
り、枠番号６の表から消し線が抽出され、その消し線の
認識信頼度が９８％と算出された結果、図７２の枠番号
６−２−２の枠から抽出されたパターンは訂正文字とみ
なされ、中間処理結果テーブルの「文字コード」の欄に
「消し線」と記入されるとともに、中間処理結果テーブ
ルの「信頼度」の欄に「９８％」と記入され、中間処理
結果テーブルの「処理完了」の欄に「消し線」と記入さ
れる。

【０４６４】また、処理実行ルールの（Ｃ３）に従っ
て、中間処理結果テーブルの「処理指示」の欄に「終
了」と記入されるとともに、中間処理結果テーブルの
「処理順序」の欄は空欄となる。

【０４６５】以上に処理により、図７６の中間処理結果
テーブルが生成される。ここで、図７６の中間処理結果
テーブルの「処理順序」の欄には、次に呼び出す処理が
記入されているので、処理実行ルール（Ｃ１）に従って
処理を続行する。

【０４６６】図７７は、図７６の中間処理結果テーブル
に基づいて認識処理を続行し、その際に得られた結果を
示す図である。まず、図７６の中間処理結果テーブルの
枠番号１の第１番目のパターンの「処理順序」の欄にお
いて、最初に「一文字消し線」と指示されているので、
処理実行ルールの（Ｃ１）に従って、図７２の枠番号１
のフリーピッチ枠から抽出された第１番目のパターンに
対し、「一文字消し線」に対応する図３の消し線認識部
２６の処理を実行し、訂正文字についての認識処理を行
う。

【０４６７】消し線認識部２６の認識処理により、図７
２の枠番号１のフリーピッチ枠から抽出された第１番目
のパターンの認識信頼度が９６％と算出された結果、図
７２の枠番号１のフリーピッチ枠から抽出された第１番
目のパターンは訂正文字とみなされ、中間処理結果テー
ブルの「文字コード」の欄に「消し線」と記入されると
ともに、中間処理結果テーブルの「信頼度」の欄に「９
６％」と記入され、中間処理結果テーブルの「処理完
了」の欄に「黒枠／消し線」と記入される。

【０４６８】また、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入されるとともに、中間処理結
果テーブルの「処理順序」の欄は空欄となる。次に、図
７５の中間処理結果テーブルの枠番号１の第２番目のパ
ターンの「処理順序」の欄において、「フリーピッチ」
と指示されているので、処理実行ルールの（Ｃ４）に従
って、図７２の枠番号１のフリーピッチ枠から抽出され
た第２番目のパターンに対し、同じ枠番号１の他の全て
のパターンの「処理順序」の欄が「フリーピッチ」とな
るまで待機し、枠番号１の全てのパターンの「処理順
序」の欄が「フリーピッチ」となった時に、枠番号１の
フリーピッチ枠から抽出された全てのパターンを対象と
して、「フリーピッチ」に対応する図３の文字列認識部
１５の処理を実行し、文字の切り出し信頼度を考慮しな
がら文字認識を行う。

【０４６９】次に、図７５の中間処理結果テーブルの枠
番号１の第８番目のパターンの「処理順序」の欄におい
て、「フリーピッチ」と指示されているので、処理実行
ルールの（Ｃ４）に従って、図７２の枠番号１のフリー
ピッチ枠から抽出された第８番目のパターンに対し、同
じ枠番号１の他の全てのパターンの「処理順序」の欄が
「フリーピッチ」となるまで待機し、枠番号１の全ての
パターンの「処理順序」の欄が「フリーピッチ」となっ
た時に、枠番号１のフリーピッチ枠から抽出された全て
のパターンを対象として、「フリーピッチ」に対応する
図３の文字列認識部１５の処理を実行し、文字の切り出
し信頼度を考慮しながら認識処理を行う。

【０４７０】そして、枠番号１の全てのパターンの「処
理順序」の欄が「フリーピッチ」となった場合、図７２
の枠番号１のフリーピッチ枠から抽出された全てのパタ
ーンを対象として、文字列認識部１５の文字認識処理を
行う。

【０４７１】ここで、図７２の枠番号１のフリーピッチ
枠から抽出された第１番目のパターンについては、図７
７の中間処理結果テーブルの枠番号１の第１番目のパタ
ーンの「処理指示」の欄が「終了」となっているので、
図７２の枠番号１のフリーピッチ枠から抽出された第１
番目のパターンを文字列認識部１５の処理対象から除外
し、図７２の枠番号１のフリーピッチ枠から抽出された
第２番目のパターンから第８番目のパターンについて、
文字列認識部１５の認識処理を実行する。

【０４７２】この文字列認識部１５では、例えば、図５
２〜図６５に示したように、文字を切り出した際の信頼
度を判別面からの距離に基づいて算出し、（文字切り出
しの信頼度）と（文字認識の信頼度）との積が最大とな
るものを、切り出し文字とする。

【０４７３】文字列認識部１５の認識処理により、図７
２の枠番号１のフリーピッチ枠から抽出された第２番目
のパターンは、認識信頼度が９５％の確率で文字カテゴ
リ「３」であると認識され、中間処理結果テーブルの
「文字コード」の欄に「３」と記入されるとともに、中
間処理結果テーブルの「信頼度」の欄に「９５％」と記
入される。

【０４７４】また、処理実行ルールの（Ｃ１）に従っ
て、中間処理結果テーブルの「処理完了」の欄に「黒枠
／フリーピッチ」と記入され、中間処理結果テーブルの
「処理順序」の欄が空欄となり、処理実行ルールの（Ｃ
４）に従って、中間処理結果テーブルの「処理指示」の
欄に「個人筆記特性」と記入される。

【０４７５】図７２の枠番号１のフリーピッチ枠から抽
出された第８番目のパターンは、認識信頼度が９８％の
確率で文字カテゴリ「４」であると認識され、中間処理
結果テーブルの「文字コード」の欄に「４」と記入され
るとともに、中間処理結果テーブルの「信頼度」の欄に
「９８％」と記入される。

【０４７６】また、処理実行ルールの（Ｃ１）に従っ
て、中間処理結果テーブルの「処理完了」の欄に「黒枠
／フリーピッチ」と記入され、中間処理結果テーブルの
「処理順序」の欄が空欄となり、処理実行ルールの（Ｃ
４）に従って、中間処理結果テーブルの「処理指示」の
欄に「個人筆記特性」と記入される。

【０４７７】また、図７２の枠番号１のフリーピッチ枠
から抽出された第３番目のパターンは、文字カテゴリ
「２」であると認識され、図７２の枠番号１のフリーピ
ッチ枠から抽出された第４番目のパターンと図７２の枠
番号１のフリーピッチ枠から抽出された第５番目のパタ
ーンとは、文字列認識部１５の認識処理により１つの文
字に統合され、文字カテゴリ「７」であると認識され、
図７２の枠番号１のフリーピッチ枠から抽出された第６
番目のパターンは、文字カテゴリ「４」であると認識さ
れ、図７２の枠番号１のフリーピッチ枠から抽出された
第７番目のパターンは、文字カテゴリ「６」であると認
識される。

【０４７８】この結果、図７７の中間処理結果テーブル
の「文字数」の欄は「７」に変更される。次に、図７６
の中間処理結果テーブルの枠番号２の「処理順序」の欄
において、「基本」と指示されているので、処理実行ル
ールの（Ｃ１）に従って、図７２の枠番号２の一文字枠
から抽出されたパターンに対し、「基本」に対応する図
３の基本文字認識部１７の処理を実行し、基本文字につ
いての文字認識処理を行う。

【０４７９】基本文字認識部１７の文字認識処理によ
り、図７２の枠番号２の一文字枠から抽出されたパター
ンは、認識信頼度が９７％の確率で文字カテゴリ「５」
であると認識され、中間処理結果テーブルの「文字コー
ド」の欄に「５」と記入されるとともに、中間処理結果
テーブルの「信頼度」の欄に「９７％」と記入される。

【０４８０】また、中間処理結果テーブルの「処理呼び
出し」の欄に「消し線（有２）／基本」と記入され、中
間処理結果テーブルの「処理完了」の欄に「消し線／基
本」と記入され、中間処理結果テーブルの「処理順序」
の欄は空欄となり、処理実行ルールの（Ｃ４）に従っ
て、中間処理結果テーブルの「処理指示」の欄に「個人
筆記特性」と記入される。

【０４８１】次に、図７６の中間処理結果テーブルの枠
番号３の「処理順序」の欄は空欄となっているので、処
理実行ルールの（Ｃ４）に従って、中間処理結果テーブ
ルの「処理指示」の欄に「個人筆記特性」と記入され
る。

【０４８２】次に、図７６の中間処理結果テーブルの枠
番号４の「処理順序」の欄において、「一文字消し線」
と指示されているので、処理実行ルールの（Ｃ１）に従
って、図７２の枠番号４の一文字枠から抽出されたパタ
ーンに対し、「一文字消し線」に対応する図３の消し線
認識部２６の処理を実行し、訂正文字の候補として抽出
されたパターンの認識処理を行う。

【０４８３】消し線認識部２６の消し線認識処理によ
り、図７２の枠番号４の一文字枠から抽出されたパター
ンの認識信頼度が９５％と算出された結果、図７２の枠
番号４の一文字枠から抽出されたパターンは訂正文字と
みなされ、中間処理結果テーブルの「信頼度」の欄に
「９５％」と記入されるとともに、中間処理結果テーブ
ルの「処理完了」の欄に「黒枠／消し線」と記入され
る。

【０４８４】また、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入されるとともに、中間処理結
果テーブルの「処理順序」の欄は空欄となる。次に、図
７６の中間処理結果テーブルの枠番号５−１の「処理指
示」の欄に「終了」と記入されているので、図７２の枠
番号５−１の枠から抽出されたパターンについては、処
理を行わない。

【０４８５】次に、図７６の中間処理結果テーブルの枠
番号５−２の「処理順序」の欄は空欄となっているの
で、処理実行ルールの（Ｃ４）に従って、中間処理結果
テーブルの「処理指示」の欄に「個人筆記特性」と記入
される。

【０４８６】次に、図７６の中間処理結果テーブルの枠
番号５−３の「処理順序」の欄は空欄となっているの
で、処理実行ルールの（Ｃ４）に従って、中間処理結果
テーブルの「処理指示」の欄に「個人筆記特性」と記入
される。

【０４８７】次に、図７６の中間処理結果テーブルの枠
番号６−１−１の「処理指示」の欄に「終了」と記入さ
れているので、図７２の枠番号６−１−１の枠から抽出
されたパターンについては、処理を行わない。

【０４８８】次に、図７６の中間処理結果テーブルの枠
番号６−２−２の「処理指示」の欄に「終了」と記入さ
れているので、図７２の枠番号６−１−１の枠から抽出
されたパターンについては、処理を行わない。

【０４８９】以上に処理により、図７７の中間処理結果
テーブルが生成される。ここで、図７７の中間処理結果
テーブルの「処理指示」の欄には、「個人筆記特性」と
記入されているものがあるので、処理実行ルール（Ｃ
５）に従って処理を続行する。

【０４９０】図７８は、図７７の中間処理結果テーブル
に基づいて認識処理を続行し、その際に得られた結果を
示す図である。まず、図７６の中間処理結果テーブルの
枠番号１の第１番目のパターンの「処理指示」の欄に
「終了」と記入されているので、図７２の枠番号１のフ
リーピッチ枠から抽出された第１番目のパターンについ
ては、処理を行わない。

【０４９１】次に、図７５の中間処理結果テーブルの枠
番号１の第２番目のパターンの「処理指示」の欄に「個
人筆記特性」と記入されているので、処理実行ルールの
（Ｃ５）に従って、図７２の枠番号１のフリーピッチ枠
から抽出された第２番目のパターンに対し、「個人筆記
特性」に対応する図３のくせ字解析部２３の処理を実行
する。

【０４９２】このくせ字解析部２３は、例えば、図６８
〜図７１に示したように、同一筆者が書いた手書き文字
を各カテゴリごとにクラスタリングし、クラスタリング
により得られた手書き文字の第１のクラスタと距離が近
く、且つ他のカテゴリに属する第２のクラスタで要素数
が少ないものを第１のクラスタに統合することにより、
第２のクラスタに属する手書き文字のカテゴリを第１の
クラスタのカテゴリに修正する。

【０４９３】くせ字解析部２３の解析処理により、図７
２の枠番号１のフリーピッチ枠から抽出された第２のパ
ターンは、認識信頼度が９７％の確率で文字カテゴリ
「３」であると認識され、中間処理結果テーブルの「文
字コード」の欄に「３」と記入されるとともに、中間処
理結果テーブルの「信頼度」の欄に「９７％」と記入さ
れる。

【０４９４】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠／フリーピッチ／個人筆記特性」と記
入されるとともに、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入される。

【０４９５】次に、図７５の中間処理結果テーブルの枠
番号１の第８番目のパターンの「処理指示」の欄に「個
人筆記特性」と記入されているので、処理実行ルールの
（Ｃ５）に従って、図７２の枠番号１のフリーピッチ枠
から抽出された第８番目のパターンに対し、「個人筆記
特性」に対応する図３のくせ字解析部２３の処理を実行
する。

【０４９６】くせ字解析部２３の解析処理により、図７
２の枠番号１のフリーピッチ枠から抽出された第８番目
のパターンは、認識信頼度が９８％の確率で文字カテゴ
リ「４」であると認識され、中間処理結果テーブルの
「文字コード」の欄に「４」と記入されるとともに、中
間処理結果テーブルの「信頼度」の欄に「９８％」と記
入される。

【０４９７】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠／フリーピッチ／個人筆記特性」と記
入されるとともに、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入される。

【０４９８】次に、図７６の中間処理結果テーブルの枠
番号２の「処理指示」の欄に「個人筆記特性」と記入さ
れているので、処理実行ルールの（Ｃ５）に従って、図
７２の枠番号２の一文字枠から抽出されたパターンに対
し、「個人筆記特性」に対応する図３のくせ字解析部２
３の処理を実行する。

【０４９９】くせ字解析部２３の解析処理により、図７
２の枠番号２の一文字枠から抽出されたパターンは、認
識信頼度が９７％の確率で文字カテゴリ「５」であると
認識され、中間処理結果テーブルの「文字コード」の欄
に「５」と記入されるとともに、中間処理結果テーブル
の「信頼度」の欄に「９７％」と記入される。

【０５００】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠／フリーピッチ／個人筆記特性」と記
入されるとともに、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入される。

【０５０１】次に、図７６の中間処理結果テーブルの枠
番号３の「処理指示」の欄に「個人筆記特性」と記入さ
れているので、処理実行ルールの（Ｃ５）に従って、図
７２の枠番号３の一文字枠から抽出されたパターンに対
し、「個人筆記特性」に対応する図３のくせ字解析部２
３の処理を実行する。

【０５０２】くせ字解析部２３の解析処理により、図７
２の枠番号３の一文字枠から抽出されたパターンは、認
識信頼度が９７％の確率で文字カテゴリ「３」であると
認識され、中間処理結果テーブルの「文字コード」の欄
に「３」と記入されるとともに、中間処理結果テーブル
の「信頼度」の欄に「９７％」と記入される。

【０５０３】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠／フリーピッチ／個人筆記特性」と記
入されるとともに、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入される。

【０５０４】次に、図７６の中間処理結果テーブルの枠
番号４の「処理指示」の欄に「終了」と記入されている
ので、図７２の枠番号４の一文字枠から抽出されたパタ
ーンについては、処理を行わない。

【０５０５】次に、図７６の中間処理結果テーブルの枠
番号５−１の「処理指示」の欄に「終了」と記入されて
いるので、図７２の枠番号５−１の枠から抽出されたパ
ターンについては、処理を行わない。

【０５０６】次に、図７６の中間処理結果テーブルの枠
番号５−２の「処理指示」の欄に「個人筆記特性」と記
入されているので、処理実行ルールの（Ｃ５）に従っ
て、図７２の枠番号５−２の枠から抽出されたパターン
に対し、「個人筆記特性」に対応する図３のくせ字解析
部２３の処理を実行する。

【０５０７】くせ字解析部２３の解析処理により、図７
２の枠番号５−２の枠から抽出されたパターンは、認識
信頼度が９７％の確率で文字カテゴリ「２」であると認
識され、中間処理結果テーブルの「文字コード」の欄に
「２」と記入されるとともに、中間処理結果テーブルの
「信頼度」の欄に「９７％」と記入される。

【０５０８】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠／フリーピッチ／個人筆記特性」と記
入されるとともに、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入される。

【０５０９】次に、図７６の中間処理結果テーブルの枠
番号５−３の「処理指示」の欄に「個人筆記特性」と記
入されているので、処理実行ルールの（Ｃ５）に従っ
て、図７２の枠番号５−３の枠から抽出されたパターン
に対し、「個人筆記特性」に対応する図３のくせ字解析
部２３の処理を実行する。

【０５１０】くせ字解析部２３の解析処理により、図７
２の枠番号５−３の枠から抽出されたパターンは、認識
信頼度が９６％の確率で文字カテゴリ「４」であると認
識され、中間処理結果テーブルの「文字コード」の欄が
「４」に変更されるとともに、中間処理結果テーブルの
「信頼度」の欄に「９６％」と記入される。

【０５１１】また、中間処理結果テーブルの「処理完
了」の欄に「黒枠／フリーピッチ／個人筆記特性」と記
入されるとともに、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入される。

【０５１２】次に、図７６の中間処理結果テーブルの枠
番号６−１−１の「処理指示」の欄に「終了」と記入さ
れているので、図７２の枠番号６−１−１の枠から抽出
されたパターンについては、処理を行わない。

【０５１３】次に、図７６の中間処理結果テーブルの枠
番号６−２−２の「処理指示」の欄に「終了」と記入さ
れているので、図７２の枠番号６−１−１の枠から抽出
されたパターンについては、処理を行わない。

【０５１４】以上に処理により、図７８の中間処理結果
テーブルが生成される。ここで、図７８の中間処理結果
テーブルの「処理指示」の欄は、全ての処理対象に対し
て「終了」と記入されているので、処理実行ルール（Ｃ
６）に従って、全ての処理を終了する。

【０５１５】以上説明したように、本発明の実施例によ
れば、文字認識部１２及び非文字認識部２５では、環境
認識系１１で認識された入力画像の状態を処理するため
に適合した認識処理を行う。

【０５１６】例えば、環境認識系１１が罫線に接触した
文字を抽出した場合、罫線に接触した文字についての認
識処理を専用に行う接触文字認識部１３を使用し、環境
認識系１１がフリーピッチ文字列を抽出した場合、フリ
ーピッチ文字列についての認識処理を専用に行う文字列
認識部１５を使用し、環境認識系１１がかすれ文字を抽
出した場合、かすれ文字についての認識処理を専用に行
うかすれ文字認識部１９を使用し、環境認識系１１がつ
ぶれ文字を抽出した場合、つぶれ文字についての認識処
理を専用に行うつぶれ文字認識部２１を使用し、環境認
識系１１が非文字を抽出した場合、非文字についての認
識処理を専用に非文字認識部２５を使用する。

【０５１７】また、文字認識部１９又は非文字認識部２
５の認識結果についての信頼度を算出し、信頼度が低い
文字や非文字については、環境認識系１１、文字認識部
１９及び非文字認識部２５の間で相互にフィードバック
を行うようにして他の処理をやり直すようにし、信頼度
が高くなるか、又は実行できる処理がなくなった場合に
全体の処理を終了する。

【０５１８】このように、本発明の実施例によれば、文
字が書かれている環境に応じて、文字を認識する際に使
用する特徴及び識別法をアダプティブに変化させて認識
処理を実行することができるので、文書や帳票の様々な
環境に対応した高精度な文字認識が可能となる。

【０５１９】また、文字コードのみを認識結果として出
力するだけでなく、環境認識系１１による環境認識結果
を文字認識結果と同時に出力することができるととも
に、環境認識結果と文字認識結果とが相互に一致した時
に文字認識結果を出力することが可能となり、文字認識
結果に対する確認機能及び信頼性を向上させることがで
きる。

【０５２０】さらに、非文字認識部２５を専用に設け、
非文字認識を文字認識と独立して行うことができるの
で、文字認識及び非文字認識の信頼性を向上させること
ができる。

【０５２１】さらにまた、各文字が書かれている環境に
応じた独立な認識処理を行うことができるので、各認識
処理における辞書や知識を増加させることにより、認識
信頼度を向上させることができる。

【０５２２】

【発明の効果】以上説明したように、本発明によれば、
処理対象の状態を入力画像から抽出し、その状態に適し
た認識処理を処理対象ごとに選択することにより、様々
な状態を有する入力画像に対し、それぞれの状態に適し
たパターン認識処理を行うことができ、認識処理を精度
よく行うことが可能となる。また、処理対象の評価が、
その状態を抽出する時と、その処理対象についての認識
処理を行う時の両方で行われるので、認識処理の精度を
より一層向上させることができる。

【０５２３】また、本発明の一態様によれば、処理対象
の状態を入力画像から抽出し、第１の状態を有する処理
対象に対しては、第１の状態専用のパターン認識処理を
行い、第２の状態を有する処理対象に対しては、第２の
状態専用のパターン認識処理を行うことにより、第１の
状態を有する処理対象の認識処理と第２の状態を有する
処理対象の認識処理とが互いに相互作用を及ぼすことが
なくなり、認識処理を精度よく行うことが可能となる。

【０５２４】また、本発明の一態様によれば、様々な状
態を有する入力画像に対し、認識辞書を使い分けること
により、それぞれの状態に対して最適な認識辞書を使用
することができ、認識処理の精度を向上させることが可
能となる。

【０５２５】また、本発明の一態様によれば、様々な状
態を有する入力画像に対し、識別関数を使い分けること
により、それぞれの状態に対して最適な識別関数を使用
しながら認識処理を行うことができ、認識処理の精度を
向上させることが可能となる。

【０５２６】また、本発明の一態様によれば、様々な状
態を有する入力画像に対し、知識を使い分けることによ
り、それぞれの状態に対して最適な知識を使用しながら
認識処理を行うことができ、認識処理の精度を向上させ
ることが可能となる。

【０５２７】また、本発明の一態様によれば、認識処理
による信頼度が所定の値以上となるまで、同一の処理対
象に対して複数の認識処理を行うようにすることによ
り、認識処理の信頼度を上げることができ、認識処理の
精度を向上させることができる。

【０５２８】また、本発明の一態様によれば、非文字に
ついての認識処理と文字についての認識処理とを別々に
行うようにすることにより、文字を非文字とみなした
り、非文字を文字とみなしたりして認識処理が行われる
ことが減少し、認識処理を精度よく行うことが可能とな
る。

【図面の簡単な説明】

【図１】本発明の一実施例によるパターン認識装置の機
能的な構成を示すブロック図である。

【図２】図１の環境認識手段のより具体的な構成の一実
施例を示すブロック図である。

【図３】図１のパターン認識装置のより具体的な構成の
一実施例を示すブロック図である。

【図４】図３の環境認識系の全体的な動作の一実施例を
示すフローチャートである。

【図５】図４の前処理部の動作の一実施例を示すフロー
チャートである。

【図６】図４のレイアウト解析部の動作の一実施例を示
すフローチャートである。

【図７】図４の品質解析部の動作の一実施例を示すフロ
ーチャートである。

【図８】図４の訂正解析部の動作の一実施例を示すフロ
ーチャートである。

【図９】図４の文字認識／非文字認識への制御部の動作
の一実施例を示すフローチャートである。

【図１０】本発明の一実施例によるパターン認識装置の
システム構成を示すブロック図である。

【図１１】本発明の一実施例によるパターン認識装置の
より具体的なシステム構成を示すブロック図である。

【図１２】本発明の一実施例によるパターン認識装置の
ラベリング処理の一例を示す図である。

【図１３】本発明の一実施例によるパターン認識装置の
ラベリング処理の圧縮表現を示す図である。

【図１４】本発明の一実施例によるパターン認識装置の
テキスト抽出処理の一例を示す図である。

【図１５】本発明の一実施例によるパターン認識装置の
テキスト抽出処理における部分領域の一例を示す図であ
る。

【図１６】本発明の一実施例によるパターン認識装置の
罫線抽出処理における隣接投影法を説明する図である。

【図１７】本発明の一実施例によるパターン認識装置の
罫線抽出処理におけるパターンの投影結果を示す図であ
る。

【図１８】本発明の一実施例によるパターン認識装置の
罫線抽出処理を示すフローチャートである。

【図１９】本発明の一実施例によるパターン認識装置の
罫線抽出処理を示す図である。

【図２０】本発明の一実施例によるパターン認識装置の
罫線抽出処理におけるかすれ罫線の補完方法を説明する
図である。

【図２１】本発明の一実施例によるパターン認識装置の
かすれ罫線の補完方法を示すフローチャートである。

【図２２】本発明の一実施例によるパターン認識装置の
かすれ罫線の補完の際の探索方向を示す図である。

【図２３】本発明の一実施例によるパターン認識装置の
一文字枠抽出処理を示すフローチャートである。

【図２４】本発明の一実施例によるパターン認識装置の
ブロック枠抽出処理を示すフローチャートである。

【図２５】本発明の一実施例によるパターン認識装置の
枠及び表の種類を示す図である。

【図２６】本発明の一実施例によるパターン認識装置の
画像縮小処理を示すフローチャートである。

【図２７】本発明の一実施例によるパターン認識装置の
枠接触有無判断処理を説明する図である。

【図２８】本発明の一実施例によるパターン認識装置の
枠接触有無判断処理を示すフローチャートである。

【図２９】本発明の一実施例によるパターン認識装置の
消し線の種類を示す図である。

【図３０】本発明の一実施例によるパターン認識装置の
訂正文字の特徴量の算出方法を説明する図である。

【図３１】図３の基本文字認識部の構成例を示すブロッ
ク図である。

【図３２】図３の基本文字認識部における特徴ベクトル
の算出方法の一例を示す図である。

【図３３】図３の基本文字認識部における特徴ベクトル
間の距離の算出方法の一例を示す図である。

【図３４】図３の基本文字認識部における詳細識別法の
文字セグメントの抽出方法を説明する図である。

【図３５】図３の基本文字認識部における詳細識別法の
端点の検出方法を説明する図である。

【図３６】図３の基本文字認識部における詳細識別法の
角度変化の検出方法を説明する図である。

【図３７】図３の基本文字認識部における詳細識別法の
文字セグメントの対応関係を説明する図である。

【図３８】図３の基本文字認識部における詳細識別法の
処理を示すフローチャートである。

【図３９】図３の接触文字認識部における文字補完の方
法を示す図である。

【図４０】図３の接触文字認識部における再補完の方法
を示す図である。

【図４１】図３の接触文字認識部における補完誤読文字
の例を示す図である。

【図４２】図３の接触文字認識部における文字の学習方
法の一例を示すブロック図である。

【図４３】図３の接触文字認識部における枠接触文字の
生成方法を説明する図である。

【図４４】図３の接触文字認識部における枠接触文字の
生成例を示す図である。

【図４５】図３の接触文字認識部における知識テーブル
の一例を示す図である。

【図４６】図３の接触文字認識部における知識テーブル
に登録される変動種類及び変動量の一例を示す図であ
る。

【図４７】図３の接触文字認識部の領域強調による再認
識領域の一例を示す図である。

【図４８】図３の接触文字認識部の領域強調による再認
識方法を説明する図である。

【図４９】図３の接触文字認識部の領域強調による再認
識処理を示すフローチャートである。

【図５０】図３の接触文字認識部における文字の再認識
方法の一例を示すブロック図である。

【図５１】図３の接触文字認識部における文字の再認識
処理を示すフローチャートである。

【図５２】図３の文字列認識部の統計的処理によるパラ
メータの図形的意味を説明する図である。

【図５３】図３の文字列認識部の統計的処理を示すフロ
ーチャートである。

【図５４】図３の文字列認識部の分離文字処理によるパ
ラメータの図形的意味を説明する図である。

【図５５】図３の文字列認識部の分離文字処理を示すフ
ローチャートである。

【図５６】図３の文字列認識部の濁点処理によるパラメ
ータの図形的意味を説明する図である。

【図５７】図３の文字列認識部の濁点処理を示すフロー
チャートである。

【図５８】図３の文字列認識部の文字切り出し成否デー
タの算出処理を示すフローチャートである。

【図５９】図３の文字列認識部の文字切り出し信頼度の
定量化方法を示す図である。

【図６０】図３の文字列認識部の度数分布の生成方法を
示す図である。

【図６１】図３の文字列認識部の文字切り出し信頼度の
算出方法を示すフローチャートである。

【図６２】図３の文字列認識部における文字の切り出し
成功及び切り出し失敗のヒストグラム分布の一例を示す
図である。

【図６３】図３の文字列認識部における文字の切り出し
成功及び切り出し失敗の２群の重なり領域算出法を示す
図である。

【図６４】図３の文字列認識部における文字の切り出し
処理の流れを示す図である。

【図６５】図３の文字列認識部の非統計的処理における
文字の切り出し処理の流れを示す図である。

【図６６】図３のかすれ文字認識部の構成例を示すブロ
ック図である。

【図６７】図３の消し線認識部の処理の一例を示す図で
ある。

【図６８】図３のくせ字解析部によるクラスタリング処
理の流れを示す図である。

【図６９】図３のくせ字解析部によるクラスタリング処
理を示すフローチャートである。

【図７０】図３のくせ字解析部による文字カテゴリ判定
結果修正処理の流れを示す図である。

【図７１】図３のくせ字解析部による文字カテゴリ判定
結果修正処理を示すフローチャートである。

【図７２】本発明の一実施例によるパターン認識装置の
処理対象となる帳票の例を示す図である。

【図７３】本発明の一実施例によるパターン認識装置の
中間処理結果テーブルの一例を示す図である。

【図７４】本発明の一実施例によるパターン認識装置の
処理順序テーブルの一例を示す図である。

【図７５】本発明の一実施例によるパターン認識装置の
中間処理結果テーブルの一例を示す図である。

【図７６】本発明の一実施例によるパターン認識装置の
中間処理結果テーブルの一例を示す図である。

【図７７】本発明の一実施例によるパターン認識装置の
中間処理結果テーブルの一例を示す図である。

【図７８】本発明の一実施例によるパターン認識装置の
中間処理結果テーブルの一例を示す図である。

【図７９】従来のパターン認識装置の構成を示すブロッ
ク図である。

【符号の説明】

１環境認識手段２第１のパターン認識手段４第２のパターン認識手段６第Ｎのパターン認識手段３、５、７信頼度算出手段１ａ状態抽出手段１ｂ認識処理制御手段１ｃ中間処理結果テーブル作成手段１ｄ処理順序制御ルール格納手段１ｅ処理実行ルール格納手段１ｆ処理順序テーブル１１環境認識系１２文字認識部１３接触文字認識部１５文字列認識部１７基本文字認識部１９かすれ文字認識部２１つぶれ文字認識部２３くせ字解析部２５非文字認識部２６消し線認識部２８雑音認識部１４、１６、１８、２０、２２、２４、２７、２９知
識テーブル３０環境認識系３１レイアウト解析部３２訂正解析部３３文字認識系／非文字認識系３４基本文字認識部３５黒枠接触文字認識部３６フリーピッチ文字列認識部３７消し線認識部３８環境認識系３９くせ字解析部４０終了判定処理部４１画像格納部４２処理条件格納部４３ラベル画像格納部４４中間処理結果テーブル５０プログラムメモリ５１中央演算処理ユニット５２画像メモリ５３ワークメモリ５４バス５５インターフェイス回路５６ディスプレイ５７プリンタ５８メモリ５９スキャナ６０辞書ファイル

Claims

【特許請求の範囲】

【請求項１】入力画像のレイアウトを解析するレイア
ウト解析手段と、前記入力画像の品質を分析する品質分析手段と、前記入力画像の訂正状態を解析する訂正解析手段と、前記入力画像の処理対象の状態ごとにパターン認識処理
を行うパターン認識手段と、前記レイアウト、前記品質又は前記訂正状態に基づいて
前記入力画像の処理対象の状態を抽出し、処理対象の状
態ごとに前記パターン認識処理のいずれか１つ又は複数
を選択して認識処理を行わせる環境認識手段とを備える
ことを特徴とするパターン認識装置。
【請求項２】前記処理対象の状態ごとにパターンの切
り出しを行うパターン切り出し手段をさらに備えること
を特徴とする請求項１に記載のパターン認識装置。
【請求項３】前記環境認識手段は、前記処理対象の状
態についての判断結果に基づいて、前記パターン認識手
段による状態ごとの認識処理を前記処理対象ごとに記入
した中間処理結果テーブルを作成する中間処理結果テー
ブル作成手段を備えることを特徴とする請求項１に記載
のパターン認識装置。
【請求項４】前記環境認識手段は、同一の処理対象に
対して複数の認識処理が呼ばれた場合、前記認識処理に
よる信頼度が所定の値以上となるまで、優先順位に従っ
て認識処理を行わせることを特徴とする請求項１に記載
のパターン認識装置。
【請求項５】前記パターン認識手段は、文字の品質ご
とに設けられた認識辞書を備え、前記品質分析手段によ
り分析された品質に基づいて、前記認識辞書を使い分け
て文字の認識処理を行うことを特徴とする請求項１に記
載のパターン認識装置。
【請求項６】前記認識辞書は、標準辞書、かすれ文字
用の辞書、つぶれ文字用の辞書、白抜き文字用の辞書、
又は背景がテクスチャの文字用の辞書のうちの少なくと
も１つからなることを特徴とする請求項５に記載のパタ
ーン認識装置。
【請求項７】前記パターン認識手段は、前記処理対象
の状態に基づいて、知識を使い分けながら認識処理を行
うことを特徴とする請求項１に記載のパターン認識装
置。
【請求項８】前記パターン認識手段は、前記処理対象
の状態に基づいて、識別関数を使い分けながら認識処理
を行うことを特徴とする請求項１に記載のパターン認識
装置。
【請求項９】前記環境認識手段は、前記パターン認識
手段による状態ごとの認識処理を文書又は帳票のペ−ジ
単位で複数実行させることを特徴とする請求項１に記載
のパターン認識装置。
【請求項１０】前記品質分析手段は、所定の領域につ
いて、（面積、縦／横の長さがそれぞれ所定のしきい値
以下の連結領域の数）／（前記所定の領域の全ての連結
領域の数）の値が、所定値よりも大きい時にかすれと判
断することを特徴とする請求項１に記載のパターン認識
装置。
【請求項１１】前記品質分析手段は、所定の領域につ
いて、（かすれた罫線を補完した際の補完された部分の
長さの合計）／（各罫線の長さの合計）の値が、所定値
よりも大きい時にかすれと判断することを特徴とする請
求項１に記載のパターン認識装置。
【請求項１２】前記品質分析手段は、所定の領域につ
いて、（黒画素密度が所定のしきい値より大きい連結領
域の数）／（前記所定の領域の全ての連結領域の数）の
値が、所定値よりも大きい時につぶれと判断することを
特徴とする請求項１に記載のパターン認識装置。
【請求項１３】処理対象の状態を入力画像から抽出す
る状態抽出手段と、前記処理対象の状態ごとにパターン認識処理を行うパタ
ーン認識手段と、前記状態抽出手段により抽出された前記処理対象の状態
ごとに、前記パターン認識処理のいずれか１つ又は複数
を呼び出して認識処理を行わせる認識処理制御手段とを
備えることを特徴とするパターン認識装置。
【請求項１４】前記状態抽出手段は、入力画像から所定の範囲の大きさを有する連結パターン
を文字の候補として抽出する文字抽出手段と、前記文字の候補のうち、隣接して存在するものを文字列
の候補として抽出する文字列抽出手段と、前記入力画像から罫線を抽出する罫線抽出手段と、前記罫線で４方を囲むパターンを枠として抽出する枠抽
出手段と、前記枠と接触している文字を抽出する接触文字抽出手段
と、前記入力画像のかすれ状態を分析するかすれ分析手段
と、前記入力画像のつぶれ状態を分析するつぶれ分析手段
と、前記入力画像の訂正状態を抽出する訂正特徴抽出手段と
を備えることを特徴とする請求項１３に記載のパターン
認識装置。
【請求項１５】前記枠抽出手段は、前記罫線の連結状態及び枠の大きさに基づいて、一文字
枠、ブロック枠、フリーピッチ枠、規則的な表、又は不
規則な表のうちのいずれか１つの属性を前記枠に付与す
る属性付与手段を備えることを特徴とする請求項１４に
記載のパターン認識装置。
【請求項１６】前記接触文字抽出手段は、前記枠抽出手段により抽出された枠の内側を枠に沿って
走査する走査手段と、前記走査により交差するパターンが存在するかどうかを
検出する交差検出手段と、前記交差検出手段により交差するパターンが検出された
場合、前記パターンを走査した枠についての枠接触文字
であると判断する判断手段と、前記パターンが走査した枠の外側から内側にはみだした
ものであるかどうかを検出するはみだし検出手段と、枠の外側から内側にはみだしているパターンを、走査し
た枠についての枠接触文字から除外する除外手段とを備
えることを特徴とする請求項１４に記載のパターン認識
装置。
【請求項１７】前記訂正特徴抽出手段は、矩形内の画像を所定の一定方向に沿って走査した際の、
白画素から黒画素又は黒画素から白画素に変化する回数
を計数することにより、所定方向の線密度を算出する線
密度算出手段と、画像中での互いに連結している連結成分の個数から、そ
の画像が有する穴の個数を減算することにより、オイラ
ー数を算出するオイラー数算出手段と、注目する画像自体の面積と注目する画像の外接矩形の面
積との比を計算することにより、黒画素密度を算出する
黒画素密度算出手段と、前記線密度が所定の値以上の場合、前記矩形内の画像を
訂正文字の候補とする線密度判定手段と、前記オイラー数の絶対値が所定の値以上で、且つ負の値
となる場合、前記画像を訂正文字の候補とするオイラー
数判定手段と、前記黒画素密度が所定の値以上の場合、前記画像を訂正
文字の候補とする黒画素密度判定手段とを備えることを
特徴とする請求項１４に記載のパターン認識装置。
【請求項１８】前記パターン認識手段は、文字についてのパターン認識を行う文字認識手段と、文字列についてのパターン認識を行う文字列認識手段
と、枠に接触した文字についてのパターン認識を行う接触文
字認識手段と、かすれ文字についてのパターン認識を行うかすれ文字認
識手段と、つぶれ文字についてのパターン認識を行うつぶれ文字認
識手段と、訂正文字についてのパターン認識を行う訂正文字認識手
段と、くせ字についてのパターン認識を行うくせ字認識手段と
を備えることを特徴とする請求項１４に記載のパターン
認識装置。
【請求項１９】前記文字認識手段は、入力された未知文字の特徴を特徴ベクトルとして抽出す
る特徴抽出部と、文字カテゴリの特徴を特徴ベクトルとして予め格納して
いる基本辞書と、前記未知文字の特徴ベクトルと前記文字カテゴリの特徴
ベクトルとの間の距離を算出し、前記特徴ベクトル間の
距離を最小とする文字カテゴリを前記未知文字として認
識する照合部とを備えることを特徴とする請求項１８に
記載のパターン認識装置。
【請求項２０】前記文字認識手段は、未知文字の輪郭の凹凸の個数を算出することにより、前
記未知文字の変形度を算出する変形度算出手段と、文字カテゴリの特徴を特徴ベクトルとして予め格納して
いるセグメント辞書と、文字の輪郭を端点で分割し、文字セグメントを生成する
文字セグメント生成部と、前記変形度が所定値以上の場合、前記文字セグメントの
角度変化の累積値が互いに最も近くなるように、未知文
字の文字セグメントと前記文字カテゴリの文字セグメン
トとの対応関係を生成する対応関係生成部と、前記対応関係に基づいて、前記未知文字の特徴ベクトル
と前記文字カテゴリの特徴ベクトルとの間の距離を算出
し、前記特徴ベクトル間の距離を最小とする文字カテゴ
リを前記未知文字として認識する照合部とを備えること
を特徴とする請求項１８に記載のパターン認識装置。
【請求項２１】前記文字列認識手段は、パターンの特徴を示すＰ個の特性値により表されるサン
プルデータを、切り出し成功を示す第１の群と切り出し
失敗を示す第２の群とに分類し、前記第１の群と前記第
２の群の各重心から等距離となるように構成された判別
面をＰ次元空間内に生成する判別面生成手段と、前記Ｐ次元空間内において、入力データについてのＰ個
の特性値の位置が、前記判別面からどのくらい離れてい
るかを示す距離を求め、前記距離に基づいて、前記入力
データの切り出し信頼度を算出する切り出し信頼度算出
手段と、前記入力データの切り出し信頼度と切り出された入力デ
ータの認識信頼度とに基づいて、入力データの切り出し
位置を決定する切り出し決定手段とを備えることを特徴
とする請求項１８に記載のパターン認識装置。
【請求項２２】前記接触文字認識手段は、枠接触文字から枠を除去する枠除去手段と、枠を除去することにより分離した線分の方向に基づい
て、前記枠を除去することによりかすれた文字を補完す
る文字補完手段と、枠を除去することにより分離したパターンのうち、前記
枠接触文字の状態の時に互いに連結していたパターンの
間を連結することにより、前記枠に重なっていた線分を
補完する再補完手段と、文字と枠とを所定の条件で接触させた学習パターンを生
成する学習パターン生成手段と、前記学習パターンの認識信頼度を前記所定の条件ととも
に格納し、前記認識信頼度が所定の値以下の場合、前記
学習パターンについての再文字認識方法を格納している
知識テーブルと、前記文字補完手段により補完されたパターン又は前記再
補完手段により補完されたパターンが、前記所定の条件
を満たす場合、知識テーブルに格納された再文字認識方
法により再文字認識を行う再文字認識手段とを備えるこ
とを特徴とする請求項１８に記載のパターン認識装置。
【請求項２３】前記かすれ文字認識手段は、入力された未知文字の特徴を特徴ベクトルとして抽出す
る特徴抽出部と、かすれ文字についての文字カテゴリの特徴を特徴ベクト
ルとして予め格納しているかすれ辞書と、前記未知文字の特徴ベクトルと前記文字カテゴリの特徴
ベクトルとの間の距離を算出し、前記特徴ベクトル間の
距離を最小とする文字カテゴリを前記未知文字として認
識する照合部とを備えることを特徴とする請求項１８に
記載のパターン認識装置。
【請求項２４】前記つぶれ文字認識手段は、入力された未知文字の特徴を特徴ベクトルとして抽出す
る特徴抽出部と、つぶれ文字についての文字カテゴリの特徴を特徴ベクト
ルとして予め格納しているつぶれ辞書と、前記未知文字の特徴ベクトルと前記文字カテゴリの特徴
ベクトルとの間の距離を算出し、前記特徴ベクトル間の
距離を最小とする文字カテゴリを前記未知文字として認
識する照合部とを備えることを特徴とする請求項１８に
記載のパターン認識装置。
【請求項２５】前記訂正文字認識手段は、訂正文字の候補として抽出されたパターンの所定方向の
ヒストグラム値を算出するヒストグラム値算出手段と、前記ヒストグラム値が所定値以上の線分を除去する線分
除去手段と、前記線分を除去することにより、前記パターンのかすれ
た部分を補完して補完パターンを生成する補完手段と、前記補完パターンについての文字認識を行う文字認識手
段と、前記補完パターンが文字と認識された場合は、前記線分
除去手段により除去した線分を消し線とみなし、前記補
完パターンがリジェクトされた場合は、前記線分除去手
段により除去した線分を文字の一部とみなす消し線認識
手段とを備えることを特徴とする請求項１８に記載のパ
ターン認識装置。
【請求項２６】前記くせ字認識手段は、同一筆者が書いた手書き文字を各カテゴリごとにクラス
タリングすることにより、前記手書き文字を要素とする
複数のクラスタを各カテゴリ内に生成するクラスタリン
グ手段と、前記クラスタリング手段により生成されたクラスタか
ら、要素数が所定値以下のクラスタを抽出するクラスタ
抽出手段と、前記クラスタ抽出手段により抽出された第１のクラスタ
と、他のカテゴリに属する第２のクラスタとのクラスタ
間距離を算出するクラスタ間距離算出手段と、前記第１のクラスタと第２のクラスタとの間の距離が所
定値以下の場合、第１のクラスタと第２のクラスタとを
統合し、前記第１のクラスタに属する手書き文字のカテ
ゴリを前記第２のクラスタのカテゴリに修正するカテゴ
リ修正手段とを備えることを特徴とする請求項１８に記
載のパターン認識装置。
【請求項２７】前記認識処理制御手段は、前記文字抽出手段が文字の候補を抽出した場合、前記文
字認識手段を呼び出し、前記文字列抽出手段が文字列の
候補を抽出した場合、前記文字列認識手段を呼び出し、
前記接触文字抽出手段が枠と接触している文字を抽出し
た場合、前記接触文字認識手段を呼び出し、前記かすれ
分析手段が前記入力画像のかすれ状態を抽出した場合、
前記かすれ文字認識手段を呼び出し、前記つぶれ分析手
段が前記入力画像のつぶれ状態を抽出した場合、前記つ
ぶれ文字認識手段を呼び出し、前記訂正特徴抽出が前記
入力画像の訂正状態を抽出した場合、前記訂正文字認識
手段を呼び出すことを特徴とする請求項１８に記載のパ
ターン認識装置。
【請求項２８】前記認識処理制御手段は、前記文字認
識手段による文字としての信頼度が所定の値以上の場
合、前記くせ字認識手段を呼び出すことを特徴とする請
求項１８に記載のパターン認識装置。
【請求項２９】前記認識処理制御手段は、処理対象の状態の入力画像からの抽出結果に基づいて、
前記パターン認識手段による認識処理のいずれを呼び出
すかを示す呼び出し手順を格納している処理順序制御ル
ール格納手段と、同一の処理対象に対する複数の認識処理が前記パターン
認識手段から呼び出された際の呼び出し順序を格納した
処理順序テーブルと、前記呼び出し手順及び前記呼び出し順序に基づいて、前
記パターン認識手段による認識処理の実行順序を前記処
理対象ごとに示した中間処理結果テーブルを作成する中
間処理結果テーブル作成手段と、前記中間処理結果テーブルに記入された認識処理の実行
結果に基づいて、次の処理の実行を指示する手順を格納
している処理実行ルール格納手段とを備えることを特徴
とする請求項１３に記載のパターン認識装置。
【請求項３０】入力画像から文字を抽出する文字抽出
手段と、入力画像から非文字を抽出する非文字抽出手段と、文字についての認識処理を行う文字認識手段と、非文字についての認識処理を行う非文字認識手段と、前記文字抽出手段が文字を抽出した場合、前記文字認識
手段により認識処理を行わせ、前記非文字抽出手段が非
文字を抽出した場合、前記非文字認識手段により認識処
理を行わせる環境認識手段とを備えることを特徴とする
パターン認識装置。
【請求項３１】前記環境認識手段は、前記文字抽出手段が文字を抽出した場合、前記文字認識
手段による認識結果についての確からしさを示す信頼度
を算出し、前記文字認識手段による認識結果の信頼度が
所定の値より小さい場合、前記文字抽出手段が抽出した
文字を非文字とみなして前記非文字認識手段により認識
処理を行わせることを特徴とする請求項３０に記載のパ
ターン認識装置。
【請求項３２】前記環境認識手段は、前記非文字抽出手段が非文字を抽出した場合、前記非文
字認識手段による認識結果についての確からしさを示す
信頼度を算出し、前記非文字認識手段による認識結果の
信頼度が所定の値より小さい場合、前記非文字抽出手段
が抽出した非文字を文字とみなして前記文字認識手段に
より認識処理を行わせることを特徴とする請求項３０に
記載のパターン認識装置。
【請求項３３】入力画像から所定の特徴量を抽出する
環境認識手段と、前記環境認識手段により抽出された特徴量に基づいて、
パターン認識処理を変更して実行可能なパターン認識手
段とを備えることを特徴とするパターン認識装置。
【請求項３４】第１の状態を有する処理対象について
のパターン認識処理を行う第１のパターン認識手段と、第２の状態を有する処理対象についてのパターン認識処
理を行う第２のパターン認識手段と、前記処理対象についての状態を入力画像から抽出し、前
記第１の状態を有する処理対象については、前記第１の
パターン認識手段による認識処理を行わせ、前記第２の
状態を有する処理対象については、前記第２のパターン
認識手段による認識処理を行わせる環境認識手段とを備
えることを特徴とするパターン認識装置。
【請求項３５】前記環境認識手段は、前記第１の状態と前記第２の状態とを同一の処理対象か
ら抽出した場合、その処理対象については、前記第１の
パターン認識手段による認識処理と前記第２のパターン
認識手段による認識処理とを行わせることを特徴とする
請求項３４に記載のパターン認識装置。
【請求項３６】前記環境認識手段は、前記第１のパタ
ーン認識手段による認識結果及び前記第２のパターン認
識手段による認識結果についての確からしさを示す信頼
度を算出し、前記信頼度が所定の値以上の場合、その認
識結果を最終結果として出力することを特徴とする請求
項３４に記載のパターン認識装置。
【請求項３７】処理対象の状態を入力画像から抽出
し、その状態に適した認識処理を前記処理対象ごとに選
択することにより、パターン認識を行うことを特徴とす
るパターン認識方法。
【請求項３８】処理対象についての状態を入力画像か
ら抽出するステップと、第１の状態を有する処理対象に対し、前記第１の状態専
用のパターン認識処理を行うステップと、第２の状態を有する処理対象に対し、前記第２の状態専
用のパターン認識処理を行うステップとを備えることを
特徴とするパターン認識方法。
【請求項３９】処理対象についての状態を入力画像か
ら抽出する機能と、第１の状態を有する処理対象に対し、第１の状態専用の
パターン認識処理を行う機能と、第２の状態を有する処理対象に対し、前記第２の状態専
用のパターン認識処理を行う機能とをコンピュータに実
行させるプログラムを格納したコンピュータ読み取り可
能な記憶媒体。