JP3280577B2

JP3280577B2 - 文字認識装置

Info

Publication number: JP3280577B2
Application number: JP21458196A
Authority: JP
Inventors: 悦伸堀田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1996-08-14
Filing date: 1996-08-14
Publication date: 2002-05-13
Anticipated expiration: 2016-08-14
Also published as: JPH1063785A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、同一筆記者により
記入された多数の入力文字の文字カテゴリを認識する文
字認識装置に関し、特に、文字サンプルを収集すること
なく、手書きの入力文字を高い精度でもって認識できる
ようにする文字認識装置に関する。

【０００２】手書き文字を認識する文字認識装置では、
筆記者の筆記特性を考慮することで文字認識率を高める
構成を構築していく必要がある。

【０００３】

【従来の技術】文字認識装置は、入力文字の持つ特徴
と、辞書に登録されている文字カテゴリの持つ特徴とを
照合することで、入力文字の文字カテゴリを認識する処
理を行う。

【０００４】文字認識装置で用意する辞書は汎用的に作
成されていることから、手書き文字を認識対象とすると
きには、一般的には十分な認識率が得られない。そこ
で、従来では、手書き文字を認識対象とするときには、
前もって筆記者毎に文字サンプルを収集して、それに基
づいて、辞書に登録する文字カテゴリの特徴を作成する
という方法を採ったり、それに基づいて、入力文字の特
徴を抽出する際に、筆記者に合わせた補正を行うという
方法を採ることで、手書き文字の認識率を高めるように
していた。

【０００５】

【発明が解決しようとする課題】しかしながら、従来技
術のように、筆記者に合わせた辞書を作成したり、筆記
者に合わせた補正を行うという方法を採っていると、文
字認識に入る前に、文字サンプルを収集しておかなくて
はならないという問題点がある。

【０００６】そして、筆記者の筆記特性も月日とともに
少しずつ変わっていくことから、高い文字認識率を維持
するためには、ある期間毎に文字サンプルを再収集して
辞書を作成し直したり、補正のパラメータを作成し直さ
なくてはならないという問題がある。

【０００７】更に、認識対象となる筆記者の数が多いと
きには、筆記者毎に辞書を用意したり補正のパラメータ
を管理する必要があることから、メモリ量が莫大となる
という問題点がある。

【０００８】一方、手書き文字認識装置の１つの利用形
態として、伝票に記入された文字を認識する場合のよう
に、同一筆記者により記入された多数の文字を入力とし
て、それらの入力文字を認識していくというものがあ
る。

【０００９】このような利用形態での手書き文字の認識
率を文字サンプルを要求することなく高める方法とし
て、本出願人は、先に出願の特願平８-30217号で、入力
文字の特徴ベクトルをクラスタリングすることでクラス
タを生成する構成を採って、他の文字カデコリのクラス
タに近いクラスタがあるときには、その２つのクラスタ
の内の入力文字数の少ない方のクラスタの認識文字カテ
ゴリを、もう一方の入力文字数の多い方のクラスタの認
識文字カテゴリに修正していくという新たな文字認識ア
ルゴリズムを提案した。

【００１０】本発明は、この提案した文字認識アルゴリ
ズムを一歩進めて、更に高い認識率の実現を図るもので
ある。

【００１１】

【課題を解決するための手段】図１に本発明の原理構成
を図示する。図中、１は本発明を具備する文字認識装置
であって、同一筆記者により記入された多数の入力文字
の文字カテゴリを認識するものである。

【００１２】本発明の文字認識装置１は、辞書１０と、
算出手段１１と、第１の格納手段１２と、認識手段１３
と、第２の格納手段１４と、第３の格納手段１５と、ク
ラスタリング手段１６と、修正手段１７と、出力手段１
８とを備える。

【００１３】この辞書１０は、各文字カテゴリの持つ特
徴ベクトルを管理する。算出手段１１は、入力文字の持
つ特徴ベクトルを算出する。第１の格納手段１２は、算
出手段１１の算出する特徴ベクトルを入力文字と対応を
取りつつ格納する。

【００１４】認識手段１３は、算出手段１１の算出する
特徴ベクトルと、辞書１０に登録される各文字カテゴリ
の持つ特徴ベクトルとの間の距離値を算出して、最も小
さな距離値を示す文字カテゴリを入力文字の文字カテゴ
リとして認識するとともに、その認識文字カテゴリとの
間の距離値が規定値以下とならないときには、入力文字
を認識不可能としてリジェクトする。

【００１５】第２の格納手段１４は、認識手段１３の算
出する入力文字と認識文字カテゴリとの間の距離値を入
力文字と対応を取りつつ格納する。第３の格納手段１５
は、認識手段１３の認識する文字カテゴリを入力文字と
対応を取りつつ格納する。

【００１６】クラスタリング手段１６は、算出手段１１
の算出する特徴ベクトルを、認識手段１３の認識する文
字カテゴリ毎にクラスタリングすることで、文字カテゴ
リ毎に１つ又は複数のクラスタを生成する。

【００１７】修正手段１７は、第３の格納手段１５に格
納される認識手段１３の認識結果を修正するものであっ
て、クラスタリング手段１６の生成するクラスタの中か
ら、誤読の可能性の高いクラスタを抽出する抽出手段１
９と、算出手段１１の算出する特徴ベクトルを使って、
抽出手段１９の抽出したクラスタに最も距離の近い他文
字カテゴリのクラスタを特定したり、認識手段１３のリ
ジェクトした入力文字に最も距離の近い他文字カテゴリ
のクラスタを特定する特定手段２０と、抽出手段１９の
抽出したクラスタに属する入力文字の認識文字カテゴリ
を変更したり、リジェクト入力文字を認識可能文字に変
更するとともに、その認識文字カテゴリを設定する変更
手段２１と、抽出手段１９の抽出したクラスタに属する
入力文字をリジェクト文字に変更する第２の変更手段２
２とを備える。

【００１８】出力手段１８は、修正手段１７により修正
された認識手段１３の認識結果を外部に出力する。この
ように構成される本発明の文字認識装置１では、クラス
タリング手段１６は、算出手段１１の算出する特徴ベク
トルを、認識手段１３の認識する文字カテゴリ毎にクラ
スタリングすることで、文字カテゴリ毎に１つ又は複数
のクラスタを生成する。

【００１９】例えば、クラスタリング手段１６は、最
初、階層クラスタリング手法に従ってクラスタリングを
行ってクラスタを生成し、続いて、そのクラスタを初期
状態として用いて非階層クラスタリング手法に従ってク
ラスタリングを行うことで、文字カテゴリ毎に１つ又は
複数のクラスタを生成するのである。

【００２０】このクラスタの生成を受けて、抽出手段１
９は、生成されたクラスタの中から、例えば、クラスタ
内の入力文字数が規定値以下となるクラスタを抽出する
ことで、誤読の可能性の高いクラスタを抽出し、これを
受けて、特定手段２０は、算出手段１１の算出する特徴
ベクトルを使って、抽出された誤読の可能性の高いクラ
スタに最も距離の近い他文字カテゴリのクラスタを特定
する。

【００２１】このとき、特定手段２０は、特定処理の高
速化や正確さを図るために、抽出された誤読の可能性の
高いクラスタの文字カテゴリに応じて特定対象とする他
文字カテゴリを予め限定しておくことがあり、また、特
定対象とする他文字カテゴリを認識手段１３の算出する
距離値の小さな上位の文字カテゴリに限定することがあ
る。

【００２２】そして、変更手段２１は、抽出された誤読
の可能性の高いクラスタと、特定手段２０の特定するそ
れに最も距離の近い他文字カテゴリのクラスタとの間の
距離値が規定値以下を示すときに、抽出された誤読の可
能性の高いクラスタに属する入力文字の内、認識文字カ
テゴリとの間の距離値が規定値以上を示すものを変更対
象として、その認識文字カテゴリを特定手段２０の特定
するクラスタの文字カテゴリに変更する。

【００２３】すなわち、誤読の可能性の高いクラスタを
抽出すると、それに最も距離の近い他文字カテゴリのク
ラスタを特定して、それとの類似度が大きいときには、
その誤読の可能性の高いクラスタに含まれる認識確信度
の低い入力文字の認識文字カテゴリを、その最も距離の
近いクラスタの認識文字カテゴリに変更するのである。

【００２４】一方、第２の変更手段２２は、抽出された
誤読の可能性の高いクラスタと、全他文字カテゴリの全
クラスタとの間の距離値が規定値以上を示すときに、抽
出された誤読の可能性の高いクラスタに属する入力文字
をリジェクト文字に変更する。

【００２５】すなわち、誤読の可能性の高いクラスタを
抽出するときに、それが全他文字カテゴリの全クラスタ
と類似しないときには、その誤読の可能性の高いクラス
タに属する入力文字をリジェクト文字に変更するのであ
る。

【００２６】一方、特定手段２０は、算出手段１１の算
出する特徴ベクトルを使って、認識手段１３のリジェク
トする入力文字に最も距離の近い他文字カテゴリのクラ
スタを特定する。

【００２７】このとき、特定手段２０は、特定処理の高
速化を図るために、リジェクト文字の認識文字カテゴリ
に応じて特定対象とする他文字カテゴリを予め限定して
おくことがあり、また、特定対象とする他文字カテゴリ
を認識手段１３の算出する距離値の小さな上位の文字カ
テゴリに限定することがある。

【００２８】そして、変更手段２１は、リジェクトされ
た入力文字と、特定手段２０の特定するそれに最も距離
の近い他文字カテゴリのクラスタとの間の距離値が規定
値以下を示すときに、リジェクトされた入力文字の内、
認識文字カテゴリとの距離値が規定値以下を示すものを
変更対象として、それを認識可能文字に変更するととも
に、その認識文字カテゴリを特定手段２０の特定するク
ラスタの文字カテゴリに設定する。

【００２９】すなわち、リジェクト入力文字に最も距離
の近い他文字カテゴリのクラスタを特定して、それとの
類似度が大きいときにあって、そのリジェクト入力文字
のリジェクト確信度が低いときには、そのリジェクト入
力文字を認識可能文字に変更するとともに、その認識文
字カテゴリをその最も距離の近いクラスタの文字カテゴ
リに設定するのである。

【００３０】このようにして、本発明の文字認識装置１
では、入力文字の特徴ベクトルをクラスタリングするこ
とでクラスタを生成する構成を採って、その中から誤読
の可能性の高いクラスタを抽出して、それに最も距離の
近い他文字カテゴリのクラスタを特定し、それとの類似
度が大きいときには、その誤読の可能性の高いクラスタ
に含まれる入力文字の内、認識確信度の低い入力文字の
認識文字カテゴリを、その類似するクラスタの文字カテ
ゴリに変更する構成を採ることから、前もって文字サン
プルを収集しなくても、手書き文字の正確な文字認識処
理を実行できるようになる。

【００３１】そして、その誤読の可能性の高いクラスタ
が全他文字カテゴリの全クラスタと類似しないときに
は、その誤読の可能性の高いクラスタに属する入力文字
をリジェクト文字に変更するので、手書き文字の正確な
文字認識処理を実行できるようになる。

【００３２】そして、リジェクト入力文字に最も距離の
近い他文字カテゴリのクラスタを特定して、それとの類
似度が大きいときにあって、そのリジェクト入力文字の
リジェクト確信度が低いときには、そのリジェクト入力
文字を認識可能文字に変更するとともに、その認識文字
カテゴリをその類似するクラスタの文字カテゴリに設定
するので、手書き文字の正確な文字認識処理を実行でき
るようになる。

【００３３】

【発明の実施の形態】以下、実施の形態に従って本発明
を詳細に説明する。図２に、本発明の文字認識装置１の
装置構成を図示する。

【００３４】この図に示すように、本発明の文字認識装
置１は、認識対象となる文書のイメージを読み取るスキ
ャナ３０と、スキャナ３０の読み取った文書イメージを
格納する文書イメージ格納メモリ３１と、各文字カテゴ
リの持つ特徴ベクトルを管理する辞書３２と、文書イメ
ージ格納メモリ３１に格納される文書イメージの中か
ら、同一筆記者により記入された多数の文字を認識対象
の文字として抽出して、それらの認識対象文字の持つ特
徴ベクトルを使い、クラスタリング手法を用いつつ、そ
れらの認識対象文字の文字カテゴリを認識する認識プロ
グラム３３と、認識プログラム３３の抽出する認識対象
文字の文書イメージを格納する処理文書イメージ格納メ
モリ３４と、認識プログラム３３の算出する認識対象文
字の持つ特徴ベクトルを格納する特徴ベクトル格納メモ
リ３５と、認識プログラム３３の認識結果を格納する認
識結果格納メモリ３６と、認識プログラム３３の求める
認識対象文字と認識文字カテゴリとの間の距離値を格納
する辞書距離値格納メモリ３７と、認識プログラム３３
の実行するクラスタリング結果を格納するクラスタ情報
格納メモリ３８とを備える。

【００３５】図３に、認識プログラム３３の実行する処
理フローの一実施例を図示する。次に、この処理フロー
に従って、本発明について詳細に説明する。認識プログ
ラム３３は、同一筆記者により記入された文書の文字認
識要求が発行されると、図３の処理フローに示すよう
に、先ず最初に、ステップ１で、文書イメージ格納メモ
リ３１に格納される文書イメージの中から、同一筆記者
により記入された文書を抽出して処理文書イメージ格納
メモリ３４に格納する。

【００３６】この抽出処理は、例えば、文書イメージ格
納メモリ３１に格納される文書イメージの中に、同一筆
記者により記入された箇所であることを示すマークが付
いているときには、そのマークの指す文書を取り出すこ
とで実行する。また、同一筆記者単位に記入されること
が決められている図４に示すような文書については、そ
の部分を取り出すことで実行する。

【００３７】続いて、ステップ２で、ステップ１で格納
した処理文書イメージ格納メモリ３４から同一筆記者に
より記入された文書を読み出して、その文書の持つ文字
を１文字ずつ順番に切り出す。この文字の切り出し処理
は従来方法に従って実行する。

【００３８】続いて、ステップ３で、ステップ２で切り
出した各文字の持つ特徴ベクトルを順番に算出して、そ
れを特徴ベクトル格納メモリ３５に順番に格納する。こ
の特徴ベクトルとしては、従来方法で用いられているど
のようなものであってもよい。このとき、特徴ベクトル
の次元数が大きいときには、必要に応じて、主成分分析
法や判別分析法等の統計手法を用いて次元数の削減を行
うことになる。

【００３９】例えば、文字を枡目に区画し、その枡目の
黒い部分の値を“１”、白い部分の値を“０”として、
枡目の左上から右下まで枡目の値を順番に並べたものを
特徴ベクトルとして用いる場合には、図５に示すような
特徴ベクトルを算出する。ここで、図５では、文字
“２”の特徴ベクトルを例示しており、記号２ａで示さ
れる手書きの文字“２”と、記号２ｂで示される手書き
の文字“２”と、記号２ｃで示される手書きの文字
“２”とは、手書きによりパターンが若干異なることか
ら、その特徴ベクトルも若干異なることになる。

【００４０】続いて、ステップ４で、ステップ２で切り
出した各文字の文字カテゴリを認識して認識結果格納メ
モリ３６に格納するとともに、その認識文字カテゴリと
の間の距離値を辞書距離値格納メモリ３７に格納する。

【００４１】この認識処理は、ステップ３で格納した各
文字の持つ特徴ベクトルを特徴ベクトル格納メモリ３５
から順番に読み出して、その読み出した特徴ベクトル
と、辞書３２に登録される各文字カテゴリの持つ特徴ベ
クトルとの間の距離値を従来方法に従って算出し、最も
小さな距離値を特定して、その最小距離値を辞書距離値
格納メモリ３７に格納するとともに、その最小距離値の
示す文字カテゴリを認識結果として認識結果格納メモリ
３６に格納することで行う。そして、その認識文字カテ
ゴリとの間の距離値が規定値以下とならないとき、すな
わち、認識の確信度が低いときには、その文字を認識不
可能なリジェクト文字として設定することで行う。

【００４２】例えば、図６に示すように、図５に示した
記号２ｂで示される手書きの文字の特徴ベクトルと、辞
書３２に登録される文字“１”／“２”／“３”／
“４”の特徴ベクトルとの間の距離値を、「ｄ_ij＝（ｘ
_i−ｘ_j）の絶対値」に従って算出して、その中の最も
小さな距離値の指す文字を特定することで、その記号２
ｂで示される手書きの文字が“２”であることを認識す
るのである。

【００４３】続いて、ステップ５で、認識文字カテゴリ
毎に、特徴ベクトル格納メモリ３５に格納した特徴ベク
トルに対してクラスタリング処理を施すことで、距離の
近いものをまとめることで定義されるクラスタを生成し
て、そのクラスタ情報をクラスタ情報格納メモリ３８に
格納する。

【００４４】このクラスタリング処理には、階層的クラ
スタリング手法と、ｋ-means法や階層的モード法等の非
階層的クラスタリング手法という２つの手法がある。階
層的クラスタリング手法は、図７に示すように、特徴ベ
クトルのそれぞれを１個のクラスタと考えて、クラスタ
間の距離が最も近いもの同士を統合していくことを繰り
返していくでクラスタを生成する手法であり、クラスタ
内の要素は、一度あるクラスタに帰属すると、別のクラ
スタに移動しないという特徴がある。なお、図４では、
「２」の文字が１つだけ、「４」と間違って認識されて
いることを想定している。

【００４５】一方、非階層的クラスタリング手法は、ｋ
-means法で説明するならば、図８に示すように、最初に
最終クラスタ数を決めてから、適当にクラスタの核とな
る要素を決めて、それをクラスタ重心とする。そして、
ある要素に対して、各クラスタ重心との距離を算出し
て、最も距離の近いクラスタに帰属させ、要素の増え
たクラスタに対して、重心位置を計算し直し、各クラ
スタ内の要素に対し、最も距離の近いクラスタ重心が変
わった場合、再配置し直すという流れを採って、ない
しの処理を繰り返していって、各クラスタの重心位置
が変化しなくなった時点で処理を打ち切ることで行われ
る。

【００４６】この非階層的クラスタリング手法は、階層
的クラスタリング手法と異なって、クラスタ内の要素
は、一度あるクラスタに帰属しても、生成過程のクラス
タの分布に応じて、別のクラスタに再配置されることが
あるという特徴がある。これから、階層的クラスタリン
グ手法に比べて、高精度のクラスタリング処理が可能に
なるが、最初に選ぶクラスタの核により処理結果が異な
るという特性がある。

【００４７】なお、階層的クラスタリング手法／非階層
的クラスタリング手法で、クラスタ間の距離を求める場
合、クラスタの要素数（特徴ベクトル）が１つとなると
きには、特徴ベクトルと特徴ベクトルとの間の距離を算
出することで求めることになるが、クラスタの要素数が
複数となるときには、例えば、そのクラスタに属する特
徴ベクトルの平均ベクトルを求めることで代表ベクトル
を求めて、その代表ベクトルと代表ベクトルとの間の距
離を算出することで求めることになる。

【００４８】認識プログラム３３は、このような階層的
クラスタリング手法／非階層的クラスタリング手法の特
徴を使って、図３の処理フローのステップ５に入ると、
先ず最初に、階層的クラスタリング手法に従って特徴ベ
クトルのクラスタリング処理を行うことでクラスタを生
成し、続いて、それらの各クラスタの平均ベクトルを核
として用いて、非階層的クラスタリング手法に従ってク
ラスタリング処理を行うことで、高精度でかつ一義的な
クラスタリング処理を実行するように処理する構成を採
っている。

【００４９】図９及び図１０に、このステップ５で実行
するクラスタリング処理の詳細な処理フローの一実施例
を図示する。すなわち、認識プログラム３３は、図３の
処理フローのステップ５に入ると、階層的クラスタリン
グ処理に入って、図９の処理フローに示すように、先ず
最初に、ステップ１で、特徴ベクトル格納メモリ３５か
ら、クラスタリング処理の対象とする特徴ベクトルとし
て、ある認識文字カテゴリの特徴ベクトルだけを抽出す
る。例えば、文字“４”と認識された文字の持つ特徴ベ
クトルだけを抽出するのである。

【００５０】続いて、ステップ２で、クラスタリング処
理の打ち切り条件を設定する。例えば、クラスタ数が３
つ以下となるまでクラスタリング処理を行うとか、クラ
スタ統合時のクラスタ間距離が閾値以上となるまでクラ
スタリング処理を行うとか、クラスタ統合時のクラスタ
間距離の増加率が閾値以上となるまでクラスタリング処
理を行うというような打ち切り条件が用意される場合に
は、その中から、１つの打ち切り条件を選択するのであ
る。

【００５１】続いて、ステップ３で、全クラスタの中か
ら最も距離の近い２つのクラスタを選択し、続くステッ
プ４で、クラスタリング処理の打ち切り条件を充足して
いるのか否かを判断して、打ち切り条件を充足していな
いことを判断するときには、ステップ５に進んで、その
選択した２つのクラスタを統合してからステップ３に戻
ることを繰り返していくことで、打ち切り条件を充足す
るまで、ステップ１で抽出した特徴ベクトルに対しての
クラスタリング処理を実行する。

【００５２】そして、ステップ４で、クラスタリング処
理の打ち切り条件の充足を判断すると、ステップ６に進
んで、全文字カテゴリに対してクラスタリング処理を実
行したのか否かを判断して、実行していないことを判断
するときには、ステップ１に戻り、実行したことを判断
するときには、階層的クラスタリング処理を終了する。

【００５３】続いて、認識文字カテゴリ毎に、非階層的
クラスタリング処理に入って、図１０の処理フローに示
すように、先ず最初に、ステップ１で、処理対象として
選択した認識文字カテゴリの持つ各クラスタ（図９の処
理フローに従って生成されたクラスタ）の平均ベクトル
を求めて、それを非階層的クラスタリング処理における
クラスタの核として設定する。

【００５４】続いて、ステップ２で、ある要素（文字≡
特徴ベクトル）と各クラスタ重心との間の距離を算出
し、続くステップ３で、最も距離の近いクラスタにその
要素を帰属させ、続くステップ４で、各クラスタの重心
位置を計算する。

【００５５】続いて、ステップ５で、重心位置が変化し
たのか否かをチェックして、重心位置が変化しないこと
判断するときには、クラスタリング処理を終了し、変化
することを判断するときには、ステップ６に進んで、各
クラスタ内要素の最近傍の重心が変化したのか否かをチ
ェックして、重心が変化したことを判断するときには、
ステップ７に進んでクラスタ内要素を再配置してからス
テップ２に戻り、重心が変化しないことを判断するとき
には、そのままステップ２に戻っていくことで、非階層
的クラスタリング処理を実行する。

【００５６】このようにして、認識プログラム３３は、
図３の処理フローのステップ５に入ると、認識文字カテ
ゴリ毎に、先ず最初に、階層的クラスタリング手法に従
って特徴ベクトルのクラスタリング処理を行うことでク
ラスタを生成し、続いて、それらの各クラスタの平均ベ
クトルを核として用いて、非階層的クラスタリング手法
に従ってクラスタリング処理を行うことで、最終的な特
徴ベクトルのクラスタを生成して、そのクラスタ情報を
クラスタ情報格納メモリ３８に格納するのである。

【００５７】これから説明するように、クラスタを生成
するのは、誤読の可能性の高い文字を抽出するためであ
る。認識プログラム３３が、このような２段階のクラス
タリング構成を採るのは、階層的クラスタリング処理の
結果を元にして、非階層的クラスタリング処理で再度ク
ラスタリングし直していくことで、正読文字と誤読文字
とを別々のクラスタとして生成させていくことに、その
理由がある。

【００５８】認識プログラム３３は、図３の処理フロー
のステップ５で、認識文字カテゴリ毎に、特徴ベクトル
のクラスタを生成すると、続いて、ステップ６で、生成
したクラスタの中に含まれる誤読候補クラスタを抽出す
る。

【００５９】この誤読候補クラスタの抽出処理は、例え
ば、図１１（ａ）の処理フローに示すように、クラスタ
内要素数が閾値以下のクラスタを誤読候補クラスタとし
て抽出し、それ以外のクラスタを正読候補クラスタとし
て抽出することで行う。すなわち、この判断方法では、
閾値よりも要素数の少ないクラスタは誤読の可能性が高
いとして判断するのである。この判断方法は、クラスタ
内要素数だけを基準にして行われることから、高速処理
が可能になるという利点がある。

【００６０】また、図１１（ｂ）の処理フローに示すよ
うに、クラスタ内要素数が閾値以下で、かつ、その認識
文字カテゴリの他クラスタとの間の相関比が閾値以上と
なるクラスタを誤読候補クラスタとして抽出し、それ以
外のクラスタを正読候補クラスタとして抽出することで
行う。この相関比とは、クラスタ間分散和を全分散（ク
ラスタ内分散和＋クラスタ間分散和）で割算した値で定
義されるものであって、他クラスタとの間の距離が大き
くなるに従って、その値が大きくなるという特性があ
る。すなわち、この判断方法では、要素数が少なく、か
つ他クラスタと距離の離れているクラスタを誤読の可能
性が高いとして判断するのである。この判断方法は、ク
ラスタ内要素数だけを基準とする場合に比べて、正確な
処理が可能になるという利点がある。

【００６１】また、図１２（ａ）の処理フローに示すよ
うに、クラスタ内要素数がその認識文字カテゴリの総要
素数の規定定数倍以下となるクラスタを誤読候補クラス
タとして抽出し、それ以外のクラスタを正読候補クラス
タとして抽出することで行う。すなわち、この判断方法
では、例えば総要素数の０.2倍の要素数を閾値として設
定して、その閾値よりも要素数の少ないクラスタは誤読
の可能性が高いとして判断するのである。この判断方法
は、クラスタ内要素数だけを基準にして行われることか
ら、高速処理が可能になるという利点がある。しかも、
閾値を認識文字カテゴリの総要素数に応じて設定するこ
とから、閾値を固定値とする場合に比べて、正確な処理
が可能になるという利点がある。

【００６２】また、図１２（ｂ）の処理フローに示すよ
うに、クラスタ内要素数がその認識文字カテゴリの総要
素数の規定定数倍以下で、かつ、その認識文字カテゴリ
の他クラスタとの間の相関比が閾値以上となるクラスタ
を誤読候補クラスタとして抽出し、それ以外のクラスタ
を正読候補クラスタとして抽出することで行う。すなわ
ち、この判断方法では、総要素数の規定定数倍で定義さ
れる閾値よりも要素数が少なく、かつ他クラスタと距離
の離れているクラスタを誤読の可能性が高いとして判断
するのである。この判断方法は、クラスタ内要素数だけ
を基準とする場合に比べて、正確な処理が可能になると
いう利点がある。しかも、閾値を認識文字カテゴリの総
要素数に応じて設定することから、閾値を固定値とする
場合に比べて、正確な処理が可能になるという利点があ
る。

【００６３】認識プログラム３３は、図３の処理フロー
のステップ６で、誤読候補のクラスタを抽出すると、続
いて、ステップ７で、誤って認識された文字カテゴリを
正しいものに修正したり、誤って認識された文字カテゴ
リをリジェクト文字に修正したり、リジェックト文字と
して設定されたものを認識可能文字に変更して、その文
字カテゴリを設定する処理を行う。

【００６４】図１３に従って、このステップ７で実行す
る修正処理の基本的な考え方について説明すると、図３
の処理フローのステップ３及びステップ４の処理に従っ
て、図中のαで示すように、認識文字カテゴリ毎に、そ
れに属する文字の持つ特徴ベクトルが得られ、図３の処
理フローのステップ５の処理に従って、図中のβに示す
ように、各認識文字カテゴリ毎に、それに属する特徴ベ
クトルのクラスタが生成されて、図３の処理フローのス
テップ６の処理に従って、このクラスタの中から、認識
文字カテゴリ“２”に属するクラスタａと、認識文字カ
テゴリ“４”に属するクラスタｄとが誤読候補クラスタ
として抽出される。

【００６５】このステップ７では、誤読候補クラスタに
最も近い他文字カテゴリのクラスタを特定して、この誤
読候補クラスタとそのクラスタとの間の距離が近いとき
には、この誤読候補クラスタに含まれる文字の内、認識
文字カテゴリとの間の距離（辞書距離値格納メモリ３７
に格納される辞書距離値）が大きいもの、すなわち、認
識文字カテゴリに対する認識の確信度が低いものについ
ては、その認識文字カテゴリを、現在のものから、その
最も近いクラスタの文字カテゴリに修正する処理を行
う。

【００６６】例えば、図中のβ，γに示すように、誤読
候補クラスタｄに最も近い他文字カテゴリのクラスタと
して、認識文字カテゴリ“２”に属するクラスタｂを特
定するときに、誤読候補クラスタｄとそのクラスタｂと
が近いときには、誤読候補クラスタｄに含まれる文字の
内、認識文字カテゴリ“４”に対する認識の確信度が低
いものについては、その認識文字カテゴリを、現在の
“４”からクラスタｂの“２”に修正するのである。

【００６７】この修正処理に従って、認識文字カテゴリ
を変更していくときに、認識に対する確信度が低い文字
のみを変更していくことから、誤った認識文字カテゴリ
の変更を防止できるようになる。

【００６８】ここで、誤読候補クラスタに最も近い他文
字カテゴリのクラスタを特定するときに、全ての他文字
カテゴリを検索対象とするのではなくて、誤読の可能性
のある特定の他文字カテゴリに検索対象を限定すると、
精度を落とすことなくクラスタを高速に特定できるよう
になる。また、最小距離値を示す文字カテゴリを認識結
果とすることになるが、これに続く距離値の小さな上位
の文字カテゴリを検索対象として限定しても、同様に、
精度を落とすことなくクラスタを高速に特定できるよう
になる。すなわち、文字パターンから誤読されるものは
大体決まっているので、この誤読の可能性の高い文字カ
テゴリを検索対象として限定したり、認識候補となった
上位の文字カテゴリ（個数とか距離値で絞る）を検索対
象として限定することで処理の高速化を図るのである。

【００６９】そして、このステップ７では、リジェクト
文字に最も近い他文字カテゴリのクラスタを特定して、
このリジェクト文字とそのクラスタとの間の距離が近い
ときには、このリジェクト文字の内、認識文字カテゴリ
との間の距離（上述したように、リジェクト文字でも認
識文字カテゴリは特定されている）が小さいもの、すな
わち、リジェクトに対する確信度が低いものについて
は、リジェクト文字の判定を解除して認識可能文字に変
更するとともに、その認識文字カテゴリを、現在のもの
から、その最も近いクラスタの文字カテゴリに修正する
処理を行う。

【００７０】例えば、図中のβ，γに示すように、リジ
ェクト文字ｇ,hに最も近い他文字カテゴリのクラスタと
して、認識文字カテゴリ“４”に属するクラスタｅを特
定するときに、リジェクト文字ｇ,hとそのクラスタｅと
が近いときにあって、リジェクト文字ｇ,hに対するリジ
ェクト確信度が低いときには、リジェクト文字ｇ,hを認
識可能文字に変更するとともに、その認識文字カテゴリ
を現在のものからクラスタｅの属する“４”に修正する
のである。

【００７１】この修正処理に従って、リジェクト文字を
正読化していくときに、リジェクト確信度が低いリジェ
クト文字のみを正読化していくことから、誤ったリジェ
クト文字の正読化の発生を防止できるようになる。

【００７２】ここで、リジェクト文字に最も近い他文字
カテゴリのクラスタを特定するときに、全ての他文字カ
テゴリを検索対象とするのではなくて、正読の可能性の
ある特定の他文字カテゴリに検索対象を限定すると、精
度を落とすことなくクラスタを高速に特定できるように
なる。また、リジェクト文字と距離値の小さな上位の文
字カテゴリを検索対象として限定しても、同様に、精度
を落とすことなくクラスタを高速に特定できるようにな
る。

【００７３】そして、このステップ７では、誤読候補ク
ラスタと全他文字カテゴリの全クラスタとの間の距離が
遠いときには、その誤読候補クラスタに属する文字を認
識可能文字からリジェクト文字に修正する処理を行う。

【００７４】例えば、図中のβ，γに示すように、誤読
候補クラスタａが全他文字カテゴリの全クラスタと離れ
ているときには、その誤読候補クラスタａに属する全て
の文字を認識可能文字からリジェクト文字に修正するの
である。

【００７５】この修正処理に従って、誤読されていた文
字がリジェクト化されることで、誤読率を減少できるよ
うになる。図１４に、この図１３で説明した認識結果修
正処理を実行すべく、認識プログラム３３が図３の処理
フローのステップ７で実行する認識結果修正処理の詳細
な処理フローの一実施例を図示する。

【００７６】認識プログラム３３は、図３の処理フロー
のステップ６で、誤読候補クラスタを抽出すると、図３
の処理フローのステップ７に入って、この図１４の処理
フローに示すように、先ず最初に、ステップ１で、特徴
ベクトルを使って、各誤読候補クラスタ／各リジェクト
文字と最も距離の近い他文字カテゴリのクラスタを抽出
する。

【００７７】続いて、ステップ２で、この抽出したクラ
スタとの間の距離値が閾値以下であるのか否かを判断し
て、閾値以下ではないことを判断するとき、すなわち、
この抽出したクラスタと類似しないときには、何も処理
を実行しない。但し、抽出元が誤読候補クラスタであ
り、そのときに、その誤読候補クラスタと全他文字カテ
ゴリの全クラスタとの間の距離が遠いときには、その誤
読候補クラスタに属する文字を認識可能文字からリジェ
ックト文字に修正する処理を行う。

【００７８】一方、ステップ２で、最も距離の近い他文
字カテゴリのクラスタとの間の距離値が閾値以下である
ことを判断するときには、ステップ３に進んで、誤読候
補クラスタ／リジェクト文字と抽出したクラスタとを統
合し、続くステップ４で、抽出元が誤読候補クラスタで
あるときには、この誤読候補クラスタに含まれる文字の
内、認識文字カテゴリに対する認識の確信度の高いもの
と低いものとを区分けして、認識の確信度の高い文字に
ついては何も処理を行わず、認識の確信度の低い文字に
ついては、ステップ５に進んで、その文字の認識文字カ
テゴリを現状のものから統合先のものに修正する。

【００７９】また、抽出元がリジェクト文字であるとき
には、このリジェクト文字の内、リジェクトに対する確
信度の高いものと低いものとを区分けして、リジェクト
に対する確信度の高い文字については何も処理を行わ
ず、リジェクトに対する確信度の低い文字については、
ステップ５に進んで、リジェクトを解除してから、その
の認識文字カテゴリを、その最も近いクラスタの文字カ
テゴリに設定する処理を行う。

【００８０】続いて、ステップ６で、抽出元が誤読候補
クラスタであるときには、この誤読候補クラスタに含ま
れる文字の全てについて処理を実行したのか否かを判断
して、実行していないものがあるときには、ステップ４
に戻っていく。

【００８１】そして、ステップ７で、全誤読候補クラス
タ／全リジェクト文字について処理を実行したのか否か
を判断して、実行していないものがあるときには、ステ
ップ１に戻り、全て実行し終えたときには、処理を終了
する。このようにして、認識プログラム３３は、この図
１４の処理フローを実行することで、図１３で説明した
認識結果修正処理を実行するのである。

【００８２】このように、認識プログラム３３は、同一
筆記者により記入された文書の文字認識要求が発行され
ると、図３の処理フローに従って、先ず最初に、ステッ
プ１で、同一筆記者により記入された文書を抽出し、続
いて、ステップ２で、その抽出した文書の持つ文字を１
文字ずつ切り出し、続いて、ステップ３で、各文字の持
つ特徴ベクトルを算出し、続いて、ステップ４で、各文
字の文字カテゴリを認識するとともに、その認識文字カ
テゴリとの間の距離値を特定し、続いて、ステップ５
で、階層的クラスタリング手法／非階層的クラスタリン
グ手法を使って、認識文字カテゴリ毎に、特徴ベクトル
のクラスタリング処理を行うことでクラスタを生成し、
続いて、ステップ６で、そのクラスタの中に含まれる誤
読候補クラスタを抽出し、続いて、ステップ７で、その
誤読候補クラスタに含まれる文字の認識文字カテゴリを
修正したり、その誤読候補クラスタに含まれる文字をリ
ジェクト文字に修正したり、リジェクト文字を認識可能
文字に修正して認識文字カテゴリを設定することで、同
一筆記者により記入された文書の文字認識を実行するの
である。

【００８３】

【発明の効果】以上説明したように、本発明の文字認識
装置では、入力文字の特徴ベクトルをクラスタリングす
ることでクラスタを生成する構成を採って、その中から
誤読の可能性の高いクラスタを抽出して、それに最も距
離の近い他文字カテゴリのクラスタを特定し、それとの
類似度が大きいときには、その誤読の可能性の高いクラ
スタに含まれる入力文字の内、認識確信度の低い入力文
字の認識文字カテゴリを、その類似するクラスタの認識
文字カテゴリに変更する構成を採ることから、従来では
誤読されていた文字の文字カテゴリの自動修正が可能に
なるとともに、前もって文字サンプルを収集しなくて
も、手書き文字を高精度に認識できるようになる。

【００８４】そして、その誤読の可能性の高いクラスタ
が他文字カテゴリの全クラスタと類似しないときには、
その誤読の可能性の高いクラスタに属する入力文字をリ
ジェクト文字に変更するので、リジェクトすべき文字が
誤読されることがなくなって、手書き文字を高精度に認
識できるようになる。

【００８５】そして、リジェクト入力文字に最も距離の
近い他文字カテゴリのクラスタを特定して、それとの類
似度が大きいときにあって、そのリジェクト入力文字の
リジェクト確信度が低いときには、そのリジェクト入力
文字を認識可能文字に変更するとともに、その認識文字
カテゴリをその類似するクラスタの認識文字カテゴリに
設定するので、読み取りが可能なリジェクト文字を正読
化できるようになって、正確な文字認識処理を実行でき
るようになる。

【００８６】このように、本発明の文字認識装置では、
先に出願の特願平８-30217号で開示したクラスタリング
手法による文字認識アルゴリズムの実装にあたって、認
識確信度を考慮して認識文字カテゴリを修正する構成を
採ったことから、同一筆記者により記入された手書き文
字を更に高精度に認識できるようになる。そして、認識
確信度を使って、誤読文字をリジェクト文字に変更した
り、リジェクト確信度を使って、リジェクト文字を認識
可能文字に変更することで、更に実用的なものにするこ
とができるようになる。

【００８７】しかも、本発明の文字認識装置は、従来の
文字認識装置をそのまま利用して実装できることから、
インプリメントが容易であるという利点もある。

【図面の簡単な説明】

【図１】本発明の原理構成図である。

【図２】本発明の装置構成図である。

【図３】認識プログラムの実行する処理フローの一実施
例である。

【図４】スキャナで読み取る文書の一例である。

【図５】特徴ベクトルの一例である。

【図６】文字カテゴリ認識処理の説明図である。

【図７】階層的クラスタリング手法の説明図である。

【図８】非階層的クラスタリング手法の説明図である。

【図９】クラスタリング処理の処理フローの一実施例で
ある。

【図１０】クラスタリング処理の処理フローの一実施例
である。

【図１１】誤読候補クラスタの抽出処理の処理フローで
ある。

【図１２】誤読候補クラスタの抽出処理の処理フローで
ある。

【図１３】認識結果修正処理の説明図である。

【図１４】認識結果修正処理の処理フローの一実施例で
ある。

【符号の説明】

１文字認識装置１０辞書１１算出手段１２第１の格納手段１３認識手段１４第２の格納手段１５第３の格納手段１６クラスタリング手段１７修正手段１８出力手段１９抽出手段２０特定手段２１変更手段２２第２の変更手段

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開平６−187499（ＪＰ，Ａ) 特開平２−300989（ＪＰ，Ａ) 川谷隆彦，筆記個人性を用いた手書き数字認識の改善，電子情報通信学会論文誌，日本，電子情報通信学会，1995年７月25日，Ｄ−２Ｖｏｌ．Ｊ78−Ｄ− ２Ｎｏ．７，ｐ．1047−1057 川谷隆彦，宮本信夫，認識結果を用いた手書き数字認識の数量化とその応用, 電子情報通信学会論文誌，日本，電子情報通信学会論文誌，1991年３月25日, Ｄ−２Ｖｏｌ．Ｊ74−Ｄ−２Ｎｏ. ３，ｐ．357−365 (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06F 9/03 - 9/62 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】同一筆記者により記入された多数の入力
文字の文字カテゴリを認識する文字認識装置において、入力文字の持つ特徴ベクトルを算出する算出手段と、上記算出手段の算出する特徴ベクトルと、辞書に登録さ
れる各文字カテゴリの持つ特徴ベクトルとの間の距離値
を算出して、最も小さな距離値を示す文字カテゴリを入
力文字の文字カテゴリとして認識するとともに、その認
識文字カテゴリとの間の距離値が規定値以下とならない
ときには、入力文字を認識不可能としてリジェクトする
認識手段と、上記算出手段の算出する特徴ベクトルを、上記認識手段
の認識する文字カテゴリ毎にクラスタリングすること
で、該文字カテゴリ毎に１つ又は複数のクラスタを生成
するクラスタリング手段と、上記クラスタリング手段の処理結果と、上記算出手段の
算出する特徴ベクトルと、上記認識手段の認識する文字
カテゴリと、上記認識手段の算出する入力文字と認識文
字カテゴリとの間の距離値とから、上記認識手段の認識
結果を修正する修正手段とを備えることを、特徴とする文字認識装置。
【請求項２】請求項１記載の文字認識装置において、修正手段は、クラスタリング手段の生成するクラスタの中から、誤読
の可能性の高いクラスタを抽出する抽出手段と、算出手段の算出する特徴ベクトルを使って、上記抽出手
段の抽出するクラスタに最も距離の近い他文字カテゴリ
のクラスタを特定する特定手段と、上記抽出手段の抽出するクラスタと上記特定手段の特定
するクラスタとの間の距離値が規定値以下を示すとき
に、上記抽出手段の抽出するクラスタに属する入力文字
の内、認識文字カテゴリとの間の距離値が規定値以上を
示すものを変更対象として、その認識文字カテゴリを上
記特定手段の特定するクラスタの文字カテゴリに変更す
る変更手段とを備えることを、特徴とする文字認識装置。
【請求項３】請求項２記載の文字認識装置において、修正手段は、抽出手段の抽出するクラスタと、全他文字カテゴリの全
クラスタとの間の距離値が規定値以上を示すときに、抽
出手段の抽出するクラスタに属する入力文字をリジェク
ト文字に変更する第２の変更手段を備えることを、特徴とする文字認識装置。
【請求項４】請求項１記載の文字認識装置において、修正手段は、算出手段の算出する特徴ベクトルを使って、認識手段の
リジェクトする入力文字に最も距離の近い他文字カテゴ
リのクラスタを特定する特定手段と、認識手段のリジェクトする入力文字と上記特定手段の特
定するクラスタとの間の距離値が規定値以下を示すとき
に、認識手段のリジェクトする入力文字の内、認識文字
カテゴリとの間の距離値が規定値以下を示すものを変更
対象として、それを認識可能文字に変更するとともに、
その認識文字カテゴリを上記特定手段の特定するクラス
タの文字カテゴリに設定する変更手段とを備えること
を、特徴とする文字認識装置。
【請求項５】請求項２又は３記載の文字認識装置にお
いて、抽出手段は、クラスタ内の入力文字数が規定値以下とな
るクラスタを、誤読の可能性の高いクラスタとして抽出
することを、特徴とする文字認識装置。
【請求項６】請求項２又は３記載の文字認識装置にお
いて、抽出手段は、クラスタ内の入力文字数がそれの属する文
字カテゴリの総入力文字数の規定定数倍以下となるクラ
スタを、誤読の可能性の高いクラスタとして抽出するこ
とを、特徴とする文字認識装置。
【請求項７】請求項２又は３記載の文字認識装置にお
いて、抽出手段は、クラスタ内の入力文字数が規定値以下で、
かつ、それの属する文字カテゴリの他クラスタとの間の
距離値が規定値以上となるクラスタを、誤読の可能性の
高いクラスタとして抽出することを、特徴とする文字認識装置。
【請求項８】請求項２又は３記載の文字認識装置にお
いて、抽出手段は、クラスタ内の入力文字数がそれの属する文
字カテゴリの総入力文字数の規定定数倍以下で、かつ、
該文字カテゴリの他クラスタとの間の距離値が規定値以
上となるクラスタを、誤読の可能性の高いクラスタとし
て抽出することを、特徴とする文字認識装置。
【請求項９】請求項２ないし８記載の文字認識装置に
おいて、特定手段は、特定対象とする他文字カテゴリを特定元の
文字カテゴリに応じて予め限定しておくことを、特徴とする文字認識装置。
【請求項１０】請求項２ないし８記載の文字認識装置
において、特定手段は、特定対象とする他文字カテゴリを認識手段
の算出する距離値の小さな上位の文字カテゴリに限定す
ることを、特徴とする文字認識装置。
【請求項１１】請求項１ないし１０記載の文字認識装
置において、クラスタリング手段は、最初、階層クラスタリング手法
に従ってクラスタリングを行ってクラスタを生成し、続
いて、該クラスタを初期状態として用いて非階層クラス
タリング手法に従ってクラスタリングを行うことを、特徴とする文字認識装置。