JP3280577B2 - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JP3280577B2 JP3280577B2 JP21458196A JP21458196A JP3280577B2 JP 3280577 B2 JP3280577 B2 JP 3280577B2 JP 21458196 A JP21458196 A JP 21458196A JP 21458196 A JP21458196 A JP 21458196A JP 3280577 B2 JP3280577 B2 JP 3280577B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- cluster
- category
- specified
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Discrimination (AREA)
Description
記入された多数の入力文字の文字カテゴリを認識する文
字認識装置に関し、特に、文字サンプルを収集すること
なく、手書きの入力文字を高い精度でもって認識できる
ようにする文字認識装置に関する。
筆記者の筆記特性を考慮することで文字認識率を高める
構成を構築していく必要がある。
と、辞書に登録されている文字カテゴリの持つ特徴とを
照合することで、入力文字の文字カテゴリを認識する処
理を行う。
成されていることから、手書き文字を認識対象とすると
きには、一般的には十分な認識率が得られない。そこ
で、従来では、手書き文字を認識対象とするときには、
前もって筆記者毎に文字サンプルを収集して、それに基
づいて、辞書に登録する文字カテゴリの特徴を作成する
という方法を採ったり、それに基づいて、入力文字の特
徴を抽出する際に、筆記者に合わせた補正を行うという
方法を採ることで、手書き文字の認識率を高めるように
していた。
術のように、筆記者に合わせた辞書を作成したり、筆記
者に合わせた補正を行うという方法を採っていると、文
字認識に入る前に、文字サンプルを収集しておかなくて
はならないという問題点がある。
少しずつ変わっていくことから、高い文字認識率を維持
するためには、ある期間毎に文字サンプルを再収集して
辞書を作成し直したり、補正のパラメータを作成し直さ
なくてはならないという問題がある。
きには、筆記者毎に辞書を用意したり補正のパラメータ
を管理する必要があることから、メモリ量が莫大となる
という問題点がある。
態として、伝票に記入された文字を認識する場合のよう
に、同一筆記者により記入された多数の文字を入力とし
て、それらの入力文字を認識していくというものがあ
る。
率を文字サンプルを要求することなく高める方法とし
て、本出願人は、先に出願の特願平8-30217号で、入力
文字の特徴ベクトルをクラスタリングすることでクラス
タを生成する構成を採って、他の文字カデコリのクラス
タに近いクラスタがあるときには、その2つのクラスタ
の内の入力文字数の少ない方のクラスタの認識文字カテ
ゴリを、もう一方の入力文字数の多い方のクラスタの認
識文字カテゴリに修正していくという新たな文字認識ア
ルゴリズムを提案した。
ズムを一歩進めて、更に高い認識率の実現を図るもので
ある。
を図示する。図中、1は本発明を具備する文字認識装置
であって、同一筆記者により記入された多数の入力文字
の文字カテゴリを認識するものである。
算出手段11と、第1の格納手段12と、認識手段13
と、第2の格納手段14と、第3の格納手段15と、ク
ラスタリング手段16と、修正手段17と、出力手段1
8とを備える。
徴ベクトルを管理する。算出手段11は、入力文字の持
つ特徴ベクトルを算出する。第1の格納手段12は、算
出手段11の算出する特徴ベクトルを入力文字と対応を
取りつつ格納する。
特徴ベクトルと、辞書10に登録される各文字カテゴリ
の持つ特徴ベクトルとの間の距離値を算出して、最も小
さな距離値を示す文字カテゴリを入力文字の文字カテゴ
リとして認識するとともに、その認識文字カテゴリとの
間の距離値が規定値以下とならないときには、入力文字
を認識不可能としてリジェクトする。
出する入力文字と認識文字カテゴリとの間の距離値を入
力文字と対応を取りつつ格納する。第3の格納手段15
は、認識手段13の認識する文字カテゴリを入力文字と
対応を取りつつ格納する。
の算出する特徴ベクトルを、認識手段13の認識する文
字カテゴリ毎にクラスタリングすることで、文字カテゴ
リ毎に1つ又は複数のクラスタを生成する。
納される認識手段13の認識結果を修正するものであっ
て、クラスタリング手段16の生成するクラスタの中か
ら、誤読の可能性の高いクラスタを抽出する抽出手段1
9と、算出手段11の算出する特徴ベクトルを使って、
抽出手段19の抽出したクラスタに最も距離の近い他文
字カテゴリのクラスタを特定したり、認識手段13のリ
ジェクトした入力文字に最も距離の近い他文字カテゴリ
のクラスタを特定する特定手段20と、抽出手段19の
抽出したクラスタに属する入力文字の認識文字カテゴリ
を変更したり、リジェクト入力文字を認識可能文字に変
更するとともに、その認識文字カテゴリを設定する変更
手段21と、抽出手段19の抽出したクラスタに属する
入力文字をリジェクト文字に変更する第2の変更手段2
2とを備える。
された認識手段13の認識結果を外部に出力する。この
ように構成される本発明の文字認識装置1では、クラス
タリング手段16は、算出手段11の算出する特徴ベク
トルを、認識手段13の認識する文字カテゴリ毎にクラ
スタリングすることで、文字カテゴリ毎に1つ又は複数
のクラスタを生成する。
初、階層クラスタリング手法に従ってクラスタリングを
行ってクラスタを生成し、続いて、そのクラスタを初期
状態として用いて非階層クラスタリング手法に従ってク
ラスタリングを行うことで、文字カテゴリ毎に1つ又は
複数のクラスタを生成するのである。
9は、生成されたクラスタの中から、例えば、クラスタ
内の入力文字数が規定値以下となるクラスタを抽出する
ことで、誤読の可能性の高いクラスタを抽出し、これを
受けて、特定手段20は、算出手段11の算出する特徴
ベクトルを使って、抽出された誤読の可能性の高いクラ
スタに最も距離の近い他文字カテゴリのクラスタを特定
する。
速化や正確さを図るために、抽出された誤読の可能性の
高いクラスタの文字カテゴリに応じて特定対象とする他
文字カテゴリを予め限定しておくことがあり、また、特
定対象とする他文字カテゴリを認識手段13の算出する
距離値の小さな上位の文字カテゴリに限定することがあ
る。
の可能性の高いクラスタと、特定手段20の特定するそ
れに最も距離の近い他文字カテゴリのクラスタとの間の
距離値が規定値以下を示すときに、抽出された誤読の可
能性の高いクラスタに属する入力文字の内、認識文字カ
テゴリとの間の距離値が規定値以上を示すものを変更対
象として、その認識文字カテゴリを特定手段20の特定
するクラスタの文字カテゴリに変更する。
抽出すると、それに最も距離の近い他文字カテゴリのク
ラスタを特定して、それとの類似度が大きいときには、
その誤読の可能性の高いクラスタに含まれる認識確信度
の低い入力文字の認識文字カテゴリを、その最も距離の
近いクラスタの認識文字カテゴリに変更するのである。
誤読の可能性の高いクラスタと、全他文字カテゴリの全
クラスタとの間の距離値が規定値以上を示すときに、抽
出された誤読の可能性の高いクラスタに属する入力文字
をリジェクト文字に変更する。
抽出するときに、それが全他文字カテゴリの全クラスタ
と類似しないときには、その誤読の可能性の高いクラス
タに属する入力文字をリジェクト文字に変更するのであ
る。
出する特徴ベクトルを使って、認識手段13のリジェク
トする入力文字に最も距離の近い他文字カテゴリのクラ
スタを特定する。
速化を図るために、リジェクト文字の認識文字カテゴリ
に応じて特定対象とする他文字カテゴリを予め限定して
おくことがあり、また、特定対象とする他文字カテゴリ
を認識手段13の算出する距離値の小さな上位の文字カ
テゴリに限定することがある。
た入力文字と、特定手段20の特定するそれに最も距離
の近い他文字カテゴリのクラスタとの間の距離値が規定
値以下を示すときに、リジェクトされた入力文字の内、
認識文字カテゴリとの距離値が規定値以下を示すものを
変更対象として、それを認識可能文字に変更するととも
に、その認識文字カテゴリを特定手段20の特定するク
ラスタの文字カテゴリに設定する。
の近い他文字カテゴリのクラスタを特定して、それとの
類似度が大きいときにあって、そのリジェクト入力文字
のリジェクト確信度が低いときには、そのリジェクト入
力文字を認識可能文字に変更するとともに、その認識文
字カテゴリをその最も距離の近いクラスタの文字カテゴ
リに設定するのである。
では、入力文字の特徴ベクトルをクラスタリングするこ
とでクラスタを生成する構成を採って、その中から誤読
の可能性の高いクラスタを抽出して、それに最も距離の
近い他文字カテゴリのクラスタを特定し、それとの類似
度が大きいときには、その誤読の可能性の高いクラスタ
に含まれる入力文字の内、認識確信度の低い入力文字の
認識文字カテゴリを、その類似するクラスタの文字カテ
ゴリに変更する構成を採ることから、前もって文字サン
プルを収集しなくても、手書き文字の正確な文字認識処
理を実行できるようになる。
が全他文字カテゴリの全クラスタと類似しないときに
は、その誤読の可能性の高いクラスタに属する入力文字
をリジェクト文字に変更するので、手書き文字の正確な
文字認識処理を実行できるようになる。
近い他文字カテゴリのクラスタを特定して、それとの類
似度が大きいときにあって、そのリジェクト入力文字の
リジェクト確信度が低いときには、そのリジェクト入力
文字を認識可能文字に変更するとともに、その認識文字
カテゴリをその類似するクラスタの文字カテゴリに設定
するので、手書き文字の正確な文字認識処理を実行でき
るようになる。
を詳細に説明する。図2に、本発明の文字認識装置1の
装置構成を図示する。
置1は、認識対象となる文書のイメージを読み取るスキ
ャナ30と、スキャナ30の読み取った文書イメージを
格納する文書イメージ格納メモリ31と、各文字カテゴ
リの持つ特徴ベクトルを管理する辞書32と、文書イメ
ージ格納メモリ31に格納される文書イメージの中か
ら、同一筆記者により記入された多数の文字を認識対象
の文字として抽出して、それらの認識対象文字の持つ特
徴ベクトルを使い、クラスタリング手法を用いつつ、そ
れらの認識対象文字の文字カテゴリを認識する認識プロ
グラム33と、認識プログラム33の抽出する認識対象
文字の文書イメージを格納する処理文書イメージ格納メ
モリ34と、認識プログラム33の算出する認識対象文
字の持つ特徴ベクトルを格納する特徴ベクトル格納メモ
リ35と、認識プログラム33の認識結果を格納する認
識結果格納メモリ36と、認識プログラム33の求める
認識対象文字と認識文字カテゴリとの間の距離値を格納
する辞書距離値格納メモリ37と、認識プログラム33
の実行するクラスタリング結果を格納するクラスタ情報
格納メモリ38とを備える。
理フローの一実施例を図示する。次に、この処理フロー
に従って、本発明について詳細に説明する。認識プログ
ラム33は、同一筆記者により記入された文書の文字認
識要求が発行されると、図3の処理フローに示すよう
に、先ず最初に、ステップ1で、文書イメージ格納メモ
リ31に格納される文書イメージの中から、同一筆記者
により記入された文書を抽出して処理文書イメージ格納
メモリ34に格納する。
納メモリ31に格納される文書イメージの中に、同一筆
記者により記入された箇所であることを示すマークが付
いているときには、そのマークの指す文書を取り出すこ
とで実行する。また、同一筆記者単位に記入されること
が決められている図4に示すような文書については、そ
の部分を取り出すことで実行する。
した処理文書イメージ格納メモリ34から同一筆記者に
より記入された文書を読み出して、その文書の持つ文字
を1文字ずつ順番に切り出す。この文字の切り出し処理
は従来方法に従って実行する。
出した各文字の持つ特徴ベクトルを順番に算出して、そ
れを特徴ベクトル格納メモリ35に順番に格納する。こ
の特徴ベクトルとしては、従来方法で用いられているど
のようなものであってもよい。このとき、特徴ベクトル
の次元数が大きいときには、必要に応じて、主成分分析
法や判別分析法等の統計手法を用いて次元数の削減を行
うことになる。
黒い部分の値を“1”、白い部分の値を“0”として、
枡目の左上から右下まで枡目の値を順番に並べたものを
特徴ベクトルとして用いる場合には、図5に示すような
特徴ベクトルを算出する。ここで、図5では、文字
“2”の特徴ベクトルを例示しており、記号2aで示さ
れる手書きの文字“2”と、記号2bで示される手書き
の文字“2”と、記号2cで示される手書きの文字
“2”とは、手書きによりパターンが若干異なることか
ら、その特徴ベクトルも若干異なることになる。
出した各文字の文字カテゴリを認識して認識結果格納メ
モリ36に格納するとともに、その認識文字カテゴリと
の間の距離値を辞書距離値格納メモリ37に格納する。
文字の持つ特徴ベクトルを特徴ベクトル格納メモリ35
から順番に読み出して、その読み出した特徴ベクトル
と、辞書32に登録される各文字カテゴリの持つ特徴ベ
クトルとの間の距離値を従来方法に従って算出し、最も
小さな距離値を特定して、その最小距離値を辞書距離値
格納メモリ37に格納するとともに、その最小距離値の
示す文字カテゴリを認識結果として認識結果格納メモリ
36に格納することで行う。そして、その認識文字カテ
ゴリとの間の距離値が規定値以下とならないとき、すな
わち、認識の確信度が低いときには、その文字を認識不
可能なリジェクト文字として設定することで行う。
記号2bで示される手書きの文字の特徴ベクトルと、辞
書32に登録される文字“1”/“2”/“3”/
“4”の特徴ベクトルとの間の距離値を、「dij=(x
i −xj )の絶対値」に従って算出して、その中の最も
小さな距離値の指す文字を特定することで、その記号2
bで示される手書きの文字が“2”であることを認識す
るのである。
毎に、特徴ベクトル格納メモリ35に格納した特徴ベク
トルに対してクラスタリング処理を施すことで、距離の
近いものをまとめることで定義されるクラスタを生成し
て、そのクラスタ情報をクラスタ情報格納メモリ38に
格納する。
スタリング手法と、k-means法や階層的モード法等の非
階層的クラスタリング手法という2つの手法がある。階
層的クラスタリング手法は、図7に示すように、特徴ベ
クトルのそれぞれを1個のクラスタと考えて、クラスタ
間の距離が最も近いもの同士を統合していくことを繰り
返していくでクラスタを生成する手法であり、クラスタ
内の要素は、一度あるクラスタに帰属すると、別のクラ
スタに移動しないという特徴がある。なお、図4では、
「2」の文字が1つだけ、「4」と間違って認識されて
いることを想定している。
-means法で説明するならば、図8に示すように、最初に
最終クラスタ数を決めてから、適当にクラスタの核とな
る要素を決めて、それをクラスタ重心とする。そして、
ある要素に対して、各クラスタ重心との距離を算出し
て、最も距離の近いクラスタに帰属させ、要素の増え
たクラスタに対して、重心位置を計算し直し、各クラ
スタ内の要素に対し、最も距離の近いクラスタ重心が変
わった場合、再配置し直すという流れを採って、ない
しの処理を繰り返していって、各クラスタの重心位置
が変化しなくなった時点で処理を打ち切ることで行われ
る。
的クラスタリング手法と異なって、クラスタ内の要素
は、一度あるクラスタに帰属しても、生成過程のクラス
タの分布に応じて、別のクラスタに再配置されることが
あるという特徴がある。これから、階層的クラスタリン
グ手法に比べて、高精度のクラスタリング処理が可能に
なるが、最初に選ぶクラスタの核により処理結果が異な
るという特性がある。
的クラスタリング手法で、クラスタ間の距離を求める場
合、クラスタの要素数(特徴ベクトル)が1つとなると
きには、特徴ベクトルと特徴ベクトルとの間の距離を算
出することで求めることになるが、クラスタの要素数が
複数となるときには、例えば、そのクラスタに属する特
徴ベクトルの平均ベクトルを求めることで代表ベクトル
を求めて、その代表ベクトルと代表ベクトルとの間の距
離を算出することで求めることになる。
クラスタリング手法/非階層的クラスタリング手法の特
徴を使って、図3の処理フローのステップ5に入ると、
先ず最初に、階層的クラスタリング手法に従って特徴ベ
クトルのクラスタリング処理を行うことでクラスタを生
成し、続いて、それらの各クラスタの平均ベクトルを核
として用いて、非階層的クラスタリング手法に従ってク
ラスタリング処理を行うことで、高精度でかつ一義的な
クラスタリング処理を実行するように処理する構成を採
っている。
するクラスタリング処理の詳細な処理フローの一実施例
を図示する。すなわち、認識プログラム33は、図3の
処理フローのステップ5に入ると、階層的クラスタリン
グ処理に入って、図9の処理フローに示すように、先ず
最初に、ステップ1で、特徴ベクトル格納メモリ35か
ら、クラスタリング処理の対象とする特徴ベクトルとし
て、ある認識文字カテゴリの特徴ベクトルだけを抽出す
る。例えば、文字“4”と認識された文字の持つ特徴ベ
クトルだけを抽出するのである。
理の打ち切り条件を設定する。例えば、クラスタ数が3
つ以下となるまでクラスタリング処理を行うとか、クラ
スタ統合時のクラスタ間距離が閾値以上となるまでクラ
スタリング処理を行うとか、クラスタ統合時のクラスタ
間距離の増加率が閾値以上となるまでクラスタリング処
理を行うというような打ち切り条件が用意される場合に
は、その中から、1つの打ち切り条件を選択するのであ
る。
ら最も距離の近い2つのクラスタを選択し、続くステッ
プ4で、クラスタリング処理の打ち切り条件を充足して
いるのか否かを判断して、打ち切り条件を充足していな
いことを判断するときには、ステップ5に進んで、その
選択した2つのクラスタを統合してからステップ3に戻
ることを繰り返していくことで、打ち切り条件を充足す
るまで、ステップ1で抽出した特徴ベクトルに対しての
クラスタリング処理を実行する。
理の打ち切り条件の充足を判断すると、ステップ6に進
んで、全文字カテゴリに対してクラスタリング処理を実
行したのか否かを判断して、実行していないことを判断
するときには、ステップ1に戻り、実行したことを判断
するときには、階層的クラスタリング処理を終了する。
クラスタリング処理に入って、図10の処理フローに示
すように、先ず最初に、ステップ1で、処理対象として
選択した認識文字カテゴリの持つ各クラスタ(図9の処
理フローに従って生成されたクラスタ)の平均ベクトル
を求めて、それを非階層的クラスタリング処理における
クラスタの核として設定する。
特徴ベクトル)と各クラスタ重心との間の距離を算出
し、続くステップ3で、最も距離の近いクラスタにその
要素を帰属させ、続くステップ4で、各クラスタの重心
位置を計算する。
たのか否かをチェックして、重心位置が変化しないこと
判断するときには、クラスタリング処理を終了し、変化
することを判断するときには、ステップ6に進んで、各
クラスタ内要素の最近傍の重心が変化したのか否かをチ
ェックして、重心が変化したことを判断するときには、
ステップ7に進んでクラスタ内要素を再配置してからス
テップ2に戻り、重心が変化しないことを判断するとき
には、そのままステップ2に戻っていくことで、非階層
的クラスタリング処理を実行する。
図3の処理フローのステップ5に入ると、認識文字カテ
ゴリ毎に、先ず最初に、階層的クラスタリング手法に従
って特徴ベクトルのクラスタリング処理を行うことでク
ラスタを生成し、続いて、それらの各クラスタの平均ベ
クトルを核として用いて、非階層的クラスタリング手法
に従ってクラスタリング処理を行うことで、最終的な特
徴ベクトルのクラスタを生成して、そのクラスタ情報を
クラスタ情報格納メモリ38に格納するのである。
するのは、誤読の可能性の高い文字を抽出するためであ
る。認識プログラム33が、このような2段階のクラス
タリング構成を採るのは、階層的クラスタリング処理の
結果を元にして、非階層的クラスタリング処理で再度ク
ラスタリングし直していくことで、正読文字と誤読文字
とを別々のクラスタとして生成させていくことに、その
理由がある。
のステップ5で、認識文字カテゴリ毎に、特徴ベクトル
のクラスタを生成すると、続いて、ステップ6で、生成
したクラスタの中に含まれる誤読候補クラスタを抽出す
る。
ば、図11(a)の処理フローに示すように、クラスタ
内要素数が閾値以下のクラスタを誤読候補クラスタとし
て抽出し、それ以外のクラスタを正読候補クラスタとし
て抽出することで行う。すなわち、この判断方法では、
閾値よりも要素数の少ないクラスタは誤読の可能性が高
いとして判断するのである。この判断方法は、クラスタ
内要素数だけを基準にして行われることから、高速処理
が可能になるという利点がある。
うに、クラスタ内要素数が閾値以下で、かつ、その認識
文字カテゴリの他クラスタとの間の相関比が閾値以上と
なるクラスタを誤読候補クラスタとして抽出し、それ以
外のクラスタを正読候補クラスタとして抽出することで
行う。この相関比とは、クラスタ間分散和を全分散(ク
ラスタ内分散和+クラスタ間分散和)で割算した値で定
義されるものであって、他クラスタとの間の距離が大き
くなるに従って、その値が大きくなるという特性があ
る。すなわち、この判断方法では、要素数が少なく、か
つ他クラスタと距離の離れているクラスタを誤読の可能
性が高いとして判断するのである。この判断方法は、ク
ラスタ内要素数だけを基準とする場合に比べて、正確な
処理が可能になるという利点がある。
うに、クラスタ内要素数がその認識文字カテゴリの総要
素数の規定定数倍以下となるクラスタを誤読候補クラス
タとして抽出し、それ以外のクラスタを正読候補クラス
タとして抽出することで行う。すなわち、この判断方法
では、例えば総要素数の0.2倍の要素数を閾値として設
定して、その閾値よりも要素数の少ないクラスタは誤読
の可能性が高いとして判断するのである。この判断方法
は、クラスタ内要素数だけを基準にして行われることか
ら、高速処理が可能になるという利点がある。しかも、
閾値を認識文字カテゴリの総要素数に応じて設定するこ
とから、閾値を固定値とする場合に比べて、正確な処理
が可能になるという利点がある。
うに、クラスタ内要素数がその認識文字カテゴリの総要
素数の規定定数倍以下で、かつ、その認識文字カテゴリ
の他クラスタとの間の相関比が閾値以上となるクラスタ
を誤読候補クラスタとして抽出し、それ以外のクラスタ
を正読候補クラスタとして抽出することで行う。すなわ
ち、この判断方法では、総要素数の規定定数倍で定義さ
れる閾値よりも要素数が少なく、かつ他クラスタと距離
の離れているクラスタを誤読の可能性が高いとして判断
するのである。この判断方法は、クラスタ内要素数だけ
を基準とする場合に比べて、正確な処理が可能になると
いう利点がある。しかも、閾値を認識文字カテゴリの総
要素数に応じて設定することから、閾値を固定値とする
場合に比べて、正確な処理が可能になるという利点があ
る。
のステップ6で、誤読候補のクラスタを抽出すると、続
いて、ステップ7で、誤って認識された文字カテゴリを
正しいものに修正したり、誤って認識された文字カテゴ
リをリジェクト文字に修正したり、リジェックト文字と
して設定されたものを認識可能文字に変更して、その文
字カテゴリを設定する処理を行う。
る修正処理の基本的な考え方について説明すると、図3
の処理フローのステップ3及びステップ4の処理に従っ
て、図中のαで示すように、認識文字カテゴリ毎に、そ
れに属する文字の持つ特徴ベクトルが得られ、図3の処
理フローのステップ5の処理に従って、図中のβに示す
ように、各認識文字カテゴリ毎に、それに属する特徴ベ
クトルのクラスタが生成されて、図3の処理フローのス
テップ6の処理に従って、このクラスタの中から、認識
文字カテゴリ“2”に属するクラスタaと、認識文字カ
テゴリ“4”に属するクラスタdとが誤読候補クラスタ
として抽出される。
最も近い他文字カテゴリのクラスタを特定して、この誤
読候補クラスタとそのクラスタとの間の距離が近いとき
には、この誤読候補クラスタに含まれる文字の内、認識
文字カテゴリとの間の距離(辞書距離値格納メモリ37
に格納される辞書距離値)が大きいもの、すなわち、認
識文字カテゴリに対する認識の確信度が低いものについ
ては、その認識文字カテゴリを、現在のものから、その
最も近いクラスタの文字カテゴリに修正する処理を行
う。
候補クラスタdに最も近い他文字カテゴリのクラスタと
して、認識文字カテゴリ“2”に属するクラスタbを特
定するときに、誤読候補クラスタdとそのクラスタbと
が近いときには、誤読候補クラスタdに含まれる文字の
内、認識文字カテゴリ“4”に対する認識の確信度が低
いものについては、その認識文字カテゴリを、現在の
“4”からクラスタbの“2”に修正するのである。
を変更していくときに、認識に対する確信度が低い文字
のみを変更していくことから、誤った認識文字カテゴリ
の変更を防止できるようになる。
字カテゴリのクラスタを特定するときに、全ての他文字
カテゴリを検索対象とするのではなくて、誤読の可能性
のある特定の他文字カテゴリに検索対象を限定すると、
精度を落とすことなくクラスタを高速に特定できるよう
になる。また、最小距離値を示す文字カテゴリを認識結
果とすることになるが、これに続く距離値の小さな上位
の文字カテゴリを検索対象として限定しても、同様に、
精度を落とすことなくクラスタを高速に特定できるよう
になる。すなわち、文字パターンから誤読されるものは
大体決まっているので、この誤読の可能性の高い文字カ
テゴリを検索対象として限定したり、認識候補となった
上位の文字カテゴリ(個数とか距離値で絞る)を検索対
象として限定することで処理の高速化を図るのである。
文字に最も近い他文字カテゴリのクラスタを特定して、
このリジェクト文字とそのクラスタとの間の距離が近い
ときには、このリジェクト文字の内、認識文字カテゴリ
との間の距離(上述したように、リジェクト文字でも認
識文字カテゴリは特定されている)が小さいもの、すな
わち、リジェクトに対する確信度が低いものについて
は、リジェクト文字の判定を解除して認識可能文字に変
更するとともに、その認識文字カテゴリを、現在のもの
から、その最も近いクラスタの文字カテゴリに修正する
処理を行う。
ェクト文字g,hに最も近い他文字カテゴリのクラスタと
して、認識文字カテゴリ“4”に属するクラスタeを特
定するときに、リジェクト文字g,hとそのクラスタeと
が近いときにあって、リジェクト文字g,hに対するリジ
ェクト確信度が低いときには、リジェクト文字g,hを認
識可能文字に変更するとともに、その認識文字カテゴリ
を現在のものからクラスタeの属する“4”に修正する
のである。
正読化していくときに、リジェクト確信度が低いリジェ
クト文字のみを正読化していくことから、誤ったリジェ
クト文字の正読化の発生を防止できるようになる。
カテゴリのクラスタを特定するときに、全ての他文字カ
テゴリを検索対象とするのではなくて、正読の可能性の
ある特定の他文字カテゴリに検索対象を限定すると、精
度を落とすことなくクラスタを高速に特定できるように
なる。また、リジェクト文字と距離値の小さな上位の文
字カテゴリを検索対象として限定しても、同様に、精度
を落とすことなくクラスタを高速に特定できるようにな
る。
ラスタと全他文字カテゴリの全クラスタとの間の距離が
遠いときには、その誤読候補クラスタに属する文字を認
識可能文字からリジェクト文字に修正する処理を行う。
候補クラスタaが全他文字カテゴリの全クラスタと離れ
ているときには、その誤読候補クラスタaに属する全て
の文字を認識可能文字からリジェクト文字に修正するの
である。
字がリジェクト化されることで、誤読率を減少できるよ
うになる。図14に、この図13で説明した認識結果修
正処理を実行すべく、認識プログラム33が図3の処理
フローのステップ7で実行する認識結果修正処理の詳細
な処理フローの一実施例を図示する。
のステップ6で、誤読候補クラスタを抽出すると、図3
の処理フローのステップ7に入って、この図14の処理
フローに示すように、先ず最初に、ステップ1で、特徴
ベクトルを使って、各誤読候補クラスタ/各リジェクト
文字と最も距離の近い他文字カテゴリのクラスタを抽出
する。
スタとの間の距離値が閾値以下であるのか否かを判断し
て、閾値以下ではないことを判断するとき、すなわち、
この抽出したクラスタと類似しないときには、何も処理
を実行しない。但し、抽出元が誤読候補クラスタであ
り、そのときに、その誤読候補クラスタと全他文字カテ
ゴリの全クラスタとの間の距離が遠いときには、その誤
読候補クラスタに属する文字を認識可能文字からリジェ
ックト文字に修正する処理を行う。
字カテゴリのクラスタとの間の距離値が閾値以下である
ことを判断するときには、ステップ3に進んで、誤読候
補クラスタ/リジェクト文字と抽出したクラスタとを統
合し、続くステップ4で、抽出元が誤読候補クラスタで
あるときには、この誤読候補クラスタに含まれる文字の
内、認識文字カテゴリに対する認識の確信度の高いもの
と低いものとを区分けして、認識の確信度の高い文字に
ついては何も処理を行わず、認識の確信度の低い文字に
ついては、ステップ5に進んで、その文字の認識文字カ
テゴリを現状のものから統合先のものに修正する。
には、このリジェクト文字の内、リジェクトに対する確
信度の高いものと低いものとを区分けして、リジェクト
に対する確信度の高い文字については何も処理を行わ
ず、リジェクトに対する確信度の低い文字については、
ステップ5に進んで、リジェクトを解除してから、その
の認識文字カテゴリを、その最も近いクラスタの文字カ
テゴリに設定する処理を行う。
クラスタであるときには、この誤読候補クラスタに含ま
れる文字の全てについて処理を実行したのか否かを判断
して、実行していないものがあるときには、ステップ4
に戻っていく。
タ/全リジェクト文字について処理を実行したのか否か
を判断して、実行していないものがあるときには、ステ
ップ1に戻り、全て実行し終えたときには、処理を終了
する。このようにして、認識プログラム33は、この図
14の処理フローを実行することで、図13で説明した
認識結果修正処理を実行するのである。
筆記者により記入された文書の文字認識要求が発行され
ると、図3の処理フローに従って、先ず最初に、ステッ
プ1で、同一筆記者により記入された文書を抽出し、続
いて、ステップ2で、その抽出した文書の持つ文字を1
文字ずつ切り出し、続いて、ステップ3で、各文字の持
つ特徴ベクトルを算出し、続いて、ステップ4で、各文
字の文字カテゴリを認識するとともに、その認識文字カ
テゴリとの間の距離値を特定し、続いて、ステップ5
で、階層的クラスタリング手法/非階層的クラスタリン
グ手法を使って、認識文字カテゴリ毎に、特徴ベクトル
のクラスタリング処理を行うことでクラスタを生成し、
続いて、ステップ6で、そのクラスタの中に含まれる誤
読候補クラスタを抽出し、続いて、ステップ7で、その
誤読候補クラスタに含まれる文字の認識文字カテゴリを
修正したり、その誤読候補クラスタに含まれる文字をリ
ジェクト文字に修正したり、リジェクト文字を認識可能
文字に修正して認識文字カテゴリを設定することで、同
一筆記者により記入された文書の文字認識を実行するの
である。
装置では、入力文字の特徴ベクトルをクラスタリングす
ることでクラスタを生成する構成を採って、その中から
誤読の可能性の高いクラスタを抽出して、それに最も距
離の近い他文字カテゴリのクラスタを特定し、それとの
類似度が大きいときには、その誤読の可能性の高いクラ
スタに含まれる入力文字の内、認識確信度の低い入力文
字の認識文字カテゴリを、その類似するクラスタの認識
文字カテゴリに変更する構成を採ることから、従来では
誤読されていた文字の文字カテゴリの自動修正が可能に
なるとともに、前もって文字サンプルを収集しなくて
も、手書き文字を高精度に認識できるようになる。
が他文字カテゴリの全クラスタと類似しないときには、
その誤読の可能性の高いクラスタに属する入力文字をリ
ジェクト文字に変更するので、リジェクトすべき文字が
誤読されることがなくなって、手書き文字を高精度に認
識できるようになる。
近い他文字カテゴリのクラスタを特定して、それとの類
似度が大きいときにあって、そのリジェクト入力文字の
リジェクト確信度が低いときには、そのリジェクト入力
文字を認識可能文字に変更するとともに、その認識文字
カテゴリをその類似するクラスタの認識文字カテゴリに
設定するので、読み取りが可能なリジェクト文字を正読
化できるようになって、正確な文字認識処理を実行でき
るようになる。
先に出願の特願平8-30217号で開示したクラスタリング
手法による文字認識アルゴリズムの実装にあたって、認
識確信度を考慮して認識文字カテゴリを修正する構成を
採ったことから、同一筆記者により記入された手書き文
字を更に高精度に認識できるようになる。そして、認識
確信度を使って、誤読文字をリジェクト文字に変更した
り、リジェクト確信度を使って、リジェクト文字を認識
可能文字に変更することで、更に実用的なものにするこ
とができるようになる。
文字認識装置をそのまま利用して実装できることから、
インプリメントが容易であるという利点もある。
例である。
ある。
である。
ある。
ある。
ある。
Claims (11)
- 【請求項1】 同一筆記者により記入された多数の入力
文字の文字カテゴリを認識する文字認識装置において、 入力文字の持つ特徴ベクトルを算出する算出手段と、 上記算出手段の算出する特徴ベクトルと、辞書に登録さ
れる各文字カテゴリの持つ特徴ベクトルとの間の距離値
を算出して、最も小さな距離値を示す文字カテゴリを入
力文字の文字カテゴリとして認識するとともに、その認
識文字カテゴリとの間の距離値が規定値以下とならない
ときには、入力文字を認識不可能としてリジェクトする
認識手段と、 上記算出手段の算出する特徴ベクトルを、上記認識手段
の認識する文字カテゴリ毎にクラスタリングすること
で、該文字カテゴリ毎に1つ又は複数のクラスタを生成
するクラスタリング手段と、 上記クラスタリング手段の処理結果と、上記算出手段の
算出する特徴ベクトルと、上記認識手段の認識する文字
カテゴリと、上記認識手段の算出する入力文字と認識文
字カテゴリとの間の距離値とから、上記認識手段の認識
結果を修正する修正手段とを備えることを、 特徴とする文字認識装置。 - 【請求項2】 請求項1記載の文字認識装置において、 修正手段は、 クラスタリング手段の生成するクラスタの中から、誤読
の可能性の高いクラスタを抽出する抽出手段と、 算出手段の算出する特徴ベクトルを使って、上記抽出手
段の抽出するクラスタに最も距離の近い他文字カテゴリ
のクラスタを特定する特定手段と、 上記抽出手段の抽出するクラスタと上記特定手段の特定
するクラスタとの間の距離値が規定値以下を示すとき
に、上記抽出手段の抽出するクラスタに属する入力文字
の内、認識文字カテゴリとの間の距離値が規定値以上を
示すものを変更対象として、その認識文字カテゴリを上
記特定手段の特定するクラスタの文字カテゴリに変更す
る変更手段とを備えることを、 特徴とする文字認識装置。 - 【請求項3】 請求項2記載の文字認識装置において、 修正手段は、 抽出手段の抽出するクラスタと、全他文字カテゴリの全
クラスタとの間の距離値が規定値以上を示すときに、抽
出手段の抽出するクラスタに属する入力文字をリジェク
ト文字に変更する第2の変更手段を備えることを、 特徴とする文字認識装置。 - 【請求項4】 請求項1記載の文字認識装置において、 修正手段は、 算出手段の算出する特徴ベクトルを使って、認識手段の
リジェクトする入力文字に最も距離の近い他文字カテゴ
リのクラスタを特定する特定手段と、 認識手段のリジェクトする入力文字と上記特定手段の特
定するクラスタとの間の距離値が規定値以下を示すとき
に、認識手段のリジェクトする入力文字の内、認識文字
カテゴリとの間の距離値が規定値以下を示すものを変更
対象として、それを認識可能文字に変更するとともに、
その認識文字カテゴリを上記特定手段の特定するクラス
タの文字カテゴリに設定する変更手段とを備えること
を、 特徴とする文字認識装置。 - 【請求項5】 請求項2又は3記載の文字認識装置にお
いて、 抽出手段は、クラスタ内の入力文字数が規定値以下とな
るクラスタを、誤読の可能性の高いクラスタとして抽出
することを、 特徴とする文字認識装置。 - 【請求項6】 請求項2又は3記載の文字認識装置にお
いて、 抽出手段は、クラスタ内の入力文字数がそれの属する文
字カテゴリの総入力文字数の規定定数倍以下となるクラ
スタを、誤読の可能性の高いクラスタとして抽出するこ
とを、 特徴とする文字認識装置。 - 【請求項7】 請求項2又は3記載の文字認識装置にお
いて、 抽出手段は、クラスタ内の入力文字数が規定値以下で、
かつ、それの属する文字カテゴリの他クラスタとの間の
距離値が規定値以上となるクラスタを、誤読の可能性の
高いクラスタとして抽出することを、 特徴とする文字認識装置。 - 【請求項8】 請求項2又は3記載の文字認識装置にお
いて、 抽出手段は、クラスタ内の入力文字数がそれの属する文
字カテゴリの総入力文字数の規定定数倍以下で、かつ、
該文字カテゴリの他クラスタとの間の距離値が規定値以
上となるクラスタを、誤読の可能性の高いクラスタとし
て抽出することを、 特徴とする文字認識装置。 - 【請求項9】 請求項2ないし8記載の文字認識装置に
おいて、 特定手段は、特定対象とする他文字カテゴリを特定元の
文字カテゴリに応じて予め限定しておくことを、 特徴とする文字認識装置。 - 【請求項10】 請求項2ないし8記載の文字認識装置
において、 特定手段は、特定対象とする他文字カテゴリを認識手段
の算出する距離値の小さな上位の文字カテゴリに限定す
ることを、 特徴とする文字認識装置。 - 【請求項11】 請求項1ないし10記載の文字認識装
置において、 クラスタリング手段は、最初、階層クラスタリング手法
に従ってクラスタリングを行ってクラスタを生成し、続
いて、該クラスタを初期状態として用いて非階層クラス
タリング手法に従ってクラスタリングを行うことを、 特徴とする文字認識装置。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21458196A JP3280577B2 (ja) | 1996-08-14 | 1996-08-14 | 文字認識装置 |
US08/801,139 US6345119B1 (en) | 1996-02-19 | 1997-02-18 | Handwritten character recognition apparatus and method using a clustering algorithm |
DE69732156T DE69732156D1 (de) | 1996-02-19 | 1997-02-19 | Verfahren und Gerät zur Zeichenerkennung |
KR1019970004938A KR100249055B1 (ko) | 1996-02-19 | 1997-02-19 | 문자인식장치및방법 |
EP97301064A EP0790574B1 (en) | 1996-02-19 | 1997-02-19 | Character recognition apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21458196A JP3280577B2 (ja) | 1996-08-14 | 1996-08-14 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1063785A JPH1063785A (ja) | 1998-03-06 |
JP3280577B2 true JP3280577B2 (ja) | 2002-05-13 |
Family
ID=16658095
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP21458196A Expired - Fee Related JP3280577B2 (ja) | 1996-02-19 | 1996-08-14 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3280577B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100369051C (zh) * | 2005-01-11 | 2008-02-13 | 富士通株式会社 | 灰度字符词典的生成装置 |
-
1996
- 1996-08-14 JP JP21458196A patent/JP3280577B2/ja not_active Expired - Fee Related
Non-Patent Citations (2)
Title |
---|
川谷隆彦,宮本信夫,認識結果を用いた手書き数字認識の数量化とその応用,電子情報通信学会論文誌,日本,電子情報通信学会論文誌,1991年 3月25日,D−2 Vol.J74−D−2 No.3,p.357−365 |
川谷隆彦,筆記個人性を用いた手書き数字認識の改善,電子情報通信学会論文誌,日本,電子情報通信学会,1995年 7月25日,D−2 Vol.J78−D−2 No.7,p.1047−1057 |
Also Published As
Publication number | Publication date |
---|---|
JPH1063785A (ja) | 1998-03-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100249055B1 (ko) | 문자인식장치및방법 | |
US5787197A (en) | Post-processing error correction scheme using a dictionary for on-line handwriting recognition | |
US20060050962A1 (en) | System, process and software arrangement for recognizing handwritten characters | |
KR100716594B1 (ko) | 문자 식별 | |
JPH10232866A (ja) | データ処理方法及び装置 | |
CN112613293A (zh) | 摘要生成方法、装置、电子设备及存储介质 | |
CN113158777A (zh) | 质量评分方法、质量评分模型的训练方法及相关装置 | |
JPH11203415A (ja) | 類似パターンカテゴリ識別辞書作成装置および方法 | |
JPH11328317A (ja) | 日本語文字認識誤り訂正方法及び装置、並びに、誤り訂正プログラムを記録した記録媒体 | |
JP3917349B2 (ja) | 文字認識結果を利用して情報を検索する検索装置および方法 | |
JP5365065B2 (ja) | 辞書作成装置 | |
JP3280577B2 (ja) | 文字認識装置 | |
CN112651590B (zh) | 一种指令处理流程推荐的方法 | |
CN114581927A (zh) | 银行票据识别方法、设备及介质 | |
JP3374762B2 (ja) | 文字認識方法及びその装置 | |
JP3180792B2 (ja) | 文字認識装置、文字学習装置およびコンピュータ可読記録媒体 | |
JP2002183667A (ja) | 文字認識装置及び記録媒体 | |
JP2906758B2 (ja) | 文字読取装置 | |
JP3487400B2 (ja) | 文字認識装置、文字認識方法、及び、記憶媒体 | |
JP3985926B2 (ja) | 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体 | |
JP3930174B2 (ja) | 文字認識方法および文字認識装置 | |
JP2001118073A (ja) | パターン認識装置及び認識方法 | |
Tóth et al. | Preprocessing algorithm for deciphering historical inscriptions using string metric | |
JPH11203413A (ja) | 類似カテゴリ識別辞書作成装置および方法 | |
JP3281530B2 (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20020205 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080222 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090222 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090222 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100222 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110222 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110222 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120222 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130222 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130222 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140222 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |