JP3280577B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3280577B2
JP3280577B2 JP21458196A JP21458196A JP3280577B2 JP 3280577 B2 JP3280577 B2 JP 3280577B2 JP 21458196 A JP21458196 A JP 21458196A JP 21458196 A JP21458196 A JP 21458196A JP 3280577 B2 JP3280577 B2 JP 3280577B2
Authority
JP
Japan
Prior art keywords
character
cluster
category
specified
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP21458196A
Other languages
English (en)
Other versions
JPH1063785A (ja
Inventor
悦伸 堀田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP21458196A priority Critical patent/JP3280577B2/ja
Priority to US08/801,139 priority patent/US6345119B1/en
Priority to DE69732156T priority patent/DE69732156D1/de
Priority to EP97301064A priority patent/EP0790574B1/en
Priority to KR1019970004938A priority patent/KR100249055B1/ko
Publication of JPH1063785A publication Critical patent/JPH1063785A/ja
Application granted granted Critical
Publication of JP3280577B2 publication Critical patent/JP3280577B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、同一筆記者により
記入された多数の入力文字の文字カテゴリを認識する文
字認識装置に関し、特に、文字サンプルを収集すること
なく、手書きの入力文字を高い精度でもって認識できる
ようにする文字認識装置に関する。
【0002】手書き文字を認識する文字認識装置では、
筆記者の筆記特性を考慮することで文字認識率を高める
構成を構築していく必要がある。
【0003】
【従来の技術】文字認識装置は、入力文字の持つ特徴
と、辞書に登録されている文字カテゴリの持つ特徴とを
照合することで、入力文字の文字カテゴリを認識する処
理を行う。
【0004】文字認識装置で用意する辞書は汎用的に作
成されていることから、手書き文字を認識対象とすると
きには、一般的には十分な認識率が得られない。そこ
で、従来では、手書き文字を認識対象とするときには、
前もって筆記者毎に文字サンプルを収集して、それに基
づいて、辞書に登録する文字カテゴリの特徴を作成する
という方法を採ったり、それに基づいて、入力文字の特
徴を抽出する際に、筆記者に合わせた補正を行うという
方法を採ることで、手書き文字の認識率を高めるように
していた。
【0005】
【発明が解決しようとする課題】しかしながら、従来技
術のように、筆記者に合わせた辞書を作成したり、筆記
者に合わせた補正を行うという方法を採っていると、文
字認識に入る前に、文字サンプルを収集しておかなくて
はならないという問題点がある。
【0006】そして、筆記者の筆記特性も月日とともに
少しずつ変わっていくことから、高い文字認識率を維持
するためには、ある期間毎に文字サンプルを再収集して
辞書を作成し直したり、補正のパラメータを作成し直さ
なくてはならないという問題がある。
【0007】更に、認識対象となる筆記者の数が多いと
きには、筆記者毎に辞書を用意したり補正のパラメータ
を管理する必要があることから、メモリ量が莫大となる
という問題点がある。
【0008】一方、手書き文字認識装置の1つの利用形
態として、伝票に記入された文字を認識する場合のよう
に、同一筆記者により記入された多数の文字を入力とし
て、それらの入力文字を認識していくというものがあ
る。
【0009】このような利用形態での手書き文字の認識
率を文字サンプルを要求することなく高める方法とし
て、本出願人は、先に出願の特願平8-30217号で、入力
文字の特徴ベクトルをクラスタリングすることでクラス
タを生成する構成を採って、他の文字カデコリのクラス
タに近いクラスタがあるときには、その2つのクラスタ
の内の入力文字数の少ない方のクラスタの認識文字カテ
ゴリを、もう一方の入力文字数の多い方のクラスタの認
識文字カテゴリに修正していくという新たな文字認識ア
ルゴリズムを提案した。
【0010】本発明は、この提案した文字認識アルゴリ
ズムを一歩進めて、更に高い認識率の実現を図るもので
ある。
【0011】
【課題を解決するための手段】図1に本発明の原理構成
を図示する。図中、1は本発明を具備する文字認識装置
であって、同一筆記者により記入された多数の入力文字
の文字カテゴリを認識するものである。
【0012】本発明の文字認識装置1は、辞書10と、
算出手段11と、第1の格納手段12と、認識手段13
と、第2の格納手段14と、第3の格納手段15と、ク
ラスタリング手段16と、修正手段17と、出力手段1
8とを備える。
【0013】この辞書10は、各文字カテゴリの持つ特
徴ベクトルを管理する。算出手段11は、入力文字の持
つ特徴ベクトルを算出する。第1の格納手段12は、算
出手段11の算出する特徴ベクトルを入力文字と対応を
取りつつ格納する。
【0014】認識手段13は、算出手段11の算出する
特徴ベクトルと、辞書10に登録される各文字カテゴリ
の持つ特徴ベクトルとの間の距離値を算出して、最も小
さな距離値を示す文字カテゴリを入力文字の文字カテゴ
リとして認識するとともに、その認識文字カテゴリとの
間の距離値が規定値以下とならないときには、入力文字
を認識不可能としてリジェクトする。
【0015】第2の格納手段14は、認識手段13の算
出する入力文字と認識文字カテゴリとの間の距離値を入
力文字と対応を取りつつ格納する。第3の格納手段15
は、認識手段13の認識する文字カテゴリを入力文字と
対応を取りつつ格納する。
【0016】クラスタリング手段16は、算出手段11
の算出する特徴ベクトルを、認識手段13の認識する文
字カテゴリ毎にクラスタリングすることで、文字カテゴ
リ毎に1つ又は複数のクラスタを生成する。
【0017】修正手段17は、第3の格納手段15に格
納される認識手段13の認識結果を修正するものであっ
て、クラスタリング手段16の生成するクラスタの中か
ら、誤読の可能性の高いクラスタを抽出する抽出手段1
9と、算出手段11の算出する特徴ベクトルを使って、
抽出手段19の抽出したクラスタに最も距離の近い他文
字カテゴリのクラスタを特定したり、認識手段13のリ
ジェクトした入力文字に最も距離の近い他文字カテゴリ
のクラスタを特定する特定手段20と、抽出手段19の
抽出したクラスタに属する入力文字の認識文字カテゴリ
を変更したり、リジェクト入力文字を認識可能文字に変
更するとともに、その認識文字カテゴリを設定する変更
手段21と、抽出手段19の抽出したクラスタに属する
入力文字をリジェクト文字に変更する第2の変更手段2
2とを備える。
【0018】出力手段18は、修正手段17により修正
された認識手段13の認識結果を外部に出力する。この
ように構成される本発明の文字認識装置1では、クラス
タリング手段16は、算出手段11の算出する特徴ベク
トルを、認識手段13の認識する文字カテゴリ毎にクラ
スタリングすることで、文字カテゴリ毎に1つ又は複数
のクラスタを生成する。
【0019】例えば、クラスタリング手段16は、最
初、階層クラスタリング手法に従ってクラスタリングを
行ってクラスタを生成し、続いて、そのクラスタを初期
状態として用いて非階層クラスタリング手法に従ってク
ラスタリングを行うことで、文字カテゴリ毎に1つ又は
複数のクラスタを生成するのである。
【0020】このクラスタの生成を受けて、抽出手段1
9は、生成されたクラスタの中から、例えば、クラスタ
内の入力文字数が規定値以下となるクラスタを抽出する
ことで、誤読の可能性の高いクラスタを抽出し、これを
受けて、特定手段20は、算出手段11の算出する特徴
ベクトルを使って、抽出された誤読の可能性の高いクラ
スタに最も距離の近い他文字カテゴリのクラスタを特定
する。
【0021】このとき、特定手段20は、特定処理の高
速化や正確さを図るために、抽出された誤読の可能性の
高いクラスタの文字カテゴリに応じて特定対象とする他
文字カテゴリを予め限定しておくことがあり、また、特
定対象とする他文字カテゴリを認識手段13の算出する
距離値の小さな上位の文字カテゴリに限定することがあ
る。
【0022】そして、変更手段21は、抽出された誤読
の可能性の高いクラスタと、特定手段20の特定するそ
れに最も距離の近い他文字カテゴリのクラスタとの間の
距離値が規定値以下を示すときに、抽出された誤読の可
能性の高いクラスタに属する入力文字の内、認識文字カ
テゴリとの間の距離値が規定値以上を示すものを変更対
象として、その認識文字カテゴリを特定手段20の特定
するクラスタの文字カテゴリに変更する。
【0023】すなわち、誤読の可能性の高いクラスタを
抽出すると、それに最も距離の近い他文字カテゴリのク
ラスタを特定して、それとの類似度が大きいときには、
その誤読の可能性の高いクラスタに含まれる認識確信度
の低い入力文字の認識文字カテゴリを、その最も距離の
近いクラスタの認識文字カテゴリに変更するのである。
【0024】一方、第2の変更手段22は、抽出された
誤読の可能性の高いクラスタと、全他文字カテゴリの全
クラスタとの間の距離値が規定値以上を示すときに、抽
出された誤読の可能性の高いクラスタに属する入力文字
をリジェクト文字に変更する。
【0025】すなわち、誤読の可能性の高いクラスタを
抽出するときに、それが全他文字カテゴリの全クラスタ
と類似しないときには、その誤読の可能性の高いクラス
タに属する入力文字をリジェクト文字に変更するのであ
る。
【0026】一方、特定手段20は、算出手段11の算
出する特徴ベクトルを使って、認識手段13のリジェク
トする入力文字に最も距離の近い他文字カテゴリのクラ
スタを特定する。
【0027】このとき、特定手段20は、特定処理の高
速化を図るために、リジェクト文字の認識文字カテゴリ
に応じて特定対象とする他文字カテゴリを予め限定して
おくことがあり、また、特定対象とする他文字カテゴリ
を認識手段13の算出する距離値の小さな上位の文字カ
テゴリに限定することがある。
【0028】そして、変更手段21は、リジェクトされ
た入力文字と、特定手段20の特定するそれに最も距離
の近い他文字カテゴリのクラスタとの間の距離値が規定
値以下を示すときに、リジェクトされた入力文字の内、
認識文字カテゴリとの距離値が規定値以下を示すものを
変更対象として、それを認識可能文字に変更するととも
に、その認識文字カテゴリを特定手段20の特定するク
ラスタの文字カテゴリに設定する。
【0029】すなわち、リジェクト入力文字に最も距離
の近い他文字カテゴリのクラスタを特定して、それとの
類似度が大きいときにあって、そのリジェクト入力文字
のリジェクト確信度が低いときには、そのリジェクト入
力文字を認識可能文字に変更するとともに、その認識文
字カテゴリをその最も距離の近いクラスタの文字カテゴ
リに設定するのである。
【0030】このようにして、本発明の文字認識装置1
では、入力文字の特徴ベクトルをクラスタリングするこ
とでクラスタを生成する構成を採って、その中から誤読
の可能性の高いクラスタを抽出して、それに最も距離の
近い他文字カテゴリのクラスタを特定し、それとの類似
度が大きいときには、その誤読の可能性の高いクラスタ
に含まれる入力文字の内、認識確信度の低い入力文字の
認識文字カテゴリを、その類似するクラスタの文字カテ
ゴリに変更する構成を採ることから、前もって文字サン
プルを収集しなくても、手書き文字の正確な文字認識処
理を実行できるようになる。
【0031】そして、その誤読の可能性の高いクラスタ
が全他文字カテゴリの全クラスタと類似しないときに
は、その誤読の可能性の高いクラスタに属する入力文字
をリジェクト文字に変更するので、手書き文字の正確な
文字認識処理を実行できるようになる。
【0032】そして、リジェクト入力文字に最も距離の
近い他文字カテゴリのクラスタを特定して、それとの類
似度が大きいときにあって、そのリジェクト入力文字の
リジェクト確信度が低いときには、そのリジェクト入力
文字を認識可能文字に変更するとともに、その認識文字
カテゴリをその類似するクラスタの文字カテゴリに設定
するので、手書き文字の正確な文字認識処理を実行でき
るようになる。
【0033】
【発明の実施の形態】以下、実施の形態に従って本発明
を詳細に説明する。図2に、本発明の文字認識装置1の
装置構成を図示する。
【0034】この図に示すように、本発明の文字認識装
置1は、認識対象となる文書のイメージを読み取るスキ
ャナ30と、スキャナ30の読み取った文書イメージを
格納する文書イメージ格納メモリ31と、各文字カテゴ
リの持つ特徴ベクトルを管理する辞書32と、文書イメ
ージ格納メモリ31に格納される文書イメージの中か
ら、同一筆記者により記入された多数の文字を認識対象
の文字として抽出して、それらの認識対象文字の持つ特
徴ベクトルを使い、クラスタリング手法を用いつつ、そ
れらの認識対象文字の文字カテゴリを認識する認識プロ
グラム33と、認識プログラム33の抽出する認識対象
文字の文書イメージを格納する処理文書イメージ格納メ
モリ34と、認識プログラム33の算出する認識対象文
字の持つ特徴ベクトルを格納する特徴ベクトル格納メモ
リ35と、認識プログラム33の認識結果を格納する認
識結果格納メモリ36と、認識プログラム33の求める
認識対象文字と認識文字カテゴリとの間の距離値を格納
する辞書距離値格納メモリ37と、認識プログラム33
の実行するクラスタリング結果を格納するクラスタ情報
格納メモリ38とを備える。
【0035】図3に、認識プログラム33の実行する処
理フローの一実施例を図示する。次に、この処理フロー
に従って、本発明について詳細に説明する。認識プログ
ラム33は、同一筆記者により記入された文書の文字認
識要求が発行されると、図3の処理フローに示すよう
に、先ず最初に、ステップ1で、文書イメージ格納メモ
リ31に格納される文書イメージの中から、同一筆記者
により記入された文書を抽出して処理文書イメージ格納
メモリ34に格納する。
【0036】この抽出処理は、例えば、文書イメージ格
納メモリ31に格納される文書イメージの中に、同一筆
記者により記入された箇所であることを示すマークが付
いているときには、そのマークの指す文書を取り出すこ
とで実行する。また、同一筆記者単位に記入されること
が決められている図4に示すような文書については、そ
の部分を取り出すことで実行する。
【0037】続いて、ステップ2で、ステップ1で格納
した処理文書イメージ格納メモリ34から同一筆記者に
より記入された文書を読み出して、その文書の持つ文字
を1文字ずつ順番に切り出す。この文字の切り出し処理
は従来方法に従って実行する。
【0038】続いて、ステップ3で、ステップ2で切り
出した各文字の持つ特徴ベクトルを順番に算出して、そ
れを特徴ベクトル格納メモリ35に順番に格納する。こ
の特徴ベクトルとしては、従来方法で用いられているど
のようなものであってもよい。このとき、特徴ベクトル
の次元数が大きいときには、必要に応じて、主成分分析
法や判別分析法等の統計手法を用いて次元数の削減を行
うことになる。
【0039】例えば、文字を枡目に区画し、その枡目の
黒い部分の値を“1”、白い部分の値を“0”として、
枡目の左上から右下まで枡目の値を順番に並べたものを
特徴ベクトルとして用いる場合には、図5に示すような
特徴ベクトルを算出する。ここで、図5では、文字
“2”の特徴ベクトルを例示しており、記号2aで示さ
れる手書きの文字“2”と、記号2bで示される手書き
の文字“2”と、記号2cで示される手書きの文字
“2”とは、手書きによりパターンが若干異なることか
ら、その特徴ベクトルも若干異なることになる。
【0040】続いて、ステップ4で、ステップ2で切り
出した各文字の文字カテゴリを認識して認識結果格納メ
モリ36に格納するとともに、その認識文字カテゴリと
の間の距離値を辞書距離値格納メモリ37に格納する。
【0041】この認識処理は、ステップ3で格納した各
文字の持つ特徴ベクトルを特徴ベクトル格納メモリ35
から順番に読み出して、その読み出した特徴ベクトル
と、辞書32に登録される各文字カテゴリの持つ特徴ベ
クトルとの間の距離値を従来方法に従って算出し、最も
小さな距離値を特定して、その最小距離値を辞書距離値
格納メモリ37に格納するとともに、その最小距離値の
示す文字カテゴリを認識結果として認識結果格納メモリ
36に格納することで行う。そして、その認識文字カテ
ゴリとの間の距離値が規定値以下とならないとき、すな
わち、認識の確信度が低いときには、その文字を認識不
可能なリジェクト文字として設定することで行う。
【0042】例えば、図6に示すように、図5に示した
記号2bで示される手書きの文字の特徴ベクトルと、辞
書32に登録される文字“1”/“2”/“3”/
“4”の特徴ベクトルとの間の距離値を、「dij=(x
i −xj )の絶対値」に従って算出して、その中の最も
小さな距離値の指す文字を特定することで、その記号2
bで示される手書きの文字が“2”であることを認識す
るのである。
【0043】続いて、ステップ5で、認識文字カテゴリ
毎に、特徴ベクトル格納メモリ35に格納した特徴ベク
トルに対してクラスタリング処理を施すことで、距離の
近いものをまとめることで定義されるクラスタを生成し
て、そのクラスタ情報をクラスタ情報格納メモリ38に
格納する。
【0044】このクラスタリング処理には、階層的クラ
スタリング手法と、k-means法や階層的モード法等の非
階層的クラスタリング手法という2つの手法がある。階
層的クラスタリング手法は、図7に示すように、特徴ベ
クトルのそれぞれを1個のクラスタと考えて、クラスタ
間の距離が最も近いもの同士を統合していくことを繰り
返していくでクラスタを生成する手法であり、クラスタ
内の要素は、一度あるクラスタに帰属すると、別のクラ
スタに移動しないという特徴がある。なお、図4では、
「2」の文字が1つだけ、「4」と間違って認識されて
いることを想定している。
【0045】一方、非階層的クラスタリング手法は、k
-means法で説明するならば、図8に示すように、最初に
最終クラスタ数を決めてから、適当にクラスタの核とな
る要素を決めて、それをクラスタ重心とする。そして、
ある要素に対して、各クラスタ重心との距離を算出し
て、最も距離の近いクラスタに帰属させ、要素の増え
たクラスタに対して、重心位置を計算し直し、各クラ
スタ内の要素に対し、最も距離の近いクラスタ重心が変
わった場合、再配置し直すという流れを採って、ない
しの処理を繰り返していって、各クラスタの重心位置
が変化しなくなった時点で処理を打ち切ることで行われ
る。
【0046】この非階層的クラスタリング手法は、階層
的クラスタリング手法と異なって、クラスタ内の要素
は、一度あるクラスタに帰属しても、生成過程のクラス
タの分布に応じて、別のクラスタに再配置されることが
あるという特徴がある。これから、階層的クラスタリン
グ手法に比べて、高精度のクラスタリング処理が可能に
なるが、最初に選ぶクラスタの核により処理結果が異な
るという特性がある。
【0047】なお、階層的クラスタリング手法/非階層
的クラスタリング手法で、クラスタ間の距離を求める場
合、クラスタの要素数(特徴ベクトル)が1つとなると
きには、特徴ベクトルと特徴ベクトルとの間の距離を算
出することで求めることになるが、クラスタの要素数が
複数となるときには、例えば、そのクラスタに属する特
徴ベクトルの平均ベクトルを求めることで代表ベクトル
を求めて、その代表ベクトルと代表ベクトルとの間の距
離を算出することで求めることになる。
【0048】認識プログラム33は、このような階層的
クラスタリング手法/非階層的クラスタリング手法の特
徴を使って、図3の処理フローのステップ5に入ると、
先ず最初に、階層的クラスタリング手法に従って特徴ベ
クトルのクラスタリング処理を行うことでクラスタを生
成し、続いて、それらの各クラスタの平均ベクトルを核
として用いて、非階層的クラスタリング手法に従ってク
ラスタリング処理を行うことで、高精度でかつ一義的な
クラスタリング処理を実行するように処理する構成を採
っている。
【0049】図9及び図10に、このステップ5で実行
するクラスタリング処理の詳細な処理フローの一実施例
を図示する。すなわち、認識プログラム33は、図3の
処理フローのステップ5に入ると、階層的クラスタリン
グ処理に入って、図9の処理フローに示すように、先ず
最初に、ステップ1で、特徴ベクトル格納メモリ35か
ら、クラスタリング処理の対象とする特徴ベクトルとし
て、ある認識文字カテゴリの特徴ベクトルだけを抽出す
る。例えば、文字“4”と認識された文字の持つ特徴ベ
クトルだけを抽出するのである。
【0050】続いて、ステップ2で、クラスタリング処
理の打ち切り条件を設定する。例えば、クラスタ数が3
つ以下となるまでクラスタリング処理を行うとか、クラ
スタ統合時のクラスタ間距離が閾値以上となるまでクラ
スタリング処理を行うとか、クラスタ統合時のクラスタ
間距離の増加率が閾値以上となるまでクラスタリング処
理を行うというような打ち切り条件が用意される場合に
は、その中から、1つの打ち切り条件を選択するのであ
る。
【0051】続いて、ステップ3で、全クラスタの中か
ら最も距離の近い2つのクラスタを選択し、続くステッ
プ4で、クラスタリング処理の打ち切り条件を充足して
いるのか否かを判断して、打ち切り条件を充足していな
いことを判断するときには、ステップ5に進んで、その
選択した2つのクラスタを統合してからステップ3に戻
ることを繰り返していくことで、打ち切り条件を充足す
るまで、ステップ1で抽出した特徴ベクトルに対しての
クラスタリング処理を実行する。
【0052】そして、ステップ4で、クラスタリング処
理の打ち切り条件の充足を判断すると、ステップ6に進
んで、全文字カテゴリに対してクラスタリング処理を実
行したのか否かを判断して、実行していないことを判断
するときには、ステップ1に戻り、実行したことを判断
するときには、階層的クラスタリング処理を終了する。
【0053】続いて、認識文字カテゴリ毎に、非階層的
クラスタリング処理に入って、図10の処理フローに示
すように、先ず最初に、ステップ1で、処理対象として
選択した認識文字カテゴリの持つ各クラスタ(図9の処
理フローに従って生成されたクラスタ)の平均ベクトル
を求めて、それを非階層的クラスタリング処理における
クラスタの核として設定する。
【0054】続いて、ステップ2で、ある要素(文字≡
特徴ベクトル)と各クラスタ重心との間の距離を算出
し、続くステップ3で、最も距離の近いクラスタにその
要素を帰属させ、続くステップ4で、各クラスタの重心
位置を計算する。
【0055】続いて、ステップ5で、重心位置が変化し
たのか否かをチェックして、重心位置が変化しないこと
判断するときには、クラスタリング処理を終了し、変化
することを判断するときには、ステップ6に進んで、各
クラスタ内要素の最近傍の重心が変化したのか否かをチ
ェックして、重心が変化したことを判断するときには、
ステップ7に進んでクラスタ内要素を再配置してからス
テップ2に戻り、重心が変化しないことを判断するとき
には、そのままステップ2に戻っていくことで、非階層
的クラスタリング処理を実行する。
【0056】このようにして、認識プログラム33は、
図3の処理フローのステップ5に入ると、認識文字カテ
ゴリ毎に、先ず最初に、階層的クラスタリング手法に従
って特徴ベクトルのクラスタリング処理を行うことでク
ラスタを生成し、続いて、それらの各クラスタの平均ベ
クトルを核として用いて、非階層的クラスタリング手法
に従ってクラスタリング処理を行うことで、最終的な特
徴ベクトルのクラスタを生成して、そのクラスタ情報を
クラスタ情報格納メモリ38に格納するのである。
【0057】これから説明するように、クラスタを生成
するのは、誤読の可能性の高い文字を抽出するためであ
る。認識プログラム33が、このような2段階のクラス
タリング構成を採るのは、階層的クラスタリング処理の
結果を元にして、非階層的クラスタリング処理で再度ク
ラスタリングし直していくことで、正読文字と誤読文字
とを別々のクラスタとして生成させていくことに、その
理由がある。
【0058】認識プログラム33は、図3の処理フロー
のステップ5で、認識文字カテゴリ毎に、特徴ベクトル
のクラスタを生成すると、続いて、ステップ6で、生成
したクラスタの中に含まれる誤読候補クラスタを抽出す
る。
【0059】この誤読候補クラスタの抽出処理は、例え
ば、図11(a)の処理フローに示すように、クラスタ
内要素数が閾値以下のクラスタを誤読候補クラスタとし
て抽出し、それ以外のクラスタを正読候補クラスタとし
て抽出することで行う。すなわち、この判断方法では、
閾値よりも要素数の少ないクラスタは誤読の可能性が高
いとして判断するのである。この判断方法は、クラスタ
内要素数だけを基準にして行われることから、高速処理
が可能になるという利点がある。
【0060】また、図11(b)の処理フローに示すよ
うに、クラスタ内要素数が閾値以下で、かつ、その認識
文字カテゴリの他クラスタとの間の相関比が閾値以上と
なるクラスタを誤読候補クラスタとして抽出し、それ以
外のクラスタを正読候補クラスタとして抽出することで
行う。この相関比とは、クラスタ間分散和を全分散(ク
ラスタ内分散和+クラスタ間分散和)で割算した値で定
義されるものであって、他クラスタとの間の距離が大き
くなるに従って、その値が大きくなるという特性があ
る。すなわち、この判断方法では、要素数が少なく、か
つ他クラスタと距離の離れているクラスタを誤読の可能
性が高いとして判断するのである。この判断方法は、ク
ラスタ内要素数だけを基準とする場合に比べて、正確な
処理が可能になるという利点がある。
【0061】また、図12(a)の処理フローに示すよ
うに、クラスタ内要素数がその認識文字カテゴリの総要
素数の規定定数倍以下となるクラスタを誤読候補クラス
タとして抽出し、それ以外のクラスタを正読候補クラス
タとして抽出することで行う。すなわち、この判断方法
では、例えば総要素数の0.2倍の要素数を閾値として設
定して、その閾値よりも要素数の少ないクラスタは誤読
の可能性が高いとして判断するのである。この判断方法
は、クラスタ内要素数だけを基準にして行われることか
ら、高速処理が可能になるという利点がある。しかも、
閾値を認識文字カテゴリの総要素数に応じて設定するこ
とから、閾値を固定値とする場合に比べて、正確な処理
が可能になるという利点がある。
【0062】また、図12(b)の処理フローに示すよ
うに、クラスタ内要素数がその認識文字カテゴリの総要
素数の規定定数倍以下で、かつ、その認識文字カテゴリ
の他クラスタとの間の相関比が閾値以上となるクラスタ
を誤読候補クラスタとして抽出し、それ以外のクラスタ
を正読候補クラスタとして抽出することで行う。すなわ
ち、この判断方法では、総要素数の規定定数倍で定義さ
れる閾値よりも要素数が少なく、かつ他クラスタと距離
の離れているクラスタを誤読の可能性が高いとして判断
するのである。この判断方法は、クラスタ内要素数だけ
を基準とする場合に比べて、正確な処理が可能になると
いう利点がある。しかも、閾値を認識文字カテゴリの総
要素数に応じて設定することから、閾値を固定値とする
場合に比べて、正確な処理が可能になるという利点があ
る。
【0063】認識プログラム33は、図3の処理フロー
のステップ6で、誤読候補のクラスタを抽出すると、続
いて、ステップ7で、誤って認識された文字カテゴリを
正しいものに修正したり、誤って認識された文字カテゴ
リをリジェクト文字に修正したり、リジェックト文字と
して設定されたものを認識可能文字に変更して、その文
字カテゴリを設定する処理を行う。
【0064】図13に従って、このステップ7で実行す
る修正処理の基本的な考え方について説明すると、図3
の処理フローのステップ3及びステップ4の処理に従っ
て、図中のαで示すように、認識文字カテゴリ毎に、そ
れに属する文字の持つ特徴ベクトルが得られ、図3の処
理フローのステップ5の処理に従って、図中のβに示す
ように、各認識文字カテゴリ毎に、それに属する特徴ベ
クトルのクラスタが生成されて、図3の処理フローのス
テップ6の処理に従って、このクラスタの中から、認識
文字カテゴリ“2”に属するクラスタaと、認識文字カ
テゴリ“4”に属するクラスタdとが誤読候補クラスタ
として抽出される。
【0065】このステップ7では、誤読候補クラスタに
最も近い他文字カテゴリのクラスタを特定して、この誤
読候補クラスタとそのクラスタとの間の距離が近いとき
には、この誤読候補クラスタに含まれる文字の内、認識
文字カテゴリとの間の距離(辞書距離値格納メモリ37
に格納される辞書距離値)が大きいもの、すなわち、認
識文字カテゴリに対する認識の確信度が低いものについ
ては、その認識文字カテゴリを、現在のものから、その
最も近いクラスタの文字カテゴリに修正する処理を行
う。
【0066】例えば、図中のβ,γに示すように、誤読
候補クラスタdに最も近い他文字カテゴリのクラスタと
して、認識文字カテゴリ“2”に属するクラスタbを特
定するときに、誤読候補クラスタdとそのクラスタbと
が近いときには、誤読候補クラスタdに含まれる文字の
内、認識文字カテゴリ“4”に対する認識の確信度が低
いものについては、その認識文字カテゴリを、現在の
“4”からクラスタbの“2”に修正するのである。
【0067】この修正処理に従って、認識文字カテゴリ
を変更していくときに、認識に対する確信度が低い文字
のみを変更していくことから、誤った認識文字カテゴリ
の変更を防止できるようになる。
【0068】ここで、誤読候補クラスタに最も近い他文
字カテゴリのクラスタを特定するときに、全ての他文字
カテゴリを検索対象とするのではなくて、誤読の可能性
のある特定の他文字カテゴリに検索対象を限定すると、
精度を落とすことなくクラスタを高速に特定できるよう
になる。また、最小距離値を示す文字カテゴリを認識結
果とすることになるが、これに続く距離値の小さな上位
の文字カテゴリを検索対象として限定しても、同様に、
精度を落とすことなくクラスタを高速に特定できるよう
になる。すなわち、文字パターンから誤読されるものは
大体決まっているので、この誤読の可能性の高い文字カ
テゴリを検索対象として限定したり、認識候補となった
上位の文字カテゴリ(個数とか距離値で絞る)を検索対
象として限定することで処理の高速化を図るのである。
【0069】そして、このステップ7では、リジェクト
文字に最も近い他文字カテゴリのクラスタを特定して、
このリジェクト文字とそのクラスタとの間の距離が近い
ときには、このリジェクト文字の内、認識文字カテゴリ
との間の距離(上述したように、リジェクト文字でも認
識文字カテゴリは特定されている)が小さいもの、すな
わち、リジェクトに対する確信度が低いものについて
は、リジェクト文字の判定を解除して認識可能文字に変
更するとともに、その認識文字カテゴリを、現在のもの
から、その最も近いクラスタの文字カテゴリに修正する
処理を行う。
【0070】例えば、図中のβ,γに示すように、リジ
ェクト文字g,hに最も近い他文字カテゴリのクラスタと
して、認識文字カテゴリ“4”に属するクラスタeを特
定するときに、リジェクト文字g,hとそのクラスタeと
が近いときにあって、リジェクト文字g,hに対するリジ
ェクト確信度が低いときには、リジェクト文字g,hを認
識可能文字に変更するとともに、その認識文字カテゴリ
を現在のものからクラスタeの属する“4”に修正する
のである。
【0071】この修正処理に従って、リジェクト文字を
正読化していくときに、リジェクト確信度が低いリジェ
クト文字のみを正読化していくことから、誤ったリジェ
クト文字の正読化の発生を防止できるようになる。
【0072】ここで、リジェクト文字に最も近い他文字
カテゴリのクラスタを特定するときに、全ての他文字カ
テゴリを検索対象とするのではなくて、正読の可能性の
ある特定の他文字カテゴリに検索対象を限定すると、精
度を落とすことなくクラスタを高速に特定できるように
なる。また、リジェクト文字と距離値の小さな上位の文
字カテゴリを検索対象として限定しても、同様に、精度
を落とすことなくクラスタを高速に特定できるようにな
る。
【0073】そして、このステップ7では、誤読候補ク
ラスタと全他文字カテゴリの全クラスタとの間の距離が
遠いときには、その誤読候補クラスタに属する文字を認
識可能文字からリジェクト文字に修正する処理を行う。
【0074】例えば、図中のβ,γに示すように、誤読
候補クラスタaが全他文字カテゴリの全クラスタと離れ
ているときには、その誤読候補クラスタaに属する全て
の文字を認識可能文字からリジェクト文字に修正するの
である。
【0075】この修正処理に従って、誤読されていた文
字がリジェクト化されることで、誤読率を減少できるよ
うになる。図14に、この図13で説明した認識結果修
正処理を実行すべく、認識プログラム33が図3の処理
フローのステップ7で実行する認識結果修正処理の詳細
な処理フローの一実施例を図示する。
【0076】認識プログラム33は、図3の処理フロー
のステップ6で、誤読候補クラスタを抽出すると、図3
の処理フローのステップ7に入って、この図14の処理
フローに示すように、先ず最初に、ステップ1で、特徴
ベクトルを使って、各誤読候補クラスタ/各リジェクト
文字と最も距離の近い他文字カテゴリのクラスタを抽出
する。
【0077】続いて、ステップ2で、この抽出したクラ
スタとの間の距離値が閾値以下であるのか否かを判断し
て、閾値以下ではないことを判断するとき、すなわち、
この抽出したクラスタと類似しないときには、何も処理
を実行しない。但し、抽出元が誤読候補クラスタであ
り、そのときに、その誤読候補クラスタと全他文字カテ
ゴリの全クラスタとの間の距離が遠いときには、その誤
読候補クラスタに属する文字を認識可能文字からリジェ
ックト文字に修正する処理を行う。
【0078】一方、ステップ2で、最も距離の近い他文
字カテゴリのクラスタとの間の距離値が閾値以下である
ことを判断するときには、ステップ3に進んで、誤読候
補クラスタ/リジェクト文字と抽出したクラスタとを統
合し、続くステップ4で、抽出元が誤読候補クラスタで
あるときには、この誤読候補クラスタに含まれる文字の
内、認識文字カテゴリに対する認識の確信度の高いもの
と低いものとを区分けして、認識の確信度の高い文字に
ついては何も処理を行わず、認識の確信度の低い文字に
ついては、ステップ5に進んで、その文字の認識文字カ
テゴリを現状のものから統合先のものに修正する。
【0079】また、抽出元がリジェクト文字であるとき
には、このリジェクト文字の内、リジェクトに対する確
信度の高いものと低いものとを区分けして、リジェクト
に対する確信度の高い文字については何も処理を行わ
ず、リジェクトに対する確信度の低い文字については、
ステップ5に進んで、リジェクトを解除してから、その
の認識文字カテゴリを、その最も近いクラスタの文字カ
テゴリに設定する処理を行う。
【0080】続いて、ステップ6で、抽出元が誤読候補
クラスタであるときには、この誤読候補クラスタに含ま
れる文字の全てについて処理を実行したのか否かを判断
して、実行していないものがあるときには、ステップ4
に戻っていく。
【0081】そして、ステップ7で、全誤読候補クラス
タ/全リジェクト文字について処理を実行したのか否か
を判断して、実行していないものがあるときには、ステ
ップ1に戻り、全て実行し終えたときには、処理を終了
する。このようにして、認識プログラム33は、この図
14の処理フローを実行することで、図13で説明した
認識結果修正処理を実行するのである。
【0082】このように、認識プログラム33は、同一
筆記者により記入された文書の文字認識要求が発行され
ると、図3の処理フローに従って、先ず最初に、ステッ
プ1で、同一筆記者により記入された文書を抽出し、続
いて、ステップ2で、その抽出した文書の持つ文字を1
文字ずつ切り出し、続いて、ステップ3で、各文字の持
つ特徴ベクトルを算出し、続いて、ステップ4で、各文
字の文字カテゴリを認識するとともに、その認識文字カ
テゴリとの間の距離値を特定し、続いて、ステップ5
で、階層的クラスタリング手法/非階層的クラスタリン
グ手法を使って、認識文字カテゴリ毎に、特徴ベクトル
のクラスタリング処理を行うことでクラスタを生成し、
続いて、ステップ6で、そのクラスタの中に含まれる誤
読候補クラスタを抽出し、続いて、ステップ7で、その
誤読候補クラスタに含まれる文字の認識文字カテゴリを
修正したり、その誤読候補クラスタに含まれる文字をリ
ジェクト文字に修正したり、リジェクト文字を認識可能
文字に修正して認識文字カテゴリを設定することで、同
一筆記者により記入された文書の文字認識を実行するの
である。
【0083】
【発明の効果】以上説明したように、本発明の文字認識
装置では、入力文字の特徴ベクトルをクラスタリングす
ることでクラスタを生成する構成を採って、その中から
誤読の可能性の高いクラスタを抽出して、それに最も距
離の近い他文字カテゴリのクラスタを特定し、それとの
類似度が大きいときには、その誤読の可能性の高いクラ
スタに含まれる入力文字の内、認識確信度の低い入力文
字の認識文字カテゴリを、その類似するクラスタの認識
文字カテゴリに変更する構成を採ることから、従来では
誤読されていた文字の文字カテゴリの自動修正が可能に
なるとともに、前もって文字サンプルを収集しなくて
も、手書き文字を高精度に認識できるようになる。
【0084】そして、その誤読の可能性の高いクラスタ
が他文字カテゴリの全クラスタと類似しないときには、
その誤読の可能性の高いクラスタに属する入力文字をリ
ジェクト文字に変更するので、リジェクトすべき文字が
誤読されることがなくなって、手書き文字を高精度に認
識できるようになる。
【0085】そして、リジェクト入力文字に最も距離の
近い他文字カテゴリのクラスタを特定して、それとの類
似度が大きいときにあって、そのリジェクト入力文字の
リジェクト確信度が低いときには、そのリジェクト入力
文字を認識可能文字に変更するとともに、その認識文字
カテゴリをその類似するクラスタの認識文字カテゴリに
設定するので、読み取りが可能なリジェクト文字を正読
化できるようになって、正確な文字認識処理を実行でき
るようになる。
【0086】このように、本発明の文字認識装置では、
先に出願の特願平8-30217号で開示したクラスタリング
手法による文字認識アルゴリズムの実装にあたって、認
識確信度を考慮して認識文字カテゴリを修正する構成を
採ったことから、同一筆記者により記入された手書き文
字を更に高精度に認識できるようになる。そして、認識
確信度を使って、誤読文字をリジェクト文字に変更した
り、リジェクト確信度を使って、リジェクト文字を認識
可能文字に変更することで、更に実用的なものにするこ
とができるようになる。
【0087】しかも、本発明の文字認識装置は、従来の
文字認識装置をそのまま利用して実装できることから、
インプリメントが容易であるという利点もある。
【図面の簡単な説明】
【図1】本発明の原理構成図である。
【図2】本発明の装置構成図である。
【図3】認識プログラムの実行する処理フローの一実施
例である。
【図4】スキャナで読み取る文書の一例である。
【図5】特徴ベクトルの一例である。
【図6】文字カテゴリ認識処理の説明図である。
【図7】階層的クラスタリング手法の説明図である。
【図8】非階層的クラスタリング手法の説明図である。
【図9】クラスタリング処理の処理フローの一実施例で
ある。
【図10】クラスタリング処理の処理フローの一実施例
である。
【図11】誤読候補クラスタの抽出処理の処理フローで
ある。
【図12】誤読候補クラスタの抽出処理の処理フローで
ある。
【図13】認識結果修正処理の説明図である。
【図14】認識結果修正処理の処理フローの一実施例で
ある。
【符号の説明】
1 文字認識装置 10 辞書 11 算出手段 12 第1の格納手段 13 認識手段 14 第2の格納手段 15 第3の格納手段 16 クラスタリング手段 17 修正手段 18 出力手段 19 抽出手段 20 特定手段 21 変更手段 22 第2の変更手段
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平6−187499(JP,A) 特開 平2−300989(JP,A) 川谷隆彦,筆記個人性を用いた手書き 数字認識の改善,電子情報通信学会論文 誌,日本,電子情報通信学会,1995年 7月25日,D−2 Vol.J78−D− 2 No.7,p.1047−1057 川谷隆彦,宮本信夫,認識結果を用い た手書き数字認識の数量化とその応用, 電子情報通信学会論文誌,日本,電子情 報通信学会論文誌,1991年 3月25日, D−2 Vol.J74−D−2 No. 3,p.357−365 (58)調査した分野(Int.Cl.7,DB名) G06F 9/03 - 9/62 JICSTファイル(JOIS)

Claims (11)

    (57)【特許請求の範囲】
  1. 【請求項1】 同一筆記者により記入された多数の入力
    文字の文字カテゴリを認識する文字認識装置において、 入力文字の持つ特徴ベクトルを算出する算出手段と、 上記算出手段の算出する特徴ベクトルと、辞書に登録さ
    れる各文字カテゴリの持つ特徴ベクトルとの間の距離値
    を算出して、最も小さな距離値を示す文字カテゴリを入
    力文字の文字カテゴリとして認識するとともに、その認
    識文字カテゴリとの間の距離値が規定値以下とならない
    ときには、入力文字を認識不可能としてリジェクトする
    認識手段と、 上記算出手段の算出する特徴ベクトルを、上記認識手段
    の認識する文字カテゴリ毎にクラスタリングすること
    で、該文字カテゴリ毎に1つ又は複数のクラスタを生成
    するクラスタリング手段と、 上記クラスタリング手段の処理結果と、上記算出手段の
    算出する特徴ベクトルと、上記認識手段の認識する文字
    カテゴリと、上記認識手段の算出する入力文字と認識文
    字カテゴリとの間の距離値とから、上記認識手段の認識
    結果を修正する修正手段とを備えることを、 特徴とする文字認識装置。
  2. 【請求項2】 請求項1記載の文字認識装置において、 修正手段は、 クラスタリング手段の生成するクラスタの中から、誤読
    の可能性の高いクラスタを抽出する抽出手段と、 算出手段の算出する特徴ベクトルを使って、上記抽出手
    段の抽出するクラスタに最も距離の近い他文字カテゴリ
    のクラスタを特定する特定手段と、 上記抽出手段の抽出するクラスタと上記特定手段の特定
    するクラスタとの間の距離値が規定値以下を示すとき
    に、上記抽出手段の抽出するクラスタに属する入力文字
    の内、認識文字カテゴリとの間の距離値が規定値以上を
    示すものを変更対象として、その認識文字カテゴリを上
    記特定手段の特定するクラスタの文字カテゴリに変更す
    る変更手段とを備えることを、 特徴とする文字認識装置。
  3. 【請求項3】 請求項2記載の文字認識装置において、 修正手段は、 抽出手段の抽出するクラスタと、全他文字カテゴリの全
    クラスタとの間の距離値が規定値以上を示すときに、抽
    出手段の抽出するクラスタに属する入力文字をリジェク
    ト文字に変更する第2の変更手段を備えることを、 特徴とする文字認識装置。
  4. 【請求項4】 請求項1記載の文字認識装置において、 修正手段は、 算出手段の算出する特徴ベクトルを使って、認識手段の
    リジェクトする入力文字に最も距離の近い他文字カテゴ
    リのクラスタを特定する特定手段と、 認識手段のリジェクトする入力文字と上記特定手段の特
    定するクラスタとの間の距離値が規定値以下を示すとき
    に、認識手段のリジェクトする入力文字の内、認識文字
    カテゴリとの間の距離値が規定値以下を示すものを変更
    対象として、それを認識可能文字に変更するとともに、
    その認識文字カテゴリを上記特定手段の特定するクラス
    タの文字カテゴリに設定する変更手段とを備えること
    を、 特徴とする文字認識装置。
  5. 【請求項5】 請求項2又は3記載の文字認識装置にお
    いて、 抽出手段は、クラスタ内の入力文字数が規定値以下とな
    るクラスタを、誤読の可能性の高いクラスタとして抽出
    することを、 特徴とする文字認識装置。
  6. 【請求項6】 請求項2又は3記載の文字認識装置にお
    いて、 抽出手段は、クラスタ内の入力文字数がそれの属する文
    字カテゴリの総入力文字数の規定定数倍以下となるクラ
    スタを、誤読の可能性の高いクラスタとして抽出するこ
    とを、 特徴とする文字認識装置。
  7. 【請求項7】 請求項2又は3記載の文字認識装置にお
    いて、 抽出手段は、クラスタ内の入力文字数が規定値以下で、
    かつ、それの属する文字カテゴリの他クラスタとの間の
    距離値が規定値以上となるクラスタを、誤読の可能性の
    高いクラスタとして抽出することを、 特徴とする文字認識装置。
  8. 【請求項8】 請求項2又は3記載の文字認識装置にお
    いて、 抽出手段は、クラスタ内の入力文字数がそれの属する文
    字カテゴリの総入力文字数の規定定数倍以下で、かつ、
    該文字カテゴリの他クラスタとの間の距離値が規定値以
    上となるクラスタを、誤読の可能性の高いクラスタとし
    て抽出することを、 特徴とする文字認識装置。
  9. 【請求項9】 請求項2ないし8記載の文字認識装置に
    おいて、 特定手段は、特定対象とする他文字カテゴリを特定元の
    文字カテゴリに応じて予め限定しておくことを、 特徴とする文字認識装置。
  10. 【請求項10】 請求項2ないし8記載の文字認識装置
    において、 特定手段は、特定対象とする他文字カテゴリを認識手段
    の算出する距離値の小さな上位の文字カテゴリに限定す
    ることを、 特徴とする文字認識装置。
  11. 【請求項11】 請求項1ないし10記載の文字認識装
    置において、 クラスタリング手段は、最初、階層クラスタリング手法
    に従ってクラスタリングを行ってクラスタを生成し、続
    いて、該クラスタを初期状態として用いて非階層クラス
    タリング手法に従ってクラスタリングを行うことを、 特徴とする文字認識装置。
JP21458196A 1996-02-19 1996-08-14 文字認識装置 Expired - Fee Related JP3280577B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP21458196A JP3280577B2 (ja) 1996-08-14 1996-08-14 文字認識装置
US08/801,139 US6345119B1 (en) 1996-02-19 1997-02-18 Handwritten character recognition apparatus and method using a clustering algorithm
DE69732156T DE69732156D1 (de) 1996-02-19 1997-02-19 Verfahren und Gerät zur Zeichenerkennung
EP97301064A EP0790574B1 (en) 1996-02-19 1997-02-19 Character recognition apparatus and method
KR1019970004938A KR100249055B1 (ko) 1996-02-19 1997-02-19 문자인식장치및방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21458196A JP3280577B2 (ja) 1996-08-14 1996-08-14 文字認識装置

Publications (2)

Publication Number Publication Date
JPH1063785A JPH1063785A (ja) 1998-03-06
JP3280577B2 true JP3280577B2 (ja) 2002-05-13

Family

ID=16658095

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21458196A Expired - Fee Related JP3280577B2 (ja) 1996-02-19 1996-08-14 文字認識装置

Country Status (1)

Country Link
JP (1) JP3280577B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100369051C (zh) * 2005-01-11 2008-02-13 富士通株式会社 灰度字符词典的生成装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
川谷隆彦,宮本信夫,認識結果を用いた手書き数字認識の数量化とその応用,電子情報通信学会論文誌,日本,電子情報通信学会論文誌,1991年 3月25日,D−2 Vol.J74−D−2 No.3,p.357−365
川谷隆彦,筆記個人性を用いた手書き数字認識の改善,電子情報通信学会論文誌,日本,電子情報通信学会,1995年 7月25日,D−2 Vol.J78−D−2 No.7,p.1047−1057

Also Published As

Publication number Publication date
JPH1063785A (ja) 1998-03-06

Similar Documents

Publication Publication Date Title
KR100249055B1 (ko) 문자인식장치및방법
US7336827B2 (en) System, process and software arrangement for recognizing handwritten characters
US5787197A (en) Post-processing error correction scheme using a dictionary for on-line handwriting recognition
KR100716594B1 (ko) 문자 식별
CN112613293A (zh) 摘要生成方法、装置、电子设备及存储介质
JPH11203415A (ja) 類似パターンカテゴリ識別辞書作成装置および方法
JPH11328317A (ja) 日本語文字認識誤り訂正方法及び装置、並びに、誤り訂正プログラムを記録した記録媒体
JP3917349B2 (ja) 文字認識結果を利用して情報を検索する検索装置および方法
JP5365065B2 (ja) 辞書作成装置
CN113158777A (zh) 质量评分方法、质量评分模型的训练方法及相关装置
JP3280577B2 (ja) 文字認識装置
CN112651590B (zh) 一种指令处理流程推荐的方法
JPH11328306A (ja) 文書画像の論理要素抽出方法、装置および記録媒体
JP3180792B2 (ja) 文字認識装置、文字学習装置およびコンピュータ可読記録媒体
JP3374762B2 (ja) 文字認識方法及びその装置
JP2002183667A (ja) 文字認識装置及び記録媒体
JP2906758B2 (ja) 文字読取装置
JP3487400B2 (ja) 文字認識装置、文字認識方法、及び、記憶媒体
JP3985926B2 (ja) 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体
JP3930174B2 (ja) 文字認識方法および文字認識装置
JP2001118073A (ja) パターン認識装置及び認識方法
Tóth et al. Preprocessing algorithm for deciphering historical inscriptions using string metric
JPH11203413A (ja) 類似カテゴリ識別辞書作成装置および方法
JP3281530B2 (ja) 文字認識装置
JPH11143984A (ja) 文字読取装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020205

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090222

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090222

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100222

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110222

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110222

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120222

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130222

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130222

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140222

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees