JP3033554B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3033554B2
JP3033554B2 JP10025125A JP2512598A JP3033554B2 JP 3033554 B2 JP3033554 B2 JP 3033554B2 JP 10025125 A JP10025125 A JP 10025125A JP 2512598 A JP2512598 A JP 2512598A JP 3033554 B2 JP3033554 B2 JP 3033554B2
Authority
JP
Japan
Prior art keywords
value
character
distance
correction
recognition device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP10025125A
Other languages
English (en)
Other versions
JPH11213096A (ja
Inventor
永記 石寺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP10025125A priority Critical patent/JP3033554B2/ja
Publication of JPH11213096A publication Critical patent/JPH11213096A/ja
Application granted granted Critical
Publication of JP3033554B2 publication Critical patent/JP3033554B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識装置に関
し、特にある個人が記載した文字の認識結果を自動的に
修正し、高精度認識を可能とする文字認識装置に関す
る。
【0002】
【従来の技術】通常の文字認識装置は、次のような処理
を経て行なわれる。すなわち、例えば、文字情報を光学
的に読み取ったり、ペン入力装置のようなタブレットか
ら読み取って電気信号に変換して入力パターンを得た
後、得られた信号に基づいて当該文字情報の文字特徴を
抽出し、予め登録されている標準文字に対応する特徴と
の類似性を評価する尺度として両特徴間の距離を求め、
この距離が最小の標準文字を認識結果として出力する。
【0003】しかし、標準文字は多数の筆記者によって
書かれた多数の文字パターンから作成されるので、ある
特定の個人が筆記した特定の文字を頻繁に誤認識すると
いう問題もあった。例えば、ある個人の筆記した「わ」
という文字を頻繁に「ゆ」に誤認識したり、逆に他の個
人が筆記した「ゆ」と言う文字を頻繁に「わ」と誤認識
したりする問題があった。
【0004】この問題を解決するため、例えば、“蔭山
他:特開昭61−214083「パターン認識用辞書の
作成方法」”では、予め準備された標準文字特徴と追加
したい文字パターンを用いて新しい標準文字特徴を作成
する方法が提案されている。また、“秋元晴雄:特開昭
57−212586「文字認識方法」”では、ある筆記
者が筆記した同一文字の標準文字特徴からの距離を蓄積
し、一定数の蓄積データから平均変位を求め標準文字特
徴をベクトル的に修正する方法が提案されている。
【0005】しかし、これらの方法は標準文字特徴自体
を特定の個人向けに修正してしまうので、利用者が変わ
った場合には、以前の利用者向けに修正されてしまった
状態の標準文字特徴から再び修正をやり直さなければな
らないという問題を持つ。また、複数の利用者に対する
個人用標準文字特徴を作成するには極めてメンテナンス
性が悪い。
【0006】そのために、ある個人が筆記した文字のう
ち、認識結果が誤りだった文字パターンもしくはそれら
の平均的パターンを個別に個人用の標準文字特徴として
追加したり、予め準備された標準文字特徴からの修正量
だけを個人用の補正用パターンとして記憶することで複
数の利用者に対しても認識性能を向上させるという方式
が知られている。
【0007】
【発明が解決しようとする課題】しかし、この方法では
複数の利用者分だけ新しい標準文字特徴又は補正用パタ
ーンを記憶することが必要になるので大量のメモリを必
要とする欠点があった。
【0008】そこで、本発明の目的は、このような問題
点を改善し、個人筆記者に適応した認識系を構築する際
に、個人用に新しく標準文字特徴を登録することなく、
また、複数の利用者に対しても簡単に適応可能な文字認
識装置を提供することにある。
【0009】前述の課題を解決するため本発明による文
字認識装置は、文字パターンを入力して認識を行なう文
字認識装置において、二値化された文字パターンを入力
する入力部と、入力された前記文字パターンから文字特
徴を抽出する特徴抽出部と、標準文字の特徴を記憶する
文字認識辞書記憶部と、前記標準文字特徴と前記文字特
徴を照合し、前記文字パターンのそれぞれを特定する文
字コードと、前記文字特徴と前記標準文字特徴の間の距
離値を得て距離値の小さい順に初期認識結果として出力
する距離値計算部と、前記初期認識結果に基づいて、前
記初期認識結果を自動修正するかどうかを決定する認識
制御部と、各文字種について複数の前記標準文字特徴か
らの距離値の範囲を修正距離範囲テーブルとして記憶す
る個人用修正テーブル記憶部と、前記認識制御部で前記
初期認識結果を自動修正するべきと判定されたときに前
記距離値計算部で得られた前記標準文字特徴との間の前
記距離値と前記修正距離範囲テーブルを照合し、前記初
期認識結果を修正して最終認識結果を算出し前記認識制
御部で前記初期認識結果を自動修正するべきでないと判
定されたときに前記初期認識結果を最終認識結果に置き
換える認識結果修正部と、前記最終認識結果を出力する
出力部と、を備えて構成される。
【0010】
【0011】
【発明の実施の形態】以下、本発明の実施の形態につい
て添付図面を参照しながら説明する。図1は、本発明に
よる文字認識装置の一実施形態の基本構成ブロック図で
ある。入力文字パターンの特徴空間上における位置は、
予め定められた標準文字特徴との距離値から推定するこ
とが可能である。簡単のために特徴空間が図2に示すの
ような2次元であったとすると、次元数+1、つまり、
図2の例では3つの標準文字特徴からの距離が求まれ
ば、入力文字パターンの特徴空間上における位置は、複
数の標準文字特徴からの距離を用いて重み付きベクトル
和を求めることで特定することが可能である。
【0012】すると、個人用に適応した認識系を構成す
る際に、新しい個人用標準文字特徴パターン自体を記憶
する代わりに複数の標準文字特徴からの距離値の範囲を
記憶しておくことで個人の筆記する文字に適応した新し
い認識系を構成することが可能である。
【0013】図2の例では、標準文字特徴1(わ)と標
準文字特徴2(巾)と標準文字特徴3(ゆ)からの距離
がわかれば、入力パターン(個人の書いた「ゆ」)のベ
クトルデータを用いなくても特徴空間上での新しい位置
を記憶することが可能になる。
【0014】図3の例では、複数の標準文字特徴からの
距離範囲を記憶して、特徴空間上での新しい領域を記憶
することが可能になり、標準文字特徴からの距離がその
領域に入るかどうかで認識結果の修正を行うことができ
る様子を示している。
【0015】次元数が例えば64次元だった場合には6
5個の標準文字からの距離を利用すれば完全に入力パタ
ーンを再現できるが、例えば距離の近い順に5個程度の
標準文字からの距離値の範囲を記憶しておくことで入力
パターンを近似することも可能である。
【0016】本発明では、入力パターンと複数の上位認
識候補との距離を参照するだけで、新しいベクトルデー
タを標準文字特徴として追加して記憶することなく、認
識結果を個人に適応して自動的に修正することを可能と
せしめる。
【0017】図1に示す実施の形態による文字認識装置
は、二値化された文字パターンを入力する入力部11
と、入力された文字パターンから文字特徴を抽出する特
徴抽出部12と、標準文字の特徴を記憶する文字認識辞
書記憶部13と、標準文字特徴と文字特徴を照合し、文
字パターンのそれぞれを特定する文字コードと、文字特
徴と標準文字特徴の間の距離値を得て距離値の小さい順
に初期認識候補として出力する距離値計算部14と、初
期文字認識結果に基づいて、初期認識結果を自動修正す
るかどうかを決定する認識制御部15と、各文字種につ
いて複数の標準文字特徴からの距離値の範囲を修正距離
範囲テーブルとして記憶する個人用修正テーブル記憶部
16と、認識制御部で初期認識結果を自動修正するべき
と判定されたときに距離値計算部で得られた標準文字特
徴との間の距離値と修正距離範囲テーブルを照合し初期
認識結果を修正して最終認識結果を算出し、認識制御部
で初期認識結果を自動修正するべきでないと判定された
ときに初期認識結果を最終認識結果に置き換える認識結
果修正部17と、認識結果を出力する出力部18とを備
えて構成される。
【0018】次に、本実施形態の各部の動作について説
明する。入力部11は、二値化された文字パターンを入
力する。特徴抽出部12は、入力部11で入力された文
字パターンから特徴を抽出する。ここで、特徴の抽出
は、例えば“津雲:「方向パタンマッチング法の改良と
手書き漢字認識への応用」信学技報、PRU90−20
(1990)”に記載されている方法を用いることによ
り実現できる。他にも、“濱中他:「手書き漢字認識に
おける非線形正規化と特徴抽出の整合性」信学技報、P
RU91−85(1991)”や、“坂野他:「拡張外
郭方向寄与度法による手書き文字認識」信学総大、D−
556(1995)”、さらに“栗田他:「加重方向指
数ヒストグラムと疑似マハラノビス距離を用いた手書き
漢字・ひらがな認識」信学技報、PRL82−79(1
982)”に記載されている方法を用いることもでき
る。
【0019】文字認識辞書記憶部13は、標準パターン
として標準文字の特徴を記憶している。標準パターンに
は、いくつかのものを用いることができる。例えば、多
数の文字サンプルから抽出された特徴ベクルトの平均ベ
クトルを用いることができる。他にも、“佐藤他:「一
般学習ベクトル量子化による文字認識」信学技報、PR
U95−219(1995)”に記載されている方法を
用いて標準パターンを作成することも可能である。ま
た、標準パターンとして、文字特徴の平均ベクトルと共
分散行列を記憶することも可能である。さらに、部分空
間法として知られている方法を用い、文字特徴の部分空
間を記憶することも可能である。
【0020】距離値計算部14は、特徴抽出部12から
得られた特徴と、文字認識辞書記憶部13から標準パタ
ーンとして記憶された標準文字の特徴を読み込んで入力
文字の特徴との距離計算を行い、距離値の小さい順に、
入力パターンの文字コードと距離値を求める。
【0021】距離値を求めるには、いくつかの方法が考
えられる。例えば、入力文字の特徴ベクトルと標準ベク
トルとの間のユークリッド距離やシティーブロック距離
を用いて算出することができる。また、標準パターンと
して平均ベクトルと共分散行列を用いる場合には、マハ
ラノビス距離や“栗田他:「加重方向指数ヒストグラム
と疑似マハラノビス距離を用いた手書き漢字・ひらがな
認識」信学技報、PRL82−79(1982)”に記
載されている方法等を用いることも可能である。さら
に、標準パターンとして文字特徴の部分空間を用いる場
合には投影距離を用いることも可能である。
【0022】認識制御部15では初期文字認識結果に基
づいて、初期認識結果を自動修正するかどうかを決定す
る処理を行う。初期認識結果を自動修正するべきかどう
かの判定には、いくつかの方法が考えられる。一例を挙
げるならば、「特願平7−161433」に記載されて
いる方式で、初期認識結果の信頼度を算出し、信頼度が
予め決められた値P1よりも小さかった場合に自動修正
処理を行うべきと判断する方法を用いることが可能であ
る。また、他にも“中山他:「文字認識結果の確信度に
関する一検討」信学総大、D−541(1995)”に
記載されている方法を用いて、初期認識結果の確信度を
信頼度として用いることも可能である。
【0023】また、他の例を挙げるなら、受動的に修正
が行われたときの信頼度を修正可否評価テーブルとして
記憶しておき、入力パターンの信頼度と修正可否評価テ
ーブルとを照合して自動修正するべきかどうかを決定す
ることもできる。
【0024】ここで、受動的に修正の行われた場合と
は、例えば、ペン入力のように筆記者が認識結果を修正
した場合や、住所読み取りのように知識処理で修正がか
かった場合を言う。本発明における文字認識装置は、自
動的に文字認識結果を修正することが可能なので、本発
明の文字認識装置単独で自動的に修正が行われた場合を
自動修正、受動的に修正が行われた場合を受動修正と呼
び区別する。
【0025】修正可否評価テーブルに記憶される内容と
しては、例えば受動修正が行われたときの信頼度の最小
値と最大値と平均値と修正回数である。この修正可否評
価テーブルは、一回受動修正がおこなわれるたびに、信
頼度の最大値と最小値と平均値と修正回数が更新され
る。
【0026】また、自動修正の結果が誤りであり、自動
修正の後に受動修正が行われた場合は修正可否評価テー
ブルの信頼度の最大値と最小値を更新することも可能で
ある。一例を挙げるならば、入力パターンの信頼度が修
正可否評価テーブルの平均値より大きな値であった場
合、最大値の値を現在の信頼度に置き換え、入力パター
ンの信頼度や確信度が修正可否評価テーブルの平均値よ
り小さな値であった場合、最小値の値を現在の信頼度に
置き換えることで更新される。他の一例を挙げるなら
ば、入力パターンの信頼度が修正可否評価テーブルの平
均値より大きな値であり、かつ最大値以下であった場
合、最大値の値をPmaxとし、現在の距離値をPcu
rとすると、Pcur+(Pmax−Pcur)×γに
よって新しい最大値を求めることができる。このときγ
は予め与えられた定数であり、1.0以下の値ならばど
のように設定しても良いが0.5から0.9の範囲に設
定することが望ましい。
【0027】また、入力パターンの信頼度が修正可否評
価テーブルの平均値より小さな値であり、かつ最小値以
下であった場合、最小値の値をPminとし、現在の距
離値をPcurするとPcur+(Pmin−Pcu
r)×δによって新しい最小値を求めることができる。
このときδは予め与えられた定数であり、1.0以下の
値ならばどのように設定しても良いが0.5から0.9
の範囲に設定することが望ましい。
【0028】入力パターンの信頼度と修正可否評価テー
ブルとの照合は、入力パターンの信頼度が、修正可否評
価テーブルの最大値と最小値の範囲内に入っている場合
に自動修正処理を行うべきと判断することも可能であ
る。
【0029】また、自動修正処理を行うべきかどうかの
判定を一切行わずに、常に自動修正を行うように設定す
ることも可能である。
【0030】個人用修正テーブル記憶部16では、ある
認識結果に受動的に修正が行われた場合、複数の標準文
字特徴からの距離値の範囲を修正距離範囲テーブルとし
て記憶しておく。修正距離範囲テーブルは、受動的に修
正が行われる毎に更新されることも可能である。
【0031】修正距離範囲テーブルの構成は、複数の標
準文字特徴の持つそれぞれの文字種とそれぞれの距離値
の範囲から成る。
【0032】距離値の範囲とは、例えば、距離の最小値
と最大値と平均値と修正回数である。修正回数は、ある
標準文字特徴からの距離値の平均値を算出する際に用い
ることができる。例えば、「わ」という文字に対する修
正距離範囲テーブルについて、「ゆ」という標準文字特
徴からの距離の最大値が600で、最小値が300、平
均値が540であり、修正回数が10回だったとする。
今、入力パターンの認識結果が「わ」に受動修正され、
そのときの「ゆ」からの距離値が280だったとする
と、最小値は280に更新され、平均値は(平均値×修
正回数+現在の距離値)/(修正回数+1)によって正
しく求めることができる。この例の場合、(540×1
0+280)/(10+1)=516となり、平均値は
516に更新される。そして、修正回数が11に更新さ
れる。
【0033】また、ある文字種の修正テーブルについ
て、他のどの文字種の標準文字特徴からの距離を修正距
離範囲テーブルに登録するのか決定のしかたにもいくつ
かの方法が考えられる。
【0034】一つの例は、受動修正が行われるときに、
例えば距離が近い順に5個までの文字種を考え、そのな
かに含まれる頻度の高い文字種との距離値の範囲を記憶
することである。この例の場合、距離が近い順に5個ま
での文字種を規定順位内文字種とよび、規定順位は5位
となる。また、ここでは規定順位は5位までとしたが何
位までを規定順位とするかは任意に設定することが可能
である。
【0035】もう一つの例は、ある文字種の修正距離範
囲テーブルについて、予めどの文字種の標準文字特徴か
らの距離をテーブルに登録するかを決めておく方法が考
えられる。この場合、テーブルへの文字種の追加や削除
は人間が介して行われる。
【0036】また、規定順位内文字種のいくつの文字種
を登録するかもいくつか方法が考えられるが、規定順位
以下の数であれば任意の数までを登録可能である。規定
順位内文字種のなかから登録される文字種の数を登録数
とよぶ。
【0037】頻度は、修正回数を参照して求めることが
可能で、一回受動修正が行われたときに、予め登録され
ている文字種が規定順位内文字種に含まれていた場合、
その文字種の修正回数を1増やし、含まれていなかった
場合に修正回数を1減ずることで頻度を求めることが可
能である。
【0038】また、頻度が低いと判断された文字種は修
正距離範囲テーブルから削除することが可能であり、修
正回数が0になった時点で削除することも可能である。
【0039】例えば、標準文字特徴との距離値が図4の
ように得られ、このとき全ての例で認識結果が「わ」に
修正された場合、修正距離範囲テーブルが更新されてい
く様子を説明する。
【0040】修正距離範囲テーブルへの登録数は4文字
種であり、規定順位を5位までとした場合、テーブルの
内容は図5のように更新される。
【0041】また、自動修正の結果が誤りであり、自動
修正の後に受動修正が行われた場合は修正距離範囲テー
ブルの距離値の最大値と最小値を更新することも可能で
ある。一例を挙げるならば、入力パターンの距離値が修
正距離範囲テーブルの平均値より大きな値であった場
合、最大値の値を現在の距離値に置き換え、入力パター
ンの距離値が修正距離範囲テーブルの平均値より小さな
値であった場合、最小値の値を現在の距離値に置き換え
ることで更新される。
【0042】他の一例を挙げるならば、入力パターンの
距離値が修正距離範囲テーブルの平均値より大きな値で
あり、かつ最大値以下であった場合、最大値の値をDm
axとし、現在の距離値をDcurするとDcur+
(Dmax−Dcur)×αによって新しい最大値を求
めることができる。このときαは予め与えられた定数で
あり、1.0以下の値ならばどのように設定しても良い
が0.5から0.9の範囲に設定することが望ましい。
【0043】また、入力パターンの距離値が修正距離範
囲テーブルの平均値より小さな値であり、かつ最小値以
下であった場合、最小値の値をDminとし、現在の距
離値をDcurするとDcur+(Dmin−Dcu
r)×βによって新しい最小値を求めることができる。
このときβは予め与えられた定数であり、1.0以下の
値ならばどのように設定しても良いが0.5から0.9
の範囲に設定することが望ましい。
【0044】認識結果修正部17では、認識制御部15
において初期認識結果を修正するべきと判定された場合
に距離値計算部で得られた標準文字特徴との間の距離値
と、個人用修正テーブル記憶部16に記憶してある修正
距離範囲テーブルを照合して認識結果を修正し、修正さ
れた認識結果を最終的な認識結果として出力部に出力す
る。また、認識制御部15において初期認識結果を修正
するべきでないと判定された場合は、そのまま初期認識
結果を最終的な認識結果として出力部に出力する。
【0045】初期認識結果の修正にはいくつかの方法が
考えられる。一例を挙げるならば、例えば、修正テーブ
ルの頻度が2以上のすべての文字種との距離範囲を参照
して、認識結果の距離値と照合する方法がある。
【0046】例えば、図6のような修正テーブルがあ
り、図7のような認識結果が得られたとする。認識結果
上位5位以内に入っている文字種のなかで、修正テーブ
ルに登録されている文字種は、「れ」と「ゆ」と「巾」
であり、これらすべては修正テーブルの頻度が2以上で
ある。そこで、各カテゴリーの距離値が修正テーブルの
距離範囲に入っているかどうかを照合し修正する。ここ
で、照合と修正にはいくつかの方法が考えられる。一例
を挙げるならば、「れ」の距離値範囲は491から61
8であり、現在の「れ」からの距離値は532なので値
範囲内である。「巾」の距離値範囲は507から557
であり、現在の「巾」からの距離値は551なので値範
囲内である。「ゆ」の距離値範囲は488から627で
あり、現在の「ゆ」からの距離値は570なので値範囲
内である。いずれも値範囲内なので、例えば「わ」の距
離値をεだけマイナスして、「わ」の距離値を(541
−ε)に修正することができる。ここで、例えば、εを
15と設定した場合「わ」の距離値は541から526
に修正される。この例では距離値をεを15に設定して
説明したが、εの値は任意の正の値に設定しても構わな
い。また、「わ」の距離値からεをマイナスすることで
初期認識結果の修正を行ったが、「わ」の修正された距
離値を、初期認識結果の距離値×ζによって算出するこ
とも可能である。このときζは1.0以下の値であれば
任意で構わないが、値の範囲としては0.8から0.9
5の間が望ましい。
【0047】他にも一例を挙げるならば、頻度順位がn
位の値範囲だった場合にηnだけ距離値をマイナスする
かもしくは距離値×θnによって修正することも可能で
ある。図6と図7の例では、「ゆ」の値範囲内だった場
合には「わ」の距離値をη1マイナスし、「れ」の値範
囲内だった場合には「わ」の距離値をさらにη2マイナ
スし、「巾」の値範囲内だった場合には「わ」の距離値
を再びη3マイナスして、「わ」の距離値を(541−
η1−η2−η3)に修正することができる。ここで、
例えば、η1とη2とη3をいずれも5と設定した場
合、「わ」の距離値は541から526に修正される。
この例では、距離値をη1とη2とη3を5に設定して
説明したが、これらの値は任意の正の値に設定しても構
わない。
【0048】例えば、修正距離範囲テーブルの頻度順位
が高い文字種について値範囲内だった場合に修正量を大
きめに設定し、頻度順位が低かった文字種について値範
囲内だった場合に修正量を小さめに設定することも可能
である。図6の例では、例えば、η1を10、η2を
3、η3を2と設定することができる。
【0049】また、修正された距離値を、初期認識結果
の距離値×θ1×θ2×θ3によって算出することも可
能である。このときθ1とθ2とθ3は1.0以下の値
であれば任意で構わないが、値の範囲としては0.8か
ら0.95の間が望ましい。例えば、θ1を0.8、θ
2を0.9、θ3を0.95と設定することも可能であ
る。
【0050】さらに一つの例を挙げるならば、頻度情報
は用いずに、平均値のι倍以上κ倍以下の範囲に距離値
があれば値範囲内とすることも可能である。このときι
は1.0より小さい値でありκは1.0より以上の値の
正の値であれば任意でかまわないが、ιは0.5から
0.9に設定するのが望ましく、κは1.2から2.0
までに設定することが望ましい。
【0051】出力部18は、修正された認識結果を距離
値の小さい順に並べ直して出力する。
【0052】
【発明の効果】以上説明したように、本発明の文字認識
装置によれば、認識結果が誤りだった文字パターン自体
を記憶して新しい個人用標準文字特徴とするかわりに、
予め定められた標準文字特徴からの距離値の範囲を用い
ることで、仮想的に新しい個人用標準文字特徴を作るこ
とと等価なことが実現できるので、個人用標準文字特徴
を追加するために必要な多大なメモリーを削減可能であ
る。また、予め定められた標準文字特徴に対する修正を
行わないので、複数の筆記者に適応した個人用の認識系
を準備することも容易に行える。
【図面の簡単な説明】
【図1】本発明の一実施例による文字認識装置のブロッ
ク図である。
【図2】特徴空間上の点が、次元数+1の標準文字特徴
からの距離で特定できることを説明する図である。
【図3】特徴空間上の領域が、複数の標準文字特徴から
の距離の範囲で指定できることを説明する図である。
【図4】修正が行われたときの認識結果の様子である。
【図5】修正距離範囲テーブルが更新されていく様子で
ある。
【図6】修正距離範囲テーブルの例である。
【図7】認識結果の例である。
【符号の説明】
11 入力部 12 特徴抽出部 13 文字認識辞書記憶部 14 距離値計算部 15 認識制御部 16 個人用修正テーブル記憶部 17 認識結果修正部 18 出力部

Claims (19)

    (57)【特許請求の範囲】
  1. 【請求項1】文字パターンを入力して認識を行なう文字
    認識装置において、 二値化された文字パターンを入力する入力部と、 入力された前記文字パターンから文字特徴を抽出する特
    徴抽出部と、 標準文字の特徴を記憶する文字認識辞書記憶部と、 前記標準文字特徴と前記文字特徴を照合し、前記文字パ
    ターンのそれぞれを特定する文字コードと前記文字特
    徴と前記標準文字特徴の間の距離値を得て距離値の小さ
    い順に初期認識結果として出力する距離値計算部と、 前記初期認識結果に基づいて、前記初期認識結果を自動
    修正するかどうかを決定する認識制御部と、 各文字種について複数の前記標準文字特徴からの距離値
    の範囲を修正距離範囲テーブルとして記憶する個人用修
    正テーブル記憶部と、 前記認識制御部で前記初期認識結果を自動修正するべき
    と判定されたときに前記距離値計算部で得られた前記標
    準文字特徴との間の前記距離値と前記修正距離範囲テー
    ブルを照合し、前記初期認識結果を修正して最終認識結
    果を算出し前記認識制御部で前記初期認識結果を自動修
    正するべきでないと判定されたときに前記初期認識結果
    を最終認識結果に置き換える認識結果修正部と、 前記最終認識結果を出力する出力部と、 を備えて成ることを特徴とする文字認識装置。
  2. 【請求項2】前記初期認識結果の自動修正は、初期認識
    結果の信頼度を算出し、信頼度が予め決められた値より
    も小さかった場合に行なう請求項1に記載の文字認識装
  3. 【請求項3】前記初期認識結果の自動修正は、受動的に
    修正が行われたときの信頼度を修正可否評価テーブルと
    して記憶しておき、入力パターンの信頼度と修正可否評
    価テーブルとを照合した結果に基づいて行なう請求項1
    に記載の文字認識装置
  4. 【請求項4】前記修正可否評価テーブルには、受動修正
    が行われたときの信頼度の最小値と 最大値と平均値と修
    正回数が記憶され、受動修正がおこなわれるたびに更新
    される請求項3に記載の文字認識装置
  5. 【請求項5】前記入力パターンの信頼度が前記修正可否
    評価テーブルの平均値より大きな値であった場合、最大
    値の値を現在の信頼度に置き換え、前記入力パターンの
    信頼度が前記平均値より小さな値であった場合、最小値
    の値を現在の信頼度に置き換えて更新する請求項3に記
    載の文字認識装置
  6. 【請求項6】前記入力パターンの信頼度が前記修正可否
    評価テーブルの平均値より大きな値であり、かつ最大値
    以下であった場合、最大値と現在の距離値に基づいて新
    しい最大値を求める請求項3に記載の文字認識装置
  7. 【請求項7】前記入力パターンの信頼度が前記修正可否
    評価テーブルの平均値より小さな値であり、かつ最小値
    以下であった場合、最小値と現在の距離値に基づいて新
    しい最小値を求める請求項3に記載の文字認識装置
  8. 【請求項8】前記入力パターンの信頼度と修正可否評価
    テーブルとの照合時、前記入力パターンの信頼度が前記
    修正可否評価テーブルの最大値と最小値の範囲内に入っ
    ている場合に自動修正処理を行うべきと判断する請求項
    1に記載の文字認識装置
  9. 【請求項9】前記自動修正処理を行うべきかどうかの判
    定を行わずに、常に自動修正を行う請求項1に記載の文
    字認識装置
  10. 【請求項10】前記個人用修正テーブル記憶部に記憶さ
    れている修正距離範囲テーブルは、受動的に修正が行わ
    れる毎に更新される請求項1に記載の文字認識装置
  11. 【請求項11】前記修正距離範囲テーブルは、複数の標
    準文字特徴の持つそれぞれの文字種とそれぞれの距離値
    の範囲を含む請求項10に記載の文字認識装置
  12. 【請求項12】前記距離値の範囲は、距離の最小値と最
    大値と平均値と修正回数である請求項11に記載の文字
    認識装置
  13. 【請求項13】前記修正距離範囲テーブルには、受動修
    正が行われるときに、距離が近い順に予め定めた数の文
    字種に含まれる頻度の高い文字種との距離値の範囲が記
    憶される請求項1に記載の文字認識装置
  14. 【請求項14】ある文字種の修正距離範囲テーブルにつ
    いて、予めどの文字種の標準文字特徴からの距離をテー
    ブルに登録するかを決めておく請求項1に記載の文字認
    識装置
  15. 【請求項15】前記自動修正の結果が誤りであり、自動
    修正の後に受動修正が行われた場合は修正距離範囲テー
    ブルを更新する請求項1に記載の文字認識装置
  16. 【請求項16】前記入力パターンの距離値が前記修正距
    離範囲テーブルの平均値より大きな値であった場合、最
    大値の値を現在の距離値に置き換え、前記入力パターン
    の距離値が前記修正距離範囲テーブルの平均値より小さ
    な値であった場合、最小値の値を現在の距離値に置き換
    えて更新する請求項1に記載の文字認識装置
  17. 【請求項17】前記入力パターンの距離値が前記修正距
    離範囲テーブルの平均値より大きな値であり、かつ最大
    値以下であった場合、最大値と現在の距離値に基づいて
    新しい最大値を求める請求項1に記載の文字認識装置
  18. 【請求項18】前記入力パターンの距離値が修正距離範
    囲テーブルの平均値より小さな値であり、かつ最小値以
    下であった場合、最小値と現在の距離値に基づいて新し
    い最小値を求める請求項1に記載の文字認識装置
  19. 【請求項19】前記初期認識結果の修正は、修正テーブ
    ルの頻度が2以上のすべての文字種との距離範囲を参照
    して、認識結果の距離値と照合して行なわれる請求項1
    に記載 の文字認識装置
JP10025125A 1998-01-22 1998-01-22 文字認識装置 Expired - Fee Related JP3033554B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10025125A JP3033554B2 (ja) 1998-01-22 1998-01-22 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10025125A JP3033554B2 (ja) 1998-01-22 1998-01-22 文字認識装置

Publications (2)

Publication Number Publication Date
JPH11213096A JPH11213096A (ja) 1999-08-06
JP3033554B2 true JP3033554B2 (ja) 2000-04-17

Family

ID=12157235

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10025125A Expired - Fee Related JP3033554B2 (ja) 1998-01-22 1998-01-22 文字認識装置

Country Status (1)

Country Link
JP (1) JP3033554B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4633271B2 (ja) * 2001-01-17 2011-02-16 株式会社日本デジタル研究所 辞書学習方法及び辞書学習プログラム

Also Published As

Publication number Publication date
JPH11213096A (ja) 1999-08-06

Similar Documents

Publication Publication Date Title
US5787197A (en) Post-processing error correction scheme using a dictionary for on-line handwriting recognition
KR100412317B1 (ko) 문자인식/수정방법및장치
JP2000353215A (ja) 文字認識装置および文字認識プログラムを記録した記録媒体
CN111651978A (zh) 基于实体的词法检查方法与装置和计算机设备及存储介质
EP2138959A1 (en) Word recognizing method and word recognizing program
JP2022095391A (ja) 情報処理装置、及び情報処理プログラム
JP3033554B2 (ja) 文字認識装置
JPH06215184A (ja) 抽出領域のラベリング装置
US6636636B1 (en) Character recognizing apparatus, method, and storage medium
JP3274014B2 (ja) 文字認識装置および文字認識方法
JP7404625B2 (ja) 情報処理装置、及びプログラム
JPH09274645A (ja) 文字認識方法および装置
WO2024084539A1 (ja) 表認識装置及び方法
JP3157557B2 (ja) 文字認識装置
JP3138665B2 (ja) 手書き文字認識方式および記録媒体
JPS6142083A (ja) 文字認識装置
JP2894305B2 (ja) 認識装置の候補修正方式
JP4633271B2 (ja) 辞書学習方法及び辞書学習プログラム
JP2925303B2 (ja) 画像処理方法及び装置
JP3481850B2 (ja) 文字認識装置
JPH07110844A (ja) 日本語文書処理装置
JPH11120294A (ja) 文字認識装置および媒体
JPS6293776A (ja) 情報認識装置
JPS60138689A (ja) 文字認識方法
JPH08202830A (ja) 文字認識システム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080218

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090218

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100218

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100218

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110218

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110218

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120218

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120218

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130218

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130218

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140218

Year of fee payment: 14

LAPS Cancellation because of no payment of annual fees