JP3164962B2 - 文字認識辞書作成方法および装置 - Google Patents

文字認識辞書作成方法および装置

Info

Publication number
JP3164962B2
JP3164962B2 JP06478694A JP6478694A JP3164962B2 JP 3164962 B2 JP3164962 B2 JP 3164962B2 JP 06478694 A JP06478694 A JP 06478694A JP 6478694 A JP6478694 A JP 6478694A JP 3164962 B2 JP3164962 B2 JP 3164962B2
Authority
JP
Japan
Prior art keywords
character
feature vector
dictionary
representative point
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06478694A
Other languages
English (en)
Other versions
JPH07271917A (ja
Inventor
良文 坂井
佳隆 池田
徹 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Steel Corp
Original Assignee
Nippon Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Steel Corp filed Critical Nippon Steel Corp
Priority to JP06478694A priority Critical patent/JP3164962B2/ja
Publication of JPH07271917A publication Critical patent/JPH07271917A/ja
Application granted granted Critical
Publication of JP3164962B2 publication Critical patent/JP3164962B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、手書き文字認識を行な
う際に使用される辞書を作成する方法および装置に関す
る。
【0002】
【従来の技術】手書き文字認識を行なう方法の一つとし
て、入力された手書き文字に対する特徴量を算出し、算
出された特徴量に応じて入力された手書き文字がどの文
字であるかを判断する方法がある。この方法は、各文字
ごとに、予めその文字についての代表となるべき特徴量
を求めて辞書に格納しておき、手書き文字認識を行なう
際に、入力された文字の特徴量に最も近いものを辞書に
格納された特徴量の中から検索し、検索された特徴量に
対応する文字をもって認識結果とするものである。特徴
量による方法は、筆順や画数を参照しないでも文字認識
を行なえるため、オンラインおよびオフラインのいずれ
の手書き文字入力装置にも適用でき、さらに、印刷文字
などの読み取りにも適用することができる。なお、特徴
量による方法では、オンライン手書き文字認識による場
合には、画数に関する情報を入手することが可能になる
ので、画数ごとに辞書を編成しておき、入力文字パター
ンの画数に応じて該当する画数の辞書のみを検索するよ
うにすることによって、認識時間の短縮とさらなる認識
率の向上を図ることができる。
【0003】本明細書において、手書き文字や印刷文字
などの文字認識の対象となるパターンないし図形のこと
を入力文字パターンという。典型的には、入力文字パタ
ーンは、書き手が手書き文字としてタブレットなどを用
いて入力した線の集合として表わされる。また、文字と
は、文字コードと1対1で対応するものである。入力文
字パターンに対して文字認識を行なった結果、その入力
文字パターンが特定の文字に同定されることになる。
【0004】特徴量を用いて手書き文字認識を行なう場
合、特徴量として、スカラー量を使用するのではなく、
ベクトル量を使用するのが一般的である。ここではベク
トル量で表わされた特徴量を特徴ベクトルと呼ぶことに
する。
【0005】特徴ベクトルによる方法では、入力された
入力文字パターンに対し前処理を施した後、例えば、離
散フーリエ変換や離散コサイン変換などの直交関数展開
を施して各次の係数を求め、算出された各係数を順に配
置することにより、特徴ベクトルが求められる。この特
徴ベクトルはn次元空間(この空間を特徴空間という)
内の点を表わすことになる。nは1以上の整数である。
一方、辞書には、文字ごとにその文字を代表する特徴ベ
クトルが代表点として登録されている。したがって代表
点も特徴空間内の点である。そして、手書き文字認識を
行なう場合には、入力された入力文字パターンに対する
特徴ベクトルからの距離が最も小さい代表点を辞書から
探し出し、探し出された代表点に対応する文字が、認識
結果として出力される。したがって、例えば「甲」とい
う文字が認識されるためには、予め、辞書内に「甲」と
いう文字に対する代表点が登録されていなければならな
い。
【0006】ところで、手書き文字認識を行なう場合、
筆者ごとに書き癖がかなり異なるので、書き手によるば
らつきによらずに認識率が高く維持されるような辞書を
作成することが重要である。このため、同一文字につい
て、多くの書き手によって書かれた多数の入力文字パタ
ーンのサンプルを収集し、これに基づいて辞書を作成す
るのが一般的である。この場合、具体的な辞書の作成方
法としては、(1)採取した入力文字パターンについての
特徴ベクトルを各文字ごとに平均し、平均された特徴ベ
クトルを代表点とする、すなわち、各文字ごとに1つの
代表点を設定する方法、(2)採取した各入力文字パター
ンの特徴ベクトルを算出し、算出した特徴ベクトルの全
部を代表点として登録する、すなわち各文字ごとに多数
の代表点を設定する方法、(3)採取した各入力文字パタ
ーンについて特徴ベクトルを計算し、各文字ごとに平均
を求めるとともにばらつきや特徴量(特徴ベクトルの成
分の値)間の相関を表わす統計量を求め、平均を代表点
として登録するとともに統計量も登録する、すなわち各
文字ごとに1つの代表点と統計パラメータとを設定する
方法がある。
【0007】また、特定のユーザが連続して手書き文字
入力を行なうような場合には、辞書の学習を行なえるよ
うにすることが望ましい。ここで学習とは、その特定の
ユーザの手書き文字に基づく特徴ベクトルを代表点とし
て辞書に登録することである。この学習を行なうことに
より、その特定のユーザの書き癖が辞書に反映されるこ
ととなって、その特定のユーザに対する手書き文字認識
の認識率のさらなる向上を図ることができる。
【0008】
【発明が解決しようとする課題】手書き文字認識におけ
る上述した従来の辞書作成方法には、以下に述べるよう
な問題点がある。上記(1)に示す各文字ごとに1つの代
表点を設定する方法では、書き手や書き方によるばらつ
きが代表点に反映されにくいので、誤認識が多くなりが
ちである。上記(2)に示す入力文字パターンごとに代表
点を設定する方法では、1つの文字を表現するために必
要な情報量が多いので、辞書のサイズが極めて大きくな
り、また、手書き文字認識時の検索に要する時間が長く
なる。上記(3)に示す統計パラメータを付随させる方法
では、この統計パラメータを修正するためには、修正前
の統計パラメータの計算に使用した全ての特徴ベクトル
を必要とするため、事実上、事後的に特定のユーザのた
めの辞書の学習を行なうことができない。
【0009】本発明の目的は、辞書サイズを大きくする
ことなく、書き手や書き方によるばらつきを十分に表現
できかつユーザが自分の手書き文字を登録することので
きる辞書の作成方法および装置を提供することにある。
【0010】
【課題を解決するための手段】本発明の文字認識辞書作
成方法は、入力された入力文字パターンに対して特徴ベ
クトルを算出し前記特徴ベクトルに応じて前記入力文字
パターンに対応する文字を識別して前記入力文字パター
ンの認識を行なう文字認識において使用され、各文字ご
とに当該文字に対応する代表的な特徴ベクトルを代表点
として保持する辞書の作成方法であって、前記辞書に新
たな入力文字パターンを登録することが要求された場合
に、前記新たな入力文字パターンを入力して前記新たな
入力文字パターンに対する特徴ベクトルを算出する第1
の工程と、前記辞書を検索して前記特徴ベクトルが前記
特徴ベクトルに対応する文字の前記代表点に近いかどう
かを判定し、近い場合には前記特徴ベクトルに近付くよ
うに前記対応する文字の代表点を修正し、それ以外の場
合には前記特徴ベクトルを前記対応する文字の代表点と
して前記辞書に追加する第2の工程と、前記第1の工程
及び前記第2の工程で作成された前記辞書の作成に使用
された入力文字パターンに対して前記作成された辞書を
用いて文字認識を行なう第3の工程と、前記第3の工程
で文字認識した結果、本来表そうとした文字とは異なる
文字として誤認識する特徴ベクトルがあれば、当該特徴
ベクトルを本来表そうとした文字の代表点として前記辞
書に登録する第4の工程とを有する。
【0011】本発明の文字認識辞書作成装置は、入力さ
れた入力文字パターンに対して特徴ベクトルを算出し前
記特徴ベクトルに応じて前記入力文字パターンに対応す
る文字を識別して前記入力文字パターンの認識を行なう
文字認識において使用され、各文字ごとに当該文字に対
応する代表的な特徴ベクトルを代表点として保持する辞
書の作成装置であって、新たな入力文字パターンを入力
して前記新たな入力文字パターンに対する特徴ベクトル
算出する特徴ベクトル算出手段と、前記辞書を検索し
て前記特徴ベクトルが前記特徴ベクトルに対応する文字
の前記代表点に近いかどうかを判定する判定手段と、前
記判定手段での判定の結果近い場合には前記特徴ベクト
ルに近付くように前記対応する文字の代表点を修正し、
それ以外の場合には前記特徴ベクトルを前記対応する文
字の代表点として前記辞書に追加する更新手段とを有
し、前記判定手段及び前記更新手段により作成された前
記辞書の作成に使用された入力文字パターンに対して前
記作成された辞書を用いて文字認識を行い、文字認識し
た結果、本来表そうとした文字とは異なる文字として誤
認識する特徴ベクトルがあれば、当該特徴ベクトルを本
来表そうとした文字の代表点として登録する
【0012】
【作用】辞書に既に登録されている代表点と新たな入力
文字パターンの特徴ベクトルとを比較し、特徴空間にお
いて両者が「近い」場合には、新たな入力文字パターン
の特徴ベクトルに近付くように既に登録されている代表
点を修正し、両者が「近くない」場合には、新たな入力
文字パターンの特徴ベクトルを新たな代表点として追加
登録するので、代表点の数を極端に増やすことなく認識
率の高い辞書を作成することが可能となる。したがっ
て、ユーザによる追加登録が可能であって、辞書サイズ
を大きくすることなく、かつ書き手や書き方によるばら
つきを十分に表現できる辞書を作成することができる。
【0013】本発明において、「近い」か「近くない」
かの判定方法としては、各種のものが考えられるが、計
算量や作成される辞書の認識率の観点から、例えば、
(1)代表点と特徴ベクトルとの差ベクトルのユークリッ
ドノルムと与えられたしきい値とを比較する、あるい
は、(2)代表点と特徴ベクトルとの差ベクトルの各次元
の成分の絶対値のうちの最大のものと与えられたしきい
値とを比較する、などの方法とすることが望ましい。ま
た、特徴ベクトルに近付くように代表点を修正する場
合、各種の方法が考えられるが、既に入力された入力文
字パターンのうち何個のものにその代表点が対応してい
るかを加味する方法を用いることが望ましい。対応する
入力文字パターンの個数を加味する方法は、例えば、そ
の個数分の重みを代表点につけた上で、代表点と特徴ベ
クトルとの平均をもって修正後の代表点とする方法があ
る。
【0014】さらに、上述のように作成された辞書を用
いた場合の認識率をさらに向上させるために、辞書の改
良を行なうことができる。辞書の改良は、例えば、辞書
の作成後、辞書の作成に使用された入力文字パターンに
対して作成された辞書を用いて文字認識を行ない、誤認
識となった場合には当該入力文字パターンに対する特徴
ベクトルを新たに代表点として作成された辞書に追加登
録することによって行なわれる。
【0015】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。図1(a)は本発明の一実施例の手書き文字
認識辞書作成装置の構成を示すブロック図である。
【0016】この手書き文字認識辞書作成装置は、各文
字ごとの代表点を格納する辞書25を作成するものであ
って、書き手の手書き文字が入力文字パターンとして入
力する手書き文字入力表示装置10と、入力した入力文
字パターンに対して前処理や直交関数展開などを施すこ
とによって特徴ベクトルを算出する特徴ベクトル算出部
12と、各入力文字パターンごとに算出された特徴ベク
トルを格納する特徴ベクトル格納部22と、算出された
特徴ベクトルと辞書25に格納されている代表点とを比
較する比較部23と、比較部23での比較結果に応じて
辞書25を更新する更新部24とを備えている。特徴ベ
クトル算出部21で算出された特徴ベクトルは、比較部
23に直接送られるとともに、同時に特徴ベクトル格納
部22にも送られるようになっており、比較部23は、
特徴ベクトル算出部21と特徴ベクトル格納部22のい
ずれからも特徴ベクトルを受け取れるように構成されて
いる。
【0017】手書き文字入力表示装置10は、例えば、
液晶表示パネルと入力用タブレットを入力エリア14と
して一体化させたものであり、ペン11を用いて文字を
書くように押圧することによって、入力文字パターン1
3の入力が行なわれ、同時にその入力文字パターン13
が入力箇所にそのまま表示されるようになっている。ま
た、入力エリア14の図示右下の隅には、学習文字13
が表示されている。ここで学習文字とは、辞書25の学
習の対象となる文字のことである。図示した例では、ひ
らがなの「あ」が学習文字であって、これに対応し、書
き手は「あ」を入力文字パターンとして入力している。
【0018】比較部23は、特徴ベクトル算出部21あ
るいは特徴ベクトル格納部23から特徴ベクトルを受け
取り、その特徴ベクトルに対応する文字について辞書2
5を検索し、辞書25内に格納されている当該文字の代
表点の中で受け取った特徴ベクトルに対して最も近い代
表点を選択し、選択された代表点と受け取った特徴ベク
トルとを比較し、両者が相互に近いかそうでないかを判
定する。代表点も特徴ベクトルもn次元空間(特徴空
間)内のベクトルとして表わされるから、判定の基準と
しては、(1)両者の差ベクトルのユークリッドノルムが
与えられたしきい値k1以下であるかどうかや、(2)差ベ
クトルのn個の成分(各次元の成分)それぞれの絶対値
を求めこの絶対値のうちの最大のものの値が与えられた
しきい値k 2以下であるかどうかを用いることができ
る。差ベクトルのユークリッドノルムがしきい値k1
いう判定基準は、n次元の特徴空間において、選択され
た代表点を中心とする半径k1の超球の表面あるいは内
部に特徴ベクトルがあるかどうかと同値である。また、
差ベクトルの成分の絶対値の最大がしきい値k2以下と
いう条件は、特徴空間において代表点を中心とし各辺が
それぞれ座標軸に平行であって1辺の長さが2・k2であ
る超立方体の表面または内部に特徴ベクトルがあるかど
うかと同値である。しきい値k1,k2は、一定の値に固
定しておいてもよいし、数字や漢字、英字などの区別に
応じて変化させるようにしてもよいし、あるいは、作成
された辞書による文字認識の認識率を評価して適応的に
定めるようにしてもよい。
【0019】このほか、(3)選択された代表点を中心と
する特徴空間内の超直方体の表面または内部に特徴ベク
トルが存在するかどうか、あるいは(4)代表点を中心と
する特徴空間内の超楕円体の表面または内部に特徴ベク
トルが存在するかどうかを判定基準とすることもでき
る。これらは、上記(1),(2)の条件において、特徴ベク
トルの各次元の成分にそれぞれ重みをつけたものに相当
する。
【0020】辞書25の構成例が図1(b)に示されてい
る。辞書25では、登録される代表点ごとに、その代表
点に対応する文字の文字コードと、代表点のベクトル値
と、その代表点が何個の特徴ベクトルに基づいて定めら
れているかを表わす回数とが、格納されている。1個の
文字に対し複数の代表点が存在し得るようになってい
る。図に示した例では、文字コードとしてJISの区点
コードが使用されており、文字「あ」(区点コード:0
402)に対して2つの代表点が登録されている。
【0021】更新部24は、比較部23での判定結果に
基づいて辞書25を更新するものであり、比較部23に
入力した特徴ベクトルが辞書25内から選択された代表
点から「近い」と判定された場合には入力した特徴ベク
トルに近付くようにその代表点の値を修正し、「近くな
い」と判定された場合には、その入力した特徴ベクトル
を対応する文字に関する代表点として辞書25に追加登
録する。「近い」と判定された場合の代表点の修正方法
としては、例えば、辞書25を検索してその代表点が何
個の特徴ベクトルに基づいて定められているかを調べ、
m個の特徴ベクトルに基づいている場合(その代表点の
「回数」欄がmとなっている場合)には、代表点とその
入力した特徴ベクトルとを1:mに内分する点にその代
表点を移動させ、移動後の値に辞書25を書き換える。
そして、その代表点の「回数」の欄の値に1を加算する
方法がある。このほか、常に一定の値だけ近付ける方法
などもある。
【0022】一方、比較部23において「近くない」と
判定された場合には、更新部24は、その入力した特徴
ベクトルを代表点として辞書25に登録するとともに、
この新規に登録した代表点の「回数」欄に1を設定す
る。なお。入力した特徴ベクトルに対応する文字の代表
点が1個も辞書25に登録されていない場合には、「回
数」を1として、その特徴ベクトルを当該文字に対する
代表点として登録する。
【0023】次に、この手書き文字認識辞書作成装置を
用いた辞書作成の手順について、図2(a)のフローチャ
ートを用いて説明する。
【0024】手書き文字入力表示装置10を介して学習
文字に対応する入力文字パターンが入力すると(ステッ
プ101)、特徴ベクトル算出部21によってその入力
文字パターンの特徴ベクトルが算出される(ステップ1
02)。算出された特徴ベクトルは、比較部23に送ら
れるとともに、特徴ベクトル格納部22にも格納され
る。入力文字パターンに対応する文字が、その登録対象
文字として最初のもの、すなわち辞書25に未だ1個も
登録されていない文字であるかどうかが判定され(ステ
ップ103)、未登録の文字の場合にはステップ107
に移行する。この判定は、比較部23が辞書25を検索
し、入力文字パターンに対応する学習文字についての代
表点の有無を調べることによって行なわれる。
【0025】ステップ103において最初のものでない
と判定された場合すなわち既に登録されている文字であ
る場合、比較部23は、算出された特徴ベクトルに対応
する文字の代表点の中でその算出された特徴ベクトルに
最も近い代表点を辞書25から探索する(ステップ10
4)。そして、その探索された代表点と算出された特徴
ベクトルとの「近さ」を求めて基準値と比較し、両者が
「近い」か「近くない」かを判定する(ステップ10
5)。この判定の基準は、上述した通りである。
【0026】「近さ」≦基準値である場合すなわち「近
い」と判定された場合には、更新部24は、算出された
特徴ベクトルに近付くように探索された代表点の値を上
述したように修正し(ステップ106)、処理を終了す
る。これに対し、「近さ」>基準値である場合すなわち
「近くない」と判定された場合や、ステップ103にお
いて未登録の文字であると判定された場合には、更新部
24は、算出された特徴ベクトルをその登録対象文字の
代表点として辞書25に新たに登録し(ステップ10
7)、処理を終了する。
【0027】手書き文字入力表示装置に順次入力する入
力文字パターンに対し、ここで述べたステップ101〜
ステップ107の処理を次々と実行することにより、辞
書25の学習が進行し、一連の入力文字パターンに基づ
く辞書が完成する。
【0028】ところで、上述の辞書作成過程において、
比較部23における「近い」、「近くない」の判定結果
は、その判定を行なうまでに修正を受けた代表点に依存
する。したがって、同一の入力文字パターンの組を使用
した場合であっても、入力順によって、作成される辞書
の内容が異なることになる。すなわち、入力文字パター
ンの組に対して最適化されていない辞書が作成されるこ
とになる。また、よく似た文字間で正しく文字認識を行
なうためには、特徴空間内でのこれら文字に対応する領
域間の境界の形状が正しく辞書に反映されていなければ
ならない。しかしながら、上述したように作成された辞
書の場合、特徴空間内での境界の形状が十分には反映さ
れていないことがある。そこで、図2(b)のフローチャ
ートに示されるように、特徴ベクトル格納部22に格納
しておいた特徴ベクトルを用いて辞書25の改良を行な
うことが望ましい。以下、辞書25の改良の手順につい
て説明する。
【0029】作成された辞書25を使用して、特徴ベク
トル格納部25に格納されている全ての特徴ベクトルす
なわち全ての入力文字パターンのそれぞれに対して、文
字認識を実行する。ある入力文字パターンについて、文
字認識の結果、その入力文字パターンが本来表わしてい
る文字以外の文字として認識し、誤認識を生じた場合に
は、その誤認識を生じた特徴ベクトルをその本来表わし
ている文字の代表点として登録する(ステップ11
1)。終了条件を満足するまでこのステップ111を繰
り返すことにより(ステップ112)、辞書25の改良
が逐次進行する。終了条件としては、ステップ111を
所定の回数実行したかどうか、あるいは誤認識の発生頻
度が所定の値を下回るようになったかどうかなどが、例
示される。
【0030】以下、具体例を図示しながら、本実施例を
さらに説明する。なお、特徴空間を図示する都合上、特
徴空間は2次元であるものとする。実際には、特徴空間
はより高次元の空間である。
【0031】図3は、比較部23における判定基準が、
代表点を中心とする半径k1の超球(図示の例では円)
の表面(円周)または内部に特徴ベクトルが存在する場
合に、「近い」とする場合を説明するものである。図3
(a)に示されるように、代表点32を中心とする半径k1
の円(図示実線の円)内に代表点32が位置する場合、
比較部23によって「近い」と判断され、その結果、図
3(c)に示されるように、特徴ベクトル33に近付くよ
うに代表点が移動し、代表点32'となる。移動前の代
表点の位置が"+"印で、移動前の円が一点鎖線で示され
ている。一方、図3(b)に示されるように、代表点32
を中心とする半径k1の円の外部に特徴ベクトル33が
存在する場合には、図3(d)に示されるように、その特
徴ベクトル33が新たな代表点34として追加される。
もとの代表点32はそのまま保存されている。
【0032】図4は、比較部23における判定基準が、
代表点を中心とする1辺が2・k2の超直方体(図示の例
では正方形)の表面(辺)または内部に特徴ベクトルが
存在する場合に、「近い」とする場合を説明するもので
ある。図4(a)に示されるように、代表点42を中心と
する上述の正方形(図示実線の正方形)内に代表点42
が位置する場合、比較部23によって「近い」と判断さ
れ、その結果、図4(c)に示されるように、特徴ベクト
ル43に近付くように代表点が移動し、代表点42'と
なる。移動前の代表点の位置が"+"印で、移動前の正方
形が一点鎖線で示されている。一方、図4(b)に示され
るように、代表点42を中心とする1辺が2・k2の正方
形の外部に特徴ベクトル43が存在する場合には、図4
(d)に示されるように、その特徴ベクトル43が新たな
代表点44として追加される。もとの代表点42はその
まま保存されている。
【0033】図5(a)〜(d)は辞書の改良過程を説明する
図である。ここでは、相互によく似た字として、数字の
「2」、漢字の「乙」、英字の「Z」を取り上げる。ま
た、特徴空間は2次元であるとして説明を行なう。
【0034】辞書25を作成したところ、特徴空間51
内において、「2」に対する代表点52と「乙」に対す
る代表点53と「Z」に対する代表点54が図5(a)に
示されるように配置されたとする。特徴ベクトルによる
文字認識では、入力文字パターンの特徴ベクトルに最も
近い代表点に応じて文字認識が行なわれるから、特徴空
間51内において各代表点間の垂直2等分線が、各文字
に対応する領域の境界となる。図5(a)においては、Y
字型の境界55ということになる。また、各文字の領域
がそれぞれ「2」,「乙」,「Z」で示されている。
【0035】ところで、文字「2」の領域内の特徴ベク
トル56(図示×印で示す)が、本当は「Z」に対応し
ていたとする。したがって、この辞書を用いてこの特徴
ベクトル56の文字認識を行なうと、誤認識となる。こ
れにより、図5(b)に示されるように、この特徴ベクト
ル56は、「Z」についての2番目の代表点54aとな
る。これにより、少なくとも、「Z」と「2」との境界
は文字「2」の代表点52側にずれて、境界55aとな
る。ところが、今度はこの境界55aよりは「Z」側に
ある特徴ベクトル57が、本当は文字「2」に対応して
いたとする。すると、同様にして、図5(c)に示される
ように、この特徴ベクトル57が、「2」についての2
番目の代表点52aとなり、「2」と「Z」との境界
は、「Z」の代表点54側にずれて境界55bとなる。
以下同様にして、全ての入力文字パターンについて誤認
識が生ずるかどうかを確かめ、誤認識となった場合には
その特徴ベクトルを新たに代表点として加えることによ
り、図5(d)において黒丸で示すように代表点が配置さ
れ、境界55の形状が、これらよく似た文字間で正しく
文字認識を行なうためにふさわしいものとなる。
【0036】以上本発明の実施例について、手書き文字
認識用の辞書の作成を例に挙げて説明したが、印刷文字
などの認識用の辞書の作成にも、本発明は応用すること
ができる。
【0037】
【発明の効果】以上説明したように本発明は、辞書に既
に登録されている代表点と新たな入力文字パターンの特
徴ベクトルとを比較し、両者が「近い」場合には、新た
な入力文字パターンの特徴ベクトルに近付くように既に
登録されている代表点を修正し、両者が「近くない」場
合には、新たな入力文字パターンの特徴ベクトルを新た
な代表点として追加登録することにより、ユーザによる
追加登録が可能であって、辞書サイズを大きくすること
なく、かつ書き手や書き方によるばらつきを十分に表現
できる辞書を作成することができるという効果がある。
【0038】また、辞書の作成後、辞書の作成に使用さ
れた入力文字パターンに対して作成された辞書を用いて
文字認識を行ない、誤認識となった場合には当該入力文
字パターンに対する特徴ベクトルを新たに代表点として
作成された辞書に追加登録することにより、辞書の改良
が行なわれ、この辞書を用いて文字認識を行なった場合
の認識率をさらに向上させることができる。
【図面の簡単な説明】
【図1】(a)は本発明の一実施例の手書き文字認識辞書
作成装置の構成を示すブロック図、(b)は辞書の構成の
一例を示す図である。
【図2】(a),(b)は辞書作成の過程を説明するフローチ
ャートである。
【図3】(a)〜(d)は代表点の更新の実例を説明する図で
ある。
【図4】(a)〜(d)は代表点の更新の実例を説明する図で
ある。
【図5】(a)〜(d)は辞書の改良の実例を説明する図であ
る。
【符号の説明】
10 手書き文字入力表示装置 11 ペン 12 学習文字 13 入力文字パターン 14 入力エリア 21 特徴ベクトル算出部 22 特徴ベクトル格納部 23 比較部 24 更新部 25 辞書 31,41,51 特徴空間 32,32',34,42,42',44,52〜54,52a,
54a 代表点 33,56,57 特徴ベクトル 55,55a,55b 境界 101〜107,111,112 ステップ
フロントページの続き (56)参考文献 特開 昭61−193282(JP,A) 特開 平2−181285(JP,A) 特開 昭57−45680(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 9/68 G06F 9/62

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力された入力文字パターンに対して特
    徴ベクトルを算出し前記特徴ベクトルに応じて前記入力
    文字パターンに対応する文字を識別して前記入力文字パ
    ターンの認識を行なう文字認識において使用され、各文
    字ごとに当該文字に対応する代表的な特徴ベクトルを代
    表点として保持する辞書の作成方法であって、 前記辞書に新たな入力文字パターンを登録することが要
    求された場合に、前記新たな入力文字パターンを入力し
    て前記新たな入力文字パターンに対する特徴ベクトルを
    算出する第1の工程と、 前記辞書を検索して前記特徴ベクトルが前記特徴ベクト
    ルに対応する文字の前記代表点に近いかどうかを判定
    し、近い場合には前記特徴ベクトルに近付くように前記
    対応する文字の代表点を修正し、それ以外の場合には前
    記特徴ベクトルを前記対応する文字の代表点として前記
    辞書に追加する第2の工程と、 前記第1の工程及び前記第2の工程で作成された前記辞
    書の作成に使用された入力文字パターンに対して前記作
    成された辞書を用いて文字認識を行なう第3の工程と、 前記第3の工程で文字認識した結果、本来表そうとした
    文字とは異なる文字として誤認識する特徴ベクトルがあ
    れば、当該特徴ベクトルを本来表そうとした文字の代表
    点として前記辞書に登録する第4の工程と、 を有する文字認識辞書作成方法。
  2. 【請求項2】 前記第4の工程では、前記本来表そうと
    した文字とは異なる文字の代表点と、前記誤認識された
    特徴ベクトルとの間に、前記本来表そうとした文字とは
    異なる文字として認識させるための領域と本来表そうと
    した文字として認識させるための領域とを分けるための
    境界を配置する、請求項1に記載の文字認識辞書作成方
    法。
  3. 【請求項3】 前記第2の工程は、前記特徴ベクトルが
    前記特徴ベクトルに対応する文字の前記代表点に近くな
    い場合には、前記特徴ベクトルを前記対応する文字の代
    表点の1つとして前記辞書に追加登録することにより、
    1つの文字に対して複数の代表点を登録する工程を含
    む、請求項1または2に記載の文字認識辞書作成方法。
  4. 【請求項4】 入力された入力文字パターンに対して特
    徴ベクトルを算出し前記特徴ベクトルに応じて前記入力
    文字パターンに対応する文字を識別して前記入力文字パ
    ターンの認識を行なう文字認識において使用され、各文
    字ごとに当該文字に対応する代表的な特徴ベクトルを代
    表点として保持する辞書の作成装置であって、 新たな入力文字パターンを入力して前記新たな入力文字
    パターンに対する特徴ベクトルを算出する特徴ベクトル
    算出手段と、 前記辞書を検索して前記特徴ベクトルが前記特徴ベクト
    ルに対応する文字の前記代表点に近いかどうかを判定す
    る判定手段と、 前記判定手段での判定の結果近い場合には前記特徴ベク
    トルに近付くように前記対応する文字の代表点を修正
    し、それ以外の場合には前記特徴ベクトルを前記対応す
    る文字の代表点として前記辞書に追加する更新手段とを
    有し、 前記判定手段及び前記更新手段により作成された前記辞
    書の作成に使用された入力文字パターンに対して前記作
    成された辞書を用いて文字認識を行い、文字認識した結
    果、本来表そうとした文字とは異なる文字として誤認識
    する特徴ベクトルがあれば、当該特徴ベクトルを本来表
    そうとした文字の代表点として登録する文字認識辞書作
    成装置。
  5. 【請求項5】 前記判定手段及び前記更新手段により作
    成された前記辞書の作成に使用された入力文字パターン
    に対して前記作成された辞書を用いて文字認識を行い、
    文字認識した結果、本来表そうとした文字とは異なる文
    字として誤認識する特徴ベクトルがあれば、当該特徴ベ
    クトルを本来表そうとした文字の代表点として登録する
    際に、 前記本来表そうとした文字とは異なる文字の代表点と、
    前記誤認識された特徴ベクトルとの間に、前記本来表そ
    うとした文字とは異なる文字として認識させるための領
    域と本来表そうとした文字として認識させるための領域
    とを分けるための境界を配置する請求項に記載の文字
    認識辞書作成装置。
  6. 【請求項6】 前記更新手段は、前記特徴ベクトルが前
    記特徴ベクトルに対応する文字の前記代表点に近くない
    場合には、前記特徴ベクトルを前記対応する 文字の代表
    点の1つとして前記辞書に追加登録することにより、1
    つの文字に対して複数の代表点を登録する請求項また
    に記載の文字認識辞書作成装置。
JP06478694A 1994-04-01 1994-04-01 文字認識辞書作成方法および装置 Expired - Fee Related JP3164962B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06478694A JP3164962B2 (ja) 1994-04-01 1994-04-01 文字認識辞書作成方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06478694A JP3164962B2 (ja) 1994-04-01 1994-04-01 文字認識辞書作成方法および装置

Publications (2)

Publication Number Publication Date
JPH07271917A JPH07271917A (ja) 1995-10-20
JP3164962B2 true JP3164962B2 (ja) 2001-05-14

Family

ID=13268269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06478694A Expired - Fee Related JP3164962B2 (ja) 1994-04-01 1994-04-01 文字認識辞書作成方法および装置

Country Status (1)

Country Link
JP (1) JP3164962B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7428516B2 (en) * 2005-06-23 2008-09-23 Microsoft Corporation Handwriting recognition using neural networks

Also Published As

Publication number Publication date
JPH07271917A (ja) 1995-10-20

Similar Documents

Publication Publication Date Title
KR100297482B1 (ko) 수기입력의문자인식방법및장치
US7756335B2 (en) Handwriting recognition using a graph of segmentation candidates and dictionary search
US20040136591A1 (en) Method and device for recognition of a handwritten pattern
EP0564827B1 (en) A post-processing error correction scheme using a dictionary for on-line handwriting recognition
US20020041713A1 (en) Document search and retrieval apparatus, recording medium and program
US5673337A (en) Character recognition
US5905811A (en) System for indexing document images
US6035062A (en) Character recognition method and apparatus
US7580573B2 (en) Segmentation-based recognition
JP3164962B2 (ja) 文字認識辞書作成方法および装置
JP3675511B2 (ja) 手書き文字認識方法及び装置
EP1010128B1 (en) Method for performing character recognition on a pixel matrix
JP3812719B2 (ja) 文書検索装置
JP2715198B2 (ja) 自動平面点パターン・マッチング装置及びマッチング方法
JP3128357B2 (ja) 文字認識処理装置
JP3720873B2 (ja) 手書き文字認識方法及びその装置
JP2003331214A (ja) 文字認識誤り訂正方法、装置及びプログラム
JP2925303B2 (ja) 画像処理方法及び装置
JPH06215197A (ja) 文字認識方法および装置
JPH07271921A (ja) 文字認識装置および文字認識方法
JPH09179938A (ja) オンライン手書き文字認識装置
JP3720876B2 (ja) 手書き文字認識学習方法及び手書き文字認識装置
JP3481850B2 (ja) 文字認識装置
JPH09237322A (ja) 認識装置の候補修正方式
JP3033904B2 (ja) 文字認識後処理方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010207

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080302

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090302

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090302

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100302

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100302

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110302

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110302

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120302

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120302

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130302

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130302

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140302

Year of fee payment: 13

LAPS Cancellation because of no payment of annual fees