JP4334131B2 - 手書き文字認識装置 - Google Patents
手書き文字認識装置 Download PDFInfo
- Publication number
- JP4334131B2 JP4334131B2 JP2000356718A JP2000356718A JP4334131B2 JP 4334131 B2 JP4334131 B2 JP 4334131B2 JP 2000356718 A JP2000356718 A JP 2000356718A JP 2000356718 A JP2000356718 A JP 2000356718A JP 4334131 B2 JP4334131 B2 JP 4334131B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- dictionary
- character
- pattern
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
Description
【発明の属する技術分野】
本発明は、複数のユーザの手書き入力が予想される環境で手書き文字を認識する装置に関し、特に、ユーザが特別な操作を行わなくても、ユーザ別に設けられているユーザ辞書を切り換え、また認識誤りが発生した文字パターンをユーザ辞書に追加登録していく等、複数のユーザが手書き文字を入力する環境であっても、認識回数の増加に伴って各ユーザの手書き文字の認識精度が向上していく手書き文字認識装置に関する。
【0002】
【従来の技術】
手書き文字のパターンは人によって少しずつ異なるが、標準的な文字パターンというものが存在するので、手書き文字認識装置では、例えば複数の手書き文字の標準パターンの平均から得られたような、各文字の標準的なパターンを辞書に予め登録しておき、手書き入力された文字パターンを辞書の登録パターンと照合し、文字を認識する。
【0003】
手書き文字認識装置は、照合の結果、パターンの類似度が最も高い文字候補をユーザに提示し、ユーザは提示された文字候補が正解の場合、例えば確定キーを押して文字を確定する。
【0004】
このとき、図14に示すように、文字の中には、字形に少々の変動があっても、1つの標準パターンだけで認識が可能である「あ」のような文字も、また複数の書き方が存在する「7」「1」のような文字もあり、このような複数の書き方が存在する文字に関しては、複数の標準パターンを辞書に登録しておくのが一般的である。
【0005】
しかし、人には書き癖があるので、複数のユーザが1台の装置を使用する環境では、「7」と「ク」のように標準パターンが似通った文字を標準パターンの辞書だけで認識すると認識誤りが発生するおそれがある。例えば、図14に示す筆者Bの手書き文字「7」が「ク」と誤認識されてしまったり、また筆者Cの手書き文字「1」が「7」と誤認識されてしまうおそれがある。
【0006】
ところが、筆者B及び筆者Cそれぞれの個人的な文字パターンだけに注目した場合、筆者Bの「7」と「ク」、また筆者Cの「7」と「1」のパターンは明らかに異なっている。従って、特に複数のユーザが装置を使用するような環境では、標準パターンの辞書に加えて筆者固有の文字パターンを登録したユーザ辞書を設けることが認識精度の向上に有効である。
【0007】
しかし、文字別に各筆記者の全ての手書き文字のパターンを登録したユーザ辞書を設けることは、例えば日本語のように、非漢字及びJIS 第1水準漢字に限っても3000文字以上存在しているような文字が認識対象の場合、メモリの記憶容量及び辞書の作成工数のいずれの面からも非現実的である。
【0008】
従って、全てのユーザに共通の標準パターンを登録した標準辞書と、個々のユーザの書き癖をカバーする範囲の文字パターン、又は標準パターンからの偏差を登録したユーザ辞書とを併用する方法、装置が提案されている(特開平1-145789号、特開平11-213096 号、特開平7-271918号公報等)。
【0009】
図15は、このようなユーザ辞書が設けられた従来の手書き文字認識装置の構成の一例を示すブロック図である。
手書き文字の入力部10から入力された文字を2値化した文字パターンが入力されると、辞書照合手段20は、この文字パターンを標準辞書30及びユーザ辞書40両方の文字パターンと照合し、類似度が最も高い文字候補を認識結果として出力する。
【0010】
出力した認識結果の文字候補はパターン登録手段50に渡される。ユーザによる入力部10の確定キー押し下げ等によってこの文字候補が正解であると決定された場合、パターン登録手段50はユーザ辞書40に対してパターン登録を行わないが、ユーザによる入力部10からの他の文字の選択等によって、認識結果の文字候補が誤認識であると検出した場合、パターン登録手段50は、誤認識した文字パターンを正解として指定された他の文字の文字パターンとしてユーザ辞書40に登録する。
【0011】
誤認識した文字パターンをユーザ辞書40に追加登録する場合、無制限に登録すると、辞書のサイズがいたずらに膨大になり、認識処理の増大、認識時間の長時間化等、認識処理性能の低下を招く。そのため、一般的には誤認識した文字候補の既登録のパターンとの類似度に閾値を設けておき、類似度が閾値より大きいパターンは登録しないルールを定めたり、また辞書の登録数に上限値を設けたり、さらに照合にあまり使用されないパターンを削除したり等の手法が利用されている。
【0012】
【発明が解決しようとする課題】
ところで、複数のユーザが装置を使用する環境では、前述のようにユーザ別に登録されているユーザ辞書を、ユーザが交代する都度、切り換えるために、画面上でユーザ名,ユーザIDを入力する等、ユーザに何らかの操作が要求されている。従って、ユーザが切り換えを忘れて前のユーザのユーザ辞書を継続して使用した場合、認識結果に誤りが発生したこのユーザの手書き文字が前のユーザのユーザ辞書に追加登録されたり、その結果、ユーザ辞書の登録容量を超えた場合に前のユーザの文字パターンが削除されたり等、前のユーザにとって次回からの手書き文字の認識精度が低下するおそれがある。
【0013】
また、同じ筆記者でも、普通の速度で筆記した場合と、急いで書いた場合、書きにくい場所で書いた場合等とでは文字パターンが異なるケースが多い。従って、登録時に普通の速度で書いた文字パターンが登録されているユーザ辞書では、急いで書いた場合、書きにくい場所で書いた場合等の筆記条件が異なる手書き文字の文字パターンを認識できないおそれがある。しかし、上述のような多様なケースを想定して、多様な文字パターンをユーザ辞書に予め登録しておくには辞書作成に多大な工数を要する。
【0014】
本発明はこのような問題点を解決するためになされたものであって、ユーザが特別な操作を行わなくても、装置側でユーザを判定してユーザ別に設けられているユーザ辞書を切り換え、また認識誤りが発生した文字パターンを、正解の文字に対するユーザ固有の文字パターンとして、対応するユーザのユーザ辞書に追加登録していく等により、複数のユーザが手書き文字を入力する環境であっても、認識回数の増加に伴って各ユーザの手書き文字の認識精度が向上していく手書き文字認識装置の提供を目的とする。
【0015】
第1発明の手書き文字認識装置は、手書き文字の入力パターンを、文字別の手書き文字の標準パターンが予め登録されている標準辞書、及び文字別のユーザ固有の手書き文字のパターンが予め登録されている複数のユーザ辞書のパターンと照合し、パターンの類似度が最も高い少なくとも一つの文字候補を認識結果として出力する手書き文字認識装置において、前記ユーザ辞書がユーザ別に設けられており、予め定めてあるユーザ識別情報別の、一方の座標軸を筆記速度とし他方の座標軸を筆圧とした2次元座標上に示した筆記速度及び筆圧の関係を示す座標点の分布を近似すべく求められた前記2次元座標上の近似曲線を格納するユーザ照合辞書と、前記手書き文字の入力パターンと前記ユーザ照合辞書に格納してあるユーザ識別情報別の近似曲線との距離を求め、該ユーザ識別情報別の距離が最小となる値の近似曲線に対応するユーザ識別情報を、筆記しているユーザのユーザ識別情報と判定するユーザ判定手段と、該ユーザ判定手段の判定結果に基づき、照合に用いるべき前記ユーザに対応するユーザ辞書を、複数のユーザ別のユーザ辞書の中から選択する手段と、前記ユーザ判定手段が求めた前記類似度が所定の類似度の閾値以下であって、既設のユーザ辞書の中に、照合に用いるべき前記ユーザに対応するユーザ辞書が存在しないと判定した場合、該ユーザのユーザ辞書を新規に作成する手段と、前記入力パターンから近似曲線を求めて、新規に作成したユーザ辞書に登録する手段と、前記認識結果である文字候補の類似度が所定の閾値以下であって、前記認識結果に誤りが発生した場合、誤認識した入力パターンを、正解としてユーザにより指定された他の文字に対するユーザ固有の手書き文字のパターンとしてユーザ辞書に登録するパターン登録判定部と、手書き文字を筆記したユーザの交代を検出するユーザ交代検出手段と、ユーザの交代を検出した場合、照合に用いるべきユーザ辞書を、前記ユーザ判定手段が判定した交代後のユーザのユーザ辞書に切り換える手段とを備えたことを特徴とする。
【0016】
第1発明では、文字を筆記しているユーザを装置側で判定し、手書き文字の入力パターンを、文字別の手書き文字の標準パターンが予め登録されている標準辞書、及びこのユーザ固有の文字別の文字パターンが予め登録されているユーザ辞書のパターンと照合し、パターンの類似度が最も高い少なくとも一つの文字候補を認識結果として出力する。またユーザの交代を検出した場合、文字を筆記しているユーザを装置側で判定し、ユーザ辞書を装置側で切り換える。このとき、既設のユーザ辞書の中に、判定したユーザのユーザ辞書が存在しない場合、このユーザのユーザ辞書を新規に作成する。さらに認識誤りが発生した場合の手書き文字の入力パターンを、正解として指定された他の文字に対するユーザ固有の手書き文字のパターンとしてユーザ辞書に登録する。
【0017】
これにより、ユーザが特別な操作を行わなくても、複数のユーザが手書き文字を入力する環境において、認識回数の増加に伴って各ユーザの手書き文字の認識精度が向上していく。
【0018】
第2発明の手書き文字認識装置は、第1発明に加えて、ユーザを判定できなかった手書き文字の入力パターンを、正解として指定された文字候補に対する不特定ユーザの手書き文字のパターンとして一時的に登録する一時登録辞書をさらに備え、前記ユーザ判定手段がユーザを判定できない間、一時登録辞書をユーザ辞書として照合に用い、前記ユーザ判定手段がユーザ辞書が未登録であると判定した時点で、一時登録辞書の登録内容から該ユーザのユーザ辞書を新規に作成し、前記ユーザ判定手段がユーザを判定した時点で、一時登録辞書の登録内容から該ユーザのユーザ辞書を新規に作成し、前記ユーザの判定手段がユーザを判定した時点で、一時登録辞書の登録内容を該ユーザのユーザ辞書に追加登録すべくなしたことを特徴とする。
【0019】
第2発明では、入力文字数がまだ少ないとか、またユーザが文字の書き始めの段階で慌てて書いたり、書きにくい場所で書いたり等の通常と異なる条件下で筆記したとか、またユーザ辞書が未登録である等の理由でユーザを判定できないとかの間、認識誤りが発生した手書き文字の入力パターンを正解として指定された文字の文字パターンとして一時登録辞書に仮に登録し、この一時登録辞書を仮のユーザ辞書として照合に使用する。ユーザを判定した時点で一時登録辞書の登録内容を、判定したユーザのユーザ辞書に追加登録するか、又はこのユーザのユーザ辞書が未登録であると判定した時点で、一時登録辞書の登録内容からこのユーザのユーザ辞書を新規に作成する。
【0020】
これにより、例えばユーザが慌てて書いたり、また書きにくい場所で書いたり等、通常と異なる筆記条件下で筆記した手書き文字のパターンも自動的にユーザ辞書に追加登録されていき、ユーザが特別な追加登録を行わなくても、認識回数の増加に伴って認識精度が向上していく。またユーザ辞書を未登録のユーザが装置を使用する場合でも、認識処理と並行してこのユーザ固有の文字パターンを収集し、このユーザのユーザ辞書を新規作成する。
【0021】
第3発明の手書き文字認識装置は、第1又は第2発明に加えて、文字の筆記動作の途切れを検出する手段と、文字の筆記動作が途切れている時間を計時する計時手段とをさらに備え、前記ユーザ交代検出手段は、前記時間が所定時間以内の場合は前記ユーザ判定手段によるユーザ判定を抑止させる一方、前記時間が所定時間を超えた場合は前記ユーザ判定手段によるユーザ判定を行わせるべくなしたことを特徴とする。
【0022】
第3発明では、例えば手書き文字を入力するタブレットへのタッチペン等による加圧の有無等から文字の筆記動作の途切れを検出し、文字の筆記動作が途切れている時間が所定時間以内の場合は同一のユーザが継続して文字を入力していると判定してユーザ判定を停止する。一方、文字の筆記動作が途切れている時間が所定時間を超えた場合はユーザが交代したと判定して、新たにユーザ判定を行う。
【0023】
これにより、交代の都度、ユーザが特別な操作を行わなくても、装置側でユーザの交代を自動的に検出し、またユーザ判定後、同一のユーザが文字を筆記している間は不必要なユーザ判定を回避する。一方、ユーザ交代を検出してユーザ判定が必要となった場合だけユーザ判定を行う。またユーザが所定量の文字を入力して所定時間が経過した後、同一のユーザが文字の筆記を再開した可能性もあるが、その場合はユーザの判定精度が向上する。
【0024】
第4発明の手書き文字認識装置は、第1乃至第3発明のいずれかに加えて、前記標準辞書及び/又はユーザ辞書は、1文字に対して複数のパターンを登録することが可能であり、前記ユーザ判定手段は、各ユーザの所定数の文字の手書き文字に対して前記複数のパターンのいずれが文字候補として出力されたかの頻度の分布を記憶する手段と、所定数の文字にて前記複数のパターンのそれぞれが文字候補として出力された頻度を計数する手段とを備え、所定数の文字にて各パターンが文字候補として出力された頻度の分布に基づいてユーザを判定すべくなしたことを特徴とする。
【0025】
第4発明では、前述の図14に示す「1」「7」等のように、1つの文字に対して複数の書き方の文字パターンが登録されている文字のうち、例えば筆者B及び筆者Cそれぞれの個人的な文字パターンだけに注目した場合、筆者Bの「7」と「ク」、また筆者Cの「7」と「1」のパターンが明らかに異なっている点に注目する。即ち、筆記者によって書き癖の特徴が現れやすいような複数の文字の登録パターンと各ユーザの手書き文字のパターンとを照合した結果、どの文字パターンとの類似度が高いと評価されて文字候補として出力されたかの頻度の分布を記憶しておき、未判定のユーザが入力した上述の複数の文字の手書き文字を登録パターンと照合した結果、文字候補としてどの文字パターンが出力されたかの頻度を計数して、これら複数の文字における文字候補としての文字パターンの出力頻度の分布が記憶している分布と最も近いユーザをユーザと判定する。
【0026】
これにより、ユーザの書き癖が現れやすい限られた文字だけに注目してユーザを効率良く、また高精度で判定することができる。
【0027】
【発明の実施の形態】
図1は本発明の手書き文字認識装置(以下、本発明装置という)の実施の形態1の構成を示すブロック図である。
ペン入力タブレット等からなる入力部10は、ユーザが筆記した文字の筆跡パターンを座標点列に変換して取り込む。
【0028】
辞書照合手段20は、入力部10が取り込んだパターンを、標準辞書30及びユーザ辞書40のパターンと比較し、認識尤度が高い順に認識結果の文字候補を出力する。このとき、入力したパターンと、後述するユーザ照合辞書602に格納されたN個の近似曲線との距離(以下ユーザ判定距離という)を求めた結果、ユーザ判定距離が最小であり、予め定めた閾値以下となるユーザidが得られた場合、このユーザidに対応するユーザが入力しているとみなす。そして、これ以降、ユーザ辞書40と標準辞書30とを用いる。パターン照合の手法には、DPマッチング等の一般的なマッチング手法が利用でき、また具体的なアルゴリズムとしては、例えば「オンライン手書き文字認識のための線形処理時間伸縮マッチング(秋山、中川)」(電子情報通信学会論文誌J81-DII-4 )等が適用可能である。
【0029】
標準辞書30は、認識対象文字の文字コードと、多数の手書き文字のパターンを平均化した標準パターン(座標点数及び座標点列)とを関連付けて格納したデータ列からなる。またユーザ辞書40は、文字コードと、各ユーザ固有の手書き文字のパターン(座標点数及び座標点列)とを関連付けて格納したデータ列からなる。
【0030】
図5は標準辞書30及びユーザ辞書40の登録状態の概念図である。図に示すように、一文字分の領域は、一つの文字コード格納領域と、一つの(標準)パターン数格納領域と、複数個分の標準パターン格納領域とからなる。
【0031】
パターン登録手段50は、図6にその構成の一例を示すように、誤認識が発生した文字パターンをユーザ辞書40に登録するか否かを判定するパターン登録判定部501 と、ユーザ辞書40にパターンを格納するパターン格納部502 と、ユーザ辞書40の登録パターンの中から古くなった(ずっと使用されていない)パターンを削除するパターン削除部503 とからなる。
【0032】
図7はパターン登録手段50における誤認識発生時のパターン登録手順のフローチャートである。
認識結果が誤認識であった場合(ステップS1のYes )、認識類似度が閾値より大きい場合(ステップS2のYes )、ユーザ辞書40にパターンは登録しないが、類似度が閾値以下の場合(ステップS2のNo)に該当するユーザ辞書40にパターンを登録する(ステップS3)。
【0033】
このとき、ユーザ辞書40の登録パターン数が閾値(上限値)より多くなった場合は(ステップS4のYes )、古いパターンを削除する(ステップS5)。なお、削除する古いパターンの判定基準は登録パターン数に限らず、ユーザ辞書40のサイズであっても、また最後に認識に使用された時点からの経過時間(登録パターンに寿命を持たせる)等であってもよい。
【0034】
ユーザ判定手段60は、図8にその構成の一例を示すように、既登録のユーザを識別する情報に関連付けて、例えば、後述するユーザ辞書40の通し番号が格納されているユーザ照合辞書602 を参照して、入力パターンが登録パターンと登録するユーザ辞書40の通し番号を取得するユーザ照合部601 を有する。
【0035】
辞書選択手段70はユーザ判定手段60の出力する判定結果に応じたユーザのユーザ辞書40に切り換え、またユーザ辞書40と辞書照合手段20、パターン登録手段50を接続する手段である。例えば、ユーザ辞書40に1〜Nの通し番号が付されている場合、ユーザ判定手段60からユーザ辞書40の通し番号(以下、ユーザid という)が出力される。
【0036】
ユーザidを判定する方法としては、1回(1文字)の入力パターンだけを見て判定する方法と、複数(数文字)の入力パターンを見てから判定する方法とがある。
一文字だけで判定する場合、入力パターンと登録パターンとの文字パターンを比較して判定すると、判定精度が極めて低くなる。しかし、リアルタイムで文字が筆記されている場合、筆速、筆圧等に注目すれば、一文字でもユーザを判定することは可能である。
【0037】
以下に、筆速と筆圧からユーザを判定する方法の一具体例を説明する。
筆速は、入力部10として用いるタブレットが同じものであり、設定も変わらないと仮定した場合、隣り合ったサンプル座標点の間の距離が速度に比例している。また筆圧の検出が可能なタブレットの場合、個々のサンプル座標点ごとに筆圧を検出することが可能である。
【0038】
ここで、文字パターンの座標点数を N、座標点をp(i)=(px (i), py (i))(ただし、 i=1,…,N)、筆圧をP(j)(ただし、 j=1,…,N)とすると、隣り合った座標点間の距離d(k)とそれに対する筆圧 P′(k) は式(1) のようにして求まる。
【0039】
【数1】
【0040】
図9は筆速d(k)と筆圧 P′(k) をxy座標にプロットしたグラフである。ここでx軸は筆速を表し、y軸は筆圧を表す。即ち、一般的に、筆記速度が速くなれば筆圧が低下するという傾向が示されている。図中の曲線は、プロットした座標点の分布を近似した曲線である。
この曲線は、図10に示すように、x軸を一定間隔に分割して、それぞれの分割領域内でのy座標値の平均値を計算し、その領域のx座標の中点とy座標の平均値の座標点とを結んだ折れ線で近似できる。
【0041】
図10に示すような近似曲線をユーザid別に予め求めておき、例えばユーザ照合辞書602 に格納しておく。入力部10から文字パターンが入力されると、ユーザ判定手段60のユーザ照合部601 は、式(1) に基づいてd(k)及び P′(k) の系列を求め、ユーザ照合辞書602 に格納されている近似曲線との距離(以下、ユーザ判定距離という)を計算する。
【0042】
ここで、(x,y) =(d(k), P′(k))平面上の座標点をQ(k)=(QX (K), Qy (k))、座標点数を Mとし、近似曲線を y=F(x)とすると、入力パターンに対するユーザ判定距離 Sは以下の式(2) により求まる。
【0043】
【数2】
【0044】
式(2) は、図9に示す座標空間でのy軸座標の差分の平均値に相当する。これにより求められるユーザ判定距離 Sの値が最少の近似曲線を描く入力パターンのユーザidが該当するユーザのユーザidであると判定できる。
【0045】
以上の判定例では、ユーザ判定距離 Sが最少の値となるユーザidをユーザ判定結果とした。ここでユーザidを1以上の整数としておき、ユーザ判定距離 Sの最少値が予め定めた閾値より大きい場合はユーザidとして0を出力することとする。即ち、ユーザ判定手段60がユーザidとして0を出力した場合、既登録のユーザ辞書40の中に該当するユーザ辞書が存在しないということを示す。
【0046】
ユーザ判定手段60が0を出力した場合、パターン入力しているユーザ用のユーザ辞書40が存在しないことを意味するので、辞書作成手段80は空のユーザ辞書40を作成する。このとき、ユーザ判定手段60のユーザ照合辞書602 に新たに作成したユーザ辞書40のユーザidが登録される。ユーザ照合辞書602 により、新たに作成したユーザ辞書40に登録される文字パターンである近似曲線は、現在の入力パターンから計算することとする。
【0047】
図2は本発明装置の実施の形態2の構成を示すブロック図である。なお、図1と同一部分には同一符号を付してその説明を省略する。
上述の例では、ユーザ判定距離 Sの値によって該当するユーザ辞書40が存在するか否かを二者択一で判定したが、本例では、もう一つの閾値を新たに用意し、ユーザ判定距離 Sの値に応じて、「該当するユーザ辞書40が存在する(ユーザidを出力する)」「該当するユーザ辞書40が存在しない(0を出力)」に加えて、「該当するユーザ辞書40が存在するかどうか判断できない(保留:−1を出力)」という選択肢を設ける。即ち、第1の閾値よりユーザ判定距離 Sの値が小さい場合、ユーザ判定手段60は、その距離の近似曲線に対応するユーザidを出力し、第2の閾値(>第1の閾値)よりユーザ判定距離 Sが大きい場合は0を出力し、それ以外の場合は−1を出力する。
【0048】
ユーザ判定手段60が−1を出力した場合、ユーザ判定手段60がユーザidを判定できなかったことを意味し、辞書選択手段70は一時登録辞書90を仮のユーザ辞書として選択する。その場合、ユーザ判定手段60はユーザidが判定できなかった入力パターンを、出力された認識結果の文字候補の中からユーザが正解として指定した文字と対応付けて、内部のバッファ(図示せず)に保持しておく。一時登録辞書90が照合に使用されている間は、そのバッファ内のパターンもユーザ判定材料として使用される。
【0049】
次に、入力パターンの正解文字が分かった(ユーザの認識結果訂正等による)時点で、それ以降のユーザ判定に正解文字 Cを利用する場合のユーザ判定手順を図11のフローチャートに基づいて説明する。
先に入力パターンについての文字認識が行われ、その結果に対するユーザの修正作業(誤認識の場合は結果を訂正し、正解の場合はそのまま確定する)が行われることによって入力パターンの正解文字 Cが判明する。
【0050】
そこで、正解文字 Cをユーザ判定手段60に入力し(ステップS11 )、標準辞書30と全てのユーザ辞書40に含まれる正解文字 Cの標準パターンについて、入力パターンとの間で再度照合を行い(ステップS12 )、正解文字 Cとの間のユーザ判定距離 Sが最も近いパターンを探し出す(ステップS13 )。ここで、ユーザ判定距離 Sの最も近いパターンがユーザ辞書40から得られた場合(ステップS14 のYes )、ユーザ判定手段60は、そのユーザ辞書40に対応するユーザidをユーザ判定結果として出力する(ステップS15 )。
【0051】
ただし、この方法では、正解文字に対応するパターンが全てのユーザ辞書40に含まれていなければ平等な比較は行えないので、その正解文字 Cが全てのユーザ辞書40に登録されていることが前提条件である。登録されていないユーザ辞書40があれば(ステップS12 のNo)、ユーザ判定結果は判断できない(保留:ユーザid=−1)とする。
【0052】
また、ユーザ判定距離 Sが最小であるパターンがユーザ辞書40から得られなかった場合、即ち標準辞書30から得られた場合(ステップS14 のNo)、ユーザ判定結果は判断できない(保留:ユーザid=−1)とする。
【0053】
図3は本発明装置の実施の形態3の構成を示すブロック図である。なお、図1と同一部分には同一符号を付してその説明を省略する。
本例では、入力パターンの入力タイミングの検出が可能な場合、入力パターンが連続的に入力されている間は同一のユーザが文字を筆記しているとしてユーザ判定手段60によるユーザ判定を抑止させるために時間カウンタ100 を設けている。
【0054】
即ち、図12にその構成の一例を示すように、文字が筆記されると、時間カウンタ100 のタイマ1001にトリガが入力され、タイマ1001はトリガが入力された時刻を出力し、この時刻が入力時刻バッファ1に格納される。入力時刻バッファ(1) 1002への時刻の格納に応じて、その直前に入力された時刻は入力時刻バッファ(2) 1003に格納される。差分器1004は入力時刻バッファ(1) 1002と入力時刻バッファ(2) 1003との差分、即ち入力の時間間隔を閾値器1005へ出力する。
【0055】
閾値器1005は、その時間間隔が予め定められた閾値(所定時間)以上であればTRUEを出力し、そうでなければFALSE を出力する。
ユーザ判定手段60は時間カウンタ100 からTRUEが出力された場合、即ち次の入力までの時間間隔が所定時間以上の場合はユーザ交代が検出されたものとしてユーザ判定を行う。しかし、時間カウンタ100 からFALSE が出力された場合は同一のユーザが文字を筆記しているものとしてユーザ判定を行わない。
【0056】
図4は本発明装置の実施の形態4の構成を示すブロック図である。なお、図1と同一部分には同一符号を付してその説明を省略する。
本例では、1つの文字に対して複数の文字パターンが登録されている文字のうち、ユーザの書き癖が現れやすい文字に注目し、これら複数個の文字の文字認識において標準辞書30、ユーザ辞書40のどの文字パターンが照合に使用されたかをカウントする標準パターンカウンタ110 が標準辞書30及びユーザ辞書40に設けられている。
【0057】
標準パターンカウンタ110 は、図13にその概念図を示すように、辞書中の1文字毎に格納されている文字パターンが、入力パターンとの照合時に何回使用されたか、即ち前述のユーザ判定距離 Sが最も近いパターンとして選択されたかをカウントするものである。
【0058】
ユーザ判定手段60には、以上のような複数個の文字について、使用頻度の分布パターンをユーザ別に予め調べて、上述のパターンカウンタのような形式で登録しておき、現在入力中のユーザの使用頻度の傾向と、登録されている各ユーザの使用頻度の傾向とを比較し、その分布傾向が近似しているユーザを現在入力中のユーザと判定する。
【0059】
例えば、図14の例で見ると、筆者Aの字形は文字「7」が標準パターン(2) 、文字「1」が標準パターン(1) に相当するが、筆者Bの字形は文字「7」が標準パターン(1) 、文字「1」が標準パターン(2) に相当する。従って、照合の結果、入力文字とどの標準パターンの形が近かったかを調べれば、筆者AとBを判別することができる。同様に、個々の筆者が書く字形の分布を種々の文字、特に書き癖が現れやすいような文字について調べておけば、精度の高いユーザ判定が可能である。
【0060】
ここで、入力パターンから得られた標準パターンカウンタ110 のカウンタ分布を I= Iij(ただし、 i=1,…,N、 j=1,…,Mi )、ユーザ判定手段60に予め用意されている標準パターンカウンタの分布を R= Rij(ただし、 i=1,…,N、 j=1,…,Mi )とする。ただし、 iは文字コードのインデクス、 Nは認識対象文字の種類、 jは文字ごとの標準パターン数であり、 Mi は文字 iにおける標準パターン数である。
ユーザ判定手段60では、 Iと Rとの間の距離 Dを以下の式(3) で求め、 Dが最小になるユーザidを出力する。
【0061】
【数3】
【0062】
ここでF(I,R)は文字毎の距離である。文字毎の距離は入力パターンの総数で正規化され、全体での距離は文字毎の距離の総和で計算する。
【0063】
なお、以上のような標準パターンカウンタ110 は、全ての文字についてパターンのカウントをするのは困難なので、よく使う文字、又は字形の特徴が出やすい文字(「1」「7」等)を選んで少数の文字セットだけで判定することも可能である。
【0064】
その場合、特徴が出やすい文字のためにユーザ判定の精度は向上するが、入力文字がその文字セットの中に入っていないとユーザ判定ができないために保留のケースが増えることとなる。従って、文字認識装置の使用目的に応じて文字セットの内容を調整すればよい。
【0065】
【発明の効果】
以上のように、本発明では、ユーザが特別な操作を行わなくても、装置側でユーザを判定して、ユーザ別に設けられているユーザ辞書を切り換え、また認識誤りが発生した文字パターンを、正解の文字に対するユーザ固有の文字パターンとして、対応するユーザのユーザ辞書に追加登録していく等、複数のユーザが手書き文字を入力する環境であっても、認識回数の増加に伴って各ユーザの手書き文字の認識精度が向上していくという優れた効果を奏する。
【図面の簡単な説明】
【図1】本発明装置の実施の形態1の構成を示すブロック図である。
【図2】本発明装置の実施の形態2の構成を示すブロック図である。
【図3】本発明装置の実施の形態3の構成を示すブロック図である。
【図4】本発明装置の実施の形態4の構成を示すブロック図である。
【図5】辞書の登録状態の概念図である。
【図6】パターン登録手段の構成の一例を示すブロック図である。
【図7】パターン登録手順のフローチャートである。
【図8】ユーザ判定手段の構成の一例を示すブロック図である。
【図9】筆速と筆圧との関係を示すグラフ(その1)である。
【図10】筆速と筆圧との関係を示すグラフ(その2)である。
【図11】ユーザ判定手順のフローチャートである。
【図12】時間カウンタの構成を示すブロック図である。
【図13】標準パターンカウンタの概念図である。
【図14】手書き文字のパターン例及び標準辞書の登録パターン例を示す図である。
【図15】従来の手書き文字認識装置の構成の一例を示すブロック図である。
【符号の説明】
10 入力部
20 辞書照合手段
30 標準辞書
40 ユーザ辞書
50 パターン登録手段
60 ユーザ判定手段
70 辞書選択手段
80 辞書作成手段
90 一時登録辞書
100 時間カウンタ
110 標準パターンカウンタ
Claims (4)
- 手書き文字の入力パターンを、文字別の手書き文字の標準パターンが予め登録されている標準辞書、及び文字別のユーザ固有の手書き文字のパターンが予め登録されている複数のユーザ辞書のパターンと照合し、パターンの類似度が最も高い少なくとも一つの文字候補を認識結果として出力する手書き文字認識装置において、
前記ユーザ辞書がユーザ別に設けられており、
予め定めてあるユーザ識別情報別の、一方の座標軸を筆記速度とし他方の座標軸を筆圧とした2次元座標上に示した筆記速度及び筆圧の関係を示す座標点の分布を近似すべく求められた前記2次元座標上の近似曲線を格納するユーザ照合辞書と、
前記手書き文字の入力パターンと前記ユーザ照合辞書に格納してあるユーザ識別情報別の近似曲線との距離を求め、該ユーザ識別情報別の距離が最小となる値の近似曲線に対応するユーザ識別情報を、筆記しているユーザのユーザ識別情報と判定するユーザ判定手段と、
該ユーザ判定手段の判定結果に基づき、照合に用いるべき前記ユーザに対応するユーザ辞書を、複数のユーザ別のユーザ辞書の中から選択する手段と、
前記ユーザ判定手段が求めた前記類似度が所定の類似度の閾値以下であって、既設のユーザ辞書の中に、照合に用いるべき前記ユーザに対応するユーザ辞書が存在しないと判定した場合、該ユーザのユーザ辞書を新規に作成する手段と、
前記入力パターンから近似曲線を求めて、新規に作成したユーザ辞書に登録する手段と、
前記認識結果である文字候補の類似度が所定の閾値以下であって、前記認識結果に誤りが発生した場合、誤認識した入力パターンを、正解としてユーザにより指定された他の文字に対するユーザ固有の手書き文字のパターンとしてユーザ辞書に登録するパターン登録判定部と、
手書き文字を筆記したユーザの交代を検出するユーザ交代検出手段と、
ユーザの交代を検出した場合、照合に用いるべきユーザ辞書を、前記ユーザ判定手段が判定した交代後のユーザのユーザ辞書に切り換える手段と
を備えたことを特徴とする手書き文字認識装置。 - ユーザを判定できなかった手書き文字の入力パターンを、正解として指定された文字候補に対する不特定ユーザの手書き文字のパターンとして一時的に登録する一時登録辞書をさらに備え、
前記ユーザ判定手段がユーザを判定できない間、一時登録辞書をユーザ辞書として照合に用い、
前記ユーザ判定手段がユーザ辞書が未登録であると判定した時点で、一時登録辞書の登録内容から該ユーザのユーザ辞書を新規に作成し、
前記ユーザ判定手段がユーザを判定した時点で、一時登録辞書の登録内容から該ユーザのユーザ辞書を新規に作成し、
前記ユーザの判定手段がユーザを判定した時点で、一時登録辞書の登録内容を該ユーザのユーザ辞書に追加登録すべくなしたことを特徴とする請求項1に記載の手書き文字認識装置。 - 文字の筆記動作の途切れを検出する手段と、
文字の筆記動作が途切れている時間を計時する計時手段と
をさらに備え、
前記ユーザ交代検出手段は、前記時間が所定時間以内の場合は前記ユーザ判定手段によるユーザ判定を抑止させる一方、前記時間が所定時間を超えた場合は前記ユーザ判定手段によるユーザ判定を行わせるべくなしたことを特徴とする請求項1又は2記載の手書き文字認識装置。 - 前記標準辞書及び/又はユーザ辞書は、1文字に対して複数のパターンを登録することが可能であり、
前記ユーザ判定手段は、
各ユーザの所定数の文字の手書き文字に対して前記複数のパターンのいずれが文字候補として出力されたかの頻度の分布を記憶する手段と、
所定数の文字にて前記複数のパターンのそれぞれが文字候補として出力された頻度を計数する手段と
を備え、
所定数の文字にて各パターンが文字候補として出力された頻度の分布に基づいてユーザを判定すべくなしたことを特徴とする請求項1乃至3のいずれかに記載の手書き文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000356718A JP4334131B2 (ja) | 2000-11-22 | 2000-11-22 | 手書き文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000356718A JP4334131B2 (ja) | 2000-11-22 | 2000-11-22 | 手書き文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002163608A JP2002163608A (ja) | 2002-06-07 |
JP4334131B2 true JP4334131B2 (ja) | 2009-09-30 |
Family
ID=18828902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000356718A Expired - Fee Related JP4334131B2 (ja) | 2000-11-22 | 2000-11-22 | 手書き文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4334131B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002207965A (ja) * | 2001-01-12 | 2002-07-26 | Nippon Digital Kenkyusho:Kk | 帳票又は原稿の文字相等性判定方法、記入者同一性判定方法、文字認識装置及び文字相等性判定プログラム |
US7715629B2 (en) * | 2005-08-29 | 2010-05-11 | Microsoft Corporation | Style aware use of writing input |
JP4817873B2 (ja) * | 2006-02-15 | 2011-11-16 | 三洋電機株式会社 | 文字認識装置及び文字認識プログラム |
JP5080872B2 (ja) * | 2007-06-13 | 2012-11-21 | 富士ゼロックス株式会社 | 採点システム及び採点プログラム |
CN111079490A (zh) * | 2019-05-29 | 2020-04-28 | 广东小天才科技有限公司 | 一种书写字的识别方法及电子设备 |
-
2000
- 2000-11-22 JP JP2000356718A patent/JP4334131B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2002163608A (ja) | 2002-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4787275B2 (ja) | セグメント化ベースの認識 | |
JP3176023B2 (ja) | 手書き入力照合方法および装置 | |
US7885464B2 (en) | Apparatus, method, and program for handwriting recognition | |
US7756335B2 (en) | Handwriting recognition using a graph of segmentation candidates and dictionary search | |
US6694056B1 (en) | Character input apparatus/method and computer-readable storage medium | |
JP3004495B2 (ja) | 手書き記号の認識方法 | |
JP2000353215A (ja) | 文字認識装置および文字認識プログラムを記録した記録媒体 | |
JP2004518198A (ja) | 手書文字を認識するための方法、デバイス及びコンピュータプログラム | |
JPH05324903A (ja) | パターン認識装置 | |
JPH05217025A (ja) | オンライン手書き文字認識装置および方法 | |
JP4334131B2 (ja) | 手書き文字認識装置 | |
US7580573B2 (en) | Segmentation-based recognition | |
JP4686502B2 (ja) | オンライン文字認識装置 | |
US20220375244A1 (en) | Systems and methods for handwriting recognition | |
JP2761679B2 (ja) | オンライン手書き文字認識装置 | |
JP3817281B2 (ja) | 情報処理装置及び方法 | |
JP3066530B2 (ja) | オンライン手書文字認識装置 | |
JP2990716B2 (ja) | 文字認識方法及び文字認識装置 | |
JPH08315139A (ja) | 筆者識別装置及びデータベースの検索制御装置 | |
JPH09147106A (ja) | 筆者識別方法およびその装置 | |
JP2000090203A (ja) | 文字認識方法及びその装置 | |
JPH05174192A (ja) | 文字認識装置 | |
JPH07296105A (ja) | 認識変換装置 | |
JPH1153476A (ja) | 文字認識装置 | |
JP2001344566A (ja) | 手書き文字認識システム、手書き文字認識における異サイズ文字認識方法および記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060518 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080909 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090512 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090602 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090623 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090623 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120703 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120703 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130703 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |