JP4323784B2 - 文字認識方法 - Google Patents

文字認識方法 Download PDF

Info

Publication number
JP4323784B2
JP4323784B2 JP2002350756A JP2002350756A JP4323784B2 JP 4323784 B2 JP4323784 B2 JP 4323784B2 JP 2002350756 A JP2002350756 A JP 2002350756A JP 2002350756 A JP2002350756 A JP 2002350756A JP 4323784 B2 JP4323784 B2 JP 4323784B2
Authority
JP
Japan
Prior art keywords
character
stroke
similar
matching
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002350756A
Other languages
English (en)
Other versions
JP2004185264A5 (ja
JP2004185264A (ja
Inventor
常一 新井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2002350756A priority Critical patent/JP4323784B2/ja
Publication of JP2004185264A publication Critical patent/JP2004185264A/ja
Publication of JP2004185264A5 publication Critical patent/JP2004185264A5/ja
Application granted granted Critical
Publication of JP4323784B2 publication Critical patent/JP4323784B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

【0001】
【発明が属する技術分野】
本発明は、オンラインで入力された手書き文字の軌跡を認識する文字認識方法に関する。
【0002】
【従来の技術】
従来、文字認識装置として、特公平7−113953号(従来例1という。)に記載のオンライン認識のための装置や、特開2000−235621号(従来例2という。)に記載の光学的な認識装置が知られている。
【0003】
従来例1は、入力パターンと標準パターンとの比較により、複数の候補文字パターンを抽出し、候補文字パターン同士の対比から、候補文字パターンの局所的特徴を識別特徴として複数点抽出し、識別特徴に関して距離を算出すると共に累積して入力パターンと比較し、候補文字パターンの中から累積距離の小さいものを認識結果として決定する。
【0004】
従来例2は、可変領域マッチング相対判定手段を用い、入力ストロークデータと辞書パターンの画像データについて、画素単位の排他的論理和を算出し、不一致部分を抽出するマッチングを行っていた。
【0005】
【発明が解決しようとする課題】
従来例1は、全体部分でのマッチング結果に抽出特徴のマッチング結果を累積し、評価しているため、抽出した特徴部分が全体に対して小さい場合、全体的評価結果の影響が顕著となり、認識結果はさほど改善されない。
【0006】
さらに、従来例1は、候補文字パターンの局所的特徴抽出において、平均的特徴点間距離により判断を行っており、特徴点間距離の平均値は、全体に対して局所的部分が占める割合によって変動する。このため、文字によって効果が異なり、全ての文字の認識率向上は困難であった。
【0007】
従来例2の可変領域マッチング相対判定手段は、文字を光学的に入力するため、ストロークの区切れ等の区別は無いため、そのままオンライン認識に適応することは難しい。
【0008】
本発明はこのような従来の問題点を解消すべく創案されたもので、複数の候補文字が抽出され、これら候補文字に類似文字が含まれていたときに、認識率を向上することを目的とする。
【0009】
【課題を解決するための手段】
本発明によれば、文字認識方法に、1乃至複数のストロークで構成される手書き文字を入力する入力ステップと、前記入力された手書き文字を構成する全てのストロークと、認識辞書に格納されている文字の辞書ストロークとのマッチングを行い、複数の候補文字とそれぞれの評価値とを得る第1のマッチングステップと、前記第1のマッチングステップで抽出された複数の候補文字の中に、相互に類似する類似文字が存在するか否か判定する類似文字判定ステップと、前記類似文字判定ステップで相互に類似する類似文字が存在すると判定した場合、当該相互に類似すると判定された類似文字それぞれに対応する辞書ストロークから、相互に類似していない相違ストロークを抽出する相違ストローク抽出ステップと、前記入力された手書き文字を構成するストロークと前記各候補文字の相違ストロークとをマッチングを行い、各相違ストロークの第2評価値を得る第2のマッチングステップと、前記第2のマッチングステップで得た第2評価値に基づいて、前記第1のマッチングステップで得た各候補文字の評価値を補正する第1の補正ステップと、前記各候補文字の各ストロークを定義する座標点同士を比較して相違点を抽出する相違点抽出ステップと、前記相違点の各々につき、入力された手書き文字を構成するストロークにおける対応点と当該相違点との距離に基づいて、各相違点の第3評価値を得る第3のマッチングステップと、前記第3のマッチングステップで得た第3評価値に基づいて、前記第1の補正ステップで補正された各候補文字の評価値を補正する第2の補正ステップと、前記第2の補正ステップで補正された評価値の順に基づいて、前記候補文字を出力する出力ステップとを備える。
【0010】
【発明の実施の形態】
次に、本発明に係る文字認識方法の好適な実施形態を図面に基づいて説明する。
【0011】
[第1の実施形態]
図1は、本発明に係る文字認識方法の第1の実施形態を実施する、携帯情報端末の使用状態を示す図、図2は、図1の携帯情報端末を示すブロック図、図3は、図1の携帯情報端末を示す機能ブロック図、図4は、本発明に係る文字認識方法の第1の実施形態で処理される入力ストロークデータと辞書ストロークデータを示す概念図、図5は、図4の辞書ストロークデータの構成図、図6は、図5の辞書ストロークデータにおける9画文字の辞書ストロークデータを示す表、図7は、図4における、辞書ストロークデータと、入力ストロークデータとのマッチング処理を示す表、図8は、図4における、辞書から抽出した部分ストロークと、入力ストロークデータとの、マッチング処理を示す表、図9は、本発明に係る文字認識方法の第1の実施形態を示すフローチャート、図10は、図7の処理に続く処理を示すフローチャートである。
【0012】
図1および図2において、携帯情報機器1はカメラ部4および表示部2を有し、表示部2には、液晶表示部21と位置座標入力部20が重ねて設けられている。位置座標入力部2に対する入力はペン3等によって行われる。さらに携帯情報機器1は、CPU6(図2)、ROM8(同図)、RAM7(同図)、記録メディア等を差し込むスロット9、パーソナルコンピュータ等の情報機器5と接続するためのUSB等のインターフェイス10を有する。
【0013】
カメラ部4で撮影した画像(以下「撮像画像」という。)は液晶表示部21に表示される。
【0014】
位置座標入力部20においてペン3によって手書きの軌跡データTDを入力でき、軌跡データをそのまま画像(以下「入力画像」という。)として記録し、あるいは軌跡データTDを文字認識してテキストデータとして記録し得る。入力画像として記録する場合、カメラ部4で撮影した画像に付加するメモ情報等を生成し得る。
【0015】
ROM8には、CCDの制御プログラム、液晶表示部の制御プログラム等が記憶され、さらに、軌跡データTDの認識プログラム、軌跡データTDのための辞書ストロークデータ等の処理手順および必要なデータが記憶されている。すなわち本実施形態の文字認識方法はROM8に格納されたプログラムによって実行される。
【0016】
RAM7には、撮像画像や入力画像の画像データ、およびメモ情報等が記憶され、またプログラムのワーク領域として使われる。
【0017】
画像データはユーザの指示操作によって、USBインターフェイス10から、パーソナルコンピュータ5へ送られ、あるいは記録メディアI/F9(図2)にセットされる記録メディアを介してパーソナルコンピュータ5やプリンター(図示省略)に送られる。
【0018】
パーソナルコンピュータ5は、携帯情報機器1からUSBインターフェイス10を介して伝送された手書き軌跡データTDや、画像データを定められた処理手順で処理する。
【0019】
記録メディアは、例えば、画像データ等を記憶し得るコンパックトフラッシュカードであり、記憶メディアI/F9は、コンパクトフラッシュカードのインターフェイス部である。コンパクトフラッシュカードはカメラ等で一般的であり、差し込まれたコンパックトフラッシュカードのデータ読書が可能である。
【0020】
位置座標入力部20は液晶表示部21表面に貼り付けられた透明抵抗膜デジタイザであり、その表示画面上を3のペンで押圧することにより軌跡データTDを入力することができる。ペン3は、軌跡データTDの入力のみならず、液晶表示部2に表示されるソフトボタン等の入力にも利用される。
【0021】
位置座標入力部20は制御回路(図示省略)を介して、システムバス11に接続され、システムバス11経由でCPU6に接続されている。ペン3を使って、位置座標入力部20を押圧することにより、押圧した位置の位置座標データがCPU6によって読み取られる。認識すべき文字を入力した場合、読み取られた位置座標データは、RAM7に記憶され、ROM8内の処理手順に従って、手書き軌跡の辞書ストロークデータとのマッチング処理等が実行される。
【0022】
カメラ部4は、レンズ41、CCD42等の撮像素子で構成されたデジタルカメラである。CCD42は制御回路(図示省略)によって制御され、制御回路はシステムバス11経由でCPU6に接続されている。CCD42は、CPU6によって制御され、撮像画像はRAM7に記憶される。
【0023】
表示部2は液晶表示部21と表示制御部3−8とを備え、軌跡データTDは表示制御部3−8内のVRAM(図示省略)に書き込まれて、液晶表示部21に表示する。表示部2は、システムバス11経由でCPU6に接続され、CPU6からの指示で、画像データや軌跡データTDを表示する。
【0024】
CPU6は、システムバス11を介して、RAM7、ROM8、位置座標入力部20、表示部2等と接続されており、ROM8に記憶されているプログラムよって処理動作を行う。
【0025】
USBインターフェイス部10は、CPU6によって制御され、パーソナルコンピュータ5と、軌跡データTDや画像データ等のやり取りを行う。
【0026】
図3において、文字認識処理は以下の処理により実行される。
【0027】
まず、位置座標入力部20において、ペン3で押圧した位置の位置座標が入力され、軌跡データTDにより手書き文字を描くことにより、手書き文字を入力し得る。軌跡データTDは液晶表示部2によって表示される。
【0028】
軌跡データTDを構成する位置座標は、文字切り手段3−1に入力され、1画面分の複数文字の位置座標データを1文字単位に切り分ける処理を行う。文字切り手段3−1は1文字ごとの位置座標を生成する。これは文字認識のための最初の処理である。
【0029】
位置座標入力部20における位置座標入力操作から、文字切り手段3−1の処理開始、すなわち文字認識処理開始までのタイミングは、ユーザの指定によって変更可能である。既定値では、10秒ペンアップが続く(ペン3が位置座標入力部20に接していない時間が10秒間継続したとき)か、他のスイッチ等が押されたときに、文字切り手段3−1に、画面上の位置座標データが送られる。文字切り方法としては、公知の任意の方法を採用し得る。
【0030】
文字切り手段3−1が生成した1文字ごとの位置座標(以下「入力ストロークデータ」という。)は、マッチング手段3−2に入力される。マッチング手段3−2は、文字全体形状に関して、入力ストロークデータと認識辞書3−3の辞書ストロークデータとのマッチングを実行し、辞書ストロークデータとの一致度が高い順に候補を出力する。認識辞書3−3は図2のROM8に格納されている。文字全体形状のマッチングは、各文字の辞書ストロークデータにおける全てのストローク(以下「辞書全ストロークデータ」という。)を使用して行う。
【0031】
マッチング方法としては、特許第3155577号(従来例3という。)等に記載の公知の方法を採用し得る。従来例3では、入力ストロークデータの始点終点位置座標と、辞書ストロークデータの位置座標間の距離を計算して、入力全ストロークの一致度を判定する。入力文字画数と同一画数の辞書ストロークデータとのマッチングを行って、一番類似している辞書ストロークデータから順に、文字認識の候補文字として出力する。
【0032】
認識辞書3−3の辞書ストロークデータには、各文字の文字コードと、各文字を構成するストロークの形状データが登録されている。
【0033】
マッチング手段3−2で抽出された1個または複数の候補文字は、候補列の評価手段3−4に入力される。候補列の評価手段3−4は候補文字における一致度第1位の候補文字と第2位の候補文字を、その評価値の差分等で評価する。
【0034】
評価の結果、候補文字が認識結果となる可能性が高ければ、候補文字をそのまま認識結果の表示制御手段3−8に出力し、表示部2において表示する。候補文字が認識結果となる可能性が低ければ、部分辞書作成手段3−5および候補列の補正手段3−7に候補文字を送りストローク部分データの抽出を行う。
【0035】
部分辞書作成手段3−5は、候補文字の辞書ストロークデータを認識辞書3−3から読み出し、読み出した辞書ストロークデータのストロークを比較する。比較の結果、ストロークが類似している辞書ストロークデータを削除し、ストロークが異なる部分ストロークのみを抽出し、これら部分ストロークのみよりなる部分辞書を生成する。
【0036】
部分辞書作成手段3−5で抽出された部分ストロークは、部分辞書データとのマッチング手段3−6に入力され、マッチング手段3−6は、部分辞書の部分ストロークのデータと、入力ストロークデータとのマッチング処理を行う。
【0037】
候補列の補正手段3−7は、評価手段3−4の評価結果に基づき、候補文字の一致度順位を修正する。
【0038】
認識結果の表示制御手段3−8は、候補列の評価手段3−4または候補列の補正手段3−7から送られてくる候補文字を表示部2に表示する。
【0039】
図4において、入力ストロークデータAと、辞書ストロークデータB、Cの例が示されており、入力ストロークデータAは、手書きの入力文字「湯」である。
【0040】
辞書ストロークデータBは、入力ストロークデータAが入力された時に、3−2の文字全体形状とのマッチング手段3−2から出力される候補文字の第1位の例であり、「場」の文字が抽出されている。辞書ストロークデータCは、候補文字の第2位の例であり、「湯」が抽出されている。
【0041】
辞書ストロークデータB、Cは部分辞書作成手段3−5によって比較され、共通ストロークが削除される。その結果、辞書ストロークデータBの「土偏」が部分辞書の部分ストロークDとして抽出され、辞書ストロークデータCの「三水」が部分辞書の部分ストロークEとして抽出される。
【0042】
部分辞書ストロークデータとのマッチング手段3−6によって、部分ストロークデータD、Eと、入力ストロークデータAとのマッチング処理を行い、マッチング結果を修正し、第1位の候補文字Fを抽出する。
【0043】
図7の表では、列方向に入力ストロークデータをストローク順に配列し、行方向に辞書ストロークデータをストローク順に配列している。入力ストロークデータと辞書ストロークデータとの、マッチング処理に際しては、まず、入力筆順(ストローク順)を比較する。入力ストロークデータAの筆順はユーザの自由とし、入力筆順と、辞書ストロークデータのストローク順との一致度を求める。例えば、入力ストロークデータが入力ストローク1〜入力ストローク9の筆順で描かれたとする。図7の○印は、入力筆順に最も類似していた辞書ストロークデータを示している。
【0044】
図8の表では、列方向に入力ストロークデータのストローク順を配列し、行方向に辞書ストロークデータにおける部分ストロークを配列し、ストローク順を示している。部分辞書ストロークデータとのマッチング手段3−6は、入力ストローク1〜入力ストローク9のうち入力ストローク4〜入力ストローク9はストロークが類似していると判断し、マッチング処理から削除する。図8の○印は、入力ストローク1〜入力ストローク3についてのみ、部分辞書の部分ストロークと比較し、部分ストローク1〜部分ストローク3の組合せが、最も類似することを示している。
【0045】
図9は、文字認識における辞書全ストロークとのマッチング手段3−2および候補列の評価手段3−3に相当する。その処理は以下のステップにより実行される。
【0046】
ステップS7−1:位置座標入力部20に入力され、文字切り手段3−1で切り出された、1文字の入力ストロークデータについて、認識辞書3−3を用いて認識処理を開始する。このとき、認識辞書3−3の辞書ストロークデータを順次読み込むための辞書インデックスを初期化する。
【0047】
ユーザは、位置座標入力部20の文字枠25内にペンで手書き文字を入力し、認識開始ボタンを押す等の処理、あるいは、ペンアップからの経過時間で、認識を開始する。認識開始に先立って、入力ストロークの記憶領域等の初期化を行う。
【0048】
1文字の入力ストロークデータ(筆跡データ)は、入力ストロークの時系列XY座標データ列と、ペンアップ時のストロークの区切りコード等で構成されている。
【0049】
ステップS7−2:入力文字の画数と同一画数の辞書ストロークデータを読み込む。認識辞書3−3との比較においては、入力筆順(ストローク順)を自由とし、画数は辞書に登録してある画数とする。文字の画数は、同一文字であっても略字等おいて大幅に変化するので、多くの人が実際に書く略字を含む文字を多数登録しておく。なお、続け字については、例えば、所定長よりも長い部分ストロークであって、変曲点が存在するものついては、その変曲点で、部分ストロークを分断することにより、辞書に登録された画数に対応させることが可能である。
【0050】
図5において、認識辞書3−3には、1画の辞書ストロークデータを先頭に、2画の辞書ストロークデータ、3画の辞書ストロークデータと順に記憶されている。各画数の辞書ストロークデータの先頭にはヘッダー部が設けられ、各画数について、辞書ストロークデータの先頭位置(ポインタ)、および辞書ストロークデータの個数が記憶されている。入力筆数が例えば、9筆のとき、9画の辞書ストロークデータの先頭アドレスをヘッダー部から読み出し、そのアドレスを元に、9画の辞書ストロークデータを読み込む。
【0051】
図6において、例えば、9画の辞書ストロークデータにおいて、1文字分の辞書ストロークデータには、文字コード(例えばJISコード)と、1番目から9番目までのストロークの始点終点のXY座標データが含まれる。9番目の始点終点のXY座標データに続いて、次の辞書ストロークデータの文字コードが記憶される。ヘッダー部には、辞書ストロークデータの個数が登録され、辞書ストロークデータ個数に1個の辞書ストロークデータのデータ長を乗ずれば、各画数の辞書ストロークデータの終端を検出し得る。
【0052】
認識辞書3−3における辞書ストロークデータの追加を可能とする場合には、画像メディアに辞書ストロークデータを記録し、画像メディアを図2の画像メディアI/F9に接続し、辞書ストロークデータをRAM7に読み込む等の構成を採用し得る。
【0053】
辞書ストロークデータは、複数のサンプルの平均値が採用される。始点終点の座標は正規化され、例えばXY座標の最小値を0、最大値を100とする。
【0054】
入力ストロークデータの最大X座標=maxISx、入力ストロークデータの最小X座標=minISx、入力ストロークデータの最大Y座標=maxISy、入力ストロークデータの最小Y座標=minISy、正規化されたX座標Nx、正規化されたY座標Nyとすると、正規化の方式は、式(1)〜式(4)で表現される。
【0055】
【数1】
Figure 0004323784
【0056】
第1の実施形態では、各ストロークの始点終点のXY座標のみに注目しているが、ストロークの中間点の座標点を併せて参照し認識処理を行ってもよい。
【0057】
ステップS7−3:1文字分の辞書ストロークデータを読み込む。認識辞書の文字コードと、ストロークの始点終点のXY座標データを記憶領域に読み込む。例えば、入力筆数が9筆であれば、9画の辞書の、文字コード1について、ストローク1からストローク9までの始点終点のXY座標データを読み込む。
【0058】
ステップS7−4:入力ストロークデータと辞書ストロークデータの一番近い組合せを見つける処理を行う。図7のマトリックス表において、入力ストロークデータの1筆目のストロークの始点終点座標と、辞書ストロークデータ1の始点終点座標との距離(以下「ストローク距離」という。)を順次算出する。辞書ストロークデータ1から、ストロークデータ1との距離が最も小さい組合せ抽出し、入力ストロークデータ1とする。同様に、入力ストロークデータの2筆目〜9筆目について、辞書ストロークデータとの距離が最も小さい組合せを抽出する。図7では、1筆目〜9筆目のストロークにおいて最も距離が小さい組合せを○印で示している。
【0059】
ステップS7−5:距離最小の組合せの辞書ストロークデータについて、入力ストロークデータとのストローク距離を積算する。すなわち各ストロークの始点間距離の和と終点距離の和を加算する。
【0060】
ここで、入力ストロークデータk筆目のストロークの始点、終点を(XIks,YIks)、(XIke,YIke)、認識辞書3−3におけるj番目の辞書ストロークデータk筆目のストロークの始点、終点を(XDjks,YDjks)、(XDjke,YDjke)とすると、k筆目のストロークのストローク距離Dk、および認識評価値REは、それぞれ式(5)、(6)で算出される。
【0061】
【数2】
Figure 0004323784
【0062】
ストローク距離Dkは、辞書ストロークデータと、入力ストロークデータの始点、終点座標が同一ならば0となる。認識評価値REは、辞書ストロークデータと、入力ストロークデータの始点、終点座標が全て同一ならば0となり、それが一致度に関する最高得点となる。
【0063】
ステップS7−6:ステップ7−5において算出した認識評価値REの高い順に、RAM7の候補記憶領域(図示省略)に、辞書ストロークデータの文字コードと、認識評価値REを順次格納する。新たに、候補文字となる辞書ストロークデータに関する演算を実行したときには、文字コードと、認識評価値REを、候補記憶領域に記憶して、さらに認識評価値REの少ない順に候補文字をソートする。
【0064】
認識評価値REが同一の辞書ストロークデータは、文字コード順にならべる。なお、同一形状の文字でなければ認識評価値REは同一とならないので、認識評価値REが同一の辞書ストロークデータが抽出される可能性は低い。
【0065】
ステップ7−7:未処理の辞書ストロークデータがあるかどうかを判断する。未処理の辞書ストロークデータが存在する場合は、辞書インデックスのカウンタを1加算して、ステップS7−3に戻り、次の辞書ストロークデータの1文字分データを読み込む。全ての辞書ストロークデータの処理が終了したら、ステップS7−8に進む。
【0066】
辞書ストロークデータ個数は、各画数の辞書ストロークデータの先頭にあるヘッダー部に記録されているので、処理済の辞書ストロークデータをカウントし、このカウント値を辞書ストロークデータ個数とを比較すれば判定し得る。
【0067】
ステップS7−1〜ステップS7−7の処理は、従来例3等に記載の公知の認識マッチング処理であり、文字全体形状とのマッチング手段3−2に相当する。
【0068】
ステップS7−8:ステップS7−1〜ステップS7−7の処理によって抽出された上位の候補文字、例えば第1位、第2位、第3位の文字について、これらの候補文字が類似文字か否かを判断する。
【0069】
ここで言う類似文字とは、例えば「場」、「湯」、「揚」等のように、同一画数(これら文字は12画である。)であって、共通部分が9画(比率にして9/12=75%)を占め、全体的に見て似通った文字である。
【0070】
この様な文字の場合、全体の形状が類似するため誤認識が生じ易く、例えば「湯」を手書き入力したときに、第1位の候補が「場」、第2位の候補が「湯」というように、逆転した順位になってしまうことがある。
【0071】
第1位の候補文字と第2位候補文字の認識評価値REの差が所定の閾値以下のときは、両者を類似文字と判定し、ステップS7−10の部分辞書作成処理に進む。第1位の候補文字と第2位候補文字の認識評価値REの差が所定の閾値より大きいときは、類似文字ではなく、正しく認識された可能性が高いので、ステップS7−9の通常の候補文字表示に進む。ステップS7−8の処理は、図3の候補列の評価手段3−4に相当する。
【0072】
辞書ストロークデータによっては、各辞書ストロークデータの共通部分の座標値が微妙にずれていることがあり、一致度の差が閾値以上になる可能性がある。この場合、「類似文字コードテーブル」に基づいて類似文字か否かを判断し得る。すなわち、相互に類似文字の関係にある文字の文字コードを示す「類似文字コードテーブル」をあらかじめ生成しておき、候補文字が抽出されたときに、その第1位、第2位の候補文字を類似文字コードテーブルで参照する。
【0073】
類似文字コードテーブルによって類似文字であることが分かったときは、類似文字として、ステップS7−10に進む。
【0074】
認識評価値REの差が閾値以上の候補文字で、類似文字コードテーブルによって類似文字でないことが判明したときは、正しく認識された可能性が高いので、ステップS7−9の通常の候補文字表示に進む。
【0075】
この類似文字コードテーブルの処理は、作成した認識辞書によっては、必ずしも必要な処理ではないので、場合によっては省略可能である。
【0076】
ステップS7−9:公知の認識処理の候補文字表示を行う。第1位の候補文字を画面上に表示し、次候補表示ボタン等が押下されたら、次候補を表示し、ユーザの選択指示によって候補文字の表示を入れ替える。
【0077】
ステップS7−10:部分辞書作成処理に進む、詳細は図10のフローチャートに沿って説明するが、入力された文字に類似文字が存在し、文字全体形状の認識では誤認識の確率が高い場合はより局所的な相違点に注目する。
【0078】
ステップS8−1:部分辞書作成処理を開始する。RAM7のワーク領域等の初期化を行い、図3の候補列の評価手段3−4から送られてくる認識結果の候補文字の文字コードに基づいて、部分辞書作成の処理を開始する。
【0079】
ステップS8−2:候補文字の類似文字について、辞書ストロークデータを読み込む。すなわち、ステップS7ー8で類似文字と判定した候補文字の辞書ストロークデータを認識辞書3−3から読み出す。
【0080】
ステップS8−3:相互に類似文字の関係にある候補文字の、辞書ストロークデータにおける、類似のストロークを検出する。
【0081】
例えば、図4において、第1位の候補が「場」、第2位の候補が「湯」のとき、「場」の辞書ストロークデータBの各ストロークと、「湯」の辞書ストロークデータCの各ストロークについて、始点終点距離が最小のストロークの組合せを見つける。
【0082】
すなわち、データBのストローク1の始点終点XY座標と、データCストローク1の始点終点XY座標の距離を計算し、次に、データBのストローク1の始点終点XY座標とデータCストローク2の始点終点XY座標の距離を計算するというように、データCの全てのストロークとデータBのストローク1との距離を計算して、データBのストローク1との距離が最小のストロークをデータCから抽出する。データBのストローク2以下についても同様の処理を行い、データBの全てのストロークとデータCの全てのストロークとの組合せについて、最小距離のストロークの組合せを抽出する。
【0083】
ステップS8−4:ステップS8−3で抽出したストロークの組合せについて、式(5)の距離を算出する。
【0084】
ステップS8−5:ステップS8−4で算出された距離に基づいて、ステップS8−3で抽出したストロークの組合せのうち、距離が所定閾値以下のストロークを削除する。
【0085】
同一位置の同一ストロークの距離は0であり、ストローク距離が所定閾値以下であれば、共通ストローク(共通部分)と判断し得る。共通部分は文字候補を絞り込む上では無用であるので、認識処理対象から除外する。これによって、データBとデータCの局所的相違部分が顕著になる。
【0086】
ステップS8−6:ステップS8−5において削除すべきストロークが存在しなかった場合などの補正を行う。補正方法としては例えば以下の3種がある。
【0087】
[辞書の補正]
認識辞書3−3にあらかじめ登録された辞書ストロークデータ(標準辞書という。)が正確に生成されていなかった場合、その補正を可能とする。また、ユーザ辞書(ユーザ登録モードを設け、ユーザに登録したい文字を書いてもらい、それを通常の文字認識処理と同様の処理で特徴抽出し、登録した辞書)の文字形状が標準辞書の形状と異なる場合、その補正を可能とする。
【0088】
[閾値の補正]
閾値の範囲を広げて、ステップS8−5と同様に削除ストロークを検索する処理を行う。すなわち閾値を補正する。
【0089】
[共通部分抽出処理の補正]
閾値を変化させても、共通部分の抽出が出来ない場合、対象の文字コードから文字形状指定の処理により、共通部分の削除を行う。例えば、文字「謀」、「諜」は、言偏および右側下部の「木」が共通であり、これら共通部分を削除すべきである。このように複雑な共通部分抽出について、文字形状ごとに共通部分抽出プログラムを予め設けておき、ユーザの指定により共通部分抽出プログラムを選択する。認識結果に対する候補修正指示のタイミングを設定し、ユーザが、候補文字を類似文字と判断したときに、候補文字の文字コードを登録する。次回の同一文字の認識に際して、再び候補文字にその文字が含まれれば、補正を行う。
【0090】
ステップS8−7:ステップS8−5で共通ストロークを除去した後の、各候補文字における各ストロークの始点終点座標を、文字コードとともに記憶する。
【0091】
ステップS8−8:共通ストロークを除去した後の候補文字における各ストロークと、それに対応した入力ストロークデータのストロークについて、始点終点距離を算出し、より局部的な相違に基づく一致度を算出する。
【0092】
図4では、辞書ストロークデータB「場」の部分ストロークD「土」と、入力ストロークデータ「湯」の共通部分を除いた部分パターンとについて、始点終点の距離の計算を行う。次に辞書ストロークデータC「湯」の部分ストロークC「三水」と、入力ストロ−クデータ「湯」の共通部分を除いた部分パターンとについて、始点終点の距離の計算を行う。
【0093】
ステップS8−9:ステップS8−8において、計算した部分パターンによる距離の値によって、候補文字の順番を補正する。例えば、「湯」の入力ストロークデータAに対して、ステップS7−8で出力した候補文字が「場」、「湯」、「陽」、「揚」であり、文字全体形状の評価において、始点終点距離が閾値以下の候補が、「場」および「揚」だったとき、ステップS8−8におけるストローク部分辞書による一致度判定結果に基づき候補文字の順位を変更する。
【0094】
ステップS8−8におけるストローク部分辞書による一致度判定結果において、「場」よりも「湯」の部分パターンの方が距離が小さいと判明したときは、候補文字の順位を、第1位「湯」、第2位「場」、第3位「陽」、第4位「揚」に変更する。
【0095】
候補文字の順位は、例えば第1位を100、第2位を90、第3位を80等の規定勾配の評価値に変更する。あるいは、「場」を「陽」、「揚」のマッチング結果の差と同等の差になるように変更する等の方法がある。これにより、第1位の候補として「湯」が表示画面上に表示される。
【0096】
本実施形態の文字認識方法、および同方法を実施する文字認識装置においては、類似文字が存在する文字が入力された場合でも、文字全体形状とのマッチング結果で類似文字があると判断した場合に、認識辞書から部分辞書を作成し、その部分辞書とのマッチング結果により、認識候補順位を補正するので、候補文字に類似文字が含まれた際の認識率を高めることができる。
また、認識辞書から動的に部分辞書を作成するので、認識辞書が、標準辞書とユーザ辞書の2つの辞書構成等で、1つの辞書が時間経過毎に変更する構成についても適応可能である。
[第2の実施形態]
次に、本発明に係る文字認識方法の第2の実施形態を図面に基づいて説明する。図11は、本発明に係る文字認識方法の第2の実施形態を実施する、携帯情報端末を示す機能ブロック図、図12は、図9の入力ストロークデータと辞書ストロークデータとの、マッチング処理を表したマトリックスの表、図13は、図12のデータで注目しているストロークのデータを示す図、図14は、本発明に係る文字認識方法の第2の実施形態を示すフローチャート、図15は、図14の処理に続く処理を示すフローチャートである。図中、第1の実施形態と同一もしくは相当部分には同一符号を付す。
第1の実施形態では、漢字等の高画数文字認識時の類似文字問題を解決する方法を説明してきた。しかし、平仮名等の低画数の類似文字、例えば、「わ」、「れ」「ね」などの場合は、1つのストロークの部分的形状特徴によって文字を識別する必要がある。入力ストロークデータの全体形状のみのマッチング処理では、「わ」を入力した場合に、認識結果が「れ」になってしまうこともある。従来は、このような場合、類似文字群1つに対して、複数の識別関数を作成して対応していた。そのような構成だと、認識辞書の変更や、認識対象文字の追加に際して、識別関数の追加や変更を要し、操作が繁雑であった。
本実施形態は、第1の実施形態における図3の処理構成を、図11の処理構成に変更することによって、低画数の類似文字識別に対応する。
図11は、処理構成図であり、符号2−1、2−2、3−1、3−2、3−3、3−4、3−5、3−6、3−7、3−8は、図3に関連して説明した処理手段なので、説明を省く。
部分辞書ストロークデータとのマッチング手段3−6において、部分辞書ストロークデータと、入力ストロークデータとのマッチング処理によって、マッチング結果を修正して得られた第1位の候補文字は、ストロークの一部とのマッチング手段9−1に入力される。
【0097】
一方、部分辞書作成手段3−5において抽出された、ストロークが異なる部分ストロークは、マッチング手段3−6およびストローク部分辞書作成手段9−2に入力される。
【0098】
マッチング手段9−1は、ストローク部分辞書作成手段9−2で作成された部分ストロークと入力ストロークデータの座標点とのマッチング処理を行う。マッチング手段9−1の処理結果は候補列の補正手段3−7に入力される。
ストローク部分辞書作成手段9−2は、各候補文字の各部分ストロークの座標点位置を比較することにより、個々のストローク内の共通座標点を省き、相違点を抽出して、ストローク部分辞書を作成する。
図12において、入力ストロークデータGと、第1位〜第3位の候補文字H、I、Jの例を示す。入力ストロークデータGは手書き文字「ね」であり、候補文字はH「わ」、I「ね」、J「れ」である。
候補文字H、I、Jは、入力ストロークデータGに対して、辞書全ストロークとのマッチング手段3−2によって抽出される。
ストローク部分辞書作成手段9−2は、候補文字H、I、Jの辞書ストロークデータを相互に比較し、ストロークの共通部分を削除して、相違する部分ストロークを抽出する。
【0099】
候補列の補正手段3−7は、マッチング手段9−1および候補列の評価手段3−4の出力に基づいて、第1位の候補をH「わ」からN「ね」(当初第2位の候補文字I)に補正する。
図13において、平仮名などの低画数文字の辞書ストロークデータは、1ストロークを9等分する10点の座標点で定義されており、図13ではH「わ」、I「ね」、J「れ」の座標点が示されている。
【0100】
H「わ」における辞書ストロークデータの始点をH−1、第2点をH−2、.....、終点をH10とし、I「ね」における辞書ストロークデータの始点I−1、第2点目をI−2、…終点をI−10とし、J「れ」の辞書ストロークデータの始点をJ−1、第2点目をJ−2、…終点をJ−10とする。
図14において、図11のストローク部分辞書作成手段9−2に相当する処理は以下のステップにより実行される。図14の処理では、文字全体形状とのマッチング手段3−2の結果に基づいて、候補列の評価手段3−4によって、類似文字として送られてきた候補文字の辞書ストロークデータから、ストローク部分データを作成する。
【0101】
ステップS12−1:ストローク部分データを作成する処理を開始する。ストローク部分データ作成のための、座標点のインデックスアドレス、辞書ストロークデータ読み込みバッファやワーク等の初期化を行う。
ステップS12−2:候補文字の辞書ストロークデータにおける形状的に相違のあるストロークを読み込む。候補文字の文字コードから、辞書ストロークデータを検索し、検索した辞書ストロークデータの中で、形状的に相互に差があるストロークを検出する。形状の差は、座標点の位置差に基づいて検出する。候補文字H「わ」、I「ね」、J「れ」では、1筆目の縦線は大体同一形状であるので2筆目のストロークを読み込む。
ステップS12−3:対応ストローク上の対応座標点同士の距離を計算する。ストロークの同一形状部分の座標点は、大体同一位置に存在するので、距離が小さい。
例えば、候補文字Hの始点を(H1x,H1y)、候補文字Iの始点を(I1x,I1y)、候補文字Jの始点を(J1x,J1y)とすると、これら始点の距離は、式(7)で算出される。
【0102】
【数3】
Figure 0004323784
【0103】
となる。
ステップS12−4:ステップS12−3で算出した距離が誤差範囲以上なら、ストローク部分データとして記憶する。距離が0に近ければ、その部分は共通部分(同一点)と考えられるので、共通部分を削除する。文字入力時や、辞書作成時にストロークデータは正規化され、文字サイズは例えば(100×100)であるので、共通部分の座標点は大体同一である。誤差範囲と評価する閾値は、認識辞書ごとに所定値に設定する。
ステップS12−5:次の座標点に進めるために、座標点のインデックスアドレスを1つ進める。これによって、順次ストロークの始点から終点までをチェックしていく。
ステップS12−6:ストロークの終点まで、処理が終了したか否かのチェックを行う。処理が終了していなければ、ステップS12ー3に戻り、次の座標点の距離計算を行い、終点まで距離計算が終了していれば、ステップS12−7へ進む。
ステップS12−7:抽出したストローク部分データを次の処理手段へ出力する。
図13の「わ」、「ね」、「れ」の例において、「わ」のストローク部分データとして、H−7、H−8、H−9、H−10の各点が出力され、「ね」のストローク部分データとして、I−7、I−8、I−9、I−10の各点が出力され、「れ」のストローク部分データとして、J−7、J−8、J−9、J−10の各点が出力される。
ステップS12ー8:処理を終了する。
図15は、図11のストロークの一部とのマッチング手段9−1に相当する処理であり、以下の各ステップにより実行される。
ステップS13−1:ストローク部分データとのマッチング処理を開始する。以下の処理で、図14のフローチャートで抽出したストローク部分辞書のストローク部分データと、入力ストロークデータとのマッチングを実行するが、その前に、マッチング処理用のワークバッファ等の初期化を行う。
ステップS13−2:1個のストローク部分辞書のデータをマッチング用のバッファに読み込む。1個のストローク部分辞書のデータは、文字コードと、ステップS12−7で抽出したストロークの一部の座標点と、その座標点がストロークのどの部分であるかを示すインデックスとよりなる。
ステップS13−3:ストローク部分辞書のストローク部分データの座標点と入力ストロークデータの座標点との距離計算を行う。すなわち、ストローク部分辞書におけるストローク部分データの座標点と、入力ストロークデータの同一インデックス座標点との距離を計算する。
【0104】
例えば、ストローク部分データの座標点が始点から7番目の座標点H−7なら、入力ストロークデータについて、始点から7番目の座標点に注目し、両者の距離を計算する。このステップで順次、座標点間の距離を計算する。
ステップS13−4:ステップS13−3で計算した距離を加算しする。全てのストローク部分辞書のストローク部分データの座標点と入力ストロークデータの座標点との距離の積算値を算出し、この積算値を一致度とする。
ステップS13−5:ストローク部分データの次の座標点に移動する。すなわち、読み込んでいるストローク部分辞書のインデックスを1加算して、次の座標点を読み込む。
ステップS13−6:ステップS13−2で読み込んだストローク部分データの全ての座標点の計算が終わったか否かチェックする。終了していれば、ステップS13−7に進み、未処理の座標点があれば、ステップS13−3に戻って、次の座標点の処理を行う。
ステップS13ー7:文字コードと、ストローク部分データとの距離(一致度)を、距離が小さい順に候補記憶領域に記憶する。辞書ストロークデータと入力ストロークデータが完全に同一であれば、座標点間の距離は0になり、位置や形状が異なれば異なるほど、距離は大きくなる。
ステップS13−8:次のストローク部分データに進む処理を行う。ストローク部分辞書のストローク部分データのインデックスを1加算して、次のストローク部分データに進む。
ステップS13−9:ストローク部分辞書の全データの処理を終了したか否かをチェックする。全てのデータの処理が終了していれば、一致度が最も高い文字コードを第1位の候補として出力して、処理を終了する。未処理のデータが存在すれば、ステップS13−2に戻る。
本実施形態によれば、平仮名等の低画数文字の認識時に、ストロークの一部の特徴のみが異なる類似文字を識別が可能である。
ストロークの一部のみを抽出して認識処理の補正を行う処理は、低画数文字のみに限定するものではなく、高画数文字についても、対象となる類似文字によっては有効である。
【0105】
また本発明の趣旨と範囲は、本発明の特定の説明と図に限定されるものではなく、本願特許請求の範囲に述べられた内容の様々な修正および変更に及ぶことは当業者にとって理解されるであろう。
上述した本発明の第1実施形態及び第2実施形態の特徴を以下に総括する。
[実施態様1] 手書き入力文字を位置座標のデータに変換し、入力ストロークデータを生成する入力ステップと、前記入力ストロークデータと、文字全体形状の辞書ストロークデータとをマッチングを行い、候補文字を抽出し、評価する全体形状マッチングステップと、前記候補文字に相互に類似する類似文字が存在するか否か判定する類似文字抽出ステップと、前記類似文字について、辞書ストロークデータにおける、相互に類似していない相違部分を抽出する相違部分抽出ステップと、前記入力ストロークデータと前記各候補文字の相違部分とをマッチングし、評価する相違部分マッチングステップと、前記相違部分マッチングステップによる候補文字の評価結果に基づいて、全体形状マッチングステップにおける候補文字の評価結果を補正する補正ステップとを備えた文字認識方法。
[実施態様2] 手書き入力文字を位置座標のデータに変換し、入力ストロークデータを生成する入力手段と、前記入力ストロークデータと、文字全体形状の辞書ストロークデータとをマッチングを行い、候補文字を抽出し、評価する全体形状マッチング手段と、前記候補文字に相互に類似する類似文字が存在するか否か判定する類似文字抽出手段と、前記類似文字について、辞書ストロークデータにおける、相互に類似していない相違部分を抽出する相違部分抽出手段と、前記入力ストロークデータと前記各候補文字の相違部分とをマッチングし、評価する相違部分マッチング手段と、前記相違部分マッチングステップによる候補文字の評価結果に基づいて、全体形状マッチングステップにおける候補文字の評価結果を補正する補正手段とを備えた文字認識装置。
【0106】
[実施態様3] 前記類似文字抽出ステップは、前記全体形状マッチングステップで抽出した複数の候補文字に対応する辞書ストロークデータについて、形状が類似するものを類似文字として判断することを特徴とする実施態様1記載の文字認識方法。
【0107】
[実施態様4] 前記相違部分抽出ステップは、対応する個々の辞書ストロークデータの始点相互の距離および終端相互の距離に基づいて相違部分を抽出することを特徴とする実施態様3記載の文字認識方法。
【0108】
[実施態様5] 前記相違部分抽出ステップは、対応する個々の辞書ストロークデータ上における複数の位置座標に基づいて相違部分を抽出することを特徴とする実施態様3記載の文字認識方法。
【0109】
[実施態様6] 前記相違部分抽出ステップは、対応する個々の辞書ストロークデータを複数の部分ストロークに分割し、形状が類似する部分ストローク以外の部分ストロークを前記相違部分として抽出することを特徴とする実施態様1記載の文字認識方法。
【0110】
[実施態様7] 前記相違部分抽出ステップは、対応する部分ストロークの始点相互の距離および終端相互の距離に基づいて相違部分を判断することを特徴とする実施態様6記載の文字認識方法。
【0111】
[実施態様8] 手書き入力文字を位置座標のデータに変換し、入力ストロークデータを生成する入力ステップと、前記入力ストロークデータと、文字全体形状の辞書ストロークデータとをマッチングを行い、候補文字を抽出し、評価する全体形状マッチングステップと、前記候補文字に相互に類似する類似文字が存在するか否か判定する類似文字抽出ステップと、前記類似文字について、辞書ストロークデータにおける、相互に類似していない相違部分を抽出する相違部分抽出ステップと、前記入力ストロークデータと前記各候補文字の相違部分とをマッチングし、評価する相違部分マッチングステップと、前記相違部分マッチングステップによる候補文字の評価結果に基づいて、全体形状マッチングステップにおける候補文字の評価結果を補正する補正ステップと、をコンピュータに実行させるためのコンピュータプログラム。
【0112】
【発明の効果】
本発明によれば、複数の候補文字が抽出され、これら候補文字に類似文字が含まれていたときに、認識率を向上し得る。
【図面の簡単な説明】
【図1】 本発明に係る文字認識方法の第1の実施形態を実施する、携帯情報端末の使用状態を示す図である。
【図2】 図1の携帯情報端末を示すブロック図である。
【図3】 図1の携帯情報端末を示す機能ブロック図である。
【図4】 本発明に係る文字認識方法の第1の実施形態で処理される入力ストロークデータと辞書ストロークデータを示す概念図である。
【図5】 図4の辞書ストロークデータの構成図である。
【図6】 図5の辞書ストロークデータにおける9画文字の辞書ストロークデータを示す表である。
【図7】 図4における、辞書ストロークデータと、入力ストロークデータとのマッチング処理を示す表である。
【図8】 図4における、辞書から抽出した部分ストロークと、入力ストロークデータとの、マッチング処理を示す表である。
【図9】 本発明に係る文字認識方法の第1の実施形態を示すフローチャートである。
【図10】 図7の処理に続く処理を示すフローチャートである。
【図11】 本発明に係る文字認識方法の第2の実施形態を実施する、携帯情報端末を示す機能ブロック図である。
【図12】 図9の入力ストロークデータと辞書ストロークデータとの、マッチング処理を示す表である。
【図13】 図12の辞書ストロークデータで注目しているストロークのデータを示す図である。
【図14】 本発明に係る文字認識方法の第2の実施形態を示すフローチャートである。
【図15】 図14の処理に続く処理を示すフローチャートである。
【符号の説明】
1 携帯情報端末
2−1 位置座標入力部
2−2 画像表示部
3 ペン
4 カメラ部
5 パソコン
6 CPU
7 RAM
8 ROM
9 画像メディアインターフェイス
10 USBインターフェイス
11 システムバス

Claims (7)

  1. 1乃至複数のストロークで構成される手書き文字を入力する入力ステップと、
    前記入力された手書き文字を構成する全てのストロークと、認識辞書に格納されている文字の辞書ストロークとのマッチングを行い、複数の候補文字とそれぞれの評価値とを得る第1のマッチングステップと、
    前記第1のマッチングステップで抽出された複数の候補文字の中に、相互に類似する類似文字が存在するか否か判定する類似文字判定ステップと、
    前記類似文字判定ステップで相互に類似する類似文字が存在すると判定した場合、当該相互に類似すると判定された類似文字それぞれに対応する辞書ストロークから、相互に類似していない相違ストロークを抽出する相違ストローク抽出ステップと、
    前記入力された手書き文字を構成するストロークと前記各候補文字の相違ストロークとをマッチングを行い、各相違ストロークの第2評価値を得る第2のマッチングステップと、
    前記第2のマッチングステップで得た第2評価値に基づいて、前記第1のマッチングステップで得た各候補文字の評価値を補正する第1の補正ステップと、
    前記各候補文字の各ストロークを定義する座標点同士を比較して相違点を抽出する相違点抽出ステップと、
    前記相違点の各々につき、入力された手書き文字を構成するストロークにおける対応点と当該相違点との距離に基づいて、各相違点の第3評価値を得る第3のマッチングステップと、
    前記第3のマッチングステップで得た第3評価値に基づいて、前記第1の補正ステップで補正された各候補文字の評価値を補正する第2の補正ステップと、
    前記第2の補正ステップで補正された評価値の順に基づいて、前記候補文字を出力する出力ステップと、
    を備えた文字認識方法。
  2. 前記類似文字判定ステップで相互に類似する類似文字が存在しないと判定した場合、前記出力ステップでは、前記第1のマッチングステップで得た評価値の順に基づいて、前記候補文字を出力することを特徴とする請求項1記載の文字認識方法。
  3. 前記類似文字判定ステップでは、前記第1のマッチングステップで得た第1位の候補文字の評価値と第2位の候補文字の評価値との差が所定閾値以下の場合に、当該第1位の候補文字と第2位の候補文字とが類似文字であると判定することを請求項1記載の文字認識方法。
  4. 前記類似文字判定ステップでは、相互に類似文字の関係にある文字の文字コードを示す類似文字コードテーブルに基づいて、前記第1のマッチングステップで得た候補文字に類似文字が存在するか否か判定することを請求項1記載の文字認識方法。
  5. 前記相違ストローク抽出ステップでは、前記類似文字それぞれに対応する辞書ストロークそれぞれの始点及び終点に基づいて、前記相違ストロークを抽出することを特徴とする請求項1記載の文字認識方法。
  6. 1乃至複数のストロークで構成される手書き文字を入力する入力手段と、
    前記入力された手書き文字を構成する全てのストロークと、認識辞書に格納されている文字の辞書ストロークとのマッチングを行い、複数の候補文字とそれぞれの評価値とを得る第1のマッチング手段と、
    前記第1のマッチング手段で抽出された複数の候補文字の中に、相互に類似する類似文字が存在するか否か判定する類似文字判定手段と、
    前記類似文字判定手段で相互に類似する類似文字が存在すると判定した場合、当該相互に類似すると判定された類似文字それぞれに対応する辞書ストロークから、相互に類似していない相違ストロークを抽出する相違ストローク抽出手段と、
    前記入力された手書き文字を構成するストロークと前記各候補文字の相違ストロークとをマッチングを行い、各相違ストロークの第2評価値を得る第2のマッチング手段と、
    前記第2のマッチング手段で得た第2評価値に基づいて、前記第1のマッチング手段で得た各候補文字の評価値を補正する補正手段と、
    前記各候補文字の各ストロークを定義する座標点同士を比較して相違点を抽出する相違点抽出手段と、
    前記相違点の各々につき、入力された手書き文字を構成するストロークにおける対応点と当該相違点との距離に基づいて、各相違点の第3評価値を得る第3のマッチング手段と、
    前記第3のマッチング手段で得た第3評価値に基づいて、前記第1の補正手段で補正された各候補文字の評価値を補正する第2の補正手段と、
    前記補正手段で補正された評価値の順に基づいて、前記候補文字を出力する出力手段と、
    を備えた文字認識装置。
  7. 1乃至複数のストロークで構成される手書き文字を入力する入力ステップと、
    前記入力された手書き文字を構成する全てのストロークと、認識辞書に格納されている文字の辞書ストロークとのマッチングを行い、複数の候補文字とそれぞれの評価値とを得る第1のマッチングステップと、
    前記第1のマッチングステップで抽出された複数の候補文字の中に、相互に類似する類似文字が存在するか否か判定する類似文字判定ステップと、
    前記類似文字判定ステップで相互に類似する類似文字が存在すると判定した場合、当該相互に類似すると判定された類似文字それぞれに対応する辞書ストロークから、相互に類似していない相違ストロークを抽出する相違ストローク抽出ステップと、
    前記入力された手書き文字を構成するストロークと前記各候補文字の相違ストロークとをマッチングを行い、各相違ストロークの第2評価値を得る第2のマッチングステップと、
    前記第2のマッチングステップで得た第2評価値に基づいて、前記第1のマッチングステップで得た各候補文字の評価値を補正する第1の補正ステップと、
    前記各候補文字の各ストロークを定義する座標点同士を比較して相違点を抽出する相違点抽出ステップと、
    前記相違点の各々につき、入力された手書き文字を構成するストロークにおける対応点と当該相違点との距離に基づいて、各相違点の第3評価値を得る第3のマッチングステップと、
    前記第3のマッチングステップで得た第3評価値に基づいて、前記第1の補正ステップで補正された各候補文字の評価値を補正する第2の補正ステップと、
    前記第2の補正ステップで補正された評価値の順に基づいて、前記候補文字を出力する出力ステップと、
    の各ステップをコンピュータに実行させるためのコンピュータプログラム。
JP2002350756A 2002-12-03 2002-12-03 文字認識方法 Expired - Fee Related JP4323784B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002350756A JP4323784B2 (ja) 2002-12-03 2002-12-03 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002350756A JP4323784B2 (ja) 2002-12-03 2002-12-03 文字認識方法

Publications (3)

Publication Number Publication Date
JP2004185264A JP2004185264A (ja) 2004-07-02
JP2004185264A5 JP2004185264A5 (ja) 2006-03-09
JP4323784B2 true JP4323784B2 (ja) 2009-09-02

Family

ID=32752865

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002350756A Expired - Fee Related JP4323784B2 (ja) 2002-12-03 2002-12-03 文字認識方法

Country Status (1)

Country Link
JP (1) JP4323784B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5018404B2 (ja) * 2007-11-01 2012-09-05 ソニー株式会社 画像識別装置および画像識別方法、並びに、プログラム
JP6812804B2 (ja) * 2017-01-12 2021-01-13 富士通株式会社 文字認識装置、文字認識プログラム及び文字認識方法
WO2019069617A1 (ja) * 2017-10-05 2019-04-11 日本電気株式会社 個体識別装置
CN111078821B (zh) * 2019-11-27 2023-12-08 泰康保险集团股份有限公司 字典设置方法、装置、介质及电子设备
CN111222590B (zh) * 2019-12-31 2024-04-12 咪咕文化科技有限公司 形近字确定方法、电子设备和计算机可读存储介质

Also Published As

Publication number Publication date
JP2004185264A (ja) 2004-07-02

Similar Documents

Publication Publication Date Title
US10803367B2 (en) Method and apparatus for recognizing characters
TWI321294B (en) Method and device for determining at least one recognition candidate for a handwritten pattern
US7778464B2 (en) Apparatus and method for searching for digital ink query
US10127199B2 (en) Automatic measure of visual similarity between fonts
US7369702B2 (en) Template-based cursive handwriting recognition
JP5294818B2 (ja) 情報処理装置及び情報処理方法
JP2007317022A (ja) 手書文字処理装置及び手書文字処理方法
JP6464504B2 (ja) 電子機器、処理方法およびプログラム
WO2017114002A1 (zh) 一维手写文字输入设备和一维手写文字输入方法
JP4323784B2 (ja) 文字認識方法
JP2007213416A (ja) 手書き文字列検索装置、手書き文字列検索方法及びプログラム
US20030174907A1 (en) Document image processing apparatus for processing line portions manually input to document image, method therefor, and computer readable recording medium recorded with document image processing program therefor
CN103699890B (zh) 一种扫描输入装置及扫描输入方法
JP2016031721A (ja) 検索装置、方法及びプログラム
JP4774200B2 (ja) 文字列領域抽出装置
JP3066530B2 (ja) オンライン手書文字認識装置
CN111767779B (zh) 图像处理方法、装置、设备及计算机可读存储介质
JP2006330873A (ja) 指紋照合装置、方法およびプログラム
TWI386823B (zh) 可攜式無線語文即時辨識翻譯設備及其方法
CN115223210A (zh) 一种端到端的手指三模态特征融合分类方法及装置
JP2824704B2 (ja) 文字認識装置
JPH09106433A (ja) 文字認識処理装置
JP2016110389A (ja) 検索装置、方法及びプログラム
JP2018180746A (ja) 情報処理装置
JPH11134437A (ja) 手書き文字認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051208

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060606

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090602

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090605

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120612

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120612

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130612

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees