JP3221488B2 - 検証機能付きオンライン文字認識装置 - Google Patents

検証機能付きオンライン文字認識装置

Info

Publication number
JP3221488B2
JP3221488B2 JP00581099A JP581099A JP3221488B2 JP 3221488 B2 JP3221488 B2 JP 3221488B2 JP 00581099 A JP00581099 A JP 00581099A JP 581099 A JP581099 A JP 581099A JP 3221488 B2 JP3221488 B2 JP 3221488B2
Authority
JP
Japan
Prior art keywords
feature point
pattern
feature
dictionary
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP00581099A
Other languages
English (en)
Other versions
JP2000207494A (ja
Inventor
祐人 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP00581099A priority Critical patent/JP3221488B2/ja
Publication of JP2000207494A publication Critical patent/JP2000207494A/ja
Application granted granted Critical
Publication of JP3221488B2 publication Critical patent/JP3221488B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、オンライン文字認
識装置に関し、特に、文字の構造を相対位置により検証
するオンライン文字認識装置に関する。
【0002】
【従来の技術】従来、この種のオンライン文字認識装置
は、高精度に文字を認識するために、入力パタンと標準
パタンとの間でストロークまたは特徴点間の対応付けを
行う必要がある。この対応付けでは、手書きの変動に対
しても頑健に認識するために、筆順や画数の制約を課し
たり、標準パタンを入力パタンへの重なりが最大となる
ように適応的整形を加えたりしている。従来のオンライ
ン文字認識方法の一例が、1995年、若原徹他、ストロー
ク単位のアフィン変換を用いたオンライン手書き漢字認
識(電子情報通信学会技術報告書 PRU95-111 pp.49-54)
に記載されている。
【0003】上記技術報告書に記載されているものを初
めとする従来の一般的なオンライン手書き文字認識方法
の例について、図12を用いて説明する。従来の一般的
なオンライン手書き文字認識方法の例では、入力パタン
記憶部31と、前処理部32と、特徴抽出部33と、特
徴点間類似度計算部34と、対応選択部35と、パタン
整合度計算部36と、辞書特徴記憶部37とを備えてい
る。
【0004】入力パタン記憶部31に記憶されている入
力パタンが前処理部32に渡されると、前処理部32
は、入力パタンの位置及び大きさを正規化した入力パタ
ンを生成し、特徴抽出部33に渡す。
【0005】前処理部32から渡された入力パタンから
特徴抽出部33によって特徴点および特徴点の端点や屈
曲点などの属性情報や筆記方向などの特徴が抽出し特徴
点類似度計算部34に渡す。ここで、抽出される特徴は
特徴点以外にストロークに関するものでもよい。
【0006】次に、特徴点類似度計算部34では、特徴
抽出部33で抽出された特徴点の特徴と辞書特徴記憶部
37に記憶されている辞書パタンにおける特徴点の特徴
との間の類似度を計算し、計算された入力パタンと辞書
パタンとの間の特徴点間の類似度を対応点選択部35に
渡す。
【0007】そして、対応点選択部35では、計算され
た類似度に基づいて、入力パタンと辞書特徴記憶部37
に記憶されている辞書パタンとの間の特徴点の対応を決
定し、パタン整合度計算部36に渡す。
【0008】パタン整合度計算部36は、対応点選択部
35で決定した特徴点の対応を基にして、入力パタンと
辞書パタンとの整合度を計算し、整合度の高い字種のパ
タンに対応付けられて記憶されている文字コードを、文
字認識の結果として出力する。
【0009】
【発明が解決しようとする課題】しかし、従来の技術で
は、第1の問題点は、入力パタンと辞書パタンとの間の
特徴点の対応付けにおいて、過度の対応付けによる誤認
識が生じやすいことである。その理由は、入力パタンと
辞書パタンが異なる字種である場合に、そのパタン間の
特徴点の対応付けにおいて、過度の対応付けが生じやす
いのにも関わらず、その考慮が何もなされていないから
である。図9を用いて具体的な例で説明する。図9はひ
らがな「す」の入力パタンとひらがな「ち」の辞書パタ
ンの例で、黒点がパタンの特徴点を表わし、入力パタン
の黒点近くの番号は、辞書パタンに示されている番号の
特徴点に対応したことを示している。図9の例では、対
応した特徴点とその特徴に挟まれる線分だけをみると形
状が似ており、図9のひらがな「す」のような入力パタ
ンは、ひらがな「す」の辞書パタンとの整合度よりも、
図9のひらがな「ち」の辞書パタンとの整合度が高くな
り誤認識を起こすことがある。
【0010】第2の問題点は、過度の整合による誤認識
が生じやすいことである。その理由は、第1の問題点の
理由と同じである。
【0011】そこで、本発明は、過度の対応付けを検証
し、過度の対応付けが起きた辞書パタンとの認識を棄却
する機能を有するオンライン文字認識装置を提供するこ
とを課題としている。
【0012】
【課題を解決するための手段】上記の課題を解決するた
めの本発明の文字認識装置は、特徴点間の相対位置によ
る検証を行ってからパタン整合度の計算を行う。より具
体的には、入力パタンと辞書パタンとの間の特徴点の対
応付けが行われた後に、その対応付けが過度に行われて
いないかを対応付いた特徴点間の相対位置関係から判定
し、過度の対応付けが行われていると判定した場合には
その辞書パタンとの認識を棄却する相対位置検証部と、
辞書パタンの固有の手書き変動等で変化しない安定な特
徴点間の相対位置関係を記憶している辞書特徴記憶部と
を有する。
【0013】すなわち、本発明においては、辞書特徴記
憶部には、記憶されている各辞書パタンにおいて、辞書
パタン毎にすべての特徴点間の相対位置について、手書
き等の変動に影響しない特徴点間の相対位置関係が記憶
されている。相対位置検証部は、入力パタンと辞書パタ
ンとの間の特徴点の対応付けが行われたのち、その対応
付けが過度に行われていないかどうかを判定するため
に、対応付いた入力パタンの特徴点間の相対位置関係と
辞書特徴記憶部に記憶されている相対位置関係との不一
致度を求め、不一致度が大きい場合にその辞書パタンと
の認識を棄却する。
【0014】たとえば、図9に示すように、ひらがな
「ち」の辞書パタンの番号4からみた番号5の特徴点の
相対位置は、手書き等の変動に影響されずX軸に対して
右に安定に存在するといった相対位置関係を予め辞書特
徴記憶部に記憶しておく。対応点選択後に、相対位置検
証部では、対応付いた入力パタン側の番号4の特徴点か
らみた番号5の特徴点の存在位置を辞書特徴記憶部に記
憶されている相対位置関係と比較すると一致していない
ため、ひらがな「ち」の辞書パタンとの認識を棄却し
て、ひらがな「す」の入力パタンと他の辞書パタンの比
較に移行する。
【0015】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して説明する。
【0016】図1を参照すると、本発明の実施の形態
は、入力パタン記憶部11と、前処理部12と、特徴抽
出部13と、特徴点間類似度計算部14と、対応選択部
15と、相対位置検証部16と、パタン整合度計算部1
7と、辞書特徴記憶部18とを備えている。
【0017】入力パタン記憶部11は、ディジタイザ、
原稿走査読取装置などから入力された時系列信号として
手書き文字のパタン(以下、入力パタン)を記憶す
る。
【0018】前処理部12は、プログラム制御によって
動作するCPU(Central Processing Unit)から構成さ
れ、入力パタン記憶部11に記憶されている入力パタン
を受け取り、受け取った入力パタンに対して、その位置
と大きさとを正規化する。
【0019】特徴抽出部13は、プログラム制御によっ
て動作するCPUから構成され、前処理部12で正規化
を施された入力パタンから、端点、屈曲点等の特徴点及
びその特徴点の筆記方向などの特徴を抽出する。
【0020】特徴点間類似度計算部14は、プログラム
制御によって動作するCPUから構成され、特徴抽出部
16で抽出された入力パタンの特徴点と、辞書特徴記憶
部18に記憶されている各字種の特徴点との間の類似度
を計算する。
【0021】対応点選択部15は、プログラム制御によ
って動作するCPUから構成され、特徴点間類似度計算
部14で計算された特徴点間の類似度を基に、整形入力
パタンの特徴点を辞書パタンの特徴点と対応付け、特徴
点の対応情報を生成する。
【0022】相対位置検証部16は、プログラム制御に
よって動作するCPUから構成され、対応点選択部15
で生成された対応情報を基に、辞書特徴記憶部18に記
憶されている各字種の相対位置テーブルとの一致度を求
め、一致度に応じてその字種との認識を棄却するかを判
定する。
【0023】パタン整合度計算部17は、プログラム制
御に動作するCPUから構成され、対応点選択部15で
生成された特徴点の対応情報を基にして、入力パタンと
辞書特徴記憶部18に記憶されている各字種の辞書パタ
ンとのパタン間の整合度を計算し、整合度の高い字種に
対応する文字コードを出力する。
【0024】辞書特徴記憶部18は、被認識対象となる
字種数分のパタン(前述の辞書パタン)、角度特徴、特
徴点、ストロークまたは特徴点の相対位置関係に関する
情報を、それに対応する文字コードに対応付けて、予め
記憶している。
【0025】次に、図1を参照して本実施の形態の動作
について説明する。
【0026】入力デバイスから文字認識の対象となる文
字のパタンが入力されると、その入力パタンは、入力パ
タン記憶部11に記憶される。この入力パタンが入力パ
タン記憶部11から前処理部12に渡されると、前処理
部12は、入力パタンの位置及び大きさを正規化した入
力パタンを生成し、特徴抽出部13に渡す。
【0027】前処理部12から渡された入力パタンか
ら、次に、特徴抽出部13によって端点、屈曲点の特徴
点およびその特徴点の筆記方向などの特徴が抽出され、
さらに辞書特徴記憶部19に記憶されている特徴点との
間の類似度が、特徴点類似度計算部14によって計算さ
れる。そして、計算された類似度に基づいて、対応点選
択部15によって入力パタンと辞書パタンとの特徴点の
対応情報が生成され、相対位置検証部16に渡される。
【0028】対応点選択部15によって生成された対応
情報から、相対位置検証部16によって、辞書特徴記憶
部18に記憶されている各字種の相対位置テーブルとの
一致度を求め、一致度に応じてその字種との認識を棄却
するかを判定し、棄却されなかった字種についての特徴
点の対応情報をパタン整合度計算部17に渡す。
【0029】そして、パタン整合度計算部17は、対応
点選択部15で生成された特徴点の対応情報を基にし
て、入力パタンと相対位置検証部16で棄却されたなか
った辞書パタンとの整合度を計算し、整合度の高い字種
のパタンに対応付けられて記憶されている文字コード
を、文字認識の結果として出力する。
【0030】以下、この実施の形態にかかるオンライン
文字認識装置の動作について、具体的な例に基づいて、
詳細に説明する。
【0031】この例では、入力パタン記憶部11は、1
〜S個のストローク列から構成される入力パタンを記憶
しているものとする。入力パタンに記憶されているスト
ローク列のうちの第i番目ストロークSDiは、1〜Pi 0個の
ポイント列からなり数式4のように表現される。
【0032】
【数4】 ここで、数4の式のPi (0)はi番目ストロークのポイント
数を表し、数4の式のxi,2 (0),yi,2 (0)は第i番目ストロ
ークの第2番目ポイントのx座標,y座標を表す。
【0033】このオンライン文字認識装置では、まず、
入力パタン記憶部11に記憶されている入力パタンは、
前処理部12に供給される。入力パタンが供給される
と、前処理部12は、第1番目のストロークから順にS番
目ストロークを読み出し、各ストロークに対して、入力
パタンの原形をできるだけ保存できるような刻み閾値T
(例えば、文字を記入する際に記入領域を囲む枠サイズ
の20分の1の値)を用いて、第1番目のポイントから
連なる第2番目のポイントまでの線分の長さD1を求め
る。
【0034】長さD1が閾値Tよりも小さければ、前処理
部12は、第2番目のポイントから連なる第3番目のポ
イントまでの線分の長さD2を求め、D=D1+D2が閾値Tより
小さいかを調べる。前処理部12は、このような操作
を、D=D1+D2+…+Di≧Tとなる第i+1番目のポイントまで
上記の操作を繰り返し、i+1番目のポイントを標本化後
のポイントとして抽出し、第i+1番目のポイントを始点
として、同様に次のポイントを順次抽出して標本化す
る。なお、標本化を行った後の第i番目のストロークの
ポイント列は、数式5のように表現される。
【0035】
【数5】 ただし、Pi (1)は標本化後の第i番目のストロークのポイ
ント数を表し、xi,2 (1 ),yi,2 (1)は第i番目ストロークの
第2番目ポイントのx座標,y座標を表す。
【0036】次に、前処理部12は、入力パタンの重心
座標(Gx,Gy)を、数式6に従って求める。
【0037】
【数6】 ここで、Sは入力パタンのストローク数を、Pi (1)は第i
番目ストロークのポイント数を、数6の式のxi,j (1)とy
i,j (1)は第i番目ストロークの第j番目のポイントの座標
をそれぞれ表す。
【0038】次に、前処理部12は、位置の正規化を行
うために、数式6の演算によって求められた重心(Gx,
Gy)を原点(0,0)とする座標系に、すべてのポイントの座
標を変換する。なお、このポイントの座標の変換は、数
式7に従って行われる。
【0039】
【数7】 ここで、数式7のxi,j (1)とyi,j (1)は前記標本化後のポ
イントを、GxとGyは数式3の演算で求められた入力パタ
ンの重心を、xi,j (2)とyi,j (2)はi番目ストロークのj番
目ポイントの変換後の座標をそれぞれ表す。
【0040】次に、前処理部12は、大きさの正規化を
行うために、数式7の演算によって変換された後の入力
パタンを予め定めた正規化サイズに変換する。ここで
は、正規化サイズを128とする。すなわち、前処理部1
2は、原点(0,0)からのx軸およびy軸における最大の座
標値と最小の座標値を持つポイントを求める。そして、
x軸における最大のx座標値の絶対値と最小のx座標値の
絶対値とを比較し、絶対値の大きい値をxmaxとする。同
様に、y軸における最大のy座標値の絶対値と最小のy座
標値の絶対値を比較し、絶対値の大きい値をymaxとす
る。こうして、前処理部12は、すべてのポイントの座
標を数式8に従って変換する。
【0041】
【数8】 ここで、128は予め定めた大きさの正規化サイズであ
り、xi,j (2),yi,j (2)は前記位置の正規化後のi番目スト
ロークのj番目ポイントの座標であり、また、xi,j (3),y
i,j (3)は、大きさの正規化後のi番目ストロークのj番目
ポイントの座標であり、少数第1位を四捨五入した自然
数で表される。
【0042】以上のようにして位置および大きさの正規
化が施された入力パタン(正規化入力パタン)は、前処
理部12から特徴抽出部13に供給される。
【0043】次に、特徴抽出部13は、前処理部12で
正規化を施された入力パタンを受け取ると、各ポイント
において次のポイントへ向かう角度特徴θn (1)を数式9
に従って求める。
【0044】
【数9】 ただし、θn (1)は−πからπまでの値であり、xi,j (3),
yi,j (3)は数15の式で求められたi番目ストロークのj
番目ポイントであり、Pi (3)はi番目ストロークのポイン
ト数である。また、nは1番目ストロークから数えられた
i番目ストロークのj番目ポイントまでのポイント番号を
示し、数式10で求められるものである。
【0045】
【数10】 また、n番目ポイントの特徴Anは数式11に示すように
表せる。
【0046】
【数11】 ここで、iはn番目ポイントが属するストロークの番号で
あり、xn (4),yn (4)はn番目ポイントの座標であり、θn
(1)はn番目ポイントの筆記角度である。
【0047】このように整形入力パタンは、N(=Σi S Pi
(3))個の特徴点列A=(A1,A2,…,AN)として表現され、特
徴点類似度計算部14に供給される。
【0048】特徴点類似度計算部14では、辞書特徴記
憶部18に記憶されているM個の辞書の特徴点列B=(B1,B
2,…,BM)と整形入力パタンのN個の特徴点列A=(A1,A2,
…,AN)との全ての組合せにおいて、それぞれの特徴を比
較し特徴点間の類似度を計算する。ここで、整形入力パ
タンの第i番目の特徴点をAi=(i,xi (4),yi (4)i (1))と
表現し、辞書側の第j番目の特徴点をBj=(j,x'j (4),y'j
(4),θ'j (1))と表現すると、整形入力パタンの第i番目
の特徴点と辞書側の第j番目の特徴点との類似度S
i,jは、数式12のような線形和で表現される。
【0049】
【数12】 ただし、d1=(xi (4)-x'j (4))2+(yi (4)-y'j (4))2、d2=|θ
i (1)-θ'j (1)|(ここで、|θi (1)-θ'j (1)|>πの場合
にはd2=2π―|θi (1)-θ'j (1)|とする)とし、の場合
W1、W2は、それぞれ1とする。なお、この例では、f
1(x),f2(x)は、f1(x)=x,f2(x)=xとしたが、図2(a)(b)
(c)に示すような単調増加関数を用いればどのようなも
のでもよい。
【0050】次に、特徴点類似度計算部14は、入力パ
タンの特徴点列と辞書の特徴点列との間における全ての
特徴点の組合せにおいて、類似度を求め、図3に示すよ
うな類似度テーブルを作成する。作成されたその類似度
テーブルと入力パタンの特徴とは、特徴点類似度計算部
14から対応点選択部15に供給される。
【0051】対応点選択部15は、特徴点類似度計算部
14から渡された類似度テーブルを基に、辞書特徴記憶
部18に記憶されている各字種の特徴点と対応すべき入
力パタン中の特徴点を選択する。
【0052】この対応点選択部15の動作について、図
4〜図8を参照して詳しく説明する。図5〜図8におい
て、j(=1,2,…,M)は辞書側の特徴点番号、i(=1,2,…,N)
は入力パタンの特徴点番号を示す。辞書の特徴点の優先
順位G(=G1,G2,…,GM)は、辞書特徴中の特徴点数と同数
のM個からなり、Gjは辞書の第j番目の特徴点の優先順位
を表し、設計者により予め与えられているものとする。
ここでは、連なる特徴点とのユークリッド距離が長いも
の順を優先順位としている。
【0053】探索フラグFは、探索空間を制限するフラ
グで入力パタンの特徴点数と同数のN個の探索フラグF=
(F1,F2,…,FN)からなり、0と1との2値で与えられ
る。探索フラグFiは、入力パタンの第i番目の特徴点の
探索フラグを表し、0を示すとき選択可能な特徴点であ
ることを示す。また、1の値を示すときは、選択不可の
特徴点であることを示す。対応点番号列Cは、辞書側の
特徴点数と同数のM個の対応特徴点番号列C(=C1,C2,…,C
M)からなり、Cjは辞書側の特徴点と対応する入力パタン
の特徴点の番号を示し、最終的な辞書の特徴点と入力パ
タンの特徴点との対応関係を示す。
【0054】また、図5〜図8中の数値は、1個のスト
ロークで11個の特徴点からなる入力側と1個のストロー
クで5個の特徴点からなる辞書側の間の特徴点間類似度
の値を示している。
【0055】以上を前提として、この例での対応点選択
部15の処理を、図4のフローチャートを参照して説明
する。まず、対応点選択部15は、k=1,F1=F2=…=FN=0,
C1=C 2=…=CM=-1と設定し、初期化を行う(ステップS1
1)。図5(a)、(b)に、ステップS11での優先
順位Gと、探索フラグFと、対応特徴点番号列Cの状態を
示す。
【0056】次に、対応点選択部15は、Gj=kなる辞書
側の第j番目の特徴点とN個の探索フラグF=(F1,F2,…,
FN)で0の値を示している入力側のすべての特徴点との
間で、最も高い類似度を示す第imax番目の特徴点を対応
点と選択し、第j番目の対応点番号Cjにimaxを格納する
(ステップS12)。
【0057】図6(a)に、k=1の場合で、優先順位がG
j=1なる辞書特徴中の第2番目の特徴点において、探索
フラグが0を示す入力パタンの特徴点との各類似度の中
で最大類似度の類似度81を示す第3番目の入力パタンの
特徴点が対応点と選択され、対応点番号C2に3が格納さ
れた状態を示す。
【0058】次に、対応点選択部15は、ステップS1
2で選択された対応点番号Cjに対応する第Cj番目の探索
フラグFimaxの値を1に変更する(ステップS13)。こ
こで、図6(b)に、辞書の第2番目の特徴点に対応す
る入力の第3番目の特徴点が対応点として選択され、選
択された対応点に対応する第3番目の探索フラグF3を0
から1に変更した状態を示す。
【0059】次に、対応点選択部15は、kの値を1イ
ンクリメントする(ステップS14)。さらに、対応点
選択部15は、kの値が辞書の特徴点数Mより大きいか、
M以下であるかを判定する(ステップS15)。kの値が
Mより大きい場合には、対応点選択部15は、このフロ
ーチャートの処理を終了する。
【0060】一方、kの値がM以下であるときは、対応点
選択部15は、探索フラグF=(F1,F2,…,FN)の値を調べ
る(ステップS16)。探索フラグFの値がすべて1で
ある時は、対応点選択部15は、このフローチャートの
処理を終了する。
【0061】探索フラグFに値が1でないものが含まれ
るときは、対応点選択部15は、Gj=kなる辞書の第j番
目と同一ストローク内で隣接する第j-1番目または第j+1
番目の特徴点が存在するとき、第j-1番目または第j+1番
目の特徴点の対応点が存在するかどうか判定する。すな
わち、sj=sj-1なる対応点Cj-1の値が正であるか、また
は、sj=sj+1なる対応点Cj+1の値が正であるかを調べる
(ステップS17)。
【0062】対応点Cj-1及びCj+1の値がいずれも負であ
るときには、第j番目の辞書の特徴点に対する隣接特徴
点の対応点が存在しないと判定されることとなり、ステ
ップS12の処理に戻る。一方、対応点Cj-1またはCj+1
の値が正であるときには、第j番目の辞書の特徴点に対
する同一ストローク内の隣接対応点が存在したと判定さ
れ、ステップS18の処理へ進む。
【0063】ここで、図7(a)は、k=2の場合で、優
先順位がGj=2なる辞書の第1番目の特徴点の対応点探索
において、同一ストローク内で隣接する第2番目の特徴
点の対応点C2が3の正の値を示し、対応点が存在してい
ることを示している。
【0064】ステップS18では、対応点選択部15
は、Gj=kなる辞書の第j番目の特徴点と、上記探索フラ
グF(=F1,F2,…,FN)が0の値を示している入力側のすべて
の特徴点との間で、局所類似度を計算する。なお、対応
点番号Cj+1の値が正である辞書の第j番目の特徴点と入
力側の第i番目の特徴点との局所類似度は、数式13で
与えられる。
【0065】
【数13】 ここで、辞書のj番目の特徴点と同一ストローク内で隣
接する特徴点の対応点番号Cj-1,Cj+1の両方が正である
とき、d3は対応した特徴点の筆記角度の差を示してお
り、数式14に従って求められる。また、d4は対応した
部分の線分長の差を示しており、数式15に従って求め
られる。
【0066】
【数14】
【0067】
【数15】 ここで、辞書のj番目の特徴点と同一ストローク内で隣
接する特徴点の対応点番号Cj-1の値が負の場合は、数式
11と数式12の左辺第1項は0とする。一方、辞書の
j番目の特徴点と同一ストローク内で隣接する特徴点の
対応点番号Cj+1の値が負の場合は、数式14と数式15
の左辺第2項は、0とする。
【0068】また、数式13において、pni,jは入力の
第i番目の特徴点と第Cj-1番目またはCj+1の特徴点が同
一ストロークのとき定数値Eを表し、定数値Eは、異なる
ストロークのとき0の値を表す。また、W3,W4はともに
1とし、Eは50とする。なお、この例では、f3(x),f
4(x)は、f3(x)=x,f4(x)=xとしたが、図2(a)(b)(c)に示
されるような単調増加関数であればどのようなものでも
よい。
【0069】次に、対応点選択部15は、ステップS1
8で求めた局所類似度の中から最も高い値を示す入力の
第imax'番目の特徴点を、Gj=kなる辞書の第j番目の特徴
点の対応点とし、第j番目の対応点番号Cjにimax'を格納
する(ステップS19)。図7(a)に、k=2の場合
で、優先順位がGj=2なる辞書の第1番目の特徴点と入力
パタンの特徴点との局所類似度において、局所類似度が
最大であるi=1番目の特徴点が対応点として選択され
て、対応点番号C1に1が格納された状態を示す。
【0070】さらに、対応点選択部15は、対応点番号
CjからCj+1まで間の探索フラグFr(ただし、r=Cj+1)から
Fimax'までの中で0の値を示している探索フラグを1に
し(ステップS20)、ステップS14の処理に戻る。
なお、図7(b)に、k=2の場合で、優先順位がGj=2な
る辞書の1番目の特徴点において、対応する入力の1番目
の特徴点が選択されたので、探索フラグF1,F2の値が0
から1に変更した状態を示す。
【0071】対応点選択部15が、上記の各ステップの
処理を行い、図4のフローチャートの処理を終了する
と、類似度テーブルと対応点番号列C(=C1,C2,…,CM)
は、対応点選択部15から相対位置検証部16へと供給
される。ここで、図8(a)、(b)は、相対位置検証
部16へ供給される。相対位置検証部16は、対応点選
択部15から渡された対応点番号列C(=C1,C2,…,CM)を
基に、辞書特徴記憶部18に記憶されている各辞書パタ
ンの相対位置関係を表現した相対位置テーブルと不一致
度を求め、不一致度が大きい辞書パタンとの認識を棄却
する。
【0072】この相対位置検証部16の動作について、
図9、図10を参照して詳細に説明する。図9は、ひら
がなの「す」の入力パタンとひらがな「ち」の辞書パタ
ンとの対応点選択部15により対応点が選択されたよう
すを示している。図9中の黒点が特徴点を示し、入力パ
タンの特徴点の近くの番号は、辞書パタンの特徴点の番
号と対応した点を示している。
【0073】図10は、辞書特徴記憶部18に記憶され
ている辞書パタンの相対位置関係を表現した相対位置テ
ーブルで、図9の辞書パタンの相対位置を表わしている
例である。
【0074】図10の縦方向と横方向の番号は図9中の
辞書パタンの特徴点番号を表わし、各桝目は縦方向の番
号の特徴点(以下、着目特徴点)からみた横方向の番号
の特徴点(以下、観測特徴点)との比較すべき相対位置
関係を記述している。図10中の記号X+はX軸方向に
おいて、着目特徴点からみた観測特徴点が正の方向(図
9中では右方向)に存在していることを示し、記号X―
はX軸方向において、着目特徴点からみた観測特徴点が
負の方向(図9中では左方向)に存在していることを示
し、記号Y+はY軸方向において、着目特徴点からみた
観測特徴点が正方向(図9中では上方向)に存在してい
ることを示し、記号Y−はY軸方向において、着目特徴
点からみた観測特徴点が負方向(図9中では下方向)に
存在していることを示し、M1は着目特徴点からみて観
測特徴点が、X軸方向において正方向に存在し、かつY
軸方向において正方向に存在していることを示し、M2
は着目特徴点からみて観測特徴点が、X軸方向において
正方向に存在し、かつY軸方向において負方向に存在し
ていることを示し、M3は着目特徴点からみて観測特徴
点が、X軸方向において負方向に存在し、かつY軸方向
において正方向に存在していることを示し、M4は着目
特徴点からみて観測特徴点が、X軸方向において負方向
に存在し、かつY軸方向において負方向に存在している
ことを示す。図10中の空白の桝目は、着目特徴点から
みて観測特徴点の存在位置が不安定であることを示す。
【0075】この相対位置テーブルは、予め辞書パタン
毎にすべての特徴点間の相対位置について、手書き等の
変動が生じてもその相対位置関係が変化しない特徴点間
を記号X+、X−、Y+、Y−、M1、M2、M3、M
4に分けて記述しておく。
【0076】相対位置検証部16は、対応点選択部15
から渡された対応点番号列C(=C1,C2,…,CM)を基に、辞
書特徴記憶部18に記憶されている各辞書パタンの相対
位置テーブルに記述されているすべての特徴点間の相対
位置関係と一致しているかどうかを調べる。相対位置関
係が一致しない特徴点間一つにつき不一致度NRに1を
加える。不一致度NRが、不一致度に対する閾値T
2 (例えば、1以上でなるべく小さい値)以上になった
場合に、その辞書パタンとの認識を棄却する。本実施例
では、T2=1とする。
【0077】図9の例では、辞書パタンの番号4の特徴
点からみた番号5の特徴点の相対位置関係は、図10の
相対位置テーブルを参照すると記号X+が記してあるの
で、番号4の特徴点からみた番号5の特徴点はX軸に対
して正方向(図9中では右方向)に存在していることを
示している。図9中において、辞書パタンの番号4と番
号5の特徴点に対応した入力パタンの特徴点の相対位置
関係は、入力パタンの番号4の特徴点からみて番号5の
特徴点はX軸方向において負の方向に存在しているた
め、辞書パタンの番号4と番号5の特徴点に対応した入
力パタンの番号4と番号5の特徴点の相対位置関係は、
図10の相対位置テーブルの記述と一致していないので
不一致度NRに1が加えられる。不一致度NRが不一致
度に対する閾値T2=1以上であるため、ひらがな
「す」の入力パタンはひらがな「ち」の辞書パタンとの
認識が棄却される。
【0078】相対位置検証部16で棄却されなかった辞
書パタンについては、パタン整合度計算部17へ渡され
る。ここで、図8(a)、(b)に、パタン整合度計算
部17へと供給される、k=5における辞書の特徴点と入
力の特徴点の対応情報と、探索フラグFと、対応点番号
列Cの状態を示す。
【0079】パタン整合度計算部17は、類似度テーブ
ルと対応点番号列C(=C1,C2,…,CM)が対応点選択部18
から渡されると、辞書特徴記憶部18中の各字種のパタ
ンと整形入力のパタンとの間のパタン間の整合度Rを計
算する。ここで、パタン間の整合度Rは数式16に従っ
て計算される。
【0080】
【数16】 ここで、r=Cj、Hは辞書のストローク数を示し、hは余剰
ストローク数(入力のストローク内の各特徴点に対応す
る探索フラグがすべて0であるストローク数)を、Mは辞
書の特徴点数を、Nは入力の特徴点数を、uは入力の未対
応特徴点数(0の値を示す探索フラグF(=F1,F2,…,Fn)数)
を示す。
【0081】そして、パタン整合度計算部17は、整形
入力パタンと辞書特徴記憶部18に記憶されている各字
種との間でパタンの整合度を求め、求めた整合度のうち
で最大の整合度を示す字種に対応する文字コードを出力
する。
【0082】以上説明したように、この実施の形態にか
かるオンライン文字認識装置では、対応点選択部15で
選択された対応点と、辞書特徴記憶部18に記憶されて
いる各辞書パタンの相対位置関係との不一致度を求め
る。そして、不一致が大きい辞書パタンとの認識を棄却
することにより、過度の対応付けが生じる入力パタンと
異なる字種と認識を避けられるとともに、過度のマッチ
ングによる誤認識を避けられる。
【0083】次に、辞書特徴記憶部18に記憶される各
辞書パタンの相対位置テーブルの作成方法について図1
1を用いて説明する。
【0084】図11の入力パタン記憶部21から対応点
選択部25までは上記の実施の形態の具体例で示したも
と同様であるので説明は省略する。また、辞書特徴記憶
部27は、上記の実施の形態とは異なり、1つの辞書パ
タンのみが記憶されている。
【0085】また、相対位置テーブルの作成前に予め辞
書特徴記憶部27に記憶されている辞書パタンと同じ字
種のサンプルパタンをm個用意する。このサンプルパタ
ン数は多いほどよく、さまざまなバリエーションをもつ
パタンを用意することが望ましい。
【0086】相対位置選択部26は、対応点選択部25
で作成された辞書特徴記憶部27に記憶されている辞書
パタンとの間の特徴点の対応情報を基に、安定度計算手
段S21において、辞書パタンのすべての特徴点の組み
合わせについて、X軸方向およびY軸方向の相対位置と
安定度を計算する。相対位置登録手段S22では、安定
度計算手段S21で計算された辞書パタンのすべての特
徴点間の相対位置の安定度にもとづいて、相対位置関係
の情報を相対位置テーブルに登録する。
【0087】相対位置選択部26の具体例ついて説明す
る。まず、安定度計算手段S21では、m個のサンプル
パタンより辞書パタンの第i番目特徴点と第j番目特徴
点のX軸方向の安定度X(i,j)およびY軸方向の安
定度Y(i,j)を数17に従って求める。
【0088】
【数17】 ここで、Pxは辞書パタンのi番目特徴点のx座標から
j番目特徴点のx座標を引いたとき正の値である数を示
し、Nxは辞書パタンのi番目特徴点のx座標からj番
目特徴点のx座標を引いたとき負の値である数を示し、
Pyは辞書パタンのi番目特徴点のy座標からj番目特
徴点のy座標を引いたとき正の値である数を示し、Ny
は辞書パタンのi番目特徴点のy座標からj番目特徴点
のy座標を引いたとき負の値である数を示す。
【0089】次に、相対位置登録手段S22では、安定
度計算部S21で求められた辞書パタンのすべての特徴
点間の安定度X(i,j)とY(i,j)を基に、以下に
示すの9通りの情報として、すべての特徴点間について
相対位置テーブルに登録する。X(i,j)が1.0で
かつY(i,j)が1.0および−1.0でない場合、
辞書パタンのi番目特徴点からみたj番目特徴点は、X
軸方向において正の方向に存在している情報(図10中
の記号X+)を相対位置テーブルに登録する。
【0090】X(i,j)が−1.0でかつY(i,j)
が1.0および−1.0でない場合、辞書パタンのi番
目特徴点からみたj番目特徴点は、X軸方向において負
の方向に存在している情報(図10中の記号X−)を相
対位置テーブルに登録する。
【0091】Y(i,j)が1.0でかつX(i,j)が
1.0および−1.0でない場合、辞書パタンのi番目
特徴点からみたj番目特徴点は、Y軸方向において正の
方向に存在している情報(図10中の記号Y+)を相対
位置テーブルに登録する。
【0092】Y(i,j)が−1.0でかつX(i,j)
が1.0および−1.0でない場合、辞書パタンのi番
目特徴点からみたj番目特徴点は、Y軸方向において負
の方向に存在している情報(図10中の記号Y−)を相
対位置テーブルに登録する。
【0093】X(i,j)が1.0でかつY(i,j)が
1.0場合、辞書パタンのi番目特徴点からみたj番目
特徴点は、X軸方向において正の方向に存在し、かつY
軸方向において正の方向に存在している情報(図10中
の記号M1)を相対位置テーブルに登録する。
【0094】X(i,j)が1.0でかつY(i,j)が
−1.0場合、辞書パタンのi番目特徴点からみたj番
目特徴点は、X軸方向において正の方向に存在し、かつ
Y軸方向において負の方向に存在している情報(図10
中の記号M2)を相対位置テーブルに登録する。
【0095】X(i,j)が−1.0でかつY(i,j)
が1.0場合、辞書パタンのi番目特徴点からみたj番
目特徴点は、X軸方向において負の方向に存在し、かつ
Y軸方向において正の方向に存在している情報(図10
中の記号M3)を相対位置テーブルに登録する。
【0096】X(i,j)が−1.0でかつY(i,j)
が−1.0場合、辞書パタンのi番目特徴点からみたj
番目特徴点は、X軸方向において負の方向に存在し、か
つY軸方向において負の方向に存在している情報(図1
0中の記号M4)を相対位置テーブルに登録する。X
(i,j)が1.0および−1.0なくかつY(i,j)
が1.0および−1.0でない場合、辞書パタンのi番
目特徴点からみたj番目特徴点は、X軸方向およびY軸
方向において不安定に存在している情報(図10中の空
白)を相対位置テーブルに登録する。
【0097】このようにして1辞書パタン当たりの相対
位置テーブルが作成できる。これを図1の辞書特徴記憶
部18に登録されている認識対象のパタンすべてについ
て相対位置テーブルについて作成し、辞書特徴記憶部1
8に記憶する。
【0098】
【発明の効果】以上説明した本発明によれば、入力パタ
ンと辞書パタンとのパタン整合度を計算する前に相対位
置検証を行うことで、過度の対応付けおよび過度のマッ
チングを回避でき、高精度に文字認識が行える。その理
由は、入力パタンと辞書パタンとの間で特徴点の対応付
けを行ったあとに、対応付いた特徴点から辞書に記憶さ
れている手書き変動等に影響されない特徴点間の相対位
置関係と不一致度を求め、不一致度が大きい場合にその
辞書パタンとの認識を棄却するためである。
【図面の簡単な説明】
【図1】本発明の実施の形態のかかるオンライン文字認
識の機能のブロック図である。
【図2】特徴点類似度の計算に適用可能な単調増加関数
の例である。
【図3】特徴点類似度計算部によって作成される類似度
テーブルの例を示す図である。
【図4】本発明の実施の形態において、対応点選択部が
実行する処理を具体的に示すフローチャートである。
【図5】(a)、(b)は、それぞれ対応点番号列と探
索フラグの状態の例を示す図である。
【図6】(a)、(b)は、それぞれ対応点番号列と探
索フラグの状態の例を示す図である。
【図7】(a)、(b)は、それぞれ対応点番号列と探
索フラグの状態の例を示す図である。
【図8】(a)、(b)は、それぞれ対応点番号列と探
索フラグの状態の例を示す図である。
【図9】辞書パタンと対応点選択部が実行した後の入力
パタンの例である。
【図10】図9中の辞書パタンにおける相対位置テーブ
ルの例である。
【図11】相対位置テーブル作成におけるブロック図で
ある。
【図12】従来の一般的なオンライン文字認識の機能の
ブロック図である。
【符号の説明】
11入力パタン記憶部 12前処理部 13特徴抽出部 14特徴点間類似度計算部 15対応点選択部 16相対位置検証部 17パタン整合度計算部 18辞書特徴記憶部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平9−161059(JP,A) 特開 昭62−164183(JP,A) 特開 平4−336686(JP,A) 特開 平2−217981(JP,A) 特開 平1−156889(JP,A) 特開 昭59−128680(JP,A) 特開 昭55−138171(JP,A) 「電子通信学会論文誌」Vol.J68 −D No.12 p.2107−2115 (1985)石井康夫”オンライン手書き漢 字におけるストローク代表点の相対位置 関係の安定性" (58)調査した分野(Int.Cl.7,DB名) G06K 9/46 - 9/62 JICSTファイル(JOIS)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 文字パターンを辞書パターンとして記憶
    する辞書特徴記憶部と、 入力された文字パターンを入力パターンとして記憶する
    入力パターン記憶部と、 前記入力パターンの位置及び大きさを正規化する前処理
    部と、 前記前処理部の出力に基いて前記入力パターンの特徴を
    抽出する特徴抽出部と、 前記入力パターンの特徴と前記辞書パターンとの類似度
    を計算する特徴点類似度計算部と、 前記計算の結果に基づいて前記入力パターンと前記辞書
    パターンとの対応を決定する対応点選択部と、 前記対応の結果に基いて入力パターンと辞書パターンと
    の整合度を計算し、前記整合度に基いて前記辞書パター
    ンに割り当てられた文字コードを出力するパターン整合
    度計算部とを含むオンライン文字認識装置であって、 前記オンライン文字認識装置は、更に、相対位置検証部
    を備え、 前記相対位置検証部は、前記対応の結果に基づいて前記
    入力パターンと前記辞書パターンとの一致度を計算し
    て、前記一致度が所定値未満である時は、前記辞書パタ
    ーンを棄却し、 前記パターン整合度計算部は、前記棄却されなかった辞
    書パターンについて、前記整合度を計算し、 前記辞書パターンが含む2以上の特徴点に対し、i番目
    特徴点とj番目特徴点との間の安定度を計算し、前記安
    定度に基いて前記i番目特徴点と前記j番目特徴点との
    間の相対位置情報を生成し、前記相対位置情報を前記辞
    書特徴記憶部に格納し、 前記入力パターンが含む2以上の特徴点に対し、p番目
    特徴点とq番目特徴点との間の相対位置情報を生成し、 前記辞書パターン及び前記入力パターンの位置情報に基
    いて、前記一致度を計算し、 前記辞書パターンの位置情報は、一つの着目特徴点から
    みた他の観測特徴点との相対位置関係を記述する情報で
    あって、 X軸方向において、着目特徴点からみた観測特徴点が正
    の方向に存在しているときX+とし、 X軸方向において、着目特徴点からみた観測特徴点が負
    の方向に存在しているときX−とし、 Y軸方向において、着目特徴点からみた観測特徴点が正
    方向に存在しているときY+とし、 Y軸方向において、着目特徴点からみた観測特徴点が負
    方向(図9中では下方向)に存在しているときY−と
    し、 着目特徴点からみて観測特徴点が、X軸方向において正
    方向に存在し、かつY軸方向において正方向に存在して
    いるときM1とし、 M2は着目特徴点からみて観測特徴点が、X軸方向にお
    いて正方向に存在し、かつY軸方向において負方向に存
    在しているときM2とし、 着目特徴点からみて観測特徴点が、X軸方向において負
    方向に存在し、かつY軸方向において正方向に存在して
    いるときM3とし、 着目特徴点からみて観測特徴点が、X軸方向において負
    方向に存在し、かつY軸方向において負方向に存在して
    いるときM4とし、 着目特徴点からみて観測特徴点の存在位置が不安定であ
    るとき、位置情報を付与しないこととし、 前記入力パターンの位置情報は、前記X+、X−、Y
    +、Y−、M1、M2、M3、M4で記述することを特
    徴とするオンライン文字認識装置。
JP00581099A 1999-01-12 1999-01-12 検証機能付きオンライン文字認識装置 Expired - Fee Related JP3221488B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP00581099A JP3221488B2 (ja) 1999-01-12 1999-01-12 検証機能付きオンライン文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00581099A JP3221488B2 (ja) 1999-01-12 1999-01-12 検証機能付きオンライン文字認識装置

Publications (2)

Publication Number Publication Date
JP2000207494A JP2000207494A (ja) 2000-07-28
JP3221488B2 true JP3221488B2 (ja) 2001-10-22

Family

ID=11621448

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00581099A Expired - Fee Related JP3221488B2 (ja) 1999-01-12 1999-01-12 検証機能付きオンライン文字認識装置

Country Status (1)

Country Link
JP (1) JP3221488B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4525526B2 (ja) * 2005-08-26 2010-08-18 パナソニック電工株式会社 パターンマッチング方法及び装置
JP6915786B2 (ja) * 2018-05-02 2021-08-04 日本電信電話株式会社 学習装置、認識装置、学習方法及びコンピュータプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
「電子通信学会論文誌」Vol.J68−D No.12 p.2107−2115(1985)石井康夫"オンライン手書き漢字におけるストローク代表点の相対位置関係の安定性"

Also Published As

Publication number Publication date
JP2000207494A (ja) 2000-07-28

Similar Documents

Publication Publication Date Title
KR100297482B1 (ko) 수기입력의문자인식방법및장치
US5454046A (en) Universal symbolic handwriting recognition system
JP4274941B2 (ja) 手書き文字を復号化するための方法および装置
JP5071914B2 (ja) 認識グラフ
US5687254A (en) Searching and Matching unrecognized handwriting
US8180160B2 (en) Method for character recognition
US5802205A (en) Method and system for lexical processing
EP1971957B1 (en) Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text
US5787197A (en) Post-processing error correction scheme using a dictionary for on-line handwriting recognition
CN101128837A (zh) 基于分割的辨认方法
Saba et al. Online versus offline Arabic script classification
JP4958236B2 (ja) 手書きパターンを認識するための方法及び装置
Singh et al. Online handwritten Gurmukhi words recognition: An inclusive study
EP0614557A1 (en) Character recognition method
JP3221488B2 (ja) 検証機能付きオンライン文字認識装置
Tung et al. Stroke-order-free on-line Chinese character recognition by stroke adjustment of two-layer bipartite weighted matching
CN115311674A (zh) 手写处理方法、装置、电子设备和可读存储介质
US6636636B1 (en) Character recognizing apparatus, method, and storage medium
KR0126800B1 (ko) 한글필기체 온라인 문자인식 장치 및 방법
JP2762472B2 (ja) 文字認識方法および文字認識装置
JPH1055409A (ja) 手書き入力情報処理装置
JP3419251B2 (ja) 文字認識装置及び文字認識方法
JP3128357B2 (ja) 文字認識処理装置
JPH09114926A (ja) オンライン文字認識における入力文字大分類方法および装置
KR19980079762A (ko) 온라인 문자 인식 장치

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees