JP3198218B2 - オンライン手書き文字認識方法 - Google Patents

オンライン手書き文字認識方法

Info

Publication number
JP3198218B2
JP3198218B2 JP23727394A JP23727394A JP3198218B2 JP 3198218 B2 JP3198218 B2 JP 3198218B2 JP 23727394 A JP23727394 A JP 23727394A JP 23727394 A JP23727394 A JP 23727394A JP 3198218 B2 JP3198218 B2 JP 3198218B2
Authority
JP
Japan
Prior art keywords
data
extracting
predetermined
handwritten character
angle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP23727394A
Other languages
English (en)
Other versions
JPH08101889A (ja
Inventor
充 小林
修 宮本
隆 松本
彰 鶴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Waseda University
Sharp Corp
Original Assignee
Waseda University
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Waseda University, Sharp Corp filed Critical Waseda University
Priority to JP23727394A priority Critical patent/JP3198218B2/ja
Publication of JPH08101889A publication Critical patent/JPH08101889A/ja
Application granted granted Critical
Publication of JP3198218B2 publication Critical patent/JP3198218B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は電子手帳、ワードプロ
セッサなどに用いられるペン入力装置に関し、特に、そ
うしたペン入力装置において、楷書のみならず変形の大
きい続け字をも正確に認識するオンライン手書き文字認
識方法に関する。
【0002】
【従来の技術】電子手帳、ワードプロセッサ、コンピュ
ータなどに対して文字を入力する場合、従来はキーボー
ドなどを用いたものが主流であった。しかし、キーボー
ドを用いた入力には一定の技量が必要であること、電子
手帳、コンピュータなどが小型化するに従い、キーボー
ドのキーを確保するのに必要な面積が確保できなくなっ
てきていること、などに鑑みて、タブレットなどを用い
た手書き文字によるオンライン手書き文字入力が使用さ
れることが多くなってきた。
【0003】従来提案されているオンライン手書き文字
認識方法は、構造解析的方法とパターンマッチング的方
法との2つに大別される。
【0004】構造解析的方法においては、入力文字を、
数種類の直線からなる予め用意した基本ストロークで記
述する。その基本ストロークの集合を識別理論に沿って
識別する。この構造解析的方法では、予め用意した基本
ストロークで文字を記述する。そのためストロークの変
形の大きい続け字の認識の場合、基本ストロークの抽出
が困難となるという問題点があった。
【0005】パターンマッチング的方法は、文字がスト
ロークの集合からなるものと考えて、予め書く文字の標
準パターンを準備しておく。そして標準パターンおよび
入力パターンを構成するストローク間の対応づけを行な
う。対応づけられた各ストローク間において定められる
距離を求め、それら距離の総和としてパターン間距離を
求める。パターン間距離が最も小さい標準パターンが入
力文字として認識される。パターンマッチング的方法で
は、変形が大きい入力パターンの認識においては、標準
パターンと入力パターンとのストロークの対応づけが誤
ったりする問題がある。ストロークの対応づけが正しく
できたとしても、正解の標準パターンとの間で計算され
たパターン間距離が、他の(誤った)標準パターンとの
間で計算されたパターン間距離よりも大きくなってしま
うことがあり、その結果認識が正しく行なわれないこと
があるという問題点があった。
【0006】
【発明が解決しようとする課題】以上のように従来の方
法では、文字を構成する各ストロークを基本ストローク
のみで記述したり、各ストロークについて複数の座標を
特徴としたりしているため、続け字のように複数のスト
ロークが接続されて1つのストロークのように手書きさ
れた場合には、ストロークの対応づけが正しく行なわれ
ず、誤認識が発生するという問題点がある。
【0007】したがって請求項1に記載の発明の目的
は、楷書のみならず続け字も認識できるオンライン手書
き文字認識方法を提供することである。
【0008】請求項2に記載の発明の目的は、楷書のみ
ならず続け字も認識でき、かつ高速に正確な文字認識が
可能なオンライン手書き文字認識方法を提供することで
ある。
【0009】請求項3に記載の発明の目的は、楷書のみ
ならず続け字も正しく認識できるオンライン手書き文字
認識方法を提供することである。
【0010】
【0011】
【0012】
【課題を解決するための手段】請求項1に記載の発明
は、手書き文字データ出力手段から与えられる、手書き
文字の筆跡の座標の移動を表わす時系列データに基づい
て手書き文字を認識するためのオンライン手書き文字認
識方法であって、与えられた時系列データから特徴点を
抽出する工程と、抽出された複数個の特徴点データを、
予め準備されたテンプレートと比較することにより、手
書き文字を認識する工程とを含む。特徴点を抽出する工
程は、与えられた時系列データのうち、隣接する予め定
める複数個のデータを選択する工程と、選択された予め
定める複数個のデータの先頭点および最終点を結んだ線
分と、選択された予め定める複数個のデータ内の、隣接
する2点を結んだ線分とがなす角度を求める工程と、求
められた角度と予め定めるしきい値角度との間に所定の
関係が成立するか否かを判定する工程と、所定の関係が
成立すると判断された場合に、選択されたデータのうち
の予め定めるものを特徴点として抽出する工程と、与え
られた時系列データに対して、複数個のデータの選択が
終了するまで、選択する工程と、角度を求める工程と、
判定する工程と、抽出する工程とを繰返す工程とを含
む。
【0013】請求項2に記載の発明は、請求項1記載の
オンライン手書き文字認識方法であって、選択する工程
は、与えられたn個(n≧3)の時系列データのうち、
隣接するk+2個(k=1〜n−2)のデータ
(t0 )〜(tk+1 )を選択する工程を含む。なお本
明細書において、アンダーラインが付されたアルファベ
ットはベクトルを表わす。角度を求める工程は、選択さ
れたk+2個のデータの先頭点(t0 )と最終点
(tk+1 )、および(ti ),(ti-1 )に対し
て、
【0014】
【数2】
【0015】で定められる角度Δθi (i=1,2,
…,k+1)を求める工程を含む。判定する工程は、各
Δθi が|Δθi |≧θ* を満たすか否かを判定する工
程を含む。
【0016】
【0017】
【0018】
【0019】
【0020】
【0021】
【0022】
【0023】
【0024】
【0025】
【0026】
【0027】
【0028】
【0029】
【0030】
【0031】
【0032】求項に記載の発明は、手書き文字デー
タ出力手段から与えられる、手書き文字の筆跡の座標の
移動およびストローク中かストローク間の空白区間かを
示すペンのオン/オフ情報を表わす時系列データに基づ
いて手書き文字を認識するためのオンライン手書き文字
認識方法であって、与えられた時系列データから特徴点
を抽出する工程と、各特徴点までの筆跡の座標の進行角
度の変化量とペンのオン/オフ情報とを特徴量として抽
出する工程と、抽出された特徴量の組を、予め準備され
たテンプレートと比較することにより、手書き文字を認
識する工程とを含む。特徴点を抽出する工程は、与えら
れた時系列データのうち、隣接する予め定める複数個の
データを選択する工程と、選択された予め定める複数個
のデータの先頭点および最終点を結んだ線分と、選択さ
れた予め定める複数個のデータ内の、隣接する2点を結
んだ線分とがなす角度を求める工程と、求められた角度
と予め定めるしきい値角度との間に所定の関係が成立す
るか否かを判定する工程と、所定の関係が成立すると判
断された場合に、選択されたデータのうちの予め定める
ものを特徴点として抽出する工程と、与えられた時系列
データに対して、複数個のデータの選択が終了するま
で、選択する工程と、角度を求める工程と、判定する工
程と、抽出する工程とを繰返す工程とを含む。
【0033】
【作用】請求項1に記載の発明によれば、手書き文字デ
ータ出力手段からの時系列データから特徴点が抽出さ
れ、抽出された複数個の特徴点データを、予め準備され
たテンプレートと比較することにより、手書き文字が認
識される。特徴点を抽出する場合、与えられた時系列デ
ータのうち、隣接する予め定める複数個のデータが選択
され、選択されたデータの先頭点および最終点を結んだ
線分と、選択されたデータ内の、隣接する2点を結んだ
線分とがなす角度とが求められる。求められた角度と予
め定めるしきい値角度との間に所定の関係が成立すれ
ば、たとえば求められた角度の絶対値がしきい値角度以
上であれば、選択されたデータのうちの予め定めるも
の、たとえば時系列で先頭に位置するものと、当該隣接
する2点のうちの、時系列で前に位置するものとを特徴
点として抽出する。与えられた時系列データに対して、
複数個のデータの選択が終了するまで、選択するステッ
プと、角度を求める工程と、判定する工程と、抽出する
工程とを繰返す。この処理により、オフストロークも含
めて、筆跡の特徴を的確に表わす1つの連続する筆記情
報列が得られる。
【0034】請求項2に記載の発明によれば、請求項1
記載のオンライン手書き文字認識方法において、選択さ
れたk+2個のデータの先頭点(t0 )と最終点
(tk+ 1 )および(ti ),(ti-1 )に対応し
て、角度Δθi (i=1,2,…,k+1)を求め、各
Δθi が|Δθi |≧θ* を満たすか否かによって特徴
点の抽出を行なうか否かが判定される。この方法によ
り、入力文字の特徴を的確に表わすために不要なデータ
が除去され、認識に適した特徴点のみを抽出できる。
【0035】
【0036】
【0037】求項に記載の発明によれば、手書き文
字データ出力手段からの時系列データから特徴点が抽出
され、抽出された特徴点データからさらに抽出された特
徴量を、予め準備されたテンプレートと比較することに
より、手書き文字が認識される。特徴点を抽出する場
合、与えられた時系列データのうち、隣接する予め定め
る複数個のデータが選択され、選択されたデータの先頭
点および最終点を結んだ線分と、選択されたデータ内
の、隣接する2点を結んだ線分とがなす角度とが求めら
れる。求められた角度と予め定めるしきい値角度との間
に所定の関係が成立すれば、たとえば求められた角度の
絶対値がしきい値角度以上であれば、選択されたデータ
のうちの予め定めるもの、たとえば時系列で先頭に位置
するものと、当該隣接する2点のうちの、時系列で前に
位置するものとを特徴点として抽出する。与えられた時
系列データに対して、複数個のデータの選択が終了する
まで、選択するステップと、角度を求める工程と、判定
する工程と、抽出する工程とを繰返す。この処理によ
り、オフストロークも含めて、筆跡の特徴を的確に表わ
す1つの連続する筆記情報列が得られる。
【0038】
【実施例】以下、本発明の一実施例を図を用いて説明す
る。図1は、本発明の一実施例を実現するためのオンラ
イン手書き文字認識装置の構成を示すブロック図であ
る。図1を参照してオンライン手書き文字認識装置30
は、筆記情報を時系列データとして出力するためのタブ
レット40と、タブレット40の出力からストロークを
検出するためのストローク検出部42と、検出されたス
トロークから特徴点を抽出するための特徴抽出部44
と、抽出された特徴点と、予め登録されていた複数個の
テンプレートとの間でマッチングを行なうためのマッチ
ング部46と、マッチングに使用されるテンプレートを
予め登録しておくテンプレート記憶部48と、マッチン
グ結果を表示するための表示部50とを含む。
【0039】タブレット40は手書き文字データ出力手
段の一例である。なお手書き文字データ出力手段として
はタブレットに限定されず、手書き文字の筆跡の移動を
座標列として出力できるとともに、その間のペンのオン
/オフ(ストローク中か、ストロークとストロークとの
間の空白区間か)を示す情報を出力できるものであれば
どのようなものでもよい。
【0040】以下、各部で行なわれる処理について次の
数式を参照して説明する。
【0041】
【数3】
【0042】図1に示されるタブレット40から得られ
るデータを、式(1)の(ti )とする。ここで、
(ti )は時刻ti における2次元座標データを示す。
時刻ti とは、筆跡の最初(0番目)のデータが得られ
た時刻をt0 とし、その後一定のタイミングでサンプリ
ングされた場合の、i番目のサンプリングタイミングを
示す。式(1)においてp(ti )は、時刻ti におけ
るスタイラスペンのオン/オフ状態を示す。たとえばペ
ンがオンの場合には論理1、ペンがオフの場合には論理
0となる。
【0043】図1のストローク検出部42および特徴抽
出部44で行なわれる特徴点の抽出処理の概略は次のよ
うなものである。
【0044】(1) ステップ1 図2を参照して、3個の座標データ(t0 )、(t
1 )、(t2 )を選択する。これら3点は、得られた
筆跡データのうちの、連続する3つの点である。この図
2に示される3点の座標データから、式(2)に従って
角度Δθiを求める。図2の場合にはΔθ1 とΔθ2
の2つが得られる。
【0045】θ* を所定のしきい値(0〜180°)と
して、もしも式(3)が成立すれば後述のステップ2
に、さもなければ(t0 )および(t1 )を特徴点
とし、(t0 ):=(t1 )として、ステップ1に
戻る。
【0046】(2) ステップ2 続いて図3を参照して、4個の座標データ(t0 ),
…,(t3 )が与えられた場合を考える。その場合に
も式(4)に従い、3つのΔθi (i=1,2,3)を
求める。もしも式(5)が図3に示されるようにi=
1,2,3のすべてに対して成立すれば後のステップ3
の処理に、さもなければ、つまり図4に示されるように
いずれか1つ(図4の場合にはΔθ3 )がθ* よりも大
きければ(t0 )、(t2 )を特徴点とし、(t
0 ):=(t2 )としてステップ1に戻る。
【0047】(3) ステップ3 以下、ステップ1およびステップ2と同様の処理を、処
理対象の座標データの数を1ずつ増加させながら行なっ
ていく。
【0048】(4) ステップk k+2個の座標データ(t0 ),(tk+1 )が与え
られる場合、式(6)に示されるようにΔθi (i=
1,…,k+1)が計算される。もしも式(7)がすべ
てのi(i=1,…,k+1)に対して成立すればステ
ップk+1へ、さもなければ(t0 )、(tk )を
特徴点とし、(t0 ):=(tk )としてステップ
1に戻る。
【0049】(5) 終了ステップ 以上の処理を、入力されたストロークの座標点数Mまで
完了した場合に抽出処理が終了する。なおMは式(1)
にも示されるように、入力されたストロークの座標点数
を示す。
【0050】図5に、「か」について上記手順で特徴点
を抽出した例を示す。図5においては「●」が特徴点
を、「○」が特徴点以外の座標データを示す。図5にお
いて、ペンのオン/オフ情報がオンのストロークは実線
で、オフのストロークは点線で、それぞれ示している。
なお、この明細書で使用している「オフストローク」と
いう語は、あるストロークの終点座標と次のストローク
の始点座標とを結んだ擬似的なストロークのことを指
す。たとえば図5では、(t5 )および(t6)と
の間、および(t7 )と(t8 )との間を結ぶ線分
がオフストロークである。
【0051】なお、しきい値角度θ* は前述のように0
〜180°の値をとることができ、経験的に最適と思わ
れる値を選択すればよい。後に述べる実験の場合、θ*
は10°に設定されている。またしきい値角度θ* は式
(3)、(5)および(7)に共通である。もちろん、
各ステップによりこのしきい値角度を変えることも考え
られるが、共通とした方が簡明である。
【0052】上記した特徴点抽出方式を実現するための
ソフトウェアの制御をフローチャート形式で示したもの
が図16および図17であるが、その詳細については後
述する。
【0053】上述のようにして抽出された特徴点から、
パターンマッチングの特徴量を得るための処理につき、
次の式(8)〜(17)を参照して以下に説明する。
【0054】
【数4】
【0055】まず、上述のようにして抽出された特徴点
の座標とその座標におけるペンのオン/オフ情報を組と
した特徴点列を式(8)で表わされるものとする。i=
1,…,Mに対して式(9)に従ってΔθi (i=1,
…,M)を計算する。なお、x1 (ti )は(ti
のx軸成分、x2 (ti )はそのy成分である。
【0056】同様にして式(10)で表わされる値も計
算する。なお、本明細書では式(10)の左辺に示され
るように変数に上線を設けた変数は、以下その変数名の
後に(オーババー)を付して呼ぶこととする。たとえば
式(10)の左辺はΔfi (オーババー)と呼ぶ。
【0057】Δfi (オーババー)を、式(11)に従
って正規化しΔfi を得る。式(11)によればΔfi
は、筆跡の全長(ペンの全移動距離)を1とした場合
の、(ti-1 )と(ti )との距離を示す。
【0058】式(12)に従ってfi を計算すると、f
i は特徴点(ti )までの筆跡の長さ(ペンの移動距
離の総和)を表わしている。
【0059】この実施例で文字認識に用いる特徴量は式
(13)により示されている。式(13)においてθ
(fi )は式(14)により定義され、pi は式(1
5)によって定義される。式(14)の右辺の「Δθk
(fk )」は、特徴点(tk )までのストロークの長
さを式(12)に示されるようにfk とした場合の、そ
のポイント(tk )におけるΔθk を表わしている。
つまり式(14)の左辺のθ(fi )は、k=1からk
=iまでの各特徴点において計算されたΔθk を累積し
たトータルの角度変化であると考えることができる。
【0060】また式(15)によれば、2つの特徴点
(ti-1 ),p(ti-1 )),((ti ),p
(ti ))の区間のペンの状態は「時刻ti-1 以降時刻
i までのペンの状態である。」ことを表わしている。
式(8)〜(14)で表わされる処理は、特徴点データ
をxy座標系から極座標系に座標変換している処理と考
えられるが、それに付随するペン情報は、極座標系に変
換される2つの特徴点の間の区間のペン情報と等しい。
【0061】以上のようにして認識に用いる特徴量が定
義される。同様にして、予め登録されているテンプレー
トの特徴量を式(16)に示されるものとする。2つの
特徴量Xi =(θ(fi ),pi )とYj =(η
(gj ),qj )とについて式(17)によりρを定義
する。ここで、式(17)の右辺に用いられているd
(pik,qjk)は、ペンの状態(オン/オフ)をパター
ン間距離に反映させるための「重み」パラメータであ
る。このような「重み」パラメータを導入することによ
り、文字の変形まで考慮したより的確なパターンマッチ
ングを行なうことができる。式(17)に従って求めた
特徴量間の距離を、全体の筆跡について合計をすること
により文字を認識できる。
【0062】ところで、文字を認識するために全体の筆
跡について式(17)の合計を求める必要があるが、こ
こで次のような問題が存在する。得られた特徴点データ
の数は式(13)に示されるようにM個であり、テンプ
レートの特徴量の数は式(16)に示されるようにNで
ある。一般にM≠Nである。この場合には単純には式
(17)の合計を求めることはできない。以下、次の式
(18)〜(20)を参照して、合計の求め方を説明す
る。
【0063】
【数5】
【0064】
【数6】
【0065】
【数7】
【0066】こうした場合の式(17)の合計を求める
方法について以下説明する。対応すべき2つの特徴ベク
トル列X、Yを次のように定める。
【0067】X=X1 ,X2 ,…,XM Y=Y1 ,Y2 ,…,YN ただしXi 、Yj はそれぞれ式(13)、(16)によ
り定義される特徴ベクトルであるとする。
【0068】この2つの系列をパターン間距離が最小と
なるように対応づけさせることを2次元的に図示すると
図6に示すとおりになる。図6を参照して、X、Y両ベ
クトル列の対応変換関数は、ij平面上の格子点c=
(i,j)の点列で表わされる。この点列をFとすれば
次のようになる。
【0069】F=c1 ,c2 ,…,ck ,…,cK ただし、ck =(ik ,jk )である。
【0070】2つの特徴ベクトルXikとYjkとの距離を
d(ck )で表わすと、点列Fに沿ってとった距離の総
和D(F)は式(20a)で表わされる。ただし式(2
0a)においてwk は、k番目の対応づけにおける経路
長である。
【0071】式(20a)の値が小さいほど、特徴ベク
トル列X、Yの対応づけが良いことを示している。
【0072】ここで、式(20a)を、式(18)、
(19)、さらにi1 =j1 =1、i K =M、jK =N
という式(17a)の制限の下でFに関して最小化する
ことを考える。式(18)はサブインデックスik 、j
k に関する単調性の条件である。式(19)は同じくこ
れらサブインデックスについての連続性の条件である。
式(17a)は、これらサブインデックスが満足すべき
境界条件である。
【0073】この式(20a)においてd(ck )、w
k を式(20b)、(20c)と定義すれば式(20)
が得られる。このようにして定義された式(20)を、
手書き文字認識に用いる距離尺度とする。
【0074】認識に用いる距離尺度として式(20)に
示される値D(X,Y)を計算するうえでd(pik,q
jk)の値は経験的なものであるが、それを定めるための
考え方は次のようなものである。
【0075】(1) 登録されたテンプレートが正しい
画数で書かれている場合を考える。入力文字が楷書体ま
たは続け字で書かれた場合、入力文字の各ペンがオフの
部分は、入力文字と同じカテゴリに属するテンプレート
のペンがオフの部分と一致する。したがってpi =qj
=“up”のときは、他の場合ほどΔθi 、Δηi 、Δ
i 、Δgj は重要ではない。なお、「カテゴリ」と
は、認識対象の各文字のことを指す。たとえば入力が
「か」の場合、入力文字と同じカテゴリに属するテンプ
レートとは、「か」を認識するためのテンプレートのこ
とを指す。
【0076】(2) 登録されたテンプレートが正しい
画数で書かれており、入力文字が続け字で書かれた場合
を考える。この場合には入力文字のペンがオンとなる或
る部分が入力文字と同じカテゴリに属するテンプレート
のペンのオフの部分と一致することがある。したがって
i =“down”でqj =“up”のときは、あまり
大きなペナルティをかけない。すなわちこの場合にはd
(pik,qjk)の値は小さくする。
【0077】(3) 一方pi =“up”でqj =“d
own”のときはペナルティを大きくする。
【0078】この重みパラメータの値としても種々考え
られる。後に述べる実験例の場合には次のようなd(p
i ,qj )を用いている。
【0079】
【表1】
【0080】このようにして考えた場合、式(17)で
定義されるρは、入力特徴(θ(f i ),pi )とテン
プレート特徴(η(gj ),qj )の間の、ストローク
のオン、オフをも考慮した距離差と考えることができ
る。実際には式(17)に示されるようにρは入力特徴
とテンプレート特徴とのストロークの方向差×重みパラ
メータとして求められている。
【0081】式(20)により、入力Xとテンプレート
Yとの間のパターン間距離D(X,Y)を計算するため
の1つの手法としてDP(ダイナミックプログラミン
グ)マッチング手法がある。DPマッチング手法を式
(20)に適用した場合の例を次の式(21)に示す。
【0082】
【数8】
【0083】式(21)の第3式は、第2式に従って求
めたD(iK ,jK )が、式(20)で示されるD
(X,Y)であることを表わしている。
【0084】入力が与えられた場合、式(21)を用
い、予め登録されているテンプレートと、上述したよう
な方法で抽出された特徴点から得られる特徴量との間で
パターン間距離を計算し、得られたパターン間距離が最
小のものを認識文字として選択すればよい。
【0085】図7に、テンプレートと入力データの特徴
ベクトルの一例を示す。図8〜図12は、或る人が筆記
した「か」と他の人が筆記した「か」とのマッチングの
例を示している。図9〜図12は実際には図8に示され
るように連続した1つの図であることをここに指摘して
おく。また図9〜図12に示される数値は式(21)に
従ったDPマッチング手法で計算されたものであるが、
計算過程での丸め誤差により表面上微小な誤差が存在し
ていることにも注意すべきである。
【0086】上述のようにすれば、入力文字とテンプレ
ートとの間で、オフストロークまで考慮したマッチング
を行なうことができる。そのために、従来の方法と比較
してより正確に続け字まで認識できるという効果が存在
する。
【0087】一方、認識精度を上げるためには、テンプ
レート数を多くすればよいと思われる。しかし、多くの
テンプレートに対して式(21)を用いたパターン間距
離の計算を行なえば、計算負荷が大きくなり認識速度の
低下の原因になると思われる。そこでパターン間距離の
計算をより高速化することが望まれる。計算処理の高速
化の方策としては以下が考えられる。
【0088】(1) 文字を筆記する動作は計算機の動
作速度と比較してよりゆっくりとしている。したがっ
て、タブレットから座標値を取得している間に式(2
1)の計算を開始すれば処理はより速く行なえる。
【0089】(2) 特徴点の数をMであるとする。す
ると式(11)の手順に従ってΔf i の正規化を行なう
と、すべてのΔfi (i=1,…,M)が得られるま
で、式(21)の計算を行なうことができない。すなわ
ち文字の筆記動作が終了しないとマッチング動作を実質
的には行なうことができず、文字の筆記と並行して計算
を行なう利点を得ることができない。
【0090】この問題に対処するために、本実施例では
次のようにしてDPマッチングのパスの刈り込みを行な
い、計算量を減少させることにより計算負荷を小さくし
ている。この計算方法を以下の式を参照して説明する。
【0091】
【数9】
【0092】まず、式(22)で示される値D* (X,
Y)を定義する。式(22)の右辺の分子は式(23)
により定義される。ここでik 、jk は既に述べたとお
りのサブインデックスである。
【0093】今、上述の式(24)および式(25)で
表わされる2つの正規化されていない特徴ベクトルにつ
いて、M=N、fi (オーババー)=gj (オーババ
ー)、pi =qj が成立し、かつ式(26)が成立する
ものとする。式(26)は、2つの正規化されていない
特徴ベクトル(式(24)および式(25))の間の角
度差が一定値γであることを意味している。ここでi=
j=k、K=M=Nとする。これら値と式(23)を式
(22)に代入して整理すると式(27)が得られる。
すなわちこの場合式(27)の左辺は定数γと等しくな
り、スケール不変である。
【0094】しかしこのようにして求めた式(22)
も、Δfi が得られるまでは計算ができない。そこで、
式(21)でノード(ik ,jk )を多く刈り込んで計
算量を少なくするために、以下のようにして式(22)
を利用する。
【0095】式(22)のうち、分母の根号の中の第2
項目(式(28))は予め登録されているテンプレート
から求めるものである。したがって式(28)は事前に
計算しておくことができる。また、タブレットのサイズ
などの物理的な制限のため、テンプレートの文字の大き
さに対する入力の筆跡の相対的なサイズには、自然な上
限がある。そこで、式(29)がすべてのテンプレート
について成立するような定数α* を経験値として求める
ことが可能である。この定数α* は理論上はかなり大き
な値となる。しかし、文字の入力枠を設けたりすること
によりかなり小さくすることができ、たとえば入力文字
の大きさをテンプレートの文字の大きさの2倍までと制
限することもできる。以下に述べる実験例ではα* =2
を用いている。
【0096】また、式(27)を考慮して、すべてのテ
ンプレートおよび入力について式(30)が成立するよ
うな経験値γ* が存在する。式(27)の解釈として、
文字がスケールに関係なく全体に角度γだけ回転してい
ると考えられる。したがって式(30)の右辺のγ*
回転を制限する上限値であって0〜180°の間に存在
する。以下に述べる実験例ではγ* =25を用いてい
る。
【0097】式(22)、(23)に式(29)、(3
0)を組合せることにより、式(31)の不等式が得ら
れる。式(31)はすべてのテンプレートと入力につい
て成立するはずである。また式(31)の右辺の部分は
入力とは無関係であり、経験値α* とγ* とが与えられ
れば予め計算可能である。そこで、式(23)で表わさ
れる値を式(20)と同様に式(21)により表わされ
るDPマッチング手法により計算し、式(31)の関係
が成立しないノードが存在した場合、そのノード以降の
パスを刈り込むことができる。これによりDPマッチン
グ手法における計算量が削減され、認識速度の向上が得
られる。
【0098】図13〜図15に、このようにしてパスを
刈り込んだ場合の計算過程を示す。図14および図15
は図13に示されるように組合わされることをここに指
摘しておく。図14および図15に示されるように、そ
のノードまでの最短経路が式(31)を満足しないノー
ド以降のパスの計算を行なわないようにすることによ
り、図8〜図12に示される場合と比較してかなりの量
の計算が削減できることがわかる。
【0099】次に、この発明の方法に従って特徴点を抽
出する処理をコンピュータ上で実行されるソフトウェア
により実現する場合の、フローチャートを図16および
図17を参照して説明する。
【0100】図16を参照して、まずステップ59で、
0 に0を代入し、(t0 )を特徴点として選択す
る。
【0101】続いてステップ60で、インデックスi0
が定数M−2以下かどうかが判定される。この式が成立
しなければ入力されたストロークの座標点数Mのすべて
が処理完了したということであるからステップ61で
(tM )を特徴点として選択し全体処理は終了する。
【0102】ステップ60の不等式が成立する場合、ス
テップ62で変数kにi0 +1を代入する。
【0103】続いてステップ64でp(ti0)(時刻t
i0におけるペンのオン/オフ情報)が“up”かどうか
についての判定が行なわれる。upであれば制御は図1
7のステップ82に進む。さもなければ制御はステップ
65に進む。図17の処理については後述する。
【0104】ステップ65ではkがM以上か否かが判定
される。M以上であれば制御は図17のステップ82に
進み、さもなければ制御はステップ66に進む。
【0105】ステップ66では、同様にしてp(tk
がupかどうかが判定される。upであれば制御は図1
7のステップ82に進み、さもなければ制御はステップ
68に進む。
【0106】ステップ68では角((tk+1 ),
(ti0))を計算する。この計算は式(9)と同様にし
て計算できる。
【0107】続いてステップ70でi0 +1をiに代入
して制御は図17のステップ72に進む。
【0108】ステップ72では、i≦(k+1)が成立
するか否かの判断が行なわれる。この不等式が成立しな
ければ制御はステップ73に進み、成立すれば制御はス
テップ74に進む。
【0109】ステップ73ではkが1インクリメントさ
れ、制御は図16のステップ65に戻る。
【0110】一方ステップ74では角((ti ),
(ti-1 ))が計算される。続いてステップ76で、式
(2)に示される関係に従ってΔθi が計算される。
【0111】ステップ78で、|Δθi |<θ* が成立
するか否かの判断が行なわれる。この不等式が成立しな
ければ制御はステップ82に進み、さもなければ制御は
ステップ80に進む。
【0112】ステップ78の不等式が成立する場合には
ステップ80でiを1インクリメントして制御はステッ
プ72に戻る。以下ステップ72〜78の処理を繰返
す。
【0113】一方ステップ82に処理が進んだ場合に
は、(tk )を特徴点として選択する。
【0114】続いてステップ84でi0 にkを代入して
制御は図16のステップ60に戻る。
【0115】以上のようにして、入力データから特徴点
が抽出される。続いて、DPマッチングによる式(2
0)の計算方法、すなわち式(21)の求め方のフロー
チャートを説明する。なお、この計算に先立って(M+
1)×(N+1)の2次元配列D(M,N)が準備され
ているものとする。図18を参照して、まずステップ9
0でD(0,0)に0が代入され、D(0,1)〜D
(0,N)に、∞が挿入される。実際には、D(0,
1)〜D(0,N)には計算機で扱うことができる最大
数が代入される。なお、以下のステップ94からの処理
では、各行について各列の値を計算し、1行の計算がす
べて完了した後に次の行の処理を行なう、というように
計算を進めていく。ステップ94ではiがM以下かどう
かについての判定が行なわれる。この不等式が成立しな
い場合、すべての行についての処理が終了したというこ
とであるので計算処理は終了する。不等式が成立する場
合には制御はステップ96に進む。
【0116】ステップ96ではD(i,0)に∞が代入
される。制御はステップ98に進む。ステップ98〜1
02の処理は、i行目の各列の要素についての計算であ
る。
【0117】ステップ98ではjがN以下かどうかにつ
いての判断が行なわれる。この不等式が成立していなけ
れば、この行についてのすべての列要素の計算が終了し
たということであり、制御はステップ104に進む。さ
もなければ制御はステップ100に進む。
【0118】ステップ100では、式(21)に従って
D(i,j)を計算する処理が行なわれる。
【0119】続いてステップ102でjをインクリメン
トして制御はステップ98に戻る。一方ステップ104
では、iを1インクリメントしてステップ94に戻る。
【0120】以上のようにして式(21)のDPマッチ
ングによる計算が行なわれる。
【0121】
【発明の効果】以上のように請求項1に記載の発明によ
れば、オフストロークも含めて、1つの連続する筆記情
報列が得られ、この筆記情報列をテンプレートと比較す
ることで手書き文字が認識される。ストロークのみによ
る文字認識ではないため、楷書のみならず続け字も認識
できるオンライン手書き文字認識方法を提供できる。
【0122】さらに請求項2に記載の発明によれば、入
力文字の特徴を的確に表わすために不要なデータが除去
され、認識に適した特徴点のみを抽出できる。認識に適
した特徴点のみを用いてテンプレートとの比較が行なえ
るので、計算量も少なく、高速に正確な文字認識が可能
なオンライン手書き文字認識方法を提供できる。
【0123】
【0124】
【0125】求項に記載の発明によれば、オフスト
ロークも含めて、各特徴点の特徴量からなる1つの連続
する筆記情報列が得られ、この筆記情報列をテンプレー
トと比較することで手書き文字が認識される。ストロー
クのみによる文字認識ではないため、楷書のみならず続
け字も認識できるオンライン手書き文字認識方法を提供
できる。
【図面の簡単な説明】
【図1】本発明の一実施例の方法を実施するためのオン
ライン手書き文字認識装置のブロック図である。
【図2】3点について特徴点を抽出する場合を示す模式
図である。
【図3】4点について特徴点を抽出する場合を示す模式
図である。
【図4】4点について特徴点を抽出する場合を示す模式
図である。
【図5】「か」に関する入力データと特徴点との一例を
示す模式図である。
【図6】2つの特徴ベクトル列X、Yのマッチング経路
を示す模式図である。
【図7】テンプレートと入力パターンとを対比して示す
図である。
【図8】図9〜図12に示される図の関係を模式的に示
す図である。
【図9】本発明をDPマッチング手法を用いて実施した
場合の結果を示す図である。
【図10】本発明をDPマッチング手法を用いて実施し
た場合の結果を示す図である。
【図11】本発明をDPマッチング手法を用いて実施し
た場合の結果を示す図である。
【図12】本発明をDPマッチング手法を用いて実施し
た場合の結果を示す図である。
【図13】図14および図15の関係を示す模式図であ
る。
【図14】本発明をDPマッチング手法を用いて行な
い、かつパスの刈り込を行なった場合の結果を示す図
である。
【図15】本発明をDPマッチング手法を用いて行な
い、かつパスの刈り込を行なった場合の結果を示す図
である。
【図16】特徴点抽出処理を示すフローチャートであ
る。
【図17】特徴点抽出処理を示すフローチャートであ
る。
【図18】DPマッチングのフローチャートである。
【符号の説明】
30 オンライン手書き文字認識装置 40 タブレット 42 ストローク検出部 44 特徴抽出部 46 マッチング部 48 テンプレート記憶部 50 表示部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 松本 隆 東京都新宿区西早稲田1丁目6番1号 学校法人早稲田大学内 (72)発明者 鶴田 彰 大阪府大阪市阿倍野区長池町22番22号 シャープ株式会社内 (56)参考文献 特開 昭62−190578(JP,A) 特開 昭62−162182(JP,A) 特開 昭55−138172(JP,A) 特開 平3−282896(JP,A) 特開 昭60−136892(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/46 G06K 9/62 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 手書き文字データ出力手段から与えられ
    る、手書き文字の筆跡の座標の移動を表わす時系列デー
    タに基づいて手書き文字を認識するためのオンライン手
    書き文字認識方法であって、 与えられた時系列データから、特徴点を抽出する工程
    と、 前記特徴点を抽出する工程により抽出された複数個の特
    徴点データを、予め準備されたテンプレートと比較する
    ことにより、手書き文字を認識する工程とを含み、 特徴点を抽出する前記工程は、 前記与えられた時系列データのうち、隣接する予め定め
    る複数個のデータを選択する工程と、 前記選択された予め定める複数個のデータの先頭点およ
    び最終点を結んだ線分と、前記選択された予め定める複
    数個のデータ内の、隣接する2点を結んだ線分とがなす
    角度を求める工程と、 前記求められた角度と予め定めるしきい値角度との間に
    所定の関係が成立するか否かを判定する工程と、 前記所定の関係が成立すると判定された場合に、前記選
    択された予め定める複数個のデータのうちの予め定める
    ものを特徴点として抽出する工程と、 前記与えられた時系列データに対して、前記複数個のデ
    ータの選択が終了するまで、前記選択するステップと、
    前記角度を求める工程と、前記判定する工程と、前記抽
    出する工程とを繰返す工程とを含む、オンライン手書き
    文字認識方法。
  2. 【請求項2】 前記選択する工程は、与えられたn個
    (n≧3)の時系列データのうち、隣接するk+2個
    (k=1〜n−2の自然数)のデータx(t0 )〜x
    (tk+1 )を選択する工程を含み、 前記角度を求める工程は、前記選択されたk+2個のデ
    ータの先頭点x(t0)と最終点x(tk+1 )、および
    点x(ti ),x(ti-1 )に対して、 【数1】 で定められる角度Δθi (i=1,2,…,k+1)を
    求める工程を含み、 前記判定する工程は、予め定めるしきい値角度θ* に対
    して各Δθi が|Δθi |≧θ* を満たすか否かを判定
    する工程を含む、請求項1記載のオンライン手書き文字
    認識方法。
  3. 【請求項3】 手書き文字データ出力手段から与えられ
    る、手書き文字の筆跡の座標の移動およびストローク中
    かストローク間の空白区間かを示すペンのオン/オフ情
    報を表わす時系列データに基づいて手書き文字を認識す
    るためのオンライン手書き文字認識方法であって、 与えられた時系列データから、特徴点を抽出する工程
    と、 各前記特徴点までの筆跡の座標の進行角度の変化量とペ
    ンのオン/オフ情報とを特徴量として抽出する工程と、 前記特徴量として抽出する工程により抽出された特徴量
    の組を、予め準備されたテンプレートと比較することに
    より、手書き文字を認識する工程とを含み、 特徴点を抽出する前記工程は、 前記与えられた時系列データのうち、隣接する予め定め
    る複数個のデータを選択する工程と、 前記選択された予め定める複数個のデータの先頭点およ
    び最終点を結んだ線分と、前記選択された予め定める複
    数個のデータ内の、隣接する2点を結んだ線分とがなす
    角度を求める工程と、 前記求められた角度と予め定めるしきい値角度との間に
    所定の関係が成立するか否かを判定する工程と、 前記所定の関係が成立すると判定された場合に、前記選
    択された予め定める複数個のデータのうちの予め定める
    ものを特徴点として抽出する工程と、 前記与えられた時系列データに対して、前記複数個のデ
    ータの選択が終了するまで、前記選択するステップと、
    前記角度を求める工程と、前記判定する工程と、前記抽
    出する工程とを繰返す工程とを含む、オンライン手書き
    文字認識方法。
JP23727394A 1994-09-30 1994-09-30 オンライン手書き文字認識方法 Expired - Fee Related JP3198218B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23727394A JP3198218B2 (ja) 1994-09-30 1994-09-30 オンライン手書き文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23727394A JP3198218B2 (ja) 1994-09-30 1994-09-30 オンライン手書き文字認識方法

Publications (2)

Publication Number Publication Date
JPH08101889A JPH08101889A (ja) 1996-04-16
JP3198218B2 true JP3198218B2 (ja) 2001-08-13

Family

ID=17012952

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23727394A Expired - Fee Related JP3198218B2 (ja) 1994-09-30 1994-09-30 オンライン手書き文字認識方法

Country Status (1)

Country Link
JP (1) JP3198218B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5352757B2 (ja) * 2006-08-14 2013-11-27 有限会社Kiteイメージ・テクノロジーズ 手書き文字認識方法、手書き文字認識システム、手書き文字認識プログラム及び記憶媒体
KR102149105B1 (ko) 2019-09-18 2020-08-27 세종대학교산학협력단 혼합현실 기반 3차원 스케치 장치 및 방법

Also Published As

Publication number Publication date
JPH08101889A (ja) 1996-04-16

Similar Documents

Publication Publication Date Title
EP0114248B1 (en) Complex pattern recognition method and system
EP1564675B1 (en) Apparatus and method for searching for digital ink query
JP3761937B2 (ja) パターン認識方法及び装置及びコンピュータ制御装置
JPH10143668A (ja) 手書き文字列の照合方法および装置
JPH06208653A (ja) 記号正規化方法
JP4817297B2 (ja) 文字検索装置
US5659633A (en) Character recognition method utilizing compass directions and torsion points as features
Malik et al. Urdu online handwriting recognition
JP3216800B2 (ja) 手書き文字認識方法
JP3198218B2 (ja) オンライン手書き文字認識方法
JPH09319828A (ja) オンライン文字認識装置
KR100301216B1 (ko) 온라인문자인식장치
JP3128357B2 (ja) 文字認識処理装置
JP2671984B2 (ja) 情報認識装置
JPH0253193A (ja) 文字認識方法および文字認識装置
JP3365538B2 (ja) オンライン文字認識方法および装置
JP3015137B2 (ja) 手書文字認識装置
JPH0877299A (ja) オンライン手書き文字認識方法
JP2851865B2 (ja) 文字認識装置
JP3115369B2 (ja) 局所的字形変動を考慮したオンライン走り書き文字認識装置
KR900005141B1 (ko) 문자인식장치
JP3146046B2 (ja) オンライン文字認識装置
JPH01204196A (ja) 連続数字認識方法及び装置
JPS6215681A (ja) オンライン手書き文字認識方式
JPS62160597A (ja) オンライン連続文字認識装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010522

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090608

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090608

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100608

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110608

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120608

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120608

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130608

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130608

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees