JPH1049630A

JPH1049630A - オンライン手書き文字認識方法および装置

Info

Publication number: JPH1049630A
Application number: JP9128988A
Authority: JP
Inventors: Toshio Tanaka; 敏雄田中
Original assignee: Seiko Epson Corp
Current assignee: Seiko Epson Corp
Priority date: 1996-05-22
Filing date: 1997-05-19
Publication date: 1998-02-20

Abstract

(57)【要約】【課題】部首を越えての筆順誤りやストロークの続
け、省略があっても認識可能とし、しかも、少ない計算
量で高速に文字認識する必要がある。【解決手段】文字が入力されると、辞書に登録された
或る１文字を構成するそれぞれの辞書ストロークについ
て、予め記述された順番に従って一本の辞書ストローク
を読み出す（ステップｓ１，ｓ２）。そして、対応付け
済みマークのない入力ストロークを読み出し、類似度計
算を行う（ステップｓ３〜ｓ５）。この処理を対応付け
済みマークのない入力ストロークすべてについて行い、
それぞれ求められた類似度のうち最大類似度を求め（ス
テップｓ６）、求められた入力ストロークに対応付け済
みマークを付加する（ステップｓ７）。このような処理
を、ある１つの文字の全ての辞書ストロークが終了する
まで行い、それを認識対象文字すべてについて同じ処理
を行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、入力文字の特徴量
と辞書に登録されている特徴量とを対応付けして、文字
認識を行うオンライン手書き文字認識において、筆順の
誤りやストロークの続け、省略があっても認識可能とし
たオンライン手書き文字認識方法および装置に関する。

【０００２】

【従来の技術】オンライン手書き文字認識は、入力筆跡
情報と辞書に登録された筆跡情報とのマッチングを取
り、類似度の高い辞書パターンを認識結果とすることが
一般に行われている。このようなオンライン手書き文字
認識においては、筆跡の情報として、一般に文字の画数
に対応したストロークや、そのストロークを分割した部
分ストロークの特徴を用い、入力された文字を構成する
ストローク（入力ストロークと呼ぶ）と辞書に登録され
たストローク（辞書ストロークと呼ぶ）との類似度を求
めることで認識することが従来より普通に行われてい
る。

【０００３】このような認識方法において、認識を行う
際、入力ストロークがその文字において何画目かという
入力ストロークの入力順序情報を用いる場合と用いない
場合とがある。

【０００４】入力ストロークの入力順序情報を用いる方
法は、類似度を計算する際に、入力ストロークと辞書ス
トロークを同じ画に絞ってマッチングを行うので、類似
度の計算量が少なく認識処理を高速に行えるという利点
があるが、入力文字の筆順が誤っていると認識できない
という欠点があった。

【０００５】これに対して、入力順序情報を用いない方
法は、筆順に誤りが有っても認識できるため、入力順序
情報を用いるものに比べて有利な方法である。この入力
順序情報を用いない方法は、入力ストロークと辞書スト
ロークとのマッチングの組み合わせを何画目かという制
限なしに作成し、それぞれの組み合わせによる類似度を
計算して、入力文字の認識を行うものである。

【０００６】たとえば、特公昭５８−２７５５１（第１
の従来技術という）で示されるオンライン手書き文字認
識方式は、辞書に登録されている認識対象文字ごとのす
べての辞書ストロークを１文字毎に読み出して、その読
み出された辞書ストロークと入力文字を構成するすべて
のストロークとを照合し、類似度を計算して、その計算
結果を基に認識するものである。

【０００７】図６は「欧」という文字が入力された場
合、その入力文字を構成するそれぞれのストロークと辞
書ストロークとのマッチングを行った例を示すものであ
る。図６において、太線で示されている部分はその時点
において照合を行うべき１本のストロークを示すもの
で、たとえば、辞書に登録された１画目のストロークに
対して、１番目に入力された入力ストローク、２番目に
入力された入力ストローク、３番目目に入力された入力
ストロークというように照合し、それぞれの類似度を計
算し、その計算結果をｄ１１，ｄ１２，ｄ１３，・・・
というように表している。

【０００８】このように、認識対象文字の１画目から順
にそれぞれの画に対応した辞書ストロークに対して、入
力文字の入力順序に従ったストロークすべてと照合し、
類似度を計算し、１画目の辞書ストロークに対しては、
類似度ｄ１１〜ｄ１８が得られ、２画目の辞書ストロー
クに対しては、類似度ｄ２１〜ｄ２８が得られるという
ように、総当たりで類似度計算を行っている。そして、
それぞれの画において最も類似度の大きいものを選ぶ。
図ではそれぞれの画における最も大きい類似度を丸で囲
んで示している。なお、実際には、辞書に登録されてい
る認識対象文字（たとえば、５０００文字程度）すべて
について前記した処理を行う。

【０００９】このような処理を行うことにより、入力文
字の筆順に関係なく文字認識が行えるが、類似度の計算
回数はこの図６の例では、辞書に登録された１つの文字
に対してだけでも６４回にもおよび、これをすべての認
識対象文字との間で処理を行うため、類似度計算量は膨
大なものとなり、認識するまでにきわめて多くの時間を
要する欠点がある。

【００１０】この問題を克服するために類似度の計算回
数を減らそうとする方法も幾つか提案されている。その
１つの方法として、１つの文字を部首などにより、幾つ
かの部分パターンに分けて、各々の部分パターン内で総
当たりにストローク間の類似度を計算する方法がある。
たとえば、特開昭６０−２３７５８１（第２の従来技術
という）では、或る文字においては殆ど全ての筆者にお
ける筆順変動が、ｍ画目からｎ画目の間で行われるとし
た場合、ｍ画目までを１つの部分パターン、ｎ画目以降
を他の１つの部分パターンとして、これら部分パターン
内のみで、入力ストロークと辞書ストロークの各ストロ
ーク間で総当たりに類似度を計算している。

【００１１】図７はこの第２の従来技術を用いて前記し
た「欧」という文字についてマッチングを行った例を示
すもので、この場合は、「欧」の文字の１画目〜４画目
までを１つの部分パターンｐ１、５画目と６画目を１つ
の部分パターンｐ２、７画目を１つの部分パターンｐ
３，８画目を１つの部分パターンｐ４というように４つ
の部分パターンに分けて、これら４つの部分パターン内
のみで、入力ストロークと辞書ストロークの各ストロー
ク間で総当たりに類似度を計算している（それぞれの画
における最も大きい類似度を丸で囲んで示している）。
このように、類似度を計算するために総当たりの組み合
わせを、部分パター内のみに制限することにより類似度
の計算回数を減らすことができ、図７の例では、類似度
の計算回数は１つの辞書登録文字に対して２２回とな
り、図６に比べれば大幅に類似度計算回数を減らすこと
ができる。

【００１２】この幾つかの部分パターンに分けて、各々
の部分パターン内で総当たりにストローク間の類似度を
計算する方法の他の例としては特開昭６０−２５４３８
４（第３の従来技術という）がある。この第３の従来技
術は、辞書パターンにパターン切れ目情報を付加し、そ
の切れ目情報で指定された範囲内において、総当たりの
マッチングを行って類似度を計算することで計算回数を
減らそうとするものである。

【００１３】図８はこの第３の従来技術を用いて前記し
た「欧」という文字についてマッチングを行った例を示
すもので、この場合には、パターン切れ目を、「欧」と
いう文字を構成する２つの部首、「区」と「欠」の間と
し、部分パターンをｐ１１，ｐ１２の２つに分けて、２
つの部分パターン内のみで、入力ストロークと辞書スト
ロークの各ストローク間で総当たりに類似度を計算して
いる（それぞれの画における最も大きい類似度を丸で囲
んで示している）。このように、類似度を計算するため
に総当たりの組み合わせを部分パター内のみに制限する
ことにより類似度の計算回数を減らすことができ、図８
の例では、類似度の計算回数は３２回に減少し、図６に
比べれば計算回数を１／２に減らすことができる。

【００１４】

【発明が解決しようとする課題】前記したように、第１
〜第３の従来技術は、確かに類似度計算の回数を減らし
認識速度の高速化を図るという点では一定の効果が得ら
れるが、辞書作成時に予測できない部分パターンを越え
る筆順間違いが有った場合には対応できないという問題
があり、さらに、ストロークの続けや省略があった場合
には誤認識になる可能性が極めて高いという問題があっ
た。

【００１５】たとえば、図９は筆者が「欧」という文字
を部首を越えた筆順誤りで書いた場合に、前記第２の従
来技術を用いてマッチングを行った例を示すものであ
る。この第２の従来技術の場合には、この文字に対して
は部分パターンをたとえば４つに分けて、４つの部分パ
ターン内のみで、入力ストロークと辞書ストロークの各
ストローク間で総当たりに類似度を計算する。ところ
で、部首を越えた筆順誤りというのは、「欧」という文
字を例にとると、たとえば、１つの部首である「区」が
書き終わらないうちに、次の部首に移り、また、「区」
に戻るというような筆順である。

【００１６】この図９の例では、本来、第１の部分パタ
ーン内ｐ１にて類似度が計算されるべき入力ストローク
が、この例では、第７画目や第８画目で書かれ、第２の
部分パターンｐ２にて類似度が計算されるべきストロー
クが、この例では、第３画目や第４画目で書かれ、ま
た、第３の部分パターン内ｐ３にて類似度が計算される
べきストロークが、この例では、第５画目で書かれ、さ
らに、第４の部分パターン内ｐ４にて類似度が計算され
るべきストロークが、この例では、第２の部分パターン
ｐ２内の第６画目で書かれているため、それぞれの部分
パターン内で正確な対応付けが行えなくなる。図９にお
いて、丸で囲ったものが辞書ストロークと入力ストロー
クとを対応付けることのできる大きな値を有する類似度
であるが、それぞれの部分パターンにおいて一定以上の
類似度の得られず対応付けのできない入力ストロークが
出てくるため、誤認識される可能性が高い。

【００１７】また、図１０は筆者が「欧」という文字を
筆順は正しく入力したものの、１部のストロークを続け
た場合における前記第２の従来技術を用いてマッチング
を行った例を示すもので、この場合、５画目と６画目に
相当する部分（「欠」の上の構成部分）が続けて１つの
ストロークで書かれ、入力ストローク数は１ストローク
少ない７ストローク（７画）となっている。

【００１８】このように入力された文字にストロークの
続けがある場合、辞書からその入力文字と同じ文字の辞
書ストロークが読み出されたとしても、画数が異なって
くるため、辞書の内容とのマッチングが取れなくなり、
誤認識される可能性が高い。

【００１９】そこで、本発明は、部首を越えての筆順誤
りやストロークの続け、省略があっても認識可能とし、
しかも、マッチングの計算量を少なくし認識速度の高速
化を図れるオンライン手書き文字認識方法および装置を
実現することを目的とする。

【００２０】

【課題を解決するための手段】本発明のオンライン手書
き文字認識方法は、ある文字が入力されることによりそ
の文字を構成する特徴量を抽出し、その抽出された特徴
量と、辞書に登録されている特徴量とを照合して対応付
けすることにより、入力文字の認識を行うオンライン手
書き文字認識方法において、前記辞書に登録される認識
対象文字の１つずつの文字を構成するそれぞれの特徴量
に対し、入力文字を構成する特徴量との照合を行う順番
を予め記述しておき、入力文字の特徴量との対応付けを
行う際、辞書に登録された或る文字を構成するそれぞれ
の特徴量を、前記記述された順番に従って１つずつ読み
出して、読み出された特徴量と入力文字を構成するそれ
ぞれの特徴量とを照合し、その照合を行う際、前記入力
文字を構成するそれぞれの特徴量に対応付け済みを示す
符号が付されているか否かを判断し、符号のない入力文
字の特徴量に対してのみ照合処理を行い、その照合処理
により対応付けられた入力文字の特徴量に対して対応付
け済みを示す符号を付すことを特徴とする。

【００２１】そして、前記辞書に記述される照合を行う
順番は、入力文字のそれぞれの特徴量との照合を行う
際、特徴量同士の対応付け誤りの少ない順にそれぞれの
特徴量が辞書から読み出されるような順番とし、また、
前記文字を構成する特徴量としては、ストロークを用い
ることが可能である。

【００２２】また、本発明のオンライン手書き文字認識
装置は、ある文字が入力されることによりその文字を構
成する特徴量を抽出し、その抽出された特徴量と、辞書
に登録されている特徴量とを照合して対応付けすること
により、入力文字の認識を行うオンライン手書き文字認
識装置において、入力された文字からその文字を構成す
るそれぞれの特徴量を抽出する特徴量抽出手段と、認識
対象の各文字毎にその文字を構成するそれぞれの特徴量
が登録されるとともに、或る１つの文字を構成するそれ
ぞれの特徴量に対し、予め決められた照合の順番が記述
された辞書と、辞書に登録された特徴量との対応付けが
済んだ入力文字の特徴量に対し、対応付け済みを示す符
号を付す符号付加部と、前記辞書から記述された順番に
従って１つずつ読み出された或る文字を構成するそれぞ
れの特徴量と、入力文字を構成するそれぞれの特徴量と
を照合する際、前記入力文字を構成するそれぞれの特徴
量に対応付け済みを示す符号が付されているか否かを判
断し、符号のない入力文字の特徴量に対してのみ照合処
理を行い、類似度を求める類似度計算部と、この類似度
計算部で求められた類似度を基に、辞書から読み出され
た特徴量に対して最大の類似度を有する入力文字の特徴
量を対応付け済みの特徴量として選択する対応付け処理
部とを有することを特徴とする。

【００２３】そして、前記辞書に記述される照合を行う
順番は、入力文字のそれぞれの特徴量との照合を行う
際、特徴量同士の対応付け誤りの少ない順にそれぞれの
特徴量が読み出されるような順番とし、また、前記文字
を構成する特徴量としては、ストロークを用いることが
可能である。

【００２４】このような手段を用いることにより、部首
を越えた筆順誤りやストロークの続けがあっても認識可
能となり、また、総当たりの認識を行わないので、類似
度計算量を大幅に減らすことができ、認識速度の高速化
が図れる。

【００２５】また、前記辞書に登録された各文字を構成
する特徴量の照合順序は、入力文字のそれぞれの特徴量
との照合を行う際に、特徴量同士の対応付け誤りの少な
い順とし、その順番に従って、辞書の特徴量が１つ１つ
読み出され、読み出された辞書の特徴量と入力された文
字のそれぞれの特徴量とが照合されることにより、特徴
量同士の対応付けの誤りを少なくすることができる。さ
らに、前記文字を構成する特徴量をストロークとするこ
とにより、特徴量の抽出が容易で類似度を計算しやす
く、高精度な認識を行うことができる。

【００２６】

【発明の実施の形態】以下本発明の実施の形態を説明す
る。

【００２７】図１は本発明の実施の形態を説明するブロ
ック図であり、タブレット上にペンなどで入力された文
字に対する座標データを時系列データとして出力する文
字入力部１、この文字入力部１から送られてくる時系列
の座標データをもとに、その文字を構成する特徴量とし
てのストロークを抽出するストローク抽出部２、認識対
象の各文字毎にその文字を構成するそれぞれの特徴量
（ここではストロークの特徴データ）が登録されるとと
もに、１つの文字を構成するそれぞれのストロークに対
し、予め決められた照合の順番が記述された辞書３、辞
書３に登録された或る文字における１つのストローク
（辞書ストローク）との対応付けが済んだ入力文字のス
トローク（入力ストローク）に対し、対応付け済みを示
す符号としてのマークを付すマーク付加部４、前記記述
された順番に従って辞書３から読み出された或る１つの
文字を構成する１本の辞書ストロークと、入力された文
字を構成するそれぞれの入力ストロークとを照合し、前
記対応付け済みのマークの有無を判断して、マークの付
加されていない入力ストロークの類似度を計算する類似
度計算部５、この類似度計算部５で求められた類似度に
基づいて、辞書から読み出された辞書ストロークとの対
応付けを行う対応付け処理部６、この対応付け処理部６
による処理結果をもとに入力文字の認識結果を出力する
認識結果出力部７などから構成されている。なお、これ
ら各構成要素の詳細（特に、辞書３の登録内容、マーク
付加部４、類似度計算部５などの処理）は、以下に説明
する。

【００２８】前記辞書３は、前記したように、認識対象
の１つ１つの文字に対してそれぞれの文字ごとにその文
字を構成するそれぞれのストロークの特徴データが登録
されるが、１つの文字毎に入力ストロークとの照合順番
を決めておき、その順番が記述されている。したがっ
て、入力された文字を構成するそれぞれの入力ストロー
クとの照合を行う際、或る１つの文字を構成する何本か
の辞書ストロークが、記述された順番にしたがって１本
ずつ読み出されるようになっている。

【００２９】ところで、前記記述される順番とは、入力
ストロークとの照合を行う際、それぞれの入力ストロー
クとの間での対応付け誤りの少ないと思われる順番が設
定される。この対応付けの誤りの少ない順とは、具体的
には、（１）１つの文字を構成するストロークのうち特徴的な
ストローク（たとえば、長さの長いストローク）から順
に照合を行うように順序を記述しておく。

【００３０】（２）１つの文字を構成するストロークの
うち文字の外縁に位置するストロークから順に照合を行
うように順序を記述しておく。

【００３１】（３）１つの文字を構成するストロークの
うち特定の方向に位置するストロークから順に照合を行
うように順序を記述しておく。

【００３２】（４）前記（１）〜（３）を任意に組み合
わせた順序、たとえば前記（１）と（２）を組み合わ
せ、外縁に位置し、しかも特徴的なストローク（たとえ
ば、長さの長いストローク）から順に照合を行うように
順序を記述しておく。

【００３３】等が考えられる。

【００３４】たとえば、「欧」という文字におけるそれ
ぞれの辞書ストロークについて考えると、入力ストロー
クとの照合を行った場合に、ストローク同士の対応付け
誤りの少ないと思われる順番として、図２に示すような
順番を予め記述しておく。図２において、太線で書かれ
た辞書ストロークが記述の順に従って照合されるストロ
ークであり、「欧」を構成する８本の辞書ストロークの
照合の順序として１番目〜８番目までを予め決めてお
き、その順番を記述しておく。なお、この図２に示され
る照合の順番は、前記した（４）で示した外縁に位置
し、しかも長さの長いストロークから照合を行うという
設定である。

【００３５】今、入力ストロークが図２に示すような順
序で入って来たとする（その時点で入力されたストロー
クを太線で示す）。なお、この図２の例は、部首の１つ
である「区」の部分に筆順誤りがある例である。

【００３６】辞書３には認識対象の文字すべてについ
て、それぞれの文字毎の辞書ストロークが登録されてい
るが、図２は認識対象文字のなかの１つの文字として
「欧」の辞書ストロークが予め記述された順番で読み出
された例を示している。

【００３７】まず、辞書３から１番目の順番に設定され
た辞書ストロークが読み出され、類似度計算部５によ
り、読み出された１番目の辞書ストロークと、それぞれ
の入力ストロークの照合を１つ１つ順番に行い、類似度
の計算が行われるが、その際、１番目〜８番目までの入
力ストロークに対応付け済みのマークが付加されている
か否かを判断する。最初はどの入力ストロークに対して
も対応付け済みのマークは付加されていないので、前記
読み出された１番目の辞書ストロークと、入力ストロー
クの１番目〜８番目までを順番に照合し、類似度計算部
５によりそれぞれの類似度を計算する。これにより得ら
れた類似度をｄ４１，ｄ４２，・・・，ｄ４８で表す。
そして、対応付け処理部６により、求められた類似度の
中で最も大きい類似度が選択され、この場合、ｄ４２が
最も大きい類似度（図中に丸印で囲んで示す）であるの
で、その類似度を有する２番目の入力ストロークが選択
される。

【００３８】このようにして、１番目の辞書ストローク
に対しては２番目の入力ストロークが最も類似度が高い
と判定され、１番目の辞書ストロークと２番目の入力ス
トロークとが対応付けられたことになる。そして、マー
ク付加部４により、その対応付けられた入力ストローク
に対して、対応付けられたことを示すマーク（対応付け
済みマークと呼ぶ）が付加される。つまり、この場合、
１番目の辞書ストロークに対しては２番目の入力ストロ
ークが対応付けられたので、２番目の入力ストロークに
対応付け済みマークが付加される。なお、前記マークを
付加するというのは、それぞれの入力ストロークに対応
して設けられた状態を表す信号を変化させることにより
行い、たとえば、“０”を“１”とする。

【００３９】次に、辞書３から２番目の照合順番に設定
された辞書ストロークが読み出され、類似度計算部５に
より、読み出された２番目の辞書ストロークと入力スト
ロークとの照合を行い類似度の計算が行われる。その
際、１番目〜８番目までの入力ストロークに対応付け済
みのマークが有るか否かを判断するが、この場合、２番
目のストロークに対応付け済みのマークが付加されてい
るので、読み出された２番目の辞書ストロークと、１〜
８番目の入力ストロークのうち、２番目のを除いた入力
ストロークとを１つ１つ照合し、類似度計算部５により
類似度を計算する。これにより得られた類似度をｄ８
１，ｄ８３，・・・，ｄ８８で表す。そして、対応付け
処理部６によって、求められた類似度の中で最も大きい
類似度が選択され、この場合、ｄ８８が最も大きい類似
度（図中に丸印で囲んで示す）であるので、その類似度
を有する８番目の入力ストロークが選択される。

【００４０】このようにして、２番目の辞書ストローク
に対しては８番目の入力ストロークが最も類似度が高い
と判定され、２番目の辞書ストロークに対しては８番目
の入力ストロークが対応付けられたことになり、マーク
付加部４により、その対応づけられた８番目の入力スト
ロークに対して、対応付け済みマークを付加する。

【００４１】次に、３番目の辞書ストロークと、入力ス
トロークの２番目と８番目を除く各入力ストロークを順
番にマッチングを取り、類似度計算部５により類似度を
計算する。これにより得られた類似度をｄ７１，ｄ７
３，・・・，ｄ７７で表す。そして、これら求められた
類似度の中で基も大きい類似度を探す。この場合、ｄ７
７が最も大きい類似度であり、図中に丸印で囲んで示
す。

【００４２】このようにして、３番目の辞書ストローク
に対しては７番目の入力ストロークが最も類似度が高い
と判定され、７番目の入力ストロークに対応付け済みマ
ークを付加する。

【００４３】以上のように、予め決められた照合順序に
従って、辞書３から辞書ストロークを１つずつ読み出
し、その読み出された辞書ストロークとマークの付加さ
れていないすべての入力ストロークとの類似度計算を入
力ストローク毎に行い、最大の類似度を有する入力スト
ロークを選び、選ばれた入力ストロークに対して対応付
け済みマークを付加し、マークの付された入力ストロー
クは以降の類似度計算対象としないという処理を行うこ
とにより、類似度計算対象となる入力ストロークを、辞
書ストロークを読み出す毎に減らして行くことができ
る。図２の例では、たとえば、７番目の順序に設定され
た辞書ストロークは、図からもわかるように、４番目の
入力ストロークと５番目の入力ストロークとの間で類似
度計算すればよいことになり、これにより４番目の入力
ストロークが選ばれると、その入力ストロークは以降の
対応付けを行わないので、８番目の順序に設定された辞
書ストロークは、５番目の入力ストロークのみと類似度
計算を行えばよいことになる。

【００４４】このような処理を行うことにより、図２の
例では、辞書に登録されている或る１つの文字に対して
３６回の類似度計算で済む。なお、このような処理を、
辞書に登録された認識対象文字すべてについて、各文字
ごとに行う。そして、辞書３から読み出された辞書スト
ロークが入力文字とは異なる文字の辞書ストロークであ
っても、その文字を構成する辞書ストロークを決められ
た順に従って１つずつ読み出して、入力ストロークとの
間で類似度計算されるが、計算された類似度がたとえ低
い値であっても、その中で最も高い類似度を有する入力
ストロークに対してマークを付加し、以降は、マークの
ない入力ストロークのみに対して類似度計算を行うとい
う処理を行うので、認識対象文字がたとえ数千存在して
も、類似度計算回数を大幅に減らすことができる。

【００４５】以上は部首を越えての筆順誤りがない場
合、つまり、１つの部首内での筆順誤りがある場合の認
識処理であったが、本発明は、１つの部首を書き終わら
ないうちに次の部首に移るというような部首を越えての
大きな筆順誤りがある場合や、ストロークの続けや省略
があっても少ない類似度計算で正確に認識できるもので
あり、以下、これについて説明する。

【００４６】図３は「欧」という文字が部首を越えた筆
順誤り（図９で示した筆順と同じ）で入力された場合の
処理を説明するものである。なお、この場合も、辞書ス
トロークの照合の順番は図２と同様に設定されているも
のとする。

【００４７】図３において、まず、辞書３から１番目の
順番に設定された辞書ストロークが読み出される。最初
はどの入力ストロークに対してもマークは付加されてい
ないので、１番目の辞書ストロークと、入力ストローク
の１番目〜８番目までを順番に照合し、類似度計算部５
により類似度が計算される。これにより得られた類似度
を図２と同様、ｄ４１，ｄ４２，・・・，ｄ４８で表
す。そして、これら求められた類似度の中で基も大きい
類似度を探す。この場合は、最も大きい類似度はｄ４２
であり、図中に丸印で囲んで示す。

【００４８】このようにして、１番目の辞書ストローク
に対しては２番目の入力ストロークが最も類似度が高い
と判定され、マーク付加部４により２番目の入力ストロ
ークに対して、対応付け済みマークを付加し、このマー
クが付加された入力ストロークはそれ以降は類似度計算
の対象外とする。

【００４９】次に、２番目の辞書ストロークと、入力ス
トロークの２番目を除く１番目〜８番目までを順番にマ
ッチングを取り、類似度計算部５により類似度を計算す
る。これにより得られた類似度の中で基も大きい類似度
を探す。この場合、最も大きい類似度はｄ８８であり、
図中に丸印で囲んで示す。

【００５０】このようにして、２番目の辞書ストローク
に対しては６番目の入力ストロークが最も類似度が高い
と判定され、６番目の入力ストロークに対応付け済みマ
ークを付加し、この６番目の入力ストロークはそれ以降
類似度の計算対象とはしない。

【００５１】次に、３番目の辞書ストロークと、入力ス
トロークの２番目と６番目を除く各入力ストロークを順
番にマッチングを取り、類似度計算部５により類似度を
計算する。これにより得られた類似度の中で基も大きい
類似度を探す。この場合、最も大きい類似度はｄ７７で
あり、図中に丸印で囲んで示す。

【００５２】このようにして、３番目の辞書ストローク
に対しては５番目の入力ストロークが最も類似度が高い
と判定され、５番目の入力ストロークに対応付け済みマ
ークを付加し、この５番目の入力ストロークはそれ以降
類似度の計算対象とはしない。

【００５３】以上のように、辞書に記述された対応付け
順序に従って、辞書３から辞書ストロークを読み出し、
その読み出された辞書ストロークと対応付け済みマーク
の付加されていないすべての入力ストロークとの類似度
計算を入力ストローク毎に行い、最大の類似度を有する
入力ストロークを選び、選ばれた入力ストロークに対し
て対応付け済みマークを付加し、その入力ストロークは
以降の類似度計算対象としないという処理を行うことに
より、この図３の例では３６回の類似度計算で済み、し
かも、部首を越えた筆順誤りがあっても正確な対応付け
が行える。

【００５４】また、図４は「欧」という文字のストロー
クに続けが有る場合の処理を示すものである。ストロー
クの続けは、図１０で示したのと同じ部分であり、筆者
が「欧」という文字を筆順は正しく入力したものの、５
画目と６画目に相当する部分（「欠」の上の構成部分）
を続けて１つのストロークで書いた場合であり、この場
合、総入力ストローク数は１ストローク少ない７ストロ
ーク（７画）となる。なお、この場合も、辞書ストロー
クの対応付け順序は図２と同様に設定されているものと
する。

【００５５】図４において、まず、辞書３から１番目の
対応付け順序に設定された辞書ストロークが読み出され
る。最初はどの入力ストロークに対してもマークは付加
されていないので、１番目の辞書ストロークと、入力ス
トロークの１番目〜７番目までを順番にマッチングを取
り、類似度計算部５により類似度を計算する。これによ
り得られた類似度を図２と同様、ｄ４１，ｄ４２，・・
・，ｄ４７で表す。そして、これら求められた類似度の
中で基も大きい類似度を探す。この場合、最も大きい類
似度はｄ４４であり、図中に丸印で囲んで示す。

【００５６】このようにして、１番目の辞書ストローク
に対しては４番目の入力ストロークが最も類似度が高い
と判定され、マーク付加部４によりその４番目の入力ス
トロークに対して、対応付け済みマークを付加し、この
マークが付加された４番目の入力ストロークはそれ以降
は類似度計算の対象外とする。

【００５７】次に、２番目の辞書ストロークと、入力ス
トロークの４番目を除く１番目〜７番目までを順番にマ
ッチングを取り、類似度計算部５により類似度を計算す
る。これにより得られた類似度の中で基も大きい類似度
を探す。この場合、最も大きい類似度はｄ８７であり、
図中に丸印で囲んで示す。

【００５８】このようにして、２番目の辞書ストローク
に対しては７番目の入力ストロークが最も類似度が高い
と判定され、７番目の入力ストロークに対応付け済みマ
ークを付加し、この７番目の入力ストロークはそれ以降
類似度の計算対象とはしない。

【００５９】次に、３番目の辞書ストロークと、入力ス
トロークの４番目と７番目を除く各入力ストロークを順
番にマッチングを取り、類似度計算部５により類似度を
計算する。これにより得られた類似度の中で基も大きい
類似度を探す。この場合、最も大きい類似度はｄ７６で
あり、図中に丸印で囲んで示す。

【００６０】このようにして、３番目の辞書ストローク
に対しては６番目の入力ストロークが最も類似度が高い
と判定され、６番目の入力ストロークに対応付け済みマ
ークを付加し、この６番目の入力ストロークはそれ以降
類似度の計算対象とはしない。

【００６１】ところで、本発明では、辞書ストロークの
対応付け順序は、前記したように、対応付け誤りの少な
い順序に並べられている。この「欧」という文字につい
ていえば、前記したように、文字の外縁部でしかも長い
ストロークから順に並べている。

【００６２】一般に、続けて書かれることにより省略さ
れやすいストロークは、長さの短いストロークである場
合が多い。たとえば、「欧」という文字の場合は、
「欠」の上の部分（「欧」の５画目と６画目）は比較的
ストロークの続けが生じやすい部分である。このよう
に、続けて書かれることにより省略されやすいストロー
クは、照合の順番が後の方の順番（たとえば「欧」でい
えば、５画目の短いストロークは８番目）となるように
辞書に記述されている。

【００６３】このようにストローク同士の対応付け誤り
の少ない辞書ストロークから先に照合を行うような順番
を設定することで、この「欧」という文字を例にとれ
ば、「欧」という文字を構成する辞書ストロークのう
ち、上位の順位に設定された辞書ストロークは図２〜図
４からもわかるように、結果的に、正確な対応付けが行
われる。これに対して、対応付け誤りの多いとされるス
トローク（たとえば、続けて書かれることにより省略さ
れやすいストローク）は、照合を後の順番で行うように
している。その結果、ストロークの続けや省略が、辞書
ストロークの余りという形で現れる。図４の例では、入
力ストローク数が７個であり、辞書ストローク数が８個
であるため、８番目の辞書ストロークが余ってしまうこ
とになる。この余った辞書ストロークは、たとえば、そ
の余った辞書ストロークの長さをエラー値としてその文
字に対する合計の類似度に反映させるなど何らかの形で
処理することが可能である。

【００６４】このようにストロークの続けや省略があっ
た場合でも正確に認識することができ、しかも少ない計
算量での対応付けが可能となる。

【００６５】図５は以上説明した本発明の処理をＰＡＤ
（Ｐrogram Ａnalysis Ｄiagram）により説明するもの
であり、ある１つの文字を構成するそれぞれの辞書スト
ロークと入力ストロークの対応付けの処理を示すもので
ある。図５において、ある文字が入力されると、辞書に
登録された認識対象の１文字ごとにその文字を構成する
すべての辞書ストロークについて、予め記述された順番
に従って１番目の辞書ストロークを読み出す（ステップ
ｓ１，ｓ２）。そして、入力された文字の入力ストロー
クのうち、対応付け済みマークの付加されていない入力
ストロークについて、順番に入力ストロークを読み出
し、それぞれの類似度計算を行う（ステップｓ３〜ｓ
５）。この処理を対応付け済みマークの付加されていな
い入力ストロークすべてについて行い、それぞれ求めら
れた類似度のうち最大類似度を求め（ステップｓ６）、
最大類似度の入力ストロークに対応付け済みマークを付
加する（ステップｓ７）。そして、ステップｓ２に戻
り、次の順番に設定された辞書ストロークを読み出し、
対応付け済みマークの付加されていない入力ストローク
について、順番に入力ストロークを読み出して、それぞ
れの類似度計算を行う（ステップｓ３〜ｓ５）。この処
理を対応付け済みマークの付加されていない入力ストロ
ークすべてについて行い、それぞれ求められた類似度の
うち最大類似度を求め（ステップｓ６）、最大類似度の
入力ストロークに対応付け済みマークを付加する（ステ
ップｓ７）。このような処理を、ある１つの文字の全て
の辞書ストロークが終了するまで行い、その文字の辞書
ストローク全てについて終了すると、次の文字における
辞書ストロークについて以上の処理を行い、認識対象文
字全てについて同じ処理を行う。

【００６６】辞書３には、たとえば、認識対象文字とし
て５０００文字分程度が用意されており、それぞれの文
字に対応する辞書ストロークが登録されている。図５に
示すＰＡＤは５０００文字のうちの１つの文字の辞書ス
トロークについての処理であり、実際には、１つの入力
文字に対してこれを５０００回繰り返すことになる。

【００６７】したがって、仮に１つの文字の入力ストロ
ーク数が１０本、１つの文字の辞書ストローク数が平均
１０本、認識対象文字数が５０００文字であるとすれ
ば、処理速度の点で従来と比較すれば、たとえば、図６
に示す第１の従来技術の場合、１０×１０×５０００＝
５０００００回の類似度計算が必要であるが、本発明に
よれば、１０！×５０００＝（１０＋９＋８＋７＋６＋
５＋４＋３＋２＋１）×５０００＝５５×５０００＝２
７５００００回となり、処理は約１．８倍高速になる。

【００６８】なお、以上説明した実施の形態では、辞書
との対応付けを行う特徴量として文字の画数に対応する
ストロークを用いたが、この特徴量は、１本のストロー
クを幾つかに分割した部分ストロークでもよく、さらに
は、他の特徴量を用いても良い。要は、辞書に登録され
た内容とのマッチングが行え、類似度が求められる特徴
量であればよい。

【００６９】また、本発明の処理を行うプログラムはフ
ロッピィディスクなどの記憶媒体に記憶させておくこと
ができ、本発明は、その記憶媒体をも含むものである。

【００７０】

【発明の効果】以上説明したように、本発明によれば、
予め設定された照合の順番に従って、辞書から特徴量を
読み出し、その読み出された特徴量に対応付けられた入
力文字の特徴量に対して対応付け済みを示す符号を付
し、その符号の付された入力文字の特徴量は以降の対応
付け処理を行わないようにするようにしたので、部首を
越えた大きな筆順誤りや、ストロークの続け、省略が有
っても、辞書の特徴量と入力された特徴量との照合を行
う際の特徴量同士の対応付け誤りを起こさずに、少ない
計算量で類似度計算が行え、かつ、高い認識率での文字
認識が可能となる。

【図面の簡単な説明】

【図１】本発明の実施の形態の構成を説明するブロック
図。

【図２】同実施の形態における処理の具体例（その１）
を説明する図。

【図３】同実施の形態における処理の具体例（その２）
を説明する図。

【図４】同実施の形態における処理の具体例（その３）
を説明する図。

【図５】同実施の形態における処理の流れを説明する
図。

【図６】第１の従来技術の処理を説明する図。

【図７】第２の従来技術の処理を説明する図。

【図８】第３の従来技術の処理を説明する図。

【図９】従来技術における問題点の例として第２の従来
技術の問題点（その１）を説明する図。

【図１０】従来技術における問題点の例として第２の従
来技術の問題点（その２）を説明する図。

【符号の説明】

１文字入力部２ストローク抽出部３辞書４マーク付加部５類似度計算部６対応付け処理部７認識結果出力部ｄ１１，ｄ１２，・・・計算された類似度

Claims

【特許請求の範囲】

【請求項１】ある文字が入力されることによりその文
字を構成する特徴量を抽出し、その抽出された特徴量
と、辞書に登録されている特徴量とを照合して対応付け
することにより、入力文字の認識を行うオンライン手書
き文字認識方法において、前記辞書に登録される認識対象文字の１つずつの文字を
構成するそれぞれの特徴量に対し、入力文字を構成する
特徴量との照合を行う順番を予め記述しておき、入力文
字の特徴量との対応付けを行う際、辞書に登録された或
る文字を構成するそれぞれの特徴量を、前記記述された
順番に従って１つずつ読み出して、読み出された特徴量
と入力文字を構成するそれぞれの特徴量とを照合し、そ
の照合を行う際、前記入力文字を構成するそれぞれの特
徴量に対応付け済みを示す符号が付されているか否かを
判断し、符号のない入力文字の特徴量に対してのみ照合
処理を行い、その照合処理により対応付けられた入力文
字の特徴量に対して対応付け済みを示す符号を付すこと
を特徴とするオンライン手書き文字認識方法。
【請求項２】前記辞書に記述される照合を行う順番
は、入力文字のそれぞれの特徴量との照合を行う際、特
徴量同士の対応付け誤りの少ない順にそれぞれの特徴量
が辞書から読み出されるような順番とすることを特徴と
する請求項１記載のオンライン手書き文字認識方法。
【請求項３】前記文字を構成する特徴量は、ストロー
クであることを特徴とする請求項１または２に記載のオ
ンライン手書き文字認識方法。
【請求項４】ある文字が入力されることによりその文
字を構成する特徴量を抽出し、その抽出された特徴量
と、辞書に登録されている特徴量とを照合して対応付け
することにより、入力文字の認識を行うオンライン手書
き文字認識装置において、入力された文字からその文字を構成するそれぞれの特徴
量を抽出する特徴量抽出手段と、認識対象の各文字毎にその文字を構成するそれぞれの特
徴量が登録されるとともに、或る１つの文字を構成する
それぞれの特徴量に対し、予め決められた照合の順番が
記述された辞書と、辞書に登録された特徴量との対応付けが済んだ入力文字
の特徴量に対し、対応付け済みを示す符号を付す符号付
加部と、前記辞書から記述された順番に従って１つずつ読み出さ
れた或る文字を構成するそれぞれの特徴量と、入力文字
を構成するそれぞれの特徴量とを照合する際、前記入力
文字を構成するそれぞれの特徴量に対応付け済みを示す
符号が付されているか否かを判断し、符号のない入力文
字の特徴量に対してのみ照合処理を行い、類似度を求め
る類似度計算部と、この類似度計算部で求められた類似度を基に、辞書から
読み出された特徴量に対して最大の類似度を有する入力
文字の特徴量を対応付け済みの特徴量として選択する対
応付け処理部と、を有することを特徴とするオンライン手書き文字認識装
置。
【請求項５】前記辞書に記述される照合を行う順番
は、入力文字のそれぞれの特徴量との照合を行う際、特
徴量同士の対応付け誤りの少ない順にそれぞれの特徴量
が読み出されるような順番とすることを特徴とする請求
項４記載のオンライン手書き文字認識装置。
【請求項６】前記文字を構成する特徴量は、ストロー
クであることを特徴とする請求項４または５に記載のオ
ンライン手書き文字認識装置。