JPH1049630A - オンライン手書き文字認識方法および装置 - Google Patents

オンライン手書き文字認識方法および装置

Info

Publication number
JPH1049630A
JPH1049630A JP9128988A JP12898897A JPH1049630A JP H1049630 A JPH1049630 A JP H1049630A JP 9128988 A JP9128988 A JP 9128988A JP 12898897 A JP12898897 A JP 12898897A JP H1049630 A JPH1049630 A JP H1049630A
Authority
JP
Japan
Prior art keywords
character
input
dictionary
stroke
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9128988A
Other languages
English (en)
Inventor
Toshio Tanaka
敏雄 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP9128988A priority Critical patent/JPH1049630A/ja
Publication of JPH1049630A publication Critical patent/JPH1049630A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 部首を越えての筆順誤りやストロークの続
け、省略があっても認識可能とし、しかも、少ない計算
量で高速に文字認識する必要がある。 【解決手段】 文字が入力されると、辞書に登録された
或る1文字を構成するそれぞれの辞書ストロークについ
て、予め記述された順番に従って一本の辞書ストローク
を読み出す(ステップs1,s2)。そして、対応付け
済みマークのない入力ストロークを読み出し、類似度計
算を行う(ステップs3〜s5)。この処理を対応付け
済みマークのない入力ストロークすべてについて行い、
それぞれ求められた類似度のうち最大類似度を求め(ス
テップs6)、求められた入力ストロークに対応付け済
みマークを付加する(ステップs7)。このような処理
を、ある1つの文字の全ての辞書ストロークが終了する
まで行い、それを認識対象文字すべてについて同じ処理
を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力文字の特徴量
と辞書に登録されている特徴量とを対応付けして、文字
認識を行うオンライン手書き文字認識において、筆順の
誤りやストロークの続け、省略があっても認識可能とし
たオンライン手書き文字認識方法および装置に関する。
【0002】
【従来の技術】オンライン手書き文字認識は、入力筆跡
情報と辞書に登録された筆跡情報とのマッチングを取
り、類似度の高い辞書パターンを認識結果とすることが
一般に行われている。このようなオンライン手書き文字
認識においては、筆跡の情報として、一般に文字の画数
に対応したストロークや、そのストロークを分割した部
分ストロークの特徴を用い、入力された文字を構成する
ストローク(入力ストロークと呼ぶ)と辞書に登録され
たストローク(辞書ストロークと呼ぶ)との類似度を求
めることで認識することが従来より普通に行われてい
る。
【0003】このような認識方法において、認識を行う
際、入力ストロークがその文字において何画目かという
入力ストロークの入力順序情報を用いる場合と用いない
場合とがある。
【0004】入力ストロークの入力順序情報を用いる方
法は、類似度を計算する際に、入力ストロークと辞書ス
トロークを同じ画に絞ってマッチングを行うので、類似
度の計算量が少なく認識処理を高速に行えるという利点
があるが、入力文字の筆順が誤っていると認識できない
という欠点があった。
【0005】これに対して、入力順序情報を用いない方
法は、筆順に誤りが有っても認識できるため、入力順序
情報を用いるものに比べて有利な方法である。この入力
順序情報を用いない方法は、入力ストロークと辞書スト
ロークとのマッチングの組み合わせを何画目かという制
限なしに作成し、それぞれの組み合わせによる類似度を
計算して、入力文字の認識を行うものである。
【0006】たとえば、特公昭58−27551(第1
の従来技術という)で示されるオンライン手書き文字認
識方式は、辞書に登録されている認識対象文字ごとのす
べての辞書ストロークを1文字毎に読み出して、その読
み出された辞書ストロークと入力文字を構成するすべて
のストロークとを照合し、類似度を計算して、その計算
結果を基に認識するものである。
【0007】図6は「欧」という文字が入力された場
合、その入力文字を構成するそれぞれのストロークと辞
書ストロークとのマッチングを行った例を示すものであ
る。図6において、太線で示されている部分はその時点
において照合を行うべき1本のストロークを示すもの
で、たとえば、辞書に登録された1画目のストロークに
対して、1番目に入力された入力ストローク、2番目に
入力された入力ストローク、3番目目に入力された入力
ストロークというように照合し、それぞれの類似度を計
算し、その計算結果をd11,d12,d13,・・・
というように表している。
【0008】このように、認識対象文字の1画目から順
にそれぞれの画に対応した辞書ストロークに対して、入
力文字の入力順序に従ったストロークすべてと照合し、
類似度を計算し、1画目の辞書ストロークに対しては、
類似度d11〜d18が得られ、2画目の辞書ストロー
クに対しては、類似度d21〜d28が得られるという
ように、総当たりで類似度計算を行っている。そして、
それぞれの画において最も類似度の大きいものを選ぶ。
図ではそれぞれの画における最も大きい類似度を丸で囲
んで示している。なお、実際には、辞書に登録されてい
る認識対象文字(たとえば、5000文字程度)すべて
について前記した処理を行う。
【0009】このような処理を行うことにより、入力文
字の筆順に関係なく文字認識が行えるが、類似度の計算
回数はこの図6の例では、辞書に登録された1つの文字
に対してだけでも64回にもおよび、これをすべての認
識対象文字との間で処理を行うため、類似度計算量は膨
大なものとなり、認識するまでにきわめて多くの時間を
要する欠点がある。
【0010】この問題を克服するために類似度の計算回
数を減らそうとする方法も幾つか提案されている。その
1つの方法として、1つの文字を部首などにより、幾つ
かの部分パターンに分けて、各々の部分パターン内で総
当たりにストローク間の類似度を計算する方法がある。
たとえば、特開昭60−237581(第2の従来技術
という)では、或る文字においては殆ど全ての筆者にお
ける筆順変動が、m画目からn画目の間で行われるとし
た場合、m画目までを1つの部分パターン、n画目以降
を他の1つの部分パターンとして、これら部分パターン
内のみで、入力ストロークと辞書ストロークの各ストロ
ーク間で総当たりに類似度を計算している。
【0011】図7はこの第2の従来技術を用いて前記し
た「欧」という文字についてマッチングを行った例を示
すもので、この場合は、「欧」の文字の1画目〜4画目
までを1つの部分パターンp1、5画目と6画目を1つ
の部分パターンp2、7画目を1つの部分パターンp
3,8画目を1つの部分パターンp4というように4つ
の部分パターンに分けて、これら4つの部分パターン内
のみで、入力ストロークと辞書ストロークの各ストロー
ク間で総当たりに類似度を計算している(それぞれの画
における最も大きい類似度を丸で囲んで示している)。
このように、類似度を計算するために総当たりの組み合
わせを、部分パター内のみに制限することにより類似度
の計算回数を減らすことができ、図7の例では、類似度
の計算回数は1つの辞書登録文字に対して22回とな
り、図6に比べれば大幅に類似度計算回数を減らすこと
ができる。
【0012】この幾つかの部分パターンに分けて、各々
の部分パターン内で総当たりにストローク間の類似度を
計算する方法の他の例としては特開昭60−25438
4(第3の従来技術という)がある。この第3の従来技
術は、辞書パターンにパターン切れ目情報を付加し、そ
の切れ目情報で指定された範囲内において、総当たりの
マッチングを行って類似度を計算することで計算回数を
減らそうとするものである。
【0013】図8はこの第3の従来技術を用いて前記し
た「欧」という文字についてマッチングを行った例を示
すもので、この場合には、パターン切れ目を、「欧」と
いう文字を構成する2つの部首、「区」と「欠」の間と
し、部分パターンをp11,p12の2つに分けて、2
つの部分パターン内のみで、入力ストロークと辞書スト
ロークの各ストローク間で総当たりに類似度を計算して
いる(それぞれの画における最も大きい類似度を丸で囲
んで示している)。このように、類似度を計算するため
に総当たりの組み合わせを部分パター内のみに制限する
ことにより類似度の計算回数を減らすことができ、図8
の例では、類似度の計算回数は32回に減少し、図6に
比べれば計算回数を1/2に減らすことができる。
【0014】
【発明が解決しようとする課題】前記したように、第1
〜第3の従来技術は、確かに類似度計算の回数を減らし
認識速度の高速化を図るという点では一定の効果が得ら
れるが、辞書作成時に予測できない部分パターンを越え
る筆順間違いが有った場合には対応できないという問題
があり、さらに、ストロークの続けや省略があった場合
には誤認識になる可能性が極めて高いという問題があっ
た。
【0015】たとえば、図9は筆者が「欧」という文字
を部首を越えた筆順誤りで書いた場合に、前記第2の従
来技術を用いてマッチングを行った例を示すものであ
る。この第2の従来技術の場合には、この文字に対して
は部分パターンをたとえば4つに分けて、4つの部分パ
ターン内のみで、入力ストロークと辞書ストロークの各
ストローク間で総当たりに類似度を計算する。ところ
で、部首を越えた筆順誤りというのは、「欧」という文
字を例にとると、たとえば、1つの部首である「区」が
書き終わらないうちに、次の部首に移り、また、「区」
に戻るというような筆順である。
【0016】この図9の例では、本来、第1の部分パタ
ーン内p1にて類似度が計算されるべき入力ストローク
が、この例では、第7画目や第8画目で書かれ、第2の
部分パターンp2にて類似度が計算されるべきストロー
クが、この例では、第3画目や第4画目で書かれ、ま
た、第3の部分パターン内p3にて類似度が計算される
べきストロークが、この例では、第5画目で書かれ、さ
らに、第4の部分パターン内p4にて類似度が計算され
るべきストロークが、この例では、第2の部分パターン
p2内の第6画目で書かれているため、それぞれの部分
パターン内で正確な対応付けが行えなくなる。図9にお
いて、丸で囲ったものが辞書ストロークと入力ストロー
クとを対応付けることのできる大きな値を有する類似度
であるが、それぞれの部分パターンにおいて一定以上の
類似度の得られず対応付けのできない入力ストロークが
出てくるため、誤認識される可能性が高い。
【0017】また、図10は筆者が「欧」という文字を
筆順は正しく入力したものの、1部のストロークを続け
た場合における前記第2の従来技術を用いてマッチング
を行った例を示すもので、この場合、5画目と6画目に
相当する部分(「欠」の上の構成部分)が続けて1つの
ストロークで書かれ、入力ストローク数は1ストローク
少ない7ストローク(7画)となっている。
【0018】このように入力された文字にストロークの
続けがある場合、辞書からその入力文字と同じ文字の辞
書ストロークが読み出されたとしても、画数が異なって
くるため、辞書の内容とのマッチングが取れなくなり、
誤認識される可能性が高い。
【0019】そこで、本発明は、部首を越えての筆順誤
りやストロークの続け、省略があっても認識可能とし、
しかも、マッチングの計算量を少なくし認識速度の高速
化を図れるオンライン手書き文字認識方法および装置を
実現することを目的とする。
【0020】
【課題を解決するための手段】本発明のオンライン手書
き文字認識方法は、ある文字が入力されることによりそ
の文字を構成する特徴量を抽出し、その抽出された特徴
量と、辞書に登録されている特徴量とを照合して対応付
けすることにより、入力文字の認識を行うオンライン手
書き文字認識方法において、前記辞書に登録される認識
対象文字の1つずつの文字を構成するそれぞれの特徴量
に対し、入力文字を構成する特徴量との照合を行う順番
を予め記述しておき、入力文字の特徴量との対応付けを
行う際、辞書に登録された或る文字を構成するそれぞれ
の特徴量を、前記記述された順番に従って1つずつ読み
出して、読み出された特徴量と入力文字を構成するそれ
ぞれの特徴量とを照合し、その照合を行う際、前記入力
文字を構成するそれぞれの特徴量に対応付け済みを示す
符号が付されているか否かを判断し、符号のない入力文
字の特徴量に対してのみ照合処理を行い、その照合処理
により対応付けられた入力文字の特徴量に対して対応付
け済みを示す符号を付すことを特徴とする。
【0021】そして、前記辞書に記述される照合を行う
順番は、入力文字のそれぞれの特徴量との照合を行う
際、特徴量同士の対応付け誤りの少ない順にそれぞれの
特徴量が辞書から読み出されるような順番とし、また、
前記文字を構成する特徴量としては、ストロークを用い
ることが可能である。
【0022】また、本発明のオンライン手書き文字認識
装置は、ある文字が入力されることによりその文字を構
成する特徴量を抽出し、その抽出された特徴量と、辞書
に登録されている特徴量とを照合して対応付けすること
により、入力文字の認識を行うオンライン手書き文字認
識装置において、入力された文字からその文字を構成す
るそれぞれの特徴量を抽出する特徴量抽出手段と、認識
対象の各文字毎にその文字を構成するそれぞれの特徴量
が登録されるとともに、或る1つの文字を構成するそれ
ぞれの特徴量に対し、予め決められた照合の順番が記述
された辞書と、辞書に登録された特徴量との対応付けが
済んだ入力文字の特徴量に対し、対応付け済みを示す符
号を付す符号付加部と、前記辞書から記述された順番に
従って1つずつ読み出された或る文字を構成するそれぞ
れの特徴量と、入力文字を構成するそれぞれの特徴量と
を照合する際、前記入力文字を構成するそれぞれの特徴
量に対応付け済みを示す符号が付されているか否かを判
断し、符号のない入力文字の特徴量に対してのみ照合処
理を行い、類似度を求める類似度計算部と、この類似度
計算部で求められた類似度を基に、辞書から読み出され
た特徴量に対して最大の類似度を有する入力文字の特徴
量を対応付け済みの特徴量として選択する対応付け処理
部とを有することを特徴とする。
【0023】そして、前記辞書に記述される照合を行う
順番は、入力文字のそれぞれの特徴量との照合を行う
際、特徴量同士の対応付け誤りの少ない順にそれぞれの
特徴量が読み出されるような順番とし、また、前記文字
を構成する特徴量としては、ストロークを用いることが
可能である。
【0024】このような手段を用いることにより、部首
を越えた筆順誤りやストロークの続けがあっても認識可
能となり、また、総当たりの認識を行わないので、類似
度計算量を大幅に減らすことができ、認識速度の高速化
が図れる。
【0025】また、前記辞書に登録された各文字を構成
する特徴量の照合順序は、入力文字のそれぞれの特徴量
との照合を行う際に、特徴量同士の対応付け誤りの少な
い順とし、その順番に従って、辞書の特徴量が1つ1つ
読み出され、読み出された辞書の特徴量と入力された文
字のそれぞれの特徴量とが照合されることにより、特徴
量同士の対応付けの誤りを少なくすることができる。さ
らに、前記文字を構成する特徴量をストロークとするこ
とにより、特徴量の抽出が容易で類似度を計算しやす
く、高精度な認識を行うことができる。
【0026】
【発明の実施の形態】以下本発明の実施の形態を説明す
る。
【0027】図1は本発明の実施の形態を説明するブロ
ック図であり、タブレット上にペンなどで入力された文
字に対する座標データを時系列データとして出力する文
字入力部1、この文字入力部1から送られてくる時系列
の座標データをもとに、その文字を構成する特徴量とし
てのストロークを抽出するストローク抽出部2、認識対
象の各文字毎にその文字を構成するそれぞれの特徴量
(ここではストロークの特徴データ)が登録されるとと
もに、1つの文字を構成するそれぞれのストロークに対
し、予め決められた照合の順番が記述された辞書3、辞
書3に登録された或る文字における1つのストローク
(辞書ストローク)との対応付けが済んだ入力文字のス
トローク(入力ストローク)に対し、対応付け済みを示
す符号としてのマークを付すマーク付加部4、前記記述
された順番に従って辞書3から読み出された或る1つの
文字を構成する1本の辞書ストロークと、入力された文
字を構成するそれぞれの入力ストロークとを照合し、前
記対応付け済みのマークの有無を判断して、マークの付
加されていない入力ストロークの類似度を計算する類似
度計算部5、この類似度計算部5で求められた類似度に
基づいて、辞書から読み出された辞書ストロークとの対
応付けを行う対応付け処理部6、この対応付け処理部6
による処理結果をもとに入力文字の認識結果を出力する
認識結果出力部7などから構成されている。なお、これ
ら各構成要素の詳細(特に、辞書3の登録内容、マーク
付加部4、類似度計算部5などの処理)は、以下に説明
する。
【0028】前記辞書3は、前記したように、認識対象
の1つ1つの文字に対してそれぞれの文字ごとにその文
字を構成するそれぞれのストロークの特徴データが登録
されるが、1つの文字毎に入力ストロークとの照合順番
を決めておき、その順番が記述されている。したがっ
て、入力された文字を構成するそれぞれの入力ストロー
クとの照合を行う際、或る1つの文字を構成する何本か
の辞書ストロークが、記述された順番にしたがって1本
ずつ読み出されるようになっている。
【0029】ところで、前記記述される順番とは、入力
ストロークとの照合を行う際、それぞれの入力ストロー
クとの間での対応付け誤りの少ないと思われる順番が設
定される。この対応付けの誤りの少ない順とは、具体的
には、 (1)1つの文字を構成するストロークのうち特徴的な
ストローク(たとえば、長さの長いストローク)から順
に照合を行うように順序を記述しておく。
【0030】(2)1つの文字を構成するストロークの
うち文字の外縁に位置するストロークから順に照合を行
うように順序を記述しておく。
【0031】(3)1つの文字を構成するストロークの
うち特定の方向に位置するストロークから順に照合を行
うように順序を記述しておく。
【0032】(4)前記(1)〜(3)を任意に組み合
わせた順序、たとえば前記(1)と(2)を組み合わ
せ、外縁に位置し、しかも特徴的なストローク(たとえ
ば、長さの長いストローク)から順に照合を行うように
順序を記述しておく。
【0033】等が考えられる。
【0034】たとえば、「欧」という文字におけるそれ
ぞれの辞書ストロークについて考えると、入力ストロー
クとの照合を行った場合に、ストローク同士の対応付け
誤りの少ないと思われる順番として、図2に示すような
順番を予め記述しておく。図2において、太線で書かれ
た辞書ストロークが記述の順に従って照合されるストロ
ークであり、「欧」を構成する8本の辞書ストロークの
照合の順序として1番目〜8番目までを予め決めてお
き、その順番を記述しておく。なお、この図2に示され
る照合の順番は、前記した(4)で示した外縁に位置
し、しかも長さの長いストロークから照合を行うという
設定である。
【0035】今、入力ストロークが図2に示すような順
序で入って来たとする(その時点で入力されたストロー
クを太線で示す)。なお、この図2の例は、部首の1つ
である「区」の部分に筆順誤りがある例である。
【0036】辞書3には認識対象の文字すべてについ
て、それぞれの文字毎の辞書ストロークが登録されてい
るが、図2は認識対象文字のなかの1つの文字として
「欧」の辞書ストロークが予め記述された順番で読み出
された例を示している。
【0037】まず、辞書3から1番目の順番に設定され
た辞書ストロークが読み出され、類似度計算部5によ
り、読み出された1番目の辞書ストロークと、それぞれ
の入力ストロークの照合を1つ1つ順番に行い、類似度
の計算が行われるが、その際、1番目〜8番目までの入
力ストロークに対応付け済みのマークが付加されている
か否かを判断する。最初はどの入力ストロークに対して
も対応付け済みのマークは付加されていないので、前記
読み出された1番目の辞書ストロークと、入力ストロー
クの1番目〜8番目までを順番に照合し、類似度計算部
5によりそれぞれの類似度を計算する。これにより得ら
れた類似度をd41,d42,・・・,d48で表す。
そして、対応付け処理部6により、求められた類似度の
中で最も大きい類似度が選択され、この場合、d42が
最も大きい類似度(図中に丸印で囲んで示す)であるの
で、その類似度を有する2番目の入力ストロークが選択
される。
【0038】このようにして、1番目の辞書ストローク
に対しては2番目の入力ストロークが最も類似度が高い
と判定され、1番目の辞書ストロークと2番目の入力ス
トロークとが対応付けられたことになる。そして、マー
ク付加部4により、その対応付けられた入力ストローク
に対して、対応付けられたことを示すマーク(対応付け
済みマークと呼ぶ)が付加される。つまり、この場合、
1番目の辞書ストロークに対しては2番目の入力ストロ
ークが対応付けられたので、2番目の入力ストロークに
対応付け済みマークが付加される。なお、前記マークを
付加するというのは、それぞれの入力ストロークに対応
して設けられた状態を表す信号を変化させることにより
行い、たとえば、“0”を“1”とする。
【0039】次に、辞書3から2番目の照合順番に設定
された辞書ストロークが読み出され、類似度計算部5に
より、読み出された2番目の辞書ストロークと入力スト
ロークとの照合を行い類似度の計算が行われる。その
際、1番目〜8番目までの入力ストロークに対応付け済
みのマークが有るか否かを判断するが、この場合、2番
目のストロークに対応付け済みのマークが付加されてい
るので、読み出された2番目の辞書ストロークと、1〜
8番目の入力ストロークのうち、2番目のを除いた入力
ストロークとを1つ1つ照合し、類似度計算部5により
類似度を計算する。これにより得られた類似度をd8
1,d83,・・・,d88で表す。そして、対応付け
処理部6によって、求められた類似度の中で最も大きい
類似度が選択され、この場合、d88が最も大きい類似
度(図中に丸印で囲んで示す)であるので、その類似度
を有する8番目の入力ストロークが選択される。
【0040】このようにして、2番目の辞書ストローク
に対しては8番目の入力ストロークが最も類似度が高い
と判定され、2番目の辞書ストロークに対しては8番目
の入力ストロークが対応付けられたことになり、マーク
付加部4により、その対応づけられた8番目の入力スト
ロークに対して、対応付け済みマークを付加する。
【0041】次に、3番目の辞書ストロークと、入力ス
トロークの2番目と8番目を除く各入力ストロークを順
番にマッチングを取り、類似度計算部5により類似度を
計算する。これにより得られた類似度をd71,d7
3,・・・,d77で表す。そして、これら求められた
類似度の中で基も大きい類似度を探す。この場合、d7
7が最も大きい類似度であり、図中に丸印で囲んで示
す。
【0042】このようにして、3番目の辞書ストローク
に対しては7番目の入力ストロークが最も類似度が高い
と判定され、7番目の入力ストロークに対応付け済みマ
ークを付加する。
【0043】以上のように、予め決められた照合順序に
従って、辞書3から辞書ストロークを1つずつ読み出
し、その読み出された辞書ストロークとマークの付加さ
れていないすべての入力ストロークとの類似度計算を入
力ストローク毎に行い、最大の類似度を有する入力スト
ロークを選び、選ばれた入力ストロークに対して対応付
け済みマークを付加し、マークの付された入力ストロー
クは以降の類似度計算対象としないという処理を行うこ
とにより、類似度計算対象となる入力ストロークを、辞
書ストロークを読み出す毎に減らして行くことができ
る。図2の例では、たとえば、7番目の順序に設定され
た辞書ストロークは、図からもわかるように、4番目の
入力ストロークと5番目の入力ストロークとの間で類似
度計算すればよいことになり、これにより4番目の入力
ストロークが選ばれると、その入力ストロークは以降の
対応付けを行わないので、8番目の順序に設定された辞
書ストロークは、5番目の入力ストロークのみと類似度
計算を行えばよいことになる。
【0044】このような処理を行うことにより、図2の
例では、辞書に登録されている或る1つの文字に対して
36回の類似度計算で済む。なお、このような処理を、
辞書に登録された認識対象文字すべてについて、各文字
ごとに行う。そして、辞書3から読み出された辞書スト
ロークが入力文字とは異なる文字の辞書ストロークであ
っても、その文字を構成する辞書ストロークを決められ
た順に従って1つずつ読み出して、入力ストロークとの
間で類似度計算されるが、計算された類似度がたとえ低
い値であっても、その中で最も高い類似度を有する入力
ストロークに対してマークを付加し、以降は、マークの
ない入力ストロークのみに対して類似度計算を行うとい
う処理を行うので、認識対象文字がたとえ数千存在して
も、類似度計算回数を大幅に減らすことができる。
【0045】以上は部首を越えての筆順誤りがない場
合、つまり、1つの部首内での筆順誤りがある場合の認
識処理であったが、本発明は、1つの部首を書き終わら
ないうちに次の部首に移るというような部首を越えての
大きな筆順誤りがある場合や、ストロークの続けや省略
があっても少ない類似度計算で正確に認識できるもので
あり、以下、これについて説明する。
【0046】図3は「欧」という文字が部首を越えた筆
順誤り(図9で示した筆順と同じ)で入力された場合の
処理を説明するものである。なお、この場合も、辞書ス
トロークの照合の順番は図2と同様に設定されているも
のとする。
【0047】図3において、まず、辞書3から1番目の
順番に設定された辞書ストロークが読み出される。最初
はどの入力ストロークに対してもマークは付加されてい
ないので、1番目の辞書ストロークと、入力ストローク
の1番目〜8番目までを順番に照合し、類似度計算部5
により類似度が計算される。これにより得られた類似度
を図2と同様、d41,d42,・・・,d48で表
す。そして、これら求められた類似度の中で基も大きい
類似度を探す。この場合は、最も大きい類似度はd42
であり、図中に丸印で囲んで示す。
【0048】このようにして、1番目の辞書ストローク
に対しては2番目の入力ストロークが最も類似度が高い
と判定され、マーク付加部4により2番目の入力ストロ
ークに対して、対応付け済みマークを付加し、このマー
クが付加された入力ストロークはそれ以降は類似度計算
の対象外とする。
【0049】次に、2番目の辞書ストロークと、入力ス
トロークの2番目を除く1番目〜8番目までを順番にマ
ッチングを取り、類似度計算部5により類似度を計算す
る。これにより得られた類似度の中で基も大きい類似度
を探す。この場合、最も大きい類似度はd88であり、
図中に丸印で囲んで示す。
【0050】このようにして、2番目の辞書ストローク
に対しては6番目の入力ストロークが最も類似度が高い
と判定され、6番目の入力ストロークに対応付け済みマ
ークを付加し、この6番目の入力ストロークはそれ以降
類似度の計算対象とはしない。
【0051】次に、3番目の辞書ストロークと、入力ス
トロークの2番目と6番目を除く各入力ストロークを順
番にマッチングを取り、類似度計算部5により類似度を
計算する。これにより得られた類似度の中で基も大きい
類似度を探す。この場合、最も大きい類似度はd77で
あり、図中に丸印で囲んで示す。
【0052】このようにして、3番目の辞書ストローク
に対しては5番目の入力ストロークが最も類似度が高い
と判定され、5番目の入力ストロークに対応付け済みマ
ークを付加し、この5番目の入力ストロークはそれ以降
類似度の計算対象とはしない。
【0053】以上のように、辞書に記述された対応付け
順序に従って、辞書3から辞書ストロークを読み出し、
その読み出された辞書ストロークと対応付け済みマーク
の付加されていないすべての入力ストロークとの類似度
計算を入力ストローク毎に行い、最大の類似度を有する
入力ストロークを選び、選ばれた入力ストロークに対し
て対応付け済みマークを付加し、その入力ストロークは
以降の類似度計算対象としないという処理を行うことに
より、この図3の例では36回の類似度計算で済み、し
かも、部首を越えた筆順誤りがあっても正確な対応付け
が行える。
【0054】また、図4は「欧」という文字のストロー
クに続けが有る場合の処理を示すものである。ストロー
クの続けは、図10で示したのと同じ部分であり、筆者
が「欧」という文字を筆順は正しく入力したものの、5
画目と6画目に相当する部分(「欠」の上の構成部分)
を続けて1つのストロークで書いた場合であり、この場
合、総入力ストローク数は1ストローク少ない7ストロ
ーク(7画)となる。なお、この場合も、辞書ストロー
クの対応付け順序は図2と同様に設定されているものと
する。
【0055】図4において、まず、辞書3から1番目の
対応付け順序に設定された辞書ストロークが読み出され
る。最初はどの入力ストロークに対してもマークは付加
されていないので、1番目の辞書ストロークと、入力ス
トロークの1番目〜7番目までを順番にマッチングを取
り、類似度計算部5により類似度を計算する。これによ
り得られた類似度を図2と同様、d41,d42,・・
・,d47で表す。そして、これら求められた類似度の
中で基も大きい類似度を探す。この場合、最も大きい類
似度はd44であり、図中に丸印で囲んで示す。
【0056】このようにして、1番目の辞書ストローク
に対しては4番目の入力ストロークが最も類似度が高い
と判定され、マーク付加部4によりその4番目の入力ス
トロークに対して、対応付け済みマークを付加し、この
マークが付加された4番目の入力ストロークはそれ以降
は類似度計算の対象外とする。
【0057】次に、2番目の辞書ストロークと、入力ス
トロークの4番目を除く1番目〜7番目までを順番にマ
ッチングを取り、類似度計算部5により類似度を計算す
る。これにより得られた類似度の中で基も大きい類似度
を探す。この場合、最も大きい類似度はd87であり、
図中に丸印で囲んで示す。
【0058】このようにして、2番目の辞書ストローク
に対しては7番目の入力ストロークが最も類似度が高い
と判定され、7番目の入力ストロークに対応付け済みマ
ークを付加し、この7番目の入力ストロークはそれ以降
類似度の計算対象とはしない。
【0059】次に、3番目の辞書ストロークと、入力ス
トロークの4番目と7番目を除く各入力ストロークを順
番にマッチングを取り、類似度計算部5により類似度を
計算する。これにより得られた類似度の中で基も大きい
類似度を探す。この場合、最も大きい類似度はd76で
あり、図中に丸印で囲んで示す。
【0060】このようにして、3番目の辞書ストローク
に対しては6番目の入力ストロークが最も類似度が高い
と判定され、6番目の入力ストロークに対応付け済みマ
ークを付加し、この6番目の入力ストロークはそれ以降
類似度の計算対象とはしない。
【0061】ところで、本発明では、辞書ストロークの
対応付け順序は、前記したように、対応付け誤りの少な
い順序に並べられている。この「欧」という文字につい
ていえば、前記したように、文字の外縁部でしかも長い
ストロークから順に並べている。
【0062】一般に、続けて書かれることにより省略さ
れやすいストロークは、長さの短いストロークである場
合が多い。たとえば、「欧」という文字の場合は、
「欠」の上の部分(「欧」の5画目と6画目)は比較的
ストロークの続けが生じやすい部分である。このよう
に、続けて書かれることにより省略されやすいストロー
クは、照合の順番が後の方の順番(たとえば「欧」でい
えば、5画目の短いストロークは8番目)となるように
辞書に記述されている。
【0063】このようにストローク同士の対応付け誤り
の少ない辞書ストロークから先に照合を行うような順番
を設定することで、この「欧」という文字を例にとれ
ば、「欧」という文字を構成する辞書ストロークのう
ち、上位の順位に設定された辞書ストロークは図2〜図
4からもわかるように、結果的に、正確な対応付けが行
われる。これに対して、対応付け誤りの多いとされるス
トローク(たとえば、続けて書かれることにより省略さ
れやすいストローク)は、照合を後の順番で行うように
している。その結果、ストロークの続けや省略が、辞書
ストロークの余りという形で現れる。図4の例では、入
力ストローク数が7個であり、辞書ストローク数が8個
であるため、8番目の辞書ストロークが余ってしまうこ
とになる。この余った辞書ストロークは、たとえば、そ
の余った辞書ストロークの長さをエラー値としてその文
字に対する合計の類似度に反映させるなど何らかの形で
処理することが可能である。
【0064】このようにストロークの続けや省略があっ
た場合でも正確に認識することができ、しかも少ない計
算量での対応付けが可能となる。
【0065】図5は以上説明した本発明の処理をPAD
(Program Analysis Diagram)により説明するもの
であり、ある1つの文字を構成するそれぞれの辞書スト
ロークと入力ストロークの対応付けの処理を示すもので
ある。図5において、ある文字が入力されると、辞書に
登録された認識対象の1文字ごとにその文字を構成する
すべての辞書ストロークについて、予め記述された順番
に従って1番目の辞書ストロークを読み出す(ステップ
s1,s2)。そして、入力された文字の入力ストロー
クのうち、対応付け済みマークの付加されていない入力
ストロークについて、順番に入力ストロークを読み出
し、それぞれの類似度計算を行う(ステップs3〜s
5)。この処理を対応付け済みマークの付加されていな
い入力ストロークすべてについて行い、それぞれ求めら
れた類似度のうち最大類似度を求め(ステップs6)、
最大類似度の入力ストロークに対応付け済みマークを付
加する(ステップs7)。そして、ステップs2に戻
り、次の順番に設定された辞書ストロークを読み出し、
対応付け済みマークの付加されていない入力ストローク
について、順番に入力ストロークを読み出して、それぞ
れの類似度計算を行う(ステップs3〜s5)。この処
理を対応付け済みマークの付加されていない入力ストロ
ークすべてについて行い、それぞれ求められた類似度の
うち最大類似度を求め(ステップs6)、最大類似度の
入力ストロークに対応付け済みマークを付加する(ステ
ップs7)。このような処理を、ある1つの文字の全て
の辞書ストロークが終了するまで行い、その文字の辞書
ストローク全てについて終了すると、次の文字における
辞書ストロークについて以上の処理を行い、認識対象文
字全てについて同じ処理を行う。
【0066】辞書3には、たとえば、認識対象文字とし
て5000文字分程度が用意されており、それぞれの文
字に対応する辞書ストロークが登録されている。図5に
示すPADは5000文字のうちの1つの文字の辞書ス
トロークについての処理であり、実際には、1つの入力
文字に対してこれを5000回繰り返すことになる。
【0067】したがって、仮に1つの文字の入力ストロ
ーク数が10本、1つの文字の辞書ストローク数が平均
10本、認識対象文字数が5000文字であるとすれ
ば、処理速度の点で従来と比較すれば、たとえば、図6
に示す第1の従来技術の場合、10×10×5000=
500000回の類似度計算が必要であるが、本発明に
よれば、10!×5000=(10+9+8+7+6+
5+4+3+2+1)×5000=55×5000=2
750000回となり、処理は約1.8倍高速になる。
【0068】なお、以上説明した実施の形態では、辞書
との対応付けを行う特徴量として文字の画数に対応する
ストロークを用いたが、この特徴量は、1本のストロー
クを幾つかに分割した部分ストロークでもよく、さらに
は、他の特徴量を用いても良い。要は、辞書に登録され
た内容とのマッチングが行え、類似度が求められる特徴
量であればよい。
【0069】また、本発明の処理を行うプログラムはフ
ロッピィディスクなどの記憶媒体に記憶させておくこと
ができ、本発明は、その記憶媒体をも含むものである。
【0070】
【発明の効果】以上説明したように、本発明によれば、
予め設定された照合の順番に従って、辞書から特徴量を
読み出し、その読み出された特徴量に対応付けられた入
力文字の特徴量に対して対応付け済みを示す符号を付
し、その符号の付された入力文字の特徴量は以降の対応
付け処理を行わないようにするようにしたので、部首を
越えた大きな筆順誤りや、ストロークの続け、省略が有
っても、辞書の特徴量と入力された特徴量との照合を行
う際の特徴量同士の対応付け誤りを起こさずに、少ない
計算量で類似度計算が行え、かつ、高い認識率での文字
認識が可能となる。
【図面の簡単な説明】
【図1】本発明の実施の形態の構成を説明するブロック
図。
【図2】同実施の形態における処理の具体例(その1)
を説明する図。
【図3】同実施の形態における処理の具体例(その2)
を説明する図。
【図4】同実施の形態における処理の具体例(その3)
を説明する図。
【図5】同実施の形態における処理の流れを説明する
図。
【図6】第1の従来技術の処理を説明する図。
【図7】第2の従来技術の処理を説明する図。
【図8】第3の従来技術の処理を説明する図。
【図9】従来技術における問題点の例として第2の従来
技術の問題点(その1)を説明する図。
【図10】従来技術における問題点の例として第2の従
来技術の問題点(その2)を説明する図。
【符号の説明】
1 文字入力部 2 ストローク抽出部 3 辞書 4 マーク付加部 5 類似度計算部 6 対応付け処理部 7 認識結果出力部 d11,d12,・・・ 計算された類似度

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 ある文字が入力されることによりその文
    字を構成する特徴量を抽出し、その抽出された特徴量
    と、辞書に登録されている特徴量とを照合して対応付け
    することにより、入力文字の認識を行うオンライン手書
    き文字認識方法において、 前記辞書に登録される認識対象文字の1つずつの文字を
    構成するそれぞれの特徴量に対し、入力文字を構成する
    特徴量との照合を行う順番を予め記述しておき、入力文
    字の特徴量との対応付けを行う際、辞書に登録された或
    る文字を構成するそれぞれの特徴量を、前記記述された
    順番に従って1つずつ読み出して、読み出された特徴量
    と入力文字を構成するそれぞれの特徴量とを照合し、そ
    の照合を行う際、前記入力文字を構成するそれぞれの特
    徴量に対応付け済みを示す符号が付されているか否かを
    判断し、符号のない入力文字の特徴量に対してのみ照合
    処理を行い、その照合処理により対応付けられた入力文
    字の特徴量に対して対応付け済みを示す符号を付すこと
    を特徴とするオンライン手書き文字認識方法。
  2. 【請求項2】 前記辞書に記述される照合を行う順番
    は、入力文字のそれぞれの特徴量との照合を行う際、特
    徴量同士の対応付け誤りの少ない順にそれぞれの特徴量
    が辞書から読み出されるような順番とすることを特徴と
    する請求項1記載のオンライン手書き文字認識方法。
  3. 【請求項3】 前記文字を構成する特徴量は、ストロー
    クであることを特徴とする請求項1または2に記載のオ
    ンライン手書き文字認識方法。
  4. 【請求項4】 ある文字が入力されることによりその文
    字を構成する特徴量を抽出し、その抽出された特徴量
    と、辞書に登録されている特徴量とを照合して対応付け
    することにより、入力文字の認識を行うオンライン手書
    き文字認識装置において、 入力された文字からその文字を構成するそれぞれの特徴
    量を抽出する特徴量抽出手段と、 認識対象の各文字毎にその文字を構成するそれぞれの特
    徴量が登録されるとともに、或る1つの文字を構成する
    それぞれの特徴量に対し、予め決められた照合の順番が
    記述された辞書と、 辞書に登録された特徴量との対応付けが済んだ入力文字
    の特徴量に対し、対応付け済みを示す符号を付す符号付
    加部と、 前記辞書から記述された順番に従って1つずつ読み出さ
    れた或る文字を構成するそれぞれの特徴量と、入力文字
    を構成するそれぞれの特徴量とを照合する際、前記入力
    文字を構成するそれぞれの特徴量に対応付け済みを示す
    符号が付されているか否かを判断し、符号のない入力文
    字の特徴量に対してのみ照合処理を行い、類似度を求め
    る類似度計算部と、 この類似度計算部で求められた類似度を基に、辞書から
    読み出された特徴量に対して最大の類似度を有する入力
    文字の特徴量を対応付け済みの特徴量として選択する対
    応付け処理部と、 を有することを特徴とするオンライン手書き文字認識装
    置。
  5. 【請求項5】 前記辞書に記述される照合を行う順番
    は、入力文字のそれぞれの特徴量との照合を行う際、特
    徴量同士の対応付け誤りの少ない順にそれぞれの特徴量
    が読み出されるような順番とすることを特徴とする請求
    項4記載のオンライン手書き文字認識装置。
  6. 【請求項6】 前記文字を構成する特徴量は、ストロー
    クであることを特徴とする請求項4または5に記載のオ
    ンライン手書き文字認識装置。
JP9128988A 1996-05-22 1997-05-19 オンライン手書き文字認識方法および装置 Withdrawn JPH1049630A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9128988A JPH1049630A (ja) 1996-05-22 1997-05-19 オンライン手書き文字認識方法および装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP12754896 1996-05-22
JP8-127548 1996-05-22
JP9128988A JPH1049630A (ja) 1996-05-22 1997-05-19 オンライン手書き文字認識方法および装置

Publications (1)

Publication Number Publication Date
JPH1049630A true JPH1049630A (ja) 1998-02-20

Family

ID=26463485

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9128988A Withdrawn JPH1049630A (ja) 1996-05-22 1997-05-19 オンライン手書き文字認識方法および装置

Country Status (1)

Country Link
JP (1) JPH1049630A (ja)

Similar Documents

Publication Publication Date Title
JP4787275B2 (ja) セグメント化ベースの認識
US7756335B2 (en) Handwriting recognition using a graph of segmentation candidates and dictionary search
US5768417A (en) Method and system for velocity-based handwriting recognition
EP0564827B1 (en) A post-processing error correction scheme using a dictionary for on-line handwriting recognition
US5854855A (en) Method and system using meta-classes and polynomial discriminant functions for handwriting recognition
US5802205A (en) Method and system for lexical processing
JP2734386B2 (ja) 文字列読み取り装置
US20080008387A1 (en) Method and apparatus for recognition of handwritten symbols
US5438631A (en) Handwriting and character recognition system
JPH09223195A (ja) 文字認識方法
KR20070090188A (ko) 수기 패턴을 인식하기 위한 방법 및 장치
JP6735775B2 (ja) 重畳手書き入力認識技術のためのシステム及び方法
JPH1049630A (ja) オンライン手書き文字認識方法および装置
JPH0520794B2 (ja)
JP2671985B2 (ja) 情報認識方法
KR100301216B1 (ko) 온라인문자인식장치
JP2790842B2 (ja) 文字認識後処理方式
JP3374762B2 (ja) 文字認識方法及びその装置
KR900005141B1 (ko) 문자인식장치
JP3357847B2 (ja) 文字認識方法、文字認識装置および記憶媒体
JP2000099631A (ja) パターン認識装置及びパターン認識方法
JPH0443316B2 (ja)
JPS6344287A (ja) 文字読取装置
JPH07282200A (ja) オンライン文字認識装置
JPS60186980A (ja) オンライン手書き文字認識処理方式

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20040803