JP2602596B2 - オンライン手書き文字認識における類似文字のプロトタイプを改良するための方法および装置 - Google Patents
オンライン手書き文字認識における類似文字のプロトタイプを改良するための方法および装置Info
- Publication number
- JP2602596B2 JP2602596B2 JP3335072A JP33507291A JP2602596B2 JP 2602596 B2 JP2602596 B2 JP 2602596B2 JP 3335072 A JP3335072 A JP 3335072A JP 33507291 A JP33507291 A JP 33507291A JP 2602596 B2 JP2602596 B2 JP 2602596B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- handwritten
- prototype
- characters
- points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Character Discrimination (AREA)
Description
【0001】
【産業上の利用分野】本発明は、手書き入力認識システ
ム、より詳しくは、未知の入力文字と照合するために使
用される文字プロトタイプの集合を最適化するための方
法および装置に関する。
ム、より詳しくは、未知の入力文字と照合するために使
用される文字プロトタイプの集合を最適化するための方
法および装置に関する。
【0002】
【従来の技術およびその課題】多くのオンライン手書き
入力認識システムは、未知の文字をプロトタイプ文字ま
たはテンプレートと照合するために曲線照合法を用いて
いる。そのようなシステムの例は、以下の論文に記述さ
れている。:W.DosterおよびP.Oed, ”
Word processing with on−l
ine script recognition”(I
EEE Micro., vol.4, pp.36−
43, October 1984); K. Ike
da, T. Yamamura, Y. Mitam
ura, S. Fujiwara, Y. Tomi
nagaおよびT. Kiyono, ”On−lin
e recognition of handwrit
ten characters utilizing
positionaland stroke vect
or sequences”(Proc. 4th I
nt. Jt. Conf. Pattern Rec
ognition, pp.813−815, Nov
ember 1978); C.C. Tapper
t,”Adaptive on−line handw
riting recognition”(Proc.
7th Int.Conf. Pattern Re
cognition, pp. 1004−1007,
1984); C.C.Tappert, ”Spe
ed, accuracy,flexibility
trade−offs in on−line cha
racterrecognition”(IBM Re
search Report RC13228, Oc
tober 1987); T. Wakaharaお
よびM. Umeda,”Stroke−number
and stroke−order free on
−line character recogniti
on by selective stroke li
nkage method”(Proc. 4th I
CTP, pp. 157−162. 1983.)一
般に、このようなプロトタイプにもとづく手書き入力認
識システムの精度は、プロトタイプの品質の関数であ
る。
入力認識システムは、未知の文字をプロトタイプ文字ま
たはテンプレートと照合するために曲線照合法を用いて
いる。そのようなシステムの例は、以下の論文に記述さ
れている。:W.DosterおよびP.Oed, ”
Word processing with on−l
ine script recognition”(I
EEE Micro., vol.4, pp.36−
43, October 1984); K. Ike
da, T. Yamamura, Y. Mitam
ura, S. Fujiwara, Y. Tomi
nagaおよびT. Kiyono, ”On−lin
e recognition of handwrit
ten characters utilizing
positionaland stroke vect
or sequences”(Proc. 4th I
nt. Jt. Conf. Pattern Rec
ognition, pp.813−815, Nov
ember 1978); C.C. Tapper
t,”Adaptive on−line handw
riting recognition”(Proc.
7th Int.Conf. Pattern Re
cognition, pp. 1004−1007,
1984); C.C.Tappert, ”Spe
ed, accuracy,flexibility
trade−offs in on−line cha
racterrecognition”(IBM Re
search Report RC13228, Oc
tober 1987); T. Wakaharaお
よびM. Umeda,”Stroke−number
and stroke−order free on
−line character recogniti
on by selective stroke li
nkage method”(Proc. 4th I
CTP, pp. 157−162. 1983.)一
般に、このようなプロトタイプにもとづく手書き入力認
識システムの精度は、プロトタイプの品質の関数であ
る。
【0003】オンライン手書き入力認識において生ずる
一つの問題は、A−H,h−k,g−yのような類似形
状の手書き文字の識別である。公知の曲線照合法は、文
字の曲線のすべての部分を等しく評価するので、非本質
的な部分が誤りを生じる可能性がある。特に、曲線照合
法の場合、「g」および「y」のディセンダすなわち尾
部の形状のように重要でない特徴または部分が認識の誤
りを生じる可能性がある。
一つの問題は、A−H,h−k,g−yのような類似形
状の手書き文字の識別である。公知の曲線照合法は、文
字の曲線のすべての部分を等しく評価するので、非本質
的な部分が誤りを生じる可能性がある。特に、曲線照合
法の場合、「g」および「y」のディセンダすなわち尾
部の形状のように重要でない特徴または部分が認識の誤
りを生じる可能性がある。
【0004】以下の米国および日本の特許はすべて、手
書き入力認識システムの各種諸相を教示している。
書き入力認識システムの各種諸相を教示している。
【0005】Craneらにより1985年12月24
日に取得された、”ComplexPattern R
ecognition method and Sys
tem”と題する米国特許第4,561,105号は、
テンプレートまたはモデルストロークを使用するオンラ
イン文字認識システムを記載している。(col.3,
lines 1−52)。
日に取得された、”ComplexPattern R
ecognition method and Sys
tem”と題する米国特許第4,561,105号は、
テンプレートまたはモデルストロークを使用するオンラ
イン文字認識システムを記載している。(col.3,
lines 1−52)。
【0006】Craneらにより1986年2月25日
に取得された、”Confusion Groupin
g of Strokes in Pattern R
ecognition method and sys
tem”と題する米国特許第4,573,196号も、
テンプレートまたはモデルストロークを使用し、さら
に、「混同グループ」の構成要素としてストロークを類
別するための距離基準を備えた、オンライン文字認識シ
ステムを記載している。
に取得された、”Confusion Groupin
g of Strokes in Pattern R
ecognition method and sys
tem”と題する米国特許第4,573,196号も、
テンプレートまたはモデルストロークを使用し、さら
に、「混同グループ」の構成要素としてストロークを類
別するための距離基準を備えた、オンライン文字認識シ
ステムを記載している。
【0007】Craneらにより1988年1月5日に
取得された、”Process and Appara
tus Involving Pattern Rec
ognition”と題する米国特許第4,718,1
02号は、文字の混同集合の構成要素を識別するための
明確化ルーチンを有するオンライン文字認識システムを
記載している(col.4)。
取得された、”Process and Appara
tus Involving Pattern Rec
ognition”と題する米国特許第4,718,1
02号は、文字の混同集合の構成要素を識別するための
明確化ルーチンを有するオンライン文字認識システムを
記載している(col.4)。
【0008】Bokserにより1988年6月28日
に取得された、”Means for Resolvi
ng Ambiguities in TextBas
ed Upon Character Contex
t”と題する米国特許第4,754,489号は、集合
のいずれの文字列がもっとも高い蓋然性を有するかを決
定するために、文字列の集合の各構成要素に蓋然性の値
を割り当てる文脈アルゴリズムを記載している。
に取得された、”Means for Resolvi
ng Ambiguities in TextBas
ed Upon Character Contex
t”と題する米国特許第4,754,489号は、集合
のいずれの文字列がもっとも高い蓋然性を有するかを決
定するために、文字列の集合の各構成要素に蓋然性の値
を割り当てる文脈アルゴリズムを記載している。
【0009】C.C.Tappertにより1988年
3月15日に取得された、”Recognition
System for Run−on Handwri
tten Characters”と題する共同譲渡さ
れた米国特許第4,731,857号は、すべてのスト
ローク端を考えられる文字の区分点としてみなす、続き
手書き文字用の区分法を記載している。
3月15日に取得された、”Recognition
System for Run−on Handwri
tten Characters”と題する共同譲渡さ
れた米国特許第4,731,857号は、すべてのスト
ローク端を考えられる文字の区分点としてみなす、続き
手書き文字用の区分法を記載している。
【0010】Yoshimuraにより1985年1月
1日に取得された、”Character Recog
nition System”と題する米国特許第4,
491,965号は、正規パターンを辞書の項目と比較
する認識区分に正規文字パターンを付与する文字認識装
置を記載している。
1日に取得された、”Character Recog
nition System”と題する米国特許第4,
491,965号は、正規パターンを辞書の項目と比較
する認識区分に正規文字パターンを付与する文字認識装
置を記載している。
【0011】Fujisawaらにより1987年3月
31日に取得された、”System and Met
hod for Segmentationand R
ecognition of Patterns”と題
する米国特許第4,654,873号は、既定の単位の
パターンが二次元画像パターンから抽出される光学式文
字読み取り装置で使用するための文字認識システムを記
載している。単位パターンの区分化にあいまいさが存在
する場合、多数の仮定的な単位パターンが認識単位に付
与され、その仮定的な単位パターンからいずれかを選択
する。
31日に取得された、”System and Met
hod for Segmentationand R
ecognition of Patterns”と題
する米国特許第4,654,873号は、既定の単位の
パターンが二次元画像パターンから抽出される光学式文
字読み取り装置で使用するための文字認識システムを記
載している。単位パターンの区分化にあいまいさが存在
する場合、多数の仮定的な単位パターンが認識単位に付
与され、その仮定的な単位パターンからいずれかを選択
する。
【0012】”Method for Recogni
zing HandwrittenCharacte
r" と題する日本国特許第62−24382号は、要約
書において、入力されたストロークがテンプレートメモ
リに記憶された参照ストロークと比較される、手書き文
字認識法を記載している。
zing HandwrittenCharacte
r" と題する日本国特許第62−24382号は、要約
書において、入力されたストロークがテンプレートメモ
リに記憶された参照ストロークと比較される、手書き文
字認識法を記載している。
【0013】”Optical Input Devi
ce of Drawing" と題する日本国特許第6
1−68678号は、テンプレート上の記号がトレース
され、登録された記号と比較される、光学式図面入力装
置を記載している。
ce of Drawing" と題する日本国特許第6
1−68678号は、テンプレート上の記号がトレース
され、登録された記号と比較される、光学式図面入力装
置を記載している。
【0014】この従来技術によって教示されておらず、
また提示すべき本発明の目的は、文字プロトタイプ、特
に、相互に混同しやすいものとして知られる文字の組の
プロトタイプの集合を改良または最適化するための方法
および装置である。
また提示すべき本発明の目的は、文字プロトタイプ、特
に、相互に混同しやすいものとして知られる文字の組の
プロトタイプの集合を改良または最適化するための方法
および装置である。
【0015】本発明の第2の目的は、各文字間の類似性
を弱めると同時に文字間の相違を強調するように、混同
しやすい文字プロトタイプの組を処理する方法およびそ
の方法を実施するための装置を提供することである。
を弱めると同時に文字間の相違を強調するように、混同
しやすい文字プロトタイプの組を処理する方法およびそ
の方法を実施するための装置を提供することである。
【0016】
【課題を解決するための手段】類似形状文字の認識精度
を改良するための、文字プロトタイプを生成する方法に
より、前述およびその他の問題は克服され、本発明の目
的は実現される。本発明の方法は、類似形状文字間の識
別に決定的であると理解される類似形状文字のそうした
部分を強調し、識別目的には決定的でないと認められる
それらの文字部分を弱めるように操作する。
を改良するための、文字プロトタイプを生成する方法に
より、前述およびその他の問題は克服され、本発明の目
的は実現される。本発明の方法は、類似形状文字間の識
別に決定的であると理解される類似形状文字のそうした
部分を強調し、識別目的には決定的でないと認められる
それらの文字部分を弱めるように操作する。
【0017】一方法によれば、文字プロトタイプを形成
するための文字入力段階を含む。この段階において、書
き手は、識別にとって決定的である文字の部分を通常よ
りも大きく書く一方、重要でない特徴を小さく書く。ま
たは、共通して同一の特徴を有する文字の場合、識別す
べき文字の組のそれぞれについて、重要でない特徴を同
一に書く。
するための文字入力段階を含む。この段階において、書
き手は、識別にとって決定的である文字の部分を通常よ
りも大きく書く一方、重要でない特徴を小さく書く。ま
たは、共通して同一の特徴を有する文字の場合、識別す
べき文字の組のそれぞれについて、重要でない特徴を同
一に書く。
【0018】文字プロトタイプの開始集合の生成におい
て、類似文字の重要でない部分を同一にするために図形
処理技法が用いられる。
て、類似文字の重要でない部分を同一にするために図形
処理技法が用いられる。
【0019】別の方法では、第1の文字のトレースを複
写するためにグラフィックスツールを利用する。複写さ
れたトレースは、その後、第1の文字を混同しやすい第
2の文字と識別するために決定的な部分について、第1
の文字を第2の文字に変換するために修正される。この
技術は、これら2文字の類似形状部分を同一に形成し、
また、識別に重要である一部または複数の部分が異なる
ように形成され強調されることを保証する。
写するためにグラフィックスツールを利用する。複写さ
れたトレースは、その後、第1の文字を混同しやすい第
2の文字と識別するために決定的な部分について、第1
の文字を第2の文字に変換するために修正される。この
技術は、これら2文字の類似形状部分を同一に形成し、
また、識別に重要である一部または複数の部分が異なる
ように形成され強調されることを保証する。
【0020】さらに別の方法では、自動誇張プロセスを
伴う。第1の段階は、誇張すべき類似文字のプロトタイ
プを選択する。第2の段階は、点対応にもとづいてその
類似文字プロトタイプを照合する。第3の段階は、相互
に離れた点の対応する組をその点の組の本来の距離に比
例する距離だけずらすことにより計算される点の組から
成る修正プロトタイプを計算する。この方法は、非類似
領域を強調することにより、その2のプロトタイプ文字
の形状を自動的にさらに非類似的にする。
伴う。第1の段階は、誇張すべき類似文字のプロトタイ
プを選択する。第2の段階は、点対応にもとづいてその
類似文字プロトタイプを照合する。第3の段階は、相互
に離れた点の対応する組をその点の組の本来の距離に比
例する距離だけずらすことにより計算される点の組から
成る修正プロトタイプを計算する。この方法は、非類似
領域を強調することにより、その2のプロトタイプ文字
の形状を自動的にさらに非類似的にする。
【0021】
【実施例】図1について説明する。本発明に従って構成
され操作されるオンライン手書き文字認識システム10
を示す。システム10は、スタイラス14などの筆記具
を有する電子タブレット12を備えた手書き入力変換器
を含む。手書き文字に応答して、変換器は、タブレット
12の座標系に対するスタイラス14の位置に対応する
(x,y)座標の組の直列の流れを出力する。これらの
座標の組は、離散的な手書きストロークの始まりおよび
終わりを識別するストローク区分器16に供給される。
ストロークは文字照合器18に供給される。文字照合器
18は、入力されたストロークまたはストロークの集ま
りが特定の文字を表現しているかどうかを一定の蓋然性
の範囲内で識別するために入力ストロークの各点を記憶
された文字プロトタイプの各点と比較するための、既定
の文字プロトタイプの記憶装置20に結合されている。
認識された文字は照合器18から出力され、使用者に表
示したり、ワードプロセッサプログラムなどのアプリケ
ーションプログラムに入力することができる。一部のシ
ステムでは、区分器16および文字照合器18の機能性
は、1手書きストローク処理装置内で結合することもで
きよう。
され操作されるオンライン手書き文字認識システム10
を示す。システム10は、スタイラス14などの筆記具
を有する電子タブレット12を備えた手書き入力変換器
を含む。手書き文字に応答して、変換器は、タブレット
12の座標系に対するスタイラス14の位置に対応する
(x,y)座標の組の直列の流れを出力する。これらの
座標の組は、離散的な手書きストロークの始まりおよび
終わりを識別するストローク区分器16に供給される。
ストロークは文字照合器18に供給される。文字照合器
18は、入力されたストロークまたはストロークの集ま
りが特定の文字を表現しているかどうかを一定の蓋然性
の範囲内で識別するために入力ストロークの各点を記憶
された文字プロトタイプの各点と比較するための、既定
の文字プロトタイプの記憶装置20に結合されている。
認識された文字は照合器18から出力され、使用者に表
示したり、ワードプロセッサプログラムなどのアプリケ
ーションプログラムに入力することができる。一部のシ
ステムでは、区分器16および文字照合器18の機能性
は、1手書きストローク処理装置内で結合することもで
きよう。
【0022】文字プロトタイプは、システム10の使用
者によって行われるトレーニングセションにおいて記憶
装置20に供給できる。文字プロトタイプは、システム
の特定の使用者によって入力され、その後、その特定の
ユーザが手書き文字を入力した場合にのみ使用できる。
また、文字プロトタイプの大域的または汎用的集合が2
以上の使用者の使用によって作成することができる。
者によって行われるトレーニングセションにおいて記憶
装置20に供給できる。文字プロトタイプは、システム
の特定の使用者によって入力され、その後、その特定の
ユーザが手書き文字を入力した場合にのみ使用できる。
また、文字プロトタイプの大域的または汎用的集合が2
以上の使用者の使用によって作成することができる。
【0023】この点に関して、開始プロトタイプ集合
は、初期プロトタイプ集合として、システム10を最初
に使用するいずれかの書き手によって使用されるように
設計することができる。希望する場合、書き手は、その
後、個別化プロトタイプ集合とも呼べる、その書き手に
合わせて作られたプロトタイプ集合を得るために自己自
身の筆記様式で文字プロトタイプを追加することもでき
る。開始プロトタイプ集合は通常、手書き入力認識シス
テムの専門家によって作成されるので、システム10の
使用者には、何らかの筆記上の指示または制約に従うた
めにいかなる負担も課されない。
は、初期プロトタイプ集合として、システム10を最初
に使用するいずれかの書き手によって使用されるように
設計することができる。希望する場合、書き手は、その
後、個別化プロトタイプ集合とも呼べる、その書き手に
合わせて作られたプロトタイプ集合を得るために自己自
身の筆記様式で文字プロトタイプを追加することもでき
る。開始プロトタイプ集合は通常、手書き入力認識シス
テムの専門家によって作成されるので、システム10の
使用者には、何らかの筆記上の指示または制約に従うた
めにいかなる負担も課されない。
【0024】いずれの場合も、トレーニングセションに
おいて、文字照合器18からの文字は、物理的または論
理的スイッチ22を介してプロトタイププロセッサ24
に送られる。プロトタイププロセッサ24はまた、以下
に詳述するその操作を制御するための、キーボード26
またはディスプレイ28などのユーザ入出力装置と結合
されている。プロトタイププロセッサ24の出力は、シ
ステム10の使用者によって行われる手書き入力認識セ
ションでの以降の使用のために記憶装置20に供給され
る一連のプロトタイプ文字である。
おいて、文字照合器18からの文字は、物理的または論
理的スイッチ22を介してプロトタイププロセッサ24
に送られる。プロトタイププロセッサ24はまた、以下
に詳述するその操作を制御するための、キーボード26
またはディスプレイ28などのユーザ入出力装置と結合
されている。プロトタイププロセッサ24の出力は、シ
ステム10の使用者によって行われる手書き入力認識セ
ションでの以降の使用のために記憶装置20に供給され
る一連のプロトタイプ文字である。
【0025】本発明に従えば、認識類似形状文字の認識
精度を改良するための文字プロトタイプを生成するため
にプロトタイププロセッサ24を操作する方法が提供さ
れる。一般に、本発明の方法は、類似形状文字間の識別
に決定的であると理解される類似形状文字のそうした部
分を強調し、識別目的には決定的でないと認められるそ
れらの文字部分を弱めるように操作する。
精度を改良するための文字プロトタイプを生成するため
にプロトタイププロセッサ24を操作する方法が提供さ
れる。一般に、本発明の方法は、類似形状文字間の識別
に決定的であると理解される類似形状文字のそうした部
分を強調し、識別目的には決定的でないと認められるそ
れらの文字部分を弱めるように操作する。
【0026】第1の方法は、混同しやすい文字の組
「g,y」のうちの文字「g」のように、混同しやすい
文字の組の1文字を書く第1の段階を含む。書き手は、
意図的に、識別にとって決定的である文字の部分を通常
よりも大きく書く一方、重要でない特徴を小さく書く。
または、共通して同一の特徴を有する文字の場合、識別
すべき文字の組のそれぞれについて、重要でない特徴を
同一に書く。
「g,y」のうちの文字「g」のように、混同しやすい
文字の組の1文字を書く第1の段階を含む。書き手は、
意図的に、識別にとって決定的である文字の部分を通常
よりも大きく書く一方、重要でない特徴を小さく書く。
または、共通して同一の特徴を有する文字の場合、識別
すべき文字の組のそれぞれについて、重要でない特徴を
同一に書く。
【0027】例えば、図2および図3を参照すれば、
「g」および「y」のディセンダ、すなわち尾部は一般
に「g」と「y」との識別に重要であるとみなされない
ので、書き手は、未知の文字がプロトタイプ文字の当該
部分を照合する際に文字照合器18によって同一の評価
が割り当てられるように、その部分を同一に書くように
忠告される。しかし、これらの文字の上部、すなわち
「g」の閉じている部分および「y」の開いている部分
は、認識にとって重要であるので、書き手は、文字のこ
れらの要素を、図3に示すように強調するように忠告さ
れる。
「g」および「y」のディセンダ、すなわち尾部は一般
に「g」と「y」との識別に重要であるとみなされない
ので、書き手は、未知の文字がプロトタイプ文字の当該
部分を照合する際に文字照合器18によって同一の評価
が割り当てられるように、その部分を同一に書くように
忠告される。しかし、これらの文字の上部、すなわち
「g」の閉じている部分および「y」の開いている部分
は、認識にとって重要であるので、書き手は、文字のこ
れらの要素を、図3に示すように強調するように忠告さ
れる。
【0028】この方法に従って生成されたプロトタイプ
は、識別にとって重要な特徴を担っている文字の曲線の
より大きな割合を示している。例えば、大文字の「O」
と小文字の「o」の認識は、大文字の「O」において大
きさ(直径)の相違が増した場合に向上することが認め
られている。また、図4および図5に示すように、
「A」と「H」の識別は、「A」と「H」とを最もよく
識別する特徴を誇張するように、「H」の縦のストロー
クを下部よりも上部でいっそう分離させた場合に改善す
ることが認められている。また、筆記体の小文字「h」
と「k」との識別は、これらのプロトタイプにおける識
別的特徴が誇張されて書かれた際に著しく改善されるこ
とが認められている。例えば、「h」の下側の曲線部は
広がっているのに対し、「k」の尖点部は意図的に、縦
のストロークを過ぎて延びるように、左側にまで書かれ
ている。
は、識別にとって重要な特徴を担っている文字の曲線の
より大きな割合を示している。例えば、大文字の「O」
と小文字の「o」の認識は、大文字の「O」において大
きさ(直径)の相違が増した場合に向上することが認め
られている。また、図4および図5に示すように、
「A」と「H」の識別は、「A」と「H」とを最もよく
識別する特徴を誇張するように、「H」の縦のストロー
クを下部よりも上部でいっそう分離させた場合に改善す
ることが認められている。また、筆記体の小文字「h」
と「k」との識別は、これらのプロトタイプにおける識
別的特徴が誇張されて書かれた際に著しく改善されるこ
とが認められている。例えば、「h」の下側の曲線部は
広がっているのに対し、「k」の尖点部は意図的に、縦
のストロークを過ぎて延びるように、左側にまで書かれ
ている。
【0029】この方法は、開始および個別化プロトタイ
プ集合の両者によって良好に利用されている。開始集合
の生成において、類似文字の重要でない部分を同一にす
るために、好ましくは図形処理技法が用いられる。
プ集合の両者によって良好に利用されている。開始集合
の生成において、類似文字の重要でない部分を同一にす
るために、好ましくは図形処理技法が用いられる。
【0030】図6について説明する。本発明の別の方法
を例示する流れ図である。この方法は、文字のトレース
を複写した後、それを混同しやすい文字の組の他方の文
字に変換するように重要な部分を図形的に修正するため
に、Freelanceとして当業で公知のグラフィッ
クスソフトウエアパッケージなどのグラフィックスツー
ルを利用する。
を例示する流れ図である。この方法は、文字のトレース
を複写した後、それを混同しやすい文字の組の他方の文
字に変換するように重要な部分を図形的に修正するため
に、Freelanceとして当業で公知のグラフィッ
クスソフトウエアパッケージなどのグラフィックスツー
ルを利用する。
【0031】第1の段階Aにおいて、使用者は、例え
ば、「g,y」の組のうちの「g」のように、混同しや
すい文字の組の一方の文字を書く。
ば、「g,y」の組のうちの「g」のように、混同しや
すい文字の組の一方の文字を書く。
【0032】第2の段階Bでは、入力文字は、グラフィ
ックスソフトウェアパッケージを用いて、線を滑らかに
し、逸脱した点を除去し、その文字の形状をより規則的
にするために、書かれた文字のx−y座標点を移動する
ことにより、フィルタにかけられる。
ックスソフトウェアパッケージを用いて、線を滑らかに
し、逸脱した点を除去し、その文字の形状をより規則的
にするために、書かれた文字のx−y座標点を移動する
ことにより、フィルタにかけられる。
【0033】第3の段階Cでは、フィルタにかけられた
第1の文字が第2の文字を形成するために複写される。
第4の段階Dで、第1および第2の文字の重要でない部
分は、「g」および「y」のディセンダのように同一に
される。また、文字の一方または両方の各点を手作業で
移動することにより、重要な特徴の間の相違が、「g」
の閉じた上部および「y」の開いた上部の誇張のよう
に、誇張される。
第1の文字が第2の文字を形成するために複写される。
第4の段階Dで、第1および第2の文字の重要でない部
分は、「g」および「y」のディセンダのように同一に
される。また、文字の一方または両方の各点を手作業で
移動することにより、重要な特徴の間の相違が、「g」
の閉じた上部および「y」の開いた上部の誇張のよう
に、誇張される。
【0034】段階Eで、これらの2つのプロトタイプ文
字は、以後の使用のために記憶装置20に記憶される。
字は、以後の使用のために記憶装置20に記憶される。
【0035】図7に例示したさらに別の方法は、手書き
文字プロトタイプの間の決定的な相違を誇張するために
自動化された誇張プロセスを用いる。段階Aは、「h,
k」のように類似文字プロトタイプの組を選択する。段
階Bで、その類似文字プロトタイプは、点対応で照合さ
れる。好ましくは、この照合は、”AdaptiveO
n−Line Handwriting Recogn
ition”と題する前述の論文でC.C.Tappe
rtによって検討された形式の柔軟照合アルゴリズムを
用いて文字照合器18によって実行される。柔軟照合器
は、文字の組の一方を未知の文字として、他方をプロト
タイプとして扱うように動作する。文字は、文字間で、
最低評価として特徴づけられる最良適合を得るために柔
軟に変形される。このプロセスはまた、各文字からの、
対応する点の組が以後の処理のために相互に関係付けら
れるような、2文字の整列をもたらす。
文字プロトタイプの間の決定的な相違を誇張するために
自動化された誇張プロセスを用いる。段階Aは、「h,
k」のように類似文字プロトタイプの組を選択する。段
階Bで、その類似文字プロトタイプは、点対応で照合さ
れる。好ましくは、この照合は、”AdaptiveO
n−Line Handwriting Recogn
ition”と題する前述の論文でC.C.Tappe
rtによって検討された形式の柔軟照合アルゴリズムを
用いて文字照合器18によって実行される。柔軟照合器
は、文字の組の一方を未知の文字として、他方をプロト
タイプとして扱うように動作する。文字は、文字間で、
最低評価として特徴づけられる最良適合を得るために柔
軟に変形される。このプロセスはまた、各文字からの、
対応する点の組が以後の処理のために相互に関係付けら
れるような、2文字の整列をもたらす。
【0036】段階Cで、2の類似文字プロトタイプは、
2文字間の相違を強調し、類似性を弱めるために、後述
のようにして各点を移動するために処理される。段階D
で、生成された類似文字プロトタイプは、以後の使用の
ために記憶装置20に記憶される。
2文字間の相違を強調し、類似性を弱めるために、後述
のようにして各点を移動するために処理される。段階D
で、生成された類似文字プロトタイプは、以後の使用の
ために記憶装置20に記憶される。
【0037】段階BおよびCは、以下に説明するように
プロトタイププロセッサ24によって実行される計算と
して表現される。
プロトタイププロセッサ24によって実行される計算と
して表現される。
【0038】類似文字1および2を点対応で照合するた
めに、対応する点(p1,p2)の全部の組について、
以下の段階(a)〜(d)が実行される。
めに、対応する点(p1,p2)の全部の組について、
以下の段階(a)〜(d)が実行される。
【0039】 (a)p1をプロトタイプ1の点とする (b)p2をプロトタイプ2の点とする (c)p1からp2が引かれたベクトルを(p2−p
1)と示す (d)修正プロトタイプ1’および2’を計算する この時、点の組p1’およびp2’はそれぞれ、適切に
選択されたスカラk>0によるベクトル加算を用いて、
以下のようになる。
1)と示す (d)修正プロトタイプ1’および2’を計算する この時、点の組p1’およびp2’はそれぞれ、適切に
選択されたスカラk>0によるベクトル加算を用いて、
以下のようになる。
【0040】 p1’=p1+k(p1−p2) p2’=p2+k(p2−p1) この技法は、対応する点の組(p1,p2)を各自の本
来の距離に比例する距離だけ相互に移動させるように操
作する。これは、2つのプロトタイプ文字の形状を、そ
れぞれの非類似領域を強調することにより類似性を弱め
ることに役立つ。スカラkは、誇張された書体を作成す
るために歪みの程度を制御する誇張係数である。
来の距離に比例する距離だけ相互に移動させるように操
作する。これは、2つのプロトタイプ文字の形状を、そ
れぞれの非類似領域を強調することにより類似性を弱め
ることに役立つ。スカラkは、誇張された書体を作成す
るために歪みの程度を制御する誇張係数である。
【図1】本発明に従って構成され操作される手書き入力
認識システムの略ブロック図。
認識システムの略ブロック図。
【図2】混同しやすい文字の組に関する2のプロトタイ
プ文字および、誤認識される可能性のある多数の別様に
形成された入力文字を示す説明図。
プ文字および、誤認識される可能性のある多数の別様に
形成された入力文字を示す説明図。
【図3】文字間の相違を強調し、類似性を弱めるように
形成された図2のプロトタイプ文字を示す説明図。
形成された図2のプロトタイプ文字を示す説明図。
【図4】2の異なる文字プロトタイプの組、詳しくは大
文字「A」および「H」ならびに小文字「h」および
「k」を示す説明図。
文字「A」および「H」ならびに小文字「h」および
「k」を示す説明図。
【図5】文字間の相違を強調し、類似性を弱めるように
形成された図4の2の異なる文字のプロトタイプの組を
示す説明図。
形成された図4の2の異なる文字のプロトタイプの組を
示す説明図。
【図6】本発明の第1の方法および、その方法の操作が
例示した文字プロトタイプの組の形成に対して与える作
用を示す流れ図。
例示した文字プロトタイプの組の形成に対して与える作
用を示す流れ図。
【図7】本発明の第2の方法および、その方法の操作が
例示した文字プロトタイプの組の形成に対して与える作
用を示す流れ図。
例示した文字プロトタイプの組の形成に対して与える作
用を示す流れ図。
【符号の説明】 10 オンライン手書き文字認識システム 12 電子タブレット 14 スタイラス 16 ストローク区分器 18 文字照合器 20 文字プロトタイプ記憶装置 22 トレーニング 24 プロトタイププロセッサ 26 キーボード 28 ディスプレイ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ジョージ、ジョセフ、ライブマン アメリカ合衆国ニューヨーク州、マウン ト、キスコ、ディプロマット、ドライ ブ、100 (72)発明者 チャールズ、カーソン、タパート アメリカ合衆国ニューヨーク州、オシニ ング、ビーチ、ロード(番地なし)
Claims (13)
- 【請求項1】手書き文字認識システムによって使用され
る文字プロトタイプを付与する方法において、 第1の手書き文字を付与する段階と、 第2の文字を付与するために前記第1の文字を複写する
段階と、 (a)前記第2の文字と前記第1の文字との間の非類似
性を強調し、 (b)前記第2の文字と前記第1の文字との間の類似性
を弱めるために、前記第1の文字を修正して前記第2の
文字に変換する段階とを含むことを特徴とする方法。 - 【請求項2】請求項1記載の方法において、さらに、前
記第1の文字および修正された前記第2の文字を文字プ
ロトタイプの記憶装置内に記憶する段階を含むことを特
徴とする方法。 - 【請求項3】請求項1記載の方法において、前記第1の
文字が二次元座標系で参照される点の集合として表現さ
れ、また、複写段階が前記第1の文字から逸脱した点を
除去するために前記第1の文字を処理する初期段階を含
むことを特徴とする方法。 - 【請求項4】手書き文字認識システムによって使用され
る文字プロトタイプを付与する方法において、第1の手
書き文字および第2の手書き文字を付与する段階であ
り、前記第1の手書き文字および前記第2の手書き文字
はそれぞれ多数の点から構成される段階と、前記第1の
文字および前記第2の文字との間の対応する点を照合す
る段階と、照合する点の組を、前記第1の文字と前記第
2の文字との間の非類似性を強調するために、その組の
各照合された対応点間の初期分離に比例する量だけ相互
に分離させるために処理する段階とを含むことを特徴と
する方法。 - 【請求項5】請求項4記載の方法において、照合段階
が、前記第1の文字および前記第2の文字を整列させる
ために前記第1の文字および前記第2の文字を柔軟に照
合させる段階を含むことを特徴とする方法。 - 【請求項6】請求項4記載の方法において、処理段階
が、対応する点(p1,p2)の全部の組について、
(a)p1を前記第1の文字の点とする段階と、(b)
p2を前記第2の文字の点とする段階と、(c)p1か
らp2に引かれたベクトルを(p2−p1)と示す段階
と、(d)ベクトル加算を用いて、それぞれ、点の組p
1’およびp2’から構成される修正された前記第1の
文字および前記第2の文字を、 p1’=p1+k(p1−p2) p2’=p2+k(p2−p1) (式中、k>0として選択される)となるように計算す
る段階とを含むことを特徴とする方法。 - 【請求項7】請求項6記載の方法において、kが、前記
第1の文字および前記第2の文字のひずみの量を制御す
るために選択される値を有する誇張係数であることを特
徴とする方法。 - 【請求項8】請求項4記載の方法において、さらに、処
理された前記第1の文字および処理された前記第2の文
字を文字プロトタイプの記憶装置内に記憶する段階を含
むことを特徴とする方法。 - 【請求項9】手書き文字認識システムによって使用され
る文字プロトタイプを付与する装置において、第1の手
書き文字および第2の手書き文字を付与する手段であ
り、前記第1の手書き文字および前記第2の手書き文字
はそれぞれ多数の点から構成される手段と、前記第1の
文字および前記第2の文字との間の対応する点を照合す
るための手段と、照合する点の組を、前記第1の文字と
前記第2の文字との間の非類似性を強調するために、そ
の組の各照合された対応点間の初期分離に比例する量だ
け相互に分離させるために処理するための手段とを含む
ことを特徴とする装置。 - 【請求項10】請求項9記載の装置において、照合手段
が、前記第1の文字および前記第2の文字を整列させる
ために前記第1の文字および前記第2の文字を柔軟に照
合するための手段を含むことを特徴とする装置。 - 【請求項11】請求項9記載の装置において、処理手段
が、対応する点(p1,p2)の全部の組に応答する手
段を含み、この時、p1は前記第1の文字の点であり、
p2は前記第2の文字の点であり、(p2−p1)はp
1からp2に引かれたベクトルを示し、それぞれ、点の
組p1’およびp2’から構成される修正された前記第
1の文字および前記第2の文字を、 p1’=p1+k(p1−p2) p2’=p2+k(p2−p1) (式中、k>0として選択される)となるように計算す
るための手段を含むことを特徴とする装置。 - 【請求項12】請求項11記載の装置において、kが、
前記第1の文字および前記第2の文字のひずみの量を制
御するために選択される値を有する誇張係数であること
を特徴とする装置。 - 【請求項13】請求項9記載の装置において、さらに、
処理された前記第1の文字および処理された前記第2の
文字を記憶するための手段を含むことを特徴とする装
置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US667917 | 1991-03-11 | ||
US07/667,917 US5285505A (en) | 1991-03-11 | 1991-03-11 | Method and apparatus for improving prototypes of similar characters in on-line handwriting recognition |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04311286A JPH04311286A (ja) | 1992-11-04 |
JP2602596B2 true JP2602596B2 (ja) | 1997-04-23 |
Family
ID=24680202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3335072A Expired - Fee Related JP2602596B2 (ja) | 1991-03-11 | 1991-12-18 | オンライン手書き文字認識における類似文字のプロトタイプを改良するための方法および装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US5285505A (ja) |
EP (1) | EP0503250A2 (ja) |
JP (1) | JP2602596B2 (ja) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5490223A (en) * | 1993-06-22 | 1996-02-06 | Kabushiki Kaisha Toshiba | Pattern recognition apparatus |
JPH0721034A (ja) * | 1993-06-28 | 1995-01-24 | Fujitsu Ltd | 文字列複写処理方法 |
JPH0732649A (ja) * | 1993-07-16 | 1995-02-03 | Fujitsu Ltd | 文字の合成方法及びその装置 |
GB2281997B (en) * | 1993-09-20 | 1997-10-15 | Ricoh Kk | Method and apparatus for improving a text image by using character regeneration |
US6366697B1 (en) | 1993-10-06 | 2002-04-02 | Xerox Corporation | Rotationally desensitized unistroke handwriting recognition |
US5465309A (en) * | 1993-12-10 | 1995-11-07 | International Business Machines Corporation | Method of and apparatus for character recognition through related spelling heuristics |
US5649023A (en) * | 1994-05-24 | 1997-07-15 | Panasonic Technologies, Inc. | Method and apparatus for indexing a plurality of handwritten objects |
US5524240A (en) * | 1994-05-24 | 1996-06-04 | Panasonic Technologies, Inc. | Method and apparatus for storage and retrieval of handwritten information |
US5710916A (en) * | 1994-05-24 | 1998-01-20 | Panasonic Technologies, Inc. | Method and apparatus for similarity matching of handwritten data objects |
US5644656A (en) * | 1994-06-07 | 1997-07-01 | Massachusetts Institute Of Technology | Method and apparatus for automated text recognition |
US6137908A (en) * | 1994-06-29 | 2000-10-24 | Microsoft Corporation | Handwriting recognition system simultaneously considering shape and context information |
US5544260A (en) | 1994-07-12 | 1996-08-06 | International Business Machines Corporation | Silent training by error correction for on-line handwritting recognition systems |
US5647023A (en) * | 1994-07-28 | 1997-07-08 | Lucent Technologies Inc. | Method of nonlinear filtering of degraded document images |
US5680480A (en) * | 1994-07-29 | 1997-10-21 | Apple Computer, Inc. | Method and apparatus for training a recognizer |
US5757959A (en) * | 1995-04-05 | 1998-05-26 | Panasonic Technologies, Inc. | System and method for handwriting matching using edit distance computation in a systolic array processor |
US5802207A (en) * | 1995-06-30 | 1998-09-01 | Industrial Technology Research Institute | System and process for constructing optimized prototypes for pattern recognition using competitive classification learning |
US5917942A (en) * | 1995-12-28 | 1999-06-29 | Motorla, Inc. | Device and method for handwriting recognition with adaptive weighting of recognition data |
US5787455A (en) * | 1995-12-28 | 1998-07-28 | Motorola, Inc. | Method and apparatus for storing corrected words with previous user-corrected recognition results to improve recognition |
JPH09259219A (ja) * | 1996-03-26 | 1997-10-03 | Sharp Corp | 文字認識方法 |
US5909509A (en) * | 1996-05-08 | 1999-06-01 | Industrial Technology Research Inst. | Statistical-based recognition of similar characters |
US6941018B2 (en) * | 2001-03-23 | 2005-09-06 | Glory Ltd. | Method of and apparatus for searching corresponding points between images, and computer program |
US7974472B2 (en) * | 2007-06-29 | 2011-07-05 | Microsoft Corporation | Feature design for HMM based Eastern Asian character recognition |
US9276617B2 (en) | 2013-03-15 | 2016-03-01 | Analog Devices, Inc. | Radio frequency domain digital pre-distortion |
US9154148B2 (en) | 2013-03-15 | 2015-10-06 | Analog Devices, Inc. | Clock signal error correction in a digital-to-analog converter |
US9281788B2 (en) | 2013-03-15 | 2016-03-08 | Analog Devices, Inc. | All digital zero-voltage switching |
US8970418B1 (en) | 2013-08-19 | 2015-03-03 | Analog Devices, Inc. | High output power digital-to-analog converter system |
US10056924B2 (en) | 2013-08-19 | 2018-08-21 | Analog Devices, Inc. | High output power digital-to-analog converter system |
CN104376336B (zh) * | 2014-12-01 | 2018-07-06 | 深圳如果技术有限公司 | 一种手写识别的方法及手写笔 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3755780A (en) * | 1971-06-28 | 1973-08-28 | Pattern Analysis & Recognition | Method for recognizing characters |
JPS4991731A (ja) * | 1972-12-31 | 1974-09-02 | ||
US4030068A (en) * | 1976-01-12 | 1977-06-14 | Decision Data Computer Corporation | Optical character recognition system |
JPS58103075A (ja) * | 1981-12-16 | 1983-06-18 | Toshiba Corp | 文字読取装置 |
JPS5998283A (ja) * | 1982-11-27 | 1984-06-06 | Hitachi Ltd | パターン切出しおよび認識方法、ならびにそのシステム |
US4573196A (en) * | 1983-01-19 | 1986-02-25 | Communications Intelligence Corporation | Confusion grouping of strokes in pattern recognition method and system |
US4561105A (en) * | 1983-01-19 | 1985-12-24 | Communication Intelligence Corporation | Complex pattern recognition method and system |
US4718102A (en) * | 1983-01-19 | 1988-01-05 | Communication Intelligence Corporation | Process and apparatus involving pattern recognition |
US4731857A (en) * | 1984-06-29 | 1988-03-15 | International Business Machines Corporation | Recognition system for run-on handwritten characters |
US4754489A (en) * | 1985-10-15 | 1988-06-28 | The Palantir Corporation | Means for resolving ambiguities in text based upon character context |
US4785391A (en) * | 1986-02-07 | 1988-11-15 | Bitstream Inc. | Automated bitmap character generation from outlines |
US5121441A (en) * | 1990-09-21 | 1992-06-09 | International Business Machines Corporation | Robust prototype establishment in an on-line handwriting recognition system |
-
1991
- 1991-03-11 US US07/667,917 patent/US5285505A/en not_active Expired - Lifetime
- 1991-12-18 JP JP3335072A patent/JP2602596B2/ja not_active Expired - Fee Related
-
1992
- 1992-01-27 EP EP92101264A patent/EP0503250A2/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
JPH04311286A (ja) | 1992-11-04 |
EP0503250A3 (ja) | 1994-02-23 |
US5285505A (en) | 1994-02-08 |
EP0503250A2 (en) | 1992-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2602596B2 (ja) | オンライン手書き文字認識における類似文字のプロトタイプを改良するための方法および装置 | |
US5315667A (en) | On-line handwriting recognition using a prototype confusability dialog | |
US5796867A (en) | Stroke-number-free and stroke-order-free on-line Chinese character recognition method | |
US4573196A (en) | Confusion grouping of strokes in pattern recognition method and system | |
US5544260A (en) | Silent training by error correction for on-line handwritting recognition systems | |
JPH0620099A (ja) | オンライン手書き文字認識システムにおける原型確立方法および装置 | |
JPH0684006A (ja) | オンライン手書き文字認識方法 | |
JPS60217477A (ja) | 手書き文字認識装置 | |
El Abed et al. | The IFN/ENIT-database-a tool to develop Arabic handwriting recognition systems | |
US20070133877A1 (en) | Script recognition for ink notes | |
JPH06301781A (ja) | コンピュータによるパターン認識のためのイメージ変換方法及び装置 | |
Manke et al. | A connectionist recognizer for on-line cursive handwriting recognition | |
JP2007213433A (ja) | 文字検索装置 | |
Rajnoha et al. | Handwriting comenia script recognition with convolutional neural network | |
JPS62159291A (ja) | 文章入力装置 | |
JPH09319828A (ja) | オンライン文字認識装置 | |
Govindaraju et al. | Paradigms in handwriting recognition | |
JP3657077B2 (ja) | オンライン文字認識装置 | |
Steinherz et al. | An integration of online and pseudo-online information for cursive word recognition | |
JP2956094B2 (ja) | 手書き文字認識装置 | |
JPH09330377A (ja) | 手書き文字認識装置および手書き文字認識方法 | |
JP3266687B2 (ja) | マーク認識方法 | |
KR20230141582A (ko) | 2차원 도면 이미지로부터 도면 정보를 그래프 구조로 추출하는 방법 및 하나의 도면 이미지와 다른 하나의 도면 이미지를 비교하는 방법 | |
JP3130392B2 (ja) | 文字認識装置 | |
JPS62190565A (ja) | 手書き図形清書装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |