JPH07117993B2 - 手書き文字認識のための特定ユーザ用プロトタイプ集合生成方法 - Google Patents

手書き文字認識のための特定ユーザ用プロトタイプ集合生成方法

Info

Publication number
JPH07117993B2
JPH07117993B2 JP5039656A JP3965693A JPH07117993B2 JP H07117993 B2 JPH07117993 B2 JP H07117993B2 JP 5039656 A JP5039656 A JP 5039656A JP 3965693 A JP3965693 A JP 3965693A JP H07117993 B2 JPH07117993 B2 JP H07117993B2
Authority
JP
Japan
Prior art keywords
user
handwriting
prototype
style
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP5039656A
Other languages
English (en)
Other versions
JPH0689368A (ja
Inventor
ジョーンキ・キム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH0689368A publication Critical patent/JPH0689368A/ja
Publication of JPH07117993B2 publication Critical patent/JPH07117993B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は手書き文字認識の分野に
属するものであり、より詳しくは、ユーザの手書きスタ
イルの自動検出と特定ユーザ用プロトタイプ集合の生成
とに関するものであって、しかもそれらを、ユーザ手書
き文字と、スタイル集合という名の予め記憶してあるア
ルファベットの部分集合と、デフォールト集合とを選択
することによって行なうようにしたものである。
【0002】
【従来の技術】オンライン式手書き文字認識のためのプ
ロトタイプを定めるプロセスは、時間のかかるプロセス
である。文字の書き手が1人の場合ですら、全ての手書
き文字形態を収集するためには、かなりの時間がかか
る。更に、文字の書き手が異なれば、書き手どうしの間
で手書きスタイルが互いに相反することがあり、そして
また、あらゆる書き手に対して使用することのできるプ
ロトタイプを予め用意しておくことは不可能である。
【0003】オンライン式手書き文字認識システムは通
常、適当なラベル付けを施した手書き文字の集合を保持
しており、未知の手書き文字が、予め記憶してあるそれ
ら手書き文字のうちのいずれかと類似しているか否かを
調べる。そして、突合せを行なったときに、予め記憶し
てあるそれら手書き文字のうち、その未知の手書き文字
との間に最良の一致が得られた予め記憶してある手書き
文字のラベルが、認識して得られた結果となる。認識の
品質は、突合せのプロセスの適否と、予め記憶してある
手書き文字の適否とに左右される。また、予め記憶して
ある手書き文字のことを、プロトタイプと呼んでいる。
【0004】プロトタイプ集合を生成するための最も直
截的な方法は、手書き文字をユーザから収集して、収集
したそれら手書き文字をプロトタイプにするという方法
である。この方法では、例えば、所定の文章をユーザに
提示して一定の位置に手書きしてもらうようにする。続
いてコンピュータが、その所定の文章の中のアルファベ
ットと、ユーザが手書きした文字とを関連付け、それに
よって、特定ユーザ用プロトタイプ集合を生成する。
【0005】プロトタイプの形成に関係した文献には、
例えば次のようなものがある。その1つは、IBM技術
開示速報(IBM Technical Disclosure Bulletin )、第
24巻、第11A号(1982年4月)に掲載されてい
る、C. C. Tappert による「Cursive Script Recogniti
on System By Elastic Matching 」という題名の論文で
ある。もう1つは、IBM技術開示速報、第24巻、第
6号(1981年11月)に掲載されている、J. M. Ku
rtzberg et al.による「Symbol Recognition System By
Elastic Matching 」という題名の論文である。これら
論文は、いずれも、プロトタイプを単純にユーザから収
集するようにした認識システムに関するものである。更
に、IBM技術開示速報に掲載されている以上の2件の
論文におけるものと同様のプロトタイプ収集法が、IB
M研究開発ジャーナル(IBM Journal of Research and
Development )、第31巻、第1号、第91〜第95頁
に掲載の、J.M. Kurtzberg による「Feature Analysis
For Symbol Recognition By ElasticMatching 」という
論文中に記載されている。
【0006】
【発明が解決しようとする課題】このような直截的な方
法でトレーニングを行なうようにした場合の1つの問題
は、そのためにユーザが長い時間を取られるということ
である。ある認識システムを新たに使用するユーザは、
通常、然るべきトレーニングを行なった後でなければ、
そのシステムを利用することができない。なぜならば、
短時間のトレーニング課程では、手書き文字の全ての形
態(バリエーション)を収集するのに充分ではないた
め、正確な結果が得られないからである。
【0007】異なったユーザの間で共通して適用される
手書きスタイルを包含したプロトタイプを用意しておけ
ば、そのシステムを新たに使用するユーザでも、そのシ
ステムを最初から利用することができる。しかしながら
現実世界には、全てのユーザに共通して適用される手書
きスタイルというものは存在しない。例えば、あるユー
ザの「t」が、別のユーザの「+」であるということも
あり得るし、また、右利きの書き手と左利きの書き手と
でも、手書きスタイルは異なっている。そのため、一部
のユーザに対しては良好に機能するスターター・プロト
タイプ集合(初期プロトタイプ集合)であっても、別の
ユーザに対しては良好に機能しないのである。
【0008】以上の点に鑑みて本発明はなされたもので
あり、本発明の目的は、手書き文字認識システムにおけ
る、改良した特定ユーザ用プロトタイプ構築技法を提供
することにある。本発明の更なる目的は、手書き認識シ
ステムにおける、従来より高速の特定ユーザ用プロトタ
イプ構築技法を提供することにある。本発明の更なる目
的は、手書き認識システムにおける、従来より高速の特
定ユーザ用プロトタイプ構築技法であって、しかも、ア
ルファベット集合の全体集合の要素数より少ない種類数
の手書き文字をユーザから収集し、収集したそれらユー
ザ手書き文字を、手書きスタイルのライブラリーから得
られる各手書きスタイル集合と比較し、それらユーザ手
書き文字と一致する手書きスタイル集合を判定するよう
にした特定ユーザ用プロトタイプ構築技法を提供するこ
とにある。尚、この後、ユーザ手書き文字と、一致した
手書きスタイル集合と、デフォールト集合とを併合し
て、そのユーザのための特定ユーザ用プロトタイプ集合
を形成するようにする。
【0009】
【課題を解決するための手段】本発明においては、プロ
トタイプ集合の全ての要素をユーザから収集するのでは
なく(それには非常に長い時間がかかる)、ユーザが僅
かな文字だけを手書きすれば良いようにしており、即
ち、ユーザが、アルファベット集合の全体集合の要素を
全て手書きしなくとも良いようにしている。そのため
に、予め、他の複数のユーザの手書き文字を収集したも
のを、手書きスタイル別に分類して、アルファベット集
合の複数の部分集合へと分類しておき、更にそれと共
に、デフォールト集合の文字集合を生成しておくように
している。そして、ユーザが手書きした文字と、そのユ
ーザの手書きスタイルに一致した1つないし複数のスタ
イル集合と、デフォールト集合とを併合して、特定ユー
ザ用プロトタイプ集合を形成するようにしている。
【0010】ここでは、手書き文字認識システムで特定
ユーザ用プロトタイプ集合を生成するための方法及び装
置について説明する。この方法及び装置においては、先
ず、アルファベット集合の要素を手書きした手書き文字
を、複数の書き手から収集する。次に、収集したそれら
手書き文字を、手書きスタイル別に分類することによ
り、それら収集した手書き文字を前記アルファベット集
合の複数の部分集合へと分類する。また、jを2以上の
整数とするとき、アルファベット集合の複数の部分集合
の各々に対して、j個のプロトタイプ・スタイル集合S
jを生成する。また、それら複数の部分集合のうちのい
ずれにも所属しない文字のための、デフォールト集合の
文字集合を生成する。また、アルファベット集合の全体
集合の要素数より少ない種類数の手書き文字をユーザか
らサンプリングする。サンプリングした、ユーザのそれ
ら手書き文字の各々を、j個のプロトタイプ・スタイル
集合Sjと比較して、ユーザが手書きした文字のうちの
いずれかの文字が、j個のプロトタイプ・スタイル集合
Sjのうちの1つないし複数のものと一致するかを判定
する。そして、ユーザ手書き文字と、一致したプロトタ
イプ・スタイル集合と、デフォールト集合とを併合し
て、そのユーザのための特定ユーザ用プロトタイプ集合
を形成する。
【0011】
【実施例】本発明は、特定ユーザ用プロトタイプを可及
的に短時間のうちに生成できるようにする、手書き認識
システムのための特定ユーザ用プロトタイプ集合の生成
に関するものである。文字の書き手は、各人が夫々に独
特の手書きスタイルを持っているため、手書きスタイル
の種類の総数は膨大な数に上る。しかしながら、アルフ
ァベット集合を複数の部分集合に分割して考えるなら
ば、それら部分集合の1つ1つについては、比較的少な
い種類の手書きスタイルしか存在してない。例えば、
「D」及び「P」という文字は、一般的に、一筆(ひと
ふで)または二筆(ふたふで)で書かれる。そして、
「D」を一筆で書く書き手は、多くの場合「P」も一筆
で書いている。それゆえ「D」及び「P」に関しては、
2種類の手書き(プロトタイプ)スタイル集合が存在し
ている。また、左利きの書き手は、短い横線を引くとき
には、しばしば、右から左へ引くが、一方、右利きの書
き手は、それを左から右へ引く。従って、「T」、
「F」、「H」等の文字では、2種類のスタイル集合が
存在している。
【0012】最初のステップは、多くの書き手から手書
き文字を収集するステップである。続いて、収集した大
量の手書き文字から成る手書き文字集合を解析して、そ
れら手書き文字を、例えば(D、P)や、(T、F、
H)等の、複数の部分集合へと分類する。そして、それ
ら部分集合の各々に対して、複数のスタイル集合を生成
する。これによって、例えば、一筆で書かれた(D、
P)というスタイル集合、二筆で書かれた(D、P)と
いうスタイル集合、左から右へ横線を引いた(T、F、
H)というスタイル集合、それに、右から左へ横線を引
いた(T、F、H)というスタイル集合が生成される。
従ってこの具体例の場合では、合計4個のプロトタイプ
・スタイル集合が生成される。以上の用意をしておいた
上で、ユーザの手書き文字を、1文字ずつ、各々のプロ
トタイプ・スタイル集合との間で突合せるようにする。
そして、もしいずれかのプロトタイプ・スタイル集合の
中のいずれかの文字との間に良好な一致が得られたなら
ば、その書き手は、そのプロトタイプ・スタイル集合の
種類の手書きスタイルを持った書き手であるといえる。
例えば、もしそのユーザの手書き文字の中に一筆で書か
れた「D」が含まれていたならば、そのユーザは、「一
筆の(D、P)」という手書きスタイルを持ったユーザ
である。
【0013】文字の中には、どのスタイル集合にも所属
しないものがあり(例えば「o」、「O」、「c」、
「C」、「s」、「S」、それに、大部分の句読記号類
がそうである)、それゆえ、アルファベットの全ての文
字に対応するためには、更に別に1つの集合(即ちデフ
ォールト集合)を作成しておく必要がある。ユーザの手
書き文字は、2つの種類に分けることができる。そのう
ちの第1の種類は、複数のプロトタイプ・スタイル集合
のうちのいずれか1つと一致するユーザ手書き文字であ
り、第2の種類は、それらプロトタイプ・スタイル集合
のうちのいずれとも一致しないユーザ手書き文字であ
る。それゆえ、特定ユーザ用プロトタイプを生成するに
は、ユーザ手書き文字と、ユーザ手書き文字と一致した
全てのプロトタイプ・スタイル集合と、デフォールト集
合である手書きスタイル集合とを、併合するようにして
いる。
【0014】プロトタイプ・スタイル集合の収集を良好
に行なうことは、高い精度を得るために非常に重要なこ
とである。ただし、プロトタイプ・スタイル集合の収集
が、特に良好に行なわれなくとも、ある程度の水準にさ
え達してさえいれば、トレーニング時間を大幅に短縮す
ることは可能である。理想的な場合では、必ずしもアル
ファベットの全ての文字を包含していない、非常に短時
間のトレーニング課程を実行するだけでも、特定ユーザ
用プロトタイプ集合を生成するには充分なものとなり得
る。以上の自動式の手書きスタイル生成手順を、ハンド
ヘルド型タブレット・ペンを備えたコンピュータ・シス
テムに組み込むようにすれば、トレーニング時間を大幅
に短縮することができ、また、そのことが直接、認識精
度の向上にもつながり、そのコンピュータ・システムを
より有用なものにすることにもつながる。
【0015】図1について説明すると、同図は、本発明
に従って構成された、そして本発明に従って動作する、
オンライン式の手書き文字認識システム10の全体構成
を示した図である。この手書き文字認識システム10
は、任意の汎用コンピュータを用いて構成することがで
きる。その具体例を挙げるならば、例えば、この手書き
文字認識システム10は、「OS/2」を走らせている
「IBM・PS/2・モデル80」を使用して構成する
ことができる。尚、「IBM」、「PS/2」、それに
「OS/2」は、いずれもIBM社の登録商標である。
手書き文字認識システム10は、手書き文字トランスデ
ューサを含んでいる。この手書き文字トランスデューサ
は、電子タブレットとディスプレイとを一体化したタブ
レット/ディスプレイ装置12から成り、このタブレッ
ト/ディスプレイ装置12は、例えばスタイラス(ペン
状器具)14等の、手書き器具を備えている。手書き文
字トランスデューサは、手書きされた文字に応答して、
(x,y)座標値のシリアルなストリームを出力し、出
力されるそれら(x,y)座標値は、タブレット12の
座標系に対するスタイラス14の相対的な位置を表わす
座標値である。こうして出力されたそれら座標値は、ス
トローク・セグメンター16へ供給され、このストロー
ク・セグメンター16は、手書きされた文字の個々の筆
画の始点と終点とを識別する。
【0016】始点と終点とを識別されたストロークは、
文字突合せ部18へ供給される。文字突合せ部18は、
所定の文字プロトタイプを記憶させてある文字プロトタ
イプ記憶部20に結合してあり、それによって、この文
字突合せ部18は、入力ストロークの始点及び終点を、
記憶されている文字プロトタイプの始点及び終点と比較
することによって、ある確率の範囲内で、1つの入力ス
トロークないしは入力した複数のストロークの組合せ
が、ある特定の文字を表わしているということを識別す
る。こうして認識された文字は、文字突合せ部18から
ライン19を介して、タブレット/ディスプレイ装置1
2へ出力され、このタブレット/ディスプレイ装置12
にその認識された文字がディスプレイされる。或いは別
法として、その認識された文字を、例えばディスプレイ
等のユーティリティ装置21や、例えばワードプロセッ
シング・プログラム等のアプリケーション等へ供給する
ようにしても良い。更には、ストローク・セグメンター
16の機能と文字突合せ部18の機能とを組合せて単一
の手書きストローク処理部として構成したシステムとす
ることもできる。
【0017】文字プロトタイプ記憶部20へ文字プロト
タイプが供給されるのは、例えば、手書き文字認識シス
テム10のユーザがトレーニング課程を実行していると
きである。この手書き文字認識システムのユーザのう
ち、ある特定のユーザが入力した文字プロトタイプは、
それ以後、その特定のユーザが手書き文字を入力すると
きだけに使用されることになる。ただし、このような特
定のユーザだけが使用する文字プロトタイプ以外にも、
2人以上のユーザが共用することのできる、大域的即ち
普遍的な、文字プロトタイプ集合を生成しておくことが
できる。
【0018】これに関しては、例えば、この手書き文字
認識システム10を初めて使用する書き手の全てが利用
することのできる初期プロトタイプ集合として、スター
ター・プロトタイプ集合を設計しておくようにすれば良
い。この場合、個々の書き手は、必要に応じて、このス
ターター・プロトタイプ集合に更に、その書き手自身の
手書きスタイルの文字プロトタイプを追加することによ
って、その書き手に合ったプロトタイプ集合を得ること
ができ、そうして得られるプロトタイプ集合のことを、
特定個人用プロトタイプ集合(或いは特定ユーザ用プロ
トタイプ集合)という。スターター・プロトタイプ集合
は、一般的に、手書き文字認識システムの分野の専門家
が生成するものであるため、手書き文字認識システム1
0のユーザにとっては、文字の手書きに関するガイドラ
インや制約に従わねばならないという煩わしさをこうむ
らずに済む。これより、本発明に従ってスターター・プ
ロトタイプ集合を生成する際の、その生成方法について
説明する。
【0019】その全体の概要を述べるならば、先ず、ト
レーニング課程の実行中には、文字突合せ部18から出
力される認識された文字が、物理スイッチないし論理ス
イッチであるスイッチ22を介して、プロトタイプ処理
装置24へ供給されるようにしておく。このプロトタイ
プ処理装置24には、例えば「インテル’386型」プ
ロセッサ等の処理装置等を使用することができる。プロ
トタイプ処理装置24からの出力は、一連の複数の平均
的プロトタイプ文字であり、それらプロトタイプ文字
は、文字プロトタイプ記憶部20へ供給され、そして、
手書き文字認識システム10を使用する個々のユーザを
対象として後に行なわれる、手書き文字認識処理の実行
中に使用される。
【0020】プロトタイプ処理装置24には、更に、例
えばキーボード26やディスプレイ装置28等のユーザ
入出力装置を接続しておき、それらユーザ入出力装置に
よってプロトタイプ処理装置24の動作を制御すること
によって、手書き文字認識システム10を使用する個々
のユーザを対象とした手書き文字認識処理の実行中に用
いられるプロトタイプの中に、混同しやすいプロトタイ
プがあった場合に、そのプロトタイプを削除できるよう
にしておいても良い。ただし、キーボード26やディス
プレイ28は、あくまでも任意に追加することのできる
オプション要素であって、この手書き文字認識システム
10は、ペン式の入力装置を備えただけでも機能し得る
ものであることに注意されたい。更には、電子式タブレ
ットとディスプレイとを一体にしたタブレット/ディス
プレイ装置12についても、それを、ディスプレイ無し
の電子式タブレットだけから成る装置に取り替え、文字
のディスプレイは、ユーティリティ装置21やディスプ
レイ装置28によって行なうようにすることも可能であ
る。
【0021】次に図2について説明すると、同図は、特
定ユーザ用プロトタイプ集合を生成するための、図1に
示したプロトタイプ処理装置24の、更に詳細な機能ブ
ロック図である。ユーザが供給するユーザ手書き文字u
(即ち、複数の手書き文字の集合)はライン30上へ供
給され、このライン30から更に比較部32と併合部3
4とへ供給される。それらユーザ手書き文字uの種類数
は、既に述べたように、アルファベット集合の全体集合
の要素数より少ない。ここでは、ユーザ手書き文字u
を、例えば次のように表わすことにする。 u={B、T... }
【0022】先ず、アルファベット集合の要素を手書き
した手書き文字を、複数の書き手から収集する。次に、
それら収集した手書き文字を手書きスタイル別に分類す
ることによって、それら収集した手書き文字をアルファ
ベット集合の複数の部分集合へと分類する。続いて、j
を2以上の整数とするとき、アルファベット集合のそれ
ら複数の部分集合の各々に対して、j個の手書きスタイ
ル集合Sjを、手書きスタイル別に生成する。これによ
って、多数のその種の手書きスタイル集合が生成され
る。ここでは、それら手書きスタイル集合Sjを、次の
ように表わすことにする(以下、「手書きスタイル集
合」を単に「スタイル集合」と書き表わす) 。 スタイル集合S1={B、D、P}(一筆で書か
れた文字) スタイル集合S2={B、D、P}(二筆で書かれた文
字) スタイル集合S3={A、E、F}(横線を左から右へ
引いた文字) スタイル集合S4={A、E、F}(横線を右から左へ
引いた文字) ・ ・ ・ ・ ・ ・ ・ ・ ・ スタイル集合Sj={T、I... } そして、これらj個のスタイル集合Sjは、スタイル集
合記憶部36に記憶させておく。
【0023】更に、以上のスタイル集合Sjのいずれに
も所属しない文字のために、文字のデフォールト集合D
を生成する。既述のごとく、デフォールト集合Dには、
例えば、「o」、「O」、「c」、「C」、「S」、
「s」、それに、大部分の句読記号類が含まれる。ここ
では、デフォールト集合Dを、次のように表わすことに
する。 D={O、C、S... } このデフォールト集合は、デフォールト集合記憶部38
に記憶させておく。
【0024】特定ユーザ用プロトタイプの生成は以下の
ようにして行なう。ここでは、ユーザ手書き文字が、一
例として、次のようなものであったとする。 u={A、C、D} ライン30上へ供給されたこのユーザ手書き文字uは、
ライン30から更に、比較部32と併合部34とへ供給
される。このユーザ手書き文字uのうち、最初の文字
「A」(左から右)は、スタイル集合S3に該当するも
のであると判定され、そのためスタイル集合S3が、ラ
イン42上の制御信号の制御の下に、ライン40を介し
て併合部34へ供給される。次の文字「C」は、スタイ
ル集合記憶部36の中に記憶してあるいずれのスタイル
集合にも該当しないものであると判定され、そのためデ
フォールト集合Dが、ライン42上の制御信号の制御の
下に、ライン44を介して併合部34へ供給される。た
だしデフォールト集合Dは、常に併合部34へ供給され
る。即ち、ユーザが手書きした文字のうちにデフォール
ト集合の文字が含まれていなかった場合でも、デフォー
ルト集合Dは併合部34へ供給される。更に次の文字
「D」(一筆書き)は、スタイル集合S1に該当するも
のであると判定され、そのためスタイル集合S1が、ラ
イン42上の制御信号の制御の下に、ライン40を介し
て併合部34へ供給される。以上のプロセスを、ユーザ
が手書きした、アルファベット集合の全体集合の要素数
よりも少ない種類数の手書き文字の、その各々について
実行するようにしている。ユーザ手書き文字uが、ここ
で具体例として採用した手書き文字である場合(即ち、
u={A、C、D})には、併合部34の出力に接続さ
れているライン46上に送出されて文字プロトタイプ記
憶部20(図1)へ供給される、特定ユーザ用プロトタ
イプ集合Puは、次のようになる。 Pu=u+S1+S3+D 即ち、この場合の、特定ユーザ用プロトタイプ集合Pu
は、ユーザ手書き文字uと、スタイル集合S1と、スタ
イル集合S3と、デフォールト集合Dとを組合せた(併
合した)ものになる。なおここで、一致すると判定され
たスタイル集合を一般的にMSjと表すと、特定ユーザ
用プロトタイプ集合は、 Pu=u+MSj+D で表すことができる。
【0025】次に図3について説明すると、同図は、特
定ユーザ用プロトタイプ集合Puをどのように生成する
かを示した詳細なフローチャートである。先ずブロック
50において、特定ユーザ用プロトタイプ集合を、初期
設定として、ユーザ手書き文字uとデフォールト集合D
とを組合せたものに設定する。ユーザ手書き文字uはi
個の文字から成り、ここでiは、1以上の整数である。
ブロック52では、iを先頭の文字の番号に等しくi=
1に設定する。ブロック54では、iが、ユーザが手書
きした文字の個数よりも大きいか否かを判定する。例え
ば、ユーザが10個の文字を手書きした場合には、この
判定は、「i>10」であるか否かを判定するものとな
る。もしそうであったならば、この処理手順はライン5
5で示したように終了する。一方、もしそうでなかった
ならば、この処理手順はブロック56へ進み、このブロ
ック56では、jを先頭のスタイル集合の番号に等しく
設定する。ここでは、先頭のスタイル集合はスタイル集
合S1である。続いてこの処理手順はブロック58へ進
み、このブロック58では、jが、最後のスタイル集合
の番号より大きいか否かを判定する。例えばスタイル集
合が6個存在している場合には、この判定は、「j>
6」であるか否かを判定するものとなる。もしそうであ
ったならば、それは、全てのスタイル集合を、その特定
の文字と比較し終わったことを示している。続いてこの
処理手順はブロック60へ進み、そこでは、iを「1」
だけインクリメントする。これによって、複数のユーザ
手書き文字のうちの、次の文字を調べることができるよ
うになる。続いて、この処理手順は、ブロック54〜ブ
ロック58における以上のプロセスを反復実行して、ユ
ーザ手書き文字のうちの、この「次の文字」を処理し、
また更にそれに続く文字を次々と処理して行く。
【0026】一方、ブロック58における判定結果が
「NO」であるうちは、この処理手順はブロック62へ
進み、このブロック62では、ユーザ手書き文字ui
(ユーザ手書き文字のうちの第i番目の文字)が、その
文字を現在比較している相手のスタイル集合Sjの要素
であるか否かを判定する。もし、そうでなかったなら
ば、ブロック64へ進み、このブロック64では、jを
「1」だけインクリメントして、次のスタイル集合と、
そのユーザ手書き文字uiとを、ブロック58及びブロ
ック62に関して説明したようにして比較できるように
する。
【0027】一方、ブロック62における判定の結果、
そのユーザ手書き文字uiが、そのスタイル集合Sjの
要素であると判定された場合には、この処理手順はブロ
ック66へ進み、このブロック66では、特定ユーザ用
プロトタイプ集合に要素の追加を行なって、その特定ユ
ーザ用プロトタイプ集合の中にスタイル集合Sjを含め
るようにする。これは、次の式で表わすことができる。 Pu=u+D+Sj 続いてこの処理手順はブロック64へ進み、そこではj
を「1」だけインクリメントする。これによって、先に
説明したように、後続のスタイル集合をそのユーザ手書
き文字uiと比較することができるようになる。以上か
ら分かるように、ユーザが手書きした複数の手書き文字
の各々を連続して次々と、各々のスタイル集合と比較す
るようにしている。そして、それらユーザ手書き文字の
うちのある1つの文字が、所与のスタイル集合に該当す
るものであると判定されるたびに、そのスタイル集合
を、ユーザ手書き文字とデフォールト集合とを組合せた
ものに更に追加して行き、それによって、そのユーザの
ための特定ユーザ用プロトタイプを形成するようにして
いるのである。
【0028】
【発明の効果】本発明は以上のように構成されているの
で、プロタタイプ集合のすべての要素を収集するのでは
なく、ユーザが所定数のわずかな文字だけを手書き入力
して、それの基づいてユーザの習慣、癖等に対応した特
定ユーザ用プロタタイプ集合を構築しているので、この
ようなプロタタイプ集合を高速で構築する事ができると
いう効果をそうすることができる。
【図面の簡単な説明】
【図1】本発明に従って構成された、そして本発明に従
って動作する、手書き文字認識システムの簡明なブロッ
ク図である。
【図2】図1の中のプロトタイプ処理装置を詳細に示し
たブロック図である。
【図3】図1及び図2に示したプロトタイプ処理装置に
おいて、特定ユーザ用プロトタイプがどのように生成さ
れるかを示したフローチャートである。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 手書き文字認識システムで特定ユーザ用
    プロトタイプ集合を生成する方法において、 (a)アルファベット集合の要素を手書きした手書き文
    字を複数の書き手から収集し、それら複数の書き手の手
    書きスタイル別に分類することにより、それら収集した
    手書き文字を、前記アルファベット集合の複数の部分集
    合へ分類するステップと、 (b)前記アルファベット集合の前記複数の部分集合の
    各々に対して、j個(jは2以上の整数)の手書きスタ
    イル集合を生成するステップと、 前記アルファベット集合の全体の要素数より少ない種類
    数のユーザ手書き文字を、ユーザ入力からサンプリング
    するステップと、 (c)前記ユーザ手書き文字を前記手書きスタイル集合
    の各々と比較して、ユーザ手書き文字が前記j個の手書
    きスタイル集合のうちの1つないし複数のものと一致す
    るかを判定し、一致手書きスタイル集合を生成するステ
    ップと、 (d)前記ユーザ手書き文字と前記一致手書きスタイル
    集合とを併合して、前記ユーザのための特定ユーザ用プ
    ロトタイプ集合を形成するステップと、を含んでいるこ
    とを特徴とする方法。
  2. 【請求項2】 請求項1記載の方法において、該方法は
    更にデフォールト集合を生成するステップを含み、前記
    ステップ(d)において、前記ユーザ手書き文字と前記
    一致手書きスタイル集合に加えて、前記デフォールト集
    合を併合して、前記特定ユーザ用プロトタイプ集合を形
    成することを特徴とする方法。
  3. 【請求項3】 手書き文字認識システムで特定ユーザ用
    プロトタイプ集合を生成する方法において、 (a)アルファベット集合の要素を手書きした手書き文
    字を、一部の書き手が様々に異なった手書きスタイルを
    有する複数の書き手から、収集するステップと、 (b)前記収集した手書き文字を、前記複数の書き手の
    手書きスタイル別に分類することにより、それら収集し
    た手書き文字を前記アルファベット集合の文字の複数の
    部分集合へ分類するステップと、 (c)前記アルファベット集合の文字の前記複数の部分
    集合の各々に対して、j個(jは2以上の整数)の手書
    きスタイル集合Sjを生成するステップと、 (d)前記アルファベット集合の中の文字のデフォール
    ト集合Dを生成するステップと、 (e)前記アルファベット集合の全体の要素数より少な
    い種類数のユーザ手書き文字uを、ユーザ入力からサン
    プリングするステップと、 (f)前記ユーザ手書き文字を、前記手書きスタイル集
    合Sjの各々と比較して、ユーザが手書きした文字中の
    いずれの文字が、前記手書きスタイル集合Sjのうちの
    1つないし複数のものと一致するかを判定し、その一致
    手書きスタイル集合をMSjで表わすステップと、 (g)特定ユーザ用プロトタイプ集合Puを、Pu=u
    +D+MSj として生成するステップと、を含んでい
    ることを特徴とする方法。
  4. 【請求項4】 請求項3記載の方法において、前記手書
    きスタイル集合Sjを、少なくとも、所与の文字を作り
    上げているストロークの画数別に分類するようにしたこ
    とを特徴とする方法。
  5. 【請求項5】 請求項3記載の方法において、前記手書
    きスタイル集合Sjを、少なくとも、文字の1つのスト
    ロークが左から右へ引かれているか右から左へ引かれて
    いるかによって分類するようにしたことを特徴とする方
    法。
  6. 【請求項6】 請求項3記載の方法において、前記手書
    きスタイル集合Sjを、少なくとも、所与の文字を作り
    上げているストロークの画数別に、かつ文字の1つのス
    トロークが左から右へ引かれているか右から左へ引かれ
    ているかによって、分類するようにしたことを特徴とす
    る方法。
JP5039656A 1992-04-29 1993-03-01 手書き文字認識のための特定ユーザ用プロトタイプ集合生成方法 Expired - Lifetime JPH07117993B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US87551692A 1992-04-29 1992-04-29
US875516 1992-04-29

Publications (2)

Publication Number Publication Date
JPH0689368A JPH0689368A (ja) 1994-03-29
JPH07117993B2 true JPH07117993B2 (ja) 1995-12-18

Family

ID=25365946

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5039656A Expired - Lifetime JPH07117993B2 (ja) 1992-04-29 1993-03-01 手書き文字認識のための特定ユーザ用プロトタイプ集合生成方法

Country Status (2)

Country Link
EP (1) EP0567836A3 (ja)
JP (1) JPH07117993B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR9405791A (pt) * 1993-12-01 1995-12-12 Motorola Inc Processo combinado baseado em dicionário e de conjunto de caracteres semelhantes para reconhecimento de caligrafia
JPH10261082A (ja) 1997-03-19 1998-09-29 Kiyadeitsukusu:Kk コンピュータ署名照合方式における登録署名データ作成方法
CA2529037A1 (en) * 2003-08-15 2005-02-24 Silverbrook Research Pty Ltd Natural language recognition using distributed processing
US7715629B2 (en) * 2005-08-29 2010-05-11 Microsoft Corporation Style aware use of writing input

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5121441A (en) * 1990-09-21 1992-06-09 International Business Machines Corporation Robust prototype establishment in an on-line handwriting recognition system

Also Published As

Publication number Publication date
EP0567836A2 (en) 1993-11-03
JPH0689368A (ja) 1994-03-29
EP0567836A3 (en) 1994-09-28

Similar Documents

Publication Publication Date Title
JP3974359B2 (ja) オンライン文字認識装置及び方法並びにコンピュータ読み取り可能な記憶媒体及びオンライン文字認識プログラム
US5687254A (en) Searching and Matching unrecognized handwriting
US7742642B2 (en) System and method for automated reading of handwriting
Kara et al. Hierarchical parsing and recognition of hand-sketched diagrams
US6249606B1 (en) Method and system for gesture category recognition and training using a feature vector
JP3131287B2 (ja) パターン認識装置
US8315482B2 (en) Integrated platform for user input of digital ink
JP5211334B2 (ja) 手書き記号の認識方法及び装置
US7778464B2 (en) Apparatus and method for searching for digital ink query
US20070009151A1 (en) Handwriting recognition using neural networks
JPH1153402A (ja) 情報検索装置
JP2007317022A (ja) 手書文字処理装置及び手書文字処理方法
JPH05182029A (ja) 可搬型ペン入力装置およびペン入力計算機システム
WO1996039677A1 (en) Method and apparatus for character recognition of hand-written input
KR20080034956A (ko) 기입 입력의 스타일 연동 이용
EP3828685B1 (en) Gesture stroke recognition in touch-based user interface input
Poon et al. Scribbler: A tool for searching digital ink
US6421461B1 (en) Pattern recognition apparatus which compares input pattern feature and size data to registered feature and size pattern data, an apparatus for registering feature and size data, and corresponding methods and memory media therefor
JP4346814B2 (ja) 情報処理装置及びその方法、コンピュータ可読メモリ、プログラム
JP4686502B2 (ja) オンライン文字認識装置
JP2003196593A (ja) 文字認識装置および文字認識方法および文字認識プログラム
JPH07117993B2 (ja) 手書き文字認識のための特定ユーザ用プロトタイプ集合生成方法
US6320985B1 (en) Apparatus and method for augmenting data in handwriting recognition system
JPH0610829B2 (ja) 手書き文字認識方法
K Jabde et al. A Comprehensive Literature Review on Air-written Online Handwritten Recognition