JP5071914B2

JP5071914B2 - 認識グラフ

Info

Publication number: JP5071914B2
Application number: JP2007557966A
Authority: JP
Inventors: シュテルンビー、ヤコブ
Original assignee: ザイデクマアクチボラゲット
Priority date: 2005-02-28
Filing date: 2006-02-24
Publication date: 2012-11-14
Anticipated expiration: 2026-02-24
Also published as: CN101128838B; TWI321294B; EP1854048A1; CN101128838A; JP2008532176A; US7756335B2; US20060239560A1; WO2006091156A1; KR20070110399A; RU2007135945A; TW200703129A

Description

本発明は、１つ又は複数の曲線を含み、複数の記号を表す手書きパターンの認識に関する。本発明は、特に、手書きパターンに関する認識候補を特定することに関する。

今日、手書きは、データ処理ユニットに、特に、移動電話機及びＰＤＡ（パーソナル・デジタル・アシスタント）にデータを入力するための、ますます一般的な方法となっている。入力されたデータを扱うために、手書きは、認識され、解釈されなければならない。手書きを認識するためのほとんどの既存の方法は、入力されるべき文字が、１つずつ書き込まれ、別々に認識されることを要求する。そのような方法の実施例が、米国特許第４７３１８５７号で与えられているが、最も有名なものが、パーム社によって製造されるＧｒａｆｆｉｔｉ（登録商標）である。

データの入力をスピードアップするために、連続する手書きが許されることが望ましい。しかし、連続する手書き認識は、別々の文字の認識より、はるかに複雑である。連続する手書き認識に関して複雑さが増大することは、つなげられた文字をセグメント化することの、即ち、手書きパターン内で１つの文字から別の文字への遷移を識別することの問題に帰せられる。そのため、連続する手書き認識における誤りは、２つのレベルで生じる可能性があり、これにより、明快な順次認識システムの構築が大いに難しくなる。

連続する手書き認識のための方法は、一般に、手書きパターンの可能なセグメント化の組合せの爆発的増加を生じる、隣接する文字間における多数の可能なセグメント化が存在するという問題に悩まされている。

したがって、今日、大抵の市販のシステムは、一体化された辞書と共に、ニューラル・ネットワーク及び隠れマルコフ・モデルを使用する複雑な統計システムを採用する。そのようなシステムの例は、P. Nescovic及びL. Cooper,「ニュートラルなネットワークに基づいたコンテクストによる、オンラインの連続手書認識“Neutral network-based context driven recognition of on-line cursive script”」, Seventh International Workshop on Frontiers in Handwriting Recognition Proceedings、３５２〜３６２頁、２０００年９月、並びにM. Schenkel及びI. Guyon, 「時間遅延ネットワークと隠れたマルコフ・モデルを用いるオンラインの連続手書認識”On-line cursive script recognition using time delay networks and hidden markov models”」, Machine Vision and Applications, vol. 8、２１５〜２２３頁、１９９５年に提示されている。これらのシステムの主な欠点は、これらの規模が大きく、かつこれらが大規模な訓練セットを必要とすることである。さらに、これらは、使用される辞書に大きく依存する。

手書きパターンの様々な認識が正しいとする確率を評価することにより、認識の結果を向上させるために、一般に、辞書を、使用することができる。そのため、手書きパターンの認識からの結果を辞書と比較して、辞書の中に存在しない結果を破棄することができる。これにより、正しい認識結果をユーザに提示することができる確率が、向上する。D. Y. Chen, J. Mao及びK. M. Mohiuddinによる、「語彙集をセグメント化グラフにマッチングさせる効率の良いアルゴリズム(An efficient algorithm for matching a lexicon with a segmentation graph)」、Proceedings of the Fifth International Conference on Document Analysis and Recognition、５４３〜５４６ページ、１９９９年には、辞書をセグメント化候補と比較する方法が、開示されている。しかし、この方法は、辞書のサイズが大きくなるにつれ、より遅くなる。別の方法が、S. Lucasによる、「効率の良い最良の最初の辞書のサーチにより得られるグラフに基づく入力（Efficient best-first dictionary search given graph-based input）」、15th International Conference on Pattern Recognition, vol. 1、４３４〜４３７ページ、２０００年に、開示されている。この方法は、辞書の中に存在する最良の認識を取り出す、より効率的な仕方を提供する。辞書検索は、パス代数を計算することによって達せられるが、これは、手書きパターンのセグメント化を、まず、確立することを要求するように思われる。

国際公開第０２／３７９３３号において、辞書を使用した手書きの語の認識のための方法が、開示されている。その方法は、セグメント化ポイントを表す頂点と、それらのセグメント化ポイント間のセグメントの解釈を表すエッジとを備える解釈グラフを作成する。探索手続きが、グラフを構築するために、したがって、語の認識を特定するために、セグメント化ポイントに適用される。探索手続きは、前のセグメント化ポイントを振り返って、グラフにおいてエッジ／セグメントを置くかどうかを判定するように実行される。このため、各頂点で、語レベル仮定のリストが、格納されることが可能である。更に、仮定リストを切り詰めるために、辞書とのマッチングが、実行されることが可能である。許される各文字クラスに関して、探索手続きは、各セグメント化ポイントにおいて、グラフに、その文字クラスに対応するエッジ／セグメントを置くことが、実行可能であるかどうかを判定する必要がある。そうすることは、探索手続きを実行するための大量の計算を要求し、そのため、この方法は、遅い。

本発明の目的は、連続する手書き認識のための改良された方法を提供することである。本発明の別の目的は、多大な学習を要求せず、非常に高い処理能力を必要としない方法を提供することである。本発明の更なる目的は、手書き認識を向上させるために辞書を迅速な仕方で使用することである。

以上の諸目的の少なくとも幾つかは、独立請求項による方法、デバイス、及びコンピュータ・プログラム製品によって達せられる。本発明の特定の諸実施例は、従属請求項に記載される。

このため、本発明は、１つ又は複数の曲線を含み、複数の記号を表す手書きパターンに関する少なくとも１つの認識候補を特定するための方法を提供する。本方法は、手書きパターンをセグメント化して、手書きパターンの、これらのセグメントを記号として認識する際に使用するために、手書きパターンにおける可能なセグメント化ポイントを選択することを備える。本方法は、手書きパターンのセグメントを、少なくとも１つの記号、又は或る記号の一部を表すテンプレートと比較することを更に含み、手書きパターンのセグメントは、第１のセグメント化ポイントから第２のセグメント化ポイントまでの可能なセグメント化ポイントのシーケンスに対応する。この比較は、手書きパターンのセグメントの可能な認識結果を形成するテンプレートに関連するセグメント候補を戻し、各セグメント候補は、テンプレートと、手書きパターンのセグメントとの間のマッチングの尺度に関連する。本方法は、セグメント候補シーケンスの表現を形成することを更に備える。その表現は、手書きパターンにおけるセグメント化ポイントに対応するデータ・ブロックを含み、データ・ブロックは、後続のセグメント化ポイントに対応するデータ・ブロックへのリファレンスを含み、リファレンスは、セグメント候補の情報と、それらのセグメント化ポイント間の手書きパターンのセグメントに関する関連する尺度とを備える。本方法は、セグメント候補シーケンスの表現を辞書と比較することを更に含み、辞書は、記号シーケンスとして表現され、シーケンスにおける記号は、許される後続の記号へのリファレンスを保持する。本方法は、辞書の中で許される記号シーケンスに対応するセグメント候補シーケンスを探し出し、これらの許される記号シーケンスの少なくとも１つを、手書きパターンに関する認識候補として戻すことを更に備える。

また、本発明は、１つ又は複数の曲線を含み、複数の記号を表す手書きパターンに関する少なくとも１つの認識候補を特定するためのデバイスも提供し、前記デバイスは、手書きパターンをセグメント化して、手書きパターンの、これらのセグメントを記号として認識する際に使用するために、手書きパターンにおける可能なセグメント化ポイントを選択するための手段と、手書きパターンのセグメントを、少なくとも１つの記号、又は或る記号の一部を表すテンプレートと比較するための手段であって、手書きパターンのセグメントは、第１の可能なセグメント化ポイントから第２の可能なセグメント化ポイントまでのセグメント化ポイントのシーケンスに対応し、前記比較は、手書きパターンのセグメントの可能な認識結果を形成するテンプレートに関するセグメント候補を戻し、各セグメント候補は、テンプレートと、手書きパターンのセグメントとの間のマッチングの尺度に関連する、手段と、手書きパターンにおけるセグメント化ポイントに対応するデータ・ブロックを備える、セグメント候補シーケンスの表現を形成するための手段であって、セグメント候補の情報と、セグメント化ポイント間の手書きパターンのセグメントに関する関連する尺度とを保持する、後続のセグメント化ポイントへのリファレンスをデータ・ブロックが保持する、手段と、セグメント候補シーケンスの表現を、記号シーケンスとして表現される辞書と比較するための手段であって、シーケンスにおける記号は、許される後続の記号へのリファレンスを保持する、手段と、辞書の中で許される記号シーケンスに対応するセグメント候補シーケンスを探し出すための手段と、これらの許される記号シーケンスの少なくとも１つを、手書きパターンに関する認識候補として戻すための手段とを備える。

また、本発明は、前段で定義される方法を実行するためのソフトウェア・コード部分を備えるデータ処理ユニットの内部メモリに直接読み込み可能なコンピュータ・プログラム製品も提供する。

本発明により、幾つかの記号を表す手書きパターンを、迅速に認識することが可能となる。セグメント化と認識の両方のために可能なセグメント化ポイントを使用することにより、計算は、手書きパターンを分離することと、そのパターンをテンプレートとマッチングさせることを同時に行う。そのため、手書きパターンをテンプレートと比較するプロセスは、非常に迅速である。

幾つかの基準に従って、限られた数の可能なセグメント化ポイントを選択することにより、手書きパターンのセグメントが、それらの可能なセグメント化ポイントだけと関係がある情報を使用することによって認識されることが可能であることが、認識されている。このため、連続する手書きを認識するために、ニューラル・ネットワーク又は隠れマルコフ・モデルを使用する必要は、存在しないことが、認識されている。代わりに、可能なセグメント化ポイントが、選択され、同一の可能なセグメント化ポイントが、手書きパターン内の記号の認識のために使用される。

可能なセグメント化ポイントの選択により、多数のポイントが、検出されたシーケンスから破棄される。このため、扱いやすい数のポイントが、選択され、これにより、ポイント・シーケンスをテンプレートと比較するために必要とされる計算作業が抑えられる。検出されたポイント・シーケンスにおける情報の相当な部分は、手書きパターンを認識するためには、冗長であることが、認識されている。したがって、多数のポイントを破棄することは、手書きパターンを正しく認識する可能性にほとんど影響を及ぼさない。また、限られた数のポイントが、認識において使用されるので、幾つかのテンプレートを、同一の記号を認識するために使用することが可能である。このため、テンプレートは、異書体、即ち、同一の記号の筆記の異なる外観、又は異なるスタイルを表すことが可能である。

更に、可能なセグメント化ポイントは、セグメントの認識のための特徴として使用されるので、セグメント化候補のシーケンスの表現は、後続のポイントへのリファレンスを作成するために、来るべきセグメント化ポイントを調べることによって形成される。このため、セグメント候補シーケンスは、セグメント化ポイントのシーケンスにおいて先を調べることにより、辞書と比較することが可能であることが有利である。このため、セグメント化ポイントのシーケンスを、飛ばすことが可能であり、セグメント候補シーケンスが、許されるシーケンスに関する情報で迅速に更新させることが可能である。

手書きパターンの可能なセグメント化は、辞書の中に存在する手書きパターンの認識候補を選び出すために、辞書と比較させることが可能である。セグメント候補シーケンスは、後続のセグメント候補の情報を備えるセグメント化ポイント間のリファレンスによって表されるので、同一の開始記号を有するシーケンスは、それらのシーケンスの開始の表現を共有させることが可能である。セグメント候補シーケンスは、対応する最初の記号又は記号群を有する語が、辞書の中に存在するかどうかを順次にチェックすることにより、辞書と比較される。シーケンスにおける記号が、辞書の中で対応物を有さないとすぐに、そのシーケンスは、破棄させることが可能であり、そのシーケンスにおける残りのセグメント候補を辞書と比較する必要は、全くない。実際、同一のプレフィックスを表す同一の最初のセグメント候補を有するすべてのシーケンスが、破棄させることが可能である。というのは、それらのシーケンスは、表現を共有するからである。

本明細書で使用される、「記号」という用語は、ラテン文字、漢字、又は他の任意の種類の文字、文字の間、前、又は後のつなぎ、数字、或いは任意の句読点などの、特定の意味を有する任意の形態として解釈されるべきである。テンプレートは、或る記号、又は或る記号の一部を表すように構成される。しかし、特定の意味を全く有さない、手書きパターンにおける雑音又は不規則性を表すように構成された１つ又は複数のテンプレートが存在してもよい。そのようなテンプレートは、パターンで書かれた情報に寄与しない手書きパターンの部分を識別するのに使用されることが可能である。更に、「手書きパターン」という用語は、個人によって書かれた特定の形態の記号、又は記号シーケンスとして解釈されるべきである。

「可能なセグメント化ポイントのシーケンス」という用語は、テンプレートの始まりとマッチングすると識別されている可能なセグメント化ポイントである第１のセグメント化ポイントから、テンプレートの終わりとマッチングすると識別されている可能なセグメント化ポイントである第２のセグメント化ポイントまでのシーケンスとして解釈されるべきである。可能なセグメント化ポイントのシーケンスは、第１のセグメント化ポイントと第２のセグメント化ポイントの間のすべての可能なセグメント化ポイントを備える。

「後続のセグメント化ポイントに対応するデータ・ブロックへのリファレンス」とは、セグメント化ポイントのシーケンスにおける次のセグメント化ポイント、又はセグメント化ポイントのシーケンスにおける、それより後のセグメント化ポイントへのリファレンスであることが可能である。このため、手書きパターンの様々なセグメントとマッチングする様々なセグメント候補シーケンスが、様々なセグメント化ポイントを選択することによって作成されることが可能である。

セグメント候補シーケンスと手書きパターンの間のマッチングの累積尺度が、認識候補の間のランク付け順序を決定するために使用されることが可能である。すべてのセグメント化ポイントが、解析された後、累積尺度が、最後のセグメント化ポイントに割り当てられ、手書きパターンとマッチングしたテンプレート又はセグメント候補シーケンスに関連付けられることが可能である。このため、最後のセグメント化ポイントに割り当てられた情報は、手書きパターンの可能な認識候補を得るために、容易に使用されることが可能である。

マッチングの尺度は、手書きパターンの特徴と、テンプレートの対応する特徴の間の相違の計算された距離値であることが可能である。このため、手書きパターンの適切な特徴が、検出されて、テンプレートの対応する特徴と比較され、距離値が、計算される。距離値が低いほど、手書きパターンとテンプレートの間のマッチングは、良好となる。

セグメント候補シーケンスの表現の形成は、ノードと、エッジとを有する認識グラフを形成することを備えることが可能であり、各ノードは、可能なセグメント化ポイントを表し、各エッジは、１つのノードから別のノードまでのセグメント化ポイントのシーケンスに沿ったパスを表し、前記パスは、手書きパターンにおける可能な記号に対応し、セグメント候補と、手書きパターンのセグメントの間のマッチングに対応する少なくとも１つの尺度に関連する。

グラフを形成することにより、セグメント候補シーケンスの辞書との比較を、段階的な形に構造化することが可能である。このことは、実行されるべき比較の良好な制御が得られることを意味する。更に、グラフを、効果的に使用することが可能である。というのは、グラフは、手書きパターンの可能なセグメントのセグメント化ポイントとして実際に識別されている、可能なセグメント化ポイントだけを使用して構築することが可能であるからである。更に、ノードは、グラフを通ってノードにつながるエッジに沿った様々なパスに関するマッチングの累積尺度を格納することができ、これにより、セグメント候補シーケンスに対応するマッチングの累積尺度を、グラフの各ノードにおいて容易に見出すことが可能となる。

表現を形成することは、１つのノードで終わる特定された数だけのセグメント候補を許すことを備えることが可能である。これにより、辞書との比較のために保持される異なるセグメント候補シーケンスの数が、限定される。許されるセグメント候補は、最良のマッチング尺度を有するセグメント候補であることが可能である。このため、手書きパターンに対して最良のマッチング尺度を有するセグメント候補だけが、保持される。

各ノードで終わる特定された数のセグメント候補は、セグメント候補シーケンスの表現の、辞書との比較の速度を制御するために調整させることが可能である。認識グラフのサイズは、許されるセグメント候補の数を調整することによって制御することが可能である。そのため、セグメント候補シーケンスの表現を辞書と比較するのに必要とされる時間も、制御される。セグメント候補の数は、辞書との比較を完了するための許される最大時間を満たすために、幾つかのセグメント候補が許されることが可能であるかを計算することにより、決定することが可能である。このため、セグメント候補の許される数は、手書きパターンの、テンプレートとの比較を実行させた後、決定することが可能である。

認識グラフを形成することは、同一のノード間の同一の記号シーケンスに対応するパスの重複を破棄することを備えることが可能である。セグメント候補シーケンスは、手書きパターンの異なるセグメント化に対応する、２つ以上の同一のシーケンスを備えることが可能である。認識グラフが形成される際、そのような重複は、破棄することが可能であり、最良のマッチング尺度を有するシーケンスだけが、保持される。認識グラフにおいて重複を有する必要は、全くない。というのは、それらの重複は、辞書と比較された際、同一の結果をもたらすからである。重複を破棄することにより、認識グラフと辞書の間の比較が、スピードアップされる。

辞書は、Ｔｒｉｅグラフとして表現されることが可能である。そうすることにより、認識グラフと辞書の間の非常に迅速で、効率的な比較が可能になる。

Ｔｒｉｅグラフは、適切に並べられた形で語を表す。Ｔｒｉｅグラフにおける任意の１つのノードのすべての派生ノードは、そのノードに関連する共通のプレフィックスを有する。このため、セグメント候補シーケンスの表現を辞書と比較することは、認識グラフのノードを段階的に進み、それらのノードを、Ｔｒｉｅグラフにおけるノードと比較することを備える。セグメント候補シーケンスは、Ｔｒｉｅグラフにおける１つのパスとマッチングさせるだけでよく、比較が非常に迅速になる。

比較することは、セグメント候補を表す認識グラフにおけるエッジから、Ｔｒｉｅグラフにおける対応するノードへのリファレンスを作成することを備えることが可能である。これにより、セグメント候補シーケンスにおける位置が、Ｔｒｉｅグラフにおける対応する位置に関連付けられることが可能になる。このため、幾つかのセグメント候補シーケンスが、Ｔｒｉｅグラフと同時に比較されることが可能である。というのは、Ｔｒｉｅグラフにおける位置が、各セグメント候補シーケンスに関して迅速に取り出されることが可能だからである。

セグメント候補シーケンスは、認識グラフにおけるノードを段階的に進む間に、そのセグメント候補シーケンスが、Ｔｒｉｅグラフにおいて対応物を全く有さないとすぐに、破棄させることが可能である。更に、同一のプレフィックスを有するすべてのセグメント候補シーケンスは、同時に破棄することが可能である。

認識グラフにおけるノードをＴｒｉｅグラフにおけるノードと比較することは、セグメント候補シーケンスの残りの部分における記号の可能な数を、Ｔｒｉｅグラフにおける後続の記号の許される数に対してチェックすることを備えることが可能である。セグメント候補シーケンスの長さに対応する長さの語、又は記号の数が存在することをチェックすることにより、対応する長さの語を有さないシーケンスを、認識グラフをＴｒｉｅグラフと比較するプロセスにおける早い段階で破棄することが可能である。

辞書の中の不完全な記号シーケンスに対応するセグメント候補シーケンスが、許されることが可能である。このことは、切り詰められた語に関する認識候補をもたらすために使用されることが可能である。更に、手書きパターンは、辞書の中の不完全な語として認識されることが可能であり、完全な語が、認識候補として提示されることが可能である。これにより、ユーザが、長い語を切り詰め、認識から、正しい完全な語を戻されることが可能になる。

セグメント候補シーケンスにおいて欠落したセグメント候補をもたらす手書きパターンにおける省略されたセグメントは、セグメント候補を辞書の中の対応しない記号にマッチングさせ、そのセグメント候補に関連する尺度にペナルティを追加することによって認識されることが可能である。したがって、辞書を使用して、手書きパターンにおける欠けた記号を探し出すことができる。

手書きパターンは、連続して書くことが可能である。本方法は、連続する手書きパターンの認識のために使用することが有利である。というのは、方法は、手書きパターンをセグメント化して、それらのセグメントを認識することができるからである。しかし、本方法は、活字体で、又は連続体と活字体の任意の組合せ又は混合で書かれた手書きパターンの認識のために使用することも可能である。

手書きパターンは、オンラインで検出させることが可能である。このことは、認識が、リアルタイムで実行されるべきことを意味する。手書きパターンの認識は、非常に迅速に実行されることが可能であり、したがって、ユーザを苛立たせる待ち時間が、抑えられる。したがって、オンライン認識が可能になる。

次に、本発明を、添付の図面を参照して、例示として、更に詳細に説明する。

図１を参照して、手書きパターンを認識するための方法を、次に説明する。まず、手書きパターンが、検出される（ステップ１０２）。通常、ユーザは、感圧スクリーン上でスタイラスを使用して手書きパターンを書くことが可能であり、そのため、手書きは、規則的な間隔でスタイラスの位置をサンプリングすることによって検出される。このようにして、ポイントの時間シーケンスが、獲得される。手書きは、例えば、ペンと、筆記面との間で形成される電気的接続を検出するセンサ群、又はペンの動きを検出するセンサ群を使用することなどにより、他の幾つかの仕方で検出されてもよい。また、手書きパターンは、手書きパターンが書き込まれている用紙を走査することによって検出させてもよい。その場合、手書きは、筆記面上のポイント・シーケンスとして検出させることが可能であり、そのシーケンスは、それらのポイントが、互いに対してどこに位置付けられるか、即ち、空間的ポイント・シーケンスに依存する。

次に、以降、コア・ポイントと呼ばれる可能なセグメント化ポイントが、手書きパターンを検出した際に作成されたポイント・シーケンスの中で選択される（ステップ１０４）。コア・ポイントは、手書きパターンの次元、即ち、パターンにおけるストロークのサンプリングされるポイントの数を減らすために選択される。それでも、コア・ポイントは、手書きパターンが正しく認識させることが可能であるように選択されなければならない。

図２は、スウェーデン語の語「ｅｋ」を形成する手書きパターン１０を示す。図２では、選択されたコア・ポイント１２も示され、１つおきのコア・ポイントに番号が付けられている。図２から、この連続する語の最初の部分は、文字「ｄ」の外観を有する可能性があることが明白である。問題は、認識方法が、その「ｄ」のエンドポイントで、その語を２つの文字セグメントにセグメント化した場合、それらのセグメントのいずれも、意図されていた語の文字を含まないことである。したがって、認識方法は、連続する手書きをセグメント化する際、複数のセグメント化の可能性を考慮する必要があることが明らかである。したがって、幾つかのコア・ポイント１２が、２つの文字間で手書きパターン１０におけるセグメント化を示す可能なポイントとして選択される。そのため、コア・ポイント１２は、別々の記号又は文字への手書きパターン１０の正しいセグメント化を特定するように選択される。しかし、コア・ポイント１２は、手書きパターン１０のセグメントの認識のためにも使用される。

コア・ポイント１２の選択は、実際のいずれのセグメント化ポイントも破棄すべきではない。しかし、手書きパターン１０の可能なセグメント化を定義するコア・ポイント１２の数は、コア・ポイント１２の数を可能な限り低く保つように選択されなければならない。したがって、コア・ポイント１２の選択は、幾つかの選択基準を使用する。

選択されるコア・ポイント１２の数は、手書きパターン１０の１つ又は複数の曲線の形状によって限定されることが可能である。このことは、曲線の形状により、選択されるコア・ポイント１２の数が規定されることを意味する。このようにして、曲線の形状が単純である場合、より少ない数のコア・ポイント１２が、選択されることが可能であるのに対して、複雑な曲線の場合、より多数のコア・ポイントが、選択される。

選択されるコア・ポイント１２の数は、前記１つ又は複数の曲線の方向変化の情報を保持するポイントに限られることが可能である。このため、曲線が曲がる、又は方向転換するポイントだけが、コア・ポイントとして使用される。これにより、限られた数のコア・ポイント１２が使用されるにもかかわらず、コア・ポイント１２が、１つ又は複数の曲線の形状を記述することができるようになる。

現在の好ましい実施例によれば、以下の選択基準が、使用される。第１の選択基準は、主な筆記方向と直交する方向において局所極限ポイントを抽出する。それらのポイントをそれぞれ、Ｎ（ノース）コア・ポイント及びＳ（サウス）コア・ポイントで表す。図２の手書きパターン１０では、Ｎコア・ポイント及びＳコア・ポイントには、円でマークが付けられている。各Ｎ−Ｓポイント・ペアは、それらの中間にある１つ乃至３つの更なるポイントによって補足されている。それらの更なるポイントは、更なる２つの基準、曲率基準及び鋭度基準によって選択されている。追加のポイントをＭ（中間）コア・ポイントと呼ぶ。図２の手書きパターン１０では、Ｍコア・ポイントには、星印でマークが付けられている。曲率基準により、手書きパターン１０が、隣接する２つのコア・ポイント間の直線から大きく逸脱しているかどうかが判定される。次に、直線から最も逸脱している位置において、Ｍコア・ポイントが選択される。鋭度基準により、手書きパターンが、急な方向転換を行うかどうかが判定される。次に、Ｍコア・ポイントが、その位置において選択される。鋭度基準が満たされるかどうかの判定は、検出された各ポイントにおいて手書きパターン１０の微分を計算することによって行われる。急な方向転換が行われる箇所では、微分は、大きい値をとる。鋭度基準及び曲率基準は、Ｎ−Ｓコア・ポイント・ペアの間における、幾つかのＭコア・ポイントを選択するために使用することが可能である。鋭度基準又は曲率基準に従って、関心対象となるポイントが全く見出されなかった場合、Ｎコア・ポイントとＳコア・ポイントの間の曲線の長さの半分に相当する中間ポイントが、Ｍコア・ポイントとして選択される。

本方法は、各コア・ポイントにおいて、又は各コア・ポイントの近傍において、手書きパターンの特徴を特定することを更に備える（ステップ１０６）。抽出されたコア・ポイント１２の座標値を、認識目的で直接に使用することが考えられる。しかし、コア・ポイント１２の周囲も、手書きパターン１０の形状のいくらかの情報を備える。その追加の形状情報を含めるため、現在の好ましい実施例によれば、各コア・ポイントに関して５つの特徴のセットが、特定される。各コア・ポイント１２には、そのコア・ポイント１２が、どのように選択されたかに応じて、或るラベル・セットからの或るラベルが与えられる。この場合、３つのラベルＮ、Ｓ、及びＭが、使用される。コア・ポイント１２の、そのラベルは、コア・ポイント・シーケンスをテンプレートとマッチングさせるための基礎を形成する。更に、それらの特徴は、コア・ポイント１２に向かう、又はコア・ポイント１２から出る方向ベクトル、コア・ポイント１２のｙ座標値、即ち、主な筆記方向と直交する方向における値と、コア・ポイント１２から、右側の最も遠い前のコア・ポイントまでの、主な筆記方向と平行なｘ座標に沿った符号付きの距離ｄｘとを備える。更に、ペンが、コア・ポイント１２において持ち上げられているか、又は押し下げられているかを判定することが可能である。その特徴は、しばしば、セグメント化ポイントを示すが、或る記号における２つのストローク間の中断を示すことも可能である。したがって、その特徴は、コア・ポイント１２において、ペンが持ち上げられる、又は押し下げられることを許す記号を認識するために使用することが可能である。

次に、手書きパターン１０の選択されたコア・ポイント１２の特定された特徴が、その手書きパターン１０の認識のための候補又は候補群を見出すために、テンプレートと比較される（ステップ１０８）。テンプレートは、データベースの中で提供され、順次コア・ポイントの特徴によって表現される。このため、特定された特徴は、テンプレートの特徴と直接にマッチングさせられる。データベースは、ユーザが、様々な筆記スタイルを有するにもかかわらず、パターンを認識するために、同一の記号の異書体を表す、幾つかのテンプレートを備えることが可能である。更に、データベースは、つなぎ、即ち、２つの文字を通常、一緒に結合し、実際の文字の一部ではないストロークを表すテンプレートも備える。連続する語の途中のすべての文字は、つなぎを有するのに対して、語の始めの文字は、つなぎを有することも、有さないことも可能である。また、連続する語は、やはり、つなぎで終わることが可能である。一部のテンプレートは、つなぎが含まれた文字を表すことが可能である。このことは、文字「ｅ」、「ｒ」、「ｃ」、「ｘ」、及び「ｓ」のテンプレートに関して有利に使用されることが可能である。

次に、図３及び図４を参照して、手書きパターン１０の選択されたコア・ポイント１２の特徴をテンプレートと比較することを説明する。コア・ポイント１２は、手書きパターン１０の可能なセグメント化ポイントと考えられる。更に、第１の可能なセグメント化ポイントから第２の可能なセグメント化ポイントまでのコア・ポイント１２のシーケンスは、手書きパターンにおける可能な記号の表現と考えられる。このため、コア・ポイント１２のシーケンスの特徴は、テンプレートと比較される。

選択されたコア・ポイント１２は、テンプレートと比較されることが可能なコア・ポイント１２の比較的多数の異なるシーケンスを表す。比較を構造化するため、コア・ポイント１２は、シーケンスで解析される。最初のコア・ポイント１２から始めて、コア・ポイント１２の任意の可能なシーケンスが、テンプレートとマッチングさせられる。テンプレートとマッチングするシーケンスのエンド・コア・ポイント１２が、グラフにおけるノードとして格納される（ステップ１１０）。このようにして、テンプレートに関連付けられたセグメント候補が、コア・ポイント１２のシーケンスによって表現される手書きパターン１０のセグメントの可能な認識として選択される。コア・ポイント・シーケンスとセグメント候補の間のマッチングの尺度を与える距離値が、最初のコア・ポイントとノードの間のパスを表すノードの中に格納される（ステップ１１２）。最初のコア・ポイントからのコア・ポイント１２のすべての可能なシーケンスが、テンプレートとマッチングさせられると、グラフにおけるノードとして格納されたコア・ポイント１２から始めて、更なるマッチングが行われる。次に、テンプレートと更なるコア・ポイント・シーケンスの間の距離値が、更なるコア・ポイント・シーケンスの開始ノードにおいて格納された最初の距離値に追加される。このため、累積距離値が、グラフにおけるノードにおいて格納される。このようにして、非循環グラフが、すべてのコア・ポイント１２に関して形成され、グラフにおける最後のコア・ポイントは、グラフを通るエッジに沿った様々なパスに関する累積距離値の情報を保持する。その時点で、セグメント候補のシーケンスが、手書きパターン１０の可能な認識結果として特定されており、ステップ１１４、グラフを通るエッジに沿ったパスとして表現される。ユーザに提示するために認識候補として戻されるべき、グラフを通るエッジに沿った、選択されたパスは、以下に更に詳細に説明する通り、辞書との比較によって特定させることが可能である。

図４に、図２の手書きパターン１０の、テンプレートとのマッチングを表すグラフ２０が、示されている。グラフ２０は、番号が付けられた円として表されるノード群２２と、それらのノード間のエッジ２４とを備える。図示されるように、手書きパターンの様々なセグメント化を表す、グラフを通る幾つかのパスが、存在する。このため、手書きパターン１０とテンプレートのマッチングにより、手書きパターン１０の可能なセグメント化も同時に定義され、セグメント化された手書きパターン１０とセグメント候補シーケンスの間の類似の尺度がもたらされる。

手書きパターンにおける１つのコア・ポイントと、テンプレートにおける１つのポイントとの間の距離値は、それらのポイントの特徴の間の差の絶対値の重み付き合計である。コア・ポイント・シーケンスとテンプレートの間の距離値は、個々のポイント間の距離値の合計である。しかし、グラフにおけるノードを形成するコア・ポイントの距離は、１回だけしか計算されるべきでない。このため、ノードを形成するコア・ポイントと、テンプレートとの間の距離は、ノードに至るパス、又はノードからのパスに割り当てられることが可能であり、コア・ポイントと、ノードに至るパス、及びノードからのパスに対応する両方のテンプレートとの間の平均距離を反映する。

しかし、特定のセグメント候補シーケンスは、禁止することが可能である。そうすることは、手書きパターン１０における情報が正しくない状況を補償する際に役立つ可能性がある。しかし、そうすることは、不可能な候補、又は可能性の低い候補を拒否することにより、認識結果を向上させるために使用することも可能である。例えば、２つのつなぎのシーケンスが、禁止されることが可能である。更に、或る重みを、特定のセグメント候補シーケンスに関する累積距離値に与えることも可能である。このことは、可能性の低いテンプレート・シーケンスを備える認識結果が、完全に拒否されるのではなく、それらの認識結果が、最小の累積距離値を有するのをより困難にする重みを、それらの認識結果に与えることが可能であることを意味する。

この時点で、手書きパターン１０の幾つかの異なる可能な認識が、図４に示される通り、特定されている。手書きパターン１０の最も可能性の高い認識を選択するため、グラフ２０におけるセグメント候補シーケンスを、辞書と比較することが可能である。次に、図５〜図７を参照して、辞書との比較を実行する実施例を説明する。

辞書との比較を実行するために、様々な可能なセグメント候補シーケンスを表す認識グラフ４０を、形成することが可能である（ステップ１２０）。次に図６を参照して、認識グラフ４０を説明する。図６は、図２に示される手書きパターン１０の認識に関して作成された認識グラフ４０の例を示す。認識グラフ４０は、手書きパターン１０のセグメントを認識するために使用されるグラフ２０とよく似た仕方で構築される。しかし、認識グラフ４０の中に含められる情報は、減らすることが可能である。例えば、グラフ２０は、手書きパターン全体とは合わないセグメント化ポイントを備える可能性がある。そのようなセグメント化ポイント、及び不完全なセグメント候補シーケンスは、認識グラフ４０を形成する際、無視することが可能である。更に、グラフ２０は、同一のセグメント候補シーケンスをもたらす、異なるセグメント化を備える可能性がある。それらのセグメント候補シーケンス重複も、認識グラフを形成する際、無視することが可能である。

認識グラフ４０は、手書きパターン１０をテンプレートと比較する際に、可能なセグメント化ポイントとして識別されているセグメント化ポイントを表すノード群４２で構築される。ノード群４２は、ノード群４２によって表されるコア・ポイント１２の番号に応じて番号が付けられた、番号付きの円として図６に示される。ノード４２は、ノード４２間の手書きパターンのセグメントに関するセグメント候補の情報を有する後続のノード群へのリファレンスを有する。ノード４２のリファレンスは、エッジ４４によって表される。エッジ４４は、図６のホワイト・ボックス内に示される通り、セグメント候補の記号の情報と、手書きパターンのセグメントとセグメント候補をマッチングさせる距離値とを備える。また、各ノード４２は、そのノード４２から派生するセグメント候補（図示せず）の最小数及び最大数も備えることが可能である。ノード４２の中に限れた数のセグメント候補が入ることを許す認識グラフ４０が、構築されることが可能である。ノード４２の中に入るセグメント候補の最大許容数を設定することにより、認識グラフ４０を辞書と比較する際の処理時間を制限するために、認識グラフ４０のサイズが制限される。代替として、閾値未満の距離値を有するセグメント候補だけを、許してもよい。また、認識グラフ４０は、辞書を考慮に入れることなしに、手書きパターンと最もよくマッチングするセグメント候補のシーケンスを迅速に戻すために使用することも可能である。そうすることは、ノードの中に入ることが許されるセグメント候補の最大数を１に設定することによって達成させることができる。すると、認識グラフ４０は、最低の距離値を有するセグメント候補シーケンスだけを備える。

図７に、辞書５０の単純化された例が、示されている。示される辞書５０は、幾つかの語だけを備えるが、辞書５０の現在、好ましい構造を示す。辞書５０は、Ｔｒｉｅグラフとして形成される。グラフ５０は、記号を表すノード群５２を備える。ノード群５２は、許される記号シーケンスが、グラフ５０を通るストリングとして形成されるように、エッジ５４によって接続される。ルート・ノードは、空のストリングを表し、したがって、すべての記号シーケンスは、ルート・ノードを共有する。シーケンスの中の最後の記号を表すノード群には、図３においてグレーでマークが付けられている。また、各ノード５２は、そのノード５２から派生する記号（図示せず）の最小数及び最大数の情報も備えることが可能である。

認識グラフ４０は、認識グラフ４０のノード群４２を辞書５０と段階的に比較することにより、辞書５０と比較される（ステップ１２２）。最初の認識グラフ・ノードで開始して、そのノードからのエッジのセグメント候補の妥当性が、同一の記号から始まる語が、辞書５０の中に存在するかどうかをチェックすることによって判定される。次に、最初の認識グラフ・ノードからのエッジが、妥当な記号の情報で更新され、つまり、辞書５０の中に対応物を有するセグメント候補が保持され、その一方で、その他のセグメント候補は、破棄される。エッジの更新された情報は、図６にグレーでマークが付けられたボックス内に示される。また、エッジは、認識グラフ４０におけるセグメント候補シーケンスにおけるそれぞれの位置に対応する、辞書５０の中のノード群へのリファレンスで更新される。その後、比較は、認識グラフ４０におけるすべてのノード４２にわたって続けられ、辞書５０の中で対応物を有さないすべてのセグメント候補シーケンスが破棄される。各認識グラフ・ノード４２に関して、そのノードからのエッジのセグメント候補の妥当性が、辞書５０の中に、認識グラフ・ノードの中に入るようにエッジによって参照される、そのノードからのエッジにおける対応する記号が存在するかどうかをチェックすることによって判定される。

セグメント候補シーケンスに記号の最小数及び最大数の情報を使用して、妥当性検査は、或る語の、それらの長さ境界が、辞書５０の中の該当するノードによって満たされるかどうかをチェックすることも備えることが可能である。長さ境界が、満たされない場合、そのセグメント候補シーケンスは、破棄されることが可能である。

更に、時間の複雑さを制御するため、認識グラフ４０におけるすべてのノード４２に関して、Ｔｒｉｅグラフ５０の中に入るリファレンスの数の上限が、設定されることが可能である。こうして、時間の複雑さの制御が、得られる。しかし、不良な初期マッチングを有するセグメント候補シーケンスが、破棄されるリスクが、存在する。

認識グラフ４０のすべてのノードが、解析されると、認識グラフ４０の最後のノードは、辞書の中にも存在する手書きパターン１０の最良の認識候補の情報を保持する。その時点で、手書きパターン１０に関する認識候補を、ユーザに提示されるように、戻すことが可能である（ステップ１２４）。最低の累積距離値を有する認識候補を、手書きパターンの解釈としてユーザに提示することが可能である。代替として、ユーザが、正しい解釈を選択することができるように、幾つかの認識候補を、ユーザに提示しても良い。

次に図８を参照して、手書きパターンの認識のためのデバイス３０を説明する。デバイス３０は、手書きパターンをポイント・シーケンスとして記録するための検出器３２を備える。検出器３２は、ユーザが書き込むことができる感圧スクリーンとして実施させることが可能である。デバイス３０は、検出された手書きパターンを解析するためのアナライザ３４を更に備える。アナライザ３４は、コンピュータの中央処理装置上で実行されるプログラムとして実施させることが可能である。アナライザ３４は、手書きパターンのコア・ポイントを選択するための手段と、コア・ポイントにおいて、又はコア・ポイントの近傍において手書きパターンの特徴を特定するための手段とを備える。デバイス３０は、コア・ポイントの特徴として表現されたテンプレートを備えるデータベース３６を更に備える。アナライザ３４は、手書きパターンのコア・ポイント・シーケンスの特徴とテンプレートの間の距離値を計算するための手段を更に備える。アナライザ３４は、手書きパターンをテンプレートと構造的に比較するためにグラフを形成するように構成される。アナライザ３４は、手書きパターンの可能な認識を形成するセグメント候補シーケンスを表す認識グラフを形成するように更に構成される。デバイス３０は、許される語又は記号シーケンスを表すＴｒｉｅグラフを備える辞書３８を更に備える。アナライザ３４は、手書きパターンと最もよくマッチングする記号シーケンスを特定するために、認識グラフを辞書と比較するように更に構成される。それらの可能な認識結果は、ディスプレイ上で提示されることが可能であり、ディスプレイは、感圧スクリーンと別個であっても、手書きパターンが入力された感圧スクリーンに組み込まれていてもよい。

別の実施例によれば、前述した方法及びデバイスの実施の際に、手書きパターンの区別符号に、特別な考慮が与えられることが可能である。本願明細書の文脈では、区別符号という用語は、記号の近くの、又は記号と交差するマーク又はストロークとして解釈されるべきであり、一部のケースにおけるマーク又はストロークは、そのマーク又はストロークを有する記号が、そのマーク又はストロークを有さない記号とは別の記号であることを示し、例えば、
ａ〜とａ、
ｔとｌ、一部のケースでは、区別符号なしに、記号が、それでも正しい記号と解釈されることが可能な、記号の特徴である、例えば、ｉ及びｊ。連続する手書きでは、多くの区別符号は、語の残りの部分が書かれた後に、引かれる。区別符号は、認識のために重要である。そうである１つの理由は、連続する語における多くのセグメントが、区別符号なしの記号とマッチングする可能性があることであり、例えば、ドットなしの「ｉ」は、別の文字の一部であると解釈される可能性がある。

連続する語を、時間的に並べ替えられた文字セグメントに分解するセグメント化ベースの方法、例えば、本願明細書で前述した方法の場合、正しい認識を可能にするために、区別符号を考慮することが重要である可能性がある。

区別符号の情報を利用する一実施例では、図１のステップ１０６で、区別符号に関する情報は、特徴として、コア・ポイント・サブセットに割り当てられる。したがって、区別符号と関係する情報は、コア・ポイントに存在し、そのため、可能な記号をテンプレートと比較することの結果に影響を与える要因として、認識中に利用されることが可能である。

区別符号は、手書きパターンにおいて、結合されていないつなぎの線として、即ち、いずれのセグメントにも結合されておらず、つなぎとして識別されているストロークとして識別されることが可能である。

コア・ポイント・サブセットのコア・ポイントに割り当てられる特徴において使用されることが可能な特性は、区別符号の位置、即ち、ｘ座標とｙ座標、その特定のコア・ポイントから区別符号までの絶対距離、ｘ方向におけるコア・ポイントから区別符号までの距離、ｙ方向におけるコア・ポイントから区別符号までの距離、区別符号の長さ、区別符号の形状などであることが可能である。コア・ポイントに割り当てられた区別符号と関係する特徴は、以上の特性の１つだけ、又は複数の特性の組合せを備えることが可能である。

区別符号が割り当てられたコア・ポイント・サブセットは、そのサブセットが、Ｎ又はＭとラベルが付けられたコア・ポイント１２だけを備えるように構成させることが可能である。これにより、本方法は、すべてのコア・ポイントが含まれたとした場合より、高速になる。

区別符号特徴は、逐次解析における現在のノード２２の距離値にペナルティを与えるために、コア・ポイント１２の逐次解析中に使用されることが可能である。例えば、現在のノード２２に関して、示唆される記号、即ち、候補が、「ｉ」であり、区別符号が、そのノード２２に関連するコア・ポイント１２に適度に近い場合、そのノード２２には、比較的小さいペナルティが与えられることが可能である。コア・ポイント１２と区別符号の間のより大きい距離は、より大きいペナルティをもたらす。最大のペナルティは、区別符号を有すべき候補の欠落した区別符号に関して与えられるペナルティに相当する値に設定されることが可能であり、そのような最大のペナルティは、区別符号までの距離が、或る特定の値を超える場合の候補に与えられることが可能である。逐次解析中の区別符号特徴の使用により、区別符号が、グラフ２０の形成中にグラフ２０の累積距離値に影響を与えるようにさせることが可能になる。このことは、文字「ｉ」及び「ｊ」に関して特に関心を引く。というのは、それらの文字の構造の単純さのため、区別符号が考慮されない場合、他の文字／記号の諸部分が、「ｉ」又は「ｊ」として誤って解釈されるという潜在的なリスクがもたらされるからである。したがって、前述のスキームにより、「ｉ」及び／又は「ｊ」を候補／候補群として含み、その候補の最初のコア・ポイントから適当な距離の範囲内に位置する区別符号を有するパスが、有利にされる。また、逐次解析中の区別符号特徴の使用は、他の記号又は文字に関して実施させることも可能である。

認識プロセスにおいて区別符号に関する情報を利用する方法は、一実施例によれば、Ｎ又はＭというラベルを有する各コア・ポイント１２に関して、最も近い区別符号ポイントを特定し、区別符号特徴を、前述した通り、そのような各コア・ポイントに関連付けることであることが可能である。別の実施例によれば、最も近い区別符号ポイントの特徴は、Ｎ又はＭというラベルを有する各コア・ポイント１２に割り当てられ、最も近い区別符号ポイントは、コア・ポイントから所定の距離の範囲内である。区別符号特徴を割り当てた後、手書きパターン１０のセグメント化を表すグラフ２０の構築中、区別符号を備える記号とマッチングしたセグメント化、即ち、候補記号は、そのセグメント化の開始Ｎコア・ポイント又は開始Ｍコア・ポイントまでの距離と関係する値によってペナルティが与えられることが可能である。必要なすべてのＮコア・ポイント及びＭコア・ポイントに区別符号の特徴が割り当てられるわけではない実施例において、最大のペナルティは、区別符号を有することになっており、その候補のＮコア・ポイント又はＭコア・ポイントに区別符号の特徴が割り当てられていないノードに与えられる。

更に、区別符号が明らかに必要とされていない箇所で区別符号を有する、セグメント化グラフにおけるエッジに沿ったパスからもたらされる候補語には、そのような候補語を辞書とマッチングさせた後、ペナルティが与えられることが可能である。辞書の使用については、本願明細書において前段で説明した。候補語が、区別符号が明らかに必要とされていない箇所で区別符号を備えるかどうかを判定するのに使用されることが可能な一方法は、その候補語が、多過ぎる区別符号を備えるかどうかをチェックすることである。そうすることは、候補語に含まれる区別符号の数を、その候補語をもたらすパスにおいて識別される区別符号の数と比較し、次に、その候補語の余剰の区別符号にペナルティを与えることによって達せられることが可能である。

例えば、
Ａ−Ｂ＞０の場合、ペナルティ＝係数・（Ａ−Ｂ）
Ａ−Ｂ＜０の場合、ペナルティ＝０
Ａ＝区別符号の最大級（候補語）
Ｂ＝区別符号の観察される数（候補語をもたらすパス）

候補語をもたらすパスにおける区別符号の観察される数は、結合されていないつなぎの線、即ち、いずれのセグメントにも結合されておらず、つなぎとして識別されているストロークの数を数えることによって得られることが可能である。

更なる実施例によれば、未使用の区別符号には、もたらされる候補語と、その候補語をもたらすパスの間で区別符号マッチング検査を適用することによってペナルティが与えられることが可能である。そうすることは、候補語に含まれる区別符号の数を、その候補語をもたらすパスにおいて識別された区別符号の数と比較し、次に、その候補語において欠落している区別符号にペナルティを与えることによって達成させることが可能である。

例えば、
Ｂ−Ａ＞０の場合、ペナルティ＝係数・（Ｂ−Ａ）
Ｂ−Ａ＜０の場合、ペナルティ＝０
Ａ＝区別符号の数（候補語）
Ｂ＝区別符号の観察される数（候補語をもたらすパス）

以上のスキームを使用することにより、システムは、例えば、「ｂｌｉｎｄ」という語をｂｌｉｎｄとして認識することが、その書かれたテキストの文字「ｉ」が、文字「ｅ」によりよく似ており、「ｂｌｅｎｄ」という語をもたらす可能性があるケースでも、更に、ドットが、多少、誤った位置に置かれている場合でも、できる。

本願明細書で説明する好ましい実施例は、全く限定するものではなく、多数の代替の実施例が、添付の特許請求の範囲によって定義される保護の範囲内で可能であることが、強調されなければならない。

手書きパターンを認識するための方法を示す流れ図である。手書きパターンをテンプレートと比較するために使用されるべき、選択されたセグメント化ポイントを示す手書きパターンの例を示す図である。手書きパターンをテンプレートと比較するための方法を示す流れ図である。テンプレートと手書きパターンの間の距離値を特定するために形成されているグラフのチャートである。認識グラフを辞書と比較するための方法を示す流れ図である。手書きパターンの可能な認識から形成されている認識グラフの実施例を示す図である。辞書の実施例を示す図である。本発明の或る実施例による、手書きパターンを認識するためのデバイスを示す概略図である。

Claims

１つ又は複数の曲線を備えかつ複数の記号を表す手書きパターンに関する少なくとも１つの認識候補を特定するための方法をコンピュータに実行させることが出来る命令を格納する、コンピュータ読出し可能なメモリ・デバイスであって、当該方法が、
a) 前記手書きパターンをセグメント化しかつ前記手書きパターンのこれらのセグメントを記号として認識する際に使用するために、前記手書きパターンにおける可能性のあるセグメント化ポイントを選択するステップ、
b) 前記手書きパターンのセグメントを、記号又は記号の一部を表すテンプレートと比較するステップであって、前記手書きパターンのセグメントは、第１のセグメント化ポイントから第２のセグメント化ポイントまでの可能性のあるセグメント化ポイントのシーケンスに対応し、当該比較が、前記手書きパターンの前記セグメントの可能性のある認識結果を形成するテンプレートに関連するセグメント候補を戻し、各セグメント候補が、前記テンプレートと前記手書きパターンの前記セグメントとの間のマッチングの尺度に関連している、比較するステップ、及び
c) セグメント候補シーケンスの表現を形成するステップであって、当該表現が、前記手書きパターンにおけるセグメント化ポイントに対応するデータ・ブロックを備え、データ・ブロックが、後続のセグメント化ポイントに対応するデータ・ブロックへのリファレンスを備え、前記リファレンスが、セグメント候補の情報と、前記セグメント化ポイント間の前記手書きパターンの前記セグメントに対して関連させた尺度とを備え、
ノードとエッジを有する認識グラフを作成するステップであって、各ノードが、可能性のあるセグメント化ポイントを表し、各エッジが、１つのノードから他のノードへのセグメント化ポイントのシーケンスのパスを表し、当該パスが、前記手書きパターン内の可能性のある記号に対応し、かつセグメント候補と前記手書きパターンのセグメントとのマッチングに対応する少なくとも１つの尺度に関連していて、前記認識グラフを作成するステップが、前記同一ノード間の記号の同一シーケンスに対応するパスの重複を廃棄するステップを備える、ステップと、
前記セグメント候補シーケンスの前記表現を辞書と比較するステップであって、当該辞書が、記号のシーケンスとして表現されていて、シーケンスにおける記号が、許される後続の記号へのリファレンスを保持する、比較するステップと、
前記辞書の中で許される記号シーケンスに対応するセグメント候補シーケンスを探し出すステップと、
これらの許される記号シーケンスの少なくとも１つを、前記手書きパターンに対する認識候補として戻すステップと、
を備える、セグメント候補のシーケンスの表現を形成するステップと
を備える、コンピュータ読出し可能なメモリ・デバイス。
前記セグメント候補シーケンスの前記表現を辞書と比較する当該ステップが、セグメント化ポイントのシーケンスにおいて先を調べるステップを備える、請求項１に記載のコンピュータ読出し可能なメモリ・デバイス。
セグメント候補シーケンスと前記手書きパターンの間のマッチングの累積尺度が、前記認識候補間のランク付け順序を決定するために使用される、請求項１に記載のコンピュータ読出し可能なメモリ・デバイス。
表現を形成する当該ステップが、特定された数のセグメント候補だけが、１つのノードで終わることを許すステップを備える、請求項１に記載のコンピュータ読出し可能なメモリ・デバイス。
前記特定された数を、前記セグメント候補シーケンスの前記表現を辞書と比較する前記ステップの速度を制御するために調整することができる、請求項４に記載のコンピュータ読出し可能なメモリ・デバイス。
前記許されるセグメント候補は、最良のマッチング尺度を有する前記セグメント候補である、請求項４に記載のコンピュータ読出し可能なメモリ・デバイス。
前記辞書は、Ｔｒｉｅグラフとして表現される、請求項１に記載のコンピュータ読出し可能なメモリ・デバイス。
セグメント候補シーケンスの前記表現を辞書と比較する当該ステップが、前記認識グラフの前記ノードを段階的に進み、それらのノードを、前記Ｔｒｉｅグラフにおけるノードと比較するステップを備える、請求項７に記載のコンピュータ読出し可能なメモリ・デバイス。
比較する当該ステップは、セグメント候補を表す前記認識グラフにおける前記エッジから、前記Ｔｒｉｅグラフにおける対応するノードへのリファレンスを作成するステップを備える、請求項８に記載のコンピュータ読出し可能なメモリ・デバイス。
セグメント候補シーケンスは、前記認識グラフにおける前記ノードを段階的に進む間に、前記セグメント候補シーケンスが、前記Ｔｒｉｅグラフにおいて対応物を全く有さないと、即座に破棄される、請求項８に記載のコンピュータ読出し可能なメモリ・デバイス。
前記認識グラフにおけるノードを前記Ｔｒｉｅグラフにおけるノードと比較する当該ステップが、前記セグメント候補シーケンスの残りの部分における記号の可能性のある数を、前記Ｔｒｉｅグラフにおける後続の記号の許される数に対してチェックするステップを備える、請求項８に記載のコンピュータ読出し可能なメモリ・デバイス。
前記辞書の中の不完全な記号シーケンスに対応するセグメント候補シーケンスが、許される、請求項１に記載のコンピュータ読出し可能なメモリ・デバイス。
前記セグメント候補シーケンスにおいて欠落したセグメント候補をもたらす前記手書きパターンにおける省略されたセグメントが、セグメント候補を前記辞書の中の対応しない記号にマッチングさせ、かつ前記セグメント候補に関連する前記尺度にペナルティを追加するステップによって認識される、請求項１に記載のコンピュータ読出し可能なメモリ・デバイス。
マッチングの前記尺度が、前記手書きパターンの特徴と、前記テンプレートの対応する特徴との間の相違の計算された距離値である、請求項１に記載のコンピュータ読出し可能なメモリ・デバイス。
前記手書きパターンが、連続して書かれている、請求項１に記載のコンピュータ読出し可能なメモリ・デバイス。
前記手書きパターンが、オンラインで検出される、請求項１に記載のコンピュータ読出し可能なメモリ・デバイス。