JP5211334B2 - 手書き記号の認識方法及び装置 - Google Patents

手書き記号の認識方法及び装置 Download PDF

Info

Publication number
JP5211334B2
JP5211334B2 JP2009518279A JP2009518279A JP5211334B2 JP 5211334 B2 JP5211334 B2 JP 5211334B2 JP 2009518279 A JP2009518279 A JP 2009518279A JP 2009518279 A JP2009518279 A JP 2009518279A JP 5211334 B2 JP5211334 B2 JP 5211334B2
Authority
JP
Japan
Prior art keywords
symbol
strokes
stroke
symbols
symbol recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009518279A
Other languages
English (en)
Other versions
JP2009543204A (ja
JP2009543204A5 (ja
Inventor
チェン,イー−スン・イー
マティック,ナダ・ピー
トレント,レイモンド・エイ,ジュニア
Original Assignee
シナプティクス インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シナプティクス インコーポレイテッド filed Critical シナプティクス インコーポレイテッド
Publication of JP2009543204A publication Critical patent/JP2009543204A/ja
Publication of JP2009543204A5 publication Critical patent/JP2009543204A5/ja
Application granted granted Critical
Publication of JP5211334B2 publication Critical patent/JP5211334B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

本発明は、包括的にはデジタルシステムの技術分野に関する。特に、本発明は、手書き記号の認識方法及び装置に関する。
手書き認識に基づくテキスト入力により、ユーザは、筆記用具(たとえば、ペン、スタイラス又は指)及び電子入力デバイス(たとえば、タブレット、デジタイザ又はタッチパッド)を使用してオンラインで記号を入力することが可能になる。通常の手書き認識入力デバイスは、筆記用具の軌跡のX座標、Y座標及び時間座標を取り込む。そして、手書きは自動的にデジタルテキストに変換されることができる。手書き認識ソフトウェアは、入力ストロークシーケンスを使用して筆記からテキストへの変換を実行する(たとえば、手書き認識ソフトウェアは、意図された記号シーケンスを識別する)。
通常、ユーザは、記号を、制限的に(たとえば枠付きモードで又はタイムアウトを使用して)、又は自然な順序で(たとえば、英語で書く場合は左から右に)書き込むことにより制約なしに(たとえば、連続的に活字体又は筆写体で)入力することができる。一般に、記号入力が制限されるほど、記号認識を解決することが容易になる。しかしながら、制限的な記号入力は、不自然であることが多く、ユーザが記号認識システムを学習する時間が長くなり、テキスト入力プロセスが低速化する。対照的に、制約なしの記号入力は、多くの場合、計算量が多くエラーが発生し易い。通常、制約なしの記号入力認識システムでは、手書きデータを、認識の前にこのような記録された手書きデータを適切に切り出し、グループ化し、再度順序付けすることによって前処理する必要がある。
技術的進歩の結果、携帯電話のような多くの小型電子機器は、手書き記号入力機能を含んでいる。しかしながら、これらの小型機器では、通常、入力デバイスの記号入力エリアが小さい。これらの入力デバイスには、ユーザが単一の記号を書き込むために十分な空間しかないことが多い。これらの入力デバイスでは、記号を、多くの言語に自然である自然な順序で(たとえば、並べて且つ左から右に)書き込むことができない。これらの入力デバイスでは、記号は互いに重ねて書き込まれることが必要である。
記号が互いに重ねて書き込まれるため、小型入力デバイスを使用して入力される記号の切出しにより、上述した記号入力システムがさらに複雑になる。小型入力デバイスでの手書き認識に対して、目下の解決法はある。しかしながら、複雑な記号切出し問題に対処するために、これらの目下の解決法では、ユーザに対し不自然な記号入力が提供されるか、又は精度が低下する。
たとえば、小型入力デバイスによっては、ユーザは、ユニストロークアルファベット等の特別なアルファベットを学習する必要があるものがある。ユニストロークアルファベットは、各記号が単一ストロークであるように設計されている。このため、記号切出しは容易に対処されるが、ユーザには、不自然な歪んだアルファベットを学習することが強要される。一方、タイムアウトメカニズム又は他の外部切出し信号を使用して、記号切出し問題に対処する他の入力デバイスもある。ユーザは、記号の入力後に一時的に待つ必要がある。タイムアウトが発生すると、記号認識が実行される。ユーザが、各記号が入力された後にタイムアウトを待つ必要があるため、この技法もまた不自然である。さらに、ユーザは十分高速にストロークを入力することができず、ユーザが記号の入力を終える前にタイムアウトが発生し、記号が間違って識別されることになるため、誤りが発生し易い。さらに、たとえば記号の終りを示すためにボタンを押下する、外部切出し信号の使用もまた、誤りが発生しやすく不便である。
本明細書で説明するさまざまな実施の形態は、少なくとも部分的に互いに重ねて書き込まれる手書き記号の統合された切出し及び認識の方法及び装置を提供する。一実施の形態では、電子機器の共通入力領域において複数のストロークが受け取られる。複数のストロークは、結合して複数の記号を定義する。一実施の形態では、複数の記号は、表意文字言語の発音表記を含む。
一実施の形態では、複数のストロークのうちの1つのストロークが非記号ジェスチャを表すか否かが確定され、その際、そのストロークは、非記号ジェスチャを表すものと確定された場合、複数の記号表現エンジンにおいて無視される。
複数の記号認識エンジンによって複数のストロークの連続した組合せが解析されて、複数のストロークによって定義される複数の記号のうちの少なくとも1つのあり得る記号が確定され、複数の記号認識エンジンのうちの少なくとも1つは、特定数のストロークを含む記号を識別するように構成される。一実施の形態では、複数の記号認識エンジンは、統計的分類器を備える。一実施の形態では、複数の記号認識エンジンのうちの少なくとも1つが、特定数のストロークを含む記号を識別するように構成される。一実施の形態では、複数の記号認識エンジンは、1ストローク記号認識エンジン、2ストローク記号認識エンジン、3ストローク記号認識エンジンを含む。一実施の形態では、複数の記号認識エンジンはまた、4ストローク記号認識エンジンも含む。
複数の記号認識エンジンは、別個のモジュールである必要はなく、重なっている記号からのストロークによって形成される非記号を含む仮説を拒否するように、ストロークの組合せを解析する同様の機能を実行する単一モジュールであってもよい、ということが理解されるべきである。
一実施の形態では、解析することは、あり得る記号を識別する外部メカニズムの使用を必要としない。一実施の形態では、必要でない外部メカニズムは、外部切出し信号及び外部ストローク辞書のうちの少なくとも一方を含む。
一実施の形態では、複数のストロークのあり得る組合せは、2値状態機械に従って確定される。一実施の形態では、あり得る組合せは、所定の制限に従って制限される。記号が、あり得る組合せから選択される。
別の実施の形態では、本発明は、手書き記号の認識装置を提供する。ストローク受取部(receiver:受信機)は、共通入力領域内に入力される複数のストロークを受け取るように動作可能であり、ここで、複数のストロークは結合して複数の記号を定義し、1つの記号の少なくとも1つのストロークが、別の記号の少なくとも1つのストロークの上に空間的に重ね合わされる。一実施の形態では、ストローク受取部は、ハンドヘルドコンピューティングデバイスのストローク入力デバイスである。一実施の形態では、複数のストロークの各ストロークは、複数の記号のうちの1つの記号のみに関連する。一実施の形態では、複数の記号は、表意文字言語の発音表記を含む。
一実施の形態では、ストローク解析部は、複数のストロークのうちの1つのストロークが非記号ジェスチャを表すか否かを確定し、そのストロークが非記号ジェスチャを表す場合、複数の記号認識エンジンにおいてそのストロークを無視するように構成される。
ストローク解析部は、複数のストロークを逐次解析して、それらの複数のストロークによって定義される少なくとも1つのあり得る記号を確定するように動作可能である。ストローク解析部は、複数のストロークの連続した組合せを解析する複数の記号認識エンジンを含み、複数の記号認識エンジンは、特定数のストロークを含む記号を識別するものである。一実施の形態では、複数の記号認識エンジンは、1つのストロークを含む記号を識別する1ストローク記号認識エンジンと、2つのストロークを含む記号を識別する2ストローク記号認識エンジンと、3つのストロークを含む記号を識別する3ストローク記号認識エンジンとを含む。一実施の形態では、複数の記号認識エンジンはまた、4つのストロークを含む記号を識別する4ストローク記号認識エンジンも含む。一実施の形態では、複数の記号認識エンジンのそれぞれは、複数の記号認識エンジンのそれぞれの記号認識エンジンによって解析されるストロークがあり得る有効な記号である確率を確定する。
一実施の形態では、ストローク解析部は、2値状態機械に従って複数のストロークのあり得る組合せを確定し、所定の制限に従ってあり得る組合せを制限するように構成される。一実施の形態では、複数の記号認識エンジンは、統計的分類器を含む。一実施の形態では、複数の記号認識エンジンのうちの少なくとも1つの記号認識エンジンは、少なくとも1つの共通ストロークによって接続される複数の記号のうちの少なくとも2つの記号を認識するように構成される。
本出願は、以下の概念に関連する。
[概念1]
手書き記号を認識する方法であって、
電子機器の共通入力領域において複数のストロークを受け取ることであって、該複数のストローク(strokes)は結合して複数の記号(symbols)を定義する、受け取ること、及び
複数の記号認識(recognition)エンジンによって前記複数のストロークの連続した(sequential)組合せ(combinations)を解析することであって、前記複数のストロークによって定義される前記複数の記号のうちの少なくとも1つのあり得る(possible)記号が確定(determine)され、前記複数の記号認識エンジンのうちの少なくとも1つは、特定数(particular number)のストロークを含む記号を識別するように構成される、解析すること、
を含む、手書き記号を認識する方法。
[概念2]
前記解析することは、前記あり得る記号を識別する外部メカニズムの使用を必要としない、概念1に記載の方法。
[概念3]
前記外部メカニズムは、外部切出し(segmenting)信号及び外部ストローク辞書のうちの少なくとも一方を含む、概念2に記載の方法。
[概念4]
前記複数の記号のうちの第1の記号の少なくとも1つのストロークは、前記複数の記号のうちの第2の記号の少なくとも1つのストロークの上に空間的に重ね合わされ(superimposed)、前記複数のストロークの各ストロークは、前記複数の記号のうちの1つの記号のみに関連する、概念1に記載の方法。
[概念5]
前記複数のストロークの連続した組合せを解析することは、
前記複数のストロークのうちの1つのストロークが非記号ジェスチャを表すか否かを確定すること、及び
前記ストロークが非記号ジェスチャを表す場合、前記複数の記号認識エンジンにおいて該ストロークを無視すること、
を含む、概念1に記載の方法。
[概念6]
前記複数のストロークの連続した組合せを解析することは、少なくとも1つの共通ストロークによって接続される前記複数の記号のうちの少なくとも2つの記号を認識することを含む、概念1に記載の方法。
[概念7]
外部切出しメカニズムを使用せずに手書き記号を認識し切り出す方法であって、
電子機器の共通入力領域において複数のストロークを受け取ることであって、前記複数のストロークは結合して複数の記号を定義し、第1の記号の少なくとも1つのストロークは、第2の記号の少なくとも1つのストロークの上に空間的に重ね合わされ、前記複数のストロークの各ストロークは、前記複数の記号のうちの1つの記号のみに関連する、受け取ること、及び
前記複数のストロークを逐次解析することであって、前記複数のストロークによって定義される少なくともの1つのあり得る記号が確定され、該逐次解析することは、前記あり得る記号を識別するために外部切出し信号及び外部ストローク辞書のうちの少なくとも1つの使用を必要とせず、オンラインで実行される、逐次解析すること、
を含む、手書き記号を認識し切り出す方法。
[概念8]
前記外部切出し信号はタイムアウト信号を含む、概念7に記載の方法。
[概念9]
前記外部ストローク辞書は、記号二重字間のストロークの相対位置を記述する情報を含む、概念7に記載の方法。
[概念10]
前記複数のストロークを逐次解析することは、複数の記号認識エンジンを利用することであって、前記複数のストロークの連続した組合せを解析することであって、前記複数のストロークによって定義される前記複数の記号のうちの少なくとも1つのあり得る記号が確定され、前記複数の記号認識エンジンのうちの少なくとも1つは、特定数のストロークを含む記号を識別するように構成される、利用することを含む、概念7に記載の方法。
[概念11]
前記複数の記号認識エンジンは、1ストローク記号認識エンジン、2ストローク記号認識エンジン及び3ストローク記号認識エンジンを含む、概念1又は10に記載の方法。
[概念12]
前記複数の記号認識エンジンは、4ストローク記号認識エンジンをさらに含む、概念11に記載の方法。
[概念13]
前記複数の記号のうちの1つの記号は、4つ以下のストロークを含む、概念1又は7に記載の方法。
[概念14]
前記複数のストロークの連続した組合せを解析すること又は前記複数のストロークを逐次解析することは、
2値状態機械に従って前記複数のストロークのあり得る組合せを確定すること、及び
所定の制限に従って前記あり得る組合せを制限すること、
を含む、概念1又は7に記載の方法。
[概念15]
前記複数の記号は、表意文字言語の発音表記を含む、概念1又は7に記載の方法。
[概念16]
前記複数のストロークを逐次解析することは、
前記複数のストロークのうちの1つのストロークが非記号ジェスチャを表すか否かを確定すること、及び
前記ストロークが非記号ジェスチャを表す場合、該ストロークを無視すること、
を含む、概念7に記載の方法。
[概念17]
前記複数の記号認識エンジンは、統計的分類器を含む、概念1又は10に記載の方法。
[概念18]
手書き記号を認識する装置であって、
共通入力領域内に入力される複数のストロークを受け取るストローク受取部であって、前記複数のストロークは結合して複数の記号を定義し、第1の記号の少なくとも1つのストロークは、第2の記号の少なくとも1つのストロークの上に空間的に重ね合わせられる、ストローク受取部と、
前記複数のストロークを逐次解析して、該複数のストロークによって定義される少なくとも1つのあり得る記号を確定するストローク解析部であって、
前記複数のストロークの連続した組合せを解析する複数の記号認識エンジンであって、特定数のストロークを含む記号を識別するものである、複数の記号認識エンジン
を備える、ストローク解析部と、
を具備する、手書き記号を認識する装置。
[概念19]
前記複数の記号認識エンジンは、
1つのストロークを含む記号を識別する1ストローク記号認識エンジンと、
2つのストロークを含む記号を識別する2ストローク記号認識エンジンと、
3つのストロークを含む記号を識別する3ストローク記号認識エンジンと、
を含む、概念18に記載の装置。
[概念20]
前記複数の記号認識エンジンは、4つのストロークを含む記号を識別する4ストローク記号認識エンジンをさらに含む、概念19に記載の装置。
[概念21]
前記複数の記号認識エンジンのそれぞれは、前記複数の記号認識エンジンのそれぞれの記号認識エンジンによって解析されるストロークが前記あり得る記号である確率値を確定する、概念18に記載の装置。
[概念22]
前記ストローク受取部は、ハンドヘルドコンピューティングデバイスのストローク入力デバイスである、概念18に記載の装置。
[概念23]
前記複数の記号のうちの1つの記号は、4つ以下のストロークを含む、概念18に記載の装置。
[概念24]
前記複数のストロークの各ストロークは、前記複数の記号のうちの1つの記号のみに関連する、概念18に記載の装置。
[概念25]
前記ストローク解析部は、2値状態機械に従って前記複数のストロークのあり得る組合せを確定し、所定の制限に従って前記あり得る組合せを制限するように構成される、概念18に記載の装置。
[概念26]
前記複数の記号は、表意文字言語の発音表記を含む、概念18に記載の装置。
[概念27]
前記ストローク解析部は、前記複数のストロークのうちの1つのストロークが非記号ジェスチャを表すか否かを確定し、前記ストロークが非記号ジェスチャを表す場合、前記複数の記号認識エンジンにおいて該ストロークを無視するように構成される、概念18に記載の装置。
[概念28]
前記複数の記号認識エンジンは統計的分類器を含む、概念18に記載の装置。
[概念29]
前記複数の記号認識エンジンのうちの少なくとも1つの記号認識エンジンは、少なくとも1つの共通ストロークによって接続される前記複数の記号のうちの少なくとも2つの記号を認識するように構成される、概念18に記載の装置。
本明細書に組み込まれると共にその一部を形成する添付図面は、本発明の実施形態を例示し、本明細書と共に本発明の原理を説明する役割を果たす。
本発明の一実施形態による例示的なスモールフォームファクタ機器のコンポーネントを示すブロック図(1A)、及び、本発明の一実施形態による手書き入力デバイスを使用する単語の例示的な入力を示す図(1B)である。 本発明の一実施形態による手書き認識エンジンのコンポーネントを示すブロック図である。 本発明の一実施形態による単語「do」に対する例示的な入力イメージを示す図(3A)、及び、本発明の一実施形態による単語「do」の3ストローク入力に対する2値状態機械を示す図(3B)である。 本発明の一実施形態による、手書き記号を認識するプロセスにおけるステップを示すフローチャート図である。 本発明の一実施形態による、ストロークを解析するプロセスにおけるステップを示すフローチャート図である。
ここで、本発明のさまざまな実施形態を詳細に参照し、その例を添付図面に示す。本発明を、さまざまな実施形態に関して説明するが、それらは本発明をこれらの実施形態に限定するようには意図されていないということが理解されよう。反対に、本発明は、代替形態、変更形態及び等価形態を包含するように意図されており、それらは、添付の特許請求の範囲によって定義されるような本発明の精神及び範囲内に含まれ得る。さらに、本発明の以下の詳細な説明では、本発明が完全に理解されるように、多数の特定の詳細を示す。しかしながら、当業者には、本発明をこれらの特定の詳細なしに実施してもよい、ということが明らかとなろう。他の場合、本発明の態様を不必要に不明瞭にしないように、既知の方法、手続き、構成要素及び回路については詳細に説明していない。
本出願の目的で、記号という用語は、意味を伝達するように意図される1つ又は複数の手書きストロークを指す。たとえば、記号は、限定されないが、さまざまなアルファベットの文字、表意文字言語の表意文字、表音記号、数字、数学記号、句読記号等を含むように意図されている。
本発明のさまざまな実施形態は、コンピュータデバイスへのテキスト入力を実行する手書き認識に基づく方法を提供し、ここで、テキスト入力に割り当てられるエリアは、書かれる記号のサイズに対して小さい。たとえば、テキスト入力に割り当てられるエリアは、1つ又は2つの記号を並べて受け取ることができるのみであってもよく、ここで、すべての追加の記号は重なっていなければならない。図1Bは、テキスト入力に割り当てられた小さいエリアにおける例示的な入力を示す。特に、記号は自然に入力されており、ユーザは特別なアルファベットを学習することも、タイムアウト、又は書かれた記号を分離することを意図されるいかなる他の外部メカニズムにも依存する必要はない。本発明の実施形態は、電子機器の共通入力領域において複数のストロークを受け取ることを含み、それらの複数のストロークは結合して複数の記号を定義する、手書き記号を認識する方法を提供する。複数のストロークの連続的な組合せが、複数の記号認識エンジンによって解析されることにより、複数のストロークによって定義される複数の記号のうちの少なくとも1つのあり得る記号が確定され、複数の記号認識エンジンのうちの少なくとも1つは、特定数のストロークを含む記号を識別するように構成される。
図1Aは、本発明の一実施形態による、例示的なスモールフォームファクタの電子機器100のコンポーネントを示すブロック図である。概して、電子機器100は、情報を通信するバス110と、バス110に結合され情報及び命令を処理するプロセッサ101と、バス110に結合されプロセッサ101に対する静的情報及び命令を格納する読取専用(不揮発性)メモリ(ROM)102と、バス110に結合されプロセッサ101に対する情報及び命令を格納するランダムアクセス(揮発性)メモリ(RAM)103とを備える。電子機器100はまた、バス110に結合されストローク入力を受け取る手書き入力デバイス104と、バス110に結合され受け取られたストローク入力に対し手書き認識を実行する手書き認識エンジン105と、バス110に結合され情報を表示する表示デバイス106とを備える。
一実施形態では、手書き入力デバイス104は、ユーザからペン、スタイラス又は指に基づく手書き入力を受け取るように動作可能である。たとえば、手書き入力デバイス104は、離散化タブレット、タッチパッド、電磁誘導ペンタブレット等であってもよい。手書き入力デバイス104は、ストロークデータの形式で入力のX座標情報及びY座標情報を取り込むように動作可能である。言い換えれば、手書き入力デバイス104は、記号及び/又は単語の自然なストローク順で書かれた記号ストロークをリアルタイムで検出する座標入力デバイスである。一実施形態では、個々の記号のストロークは、手書き入力デバイス104の表面に接触し、その上を移動し、且つそこから離れる物体の動きから導出される位置情報及び時間情報を含む。別の実施形態では、手書き入力デバイス104が、表示デバイス106の後方に配置される誘導デバイスである場合、個々の記号ストロークは、表示デバイス106の表面に接触し、その上を移動し、且つそこから離れる物体の動きから導出される位置情報及び時間情報を含む。一実施形態では、ストロークは、手書き認識エンジン105によってアクセスされるために、不揮発性メモリ102及び揮発性メモリ103のうちの一方に格納される。一実施形態では、ユーザによって入力される記号は、表意文字の発音表記である。一実施形態では、記号は非筆写体である。
一実施形態では、手書き入力デバイス104は非常に小さく、ユーザによって入力される記号を、並べて(たとえば左から右に又は上から下に)書くことはできないが、互いの上に重ねて書くことができる程度である。たとえば、一実施形態では、手書き入力デバイス104は、表面積が1平方インチ未満である。図1Bは、本発明の一実施形態による、手書き入力デバイス104を使用する単語の例示的な入力を示す図150である。図150は、スモールフォームファクタ手書き入力デバイスを使用する単語「BELL」の入力を示す。特に、記号B、E、L及びLは、互いに重ねて入力される。本発明の実施形態は、並べて書かれる記号、たとえば「AN」及び「TO」のような短い単語を入力するように動作可能であるということが理解されるべきである。一実施形態では、単語の終りは、特別なジェスチャ、ボタン押下、タイムアウト又は他の信号によって指示される。
図1Aを参照すると、手書き認識エンジン105は、手書き入力デバイス104において入力されたストロークを受け取るように動作可能であり、ストロークに対し記号認識を実行する。手書き認識エンジン105を、電子機器100内においてハードウェア、ソフトウェア及び/又はファームウェアとして実装してもよいということが理解されるべきである。さらに、手書き認識エンジン105は、点線で示すように、独立したコンポーネントであってもよく、又は電子機器100の他のコンポーネントにわたって分散されてもよい、手書き認識機能を示すということが理解されるべきである。たとえば、手書き認識エンジン105の異なる機能を、プロセッサ101、不揮発性メモリ102及び揮発性メモリ103のような、電子機器100のコンポーネントにわたって分散されてもよい、ということが理解されるべきである。手書き認識エンジン105の動作を、たとえば図2を参照して以下に説明する。手書き認識エンジン105は、認識された記号を出力するように動作可能である。
電子機器100で利用される表示デバイス106は、液晶デバイス(LCD)であっても、ユーザが認識可能なグラフィックイメージ及び英数字又は表意記号を生成するために適している他の表示デバイスであってもよい。表示デバイス106は、認識された記号を表示するように動作可能である。一実施形態では、認識された記号はテキストとして表示される。
図2は、本発明の一実施形態による、手書き認識を実行するシステム200のコンポーネントを示すブロック図である。一実施形態では、本発明は、コンピュータデバイス(たとえば図1Aの電子機器100)へのテキスト入力に基づいて手書き認識を実行するシステム200を提供し、ここで、テキスト入力に割り当てられるエリアは、筆記用具に比べて小さい。ユーザは、記号のストロークを自然なストローク順で入力することができる。
システム200は、手書き入力デバイス104、手書き認識エンジン105及び表示デバイス106を備える。上述したように、手書き入力デバイス104においてストローク入力が受け取られる。図2において、ストローク入力をストローク202、204、206及び208として表す。特に、ストローク208は、ストローク206、204及び202に続いて入力された最後のストロークである。図示するように、4つのストロークは、手書き認識エンジン105によって処理される。しかしながら、いかなる数のストロークを処理することも可能であり、本発明の実施形態は本実施形態に限定されない、ということが理解されるべきである。たとえば、本実施形態を、最後に受け取られた4つのストロークを処理するものとして説明するが、他の実施形態は、最後に受け取られた他の数のストローク(たとえば、最後に受け取られた3つのストローク又は最後に受け取られた5つのストローク)を対象としてもよい。
一実施形態では、手書き入力デバイス104は、接触移動の跡を検知及び報告するように動作可能である。接触の跡は、ストロークと呼ばれるX座標及びY座標の点のセットにグループ分けされる。ストロークバッファ201が、入力されたストロークを一時的に保持することにより、ストロークシーケンスを切り出す種々の仮説を形成することが可能になる。
手書き認識エンジン105は、ユーザストローク入力に基づいて、記号の登録されたセット(たとえば、a〜z、0〜9、A〜Z又は表意記号)を認識するように動作可能である。ストローク202、204、206及び208は、手書き認識エンジン105により手書き認識を実行するように処理される。一実施形態では、ストローク202、204、206及び208は、ストローク解析部210において処理される。ストローク解析部210は、複数のストロークを逐次解析することにより、複数のストロークによって定義される少なくとも1つのあり得る記号を確定するように動作可能である。図示するように、ストローク解析部210は、それぞれ最後に入力された4つ、3つ、2つ及び1つのストロークを含む記号に対し記号認識を実行する、4つの記号認識エンジン222、224、226及び228を含む。記号認識エンジン222、224、226及び228は、別個のモジュールである必要はなく、重なっている記号からのストロークによって形成される非記号を含む仮説を拒否するようにストロークの組合せを解析する、同様の機能を実行する単一モジュールであってもよい、ということが理解されるべきである。
一実施形態では、ストローク解析部210はまた、最後のストロークが記号の一部であるか又はジェスチャを示しているかを確定するジェスチャ認識部220も含む。手書きストロークは、記号(入力テキスト)の一部か又はコマンドを発行するジェスチャのいずれかであり得る。ジェスチャは事前定義されたストロークのセットを表すため、ジェスチャ認識部210は、記号認識の前にジェスチャストロークをフィルタリング除去することができる。
ストロークがジェスチャではないと確認されると、記号認識及び切出しが開始する。一時バッファ内に格納されているストローク202、204、206及び208は、仮記号認識に使用される。バッファ内の利用可能なストロークに基づき、複数の新たな仮記号を、最後に入力されたストロークに関して形成することができる。新たな仮記号の数は、特定の記号セットに対するストロークの最大数に関する事前の知識を使用することによって確定される。デフォルトで各仮記号は、最後のストロークのみを含む新たな記号、又は1つ若しくは複数の前のストロークと結合される最後のストロークを含む新たな記号のいずれかであると想定される。
一実施形態では、記号認識エンジンにストロークを送出する前に、ストロークは、プリプロセッサ212、214、216及び218において前処理される。プリプロセッサ212、214、216及び218は、さまざまな変換を実行して、生データ(たとえばX座標、Y座標)を、認識プロセスを容易にする表現に変換するように動作可能である。一実施形態では、前処理には、スケーリング、正規化及び特徴生成のような動作、たとえば、入力表現を認識により適した表現に変換することが含まれる。
前処理技法は、既知の変動及び関連する特徴のような、当面のタスクに関する人間の知識を組み込む。たとえば、前処理は、キーポイント抽出、雑音ろ過及び特徴抽出を含んでもよい。一実施形態では、プリプロセッサ212、214、216及び218の出力は、多次元特徴空間において定義される特徴ベクトルの形式の入力を表すベクトルである。この超空間は、問題の個々のクラスを表す複数の部分空間に分割される。分類プロセスは、特定の入力がいずれの部分空間特徴ベクトルに属するかを確定する。
前処理後、ストロークはそれぞれの記号認識エンジン222、224、226及び228に渡され、それぞれ最後の4つのストローク、最後の3つのストローク、最後の2つのストローク及び最後のストロークの組合せに対して記号認識が実行される。一実施形態では、特徴ベクトルの形式の入力ストロークは、登録されたクラスの特徴に対して照合される。ジェスチャとして認識されるストロークは、記号認識エンジン222、224、226及び228に渡されないことが理解されるべきである。
一実施形態では、記号認識エンジン222、224、226及び228は、統計的認識器を備え、事前定義されたクラスのセットの間で分類を実行するように動作可能である。一実施形態では、記号認識エンジン222、224、226及び228はまた、ストロークの非適合組合せを拒否するようにもトレーニングされている。記号認識エンジン222、224、226及び228は、前処理された入力信号と出力クラスとの間の類似性を反映するスコアを出力する。高い出力スコアは、関連する仮記号の受入れを示唆し、すべてのクラスに対する低いスコアは、関連する仮説の拒否を示唆する。一実施形態では、出力スコアは、それぞれの記号認識エンジンによって解析されるストロークがあり得る記号である確率を示す。記号認識エンジン222、224及び226は、各ストロークを個々に解析するのではなく、それぞれの記号認識内のストロークの各組合せを全体として解析することが理解されるべきである。
一実施形態では、各記号認識エンジン222、224、226及び228は、規則的な分類タスクに対する優れた性能を達成するように動作可能であり、不明瞭な入力パターンを拒否する有効な「信頼度判断」を生成する時、ストロークが2つの意図された記号からのものである、不正確な仮説窓において観測される意味のない記号の問合せを拒否するように動作可能である。一実施形態では、各記号認識エンジンは、入力記号とテンプレートのグループとの間の照合をそれらの類似性を測定することにより網羅的に実行する、テンプレートマッチング手続きを採用する。比較の正しい結果は、類似性スコアが最高のテンプレートである。
一実施形態では、テンプレートマッチングは以下を含む。
・分類されたテンプレートマッチング
テンプレートは、ストロークの数により複数のグループに分類される。これらのグループは、認識タスクを相互に排他的なサブタスクに分割し、それにより認識性能を向上させる。
・類似性測定
変換された入力とすべてのテンプレートとの間の類似性を測定し、最高スコアの比較を意図されたクラスとして報告する機能。
・サブセットクラス認識のためのペナルティ係数
サブセットクラスは、より複雑なクラスの一部も表す単純なクラスである(たとえば、I及びCは手書きにおいてKのサブセットクラスである)。サブセットクラスが高いスコアを得ないように、類似性測度にペナルティ定数が考慮される。たとえば、入力「I」が、テンプレート「K」に対して照合される場合である。
・異書体に基づく認識
同じ記号に対する手書きスタイルの変形により、異書体と呼ばれる別個のサブセットがもたらされる場合がある。たとえば、小文字「z」が「3」のようにも書かれる可能性があり、この第2の異書体は、通常の「z」とは別個である特徴を含む。認識タスクは、異書体を別個のクラスとして扱う。
ニューラルネットワーク等のような、他のタイプの統計的分類器を記号認識エンジン222、224、226及び228で使用してもよく、本発明はテンプレートマッチングの使用に限定されない、ということが理解されるべきである。
一実施形態では、記号認識エンジンの照合結果に対し、ポストプロセッサ232、234、236及び238において後処理が施される。後処理は、クラス間で既存の混乱を低減するように動作可能である。認識結果は、信頼度レベル、たとえば認識スコアと共にクラスラベルである。
ストローク解析部210は、受け取ったストロークに対して記号認識を実行するように動作可能である。時間的切出し部240は、記号認識結果を受け取ると共に、記号認識エンジンの記号認識結果に基づいて最良適合記号を選択するように動作可能である。
時間的切出し部240は、すべてのあり得る仮説、たとえば入力ストロークのシーケンスを結合する方法を評価する。ストロークシーケンスの特定部分における最高スコアの仮説が勝ち残り、勝ち残った仮説に関連する累積された記号シーケンスが出力される。すべてのあり得る解を生成するために、一実施形態では、時間的切出し部240は、新たなストロークがシステムに追加されると指数関数的に拡張する2値状態機械を利用する。状態機械は、各状態が親状態に基づく2つの新たなあり得る仮説を表す最大数の2つの子状態を有することから2値であり、新たに追加されるストロークは、単一のストローク記号、又は親状態において累積されたストロークに追加された最後のストロークのいずれかである。
図3Aは、本発明の一実施形態による、単語「do」に対する例示的な入力イメージ300を示す。単語「do」は、図示するように、3つのストローク312、314及び316を含む。入力イメージ300は、ストロークの重ね合わされた入力を示し、グラフ310は、ストロークシーケンス領域内に入力されたストロークを示す。
図3Bは、本発明の一実施形態による、単語「do」の3ストローク入力に対する2値状態機械320を示す。2値状態機械は、ストロークの各組合せに対して有効な仮説を追跡する。仮説330は、入力ストローク312に対する唯一の仮説である。仮説340a及び340bは、共に、入力ストローク312及び314の組合せに対する有効な仮説である。仮説350a、350b及び350cは、入力ストローク312、314及び316に対する有効な仮説である。仮説350dは、クラス「d」が3つ未満のストロークから成ることがわかるため無効であり、そのため、3ストローク「d」に対する仮説を除外することができる。所望の出力「do」は仮説350cにおいて示されている。
2値状態機械は指数関数的に成長する。2値状態機械の成長を制限するためには、処理速度及びシステムオーバヘッドを向上させるために、時間的切出し部240にさまざまな制約が配置され得る。
一実施形態では、適合記号に対するストロークの数に対して任意の制限が課される。たとえば、ストロークの最大数は、大文字、小文字及び数字それぞれに対して4未満、3未満及び2未満のストロークに制限される。これらの制限を超える数のストロークを有する記号を想定する仮説の可能性はゼロであり、そのため、状態機械に維持されない。
一実施形態では、2値状態機械の深さが制約される。この制約は、累積されたストロークの発火(firing)を強制し、機械における最も信頼される仮説(状態)を送り出す。この制約により、ストロークバッファから未完成記号のストロークがアンロードされる可能性があり、このため、切出しエラーが生じ易い。切出しタスクの1つの目標は、この制約の達成を回避することである。
時間的切出し部240は、記号認識結果を受け取ると共に、イベントのシーケンスを相互に排他的な結合イベントのセットに分割するように動作可能である。これは、観測値のシーケンスから隠れ状態をモデル化する、隠れマルコフモデル(HMM)の一般的なフレームワークに適合する。定義されたHMMにおいて最高尤度の経路を特定することにより、切出しに対し最も確度の高い回答が与えられる。HMMの複雑性は、連続した状態の間の依存性の程度(order)によって指示される。この問題領域において、依存性の程度は、登録された記号のセットに対する記号毎のストロークの最大数(たとえば4)に等しい。このため、4つを上回るストロークを含むいかなる仮説も、HMMから即時排除することができる。
時間的切出し部240によって確定される状態の信頼度は、2つの主な信頼源から来る。すなわち、新たな仮説記号における信頼度と、それに先行するストリングの信頼度とである。先行するストリングは、親状態又は祖先状態から来る可能性がある。たとえば、状態350aは、その親状態340aに新たな記号「o」を追加するという仮説を反映し、状態350bは、340aの局部的な(「I」のように見える記号の)仮定を否定し、状態330に新たな記号「d」を追加する。一実施形態では、2つの信頼度は等しく重み付けされる。
本発明はまた、早期発火決定を提供することにより2値状態機械の拡張された管理も提供する。早期発火決定とは、状態機械がその限界に達する前に、累積されたストロークをアンロードすると共に最良の推測をユーザに送り出す信号を指す。このような信号は、勝ち残った仮説が最後に認識された記号に非常に高い信頼度を有する時に送り出すことができる。その間の最後の観測値に対する結論は、シーケンスの他の排他的部分における信頼度を向上させるのに役立つ。
制御モジュール250は、時間的切出し部240から記号及び単語を受け取り、ジェスチャ認識部220から認識されたジェスチャを受け取る。制御モジュール250は、例示的なスモールフォームファクタの電子機器260の表示デバイス106に記号及び単語を表示するように動作可能である。制御モジュール250はまた、ジェスチャの受け取りに応じて適切な動作を行う、たとえば新たな単語を開始するか又は空間を挿入するように動作可能である。
図4は、本発明の一実施形態による、手書き記号を認識するプロセス400のステップを示すフローチャート図である。一実施形態では、プロセス400は、プロセッサ及び電気コンポーネントによりコンピュータ可読且つコンピュータ実行可能命令の制御下で実行される。コンピュータ可読且つコンピュータ実行可能命令は、たとえば、コンピュータ使用可能揮発性メモリ及び不揮発性メモリのようなデータ記憶機構に存在する。しかしながら、コンピュータ可読且つコンピュータ実行可能命令は、いかなるタイプのコンピュータ可読媒体に存在してもよい。プロセス400に特定のステップを開示するが、このようなステップは例示的なものである。すなわち、本発明の実施形態は、図4に列挙するステップのさまざまな他のステップ又は変形を実行するのによく適している。一実施形態では、プロセス400は、図2の手書き認識エンジン105によって実行される。
図4のステップ405において、電子機器の共通入力領域が複数のストロークの受取りを開始する。ここで、複数のストロークは結合して複数の記号を定義する。一実施形態では、複数の記号のうちの第1の記号の少なくとも1つのストロークが、複数の記号のうちの第2の記号の少なくとも1つのストロークの上にy空間的に重ね合わさり、複数のストロークの各ストロークは複数の記号のうちの1つの記号のみに関連する。一実施形態では、複数の記号は、表意文字言語の発音表記を含む。一実施形態では、複数の記号のうちの1つの記号は、4つ以下のストロークを含む。
ステップ410において、ストロークを処理する。ステップ415において、そのストロークが単語終了ジェスチャであるか否かを確定する。ストロークが単語終了ジェスチャである場合、プロセス400はステップ440に進む。一方、ストロークが単語終了ジェスチャでない場合、プロセス400はステップ420に進む。ステップ420において、ストロークを含む仮説記号を生成する。一実施形態では、仮説記号は、そのストロークと既に処理されたストロークとの連続した組合せを含む。
ステップ425において、仮説記号を解析する。一実施形態では、仮説記号を、図5のプロセス500に従って解析する。
図5は、本発明の一実施形態による、プロセス500における複数のストロークを解析するステップを示すフローチャート図である。一実施形態では、プロセス500は、プロセッサ及び電気コンポーネントによりコンピュータ可読且つコンピュータ実行可能命令の制御下で実行される。コンピュータ可読且つコンピュータ実行可能命令は、たとえば、コンピュータ使用可能揮発性メモリ及び不揮発性メモリのようなデータ記憶機構内に存在する。しかしながら、コンピュータ可読且つコンピュータ実行可能命令は、いかなるタイプのコンピュータ可読媒体内に存在してもよい。プロセス500に特定のステップを開示するが、このようなステップは例示的なものである。すなわち、本発明の実施形態は、図5に列挙するステップのさまざまな他のステップ又は変形を実行するのによく適している。一実施形態では、プロセス500は、図2の手書き認識エンジン105によって実行される。
ステップ520において、複数の記号認識エンジンにより、複数のストロークの連続した組合せが解析されて、複数のストロークによって定義される複数の記号のうちの少なくとも1つのあり得る記号が確定される。一実施形態では、複数の記号認識エンジンは、統計的分類器を含む。一実施形態では、複数の記号認識エンジンのうちの少なくとも1つは、特定数のストロークを含む記号を識別するように構成される。
合字、二重母音等の記号組合せは、一般に1つ又は複数のストロークで書かれる可能性がある。一実施形態では、少なくとも1つの共通ストロークによって接続される複数の記号のうちの少なくとも2つの記号は、記号認識エンジン、ジェスチャ認識部又はこのタスクに対して最適化された追加の認識部のうちの1つ又は複数によって認識される。
一実施形態では、解析は、あり得る記号を識別するために外部メカニズムの使用を必要としない。一実施形態では、必要でない外部メカニズムは、外部切出し信号と、記号二重字間のストロークの相対位置を記述する情報を含むストローク辞書のようなストローク辞書とのうちの少なくとも1つを含む。
一実施形態では、複数の記号認識エンジンは、1ストローク記号認識エンジン、2ストローク記号認識エンジン、3ストローク記号認識エンジンを含む。一実施形態では、複数の記号認識エンジンはまた、4ストローク記号認識エンジンも含む。
ステップ525において、複数のストロークのあり得る組合せを、2値状態機械に従って確定する。ステップ530において、あり得る組合せは、所定の制限に従って制限される。一実施形態では、プロセス500はその後図4のステップ430に進む。
図4を参照すると、ステップ430において、早期発火基準(early firing criteria)が満たされているか否かを判断する。一実施形態では、早期発火基準は、勝ち残った仮説における最後の仮説記号が非常に高い信頼度を有し且つ他の任意の記号のサブセットでないことがわかっている場合に満たされる。早期発火基準が満たされていない場合、プロセス400はステップ435に進み、ここで、次のストロークに対し処理するためにアクセスし、プロセス400はステップ410に進む。一方、早期発火基準が満たされている場合、あり得る組合せから部分的に完成した記号のストリングを選択する。一実施形態では、ステップ440に示すように、勝ち残った仮説ストリングを表示デバイス、たとえば図1の表示デバイス106に出力し、プロセス400を次のストロークシーケンスに対してリセットする。
このように、本発明、すなわち手書き記号の認識方法及び装置のさまざまな実施形態について説明した。本発明を特定の実施形態で説明したが、本発明は、このような実施形態によって限定されるようには解釈されるべきではなく、以下の特許請求の範囲に従って解釈されるべきである、ということが理解されるべきである。

Claims (8)

  1. 手書き記号を認識する方法であって、
    電子機器の共通入力領域において複数のストロークを受け取る受取ステップであって、該複数のストロークが結合して複数の記号を定義し、該複数の記号が前記共通入力領域において互いに重ねて入力され、前記複数の記号の第1の記号の少なくとも1つのストロークが、前記複数の記号の第2の記号の少なくとも1つのストロークの上に空間的に重ね合わされる、該受取ステップと、
    前記複数のストロークによって定義される前記複数の記号のうちの少なくとも1つのあり得る記号を確定するために、前記電子機器の複数の記号認識エンジンによって前記複数のストロークの連続した組合せを解析する解析ステップであって、当該複数の記号認識エンジンの各々が、相異なる数の連続したストロークからなる記号を識別するように構成され、当該複数の記号認識エンジンが前記複数のストロークを解析する、該解析ステップと
    を含む、手書き記号を認識する方法。
  2. 前記複数のストロークの連続した組合せを解析する前記解析ステップが、
    2値状態機械に従って前記複数のストロークのあり得る組合せを確定すること、及び
    所定の制限に従って前記あり得る組合せを制限すること、
    を含む、請求項1に記載の方法。
  3. 前記解析ステップが、
    前記複数のストロークのうちの1つのストロークが非記号ジェスチャを表すか否かを確定するステップ、及び
    前記ストロークが非記号ジェスチャを表す場合、該ストロークを無視するステップ、
    を含む、請求項1又は2に記載の方法。
  4. 前記解析ステップが、少なくとも1つの共通ストロークによって接続される前記複数の記号のうちの少なくとも2つの記号を認識するステップを含む、請求項1ないし3のいずれか一項に記載の方法。
  5. 手書き記号を認識する装置であって、
    共通入力領域内に入力される複数のストロークを受け取るストローク受取部であって、前記複数のストロークが結合して複数の記号を定義し、該複数の記号が前記共通入力領域において互いに重ねて入力され、当該複数の記号中の第1の記号の少なくとも1つのストロークが、当該複数の記号中の第2の記号の少なくとも1つのストロークの上に空聞的に重ね合わせられる、該ストローク受取部と、
    前記複数のストロークを逐次解析して、該複数のストロークによって定義される少なくとも1つのあり得る記号を確定するストローク解析部であって、当該ストローク解析部が、前記複数のストロークの連続した組合せを解析する複数の記号認識エンジンを備え、当該複数の記号認識エンジンの各々が、相異なる数の連続したストロークからなる記号を識別し、当該複数の記号認識エンジンが前記複数のストロークを解析する、該ストローク解析部と、
    を具備する、手書き記号を認識する装置。
  6. 前記複数の記号認識エンジンが、
    1つのストロークからなる記号を識別する1ストローク記号認識エンジンと、
    2つのストロークからなる記号を識別する2ストローク記号認識エンジンと、
    3つのストロークからなる記号を識別する3ストローク記号認識エンジンと、
    を含む、請求項5に記載の装置。
  7. 2値状態機械に従って前記複数のストロークのあり得る組合せを確定し、所定の制限に従って前記あり得る組合せを制限する、時間的切出し部をさらに備える、請求項5及び6のいずれか一項に記載の装置。
  8. 前記ストローク解析部は、前記複数のストロークのうちの最後のストロークが非記号ジェスチャを表すか否かを確定するジェスチャ認識部を含む、請求項5〜7のいずれか一項に記載の装置。
JP2009518279A 2006-07-06 2007-06-29 手書き記号の認識方法及び装置 Active JP5211334B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/484,051 US20080008387A1 (en) 2006-07-06 2006-07-06 Method and apparatus for recognition of handwritten symbols
US11/484,051 2006-07-06
PCT/US2007/015083 WO2008005304A2 (en) 2006-07-06 2007-06-29 A method and apparatus for recognition of handwritten symbols

Publications (3)

Publication Number Publication Date
JP2009543204A JP2009543204A (ja) 2009-12-03
JP2009543204A5 JP2009543204A5 (ja) 2010-08-12
JP5211334B2 true JP5211334B2 (ja) 2013-06-12

Family

ID=38895117

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009518279A Active JP5211334B2 (ja) 2006-07-06 2007-06-29 手書き記号の認識方法及び装置

Country Status (7)

Country Link
US (1) US20080008387A1 (ja)
EP (1) EP2038813A4 (ja)
JP (1) JP5211334B2 (ja)
KR (1) KR101354663B1 (ja)
CN (1) CN101484907B (ja)
TW (1) TWI435276B (ja)
WO (1) WO2008005304A2 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8074172B2 (en) 2007-01-05 2011-12-06 Apple Inc. Method, system, and graphical user interface for providing word recommendations
US8121412B2 (en) * 2008-06-06 2012-02-21 Microsoft Corporation Recognition of tabular structures
US8566717B2 (en) * 2008-06-24 2013-10-22 Microsoft Corporation Rendering teaching animations on a user-interface display
TWI385584B (zh) * 2008-11-05 2013-02-11 Avermedia Information Inc 自動排列手寫字串之裝置及方法
US8310461B2 (en) * 2010-05-13 2012-11-13 Nuance Communications Inc. Method and apparatus for on-top writing
CN102156609B (zh) * 2010-12-10 2012-12-19 上海合合信息科技发展有限公司 一种重叠书写的手写输入方法
US8988461B1 (en) 2011-01-18 2015-03-24 Disney Enterprises, Inc. 3D drawing and painting system with a 3D scalar field
CN102141892B (zh) * 2011-03-28 2013-01-02 安徽科大讯飞信息科技股份有限公司 叠加手写输入显示方法及系统
US9142056B1 (en) * 2011-05-18 2015-09-22 Disney Enterprises, Inc. Mixed-order compositing for images having three-dimensional painting effects
EP3522075A1 (en) * 2011-06-13 2019-08-07 Google LLC Character recognition for overlapping textual user input
US8094941B1 (en) 2011-06-13 2012-01-10 Google Inc. Character recognition for overlapping textual user input
CN102981693B (zh) * 2011-09-07 2015-11-25 汉王科技股份有限公司 一种多语言手写输入方法和装置
TWI447619B (zh) * 2011-12-15 2014-08-01 Inventec Corp 提供引導軌跡以輔助手勢輸入之系統及其方法
CN103366151B (zh) * 2012-03-30 2017-05-31 佳能株式会社 手写字符识别方法以及设备
CN105283882B (zh) * 2013-04-12 2019-12-27 诺基亚技术有限公司 用于文本输入的装置及相关联的方法
US9898187B2 (en) 2013-06-09 2018-02-20 Apple Inc. Managing real-time handwriting recognition
CN103425262A (zh) * 2013-08-01 2013-12-04 广东小天才科技有限公司 一种汉字手写输入方法及装置
KR102147935B1 (ko) * 2013-08-29 2020-08-25 삼성전자주식회사 데이터 처리 방법 및 그 전자 장치
CN105095924A (zh) * 2014-04-25 2015-11-25 夏普株式会社 手写识别方法和设备
US10528249B2 (en) * 2014-05-23 2020-01-07 Samsung Electronics Co., Ltd. Method and device for reproducing partial handwritten content
JP6430199B2 (ja) * 2014-09-30 2018-11-28 株式会社東芝 電子機器、方法及びプログラム
JP6451316B2 (ja) * 2014-12-26 2019-01-16 富士通株式会社 文字認識プログラム、文字認識方法及び文字認識装置
CN104699405B (zh) * 2015-03-26 2019-03-29 联想(北京)有限公司 信息处理方法、信息处理装置和电子设备
DK179374B1 (en) 2016-06-12 2018-05-28 Apple Inc Handwriting keyboard for monitors
JP7071840B2 (ja) * 2017-02-28 2022-05-19 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド 画像中の文字ストローク情報の推定
US10204082B2 (en) * 2017-03-31 2019-02-12 Dropbox, Inc. Generating digital document content from a digital image
US11194467B2 (en) 2019-06-01 2021-12-07 Apple Inc. Keyboard management user interfaces

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5580183A (en) * 1978-12-12 1980-06-17 Nippon Telegr & Teleph Corp <Ntt> On-line recognition processing system of hand-written character
JPS58169296A (ja) * 1982-03-31 1983-10-05 Fujitsu Ltd オンライン手書文字認識装置
US4731857A (en) * 1984-06-29 1988-03-15 International Business Machines Corporation Recognition system for run-on handwritten characters
JPS63155389A (ja) * 1986-12-19 1988-06-28 Toshiba Corp オンライン文字認識装置
US5459796A (en) * 1990-10-22 1995-10-17 The Watt Stopper System for entering handwritten data into computer generated forms
JPH05233599A (ja) * 1992-02-18 1993-09-10 Seiko Epson Corp オンライン文字認識装置
US5592608A (en) * 1993-10-15 1997-01-07 Xerox Corporation Interactively producing indices into image and gesture-based data using unrecognized graphical objects
JP3486459B2 (ja) * 1994-06-21 2004-01-13 キヤノン株式会社 電子情報機器及びその制御方法
US6094506A (en) * 1995-10-25 2000-07-25 Microsoft Corporation Automatic generation of probability tables for handwriting recognition systems
US6898315B2 (en) * 1998-03-23 2005-05-24 Microsoft Corporation Feature extraction for real-time pattern recognition using single curve per pattern analysis
JP4536239B2 (ja) * 1999-10-15 2010-09-01 パナソニック株式会社 文字入力装置及び方法並びにコンピュータ読み取り可能な記録媒体
JP3974359B2 (ja) * 2000-10-31 2007-09-12 株式会社東芝 オンライン文字認識装置及び方法並びにコンピュータ読み取り可能な記憶媒体及びオンライン文字認識プログラム
US7369702B2 (en) * 2003-11-07 2008-05-06 Microsoft Corporation Template-based cursive handwriting recognition
CN1317664C (zh) * 2004-01-17 2007-05-23 中国科学院计算技术研究所 乱笔顺库建立方法及联机手写汉字识别评测系统
WO2006028438A1 (en) * 2004-09-01 2006-03-16 Hewlett-Packard Development Company, L.P. System, method, and apparatus for continuous character recognition
US7496547B2 (en) * 2005-06-02 2009-02-24 Microsoft Corporation Handwriting recognition using a comparative neural network

Also Published As

Publication number Publication date
KR20090045190A (ko) 2009-05-07
JP2009543204A (ja) 2009-12-03
WO2008005304A2 (en) 2008-01-10
TWI435276B (zh) 2014-04-21
EP2038813A2 (en) 2009-03-25
KR101354663B1 (ko) 2014-01-24
EP2038813A4 (en) 2014-04-23
US20080008387A1 (en) 2008-01-10
TW200823773A (en) 2008-06-01
CN101484907B (zh) 2012-01-25
WO2008005304A3 (en) 2008-07-31
CN101484907A (zh) 2009-07-15

Similar Documents

Publication Publication Date Title
JP5211334B2 (ja) 手書き記号の認識方法及び装置
US10007859B2 (en) System and method for superimposed handwriting recognition technology
EP3320482B1 (en) System for recognizing multiple object input and method and product for same
US8175389B2 (en) Recognizing handwritten words
KR100297482B1 (ko) 수기입력의문자인식방법및장치
EP1564675B1 (en) Apparatus and method for searching for digital ink query
Chiang et al. Recognizing arbitrarily connected and superimposed handwritten numerals in intangible writing interfaces
Khan Online Urdu handwritten character recognition: Initial half form single stroke characters
Sundaram et al. Bigram language models and reevaluation strategy for improved recognition of online handwritten Tamil words
CN107912062B (zh) 叠覆手写的系统和方法
Urala et al. Recognition of open vocabulary, online handwritten pages in Tamil script
K Jabde et al. A Comprehensive Literature Review on Air-written Online Handwritten Recognition
Rossignol et al. Mode detection and incremental recognition
Erdem et al. Computer vision based unistroke keyboards
WO2006090404A1 (en) System, method, and apparatus for accomodating variability in chunking the sub-word units of online handwriting
JP2020013460A (ja) 情報処理装置、文字認識方法、および文字認識プログラム
Öksüz et al. A video-based text and equation editor for LaTeX
Ramakrishnan et al. Recognition of open vocabulary, online handwritten pages in Tamil script

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100621

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100621

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20111025

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20111027

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120814

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121101

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130201

R150 Certificate of patent or registration of utility model

Ref document number: 5211334

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160308

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250