JP2004528620A - 入力ゾーン上で手動トレースされた文字を認識するための方法およびデバイス - Google Patents
入力ゾーン上で手動トレースされた文字を認識するための方法およびデバイス Download PDFInfo
- Publication number
- JP2004528620A JP2004528620A JP2002553717A JP2002553717A JP2004528620A JP 2004528620 A JP2004528620 A JP 2004528620A JP 2002553717 A JP2002553717 A JP 2002553717A JP 2002553717 A JP2002553717 A JP 2002553717A JP 2004528620 A JP2004528620 A JP 2004528620A
- Authority
- JP
- Japan
- Prior art keywords
- character
- stroke
- segment
- model
- trace
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
- G06V10/17—Image acquisition using hand-held instruments
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
図6a
Description
本発明は、入力ゾーン上で手動トレースされた文字を認識する方法、およびこの方法を実装する電子デバイスに関する。
【0002】
本発明の範囲内で、“文字”は、指またはトレース器具、例えばスタイラスなどを用いて、手動でトレースする(描く)ことのできる任意の英数字(A、B、C、...1、2、3...)、句読点(?、!、:、...)または記号文字(+、−、*、#、...)を意味する。拡大すれば、英数字または記号文字のトレース以外に、特定のコマンドが関連する任意のトレースも意味し、以下の記述ではこのようなトレースを制御文字と定義する。これらの制御文字は、カーソルの移動、前に入力した文字の削除、大文字と小文字の切替えなど、ある特定のコマンドを実行するように意図される。
【0003】
入力ゾーン上で手動トレースされた文字を認識するための多くのソリューションがすでに知られている。このようなソリューションは特に、電子デバイス、特に電子日記帳やポケット・コンピュータや電子時計などのポータブル電子デバイスで、キーボードを使用せずにデータを手動入力できるようにするのに用いられる。
【0004】
あるソリューションは、トレースされた文字のドット・マトリックス画像またはビットマップ画像に基づく複雑な認識アルゴリズムを提供するものであり、このドット・マトリックス画像またはビットマップ画像を所定の文字セットのモデル・データと比較して、行われたトレースに最も近い文字を識別する。このソリューションは実際的ではなく、特にポータブル電子デバイスでは、計算時間や用いる電力が過度に多く、過度に大きな負担を要する。このソリューションのもう1つの欠点は、認識すべき文字を定義するために大きなメモリ空間が必要なことである。このソリューションではさらに、ユーザが所定のパターンに従って各文字をトレースするようにユーザ側で学習することも必要である。
【0005】
したがって現在通例となっているのは、文字が入力ゾーン上でトレースされるときに行われる動きを調べる認識デバイスおよびアルゴリズムを提案することである。通常は、入力ゾーンから、より正確にはこの入力ゾーンを形成する複数のセンサから発する信号をサンプリングして、文字のトレースの進展(evolution)過程を決定している。
【0006】
例えば、本出願人名義の文献番号EP0695979号は、特に時計用に、面上でトレースされた文字を識別するためのデバイス、ならびにこのような文字を識別するプロセスを開示している。この文書によれば、入力ゾーンを形成するセンサの状態(“オン”または“オフ”)の変化を表す連続した識別体を生成し、これを少なくとも1組の連続した基準識別体と比較して、トレースされた文字を識別する。
【0007】
いくつかの文字は複雑であり著しく類似するので、現在、文字セットにおいていくつかの簡略化(例えば、特に“O”と“0”、“B”と“8”、“+”と“T”などいくつかの文字間の混同を避けるために文字を異なる英字、数字、記号文字などのセットに細分する)を採用して、きっちり決められた手順に従ってユーザに文字をトレースさせることが通例となっている。しかし、この手順はユーザの通常のやり方に反することがあり、さらにはどんな通常のやり方にも反することがある。このため既存のソリューションでは、他の文字と混同されないように各文字をトレースする可能な方法は1つしかないことが多い。さらに、採用すべき手順は、所望の文字の自然なトレースに必ずしも対応しない。筆跡の特長には大きなばらつきがあり、さらには例えば右利きの人と左利きの人の筆跡では完全に逆なこともあるので、これらの困難はさらに大きい。
【0008】
同様の制約を伴う文字認識デバイスの他の例が、文献番号US4047010A、US4199751A、GB2092352A、およびWO90/15399号にも開示されている。
【0009】
したがって、これらの既知の認識デバイスおよびアルゴリズムは、ユーザ側の学習を必要とするか、ユーザに対する制約を含む。この学習が不完全な場合または制約が守られない場合は、所望のテキストが入力されたときにエラーが生じる可能性があり、このエラーにより、データ入力に要する時間が長くなる。
【0010】
別のソリューションが文献番号FR2538581号に開示されている。この別のソリューションによれば、文字が入力ゾーン上でトレースされるときに行われる各ストロークを複数の直線セグメントに分解し、これらの各セグメントの配向を複数(8個)の基準ベクトルに対して決定する。それにより、所定の直線セグメント・セットで形成されるこのトレース文字のモデルを作り、次いで、対応する基準文字セットと比較する。文献番号FR2538581号によれば、このソリューションは、腕時計に似た形のポータブル・オブジェクト中で実施するのが有益である。
【0011】
文献番号EP0632401号は、直線セグメントで形成されるモデルだけでなく他のパラメータを考慮したモデルにも基づいて各文字をモデリングすることを提案している。他のパラメータとしては、入力ゾーン上で筆記具が上がる動作(ペン・アップ)や下がる動作(ペン・ダウン)、トレース中の一時停止期間、トレースの重心、トレースのサイズ、曲線セグメントの回転方向、曲線セグメントの開始点および終了点の位置、このような曲線セグメントの配向などがある。この文書では、このようなソリューションを“連想”メモリと呼ばれる特定のメモリ・タイプを使用して並列プロセッサ・システム中に実装することが教示されている。当然ながら、このような並列プロセッサ構造は、特にデータ処理能力が限られているポータブル電子デバイスへの適用には考えられない。
【0012】
文献番号FR2538581号と文献番号EP0632401号で提案されているソリューションは共に、幾何学的考慮に依拠して文字を認識するものであることに留意されたい。このことは、所与の筆記文字についての可能性あるすべての異型を幾何学的パラメータでモデリングするのは実際的でないという点で、大きな欠点である。実際、筆跡は人によって、さらには1人の人間でも、大きなばらつきがある。したがって、人について大きなばらつきがある場合に、文字のトレースの配向、サイズ、位置、長さ、またはその他の幾何学的パラメータを使用して真に信頼できる確実な文字認識を実施することはできない。
【0013】
【特許文献1】EP0695979
【特許文献2】US4047010A
【特許文献3】US4199751A
【特許文献4】GB2092352A
【特許文献5】WO90/15399
【特許文献6】FR2538581
【特許文献7】EP0632401
【特許文献8】EP0674247
【特許文献9】EP0838737
【0014】
本発明の第1の目的は、ユーザ側のいわゆる学習を何ら必要としないソリューション、すなわち、ユーザが通常のやり方をほとんど変更する必要がなくても、ユーザによってトレースされた文字を認識することのできるソリューションを提案することである。
【0015】
本発明の別の目的は、ユーザによって様々な書き方でトレースされた英数字、記号文字、制御文字、またはその他の文字を認識することのできるソリューションを提案することである。
【0016】
本発明の別の目的は、しかしながら複雑すぎず、実施のための要求が厳しすぎないソリューションであって、それにより電子日記帳、ポケット・コンピュータ、時計、ポータブル電話機、リモート・コントロール、またはその他任意の小サイズのポータブル電子デバイス、特に電池式ポータブル電子デバイスなどの小型電子デバイスに適用することのできるソリューションを提案することである。
【0017】
本発明の別の目的は、トレースされた文字を解釈する際のエラー数を制限すること、すなわち、どのような方式でも所定の文字に対応しないある種の文字トレースを拒否することのできるソリューションを提案することである。
【0018】
したがって本発明は、電子デバイスの入力ゾーン上で手動トレースされた文字を認識する方法に関し、この特徴を独立請求項1に列挙する。
【0019】
この方法の有利な実施態様は、従属請求項の主題を形成する。
【0020】
本発明はまた、本発明による方法を実施するための電子デバイスに関し、この特徴を独立請求項10に列挙する。
【0021】
このデバイスの有利な実施態様、従属請求項の主題を形成する。
【0022】
本発明の利点の1つは、文字が文字自体としてモデリングされるのではなく、文字がトレースされる仕方を表す少なくとも1つの所定のモデルで各文字が定義されることにある。同様に、入力ゾーン上でユーザによって手動トレースされた文字も、その文字がトレースされた仕方を表すモデルで表される。典型的には、1つの文字は、それを手動トレースできる様々な方法を考慮に入れるために複数のモデルで定義されることになる。
【0023】
より具体的には、本発明によれば、モデルは少なくとも、文字のトポロジーに関するトポロジカル・パラメータを含む。すなわち具体的には以下のものである。
− 文字をトレースするのに使用されるストロークの数、
− これらの各ストロークの性質、すなわち1次元的性質のストローク(点)か2次元的性質のストローク(1つまたは複数のセグメント)か、
− 2次元的性質の各ストロークの構成、すなわち
− 2次元的性質のストロークを形成するセグメントの数および
− 各セグメントの性質、すなわち直線的性質のセグメントか、曲線的性質のセグメントか。
【0024】
有利には、トポロジカル・パラメータは、文字トレースのストロークの“閉じた”性質(例えば文字“B”、“D”、“O”、“8”、“0”など)または“開いた”性質(例えば文字“A”、“C”、“E”など)に関する指示によって完全なものにすることができる。
【0025】
本記述の範囲内で“トポロジー”は、文字のサイズおよび正確な寸法から独立した、すなわち文字の正確な幾何形状から独立した、文字のすべての特徴を意味する。具体的には、本発明の範囲内で、これは前述のように、文字をトレースするのに使用されるストロークの数ならびにその性質を意味し、適切ならこれらの各ストロークの構成も意味する。また後述するように、曲線セグメントの回転方向など他のパラメータも意味する。
【0026】
本記述の範囲内で“ストローク”は、入力ゾーン上で指またはトレース器具によって開始から中断まで行われるトレースを意味する。各文字は様々な数のストロークでトレースすることができ、ラテン文字セットの英数字または記号文字の場合は、通常は4つ以下である。
【0027】
“セグメント”は、その直線的または曲線的性質によって、かつ/あるいは当該のストロークの実行中に指またはトレース器具が採用する大きな方向変化によって、ストロークの別のセグメントから区別されるストローク部分を意味する。
【0028】
モデルはさらに、直線的または曲線的性質の各セグメントに対して、セグメントのトレースの角度配向の進展(evolution)を表す幾何学的パラメータも適宜含む。セグメントのトレースの角度配向の進展を表す幾何学的パラメータは、以下のものを含むことが好ましい。
− 直線的性質の各セグメントに対して、セグメントの角度配向(Φで示す)、または
− 曲線的性質の各セグメントに対して、セグメントの一端(この位置をそれぞれP1、P2で示す)の開始角度配向または終了角度配向(それぞれΦ1、Φ2で示す)。
【0029】
“角度配向”は、図12および13a〜13cに概略的に示すように、直線セグメントの方向と向き、または曲線セグメントの1点でとられた接線の方向と向き、それらは角度値で示される、を意味することを指定しておく。以下の記述では、説明のみの目的であるが、セグメントまたは接線の角度配向は−180°と180°の値の間で構成されるものと定義されることが好ましい。ただし、これらの値がn360°内(nは整数)と定義され、したがって−180°および180°が同じ角度配向を示すことを理解されたい。
【0030】
開始角度配向または終了角度配向は、曲線セグメントの一端における接線の角度配向に対応し、この接線は少なくとも、当該のセグメントのトレースの最初の2つのサンプルまたは最後の2つのサンプルで定義されることをここで指定しておく。実際は、開始または終了における曲線セグメントのトレースの連続するいくつかのサンプルにわたる平均値を使用して、この開始角度配向または終了角度配向の値を決定することになる。
【0031】
前述の場合、文字のトポロジーに関するパラメータはさらに、各曲線セグメントに対して、セグメントの回転方向(wで示す)も含む。この回転方向は少なくとも、トリゴノメトリック(反時計回り)またはノントリゴノメトリック(時計回り)である。
【0032】
このような場合、トリゴノメトリックまたはノントリゴノメトリックの回転方向に加えて、第3のいわゆる混合または可変の回転方向を定義するのも有用なことがある。すなわち、トリゴノメトリックの回転方向とノントリゴノメトリックの回転方向との間で変化する回転方向である。例えばこのような特徴は、文字“N”、“M”、“W”、“S”、“2”、“5”、“8”等のトレースなど、いくつかの文字トレースに存在する。あるいは、このような混合回転方向の曲線セグメントを、トリゴノメトリックまたはノントリゴノメトリックの回転方向を有する複数の曲線セグメントに分割することもできることは明らかである。
【0033】
セグメントの角度配向の進展を表す幾何学的パラメータは、曲線セグメントに対して、その曲線セグメントの総展開(total development)角度(αで示す)を含ませることが望ましい。混合回転方向の曲線セグメントの場合、この総展開角度は、トリゴノメトリックまたはノントリゴノメトリックの回転方向を有する各部分の総展開角度の合計として絶対値で定義することが好ましい。この総展開角度αにより、いくつかの特定の文字の識別が簡単になる。
【0034】
文字トレースの角度配向の進展を表す幾何学的パラメータに加えて、各モデルはさらに、入力ゾーン上の各ストロークの位置を表す幾何学的パラメータも含む。これは具体的には、1次元的性質の各ストロークの位置(点)、または2次元的性質の各ストロークの端の位置を表すのが有利である。有利には、これらの幾何学的パラメータは、2次元的性質のストロークを構成する各セグメントの端の位置によって完全なものにすることができる。
【0035】
1次元的性質のストロークの位置、または2次元的性質のストロークの端の位置を、ストロークが行われる入力ゾーンに対して決めることができ、あるいは、当該の文字のトレースに対して定義することができることは明らかである。一般に、本発明の範囲内で、文字のトレースに対する相対的な位置指示を用いる。すなわち、任意のストロークが文字のトレースの上部にあるか下部にあるか、および/または右側にあるか左側にあるかを定義するための位置指示を用いる。例外として、入力ゾーン上におけるトレースの位置だけを異にする文字を区別するために、ある種の文字(例えば“/”“,”、“’”)の場合は、ストロークがトレースされた入力ゾーンに対する相対的な位置指示を用いる。
【0036】
また、必ずしもすべてのモデルがその特徴の幾何学的決定を必要とするわけではないことも明らかである。したがって、いくつかの文字はトポロジカル・パラメータだけで明確に定義することができる。
【0037】
図11、12、13a、13b、13cに以上の定義を概略的に示す。具体的には、図11は、1次元的なストロークすなわち点の例示であり、その位置P0で定義される。図12は、直線的性質のセグメントの例示であり、その角度配向Φとその端の位置P1、P2で定義される。図13a、13b、13cは、曲線的性質のセグメントの例示であり、それぞれセグメントの端における開始と終了の角度配向Φ1、Φ2と、端の位置P1、P2と、図13a〜13cそれぞれのノントリゴノメトリック、トリゴノメトリック、混合の回転方向wとで定義される。
【0038】
図13a、13b、13cには、各曲線セグメントの総展開角度αも示されている。図13cで、総展開角度αはこの場合、曲線セグメントのトリゴノメトリック部分およびノントリゴノメトリック部分のα1、α2で示される総展開角度の合計の絶対値として定義されることに留意されたい。
【0039】
例えば、上から下にトレースされる垂直な直線セグメントは−90°の角度配向Φを有するものとして定義され、下から上にトレースされる垂直な直線セグメントは+90°の角度配向Φを有するものとして定義される。左から右にトレースされる直線セグメントは角度配向0°を有するものとして定義され、右から左にトレースされる直線セグメントは角度配向±180°を有するものとして定義される。前述のように、これらの角度配向はn360°内に定義される。
【0040】
同様に、上から下にまたは下から上にトレースされた“C”を表す曲線セグメント(回転方向wはトリゴノメトリックまたはノントリゴノメトリック)は、単なる例だが約±180°の開始角度配向Φ1および約0°の終了角度配向Φ2を有するものとして定義される(総展開角度αは180°)。この2つの曲線セグメントは、その回転方向が異なるだけである。
【0041】
入力ゾーン上で手動で行われたトレースを分析する間、角度の概念に関する使用される定義および360°周期性を考慮して、±180°での中断を防止するために各セグメントの角度配向は“展開”されることが好ましい。例えば、文字“C”のトレースに類似する曲線トレースが、トリゴノメトリックの方向(上から下)に行われ、約170°の開始角度配向および約0°の終了角度配向を有するとする。セグメントの角度配向は、170°から360°に展開されることになる(総展開角度αは190°)。同様の、例えば角度配向−170°で開始し角度配向0°で終了する曲線トレースの場合、セグメントの角度配向は−170°から0°に展開されることになり(総展開角度αは170°)、その他も同様になる。
【0042】
この2つのトレース例を、トリゴノメトリック・タイプの回転方向wを有し±180°と0°の開始角度配向と終了角度配向をそれぞれ有するものとして定義された文字“C”のモデルと比較することにより、この2つの例は、360°の周期性を考慮した場合に角度配向からみて10°の偏差があることになる。
【0043】
上から下にトレースされる文字“S”を表す曲線セグメントは、例えば、ほぼ±180°に等しい開始と終了の角度配向Φ1、Φ2を有し、混合または可変の回転方向を有するものとして定義することができる(総展開角度αは絶対値で約180°+180°=360°である)。あるいは前述のように、この曲線セグメントは、連続する2つの曲線セグメントに分解することもでき、それぞれトリゴノメトリックおよびノントリゴノメトリックの回転方向である(それぞれ総展開角度αは180°である)。
【0044】
本発明によれば、トポロジカルな基準、すなわち文字の正確な形状および寸法から独立した基準を使用することで、トレースされた文字に対応する可能性の高い候補をソートして有意に事前選択することができ、この段階では必ずしも幾何学的状態の考慮に依拠する必要はない。実際、文字をトレースするのに使用されたストロークの数、ならびにその性質および構成を調べるという単純な事実はすでに、トレースされた文字を識別するのに必要な調査の範囲をかなり限定する。直線セグメントと曲線セグメントを区別することで、候補の事前選択をより正確にすることができる。場合によっては、トレースされた文字をこれらのトポロジカルな基準だけに基づいて明確に識別することさえ可能である。以下で詳細にわかるであろうが、この可能性は特に、いくつかの特定の制御文字を識別するのにも用いることができる。
【0045】
幾何学的な基準、すなわちセグメントの角度配向およびもし適切であるなら点またはセグメントの位置は、その後で、無効な候補を除去するためだけに適用する。具体的には、本発明によれば、トレースされた文字を形成するセグメントの角度配向をまず候補のセグメントの角度配向と比較し、これに基づいて最も類似する候補を選択することが好ましい。この選択によっていくつかの候補のセットが得られた場合は、トレースされた文字のストローク位置データ(すなわち1次元ストロークの位置、および/または2次元ストロークを表す少なくとも1つの点の位置)を使用して、最良の候補を識別する。
【0046】
したがって本発明によれば、多数の文字(小文字を数えずに少なくとも80個の文字)、および同じ文字についての多数の異型をモデリングすることが可能であり、それによりユーザ側の学習が限定され、この方法を実装しているデバイスの使用が容易になる。さらに、本発明による認識方法の実装によって得られる認識率は非常に高く、したがって誤ったデータを入力するリスクが限定される。また、新しいモデルの追加は極めて容易であり、定義されるモデルがいくつあっても、またどんなに複雑でも、使用される手法は適用可能である。
【0047】
本発明の別の利点は、右利きおよび/または左利きの人に特有の筆跡特徴を考慮することができることである。
【0048】
本発明の他の特徴および利点は、非限定的な例によって提供する添付の図面に関して行う後続の詳細な説明を読めばよりはっきりするであろう。
【0049】
本発明による認識デバイスを、特定の適用例、すなわち時計における適用例の範囲内で述べる。ただし本発明は、指またはトレース器具でデータを入力することが望まれるその他の任意の電子デバイスにも等しく適用されることを理解されたい。また、認識デバイスの入力ゾーンの性質および構成は決定的なものではないことも理解されたい。したがって、本記述の範囲内で入力ゾーンは容量性タイプのセンサを含むものとして定義するが、光学、オーム、誘導センサ、表面弾性波伝搬センサ(SAW)など他の任意のタイプのセンサや、指またはトレース器具でアクティブ化することができ、入力ゾーン上で行われたトレースに関するトポロジー・データおよび幾何学的データを抽出するのに使用できる信号を生成することのできる他の任意のタイプのセンサも使用できることは、容易に理解されるであろう。
【0050】
図1に、ケース2およびガラス3を備える時計1の横断面図を示す。電子回路4がケース2中に配置されている。好ましくは透明である導電性電極が、ガラス3の内面31上に配置されており、図1にはこれらの電極のうち4つだけ(それぞれ15B、15F、15J、15Nで参照する)を示す。前述のように、このセンサ配置は決して限定的なものではない。
【0051】
導線6、7、8、9がそれぞれ、導電性電極15B、15F,15J、15Nを電子回路4に接続する。ケース2中には、電池11またはその他の電気エネルギー源(充電式蓄電池など)も配置され、導線12によって電子回路4の供給端子に接続される。
【0052】
導電性電極15B、15F、15J、15N(図2の15A〜15P)はそれぞれ、参照符号15で全体として示す一連の容量性センサの一方の端子を形成する。これらの各容量性センサ15の他方の端子は、時計1を使用している人が特定の電極に向かい合うガラス3の外面に触れたときに、この人の指13で形成される。これらの容量性センサ15は、共に入力ゾーン10を形成し、この場合ではユーザの指13によるデータ入力を可能にする。この指13は、ケース2を介して電子回路4の接地に接続される。ケース2はユーザの腕に接触しており、この接地は通常、電池11の負端子および電子回路4に接続される。
【0053】
図2に、容量性センサ15の例示的な空間構成の平面図を示す。本容量性センサ15は、15A〜15Pで示す導電性電極を含み、認識デバイスの入力ゾーン10を形成している。この入力ゾーン10はこの例で複数のセンサ15を含むが、この場合では16個あり、図示のように4×4のマトリックスの形に構成される。
【0054】
構造上、各導電性電極15A〜15Pと時計1のケース2との間に浮遊容量が存在することにも留意されたい。導電性電極がその一部を形成する各容量性センサ15と、容量性センサに関連する浮遊容量とは、電子回路4の接地と入力の間で並列接続される。
【0055】
容量性センサと共に使用するのに適した、電子回路4の検出手段について次に述べる。この検出手段は、非限定的な例示としてのみ述べるものである。
【0056】
やはり本出願人名義である特許文献番号EP0674247号およびEP0838737号と、プリアンブルですでに述べた特許文献番号EP0695979号を参照すれば、電子回路4の構成に関する詳細な情報を得ることができる。この3つをすべて参照により本明細書に組み込む。ここでは単に、各容量性センサおよび並列で存在する浮遊容量が電圧制御発振器の入力に接続され、この発振器の周波数がその入力と接地の間に存在する総静電容量に応じて変動すると言っておく。各容量性センサをそれ自体の電圧制御発振器に接続することもでき、あるいはマルチプレクサを介してすべての容量性センサを単一の電圧制御発振器に接続することもできることに留意されたい。当然、マルチプレクサを使用する場合は、その多重化期間を入力ゾーン上での指またはトレース器具の動きや信号サンプリング期間よりもずっと短くし、各センサから発する信号がいかなる瞬間においてもセンサ状態の同時の測定値と考えられるようにする必要がある。
【0057】
より具体的には、電圧制御発振器の出力で生成される信号の発振周波数は、並列接続された2つのコンデンサの総容量の逆数に比例する。時計1のユーザの指13が特定の電極に面したガラス3上に置かれていない場合は、容量性センサに対応する一方の端子が形成されない。この場合、発振器の入力と接地の間に存在する総静電容量は浮遊容量の値と同値であり、電圧制御発振器の出力信号の発振周波数はその逆数に比例する。
【0058】
反対に、指13が特定の電極に面したガラス3上に置かれているときは、総静電容量はこの指の存在に影響を受ける。このため、電圧制御発振器の出力信号の発振周波数は、静電容量合計の逆数に比例する。さらに、指13の存在によって生じる周波数変動は指13でカバーされる電極の表面に依存することにも留意されたい。したがって、電極に面した指13の有無を検出することができるだけでなく、指13でカバーされる電極のカバー程度も検出することができる。
【0059】
出力信号中の所望のデータは、電圧制御発振器によって生成される信号の周波数に含まれる。このため、単にこのようなデータを抽出するように設計されたディジタル手段を使用すればよい。したがって例えば、所定期間中の出力信号のゼロ交差数(またはパルス数)を反映させて、様々なセンサから必要なデータを抽出することができる。
【0060】
入力ゾーン上で行われる手動トレースの正確な画像を得るために十分なだけの入力ゾーンの解像度、すなわちセンサの数があれば、センサのカバー程度に応じた周波数変動を調べるのを省略して、単に各センサのアクティブ度または非アクティブ度の状態を調べるだけでもよいことを理解されたい。入力ゾーンの解像度はまた、使用されるトレース器具およびそれが入力ゾーンと接する接触面にも依存し、指の接触ゾーンは、例えばスタイラスの接触ゾーンよりは明らかに広い。図2(および図5)に示す構成は、トレース器具として指を使用できるようにするのに特に適しており、各センサは、指の通常の接触面サイズよりも小さい約1cm2の表面を有する。
【0061】
補足すれば、時計に、またはより一般的に本発明による認識デバイスを組み込んだ電子デバイスに、入力ゾーン10上で行われたトレースの指示をユーザに提供するための表示手段(図1には示さず)を設けることが有利であろう。例えば液晶表示装置で形成されるこのような表示手段を図1の時計に配置すると、認識デバイスの使用を容易にすることができるので有利である。ユーザは、入力ゾーン10の方を向いて直接見える確認データから利益を得ることができる。
【0062】
図3に、容量性センサのアレイを使用する、本発明による文字認識デバイスの特定のブロック図を示す。この図は単に例示的なものである。図3には、入力ゾーン10とこの入力ゾーン10に関連する電子回路4が概略的に示してある。参照番号5で大域的に示す表示手段も示してある。この表示手段は、表示制御回路50と液晶表示装置などの表示デバイス55を備える。後者は通常、文字の複数の線を表示するドット・マトリックス表示装置の形をとり、適切なら入力ゾーン10上で行われた手動トレースの画像を表示する。
【0063】
入力ゾーン10およびその容量性センサは、1つ(多重化によって)または複数の電圧制御発振器41に接続され、電圧制御発振器41は出力で、tkで示す所与の瞬間に周波数信号fij(tk)を出力する。添え字iおよびjは、入力ゾーン10を形成するアレイ中のセンサの位置を示す。電圧制御発振器41の出力に接続された周波数検出器42が、各センサごとに生成される信号の周波数を、例えば所定の測定期間中のこの信号のゼロ交差数を決定することによって決定する。この各センサごとのゼロ交差数を参照Nij(tk)で示す。周波数検出器42は通常、クロック手段43で生成されるクロック信号を受け取る。クロック信号は、各センサごとに生成される信号の周波数を決定するための測定期間を決める。これらの同じクロック手段43が、文字がトレースされているときに入力ゾーン10のセンサによって生成される信号のサンプリング周波数を決定する第2のクロック信号を生成する。
【0064】
瞬間tkで入力ゾーン10の各センサごとに生成される信号の周波数を表す数Nij(tk)は、マイクロコントローラ45に送られる。マイクロコントローラ45は、文字トレースの獲得信号を処理して文字を認識することを担う。この目的でマイクロコントローラ45は、揮発性メモリ(RAM)、読出し専用メモリ(ROM)、および/または再プログラム可能メモリ(EEPROM)を通常含む記憶手段46に記憶されたデータを利用する。マイクロコントローラ45によって利用されるデータには、英数字、記号文字、および制御文字の様々なモデルに関係するデータなどが含まれ、このデータは、図3に概略的に示すように文字ライブラリ460の形で記憶される。
【0065】
英数字テキストの入力(この例では“HELLO”という語の入力)も示されている。有利なことに各文字は、入力ゾーン10を使用して連続的に入力され、後で詳述するプロセスに従ってマイクロコントローラ45によって認識される。文字が入力ゾーン上でトレースされている間、a)で示すように、入力ゾーン10上で行われた100で示す文字の手動トレース(ここでは文字“O”)が表示装置55上に表示されて、行われたトレースをユーザが確認できることが好ましい。認識プロセスの最後に、文字は妥当性検査され(または適宜拒否され)、(図3のb)に示すように表示デバイス55上に表示される。
【0066】
次に、図4〜10を参照しながら文字認識デバイスの動作についてより詳細に述べる。
【0067】
図4a〜4dに、本発明の範囲内で、様々な英数字、記号文字、および制御文字を典型的には入力ゾーン10上でトレースするのに使用できる様々な方式を表すモデルのセットを、概略的かつ部分的に示す。図示のセットは決して網羅的でも限定的でもなく、他のトレースも容易に考えることができることを強調しておく。したがって特に、“B”、“D”、“E”、“F”、“M”、“N”、“P”“R”など多数の英字のトレースは、上から下にトレースされる第1の垂直セグメントで開始することができ、これを、これらの各文字に面して角括弧中に示す下向きの垂直セグメントで概略的に示す。
【0068】
図4aおよび4bには、特に英字のモデルを示し、図4cには、数字および記号文字のモデルを示し、図4dには、制御文字のモデルを示す。これらの図すべてにおいて、文字をトレースするのに必要なA〜Dで示す異なるストロークを異なる色または異なるパターンで示す。具体的には、図4aの凡例に示すように、第1のストロークAを黒で示し、第2のストロークBをグレーで示し、第3のストロークCを白で示し、第4のストロークDをハッチングで示す。各ストローク中の矢印はストロークがトレースされる方向を示し、逆向きの2つの矢印は当該のストロークを一方向でも他方向でもどちらへでもトレースできることを示す。
【0069】
図4a〜4dに示す文字セットを検討すると、ユーザに対して学習またはいくつかの制約を要する文字の数が大幅に減少しているのに気付くであろう。例えば、開括弧および閉括弧“(”と“)”は、1次元的性質の追加のストロークでモデリングされ、文字“スペース”は、ほぼ同じ高さで行われる2つの1次元的性質のストロークでモデリングされている。残りについては、文字はその通常の自然なトレースにできるだけ近くモデリングされている。
【0070】
一般に、ほとんどの文字が、この例で1つ、2つ、さらには4つのストロークで行われることに留意されたい。文字“E”、ならびに記号文字“#”および“*”は、例えば、直線セグメントでそれぞれ形成される4つのストロークでトレースすることができる。なお、トポロジカルな基準だけを第1に考慮する場合、文字“E”、“#”、“*”の3つはすべて、類似のトポロジカルな定義、すなわち単一の直線セグメントでそれぞれ形成される4つのストロークのセットを有する。これらを区別するには、直線セグメントの角度配向を比較する必要があり、文字“#”および“*”に対する文字“E”の特徴の1つは、水平な3つの直線セグメントがあることである。
【0071】
本発明によれば、まず様々なモデルをストローク数に従ってグループ化することが好ましい。次いで、これらの各範疇を、ストロークの性質と構成に従って細分する。1次元ストローク(点)の場合、モデルはこの1次元ストロークの位置に関する幾何学的パラメータも含むことが好ましい。2次元ストローク(1つまたは複数のセグメント)の場合、モデルは、各セグメントの角度配向に関する幾何学的パラメータと、各曲線セグメントについての、曲線セグメントの回転方向(トリゴノメトリック、ノントリゴノメトリック、または混合)に関する少なくとも1つのトポロジカル・パラメータも含むことが好ましい。したがって、特定の文字モデルに至ることのできる木構造が形成される。
【0072】
入力ゾーン上でユーザによって行われたトレースが所定のストローク数を超える場合は、通常、このトレースが英数字、記号文字、制御文字に対応せず、未定義文字に対応すると見なすことができる。例えば、ラテン文字セットには通常、4つよりも多くのストロークで自然に行われる文字はない。同様に、所定の限度よりも多いいくつかのセグメントで形成されるストロークを含む文字のトレースは、未定義文字に対応すると見なすか、または有利には特定の制御文字に対応すると見なすことができる。例えば、明確なトポロジカルな定義を有するいくつかの特定の制御文字、すなわち幾何学的パラメータを認識する必要のない文字を定義することが可能である。したがって例えば、図4dの右側に示すように、例えば5つよりも多い連続的なセグメントを含む単一のストロークで形成されるモデルで第1の特定の制御文字を定義することができ、あるいは、5つよりも多い連続的なセグメントを含む第1のストロークと、それに続く、点を含む第2のストロークとによって第2の特定の制御モデルを定義することができるので有利である。
【0073】
本発明によれば、有利なことに、1次元的または2次元的性質の各ストローク間が区別される。この場合、より小さいサイズのゾーン中に含まれる非常に局所化されたトレースが検出されれば、1つのセグメントまたは連続するいくつかの(直線または曲線の)セグメントから点を素早く区別することができる。ある程度までは、点に対応すると認識されるストロークが現れればすぐに、トレースされる文字の調査領域を素早く縮小することができる。この特徴はより少数の文字にしか存在しない。これらは基本的には句読点、記号文字、または制御文字である。
【0074】
同様に、直線的または曲線的性質のセグメント間を区別することにより、類似の特徴を有するモデルだけを選択することで調査領域を素早く縮小することができる。この選択は、トレースされた文字が曲線的性質のセグメントを有する場合に、適切なら各曲線セグメントの回転方向を考慮することによってさらに正確にすることができる。
【0075】
本発明により提案する手法の効率には容易に気付くであろう。実際、トポロジカルな基準により、すべての文字をより少数のデータで効率的に、しばしば明確にモデリングすることができる。後でわかるであろうが、角度配向の進展の幾何学的パラメータおよび適切なら位置の幾何学的パラメータは、残った候補を区別するために最後に使用するだけである。
【0076】
したがって本発明の第1の態様では、ユーザがトレースすることのできる各文字についてのモデルのセットまたはカタログを形成する必要がある。各モデルは、当該の文字をトレースする少なくとも1つの方法を表し、例えばこのようなセットは図4a〜4dに示すものである。複数の文字セットを定義することもできることに留意されたい。したがって、例えば類似するトポロジーを有する文字間における解釈エラーのリスクを低減するために、英字、数字、および記号文字について別個の文字セットを生み出すことを考えることができる。
【0077】
本発明の別の態様によれば、入力ゾーンを形成する様々なセンサによって生成される信号を処理して、トレースされた文字のモデルを形成するためのデータを抽出する必要もあり、このトレースされた文字もまた、そのトポロジーおよび幾何形状に関するデータまたはパラメータを含む。したがって通常、この文字をトレースするのに必要な全期間中に、この文字をサンプリングする。
【0078】
図2のセンサの構成を図5に示す。例として、指13で行われた、文字“A”を表す100で示す手動トレースが、2つの矢印で表されている。このトレースを辿ることにより、例えば、指13が最初にAで示す第1のストロークを行って文字の第1部分すなわち文字“A”のくぼんだ形状の部分(ここでは曲線の逆U字セグメントの形状)を形成し、次いでBで示す第2のストロークを行って文字“A”のほぼ水平の棒のトレースを形成したことがわかる。この例は、右利きの人による文字“A”の自然かつ典型的なトレースに対応する。ただし、この同じ文字を他の方式でトレースすることもできることに留意されたい。例えば、逆V字型の第1のストロークを行ってから水平の直線セグメントで形成される第2のストロークを行うか、または図4aに示すような3つのストロークを行うことである。
【0079】
入力ゾーンのタイプと、この入力ゾーンを形成するセンサの数および性質に応じて、認識に必要なデータを抽出する前に信号の前処理を行うことが必要な場合もあり、必要でない場合もある。本記述の範囲内で例示的に用いる非限定的な例では、入力ゾーンは、4×4マトリックスの別々の容量性センサで形成され、各センサは、(前述のように)電圧制御発振器に接続され、指による各センサのカバー程度に応じて周波数の変動する電気信号を生成する。図5に示す例では、センサのサイズを考慮すると、各センサがアクティブ化されているかどうかだけを単純に調べることは明らかに不可能である。したがって、指によるセンサのカバー程度に対する出力信号の周波数の依存を用いて、入力ゾーン上の指の位置をより正確に決定することが好ましい。
【0080】
通常、入力ゾーンの寸法を考慮すると、いくつかのセンサが同時にアクティブ化されることになる。このため、これらのアクティブ化された各センサごとに、アクティブ化されたセンサの重心または共通重心(barycentre)を計算することによって入力ゾーン上の指の平均位置をリアルタイムで決定する。好ましくは、指によるセンサのカバー程度に応じて、より多いまたは少ない重みが各センサにあるものとする。この重みは、指がセンサの面全体をカバーしているときは最大値であり、センサのわずかな部分だけをカバーしているときは最小値である。
【0081】
文字をサンプリングした後、さらに信号を処理すること、特に、このようなデータの入力中に通常みられる雑音をフィルタリングすることが必要な場合もあり、必要でない場合もある。具体的には、文字の本質的な特徴は当然変えずに、フィルタリングおよび平滑化技法を適用して、雑音をほぼ除去し文字のトレースを平滑化することが好ましい。これらの様々なフィルタリングおよび平滑化技法は、当業者には十分周知かつ理解の範囲内であり、ここでは詳細に述べない。
【0082】
サンプリング後、および適切なら信号処理の前に、まずユーザが文字をトレースするのに用いたストロークの数をすべて検出しなければならない。このストローク数は、文字をトレースする間の中断数、すなわちどのセンサも指の存在によってアクティブ化されなかった所定期間(通常は連続するいくつかの非アクティブ期間)の出現を検出することによって容易に決定される。文字トレースの終了も同様にして検出されるが、これはより長い非アクティブ期間に基づいて決定される。次いで、ストローク数に基づいて第1の候補を選択することができる。
【0083】
次いで、各ストロークの一般的性質、すなわち特にストロークが1次元的性質(点)か2次元的性質(1つまたは複数のセグメント)かを決定しなければならない。これもまた、所与のストロークに関するサンプルのセットが所定のより小さいゾーンに集中するかどうかを調べることによって容易に決定される。集中する場合は、それが点のトレースであるという原理から開始し、P0で示されるその位置を決定する。サンプルのセットがより広いゾーンにわたって延びる場合は、セグメント化ステップと呼ぶことのできるステップに進む。このステップは、各ストロークを調べて、そのストロークを構成するセグメントの数、これらのセグメントの直線的または曲線的性質、およびこれらの幾何形状(角度配向および位置)を決定することを含む。
【0084】
このセグメント化を行うために、各ストロークのトレースの角度配向の進展を調べ、特にこの角度配向の急激な変化または限界点を検出することが好ましい。これらの急激な変化は、別のセグメントの出現を示す。これは、トレースの導関数(展開されるセグメントの角度配向)を計算すること、より正確には、連続する2つの信号サンプルで形成される各基本セグメントの傾斜を計算することを含む。限界点は、連続する2つの基本セグメント間で角度配向の著しい違い(例えば90°などの所定限度よりも大きい)が出現したこととして容易に識別される。
【0085】
有利な変形として、指がうっかり上げられたことに関連するエラーを防止するために、同じ性質のセグメントの端が相互に近い場合はこれらのセグメントを共にグループ化することができる。また、指が置かれたときまたは上げられたときの重要でない小さな動きを考慮に入れないために、ストロークの最初と最後の短すぎるいくつかのセグメントは除くことも考えられる。
【0086】
各セグメントの直線的または曲線的性質は、例えば、当業者に知られている従来の最小自乗法による各セグメントの線形近似によって決定される。この線形近似モデルとの間の偏差が所定の偏差よりも大きい場合は、当該のセグメントが曲線的性質であるという原理から開始し、例えばこのセグメントの開始と終了の配向Φ1、Φ2を決定する。この場合、曲線セグメントの回転方向wも決定することが好ましい。そうでない場合は、このセグメントが直線的性質を有するという原理から開始し、その角度配向Φを決定する。また、P1およびP2で示される各セグメントの端点の位置を決定することに進むのが好ましい。
【0087】
次いで、トポロジカル・データに基づいて、かつ必要ならこのように決定した幾何学的データに基づいて、可能性ある候補のセットの中で文字を識別することに進む。
【0088】
したがって、図5のこの例示では、2つのストロークAおよびBが識別されることになる。これには第1に、約+90°の開始角度配向Φ1および約−90°の終了角度配向Φ2を含み厳密にノントリゴノメトリックの回転方向wを有する曲線的性質の単一のセグメントが含まれ、第2に、直線的性質の単一のセグメントが含まれる。第2のセグメントは、図5の例示における傾きを考慮すると、0°よりもわずかに大きい角度配向Φを含む。文字“A”のトレースの場合、通常はトポロジーおよび角度配向からみて類似する文字は他にないので、セグメントの端の位置データは有用でないことに留意されたい。
【0089】
図4a〜4dに例として定義する文字セットを検討すると、図5に示す文字“A”のトレースと同じトポロジーを有する文字、すなわち単一の曲線セグメントを構成する第1のストロークおよび単一の直線セグメントを構成する第2のストロークを有する文字は、文字“A”、“E”、“F”、“J”、“K”、“Q”、“Y”、“Z”、“0”、“4”、“7”に限定される。トポロジーからみたこの類似を、図4a〜4d中の当該のモデルを囲む枠で示してある。曲線セグメントの回転方向(ここではノントリゴノメトリック)を考慮すると、候補“E”、“K”、“Q”、“Y”、“Z”、“0”、“4”を除外することができる(右利きの人用の文字セットの特定の場合)。セグメントの角度配向を比較することにより、文字モデル“A”を除くすべての候補を明確に除去することができる。
【0090】
比較として、図6a〜6cに、文字“R”に関する3つの例示的トレースを示す。図6aには、2つのストロークによるトレースを示し、図6bおよび6cには、単一のストロークによるトレースを示す。これらの図はそれぞれ、入力ゾーン上でトレースされる文字の概略図と、標準化された期間にわたる各ストロークのトレースに対する接線の角度配向の進展を示す図とを示している。角度配向の急激な変化と同時に生じる限界点を図中の点で概略的に表す。この場合も、図6a〜6cは、文字“R”をトレースするために採用することのできる可能性を網羅するものではないことを強調しておく。
【0091】
図6aには、AおよびBでそれぞれ示す2つのストロークでトレースされる文字“R”を示す。第1のストロークAは、上から下にトレースされておりしたがって約−90°の角度配向Φを有する、ほぼ垂直の直線セグメントA1で形成される。第2のストロークBは、連続する2つのセグメントで形成されており、これらはそれぞれ曲線セグメントB1とそれに続く直線セグメントB2であり、両方とも上から下にトレースされている。曲線セグメントB1は、それぞれ0°に等しい値の開始角度配向Φ1と約−180°の終了角度配向Φ2を有し、回転方向はノントリゴノメトリックである。直線セグメントB2は、約−45°の角度配向Φを有する。“R”の最後の直線部分トレースの前にある曲線部分トレースの端で角度配向の急激な変動(−180°から−45°)がみられるので、2つのセグメントB1およびB2は容易に区別することができる。
【0092】
図6aの角度配向の進展の図を参照すると、ストロークAおよびその単一のセグメントA1は、約−90°に位置するほぼ水平な線に変換されるのがわかる。ストロークBは、第1近似で0°と約−180°の間の負の傾斜線部分に類似する、曲線セグメントB1に対応する第1部分と、それに続く、約−45°に位置し直線セグメントB2に対応するほぼ水平な線の部分とに変換される。この図から、セグメントB1とB2の間の角度配向の急激な変化がはっきりする。
【0093】
図6bには、単一のストロークAで行われる文字“R”のトレースを示す。すなわち、約+90°の直線セグメントA1と、それに続く0°から約−180°に変化する曲線セグメントA2と、最後の約−45°の直線セグメントA3である。したがって、ストロークAの角度配向の進展の図では、約+90°のほぼ水平な線の第1部分と、それに続く第1近似で0°と約−180°の間の負の傾斜線の第2部分と、最後の約−45°のほぼ水平な線の第3部分とがみられる。
【0094】
図6cには、単一のストロークAで文字“R”をトレースする別の可能性を示す。このストロークAは、約−90°の直線セグメントA1を含み、それに続いて、混合回転方向で+90°から約−45°に変化する曲線セグメントA2を含む。すなわち、角度配向がまず+90°から約−180°に減少した後で−180°から約−45°に増加する曲線である。この場合も、混合回転方向の曲線セグメントA2は、別法として、ノントリゴノメトリック方向になってからトリゴノメトリック方向になる連続的な2つの曲線セグメントに分解することもできることに留意されたい。
【0095】
次に、図7aおよび7bを用いて、本発明による文字認識方法の例示的な実施について述べる。図7aに、本発明の方法のこの実施形態を示すフローチャートの第1の部分を示し、図7bに、このフローチャートの第2の部分を示す。
【0096】
前述のようにこの方法は、トレースされた文字をステップS100でサンプリングすることで開始する。このサンプリングは、必要なら信号を前処理することを含む場合がある。
【0097】
ステップS102で、文字をトレースするために行われたストロークの数を決定する。この数により、ステップS104に概略的に示すように、同数のストロークを含む第1グループの候補を選択することができる。
【0098】
候補が選択された場合は(ステップS106)、ステップS108〜S120で概略的に示すように、各ストロークの性質および構成を決定することを開始する。そうでない場合は、図7bのフローチャートのステップS140およびS142で示すように、この文字が定義されていないという原理から開始し、このことをユーザに通知する。
【0099】
ステップS108で、まず各ストロークの1次元的または2次元的性質、すなわち点であるか連続するいくつかのセグメントであるかを決定する。ストロークが点である場合は、ステップ109で点の位置を決定する。そうでない場合は、ステップS110〜S118で示すように、当該のストロークをセグメント化することを開始する。これを、当該のストローク中にあるセグメントの分だけ繰り返す。
【0100】
したがってステップS110で、例えば前述のようにストロークの角度配向の急激な変化を決定することにより、ストロークを形成するセグメントの数を決定する。このステップで、セグメントの端の位置P1、P2の決定を行う。ステップS112で示すように、セグメント数が所定限度を超える場合は、認識プロセスをステップS140およびS142で中断することが有利である。これはトレースがどんな定義済み文字にも対応しないことを示す。そうでない場合は、ステップS114で、例えば各セグメントの線形近似、およびこの線形近似と当該セグメントのトレースとの間の偏差に応じた選択により、各セグメントの直線的または曲線的性質を決定する。セグメントの直線的または曲線的性質に応じて、ステップS115で直線セグメントの角度配向Φを決定し、あるいはステップS116で曲線セグメントの開始と終了の角度配向Φ1、Φ2を決定する。セグメントが曲線的性質の場合、トポロジカル・データは、ステップS117で概略的に示すように曲線セグメントの回転方向wを決定することによって完全なものになる。このプロセスを、ステップS118およびS120で示すように各セグメントおよび各ストロークについて繰り返す。
【0101】
これらのステップの最後には、トレースされた文字のモデルをステップS122で作るのに必要なデータがある。このモデルを使用して、潜在的候補を選択し、最終的にトレース文字を識別することができる。したがってステップS124で、ステップS104で決定した第1グループの候補の中から、トレース文字のモデルと同じ性質および構成のストロークを有する第2グループの候補を選択する。この段階では、モデルの幾何学的性質のデータ、すなわちセグメントの角度配向の進展または位置のパラメータを考慮する必要はない。
【0102】
この選択の最後に、ステップS126で、トレース文字が定義済みのモデルに対応するかどうか、あるいはこのモデルが未知であるかどうかを識別することができる。未知の場合は、第2グループは候補を含まない。
【0103】
第2グループが1つまたは複数の候補を含む場合は、ステップS128で、第2グループの候補の中から、角度配向からみた幾何形状がトレース文字のモデルに最も近い第3グループの候補を選択する。これを行うには、例えば各ストロークを形成するセグメント間で角度配向からみた偏差を決定し、最小の偏差を有する最良の候補を選択する。実際は、これらの角度配向に対していくらかの許容差が認められる(例えば±10°)。
【0104】
ステップS129で、角度配向からみた偏差が大きすぎる場合は、トレース文字が定義されていないことを意味し、この場合は候補を除外することができるのが有利である。次いでS140およびS142でプロセスを終了する。候補がトレース文字に十分近いと考えられる場合は、まずステップS130で、複数の候補がこの段階で選択されているかどうかを決定し、そうである場合は、ステップS132で、セグメントの位置(絶対または相対)からみた幾何形状がトレース文字のモデルに最も近い候補を第3グループから選択する。次いで、ステップS134でこの候補を妥当性検査する。ステップS130で第3グループが1つの候補しか含まない場合は、図示のようにステップS134でこの候補を直接に妥当性検査する。
【0105】
したがって、妥当性検査ステップS134の最後には、トレース文字が認識され妥当性検査されている。それにより、ステップS136、S137、S138に示すように、この文字が英数字(または記号文字)である場合はこれを表示することができ、制御文字である場合は関連するコマンドを実行することができる。
【0106】
図7aおよび7bに示したフローチャートは本発明の特定の実施形態を構成するに過ぎず、フローチャート中で上流または下流へ何らかのテストを再分配するなどの様々な修正、および/または改良を加えることもできることを理解されたい。したがって、図7aおよび7bのステップS112およびS129はそれぞれ、ストロークを形成するセグメントの数が所定限度を超える場合、または候補とトレース文字のモデルとの間の角度配向からみた偏差が限度値を超える場合に認識を中断するステップだが、これらのステップは省略することもできる。ただし、これらのステップによって文字の無駄な検索または誤った解釈を防止することができるので有利である。したがって、この文字認識方法は、誤った文字認識を防止し、それによりこの方法を実施するデバイスへの誤ったデータ入力を制限することに留意されたい。本発明によるこの方法はさらに、文字の手動トレースの正確な形状からかなり独立しており、認識は本質的に、トレースが行われるときのトレースの傾向に基づく。
【0107】
図8aおよび8bに示すように、図7aおよび7bに示した実施形態は、特定のコマンドに関連する特定の制御文字を識別するための追加のステップを含むように修正することができる。これらの特定の制御文字は、トポロジカルな性質のデータまたはパラメータによって明確に表現されることが望ましい。
【0108】
例えば、所定数(例えば少なくとも5つ)よりも多い連続的なセグメントを含むストロークのトレースは、図4dに示すような、特定のコマンド(例えば前に入力した文字の削除や、入力したデータの完全な再初期化)に関連する特定の制御文字と考えることができる。この方式でトレースできる文字は他にないので(ただしこのような方式で定義された文字がない限り)、セグメントの直線的または曲線的性質の決定に進む必要はなく、またセグメントの幾何学的パラメータの決定に進む必要もない。
【0109】
したがって図8aおよび8bを参照すると、1ストロークあたりのセグメント数を決定するステップS112の後に追加のステップS113を設けることができる。この追加のステップS113は、ステップS104で決定した第1グループの候補を特定の制御文字のセットに限定することを含み、この場合、ステップS114〜S116でセグメントの直線的または曲線的性質ならびにこのセグメントの幾何形状を決定することはしない。この場合、第2グループの候補を選択するステップS124の後にもう1つの追加ステップS125を設けて、候補が特定の制御文字に対応するかどうかを識別する。対応する場合は、ステップS138で、この特定の制御文字に関連するコマンドを直接に実行する。
【0110】
有利な変形により、十分に有意な長さを持たないセグメントをフィルタリングするための追加のステップを、図7a(または8a)のステップS118の後に設けることもできる。このようなセグメントは、ユーザ側の躊躇と考えることができる。
【0111】
また有利な変形により、文字のトレースまたは各ストロークの最初と最後の点のおよその相対位置を調べることにより、選択される候補のセットを限定することもできる。したがって、ストロークがそれぞれ開始するか終了するか、その開始または終了が文字のトレースの高い部分か低い部分か、および/または右側か左側かを定義する大まかな基準により、いくつかの文字を自動的に除外することができる。例えば、“L”が文字の低い部分で開始するトレースを有すると考えるのは非現実的である。
【0112】
また有利な変形により、文字のトレースのストロークが開いているか閉じているかを調べ、それにより、この基準に基づいて候補数を限定することもできる。当然、文字のモデルはこの方式で定義しておかなければならない。すなわち、ストロークが開いているか閉じているかの指示を含めなければならない。
【0113】
次に、再び図7aおよび7bを参照し、図9a、9b、および10a、10bをも参照しながら、文字トレースが行われるときに本発明による文字認識方法がどのように機能するかを示す様々な例について述べる。
【0114】
図9aに、入力ゾーン上でトレースされる文字“R”の例を示す。この例で文字は、第1の直線セグメントA1と、それに続く曲線セグメントA2と第2の直線セグメントA3の形をとる、単一のストロークAでトレースされる。したがって、図7aおよび7bに関して述べた実施形態を適用することにより、ステップS104で、1つのストロークでトレースすることのできる第1グループの候補を選択する。次いで、先の記述に従ってステップS110〜S120で、この単一ストロークの3つのセグメントA1〜A3の直線的または曲線的性質、およびこれらの角度配向の幾何学的データを決定する。
【0115】
単に例として、第1の直線セグメントA1は約+80°の角度配向Φを有し、曲線セグメントA2は約+10°の開始角度配向Φ1および約−170°の終了角度配向Φ2を有し、第2の直線セグメントA3は約−60°の角度配向Φを有すると仮定する。曲線セグメントA2はまた、ノントリゴノメトリックの回転方向でトレースされる。次いでステップS122で、これらの特徴で形成されるトレース文字のモデルを作る。トレース文字のセグメントの角度配向は、次のように要約することができる。
【表1】
【0116】
ステップS124の間に、トレース文字のモデルと同一の性質および構成を有するすべての候補を選択する。すなわち、第1の直線セグメント、第2の曲線的性質のセグメント、および第3の直線的性質のセグメントをこの順番で含む連続する3つのセグメントで形成されるストロークで行われると定義されたすべてのモデルを選択する。例示として図9bに、図4aおよび4bの文字セット中で定義された文字“M”、文字“R”、文字“W”のモデルを示す(当然これらのモデルは、事前にこのように定義されている)。これらの候補は、図9aのトレース文字と同じトポロジーを有する(曲線セグメントの回転方向を考慮しない場合)。すなわち、第1の直線的性質のセグメント、それに続く第2の曲線的性質のセグメント、次いで第3の直線的性質のセグメントである。適切なら他のモデルも存在し得るが、図を簡単にするためにそれらは示していない。
【0117】
文字“M”、“R”、“W”のモデルのセグメントの角度配向は、例の中でもとりわけ、次のように定義されているものとすることができる。
【表2】
【0118】
曲線セグメントの回転方向wに関する追加のトポロジカルな基準を加えることにより、候補“M”が除外される。“M”は、候補“R”および“W”とは異なり、トリゴノメトリックの回転方向の曲線セグメントを有しているからである。
【0119】
曲線セグメントA2の回転方向を考慮した場合、選択ステップS124の最後には、トレース文字に対応する可能性のある少なくとも2つの候補、すなわち候補“R”および“W”が残る。ただし、大多数の候補はトポロジーの考慮のみに基づいて除外されている。
【0120】
次いで、認識プロセスはステップS128に進み、角度配向からみてトレース文字のモデルに最も近い幾何形状を有する1つまたは複数の候補を選択する。したがって、例えば各候補に関して各セグメントの角度配向の偏差を決定することにより、角度配向からみて最も忠実な候補を決定する。
【0121】
文字“R”と“W”の角度配向を比較することにより、図9aでトレースされた文字が“R”モデルの方でより忠実に表されることに容易に気付くであろう。トレース文字のセグメントの角度配向は“R”文字モデルと厳密に同一ではないものの、“W”文字モデルのセグメントの角度配向とは本質的かつ十分に異なる。この大きな違いにより、容易に候補“W”を除去して“R”文字モデルだけを残すことができる。最後に、“R”文字モデルを妥当性検査する。曲線セグメントA2の回転方向wを調べなかったとしても、候補“M”も同様にして除去できることにも留意されたい。
【0122】
図10aに、入力ゾーン上でトレースされる文字“T”の例を示す。この例で文字は、第1の直線セグメントA1を含む第1のストロークと、それに続く、第2の直線セグメントB1を含む第2のストロークBとでトレースされる。やはり図7aおよび7bに関して述べた実施形態を適用し、それによりステップS104で、連続する2つのストロークでトレースすることのできる第1グループの候補を選択する。次いで、先の記述に従ってステップS110およびS120で、2つのセグメントA1およびB1の直線的性質とこれらの幾何学的な角度配向(および位置)のデータを決定する。ストロークを反転することができるのは明らかである。
【0123】
単に例として、第1の直線セグメントA1は約+5°の角度配向Φを有し、直線セグメントB1は約−95°の角度配向Φを有すると仮定する。次いでステップS122で、これらの特徴で形成されるトレース文字のモデルを作る。トレース文字のセグメントの角度配向は、次のように要約することができる。
【表3】
【0124】
ステップS124の間に、トレース文字のモデルと同じ性質および構成を有するすべての候補を選択する。すなわち、直線的性質の単一セグメントでそれぞれ形成される2つのストロークで行われると定義されたすべてのモデルを選択する。例示として図10bに、この定義に対応する5つの候補を示す(当然これらのモデルは、事前にこのような方式で定義されている)。したがって図10bには、同じトポロジーを有する文字モデル、すなわち直線的性質の単一セグメントを含む第1のストロークと、それに続くやはり直線的性質の単一セグメントを含む第2のストロークとを有する文字モデル“T”、“X”、“Y”、“+”、“=”ならびに制御文字モデル“CAPSオン/オフ”(大文字/小文字の切替え)を示す。適切なら他のモデルも存在し得るが、図を簡単にするためにそれらは示していない。
【0125】
文字モデル“T”、“X”、“Y”、“+”、“=”、および“CAPSオン/オフ”のセグメントの角度配向は、例の中でもとりわけ、次のように定義されているものとすることができる(水平セグメントは一般に、左から右に、または右から左にトレースすることができる)。
【表4】
【0126】
選択ステップS124の最後には、トレース文字に対応する可能性のある候補が少なくとも5つ残る。ただし、大多数の候補はトポロジーの考慮のみに基づいて除外されている。
【0127】
この場合、図10bに示すモデルの各セグメントの角度配向を図10aのトレース文字モデルの角度配向と比較することにより、トレース文字モデルは文字モデル“T”または文字モデル“+”で最も忠実に表され、文字モデル“X”、“Y”、“=”、および“CAPSオン/オフ”は容易に除去できることが容易にわかるであろう。ただし、ステップS128で、幾何学的な角度配向パラメータだけでは候補“T”と“+”のどちらが最も適切かを区別することができないこともわかるであろう。
【0128】
前述のように、プロセスは図7bのステップS132に進み、位置からみてトレース文字モデルに最も近い幾何形状を有する候補を選択する。これを行うには、候補のストローク(またはセグメントの端)の位置を用いて、これをトレース文字のモデルのストローク(それぞれセグメントの端)の位置と単に比較すればよい。1次元的性質のストロークすなわち点を含むモデルの場合は、当該の点の位置を直接に比較する。
【0129】
すべての文字に適用できる可能なソリューションの1つは、文字を形成するセグメントの各点または各端の位置を、正規化されたデカルト参照で、すなわちxとyの座標ベクトルをトレース文字の幅(x座標軸に沿った)および高さ(y座標軸に沿った)に関して正規化したデカルト・タイプの参照で決定することを含むことができる。この場合、このように定義された正規化デカルト参照で、文字を形成するセグメントの端および/または点の位置を決定することができる。
【0130】
したがって、図10aおよび10bに示す特定のケースでは、セグメントの様々な端の位置の隔たりを決定することにより、候補“T”がトレース文字に最も忠実な文字であると容易に認識することができる。文字“T”は、第1のセグメントA1の端がほぼ文字の上部に位置することを特徴としている。
【0131】
上に提示した、文字“T”がトレースされるとき(または文字“+”がトレースされるとき)に生じるケースは、他の文字でも同様である。この手法は、例えば文字“X”と“Y”のトレース、または文字“D”と“P”のトレースを区別するのにも採用される。
【0132】
したがって、モデルは、それらのトポロジカル・パラメータに応じて、かつ適切ならそれらの角度配向の進展の幾何学的パラメータに応じて、複数の群にグループ化することが好ましい。各群は、位置の幾何学的パラメータでしか群の他のモデルと区別することのできない1つまたは複数のモデルを含む。これは、文字“T”と“+”、“X”と“Y”、“D”と“P”などの場合である。
【0133】
この場合、この方法は、(i)文字の手動トレースのモデルに最もよく対応するモデルの群を識別すること、および(ii)群の中で、前述のように文字の手動トレースのモデルに最も近い位置の幾何学的パラメータを有するモデルを識別することを含む。
【0134】
本記述で述べた文字認識方法およびデバイスには、添付の特許請求の範囲によって定義する本発明の範囲を逸脱することなく、当業者に自明の様々な修正および/または改良を加えることができることを理解されたい。特に、図4a〜4dに示した文字セットは、本発明の可能な適用例を網羅するものでも限定するものでも決してないことを理解されたい。また、曲線セグメントの回転方向wの定義は使用してもしなくてもよいことも理解されたい。本発明はまた、図1に示した時計における適用に限定されるものではなく、容量性センサを使用して入力ゾーンを形成することに限定されるものでもない。
【図面の簡単な説明】
【図1】
本発明による文字認識デバイスを備える時計の概略的な横断面図である。
【図2】
文字認識デバイスの入力ゾーンを形成するセンサの空間構成を示す図である。
【図3】
図2に示した容量性センサのネットワークを非限定的な形で使用する、本発明による文字認識デバイスのブロック図である。
【図4a】
本発明の範囲内で定義することのできる英数字、記号文字、および制御文字のモデルのセットを網羅的でない形で示す図である。
【図4b】
本発明の範囲内で定義することのできる英数字、記号文字、および制御文字のモデルのセットを網羅的でない形で示す図である。
【図4c】
本発明の範囲内で定義することのできる英数字、記号文字、および制御文字のモデルのセットを網羅的でない形で示す図である。
【図4d】
本発明の範囲内で定義することのできる英数字、記号文字、および制御文字のモデルのセットを網羅的でない形で示す図である。
【図5】
図2の入力ゾーン上の文字“A”の可能なトレースを示す図である。
【図6a】
文字“R”のトレースの3つの例と、このトレースを形成するのに使用される各ストロークについての、角度配向からみたこの文字のトレースの進展を示す図とを示す図である。
【図6b】
文字“R”のトレースの3つの例と、このトレースを形成するのに使用される各ストロークについての、角度配向からみたこの文字のトレースの進展を示す図とを示す図である。
【図6c】
文字“R”のトレースの3つの例と、このトレースを形成するのに使用される各ストロークについての、角度配向からみたこの文字のトレースの進展を示す図とを示す図である。
【図7a】
本発明による文字認識方法の例示的な実施形態のフローチャートである。
【図7b】
本発明による文字認識方法の例示的な実施形態のフローチャートである。
【図8a】
図7aおよび7bに示した方法の代替実施形態のフローチャートである。
【図8b】
図7aおよび7bに示した方法の代替実施形態のフローチャートである。
【図9】
文字“R”の可能なトレースと、類似のトポグラフィを有する候補とを例としてそれぞれ示す図である。
【図10】
文字“T”の可能なトレースと、類似のトポグラフィを有する候補とを例としてそれぞれ示す図である。
【図11】
1次元的性質のストロークすなわち点の定義を表す図である。
【図12】
直線的性質のセグメントの定義を表す図である。
【図13】
ノントリゴノメトリック、トリゴノメトリック、および混合の回転方向をそれぞれ有する曲線的性質のセグメントの定義を表す図である。
Claims (11)
- 電子デバイスの入力ゾーン(10)上で指またはトレース器具(13)で手動トレースされた文字を認識する方法であって、前記入力ゾーン(10)は複数のセンサ(15)を備え、各センサは前記指または前記トレース器具(13)でアクティブ化することができ、前記方法は、前記入力ゾーン(10)上で行われた文字の手動トレース(100)を所定の文字セットからの文字のグループと比較し、
前記文字セットの各文字は、当該の文字をトレースできる仕方を表す少なくとも1つのモデルで表され、前記入力ゾーン(10)上で前記文字の手動トレース(100)が行われた仕方を表すモデルが作られ、
前記モデルは少なくとも、文字のトポロジーに関するトポロジカル・パラメータすなわち特に、
(i)文字をトレースするのに使用されるストローク(A、B、C、D、...)の数と、
(ii)各ストローク(A、B、C、D、...)の性質、すなわち1次元的性質のストロークであるか2次元的性質のストロークであるかと、
(iii)2次元的性質の各ストロークの構成、すなわち
前記2次元的性質のストロークを形成するセグメント(A1、A2、...B1、B2...)の数、および
各セグメント(A1、A2、...B1、B2...)の性質、すなわち直線的性質のセグメントであるか曲線的性質のセグメントであるかとを含み、
適切なら前記モデルはさらに、
(iv)直線的または曲線的性質の各セグメント(A1、A2、...B1、B2)に対して、セグメント(A1、A2、...B1、B2...)のトレースの角度配向の進展を表す幾何学的パラメータ(Φ、Φ1、Φ2、α)、および/または
(v)1次元的または2次元的性質の各ストローク(A、B、C、D、...)につき、ストローク(A、B、C、D、...)の位置を表す幾何学的パラメータ(P0、P1、P2)を含み、
前記方法は本質的に、
前記文字セットの文字のモデルの中から、前記文字の手動トレース(100)のモデルに類似するトポロジカル・パラメータを有する候補のグループを決定し、次いで、
候補のグループが複数の候補を含む場合に、前記文字の手動トレース(100)のモデルに最も近い角度配向の進展の幾何学的パラメータ(Φ、Φ1、Φ2、α)および/または位置の幾何学的パラメータ(P0、P1、P2)を有する候補を識別することを特徴とする方法。 - 前記モデルはそれらのトポロジカル・パラメータに応じて、かつ適切ならそれらの角度配向の進展の幾何学的パラメータ(Φ、Φ1、Φ2、α)に応じて複数の群に再グループ化され、各群は、モデルの位置の幾何学的パラメータ(P0、P1、P2)に応じて区別することでしか群の他のモデルと区別できない1つまたは複数のモデルを含み、
前記文字の手動トレース(100)のモデルに最もよく対応するモデルの群を識別し、かつ
前記群の中で、前記文字の手動トレース(100)のモデルに最も近い位置の幾何学的パラメータ(P0、P1、P2)を有するモデルを識別することを特徴とする請求項1に記載の方法。 - セグメント(A1、A2、...B1、B2...)のトレースの角度配向の進展を表す前記幾何学的パラメータは、少なくとも、
直線的性質のセグメントに対して、前記セグメントの角度配向(Φ)と、
曲線的性質のセグメントに対して、前記曲線的性質のセグメントの一端の開始角度配向(Φ1)または終了角度配向(Φ2)とを含み、
前記トポロジカル・パラメータはまた、曲線的性質のセグメントに対して、前記セグメントの回転方向(w)も含み、前記回転方向(w)は少なくともトリゴノメトリックまたはノントリゴノメトリックであることを特徴とする請求項1または2に記載の方法。 - セグメント(A1、A2、...B1、B2...)のトレースの角度配向の進展を表す前記幾何学的パラメータはさらに、
曲線的性質のセグメントに対して、前記曲線的性質のセグメントの総展開角度(α)も含むことを特徴とする請求項3に記載の方法。 - 前記トポロジカル・パラメータはさらに、2次元的性質の各ストロークにつき、前記ストロークが閉じているか開いているかに関する指示も含むことを特徴とする請求項1から4のいずれかに記載の方法。
- ストローク(A、B、C、D、...)の位置を表す前記幾何学的パラメータ(P0、P1、P2)は、前記ストローク(A、B、C、D、...)を表す少なくとも1点の、すなわち1次元的性質のストロークの位置(P0)および2次元的性質のストロークの少なくとも一端の位置(P1、P2)の、前記入力ゾーン(10)上における位置または文字のトレースに対する位置を含むことを特徴とする請求項1から5のいずれかに記載の方法。
- 文字のトポロジーに関する前記パラメータはさらに、1次元的性質のストロークまたは2次元的性質のストロークの少なくとも一端の、前記入力ゾーン(10)上におけるおよその位置または文字のトレースに対するおよその位置に関する指示を含み、すなわち、前記ストロークまたは前記端が前記入力ゾーン(10)または文字トレースのほぼ上部にあるか下部にあるか、および/または左側にあるか右側にあるかに関する指示を含むことを特徴とする前記各請求項のいずれかに記載の方法。
- (a)前記入力ゾーン(10)上で行われた文字の手動トレースをサンプリングする(S100)ステップと、
(b)前記文字の手動トレースを行うのに使用されたストローク(A、B、C、D...)の数を決定する(S102)ステップと、
(c)同一数のストローク(A、B、C、D...)を含む第1グループの候補を選択する(S104)ステップと、
(d)前記第1グループが候補を含まない場合は(S106)認識を中断し、そうでない場合は、各ストロークの性質、構成、および幾何形状を決定する(S108〜S120)ステップ、すなわち、
前記ストロークが1次元的性質である場合は前記ストロークの位置(P0)を決定し(S109)、あるいは、
前記ストロークが2次元的性質である場合は、前記ストロークをセグメント化して、前記ストロークを形成するセグメントの数を決定し(S110)、各セグメントの直線的または曲線的性質を決定し(S114)、各セグメントの幾何形状すなわち各セグメントの端の位置(P1、P2)を決定し(S115、S116)、
直線的性質の各セグメントに対して、各セグメントの角度配向(Φ)を決定し、
曲線的性質の各セグメントに対して、前記セグメントの端の開始角度配向(Φ1)および終了角度配向(Φ2)、ならびに前記セグメントの少なくともトリゴノメトリックまたはノントリゴノメトリックである回転方向(w)を決定するステップと、
(e)前記文字の手動トレースを表すモデルを作る(S122)ステップと、
(f)前記第1グループの候補の中から、各ストロークの性質および適切ならその構成が前記文字の手動トレースのモデルと同一である第2グループの候補を選択する(S124)ステップと、
(g)前記第2グループが候補を含まない場合は(S126)認識を中断し、そうでない場合は、前記第2グループの候補の中から、セグメントの角度配向からみた幾何形状(Φ、Φ1、Φ2)が前記文字の手動トレースのモデルに最も近い第3グループの候補を選択する(S128)ステップと、
(h)前記第3グループが候補を1つだけ含む場合は(S130)前記候補を妥当性検査し(S134)、そうでない場合は、前記第3グループの候補の中から、位置からみた幾何形状(P0、P1、P2)が前記文字の手動トレースのモデルに最も近い候補を選択し(S132)、前記候補を妥当性検査する(S134)ステップとを含むことを特徴とする前記各請求項のいずれかに記載の方法。 - 前記文字セットは特定の制御文字のグループを含み、前記特定の制御文字はそれぞれ、所定のコマンドに関連し、所定限度を超える数のセグメントで形成される少なくとも1つのストロークを含む明確なモデルで表され、
ステップd)で決定したストロークのセグメント数が前記所定限度を超える場合は(S112)、前記第1グループの候補を前記特定の制御文字のグループに限定し(S113)、この場合は前記セグメントの直線的または曲線的性質も幾何形状も決定せず、
次いでステップf)で、ストロークの性質および構成が文字の手動トレースのモデルと同一である特定の制御文字を選択し、関連するコマンドを実行することを特徴とする請求項8に記載の方法。 - 指またはトレース器具(13)でそれぞれアクティブ化することのできる複数のセンサ(15)を備える入力ゾーン(10)と、
前記入力ゾーン(10)の各センサ(15)ごとに、所定の瞬間に、前記指または前記トレース器具(13)による前記センサのアクティブ化を表す信号を生成する検出手段(41、42)と、
前記入力ゾーン(10)上で行われた文字の手動トレースを所定の文字セット(460)からの文字のグループと比較する処理手段(45)とを備える電子文字認識デバイスであって、
前記文字セット(460)の各文字は、当該の文字をトレースできる仕方を表す少なくとも1つのモデルで表され、前記処理手段(45)は、前記入力ゾーン(10)上で前記文字の手動トレース(100)が行われた仕方を表すモデルを作るように構成され、
前記モデルは少なくとも、文字のトポロジーに関するトポロジカル・パラメータすなわち、
(i)文字をトレースするのに使用されるストローク(A、B、C、D、...)の数と、
(ii)各ストローク(A、B、C、D、...)の性質、すなわち1次元的性質のストロークであるか2次元的性質のストロークであるかと、
(iii)2次元的性質の各ストロークの構成、すなわち
前記2次元的性質のストロークを形成するセグメント(A1、A2、...B1、B2...)の数、および
各セグメント(A1、A2、...B1、B2...)の性質、すなわち直線的性質のセグメントであるか曲線的性質のセグメントであるかとを含み、
適切なら前記モデルはさらに、
(iv)直線的または曲線的性質の各セグメント(A1、A2、...B1、B2)に対して、セグメント(A1、A2、...B1、B2...)のトレースの角度配向の進展を表す幾何学的パラメータ(Φ、Φ1、Φ2、α)、および/または
(v)1次元的または2次元的性質の各ストローク(A、B、C、D、...)につき、ストローク(A、B、C、D、...)の相対的または絶対的な位置を表す幾何学的パラメータ(P0、P1、P2)を含み、
前記処理手段(45)は、
前記文字セットの文字モデルの中から、前記文字の手動トレース(100)のモデルに類似するトポロジカル・パラメータを有する候補のグループを決定する手段と、
候補のグループが複数の候補を含む場合に、前記文字の手動トレース(100)のモデルに最も近い角度配向の進展の幾何学的パラメータ(Φ、Φ1、Φ2、α)および/または位置の幾何学的パラメータ(P0、P1、P2)を有する候補を識別する手段とを含むことを特徴とする電子文字認識デバイス。 - 前記入力ゾーン(10)上で前記指または前記トレース器具(13)で行われた文字の手動トレースの画像を少なくとも一時的に表示するための表示デバイス(55)をさらに備えることを特徴とする請求項10に記載のデバイス。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP00204756A EP1220140A1 (fr) | 2000-12-27 | 2000-12-27 | Procédé de reconnaissance de caractères tracés manuellement sur une zone de saisie et dispositif électronique permettant de mettre en oeuvre ce procédé |
PCT/CH2001/000710 WO2002052493A1 (fr) | 2000-12-27 | 2001-12-13 | Procede et dispositif de reconnaissance de caracteres traces manuellement sur une zone de saisie |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004528620A true JP2004528620A (ja) | 2004-09-16 |
JP4122226B2 JP4122226B2 (ja) | 2008-07-23 |
Family
ID=8172530
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002553717A Expired - Fee Related JP4122226B2 (ja) | 2000-12-27 | 2001-12-13 | 入力ゾーン上で手動トレースされた文字を認識するための方法およびデバイス |
Country Status (7)
Country | Link |
---|---|
US (1) | US7042809B2 (ja) |
EP (2) | EP1220140A1 (ja) |
JP (1) | JP4122226B2 (ja) |
KR (1) | KR100860923B1 (ja) |
CN (1) | CN1252634C (ja) |
HK (1) | HK1061098A1 (ja) |
WO (1) | WO2002052493A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006260306A (ja) * | 2005-03-17 | 2006-09-28 | Ricoh Co Ltd | 文字入力装置、プログラムおよび文字入力方法 |
JP2015090670A (ja) * | 2013-11-07 | 2015-05-11 | 株式会社東芝 | 電子機器、方法およびプログラム |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2847996B1 (fr) * | 2002-11-28 | 2005-10-07 | Thales Sa | Dispositif d'affichage dedie a detection de proximite |
JP2005135268A (ja) * | 2003-10-31 | 2005-05-26 | Internatl Business Mach Corp <Ibm> | 紙面をレイアウトするための装置、方法、およびプログラム |
CN100405389C (zh) * | 2004-08-06 | 2008-07-23 | 摩托罗拉公司 | 从划线标记识别字符的方法和装置 |
US7424136B2 (en) * | 2005-10-18 | 2008-09-09 | Authentec, Inc. | Finger sensing with enhanced mounting and associated methods |
US8280169B2 (en) * | 2005-12-21 | 2012-10-02 | Michael Linderman | Recordation of handwriting and hand movement using electromyography |
JP4607797B2 (ja) * | 2006-03-06 | 2011-01-05 | 株式会社東芝 | 行動判別装置、方法およびプログラム |
CN101256624B (zh) * | 2007-02-28 | 2012-10-10 | 微软公司 | 建立适用于识别手写东亚字符的hmm拓扑结构的方法及系统 |
US20100020033A1 (en) * | 2008-07-23 | 2010-01-28 | Obinna Ihenacho Alozie Nwosu | System, method and computer program product for a virtual keyboard |
US8769427B2 (en) | 2008-09-19 | 2014-07-01 | Google Inc. | Quick gesture input |
TWI444858B (zh) * | 2009-05-27 | 2014-07-11 | Htc Corp | Method and system for updating the gesture track of hand - held touch device |
CN101923635B (zh) * | 2009-06-16 | 2014-11-26 | 宏达国际电子股份有限公司 | 手持触控装置的笔势轨迹更新方法及其系统 |
US8824245B2 (en) * | 2010-10-25 | 2014-09-02 | Advance Watch Company, Ltd. | Touch screen watch |
US9104306B2 (en) * | 2010-10-29 | 2015-08-11 | Avago Technologies General Ip (Singapore) Pte. Ltd. | Translation of directional input to gesture |
CN103425425B (zh) * | 2012-05-22 | 2018-09-04 | 北京蒙恬科技有限公司 | 手写输入选字系统及方法 |
EP2784607B1 (fr) * | 2013-03-28 | 2017-01-18 | ETA SA Manufacture Horlogère Suisse | Montre comprenant un rehaut |
CN104537343B (zh) * | 2014-12-22 | 2018-11-16 | 中山大学 | 一种基于网格多级精确度递进式比划识别方法 |
JP6481513B2 (ja) * | 2015-05-28 | 2019-03-13 | アイシン精機株式会社 | 操作装置 |
US10503271B2 (en) * | 2015-09-30 | 2019-12-10 | Apple Inc. | Proximity detection for an input mechanism of an electronic device |
JP7171500B2 (ja) | 2018-06-25 | 2022-11-15 | 株式会社クボタ | 作業車両 |
KR20220112368A (ko) * | 2021-02-04 | 2022-08-11 | 주식회사 네오랩컨버전스 | 필기 데이터 문자 인식 방법 및 그 장치 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CH599599B5 (ja) * | 1974-09-04 | 1978-05-31 | Centre Electron Horloger | |
CH615520A5 (ja) * | 1977-06-08 | 1980-01-31 | Centre Electron Horloger | |
US4477797A (en) | 1980-12-12 | 1984-10-16 | Citizen Watch Company Limited | Data input device for electronic device |
JPS59121478A (ja) | 1982-12-27 | 1984-07-13 | Casio Comput Co Ltd | 文字認識装置 |
FR2648255B1 (fr) * | 1989-06-08 | 1992-11-27 | Gazale Midhat | Dispositif electromecanique de reconnaissance de caracteres executes manuellement |
US5390260A (en) * | 1993-06-28 | 1995-02-14 | International Business Machines, Corp. | Method and apparatus for on-line, real time recognition of stroked hand-drawn characters |
US6366697B1 (en) * | 1993-10-06 | 2002-04-02 | Xerox Corporation | Rotationally desensitized unistroke handwriting recognition |
US5596656B1 (en) * | 1993-10-06 | 2000-04-25 | Xerox Corp | Unistrokes for computerized interpretation of handwriting |
FR2717917B1 (fr) * | 1994-03-24 | 1996-05-03 | Asulab Sa | Montre comportant un dispositif de commande manuelle. |
JPH10510639A (ja) * | 1994-07-01 | 1998-10-13 | パーム コンピューティング,インコーポレーテッド | マルチペンストローク文字セット及び手書文書認識システム |
CH686601B5 (fr) * | 1994-08-02 | 1996-11-15 | Asulab Sa | Dispositif d'identification d'un caractère transcrit sur une surface et procédé d'identification d'un tel caractère, notamment pour une montre. |
FR2755269B1 (fr) * | 1996-10-25 | 1998-12-04 | Asulab Sa | Dispositif d'identification d'une action manuelle sur une surface, notamment pour une piece d'horlogerie |
US5940535A (en) * | 1996-10-31 | 1999-08-17 | Industrial Technology Research Institute | Method and apparatus for designing a highly reliable pattern recognition system |
-
2000
- 2000-12-27 EP EP00204756A patent/EP1220140A1/fr not_active Withdrawn
-
2001
- 2001-12-13 WO PCT/CH2001/000710 patent/WO2002052493A1/fr active Application Filing
- 2001-12-13 CN CNB018215815A patent/CN1252634C/zh not_active Expired - Fee Related
- 2001-12-13 KR KR1020037008754A patent/KR100860923B1/ko active IP Right Grant
- 2001-12-13 EP EP01271938.1A patent/EP1350218B1/fr not_active Expired - Lifetime
- 2001-12-13 JP JP2002553717A patent/JP4122226B2/ja not_active Expired - Fee Related
-
2002
- 2002-11-14 US US10/451,534 patent/US7042809B2/en not_active Expired - Lifetime
-
2004
- 2004-06-10 HK HK04104194A patent/HK1061098A1/xx not_active IP Right Cessation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006260306A (ja) * | 2005-03-17 | 2006-09-28 | Ricoh Co Ltd | 文字入力装置、プログラムおよび文字入力方法 |
JP4648045B2 (ja) * | 2005-03-17 | 2011-03-09 | 株式会社リコー | 文字入力装置、プログラムおよび文字入力方法 |
JP2015090670A (ja) * | 2013-11-07 | 2015-05-11 | 株式会社東芝 | 電子機器、方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
EP1350218B1 (fr) | 2014-03-26 |
WO2002052493A1 (fr) | 2002-07-04 |
EP1350218A1 (fr) | 2003-10-08 |
HK1061098A1 (en) | 2004-09-03 |
EP1220140A1 (fr) | 2002-07-03 |
CN1252634C (zh) | 2006-04-19 |
JP4122226B2 (ja) | 2008-07-23 |
US20040042346A1 (en) | 2004-03-04 |
US7042809B2 (en) | 2006-05-09 |
KR100860923B1 (ko) | 2008-09-29 |
KR20030066774A (ko) | 2003-08-09 |
CN1484810A (zh) | 2004-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4122226B2 (ja) | 入力ゾーン上で手動トレースされた文字を認識するための方法およびデバイス | |
JP4274941B2 (ja) | 手書き文字を復号化するための方法および装置 | |
US5315667A (en) | On-line handwriting recognition using a prototype confusability dialog | |
JP3135747B2 (ja) | 入出力装置 | |
JP4098880B2 (ja) | 情報検索装置 | |
US6212297B1 (en) | Handwritten keyboardless entry computer system | |
US7302099B2 (en) | Stroke segmentation for template-based cursive handwriting recognition | |
US7778464B2 (en) | Apparatus and method for searching for digital ink query | |
JP2004152040A (ja) | 手書き入力装置、プログラムおよび手書き入力方法システム | |
WO1995027935A1 (fr) | Appareil d'introduction de donnees du type a prehension de crayon et appareil d'introduction de donnees | |
JP4958236B2 (ja) | 手書きパターンを認識するための方法及び装置 | |
JPH0695800A (ja) | ペングリップ式入力装置 | |
JP4148867B2 (ja) | 筆跡処理装置 | |
JPH11184971A (ja) | 手書き文字認識機能を持つ文字入力装置及び方法 | |
JP3357343B2 (ja) | 入出力装置 | |
JP4296862B2 (ja) | 仮想的なキーの配列方法 | |
GB2234102A (en) | Handwritten keyboardless-entry computer system | |
JP3574246B2 (ja) | パターン認識装置 | |
Ford | On-line recognition of connected handwriting | |
JPH11126235A (ja) | 手書き文字認識装置及び手書き文字認識装置制御プログラムを記憶した媒体 | |
JPS6215683A (ja) | 情報認識装置 | |
JPH08279041A (ja) | 筆記者識別装置 | |
JPH07296105A (ja) | 認識変換装置 | |
JPH08123912A (ja) | オンライン文字認識装置および文字認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040930 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070626 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070926 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080206 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080401 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080501 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110509 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4122226 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120509 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130509 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130509 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |