JP2004518198A - 手書文字を認識するための方法、デバイス及びコンピュータプログラム - Google Patents
手書文字を認識するための方法、デバイス及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2004518198A JP2004518198A JP2002556828A JP2002556828A JP2004518198A JP 2004518198 A JP2004518198 A JP 2004518198A JP 2002556828 A JP2002556828 A JP 2002556828A JP 2002556828 A JP2002556828 A JP 2002556828A JP 2004518198 A JP2004518198 A JP 2004518198A
- Authority
- JP
- Japan
- Prior art keywords
- character
- handwritten character
- handwritten
- positional
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000004590 computer program Methods 0.000 title claims abstract description 4
- 239000013598 vector Substances 0.000 claims description 17
- 230000006870 function Effects 0.000 description 14
- 238000005070 sampling Methods 0.000 description 7
- 230000009466 transformation Effects 0.000 description 6
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 206010022998 Irritability Diseases 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/142—Image acquisition using hand-held instruments; Constructional details of the instruments
- G06V30/1423—Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
Description
技術分野
本発明は手書文字を認識するための方法に係る。
【0002】
発明の背景
手書文字を認識することの必要性はますます高まっている。携帯データ処理デバイス、例えば、PDA(Personal Didital Assistant)、移動電話或いは携帯コンピュータ等がますます普及しつつある。これら携帯デバイスにデータを入力するためには、テキスト入力ユニット(text insertion unit)が必要とされる。
【0003】
テキスト入力ユニットは従来以からキーボードとして実現されてきた。ただし、このやり方では携帯デバイスのサイズの小型化に制約があり、このため、より小さなデバイスを実現するためにはデバイスにテキストを入力するための異なるやり方が必要とされる。
【0004】
キーボードは現在ある種の手書テキストを認識するための手法にとって代られつつある。一般的なやり方としては、感圧エリア(pressure−sensitive area)が設けられ、ユーザはここに文字を書き込む。次にこれら文字が携帯デバイスによって翻訳及び処理される。勿論、通常の卓上コンピュータのキーボードの代りに用いることもできる。
【0005】
このように、手書文字の認識は携帯デバイスにおける重要なタスクである。この認識は、通常、手書文字を携帯デバイス内のデータベースに格納された参照文字と比較することで遂行される。一つのこのような方法が米国特許第4,284,975号明細書において開示されている。
【0006】
認識は、遅延によるユーザのイライラ感を避けるために高速であることを要求される。この要件は、ロゴグラフィックな文字(logographic writing system)、例えば、漢字に対応するためには特に大変である。漢字(Chinese writing system)は高々20,000文字から成る。漢字の認識を遂行する際には、手書文字を非常に多数の参照文字と比較することが必要となるために、認識には多くの時間がかかる。
【0007】
米国特許第4,284,975号明細書によると、手書文字上の点と参照文字上の点間の座標の差が計算される。これら差はこれら点間の距離計量(distance measure)を計算するために用いられる。
【0008】
現在、この差は、少なくとも二つのステップにて計算される。点を定義する2つの特性(characteristics)が異なるエリア内に格納される。異なるエリアに格納するのは、ある特性の値に、それが格納されているレジスタに参照することで、容易にアクセスできるようにするためである。次に、点の2つの特性を比較するために、2点間の差の計算が2回の減算にて遂行される。これらの減算においては、これら特性の値を保持するレジスタが直接に参照される。ただし、このやり方では、2つの特性が別個に格納されるために大量のメモリが必要とされる。もう一つの方法においては、これら2つの特性の値が、各点を別個に格納するために、圧縮される。この方法では要求されるメモリ量を低減することはできるが、ただし、点の特性を、特性間の差の計算を遂行する前に、伸張することを要求される。このため処理が遅くなる。
【0009】
発明の概要
本発明の一つの目的は、手書文字を認識するためのより高速な方法を提供することにある。
【0010】
本発明のこの目的は、手書文字を認識するための方法によって達成される。この方法は、手書文字を定義する複数の位置的特徴を決定するステップと、手書文字を、最も良く一致する参照文字を見つけるために、データベース内に格納されている複数の参照文字と比較するステップとを含む。この比較ステップは、手書文字の複数の位置的特徴の一つと複数の参照文字の一つの位置的特徴との間の差を計算するステップと、こうして計算された差に基づいて、予め定義されたテーブルを検索することで、距離計量を決定するステップとを含む。この比較ステップは、更に、この差を計算するステップと距離計量を決定するステップを、手書文字の複数の位置的特徴の各々に対して反復するステップと、こうして決定された距離計量に基づいてコスト関数を計算するステップとを含む。
【0011】
この新規の方法は、手書文字を認識する方法を高速化するためには、手書文字と多量の参照文字との間で遂行されるべき比較動作が高速化される必要がという理解に基づく。比較のステップを高速化できれば、認識の方法全体がより高速化される。文字を比較するためのステップは、文字の複数の位置的特徴(position features)を比較するステップから成る。本発明によると、位置的特徴の比較が非常に高速に遂行される。手書文字の位置的特徴を参照文字の位置的特徴と比較するステップは、位置的特徴間の距離計量を決定するためにテーブルを検索することから成る。このテーブルの検索は距離計量を実際に計算するより速い。このため、手書文字を参照文字と比較するための各動作が高速化され、位置的特徴を比較する速度を少し高速化することで、手書文字を認識するための方法全体の速度がかなり速くなる。
【0012】
より具体的には、本発明によると、特徴点(feature point)間の離散距離(discrete distances)のみを測定することで、得られる異なる距離計量の数が制限される。本発明は、この手法を認識を高速化するために利用できるという洞察に基づく。本発明によると、こうして得られた異なる距離計量がテーブル内に格納される。このテーブルは、距離計量が、計算された差に基づいて、高速にアクセスできるようにされる。こうすることで、距離計量を計算によって決定する必要はなくなり、代りに、テーブルを検索することで、距離計量が得られることとなり、こうして、距離計量の決定を高速化することが可能となる。
【0013】
認識の際に位置的特徴を決定するやり方は知られているために、認識を開始する前に、位置的特徴の可能な値を知ることができる。このため位置的特徴間の可能な距離計量も知ることができ、このため、認識を開始する前に、テーブルを計算し、格納しておくことができる。
【0014】
位置的特徴は手書文字を定義する。好ましくは、位置的特徴は手書文字内の点及び/或いはベクトルから成る。ベクトルは、例えば、文字上の2点間の直線或いは文字の点内の導関数(derivative)を記述する。手書文字は、勿論、点とベクトルの任意の組合せによって定義することもできる。
【0015】
距離計量は、手書文字の位置的特徴と参照文字の位置的特徴間の差の関数から成る。この関数は非常に複雑である必要はなく、距離関数は、テーブルの検索によって、実際に計算するよりも速く決定することができる。本発明との関連では、文字なる語句は、書かれる可能性のある任意のシンボルとして定義される。幾つかのケースにおいては、文字は、このようなシンボルの部分であることも、或いはこのようなシンボルの結合された構造であることもある。
【0016】
好ましくは、各位置的特徴(position feature)は、少なくとも二つの特性(characteristics)によって定義される。手書文字の位置的特徴と参照文字の位置的特徴間の差を計算するステップは、手書文字の位置的特徴の各特性と参照文字の位置的特徴の対応する特性間の差の計算から成る。一つの位置的特徴(position feature)を定義するためには、通常、二つの特性(characteristics)、例えば、点に対するx座標とy座標、或いはベクトルに対するx方向とy方向が必要とされる。距離計量を決定するためには、両方の特性が距離計量に寄与するように、比較される位置的特徴に対する両方の特性の差が必要とされる。
【0017】
本発明の一つの好ましい実施例によると、各特性に対して差を計算するステップは、単一の動作にて遂行される。本発明の方法によると、これら特性の差を計算するためには、各位置的特徴の特性が単一のレコード内に格納され、差を計算するためには、レコード内のどのビットが各特性を表すかについての知識が用いられる。こうして、位置的特徴が小さなメモリ空間内に格納されるが、距離計量を決定するステップの高速化に加えて、差を計算するステップも、位置的特徴の差の計算にはたった一つのマシンコード動作しか必要とされないために、非常に高速化することが可能となる。
【0018】
好ましくは、位置的特徴を決定するステップは、格子内の位置的特徴の位置を決定するステップを含む。こうすることで、手書文字の位置的特徴を、参照文字の位置的特徴とより簡単に比較することが可能となる。
【0019】
一つの好ましい実施例においては、手書文字と参照文字の位置的特徴は比較点の座標から成る。こうすることで、一致する参照文字を見つけるために、手書文字のある比較点を、参照文字の予め定義された比較点と比較することが可能となる。
【0020】
好ましくは、位置的特徴を決定するステップは、格子内の比較点のx座標とy座標を決定するステップを含む。こうすることで、比較点の位置を2つの特性にて容易に記述することが可能となる。
【0021】
一つの好ましい実施例においては、格子のサイズは16×16位置とされ、一つの比較点の座標は1バイトのデータにて表現される。この格子サイズは、漢字を曖昧さなしに表現するため、及び一つの比較点の位置を小量のメモリ空間内に格納するために最適である。
【0022】
好ましくは、予め定義されたテーブルのテーブル検索から得られる距離計量は、手書文字の比較点と参照文字の比較点間のユークリッド距離の関数から成る。このユークリッド距離はx方向とy方向における差の等しく重み付けされた計量を与える。この関数はユークリッド距離の二乗とすることもでき、この場合は、入力される差が整数の場合は、整数の結果を与える。
【0023】
もう一つの実施例においては、手書文字と参照文字の位置的特徴は、比較ベクトルの位置と方向から成る。比較ベクトルと比較点を組合せて、文字を定義することもできる。位置的特徴が比較ベクトルから成る場合は、手書文字のストロークの方向が、参照文字のストロークの方向を定義する参照文字の対応する比較ベクトルと比較される。
【0024】
この実施例においては、予め定義されたテーブルのテーブル検索から得られる距離計量は、手書文字と参照文字の曲率間の差の関数から成る。このことはストロークの導関数(derivatives)が比較されることを意味する。
【0025】
好ましくは、この方法は、更に、手書文字を、手書文字の位置的特徴を決定するステップを遂行する前に、格子の中央に移動させるステップを含む。この結果として、手書文字の位置のずれ(translation)を考慮し、手書文字の位置を参照文字の位置に合わせることが可能となる。こうすることで、手書文字を、文字の入力が可能な任意の場所に書くことが可能となる。
【0026】
好ましくは、この方法は、更に、手書文字を、手書文字の位置的特徴を決定するステップを遂行する前に、参照文字のサイズに従って正規化されたサイズにスケーリングするステップを含む。こうすることで、手書文字のサイズは、認識のためにはあまり重要でなくなる。
【0027】
一つの好ましい実施例においては、この方法は、更に、手書文字を形成するストロークの数を決定するステップを含む。これは、手書文字を個々の全ての参照文字と比較する必要性を回避するために、文字を分類するための一つのやり方である。
【0028】
好ましくは、手書文字と参照文字とを比較するステップは、最初に手書文字を同数のストロークから形成される参照文字と比較するステップを含む。この結果、手書文字は、最初に最も良く一致する参照文字である可能性が最も高い参照文字と比較されることとなる。
【0029】
加えて、比較ステップは、好ましくは、更に、手書文字を、ストロークの誤った併合を考慮するために、その手書文字より少し少数のストロークから形成される参照文字と比較するステップを含む。書く人がペンを持ち上げるべきときに持ち上げないために、2つのストロークが併合されることはしばしば見かけられる。この構成を用いることで、たとえ書く人が2つのストロークを誤って併合した場合でも、正しい最も良く一致する参照文字を見つけることが可能となる。
【0030】
さらに、比較ステップは、好ましくは、手書文字を、ペンが誤って持ち上げられた場合を考慮するために、その手書文字より少し多数のストロークから形成される参照文字と比較するステップを含む。この構成を用いることで、たとえ書く人が1つのストロークの途中で誤ってペンを上げた場合でも、参照文字を見つけることが可能となる。
【0031】
もう一つの好ましい実施例においては、手書文字のあるストロークが参照文字の対応するストロークと比較され、これら対応するストロークは、その手書文字のストロークが書かれる順番に決定される。こうすることで、参照文字の対応する位置的特徴を、それと対応する手書文字の位置的特徴と容易に関連付けることができる。このやり方は、とりわけ、ストロークの書順が決まっている漢字に有効である。漢字に慣れた人なら、文字を誤った書順で書くことはめったにないためである。
【0032】
好ましくは、この方法は、更に、ストロークの書順の誤りを考慮するために、手書文字のストロークの順番を認識するステップを含む。こうすることで、書く人がその文字のストロークを誤って書いた場合でも、正しい最も良く一致する参照文字を見つけることが可能となる。
【0033】
一つの好ましい実施例においては、この方法は、更に、手書文字の傾きを補償するために手書文字のアフィン変換を計算し、その後、変換された文字をデータベースの参照文字と比較するステップを含む。こうすることで、書く人が傾いた文字を書いた場合でも、正しい最も良く一致する参照文字を見つけることが可能となる。
【0034】
更に、本発明の目的は、手書文字を認識するため、及びこれをデジタル形式に変換するためのデバイスによっても達成される。このデバイスは、手書文字を定義する複数の位置的特徴を決定するための手段と、複数の参照文字を含むデータベースと、手書文字を、このデータベース内に格納されている複数の参照文字と、最も良く一致する参照文字を見つけるために比較するための手段とを含む。この比較のための手段は、手書文字の複数の位置的特徴の一つと複数の参照文字の一つの位置的特徴間の差を計算するための手段と、位置的特徴間の差に基づいて距離計量を定義する予め定義されたテーブルとを含む。この比較のための手段は、更に、この予め定義されたテーブルを検索することで距離計量を決定するための手段と、こうして決定された距離計量に基づいてコスト関数を計算するための手段とを含む。
【0035】
このデバイスはテキストをデータ処理デバイスに入力するために用い、キーボード代りに、或いはこれを補完するために用いることもできる。本発明によると、テーブルの検索のために手書文字の認識が非常に高速化され、長い待ち時間によるイライラ感が解消される。
【0036】
本発明の目的は、更に、請求項22記載のコンピュータプログラムによっても達成される。
【0037】
以下では、本発明を、単に例示として、添付の図面を用いてより詳細に説明する。
【0038】
【発明の実施の形態】
図1は、格子3内に書かれた手書文字1(太い灰色の線)と参照文字2(細い黒色の線)とを示す。手書文字1は複数のストローク4から成る。格子3内への書き込みの際の各ストローク4の始点5と終点6の位置がマークされる。これらストロークの始点5と終点6が、好ましくは、手書文字1の位置的特徴(position features)として用いられる。格子3内のこれらのx座標とy座標によって、これらの位置的特徴が定義される。勿論、他の座標系、例えば、極座標系を用いることもできる。手書文字1の追加の位置的特徴として、各ストローク4の始点5から終点6へのベクトルや、ストローク4上の始点5と終点6との間の追加の点を用いることもできる。手書文字1と参照文字2との比較は、後に詳細に説明するように、手書文字1のこれら位置的特徴を参照文字2の位置的特徴と比較することで行なわれる。
【0039】
以下では、図2から図6との関連で、手書文字を認識するための一つの好ましい方法について説明する。以下の説明においては、文字は、感圧エリア(pressure−sensitive)上に書かれ、文字の認識は即座に遂行されるものと想定される。ただし、後に指摘するように、この方法を紙に書かれた手書文字に適用し、その後、これを走査し、デジタル形式に変換することもできる。
【0040】
図2は、ユーザの手書による文字の入力動作を示す。ステップ10において、文字が、認識及びデジタル形式への変換のために、手書きにて感圧エリア上に書かれる。この感圧エリアは、データ処理デバイス、例えば、コンピュータ、PDA或いは移動電話に接続された入力ユニットから成る。ユーザは、この感圧エリア上に、文字を、以降ここではペンと呼ばれる先の尖った物を用いてこのエリアに圧力を加えることで書き込む。文字は、少なくとも1ストローク、すなわち、ペンを持ち上げることなく書かれた一つの線を含む。ユーザは、文字を形成するこれらストロークを書く。一つの文字全体の入力を終えると、ユーザは、ステップ12において、このことをデータ処理デバイスに伝え、すると、データ処理デバイスは、最も良く一致する文字(closest matching character)を見つけるために、手書文字と参照文字とを比較する。一つの文字全体の入力が完了したことをデータ処理デバイスに認識させるためには、他のやり方も考えられ、例えば、ユーザがなにもしない時間の経過からこれを知ることもできる。次に、ステップ14において、この最も良く一致する文字が、正しい文字が表示されたか否か答えてもらうためにユーザに対して表示される。ユーザは、こうして示された文字を、ステップ16において受理し、或いはステップ18において拒否する。
【0041】
次に、図3との関連で、手書文字のデータ処理についてより詳細に説明する。ステップ20において手書文字が入力されると、ステップ22において、その手書文字を定義するために、その手書文字上の複数の点がサンプリングされる。これら点は、好ましくは、格子内のそれらのx座標とy座標として決定される。これらの点は、後に、手書文字を参照文字と比較するために用いられる。ステップ22におけるサンプリング過程の後に、入力された文字は、手書文字の位置やサイズを訂正するために前処理される。
【0042】
この前処理は、手書文字を格子の中央に移動するステップ24と、手書文字を、正規化されたサイズにスケーリングするステップ26とから成る。これらステップ24乃至26は、以下のように遂行される。最初に、全てのサンプリング点のx座標とy座標のそれぞれの平均値が決定される。次に、これらx座標とy座標のそれぞれの平均値がサンプリングされた点の座標から引かれ、こうして手書文字の重心が移動される。その後、サンプリングされた点から重心までの距離の標準偏差が正規化される。このサイズは参照文字のサイズに対応する。最後に、手書文字が格子の中央に移動される。サンプリング点の決定は、好ましくは、手書文字を参照文字と比較する過程の際に用いられる解像度より高い解像度にて行なわれる。このため、文字のスケーリングには解像度の変換も含まれ、このためにはx−座標とy−座標の値がこれら解像度間の比にて割られる。
【0043】
手書文字は複数のストローク、すなわち、ペンを持ち上げることなく引かれた複数の線から成る。各ストロークがサンプリングされ、位置的特徴が決定される。一つのやり方においては、このサンプリングでは、所定の間隔にて位置的特徴が検出され、その時点におけるペンの位置からその位置的特徴が決定される。別のやり方においては、ストロークの始点と終点を決定され、ストローク上のどの点が始点と終点との間に引かれた直線から最も大きくずれるかを計算することで追加の位置が決定される。同様なやり方にてさらなる追加の点を決定することもできる。手書文字の位置的特徴には、サンプリング点の座標を用いることもできる。別のやり方として、2つの隣接するサンプリング点間の方向ベクトルを用いることも、或いは2つの隣接する方向ベクトル間の方向の差を定義する曲率ベクトル(curvature vector)を用いることもできる。
【0044】
これらストロークがそれらが書かれた順にリストされる。次に、手書文字の第一のストロークが参照文字内の第一のストロークと比較され、これが繰返される。これは、とりわけ、漢字に適する。これは、ストロークの順番(書順)が決まっているためである。ただし、ストロークが誤った順番にて書かれる場合もあり、これは、例えば、ストロークの順番を再度シャフリング(reshuffling)することで考慮される。このリシャフリングを遂行するためには、手書文字の各ストロークが参照文字の各ストロークと比較され、どのストロークが手書文字の各ストロークと最も良く一致するか決定される。
【0045】
手書文字は複数の位置的特徴によって表される。これら位置的特徴は、例えば、サンプリング点の座標、方向ベクトル、曲率ベクトル或いはこれらの任意の組合せから成る。手書文字の位置的特徴を参照文字の位置的特徴と比較することで最も良く一致する参照文字が見つけられる。参照文字の位置的特徴は予め定義されており、手書文字から抽出された位置的特徴(position features)と同一の特性(characteristics)を表す。ただし、手書文字の個々の全ての位置的特徴に対して対応する位置的特徴が存在することは限らない。例えば、参照文字の一つの位置的特徴が、手書文字の二つ或いはそれ以上の位置的特徴との比較に用いられることも、或いはこの逆も考えられる。ストロークの比較には、異なる数の位置的特徴を正しく定義することが必要となる。例えば、手書文字の3つの位置的特徴が参照文字の4つの位置的特徴と比較されることもある。この場合は、参照文字のどの位置的特徴が手書文字のこれら位置的特徴と対応するかを決定することが必要となる。このためには、参照文字の対応する位置的特徴として、手書文字の位置的特徴との差が最も少ない参照文字の3つの位置的特徴が選択される。逆に、手書文字の一つの位置的特徴が参照文字の2つの対応する位置的特徴と比較されることもあり、この一つの位置的特徴に対して2つの距離計量(distance measures)が計算されることもある。
【0046】
一つの好ましい実施例においては、これら位置的特徴は文字の比較点(comparison points)から成る。格子内の比較点の位置がそのx座標とy座標によって決定される。この格子は、好ましくは、16×16の方形から成り、こうしてある比較点は、それぞれ、x座標とy座標に対して4ビットが必要とされるため、1バイトのデータにて表される。
【0047】
次に、図4との関連で、手書文字と参照文字との比較についてより詳細に説明する。参照文字はデータ処理デバイス内のデータベース内にそれらの対応する位置的特徴の情報として格納される。手書文字の各比較点が参照文字の対応する比較点と比較される。これを達成するために、ステップ30において、比較点間の差が計算される。つまり、参照文字の対応する比較点のx座標とy座標の値が、手書文字の比較点のx座標とy座標の値から引かれ、次に、ステップ32において、これら差を入力として用いることで、予め定義されたテーブル内の距離計量が検索される。この距離計量としては、
f(xa−xb)+g(ya−yb)
なる形式の任意の関数を用いることができる。ここで、fとgは関数を表し、(xa、ya)は手書文字の比較点を表し、(xb、yb)は参照文字の対応する比較点を表す。代りに、特徴(xa、ya)と(xb、yb)は、勿論、方向ベクトル或いは曲率ベクトルを表すこともできる。
【0048】
この好ましい実施例においては、このテーブルは、距離計量をこれら点間のユークリッド距離の二乗として定義する。つまり、このテーブルは、
(xa−xb)2+(ya−yb)2
の結果を与える。
【0049】
これは、全ての距離に対して正の値を与え、さらに、これら2つの差が整数である場合は整数の結果を与える。
【0050】
比較点の座標(xa、ya)は、1バイトのデータ内に格納される。x座標は第一のニブル(nybble)、つまり、最初の4つのビット内に格納され、y座標は続くニブル内に格納される。これらの差(xa−xb)と(ya−yb)は、x座標値とy座標値の格納位置が知られているために一つの動作にて同時に計算することができる。これら差(xa−xb)と(ya−yb)は、9ビットにて表され、予め定義されたテーブルへの入力として用いられる。最初のニブル、つまり、最初の4つのビットは差(xa−xb)を表し、続くニブルは差(ya−yb)を表す。9番目のビットは桁上げビット(carry bit)であり、y座標の差が負であるか否かを示す。x座標については、8個のx‐刻み(ticks)より大きな差は決して発生しないものと想定される。従って、最初のニブルは区間[−7,8]を表すものと解される。引算は単に8ビットの(xa、ya)から(xb、yb)を引くことで遂行される。4つの最下位ビットの差、つまり、(xa−xb)が負である場合は、これは(ya−yb)の差に影響を及ぼす。この場合は、4つの続くビットは(ya−yb)−1となり、このことが予め定義されたテーブル内で考慮される。勿論、x座標とy座標との間に空ビット(empty bit)を置くこともでき、この場合は、これが(xa−xb)が負の値となったときの桁上げビット(carry bit)として機能する。ただし、この好ましい実施例によると、8個のx‐刻みより大きな差が発生した場合に、(ya−yb)に発生するエラーは、あまり重大ではないものとみなされる。これは、万一8個のx‐刻みより大きなこの差が発生した場合でも、比較されている文字はあまりにも異なるため、その参照文字が最も良く一致する文字として解釈されることはあり得ないためである。この予め定義されたテーブルは、16×32=512の要素から成る。ただし、代替として、y座標の桁上げビットも無視することもでき、この場合は、このテーブルはたった256個の要素から成ることとなる。
【0051】
16×16格子が用いられる場合は、全ての点が互いに高々8個のx‐刻みだけ離れることは保証されない。ただし、漢字のストロークは多くの場合左から右に、或いは下方に向かって書かれるため、混乱の恐れはほとんどない。代替として、8×8格子を用いることもできる。この場合は各座標を表現するためにたった3ビットのみが必要となる。こうして得られる解像度は漢字には粗すぎるが、他の用途に用いることも考えられる。
【0052】
テーブルの検索の結果として、距離計量の結果が返される。ステップ30と32における距離計量の決定が、ステップ34において、手書文字の全ての位置的特徴に対して反復される。次に、ステップ36において、参照文字と手書文字との類似度(resemblance)を定義するコスト関数が計算される。このコスト関数は、例えば、全ての決定された距離計量の総和とされる。次に、ステップ38において、その参照文字に対するコスト関数の結果が、それまで比較された参照文字の内で最も低いものであるか知るためのチェックが行なわれる。その結果がそれまでの最小である場合は、それが格納され、ステップ40において、その参照文字が、それまでの内で最も良く一致する参照文字であるものと定義される。
【0053】
ある参照文字の決定された距離計量の総和が、それまでの内で最も良く一致する参照文字の総和を超える場合は、その参照文字に対して全ての距離計量を決定する前に、比較は中断される。この場合は、その参照文字は、全ての距離計量を決定する前に、距離計量の総和が既に高すぎるために、拒否される。
【0054】
ステップ30乃至38の比較が全ての参照文字に対して反復される。手書文字が全ての参照文字に対して比較された時点でそれまでの内で最も良く一致する参照文字として格納された参照文字が、最も良く一致する参照文字とみなされる。次に、図2との関連で上で説明したように、この最も良く一致する参照文字が表示され、ユーザは手書文字が正しく認識されたかチェックする。
【0055】
次に、図5との関連で、正しい文字である可能性が最も高い参照文字を知能的に選択する方法について示す。データベース内の参照文字がそれが含むストロークの数に基づいてグループ化される。次に、ステップ50において、手書文字が同数のストロークから成る参照文字と比較される。こうして最初に参照文字の小さな部分が最も良く一致する文字である可能性が最も高いものとして定義される。
【0056】
ただし、ユーザが文字を書くとき2つのストロークが誤って一つに併合されたり、或いはユーザが一つのストロークの中間でペンを上げることで単一のストロークが2つに分割されることがある。このため、手書文字を、少し異なるストローク数(画数)を有する参照文字と比較することが必要となる。手書文字内のストロークの位置が調べられる。ステップ52において、あるストロークの端点が他のストロークの始点に近接するペアのストロークが併合され、その後、ステップ54において、その手書文字が、その手書文字内の新たなストローク数に対応するストローク数を有する参照文字と比較される。ストロークが様々な異なるやり方にて併合され、対応するストローク数を有する参照文字と比較される。
【0057】
さらに、あるストロークは、ステップ56に示すように、分割することもできる。このためには分割点(breakpoint)が設定され、この分割点の両側のストロークの2つの部分が、2つの別個のストロークとして定義される。次に、手書文字が、ステップ58において、その手書文字内の新たなストローク数に対応するストローク数を有する参照文字と比較される。このストロークの併合と分割が、ある正しく書かれた文字を見つけるために、数回、異なる組み合わせにて反復される。
【0058】
こうして、参照文字の大部分は、それらが手書文字のストローク数とかけ離れたストローク数を有するために手書文字と一度も比較されない。
【0059】
さらに手書文字は、図6との関連で説明されるように、誤った傾き(erroneous slant)を有することもある。この場合は、一致する正しい参照文字を見つけるためには、最初に、ステップ60において、手書文字がアフィン変換される。次に、ステップ62において、手書文字に対して、アフィン変換の不変量(invariant)が計算される。この不変量は、手書文字を参照文字と比較するために用いられる。次に、ステップ64において、この不変量と参照文字間のクロス乗積(cross product)が計算される。2つの文字が同一である場合は、それらは同一の空間を占め、このためクロス乗積の内積(internal cross product)は零となる。この不変量と参照文字間のクロス乗積は、テーブルを検索することで決定される。
【0060】
上から分かるように、多数の比較を遂行することが必要となる。手書文字は多くの異なる参照文字と比較することを必要とされる。更に、手書文字は少し誤って書かれることもある。これを補完するためには、手書文字について幾つかの変換(ストロークの併合、ストロークの分割、アフィン変換)を施し、これら変換から得られる新たな文字を参照文字と比較することが必要となる。このため文字間の比較を高速化することは非常に重要である。この高速化は本発明によると、テーブルの検索により距離計量を決定することで達成される。
【0061】
上の説明では、本質的に文字はディスプレイ上に書かれ、書かれるのと同時に検出された。ただし、代りに、文字は、例えば、紙面に書かれた後、例えば、スキャンによって検出することもできる。この文字は、手書であっても、活字であっても構わない。この場合は、検出は、ディスプレイ上への書き込みを認識する動作の代りに、紙面から文字を読み込む(スキャニングする)動作から成る。次に、こうして読み込まれた文字の位置的特徴の検出及び認識が上述のようなやり方にて遂行される。
【0062】
次に、図7との関連で、本発明によるデバイスについて説明する。データ処理デバイス100、例えば、コンピュータ、PDA、移動電話、スキャナ等は、手書きにてテクストを入力するためのテキスト入力ユニット102を備える。データ処理デバイス100は、入力されたテキストを検出するための手段104を含む。検出のための手段104は、手書文字の位置的特徴を決定する。
【0063】
データ処理デバイス100は、データベース106を含むか、或いは少なくともこれへのアクセスを有する。データベースは、参照文字と、これらの外観の表現をを備える。データ処理デバイス100は、更に、検出された手書文字を上述の方法に従ってデータベース内の参照文字を比較するための手段108を含む。
【0064】
比較のための手段108は、手書文字の比較を、文字の入力/読込みと同時に開始することもできる。代りに、比較は、ユーザからの文字全体が入力されたことの指標に応答して開始することもできる。
【0065】
比較のための手段108は、手書文字と最も良く一致する参照文字を返す。データ処理デバイス100はこの最も良く一致する文字をディスプレイ110上に表示した時点で、新たな文字を認識する準備が整う。
【0066】
最も良く一致する文字が表示されると、ユーザは手書文字が正しく認識されたかチェックすることを求められる。ユーザがその最も良く一致する文字を拒否すると、データ処理デバイス100は、第二番目に良く一致する文字を表示する。代りに、ユーザにその文字を再入力することを求めることもできる。
【0067】
データ処理デバイス100は、もう一つの代替としてユーザに受理/拒否を尋ねることなく、文字を認識することもできる。この場合は、例えば、入力されたテキストのスペルと文法が正しいかチェックされ、誤りがユーザに表示される。次に、ユーザは、テキストをプルーフリードし、誤って解釈された文字を訂正する。
【0068】
上で説明された好ましい実施態様は制限を意図するものではなく、クレームに記載される保護の範囲内で他の多くの形態も考えられることに注意する。例えば、格子は、他のサイズ、例えば、8×8或いは32×32とすることも、更には16×8等の非対称なサイズとすることもできる。ただし、格子のサイズは、x座標とy座標が二進数にて表現されるために、2のべき乗であることが望ましい。こうして、例えば、一つの座標を表すために3或いは5ビットを用いることもできる。
【図面の簡単な説明】
【図1】
手書文字と、比較用の参照文字とを示す。
【図2】
ユーザと、本発明による方法を実現するデバイスとの対話の流れ図である。
【図3】
実際の認識を遂行する前の手書文字の前処理の流れ図である。
【図4】
手書文字を参照文字と比較する過程の流れ図である。
【図5】
手書文字を参照文字と比較する順番を記述する流れ図である。
【図6】
手書文字のアフィン変換を参照文字と比較する過程の流れ図である。
【図7】
本発明による方法を実現するデバイスを示す。
【符号の説明】
1 手書文字(太い灰色の線)
2 参照文字(細い黒色の線)
3 格子
4 ストローク
5 ストロークの始点
6 終点
100 データ処理デバイス
102 テキスト入力ユニット
104 検出手段
106 データベース
108 比較手段
Claims (22)
- 手書文字を定義する複数の位置的特徴を決定するステップと、
手書文字を、最も良く一致する参照文字を見つけるために、データベース内に格納されている複数の参照文字と比較するステップとを含み、この比較ステップが:
手書文字の前記複数の位置的特徴の一つと複数の参照文字の一つの位置的特徴との間の差を計算するステップと、
前記計算された差に基づいて予め定義されたテーブルを検索することで距離計量を決定するステップと、
差を計算するステップと距離計量を決定するステップを手書文字の複数の位置的特徴の各々に対して反復するステップと、
こうして決定された距離計量に基づいてコスト関数を計算するステップと、を含むことを特徴とする手書文字を認識するための方法。 - 各位置的特徴が少なくとも二つの特性によって定義され、前記手書文字の位置的特徴と参照文字の位置的特徴との間の差を計算するステップが手書文字の位置的特徴の各特性と参照文字の位置的特徴の対応する特性間の差を計算することから成ることを特徴とする請求項1記載の方法。
- 各特性に対して差を計算するステップが単一の動作にて遂行される請求項2記載の方法。
- 前記位置的特徴を決定するステップが格子内の位置的特徴の位置を決定するステップを含むことを特徴とする請求項1乃至3のいずれかに記載の方法。
- 前記手書文字と参照文字の位置的特徴が比較点の座標から成ることを特徴とする請求項1乃至4のいずれかに記載の方法。
- 前記位置的特徴を決定するステップが格子内の前記比較点のx座標とy座標を決定するステップを含むことを特徴とする請求項5記載の方法。
- 前記格子のサイズが16×16位置から成り、一つの比較点の座標が1バイトのデータにて表現されることを特徴とする請求項6記載の方法。
- 前記予め定義されたテーブルのテーブル検索から得られる距離計量が手書文字の比較点と参照文字の比較点間のユークリッド距離の関数から成ることを特徴とする請求項5乃至7のいずれかに記載の方法。
- 手書文字と参照文字の位置的特徴が比較ベクトルの位置と方向から成ることを特徴とする請求項1乃至8のいずれかに記載の方法。
- 前記予め定義されたテーブルのテーブル検索から得られる距離計量が手書文字と参照文字の曲率間の差の関数から成ることを特徴とする請求項9記載の方法。
- 更に、手書文字を、手書文字の位置的特徴を決定するステップを遂行する前に、格子の中央に移動させるステップを含むことを特徴とする請求項4乃至10のいずれかに記載の方法。
- 更に、手書文字を、手書文字の位置的特徴を決定するステップを遂行する前に、参照文字のサイズに従って正規化されたサイズにスケーリングするステップを含むことを特徴とする請求項1乃至11のいずれかに記載の方法。
- 更に、手書文字を形成するストロークの数を決定するステップを含むことを特徴とする請求項1乃至12のいずれかに記載の方法。
- 手書文字を参照文字と比較するステップが、最初に手書文字を同数のストロークから形成される参照文字と比較するステップを含むことを特徴とする請求項13記載の方法。
- 前記比較ステップが更に手書文字を、その手書文字より少し少数のストロークから形成される参照文字と比較するステップを含むことを特徴とする請求項13或いは14記載の方法。
- 前記比較ステップが更に手書文字を、その手書文字より少し多数のストロークから形成される参照文字と比較するステップを含むことを特徴とする請求項1乃至15のいずれかに記載の方法。
- 手書文字のストロークが参照文字の対応するストロークと比較され、これら対応するストロークが手書文字が書かれる順番に決定されることを特徴とする請求項13乃至17のいずれかに記載の方法。
- 更に、手書文字のストロークの順番を認識するステップを含むことを特徴とする請求項17記載の方法。
- 手書文字を認識するため、及びこれをデジタル形式に変換するためのデバイスであって、
手書文字を定義する複数の位置的特徴を決定するための手段と、
複数の参照文字を含むデータベースと、
前記手書文字を、最も良く一致する参照文字を見つけるために、前記データベース内に格納されている複数の参照文字と比較するための手段とを含み、この比較のための手段が:
手書文字の複数の位置的特徴の一つと複数の参照文字の一つの位置的特徴との間の差を計算するための手段と、
距離計量を位置的特徴間の差に基づいて定義する予め定義されたテーブルと、
前記予め定義されたテーブルを検索することで、距離計量を決定するための手段と、
こうして決定された距離計量に基づいてコスト関数を計算するための手段と、を含むことを特徴とするデバイス。 - 位置的特徴がこれを定義する2つの特性を含み、これら特性が前記データベース内の一つのデータレジスタ内に格納されることを特徴とする請求項19記載のデバイス。
- 文字を手書で書き込むように構成された感圧エリアと、この感圧エリア内に書かれた文字を認識し、これをデジタル形式に変換するための請求項19記載のデバイスとを備えるデータ処理用の携帯デバイス。
- 手書文字を認識するためのコンピュータプログラムであって、
手書文字を定義する複数の位置的特徴を決定するためのコードと、
手書文字を、最も良く一致する参照文字を見つけるために、データベース内に格納されている複数の参照文字と比較するためのコードとを含み、この比較のためのコードが:
手書文字の複数の位置的特徴の一つと複数の参照文字の一つの位置的特徴との間の差を計算するためのコードと、
こうして計算された差に基づいて予め定義されたテーブルを検索することで距離計量を決定するためのコードと、
前記差を計算するステップと距離計量を計算するステップを手書文字の複数の位置的特徴の各々に対して反復するためのコードと、
こうして決定された距離計量に基づいてコスト関数を計算するためのコードと、を含むことを特徴とするコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE0100114A SE521911C2 (sv) | 2001-01-15 | 2001-01-15 | Metod, anordning och datorprogram för igenkänning av ett handskrivet tecken |
PCT/SE2002/000037 WO2002056242A1 (en) | 2001-01-15 | 2002-01-11 | Method, device and computer program for recognition of a handwritten character |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004518198A true JP2004518198A (ja) | 2004-06-17 |
Family
ID=20282632
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002556828A Pending JP2004518198A (ja) | 2001-01-15 | 2002-01-11 | 手書文字を認識するための方法、デバイス及びコンピュータプログラム |
Country Status (6)
Country | Link |
---|---|
US (1) | US7349576B2 (ja) |
JP (1) | JP2004518198A (ja) |
CN (1) | CN1488120B (ja) |
SE (1) | SE521911C2 (ja) |
TW (1) | TW573280B (ja) |
WO (1) | WO2002056242A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101392295B1 (ko) | 2012-12-17 | 2014-05-12 | 한승희 | 한글 필적의 음절단위 분석 장치 및 방법 |
Families Citing this family (137)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7712053B2 (en) | 1998-12-04 | 2010-05-04 | Tegic Communications, Inc. | Explicit character filtering of ambiguous text entry |
US8938688B2 (en) | 1998-12-04 | 2015-01-20 | Nuance Communications, Inc. | Contextual prediction of user words and user actions |
US7881936B2 (en) * | 1998-12-04 | 2011-02-01 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
US7679534B2 (en) * | 1998-12-04 | 2010-03-16 | Tegic Communications, Inc. | Contextual prediction of user words and user actions |
US7720682B2 (en) | 1998-12-04 | 2010-05-18 | Tegic Communications, Inc. | Method and apparatus utilizing voice input to resolve ambiguous manually entered text input |
US7821503B2 (en) | 2003-04-09 | 2010-10-26 | Tegic Communications, Inc. | Touch screen and graphical user interface |
US7286115B2 (en) * | 2000-05-26 | 2007-10-23 | Tegic Communications, Inc. | Directional input system with automatic correction |
US7610194B2 (en) * | 2002-07-18 | 2009-10-27 | Tegic Communications, Inc. | Dynamic database reordering system |
US7750891B2 (en) * | 2003-04-09 | 2010-07-06 | Tegic Communications, Inc. | Selective input system based on tracking of motion parameters of an input device |
US7030863B2 (en) | 2000-05-26 | 2006-04-18 | America Online, Incorporated | Virtual keyboard system with automatic correction |
EP1192716B1 (en) * | 1999-05-27 | 2009-09-23 | Tegic Communications, Inc. | Keyboard system with automatic correction |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US8583440B2 (en) * | 2002-06-20 | 2013-11-12 | Tegic Communications, Inc. | Apparatus and method for providing visual indication of character ambiguity during text entry |
US7284200B2 (en) * | 2002-11-10 | 2007-10-16 | Microsoft Corporation | Organization of handwritten notes using handwritten titles |
US7634729B2 (en) * | 2002-11-10 | 2009-12-15 | Microsoft Corporation | Handwritten file names |
US7580551B1 (en) * | 2003-06-30 | 2009-08-25 | The Research Foundation Of State University Of Ny | Method and apparatus for analyzing and/or comparing handwritten and/or biometric samples |
US7636083B2 (en) * | 2004-02-20 | 2009-12-22 | Tegic Communications, Inc. | Method and apparatus for text input in various languages |
US8095364B2 (en) | 2004-06-02 | 2012-01-10 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US8504606B2 (en) * | 2005-11-09 | 2013-08-06 | Tegic Communications | Learner for resource constrained devices |
US7587378B2 (en) * | 2005-12-09 | 2009-09-08 | Tegic Communications, Inc. | Embedded rule engine for rendering text and other applications |
US7580925B2 (en) * | 2006-04-19 | 2009-08-25 | Tegic Communications, Inc. | Efficient storage and search of word lists and other text |
US8913833B2 (en) * | 2006-05-08 | 2014-12-16 | Fuji Xerox Co., Ltd. | Image processing apparatus, image enlarging apparatus, image coding apparatus, image decoding apparatus, image processing system and medium storing program |
US7565624B2 (en) * | 2006-06-30 | 2009-07-21 | Research In Motion Limited | Method of learning character segments during text input, and associated handheld electronic device |
US8395586B2 (en) | 2006-06-30 | 2013-03-12 | Research In Motion Limited | Method of learning a context of a segment of text, and associated handheld electronic device |
KR100801224B1 (ko) * | 2006-08-16 | 2008-02-05 | 장경호 | 사용자 필적 구현 시스템 및 방법 |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US20080154576A1 (en) * | 2006-12-21 | 2008-06-26 | Jianchao Wu | Processing of reduced-set user input text with selected one of multiple vocabularies and resolution modalities |
US8201087B2 (en) * | 2007-02-01 | 2012-06-12 | Tegic Communications, Inc. | Spell-check for a keyboard system with automatic correction |
US8225203B2 (en) | 2007-02-01 | 2012-07-17 | Nuance Communications, Inc. | Spell-check for a keyboard system with automatic correction |
US8103499B2 (en) * | 2007-03-22 | 2012-01-24 | Tegic Communications, Inc. | Disambiguation of telephone style key presses to yield Chinese text using segmentation and selective shifting |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8299943B2 (en) | 2007-05-22 | 2012-10-30 | Tegic Communications, Inc. | Multiple predictions in a reduced keyboard disambiguating system |
CN100533478C (zh) * | 2007-07-09 | 2009-08-26 | 华南理工大学 | 基于最优全局仿射变换的汉字合成实现方法 |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8416264B2 (en) * | 2008-11-03 | 2013-04-09 | Sony Mobile Communications Ab | Method and device for optimizing an image displayed on a screen |
TWI385584B (zh) * | 2008-11-05 | 2013-02-11 | Avermedia Information Inc | 自動排列手寫字串之裝置及方法 |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8363947B2 (en) | 2010-07-31 | 2013-01-29 | International Business Machines Corporation | Handwritten character recognition based on frequency variations in characters |
US9746927B2 (en) * | 2010-09-30 | 2017-08-29 | France Telecom | User interface system and method of operation thereof |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8989492B2 (en) * | 2011-06-03 | 2015-03-24 | Apple Inc. | Multi-resolution spatial feature extraction for automatic handwriting recognition |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
TWI447619B (zh) * | 2011-12-15 | 2014-08-01 | Inventec Corp | 提供引導軌跡以輔助手勢輸入之系統及其方法 |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
CN103313212A (zh) * | 2012-03-16 | 2013-09-18 | 腾讯科技(深圳)有限公司 | 一种信息发送、接收的方法、发送终端及接收终端 |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
JP6125333B2 (ja) * | 2013-05-31 | 2017-05-10 | 株式会社東芝 | 検索装置、方法及びプログラム |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
KR101772152B1 (ko) | 2013-06-09 | 2017-08-28 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
CN110797019B (zh) | 2014-05-30 | 2023-08-29 | 苹果公司 | 多命令单一话语输入方法 |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10489051B2 (en) * | 2014-11-28 | 2019-11-26 | Samsung Electronics Co., Ltd. | Handwriting input apparatus and control method thereof |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
CN111222590B (zh) * | 2019-12-31 | 2024-04-12 | 咪咕文化科技有限公司 | 形近字确定方法、电子设备和计算机可读存储介质 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5580183A (en) | 1978-12-12 | 1980-06-17 | Nippon Telegr & Teleph Corp <Ntt> | On-line recognition processing system of hand-written character |
JPS60136892A (ja) * | 1983-12-26 | 1985-07-20 | Hitachi Ltd | オンライン手書き図形認識装置 |
JPS60237580A (ja) | 1984-05-11 | 1985-11-26 | Hitachi Ltd | オンライン手書文字認識方式 |
JPS61182185A (ja) | 1985-02-06 | 1986-08-14 | Nippon Tsushin Kensetsu Kk | 手書き文字認識装置 |
JPH03282896A (ja) | 1990-03-30 | 1991-12-13 | Toshiba Corp | パターン認識装置 |
IL100198A (en) * | 1991-11-29 | 1999-10-28 | Art Advanced Recognition Tech | Character recognition method |
US5901255A (en) * | 1992-02-07 | 1999-05-04 | Canon Kabushiki Kaisha | Pattern recognition method and apparatus capable of selecting another one of plural pattern recognition modes in response to a number of rejects of recognition-processed pattern segments |
US5774586A (en) * | 1994-05-04 | 1998-06-30 | Ncr Corporation | Method and apparatus for standardization of inputs to word recognition systems |
US6052481A (en) * | 1994-09-02 | 2000-04-18 | Apple Computers, Inc. | Automatic method for scoring and clustering prototypes of handwritten stroke-based data |
JP3444561B2 (ja) | 1994-11-01 | 2003-09-08 | 株式会社東芝 | 文字認識方法及び文字認識装置 |
DE19511470C1 (de) * | 1995-03-29 | 1996-10-24 | Siemens Ag | Verfahren zur Ermittlung eines Referenzschriftzuges anhand einer Menge von schreiberidentischen Musterschriftzügen |
DE19511472C1 (de) * | 1995-03-29 | 1996-10-17 | Siemens Ag | Verfahren zur dynamischen Verifikation eines Schriftzuges anhand eines Referenzschriftzuges |
-
2001
- 2001-01-15 SE SE0100114A patent/SE521911C2/sv not_active IP Right Cessation
- 2001-02-05 TW TW090102405A patent/TW573280B/zh not_active IP Right Cessation
-
2002
- 2002-01-11 JP JP2002556828A patent/JP2004518198A/ja active Pending
- 2002-01-11 US US10/466,087 patent/US7349576B2/en not_active Expired - Fee Related
- 2002-01-11 WO PCT/SE2002/000037 patent/WO2002056242A1/en active Application Filing
- 2002-01-11 CN CN028036778A patent/CN1488120B/zh not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101392295B1 (ko) | 2012-12-17 | 2014-05-12 | 한승희 | 한글 필적의 음절단위 분석 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
SE521911C2 (sv) | 2003-12-16 |
US20040096105A1 (en) | 2004-05-20 |
SE0100114D0 (sv) | 2001-01-15 |
CN1488120B (zh) | 2010-09-29 |
CN1488120A (zh) | 2004-04-07 |
US7349576B2 (en) | 2008-03-25 |
WO2002056242A1 (en) | 2002-07-18 |
TW573280B (en) | 2004-01-21 |
SE0100114L (sv) | 2002-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2004518198A (ja) | 手書文字を認識するための方法、デバイス及びコンピュータプログラム | |
US8180160B2 (en) | Method for character recognition | |
JP4787275B2 (ja) | セグメント化ベースの認識 | |
US7437001B2 (en) | Method and device for recognition of a handwritten pattern | |
EP0686931B1 (en) | Searching and matching unrecognized handwriting | |
US7778464B2 (en) | Apparatus and method for searching for digital ink query | |
US7369702B2 (en) | Template-based cursive handwriting recognition | |
US7630551B2 (en) | Method and system for line extraction in digital ink | |
CN102449640B (zh) | 识别手写单词 | |
US20050089226A1 (en) | Apparatus and method for letter recognition | |
US20030099398A1 (en) | Character recognition apparatus and character recognition method | |
US20100104189A1 (en) | Handwriting Identification Method, Program And Electronic Device | |
US5732154A (en) | Handwriting and character recognition system | |
CN111340020A (zh) | 一种公式识别方法、装置、设备及存储介质 | |
US7580573B2 (en) | Segmentation-based recognition | |
US20050276480A1 (en) | Handwritten input for Asian languages | |
JP3467437B2 (ja) | 文字認識装置及びその方法とプログラム記録媒体 | |
JP2013025390A (ja) | 手書き入力方法 | |
JP3812719B2 (ja) | 文書検索装置 | |
JP3066530B2 (ja) | オンライン手書文字認識装置 | |
JP2018112931A (ja) | 文字認識装置、文字認識プログラム及び文字認識方法 | |
JP4431335B2 (ja) | 文字列読み取りプログラム | |
Cha et al. | Writing speed and writing sequence invariant on-line handwriting recognition | |
JPH07141468A (ja) | 手書入力文字装置における手書文字認識処理方法 | |
JPH012186A (ja) | 手書き文字認識方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041210 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20050621 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070622 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20070921 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20071001 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20071019 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20071026 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071220 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080528 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20080630 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20080711 |