JP2005505868A - 手書き文字を復号化するための方法および装置 - Google Patents
手書き文字を復号化するための方法および装置 Download PDFInfo
- Publication number
- JP2005505868A JP2005505868A JP2003536980A JP2003536980A JP2005505868A JP 2005505868 A JP2005505868 A JP 2005505868A JP 2003536980 A JP2003536980 A JP 2003536980A JP 2003536980 A JP2003536980 A JP 2003536980A JP 2005505868 A JP2005505868 A JP 2005505868A
- Authority
- JP
- Japan
- Prior art keywords
- character
- segmentation
- model
- input
- stroke
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 230000011218 segmentation Effects 0.000 claims abstract description 116
- 238000011156 evaluation Methods 0.000 claims abstract description 3
- 230000008569 process Effects 0.000 claims description 32
- 238000012854 evaluation process Methods 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 15
- 238000004422 calculation algorithm Methods 0.000 description 12
- 238000013459 approach Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000003909 pattern recognition Methods 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000013479 data entry Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000003412 degenerative effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012880 independent component analysis Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007665 sagging Methods 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/142—Image acquisition using hand-held instruments; Constructional details of the instruments
- G06V30/1423—Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Character Discrimination (AREA)
- Facsimile Image Signal Circuits (AREA)
- Vending Machines For Individual Products (AREA)
- Character Input (AREA)
- Input From Keyboards Or The Like (AREA)
- Electronic Switches (AREA)
Abstract
【選択図】図8
Description
【0001】
本発明は、手書きデータエントリーをコンピュータまたはその他の処理装置に読み込んで復号化する方法に関し、より詳細には、必要であれば、個々の文字を1つかまたはそれ以上のプリミティブサブストロークに分解することを含む手書き文字認識方法に関する。
【背景技術】
【0002】
この明細書において参照されるすべての従来技術は、それらの従来技術が一般的に良く知られている知識の一部しか構成しない限り、本発明を想到させまたは何らかの形で示唆するものではなく、また、そのようなものであるとみなされるべきではない。
【0003】
ハンドヘルドコンピュータのような従来技術による処理装置は、手書きのデータ入力に基づいたユーザ命令を復号化することができる。その他の装置は、疑似手書き形式を用いてユーザがデータを入力することを強いる。そのような装置の1つの例は、Palm Computerであり、Graffitiとして知られている独自開発の入力形式を使用する。この入力形式は、ハンドヘルドコンピュータのユーザが、タッチスクリーン領域上において、プラスチックのスタイラスを予め定義された動きで動かすことによって、データを装置に入力するのを可能にし、それぞれの文字は、対応する「ストローク」を有し、そのストロークは、ほとんどの場合、実際の文字に類似している。
【0004】
そのようなシステムは、都合のよい大きさのキーボードを有するには携帯型装置があまりにも小さすぎる場合に利点を有するが、データを入力するために、ユーザは、人工「言語」を学習しなければならない。
【0005】
個々のユーザが有する手書き文字の様式の種類は、極めて多く、そのために、様々なユーザの手書き文字を自動コンピュータ認識するには、様々な問題が存在する。このために、商業的に実現可能な手書き文字認識システムは、コンピュータ装置において、まだ、あまり使用されていない。特定の装置の期待入力書体と一致するようにユーザがそのユーザの書き方を適合させることを必要とせずに手書き文字を読み込むことのできるシステムを提供することが望ましい。
【0006】
ほとんどのパターンまたは文字認識システムは、データの基本プリミティブを識別するために、また、入力におけるノイズレベルを最小限に抑制するために、入力信号のある種のセグメンテーションを実行する。また、特徴抽出中に使用される情報の量を減少させるために、セグメンテーションが実行され、入力信号のより抽象的な特徴において、パターン認識が発生するのを可能にする。
【0007】
手書き文字認識システムにおいては、多くの場合、個々のストロークは、前処理中に、いくつかのサブストロークプリミティブに分割される。そして、これらのプリミティブは、特徴抽出モジュールへ供給され、あるいは、パターン分類のために直接に使用される。筆記体活字または連結された活字の認識システムにおいては、ただ1つのストロークが、1つよりも多い字体を表現してもよく、したがって、セグメンテーションは、潜在的な字体セグメンテーション点を識別するのに使用される。
【0008】
人間運動システムの特性に基づいた簡単なアプローチも含めて、これまでに、多くのセグメンテーション技術が、研究団体によって発表されてきた。例としては、曲率最大値、重要点、および、速度極値において分割すること、あるいは、これらの技術の組み合わせ(例えば、曲率極値および速度最小値が同時に発生する点を探索する)が含まれる。別の研究は、弾道学的ジェスチャー検出を用いて、ストロークの独立成分分析、および、ストロークを分割するための正規性および特異性の概念を提案している。
【0009】
上述した処理は、セグメンテーションの基礎として、手書き文字の生成を使用するが、別の技術は、知覚処理に基づくものである。字体の視覚的な復号化に重要なことは、プリミティブの局所的相対位置からなるパーセプトロンであり、そのために、位置の極値が、字体形状の認識において重要な役割をなす。セグメンテーションのための基準に基づいたパーセプトロンは、X極値およびY極値、尖点、および、ストローク交点を含む。
【0010】
ストロークセグメンテーションは、ある特定の条件下においては、手書き文字認識システムの精度を改善することができるが、認識誤りの主要な発生源でもあり得る。運動に基づいたほとんどのストロークセグメンテーションアルゴリズムは、セグメンテーション点を選択するとき、ある種のしきい値を適用し、その結果、場合によっては、汚く書かれたストロークを一貫性を欠いて分離することになる。図2b)は、汚く書かれた字体「a」の曲率極値に基づいた正しくないセグメンテーションを示す。
【0011】
この例においては、ストロークのセグメンテーションは、より直線的な部分の上端における極端な曲率をセグメンテーション点として用いて、その直線的な部分から「a」の円形部分を分割または切り出すのに使用されている。図2a)は、正しいセグメンテーション点を示す(十字記号で示されるように)。しかしながら、図2b)は、円形部分中に曲率極値を有し、また、字体直線部分の開始点を指示する期待尖点が存在せず、その結果として、ストロークの正しくないセグメンテーションをもたらす。
【0012】
更に、手書き文字は、一連の弾道学的な運動(すなわち、開始点から最大速度まで加速し、そして、目標点において減速する)によって生成されるので、速度が、セグメンテーションのために使用される。速い速度の区間は、一般的には、直線であり、遅い速度は、通常、曲率の極値において発生する。しかしながら、速度は、また、しきい値処理問題の影響を受けやすく、それに加えて、ユーザは、ストロークを書いているときに休止することがあり、正しくないセグメンテーション点を発生させる。図3において、字体「a」のサンプリングされた点が、四角で示される。ペンの速度は、サンプル間の間隔から導き出すことができ(一定のサンプリング速度であると仮定すれば)、したがって、大きな間隔は、速い速度を示し、お互いに近接するサンプルは、遅い速度を示す。この例において、遅い速度(および、大きな曲率)の領域は、直線部分の上端に存在する尖点における、および、直線部分の下端に存在する小さな鉤状部分における、サンプルのクラスタと考えられる。しかしながら、遅い速度の別の領域が、(円形領域の左側に)存在し、その領域は、ダウンストロークにおいて躊躇する筆者(書き手)によってもたらされたものである。したがって、字体「a」は、明らかに、きちんと書かれているが、この速度に基づいたセグメンテーションは、一貫性のない結果をもたらすであろう。
【0013】
Y極値をセグメンテーション点として用いるような、知覚によるセグメンテーション技術は、一般的には、しきい値処理問題からの影響を受けない。なぜなら、点が局所的極値であるかどうかを決定するのに、数値を必要としないからである。しかしながら、これらの技術は、また、一貫性のないセグメンテーションからの影響を受ける。図4a)においては、字体「a」が、十字記号によって示されるように、ストロークの開始点の近くに位置するY極値において分割される。しかしながら、図4b)に示される第2の字体「a」は、明らかに、第1の字体と同じものであるが、このストロークは平坦になる傾向があるので、その位置にはY極値を含まない。
【0014】
その他のほとんどのセグメンテーション技術は、これらの問題からの影響を受け、とりわけ、汚く書かれた字体によって悪影響を受ける。ストロークセグメンテーションの困難且つ誤りを起こしやすい性質のために、多くのシステムは、どのような種類のストロークセグメンテーションも試みておらず、ただ単に、ユーザによって提供された分割されていない生のストロークを直接に処理する。ストロークセグメンテーションを実行しないそれらのシステムは、通常、一貫性のないセグメンテーションの影響を最小限に抑制するために、ある種の弾性マッチング処理を実行する。
【0015】
“Elastic Structural Matching For Recognizing Online Handwritten Alphanumeric Characters,”Technical Report HKUST−CS98−07,Department Of Computer Science,Hong Kong University,March 1998は、ストロークを複数の線分に分割するために、曲率の極値を使用することを開示している。しかしながら、これは、「汚い書き方のために滑らかなストロークがいくつかの部分に分割される」ことを認めており、そのために、正しくないセグメンテーションが発生する。それを阻止するために、これは、正しくないセグメンテーションを検出することを試みる一組の規則を提供し、誤って切り出されたサブストロークと組み合わせ、新しいストロークを形成する。
【0016】
“Handwritten Word Recognition−The Approach Proved By Practice”,Advances In Handwriting Recognition,Series in Machine Perception and Artificial Intelligence,34巻,153〜162頁,World Scientific Publishing Co.1999は、市販の光学的伝票読み取り装置において手書き筆記体ストロークを切り出すために、垂直速度におけるゼロ交差点を使用することを開示している。そして、サブストロークが、弾性マッチング認識器において使用されるべき一組のプリミティブ要素と照合される。
【0017】
“Global Methods for Stroke−segmentation”,Advances In Handwriting Recognition,Series in Machine Perception and Artificial Intelligence,34巻,225〜234頁,World Scientific Publishing Co.1999は、輪郭曲線近似に基づいたオフライン画像のストロークセグメンテーションを開示している。この方法においては、曲線は、三次Bスプライン曲線を用いて一次近似され、セグメンテーションは、曲率の極値点においてなされる。
【0018】
“A Fuzzy Online Handwriting Recognition System:FOHRES,”Proceedings of the 2nd International Conference on Fuzzy Theory and Technology,13−16 October,1993,Durham,NCは、ストロークを切り出すための一組のファジー論理規則を構成するために、言語学的変数からなるグループとともにペンの速度および方向のファジー論理表現を使用することを教示している。それらの切り出されたストロークは、ファジー特徴抽出のためのプリミティブとして使用される。
【0019】
“Recognizing Letters in Online Handwriting Using Hierarchical Fuzzy Inference”,4th International Conference Document Analysis and Recognition(ICDAR),August 18−20,1997,Ulm,Germanyは、尖点および水平接線を備えた点におけるストロークをいくつかの組のPStroke(部分的ストローク)に分割することを開示している。開示されたアルゴリズムは、(しばしば実行される点位置スムージングではなく)角度スムージングを実行するシステムを使用し、このシステムは、ペン軌跡の不連続な部分(すなわち、尖点)を変形させることがない。
【0020】
“Detection Of Extreme Points of Online Handwritten Scripts”,Progress In Handwriting Recognition,169〜176頁,2−5 September,1996,Colchester,UK.World Scientific Publishing Co.は、手書き文字認識のデルタ対数正規理論に基づいた曲率検出アルゴリズムのロバストな局所的極値を開示しており、そのデルタ対数正規理論は、“A Delta Lognormal Model for Handwriting Generation,”Proceedings of the 7th Biennial Conference of the International Graphonomics Society,126−127,1995に開示されている。ストロークをプリミティブ要素に分割するために、これは、角度信号強度および一次交差点の計算を使用することを開示している。
【0021】
“Perceptual Model of Handwriting Drawing Application to the Handwriting Segmentation Problem”,4th International Conference Document Analysis and Recognition(ICDAR),August 18−20,1997,Ulm,Germanyは、一組の「知覚基点」の検出に基づいてモデル化し且つ切り出すアプローチを開示している。要するに、これは、ペンアップ、鋭い屈曲点、および、尖点と、変曲点、X極値およびY極値、および、ストローク交点を含む「知覚点」などの不連続点として定義される「カタストロフィー点」と、を探索する。
【0022】
米国特許第6,275,611号は、「局所的角度変化が最大となり且つ設定されたしきい値を超える」点においてストロークを分割する文字認識システムを開示している。また、“Handwriting Recognition Device,Method and Alphabet,With Strokes Grouped Into Stroke Sub−Structures”,August 14,2001.を参照されたい。米国特許第5,740,273号は、セグメンテーションアルゴリズムについて詳細に説明している。同様に、米国特許第5,889,889号は、「急激な方向変化のような基準によって、また、ペンを持ち上げたことによって識別される」点を検出することによって、手書き文字認識装置においてストロークセグメンテーションを実行することを開示している。これは、圧縮および再生のために手書き文字入力をパラメトリック形式で表現するように構成されたシステムにおける同様のセグメンテーション処理を開示しており、「方向が急激に変化する角および尖点」においてストロークを分割する。また、米国特許第6,044,174号も参照されたい。
【0023】
米国特許第6,137,908号に記載される処理は、認識のためのストローク前処理の一部としてY極値を識別する。また、これらの極値間の中間点が、認識システムにおいて使用するための「フレーム」として、抽出および記憶される。
【0024】
同様に、米国特許第5,610,996号は、認識のためのプリミティブとして一連の円弧を使用することを開示しており、「その円弧は、サンプルテキスト上のY極値点において開始および終了する」。また、この文献は、X極値および組み合わせられたX−Y極値のような代替セグメンテーション体系を使用することを開示している。
【0025】
米国特許第4,024,500号は、筆記体ストロークを文字(弾道学的サブストロークプリミティブではなく)に分割するために、X極値およびY極値を使用することを開示している。
【0026】
米国特許第5,854,855号は、ストロークを切り出すために、速度分布を使用することを教示しており、「サブストローク境界を、手書き文字入力における選択された速度最小値に対応づける」。
【0027】
米国特許第5,577,135号は、Y極値においてストロークを切り出すことを開示しており、その結果として、隠れマルコフモデル(HMM)認識システムにおいて使用される一連のアップストロークおよびダウンストロークが得られる。米国特許第5,878,164号に記載される別のHMM認識システムにおいては、ストロークは、「ペンアップおよび尖点のような定義された境界条件に基づいて、字体または下位文字プリミティブに分割される」。
【0028】
参照された従来技術は、それぞれ、手書き入力テキストを認識する際の問題を解決するために、新しい技術を取り入れることを試みている。従来技術のそれぞれは、問題を改善するかもしれないが、上述したすべての問題を解決するロバストなシステムを提供するものは1つもない。
【発明の開示】
【0029】
範囲の広い形態において、本発明は、手書き文字認識を実行する方法を提供し、上記方法は、与えられた入力文字を記憶された一連の文字モデルの中の1つと順次に比較するステップを含み、上記比較するステップは、更に、現在の文字モデルに対応するセグメンテーション体系に基づいて、上記与えられた入力文字を1つかまたはそれ以上のセグメントに分解するステップと、上記現在の文字モデルに対応するセグメントモデルと比較して、上記1つかまたはそれ以上のセグメントを評価し、その結果として、上記評価が、上記モデルとの適合度を判定するスコアを生成するステップと、上記一連の文字モデルに含まれる複数の文字モデルに対して、上記比較するステップを反復するステップと、最も大きなスコアを割り当てられた文字モデルを選択し、上記入力文字をその文字モデルに対応する文字として分類するステップと、を含む。
【0030】
好ましくは、認識される上記文字は、文字、数字、または、句読点のうちの1つである。
【0031】
好ましくは、上記入力文字を1つかまたはそれ以上のセグメントに分解するステップは、
【数1】
(ここで、
lminは、セグメントの最小長であり、
piは、点iの座標であり、
nは、ストロークにおける点の数であり、
λは、最小長しきい値である)
という式に基づいて、それぞれのセグメントが最小長を有するように実行される。
【0032】
好ましくは、上記現在の文字モデルに対応するセグメンテーション体系に基づいて、上記与えられた入力文字を分割することができない場合、上記与えられた入力文字に一致する可能性があるものとして、上記現在の文字モデルは、拒否される。
【0033】
好ましくは、上記評価処理は、理想的なものに、より正確に一致するものによって高いスコアを割り当てる。
【0034】
好ましくは、上記評価処理は、ファジー論理規則を使用する。
【0035】
好ましくは、同じ文字の異なる形態を認識するのを容易にするために、それぞれの上記文字モデルは、複数のセグメンテーション体系をそれに対応づけられる。
【0036】
好ましくは、上記入力文字を1つかまたはそれ以上のセグメントに分解する異なる規則が、異なる文字モデルに対して定義されてもよい。
【0037】
また、装置が、提供され、上記装置は、スタイラスの運動に感応して入力刺激を生成する入力表面と、メモリーと、上記入力刺激を受け取り、そして、上記入力刺激を処理するプロセッサであって、上記プロセッサは、本発明の範囲の広い形態による方法を実行するように構成された、上記プロセッサとを含む。
【0038】
手書き文字認識のためのストロークセグメンテーション処理が、開示される。評価されるモデルに依存するセグメンテーションアルゴリズムを変更することによって、一貫性があり且つロバストな一組のストロークプリミティブが得られ、その一組のストロークプリミティブは、特徴抽出および分類に使用することができる。更に、このセグメンテーション処理を使用するファジー論理識別器の例が、説明される。
【発明を実施するための形態】
【0039】
添付の図面を参照して、本発明の好ましい限定するものではない実施形態の単なる例として提供される以下の説明から、本発明を容易に理解できるであろう。
【0040】
本発明の主題をより正確に理解するために、本明細書および添付の特許請求の範囲に適用される以下の態様を説明する。
【0041】
以下の例は、本発明の一実施形態のより詳細な概要を提供するものである。これらの例は、ただ単に本発明を説明するためのものであり、本発明の範囲を限定するものではない。
【0042】
本発明は、手書き文字認識を実行するための方法を提供する。また、その方法を実行するための装置を提供する。本発明の特徴を説明するために添付された図面においては、すべての図面を通して、同じ符号が、類似する部分を識別するのに使用される。
【0043】
本発明の実施形態による方法は、処理システムを用いて実行されてもよく、その処理システムの例が、図1に示される。
【0044】
具体的には、処理システム10は、一般的には、図示されるようにバス24を介してお互いに結合された、プロセッサ20、メモリー21、グラフィックスタブレットおよび/またはタッチスクリーンのような入力装置22、および、ディスプレイのような出力装置23を少なくとも含む。また、データベースのような記憶装置11に処理システムを結合するために、符号25によって示されるように、外部インタフェースが、提供される。更に、ユーザがテキストをシステム10に入力できるように、スタイラスが、使用されてもよい。
【0045】
使用する際、処理システムは、モデルデータおよび規則データを、データベース11に記憶し且つそのデータベース11から取り出すことができるように構成される。これによって、プロセッサは、入力装置22を介して、手書き文字データを受け取り、その手書き文字データを処理し、そして、それを記憶装置に記憶されたデータと比較することができる。そして、これは、処理システムが、手書きテキストに含まれる文字を認識するのを可能にする。このことから、処理システム10は、コンピュータ、ラップトップ型コンピュータ、サーバー、専門ハードウェア、または、それらに類似するものなど、どのような形態の処理システムであってもよいことがわかる。
【0046】
以下、処理システム10の動作をより詳細に説明する。
【0047】
ここで、手書き文字を認識するためのストロークセグメンテーションへのモデル固有アプローチが、モデル固有アルゴリズムの例も含めて説明される。また、処理を最適化するための技術も説明される。
【0048】
従来技術に関連して上述したストロークセグメンテーションの発見的方法は、手書き文字入力は大きく変化するために、一貫性のあるセグメンテーション点をいつも提供するとは限らないことは明らかである。問題の一部分は、字体認識とは無関係に動作するセグメンテーション処理によって発生する。これは、退化的状況は誤った結果を提供することを意味し、これらのセグメンテーションの失敗は、セグメントをただ1つの文字と相関させることを試みる識別器において検出および修正するのが難しい。
【0049】
手書き文字の曖昧さのために、グラフィックシンボルは、局所的文脈に依存した様々な意味を有してもよく、例えば、曖昧な字体構成は、構文情報および意味情報(辞書または文字文法のような)に基づいて、様々に解釈されてもよい。同様に、個々の字体を構成する個々のストロークおよびサブストロークは、正しい解釈がなされることを保証するために、局所的文脈によって解釈されなければならない。
【0050】
モデル固有ストロークセグメンテーションを使用する本発明の実施形態は、手書き文字ストロークのセグメンテーションを延期し、セグメンテーションは、分類処理と統合される。その結果、これは、セグメンテーション処理によって使用される字体モデルによって予測されるセグメンテーション点の種類に関するより多くの情報をもたらす。ストロークを切り出すのに使用される尺度は、認識されている文字列から得られる現在の文字の期待構造に基づいたものであり、したがって、単一の大域的セグメンテーション処理は、使用されない。
【0051】
それぞれの字体プロトタイプ、異綴り体、または、文字モデルが、入力と比較されるので、たとえどのような技術が重要点を識別しようとも、その重要点に基づいて、入力ストロークが、切り出され、その結果、より大きな一貫性を有して、ストロークをプリミティブに分解することができる。更に、セグメンテーション処理が、特定の字体モデルに対する期待セグメンテーション点の検出に失敗することは、そのモデルの更なる解析を必要としないことを意味し、入力の全体構造に一致しないモデルを効率的に選び出すことができる。
【0052】
実際には、ユーザが、スタイラスを用いて文字を入力し、本発明の実施形態を実施するためのプログラムを実行するプロセッサが、まず最初に、入力字体が「a」であるかどうかを検査し、そして、「a」に期待されることに基づいて、入力を切り出すことを試みる。そして、プロセッサは、入力を例えば「b」〜「z」のような可能性のあるいくつかのまたはすべてのデータエントリーと照合することを続行し、それぞれの試みにスコアをつける。このようにして、最もぴったりと一致する結果が、入力字体として分類される。適切なスコア体系が、後に開示される。
【0053】
特定の字体が書かれるであろう様々な様式を考慮に入れるために、字体ごとにいくつかのモデルが存在してもよい。例えば、ある人は、字体「z」を横にして大文字の「N」に見えるように書き、また、別の人は、字体「z」を数字の「3」に類似するように書く。
【0054】
それぞれの字体モデルは、実行されるべきセグメンテーション処理を潜在的に必要とするが、多くのモデルは、同一かまたは類似するセグメンテーション点を使用し、これは、セグメンテーション処理のオーバーヘッドを減少させるために、これらの点が保存されてもよいことを意味することに注意されたい。例えば、字体「y」および「g」は、類似する垂れ下がった下部セグメントを有し、それらのセグメントが、上述したように、保存されてもよい。
【0055】
認識は、信号から雑音を除去するための何らかの簡単な前処理から開始する。これは、サンプリングされた点をスムージングし(サンプリング処理に雑音があれば)、また、さもなければ認識処理を混乱させるかもしれない鉤状部分をストロークの開始点および終了点から除去するような技術を含んでもよい。また、点は、重複する点を除去することによって、あるいは、サンプル間の最小距離を実現するために再サンプリングすることによって、正規化されてもよい。
【0056】
手書き文字識別器において定義されたそれぞれの字体モデルは、入力ストロークに対して実行されるセグメンテーション処理を定義する。セグメンテーションは、ストロークを一連のサブストロークに分割するのに使用される一組のセグメンテーション点を提供する。アルゴリズムは、一度に1つのストロークしか処理しない。構造的に適切であるには小さすぎるストロークのサブセグメントを生成するのを防止するために、最小サブストローク長が、ストロークの全体長に基づいて計算される。
【数1】
ここで、
Piは、点iの座標であり、
nは、ストロークにおける点の数であり、
λは、最小長しきい値(経験的に0.05に設定される)である。
【0057】
セグメンテーションは、アルゴリズムが現在の字体モデルによって定義された潜在的なセグメンテーション点を識別するまで、すべてのサンプルに対してそのアルゴリズムを反復して実行する。正しい点を検出することができなければ、アルゴリズムは、失敗であることを戻し、字体モデルによって予測された構造と入力が一致しないことを指示する。正しい点が検出された場合、この点においてストロークを分割することによって生成された2つのサブストロークが、lminよりも大きければ、ストロークは、その点において分割され、処理は、ストロークの残りの部分に対して続行される。どちらか一方のサブストロークが、lminよりも小さければ、そのセグメンテーション点は無視され、処理は続行する。すべてのセグメンテーション点が、正しく識別されると、処理は、終了し、そして、セグメンテーションが成功したことを認識装置に指示する。
【0058】
字体モデルは、手書き文字字体の期待構造によって指示される任意のどのようなセグメンテーション技術を使用してもよく、また、あるモデルは、どのようなストロークセグメンテーションをも必要としないかもしれないことに注意されたい。例えば、「c」および「o」のための簡単なモデルは、ストロークをサブストロークプリミティブに細分化することを試みなくても、あっさりと正確に入力と一致するかもしれない。一般的には、これらの単一弾道学的ジェスチャーのセグメンテーションから得ることのできる情報は何もなく、分割されていないストロークと一致させることによって、従来のセグメンテーション技術によって発生することのある問題(例えば、滑らかな速度曲率分布は、筆者の書体に依存して、不定の点においてセグメンテーションを発生させることがある)を回避することができる。
【0059】
以下の例は、様々なモデルのためのセグメンテーション処理を説明する。図5は、字体「a」の単一ストローク異綴り体のセグメンテーションに使用される重要点30、32を示す。
【0060】
このストロークが字体直線部分の上端32において切り出されることをモデルが期待していると仮定すれば、セグメンテーションアルゴリズムは、最初に、第1のY最小値30を探索し、この点30に続いて、Y最大値32を検出することを試みる。Y最大値が、検出されると、その点は、セグメンテーション点に指定される。Y最小値30はセグメンテーションに使用されるのではなく、正しいY最大値点32が検出されることをただ単に保証するだけであることに注意されたい。最初のY最小値30をまず最初に探索しなければ、正しくないY最大値が探索されるかもしれない(図4bに示されるように)。また、この処理は、図1〜図3に関して上述したすべての例に対して正しいセグメンテーション点を検出することに注意されたい。
【0061】
逆の例として、上で定義された「a」モデルを用いて、ユーザによって入力された手書き文字「c」を照合することを考える。Y最小値は検出されるが、それに続くY最大値の探索は失敗する。終了点は、セグメンテーション点と一致しない。その結果として、セグメンテーション処理は失敗し、入力が、モデルの全体構造と一致しないことを指示し、それによって、潜在的一致のリストからそのモデルを除去することができる。
【0062】
上述したセグメンテーション処理は、いくつかの字体モデルに対しては良好に動作するが、別のモデルは、異なるアルゴリズムを必要とする。簡単な例として、図6は、字体「b」のモデルに対するセグメンテーションを示す。
【0063】
「b」のこの単一ストローク異綴り体を分割するために、第1のY最小値が検出され、セグメンテーション点40として使用され、垂直線サブストロークおよび曲線状の「o」字形サブストロークを提供する。より複雑なセグメンテーション処理が、図7に示される。
【0064】
字体「B」の上述した単一ストロークモデルにおいては、第1のセグメンテーション点が、第1のY最小値50において検出される。これに続いて、Y最大値52が検出され、それに続いて、X最小値54が検出され、そのX最小値54は、第2のセグメンテーション点として使用される。図8は、切り出された字体を示す。
【0065】
結果は、図8a)に示されるような最初の垂直線サブストローク、それに続く、図8b)に示される曲線状の「p」サブストローク、それに続く、図8c)に示される「横を向いたu」サブストロークである。このセグメンテーションアプローチは、曲率および速度の変化に対してロバストなものであり、様々な書き方に対して一貫性のあるセグメンテーションを提供する。他方において、従来技術において使用される大域的セグメンテーション処理は、上述したような手書き文字の字体の極めて一貫性のないセグメンテーションを提供することがあり、それは、ペンストロークの曲率の程度および一貫性のある速度に依存する。
【0066】
X極値およびY極値を用いてすべての字体モデルを一貫性をもって切り出すことができるわけではない。例えば、図9は、字体「E」の2ストローク異綴り体のセグメンテーションを示す。
【0067】
セグメンテーション点60および62を検出するためにX最小値を使用することは、とりわけ、字体がいくぶん回転または傾斜している場合には、成功しないことがある。同様に、Y最小値を使用することは、必ずしも正しいセグメンテーションを提供するとは限らない。この異綴り体の場合、第1のストロークに存在する最も大きな角度変化を有する2つの点が、セグメンテーションに使用されてもよい。角度しきい値は、これらの点を検出するのに必要とされないことに注意されたい。なぜなら、最も大きな曲率を有する2つの点は、それぞれの点における曲率値を分類することによって、容易に検出することができるからである。より高度な処理が、考えられ、例えば、セグメンテーション点は、ほぼ等しい長さのサブストロークを提供することを保証する。大まかに言えば、正しいセグメンテーション点が一貫性をもって検出されるのを保証するために、入力ストロークの何らかの構造的特徴に基づいた任意に複雑なモデル固有セグメンテーションが、実行されてもよい。
【0068】
字体「a」に関して上述したセグメンテーション処理は、曲線状領域、それに続く尖点、それに続くダウンストロークを有する基本構造(例えば、「d」、「g」、「u」、「y」などのいくつかの異綴り体)を理解するすべての字体モデルに対してうまく動作する。その結果として、検出されたサブストロークは、これらの類似する構造を有するモデルに一致すれば、後に使用するために記憶されてもよい。更に、分類する前に、サブストロークが、特徴表現に変換される場合、特徴を反復して抽出するのを回避するために、特徴ベクトルが、記憶されてもよい。
【0069】
使用することのできる多くのストロークセグメンテーション技術は、サブストローク距離および曲率情報を必要とする。ストロークセグメンテーションが実行されるたびにこれらの値を計算し直すのを回避するために、二次的データ構造が、生成され、ストローク上のそれぞれの点とともに距離および曲率の値を記憶することによって、それらの値を保存してもよい。
【0070】
以下の記述は、モデル固有ストロークセグメンテーションを手書き文字の認識にどのように使用できるかを説明する。例は、ファジー論理型識別器に基づくものであるが、当業者には、この技術が、ストロークセグメンテーションを使用できるどのような種類の識別器とともに使用されてもよく、且つ、構造的(弾性マッチングのような)および統計学的な識別器にこの処理を容易に組み込むことができることは明らかなことである。
【0071】
手書き文字の曖昧なものおよび様式的な変種をモデル化するための1つのアプローチは、ファジー論理を使用することであり、これは、正確に定義されていないいくつかの組の基準を定義するのを可能にする。ファジー論理識別器は、モデルを表現するファジー規則に特徴がどのくらい良好に一致するかに応じて、入力信号のメンバーシップ度をファジーモデルに割り当てることによって、うまく動作する。手書き文字認識のための適切なファジー論理識別器が、“A New Fuzzy Geometric Representation for On−Line Isolated Character Recognition”,International Conference on Pattern Recognition(ICPR’98),1121〜1123頁,1998、および、“Fuzzy Feature Description of Handwriting Patterns”,Pattern Recognition,30巻,第10号,1591〜1604頁,1997により詳細に説明されている。
【0072】
例として、直線を定義するファジー論理規則は、以下の集合、すなわち、垂直線(VL)、水平線(HL)、正の傾斜を有する線(PS)、および、負の傾斜を有する線(NS)を含んでもよい。当然ながら、ほとんどの線は、これらの制限された集合の範囲内で完全に一致することはなく、通常、これらの集合の中の少なくとも2つに対するメンバーシップ度を有する。したがって、ファジー論理は、集合メンバーシップが離散的ではなくむしろ漸進的である論理的集合表記を定義する。図10は、直線の場合に考えられる一組のグループメンバーシップ関数を示し、正規化された向き(単位:度)によって定義される。
【0073】
図10は、一連の鐘状曲線を示す。例えば、符号VLを付された曲線は、垂直線を意味し、真の水平線と比較して45°よりわずかに小さい角度から135°よりわずかに大きい角度までの範囲にほぼ存在する角度を有する一組の線によって定義され、90°に最も近い線は、より大きな重み付けを有する。水平線(HL)、負の傾斜を有する線(NS)、および、正の傾斜を有する線(PS)に対して、類似する曲線が、示される。
【0074】
ファジー論理識別器は、例えば、個々の字体モデルを定義する一組の規則からなる。これらの規則は、ストロークおよびサブストロークのプリミティブを一組の包括的ストローク形状と照合する。また、規則は、類似するプリミティブからなる字体を識別するのに使用される相対的な位置情報を含む。使用される言語学的プリミティブは、図11a)に示される「o」字形曲線(OC)、図11b)に示される「c」字形曲線(CC)、図11c)に示される「d」字形曲線(DC)、および、図11d)に示される右へ湾曲した垂直線(RVC)を含む。
【0075】
以下の情報、すなわち、絶対的ストローク曲率、ストロークの境界ボックスに対する開始点および終了点の相対的位置、および、開始点と終了点との間に存在する線の向きを用いて、それぞれのサブストロークごとに、これらのプリミティブ集合におけるメンバーシップ度が、ストロークの簡単な構造的解析に基づいて計算される。
【0076】
位置的なプリミティブであるLEFT、RIGHT、TOP、CENTRE、および、BOTTOMは、字体の境界ボックス内におけるストローク位置を指示し、また、上述した直線のプリミティブ(VL、HL、PS、NS)も使用される。いくつかの典型的な規則の例には、
がある。
【0077】
上述した規則において、「|」記号は、ファジーORを示し、「&」記号は、ファジーANDを示し、「()」は、論理的順位を示し、「,」は、ファジーANDを用いたサブストロークの合成を示す(すなわち、「,」の左側にある式は、第1のサブストロークを用いて評価され、「,」の右側にある式は、第2のサブストロークを用いて評価され、その結果が、ファジーANDを用いて組み合わせられる)。
【0078】
例として、第1の規則は、次のように解釈することができる。すなわち、「a」字体は、その字体の左側に配置され且つ垂直方向において中央に配置された「o」字形曲線または「c」字形曲線、および、それに続く、その字体の右側に配置された垂直線または右へ湾曲した垂直曲線である。それぞれの字体ごとに多くの別の規則が存在し、手書き文字の様々な様式をモデル化してもよいことに注意されたい。
【0079】
これらの規則は、それぞれの字体モデルごとにプリミティブがどのように組み立てられるかを表現するものであるが、ストロークがプリミティブにどのように分解されるかを指示してはいない。これを実現するために、それぞれの規則は、規則が評価される前に入力ストロークに対して実行されるモデル固有セグメンテーション規則に対応づけられる。
【0080】
MAXYは、次のY最大値を探索することを表す。MINYは、次のY最小値を探索することを表す。「→」記号は、左側に定義された点がまず最初に検出されるが、セグメンテーションには使用されないことを示し、むしろ、それに続く点が正しく探索されることを保証するために検出される。「c」モデルの分類はただ1つのストロークしか必要とせず、そのために、そのモデルに対しては、セグメンテーションが実行されないことに注意されたい。「k」モデルが、指定された順序で検出される複数のセグメンテーション点を含む規則の例として示される。
【0081】
ストロークセグメンテーションが、モデル固有規則を用いて実行されると、サブストロークが、包括的ストローククラスにおけるメンバーシップ度によって分類される。そして、これらのメンバーシップ値は、構造規則を評価するのに使用され、入力がどのくらい良好に字体モデルと一致するかという指示を与える。それぞれの字体モデルが、同様に、評価され、入力が、最も大きなファジーメンバーシップ値を与えるモデルのクラスに分類される。
【0082】
要するに、それぞれの入力は、それぞれの規則に照らして、吟味され、それぞれの規則は、更に、吟味される文字と入力文字が同じものであるという予測に取り入れられるべきセグメンテーションアプローチを定義する。入力文字が規則によって吟味される文字と一致しないために、特定の文字モデルに対するセグメンテーションを実行することができなければ、ゼロまたは小さなスコアが、分類するときのその試みに付与される。
【0083】
また、本発明は、本出願の明細書において個々にまたは集合的に言及または開示された2つかまたはそれ以上の部品、構成要素、および、特徴のいずれかまたはすべてを組み合わせてそれらの部品、構成要素、および、特徴から構成されるように、広い範囲で論じられてもよく、ここでは、特定の完全体について言及したが、それらの完全体は、本発明が属する分野において知られている同等のものを有し、そのような良く知られている同等のものは、個々に説明したように、本発明に含まれると考えられる。
【0084】
好ましい実施形態を詳細に説明したが、ここで、当業者は、上述され且つ特許請求の範囲において請求された本発明の範囲から逸脱することなく、様々な変更、置換、および、代替をなすことができることを理解すべきである。
【図面の簡単な説明】
【0085】
【図1】本発明の実施形態を説明する図であり、ユーザ入力を受け取り、そして、本発明の更なる実施形態に基づいてそのユーザ入力を処理するように構成された処理システムが示される。
【図2a】字体「a」のきちんと書かれたバージョンを示す図である。
【図2b】字体「a」の汚く書かれたバージョンを示す図である。
【図3】字体「a」を解釈するのに速度セグメンテーションをどのように使用できるか、および、それに関連する問題を説明する図である。
【図4a】字体「a」を復号化するのにy極値を使用した場合の問題を説明する図である。
【図4b】字体「a」を復号化するのにy極値を使用した場合の問題を説明する図である。
【図5】字体「a」のセグメンテーションを示す図である。
【図6】字体「b」のセグメンテーションを示す図である。
【図7】字体「B」のセグメンテーションを示す図である。
【図8a】字体「B」の個々のセグメントを示す図である。
【図8b】字体「B」の個々のセグメントを示す図である。
【図8c】字体「B」の個々のセグメントを示す図である。
【図9】字体「E」のセグメンテーションを示す図である。
【図10】ファジーグループメンバーシップを線の向き(単位:度)に基づいて示す図である。
【図11a】文字認識に使用される包括的ストロークプリミティブの選択を示す図である。
【図11b】文字認識に使用される包括的ストロークプリミティブの選択を示す図である。
【図11c】文字認識に使用される包括的ストロークプリミティブの選択を示す図である。
【図11d】文字認識に使用される包括的ストロークプリミティブの選択を示す図である。
Claims (9)
- 手書き文字認識を実行する方法であって、与えられた入力文字を記憶された一連の文字モデルの中の1つと順次に比較するステップを含み、前記比較するステップが、更に、
現在の文字モデルに対応するセグメンテーション体系に基づいて、前記与えられた入力文字を1つかまたはそれ以上のセグメントに分解するステップと、
前記現在の文字モデルに対応するセグメントモデルと比較して、前記1つかまたはそれ以上のセグメントを評価し、その結果として、前記評価が、前記モデルとの適合度を判定するスコアを生成するステップと、
前記一連の文字モデルに含まれる複数の文字モデルに対して、前記比較するステップを反復するステップと、
最も大きなスコアを割り当てられた文字モデルを選択し、前記入力文字をその文字モデルに対応する文字として分類するステップと、
を含む方法。 - 認識される前記文字が、文字、数字、または、句読点のうちの1つである、請求項1に記載の方法。
- 前記現在の文字モデルに対応するセグメンテーション体系に基づいて、前記与えられた入力文字を分割することができない場合、前記与えられた入力文字に一致する可能性があるものとして、前記現在の文字モデルが拒否される、請求項1〜3のいずれか一項に記載の方法。
- 前記評価処理が、理想的なものに、よりぴったりと一致するものにより高いスコアを割り当てる、請求項1〜4のいずれか一項に記載の方法。
- 前記評価処理が、ファジー論理規則を使用する、請求項5に記載の方法。
- 同じ文字の異なる形態を認識するのを容易にするために、それぞれの前記文字モデルが、複数のセグメンテーション体系をそれに対応づけられる、請求項1〜6のいずれか一項に記載の方法。
- 前記入力文字を1つかまたはそれ以上のセグメントに分解する異なる規則が、異なる文字モデルに対して定義されてもよい、請求項1〜7のいずれか一項に記載の方法。
- 手書き文字認識を実行するための装置であって、
スタイラスの運動に感応して入力刺激を生成する入力表面と、
メモリーと、
前記入力刺激を受け取り、そして、前記入力刺激を処理するプロセッサであって、前記プロセッサが、請求項1から請求項8までのいずれかに記載の方法を実行するように構成された、前記プロセッサと、
を備える装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
AUPR8245A AUPR824501A0 (en) | 2001-10-15 | 2001-10-15 | Methods and systems (npw003) |
PCT/AU2002/001393 WO2003034325A1 (en) | 2001-10-15 | 2002-10-15 | A method and apparatus for decoding handwritten characters |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2005505868A true JP2005505868A (ja) | 2005-02-24 |
JP2005505868A5 JP2005505868A5 (ja) | 2005-12-22 |
JP4274941B2 JP4274941B2 (ja) | 2009-06-10 |
Family
ID=3832070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003536980A Expired - Fee Related JP4274941B2 (ja) | 2001-10-15 | 2002-10-15 | 手書き文字を復号化するための方法および装置 |
Country Status (12)
Country | Link |
---|---|
US (6) | US7359551B2 (ja) |
EP (1) | EP1444642B1 (ja) |
JP (1) | JP4274941B2 (ja) |
KR (1) | KR100651762B1 (ja) |
CN (1) | CN100533470C (ja) |
AT (1) | ATE386989T1 (ja) |
AU (3) | AUPR824501A0 (ja) |
CA (1) | CA2463230C (ja) |
DE (1) | DE60225170T2 (ja) |
IL (1) | IL161383A0 (ja) |
WO (1) | WO2003034325A1 (ja) |
ZA (1) | ZA200402925B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102581822B1 (ko) * | 2023-04-18 | 2023-09-26 | (주)핸듀 | 교육용 프로그램에서 문자를 인식하는 방법 |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030202097A1 (en) | 2000-10-26 | 2003-10-30 | Autoliv Development Ab | Night vision arrangement |
AUPR824501A0 (en) * | 2001-10-15 | 2001-11-08 | Silverbrook Research Pty. Ltd. | Methods and systems (npw003) |
US7995095B2 (en) | 2001-10-18 | 2011-08-09 | Autoliv Development Ab | Night vision device for a vehicle |
US20050281467A1 (en) * | 2003-01-24 | 2005-12-22 | Stahovich Thomas F | Recognizing multi-stroke symbols |
AU2003900865A0 (en) * | 2003-02-26 | 2003-03-13 | Silverbrook Research Pty Ltd | Methods, systems and apparatus (NPW010) |
CN100405389C (zh) * | 2004-08-06 | 2008-07-23 | 摩托罗拉公司 | 从划线标记识别字符的方法和装置 |
US20090300554A1 (en) * | 2008-06-03 | 2009-12-03 | Nokia Corporation | Gesture Recognition for Display Zoom Feature |
KR101080255B1 (ko) | 2009-07-21 | 2011-11-08 | (주)펜앤프리 | 필기 패턴에 따른 필기 정보 입력 장치 및 필기 정보 입력 방법 |
CN101916378B (zh) * | 2010-07-20 | 2013-01-09 | 青岛海信网络科技股份有限公司 | 易混淆字符的识别方法及装置 |
US8363947B2 (en) | 2010-07-31 | 2013-01-29 | International Business Machines Corporation | Handwritten character recognition based on frequency variations in characters |
US8768062B2 (en) * | 2010-11-09 | 2014-07-01 | Tata Consulting Services Limited | Online script independent recognition of handwritten sub-word units and words |
US20120281919A1 (en) * | 2011-05-06 | 2012-11-08 | King Abdul Aziz City For Science And Technology | Method and system for text segmentation |
CN102968265B (zh) * | 2011-09-01 | 2015-12-16 | 晨星软件研发(深圳)有限公司 | 将触控点转换为输入文字的方法及触控装置 |
US8873813B2 (en) | 2012-09-17 | 2014-10-28 | Z Advanced Computing, Inc. | Application of Z-webs and Z-factors to analytics, search engine, learning, recognition, natural language, and other utilities |
US11195057B2 (en) | 2014-03-18 | 2021-12-07 | Z Advanced Computing, Inc. | System and method for extremely efficient image and pattern recognition and artificial intelligence platform |
US8311973B1 (en) | 2011-09-24 | 2012-11-13 | Zadeh Lotfi A | Methods and systems for applications for Z-numbers |
US9916538B2 (en) | 2012-09-15 | 2018-03-13 | Z Advanced Computing, Inc. | Method and system for feature detection |
US11074495B2 (en) | 2013-02-28 | 2021-07-27 | Z Advanced Computing, Inc. (Zac) | System and method for extremely efficient image and pattern recognition and artificial intelligence platform |
US11914674B2 (en) | 2011-09-24 | 2024-02-27 | Z Advanced Computing, Inc. | System and method for extremely efficient image and pattern recognition and artificial intelligence platform |
US20130106894A1 (en) | 2011-10-31 | 2013-05-02 | Elwha LLC, a limited liability company of the State of Delaware | Context-sensitive query enrichment |
US9082005B2 (en) * | 2012-03-19 | 2015-07-14 | Disney Enterprises, Inc. | Smart scribbles for sketch segmentation |
JP5284523B1 (ja) * | 2012-09-05 | 2013-09-11 | 株式会社東芝 | 情報処理システム、プログラムおよび情報処理システムの処理方法 |
US9330331B2 (en) | 2013-11-11 | 2016-05-03 | Wipro Limited | Systems and methods for offline character recognition |
US9286527B2 (en) | 2014-02-20 | 2016-03-15 | Google Inc. | Segmentation of an input by cut point classification |
US9524440B2 (en) * | 2014-04-04 | 2016-12-20 | Myscript | System and method for superimposed handwriting recognition technology |
US9384403B2 (en) | 2014-04-04 | 2016-07-05 | Myscript | System and method for superimposed handwriting recognition technology |
US20160154555A1 (en) * | 2014-12-02 | 2016-06-02 | Lenovo (Singapore) Pte. Ltd. | Initiating application and performing function based on input |
CN104537347A (zh) * | 2014-12-25 | 2015-04-22 | 安徽寰智信息科技股份有限公司 | 一种基于云端分析和模型匹配的唇形识别文字输入方法 |
US10402734B2 (en) * | 2015-08-26 | 2019-09-03 | Google Llc | Temporal based word segmentation |
CN105512692B (zh) * | 2015-11-30 | 2019-04-09 | 华南理工大学 | 基于blstm的联机手写数学公式符号识别方法 |
US10163004B2 (en) * | 2017-03-30 | 2018-12-25 | Konica Minolta Laboratory U.S.A., Inc. | Inferring stroke information from an image |
US10748031B1 (en) | 2019-05-22 | 2020-08-18 | Read-Ink Corporation | Handwriting recognition systems and methods |
CN110503101A (zh) * | 2019-08-23 | 2019-11-26 | 北大方正集团有限公司 | 字形评价方法、装置、设备及计算机可读存储介质 |
CN110866499B (zh) * | 2019-11-15 | 2022-12-13 | 爱驰汽车有限公司 | 手写文本识别方法、系统、设备及介质 |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3755780A (en) * | 1971-06-28 | 1973-08-28 | Pattern Analysis & Recognition | Method for recognizing characters |
JPS51115718A (en) * | 1975-02-24 | 1976-10-12 | Pioneer Electronic Corp | Bi-directional catv system |
US4345245A (en) * | 1979-11-26 | 1982-08-17 | Eltra Corporation | Method and apparatus for arranging segmented character groups in a digital typesetter |
US4731857A (en) * | 1984-06-29 | 1988-03-15 | International Business Machines Corporation | Recognition system for run-on handwritten characters |
US4837842A (en) * | 1986-09-19 | 1989-06-06 | Holt Arthur W | Character and pattern recognition machine and method |
US4864618A (en) | 1986-11-26 | 1989-09-05 | Wright Technologies, L.P. | Automated transaction system with modular printhead having print authentication feature |
US5051736A (en) | 1989-06-28 | 1991-09-24 | International Business Machines Corporation | Optical stylus and passive digitizing tablet data input system |
CA2077970C (en) * | 1991-11-19 | 1999-02-23 | Daniel P. Huttenlocher | Optical word recognition by examination of word shape |
US5852434A (en) | 1992-04-03 | 1998-12-22 | Sekendur; Oral F. | Absolute optical position determination |
US5477012A (en) | 1992-04-03 | 1995-12-19 | Sekendur; Oral F. | Optical position determination |
US5491758A (en) * | 1993-01-27 | 1996-02-13 | International Business Machines Corporation | Automatic handwriting recognition using both static and dynamic parameters |
JP2682416B2 (ja) | 1993-12-24 | 1997-11-26 | 日本電気株式会社 | 図形認識装置 |
US5745599A (en) * | 1994-01-19 | 1998-04-28 | Nippon Telegraph And Telephone Corporation | Character recognition method |
DE4407998C2 (de) * | 1994-03-10 | 1996-03-14 | Ibm | Verfahren und Vorrichtung zur Erkennung eines Musters auf einem Beleg |
US7103460B1 (en) * | 1994-05-09 | 2006-09-05 | Automotive Technologies International, Inc. | System and method for vehicle diagnostics |
US20050192727A1 (en) * | 1994-05-09 | 2005-09-01 | Automotive Technologies International Inc. | Sensor Assemblies |
US5652412A (en) | 1994-07-11 | 1997-07-29 | Sia Technology Corp. | Pen and paper information recording system |
US5652414A (en) * | 1994-08-18 | 1997-07-29 | Otis Elevator Company | Elevator active guidance system having a coordinated controller |
DE19581757T1 (de) * | 1994-09-09 | 1997-08-21 | Motorola Inc | Verfahren und System zum Erkennen einer Grenze zwischen Zeichen in einem handgeschriebenen Text |
JP3027321B2 (ja) * | 1994-09-27 | 2000-04-04 | 財団法人工業技術研究院 | 拘束のない手書き英数字のオンライン認識の方法及び装置 |
US5661506A (en) | 1994-11-10 | 1997-08-26 | Sia Technology Corporation | Pen and paper information recording system using an imaging pen |
JP3445680B2 (ja) | 1995-03-10 | 2003-09-08 | シャープ株式会社 | 手書き認識装置 |
US5706364A (en) * | 1995-04-28 | 1998-01-06 | Xerox Corporation | Method of producing character templates using unsegmented samples |
JPH0935001A (ja) | 1995-07-21 | 1997-02-07 | Oki Electric Ind Co Ltd | 筆記文字認識方法および認識装置 |
US6081261A (en) | 1995-11-01 | 2000-06-27 | Ricoh Corporation | Manual entry interactive paper and electronic document handling and processing system |
US5692073A (en) | 1996-05-03 | 1997-11-25 | Xerox Corporation | Formless forms and paper web using a reference-based mark extraction technique |
US5713478A (en) * | 1996-10-23 | 1998-02-03 | Habisohn; Chris X. | Method for deactivating swing control with a timer |
US6518950B1 (en) | 1997-10-07 | 2003-02-11 | Interval Research Corporation | Methods and systems for providing human/computer interfaces |
US6092065A (en) * | 1998-02-13 | 2000-07-18 | International Business Machines Corporation | Method and apparatus for discovery, clustering and classification of patterns in 1-dimensional event streams |
WO1999050787A1 (en) | 1998-04-01 | 1999-10-07 | Xerox Corporation | Cross-network functions via linked hardcopy and electronic documents |
US6285786B1 (en) * | 1998-04-30 | 2001-09-04 | Motorola, Inc. | Text recognizer and method using non-cumulative character scoring in a forward search |
US6256410B1 (en) * | 1998-07-30 | 2001-07-03 | International Business Machines Corp. | Methods and apparatus for customizing handwriting models to individual writers |
US6249605B1 (en) * | 1998-09-14 | 2001-06-19 | International Business Machines Corporation | Key character extraction and lexicon reduction for cursive text recognition |
US6964374B1 (en) | 1998-10-02 | 2005-11-15 | Lucent Technologies Inc. | Retrieval and manipulation of electronically stored information via pointers embedded in the associated printed material |
CN1145872C (zh) * | 1999-01-13 | 2004-04-14 | 国际商业机器公司 | 手写汉字自动分割和识别方法以及使用该方法的系统 |
US6658151B2 (en) * | 1999-04-08 | 2003-12-02 | Ricoh Co., Ltd. | Extracting information from symbolically compressed document images |
US6678415B1 (en) * | 2000-05-12 | 2004-01-13 | Xerox Corporation | Document image decoding using an integrated stochastic language model |
WO2002037933A2 (en) * | 2000-11-08 | 2002-05-16 | New York University | System, process and software arrangement for recognizing handwritten characters |
JP4136316B2 (ja) * | 2001-01-24 | 2008-08-20 | 富士通株式会社 | 文字列認識装置 |
AUPR824501A0 (en) * | 2001-10-15 | 2001-11-08 | Silverbrook Research Pty. Ltd. | Methods and systems (npw003) |
US7672507B2 (en) * | 2004-01-30 | 2010-03-02 | Hewlett-Packard Development Company, L.P. | Image processing methods and systems |
US7089099B2 (en) * | 2004-07-30 | 2006-08-08 | Automotive Technologies International, Inc. | Sensor assemblies |
-
2001
- 2001-10-15 AU AUPR8245A patent/AUPR824501A0/en not_active Abandoned
-
2002
- 2002-10-15 IL IL16138302A patent/IL161383A0/xx not_active IP Right Cessation
- 2002-10-15 KR KR1020047005558A patent/KR100651762B1/ko not_active IP Right Cessation
- 2002-10-15 JP JP2003536980A patent/JP4274941B2/ja not_active Expired - Fee Related
- 2002-10-15 WO PCT/AU2002/001393 patent/WO2003034325A1/en active IP Right Grant
- 2002-10-15 AU AU2002333064A patent/AU2002333064B2/en not_active Ceased
- 2002-10-15 EP EP02801225A patent/EP1444642B1/en not_active Expired - Lifetime
- 2002-10-15 AT AT02801225T patent/ATE386989T1/de not_active IP Right Cessation
- 2002-10-15 US US10/492,168 patent/US7359551B2/en not_active Expired - Fee Related
- 2002-10-15 DE DE60225170T patent/DE60225170T2/de not_active Expired - Lifetime
- 2002-10-15 CA CA002463230A patent/CA2463230C/en not_active Expired - Fee Related
- 2002-10-15 CN CNB028204743A patent/CN100533470C/zh not_active Expired - Fee Related
-
2004
- 2004-04-19 ZA ZA200402925A patent/ZA200402925B/en unknown
-
2006
- 2006-10-04 AU AU2006225217A patent/AU2006225217B2/en not_active Ceased
-
2008
- 2008-02-14 US US12/031,615 patent/US7697761B2/en not_active Expired - Fee Related
-
2010
- 2010-03-30 US US12/750,587 patent/US7848574B2/en not_active Expired - Fee Related
- 2010-11-08 US US12/941,807 patent/US8009914B2/en not_active Expired - Fee Related
-
2011
- 2011-08-07 US US13/204,703 patent/US8280168B2/en not_active Expired - Fee Related
-
2012
- 2012-09-09 US US13/607,768 patent/US20120328195A1/en not_active Abandoned
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102581822B1 (ko) * | 2023-04-18 | 2023-09-26 | (주)핸듀 | 교육용 프로그램에서 문자를 인식하는 방법 |
Also Published As
Publication number | Publication date |
---|---|
US7848574B2 (en) | 2010-12-07 |
US20110052066A1 (en) | 2011-03-03 |
EP1444642A4 (en) | 2006-07-26 |
US20050175241A1 (en) | 2005-08-11 |
US20120328195A1 (en) | 2012-12-27 |
IL161383A0 (en) | 2004-09-27 |
US7359551B2 (en) | 2008-04-15 |
JP4274941B2 (ja) | 2009-06-10 |
WO2003034325A1 (en) | 2003-04-24 |
DE60225170D1 (de) | 2008-04-03 |
US20100189352A1 (en) | 2010-07-29 |
CA2463230C (en) | 2009-07-28 |
CN1571979A (zh) | 2005-01-26 |
AU2002333064B2 (en) | 2006-07-20 |
ATE386989T1 (de) | 2008-03-15 |
ZA200402925B (en) | 2005-02-23 |
US8009914B2 (en) | 2011-08-30 |
EP1444642A1 (en) | 2004-08-11 |
US20110293181A1 (en) | 2011-12-01 |
CN100533470C (zh) | 2009-08-26 |
DE60225170T2 (de) | 2009-03-05 |
AUPR824501A0 (en) | 2001-11-08 |
US7697761B2 (en) | 2010-04-13 |
KR100651762B1 (ko) | 2006-12-01 |
CA2463230A1 (en) | 2003-04-24 |
US8280168B2 (en) | 2012-10-02 |
AU2006225217B2 (en) | 2008-02-28 |
KR20050036864A (ko) | 2005-04-20 |
US20080144938A1 (en) | 2008-06-19 |
EP1444642B1 (en) | 2008-02-20 |
AU2006225217A1 (en) | 2006-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4274941B2 (ja) | 手書き文字を復号化するための方法および装置 | |
AU2002333064A1 (en) | A method and apparatus for decoding handwritten characters | |
Tagougui et al. | Online Arabic handwriting recognition: a survey | |
Al-Helali et al. | Arabic online handwriting recognition (aohr) a survey | |
JP3176023B2 (ja) | 手書き入力照合方法および装置 | |
AU737039B2 (en) | Methods and apparatuses for handwriting recognition | |
Namboodiri et al. | Online handwritten script recognition | |
Vikram et al. | Handwriting and gestures in the air, recognizing on the fly | |
Sharma et al. | Online handwritten Gurmukhi character recognition using elastic matching | |
WO2000041166A2 (en) | Handwriting or spoken words recognition with neural networks | |
Vikram et al. | Writing and sketching in the air, recognizing and controlling on the fly | |
Manke et al. | A connectionist recognizer for on-line cursive handwriting recognition | |
Singh et al. | Online handwritten Gurmukhi words recognition: An inclusive study | |
Chen | Recognition and interpretation of multi-touch gesture interaction | |
ZA200507772B (en) | Written character recognition using character models | |
AU2020103527A4 (en) | IPDN- Read Handwriting: Intelligent Process to Read Handwriting Using Deep Learning and Neural Networks | |
Ball | Arabic handwriting recognition using machine learning approaches | |
Namboodiri et al. | Robust Segmentation of Unconstrained Online Handwritten Documents. | |
Gmati et al. | Identity Signatures Extraction of Latin and Arabic Characters | |
Al-Helali | Online Arabic Text Recognition Using Statistical Techniques | |
Halawani | Recognition of Arabic online handwritten text using syntactical techniques | |
JPH0443316B2 (ja) | ||
Kim et al. | Matching algorithm for hangul recognition based on PDA |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061031 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070122 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070524 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070723 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070727 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20070824 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090113 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090303 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120313 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120313 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130313 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130313 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130313 Year of fee payment: 4 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130313 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130313 Year of fee payment: 4 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees | ||
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R370 | Written measure of declining of transfer procedure |
Free format text: JAPANESE INTERMEDIATE CODE: R370 |