JP2005505869A - 文字ストリングの識別 - Google Patents
文字ストリングの識別 Download PDFInfo
- Publication number
- JP2005505869A JP2005505869A JP2003536981A JP2003536981A JP2005505869A JP 2005505869 A JP2005505869 A JP 2005505869A JP 2003536981 A JP2003536981 A JP 2003536981A JP 2003536981 A JP2003536981 A JP 2003536981A JP 2005505869 A JP2005505869 A JP 2005505869A
- Authority
- JP
- Japan
- Prior art keywords
- character
- template
- string
- probability
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 77
- 238000012545 processing Methods 0.000 claims description 24
- 238000007619 statistical method Methods 0.000 claims description 4
- 238000013459 approach Methods 0.000 description 11
- 238000012549 training Methods 0.000 description 7
- 238000012805 post-processing Methods 0.000 description 6
- 238000007476 Maximum Likelihood Methods 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000003058 natural language processing Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000009499 grossing Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/226—Character recognition characterised by the type of writing of cursive writing
- G06V30/2268—Character recognition characterised by the type of writing of cursive writing using stroke segmentation
- G06V30/2272—Character recognition characterised by the type of writing of cursive writing using stroke segmentation with lexical matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/268—Lexical context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Character Discrimination (AREA)
- Yarns And Mechanical Finishing Of Yarns Or Ropes (AREA)
- Ropes Or Cables (AREA)
- Decoration Of Textiles (AREA)
- Jellies, Jams, And Syrups (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
【選択図】図1
Description
【0001】
本発明は、多数の手書き文字から形成されたストリングを識別する方法および装置に関し、具体的には手書きテキストを識別する方法および装置に関する。
【背景技術】
【0002】
本明細書で従来技術を参照する場合、その従来技術が普通の一般的知識の一部分を形成することの承認、またはどのような形式であれ、その暗示を与えるものではなく、また与えられていると考えてはならない。
【0003】
高度に正確な手書き文字認識システムの開発で直面する大きな問題の1つは、手書きの本来的な不明瞭性である。人は、文脈的知識に依存して手書きテキストを正しく解読する。その結果、多くの研究が、手書きテキスト認識へ統語的および言語的制約を適用することに向けられた。同様の作業が、音声認識、自然言語処理、および機械翻訳の分野で行われた。
【0004】
手書き文字認識システムにおいて、基本的言語プリミティブは文字である。幾つかの認識システムは、文字認識を全くバイパスするが(全体論的ワード認識として知られる)、大部分の認識システムは入力信号の中の個々の文字を識別しようと試みる。これを行わないシステムは、認識中に辞書へ過度に依存し、語彙から外れたワード(即ち、辞書に存在しないワード)の認識サポートは通常得られない。
【0005】
文字認識を利用するシステムでは、文字分類器の生の出力は、手書きの本来的不明瞭性のため必然的に認識誤りを含む。その結果、入力の真の意味を解決するため、一般的にある種の言語ベース後処理が必要である。
【0006】
多くのシステムは、手書きテキストについて言語規則のセットを定義する簡単な発見的方法を含む。したがって、例えば、大文字は、多くの場合、ワードの出発点で発見され(反対の例は「MacDonald」)、多くのストリングは、通常、全て字句であるか全て数字であり(反対の例は「2nd」)、ワード内で句読点文字の確からしい位置を定義する規則である。しかしながら、これらの発見的方法は、時間の無駄であり、定義するのに困難であり、変更されやすく、通常不完全である。
【0007】
上記の発見的方法に加えて、幾つかの認識システムは、文字Nグラム・モデルを含む。この例は、H.Beigi and T.Fujisaki,“A Character Level Predictive Language Model and Its Application to Handwriting Recognition”,Proceedings of the Canadian Conference on Electrical and Computer Engineering,Toronto,Canada,Sep.13〜16,1992,I巻,WA1.27.1〜4頁)に説明される。
【0008】
具体的には、これらのシステムは、先行文字のシーケンスを与えられた時、ある文字を看取する確率を定義する言語モデルを利用する。例えば、字句「e」は、字句「q」よりも「th」に続く確からしさが、はるかに大きい。即ち、P(e|th)は、P(q|th)よりも、はるかに大きい。文字Nグラムはテキスト・コーパスから容易に引き出すことができ、書き手を特定のワード・リストへ制限することなく文字認識を改善する強力な手法である。
【0009】
しかしながら、字句の多数の組み合わせが所与の言語の中に存在すると、そのようなシステムの使用は制限され、非常にデータ集中的な処理を必要とし、それによって手法の適用範囲を限定する。
【0010】
更に、ある状況では、認識システムは入力にあるフォーマットを期待する(例えば、米国のジップコード、電話番号、街路アドレス等)。これらの場合、認識の正確性を増進するため、正規表現、簡単な言語テンプレート、および制限された文字セットを使用することができる。しかしながら、これらの手法の使用は、限定されたフォーマットが厳格に固守される場合に制限される。したがって、例えば、手法は、システムがトレーニングされた郵便番号等へのみ適用され、一般的な手書きテキストには適用されない。
【0011】
手書きテキストは、更に、文字レベルだけでなくワード・レベル、特に筆記体で書く時に不明瞭性を示す。認識システムは、ワード・ベースの言語モデルを含めることによって、この問題に対処する。その最も普通の場合は、前もって定義された辞書を使用することである。
【0012】
文字Nグラムと類似するが、文字ではなくワードのシーケンス間で推移確率を定義するワードNグラムは、筆記テキストの後処理に使用することができる。大語彙のワードNグラムに対するメモリと処理の組み合わせ要件を避けるため、幾つかのシステムは、ワード・クラスNグラムを使用する。その場合、推移確率は、個々のワードではなくワードの品詞タグ(例えば、名詞または動詞)について定義される。
【0013】
他のシステムは、ワードの不明瞭性を除くためマルコフ・シンタクス・モデルを使用する。この1つの例は、D.Tugwell,“A Markov Model of Syntax”,Paper presented at the 1st CLUK Colloquium,University of Sunderland,UK 1998に説明される。
【0014】
ワード・モデリングへの他のアプローチは、例えば、C.Manning and H.Schutze,“Foundations of Statistical Natural Language Processing”,The MIT Press,Cambridge,Massachusetts,US 1999で説明されるように、ワード・コロケーション、即ち、構文または意味ユニットの特性を有する2つ以上のワードから成るシーケンスの識別である。
【0015】
しかしながら、再び、言語後処理の使用は、データ集中的であり、それによって手法が適用される応用を限定する。
【0016】
これまで概説した手法の幾つかの例を、これから更に詳細に説明する。
【0017】
H.BeigiおよびT.Fujisakiは、“A Flexible Template Language Model and its Application to Handwriting Recognition”,Proceedings of the Canadian Conference on Electrical and Computer Engineering,Toronto,Canada,Sep.13−16,1992,I巻,WA1.28.1〜4頁の中で、「フォーマットまたは語彙が非常に限定された」状況で使用される一般的テンプレート言語モデルを説明している。この場合、テンプレートは、探索の発見的方法を使用し、弾力的マッチング文字分類得点をモデル確率と統合することによって適用される。先行N−1文字に基づいて文字の確率を推定するために使用されるNグラム文字モデルの使用も説明される。
【0018】
このシステムでは、H.Beigi and T.Fujisaki,“A Character Level Predictive Language Model and Its Application to Handwriting Recognition”,Proceedings of the Canadian Conference on Electrical and Computer Engineering,Toronto,Canada,Sep.13〜16,1992,I巻,WA1.27.1〜4頁)で詳細に説明されるように、「Nグラム文字予測器でサポートされる文字のセットは、a〜zおよびスペースである」。
【0019】
更に、H.Beigi,“Character Prediction for On−Line Handwriting Recognition”,Canadian Conference on Electrical and Computer Engineering,IEEE,Toronto,Canada,September 1992では、「実際的なオンライン手書き文字認識には、N=4が最適であることを示される」と記載されている。
【0020】
同様に、J.Pitrelli およびE.Ratzlaffは、“Quantifying the Contribution of Language Modeling to Writer−Independent On−line Handwriting Recognition”,Proceedings of the Seventh International Workshop on Frontiers in Handwriting Recognition,September 11〜13 2000,Amsterdamの中で、隠れマルコフ・モデル(HMM)筆記体手書き文字認識システムにおける文字NグラムおよびワードNグラムの使用を説明している。
【0021】
手書きテキストの全体論的ワード認識を実行するためコーパスから引き出されるワードのユニグラムおよびバイグラム言語モデルは、U.Marti and H.Bunke,“Handwritten Sentence Recognition”,Proceedings of the 15th International Conference on Pattern Recognition,Barcelona,Spain,2000,3巻,467〜470頁で説明されている。この場合、ビタビアルゴリズムが分類器得点およびワード確率を使用して、入力テキスト文をデコードする。
【0022】
Bouchaffra等は、“Post processing of Recognized Strings Using Non−stationary Markovian Models”,IEEE Transactions Pattern Analysis and Machine Intelligence,21(10),October 1999,990〜999頁の中で、米国ジップコードの認識に非定常マルコフ・モデルを後処理ステップとして使用することを説明している。この場合、認識を助けるため、ジップコードが固定長を有し、コード内の各々の数字が特定の物理的意味を有するという領域特定知識が使用される。具体的には、米国郵政公社によって提供されたジップコードのトレーニング・セットを使用して、数字ストリング内の各々の点における各々の数字の推移確率が計算され、この知識が認識パフォーマンスを改善するために適用される。
【0023】
L.Yaeger、B.Webb、およびR.Lyonの“Combining Neural Networks and Context−Driven Search for On−Line,Printed Handwriting Recognition in the Newton”,AI Magazine,19巻,No.1,73〜89頁,AAAI 1998)は、弱く適用される様々な言語モデリング手法を実行して、商用手動印刷文字認識システムの語彙文脈を定義することを説明している。このスキームは、「正規表現文法から引き出される」ものを含む「ワード・リスト、接頭辞および接尾辞リスト、並びに句読点モデル」の定義および組み合わせを可能にする。辞書および語彙テンプレートは平行して探索可能であり、各々の表現の事前確率を含む。構文テンプレートは手でコード化され、確率は経験分析から引き出される。
【0024】
R.SrihariのUse of Lexical and Syntactic Techniques in Recognizing Handwritten Text”,ARPA Workshop on Human Language Technology,Princeton,NJ,March 1994は、語彙的および構文的手法の組み合わせを使用して、手書き文字認識システムの結果の不明瞭性を除くことを説明する。具体的には、この手法はワード・コロケーション確率を適用し、文脈に基づきワードを奨励または提案し、品詞タグに基づくワード・シンタクスのマルコフ・モデルを使用する。
【0025】
米国特許第6,137,908号は、トライグラム言語モデルを他の発見的方法と組み合わせて使用し、文字の区分化および認識の正確性を改善することを説明する。
【0026】
米国特許第6,111,985号では、Nグラム文字モデルを使用する数値ストリングからのワードの不明瞭性を除くため、認識中の文字文法および従来の最尤シーケンス推定アルゴリズム(即ち、ビタビデコーディング)が使用される。
【0027】
同様に、米国特許第5,392,363号で説明される手書きワード認識システムは、フレーム・ベースの確率的分類器で不明瞭性を除くため、文字およびワード文法モデルを使用する。
【0028】
米国特許第5,787,197号は、オンライン手書き文字認識に辞書ベースの後処理手法を使用する。辞書探索は入力ワードから全ての句読点を除き、次に入力ワードが辞書と照合される。探索が失敗すれば、「可能なワードのリストを構築するため、ストローク・マッチ関数およびスペル援助辞書が使用される」。
【0029】
同様に、米国特許第5,151,950号は、ツリー構造辞書を決定論的有限オートマトンとして使用し、分類器の結果を文脈情報とマージすることを説明する。このシステムは、「隠れマルコフ過程を介して例示的ストリングから最良マッチ認識ストリングを」選択する。
【0030】
米国特許第5,680,511号は、ワード・ベース言語モデルを使用して、「ワード節の中で生じて認識されないか不明瞭なワードを認識する」。この方法は、発話または手書きテキスト認識との関連で説明される。
【0031】
米国特許第5,377,281号は、知識ベースのアプローチを使用して、文字認識ストリングを後処理する。使用される知識ソースは、ワード確率、ワード・ダイグラム確率、ワードの尤度を特定の文字接頭辞と関連づける統計、および書き換え暗示とそのコストを含み、テキスト・コーパスから引き出される。
【0032】
米国特許第5,987,170号は、東洋手書き文字の認識にワードおよび文法辞書の組み合わせを使用する。米国特許第6,005,973号は、認識中に辞書ストリングおよび最も確からしい数字ストリングの双方を引き出し、これらを書き手へ与えて選択させる。
【0033】
米国特許第6,084,985号は、隠れマルコフ・モデルに基づくオンライン手書き文字認識方法を説明し、筆跡の少なくとも瞬時書き込み位置をリアルタイムで感知して、筆跡特徴ベクトルに関連づけられたセグメントの時間整合ストリングを筆跡から引き出す。次に、この方法は、筆跡に関連したデータベースからの様々な例示的ストリングと時間整合ストリングとを照合し、隠れマルコフ過程を介して例示的ストリングから最良マッチ認識ストリングを選択する。
【0034】
したがって、上記の方法の各々は様々な欠点を有することが分かる。特に、手法の大多数は、膨大なデータ処理を必要とする傾向がある。これは、特に、認識の実行に強力なプロセッサを必要とするので、手法が実現される環境を制限する可能性がある。
【発明の開示】
【0035】
第1の広い形態において、本発明は、多数の手書き文字から形成されたストリングを識別する方法を提供する。この方法は、
(a)ストリング内の各々の文字について文字確率を決定するステップであって、各々の文字確率は、それぞれの文字が多数の所定の文字のそれぞれの1つである尤度を表している、前記ステップと、
(b)ストリングについてテンプレート確率を決定するステップであって、各々のテンプレート確率は、多数のテンプレートのそれぞれの1つに対応するストリングの尤度を表し、各々のテンプレートは文字タイプのそれぞれの組み合わせを表している、前記ステップと、
(c)決定された文字およびテンプレートの確率に従ってストリング確率を決定するステップと、
(d)決定されたストリング確率に従って文字ストリングを識別するステップと、
を含む。
【0036】
典型的には、各々の所定の文字は、それぞれの文字タイプを有する。
【0037】
文字タイプは、一般的に、
(a)数字、
(b)字句、
(c)句読点
の少なくとも1つを含む。
【0038】
一般的に、文字確率を決定する方法は、文字分類器を使用することを含む。
【0039】
テンプレート確率を決定する方法は、
(a)ストリング内の文字の数を決定するステップと、
(b)同数の文字を有するテンプレートを選択するステップと、
(c)各々の選択されたテンプレートについてテンプレート確率を取得するステップと、
を含むことができる。
【0040】
テンプレート確率は、テキスト・コーパスの統計的分析によって決定可能である。
【0041】
一般的に、方法は、
(a)テンプレートからストリング内の各々の文字の文字タイプを決定し、
(b)テンプレート内の各々の文字について所定の文字の1つを選択し、所定の文字は決定された文字タイプおよび文字確率に従って選択されることによって、
各々のテンプレートに対応する潜在的文字ストリングを決定するステップを含む。
【0042】
好ましくは、選択された所定の文字は、最高文字確率を有する所定の文字である。
【0043】
典型的には、文字ストリングを識別する方法は、
(a)各々の潜在的ストリングについてストリング確率を決定するステップであって、ストリング確率は、各々の選択された文字の文字確率とそれぞれのテンプレート確率とを連結することによって決定される、前記ステップと、
(b)文字ストリングを、最高ストリング確率を有する潜在的ストリングであるとして決定するするステップと、
を含む。
【0044】
方法は、処理システムを使用して実行されてよく、前記処理システムは、
(a)(i)所定の文字と、
(ii)(1)テンプレートと、
(2)テンプレート確率
の少なくとも1つを表すテンプレート・データ
の少なくとも1つを記憶するストレージと、
(b)(i)文字ストリングを受け取り、
(ii)ストリング内の各々の文字について文字確率を決定し、
(iii)テンプレート確率を決定し、
(iv)決定された文字およびテンプレート確率に従ってストリング確率を決定し、
(v)決定されたストリング確率に従って文字ストリングを識別するように構成されたプロセッサと、
を有している。
【0045】
第2の広い形態において、本発明は、多数の手書き文字から形成されたストリングを識別する装置を提供する。この装置は、
(a)(i)多数の所定の文字と、
(ii)多数のテンプレートを表すテンプレート・データ
の少なくとも1つを記憶するストレージと、
(b)(i)ストリング内の各々の文字について文字確率を決定し、各々の文字確率はそれぞれの文字が多数の所定の文字のそれぞれの1つである尤度を表し、
(ii)ストリングについてテンプレート確率を決定し、各々のテンプレート確率は多数のテンプレートのそれぞれの1つに対応するストリングの尤度を表し、各々のテンプレートは文字タイプのそれぞれの組み合わせを表し、
(iii)所定の文字およびテンプレート確率に従ってストリング確率を決定し、
(iv)決定されたストリング確率に従って文字ストリングを識別するように構成されたプロセッサと、
を備える。
【0046】
典型的には、プロセッサは入力へ結合され、入力を介して手書き文字のストリングを受け取るように構成される。
【0047】
したがって、装置、特にプロセッサは、本発明の第1の広い形態の方法を実行するように構成可能である。
【0048】
この場合、テンプレート・データは更に各々のテンプレートについてテンプレート確率を含むことができ、プロセッサはテンプレート・データからテンプレート確率を取得するように構成される。
【0049】
第3の広い形態において、本発明は、手書き文字認識で使用されるテンプレートを生成する方法を提供する。この方法は、
(a)テキストを取得するステップと、
(b)テキスト内の文字ストリングを識別するステップとであって、各々の文字ストリングは1つまたは複数の文字のシーケンスから形成され、各々の文字はそれぞれのタイプを有する、前記ステップと、
(c)各々の文字ストリングについて文字タイプのシーケンスを決定するステップと、
(d)各々の文字タイプ・シーケンスについてテンプレートを定義するステップと、
を含む。
【0050】
典型的には、方法は、
(a)決定されたテンプレートを統計的に分析するステップと、
(b)統計的分析に従ってテンプレート確率を決定するステップであって、テンプレート確率はテキスト内で起こるそれぞれの文字タイプ・シーケンスの確率を示す、前記ステップと、
を含む。
【0051】
一般的には、方法は、
(a)テキスト内の各々の文字タイプ・シーケンスの発生の頻度を決定するステップと、
(b)各々の文字タイプ・シーケンスの決定された頻度に従ってテンプレート確率を決定するステップと、
を含む。
【0052】
一般的に、方法は、決定されたテンプレート確率を修正して、限定された数の文字タイプ・シーケンスに対処することを更に含む。これは、リドストン(Lidstone)の法則に従って達成されてよい。
【0053】
好ましくは、方法は、大きなテキスト・コーパスからテキストを取得することを含む。典型的には、テキストは、多数の異なったソースからも取得される。
【0054】
好ましくは、方法は、
(a)テキストを記憶するストレージと、
(b)(i)テキスト内の文字ストリングを識別し
(ii)文字タイプ・シーケンスを決定し、
(iii)テンプレートを定義するように構成されたプロセッサと、
を有する処理システムを使用して実行される。
【0055】
第4の広い形態において、本発明は、手書き文字認識で使用されるテンプレートを生成する装置を提供する。この装置は、
(a)テキストを取得し、
(b)テキスト内の文字ストリングを識別し、各々の文字ストリングは1つまたは複数の文字のシーケンスから形成され、各々の文字はそれぞれのタイプを有し、
(c)各々の文字ストリングについて文字タイプのシーケンスを決定し、
(d)各々の文字タイプ・シーケンスについてテンプレートを定義するように構成されたプロセッサを含む。
【0056】
典型的には、装置は、テキストを記憶するストレージを備え、プロセッサはストレージからテキストを取得するように構成される。
【0057】
一般的に、プロセッサは、本発明の第3の広い形態の方法を実行するように構成される。
【本発明を実施する形態】
【0058】
本発明は、添付の図面と関連づけて記述される本発明の好ましいが非限定的な実施形態の単なる例として示される以下の説明から明らかになるであろう。
【0059】
次の形態は、本発明の主題の正確な理解を提供するため、書かれた説明および添付のクレームに適用されるものとして記述される。
【0060】
これから図1を参照して、本発明を実現するのに適切な装置の例を説明する。図1は、手書き文字認識を実行するように構成された処理システム10を示す。
【0061】
具体的には、図示されるように、一般的に、処理システム10は少なくともバス24を介して相互に結合されたプロセッサ20、メモリ21、入力デバイス22、例えばグラフィックス・タブレットおよび/またはキーボード、出力デバイス23、例えばディスプレイを含む。処理システムをストレージ11、例えばデータベースへ結合するため、25で示されるような外部インタフェースも設けられる。
【0062】
使用に当たって、処理システムは、2つの主な機能を実行するように構成可能である。具体的には、処理システムは、テキスト・コーパスから統計的テンプレートを生成し、および/または手書きテキストのデコーディングで統計的テンプレートを使用するように構成可能である。これにより、処理システム10は任意の形式の処理システム、例えばコンピュータ、ラップトップ、サーバ、特殊のハードウェア等であってよいことが分かるであろう。処理システム10は、典型的には、メモリ21に記憶された適切なアプリケーション・ソフトウェアを実行することによって、これらの手法を実行するように構成される。
【0063】
テンプレートを生成する場合、処理システムはテキストを分析するように構成される。典型的には、テキストは、データベース11の中に記憶される。この点に関して、プロセッサ20は、テキスト内の各々のワードまたはストリングを識別し、次に文字のシーケンスとして評価するように動作する。プロセッサは、各々のワードまたはストリングの中の文字のタイプを決定し、例えば文字が字句、数字、または句読点であるかを決定する。
【0064】
次に、プロセッサはストリングを表すテンプレートを決定する。この点に関して、テンプレートはそれぞれの文字タイプを表すトークン(tokens)から形成される。したがって、例えば、ワード「the」のテンプレートは形式「aaa」であってよく、「a」は字句を表す。
【0065】
同じテンプレートが、異なったストリングについて生成されることが分かるであろう。したがって、例えば、ワード「cat」は、ワード「the」と同じテンプレートを生じる。
【0066】
プロセッサ20は、各々のテンプレートがデータベース11の中で決定される回数を記録する。
【0067】
テキスト内の全てのワードが分析されると、これによって、テキスト・サンプル内で起こる所与のテンプレートの確率を決定することができる。したがって、これは手書きテキストの認識に使用することができる。
【0068】
具体的には、プロセッサ20が、例えば入力デバイス22またはデータベース11から手書きテキストを取得すると、プロセッサは、初期評価を実行し、文字ストリングを識別してストリング内の各々の文字のアイデンティティを決定しようと試みる。
【0069】
一般的に、プロセッサ20は、多数の可能な文字アイデンティティ、および各々のアイデンティティに関連した確率を決定する文字分類器を実現する。
【0070】
これは、全体のストリングについて反復され、異なった潜在的ストリングに対応する多数の潜在的文字アイデンティティの組み合わせが存在するようになる。
【0071】
次に、前述したテンプレートがプロセッサ20によってアクセスされる。プロセッサ20は、それぞれのストリングと同じ数の文字を有するテンプレートを選択する。次に、プロセッサ20は、最も確からしいストリングを決定させるため、文字アイデンティティおよびテンプレートの特定の組み合わせについて全体的確率を決定する。
【0072】
以下、これらの手法を詳細に説明する。
【統計的テンプレートの生成】
【0073】
このセクションは、テキスト・コーパスからの統計的テンプレートの生成を説明し、統計的に引き出されたテンプレートの例を与える。
【概説1】
【0074】
字句は、手書きテキスト認識システムの基本的分類プリミティブを表す。英語では、字句はアルファベット(「a」〜「z」、「A」〜「Z」)、数字(「0」〜「9」)、または句読点(他の全て)として分類できる。アルファベット文字の一般的認識を助けるため、多くの場合、辞書および文字文法が使用され、不明瞭性が除かれる。一般的に、辞書および文字文法はアルファベット文字のみを含む(もっとも、ある場合には、複合語、例えば「they're」および「he'll」を作るためにアポストロフィが含められる)。
【0075】
大部分の言語モデルは数字および句読点字句に関して先行情報を含まないので、認識システムは発見的手法を使用して、認識ストリングからアルファベットまたは数字文字のストリングを抽出する。次に、アルファベットまたは数字文字は、言語モデルを使用して処理される。しかしながら、これらの発見的アプローチは一般的にあまり強固なものとは言えず、次のような通常の誤り認識問題を導く。
・アルファベット・ストリングが数字として認識される、
・数字ストリングがアルファベットとして認識される、
・テキストおよび数字を含むワード(例えば、2nd、V8、B2)が、アルファベットまたは数字ストリングとして誤って認識される、
・句読点が、アルファベットまたは数字の字句として誤って認識される、並びに
・アルファベットまたは数字の字句が、句読点として誤って認識される。
【0076】
しかしながら、テキスト・シーケンス内のある句読点文字の存在は、そのシーケンス内の他の文字のデコーディングを実際に助けることができる。例えば、アポストロフィはテキスト・ストリングを示すことができ、コンマ、通貨記号、およびピリオドは数字ストリングを示すことができる。ダッシュを含むワードは、多くの場合、数字およびアルファベット・ストリングの混合を含む(例えば、「30−year−old」または「20−pound」)。これに加えて、ある句読点文字は、通常、ストリング内の特定のロケーションで発見される(例えば、「?」、「!」、または「:」のような接尾辞句読点)。
【0077】
統計的言語テンプレート処理は、筆記テキストの構造に関する先行情報をエンコードする方法である。この方法は、確率的モデルを使用してアルファベット、数字、および句読点文字の間の相互作用をモデル化する。確率的モデルは、位置情報を考慮し、(文字Nグラムのように固定数のローカル先行状態ではなく)全体の入力ワードを考慮することよって、字句依存性をグローバルにモデル化することができる。
【字句のトークン化】
【0078】
統計的テンプレート生成は、筆記テキスト・コーパス(多数のソースから収集されたテキスト・ファイルの大きなセット)を使用して実行される。テンプレート統計を生成するため、コーパス内の各々のファイルは、白のスペース(即ち、ワード、センテンス、およびパラグラフのマーカ)によって区切られた字句のシーケンシャル・セットとして処理される。この字句シーケンスは、ストリングを形成する。
【0079】
テンプレートの生成中に、個々の字句は、その字句が所属するクラス(または文字タイプ)を表すトークンへ変換される。
【0080】
字句クラスの定義は領域特定的であり、解決されなければならない不明瞭性に基づいて選択される。以下の説明は、次の分類スキームに基づく。即ち、大文字および小文字のアルファベット文字はトークン「a」へ変換され、全ての数字はトークン「d」へ変換され、全ての残りの文字(即ち、句読点)は変換されないで元の値を維持する。
【0081】
ワードまたは文字ストリングを表すトークン・シーケンスは、テンプレートを定義する。
【0082】
例として、ストリング「15−years?」はテンプレート「dd−aaaaa?」へ変換される。大文字と小文字を区別するような他の言語形態を作るため(例えば、「MacDonald」を「ullulllll」として形成し、「u」が大文字を表し、「l」が小文字を表すようにする)、代替のトークン化スキームが使用可能であることに注意されたい。
【処理】
【0083】
統計的言語テンプレートを生成する目的は、共通の筆記テキスト・イディオムを識別し、筆記テキストの中で遭遇されるイディオムの確率を計算することである。モデルのトレーニングは、白スペースで分離された各々のワード内の字句をトークン化し、結果のテンプレートを表に、典型的にはデータベース11の中に記憶するように進行する。特定のテンプレートが入力ストリームの中で発見された回数を示すカウントが、各々のテンプレートに関連づけられる。
【0084】
コーパス内の全てのテキストが処理された後、表はテキスト内で遭遇された全てのテンプレートのリスト、および各々のテンプレートが発見された回数のカウントを含む。明らかに、共通に起こるテンプレート(例えば、「the」、「but」、または「cat」を表すテンプレート「aaa」)は、ありそうもないテンプレート(例えば、「xly」または「b2b」を表すテンプレート「ada」)よりも、はるかに高いカウントを含むであろう。
【0085】
テンプレートの事前確率を計算するため、テンプレート・カウントは全てのテンプレート・カウントの合計によって単純に除算される。これらの値は、数値アンダーフローを回避して認識中の処理を容易にするため、対数として記憶することができる。テンプレートtiの対数確率は、
【数1】
ここで、ciはテンプレートiがトレーニング・テキスト内で遭遇された回数であり、nは異なったテンプレートのトータル数である。
【0086】
全ての遭遇されたテンプレートについて事前確率を計算することによって、字句の数が変化するテンプレートを比較することができる。これは、字句またはワードの区分化が知られていないか、多数の代替区分化パスが可能である場合に、言語モデルが入力のデコーディングを助けることができることを意味する。
【0087】
しかしながら、入力ストリング内の字句の数が認識時に知られていれば、テンプレート・モデルを区分化して、テンプレートを字句カウントでグループ化することができる。次に、全てのグループにわたる全てのカウントの合計ではなくテンプレート・グループのテンプレート・カウントの数に基づいて、事前確率を計算することができる。
【平滑化】
【0088】
上記の手順は、テキスト・コーパスに基づいてテンプレート確率の最尤推定(MLE)を生じる。即ち、計算された確率は、トレーニング・コーパスへ適用された時最高確率を与える確率である。トレーニング・テキストの中で遭遇されなかったテンプレートに対しては、確率分布は割り当てられず、したがって、これらのテンプレートはゼロの確率を割り当てられる。
【0089】
テキスト・コーパスは、言語モデルへの潜在的入力のサブセットを表すだけであるから、看取された事象の確率を少量だけ減少させ、発見されなかった事象へ剰余確率量を割り当てるため、平滑化モデルを適用しなければならない。この手順は、例えば、C.Manning and H.Schutze,“Foundations of Statistical Natural Language Processing”,The MITPress,Cambridge,Massachusetts,US 1999)で説明されているように、通常、文字およびワードNグラムの中で使用される。したがって、この場合、同じ手法を容易に適用することができる。
【0090】
この例では、前記の「統計的自然言語処理の基礎」で説明されているように、生成された確率を平滑化するためリドストン(Lidstone)の法則が使用された。
【数2】
ここで、Bはコーパスから引き出された唯一無二のテンプレートの数であり、λは平滑化因数である(経験的に、0.5へ設定される)。
【0091】
その結果、トレーニング・コーパスの中で発見されなかったワード構造へ非ゼロの確率を割り当てることができ、稀少で例外的なワード構造を認識することができる。
【0092】
更に、確率の決定に使用されるテキスト・コーパスが大きければ、それだけ正確な確率が得られることが分かるであろう。
【結果の例】
【0093】
トレーニング手順は、大きなテキスト・コーパス、この例では、D.Harman and M.Liberman,Complete TIPSTER Corpus,1993の上で実行され、統計的言語テンプレートのセットを生成した。決定されたテンプレートの例は、下記に記載されている。
【0094】
具体的には、表1は、筆記テキスト・コーパスの中で最高発生頻度(したがって、最高事前確率)を有する20のテンプレートを含む。
【0095】
この表は、筆記テキストの明白な特性の多くを示している。例えば、一般的に短いワードが長いワードよりも普通であること、コンマおよびピリオドが最も句読点文字になりやすく、ワードの接尾辞として現れること、等を示す。これらの規則は、テンプレートおよび対応する事前対数確率によって暗黙的に定義され、強固で統計的に十分な根拠をもつ入力デコーディングを可能にする。
【0096】
上記の表のテンプレートは、多数の簡単な発見的方法によって説明することのできる、どちらかと言えば明白な多数の言語規則を詳細に示す(もっとも、これらの規則の事前確率を容易および正確に推定できるとは言えないであろう)。
【表1】
【0097】
しかしながら、結果の更なる吟味は、表2で詳細に示されるように、発見的アプローチを使用して正確にモデル化することが非常に困難な多数の言語イディオムが存在することを示している。これらのテンプレートは、アルファベット字句、数字、および句読点の間の相互作用をモデル化し、筆記テキストの構造について規則のセットを暗黙的に定義する。
【表2】
【0098】
注意すべきは、この手法の威力は、多数のテンプレート、およびテンプレートに対応する相対確率の生成にある。典型的には、何千というテンプレートが生成され、これらのテンプレートは一緒になって、筆記テキストの構造に関して統計的に良好な基礎を有する規則のセットを定義する。
【統計的テンプレートの処理】
【0099】
このセクションは、統計的テンプレートを筆記テキストのデコーディングに使用する場合を説明する。一般的な手順が、幾つかの例示的処理と一緒に示される。この手法を、他の言語モデルと、どのように組み合わせるかの説明もまた示されている。
【概説2】
【0100】
手書き文字認識の目的は、書き手によって生成されたペン・ストロークを、対応するテキストへ変換することである。しかしながら、手書きのテキストは本来的に不明瞭であり、したがって入力をデコードするためには、文脈的情報の使用が必要である。前述したようにして生成された統計的テンプレートは、入力の一般的構造の認識を助け、認識中に他の言語モデル、例えば辞書および文字文法と組み合わせることができる。
【0101】
大部分の文字分類システムは、入力字句について、可能な字句マッチおよび関連した信頼性得点のセットを生成する。例えば、字句「a」を分類する時、分類器の字句仮説は下記の表3に記載されるようなものになるかもしれない。
【表3】
【0102】
これは、(非公式に)分類器が60%の信頼性で字句が「a」であること、30%の信頼性で字句が「d」であること、以下同様であることを示す。統計的処理のためには、得点が確率の規則と合致しなければならないことに注意されたい。即ち、
0≦ P(xi) ≦1 全てのiについて
および、
【数3】
【0103】
確率を生成しない分類器(例えば、距離値を報告する分類器)については、出力得点ベクトルは、上記の規則が確実に適用されるように正規化されなければならない。ニューラル・ネットワーク分類器については、正規化された変換関数(例えば、J.Briddle,“Probabilistic Interpretation of Feedforward Classification Network Outputs,with Relatiionships to Statistical Pattern Recognition”,Neuro−computing:Algorithms,Architectures,and Applications,227〜236頁,NewYork,Springer−Verlag,1990、で説明されるソフトマックス活性化関数)を使用して、出力値を正規化することができる。
【デコーディング】
【0104】
デコーディングは、文字分類器によって生成された字句仮説のセットの上で実行される。字句仮説のセットは入力ワードまたは一連のワードを表す。テンプレートに関連づけられた確率は、特徴、例えばワード長および句読点文字のロケーションを、統計的なワードの区分化に使用できることを意味する。統計的テンプレートは、特定のワード構造の確率を推定できることから、必要であれば、統計的テンプレートを使用してワードの区分化を助けることができる。
【0105】
しかしながら、下記の説明では、ワードの区分化が既に実行されており、文字分類器の出力を与えられる可能性が最も高い字句シーケンスを発見するためにのみデコーディング手順が必要であると仮定する。これは、テンプレート尤度の事前確率と組み合わせられて、分類器によって生成された文字確率を与えられた最大得点を提供するテンプレートを発見することによって行われる。
【数4】
ここで、n=入力ストリング内の字句の数、
P(wi)=字句シーケンスの確率、
P(xij)=テンプレートtiの位置jにおけるトークンの分類器得点(下記を参照)、
P(ti)=テンプレートtiの事前確率。
【0106】
P(xij)の値を計算する時、トークン・クラスの最高得点メンバー(字句位置jにおける分類器仮説を使用する)が使用される。例えば、テンプレートが「a」を含むならば、最高ランクのアルファベット文字の得点が使用される。同様に、テンプレートが「d」を含むならば、最高ランクの数字の得点が使用される。句読点については、指定された句読点文字の得点が使用される。
【0107】
テンプレートについて対数確率が使用された場合、分類器出力も対数確率へ変換される必要があり、デコーディング手順は、次式の最大値を発見する。
【数5】
【0108】
例として、分類器が、入力ストリング「30−day」から、示された文字について、表4で示される得点を生成したと仮定する。
【表4】
【0109】
この例では、正しいデコーディング・パスは太字で示される。
【0110】
これらの得点が対数確率へ変換され、マッチする長さの全てのテンプレートへ適用された場合、最高得点のテンプレートは、表5に記載されるようなテンプレートである。
【表5】
ここで、P(ti)はテキスト・コーパスから統計的に引き出されるようなテンプレートの事前確率である。
【0111】
テンプレート「dd−aaa」についてP(wi)を計算するため、プロセッサ20によって実行される計算は次のようになる。
【0112】
テンプレート「aaaaaa」についてP(wi)を計算すると、次のようになる。
【0113】
テンプレート「dddddd」についてP(wi)を計算すると、次のようになる。
【0114】
最高得点のテンプレート(「dd−aaa」)が発見され、対応するテキストが正しいストリング(「30−day」)として選択される。
【0115】
最尤デコーディング(即ち、各々の位置で最も確からしい文字を取ること)は、正しいテキストを発見しないことが注目される(「3o−day」が最尤シーケンスであるから)。
【言語モデルの組み合わせ】
【0116】
前述した例において、最良マッチのテンプレートのストリングが、デコードされたストリングとして選択された。しかしながら、通常、マッチしたテンプレートは、追加処理のために他の言語モデルと組み合わせられる。
【0117】
例えば、ストリングのアルファベット部分(即ち、「day」)から最尤字句を取るのではなく、この部分からの分類器得点を、更なるデコーディングのために辞書または文字文法へ渡すことができる。
【0118】
あるいは、追加の言語モデルを使用して、多数の最高得点テンプレートからのテキスト部分を処理し、結果の得点を組み合わせて最終ワード確率を生成することができる。
【0119】
したがって、前述したプロセスは、手書き文字を認識するため統計的言語テンプレートを使用する文脈的処理方法を提供することが分かる。この方法は、テキスト・コーパスからテンプレートを生成するのに必要な手順、およびテンプレートを使用して文字分類器の出力をデコードするのに必要な手法を含む。
【0120】
特に、一般的に、これらの手法は、従来技術の方法よりも少ないプロセッサ能力を使用して、より速くて正確な手書き文字認識が実行されることを可能にする。
【0121】
本発明は、更に、個別的または集合的に本願の明細書で言及または指摘された部分、要素、および特徴にあり、これら部分、要素、または特徴の2つ以上の任意または全ての組み合わせにあると広く言うことができ、本発明が関連を有する技術で既知の同値を有する特定の整数が言及されている場合は、そのような既知の同値は、あたかも個々に記載されているかのように、本明細書に組み込まれていると考えられる。
【0122】
好適な実施形態が詳細に説明されたが、これまで説明され、また後でクレームに記載されるような本発明の範囲から逸脱することなく、当業者による様々な変更、置換、および代替が可能であることを理解すべきである。
【図面の簡単な説明】
【0123】
【図1】本発明を実行するのに適した処理システムの例である。
Claims (24)
- 多数の手書き文字から形成されたストリングを識別する方法であって、前記方法は、
(a)ストリング内の各々の文字について文字確率を決定するステップであって、各々の文字確率は、それぞれの文字が多数の所定の文字のそれぞれの1つである尤度を表している、前記ステップと、
(b)ストリングについてテンプレート確率を決定するステップであって、各々のテンプレート確率は、多数のテンプレートのそれぞれの1つに対応するストリングの尤度を表し、各々のテンプレートは文字タイプのそれぞれの組み合わせを表している、前記ステップと、
(c)決定された文字およびテンプレート確率に従ってストリング確率を決定するステップと、
(d)決定されたストリング確率に従って文字ストリングを識別するステップと、
を含む方法。 - 各々の所定の文字がそれぞれの文字タイプを有する、請求項1に記載の方法。
- 文字タイプが、
(a)数字、
(b)字句、
(c)句読点
の少なくとも1つを含む、請求項1または2に記載の方法。 - 文字確率を決定する方法が文字分類器を使用するステップを含む、請求項1から3のいずれか一項に記載の方法。
- テンプレート確率を決定する方法が、
(a)ストリング内の文字の数を決定するステップと、
(b)同数の文字を有するテンプレートを選択するステップと、
(c)各々の選択されたテンプレートについてテンプレート確率を取得するステップと、を含む、請求項1から4のいずれか一項に記載の方法。 - テンプレート確率がテキスト・コーパスの統計的分析によって予め決定される、請求項5に記載の方法。
- (a)テンプレートからストリング内の各々の文字の文字タイプを決定するステップと、
(b)テンプレート内の各々の文字について所定の文字の1つを選択するステップであって、所定の文字は決定された文字タイプおよび文字確率に従って選択される、前記ステップと、
によって、各々のテンプレートに対応する潜在的文字ストリングを決定するステップを含む、請求項5または6に記載の方法。 - 選択された所定の文字が、最高文字確率を有する所定の文字である、請求項7に記載の方法。
- 文字ストリングを識別する方法が、
(a)各々の潜在的ストリングについてストリング確率を決定するステップであって、ストリング確率は、各々の選択された文字の文字確率とそれぞれのテンプレート確率とを連結することによって決定される、前記ステップと、
(b)文字ストリングを、最高ストリング確率を有する潜在的ストリングとして決定するステップと、
を含む、請求項7または8に記載の方法。 - (a)(i)所定の文字と、
(ii)(1)テンプレートと、
(2)テンプレート確率
の少なくとも1つを表すテンプレート・データ、
の少なくとも1つを記憶するストレージと、
(b)(i)文字ストリングを受け取り、
(ii)ストリング内の各々の文字について文字確率を決定し、
(iii)テンプレート確率を決定し、
(iv)決定された文字およびテンプレート確率に従ってストリング確率を決定し、
(v)決定されたストリング確率に従って文字ストリングを識別する
ように構成されたプロセッサと、
を有する処理システムを用いて実行される、請求項1から9のいずれか一項に記載の方法。 - 多数の手書き文字から形成されたストリングを識別する装置であって、
(a)(i)多数の所定の文字と、
(ii)多数のテンプレートを表すテンプレート・データ
の少なくとも1つを記憶するストレージと、
(b)(i)ストリング内の各々の文字について文字確率を決定し、各々の文字確率はそれぞれの文字が多数の所定の文字のそれぞれの1つである尤度を表し、
(ii)ストリングについてテンプレート確率を決定し、各々のテンプレート確率は多数のテンプレートのそれぞれの1つに対応するストリングの尤度を表し、各々のテンプレートは文字タイプのそれぞれの組み合わせを表し、
(iii)決定された文字およびテンプレート確率に従ってストリング確率を決定し、
(iv)決定されたストリング確率に従って文字ストリングを識別する
ように構成されたプロセッサと、
を備える装置。 - プロセッサが、入力へ結合され、更に、入力を介して手書き文字のストリングを受け取るように構成されている、請求項11に記載の装置。
- プロセッサが、請求項1から9のいずれか一項に記載の方法を実行するように構成されている、請求項10または11に記載の装置。
- 手書き文字認識で使用されるテンプレートを生成する方法であって、
(a)テキストを取得するステップと、
(b)テキスト内の文字ストリングを識別するステップであって、各々の文字ストリングは1つまたは複数の文字のシーケンスから形成され、各々の文字はそれぞれのタイプを有する、前記ステップと、
(c)各々の文字ストリングについて文字タイプのシーケンスを決定するステップと、
(d)各々の文字タイプ・シーケンスについてテンプレートを定義するステップと、
を含む方法。 - (a)決定されたテンプレートを統計的に分析するステップと、
(b)統計的分析に従ってテンプレート確率を決定するステップであって、テンプレート確率はテキスト内で起こるそれぞれの文字タイプ・シーケンスの確率を示す、前記ステップと、
を含む、請求項14に記載の方法。 - (a)テキスト内の各々の文字タイプ・シーケンスの発生の頻度を決定するステップと、
(b)各々の文字タイプ・シーケンスの決定された頻度に従ってテンプレート確率を決定するステップと、
を含む、請求項14または15に記載の方法。 - 決定されたテンプレート確率を修正して、限定された数の文字タイプ・シーケンスに対処するステップを更に含む、請求項16に記載の方法。
- リドストンの法則に従って確率を修正するステップを含む、請求項17に記載の方法。
- 大きなテキスト・コーパスからテキストを取得するステップを含む、請求項14から18のいずれか一項に記載の方法。
- 多数の異なったソースからテキストを取得するステップを含む、請求項14から19のいずれか一項に記載の方法。
- (a)テキストを記憶するストレージと、
(b)(i)テキスト内の文字ストリングを識別し
(ii)文字タイプ・シーケンスを決定し、
(iii)テンプレートを定義する
ように構成されたプロセッサと、
を有する処理システムを用いて実行される、請求項14から20のいずれか一項に記載の方法。 - 手書き文字認識で使用されるテンプレートを生成する装置であって、
(a)テキストを取得し、
(b)テキスト内の文字ストリングを識別し、各々の文字ストリングは1つまたは複数の文字のシーケンスから形成され、各々の文字はそれぞれのタイプを有し、
(c)各々の文字ストリングについて文字タイプのシーケンスを決定し、
(d)各々の文字タイプ・シーケンスについてテンプレートを定義する
ように構成されたプロセッサを備える装置。 - テキストを記憶するストレージを備え、プロセッサがストレージからテキストを取得するように構成された、請求項22に記載の装置。
- 請求項14から21のいずれか一項に記載の方法を実行するように構成された、請求項22または23に記載の装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
AUPR8246A AUPR824601A0 (en) | 2001-10-15 | 2001-10-15 | Methods and system (npw004) |
PCT/AU2002/001392 WO2003034326A1 (en) | 2001-10-15 | 2002-10-15 | Character string identification |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008143500A Division JP4568774B2 (ja) | 2001-10-15 | 2008-05-30 | 手書き文字認識で使用されるテンプレートを生成する方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005505869A true JP2005505869A (ja) | 2005-02-24 |
Family
ID=3832071
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003536981A Pending JP2005505869A (ja) | 2001-10-15 | 2002-10-15 | 文字ストリングの識別 |
JP2008143500A Expired - Fee Related JP4568774B2 (ja) | 2001-10-15 | 2008-05-30 | 手書き文字認識で使用されるテンプレートを生成する方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008143500A Expired - Fee Related JP4568774B2 (ja) | 2001-10-15 | 2008-05-30 | 手書き文字認識で使用されるテンプレートを生成する方法 |
Country Status (11)
Country | Link |
---|---|
US (6) | US7444021B2 (ja) |
EP (1) | EP1446763B1 (ja) |
JP (2) | JP2005505869A (ja) |
KR (1) | KR100630886B1 (ja) |
CN (1) | CN1571980A (ja) |
AT (1) | ATE387677T1 (ja) |
AU (2) | AUPR824601A0 (ja) |
CA (1) | CA2463127C (ja) |
DE (1) | DE60225317T2 (ja) |
IL (2) | IL161379A0 (ja) |
WO (1) | WO2003034326A1 (ja) |
Families Citing this family (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3997790B2 (ja) * | 2002-02-15 | 2007-10-24 | コニカミノルタビジネステクノロジーズ株式会社 | プログラム及びスタイルシート選択装置 |
US7139688B2 (en) * | 2003-06-20 | 2006-11-21 | International Business Machines Corporation | Method and apparatus for classifying unmarked string substructures using Markov Models |
US7508324B2 (en) * | 2004-08-06 | 2009-03-24 | Daniel Suraqui | Finger activated reduced keyboard and a method for performing text input |
US7478081B2 (en) * | 2004-11-05 | 2009-01-13 | International Business Machines Corporation | Selection of a set of optimal n-grams for indexing string data in a DBMS system under space constraints introduced by the system |
US7933929B1 (en) * | 2005-06-27 | 2011-04-26 | Google Inc. | Network link for providing dynamic data layer in a geographic information system |
US20070271087A1 (en) * | 2006-05-18 | 2007-11-22 | Microsoft Corporation | Language-independent language model using character classes |
CN100421066C (zh) * | 2006-05-24 | 2008-09-24 | 上海印钞厂 | 一种提高数字喷码标签字符识别率的方法 |
JP2010277440A (ja) * | 2009-05-29 | 2010-12-09 | Internatl Business Mach Corp <Ibm> | プログラム実行時における文字列の処理を最適化する方法、並びにそのコンピュータ・システム及びコンピュータ・プログラム |
KR101086550B1 (ko) * | 2009-06-24 | 2011-11-23 | 엔에이치엔(주) | 로마자 변환을 이용한 일본어 자동 추천 시스템 및 방법 |
CN102402692B (zh) * | 2010-09-13 | 2014-06-04 | 中国科学院遥感应用研究所 | 一种特征字符串识别方法及系统 |
US20120323967A1 (en) * | 2011-06-14 | 2012-12-20 | Microsoft Corporation | Spelling Using a Fuzzy Pattern Search |
JP5831420B2 (ja) * | 2012-09-28 | 2015-12-09 | オムロン株式会社 | 画像処理装置および画像処理方法 |
CN103077389B (zh) * | 2013-01-07 | 2016-08-03 | 华中科技大学 | 一种结合字符级分类和字符串级分类的文本检测和识别方法 |
US9922311B2 (en) | 2013-03-15 | 2018-03-20 | Mastercard International Incorporated | Account mask identifier apparatus, method, and computer program product |
US9171207B1 (en) * | 2013-03-15 | 2015-10-27 | Peter L Olcott | Method and system for recognizing machine generated character glyphs in graphic images |
US9305245B2 (en) * | 2013-05-07 | 2016-04-05 | Xerox Corporation | Methods and systems for evaluating handwritten documents |
US9552547B2 (en) * | 2015-05-29 | 2017-01-24 | Sas Institute Inc. | Normalizing electronic communications using a neural-network normalizer and a neural-network flagger |
US20160350644A1 (en) | 2015-05-29 | 2016-12-01 | Sas Institute Inc. | Visualizing results of electronic sentiment analysis |
US9595002B2 (en) | 2015-05-29 | 2017-03-14 | Sas Institute Inc. | Normalizing electronic communications using a vector having a repeating substring as input for a neural network |
US20170337225A1 (en) * | 2016-05-23 | 2017-11-23 | Informatica Llc | Method, apparatus, and computer-readable medium for determining a data domain of a data object |
US10909140B2 (en) | 2016-09-26 | 2021-02-02 | Splunk Inc. | Clustering events based on extraction rules |
US10685279B2 (en) * | 2016-09-26 | 2020-06-16 | Splunk Inc. | Automatically generating field extraction recommendations |
CN106951832B (zh) * | 2017-02-28 | 2022-02-18 | 广东数相智能科技有限公司 | 一种基于手写字符识别的验证方法及装置 |
CN107358148B (zh) * | 2017-05-24 | 2022-04-29 | 广东数相智能科技有限公司 | 一种基于手写识别的防作弊网络调研的方法及装置 |
TWI640877B (zh) * | 2017-06-14 | 2018-11-11 | 財團法人資訊工業策進會 | 語意分析裝置、方法及其電腦程式產品 |
CN109871161B (zh) * | 2017-12-01 | 2021-08-17 | 腾讯科技(深圳)有限公司 | 聊天应用中的字体处理方法及装置、电子设备 |
CN109190124B (zh) * | 2018-09-14 | 2019-11-26 | 北京字节跳动网络技术有限公司 | 用于分词的方法和装置 |
US11227176B2 (en) * | 2019-05-16 | 2022-01-18 | Bank Of Montreal | Deep-learning-based system and process for image recognition |
US11347733B2 (en) * | 2019-08-08 | 2022-05-31 | Salesforce.Com, Inc. | System and method for transforming unstructured numerical information into a structured format |
CN110443251A (zh) * | 2019-08-13 | 2019-11-12 | 树根互联技术有限公司 | 仪表图像识别方法及装置 |
KR20210034869A (ko) | 2019-09-23 | 2021-03-31 | 한국전력공사 | 수기 표 이미지의 디지털 이미지 변환 방법 |
CN111339771B (zh) * | 2020-03-09 | 2023-08-18 | 广州深声科技有限公司 | 一种基于多任务多层级模型的文本韵律预测方法 |
CN111833660B (zh) * | 2020-06-17 | 2023-01-31 | 胡屹 | 一种汉字学习实现系统 |
CN111783695B (zh) * | 2020-07-06 | 2022-06-07 | 北京易真学思教育科技有限公司 | 文本识别方法、装置、电子设备及存储介质 |
CN111985208B (zh) * | 2020-08-18 | 2024-03-26 | 沈阳东软智能医疗科技研究院有限公司 | 一种实现标点符号填充的方法、装置及设备 |
CN115758990A (zh) * | 2022-10-14 | 2023-03-07 | 美的集团(上海)有限公司 | 文本的规范化方法、装置、存储介质和电子设备 |
CN118314588A (zh) * | 2024-03-15 | 2024-07-09 | 江苏乐易智慧科技有限公司 | 一种基于ai技术识别手写字体的方法与系统 |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3755780A (en) * | 1971-06-28 | 1973-08-28 | Pattern Analysis & Recognition | Method for recognizing characters |
US4731857A (en) | 1984-06-29 | 1988-03-15 | International Business Machines Corporation | Recognition system for run-on handwritten characters |
US4837842A (en) * | 1986-09-19 | 1989-06-06 | Holt Arthur W | Character and pattern recognition machine and method |
US4864618A (en) | 1986-11-26 | 1989-09-05 | Wright Technologies, L.P. | Automated transaction system with modular printhead having print authentication feature |
JPH0290384A (ja) * | 1988-09-28 | 1990-03-29 | Ricoh Co Ltd | 文字認識装置の後処理方式 |
US5051736A (en) | 1989-06-28 | 1991-09-24 | International Business Machines Corporation | Optical stylus and passive digitizing tablet data input system |
US5151950A (en) * | 1990-10-31 | 1992-09-29 | Go Corporation | Method for recognizing handwritten characters using shape and context analysis |
CA2077970C (en) * | 1991-11-19 | 1999-02-23 | Daniel P. Huttenlocher | Optical word recognition by examination of word shape |
US5852434A (en) | 1992-04-03 | 1998-12-22 | Sekendur; Oral F. | Absolute optical position determination |
US5477012A (en) | 1992-04-03 | 1995-12-19 | Sekendur; Oral F. | Optical position determination |
JPH07182462A (ja) * | 1993-12-22 | 1995-07-21 | Toshiba Corp | 文字認識装置及び方法 |
DE4407998C2 (de) * | 1994-03-10 | 1996-03-14 | Ibm | Verfahren und Vorrichtung zur Erkennung eines Musters auf einem Beleg |
US7103460B1 (en) * | 1994-05-09 | 2006-09-05 | Automotive Technologies International, Inc. | System and method for vehicle diagnostics |
US20050192727A1 (en) * | 1994-05-09 | 2005-09-01 | Automotive Technologies International Inc. | Sensor Assemblies |
US5652412A (en) | 1994-07-11 | 1997-07-29 | Sia Technology Corp. | Pen and paper information recording system |
JP3647518B2 (ja) | 1994-10-06 | 2005-05-11 | ゼロックス コーポレイション | コード化したワードトークンを使用して文書画像をハイライトで強調する装置 |
US5661506A (en) | 1994-11-10 | 1997-08-26 | Sia Technology Corporation | Pen and paper information recording system using an imaging pen |
JPH08180137A (ja) * | 1994-12-26 | 1996-07-12 | Hitachi Ltd | 文字入力装置 |
US5642435A (en) * | 1995-01-25 | 1997-06-24 | Xerox Corporation | Structured document processing with lexical classes as context |
US5706364A (en) * | 1995-04-28 | 1998-01-06 | Xerox Corporation | Method of producing character templates using unsegmented samples |
US5778361A (en) * | 1995-09-29 | 1998-07-07 | Microsoft Corporation | Method and system for fast indexing and searching of text in compound-word languages |
US6081261A (en) | 1995-11-01 | 2000-06-27 | Ricoh Corporation | Manual entry interactive paper and electronic document handling and processing system |
CA2247359A1 (en) * | 1996-03-08 | 1997-09-12 | Farzad Ehsani | Method and device for handwritten character recognition |
US5692073A (en) | 1996-05-03 | 1997-11-25 | Xerox Corporation | Formless forms and paper web using a reference-based mark extraction technique |
TW490643B (en) | 1996-05-21 | 2002-06-11 | Hitachi Ltd | Estimated recognition device for input character string |
US5796867A (en) | 1996-06-12 | 1998-08-18 | Industrial Technology Research Institute | Stroke-number-free and stroke-order-free on-line Chinese character recognition method |
JPH10302025A (ja) | 1997-04-25 | 1998-11-13 | Casio Comput Co Ltd | 手書き文字認識装置およびそのプログラム記録媒体 |
US6518950B1 (en) | 1997-10-07 | 2003-02-11 | Interval Research Corporation | Methods and systems for providing human/computer interfaces |
US6092065A (en) * | 1998-02-13 | 2000-07-18 | International Business Machines Corporation | Method and apparatus for discovery, clustering and classification of patterns in 1-dimensional event streams |
JPH11259088A (ja) * | 1998-03-13 | 1999-09-24 | Science Univ Of Tokyo | 音声認識方法及び音声認識装置並びに記録媒体 |
JPH11282842A (ja) * | 1998-03-30 | 1999-10-15 | Brother Ind Ltd | 日本語解析装置および日本語解析プログラムを記録したコンピュータ読み取り可能な記録媒体 |
WO1999050787A1 (en) | 1998-04-01 | 1999-10-07 | Xerox Corporation | Cross-network functions via linked hardcopy and electronic documents |
JP2000036008A (ja) | 1998-07-17 | 2000-02-02 | Casio Comput Co Ltd | 文字認識装置及び記憶媒体 |
JP2000090201A (ja) * | 1998-09-11 | 2000-03-31 | Masaki Nakagawa | バイグラム辞書とその小型化方法並びに手書き文字の認識処理方法およびその装置 |
US6249605B1 (en) * | 1998-09-14 | 2001-06-19 | International Business Machines Corporation | Key character extraction and lexicon reduction for cursive text recognition |
US6964374B1 (en) | 1998-10-02 | 2005-11-15 | Lucent Technologies Inc. | Retrieval and manipulation of electronically stored information via pointers embedded in the associated printed material |
CN1145872C (zh) * | 1999-01-13 | 2004-04-14 | 国际商业机器公司 | 手写汉字自动分割和识别方法以及使用该方法的系统 |
US6658151B2 (en) * | 1999-04-08 | 2003-12-02 | Ricoh Co., Ltd. | Extracting information from symbolically compressed document images |
US6678415B1 (en) * | 2000-05-12 | 2004-01-13 | Xerox Corporation | Document image decoding using an integrated stochastic language model |
WO2002037933A2 (en) * | 2000-11-08 | 2002-05-16 | New York University | System, process and software arrangement for recognizing handwritten characters |
JP4136316B2 (ja) * | 2001-01-24 | 2008-08-20 | 富士通株式会社 | 文字列認識装置 |
US7089099B2 (en) * | 2004-07-30 | 2006-08-08 | Automotive Technologies International, Inc. | Sensor assemblies |
-
2001
- 2001-10-15 AU AUPR8246A patent/AUPR824601A0/en not_active Abandoned
-
2002
- 2002-10-15 AT AT02801224T patent/ATE387677T1/de not_active IP Right Cessation
- 2002-10-15 JP JP2003536981A patent/JP2005505869A/ja active Pending
- 2002-10-15 IL IL16137902A patent/IL161379A0/xx unknown
- 2002-10-15 US US10/492,161 patent/US7444021B2/en not_active Expired - Fee Related
- 2002-10-15 EP EP02801224A patent/EP1446763B1/en not_active Expired - Lifetime
- 2002-10-15 KR KR1020047005516A patent/KR100630886B1/ko not_active IP Right Cessation
- 2002-10-15 WO PCT/AU2002/001392 patent/WO2003034326A1/en active IP Right Grant
- 2002-10-15 DE DE60225317T patent/DE60225317T2/de not_active Expired - Lifetime
- 2002-10-15 CA CA002463127A patent/CA2463127C/en not_active Expired - Fee Related
- 2002-10-15 CN CNA028204751A patent/CN1571980A/zh active Pending
- 2002-10-15 AU AU2002333063A patent/AU2002333063B2/en not_active Ceased
-
2004
- 2004-04-14 IL IL161379A patent/IL161379A/en not_active IP Right Cessation
-
2008
- 2008-04-14 US US12/102,751 patent/US7532758B2/en not_active Expired - Fee Related
- 2008-05-30 JP JP2008143500A patent/JP4568774B2/ja not_active Expired - Fee Related
- 2008-09-01 US US12/202,384 patent/US7756336B2/en not_active Expired - Fee Related
-
2010
- 2010-07-06 US US12/831,244 patent/US7881536B2/en not_active Expired - Fee Related
- 2010-12-22 US US12/976,324 patent/US8000531B2/en not_active Expired - Fee Related
-
2011
- 2011-08-07 US US13/204,704 patent/US8285048B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
WO2003034326A1 (en) | 2003-04-24 |
KR100630886B1 (ko) | 2006-10-02 |
EP1446763A1 (en) | 2004-08-18 |
US20080193021A1 (en) | 2008-08-14 |
CN1571980A (zh) | 2005-01-26 |
US20090022399A1 (en) | 2009-01-22 |
ATE387677T1 (de) | 2008-03-15 |
JP4568774B2 (ja) | 2010-10-27 |
US7881536B2 (en) | 2011-02-01 |
EP1446763A4 (en) | 2006-05-31 |
DE60225317T2 (de) | 2009-02-26 |
IL161379A0 (en) | 2004-09-27 |
US7444021B2 (en) | 2008-10-28 |
US20110091110A1 (en) | 2011-04-21 |
US20110293186A1 (en) | 2011-12-01 |
US8285048B2 (en) | 2012-10-09 |
AUPR824601A0 (en) | 2001-11-08 |
KR20050036857A (ko) | 2005-04-20 |
US8000531B2 (en) | 2011-08-16 |
JP2008243227A (ja) | 2008-10-09 |
US7756336B2 (en) | 2010-07-13 |
US7532758B2 (en) | 2009-05-12 |
CA2463127A1 (en) | 2003-04-24 |
AU2002333063B2 (en) | 2007-09-06 |
CA2463127C (en) | 2009-09-22 |
EP1446763B1 (en) | 2008-02-27 |
US20100278430A1 (en) | 2010-11-04 |
IL161379A (en) | 2011-06-30 |
US20050226512A1 (en) | 2005-10-13 |
DE60225317D1 (de) | 2008-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4568774B2 (ja) | 手書き文字認識で使用されるテンプレートを生成する方法 | |
AU2002333063A1 (en) | Character string identification | |
Azmi et al. | A survey of automatic Arabic diacritization techniques | |
Zitouni et al. | Maximum entropy based restoration of Arabic diacritics | |
Antony et al. | Parts of speech tagging for Indian languages: a literature survey | |
US20090070097A1 (en) | User input classification | |
WO2005064490A1 (en) | System for recognising and classifying named entities | |
Shaalan et al. | A hybrid approach for building Arabic diacritizer | |
Nguyen et al. | A hybrid approach to Vietnamese word segmentation | |
Hládek et al. | Learning string distance with smoothing for OCR spelling correction | |
Uthayamoorthy et al. | Ddspell-a data driven spell checker and suggestion generator for the tamil language | |
Romero et al. | Using the mggi methodology for category-based language modeling in handwritten marriage licenses books | |
Elshafei et al. | Machine Generation of Arabic Diacritical Marks. | |
US20140093173A1 (en) | Classifying a string formed from hand-written characters | |
Daya et al. | Identifying semitic roots: Machine learning with linguistic constraints | |
Mohapatra et al. | Spell checker for OCR | |
Manohar et al. | Spellchecker for Malayalam using finite state transition models | |
Goonawardena et al. | Automated spelling checker and grammatical error detection and correction model for sinhala language | |
Lakshmi et al. | Automated Word Prediction In Telugu Language Using Statistical Approach | |
Oluwaseyi et al. | Automatic Spelling Corrector for Yorùbá Language Using Edit Distance and N-Gram Language Models | |
ZA200402926B (en) | Character string identification. | |
Pan | Collaborative Recognition and Recovery of the Chinese Intercept Abbreviation | |
ZA200507771B (en) | Method of generating statistical templates of character strings | |
CN114330316A (zh) | 简拼的识别方法及计算机可读存储介质 | |
Parvez et al. | Linguistic Descriptors for Arabic Sub-Words Conjugation and Recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070402 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080304 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080530 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20080530 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080708 |