JP2750057B2 - 自動手書き文字認識に対する統計的混合手法 - Google Patents

自動手書き文字認識に対する統計的混合手法

Info

Publication number
JP2750057B2
JP2750057B2 JP4220410A JP22041092A JP2750057B2 JP 2750057 B2 JP2750057 B2 JP 2750057B2 JP 4220410 A JP4220410 A JP 4220410A JP 22041092 A JP22041092 A JP 22041092A JP 2750057 B2 JP2750057 B2 JP 2750057B2
Authority
JP
Japan
Prior art keywords
character
feature vector
prototype
signal
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP4220410A
Other languages
English (en)
Other versions
JPH05217024A (ja
Inventor
エヴェリン・ジャニーン・ベルガーダ
ジェローム・ルネ・ベルガーダ
デイヴィッド・ナハムー
クリシュナ・サンダラム・ネイサン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH05217024A publication Critical patent/JPH05217024A/ja
Application granted granted Critical
Publication of JP2750057B2 publication Critical patent/JP2750057B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • G06V30/347Sampling; Contour coding; Stroke extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • G06V30/373Matching; Classification using a special pattern or subpattern alphabet

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、信号処理の分野におけ
るものであり、特に手書き認識に関する。特に、本発明
は、1つの(あるいは幾つかの)特徴ベクトル空間、各
空間におけるユークリッドおよびガウス・モデリング、
および全ての空間における全ての関連プロトタイプの寄
与を勘案する混合復号法における手書きの適当な表現に
基く手書き認識に関する。
【0002】
【従来の技術および発明が解決しようとする課題】続き
書きあるいは更に手書き文字を認識すると称する自動シ
ステムは、これまでごく限られた成功をもたらしたに過
ぎない。その理由は、主として手書きのモデリングにお
いて使用されるテンプレートにより呈される頑強性の不
足に見出すことができる。例えば、続き書きの手書き文
字の認識のための3ステップの手順について記載する米
国特許第4,731,857号がある。第1に、潜在的
区切り点が取得される。第2に、妥当に文字であり得る
区切りの全ての組合わせが文字認識装置へ送られてラン
ク付けされた選択および対応する点数を得る。第3に、
最善の候補単語を得るように文字列が組合わされる。各
テンプレートは、この文字を形成する筆記者の平均的方
法をおそらくは表わすであろう完全形成文字であり、そ
の時の文字の弾性的照合(マッチング)が各テンプレー
トに対して計算される。この手法は、筆記者および時間
の双方にわたり観察され得る広範囲な多岐性の影響を受
け易い。
【0003】本発明は、受入れ得る頑強度を有する手書
き認識のための高速アルゴリズム(即ち、Tapper
tの米国特許第4,731,857号に開示される如き
弾性的マッチングのそれと似た複雑さ)の考案に関する
ものである。このため、少なくとも3つの重要な規定を
もたらす。即ち、(i)特徴要素は、個別の、筆記、続
き書きあるいは拘束されないモードで生成された手書き
も同様に特徴付けるように選択されねばならず、(ii)
これらの特徴要素は冗長性を最小化するように適当に処
理され、これによりパラメータ毎に表わされる情報を最
大化されねばならず、(iii)結果として得る特徴パラ
メータは更に、手書きにおける広い傾向を検出してこの
ような傾向の適当なモデリングを可能にしなければなら
ない。これらの規定は、現在の弾性的マッチング法が
(i)文字ベースであるため、また(ii)文字テンプレ
ートを得るため幾つかの文字例を単に平均化するもので
あるため、このマッチング法では満たされない。
【0004】本発明によれば、信号処理フロントエンド
(プロセッサ)は、弾性的マッチング法よりも非常に複
雑である。入力データを単に区切りに分割するのではな
く、信号は更に高次元の特徴空間(手書き空間)に変換
され、その点が冗長でない特徴の抽出の毎に全ての直接
観察を表わす。更に細かなクラスタリング(クラス分
割)のための(ユークリッド法とは対照的な)ガウス法
を用いて、この空間におけるプロトタイプが頑強性のた
め形成される。従って、各プロトタイプは、多くの文字
と共通である小さなビルディング・ブロック(具体的に
はクラスタ中心)を表わす。文字列の代わりに、ビルデ
ィング・ブロック列が組合わされ、その各々が真性の確
率空間について定義された真の尤度が割当てられる(距
離スコアとはちょうど対照的に)。最後に、認識アルゴ
リズム自体は高々この確率空間について演算する事後復
号である。この代替的な手法は頑強性のための規定を満
たすのに更に適合する。
【0005】
【課題を解決するための手段】本発明の目的は、改善さ
れた手書き認識システムの提供にある。
【0006】本発明の別の目的は、入力された手書きが
局部的および大域的な両特徴要素を抽出するように信号
処理される改善された手書き認識システムの提供にあ
る。
【0007】本発明の他の目的は、ウインドウ表示を用
いて広義の特徴事象を検出する改善された手書き認識シ
ステムの提供にある。
【0008】本発明の更に他の目的は、射影を用いて冗
長性を排除する改善された手書き認識システムの提供に
ある。
【0009】本発明の他の目的は、手書き空間と呼ばれ
る適当な特徴ベクトル空間におけるガウス・モデリング
に基いて手書きが認識される改善された手書き認識シス
テムの提供にある。
【0010】本発明の他の目的は、混合復号法を用いて
手書き空間における全ての関連プロトタイプの寄与を勘
案する改善された手書き認識システムの提供にある。
【0011】本発明の更に他の目的は、多数の手書き空
間と対応する多数のコードブック(クラスタ中心の一覧
表)を用いて更に頑強な認識を提供する改善された手書
き認識システムの提供にある。
【0012】手書きテキストの自動認識は、適当な特徴
ベクトル空間におけるユークリッドおよびガウス・モデ
リング、およびこの空間における全ての関連プロトタイ
プの寄与を勘案する混合復号法に基く。
【0013】全ての筆記モードに充分な特徴要素を得る
ため、1つの点から次の点までの座標の差、ならびに文
字自体が平行移動しても変化しないような勾配および曲
率情報が選択される。これは、ペンの軌跡の局部的な挙
動について充分な情報を提供する。同時に、ペンの軌跡
の大域的挙動についての情報を集めることが重要であ
る。続き書きあるいは拘束されない手書きの場合にはこ
の情報の評価が更に難しいため、対応する大域的特徴要
素を局部的な特徴要素とは別個に処理されねばならな
い。しかし、両者において冗長性を最小化するため、結
果として得るデータの全共分散マトリックスが計算さ
れ、関連する固有値および固有ベクトルが見出され、線
形変換がこれら固有ベクトルの方向に沿って与えられ、
データは下位の次元のサブ空間に対して射影される。最
後に、手書きにおける重要なビルディング・ブロック
(具体的には、クラスタ中心)を検出するため、少ない
特徴ベクトルが比較的少数のいわゆる手書きプロトタイ
プに分割されて、筆記プロセスにおいて使用される基本
的なビルディング・ブロックを表わす手書きラベルの英
字をもたらす。
【0014】上記の手法は、筆記者に依存しないかある
いは筆記者に依存するベースで実現することができる。
後者の場合、各筆記者毎に1組の手書きプロトタイプが
得られる。この組は、対応する筆記者の個人的特徴を捕
捉することが期待される。本アルゴリズムを初期化する
ため、ある手書きが記録され、各ストローク(運筆また
は筆画)毎にタブレット上のその時の軌跡と対応する一
連の(x、y)座標が得られるようにする。一旦手書き
プロトタイプが得られると、その時の特徴ベクトルを生
じる各プロトタイプの尤度を計算し、各個の尤度を一緒
に混合して最終的尤度を得るだけで認識を行うことがで
きる。この手法では、混合係数は語彙における各文字が
手書きラベル・タブレットに与えられたプロトタイプを
生じる確率である。
【0015】
【実施例】手書き認識において、手書き文字は一般に図
1に示される5つのグループに該当し、このグループは
認識の複雑さの増加する順序に示される。特に、これら
のグループは、個々の文字が予め定義された領域内に形
成される枡目があってそこへ楷書で書いていくものとし
て知られる第1のタイプの筆記(W1)を含み、これに
より文字の区切りタスクを簡単にする。第2のタイプの
筆記(W2)は、文字が他の文字と接触しないようにユ
ーザが各文字を意図的に形成する間隔をおいた離散とし
て知られる。第3のタイプの筆記(W3)は、相互に接
触する即ち「繋がる」文字をユーザが形成できる続け書
き離散として知られる。第4のタイプの筆記(W4)
は、ユーザが通常全単語を筆記後でtの横棒を引きiお
よびjの点を打つ続け書きである。最後に、第5のタイ
プの筆記(W5)は、ユーザが続き書きの組合わせを使
用する拘束されない筆記である。この最後のタイプは、
最も困難であり、図3に示された5つのスタイルの最も
複雑な区切りおよび認識を提供する。
【0016】図2において、一般的な手書き認識システ
ムの動作がブロック図で示される。図2の一般的論議が
最初に行われ、内部に示されるブロックの各々の動作の
詳細な記述が続く。ブロック2において、スタイラス即
ちペンのストローク(運筆または筆画)情報のデータ取
得が生じる。取得されたストロークは、手書き情報を認
識するため演算される。ブロック4に示される如きトレ
ーニング演算モードの間、取得された手書き情報が既知
のトレーニング筆跡に関して分析され、この情報を表わ
すため基底モデルを教習する。使用中、トレーニング中
に得られたモデル・パラメータが、認識される(未知
の)手書きと対応する特徴ベクトルと共に、復号ブロッ
ク6により使用される。特に、復号ブロック6はこのモ
デルを用いて個々の特徴ベクトルの組立てから候補文字
種を生成する。復号プログラムは、関連するモデル・パ
ラメータに基く最も確率の高い文字種を選択する。
【0017】認識された手書きは、その後ブロック8に
より使用できるようになる。例えば、認識されたメッセ
ージは単に英数字フォーマットに変換され、表示デバイ
ス上に表示される。認識されたメッセージはまた、これ
まで例えばワード・プロセッシング・システムの如きキ
ーボードからメッセージを受取る何らかのアプリケーシ
ョンへ渡される。
【0018】下記のアルゴリズムは、本発明の手書き認
識システムを含む装置において実現される。このアルゴ
リズムのステップは下記の如くである。即ち、
【0019】1.筆記の速度に対して正規化するデータ
の事前フィルタリングを行う。これは、タブレットによ
り捕捉される諸点間の間隔が筆記速度に依存して不等間
隔に並ぶ点列(これを説明の便宜上比喩的に、弾道状と
呼ぶことにする)を、全ての点が等間隔である時間に依
存しない表現に変換することにより行われる。線形補間
が結果として生じる等間隔点を見出す必要に応じて行わ
れる。必要に応じて、更に微細な補間に対してはキュー
ビック・スプライン補間もまた行うことができる。
【0020】2.各点毎に、トレーニング・データにお
ける座標(xn、yn)のnがPn付近の局部のペン軌
跡を表わす特徴要素のP次元ベクトルPnを形成する。
例えば、Pに対する良好な選択は6であり、特徴要素が
下記により与えられる。即ち、(i)水平および垂直方
向の増分変化:
【0021】
【数1】
【0022】(ii)Pnにおけるペンの軌跡に対する接
線角の正弦および余弦:
【0023】
【数2】
【0024】(iii)上記の2つのパラメータにおける
増分変化:
【0025】
【数3】
【0026】最後の2つのパラメータがPnにおけるペ
ンの軌跡の曲率についての情報を提供することに注意さ
れたい。
【0027】3.各点毎に、トレーニング・データにお
ける座標(xn、yn)のnが、Pnまでの大域ペン軌
跡を表わす特徴要素のP′次元ベクトルP′nを形成す
る。例えば、P′に対する良好な選択は3であり、特徴
要素は下記により与えられる。即ち、(i)基線yn
らの高さ、(ii)ストローク(xn−xi)の始めからの
幅(但し、xiはその時のストロークの第1の座標)、
および(iii)その時の文字が1つ以上のストロークか
らなるならばストローク間の距離。
【0028】4.トレーニング・データにおける各スト
ローク毎に、このストロークにおける複数点Pn のサブ
セット例えば複数のQiが略々等しく隔てられる特性を
有するようなQiを決定する。別言すれば、ストローク
中の点の部分集合を複数決定して、i番目の部分集合を
iとおくのである。この部分集合すなわちサブセット
は常に各ストロークの最初と最後の点を含み、例えば、
図1の第1のタイプの筆記(W1)においては、桝目を
形成している上限または下限との間隔(すなわち行の高
さ)に応じて点の間隔を調整すればよいのである。すな
わち、小さい文字であれば細かくとる必要が生じるであ
ろう。
【0029】5.ステップ4で得られる各Qiは、Qi
前のH個のPnのベクトルと、Qi自身と、Qiの後のH
個のPnのベクトルと、を連結させることによってQ次
元の接合ベクトルを構成する。同様に、Q′iの前の
H′個のP′nのベクトルと、Q′i自身と、Q′iの後
のH′個のP′nのベクトルと、を連結させることによ
ってQ′次元の接合ベクトルを構成する。これは、下式
が成立つならば実現し得る。即ち、
【0030】
【数4】
【0031】良好な選択はH=H′であり、値Q=24
6およびQ′=123を生じる。
【0032】6.局部手書き特徴と対応する全てのQ次
元ベクトルの平均ベクトルおよび共分散マトリックスを
計算する。これらはそれぞれMt (1)およびSt (1)として
示す。同様に、大域手書き特徴と対応する全てのQ′次
元ベクトルの平均ベクトルおよび共分散マトリックスを
計算する。これらはそれぞれMt (2)およびSt (2)として
示す。
【0033】7.n=1,2に対しては、対応する固有
値の対角マトリックスであるSt (n)およびΛ t (n)の固有
ベクトル・マトリックスEt (n)を計算する。これらの量
は下式の関係に従う。即ち、
【0034】
【数5】
【0035】但し、Tは行列の転置を表わす。このた
め、Et (n)における先行固有ベクトルがΛ t (n)における
先行固有値と対応する。
【0036】8.ステップ7からのR1個の主要固有ベ
クトル(固有値の大きい順にとったベクトル) を用い
て、ステップ5のQ次元の特徴ベクトルを次元R1 の空
間へ射影する。結果として得るベクトルri (1)を呼出
す。R1 に対する妥当値は6である。この点において、
Q次元の接合特徴ベクトルに存在する冗長性が排除さ
れ、最も情報を包含している特徴要素で連結された。ベ
クトルri (1)により張られた空間を手書き空間(カイロ
グラフィック空間)C(1)と呼ぶ。
【0037】9.同様に、ステップ7からのR2 個の主
要固有ベクトルを用いて、ステップ5のQ′次元の特徴
ベクトルを次元R2の空間に射影し、ベクトルri (2)
結果として生成する。R2 に対する妥当値は15であ
る。一般に、(大域特徴の)Q次元の接合特徴ベクトル
には(局部特徴の)Q次元接合特徴ベクトルにおけるよ
りも少ない冗長性が存在する故に、R2>R1となること
に注意されたい。ベクトルri (2)により張られた空間を
手書き空間C(2)と呼ぶ。
【0038】10.ここでのステップ10をn=1,
2に対してランダム・クラスタ割当てで開始し、対応
するRn 次元の手書き空間における予備的プロトタイプ
分布を得るように、ステップ8および9で得た射影ベク
トルri (n)のK平均ユークリッド・クラスタリングを実
施する。
【0039】11.ここでのステップ11を、n=1,
2に対して、ステップ10の予備的分布から開始し、両
方の手書き空間における最終的ガウス・プロトタイプ分
布を得るように、ステップ8および9において得た射影
ベクトルri (n)のK平均ガウス・クラスタリングを実施
し、ガウス混合分布を求める。。これらのプロトタイプ
分布をπk (n)として表わし、クラスタ・サイズを使用し
て、各Rn次元の手書き空間における各プロトタイプ分
布の確率Pr(πk (n))を評価する。
【0040】12.ここでのステップ12を、n=1,
2に対して、ステップ11からのガウス分布を用いて、
ステップ8および9で得た全てのベクトルri (n)に対し
て量Pr(ベクトルri (n)|πk (n))を計算する。ま
た、各手書き空間における全クラスタ数がKnであるも
のとして、各特徴ベクトルの確率を下式で評価する。即
ち、
【0041】
【数6】
【0042】良好な選択はK1=K2=400である。
【0043】13.ここでのステップ13を、n=1,
2に対して、ステップ11および12の結果を用いて、
下記量を計算し、
【0044】
【数7】
【0045】次のステップ14のために、対象となる語
彙におけるどの候補文字種aj に対して,各ベクトルr
i (n)がトレーニング・データに整合されるかに注意され
たい。
【0046】14.ここでのステップ14を、n=1,
2に対して、対象となる語彙における各候補文字種aj
毎に、これに整合された全てのベクトルri (n)を一緒に
プールして対応するP(πk (n)|ベクトルri (n))を
累計する。正規化の後に、これは各候補文字種aj を与
えた各手書き空間における各プロトタイプ分布の確率で
あるP(πk (n)|aj)の評価を行う。これがトレー
ニング段階の終りである。
【0047】15.トレーニング・データと同じ各手書
き空間にテスト特徴ベクトルを生じるように、テスト・
データについてステップ1乃至5および8乃至9を反復
する。
【0048】16.手書き空間C(1)においてベクトル
i (1)で、また手書き空間C(2)においてベクトルri
(2)で表わされる各データ・フレームfi 毎に、ステッ
プ11で得たガウス混合分布およびステップ14で得た
確率を用いて下記の量を形成する。即ち、
【0049】
【数8】
【0050】即ち、全手書きラベル英字をカバーする2
単一ガウス混合分布の加重積である。この式中、α
が第1のコードブックに対する第2のコードブックの影
響を制御する。αに対する良値は0.7である。これ
は、連続フレームのスコアを乗じてフレームの仮のシー
ケンスに対する全スコアを得、これにより復号プロセス
を完了する。
【0051】次に、先に述べたアルゴリズムを実現する
ための本発明による手書き認識システムのブロック図で
ある図3を参照する。例えばIBM3090/VFある
いはIBM RS6000でよい汎用コンピュータ10
が、スタイラス12を用いるユーザにより生成された文
字即ちストローク情報を受取って電子タブレット14に
書込む。この文字即ちストローク情報は、電子タブレッ
ト14上かあるいは他の表示デバイス(図示せず)上に
表示することができる。コンピュータ10は、トレーニ
ング・モード16かあるいは復号モード18のいずれか
で使用することができる。これは、破線20により象徴
的に示される。トレーニングまたは復号のいずれのモー
ドにおいても、フロント・エンド・パラメータ抽出ブロ
ック22を加えなければならない。トレーニング・モー
ド16においては、アルゴリズムは、プロトタイプ構成
ブロック24と、言語モデル・ブロック26とを含む。
復号モード18においては、アルゴリズムは尤度評価部
28と復号部30とを含む。
【0052】ブロック22乃至30は機能プログラム・
モジュールとして示されるが、これら機能ブロックの一
部あるいは全てがソフトウエア形態の代わりにハードウ
エア形態で実現され、本発明の特許請求の範囲の教示内
にあることが理解されよう。
【0053】手書き認識アルゴリズムのステップ1乃至
9を実行するフロント・エンド・パラメータ抽出ブロッ
ク22は、トレーニング・モードの間プロトタイプ構成
ブロック24に対して、あるいは復号モードの間プロト
タイプ構成ブロック24に対して特徴ベクトルを提供す
る。プロトタイプ構成ブロック24は、手書き認識アル
ゴリズムのステップ10乃至14を実行して、(i)文
字の適当な部分を表わす手書きプロトタイプ、および
(ii)これらを組合わせる方法を示す混合係数(ガウス
混合分布)を生じる。この情報は、未知の候補文字種を
判定あるいは認識する復号モードにおいて使用される。
言語モデル・ブロック26は、どの候補文字種が与えら
れたコンテキスト中に最も生じ得るか、あるいはどの単
語が与えられたコンテキスト中に生じ得るかを判定する
ため使用できる言語モデルの確率を提供する。ある実施
例においては、ブロック26は手書き中に生じる候補文
字種、句あるいは文章のあり得る組合わせのライブラリ
に実施することができる。この言語モデルは、認識中復
号部30によって使用される。
【0054】認識モードの間、手書き認識アルゴリズム
のステップ16を実行する尤度評価部28は、認識され
る未知のストロークまたは文字から生じた特徴ベクトル
をブロック22から受取る。これらの特徴ベクトルは、
ブロック24からの手書きプロトタイプと同じ手書き空
間に存在し、従ってこれらの各々と比較して特定の各特
徴ベクトルに対するその各々の寄与を評価する。この情
報は、特定の各特徴ベクトルが英字における候補文字種
に「帰属」する尤度を計算するため、トレーニング中生
じる混合係数を用いて積分される。これは、全ての特徴
ベクトルにわたって、復号部30に対して認識のための
候補文字種を生じるように使用することができる。復号
部30は、最大スコアと対応するブロック26からの言
語モデルの確率を全スコアに積分する。示されたアルゴ
リズムに従う認識された筆記は、復号部30の出力32
に生成される。次にこの認識された筆記は、タブレット
14上に表示されるか、あるいは例えば表示デバイス、
プリンタ、アプリケーション・プログラムなどである利
用デバイス33へ渡される。
【0055】次に、図3に全体的に示されるフロント・
エンド・パラメータ抽出ブロック22の詳細なブロック
図である図4を参照する。筆記の各サンプル点は、手書
き認識アルゴリズムのステップ1を実行する事前フィル
タ・ブロック34へ渡される座標xnおよびynにより定
義される点により表わされる。これらの点は、図5に示
されるように諸点間の間隔が筆記速度に依存して不等間
隔に並ぶ点列として示される。即ち、前記点の間隔は、
筆記者がその時の文字を形成するのに用いた筆記速度の
関数である。種々の理由から、筆記者はその速度即ち筆
記速度がほとんど一貫せず、手書き認識における高い誤
差率を生じることがある。事前フィルタ・ブロック34
は、図5の点を正規化してブロック34の出力に等間隔
の点xmおよびymを生じる。事前フィルタリングの詳細
については、図7および図8に関して簡単に説明する。
図6に示される如き文字を含む等間隔の点xmおよびym
は、パラメータ抽出ブロック36へ与えられ、これがベ
クトルvm を生じる手書き認識アルゴリズムのステップ
2および3を実施する。このパラメータ抽出の詳細は、
図11、図12、図13および図14に関して簡単に説
明する。ベクトルvm は、ウインドウ表示ブロック38
へ与えられ、これが接合ベクトルSi を生じるため手書
き認識アルゴリズムのステップ4および5を実施する。
接合ベクトルSi が与えられる方法の詳細については、
図14、図15および図16に関して簡単に説明する。
接合ベクトルSi は射影ブロック40へ与えられ、この
ブロックが特徴ベクトルriを生じるため手書き認識ア
ルゴリズムのステップ6乃至9を実施する。これは、接
合パラメータ・ベクトルにおける冗長性を排除する。ブ
ロック40の機能の詳細については、図17に関して記
載される。射影ブロック40は、接合ベクトルSi に応
答して特徴ベクトルri を生じ、これは先に図3に関し
て述べたように、プロトタイプ構成ブロック24および
尤度評価部28へ与えられる。射影ブロック40の詳細
については、図17のフロー図に関して記載する。
【0056】図5の諸点間の間隔が筆記速度に依存して
不等間隔に並ぶ点列として示される文字が事前フィルタ
・ブロック34(図4)により正規化されて、手書き認
識アルゴリズムのステップ1が行われる方法を示す図7
および図8に関して次に説明する図6の等間隔の文字を
生じる。図7は、図5の上4分の1の湾曲部分を表わ
す。第1に、元の生の点(点・で示される)間のある補
間法を行うことにより点の密度が増加される。この結
果、元の生点(・)おいた補間点(|)を含む一連の点
を生じる。次いで、点間の等しい間隔が電子タブレット
14(図3)上に示される如き2つのpel間の距離と
適当に関連する距離Rであることの事前の決定によりフ
ィルタリングが行われる。図7においては、その結果X
(56)により示されるフィルタリングの後一連の点が
生じる。生および内挿された点は等間隔ではない整数点
nと見做され、フィルタ点は等間隔の整数点mと見做さ
れる。
【0057】図8によれば、ブロック42において、ス
トロークの第1の(生の)点48における位置n=1が
m=1で示され、これも第1のフィルタ点と見做され
る。n=2におけるストロークの第2の点50は、フィ
ルタリングに対してテストされる第1の点である。ブロ
ック44において、点mおよびn間の(ユークリッド)
距離が下記の関係に従って決定される。即ち、
【0058】距離=|xn−xm2+|yn−ym2
【0059】ブロック46において、距離がRより大き
いかどうか判定が行われる。図7において、点m=1は
点48であり、点n=2は点50である。図7では距離
がRより小さいことが判り、従って点は排除されてブロ
ック52へ進み、ここでnは3、即ち点54へ増分され
る。ブロック44において距離が再び計算されて、ブロ
ック46においてRと比較される。最後に、距離はRよ
り大きくなり、従って点55が受入れられる(ブロック
58においてmはnと等しくされる)。ブロック60に
おいて、点(xn、yn)が12番目の点の点56である
フィルタ点(xm、ym)として記憶される。ブロック6
2において、nは1だけ増分され、ブロック44へ戻
り、ここで生の点および内挿点が先に述べたように処理
される。
【0060】図9および図10は、従来技術において特
徴ベクトルがストロークの重心(CG)に関してどのよ
うに得られるかを示している。入力されたストローク、
例えば小文字の「a」が電子タブレットにより捕捉され
る。各特徴ベクトルは、重心に対するストロークにおけ
るサンプル点(P)の変位xおよびy、基底線(BL)
に対するPの変位(b)、およびPに対する接線(L)
と関連する角度情報(θ)を表わす諸元を含む。この望
ましい実施態様における結果として得る特徴ベクトル
は、4つの元を持ち、このため4つの次元(4d)ベク
トルを表わす。
【0061】図11、図12、図13および図14は、
手書き認識アルゴリズムのステップ2および3を実施す
る図4のブロック36のパラメータ抽出がパラメータ・
ベクトルvm を提供するため本発明により如何にして
得られるかを示している。図11は局部パラメータ抽出
を示し、図12は局部パラメータ・ベクトルを、図13
は大域パラメータ抽出を、図14は大域パラメータ・ベ
クトルを示す。合計9つの座標に対して、局部パラメー
タ・ベクトルには6つの局部座標があり、大域パラメー
タ・ベクトルには3つの大域座標がある。即ち、図10
に示す如き従来技術の4つの座標より5つ多い座標が生
成される。局部パラメータ・ベクトルについては、前の
点66、67および後の点68、69に対するこの時の
点64に関して計算が行われる。局部パラメータ・ベク
トルに対する特定の計算は図12に示される。大域パラ
メータ・ベクトルについては、基底線65、文字の初点
66、第1のストロークの最終点67および第2のスト
ロークの初点68に対するその時の点64に関して計算
が行われる。大域パラメータ・ベクトルに対する特定計
算は図14に示される。一般性を損なうことなく、本項
の残部は唯1つのコードブックの手書き認識アルゴリズ
ム、即ち、局部パラメータ・ベクトルあるいは大域パラ
メータ・ベクトルを示す。
【0062】次に、特徴ベクトルがデータから抽出され
る方法を示すため、図4のウインドウ表示ブロック38
の詳細を図15および図16に関して述べる。少数の略
々等距離の特徴点が図8と同じアルゴリズムを用いて決
定されるが、値Rが異なると、パラメータ・ベクトルは
これらの点で接合される。各点で接合されるべきパラメ
ータ・ベクトルの数(2H+1)は予め決定され、これ
が更に接合次元Q=(2H+1)Pを規定する。
【0063】図15において、特徴点が点で示され、ウ
インドウ中心がXで示される。点は点kとして示され、
Xは指標iにより点ki として示される。図16におい
て、ブロック70ではiおよびカウンタjがそれぞれ1
に等しくセットされる。ブロック72では、kがki
Hにセットされ、ブロック74において対応するベクト
ルvk (P次元の)が得られる。次に、ブロック76に
おいて(2H+1)ベクトルvk が示されるかどうかの
判定がなされる。もしそうであれば、ブロック78にお
いてjは1に再び初期化され、iは1だけ増分され、こ
の手順は先に述べたように反復される。もしそうでなけ
れば、ベクトルvk が位置(j−1)P+1で始まるベ
クトルVi に加えられる。ブロック82においてkおよ
びjが共に1だけ増分され、次のvk を得るためブロッ
ク74へ戻り、この手順が先に述べたように反復され
る。
【0064】図17において、手書き認識アルゴリズム
のステップ6乃至9を実施する図4の射影ブロック40
の機能を詳細に説明する。この射影ブロックは、ウイン
ドウ表示ブロック38からの接合パラメータ・ベクトル
における冗長性を排除するため使用される。ブロック7
1において全ての接合ベクトルに対して共分散マトリッ
クスが計算され、関連する固有値および固有ベクトルが
ブロック75において主成分分析により見出される。ブ
ロック74の固有ベクトルおよびそれに対応するR個の
主要な固有値を用いて、ブロック77において接合ベク
トルが手書き空間と呼ばれるより小さな次元のサブ空間
に対して射影され、結果として射影ベクトルri を生じ
る。共分散マトリックスが計算される方法については、
J.H.GolubおよびC.F.VanLoan著
「Matrix Computations」(Joh
n Hopkins,University Pres
s、Baltimore、1989年)に記載されてい
る。この文献はまた、ブロック73における主成分分析
の方法およびブロック77における全てのSiの射影方
法を教示する。
【0065】図3のプロトタイプ構成ブロック24の詳
細を示す図18および図19に示されるように、手書き
空間が仕切られて手書きプロトタイプを生じる。特徴ベ
クトルがブロック79に与えられて、K平均ユークリッ
ド・クラスタリングを行う。ブロック79の詳細は、図
19および図20に関して記載される。ユークリッド・
クラスタリングの結果はブロック81に与えられてK平
均ガウス・クラスタリングを行い、プロトタイプ分布ベ
クトルπk を生じる。ブロック81の詳細は、図21に
関して記載される。図18乃至21は、手書き認識アル
ゴリズムのステップ10および11が行われる方法を詳
細に示す。プロトタイプ分布または手書きプロトタイプ
が尤度評価部28(図3)に与えられて、復号部30
(図3)に対して候補文字種を生じる。K平均クラスタ
リングを一般に行う方法は、J.A.Hartigan
著「Clustering Algorithms」
(J.Wiley、1975年)において記載される。
【0066】図19は、クラスタ84、86、88に分
割される空間83を示す。各クラスタは、点xとして示
される複数のベクトルを含み、クラスタ中心(セントロ
イドともいう)#がこのようなベクトルのクラスタ毎に
計算される。
【0067】図18のブロック79の詳細を示す図20
を参照する。ブロック90において250と選定された
複数のランダム・シーズ(ランダム核)が図3のブロッ
ク22から得られる手書き空間における全ての点から拾
われる。各点と各速度間のユークリッド距離がブロック
92において計算される。各点をその最も近い核に割当
てることにより、ブロック94において空間がクラスタ
に仕切られる。これは、図19のクラスタ84、86、
88と対応している。各クラスタのセントロイドがブロ
ック96で計算される。これは、図19の#と対応す
る。これらのセントロイドは、ブロック98において元
の核を置換するようにセットされる。判断ブロック10
0において、最大反復数に達するかどうか判定がなされ
る。もしそうでなければ、先に述べたように、ブロック
92へ戻ってステップが繰返される。もしそうであれ
ば、ユークリッド・クラスタリングの計算が完了する。
【0068】図18のガウス・クラスタリング・ブロッ
ク81の詳細を示す図21を参照する。ブロック79
(図18)で得られたユークリッド・クラスタはブロッ
ク102で与えられる。各点と各セントロイド間のガウ
ス距離は、ブロック104で計算される。各点をその最
も近いセントロイドに割当てることにより、ブロック1
06において空間がクラスタに仕切られる。各クラスタ
の新しいセントロイドがブロック108で計算される。
判断ブロック110において、最大反復数が完了したか
どうかの判定が行われる。もしそうでなければ、先に述
べたように、ブロック104へ戻ってステップが反復さ
れる。もしそうであれば、ガウス・クラスタリングの計
算が完了する。この結果、手書き空間における最終的な
プロトタイプ分布が生じる。
【0069】唯1つのコードブック(クラスタ中心の一
覧表)に対する手書き認識アルゴリズムのステップ16
を実施し、ステップ12、13の結果として生じる手書
き認識アルゴリズムの情報が如何にして図3の尤度評価
部28により演算されて復号部30に対する候補文字種
を生じるかを示す図22を参照する。ブロック114に
おいて、その時のフレーム(あるいはウインドウ中心)
を表わす変数iが1に初期化され、テスト特徴ベクトル
i がブロック116で示されるようにフロント・エン
ド・パラメータ抽出ブロック22(図4)から与えられ
る。ブロック118において、その時のプロトタイプブ
ック(クラスタ中心の一覧表)を表わす変数kがk=1
に初期化される。このプロトタイプ分布を生じたこの特
徴ベクトルの条件付き確率がブロック120で計算さ
れ、ブロック122へ与えられる。
【0070】ブロック124における手書きプロトタイ
プ分布π k およびブロック126における混合係数Pr
π k|aj)により表わされる如きトレーニング位相の
プロトタイプ構成ブロック24もまたブロック122に
与えられ、ここで組合わせ確率が計算されて記憶され
る。判断ブロック128において、kが最大クラスタ数
に達したかどうか判定がなされる。もしそうでなけれ
ば、ブロック130で示される如くkが1だけ増分され
てブロック120へ戻り、先に述べたプロセスが反復さ
れる。もしそうであれば、基本の英字における全ての候
補文字種aj に対して先に述べたスコアがブロック13
2に累計される。判断ブロック134においては、対象
となるその時の文字に対して全てのフレームiが示され
たかどうかの判定がなされる。もしそうでなければ、ブ
ロック136においてiが1だけ増分されてブロック1
16へ戻り、先に述べたプロセスが反復される。もしそ
うであれば、累計されたスコアがブロック138におい
て順序を付され、上位J個のスコア(確率の高いもの)
から形成される候補文字種aj の候補リストが、復号部
30(図3)へ与えるように形成される。
【0071】次に、復号部30(図3)の動作を表わす
フロー図である図23を参照する。対象となるその時の
候補文字種を表わす変数tがブロック142において1
に初期化される。候補文字種Ct に対する尤度評価部2
8(図3)からの文字候補リストがブロック144で与
えられる。その時の候補文字種を表わす変数jがブロッ
ク146で1に初期化され、ブロック148においてC
tが一時的にajに等しくセットされる。トレーニング・
ブロックからは、言語モデル確率ブロック26(図3)
がブロック150で与えられる。これらの確率およびブ
ロック154で前に認識された文字に基いて、文字aj
の最終スコアがブロック152において計算される。こ
のスコアは、言語モデルによりコンテキスト情報を勘案
してCtがajとして認識される尤度を表わす。判断ブロ
ック156において、尤度評価部28により与えられた
候補リストにおける最後の候補文字種の指標であるj=
Jかどうかの判定がなされる。もしそうでなければ、ブ
ロック148へ戻り、先に述べたプロセスが反復され
る。もしそうであれば、言語モデルの確率を含む最終ス
コアがブロック158において順序を付される。ブロッ
ク160において、文字Ct に対する認識された回答と
して最高の候補が選択される。判断ブロック162にお
いて、認識されるストリングにおける最後の文字の指標
であるt=Tmax かどうかの判定がなされる。もしそう
でなければ、ブロック164においてtが1だけ増分さ
れて、認識されるべき次の文字を得る。ブロック166
において更新が行われて、認識されたCt をブロック1
54に挿入し、ブロック144へ戻り、先に述べたプロ
セスが反復される。もしそうであれば、このプロセスは
ブロック168に示される如く完了して、文字の全スト
リングが認識されることになる。
【0072】
【発明の効果】本発明によれば広義の特徴事象を検出す
る手書き認識システムが提供される。
【図面の簡単な説明】
【図1】本発明の手書き認識システムに対して入力され
る5つの異なるタイプの手書きの事例を示す図である。
【図2】トレーニングおよび復号パラダイムを強化する
汎用手書き認識システムを示すブロック図である。
【図3】本発明による手書き認識システムを示すブロッ
ク図である。
【図4】図3に全体的に示されるフロント・エンド・パ
ラメータ抽出ブロックを示す詳細ブロック図である。
【図5】図4の事前フィルタ・ブロックに入力される弾
道状空間文字を示す図である。
【図6】図4の事前フィルタ・ブロックから出力される
等間隔文字を示す図である。
【図7】図5の弾道空間文字の上部4分の1が図6の等
間隔文字に変換される方法を示す図である。
【図8】図4の事前フィルタ・ブロックが図5の弾道状
空間文字を図6の等間隔文字に変換するよう機能する方
法を詳細に示すフロー図である。
【図9】点(P)に対する特徴ベクトルを生じるため従
来技術により処理される手書き文字を示す図である。
【図10】複数の空間属性を集めることにより図9の点
(P)に対して従来技術で生成された4次元の手書き特
徴ベクトルを示す図である。
【図11】点(P)に対する第1のパラメータ・ベクト
ルを生成するため本発明の教示により処理される手書き
文字の一部を示す図である。
【図12】複数の局部空間属性を集めることにより図1
1の点(P)に対して生成された6次元の局部パラメー
タ・ベクトルを示す図である。
【図13】点(P)に対する第2のパラメータ・ベクト
ルを生成するため本発明の教示により処理される手書き
文字を示す図である。
【図14】複数の大域空間属性を集めることにより図1
3の点(P)に対して生成される3次元の大域パラメー
タ・ベクトルを示す図である。
【図15】図12および図14において抽出された如き
個々のパラメータ・ベクトルの連結により1つの文字に
おけるウインドウ表示が行われる方法を示す図である。
【図16】図15に示されるパラメータ・ベクトルの連
結を行うことにより分割ベクトルを生じるため図4のウ
インドウ・ブロックが機能する方法を詳細に示すフロー
図である。
【図17】図4の射影ブロックが図16で得られた接合
ベクトルから特徴ベクトルを生じるため機能する方法を
詳細に示すフロー図である。
【図18】図3のプロトタイプ構造の詳細ブロック図で
ある。
【図19】K平均クラスタリング(アルゴリズム)を示
す図である。
【図20】図18のユークリッドK平均クラスタリング
・ブロックが機能する方法を示すフロー図である。
【図21】図18のガウスK平均クラスタリング・ブロ
ックが機能する方法を示すフロー図である。
【図22】図3の尤度評価ブロックが機能する方法を示
すフロー図である。
【図23】図3の復号ブロックが機能する方法を示すフ
ロー図である。
【符号の説明】
10 汎用コンピュータ 12 スタイラス 14 電子タブレット 16 トレーニング・モード 18 復号モード 22 フロント・エンド・パラメータ抽出ブロック 24 プロトタイプ構成ブロック 26 言語モデル・ブロック 28 尤度評価部 30 復号部 32 出力 33 利用デバイス 34 事前フィルタ・ブロック 36 パラメータ抽出ブロック 38 ウインドウ表示ブロック 40 射影ブロック 83 空間 84、86、88 クラスタ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ジェローム・ルネ・ベルガーダ アメリカ合衆国10526 ニューヨーク州 ゴールデンズ・ブリッジ、ブルダー・レ ーン 490番地 (72)発明者 デイヴィッド・ナハムー アメリカ合衆国10605 ニューヨーク州 ホワイト・プレインズ、エルムウッド・ ロード 12番地 (72)発明者 クリシュナ・サンダラム・ネイサン アメリカ合衆国10016 ニューヨーク州 ニューヨーク、アパートメント・110・ マディソン・アベニュー 220番地

Claims (12)

    (57)【特許請求の範囲】
  1. 【請求項1】ストロークに沿った複数の異なる位置にお
    いてタブレット上の手書きストロークの少なくとも1つ
    の特徴値を測定して、手書きストロークを表わす特徴ベ
    クトル信号を生成する手段と、 各々が少なくとも1つのパラメータ値を有する複数のプ
    ロトタイプ信号を記憶する手段と、 対象文字種の各文字について、プロトタイプ信号の発生
    確率の評価値を記憶する手段と、 候補文字種と特徴ベクトル信号とプロトタイプ信号とに
    ついて、成分文字スコア(当該成分文字スコアは、プロ
    トタイプ信号が与えられたときに特徴ベクトル信号が発
    生する確率の評価値を有し、候補文字種が与えられたと
    きにプロトタイプ信号が発生する確率が考慮される)を
    生成する手段と、 候補文字種と特徴ベクトル信号とについて、部分文字ス
    コア(当該部分文字スコアは、候補文字種と特徴ベクト
    ル信号と全てのプロトタイプ信号とについて、成分文字
    スコアが考慮される)を生成する手段と、 手書きストロークを表わす候補文字種と全ての特徴ベク
    トル信号とについて、全体文字スコア(当該全体文字ス
    コアは、手書きストロークを表わす候補文字種と全ての
    特徴ベクトル信号とについて、部分文字スコアが考慮さ
    れる)を生成する手段と、 全体文字スコアが上位の候補文字種を識別する手段とを
    有する、 手書き認識システム。
  2. 【請求項2】少なくとも1つの候補文字種を生成し、ま
    たは、表示する手段とをさらに有する、 請求項1記載の手書き認識システム。
  3. 【請求項3】候補文字種についての全体文字スコアがさ
    らに、当該候補文字種に先行又は後行する1以上の他の
    候補文字種の発生の確率の評価についても考慮される、
    請求項2記載の手書き認識システム。
  4. 【請求項4】各プロトタイプ信号が、少なくとも1の平
    均パラメータ値と少なくとも1の分散パラメータ値とを
    有し、 プロトタイプ信号の発生が与えられる特徴ベクトル信号
    の発生確率が、プロトタイプ信号の平均と分散とが与え
    られる特徴ベクトル信号のガウス尤度として評価され
    る、 請求項3記載の手書き認識システム。
  5. 【請求項5】手書きストロークを表わす特徴ベクトル信
    号を生成する手段が、タブレット上の手書きストローク
    の少なくとも1の局部特徴の値を生成するとともに、タ
    ブレット上の手書きストロークの少なくとも1の大域特
    徴の値を生成する、 請求項3記載の手書き認識システム。
  6. 【請求項6】成分文字スコアが、プロトタイプ信号が与
    えられたときに特徴ベクトル信号が発生する確率に、候
    補文字種が与えられたときにプロトタイプ信号が発生す
    る確率を掛けることによる、積の評価を考慮し、 部分文字スコアが、全てのプロトタイプ信号について、
    候補文字種と特徴ベクトル信号とについての成分文字ス
    コアの合計を考慮し、 全体文字スコアが、手書きストロークにおける候補文字
    種と全ての特徴ベクトル信号とについての部分文字スコ
    アの積を考慮したものである、 請求項5記載の手書き認識システム。
  7. 【請求項7】ストロークに沿った複数の異なる位置にお
    いてタブレット上の手書きストロークの少なくとも1の
    特徴値を測定して、手書きストロークを表わす特徴ベク
    トル信号を生成するステップと、 各々が少なくとも1つのパラメータ値を有する複数のプ
    ロトタイプ信号を記憶するステップと、 対象文字種の各文字について、プロトタイプ信号の発生
    確率の評価値を記憶するステップと、 候補文字種と特徴ベクトル信号とプロトタイプ信号とに
    ついて、成分文字スコア(当該成分文字スコアは、プロ
    トタイプ信号が与えられたときに特徴ベクトル信号が発
    生する確率の評価値を有し、候補文字種が与えられたと
    きにプロトタイプ信号が発生する確率が考慮される)を
    生成するステップと、 候補文字種と特徴ベクトル信号とについて、部分文字ス
    コア(当該部分文字スコアは、候補文字種と特徴ベクト
    ル信号と全てのプロトタイプ信号とについて、成分文字
    スコアが考慮される)を生成するステップと、 手書きストロークを表わす候補文字種と全ての特徴ベク
    トル信号とについて、全体文字スコア(当該全体文字ス
    コアは、手書きストロークを表わす候補文字種と全ての
    特徴ベクトル信号とについて、部分文字スコアが考慮さ
    れる)を生成するステップと、 全体文字スコアが上位の候補文字種を識別するステップ
    とを有する、 手書き認識方法。
  8. 【請求項8】少なくとも1つの候補文字種を生成し、ま
    たは、表示するステップとをさらに有する、 請求項7記載の手書き認識方法。
  9. 【請求項9】候補文字種についての全体文字スコアがさ
    らに、当該候補文字種に先行又は後行する1以上の他の
    候補文字種の発生の確率の評価についても考慮される、 請求項8記載の手書き認識方法。
  10. 【請求項10】各プロトタイプ信号が、少なくとも1の
    平均パラメータ値と少なくとも1の分散パラメータ値と
    を有し、 プロトタイプ信号の発生が与えられる特徴ベクトル信号
    の発生確率が、プロトタイプ信号の平均と分散とが与え
    られる特徴ベクトル信号のガウス尤度として評価され
    る、 請求項9記載の手書き認識方法。
  11. 【請求項11】手書きストロークを表わす特徴ベクトル
    信号を生成するステップが、タブレット上の手書きスト
    ロークの少なくとも1の局部特徴の値を生成するととも
    に、タブレット上の手書きストロークの少なくとも1の
    大域特徴の値を生成する、 請求項10記載の手書き認識方法。
  12. 【請求項12】成分文字スコアが、プロトタイプ信号が
    与えられたときに特徴ベクトル信号が発生する確率に、
    候補文字種が与えられたときにプロトタイプ信号が発生
    する確率を掛けることによる、積の評価を考慮し、 部分文字スコアが、全てのプロトタイプ信号について、
    候補文字種と特徴ベクトル信号とについての成分文字ス
    コアの合計を考慮し、 全体文字スコアが、手書きストロークにおける候補文字
    種と全ての特徴ベクトル信号とについての部分文字スコ
    アの積を考慮したものである、 請求項11記載の手書き認識方法。
JP4220410A 1991-10-31 1992-08-19 自動手書き文字認識に対する統計的混合手法 Expired - Fee Related JP2750057B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US785642 1985-10-08
US07/785,642 US5343537A (en) 1991-10-31 1991-10-31 Statistical mixture approach to automatic handwriting recognition

Publications (2)

Publication Number Publication Date
JPH05217024A JPH05217024A (ja) 1993-08-27
JP2750057B2 true JP2750057B2 (ja) 1998-05-13

Family

ID=25136155

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4220410A Expired - Fee Related JP2750057B2 (ja) 1991-10-31 1992-08-19 自動手書き文字認識に対する統計的混合手法

Country Status (4)

Country Link
US (1) US5343537A (ja)
EP (1) EP0539749B1 (ja)
JP (1) JP2750057B2 (ja)
DE (1) DE69231309T2 (ja)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5491758A (en) * 1993-01-27 1996-02-13 International Business Machines Corporation Automatic handwriting recognition using both static and dynamic parameters
NL9300310A (nl) * 1993-02-19 1994-09-16 Oce Nederland Bv Inrichting en werkwijze voor syntactische signaal-analyse.
DE69425412T2 (de) * 1993-11-23 2001-03-08 Ibm Anlage und Verfahren zur automatischen Handschrifterkennung mittels eines benutzerunabhängigen chirographischen Labelalphabets
IL108566A0 (en) * 1994-02-04 1994-05-30 Baron Research & Dev Company L Handwriting input apparatus using more than one sensing technique
US5577135A (en) * 1994-03-01 1996-11-19 Apple Computer, Inc. Handwriting signal processing front-end for handwriting recognizers
GB9409773D0 (en) * 1994-05-13 1994-07-06 Atomic Energy Authority Uk Identification system
IL110137A (en) * 1994-06-27 2000-06-29 Advanced Recognition Tech Handwriting recognition system
US5666438A (en) * 1994-07-29 1997-09-09 Apple Computer, Inc. Method and apparatus for recognizing handwriting of different users of a pen-based computer system
US6052481A (en) * 1994-09-02 2000-04-18 Apple Computers, Inc. Automatic method for scoring and clustering prototypes of handwritten stroke-based data
US5854855A (en) * 1994-09-09 1998-12-29 Motorola, Inc. Method and system using meta-classes and polynomial discriminant functions for handwriting recognition
US5802205A (en) * 1994-09-09 1998-09-01 Motorola, Inc. Method and system for lexical processing
GB2307085B (en) * 1994-09-09 1998-09-23 Motorola Inc Method and system for recognizing a boundary between characters in handwritten text
AU3590795A (en) * 1994-09-14 1996-03-29 Apple Computer, Inc. System and method for automatic subcharacter unit and lexicon generation for handwriting recognition
US5812818A (en) * 1994-11-17 1998-09-22 Transfax Inc. Apparatus and method for translating facsimile text transmission
JPH0973660A (ja) * 1995-09-06 1997-03-18 Nec Corp 光学的情報記録媒体ならびに記録中ベリファイ方法
US6137909A (en) * 1995-06-30 2000-10-24 The United States Of America As Represented By The Secretary Of The Navy System and method for feature set reduction
JPH09223195A (ja) * 1996-02-06 1997-08-26 Hewlett Packard Co <Hp> 文字認識方法
US6345119B1 (en) * 1996-02-19 2002-02-05 Fujitsu Limited Handwritten character recognition apparatus and method using a clustering algorithm
EP0896704A1 (en) * 1996-03-08 1999-02-17 Motorola, Inc. Method and device for handwritten character recognition
US5933525A (en) * 1996-04-10 1999-08-03 Bbn Corporation Language-independent and segmentation-free optical character recognition system and method
EP0845224A1 (en) 1996-11-29 1998-06-03 Jack Wen Shock-absorbing footwear
US6708274B2 (en) * 1998-04-30 2004-03-16 Intel Corporation Cryptographically protected paging subsystem
JP3969775B2 (ja) * 1996-12-17 2007-09-05 キヤノン株式会社 手書き情報入力装置および手書き情報入力方法
US6332040B1 (en) * 1997-11-04 2001-12-18 J. Howard Jones Method and apparatus for sorting and comparing linear configurations
US6281888B1 (en) * 1999-01-07 2001-08-28 International Business Machines Corporation Pen input device using electrostatic coupling
US6671661B1 (en) * 1999-05-19 2003-12-30 Microsoft Corporation Bayesian principal component analysis
JP4346814B2 (ja) * 2000-12-27 2009-10-21 キヤノン株式会社 情報処理装置及びその方法、コンピュータ可読メモリ、プログラム
US7269546B2 (en) 2001-05-09 2007-09-11 International Business Machines Corporation System and method of finding documents related to other documents and of finding related words in response to a query to refine a search
US6925433B2 (en) 2001-05-09 2005-08-02 International Business Machines Corporation System and method for context-dependent probabilistic modeling of words and documents
US20040243531A1 (en) * 2003-04-28 2004-12-02 Dean Michael Anthony Methods and systems for representing, using and displaying time-varying information on the Semantic Web
US7219085B2 (en) * 2003-12-09 2007-05-15 Microsoft Corporation System and method for accelerating and optimizing the processing of machine learning techniques using a graphics processing unit
US8411958B2 (en) * 2004-05-04 2013-04-02 Nokia Corporation Apparatus and method for handwriting recognition
SE528063C2 (sv) * 2004-11-12 2006-08-22 Zi Decuma Ab Metod och anordning för segmenteringsbaserad igenkänning
US8280719B2 (en) * 2005-05-05 2012-10-02 Ramp, Inc. Methods and systems relating to information extraction
US7809214B2 (en) * 2005-08-22 2010-10-05 Samsung Electronics Co., Ltd. Device and a method for identifying movement patterns
US20070271087A1 (en) * 2006-05-18 2007-11-22 Microsoft Corporation Language-independent language model using character classes
US8131536B2 (en) * 2007-01-12 2012-03-06 Raytheon Bbn Technologies Corp. Extraction-empowered machine translation
JP4894709B2 (ja) * 2007-10-04 2012-03-14 株式会社Ihi 製品設計支援システム及びコンピュータにおける製品設計支援のための動作方法
US7890539B2 (en) 2007-10-10 2011-02-15 Raytheon Bbn Technologies Corp. Semantic matching using predicate-argument structure
US9285983B2 (en) * 2010-06-14 2016-03-15 Amx Llc Gesture recognition using neural networks
US9529448B2 (en) * 2011-08-31 2016-12-27 Farzan Fallah Data entry systems and methods
WO2013128291A2 (en) * 2012-02-29 2013-09-06 Robert Bosch Gmbh Method of fusing multiple information sources in image-based gesture recognition system
CN103218628A (zh) * 2013-03-22 2013-07-24 中国科学技术大学 一种基于团块与轨迹特征的异常行为描述方法
JP6125333B2 (ja) * 2013-05-31 2017-05-10 株式会社東芝 検索装置、方法及びプログラム
US9575952B2 (en) 2014-10-21 2017-02-21 At&T Intellectual Property I, L.P. Unsupervised topic modeling for short texts
US10671844B2 (en) * 2017-06-02 2020-06-02 Apple Inc. Handwritten text recognition
US11270104B2 (en) * 2020-01-13 2022-03-08 Apple Inc. Spatial and temporal sequence-to-sequence modeling for handwriting recognition

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6015791A (ja) * 1983-07-07 1985-01-26 松下電器産業株式会社 風呂状態検出装置
JPS6029767A (ja) * 1983-07-28 1985-02-15 Canon Inc 電子写真装置とその装置による電子写真法
US4731857A (en) * 1984-06-29 1988-03-15 International Business Machines Corporation Recognition system for run-on handwritten characters
JPS6219975A (ja) * 1985-07-17 1987-01-28 Fujitsu Ltd 図形処理システム
JPS62154078A (ja) * 1985-12-26 1987-07-09 Fujitsu Ltd オンライン手書文字認識における特徴点の抽出方式
JPS6474345A (en) * 1987-09-17 1989-03-20 Honda Motor Co Ltd Controller for hydraulic operation type transmission for vehicle
JP2822189B2 (ja) * 1988-05-19 1998-11-11 ソニー株式会社 文字認識装置及び方法
JPH01321591A (ja) * 1988-06-23 1989-12-27 Nec Corp 文字認識装置
JPH071434B2 (ja) * 1989-03-27 1995-01-11 三菱電機株式会社 標準パタン作成方式
US5075896A (en) * 1989-10-25 1991-12-24 Xerox Corporation Character and phoneme recognition based on probability clustering
US5029223A (en) * 1990-02-02 1991-07-02 International Business Machines Corporation Constraint driven-on line recognition of handwritten characters and symbols
US5105468A (en) * 1991-04-03 1992-04-14 At&T Bell Laboratories Time delay neural network for printed and cursive handwritten character recognition

Also Published As

Publication number Publication date
DE69231309D1 (de) 2000-09-07
EP0539749A2 (en) 1993-05-05
DE69231309T2 (de) 2001-02-15
EP0539749A3 (en) 1994-05-11
EP0539749B1 (en) 2000-08-02
US5343537A (en) 1994-08-30
JPH05217024A (ja) 1993-08-27

Similar Documents

Publication Publication Date Title
JP2750057B2 (ja) 自動手書き文字認識に対する統計的混合手法
JP2667954B2 (ja) 静的及び動的パラメータを使用する自動手書き文字認識装置及び方法
JP2669583B2 (ja) 手書き認識のためのコンピュータベース方法及びシステム
US6556712B1 (en) Methods and apparatus for handwriting recognition
US7336827B2 (en) System, process and software arrangement for recognizing handwritten characters
EP2808827B1 (en) System and method for OCR output verification
JP4504702B2 (ja) 文書処理装置、文書処理方法、および文書処理プログラム
US20040148577A1 (en) Learning-based system and process for synthesizing cursive handwriting
US7903877B2 (en) Radical-based HMM modeling for handwritten East Asian characters
WO1997044758A9 (en) Methods and apparatuses for handwriting recognition
CN104008363A (zh) 手写轨迹的检测、规范化和在线识别以及异常字根的收集
Stern et al. Most discriminating segment–Longest common subsequence (MDSLCS) algorithm for dynamic hand gesture classification
Wieprecht et al. Word spotting in historical document collections with online-handwritten queries
JP3209197B2 (ja) 文字認識装置及び文字認識プログラムを記録した記録媒体
Garain et al. On machine understanding of online handwritten mathematical expressions
AU764561B2 (en) Method and apparatuses for handwriting recognition
JP3374762B2 (ja) 文字認識方法及びその装置
JP4180137B2 (ja) オンライン手書き文字認識方法
Senior et al. O-line cursive handwriting recognition using recurrent neural networks
Mukherjee et al. An efficient feature vector for segmentation-free recognition of online cursive handwriting based on a hybrid deep neural network
Lemaıtre et al. Off-line handwritten word recognition based on a bidimensional Markovian approach with a large vocabulary
Song et al. Free-Flow: Unintrusive Reading Device for a Printed Text

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080220

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090220

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100220

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees