JP2750057B2 - 自動手書き文字認識に対する統計的混合手法 - Google Patents
自動手書き文字認識に対する統計的混合手法Info
- Publication number
- JP2750057B2 JP2750057B2 JP4220410A JP22041092A JP2750057B2 JP 2750057 B2 JP2750057 B2 JP 2750057B2 JP 4220410 A JP4220410 A JP 4220410A JP 22041092 A JP22041092 A JP 22041092A JP 2750057 B2 JP2750057 B2 JP 2750057B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- feature vector
- prototype
- signal
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/333—Preprocessing; Feature extraction
- G06V30/347—Sampling; Contour coding; Stroke extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/36—Matching; Classification
- G06V30/373—Matching; Classification using a special pattern or subpattern alphabet
Description
【0001】
【産業上の利用分野】本発明は、信号処理の分野におけ
るものであり、特に手書き認識に関する。特に、本発明
は、1つの(あるいは幾つかの)特徴ベクトル空間、各
空間におけるユークリッドおよびガウス・モデリング、
および全ての空間における全ての関連プロトタイプの寄
与を勘案する混合復号法における手書きの適当な表現に
基く手書き認識に関する。
るものであり、特に手書き認識に関する。特に、本発明
は、1つの(あるいは幾つかの)特徴ベクトル空間、各
空間におけるユークリッドおよびガウス・モデリング、
および全ての空間における全ての関連プロトタイプの寄
与を勘案する混合復号法における手書きの適当な表現に
基く手書き認識に関する。
【0002】
【従来の技術および発明が解決しようとする課題】続き
書きあるいは更に手書き文字を認識すると称する自動シ
ステムは、これまでごく限られた成功をもたらしたに過
ぎない。その理由は、主として手書きのモデリングにお
いて使用されるテンプレートにより呈される頑強性の不
足に見出すことができる。例えば、続き書きの手書き文
字の認識のための3ステップの手順について記載する米
国特許第4,731,857号がある。第1に、潜在的
区切り点が取得される。第2に、妥当に文字であり得る
区切りの全ての組合わせが文字認識装置へ送られてラン
ク付けされた選択および対応する点数を得る。第3に、
最善の候補単語を得るように文字列が組合わされる。各
テンプレートは、この文字を形成する筆記者の平均的方
法をおそらくは表わすであろう完全形成文字であり、そ
の時の文字の弾性的照合(マッチング)が各テンプレー
トに対して計算される。この手法は、筆記者および時間
の双方にわたり観察され得る広範囲な多岐性の影響を受
け易い。
書きあるいは更に手書き文字を認識すると称する自動シ
ステムは、これまでごく限られた成功をもたらしたに過
ぎない。その理由は、主として手書きのモデリングにお
いて使用されるテンプレートにより呈される頑強性の不
足に見出すことができる。例えば、続き書きの手書き文
字の認識のための3ステップの手順について記載する米
国特許第4,731,857号がある。第1に、潜在的
区切り点が取得される。第2に、妥当に文字であり得る
区切りの全ての組合わせが文字認識装置へ送られてラン
ク付けされた選択および対応する点数を得る。第3に、
最善の候補単語を得るように文字列が組合わされる。各
テンプレートは、この文字を形成する筆記者の平均的方
法をおそらくは表わすであろう完全形成文字であり、そ
の時の文字の弾性的照合(マッチング)が各テンプレー
トに対して計算される。この手法は、筆記者および時間
の双方にわたり観察され得る広範囲な多岐性の影響を受
け易い。
【0003】本発明は、受入れ得る頑強度を有する手書
き認識のための高速アルゴリズム(即ち、Tapper
tの米国特許第4,731,857号に開示される如き
弾性的マッチングのそれと似た複雑さ)の考案に関する
ものである。このため、少なくとも3つの重要な規定を
もたらす。即ち、(i)特徴要素は、個別の、筆記、続
き書きあるいは拘束されないモードで生成された手書き
も同様に特徴付けるように選択されねばならず、(ii)
これらの特徴要素は冗長性を最小化するように適当に処
理され、これによりパラメータ毎に表わされる情報を最
大化されねばならず、(iii)結果として得る特徴パラ
メータは更に、手書きにおける広い傾向を検出してこの
ような傾向の適当なモデリングを可能にしなければなら
ない。これらの規定は、現在の弾性的マッチング法が
(i)文字ベースであるため、また(ii)文字テンプレ
ートを得るため幾つかの文字例を単に平均化するもので
あるため、このマッチング法では満たされない。
き認識のための高速アルゴリズム(即ち、Tapper
tの米国特許第4,731,857号に開示される如き
弾性的マッチングのそれと似た複雑さ)の考案に関する
ものである。このため、少なくとも3つの重要な規定を
もたらす。即ち、(i)特徴要素は、個別の、筆記、続
き書きあるいは拘束されないモードで生成された手書き
も同様に特徴付けるように選択されねばならず、(ii)
これらの特徴要素は冗長性を最小化するように適当に処
理され、これによりパラメータ毎に表わされる情報を最
大化されねばならず、(iii)結果として得る特徴パラ
メータは更に、手書きにおける広い傾向を検出してこの
ような傾向の適当なモデリングを可能にしなければなら
ない。これらの規定は、現在の弾性的マッチング法が
(i)文字ベースであるため、また(ii)文字テンプレ
ートを得るため幾つかの文字例を単に平均化するもので
あるため、このマッチング法では満たされない。
【0004】本発明によれば、信号処理フロントエンド
(プロセッサ)は、弾性的マッチング法よりも非常に複
雑である。入力データを単に区切りに分割するのではな
く、信号は更に高次元の特徴空間(手書き空間)に変換
され、その点が冗長でない特徴の抽出の毎に全ての直接
観察を表わす。更に細かなクラスタリング(クラス分
割)のための(ユークリッド法とは対照的な)ガウス法
を用いて、この空間におけるプロトタイプが頑強性のた
め形成される。従って、各プロトタイプは、多くの文字
と共通である小さなビルディング・ブロック(具体的に
はクラスタ中心)を表わす。文字列の代わりに、ビルデ
ィング・ブロック列が組合わされ、その各々が真性の確
率空間について定義された真の尤度が割当てられる(距
離スコアとはちょうど対照的に)。最後に、認識アルゴ
リズム自体は高々この確率空間について演算する事後復
号である。この代替的な手法は頑強性のための規定を満
たすのに更に適合する。
(プロセッサ)は、弾性的マッチング法よりも非常に複
雑である。入力データを単に区切りに分割するのではな
く、信号は更に高次元の特徴空間(手書き空間)に変換
され、その点が冗長でない特徴の抽出の毎に全ての直接
観察を表わす。更に細かなクラスタリング(クラス分
割)のための(ユークリッド法とは対照的な)ガウス法
を用いて、この空間におけるプロトタイプが頑強性のた
め形成される。従って、各プロトタイプは、多くの文字
と共通である小さなビルディング・ブロック(具体的に
はクラスタ中心)を表わす。文字列の代わりに、ビルデ
ィング・ブロック列が組合わされ、その各々が真性の確
率空間について定義された真の尤度が割当てられる(距
離スコアとはちょうど対照的に)。最後に、認識アルゴ
リズム自体は高々この確率空間について演算する事後復
号である。この代替的な手法は頑強性のための規定を満
たすのに更に適合する。
【0005】
【課題を解決するための手段】本発明の目的は、改善さ
れた手書き認識システムの提供にある。
れた手書き認識システムの提供にある。
【0006】本発明の別の目的は、入力された手書きが
局部的および大域的な両特徴要素を抽出するように信号
処理される改善された手書き認識システムの提供にあ
る。
局部的および大域的な両特徴要素を抽出するように信号
処理される改善された手書き認識システムの提供にあ
る。
【0007】本発明の他の目的は、ウインドウ表示を用
いて広義の特徴事象を検出する改善された手書き認識シ
ステムの提供にある。
いて広義の特徴事象を検出する改善された手書き認識シ
ステムの提供にある。
【0008】本発明の更に他の目的は、射影を用いて冗
長性を排除する改善された手書き認識システムの提供に
ある。
長性を排除する改善された手書き認識システムの提供に
ある。
【0009】本発明の他の目的は、手書き空間と呼ばれ
る適当な特徴ベクトル空間におけるガウス・モデリング
に基いて手書きが認識される改善された手書き認識シス
テムの提供にある。
る適当な特徴ベクトル空間におけるガウス・モデリング
に基いて手書きが認識される改善された手書き認識シス
テムの提供にある。
【0010】本発明の他の目的は、混合復号法を用いて
手書き空間における全ての関連プロトタイプの寄与を勘
案する改善された手書き認識システムの提供にある。
手書き空間における全ての関連プロトタイプの寄与を勘
案する改善された手書き認識システムの提供にある。
【0011】本発明の更に他の目的は、多数の手書き空
間と対応する多数のコードブック(クラスタ中心の一覧
表)を用いて更に頑強な認識を提供する改善された手書
き認識システムの提供にある。
間と対応する多数のコードブック(クラスタ中心の一覧
表)を用いて更に頑強な認識を提供する改善された手書
き認識システムの提供にある。
【0012】手書きテキストの自動認識は、適当な特徴
ベクトル空間におけるユークリッドおよびガウス・モデ
リング、およびこの空間における全ての関連プロトタイ
プの寄与を勘案する混合復号法に基く。
ベクトル空間におけるユークリッドおよびガウス・モデ
リング、およびこの空間における全ての関連プロトタイ
プの寄与を勘案する混合復号法に基く。
【0013】全ての筆記モードに充分な特徴要素を得る
ため、1つの点から次の点までの座標の差、ならびに文
字自体が平行移動しても変化しないような勾配および曲
率情報が選択される。これは、ペンの軌跡の局部的な挙
動について充分な情報を提供する。同時に、ペンの軌跡
の大域的挙動についての情報を集めることが重要であ
る。続き書きあるいは拘束されない手書きの場合にはこ
の情報の評価が更に難しいため、対応する大域的特徴要
素を局部的な特徴要素とは別個に処理されねばならな
い。しかし、両者において冗長性を最小化するため、結
果として得るデータの全共分散マトリックスが計算さ
れ、関連する固有値および固有ベクトルが見出され、線
形変換がこれら固有ベクトルの方向に沿って与えられ、
データは下位の次元のサブ空間に対して射影される。最
後に、手書きにおける重要なビルディング・ブロック
(具体的には、クラスタ中心)を検出するため、少ない
特徴ベクトルが比較的少数のいわゆる手書きプロトタイ
プに分割されて、筆記プロセスにおいて使用される基本
的なビルディング・ブロックを表わす手書きラベルの英
字をもたらす。
ため、1つの点から次の点までの座標の差、ならびに文
字自体が平行移動しても変化しないような勾配および曲
率情報が選択される。これは、ペンの軌跡の局部的な挙
動について充分な情報を提供する。同時に、ペンの軌跡
の大域的挙動についての情報を集めることが重要であ
る。続き書きあるいは拘束されない手書きの場合にはこ
の情報の評価が更に難しいため、対応する大域的特徴要
素を局部的な特徴要素とは別個に処理されねばならな
い。しかし、両者において冗長性を最小化するため、結
果として得るデータの全共分散マトリックスが計算さ
れ、関連する固有値および固有ベクトルが見出され、線
形変換がこれら固有ベクトルの方向に沿って与えられ、
データは下位の次元のサブ空間に対して射影される。最
後に、手書きにおける重要なビルディング・ブロック
(具体的には、クラスタ中心)を検出するため、少ない
特徴ベクトルが比較的少数のいわゆる手書きプロトタイ
プに分割されて、筆記プロセスにおいて使用される基本
的なビルディング・ブロックを表わす手書きラベルの英
字をもたらす。
【0014】上記の手法は、筆記者に依存しないかある
いは筆記者に依存するベースで実現することができる。
後者の場合、各筆記者毎に1組の手書きプロトタイプが
得られる。この組は、対応する筆記者の個人的特徴を捕
捉することが期待される。本アルゴリズムを初期化する
ため、ある手書きが記録され、各ストローク(運筆また
は筆画)毎にタブレット上のその時の軌跡と対応する一
連の(x、y)座標が得られるようにする。一旦手書き
プロトタイプが得られると、その時の特徴ベクトルを生
じる各プロトタイプの尤度を計算し、各個の尤度を一緒
に混合して最終的尤度を得るだけで認識を行うことがで
きる。この手法では、混合係数は語彙における各文字が
手書きラベル・タブレットに与えられたプロトタイプを
生じる確率である。
いは筆記者に依存するベースで実現することができる。
後者の場合、各筆記者毎に1組の手書きプロトタイプが
得られる。この組は、対応する筆記者の個人的特徴を捕
捉することが期待される。本アルゴリズムを初期化する
ため、ある手書きが記録され、各ストローク(運筆また
は筆画)毎にタブレット上のその時の軌跡と対応する一
連の(x、y)座標が得られるようにする。一旦手書き
プロトタイプが得られると、その時の特徴ベクトルを生
じる各プロトタイプの尤度を計算し、各個の尤度を一緒
に混合して最終的尤度を得るだけで認識を行うことがで
きる。この手法では、混合係数は語彙における各文字が
手書きラベル・タブレットに与えられたプロトタイプを
生じる確率である。
【0015】
【実施例】手書き認識において、手書き文字は一般に図
1に示される5つのグループに該当し、このグループは
認識の複雑さの増加する順序に示される。特に、これら
のグループは、個々の文字が予め定義された領域内に形
成される枡目があってそこへ楷書で書いていくものとし
て知られる第1のタイプの筆記(W1)を含み、これに
より文字の区切りタスクを簡単にする。第2のタイプの
筆記(W2)は、文字が他の文字と接触しないようにユ
ーザが各文字を意図的に形成する間隔をおいた離散とし
て知られる。第3のタイプの筆記(W3)は、相互に接
触する即ち「繋がる」文字をユーザが形成できる続け書
き離散として知られる。第4のタイプの筆記(W4)
は、ユーザが通常全単語を筆記後でtの横棒を引きiお
よびjの点を打つ続け書きである。最後に、第5のタイ
プの筆記(W5)は、ユーザが続き書きの組合わせを使
用する拘束されない筆記である。この最後のタイプは、
最も困難であり、図3に示された5つのスタイルの最も
複雑な区切りおよび認識を提供する。
1に示される5つのグループに該当し、このグループは
認識の複雑さの増加する順序に示される。特に、これら
のグループは、個々の文字が予め定義された領域内に形
成される枡目があってそこへ楷書で書いていくものとし
て知られる第1のタイプの筆記(W1)を含み、これに
より文字の区切りタスクを簡単にする。第2のタイプの
筆記(W2)は、文字が他の文字と接触しないようにユ
ーザが各文字を意図的に形成する間隔をおいた離散とし
て知られる。第3のタイプの筆記(W3)は、相互に接
触する即ち「繋がる」文字をユーザが形成できる続け書
き離散として知られる。第4のタイプの筆記(W4)
は、ユーザが通常全単語を筆記後でtの横棒を引きiお
よびjの点を打つ続け書きである。最後に、第5のタイ
プの筆記(W5)は、ユーザが続き書きの組合わせを使
用する拘束されない筆記である。この最後のタイプは、
最も困難であり、図3に示された5つのスタイルの最も
複雑な区切りおよび認識を提供する。
【0016】図2において、一般的な手書き認識システ
ムの動作がブロック図で示される。図2の一般的論議が
最初に行われ、内部に示されるブロックの各々の動作の
詳細な記述が続く。ブロック2において、スタイラス即
ちペンのストローク(運筆または筆画)情報のデータ取
得が生じる。取得されたストロークは、手書き情報を認
識するため演算される。ブロック4に示される如きトレ
ーニング演算モードの間、取得された手書き情報が既知
のトレーニング筆跡に関して分析され、この情報を表わ
すため基底モデルを教習する。使用中、トレーニング中
に得られたモデル・パラメータが、認識される(未知
の)手書きと対応する特徴ベクトルと共に、復号ブロッ
ク6により使用される。特に、復号ブロック6はこのモ
デルを用いて個々の特徴ベクトルの組立てから候補文字
種を生成する。復号プログラムは、関連するモデル・パ
ラメータに基く最も確率の高い文字種を選択する。
ムの動作がブロック図で示される。図2の一般的論議が
最初に行われ、内部に示されるブロックの各々の動作の
詳細な記述が続く。ブロック2において、スタイラス即
ちペンのストローク(運筆または筆画)情報のデータ取
得が生じる。取得されたストロークは、手書き情報を認
識するため演算される。ブロック4に示される如きトレ
ーニング演算モードの間、取得された手書き情報が既知
のトレーニング筆跡に関して分析され、この情報を表わ
すため基底モデルを教習する。使用中、トレーニング中
に得られたモデル・パラメータが、認識される(未知
の)手書きと対応する特徴ベクトルと共に、復号ブロッ
ク6により使用される。特に、復号ブロック6はこのモ
デルを用いて個々の特徴ベクトルの組立てから候補文字
種を生成する。復号プログラムは、関連するモデル・パ
ラメータに基く最も確率の高い文字種を選択する。
【0017】認識された手書きは、その後ブロック8に
より使用できるようになる。例えば、認識されたメッセ
ージは単に英数字フォーマットに変換され、表示デバイ
ス上に表示される。認識されたメッセージはまた、これ
まで例えばワード・プロセッシング・システムの如きキ
ーボードからメッセージを受取る何らかのアプリケーシ
ョンへ渡される。
より使用できるようになる。例えば、認識されたメッセ
ージは単に英数字フォーマットに変換され、表示デバイ
ス上に表示される。認識されたメッセージはまた、これ
まで例えばワード・プロセッシング・システムの如きキ
ーボードからメッセージを受取る何らかのアプリケーシ
ョンへ渡される。
【0018】下記のアルゴリズムは、本発明の手書き認
識システムを含む装置において実現される。このアルゴ
リズムのステップは下記の如くである。即ち、
識システムを含む装置において実現される。このアルゴ
リズムのステップは下記の如くである。即ち、
【0019】1.筆記の速度に対して正規化するデータ
の事前フィルタリングを行う。これは、タブレットによ
り捕捉される諸点間の間隔が筆記速度に依存して不等間
隔に並ぶ点列(これを説明の便宜上比喩的に、弾道状と
呼ぶことにする)を、全ての点が等間隔である時間に依
存しない表現に変換することにより行われる。線形補間
が結果として生じる等間隔点を見出す必要に応じて行わ
れる。必要に応じて、更に微細な補間に対してはキュー
ビック・スプライン補間もまた行うことができる。
の事前フィルタリングを行う。これは、タブレットによ
り捕捉される諸点間の間隔が筆記速度に依存して不等間
隔に並ぶ点列(これを説明の便宜上比喩的に、弾道状と
呼ぶことにする)を、全ての点が等間隔である時間に依
存しない表現に変換することにより行われる。線形補間
が結果として生じる等間隔点を見出す必要に応じて行わ
れる。必要に応じて、更に微細な補間に対してはキュー
ビック・スプライン補間もまた行うことができる。
【0020】2.各点毎に、トレーニング・データにお
ける座標(xn、yn)の点PnがPn付近の局部のペン軌
跡を表わす特徴要素のP次元ベクトルPnを形成する。
例えば、Pに対する良好な選択は6であり、特徴要素が
下記により与えられる。即ち、(i)水平および垂直方
向の増分変化:
ける座標(xn、yn)の点PnがPn付近の局部のペン軌
跡を表わす特徴要素のP次元ベクトルPnを形成する。
例えば、Pに対する良好な選択は6であり、特徴要素が
下記により与えられる。即ち、(i)水平および垂直方
向の増分変化:
【0021】
【数1】
【0022】(ii)Pnにおけるペンの軌跡に対する接
線角の正弦および余弦:
線角の正弦および余弦:
【0023】
【数2】
【0024】(iii)上記の2つのパラメータにおける
増分変化:
増分変化:
【0025】
【数3】
【0026】最後の2つのパラメータがPnにおけるペ
ンの軌跡の曲率についての情報を提供することに注意さ
れたい。
ンの軌跡の曲率についての情報を提供することに注意さ
れたい。
【0027】3.各点毎に、トレーニング・データにお
ける座標(xn、yn)の点Pnが、Pnまでの大域ペン軌
跡を表わす特徴要素のP′次元ベクトルP′nを形成す
る。例えば、P′に対する良好な選択は3であり、特徴
要素は下記により与えられる。即ち、(i)基線ynか
らの高さ、(ii)ストローク(xn−xi)の始めからの
幅(但し、xiはその時のストロークの第1の座標)、
および(iii)その時の文字が1つ以上のストロークか
らなるならばストローク間の距離。
ける座標(xn、yn)の点Pnが、Pnまでの大域ペン軌
跡を表わす特徴要素のP′次元ベクトルP′nを形成す
る。例えば、P′に対する良好な選択は3であり、特徴
要素は下記により与えられる。即ち、(i)基線ynか
らの高さ、(ii)ストローク(xn−xi)の始めからの
幅(但し、xiはその時のストロークの第1の座標)、
および(iii)その時の文字が1つ以上のストロークか
らなるならばストローク間の距離。
【0028】4.トレーニング・データにおける各スト
ローク毎に、このストロークにおける複数点Pn のサブ
セット例えば複数のQiが略々等しく隔てられる特性を
有するようなQiを決定する。別言すれば、ストローク
中の点の部分集合を複数決定して、i番目の部分集合を
Qiとおくのである。この部分集合すなわちサブセット
は常に各ストロークの最初と最後の点を含み、例えば、
図1の第1のタイプの筆記(W1)においては、桝目を
形成している上限または下限との間隔(すなわち行の高
さ)に応じて点の間隔を調整すればよいのである。すな
わち、小さい文字であれば細かくとる必要が生じるであ
ろう。
ローク毎に、このストロークにおける複数点Pn のサブ
セット例えば複数のQiが略々等しく隔てられる特性を
有するようなQiを決定する。別言すれば、ストローク
中の点の部分集合を複数決定して、i番目の部分集合を
Qiとおくのである。この部分集合すなわちサブセット
は常に各ストロークの最初と最後の点を含み、例えば、
図1の第1のタイプの筆記(W1)においては、桝目を
形成している上限または下限との間隔(すなわち行の高
さ)に応じて点の間隔を調整すればよいのである。すな
わち、小さい文字であれば細かくとる必要が生じるであ
ろう。
【0029】5.ステップ4で得られる各Qiは、Qiの
前のH個のPnのベクトルと、Qi自身と、Qiの後のH
個のPnのベクトルと、を連結させることによってQ次
元の接合ベクトルを構成する。同様に、Q′iの前の
H′個のP′nのベクトルと、Q′i自身と、Q′iの後
のH′個のP′nのベクトルと、を連結させることによ
ってQ′次元の接合ベクトルを構成する。これは、下式
が成立つならば実現し得る。即ち、
前のH個のPnのベクトルと、Qi自身と、Qiの後のH
個のPnのベクトルと、を連結させることによってQ次
元の接合ベクトルを構成する。同様に、Q′iの前の
H′個のP′nのベクトルと、Q′i自身と、Q′iの後
のH′個のP′nのベクトルと、を連結させることによ
ってQ′次元の接合ベクトルを構成する。これは、下式
が成立つならば実現し得る。即ち、
【0030】
【数4】
【0031】良好な選択はH=H′であり、値Q=24
6およびQ′=123を生じる。
6およびQ′=123を生じる。
【0032】6.局部手書き特徴と対応する全てのQ次
元ベクトルの平均ベクトルおよび共分散マトリックスを
計算する。これらはそれぞれMt (1)およびSt (1)として
示す。同様に、大域手書き特徴と対応する全てのQ′次
元ベクトルの平均ベクトルおよび共分散マトリックスを
計算する。これらはそれぞれMt (2)およびSt (2)として
示す。
元ベクトルの平均ベクトルおよび共分散マトリックスを
計算する。これらはそれぞれMt (1)およびSt (1)として
示す。同様に、大域手書き特徴と対応する全てのQ′次
元ベクトルの平均ベクトルおよび共分散マトリックスを
計算する。これらはそれぞれMt (2)およびSt (2)として
示す。
【0033】7.n=1,2に対しては、対応する固有
値の対角マトリックスであるSt (n)およびΛ t (n)の固有
ベクトル・マトリックスEt (n)を計算する。これらの量
は下式の関係に従う。即ち、
値の対角マトリックスであるSt (n)およびΛ t (n)の固有
ベクトル・マトリックスEt (n)を計算する。これらの量
は下式の関係に従う。即ち、
【0034】
【数5】
【0035】但し、Tは行列の転置を表わす。このた
め、Et (n)における先行固有ベクトルがΛ t (n)における
先行固有値と対応する。
め、Et (n)における先行固有ベクトルがΛ t (n)における
先行固有値と対応する。
【0036】8.ステップ7からのR1個の主要固有ベ
クトル(固有値の大きい順にとったベクトル) を用い
て、ステップ5のQ次元の特徴ベクトルを次元R1 の空
間へ射影する。結果として得るベクトルri (1)を呼出
す。R1 に対する妥当値は6である。この点において、
Q次元の接合特徴ベクトルに存在する冗長性が排除さ
れ、最も情報を包含している特徴要素で連結された。ベ
クトルri (1)により張られた空間を手書き空間(カイロ
グラフィック空間)C(1)と呼ぶ。
クトル(固有値の大きい順にとったベクトル) を用い
て、ステップ5のQ次元の特徴ベクトルを次元R1 の空
間へ射影する。結果として得るベクトルri (1)を呼出
す。R1 に対する妥当値は6である。この点において、
Q次元の接合特徴ベクトルに存在する冗長性が排除さ
れ、最も情報を包含している特徴要素で連結された。ベ
クトルri (1)により張られた空間を手書き空間(カイロ
グラフィック空間)C(1)と呼ぶ。
【0037】9.同様に、ステップ7からのR2 個の主
要固有ベクトルを用いて、ステップ5のQ′次元の特徴
ベクトルを次元R2の空間に射影し、ベクトルri (2)を
結果として生成する。R2 に対する妥当値は15であ
る。一般に、(大域特徴の)Q次元の接合特徴ベクトル
には(局部特徴の)Q次元接合特徴ベクトルにおけるよ
りも少ない冗長性が存在する故に、R2>R1となること
に注意されたい。ベクトルri (2)により張られた空間を
手書き空間C(2)と呼ぶ。
要固有ベクトルを用いて、ステップ5のQ′次元の特徴
ベクトルを次元R2の空間に射影し、ベクトルri (2)を
結果として生成する。R2 に対する妥当値は15であ
る。一般に、(大域特徴の)Q次元の接合特徴ベクトル
には(局部特徴の)Q次元接合特徴ベクトルにおけるよ
りも少ない冗長性が存在する故に、R2>R1となること
に注意されたい。ベクトルri (2)により張られた空間を
手書き空間C(2)と呼ぶ。
【0038】10.ここでのステップ10を、n=1,
2に対して、ランダム・クラスタ割当てで開始し、対応
するRn 次元の手書き空間における予備的プロトタイプ
分布を得るように、ステップ8および9で得た射影ベク
トルri (n)のK平均ユークリッド・クラスタリングを実
施する。
2に対して、ランダム・クラスタ割当てで開始し、対応
するRn 次元の手書き空間における予備的プロトタイプ
分布を得るように、ステップ8および9で得た射影ベク
トルri (n)のK平均ユークリッド・クラスタリングを実
施する。
【0039】11.ここでのステップ11を、n=1,
2に対して、ステップ10の予備的分布から開始し、両
方の手書き空間における最終的ガウス・プロトタイプ分
布を得るように、ステップ8および9において得た射影
ベクトルri (n)のK平均ガウス・クラスタリングを実施
し、ガウス混合分布を求める。。これらのプロトタイプ
分布をπk (n)として表わし、クラスタ・サイズを使用し
て、各Rn次元の手書き空間における各プロトタイプ分
布の確率Pr(πk (n))を評価する。
2に対して、ステップ10の予備的分布から開始し、両
方の手書き空間における最終的ガウス・プロトタイプ分
布を得るように、ステップ8および9において得た射影
ベクトルri (n)のK平均ガウス・クラスタリングを実施
し、ガウス混合分布を求める。。これらのプロトタイプ
分布をπk (n)として表わし、クラスタ・サイズを使用し
て、各Rn次元の手書き空間における各プロトタイプ分
布の確率Pr(πk (n))を評価する。
【0040】12.ここでのステップ12を、n=1,
2に対して、ステップ11からのガウス分布を用いて、
ステップ8および9で得た全てのベクトルri (n)に対し
て量Pr(ベクトルri (n)|πk (n))を計算する。ま
た、各手書き空間における全クラスタ数がKnであるも
のとして、各特徴ベクトルの確率を下式で評価する。即
ち、
2に対して、ステップ11からのガウス分布を用いて、
ステップ8および9で得た全てのベクトルri (n)に対し
て量Pr(ベクトルri (n)|πk (n))を計算する。ま
た、各手書き空間における全クラスタ数がKnであるも
のとして、各特徴ベクトルの確率を下式で評価する。即
ち、
【0041】
【数6】
【0042】良好な選択はK1=K2=400である。
【0043】13.ここでのステップ13を、n=1,
2に対して、ステップ11および12の結果を用いて、
下記量を計算し、
2に対して、ステップ11および12の結果を用いて、
下記量を計算し、
【0044】
【数7】
【0045】次のステップ14のために、対象となる語
彙におけるどの候補文字種aj に対して,各ベクトルr
i (n)がトレーニング・データに整合されるかに注意され
たい。
彙におけるどの候補文字種aj に対して,各ベクトルr
i (n)がトレーニング・データに整合されるかに注意され
たい。
【0046】14.ここでのステップ14を、n=1,
2に対して、対象となる語彙における各候補文字種aj
毎に、これに整合された全てのベクトルri (n)を一緒に
プールして対応するPr(πk (n)|ベクトルri (n))を
累計する。正規化の後に、これは各候補文字種aj を与
えた各手書き空間における各プロトタイプ分布の確率で
あるPr(πk (n)|aj)の評価を行う。これがトレー
ニング段階の終りである。
2に対して、対象となる語彙における各候補文字種aj
毎に、これに整合された全てのベクトルri (n)を一緒に
プールして対応するPr(πk (n)|ベクトルri (n))を
累計する。正規化の後に、これは各候補文字種aj を与
えた各手書き空間における各プロトタイプ分布の確率で
あるPr(πk (n)|aj)の評価を行う。これがトレー
ニング段階の終りである。
【0047】15.トレーニング・データと同じ各手書
き空間にテスト特徴ベクトルを生じるように、テスト・
データについてステップ1乃至5および8乃至9を反復
する。
き空間にテスト特徴ベクトルを生じるように、テスト・
データについてステップ1乃至5および8乃至9を反復
する。
【0048】16.手書き空間C(1)においてベクトル
ri (1)で、また手書き空間C(2)においてベクトルri
(2)で表わされる各データ・フレームfi 毎に、ステッ
プ11で得たガウス混合分布およびステップ14で得た
確率を用いて下記の量を形成する。即ち、
ri (1)で、また手書き空間C(2)においてベクトルri
(2)で表わされる各データ・フレームfi 毎に、ステッ
プ11で得たガウス混合分布およびステップ14で得た
確率を用いて下記の量を形成する。即ち、
【0049】
【数8】
【0050】即ち、全手書きラベル英字をカバーする2
つの単一ガウス混合分布の加重積である。この式中、α
が第1のコードブックに対する第2のコードブックの影
響を制御する。αに対する良値は0.7である。これ
は、連続フレームのスコアを乗じてフレームの仮のシー
ケンスに対する全スコアを得、これにより復号プロセス
を完了する。
つの単一ガウス混合分布の加重積である。この式中、α
が第1のコードブックに対する第2のコードブックの影
響を制御する。αに対する良値は0.7である。これ
は、連続フレームのスコアを乗じてフレームの仮のシー
ケンスに対する全スコアを得、これにより復号プロセス
を完了する。
【0051】次に、先に述べたアルゴリズムを実現する
ための本発明による手書き認識システムのブロック図で
ある図3を参照する。例えばIBM3090/VFある
いはIBM RS6000でよい汎用コンピュータ10
が、スタイラス12を用いるユーザにより生成された文
字即ちストローク情報を受取って電子タブレット14に
書込む。この文字即ちストローク情報は、電子タブレッ
ト14上かあるいは他の表示デバイス(図示せず)上に
表示することができる。コンピュータ10は、トレーニ
ング・モード16かあるいは復号モード18のいずれか
で使用することができる。これは、破線20により象徴
的に示される。トレーニングまたは復号のいずれのモー
ドにおいても、フロント・エンド・パラメータ抽出ブロ
ック22を加えなければならない。トレーニング・モー
ド16においては、アルゴリズムは、プロトタイプ構成
ブロック24と、言語モデル・ブロック26とを含む。
復号モード18においては、アルゴリズムは尤度評価部
28と復号部30とを含む。
ための本発明による手書き認識システムのブロック図で
ある図3を参照する。例えばIBM3090/VFある
いはIBM RS6000でよい汎用コンピュータ10
が、スタイラス12を用いるユーザにより生成された文
字即ちストローク情報を受取って電子タブレット14に
書込む。この文字即ちストローク情報は、電子タブレッ
ト14上かあるいは他の表示デバイス(図示せず)上に
表示することができる。コンピュータ10は、トレーニ
ング・モード16かあるいは復号モード18のいずれか
で使用することができる。これは、破線20により象徴
的に示される。トレーニングまたは復号のいずれのモー
ドにおいても、フロント・エンド・パラメータ抽出ブロ
ック22を加えなければならない。トレーニング・モー
ド16においては、アルゴリズムは、プロトタイプ構成
ブロック24と、言語モデル・ブロック26とを含む。
復号モード18においては、アルゴリズムは尤度評価部
28と復号部30とを含む。
【0052】ブロック22乃至30は機能プログラム・
モジュールとして示されるが、これら機能ブロックの一
部あるいは全てがソフトウエア形態の代わりにハードウ
エア形態で実現され、本発明の特許請求の範囲の教示内
にあることが理解されよう。
モジュールとして示されるが、これら機能ブロックの一
部あるいは全てがソフトウエア形態の代わりにハードウ
エア形態で実現され、本発明の特許請求の範囲の教示内
にあることが理解されよう。
【0053】手書き認識アルゴリズムのステップ1乃至
9を実行するフロント・エンド・パラメータ抽出ブロッ
ク22は、トレーニング・モードの間プロトタイプ構成
ブロック24に対して、あるいは復号モードの間プロト
タイプ構成ブロック24に対して特徴ベクトルを提供す
る。プロトタイプ構成ブロック24は、手書き認識アル
ゴリズムのステップ10乃至14を実行して、(i)文
字の適当な部分を表わす手書きプロトタイプ、および
(ii)これらを組合わせる方法を示す混合係数(ガウス
混合分布)を生じる。この情報は、未知の候補文字種を
判定あるいは認識する復号モードにおいて使用される。
言語モデル・ブロック26は、どの候補文字種が与えら
れたコンテキスト中に最も生じ得るか、あるいはどの単
語が与えられたコンテキスト中に生じ得るかを判定する
ため使用できる言語モデルの確率を提供する。ある実施
例においては、ブロック26は手書き中に生じる候補文
字種、句あるいは文章のあり得る組合わせのライブラリ
に実施することができる。この言語モデルは、認識中復
号部30によって使用される。
9を実行するフロント・エンド・パラメータ抽出ブロッ
ク22は、トレーニング・モードの間プロトタイプ構成
ブロック24に対して、あるいは復号モードの間プロト
タイプ構成ブロック24に対して特徴ベクトルを提供す
る。プロトタイプ構成ブロック24は、手書き認識アル
ゴリズムのステップ10乃至14を実行して、(i)文
字の適当な部分を表わす手書きプロトタイプ、および
(ii)これらを組合わせる方法を示す混合係数(ガウス
混合分布)を生じる。この情報は、未知の候補文字種を
判定あるいは認識する復号モードにおいて使用される。
言語モデル・ブロック26は、どの候補文字種が与えら
れたコンテキスト中に最も生じ得るか、あるいはどの単
語が与えられたコンテキスト中に生じ得るかを判定する
ため使用できる言語モデルの確率を提供する。ある実施
例においては、ブロック26は手書き中に生じる候補文
字種、句あるいは文章のあり得る組合わせのライブラリ
に実施することができる。この言語モデルは、認識中復
号部30によって使用される。
【0054】認識モードの間、手書き認識アルゴリズム
のステップ16を実行する尤度評価部28は、認識され
る未知のストロークまたは文字から生じた特徴ベクトル
をブロック22から受取る。これらの特徴ベクトルは、
ブロック24からの手書きプロトタイプと同じ手書き空
間に存在し、従ってこれらの各々と比較して特定の各特
徴ベクトルに対するその各々の寄与を評価する。この情
報は、特定の各特徴ベクトルが英字における候補文字種
に「帰属」する尤度を計算するため、トレーニング中生
じる混合係数を用いて積分される。これは、全ての特徴
ベクトルにわたって、復号部30に対して認識のための
候補文字種を生じるように使用することができる。復号
部30は、最大スコアと対応するブロック26からの言
語モデルの確率を全スコアに積分する。示されたアルゴ
リズムに従う認識された筆記は、復号部30の出力32
に生成される。次にこの認識された筆記は、タブレット
14上に表示されるか、あるいは例えば表示デバイス、
プリンタ、アプリケーション・プログラムなどである利
用デバイス33へ渡される。
のステップ16を実行する尤度評価部28は、認識され
る未知のストロークまたは文字から生じた特徴ベクトル
をブロック22から受取る。これらの特徴ベクトルは、
ブロック24からの手書きプロトタイプと同じ手書き空
間に存在し、従ってこれらの各々と比較して特定の各特
徴ベクトルに対するその各々の寄与を評価する。この情
報は、特定の各特徴ベクトルが英字における候補文字種
に「帰属」する尤度を計算するため、トレーニング中生
じる混合係数を用いて積分される。これは、全ての特徴
ベクトルにわたって、復号部30に対して認識のための
候補文字種を生じるように使用することができる。復号
部30は、最大スコアと対応するブロック26からの言
語モデルの確率を全スコアに積分する。示されたアルゴ
リズムに従う認識された筆記は、復号部30の出力32
に生成される。次にこの認識された筆記は、タブレット
14上に表示されるか、あるいは例えば表示デバイス、
プリンタ、アプリケーション・プログラムなどである利
用デバイス33へ渡される。
【0055】次に、図3に全体的に示されるフロント・
エンド・パラメータ抽出ブロック22の詳細なブロック
図である図4を参照する。筆記の各サンプル点は、手書
き認識アルゴリズムのステップ1を実行する事前フィル
タ・ブロック34へ渡される座標xnおよびynにより定
義される点により表わされる。これらの点は、図5に示
されるように諸点間の間隔が筆記速度に依存して不等間
隔に並ぶ点列として示される。即ち、前記点の間隔は、
筆記者がその時の文字を形成するのに用いた筆記速度の
関数である。種々の理由から、筆記者はその速度即ち筆
記速度がほとんど一貫せず、手書き認識における高い誤
差率を生じることがある。事前フィルタ・ブロック34
は、図5の点を正規化してブロック34の出力に等間隔
の点xmおよびymを生じる。事前フィルタリングの詳細
については、図7および図8に関して簡単に説明する。
図6に示される如き文字を含む等間隔の点xmおよびym
は、パラメータ抽出ブロック36へ与えられ、これがベ
クトルvm を生じる手書き認識アルゴリズムのステップ
2および3を実施する。このパラメータ抽出の詳細は、
図11、図12、図13および図14に関して簡単に説
明する。ベクトルvm は、ウインドウ表示ブロック38
へ与えられ、これが接合ベクトルSi を生じるため手書
き認識アルゴリズムのステップ4および5を実施する。
接合ベクトルSi が与えられる方法の詳細については、
図14、図15および図16に関して簡単に説明する。
接合ベクトルSi は射影ブロック40へ与えられ、この
ブロックが特徴ベクトルriを生じるため手書き認識ア
ルゴリズムのステップ6乃至9を実施する。これは、接
合パラメータ・ベクトルにおける冗長性を排除する。ブ
ロック40の機能の詳細については、図17に関して記
載される。射影ブロック40は、接合ベクトルSi に応
答して特徴ベクトルri を生じ、これは先に図3に関し
て述べたように、プロトタイプ構成ブロック24および
尤度評価部28へ与えられる。射影ブロック40の詳細
については、図17のフロー図に関して記載する。
エンド・パラメータ抽出ブロック22の詳細なブロック
図である図4を参照する。筆記の各サンプル点は、手書
き認識アルゴリズムのステップ1を実行する事前フィル
タ・ブロック34へ渡される座標xnおよびynにより定
義される点により表わされる。これらの点は、図5に示
されるように諸点間の間隔が筆記速度に依存して不等間
隔に並ぶ点列として示される。即ち、前記点の間隔は、
筆記者がその時の文字を形成するのに用いた筆記速度の
関数である。種々の理由から、筆記者はその速度即ち筆
記速度がほとんど一貫せず、手書き認識における高い誤
差率を生じることがある。事前フィルタ・ブロック34
は、図5の点を正規化してブロック34の出力に等間隔
の点xmおよびymを生じる。事前フィルタリングの詳細
については、図7および図8に関して簡単に説明する。
図6に示される如き文字を含む等間隔の点xmおよびym
は、パラメータ抽出ブロック36へ与えられ、これがベ
クトルvm を生じる手書き認識アルゴリズムのステップ
2および3を実施する。このパラメータ抽出の詳細は、
図11、図12、図13および図14に関して簡単に説
明する。ベクトルvm は、ウインドウ表示ブロック38
へ与えられ、これが接合ベクトルSi を生じるため手書
き認識アルゴリズムのステップ4および5を実施する。
接合ベクトルSi が与えられる方法の詳細については、
図14、図15および図16に関して簡単に説明する。
接合ベクトルSi は射影ブロック40へ与えられ、この
ブロックが特徴ベクトルriを生じるため手書き認識ア
ルゴリズムのステップ6乃至9を実施する。これは、接
合パラメータ・ベクトルにおける冗長性を排除する。ブ
ロック40の機能の詳細については、図17に関して記
載される。射影ブロック40は、接合ベクトルSi に応
答して特徴ベクトルri を生じ、これは先に図3に関し
て述べたように、プロトタイプ構成ブロック24および
尤度評価部28へ与えられる。射影ブロック40の詳細
については、図17のフロー図に関して記載する。
【0056】図5の諸点間の間隔が筆記速度に依存して
不等間隔に並ぶ点列として示される文字が事前フィルタ
・ブロック34(図4)により正規化されて、手書き認
識アルゴリズムのステップ1が行われる方法を示す図7
および図8に関して次に説明する図6の等間隔の文字を
生じる。図7は、図5の上4分の1の湾曲部分を表わ
す。第1に、元の生の点(点・で示される)間のある補
間法を行うことにより点の密度が増加される。この結
果、元の生点(・)おいた補間点(|)を含む一連の点
を生じる。次いで、点間の等しい間隔が電子タブレット
14(図3)上に示される如き2つのpel間の距離と
適当に関連する距離Rであることの事前の決定によりフ
ィルタリングが行われる。図7においては、その結果X
(56)により示されるフィルタリングの後一連の点が
生じる。生および内挿された点は等間隔ではない整数点
nと見做され、フィルタ点は等間隔の整数点mと見做さ
れる。
不等間隔に並ぶ点列として示される文字が事前フィルタ
・ブロック34(図4)により正規化されて、手書き認
識アルゴリズムのステップ1が行われる方法を示す図7
および図8に関して次に説明する図6の等間隔の文字を
生じる。図7は、図5の上4分の1の湾曲部分を表わ
す。第1に、元の生の点(点・で示される)間のある補
間法を行うことにより点の密度が増加される。この結
果、元の生点(・)おいた補間点(|)を含む一連の点
を生じる。次いで、点間の等しい間隔が電子タブレット
14(図3)上に示される如き2つのpel間の距離と
適当に関連する距離Rであることの事前の決定によりフ
ィルタリングが行われる。図7においては、その結果X
(56)により示されるフィルタリングの後一連の点が
生じる。生および内挿された点は等間隔ではない整数点
nと見做され、フィルタ点は等間隔の整数点mと見做さ
れる。
【0057】図8によれば、ブロック42において、ス
トロークの第1の(生の)点48における位置n=1が
m=1で示され、これも第1のフィルタ点と見做され
る。n=2におけるストロークの第2の点50は、フィ
ルタリングに対してテストされる第1の点である。ブロ
ック44において、点mおよびn間の(ユークリッド)
距離が下記の関係に従って決定される。即ち、
トロークの第1の(生の)点48における位置n=1が
m=1で示され、これも第1のフィルタ点と見做され
る。n=2におけるストロークの第2の点50は、フィ
ルタリングに対してテストされる第1の点である。ブロ
ック44において、点mおよびn間の(ユークリッド)
距離が下記の関係に従って決定される。即ち、
【0058】距離=|xn−xm|2+|yn−ym|2
【0059】ブロック46において、距離がRより大き
いかどうか判定が行われる。図7において、点m=1は
点48であり、点n=2は点50である。図7では距離
がRより小さいことが判り、従って点は排除されてブロ
ック52へ進み、ここでnは3、即ち点54へ増分され
る。ブロック44において距離が再び計算されて、ブロ
ック46においてRと比較される。最後に、距離はRよ
り大きくなり、従って点55が受入れられる(ブロック
58においてmはnと等しくされる)。ブロック60に
おいて、点(xn、yn)が12番目の点の点56である
フィルタ点(xm、ym)として記憶される。ブロック6
2において、nは1だけ増分され、ブロック44へ戻
り、ここで生の点および内挿点が先に述べたように処理
される。
いかどうか判定が行われる。図7において、点m=1は
点48であり、点n=2は点50である。図7では距離
がRより小さいことが判り、従って点は排除されてブロ
ック52へ進み、ここでnは3、即ち点54へ増分され
る。ブロック44において距離が再び計算されて、ブロ
ック46においてRと比較される。最後に、距離はRよ
り大きくなり、従って点55が受入れられる(ブロック
58においてmはnと等しくされる)。ブロック60に
おいて、点(xn、yn)が12番目の点の点56である
フィルタ点(xm、ym)として記憶される。ブロック6
2において、nは1だけ増分され、ブロック44へ戻
り、ここで生の点および内挿点が先に述べたように処理
される。
【0060】図9および図10は、従来技術において特
徴ベクトルがストロークの重心(CG)に関してどのよ
うに得られるかを示している。入力されたストローク、
例えば小文字の「a」が電子タブレットにより捕捉され
る。各特徴ベクトルは、重心に対するストロークにおけ
るサンプル点(P)の変位xおよびy、基底線(BL)
に対するPの変位(b)、およびPに対する接線(L)
と関連する角度情報(θ)を表わす諸元を含む。この望
ましい実施態様における結果として得る特徴ベクトル
は、4つの元を持ち、このため4つの次元(4d)ベク
トルを表わす。
徴ベクトルがストロークの重心(CG)に関してどのよ
うに得られるかを示している。入力されたストローク、
例えば小文字の「a」が電子タブレットにより捕捉され
る。各特徴ベクトルは、重心に対するストロークにおけ
るサンプル点(P)の変位xおよびy、基底線(BL)
に対するPの変位(b)、およびPに対する接線(L)
と関連する角度情報(θ)を表わす諸元を含む。この望
ましい実施態様における結果として得る特徴ベクトル
は、4つの元を持ち、このため4つの次元(4d)ベク
トルを表わす。
【0061】図11、図12、図13および図14は、
手書き認識アルゴリズムのステップ2および3を実施す
る図4のブロック36のパラメータ抽出がパラメータ・
ベクトルvm を提供するため本発明により如何にして
得られるかを示している。図11は局部パラメータ抽出
を示し、図12は局部パラメータ・ベクトルを、図13
は大域パラメータ抽出を、図14は大域パラメータ・ベ
クトルを示す。合計9つの座標に対して、局部パラメー
タ・ベクトルには6つの局部座標があり、大域パラメー
タ・ベクトルには3つの大域座標がある。即ち、図10
に示す如き従来技術の4つの座標より5つ多い座標が生
成される。局部パラメータ・ベクトルについては、前の
点66、67および後の点68、69に対するこの時の
点64に関して計算が行われる。局部パラメータ・ベク
トルに対する特定の計算は図12に示される。大域パラ
メータ・ベクトルについては、基底線65、文字の初点
66、第1のストロークの最終点67および第2のスト
ロークの初点68に対するその時の点64に関して計算
が行われる。大域パラメータ・ベクトルに対する特定計
算は図14に示される。一般性を損なうことなく、本項
の残部は唯1つのコードブックの手書き認識アルゴリズ
ム、即ち、局部パラメータ・ベクトルあるいは大域パラ
メータ・ベクトルを示す。
手書き認識アルゴリズムのステップ2および3を実施す
る図4のブロック36のパラメータ抽出がパラメータ・
ベクトルvm を提供するため本発明により如何にして
得られるかを示している。図11は局部パラメータ抽出
を示し、図12は局部パラメータ・ベクトルを、図13
は大域パラメータ抽出を、図14は大域パラメータ・ベ
クトルを示す。合計9つの座標に対して、局部パラメー
タ・ベクトルには6つの局部座標があり、大域パラメー
タ・ベクトルには3つの大域座標がある。即ち、図10
に示す如き従来技術の4つの座標より5つ多い座標が生
成される。局部パラメータ・ベクトルについては、前の
点66、67および後の点68、69に対するこの時の
点64に関して計算が行われる。局部パラメータ・ベク
トルに対する特定の計算は図12に示される。大域パラ
メータ・ベクトルについては、基底線65、文字の初点
66、第1のストロークの最終点67および第2のスト
ロークの初点68に対するその時の点64に関して計算
が行われる。大域パラメータ・ベクトルに対する特定計
算は図14に示される。一般性を損なうことなく、本項
の残部は唯1つのコードブックの手書き認識アルゴリズ
ム、即ち、局部パラメータ・ベクトルあるいは大域パラ
メータ・ベクトルを示す。
【0062】次に、特徴ベクトルがデータから抽出され
る方法を示すため、図4のウインドウ表示ブロック38
の詳細を図15および図16に関して述べる。少数の略
々等距離の特徴点が図8と同じアルゴリズムを用いて決
定されるが、値Rが異なると、パラメータ・ベクトルは
これらの点で接合される。各点で接合されるべきパラメ
ータ・ベクトルの数(2H+1)は予め決定され、これ
が更に接合次元Q=(2H+1)Pを規定する。
る方法を示すため、図4のウインドウ表示ブロック38
の詳細を図15および図16に関して述べる。少数の略
々等距離の特徴点が図8と同じアルゴリズムを用いて決
定されるが、値Rが異なると、パラメータ・ベクトルは
これらの点で接合される。各点で接合されるべきパラメ
ータ・ベクトルの数(2H+1)は予め決定され、これ
が更に接合次元Q=(2H+1)Pを規定する。
【0063】図15において、特徴点が点で示され、ウ
インドウ中心がXで示される。点は点kとして示され、
Xは指標iにより点ki として示される。図16におい
て、ブロック70ではiおよびカウンタjがそれぞれ1
に等しくセットされる。ブロック72では、kがki −
Hにセットされ、ブロック74において対応するベクト
ルvk (P次元の)が得られる。次に、ブロック76に
おいて(2H+1)ベクトルvk が示されるかどうかの
判定がなされる。もしそうであれば、ブロック78にお
いてjは1に再び初期化され、iは1だけ増分され、こ
の手順は先に述べたように反復される。もしそうでなけ
れば、ベクトルvk が位置(j−1)P+1で始まるベ
クトルVi に加えられる。ブロック82においてkおよ
びjが共に1だけ増分され、次のvk を得るためブロッ
ク74へ戻り、この手順が先に述べたように反復され
る。
インドウ中心がXで示される。点は点kとして示され、
Xは指標iにより点ki として示される。図16におい
て、ブロック70ではiおよびカウンタjがそれぞれ1
に等しくセットされる。ブロック72では、kがki −
Hにセットされ、ブロック74において対応するベクト
ルvk (P次元の)が得られる。次に、ブロック76に
おいて(2H+1)ベクトルvk が示されるかどうかの
判定がなされる。もしそうであれば、ブロック78にお
いてjは1に再び初期化され、iは1だけ増分され、こ
の手順は先に述べたように反復される。もしそうでなけ
れば、ベクトルvk が位置(j−1)P+1で始まるベ
クトルVi に加えられる。ブロック82においてkおよ
びjが共に1だけ増分され、次のvk を得るためブロッ
ク74へ戻り、この手順が先に述べたように反復され
る。
【0064】図17において、手書き認識アルゴリズム
のステップ6乃至9を実施する図4の射影ブロック40
の機能を詳細に説明する。この射影ブロックは、ウイン
ドウ表示ブロック38からの接合パラメータ・ベクトル
における冗長性を排除するため使用される。ブロック7
1において全ての接合ベクトルに対して共分散マトリッ
クスが計算され、関連する固有値および固有ベクトルが
ブロック75において主成分分析により見出される。ブ
ロック74の固有ベクトルおよびそれに対応するR個の
主要な固有値を用いて、ブロック77において接合ベク
トルが手書き空間と呼ばれるより小さな次元のサブ空間
に対して射影され、結果として射影ベクトルri を生じ
る。共分散マトリックスが計算される方法については、
J.H.GolubおよびC.F.VanLoan著
「Matrix Computations」(Joh
n Hopkins,University Pres
s、Baltimore、1989年)に記載されてい
る。この文献はまた、ブロック73における主成分分析
の方法およびブロック77における全てのSiの射影方
法を教示する。
のステップ6乃至9を実施する図4の射影ブロック40
の機能を詳細に説明する。この射影ブロックは、ウイン
ドウ表示ブロック38からの接合パラメータ・ベクトル
における冗長性を排除するため使用される。ブロック7
1において全ての接合ベクトルに対して共分散マトリッ
クスが計算され、関連する固有値および固有ベクトルが
ブロック75において主成分分析により見出される。ブ
ロック74の固有ベクトルおよびそれに対応するR個の
主要な固有値を用いて、ブロック77において接合ベク
トルが手書き空間と呼ばれるより小さな次元のサブ空間
に対して射影され、結果として射影ベクトルri を生じ
る。共分散マトリックスが計算される方法については、
J.H.GolubおよびC.F.VanLoan著
「Matrix Computations」(Joh
n Hopkins,University Pres
s、Baltimore、1989年)に記載されてい
る。この文献はまた、ブロック73における主成分分析
の方法およびブロック77における全てのSiの射影方
法を教示する。
【0065】図3のプロトタイプ構成ブロック24の詳
細を示す図18および図19に示されるように、手書き
空間が仕切られて手書きプロトタイプを生じる。特徴ベ
クトルがブロック79に与えられて、K平均ユークリッ
ド・クラスタリングを行う。ブロック79の詳細は、図
19および図20に関して記載される。ユークリッド・
クラスタリングの結果はブロック81に与えられてK平
均ガウス・クラスタリングを行い、プロトタイプ分布ベ
クトルπk を生じる。ブロック81の詳細は、図21に
関して記載される。図18乃至21は、手書き認識アル
ゴリズムのステップ10および11が行われる方法を詳
細に示す。プロトタイプ分布または手書きプロトタイプ
が尤度評価部28(図3)に与えられて、復号部30
(図3)に対して候補文字種を生じる。K平均クラスタ
リングを一般に行う方法は、J.A.Hartigan
著「Clustering Algorithms」
(J.Wiley、1975年)において記載される。
細を示す図18および図19に示されるように、手書き
空間が仕切られて手書きプロトタイプを生じる。特徴ベ
クトルがブロック79に与えられて、K平均ユークリッ
ド・クラスタリングを行う。ブロック79の詳細は、図
19および図20に関して記載される。ユークリッド・
クラスタリングの結果はブロック81に与えられてK平
均ガウス・クラスタリングを行い、プロトタイプ分布ベ
クトルπk を生じる。ブロック81の詳細は、図21に
関して記載される。図18乃至21は、手書き認識アル
ゴリズムのステップ10および11が行われる方法を詳
細に示す。プロトタイプ分布または手書きプロトタイプ
が尤度評価部28(図3)に与えられて、復号部30
(図3)に対して候補文字種を生じる。K平均クラスタ
リングを一般に行う方法は、J.A.Hartigan
著「Clustering Algorithms」
(J.Wiley、1975年)において記載される。
【0066】図19は、クラスタ84、86、88に分
割される空間83を示す。各クラスタは、点xとして示
される複数のベクトルを含み、クラスタ中心(セントロ
イドともいう)#がこのようなベクトルのクラスタ毎に
計算される。
割される空間83を示す。各クラスタは、点xとして示
される複数のベクトルを含み、クラスタ中心(セントロ
イドともいう)#がこのようなベクトルのクラスタ毎に
計算される。
【0067】図18のブロック79の詳細を示す図20
を参照する。ブロック90において250と選定された
複数のランダム・シーズ(ランダム核)が図3のブロッ
ク22から得られる手書き空間における全ての点から拾
われる。各点と各速度間のユークリッド距離がブロック
92において計算される。各点をその最も近い核に割当
てることにより、ブロック94において空間がクラスタ
に仕切られる。これは、図19のクラスタ84、86、
88と対応している。各クラスタのセントロイドがブロ
ック96で計算される。これは、図19の#と対応す
る。これらのセントロイドは、ブロック98において元
の核を置換するようにセットされる。判断ブロック10
0において、最大反復数に達するかどうか判定がなされ
る。もしそうでなければ、先に述べたように、ブロック
92へ戻ってステップが繰返される。もしそうであれ
ば、ユークリッド・クラスタリングの計算が完了する。
を参照する。ブロック90において250と選定された
複数のランダム・シーズ(ランダム核)が図3のブロッ
ク22から得られる手書き空間における全ての点から拾
われる。各点と各速度間のユークリッド距離がブロック
92において計算される。各点をその最も近い核に割当
てることにより、ブロック94において空間がクラスタ
に仕切られる。これは、図19のクラスタ84、86、
88と対応している。各クラスタのセントロイドがブロ
ック96で計算される。これは、図19の#と対応す
る。これらのセントロイドは、ブロック98において元
の核を置換するようにセットされる。判断ブロック10
0において、最大反復数に達するかどうか判定がなされ
る。もしそうでなければ、先に述べたように、ブロック
92へ戻ってステップが繰返される。もしそうであれ
ば、ユークリッド・クラスタリングの計算が完了する。
【0068】図18のガウス・クラスタリング・ブロッ
ク81の詳細を示す図21を参照する。ブロック79
(図18)で得られたユークリッド・クラスタはブロッ
ク102で与えられる。各点と各セントロイド間のガウ
ス距離は、ブロック104で計算される。各点をその最
も近いセントロイドに割当てることにより、ブロック1
06において空間がクラスタに仕切られる。各クラスタ
の新しいセントロイドがブロック108で計算される。
判断ブロック110において、最大反復数が完了したか
どうかの判定が行われる。もしそうでなければ、先に述
べたように、ブロック104へ戻ってステップが反復さ
れる。もしそうであれば、ガウス・クラスタリングの計
算が完了する。この結果、手書き空間における最終的な
プロトタイプ分布が生じる。
ク81の詳細を示す図21を参照する。ブロック79
(図18)で得られたユークリッド・クラスタはブロッ
ク102で与えられる。各点と各セントロイド間のガウ
ス距離は、ブロック104で計算される。各点をその最
も近いセントロイドに割当てることにより、ブロック1
06において空間がクラスタに仕切られる。各クラスタ
の新しいセントロイドがブロック108で計算される。
判断ブロック110において、最大反復数が完了したか
どうかの判定が行われる。もしそうでなければ、先に述
べたように、ブロック104へ戻ってステップが反復さ
れる。もしそうであれば、ガウス・クラスタリングの計
算が完了する。この結果、手書き空間における最終的な
プロトタイプ分布が生じる。
【0069】唯1つのコードブック(クラスタ中心の一
覧表)に対する手書き認識アルゴリズムのステップ16
を実施し、ステップ12、13の結果として生じる手書
き認識アルゴリズムの情報が如何にして図3の尤度評価
部28により演算されて復号部30に対する候補文字種
を生じるかを示す図22を参照する。ブロック114に
おいて、その時のフレーム(あるいはウインドウ中心)
を表わす変数iが1に初期化され、テスト特徴ベクトル
ri がブロック116で示されるようにフロント・エン
ド・パラメータ抽出ブロック22(図4)から与えられ
る。ブロック118において、その時のプロトタイプブ
ック(クラスタ中心の一覧表)を表わす変数kがk=1
に初期化される。このプロトタイプ分布を生じたこの特
徴ベクトルの条件付き確率がブロック120で計算さ
れ、ブロック122へ与えられる。
覧表)に対する手書き認識アルゴリズムのステップ16
を実施し、ステップ12、13の結果として生じる手書
き認識アルゴリズムの情報が如何にして図3の尤度評価
部28により演算されて復号部30に対する候補文字種
を生じるかを示す図22を参照する。ブロック114に
おいて、その時のフレーム(あるいはウインドウ中心)
を表わす変数iが1に初期化され、テスト特徴ベクトル
ri がブロック116で示されるようにフロント・エン
ド・パラメータ抽出ブロック22(図4)から与えられ
る。ブロック118において、その時のプロトタイプブ
ック(クラスタ中心の一覧表)を表わす変数kがk=1
に初期化される。このプロトタイプ分布を生じたこの特
徴ベクトルの条件付き確率がブロック120で計算さ
れ、ブロック122へ与えられる。
【0070】ブロック124における手書きプロトタイ
プ分布π k およびブロック126における混合係数Pr
(π k|aj)により表わされる如きトレーニング位相の
プロトタイプ構成ブロック24もまたブロック122に
与えられ、ここで組合わせ確率が計算されて記憶され
る。判断ブロック128において、kが最大クラスタ数
に達したかどうか判定がなされる。もしそうでなけれ
ば、ブロック130で示される如くkが1だけ増分され
てブロック120へ戻り、先に述べたプロセスが反復さ
れる。もしそうであれば、基本の英字における全ての候
補文字種aj に対して先に述べたスコアがブロック13
2に累計される。判断ブロック134においては、対象
となるその時の文字に対して全てのフレームiが示され
たかどうかの判定がなされる。もしそうでなければ、ブ
ロック136においてiが1だけ増分されてブロック1
16へ戻り、先に述べたプロセスが反復される。もしそ
うであれば、累計されたスコアがブロック138におい
て順序を付され、上位J個のスコア(確率の高いもの)
から形成される候補文字種aj の候補リストが、復号部
30(図3)へ与えるように形成される。
プ分布π k およびブロック126における混合係数Pr
(π k|aj)により表わされる如きトレーニング位相の
プロトタイプ構成ブロック24もまたブロック122に
与えられ、ここで組合わせ確率が計算されて記憶され
る。判断ブロック128において、kが最大クラスタ数
に達したかどうか判定がなされる。もしそうでなけれ
ば、ブロック130で示される如くkが1だけ増分され
てブロック120へ戻り、先に述べたプロセスが反復さ
れる。もしそうであれば、基本の英字における全ての候
補文字種aj に対して先に述べたスコアがブロック13
2に累計される。判断ブロック134においては、対象
となるその時の文字に対して全てのフレームiが示され
たかどうかの判定がなされる。もしそうでなければ、ブ
ロック136においてiが1だけ増分されてブロック1
16へ戻り、先に述べたプロセスが反復される。もしそ
うであれば、累計されたスコアがブロック138におい
て順序を付され、上位J個のスコア(確率の高いもの)
から形成される候補文字種aj の候補リストが、復号部
30(図3)へ与えるように形成される。
【0071】次に、復号部30(図3)の動作を表わす
フロー図である図23を参照する。対象となるその時の
候補文字種を表わす変数tがブロック142において1
に初期化される。候補文字種Ct に対する尤度評価部2
8(図3)からの文字候補リストがブロック144で与
えられる。その時の候補文字種を表わす変数jがブロッ
ク146で1に初期化され、ブロック148においてC
tが一時的にajに等しくセットされる。トレーニング・
ブロックからは、言語モデル確率ブロック26(図3)
がブロック150で与えられる。これらの確率およびブ
ロック154で前に認識された文字に基いて、文字aj
の最終スコアがブロック152において計算される。こ
のスコアは、言語モデルによりコンテキスト情報を勘案
してCtがajとして認識される尤度を表わす。判断ブロ
ック156において、尤度評価部28により与えられた
候補リストにおける最後の候補文字種の指標であるj=
Jかどうかの判定がなされる。もしそうでなければ、ブ
ロック148へ戻り、先に述べたプロセスが反復され
る。もしそうであれば、言語モデルの確率を含む最終ス
コアがブロック158において順序を付される。ブロッ
ク160において、文字Ct に対する認識された回答と
して最高の候補が選択される。判断ブロック162にお
いて、認識されるストリングにおける最後の文字の指標
であるt=Tmax かどうかの判定がなされる。もしそう
でなければ、ブロック164においてtが1だけ増分さ
れて、認識されるべき次の文字を得る。ブロック166
において更新が行われて、認識されたCt をブロック1
54に挿入し、ブロック144へ戻り、先に述べたプロ
セスが反復される。もしそうであれば、このプロセスは
ブロック168に示される如く完了して、文字の全スト
リングが認識されることになる。
フロー図である図23を参照する。対象となるその時の
候補文字種を表わす変数tがブロック142において1
に初期化される。候補文字種Ct に対する尤度評価部2
8(図3)からの文字候補リストがブロック144で与
えられる。その時の候補文字種を表わす変数jがブロッ
ク146で1に初期化され、ブロック148においてC
tが一時的にajに等しくセットされる。トレーニング・
ブロックからは、言語モデル確率ブロック26(図3)
がブロック150で与えられる。これらの確率およびブ
ロック154で前に認識された文字に基いて、文字aj
の最終スコアがブロック152において計算される。こ
のスコアは、言語モデルによりコンテキスト情報を勘案
してCtがajとして認識される尤度を表わす。判断ブロ
ック156において、尤度評価部28により与えられた
候補リストにおける最後の候補文字種の指標であるj=
Jかどうかの判定がなされる。もしそうでなければ、ブ
ロック148へ戻り、先に述べたプロセスが反復され
る。もしそうであれば、言語モデルの確率を含む最終ス
コアがブロック158において順序を付される。ブロッ
ク160において、文字Ct に対する認識された回答と
して最高の候補が選択される。判断ブロック162にお
いて、認識されるストリングにおける最後の文字の指標
であるt=Tmax かどうかの判定がなされる。もしそう
でなければ、ブロック164においてtが1だけ増分さ
れて、認識されるべき次の文字を得る。ブロック166
において更新が行われて、認識されたCt をブロック1
54に挿入し、ブロック144へ戻り、先に述べたプロ
セスが反復される。もしそうであれば、このプロセスは
ブロック168に示される如く完了して、文字の全スト
リングが認識されることになる。
【0072】
【発明の効果】本発明によれば広義の特徴事象を検出す
る手書き認識システムが提供される。
る手書き認識システムが提供される。
【図1】本発明の手書き認識システムに対して入力され
る5つの異なるタイプの手書きの事例を示す図である。
る5つの異なるタイプの手書きの事例を示す図である。
【図2】トレーニングおよび復号パラダイムを強化する
汎用手書き認識システムを示すブロック図である。
汎用手書き認識システムを示すブロック図である。
【図3】本発明による手書き認識システムを示すブロッ
ク図である。
ク図である。
【図4】図3に全体的に示されるフロント・エンド・パ
ラメータ抽出ブロックを示す詳細ブロック図である。
ラメータ抽出ブロックを示す詳細ブロック図である。
【図5】図4の事前フィルタ・ブロックに入力される弾
道状空間文字を示す図である。
道状空間文字を示す図である。
【図6】図4の事前フィルタ・ブロックから出力される
等間隔文字を示す図である。
等間隔文字を示す図である。
【図7】図5の弾道空間文字の上部4分の1が図6の等
間隔文字に変換される方法を示す図である。
間隔文字に変換される方法を示す図である。
【図8】図4の事前フィルタ・ブロックが図5の弾道状
空間文字を図6の等間隔文字に変換するよう機能する方
法を詳細に示すフロー図である。
空間文字を図6の等間隔文字に変換するよう機能する方
法を詳細に示すフロー図である。
【図9】点(P)に対する特徴ベクトルを生じるため従
来技術により処理される手書き文字を示す図である。
来技術により処理される手書き文字を示す図である。
【図10】複数の空間属性を集めることにより図9の点
(P)に対して従来技術で生成された4次元の手書き特
徴ベクトルを示す図である。
(P)に対して従来技術で生成された4次元の手書き特
徴ベクトルを示す図である。
【図11】点(P)に対する第1のパラメータ・ベクト
ルを生成するため本発明の教示により処理される手書き
文字の一部を示す図である。
ルを生成するため本発明の教示により処理される手書き
文字の一部を示す図である。
【図12】複数の局部空間属性を集めることにより図1
1の点(P)に対して生成された6次元の局部パラメー
タ・ベクトルを示す図である。
1の点(P)に対して生成された6次元の局部パラメー
タ・ベクトルを示す図である。
【図13】点(P)に対する第2のパラメータ・ベクト
ルを生成するため本発明の教示により処理される手書き
文字を示す図である。
ルを生成するため本発明の教示により処理される手書き
文字を示す図である。
【図14】複数の大域空間属性を集めることにより図1
3の点(P)に対して生成される3次元の大域パラメー
タ・ベクトルを示す図である。
3の点(P)に対して生成される3次元の大域パラメー
タ・ベクトルを示す図である。
【図15】図12および図14において抽出された如き
個々のパラメータ・ベクトルの連結により1つの文字に
おけるウインドウ表示が行われる方法を示す図である。
個々のパラメータ・ベクトルの連結により1つの文字に
おけるウインドウ表示が行われる方法を示す図である。
【図16】図15に示されるパラメータ・ベクトルの連
結を行うことにより分割ベクトルを生じるため図4のウ
インドウ・ブロックが機能する方法を詳細に示すフロー
図である。
結を行うことにより分割ベクトルを生じるため図4のウ
インドウ・ブロックが機能する方法を詳細に示すフロー
図である。
【図17】図4の射影ブロックが図16で得られた接合
ベクトルから特徴ベクトルを生じるため機能する方法を
詳細に示すフロー図である。
ベクトルから特徴ベクトルを生じるため機能する方法を
詳細に示すフロー図である。
【図18】図3のプロトタイプ構造の詳細ブロック図で
ある。
ある。
【図19】K平均クラスタリング(アルゴリズム)を示
す図である。
す図である。
【図20】図18のユークリッドK平均クラスタリング
・ブロックが機能する方法を示すフロー図である。
・ブロックが機能する方法を示すフロー図である。
【図21】図18のガウスK平均クラスタリング・ブロ
ックが機能する方法を示すフロー図である。
ックが機能する方法を示すフロー図である。
【図22】図3の尤度評価ブロックが機能する方法を示
すフロー図である。
すフロー図である。
【図23】図3の復号ブロックが機能する方法を示すフ
ロー図である。
ロー図である。
10 汎用コンピュータ 12 スタイラス 14 電子タブレット 16 トレーニング・モード 18 復号モード 22 フロント・エンド・パラメータ抽出ブロック 24 プロトタイプ構成ブロック 26 言語モデル・ブロック 28 尤度評価部 30 復号部 32 出力 33 利用デバイス 34 事前フィルタ・ブロック 36 パラメータ抽出ブロック 38 ウインドウ表示ブロック 40 射影ブロック 83 空間 84、86、88 クラスタ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ジェローム・ルネ・ベルガーダ アメリカ合衆国10526 ニューヨーク州 ゴールデンズ・ブリッジ、ブルダー・レ ーン 490番地 (72)発明者 デイヴィッド・ナハムー アメリカ合衆国10605 ニューヨーク州 ホワイト・プレインズ、エルムウッド・ ロード 12番地 (72)発明者 クリシュナ・サンダラム・ネイサン アメリカ合衆国10016 ニューヨーク州 ニューヨーク、アパートメント・110・ マディソン・アベニュー 220番地
Claims (12)
- 【請求項1】ストロークに沿った複数の異なる位置にお
いてタブレット上の手書きストロークの少なくとも1つ
の特徴値を測定して、手書きストロークを表わす特徴ベ
クトル信号を生成する手段と、 各々が少なくとも1つのパラメータ値を有する複数のプ
ロトタイプ信号を記憶する手段と、 対象文字種の各文字について、プロトタイプ信号の発生
確率の評価値を記憶する手段と、 候補文字種と特徴ベクトル信号とプロトタイプ信号とに
ついて、成分文字スコア(当該成分文字スコアは、プロ
トタイプ信号が与えられたときに特徴ベクトル信号が発
生する確率の評価値を有し、候補文字種が与えられたと
きにプロトタイプ信号が発生する確率が考慮される)を
生成する手段と、 候補文字種と特徴ベクトル信号とについて、部分文字ス
コア(当該部分文字スコアは、候補文字種と特徴ベクト
ル信号と全てのプロトタイプ信号とについて、成分文字
スコアが考慮される)を生成する手段と、 手書きストロークを表わす候補文字種と全ての特徴ベク
トル信号とについて、全体文字スコア(当該全体文字ス
コアは、手書きストロークを表わす候補文字種と全ての
特徴ベクトル信号とについて、部分文字スコアが考慮さ
れる)を生成する手段と、 全体文字スコアが上位の候補文字種を識別する手段とを
有する、 手書き認識システム。 - 【請求項2】少なくとも1つの候補文字種を生成し、ま
たは、表示する手段とをさらに有する、 請求項1記載の手書き認識システム。 - 【請求項3】候補文字種についての全体文字スコアがさ
らに、当該候補文字種に先行又は後行する1以上の他の
候補文字種の発生の確率の評価についても考慮される、
請求項2記載の手書き認識システム。 - 【請求項4】各プロトタイプ信号が、少なくとも1の平
均パラメータ値と少なくとも1の分散パラメータ値とを
有し、 プロトタイプ信号の発生が与えられる特徴ベクトル信号
の発生確率が、プロトタイプ信号の平均と分散とが与え
られる特徴ベクトル信号のガウス尤度として評価され
る、 請求項3記載の手書き認識システム。 - 【請求項5】手書きストロークを表わす特徴ベクトル信
号を生成する手段が、タブレット上の手書きストローク
の少なくとも1の局部特徴の値を生成するとともに、タ
ブレット上の手書きストロークの少なくとも1の大域特
徴の値を生成する、 請求項3記載の手書き認識システム。 - 【請求項6】成分文字スコアが、プロトタイプ信号が与
えられたときに特徴ベクトル信号が発生する確率に、候
補文字種が与えられたときにプロトタイプ信号が発生す
る確率を掛けることによる、積の評価を考慮し、 部分文字スコアが、全てのプロトタイプ信号について、
候補文字種と特徴ベクトル信号とについての成分文字ス
コアの合計を考慮し、 全体文字スコアが、手書きストロークにおける候補文字
種と全ての特徴ベクトル信号とについての部分文字スコ
アの積を考慮したものである、 請求項5記載の手書き認識システム。 - 【請求項7】ストロークに沿った複数の異なる位置にお
いてタブレット上の手書きストロークの少なくとも1の
特徴値を測定して、手書きストロークを表わす特徴ベク
トル信号を生成するステップと、 各々が少なくとも1つのパラメータ値を有する複数のプ
ロトタイプ信号を記憶するステップと、 対象文字種の各文字について、プロトタイプ信号の発生
確率の評価値を記憶するステップと、 候補文字種と特徴ベクトル信号とプロトタイプ信号とに
ついて、成分文字スコア(当該成分文字スコアは、プロ
トタイプ信号が与えられたときに特徴ベクトル信号が発
生する確率の評価値を有し、候補文字種が与えられたと
きにプロトタイプ信号が発生する確率が考慮される)を
生成するステップと、 候補文字種と特徴ベクトル信号とについて、部分文字ス
コア(当該部分文字スコアは、候補文字種と特徴ベクト
ル信号と全てのプロトタイプ信号とについて、成分文字
スコアが考慮される)を生成するステップと、 手書きストロークを表わす候補文字種と全ての特徴ベク
トル信号とについて、全体文字スコア(当該全体文字ス
コアは、手書きストロークを表わす候補文字種と全ての
特徴ベクトル信号とについて、部分文字スコアが考慮さ
れる)を生成するステップと、 全体文字スコアが上位の候補文字種を識別するステップ
とを有する、 手書き認識方法。 - 【請求項8】少なくとも1つの候補文字種を生成し、ま
たは、表示するステップとをさらに有する、 請求項7記載の手書き認識方法。 - 【請求項9】候補文字種についての全体文字スコアがさ
らに、当該候補文字種に先行又は後行する1以上の他の
候補文字種の発生の確率の評価についても考慮される、 請求項8記載の手書き認識方法。 - 【請求項10】各プロトタイプ信号が、少なくとも1の
平均パラメータ値と少なくとも1の分散パラメータ値と
を有し、 プロトタイプ信号の発生が与えられる特徴ベクトル信号
の発生確率が、プロトタイプ信号の平均と分散とが与え
られる特徴ベクトル信号のガウス尤度として評価され
る、 請求項9記載の手書き認識方法。 - 【請求項11】手書きストロークを表わす特徴ベクトル
信号を生成するステップが、タブレット上の手書きスト
ロークの少なくとも1の局部特徴の値を生成するととも
に、タブレット上の手書きストロークの少なくとも1の
大域特徴の値を生成する、 請求項10記載の手書き認識方法。 - 【請求項12】成分文字スコアが、プロトタイプ信号が
与えられたときに特徴ベクトル信号が発生する確率に、
候補文字種が与えられたときにプロトタイプ信号が発生
する確率を掛けることによる、積の評価を考慮し、 部分文字スコアが、全てのプロトタイプ信号について、
候補文字種と特徴ベクトル信号とについての成分文字ス
コアの合計を考慮し、 全体文字スコアが、手書きストロークにおける候補文字
種と全ての特徴ベクトル信号とについての部分文字スコ
アの積を考慮したものである、 請求項11記載の手書き認識方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US785642 | 1985-10-08 | ||
US07/785,642 US5343537A (en) | 1991-10-31 | 1991-10-31 | Statistical mixture approach to automatic handwriting recognition |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05217024A JPH05217024A (ja) | 1993-08-27 |
JP2750057B2 true JP2750057B2 (ja) | 1998-05-13 |
Family
ID=25136155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4220410A Expired - Fee Related JP2750057B2 (ja) | 1991-10-31 | 1992-08-19 | 自動手書き文字認識に対する統計的混合手法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5343537A (ja) |
EP (1) | EP0539749B1 (ja) |
JP (1) | JP2750057B2 (ja) |
DE (1) | DE69231309T2 (ja) |
Families Citing this family (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5491758A (en) * | 1993-01-27 | 1996-02-13 | International Business Machines Corporation | Automatic handwriting recognition using both static and dynamic parameters |
NL9300310A (nl) * | 1993-02-19 | 1994-09-16 | Oce Nederland Bv | Inrichting en werkwijze voor syntactische signaal-analyse. |
DE69425412T2 (de) * | 1993-11-23 | 2001-03-08 | Ibm | Anlage und Verfahren zur automatischen Handschrifterkennung mittels eines benutzerunabhängigen chirographischen Labelalphabets |
IL108566A0 (en) * | 1994-02-04 | 1994-05-30 | Baron Research & Dev Company L | Handwriting input apparatus using more than one sensing technique |
US5577135A (en) * | 1994-03-01 | 1996-11-19 | Apple Computer, Inc. | Handwriting signal processing front-end for handwriting recognizers |
GB9409773D0 (en) * | 1994-05-13 | 1994-07-06 | Atomic Energy Authority Uk | Identification system |
IL110137A (en) * | 1994-06-27 | 2000-06-29 | Advanced Recognition Tech | Handwriting recognition system |
US5666438A (en) * | 1994-07-29 | 1997-09-09 | Apple Computer, Inc. | Method and apparatus for recognizing handwriting of different users of a pen-based computer system |
US6052481A (en) * | 1994-09-02 | 2000-04-18 | Apple Computers, Inc. | Automatic method for scoring and clustering prototypes of handwritten stroke-based data |
US5854855A (en) * | 1994-09-09 | 1998-12-29 | Motorola, Inc. | Method and system using meta-classes and polynomial discriminant functions for handwriting recognition |
US5802205A (en) * | 1994-09-09 | 1998-09-01 | Motorola, Inc. | Method and system for lexical processing |
GB2307085B (en) * | 1994-09-09 | 1998-09-23 | Motorola Inc | Method and system for recognizing a boundary between characters in handwritten text |
AU3590795A (en) * | 1994-09-14 | 1996-03-29 | Apple Computer, Inc. | System and method for automatic subcharacter unit and lexicon generation for handwriting recognition |
US5812818A (en) * | 1994-11-17 | 1998-09-22 | Transfax Inc. | Apparatus and method for translating facsimile text transmission |
JPH0973660A (ja) * | 1995-09-06 | 1997-03-18 | Nec Corp | 光学的情報記録媒体ならびに記録中ベリファイ方法 |
US6137909A (en) * | 1995-06-30 | 2000-10-24 | The United States Of America As Represented By The Secretary Of The Navy | System and method for feature set reduction |
JPH09223195A (ja) * | 1996-02-06 | 1997-08-26 | Hewlett Packard Co <Hp> | 文字認識方法 |
US6345119B1 (en) * | 1996-02-19 | 2002-02-05 | Fujitsu Limited | Handwritten character recognition apparatus and method using a clustering algorithm |
EP0896704A1 (en) * | 1996-03-08 | 1999-02-17 | Motorola, Inc. | Method and device for handwritten character recognition |
US5933525A (en) * | 1996-04-10 | 1999-08-03 | Bbn Corporation | Language-independent and segmentation-free optical character recognition system and method |
EP0845224A1 (en) | 1996-11-29 | 1998-06-03 | Jack Wen | Shock-absorbing footwear |
US6708274B2 (en) * | 1998-04-30 | 2004-03-16 | Intel Corporation | Cryptographically protected paging subsystem |
JP3969775B2 (ja) * | 1996-12-17 | 2007-09-05 | キヤノン株式会社 | 手書き情報入力装置および手書き情報入力方法 |
US6332040B1 (en) * | 1997-11-04 | 2001-12-18 | J. Howard Jones | Method and apparatus for sorting and comparing linear configurations |
US6281888B1 (en) * | 1999-01-07 | 2001-08-28 | International Business Machines Corporation | Pen input device using electrostatic coupling |
US6671661B1 (en) * | 1999-05-19 | 2003-12-30 | Microsoft Corporation | Bayesian principal component analysis |
JP4346814B2 (ja) * | 2000-12-27 | 2009-10-21 | キヤノン株式会社 | 情報処理装置及びその方法、コンピュータ可読メモリ、プログラム |
US7269546B2 (en) | 2001-05-09 | 2007-09-11 | International Business Machines Corporation | System and method of finding documents related to other documents and of finding related words in response to a query to refine a search |
US6925433B2 (en) | 2001-05-09 | 2005-08-02 | International Business Machines Corporation | System and method for context-dependent probabilistic modeling of words and documents |
US20040243531A1 (en) * | 2003-04-28 | 2004-12-02 | Dean Michael Anthony | Methods and systems for representing, using and displaying time-varying information on the Semantic Web |
US7219085B2 (en) * | 2003-12-09 | 2007-05-15 | Microsoft Corporation | System and method for accelerating and optimizing the processing of machine learning techniques using a graphics processing unit |
US8411958B2 (en) * | 2004-05-04 | 2013-04-02 | Nokia Corporation | Apparatus and method for handwriting recognition |
SE528063C2 (sv) * | 2004-11-12 | 2006-08-22 | Zi Decuma Ab | Metod och anordning för segmenteringsbaserad igenkänning |
US8280719B2 (en) * | 2005-05-05 | 2012-10-02 | Ramp, Inc. | Methods and systems relating to information extraction |
US7809214B2 (en) * | 2005-08-22 | 2010-10-05 | Samsung Electronics Co., Ltd. | Device and a method for identifying movement patterns |
US20070271087A1 (en) * | 2006-05-18 | 2007-11-22 | Microsoft Corporation | Language-independent language model using character classes |
US8131536B2 (en) * | 2007-01-12 | 2012-03-06 | Raytheon Bbn Technologies Corp. | Extraction-empowered machine translation |
JP4894709B2 (ja) * | 2007-10-04 | 2012-03-14 | 株式会社Ihi | 製品設計支援システム及びコンピュータにおける製品設計支援のための動作方法 |
US7890539B2 (en) | 2007-10-10 | 2011-02-15 | Raytheon Bbn Technologies Corp. | Semantic matching using predicate-argument structure |
US9285983B2 (en) * | 2010-06-14 | 2016-03-15 | Amx Llc | Gesture recognition using neural networks |
US9529448B2 (en) * | 2011-08-31 | 2016-12-27 | Farzan Fallah | Data entry systems and methods |
WO2013128291A2 (en) * | 2012-02-29 | 2013-09-06 | Robert Bosch Gmbh | Method of fusing multiple information sources in image-based gesture recognition system |
CN103218628A (zh) * | 2013-03-22 | 2013-07-24 | 中国科学技术大学 | 一种基于团块与轨迹特征的异常行为描述方法 |
JP6125333B2 (ja) * | 2013-05-31 | 2017-05-10 | 株式会社東芝 | 検索装置、方法及びプログラム |
US9575952B2 (en) | 2014-10-21 | 2017-02-21 | At&T Intellectual Property I, L.P. | Unsupervised topic modeling for short texts |
US10671844B2 (en) * | 2017-06-02 | 2020-06-02 | Apple Inc. | Handwritten text recognition |
US11270104B2 (en) * | 2020-01-13 | 2022-03-08 | Apple Inc. | Spatial and temporal sequence-to-sequence modeling for handwriting recognition |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6015791A (ja) * | 1983-07-07 | 1985-01-26 | 松下電器産業株式会社 | 風呂状態検出装置 |
JPS6029767A (ja) * | 1983-07-28 | 1985-02-15 | Canon Inc | 電子写真装置とその装置による電子写真法 |
US4731857A (en) * | 1984-06-29 | 1988-03-15 | International Business Machines Corporation | Recognition system for run-on handwritten characters |
JPS6219975A (ja) * | 1985-07-17 | 1987-01-28 | Fujitsu Ltd | 図形処理システム |
JPS62154078A (ja) * | 1985-12-26 | 1987-07-09 | Fujitsu Ltd | オンライン手書文字認識における特徴点の抽出方式 |
JPS6474345A (en) * | 1987-09-17 | 1989-03-20 | Honda Motor Co Ltd | Controller for hydraulic operation type transmission for vehicle |
JP2822189B2 (ja) * | 1988-05-19 | 1998-11-11 | ソニー株式会社 | 文字認識装置及び方法 |
JPH01321591A (ja) * | 1988-06-23 | 1989-12-27 | Nec Corp | 文字認識装置 |
JPH071434B2 (ja) * | 1989-03-27 | 1995-01-11 | 三菱電機株式会社 | 標準パタン作成方式 |
US5075896A (en) * | 1989-10-25 | 1991-12-24 | Xerox Corporation | Character and phoneme recognition based on probability clustering |
US5029223A (en) * | 1990-02-02 | 1991-07-02 | International Business Machines Corporation | Constraint driven-on line recognition of handwritten characters and symbols |
US5105468A (en) * | 1991-04-03 | 1992-04-14 | At&T Bell Laboratories | Time delay neural network for printed and cursive handwritten character recognition |
-
1991
- 1991-10-31 US US07/785,642 patent/US5343537A/en not_active Expired - Lifetime
-
1992
- 1992-08-19 JP JP4220410A patent/JP2750057B2/ja not_active Expired - Fee Related
- 1992-09-30 DE DE69231309T patent/DE69231309T2/de not_active Expired - Lifetime
- 1992-09-30 EP EP92116751A patent/EP0539749B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
DE69231309D1 (de) | 2000-09-07 |
EP0539749A2 (en) | 1993-05-05 |
DE69231309T2 (de) | 2001-02-15 |
EP0539749A3 (en) | 1994-05-11 |
EP0539749B1 (en) | 2000-08-02 |
US5343537A (en) | 1994-08-30 |
JPH05217024A (ja) | 1993-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2750057B2 (ja) | 自動手書き文字認識に対する統計的混合手法 | |
JP2667954B2 (ja) | 静的及び動的パラメータを使用する自動手書き文字認識装置及び方法 | |
JP2669583B2 (ja) | 手書き認識のためのコンピュータベース方法及びシステム | |
US6556712B1 (en) | Methods and apparatus for handwriting recognition | |
US7336827B2 (en) | System, process and software arrangement for recognizing handwritten characters | |
EP2808827B1 (en) | System and method for OCR output verification | |
JP4504702B2 (ja) | 文書処理装置、文書処理方法、および文書処理プログラム | |
US20040148577A1 (en) | Learning-based system and process for synthesizing cursive handwriting | |
US7903877B2 (en) | Radical-based HMM modeling for handwritten East Asian characters | |
WO1997044758A9 (en) | Methods and apparatuses for handwriting recognition | |
CN104008363A (zh) | 手写轨迹的检测、规范化和在线识别以及异常字根的收集 | |
Stern et al. | Most discriminating segment–Longest common subsequence (MDSLCS) algorithm for dynamic hand gesture classification | |
Wieprecht et al. | Word spotting in historical document collections with online-handwritten queries | |
JP3209197B2 (ja) | 文字認識装置及び文字認識プログラムを記録した記録媒体 | |
Garain et al. | On machine understanding of online handwritten mathematical expressions | |
AU764561B2 (en) | Method and apparatuses for handwriting recognition | |
JP3374762B2 (ja) | 文字認識方法及びその装置 | |
JP4180137B2 (ja) | オンライン手書き文字認識方法 | |
Senior et al. | O-line cursive handwriting recognition using recurrent neural networks | |
Mukherjee et al. | An efficient feature vector for segmentation-free recognition of online cursive handwriting based on a hybrid deep neural network | |
Lemaıtre et al. | Off-line handwritten word recognition based on a bidimensional Markovian approach with a large vocabulary | |
Song et al. | Free-Flow: Unintrusive Reading Device for a Printed Text |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080220 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090220 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100220 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |