JP2641388B2 - 手書き文字認識システムにおけるライン・スペース及びベース・ラインの調整方法 - Google Patents

手書き文字認識システムにおけるライン・スペース及びベース・ラインの調整方法

Info

Publication number
JP2641388B2
JP2641388B2 JP6020305A JP2030594A JP2641388B2 JP 2641388 B2 JP2641388 B2 JP 2641388B2 JP 6020305 A JP6020305 A JP 6020305A JP 2030594 A JP2030594 A JP 2030594A JP 2641388 B2 JP2641388 B2 JP 2641388B2
Authority
JP
Japan
Prior art keywords
character
value
line
baseline
line space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP6020305A
Other languages
English (en)
Other versions
JPH076204A (ja
Inventor
ウィルカー・シェーン・ブルース
ジョオンキ・キム
ドナルド・ベン・マトソン
ウィリアム・デビッド・モドリン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH076204A publication Critical patent/JPH076204A/ja
Application granted granted Critical
Publication of JP2641388B2 publication Critical patent/JP2641388B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/166Normalisation of pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は手書き文字の認識に係
り、更に詳細に説明すれば、プロトタイプ文字の座標空
間に一致するように、手書き文字のデカルト座標を正規
化することによって、その認識精度を向上させることに
係る。
【0002】
【従来の技術】手書き文字認識システムでは、筆記表面
上に複数のガイドラインを設けて、ユーザに対し手書き
文字の筆記位置をガイドするのが普通である。ユーザが
入力した筆跡は、デイジタイザによって捕捉された後、
パターン・マッチング手段へ送られ、そこでこの筆跡
が、手書き文字認識システムによって認識可能な手書き
単位(文字)を表すプロトタイプ・パターンと突き合わ
される。かかるマッチング・プロセスの一環として、デ
イジタイザによって捕捉される筆跡のデカルト座標は、
プロトタイプ文字の座標空間と一致するように正規化さ
れねばならない。
【0003】座標の正規化は、高い認識精度を得る上で
重要である。正規化を行うためのプロセスで使用される
情報には、ライン・スペースやベース・ラインの位置の
ような測定値が含まれる。しかしながら、ユーザが異な
れば筆記スタイルも当然に異なり、またユーザが同一で
ある場合ですら状況に応じて筆記スタイルが異なってく
るために、これらの値は、筆記表面上の複数のガイドラ
インによって予定されたものとは著しく相違することが
ある。パターン・マッチングのアルゴリズムを成功裡に
行うためには、正規化が重要であることは明らかである
から、手書き文字認識システムの認識精度を向上させる
ためには、ライン・スペースとベース・ラインの配置に
関する正確な推定値を実時間式に提供することが必要と
なる。
【0004】手書き文字の認識については多数の特許及
び文献が公知であり、その各々はそれぞれ利点と欠点を
合わせ持っている。以下、これらの従来技術のうち代表
的なものを簡術する。米国特許第 4,024,500 号は、手
書きの続け字を分析するシステムにおいて、筆記具の連
続的なxy座標や、xy方向の速度を得るようにした、
文字分割方法及び装置に係る。詳述すると、xy方向の
速度がゼロに等しくなるような、手書き文字のxy極値
点(extremal points)に関連するx変位を連続的に平
均化し、各x極値点のx変位を相次いで調べ、各x極値
点のx変位が現文字の平均的なx変位に関する予定のス
レッショルドを超えているか否かを決定し、もしそうな
ら、この新しい極値点が次の文字内に位置することを指
示するとともに、分析したばかりの極値点と以前に分析
した極値点との間のリガチュア(合字)に沿った予定の
距離に分割マークを置くべきことを指示する。次に、か
かる分割の結果を文字認識機構へ通信すると、その効率
及び精度を大幅に向上させることができる。このシステ
ムは、筆記動作が進行するにつれて遭遇するような、ベ
ース・ライン及び中間ゾーン・ラインからの逸脱にも追
従することができる。
【0005】米国特許第 4,845,768 号に開示されてい
る文字認識用の編集機構は、2進符号化文字をX/Yア
ドレス可能なイメージ信号メモリに格納し、このメモリ
から複数の信号を列単位で読み出し、それぞれが黒い点
から成る連続的な列を文字のベース・ラインへ射影する
ことによって第1の文字シャドウを形成する。次に、最
小の文字シャドウが生ぜられるまで、Y軸に関する正又
は負の斜角における走査と一致して、格納された文字パ
ターンを反復的に読み出す。かかる最小の文字シャドウ
を生ぜしめるような走査済みのパターンを選択して、文
字の更なる評価のためにこれを使用する。
【0006】米国特許第 4,972,496 号に開示されてい
るキーボードを持たないエントリ・システムは、スタイ
ラスとの接触に応答して位置情報を生成する透明な入力
スクリーンと、この入力スクリーンの下側に観察可能な
文字を表示することができるように、この入力スクリー
ンの下部に物理的に取り付けられた表示スクリーンとを
備えている。このシステムの計算機が搭載するプログラ
ムは、位置情報を複数のストロークへコンパイルし、ス
トローク特性を計算し、かかるストローク特性をデータ
ベースに格納された特性と比較して、スタイラスが描い
た記号を認識するように機能する。このシステムの特徴
的な手段は、 透明な位置検知サブシステムと、 検
知された位置情報の描画を模写して文字又は記号を表示
する、前記サブシステムの下側に位置する表示手段と、
検知された位置情報を先ずプロット点へ変換し、次
に認識済みの文字又は記号へ変換する手段と、検知さ
れた位置情報を文字又は記号と関連付けるように、「学
習」を行う手段とから成る。
【0007】IBM Technical Disclosure Bulletin, Vo
l.25, No.10, March 1983, pp.5111-5114 に掲載された
"Baseline Drift Correction of Handwritten Test"
と題する論文には、所定のワードを一層小さな複数の単
位へ分割することが示されている。各単位は1つのボッ
クスであって、その各々は等しい幅を持ち、またその幅
内に存在する全ての点を包囲することができるような高
さを持っている。複数のかかるボックスを所定のワード
上に均等な間隔を置いて配置すると、これらのボックス
の相対的な位置を分析することにより、それらの上下方
向のずれを検知することが可能となる。これらのボック
スのdy/dxを平均化したものはドリフト量であっ
て、これを訂正のために使用することができる。
【0008】
【発明が解決しようとする課題】本発明の目的は、手書
き文字認識システムにおけるライン・スペース及びベー
ス・ラインの調整方法を提供することにある。本発明の
他の目的は、加重平均(weighted average)推定法を利
用する、手書き文字認識システムにおけるライン・スペ
ース及びベース・ラインの調整方法を提供することにあ
る。本発明の他の目的は、プロトタイプ抽出(prototyp
e extraction)推定法を利用する、手書き文字認識シス
テムにおけるライン・スペース及びベース・ラインの調
整方法を提供することにある。本発明の他の目的は、極
値点クラスタ化(extreme point clustering)推定法を
利用する、手書き文字認識システムにおけるライン・ス
ペース及びベース・ラインの調整方法を提供することに
ある。本発明の他の目的は、プロトタイプ抽出推定法と
極値点化推定法の組み合わせを利用する、手書き文字認
識システムにおけるライン・スペース及びベース・ライ
ンの調整方法を提供することにある。
【0009】
【課題を解決するための手段】本発明によれば、手書き
文字を認識するのに使用されるベース・ライン、ライン
・スペース及び文字高のそれぞれに関する情報が、手書
き文字の認識認識精度を改良するために、以前に認識さ
れたワードからの抽出を通して及びストロークのy座標
極値点のクラスタ化のヒューリステイックな適用を通し
て推定される。
【0010】手書き文字認識システムにおけるライン・
スペース及びベース・ラインの調整手段は、デイジタイ
ザによって捕捉された筆跡のデカルト座標を、プロトタ
イプ文字の空間と一致するように正規化することによっ
て、認識精度を向上させる。かかる正規化技法は、加重
平均推定法と、プロトタイプ抽出推定法と、極値点クラ
スタ化推定法と、プロトタイプ抽出推定法及び極値点ク
ラスタ化推定法の組み合わせとを含んでいる。
【0011】
【実施例】図1は、本発明に従ったオンライン式の手書
き文字認識システム10を示す。手書き文字認識システ
ム10は、例えば「ペンポイント」オペレーテイング・
システムを搭載したIBM「シンクパッド」コンピュー
タ700−Tとすることができる(なお、「ペンポイン
ト」はGO社の商標で、「シンクパッド」はIBM社の
商標である)。かかるコンピュータの動作は、ユーザ・
ガイド(IBM部品番号 41G3122)に記述されている。
手書き文字認識システム10に含まれる手書き文字の変
換手段は、統合化されたタブレット兼表示手段12から
構成され、この変換手段にはスタイラス14のような筆
記具が付属している。この変換手段は、手書き文字に応
答して、タブレット兼表示手段12上のスタイラス14
の位置に対応するxy座標対の直列ストリームを出力す
る。ストローク・セグメント手段16は、これらの座標
対を受け取って、離散的な手書きストロークの開始端及
び終了端を識別する。ライン・スペース/ベース・ライ
ン(LS/BL)調整手段17は、正規化された文字を
供給して文字認識精度を一層向上させるべく、ストロー
ク・セグメント手段16からの複数のストロークに応答
して、各文字毎にライン・スペース及びベース・ライン
を推定する。この推定法については、以下で詳述する。
文字マッチング手段18は、LS/BL調整手段17か
ら受け取られる正規化された入力ストロークの点を、プ
ロトタイプ文字記憶手段20に格納された予定のプロト
タイプ文字の点と比較して、一の入力ストローク又はス
トロークの集合が特定の文字を表すか否かを、或る程度
の確率で識別する。このようにして認識された文字は、
線19を介して文字マッチング手段18からタブレット
兼表示手段12へ出力してこれを表示するか、又は利用
手段21(例えば、表示手段や、ワード処理プログラム
等のアプリケーション)へ供給することができる。認識
精度を更に向上させることを目的として、利用手段21
から線23を介してLS/BL調整手段17へ、デフォ
ルトのライン・スペース値及びベース・ライン値を供給
することが可能である。また、ストローク・セグメント
手段16及び文字マッチング手段18の両者の機能を、
1つの手書きストローク処理ユニット内で統合化するこ
とも可能である。
【0012】プロトタイプ文字については、手書き文字
認識システム10のユーザのために行われるトレーニン
グ用セションの間に、これをプロトタイプ文字記憶手段
20へ供給することができる。また、手書き文字認識シ
ステム10の特定のユーザにプロトタイプ文字を入力さ
せて、その後は、かかる特定のユーザが手書き文字を入
力するときに使用するようにしても良い。更に、複数の
ユーザが使用できるように、汎用のプロトタイプ文字セ
ットを生成するようにしても良い。
【0013】この点に関し説明を補足すれば、手書き文
字認識システム10を最初に使用する任意のユーザが、
最初のプロトタイプ文字セットとして使用することがで
きるように、初心者用のプロトタイプ文字セットを設計
するようにしても良い。もし必要なら、ユーザが事後的
に幾つかのプロトタイプ文字を自分の筆記スタイルに追
加して、自分にあったプロトタイプ文字セット、すなわ
ち個性化されたプロトタイプ文字セットを獲得するよう
にしても良い。かかる初心者用のプロトタイプ文字セッ
トは専門家によって作成されるのが通例であるから、手
書き文字認識システム10のユーザには、筆記上の追加
的な制約に従うという如何なる負担も課されない。
【0014】いずれにしても、トレーニング用セション
の間、文字マッチング手段18からの各文字は、物理的
又は論理的スイッチ22を介して、市販のマイクロプロ
セッサで構成可能なプロトタイプ・プロセッサ24へ供
給される。プロトタイプ・プロセッサ24の出力である
平均化された一連のプロトタイプ文字は、プロトタイプ
文字記憶手段20へ供給され、そこに格納された後、手
書き文字認識システム10のユーザについて行われる手
書き認識セションの間に使用される。
【0015】また、プロトタイプ・プロセッサ24は、
キーボード26及び表示手段24のようなユーザ入力及
び出力装置にも結合される。こうすることにより、手書
き文字認識システム10のユーザについて行われる手書
き認識セション中に使用される、混同するプロトタイプ
を削除するように、プロトタイプ・プロセッサ24の動
作を制御することができる。
【0016】ここで、統合化されたタブレット兼表示手
段12を、表示手段を持たないタブレットで置き換え
て、文字の表示を利用手段21又は他の表示手段28で
行わせるようにすることも可能である点を理解すべきで
ある。
【0017】以下、手書き文字の認識精度を向上させる
のに役立つ、LS/BL調整手段17の機能を詳述す
る。一般に、文字列(テキスト)はユーザによって一度
に1行ずつ書かれ、その行が完成したとき、筆記動作は
次の行へ折り返されるようになっている。筆記方向(左
から右、右から左、等)は、筆記されている言語に応じ
て変わる。本明細書では、言語や筆記方向にとらわれな
い一般化した技法を説明する。以下、本発明を説明する
際に使用する用語の定義を掲げる。
【0018】「ベース・ライン」: デセンダ・
ストロークを持たない文字を、ユーザがその上に配置す
るような自然なライン。 「文字高」: ベース・ラインと(認識
対象の言語における)大文字の頂部との間にある距離。 「デセンダ・ストローク」: ベース・ラインの下に突
き抜けるような文字の下垂部。英字では、"g"、 "j"、 "
p"、 "q" 及び"y" がデセンダ・ストロークを含む文字の
例である。 「ライン・スペース」: 各文字に属する複数の点
を含み得る、ベース・ラインからの正方向の最大の距
離。
【0019】図2には、ライン・スペース(LS)30
と、文字高32と、ベース・ライン(BL)34との配
置の1例が示されている。一般に、ユーザは隣接するベ
ース・ライン間のスペースを完全に満たすような大文字
を書くことはないから、文字高32はライン・スペース
30の一部となるのが普通である。また、アセンダ又は
デセンダを持たない小文字は、ライン・スペース30の
値のほぼ半分に等しい高さを持つように書かれるのが普
通である。これに対し、アセンダ又はデセンダを持つ小
文字は、ライン・スペース30の値にほぼ等しい高さを
持つように書かれるのが普通である。
【0020】手書きの文字列を分析すると、筆記表面上
に複数のガイドラインが設けられている場合であって
も、かかる文字列がベース・ライン上に正確に位置して
いないことが判る。更に、手書き文字の文字高とライン
・スペースは、時間が経過するにつれて変化する、とい
う現象が認められる。図3には、かかる現象の1例とし
て、文字高のドリフトが参照番号36の箇所に、文字高
とベース・ラインの両者のドリフトが参照番号40の箇
所にそれぞれ示されている。手書き文字認識システムに
おいて、ライン・スペース、ベース・ライン及び文字高
のそれぞれについての実時間的な推定値を必要とするの
は、かかる自然的な変動が存在するためである。
【0021】入力データの基本単位は、ストロークであ
る。ストロークとは、スタイラス14(図1参照)の下
降から上昇までの筆跡を言う。各文字は、1つ以上のス
トロークから構成することができる。複数のストローク
は、一度に1つずつこれを取り扱うか、又は一度に1つ
の文字、ワード若しくは行へグループ化することができ
る。複数のストロークをグループ化したものは、セグメ
ントと呼ばれる。
【0022】以下では、図1の手書き文字認識システム
10において、ベース・ライン、ライン・スペース及び
文字高を推定するための5つの推定法を詳述する。これ
らの推定法は、後のものの方が前のものより一層正確な
推定値を与える。 <デフォルト推定法>図4に示すように、筆記表面上に
複数のベース・ライン(BL1乃至BL3)を設ける
と、ユーザが文字のサイズを変えないでこれらのベース
・ライン内に一様に文字を筆記すると仮定することが可
能である。この推定法では、大文字は隣接するベース・
ライン相互間のスペースを完全に満たすように筆記さ
れ、小文字はこの高さのほぼ半分まで筆記されるものと
仮定する。デセンダ・ストロークは、次の行の途中まで
下側に突出する。この推定法では、ベース・ラインの値
は、ユーザへ提示するために筆記表面上に設けられるラ
インの値と等しくなるように計算される。ライン・スペ
ース(LS)の値及び文字高の値は、隣接するベース・
ライン相互間の距離に等しくなるように計算される。こ
の推定法は、協調的なユーザについてだけ使用するのに
適している。
【0023】<簡単な推定法>第2の推定法は、一のセ
グメントの最大及び最小のy座標値に基づいている。こ
こで、"ymax" が一のセグメントの最大のy座標値を表
し、"ymin" が当該セグメントの最小のy座標値を表す
ものとする。この推定法では、ベース・ライン(BL)
は "ymin" に等しいものと推定され、ライン・スペー
ス(LS)及び文字高は "ymax−ymin" であるように
推定される。これは、図5に示す通りである。
【0024】この推定法は、ベース・ライン、ライン・
スペース及び文字高のそれぞれに関する推定値を与え
る。これらの推定値は、非常に速やかに計算可能であっ
て、手書き文字認識システム10がユーザをガイドする
ために筆記表面上に如何なるガイドラインも提示しない
ような場合に使用することができる。しかしながら、こ
の推定法は、良好なパターン・マッチングに必要な精度
を常に有するとは限らない。なぜなら、 該当セグメ
ント中に図5の42及び44に示すようなデセンダ・ス
トロークが存在する場合は、ベース・ラインの貧弱な推
定値が与えられることになり、 該当セグメントがデ
センダ・ストロークを持たない半分の高さの小文字だけ
を含む場合は、文字高及びライン・スペースの推定値
が、それらの正しい値のほぼ半分へ設定されることがあ
り、 該当セグメントが大文字とデセンダ・ストロー
クを持つ小文字の両方を含む場合は、ライン・スペース
及び文字高の値が、それらの正しい値のほぼ1.5倍で
あるように推定されるからである。これらの弱点がある
ために、例えば(C、c)や、(P、p)のような同様
の形状を持つ文字対を、文字マッチング手段18が十分
に区別できないという問題がある。
【0025】<加重平均推定法>ライン・スペース、文
字高及びベース・ラインのそれぞれについて一層良好な
推定値を得るように、以前に計算された値と、この点へ
変換される全セグメントの最大及び最小のy座標値の加
重平均値とに基づく、計算が行われる。この推定法の概
要は、図6に示されている。ここで、"LSold" が、手
書き文字認識システム10の以前のセグメント変換にお
いて使用された、ライン・スペースの古い推定値を表す
ものとする。また、 "Ymax" 及び "Ymin" が、現セグ
メントの最大及び最小のy座標値を表し、"Wold" 及び
"Wcur" が、新しいベース・ライン、ライン・スペー
スおよび文字高値の計算において以前の及び現在のスト
ロークの相対的な影響度を決定するために使用される重
み係数をそれぞれ表すものとする。典型的な場合、"W
old" 及び "Wcur" の各々は、初期設定時には 0−1.0
の範囲にあり、初期設定時を除く時間には 0.3−0.7 の
範囲にある。更に、"LSsys" が、新しいベース・ライ
ンを表し、"BLsys" が、手書き文字認識システム10
に格納すべき新しいベース・ライン値を表すものとす
る。そうすると、これらの推定値は、次の式に従って計
算することができる。
【0026】
【数9】 LSsys = (Wold * LSold + Wcur * (Ymax - Ymin)) / (Wold + Wcur) BLsys = (Wold * LSold + Wcur * Ymin) / (Wold + Wcur) この推定法は、以前のセグメントについて計算された値
を信頼することを通して、前述の簡単な推定法の弱点を
補償しようとするものである。十分な筆跡が存在する場
合、多種多様な文字高とy座標のエクステントに遭遇す
る筈である。エクステントとは、最小値及び最大値であ
る。特に、全文字高を有し且つ如何なるデセンダ・スト
ロークをも持たない文字を含む、複数のセグメントが存
在する筈である。ライン・スペース及びベース・ライン
の位置を計算するために加重平均値を使用することによ
り、かかるセグメントは、推定されたベース・ライン値
とライン・スペース値とを正しい推定値へ向けて移動さ
せるように作用する。デセンダ・ストロークを持つセグ
メントが生ずるか、又は前述の簡単な推定法によっては
不正な推定値を与えるようなセグメントが生ずる場合、
これらのセグメントがライン・スペース及びベース・ラ
インの推定値に与える影響度は、前述の簡単な推定法に
おける影響度ほど極端ではない。そのかわり、推定され
た値は現セグメントの値の方向に緩やかに移動し、特に
重みがこれまでに遭遇したストロークの数に依存するよ
うな場合にはそうである。図6には、推定されたライン
・スペース46及び推定されたベース・ライン48の移
動が、時間に関連して図示されている。
【0027】これらの式は、盲目的に適用することがで
きない。なぜなら、該当ライン・スペースの一部のみを
占有する、例えばコンマやピリオドのような形状が存在
する場合、これらの形状が識別され、そして前述の式を
適用することから除外されるからである。加重平均推定
法については、図9を参照して後で詳述する。
【0028】<プロトタイプ抽出推定法>前述の加重平
均推定法は良好に機能するが、それでも改良の余地があ
る。一のセグメントが既に認識されていて、しかも新し
いセグメントを認識する準備が完了している場合、図7
に示すプロトタイプ抽出推定法を利用すると、以前の認
識結果を使用してライン・スペース値及びベース・ライ
ン値を一層良好に推定することができる。
【0029】パターン・マッチングは、未知の筆跡50
をプロトタイプ空間52へマッピングすることを含んで
いる。プロトタイプは、ラベルと、ライン・スペース
(LS)と、ベース・ライン(BL)と、文字高と、文
字の形状情報とを含んでいる。マッチング・プロセス
は、未知の入力を、1組の予め格納されたプロトタイプ
と比較するものである。このマッチング・プロセスの結
果として各プロトタイプ毎に得られるマッチ・スコア
は、未知の入力が当該プロトタイプに対しどの程度の類
似度でマッチ(一致)しているかを表す。一般に、最良
のマッチ・スコアを有するプロトタイプのラベルが、マ
ッチング・プロセスの結果として選択される。
【0030】一のプロトタイプに含まれるベース・ライ
ン(BL)54及びライン・スペース(LS)56の情
報を、筆記入力空間の座標系へ逆マッピングすることも
可能である。すなわち、一のプロトタイプが未知の入力
に対し最も良くマッチするものとして選択され、しかも
当該プロトタイプに対するマッチ・スコアが予め定義さ
れたスレッショルドよりも良好である場合、当該プロト
タイプから筆記入力空間へ逆マッピングを行うことによ
り、以前のセグメントのベース・ライン及びライン・ス
ペースの推定値を一層正確に得ることができる。かく
て、以前のセグメントに対するパターン・マッチングの
スコアが良好であったと仮定すると、マッチするプロト
タイプから抽出されたライン・スペース及びベース・ラ
イン情報を推定式において使用することができる。
【0031】ここで、"LSpro" が、以前のマッチを使
用してプロトタイプ・セットから抽出されたライン・ス
ペース値を表すものとし、"BLpro" が、以前のマッチ
を使用してプロトタイプ・セットから抽出されたベース
・ライン値を表し、"Wpro"が、これらの値が推定値の
計算に与える影響の度合いを決定する重みを表すものと
する。典型的な場合、"Wpro" 及び "Wcur" の各々
は、初期設定時には 0−1.0 の範囲にあり、初期設定時
を除く時間には 0.3−0.7 の範囲にある。同様に、"L
new" 及び "BLnew" が、この推定法によって計算さ
れる新しい推定値を表すものとする。そうすると、これ
らの新しい推定値は、以下の式によって計算することが
できる。
【0032】
【数10】 LSsys = (Wpro * LSpro + Wcur * LSnew) / (Wpro + Wcur) BLsys = (Wpro * BLpro + Wcur * BLnew) / (Wpro + Wcur) これらの新しい推定値を計算する際に、マッチするプロ
トタイプから抽出されるベース・ライン値及びライン・
スペース値を使用することが不可能であるか、又は望ま
しくないような状況が存在する。マッチされる最初のセ
グメント(又はベース・ラインを推定するための或る行
の最初のセグメント)については、先行するセグメント
が存在せず、従ってマッチするプロトタイプも存在しな
いことになる。この場合、任意の推定値、例えば筆記行
の測定値又は "Ymin" 及び "Ymax" から計算された値
を、種のライン・スペース値及びベース・ライン値とし
て使用することができる。更に、ピリオドやコンマのよ
うな幾つかの句読点は非常に短く、ライン・スペースの
僅かな部分を占有するに過ぎないから、これらの句読点
は、ライン・スペースを調整するのに使用すべきではな
い。この状況を検出するため、各セグメントの "Ymax
−Ymin" が計算される。もし、この計算値が(古いラ
イン・スペースの一部として定義される)予定のスレッ
ショルドよりも小さければ、プロトタイプから抽出され
たライン・スペース値を使用することは避けるべきであ
る。これと同じ理由で、単一の引用符がコンマとなるの
を防ぐために、一のセグメントの "Ymin" が 古いベー
ス・ライン値から離れる方向でスレッショルドよりも大
きくなれば、抽出された値の代わりにこの古いベース・
ライン値を使用すべきである。この点については、図1
0に関連して以下で詳述する。
【0033】<極値点クラスタ化推定法>プロトタイプ
抽出推定法は良好に機能するが、それでも幾つかの制限
を有している。特に、手書き文字認識システム10が所
定の行にある少なくとも1つの文字を既に認識している
場合、任意の行にある最初の文字については、プロトタ
イプ抽出推定法を使用することができない。極値点クラ
スタ化推定法は認識のためのプリ・プロセッサであっ
て、この問題を解決することにより、前述の推定法より
も一層良好な推定値を提供するものである。
【0034】図8に示す例から各ストローク毎に "Y
min" 及び "Ymax" の値をそれぞれ格納すると、この推
定法でクラスタと呼ばれる、1組4グループの数を得る
ことができる。各クラスタは、ヒストグラムとも呼ばれ
る。これらのクラスタをラインA乃至Dに関し計算する
ため、1行を形成する複数の文字中の点が、ラインA乃
至Dにそれぞれ落下する数を計算する。これらのクラス
タは、筆記される文字の各行毎に計算される。ここで、
全てのデセンダ底部58、60、62及び64がライン
Aの回りにどのようにクラスタし、そして全ての大文字
66及び背の高い小文字の頂部68がラインDの回りに
どのようにクラスタしているか、という点に注意すべき
である。同様に、大文字の底部70とデセンダを持たな
い小文字72及び74は、ラインBの回りにクラスタす
る。また、ラインBの回りには、デセンダを持つ小文字
の中央部76及び78もクラスタする。残りのクラスタ
はラインCの回りにあり、小文字の全ての頂部80及び
82がそうである。
【0035】最初のライン・スペースはアプリケーショ
ンによって渡されるか、又は手書き文字認識システム1
0のメトリックスからその時間に導出されるか、或いは
全く供給されないこともある。また、このアプリケーシ
ョンは、これらのクラスタを設定するために使用される
一のベース・ライン値を渡すようにしても良い。もし、
このベース・ラインが(かかるアプリケーションから又
は先行する計算から見て)既知でなければ、これはゼロ
へ設定される。これらのクラスタのうちベース・ライン
値である蓋然性が最も大きい特定のクラスタを決定する
ために、ヒューリステイックが適用される。このライン
・スペース及びベース・ラインから、予備的な1組の4
クラスタが設定される。ヒストグラム84の箇所に図示
されているように、これらの4クラスタは、デセンダ底
部86と、ベース・ライン88と、小文字の頂部92
と、大文字(又は背の高い小文字)の頂部90とであ
る。かかる1組のクラスタ84は、新しいベース・ライ
ン及びライン・スペースを決定する際に使用される基準
点となる。
【0036】極値点クラスタ化は、所定のセグメント中
にある全ての点に対するアクセスを有し、各ストローク
毎に "Ymin" 及び "Ymax" を抽出し、その各々を(各
点がどのクラスタに最も近いかということに基づいて)
4つの可能なクラスタのうちの1つに格納する。一の重
み(出現の数)が各クラスタに関連していて、ゼロから
最大9までの範囲にある。
【0037】一旦、これらのクラスタが設定されると、
どのクラスタがベース・ライン及びライン・スペースを
表すかということを決定するために、ヒューリステイッ
クが適用される。有効なクラスタとは、ゼロより大きい
重みを持つようなものである(少なくとも1つの点がか
かるクラスタに落ち込む)。もし、2つより少ない有効
なクラスタが見い出されたならば、元のライン・スペー
ス値及び元のベース・ライン値が使用されることにな
る。もし、有効な4つのクラスタが見い出されたなら
ば、ベース・ライン値及びライン・スペース値は既知で
あり、かくてこれらの値が使用される。2つ又は3つの
有効なクラスタが見い出された場合は、これが表すデー
タの型が決定される。最も可能性が高いのは、大小混合
(大文字及びデセンダを持たない小文字)、全てが大文
字、全てが小文字、デセンダを持つ小文字、又は全てが
数字という形態である。基準クラスタと比較すると、既
知である値を特定できる蓋然性が大きいことから、かか
る既知の有効なクラスタから欠落しているクラスタ値を
計算することができる。新しい推定値は、次の式によっ
て計算することができる。
【0038】
【数11】 LSsys = (Wold * LSold + Wcur * LSnew) / (Wold + Wcur) BLsys = (Wold * LSold + Wcur * BLnew) / (Wold + Wcur) 初期設定については、もし予め定義された行が筆記のた
めに使用されるのであれば、ライン・スペース及びベー
ス・ラインのデフォルト値が使用される。もし、予め定
義された行が使用されなければ、初期条件を決定するた
めに "Ymin"及び "Ymax" が計算される。この極値点
クラスタ化については、図11に関連して以下で詳述す
る。
【0039】図9を参照するに、そこには図6に関連し
て既に一般的に説明した、図1のライン・スペース/ベ
ース・ライン(LS/BL)調整手段17として使用す
ることができる、加重平均推定手段94のブロック図が
示されている。文字の各セグメントを構成するX、Y点
はブロック96へ供給され、そこで "Ymin" 及び "Y
max" が計算される。"Ymin" 及び "Ymax"の計算値は
ブロック98へ供給され、そこで所定の文字に対するラ
イン・スペース及びベース・ラインが以下の式に従って
計算される。
【0040】
【数12】 LSsys = (Wold * LSold + Wcur * (Ymax - Ymin)) / (Wold + Wcur) BLsys = (Wold * BLold + Wcur * Ymin) / (Wold + Wcur) ライン・スペース及びベース・ラインの推定値は線10
0を介してブロック102へ供給され、そこで次の文字
用のライン・スペース及びベース・ラインの計算に使用
されるように、"LSold" 及び ”BLold" として格納
される。ライン・スペース及びベース・ラインに関する
これらの推定値は、図1のストローク・セグメント手段
16からのサンプル済みの文字について使用され、文字
マッチング手段18においてプロトタイプ文字記憶手段
20中のプロトタイプ文字と比較される。
【0041】次に図10を参照すると、そこには図7に
関連して既に一般的に説明した、図1のライン・スペー
ス/ベース・ライン(LS/BL)調整手段17として
使用することができる、プロトタイプ抽出推定手段10
4のブロック図が示されている。一の文字の各セグメン
トを構成するX、Y点は、文字マッチング手段106へ
供給される。この文字マッチング手段106は、プロト
タイプ文字記憶手段108からのライン・スペース及び
ベース・ラインをも受け取る。プロトタイプ文字記憶手
段108からの "LSpro" 及び "BLpro" を使用する
と、"Ymin" 及び "Ymax" を使用する場合よりも、一
層正確な計算を行うことができる。なぜなら、この計算
が小文字のためのものであれば、その文字高は、ライン
・スペースには等しくないからである。現在のライン・
スペース及びベース・ラインは、ブロック110内で、
次の式に従って計算される。
【0042】
【数13】 LSsys = (Wpro * LSpro + Wcur * LScur) / (Wpro + Wcur) BLsys = (Wpro * BLpro + Wcur * BLcur) / (Wpro + Wcur) 前式において、"LSpro" 及び "BLpro" はプロトタ
イプ文字記憶手段108から引き出され、"Wpro" 及び
"Wcur" はシステム定数であって経験的に決定される
ものである。"LSpro" 及び "BLpro" は、現にサン
プル中の文字の直前にサンプルされた文字の、マッチし
たプロトタイプのライン・スペースおよびベース・ライ
ンである。典型的な場合、"Wpro" 及び "Wcur" の各
々は、初期設定時には 0−1.0 の範囲にあり、初期設定
時を除く時間には 0.3−0.7 の範囲にある。現在のライ
ン・スペース及びベース・ラインの計算値は、線112
を介してブロック110へ供給され、そこで次のライン
・スペース及びベース・ラインを計算するために使用さ
れる。
【0043】次に、図11を参照すると、そこには図8
に関連して既に一般的に説明した、図1のライン・スペ
ース/ベース・ライン(LS/BL)調整手段17とし
て使用することができる、極値点クラスタ化推定手段1
13のブロック図が示されている。一の文字の各セグメ
ントを構成するX、Y点並びにライン・スペース及びベ
ース・ラインのデフォルト値がブロック114へ供給さ
れ、そこで極値点クラスタA乃至Dが図8に関連して既
に説明したようにして計算される。もし、ブロック11
6に示すように4つのクラスタがあれば、A乃至Dの計
算値が使用され、ライン・スペース及びベース・ライン
が次のように計算されて、線118上に出力される。
【0044】
【数14】LS = D - B BL = B ブロック120では、2より少ないクラスタが存在する
か否かが判別される。もしそうであれば、ライン・スペ
ース及びベース・ラインのデフォルト値が、線122に
示すように利用されることになる。2より少ないクラス
タが存在するのは、例えばピリオドや等号のような或る
特殊記号が書かれる場合だけである。もし、2より少な
いクラスタが存在しなければ、ブロック124で2つ又
は3つのクラスタが存在するか否かが判別される。もし
そうであれば、ブロック126で欠落したクラスタの推
定が行われる。
【0045】もし2つのクラスタが存在すれば、底部の
クラスタが古いベース・ラインと比較される。もし、こ
の底部のクラスタが、(古いベース・ライン + 古いラ
イン・スペースの1/2)より大きければ、Bは、この
底部のクラスタへ設定される。もし、この底部のクラス
タが、(古いベース・ライン + 古いライン・スペース
の1/2)よりも大きくなければ、Bは、(底部のクラ
スタ + 古いライン・スペースの1/2)へ設定され
る。両者の場合、Dは、(B +(古いライン・スペー
ス))へ設定される。
【0046】もし、3つのクラスタが存在すれば、古い
ベース・ラインに最も近い特定のクラスタが一時的な新
しいベース・ラインTとして選択される。もし、この一
時的な新しいベース・ラインTが、(古いベース・ライ
ン + 古いライン・スペースの1/3)よりも大きけれ
ば、Bは、(0.9 *(古いベース・ライン)+ 0.1*
T)へ設定される。もし、Tが、(古いベース・ライン
+ 古いライン・スペースの1/3)よりも大きくなけ
れば、Bは、(0.5 *(古いベース・ライン)+ 0.5
* T)へ設定される。両者の場合、Dは、(B +(古
いベース・ライン))へ設定される。
【0047】各々の場合において、D及びBの値は、線
128でライン・スペース及びベース・ラインを次の式
に従って計算するために利用される。
【0048】
【数15】LS = D - B BL = B 次に、図12を参照するに、そこには図1のライン・ス
ペース/ベース・ライン(LS/BL)調整手段17と
して使用することができる、プロトタイプ抽出推定手段
130と極値点クラスタ化推定手段132の組み合わせ
がブロック図の形式で示されている。図示のように、一
の文字の各セグメントを構成するX、Y点はブロック1
28へ供給され、そこで "Xmin" 、"Xmax" 、"Ymin"
及び "Ymax" が計算される。計算された最小値/最大
値は、プロトタイプ抽出推定手段130及び極値点クラ
スタ推定手段132へ供給される。また、プロトタイプ
抽出推定手段130は、その入力として "LSpro" 及
び "BLpro" 並びに図10に関連して説明した関数を
受け取って、"LS1" 及び "BL1" をブロック134
へ供給する。一方、極値点クラスタ化推定手段132
は、その入力として "LS" 及び "BL" のデフォルト
値並びに図11に関連して説明した関数を受け取っ
て、"LS2" 及び "BL2" をブロック134へ供給す
る。ブロック134では、所定の文字に対する "LS
sys" 及び "BLsys" が、次の式に従って計算される。
【0049】
【数16】 LSsys = W1 * LS1 + W2 * LS2 / (W1 + W2) BLsys = W1 * BL1 + W2 * BL2 / (W1 + W2) 典型的な場合、"W1" 及び "W2" の各々は、初期設定
時には 0−1.0 の範囲にあり、初期設定時を除く時間に
は 0.3−0.7 の範囲にある。"LS" 及び "BL" は、
線136へ供給される。
【0050】ライン・スペース及びベース・ラインを推
定するための前述の方法は、ボックス筆記、罫線筆記及
びフリーハンド筆記のために使用することができる。
【0051】
【発明の効果】以上のように、本発明によれば、手書き
文字のライン・スペース及びベース・ラインを適当に推
定するようにしているので、かかる手書き文字の認識精
度を向上させることができる。
【図面の簡単な説明】
【図1】本発明に従った手書き文字認識システムを示す
簡略化ブロック図である。
【図2】手書き文字認識システムにおけるベース・ライ
ン(BL)、ライン・スペース(LS)及び文字高を示
す図である。
【図3】手書き文字認識システムにおける手書き文字の
ドリフトを示す図である。
【図4】手書き文字認識システムにおけるデフォルト推
定法を示す図である。
【図5】セグメントの最小及び最大のy座標値に基づく
簡単な推定法を示す図である。
【図6】加重平均推定法を示す図である。
【図7】プロトタイプ抽出推定法を示す図である。
【図8】極値点クラスタ化推定法を示す図である。
【図9】加重平均推定手段のブロック図である。
【図10】プロトタイプ抽出推定手段のブロック図であ
る。
【図11】極値点クラスタ化推定手段のブロック図であ
る。
【図12】プロトタイプ抽出推定法と極値点クラスタ化
推定法との組み合わせを実施するシステムのブロック図
である。
【符号の説明】
12・・・タブレット兼表示手段 14・・・スタイラス 16・・・ストローク・セグメント手段 17・・・ライン・スペース/ベース・ライン調整手段 18・・・文字マッチング手段 20・・・プロトタイプ文字記憶手段 21・・・利用手段 24・・・プロトタイプ・プロセッサ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ジョオンキ・キム アメリカ合衆国ニューヨーク州、ホワイ ト・プレーンズ、メイシー・アベニュー 6番地 (72)発明者 ドナルド・ベン・マトソン アメリカ合衆国フロリダ州、ボカ・ラト ン、ノース・ディキシー・ハイウェイ 6420番地 (72)発明者 ウィリアム・デビッド・モドリン アメリカ合衆国フロリダ州、ボカ・ラト ン、ノースイースト・トウェンティス・ ストリート 225番地

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】下記の各段階より成る、手書き文字認識シ
    ステムにおけるライン・スペース及びベース・ラインの
    調整方法。 (a)タブレット上に書かれた各文字毎に、当該タブレ
    ット上のスタイラスの位置を表す(X,Y)座標対の直
    列ストリームをサンプルする段階。 (b)前記タブレット上に書かれた各文字毎に、サンプ
    ルされたY座標点のうちの最小値(Ymin)及び最大値
    (Ymax)をそれぞれ計算する段階。 (c)一の文字のライン・スペース(LS)値を、次式 【数1】 〔式中、LSoldは以前に計算されたLSの値であり、
    old及びWcurはシステム定数である〕に従って計算す
    る段階。 (d)一の文字のベース・ライン(BL)値を、次式 【数2】 〔式中、BLoldは以前に計算されたBLの値である〕
    に従って計算する段階。
  2. 【請求項2】Wold及びWcurの各々の値が、初期設定時
    には 0 - 1.0 の範囲にあり、初期設定時を除く時間に
    は 0.3 - 0.7 の範囲にある、請求項1記載の手書き文
    字認識システムにおけるライン・スペース及びベース・
    ラインの調整方法。
  3. 【請求項3】下記の各段階より成る、手書き文字認識シ
    ステムにおけるライン・スペース及びベース・ラインの
    調整方法。 (a)各プロトタイプ文字毎に一のベース・ライン(B
    pro)値及び一のライン・スペース(LSpro)値を含
    むように、1組のプロトタイプ文字を格納する段階。 (b)タブレット上に書かれた各文字毎に、当該タブレ
    ット上のスタイラスの位置を表す(X,Y)座標対の直
    列ストリームをサンプルする段階。 (c)前記タブレット上に書かれた各文字毎に、サンプ
    ルされた一の文字を供給する段階。 (d)サンプルされた一の文字を前記格納された1組の
    プロトタイプ文字と比較して、当該サンプルされた文字
    が最も類似する所定のプロトタイプ文字を認識された一
    の文字として選択する段階。 (e)サンプルされた次の文字のベース・ライン値及び
    ライン・スペース値を、最後にサンプルされた文字が最
    も類似する所定のプロトタイプ文字のBLpro値及びL
    pro値によって、それぞれ調整する段階。
  4. 【請求項4】現にサンプルされた一の文字のライン・ス
    ペース(LSsys)値を、次式 【数3】 〔式中、LSnewは以前に計算されたLSsysの値であ
    り、Wpro及びWcurはシステム定数である〕に従って計
    算し、 現にサンプルされた一の文字のベース・ライン(BL
    sys)値を、次式 【数4】 〔式中、BLnewは以前に計算されたBLsysの値であ
    る〕に従って計算するようにした、請求項3記載の手書
    き文字認識システムにおけるライン・スペース及びベー
    ス・ラインの調整方法。
  5. 【請求項5】下記の各段階より成る、手書き文字認識シ
    ステムにおけるライン・スペース及びベース・ラインの
    調整方法。 (a)タブレット上に書かれた各文字毎に、当該タブレ
    ット上のスタイラスの位置を表す(X,Y)座標対の直
    列ストリームをサンプルする段階。 (b)ライン・スペース及びベース・ラインのデフォル
    ト値を供給する段階。 (c)一行の文字における各文字を構成するY座標点の
    最小値(Ymin)及び最大値(Ymax)をそれぞれ格納す
    る段階。 (d)一行の文字について格納された前記最小値(Y
    min)及び最大値(Ymax)のヒストグラムを取ることに
    より、1組4グループの値を決定する段階。前記グルー
    プの各々はそれぞれクラスタと呼ばれ、第1のクラスタ
    は文字のデセンダ底部を表し、第2のクラスタはベース
    ・ラインを表し、第3のクラスタは小文字の頂部を表
    し、第4のクラスタは背の高い小文字の頂部又は大文字
    の頂部を表す。 (e)前記ヒストグラムを取ることにより見い出された
    クラスタの数を判別する段階。 (f)2より少ないクラスタが見い出された場合は、ラ
    イン・スペース及びベース・ラインの前記デフォルト値
    を、前記一行の文字のうちサンプルされた一の文字のラ
    イン・スペース値及びベース・ライン値としてそれぞれ
    使用する段階。 (g)2つ又は3つのクラスタが見い出された場合は、
    前記一行の文字のうちサンプルされた一の文字のライン
    ・スペース(LS)値及びベース・ライン(BL)値
    を、次式 LS =(第4のクラスタ)−(第2のクラスタ) BL = 第2のクラスタ に従ってそれぞれ計算するとともに、これらの計算値で
    以て欠落したクラスタを推定する段階。 (h)4つのクラスタが見い出された場合は、前記一行
    の文字のうちサンプルされた一の文字のライン・スペー
    ス(LS)値及びベース・ライン(BL)値を、次式 LS =(第4のクラスタ)−(第2のクラスタ) BL = 第2のクラスタ に従ってそれぞれ計算する段階。
  6. 【請求項6】下記の各段階より成る、手書き文字認識シ
    ステムにおけるライン・スペース及びベース・ラインの
    調整方法。 (a)各プロトタイプ文字毎に一のベース・ライン(B
    pro)値及び一のライン・スペース(LSpro)値を含
    むように、1組のプロトタイプ文字を格納する段階。 (b)タブレット上に書かれた各文字毎に、当該タブレ
    ット上のスタイラスの位置を表す(X,Y)座標対の直
    列ストリームをサンプルする段階。 (c)前記タブレット上に書かれた各文字毎に、サンプ
    ルされた一の文字を供給する段階。 (d)サンプルされた一の文字を前記格納された1組の
    プロトタイプ文字と比較して、当該サンプルされた文字
    が最も類似する所定のプロトタイプ文字を認識された一
    の文字として選択する段階。 (e)現にサンプルされた一の文字の第1の中間ライン
    ・スペース(LS1)値を、次式 【数5】 〔式中、LSnewは以前に計算されたライン・スペース
    (LSsys)の値であり、Wpro及びWcurはシステム定
    数である〕に従って計算して、これを供給する段階。 (f)現にサンプルされた一の文字の第1の中間ベース
    ・ライン(BL1)値を、次式 【数6】 〔式中、BLnew は以前に計算されたベース・ライン
    (BLsys)の値である〕に従って計算して、これを供
    給する段階。 (g)ライン・スペース及びベース・ラインのデフォル
    ト値を供給する段階。 (h)一文字行中の各文字のY座標点の最小値
    (Ymin)及び最大値(Ymax)をそれぞれ格納する段
    階。 (i)一行の文字について格納された前記最小値(Y
    min)及び最大値(Ymax)のヒストグラムを取ることに
    より、1組4グループの値を決定する段階。前記グルー
    プの各々はそれぞれクラスタと呼ばれ、第1のクラスタ
    は文字のデセンダ底部を表し、第2のクラスタはベース
    ・ラインを表し、第3のクラスタは小文字の頂部を表
    し、第4のクラスタは背の高い小文字の頂部又は大文字
    の頂部を表す。 (j)前記ヒストグラムを取ることにより見い出された
    クラスタの数を判別する段階。 (k)2より少ないクラスタが見い出された場合は、ラ
    イン・スペース及びベース・ラインの前記デフォルト値
    を、前記一行の文字のうちサンプルされた一の文字の第
    2の中間ライン・スペース(LS2)値及びベース・ラ
    イン(BL2)値としてそれぞれ使用する段階。 (l)2つ又は3つのクラスタが見い出された場合は、
    前記一行の文字のうちサンプルされた一の文字の前記第
    2の中間ライン・スペース(LS2)値及びベース・ラ
    イン(BL2)値を、次式 LS2 =(第4のクラスタ)−(第2のクラスタ) BL2 = 第2のクラスタ に従ってそれぞれ計算するとともに、これらの計算値で
    以て欠落したクラスタを推定する段階。 (m)4つのクラスタが見い出された場合は、前記一行
    の文字のうちサンプルされた一の文字の前記第2の中間
    ライン・スペース(LS2)値及びベース・ライン(B
    2)値を、次式 LS2 =(第4のクラスタ)−(第2のクラスタ) BL2 = 第2のクラスタ に従ってそれぞれ計算する段階。 (n)サンプルされた一の文字のライン・スペース(L
    sys)値を、次式 【数7】 〔式中、W1及びW2はシステム定数である〕に従って計
    算する段階。 (o)サンプルされた一の文字のベース・ライン(BL
    sys)値を、次式 【数8】 に従って計算する段階。
  7. 【請求項7】W1及びW2の各々の値が、初期設定時には
    0 - 1.0 の範囲にあり、初期設定時を除く時間には 0.
    3 - 0.7 の範囲にある、請求項6記載の手書き文字認識
    システムにおけるライン・スペース及びベース・ライン
    の調整方法。
JP6020305A 1993-03-04 1994-02-17 手書き文字認識システムにおけるライン・スペース及びベース・ラインの調整方法 Expired - Lifetime JP2641388B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US25511 1979-03-19
US025511 1993-03-04
US08/025,511 US5396566A (en) 1993-03-04 1993-03-04 Estimation of baseline, line spacing and character height for handwriting recognition

Publications (2)

Publication Number Publication Date
JPH076204A JPH076204A (ja) 1995-01-10
JP2641388B2 true JP2641388B2 (ja) 1997-08-13

Family

ID=21826515

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6020305A Expired - Lifetime JP2641388B2 (ja) 1993-03-04 1994-02-17 手書き文字認識システムにおけるライン・スペース及びベース・ラインの調整方法

Country Status (4)

Country Link
US (1) US5396566A (ja)
JP (1) JP2641388B2 (ja)
KR (1) KR960008205B1 (ja)
CN (1) CN1035904C (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5220649A (en) * 1991-03-20 1993-06-15 Forcier Mitchell D Script/binary-encoded-character processing method and system with moving space insertion mode
US6434581B1 (en) * 1991-03-20 2002-08-13 Microsoft Corporation Script character processing method for interactively adjusting space between writing element
US5953735A (en) * 1991-03-20 1999-09-14 Forcier; Mitchell D. Script character processing method and system with bit-mapped document editing
US5613019A (en) * 1993-05-20 1997-03-18 Microsoft Corporation System and methods for spacing, storing and recognizing electronic representations of handwriting, printing and drawings
US6651221B1 (en) 1993-05-20 2003-11-18 Microsoft Corporation System and methods for spacing, storing and recognizing electronic representations of handwriting, printing and drawings
US5517578A (en) * 1993-05-20 1996-05-14 Aha! Software Corporation Method and apparatus for grouping and manipulating electronic representations of handwriting, printing and drawings
US6256408B1 (en) * 1994-04-28 2001-07-03 International Business Machines Corporation Speed and recognition enhancement for OCR using normalized height/width position
US5633957A (en) * 1994-09-16 1997-05-27 Compaq Computer Corporation Method and apparatus for determining positional guidelines of handwritten data
US5528732A (en) * 1994-10-17 1996-06-18 Xerox Corporation Reprographic device for making copies with multi-spaced lines
US5642473A (en) * 1994-10-17 1997-06-24 Xerox Corporation Paper saving reprographic device
WO1996023275A1 (en) * 1995-01-23 1996-08-01 Advanced Recognition Technologies Inc. Handwriting recognizer with estimation of reference lines
IL112420A (en) * 1995-01-23 1999-05-09 Advanced Recognition Tech Handwriting recognition with reference line estimation
US5638466A (en) * 1995-08-30 1997-06-10 Horizon Marketing Corporation Aka Wordwand Method and apparatus for deskewing images of symbols having a non-linear baseline
US5892842A (en) * 1995-12-14 1999-04-06 Xerox Corporation Automatic method of identifying sentence boundaries in a document image
US5850476A (en) * 1995-12-14 1998-12-15 Xerox Corporation Automatic method of identifying drop words in a document image without performing character recognition
US5848191A (en) * 1995-12-14 1998-12-08 Xerox Corporation Automatic method of generating thematic summaries from a document image without performing character recognition
CN1173247C (zh) * 1999-01-13 2004-10-27 国际商业机器公司 具有文字分割用户接口的手写信息处理系统
US6567548B2 (en) * 1999-01-29 2003-05-20 International Business Machines Corporation Handwriting recognition system and method using compound characters for improved recognition accuracy
DE10035439B4 (de) * 2000-07-20 2005-11-24 Promos Technologies, Inc. Verbesserter DRAM-Durchgangstransistor mit Arsen-Implantierung
US7096432B2 (en) * 2002-05-14 2006-08-22 Microsoft Corporation Write anywhere tool
US7295708B2 (en) * 2003-09-24 2007-11-13 Microsoft Corporation System and method for detecting a list in ink input
US7970812B2 (en) * 2005-03-17 2011-06-28 Microsoft Corporation Redistribution of space between text segments
US7454063B1 (en) * 2005-09-22 2008-11-18 The United States Of America As Represented By The Director National Security Agency Method of optical character recognition using feature recognition and baseline estimation
TWI385584B (zh) 2008-11-05 2013-02-11 Avermedia Information Inc 自動排列手寫字串之裝置及方法
US8311331B2 (en) * 2010-03-09 2012-11-13 Microsoft Corporation Resolution adjustment of an image that includes text undergoing an OCR process
JP5683411B2 (ja) * 2011-08-25 2015-03-11 シャープ株式会社 表示装置および表示プログラム
US20140232667A1 (en) * 2013-02-15 2014-08-21 Kabushiki Kaisha Toshiba Electronic device and method
KR20150028627A (ko) * 2013-09-06 2015-03-16 삼성전자주식회사 사용자 필기를 텍스트 정보로 변환하는 방법 및 이를 수행하기 위한 전자 기기
WO2016031016A1 (ja) * 2014-08-28 2016-03-03 株式会社 東芝 電子機器、方法及びプログラム
CN105787415B (zh) * 2014-12-18 2020-04-07 富士通株式会社 文档图像的处理装置、方法以及扫描仪
US10614300B2 (en) * 2014-12-23 2020-04-07 Lenovo (Singapore) Pte. Ltd. Formatting handwritten content
US10410316B2 (en) 2015-12-08 2019-09-10 Myscript System and method for beautifying digital ink
US20180032494A1 (en) * 2016-07-29 2018-02-01 Myscript System and method for beautifying superimposed digital ink
CN109657203B (zh) * 2017-10-12 2020-12-04 北大方正集团有限公司 字库字面大小调整的方法、系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4024500A (en) * 1975-12-31 1977-05-17 International Business Machines Corporation Segmentation mechanism for cursive script character recognition systems
US4972496A (en) * 1986-07-25 1990-11-20 Grid Systems Corporation Handwritten keyboardless entry computer system
ATE112079T1 (de) * 1987-07-30 1994-10-15 Computer Ges Konstanz Schaltungsanordnung zur aufbereitung von schrägstehenden, insbesondere handgeschriebenen zeichen.
JP2822189B2 (ja) * 1988-05-19 1998-11-11 ソニー株式会社 文字認識装置及び方法
US5001765A (en) * 1989-01-05 1991-03-19 International Business Machines Corporation Fast spatial segmenter for handwritten characters
JP2930612B2 (ja) * 1989-10-05 1999-08-03 株式会社リコー 画像形成装置

Also Published As

Publication number Publication date
CN1099500A (zh) 1995-03-01
US5396566A (en) 1995-03-07
KR940022339A (ko) 1994-10-20
CN1035904C (zh) 1997-09-17
KR960008205B1 (ko) 1996-06-20
JPH076204A (ja) 1995-01-10

Similar Documents

Publication Publication Date Title
JP2641388B2 (ja) 手書き文字認識システムにおけるライン・スペース及びベース・ラインの調整方法
US6556712B1 (en) Methods and apparatus for handwriting recognition
US4573196A (en) Confusion grouping of strokes in pattern recognition method and system
US7369702B2 (en) Template-based cursive handwriting recognition
US5454046A (en) Universal symbolic handwriting recognition system
US5315667A (en) On-line handwriting recognition using a prototype confusability dialog
US7302099B2 (en) Stroke segmentation for template-based cursive handwriting recognition
JP3176023B2 (ja) 手書き入力照合方法および装置
Guerfali et al. Normalizing and restoring on-line handwriting
KR100658119B1 (ko) 문자 인식 장치 및 방법
US4561105A (en) Complex pattern recognition method and system
WO1997044758A9 (en) Methods and apparatuses for handwriting recognition
JPH05324903A (ja) パターン認識装置
JP2002222425A (ja) 情報処理装置及び方法
JPH08161429A (ja) 文字を認識するための方法および装置
US6724936B1 (en) Handwriting input device and method using a single character set
TWI303783B (en) Method and device for recognition of a handwritten pattern, and computer program product
EP3828685B1 (en) Gesture stroke recognition in touch-based user interface input
WO2000034942A1 (en) Method and system for recognizing musical notations using a compass-direction user interface
JPH0610829B2 (ja) 手書き文字認識方法
EP4086744B1 (en) Gesture stroke recognition in touch-based user interface input
JP3720873B2 (ja) 手書き文字認識方法及びその装置
JP3977473B2 (ja) 手書き文字認識方法及び手書き文字認識装置
Hennig et al. Zone estimation for multiple lines of handwriting using approximating spline functions
AU764561B2 (en) Method and apparatuses for handwriting recognition