JP2726568B2 - 文字認識方法及び装置 - Google Patents

文字認識方法及び装置

Info

Publication number
JP2726568B2
JP2726568B2 JP2416657A JP41665790A JP2726568B2 JP 2726568 B2 JP2726568 B2 JP 2726568B2 JP 2416657 A JP2416657 A JP 2416657A JP 41665790 A JP41665790 A JP 41665790A JP 2726568 B2 JP2726568 B2 JP 2726568B2
Authority
JP
Japan
Prior art keywords
stroke
path
constraint
labels
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2416657A
Other languages
English (en)
Other versions
JPH04296989A (ja
Inventor
テツノスケ・フジサキ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH04296989A publication Critical patent/JPH04296989A/ja
Application granted granted Critical
Publication of JP2726568B2 publication Critical patent/JP2726568B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • G06V30/2268Character recognition characterised by the type of writing of cursive writing using stroke segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/196Recognition using electronic means using sequential comparisons of the image signals with a plurality of references

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は手書き記号を認識する文
字認識方法及び装置に関し、特にオンライン手書き文字
及び記号の拘束条件駆動の認識を行う方法及び装置に関
する。
【0002】
【従来の技術】一般に、手書きのような記号は電子的タ
ブレツト上でトレースされる場合はx−y座標列により
表される。手書きの基本ユニツトはストロークであり、
1つのストロークは書き手のタブレツトペン着筆動作及
びペン引上げ動作間において発生されるx−y座標デー
タにより表されるポイント列と考えることができる。文
字及び記号はそのようなストロークの集合である。
【0003】文字認識システムにおける第1の処理段階
はセグメント化である。セグメント化は文字認識装置に
より処理される前に1つの文字、記号又は場合によつて
はワードストロークを区分けするためにストローク入力
データを前処理することを含んでいる。
【0004】従来種々の手書きセグメント化方法及び装
置が知られており、米国特許第4024500号明細書
はスタイラスペンの速度と、文字分析が行われる3個の
正確なゾーンの決定を利用するセグメント化方法及び装
置を開示している。米国特許第4654873号明細書
は多数の仮説ユニツトパターンを利用するパターンセグ
メント及びアナライザを開示している(2欄5〜8
行)。5欄61行から6欄36行には図9と関連してセ
グメント化プロセス及び認識プロセスが説明されてい
る。ステツプ703は文字の仮説境界がエレメント属性
リスト714とフオーム辞書950の情報に基づいて作
られることを示している。米国特許第4680804号
明細書は文字又は図形認識モードを指定する方法を開示
している。米国特許第4718103号明細書は手書き
パターンの隣接するセグメント間の角度変化及び候補パ
ターンを有する辞書を用いる手書きパターン認識システ
ムを開示している。
【0005】米国特許第4764972号明細書は分離
文字を記憶する第1メモリと、ストローク間文字情報を
記憶する第2メモリとを使用する認識システムを開示し
ている。米国特許第4805225号明細書は学習モー
ドと認識モードを含み、変数の基本特徴認識装置によつ
て構成される汎用のパターン認識方法及び装置を開示し
ている。
【0006】
【発明が解決しようとする課題】米国特許第47275
88号明細書は容易に編集でき、かつ後に情報処理シス
テムに記憶し得る手書き文書の画像をつくるための電子
的タブレツトと全点アドレス可能表示装置を開示してい
る。
【0007】米国特許第4731857号明細書は手書
き文字が可能なセグメント化点を使用でき、1つの文字
であり得るセグメントのすべての組合せを文字認識装置
に通すことを含む方法を開示している(3欄47〜68
行)。この技術において図4の多分類サブルーチンに関
連して有効ワードが存在しない文字連鎖選択を除去する
ために辞書ルツクアツプ及び文章構成的及び意味的処理
を使用し得るとされている(6欄45行以降)。しかし
ながら、この文章構成的及び意味的処理はすべての入力
ストロークについて動作する計算機的に高価なプロセス
であり、これは、比較的単純なワードであつても潜在的
に多数のストロークの組合せとなる。かくして、このプ
ロセスは辞書ルツクアツプのような付加的処理を用いる
とすると、リアルタイム文字認識には適用できない。ま
たこの明細書には選択可能な又は切換可能な文章構成的
又は意味的処理エレメントが開示されていない。
【0008】従つて本発明の目的はオンライン手書き文
字及び記号の拘束条件駆動認識を与える方法及び装置を
提供することである。本発明の他の目的はスタツクアル
ゴリズムと、それぞれ1つの拘束条件に対応する一連の
カスケード型フイルタとを組合せることによつて拘束条
件駆動型認識用の効率の良いメカニズムを実現する方法
及び装置を提供することである。
【0009】本発明の他の目的はアプリケーシヨンプロ
グラムの作成者に、文字認識タスクに加えられる拘束条
件を動的に活性化及び不活性化する能力を与え、これに
よりフオームアプリケーシヨンの処理を容易にする方法
及び装置を提供することである。本発明のさらに他の目
的は文字認識中に拘束条件を検索する効率のよい方法を
与える形で拘束条件を表示する方法を提供することであ
る。
【0010】
【課題を解決するための手段】上述の問題は一連の手書
きストロークから有効な象形又は有効な象形の列を識別
するための方法及び装置により解決され、これにより本
発明の目的が達成される。本発明の方法によれば、
(a)1つ以上の手書きストロークに応じてそれぞれ組
み合された評価点を有する複数のストロークラベルを発
生し、(b)有効な象形又は有効な象形の部分を示すス
トロークラベルを識別するためにビーム検索技術のよう
なものに従つてそれら複数のストロークラベルを処理
し、(c)識別されたストロークラベルを組み合わせる
ことにより有効な象形又は有効な象形の列の特徴を決定
する。
【0011】この方法は電子的タブレツト手段から1つ
の手書きストロークを示すx−y座標データを入力する
初期ステツプを含んでいる。この処理ステツプは評価点
の値の順に複数のストロークラベルにより特定される検
索空間を通る全てのパス又はすべてのパスの部分を蓄積
するスタツクデータ空間内にストロークラベルを蓄積す
る初期ステツプを含む。
【0012】本発明の第1の方法によれば処理ステツプ
は(1)スタックデータ空間から先頭パスを読み取り、
(2)1つ以上の拡張されたパスを形成するためにすべ
ての可能な後続ストロークラベルをもつ先頭パスを拡張
し、(3)これら拡張されたパスを評価点の関数として
検索空間に組み合せ、(4)入力条件の終了までに段階
(1)〜(3)の処理を繰り返す繰返す。
【0013】本発明の第2の方法によれば、処理ステツ
プは(1)スタツクデータ空間から先頭パスを除去し、
(1.5)親となる先頭パスから妹となるパスを拡張
し、(1.6)妹パスを評価点の関数としてスタツクに
組み入れ、(1.7)先頭パスを少なくとも1つの拘束
条件有効化フイルタを通じて伝送し、先頭パスがフイル
タを出れば、(2)この先頭パスを拘束条件有効化フイ
ルタから戻される候補の最良のもので拡張し、(3a)
組み合されたフラグをFLAG=OPENとして拡張さ
れた先頭パスをスタツクデータ空間に組み入れ、(3
b)組み合されたフラグをFLAG=CLOSEDとし
てオリジナルの先頭パスをスタツクデータ空間に組み入
れ、(4)入力条件が終了するまで(1)〜(3)の処
理を繰り返す。
【0014】本発明の主な特徴はそれぞれの拘束条件有
効化フイルタがスタツクの出力として又は前のフイルタ
の出力に切換自在に接続することである。これらのスイ
ツチはフイルタブロツクの入力をストロークラベルに結
合させるか、又は切り離してそのフイルタブロツクを迂
回するパスを与えるように機能する。本発明によればア
プリケーシヨンプログラマは複数の拘束条件フイルタを
使用し得る。プログラマは特定のストロークシーケンス
についてこれら拘束条件フイルタのどれを適用すべきか
を特定する。
【0015】これら拘束条件フイルタは拘束条件の満足
を検証する型(拘束条件検証型)又は拘束条件に照らし
て採点する評価点型のものであり、アプリケーシヨンプ
ログラムにより処理されるべき手書きデータの形式に基
づきプログラマにより選択される。これに限られるもの
ではないが、異なる形式の拘束条件フイルタとしては辞
書拘束条件フイルタ、構文的拘束条件フイルタ、意味論
的拘束条件フイルタ、ストローク位相拘束条件フイルタ
並びにそれらの変形及び組合せである。
【0016】
【作用】文字の識別は次の処理手順に従つて実行され
る。すなわち、先ず手書きストロークに対応する評価点
を有するストロークラベルを発生し、次にこのストロー
クラベルを検索することによつて特徴を表すストローク
ラベルを識別し、次に当該識別されたストロークラベル
の組合せ方に基づいて手書き文字の特徴を決定する。か
くして本発明によれば簡易かつ確実に手書き文字を識別
することができる。
【0017】
【実施例】以下図面について本発明の一実施例を詳述す
る。
【0018】図1は電子タブレツト14及び文字認識装
置18間にセグメント化プロセサ12を接続した構成の
文字認識システム10を示す。タブレツト14には市販
のタブレツトが適用される。タブレツト14は付属する
スタイラスすなわちペン15を有し、着筆位置において
ユーザがペン15を用いてタブレツト14の表面に活字
体又は手書きの文字数字など(これを記号と呼ぶ)を書
くことができるようになされている。タブレツト14は
x−yタブレツト座標系におけるペン15の位置を表す
x軸及びy軸出力信号を有する。ストローク捕捉手段1
6はソフトウエア処理手段によつて構成され、タブレツ
ト14からx−y軸出力信号を受けてセグメント化プロ
セサ12に対してx−y位置データを発生する。セグメ
ント化プロセサ12の出力は接続型ストローク及び非接
続型ストロークを表すデータであり、このデータは本発
明の文字認識装置18に入力される。文字認識装置18
はセグメント化されたストロークの接続形式を識別する
ように動作すると共に、文字数字のような識別記号を表
す出力18aを送出する。
【0019】この点について本発明は、与えられた記号
が少なくとも1つのセグメント化されたストロークによ
り構成されている多数の手書き記号の認識に適用できる
ようになされている。本発明の技術を用いることによ
り、システム10は種々の言語の手書き文字や、数学記
号に関する記号を容易に認識する。
【0020】本発明はストロークのセグメント化プロセ
ス全体を含むものではないが、本発明は図2に示すよう
な種々のレベルの書体に対応する種々のレベルのセグメ
ント化に適用し得る。例えばます目書き(W1)では個
々の文字はます目内に書かれる。スペース書き(W2)
では文字は1つの文字内のストローク間ギヤツプのいず
れより大きい文字間ギヤツプと共に書かれる。走り書き
(W3)では文字は接触したり重複したりすることがあ
るが、ペン15は文字間位置において持ち上げられる。
草書(W4)では1つのストロークがいくつかの文字に
跨がることがある。
【0021】図2のこれら4種の書体のすべてを処理す
るために、少なくとも2つのモード又はレベルのセグメ
ント化処理モードS1及びS2が考えられる。
【0022】セグメント化処理モードS1 筆跡(W1)及び(W2)間の文字を空間情報を用いる
ことにより分離することができる場合の処理で、この場
合セグメント化の役割はストロークを文字ユニツトにグ
ループ分けすることにある。
【0023】セグメント化処理モードS2 筆跡(W3)及び(W4)間の文字を空間情報を用いる
ことにより容易に分離できない場合の処理で、この場合
は文脈情報(すなわち構文情報)を用いて分離をする。
このときのセグメント化の役割は、1つのストロークが
セグメント化された後に複数の文字に跨がることがない
ように原ストロークを小片に再形成(分離)し直すこと
にある。
【0024】後述するように本発明は両方の場合を容易
に処理するものである。すなわち、セグメント化プロセ
サ12がS1モードで動作しているとき、文字認識装置
18には1文字を形成する複数のストロークが入力され
る。セグメント化プロセサ12がS2モードで動作して
いるとき、文字認識装置18には1文字を形成する1ス
トロークのセグメントが入力される。
【0025】図3はS1モードで動作するセグメント化
プロセサ12の出力順序を示し、また図4はS2モード
で動作するときの出力順序を示しており、双者とも手書
き文字列「ABC」についての結果である。
【0026】後述するように本発明は、第1にオンライ
ン手書き文字記号の拘束条件駆動認識を与え、第2に効
率のよい拘束条件駆動認識を実現する形で拘束条件に依
存した適用手法を表す方法及び装置である。まず拘束条
件駆動認識を説明する。
【0027】上述のように本発明は少なくとも2つのセ
グメント化方法、すなわちS1及びS2モード時に適用
することができ、これらの方法は図2に示すような4種
の筆跡W1、W2、W3、W4を順次処理する。文字認
識装置18への入力はセグメント化方法に応じて異な
る。すなわち、S1モードにおける入力は1文字を形成
するストローク群であり、S2モードにおける入力は1
文字の部分を表す1つのストロークである。
【0028】S2モードのセグメント化は一般により単
純であるから、S2モードのセグメント化について本発
明を説明するが、本発明はS1モードにも同様に適用し
得る。
【0029】図9のストローク形状認識装置32におい
て実行される識別プロセスにおいて、セグメント化プロ
セサ12からの入力が、それぞれ「1/2A」のような
文字片に対応する一組の登録テンプレートと比較され
る。ここで使用されている当該表記「1/2A」は、
文字の文字「A」を表す2つのストロークのうち、第1
番目のストロークであること(これを1/2と表す)を
示している。同じく、表記「3/3H」は文字「H」を
表す3つのストロークのうち、第3番目のストロークで
あることを示しており、また「1/1C」は大文字
「C」を表す1つのストロークのうち、唯1つの第1番
目のストロークであることを示している。それぞれのス
トロークラベルには、入力ストロークに対応するストロ
ークテンプレートのうちの1つとの間の非類似性の度合
を示すための「評価点」すなわち数値が組み合されてい
る。
【0030】このプロセスの出力を図6に示す。これら
評価点付ラベルは図9の記憶アレイ33内にリンクされ
たリストとして記憶される。各評価点付ラベルには円で
囲まれた数字で示すインデクス値がつけられている。こ
のインデクス値はストロークラベルが付されたストロー
クの受入れ順序を示すものである。例えばインデクス値
2を有するストロークラベルは7個、インデクス値3を
有するストロークラベルは8個となつている。すなわ
ち、7個のストロークラベルが第2番目の受入れストロ
ークに対応し、8個のストロークラベルが第3番目の受
入れストロークに対応する。ここで「姉妹」の語を用い
るが、この語は同じインデクス値を有する評価点付スト
ロークラベル相互間の関係、すなわち図9の記憶アレイ
33において同一の「コラム」を占有するリンクされた
ストロークラベル相互間の関係を示す。
【0031】このプロセスはS1モードで動作するセグ
メント化プロセスにも適用される。S1モードの場合、
ストロークテンプレートの代わりに文字テンプレートが
用いられる。結果として得られるラベルは単に「A」、
「B」、「C」等で表すことができる。S1モードの処
理の結果得られる評価点付ラベルを図7に示す。この認
識プロセスの残る部分はS1及びS2モードのセグメン
ト化方法に共通であるから、図6のより複雑な評価点付
ラベルについてのみ説明する。
【0032】入力ストロークに組み合されたストローク
ラベルのリストに基づいて、仮想検索空間を考える。図
8に示すように、この検索空間20は文字の断片として
可能性のあるすべての有効配列順序を含む。例えば、ス
トローク「1/2A」、「2/2A」、「1/2B」、
「2/2B」、「1/1c」という配列順序は20a、
20b、20c、20d、20eのラベルがついた岐路
に対応し、検索空間20における有効パスを表す。この
有効パスは岐路列「ABc」に対応する。本発明によれ
ば、検索空間20におけるパスは、最も可能性の高いパ
スが検索空間の「先頭」となるように処理中に評価点を
用いて順序づけられる。かくして、図6のストローク順
序については文字順序「ABc」が検索空間20を形成
する検索ツリーの「先頭」に位置することに基づいて最
も可能性の高い文字配列順序として決定される。この図
の右側に示す9種の有効文字の組合せに関連するパスを
図8に実線矢印で示し、「1/2A」に「2/3H」が
続く組合せ方のように無効な組合せ方のストロークに関
連する岐路を点線矢印で示す。
【0033】これに関し、図8の検索空間20の必要な
部分は図9のスタツク30のデータ空間としてメモリ内
に構築することが好適で、このとき入力ストロークラベ
ルは、最も小さい評価点をもつか、又はストローク及び
対応するテンプレート間で最も一致するストロークラベ
ルがスタツクの先頭となるように評価点によって配列さ
れる。スタツク30のデータ空間の有用性及び重要性に
ついての好適なスタツク処理手順について詳述する。以
降の説明において用語「スタツク」及び「検索空間」は
スタツク30のデータ空間が検索空間の一部を表したり
又は全部を表わしたりすると言う点で異なるが互いに同
じ意味で用いられる。
【0034】好適なスタツク処理方法は「ビーム検索」
として知られる検索技術に基づいている。適用して好適
なビーム検索手順がN.J.Nilsson:“Pro
blem Salving Methods in A
rtificial Intelligence”,p
p54−59,McGrall Hill,(197
1)に示されており、ビーム検索手順は“Algori
thm A*”(第59頁)に述べられている。勿論、
本発明はこのビーム検索又はビーム検索類似の技術に限
られるものではない。
【0035】以下の手順1図12のフローチヤートに
示されている。
【0036】手順1 ステツプ1 スタツクから先頭パスを読み取る。この先
頭パスには「CLOSED」マークが付され、再度読み
取らせない状態になる。 ステツプ2 この先頭パスをすべての可能性がある後続
パス拡張させる。 ステツプ3 拡張されたパスを検索空間に組み入れる。 ステツプ4 入力が終了する(EOI)までステツプ1
以降の処理を繰り返す。
【0037】図8のストローク配列順序に適用された手
順1は以下の拡張されたステツプ配列順序を生じ、ここ
でカツコ( )内の数字は上述の手順1のステツプ1−
4に対応する。また図10のスタツク30の内容も参照
する。図10において、各スタツクエントリは5個のデ
ータフイールド、すなわち開/閉データフイールド、ラ
ベルデータフイールド、評価点データフイールド及び逆
方向連鎖データフイールドと、図示しないインデツクス
データフイールドとを有する。インデツクスデータフイ
ールドは特定のストロークラベルが記憶アレイ33から
スタツク30にコピーされるとき対応するインデクス値
をもつ。エントリ開始時のインデクス値を0と定義す
る。1つの与えられたパスが拡張されるとき、記憶アレ
イ33は図9のパス受取り/拡張部34によりアクセス
されて1つ以上のストロークラベルを取り出す。拡張さ
れたパスの組入れは記憶アレイ33からスタツク30に
少なくとも1組のストロークラベルをコピーすることに
より行われる。
【0038】拡張手順1 ステツプ1 (1)「スタート」エントリがスタツク3
0から読み出される。スタツク30は定義によりインデ
クス値0の「スタート」エントリによつて初期化され
る。 ステツプ2 (2)「スタート」エントリは記憶アレイ
33から読み出されるストローク「1/2A」で拡張さ
れる。結果として評価点は(評価点=0(「スタート」
エントリの評価点)+10(ストローク「1/2A」の
評価点)−20(評価点バイアス)=−10)と決定さ
れる。評価点バイアスの項は評価点の正規化のためにビ
ーム検索中に一般に使用される。
【0039】ステツプ3 (3)ストローク「1/2
A」がスタツクに組み入れられる。 ステツプ4 (1)ストローク「1/2A」がスタツク
から読み出されて「CLOSED」マークが付される。 ステツプ5 (2)ストローク「1/2A」がストロー
ク「2/2A」で拡張される(ストローク「2/4E」
はストローク「1/2A」に続くことができない)。結
果としての評価点は(評価点=−10(ストローク「1
/2A」の評価点)+10(ストローク「2/2A」の
評価点−20(評価点バイアス)=−20)と決定され
る。
【0040】ステツプ6 (3)ストローク「2/2
A」がスタツクに組み入れられる。 ステツプ7 (1)ストローク「2/2A」がスタツク
から読み出されて「CLOSED」マークが付される。 ステツプ8 (2)ストローク「2/2A」が可能性が
あるすべての後続ストローク(すなわち「妹」となるス
トローク)「1/4E」、「1/2B」、「1/2
D」、「1/3F」、「1/1I」及び「1/3H」に
おいて拡張される。ストローク「3/3H」及び「2/
2A」はストローク「2/2A」に対して有効な「妹」
ストロークにはならない。
【0041】 ステツプ9 (3)結果としてこれらの妹ストローク
のすべてが評価点順にスタツク30に組み入れられる。 ステツプ10 (1)ストローク「1/4E」の評価点
はこれら妹ストロークの評価点の中で最も小さいので、
当該ストローク「1/4E」が次にスタツクから読み出
される。 ステツプ11 (2)ストローク「1/4E」を拡張す
るものはない。ストローク「1/4E」は「除去さ
れ」、かつスタツクに「CLOSED」マークが組み入
れられる。
【0042】 ステツプ12 (3)スタツクには何も加入されない。 ステツプ13 (1)ストローク「1/2B」の評価点
は現在「OPEN」状態になつているスタツクエレメン
トの中で最も小さいので、当該ストローク「1/2B」
がスタツクから読み出される。 ステツプ14 (2)ストローク「1/2B」がストロ
ーク「2/2B」によっ 拡張される。
【0043】 ステツプ15 (3)ストローク「2/2B」がスタツ
クに組み入れられる。 ステツプ16 (1)ストローク「2/2B」がスタツ
クから読み出されて「CLOSED」マークが付され
る。 ステツプ17 (2)ストローク「2/2B」がストロ
ーク「1/1c」、ストローク「1/1C」、ストロー
ク「1/2G」、ストローク「1/1C」によって拡張
される。 ステツプ18 (3)これらすべてのラベルがスタツク
に組み入れられる。 ステツプ19 (4)ストローク「1/1c」がEOI
に達するのでこの手順は終了し、このときスタツクは図
10のように構成されている。
【0044】この場合の解は文字列「ABc」である。
次に本発明においては、上述の手順1を後述するように
変更することにより拘束条件検証フイルタにより与えら
れる利点に加えて新たな利点を与える。
【0045】図13のフローチヤートは当該第2手順を
示すもので、手順1におけるステツプ2をステツプ1.
5、1.6、1.7及び2に置き換える。ステツプ1.
7は先頭のパスを図9のカスケード形拘束条件フイルタ
(36a−36n)を通すために用いられる。
【0046】図10及び図11のスタツク空間を比較す
れば明らかなように、手順2はスタツク項目の数を大幅
に減少させる。すなわち、この検索の拡張部分のサイズ
が大幅に縮小する。
【0047】手順2 ステツプ1 スタツクから先頭パスを取り出す。 ステツプ1.5 先頭の「親」から「妹」ストロークを
拡張する。 ステツプ1.6 「妹」ストロークをスタツクに組み入
れる。 ステツプ1.7 拡張された先頭パスをカスケード形拘
束条件フイルタ36(フイルタパイプ)を通して送る。
【0048】ステツプ1.7の実行の結果として次の3
つの場合が生じる。 (ケースA)フイルタ36は拡張された先頭パスがフイ
ルタにより表される拘束条件に反するときそのパスを除
去することができる。その場合にはフイルタから先頭パ
スは戻されない。 (ケースB)フイルタは拡張された先頭パスにペナルテ
イを与えることができる。この場合には拡張された先頭
パスは戻されるが対応する評価点が増加(ペナルテイと
して)する。 (ケースC)拡張された先頭パスがすべての拘束条件フ
イルタを満足させる。先頭パスは対応する評価点に変更
が加わることなく戻される。
【0049】ステップ2.フイルタから戻されたとき、
先頭パスは候補ストロークラベルのうちの最良のもの、
すなわち最も可能性が高いストロークにより拡張され
る。先頭パスが戻らないとき、このステツプでは何も行
なわない。ステップ 3a.拡張された先頭パスを「FLAG」=
「OPEN」としてスタツクに組み入れる。
【0050】ステップ3b.オリジナルの先頭パスを
「FLAG」=「CLOSED」としてスタツクに組み
入れる。ステップ 4.EOIまで上記ステツプ(1)以降のステ
ツプを繰り返す。繰り返しにおいて上記ステップ(1)
の先頭パスは拡張された先頭パスである。 文字列「ABC」を表す検索空間における上記処理は手
順2に示される改定されたスタツクプロセサにより繰り
返される。ここで後述する形式の構文的条件フイルタ3
6がフイルタパイプに切り換えられ、そしてこのパイプ
を通して送られたパスを受けるものとする。この形式の
拘束条件フイルタは大文字及び小文字の変換を有効にす
るために用いられる。構文的拘束条件フイルタを用いる
と、「WOR」及び「WOrd」のような文字の組合
せを排除できると共に、「Word」及び「WORD」
のような組合せを適切に評価できる。カツコ( )内の
数字は手順2のステツプ番号である。
【0051】 ステツプ1 (1)「スタート」エントリがスタツクか
取り出される。 ステツプ2 (1.5)「スタート」について「妹」と
なるストロークはない。 ステツプ3 (1.6)スタツクには何も組み入れられ
ない。 ステツプ4 (1.7)定義により「スタート」エント
リはすべての拘束条件フイルタを満足している
【0052】 ステツプ5 (2)記憶アレイ33にアクセスして「ス
タート」エントリをストロークラベル「1/2A」に
拡張する。 ステツプ6 (3)ストローク「1/2A」及び「ス
タート」エントリをスタツクに組み入れる。 ステツプ7 (1)ストローク「1/2A」をスタツク
から取り出す。 ステツプ8 (1.5)「妹」ストロークはない。 ステツプ9 (1.6)スタツクに何も組み入れられな
い。
【0053】 ステツプ10 (1.7)ストローク「1/2A」を拘
束条件フイルタにおいて評価する。 ステツプ11 (2)ストローク「1/2A」をストロ
ーク「2/2A」で拡張する。低レベルの拘束条件に反
するためストローク「2/4E」はストローク「1/2
A」に続くことができない。 ステツプ12 (3)ストローク「1/2A」及びス
トローク「2/2A」をスタツクに組み入れる。 ステツプ13 (1)ストローク「2/2A」をスタツ
クから取り出す。 ステツプ14 (1.5)ストローク「1/2A」に
くことができるストローク「2/2A」のストローク
はない。何も拡張されない。
【0054】 ステツプ15 (1.6)スタツクには何も組み入れら
れない。 ステツプ16 (1.7)ストローク「2/2A」が拘
束条件フイルタを満足す 。 ステツプ17 (2)拡張手順1のステツプ8に対応す
るようにストローク「2/2A」をストローク「1/4
E」により拡張する。 ステツプ18 (3)ストローク「2/2A」及びス
トローク「1/4E」をスタツクに組み入れる。 ステツプ19 (1)ストローク「1/4E」をスタツ
クか取り出す
【0055】 ステツプ20 (1.5)ストローク「1/4E」の
ストロークであるストローク「1/2B」をストローク
「1/4E」の「親」であるストローク「2/2A」か
ら拡張する。 ステツプ21 (1.6)ストローク「1/2B」をス
タツクに組み入れる。 ステツプ22 (1.7)ストローク「1/4E」を拘
束条件フイルタにおいて評価する。 ステツプ23 (2)このときストローク「1/4E」
を拡張するものはない。 ステツプ24 (3)ストローク「1/4E」をスタ
ツクに組み戻し、フラグを「FLAG」=「CLOSE
D」とする。
【0056】 ステツプ25 (1)ストローク「1/2B」をスタツ
クから取り出す。 ステツプ26 (1.5)ストローク「1/4E」の
「妹」であるストローク「1/2D」をストローク「1
/2B」の「親」であるストローク「2/2A」から拡
張する。 ステツプ27 (1.6)ストローク「1/2D」をス
タツクに組み入れる。 ステツプ28 (1.7)ストローク「1/2B」を拘
束条件フイルタにおいて評価する。 ステツプ29 (2)ストローク「1/2B」をストロ
ーク「2/2B」により拡張する。
【0057】 ステツプ30 (3)ストローク「1/2B」を「C
LOSED」とし、かつストローク「2/2B」を「O
PEN」としてスタツクに組み入れる。 ステツプ31 (1)ストローク「2/2B」をスタツ
クから取り出す。 ステツプ32 (1.5)ストローク「1/2B」に続
くストローク「2/2B」のストロークはない。 ステツプ33 (1.6)このときスタツクに付加され
るものない。 ステツプ34 (1.7)ストローク「2/2B」を拘
束条件フイルタにおいて評価する。
【0058】 ステツプ35 (2)ストローク「2/2B」をストロ
ーク「1/1c」により拡張する。 ステツプ36 (3b)ストローク「2/2B」を「C
LOSED」とし、(3 a)ストローク「1/1c」を
「OPEN」としてスタツクに組み入れる。 ステツプ37 (1)ストローク「1/1c」をスタツ
クから取り出す。 ステツプ38 (1.5)ストローク「1/1c」の
「妹」であるストローク「1/1C」がストローク「2
/2B」(ストローク「1/1c」の「親」)を拡張す
る。 ステツプ39 (1.6)ストローク「1/1C」をス
タツクに組み入れる。
【0059】 ステツプ40 (1.7)ストローク「1/1c」は
文的拘束条件フイルタを満足しない。これはこのパスが
構文的拘束条件フイルタでは許されないとされるストロ
ーク列「1/2A」、「2/2A」、「1/2B」、
「2/2B」、「1/1c」(大文字)(大文字)(小
文字)を表すからである。すなわち、小文字は2つの大
文字に続くことができない。従つてこのパスは消され
る。 ステツプ41 (2)何も拡張されない。 ステツプ42 (3)スタツクには何も組み入れられ
ない。 ステツプ43 (1)ストローク「1/1C」がスタツ
クから取り出される
【0060】 ステツプ44 (1.5)ストローク「1/2G」(ス
トローク「1/1c」の「妹」)がストローク「2/2
B」(ストローク「1/1c」の「親」)を拡張する。 ステツプ45 (1.6)ストローク「1/2G」がス
タックに組み入れられる。
【0061】 ステツプ46 (1.7)ストローク「1/1C」が拘
束条件フイルタによつて評価される。 ステツプ47 (2)ストローク「1/1C」がEOI
で拡張される。 ステツプ48 (3)ストローク「1/1C」を「C
LOSED」とし、(3 a)EOIを「OPEN」とし
て組み入れる。 ステツプ49 (1)EOIをスタツクから除去する。
【0062】EOIがスタツク30から除去されると
き、この手順を終了する。図10及び図11のスタツク
空間を比較すれば容易に分るように、手順2の方法は、
文字列「ABc」に対立するものとして正しい結果「A
BC」を戻すばかりではなく、手順2が検索空間の小さ
い部分を拡張するので、高い実行速度効率を与える。す
なわち、図11のデータ空間は図10のデータ空間より
コンパクトであることが分る。
【0063】さらに本発明によれば、拘束条件フイルタ
36は拘束条件フイルタパイプに切換自在に接続する。
かくしてアプリケーシヨンプログラマが望むときに特定
のフイルタが活性化される。例えば、図5の部品番号フ
イールドにおいて、2つ以上の大文字に続く小文字が
「PNa2345e」のような部品番号を表すための有
効な文字列であり得る。この場合にはアプリケーシヨン
プログラマは部品番号フイールドからの入力を処理する
場合に構文的拘束条件フイルタを切換えてそのフイルタ
をセールスマンデータフイールドからの入力を処理する
場合に再び戻すように切換える。後述するように、これ
らフイルタ36のうちあるものを文字認識タスクに関連
する変数又は状態の関数として自動的に接続したり切り
離したりすることができる。
【0064】かくして本発明によれば、拘束条件駆動の
認識動作が文字認識装置18内に拘束条件検証ループを
含めることにより実現する。手順2に基づいて構成され
て動作する文字認識装置18の一実施例を図9に示す。
【0065】パスの検証又は中間認識はカスケード形拘
束条件フイルタ36によつて行われる。生き残るパスは
再び順序づけられ、そして手順2の第3ステツプを実行
する組入れパスブロツク38により評価点の関数として
スタツク30に組み戻される。この組入れすなわちマー
ジング操作は特定のスタツクラベルを検索空間に連鎖さ
せるために予めスタツクエントリに逆方向ポインタを与
えることを含んでいる。すべての入力ストロークが処理
された後に、出力文字列発生部40が結果18aを選ん
で出力するためにこのスタツクを通つて逆方向連鎖を行
う。手順1のステツプのうちあるものはフイルタブロツ
ク36のすべてを迂回するためにスイツチのすべてを開
位置にすることにより近似し得る。しかしながらこの方
法は、手順2のステツプ2が手順2のステツプ1.5に
拡張されるために同じ操作を与えない。
【0066】評価点が最小であるパスが検索空間から除
去されるとき、このパスはカスケード形拘束条件フイル
タ36に送られる(手順2のステツプ1.7)。拘束条
件フイルタ36a−36nはそれぞれ1つの拘束条件に
対応する。例えば、フイルタ36のうち1つはアプリケ
ーシヨン依存のワードシンタツクスに従つてストローク
ラベルを処理し、他は汎用ワードシンタツクスに従つて
ストロークラベルを処理し、他は統計的に関係するn−
グラムに従つてストロークラベルを処理する。
【0067】セグメント化プロセサ12がS2モードで
動作しているとき、ストローク間の位相関係を評価する
フイルタが一般にカスケード形拘束条件フイルタの1つ
として必要になる。これは拘束条件と同じ形のストロー
クを有する文字間の混乱を避けるためである。例えば、
このフイルタは「t」及び「T」間及び「F」及び
「I」間の混同を防止する。図14に示すように、テン
プレート一致型又は特徴分析型の従来の文字一致装置を
この目的に対するフイルタの1つとして使用し得る。図
14の場合には文字評価フイルタ50がS1モード動作
に入るとき自動的に活性化され又は接続される。
【0068】図9に示すように、本発明の1つの特徴は
これらフイルタ36のそれぞれがパス受取り拡張パスブ
ロツク34の出力及び又は前のフイルタの出力に切換自
在に接続することである。スイツチ(SW)は、フイル
タブロツク入力をストロークラベルに結合し又はその入
力を切り離してフイルタブロツクを迂回するパスを与え
る単極/2極スイツチとして概略的に示されている。本
発明によれば、アプリケーシヨンプログラマは複数の拘
束条件フイルタ36a−36nを使用し得る。プログラ
マは所定のストローク順序についてこれらフイルタ36
のどれを適用すべきかを特定する。
【0069】一般に、1つの入力に関連する拘束条件の
数が大きい程認識プロセスはより正確かつ効率良く生じ
る。拘束条件の使用は、手書き記号の認識が「記入」式
の文書に関連するときに文字認識アプリケーシヨンのプ
ログラマにとつて特に有利であり、その理由はそのよう
な文書の記入フイールドが一般に関連した使用可能なワ
ード及び記号群を有するからである。これに関し、使用
可能なワードについての制限は一群の拘束条件、認識を
容易にするため用いられるルール群及び又はワードリス
トとして記述し得る。
【0070】図5は「記入」式の文書の典型例を示す各
書込みフイールドについて使用可能な値についてのアプ
リケーシヨン依存型拘束条件が識別される。例えば図5
のフオームについて各フイールドの有効内容について次
の拘束条件を特定し得る。
【0071】 フイールド1:使用可能文字=〈数字〉、“/” ワードシンタツクス=〈数字〉〈数字〉/〈数字〉 〈数字〉/〈数字〉〈数字〉 フイールド2:使用可能文字=〈数字〉、“−” ワードシンタツクス=P〈数字〉−〈数字〉 〈数字〉〈数字〉〈数字〉 ワードリスト=P7−0324、P1−2588のよう
な部品番号のリストを含むフアイルのネーム。
【0072】 フイールド3:使用可能文字=“数字” ワードシンタツクス=〈数字〉…… フイールド4:使用可能文字=“アルフアベツト”ワード シンタツクス=〈大文字〉……1〈大文字〉 〈小文字〉…… ワードリスト=“John”又は“Mary”のような
セールスマンの名前のリスト
【0073】図5の例を用いると、フイルタ36の特定
の1つの組合せがデータフイールド(フイールド1)に
関連するストロークを処理するために特定され、フイル
タ36の他の組合せが、部品番号データフイールド(フ
イールド2)に関連するストロークを処理するために特
定される。例えばアプリケーシヨンプログラマに使用で
きる拘束条件フイールドライブラリ内に5つの形式のル
ール駆動拘束条件フイルタ36を設けることができる。
また、後述するように、アプリケーシヨンプログラマは
ストローク順序に属するルールを特定し、かつ対応する
拘束条件フイールドがそれら関連するストロークに適用
される。
【0074】拘束条件フイルタの1つの形態は汎用ワー
ド辞書及び又はアプリケーシヨン依存型ワード辞書に基
づくものである。そのような辞書は一般に2つの方法で
用いられる。ワードの認識が完了したときその認識結果
を確認するために辞書を用いることができる。すなわ
ち、ワードを認識される文字列は辞書フイルタを通つて
認識結果を確認する。また、辞書フイルタは辞書にはな
いN個の文字の組合せを検出することにより中間ワード
認識結果を確認するために実用できる。かくして検索空
間からの無効な文字列及びワードの早期の排除を行うこ
とができる。
【0075】図10及び図11の例において、ストロー
クが例えば図5のセールスマンの名前のフイールド(フ
イールド4)に関連づけられるとすれば、数字は不適切
な文字とされることになる。このように、アプリケーシ
ヨンプログラマが部分的な文字列「AB」、「AD」、
「A13」をそのような辞書に適用しようとすると、文
字列「A13」は生き残れなくなる。辞書フイルタは完
全又は中間的なワードエントリを含むテーブルにより駆
動される。最終又は中間の文字認識結果の文字列がこの
テーブルのエントリとの一致を検出される。
【0076】例えば、図11の先頭パスが辞書拘束条件
フイルタに与えられると、文字列「START A B
C EOW」はストロークの逆方向連鎖をたどって
ーブル内のエントリと比較することにより確定する。辞
書テーブルエントリはそれぞれエントリが完全なワード
であるか中間ワードであるかを表すフラグと組み合され
る。完全ワードであると特定されたとき、エントリに対
する評価はパスが1つのワードの終りに達したときにの
み行われる。フラグはこのエントリがネガテイブワード
であるかポジテイブワードであるかをも表す。ポジテイ
ブワードはテーブル内にリストされたワードが完全又は
中間ワードとして有効であることを表す。ネガテイブワ
ードはテーブルに与えられたつづりが無効であることを
表す。このつづりを含む任意のパスが消される。
【0077】特に評価点型フイルタとして有効な他の拘
束条件フイルタの形式はワードn−グラム統計及び文字
n−グラム統計に基づくものであり、3文字の評価に用
いられる。例えば文字列「que」は文字列「qae」
より大きい頻度で発生する。その結果、これら2つの文
字列がn−グラムフイルタに供給されたとき、文字列
「que」の評価点は変わらないのに対して、文字列
「qae」はペナルテイを受けてその評価点が増加す
る。使用に当たつてはこれら文字がトリプレツトとして
フイルタを通される。さらに特殊なスタート及びストツ
プ文字(ここでは で示される)がワードの仮定された
スタート位置及び仮定されたエンド位置に挿入される。
例えばワード「WORK」がトリプレツト「 W」、
WO」、「WOR」、「ORK」及び「RK 」に
区切られてn−グラムフイルタに入れられる。
【0078】この形式のフイルタは、それぞれ文字トリ
プレツト及びペナルテイ評価点を含む複数のエントリを
内蔵するテーブルと共に動作する。このフイルタに1つ
のパスが与えられると、最後の3文字からなるトリプレ
ツトが形成されて検査される。
【0079】図11の先頭パスの場合には、トリプレツ
ト「BC 」が形成される。このトリプレツトがテーブ
ルにないならば、このパスは消される。これがテーブル
にあれば、一致エントリに関連する評価点がこのパスの
評価点に加算される。このテーブルは任意ワードリスト
から容易に作ることができる。正しい評価点を決定する
ことは困難であろうが、このフイルタはすべての評価点
が0にセツトされても有効である。例えばTOM、JI
M、BOB、MARY、BETTY及びJIMMYを含
むワードリストから次のエントリを発生することができ
る。
【0080】
【0081】
【0082】
【0083】他の形式の拘束条件フイルタは手順2の動
作について与えた例で説明したが、これは英語の一般的
ワードについての構文的拘束条件に基づく。構文的拘束
条件フイルタは文字タイプ遷移評価に一般に用いられ
る。
【0084】例えば後述するルールによつて取り出され
るテーブルは無効遷移を含むパスがペナルテイを課され
るようにワード内の文字のタイプの遷移をチエツクす
る。これらルールでは〈大文字ワード〉及び〈小文字ワ
ード〉は大文字〈大文字〉及び小文字〈小文字〉文字か
らなるワードをそれぞれ示す。 〈ワード〉=〈大文字ワード〉OR〈小文字ワード〉 〈大文字ワード〉=〈大文字〉OR〈大文字ワード〉A
ND〈大文字〉 〈小文字ワード〉={〈小文字〉OR〈大文字〉}AND
{〈大文字〉OR〈小文字ワード〉}AND〈小文字〉
【0085】この種のフイルタは文字トリプレツトの評
価について上述したと同様のテーブルにより駆動され
る。すなわち、このテーブルの各エントリは文字トリプ
レツト及びペナルテイ評価点を含む。しかしながら、ト
リプレツト内の文字の意味は異なる。すなわちトリプレ
ツト内の文字は入力における文字のタイプを表す。Uは
「A」、「B」、「C」、……「Z」のようなアルフア
ベツトの大文字を表す。Lは「a」、「b」、「c」、
……「z」のようなアルフアベツトの小文字を表す。D
は「1」、「2」、……「9」、「0」のような数字を
表す。Sは他の特定の文字を表す。
【0086】これら表記により英語の大文字ワード及び
小文字ワードについての有効シンタツクスがこの表記で
は13組のトリプレツトで表される。これら13組のト
リプレツトは好適にはペナルテイ0に割り振られる。
【0087】
【0088】このフイルタに1つのパスが与えられる
と、最後の3文字の大文字タイプからなる1つのトリプ
レツトが形成されそしてこのテーブルにより評価され
る。例えば「ABc」からなるパスがこのフイルタに与
えられると、トリプレツト「UUL」が形成されてこの
テーブルに対して検査される。「UUL」は上記の13
組のトリプレツト内にないから、このパスは除去され
る。
【0089】さらに本発明によれば複雑な文章構成的な
評価のための拘束条件有効化フイルタも容易に使用し得
る。
【0090】図5の文書例をみるに、後述のルールから
引き出される拘束条件は、このルールに付随しないパス
が無効遷移を含むとしてペナルテイを課せられるように
部分番号フイールド(フイールド2)内の文字のタイプ
の遷移をチエツクする。拘束条件のそれぞれのタイプに
関係するルールは各拘束条件フイルタ36を作るべく形
式化し得る。すなわち、アプリケーシヨンプログラマは
複雑な任意の文章構成を次のように特定し得る。
【0091】ルール 〈部品番号〉=“P”〈数字〉“−”〈数字〉〈数字〉 〈数字〉〈数字〉 他の例として(3+4−(A+B/62))のような数
式について拘束条件を与えるルールも容易に与えること
ができる。
【0092】これら拘束条件は上述の文字形トリプレツ
トにより近似し得る。しかしながら、これら拘束条件
は、入力状態、文字、出力状態及びエンドフラグを含む
テーブル内のエントリとして正確に表される。例えば、
〈部品番号〉の有効な形は次の8つのルールにより表さ
れる。
【0093】
【0094】このテーブルを駆動するために図11に示
すスタツクエントリは現在の状態パラメータに対する記
憶を含む。現在の状態は初期状態において0にセツトさ
れる。状態(i)を有するパスエンドが文字(C)で拡
張されるべきであれば、このテーブルは(i、C)の組
合せについて検索される。もしそれがあればこの拡張パ
スの状態が一致したテーブルエントリの出力状態位置に
ある出力状態番号にセツトされる。
【0095】他の形式の拘束条件フイルタはストローク
間の位相関係を検査するものである。このフイルタは通
常S−2タイプのセグメント化が行われるときにのみ必
要である。このフイルタは2つの文字が1つのパスにお
いて終了するとき、拘束条件有効化ループに切換えられ
る。このパスの最後の文字が拘束条件ストロークに関連
するフイルタに送られる。これらストロークの位相関係
が仮定された文字から予想されるものと一致すれば、そ
の文字が評価される。任意の適当な文字を一致アルゴリ
ズムがこの目的に使用し得る。
【0096】上述のように、本発明の教示は、例えば埋
込みフイールドを有する入力フオームのような特別な適
用形式のものに使用される場合に制限されない。上述の
実施例のように拘束条件フイルタ形式に使用する場合に
も制限されない。本発明を好適な実施例について特定し
て図示説明をしたが、形式や詳細部分の変更を本発明の
特徴及び精神から逸脱することなくなし得ることは、容
易に理解できるところである。
【0097】
【発明の効果】上述のように本発明によれば、1つ以上
の手書きストロークに基づいて、組み合せられた評価点
を表すストロークラベルを発生し、このストロークラベ
ルを処理して有効な象形又は有効な象形の一部を表すス
トロークラベルを識別し、この識別されたストロークラ
ベルを組み合せることにより有効な象形又は有効な象形
の列を識別する。かくしてこの有効な象形又は有効な象
形の列に対して拘束条件フイルタを用いて文字列を識別
することにより、手書き文字を簡易かつ確実に識別する
ことができる。
【図面の簡単な説明】
【図1】本発明による手書記号認識システムのブロツク
図である。
【図2】本発明により処理するに適した手書き文字の種
々のタイプ(W1−W4)を示す図である。
【図3】第1セグメント化モード(S1)で動作するセ
グメント化プロセサの出力を示す図である。
【図4】第2セグメント化モード(S2)で動作するセ
グメント化プロセサの出力を示す図である。
【図5】本発明により処理するに適した形の埋込みフイ
ールドを有する入力フオームを示す図である。
【図6】5ストロークシーケンス(S2モード)及びス
トロークに関連するストローク及び評価点を示す図であ
る。
【図7】S1モードで動作するときに文字認識装置に与
えられる文字及び組み合される評価点を示す図である。
【図8】図6のストロークラベルを表す検索空間を示す
図である。
【図9】図1の文字認識装置18の詳細を示すと共に、
本発明の特徴であるカスケード型に切換自在に接続され
た拘束条件フイルタを示すブロツク図である。
【図10】図8の検索空間を表す本発明の文字認識装置
により使用されるスタツクを示す図であつて、このスタ
ツクの内容を本発明の第1文字認識方法(手順1)の動
作の終了に示されるものを示す図である。
【図11】本発明の第2文字認識方法(手順2)の動作
終了時に示される内容を有するスタツクを示す図であ
る。
【図12】本発明の第1方法(手順1)を示すフローチ
ヤートである。
【図13】本発明の第2方法(手順2)を示すフローチ
ヤートである。
【図14】カスケード型拘束条件フイルタパイプに切換
自在に接続する代表的な拘束条件有効化フイルタを示す
詳細図である。
【符号の説明】
10……文字認識システム、12……セグメント化プロ
セサ、14……電子的タブレツト、15……ペン、16
……ストローク捕捉手段、18……文字認識装置。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭63−308690(JP,A) 特開 平1−134585(JP,A) 特開 平1−134587(JP,A) 特開 平2−73484(JP,A)

Claims (9)

    (57)【特許請求の範囲】
  1. 【請求項1】手書きストロークの順序に基づいて有効な
    象形又は有効な象形の列を識別する文字認識方法におい
    て、 1つ以上の手書きストロークに応答して各手書きストロ
    ーク毎にそれぞれ対応する評価点を有する複数の姉妹ス
    トロークラベルを発生するストロークラベル発生ステツ
    プと、 有効な象形又は有効な象形の部分を表すストロークラベ
    ルを識別するように複数のストロークラベルを処理する
    識別処理ステツプとを具え、上記識別処理ステツプは、 評価点の順序にデータ空間内に上記ストロークラベルを
    蓄積することにより、上記データ空間内に上記複数のス
    トロークラベルによつて定義された検索空間を通るパス
    の全部又は一部を蓄積するストロークラベル蓄積ステツ
    プと、 (1) 上記データ空間から先頭パスを読み取る読取り
    ステツプと、 (2) 上記先頭パスを次のストロークのすべての姉妹
    ストロークラベルで拡張することにより1つ以上の拡張
    されたパスを形成する拡張ステツプと、 (3) 上記拡張されたパスを拘束条件検証フィルタの
    評価点の関数として上記検索空間に組み入れる組入れス
    テツプと、 (4) 入力条件が終了になるまで上記読取りステツプ
    以降の処理を繰り返す繰返しステツプとを含むことを特
    徴とする文字認識方法。
  2. 【請求項2】複数のストロークラベルを発生する上記ス
    トロークラベル発生ステツプは、 手書きストロークを複数のストロークテンプレートと比
    較することにより、手書きストロークの構成要素となり
    得る象形を識別する比較ステツプと上記手書きストロー
    クをそれぞれ識別された象形によつて特定される構成要
    素ストロークに対応させるステツプとを含むことを特徴
    とする請求項1に記載の文字認識方法。
  3. 【請求項3】上記ストロークラベルを発生するステツプ
    は電子的タブレツト手段から1つの手書きストロークを
    表すx−y座標データを入力する初期ステツプを含むこ
    とを特徴とする請求項1に記載の文字認識方法。
  4. 【請求項4】上記識別処理ステツプはさらに、 (1.5) 親となる上記先頭パスから妹となるパスを
    拡張する拡張ステツプと、 (1.6) 上記妹パスを評価点の関数としてスタツク
    に戻す組入れステツプと、 (1.7) 上記先頭パスを少なくとも1つの拘束条件
    検証フイルタを通じて送る伝送ステツプと、 上記先頭パスが上記拘束条件検証フイルタを満足させた
    場合に、 (2) 上記拘束条件検証フイルタから戻される候補の
    うち最良の候補により上記先頭パスを拡張する拡張ステ
    ツプと、 (3a) 組み合されたフラグをFLAG=OPENと
    してデータ空間に上記拡張された先頭パスを戻す第1の
    組入れステツプと、 (3b) 組み合されたフラグをFLAG=CLOSE
    Dとしてデータ空間にオリジナルの先頭パスを戻す第2
    の組入れステツプと、 (4) 入力条件が終了するまで上記読取りステツプ以
    降の処理を繰り返す繰返しステツプとを含むことを特徴
    とする請求項1に記載の文字認識方法。
  5. 【請求項5】上記識別処理ステツプは、辞書拘束条件フ
    イルタ、構文的拘束条件フイルタ、意味論的拘束条件フ
    イルタ、ストローク位相拘束条件フイルタ、並びにそれ
    らの変形及び組合せからなるグループから選択された1
    つ以上の拘束条件検証フイルタを使用する初期ステツプ
    を含むことを特徴とする請求項1に記載の文字認識方
    法。
  6. 【請求項6】手書きストロークの順序に基づいて有効な
    象形又は有効な象形の列を識別する文字認識装置におい
    て、 1つ以上の手書きストロークに応答して各手書きストロ
    ーク毎にそれぞれ対応する評価点を有する複数の姉妹ス
    トロークラベルを発生するストロークラベル発生手段
    と、 有効な象形又は有効な象形の部分を表すストロークラベ
    ルを識別するように複数のストロークラベルを処理する
    識別処理手段とを具え、上記識別処理手段は、 評価点の順序にデータ空間内に上記ストロークラベルを
    蓄積することにより、上記データ空間内に上記複数のス
    トロークラベルによつて定義された検索空間を通るパス
    の全部又は一部を蓄積するストロークラベル蓄積手段
    と、 (1) 上記データ空間から先頭パスを読み取る読取り
    手段と、 (2) 上記先頭パスを次のストロークのすべての姉妹
    ストロークラベルで拡張することにより1つ以上の拡張
    されたパスを形成する拡張手段と、 (3) 上記拡張されたパスを拘束条件検証フィルタの
    評価点の関数として上記検索空間に組み入れる組入れ手
    段と、 (4) 入力条件が終了になるまで上記読取り手段以降
    の処理を繰り返す繰返し手段とを含むことを特徴とする
    文字認識装置。
  7. 【請求項7】上記発生手段は電子的タブレツト手段から
    1つの手書きストロークを表すx−y座標データを入力
    するための入力手段を含むことを特徴とする請求項6に
    記載の文字認識装置。
  8. 【請求項8】手書きストロークについて、当該手書きス
    トロークの順序に基づいて有効な象形を識別する文字認
    識方法において、 手書きストロークを複数のストロークテンプレートと比
    較することにより、上記手書きストロークの構成要素と
    なり得る象形を識別するステツプと、 上記手書きストロークを識別された象形の部分に対応さ
    せることによりストロークラベルを形成するステツプ
    と、 上記手書きストロークと識別された象形に対応するスト
    ロークテンプレートとの間の類似度の関数である値をも
    つ評価点を、各ストロークラベルに割り当てるステツプ
    と、 各手書きストローク毎に対応する姉妹ストロークラベル
    を上記評価点の順序で並べるステツプと、 順次続く手書きストロークに関するストロークラベルと
    組み合わされたときに、どのストロークラベルが有効な
    象形又は有効な象形の部分を構成するかを決定すること
    により、手書きストロークに関するストロークラベルを
    処理するステツプとを有し、 上記処理ステツプは、ストロークラベルを評価点の順序
    でデータ空間内に蓄積することにより、当該データ空間
    内にストロークラベルによつて定義された検索空間を通
    る全てのパス及びその部分を蓄積する初期ステツプを含
    むと共に、 上記処理ステツプは、 (1)データ空間から最初のパスを取り出すステツプ
    と、 (1.5)妹パスを上記最初のパスでなる親パスから拡
    張するステツプと、 (1.6)上記妹パスを評価点の関数として上記データ
    空間内に取り入れるステツプと、 (1.7)上記最初のパスを少なくとも1つの拘束条件
    検証フイルタに送るステツプと、 上記最初のパスが上記フイルタを満足させたとき、 (2)当該最初のパスを上記拘束条件検証フイルタから
    戻された候補のうち最良の候補により拡張するステツプ
    と、 (3a)当該拡張された最初のパスをFLAG=OPE
    Nとしてデータ空間内に組み入れるステツプと、 (3b)元の最初のパスをFLAG=CLOSEDとし
    てデータ空間内に組み入れるステツプと、 (4)上記処理ステツプをステツプ(1)から出力条件
    の終端に至るまでの間繰り返すステツプとを具えること
    を特徴とする文字認識方法。
  9. 【請求項9】上記組み合わせるステツプは、(m/n
    C)の形式をもつストロークラベル(ここで、Cは識別
    シンボルを表し、mはCを含むストローク順序以外の特
    定のストローク数を表し、nはストローク順序内のトー
    タルストローク数を表す)を発生するステツプを含むこ
    とを特徴とする請求項8に記載の文字認識方法。
JP2416657A 1990-02-02 1990-12-29 文字認識方法及び装置 Expired - Lifetime JP2726568B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US07/474,271 US5029223A (en) 1990-02-02 1990-02-02 Constraint driven-on line recognition of handwritten characters and symbols
US474271 1990-02-02
US07/474271 1990-02-02

Publications (2)

Publication Number Publication Date
JPH04296989A JPH04296989A (ja) 1992-10-21
JP2726568B2 true JP2726568B2 (ja) 1998-03-11

Family

ID=23882845

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2416657A Expired - Lifetime JP2726568B2 (ja) 1990-02-02 1990-12-29 文字認識方法及び装置

Country Status (4)

Country Link
US (1) US5029223A (ja)
EP (1) EP0439743B1 (ja)
JP (1) JP2726568B2 (ja)
DE (1) DE69030310T2 (ja)

Families Citing this family (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2795719B2 (ja) * 1990-03-07 1998-09-10 富士通株式会社 認識距離の差に基づく最良優先探索処理方法
JPH03294976A (ja) * 1990-04-13 1991-12-26 Matsushita Electric Ind Co Ltd 基準マークパターン検出装置
JP3143461B2 (ja) * 1990-05-29 2001-03-07 キヤノン株式会社 文字認識方法及び文字認識装置
US5343537A (en) * 1991-10-31 1994-08-30 International Business Machines Corporation Statistical mixture approach to automatic handwriting recognition
CA2087500A1 (en) * 1992-04-07 1993-10-08 Tetsunosuke Fujisaki Resolution of case confusions by majority voting rule in on-line handwriting recognition
US5675668A (en) * 1992-04-08 1997-10-07 Kawaski Steel Corporation Coding method, semiconductor memory for implementing coding method, decoder for semiconductor memory and method for identification of hand-written characters
JPH0684006A (ja) * 1992-04-09 1994-03-25 Internatl Business Mach Corp <Ibm> オンライン手書き文字認識方法
CA2089784C (en) * 1992-04-15 1996-12-24 William Joseph Anderson Apparatus and method for disambiguating an input stream generated by a stylus-based user interface
WO1994004993A1 (en) * 1992-08-18 1994-03-03 Perception Software Corporation A recognition system with an automated development tool
JP3260843B2 (ja) * 1992-08-25 2002-02-25 株式会社リコー 文字認識方法
US5515455A (en) * 1992-09-02 1996-05-07 The Research Foundation Of State University Of New York At Buffalo System for recognizing handwritten words of cursive script
US5337372A (en) * 1992-10-13 1994-08-09 At&T Bell Laboratories Method and apparatus for symbol recognition using multidimensional preprocessing at multiple resolutions
US5625708A (en) * 1992-10-13 1997-04-29 Lucent Technologies, Inc. Method and apparatus for symbol recognition using multidimensional preprocessing
US5647022A (en) * 1992-10-13 1997-07-08 Lucent Technologies Inc. Method and apparatus for symbol recognition using multidimensional preprocessing and symbol sorting
US5392363A (en) * 1992-11-13 1995-02-21 International Business Machines Corporation On-line connected handwritten word recognition by a probabilistic method
US6011865A (en) * 1993-05-12 2000-01-04 International Business Machines Corporation Hybrid on-line handwriting recognition and optical character recognition system
US5596350A (en) * 1993-08-02 1997-01-21 Apple Computer, Inc. System and method of reflowing ink objects
US5878164A (en) * 1994-01-21 1999-03-02 Lucent Technologies Inc. Interleaved segmental method for handwriting recognition
US5524066A (en) * 1994-03-31 1996-06-04 Xerox Corporation Text recognition by predictive composed shapes
IL109268A (en) * 1994-04-10 1999-01-26 Advanced Recognition Tech Method and system for image recognition
FR2719140A1 (fr) * 1994-04-20 1995-10-27 Philips Laboratoire Electroniq Méthode pour l'analyse d'écriture cursive.
JPH07295940A (ja) * 1994-04-21 1995-11-10 Sharp Corp 電子機器
US5774586A (en) * 1994-05-04 1998-06-30 Ncr Corporation Method and apparatus for standardization of inputs to word recognition systems
US6137908A (en) * 1994-06-29 2000-10-24 Microsoft Corporation Handwriting recognition system simultaneously considering shape and context information
JP3630734B2 (ja) * 1994-10-28 2005-03-23 キヤノン株式会社 情報処理方法
US5850480A (en) * 1996-05-30 1998-12-15 Scan-Optics, Inc. OCR error correction methods and apparatus utilizing contextual comparison
US6111976A (en) * 1996-11-04 2000-08-29 Rylander; John E. System and method for handwritten character recognition and qualification
US6370269B1 (en) 1997-01-21 2002-04-09 International Business Machines Corporation Optical character recognition of handwritten or cursive text in multiple languages
GB9701793D0 (en) 1997-01-29 1997-03-19 Gay Geoffrey N W Means for inputting characters or commands into a computer
DE10028624B4 (de) * 1999-06-09 2007-07-05 Ricoh Co., Ltd. Verfahren und Vorrichtung zur Dokumentenbeschaffung
CA2400345C (en) * 2000-03-06 2007-06-05 Iarchives, Inc. System and method for creating a searchable word index of a scanned document including multiple interpretations of a word at a given document location
US6940617B2 (en) * 2001-02-09 2005-09-06 Matsushita Electric Industrial Co., Ltd. Printing control interface system and method with handwriting discrimination capability
DE10110980A1 (de) * 2001-03-07 2002-09-26 Siemens Ag Texteingabe in ein Handgerät
US7120872B2 (en) * 2002-03-25 2006-10-10 Microsoft Corporation Organizing, editing, and rendering digital ink
US7680649B2 (en) * 2002-06-17 2010-03-16 International Business Machines Corporation System, method, program product, and networking use for recognizing words and their parts of speech in one or more natural languages
US7609890B2 (en) * 2004-09-30 2009-10-27 Pitney Bowes Inc. Packing list verification system
JP5071914B2 (ja) * 2005-02-28 2012-11-14 ザイ デクマ アクチボラゲット 認識グラフ
US7724957B2 (en) * 2006-07-31 2010-05-25 Microsoft Corporation Two tiered text recognition
US20080231429A1 (en) * 2007-03-19 2008-09-25 Barton Leonard System for electronic documentation and validation of information
US8121412B2 (en) * 2008-06-06 2012-02-21 Microsoft Corporation Recognition of tabular structures
TWI457793B (zh) * 2008-08-08 2014-10-21 Ind Tech Res Inst 即時動作辨識方法及其慣性感測與軌跡重建裝置
CN102012900B (zh) * 2009-09-04 2013-01-30 阿里巴巴集团控股有限公司 信息检索方法和系统
US9591339B1 (en) 2012-11-27 2017-03-07 Apple Inc. Agnostic media delivery system
US9774917B1 (en) 2012-12-10 2017-09-26 Apple Inc. Channel bar user interface
US10200761B1 (en) 2012-12-13 2019-02-05 Apple Inc. TV side bar user interface
US9532111B1 (en) 2012-12-18 2016-12-27 Apple Inc. Devices and method for providing remote control hints on a display
US10521188B1 (en) 2012-12-31 2019-12-31 Apple Inc. Multi-user TV user interface
WO2015200228A1 (en) 2014-06-24 2015-12-30 Apple Inc. Character recognition on a computing device
CN111078110B (zh) 2014-06-24 2023-10-24 苹果公司 输入设备和用户界面交互
CN111782128B (zh) 2014-06-24 2023-12-08 苹果公司 用于在用户界面中导航的列界面
CN104112130B (zh) * 2014-06-26 2017-08-01 小米科技有限责任公司 光学字符识别方法及装置
DK201670581A1 (en) 2016-06-12 2018-01-08 Apple Inc Device-level authorization for viewing content
DK201670582A1 (en) 2016-06-12 2018-01-02 Apple Inc Identifying applications on which content is available
US11966560B2 (en) 2016-10-26 2024-04-23 Apple Inc. User interfaces for browsing content from multiple content applications on an electronic device
CN108734167B (zh) * 2018-05-08 2022-05-17 湖南开启时代电子信息技术有限公司 一种被污染的胶片文字识别方法
US11683565B2 (en) 2019-03-24 2023-06-20 Apple Inc. User interfaces for interacting with channels that provide content that plays in a media browsing application
WO2020198237A1 (en) 2019-03-24 2020-10-01 Apple Inc. User interfaces including selectable representations of content items
CN113906419A (zh) 2019-03-24 2022-01-07 苹果公司 用于媒体浏览应用程序的用户界面
CN113940088A (zh) 2019-03-24 2022-01-14 苹果公司 用于查看和访问电子设备上的内容的用户界面
US11863837B2 (en) 2019-05-31 2024-01-02 Apple Inc. Notification of augmented reality content on an electronic device
CN113906380A (zh) 2019-05-31 2022-01-07 苹果公司 用于播客浏览和回放应用程序的用户界面
US11843838B2 (en) 2020-03-24 2023-12-12 Apple Inc. User interfaces for accessing episodes of a content series
US11899895B2 (en) 2020-06-21 2024-02-13 Apple Inc. User interfaces for setting up an electronic device
US11720229B2 (en) 2020-12-07 2023-08-08 Apple Inc. User interfaces for browsing and presenting content
US11934640B2 (en) 2021-01-29 2024-03-19 Apple Inc. User interfaces for record labels

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6249483A (ja) * 1985-08-28 1987-03-04 Hitachi Ltd 実時間手書き文字認識の文字入力方式
US4024500A (en) * 1975-12-31 1977-05-17 International Business Machines Corporation Segmentation mechanism for cursive script character recognition systems
JPS5580183A (en) * 1978-12-12 1980-06-17 Nippon Telegr & Teleph Corp <Ntt> On-line recognition processing system of hand-written character
JPS5827551B2 (ja) * 1979-05-18 1983-06-10 日本電信電話株式会社 オンライン手書き文字認識方式
JPS5998283A (ja) * 1982-11-27 1984-06-06 Hitachi Ltd パターン切出しおよび認識方法、ならびにそのシステム
JPS60136892A (ja) * 1983-12-26 1985-07-20 Hitachi Ltd オンライン手書き図形認識装置
JPH0650538B2 (ja) * 1984-03-28 1994-06-29 株式会社日立製作所 手書き文字・図形認識の認識モード指定方法
US4731857A (en) * 1984-06-29 1988-03-15 International Business Machines Corporation Recognition system for run-on handwritten characters
JPS6180478A (ja) * 1984-09-27 1986-04-24 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション デ−タ入力・表示システム
US4764972A (en) * 1985-05-23 1988-08-16 Nec Corporation Continuous characters recognition system
JPS6282486A (ja) * 1985-10-08 1987-04-15 Hitachi Ltd オンライン手書き図形認識装置
CA1293807C (en) * 1986-09-11 1991-12-31 Xavier Maury Method of handwriting recognition
JPH07107708B2 (ja) * 1986-09-26 1995-11-15 株式会社日立製作所 パタ−ン認識方法
US4805225A (en) * 1986-11-06 1989-02-14 The Research Foundation Of The State University Of New York Pattern recognition method and apparatus
JPH07122890B2 (ja) * 1987-11-19 1995-12-25 富士通株式会社 分離文字処理機能を持つ文書リーダ装置
JPH01134587A (ja) * 1987-11-19 1989-05-26 Fujitsu Ltd 最良優先探索による文字認識後処理方式
JPH0273484A (ja) * 1988-09-09 1990-03-13 Seiko Epson Corp 文字認識方法

Also Published As

Publication number Publication date
EP0439743A3 (en) 1992-11-19
DE69030310D1 (de) 1997-04-30
JPH04296989A (ja) 1992-10-21
EP0439743B1 (en) 1997-03-26
EP0439743A2 (en) 1991-08-07
DE69030310T2 (de) 1997-09-18
US5029223A (en) 1991-07-02

Similar Documents

Publication Publication Date Title
JP2726568B2 (ja) 文字認識方法及び装置
JP3425408B2 (ja) 文書読取装置
US6111985A (en) Method and mechanism for providing partial results in full context handwriting recognition
JP3427692B2 (ja) 文字認識方法および文字認識装置
JPH02299068A (ja) 入力文字列からワードを分離する方法
US10963717B1 (en) Auto-correction of pattern defined strings
Weibel et al. Automated title page cataloging: a feasibility study
JP2003331214A (ja) 文字認識誤り訂正方法、装置及びプログラム
JP2560656B2 (ja) 文書ファイリングシステム
JP3233803B2 (ja) 難読漢字検索装置
JPH03209564A (ja) 文献データ登録方法
JPS6154569A (ja) 文書画像処理方式
JP3415012B2 (ja) 文字認識後処理装置
JP2874815B2 (ja) 日本語文字読取装置
JPH11120294A (ja) 文字認識装置および媒体
JPH04123185A (ja) 文書認識方式
JPH0677252B2 (ja) 和文データ入力処理装置
JPS6059487A (ja) 手書文字認識装置
JPH05189621A (ja) オンライン手書き文字認識装置
JPH0258187A (ja) 文字認識装置
JPH08263509A (ja) ソフトウェア利用装置
JPH06332949A (ja) 電子ファイリング装置
JPH11191107A (ja) 文書処理方法とその装置
JPH08212304A (ja) 文字読取装置の文字認識後処理方法
JPH0458381A (ja) 光学的文字読取装置