JP2001143019A

JP2001143019A - 文字列認識装置

Info

Publication number: JP2001143019A
Application number: JP32096599A
Authority: JP
Inventors: Yasushi Ishizuka; 康司石塚
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1999-11-11
Filing date: 1999-11-11
Publication date: 2001-05-25

Abstract

(57)【要約】【課題】「枠無し認識」手法において「枠有り認識」手法
と同等の処理速度を高認識精度で実現する。【解決手段】文字切り出し部２は、ストローク入力装
置１からストロークが入力される毎に、既に入力された
ストロークと合せて切り出し処理を行う。文字認識部３
は、新たな１文字が切り出される毎に文字認識処理を行
う。言語処理部４は、１文字の文字認識結果候補が得ら
れる毎に、既に得られた文字認識結果候補と組み合わせ
て単語辞書照合処理を行う。その際に、上記切り出し処
理,文字認識処理および単語辞書照合処理を、次ストロ
ークの入力が開始されるまでの時間を利用して行う。そ
の結果、「枠無し認識」において、総ての入力文字に対す
る文字認識処理が終了した後に、後処理によって単語辞
書照合処理を行う必要が無く、「枠有り認識」手法と同等
の処理速度を高認識精度で実現できる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、タブレット等の
座標入力装置を介して入力される文字列を認識する文字
列認識装置に関する。

【０００２】

【従来の技術】携帯端末等で用いられているオンライン
文字認識装置の多くは、複数の文字記入枠を表示して１
つの記入枠に１文字だけを記入する「枠有り認識」と呼ば
れる手法を用いている。このような「枠有り認識」手法を
用いたオンライン文字認識装置の一例として、特開平８
‐２４９４２４号公報に開示されたようなものがある。
このオンライン文字認識装置においては、上記記入枠に
対する１文字単位の記入を行うので文字を切り出す必要
がなく、高速な文字認識処理を行うことができるという
長所を有する。ところが、その反面、オペレータ(記入
者)にとって、上記記入枠単位でしか文字を記入できな
いという文字記入上の制約がある。

【０００３】一方、上記「枠有り認識」に対して、記入枠
を廃止した「枠無し認識」と呼ばれる文字認識の手法があ
る。この「枠無し認識」手法を用いた文字列認識装置にお
いては、入力パターンのどこまでが一つの文字であるか
を確定する「文字切り出し処理」を行う必要である。その
ために、様々な切り出し手法を適用して文字単位の切り
出しを行なっている。ところが、何れの切り出し手法に
おいても、入力パターンの形状のみでは一意に決定でき
ない場合が多い。

【０００４】そのために、上記「枠無し認識」手法を用い
た文字列認識の結果として出力される文字列候補の数
は、上記「枠有り認識」手法を用いた文字列認識結果と比
較して切り出し位置候補の組合せに相当する数だけ増加
している。

【０００５】さらに、漢字の「口」と片仮名の「ロ」との識
別等の上記「枠有り認識」手法にも共通する同形文字の問
題に加えて、１文字「旧」と２文字「１日」との識別等の形
状が同じで文字数が異なる文字列の問題がある。

【０００６】従来の上記「枠無し認識」手法を用いた文字
列認識装置においては、上記「同形文字の問題」や「形状
が同じで文字数が異なる文字列の問題」を解決するため
に、総ての入力文字に対する文字認識処理終了後に、各
文字列候補内における文字間の遷移確率の利用や単語辞
書の照合等による後処理を行っている。

【０００７】

【発明が解決しようとする課題】しかしながら、上記従
来の「枠無し認識」手法を用いた文字列認識装置において
は、上記記入枠を無くすことによって増加した文字列候
補に対して、総ての入力文字に対する文字認識処理終了
後の後処理によって、各文字列候補内における文字間の
遷移確率の利用や単語辞書の照合を行う必要がある。そ
のために、上記後処理量は飛躍的に増加し、文字列認識
のトータル処理時間が極端に長くなって、処理速度の低
下を引き起こすという問題がある。

【０００８】尚、上記後処理の内容を簡素化することに
よって、処理速度の向上を図ることは可能ではある。し
かしながら、その場合には、認識精度が低下するという
問題が発生する。

【０００９】そこで、この発明の目的は、「枠有り認識」
手法と同等の処理速度を高認識精度で実現する「枠無し
認識」手法を用いた文字列認識装置を提供することにあ
る。

【００１０】

【課題を解決するための手段】上記目的を達成するため
に、この発明は、座標入力装置から入力された文字列を
オンラインで認識する文字列認識装置であって、上記入
力された文字の筆跡をストローク単位で座標列データと
して順次記録するストローク記憶手段と、上記ストロー
ク記憶手段に１ストロークの座標列データが記録される
毎に,新たな１ストロークの座標列データと既に記録さ
れている各ストロークの座標列データとに基づいて文字
の切り出し位置を推定する文字切り出し手段と、上記切
り出し手段によって１文字の切り出し位置が推定される
毎に,新たな推定切り出し位置で１文字を分割して文字
認識処理を行い,認識結果として文字認識結果候補を得
る文字認識手段と、上記文字認識手段によって文字認識
結果候補が得られる毎に,新たな文字認識結果候補と既
に得られている各文字列との組み合わせに対して言語処
理を行って文字列認識結果を得る言語処理手段を備えた
ことを特徴としている。

【００１１】上記構成によれば、ストローク記憶手段に
１ストロークの座標列データが記録される毎に、文字切
り出し手段によって文字の切り出し位置が推定される。
さらに、１文字の切り出し位置が推定される毎に、文字
認識手段によって１文字が分離されて文字認識処理が行
われる。さらに、1文字の文字認識結果候補が得られる
毎に、言語処理手段によって言語処理が行われて文字列
認識結果が得られる。

【００１２】こうして、「枠無し認識」手法を用いた文字
列認識が行われるに際して、総ての入力文字に対する文
字認識処理が終了した後に後処理によって言語処理を行
うのではなく、１文字の文字認識結果候補が得られる毎
に次ストロークの入力開始までの時間を利用して言語処
理が行われる。したがって、１文字が認識される毎に行
われる上記言語処理によって文字列候補の数が絞り込ま
れることと相俟って、「枠有り認識」手法と同等の処理速
度が、高認識精度を保ちつつ得られる。

【００１３】また、この発明の文字列認識装置は、上記
言語処理手段による言語処理を,単語辞書に登録された
単語との照合を行う単語辞書照合を含むように成し、上
記単語辞書を登録単語の先頭文字あるいは先頭文字列を
インデックスとして有するように成し、上記言語処理手
段を,上記単語辞書照合に際して,上記新たな文字認識結
果候補と既に得られている各文字列との組み合わせが上
記インデックスに存在する場合には,次回の単語辞書照
合の範囲を当該インデックスに対応付けられた単語群に
限定するように成すことが望ましい。

【００１４】上記構成によれば、上記単語辞書照合を行
う際に、新たな文字認識結果候補と既に得られている各
文字列との組み合わせが上記インデックスに存在する場
合には、次回の単語辞書照合時には、当該インデックス
に対応付けられた単語群のみとの照合が行われ、単語辞
書に登録された全単語との照合を行う場合に比して、単
語照合の範囲が限定されて単語照合時間が低減される。

【００１５】また、この発明の文字列認識装置は、上記
インデックとして、上記登録単語の先頭文字である文字
インデックスに加えて、２文字目の文字を構成するパタ
ーンの一部分であるサブパターンを用いることが望まし
い。

【００１６】上記構成によれば、先頭文字に加えて２文
字目の文字を構成するサブパターンもインデックスとし
て用いられて、さらに単語辞書照合の範囲が限定され
る。こうして、さらに単語照合時間が低減されて効率的
に文字列認識が行われる。

【００１７】

【発明の実施の形態】以下、この発明を図示の実施の形
態により詳細に説明する。図１は、本実施の形態の文字
列認識装置におけるブロック図である。

【００１８】ストローク入力装置１は、筆記者によって
ペンを用いて文字のストロークが入力される。文字切り
出し部２は、入力された文字を１文字単位で切り出す切
り出し処理を行い、入力ストロークを文字単位に分割す
る。その場合、切り出し位置が一意に特定できない場合
には、複数の切り出し位置の組合せに基づく複数の切り
出し候補を出力する。

【００１９】文字認識部３は、上記文字切り出し部２に
よって文字に分割された領域に含まれるストロークを入
力とし、照合用文字パターン辞書６を参照して文字認識
処理を行う。そして、文字認識処理の結果を、文字認識
結果候補として出力する。言語処理部４は、文字認識部
３で得られた複数の文字認識結果候補に基づいて、照合
用単語辞書７及び遷移確率テーブル８を用いて文字列候
補を求める。そして、得られた文字列候補を表示装置５
に表示する。

【００２０】図２は、図１に示す文字列認識装置におけ
る具体的な構成例を示す。図１におけるストローク入力
装置１は、表示一体型タブレット１１を構成する例えば
静電誘導型のタブレット装置で実現される。また、図１
における表示装置５は、表示一体型タブレット１１を構
成する例えば液晶表示パネルで実現される。また、図１
における文字切り出し部２,文字認識部３および言語処
理部４は、ＣＰＵ(中央演算処理装置)１２によって実現
される。

【００２１】そして、上記ＣＰＵ１２による切り出し処
理,文字認識処理および言語処理の結果得られた切り出
し候補,文字認識結果候補,文字列候補およびそれらの中
間データは、ＲＡＭ(ランダム・アクセス・メモリ)１３の
切出候補バッファ１４,認識結果バッファ１５および中
間辞書バッファ１６に格納される。また、図１における
照合用文字パターン辞書６,照合用単語辞書７および遷
移確率テーブル８は、ＲＯＭ(リード・オンリ・メモリ)１
８に格納される。尚、ＣＰＵ１２によって実行される切
り出し処理,文字認識処理および言語処理の実行プログ
ラムは、ＲＯＭ１８のプログラム格納部１９に格納され
る。

【００２２】ストローク記憶装置２０は、上記表示一体
型タブレット１１から入力されたストロークの軌跡を表
す座標列データを格納する。ビデオメモリ２１は、表示
一体型タブレット１１に表示するイメージ・データを格
納する。

【００２３】図３は、図２におけるＣＰＵ１２の制御の
下に実行される文字列認識処理動作のフローチャートで
ある。以下、図３に従って文字列認識処理動作について
説明する。ＣＰＵ１２によって、表示一体型タブレット
１１に対するペンによる入力が検知されると文字列認識
処理動作が開始される。

【００２４】ステップＳ1で、上記表示一体型タブレッ
ト１１から入力されたストロークの軌跡が座標列データ
として読み込まれ、ストローク記憶装置２０に格納され
る。ステップＳ2で、ペンが表示一体型タブレット１１
から離れたか否かで、１ストロークの入力が完了したか
否かが判別される。その結果、１ストロークの入力が完
了すればステップＳ3に進む。ステップＳ3で、切出候補
バッファ１４に、今までの中間切り出し結果が格納され
ているか否かが判別される。その結果、中間切り出し結
果が有ればステップＳ6に進み、無ければステップＳ4に
進む。

【００２５】ステップＳ4で、上記ストローク記憶装置
２０に格納されている座標列データが読み出されて、上
記切り出し処理が実行される。ここで、上記切り出し処
理の具体的な方法は以下のように行われる。すなわち、
新たに得られたストロークの座標列データから、各スト
ロークの始点および終点の座標やｘ,ｙ座標夫々の最大
値等の特徴を抽出する。そして、横書きの場合には、位
置的に隣接するストロークとの距離を求め、所定値以上
の距離を有するストローク間を文字切り出し位置の候補
として切出候補バッファ１４に記憶するのである。

【００２６】ステップＳ5で、前回１文字を切り出して
からのストロークの数、各ストロークの特徴、分割の候
補位置、切り出し後の文字候補位置等で成る中間切り出
し結果が求められ、後の文字切り出しの際に利用するた
めに切出候補バッファ１４に格納される。そうした後、
ステップＳ9に進む。

【００２７】ステップＳ6で、上記切出候補バッファ１
４から中間切り出し結果が読み込まれる。ステップＳ7
で、上記読み込まれた中間切り出し結果に、新たに得ら
れた座標列データから抽出された特徴(新たに入力され
たストロークの情報)が加えられ、上述のようにして切
り出し処理が実行される。ステップＳ8で、上記中間切
り出し結果が求められて切出候補バッファ１４に格納さ
れる。ステップＳ9で、切出候補バッファ１４に記憶さ
れた上記分割の候補位置に基づいて、上記ステップＳ4,
Ｓ7における切り出し処理の結果新たな文字領域が生成
されたか否かが判別される。その結果、生成された場合
はステップＳ10に進み、生成されない場合は上記ステッ
プＳ1に戻って、次のストロークの取り込みと切り出し
処理に移行する。

【００２８】こうして、１ストロークが入力される毎
に、次のストロークの入力開始までの時間を利用して、
上記ストローク記憶装置２０に新たに格納されたストロ
ークに既に格納されているストロークを加えた複数のス
トロークに基づいて切り出し処理を行う。そして、この
処理が１文字領域が生成されるまで、つまり１文字が切
り出されるまで繰り返されるのである。その結果、１文
字が切り出されるとステップＳ10に進む。

【００２９】ステップＳ10で、上記生成された新たな文
字領域に含まれるストロークの座標列データを入力とし
て、照合用文字パターン辞書６を用いた文字認識が実行
される。そして、文字認識結果候補が認識結果バッファ
１５に格納される。ここで、照合用文字パターン辞書６
とは、文字とこの文字を構成するサブパターンとを対応
付けたものである。尚、上記サブパターンは、文字を左
右に分離できるパターン、低画数文字のパターン全体、
統計上一筆書きされ易いパターンの全体等である。ま
た、上記文字認識に関する詳細な説明は省略するが、上
記文字認識の具体的な方法としては、例えば、特開平８
‐２４９４２４号公報(特に第１実施例)に開示された方
法がある。

【００３０】ステップＳ11で、上記中間辞書バッファ１
６に中間照合結果が格納されているか否かが判別され
る。その結果、中間照合結果が有ればステップＳ15に進
み、無ければステップＳ12に進む。ステップＳ12で、認
識結果バッファ１５に格納された文字認識結果候補に対
して遷移確率テーブル８を用いた確率方式による言語処
理が実行される。ステップＳ13で、上記確率方式による
言語処理の結果選出された言語的に確からしい文字認識
結果候補に対して、照合用単語辞書７を用いた新規の単
語辞書照合が実行される。そして、得られた文字列候補
が認識結果バッファ１５に格納される。ステップＳ14
で、得られた照合結果が中間照合結果として中間辞書バ
ッファ１６に格納される。そうした後にステップＳ19に
進む。

【００３１】ステップＳ15で、上記中間辞書バッファ１
６に格納されている中間照合結果が読み込まれる。ステ
ップＳ16で、認識結果バッファ１５に格納された文字認
識結果候補が読み込まれ、上記読み込まれた中間照合結
果に接続して文字認識結果候補の列が生成される。そし
て、この文字認識結果候補の列に対して遷移確率テーブ
ル８を用いた確率方式による言語処理が実行される。こ
うして、言語的に確からしい文字認識結果候補の列が得
られる。ステップＳ17で、上記得られた言語的に確から
しい文字認識結果候補の列に対して、照合用単語辞書７
を用いた継続の単語辞書照合が実行される。そして、得
られた文字列候補が認識結果バッファ１５に格納され
る。ステップＳ18で、得られた照合結果が中間照合結果
として中間辞書バッファ１６に格納される。

【００３２】こうして、各ストロークが入力されて１文
字が認識される毎に、次のストロークの入力開始までの
時間を利用して、中間辞書バッファ１６に格納されてい
る中間照合結果に当該認識結果を加えた文字列に対して
照合用単語辞書７を用いた単語照合を行う。そして、こ
の処理が当該認識結果の全文字認識結果候補が照合され
るまで繰り返されるのである。その結果、上記全文字認
識結果候補に対する単語照合が終了するとステップＳ19
に進む。

【００３３】ステップＳ19で、文字列入力が終了したか
否かが判別される。その結果、終了すればステップＳ20
に進み、終了していなければ上記ステップＳ1に戻っ
て、次の文字に関するストロークの取り込みと文字切り
出しに移行する。ここで、上記文字列入力の終了判定
は、例えば、上記表示一体型タブレット１１からの入力
が所定時間以上途絶えたか否かを判別することによって
行う。ステップＳ20で、認識結果バッファ１５に格納さ
れている文字列候補がビデオメモリ２１に送出されて表
示一体型タブレット１１に出力される。そうした後、文
字列認識処理動作が終了する。

【００３４】すなわち、上記文字列認識処理動作におけ
るステップＳ3〜ステップＳ9が文字切り出し部２による
切り出し処理に相当し、ステップＳ10が文字認識部３に
よる文字認識処理に相当し、ステップＳ11〜ステップＳ
18が言語処理部４による言語処理に相当するのである。

【００３５】以下、上記文字列認識処理動作におけるス
テップＳ13,Ｓ14及びステップＳ17,Ｓ18において実行さ
れる単語辞書照合および中間照合結果の保存について詳
細に説明する。図４は、単語辞書照合・保存処理動作の
フローチャートである。上記文字列認識処理動作におい
て、遷移確率テーブル８を用いた確率方式の言語処理が
終了すると、単語辞書照合・保存処理動作がスタートす
る。

【００３６】ステップＳ21で、上記確率方式の言語処理
によって得られた言語的に確からしい認識結果が取得さ
れる。ステップＳ22で、上記取得された認識結果から１
つの文字認識結果候補が読み出される。ステップＳ23
で、上記読み出された文字認識結果候補を照合用単語辞
書７に登録されている単語の文字と照合する単語照合が
行われる。その場合、中間照合結果がある場合の単語辞
書照合・保存処理動作であれば、中間辞書バッファ１６
から読み出された後に詳述する未完成文字列(中間照合
結果)に対して単語照合が行われる。

【００３７】ステップＳ24で、上記単語照合の結果、当
該文字認識結果候補あるいは文字列が照合用単語辞書７
あるいは上記未完成文字列にあったか否かが判別され
る。その結果、ある場合にはステップＳ25に進み、無い
場合にはステップＳ25をスキップする。ステップＳ25
で、当該文字認識結果候補あるいは文字列が、完成文字
列候補として認識結果バッファ１５に格納される。

【００３８】ステップＳ26で、当該文字認識結果候補あ
るいは文字列が照合用単語辞書７のインデックスにある
か否かが判別される。その結果、上記インデックスにあ
ればステップＳ27に進み、無ければステップＳ27をスキ
ップする。ここで、上記インデックスは照合用単語辞書
７を引くための索引であり、例えば、図５に示すよう
に、照合用単語辞書７に登録されている単語の先頭文字
あるいは先頭文字列である。ステップＳ27で、上記イン
デックスに存在する当該文字認識結果候補あるいは文字
列を先頭とする総ての単語が照合用単語辞書７から読み
出され、未完成文字列として当該文字認識結果候補ある
いは文字列と対応付けられて中間辞書バッファ１６に格
納される。この未完成文字列が次回の単語照合の際に上
記中間照合結果として使用されるのである。ステップＳ
28で、上記ステップＳ21において取得された総ての文字
認識結果候補に関する単語照合が、終了したか否かが判
別される。その結果、未だ単語照合されていない文字認
識結果候補があれば、上記ステップＳ22に戻って次の文
字認識結果候補に対する処理に移行する。一方、無けれ
ばステップＳ29に進む。

【００３９】ステップＳ29で、上記認識結果バッファ１
５に格納されている総ての完成文字列候補および中間辞
書バッファ１６に格納されている総ての未完成文字列
(中間照合結果)に関して、後に詳述する単語列精度Ｄが
算出される。そして、この単語列精度Ｄの昇順に上記完
成文字列候補および未完成文字列がソートされる。ステ
ップＳ30で、上記ソート結果に基づいて所定数の完成文
字列候補および未完成文字列から成る候補結果が選定さ
れる。ステップＳ31で、選定された完成文字列候補およ
び未完成文字列が認識結果バッファ１５に格納されて文
字列候補が決定される。その後、単語辞書照合・保存処
理動作を終了して、上記文字列認識処理動作におけるス
テップＳ19に移行するのである。

【００４０】すなわち、上記ステップＳ21〜ステップＳ
23は上記文字列認識処理動作におけるステップＳ13,Ｓ1
7に相当し、ステップＳ24〜ステップＳ31は上記文字列
認識処理動作におけるステップＳ14,Ｓ18に相当するの
である。

【００４１】こうして、上記照合用単辞書７に登録され
ている単語の中から、切り出された全文字の文字認識結
果候補の組み合わせと完全一致あるいは部分一致する単
語が単語列精度Ｄの昇順にソートされて、文字列候補と
して得られるのである。

【００４２】尚、上記単語列精度Ｄの算出は、次式に従
って行われる。照合用単語辞書７と完全一致した場合(完成文字列候補
である場合)：Ｄ＝Σ(照合用文字パターン辞書６との距離)−α×(一
致文字数) 照合用単語辞書７と部分一致した場合(未完成文字列で
ある場合)：Ｄ＝Σ(照合用文字パターン辞書６との距離) ここで、αは文字認識手法に応じて適宜に定められる定
数であり、本実施の形態においてはα＝１０とする。

【００４３】以下、上記単語辞書照合・保存処理動作に
ついて、表示一体型タブレット１１から文字列「言語処
理」が入力された場合を例に挙げて具体的に説明する。
この場合、上記文字列認識処理動作におけるステップＳ
10での文字認識処理によって、図６に示すような文字認
識結果候補が順次得られるものとする。尚、説明を簡単
にするために、上記確率方式による言語処理に関する説
明は省略する。

【００４４】先ず、１文字目が切り出されて文字認識が
行われると、その認識結果「言」が取得される。ここで、
１文字目の場合には「中間照合結果」は格納されていな
い。そこで、直ちに１文字目の認識結果「言」と図５に示
す照合用単語辞書７に登録された単語の文字とが照合さ
れる。その結果、認識結果「言」１字のみの単語は照合用
単語辞書７にないので、照合用単語辞書７のインデック
スとの照合が行われる。その結果、認識結果「言」は上記
インデックスに登録されているので、文字「言」を先頭と
する単語「言語」,「言動」,「言う」,「言語処理」等が未完成
文字列として選出され、文字「言」と共に中間辞書バッフ
ァ１６に格納される。ここで、１文字目の認識結果は
「言」のみであるから、次に上記未完成文字列「言語」,「言
動」,「言う」，「言語処理」等の単語列精度Ｄが算出され
る。例えば、未完成文字列「言語」の単語列精度Ｄは、Ｄ＝４１(「言」の距離) となる。

【００４５】こうして得られた単語列精度Ｄの値が小さ
い順に上記未完成文字列がソートされる。そして、ソー
ト後の未完成文字列から例えば上位１００位を候補結果
として選定し、認識結果バッファ１５に格納されて文字
列候補が決定される。上記候補結果の選定は、計算処理
量の低減とメモリの節約を目的として行われる。

【００４６】次に、２文字目が切り出されて文字認識が
行われると、その２文字目の認識結果「話」,「語」,「詞」が
取得される。そして、第１候補「話」が読み出され、中間
辞書バッファ１６に保存されている１文字目の文字認識
結果候補「言」と合せて２文字列「言話」が生成される。こ
の文字列「言話」は、上記未完成文字列「言語」,「言動」,
「言う」,「言語処理」,…の中には無く、上記インデックス
にも無いので、第１候補「話」に関する処理を終了する。
次に、第２候補「語」が読み出されて２文字列「言語」が生
成される。この場合、この２文字列「言語」は、未完成文
字列「言語」,「言動」,「言う」,「言語処理」,…の中に在るの
で、完成文字列候補「言語」として認識結果バッファ１５
に格納される。更に、この２文字列「言語」は上記インデ
ックスに登録されているので、２文字列「言語」を先頭と
する単語「言語」,「言語処理」等が未完成文字列として２
文字列「言語」と共に中間辞書バッファ１６に格納され
る。次に、第３候補「詞」が読み出されて２文字列「言詞」
が生成される。そして、この２文字列「言詞」は、上記未
完成文字列「言語」,「言動」,「言う」,「言語処理」,…の中に
は無く、上記インデックスにも無いので、第３候補「詞」
に関する処理を終了する。

【００４７】そして、上記完成文字列候補「言語」と未完
成文字列「言語処理」等との単語列精度Ｄが算出される。
例えば、完成文字列候補「言語」の単語列精度Ｄは、Ｄ＝{４１(「言」の距離)＋５４(「語」の距離)}−１０(α)
×２＝７５となる。また、未完成文字列「言語処理」の単語列精度Ｄ
は、Ｄ＝４１(「言」の距離)＋５４(「語」の距離)＝９５となる。次に、こうして算出された単語列精度Ｄの値が
小さい順に上記文字列がソートされ(第１位は「言語」)、
ソート後の文字列から候補結果が選定されて文字列候補
が決定される。そして、認識結果バッファ１５の文字列
候補が更新されるのである。

【００４８】以下同様にして、３文字目の認識結果
「処」,「机」に対する処理、４文字目の認識結果「理」,「埋」
に対する処理が行われる。その結果、４文字列「言語処
理」を第１位とする文字列候補が認識結果バッファ１５
に得られるのである。

【００４９】上述のように、本実施の形態においては、
表示一体型タブレット１１からストロークが入力される
毎に、中間切り出し結果が在る場合にはその中間切り出
し結果も用いて切り出し処理を行う。そして、新たな１
文字が切り出される毎に、その新たな１文字に対する文
字認識処理を行う。さらに、１文字の文字認識結果候補
が得られる毎に、中間照合結果が在る場合にはその中間
照合結果も用いて、照合用単語辞書７を用いた単語辞書
照合処理を行うようにしている。

【００５０】オペレータが、上記表示一体型タブレット
１１に対して１つのストロークを入力するのに、ペンで
記入する場合には通常約０.２秒〜０.３秒の時間が必要
である。さらに、１つのストロークの入力が完了後に次
のストロークの入力を開始するまでに、上記ペン移動の
ための時間も必要である。そこで、本実施の形態におい
ては、このオペレータが入力に必要な時間内に、既に入
力されたストローク列の情報を用いて文字切り出し位置
の候補を推定し、この推定した文字切り出し位置で１文
字を切り出して文字認識し、得られた文字認識結果候補
の組み合わせと照合用単語辞書７との単語照合を行うの
である。したがって、最後のストロークが入力されると
略同時に、最後の文字が切り出されて認識され、最後の
候補文字列に対する言語処理が行われることになる。

【００５１】すなわち、本実施の形態によれば、上記
「枠無し認識」手法を用いた文字列認識装置において、総
ての入力文字に対する文字認識処理が終了した後に、後
処理によって言語処理を行う必要がない。また、記入枠
を無くすことによって文字列候補が増加しても、文字認
識結果候補が生成される毎に言語処理を行って文字列候
補の数を絞り込むことができる。したがって、「枠有り
認識」手法と同等の処理速度を、高認識精度を保ちつつ
得ることができるのである。

【００５２】ここで、上記照合用単語辞書７のインデッ
クスの構成は、図５に限定されるものではない。図７に
示す照合用単語辞書２５のインデックスの構成は、図５
に示すような文字単位のみではなく、上記サブパターン
単位をも併用する。例えば、単語「往復」の場合には、１
文字目「往」の文字全体のパターンを表す文字インデック
スと、２文字目「復」のサブパターン(ＳＰ)「彳」のＳＰイ
ンデックスとの２つのインデックスを用意するのであ
る。

【００５３】そして、上記単語辞書照合・保存処理動作
におけるステップＳ26において、照合用単語辞書２５の
インデックスとの照合を行う際には、照合の対象となる
文字列「往復」の１文字目「往」の文字インデックスと２文
字目「復」のサブパターン(ＳＰ)「彳」との組み合わせを指
定することによって、得られる未完成文字列の数をより
少なくすることができる。したがって、文字認識処理終
了後の処理量をさらに低減して、効率的な入力作業を可
能にするのである。

【００５４】尚、上記実施の形態においては、図４に示
す単語辞書照合・保存処理動作のステップＳ27におい
て、上記中間辞書バッファ１６に、上記インデックスに
存在する当該文字認識結果候補あるいは文字列と未完成
文字列とを格納するようにしている。しかしながら、照
合用単語辞書７上における当該インデックスのアドレス
を格納して、中間辞書バッファ１６の情報量を削減して
も差し支えない。

【００５５】

【発明の効果】以上より明らかなように、この発明の文
字列認識装置は、ストローク記憶手段に１ストロークの
座標列データが記録される毎に、文字切り出し手段によ
って新たな１ストロークの座標列データと既に記録され
ている各ストロークの座標列データとに基づいて文字の
切り出し位置を推定し、文字の切り出し位置が推定され
る毎に、文字認識手段によって分割文字の文字認識処理
を行なって文字認識結果候補を得、１文字の認識結果候
補が得られる毎に、言語処理手段によって上記文字認識
結果候補と既に得られている各文字列との組み合わせに
対して言語処理を行って文字列認識結果を得るので、
「枠無し認識」手法を用いた文字列認識を行うに際して、
総ての入力文字に対する文字認識処理が終了した後に、
後処理によって言語処理を行う必要が無く、次ストロー
クの入力開始までの時間を利用して言語処理を行うこと
ができる。

【００５６】したがって、上記ストロークの入力終了か
ら上記文字列認識結果を得るまでの時間を短縮して、リ
アルタイムで枠無し文字列認識を行うことができる。そ
の際に、「枠無し認識」手法によって増加した文字列候補
の数を、１文字認識毎に行われる上記言語処理によって
順次絞り込むことができる。すなわち、この発明によれ
ば、「枠有り認識」手法と同等の処理速度を高認識精度で
実現できるのである。

【００５７】また、この発明の文字列認識装置は、上記
言語処理手段による言語処理を単語辞書照合を含むよう
に成し、上記単語辞書に登録単語の先頭文字あるいは先
頭文字列をインデックスとして設け、上記単語辞書照合
に際して、新たな文字認識結果候補と既に得られている
各文字列との組み合わせが上記インデックスに存在する
場合には、次回の単語辞書照合の範囲を当該インデック
スに対応付けられた単語群に限定すれば、単語辞書に登
録された全単語との照合を行う場合に比して、単語照合
の範囲を限定することができる。すなわち、単語照合時
間を低減して、上記ストロークの入力終了から上記文字
列認識結果を得るまでの時間を更に短縮できる。

【００５８】また、この発明の文字列認識装置は、上記
インデックとして、上記登録単語の先頭文字である文字
インデックスに加えて、２文字目の文字を構成するパタ
ーンの一部分であるサブパターンを用いれば、上記単語
辞書照合の範囲をさらに限定できる。したがって、上記
ストロークの入力終了から上記文字列認識結果を得るま
での時間を更に短縮して、より効率的に文字列認識処理
を行うことができる。

【図面の簡単な説明】

【図１】この発明の文字列認識装置におけるブロック
図である。

【図２】図１に示す文字列認識装置における具体的な
構成例を示す図である。

【図３】図２におけるＣＰＵの制御の下に実行される
文字列認識処理動作のフローチャートである。

【図４】図３に示す文字列認識処理動作において実行
される単語辞書照合・保存処理動作のフローチャートで
ある。

【図５】照合用単語辞書のインデックスの説明図であ
る。

【図６】図３における文字認識処理によって得られる
文字認識結果候補の例を示す図である。

【図７】図５とは異なるインデックスの説明図であ
る。

【符号の説明】

１…ストローク入力装置、２…文字切り出し部、
３…文字認識部、４…言語処理部、
５…表示装置、６…照合用文字パターン辞
書、７,２５…照合用単語辞書、８…遷移確率
テーブル、１１…表示一体型タブレット、
１２…ＣＰＵ、１３…ＲＡＭ、
１４…切出候補バッファ、１５…認識結果
バッファ、１６…中間辞書バッファ、１８
…ＲＯＭ、１９…プログラム格納部、２０
…ストローク記憶装置、２１…ビデオメモリ。

Claims

【特許請求の範囲】

【請求項１】座標入力装置から入力された文字列をオ
ンラインで認識する文字列認識装置であって、上記入力された文字の筆跡をストローク単位で座標列デ
ータとして順次記録するストローク記憶手段と、上記ストローク記憶手段に１ストロークの座標列データ
が記録される毎に、新たな１ストロークの座標列データ
と既に記録されている各ストロークの座標列データとに
基づいて文字の切り出し位置を推定する文字切り出し手
段と、上記切り出し手段によって１文字の切り出し位置が推定
される毎に、新たな推定切り出し位置で１文字を分割し
て文字認識処理を行い、認識結果として文字認識結果候
補を得る文字認識手段と、上記文字認識手段によって文字認識結果候補が得られる
毎に、新たな文字認識結果候補と既に得られている各文
字列との組み合わせに対して言語処理を行って文字列認
識結果を得る言語処理手段を備えたことを特徴とする文
字列認識装置。
【請求項２】請求項１に記載の文字列認識装置におい
て、上記言語処理手段による言語処理は、単語辞書に登録さ
れた単語との照合を行う単語辞書照合を含み、上記単語辞書は、登録単語の先頭文字あるいは先頭文字
列をインデックスとして有し、上記言語処理手段は、上記単語辞書照合に際して、上記
新たな文字認識結果候補と既に得られている各文字列と
の組み合わせが上記インデックスに存在する場合には、
次回の単語辞書照合の範囲を当該インデックスに対応付
けられた単語群に限定することを特徴とする文字列認識
装置。
【請求項３】請求項２に記載の文字列認識装置におい
て、上記インデックとして、上記登録単語の先頭文字である
文字インデックスに加えて、２文字目の文字を構成する
パターンの一部分であるサブパターンを用いることを特
徴とする文字列認識装置。